Procedimientos de CO
Si clasificamos los procedimientos de CO según su influencia sobre la conducta, ya sabemos que cuando tiene como resultado un aumento de la probabilidad de emisión de la conducta se denomina reforzamiento, y cuando reduce su probabilidad de denomina castigo.
Se puede aumentar la clasificación según la relación de contingencia entre la respuesta y la consecuencia, y la naturaleza de dicha consecuencia (apetitiva o aversiva). Cuando la correlación es directa la contingencia será positiva, mientras que cuando es inversa será denominada contingencia negativa. Así tenemos los cuatro procedimientos:
Apetitivo | Aversivo | |
Contingencia positiva |
Refuerzo positivo o entrenamiento de recompensa La conducta provoca consecuencias positivas (reforzador) La probabilidad de emisión de la conducta aumenta |
Castigo positivo o castigo La conducta provoca consecuencias negativas, aversivas Reduce la probabilidad de emisión de la conducta |
Contingencia negativa |
Entrenamiento de omisión o castigo negativo La conducta provoca la no aparición o retirada de algo bueno. Reduce la probabilidad de emisión de la conducta Reforzamiento diferencial de otras conductas |
Reforzamiento negativo o entrenamiento de evitación/escape La conducta provoca la no aparicición o retirada de una consecuencia aversiva La probabilidad de emisión de la conducta aumenta |
La distinción entre estos procedimientos no es tan sencilla en nuestro ambiente natural. Si, por ejemplo, en una calurosa tarde de julio encendemos el aparato de aire acondicionado, ¿estaríamos ante un caso de reforzamiento negativo (el sujeto escapa del calor como estímulo aversivo) o positivo (reforzado por la aparición del frío)? Hineline defendió que no existe simetría absoluta entre el reforzamiento positivo y negativo. Cuando un evento requiere de la emisión de una respuesta para su desaparición, ésta debe producirse en su presencia. Sin embargo, las respuestas reforzadas positivamente tienen que emitirse necesariamente antes de la aparición del refuerzo.
Castigo, escape y evitación
En un entrenamiento de escape la consecuencia aversiva está presente y no desaparece hasta la emisión de la conducta operante. La operante, por tanto, es reforzada por la supresión del evento aversivo que estaba en curso.
En laboratorio las preparaciones de escape incluyen tanto respuestas locomotrices, en las que el sujeto se desplaza fuera del lugar donde se halla el estímulo aversivo, como respuestas manipulativas que interrumpen la emisión del estímulo. Generalmente la técnica de desplazamiento consiste en pasar de un compartimento a otro, en una caja doble dónde se electrifica uno de ellos, o correr a lo largo de un corredor en una caja de salida y meta, dónde la salida y el corredor están electrificados pero la meta no.
En la técnica de manipular suelen consistir en accionar una palanca o picar una tecla.
En un entrenamiento de evitación el sujeto es expuesto a la presentación periódica de una consecuencia aversiva, y la emisión de la operante impide o retrasa su aparición. La diferencia con la anterior es que aquí la operante no se emite mientras el estímulo aversivo se encuentra presente (ej. dar a la palanca para que pare la descarga, sería escape) sino antes de que haya aparecido (ej. dar a la palanca antes de que llegue la descarga para evitarla, que sabes que va a llegar porque la has sufrido antes) Existen diferentes variantes de este procedimiento, que se explican más adelante.
Respecto al castigo todos los procedimientos tienen el efecto de reducir la conducta a la que se aplica. Sin embargo en un entrenamiento de omisión, la conducta del sujeto no mantiene ninguna relación con la aparición de estimulación aversiva (recordad que era omitir o retirar algo bueno). Por eso cuando hablamos de castigo, nos referimos al castigo positivo, es decir a los procedimientos en los que la conducta va seguida de la aparición de un estímulo (consecuencia) aversivo.
Para poder aplicar un procedimiento de castigo a una conducta es necesario que ésta se emita con cierto grado de probabilidad, lo que determina su estudio en el laboratorio. La mayoría de las preparaciones experimentales empiezan con una fase previa en la que se refuerza la emisión de alguna conducta, para poder aplicar castigo a esa misma respuesta en una fase posterior. El grado en el que se ve suprimida dicha respuesta se considera un índice de la efectividad del castigo. Como estímulos aversivos suelen utilizarse ruidos fuertes o descargas, aunque la variedad es muy amplia.
Mediante los procedimientos de reforzamiento negativo (escape y evitación) aumentamos la probabilidad de la operante, mientras que con el castigo la reducimos. Sin embargo en ambos casos la conducta del sujeto es moldeada para reducir al máximo su exposición a la estimulación aversiva, es decir, mediante el aumento de los periodos de seguridad.
Procedimientos de CO y estados emocionales
El efecto elicitador, propio del condicionamiento clásico, de un EC o un EI no desaparece cuando está funcionando como consecuencia en una contingencia operante.
Podemos reforzar una respuesta haciendo contingente su emisión con la aparición de un EI apetitivo (o un
EC excitatorio apetitivo). Si este procedimiento aumenta la probabilidad de emisión de dicha respuesta, podemos catalogarlo como reforzamiento positivo, y considerar por tanto que el EI o EC ha funcionado como reforzador. La función del EI como reforzador no reemplaza ni su capacidad como elicitador de RI ni su capacidad para condicionar otros eventos con los que mantenga contingencia y contigüidad.
Si una orden como “siéntate” la reforzamos con comida, convertimos la orden en un Ed+ para la conducta de sentarse de nuestra mascota, pero además, el uso de comida como consecuencia provocará la salivación del sujeto y convertirá a los eventos antecedentes (la respuesta, la orden y hasta la persona que la emite) en EC excitatorios apetitivos. Lo que hacen es cumplir otras funciones, además de reforzador, dentro de otras contingencias, como en este caso un condicionamiento clásico excitatorio apetitivo.
Además de esa RI especifica (como la salivación producida por la comida) los estímulos elicitadores provocan en los sujetos estados emocionales, estados que pueden asociarse al resto de los eventos antecedentes (convirtiéndolos en ECs). Por regla general, suele considerarse que los EI apetitivos provocan alegría, mientras que los aversivos generan miedo. El efecto emocional de los ECs suele etiquetarse así:
ECs excitatorios apetitivos suele etiquetarse como “esperanza”
ECs excitatorios aversivos como “ansiedad”
ECs inhibitorios apetitivos generan estados como “tristeza”
ECs inhibitorios aversivos como “alivio”
Por eso un entrenador que suela utilizar procedimientos de refuerzo positivo, no sólo funciona como discriminativo para según qué conductas, sino que además elicita un estado emocional parecido a la alegría (“esperanza” o “ilusión”). En otras palabras, los eventos presentes durante el refuerzo, incluidos los estímulos propioceptivos generados por nuestro comportamiento (que también se convierten en ECs), nos hacen sentir bien, y por las mismas razones, no nos «gustan» los eventos presentes durante el castigo.
Podríamos concluir que tanto los Ed+ (para respuestas reforzadas negativamente) como las conductas de evitación o escape generan estados de alivio en los sujetos, mientras que tanto los Ed- (para respuestas castigadas) como las propias conductas castigadas producen estados de ansiedad. Pero, aún más importante, la presencia de un EI aversivo provoca miedo, y esta poderosa reacción es algo que hay que tener siempre en cuenta para predecir el efecto del procedimiento que estamos usando.
El castigo tiene efectos emocionales que inhiben la conducta apetitiva y cualquier operante en general. Se ha demostrado experimentalmente que, aunque la estimulación aversiva independiente de la respuesta pueda producir cierta supresión de la conducta instrumental, se da una supresión significativamente mayor de la conducta si la estimulación aversiva se produce por la ejecución de la respuesta instrumental. Por tanto es mucho más eficaz para suprimir una conducta cuando la estimulación aversiva es producida por la respuesta que si es independiente de ella.
La Teoría de la respuesta emocional condicionada propuesta por Estes es la más relevante para explicar el efecto en la conducta de los procedimientos de castigo. La idea básica es que un EC excitatorio aversivo provoca ciertas respuestas emocionales (como la paralización) por el hecho de estar emparejadas con una descarga. Esas respuestas emocionales condicionadas son incompatibles con la respuesta de presión de palanca (la rata no puede quedarse paralizada y al mismo tiempo presionar la palanca). Por tanto, la tasa de presión de la palanca se suprime durante las presentaciones del EC. Pero los procedimientos de castigo no suelen incluir, a diferencia del experimento de supresión condicionada, un EC explicito que señale que va a darse la descarga. Estes sugirió que cumplen esta función diversos estímulos (visuales, táctiles y propioceptivos) que el sujeto experimenta antes de dar la respuesta castigada, como los Eds, la postura de su propio cuerpo antes de responder, la visión de la palanca, etc.