9.3. Qué se aprende en la extinción?

Si como hemos visto la extinción no implica “desaprendizaje” y deja intacta las asociaciones R-C y E-C, ¿por qué disminuye las respuestas en los procedimientos de extinción?.

Asociaciones ER inhibitorias

Los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar de centrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, han llegado a la conclusión de que la falta de reforzamiento produce una asociación E-R inhibitoria: La falta de reforzamiento de una respuesta en presencia de un estímulo específico, produce una asociación E-R inhibitoria que sirve para suprimir esa respuesta siempre y cuando el E esté presente. Esta hipótesis, predice que los efectos de la extinción serán altamente específicos del contexto en el que la respuesta fue extinguida.

La omisión de una recompensa esperada genera desilusión o frustración. Estos efectos emocionales se presume que desempeñan un papel crítico en la disminución conductual que se da en la extinción. La ausencia de recompensa esperada desencadena una reacción frustrante aversiva incondicionada que sirve para que se deje de responder durante el curso de la extinción mediante el establecimiento de una asociación inhibitoria.

La afirmación de que la extinción implica el aprendizaje de una asociación inhibitoria resulta controvertida frente a las teorías convencionales que consideraban la inhibición condicionada y la extinción como fenómenos diferentes.

Efectos paradójicos de la recompensa

Efecto de sobreentrenamiento en la extinción. Cuanto más entrenamiento con reforzamiento se proporciona más fuerte es la expectativa de recompensa, y más fuerte la frustración cuando se introduce la extinción. La disminución en la respuesta se debe a los efectos frustrantes de la ausencia de recompensa, el entrenamiento de reforzamiento más extenso produce una extinción más rápida. Especialmente evidente cuando el entrenamiento incluye reforzamiento continuo.

Ejemplo: Podríamos pensar que un entrenamiento más extenso crearía una respuesta “más fuerte”, que sería más resistente a la extinción, pero sucede lo contrario.

Efecto de magnitud del reforzamiento en la extinción: se refiere al hecho de que la respuesta disminuye más rápido durante la extinción que sigue a un reforzamiento con un reforzador mayor. Es más evidente cuando el entrenamiento incluye reforzamiento continuo.

Ejemplo: Si consideramos dos posibilidades: en una, que se recibe 100€ al mes; en la otra, 20€ al mes.

Si se deja de percibir la cantidad, es más aversiva si nos hemos acostumbramos a 100 que a 20.

Efecto del reforzamiento parcial en la extinción: Es el efecto paradójico más estudiado.

Un factor crítico que determina la magnitud de los efectos tanto conductuales como emocionales de un procedimiento de extinción es el programa de reforzamiento que opera antes de que se introduzca el procedimiento de extinción. Pero la característica dominante del programa que determina los efectos de la extinción es si la respuesta instrumental se reforzó cada vez que ocurría (reforzamiento continuo) o sólo algunas veces (reforzamiento intermitente o parcial). La extinción es mucho más lenta y produce menos reacciones de frustración si estaba en activo un programa de reforzamiento parcial antes de la introducción del procedimiento de extinción. Este fenómeno se denomina el efecto de reforzamiento parcial en la extinción o ERPE,

Mecanismos del efecto del reforzamiento parcial en la extinción

La explicación más evidente del ERPE es que la introducción de la extinción es más fácil de detectar tras el reforzamiento continuo que tras el reforzamiento parcial. La ausencia de reforzamiento es presumiblemente mucho más fácil de detectar tras el reforzamiento continuo. Esta explicación del efecto del reforzamiento parcial en la extinción se llama hipótesis de la discriminación.

El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la ausencia de reforzador. El reforzamiento parcial favorece la persistencia de dos formas diferentes.

Una explicación seria la teoría de la frustración, basada en que los sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa durante el entrenamiento en reforzamiento parcial. La otra explicación, la teoría secuencial, está basada en lo que los sujetos aprenden sobre la memoria de la ausencia de recompensa.

Teoría de la frustración: Desarrollada por Abram Amsel, la persistencia en la extinción es resultado del aprendizaje de algo paradójico, es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado. Asume que el reforzamiento intermitente da como resultado aprender a responder a pesar de esperar la ausencia de reforzamiento. Sin embargo, este aprendizaje requiere considerable experiencia con reforzamiento intermitente.

El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Lo recompensados animan a los sujetos a esperar reforzamiento y los no recompensados les llevan a espera la ausencia de recompensa. Por tanto el reforzamiento intermitente produce el aprendizaje de expectativas tanto de recompensa como de no recompensa. La expectativa de recompensa alienta a los sujetos a responder, y la anticipación de la ausencia de reforzamiento desalienta la respuesta, al principio del entrenamiento los sujetos entran en conflicto con lo que se ha de hacer. Sus expectativas motivan tendencias de respuesta opuestas. Sin embargo a medida que el entrenamiento continua, el conflicto se resuelva a favor de responder.

La resolución del conflicto ocurre debido a que el reforzamiento no es predecible en el típico programa de reforzamiento parcial. Debido a estas experiencias, la respuesta instrumental se condiciona a la expectativa de la ausencia de recompensa. De acuerdo con la teoría de la frustración, esta es la clave de la persistencia en responder durante la extinción. Con suficiente entrenamiento, el reforzamiento intermitente da como resultado el aprendizaje de realizar la respuesta instrumental como reacción a la expectativa de ausencia de recompensa. Por el contrario no existe nada en la experiencia del reforzamiento continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo no produce persistencia en la extinción.

Teoría secuencial; Capaldi, está formulada en términos de memoria. Asume que los sujetos pueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasado reciente. Recuerdan los ensayos recientes tanto recompensados como no recompensados.

Se asume además que durante el entrenamiento en reforzamiento intermitente, la memoria de la ausencia de recompensa llega a ser una clave para la realización de la respuesta instrumental, esto produce persistencia en le extinción.

Considérese un ensayo: RNNRRNR. El sujeto es recompensado en el primer ensayo, no recompensado en los dos siguientes, recompensado dos veces, luego no reforzado y finalmente recompensado de nuevo. Con suficientes experiencias de este tipo, el sujeto aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayo precedentes. Este aprendizaje provoca la persistencia de la respuesta instrumental en la extinción.

Desde que la dos teorías fueron propuestas se ha obtenido gran evidencia en apoyo de cada teoría. Ambas representan dos formas diferentes en las que el reforzamiento parcial puede influir sobre la respuesta durante la extinción. Los mecanismos de memoria pueden contribuir en mayor medida cuando los ensayos de entrenamiento no estén separados por largos intervalos entre ensayos. El aprendizaje emocional descrito por la teoría de la frustración es menos sensible a los intervalos entre ensayos y, por tanto, proporciona una mejor explicación del ERPE cuando se utilizan ensayos ampliamente espaciados.

Contenido relacionado