La naturaleza de la asociación en el aprendizaje instrumental

La formulación de la ley de igualación y de la teoría de la igualación, por Herrnstein, se basaron en el constructo de fuerza de la respuesta. Este constructo es probablemente mejor entendido como variable interviniente y no realmente como un constructo hipotético, en el sentido de que responde a un conjunto de cantidades empíricamente medibles de conducta (preferentemente la tasa de respuesta, pero no sólo).

¿Cómo se desarrolla la fuerza de la respuesta? La respuesta tradicional a esta pregunta ha sido (y quizás continúa siendo la más extendida) de naturaleza asociativa, y en concreto a partir de la formación de asociaciones entre los estímulos y las respuestas. Éste fue el planteamiento de Thorndike en la formulación de la ley del efecto, y por eso se considera que la ley del efecto propuesta por Thorndike es de naturaleza teórica. Sin embargo, es Hull quién mejor representa la teoría de que el aprendizaje es fruto de la formación de asociaciones estímulo-respuesta (E-R). Según este punto de vista, los estímulos ambientales elicitan respuestas, y su asociación se ve estampada por la ocurrencia del reforzador. En el futuro, ante la presentación de tales estímulos será más probable la ocurrencia de las respuestas que han sido reforzadas.

Thorndike comenzó a trabajar experimentalmente con animales dentro del ambiente darwinista de finales del siglo XIX. Para sus experimentos, y como se vio en el Capítulo 4, construyó unas ingeniosas cajas- problema que, aunque de rudimentario diseño, le permitieron estudiar experimentalmente la conducta de los animales. Estas cajas se encontraban cerradas con una puerta que el animal podía abrir accionando un pestillo. Sus sujetos experimentales, generalmente gatos, estaban hambrientos cuando se colocaban en el interior de la caja. La comida se situaba en un recipiente a la vista de los animales, aunque lejos de su alcance. El modo de obtener la comida era el problema que tenían que resolver los gatos de Thorndike.Tras varios intentos infructuosos, los animales conseguían «por casualidad» accionar el pestillo para abrir la puerta y así acceder a la comida. En intentos sucesivos la rapidez con que los gatos conseguían abrir la puerta de la caja iba disminuyendo progresivamente, hasta el punto de que nada más introducirlos en la caja eran capaces de salir casi inmediatamente.

Thorndike formuló las leyes necesarias para explicar el aprendizaje, entre las que destaca la «ley del efecto» y que quedó enunciada de la siguiente manera: “De las varias respuestas que se dan en la misma situación, aquellas que van acompañadas o estrechamente seguidas de satisfacción para el animal, siendo constantes otras condiciones, tenderán a conectarse más firmemente con la situación, de modo que, cuando ésta se repita, tales respuestas tendrán mayor probabilidad de volver a ocurrir; aquellas que van acompañadas o estrechamente seguidas de malestar para el animal, siendo constantes otras condiciones, verán debilitadas sus conexiones con tal situación, de modo que, cuando ésta se repita, tales respuestas tendrán menor probabilidad de ocurrir. Cuanto mayor sea la satisfacción o el malestar, mayor será el fortalecimiento o debilitamiento del vínculo” Es importante considerar de nuevo aquí esta ley por sus repercusiones teóricas. La ley del efecto en realidad es una ley teórica, que postula que la fuerza de la asociación E-R no depende de los principios asociacionistas clásicos que explicaban el condicionamiento pavloviano, más bien dichas asociaciones dependen de la propia consecuencia de la acción. Esto marca el inicio del estudio experimental del CO.

Hull en los años 40 utilizó los principios de asociación E-R para explicar el comportamiento aprendido. La consecución del reforzador, según Hull, refuerza la formación de una asociación E-R debido a una reducción del impulso, introduciendo así el concepto de motivación en la teoría del aprendizaje. Para que los animales ejecuten una acción determinada es imprescindible que tengan una necesidad biológica, que queda reducida por la consecución del reforzador y que en consecuencia produce un incremento en la fuerza de la asociación entre el estímulo y la respuesta. Hull desarrolló la primera teoría formal sobre la formación de los hábitos, convirtiéndose así en el más clásico de los psicólogos hipotético-deductivos del aprendizaje y en el mejor exponente de la corriente de pensamiento conocida como neoconductismo.Introdujo también el concepto de incentivo para explicar resultados como los de los efectos de contraste que no se podían explicar únicamente en base a la noción de impulso. La consecución del reforzador, según Hull, reduce las necesidades del organismo (impulso) al tiempo que incita a la acción (incentivo), distinguiendo estos dos aspectos motivacionales de los reforzadores, que quedaron incorporados a la ecuación que determina la fuerza de la respuesta como factores separados.

La ejecución conductual va a depender de la fuerza del hábito (H), del nivel de impulso (D=drive) y del valor del incentivo (I), siguiendo la Ecuación 5.10 (nótese que tanto la ejecución como la fuerza del hábito están en función de la conexión E-R):

Tolman es generalmente descrito como el defensor de un esquema estímulo-estímulo (E-E) en el aprendizaje, contrario a la teoría E-R. Varios datos experimentales sirvieron a Tolman para apoyar este punto de vista. Como el experimento en el que unas ratas fueron entrenadas a nadar por un pasillo para conseguir comida que había al final. Después las ponían un falso suelo de manera que podían llegar a la comida corriendo. A pesar de que no se había enseñado a las ratas a correr, todas ejecutaron la conducta adecuada para conseguir la comida. Si el aprendizaje de las ratas hubiera sido exclusivamente el de nadar por el pasillo, nunca habrían podido correr casi inmediatamente después de situar el suelo falso en la segunda parte del experimento. Para Tolman, las ratas aprendieron un «mapa cognitivo» del pasillo y podían trasladarse de un extremo al otro del mismo de la forma física adecuada para cada momento. Las ratas en este experimento aprendieron dónde ir y no tanto a efectuar unos movimientos musculares concretos, resultado opuesto al predicho por los defensores de un esquema E-R para el aprendizaje. Con este experimento Tolman no sólo intentó demostrar que los cambios en la conducta atribuidos al aprendizaje son el resultado de la intervención de procesos como la expectativa de recompensa, sino que al mismo tiempo para Tolman es necesario distinguir entre el aprendizaje y la ejecución, no resultando necesario el reforzador para el aprendizaje pero sí para la ejecución.

Tolman recoge varios ejemplos experimentales donde, en ocasiones, los animales pueden estar aprendiendo una determinada tarea y, sin embargo, no ejecutar en ese momento la respuesta requerida para la consecución del premio. Una situación experimental de este tipo es, por ejemplo, la denominada de aprendizaje latente, dónde los sujetos recorren un laberinto pero no se les recompensa por hacerlo en la primera fase, y después en la segunda se les vuelve a situar en el laberinto y se refuerza con comida la respuesta correcta. En circunstancias como ésta se comprueba que los animales experimentales aprenden a efectuar la respuesta correcta más rápidamente que otros animales de control que no habían tenido la oportunidad de recorrer el laberinto en primera instancia. Se dice entonces que los animales experimentales habían aprendido ya a recorrer el laberinto antes de empezar a recibir el premio, pero que no ejecutaban la respuesta porque faltaba el reforzador. El reforzador por tanto no sería necesario para el aprendizaje pero es imprescindible para que posteriormente se ejecute la respuesta aprendida. En este caso, el reforzador estampa la conexión entre el estímulo y la respuesta, pero la ejecución de la respuesta es provocada por la mera presentación del estímulo ambiental antecedente. A pesar de esta diferencia esencial entre los planteamientos de Tolman y Hull, ambos autores coincidirían en señalar que el aprendizaje y la ejecución son aspectos separables.

Seguramente los mecanismos asociativos E-R y E-E puedan estar ambos implicados en el aprendizaje instrumental, siendo el mecanismo E-R más específico en cuanto que establece formas precisas para producir las respuestas, y no sólo la adquisición de la asociación. A través del mecanismo E-R se pueden entender por qué determinadas respuestas son más adecuadas a determinados estímulos antecedentes y en función de las consecuencias que hayan seguido a las respuestas con anterioridad, un mecanismo que establece reglas de ejecución y no sólo de aprendizaje.

Contenido relacionado