Por condicionamiento operante (CO) entendemos el proceso que da lugar a que la probabilidad de una respuesta se vea modificada por sus consecuencias, es decir, por los efectos que tiene el ambiente sobre ella.
El ejemplo más común: una rata en una caja de Skinner, que dispone de una palanca que está conectada al contenedor de comida. Para el animal, la caja será las circunstancias o el ambiente. Si la rata cuando está explorando da por casualidad a la palanca, se liberará una bolita de comida, lo que hace que aumente la probabilidad de que el animal accione de nuevo la palanca para conseguir una nueva bolita de comida.
Por tanto el condicionamiento operante dispone al sujeto en unas circunstancias en las que alguna de sus conductas da lugar a la aparición de un evento, lo que produce un cambio de la probabilidad de emisión de esa conducta en el futuro. El término “operante” se utiliza porque a diferencia de lo que ocurría en el CC el sujeto interviene u “opera” en el medio.
Si el resultado del comportamiento es beneficioso para el animal la conducta se fortalecerá, siendo más probable que se emita de nuevo en circunstancias parecidas. Si el resultado es perjudicial, dicha conducta tenderá a desaparecer del repertorio del sujeto.
Con el condicionamiento operante, los organismos aprenden a obtener consecuencias favorables y a eliminar consecuencias desfavorables del ambiente Este condicionamiento hace que los sujetos, no sólo aprendan a responder ante una nueva circunstancia con una respuesta que formaba parte de su repertorio, sino que además puede dar lugar a la aparición de respuestas nuevas.
La contingencia de 3 términos
La descripción de la conducta operante requiere habitualmente de tres términos elementales y sus interrelaciones funcionales. Estos tres términos fundamentales son el estímulo discriminativo, la respuesta y la consecuencia o reforzador. De este modo la contingencia se define como: en presencia de un estímulo específico, el reforzador se presentará si y solo si la respuesta operante sucede. La contingencia de estos tres términos constituye la unidad fundamental de análisis en el estudio de la conducta operante.
El estímulo discriminativo
Debemos considerar la conducta como la ejecución que ocurre después de un estímulo que en un momento determinado tiene como resultado una consecuencia específica. Esto nos viene a señalar que los estímulos antecedentes también tienen una gran importancia en el condicionamiento operante. Las claves contextuales en el CO reciben el nombre de estímulos discriminativos (Eds) y señalan la ocasión para que si la conducta se presenta sea seguida por una consecuencia. Es decir, un estímulo, en principio neutro, puede indicar si el reforzador está disponible, y por tanto indica al sujeto cuándo ha de responder. Esto implica reforzar una respuesta en una situación pero no en otra, la probabilidad de emitir una operante en presencia de un Ed puede ser muy alta, esto quiere decir que el estímulo ejerce un control sobre esa respuesta, pero no es que el Ed provoqué la respuesta.
Las consecuencias de las respuestas operantes establecen el control que ejercen los Eds. Cuando un Ed va seguido de una respuesta cuya consecuencia es apetitiva, se ve como ya hemos dicho reforzada, y por tanto la probabilidad de que ocurra aumenta si dicho estímulo está presente posteriormente. Cuando una respuesta operante no es seguida de una conducta reforzante, el estímulo que precede la respuesta se conoce como estímulo delta (EΔ), y en su presencia la probabilidad de emitir la operante disminuye. El termino control por el estímulo se refiere a cómo los estímulos que preceden una conducta pueden controlar la ocurrencia de ésta.
Pensemos en una maquina dispensadora de bebidas en la que introducimos una moneda para comprar un refresco. Una luz verde nos indica que el refresco que queremos seleccionar está disponible y una luz roja nos indica que está agotado. La respuesta operante en este caso es apretar el botón de selección de la bebida. La probabilidad de que pulsemos el botón con la luz verde encendida será mucho más alta que la probabilidad de que pulsemos ese mismo botón si la luz roja está encendida. En este caso la luz verde actúa como un Ed porque señala la disponibilidad del reforzador en el caso de que se emita la respuesta operante y la luz roja como un EΔ porque señala la ausencia del reforzador en el caso de que la operante ocurra.
La respuesta
La respuesta operante en este condicionamiento se define por los efectos que provoca en el ambiente.
Cuando una respuesta produce el mismo efecto que otra respuesta (aunque sean diferentes) estaremos hablando de la misma operante, porque producen los mismos efectos sobre el ambiente. La operante se define por tanto por su función, y no por su forma.
En el caso de presionar la palanca, la ratita puede hacerlo con la pata o con el morro, pero ambas respuestas dan una bolita de comida, por ello son ejemplos de una misma operante.
Skinner señaló que “El término enfatiza el hecho de que la conducta opera sobre el ambiente para generar consecuencias. Las consecuencias definen las propiedades en función de las cuales las respuestas se consideran similares. El término se usara como adjetivo (conducta operante) y como sustantivo que designa la conducta definida por una consecuencia dada”
Cuando hablamos de la conducta, esta puede ser muy compleja y adoptar distintas formas (topografía) teniendo la misma función. Cuando hablamos de clase de respuesta nos estamos refiriendo a cualquier forma de ejecutar una conducta con una función similar, en el ejemplo anterior la función sería obtener comida. Estas respuestas pueden ser físicamente parecidas pero no siempre tiene que ser así: por ejemplo podemos hacer algo nosotros mismos o pedirle a otro que lo haga. Ambas sería la misma clase de respuesta pero con una topografía o forma muy diferente.
El reforzador
Para el CO el término reforzador debe dar cabida a la gran variedad de estímulos y eventos que poseen la capacidad de reforzamiento de una conducta. Se define por tanto en función de los efectos que tiene sobre la conducta. Según esta definición funcional un reforzador es cualquier suceso o evento que al hacerse contingente con una respuesta cambia la probabilidad de aparición de esa respuesta en el futuro.
Reforzamiento condicionado
La conducta humana muchas veces no es controlada por reforzadores primarios como puede ser la comida, sino por eventos cuyos efectos dependen de la historia del reforzamiento. Los elogios o críticas, los juicios sobre nuestro comportamiento, o el dinero, son consecuencias que pueden fortalecer o debilitar la ocurrencia de una conducta. Este tipo de eventos adquieren los efectos que producen debido a las experiencias que la gente ha tenido con ellos a lo largo de sus vidas y ello hace que la misma consecuencia pueda tener efectos distintos dependiendo de la experiencia personal del sujeto (por ejemplo para algunos el dinero es muy importante, pero para otros lo es menos)
Como venimos señalando, un reforzador puede ser definido como un evento cuya entrega aumenta la frecuencia de una respuesta con la que es contingente. El componente critico es la influencia en la tasa de respuesta, no lo que el estímulo o evento es en realidad. Se puede producir el fenómeno del reforzamiento condicionado, también llamado reforzamiento secundario: un estímulo o evento que originalmente no es reforzante, como una luz o un sonido, puede adquirir capacidad de reforzamiento mediante la asociación repetida con otro que era previamente reforzante. Hablamos, entonces, de reforzamiento condicionado cuando una conducta se fortalece debido a sucesos que tienen un efecto que depende de la historia de reforzamiento de ese sujeto. Implica una correspondencia entre un evento arbitrario y un reforzador que es efectivo en el momento actual. Cuando este evento arbitrario es capaz de aumentar la frecuencia o la tasa de una respuesta, a este tipo de reforzamiento lo denominamos reforzamiento secundario o reforzamiento condicionado.
Los resultados de laboratorio en el estudio del reforzamiento condicionado son contradictorios: en algunos la extinción hace que los reforzadores condicionados pierdan efectividad, mientras que en otro se mantienen en situaciones de muchas repeticiones. A pesar de estos resultados que no son concluyentes, la experiencia en la vida diaria sugiere que eventos de este tipo pueden reforzar gran cantidad de conductas sin extinguirse.
Aclaraciones
Reforzador-reforzamiento
El evento sería el reforzador, y el procedimiento o proceso el reforzamiento. El reforzamiento produce incrementos en la conducta, y los reforzadores son los eventos que hacen que el reforzamiento produzca esos efectos. Cuando el procedimiento disminuye la conducta se denomina castigo y los eventos utilizados cuando se presenta la conducta son de naturaleza aversiva. Hay que distinguir así entre consecuencia apetitiva (reforzador) y consecuencia aversiva (castigo).
Respuesta discreta-operante libre
En los experimentos de ensayo discreto, la variable dependiente es la latencia de respuesta. En éstos el ensayo comienza cuando el sujeto es dispuesto en el aparato y éste puede únicamente emitir, y el investigador registrar, una respuesta en cada ensayo. Por ejemplo un laberinto en forma de T, se coloca al animal y se recoge a la salida del brazo una vez obtiene el reforzador correspondiente. Llevan mucho trabajo y tiempo y en un día solo se pueden llevar a cabo un pequeño número de ensayos.
Los procedimientos de operante libre incluyen la novedad introducida por Skinner: la variable dependiente para medir el aprendizaje es la tasa de respuesta, y los sujetos pueden emitir la respuesta de forma constante y repetidamente sin que el investigador tenga que manipular al sujeto de ninguna forma entre ensayo y ensayo.
Topografía-función
La topografía sería el punto de vista estructural de una conducta, la forma de respuesta, sus propiedades o características físicas de una respuesta, entendida como una secuencia de movimientos que ocurren en el tiempo. Por ejemplo para empujar una puerta podemos hacerlo con la mano con el codo o con el pie. Todo ello son diferentes formas de la misma respuesta de empujar la puerta. Desde el punto de vista del CO las consecuencias de una respuesta pueden modificar su topografía o forma. Si estamos en público es menos probable que abramos esa puerta dando una patada, o si queremos evitar hacer ruido será menos probable que la empujemos de golpe. Por esto la topografía es una función de las contingencias de reforzamiento.
Sin embargo la función es la relación de la respuesta con los estímulos antecedentes y las consecuencias de la misma. La conducta es por tanto la ejecución de una respuesta que sigue a un estímulo específico y que tiene como resultado algún tipo de consecuencia. Dos respuestas con la misma forma pueden tener función diferente, y dos respuestas con distinta topografía tener la misma función.
El control que ejerce un reforzador sobre una conducta operante puede estar limitado por la topografía de la respuesta. Por ejemplo la comida como reforzador ejerce poco control en la conducta de rascarse el cuerpo en los hámsteres, pero mucho control sobre otra como alzarse sobre las patas traseras. En otros casos, las relaciones funcionales entre diferentes topografías de respuesta son similares entre ellas: por ejemplo las palomas tienen formas distintas de abrir el pico para beber que para comer.
Instancia de respuesta y clase de respuesta
La conducta operante se define por las relaciones funcionales entre clases de respuestas y las consecuencias ambientales. Una clase de respuesta se refiere a todas las formas en las que la ejecución de la respuesta puede llevar a una función similar. Una instancia de respuesta es la unidad mínima de conducta y se refiere a la ocurrencia particular y especifica de una respuesta teniendo en cuenta además su topografía. Así, podemos especificar “la rata presiono la palanca de la caja de condicionamiento con la pata delantera derecha a las 10:50 p.m.” señalando una instancia de respuesta o utilizar la clase “presionar la palanca” independiente del momento concreto en el que ocurrió la instancia y sin tener en cuenta la topografía.
Interacciones clásicas y operantes en el control de la conducta
Para llevar a cabo un condicionamiento operante, es necesario que el sujeto sea “activo” es decir, que emita algún tipo de respuesta. Para poder reforzar o castigar una conducta es necesario que la conducta ocurra, que se presente con una cierta probabilidad, ya que en ausencia de ella no se podrá establecer una relación entre esa conducta y otro acontecimiento ambiental. Cuando la probabilidad de que ocurra la respuesta es muy baja (por ejemplo que una paloma picoteé una luz) hay ciertas soluciones para no tener que esperar a que se dé por casualidad, lo que nos llevaría mucho tiempo. Una de las soluciones es el automoldeamiento: hacer primero un procedimiento de CC que empareje el estímulo neutro, como la tecla iluminada, con algo apetitivo, como la comida. Como ya sabemos la luz pasaría tras varios ensayos a ser un EC que provoca una respuesta por sí misma al ser presentada en solitario. Una vez que la luz provoca la RC, podemos someterla a control operante haciendo que solo aparezca la comida cuando la paloma la picotea. De esta forma pasa de ser un EC a ser un estímulo discriminativo (Ed) que correlaciona con el reforzador (la comida) cuando el animal presiona la tecla (respuesta operante). La luz en este caso tiene doble función: es un Ed que señala la ocasión para el refuerzo, y es un EC porque elicita una conducta condicionada clásicamente.
Hay que tener en cuenta que habitualmente se dan relaciones de interacción entre CC y CO porque aunque analicemos de forma separada las respuestas condicionadas clásicamente de las respuestas operantes, la influencia de estas contingencias tiene lugar sobre todo el organismo. Diferenciar ambos tipos de aprendizaje puede entonces parecer algo artificial, pero ha sido necesaria la distinción práctica para el desarrollo de la investigación del aprendizaje, además se ha sugerido que a nivel neurobiológico ambos tipos de aprendizaje podrían estar mediados por diferentes mecanismos a nivel celular, lo que señala que el cerebro los procesaría de forma diferentes y por tanto serían fenómenos distintos (aunque esto aún se está discutiendo).