Programas de reforzamiento

Programas básicos de reforzamiento

Programas de razón frente a programas de intervalo: funciones de retroalimentación

La forma en que se programan los reforzadores en contingencia con la emisión de una respuesta operante constituyen los programas de reforzamiento. Cada uno de ellos especifica una regla que determina las condiciones en las que una respuesta puede ser reforzada. Hablamos de reforzamiento intermitente o parcial cuando tan sólo se refuerzan algunas de las respuestas que emite el sujeto y no todas, y es lo que generalmente mantiene todo comportamiento condicionado de forma operante. El reforzamiento parcial en comparación con el reforzamiento continuo, produce un aprendizaje más duradero y más difícil de extinguir.

Se han investigado muchas formas diferentes de programar los reforzadores de manera intermitente, los principales y más básicos programas de reforzamiento positivo intermitente se pueden clasificar en dos bloques: programas de razón y programas de intervalo. Los programas de razón estipulan que se debe emitir un número determinado de respuestas antes de que la última de ellas sea reforzada. Los programas de intervalo establecen que debe pasar un determinado tiempo desde la consecución del reforzador anterior antes de que la respuesta requerida sea de nuevo reforzada. El requisito del número de respuestas en los programas de razón o el tiempo transcurrido en los programas de intervalo, es a partir de la presencia del reforzador anterior.

Los programas de razón y de intervalo pueden a su vez, clasificarse en programas fijos y programas variables. De la combinación de estas divisiones surgen cuatro programas básicos de reforzamiento: razón fija, razón variable, intervalo fijo e intervalo variable.

Cita de Ferster y Skinner: “Un programa de reforzamiento puede definirse sin referencia a sus efectos sobre la conducta. De esta manera, una respuesta puede ser reforzada en base al tiempo que ha transcurrido desde que se administró el reforzador precedente, o en base al número de respuestas que han sido emitidas desde que se administró el anterior reforzador. Un programa dado puede ser fijo o puede variar, ya sea al azar, ya sea de acuerdo con un plan. Estas dos posibilidades suministran cuatro programas básicos: intervalo fijo, intervalo variable, razón fija y razón variable. Pero otras posibilidades existen, así como muchas combinaciones de tales programas”

En un programa de razón fija el número de respuestas requerido para que se administre el reforzador es siempre el mismo, siempre se tiene que dar el mismo número de respuestas para conseguir cada reforzador. Se abrevia RF seguida de un número que indica el valor del número de respuestas requerida, por ejemplo RF-50. El programa RF-1 sería lo que antes hemos denominado reforzamiento continuo, puesto que sería reforzada cada respuesta.

Un programa de razón variable requiere en cambio un número de respuestas que varía de una ocasión a la siguiente, de manera irregular, alrededor de un número promedio de respuestas por cada reforzador. Se abrevia RV, de manera que en un programa RV-100 se conseguirá el reforzador si en promedio se han emitido cien respuestas, en unas ocasiones más y en otras menos, teniendo 100 como valor medio.

Los programas de intervalo fijo son aquellos que, al mantener constante el tiempo requerido para el siguiente reforzador, reforzarán la primera respuesta que ocurra una vez haya transcurrido un tiempo siempre igual desde que se dispensó el último reforzador. En cambio los de intervalo variable son aquellos donde varía la cantidad de tiempo a transcurrir entre un reforzador y el siguiente antes de que la respuesta sea reforzada, dando lugar a un valor promedio de intervalo entre reforzadores.

Estos programas también se abrevian IF e IV seguidos del valor numérico de la cantidad de tiempo que debe transcurrir.

Cada uno de estos cuatro programas básicos produce una ejecución conductual característica y diferente, que se puede apreciar solo con ver la forma cómo se distribuyen las respuestas a lo largo del tiempo. Una forma de registrar las respuestas en un registrador acumulativo, que es un rollo de papel que va girando a velocidad constante y sobre el que se apoyan dos plumillas que van dibujando, una cuando el sujeto da respuestas, indicando también qué respuestas son reforzadas, y otra que marca cuando se presenta el estímulo discriminativo.

Se puede medir así tanto el número de respuestas, como el número de pausas, el tiempo transcurrido entre ellas (TER: tiempo entre respuestas) o el tiempo total sin responder.... El resultado es una curva acumulativa continua que refleja las tasas de respuesta.

La observación de cómo se distribuyen las respuestas en un registro acumulativo permite una lectura fácil de la tasa de respuesta y de los cambios asociados a ella que ocurren en el tiempo. Cómo el papel avanza a una velocidad constante, cuando se responde rápidamente (tasa alta de respuesta) el registro será muy inclinado. Si la tasa de respuesta fuera baja, el registro sería más plano, y de la misma forma ante una tasa de respuesta de valor medio el registro será una pendiente intermedia. Esta técnica de medida con el registro acumulativo tiene varias ventajas: se pueden medir todas las respuestas aun cuando ocurran muy rápidamente, y registrar las estructuras de comportamiento sin perder detalles. Permite hacer una medición no contaminada de las respuestas de los sujetos experimentales durante periodos prolongados de tiempo.

Los programas de RV (panel b) proporcionan tasas de respuesta muy altas y constantes, que a veces se aproxíman a los límites de capacidad física de los organismos. Los programas de IV (panel d) tambien dan tasas constantes de respuesta, aunque normalmente de un valor inferior a las producidas en un RV. Ambos proporcionan un índice de perseverancia muy elevado. (vertical: no respuestas, horizontal: segundos).

En cambio la tasa de ejecución en un programa de RF (panel a) se caracteriza inicialmente por una tasas elevada de respuesta, que se mantienen desde la primera respuesta después de haber obtenido el reforzador hasta la siguiente respuesta reforzada. Esta ejecución alta y estable de conducta se desarrolla rápidamente cuando la razón es relativamente pequeña.

Sin embargo cuando la razón es mayor, como por ejemplo RF-50 (la representada aqui) se observa una pausa post-reforzamiento que se sigue de una transición casi instantánea a una tasa alta de respuesta posterior (la carrera de la razón). La duración de la pausa post-reforzamiento en los programas de RF depende, principalmente, del valor de la razón. Si el requisito de la razón fuese muy elevado, se puede dejar de responder por completo, lo que se denomina tensión de la razón.

La ejecución en un programa de IF (panel c) se caracteriza por una pausa post-reforzamiento más o menos prolongada en función de la duración del intervalo, y por una progresiva aceleración posterior de la tasa de respuesta en cada uno de los intervalos, de manera que la tasa mayor de respuesta se produce cerca del final del intervalo. Esta pauta de conducta, como la representada en la gráfica de abajo para un programa de IF-60 seg, es frecuentemente referida como festoneado, para resaltar así la existencia de cambios sistemáticos en la tasa de respuesta. En los programas de IF, la tasa global de respuesta no parece ser el mejor indicador de la ejecución conductual en estos programas de reforzamiento

Como se ha señalado, la tasa de respuesta aumenta progresivamente en cada uno de los intervalos a medida que avanza el tiempo, y estos cambios son lo genuinamente característico de los programas de IF. El patrón de respuestas en un programa de IF refleja un proceso de discriminación temporal, de manera que los animales responden cuando «subjetivamente» consideran que es altamente probable la consecución del reforzador.

La diferencia fundamental entre los programas fijos (RF e IF) y los variables (RV e IV) es que en los primeros, de forma contraria a los segundos, suele aparecer una pausa tras cada reforzamiento. La diferencia fundamental entre un programa de RF y uno de IF es que en la ejecución del primero se pasa de la pausa post-reforzamiento a una tasa alta y estable de respuesta, mientras que en IF se pasa de la pausa post-reforzamiento a una aceleración gradual en la tasa de respuesta hasta alcanzar una tasa alta al final del intervalo.

En los programas de intervalo, una vez que la respuesta está disponible, el sujeto puede recibirla en cualquier momento a partir de entonces (porque ya ha pasado el intervalo de tiempo estipulado) con tal de que dé la respuesta requerida. En muchas ocasiones esta disponibilidad del reforzador se limita en el tiempo, estipulando un tiempo límite para conseguir el reforzador. Esta clase de restricción se llama duración limitada y se puede aplicar tanto a IF como a IV.

La duración de la pausa post-reforzamiento que ocurre en los programas de RF se incrementa sistemáticamente a medida que aumenta el requisito de la razón. De la misma forma, la pausa post- reforzamiento está directamente relacionada con la longitud del programa de IF, de forma que a mayor duración del intervalo mayor será la respuesta. En los programas de razón, a medida que se aumenta el requisito del número de respuestas, se aumenta también el intervalo entre reforzadores, dado que se tarda más en completar las respuestas necesarias para conseguir el reforzador. Killeen mostró que la duración de la pausa post-reforzamiento en los programas de RF depende más de la frecuencia de reforzamiento (que viene determinada por el intervalo temporal entre los reforzadores) que del propio requisito del programa en cuanto al número de respuestas a realizar.

En los programas de razón, la duración de la pausa está determinada más por el programa que se va a completar que por el que ha ocurrido inmediatamente antes. Los programas se pueden disponer en cuatro series secuenciales distintas en base a la longitud corta o larga de la razón. Así, las transiciones de uno a otro programa de RF pueden ser:, larga-larga, corta-larga, corta-corta, larga-corta. Si el programa que va a ocurrir es el responsable de la longitud de la pausa, se esperan pausas más largas en los dos primeros casos, en los que el programa que viene después es una RF larga, que en los dos últimos. Y de forma contraria, si el programa que ya ha ocurrido es el responsable de la pausa siguiente, las pausas más largas deberían ocurrir cuando el programa precedente hubiera sido una RF larga, es decir en secuencias larga-larga y larga-corta. Los resultados parecen indicar que la longitud de la pausa está mejor predicha por el programa de RF que va a ocurrir que por el que ya ha ocurrido, puede ser debido a que las RF más largas aumentan la separación entre las respuestas iniciales y el reforzador que ocurre al final de la serie, de manera que es más contiguo a las últimas respuestas que a las primeras.

Programas de razón frente a programas de intervalo: funciones de retroalimentación

Cuando se igualan las tasas y patrones de reforzamiento, la tasa de respuesta suele ser mayor en los programas de razón que en los de intervalo. Esto se ha investigado por un procedimiento que asigna un valor de intervalo a un programa de reforzamiento en función de lo que hayan tardado los animales previamente en completar un programa de razón (midiendo el tiempo que les lleva realizar todas las respuestas). De esta manera los programas de intervalo y de razón se igualan en cuanto al número de reforzadores obtenidos y la distribución de los mismos.

En la figura se representan registros típicos de programas de RV e IV acoplados de esta manera (las líneas discontinuas verticales indican el momento de ocurrencia de los reforzadores, que como se puede ver coinciden en los dos programas) y, como se puede apreciar, el programa de RV generó una tasa de respuesta mucho más alta que el programa de IV.

En los programas de intervalo, la tasa de respuesta no influye directamente sobre la frecuencia de administración de los reforzadores (la tasa de reforzamiento), mientras que la tasa de reforzamiento varía de manera directa con los cambios en la tasa de respuesta en los programas de razón (comparar las líneas verticales que interseccionan con el eje de abscisas en los paneles c y d de la Figura 5.2., con las líneas horizontales que interseccionan con el eje de ordenadas en los paneles a y b).

Una explicación de estas diferencias es que los programas de intervalo (particularmente IV) tienden a reforzar TER largos, porque el mero paso del tiempo lleva a un incremento en la probabilidad de reforzamiento. Dado que en los programas de IV se generan TER largos, éstos se reforzarán y llegarán a predominar, reduciendo así la tasa de respuesta. Los programas de razón (particularmente RV) no presentan la tendencia de reforzar diferencialmente un TER particular y, por tanto, no favorecen la ocurrencia de TER largos.

Es más, dada la tendencia a responder en ráfagas de respuestas se hace más probable que el reforzador actúe sobre TER cortos. Baum ha denominado este tipo de explicación como molecular, porque un acontecimiento que puede ocurrir en un determinado momento, en este caso el reforzamiento de un TER, es suficiente para producir un efecto. El mecanismo explicativo implicado sería las variaciones momento a momento en la contigüidad respuesta-reforzador.

Una segunda forma de explicar las diferentes tasas de respuesta entre los programas de razón y de intervalo parte de que en los programas de RV existe una correlación directa entre la tasa de respuesta y la tasa de reforzamiento. La tasa de respuesta tenderá a aumentar para maximizar la tasa de reforzamiento.En los programas de IV, sin embargo, no existe virtualmente ninguna relación entre la tasa de respuesta y la tasa de reforzamiento: por mucho que se incremente la primera, no variará la segunda. Baum ha denominado este tipo de explicación como molar, porque las variables efectivas —la tasa de reforzamiento y su dependencia de la tasa de respuesta— son fenómenos temporalmente extensos, haciendo énfasis en la correlación frente a la contigüidad. Las correlaciones entre la tasa de respuesta y la tasa de reforzamiento han sido denominadas funciones de retroalimentación

Una función de retroalimentación es una descripción de la forma en que actúa el ambiente, como la frecuencia de reforzamiento, la magnitud del reforzador, o la demora al reforzador, en función de algún aspecto de la ejecución conductual. Las funciones de retroalimentación no asumen que la conducta esté bajo el control de una variable independiente, simplemente que la conducta afectará a algún aspecto del ambiente. Los aspectos de la conducta y del reforzamiento son variables dependientes, que se relacionan por funciones de retroalimentación, pero que no necesariamente tienen por qué mantener una relación causal. En el condicionamiento operante, la obtención de los reforzadores programados depende de la emisión de la respuesta criterio, y así la tasa de reforzamiento obtenida es también una medida de una ejecución eficiente.

La función de retroalimentación de la tasa de reforzamiento para la tasa de respuesta en un programa de RF que requiera N respuestas por reforzador es R = B/N, donde R es la tasa de reforzamiento obtenido y B es la tasa de respuesta emitida.

El resultado de esta ecuación aplicada a diferentes programas de RF sería este panel, dónde la tasa de reforzamiento que obtiene el sujeto es proporcional a la tasa de respuesta realizada y la proporcionalidad es el requisito de la razón. Cuando más rápido se responda, mayor tasa de reforzamiento, y el número de respuestas requeridas para producir incrementos en la tasa de reforzamiento debe aumentar conforme se incrementa el requisito de la razón. La misma ecuación puede aplicarse para programas de RV.

Las funciones de retroalimentación que relacionan la tasa de respuesta y la tasa de reforzamiento son más difíciles de calcular para los programas de intervalo. En los programas de IV (y también en los de IF) la forma de la función es hiperbólica

Los cambios en la tasa de respuesta a tasas bajas de respuesta afectarán mucho a las tasas de reforzamiento, pero cuando las tasas de respuesta sean altas, los cambios en la tasa de respuesta tendrán poco efecto sobre la tasa de reforzamiento. Cuanto más corto es el programa de IV existe un mayor margen para que pequeños incrementos en las tasas bajas de respuesta produzcan incrementos sustanciales en la tasa de reforzamiento. Las funciones se aplanan a partir de una tasa de respuesta, porque por mucho que se responda la tasa máxima de reforzamiento no puede aumentar más que el valor especificado por el programa de intervalo.

El que en los programas de intervalo existan áreas aplanadas en las funciones de retroalimentación indica que el control diferencial de la conducta es bastante débil, las contingencias de reforzamiento no empujan la conducta en ninguna dirección. Esta es la diferencia fundamental entre los programas de intervalo y los programas de razón.

El ejemplo paradigmático de una función de retroalimentación plana es el experimento de superstición (Capítulo 4), donde no hay contingencia programada entre la ocurrencia o no de la respuesta y la presentación del reforzador, ni por supuesto entre la tasa de respuesta y la tasa de reforzamiento.

Programas de reforzamiento diferencial de tiempos entre respuestas

Para probar que el reforzamiento diferencial de los TER es posible se diseñaron programas de reforzamiento específicos a tal fin, reforzando específicamente TER cortos y TER largos. El diseño básico de estos programas es elegir un tiempo determinado y reforzar únicamente los TER que sean más largos que ese tiempo, lo que viene a definir los programas de Reforzamiento Diferencial de tasas Bajas de respuesta (RDB), o los TER más cortos que el tiempo elegido, lo que viene a definir los programas de Reforzamiento Diferencial de tasas Altas de respuesta (RDA).

La diferencia entre RDB y IF, es que en los programas de RBD sólo se refuerza la respuesta si ha transcurrido un tiempo especificado desde la anterior respuesta (un TER), mientras que en los programas de IF la respuesta es reforzada si ha transcurrido un tiempo determinado desde el anterior reforzador. Por tanto en los RDB se añade una contingencia de castigo para las respuestas que ocurren antes del tiempo especificado por el programa, ya que cualquier respuesta prematura reinicia el intervalo de tiempo requerido. La manera de obtener el reforzador es, por tanto, refrenar la respuesta por un tiempo y emitirla cuando ha transcurrido dicho intervalo temporal. Esta pequeña modificación da como resultado una ejecución operante muy diferente a la que se obtiene en un IF, porque la contingencia añadida para las respuestas que ocurren antes de transcurrir el tiempo especificado, debe ser considerada como un castigo, porque la consecuencia de la respuesta es la presentación de un tiempo-fuera de reforzamiento positivo.

El RDA se define porque el reforzador se hace contingente con la respuesta si esta ocurre antes de que haya transcurrido un tiempo determinado, reforzando especialmente los TER cortos. En este programa el reforzador se obtiene si se responde antes del tiempo especificado, y las respuestas que ocurran después de ese intervalo temporal simplemente reinician el intervalo. Por eso se obtienen tasas altas de respuesta.La ejecución en los programas RDA es más fácil que en los RDB porque es difícil reforzar específicamente una respuesta pero que no se haga de forma repetida. La dificultad puede deberse a la inducción de respuestas por el reforzamiento espaciado y/o a la degradación del valor del reforzador por encontrarse demorado desde la emisión de la respuesta criterio.

Teoría del reforzamiento diferencial de los tiempos entre respuestas

La teoría del reforzamiento diferencial de los TER se basa en que los reforzadores no sólo refuerzan ejecutar una determinada respuesta, sino que también refuerzan el hacerlo a un determinado ritmo, con un determinado espaciamiento entre respuestas. Afirma así que en todos los programas de CO se refuerzan específicamente TER de una duración determinada, concretamente se reforzaría el TER que ocurre antes de la administración del reforzador.

Los programas RDB y RDA están específicamente diseñados para reforzar, respectivamente, TER de duración larga y de duración corta. También cambia la ejecución del sujeto dependiendo de si los reforzadores se dan de acuerdo a programas de razón o intervalo, y también según si son fijos o variables.

Los programas RV e IV consiguen una tasa de respuesta muy constante, esto es, sin pausas post- reforzamiento, con lo que la duración de los TER es muy homogénea y es fácil atribuir su ejecución al reforzamiento diferencial de los TER de una duración determinada

La ejecución en los programas de RF e IF, sin embargo, no es tan homogénea como en los programas variables y normalmente se obtienen acusadas pausas post-reforzamiento. De acuerdo con la aplicación estricta de la teoría de reforzamiento diferencial de los TER, los TER reforzados en los programas de RF e IF deberían ser siempre muy cortos, puesto que los reforzadores se presentan al final cuando los sujetos están respondiendo a una tasa alta. No se tendría por qué esperar que los sujetos dejaran de responder inmediatamente después de haber conseguido el reforzador (la pausa post-reforzamiento) puesto que este intervalo no es otra cosa que un TER de muy larga duración. Para solventar esta dificultad se han ideado diferentes alternativas que lo que hacen es considerar mecanismos adicionales que se combinen con el reforzamiento diferencial de los TER y así explicar tanto la constancia en los programas variables como las variaciones en tasas de respuesta observadas en los programas fijos. Se puede añadir por ejemplo un mecanismo de discriminación temporal para explicar que las pausas post-reforzamiento en programas de RF e IF son debidos a que los sujetos experimentales son capaces de discriminar eficazmente el momento de entrega del reforzador, y saben que después de entregar el último es improbable conseguir uno nuevo después.

Programas compuestos de reforzamiento

Los programas compuestos resultan de la aplicación de dos o más programas básicos de reforzamiento y pueden dividirse en dos grandes bloques, aquellos donde la presentación de los programas componentes es secuencial y aquellos donde los componentes se presentan de forma simultánea.

Programas alternantes y secuenciales: el control por el estímulo y reforzamiento condicionado

Los programas secuenciales son cuatro: programa mixto, programa múltiple, programa tándem y programa encadenado, siendo los dos primeros alternantes y los dos últimos estrictamente secuenciales.

En un programa mixto se presentan dos o más programas básicos alternándose al azar. El cambio de uno a otro de los programas es independiente de la conducta del sujeto, depende de la duración de un tiempo establecido con anterioridad por el experimentador. Si por ejemplo cada componente dura diez minutos, durante los diez primeros puede estar en funcionamiento un programa IF-60seg (le damos comida cuando dé una respuesta después de transcurridos 60 seg desde el anterior reforzador)- Los siguientes diez minutos va a funcionar el segundo programa, por ejemplo RF-50 (reforzaremos cada vez que emita 50 respuestas consecutivas) y al terminar sus 10 minutos, volverá a empezar el programa IF 60 seg... así sucesivamente hasta un número de veces determinado también previamente por el experimentador.

El programa múltiple es exactamente igual que el mixto con la diferencia de que cada componente se señala con una clave discriminativa distinta, (luz, sonido, cualquier estimulación ambiental...) y el sujeto es informado en todo momento en qué parte del programa múltiple se encuentra. Por ejemplo el encendido de la luz podría marcar la presencia del programa IF 60-seg y cuando la luz se apaga el programa RF 50. Si un estímulo discriminativo indica que las respuestas pueden ser reforzadas de acuerdo a reforzamiento positivo, y un estímulo diferente señala la imposibilidad de conseguir dicho reforzamiento, nos encontramos ante un programa múltiple donde se establece una discriminación entre un estímulo discriminativo positivo (E+ o Ed) y un estímulo discriminativo negativo (E- o EΔ). El aprendizaje consistiría en emitir respuestas en presencia del E+ y omitirlas en presencia del E-, lo que permite estudiar el grado de control ejercido por los Eds sobre la respuesta instrumental.

Un programa tándem consta al menos de dos programas simples que se presentan siempre en el mismo orden. Los sujetos experimentales deben completar el primer programa para poder iniciar el segundo, al final del cual consiguen la administración del reforzador. En este programa, al contrario que en los anteriores, solo es posible conseguir el reforzador si se cumplen en sucesión todo los programas componentes. Cumplir uno de ellos (y por extensión, sus anteriores) sólo da lugar a la posibilidad de realizar el siguiente, y el reforzador se conseguirá al terminar de completar todos. Por ejemplo, un programa tándem IF 60-seg RF-50 se inicia con el programa de IF 60- seg, de forma que la primera respuesta después de transcurridos 60 segundos da acceso al programa de RF-50. Al emitir 50 respuestas se obtendrá el reforzador, lo que de nuevo puede permitir comenzar el primer programa y repetir el tándem durante un número determinado de veces o un periodo de tiempo establecido con anterioridad.

El programa encadenado es exactamente igual que el tándem, pero en este caso cada uno de los dos programas simples está señalado de manera diferente, de forma que el sujeto experimental conoce en qué componente del programa se encuentra en cada momento. Habitualmente la terminación del primer programa se acompaña del encendido de una luz o de la presentación de un sonido, que permanece en funcionamiento durante el segundo programa hasta el momento de la consecución del reforzador. Ej. en un programa encadenado IF 60-seg RF-50, la primera respuesta una vez transcurridos 60 segundos inicia el programa de RF-50, al tiempo que provoca el encendido de una luz de la caja experimental, que permanecerá encendida hasta que se complete la respuesta número cincuenta y se consiga el reforzador.

Los programas encadenados se han utilizado para estudiar el reforzamiento condicionado, que se refiere al hecho de que algunos estímulos adquieren capacidades reforzantes por su asociación con los reforzadores primarios. En los programas encadenados, el cambio en el ambiente producto de la finalización del primer programa adquiere propiedades de reforzador por su asociación con el reforzador que se consigue al finalizar el segundo programa. Las propiedades reforzantes de estos estímulos se miden por su capacidad para encadenar respuestas, de manera que los sujetos experimentales responden para conseguir dichos cambios en el ambiente. Esta técnica del encadenamiento ha permitido estudiar en los estímulos capacidades reforzantes de segundo orden, de tercer orden, e incluso de órdenes superiores

Programas simultáneos: programas concurrentes y programas combinados

Los más importantes y conocidos son los programas concurrentes, que se caracterizan por disponer simultáneamente de al menos dos programas básicos de reforzamiento. En los programas concurrentes se puede cambiar de un programa a otro sin que normalmente haya sido necesario haber completado un tiempo o un número de respuestas en cada uno de los programas. Los sujetos experimentales, como consecuencia, deben elegir entre responder a uno u otro de los programas que componen el programa concurrente. Por ejemplo, en una caja de condicionamiento podemos disponer de dos palancas de respuesta, una a la derecha asociada a un programa IV 60-seg y otra a la izquierda asociada a uno IV 30seg.

Se mide el número de respuestas en cada una de las palancas y se calcula la proporción por la que se distribuyen las respuestas entre una y otra.

Otros programas compuestos simultáneos consisten en combinaciones de un programa de razón y otro de intervalo, y existen al menos tres combinaciones que deben distinguirse:

En un programa alternativo se refuerza una respuesta cada vez que se cumple con el requisito del programa de razón o el del intervalo, existiendo así dos formas de conseguir el reforzamiento.
En un programa conjuntivo se refuerza una respuesta cada vez que se cumple al mismo tiempo con el requisito de la razón y del intervalo.
En un programa entrelazado la respuesta que se refuerza viene determinada por dos programas, pero la disposición de uno de ellos se altera por el desarrollo del otro. otro. Una posibilidad es que cierta suma de respuestas y de tiempo (ej. 10 respuestas o 6 respuestas en 4 seg, ó 3 respuestas en 7 seg o 10 seg) debe darse antes de que la respuesta sea reforzada, o bien que algún valor recogido en un programa de razón determine las características de un programa de intervalo.

Programas de reforzamiento

Programas básicos de reforzamiento

Programas de razón frente a programas de intervalo: funciones de retroalimentación

Programas de razón frente a programas de intervalo: funciones de retroalimentación

Programas de reforzamiento diferencial de tiempos entre respuestas

Teoría del reforzamiento diferencial de los tiempos entre respuestas

Programas compuestos de reforzamiento

Programas alternantes y secuenciales: el control por el estímulo y reforzamiento condicionado

Programas simultáneos: programas concurrentes y programas combinados

Compartir

Contenido relacionado

Categorías del Blog

Compartir

Los más populares

Últimas novedades

Enlaces web

Te puede interesar