6.3. Elección con compromiso

Se dice a la gente que carece de autocontrol si elige una recompensa pequeña a corto plazo en lugar de esperar para conseguir un beneficio mayor pero más demorado.

Programas concurrentes encadenados

Programa A (RV 10)                Programa B (RF 10)

                *    *                                        *    *

Eslabon terminal                        Eslabón terminal

        TECLA A                                    TECLA B      Eslabón de elección(no es el reforzador primario)

Hay 2 fases o eslabones: Durante la primera fase el eslabón de elección elige entre 2 programas alternativos. Responder a este eslabón de elección no proporciona resultados, sólo cuando se encuentre en el eslabón terminal. Cuando se escoge A o B está comprometido hasta el final del eslabón terminal del programa por eso implican elección con compromiso.

Se prefiere la alternativa de razón variable RV. La variedad parece ser la sal de la vida. El eslabón terminal se convierte en reforzador condicionado.

La conducta de elección está gobernada tanto por los programas de eslabón terminal como por cualquier programa que funcione en el enlace inicial.

Estudios de autocontrol

Autocontrol es elegir una recompensa grande demorada sobre una recompensa pequeña inmediata. El autocontrol es más fácil si la alternativa tentadora (un pastel) no está tan claramente disponible (en la carta hay pastel y verduras).

Una propiedad general de la conducta de elección: Si las recompensas se entregan rápidamente tras una respuesta de elección, los sujetos generalmente prefieren una recompensa pequeña inmediata más que una recompensa grande demorada. Sin embargo, si se añade una demora constante a la entrega de ambas recompensas, los sujetos muestran autocontrol y prefieren la recompensa grande demorada.

Explicaciones del autocontrol

Principio general: el valor de un reforzador se reduce en función de cuánto tiempo se tiene que esperar para obtenerlo. La fórmula para esta reducción en el valor se llama función descontadora del valor.

 V= M/(1+ KD) función del decaimiento hiperbólico.

M= magnitud de la recompensa

D= demora de la recompensa

K= parámetro de la tasa descontadora

Cuando se entrega el reforzador sin demora D=0, el valor del reforzador está directamente relacionado con su magnitud (los reforzadores más grandes tienen valores mayores).

Incrementar la demora de las recompensas grande y pequeña hace más fácil que se muestre autocontrol seleccionando el reforzador más grande pero con más demora.

Las funciones descontadoras y los problemas de autocontrol en la adicción a la droga

El abuso de sustancias frecuentemente refleja una serie de elecciones impulsivas.

Las funciones descontadoras de la recompensa era mucho más acusada para los adictos a la heroína, es decir, el valor del dinero disminuyó muy rápido si la recepción del dinero iba a demorarse. Esta función acusada del descuento de la recompensa indica una falta de control es decir, impulsividad.

¿Puede entrenarse el autocontrol?

Sí. Una persona que no puede tolerar esperar el tiempo necesario para obtener recompensas grandes tiene que olvidarse de obtener estos reforzadores.

Siempre y cuando las tareas de entrenamiento implicasen bajo esfuerzo, el entrenamiento con la recompensa demorada incrementó la preferencia por la recompensa más grande demorada. Por lo tanto, el entrenamiento con reforzamiento demorado produce autocontrol.

Contenido relacionado