En el reforzamiento negativo la minimización del
contacto con el evento aversivo se logra “haciendo algo” (la respuesta de evitación o de escape), por lo que se conoce como evitación activa.
En el castigo, ese resultado se obtiene “dejando de
hacer algo” (la conducta castigada), por lo que se conoce como evitación pasiva CONTROL AVERSIVO
Los primeros estudios sobre la evitación fueron los
realizados en seres humanos por Bechterev como una extensión de los trabajos de Pavlov sobre el condicionamiento clásico. En sus experimentos Bechterev pedía a sus sujetos que colocaran un dedo sobre una bandeja de metal y los exponía al emparejamiento de un sonido (EC) con una descarga (EI) CONTROL AVERSIVO
Aunque Bechterev realizó sus estudios en el contexto
del condicionamiento clásico, el hecho de que los sujetos demostraran tener control de la descarga (empezaron a retirar el dedo de la descarga al escuchar el sonido evitando de ese modo el choque eléctrico) incluye a su paradigma en el campo del condicionamiento operante conocido como reforzamiento negativo. CONTROL AVERSIVO
El reforzamiento negativo incluye dos variantes:
Evitación: el sujeto responde antes de que se presente el estímulo aversivo e impide o posterga su presentación. Escape: el sujeto responde después de que se presenta el estímulo aversivo y lo termina o lo reduce CONTROL AVERSIVO
En los casos en que la presentación del estímulo
aversivo es anticipada por una señal (el EC o estímulo preaversivo), el paradigma se conoce como evitación discriminada o señalada (Brogden et al., 1938). Solomon y Wynne (1953) realizaron un experimento con perros en una caja de saltos en que el apagado de una luz anunciaba la presentación de una descarga que los animales podían evitar o escapar si saltaban la barrera al otro compartimento de la caja. Luego de algunos ensayos, los perros saltaban la barrera a los 2 o 3 segundos de apagarse la luz, por lo que no volvieron a recibir una sola descarga. CONTROL AVERSIVO
Esos resultados se conocen como la paradoja de la
evitación y llevaron a teóricos como Mowrer (1947) a preguntarse cómo era posible que la no ocurrencia de un evento (la descarga) pudiera reforzar la respuesta de evitación? Los teóricos no tenían problemas para explicar las respuestas de escape porque dicha respuesta producía un cambio evidente en un estímulo importante, el problema era con las respuestas de evitación porque en este caso el cambio no era evidente. Teoría de los dos procesos, supone que en el aprendizaje de la evitación participan dos mecanismos:
Un proceso de condicionamiento clásico activado por
el emparejamiento del estímulo de advertencia (EC) y el evento aversivo (EI), que da lugar al condicionamiento de una RC de temor que a su vez es desagradable.
El condicionamiento instrumental de una respuesta
que permite el escape del EC que provoca miedo. Según esta teoría, lo que refuerza la respuesta no es la evitación de la descarga, sino el escape del EC que provoca temor. CONTROL AVERSIVO
Algunos teóricos (Miller, 1948) consideraron al miedo
condicionado como una forma de pulsión adquirida, lo que permitiría diferenciar las contribuciones separadas de los dos procesos (condicionamiento clásico y condicionamiento instrumental) al aprendizaje de la conducta de evitación. Por ejemplo, Miller condicionó una respuesta de temor en ratas a las que aplicaba descargas (EI) en un compartimento blanco (EC) pero no en un compartimento negro de una caja de Vaivén. CONTROL AVERSIVO
En una segunda etapa, eliminó la barrera que dividía
ambos compartimentos, en la sola presencia del EC (el compartimento blanco) las ratas se dirigían de inmediato al compartimento negro, aun cuando las descargas habían sido descontinuadas. Además, la mayor parte de los animales aprendieron a realizar diferentes respuestas (presionar una palanca, pisar un pedal, girar una rueda) para obtener como único reforzamiento la posibilidad de pasar del EC (compartimento blanco) al otro compartimento, lo que en opinión de Miller es evidencia de que el miedo se convirtió en una pulsión adquirida. CONTROL AVERSIVO
A partir de los resultados anteriores, se llegó a la
conclusión de que el miedo motiva y refuerza la conducta de evitación, por lo que tendrían que mostrar una elevada correlación.
Sin embargo, una observación común es que a medida
que los sujetos dominan una respuesta de evitación, su miedo va disminuyendo. Por ejemplo, Lovibond et al (2008) sometieron a tres grupos de estudiantes a una experiencia en que tres colores diferentes indicaban resultados distintos. CONTROL AVERSIVO
Grupo 1: El color A señalaba la Los sujetos aprendieron a predecir
oportunidad para que una lo que sucedería y mostraron una respuesta de evitación impidiera la disminución de las respuestas descarga fisiológicas de temor
Grupo 2: El color B era el EC que Los sujetos aprendieron a predecir lo
indicaba la presentación de una que sucedería, pero sus respuestas descarga que no podía ser evitada fisiológicas de temor aumentaron
Grupo 3 (control): se presentaba el
color C sin presentar la descarga Problemas de la teoría de los dos procesos:
1. El primer problema atañe a la relación entre el miedo y
las respuestas de evitación. Si la teoría es correcta, deberíamos observar un aumento del temor al presentar el EC y una disminución al dar la respuesta de evitación. Pero la evidencia indicaba que los indicios de temor disminuían a medida que los sujetos adquirían experiencia; lo que dio lugar a la pregunta: Si el temor en verdad disminuye: ¿qué sostiene entonces a las respuestas de evitación? CONTROL AVERSIVO
Según la teoría de los dos procesos, cada ensayo en
que se evita la descarga (EI) es un ensayo de extinción del condicionamiento clásico (se presenta el EC pero no el EI).
Si desaparece el temor y por ende la respuesta de
evitación, entonces tendría que reaparecer el EI temido. Por ende, la teoría predice un patrón cíclico de aparición-desaparición de las respuestas de evitación, predicción que ha sido cuestionada por el hallazgo de la extrema resistencia a la extinción de las respuestas de evitación. Teorías alternativas a la conducta de evitación
a. Teoría cognitiva de la evitación. Seligman y
Johnston (1978) propusieron que la conducta de evitación sólo desaparecerá cuando exista alguna discrepancia entre lo que el sujeto espera y lo que en realidad sucede. Según la teoría, en el curso del aprendizaje el sujeto se forma dos expectativas importantes, una expectativa acerca de las consecuencias de responder y otra acerca de las consecuencias de no responder. Teorías alternativas a la conducta de evitación
En los primeros ensayos de evitación discriminada, el
animal NO espera recibir una descarga en caso de no responder, por lo que no realiza las respuestas de evitación en ese ensayo. Conforme adquiere experiencia, desarrolla las expectativas de que a. si emite la respuesta no habrá descarga B. si no emite la respuesta habrá descarga Teorías alternativas a la conducta de evitación
Por lo tanto, la conducta sólo cambiará si se
transgrede alguna de esas expectativas. Como en extinción se descontinúan las descargas, si el sujeto responde y no se presenta la descarga no tiene forma de saber que este resultado no se debe a su conducta Teorías alternativas a la conducta de evitación
Para facilitar la discriminación, debería
presentarse la señal (EC) e impedir que el sujeto dé la respuesta de evitación, sólo así se percatará de que sus expectativas no se cumplen (esto constituye el fundamento de la terapia de inundación y prevención o impedimento de la respuesta. Teorías alternativas a la conducta de evitación
b. Teoría de un factor (o proceso) supone que
no es necesario el componente del condicionamiento clásico para explicar la conducta de evitación, y que, a diferencia de la paradoja propuesta por Mowrer, si es la evitación del choque lo que refuerza dicha conducta. Teorías alternativas a la conducta de evitación
Sidman (1953) desarrolló un procedimiento de evitación
no discriminada en que no presentaba una señal externa (EC) que precediera a la descarga, sino que ésta se presentaba a intervalos regulares (por ejemplo, cada 5 segundos), a menos que el animal presionara una palanca.
Aunque en el procedimiento de Sidman no existía un EC
externo evidente, pronto se planteó la posibilidad de que el tiempo fungiera como EC. Teorías alternativas a la conducta de evitación
c. Teoría del reforzamiento positivo a través de
la inhibición condicionada del miedo o de las señales de seguridad: propone que los estímulos que acompañan a la conducta de evitación adquieren propiedades inhibitorias que las convierten en señales de seguridad. Estas señales de seguridad pueden fungir como reforzadores positivos que mantienen a la conducta de evitación ( Teorías alternativas a la conducta de evitación
d. Teoría del reforzamiento de la evitación
mediante la reducción de la frecuencia de las descargas: Herrnstein y Hineline (1966) diseñaron un experimento en que las ratas presionaban una palanca para cambiar de un programa que entregaba descargas a una tasa rápida a otro que las entregaba a una tasa más lenta, es decir, lo que reforzaba la conducta de evitación era la reducción en la frecuencia de las descargas. Teorías alternativas a la conducta de evitación
Una evidencia en contra de dicha teoría proviene
que demuestran la posibilidad de aprender una respuesta de evitación que no reduce la frecuencia de las descargas sino que sólo las demora (Hineline, 1981). Teorías alternativas a la conducta de evitación
Los hallazgos de Hineline (1981) son compatibles
con la teoría de las señales de seguridad, ya que los estímulos que acompañan a la respuesta que pospone al estímulo aversivo pueden convertirse en señales de seguridad que refuerzan a la conducta de evitación. CONTROL AVERSIVO
Las teorías analizadas enfatizan el control que ejercen
en la conducta de evitación los estímulos que la preceden (EC) y los que la siguen (EI), pero no se interesan en la naturaleza de la respuesta en sí.
Si la evitación exitosa de los peligros reales sólo
dependiera del aprendizaje, dicho mecanismo resultaría insuficiente para garantizar la supervivencia de las especies. CONTROL AVERSIVO
Bolles (1970) suponía que las situaciones de peligro
provocan RI que evolucionaron por ser una defensa exitosa contra el dolor y el daño, a las que denominó reacciones de defensa específicas de la especie, que si bien son diferentes para especies distintas, por lo regular caen en una de tres categorías: huída, congelamiento, ataque defensivo.
Según Bolles, la configuración del entorno determina
cuál es la RI que ocurrirá (si existe una ruta de escape prevalece la huída, en caso contrario, dominan el congelamiento). CONTROL AVERSIVO
La teoría predice que en situaciones de
condicionamiento instrumental, será más fácil el aprendizaje de ciertas respuestas de evitación que de otras (por ejemplo, a las ratas les resulta más fácil aprender a correr en una rueda que a erguirse sobre sus patas traseras para evitar una descarga). CONTROL AVERSIVO
Fanselow et al (1988, 1997) propusieron el modelo de
inminencia depredadora, según el cual las reacciones defensivas dependen del nivel de peligro. Por ejemplo, si el nivel de peligro es bajo, los animales pueden hacer ajustes a su patrón de forrajeo; si aparece el depredador, pero el ataque no es inminente, la respuesta puede ser de congelamiento. Si el depredador hace contacto con el sujeto, la respuesta puede ser el escape y las respuestas de recuperación. El nivel de peligro es mayor cuando sucede el ataque del depredador, en cuyo caso es muy probable la muerte CONTROL AVERSIVO
La teoría de la inminencia depredadora supone
que al inicio la conducta defensiva ocurre como RI, pero que puede llegar a condicionarse a un EC asociado a un EI aversivo. La respuesta que se condicione dependerá de la relación temporal el EC con el EI aversivo (es decir, del punto del continuo de inminencia depredadora en que se presente) CONTROL AVERSIVO
Aunque el planteamiento inicial de la ley del
efecto sugería que el castigo es el opuesto del reforzamiento, tanto Thorndike como Skinner argumentaron que no lo era; a partir de sus respectivas investigaciones, cada uno concluyó que los efectos del castigo no son exactamente opuestos a los del reforzamiento. CONTROL AVERSIVO
Skinner concluyó que los efectos del castigo no son
permanentes, ya que produce sólo una “supresión temporal” de la respuesta (en cuanto el castigo se suspende, la conducta castigada se recupera).
Un problema con la conclusión de Skinner es que si bien
los efectos del castigo son temporales, también lo son los efectos del reforzamiento positivo: una conducta que ha sido reforzada se extinguirá si se suspende el reforzamiento. Factores que influyen en la eficacia del castigo:
Contingencia del castigo. Schuster y Rachlin (1968)
entregaban comida a palomas por responder a dos teclas con programas IV idénticos. Una vez que la respuesta se estabilizó, les aplicaban descargas de la misma intensidad. La diferencia fue que el castigo fue contingente a los picoteos en la tecla izquierda, pero no contingente a los picoteos en la tecla derecha. Sólo en el primer caso hubo un decremento de la conducta. Factores que influyen en la eficacia del castigo:
Nivel introductorio del castigo. Diversos estudios han
mostrado que si el castigo inicial es de baja intensidad, se produce habituación al mismo. Esto no sólo implica que la supresión inicial es apenas moderada, sino la recuperación de la respuesta indeseable que luego es más difícil eliminar. Factores que influyen en la eficacia del castigo:
Azrin y Holz y Hake (1963) trataron de suprimir la
respuesta de picoteo de dos palomas usando descargas eléctricas. Al inicio, uno de los animales recibió inicialmente una descarga leve mientras que el otro recibió una descarga fuerte. Mientras que la paloma que recibió la descarga fuerte suspendió su conducta con una descarga inicial de 80 voltios, la que recibió la descarga “leve” mostró habituación a la descarga, siendo necesario incrementar la descarga hasta 130 voltios para eliminar la conducta Factores que influyen en la eficacia del castigo:
c) Demora del castigo: Baron, Kaufman y Fazzini
(1969) estudiaron la efectividad de una descarga para eliminar una respuesta en diferentes grupos de ratas. Aunque la intensidad de la descarga era la misma para todos los grupos, la demora del castigo variaba entre 0 y 60 segundos. Se encontró que entre más inmediato fuera el castigo, mayor era la disminución de la respuesta. Factores que influyen en la eficacia del castigo:
d. Programa de castigo: Igual que en el
reforzamiento positivo, una conducta no es castigada cada vez que ocurre. Sin embargo, Azrin y Holz (1996) concluyeron que aunque el castigo parcial produce cierta supresión de la respuesta indeseable, los efectos dependen de la proporción de respuestas castigadas. Factores que influyen en la eficacia del castigo:
e. Reforzamiento positivo recibido por la
conducta indeseable: el estudio de esta variable es importante porque una conducta indeseable siempre está recibiendo alguna forma de reforzamiento. El hallazgo más común es que el efecto del castigo siempre depende del reforzador que recibe la conducta castigada Factores que influyen en la eficacia del castigo:
f. Motivación para responder: Azrin y Holz (1966)
advirtieron que la eficacia de un procedimiento de castigo se relaciona inversamente con la motivación del sujeto para responder; observaron en palomas los efectos del castigo en una respuesta de picoteo que era reforzada con comida. El mismo castigo tuvo poco efecto en las palomas con mucha hambre (privación prolongada de comida), pero eliminó de inmediato la conducta en palomas con poca hambre (privación mínima de comida). Factores que influyen en la eficacia del castigo:
g. Disponibilidad de respuestas alternativas para
obtener la recompensa: Azrin y Holz (1966) encontraron que una descarga podía suprimir fácilmente el picoteo de una paloma si el animal disponía de otra opción de respuesta que le permitiera obtener el reforzador que obtenía con la respuesta no deseada; sin embargo, la misma descarga producía cambios insignificantes en otra paloma que no disponía de dicha opción. Factores que influyen en la eficacia del castigo:
g. El castigo como estímulo discriminativo
de reforzamiento. En ocasiones, un estímulo aversivo puede convertirse en una señal que predice la disponibilidad de otros estímulos, algunos de los cuales pueden ser reforzantes. Azrin y Holz (1966) sugieren que eso podría explicar algunos casos de masoquismo, en que el trato cruel y humillante se convierte en señal de reforzadores como placer y atención. Efectos indeseables del castigo
a. Puede provocar efectos emocionales como ira y
temor, los cuales a su vez obstaculizan el aprendizaje y el desempeño. Balaban et al (1990) encontraron que el desempeño de estudiantes en tareas de memoria era peor cuando sus errores se castigaban con una descarga que cuando simplemente eran señalados con un sonido. Efectos indeseables del castigo:
b. El castigo podría producir una supresión
general de todas las conductas, no sólo de la conducta castigada. Por ejemplo, si un maestro responde a la pregunta de un niño con un comentario como “¡Vaya, esa sí que es una pregunta tonta!” no sólo reducirá las “preguntas tontas”, sino cualquier posible participación del niño. Efectos indeseables del castigo:
c. En el mundo real, el uso del castigo exige
la supervisión continua de la conducta, cosa que no sucede con el reforzamiento (un niño exigirá su reforzador si los padres olvidaron entregárselo por una buena conducta, pero es poco probable que ese mismo niño exija su castigo por una conducta indeseable). Efectos indeseables del castigo:
d. El castigo favorece conductas de evitación
y escape. Azrin y Holz (1966) reportan el caso de una rata que aprendió a evitar descargas dolorosas por una respuesta de palanqueo, tirándose de espaldas para usar el pelaje como aislante a la vez que presionaban la palanca para seguir obteniendo comida. Efectos indeseables del castigo:
e. El castigo puede producir agresión hacia
el agente de castigo o hacia quienes estén cerca, como lo atestigua el riesgo continuo de agresión que enfrentan celadores e internos de las prisiones. Ulrich y Azrin (1962) reportaron un estudio en que dos ratas colocadas en una cámara experimental se comportaron pacíficamente hasta que empezaron a recibir descargas, en ese momento empezaron a pelear. CONTROL AVERSIVO
Dadas las numerosas desventajas del uso del
castigo, Azrin y Holz sugieren evitar el uso del castigo salvo en los casos en que éste sea el único recurso, sea porque la conducta indeseable es insensible a otros procedimientos o porque la conducta en cuestión supone un riesgo para el individuo y/o quienes lo rodean. Otros procedimientos de supresión de conducta
Otras formas de castigo implican la pérdida de
reforzadores positivos (como en el tiempo fuera), la sobrecorrección e incluso la restricción
En el tiempo fuera de reforzamiento se saca
al sujeto del escenario en que recibía reforzamiento positivo. La sobrecorrección implica hacer que el sujeto corrija en exceso lo que hizo mal Teorías del castigo
a. Teoría de la respuesta emocional
condicionada o supresión condicionada Estes (1944) propuso que los EC asociados con un EI aversivo adquieren propiedades aversivas que “congelan” al sujeto e impiden que emita la respuesta indeseable Teorías del castigo
b. Teoría de la evitación del castigo Dinsmoor
(1958) propuso que el castigo produce el fortalecimiento indirecto de respuestas incompatibles con la conducta indeseable.
La teoría no permite la comprobación empírica de
sus aseveraciones ni puede anticipar cuáles serían las respuestas incompatibles que puedan aparecer Teorías del castigo
c. La versión negativa de la ley del efecto. Aunque
Thorndike descartó la posibilidad de que el castigo fuese simétricamente opuesto al reforzamiento. Esa idea ha sido sistemáticamente corroborada