Anda di halaman 1dari 155

PSICOLOGIA

PRINCIPIOS DE
APRENDIZAJE Y CONDUCTA
5 edicin
Michael Domjan
Juan Carlos Cabrera Valderrama
Cdiz 2009-2010
1
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera - 2009/2010
Antecedentes histricos
- Desarrollo histrico del estudio de la mente.
- Desarrollo histrico del estudio de los reflejos.
El amanecer de la nueva era
- La cognicin comparada y la evolucin de la inteligencia.
- Neurologa funcional.
- Modelos animales de la conducta humana.
- Modelos animales y robtica.
Definicin de aprendizaje:
- La distincin entre aprendizaje y ejecucin.
- El aprendizaje y otras fuentes de cambion conductual.
- Diferentes tipos de mecanismos causales.
Aspectos metodolgicos del estudio del aprendizaje
- El aprendizaje como ciencia experimental.
- La perspectiva de proceso general en el estudio del aprendizaje.
Uso de animales no humanos en la investigacin sobre aprendizaje
- Razones del uso de animales no humanos en la investigacin sobre aprendizaje.
- Los animales de laboratorio y la conducta normal.
- El debate pblico sobre la investigacin con animales no humanos.
3
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
Antecedentes Histricos
Las aproximaciones tericas al estudio del aprendizaje tienen
sus races en la filosofa de Ren Descartes. Antes de
Descartes, se pensaba que el comportamiento humano estaba
enteramente determinado por la intencin consciente y por el
libre albedro. Descartes reconoci que muchas cosas que
hacen las personas son respuestas automticas a estmulos
externos, aunque no abandon por completo la idea del libre
albedro y del control consciente. Por tanto, formul la visin
dualista del comportamiento humano conocida como dualismo
cartesiano: conducta voluntaria controlada por la mente y
conducta involuntaria controlada por mecanismos reflejos.
Descartes asume que los estmulos del ambiente externo son la causa de toda conducta
involuntaria. Estos estimulos producen respuestas involuntarias por medio de un circuito
neuronal que incluye al cerebro. Sin embargo, crea que los mismos nervios transmitan la
informacin de los rganos de los sentidos al cerebro y del cerebro a los msculos. Este
circuito permita reacciones rpidas a estmulos exteros ( ejemplo: retirar rpidamente un
dedo del fogn caliente).
Descartes crea que los animales carecan del libre albedro y eran incapaces de acciones
voluntarias y conscientes, frente a los seres humanos que se les atribua una mente o alma.
La mente como una entidad inmaterial, se conectaba al cuerpo a traves de la glndula pineal,
cerca del cerebro, por lo que poda tener conciencia de la conducta involuntaria e iniciar las
Ren Descartes (1596-1650)
Diagrama de dualismo cartesiano. Los rganos sensoriales detectan los eventos del mundo fsico. Desde aqu la
informacin se trasmite al cerebro. El cerebro est conectado a la mente por medio de la Glndula pineal. La accin
involuntaria se realiza por un arco reflejo que enva mensajes en primer lugar a los rganos sensoriales al cerebro y
despus del cerebro a los msculos. La accin voluntaria se inicia en la mente, que enva mensajes al cerebro y despus a
los msculos.
rganos
sensoriales
Mundo fsico (causa
de la accin
involuntaria)
Cerebro
Msculos
Glndula
pineal
Accin
voluntaria
o involuntaria
Mente
(causa de la
accin
voluntaria)
4
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
acciones voluntarias. Dado que la conducta voluntaria se iniciaba en la mente, sta poda
tener lugar independientemente de la estimulacin externa.
El dualismo mente-cuerpo introducido por Descartes dio lugar a dos tradiciones
intelectuales, base del estudio del aprendizaje moderno:
1.- El mentalismo, se ocupaba de los contenidos y funcionamiento de la mente.
2.- La reflexologa, del mecanismo de la conducta involuntaria.
Desarrollo histrico del estudio de la mente.
Los filsofos preocupados por la mente estaban interesados en descubrir qu era la mente
y cmo funcionaba. Preguntas similares se plantean los psiclogos cognitivos actuales.
En cuanto al contenido de la mente.
Descartes crea que la mente contena ideas innatas independientemente de la experiencia
personal. La aproximacin filosfica segn la cual nacemos con ideas innatas acerca de
ciertas cosas se denomina innatismo.
Otros filsofos posteriores a Descartes se enfrentaron a la postura nativista, como John
Locke(1632-1704) crea que las ideas de las personas eran aprendidas directa o
indirectamente a travs de experiencias posteriores al nacimiento, recibiendo esta el
nombre de empirismo.
En cuanto a cmo funciona.
Descartes creia en una mente impredecible y desordenada sin ninguna regla estricta o leyes
que pudieran identificar. Mientras que el filsofo Thomas Hobbes ( 1588-1679) fue pionero
en proponer que al igual que los reflejos, la mente operaba de forma predecible y conforme
a leyes. En concreto propuso la conducta voluntaria estaba gobernada por el principio del
hedonismo (las personas tratan de lograr el placer y de evitar el dolor).
Los empiristas britnicos propusieron que las sensaciones simples se combinan hasta formar
ideas complejas por medio de asociaciones. Al oir la palabra coche cuando hemos visto un
coche, se establece asociacin con estos atributos de los coches, de manera que esta
palabra volver a activar los recuerdos de los aspectos del coche que hemos experimentado
cuando vuelva a oirla. Los empiristas britnicos consideraban que tales asociaciones
constituan los ladrillos de la actividad mental y dedicaran un considerable esfuerzo en
detallar las Leyes de asociacin.
5
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
Leyes de asociacin. Los empiristas britnicos aceptaron dos conjuntos de leyes para el
establecimiento de asociaciones:
Primarias: formuladas por Aristoteles que propuso tres principios,
Contigidad: si dos eventos ocurren juntos en el espacio o en el tiempo de
forma repetida quedarn asociados. Por ejemplo, si nos encontramos con el
olor de la salsa de tomate y de los espaguetis con la suficiente frecuencia,
nuestro recuerdo de los espaguetis se activar con el mero olor de la salsa de
tomate.
Similitud y contraste: dos ideas se asocian si son similares en algn aspecto
(por ejemplo, si las dos son rojas) o si tienen alguna caracterstica contraria
(por ejemplo, si una es muy alta y otra muy baja).
Secundarias: varios filsofos formularon leyes de asociacin secundarias, entre
ellos Tomas Brown(1778-1820) propuso que la formacin de asociaciones entre
dos sensaciones estaba influida por un nmero de factores, incluyendo la
intensidad de las sensaciones y la frecuencia y recencia con que las dos ocurrian
conjuntamente. Adems, se consideraba que la formacin de una asociacin entre
dos eventos dependa del nmero de asociaciones anteriores en las que cada uno
de dichos eventos estaba involucrado, y la similitud entre estas asociaciones
pasadas y la que se forma en el presente.
La investigacin emprica de los mecanismos de asociacin no comenzara hasta el siglo XIX,
con el trabajo pionero del psiclogo alemn Hermann Ebbinghaus (1850-1909) inventor de
las slabas sin sentido, combinaciones de tres letras sin ningn significado, estudi listas
de estas y midi su capacidad de recordarlas bajo diversas condiciones experimentales,
permiti comprobar que :
- la fuerza de las asociaciones mejoraba con el entrenamiento.
- Las slabas sin sentido que aparecan juntas en una lista quedaban asociadas con mayor
fuerza que las slabas que estaban ms distantes,
- Una slaba se asocia con mayor fuerza a la siguiente de la lista que a la anterior.
6
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
Desarrollo histrico del estudio de los reflejos.
Al formular el concepto de reflejo, Descartes hizo una gran contribucin a la compresin de
la conducta, aunque estaba eqivocado en sus ideas acerca del acto reflejo cuando creia que
los mensajes sensoriales iban de los rganos de los sentidos al cerebro y los mensajes
motores iban del cerebro a los msculos, viajando por los mismo nervios; y cuando pensaba
que los nervios eran tubos huecos y su transmisin neuronal involucraba gases a los que
denomin espritus animales. Supona que estos espritus animales, liberados por la glndula
pineal, se desplazaban por los tubos neurales y entraban en los musculos hinchandolos y
provocando el movimiento. Por ltimo, Descartes consideraba el movimiento reflejo era de
carcter innato y que estaban fijados por la anatoma del sistema nervioso.
Charles Bell (1774-1842) y Franois Magaendie (1783-1855) mostraron que eran fibras
nerviosas distintas las encargadas de transmitir la informacin sensorial desde los organos
sensoriales a SNC (sistema nervioso central) y la informacin motora, del SNC a los
msculos.
John Swanmmerdan (1637-1680) en 1669 mostr que el influjo de espiritus animales desde
la glndula pineal resultaba innecesario y Francis Glisson (1597-1677) demostr que las
contracciones musculares no se deban a que los msculos se hincharan por un gas.
Descartes y la mayor parte de los filsofos posteriores asumieron que los reflejos eran
responsables nicamente de reacciones sencillas a estmulos externos. Se supona que un
estimulo mayor corresponde a una respuesta ms vigorosa. Por ejemplo, si tocamos un
fogn, cuanto mayor sea el calor ms rpido se retira la mano.
Hasta el s.XIX I.M. Sechenov (1829-1905) propuso que
los estmulos no siempre elicitan respuestas reflejas de
forma directa. En algunos casos pueden liberar respuesta
que estaba inhibida, cuya fuerza no depender de la
intensidad del estimulo. Por ejemplo, pequeas particulas
de polvo pueden producir potentes estornudos. Sugiri
que formas complejas de comportamiento (acciones o
pensamientos) que ocurrian en ausencia de estmulo
elicitador manifiesto eran de hecho respuestas reflejas.
As, la conducta voluntaria y los pensamientos estn en
realidad elicitados por estmulos dbiles y apenas
visibles.
Sechenov no tom en consideracin que la conducta de
los organismos no permaneca fija e invariable a lo largo
I.M. Sechenov ( 1829-1905)
7
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
de su vida, sino que se veia alterada por la experiencia. Desde tiempos de Descartes se
consider las respuestas reflejas como innatas y fijadas de antemano por las conexiones del
sistema nervioso y por tanto un estmulo dado elicitara la misma respuesta a lo largo de
toda la vida del individuo.
Pavlov demostr experimentalmente que no todos los reflejos
son innatos. Mediante mecanismos asociativos se pueden
establecer nuevos reflejos para los estmulos. Trabaj desde
la tradicin fisiolgica de la reflexologa tratanto de
determinar las leyes de la asociacin mediante la investigacin
experimental .
El anlisis de tipo asociativo continua jugando un importante
papel en investigaciones tanto fisiolgicas como conductuales,
aunque algunos han complementado los mecanismos asociativos
con otro tipo de procesos.
El Amanecer De Una Nueva Era
Los estudios experimentales sobre los principios bsicos de aprendizaje se realizan
frecuentemente con animales no humanos y dentro de la tadicin reflexolgica.
La cognicin comparada y la evolucin de la inteligencia.
Surge como consecuencia de los escritos de Charles Darwin
que atacaba los privilegios que Descartes daba a los humanos
cuando asumia que slo estos posean mente. En su segunda
obra ms importante, El origen del hombre, Darwin, argument
que "el hombre desciende de algn ser ms primitivo, a pesar
de que por el momento se desconozcan los eslabones
intermedios". Al reclamar la continuiad entre los dems
animales y los humanos, Darwin trat de caracterizar, no slo
la evolucin de los rasgos fsicos, sino tambien la evolucin de
las capacidades psicolgicas o mentales. En su opinin, la mente
humana es producto de la evolucin. Sugera que los animales
tambin poseen capacidades similares a las humanas incluso
capaces de creer en entidades espitiruales.
Ivan Pavlov (1849-1936)
Charles Darwin (1809-1882)
8
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
Darwin recopil evidencias anecdticas de formas de comportamiento inteligente en
animales, que hoy no satisface los estandares cientficos pero que el tema de investigacin
siguen siendo de mxima actualidad por la posibilidad de seguir la huella de la evolucin de la
inteligencia por medio de destudios delas capacidades de las diversas especies animales.
George Romanes en su libro inteligencia animal de 1882, sugiri que la inteligencia podra
identificarse determinando si un animal aprende "a hacer nuevos ajustes, o a modificar los
antiguos, de acuerdo con los resultados de su propia experiencia individual". La defini como
la capacidad de aprender.
Neurologa Funcional.
De acuerdo con el principio del nervismo, las principales funciones fisiolgicas estn
gobernadas por el sistema nervioso (SN). Ivan Pavlov dedic su vida a investigarlo y gran
parte a la identificacin de los mecanismos neurales de la digestin. El descubrimiento por
parte de los britanicos Bayliss y Starling evidenciando el control parcial del pncreas por
factores hormonal y no por factores neurales, hizo que abandonara el estudio de la
fisiologa del sistema digestivo para investigar los reflejos condicionados. La afirmacin de
Pavlov segn la cual los estudios de aprendizaje revelan cmo opera el sistema nervioso es
ampliamente aceptada por los neurocientficos contemporaneos. Kandel, por ejemplo, ha
comentado que "el principio central de las modernas neurociencias es que todo
comportamiento es un reflejo del funcionamiento del cerebro".
El psiclogo del comportamiento es como un conductor que trata de descubrir el
funcionamiento de un vehculo experimental probandolo, en lugar de estudiando el motor.
Los estudios conducturales del aprendizaje pueden proporcionar pistas sobre la maquinaria
del sistema nervioso. Tales estudios nos informan de la plasticidad potencial del sistema
nervioso, de las condiciones en las cuales el aprendizaje puede tener lugar, del mecanismo
por el cual persisten las respuestas aprendidas y de las circunstancias en las cuales la
informacin aprendida es o no accesible. Al detallar las funciones del sistema nervioso, los
estudios conductuales del aprendizaje definen los rasgos u operaciones que deben ser
explicados por investigaciones de tipo neurofisiolgico.
9
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
Modelos animales de la conducta humana.
La realizacin de inferencias sobre el comportamiento humano partiendo de investigaciones
con otras especies animales puede ser arriesgada, si se realiza de forma injustificada; y
controvertida si las razones para la utilizacin del modelo no se entiende apropiadamente.
Los modelos bases suelen ser animales de otras especies como palomas, ratones y ratones,
primates.
La utilizacin de animales como modelo es una herramienta cientifica bsica y potente.
Permite el estudio de aspectos de la realidad que representan en condiciones sencillas,
controladas y econmicas. Lo importante del modelo animal es que la caracteristica a
estudiar sea similar a las conductas humanas. Por ejemplo, las similitudes entre las ratas y
los humanos en la forma de evitar comidas peligrosas hace que la rata sea un modelo vlido
para investigar el aprendizaje de aversin a la comida en humanos.
Dollard y Miller fueron partidarios de una integracin en la que los estudios de laboratorio
realizados con animales no humanos se usaran para aislar e identificar los fenmenos que
podran posteriormente ser estudiados con xito en personas. La investigacin con animales
permite tambin aumentar nuestra confianza en los datos obtenidos con humanos mediante
mtodos de investigacin menos rigurosos.
Modelos animales y robtica.
Los modelos animales de aprendizaje y conducta tambin revisten cierta importancia en
relacin a la robtica y a los sistemas de inteligencia artificial. Los robots son mquinas
capaces de realizar funciones o tareas especficas. La meta de la robtica es hacer
mquinas tan "inteligentes" como sea posible. Al igual que Romanes defini el trmino
"inteligencia" a partir de la capacidad de aprender, los ingenieros actuales contemplan la
capacidad de recordad y aprender a partir de la experiencia como un rasgo importante de
los sitemas artificiales "inteligentes". La informacin sobre las caractersticas y
mecanismos de tal aprendizaje puede obtenerse a partir de estudios de aprendizaje
realizados por animales no humanos. Por ejemplo, en inteligencia artificial se utilizan
frecuentemente mecanismos asociativos para permitir que las respuestas de estos sistemas
sean modificables por la experiencia.
10
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
Definicin De Aprendizaje.
No hay una definicin de aprendizaje universalmente aceptada. Sien embargo, muchos
aspectos quedan recogidos en las siguiente afirmacin:
El aprendizaje es un cambio duradero en los mecanismos de conducta que implica
estmulos y/o respuestas especficas y que es resultado de la experiencia previa con
esos estmulos y respuestas o con otros similares.
La distincin entre aprendizaje y ejecucin.
Siempre que contemplamos evidencia de aprendizaje, observamos la aparicin de un cambio
en el comportamiento. Es la nica forma de saber si el aprendizaje a tenido lugar. El
comportamiento est determinado por muchos otros factores distintos del aprendizaje.
La ejecucin se refiere a las acciones de un organismo en un momento concreto. La
ejecucin esta determinada por la oportunidad, la motivacin y las capacidades sensoriales y
motoras, adems del aprendizaje. Por lo que, un cambio de actuacin no puede ser
automticamente considerada como una manifestacin de aprendizaje.
El aprendizaje y otras fuentes de cambio conductual.
La fatiga o cansancio , entre otros, es un mecanismo que da lugar a cambios de conducta
que es excesivamene breve para ser considerados como aprendizaje. Se produce por el
esfuerzo fsico y provoca una disminucin gradual en la fuerza de una respuesta. Este tipo
de cambio est producido por la experiencia, pero no se considera ejemplo de aprendizaje
debido a que la debilitacin de la respuesta desaparece si se permite al individuo descansar
un rato.
Un cambio en las condiciones estimulares tambin puede alterar la conducta temporalmente
(La luz del cine se enciende de repente, el espectador cambia su comportamiento, y cuando
se apaga se vuelve a concentrar en la pelicula). Como tampoco puede considerarse
aprendizaje los que implican alteracin en el estado fisiolgico o motivacional del organismo
( el hambre, la sed, cambios en niveles hormonas sexuales, drogas psicoactivas, etc.
provocan cambios conductuales transitorios).
En algunos casos, pueden aparecer cambios persistentes en la conducta sin necesidad de la
experiencia con eventos del entorno que requiere la definicin de aprendizaje. Destacabel
de este tipo es la maduracin. Un nio no alcanza un objeto que est en una estantera alta
hasta que crezca lo suficiente.
11
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
Diferentes tipos de mecanismos causales.
Las causas pueden ser conceptualizadas de diversas formas o a diferentes niveles de
explicacin. Cuatro tipos de causas descritos por Aristteles.
Primero , causa eficiente, hace referencia a las condiciones necesarias y suficientes
para producir un resultado en la conducta.
Segundo, causas materiales, cambios en los mecanismos sinpticos; cambios neurales.
Tercera, causas formales son las teoras o modelos de aprendizaje.
Cuarta, causas finales son las explicaciones del aprendizaje que pone nfasis en su
funcin o utilidad.
Los cientificos de orientacin biolgica a menudo establecen una distincin entre las causas
prximas o inmediatas del comportamiento y sus causas ltimas. Las causas prximas se
corresponden con las causas eficientes y materiales de Aristteles. Las causas ltimas se
corresponden con las causas finales.
Aspectos Metodolgicos Del Estudio del Aprendizaje.
La investigacin sobre los procesos de aprendizaje se caracteriza por dos rasgos
metodolgicos principales. Uno es consecuencia directa de la definicin de aprendizaje y
requiere el uso de mtodos de investigacin experimentales, en lugar de mtodos
observacionales. Los fenmenos del aprendizaje no pueden investigarse sin una metodologa
experimental. El segundo rasgo metodolgico es ms una cuestin de preferencia que de
necesidad.
El aprendizaje como ciencia experimental.
De los cuatro tipos de causas, los investigadores del aprendizaje han centrado su atencin
en las causas eficiente, materiales y formales. Independientemente del tipo de causa, este
nfasis prescribe que las investigaciones de aprendizaje utilicen una metodologa
experimental. Las causas no pueden observarse directamente. Tan slo pueden ser inferidas
a partir de los resultados de las manipulaciones experimentales.
En el estudio del aprendizaje, lo que nos interesa es la conducta de organismos vivos, en
presencia y en ausencia de la presunta causa. Hay que comparar las acciones de los
individuos que previamente han sido expuestos al procedimiento en cuestin con las acciones
de los individuos que no han sido expuestos a dicho procedimiento. La nica forma de
demostrar que la exposicin a ese entrenamiento es la causa del cambio conductual
12
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
estudiado es manipular experimentalmente la presencia y la ausencia de dicha exposicin.
Por esta razn, el aprendizaje slo puede estudiarse mediante tcnicas experimentales y
tiene lugar bsicamente en el laboratorio.
La perspectiva de proceso general en el estudio del aprendizaje.
El segundo rasgo metodolgico de los estudios de aprendizaje es una perspectiva basada en
procesos generales. sta es ms una cuestin de preferencia que de necesidad. Sin
embargo, al adoptar una perspectiva de proceso general, los investigadores del aprendizaje
animal siguen una antigua tradicin cientfica.
Elementos de la perspectiva de proceso general. La caracterstica ms obvia de la
naturaleza es su diversidad. Los cientificos han elegido fijarse en los aspectos comunes
para buscar la uniformidad y formular leyes generales con las que organizar y explicar la
diversidad de los eventos del universo. Los investigadores del aprendizaje animal han
seguido esta misma tradicin.
Un presupuesto fundamental de la perspectiva de proceso general es que los fenmenos
estudiados son el resultado de procesos ms elementales. Adems, se asume que esos
procesos elementales operan de forma similar independientemente de dnde se encuentren.
Por tanto, se asume que la generalidad emerge a nivel de los procesos bsicos o elementales.
Los investigadores del condicionamiento y el aprendizaje se han adherido a la perspectiva
de proceso general desde los comienzos de esta rea de estudio en psicologa. Se han
centrado en los aspectos comunes de los diversos tipos de aprendizaje y han asumido que
los fenmenos de aprendizaje son producto de procesos elementales que operan de forma
similar en diversas situaciones de aprendizaje.
El presupuesto segn el cual las leyes "universales" de la asociacin son las responsables de
los fenmenos de aprendizaje no excluye que los animales puedan aprender sobre multitud
de estmulos, respuestas o que cada especie tenga un ritmo de aprendizaje diferente. Se
asume que la generalidad se sita en los principios o procesos de aprendizaje; no en el
contenido o en la velociad del mismo. El trabajo del psiclogo del aprendizaje es descubrir
esas leyes universales.
Implicaciones metodolgicas de la perspectiva de proceso general. Si asumimos que
existen principios universales de aprendizaje, entonces deberamos ser capaces de
descubrir esos principios en cualquier situacin en la que el aprendizaje tenga lugar. Por
tanto, una importante implicacin metodolgica de la perspectiva de proceso general es que
se pueden descubrir los principios del aprendizaje estudiando cualquier especie o sistema
de respueta que muestre aprendizaje. Los investigadores han confluido hacia unos
13
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
paradigmas experimentales estandarizados o convencionales. La mayor parte de los estudios
de aprendizaje se realizan en estos paradigmas. A lo largo de los aos se han ido
perfeccionando estos paradigmas experimentales convencionales, para ajustarse a las
predisposiciones conductuales de los animales de investigacin. Debido a estas mejoras,
estas preparaciones experimentales permiten realizar estudios de laboratorio con
respuestas bastante naturales.
Demostracin de la generalidad de los fenmenos de aprendizaje. Asumir que existen
procesos elementales de aprendizaje comunes no es lo mismo que demostrar empricamente
estas similitudes.
La verificacin emprica de la existencia de tales mecanismos comunes en diversas
situaciones sigue siendo necesaria para construir una explicacin verdaderamente general
del aprendizaje. Una teora general del aprendizaje no puede verificarse empricamente
utilizando slo unos pocos paradigmas experimentales estandarizados. La generalidad del
aprendizaje debe probarse realizando estudios de distintas especies y situaciones.
Uso de Animales No Humanos En La Investigacin Sobre Aprendizaje.
Gran parte de los experimentos se han realizado con animales no humanos por razones
tanto tericas como metodolgicas.
Razones del uso de animales no humanos en la investigacin sobre aprendizaje.
Para investigar los fenmenos de aprendizaje se requiere el uso de mtodos experimentales
que puedan atribuir la adquisicin de una nueva conducta a una experiencia previa en
particular. Este control experimental de la experiencia previa no puede alcanzarse con el
mismo grado de precisin cuando se utilizan sujetos humanos que cuando se utilizan
animales de labotatorio. Con los animales de laboratorio, los cientificos pueden estudiar
cmo se aprende las reacciones emocionale intensas y cmo el aprendizaje interviene a la
hora de buscar comida, evitar el dolor o el estrs, o encontrar posible pareja sexual. Con las
personas, se ven limitados a tratar de modificar las respuestas emocionales inadaptadas una
vez que stas ya han sido aprendidas. Incluso para procedimientos teraputicos eficaces en
el tratamiento de la conducta inadaptada requiere conocer primero los mecanismos por los
cuales se aprenden dichas respuestas emocionales, conocimiento que requiere estudios con
animales de laboratorio.
14
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
Obtener informacin sobre las bases evolutivas y biolgicas del aprendizaje, o cmo
evoluciona la cognicin y la inteligencia requieren el apoyo o la utilizacin de animales de
investigacin.
Igualmente el conocimiento de las bases biolgicas del aprendizaje necesitan el apoyo de los
animales de laboratorio para desenmaraar cmo aprende y recuerda el sistema nervioso.
Los estudios conductuales de aprendizaje realizados con animales son un requisito necesario
para cualquier intento de investigar las bases biolgicas del aprendizaje con animales. La
neurociencia tiene que fundamentarse en la ciencia del comportamiento.
Estudiar los procesos de aprendizaje en animales criados en condiciones de control de
laboratorio es ms simples que hacerlo en personas cuyos ambientes son mucho ms
variados y difciles de describir. El comportamiento de los animales no se ve complicado por
los procesos lingsticos que juegan un papel tan importante en determinados tipos de
conducta humana. Otra ventaja importante es que en la investigacin con animales no es
necesario hacer peticiones explcitas a los sujetos. En la investigacin con humanos se debe
asegurar que los participantes no estn influenciados por el deseo de complacer al
investigador.
Los animales de laboratorio y la conducta normal.
Parece errnea la idea de alguno cuando sugieren que la endogamia y los largos periodos de
cautiverio de los animales domesticados de laboratorio pueden influir en la conducta normal
de estos. De hecho, los animales de laboratorio (ratas) pueden ser preferibles con fines de
investigacin a sus equivalentes salvajes ya que viven en un medio tan "artificial" como el del
humano.
El debate pblico sobre la investigacin con animales no humanos.
Ha habido un gran debate acerca de las ventajas y los inconvenientes de realizar
investigaciones con animales. Parte del debate se ha centrado en la necesidad de dar un
trato humano a los animales. Otros aspectos del debate han centrado los requisitos ticos y
que debe cumplir el trato de los animales, en el derecho de los seres humanos a
beneficiarse a expensas de los animales y en posibles alternativas a la investigacin con
animales.
La tica de la investigacin con animales de laboratorio. La preocupacin por el bienestar
de los animales de laboratorio han dado lugar a la adopcin de reglas estrictas para el
alojamiento de los animales y para la supervisin de la investigacin con animales. En el caso
de la ciencia que estudia la conducta, siempre se preocupan de ese bienestar ya que no se
15
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
puede obtener informacin sobre el aprendizaje y la conducta normales utilizando animales
enfermos o maltratados.
Algunos experimentos conllevan alguna incomodidad, sin embargo, se realizan todos los
esfuerzos necesarios para minimizarlos.
Qu es un trato "humano" a los animales? Asumiendo que una especie merece el trato
que establezcan las normas oficiales. A menudo se describe como "trato humano" al
tratamiento que se considera apropiado para los animales de laboratorio.
Deben los seres humanos beneficiarse del uso de otros animales? La relacin es
simbitica ms que unilateral y de explotacin. Adems, el uso de animales de laboratorio en
la investigacin representa tan slo una pequea parte del uso que otros humanos hacen de
los animales domsticos, incluyendo su uso como fuente de alimentacin.
Estimaciones del nmero de animales empleados en avicultura y ganadera
Pollos 7.764.200.000
Gallinas ponedoras 303.604.000
Pavos 301.251.000
Ganado vacuno 59.801.000
Cerdos 104.301.000
Ovejas y corderos 6.691.000
TOTAL AVICULTURA Y GANADERA 8.539.848.000
Estimaciones del nmero de animales empleados en Investigacin
Perros 75.429
Gatos 26.091
Primates 56.381
Caballos 217.079
Conejos 309.322
Animales de granja 159.742
Ratas y ratones 7.452.186
Otros 150.987
TOTAL INVESTIGACIN 8.452.186
*Datos de 1997 de EEUU.
Porcentaje del total empleado en investigacin = 0.099%
Alternativa a la investigacin con animales. La creciente preocupacin por aspectos ticos
de la investigacin con animales ha llevado a la bsqueda de tcnicas alternativas. Russell y
Burch (1959) formularon las "tres R": reemplazamiento de animales por otras tcnicas de
estudio, reduccin del nmero de animales empeados por tcnicas estadsticas y
refinamiento de los procedimientos experimentales para causar menos sufrimiento. Pero en
la investigacin sobre aprendizaje no es posible la experimentacin sin organismos vivos.
16
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introduccin
Juan Carlos Cabrera
Algunas de las tcnicas propuestas:
1. Tcnica observacionales. Al necesitar los estudios de aprendizaje manipulacciones
experimentales de la experiencia pasada, las observaciones realizadas sin intervenir
sobre los animales no pueden proporcionar informacin sobre los mecanismos de
aprendizaje.
2. Uso de plantas. El aprendizaje no puede estudiarse en plantas, ya que carecen de
sistema nervioso, imprescindible para el aprendizaje.
3. Cultivo de tejidos. Aunque los cultivos de tejidos pueden revelar las operaciones de
procesos celulares, el funcionamiento del estos procesos celulares dentro del organismo
intacto slo puede estudiarse en el organismo intacto. Adems, la bsqueda de los
mecanismos celulares del aprendizaje requiere una caracterizacin previa del
aprendizaje a nivel conductual.
4. Simulaciones informticas. Sin los conocimientos precisos sobre la naturaleza de los
fenmenos de aprendizaje y de los mecanismos y factores que determinan el
aprendizaje, los programadores no pueden realizar una simulacin informtica. Por
tanto, la investigacin con organismos vivos es un requisito para la simulacin
informtica efectiva.
TERMINOS CLAVE
Aprendizaje Cambio duradero en los mecanismos de
conducta que implica estmulos y/o respuestas
especficos y que es resultado de la experiencia
previa con esos estmulos y respuestas o con otros
similares.
Asociacin Conexin entre la representacin mental
de dos eventos (dos estmulos o un estmulo y una
respuesta) de forma que la ocurrencia de uno de
los eventos activa la representacin del otro.
Dualismo Visin de la conducta segn la cual las
acciones pueden dividirse en dos categoras:
conducta voluntaria controlada por la mente y
conducta involuntaria controlada por mecanismos
reflejos.
Ejecucin Actividades de un organismo en un
momento particular.
Empirismo Corriente filosfica segn la cual todas las
ideas de la mente tienen su origen en la
experiencia.
Hedonismo Postura filosfica propuesta por Hobbes
segn la cual las acciones de un organismo estn
enteramente determinadas por la persecucin del
placer y la evitacin del dolor.
Maduracin Cambio en la conducta causado por el
desarrollo fsico o fisiolgico del organismo en
ausencia de experiencia con eventos particulares
del ambiente.
Innatismo Postura filosfica segn la cual los seres
humanos nacen con ideas innatas.
Nervismo Postura filosfica adoptada por Pavlov
segn la cual todos los procesos conductuales y
fisiolgicos estn regulados por el sistema
nervioso.
Reflejo Mecanismo que permite que un evento
especfico del ambiente elicite una respuesta
especfica.
Slaba sin sentido Combinacin de tres letras (dos
consonantes y una vocal) sin significado.
17
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
La naturaleza de la conducta elicitada.
- El concepto de reflejo.
- Pautas de accin modal.
- Estmulos elicitantes de las pautas de accin modal.
- La organizacin secuencial de la conducta.
Efectos de la estimulacin repetida.
- Atencin visual en los bebs humanos.
- Salivacin y evaluacin del sabor en humanos.
- Respuesta de sobresalto en ratas.
Los conceptos de hatituacin y sensibilizacin.
- Adaptabilidad y generalidad de la habituacin y la sensibilizacin.
- Diferencias entre habituacin y adaptacin sensorial y fatiga.
- Teora de proceso dual de la habituacin y la sensibilidad.
Caractersticas de la habituacin y la sensibilizacin.
- Curso temporal.
- Especificidad del estmulo.
- Efecto de un estmulo externo intenso.
Aplicacin a las emociones y la conducta motivada.
- Reacciones emocionales y sus efectos posteriores.
- La teora del proceso oponente.
- Variaciones en la conducta dirigida a metas.
19
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
La Naturaleza de la Conducta Elicitada (pg. 29)
Todos los animales reaccionan a los eventos que tienen lugar en su entorno. Gran parte de la
conducta tiene lugar como respuesta a los estmulos; es decir, ocurre de forma elicitada.
El concepto de reflejo.
Un reflejo conlleva dos elementos ntimamente relacionados, un estmulo elicitante y su
correspondiente respuesta. La respuesta rara vez tiene lugar en ausencia del estmulo.
Estmulo y respuesta es una consecuencia de la organizacin del sistema nervioso. Los
reflejos simples suelen estar mediados por tres neuronas:
- Neurona sentorial o neurona aferente, es activada por un estmulo ambiental y
transmite el mensaje sensorial a la mdula espinal.
- Neurona motora o neurona eferente, trasmite el impulso desde la mdula espinal que
activa el musculo involuntario en la repuesta refleja.
- Interneural el impulso que comunica las dos neuronas anteriores.
Los circuitos neuronales estn dispuestos de tal modo que determinadas neuronas
sensoriales se conectan al conjunto correspondiente de neurnas motoras, por lo que una
Organizacin neuronal de los reflejos simples. Los estmulos del entorno activan una neurona sensorial,
que trasmite el mensaje sensorial a la mdula espinal. En este lugar, el impulso neuronal pasa a una
interneurona, que a su vez dirige el impulso hacia una neurona motora. La neurona motora activa al musculo
involucrado en el movimiento.
20
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
determinada respuesta refleja est elicitada nicamente por un conjunto limitado de
estmulos. El conjunto formado por neurona aferente, la interneuraona y la neurona
eferente constituyen el arco reflejo.
El arco reflejo representa el nmero
mnimo de conexiones neuronales
necesarias para que tenga lugar el acto
reflejo, pero pueden verse involucradas esctructuras neuronales adicionales. Por ejemplo, la
informacin sensorial puede transmitirse al cerebro, que a su vez puede modificar la
reaccin refleja de diversas formas.
La mayor parte de los reflejos contribuyen al bienestar del
organismo, constituyen una parte importante del repertorio
conductual de los nios recien nacidos y en ocasiones esencial para la
supervivencia, como el reflejo de oclusin respiratoria.
Pautas de accin modal.
Hay respuetas simples comunes en muchas especies, por el contrario, existen otras
especificas de la propia especie. Por ejemplo, la respuesta de succin provocada por objetos
situados cerca de la boca es un rasgo caracterstico de los mamferos.
A las secuencias de respuestas tpicas de especies particulares, tales como las que aparecen
en la alimentacin de cras, se las denomina pautas de accin modal o PAMs.
Estmulos elicitantes de las pautas de accin modal.
Los rasgos especificos que se requieren para elicitar la conducta reciben colectivamente el
nombre de estmulo seal o estmulo desencadenante.
Un estmulo seal o desencadenante es
suficiente para elicitar una pauta de
accin modal. Sin embargo, una
determinada pauta de accin puede
estar controlada por varios rasgos del estmulo de forma aditiva. Adems, el estmulo que
elicita con mayor efectividad la pauta de accin no tiene por qu ser el que ocurra con
mayor probabilidad en condiciones naturales.
De hecho experimentos realizados con la gaviota arenquera, demostraron que el color, la
textura y el tamao parecan controlar la conducta de recuperacin del huevo de forma
aditiva. El atractivo del huevo poda resaltarse hacindolo ms verde, ms moteado o ms
Arco reflejo
El estmulo provoca una reaccin automtica.
Componentes: Neurona sensorial, interneural, neurona motora.
Son secuencias de conducta especficas de algunas especies
que se desencadenan ante un estmulo determinado
(estmulo seal o estmulo desencadenante).
Ej: "Bailes de cortejo".
21
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
grande. Al optimizar cada una de estas
dimensiones se obtena un objeto que
era ms efectivo que el natural como
elicitador de la pauta de accin. Estos
estmulos inusualmente efectivos
reciben el nombre de estmulos
supranormales.
La organizacin secuencial de la conducta.
Las conductas nunca aparecen aisladas sino que forman secuencias. Distinguimos dos tipos:
1.- Conducta apetitiva a los primeros componentes de la secuencia de
comportamiento. Sirve para poner al animal en contacto con el estmulo. Por ejemplo,
olfatear la comida antes de comerla.
2.- Conductas consumatoria a los ltimos componentes de la secuencia de
comportamiento. Por ejemplo, tragar la comida. Son normalmente ms estereotipadas
(menos variables) que las conductas apetitivas.
En secuencias de busqueda de comida:
1.- Modo de bsqueda general. Son conductas apetitivas. El sujeto no sabe dnde
buscar comida. Por ejemplo, la ardilla busca un nogal.
2.- Modo de bsqueda focalizada. Tambien conductas apetitiva. El sujeto ya ha
localizado espacialmente la fuente de comida, la bsqueda es ahora ms restringida.
Por ejemplo, la ardillaha encontrado el nogal y comienza a buscar nueces.
3.- Modo de manipulacin del alimento. Es la conducta consumatoria. Por ejemplo, la
ardilla ha obtenido la nuez.
Efectos De La Estimulacin Repetida. (pg. 35 del libro)
Descartes pensaba que una respuesta simple elicitada ocurre automticamente de la misma
forma que se presenta el estmulo elicitada. Cada aparicin del estmulo elicitante producir
la misma accin refleja. Esto no es as, dado que a menudo aparecen alteraciones en la
naturaleza de la conducta elicitada simplemente como resultado de la presentacin repetida
del estmulo elicitante.
Imaginemos que el parmetro ms importante es el color azul.
As puede suceder que el huevo artificial ms efectivo para
iniciar la Pauta de accin modal (PAM) resulta ser muy diferente
del huevo real. Un huevo muy azul que no existe en la
naturaleza, pero que elicita la PAM con ms fuerza que los de
verdad, lo llamamos estmulo supranormal.
22
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
Atencin visual en los bebs humanos.
Los bebs humanos tienen que aprender muchas cosas sobre el mundo, y una forma es
observar el entorno. Las claves visuales elicitan una respuesta de observacin, que puede
medirse por el tiempo que los bebs mantienen sus ojos en un objeto antes de mirar a otra
parte.
En un estudio sobre atencin visual se tomaron dos grupos de bebs de cuatro meses y se
les presentaron diferentes estmulos visuales. Los dos patrones similares a tableros de
ajedrez; uno de 4x4 y el otro de 12x12. Se presentaron durante 10s., ocho veces en
intervalos de 10s.
Los resultados muestran que la atencin visual provocada por un estmulo novedoso cambia a
medida que el beb se familiariza con el estmulo. Con el patron 4x4 relativamente sencillo,
la atencin visual se reduce progresivamente. Con el patrn 12x12 ms complejo, la atencin
se increment en el segundo ensayo, pero despus se redujo tambin.
Salivacin y evaluacin del sabor en humanos.
El sabor de la comida elicita la salivacin como respuesta refleja. Esto puede observarse
tan claramene en las personas como en los perros de Pavlov.
Las personas encuentran el sabor de una comida especfica menos placentera cuanto ms
comen. Sin embargo, el sabor de una comida distinta es suficiente para restablecer la
valoracin hednica de una comida familiar. Estos hallazgos , del experimento realizado por
Epstein, Rodefer, Wisniewski y Caggiula, 1992, suguieren que sobrealimentacin puede
reducirse no variando la alimentacin disponible para su consumo.
Patrn de tablero 4 x 4 Patrn de tablero 12 x 12
23
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
Respuesta de sobresalto en ratas.
La respuesta de sobresalto es una respuesta defensiva que aparece en muchas especies.
Consiste en un salto repentino y una contraccin de los msculos de la parte superior del
cuerpo, con frecuencia acompaado de una elevacin de los hombros.
Davis (1974) estudi la respuesta de sobresalto en dos grupos de ratas. A cada grupo, en un
ambiente con un sonido suave de 60dB y al otro, algo ms fuerte, con 80dB. Ambos grupos
recibieron 100 presentaciones de un tono de 4000 cps en intervalos de 30 segundos. Los
resultados fueron una reaccin de sobresalto cada vez ms dbil para el grupo expuesto a
ambiente 60dB y reacciones de sobresalto cada vez ms vigorosas para el grupo expuesto a
ambiente 80dB.
Los Conceptos De Habituacin y Sensibilizacin. (pg. 39 del libro)
Los estudios descritos anteriormente
muestran que la presentacin repetida de
un estmulo elicitante puede provocar
tanto disminuciones como incrementos en
la respuesta. Las disminuciones de la
tendencia a responder producidas por la
estimulacin repetida recibe el nombre
tcnico de efecto de habituacin. Los
incrementos de la tendencia a responder se llaman efecto de sensibilizacin.
Adaptabilidad y generalidad de la habituacin y la sensibilizacin.
Estamos continuamente bombardeados
por estimulos. Si tuviesemos que
responder a todos nuestra conducta sera
desorganizada y catica. Los fenmenos
de habituacin y sensibilizacin son el producto final de procesos que ayudan a organizar y
focalizar la conducta en el catico mundo de estmulos en el que los organismos viven.
Habituacin y sensibilizacin son tiles y necesarias porque
ayudan a hacer caso a ciertos estmulos relevantes y a ignorar
los estmulos irrelevantes. De lo contrario, nos moveramos en
un maremgnum estimular poco informativo.
Habituacin: La respuesta desciende debido a la estimulacin
repetida. Ej: Acostumbrarse a vivir cerca de un aeropuerto,
cuando los primeros das es una tortura, por el ruido.
Sensibilizacin: La respuesta aumenta debido a la
estimulacin repetida. Ej: La primera vez que escuch una
pera no haba distinguido el sonido de los clarinetes, ahora
que ya la he odo muchas veces puedo diferenciar ese sonido
claramente.
24
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
Diferencias entre habituacin y adaptacin sensorial y fatiga.
La habituacin no es el nico efecto
que da lugar a una disminucin en la
respuesta. La adaptacin sensorial
ocurre en los rganos sensoriales (una
cegera temporal al pasar de la
oscuridad a una luz) y la fatiga de la
respuesta tiene lugar en los msculos
efectores. Por el contrario, la
habituacin y la sensibilizacin
ocurren en el sistema nervioso.
En la habituacin, el rganismo deja de responder a un estmulo aunque mantiene la
capacidad de percibirlo y de realizar los movimientos musculares requeridos por la
respuesta. La respuesta no tiene lugar debido a los cambios en el sistema nervioso bloquean
la transmisin del impulso nervioso de la neuronas motoras.
En los estudios sobre habituacin, la adaptacin sensorial puede descartarse ya que existe
evidencia de que la habituacin es especfica de la respuesta.
La fatiga tambin puede descartarse como causa de la habituacin por medio de evidencias
que muestra que la habituacin es especfica del estmulo.
Adaptacin sensorial: prdida de sensibilidad de ls
organos sensoriales ( ej: deslumbrarse por una luz muy
fuerte).
Cmo distinguirla de la Habituacin?
La adaptacin sensorial...
1. No se debe a una estimulacin repetida, como la
Habituacin, sino a una estimulacin demasiado potente.
2. No sucede en el sistema nervioso central, como la
habituacin, sino en los rganos sensoriales. No es por
tanto una forma de aprendizaje.
3. No es especfica de la respuesta. Si los rganos
sensoriales estn afectados, todas las respuestas
disminuirn porque los estmulos no son bien captados por
los sentidos. Por el contrario, en la habituacin, slo
desciende una respuesta, otras respuestas diferentes
pueden ser ejecutadas con normalidad.
4. Es un tipo de efecto muy transitorio.
Fatiga: Reduccin de la respuesta producida por el
cansancio de los msculos involucrados en ella.
En qu se parece y en qu se distingue de la
Habituacin?
1. La fatiga s puede ser consecuencia de una estimulacin
repetida, como la Habituacin. Ejecutar una misma
respuesta continuamente produce fatiga.
2. Sin embargo, la fatiga no sucede en el sistema nervioso,
no es aprendizaje, sino en los msculos que ejecutaran
la respuesta. Un brazo cansado no puede ejecutar la
respuesta.
3. La fatiga no es especfica del estimulo, como s lo es
la Habituacin. En el caso de la Habituacin, un cambio en
el estmulo devuelve la respuesta normal. Sin embargo, un
msculo fatigado no puede volver a ejecutar la respuesta
por haber cambiado el estmulo presentado.
4. Igualmente es un cambio muy transitorio: slo hace
falta descansar un rato.
25
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
Teora de proceso dual de la habituacin y la sensibilidad.
La teora del proceso dual presupone que los incrementos y disminuciones en la tendencia a
responder a un estmulo son producto de procesos neuronales diferentes: Proceso de
habituacin, rovoca una disminucin de la tendencia a responder y proceso de
sensibilizacin, produce un incremento en la tendencia a responder. Estos procesos no son
exlcuyentes y ambos pueden estar activos al mismo tiempo. El resultado conductual depende
de qu proceso sea ms fuerte.
En base investigaciones neuropsicolgica, los
procesos de habituacin y sensibilizacin
tienen lugar en diferentes partes de sistema
nervioso. La habituacin tiene lugar en el
sistema E-R, que consiste en el camino
neural ms corto que conecta los rganos
sensoriales activos por el estmulo elicitante
y los msculos involucrados en la produccin
de la respuesta elicitada ( como el arco
reflejo). Cada presentacin de un estmulo
elicitante activa el sistema E-R y causa un
incremento en la habituacin.
Los procesos de sensibilizacin tienen lugar en el sistema de estado. Este determina la
tendencia general de un organismo a responder, mientras el sistema E-R permite al animal
dar la respuesta especfica al estmulo relevante. Los cambios de conducta que tienen lugar
por la repeticin de un estmulo refleja la accin combinada de los sistemas E-R y de
estado.
Aplicaciones de la teora del proceso dual. En los ejemplos de habituacin y
sensibilizacin, la exposicin repentida al patrn ajedrez 4x4 produjo una disminucin de
respuesta visual de los bebs, posiblemente no provoc mucha activacin del sistema E-R,
proceso de habituacin. El patrn ajedrz 12x12, ms complejo, produjo mayor activacin y
La teora del proceso dual integra los dos procesos de
habituacin y sensibilizacin.
Los dos procesos suceden al mismo tiempo: la conducta
observada es el resultado neto de los dos. Quin es ms
fuerte?
Los dos procesos (habituacin y sensibilizacin) tienen lugar en distintas partes del SN.
El proceso de habituacin tiene lugar en el sistema E-R (similar al arco reflejo). Cada presentacin de un estmulo activa
el sistema E-R aumentando la habituacin.
El proceso de sensibilizacin tiene lugar en el sistema de estado (determina la tendencia a responder). Slo se activa ante
la presentacin repetida de estmulos excitadores (por tanto, no est activo todo el tiempo). Se puede modificar esa
tendencia mediante drogas o estados emocionales ( ej: el miedo).
La conducta observada ser el resultado de la combinacin de los dos procesos, por lo tanto depende de cul de los dos sea
ms fuerte en un momento dado.
26
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
activ, no slo el sistema E-R, sino tambin el sistema estado. Produjo un incremento en la
atencin visual despus del primera presentacin. Sin embargo, el proceso de sensibilizacin
no fue lo suficientemente fuerte para contrarestar completamente los efectos de la
habituacin. Como resultado, despues de varios ensayos, la atencin visual tambien declino
en respuesta al estimulo 12x12.
La respuesta de sobresalto de las ratas anteriormente comentadas requieren una aplicacin
diferente de la teora del proceso dual. Cuando se someti a prueba con ruido ambiental
relativamente suave (60 dB), no haba nada que las activara. Por tanto, podemos asumir que
los procedimientos experimentales no produjeron cambios en el sistema estado. La
presentacin repetida de tono elicitador activaba tan slo el sistema E-R, lo que dio lugar a
la habituacin de la respuesta de sobresalto.
El resultado contrario tubo lugar cuando fueron puestos en presencia de los 80 dB.
Sucesivas presentaciones del tono aparecieron reacciones de sobresalto ms enrgicas.
Dado que en ambos grupos se utiliz el mismo tono, la diferencia en los resultados no puede
ser atribuida al mismo. Debemos asumir que en el segundo grupo, el ruido ambiente intenso
increment el nivel de activacin o la tendencia a respuesta. Esta sensibilizacin del sistema
de estado fue la causa del incremento en la reaccin de sobresalto al tono en el segundo
grupo.
Implicaciones de la teora del proceso dual. El sistema E-R se activa siempre que un
estmulo elicita una respuesta, mientras que el sistema de estado slo interviene en
circunstancias especiales.
Caractersticas de la habituacin y la sensibilizacin. (pg. 45 del libro)
Curso temporal.
Por lo general duran poco tiempo, lo suficiente para ser considerarlos formas de
aprendizaje.
Curso temporal de la sensibilizacin por lo general tienen efectos temporales y su
duracin depende de la intensidad de los estmulos. Los estmulos ms intensos producen
mayores incrementos en la tendencia a responder y una sensibilizacin ms persistentes.
Curso temporal de la habituacin. La persistencia es variable. En la habituacin se
distingue entre habituacin a corto plazo (se disipa en segundos o minutos) y habituacin a
27
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
largo plazo (persiste durante muchos das). La recuperacin espontnea es la principal
caracterstica del efecto de habituacin a corto plazo.
Especificidad del estmulo.
Especificidad del estmulo en la habituacin. La habituacin es especfica del estmulo que
ha sido presentado repetidamente. Una respuesta a un estmulo previamente habituada
puede manifestarse plenamente alterando alguna caracterstica importante del estmulo.
Ejemplo, despus de habituarse al sabor del limn, la presentacin de la lima recupera la
respuesta totalmente.
Aunque la habituacin es especfica de un estmulo, puede darse cierta generalizacin. Si
nos hemos habituado a un determinado sonido del reloj, es posible que tampoco
respondamos al sonido de otro reloj que es similar al original. Este fenmeno recibe el
nombre de generalizacin del estmulo de la habituacin. A medida que los estmulos se
hacen progresivamente diferente, el organismo mostrar una menor habituacin o supresin
de la respuesta ante dicho estmulo.
Especificidad del estmulo en la sensibilizacin.
La sensibilizacin no es especfica del estmulo.Si una animal se sensibiliza por alguna razn,
su reactividad se increment para toda una variedad de estmulos.
Efecto de un estmulo externo intenso.
La respuesta habituada tambin puede
restablecerse sensibilizando al organismo con
la exposicin de un estmulo externo. Este
fenmeno recibe el nombre de
deshabituacin.
Especialidad del estmulo:
- Habituacin: Muy especfica del estmulo (cambiamos el estmulo y la respuesta).
- Sensibilizacin: No especfica del estmulo. Cuando el animal se sensibiliza (por estados de alerta, miedo, ingestin de
drogas), est hipersensible para casi cualquier estmulo que vaya a presentarse.
Un estmulo intenso puede producir en el animal un estado
de sensibilizacin que recupera la respuesta anteriormente
habituadas: Deshabituacin.
28
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
Aplicacin a las emociones y la conducta motivada. (pg. 49 del libro)
La exposicin de los cambios producidos por la repeticin de un estmulo se ha limitado
hasta ahora a respuestas relativamente sencillas. Los estmulos tambin pueden provocar
emociones complejas, tales como amor, miedo, euforia, terror o satisfaccin.
Reacciones emocionales y sus efectos posteriores.
Solomon y Corbit (1.074) destacaron dos rasgos llamativos.
Las reacciones emocionales intensas a menudo constas de dos
fase:
- Primero, tiene lugar durante la presentacin del estmulo
elicitante, y
- Segundo, la opuesta se observa cuando el estmulo
desaparece.
Por ejemplo, el efecto psicoactivo del alcohol. Una persona se
vuelve alegre y relajada, y experiementa sensaciones de cracter generalmente agradable
cuando toma una un vaso de vino. Estas reacciones reflejan el efecto sedante inicial del
alcohol. Por el contrario, tras tomar varias bebidas ocurre algo bastante distino. Una vez
que el efecto sedante del alcohol se ha disipado, es probable que la persona se vuelva
irritable y que experimente dolor de cabeza y nuseas. El efecto sedante y placentero del
alcohol da paso a la sensaciones molestas de la resaca.
Cuanto ms bebemos ms
alegres o sedados quedamos y
ms intensa es la resaca
posteriormente.
Las reacciones emocionales cambian con la experiencia. La reaccin primaria se hace ms
dbil y su postefecto se hace ms fuerte. La habituacin de la
primera reaccin a la droga se llama tolerancia a la droga, lo que
hace referencia a la disminucin en la efectividad a una droga con
las exposiciones repetidas.
Solomon y Corbit (1974) destacaron que se producen patrones de reaccin emocional
similares con otros estmulos emocionales. El amor y el apego, por ejemplo, la habituacin
primaria va acompaada de un fortalecimiento del postefecto afectivo.
R.L. Solomon
Reaccin emocional
"positiva": Euforia y
relajacin.
Reaccin emocional
"negativa": Irritabilidad,
agresividad.
Tolerancia a las drogas:
habituacin a la emocin
primaria que producen.
29
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
La teora del proceso oponente.
La teora del proceso oponente de la motivacin se diseo para explicar estos tres rasgos
caractersticos de las reacciones emocionales:
1. Las reacciones emocinales son bifsicas; a una reaccin primaria sigue un postefecto
opuesto.
2. La reaccin primaria se debilita con la estimulacin repetida.
3. El debilitamiento de la reaccion primaria va acompaado por un fortalecimiento del
postefecto.
Mecanismos oponentes durante la exposicin inicial al estmulo.
La figura 2.16 muestra cmo los procesos primario
y oponente determinan la respuesta iniciales de un
organismo ante un estmulo emocional activador.
Cuando el estmulo se presenta por primera vez
(panel inferior) el proceso a tiene lugar sin la
oposicin del proceso b. Esto permite que la
reaccin emocional primaria alcance su nivel ms
alto. Despus se activa el proceso b y comienza a
oponerse al proceso a. Sin embargo, en la primera
presentacin del estmulo el proceso b no es lo
suficientemente fuerte para compensar por
completo la respuesta emocional primaria, que
persiste mientras est presente el estmulo
elicitante. Cuando el estmulo se retira, el proceso
a se detiene rpidamente, pero el proceso b
permanece por algn tiempo. En ese momento, no
hay nada que se oponga al proceso b, y la respuesta emocional caracterstica del proceso
oponente se hace evidente por primera vez. Estas emociones son por lo general opuestas a
las que se observan durante la presentacin del estmulo.
Esta teora asume que hay que mantener el equilibro (homeostasis) emocional. Toda emocin primaria, activa un proceso
oponente de signo contrario para compensarla.
El porceso oponente empieza siendo ms dbil que el proceso primario (ejemplo, felicidad) pero tambin aumenta de
fuerza ms rpido que el proceso primario. Por lo tanto, con la estimulacin repetida, el proceso oponente se va haciendo
ms fuerte que el proceso primario ( la tristeza gana a la felicidad). Esto sera Habituacin..
Figura 2.16
30
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
Mecanismos oponentes tras la exposicin prolongada al estmulo.
La figura 2.17 muestra cmo funcionan los
procesos primarios y oponentes tras la exposicin
prolongada al estmulo. Un estmulo familiar no
elicita reacciones emocionales fuertes, pero el
postefecto afectivo tiende a ser ms fuerte
cuendo termina un estmulo familiar. La teora del
proceso oponente explica este resultado
asumiendo que el proceso b fortalece con la
exposicin prolongada al estmulo. El
fortalecimiento del proceso b se refleja en varias
de sus caractersticas: se activa antes tras la
apricin del estmulo, su intensidad mxima se
hace mayor y tarda ms tiempo en decaer tras la
desaparicin del estmulo. Por el contrario, se
asume que el proceso a pertenece inalterado. Por
tanto, tras la presentacin repetida de un
estmulo, la respuesta emocional primaria queda compensada de forma ms efectiva por el
proceso oponente. Este fortalecimiento del proceso oponente reduce la intensidad de las
respuestas emocionales primarias observadas durante la presentacin del estmulo
emocional activador. Tambin da lugar a un postefecto emocional intenso cuando el estmulo
se retira.
Motivacin y postefecto oponente. Si los efectos placenteros iniciales de una droga
psicoactiva desaparecen en los consumidores habituales por qu continan tomando la
droga? Por qu se hacen adictos?. La teora del proceso oponente suguiere que la adiccin
a las drogas es principalmente un intento de reducir la aversin producida por el postefecto
afectivo de las drogas. Hay dos formas de reducir los postefectos oponetes aversivos.
Esperar a que se disipen ( "pasar el mono" , puede tardad mucho tiempo y puede ser muy
duro) o tomando de nuevo la droga para reducir ms rpidamente los postefectos
oponentes. Quedan atrapados, no por el placer directo que obtienen de la droga, sino de la
necesidad de reducir los efectos de la retirada.
Valoracin general de la teora del proceso oponente. La teora del proceso oponente
result muy atractiva cuando se present, ya que abarca un amplio rango de situaciones y
proporciona una interesante explicacin de la tolerancia a las drogas, as como la
dependencia y la adiccin. An est pendiente de probar de forma emprica muchas de sus
predicciones en varias situaciones.
Figura 2.17
31
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
Variaciones en la conducta dirigida a metas.
Responder para escapar de la molestia producida por la retirada de un estmulo es slo uno
de los tipos de conducta motivada a dirigir a metas. Un objeto meta gratificante recibe el
nombre tcnico de reforzador. Las situaciones en la que los organismos responden
repetidamente para obtener un reforzador muestran muchas de las propiedades comunes
de la habituacin y la sensibilizacin.
Ejemplo: El acto de encender un lector de disco ppara escuchar una cancin particular. Es
menos problable que encedndamos el lectos si el resultado es siempre la misma cancin
(habituacin), pero esta prdida de inters es especifica de esa cancin repetida
(especificidad del estmulo). Adems, recuperaremos nuestro interes en la cancin origianl
si no la escuchamos durante unos das ( recuperacin espontnea). Nuestro inters por la
cancin conocida tambien puede establecerse por la exposicin a estmulos novedosos, tales
como la excitacin de encontrarnos con un amigo (sensibilizacin)
La habituacin y la sensibilizacin son frecuentes con reforzadores sensoriales como
pueden ser las piezas musicales. Tambin tienen lugar fenmenos similares a la habituacin
y la sensibilizacin con objetos meta consumibles, como la comida y el agua. La exposicin
repetida a la comida, por ejemplo, provocar un descenso de la conducta dirigida a la
alimentacin. La disminucin de la conducta dirigida a alimentos normalmente puede
atribuirse a la reduccin del hambre o saciedad, pero tambin pueden estar involucrados los
mecanismos generales de la habituacin.
Adiccin a las drogas y proceso oponente
Las drogas ( en general, toda sustancia psicoactiva) activan un proceso primario positivo (eufora, "colocn") y tambin un
proceso oponente negativo ("bajn", resaca, "mono") que le sigue despus.
1 . Nada ms tomar la droga, el proceso primario gana ("colocn").
2. Al retirar la droga, el proceso oponente permanece un tiempo ("bajn").
Con la estimulacin repetida, se va haciendo ms fuerte el proceso oponente (habituacin=tolerancia a la droga). El
usuario de la droga que ha desarrollado tolerancia siente los efectos positivos cada vez menos, y los efectos negativos
cada vez ms.
A veces, el bajon (proceso oponente) puede durar mucho tiempo y ser inaguantable (eso es "pasar el mono"). Una manera de
reducir su duracin es volver a tomar la droga para reiniciar el proceso primario. As se explica la adiccin. El adicto
no acude a la droga por sus efectos positivos, sino para detener los efectos negativos... por un tiempo.
32
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
TERMINOS CLAVE
Adaptacin sensorial Reduccin temporal en la
sensibilidad de los rganos sensoriales provocada
por la estimulacin repetida o excesiva.
Arco reflejo Estructura neural que consiste en una
neurona aferente (sensorial), una interneurona y
una neurona eferente (motora) y que permite que
un estmulo pueda elicitar una respuesta refleja.
Conducta apetitiva Conducta que tiene lugar al
principio de una secuencia natual de conducta y
que sirve para poner al organismo en contacto
con un estmulo desencadenante. (Vase tambin
modo de bsqueda general y modo de bsqueda
focalizada.)
Concucta consumatoria Conducta que lleva a
consumar o completar una secuencia natural de
conducta. La respusta consumatorias son, por lo
general, patrones de accin modal especficos de
la especie. (Vase tambin modo de manipulacin
del alimento.)
Deshabituacin Recuperacin de una respuesta
habituada como resultado de la presentacin de
un estmulo externo e intenso.
Efecto de habituacin Disminucin progresiva en el
vigor de la conducta elicitada que puede tener
lugar con la presentacin repetida del estmulo
elicitante.
Efecto de sensibilizacin Incremento en el vigor de
la conducta elicitada que puede resultar de la
presentacin repetida del estmulo elicitante o
de la exposicin a un estmulo externo intenso.
Estmulo desencadenante Lo mismo que estmulo
seal.
Estmulo seal Rasgo especfico de un objeto o
animal que elicita una pauta de accin modal en
otros organismos. Tambin llamado estmulo
desencadenante.
Estmulo supranormal Estmulo seal artificial-mente
agrandado o exagerado que elicita una respuesta
inusualmente vigorosa.
Fatiga Disminucin temporal de la conducta causada
por el uso repetido o excesivo de los msculos
involucrados en la conducta.
Interneural Neurona de la mdula espinal situada
entre la neurona aferente (sensorial) y la
neurona eferente (motora) en el arco reflejo.
Modo de bsqueda focalizada Segundo componente
de la secuencia de conducta de alimentacin, tras
la bsqueda general, en el que el organismo pone
en marcha una conducta centada en la
localizacin de un estmulo particular que indica
la presencia de alimento. La bsqueda focalizada
es una forma de conducta apetitiva ms
directamente relacionada con el alimento que la
busqueda general.
Modo de bsqueda general Primer compnente de la
secuencia de conducta de alimentacin, en la que
el organismo pone en marcaha una conducta
motora sin direccin fija. La bsqueda general es
una forma de conducta apetitiva.
Modo de manipulacin del alimento ltimo
componente de la secuencia de conducta de
alimentacin en el que el organismo manipula y
consume el alimento. Es similar a lo que los
etlogos llaman conducta consumatoria.
Neurona aferente Neurona que transmite mensajes
de los rganos de los sentidos al sistema nervioso
central. Tambin recibe el nombre de neurona
sensorial.
Neurona eferente Neurona que transmite los
impulsos a los msculos. Tambin llamada
neurona motora.
Neurona motora Lo mismo que neurona eferente.
Neurona sensorial Lo mismo que neurona aferente.
33
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010
PAM Abreviatura de pauta de accin modal.
Pauta de accin modal Patrn de respuesta exhibido
de forma similar por la mayora de los miembros
de una misma especie. Las pautas de accin modal
se utilizan como unidades bsicas de conducta en
las investigaciones etolgicas de
comportamiento. Abreviatura PAM.
Proceso a Lo mismo que proceso primario en la teora
de proceso oponente de la motivacin.
Proceso b Lo mismo que proceso oponente en la
teora de proceso oponente de la motivacin.
Proceso de habituacin Mecanismo neural activado
por la repeticin de un estmulo que reduce la
magnitud de las respuestas elicitadas por ese
estmulo.
Proceso de sensibilizacin Mecanismo neural que
incrementa la magnitud de las respuestas
elicitadas por un estmulo.
Proceso oponente Mecanismo compensatorio que
tiene lugar en respuesta al proceso primario
elicitado por eventos biolgicamente
significativos. El proceso oponente provoca
cambios fisiolgicos y conductuales opuestos a
los que provova el proceso primario. Tambin
llamado proceso b.
Proceso primario Primer proceso elicitado por un
evento biolgicamente significativo. Tambin
llamado proceso a.
Recuperacin espontnea Recuperacin de una
respuesta habituada o de una respuesta
exinguida tras un perodo de descanso.
Reforzador Estmulo cuya administracin
inmediatamente posterior a una respuesa
incrementa la probabilidad futura de dicha
respuesta.
Sistema de estado Estructuras neurales que
determinan el nivel general de responsividad o
tendencia a responder del organismo.
Sistema E-R Ruta neural ms corta que conecta los
rganos sensoriales estimulados por un estmulo
elicitante con los msculos involucrados en la
produccin de respuesta elicitada.
Tolerancia a las drogas Reduccin en la efectividad
de una droga como resultado del uso repetido de
la droga.
35
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera - 2009/2010
Los primeros aos del acondicionamiento clsico
- Los descubrimientos de Vul'fson y Snarskii
- El paradigma de condicionamiento clsico
Situaciones experimentales
- Condicionamiento del miedo.
- Condicionamiento del parpadeo.
- Seguimiento del signo.
- Aprendizaje de aversin al sabor.
Procedimientos de condicionamiento pavloviano excitatorio
- Procedimientos tpicos de condicionamiento pavloviano.
- Medida de las respuestas condicionadas.
- Procedimientos de control en el condicionamiento clsico.
- Eficacia de los procedimientos tpicos de condicionamiento.
Condicionamiento pavloviano inhibitorio
- Procedimientos de condicionamiento inhibitorio.
- Mediacin de la inhibicin condicionada.
Predominio del condicionamiento clsico
37
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
El condicionamiento clsico es el mecanismo ms simple por el cual los organismos pueden
aprender acerca de las relaciones entre estmulos y cambiar su conducta en conformidad
con la misma. Permite a los seres humanos y a los dems animales aprovecharse de la
secuencia ordenada de eventos de su ambiente y aprender qu estmulos tienden a ir con
qu evento.
Los Primeros aos del condicionamiento clsico (pgina 60 del libro)
Comenzaron con el trabajo del fisilogo ruso Ivan P. Pavlov. Los descubrimientos de Edwin
B. Twitmyer sobre el condicionamiento clsico, que realiz en su tesis doctoral, en el que no
investig sistemticamente las implicaciones y sus hallazgos no despertaron gran atencin.
Como una estensin ms de los estudios que Pavlov realiz sobre la digestin, su equipo
tnico descubri que los perro secretaban jugos gstricos en respuesta de la mera visin de
la comida o la persona que normalmente se las suministraba. Sus tcnicos del laboratorio lo
llamaban "secreciones psqicas" .
Los descubrimientos de Vul'fson y Snarskii
Los primeros estudios sistemticos sobre el condicionamiento clsico fueron realizados por
S. G. Vul'fson y A. T. Snarskii en el laboratorio de Pavlov.
Vul'fson estudi la respuesta salival de los perros con productos naturales. Despus de que
los perros hubieran experimentado la sensacin provocada por estas sustancias en sus
bocas, la mera visin de la misma era suficiente para provocar salivacin.
Snarskii extendi estas observaciones a sustancias artificiales.
El aprendizaje de objeto, requiere asociar diferentes caractersticas de un mismo objeto.
El paradigma de condicionamiento clsico
El procedimiento bsico de Pavlov para el estudio de la salivacin condicionada conlleva dos
estmulos: un tono o luz que no provoca salivacin al principio y un alimento o solucin cida
situada en la boca que provoca una fuerta salivacin.
EC o Estmulo condicionado sera la luz.
EI o Estmulo incondicionado sera el alimento.
RC o Respuesta condicionada sera la respuesta provocada por la Luz.
RI o Respuesta incondicionada sera la salivacin provocada por el alimento.
38
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
39
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
Situaciones experimentales (pgina 63 del libro)
Condicionamiento del miedo.
Watson y Rayner (1920) condicionaron la respuesta de miedo en un
nio de 9 meses, Albert, a la presentacin inofensiva de una rata
blanca de laboratorio. Albert se alarmaba cuando se haca sonar un
fuerte sonido, as que cada vez que le presentaba la rata se
golpeaba una barra de acero. Despus de cinco ensayos, Albert
mostr una reaccin de miedo intenso ante la rata. Este miedo se
generaliz rpidamente a otros objetos peludos.
Desde el estudio de Albert, los experimentos se realizan sobre
todo con ratas de laboratorio. El EI aversivo (odioso o
desagradable) utilizado en estos estudios es una breve descarga
elctrica administrada directamente en las patas del animal mediante un rejilla metlica,
con una intensidad y duracin que no provoque dao tisular (de los tejidos u organos). El EC
puede ser un tono o una luz.
La respuesta de miedo de las ratas es quedarse quietas, as se utiliza una tcnica popular de
medida indirecta del miedo condicionado como es el procedimiento de respuesta emocional
condicionada o supresin condicionada (REC) diseada por Estes y Skinner (1941). Consiste
en primero ensear al sujeto (rata) a presionar una barra varias veces para obtener
alimento como recompensa de forma regular. Despus comienza la segunda fase que
consiste en presentar un EC (un tono) durante 1 o 2 minutos e inmediatamente aplicarle una
breve exposicin a la descarga. Espaciando los ensayos entre 15 o 20 minutos.
La supresin condicionada puede ser completa, de modo que las ratas no presionen en
absoluto la barra, en 3 o 5 ensayo de condicionamiento. Sin embargo, la supresin es
especfica de del EC y cuando desaparece, los animales vuelven rpidamente a su conducta
para obtener comida.
Para medir cuantitativamente la suprecin condicionada se calcula una razn de supresin.
EC pre el durante Respuesta EC el durante Respuesta
EC durante Respuesta
supresin de Razn
+
=
La razn de supresin adopta un valor 0 si la rata deja de presionar la palanca completamente durante el EC, ya que el
numerador de la frmula es 0. En el otro extremo, si la rata no altera su ritmo de presiones en absoluto cuando se presenta el
EC, la razn tiene un valor de 0,5.
J ohn Broadus Watson
(1878-1958)
40
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
Algunos investigadores prefieren el procedimiento de supresin condicionada del lameteo
porque requiere menos entrenamiento para hacer que las ratas beban del tubo que para que
presionen una palanca y obtener comida. En el procedimiento de supresin del lameteo, se
registra el tiempo que el animal tarda en completar un total de 5 segundos de lameteo como
medida de la supresin de la respuesta.
Condicionamiento del parpadeo.
El reflejo palpebal es un reflejo discreto ( moderado, sin exceso, que no destaca ). Un
soplo suave en un ojo hace que se parpadee. Si el aire est precedido de un tono breve, es
problable que la persona aprenda a parpadear cuando aparece el tono, anticipando el soplo
de aire.
En un experimento se tom dos grupos de nios de 5 meses de edad y se realizadon dos
ensayos . A uno de estos grupos se emparej un tono (EC) que terminaba con un ligero soplo
de aire en el ojo. Al otro el tono y el soplo nunca ocurrian juntos. En el primer ensayo la tasa
de parpadeo no influyo en ninguno de los grupos, sin embargo, en el segundo ensayo, en el
primer grupo la tasa fue significativamente superior al segundo grupo, debido en parte a la
asociacin EC-EI que comenzaron a aprender en la primera sesin.
Este experimento demostro varios aspectos importantes del aprendizaje: Primero, el
condicionamiento clsico requiere del emparejamiento del EC y el EI. Segundo, el
aprendizaje inicial puede no ser directamente observable.
El interes por el condicionamiento palpebral en humanos se debe al hecho de que se han
realizado los progresos sutanciales en la compresin de los sustratos neurobiolgicos de
este tipo de aprendizaje. Las investigaciones neurobiolgicas sobre el condicionamiento
palpebral se ha llevado a cabo principalmente con conejos dmesticos y fue desarrollado por
Gormezano.
41
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
El condicionamiento palpebral y la bsquea del engrama.
Cuando un organismo aprende algo, el resultado de este
aprendizaje debe almacenarse en el cerebro. De algn modo, la
red de neuronas que constituyen el sistema nervioso central (SNC)
es capaz de codificar la relacin entre evento biolgicamente
significativos y de utilizar esta informacin para dirigir la conducta
en curso. Esta memoria biolgica se denomina engrama. Segn el
punto de vista tradicional, el engrama de una respuesta
condicionada concreta se almacena en regiones localizadas del
cerebro.
Richard Thompson y sus colegas, despus de casi cuatro dcadas
buscando el engrama, reconoci que requerira un sistema
conductual claramente definido en el que estuvieran precisamente
especificados tanto las condiciones para el aprendizaje como el
resultado motor. Estas consideraciones le llevaron a estudiar los
mecanismos que subyacen al condicionamiento palpebral.
La bsqueda del engrama comenz por el hipocampo. Personas
con daos en esta regin revelaron perdida de habilidad en
recordar conscientemente un evento reciente. Colocando una
serie de electrodos a animales en el hipocampo revelaron que las
clulas reflejaban el aprendizaje por una asociacin EC-EI. La ablacin del hipocampo, incluso la eliminacin de todas las
estructuras cerebrales por encima del cerebro medio, no eliminaba la capacidad del animal para adquirir y retener una respuesta
condicionada de parpadeo. Esto sugirie que el circuito esencial para el condicionamiento palpebral se sita en las estructuras
inferiores del tronco del encfalo y el cerebelo. Los experimentos posteriores mostraron claramente que la adquiscin de una
respuesta condicionada del parpadeo bien
ajustada depende de un circuito neuronal
situado en el cerebelo.
La respuesta incondicionada elicitada por un
soplo de aire en el ojo est mediada por
neuronas que se proyectan sobre una regin
del tronco del encfalo conocida como ncleo
trigeminal. Desde all, las neuronas siguen dos
rutas, una directa y otra a travs de la
formacin reticular, hasta llegar al ncleo
craneal motor, donde se organiza la salida
conductual. Para definir este recorrido, se
utilizan tres tcnicas bsicas. La primera
consista en tomar registros electrofisiolgicos
para verificar que las neuronas de ese circuito
intervienen el la resusta EI. La segunda
tcnica consista en desactivar el circuito
neuronal, ya fuera permanentemente
(eliminando las clulas) o temporalmente (por
medio de drogas o frio), para mostrar que el
circuito tiene un papel esencial en la respuesta
incondincionada. Si el circuito es necesario, la
alteracin de sus funciones debera eliminar la
salida conductual. Finalmente, se estimul el
circuito de forma artificial para mostrar que la
actividad de dicho circuito era suficiente par
producir la salida conductual.
Las mismas tcnicas (registro elctrico,
desactivacin y estimulacin) se utilizaron para
definir el reorrido neuronal que media en la
adquisicin y ejecucin de la respuesta
condicionada.La entrada EC se trasmite hasta
una regin del tronco del encfalo conocida
como ncleo pontino. Desde all, al cerebelo
por medio de fibras musgosas. La seal del EI
llega al cerebelo a travs de fibras trepadoras.
Estas dos seales se encuentran en el crtex
42
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
cerebeloso donde la convergencia de actividades produce una modificacin sinptica que altera la salida neuronal del cerebelo.
Bsicamente, las fibras ascendentes actuan como maestras, seleccionando un subconjunto de conexiones para su
modificacin. Este cambio definelas propiedades del estmulo (las caractersticas del EC) que sern responsables de una salida
motora concreta. Esta salida est mediada por neuronas que se proyectan desde el ncleo interpositus al ncleo rojo, y
finalmente, al ncleo craneal motor.
A medida que se va adquiriendo la respuesta condicionada, la actividad condicionada se desarrolla en el ncleo interpositus. Las
neuronas de dicho ncleo se proyectan hacia atrs hasta el circuito del EI e inhiben la seal del mismo en la oliva inferior. Esto
proporciona una retroalimentacin negativa que reduce la efectividad del EI. Muchos investigadores creen que fenmeno como
el bloqueo o el ensombrecimiento tienen lugar porque un EI previsto es menos eficaz. En el paradigma del condicionamiento
palpebral esto podra suceder debido a que la entrada del EI est inhibida en la oliva inferior. Esta idea se ve apoyada por un
experimento de Kim y colaboradores (1998), que mostr que la eliminacin de esta fuente de inhibicin eliminaba el efecto de
bloqueo.
Previamente hemos dicho que el hipocampo no es ncesario para el condicionamiento de demora simple. Sin embargo, s
interviene en formas ms complejas de aprendizaje. Un ejemplo lo proporciona el condicionamiento de huella, en el que se
inserta una demora temporal entre el final del EC y el principio de EI. Un animal normal puede adquirir fcilmente un parpadeo
condicionado a un EC que termina 0,5 segundos antes del comienzo del EI. Sin embargo, no puede alvar este espacio si se
retira el hipocampo. Se observa un patrn de resultados similar en los pacientes amnsicos que han sufrido dao en el
hipocampo. Estos pacientes no pueden recordar concientemente la relacin EC-EI. En ausncia de esta memoria esplcita, son
incapaces de aprender con un procedimiento de huella. El aprendizaje con un procedimento de demora no se ve alterado,
incluso si los pacientes no pueden recordar conscientemente la relacin EC-EI de una sesin a la siguiente. Curiosamente, la
alteracin de conciencia en un individuo normal debilita la apreciacin de la relacin EC-EI con un procedimiento de huella. De
nuevo, los sujetos que no pueden dar informacin explcita sobre la relacin, son incapaces de aprender.
-J .W.Grau
Seguimiento del signo.
Uno de los paradigmas experimentales que ha contribuido significativamente a la concepcin
actual del condicionamiento pavloviano es el paradigma de seguimiento del signo o
automoldeamiento que consiste en el movimiento hacia un estmulo que seala la
disponibilidad de un reforzador, como comida, y posible contacto con el mismo.
Experimentos con palomas en un laboratorio mediante la presentacin de un estimulo visual
discreto y bien localizado (una tecla luminosa) justo antes de cada administracin
automtica de alimentos, las palomas en vez de utilizar el estmulo visual para predecir
cuando dirigirse al comedero, picoteaban la tecla aunque no era necesario para tener acceso
a la comida. Demostrando que el seguimiento del signo es una herramienta til para el
estudio del aprendizaje asociativo.
El aprendizaje tiene lugar de forma rpida cuando EC se presenta justo antes del EI. Las
palomas no se aproximan a EC si el EC y el EI se presentan de forma aleatoria uno del otro.
El segimiento del signo slo es posible en situaciones en las que el EC tiene una localizacin
precisa y puede ser "seguido". Cuando el EC es un sonido no provoca la aproximacin a la
fuente y s el acercamiento al comedero. El EC tiene que ser de una modalidad y
configuracin apropiada.
43
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
Otro factor importante es la relacin entre la cantidad de tiempo que el sujeto pasa en el
contexto experimental y la duracin de cada presentacin del EC. Se obtienen mayores
niveles de seguimiento del signo con mayores exposiciones al contexto experimental en
relacin a la duracin EC.
Aprendizaje de aversin al sabor.
El simple acto de comer proporciona numerosas oportunidades de aprendizaje de la
asociacin. La experiencia de aprendizaje de aversin tpica consiste en ingerir una comida
con un sabor muy distinto y posteriormente enfermar. Este emparejamiento, sabor-
enfermedad, puede dar lugar a una aversin condicionada al alimento en un nico ensayo, y el
aprendizaje puede tener lugar incluso si la enfermedad se manifiesta con varias horas de
retraso con respecto a la ingestin de la comida. Otro hallazgo interesante es que el 20%
de las personas que enfermaron estaban seguras de que no lo provoc la comida. Lo que
indica que el aprendizaje de aversin al sabor puede ser independiente de los procesos de
pensamiento racional y que puede ser contrario a las conclusiones de una persona sobre la
causa de su enfermedad.
Personas con malestar gstrico producidos por tratamientos mdicos, como en
quimioterapia del cncer que suele producir nuseas, pueden adquieren aversiones a los
alimentos ingeridos justo antes de las sesiones, contribuyendo a la falta de apetito, a la
supresin de la ingesta de alimento o anorexia.
El desarrollo de tumores, depresiones severas y la anorexia nerviosa, entre otras, pueden
contribuir a incrementar la probabilidad de aprender aversin al sabor.
La aversin al sabor es el resultado del emparejamiento de un EC (un sabor) con un EI (malestar: una droga o exposicin a
radiacin) similar a otros ejemplos de condicionamiento clsico, y sigue las mismas leyes de aprendizaje en muchos aspectos.
Tambin tiene caracteristicas especiales:
Primero, puede aprenderse con un solo ensayo aversin al sabor por el emparejamiento del sabor y la enfermedad.
Segundo, puede darse despus de varias horas de la exposicin al nuevo sabor. Probablemente sea un aprendizaje
demorado de la aversin al sabor que ha evolucionado para permitir a os animales evitar alimentos venenosos con
efecto retardado.
44
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
Procedimientos de Condicionamiento Pavloviano Excitatorio(pgina 74 del libro)
Procedimientos tpicos de condicionamiento pavloviano.
Uno de los factores crticos que determinan el curso del condicionamiento clsico es la
ordenacin temporal del EC y el EI. Pequeas variaciones en la forma de emparejarlos
pueden tener importantes efectos en la intensidad de la RC.
A continuacin se muestran cinco procedimientos comunes de condicionamiento clsico.
La distancia horizontal representa el paso del tiempo; el desplazamiento vertical el momento en ue cada estmulo aparece y
desaparece. Cada configuracin EC y EI representa un nico ensayo de condicionamiento.
Tiempo
Inicio Final
EC
Condicionamiento
de demora corta EI
EC
Condicionamiento
de huella EI
EC
Condicionamiento
de demora larga EI
EC
Condicionamiento
simultaneo EI
EC
Condicionamiento
hacia atrs EI
Procedimiento de condicionamiento
clsico en el que el estmulo
condicionado aparece poco antes
del estmulo incondicionado en
cada ensayo de condicionamiento.
Procedimiento de condicionamiento
clsico en el que el estmulo
incondicionado se presenta poco
despus de que haya terminado el
estmulo condicionado.
Similar al procedimiento de
condicionamiento de demora corta,
en que el EC comienza antes que el
EI, sin embargo, EI se demora ms
tiempo (5-10 minutos).
Procedimiento de condicionamiento
clsico en el que el estmulo
condicionado y el incondicionado
se presenta simultneamente en
cada ensayo condicionado.
Procedimiento de condicionamiento
clsico en el que el estmulo
condicionado se presenta en todos
los ensayos despus del estmulo
incondicionado.
45
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
Un experimento tpico de condicionamiento clsico, los episodios EC-EI se repiten varias
veces a lo largo de la sesin de entrenamiento. El tiempo entre el final de un ensayo y el
comienzo del siguiente se llama intervalo entre ensayos. El tiempo entre el comienzo del EC
y el comienzo del EI en un mismo ensayo se llama intervalo entre estmulos o intervalo
EC-EI.
Medida de las respuestas condicionadas.
Para poder medir el condicionamiento, en cualquiera de los procedimientos anteriores, hay
que realizar un ensayo de prueba, consistente en la presentacin del EC aislado (sin el EI) y
observar la respuesta del EC sin la contaminacin procedente de la respuesta provocada por
el EI. Estos ensayos pueden introducirse periodicamente a lo largo del curso del
entrenamiento para hacer un seguimiento del proceso de aprendizaje.
La conducta EC puede cuantificarse:
Por la magnitud de la respuesta condicionada (Pavlov midi en nmero de gotas de
saliva elicitada por un EC).
Por la probabilidad de la respuesta (en estudios de condicionamiento palpebral, el
porcentaje de ensayos en los que el EC provoca una respuesta condicionada).
Por latencia de la respuesta (es la cantidad de tiempo que pasa entre el principio del EC
y la aparicin de la respuesta condicionada).
En procedimientos de demora y huella, el EC aparece de forma aislada al principio de cada
ensayo, por lo que puede utilizarse como medida del aprendizaje al no estar contaminada
por el EI. Por el contrario, ensayos de condicionamiento simultneo y hacia atrs la
respuesta durante el EC puede reflejar presencia del EI o su presentacin reciente. Por
tanto, los ensayos de prueba resultan cruciales para evaluar el aprendizaje en estas dos.
Procedimientos de control en el condicionamiento clsico.
Un ensayo de prueba vlido no es suficiente para tener evidencias concluyentes de
condicionamiento clsico. En los estudios de habituacin y sensibilizacin tan slo eran de
inters los efectos de exposicin previa al un estmulo. El procedimiento de comparacin o
control consista en la ausencia de exposicin al estmulo. Cuando el estudio es la forma en
la que se asocian los EC y EI, los procedimientos de control son ms complicados.
Una asociacin EC-EI implica que dos eventos se han conectado de alguna forma. Despus
EC adquiere la capacidad de activar procesos relacionados con el EI. Requiere algo ms que
una familiaridad. Para concluir que se ha establecido asociacin, debemos asegurarnos de
46
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
que el cambio conductual observado no podra haberse producido por la mera presentacin
de EC o del EI por separado.
El incremento en la respuesta podra resultar de la sensibilizacin y no por un proceso
asociativo. La presentacin de un estmulo activador, como la comida a un animal
hambriento, puede incrementar la conducta provocada por un estmulo menos efectivo, tal
como un tono, sin que se haya establecido ninguna asociacin entre los dos estmulos. Por
tanto, el incremento de la respueta que se observa con el emparejamiento repetido del EC y
el EI podra ser, en realidad, el resultado de una mera exposicin al EI. Los casos en los que
la mera exposicin al EI da lugar a respuestas similares a la respuesta condicionada reciben
el nombre de pseudocondicionamiento. Para determinar si la respuesta que se dan ante el
EC representa una asociacin entre EC-EI, en lugar de sensibilizacin debido a la exposicin
a los EC y EI, se requieren procedimientos de control.
Uno de los procedimientos discutidos por los investigadores es el de control aleatorio, en el
que los estmulos condicionado e incondicionado se pesentan en momentos aleatorios uno
respecto al otro. Desafortunadamente hay evidencias de que puede dar lugar a aprendizaje
asociado.
Un procedimiento ms til es el denominado control desemparejado explcito, que consiste
en la presentacin de los estmulos condicionados e incondicionado en diferentes ensayos,
pero con el suficiente espacio temporal para evitar que se asocien.
Eficacia de los procedimientos tpicos de condicionamiento.
En general, se ha observado poco condicionamiento en los procedimientos de
condicionamiento simultneo, en los que el intervalo EC-EI es cero. Una ligera demora de la
presentacin EI tras el EC a menudo facilitaba la Respuesta Condicionada. Sin embargo, si
el intervalo se incrementaba ms, la RC disminua. Incluso en el procedimiento de aversin al
sabor, donde el aprendizaje es posible con intervalos de 1 2 horas, la RC disminuye a
medida que se aumente el intervalo.
Se consolida la idea de que el condicionamiento es ms efectivo cuando el EC es una buena
seal de que EI aparecer pronto. El valor de la seal es mejor en el procedimiento de
demora corta, en el que el EI tiene lugar poco despus de la aparicin del EC. El valor de la
seal EC disminuye a medida que se incrementa el intervalo EC-EI. Tambin el EC es mal
predictor del EI en los procedimientos simultneo y de huella. El procedimiento simultneo
se presenta el EC junto con EI y por tanto EC no seala la paricin del EI. En el intervalo de
huella el EC va seguido por el intervalo de huella en lugar del EI.
47
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
El condicionamiento hacia atrs produce resultadoa ambiguos. Algunos han observado
condicionamientos excitatorio y otros de tipo inhibitorio, mientras que otros encontraron
excitatorios e inhibitorio.
Nuevas tendencias emergentes sobre los procedimientos de demora, simultneo, de huella y
hacia atrs, conceptualizan que todos ellos producen un aprendizaje slido y una respuesta
condicionada vigorosa, pero lo que los sujetos aprenden es direrente en cada caso. En vez
de aprender una mera asociacin EC-EI, se asume que tambin se aprende cundo aparece
el EI en relacin al EC, denominadose tal fenmeno hiptesis de la codificacin temporal.
La idea es que puede obtenerse diferentes tipos de RC dependiendo de la informacin
temporal acerca del EI que proporciona el EC.
Condicionamiento Pavloviano Inhibitorio (pgina 79 del libro)
La exposicin a estmulos aversivos impredecibles es muy perturbador y produce lceras de
estmago y otros sintomas fisiolgicos del estrs.
Otra fuente de estrs es el ataque de
pnico (sensacin repentina de miedo o
incomodidad, acompaada de sntomas
fsicos -por ejemplo, taquicardia- y una
sensacin de desastre inminente).
Cuando son frecuentes se dice que el
individuo sufre de un trastorno de
pnico y a veces estas personas pueden
predecirlos. En un estudio con estos
individuos se midieron la ansiedad
general de los sujetos antes y despus
de cada tipo de ataque (predecibles e
impredecibles). Antes de los ataques los
niveles de ansiedad eran similares,
despus del ataque de pnico la ansiedad
se incrementaba si este era imprevisto y disminua tras un ataque previsto. Demostrando
que son preferibles los ataque cuando son predecibles.
Las seales que predicen la ausencia de un estmulo aversivo son estmulos condicionados
inhibitorios.
Niveles de ansiedad general de individuos con trastorno de pnico
antes y despus de ataques de pnico previstos e imprevistos.
48
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
Procedimientos de condicionamiento inhibitorio
La inhibicin condicionada tiene un requisito importante, y es que, para que la ausencia de
EI sea significativa, este debe ocurrir peridicamente en la situacin.
Procedimiento estandar de
inhibicin condicionada.
Se requiere dos estimulos
condicionados y dos tipos de
ensayo de condicionamiento, uno
para el condicionamiento
excitatorio y otro para el
condicionamiento inhibitorio.
Ensayo Tipo A (condicionamiento exitatorio): Siempre que aparece el EI va anunciado por el
estimulo condicionado EC+, conviertiendose as por asociacin en una seal del EI y sirve
para proporcionar el contexto excitatorio necesario para el desarrollo de la inhibicin
condicionada.
Ensayo B (condicionamiento inhibitorio): El EC- se presenta en el contexto excitatorio
proporcionado por el EC+, pero no se empareja con el EI. Esto convierte al EC- en un
inhibidor condicionado.
A lo largo del tratamiento, los ensayos se alternan de forma aleatoria. A medida que el
animal recibe ensayos repetidos del EC+ seguido del EI y ensayos del EC+ y el EC- seguidos
de la ausencia de EI, el EC- adquiere gradualmente propiedades inhibitorais.
Ejemplo: Un semforo rojo en un cruce transitado es una seal (EC+) de un peligro potencial
(EI). Sin embargo, si un agente de polica indica con su silbato (EC-) que debemos cruzar, a
pesar de la luz roja, es poco probable que tengamos un accidente y el peligro sealado por el
semforo queda bloqueado o inhibido por silbato.
Contingencia o correlacin
negativa entre el EC y el EI.
Otro procedimiento para
producir inhibicin condicio-
nada que no requiere un estmulo excitatorio EC+ explcito; en lugar de eso, se utiliza un
nico EC- que est negativamente correlacionado con el EI. Una correlacin o contingencia
negativa indica que el EI es menos probable tras el EC que en otro momento.
Procedimiento estndar de inhibicin condicionada. En algunos ensayos (Tipo A)
el EC+ se empareja con el EI. En otros ensayos (tipo B) el EC+ se presenta
junto con el EC- y se omite el EI. El procedimiento resulta efectivo para
condicionar propiedades inhibitorias al EC-.
49
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
El EC seala una reduccin en la probabilidad de que aparezca el EI. Como por ejemplo, Los
nios que se meten con un compaero en clase y dejan de hacerlo en presencia del profesor.
El profesor funciona como EC- que seala un perodo libre de acoso, o ausencia EI.
En el procedimiento de contigencia negativa EC-EI, el EI aversivo puede aparecer de vez en
cuando tras el EC, pero con una probabilidad pequea. Es mucho ms probable que el EI
aversivo aparezca en ausencia del EC, dando lugar a una contingencia negativa entre el EC y
el EI. Sin embargo, incluso en ausencia del EC, el momento exacto de presentacin del EI no
puede predecirse. El EI tiene lugar de forma probabilstica, a diferencia del procedimiento
estndar, en el que el EI siempre aparece al final del EC+ y no aparece cuando se presenta
el EC- junto con el EC+. As podemos predecir el momento preciso de la aparicin del EI, y
tambin permite predecir cundo no va a aparecer, posibilitando la codificacin temporal de
la ausencia del EI.
Medicin de la inhibicin.
Los estmulos inhibitorios elicitan reacciones opuestas a los estmulos condicionados
excitatorios. Si los estmulos condicionados excitatorios provocan salivacin, los estmulos
inhibitorios provocan la supresin de la salivacin.
Sistema de respuesta bidireccionales. La identificacin de tendencias de respuesta
opuesta es sencilla en aquellos sistemas de respuesta que pueden variar en direcciones
opuestas con respecto a una lnea base de ejecucin normal. Por ejemplo, una paloma puede
acercarse a una tecla luminosa asociada con la presentacin subsiguiente de comida o
cuando se utiliza un procedimiento inhibitorio, alejarse de la luz.
Una limitacin es que este mtodo funciona slo con respuestas que pueden ir en
direcciones opuestas. Otra es que esta tcnica puede mostrar slo el efecto neto de la
excitacin y la inhibicin. El sujeto se aproxima a EC si excitacin es mayor a la inhibicin
y se aleja en caso contrario. La paloma no puede acercarse y alejarse al mismo tiempo. Esto
invalida el procedimiento para los casos en que EC adquiere ambas propiedades (exitatorias
e inhibitorias)
La prueba del estmulo compuesto o sumacin. Cuando la conducta no es bidireccional el
procedimiento ms aceptado por los investigadores para la medicin de la inhibicin
condicionada es la prueba de sumacin o del estmulo compuesto. La prueba requiere
observar los efectos de un EC inhibitorio en compuesto con un EC+ exitatorio.
50
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
Experimento de lameteo con ratas de laboratorio:
El procedimiento de prueba del estmulo compuesto para la inhibicin condicionada sugiere
que la presentacin de un inhibidor condicionado o de una seal de seguridad puede reducir
los efectos estresantes de una experiencia aversiva.
La prueba de retraso en la adquisicin. Si un estmulo inhibe de forma activa una
respuesta particular, entonces debera ser especialmente difcil de condicionar ese
estmulo para que provoque la conducta.
Prueba del estmulo compuesto de la inhibicin en un experimento de supresin del lameteo. Los estmulos A y B se
condicionaron como estmulos excitatorios mediante la presentacin de cada uno de ellos por separado junto con la descarga
(A+ y B+). El estmulo X se condicion como inhibidor presentndolo junto con el estmulo A sin la descarga (AX-). El
estmulo Y era un estmulo de control que no haba intervenido en ningn condicionamiento excitatorio o inhibitorio. A era una
luz brillante. B, X e Y eran claves auditivas ( un clic, un ruido blanco y un zumbador, contrabalanceados). A y AX se pusieron a
prueba con el contexto original de condicionamiento. B, BX y BY se pusieron a prueba en un contexto diferente. (Para detalles
adicionales, vease Cole, Barnet y Miller, 1997, Experimento 1.
51
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
Retomando el experimento anterior, en una cmara experimental diferente a las utilizadas
anteriormente para realizar el entrenamiento inhibitorio, Cole y sus colegas tomaron el
estmulo X (que haba sido condicionado como inhibidor) y el estmulo Y ( que no haba
utilizado con anterioridad en el procedimiento de condicionamiento ) y realizadon una
prueba de retraso en la adquisicin emparejando tres veces cada uno de estos estmulos con
una descarga. Tras los tres ensayos sometiern a prueba para ver cul provocaba una mayor
supresin de la conducta de beber. El tiempo empleado en completar un total de 5 segundos
de ingestin de agua fue mayor en presencia del estmulo de control Y que en presencia del
estmulo X. El entrenamiento inhibitorio inicial de X retras la adquisicin de propiedades
excitatorias de miedo condicionado.
La inhibicin condicionada puede ser difcil de distinguir de otros procesos conductuales. La
mejor estrategia es utilizar ms de una prueba y asegurarse de que las diferentes pruebas
sealan la misma conclusin. La estrategia dual ( utilizacin tanto la prueba de estmulo
compuesto como de la del retraso en la adquisicin) ha gozado de popularidad desde que lo
propuso Rescorla (1969).
PREDOMINIO DEL CONDICIONAMIENTO CLSICO (pgina 86 del libro)
El condicionamiento clsico se estudia normalmente en situaciones de laboratorio, aunque
tambin ocurre en una gran variedad de situaciones fuera de este. Aparece con mayor
probabiliad cuando un evento predice a otro regularmente y con una demora corta entre el
EC y el EI.
Un rea de investigacin particularmente interesante es cmo las personas llegan a
considerar que un evento es la causa de otro, denominado juicios de causalidad humanos. Los
estudios sobre causalidad se parecen a los estudios sobre condicionamiento pavloviano en
que ambos conllevan experiencias repetidas con dos eventos y respuestas basadas en el
grado en que esos dos eventos estn relacionados. Los mecanismos asociativos pavlovianos
no se limitan a los perros de Pavlov, sino que pueden tener un importante papel en los juicios
de causalidad informales que realizamos en el curso de nuestra vida cotidiana.
El condicionamiento pavloviano puede dar lugar al condicionamiento de preferencias y
aversiones alimenticias, adquisicin de miedo (ansiedad, fobias y trastornos del pnico),
tolerancia y adicin a las drogas ...
El condicionamiento pavloviano tambin interviene en las respuestas de los nios y de las
madres durante la lactancia. Para que el amamantamiento sea satisfactorio, la madre debe
mantener al beb en una postura determinada, que proporcione estmulos tctiles especiales
tanto para la madre como para el nio. Los estmulos tctiles que percibe el nio pueden
condicionarse y elicitar respuestas de orientacin y succin. Los estmulos tctiles
52
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
experimentados por la madre que amamanta a sus hijos suelen experimentar el reflejo de
secrecin de lecha cuando el nio llora o cuando llega lahora habitual de amamantamiento.
Todos estos estmulos preceden de forma regular a la succin del beb y por tanto pueden
condicionarse a la estimulacin propia de la succin y adquirir la capacidad de provocar la
secrecin de lecha como respuesta condicionada. Las respuestas anticipatorias de
orientacin y succin y la respuesta anticipatoriade secrecin de leche hace que la lactancia
sea ms satisfactoria tanto para la madre como para el nio.
El condicionamiento pavloviano tambin es importante en el aprendizaje acerca de
situaciones sexuales. Estudios realizados con animales machos y como estmulo condicionado
la visin de una hembra sexualmente receptiva o el acceso a una hembra, los sujetos acaban
aproximandose a los estmulos que sealan la disponibilidad de un compaero sexual. La
exposicin a un EC sexual realizan la respuesta copulatoria ms rpidamente, compiten
mejor con otros machos por el acceso a una hembra, muestran ms conducta de cortejo,
liberan una mayor cantidad de esperma y muestran un incremento en los niveles de
testosterona y hormona luteinizante. Incluso incrementan el nmero de cras en algunas
especies de peces y codornices estudiadas.
COMENTARIOS FINALES
En este Captulo se ha continuado el estudio sobre la conducta elicitada desplazando la
atencin de la habituacin y la sensibilizacin al condicionamiento clsico, ms complejo, ya
que est mediada por mecanismos asociativos. El condicionamiento clsico es una de las
principales tcnicas para investigar cmo se aprenden las asociaciones y pueden intervenir
en muchos aspectos importantes de la conducta. Dependiendo del procedimiento empleado,
el aprendizaje puede tener lugar de manera rpida o lenta. Con algunos procedimientos, se
aprenden tendencias de respuesta excitatorias y con otros, el organismo aprende a inhibir
una respuesta particular en presencia del estmulo condicionado. El condicionamiento
exitatorio e inhibitorio tiene lugar en muchos aspectos de la experiencia cotidiana y sirve
para mejorar la efectifidad con la que nos enfrentamos a eventos biolgicamente
significativos.
53
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
TRMINOS CLAVE
Aprendizaje de objeto Aprendizaje de asocia-
ciones entre diferente elementos de un objeto.
Automoldeamiento Lo mismo que seguimiento del
signo.
Condicionamiento de demora corta Procedimiento
de condicionamiento clsico en el que el estmulo
condicionado aparece poco antes del estmulo
incondicionado en cada ensayo de condiciona-
miento.
Condicionamiento de huella Procedimiento de
condicionamiento clsico en el que el estmulo
incondicionado se presenta poco despus de que
haya terminado el estmulo condicionado.
Condicionamiento hacia atrs Procedimiento de
condicionamiento clsico en el que el estmulo
condicionado se presente en todos los ensayos
despus del estmulo incondicionado.
Condicionamiento simultneo Procedimiento de
condicionamiento clsico en elque el estmulo
condicionado y el incondicionado se presentan
simultneamente en cada ensayo de condiciona-
miento.
Control aleatorio Procedimiento en el que los
estmulos condicionado e incondicionado se
rpresentan en momentos aleatorios uno con res-
pecto a otro.
Control desemparejado explcito Procedimiento en
el que se presentan tanto el estmulo
condicionado como el incondicionado, pero con el
suficiente tiempo entre ellos como para que no se
asocien el uno del otro.
EC Abreviatura de estmulo condicionado.
EI Abreviatura de estmulo incondicionado.
Ensayo de condicionamiento Episodio de entre-
namiento compuesto por la presentacin de un
estmulo condicionado con ( o sin) un estmulo
incondicionado.
Ensayo de prueba Ensayo en el que se presenta el
estmulo condicionado sin el estmulo incondicio-
nado. Esto permite medir la respuesta condiciona-
da en ausencia de la respuesta incondicionada.
Estmulo condicional o condicionado Estmulo que
inicialmente no provoca una respuesta particular,
pero que adquiere la capacidad de hacerlo como
resultado del desarrollo de una asociacin con un
estmulo incondicionado. Abreviatura EC.
Estimulo incondicional o incondicionado Estmulo
que elicita una respuesta particular sin necesidad
de entrenamiento. Abreviatura EI.
Hiptesis de la codificacin temporal Idea segn
la cual el condicionamiento pavloviano lleva, no
slo al aprendizaje de que el EI ocurre, sino
tambin de cundo ocurre en relacin al EC. El EC
representa ( o codifica) la disposicin temporal
del EI.
Intervalo de huella Intervalo entre el final del
estmulo condicionado y el principio del estmulo
incondicionado en los ensayos de condiciona-
miento de huella.
Intervalo EC-EI Lo mismo que intervalo entre
estmulos.
Intervalo entre ensayos Cantidad de tiempo que
pasa entre dos ensayos consecutivos.
Intervalo entre estmulos Cantidad de tiempo que
pasa entre el comienzo del estmulo condicionado
(EC) y el comienzo del estmulo incondicionado
(EI) durante un ensayo de condicionamiento
clsico. Tambin llamado intervalo EC-EI.
Latencia Tiempo transcurrido entreel comienzo de
un estmulo (o el comienzo de un ensayo) y la
respuesta que se da a ese etmulo.
54
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera
Magnitud de la respuesta Medida del tamao,
vigor o extensin de una respuesta.
Probabiliad de una respuesta Probabilidad de que
se realice una respuesta, normalmente represen-
tada en trminos de porcentaje de ensayos en los
que tiene lugar la respuesta.
Prueba de retraso en la adquisicin Procedimien-
to de prueba que identifica un inhibidor condicio-
nado si ese estmulo tarda ms tiempo en adquirir
propiedades exitatorias que un estmulo de compa-
racin.
Prueba de sumacin Lo mismo que prueba del est-
mulo compuesto.
Prueba del estmulo compuesto Procedimoento de
prueba que sirve para identiricar un inhibidor
condiconado si dicho estmulo reduce a respuesta
elicitada por un estmulo condicionado excitatorio.
Tambin llamado prueba de sumacin.
Pseudocondicionamiento Incremento en la respues-
ta que puede provocar un estmulo cuyas
presentaciones estn entremezcladas con las
presentaciones del estmulo condicionado (EC) sin
que se establezca una asociacin entre el estmulo y
el EI.
RC Abreviatura de respuesta condicionada.
REC Abreviatura de respuesta emocional condicio-
nada.
Respuesta condicional o condicionada Respuesta
que se realiza ante el estmulo condicionado como
resultado del condicionamiento clsico. Abreviatura
RC.
Respuesta emocional condicionada Supresin de
una conducta instrumental positivamente reforzada
(por ejemplo, presin de una palanca para obtener
alimento) provacada por la presentacin de un
estmulo que se ha asociado con un estmulo
aversivo. Abreviatura REC. Tambin llamada
supresin condicionada.
Respuesta incondicional o incondicionada Res-
puesta que provoca un estmulo sin necesidad de
entrenamiento previo.
RI Abreviatura de respuesta incondicionada.
Seguimiento del signo Movimiento hacia un
estmulo que seala la disponibilidad de un reforza-
dor positivo, como comida, y posible contacto con el
mismo. Tambien llamada automoldeamiento.
Supresin condicionada del lameteo Similar a la
respuesta emocional condicionada (REC) o
procedimiento de supresin condicionada. Sin
embargo, en lugar de utilizar la presin de la
palanca para obtener la comida como conducta a
suprimir por el miedo condicionado, la lnea de base
es el lameteo de un tubo con agua por parte de
ratas sedientas. La presentacin de un EC
condicionado al miedo ralentiza la tasa de lameteo.
Supresin condicionada Lo mismo que respuesta
emocional condicionada.
55
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera 2009/2010
A qu deben su eficacia los estmulos condicionados e incondicionados?
- Respuestas iniciales a los estmulos.
- La novedad de los estmulos condicionados e incondicionados.
- Intensidad y saliencia del EC y del EI.
- Relevancia o pertinencia EC-EI.
- El conceto de fuerza biolgica.
Qu determina la naturaleza de la respuesta condicionada?
- El modelo de sustitucin del estmulo.
- Aprendizaje y homeostasis: Un caso especial de sustitucin del estmulo.
- El EC como determinante de la forma de la RC.
- Conducta condicionada y sistemas de conducta.
- Aprendizaje E-R frente a aprendizaje E-E.
Cmo se asocian los estmulos condicionado e incondicionado?
- El efecto de bloqueo.
- El modelo de Rescola y Wagner.
- Otros modelos de condicionamiento clsicos.
Comentarios finales
57
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
A qu deben su eficiacia los estmulos condicionados e
incondicionados? (pgina 91 del libro)
Esta es quiz la pregunta ms importante en relacin al condicionamiento clsico. Planteada
originalmente por Pavlov y tambin en la actualidad est recabando cada vez ms la atencin
de los investigadores.
Respuestas iniciales a los estmulos.
Segn defini Pavlov los trminos condicionado e incondicionado: un estmulo condicionado
(EC) inicialmente no provoca la respuesta condicionada, pero adquiere la capacidad de
hacerlo como resultado del desarrollo de una asociacin con el estmulo incondicionado (EI).
Por el contrario, el EI elicita eficazmente la respuesta en custin desde el principio, sin
ningn entrenamiento previo.
La comparacin de los ECs y de los EIs son relativas, pues en un evento particular puede
servir de EC respecto a un estmulo y de EI respecto a otro. Una exposicin salina en un
experimento de aversin al sabor actua como EC y la droga que produce el malestar como
EI; mientras que en un experimento de seguimiento del signo la exposicin salina se podra
considerar como EI y la luz el EC. Por tanto, el que la sacarina se considere un EC o un EI
depende de su relacin con otros estmulos de la situacin.
La novedad de los estmulos condicionados e incondicionados.
Tanto si el estmulo condicionado como el incondicionado es familiar, el aprendizaje se
desarrolla con mayor lentitud que si el EC y el EI son novedosos.
Los estudios sobre el papel de la novedad de los estmulos en el condicionamiento clsico
suelen realizarse en dos fases. Primero se expone repetidamente y de forma aislada al
sujeto al estmulo que posteriormente va a utilizarse como EC y despus se empareja con un
EI segn el condicionamiento clsico. La familiarizacin que se produce por la exposicin
incial retrasa el condicionamiento posterior de dicho estmulo. Este fenmeno se denomina
efecto de preexposicin al EC o efecto de inhibicin latente.
La habituacin y efecto de preexposicin al EC sirven para limitar la cantidad de
procesamiento y atencin a los estmulos que se sabe carecen de consecuencias.
El mismo proceso realizado con EI han dado similares resultados. Los sujetos familiarizados
con un EI antes de su emparejamiento con EC desarrollan la respuesta condicionada al EC
58
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
ms lentamente que los participantes para los cuales el EI es novedoso. Este resultado se
denomina efecto de preexposicion al EI.
Dos son las explicaciones por parte de los investigadores de los efectos de preexposicion
al EC y al EI. La interferencia asociativa como mecanismo que disminuye la capacidad de los
estmulos para participar en nuevas asociaciones; y otra, la interferencia de memoria en la
que los participantes recuerdan lo sucedido en fase de experimento alterando la respuesta
condicionada. Los mecanismos que reduzcan el recuerdo de preexposicin en el momento de
la prueba fortalecen la respuesta condicionada.
Intensidad y saliencia del EC y del EI.
Otra variable importante para el
condicionamiento clsico es la intensidad de
los estmulos condicionados e incondicionados.
La respuesta es ms fuerte cuanto ms
intenso sean estos.
Un estmulo puede adquirir saliencia o
significacin aumentando su intensidad, lo que
hace que despierte mayor atencin. Por
ejemplo, una rata presta ms atencin a la sal
si sufre un deficit nutricional de sal.
Estudios sobre condicionamiento sexual de la codorniz macho domstica, muestran que se
observa una respuesta sexual condicionada ms intensa utilizando un EC que incluya algunas
de las caractersticas estimulares de la hembra de codoniz.
Relevancia o pertinencia EC-EI.
El aprendizaje depende de la relevancia o adecuacin del EC con respecto al EI que se
administra. El sabor se asocia fcilmente al malestar y las claves audiovisuales se asocian al
dolor perifrico.
condicionamiento
Gustativo + audiovisual Descarga
Gustativo + audiovisual Malestar
El experimento se emparejaron un estimulo audiovisual y un estmulo gustativo, presentados simultaneamente, con una descarga
o con una sensacin de malestar, dependiendo del grupo. Despus los sujetos se pusieron a prueba con los estmulos
gustativos y audiovisuales por separado.
Las ratas condicionadas con una sensacin de malestar adquirieron una mayor aversin a las claves gustativas que las
audiovisuales. Por el contrario, las ratas condicionadas con una descarga adquirieron una mayor aversin a las claves
audiovisuales que a las gustativas.
Objeto utilizados como EC en los estudios sobre
condicionamiento sexual con codornices macho para
sealar la oportunidad de copula. El objeto de la izda. es
"arbitrario" est hecho de un material lanudo. El objeto
de la derecha inlcuye una cabeza y algunas plumas del
cuello de un ejemplar de hembra disecado, de modo que
contenga alguna de las claves que proporciona la hembra.
59
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Se demostr con ratas recien nacidas que la experiencia con sabores o con la enfermedad
(o con las claves audiovisuales y el dao perifrico) no es necesaria para que se d el efecto
de relevancia del estmulo. Ms bien, el fenmeno parece reflejar una predisposicin
gentica para la asociacin selectiva de ciertas combinaciones de estmulos condicionados e
incondicionados.
Se ha documentado otras situaciones del efecto de relevancia del estmulo de aversin al
sabor en palomas que asocian la comida mejor con claves visuales que con auditivas y una
descarga ms efectivas con las auditivas. En cuanto a efectos de relevancia del estmulo en
la adquisicin del miedo en monos, estos parecen que tienen una predisposicin para
aprender a temer a las serpientes de juguete que si lo hacen a flores de plstico. Esta
selectividad de estmulos en el aprendizaje de miedos tambin se muestran en las personas,
cuando participantes en estudios, han asociado fotografas de serpientes y araas con una
descarga con mayor facilidad que fotografas de flores y casas.
Aproximaciones conductuales al control del
tabaquismo
Se han desarrollado diversos procedimientos de
condiciona-miento aversivo para que las personas dejen
de fumar (Hall, Hall y Ginsberg, 1990). Los primeros
intentos consistieron en una terapia aversiva en la que el
acto de fumar se emparejaba con el dolor producido por
una descarga elctrica. Tcnicas ms recientes se basan
en los hallazgos que indican que el condicionamiento de la
aversin es ms efectivo si el estmulo aversivo es
relevante en relacin a la situacin. En estos
procedimientos, suele utilizarse el propio acto de fumar
como fuente de la estimulacin aversiva. Un procedimiento
utilizado frecuentemente es el de inhalacin rpida
(USDHHS, 1996), en el ue se pide al sujeto que inhale
tabaco cada 6 segundos durante un periodo de tiempo
hasta que surja nuseas o mareos. Esta forma de fumar es
aversiva y permite condicionar una aversin al tabaco.
Los procedimiento de condicionamiento aversivo resultan ms
efectivos a la hora de eliminar el tabaquismo si se combinan
con otras tcnicas de modificacin conductual. La inhalacin
rpida, por ejemplo, puede combinarse con un entrenamiento
en autoobservacin o autoadministracin.
Primero se pide al sujeto que mantenga un egistro preciso del
nmero de cigarrillos que fuma, as como del momento, lugar
y circunstancia en las que lo hace. Una vez conocidas la
frecuencia y las circunstancias en las que fuma, se proponen
dos objetivos con los que se pretende reducir gradualmente el
consumo de tabaco: reducir el nmero total de cigarrillos
fumados al da y reducir el nmero de situaciones en las que
se permite fumar. Esta combinacin de objetivos permita
restringir la conducta de fumar. El cumplimiento puede
alentarse utilizando un sistema de contratos. Por ejemplo, la
persona puede depositar una cantidad de dinero al comienzo
del tratamiento y recuperar posiciones de este depsito cada
vez que logre un objetivo.
El concepto de fuerza biolgica
Pavlov sugiri que para que un estmulo se condicionara deba tener una fuerza biolgica
menor que la del estmulo incondicionado con el que se emparejaba. El concepto de "menor
fuerza biolgica" se refera a que inicialmente el EC deba elicitar menos respuestas y ms
dbiles que el EI.
60
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Condicionamiento de orden superior. Un estmulo puede hacer de EI tras haber sido
fuertemente condicionado. Un tono emparejado repetidamente con la comida, elicitar la
salivacin, as como seguimiento del signo. El concepto de fuerza biolgica dice que este
tono debera ser efectivo para condicionar una luz.
El condicionamiento de segundo orden es similar al procedimiento estandar para la inhibicin
condicionada, sin embargo, parece ser el nmero de ensayos no EI es el factor crtico. Con
pocos ensayos no reforzados tiene lugar condicionamiento excitatorio de segundo orden.
Con un entrenamiento ms extenso, se desarrolla inhibicin condicionada.
Con el condicionamiento de orden superior, el condicionamiento clsico puede acontecer sin
un EI primario. El nico requisito es que estn disponibles estmulos previamente
condicionados.
El condicionamiento de segundo orden tambin resulta interesante como tcnica para
confirmar la aparicin de condicionamiento de primer orden, que a veces no provoca
directamente una respuesta condicionada, pero que el EC de primer orden puede elicitar la
respuesta condicionada si es sometido a un condicionamiento de segundo orden.
Condicionamiento de orden superior del miedo
Los miedos irracionales se desarrollan muchas veces por
medio del condicionamiento de oren superior. Por ejemplo,
Woldpe (1990) describe el caso de una mujer que
inicialmente tena miedo a las multitudes. Aunque se
desconoce cmo se condicion este miedo, las multitudes
haban adquirido la capacidad de elicitar miedo. Para evitar
el surgimiento del miedo, la mujer iba al cine slo en el
momento del da en el que haba poca gente. En una de
tales visitas, el cine se llen repentinamente de estudiantes.
La mujer qued muy afectada por esta experiencia y asoci
los cines con las multitudes. As pues, como consecuencia
del condicionamiento de orden superior, un estmulo
condicionado al miedo (las multitudes) haba condicionado
elmiedo a otros estmulos (cines) que previamente
resultaban inocuos. El aspecto destacable de esta
experiencia es que se adquiri aversin a los estmulos del
cine sin que estas claves se hubieran emparejado
directamente con un estmulo incondicionado aversivo.
Despus de esta terrible experiencia con el cine, la mujer
evitaba ir al cine incluso cuando era poco probable que se
encontrara con mucha gente. Adems, el miedo a los cines
recin adquirido se generaliz a otros lugares pblicos, tales
como restaurantes, iglesias y edificios pblicos, que tambin
evitaba incluso si estaban vacos.
El trmino orden superior, puede considerarse el condicionamiento como si operase en diferentes niveles. El emparejamiento
del tono con la comida se considera condicionamiento de primer orden; El emparejamiento de la luz con el tono
previamente condicionado sera el condicionamiento de segundo orden; y si la luz se usara para condicionar otro estmulo,
por ejemplo, un olor, se tratara de condicionamiento de tercer orden.
61
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Contracondicionamiento. Dos estmulos pueden quedar asociados aunque ambos eliciten
inicialmente respuesta intensas. La respuesta que un animal da a un EC se invierte o
contrarresta emparejando ese estmulo con un EI que provoca una reaccin opuesta. Por
ejemplo, un animal puede condicionarse para aproximarse a un estmulo que anteriormente
evitaba.
Precondicionamiento sensorial. Tambin pueden aprenderse asociaciones entre dos
estmulos que tan slo elicitan una dbil respuesta de orientacin antes de
condicionamiento. Por ejemplo, el emparejamiento del sabor de vainilla y canela quedan
asociados el uno del otro en los pasteles. Una aversin a la canela por medio de
envenenamiento, nos llevar a rechazar tambin pasteles con sabor a vainilla.
Qu determina la naturaleza de la respuesta condicionada?
(pg. 100 del libro)
El modelo de sustitucin del estmulo
Segn el modelo de sustitucin del estmulo de Pavlov, el EC adquiere la capacidad de
funcionar de forma similar a como el EI lo haca previamente, asumiendo, que el EC activa
los circuitos neuronales que previamente activaba slo el EI y elicita respuetas similares a
EI.
Pavlov sugiri que el condicionamiento da lugar al establecimiento de nuevos enlaces
neuronales durante los emparejamientos reptidos de EC y EI, desarrollando una nueva
conexin entre los circuitos que previamente activaba el EC y los que previamente activaba
el EI. Establecida la conexin EC se convierte en un sustituto del EI
El EI como factor determinante de la RC. EC diferentes elicitan respuetan condicionadas
diferentes. La comida elicita salivacin y aproximacin; las descargas elicitan aversin y
alejamiento. Si el condicionamiento convierte al EC en un sustituto del EI, entonces los Ecs
condicionados con diferentes EIs deberan provocar diferentes tipos de RC.
El experimento con palomas de Jenkins y Moore (1973) compararon el condicionamiento
pavloviano utilizando como EI comida y agua . Para comer las palomas picotean rpido y
bruco hacia el grano y abren el pico justo antes de tomar contacto con l. Para el beber
introducen el pico casi cerrado en el agua y bajo ella abren periodicamente para succionar.
Las respuestas incondicionadas de comer y beber son diferentes.
62
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
El EC fue la iluminacin de una tecla durante 8 segundos y se emparej tanto para la
presentacin del grano de cereal como con la disposibilidad de agua. La forma de RC se
pareca a la forma de la respuesta incondicionada: El EC condicionado con la comida
provocaba el picoteo relacionado con la comida y el EC condicionado con agua provocaba los
picoteos relacionados con la bebida.
Aprendizaje y homeostasis: Un caso especial de sustitucin del estmulo.
Walter Cannon introdujo el concepto homeostasis para referirse a los mecanismos
fisiolgicos que mantienen los aspectos crticos del cuerpo dentro de los lmites aceptables,
Estos mecanismo funcionaban por procesos de retroalimentacin negativa que servan para
contrarestar las alteraciones una vez que estas ya haban provocado una desviacin de los
niveles optimos. Esto puede resultar ineficiente, especialmente si el proceso de
compensacin o correccin tarda en activarse. Dworking (1993) sealo que las alteraciones
en la homeosteasis pueden compensarse ms activamente si pueden anticiparse. El
condicionamiento pavloviano proporciona los medio necesarios para tal anticipacin.
Las respuetas homeostticas condicionadas se han examinado ms extensamente en
relacin a la forma en que los organismos respondem a la administracin de drogas
psicoactivas. Suelen provocar alteraciones fisiolgicas que afectan a la homeostasis que
activan reacciones compensatorias condicionadas. Las claves que se asocian con la alteracin
fisiolgica inducida por la droga pueden llegar a elicitar estas reacciones compensatorias
como respuestas condicionadas anticipatorias.
El modelo de condicionamiento de tolerancia a las drogas: Se considera que se ha
desarrollado tolerancia a las drogas cuando las administraciones repetidas de las mismas
tiene un efecto cada vez menor. Tradicionalmente se ha considerado esta tolerancia como
debida a procesos farmacolgicos. Shepard Siegel, en contraste ha propuesto un modelo
basado en el condicionamiento clsico, utilizando el concepto de homeostasis aprendida.
El modelo de condicionamiento de la tolerancia a las drogas atribuye la tolerancia a las
respuestas compensatorias condicionadas a los estmulos del entorno que se emparejan con
la administracin de la droga. Una importante prediccin del modelo es que la tolerancia a la
droga se ver atenuada si los sujetos reciben la droga en condiciones novedosas o en
ausencia de las claves que normalmente predicen su consumo. Tambin predice que varios
factores que atenan el desarrollo de las respuestas condicionadas (como la preexposicin
al EC) tambin deberan atenuar el desarrollo de la tolerancia a la droga
63
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
El EC como determinante de la forma de la RC
La forma de la RC tambin esta influenciada por la naturaleza del EC. Timberlake y Grant
(1975) utilizaron comida como EI, el EC fue la presentacin de otra rata justo antes de la
administracin de comida, el EC no porvoco conductas de roer y morder, elicito respuestas
de orientacin, aproximacin y olfateo, asi como contactos de tipo social.
Conducta condicionada y sistemas de conducta
Los diversos sistemas de conductas han evolucionado para permitir al animal llevar a cabo
tareas criticas, tales como obtener y comer el alimento, defender su territorio, evitar a los
depredadores, reproducirse y cuidad sus cras. Cada sistema consiste en una serie de modos
de respuesta, cada uno de ellos con sus propios estimulos y respuestas relevantes,
dispuestos con determinado orden espacial y secuencial.
La teora de los sistemas de conducta asume que la presentacin del EI en un porcedimiento
de condicionamiento pavloviano activa el sistema de conducta relevante para ese EI. Los
estmulos condicionados con comida elictan componentes del sistema de alimentacin y los
estmulos condicionados sexuales elicitan componentes del sistema de conducta sexual.
Una prediccin de la teora de los sitemas de conducta es que la forma de la RC depender
del intervalo EC-EI que se utilice. Este intervalo determina el lugar en que se incorporara el
EC dentro de la secuencia de respuestas del sistema de conducta.
La teora es claramente compatible con el hecho de que la forma de la RC est determinada
por: La naturaleza del (EI) estmulo incondicionado y la naturaleza del (EC) estmulo
condicionado.
Aprendizaje E-R frente a aprendizaje E-E
Historicamente la conducta condicionada se vea como una conducta elicitada directamente
por el EC. De acuerdo con la teora del aprendizaje E-R, establece una nueva conexin
estmulo-respueta entre el EC y la RC. La teora del aprendizaje E-E los sujetos aprenden
una asociacin estimulo-estimulo entre el EC y el EI. Los sujetos responden al EC, no porque
este elicite directamente una RC, sino porque el EC activa una representacin del EI. La
presentacin del EC hace que el sujeto piense en el EI y esta es la causa de la conducta
condicionada.
Un mtodo de investigacin importante para decidir entre aprendizaje E-R y E-E es la de la
devaluacin del EI.
64
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Cmo se asocian los estmulos condicionados e incondicionados ?
(pg. 109 del libro)
El efecto de bloqueo
Conlleva una secuencia de suscesos
similar. Primero se asocia EC (estmulo
A) y el EI. Una vez que el EC
A
esta bien
condicionado, se aade el segundo
estmulo (estmulo B) al estmulo A y se
presentan los dos juntos en los ensayos
de condicionamiento. El hallazgo bsico
es que el condicionamiento previo de A,
bloquea el desarrollo de la RC al
estmulo B.
Este efecto se ha convertido en un
fenmeno clave del condicionamiento
clsico porque puso en duda el
presupuesto de que la contigidad
temporal fuese suficiente para el aprendizaje.
Kamin, su descubridor, explico el efecto proponiendo que para que se produzca aprendizaje
de forma efectiva el EI deba ser inesperado o sorprendente.
El modelo de Rescorla y Wagner
Rescola Wagner asumieron que la sorpresividad, y por tanto le efectividad, de un EI
depende de lo diferente que el EI sea en comparacin con lo que el sujeto espera. Asumen
que la expectativa del EI est relacionada con las propiedades condicionadas o asociativas
del estmulo que precede al EI. Una RC intensa indica una fuerta expectativa de que el EI
aprecer (condicionamiento excitatorio o incremento de la fuerza asociativa); una RC dbil
indica una baja expectativa del EI (condicionamiento inhibitorio o disminucin de la fuerza
asociativa).
EI. del y EC del saliencia la con a relacionad constante
estmulos los de asociativo valor
e aprendizaj de astona

: bsica Ecuacin
:
:
:
) (
k
V
V k V =
Figura 4.13. Esquema del procedimiento de bloqueo.
En la fase 1, el estmulo A se condiciona con el EI para el grupo
experimental, mientras que el grupo de control recibe
presentaciones desemparejadas de A y el EI.
En la fase 2, ambos grupos reciben ensayos de condicionamiento
en los que el estmulo A se presenta a la vez que el estmulo B y
se empareja con el EI.
Una prueba posterior con el estmulo B aislado muestra que el
grupo experimental produce una respuesta condicionada menor
ante el estmulo B que el grupo de control.
65
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Aplicacin del efecto de bloqueo. El modelo de Rescorla y Wagner predicen claramente el
efecto bloqueo. Como se muestra en la Figura 4.13, el grupo experimental de diseo de
bloqueo recibe primero un condicionamiento extenso del estmulo A, de forma que adquiere
una expectativa de que el EI ocurrir siempre que se presente el estmulo A. Cuando
finaliza la fase 1, V
A
es igual a la asntota de aprendizaje o ) ( =
A
V . En la fase 2, el
estmulo B se presenta junto con el estmulo A, y ambos van seguido del EI. De acuerdo con
el modelo Rescorla-Wagner, no habr condicinamiento del estmulo B en la Fase 2, ya que el
EI es perfectamente predecible por la presencia del estmulo A: 0 ) ( =
+B A
V
El grupo de control recibe un tratamiento idntico en la Fase 2, pero para ellos la presencia
del estmulo A no lleva a unaexpectativa del EI y por tanto es sorprendente para el grupo
de control y produce nuevo aprendizaje.
Perdida de valor asociativo a pesar de los emparejamientos con el EI. Gran parte de la
importancia del modelo se debe a sus inusuales predicciones. Una de tales predicciones es
que, en ciertas circunstancias, las propiedades condicionadas de los estimulos se reduciran
a pesar de que siga habiendo emparejamientos con el EI.
el EI
1
Inhibicin condicionada. La aplicacin del modelo de Rescorla y Wagner a este
procedimiento requiere que se consideren separadamente los ensayos reforzados y los no
reforzados. Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirir
propiedades excitatorias. El condicionamiento excitatorio conlleva la adquisicin de una
valor asociado positivo, y cesa una vez que el organismo predice el EI perfectamente en
cada ensayo.
En cada ensayo aparecen tanto el EC+ como el EC-. Una vez que el EC+ ha adquirido cierto
grado de excitacin condicionada (debido a su presentacin en los ensayos reforzados), el
organismo esperar que se presente el EI siempre que aparezca el EC+, incluyendo los
ensayos no reforzados. Sin embargo, el EI no ocurre en los ensayos no reforzados, por lo
que se trata de un caso de expectativa excesiva. Para predecir con exactitud la ausencia del
EI en los ensayos reforzados, los valores asociativos del EC+ y del EC- tienen que sumar
Fase 1 Fase 2
A EI
[A + B] EI
B EI
Prdida de valor asociativo a pesar de las presentacin continuada del EI. Los estmulos A y B se condicionan separadamente
hasta llegar a la asntota en la Fase 1, de modo que cada EC sea capaz de predecir el EI perfectamente. En la Fase 2, los
estmulos A y B se presentan simultneamente y se emparejan con el mismo EI utilizando en la Fase 1. Esto produce una
expectativa excesiva del EI. Dado que el EI es sorprendentemente pequeo al principio de la Fase 2, las propiedades
condicinadas de los estmulos A y B se reducen hasta que la presentacin simultnea de los dos ECs deja de producir un
exceso de expectativas.
66
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
cero (valor que representa la ausencia de EI). Para lograrlo, como el EC+ tiene un valor
asociativo positivo, la nica forma es hacer que el valor asociativo del EC- sea negativo. El
modelo Rescola-Wagner explica la inhibicin condicionada asumiento que el EC- adquiere un
valor asociativo negativo.
Extincin de la excitacin y de la inhibicin. En un procedimiento de extincin, el
estmulo condicionado se presenta repetidamente sin el EI. Si un EC ha adquirido
propiedades excitatorias (EC+) habr un exceso de expectativa del EI la primera vez que el
EC se presente sin el EI en la fase de extincin. Al continuar con los ensayos del EC solo, la
expectativa elicitada por el EC se va acercando a la lnea que representa la ausencia del EI
por medio de una reduccin gradual del valor asociativo del EC+ hasta llegar a cero.
El modelo de Rescola y Wagner prdice un situacin similar para la extincin de la inhibicin
condicionada. Al principio de la extincin, el EC- tiene valor asociativo negativo, esto puede
considerarse una prediccin excesivamente baja del EI; el organismo predice un EI con un
valor menor del valor cero con el que de hecho aparece le EI. Para ajustar las expectativas
a la ausencia del EI, el valor asociativo negativo del Ec- se va perdiendo gradualmente y el
EC- termina con una fuerza asociativa igual a cero.
Problemas del modelo Rescorla Wagner.
1- Su anlisis de la extincin de la inhibicin es incorrecto. Algunos investigadores
han encontrado que no reforzar un EC- de forma repetida puede potenciar sus propiedades
inhibitorias.
2- El modelo considera la extincin como lo opuesto a la excitacin, o a la vuelta a un
valor asociativo cero, pero la extincin no debera verse como una mera inversin de la
adquisicin. La extincin parece involucrar el aprendizaje de una nueva relacin entre el EC
y el EI.
3- En ciertas condiciones el mismo EC puede tener tanto propiedades excitatorias
como inhibitorias, en el modelo no pueden ser ambos.
4- El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los
paradigmas de avesion al sabor y olor. En experimentos similares al de efecto de bloqueo,
cabria esperar que la presencia del EC previamente condicionado interfiriera en el
condicionamiento del EC aadido en la fase 2. Se encontr el resultado opuesto: un efecto
de aumento o de contrabloqueo.
67
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Otro modelos de condicionamiento clsico
Modelos atencionales de condicionamiento. Las teoras atencionales difieren en sus
supuestos sobre que es lo que determina la saliencia del EC en un ensayo. Pearce y Hall
(1980) asumen que el grado de atencin que un animal presta al EC en un ensayo
determinado depende del grado en el que el EI haya sido sorprendente en el ensayo
anterior, y por tanto an tiene mucho que aprender y prestarn ms atencin al EC en el
siguiente ensayo. Por el contario, si un EC iba seguido de un EI esperado en el ensayo
anterior, el sujeto prestar menos atencin a ese EC en el siguiente ensayo, asumiendo que
un EI esperado reduce la saliencia o la atencin dedicada al EC.
Una caracteristica importante de la teoras atencionales es que asumen que la sorpresividad
del EI en un ensao determinado altera el grado de atencin dedicado al EC en los ensayos
siguientes. Esta es una diferencia importante con Rescorla Wagner que asumen que la
sorpresividad del EI en un ensayo determina lo que se aprende en ese ensayo.
El supuesto de que el EI presentado en un ensayo slo afecta a lo que se aprende en el
siguiente ensayo ha permitido explicar ciertos hallazgos, pero tambin tienen dificultades
con otros, como los del experimento de bloqueo en el primer ensayo de la Fase 2 del
experimento de bloqueo.
Factores temporales y respuesta condicionada. Ni el modelo de Rescola y Wagner ni los
modelos modificacin del EC fueron diseados para explicar los efectos del tiempo sobre el
condicionamiento, pese a que el tiempo es un factor crtico. Una variable temporal
importante es el intervalo EC-EI. La respuesta condicionada es inversamente proporcional al
intervalo EC-EI o duracin del EC. Por encima de un punto ptimo los procedimientos con
intervalos EC-EI ms largos producen menos respuestas.
Otra variable temporal importante es el intervalo entre ensayos. En general en ensayos ms
separados entre si, mayor respuesta condicionada. Mas interesante resulta que el intervalo
entre ensayos y la duracin del EC interactuan a la hora de determinar la respuesta.
Numerosos ensayos han mostrado que el factor crtico es la duracin relativa de estas dos
variables temporales, ms que el valor absoluto de las mismas.
Se han ofrecido varias interpretaciones sobre por qu la respuesta condicionada esta tan
fuertemente determinada por la razn IEE/DE (intervalo entre ensayos/duracin del
ensayo). Una de las primeras explicaciones fue la hiptesis de espera relativo, que supone
que un EC proporciona informacin acerca de la aparicin del EI slo si el sujeto tiene que
pasar menos tiempo esperando al EI que cuando esta simplemente expuesto al contexto
experimental.
68
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Cuando la Razn IEE/ED es baja, el tiempo de espera ante el EC es similar al tiempo de
espera en el contexto. En este caso, el EC proporciona poca informacin adicional sobre el
momento de aparicin del EI y no se desarrollara mucha respuesta condicionada. Por el
contrario, cuando la razn IEE/ED es alta, el tiempo de espera ante el EC es mucho menor
que el tiempo de espera en el contexto. Esto hace que el EC aporte informacin sobre el
momento que aparece el EI, y la respuesta condicionada ser mas fuerte.
La hiptesis del comparador. R.Miller. Se parece a la hiptesis del tiempo de espera
relativo, en que asume que la respuestas condicionadas depende no slo de la asociacin
entre el EC y EI, sino tambin de todas las posibles asociaciones que puedan establecerse
en claves contextuales y el EI. La fuerza asociativa de otras claves presentes durante el
entrenamiento con el EC crtico es especialmente importante. Otra restriccin del modelo
del comparador es que slo permite asociaciones excitatorias con el EI. El modelo asume
que el que la RC refleje excitacin o inhibicin est determinado por la fuerza relativa de la
excitacin condicionada al EC en comparacin con la excitacin condicionada a las claves
contextuales presentes durante el entrenamiento del EC.
La hiptesis hace ms hincapi en las asociaciones que en el tiempo. Asume que los sujetos
aprenden tres asociaciones en el curso del condicionamiento:
1 Une el EC crtico con el EI.
2 Une el EC crtico con las claves contextuales de comparacin .
3 Une los estmulos de comparacin y el EI.
Cuando se presenta el EC este activa la representacin del EI tanto directamente (asoc 1)
como indirectamente (asoc 2 y3). La comparacin de las activaciones directa y indirecta del
EI determina el grado de respuesta excitatoria o inhibitoria que tendr lugar.
Esta hiptesis no indica cmo se establecen las asociaciones, es una teora de la ejecucin.
Un importante corolario es que la comparacin entre asociaciones EC-EI y el contexto-EI se
realiza en el momento de la prueba. Predice que la extincin de la asociacin contexto EI
despus del entrenamiento del EC potenciara la respuesta al EC crtico.
Principal contribucin ha sido su nfasis en que las diferencias en la respuesta condicionada
pueden reflejar diferencias en la ejecucin ms que en el aprendizaje, considera el efecto
bloqueo como un fallo en la ejecucin, Predice que la extincin del estimulo bloqueador
elevara la RC al EC bloqueado
Tambin se ha puesto a prueba en estudios sobre inhibicin condicionada. El modelo le
atribuye la inhibicin condicionada a situaciones en las que se asocia el EC crtico con el EI
es ms dbil que la asociacin de las claves contextuales con el EI. En este caso, las claves
69
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
contextuales son estmulos que proporcionan el contexto excitatorio necesario para el
condicionamiento inhibitorio. Curiosamente predice que la extincin de estos estmulos
condicionados excitatorios tras el condicionamiento inhibitorio reducira la respuesta
inhibitoria. Por tanto, la hipotesis del comparador es la nica que predice que la extincin de
la inhibicin condicionada se logra de forma ptima, no presentando el EC- aislado, sino
extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el
condicionamiento inhibitorio del EC-.
El modelo predice tambin que incrementar el valor excitatorio de las claves contextuales
tras el tratamiento (Asoc. 3) reducir la respuesta condicionada del EC crtico. No se ha
conseguido confirmar esta prediccin.
Una de sus principales contribuciones ha sido su nfasis en que la diferencias en la
respuesta condicionada puede reflejar diferencias en la ejecucin ms que en el
aprendizaje. El bloqueo lo considera como un mero fallo en la ejecucin ms que en el
aprendizaje. Predice que la extincin del estmulo bloqueador tras el entrenamiento elevar
la respuesta condicionada al EC bloqueado.
Visin general de las alternativas tericas. Cada uno de los modelos que se han descrito
hace hincapi en un aspecto diferente del condicionamiento clsico. La hiptesis del tiempo
de espera relativo se centre en un pequeo conjunto de fenmenos relacionados con la
distribucin temporal de los estmulos condicionados e incondicionados, a pesar de que su
antecesora (la teora de la expectativa escalar) tiene un alcance mucho mayor.
La hiptesis del comparador tambin es ambiciosa, pero es una teora de la ejecucin ms
que del aprendizaje y, por toanto, no explica como se adquieren las asociaciones.
Los modelos atencionaes hacen referencia al mismo tipo de fenmeno que el modelo
Rescorla-Wagner, pero comparten algunas de sus limitaciones.
Todos estos modelos han sido importantes en tanto que han dirigido nuestra atencin a
aspectos previamente ignorados del condicionamiento clsico. Ninguno de ellos ha llegado a
dominar el estudio del condicionamiento clsico e la misma forma que el modelo Rescorla-
Wagner lo hizo en los setenta.
70
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Comentarios finales (pg. 122 del libro)
Inicialmente, algunos psiclogos consideraron el condicionamiento clsico como un tipo de
aprendizaje relativamente simple y primitivo que intervena slo en la regulacin de
respustas glandulares y vecerales como la salivacin. Se asuma que el establecimiento de
las asociaciones EC-EI tena lugar automticamente con los emparejamientos del EC y el EI.
Debido a la naturaleza simple y automtica del condicionamiento y a que se crea que estaba
limitado a las respustas glandulares y vicerales, no se consideraba que fuera importante a la
hora de explicar la complejidad y riqueza de la experiencia humana. Claramente, esta visin
del condicionamiento clsico resulta insotenible en la actualidad.
La investigacin revisada de los Captulos 3 y 4 muestra que el condicionamiento clsico
involucra numerosos procesos complejos y est implicado en el control de una gran variedad
de respuestas, desde la conducta emocional hasta las respuestas de aproximacin y
evitacin. Adems, el aprendizaje no ocurre de forma automtica por el mero
emparejamiento de un EC con un EI. Depende de la experiencia previa del organismo con
cada uno de estos estmulos, de la presencia de otros estmuos durante los ensayos de
condicionamiento y del grado con que el EC y el EI sean mutuamente relevantes. Adems, los
procesos de condicionamiento clsico no se limitan a emparejamientos EC-EI. Tambin
pueden desarrollarse asociaciones entre dos eventos sin significacin biolgica
(precondicionamiento ensorial), en ausencia de un estmulo incondicionado (condicionamiento
de orden superior) o en ausencia de un estmulo condicionado convencional
(contracondiconamiento).
Debido a estas y otras complejidades de los procesos de condicionamiento clsico, es un
error ignorar el condiconamiento clsico al tratar de explicar formas complejas de
comportamiento. La riqueza de los mecanismos del condicionamiento clsico los convierte en
relevantes en relaicn a la riqueza y complejidad de la experiencia humana.
71
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Trminos clave
Aprendizaje E-E Aprendizaje de una asociacin
entre dos estmulos, con el resultado de que la
exposicin a uno de los estmulos adquiere la
capacidad de activar una representacin o
imagen mental del otro estmulo. Tambin
llamado aprendizaje estmulo-estmulo.
Aprendizaje E-R Aprendizaje de una asociacin
entre un estmulo y una respuesta, con el
resultado de que el estmulo adquiere la
capacidad de provocar la respuesta. Lo mismo
que aprendizaje estmulo-respuesta.
Aprendizaje estmulo-estmulo Lo mismo que
aprendizaje E-E.
Aprendizaje estmulo-respuesta Lo mismo que
aprendizaje E-R.
Condicionamiento de orden superior Procedimien-
to en el que se utiliza un estmulo previamente
condicionado (EC
1
) para condicionar un nuevo
estmulo (EC
2
)
Contracondicionamiento Procedimiento de condi-
cionamiento que invierte la respuesta
condicionada con anterioridad a un estmulo. Por
ejemplo, un animal puede condicionarse para
aproximarse aun estmulo que anteriormente
evitaba.
Devaluacin del EI Reduccin el atractivo de un
es-tmulo incondicionado, normalmente obtenida
mediante la aversin o la saciedad.
Efecto de aumento Facilitacin en el condiciona-
miento el un estmulo novedoso debido a su
condicionamiento junto a un estmulo previa-
mente condicionado. Tambin llamado efecto de
contrabloqueo.
Efecto bloqueo Interferencia en el
condicionamien-to de un nuevo estmulo debida a
la presencia de un estmulo previamente
condicionado.
Efecto de contrabloqueo Lo mismo que
aumentacin.
Efecto de inhibicin latente Lo mismo que efecto
de preexposicion al EC.
Efecto de preexposicin al EC Interferencia con
el proceso de condicionamiento producida por la
exposicin repetida al estmulo condicionado
antes de los ensayos de condicionamiento.
Tambin llamado efecto de inhibicin latente.
Efecto de preexposicin al EI Interferencia con
el proceso de condicionamiento producida por la
exposicin repetida al estmulo incondicionado
antes de los ensayos de condicionamiento.
Hiptesis del comparador Idea segn la cual la
respuesta condicionada depende de una
comparacin entre la fuerza asociativa del
estmulo condicionado crtico (EC) y la fuerza
asociativa de otras claves presentes durante el
condicionamiento del EC crtico.
Hipotesis del tiempo de espera relativo Idea
segn la cual la respuesta condicionada depende
de cunto tiempo tenga que esperar el
organismo para el estmulo incondicionado (EI)
en presencia del estmulo condicionado (EC), en
comparacin con el tiempo que tenga que
esperar para el EI en la situacin experimental
independientemente del EC.
Homeostasis Concepto introducido por Walter
Cannon para referirse a los mecanismos
fisiolgicos que permiten mantener los aspectos
corporales crticos (tales como los niveles e
azcar en sangre o la temperatura) dentro de
ciertos lmites. El nivel homeosttico suele
lograrse mediante la accin de mecanismos de
retroalimentacin negativa que permiten
contrarrestar el efecto de los cambios en el
nivel homeosttico.
Precondicionamiento sensorial Procedimiento en el
que un estmulo biolgicamente dbil (EC
2
) se
empareja repetidamente con un estmulo
biolgicamente dbil (EC
1
). Despus, el EC
1
se
condiciona con un estmulo incondicionado. En un
ensayo de prueba posterior, el EC
2
tambin
nunca se haba emparejado directamente con el
estmulo incondicionado.
72
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera
Respuesta homeosttica condicionada Respuesta
condicionada que se parece a las reacciones
homeostticas incondicionadas que elicita un
estmulo incondicionado.
Saliencia del estmulo Significacin o percep-
tibilidad de un estmulo para el organismo. En
general, el aprendizaje avanza ms rpido con
estmulos condicionados e incondicionados ms
salientes.
Sustitucin del estmulo Idea terica segn la
cual el resultado del condicionamiento clsico es
que el organismo responde al estmulo
condicionado de la misma manera que responda
previamente al estmulo incondicionado.
Tolerancia a las drogas Reduccin en la
efectividad de una droga como resultado del
consumo repetido de la misma.
73
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera 2009/2010
Primeras investigaciones sobre el condicionamiento instrumental
Aproximaciones modernas al estudio del condicionamiento instrumental
- Procedimientos de ensayo discreto
- Procedimientos de operante libre
Procediminetos de condicionamiento instrumental
Elementos fundamentales del condicionamiento instrumental
- La respuesta instrumental
- El reforzador instrumental
- La relacin respuesta-reforzador
Contigidad y contingencia: Comentarios finales
75
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
En este captulo se vuelve la vista al anlisis de las situaciones de aprendizaje en las cuales
los estmulos a los que un organismo se enfrenta son el resultado directo de su conducta,
descrita como dirigida a una meta.
La conducta que sucede debido a que ha servido previamente como instrumento para
producir ciertas consecuencias se denomina conducta instrumental.
Primeras investigaciones sobre el condicionamiento instrumental.
(pgina 125 del libro)
Los anlisis tericos y de laboratorio del condicionamiento instrumental comenzaron
formalmentecon el trabajo de thorndike. Su intencin original era estudiar la inteligencia
animal. Estudio la cuestin planteada por Darwin sobre que capacidades intelectuales
humanas estaban presentes en los animales mediante investigacin emprica, para ello
invento una serie de cajas problema donde introduca un gato hambriento con algo de
comida fuera de la vista del animal. Su tarea era aprender a salir de la caja y obtener la
comida.
La cuidadosa aproximacin empirica de Thorndike fue un avance significativo en el estudio
de la inteligencia animal. Otra contribucin importante fue la estricta evitacin de
interpretaciones antropomrficas de la conducta observada. En lugar de ello, interpreto los
resultados de sus estudios como el reflejo del aprendizaje de una asociacin E-R. A medida
que la asociacin o conexin entre las claves de la caja y la respuesta con xito se hacia mas
fuerte, el gato llegaba a realizar esta de forma ms rpida. La consecuencia de la respuesta
exitosa fortaleca la asociacin entre los estimulos de la caja y esa respuesta.
Sobre la base de eta investigacin, Thorndike formulo la ley del efecto: si una respuesta
en presencia de un estimulo es seguida por un suceso satisfactorio, la asociacin E-R se
fortalece, si es seguida por un suceso molesto, se debilita. Esta ley implica un aprendizaje
E-R.
76
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
Aproximaciones modernas al estudio (pgina 125 del libro)
del condicionamiento instrumental.
Thorndike utiliz 15 cajas problemas diferentes en sus investigaciones que requeran
diferentes manipulaciones para que el gato saliese. Algunas llegaron a ser estndar.
Procedimientos de ensayo discreto
El mtodo es similar al de Thorndike, en el que cada ensayo de entrenamiento acaba con la
retirada del animal del aparato, y la respuesta instrumental se realiza slo una vez durante
cada ensayo.
Similares al mtodo de Thorndike, W.S.Small (1899,1900), introdujo el laberinto en las
investigaciones sobre aprendizaje inspirado en las madrigueras bajo tierra.
Un laberinto muy utilizado es el de forma de T, diseado para estudiar la conducta de
eleccin. La conducta en el laberinto puede cuantificarse midiendo la velocidad de
carrera, que normalmente aumenta con ensayos de entrenamiento repetidos. Otra medida
comn es la latencia, tiempo que tarda el animal en abandonar la caja salida y empezar a
desplazarse por el pasadizo, las latencias se hacen mas cortas a medida que progresa el
entrenamiento.
Procedimientos de operante libre
Ideado por B.F. Skinner, los procedimientos de operante libre permiten al animal que repita
la respuesta instrumental una y otra vez sin restricciones.
Skiner estaba interesado en analizar en el laboratorio una forma de conducta que fuese
representativa de toda la actividad en curso que ocurria de forma natural. La conducta no
se divide como si fueran molculas, por eso propuso el concepto de operante como la forma
de dividir la conducta en unidades medibles con significado.
La tpica caja bsica de Skinner que utilizada para estudiar la conducta opeante libre,
consistia en una pequea cmara que contiene una palanca y un mecanismo que proporciona
un reforzador.
Una respuesta operante, como presionar una palanca, se defina a partir del efecto que
produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se
consideran ejemplos de la misma operante.
77
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
Entrenamiento y moldeamiento al comedero. Hay algunos pasos preliminares para
establecer la conducta de presin de la palanca. En primer lugar, los animales tienen que
aprender cundo esta disponible la comida en el comedero. Esto comprende un
condicionamiento clsico. Tras suficientes emparejamientos del sonido del dispensador con
la entrega de comida, el sonido llega a elicitar una respuesta de seguimiento del signo: el
animal se dirige al comedero y recoge la bolita de comida. Esta fase preliminar se llama
entrenamiento al comedero.
Despus, el organismo esta preparado para aprender la respuesta instrumental requerida.
Si la respuesta no es algo que el animal ya realiza, nunca suceder por si mima, para facilitar
la adquisicin de una nueva respueta operante, al principio, la comida se entrega si el animal
hace cualquier cosa remotamente relacionada con la respuesta deseada. Una vez que la
respuesta de alzamiento ha sido establecida la comida solo entrega si la rata realiza la
respuesta de alzamiento sobre la palanca de respuesta. Una vez que el alzamiento sobre la
palanca ha sido establecido, la bolita de comida puede entregarse solo si realmente la rata
presiona la palanca. Esta secuencia de pasos se denomina moldeamiento. Este incluye dos
tcticas complementarias: reforzamiento de aproximaciones sucesivas a la respuesta
requerida y no reforzamiento de las formas de respuesta ms tempranas.
Moldeamiento y nueva conducta: El condicionamiento instrumental incluye a menudo la
construccin o sntesis de una nueva unidad conductual a partir de componentes de
respuesta preexistentes que ya se encuentran en el repertorio del sujeto. El
condicionamiento instrumental puede tambin utilizarse para producir respuestas que no se
parecen en nada a lo que el individuo es probable que haga sin entrenamiento. El
moldeamiento aprovecha la variabilidad inherente de la conducta. Sin esta variabilidad, los
procedimientos de moldeamiento no tendran xito. El moldeamiento puede producir nuevas
formas de respuesta nunca antes realizadas por el organismo.
La tasa de respuesta como medida de la conducta operante. Los mtodos de operante
libre permiten una observacin continua durante largos periodos, proporcionan una ocasin
especial para obsevar cambios en la probabilidad de la conducta a lo largo del tiempo.
Las medidas de la latencia de la respuesta y de la velocidad que se emplea normalmente en
procedimientos de ensayo discreto no permiten que se repita la respuesta. Skinner propuso
que la tasa de ocurrencia de una conducta operante (frecuencia por minuto, por ej.) se
utilizase como medida de la probabilidad de respuesta.
78
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
Procedimientos de condicionamiento instrumental (pgina 133 del libro)
Una consecuencia placentera se denomina tcnicamente estimulo apetitivo. Una
consecuencia molesta estimulo aversivo. La respuesta instrumental puede proporcionar el
estimulo, en este caso se dice que surte efecto una contingencia positiva entre la respuesta
y su estimulo consecuente. De forma alternativa, la respuesta instrumental puede retirar o
eliminar un estimulo, en este caso se dice que existe un efecto de contingencia negativo
entre la respuesta y su consecuencia: Que el resultado de un procedimiento de
condicionamiento sea un aumento o una disminucin de la tasa de respuesta depende tanto
de la contingencia respuesta-consecuencia como de la naturaleza de la consecuencia.
Reforzamiento positivo: es un procedimiento en el que la respuesta instrumental produce un
estimulo apetitivo. Si se da la respuesta el estimulo apetitivo se presenta, si no se da la
respuesta el estimulo apetitivo no se presenta: existe una contingencia positiva entre la
espuesta instrumental y el estimulo positivo. El reforzamiento positivo produce incremento
en la tasa de respuesta.
Castigo: En un procedimiento de castigo, la respuesta instrumental produce o aproxima un
estimulo molesto o aversivo. Produce disminucin en la respuesta instrumental.
Reforzamiento negativo: En una contingencia negativa, la respuesta retira o previene la
presentacion de un suceso ambiental. Un procedimiento en el que la respuesta instrumental
finaliza o previene la entrega de un estimulo aversivo se denomina reforzamiento negativo.
Hay dos tipos, escape y evitacin.:
En el escape, el estimulo aversivo se presenta pero puede ser eliminado por la
respuesta instrumental.La presencia de un estimulo aversivo establece la ocasin para la
ocurrencia de la respuesta instrumental, entonces es reforzada por la terminacin del
estimulo aversivo.
La evitacin implica la programacin de un estimulo aversivo para ser presentado en
algn momento del futuro. En este caso la respuesta instrumental previene la entrega del
estimulo aversivo.
Entrenamiento de omisin: Incluye una contingencia negativa entre la respuesta
instrumental y un suceso ambiental. En este caso la respuesta instrumental previene la
presentacin de un estimulo apetitivo o placentero. A menudo es el preferido para disuadir
la conducta humana (nio a su habitacin).
79
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
Los procedimientos de entrenamiento de omisin se denominan en ocasiones reforzamiento
diferencial de otras conductas o RDO. Este termino refleja el hecho de que el individuo
recibe un estmulo apetitivo peridicamente a condicin de que se dedique a realizar otra
conducta diferente de la respuesta especificada por el procedimiento. Implica el
reforzamiento de otras conductas.
La respuesta instrumental disminuye por el castigo y aumenta por el reforzamiento negativo
Elementos fundamentales del condicionamiento instrumental
(pgina 137 del libro)
La esencia de la condcuta instrumental es que esta controlada por sus consecuencias. El
condicionamiento instrumental consta de tres elementos claves; una respuesta, una
consecuencia (el reforzador) y una relacin o contingencia, entre la respuesta y la
consecuencia.
La respuesta instrumental
El resultado de los procedimientos del condicionamiento instrumental depende en parte de
la naturaleza de la respuesta que se este condicionando.Algunas respuestas son mas
fcilmente condicionables que otras.
Variabilidad conductual versus estereotipia. Thorndike y Skinner enfatizaron que el
reforzamiento incrementa la probabilidad de que la respuesta se repita en el futuro. Este
nfasis alent la creencia de que los procedimientos de condicionamiento instrumental
producan repeticiones de la misma respuesta - que producan uniformidad o estereotipia en
la conducta - . Sin embargo, esto no significa que el condicionamiento instrumental no pueda
verse tambin involucrado en la produccin de respuestas creativas o variables. Los
organismos pueden aprender a obtener refuerzo en situaciones donde se requiera hacer
algo nuevo. La variabiliad de la respuesta puede ser la base para el reforzamiento
instrumental. (ver ejemplo. Pag 137).
Relevancia o pertinencia en el condicionamiento instrumental: Thorndike propuso el
termino de pertinencia para explicar los fallos en el entrenamiento del rascado y del
bostezo, ciertas respuestas se corresponden de forma natural con el reforzador debido a la
historia evolutiva del animal. Los Breland denominaron deriva instintiva al desarrollo de
respuestas como la de hozar en los cerdos y frotar monedas en los mapaches. Estas
respuestas naturales relacionadas con la comida eran aparentemente muy fuertes y
competan con las respuestas que requera el investigador.
80
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
Sistemas de conducta y limitaciones en el condicionamiento instrumental. De acuerdo
con la terora de los sistemas de conducta, cuando un animal est privado de comida y se
encuentra en una situacin donde podra encontrarla, su sistema de alimentacin se activa, y
se dedica al forrajeo y otras actividades relacionadas con la comida. Sobre este sistema de
conducta se superpone un procedimiento de condicionamiento instrumental. La efectividad
del procedimiento para el incremento de una respuesta instrumental depender de la
compatibilidad de esa respuesta con la organizacin preexistente del sistema de
alimentacin.
Podemos predecir qu respuestas se incrementarn con un reforzamiento de comida
mediante el estudio de lo que los animales hacen cuando su sistema de alimentacin est
activado en ausencia de condicionamiento instrumental.
Otra forma de diagnosticar si una respuesta es parte de un sistema de conducta es realizar
un experimento de condicionamiento clsico. Un EC llega a elicitar componentes del sistema
de conducta activado por el EI. Si la deriva instintiva refleja las respuestas del sistema de
conducta, las respuestas anlogas a la deriva instintiva deberas ser evidentes en un
experimento de condicionamiento clsico. Timberlake y colaboradores comprobaron esta
prediccin en ratas utilizando una modificacin de los estudios de manipulacion de monedas
llevados a cabo por los Brelands.
El reforzador instrumental
Cantidad y naturaleza del reforzador: En un estudio sistemtico, Hutt(1954) intento
aislar los efectos de la cantidad y naturaleza del reforzador alimenticio lquido mediante la
variacin sistematica de ambos rasgos. Los incrementos en el calidad y cantidad produjeron
mayor tasa de respuesta.
Cambios en la naturaleza y la cantidad de reforzador: Se plantea la posibilidad de que la
efectividad de un reforzador dependa no slo de sus propiedades sino tambin de cmo ese
reforzador se compara con otros que el individuo haya experimentado. La efectividad de un
EI en el condicionamiento clsica depende de cmo se compare el EI con las expectativas
del individuo basndose en la experiencia previa. Esta es la idea fundamental del modelo
Rescorla-Wagner, si el EI es mayor de lo esperado, producir condicionamiento excitatorio,
si el EI es menor producir condicionamiento inhibitorio. Los efectos de una cantidad o tipo
de reforzador dependen de la cantidad y la naturaleza de los reforzadores que el individuo
ha experimentado previamente.
Mellgren (1972) Los resultados que obtuvo ilustran el fenmeno de contraste positivo: se
refiere a una elevada respuesta por una recompensa favorable, resultado de una
experiencia anterior con una consecuencia menos atractiva y contraste negativo: se refiere
81
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
a una respuesta disminuida por una recompensa desfavorable debido a una experiencia
anterior con una consecuencia mejor. Los efectos de contraste tambin se dan si las
condiciones de recompensa se modifican una y otra vez con una clave diferente saalando
cada condicin de recompensa, estos efectos son ejemplo de contraste conductual
simultaneo.
Todos los efectos de contraste ilustran que la efectividad de un reforzador en una
situacin esta determinada en parte por las experiencias del organismo con reforzadores en
otras situaciones. Por razones que no estn totalmente claras, el contraste negativo se ha
obtenido de forma ms clara que el contraste positivo.
La relacin respuesta-reforzador
Unas veces existe una fuerte relacin entre la conducta y sus consecuencias (introducir una
moneda en una maquina y obtener un refresco), en otras no (llevar una camiseta roja al
examen y sacar buena nota) y tambin puede ser probabilistica (hacer llamadas de telefono
y encontrar a alguien que te ayude).
Existen dos tipos de relaciones entre una respuesta y un reforzador:
1.- La relacin temporal , que se refiere al tiempo que transcurre entre la respuesta
y el reforzador. Un tipo especial es la contigidad temporal, la cual se refiere a la entrega
del reforzador inmediatamente despus de la respuesta.
2.- La relacin causal o contingencia respuesta-reforzador, se refiere al hecho de
que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.
Los factores temporales y causales son independientes unos de otros.
Ambas son independientes unos de otros .
Efectos de contigidad temporal. El reforzamiento inmediato es preferible al
reforzamiento demorado. Los psiclogos del aprendizaje han resaltado que el
condicionamiento instrumental requiere porporcionar el reforzador inmediatamente
despus de la ocurrencia de la respuesta instrumental. Grice informo que el aprendizaje
instrumental puede deteriorarse con demoras tan cortas como 0.5 seg.
Hay varios factores que pueden contribuir a este deterioro. Cuando el reforzamiento es
demorado tras la realizacin de una respuesta, R1, el organismo no deja de hacer cosas, R2
R3 R4 etc. Si el reforzador se establece en R1 pero no se entrega hasta algn tiempo
Hay una relacin causal fuerte entre presentar una solicitud de admisin y ser aceptado, pues si no lo solicitas es seguro que
no ser aceptado; sin embargo, la relacin temporal entre solicitar y ser admitido es dbil porque puede pasar semanas o
meses sin conocer la respuesta a la solicitud despues de haberla presentado.
82
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
despus, el reforzador puede ocurrir despus de alguna otra respuesta por ej. R5. Para
asociar R1 con el reforzador, el organiso tiene que poder distinguir R1 de otras respuestas
que realiza durante el intervalo de demora.
Hay dos formas de resolver este problema.
La primera tcnica, es proporcionar un reforzador secundario o condicionado
inmediatamente despus de la respuesta instrumental. Un reforzador condicionado o
secundario es un estmulo condicionado que previamente ha sido asociado con el reforzador.
Otra tcnica es marcar la respuesta instrumental criterio de alguna manera para
hacerla distinguible de otras actividades del organismo.La efectividad del procedimiento de
marcado se demostr por primera vez por Lieberman, Mcintosh y Thomas (1979)
La contingencia respuesta-reforzador. Los estudios de demora del reforzamiento
muestran que no es suficiente una relacin causal perfecta entre la respuesta y el
reforzador para producir una respuesta instrumental vigorosa. Incluso con una relacin
causal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durante
demasiado tiempo. Se concluy que la contigidad respuesta-reforzador ms que la
contingencia era el factor critico que produca el aprendizaje instrumental. No obstante,
esta visin ha resultado injustificada por la investigacin posterior. La contingencia
respuesta-reforzador es tambin importante.
El experimento de supersticin Skinner. Fue un hito en el debate acerca del papel de la
contigidad frente a la contingencia en el aprendizaje instrumental. Skinner situ palomas
en cmaras experimentales independientes y mont el equipo para entregar una cantidad de
de comida cada 15 segundos independientemente de lo que las palomas estuvieran haciendo.
Las palomas parecan estar respondiendo como si la conducta controlara la entrega del
reforzador. Skinner denomin a esto conducta supersticiosa.
La conducta supersticiosa descansa en la idea de reforzamiento accidental o adventicio.
Se refiere al emparejamiento accidental de una respuesta con la entrega de un reforzador,
un segundo emparejamiento accidental aumenta an ms la probabilidad de la respuesta, de
esta forma cada emparejamientno ayuda a estampar una respuesta particular.
1- Reinterpretacin del experimento de supersticin: la afirmacion de Skinner ha sido
puesta en duda por la evidencia empirica posterior. Stadon y Simmelhag (1971) realizaron
observaciones ms extensas, definieron y midieron la ocurrencia de muchas respuestas,
algunas respuesta ocurran de modo predominante hacia el final del intervalo entre
reforzadores, las llamaron respuestas terminales. Otras aumentaron tras la entrega del
reforzador y disminuan a medida que se acercaba el tiempo de la siguiente comida;
respuestas de interin.
83
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
Las acciones que eran respuestas terminales y las que eran respuestas de interin no
variaban mucho de una paloma a otra. No encontraron evidencia de reforzamiento
accidental. La investigacion posterior ha proporcionado mucha evidencia adicional de que las
presentaciones periodicas de un reforzador producen regularidades en la conducta.
2-Explicacin de la periodicidad de las respuestas de interin y terminales. Staddon y
Simmelhag sugirieron que las respuestas terminales son respuestas tpicas de la especie que
reflejan la anticipacin de la comida a medida que el tiempo se encuentra ms cerca de la
prxima presentacin de comida. En contraste, entendieron las respuestas de interin como
una manifestacin de otras fuentes de motivacin que eran mas importantes al comienzo del
intervalo entre comidas, cuando la presentacin de comida era improbable. Los
investigadores posteriores, sin embargo han favorecido aproximaciones en las cuales las
respuestas terminales y de interin se consideran diferentes manifestaciones del mismo
sistema motivacional.
La teora de sistema de conducta, el sistema de alimentacin est activado en animales
privados de comida a los que se les proporciona peridicamente pequeas cantidades de
comida. Justo despus de la entrega de comida se asume que el organismo realiza respuetas
de bsqueda focalizada poscomida, que involucra actividades cercana a la comida. En medio
del intervalo entre entregas ocurren respuestas de bsqueda general, que aleja al suejto de
la comida. En el momento de la prxima entrega de comida ocurre la respuesta de bsqueda
focalizada.
Congruente con la teora de los sistemas de conducta, la distribucin de las actividades se
desarrollan con la entrega periodica de un reforzador depende de la naturaleza de ese
reforzador. Por ejemplo, se desarrollan diferentes patrones de conductas con
presentaciones de comida o agua, debido a que activan diferentes patrones de forrajeo.
Efectos de la controlabilidad de los reforzadores. Una contingencia fuerte entre una
respuesta instrumental y un reforzador esencialmente significa que la respuesta controla el
reforzador, esto es, que el reforzador suceda depende de si ha ocurrido la respuesta
instrumental. Los estudio acerca de los efectos de control sobre reforzadores han
proporcionado la evidencia mas amplia de la sensibilidad de la conducta a las contingencias
respuesta-reforzador. La mayora de la investigacin se ha centrado en los efectos de
control sobre la estimulacin aversiva, esa se origino con los estudios pioneros de Seligman,
Overmier y Maier, quienes investigaron los efectos de la exposicin a una descarga
incontrolable en el aprendizaje posterior de escape-evitacin en perros. El hallazgo ms
importante fue que la exposicin a una descarga incontrolable dificultaba el aprendizaje
posterior: Efecto de indefensin aprendida.
84
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
1 - Diseo tradico: los experimentos sobre indefensin aprendida se realizan normalmente
utilizando este diseo, incluye dos fases: exposicin, un grupo de ratas (E escape) es
expuesto a descargas periodicas que puede fianlizar mediante la realizacin de un respuesta
de escape. Cada sujeto del segundo grupo (A, acoplado) es acoplado a un animal del grupo E
y recibe las mismas descargas, pero el grupo A no puede hacer nada por evitarlas. El tercer
grupo (C confinado), no recibe descargas durante la fase de exposicin pero esta confinado
en el aparato tanto tiempo como los otros grupos. Durante la fase de condicionamiento, los
tres grupos reciben entrenamiento escape-evitacion. El hallazgo destacable es que los
efectos de la estimulacin aversiva durante la fase de exposicin dependen de si la
descarga es o no es escapable. La exposicin a una descarga incontrolable (grupo A) produce
una severa interrupcin del aprendizaje posterior de escape-evitacion, esto indica que los
animales son sensibles a las diferencias procedimentales entre la descarga escapable y la
descarga inescapable. La principal diferencia procedimental entre los grupos E y A es la
presencia de una contingencia respuesta-reforzador para el grupo E pero no para el grupo
A.
2- La hiptesis de la indefensin aprendida: la primera explicacin importante estaba
basada en la conclusin de que los animales pueden percibir la contingencia entre su
conducta y la entrega de un reforzador. La hiptesis de la indefensin aprendida asume
que durante la exposicin a descargas incontrolables, los animales aprenden que las
descargas son independientes de su conducta. Es ms, llegan a esperar que los reforzadores
continuaran siendo independientes de su conducta . Esta expectativa de ausencia de
control debilita su habilidad para aprender una nueva respuesta instrumental. Esto ocurre
por dos razones , primero, la expectativa de falta de control reduce la motivacin de los
sujetos para realizar una respuesta instrumental; segundo, incluso si realizan la respuesta y
son reforzados en la fase de condicionamiento, la expectativa previamente aprendida de
falta de control hace mas difcil para los sujetos aprender que su conducta es ahora
efectiva para producir reforzamiento.
Es importante distinguir la hiptesis de indefensin aprendida del efecto de indefensin
aprendida . El efecto de indefensin aprendida es el patrn de resultados obtenido con el
diseo tradico, este ha sido reproducido en numerosos estudios y es un hallazgo bien
EL DI SEO TRIDI CO UTI LI ZADO EN LOS ESTUDIOS DEL EFECTO DE I NDEFENSI N APRENDI DA
FASE DE
GRUPO FASE DE EXPOSICIN CONDICIONAMIENTO PRUEBA .
Grupo E Descarga escapable Escape-evitacin Aprendizaje rpido de evitacin
Grupo A Descarga acoplada inescapable Escape-evitacin Aprendizaje lento de evitacin
Grupo C Confinado al aparato Escape-evitacin Aprendizaje rpido de evitacin
85
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
establecido. En contraste, desde que se propuso, la hiptesis de indefensin aprendida ha
sido una explicacin sugestiva y controvertida del efecto de indefensin aprendida.
3- Dficit de actividad: El dficit de aprendizaje observado en el grupo A era resultado de
que aprendan a ser inactivos durante la fase de exposicin. Congruente con esta hiptesis,
en algunas situaciones la descarga inescapable produce una disminucin en el movimiento
motor, y a esto se deberan los posteriores dficits de actuacin. Hay tambin situaciones
en las cuales los efectos del aprendizaje probablemente no son debidos a la supresin del
movimiento causada por la descarga inescapable. Por tanto, la hiptesis de la inactividad
aprendida no puede explicar todos los ejemplos de efectos de indefensin aprendida.
4- Dficit atencional: Que la descarga provoque que los animales presten menos atencin a
sus acciones. Si un animal no presta atencin a su conducta, tendr dificultad para asociar
sus acciones con los reforzadores en el escape.-evitacion o en otras formas de
condicionamiento instrumental.
Maier, Jackson y Tomie (1987) probaron esta hiptesis de dficit atencional con ratas,
razonaron que la atencion reducida a la conducta instrumental tambin poda ser aliviada
mediante la introduccin de una clave externa de retroalimentacin de la respuesta o
estmulo de marcado.
5- Relaciones estimulares en el condicionamiento de escape: Resulta evidente que el
condicionamiento de escape resulta mas complejo de lo que se pensaba anteriormente. El
rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como
consecuencia la terminacin de un estimulo aversivo. Realizar la respuesta de escape tiene
como resultado claves internas de retroalimentacin de la respuesta. Algunos de estos
estimulos producidos por la respuesta son experimentados al comienzo de la respuesta de
escape, justo antes de que la descarga se retire, y se denominan claves de retroalimen-
tacion de la terminacin de la descarga. Otros estimulos producidos por la respuesta son
experimentados cuando el animal completa la respuesta, justo despus de que la descarga
se haya retirado al comienzo del intervalo entre ensayos, estos se denominan claves de
retroalimentacin de la seal de seguridad. Estas son seguidas de forma fiable por el
intervalo entre ensayos, y por tanto por la ausencia de descarga. En consecuencia, estas
claves contextuales pueden llegar a convertirse en inhibidores condicionados del miedo y
limitan o inhiben el miedo elicitado por las claves contextuales de la cmara experimental.
Estas seales de seguridad no existen para los animales que estn acoplados a la descarga
inescapable porque, para ellos, los periodos de descarga no descarga no son predecibles.
Centrarse en los factores estimulares del condicionamiento de escape en lugar de las
contingencias respuesta-reforzador no ha permitido todava el desarrollo de una explicacin
comprensiva de todos los resultados con el diseo tradico.
86
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
Contiguidad y contingencia: comentarios finales (pagina 156 del libro)
Como se ha descrito, los organismos son sensibles a la contigidad tanto como a la
contingencia entre una respuesta instrumental y un reforzador. Normalmente, estos dos
aspectos de la relacin entre la respuesta y el reforzador actan en conjunto para producir
el aprendizaje. Ambos factores sirven para entender los efectos del reforzamiento en la
respuesta instrumental. La relacin causal, o contingencia, asegura que el reforzador es
entregado slo tras la ocurrencia de la respuesta instrumental especificada. La relacin de
congigidad asegura que otras actividades no se interpongan entre la respuesta
especificada y el reforzador para interferir en el condicionamiento de la respuesta crtica.
Trminos clave (pagina 160 del libro)
Castigo Procedimiento de condicionamiento
instrumental en el cual hay una contingencia
positiva entre la respuesta instrumental y un
estmulo aversivo. Si el sujeto realiza la respues-
ta instrumental, recibe el estmulo aversivo; si el
sujeto no realiza la respuesta instrumental, no
recibe el estmulo aversivo.
Conducta instrumental Actividad que ocurre debido
a su efectividad para producir una consecuencia
particular o reforzador.
Conducta supersticiosa Conducta que se incrementa
en frecuencia debido a emparejamientos acciden-
tales de la entrega de un reforzador con ocurre-
ncia de la conducta.
Contigidad Ocurrencia simultnea ( o casi simult-
nea) de dos eventos, como una respuesta y un
reforzador. Tambin denominada contigidad
temporal.
Contigidad temporal Lo mismo que contigidad.
Contingencia respuesta-reforzador Relacin causal
entre una respuesta y un reforzador, medida en
trminos de la probabilidad de ser reforzado por
realizar la respuesta en comparacin con la
probabilidad de ser reforzado en ausencia de la
respuesta.
Contraste conductual simultneo Efectos de
contraste conductual (contraste positivo y
negativo) que estn producidos por frecuentes
cambios entre una condicin de recompensa
favorable y una desfavorable, con cada condicin
de recompensa asociada a su propio estmulo
distintivo.
Contraste negativo Respuesta menor a un
reforzador desfavorable tras una experiencia
previa con un reforzador ms deseado que en
ausencia de esa experiencia previa.
Contraste negativo Respuesta mayor a un estmulo
favorable tras una experiencia previa con un
reforzador menos deseado que en ausencia de esa
experiencia previa.
Deriva instintiva Deriva gradual de la conducta
instrumental que se aleja de las respuestas
requeridas para el reforzamiento hacia
respuestas tpicas de la especie o instintivas
relacionadas con el reforzador y con otros
estmulos de la situacin experimental.
Efecto de indefensin aprendida Interferencia en
el aprendizaje de nuevas respuestas instrumen-
tales como resultado de la exposicin a estimula-
cin aversiva inescapable e inevitable.
87
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
Entrenamiento al comedero Estadio preliminar del
condicionamiento instrumental en el cual un
estmulo es repetidamente emparejado con el
reforzador a fin de capacitar al sujeto para
aprender a ir a recoger el reforzador cuando se
presenta. El sonido del mecanismo de la entrega
de comida, por ejemplo, puede ser repetidamente
emparejado con la comida, por lo que el animal
aprender a ir al cuenco de comida cuando sta se
entregue.
Entrenamiento de omisin Procedimiento de
conicionamiento instrumental en el cual la
respuesta instrumental previene la presentacin
de un estmulo refonzante. ( Vase tambin
reforzamiento diferencial de otras conductas)
Escape Procedimiento de condicionamiento instru-
mental en el cual la respuesta intrumental finaliza
un estmulo aversivo ( Vase tambien reforza-
miento negativo.)
Estmulo apetitivo Estmulo placentero o
satisfactorio que puede utilizarse para reforzar
positivamente una respuesta instrumental.
Estmulo aversivo Estmulo displacentero o molesto
que puede ser utilizado para castigar una
respuesta instrumental.
Evitacin Procedimiento de condicionamiento instru-
mental en el cual la respuesta instrumental pre-
viene la administracin de un estmulo aversivo.
Hiptesis de la indefensin aprendida Idea terica
que asume que durante la exposicin a
estimulacin aversiva inescapable e inevitable, los
sujetos aprenden que su conducta no controla los
eventos ambientales.
Latencia Tiempo entre el inicio de un ensayo (o el
inicio de un estmulo) y la respuesta instrumental.
Ley del efecto Regla de la conducta instrumental,
propueta por Thorndike, que establece que si una
respuesta en presencia de un estmulo es seguida
por un evento satisfactorio, la asociacin entre el
estmulo y la respuesta se fortalecer; si la
respuesta es seguida por un evento molesto, la
asociacin se debilitar.
Mtodo de ensayo discreto Mtodo de
condicionamiento instrumental en el cual el sujeto
puede realizar la respuesta instrumental slo
durante perodos especficos normalmente
determinados bien por el emplazamiento del
sujeto en una cmara experimental o por
lapresentacin de un estmulo.
Mtodo de operante libre Mtodo de
condicionamiento instrumental que permite la
ejecucin repetida de la respuesta instrumental
sin que el sujeto sea retirado de la cmara
experimental. (Comprese con el mtodo de
ensayo discreto).
Moldeamiento Reforzamiento de aproximaciones
sucesivas a la respuesta instrumental deseada.
Pertinencia La idea terica, originalmente propuesta
por Thorndike, de que la historia evolutiva de un
organismo hace que ciertas respuestas encajen o
se correspondan con ciertos reforzadores. La
pertinencia facilita el aprendizaje.
Procedimiento de marcado Procedimiento en el cual
la respuesta instrumental es inmediatamente
seguida por un evento distintivo (el sujeto es
recogido, o se presenta un destello de una luz)
que hace que la respuesta instrumental sea ms
fcil de memorizar y ayuda a superar los efectos
perjudiciales del reforzamiento demorado.
Reforzador condicionado Estmulo que se convierte
en un reforzador efectivo debido a su asociacin
con un reforzador primario o incondicionado.
Tambin denominado reforzador secundario.
Reforzador secundario Lo mismo que reforzador
condicionado.
Reforzamiento accidental Caso en cual la entrega
de un reforzador coincide con una respuesta
particular incluso si esta respuesta no es
responsable de la presentacin del reforzador.
Tambin denominado reforzamiento adventicio.
Reforzamiento adventicio Lo mismo que
reforzamiento accidental.
88
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera
Reforzamiento diferencial de otras conductas
Procedimiento de condicionamiento instrumental
en el cual un reforzador positivo es
peridicamente entregado slo si el sujeto no
realiza una respuesta particular. Abreviado RDO.
RDO Abreviacin de reforzamiento diferencial de
otras conductas.
Reforzamiento negativo Procedimiento de
condicionamiento instrumental en el cual hay una
contingencia negativa entre la respuesta
instrumental y un estmulo aversivo. Si la
respuesta intrumental es realizada, el estmulo
aversivo finaliza o se previene; si la respuesta
instrumental no se realiza, se presenta el
estmulo aversivo.
Reforzamiento positivo Procedimiento de
condicionamiento instrumental en el cual hay una
contingencia positiva entre la respuesta
intrumental y un estmulo reforzante. Si el sujeto
realiza la respuesta, recibe el estmulo
reforzante; si el sujeto no realiza la respuesta, no
recibe elestmulo reforzante.
Respuesta de nterin Respuesta que aumenta en
frecuencia despus de la entrega de un
reforzador peridico y que disminuye a medida
que se aproxima el siguiente reforzador.
Respuesta operante Respuesta que se define por el
efecto que produce en el ambiente. Los ejemplos
incluyen presionar una palanca y abrir una puerta.
Cualquier secuencia de movimientos que emuje la
palanca hasta abajo o abra la puerta constituye un
ejemplo de esa operante particular.
Respuesta terminal Respuesta que es ms probable
al final del intervalo entre sucesivos
reforzadores que estn presentes a intervalos
fijos.
Velocidad de la carrera Rapidez (en metros por
segundo, por ejemplo) con que se mueve un animal
por un corredor.
89
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera 2009/2010
Programas simples de reforzamiento intermitente
- Programa de razn
- Programas de intervalo
- Comparacin de los programas de razn y de intervalo
- Programas de reforzamiento de tasas de respuesta
Conducta de eleccin: programas concurrentes
- Medidas de la conducta de eleccin
- La ley de la igualacin
- Mecanismos de la ley de la igualacin
Eleccin con compromiso
- Programas concurrentes encadenados
- Estudios de "autocontrol"
Comentarios finales
91
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Un programa de reforzamiento es un programa, o regla, que
determina cmo y cundo la ocurrencia de una respuesta ira
seguida de un reforzador. Este puede establecerse de
infinidad de formas. Los programas de reforzamiento que
incluyen relaciones similares entre los estmulos, las
respuestas y los reforzadores, normalmente producen
patrones de conducta similares. Los programas de reforzamiento influyen tanto en la
forma de aprender una respuesta instrumental como en la forma en que se mantiene el
reforzamiento.
Zeiler (1984) denomin a los programas de reforzamiento el gigante durmiente del anlisis
de la conducta.
PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE
(pgina 154 del libro)
Los programas que organizan y dirigen la ejecucin instrumental se activan de diferentes
formas por los distintos programas de reforzamiento. En los programas "simples", un slo
factor determina qu ocurrencia de la respuesta instrumental se refuerza.
Programas de razn
La caracterstica definitoria de un programa de razn es que el reforzamiento depende
slo del nmero de respuestas que el organismo realiza. Un programa de razn slo requiere
contar el nmero de respuestas que ha ocurrido y entregar el reforzador cad vez que se
alcance el nmero requerido. Si este nmero es uno, cada ocurrencia e la respuesta
instrumental provacar la entrega de reforzador. Este tipo de programa se denomina
tcnicamente reforzamiento continuo (abreviado RFC).
Las situaciones en las que la respuesta se refuerza slo alguna vez, reforzamiento parcial o
intermitente.
Razn fija. Por ejemplo, la entrega de un reforzador despus de cada dcima respuesta de
presin de palanca en un estudio con ratas de laboratorio. En un programa como ste, hay
una razn fija entre el nmero de respuestas que la rata realiza y el nmero de
reforzadores que consigue. Esto convierte al procedimiento en un programa de razn fija.
El procedimiento podra denominarse programa de reforzamiento de razn fija (RF 10).
En la vida real, no siempre que
damos una respuesta, aparecer un
reforzador.
El programa de reforzamiento
determina cundo la ocurrencia
de la respuesta va a ir seguida
de un reforzador
92
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Un programa de reforzamiento continuo
constituye tambin un programa de razn fija. Es
una razn fija de una respuesta por reforzador,
en la que los organismos suelen responder con una
tasa de respuesta constante pero moderada.
Se da un patrn de respuesta diferente cuando se trata de un programa de razn
intermitente de razn fija.
El patrn tpico de los programas de razn fija es que se da una tasa constante y alta una
vez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar el
nmero requerido de respuestas. Estas se muestran con claridad en un registro acumulativo
de la conducta.
Un registro acumulativo es una forma especial de representar la forma de repetirse una
respuesta a lo largo del tiempo. Muestra el nmero total (o acumulativo ) de respuestas que
han ocurrido hasta un momento determinado en el tiempo.
El registro acumulativo propor-
ciona una representacin visual
completa de cuando y con que
frecuencia responde el sujeto
durante la sesin.
La tasa cero de respuesta que
se observa justo despus del
reforzamiento se llama pausa
posreforzamiento. La tasa alta
y estable que completa cada
requerimiento de la razn se
llama carrera de la razn.
Si el requerimiento de la razn se incrementa un poco ( de una RF 120 a un RF 150), la tasa
de respuesta puede permanecer igual durante la carrera de razn. Con mayores
requerimientos de tasa, tienden a ocurrir pausas posreforzamiento ms largas. Si el
requerimiento de la razn sufre un aumento sbito y significativo (de RF 120 a RF 500) es
probable que el animal realice una pausa periodica cada vez que complete la razn requerida,
este efecto se llama tensin de la razn. En casos exremos, la tensin de la razn puede
ser tan grande que el animal deje de responder. La longitud de la pausa posreforzamiento
esta controlada por el requerimiento de la razn subsiguiente, por tanto podra recibir el
nombre de pausa pre-razn.
Programa de reforzamiento continuo:
Cada respuesta correcta es reforzada.
Programa de reforzamento parcial o intermitente:
No todas las respuestas correctas son reforzadas y
pueden ser de varios tipos.
93
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Razn variable. Es un procedimiento en el que se necesita un nmero de respuestas distinto
para la entrega de cada recompensa. El valor numrico del programa de razn variable (RV)
indica el nmero medio de respuestas requerido para conseguir el reforzador.
Debido a que el nmero de respuestas necesario para conseguir el reforzamiento no es
predecible, las pausas predecibles en la tasa de respuesta son menos probables con estos
programas RV que con los programas de RF. Los organismos suelen responder con una tasa
claramente estable en los programa RV.
Aunque pueden darse pausas posreforzamiento en los programas de razn variable, estas
son mas largas y prominentes en los programas de razn fija. La tasa global de respuesta en
los programas de RF y RV es similar siempre y cuando, como promedio, se requieran nmeros
similares de respuestas. Sin embargo, la tasa global de respuesta tiende a distribuirse en
un patrn de pausa-carrera con los programa de RF, mientras que se observa un patrn ms
estable con los de RV.
Programas de intervalo
Las respuestas son reforzadas slo si ocurren cuando ha transcurrido una cierta cantidad
de tiempo.
Intervalo fijo: el tiempo no varia de una ocasin a la siguiente. Se dan en situaciones donde
se requiere una cantidad fija de tiempo para dispensar el reforzador. A medida que el
tiempo para la disponibilidad del prximo reforzador se acerca, la tasa de respuesta
aumenta, este aumento de la tasa de respuesta se manifiesta como una aceleracin del
registro acumulativo al final del IF, este se denomina por consenso festn de intervalo
fijo. La pusa posreforzamiento y el aceleron posterior hacia el final del intervalo reflejan
una habilidad rudimentaria para contar el tiempo, En un estudio se uso como reloj un punto
de luz que crecia a medida que el tiempo pasaba. L introduccin de este estimulo reloj
incremento la pausa posreforzamiento y provoco que la respuesta se desplazase mas cerca
del final del ciclo IF.
Programa de RAZN:
El reforzador se otorga en funcin del nmero de respuestas.
Razn Fija (RF): El nmero de respuestas necesarias para obtener un reforzador es siempre el mismo.
Ejemplo: RF5 = Cada 5 respuestas, me dan un premio.
El programa de RF1 es un programa de reforzamiento continuo.
Produce pausas post-reforzamiento.
Razn variable (RV): El nmero de respuestas necesarias para obtener un reforzador va variando.
Ejemplo: RV5 = Cada 5 respuestas de media, me dan un premio.
94
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Un programa IF no garantiza que el reforzador se proporcionara en algn momento a lo
largo del intervalo, el intervalo slo determina cundo el reforzador esta disponible, no
cuando se entrega.
Intervalo variable: (IV), las respuestas se refuerzan si se dan tras haber transcurrido un
intervalo variable desde la administracin del reforzador previo. Se hallan en situaciones
donde se requiere una cantidad de tiempo impredecible para preparar o dispensar el
reforzador.
El sujeto en los programas IV tiene que realizar la respuesta instrumental para obtener el
reforzador., no se dan gratis, se dan solo si el organismo responde tras un intervalo
variable. Los programa IV mantienen tasa de respuesta constantes y estables sin pausas
regulares.
Programas de intervalo y espera
limitada: Con los programas fuera de
laboratorio, es mas comn que los
reforzadores estn disponibles durante
tiempo limitado. Este tipo de
restriccin en cuanto al tiempo que
permanece el reforzador disponible se
llama espera limitada. Las restricciones
de la espera limitada pueden aadirse
tanto a los programas de intervalo fijo
como a los de intervalo variable
Programa de INTERVALO:
El reforzador se otorga en funcin del tiempo que ha transcurrido desde el ltimo reforzador (Pero todava hay que
responder al menos 1 vez para obtener el reforzador
Intervalo Fijo (IF): El tiempo que pasa entre dos reforzamientos es siempre el mismo.
Ejemplo: IF5 = Cada 5 segundos, el reforzador est disponible (cada cinco segundos, si respondo me dan un premio.
Produce pausas post-reforzamiento y aceleracin pre-reforzamiento (Patrn festoneado)
Intervalo variable (IV): El tiempo que pasa entre dos reforzadores va variando.
Ejemplo: IV5 = Cada 5 respuestas de media, el reforzador est disponible.
95
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Comparacion de los programas de razn e intervalo
Hay similitudes entre los patrones de respuesta, tanto los programas RF como los IF
producen una pausa posreforzamiento despus de la administracin del reforzador.
Producen altas tasas de respuesta
justo antes de la administracin del
siguiente reforzador. Por el
contrario, los programas de RV y de
IV mantienen tasas estables de
respuesta, sin pausas predecibles.
Los programas de intervalo y de
razn activan diferentes cambios
neuroqumicos en el cerebro.
La conducta mantenida por
programas de intervalo esta
mediada por el sentido temporal del
organismo, en los programas de razn no.
La primera evidencia sobre las diferencias entre programas de intervalo y de razn fue
proporcionada por un importante experimento de Reynolds (1975), ver pag 169-170 libro.
Reforzamiento diferencial del tiempo interres-
puesta. Por qu los programas de razn son
capaces de producir tasas ms altas de respuesta
que los programas de intervalo? El factor critico es
el espaciamiento entre respuestas que se da justo
antes del reforzamiento. El intervalo entre una
respuesta y la siguiente se denomina tiempo
interrespuesta o TIR. Si se refuerzan TIRs cortos,
ser mas probable que el sujeto realice TIRs
cortos, si se refuerzan TIRs largos ser mas
probable que el sujeto realice TIRs largos. En un
programa de razn , no hay restricciones acerca de
cuando cuentan las respuestas para conseguir el
reforzador, esto es no se espera mucho entre las
respuestas. Los programas de intervalo favorecen TIRs largos.
Cul produce ms respuesta?
Los programas que ms respuestas producen
son los de RAZN, porque en los de intervalo el
reforzador se obtiene por esperar al momento
idneo, no por dar un nmero determinado de
respuestas.
Cul produce ms respuestas?
Los programas fijos producen menos
respuestas que los variables porque son ms
predecibles. Adems son ms faciles de extinguir
(tema 9).
De modo que el programa ms efectivo
para crear respuestas es el de razn
variable ( Ejemplo: mquina tragaperras, por eso
son tan adictivas y peligrosas)
96
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Programas de reforzamiento de tasas de respuesta.
Requieren especficamente que el organismo
responda a una tasa particular de respuesta. El
reforzamiento de una respuesta particular depende
de cuan pronto ocurra tras la respuesta
precedente. Reforzamiento diferencial de tasa
altas (RDA): una respuesta se refuerza slo si
ocurren antes de que haya transcurrido cierta
cantidad de tiempo tras la respuesta precedente.
Reforzamiento diferencial de tasas bajas (RDB):
una respuesta se refuerza slo si ocurre despus
de que haya transcurrido cierta cantidad de tiempo
desde la respuesta previa.
CONDUCTA DE ELECCIN: PROGRAMAS RECURRENTES
(pgina 154 del libro)
Histricamente se estudio con laberintos en
forma de T. Las aproximaciones recientes al
estudio de la conducta de eleccin utilizan
cajas de Skinner equipadas con dos
manipulandos (dos botones). En el
experimento tpico, responder en cada tecla
es reforzado segn algn programa de
reforzamiento. Los dos programas funcionan
al mismo tiempo (o concurrentemente) y el
sujeto es libre de cambiar de una tecla a otra, este tipo de procedimiento se llama
programa concurrente, permite una medicion continua de la eleccin porque el organismo es
libre para cambiar de una tecla a otra en cualquier momento.
Adems de las respuestas independientes,
tambin podemos reforzar la tasa de respuesta (la
velocidad a la que se dan las respuestas).
Ejemplo: quiero que un animal d cmo mnimo
12 respuestas por minuto. Entonces le doy el
reforzador slo si produce una respuesta en los 5
segundos siguientes a la anterior respuesta. Si
responde cada 5 segundos o menos, tiene una
tasa de 12 respuestas por minuto, lo que yo
quera. Si tarda ms de 5 segundos en responder,
no es reforzado aunque responda. Eso har que
se vuelva ms rpido en el futuro.
Si te dejan elegir, qu prefieres hacer?
En los programas concurrentes se deja elegir al animal
entre dos programas de reforzamiento
97
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Medidas de la conducta de eleccin
La conducta de eleccin de un organismo en un
programa concurrente se refleja en la
distribucin de su conducta entre dos
respuestas alternativas. Una tcnica comn de
medicin es calcular la tasa relativa de
respuestas de cada alternativa.
R
A
/ (R
A
+R
B
)
La forma en que un individuo distribuye su
conducta entre dos alternativas esta muy
influida por el programa de reforzamiento que
funciona para cada respuesta. La tasa relativa
de reforzamiento para cada alternativa de
respuesta puede calcularse de una manera
semejante a la tasa relativa de respuesta.
r
A
/(r
A
+r
B
)
La ley de la igualacin
Herrnstein (1961) estudio la distribucin de
las respuestas en varios programas
concurrentes IV-IV en los cuales la tasa total
mxima de reforzamiento que las palomas
podan obtener estaba fijada en 40 por hora.
Dependiendo del valor exacto de cada
programa de IV, se podan obtener diferentes
proporciones de los 40 reforzadores y no
haba restricciones acerca de cual tecla
podan picotear. Los sujetos distribuyeron sus
respuestas de una manera altamente
predecible, la tasa relativa de respuesta en
una alternativa dada, estaba siempre muy cercana a igualar la tasa relativa de
reforzamiento en esa alternativa, por tanto la tasa de respuesta en una alternativa se
iguala con la tasa relativa de reforzamiento en esa alternativa: ley de la igualacin.
R
A
/(R
A
+R
B
)=r
A
/(r
A
+r
B
) o R
A
/R
B
=r
A
/r
B
; las tasas relativas de respuesta se igualan con las
tasas relativas de reforzamiento.
R
A
/R
B
= r
A
/r
B
Para saber qu programa prefiere seguir la paloma,
recurriremos a la tasa relativa de respuestas.
B A
A
R R
R
+
= A tecla de respuestas de relativa Tasa
Si la paloma no tiene ninguna preferencia en especial, la
tasa relativa se queda en 0,5.
Para saber que programa administra ms reforzadores a la
paloma, recurriremos a la tasa relativa de reforzamiento.
B A
A
r r
r
+
= A tecla de nto reforzamie de relativa Tasa
Si la paloma recibe reforzadores con la misma frecuncia en
cada lado, la tasa relativa se queda en 0,5.
Ley de la igualacin (Herrnstein)
La tasa de respuesta = tasa de reforzamiento
B A
A
B A
A
r r
r
R R
R
+
=
+
O sea, que la paloma responde ms en el programa
que ms reforzadores le proporciona.
Si te dejan escoger entre pasar una tarde en el cine o
paseando con un amigo, escogers probablemente la
actividad ms reforzante.
98
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Infraigualacion, supraigualacion y sesgo de respuesta.
La tasa relativas de respuesta
no siempre se igualan con las
tasas relativas de reforza-
miento. Para acomodarlo aadie-
ron dos parametros, b y s a la
ecuacin: R
A
/R
B
=b(r
A
/r
B
)
S
,
donde s representa la sensibili-
dad de la conducta de eleccin a
las tasas relativas de reforza-
miento para las alternativas de
respuesta. Cuando ocurre una
igualacion perfecta s=1.0.
Un tipo de desviacin de la
iguala-cin perfecta incluye una
sensi-bilidad reducida de la
conducta de eleccin a las tasas relativas de reforzamiento: infraigualacin y pueden
acomodarse mediante la ecuacin de arriba dotando al exponente s de un valor menor que
1.0, indicando la sensibilidad reducida a la tasa relativa de reforzamiento.
En otros ejemplos, la tasa relativa de respuesta es mas sensible a la tasa relativa de
reforzamiento de lo que se predice para una igualacin perfecta: supraigualacin, dotando
al exponente s un valor mayor que uno, indicando el aumento de la sensibilidad de este
factor.
Es ms probable que las elecciones muestren sensibilidad reducida a las tasas relativas de
reforzamiento que sensibilidad reducida a las mismas. El parmetro de sensibilidad puede
estar influido por nmerosas variables, le especie, esfuerzo dificultad, etc.
El parmetro b de la ecuacin representa el sesgo de respuesta, estos influyen en la
eleccin cuando las alternativas de respuesta son diferentes, tambin es importante cuando
el reforzador proporcionado para las dos respuestas es diferente. En ausencia de sesgos
b=1.0.
Infraigualacin, supraigualacin y sesgo de respuesta
A veces la ley de igualacin no se cumple, y en esos casos se cumple esta
norma:
s
r
r
b
R
R
B
A
B
A

=
EL parmetro s es la sensibilidad de la
conducta de elecin a las tasas de
reforzamiento (Cuto me afecta la tasa
de reforzamiento de este programa).
Una buena comida es reforzante, pero
si no me gusta el pescado a lo mejor no
eligira ese men (sensibilidad).
El parmetro b es el sesgo (bias) de respuesta. Es una preferencia
por uno de los dos programas en particular, incluso aunque
proporcione la misma tasa de reforzamiento que el otro (por ejemplo,
la respuesta en s puede ser ms cmoda).
Ir al ginmasio podra ser ms reforzante que ver la televisin, porque
produce un bneficio a largo plazo, pero como la respuesta es costosa,
puede que prefiramos quedarnos en casa (sesgo de respuesta)
Infraigualacin: El animal tiene una tasa de respuesta menor que la tasa de reforzamiento (recibe muchos reforzadores,
pero no responde mucho), es como si los reforzadores obtenidos no produjeran mucha efecto en su eleccin.
El parmetro sensibilidad (s) es <1.
Supraigualacin: El animal responde ms de lo que le correspondera en funcin de su tasa de reforzamiento.
El parmetro sensibilidad (s) es >1.
En realizad, en estas relaciones influyen tanto la cantidad como la calidad del reforzador: si es un reforzador valioso, unos
poquitos bastaran para que el animal prefiera ese programa a otro.
99
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
La ley de la igualacin y el valor del reforzador: Se ha encontrado que la tasa relativa de
respuesta es una funcin de la cantidad relativa de reforzador, asi como de la demora
relativa del reforzamiento. Tambin estn determinadas por la palatabilidad de los
reforzadores.
La ley de la igualacin y los programas simples de reforzamiento
Herrnstein (1970) apunt que incluso las
situaciones de respuesta nica pueden
involucrar eleccin, entre realizar la respuesta
especificada (presin de palanca) y ocuparse en
otras posibles actividades (acicalarse). En un
programa simple, el sujeto recibe no slo
reforzamiento explcito por realizar una
respuesta operante especfica, sino tambin recompenss intrnsecas de las otras
actividades que puede realizar. Por tanto, el reforzamiento total incluye las recompensas
extrnsecas programadas tanto como las fuentes del reforzamiento no programadas. Este
tipo de anlisis permite la aplicacion de la ley de la igualacin.
Si sustituimos los valores de la ecuacin de la ley de igualacin, podemos adaptarla as
situaciones de respuesta nica:
R
A
representa la tasa de respuesta operante especificada por el programa.
R
O
representa la tasa de otras actividades del animal.
r
A
es la tasa de reforzamiento explicito programado.
r
O
es la tasa de reforzamiento intrnseco por las otras actividades.
k es una constante que el investigador utiliza cuando presupone que (R
A
+R
O
) es una
constante que no guarda relacin con el reforzador utilizado.
O A
A
A
r r
kr
R
+
=
Esta ecuacin predice que la tasa de respuesta (R
A
) estar directamente relacionada con la
tasas de reforzamiento para esa respuesta de una forma negativamente acelerada. Otra
implicacin, de particular inters clnico, es que la tasa de respuesta disminuir a medida
que aumente la tasa de las otras fuentes de reforzamiento (r
O
). Por tanto, esta ecuacin
proporcionara dos maneras de modificar la tasa de una respuesta, mediante el cambio de su
tasa de reforzamiento o mediante el cambio en la tasa de las otras fuentes de
reforzamiento.
La presuposicin de que (R
A
+R
O
) es constante para unas situacin instrumental esta puesto
en cuestin con estudios recientes que varian el reforzador pero no la respuesta
instrumental.
La ley de la igualacin tambin puede aplicarse a
programas sencillos de reforzamiento (no a la eleccin
en programas concurrentes)
Realizar cualquier conducta supone una eleccin
(elegimos realizar esa conducta en vez de hacer
cualquier otra cosa). Si una conducta no me refuerza
ms que cualquier otra alternativa, si no es atractiva, es
poco probable que la realice.
100
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Mecanismos de la ley de la igualacin
La ley de la igualacin describe como los organismos distribuyen sus respuestas en una
situacion de eleccin pero no explica que mecanismos son responsables de esta distribucin
de respuestas. Est establecida en funcion de las tasas de respuestas y de reforzamiento
promediada sobre la duracin total de las sesiones experimentales. Ignora cuando se
realizan las respuestas individuales. Igualmente las teoras molares de la igualacin ignoran
que podra ocurrir al nivel de las respuestas individuales. Las teroras molares explican
agregados de respuestas y se relacionan con la distribucin total de respuestas y
reforzadores en las situaciones de eleccin. Las teoras moleculares se centran en lo que
ocurre al nivel de las respuestas individuales y consideran la relacin de igualacin como el
resultado neto de estas elecciones individuales. Otras teoras proporcionan.
caracterizaciones de la conducta que no son ni molares ni moleculares, sino algo intermedio
entre ellas ; el mejoramiento.
Igualacin y maximizacin de las tasas de reforzamiento: las explicaciones ms
investigadas de la conducta de eleccion estn basadas en la idea de que los organismos
distribuyen sus acciones entre las alternativas de respuesta para recibir la mayor cantidad
posible de reforzamiento.
1 Maximizacion molecular: los organismos siempre eligen cualquier alternativa de respuesta
con mejores probabilidades de que sea reforzada en ese momento. Shimp (1966.1969)
propuso una primera versin de la ley de igualacin molecular. Cuando dos programas A y B,
funcionando simultneamente, el sujeto cambia del programa A al B a medida que la
probabilidad de reforzamiento aumenta para el programa B. Supuso que la relacin de
igualacin es un subproducto de una alternancia prudente cuando la probabilidad de
reforzamiento en la tecla de respuesta alternativa es mayor que la probabilidad de
reforzamiento en la tecla de respuesta actual.
Estudios detallados de las pautas de alternancia entre respuestas no siempre apoyaron la
teora de maximizacin molecular propuesta por Shimp. Algunos estudios han mostrado que
la igualacin es posible en ausencia de una maximizacin momentnea. Sin embargo,
aproximaciones ms recientes a los anlisis moleculares de la conducta de eleccin han
tenido mas xito.
2 maximizacin molar: presuponen que el organismo distribuye sus respuestas entre las
varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a la
larga. Se centran en agregados de conducta sobre algn perodo ms que en las respuestas
de eleccin individual.
101
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Fue originalmente formulada para explicar la eleccion en programas concurrentes
construidos con programas de razn, en estos programas, los animales raramente cambian
de una alternativa a otra, en su lugar, responden exclusivamente en el componente de razn
que requiere el menor nmero de respuestas, de esta forma maximiza su tasa de
reforzamiento con el mnimo esfuerzo.
La maximizacin molar predice de forma precisa los resultados de los procedimientos de
eleccin, pero ciertos hallazgos presentan dificultades; como en los resultados de los
programas concurrentes de reforzamiento IV-IV, en los cuales los organismos pueden
conseguir casi todas las recompensas disponibles en ambos programas, siempre y cuadno
prueben de forma ocasional cada alternativa. La teora no puede explicar por qu la
conducta de eleccin se distribuye de forma tan cercana a la relacin de igualacin.
Otro desafio son los programas de IV-RV, dadas las diferencias entre estos dos programas,
para el mximo beneficio en un programa concurrente RV-IV, los sujetos deberan
concentrara sus respuestas en la alternativa de razn variable y responder solo
ocasionalmente en el componente de intervalo variable, esto no sucede, los animales
favorecen el componente RV pero no de forma tan fuerte como predice la teora
3 Mejoramiento: Los mecanismos de mejoramiento operan en una escala temporal que esta
entre la escala temporal de las teoras molar y molecular.
El termino mejoramiento se refiere a hacer algo mejor. No se refiere a elegir la mejor
alternativa en ese momento (maximizacin molecular), o hacer que a largo plazo algo sea tan
bueno como pueda (maximizacin molar), sino a hacer que la situacion sea mejor a cmo esa
situacin ha sido en el pasado reciente. Los beneficios estn circunscritos a una situacin
limitada - no en su totalidad o a largo plazo.
La teora asume que los organismos cambian de una alternativa a otra para mejorar la tasa
local de reforzamiento. Puede demostrarse matemticamente que cuando los sujetos
distribuyen sus respuestas para obtener la misma tasa local de reforzamiento en cada
alternativa, se estn comportando de acuerdo con la ley de igualacin. Por tanto, el
mecanismo de mejoramiento da como resultado la igualacin. De acuerdo con esta teora, la
paloma cambiara su preferencia a favor de la alternativa de respuesta que arroje la tasa
local ms alta. Estos cambios de un lado a otro continuaran hasta que sea igual la tasa local
de reforzamiento conseguida en las dos alternativas.
Qu determina los cambios de un programa a otro?
Teoras de la maximizacin molecular: El animal hace un cambio de programa para obtener un reforzador determinado.
Teora de la maximizacin molar: El animal hace los cambios precisos para obtener el mximo de reforzadores a la larga.
Teora del mejoramiento: El animal cambia para obtener una tasa local de reforzamiento mejor que la actual. La tasa
local de reforzamiento en el programa A: Nmero de reforzadores obtenidos durante el tiempo que se ha dedicado al
programa A.
La alternancia de programas contina hasta que las tasas locales se igualan.
102
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
ELECCION CON COMPROMISO
(pgina 182 del libro)
Una vez que se tome una decisin, no se puede cambiar.
Programas concurrentes encadenados
La tcnica bsica en este area de
investigacin es el programa concurrente
encadenado de reforzamiento, este consta
de dos fases; eslabn de eleccin; se
permite al participante elegir entre dos
programas alternativos de respuesta. La
oportunidad para el reforzamiento sucede
slo despus de que la eleccin inicial haya
sido realizada y la paloma se encuentra en
el eslabn terminal; otra caracterstica
importante de este programa es que una
vez que el participante ha realizado la
eleccin, esta comprometido con esta hasta el final del programa. Por tanto los programas
concurrentes encadenados implican eleccin con compromiso.
Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de RV,
esta est guiada por el hecho de que ocasionalmente un programa de RV proporciona
reforzamiento por un nmero relativamente pequeo de respuestas.
La consecuencia de responder durante
el eslabon inicial de un programa
concurrente no es el reforzador
primario (comido), es pasar a uno de los
eslabones terminales, la consecuencia
inmediata de una respuesta en un
eslabon inicial es un estmulo que esta
asociado con el eslabn terminal
elegido. Como este estimulo esta
presente cuando se proporciona el
reforzador primario, el estimulo del
eslabn terminal se convierte en
reforzador condicionado . Por tanto, se puede caracterizar un programa concurrente como
aquel en que las respuestas al eslabn inicial se refuerzan por la presentacin de un
reforzador condicionado. Las diferencias en el valor de reforzador condicionado
determinaran entonces la tasa relativa de cada respuesta de eleccin en el eslabon inicial.
103
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Estudios de autocontrol
El autocontrol es a menudo cuestin de elegir una recompensa
grande demorada sobre una recompensa pequea inmediata.
Explicaciones del autocontrol: El valor de un reforzador se reduce en funcin de cuanto
tiempo se tiene que esperar para obtenerlo, funcion descontadora de valor. El consenso
actual es que el valor (V) de un reforzador esta directamente relacionado con la magnitud
de la recompensa (M) e inversamente relacionado con la demora de la recompensa (D), de
acuerdo con la formula: V=M/(1+KD) donde K es el parmetro de la tasa descontadora, esta
ecuacin se llama funcin del decaimiento hiperblico, de acuerdo con esta ecuacin, si el
reforzadro es entregado sin demora (D=0), el valor del reforzador est directamente
relacionado con su magnitud. Cuanto ms se demora el reforzador, menor es su valor.
Las funciones descontadoras y los problemas de autocontrol en la adiccin a las
drogas. Madden, Petry, Badger y bickel (1997) advirtieron que el abuso de sustancias
frecuentemente revela una serie de elecciones impulsivas. Los adictos elegirn la
recompensa relativamente pequea y rpida de la intoxicacin de la droga a riesgo de
consecuencias negativas ms demoradas de problemas interpersonales. Este tipo de
elecciones sugieren que se descuenta el valor (o amenaza) de las consecuencias a largo
plazo. Si esto es cierto, entonces los adictos deberan mostrar funciones de descuento de
la recompensa mas acusadas que otros individuos. Madden y colaboradores (1997)
comprobaron esta prediccin con un grupo de pacientes dependientes de la herona
apuntados aun programa de desintoxicacion y otro grupo de no dependientes igualados en
edad, genero, educacin y CI. Ver ej libro pag 187. Un hallazgo significativo fue que la
funciones descontadoras de la recompensa eran mucho ms acusadas para los adictos a la
herona. Esto indica una falta de control.
104
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Puede entrenarse el autocontrol? Una persona que no puede tolerar esperar el tiempo
necesario para obtener recompensas grandes tiene que olvidarse de obtener esos
reforzadores. El autocontrol, o la preferencia pr una recompensa grande demorada frente a
una recompensa pequea inmediata, es a menudo una estrategia sensible. De hecho, algunos
han sugerido que el autocontrol es un componente crtico de la socializacin y del ajuste
emocional.
Entrenar a las personas con recompensas demoradas parace tener efectos generalizados en
incrementar su tolerancia a la recompensa demorada. En un estudio de eleccin, realizados
con nios de una escuela elemental, a los que se les pregunt si queran conseguir 2 cntimos
inmediatamente o 3 al final del da, se les realizadon tres sesiones de entrenamiento con
una recompensa imediata o demorada.
Durante cada sesin de entrenamiento, se presentaron varios roblemas: uno inclua contar
objetos en una carta, otro era una rarea pictrica, y el tercero era una tarea de
emparejamiento de formas. Para la mitad de los estudiantes, la respuesta correcta era
reforzada inmediatamente con 2 centimos. Para el resto, las respuestas correctas tenian
como resultado 3 cntimos que se situaban en un cuanco y seran entregados al final de da.
Se midi la preferencia por la recompensa pequea inmediata frente a la ms grande
demorada. Siempre y cuando las tareas de entrenamiento implicasen bajo esfuerzo, el
entrenamiento con la recompensa demorada increment la preferencia por la recompensa
ms grande demorada durante el postest. Por tanto, el entrenamiento con reforzamiento
demorado produca autocontrol generalizado.
Comentarios finales
(pgina 189 del libro)
El principio bsico del condicionamiento instrumental es muy simplie: el reforzamiento
aumenta (y el castigo disminuye) la probabilidad futura de una respuesta instrumental. Sin
embargo, como se ha descrito, el anlisis experimental de la conducta instrumental puede
ser bastante intrincado. Muchos aspectos importantes de la conducta instrumental est
determinados por el programa de reforzamiento. Hay numerosos programas por los cuales
las respuestas pueden ser reforzadas. El reforzamiento puede depender de cuntas
respuestas han ocurrido, el paso del tiempo, o la tasa de respuesta. Es ms, puede estar
disponible ms de un programa de reforzamiento al mismo tiempo. El patrn de conducta
instrumental, as como las elecciones entre varias alternativas de respuestas, estn
fuertemente determinados por el programa de reforzamiento en curso. Estos hallazgos han
permitido conocer bastante sobre cmo el reforzamiento controla la conducta en diversas
circunstancias y han alentado muchas aplicaciones importantes de los principios del
reforzamiento a la conducta humana.
105
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
TRMINOS CLAVE
Carrera de razn Tasa de respuesta alta y estable
que se observa tras la pausa posreforzamiento en
los programas de reforzamiento de razn fija. La
carrera de la razn finaliza cuando se ha llevado a
cabo el nmero necesario de respuestas y el sujeto
es reforzado.
Espera limitada Restriccin en cunto tiempo
permanece disponible el reforzamiento. Para que
una respuesta sea reforzada, debe ocurrir durante
el periodo de espera limitada.
Festn del intervalo fijo Incremento gradual de la
tasa de respuesta que ocurre entre
reforzamientos sucesivos en un programa de
intervalo fijo.
Funcin descontadora del valor Funcin matemtica
que describe cmo disminuye el valor del
reforzador en funcin del tiempo que el sujeto
tiene que esperar para la administracin del
reforzador.
Infraigualacin Sensibilidad menor de la predicha
por una igualacin perfecta a la tasa relativa de
reforzamiento.
Ley de la igualacin Regla de la conducta
instrumental, propuesta por R.J.Herrnstein, que
establece que la tasa relativa de respuesta en una
alternativa de respuesta particular es igual a la
tasa relativa de reforzamiento para esa alternativa
de respuesta.
Mejoramiento Mecanismo para alcanzar la
igualacin respondiendo para mejorar las tasas
locales de reforzamiento en las alternativas de
respuesta.
Pausa posreforzamiento Pausa en el responder que
sucede normalmente tras la administracin del
reforzador en los programas de reforzamiento de
razn fija e intervalo fijo.
Programa concurrente Procedimiento de
reforzamiento complejo en el cual el participante
puede elegir cualquiera de dos o ms programas de
reforzamiento simples que estn disponibles
simultneamente. Los programas concurrentes
permiten la medida de la eleccin entre
alternativas de programas simples.
Programa concurrente encadenado Procedimiento
de reforzamiento complejo en el que se permite al
participante elegir cul de varios programas
simples de reforzamiento funcionar. Una vez
realizada la eleccin, las alternativas rechazadas
no estn disponibles durante algn tiempo.
Programa de intervalo Programa de reforzamiento
por el que una respuesta es reforzada slo si
ocurre despus de una cantidad de tiempo
establecida desde el ltimo reforzamiento.
Programa de intervalo fijo Programa de
reforzamiento en el cual el reforzador se entrega
por la primera respuesta que ocurre despus de
una cantidad fija de tiempo desde el ltimo
reforzador. Abreviado IF.
Programa de intervalo variable Programa de
reforzamiento en el que el reforzamiento se
proporciona por la primera respuesta que ocurre
tras una cantidad de tiempo variable desde el
ltimo reforzador. Abreviado IV.
Programa de razn Programa de reforzamiento en
el que el reforzamiento depende slo del nmero
de respuestas que realiza el sujeto,
independientemente de cundo sucedan.
Programa de razn fija Programa de reforzamiento
en el cual debe ocurrir un nmero fijo de
respuestas para que la prxima respuesta sea
reforzada. Abreviado RF.
106
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera
Programa de razn variable Programa de
reforzamiento en el que el nmero de respuestas
necesarias para producir reforzamiento vara de
ensayo a ensayo. El valor del programa se refiere al
nmero medio de respuestas necesarias para el
reforzamiento. Abreviado RV.
Programa de reforzamiento Programa, o regla, que
determina cmo y cundo la ocurrencia de una
respuesta ir seguida por la adaministracin de un
reforzador.
Programa de tasa de respuesta Programa de
reforzamiento en el que la respuesta se refuerz
dependiendo de lo pronto que sta se realiza tras la
ocurrencia previa de la conducta.
Reforzamiento continuo Programa de reforzamiento
en el cual cada ocurrencia de la respuesta
instrumental produce el reforzador. Abreviado RFC.
Reforzamiento diferencial de tasas altas Programa
de reforzamiento en el cual una respuesta es
reforzada slo si ocurre antes de que haya
transcurrido una cantidad especifica de tiempo
despus de la respuesta precedente. Abreviado RDA.
Reforzamiento diferencial de tasas bajas
Programa de reforzamiento en el cual una respuesta
es reforzada slo si ocurre despues de que haya
transcurrido una cantidad especificada de tiempo
despues de la respuesta precedente. Abreviado RDB.
Reforzamiento intermitente Programa de
reforzamiento por el que slo algunas de las
ocurrencias de la respuesta instrumental son
reforzadas. La respuesta instrumental es reforzada
ocasionalmente, o de forma intermitente. Tambin
denominado reforzamiento parcial.
Reforzamiento parcial Lo mismo que reforzamiento
intermitente.
Registro acumulativo Una representacin grfica de
cmo se repite una respuesta a lo largo del tiempo,
con el paso del tiempo representado por la distancia
horizontal (o eje x) y el total o nmero acumulativo
de respuestas que ha ocurrido hasta un momento
determinado representado por la distancia vertical (o
eje y).
Supraigualacin Sensibilidad mayor de la predicha
por una igualacin perfecta a la tasa relativa de
reforzamiento.
Tensin de la razn Deterioro en la respuesta que
sucede cuando el requerimiento de respuesta de una
razn fija se incrementa demasiado rpido.
Tiempo interrespuesta o TIR Intervalo entre una
respuesta y la siguiente. Los TIRs pueden ser
diferencialmente reforzados de la misma manera que
otros aspectos de la conducta, como la fuerza dela
respuesta o la variabilidad.
107
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera 2009/2010
La estructura asociativa del condicionamiento instrumental
- La asociacin E-R y la ley del efecto.
- Expectativa de recompensa y la asociacin E-C
- Relaciones R-C y E(R-C) en el condicionamiento instrumental
Regulacin conductual
- Antecedentes de la regulacin conductual
- Regulacin conductual y el punto de deleite conductual
- Conceptos econmicos y distribucin de respuesta
- Problemas con las aproximaciones de regulacin conductual
- Contribuciones de la regulacin conductual
Comentarios finales
109
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
Se han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre la
respuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra en
explicar la estructura asociativa del condicionamiento instrumental. La otra se origino con
el trabajo de Skinner y se centra en como la conducta esta regulada en vista de las
limitaciones o restricciones creadas por los procedimientos de condicionamiento
instrumental. Las teoras de la regulacin conductual describen los efectos del
reforzamiento dentro del amplio contexto del repertorio conductual de un organismo
utilizando conceptos de varias reas de investigacin, incluyendo la economa conductual y
la ecologa conductual. La aproximacin asociacionista se centra en los mecanismos
moleculares y no se preocupa de la meta a largo plazo o la funcin de la conducta
instrumental. Por el contrario, la aproximacin de la regulacin conductual se centra n los
aspectos molares de la conducta y considera los efectos del condicionamiento instrumental
como manifestaciones de procesos de maximizacin u optimizacin.
La motivacin de la respuesta instrumental ha sido considerada desde dos perspectivas
radicalmente distintas. La primera se origino con Thorndike e incluye el anlisis de la
estructura asociativa del condicionamiento instrumental , radica en el concepto de
asociaciones y es compatible con la tradicin terica del condicionamiento pavloviano. Toma
una perspectiva molecular: se centra en las respuestas individuales y sus antecedentes
estimulares y consecuencia especificas. Para alcanzar este nivel de detalles, la
aproximacin asociativa examina el aprendizaje instrumental en preparaciones conductuales
aisladas. Debido a que las asociaciones pueden encontrar sustento en el sistema nerviosos,
la aproximacin asociativa proporciona un marco conveniente para estudiar los mecanismos
neurales del condicionamiento instrumental.
La aproximacin alternativa a los procesos motivacionales en el aprendizaje instrumental es
la regulacin conductual. Se desarrolla dentro de la tradicin skinneriana e incluye la
consideracin del condicionamiento instrumental en el contexto ms amplio de las mltiples
cosas que el organismo esta haciendo. Esta interesada en como un procedimiento de
condicionamiento instrumental establece los limites al flujo de actividades de un organismo
y las consecuencias conductuales de estas restricciones: considera la motivacin de la
conducta instrumental desde un punto de vista ms molar, las metas y como los organismos
sacan provecho de la complejidad de su ambiente y de sus mltiples opciones conductuales
para alcanzar sus metas.
Dos perspectivas de motivacin de la respuesta instrumental:
Estructura asociativa del condicionamiento instrumental
Concepto de asociacin pavloviano (perspectiva molecularrespuestas especificas)
Regulacin conductual: influencia Skinneriana. Contexto ms amplio que la conducta aislada. Se centra en cmo un
procedimiento instrumental establece lmites a las actividades naturales de un organismo y las consecuencias de
dichas restricciones (perspectiva molar)
110
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
La estructura asociativa del condicionamiento instrumental
(pgina 192 del libro)
Eduard Thorndike fue el primer en reconocer que el condicionamiento instrumental incluye
algo ms que una respuesta y un reforzador. La respuesta instrumental ocurre en presencia
de estmulos particulares. Deben considerarse tres sucesos en el anlisis del
condicionamiento instrumental: el contexto estimular (E), la respuesta instrumental (R) y la
consecuencia de la respuesta instrumental o reforzador (C). Skinner tambin suscribi la
nocin de tres sucesos y describi el condicionamiento instrumental en trminos de una
contingencia de tres trminos que inclua E R y C .
La asociacin E-R ya la Ley del efecto
La asociacin E-R fue postulada por Thorndike
como la clave del aprendizaje instrumental en
su ley del efecto; el papel del reforzador o de
la consecuencia de la respuesta es establecer o
"estampar" una asociacin entre las claves contextuales E y la respuesta instrumental.
Pens que una vez establecida esta asociacin E-R sera, de forma nica, responsable de la
ocurrencia de la respuesta instrumental. Por tanto, el mpetu bsico o motivacin para la
respuesta instrumental era la activacin de la asociacin E-R mediante la exposicin del
sujeto a los estmulos en presencia de los cuales la respuesta instrumental fue previamente
reforzada.
La ley del efecto asume que el nico papel del reforzador es crear una asociacin E-R, que
el reforzador en si mismo no es una parte o no participa en esta asociacin. Esta presuncin
es bastante contraintuitiva.
Expectativa de recompensa y la asociacin E-C
Cualesquiera que sean los estmulos, el reforzamiento de la
respuesta instrumental producira inevitablemente un
emparejamiento entre E y el reforzador o consecuencia de la
respuesta (C). Estos emparejamientos proporcionan el
potencial para el condicionamiento clsico y el
establecimiento de una asociacin entre E y C.
Una de las explicaciones ms tempranas e influyentes del papel del condicionamiento clsico
en la conducta instrumental fue propuesta por Clark Hull (1930,1931) y ms tarde
elaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental.
La respuesta instrumental llega a ser instigada o motivada por dos factores. En primer
lugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociacin
con E-R. En segundo lugar, la actividad instrumental tambin llega a realizarse en respuesta
Thorndike La respuesta ocurre en presencia de
ciertos estmulos particulares.
Recordemos la ley del efecto: La presencia de seales o
estmulos que sealan acontecimientos significativos
(por ejemplo, la disponibilidad de recompensa si
llevamos a cabo una respuesta determinada) controla
nuestra expectativa de recompensa.
Clark Hull
Dos tipos distintos de aprendizaje:
1. Aprendizaje pavloviano E-C
(expectativa de recompensa)
Activa un estado emocional
2. Aprendizaje instrumental E-R.
111
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
a la expectativa de recompensa debido al establecimiento de una asociacin R-C: la forma
concreta en que la asociacin R-C llega a motivar la conducta instrumental ha sido tema de
considerable debate e investigacin experimental. Una formulacin especialmente
influyente fue la teora moderna de los dos procesos /Rescorla y Salomon,1967)
La teora moderna de los dos procesos. Asume que hay dos tipos distintos de
aprendizaje, el condicionamiento pavloviano y el instrumental, adems, estos dos procesos
estn relacionados de una forma especial. Durante el curso de un condicionamiento
instrumental, los estmulos (E) -en presencia de los cuales de refuerza la respuesta
instrumental- se presume que llegan a asociarse con la consecuencia de la respuesta (C) a
travs de condicionamiento pavloviano para establecer una asociacin E-C. A travs de la
asociacin E-C, el estmulo E llega a motivar la conducta instrumental mediante la
activacin de un estado emocional central. La naturaleza de ese estado emocional o
motivacin depender de la naturaleza del reforzador. Por ejemplo, en un procedimiento de
condicionamiento instrumental en el que la respuesta sea reforzada por la presentacin de
comida ( u otro reforzadores apetitivos), la asociacin E-C activa la expectativa de comida
(Mowrer la llamo "esperanza").
Recorla y Salomon (1967) apuntaron que si la expectativa pavloviana motiva la conducta
instrumental, entonces la presentacin de un estmulo condicionado pavloviano debera
alterar el curso de la respuesta instrumentalmente reforzada. La implicacin bsica de la
teora moderna de los dos procesos es que la tasa de una respuesta instrumental ser
modificada por la presentacin de un estmulo clsicamente condicionado. la presentacin
de un EC+ clsicamente condicionado con comida durante la ejecucin de una respuesta
reforzada con comida debera aumentar la esperanza que fue creada por la contingencia
instrumental e incrementar la respuesta.
Resultados consecuentes con la teora moderna de los dos procesos. Utiliza
normalmente un diseo experimental llamado experimento de transferencia de control,
consta de tres fases:
Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algn
programa de reforzamiento positivo o negativo.
Fase 2: Condicionamiento clsico, en el cual se asocia un EC explcito con la presencia o
ausencia de un EI. Es necesario durante esta fase no est presente el condicionamiento
instrumental.
Fase 3: Fase de transferencia crtica. Los participantes pueden realizar la respuesta
instrumental y se presenta periodicamente el EC de la fase 2 para observar su efecto
en la tasa de conducta instrumental.
112
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
Interacciones de respuesta en los experimentos de transferencia de control. Los
estmulos condicionados clsicamente elicitan no slo estados emocionales, sino tambin
respuestas concretas que puede influir sobre la conducta que habamos condicionado. Por
ejemplo, si el estmulo condicionado provoca una conducta de quedarse quieto y la conducta
instrumental que se ha aprendido y reforzado es dar saltos, la presencia del EC disminuir,
interferir. Esto hace ver que no es slo el estado emocional lo que influye en la conducta
reforzada.
Estados emocionales centrales condicionados o expectativas especificas de
recompensa? La teora moderna de los dos procesos asume que el condicionamiento clsico
media la conducta instrumental a travs del condicionamiento de estados emocionales
centrales como la esperanza (en el caso de reforzamiento positivo) o el miedo (en el caso
del reforzamiento negativo). En ciertas circunstancias los animales adquieren expectativas
especificas del reforzador en lugar de un estado emocional ms general de esperanza
durante el condicionamiento instrumental y clsico. El aprendizaje de expectativa
especifica de recompensa es una alternativa importante a la teora de los dos procesos
para explicar ciertos tipos de resultados. Esta basada en la asuncin de que el
condicionamiento instrumental incluye aprendizaje de una asociacin E-C.
Las asociaciones E-C parecen ser fundamentales para la motivacin de la conducta
instrumental, Berridge (2001) apunto que la asociacin E-C, E llega a ser un estmulo de
incentivo; E en si mismo llega a ser atractivo. Esta motivacin adquirida de incentivo
contribuye significativamente a la motivacin de la respuesta instrumental.
Relaciones R-C y E(R-C) en el condicionamiento instrumental
La intuicin sugiere que la conducta instrumental involucra asociaciones R-C, estas no
existen en el modelo de los dos procesos.
Otra peculiaridad de la estructura asociativa del condicionamiento instrumental asumida
por las teoras de los dos procesos es que E supone que llega a estar asociado directamente
con C en la idea de que el emparejamiento de E con C es suficiente para la ocurrencia de
condicionamiento clsico. Los emparejamientos EC-EI no son suficientes para el desarrollo
de asociaciones pavlovianas. El EC debe tambin proporcionar informacin acerca del EI, o
estar de alguna manera relacionado con el EI. Esta condicionalidad en la relacin de E con C
es desestimada en la teora de los dos procesos.
Como resumen: la teora de los dos procesos asume que el condicionamiento clsico media de conducta instrumental a
travs del condicionamiento de estados emocionales centrales como la esperanza o el miedo.
Parece difcil creer que toda la motivacin depende de las asociaciones E-C y E-R teniendo en cuenta que ninguna de ellas
establece una relacin directa entre la respuesta y el reforzador. En la vida diaria hacemos las cosas porque conllevan
una consecuencia determinada, cosa que no refleja la teora de los dos procesos.
113
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
Evidencia de asociaciones R-C; Algunas investigaciones han sugerido que el
condicionamiento instrumental lleva el aprendizaje de asociaciones respuesta-consecuencia.
La devaluacin del reforzador
ha sido utilizada para
determinar si la repuesta
instrumental esta mediada
por una asociacin entre la
respuesta y la consecuencia
reforzante. La supresin
selectiva de respuesta que se obtuvo es difcil de explicar a partir de las asociaciones E-C
o E-R que se supone que son aprendidas de acuerdo con la teora de los dos procesos, la
devaluacin de un reforzador debilita selectivamente la respuesta particular que ha sido
entrenada con ese reforzador. Este hallazgo indica que cada respuesta estaba asociada
separadamente con su propio reforzador.
Evidencia del aprendizaje de una relacin jerrquica E-(R-C); los organismos aprenden
a asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-C
no pueden actuar aisladamente para producir la repuesta instrumental. E no activa R
directamente , sino que activa la asociacin R-C. El sujeto llega a pensar en la asociacin R-
C cuando se encuentra con E, y eso motiva que realice la respuesta instrumental.
Skinner (1938) sugiri que E, R y C en el condicionamiento instrumental estn conectados a
travs de una relacin condicional E-(R-C).
Regulacin Conductual (pgina 199 del libro)
La regulacin conductual se centran en cmo las contingencias instrumentales ponen
limitaciones a las actividades de un organismo.
Antecedentes de la regulacin conductual
Los tericos estn de acuerdo en que los reforzadores son un tipo especial de estmulos.
La teora de la respuesta consumatoria
El primer reto a esta idea vino de Fred Sheffield
que formularon la teora de respuesta
consumatoria, esta atribuye el reforzamiento a
estas conductas tpicas de la especie. Se establece
que las respuestas consumatorias tpicas de la
especie son en si mismas el rasgo critico de los
reforzadores. Fue una innovacin radical debido a
que traslado la investigacin de los reforzadores
desde tipos especiales de estmulos a tipos especiales de respuestas. Se considero que las
respuestas reforzadoras eran especiales porque involucraban la consumacin o el
La importancia de la asociacin R-C se ve con la devaluacin del reforzador.
DEVALUACI N DEL REFORZADOR
Fase 1: Entrenamiento de dos conductas con IV1 con reforzadores distintos.
Fase 2: Devaluacin del reforzador: Reforzador + LiC1 (condicionamiento de
aversin)
Fase 3: Posibilidad de realizar las dos conductas aprendidas La conducta
cuyo reforzador ha sido condicionado aversivamente disminuye.
Las respuestas consumatorias tpicas de la
especia (comer, beber...) son en s mismas el
rasgo crtico de los reforzadores.
Esta teora considera que las respuestas
reforzadoras son especiales porque involucran la
consumacin o el completamiento de una
secuencia instintiva de conducta. La teora
asume que las respuestas consumatorias
(masticar y tragar, por ejemplo) son
fundamentalmente diferentes de varias
respuestas instrumentales potenciales (correr,
saltar...)
114
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
completamiento de una secuencia instintiva de conducta. David Premack retomo el tema con
su teora y sugiri que las respuestas reforzadoras son especiales slo debido a que es ms
probable que ocurran que las respuestas instrumentales a las que siguen.
El principio de Premack: Apunt que
las respuestas incluidas en los
reforzadores comnmente utilizados
eran actividades que es altamente
probable que realicen los animales. Las
respuestas instrumentales son activi-
dades que normalmente ocurren a una
baja probabilidad. Propuso que esta
diferencia en las probabilidades de
respuesta es critica para el reforza-
miento.
Se centra en la diferencia de la probabilidad de las respuestas instrumental y reforzadora.
En consecuencia tambin es denominado el principio de la probabilidad diferencial.
El principio de Premack signific un avance importante en el pensamiento cientfico sobre el
reforzamiento. Estimul la consideracin de los reforzadores como respuestas ms que
como estmulos, y ampli mucho el rango de cosas que los investigadores empezaron a
utilizar como reforzadores. Cualquier actividad poda servir como reforzador siempre y
cuando fuera ms probable que la respuesta instrumental.
Principio de Premack
Las respuestas incluidas en los reforzadores comnmente
utilizados son actividades que es altamente probable que
realicen los animales.
Principio de Premack o "Principio de la probabilidad diferencial"
"Dadas dos respuestas de diferente probabilidad, A y B, la
oportunidad para realizar la respuesta de alta probabilidad A
despus de la respuesta de baja probabilidad B tendr como
resultado el reforzamiento de la respuesta B. (BA refuerza B). La
oportunidad para realizar la respuesta B de baja probabilidad
despus de la respuesta A de alta probabilidad no dar como
resultado el reforzamiento de la respuesta (A no refuerza A)"
Principio de Premack
Una conducta muy probable es una conducta muy preferida.
Las conductas probables (preferidas) sirven para reforzar las
menos probables y hacer que se repitan ms en el futuro.
Respuesta reforzadora: La que se usa para reforzar otra.
Respuesta instrumental: La que es reforzada con otra.
Principio de Premack
Tambin sirve para el castigo...
Las conductas poco probables (no preferidas)
sirven para castigar la ms probables y hacer que
no se repitan tanto en el futuro.
La conducta instrumental es la castigada.
115
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
La hiptesis de la privacin de respuesta: En la mayora de los procedimientos de
condicionamiento instrumental, la probabilidad momentanea de una respuesta reforzada se
mantiene a un nivel alto mediante la restriccin al acceso a la respuesta reforzante.
Premack (1965) reconoci la importancia de restringir el acceso a respuesta reforzadora
para el condicionamiento instrumental. Caracterizo la privacin de respuesta no slo como
una condicin necesaria para el reforzamiento sino como algo adjunto al principio de
probabilidad diferencial. La respuesta reforzadora todava tiene que ser una conducta ms
probable que la respuesta instrumental. Por el contrario, Timberlake y Allison (1974)
abandonaron totalmente el principio de probabilidad diferencial y argumentaron que la
restriccin de la respuesta reforzadora era el factor critico para el reforzamiento
instrumental, esta propuesta es denominada Hiptesis de privacin de respuesta, hace
explcita la idea radicalmente diferente de que un reforzador es producido por la
contingencia instrumental en si misma. Posteriores desarrollos de las teoras de regulacin
conductual han establecido como las contingencias instrumentales crean los reforzadores y
los efectos del reforzamiento.
Regulacin conductual y el punto de deleite conductual
Las teoras de la regulacin conductual asumen que existen mecanismos homeostticos
anlogos respecto a la conducta. Se propone que los organismos tienen una distribucin de
actividades preferida u optima que luchan por mantener frente a los cambios o
interrupciones. Se centran en el grado en que la contingencia instrumental respuesta-
reforzador rompe la estabilidad conductual y empuja al individuo fuera de su distribucin
de actividades preferida u optima.
El punto de deleite conductual. La teora
de la regulacin conductual asume que si los
organismos son libres para distribuir sus
respuestas entre las alternativas
disponibles, lo harn de la forma en que
sea ms cmodo o en algn sentido optimo
para ellos. Esta distribucin de respuestas
define el punto de deleite conductual.
El punto de deleite conductual puede
identificarse mediante la frecuencia
relativa de ocurrencia de todas las
respuestas de un organismo en una situacin sin restricciones.
Hiptesis de la privacin de la respuesta: Lo importante no es la probabilidad diferencial de las conductas (cules
se repitan ms y cules menos), sino el estado de privacin de una determinada conducta. Puede que en el estado
natural correr sea una conducta de baja probabilidad, pero si yo privo el acceso a esta conducta, entonces la puedo usar
como respuesta reforzadora.
116
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
Imposicin de una contingencia instrumental. La teora de regulacin conductual establece
que los organismos defendern el punto de deleite conductual contra los cambios. Lo
interesante es que la lnea de base libre del
punto de deleite conductual no siempre puede
ser restablecida despus de que se haya
introducido una contingencia instrumental. Este
es a menudo el dilema que impone una
contingencia instrumental. No permite volver al
punto de deleite.
El punto de deleite proporciona la
motivacin para la conducta
instrumental. La teora de
regulacin conductual asume que
para volver al punto conductual
establecido continua siendo una
meta en la distribucin de
respuestas. Cuando este meta no
puede alcanzarse, la redistribucin
de las respuestas entre las
conductas instrumental y
contingente llega a ser una cuestin
de ajuste. La tasa de una respuesta
se mantiene lo mas cerca posible
del nivel preferido sin cambiar la otra respuesta demasiado de su nivel preferido.
Staddon propuso un modelo de desviacin mnima de regulacin conductual para resolver
el dilema de las restricciones del programa, la introduccin de una contingencia respuesta-
reforzador provoca que los organismos redistribuyan sus conductas entre las respuestas
instrumentales y contingentes de manera que se minimice la desviacin total de las dos
respuestas con respecto al punto optimo o de deleite.
Explicacin los efectos de reforzamiento. La regulacin conductual incluye la defensa de
un punto de deleite conductual frente a restricciones de respuesta impuestas por una
contingencia respuesta-reforzador. Esta defensa puede requerir establecerse en algn
punto cercano peno no exactamente en el punto de deleite de la lnea base. El aumento en la
respuesta instrumental (un efecto de reforzamiento ) es el resultado de mecanismos
reguladores de la conducta que funcionan para minimizar las desviaciones del punto de
deleite conductual.
Una visin sobre las contingencias de reforzamiento en un contexto conductual mas
amplio: Las contingencias instrumentales no suceden en un vaco conductual ocurren en el
contexto de una variedad de respuestas y reforzadores que puede obtener el sujeto.
Imposicin de una contingencia instrumental:
Si dejamos al sujeto a su aire, se quedar en el
punto de deleite. Eso puede ser malo ( ejemplo:
estudiar poco, fumar mucho...)
El terapeuta quiere modificar esa distribucin de
conductas haciendo que se apartasen del punto de
deleite. Cmo? Mediante reforzamientos y castigos.
117
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
Centrarse solo en la respuesta instrumental y sus estmulos antecedentes y consecuentes
(esto es, la estructura asociativa de la conducta instrumental) desatiende el contexto
conductual mas amplio ya que puede influir de forma significativa en el resultado de los
procedimientos particulares de condicionamiento instrumental.
Conceptos econmicos y distribucin de respuesta
En las situaciones de condicionamiento instrumental, las restricciones estn proporcionadas
por el nmero de respuestas que un organismo es capaz de realizar y el nmero de
respuestas requerido para obtener cada reforzador.
Demanda del consumidor. La relacin entre el precio de una comodidad y cuanto se obtiene
se denomina curva de la demanda.
El grado en el cual el precio influye en el
consumo se denomina elasticidad de la
demanda.
El concepto de demanda del consumidor
puede utilizarse para analizar el refor-
zamiento instrumental considerando el
numero de respuestas realizadas como
anlogo al dinero. EL precio de un
reforzador es el tiempo o numero de
respuestas requeridas para obtener un
reforzador. Por tanto, el precio del
reforzador esta determinado por el
programa de reforzamiento.
Determinantes en la elasticidad de la demanda.
Los conceptos econmicos han ayudado a identificar tres factores principales que influyen
en como las restricciones de un programa moldean la redistribucin de la conducta.
1 Disponibilidad de sustitutos: Es el factor que mas influye en la elasticidad de la
demanda. La disponibilidad de sustitutos
aumenta la sensibilidad del articulo a los precios
altos.
Una fuente de reforzadores sustituible es la disponibilidad de un reforzador fuera de la
sesin experimental. La parte de comida que no comen durante la sesin experimental se
les da luego en la jaula hogar, esta situacin se denomina una economa abierta, Esto se
contrapone con una economa cerrada, en la cual los sujetos no reciben alimentacin
118
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
suplementaria. En general la elasticidad de la demanda es mayor en situaciones de economa
abierta que en economas cerradas.
2 Rango de precios: Un aumento en el
precio tiene menos efecto en precios
bajos que en precios altos.
3 Nivel de ingresos: En estudios de
condicionamiento instrumental, el
nmero de respuestas o la cantidad de
tiempo disponible para responder
corresponde a los ingresos. Cuantas ms
respuestas o tiempo tengan disponibles
los animales, menos estar su conducta
influida por los aumentos en el coste del
reforzador.
Problemas con las aproximaciones de regulacin conductual
El punto de deleite es una caracterstica
molar de la conducta. Se basa en una medida
de cada respuesta acumulada a lo largo del
bloque temporal amplio. Un punto de deleite
molar dado puede alcanzarse de varias
formas, de acuerdo con esta aproximacin ,
las diferencias en las pautas de respuesta no
deberan tener importancia. Pero la evidencia
experimental indica que es importante como
se alcanza el punto de deleite molar. En
consecuencia una adecuada caracterizacin del deleite conductual requiere informacin
sobre las pautas de eleccin moleculares.
Otra dificultad, tal vez ms seria es que las respuestas durante un periodo de lnea base
libre no siempre tiene el mismo valor como respuestas que ocurren como parte de una
contingencia instrumental impuesta, Hacer algo cuando no hay requerimientos impuestos
externamente (correr por placer ) parece ser diferente a hacer lo mismo cuando se
requiere por una contingencia instrumental impuesta.
Finalmente, debido a que las aproximaciones no comprenden procesos conductuales
moleculares, no dicen nada de cmo los organismos defienden una combinacin favorita de
bienes o actividades.
1. El punto de deleite se formula desde un punto de vista
molar (como un conjunto, y a lo largo de un periodo
amplio). Sin embargo, est demostrado que es
importante cmo se alcanza ese punto de deleite
(pausas de eleccin en los cambios de conducta a
otra) desde un punto de vista ms molecular.
2. El "valor reforzante de una conducta puede cambiar
segn si es obligada o no. Por ejemplo, al principio
una conducta A puede ser agradable, pero cuando la
utilizo para reforzar otra conducta B, estoy
imponiendo la conducta A. Cmo s si sigue siendo
tan agradable como al principio?
119
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
Contribuciones de la regulacin conductual
1 Nos alej de la consideracin de los
reforzadores como tipos especiales de
respuestas. Los efectos del reforzamiento se
ven como producidos por las restricciones del
programa en el devenir de las actividades de
un organismo.
2 Los procedimientos de condicionamiento
instrumental ya no se considera que estampan
o fortalecen la conducta instrumental: en su
lugar el condicionamiento instrumental es
visto como la creacin de una nueva
distribucin o asignacin de respuestas, la
reasignacin de la conducta incluye un
aumento en la respuesta instrumental y una
disminucin de la respuesta reforzadora.
3 No existe una distincin fundamental entre
las respuestas instrumentales y las
reforzadoras, se distinguen solo por los
papeles asignados a ellas mediante un
procedimiento de condicionamiento instrumental.
4 Aceptan la idea de que los organismos responden para maximizar sus beneficios.
5 Han proporcionado caminos nuevos y precisos para describir las restricciones que
imponen varios procedimientos de condicionamiento instrumental en el repertorio de
conducta de un organismo. Mas importante, han enfatizado que la conducta instrumental no
puede ser estudiada en un vaco o en un tubo de ensayo conductual. Todas las opciones de
respuesta del organismo que se dan en un momento dado deben ser consideradas como un
sistema.
Comentarios finales
Los procesos motivacionales en la conducta instrumental se ha enfocado desde dos
perspectivas radicalmente diferentes y dos tradicionales intelectuales: la perspectiva
asociacionista tiene sus raices en la ley del efecto de Thorndike y el condicionamiento
pavloviano, y la perspectiva de la regulacin conductual tiene su origen en el anlisis
conductual skinneriano. Estas dos aproximaciones difieren ms que se asemejan, haciendo
difcil imaginar cmo podran integrarse. Por ejemplo, el concepto fundamental en la
1. Antes se pensaba en los reforzadores como tipos
especiales de estmulos. Desde la aproximacin de la
regulacin conductual, la causa del reforzamiento est
en la forma en que el flujo libre, natural, de la conducta
se ve alterado por las contingencias instrumentales. Una
conducta puede ser reforzante.
2. Ahora, el entrenamiento instrumental ya no sirve slo
para "fijar" o "eliminar" una conducta, sino que crea una
nueva distribucin de conductas en general.
3. Una respuesta reforzadora no tiene nada inherente
distinto de una respuesta instrumental: no proporciona
ningn beneficio especial, por ejemplo fisiolgico (hacer
ejercicio vs. Comer caramelos). Simplemente, el que una
conducta sea reforzadora o instrumental va a depender
de los papeles que les asigne el terapeuta o
experimentador.
4. Ha contribuido a ver el condicionamiento instrumental
como un sistema, en vez de cmo elementos aislados.
Al cambiar un solo elemento, el sistema entero se ve
afectado.
120
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
aproximacin asociacionista (el concepto de una asociacin) es enteramente soslayado por
la regulacin conductual. Igualmente, los conceptos crticos de la regulacin
conductual(puntos de deleite y restricciones del programa) no tienen correspondencia en la
aproximacin asociacionista. La aproximacin asociacionista por s misma lleva un inmediato
a la exploracin de los circuitos neurales de condicionamiento instrumental. Por otra parte,
es difcil ver cmo la aproximacin de la regulacin conductual podra utilizarse para guiar
la investigacin neurofisiolgica.
Las dos aproximaciones parecen centrarse en asuntos completamente distintos, pero ambas
han contribuido de forma significativa a la compresin de la motivacin de la conducta
instrumental. Es evidente que una aproximacin no puede ignorarse a favor de la otra, pero
cmo contribuye cada una a la compresin completa de la motivacin instrumental?.
Una forma de pensar sobre las dos aproximaciones es que incluyen diferentes niveles de
anlisis. La asociacionista involucra un nivel molecular donde el objetivo son los estmulos
especficos, las respuestas, y sus conexiones. En contraste, como se ha descrito, la
regulacin conductual opera a un nivel molar de agregados de conducta y de contextos
conductuales ms amplio en el que operan las contingencias instrumentales. Por tanto, la
aproximacin de la regulacin conductual contacta mejor con las complejidades de la
ecologa de un organismo.
Otra forma de pensar en la relacin entre las dos aproximaciones es que una se relaciona
con procesos y la otra est ms relacionada con funciones o metas a largo plazo. La
aproximacin asociacionista describe procesos especficos [asociaciones E-R, E-C, R-C y E-
(R-C)] que sirven para generar y dirigir la conducta instrumental, pero no tienen en cuenta
el propsito o funcin a largo plazo del aprendizaje instrumental. ste es el punto de vista
de la regulacin conductual y la economa conductual, que asumen que los organismos
trabajan para defender una distribucin ptima de actividades. La defensa del punto de
deleite conductual se alcanza mediante los procesos moleculares de las asociaciones.
Los desarrollos conceptuales en el estudio de la motivacin de la conducta instrumental
proporcionan un ejemplo representativo del curso de la investigacin cientfica. sta se ha
desarrollado desde formulaciones simples estmulo-respuesta hasta consideraciones ms
comprensivas de la forma en que el repertorio del organismo se restringe mediante las
contingencias instrumentales y cmo los organismos resuelven problemas ecolgicos
complejos. En ese aspecto del estudio del condicionamiento y el aprendizaje, tal vez ms
que en ningn otro, los investigadores se han movido con atrevimiento para explorar nuevas
concepciones cuando las viejas ideas no afrontaban con xito los desafos propuestos por
los hallazgos empricos.
121
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
Juan Carlos Cabrera
TERMINOS CLAVE (pgina 216 del libro)
Curva de la demanda Relacin entre la cantidad
que se obtiene de una comodidad y su precio.
Elasticidad de la demanda Grado en el que el precio
influye sobre el consumo u obtencin de una
comodidad. Si el precio tiene un efecto
importante en el consumo, la elasticidad de la
demanda es alta. Si el precio tiene poco efecto
sobre el consumo, la elasticidad de la demanda es
baja.
Experimento de transferencia de control
Experimento que evala los efectos de un
estmulo condicionado clsicamente (EC) en la
ejecucin de la conducta instrumental. El EC y la
respuesta instrumental se condicionan en primer
lugar en fases independientes del experimento.
Los efectos del EC sobre la respuesta
instrumental se determinan entonces en la fase
de transferencia.
Hiptesis de la privacin de respuesta Explicacin
del reforzamiento que defiende que la restriccin
el acceso a una respuesta por debajo de su tasa
de lnea base de ocurrencia (privacin de
respuesta) es suficiente para hacer que la
oportunidad de ejecutar esa respuesta acte
como un reforzador positivo efectivo.
Modelo de desviacin mnima Modelo de conducta
instrumental, segn el cual los participantes
responden a la contingencia respuesta-
reforzador de manera que los acerque lo mximo
posible a su punto de deleite conductual.
Punto de deleite conductual Distribucin preferida
de las actividades de un organismo antes de que
se introduzca un procedimiento de
condicionamiento instrumental que disponga
limitaciones en la distribucin de respuesta.
Principio de Premack Lo mismo que principio de
probabilidad diferencial.
Principio de probabilidad diferencial Principio que
asume que el reforzamiento depende la
probabilidad relativa del organismo de ejecutar la
respuesta reforzadora frente a la respuesta
instrumental antes de que se introduzca el
procedimiento de condicionamiento instrumental.
Cuanta ms diferencia exista entre la
probabilidad de la respuesta reforzadora y la
instrumental durante las condiciones de lnea de
base, mayor ser el efecto reforzante de
proporcionar la oportunidad de ejecutar la
respuesta reforzadora tras realizar la
instrumental. Tambin conocido como principio de
Premack.
Teora de la respuesta consumatoria Teora que
asume que las respuestas consumatorias tpicas
de la especia (comer, beber y cosas as) son las
caractersticas fundamentales de los
reforzadores.
123
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera 2009/2010
Identificacin y medida del control por el estmulo
- Respuesta diferencial y discriminacin de estmulos
- Generalizacin de estmulos
- Los gradientes de generalizacin del estmulo como medida de control por el estmulo.
Factores del estmulo y la respuesta en el control por el estmulo
- Capacidad sensorial y orientacin.
- Facilidad relativa del condicionamiento de varios estmulos.
- Tipo de reforzamiento.
- Tipo de respuesta instrumental.
- Elementos del estmulo frente a claves configuracionales en los estmulos compuestos.
Factores de aprendizaje en el control por el estmulo
- Entrenamiento en discriminacin de estmulos.
- Efectos del entrenamiento en discriminacin sobre el control por el estmulo.
- Rango de posibles estmulos discriminativos.
- Qu se aprende en el entrenamiento de discriminacin?
- Interacciones entre el E+ y el E-: desplazamiento del mximo
- Entrenamiento de equivalencia de estmulos
Claves contextuales y relaciones condicionales
- Control por claves contextuales.
- Control por las relaciones condicionales.
Comentarios finales
Es tan importante la adecuacin de una respuesta instrumental al contexto estimular en el
que se realiza, que la falta de un apropiado control por el estmulo se considera a menudo
anormal, desvestirse en privado es aceptable en publico motivo de arresto.
El control de la conducta por el estmulo es un aspecto importante de la forma en que los
organismos se adaptan al ambiente. Para acomodarse de forma efectiva y evitar el peligro
los animales tienen que comportarse de forma congruente con las circunstancias
cambiantes.
Identificacin y medida del control por el estmulo
(pgina 218 del libro)
Cmo se puede afirmar que una respuesta instrumental esta bajo el control de ciertos
estmulos?.
Respuesta diferencial y discriminacin de estmulos
El control por el estmulo de la conducta
instrumental se demuestra mediante variaciones
en la respuesta (respuesta diferencial) rela-
cionadas con las variaciones en los estmulos. Si
un organismo responde de una manera en
presencia de un estmulo, y de forma diferente
en presencia de otro, se puede decir que su
conducta esta bajo el control de esos estmulos.
Estas respuestas diferenciales resultan eviden-
tes en el comportamiento de las dos palomas del
experimento de Reynolds.
La respuesta diferencial a dos estmulos tambin
indica que las palomas estaban tratando cada
estmulo de forma diferente. Esto se denomina
discriminacin de estmulos. Se dice que un
organismo muestra discriminacin de estmulos si
responde de forma diferente a dos o ms
estmulos. La discriminacin de estmulos y el
control por el estmulo constituyen dos maneras
de considerar el mismo fenmeno: una no existe
sin la otra. Si un organismo no discrimina entre dos estmulos, su conducta no esta bajo el
control de esas claves.
Reynolds (1961)
Entrenamiento:
Prueba:
Resultados: una paloma picoteaba ms el circulo
rojo y para la otra fue el tringulo blanco.
Conclusiones:
Si un cambio en el estmulo conlleva un cambio
en la conducta, es que ese estmulo controla
en cierta medida esa conducta.
Para que un estmulo controle una conducta, el
organismo tiene que poder distinguir ese est-
mulo de otros (diferenciar al estmulo com-
puesto del crculo por un lado y del tringulo
por el otro).
En esta situacin es difcil predecir qu compo-
nente del estmulo original va a tener el con-
trol. Unas palomas responden ms al crculo,
otras al tringulo.
125
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
Otro aspecto interesante del experimento de Reynolds es que la conducta de cada pjaro
estaba controlada por un estmulo diferente. En ausencia de procedimientos especiales, los
investigadores no siempre pueden predecir cual de varios estmulos de aquellos que un
organismo experimenta adquirir control sobre su conducta instrumental
Generalizacin de estmulos
Identificar y diferenciar varios estmulos no es algo tan simple. Los estmulos pueden
definirse de formas muy diversas. En ocasiones, objetos o eventos muy diferentes se
consideran ejemplos del mismo estmulo debido a que comparten la misma funcin. En otros
casos, los estmulos se identifican y distinguen partiendo de rasgos fsicos precisos, como
la longitud de onda.
Los anlisis experimentales del problema han dependido en su mayora del fenmeno de la
generalizacin de estmulos, que es lo opuesto a la respuesta diferencial, o discriminacin
de estmulos. Se dice que un organismo muestra generalizacin de estmulos si responde
manera similar a dos o mas estmulos. Este fenmeno fue observado en primer lugar por
Pavlov.
En un experimento clsico Guttman y Kalish palomas programa IV picotear con luz
amarillenta con longitud de onda 580 anmetros, despus se observa que palomas tambin
responde a 570 y590. Estos resultados mostraron un gradiente de respuesta en funcin de
la semejanza entre cada estmulo de prueba y el estmulo original de entrenamiento. Este
resultado es un ejemplo de lo que se denomina gradiente de generalizacin de estmulo.
Los gradientes de generalizacin del estmulo como medidas del control por el
estmulo
Se utilizan a menudo para medir el control por el estmulo porque facilitan informacin
acerca del grado de sensibilidad de la conducta de un organismo ante la variacin de un
aspecto particular del ambiente.
Guttman y Kalish (1956) y el experimento hipottico con las palomas ciegas a los colores
indica que lo acusado del gradiente de generalizacin de un estmulo proporciona una
medida precisa del grado de control del estmulo. Se obtiene un gradiente de
generalizacin plano si el organismo responde de forma similar a todos los estmulos de la
prueba. Esta falta de respuesta diferencial demuestra que el rasgo del estmulo que se
varia en la prueba de generalizacin no controla la conducta instrumental. Por el contrario,
se obtiene un gradiente de generalizacin acusado si el organismo responde en mayor
medida a algunos de los estmulos de prueba que a otros. Esta respuesta diferencial
126
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
evidencia el hecho de que la conducta instrumental esta bajo el control del rasgo del
estmulo que varia entre los estmulos de prueba.
Si se da una gran cantidad de generalizacin, se dar poca respuesta diferencial. Si la
respuesta es altamente diferencial ante los estmulos, se obtendr una mnima
generalizacin.
Factores del estmulo y la respuesta en el control por el estmulo.
(pgina 222 del libro)
La cuestin principal es la siguiente Qu es lo que determina que una de las muchas
caractersticas de una situacin estimular adquiera control sobre la conducta
instrumental?.
Capacidad sensorial y orientacin
El factor que determina de forma mas evidente si una caracterstica particular del
estmulo llega a controlar la respuesta es la capacidad sensorial y de orientacin del
individuo. La presentacin de estmulos con ciertas caractersticas de inters para un
organismo no garantiza que otro organismo responder a las mismas caractersticas.
Los sucesos fuera del rango de lo que un organismo puede detectar con sus rganos
sensoriales simplemente no existen para ese organismo a menos que se amplifiquen o sean
traducidos a algo que el organismo pueda detectar. Las limitaciones en los estmulos que
pueden llegar a controlar la conducta dependen tambin de si el individuo llega a tomar
contacto con el estmulo.
127
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
Facilidad relativa del condicionamiento de varios estmulos
La intensidad con que los organismos aprenden
sobre un estmulo depende de la facilidad relativa
de condicionamiento de otras claves presentes en la
situacin. Este fenmeno se llama
ensombrecimiento. Pavlov fue el primero en
observar que si dos estmulos se presentan al mismo
tiempo, la presencia del estmulo que se puede
entrenar mas fcilmente puede ocultar el
aprendizaje del otro. En general cuanto ms intenso
sea el estmulo , ms rpido se condicionara y
ensombrecer el aprendizaje del estmulo mas
dbil. Pavlov encontr que el estmulo dbil poda
llegar a condicionarse (algo ms lentamente ) si se
presentaba solo.
Tipo de reforzamiento
Es ms probable que ciertos tipos de
estmulos adquieran control sobre la
conducta instrumental con reforzamiento
positivo que con reforzamiento negativo.
Ciertos hallazgos indican que el control por
el estmulo de la conducta instrumental
esta determinado en parte por el tipo de
reforzamiento utilizado. Es ms probable
que los estmulos visuales adquieran control
sobre la conducta en situaciones apetitivas
que las claves auditivas, mientras que es
mas probable que estas adquieran control
en situaciones aversivas.
Esto est probablemente relacionado con
los sistemas de conducta que se activan en
los dos casos, la activacin del sistema de alimentacin puede involucrar una sensibilidad
incrementada a los estmulos visuales. En contraste los procedimientos de evitacin de la
descarga activan el sistema de conducta defensiva. Responder a claves auditivas puede ser
particularmente adaptativo para evitar el peligro.
Efectos del tipo de reforzamiento en el control por el estmulo. Se
reforz una respuesta de presin de un pedal en palomas en
presencia de un estmulo compuesto consistente en un tono y
una luz. Con un reforzamiento con comida, la luz obtuvo mucho
ms control sobre la conducta que el tono. Con un
reforzamiento de evitacin de una descarga, el tono adquiri
mucho ms control sobre la conducta que la luz (Adaptado de
Foree y Lolordo, 1973.)
Factores del estmulo y la respuesta.
1. Capacidad sensorial del individuo.
2. Facilidad de condicionamiento del estimulo.
Unos estmulos se
condicionan mejor que
otros, por su
intensidad,
naturaleza...
128
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
Tipo de respuesta instrumental
Otro factor que puede determinar que rasgos de un estmulo compuesto obtendrn control
sobre la conducta es la naturaleza de la respuesta requerida por el reforzamiento.
Las respuestas que se diferencian por la localizacin es mas probable que lleguen a estar
bajo el control de la caracterstica espacial de las claves auditivas. Por el contrario las
respuestas que se diferencian por la naturaleza (hacer/no hacer) es mas probable que
lleguen a estar bajo el control de la naturaleza de las claves auditivas. Este fenmeno se
denomina efecto de la naturaleza-localizacion. Este efecto es una forma de asociacin
selectiva.
El efecto de naturaleza-localizacin no significa que los sujetos no puedan nunca aprender
sobre la naturaleza de los sonidos cuando estn involucradas respuestas que se diferencias
espacialmente o que nunca puedan aprender acerca de la localizacin de los sonidos en una
tarea de hacer/no hacer. Con un emplazamiento oportuno de las fuentes de sonido (uno
mucho ms cerca de la respuesta que el otro), los sujetos pueden llegar a responder a las
caractersticas de localizacin de sonidos en una tarea de hacer/no hacer.
Elementos del estmulo frente a claves configuracionales en los estmulos
compuestos.
En el anlisis anterior sobre el control de la conducta por varios elementos del estmulo, se
asumi que los organismos tratan a estos elementos del estmulo como rasgos distintivos y
separados del ambiente. Esto se denomina aproximacin elemental del estmulo. Por tanto,
en el efecto de naturaleza-localizacin, la naturaleza y la localizacin de un estmulo
auditivo se consideran caractersticas separables de las claves auditivas. Se supona que
una caracterstica particular del estmulo (la naturaleza del sonido) se perciba de la misma
manera independientemente del estatus de la otra caracterstica (la localizacin del
sonido). Una alternativa terica importante presuma que los organismos tratan los
estmulos complejos como un todo integral que no se divide en partes o elementos. Esto se
denomina aproximacin de la clave configuracional.
De acuerdo con la aproximacin de la clave configuracional, los individuos responden a un
estmulo compuesto en funcin de la configuracin nica de sus elementos. Se asume que los
elementos no se tratan como entidades separadas. Pueden incluso no ser identificables
cuando se presenta el estmulo compuesto, los elementos del estmulo son importantes no
en cuanto a su individualidad sino en funcin de cmo contribuyen a la configuracin total
de la estimulacin proporcionada por el compuesto.
El ensombrecimiento , segn esta teora, refleja diferentes grados de decremento de la
generalizacin desde la fase de entrenamiento a la de prueba para los grupos de
ensombrecimiento y de control, (John Pearce, 1987): No hay decremento de la
generalizacin para el grupo de control cuando se prueba el estmulo dbil a porque es el
mismo estmulo que recibi durante el condicionamiento. Por el contrario, se da un
129
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
considerable decremento de la generalizacin cuando se prueba el estmulo a en el grupo de
ensombrecimiento tras el condicionamiento con el compuesto aB. Para el grupo de
ensombrecimiento, la respuesta se condiciona al compuesto aB, que es muy diferente de
presentar slo a durante la generalizacin, este mayor decremento de la generalizacin es
la causa del efecto de ensombrecimiento.
En ciertas condiciones, los organismos claramente responden a los estmulos compuestos
principalmente en trminos de la configuracin de los elementos que forman el compuesto.
Esta teora es incompatible con varios ejemplos de asociaciones selectivas que se han
descrito con anterioridad, no explica por que el control por el, estmulo esta en funcin del
tipo de reforzamiento utilizado o del tipo de respuesta requerida. La conclusin mas
prudente es que los organismos responden a los compuestos estimulares tanto a partir de
los elementos del estmulo que forman el compuesto como en funcin de configuraciones
estimulares nicas creadas por los elementos del estmulo. En ciertas circunstancias
predomina el control elemental, mientras que en otras condiciones predomina el control de
las caractersticas configuracionales de los compuestos estimulares.
La estructura de una teora unificada de este tipo ha sido descrita recientemente por
Wagner y Brandon (2001), estmulos como el sonido de un tono contienen rasgos distintivos
(tono, intensidad, localizacin ). Cuando un estmulo se combina con otro se crean nuevos
elementos estimulares configuracionales que son nicos para este nueva combinacin
estimular. Adems, algunos de los rasgos individuales de los estmulos originales se pierden
en la combinacin. Esto sesga el control por el estmulo a favor de los elementos
configuracionales y produce resultados congruentes con la aproximacin de la clave
configuracional.
FACTORES DE APRENDIZAJE EN EL CONTROL POR EL
ESTMULO (pgina 230 del libro)
Los factores del estmulo y la respuesta son los puntos de arranque del control por el
estmulo. El que ciertos estmulos lleguen a controlar la conducta a menudo depende de lo
que el organismo ha aprendido acerca de esos estmulos.
La sugerencia de que la experiencia con los estmulos puede determinar hasta que punto
estos llegan a controlar la conducta tuvo su origen en los esfuerzos por explicar el
fenmeno de la generalizacin de estmulos. Pavlov sugiri que la generalizacin del estmulo
se da porque el aprendizaje sobre el EC llega a transferirse a otros estmulos en funcin de
la semejanza fsica de esos estmulos de prueba con el EC original.
Lashley y Wade (1946) adoptaron una postura contraria a la de Pavlov. Rechazaron la idea
de que la generalizacin del estmulo reflejase la transferencia del aprendizaje y
argumentaron que reflejaba la ausencia de aprendizaje. En particular propusieron que la
generalizacin del estmulo ocurre si los organismos no han aprendido a distinguir las
diferencias entre los estmulos. Defendan que los animales tenan que aprender a tratar
los estmulos como diferentes uno de otro. Consideraban la forma del gradiente de
130
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
generalizacin del estmulo como determinada principalmente por las experiencias previas
de aprendizaje del organismo mas que por las propiedades fsicas de los estmulos.
Entrenamiento en discriminacin de estmulos.
Numerosos estudios han demostrado que el control por el estmulo puede alterarse de
forma notable por las experiencias de aprendizaje. El procedimiento ms poderoso para
situar la conducta bajo el control de un estmulo es el entrenamiento en discriminacin de
estmulos. En un procedimiento de discriminacin de estmulos los participantes se
exponen al menos a dos estmulos diferentes, pero el reforzamiento por realizar la
respuesta instrumental esta disponible solo en presencia de uno de los colores. El estmulo
que seala la disponibilidad de reforzamiento se denomina E+ o E
D
(pronunciado e de). En
contraste, el estmulo que seala la falta de reforzamiento se denomina E- o E

(pronunciado e delta). Los


procedimientos de discriminacin de
estmulos establecen un control por
los estmulos que sealan cuando
esta o no disponible el
reforzamiento. Cuando E+ y E- han
adquirido control sobre la conducta
del organismo, se denominan
estmulos discriminativos . El E+ es
un estmulo discriminativo para la
realizacin de la respuesta
instrumental, y el E- es un estmulo
discriminativo para la supresin de
la respuesta.
Los procedimientos instrumentales de discriminacin de estmulos se diferencian de los
procedimientos de condicionamiento clsico slo en que el reforzador se presenta de forma
contingente a la respuesta durante el E+. No es necesario responder para que se den los
emparejamientos del EC+ con el EI en el condicionamiento clsico. A diferencia de un EC+,
un E+ no seala de que el reforzador ocurrir inevitablemente. Ms bien, el E+ indica que la
respuesta instrumental ser reforzada.
En un programa mltiple de reforzamiento funcionan diferentes programas de
reforzamiento en presencia de diferentes estmulo.
Efectos del entrenamiento en discriminacin sobre el control por el estmulo
El entrenamiento en discriminacin sita la conducta instrumental bajo el control del E+ y
el E-. Los investigadores deben tambin determinar lo acusado del gradiente de
generalizacin cuando los participantes responden en presencia de estmulos que varan
sistemticamente a partir del E+: Es mas debe determinarse que aspecto del procedimiento
131
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
del entrenamiento en discriminacin es responsable del tipo de gradiente de generalizacin
del estmulo que se obtiene.
Jenkins y Harrison (1960,1962) examinaron como los estmulos auditivos que diferan en el
tono llegaban a controlar la conducta de picoteo de las palomas reforzada con comida. Un
grupo de pjaros fue reforzado por picotear en presencia de un tono de 1000 hertzios y no
reciba reforzamiento cuando el tono no se presentaba. El tono de 1000 hz serva como E+
y la ausencia de tono como E-.
Para el segundo grupo, el tono de 1000 hz sirvi de nuevo como E+ , pero el E- fue un tono
de 950 hz. El tercer grupo de palomas sirvi como grupo de control y no recibi
entrenamiento, el tono de 1000 hz sonaba constantemente y siempre podan recibir
reforzamiento por picotear cuando estaban en la cmara experimental.
Despus de acabar el entrenamiento, en cada grupo se puso a prueba la conducta de picoteo
en presencia de tonos de varia frecuencias para ver con que precisin controlaba el tono
dicha conducta. El grupo control respondi de forma casi idntica en presencia de todos los
estmulos de prueba; el tono de los sonidos no controlaba su conducta: Cada uno de los
otros procedimientos de entrenamiento produjo un mayor nivel de control estimular por el
tono. El gradiente de generalizacin mas acusado y por tanto el control por el estmulo mas
fuerte se observo en los pjaros que haban sido entrenados con el tono de 1000 hz como
E+ y el tono de 950 como E-. Las otras (1000 hz y ausencia de tono ) mostraron un grado
intermedio de control.
Este experimento aporto dos conclusiones importantes (1) el entrenamiento en
discriminacin aumenta el control por el estmulo de la conducta instrumental, y (2) una
dimensin particular del estmulo (como la frecuencia tonal ) es mas probable que adquiera
control sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensin del estmulo.
Rango de posibles estmulos discriminativos
Los procedimientos de entrenamiento en discriminacin se emplean a menudo para evaluar
la capacidad sensorial de los animales. Schsterman y colaboradores lo han utilizado para
determinar los umbrales visuales y auditivos .Los investigadores tambin se han interesado
por el estudio de si los animales son capaces de detectar las sensaciones internas creadas
por una droga. Esta investigacin ha mostrado que los mecanismos de control por el
estmulo con drogas son asombrosamente parecidos a los mecanismos identificados por
Jenkins y Harrison para el control del picoteo de una tecla por claves visuales en las
palomas. El gradiente de generalizacin fue mucho mas acusado, lo que indica un control por
las drogas mucho mas fuerte.
132
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
Qu se aprende en el entrenamiento de discriminacin?
Se aprende a responder al E+ como a suprimir la respuesta ante el E-.
Teora de Spence del aprendizaje de discriminacin: Esta basada en la idea de que lo que
se aprende tanto el significado del E+ como del E-, o sea aprender tanto a responder al E+
como a suprimir la respuesta ante el E-. El reforzamiento de una respuesta en presencia del
E+ condiciona tendencias excitatorias de respuesta al E+. Por el contrario, el no
reforzamiento de la respuesta durante el E- condiciona propiedades inhibitorias al E-, lo
que sirve para suprimir la conducta instrumental. Se asume que la respuesta diferencial al
E+ y al E- refleja tanto la excitacin por responder ante el E+ como la inhibicin por
responder ante el E-.
Comprobar esto requiere pruebas sofisticadas. Una posibilidad es utilizar los gradientes de
generalizacin del estmulo.
Si se ha condicionado una tendencia exitatoria al E+, entonces los estmulos que difieran de
forma progresiva del E+ deberan ser cada vez menos efectivos en evocar la respuesta
instrumental. En otras palabras, debe observarse un gradiente de generalizacin acusado,
con la mayor cantidad de respuesta ante el E+. Un resultado como este se llama gradiente
de generalizacin del estmulo excitatorio. Por el contrario, si se ha condicionado una
tendencia inhibitoria al E-, entonces los estmulos que difieran progresivamente del E-
deberan ser cada vez menos efectivos en inhibir la respuesta instrumental, este resultado
se llama gradiente de generalizacin del estmulo inhibitorio.
Las pruebas conductuales llevadas a
cabo dcadas despus omprobaron
que las ideas de Spence eran
sustancialmente correctas. En un
experimento clsico Honig, Boneau,
Burstein y Pennypacker, 1963. Un
grupo de palomas es reforzado
cuando la tecla estaba iluminada con
luz blanca y una lnea vertical negra
(E+) sin la lnea vertical no refuerzo
(E-). 2 Grupo el E+ y E-
intercambiados, despus de que los
dos grupos aprenden a responder al
E+, se llevaron a cabo las pruebas de
generalizacin del estmulo para
averiguar el grado de control de la
barra vertical negra sobre la
conducta; en el grupo 1, mayor tasa
de respuesta ante la raya vertical y
progresivamente descendiendo, esto
Gradientes de generalizacin del estmulo para estmulos
consistentes en la inclinacin de una lnea en dos grupos de palomas
tras un entrenamiento en discriminacin. Para el Grupo 1, sirvi como
E+ una barra vertical negra sobre un fondo blanco, y la luz blanca sin
barra sirvi como E-. Para el Grupo 2, las funciones de los estmulos
se invirtieron.
133
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
ilustra un gradiente de generalizacin del estmulo excitatorio. En el grupo 2los estmulos
que eran cada vez mas diferentes del original E- producan progesivamente menos inhibicin
en la conducta, ilustrando un gradiente de generalizacin del estmulo inhibitorio.
Este experimento muestra que el entrenamiento en discriminacin puede producir tanto
condicionamiento excitatorio al E+ como condicionamiento inhibitorio al E-. El hecho de que
los gradientes de excitacin e inhibicin puedan ocurrir alrededor del E+ y del E-
proporcionan un fuerte apoyo a la teora de Spence del aprendizaje de discriminacin.
Se obtienen diferentes resultados si los estmulos E+ y E- difieren cuantitativamente en
una caraterstica en lugar de cualitativamente ( incluyendo muchas caractersticas.)
Interacciones entre el E+ y el E-: desplazamiento del mximo
Lo que los sujetos aprenden sobre el E+ es independiente de lo que aprenden sobre el E-.
Esta suposicin es demasiado simplista. Lo que se aprende sobre el E+ puede influir en la
respuesta al E- y viceversa. Estas interacciones son particularmente probables si el E+ y el
E- se relacionan de alguna manera.
Una de las maneras en que el E+ y el E- puede estar relacionados es siendo semejantes
excepto por un rasgo o atributo. Un procedimiento de entrenamiento en que slo difieren
por el valor de una caracterstica del estmulo se llama discriminacin intradimensional.
Las discriminaciones intradimensionales son de particular inters debido a que estn
relacionadas con el problema de la ejecucin experta, esta implica normalmente realizar
distinciones sutiles. Distinguir los estmulos que difieren en un nica caracterstica es mas
difcil que distinguir entre estmulos que difieren en muchos aspectos. La discriminacin
intradimensional requiere la deteccin de un nico rasgo diferenciador entre el E+ y el E-
y, en consecuencia, es una forma de ejecucin experta.
Una caracterstica importante de la discriminacin intradimensional es que a veces dan
como resultado una interesante interaccin entre las respuestas al E+ y al E-, en un
experimento clsico Hanson (1959) examinaba el grado en que varios colores controlaban la
conducta de picoteo en paloma. Todos los sujetos fueron reforzados con un luz de 550nn, el
E+ era el mismo para todos los grupos, diferan en lo similar que era el E- al E+. un grupo
recibi un E- de 590nn , para otro grupo el E- era de 555nm, y u n grupo de control que no
recibi entrenamiento en discriminacin pero que tambin fue reforzado por picotear en
presencia del estmulo de 550 nm. El grupo de control mostr un gradiente de
generalizacin del estmulo excitatorio normal centrado alrededor del E+, el grupo en que el
E- fue de 590nm mostr un desplazamiento del mximo del gradiente de generalizacin
desde el E+ llamativo porque la respuesta nunca se reforz en 540 o 530 donde se
obtuvieron las tasas mas altas de respuesta, estos estmulos nunca haban sido presentados
durante el entrenamiento original.
El desplazamiento del mximo del gradiente de generalizacin alejado del E+ original se
134
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
denomina efecto del desplazamiento del mximo, este puede ocurrir en cualquier
discriminacin intradimensional.
Explicacin de Spence del desplazamiento del mximo. El efecto de desplazamiento de
mximo es importante porque muestra que el nico estmulo en cuya presencia se refuerza
la respuesta (E+) no es necesariamente es estmulo que evoca la tasa de respuesta ms alta.
Spence sugiri que los gradientes
excitatorio e inhibitorio pueden producir el
fenmeno de desplazamiento del mximo,
asumi que el entrenamiento en
discriminacin intradimensional produce
gradientes de generalizacin excitatorios e
inhibitorios centrados en el E+ y el E-, sin
embargo, debido a que el E+ y el E- son
semejantes en las tareas de discriminacin
intradimensional, los gradientes de generalizacin de la inhibicin y excitacin se
superpondrn. Es mas, el grado de superposicin depender del grado de semejanza entre
el E+ y el E-. La inhibicin generalizada del E- suprimir la respuesta al E+, dando como
resultado un efecto de desplazamiento del mximo.
Explicaciones alternativas del desplazamiento del mximo: Una cuestin importante es si
vemos los estmulos en funcin de sus propiedades individuales y absolutas, o en funcin de
su relacin con otros estmulos que experimentamos, existe evidencia consistente con cada
una de estas aproximaciones, que sugiere que ambos tipos de mecanismos estn implicados
en la forma de responder de los organismos.
El modelo de Spence es un modelo de aprendizaje absoluto del estmulo. Predice la
conducta basada en las propiedades excitatorias netas de los estmulos individuales. Una
aproximacin alternativa asume que los organismos aprenden a responder a un estmulo
basndose en la relacin de ese estmulo con otras claves de la situacin. Una prediccin
interesante de esta aproximacin es que la forma de un gradientes de generalizacin
cambiara en funcin del rango de los estmulos de prueba que se presenten durante la
sesin de generalizacin. Estas y oras predicciones de la teora relacional han sido
confirmadas.
Entrenamiento de equivalencia de estmulos
De la misma forma que el entrenamiento en discriminacin potencia la respuesta
diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada o
equivalencia de estmulos.
Se dispone de varias aproximaciones para promover la generalizacin en lugar de la
discriminacin, 1 (Herrnstein, Loveland y Cable 1976, la estrategia bsica de
entrenamiento es reforzar la misma respuesta en presencia de varias imgenes que
135
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
contiene agua, una vez que aprenden la discriminacin agua/no agua, su conducta se
generalizo a nuevas fotografa.
Los investigadores tambin han explorado la posibilidad de que la equivalencia funcional
entre dos estmulos diferentes podra establecerse enlazando cada una de las distintas
claves con un tercer estmulo comn Ej. Honey y Hall (1989) un grupo ruido y click con
comida, grupo control ruido y click, solo el click con comida despus ambos recibe ruido con
descarga-miedo al ruido. Los investigadores estaban interesados en saber si este miedo
condicionado se generalizara al clik, se dio significativamente mas generalizacin en los
animales entrenados en equivalencia que en el grupo de control.
El emparejamiento de estmulos diferentes con la misma consecuencia crea equivalencia
funcional entre esos estmulos, con la consecuencia de que una respuesta condicionada a uno
de ellos se generalizara a los oros. Una definicin mas formal de clase de equivalencia ha
sido propuesta por Siedman y colaboradores. Se dice que existe una clase equivalencia si
sus miembros poseen propiedades matemticas 1 reflexividad o igualdad, 2 simetra y 3
transitividad. La reflexividad o igualdad se refiere a la relacin A=A: la simetra existe si
una relacin es bidireccional, la transitividad se refiere a la integracin de dos relaciones
en una tercera.
CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES
(pgina 242 del libro)
Un estmulo se dice que es discreto si se presenta durante un breve periodo y tiene un
comienzo y un final claros. Las claves contextuales pueden ser visuales, auditivas o claves
olfatoria de la habitacin o lugar donde se presentan los estmulos discriminativos
discretos. La investigacin reciente indica que las claves contextuales pueden proporcionar
una importante fuente adicional de control de la conducta aprendida.
Control por claves contextuales
Las claves contextuales pueden llegar a controlar la conducta instrumental. Es ms fcil
concentrarse en una biblioteca del colegio que en casa durante las vacaciones, debido al
control contextual de la conducta de estudio por los estmulos experimentados en la
biblioteca. Charlar en un partido de ftbol, pero no durante misa es otro ejemplo del poder
de las claves contextuales.
El control contextual por el estmulo puede ocurrir sin que un contexto est ms
fuertemente asociado con el reforzamiento que otro. Dado que un contexto no es mejor
seal par el reforzamiento que otro, las asociaciones involucran un tipo diferente de
mecanismos. Una posibilidad es que cada contexto activa una memoria diferente. Que le
Contexto 1 active la memoria de reforzamiento con 90 y la de ausencia de reforzamiento
con 0. Por el contrario, el Contexto 2 active la memoria de reforzamiento con 0 y la de
ausencia de reforzamiento con 90. En lugar de estar asociado con un estmulo particular,
cada contexto podra estar asociado con una contingencia diferente E+/E-. Estas
asociaciones se denominan relaciones condicionales.
136
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
Control por las relaciones condicionales
En captulos anteriores se han destacado las relaciones que involucran slo dos eventos, un
EC y un EI, o una respuesta y un reforzador. Las relaciones entre dos eventos se llaman
relaciones binarias. En ciertas circunstancias, la naturaleza de un relacin binaria esta
determinada por un tercer suceso, llamado modulador. La relacin de un modulador con la
relacin binaria que seala se denomina una relacin condicional.
Numerosos experimentos han
indicado que los animales pueden
aprender a utilizar moduladores para
decir cuando esta en funcionamiento
una relacin binaria particular.
Un procedimiento en el que un
organismo es reforzado por
responder en presencia del E+ pero
no es reforzado en presencia del E-,
los estmulos discriminativos E+ y E-
son moduladores que sealan la relacin entre la respuesta y el reforzador. Existe una
relacin respuesta-reforzador durante el E+ y una relacin diferente durante el E-, por
tanto los procedimientos de discriminacin instrumental incluyen el control condicional de
la relacin entre la respuesta y el reforzador.
Control condicional en el condicionamiento pavloviano. El concepto fundamental del
control condicional es que un evento seala la relacin entre otros dos eventos.
Un modulador es un tercer elemento que indica cundo la presentacin del EC o el
reforzador aparecer.
En los procedimientos de discriminacin instrumental, los moduladores (E+ y E-) se
denominan "estmulos discriminativos". En el condicionamiento pavloviano han denominado al
control condicional de la respuesta facilitacin debido a que el modulador facilita la
respuesta del EC. Mas comn, el control condicional en el condicionamiento clsico se llama
establecimiento de la ocasin porque el modulador establece la ocasin para los
emparejamientos del EC con el EI. En esta terminologa, el modulador se llama establecedor
de la ocasin.
Distincin entre la excitacin y la modulacin. El establecimiento de la ocasin es un
aspecto importante del condicionamiento clsico porque parece involucrar mecanismos de
aprendizaje diferentes . Los emparejamientos de un EC con un EI dan como resultado una
asociacin entre los dos sucesos tal que la presentacin del EC llega a activar una
representacin del EI. Este tipo de aprendizaje se ha considerado que refleja el
condicionamiento de la excitacin al EC. Las propiedades modulatorias de los estmulos son
diferentes de la excitacin condicionada.
137
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
En varios estudios, los intentos de obtener evidencia de las propiedades excitatorias
condicionadas de los moduladores han fracasado, estos experimentos indican que un
estmulo puede establecer la ocasin para la respuesta condicionada elicitada por otra clave
sin elicitar por si mismo una respuesta condicionada visible. Otros estudios han mostrado
que condicionar las propiedades excitatorias simples a un estmulo no hace que este
funcione como un modulador.
La evidencia adicional para mantener la distincin entre modulacin y excitacin
condicionada se basa en los efectos de los procedimientos de extincin. La extincin es un
procedimiento en el cual un estmulo previamente condicionado se presenta repetidamente
pero se omite el EI.
Un estmulo condicionado excitatorio seala la prxima presentacin del EI. La ausencia
del EI despus de la presentacin del EC durante la extincin es una violacin de esa
expectativa. Por tanto, el valor como seal del EC tiene que reajustarse en la extincin para
estar en consonancia con la nueva realidad. Un reajuste como este no se requiere en un
procedimiento de extincin de un establecedor de la ocasin
Un establecedor de la ocasin seala una relacin entre un EC y un EI. La ausencia del EI
cuando se presenta el establecedor de la ocasin por si solo durante la extincin no
significa que la relacin entre el EC y el EI haya cambiado. La informacin sealada por un
establecedor de la ocasin no se prueba que sea incorrecta mediante la presentacin del
modulador por si mismo durante la extincin. En consecuencia, la habilidad del modulador
para promover la respuesta elicitada se reduce si se altera la relacin EC-EI sealada por
el modulador.
Otra evidencia que apoya la conclusin de que el establecedor de la ocasin es distinto de la
excitacin convencional se ha obtenido en las pruebas de transferencia, estas fueron
llevadas a cabo para determinar si un estmulo que haba sido condicionado para establecer
la ocasin de responder a un EC critico particular tambin incrementara la respuesta a
orto EC. Se ha obtenido evidencia de transferencia positiva de los efectos de un
modulador a un nuevo EC critico, los efectos de transferencia son mas probables si los
nuevos estmulos crticos han servido previamente como estmulos crticos de otros
estmulos moduladores. Las limitaciones en la transferencia proporcionan evidencia
adicional de que los moduladores tienen sus efectos mediante algn mecanismo distinto de
la excitacin convencional.
Modulacin frente a condicionamiento configuracional: Los efectos modulatorios
requieren la respuesta al compuesto estimular como constituido por elementos
independientes estimulares, Los investigadores han presentado los elementos uno tras otro
mas que simultneamente, en lo que se llama compuesto serial. En los ensayos reforzados,
el establecedor de la ocasin es presentado normalmente primero, seguido por el EC crtico
y el reforzamiento. Holland y colaboradores han encontrado que los organismos responden
a las discriminaciones condicionales que incluyen compuestos seriales en trminos de
138
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
relaciones condicionales. En contraste, la utilizacin de compuestos simultneos en la
discriminacin condicional a menudo no produce efectos modulatorios.
COMENTARIOS FINALES
(pgina 249 del libro)
El control por el estmulo se refiere al grado de precisin del ajuste de la conducta de un
organismo a las caractersticas especficas del ambiente. Por tanto, los temas relacionados
con el control de la conducta por el estmulo son importantes para entender cmo un
organismo interactan con su ambiente. El control por el estmulo se mide en trminos de
apuntamiento de los gradientes de generalizacin. Un gradiente de generalizacin acusado
indica que pequeas variaciones en un estmulo producen grandes diferencias en la
respuesta. Un control por el estmulo ms dbil se manifiesta en gradientes de
generalizacin ms planos.
El grado de control por el estmulo est determinado por numerosos factores, incluyendo la
capacidad y orientacin sensorial del organismo, la prominencia relativa de otras claves en
las situaciones, el tipo de reforzamiento utilizado, y el tipo de respuesta requerida para el
reforzamiento. El control por el estmulo est tambin en funcin del aprendizaje. El
entrenamiento en discriminacin aumenta el control de la conducta por el estmulo tanto si
incluye estmulos que difieren en varios aspectos como en uno solo. El entrenamiento en
discriminacin con estmulos que difieren slo en una dimensin produce un control por el
estmulo ms preciso y puede llevar al resultado contraintuitivo de que el nivel mximo de
respuesta se desplace del estmulo reforzado. Lo opuesto del entrenamiento en
discriminacin es el entrenamiento en equivalencia, el cual aumenta la generalizacin de la
conducta.
No slo los estmulos discretos sino tambin las claves contextuales de fondo pueden llegar
a controlar la conducta. El control del estmulo por claves contextuales pueden
desarrollarse aun cuando no se requiera atencin a las claves contextuales para optimizar
el reforzamiento. Las claves contextuales pueden llegar a asociarse directamente con el EI
o servir para modular la relacin entre un EC discreto y un EI.
139
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
TRMINOS CLAVE
Aproximacin de la clave configuracional Aproxi-
macin al anlisis del control por estmulos
compuestos que asume que los organismos
responden a un estmulo compuesto como un todo
integral ms que a una coleccin de elementos
estimulares separados e independiente. (Compa-
rse con la aproximacin elemental del estmulo)
Aproximacin elemental del estmulo Aproximacin
al anlisis del control por los estmulos
compuestos que asume que los participantes
responden a un estmulo compuesto en trminos
de los elementos del estmulo que forman el
compuesto. (Comprese con aproximacin de la
clave configuracional.)
Desplazamiento del mximo Desplazamiento de la
tasa ms alta de respuesta en un gradiente de
generalizacin del estmulo desde el E+ en
direccin opuesta al E- despus del entrenamien-
to en discriminacin intradimensional.
Discriminacin del estmulo Respuesta diferencial
en presencia de dos o ms estmulos.
Discriminacin intradimensional Discriminacin
entre estmulos que difieren slo en cuanto al
valor de una caracterstica del estmulo, como el
color, el brillo o el tono.
Equivalencia de estmulos Responder a estmulos
fsicamente distintos como si fuesen iguales
debido a experiencias comunes previas con los
estmulos.
Ensombrecimiento Interferencia en el
condicionamiento de un estmulo debido a la
presencia simultnea de otro estmulo que es ms
fcil de condicionar.
Establecimiento de la ocasin Lo mismo que
facilitacin.
Estmulo discriminativo Estmulo que controla la
ejecucin de la conducta instrumental porque
seala la disponibilidad (o no disponibilidad) de
reforzamiento.
Facilitacin Procedimiento en el que una clave
designa cundo otra clave ser reforzada.
Tambin llamado establecimiento de la ocasin.
Generalizacin del estmulo Ocurrencia de una
conducta aprendida a travs de habituacin o
condicionamiento en presencia de estmulos que
son diferentes de los estmulos utilizados
durante el entrenamiento.
Gradiente de generalizacin del estmulo
Gradiente de respuesta que se observa si los
participantes se prueban con estmulos que
difieren cada vez ms del estmulo que estaba
presente durante el entrenamiento. (Vase
tambin gradiente de generalizacin del estmulo
excitatorio y gradiente de generalizacin del
estmulo inhibitorio.)
Gradiente de generalizacin del estmulo
excitatorio Gradiente de respuesta que se
observa cuando se prueba a los organismos con el
E+ de un procedimiento de discriminacin y con
estmulos que difieren cada vez ms del E+. El
nivel ms alto de respuesta sucede con los
estmulos similares al E+; se da progresivamente
menos respuestas a los estmulos que difieren
cada vez ms del E+. Por tanto, el gradiente tiene
forma de U invertida.
Gradiente de generalizacin del estmulo
inhibitorio Gradiente de respuesta que se
observa cuando se prueba a loa organismos con el
E- de un procedimiento de discriminacin y con
estmulos que difieren cada vez ms del E-. El
nivel ms bajo de respuesta sucede con los
estmulos similares al E-; se da progresivamente
ms respuestas a los estmulos que difieren cada
vez ms del E-. Por tanto, el gradiente tiene
forma de U.
Modulador Estimulo que seala la relacin entre
otros dos sucesos. La naturaleza de una relacin
binaria est determinada por el modulador.
140
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 8:El control de la conducta por el estmulo
Juan Carlos Cabrera
Procedimiento de discriminacin del estmulo (en
condicionamiento clsico) Procedimiento de
condicionamiento clsico en el cual un estmulo (el
EC+) es emparejado con el estmulo incondi-
cionado en algunos ensayos y otros estmulos (el
EC-) se presenta sin el estmulo incondicionado en
otros ensayos. Como resultado de este procedi-
miento, el EC+ llega a elicitar una respuesta
condicionada, y el EC- llega a inhibir esta res-
puestas. (Tambin denominado inhibicin diferen-
cial.)
Procedimiento de discriminacin del estmulo (en
condicionamiento instrumental) Procedimiento en
el cual el reforzamiento por responder est
disponible siempre y cuando se presente un
estmulo (el E+, o E
D
) y no est disponible siempre
y cuando se presente otro estmulo (el E- o E

).
Programa mltiple de reforzamiento Procedimiento
en el cual funcionan diferentes programas de
reforzamiento en presencia de diferentes
estmulos presentados en sucesin. General-
mente, cada estmulo llega a evocar un patrn de
respuesta que se corresponde con el programa
de reforzamiento.
Relacin condicional Relacin en la que la
significacin de un estmulo o suceso depende del
estatus del otro estmulo.
143
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
Efectos de los procedimientos de extincin
Extincin y aprendizaje originales
- Recuperacin espontnea
- Renovacin del condicionaiento excitatorio original
- Restauracin de la ejecucin de la extincin.
- Restablecimiento de la excitacin condicionada.
- Sensibilidad a a devaluacin del reforzador.
Qu se pretende en la extincin?
- Asociacin E-R inhibitorias
- Efectos paradjicos
- Mecanismos del reforzamiento parcial de la extincin
Resistencia a la extincin y momento conductual
Comentarios finales
145
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
La extincin puede llevarse a cabo slo despus de que haya sido establecida una
respuesta o una asociacin utilizando condicionamiento pavloviano o instrumental. El
objetivo es revertir los efectos de la adquisicin, pero raramente se alcanza y en la mayora
resultan imposible. Fenmenos como la recuperacin espontnea, la renovacin y el
restablecimiento muestran que la extincin no elimina lo que se aprendi de forma original.
Los estudios sobre devaluacin del reforzador sugieren que la extincin no tiene
virtualmente ningn impacto sobre las asociaciones E-C o R-C. Parece implicar el nuevo
aprendizaje de una asociacin E-R inhibitoria que se superpone a lo que se aprendi con
anterioridad.
La inhibicin surge de los efectos de la frustacin y esta falta inesperada de
recompensa es responsable de una serie de efectos paradjicos de la recompensa,
incluyendo el efecto del reforzamiento parcial en la extincin.
El reforzamiento parcial o intermitente permite a los organismos aprender sobre la
falta de recompensa de manera que les sirva para inmunizarse frente a los efectos de la
extincin, como demuestra los estudios acerca del momento conductual.
La extincin implica la omisin del EI o reforzador. Por tanto, la extincin en el
condicionamiento clsico incluye presentaciones repetidas del estimulo condicionado por s
solo; la extincin en el condicionamiento instrumental implica no volver a presentar el
reforzador como una consecuencia de la respuesta instrumental. El resultado es que la
respuesta condicionada disminuye. La extincin no es lo contrario de la adquisicin.
La extincin se produce por la omisin del EI que sigue a las presentaciones del EC o
la omisin del reforzador que sigue a la respuesta instrumental. El olvido, por el contrario,
es una disminucin de la respuesta condicionada que se da por la ausencia prolongada de
experiencia con el estimulo condicionado o con la respuesta instrumental.
La extincin no siempre funciona en la terapia de conducta, los avances sugieren que
los fallos en la extincin reflejan las limitaciones normales de la misma. La extincin no
revierte los efectos de la adquisicin, en lugar de ello, implica el aprendizaje de algo nuevo
que se superpone sobre lo que se aprendi antes (sin la perdida de lo que se aprendi
anteriormente).
146
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
EFECTOS DE LOS PROCEDIMIENTOS DE EXTINCION.(pgina 253 del libro)
La extincin disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, pero
no altera de otro modo la estructura de la conducta.
Si un organismo est acostumbrado a recibir reforzamiento por una respuesta particular,
puede trastornarse cuando no vuelve a entregar los reforzadores. Las reaccin emocional
inducida por la falta de un reforzador esperado se denomina frustacin. La ausencia
frustrante de recompensa proporciona energa a la conducta que en ocasiones puede ser lo
suficietemente severa como para implicar reacciones agresivas.
EXTINCION Y APRENDIZAJE ORIGINAL (pgina 255 del libro)
Aunque la extincin produce importantes efectos conductuales y emocionales, no revierte
los efectos de la adquisicin. La evidencia de que la extincin no elimina lo que se aprendi
originalmente se ha obtenido a travs de estudios sobre la renovacin espontanea, la
renovacin, el restablecimiento y los efectos de la devaluacin del reforzador.
Recuperacin espontanea
La recuperacin espontanea tras el condicionamiento pavloviano: La extincin se disipa
con el tiempo, y como consecuencia, la respuesta condicionada original vuelve a presentarse
si el sujeto se pone a prueba tras una demora que siga al procedimiento de extincin.
Recuperacin espontanea tras el condicionamiento instrumental: La recuperacin
espontnea es un fenmeno notable en la extincin tras el condicionamiento instrumental. La
introduccin de un periodo de descanso tras la extincin produce una recuperacin
sustancial en la respuesta.
Renovacin del condicionamiento excitatorio original
La renovacin se refiere a la recuperacin de la ejecucin propia de la adquisicin que se da
cuando se cambian las claves contextuales que estaban presentes durante la extincin. El
cambio puede consistir en una vuelta al contexto de la adquisicin original o a un cambio a un
contexto neutral.
El efecto de la renovacin no slo se ha observaldo en el condicionamiento pavloviano del
miedo, sino tambin en el condicionamiento apetitivo del miedo, la inhibicin condicionada y
147
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
en varias situaciones de condicionamiento instrumental. El fenmeno se evidencia no slo
con claves externas contextuales sino con claves contextuales creadas por estados
provocados por drogas. Tambin puede darse si el sujeto se retira del contexto de
adquisicin a uno alternativo que no es el de la adquisicin original. Este tipo de renovacin
no es tan slido como cuando se reinstaura en el contexto original de adquisicin.
La mayor parte de la evidencia indica que el efecto de renovacin se produce porque la
memoria de la extincin es especfica de las claves que estaban presentes durante la fase
de extincin. En consecuencia, un cambio en el contexto de la extincin dificulta la
recuperacin de la memoria de extincin, con el resultado de que se pierde la ejecucin
propia de la extincin.
Bouton (1993,1994) ha sugerido que las claves contextuales sirven para eliminar la
ambigedad del significado de un estimulo condicionado. Un EC que adquiere
condicionamiento excitatorio y luego se extingue tambin tiene un significado ambiguo, en el
sentido de que podra indicar la cercana del EI (adquisicin) o su ausencia (extincin). Esta
ambigedad permite al EC ponerse bajo el control contextual de manera ms fcil. Tras el
entrenamiento de adquisicin por s solo, el EC no es ambiguo porque solo significa una cosa
(la proximidad de la entrega del EI). En consecuencia, este EC no es susceptible de control
contextual.
Los investigadores han explorado la forma de reducir el efecto de renovacin. Un
procedimiento que se muestra prometedor es llevar a cabo la extincin en distintos
contextos. Otras tcnicas para reducir el efecto de renovacin implican entrenamiento en
inhibicin condicionada, condicionamiento diferencial, y la presentacin del EC
explcitamente emparejado con el EI.
Restauracin de la ejecucin propia de la extincin
El efecto de renovacin representa reactivar una conducta aprendida previamente mediante
el cambio del contexto a condiciones ms aproximadas a las presentes cuando la conducta
se adquiri con anterioridad. Esta estrategia puede aplicarse a la extincin, es decir, la
ejecucin propia de la extincin puede restaurarse introduciendo claves contextuales que
reactiven la memoria de extincin.
La recuperacin espontanea implica la recuperacin de la conducta condicionada
originalmente que sigue a la extincin si transcurre un periodo suficiente de tiempo tras la
fase de extincin. La conducta propia de la extincin puede restaurarse (contrarrestando la
recuperacin espontaneas) presentando las claves que estaban presentes durante la fase de
148
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
extincin. La recuperacin expontnea se debe a un eterioro de las claves contextuales de
la extincin que se da con el paso del tiempo.
Restablecimiento de la excitacin condicionada
El restablecimiento se refiere a la recuperacin de la respuesta excitatoria a un estimulo
extinguido, producida por exposiciones al estimulo incondicionado. Las respuestas que se
extinguen con xito, pueden recuperarse si el individuo se enfrenta de nuevo con el estmulo
incondicionado.
Investigaciones durante los ltimos 20 aos sobre el efecto del restablecimiento, han
indicado que el condicionamiento contextual es importante, pero no porque permita la suma
de la extincin sino por suprimir la ambigedad del significado de un estimulo que tiene una
historia mezclada de condicionamiento y extincin. El contexto tiene poco efecto en los
estmuos con una historia slo de condicionamiento.
Bouton considera el restablecimiento como una forma de renovacin. Las claves
contextuales condicionadas proporcionan algunas de las claves contextuales para la
respuesta excitatoria en circunstancias normales. Estas se extinguen cuando se presenta el
EC por si solo durante la extincin.
Sensibilidad a la devaluacin del reforzador
La persistencia del aprendizaje original a pesar de la extincin puede tambin investigarse
analizando los efectos de la devaluacin del reforzador. Rescorla ha utilizado la tcnica de
devaluacin del EI para determinar si la asociacin EC-EI establecida a travs de
condicionamiento pavloviano persiste a lo largo de la extincin.
Los hallazgos han fortalecido la conclusin de que la extincin no elimina las asociaciones -
R-C y E-C que se aprende durante el condicionamiento instrumental.
149
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
QUE SE APRENDE EN LA EXTINCIN? (pgina 266 del libro)
Si como hemos visto la extincin no implica desaprendizaje y deja intacta las asociaciones
R-C y E-C, por qu disminuye las respuestas en los procedimientos de extincin?
Asociaciones ER inhibitorias
Los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar de
centrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, han
llegado a la conclusin de que la falta de reforzamiento produce una asociacin E-R
inhibitoria: La falta de reforzamiento de una respuesta en presencia de un estmulo
especfico, produce una asociacin E-R inhibitoria que sirve para suprimir esa respuesta
siempre y cuando el E est presente. Esta hiptesis, predice que los efectos de la extincin
sern altamente especficos del contexto en el que la respuesta fue extinguida.
La omisin de una recompensa esperada genera desilusin o frustracin. Estos efectos
emocionales se presume que desempean un papel crtico en la disminucin conductual que se
da en la extincin. La ausencia de recompensa esperada desencadena una reaccin frustante
aversiva incondicionada que sirve para que se deje de responder durante el curso de la
extincin mediante el establecimiento de una asociacin inhibitoria.
La afirmacin de que la extincin implica el aprendizaje de una asociacin inhibitoria resulta
controvertida frente a las teoras convencionales que consideraban la inhibicin
condicionada y la extincin como fenmenos diferentes.
Efectos paradjicos de la recompensa
Efecto de sobreentrenamiento en la extincin. Cuanto ms entrenamiento con
reforzamiento se proporciona ms fuerte es la expectativa de recompensa, y ms fuerte la
frustracin cuando se introduce la extincin. La disminucin en la respuesta se debe a los
efectos frustrantes de la ausencia de recompensa, el entrenamiento de reforzamiento ms
extenso produce una extincin ms rpida. Especialmente evidente cuando el entrenamiento
incluye reforzamiento continuo.
Ejemplo: Podriamos pensar que un entrenamiento ms extenso creara una respuesta ms fuerte,
que sera ms resistente a la extincin, pero sucede lo contrario.
150
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
Efecto de magnitud del reforzamiento en la extincin: se refiere al hecho de que la
respuesta disminuye ms rpido durante la extincin que sigue a un reforzamiento con un
reforzador mayor. Es ms evidente cuando el entrenamiento incluye reforzamiento
continuo.
Ejemplo: Si consideramos dos posibiliades: en una, que se recibe 100 al mes; en la otra, 20 al mes.
Si se deja de percibir la cantidad, es ms aversiva si nos hemos acostumbramos a 100 que a 20.
Efecto del reforzamiento parcial en la extincin: Es el efecto paradjico ms estudiado.
Un factor crtico que determina la magnitud de los efectos tanto conductuales como
emocionales de un procedimiento de extincin es el programa de reforzamiento que opera
antes de que se introduzca el procedimiento de extincin. Pero la caracterstica dominante
del programa que determina los efectos de la extincin es si la respuesta instrumental se
reforz cada vez que ocurra (reforzamiento continuo) o slo algunas veces (reforzamiento
intermitente o parcial). La extincin es mucho ms lenta y produce menos reacciones de
frustracin si estaba en activo un programa de reforzamiento parcial antes de la
introduccin del procedimiento de extincin. Este fenmeno se denomina el efecto de
reforzamiento parcial en la extincin o ERPE,
Mecanismos del efecto del reforzamiento parcial en la extincin
La explicacin ms evidente del ERPE es que la introduccin de la extincin es ms fcil de
detectar tras el reforzamiento continuo que tras el reforzamiento parcial. La ausencia de
reforzamiento es presumiblemente mucho ms fcil de detectar tras el reforzamiento
continuo. Esta explicacin del efecto del reforzamiento parcial en la extincin se llama
hiptesis de la discriminacin.
El reforzamiento parcial parece ensear a los sujetos a no rendirse ante la ausencia de
reforzador. El reforzamiento parcial favorece la persistencia de dos formas diferentes.
Una explicacin seria la teora de la frustracin, basada en que los sujetos aprenden sobre
los efectos emocionales de la ausencia de recompensa durante el entrenamiento en
reforzamiento parcial. La otra explicacin, la teora secuencial, est basada en lo que los
sujetos aprenden sobre la memoria de la ausencia de recompensa.
Teora de la frustracin: Desarrollada por Abram Amsel, la persistencia en la extincin es
resultado del aprendizaje de algo paradjico, es decir, continuar respondiendo cuando se
espera no ser reforzado o ser frustrado. Asume que el reforzamiento intermitente da como
resultado aprender a responder a pesar de esperar la ausencia de reforzamiento. Sin
embargo, este aprendizaje requiere considerable experiencia con reforzamiento
intermitente.
151
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Lo
recompensados animan a los sujetos a esperar reforzamiento y los no recompensados les
llevan a espera la ausencia de recompensa. Por tanto el reforzamiento intermitente produce
el aprendizaje de expectativas tanto de recompensa como de no recompensa. La
expectativa de recompensa alienta a los sujetos a responder, y la anticipacin de la ausencia
de reforzamiento desalienta la respuesta, al principio del entrenamiento los sujetos entran
en conflicto con lo que se ha de hacer. Sus expectativas motivan tendencias de respuesta
opuestas. Sin embargo a medida que el entrenamiento continua, el conflicto se resuelva a
favor de responder.
La resolucin del conflicto ocurre debido a que el reforzamiento no es predecible en el
tpico programa de reforzamiento parcial. Debido a estas experiencias, la respuesta
instrumental se condiciona a la expectativa de la ausencia de recompensa. De acuerdo con la
teora de la frustracin, esta es la clave de la persistencia en responder durante la
extincin. Con suficiente entrenamiento, el reforzamiento intermitente da como resultado
el aprendizaje de realizar la respuesta instrumental como reaccin a la expectativa de
ausencia de recompensa. Por el contrario no existe nada en la experiencia del reforzamiento
continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El
reforzamiento continuo no produce persistencia en la extincin.
Teora secuencial; Capaldi, est formulada en trminos de memoria. Asume que los sujetos
pueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasado
reciente. Recuerdan los ensayos recientes tanto recompensados como no recompensados.
Se asume adems que durante el entrenamiento en reforzamiento intermitente, la memoria
de la ausencia de recompensa llega a ser una clave para la realizacin de la respuesta
instrumental, esto produce persistencia en le extincin.
Considerese un ensayo: RNNRRNR. El sujeto es recompensado en el primer ensayo, no
recompensado en los dos siguientes, recompensado dos veces, luego no reforzado y
finalmente recompensado de nuevo. Con suficientes experiencias de este tipo, el sujeto
aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayo
precedentes. Este aprendizaje provoca la persistencia de la respuesta instrumental en la
extincin.
Desde que la dos teoras fueron propuestas se ha obtenido gran evidencia en apoyo de cada
teora. Ambas representan dos formas diferentes en las que el reforzamiento parcial puede
influir sobre la respuesta durante la extincin. Los mecanismos de memoria pueden
contribuir en mayor medida cuando los ensayos de entrenamiento no estn separados por
largos intervalos entre ensayos. El aprendizaje emocional descrito por la teora de la
frustracin es menos sensible a los intervalos entre ensayos y, por tanto, proporciona una
mejor explicacin del ERPE cuando se utilizan ensayos ampliamente espaciados.
152
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
RESISTENCIA AL CAMBIO Y MOMENTO CONDUCTUAL
(pgina 273 del libro)
Otra forma de considerar la persistencia de la respuesta en la extincin es que representa
la resistencia al cambio en las contingencias de reforzamiento que sucede cuando se
introduce la extincin. Nevin y colaboradores han estudiado la resistencia al cambio de
forma ms general y han propuesto el concepto de momentos conductual para caracterizar
la susceptibilidad de la conducta a las interrupciones. Est basada en el concepto de
momento de la fsica newtoniana. Predice que la conducta que posee un momento elevado
tambin ser difcil de parar o interrumpir por las manipulaciones. Ver ej. Pag 274 libro.
Un experimento en el que particip HCB, una chica de 17 aos y una edad mental de 3. Los
resultados obtenidos con HCB ilustran dos conclusiones normales de los estudios de
momento conductual. La primera es que el momento conductual est directamente
relacionado con la tasa de reforzamiento. Una tasa ms alta de reforzamiento produce una
conducta que tiene un mayor momento y que es menos susceptible a la interrupcin; otro
hallazgo es que el momento conductual no est relacionado con la tasa de respuesta. Dos
conductas que se dan a tasas semejantes no es preciso que tengan grados similares de
momento conductual. Nevin ha destacado la tasa de reforzamiento en lugar de la tasa de
respuesta como el determinante fundamental del momento conductual. Esta conclusin est
confirmada por otros estudios que demuestran que los programas que proporcionan tasas
similares de reforzamiento pero tasa diferentes de respuesta tienen similares momentos o
resistencias al cambio.
La primaca de la tasa de reforzamiento sobre la tasa de respuesta como determinante del
momento conductual ha llevado a Nevin y Grace (2000) a atribuir el momento conductual
principalmente al condicionamiento pavloviano o de asociaciones E-C, aunque la forma exacta
en que estas asociaciones promueven el momento conductual no se han averiguado todava.
El reto principal a la proposicin bsica de que el momento conductual est directamente
relacionado con la tasa de reforzamiento es el efecto ERPE, este es un caso en que la
resistencia a la extincin es mayor despus de una baja tasa o probabilidad de
reforzamiento. Nevin y Grace han sugerido que el ERPE puede explicarse asumiendo que la
extincin es menos discriminable tras el reforzamiento intermitente que tras el continuo
153
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
Comentarios finales (pgina 276 del libro)
Los estudios sobre extincin ilustran la naturaleza duradera de ciertos temas en la teora
de la conducta. Los primeros estudios sobre la extincin se centraron en los efectos del
reforzamiento parcial enla extincin y otros efectos paradjicos de la recompensa, y se
llevaron a cabo dentro de la tradicin hulliana que daba preeminencia al aprendizaje E-R.
Los mecanismos E-R cayeron en desuso con la creciente evidencia de que el
condicionamiento pavloviano y el intrumental involucraban asociaciones E-C y R-C, que
estaban controladas o moduladas por claves contextuales. Estas evidencias fueron parte de
la revolucin cognitiva que se introdujo en la psicologa en el ltimo cuarto de siglo XX.
sta proporcion una mejor compresin de la recuperacin espontnea y llev al
descubrimiento de nuevos fenmenos como la renovacin y el restablecimiento. Sin
embargo, estos fenmenos representas los fallos de la extincin ms que la exticnin en s
misma. Como se ha descrito, la compresin de la extincin en s misma ha requerido la
vuelta a los conceptos E-R, esta vez en forma de asociaciones E-R inhibitorias. Los
investigadores sigun interesados en qu es lo que hace que conducta sea resistente al
cambio. Esta resistencia o momento conductual plantea especiales desafos para la terapia
de conducta.
154
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010
Terminos Clave (pgina 277 del libro)
Efecto de la magnitud del reforzamiento en la
extincin Persistencia menor de la conducta
instrumental en la extincin que sigue al
entrenamiento con un reforzador de gran
magnitud que en la que sigue al entrenamiento con
un reforzador pequeo o moderado.
Efecto de reforzamiento parcial en la extincin
Trmino utilizado para describir una persistencia
mayor de la respuesta instrumental en la
extincin posterior a un entrenamiento de
reforzamiento parcial (intermitente) que en la
extincin posterior a un entrenamiento de
reforzamiento continuo. Abreviado ERPE.
Efecto de sobreentrenamieno en la exticin
Persistencia menor de la conducta instrumental
en la que la extincin que sigue a un
entrenamiento extenso con reforzamiento
(sobrentrenamiento) que en la que sigue a un
entrenamiento con niveles de reforzamiento
moderados.
Extincin (en el condicionamiento clsico) Reduccin
de la respuesta aprendida que ocurre debido a
que el estmulo condicionado no se vulve a
emparejar con el estmulo condicionado. Tambin,
el procedimiento de presentar repetidamente un
estmulo condicionado sin el estmulo incondi-
cionado.
Extincin (en el condicionamiento intrumental)
Reduccin de la respuesta instrumental que
ocurre porque la respuesta no vuelve a ir seguida
de un reforzador. Tambin, el procedimiento de
no volver a reforzar la respuesta instrumental.
Frustracin Respuesta emocional aversiva que es
resultado de la ausencia inesperada de reforza-
miento.
Hiptesis de la discriminacin Explicacin del
efecto de reforzamiento parcial en la extincin,
de acuerdo con la que la extincin es ms lenta
tras el reforzamiento parcial que tras el reforza-
miento continuo, porque el principio de la extin-
cin es ms difcil de detectar cuando sigue el
reforzamiento parcial.
Momento conductual Susceptibilidad de la respues-
ta a la interrupcin mediante manipulaciones como
la alimentacin presin, la disponibilidad libre de
comida, o el cambio en el programa de
reforzamiento.
Olvido Reduccin de la respuesta aprendida que
ocurre por el paso del tiempo, no debido a
experiencias particulares.
Reforzamiento continuo Programa de reforzamiento
en el que cada ocurrencia de la respuesta intru-
mental produce el reforzador. Abreviado RFC.
Reforzamiento intermitenta Un programa de
reforzamiento en el que slo algunas de las
ocurrencias de la respuesta instrumental se
refuerzan. La respuesta intrumental se refuerza
ocasionalmente, o intermitentemente. Tambin
denominado reforzamiento parcial.
Restablecimiento Recuperacin de la respuesta
excitatoria a un estmulo extinguido producida
por la exposiciones al estmulo incondicionado.
Renovacin Recuperacin de la respuesta
excitatoria a un estmulo extinguido producida
por la retirada de las claves contextuales que
estaban presentes durante la extincin.
Teora de la frustracin Teora del efecto del
reforzamiento parcial en la extincin, de acuerdo
con la cual la extincin se retarda tras le
reforzamiento parcial porque la resuesta instru-
mental se condiciona a la anticipacin de la ausen-
cia frustante de recompensa.
Teora secuencial Teora del efecto de reforza-
miento parcial en la extincin, de acuerdo con la
que la extincin se retarda tras el reforzamiento
parcial porque la respuesta intrumental se condi-
ciona a la memoria de ausencia de rescompensa.