CAPITULO 1: INTRODUCCIÓN
A) ANTECEDENTES HISTÓRICOS
Los inicios del aprendizaje tienen su raíz en la filosofía de René Descartes.
Dualismo Cartesiano: 2 tipos de conducta
1) Conducta Involuntaria: Respuestas automáticas a los estímulos externos y está mediada por un mecanismo llamado reflejo.
2) Conducta Voluntaria: No requiere de la intervención de estímulos externos sino que se debe a la voluntad consciente de actuar de una determinada forma.
Diagrama del dualismo cartesiano
Mundo fisico Órganos
(causa de la
acción inv.) sensoriales
Glandula Mente
Cerebro
Nervios Pineal
Acción (causa de la
voluntaria o Musculos acción
involuntaria voluntaria)
Innatismo: (Descartes) Nacemos con ideas innatas acerca de ciertas cosas. Es lo que se conoce como Postura nativista.
Empirismo: (John Locke) Todas las ideas de las personas eran aprendidas directa o indirectamente a través de experiencias posteriores al nacimiento.
Modelo adoptado por filósofos británicos entre XVII-XIX. A los seguidores se les conocería como Empiristas británicos.
Descartes también pensaba que la mente no operaba de forma predecible y ordenada. El Hedonismo surge como una alternativa a este pensamiento.
Hedonismo: (Thomas Hobbes) Para los hedonistas, la mente opera de forma predecible y conforme a leyes. Las personas siempre tratarán de lograr el placer
y evitar el dolor.
Concepto de asociación: Concepto importante para los empiristas británicos para explicar el funcionamiento de la mente. Las sensaciones simples se
Desarrollo combinan hasta formas ideas complejas por medio de asociaciones.
histórico Leyes de asociación
del estudio Leyes primarias: (Origen en Aristóteles) contigüidad, similitud y contraste
de - Contigüidad: La más importante en el estudio de las asociaciones. Si dos eventos ocurren juntos en el espacio o en el tiempo de forma repetida
la mente quedarán asociados.
- Similitud y contraste: Dos ideas se asocian si son similares en algún aspecto o si tienen alguna característica contraria
Leyes secundarias: (Thomas Brown 1778-1820). La formación de asociaciones entre dos sensaciones estaba influida por un número de factores, incluyendo la
intensidad de las sensaciones y la frecuencia y recencia con que las dos sensaciones ocurrían conjuntamente. Además se consideraba que la formación de
una asociación entre dos eventos dependía del número de asociaciones anteriores en las que cada uno de dichos eventos estaba involucrado, y la similitud
entre estas asociaciones pasadas y la que se forma en el presente.
Sílabas sin sentido (Hermann Ebbinghaus): Combinaciones de 3 letras (bap por ejemplo) despojadas de cualquier significado que pudiera influir en cómo se
reaccionaba entre ellas. Comprobó que la fuerza de las asociaciones mejoraba con el entrenamiento y que las sílabas que aparecían cercanas en una lista
quedaban asociadas con mayor fuerza que las que estaban distantes.
• Descartes pensaba que los mensajes que iban de los órganos de los sentidos al cerebro y los mensajes motores que iban del cerebro a los músculos
viajaban por los mismos nervios. Descartes Pensaba que los nervios eran tubos huecos por los que se desplazaban unos gases llamados espíritus
animales…
Como es obvio, siglos posteriores a la muerte de Descartes, todas estas ideas acerca de los reflejos resultaron ser erróneas.
• Charles Bell y François Magendie demostraron que eran fibras nerviosas distintas las que se encargaban de transmitir la información sensorial desde los
Desarrollo órganos de los sentidos hasta el sistema nervioso central y otras fibras que transmitían la información motora desde el sistema nervioso central hasta los
histórico músculos.
del estudio • En 1669 John Swamerdamm mostró que la irritación mecánica de un nervio era suficiente para producir una contracción muscular
de • Posteriormente, Francis Glisson demostró que las contracciones musculares no se debían a que los músculos fueran hinchados por un gas.
los reflejos • I.M Sechenov (1829-1905) – Propuso que los estímulos no siempre elicitan respuestas reflejas de forma directa. En algunos casos un estímulo puede
liberar una respuesta que estaba inhibida y la fuerza de la respuesta no dependerá de la intensidad del estímulo. Ejemplo: Pequeñas partículas de
polvo pueden liberar un potente estornudo. Según Sechenov, la conducta voluntaria y los pensamientos están en realidad elicitados (generados) por
estímulos débiles y apenas visibles.
Sin embargo el trabajo de Sechenov tenía un fallo: No tuvo en consideración que a lo largo de la vida de un individuo, su respuesta ante un estímulo puede
variar debido a la experiencia.
• Ivan Pavlov (1849 – 1936): Demostró experimentalmente que no todos los reflejos son innatos. Mediante mecanismos asociativos se pueden establecer
nuevos reflejos para estímulos.
B) EL AMANECER DE UNA NUEVA ERA
La cognición Descartes pensaba que los humanos eran los únicos animales que poseían mente.
comparada - Darwin criticó duramente esta idea y en su libro “el origen del hombre” postuló que el hombre desciende de algún ser más primitivo, a pesar
y la de que por el momento se desconozcan los eslabones intermedios”. En opinión de Darwin, la mente humana es producto de la evolución y si
evolución de el ser humano tiene habilidades mentales como hacerse preguntas, memorizar, o razonar, el resto de animales las posee.
la - George Romanes: Definió la inteligencia a partir de la capacidad de aprender. Definición muy aceptada a finales del XIX y principios del XX.
inteligencia
Nervismo: (Pavlov) – De acuerdo con el nervismo, las principales funciones fisiológicas están controladas por el sistema nervioso.
Neurologia Años más tarde (1902) dos investigadores británicos demostraron que el páncreas estaba controlado parcialmente por factores hormonales
funcional Esto llevó a Pavlov a abandonar su investigación sobre la fisiología del sistema digestivo y centrarse en los reflejos condicionados.
Pavlov consideró los estudios de condicionamiento como un medio para obtener información sobre las funciones del sistema nervioso.
Modelos Los modelos animales permiten investigar problemas que son difíciles o imposibles de estudiar directamente en personas. Un modelo
animales de permite realizar la investigación en condiciones más sencillas, mejor controladas y más económicas. Lo más importante a la hora de construir
la conducta un modelo animal útil es identificar las similitudes relevantes entre el modelo animal y la conducta humana en cuestión.
humana Dollard y Miller fueron partidarios de una integración en la que los estudios de laboratorio realizados con animales no humanos se usaran
para aislar e identificar los fenómenos que podrían ser estudiados posteriormente con éxito en las personas.
Modelos La meta de la robótica es hacer máquinas tan inteligentes como sea posible. Los ingenieros actuales contemplan la capacidad de recordar y
animales aprender a partir de la experiencia como un rasgo importante de los sistemas artificiales inteligentes.
y robótica
C) DEFINICIÓN DE APRENDIZAJE
Según Domjan: “El aprendizaje es un cambio duradero en los mecanismos de conducta que implica estímulos y/o respuestas específicas y que es resultado de
la experiencia previa con esos estímulos y respuestas o con otros similares”
Distinción La definición anterior atribuye el aprendizaje a un cambio en los mecanismos de conducta, no a un cambio directo en la conducta. Esto es
entre importante ya que pueden haber cambios en la conducta que no sean consecuencia de un aprendizaje.
aprendizaje Ejecución: Se refiere a las acciones de un organismo en un momento concreto. Que hagamos (o no) algo depende de muchas cosas, como la
y ejecución motivación, capacidades sensoriales, etc, además del aprendizaje.
El Existen cambios en la conducta tan breves que no pueden ser considerados como ejemplos de aprendizaje:
aprendizaje Fatiga: El esfuerzo físico debilita gradualmente la fuerza de una respuesta.
y otras Cambio en las condiciones estimulares: Encender las luces a mitad de la película en el cine provoca una respuesta en los espectadores.
fuentes de Estado Fisiológico o motivacional del organismo: El hambre y la sed provocan respuestas que no se observan en otros momentos.
cambio Maduración: Un niño crece y alcanza una estantería a la que antes no llegaba. No se considera aprendizaje ya que es un cambio debido al
conductual paso del tiempo.
Diferentes Existen 4 tipos de causas descritos por Aristóteles:
tipos de Causa eficiente: Es la experiencia anterior con estímulos y/o respuestas específicos que produce el cambio en la conducta que señala la
mecanismos presencia del aprendizaje.
causales Causa material: Hacen referencia a los cambios físicos en el sistema nervioso que median en el aprendizaje.
Causa formal: Las causas formales son las teorías o modelos de aprendizaje. Estas terorías o modelos pueden expresarse en términos
matemáticos o computacionales.
Causa final: La causa final de un comportamiento o de cualquier proceso biológico es cómo ese proceso contribuye al éxito reproductivo del
organismo. La causa final se mide a partir del número de descendientes de un organismo.
Los investigadores del aprendizaje han centrado su atención en las causas eficientes,materiales y formales.
El Las causas no pueden observarse directamente. Tan sólo pueden ser inferidas a partir de los resultados de las manipulaciones experimentales.
aprendizaje Para identificar una causa se requiere la realización de una prueba en ausencia de dicha causa. Entonces podremos comparar los resultados
como obtenidos en presencia y en ausencia de la presunta causa.
ciencia La pregunta típica es si un procedimiento produce un efecto de aprendizaje en particular. Para responder a esta pregunta, hay que comparar
experimental las acciones de los individuos que previamente han sido expuestos al procedimiento en cuestión con las acciones de los individuos que no han
sido expuestos a dicho procedimiento.
TÉRMINOS CLAVE
Aprendizaje: Cambio duradero en los mecanismos de conducta que implica estímulos y/o respuestas específicos y que es resultado de la experiencia previa con esos
estímulos y respuestas o con otros similares.
Asociación: Conexión entre la representación mental de dos eventos (dos estímulos o un estímulo y una respuesta) de forma que la ocurrencia de uno de los eventos
activa la representación del otro.
Dualismo: Visión de la conducta según la cual las acciones pueden dividirse en dos categorías: conducta voluntaria controlada por la mente y conducta involuntaria
controlada por mecanismos reflejos.
Ejecución: Actividades de un organismo en un momento particular.
Empirismo: Corriente filosófica según la cual todas las ideas de la mente tienen su origen en la experiencia.
Fatiga: Disminución temporal de la conducta provocada por el uso excesivo o repetido de los músculos involucrados en ella.
Hedonismo: Postura filosófica propuesta por Hobbes según la cual las acciones de un organismo están enteramente determinadas por la persecución del placer y la
evitación del dolor.
Maduración: Cambio en la conducta causado por el desarrollo físico o fisiológico del organismo en ausencia de experiencia con eventos particulares del ambiente.
Innatismo: Postura filosófica según la cual los seres humanos nacen con ideas innatas.
Nervismo: Postura filosófica adoptada por Pavlov según la cual todos los procesos conductuales y fisiológicos están regulados por el sistema nervioso.
Reflejo: Mecanismo que permite que un evento específico del ambiente elicite una respuesta específica.
Sílaba sin sentido: Combinación de 3 letras ( dos consonantes separadas por una vocal) sin significado.
La conducta elicitada puede variar como resultado únicamente de la presentación repetida del estímulo elicitante.
Atención visual en Conclusión: La atención visual provocada por un estímulo novedoso cambia a medida que el bebé se familiariza con el estímulo.
los bebes
humanos
Salivación y Conclusión: Los resultados indican que las personas encuentran el sabor de una comida específica menos placentera cuanto más la comen.
evaluación del
sabor en humanos
Respuesta de Conclusión: Las repeticiones de los sustos generaban cada vez respuestas más débiles de sobresalto por parte de las ratas. Por el contrario cuando el
sobresalto sonido era más intenso, las repeticiones de tono provocaron reacciones de sobresalto cada vez más vigorosas.
en ratas
LOS CONCEPTOS DE HABITUACIÓN Y SENSIBILIZACIÓN
Reacciones Solomon y Corbit destacaron que las reacciones emocionales intensas a menudo constan de dos fases. Una emoción tiene lugar durante la presentación
emocionales del estímulo elicitante y la opuesta se observa cuando el estímulo desaparece. (efecto sedante, relajante y agradable del alcohol al principio, en
y sus efectos contraposición al dolor de cabeza y nausea de la resaca).
posteriores Otra característica de las reacciones emocionales es que cambian con la experiencia.
La reacción primaria se hace más débil y su pos efecto se hace más fuerte
Tolerancia a la droga: Habituación de la primera reacción a la droga
También podemos encontrar esta misma analogía de dos procesos en el amor y el apego. Las parejas con el tiempo dejan de darse los signos de amor
del principio e incluso dejan de sentir ese enamoramiento principal, debido a la habituación. Sin embargo cuanto más tiempo lleve una pareja junta,
más difícil será la pérdida de uno de ellos para el otro.
La teoría del Esta teoría se diseñó para explicar los 3 rasgos característicos de las emociones
proceso 1. Las reacciones emocionales son bifásicas; a una reacción primaria sigue un postefecto opuesto.
oponente 2. La reacción primaria de debilita con la estimulación repetida.
3. El debilitamiento de la reacción primaria va acompañado de un fortalecimiento del postefecto.
La teoría asume que los mecanismos neurofisiológicos involucrados en la conducta emocional tratan de mantener la estabilidad emocional. Por esta
razón decimos que es una teoría homeostática. Asume que un estímulo emocional activador desvía de la neutralidad el estado emocional de una
persona. Se asume que este desplazamiento con respecto a la neutralidad emocional pone en marcha un proceso oponente (contrario) que compensa
el cambio. Encontramos dos tipos de procesos:
Proceso primario o proceso a: Es el responsable de la naturaleza del estado emocional que tiene lugar en presencia del estímulo (la alegría).
Proceso oponente o proceso b: Es el que genera la reacción emocional opuesta (por ejemplo tristeza).
El proceso oponente es ligeramente ineficiente ya que no logra contrarrestar del todo al proceso primario. Sin embargo con la repetición logramos
una sensibilización de este proceso y por lo tanto un mayor efecto.
Ver gráficos de la página 54 y 55.
Mecanismos oponentes durante la exposición inicial al estímulo
En la primera presentación del estímulo el proceso b no es lo suficientemente fuerte para compensar por completo la respuesta emocional primaria,
que persiste mientras esté presente el estímulo elicitante. Cuando el estímulo se retira, el proceso a se detiene rápidamente pero el proceso b
permanece por algún tiempo y se hace evidente por primera vez.
Mecanismos oponentes tras la exposición prolongada al estímulo
El proceso b se fortalece con la exposición prolongada al estímulo, por el contrario se asume que el proceso a permanece inalterado. Por tanto, tras la
presentación repetida de un estímulo, la respuesta emocional primaria queda compensada de forma más efectiva por el proceso oponente.
Motivación y postefecto oponente
Si los consumidores habituales de drogas cada vez notan menos placer al consumirlas ¿porqué se hacen adictos? La teoría del proceso oponente
sugiere que la adicción a las drogas es un intento de reducir la aversión producida por el postefecto afectivo de las drogas (bajón, irritabilidad,
malestar). Hay dos formas de reducir el postefecto, una es simplemente esperar a que pase el efecto oponente (pasar el mono) la otra forma de pasarlo
es volver a consumir la droga. Este mecanismo es lo que hace que la gente se haga adicta, no por el placer directo que obtienen de la droga, sino para
reducir los efectos de retirada.
Los descubrimientos de Fueron los primeros en estudiar el condicionamiento clásico en el laboratorio de Pavlov.
Vul´fson y Snarskii Siguieron experimentando con los perros y su salivación.
Estímulos orofaringeos: Algunas sustancias provocan en la boca sensaciones de textura y sabor características. Estas sensaciones reciben el
nombre de estímulos orofaringeos.
Los perros salivaban cuando se les ponía arena en la boca, posteriormente la sola visión de la arena les hacía salivar. Este tipo de aprendizaje
se denomina aprendizaje de objeto ya que requiere asociar diferentes características de un mismo objeto.
El paradigma de El procedimiento de Pavlov constaba de dos estímulos:
condicionamiento clásico -Luz que no provoca salivación al principio del experimento. Se trata del estímulo condicional ya que su efectividad depende de su
emparejamiento con el ácido. Provoca una respuesta condicional
-Solución ácida situada en la boca. Se trata del estímulo incondicional ya que no depende de nada para producir saliva. Provoca una
respuesta incondicional.
Condicionamiento Watson y Rainer. Condicionaron la respuesta de miedo a un niño de 9 meses ante la presentación de una rata blanca. Más tarde comenzaron a utilizar
del miedo ratas y descargas eléctricas en las patas como estímulo incondicional aversivo.
Ante una descarga eléctrica la rata se paraliza por el miedo. Sin embargo para medir la respuesta de miedo utilizaban la técnica REC (respuesta
emocional condicionada).
1. Se enseña a las ratas a presionar una palanca para obtener comida
2. Se muestra un EC (estimulo condicionado) que puede ser una luz o un pitido seguido de una descarga eléctrica.
3. La rata se paraliza y no puede acceder a la palanca.
4. Finalmente la sola presencia del EC (sin la descarga) hace que la rata se paralice.
Para ponerle números a todo esto se calcula algo llamado “Razón de supresión”
Razón de supresión = Respuestas durante EC/ (Respuestas durante EC + Respuestas durante Pre – EC)
Cuanto menor es la razón de supresión, menor es la respuesta del animal. Entendiendo por razón de supresión = 0 una
parálisis total de su respuesta.
Aparte del experimento de la palanca también utilizaban la supresión condicionada del lameteo en el cual ratas sedientas bebían de un tubo que
desprendía agua y mediante el EC se paralizaban y no bebían.
Condicionamiento Conocido como reflejo palpebral.
del parpadeo 1. Presentación de un estímulo condicionado – Tono
2. Soplo de aire a los ojos – estímulo incondicionado – Se produce el parpadeo.
3. El sujeto aprende a parpadear ante la sola presencia del estímulo condicionado
Conclusiones:
a) Para que se produzca condicionamiento clásico debe haber emparejamiento entre EC y EI.
b) b) El aprendizaje inicial puede no ser directamente observable.
Recuadro 3.2 El Cuando un organismo aprende algo, la red de neuronas que almacena esta nueva información se llama engrama.¿Dónde se encuentra el engrama?
condicionamiento La búsqueda del engrama comenzó por el hipocampo. Sin embargo comprobaron en animales que si les extirpaban el hipocampo la capacidad de
palpebral y la aprendizaje condicionado no se alteraba.
búsqueda del Entonces concluyeron que el engrama se encontraba en el cerebelo … (leer página 68)
engrama Estímulo incondicionado – La señal llega al cerebelo a través de fibras trepadoras
Estímulo condicionado – La señal llega al cerebelo a través de fibras musgosas
Seguimiento del Los animales se aproximan a estímulos que señalan la disponibilidad de alimento.
signo ¿Cómo comprobaban el seguimiento del signo en el laboratorio?
Con Palomas dentro de una caja. Había una tecla (EC) que se iluminaba durante 8 segundos y a continuación se administraba comida (EI) en un
pequeño comedero (no era necesario pulsar la tecla para administrar comida).Con las repeticiones, cada vez que la tecla se encendía, las palomas
picoteaban la tecla.
Este y otros experimentos demuestran que tenían una atracción irresistible a las señales de comida condicionadas clásicamente, es decir, a la tecla
(EC).
Aprendizaje de La aversión a un sabor puede aprenderse si la ingestión de un sabor nuevo va seguida de enfermedad o de otras circunstancias negativas. Por el
aversión al sabor contrario la preferencia por un sabor va acompañada de sensaciones de saciedad u otras circunstancias positivas.
En el caso de aversión a un sabor por haber enfermado, lo curioso es que el 20% de los casos las personas estaban seguras que su enfermedad no
tenía que ver con la comida, y sin embargo le cogieron aversión. Esto demuestra que el aprendizaje de aversión al sabor es independiente de los
procesos racionales.
Características de la aversión al sabor
- Un único emparejamiento entre EC y EI puede provocar la aversión (eso también puede suceder con el aprendizaje del miedo). Sin embargo se
necesitan más emparejamientos en el condicionamiento palpebral, el condicionamiento salival o el seguimiento del signo.
- Se produce aversión aunque la enfermedad se presente horas después de haber comido. Es lo que se conoce como “Aprendizaje demorado”.
Procedimientos Intervalo entre ensayos: Tiempo entre el final de un ensayo de condicionamiento y el inicio del siguiente.
típicos Intervalo entre estímulos: Tiempo entre el EC y el IE.
de Para que haya respuesta de condicionamiento, el intervalo entre estímulos debe ser mucho menor que el intervalo entre ensayos.
condicionamiento 5 procedimientos comunes de condicionamiento clásico (mirar el gráfico de la página 75)
pavloviano 1. Condicionamiento de demora corta: Se presenta el EC y al poco tiempo y sin que haya finalizado, se presenta el EI.
2. Condicionamiento de huella: Se presenta el EC y cuando ha acabado se presenta el EI. Al intervalo entre ambos se le llama intervalo de huella.
3. Condicionamiento de demora larga: Como el de demora corta pero el EC dura mucho más tiempo. Entonces se presenta el EI antes de que EC
acabe.
4. Condicionamiento simultáneo: EC y EI se presentan a la vez.
5. Condicionamiento hacia atrás: Al revés que todos los anteriores. Se presenta el EI y luego el EC
Medida de las Ensayo de prueba: Ensayo en el que se presenta el EC sin el EI. Esto permite medir la respuesta condicionada en ausencia de la respuesta
respuestas incondicionada. Son fundamentales para evaluar el aprendizaje en el condicionamiento simultáneo y hacia atrás.
condicionadas Magnitud: Cantidad de conducta que tiene lugar
Fuerza de la respuesta: Se mide por la frecuencia con la que el EC provoca una respuesta condicionada.
Probabilidad :cómo de probable es que el EC de una respuesta condicionada
Latencia: Cantidad de tiempo que pasa entre el principio del EC y la aparición de la respuesta condicionada.
Procedimientos Pseudocondicionamiento: Casos en los que la mera exposición al EI da lugar a respuestas similares a la respuesta condicionada
de control en el Para saber si se trata de un pseudocondicionamiento o realmente un condicionamiento clásico (asociación entre EC y EI) son necesarios los
condicionamiento procedimientos de control.
clásico Control aleatorio: Procedimiento en el que los estímulos condicionado e incondicionado se presentan en momento aleatorios uno con respecto a
otro. Sin embargo este tipo de control puede dar lugar a aprendizaje asociativo.
Control desemparejado explícito: EC y EI se presentan lo suficientemente separados para evitar que se asocien.
Eficacia de los
Trataban de averiguar cual de los 5 procedimientos de condicionamiento vistos en la hoja anterior daba más muestras de aprendizaje. Para ello lo
procedimientos
primero que hay que tener en cuenta es el intervalo entre estímulos o intervalo EC-EI.
típicos de - Simultaneo: Poco condicionamiento en el condicionamiento simultaneo en los que el intervalo EC-EI es 0.
condicionamiento
- Demora corta: facilita la respuesta condicionada
- Demora larga: Disminuye la respuesta condicionada
- De huella: Se genera un intervalo de huella. Al igual que en demora larga, cuanto más separados están EC y EI, se produce menos condicionamiento.
- Hacia atrás: Ofrece resultados ambiguos. Se ha observado condicionamiento excitatorio o inhibitorio.
2 ideas que debemos recordar a modo de conclusión:
- El condicionamiento es más efectivo cuando el EC es una buena señal de que el EI aparecerá pronto.
- Se produce mejor condicionamiento cuando el intervalo EC-EI es corto.
Hipótesis de codificación temporal: El sujeto no sólo aprende a relacionar EC y EI, sino que dependiendo del procedimiento utilizado (de los 5 que
hemos visto) también aprenderá cúando en el tiempo va a ocurrir EI.
CONDICIONAMIENTO PAVLOVIANO INHIBITORIO
La inhibición condicionada produce cambios en la conducta observable, pero ¿Cómo podemos observar estos cambios?
Medición de la Hay 3 métodos
inhibición A) Sistemas de respuestas bidireccionales
condicionada Se puede medir fácilmente en aquellos sistemas que tengan una línea base. En estos casos la excitación condicionada da lugar a un cambio
conductual en una dirección y la inhibición condicionada da lugar a un cambio en la dirección opuesta.
Limitaciones
- Sólo funciona con respuestas que pueden ir en direcciones opuestas.
- Sólo muestra el efecto neto (resultado) entre la excitación y la inhibición.
B) La prueba del estímulo compuesto o sumación
La prueba de sumación implica la presentación de dos estímulos, un EC+ y un EC- juntos.
La idea es que cada estímulo produce su propia reacción asociativa (excitación e inhibición) y que cada reacción se suma de forma algebraica. Puesto
que son procesos antagónicos, la asociación inhibitoria suprime la excitatoria. Este efecto se cuantifica midiendo la fuerza del estímulo condicionado
excitatorio (EC+) sin emparejar, evaluándolo de nuevo en combinación con el estímulo condicionado inhibitorio (EC-), y calculando después la
diferencia. Si un EC- carece de fuerza inhibitoria, se observa toda la fuerza de la reacción excitatoria en ambos casos. Sin embargo, si el estímulo
condicionado inhibitorio es fuerte (produce RC inhibitoria), se observa una disminución del nivel de excitación del EC+ al presentar los estímulos
simultáneamente
C) La prueba del retraso en la adquisición
Si un estímulo inhibe de forma activa una respuesta particular, entonces debería ser especialmente difícil de condicionar ese estímulo para que
provoque la conducta. Es decir, la velocidad de adquisición de una respuesta excitatoria debería disminuir si el EC es un inhibidor condicionado.
PREDOMINIO DEL CONDICIONAMIENTO CLÁSICO
Aparece con mayor probabilidad cuando un evento predice a otro regularmente y con una demora corta entre el EC y el EI.
Algunos ámbitos de la vida en los que se desarrolla el condicionamiento de Pavlov:
- Aversiones y preferencias alimenticias
- Adquisición de miedos.
- Tolerancia y adicción a las drogas
- Respuestas de los niños y de las madres durante la lactancia
- Situaciones sexuales
Pavlov: El EC inicialmente no provoca la respuesta condicionada pero adquiere la capacidad de hacerlo como resultado del desarrollo de una
Respuestas asociación con el EI.
iniciales Sin embargo la identificación de EC y EI es relativa ya que un evento puede servir de EC respecto a un estímulo y de EI respecto a otro. En
a los estímulos experimentos con ratas la sacarina es un EC si posteriormente se inyecta una droga que produce malestar (EI), entonces las ratas aprenden a no tomar
la sacarina. Sin embargo en un experimento en el que se proyecta una luz (EC) justo antes de suministrar sacarina (EI) las ratas aprenden a acercarse a
la luz cada vez que aparezca.
Cuando los estímulos son novedosos, el aprendizaje se desarrolla más rápido.
A la hora de experimentar sobre la novedad o familiaridad de los estímulos, se realiza en dos fases:
a) Se expone repetidamente a los sujetos al estímulo que luego será EC.
b) EC se empareja con un EI
Sin embargo se observa que la familiaridad que el sujeto tiene con EC (ya que se le ha repetido muchas veces en la fase a) hace que el
emparejamiento con el estímulo incondicionado sea más lento. Este fenómeno se denomina efecto de preexposición al EC o efecto de Inhibición
latente.
• La Habituación sirve para sesgar la conducta elicitada a favor de los estímulos novedosos.
La novedad de • La Inhibición latente sirve para sesgar el aprendizaje a favor de los estímulos novedosos.
los estímulos Es la habilidad de inconscientemente ignorar los estímulos que son percibidos como irrelevantes para lo que uno necesita.
condicionados Si el experimento lo hacemos con un EI, el resultado es el mismo. Quien estaba familiarizado con el estímulo incondicionado tardará más en
e incondicionados relacionarlo con el EC. Esto recibe el nombre de Efecto de preexposición al EI.
2 Mecanismos para explicar los dos efectos de preexposición
• Interferencia asociativa: Las preexposiciones a EC o EI disminuyen la capacidad de estos estímulos para participar en nuevas asociaciones.
• Interferencia de memoria: Los participantes recuerdan que en la fase “a” el estímulo se les presentada aislado y este recuerdo altera la
respuesta condicionada.
Intensidad y La intesidad de los estímulos es una variable importante que recibe el nombre de saliencia del estímulo. El aprendizaje se llevará a cabo de manera
saliencia del más rápida cuanto mayor sea la saliencia del estímulo. Ratas con deficit nutricional de sal prestan más atención al sabor de la sal (aquí se ha
EC y del EI aumentado la saliencia del estímulo en relación a las necesidades biológicas del organismo).
La relevancia es el grado en el que el EC es relevante con respecto al EI. En un ambiente natural, es normal que las ratas enfermen tras tomar un
alimento en mal estado. También es normal que sufran algún daño tras ser perseguidas por un animal al que pueden oir.
Ambas hipótesis son trasladadas al laboratorio donde se ponen en práctica para demostrar la relevancia
Hipótesis 1: Daño por animal al que pueden oir
Relevancia o Experimento
pertinencia A- Ratas lamiendo agua salada + luz que acompaña al lameteo = descarga eléctrica
EC – EI Luego se repetía el proceso pero cada estímulo por separado:
B- Ratas lamiendo agua salada + ausencia de luz = descarga eléctrica
C- Ratas lamiendo agua sin sabor + luz que acompaña al lameteo= descarga eléctrica
Pavlov: Un EC adquiere la capacidad de funcionar de forma similar a como el EI lo hacía previamente. El EC activa los circuitos neuronales que
previamente sólo activaba el EI. El EC se convierte en un sustituto del EI.
- EI EI como factor determinante de la RC
La forma de la respuesta condicionada va a tener algo de relación con que tipo de EI haya.
El modelo de Ejemplo en Palomas
sustitución Las Palomas abren el pico más cuando van a comer grano que cuando van a beber.
del estímulo EI = Grano EC= Tecla que se ilumina antes de dar agua o grano
EI = Agua RC= Respuesta de picoteo a la tecla
2 grupos de Palomas, uno con agua y otro con grano. Se demostró que el grupo que había relacionado el grano con la tecla, picoteaba la tecla con el
pico más abierto que el grupo que había relacionado la tecla con el agua. Por lo tanto dependiendo del EI (agua o grano) tendremos una RC
(picoteo grande o succión) al EC (tecla) diferente.
La homeostasis se refiere a los mecanismos fisiológicos que mantiene los aspectos críticos del cuerpo dentro de los límites aceptables. Cualquier
amenaza a nivel homeostático pone en marcha una reacción compensatoria que neutraliza la alteración. Esta reacción funciona por procesos de
retroalimentación negativa (Walter Cannon). La exposición al frío produce escalofríos para incrementar la temperatura del cuerpo.
Dworkin señaló que las alteraciones en la homeostasis pueden compensarse más efectivamente si pueden anticiparse.
Esto recibe el nombre de respuesta homeostática condicionada.
Las drogas suelen provocar alteraciones fisiológicas de la homeostasis que activan reacciones compensatorias condicionadas. Las claves que se asocian
a esta alteración pueden elicitar estas reacciones compensatorias como respuestas condicionadas anticipatorias.
A) Proceso normal=Drogas - Alteración homeostasis – reacciones compensatorias condicionadas
B) Proceso en el que pienso en la droga pero no la tomo = Claves de droga (drogas-alteración homeostasis) – reacciones compensatorias
Aprendizaje y condicionadas – respuestas condicionadas anticipatorias.
homeostasis: El modelo de condicionamiento de tolerancia a las drogas
Un caso especial Siempre se ha considerado que la tolerancia a las drogas se debía a procesos farmacológicos, sin embargo Shepard Siegel encuentra otra explicación
de basada en el condicionamiento clásico… La explicación se basa en el concepto de homeostasis aprendida.
sustitución del Tomamos droga y se producen unos cambios fisiológicos en nuestro organismo (son el EI).
estímulo Entonces se ponen en marcha unos ajustes para compensar esos cambios, son la respuesta incondicionada (RI). Entonces…
Mediante el condicionamiento pavloviano o clásico, los estímulos que acompañan a la administración de droga se asocian con el EI. Estos estímulos
condicionados pueden ser la hora del día, o el lugar donde se consume droga habitualmente. Por lo tanto
- Droga provoca EI
- EI provoca RI
- EI siempre va con EC (lugar y hora)
-EC provoca RI (es decir, el lugar y la hora provocan mi respuesta fisiológica para compensar los cambios que me producirá la droga, por lo tanto tomar
droga en sitios habituales me “colocará” menos).
Ejemplo en ratas.
el EC como A una rata A se le presentaba otra rata B atada que actuaba como EC, 10 segundos antes de presentarle la comida. A fuerza de presentarle la rata B (EC)
determinante de antes de la comida (EI) se quería observar si la respuesta normal que daría la rata A ante la comida (morder, roer) comenzaría a darla con la sola visión
la forma de la RC de la otra rata. Sin embargo esto no fue así, sino que la rata A mostraba actitudes sociales ante la rata B. Por lo tanto estas actitudes sociales
estaban sin duda determinadas por la naturaleza del EC (la rata B).
Conducta Un sistema de conducta consiste en una serie de modos de respuesta, cada uno de ellos con sus propios estímulos y respuestas relevantes, dispuestos
condicionada y con determinado orden espacial y/o secuencial.
sistemas de Esta teoría asume que la presentación de un EI activa el sistema de conducta (formado por uno o varios EC) para ese EI.
conducta La presentación de un estímulo sexual para la codorniz macho (EI) activa una secuencia de:
Conducta de búsqueda general (EC),
Conducta de búsqueda focal (EC)
Conducta consumatoria (EI)
La forma de la RC depende del intervalo EC-EI que se utilice. La razón es que el intervalo EC-EI determinará el lugar en el que se incorporará el EC
dentro de la secuencia de respuestas del sistema de conducta. El EC no sustituye ni compensa al EI. En lugar de eso, sustituye a un estímulo en un punto
del sistema de conducta determinado por el intervalo EC-EI.
Aprendizaje E-R Aprendizaje E-R: Este aprendizaje establece una nueva conexión Entre el EC y la RC
frente a Aprendizaje E-E: Es una visión más moderna, en la que los individuos aprenden una asociación entre el EC y el EI. Los sujetos responden al EC, no
aprendizaje E-E porque éste elicite directamente la RC sino porque el EC hace que el sujeto piense en EI.
¿Cómo pueden los investigadores decidir entre estas dos interpretaciones?
Mediante la técnica de la devaluación del EI, que consiste en la reducción del atractivo de un estímulo incondicionado, normalmente obtenida
mediante la aversión o la saciedad.
El modelo de Se trata de un modelo matemático que explica porqué la efectividad de un EI está determinada por el grado en que resulta sorprendente.
Rescorla y Wagner Pueden haber:
- EI inesperadamente grandes: Son la base del condicionamiento excitatorio
- EI inesperadamente pequeños: Son la base del condicionamiento inhibitorio
Y todo esto se puede explicar mediante una fórmula matemática:
ΔV = k( λ - V )
λ : Asíntota de aprendizaje
V: Valor asociativo de los estímulos que preceden al EI
k: Constante relacionada con la saliencia del EC y del EI
ΔV: Cambio en el valor asociativo de un estímulo
Al principio del aprendizaje V está cercano a 0 ya que los estímulos que preceden al EI no los relaciono para nada con EI (por eso es una sorpresa).
Como V está cerca de 0, el resultado de ( λ - V ) será bastante grande. Por lo tanto ΔV (la sorpresa) será mayor al principio del aprendizaje.
Sin embargo conformen vayamos haciendo ensayos, V va creciendo al incrementarse su valor de asociación con el EI. Como V va creciendo, el
resultado ( λ - V ) será menor. Por lo tanto ΔV (la sorpresa) será menor al final del aprendizaje.
Aplicación al efecto de bloqueo
Final de la primera fase: VA = λ
Segunda fase: No hay condicionamiento del estímulo B en la fase 2, ya que el EI es predecible por la presencia del estímulo A:
EI = (λ-VA+B) = 0
Pérdida del valor asociativo a pesar de los emparejamientos con el EI
El modelo Rescola-Wagner predice que los estímulos perderán valor asociativo si se presentan juntos en un ensayo de condicionamiento después de
haber sido entrenados por separado.
Fase 1
- Asociamos el estímulo A con una bolita de comida (EI)
- Paralelamente asociamos el estímulo B con la misma bolita de comida (EI)
Ambos estímulos se han condicionado perfectamente, de manera que predicen perfectamente el EI de una bolita de comida, es decir, VA = VB = λ
Fase 2
- Presentamos ambos estímulos conjuntos (A y B) con la bolita de comida (EI)
Al no haber cambios en el EI, las propiedades de A y B adquiridas en la fase 1 deberían mantenerse, y sin embargo el modelo predice que se van a
reducir. ¿porqué sucede esto?
Porque la expectativa basada en los estímulos individuales son 2 bolitas de comida y sin embargo se le presenta 1 única bolita. Por lo tanto existe
una discrepancia entre lo que se espera (2 bolitas) y lo que se presenta (1 bolita). Los participantes encuentran que el EI es sorprendentemente
pequeño, por lo tanto para ajustar la expectativa a lo que realmente ocurre, A y B perderán valor.
Inhibición condicionada (mirar el gráfico de la página 82 del tema 3 para recordar qué era la inhibición condicionada)
La inhibición condicionada consta de dos tipos de ensayos:
- Ensayos reforzados: Se presenta el EI
- Ensayos no reforzados: Se omite el EI
Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirir propiedades excitatorias.
Por el contrario, en los ensayos no reforzados, el EI no ocurre (a pesar de que lo esperamos como consecuencia de nuestro aprendizaje en los
ensayos reforzados). Se trata de un caso de expectativa excesiva.
Para predecir con exactitud la ausencia de EI en los ensayos no reforzados, los valores asociativos de EC+ y EC- tienen que sumar cero.
Extinción de la excitación y la inhibición (gráfico pág 115)
Excitación:
En este procedimiento, el estímulo condicionado se presenta repetidamente con el EI.
Como el EC ha adquirido fuertes propiedades excitatorias, la primera vez que se presenta solo el EC habrá un exceso de expectativa a que también
se presente el EI. Conforme se siga presentado el EC solo, la expectativa de que aparezca EI se va acercando a 0.
Inhibición:
Es un poco lo contrario que el caso anterior. Aquí el EC- comienza con un valor asociativo negativo que se considera una predicción excesivamente
baja del EI. Para ajustarse a las expectativas, el valor asociativo negativo del EC- se va perdiendo hasta llegar a 0.
Problemas del modelo de Rescorla y Wagner
1º Problema: Su análisis de la extinción de la inhibición condicionada es incorrecto. El modelo predice que la presentación repetida de un
inhibidor condicionado (EC-) sin el EI debería dar lugar a una pérdida de la inhibición condicionada, pero esto no sucede.
2º Problema: El modelo considera la excitación como lo opuesto a la extinción. Y no debe verse así.
3º Problema: El modelo solo permite que los EC tengan un único valor asociativo (EC+ o EC-) sin embargo se ha descubierto que en ciertas
condiciones puede tener ambos.
4º Problema: El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los paradigmas de aversión al sabor y el olor.
Concretamente tiene problemas para explicar el efecto de aumento o contrabloqueo. (el estímulo previamente condicionado
aumenta el condicionamiento del EC añadido)
Modelos atencionales de condicionamiento
Para que el condicionamiento tenga lugar, los sujetos deben prestar atención al EC.
- Se asume que el grado de atención que un animal presta al EC en un ensayo determinado depende del grado en el que el EI haya sido
sorprendente en el ensayo anterior.
- La sorpresividad del EI en un ensayo determinado altera el grado de atención dedicado al EC en los ensayos siguientes. Por lo tanto la
sorpresividad del EI tiene sólo un efecto prospectivo o proactivo sobre la atención y el condicionamiento (esta es la principal diferencia con el
modelo de Rescorla y Wagner)
Otros modelos de Factores temporales y respuesta condicionada
condicionamiento - Ninguno de los modelos vistos hasta ahora explica los efectos del tiempo sobre el condicionamiento. Sin embargo el intervalo EC-EI es una variable
clásico temporal importante ya que los intervalos EC-EI más largos producen menos respuestas. (la respuesta es inversamente proporcional a la duración
del intervalo)
- Otra variable importante es el intervalo entre ensayos sucesivos. Se observa una mayor respuesta condicionada cuando se utilizan procedimientos
en los que los ensayos están más separados entre sí.
Hipótesis del tiempo de espera relativo
IEE: Intervalo entre ensayos
ED: Duración del ensayo
Un EC proporciona información acerca de la aparición del EI, sólo si el sujeto tiene que pasar menos tiempo esperando al EI tras la presentación del
EC que cuando está simplemente expuesto al contexto experimental.
-Razón IEE/DE baja = tiempo de espera similar al contexto = EC da poca info sobre aparición EI
-Razón IEE/DE alta= tiempo de espera menor que el contexto= EC da mucha info sobre aparición EI
Hipótesis del comparador
La respuesta condicionada depende no sólo de la asociación entre el EC y el EI, sino también de todas las posibles asociaciones que puedan
establecerse entre las claves contextuales y el EI.
Se asume que los organismos aprenden 3 asociaciones en el curso del tiempo (gráfico 121):
1ª asociación: Une el EC crítico (X) con el EI. (de forma directa)
2ª asociación: Une el EC crítico con las claves contextuales de comparación
3ª asociación: Une los estímulos de comparación y el EI (de forma indirecta)
- La hipótesis del comparador no indica cómo se establecen las asociaciones, se trata de una teoría de ejecución, no de aprendizaje.
- La comparación entre las asociaciones (EC-EI) y (contexto-EI) se realiza en el momento de la prueba.
- También se ha probado esta hipótesis en estudios sobre inhibición condicionada.
Atribuye la inhibición condicionada a situaciones en las que la asociación del EC crítico con el EI es más débil que la asociación de las claves
contextuales con el EI.
- Es la única hipótesis que predice que la extinción de la inhibición condicionada se puede lograr no presentando el EC- de forma aislada, sino
extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el condicionamiento inhibitorio del EC-.
- El modelo predice también que incrementar el valor excitatorio de las claves contextuales tras el tratamiento reducirá la respuesta condicionada
del EC crítico.
- Otra contribución ha sido suponer que las diferencias en la respuesta condicionada pueden reflejar diferencias en la ejecución más que en el
aprendizaje.
Visión general de las alternativas teóricas (un poco resumen de lo visto)
- Hipótesis del tiempo: Se centra en la distribución temporal
- Hipótesis del comparador: Es una teoría de la ejecución más que del aprendizaje
- Modelos atencionales: Se parece más a Rescorla-Wagner pero también comparte sus limitaciones.
Antes de empezar con los procedimientos (que son 4) vamos a explicar 4 conceptos:
condicionamiento instrumental.
Reinterpretación del experimento de superstición: Staddon y Simmelhag dieron nombre a las conductas de las palomas.
Denominaron respuestas terminales a las que se daban al final del intervalo comida-comida y respuestas de interín a las que se daban en medio del
intervalo. Las Palomas solían coincidir en el tipo de respuestas terminales y en el tipo de respuestas interín. Por lo tanto hay algo de contingencia entre
el tipo de respuestas y el reforzador (al contrario de cómo sugería Skinner)
Explicación de la periodicidad de las respuestas de interín y terminales: sugirieron que las respuestas terminales son respuestas típicas de la especie
que reflejan la anticipación de comida a medida que el tiempo se encuentra más cerca de la próxima presentación de comida. En contraste, las
respuestas interín son una manifestación de otras fuentes de motivación que eran más importantes al comienzo del intervalo entre comidas, cuando la
presentación de comida era improbable.
El tipo de respuestas que se dan en el intervalo se agrupan en 3 subgrupos siguiendo el orden temporal tras la última aparición de comida:
a) – Búsqueda focalizada poscomida (cerca del cuenco)
b) – Búsqueda general (lejos del cuenco)
c) - Búsqueda focalizada (cerca del cuenco otra vez)
Efectos de la controlabilidad de los reforzadores
Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. Un hallazgo importante en experimentos
con perros fue que la exposición a una descarga incontrolable dificultaba el aprendizaje posterior. Este efecto recibe el nombre de efecto de
indefensión aprendida.
1. El diseño triádico: (tabla página 153)
Los experimentos de indefensión aprendida se realizan utilizando el diseño triádico.
Contiene 2 fases:
a) Exposición
Grupo de ratas E: Expuesto a descargas periódicas de las que pueden escapar.
Grupo de ratas A: Cada sujeto del grupo A es acoplado a cada sujeto del grupo E y recibe las mismas descargas pero no
pueden escapar de ellas.
Grupo C: No recibe descargas pero está confinado en el aparato tanto tiempo como los otros.
b) Condicionamiento
Los 3 grupos reciben entrenamiento de escape – evitación
Resultados: La exposición a una descarga incontrolable (Grupo A) produce peores resultados en el aprendizaje escape-evitación que el resto de los
grupos. La diferencia en la tasa de aprendizaje entre los grupos muestra que los animales son sensibles a la contingencia respuesta-reforzador.
2. Hipótesis de la indefensión aprendida: Esta hipótesis asume que durante la exposición a descargas incontrolables, los animales aprenden
que las descargas son independientes de su conducta, no pueden hacer nada para controlarlas. Esto dificulta el aprendizaje ya que la falta de
control sobre la situación hace que descienda la motivación de los sujetos para realizar una respuesta instrumental. No confundir con el efecto
de indefensión aprendida que explica el patrón de resultados obtenido con el diseño triádico.
3. Deficit de actividad: Las ratas del Grupo A aprendían a ser inactivas en respuesta a la descarga durante la fase de exposición.
4. Deficit atencional: Una descarga inescapable hace que los animales presten menos atención a sus acciones. Sin embargo marcar la respuesta
instrumental supera el déficit de indefensión aprendida.
5.Relaciones estimulares en el condicionamiento de escape: El rasgo definitorio de la conducta de escape es que la respuesta instrumental
tiene como consecuencia la terminación del estímulo aversivo. Además, la respuesta de escape tiene como resultado claves internas de
Programa de reforzamiento: Programa o regla que determina la forma en que se relacionan las presentaciones del reforzador con las ocurrencias de la respuesta
instrumental. La entrega del reforzador puede depender de varios factores, número de respuestas, paso del tiempo, etc.
Los programas de reforzamiento se investigan normalmente en cajas de Skinner que permiten una observación continua de la conducta, por lo que pueden observarse y
analizarse los cambios en la tasa de respuesta. Proporcionan más información sobre los factores que controlan el mantenimiento de la conducta.
A) PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE
Son programas en los que un solo factor determina qué ocurrencia de la respuesta instrumental se refuerza.
Programas El reforzamiento depende del número de respuestas.
de razón Reforzamiento continuo: Una sóla respuesta provoca la entrega del reforzador.
Reforzamiento parcial o intermitente: La respuesta se refuerza sólo alguna vez.
Razón fija: Entrega del reforzador cada X respuestas, (5, 10 etc). Se representa mediante RF5, RF10, etc.
Otros conceptos importantes
Registro acumulativo de la conducta: Es una forma especial de representar la forma de repetirse una respuesta a lo largo del tiempo. Se utilizaba sobre
todo antes de la existencia de los ordenadores. (gráfico pág 165). La pendiente de la línea trazada representa la tasa de respuesta.
Pausa posreforzamiento: Es la tasa de respuesta 0 que se observa justo después del reforzamiento.
Carrera de la razón: La tasa de respuesta alta y estable que completa cada requerimiento de la razón.
¿Qué ocurre cuando el requerimiento de la razón se incrementa un poco? Es decir, pasar por ejemplo de RF 120 a RF 150
- Con mayores requerimientos de la tasa, tienden a ocurrir pausas posreforzamiento más largas.
- Si el incremento es muy grande es probable que el animal realice una pausa periódica cada vez que complete la razón requerida. Es lo que se conoce
como tensión de razón.
Razón variable: Número de respuestas distinto para la entrega del reforzador. Se representa por RV y en el caso de RV10 quiere decir que su media es 10
Las pausas predecibles en la tasa de respuesta son menos probables con los programas de razón variable que con los programas de razón fija. Los
organismos suelen responder a una tasa claramente estable en los programas de RV.
Programas Cuando ocurre cierta cantidad de tiempo desde la última entrega del reforzador.
de intervalo Intervalo fijo (IF): El tiempo no varía de una ocasión a la siguiente.
Festón del intervalo fijo: A medida que el tiempo para la disponibilidad del próximo reforzador se acerca, la tasa de respuesta aumenta. Este aumento en la
tasa de respuesta se manifiesta como una aceleración en el registro acumulativo hacia el final del IF.
OJO!!! : Un programa de IF no garantiza que el reforzador se proporcionará a en algún momento a lo largo del tiempo, el intervalo determina sólo cuándo
el reforzador estará disponible, no cuando se entrega. Es decir, además del paso del tiempo, sigue siendo
necesaria algún tipo de respuesta por parte del sujeto para acceder al reforzador.
Intervalo variable (IV): El tiempo varía de una ocasión a la siguiente. Se representa por (IV 5), (IV 10), etc. Entendiendo este número como la media de
todos los intervalos. Los programas de IV mantienen tasas de respuesta constantes y estables sin pausas regulares. (al igual que prog. de RV)
Programas de intervalo y espera limitada: En la espera limitada el reforzador está disponible durante un tiempo X, si pasado ese tiempo el sujeto no ha
dado el número de respuestas necesario, el reforzador deja de estar disponible.
Similitudes Diferencias
Razón fija e intervalo fijo: - Activan diferentes cambios neuroquímicos en el cerebro
- Producen una pausa posreforzamiento después de la administración de - Los programas de intervalo están relacionados con el sentido temporal del
cada reforzador. organismo.
- Producen altas tasas de respuesta antes de la administración del siguiente En un experimento con palomas, una reforzada con RV y la otra con IV, se
reforzador. comprobó que la paloma reforzada con el programa de RV respondió a una
Comparación Razón variable e intervalo variable: tasa mucho más alta que la paloma reforzada con el programa de IV. El
de - Mantienen tasas estables de respuesta, sin pausas predecibles. programa de RV motivó una conducta instrumental mucho más vigorosa.
los programas
de razón y Reforzamiento diferencial del tiempo interrespuesta: El intervalo entre una respuesta y la siguiente se denomina tiempo interrespuesta o TIR.
de intervalo • TIR cortos=> responderá a una tasa alta
• TIR largos=> su tasa será baja.
Un programa de razón favorece los TIR cortos (es la respuesta del sujeto la que determina cuando accederá a la comida, por lo tanto cuanto más rápida se
produzca esa respuesta (TIR corto), antes accederá a la comida. Por el contrario, un programa de intervalo favorece los TIR largos.
Programas de Los programas de tasas de respuesta requieren específicamente que el organismo responda a una tasa particular para obtener el reforzador. Es como una
reforzamiento mezcla de los dos anteriores (tiempo y número).
de tasas de Por ejemplo un programa de reforzamiento en el que una respuesta se refuerce sólo si ocurre dentro de los 5 segundos siguientes a la respuesta
respuesta precedente. Si el animal realiza una respuesta cada 5 segundos, su tasa de respuesta será de 12 por minuto. Por lo tanto habrá reforzamiento si la tasa de
respuesta es de 12 por minuto o mayor. Si la tasa de respuesta es menor, el organismo no será reforzado.
Esto recibe el nombre de Reforzamiento diferencial de tasas altas, o RDA.
Reforzamiento diferencial de tasas altas (RDA): Una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la
respuesta precedente. Estos programas fomentan que los sujetos respondan rápidamente.
Reforzamiento diferencial de tasas bajas (RDB): Una respuesta se refuerza sólo si ocurre después de que haya transcurrido cierta cantidad de tiempo tras
la respuesta precedente. Estos programas fomentan que los sujetos respondan lentamente.
B) CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES
Los experimentos en los que sólo se mide una respuesta (los vistos hasta ahora) no proporcionan una visión completa de la conducta. En la vida real los organismos ocupan
su tiempo en muchas actividades y están continuamente estableciendo elecciones entre varias conductas.
Las situaciones de elección pueden ser bastante complicadas y muy diferentes. Por esta razón los psicólogos han desarrollado el estudio de situaciones más simples. La
situación de elección más simple consta de dos respuestas alternativas, cada una de estas seguida por un reforzador de acuerdo con su propio programa de reforzamiento.
Históricamente se utilizaban laberintos T para estudiar la conducta de elección. Hoy se utilizan cajas de Skinner equipadas con dos teclas. Responder en cada tecla es
reforzado según algún programa de reforzamiento. Los dos programas funcionan concurrentemente, por eso reciben el nombre de programa concurrente.
Ejemplo página 173 (gráfico). Programa concurrente. Los picotazos sobre la tecla A siguen un programa IV 60 seg. Los de la tecla B siguen un programa RF 10. El objetivo del
experimento es ver cómo la paloma distribuye sus picotazos en las dos teclas y cómo influye el programa de reforzamiento propio de cada tecla en las elecciones del animal.
La ley de la igualación y el valor del reforzador: La tasa relativa de respuesta es una función de la cantidad relativa de cada reforzador, de la demora y de
la palatabilidad. Cuanto mayores, más sabrosos y más inmediatos sean los reforzadores, serán de mayor valor.
La ley de la igualación y los programas simples de reforzamiento: Incluso las situaciones de respuesta única pueden involucrar una elección entre realizar
la respuesta especificada (picotear o presionar una palanca) u ocuparse de otras actividades (caminar, acicalarse, etc)
Según esto, la ley de la igualación quedaría así:
RA / (RA+RO) = rA / (rA+rO)
Despejando RA = RA =(RA+RO) rA / (rA+rO)
- RA= Tasa de respuesta del programa
- RO= Tasa de respuesta de las otras actividades
- rA = Reforzamiento explícito del programa
- rO = Reforzamiento de las otras actividades
Si consideramos que (RA+RO) es una constante que no guarda relación con el reforzador, podemos llamarla constante k. La fórmula quedará de la
siguiente manera:
RA = krA / (rA+rO)
Esta última ecuación proporciona dos maneras de modificar la tasa de una respuesta:
- Mediante el cambio de su tasa de reforzamiento
- Mediante el cambio de la tasa de las otras fuentes de reforzamiento
Mecanismos de Igualación y maximización de las tasas de reforzamiento: Los organismos distribuyen sus acciones entre las alternativas de respuesta para recibir la
la ley de la máxima cantidad posible de reforzadores en cada situación.
igualación 1. Maximización molecular: Los organismos siempre eligen cualquier alternativa de respuesta con mejores probabilidades de que sea reforzada en ese
momento.
Experimento en palomas con dos teclas (A y B) y programa IV-IV. Cuanto más tiempo permanezca la paloma en la tecla A, más probabilidad habrá de que
transcurra el intervalo para la tecla B y que por lo tanto el reforzamiento esté disponible para B.
2. Maximización molar: El organismo distribuye sus respuestas entre las varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen
a la larga.
Se utilizó para explicar los programas de razón en los que los organismos rara vez cambian de alternativa, simplemente responden a la alternativa que
requiera menor número de respuestas (RF10 frente a RF20)
Sin embargo la maximización molar encuentra problemas a la hora de explicar la conducta de elección en programas de intervalo (IV-IV) y para programas
razón-intervalo (RF-IV).
3. Mejoramiento: Los mecanismos de mejoramiento operan a una escala temporal de las teorías molar y molecular. El término “mejoramiento” se refiere
a hacer algo mejor que el pasado reciente. No se refiere a elegir la mejor alternativa en ese momento.
Término importante sobre el mejoramiento:
Tasa local de respuesta y reforzamiento: Las tasas locales están calculadas sólo sobre el período de tiempo que un sujeto dedica a una alternativa
particular de respuesta. Si la situación incluye dos opciones (A y B), la tasa local de respuesta en A se calcula dividiendo la frecuencia de respuesta en A por
el tiempo que el sujeto dedica a responder en A.
La teoría del mejoramiento asume que los organismos cambian de una alternativa de respuesta a otra para mejorar la tasa local de reforzamiento que
están recibiendo. El mecanismo de mejoramiento da como resultado la igualación. Esta teoría sostiene que un organismo cambiará su preferencia en
favor de la alternativa de respuesta que arroje la tasa local de reforzamiento más alta.
1. Estructura asociativa del condicionamiento instrumental: (Thorndike). Toma una perspectiva molecular. Se centra en las respuestas individuales y sus antecedentes
estimulares y consecuencias específicas.
2. Regulación conductual: (tradición skinneriana): El condicionamiento instrumental se considera desde un contexto más amplio, es decir, desde una perspectiva molar. Se
analizan las opciones conductuales del organismo para alcanzar las metas, por lo tanto es una perspectiva más funcional.
Regulación El concepto de regulación está muy relacionado con la homeostasis. Los organismos tienen una distribución de actividades preferida que luchan por
conductual mantener frente a los cambios. Si se perturba este nivel de actividades óptimo, se supone que la conducta
y el punto de cambiará para regular la desviación.
deleite Punto de deleite conductual: Si los organismos son libres para distribuir sus respuestas entre varias alternativas, lo harán de forma en que sea más
conductual cómodo para ellos. Este punto puede identificarse mediante la frecuencia relativa de ocurrencia de todas las respuestas de un organismo en una
situación sin restricciones. (gráfico pág 205)
Imposición de una contingencia instrumental: (seguimos observando el gráfico de la 205) La contingencia consiste en un programa mediante el cual
se le pide al estudiante que estudie la misma cantidad de tiempo que dedica a ver la television. (es la línea que parte del origen con un ángulo de 45º).
Una contingencia instrumental no permite volver al punto de deleite. Sin embargo el punto de deleite conductual sigue teniendo importancia ya que
proporciona la motivación para la conducta instrumental. Volver al punto conductual sigue siendo una meta en la distribución de respuestas.
Modelo de desviación minima (Staddon): La introducción de una contingencia respuesta-reforzador provoca que los organismos redistribuyan sus
conductas entre las respuestas instrumentales y contingentes de manera que se minimice la desviación total de las dos respuestas con respecto al
punto óptimo o de deleite. (es el punto negro de la línea del gráfico de la página 205)
Explicación de los efectos del reforzamiento: El efecto de reforzamiento se identifica por un incremento en la ocurrencia de una respuesta
instrumental sobre el nivel de esa conducta en ausencia de la contingencia respuesta-reforzador. Siguiendo con el ejemplo del estudiante, para
acercarse al punto de deleite conductual, el estudiante tiene que aumentar su estudio para obtener más oportunidad de ver la television. Y al
aumentar el estudio se produce el reforzamiento que es lo que buscamos.
Una vision sobre las contingencias de reforzamiento en un contexto conductual más amplio: El contexto también influye en todo esto ya que las
contingencias instrumentales no suceden en un vacío, ocurren en un contexto en el que se puden dar una variedad de respuestas y reforzadores. Si el
estudiante prefiere escuchar la radio en lugar de ver la TV, no aumentará su conducta de estudio como para conseguir su cantidad de tiempo
preferida de TV. Y ahora nos van a relacionar todo esto con la economía…
Conceptos “La economía es el estudio de la distribución de la conducta dentro de un sistema de restricciones”
económicos Economía: Las restricciones de la conducta se imponen por los ingresos de un individuo y el precio de los bienes que se quiere obtener.
y distribución de Psicología: En las situaciones de condicionamiento instrumental, las restricciones están proporcionadas por el número de respuestas que un
respuesta organismo es capaz de realizar y el número de respuestas requerido para obtener el reforzador.
Demanda del consumidor: Es fundamental la relación entre el precio de una comodidad y cuánto se obtiene, esto se denomina curva de la demanda
Elasticidad de la demanda: Grado en el cual el precio influye en el consumo. La demanda de caramelos es mu elástica, quiere decir que conforme más
suba el precio de los caramelos más descenderá su compra. (gráfico pág 209)
¿Y cómo relacionamos todo esto con el reforzamiento instrumental?: ESTABLECIENDO ANALOGÍAS.
- El número de respuestas (o tiempo dedicado a responder) es el dinero.
- El “precio” de un reforzador es el tiempo o número de respuestas requeridas para obtener (adquirir) el reforzador.
La meta es comprender cómo la conducta instrumental (gasto) está controlada por las contingencias instrumentales (precios).
Determinantes de la elasticidad de la demanda: Existen 3 factores que influyen en cómo las restricciones de un programa moldean la redistribución
de la conducta:
1. Disponibilidad de sustitutos: El grado en que los aumentos en el precio de un artículo producen una disminución en el consumo depende de la
disponibilidad (y precio) de otros bienes que puedan utilizarse en sustitución del artículo original. La disponibilidad de sustitutos aumenta la
sensibilidad del artículo original a los precios altos. Si algo aumenta de precio y yo tengo una alternativa, dejaré de comprarlo rápidamente y adquiriré
la segunda alternativa. (el café es sustituto del te ya que ambos contienen cafeina).
- Economía abierta: A los animales se les da comida fuera de las sesiones experimentales
- Economía cerrada: Los animales no reciben alimentación suplementaria.
2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en
precios altos. En un rango de precios bajos, la demanda de comida no es elástica. (no olvidemos que cuando hablamos de precio nos estamos
refiriendo al número de respuestas para obtener un reforzador).
3. Nivel de ingresos: Cuanto más salario, menos se desanimará un consumidor con los incrementos del precio. Extrapolando esto a los programas de
reforzamiento, el número de respuestas o el tiempo disponible para responder corresponde a los ingresos, por lo tanto cuantas más respuestas o
tiempo tengan disponibles los animales, menos estará su conducta influida por los aumentos en el coste del reforzador.
Problemas con las - El punto de deleite es una característica molar de la conducta. Se basa en una medida de cada respuesta acumulada a lo largo de un bloque temporal
aproximaciones amplio.
de En el ejemplo del niño que estudiaba y veía TV, el punto de deleite lo podía haber alcanzado viendo todo el tiempo la TV antes de estudiar o
regulación alternando ambas respuestas.
conductual Desde la aproximación punto de deleite conductual no importa que estrategia utilizara, sin embargo sí que es importante desde el punto de deleite
molar.
- Otro problema es que las respuestas durante un período de línea de base libre no siempre tienen el mismo valor como respuestas que ocurren como
parte de una contingencia instrumental impuesta. Es decir, debemos asumir que estudiar en ausencia de una restricción de respuesta impuesta
externamente tiene que tener el mismo valor que estudiar para obtener acceso a la TV. Sin embargo esto es incorrecto, correr por placer es diferente
que cuando se requiere por una contingencia instrumental impuesta (correr en una clase de gymnasia).
- La regulación conductual no estudia los procesos conductuales moleculares, por lo tanto no dice nada acerca de cómo los organismos defienden una
combinación preferida de bienes o actividades.
Contribuciones de 1. La regulación conductual y el principio de Premack nos alejó de la consideración de los reforzadores como tipos especiales de estímulos o como
la regulación tipos especiales de respuestas.
conductual 2. Los procedimiento de condicionamiento instrumental ya no se considera que “estampan” o “fortalecen” la conducta instrumental, en su lugar es
visto como una nueva distribución de respuestas.
3. No existe una distinción fundamental entre las respuestas instrumentales y las reforzadoras. Se distinguen únicamente por los papeles asignados a
ellas mediante un procedimiento de condicionamiento instrumental.
4. La regulación conductual y la economía conductual aceptan la idea de que los organismos responden para maximizar sus beneficios
5. La regulación conductual y la economía conductual han proporcionado caminos nuevos para describir las restricciones que imponen varios
procedimientos de condicionamiento instrumental en el repertorio de conducta de un organismo.
3. COMENTARIOS FINALES
En este apartado se realiza una comparación a nivel general entre el punto 1 y el 2 de este tema, es decir, la estructura asociativa y la regulación conductual.
Características propias de cada teoría que no comparte con la otra
Asociacionismo
- Concepto de asociación
- Exploración de los circuitos neuronales
- Nivel molecular: El objetivo son los estímulos específicos, las respuestas y sus conexiones.
- Está relacionada con procesos específicos (asociaciones E-R, E-C, R-C, etc)
Regulación conductual
- Concepto de regulación conductual (puntos de deleite y restricciones del programa)
- Poca aplicación neurológica
- Nivel molar de agregados de conducta.
- Está relacionada con metas a largo plazo
¿Cómo podemos afirmar que una respuesta instrumental está bajo el control de ciertos estímulos?
Respuesta Experimento en palomas: Reforzamiento consistente en picotear un triángulo rojo con fondo rojo. Cuando la paloma aprendió a picotear de forma
diferencial estable el triángulo con fondo rojo se separaron los estímulos (por un lado el triángulo y por otro el fondo rojo) y se midió la respuesta en cada uno de
y discriminación ellos. El resultado fue que picoteaba mucho más el fondo rojo que el triángulo. Por lo tanto decimos que el fondo rojo controla la conducta de picoteo
de estímulos mejor que el triángulo.
Otro concepto importante aquí es el de discriminación de estímulos: Un organismo muestra discriminación de estímulos si responde de forma
diferente a dos o más estímulos.
Generalización Se dice que un organismo muestra generalización de estímulos si responde de forma similar a dos o más estímulos (semejantes)
de estímulos Gradiente de generalización de estímulos: Experimento en Palomas: Picoteaban una tecla de 580nm de longitud de onda, se demostró que ante
variaciones de la longitud entre 570 y 590 seguían respondiendo de la misma forma. El intervalo donde se generalizan las respuestas (570-590) es lo
que se conoce como gradiente de generalización del estímulo.
Los gradientes de Los gradientes facilitan información acerca del grado de sensibilidad de la conducta de un organismo ante la variación de un aspecto particular del
generalización ambiente. Los investigadores pueden determinar exactamente el grado en que tiene que modificarse un estímulo para producir un cambio en la
del conducta.
estímulo como - Si un gradiente es muy plano (gráfico pág 222) quiere decir que el rasgo que se varía en la prueba de generalización no controla la conducta
medidas del instrumental.
control - Por el contrario, si el gradiente es muy acusado (gráfico 221) quiere decir que el organismo responde en mayor medida a algunos estímulos de prueba
por el estímulo que a otros.
Resumiendo: “Lo acusado del gradiente de generalización de un estímulo proporciona una medida precisa del grado de control del estímulo”. La
generalización y la respuesta diferencial son fenómenos opuestos.
Capacidad La capacidad sensorial y de orientación determinan qué estímulos se incluyen en el mundo sensorial de un organismo. Lo que esté fuera de su rango
sensorial sensorial no existe para un organismo (los seres humanos no podemos oir los ultrasonidos, sin embargo los perros sí)
y orientación
Facilidad relativa Aparte de tener la capacidad sensorial, la intensidad con que los organismos aprenden sobre un estímulo depende de la facilidad relativa de
del condicionamiento de otras claves presentes en la situación. Esto se conoce como ensombrecimiento. Ejemplo de un niño que aprende a leer viendo
condicionamiento los dibujos de un libro ignorando las frases. Luego al ir describiendo los dibujos parecerá que está leyendo cuando en realidad no es así.
de varios Cuanto más intenso sea el estímulo, más rápido se condicionará y ensombrecerá el aprendizaje del estímulo más débil.
estímulos
Tipos de Es más probable que ciertos tipos de estímulos adquieran control sobre la conducta instrumental con reforzamiento positivo que con reforzamiento
reforzamiento negativo.
Ejemplo en Palomas
- Reforzamiento positivo (comida) con tono y luz roja: Respondieron más a la luz roja
- Reforzamiento negativo (descarga) con tono y luz roja: Respondieron más al tono
Esto se puede explicar por los sistemas de conducta que se activan en cada caso. En el caso de la alimentación las claves visuales son más dominantes
(luz roja) mientras que en el caso de evitar el peligro son más importantes los tonos (el animal oye a un depredador
acercarse)
Por lo tanto, para una misma combinación de estímulos se pueden dar respuestas diferentes dependiendo del tipo de condicionamiento empleado,
debido al sistema de conducta que se activa en cada caso.
Tipos de Otro factor importante es el tipo de respuesta requerida para el refozamiento. En un experimento con perros se demostró que las respuestas que se
respuesta diferencian por la localización (levantar la para derecha/levantar la pata izquierda) es más probable que estén bajo el control de la característica
instrumental especial de las claves auditivas. Por el contrario las respuestas que se diferencian por la naturaleza (hacer/no hacer) es más probable que
lleguen a estar bajo el control de la naturaleza de la clave auditiva. páginas 226-228
A todo este fenómeno lo llamamos: efecto de la naturaleza-localización
El efecto de naturaleza-localización es un ejemplo de asociación selectiva. Hay otros ejemplos de asociación selectiva:
Claves relacionadas con el sabor – Asociadas con la enfermedad
Claves audiovisuales – Asociadas con descarga eléctrica
Elementos del Aproximación elemental del estímulo: Los distintos elementos que forman un estímulo (localización, color, sonido, etc) son tratados por el organismo
estímulo frente como rasgos distintivos y sepadados del ambiente.
a claves Aproximación de la clave configuracional: (es lo contrario a lo anterior): Los estímulos son percibidos como un todo integral y no se dividen en partes
configuracionales más pequeñas.
en los estímulos Aunque parezcan aproximaciones opuestas, se han elaborado teorías para unificarlas. Se piensa que en ciertas circunstancias predomina el control
compuestos elemental mientras que en otras condiciones predomina el control de las características configuracionales.
Lo que aprende el sujeto sobre el E+ puede influir en la respuesta al E- y viceversa, sobre todo si ambos se encuentran relacionados de alguna manera.
Discriminación intradimensional: Se produce cuando el E+ y el E- son semejantes excepto por un rasgo o atributo. La discriminación intradimensional es
una forma de ejecución experta.
Por ejemplo, si entrenamos una luz de 500 nm como E+ y una luz de 600 nm como E-, y luego presentamos 4 luces de 450, 490, 590 y 650 nm cómo
Interacciones estímulos de prueba. El máximo de respuesta no se emite ante la luz de 490 nm (que es valor más parecido al E+ original: 500 nm), sino ante un valor
entre distinto en dirección opuesta al E-, en este caso: 450 nm.
el E+ y el E-: Explicación de Spence del desplazamiento del máximo: La explicación de Spence a este fenómeno se basa en la interacción en forma de superposición
desplazamiento matemática de los valores absolutos de los E+ y E- originales. En otras palabras, Spence considera que, independientemente de los estímulos que se
del máximo presenten en la prueba de generalización, es posible calcular el valor del rasgo del estímulo hacia el que va a desplazarse el máximo de respuestas
atendiendo exclusivamente a los valores netos de los E+ y E- originales. Por ejemplo, si el E+ es una luz de 100 nm y el E- una luz de 50 nm, puede
deducirse que el máximo de respuesta se emitirá ante una luz de 150 nm, independientemente del valor que tengan en ese rasgo los estímulos de
prueba que se presenten.
Explicaciones alternativas del desplazamiento del máximo: La explicación alternativa asume que los organismos aprenden a responder a un estímulo
basándose en la relación de ese estímulo con otras claves de la situación
Entrenamiento De la misma forma que el entrenamiento en discriminación potencia la respuesta diferencial, el entrenamiento en equivalencia potencia la respuesta
de generalizada o equivalencia de estímulos.
equivalencia El emparejamiento de estímulos diferentes con la misma consecuencia crea equivalencia funcional entre esos estímulos con la consecuencia de que una
de estímulos respuesta condicionada a uno de ellos se generalizará a los otros.
Se dice que existe una clase de equivalencia si sus miembros poseen 3 propiedades matemáticas:
1) Reflexividad o igualdad (A=A, B=B, C=C)
2) Simetría (si A lleva a B, diremos que también B lleva a A)
3) Transitividad (Si A lleva a B y B lleva a C, diremos que A lleva a C)
Estímulo discreto: Aquel que se presenta durante un breve período de tiempo y tiene un comienzo y un final claros.
Sin embargo los estímulos discretos suceden en presencia de un fondo de claves contextuales que también pueden proporcionar una fuente importante de información
acerca de la conducta aprendida.
Las claves contextuales pueden llegar a controlar la conducta de varias formas.
En un experimento con codornices macho, mostraban predilección por contextos en los que previamente se les habían presentado una hembra
sexualmente receptiva. Por lo tanto las asociación de claves contextuales con el reforzamiento sexual aumentó la preferencia por estas claves.
Control por Este experimento muestra que las claves contextuales pueden llegar a controlar la conducta si sirven como señal para un EI o un reforzador.
claves Entonces…¿Sirven las claves conductuales para controlar la conducta cuando no señalan ningún reforzamiento, sino que simplemente son estímulos de
contextuales fondo?
En varios experimentos se concluyó que efectivamente las claves contextuales (sin reforzador) también pueden llegar a controlar la conducta
instrumental. Además el control contextual por el estímulo puede ocurrir sin que un contexto esté más fuertemente asociado con el reforzamiento que
otro.
Control de las Relaciones binarias: Son las relaciones entre dos eventos (un EC y un EI)
relaciones Modulador: En ciertas circunstancias la naturaleza de una relación binaria está determinada por un tercer suceso llamado modulador.
condicionales Relación condicional: Es la relación de un modulador con la relación binaria que señala.
Control condicional en el condicionamiento pavloviano: El concepto fundamental del control condicional es que un evento señala la relación entre otros
dos eventos.
Ejemplo con EC (luz naranja) y la presentación de comida (EI)
Establecer una relación condicional requiere introducir un tercer suceso (modulador) que indica cuándo la presentación de luz en la tecla terminará con
comida. Podría ser un estímulo auditivo. Los resultados muestras que los pájaros picoteaban la tecla naranja mucho más cuando se presentaba después
de la presentación del modulador que cuando se presentaba como un elemento aislado. Por lo tanto la presencia del modulador facilita la respuesta al
EC de la luz de la tecla.
Un estímulo discriminativo facilita la respuesta instrumental mientras que el modulador facilita la respuesta elicitada por el EC.
Estímulos discriminativos: Reciben este nombre los moduladores (E+ y E-) en los procedimientos de discriminación instrumental.
Otras terminologías:
(En el condicionamiento pavloviano)
Facilitación: Es otro nombre con el que se conoce al control condicional de la respuesta, debido a que el modulador facilita la respuesta al EC.
Facilitador: Otro nombre con el que se conoce al modulador.
(en el condicionamiento clásico)
Establecimiento de la ocasión: lo mismo que facilitación
Establecedor de la ocasión: lo mismo que facilitador
Distinción entre la excitación y la modulación
- La extinción es un procedimiento en el cual un estímulo previamente condicionado se presenta repetidamente pero se omite el EI. El resultado típico de
la extinción es que disminuye la respuesta condicionada.
La diferencia en los efectos de un procedimiento de extinción sobre los estímulos condicionados excitatorios y los establecedores de la ocasión está
relacionada con lo que se señala en cada uno de los procedimientos (y aquí es donde encontramos la distinción):
- Un estímulo condicionado excitatorio señala la próxima presentación del EI. La ausencia del EI después de la presentación del EC durante la extinción es
una violación de esa expectativa. Por lo tanto el valor como señal del EC tiene que reajustarse en la extinción para estar en consonancia con la nueva
realidad. Un reajuste como éste no se requiere en un procedimiento de extinción de un establecedor de la ocasión.
Por otro lado…
- Un establecedor de la ocasión señala una relación entre un EC y un EI. La ausencia del EI cuando se presenta el establecedor de la ocasión (o
modulador) por sí solo durante la extinción no significa que la relación entre el EC y el EI haya cambiado. En consecuencia la habilidad del modulador para
promover la respuesta elicitada por el EC permanece intacta durante la extinción.
Modulación frente a condicionamiento configuracional: Antes veíamos un experimento con modulador (sonido) junto a un EC (luz naranja) y un EI
(presetnación de comida). Para que el sonido sirva como una señal de que la luz de la tecla se emparejará con la comida, el sonido y la luz de la tecla
tiene que ser tratados como elementos independientes más que como una clave configuracional combinada. Por tanto, los efectos modulatorios
requieren la respuesta al compuesto estimular como constituido por elementos independientes estimulares.
Compuesto serial: Para promover que los organismos traten los compuestos estimulares como construidos por elementos independientes, los
investigadores presentan los elementos uno tras otro, en lugar de simultáneamente.
Recuperación espontánea tras el condicionamiento pavloviano: El efecto de la extinción se pierde con el tiempo. Por lo tanto la respuesta
condicionada volverá a estar presente si el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción.
Recuperación Recuperación espontánea tras el condicionamiento instrumental: En un experimento con ratas se demostró que la respuesta cuya recuperación se
espontánea comprobó tras un período de descanso posterior a la extinción (R-Descanso) se dio a una tasa mucho más alta que la respuesta cuya recuperación se
midió sin un período de descanso posterior a la extinción (R-No descanso).
Por lo tanto: La introducción de un período de descanso tras la extinción produjo una recuperación sustancial en la respuesta.
Renovación: Se refiere a la recuperación de la ejecución propia de la adquisición que se da cuando se cambian las claves contextuales que estaban
presentes durante la extinción.
En un experimento con ratas se comprobó que un miedo condicionado y posteriormente extinguido se renovava cuando se retiraba al grupo de ratas
del nuevo contexto y se volvía a introducir en el contexto original de aprendizaje.
Por lo tanto: El hecho de que el miedo condicionado se renovara, indica que la pérdida de supresión durante la fase de extinción no refleja
Renovación del desaprendizaje de la respuesta de miedo condicionado.
condicionamiento La renovación también puede darse si el sujeto se retira del contexto de adquisición a un contexto alternativo que no es el de la adquisición original.
excitatorio Sin embargo en este caso la renovación no es tan sólida como cuando se lleva al contexto original.
original Otra explicación de la renovación: propiedades excitatorias condicionadas del contexto de renovación:
1) Contexto A: Adquisición original
2) Contexto B. Extinción
3) Vuelta al contexto A que tiene propiedades excitatorias ya que es ahí donde se produjo la adquisición.
Sin embargo algunos experimentos han demostrado que esto no es así
Implicación en la terapia de conducta: Aunque un procedimiento terapeútico sea efectivo extinguiendo una fobia en la seguridad de una sala de
consulta del terapeuta, el miedo condicionado puede volver a presentarse cuando el paciente se enfrente con un EC de miedo en un contexto
diferente.
Restauración
de la ejecución Como ya hemos visto antes: La renovación reactiva una conducta aprendida previamente mediante el cambio del contexto a condiciones más
propia de aproximadas a las presentes cuando la conducta se adquirió con anterioridad.
la extinción De la misma forma que recuperamos la respuesta original, también podemos recuperar la respuesta de la extinción, (osea la “no respuesta”) Esto tiene
mucho que ver con la recuperación espontánea ya que la conducta propia de la extinción puede restaurarse (contrarrestando la recuperación
espontánea) presentando las claves que estaban presentes durante la fase de extinción.
Restablecimiento: Procedimiento que sirve para restaurar la respuesta a un estímulo condicionado extinguido.
Ejemplo con patatas fritas: Si cojo aversión a las patatas fritas porque me puse enfermo en un viaje tras comerlas, la aversión se extinguirá comiendo
patatas fritas en varias ocasiones sin caer enfermo. Sin embargo, el fenómeno del restablecimiento sugiere que si se cae enfermo otra vez por alguna
Restablecimiento razón, la aversión a las patatas fritas podría reaparecer aunque la enfermedad no tuviera nada que ver con ellas.
de la excitación Al igual que ocurría con el efecto de renovación, es importante considerar si el efecto del restablecimiento puede ser un resultado del
condicionada condicionamiento contextual. El condicionamiento contextual es un posible factor contribuyente debido a que las presentaciones del EI que se dan
durante la fase de restablecimiento pueden producir un condicionamiento de las claves contextuales de la situación experimental.
Diversos estudios han demostrado que el papel del contexto en estos casos es suprimir la ambigüedad de significado de un estímulo que tiene una
historia mezclada de condicionamiento y extinción. El contexto tiene un efecto pequeño en los estímulos que tienen una historia sólo de
condicionamiento.
En realidad se considera el restablecimiento como una forma de renovación: las claves contextuales condicionadas proporcionan algunas de las claves
contextuales para la respuesta excitatoria en circunstancias normales. Estas claves contextuales se extinguen cuando se presenta el EC por sí solo
durante la extinción.
Sensibilidad En una contingencia operante (instrumental), el procedimiento de devaluación de un reforzador consiste en asociar de forma pavloviana el estímulo
a la devaluación que se está usando para reforzar una conducta (comida, por ejemplo) con algún otro estímulo de naturaleza inversa, es decir, aversivo (cloruro de litio,
del reforzador por ejemplo). El efecto resultante es una disminución de la respuesta operante que ha sido reforzada con el reforzador devaluado aunque ésta
respuesta nunca haya sido contingente con el estímulo aversivo, ni siquiera con el reforzador tras el proceso de devaluación.
En una contingencia clásica (pavloviana, respondiente), el procedimiento es muy similar y consiste en asociar el EI (con el que se estaba
condicionando el EC) con otro EI de naturaleza inversa. De nuevo, el efecto encontrado es una disminución de la RC ante el EC, aunque el EC nunca se
haya relacionado directamente con el EI aversivo.
Lo relevante para el capítulo que nos ocupa (Extinción de la conducta condicionada) es que este efecto (el de la devaluación del reforzador) se observa
también en estímulos (en el caso del condicionamiento clásico) y respuestas (en el caso del condicionamiento operante) que han sido sometidas a
procedimientos de extinción. Es decir, que después de extinguir un EC, por ejemplo, si devaluamos el EI con el que se condicionó, la RC ante ese EC
será todavía menor que si simplemente lo hubiésemos extinguido.
Este fenómeno se usa como evidencia para defender que los procesos de extinción no eliminan las asociaciones realizadas durante el
condicionamiento. Es decir, que las asociaciones establecidas (EC-EI o R-Er) durante el aprendizaje no desaparecen durante la extinción, aunque el
sujeto no emita la RC o la R.