Apuntes Capitulo1 9 Psicologia Del Aprendizaje

lOMoARcPSD|1999571
CAPITULO 1: INTRODUCCIÓN
A) ANTECEDENTES HISTÓRICOS
Los inicios del aprendizaje tienen su raíz en la filosofía de René Descartes.
Dualismo Cartesiano: 2 tipos de conducta
1) Conducta Involuntaria: Respuestas automáticas a los estímulos externos y está mediada por un mecanismo llamado reflejo.
2) Conducta Voluntaria: No requiere de la intervención de estímulos externos sino que se debe a la voluntad consciente de actuar de una determinada forma.
Diagrama del dualismo cartesiano
Mundo fisico Órganos
(causa de la
acción inv.) sensoriales
Glandula Mente
Cerebro
Nervios Pineal
Acción (causa de la
voluntaria o Musculos acción
involuntaria voluntaria)
Innatismo: (Descartes) Nacemos con ideas innatas acerca de ciertas cosas. Es lo que se conoce como Postura nativista.
Empirismo: (John Locke) Todas las ideas de las personas eran aprendidas directa o indirectamente a través de experiencias posteriores al nacimiento.
Modelo adoptado por filósofos británicos entre XVII-XIX. A los seguidores se les conocería como Empiristas británicos.
Descartes también pensaba que la mente no operaba de forma predecible y ordenada. El Hedonismo surge como una alternativa a este pensamiento.
Hedonismo: (Thomas Hobbes) Para los hedonistas, la mente opera de forma predecible y conforme a leyes. Las personas siempre tratarán de lograr el placer
y evitar el dolor.
Concepto de asociación: Concepto importante para los empiristas británicos para explicar el funcionamiento de la mente. Las sensaciones simples se
Desarrollo combinan hasta formas ideas complejas por medio de asociaciones.
histórico Leyes de asociación
del estudio Leyes primarias: (Origen en Aristóteles) contigüidad, similitud y contraste
de - Contigüidad: La más importante en el estudio de las asociaciones. Si dos eventos ocurren juntos en el espacio o en el tiempo de forma repetida
la mente quedarán asociados.
- Similitud y contraste: Dos ideas se asocian si son similares en algún aspecto o si tienen alguna característica contraria
Leyes secundarias: (Thomas Brown 1778-1820). La formación de asociaciones entre dos sensaciones estaba influida por un número de factores, incluyendo la
intensidad de las sensaciones y la frecuencia y recencia con que las dos sensaciones ocurrían conjuntamente. Además se consideraba que la formación de
una asociación entre dos eventos dependía del número de asociaciones anteriores en las que cada uno de dichos eventos estaba involucrado, y la similitud
entre estas asociaciones pasadas y la que se forma en el presente.
Sílabas sin sentido (Hermann Ebbinghaus): Combinaciones de 3 letras (bap por ejemplo) despojadas de cualquier significado que pudiera influir en cómo se
reaccionaba entre ellas. Comprobó que la fuerza de las asociaciones mejoraba con el entrenamiento y que las sílabas que aparecían cercanas en una lista
quedaban asociadas con mayor fuerza que las que estaban distantes.
Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

lOMoARcPSD|1999571
• Descartes pensaba que los mensajes que iban de los órganos de los sentidos al cerebro y los mensajes motores que iban del cerebro a los músculos
viajaban por los mismos nervios. Descartes Pensaba que los nervios eran tubos huecos por los que se desplazaban unos gases llamados espíritus
animales…
Como es obvio, siglos posteriores a la muerte de Descartes, todas estas ideas acerca de los reflejos resultaron ser erróneas.
• Charles Bell y François Magendie demostraron que eran fibras nerviosas distintas las que se encargaban de transmitir la información sensorial desde los
Desarrollo órganos de los sentidos hasta el sistema nervioso central y otras fibras que transmitían la información motora desde el sistema nervioso central hasta los
histórico músculos.
del estudio • En 1669 John Swamerdamm mostró que la irritación mecánica de un nervio era suficiente para producir una contracción muscular
de • Posteriormente, Francis Glisson demostró que las contracciones musculares no se debían a que los músculos fueran hinchados por un gas.
los reflejos • I.M Sechenov (1829-1905) – Propuso que los estímulos no siempre elicitan respuestas reflejas de forma directa. En algunos casos un estímulo puede
liberar una respuesta que estaba inhibida y la fuerza de la respuesta no dependerá de la intensidad del estímulo. Ejemplo: Pequeñas partículas de
polvo pueden liberar un potente estornudo. Según Sechenov, la conducta voluntaria y los pensamientos están en realidad elicitados (generados) por
estímulos débiles y apenas visibles.
Sin embargo el trabajo de Sechenov tenía un fallo: No tuvo en consideración que a lo largo de la vida de un individuo, su respuesta ante un estímulo puede
variar debido a la experiencia.
• Ivan Pavlov (1849 – 1936): Demostró experimentalmente que no todos los reflejos son innatos. Mediante mecanismos asociativos se pueden establecer
nuevos reflejos para estímulos.
B) EL AMANECER DE UNA NUEVA ERA
La cognición Descartes pensaba que los humanos eran los únicos animales que poseían mente.
comparada - Darwin criticó duramente esta idea y en su libro “el origen del hombre” postuló que el hombre desciende de algún ser más primitivo, a pesar
y la de que por el momento se desconozcan los eslabones intermedios”. En opinión de Darwin, la mente humana es producto de la evolución y si
evolución de el ser humano tiene habilidades mentales como hacerse preguntas, memorizar, o razonar, el resto de animales las posee.
la - George Romanes: Definió la inteligencia a partir de la capacidad de aprender. Definición muy aceptada a finales del XIX y principios del XX.
inteligencia
Nervismo: (Pavlov) – De acuerdo con el nervismo, las principales funciones fisiológicas están controladas por el sistema nervioso.
Neurologia Años más tarde (1902) dos investigadores británicos demostraron que el páncreas estaba controlado parcialmente por factores hormonales
funcional Esto llevó a Pavlov a abandonar su investigación sobre la fisiología del sistema digestivo y centrarse en los reflejos condicionados.
Pavlov consideró los estudios de condicionamiento como un medio para obtener información sobre las funciones del sistema nervioso.
Modelos Los modelos animales permiten investigar problemas que son difíciles o imposibles de estudiar directamente en personas. Un modelo
animales de permite realizar la investigación en condiciones más sencillas, mejor controladas y más económicas. Lo más importante a la hora de construir
la conducta un modelo animal útil es identificar las similitudes relevantes entre el modelo animal y la conducta humana en cuestión.
humana Dollard y Miller fueron partidarios de una integración en la que los estudios de laboratorio realizados con animales no humanos se usaran
para aislar e identificar los fenómenos que podrían ser estudiados posteriormente con éxito en las personas.
Modelos La meta de la robótica es hacer máquinas tan inteligentes como sea posible. Los ingenieros actuales contemplan la capacidad de recordar y
animales aprender a partir de la experiencia como un rasgo importante de los sistemas artificiales inteligentes.
y robótica

lOMoARcPSD|1999571
C) DEFINICIÓN DE APRENDIZAJE
Según Domjan: “El aprendizaje es un cambio duradero en los mecanismos de conducta que implica estímulos y/o respuestas específicas y que es resultado de
la experiencia previa con esos estímulos y respuestas o con otros similares”
Distinción La definición anterior atribuye el aprendizaje a un cambio en los mecanismos de conducta, no a un cambio directo en la conducta. Esto es
entre importante ya que pueden haber cambios en la conducta que no sean consecuencia de un aprendizaje.
aprendizaje Ejecución: Se refiere a las acciones de un organismo en un momento concreto. Que hagamos (o no) algo depende de muchas cosas, como la
y ejecución motivación, capacidades sensoriales, etc, además del aprendizaje.
El Existen cambios en la conducta tan breves que no pueden ser considerados como ejemplos de aprendizaje:
aprendizaje Fatiga: El esfuerzo físico debilita gradualmente la fuerza de una respuesta.
y otras Cambio en las condiciones estimulares: Encender las luces a mitad de la película en el cine provoca una respuesta en los espectadores.
fuentes de Estado Fisiológico o motivacional del organismo: El hambre y la sed provocan respuestas que no se observan en otros momentos.
cambio Maduración: Un niño crece y alcanza una estantería a la que antes no llegaba. No se considera aprendizaje ya que es un cambio debido al
conductual paso del tiempo.
Diferentes Existen 4 tipos de causas descritos por Aristóteles:
tipos de Causa eficiente: Es la experiencia anterior con estímulos y/o respuestas específicos que produce el cambio en la conducta que señala la
mecanismos presencia del aprendizaje.
causales Causa material: Hacen referencia a los cambios físicos en el sistema nervioso que median en el aprendizaje.
Causa formal: Las causas formales son las teorías o modelos de aprendizaje. Estas terorías o modelos pueden expresarse en términos
matemáticos o computacionales.
Causa final: La causa final de un comportamiento o de cualquier proceso biológico es cómo ese proceso contribuye al éxito reproductivo del
organismo. La causa final se mide a partir del número de descendientes de un organismo.
D) ASPECTOS METODOLÓGICOS DEL ESTUDIO DEL APRENDIZAJE
Los investigadores del aprendizaje han centrado su atención en las causas eficientes,materiales y formales.
El Las causas no pueden observarse directamente. Tan sólo pueden ser inferidas a partir de los resultados de las manipulaciones experimentales.
aprendizaje Para identificar una causa se requiere la realización de una prueba en ausencia de dicha causa. Entonces podremos comparar los resultados
como obtenidos en presencia y en ausencia de la presunta causa.
ciencia La pregunta típica es si un procedimiento produce un efecto de aprendizaje en particular. Para responder a esta pregunta, hay que comparar
experimental las acciones de los individuos que previamente han sido expuestos al procedimiento en cuestión con las acciones de los individuos que no han
sido expuestos a dicho procedimiento.

lOMoARcPSD|1999571
La Elementos de la perspectiva de proceso general Implicaciones metodológicas de la perspectiva de proceso general

perspectiva Un presupuesto fundamental en la perspectiva de proceso La principal implicación metodológica es que se pueden descubrir los
de proceso general es que los fenómenos estudiados son el resultado de principios de aprendizaje estudiando cualquier especie o sistema de
general procesos más elementales. Además se supone que estos respuesta que demuestre aprendizaje. Esta implicación ha llevado a una
en el estudio procesos elementales operan de forma similar estandarización en la comunidad científica de los paradigmas
del independientemente de donde se encuentren. experimentales.
aprendizaje Los investigadores del condicionamiento y el aprendizaje se
han adherido a esta perspectiva de proceso general desde los Demostración de la generalidad de los fenómenos de aprendizaje
comienzos de esta área de estudio en psicología.
Darwin, Pavlov o C. Lloyd Morgan seguían esta perspectiva. Es importante tener en mente que la adopción de la perspectiva de proceso
Creían en la existencia de leyes universales (por ejemplo las general no prueba la generalidad de los procesos de aprendizaje. Una teoría
leyes de asociación) para todas las especies, aunque general no puede verificarse empíricamente utilizando unos pocos
también afirmaban que cada especie podía tener un ritmo paradigmas experimentales estandarizados. La generalidad del aprendizaje
diferente de aprendizaje para unas mismas leyes elementales. debe probarse realizando estudios en distintas especies y situaciones.
E) USO DE ANIMALES NO HUMANOS EN LA INVESTIGACIÓN SOBRE APRENDIZAJE.
Razones del uso Con los animales de laboratorio los científicos pueden estudiar cómo se aprenden las reacciones emocionales intensas. Sin embargo, con
de las personas, los investigadores se ven limitados a tratar de modificar las respuestas emocionales inadaptadas una vez que éstas ya han
animales no sido aprendidas. Para modificar esta respuesta tienen que comprender cómo se aprendió, y es por esta razón por la que se estudian las
humanos respuestas emocionales en los animales de laboratorio y extrapolan la conclusión a los seres humanos.
en la Ventajas de utilizar animales de laboratorio en lugar de personas
investigación - Los procesos de aprendizaje suelen ser más simples
sobre - El comportamiento de los animales no se ve complicado por procesos lingüísticos
aprendizaje - No es necesario hacer peticiones explícitas a los sujetos
- El investigador no debe preocuparse sobre si los actos de los participantes no están influidos por el deseo de complacer al investigador.
Los animales de La ética de la investigación con animales de laboratorio
laboratorio y Han surgido reglas estrictas que obligan a los laboratorios a tratar bien a los animales. Sin embargo se olvida que aunque no existan estas
la conducta reglas, los científicos siempre los tratarían bien, ya que la información extraída a partir de experimentos a animales enfermos o ansiosos
normal no es fiable.
¿Deben los seres humanos beneficiarse del uso de otros animales?
Muchos animales domésticos también se benefician de la relación con los humanos, de hecho algunos no existirían. Se trata de una
relación simbiótica.
Además el uso de animales de laboratorio representa tan sólo una pequeña parte del uso que otros humanos hacen de los animales
domésticos, incluyendo su uso como fuente de alimentación.

lOMoARcPSD|1999571
Alternativas a la investigación con animales

Russell y Burch (1959) formularon las 3 “R” de la investigación con animales.
- Reemplazamiento del uso de animales por otras técnicas de estudio
- Reducción del número de animales empleados por medio de técnicas estadísticas
- Refinamiento de los procesos experimentales para causar menos sufrimiento
Algunas de las alternativas propuestas son las siguientes:
1. Técnicas observacionales: No se puede. Los estudios de aprendizaje requieren manipulaciones experimentales de la experiencia pasada.
2. Uso de plantas: No se puede estudiar el aprendizaje ya que carecen de sistema nervioso.
3. Cultivo de tejidos: El funcionamiento de estos procesos celulares en el organismo intacto solo puede estudiarse en el organismo intacto.
4. Simulaciones informáticas: La preparación de un programa informático que simule un fenómeno natural requiere un conocimiento
profundo del fenómeno en cuestión. No pueden utilizarse para generar hechos anteriormente desconocidos sobre la conducta. Eso sólo
puede hacerse estudiando a los organismos vivos.
TÉRMINOS CLAVE
Aprendizaje: Cambio duradero en los mecanismos de conducta que implica estímulos y/o respuestas específicos y que es resultado de la experiencia previa con esos
estímulos y respuestas o con otros similares.
Asociación: Conexión entre la representación mental de dos eventos (dos estímulos o un estímulo y una respuesta) de forma que la ocurrencia de uno de los eventos
activa la representación del otro.
Dualismo: Visión de la conducta según la cual las acciones pueden dividirse en dos categorías: conducta voluntaria controlada por la mente y conducta involuntaria
controlada por mecanismos reflejos.
Ejecución: Actividades de un organismo en un momento particular.
Empirismo: Corriente filosófica según la cual todas las ideas de la mente tienen su origen en la experiencia.
Fatiga: Disminución temporal de la conducta provocada por el uso excesivo o repetido de los músculos involucrados en ella.
Hedonismo: Postura filosófica propuesta por Hobbes según la cual las acciones de un organismo están enteramente determinadas por la persecución del placer y la
evitación del dolor.
Maduración: Cambio en la conducta causado por el desarrollo físico o fisiológico del organismo en ausencia de experiencia con eventos particulares del ambiente.
Innatismo: Postura filosófica según la cual los seres humanos nacen con ideas innatas.
Nervismo: Postura filosófica adoptada por Pavlov según la cual todos los procesos conductuales y fisiológicos están regulados por el sistema nervioso.
Reflejo: Mecanismo que permite que un evento específico del ambiente elicite una respuesta específica.
Sílaba sin sentido: Combinación de 3 letras ( dos consonantes separadas por una vocal) sin significado.

lOMoARcPSD|1999571
CAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN
LA NATURALEZA DE LA CONDUCTA ELICITADA
El concepto Un reflejo se compone de dos elementos: un estímulo elicitante y su correspondiente

de reflejo Respuesta. En los vertebrados los reflejos simples están mediados por 3 neuronas:
Neurona sensorial (aferente): capta el estimulo ambiental y transmite el mensaje a la medula espinal.
Neurona motora (eferente): Activa el músculo involucrado en la respuesta refleja.
Interneurona: Neurona encargada de transmitir los impulsos entre los dos tipos de neuronas anteriores.
Arco reflejo: Es el conjunto formado por la neurona sensorial, la interneurona y la neurona motora. En los vertebrados, el arco reflejo representa
el numero mínimo de conexiones neuronales necesarias para que tenga lugar el acto reflejo.
La mayor parte de los reflejos contribuyen al bienestar del organismo.
Pautas de Las pautas de acción modal (PAMs) son respuestas típicas de especies particulares. Una de las características de las PAMs es que el umbral de
Acción estimulación necesario para que éstas se pongan en marcha varía en función de las circunstancias. El estímulo puede tener efectos diversos
modal dependiendo del estado fisiológico del animal y de las acciones que haya realizado recientemente. Un pez espinoso no mostrará su respuesta
sexual hasta que la hembra no haya terminado de construir el nido.
Estímulos Como ejemplo hablaremos de la alimentación de la gaviota. Las crias picotean un punto rojo en el pico de su progenitor, lo cual hace que
elicitantes regurgite la comida para ellos. Ahora bien, qué es lo que provoca que las crias hagan este picoteo. Para hallar la solución a este problema
de las pautas hicieron experimentos y concluyeron que un objeto alargado (en forma de pico) apuntando hacia abajo y con un punto rojo, era lo que más
de acción modal elicitaba la conducta de los polluelos. Los rasgos específicos que se requieren para elicitar la conducta de picoteo reciben colectivamente el
nombre de estimulo señal o estimulo desencadenante.
Una determinada pauta de acción puede estar controlada por varios rasgos del estímulo de forma aditiva. Además el estímulo que elicita con
mayor
efectividad la pauta de acción no tiene porqué ser el que ocurra con mayor probabilidad en condiciones naturales.
Estimulos supranormales: Son estímulos inusualmente efectivos. Aquí volvieron a estudiar a las gaviotas, en concreto cuales eran los huevos que
más protegían. Huevos verdes, grandes y moteados eran sus preferidos. Entonces los científicos crearon un super huevo verde artificial y lleno de
motas que era mucho más efectivo que el natural a la hora de elicitar la respuesta de acción.
La organización Toda conducta dirigida a metas involucra secuencias de acciones sistemáticamente organizadas.
secuencial de la Los etólogos denominaron conducta apetitiva a los primeros componentes de la secuencia del comportamiento y conducta consumatoria a los
conducta ultimos. Las conductas apetitivas son menos estereotipadas y dependen del entorno(una ardilla puede buscar comida de muchas formas, puede
subir desde un arbol o saltar desde otro cercano) sin embargo las conductas consumatorias son especificas de cada especie y mucho más
estereotipadas (roer, masticar, tragar).
Secuencia de respuestas de búsqueda de comida con el ejemplo de la ardilla.
Modo de búsqueda general: Antes de que la ardilla pueda identificar un nogal se moverá buscando posibles fuentes de alimentación.
Modo de búsqueda focalizada: Al encontrar un nogal pasará al modo focalizado en el que sólo buscará nueces en ese árbol.
Modo de manipulación de alimento (o consumatorio): Obtener la nuez y masticarla.

lOMoARcPSD|1999571
EFECTOS DE LA ESTIMULACIÓN REPETIDA
La conducta elicitada puede variar como resultado únicamente de la presentación repetida del estímulo elicitante.
Atención visual en Conclusión: La atención visual provocada por un estímulo novedoso cambia a medida que el bebé se familiariza con el estímulo.
los bebes
humanos
Salivación y Conclusión: Los resultados indican que las personas encuentran el sabor de una comida específica menos placentera cuanto más la comen.
evaluación del
sabor en humanos
Respuesta de Conclusión: Las repeticiones de los sustos generaban cada vez respuestas más débiles de sobresalto por parte de las ratas. Por el contrario cuando el
sobresalto sonido era más intenso, las repeticiones de tono provocaron reacciones de sobresalto cada vez más vigorosas.
en ratas
LOS CONCEPTOS DE HABITUACIÓN Y SENSIBILIZACIÓN
Efecto de habituación: Disminución de la tendencia a responder producido por la estimulación repetida.

Efecto de sensibilización: Incremento en la tendencia a responder producido por la estimulación repetida.
Diferencias entre La habituación no es el único efecto que da lugar a una disminución en la respuesta.
habituación, Puede no darse una respuesta si por alguna razón los órganos sensoriales pierden temporalmente sensibilidad a la estimulación. Una persona
adaptación sensorial puede quedar temporalmente cegada por una luz brillante (adaptación sensorial) y una respuesta tampoco tendrá lugar si los músculos
y fatiga involucrados quedan incapacitados por la fatiga.
- La adaptación sensorial ocurre en los órganos sensoriales
- La fatiga de la respuesta tiene lugar en los músculos efectores
- La habituación y sensibilización tienen lugar en el sistema nervioso
¿Cómo distinguimos todo esto?
- La habituación se distingue de la adaptación sensorial en que la habituación es específica de la respuesta. levantamos la vista por un momento
pero
- La habituación se distingue de la fatiga en que la habituación es específica del estímulo.
Teoría del proceso Presupone que los incrementos y disminuciones en la tendencia a responder a un estímulo son producto de procesos neurales diferentes.
dual de habituación y El proceso de habituación provoca una disminución en la tendencia a responder
sensibilización El proceso de sensibilización produce un incremento en la tendencia a responder.
(Groves y Thompson) Sin embargo ambos procesos están relacionados y pueden estar activos al mismo tiempo ante un mismo estímulo.
Un aumento (sensibilización) o disminución (habituación) de la respuesta, viene dado por la suma resultado de los procesos de sensibilización y
habituación juntos.
Groves y Thomson sugirieron que los procesos de habitación y sensibilización tienen lugar en diferentes partes del sistema nervioso:
- Proceso de habituación: tiene lugar en el sistema E-R (estimulo respuesta)
- Proceso de sensibilización: tiene lugar en el sistema de estado. Este sistema abarca otras partes del sistema nervioso que determinan el nivel
general de disposición a responder.

lOMoARcPSD|1999571
Implicaciones de la teoría del proceso dual

- El sistema E-R se activa siempre que un estímulo elicita una respuesta ya que es el circuito neuronal que lleva los impulsos desde la entrada
sensorial hasta la salida conductual.
- El sistema de estado sólo interviene en circunstancias especiales. Algunos eventos externos (como un ruido intenso) pueden incrementar el
estado de alerta del individuo y sensibilizar el sistema de estado.
La teoría del proceso dual de habituación y sensibilización ha tenido una gran influencia en el estudio de la plasticidad de la conducta elicitada.
CARACTERÍSTICAS DE LA HABITUACIÓN Y SENSIBILIZACIÓN
1. Curso temporal Curso temporal de sensibilización Curso temporal de la habituación

Por lo general los procesos de sensibilización tienen efectos temporales. 2 tipos de efectos de habituación cualitativamente distintos:
En todos los sistemas de respuesta la duración de los efectos de - La habituación a corto plazo (desaparece en segundos o
sensibilización está determinada por la intensidad del estimulo. minutos). Tiene lugar
Los estímulos más intensos producen mayoresincrementos de la cuando el estímulo elicitante se presenta frecuentemente.
tendencia a responder y una sensibilización más persistente. - La habituación a largo plazo (persiste durante muchos días).
Se da cuando las presentaciones del estímulo están más
separadas.
Aquí es importante quedarnos con el concepto de:
Recuperación instantánea: Recuperación de una respuesta
habituada o de una respuesta extinguida tras un periodo de
descanso. Es la característica principal del efecto de
habituación a corto plazo.
2. Especificidad Especificidad del estimulo en la habituación Especificidad del estimulo de sensibilización
del estímulo La habituación es específica del estímulo que ha sido presentado repetidamente. Una La sensibilización no es muy específica del estímulo.
respuesta a un estímulo previamente habituada puede puede manifestarse
plenamente alterando alguna característica importante del estímulo. (si nos
acostumbramos al sonido de un reloj que tengamos por casa poco a poco dejamos de
oirlo, pero si de repente notamos que se rompe y hace un ruido diferente es
probable que volvamos a prestar atención.)
Generalización del estímulo de habituación: Seguimos con el ejemplo del reloj. Si
nos habituamos a su sonido y nos presentan otro reloj diferente pero con un sonido
similar, es posible que tampoco lo oigamos.
3. Efecto de un Deshabituación: Una respuesta habituada puede restablecerse sensibilizando al organismo con la exposición a un estímulo externo. Es importante
estímulo intenso tener en cuenta que la deshabituación hace referencia a la recuperación de la respuesta al estímulo previamente habituado.

lOMoARcPSD|1999571
APLICACIÓN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA
Reacciones Solomon y Corbit destacaron que las reacciones emocionales intensas a menudo constan de dos fases. Una emoción tiene lugar durante la presentación
emocionales del estímulo elicitante y la opuesta se observa cuando el estímulo desaparece. (efecto sedante, relajante y agradable del alcohol al principio, en
y sus efectos contraposición al dolor de cabeza y nausea de la resaca).
posteriores Otra característica de las reacciones emocionales es que cambian con la experiencia.
La reacción primaria se hace más débil y su pos efecto se hace más fuerte
Tolerancia a la droga: Habituación de la primera reacción a la droga
También podemos encontrar esta misma analogía de dos procesos en el amor y el apego. Las parejas con el tiempo dejan de darse los signos de amor
del principio e incluso dejan de sentir ese enamoramiento principal, debido a la habituación. Sin embargo cuanto más tiempo lleve una pareja junta,
más difícil será la pérdida de uno de ellos para el otro.
La teoría del Esta teoría se diseñó para explicar los 3 rasgos característicos de las emociones
proceso 1. Las reacciones emocionales son bifásicas; a una reacción primaria sigue un postefecto opuesto.
oponente 2. La reacción primaria de debilita con la estimulación repetida.
3. El debilitamiento de la reacción primaria va acompañado de un fortalecimiento del postefecto.
La teoría asume que los mecanismos neurofisiológicos involucrados en la conducta emocional tratan de mantener la estabilidad emocional. Por esta
razón decimos que es una teoría homeostática. Asume que un estímulo emocional activador desvía de la neutralidad el estado emocional de una
persona. Se asume que este desplazamiento con respecto a la neutralidad emocional pone en marcha un proceso oponente (contrario) que compensa
el cambio. Encontramos dos tipos de procesos:
Proceso primario o proceso a: Es el responsable de la naturaleza del estado emocional que tiene lugar en presencia del estímulo (la alegría).
Proceso oponente o proceso b: Es el que genera la reacción emocional opuesta (por ejemplo tristeza).
El proceso oponente es ligeramente ineficiente ya que no logra contrarrestar del todo al proceso primario. Sin embargo con la repetición logramos
una sensibilización de este proceso y por lo tanto un mayor efecto.
Ver gráficos de la página 54 y 55.
Mecanismos oponentes durante la exposición inicial al estímulo
En la primera presentación del estímulo el proceso b no es lo suficientemente fuerte para compensar por completo la respuesta emocional primaria,
que persiste mientras esté presente el estímulo elicitante. Cuando el estímulo se retira, el proceso a se detiene rápidamente pero el proceso b
permanece por algún tiempo y se hace evidente por primera vez.
Mecanismos oponentes tras la exposición prolongada al estímulo
El proceso b se fortalece con la exposición prolongada al estímulo, por el contrario se asume que el proceso a permanece inalterado. Por tanto, tras la
presentación repetida de un estímulo, la respuesta emocional primaria queda compensada de forma más efectiva por el proceso oponente.
Motivación y postefecto oponente
Si los consumidores habituales de drogas cada vez notan menos placer al consumirlas ¿porqué se hacen adictos? La teoría del proceso oponente
sugiere que la adicción a las drogas es un intento de reducir la aversión producida por el postefecto afectivo de las drogas (bajón, irritabilidad,
malestar). Hay dos formas de reducir el postefecto, una es simplemente esperar a que pase el efecto oponente (pasar el mono) la otra forma de pasarlo
es volver a consumir la droga. Este mecanismo es lo que hace que la gente se haga adicta, no por el placer directo que obtienen de la droga, sino para
reducir los efectos de retirada.

lOMoARcPSD|1999571

lOMoARcPSD|1999571
CAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS
LOS PRIMEROS AÑOS DEL CONDICIONAMIENTO CLÁSICO
Los descubrimientos de Fueron los primeros en estudiar el condicionamiento clásico en el laboratorio de Pavlov.
Vul´fson y Snarskii Siguieron experimentando con los perros y su salivación.
Estímulos orofaringeos: Algunas sustancias provocan en la boca sensaciones de textura y sabor características. Estas sensaciones reciben el
nombre de estímulos orofaringeos.
Los perros salivaban cuando se les ponía arena en la boca, posteriormente la sola visión de la arena les hacía salivar. Este tipo de aprendizaje
se denomina aprendizaje de objeto ya que requiere asociar diferentes características de un mismo objeto.
El paradigma de El procedimiento de Pavlov constaba de dos estímulos:
condicionamiento clásico -Luz que no provoca salivación al principio del experimento. Se trata del estímulo condicional ya que su efectividad depende de su
emparejamiento con el ácido. Provoca una respuesta condicional
-Solución ácida situada en la boca. Se trata del estímulo incondicional ya que no depende de nada para producir saliva. Provoca una
respuesta incondicional.
Condicionamiento Watson y Rainer. Condicionaron la respuesta de miedo a un niño de 9 meses ante la presentación de una rata blanca. Más tarde comenzaron a utilizar
del miedo ratas y descargas eléctricas en las patas como estímulo incondicional aversivo.
Ante una descarga eléctrica la rata se paraliza por el miedo. Sin embargo para medir la respuesta de miedo utilizaban la técnica REC (respuesta
emocional condicionada).
1. Se enseña a las ratas a presionar una palanca para obtener comida
2. Se muestra un EC (estimulo condicionado) que puede ser una luz o un pitido seguido de una descarga eléctrica.
3. La rata se paraliza y no puede acceder a la palanca.
4. Finalmente la sola presencia del EC (sin la descarga) hace que la rata se paralice.
Para ponerle números a todo esto se calcula algo llamado “Razón de supresión”
Razón de supresión = Respuestas durante EC/ (Respuestas durante EC + Respuestas durante Pre – EC)
Cuanto menor es la razón de supresión, menor es la respuesta del animal. Entendiendo por razón de supresión = 0 una
parálisis total de su respuesta.
Aparte del experimento de la palanca también utilizaban la supresión condicionada del lameteo en el cual ratas sedientas bebían de un tubo que
desprendía agua y mediante el EC se paralizaban y no bebían.
Condicionamiento Conocido como reflejo palpebral.
del parpadeo 1. Presentación de un estímulo condicionado – Tono
2. Soplo de aire a los ojos – estímulo incondicionado – Se produce el parpadeo.
3. El sujeto aprende a parpadear ante la sola presencia del estímulo condicionado
Conclusiones:
a) Para que se produzca condicionamiento clásico debe haber emparejamiento entre EC y EI.
b) b) El aprendizaje inicial puede no ser directamente observable.

lOMoARcPSD|1999571
Recuadro 3.2 El Cuando un organismo aprende algo, la red de neuronas que almacena esta nueva información se llama engrama.¿Dónde se encuentra el engrama?
condicionamiento La búsqueda del engrama comenzó por el hipocampo. Sin embargo comprobaron en animales que si les extirpaban el hipocampo la capacidad de
palpebral y la aprendizaje condicionado no se alteraba.
búsqueda del Entonces concluyeron que el engrama se encontraba en el cerebelo … (leer página 68)
engrama Estímulo incondicionado – La señal llega al cerebelo a través de fibras trepadoras
Estímulo condicionado – La señal llega al cerebelo a través de fibras musgosas
Seguimiento del Los animales se aproximan a estímulos que señalan la disponibilidad de alimento.
signo ¿Cómo comprobaban el seguimiento del signo en el laboratorio?
Con Palomas dentro de una caja. Había una tecla (EC) que se iluminaba durante 8 segundos y a continuación se administraba comida (EI) en un
pequeño comedero (no era necesario pulsar la tecla para administrar comida).Con las repeticiones, cada vez que la tecla se encendía, las palomas
picoteaban la tecla.
Este y otros experimentos demuestran que tenían una atracción irresistible a las señales de comida condicionadas clásicamente, es decir, a la tecla
(EC).
Aprendizaje de La aversión a un sabor puede aprenderse si la ingestión de un sabor nuevo va seguida de enfermedad o de otras circunstancias negativas. Por el
aversión al sabor contrario la preferencia por un sabor va acompañada de sensaciones de saciedad u otras circunstancias positivas.
En el caso de aversión a un sabor por haber enfermado, lo curioso es que el 20% de los casos las personas estaban seguras que su enfermedad no
tenía que ver con la comida, y sin embargo le cogieron aversión. Esto demuestra que el aprendizaje de aversión al sabor es independiente de los
procesos racionales.
Características de la aversión al sabor
- Un único emparejamiento entre EC y EI puede provocar la aversión (eso también puede suceder con el aprendizaje del miedo). Sin embargo se
necesitan más emparejamientos en el condicionamiento palpebral, el condicionamiento salival o el seguimiento del signo.
- Se produce aversión aunque la enfermedad se presente horas después de haber comido. Es lo que se conoce como “Aprendizaje demorado”.
Procedimientos Intervalo entre ensayos: Tiempo entre el final de un ensayo de condicionamiento y el inicio del siguiente.
típicos Intervalo entre estímulos: Tiempo entre el EC y el IE.
de Para que haya respuesta de condicionamiento, el intervalo entre estímulos debe ser mucho menor que el intervalo entre ensayos.
condicionamiento 5 procedimientos comunes de condicionamiento clásico (mirar el gráfico de la página 75)
pavloviano 1. Condicionamiento de demora corta: Se presenta el EC y al poco tiempo y sin que haya finalizado, se presenta el EI.
2. Condicionamiento de huella: Se presenta el EC y cuando ha acabado se presenta el EI. Al intervalo entre ambos se le llama intervalo de huella.
3. Condicionamiento de demora larga: Como el de demora corta pero el EC dura mucho más tiempo. Entonces se presenta el EI antes de que EC
acabe.
4. Condicionamiento simultáneo: EC y EI se presentan a la vez.
5. Condicionamiento hacia atrás: Al revés que todos los anteriores. Se presenta el EI y luego el EC
Medida de las Ensayo de prueba: Ensayo en el que se presenta el EC sin el EI. Esto permite medir la respuesta condicionada en ausencia de la respuesta
respuestas incondicionada. Son fundamentales para evaluar el aprendizaje en el condicionamiento simultáneo y hacia atrás.
condicionadas Magnitud: Cantidad de conducta que tiene lugar
Fuerza de la respuesta: Se mide por la frecuencia con la que el EC provoca una respuesta condicionada.
Probabilidad :cómo de probable es que el EC de una respuesta condicionada
Latencia: Cantidad de tiempo que pasa entre el principio del EC y la aparición de la respuesta condicionada.

lOMoARcPSD|1999571
Procedimientos Pseudocondicionamiento: Casos en los que la mera exposición al EI da lugar a respuestas similares a la respuesta condicionada
de control en el Para saber si se trata de un pseudocondicionamiento o realmente un condicionamiento clásico (asociación entre EC y EI) son necesarios los
condicionamiento procedimientos de control.
clásico Control aleatorio: Procedimiento en el que los estímulos condicionado e incondicionado se presentan en momento aleatorios uno con respecto a
otro. Sin embargo este tipo de control puede dar lugar a aprendizaje asociativo.
Control desemparejado explícito: EC y EI se presentan lo suficientemente separados para evitar que se asocien.
Eficacia de los
Trataban de averiguar cual de los 5 procedimientos de condicionamiento vistos en la hoja anterior daba más muestras de aprendizaje. Para ello lo
procedimientos
primero que hay que tener en cuenta es el intervalo entre estímulos o intervalo EC-EI.
típicos de - Simultaneo: Poco condicionamiento en el condicionamiento simultaneo en los que el intervalo EC-EI es 0.
condicionamiento
- Demora corta: facilita la respuesta condicionada
- Demora larga: Disminuye la respuesta condicionada
- De huella: Se genera un intervalo de huella. Al igual que en demora larga, cuanto más separados están EC y EI, se produce menos condicionamiento.
- Hacia atrás: Ofrece resultados ambiguos. Se ha observado condicionamiento excitatorio o inhibitorio.
2 ideas que debemos recordar a modo de conclusión:
- El condicionamiento es más efectivo cuando el EC es una buena señal de que el EI aparecerá pronto.
- Se produce mejor condicionamiento cuando el intervalo EC-EI es corto.
Hipótesis de codificación temporal: El sujeto no sólo aprende a relacionar EC y EI, sino que dependiendo del procedimiento utilizado (de los 5 que
hemos visto) también aprenderá cúando en el tiempo va a ocurrir EI.
CONDICIONAMIENTO PAVLOVIANO INHIBITORIO
Este tipo de condicionamiento pretende predecir la ausencia del estímulo incondicionado.

Estímulos condicionados inhibitorios: Señales que predicen la ausencia de un estímulo aversivo
Procedimientos de Para que se dé el condicionamiento inhibitorio hay un requisito importante: el EI debe ocurrir periódicamente en la situación.
condicionamiento Procedimiento estándar de inhibición condicionada (gráfico pág 82)
inhibitorio Este procedimiento consta de dos ensayos diferentes que se intercalan.
Ensayo A (condicionamiento excitatorio)
- Tenemos un EC+ y un EI. El Estímulo incondicionado ocurre inmediatamente después del estímulo condicionado y de esta manera quedan
asociados.
Ensayo B (condicionamiento inhibitorio)
- A diferencia del ensayo A, aquí no se presenta el EI. Tan sólo tenemos un EC+ y un EC- que se presentará en el contexto excitatorio proporcionado
por el EC+. Pero no se empareja con el EI. Por lo tanto decimos que el EC- es un inhibidor condicionado.
Contingencia o correlación negativa entre el EC y el EI (gráfico pág 83)
Una contingencia o correlación negativa indica que el EI es menos probable tras el EC que en otro momento. En el gráfico podemos observar que la
presencia de EC predice la ausencia del EI durante un tiempo.
En este tipo de procedimiento, el EI aversivo puede aparecer de vez en cuando tras el EC, pero con una probabilidad pequeña.

lOMoARcPSD|1999571
La inhibición condicionada produce cambios en la conducta observable, pero ¿Cómo podemos observar estos cambios?
Medición de la Hay 3 métodos
inhibición A) Sistemas de respuestas bidireccionales
condicionada Se puede medir fácilmente en aquellos sistemas que tengan una línea base. En estos casos la excitación condicionada da lugar a un cambio
conductual en una dirección y la inhibición condicionada da lugar a un cambio en la dirección opuesta.
Limitaciones
- Sólo funciona con respuestas que pueden ir en direcciones opuestas.
- Sólo muestra el efecto neto (resultado) entre la excitación y la inhibición.
B) La prueba del estímulo compuesto o sumación
La prueba de sumación implica la presentación de dos estímulos, un EC+ y un EC- juntos.
La idea es que cada estímulo produce su propia reacción asociativa (excitación e inhibición) y que cada reacción se suma de forma algebraica. Puesto
que son procesos antagónicos, la asociación inhibitoria suprime la excitatoria. Este efecto se cuantifica midiendo la fuerza del estímulo condicionado
excitatorio (EC+) sin emparejar, evaluándolo de nuevo en combinación con el estímulo condicionado inhibitorio (EC-), y calculando después la
diferencia. Si un EC- carece de fuerza inhibitoria, se observa toda la fuerza de la reacción excitatoria en ambos casos. Sin embargo, si el estímulo
condicionado inhibitorio es fuerte (produce RC inhibitoria), se observa una disminución del nivel de excitación del EC+ al presentar los estímulos
simultáneamente
C) La prueba del retraso en la adquisición
Si un estímulo inhibe de forma activa una respuesta particular, entonces debería ser especialmente difícil de condicionar ese estímulo para que
provoque la conducta. Es decir, la velocidad de adquisición de una respuesta excitatoria debería disminuir si el EC es un inhibidor condicionado.
PREDOMINIO DEL CONDICIONAMIENTO CLÁSICO
Aparece con mayor probabilidad cuando un evento predice a otro regularmente y con una demora corta entre el EC y el EI.
Algunos ámbitos de la vida en los que se desarrolla el condicionamiento de Pavlov:
- Aversiones y preferencias alimenticias
- Adquisición de miedos.
- Tolerancia y adicción a las drogas
- Respuestas de los niños y de las madres durante la lactancia
- Situaciones sexuales

lOMoARcPSD|1999571
CAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS
¿A QUÉ DEBEN SU EFICACIA LOS ESTÍMULOS CONDICIONADOS E INCONDICIONADOS?
Pavlov: El EC inicialmente no provoca la respuesta condicionada pero adquiere la capacidad de hacerlo como resultado del desarrollo de una
Respuestas asociación con el EI.
iniciales Sin embargo la identificación de EC y EI es relativa ya que un evento puede servir de EC respecto a un estímulo y de EI respecto a otro. En
a los estímulos experimentos con ratas la sacarina es un EC si posteriormente se inyecta una droga que produce malestar (EI), entonces las ratas aprenden a no tomar
la sacarina. Sin embargo en un experimento en el que se proyecta una luz (EC) justo antes de suministrar sacarina (EI) las ratas aprenden a acercarse a
la luz cada vez que aparezca.
Cuando los estímulos son novedosos, el aprendizaje se desarrolla más rápido.
A la hora de experimentar sobre la novedad o familiaridad de los estímulos, se realiza en dos fases:
a) Se expone repetidamente a los sujetos al estímulo que luego será EC.
b) EC se empareja con un EI
Sin embargo se observa que la familiaridad que el sujeto tiene con EC (ya que se le ha repetido muchas veces en la fase a) hace que el
emparejamiento con el estímulo incondicionado sea más lento. Este fenómeno se denomina efecto de preexposición al EC o efecto de Inhibición
latente.
• La Habituación sirve para sesgar la conducta elicitada a favor de los estímulos novedosos.
La novedad de • La Inhibición latente sirve para sesgar el aprendizaje a favor de los estímulos novedosos.
los estímulos Es la habilidad de inconscientemente ignorar los estímulos que son percibidos como irrelevantes para lo que uno necesita.
condicionados Si el experimento lo hacemos con un EI, el resultado es el mismo. Quien estaba familiarizado con el estímulo incondicionado tardará más en
e incondicionados relacionarlo con el EC. Esto recibe el nombre de Efecto de preexposición al EI.
2 Mecanismos para explicar los dos efectos de preexposición
• Interferencia asociativa: Las preexposiciones a EC o EI disminuyen la capacidad de estos estímulos para participar en nuevas asociaciones.
• Interferencia de memoria: Los participantes recuerdan que en la fase “a” el estímulo se les presentada aislado y este recuerdo altera la
respuesta condicionada.
Intensidad y La intesidad de los estímulos es una variable importante que recibe el nombre de saliencia del estímulo. El aprendizaje se llevará a cabo de manera
saliencia del más rápida cuanto mayor sea la saliencia del estímulo. Ratas con deficit nutricional de sal prestan más atención al sabor de la sal (aquí se ha
EC y del EI aumentado la saliencia del estímulo en relación a las necesidades biológicas del organismo).
La relevancia es el grado en el que el EC es relevante con respecto al EI. En un ambiente natural, es normal que las ratas enfermen tras tomar un
alimento en mal estado. También es normal que sufran algún daño tras ser perseguidas por un animal al que pueden oir.
Ambas hipótesis son trasladadas al laboratorio donde se ponen en práctica para demostrar la relevancia
Hipótesis 1: Daño por animal al que pueden oir
Relevancia o Experimento
pertinencia A- Ratas lamiendo agua salada + luz que acompaña al lameteo = descarga eléctrica
EC – EI Luego se repetía el proceso pero cada estímulo por separado:
B- Ratas lamiendo agua salada + ausencia de luz = descarga eléctrica
C- Ratas lamiendo agua sin sabor + luz que acompaña al lameteo= descarga eléctrica

lOMoARcPSD|1999571
La medición del aprendizaje se hacía midiendo la supresión de volver a beber.

Conclusión: Demostraban mayor supresión con el estímulo audiovisual.
Hipótesis 2: Enfermar tras tomar un alimento en mal estado

Lo mismo que antes pero en lugar de la descarga eléctrica se las hacía enfermar con drogas. La conclusión es que haciéndolo de esta manera
demostraban mayor supresión al estímulo gustativo.
Todo esto de la relevancia tiene mucho que ver con la naturaleza y con la predisposición genética.
El concepto de La fuerza biológica es la fuerza que tiene cada estímulo (EC y EI) ante nosotros por naturaleza. Pavlov sugirió que para que un estímulo se
fuerza biológica condicionara debía tener una fuerza biológica menor que el estímulo incondicionado.
Condicionamiento de orden superior
Situación:
a) Un tono se empareja fuertemente con la comida.
b) La sola presencia del tono produce salivación. (condicionamiento de 1er orden)
c) Empezamos a emparejar el tono (que produce salivación) con una luz
d) Al final la sola presencia de la luz producirá salivación (condicionamiento de 2º orden)
Recuadro 4.2 Los miedos irracionales suelen desarrollarse por medio del condicionamiento de orden superior. Se explica el ejemplo de una mujer con miedo a las
Condicionamiento multitudes cuyo miedo se extendió a otros estímulos en principio inocuos, como ir al cine.
de orden superior Contracondicionamiento
del miedo Dos estímulos pueden quedar asociados el uno con el otro aunque ambos eliciten inicialmente respuestas intensas. La respuesta que un animal da a
un EC se invierte o contrarresta emparejando ese estímulo con un EI que provoca una reacción opuesta.
Precondicionamiento sensorial
Se pueden aprender asociaciones entre estímulos que tan sólo elicitan una breve respuesta de orientación antes del condicionamiento. Si asociamos
los sabores de canela y vainilla como algo que siempre va junto en los helados, y de repente nos sienta mal la canela, también rechazaremos la
vainilla.
¿QUÉ DETERMINA LA NATURALEZA DE LA RESPUESTA CONDICIONADA?
Pavlov: Un EC adquiere la capacidad de funcionar de forma similar a como el EI lo hacía previamente. El EC activa los circuitos neuronales que
previamente sólo activaba el EI. El EC se convierte en un sustituto del EI.
- EI EI como factor determinante de la RC
La forma de la respuesta condicionada va a tener algo de relación con que tipo de EI haya.
El modelo de Ejemplo en Palomas
sustitución Las Palomas abren el pico más cuando van a comer grano que cuando van a beber.
del estímulo EI = Grano EC= Tecla que se ilumina antes de dar agua o grano
EI = Agua RC= Respuesta de picoteo a la tecla
2 grupos de Palomas, uno con agua y otro con grano. Se demostró que el grupo que había relacionado el grano con la tecla, picoteaba la tecla con el
pico más abierto que el grupo que había relacionado la tecla con el agua. Por lo tanto dependiendo del EI (agua o grano) tendremos una RC
(picoteo grande o succión) al EC (tecla) diferente.

lOMoARcPSD|1999571
La homeostasis se refiere a los mecanismos fisiológicos que mantiene los aspectos críticos del cuerpo dentro de los límites aceptables. Cualquier
amenaza a nivel homeostático pone en marcha una reacción compensatoria que neutraliza la alteración. Esta reacción funciona por procesos de
retroalimentación negativa (Walter Cannon). La exposición al frío produce escalofríos para incrementar la temperatura del cuerpo.
Dworkin señaló que las alteraciones en la homeostasis pueden compensarse más efectivamente si pueden anticiparse.
Esto recibe el nombre de respuesta homeostática condicionada.
Las drogas suelen provocar alteraciones fisiológicas de la homeostasis que activan reacciones compensatorias condicionadas. Las claves que se asocian
a esta alteración pueden elicitar estas reacciones compensatorias como respuestas condicionadas anticipatorias.
A) Proceso normal=Drogas - Alteración homeostasis – reacciones compensatorias condicionadas
B) Proceso en el que pienso en la droga pero no la tomo = Claves de droga (drogas-alteración homeostasis) – reacciones compensatorias
Aprendizaje y condicionadas – respuestas condicionadas anticipatorias.
homeostasis: El modelo de condicionamiento de tolerancia a las drogas
Un caso especial Siempre se ha considerado que la tolerancia a las drogas se debía a procesos farmacológicos, sin embargo Shepard Siegel encuentra otra explicación
de basada en el condicionamiento clásico… La explicación se basa en el concepto de homeostasis aprendida.
sustitución del Tomamos droga y se producen unos cambios fisiológicos en nuestro organismo (son el EI).
estímulo Entonces se ponen en marcha unos ajustes para compensar esos cambios, son la respuesta incondicionada (RI). Entonces…
Mediante el condicionamiento pavloviano o clásico, los estímulos que acompañan a la administración de droga se asocian con el EI. Estos estímulos
condicionados pueden ser la hora del día, o el lugar donde se consume droga habitualmente. Por lo tanto
- Droga provoca EI
- EI provoca RI
- EI siempre va con EC (lugar y hora)
-EC provoca RI (es decir, el lugar y la hora provocan mi respuesta fisiológica para compensar los cambios que me producirá la droga, por lo tanto tomar
droga en sitios habituales me “colocará” menos).
Ejemplo en ratas.
el EC como A una rata A se le presentaba otra rata B atada que actuaba como EC, 10 segundos antes de presentarle la comida. A fuerza de presentarle la rata B (EC)
determinante de antes de la comida (EI) se quería observar si la respuesta normal que daría la rata A ante la comida (morder, roer) comenzaría a darla con la sola visión
la forma de la RC de la otra rata. Sin embargo esto no fue así, sino que la rata A mostraba actitudes sociales ante la rata B. Por lo tanto estas actitudes sociales
estaban sin duda determinadas por la naturaleza del EC (la rata B).
Conducta Un sistema de conducta consiste en una serie de modos de respuesta, cada uno de ellos con sus propios estímulos y respuestas relevantes, dispuestos
condicionada y con determinado orden espacial y/o secuencial.
sistemas de Esta teoría asume que la presentación de un EI activa el sistema de conducta (formado por uno o varios EC) para ese EI.
conducta La presentación de un estímulo sexual para la codorniz macho (EI) activa una secuencia de:
Conducta de búsqueda general (EC),
Conducta de búsqueda focal (EC)
Conducta consumatoria (EI)
La forma de la RC depende del intervalo EC-EI que se utilice. La razón es que el intervalo EC-EI determinará el lugar en el que se incorporará el EC
dentro de la secuencia de respuestas del sistema de conducta. El EC no sustituye ni compensa al EI. En lugar de eso, sustituye a un estímulo en un punto
del sistema de conducta determinado por el intervalo EC-EI.

lOMoARcPSD|1999571
Aprendizaje E-R Aprendizaje E-R: Este aprendizaje establece una nueva conexión Entre el EC y la RC
frente a Aprendizaje E-E: Es una visión más moderna, en la que los individuos aprenden una asociación entre el EC y el EI. Los sujetos responden al EC, no
aprendizaje E-E porque éste elicite directamente la RC sino porque el EC hace que el sujeto piense en EI.
¿Cómo pueden los investigadores decidir entre estas dos interpretaciones?
Mediante la técnica de la devaluación del EI, que consiste en la reducción del atractivo de un estímulo incondicionado, normalmente obtenida
mediante la aversión o la saciedad.
¿CÓMO SE ASOCIAN LOS ESTÍMULOS CONDICIONADO E INCONDICIONADO?
Si tenemos dos estímulo A y B y emparejamos fuertemente el estímulo A con un EI,

provocando una respuesta condicionada intensa, y luego presentamos los dos estímulos
(A y B) conjuntamente junto al EI, se observa que el condicionamiento de A no se extiende
a B.
Ejemplo con el pastel de la abuela
Todos los domingos visito a mi abuela y me hace un pastel de arroz (A) que me sienta mal
(EI). Aprendo a tenerle aversión al pastel de arroz. Tiempo después me sorprende un día
al acompañar el pastel de arroz de galletas (B). Me vuelve a sentar mal (EI) pero pienso
que sigue siendo culpa del pastel de arroz y no de las galletas.
¿Porqué la presencia del estímulo A previamente condicionado bloquea la
adquisición de la respuesta a B?
Kamin señala que el EI debe ser sorprendente. Es decir si el EI va señalado por un
El efecto de estímulo previamente condicionado (A), no sorprenderá al sujeto y, por tanto no funcionará
bloqueo bien a la hora de condicionar al estímulo añadido (B). En el ejemplo anterior soy consciente
de que cuando tome el pastel de arroz me sentará mal, asi que el hecho de acompañarlo
con galletas no lo atribuiré a mi malestar.
Recuadro 4.3 El problema dibujo-palabra en la enseñanza de la lectura: Una forma de
bloqueo. El aprendizaje de la lectura mediante la presentación de palabras y dibujos
puede producir procesos similares al bloqueo. Por esta razón hay que utilizar estos
métodos con precaución ya que pueden dificultar el aprendizaje en lugar de facilitarlo.
(esto con muuuuucha calma y leyendo el libro
detenidamente ya que los siguientes puntos son casi imposibles de resumir. He extraído
las ideas principales)

lOMoARcPSD|1999571
El modelo de Se trata de un modelo matemático que explica porqué la efectividad de un EI está determinada por el grado en que resulta sorprendente.
Rescorla y Wagner Pueden haber:
- EI inesperadamente grandes: Son la base del condicionamiento excitatorio
- EI inesperadamente pequeños: Son la base del condicionamiento inhibitorio
Y todo esto se puede explicar mediante una fórmula matemática:
ΔV = k( λ - V )
λ : Asíntota de aprendizaje
V: Valor asociativo de los estímulos que preceden al EI
k: Constante relacionada con la saliencia del EC y del EI
ΔV: Cambio en el valor asociativo de un estímulo
Al principio del aprendizaje V está cercano a 0 ya que los estímulos que preceden al EI no los relaciono para nada con EI (por eso es una sorpresa).
Como V está cerca de 0, el resultado de ( λ - V ) será bastante grande. Por lo tanto ΔV (la sorpresa) será mayor al principio del aprendizaje.
Sin embargo conformen vayamos haciendo ensayos, V va creciendo al incrementarse su valor de asociación con el EI. Como V va creciendo, el
resultado ( λ - V ) será menor. Por lo tanto ΔV (la sorpresa) será menor al final del aprendizaje.
Aplicación al efecto de bloqueo
Final de la primera fase: VA = λ
Segunda fase: No hay condicionamiento del estímulo B en la fase 2, ya que el EI es predecible por la presencia del estímulo A:
EI = (λ-VA+B) = 0
Pérdida del valor asociativo a pesar de los emparejamientos con el EI
El modelo Rescola-Wagner predice que los estímulos perderán valor asociativo si se presentan juntos en un ensayo de condicionamiento después de
haber sido entrenados por separado.
Fase 1
- Asociamos el estímulo A con una bolita de comida (EI)
- Paralelamente asociamos el estímulo B con la misma bolita de comida (EI)
Ambos estímulos se han condicionado perfectamente, de manera que predicen perfectamente el EI de una bolita de comida, es decir, VA = VB = λ
Fase 2
- Presentamos ambos estímulos conjuntos (A y B) con la bolita de comida (EI)
Al no haber cambios en el EI, las propiedades de A y B adquiridas en la fase 1 deberían mantenerse, y sin embargo el modelo predice que se van a
reducir. ¿porqué sucede esto?
Porque la expectativa basada en los estímulos individuales son 2 bolitas de comida y sin embargo se le presenta 1 única bolita. Por lo tanto existe
una discrepancia entre lo que se espera (2 bolitas) y lo que se presenta (1 bolita). Los participantes encuentran que el EI es sorprendentemente
pequeño, por lo tanto para ajustar la expectativa a lo que realmente ocurre, A y B perderán valor.
Inhibición condicionada (mirar el gráfico de la página 82 del tema 3 para recordar qué era la inhibición condicionada)
La inhibición condicionada consta de dos tipos de ensayos:
- Ensayos reforzados: Se presenta el EI
- Ensayos no reforzados: Se omite el EI
Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirir propiedades excitatorias.

lOMoARcPSD|1999571
Por el contrario, en los ensayos no reforzados, el EI no ocurre (a pesar de que lo esperamos como consecuencia de nuestro aprendizaje en los
ensayos reforzados). Se trata de un caso de expectativa excesiva.
Para predecir con exactitud la ausencia de EI en los ensayos no reforzados, los valores asociativos de EC+ y EC- tienen que sumar cero.
Extinción de la excitación y la inhibición (gráfico pág 115)
Excitación:
En este procedimiento, el estímulo condicionado se presenta repetidamente con el EI.
Como el EC ha adquirido fuertes propiedades excitatorias, la primera vez que se presenta solo el EC habrá un exceso de expectativa a que también
se presente el EI. Conforme se siga presentado el EC solo, la expectativa de que aparezca EI se va acercando a 0.
Inhibición:
Es un poco lo contrario que el caso anterior. Aquí el EC- comienza con un valor asociativo negativo que se considera una predicción excesivamente
baja del EI. Para ajustarse a las expectativas, el valor asociativo negativo del EC- se va perdiendo hasta llegar a 0.
Problemas del modelo de Rescorla y Wagner
1º Problema: Su análisis de la extinción de la inhibición condicionada es incorrecto. El modelo predice que la presentación repetida de un
inhibidor condicionado (EC-) sin el EI debería dar lugar a una pérdida de la inhibición condicionada, pero esto no sucede.
2º Problema: El modelo considera la excitación como lo opuesto a la extinción. Y no debe verse así.
3º Problema: El modelo solo permite que los EC tengan un único valor asociativo (EC+ o EC-) sin embargo se ha descubierto que en ciertas
condiciones puede tener ambos.
4º Problema: El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los paradigmas de aversión al sabor y el olor.
Concretamente tiene problemas para explicar el efecto de aumento o contrabloqueo. (el estímulo previamente condicionado
aumenta el condicionamiento del EC añadido)
Modelos atencionales de condicionamiento
Para que el condicionamiento tenga lugar, los sujetos deben prestar atención al EC.
- Se asume que el grado de atención que un animal presta al EC en un ensayo determinado depende del grado en el que el EI haya sido
sorprendente en el ensayo anterior.
- La sorpresividad del EI en un ensayo determinado altera el grado de atención dedicado al EC en los ensayos siguientes. Por lo tanto la
sorpresividad del EI tiene sólo un efecto prospectivo o proactivo sobre la atención y el condicionamiento (esta es la principal diferencia con el
modelo de Rescorla y Wagner)
Otros modelos de Factores temporales y respuesta condicionada
condicionamiento - Ninguno de los modelos vistos hasta ahora explica los efectos del tiempo sobre el condicionamiento. Sin embargo el intervalo EC-EI es una variable
clásico temporal importante ya que los intervalos EC-EI más largos producen menos respuestas. (la respuesta es inversamente proporcional a la duración
del intervalo)
- Otra variable importante es el intervalo entre ensayos sucesivos. Se observa una mayor respuesta condicionada cuando se utilizan procedimientos
en los que los ensayos están más separados entre sí.
Hipótesis del tiempo de espera relativo
IEE: Intervalo entre ensayos
ED: Duración del ensayo
Un EC proporciona información acerca de la aparición del EI, sólo si el sujeto tiene que pasar menos tiempo esperando al EI tras la presentación del
EC que cuando está simplemente expuesto al contexto experimental.

lOMoARcPSD|1999571
-Razón IEE/DE baja = tiempo de espera similar al contexto = EC da poca info sobre aparición EI
-Razón IEE/DE alta= tiempo de espera menor que el contexto= EC da mucha info sobre aparición EI
Hipótesis del comparador
La respuesta condicionada depende no sólo de la asociación entre el EC y el EI, sino también de todas las posibles asociaciones que puedan
establecerse entre las claves contextuales y el EI.
Se asume que los organismos aprenden 3 asociaciones en el curso del tiempo (gráfico 121):
1ª asociación: Une el EC crítico (X) con el EI. (de forma directa)
2ª asociación: Une el EC crítico con las claves contextuales de comparación
3ª asociación: Une los estímulos de comparación y el EI (de forma indirecta)
- La hipótesis del comparador no indica cómo se establecen las asociaciones, se trata de una teoría de ejecución, no de aprendizaje.
- La comparación entre las asociaciones (EC-EI) y (contexto-EI) se realiza en el momento de la prueba.
- También se ha probado esta hipótesis en estudios sobre inhibición condicionada.
Atribuye la inhibición condicionada a situaciones en las que la asociación del EC crítico con el EI es más débil que la asociación de las claves
contextuales con el EI.
- Es la única hipótesis que predice que la extinción de la inhibición condicionada se puede lograr no presentando el EC- de forma aislada, sino
extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el condicionamiento inhibitorio del EC-.
- El modelo predice también que incrementar el valor excitatorio de las claves contextuales tras el tratamiento reducirá la respuesta condicionada
del EC crítico.
- Otra contribución ha sido suponer que las diferencias en la respuesta condicionada pueden reflejar diferencias en la ejecución más que en el
aprendizaje.
Visión general de las alternativas teóricas (un poco resumen de lo visto)
- Hipótesis del tiempo: Se centra en la distribución temporal
- Hipótesis del comparador: Es una teoría de la ejecución más que del aprendizaje
- Modelos atencionales: Se parece más a Rescorla-Wagner pero también comparte sus limitaciones.

lOMoARcPSD|1999571
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS
PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INSTRUMENTAL

Comienzan con Thorndike.
Sus experimentos se basaban en introducir animales hambrientos en cajas con comida en el exterior y a la vista del animal. El animal debía aprender cómo salir de la caja.
Los resultados son obvios, con la repetición elanimal cada vez tarda menos tiempo en repetir la acción que abre la caja. Sin embargo hay que hacer una puntualización,
Thorndike no explicaba que los animales compredieran el funcionamiento del mecanismo que abría la caja, sino que la abrían como una asociación estímulo-respuesta.
Ley del efecto: Si una respuesta en presencia de un estímulo es seguida por un suceso satisfactorio, la asociación entre el estímulo (E) y la respuesta (R) se fortalece. Si la
respuesta es seguida por un suceso molesto, la asociación E-R se debilita. La ley del efecto implica un aprendizaje E-R.
APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO INSTRUMENTAL

Normalmente se llevan a cabo en laberintos
Procedimientos de W.S. Small (1899-1900) creó laberintos para estudiar la conducta de las ratas. Uno tenía forma de T (para estudiar la conducta de elección )y otro
ensayo discreto era simplemente alargado con forma de I (gráficos pág 129).
Con los laberintos se puede medir la velocidad de la carrera (desde la salida hasta la meta) y el tiempo de latencia (tiempo que tarda en
abandonar la salida e iniciar la carrera).
Skinner (1938). Se permite que el animal repita la respuesta una y otra vez sin restricciones.(a diferencia de los laberintos en T en que el animal
era sacado del laberinto al llegar a meta). Skinner quería obtener una respuesta más natural en los experimentos.
La observación informal sugiere que la conducta en curso es un continuo, una actividad sigue a la otra. Skinner propuso el concepto de operante
como la forma de dividir la conducta en unidades medibles con significado.
Foto página 131: Rata hambrienta en una caja de Skinner. Hay una palanca conectada a un dispensador de comida.
• La respuesta operante (presionar la palanca) se define a partir del efecto que produce en el ambiente. El operante de presión de la
palanca se define como una presión hacia abajo suficiente para que cause el cierre del microinterruptor.
• Entrenamiento y moldeamiento al comedero Es la primera fase. Se realiza un seguimiento del signo mediante un sonido
(condicionamiento clásico) para que el animal se dirija al comedero. (esto es el entrenamiento al comedero). Tras este entrenamiento el
animal está preparado para aprender la respuesta instrumental.
Procedimientos de Si la respuesta NO ES ALGO que el animal ya realiza ocasionalmente NUNCA sucederá por si misma la respuesta que produce el reforzador.. Poco a
operante libre poco vamos produciendo un moldeamiento de la conducta del animal hasta conseguir la respuesta buscada.
Esta dos fases que hemos visto del modeamiento son: “reforzamiento de aproximaciones sucesivas”
Moldeamiento y nueva conducta Toda la nueva unidad conductual de la rata está formada por un conjunto de respuestas preexistentes . Es decir,
se le enseña una nueva combinación de respuestas familiares en una nueva actividad. Es importante señalar que el moldeamiento aprovecha la
variabilidad inherente de la conducta. Es decir, se puede variar la conducta en una dirección u otra.
El moldeamiento puede producir nuevas formas de respuesta nunca antes realizadas por el organismo.
Antes de los experimentos las palomas conseguían abrir el pico 10 mm, pero tras el moldeamiento llegaban hasta 20 mm.
La tasa de respuesta como medida de la conducta operante
Los experimentos con operante libre permiten una observación continua durante largos periodos (a diferencia del ensayo discreto). Skinner
propuso la “tasa de ocurrencia” (frecuencia de la respuesta por minuto) como medida de la probabilidad de una respuesta. Las respuestas más
probables ocurren con frecuencia y muestran una tasa alta.

lOMoARcPSD|1999571
PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL
Antes de empezar con los procedimientos (que son 4) vamos a explicar 4 conceptos:
- Estimulo apetitivo: Una consecuencia placentera.

- Estímulo aversivo: Una consecuencia molesta.
- Contingencia positiva: La respuesta instrumental proporciona el estímulo (un
chico corta el césped y recibe dinero)
- Contingencia negativa: La respuesta instrumental evita el estímulo (cierro la
ventana y no entra lluvia)
Importante la tabla de la página 134
Y ahora los 4 procedimientos:
NOMBRE DEL CONTINGENCIA RESPUESTA-CONSECUENCIA RESULTADO

PROCEDIMIENTO
Reforzamiento positivo POSITIVO: respuesta instrumental produce un estímulo apetitivo. Reforzamiento o incremento en la
tasa de respuesta
Castigo POSITIVO: respuesta instrumental produce un estímulo aversivo Supresión o disminución en la tasa
de respuesta
Reforzamiento negativo NEGATIVO: la respuesta instrumental finaliza o previene la entrega de un estímulo aversivo. Hay Reforzamiento o incremento en la
dos tipos de reforzamiento negativo: tasa de respuesta
A) Escape: Se presenta el estímulo aversivo pero puede ser eliminado por la respuesta
instrumental. Se puede escapar del sonido molesto de una radio apagándola.
B) Evitación: Implica la programación de un estímulo aversivo para ser presentado en algún
momento del futuro. La gente pone a punto su coche para evitar averías.
Entrenamiento de NEGATIVO: la respuesta instrumental finaliza o previene la entrega de un estímulo APETITIVO Supresión o disminución en la tasa
omisión (RDO) de respuesta

lOMoARcPSD|1999571
ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO INSTRUMENTAL

Variabilidad conductual versus estereotipia
Los experimentos de Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de que la respuesta instrumental se repita en el
futuro. Sin embargo esto no significa que el condicionamiento instrumental no pueda producir también respuestas creativas o variables. Los organismos
pueden aprender a obtener reforzamiento en una situación donde se requiere hacer algo nuevo.
Por lo tanto la variabilidad de la respuesta puede ser la base para el reforzamiento instrumental. Y esto se demostró con un experimento en palomas:
Page y Neuringer (1985) – Experimento en Palomas. Las palomas tenían que picotear 2 teclas durante 8 veces para obtener comida. Podían alternar los
picoteos como quisieran siempre que fuesen 8 entre dos teclas. Tras 50 ensayos solo recibirían comida si no repetian ninguna de las combinaciones de
los 50 ensayos del principio. Paralelamente un grupo de control recibía comida independientemente de si repetía o no. Los resultados demostraron que
el grupo que no tenía que repetir las combinaciones daba mucha más variabilidad en su respuesta que el grupo de control, creando combinaciones
nuevas.
Por lo tanto:
- La variabilidad de la respuesta puede mantenerse e incrementarse por reforzamiento.
- En ausencia de reforzamiento explícito de la variabilidad, la respuesta llega a ser más estereotipada con un condicionamiento instrumental
continuado.
1. La Relevancia o pertinencia en el condicionamiento instrumental
respuesta Thordike estudió las respuestas de gatos atrapados en cajas. Primeramente condicionó el rascado y el bostezo como respuestas instrumentales para
instrumental escapar y en otros experimentos condicionó manipular un picaporte o tirar de una anilla. Demostró que cuando se trataba del picaporte o la anilla, la
respuesta era mucho más vigorosa que cuando se trataba del bostezo y el rascado. La evolución natural del gato hace que manipular un picaporte y
empujar una anilla son respuestas que están relacionadas de forma natural con escapar de la trampa. Con esto se explica el concepto de pertinencia.
Deriva instintiva: Breland y Breland observaron varias limitaciones y problemas a la hora de entrenar animales para realizar exhibiciones en circos.
Observaron que los animales realizaban conductas relacionadas con su forma de alimentación en lugar de reproducir la conducta buscada por los
educadores.
Sistemas de conducta y limitaciones en el condicionamiento instrumental
De acuerdo con la teoría de los sistemas de conducta, cuando un animal está privado de comida y se encuentra en una situación donde podría
encontrarla, su sistema de alimentación se activa y se dedica a otras actividades relacionadas con la comida. De acuerdo con la aproximación de los
sistemas de conducta, deberíamos ser capaces de predecir qué respuestas se incrementarán con un reforzamiento de comida mediante el estudio de lo
que los animales hacen cuando su sistema de alimentación está activado en ausencia de condicionamiento instrumental. Esto suena un poco lioso pero
se entiende con el siguiente ejemplo:
Cuando un hamster tiene comida suficiente se dedica a otras actividades como el autocuidado (lavarse, etc) pero cuando está hambriento su sistema de
conducta se centra en otras actividades como rascar o comer. Por lo tanto podemos concluir que el autocuidado no está relacionado con su sistema de
conducta de la alimentación y que el reforzamiento de comida podría producir incrementos en actividades como cavar y escarbar pero no en lavarse la
cara y rascarse.

lOMoARcPSD|1999571
2. El Cantidad y naturaleza del reforzador

reforzador Las dos características están muy relacionadas. Tener un reforzador más grande o más sabroso (en el caso de la comida) provocará respuestas más
instrumental intensas en los sujetos.
Cambios en la naturaleza y cantidad del reforzador
Esto está relacionado con el modelo Rescorla-Wagner visto en el tema anterior.
Si el EI es mayor de lo esperado, producirá condicionamiento excitatorio. Si por el contrario el EI es menor de lo esperado, producirá condicionamiento
inhibitorio.
Contraste positivo: Se refiere a una elevada respuesta por una recompensa favorable resultado de una experiencia anterior con una consecuencia
menos atractiva.
Contraste negativo: Se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia
mejor.
Contraste sucesivo (positivo o negativo): Dos condiciones de respuesta en diferentes fases del experimento y sólo un cambio en la magnitud de la
recompensa para los grupos de cambio.
Contraste conductual simultáneo: Efectos de contraste conductual (contraste positivo y negativo) que están producidos por frecuentes cambios entre
una condición de recompensa favorable y una desfavorable, con cada condición de recompensa asociada a su propio estímulo distintivo.
Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situación está determinada en parte por las experiencias del
organismo con reforzadores en otras situaciones.
3. La relación 2 tipos de relaciones entre una respuesta y un reforzador
respuesta- a) Relación temporal (o contigüidad temporal): Tiempo que transcurre entre la respuesta y el reforzador. En la “Contigüidad temporal” el
reforzador reforzador se entrega inmediatamente después de la respuesta.
b) Relación causal: (o contingencia respuesta-reforzador). Se refiere al hecho de que la respuesta instrumental es necesaria y suficiente para la
ocurrencia del reforzador.
Efectos de la contigüidad temporal
El reforzamiento inmediato es preferible al demorado. Proporcionar el reforzador inmediatamente después de la ocurrencia de la respuesta
instrumental facilita el aprendizaje. Hay varios factores que explican porqué el condicionamiento instrumental es tan sensible a la demora del
reforzamiento:
- Una demora larga hace que el sujeto no sepa cual de sus respuestas haya sido la que ha producido el reforzador
- Para resolver este problema se entrega un reforzador condicionado o secundario inmediatamente después de la respuesta instrumental y que ha sido
asociado previamente con el reforzador.
- Otra manera de resolver el problema es mediante un “procedimiento de marcado” de la respuesta instrumental correcta. (ej: sacar la rata de la caja)
La contingencia respuesta-reforzador
Aunque la relación causal sea perfecta, el condicionamiento no ocurrirá si el reforzamiento es demorado durante demasiado tiempo.
El experimento de superstición de Skinner
Metió a 8 palomas en 8 cajas distintas que estaban programadas para dar comida cada 15 segundos independientemente de lo que
estuviesen haciendo las palomas. Al rato volvío y comprobó que cada paloma estaba haciendo una cosa, unas daban vueltas otras picoteaban, etc,
como si su comportamiento condicionara el hecho de que apareciese o no apareciese comida. Skinner denominó a esto conducta supersticiosa.
Skinner explica esta conducta mediante la idea del reforzamiento accidental o adventicio que se refiere al emparejamiento accidental de una
respuesta con la entrega del reforzador. Este experimento sugería que una contingencia positiva respuesta-reforzador no es necesaria para el

lOMoARcPSD|1999571
condicionamiento instrumental.
Reinterpretación del experimento de superstición: Staddon y Simmelhag dieron nombre a las conductas de las palomas.
Denominaron respuestas terminales a las que se daban al final del intervalo comida-comida y respuestas de interín a las que se daban en medio del
intervalo. Las Palomas solían coincidir en el tipo de respuestas terminales y en el tipo de respuestas interín. Por lo tanto hay algo de contingencia entre
el tipo de respuestas y el reforzador (al contrario de cómo sugería Skinner)
Explicación de la periodicidad de las respuestas de interín y terminales: sugirieron que las respuestas terminales son respuestas típicas de la especie
que reflejan la anticipación de comida a medida que el tiempo se encuentra más cerca de la próxima presentación de comida. En contraste, las
respuestas interín son una manifestación de otras fuentes de motivación que eran más importantes al comienzo del intervalo entre comidas, cuando la
presentación de comida era improbable.
El tipo de respuestas que se dan en el intervalo se agrupan en 3 subgrupos siguiendo el orden temporal tras la última aparición de comida:
a) – Búsqueda focalizada poscomida (cerca del cuenco)
b) – Búsqueda general (lejos del cuenco)
c) - Búsqueda focalizada (cerca del cuenco otra vez)
Efectos de la controlabilidad de los reforzadores
Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. Un hallazgo importante en experimentos
con perros fue que la exposición a una descarga incontrolable dificultaba el aprendizaje posterior. Este efecto recibe el nombre de efecto de
indefensión aprendida.
1. El diseño triádico: (tabla página 153)
Los experimentos de indefensión aprendida se realizan utilizando el diseño triádico.
Contiene 2 fases:
a) Exposición
 Grupo de ratas E: Expuesto a descargas periódicas de las que pueden escapar.
 Grupo de ratas A: Cada sujeto del grupo A es acoplado a cada sujeto del grupo E y recibe las mismas descargas pero no
pueden escapar de ellas.
 Grupo C: No recibe descargas pero está confinado en el aparato tanto tiempo como los otros.
b) Condicionamiento
Los 3 grupos reciben entrenamiento de escape – evitación
Resultados: La exposición a una descarga incontrolable (Grupo A) produce peores resultados en el aprendizaje escape-evitación que el resto de los
grupos. La diferencia en la tasa de aprendizaje entre los grupos muestra que los animales son sensibles a la contingencia respuesta-reforzador.
2. Hipótesis de la indefensión aprendida: Esta hipótesis asume que durante la exposición a descargas incontrolables, los animales aprenden
que las descargas son independientes de su conducta, no pueden hacer nada para controlarlas. Esto dificulta el aprendizaje ya que la falta de
control sobre la situación hace que descienda la motivación de los sujetos para realizar una respuesta instrumental. No confundir con el efecto
de indefensión aprendida que explica el patrón de resultados obtenido con el diseño triádico.
3. Deficit de actividad: Las ratas del Grupo A aprendían a ser inactivas en respuesta a la descarga durante la fase de exposición.
4. Deficit atencional: Una descarga inescapable hace que los animales presten menos atención a sus acciones. Sin embargo marcar la respuesta
instrumental supera el déficit de indefensión aprendida.
5.Relaciones estimulares en el condicionamiento de escape: El rasgo definitorio de la conducta de escape es que la respuesta instrumental
tiene como consecuencia la terminación del estímulo aversivo. Además, la respuesta de escape tiene como resultado claves internas de

lOMoARcPSD|1999571
retroalimentación de la respuesta. Hay dos:

- Claves de retroalimentación de la terminación de la descarga. (al comienzo de la respuesta de escape)
- Claves de retroalimentación de la señal de seguridad. (cuando el animal completa la respuesta)
Estas claves contextuales llegan a convertirse en inhibidores condicionados del miedo y limitan el miedo elicitado por las claves
contextuales de la cámara experimental. Hay mayor probabilidad que las claves contextuales de la cámara en la que se administran las
descargas queden condicionadas para elicitar miedo cuando las descargas son inescapables.

lOMoARcPSD|1999571
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN
Programa de reforzamiento: Programa o regla que determina la forma en que se relacionan las presentaciones del reforzador con las ocurrencias de la respuesta
instrumental. La entrega del reforzador puede depender de varios factores, número de respuestas, paso del tiempo, etc.
Los programas de reforzamiento se investigan normalmente en cajas de Skinner que permiten una observación continua de la conducta, por lo que pueden observarse y
analizarse los cambios en la tasa de respuesta. Proporcionan más información sobre los factores que controlan el mantenimiento de la conducta.
A) PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE
Son programas en los que un solo factor determina qué ocurrencia de la respuesta instrumental se refuerza.
Programas El reforzamiento depende del número de respuestas.
de razón Reforzamiento continuo: Una sóla respuesta provoca la entrega del reforzador.
Reforzamiento parcial o intermitente: La respuesta se refuerza sólo alguna vez.
Razón fija: Entrega del reforzador cada X respuestas, (5, 10 etc). Se representa mediante RF5, RF10, etc.
Otros conceptos importantes
Registro acumulativo de la conducta: Es una forma especial de representar la forma de repetirse una respuesta a lo largo del tiempo. Se utilizaba sobre
todo antes de la existencia de los ordenadores. (gráfico pág 165). La pendiente de la línea trazada representa la tasa de respuesta.
Pausa posreforzamiento: Es la tasa de respuesta 0 que se observa justo después del reforzamiento.
Carrera de la razón: La tasa de respuesta alta y estable que completa cada requerimiento de la razón.
¿Qué ocurre cuando el requerimiento de la razón se incrementa un poco? Es decir, pasar por ejemplo de RF 120 a RF 150
- Con mayores requerimientos de la tasa, tienden a ocurrir pausas posreforzamiento más largas.
- Si el incremento es muy grande es probable que el animal realice una pausa periódica cada vez que complete la razón requerida. Es lo que se conoce
como tensión de razón.
Razón variable: Número de respuestas distinto para la entrega del reforzador. Se representa por RV y en el caso de RV10 quiere decir que su media es 10
Las pausas predecibles en la tasa de respuesta son menos probables con los programas de razón variable que con los programas de razón fija. Los
organismos suelen responder a una tasa claramente estable en los programas de RV.
Programas Cuando ocurre cierta cantidad de tiempo desde la última entrega del reforzador.
de intervalo Intervalo fijo (IF): El tiempo no varía de una ocasión a la siguiente.
Festón del intervalo fijo: A medida que el tiempo para la disponibilidad del próximo reforzador se acerca, la tasa de respuesta aumenta. Este aumento en la
tasa de respuesta se manifiesta como una aceleración en el registro acumulativo hacia el final del IF.
OJO!!! : Un programa de IF no garantiza que el reforzador se proporcionará a en algún momento a lo largo del tiempo, el intervalo determina sólo cuándo
el reforzador estará disponible, no cuando se entrega. Es decir, además del paso del tiempo, sigue siendo
necesaria algún tipo de respuesta por parte del sujeto para acceder al reforzador.
Intervalo variable (IV): El tiempo varía de una ocasión a la siguiente. Se representa por (IV 5), (IV 10), etc. Entendiendo este número como la media de
todos los intervalos. Los programas de IV mantienen tasas de respuesta constantes y estables sin pausas regulares. (al igual que prog. de RV)
Programas de intervalo y espera limitada: En la espera limitada el reforzador está disponible durante un tiempo X, si pasado ese tiempo el sujeto no ha
dado el número de respuestas necesario, el reforzador deja de estar disponible.

lOMoARcPSD|1999571
Similitudes Diferencias
Razón fija e intervalo fijo: - Activan diferentes cambios neuroquímicos en el cerebro
- Producen una pausa posreforzamiento después de la administración de - Los programas de intervalo están relacionados con el sentido temporal del
cada reforzador. organismo.
- Producen altas tasas de respuesta antes de la administración del siguiente En un experimento con palomas, una reforzada con RV y la otra con IV, se
reforzador. comprobó que la paloma reforzada con el programa de RV respondió a una
Comparación Razón variable e intervalo variable: tasa mucho más alta que la paloma reforzada con el programa de IV. El
de - Mantienen tasas estables de respuesta, sin pausas predecibles. programa de RV motivó una conducta instrumental mucho más vigorosa.
los programas
de razón y Reforzamiento diferencial del tiempo interrespuesta: El intervalo entre una respuesta y la siguiente se denomina tiempo interrespuesta o TIR.
de intervalo • TIR cortos=> responderá a una tasa alta
• TIR largos=> su tasa será baja.
Un programa de razón favorece los TIR cortos (es la respuesta del sujeto la que determina cuando accederá a la comida, por lo tanto cuanto más rápida se
produzca esa respuesta (TIR corto), antes accederá a la comida. Por el contrario, un programa de intervalo favorece los TIR largos.
Programas de Los programas de tasas de respuesta requieren específicamente que el organismo responda a una tasa particular para obtener el reforzador. Es como una
reforzamiento mezcla de los dos anteriores (tiempo y número).
de tasas de Por ejemplo un programa de reforzamiento en el que una respuesta se refuerce sólo si ocurre dentro de los 5 segundos siguientes a la respuesta
respuesta precedente. Si el animal realiza una respuesta cada 5 segundos, su tasa de respuesta será de 12 por minuto. Por lo tanto habrá reforzamiento si la tasa de
respuesta es de 12 por minuto o mayor. Si la tasa de respuesta es menor, el organismo no será reforzado.
Esto recibe el nombre de Reforzamiento diferencial de tasas altas, o RDA.
Reforzamiento diferencial de tasas altas (RDA): Una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la
respuesta precedente. Estos programas fomentan que los sujetos respondan rápidamente.
Reforzamiento diferencial de tasas bajas (RDB): Una respuesta se refuerza sólo si ocurre después de que haya transcurrido cierta cantidad de tiempo tras
la respuesta precedente. Estos programas fomentan que los sujetos respondan lentamente.
B) CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES
Los experimentos en los que sólo se mide una respuesta (los vistos hasta ahora) no proporcionan una visión completa de la conducta. En la vida real los organismos ocupan
su tiempo en muchas actividades y están continuamente estableciendo elecciones entre varias conductas.
Las situaciones de elección pueden ser bastante complicadas y muy diferentes. Por esta razón los psicólogos han desarrollado el estudio de situaciones más simples. La
situación de elección más simple consta de dos respuestas alternativas, cada una de estas seguida por un reforzador de acuerdo con su propio programa de reforzamiento.
Históricamente se utilizaban laberintos T para estudiar la conducta de elección. Hoy se utilizan cajas de Skinner equipadas con dos teclas. Responder en cada tecla es
reforzado según algún programa de reforzamiento. Los dos programas funcionan concurrentemente, por eso reciben el nombre de programa concurrente.
Ejemplo página 173 (gráfico). Programa concurrente. Los picotazos sobre la tecla A siguen un programa IV 60 seg. Los de la tecla B siguen un programa RF 10. El objetivo del
experimento es ver cómo la paloma distribuye sus picotazos en las dos teclas y cómo influye el programa de reforzamiento propio de cada tecla en las elecciones del animal.

lOMoARcPSD|1999571
Se puede medir de varias formas:

Tasa relativa de respuesta de cada alternativa: La tasa relativa de respuesta en la tecla A se calcula dividiendo la tasa de respuesta en la tecla A por la
tasa total de respuesta (suma de la tasa A + la tasa B)
Tasa relativa de respuesta (A) = RA/ (RA+RB)
Medidas de la - Si la paloma picotea igualmente en las dos teclas de respuesta, la razón será 0,5.
conducta de - Si la tasa de respuesta es mayor en A que en B, la razón será mayor que 0,5.
elección - Si la tasa de respuesta es menor en A que en B, la razón será menor que 0,5.
La forma en que un organismo distribuye su conducta entre las dos alternativas de respuesta está muy influida por el programa de reforzamiento que
funciona para cada respuesta.
Tasa relativa de reforzamiento: Es la frecuencia con la que el individuo obtiene recompensas en cada lado. Se calcula de igual manera a la tasa relativa de
respuesta.
Tasa relativa de reforzamiento (A) = rA/ (rA+rB)
En el punto anterior en los ejemplos se utilizaba el mismo programa de reforzamiento (IV 60 seg) para las dos teclas. Por lo tanto la tasa relativa de
respuesta y la tasa relativa de reforzamiento daba 0,5 ya que los programas eran iguales… ¿Pero qué ocurre si los programas son diferentes?
Experimento en palomas:
Tecla A: IV 6 min = Pulsando siempre a esta tecla obtendría un máximo de 10 reforzadores por hora.
Tecla B: IV 2 min= Pulsando siempre a esta tecla obtendría un máximo de 30 reforzadores por hora.
¿Cómo fue la respuesta de las palomas?
La tasa relativa de respuesta en una alternativa dada estaba siempre muy cercana a igualar la tasa relativa de reforzamiento logrado en esa alternativa. Si
las palomas obtenían una proporción mayor de reforzadores en A, picoteaban más en A. Por lo tanto, la tasa relativa de respuesta en una alternativa se
iguala con la tasa relativa de reforzamiento en esa alternativa. Esto es la ley de igualación.
RA/ (RA+RB) = rA/ (rA+rB)
Otra forma de escribir esta fórmula es: RA/ RB = rA/rB
Infraigualación, supraigualación y sesgo de respuesta
La ley de A pesar de lo que hablábamos de la ley de igualación, las tasas relativas de respuesta no siempre se igualan con exactamente con las tasas relativas de
igualación reforzamiento.
(de Herrnstein) Esto lo vamos a estudiar añadiendo dos parámetros “b” y “s” a la ecuación.
RA/ RB = b (rA/rB)s
• s= sensibilidad de la conducta de elección a las tasas relativas de reforzamiento para las alternativas de respuesta.
o Si s es menor que 1,0 = infraigualación. Sensibilidad reducida a la tasa relativa de reforzamiento.
o Si s es mayor que 1,0 = supraigualación. Sensibilidad aumentada a la tasa relativa de reforzamiento.
La infraigualación se encuentra más a menudo que la supraigualación.
b = sesgo de respuesta(bias en inglés, por eso la b)
Los sesgos de respuesta influyen en la elección cuando las alternativas de respuesta son diferentes (picotear y presionar con la pata). El sesgo también
adquiere importancia cuando el reforzador es diferente (grano de trigo y semillas).
En ausencia de sesgos, b=1. Dependiendo de la naturaleza del sesgo o de la preferencia, b será mayor o menor que 1.

lOMoARcPSD|1999571
La ley de la igualación y el valor del reforzador: La tasa relativa de respuesta es una función de la cantidad relativa de cada reforzador, de la demora y de
la palatabilidad. Cuanto mayores, más sabrosos y más inmediatos sean los reforzadores, serán de mayor valor.
La ley de la igualación y los programas simples de reforzamiento: Incluso las situaciones de respuesta única pueden involucrar una elección entre realizar
la respuesta especificada (picotear o presionar una palanca) u ocuparse de otras actividades (caminar, acicalarse, etc)
Según esto, la ley de la igualación quedaría así:
RA / (RA+RO) = rA / (rA+rO)
Despejando RA = RA =(RA+RO) rA / (rA+rO)
- RA= Tasa de respuesta del programa
- RO= Tasa de respuesta de las otras actividades
- rA = Reforzamiento explícito del programa
- rO = Reforzamiento de las otras actividades
Si consideramos que (RA+RO) es una constante que no guarda relación con el reforzador, podemos llamarla constante k. La fórmula quedará de la
siguiente manera:
RA = krA / (rA+rO)
Esta última ecuación proporciona dos maneras de modificar la tasa de una respuesta:
- Mediante el cambio de su tasa de reforzamiento
- Mediante el cambio de la tasa de las otras fuentes de reforzamiento
Mecanismos de Igualación y maximización de las tasas de reforzamiento: Los organismos distribuyen sus acciones entre las alternativas de respuesta para recibir la
la ley de la máxima cantidad posible de reforzadores en cada situación.
igualación 1. Maximización molecular: Los organismos siempre eligen cualquier alternativa de respuesta con mejores probabilidades de que sea reforzada en ese
momento.
Experimento en palomas con dos teclas (A y B) y programa IV-IV. Cuanto más tiempo permanezca la paloma en la tecla A, más probabilidad habrá de que
transcurra el intervalo para la tecla B y que por lo tanto el reforzamiento esté disponible para B.
2. Maximización molar: El organismo distribuye sus respuestas entre las varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen
a la larga.
Se utilizó para explicar los programas de razón en los que los organismos rara vez cambian de alternativa, simplemente responden a la alternativa que
requiera menor número de respuestas (RF10 frente a RF20)
Sin embargo la maximización molar encuentra problemas a la hora de explicar la conducta de elección en programas de intervalo (IV-IV) y para programas
razón-intervalo (RF-IV).
3. Mejoramiento: Los mecanismos de mejoramiento operan a una escala temporal de las teorías molar y molecular. El término “mejoramiento” se refiere
a hacer algo mejor que el pasado reciente. No se refiere a elegir la mejor alternativa en ese momento.
Término importante sobre el mejoramiento:
Tasa local de respuesta y reforzamiento: Las tasas locales están calculadas sólo sobre el período de tiempo que un sujeto dedica a una alternativa
particular de respuesta. Si la situación incluye dos opciones (A y B), la tasa local de respuesta en A se calcula dividiendo la frecuencia de respuesta en A por
el tiempo que el sujeto dedica a responder en A.
La teoría del mejoramiento asume que los organismos cambian de una alternativa de respuesta a otra para mejorar la tasa local de reforzamiento que
están recibiendo. El mecanismo de mejoramiento da como resultado la igualación. Esta teoría sostiene que un organismo cambiará su preferencia en
favor de la alternativa de respuesta que arroje la tasa local de reforzamiento más alta.

lOMoARcPSD|1999571
C) ELECCIÓN CON COMPROMISO
Este programa involucra al menos dos fases o eslabones:

1ª fase: Eslabón de elección: Se permite al participante elegir entre dos programas alternativos realizando una de dos respuestas.
Programa 2ª fase: Eslabón terminal: Una vez que el participante ha elegido uno de los dos eslabones de elección, irá al eslabón terminal que está formado por dos
Concurrente programas de reforzamiento dependiendo de qué opción haya escogido en la 1ª fase.
encadenado Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de razón variable (RV) ya que proporciona reforzamiento por un número
(gráfico pág relativamente pequeño de respuestas.
183) El estímulo del eslabón terminal se convierte en un reforzador condicionado. Por lo tanto un programa concurrente se caracteriza en que las respuestas al
eslabón inicial se refuerzan por la presentación de un reforzador condicionado. Las diferencias en el valor del reforzador condicionado determinarán
entonces la tasa relativa de cada respuesta de elección en el eslabón inicial. (el programa (eslabón terminal) que suscite más valor a la paloma será el que
elija al principio en el eslabón de elección)
El autocontrol a menudo supone elegir una recompensa grande demorada en lugar de una recompensa pequeña inmediata.
Experimento en palomas: (gráfico pág 185)
Utilizando el programa concurrente encadenado. En cada uno de los programas terminales responder era recompensado o bien mediante el acceso a una
pequeña cantidad de grano (alternativa A) o el acceso a una mayor cantidad de grano que estaba demorada 4 segundos (alternativa B).
Estudiaron la conducta de elección en dos circunstancias diferentes:
1. Procedimiento de elección directa: (dibujo superior de la 185). No existe eslabón de elección, directamente se accede a la recompensa. En este ejemplo
las palomas no mostraban autocontrol y directamente seleccionaban la recompensa pequeña inmediata.
2. Procedimiento concurrente encadenado (dibujo inferior de la página 185). En este ejemplo, los componentes terminales estaban demorados después
de que las palomas realizaran su elección inicial. Si la demora era suficiente antes de los componentes terminales, las palomas mostraban autocontrol y
elegían la recompensa grande demorada.
Estudios de Conclusiones: Las preferencias cambian a favor de cualquier recompensa grande demorada si se requiere que los participantes esperen más tiempo para
autocontrol recibir cualquier recompensa tras realizar su elección. Si las recompensas se entregan rápidamente tras una respuesta de elección, los sujetos
generalmente prefieren una recompensa pequeña inmediata más que una recompensa grande demorada. Sin embargo, si se añade una demora constante
a la entrega de ambas recompensas, es más probable que los individuos muestren autocontrol y prefieran la recompensa grande demorada.
Explicaciones del autocontrol:
El valor de un reforzador se reduce en función del tiempo que haya que esperar para obtenerlo. La función matemática que representa esto se llama
función descontadora del valor.
V = M / (1+KD) (esta función recibe el nombre de función del decaimiento hiperbólico)
V= valor del reforzador
M= Magnitud de la recompensa
D= Demora de la recompensa
K= Parámetro de la tasa descontadora
Si el reforzador es entregado sin demora (D=0), el valor del reforzador estará directamente relacionado con su magnitud. Cuanto más se demora el
reforzador menor es su valor.
(gráfico de la página 186)

lOMoARcPSD|1999571
Las funciones descontadotas y los problemas de autocontrol en la adicción a la droga:

Cuando más acusada sea la función descontadora de la demora de una persona, más dificultad tendrá para mostrar autocontrol (seleccionando una
recompensa mayor demorada) en lugar de impulsividad (seleccionando una recompensa más pequeña pero más rápida).
Experimentos para medir el autocontrol en personas dependientes de la heroína demostró que tenían más impulsividad que el resto de las personas.
(gráfico de la izquierda en 187). Para los dependientes de la heroína, el valor del dinero (con el que se realizaba el experimento) disminuyó muy rápido si
iban a tardar en dárselo.
¿Puede entrenarse el autocontrol?
La respuesta es sí.
Ejemplo con niños. 3 fases.
Fase 1- Pretest: Se les pregunta a los niños si quieren 2 centimos ahora o 3 centimos al final del día. A los que eligen los 2 céntimos se les dan enseguida, a
los que eligen los 3 centimos se les dan al final del día.
Fase 2- Sesión de entrenamiento: Dependiendo de la elección en la fase 1, se hacen 2 grupos y se comienza con la sesión de entrenamiento. Deben
resolver problemas sencillos para obtener la recompensa, las respuestas correctas del grupo de los 2 céntimos recibirán el dinero al instante. Las
respuestas correctas del grupo de los 3 céntimos recibirán el dinero al final del día.
Fase 3 – Postest: se les vuelve a preguntar a los niños lo mismo que en la fase 1.
El hallazgo fue que había mayor cantidad de niños escogiendo la recompensa más grande demorada (3 céntimos) en el postest. Por lo tanto, siempre y
cuando las tareas de entrenamiento (fase 2) impliquen bajo esfuerzo, el entrenamiento con la recompensa demorada incrementará la preferencia por la
recompensa más grande demorada.

lOMoARcPSD|1999571
CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES
1. Estructura asociativa del condicionamiento instrumental: (Thorndike). Toma una perspectiva molecular. Se centra en las respuestas individuales y sus antecedentes
estimulares y consecuencias específicas.
2. Regulación conductual: (tradición skinneriana): El condicionamiento instrumental se considera desde un contexto más amplio, es decir, desde una perspectiva molar. Se
analizan las opciones conductuales del organismo para alcanzar las metas, por lo tanto es una perspectiva más funcional.
1.ESTRUCTURA ASOCIATIVA DEL CONDICIONAMIENTO INSTRUMENTAL

Thorndike: El condicionamiento instrumental incluye algo más que una respuesta y un
reforzador. Deben considerarse 3 sucesos en el análisis del condicionamiento instrumental:
- Contexto estimular (E)
- Respuesta instrumental (R)
- Consecuencia de la respuesta o reforzador (C)
Estos 3 sucesos se relacionan entre sí creando distintos tipos de relaciones que vamos a ver a
continuación.
La asociación E-R El papel del reforzador (C) es establecer una asociación entre las claves contextuales (E) y la respuesta instrumental (R).
y la ley del efecto La ley del efecto asume que el único papel del reforzador es crear una asociación E-R, ya que el reforzador (C) no participa en esta asociación.
Expectativa de Los procesos pavlovianos son importantes en este tipo de asociación. El reforzamiento de la respuesta (R) producirá una asociación entre el contexto
recompensa y estimular (E) y la consecuencia de la respuesta (C).
la asociación E-C Hull estableció que la respuesta instrumental era motivada por dos factores:
a) (E) evoca la respuesta directamente por asociación con (R)
b) La actividad instrumental también llega a realizarse en respuesta a la expectativa de recompensa debido al establecimiento de una
asociación R-C.
La teoría moderna de los dos procesos: Esta teoría asume que hay 2 tipos de aprendizaje, el condicionamiento pavloviano y el instrumental y están
relacionados de una forma especial:
Durante el condicionamiento instrumental, (E) se relaciona con (C) a través de condicionamiento pavloviano. Entonces tenemos la asociación (E-C). A
través de esta asociación, (E) motiva la conducta instrumental mediante la activación de un estado emocional central que dependerá de la naturaleza
del reforzador (como puede ser la esperanza de obtener comida).
¿Cómo podían demostrar que este estado de esperanza finalmente motivaría la conducta instrumental? La tasa de una respuesta instrumental será
modificada por la presentación de un estímulo clásicamente condicionado. Reforzar una presión de palanca con comida crea la expectativa de comida y
la emoción de esperanza. Por lo tanto la presentación de un EC+ clásicamente condicionado con comida durante la ejecución de una respuesta
reforzada debería aumentar la esperanza y por lo tanto incrementar la respuesta.
Resultados consecuentes con la teoría moderna de los dos procesos
Experimento de transferencia de control: (consta de 3 fases)
Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algún procedimiento de reforzamiento positivo o negativo.
Fase 2: Se entrena a los participantes con un condicionamiento clásico en el cual se asocia un EC explícito con la presencia o ausencia de un
estímulo incondicionado.
Fase 3: Es la fase de transferencia crítica. Se permite a los participantes que realicen la respuesta instrumental y se presenta el EC de la fase 2
para comprobar su efecto en la tasa de conducta instrumental.

lOMoARcPSD|1999571
Interacciones de respuesta en los experimentos de transferencia de control

Un estímulo clásicamente condicionado puede influir sobre la conducta instrumental a través de las respuestas abiertas que elicita. Situación
hipotética: Un estímulo condicionado clásicamente hace que un animal permanezca quieto y su respuesta instrumental es saltar hacia delante y
hacia atrás. La consecuencia es que el EC disminuirá la respuesta instrumental y saltará menos.
¿Estados emocionales centrales condicionados o expectativas específicas de recompensa?
En ciertas circunstancias los animales adquieren expectativas específicas del reforzador en lugar de un estado emocional más general de “esperanza”
durante el condicionamiento instrumental y clásico.
En los dos tipos de asociaciones que hemos visto antes (Throndike E-R y asociación E-C) no se incluía de forma directa una relación entre la respuesta
(R) y el reforzador (C).
Evidencia de asociaciones R-C: Una técnica para probar la asociación respuesta-consecuencia consiste en devaluar el reforzador después del
Relaciones R-C condicionamiento clásico para ver si esto disminuye la respuesta instrumental. La devaluación de un reforzador debilita selectivamente la respuesta
y E(R-C) en el particular que ha sido entrenada con ese reforzador.
condicionamiento Evidencia del aprendizaje de una relación jerárquica E-(R-C): Las asociaciones R-C no pueden actuar aisladamente para producir la conducta
instrumental instrumental. Se necesita un factor adicional para activar la asociación R-C. Y este factor es el estímulo (E).
2. REGULACIÓN CONDUCTUAL
Antecedentes de La teoría de la respuesta consumatoria: (Fred Sheffield)- Las respuestas consumatorias típicas de la especie (comer, beber, etc) son en sí mismas el
la regulación rasgo crítico de los reforzadores. Se consideró que las respuestas reforzadoras eran especiales porque involucraban la consumación o completamiento
conductual de una secuencia instintiva de conducta.
El principio de Premack: Las respuestas incluidas en los reforzadores comúnmente utilizados son actividades que es altamente probable que realicen
los animales (respuesta de comer en una rata privada de comida). Por el contrario las respuestas instrumentales son actividades que normalmente
ocurren a una baja probabilidad (respuesta de presionar una palanca).
“Dadas dos respuestas de diferente probabilidad, A y B, la oportunidad para realizar la respuesta de alta probabilidad A después de la respuesta de
baja probabilidad B tendrá como resultado el reforzamiento de la respuesta B. La oportunidad para realizar la respuesta B de baja probabilidad
después de la respuesta A de alta probabilidad no dará como resultado el reforzamiento de la respuesta A”
(B→ A refuerza B)
(A→B no refuerza A)
Comer reforzará la presión de la palanca porque comer es normalmente más probable que presionar la palanca. Sin embargo, la presión de la palanca
no puede reforzar el comer.
Por todo esto, el principio de Premack también recibe el nombre de principio de la probabilidad diferencial.
En resumen: El principio de Premack significó un avance importante en el pensamiento científico sobre el reforzamiento. Estimuló la consideración de
los reforzadores como respuestas más que como estímulos. Con este principio cualquier actividad podía servir como reforzador siempre y cuando
fuera más probable que la respuesta instrumental.
La Hipótesis de la privación de respuesta: (Timberlake y Allison): La restricción de la respuesta reforzadora es el factor crítico para el reforzamiento
instrumental. Incluso el acceso a una respuesta de baja probabilidad puede servir como reforzador siempre y cuando los sujetos tuvieran la restricción
de realizar esa respuesta.
Por lo tanto esto entra en conflicto con el principio de Premack al mostrar que la privación de respuesta es más básica para la motivación de la
conducta instrumental que la probabilidad diferencial de la respuesta.
Tanto la teoría de Premack como la hipótesis de la privación de respuesta sugieren que los reforzadores no existen en sentido absoluto.

lOMoARcPSD|1999571
Regulación El concepto de regulación está muy relacionado con la homeostasis. Los organismos tienen una distribución de actividades preferida que luchan por
conductual mantener frente a los cambios. Si se perturba este nivel de actividades óptimo, se supone que la conducta
y el punto de cambiará para regular la desviación.
deleite Punto de deleite conductual: Si los organismos son libres para distribuir sus respuestas entre varias alternativas, lo harán de forma en que sea más
conductual cómodo para ellos. Este punto puede identificarse mediante la frecuencia relativa de ocurrencia de todas las respuestas de un organismo en una
situación sin restricciones. (gráfico pág 205)
Imposición de una contingencia instrumental: (seguimos observando el gráfico de la 205) La contingencia consiste en un programa mediante el cual
se le pide al estudiante que estudie la misma cantidad de tiempo que dedica a ver la television. (es la línea que parte del origen con un ángulo de 45º).
Una contingencia instrumental no permite volver al punto de deleite. Sin embargo el punto de deleite conductual sigue teniendo importancia ya que
proporciona la motivación para la conducta instrumental. Volver al punto conductual sigue siendo una meta en la distribución de respuestas.
Modelo de desviación minima (Staddon): La introducción de una contingencia respuesta-reforzador provoca que los organismos redistribuyan sus
conductas entre las respuestas instrumentales y contingentes de manera que se minimice la desviación total de las dos respuestas con respecto al
punto óptimo o de deleite. (es el punto negro de la línea del gráfico de la página 205)
Explicación de los efectos del reforzamiento: El efecto de reforzamiento se identifica por un incremento en la ocurrencia de una respuesta
instrumental sobre el nivel de esa conducta en ausencia de la contingencia respuesta-reforzador. Siguiendo con el ejemplo del estudiante, para
acercarse al punto de deleite conductual, el estudiante tiene que aumentar su estudio para obtener más oportunidad de ver la television. Y al
aumentar el estudio se produce el reforzamiento que es lo que buscamos.
Una vision sobre las contingencias de reforzamiento en un contexto conductual más amplio: El contexto también influye en todo esto ya que las
contingencias instrumentales no suceden en un vacío, ocurren en un contexto en el que se puden dar una variedad de respuestas y reforzadores. Si el
estudiante prefiere escuchar la radio en lugar de ver la TV, no aumentará su conducta de estudio como para conseguir su cantidad de tiempo
preferida de TV. Y ahora nos van a relacionar todo esto con la economía…
Conceptos “La economía es el estudio de la distribución de la conducta dentro de un sistema de restricciones”
económicos Economía: Las restricciones de la conducta se imponen por los ingresos de un individuo y el precio de los bienes que se quiere obtener.
y distribución de Psicología: En las situaciones de condicionamiento instrumental, las restricciones están proporcionadas por el número de respuestas que un
respuesta organismo es capaz de realizar y el número de respuestas requerido para obtener el reforzador.
Demanda del consumidor: Es fundamental la relación entre el precio de una comodidad y cuánto se obtiene, esto se denomina curva de la demanda
Elasticidad de la demanda: Grado en el cual el precio influye en el consumo. La demanda de caramelos es mu elástica, quiere decir que conforme más
suba el precio de los caramelos más descenderá su compra. (gráfico pág 209)
¿Y cómo relacionamos todo esto con el reforzamiento instrumental?: ESTABLECIENDO ANALOGÍAS.
- El número de respuestas (o tiempo dedicado a responder) es el dinero.
- El “precio” de un reforzador es el tiempo o número de respuestas requeridas para obtener (adquirir) el reforzador.
La meta es comprender cómo la conducta instrumental (gasto) está controlada por las contingencias instrumentales (precios).
Determinantes de la elasticidad de la demanda: Existen 3 factores que influyen en cómo las restricciones de un programa moldean la redistribución
de la conducta:
1. Disponibilidad de sustitutos: El grado en que los aumentos en el precio de un artículo producen una disminución en el consumo depende de la
disponibilidad (y precio) de otros bienes que puedan utilizarse en sustitución del artículo original. La disponibilidad de sustitutos aumenta la
sensibilidad del artículo original a los precios altos. Si algo aumenta de precio y yo tengo una alternativa, dejaré de comprarlo rápidamente y adquiriré
la segunda alternativa. (el café es sustituto del te ya que ambos contienen cafeina).

lOMoARcPSD|1999571
- Economía abierta: A los animales se les da comida fuera de las sesiones experimentales
- Economía cerrada: Los animales no reciben alimentación suplementaria.
2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en
precios altos. En un rango de precios bajos, la demanda de comida no es elástica. (no olvidemos que cuando hablamos de precio nos estamos
refiriendo al número de respuestas para obtener un reforzador).
3. Nivel de ingresos: Cuanto más salario, menos se desanimará un consumidor con los incrementos del precio. Extrapolando esto a los programas de
reforzamiento, el número de respuestas o el tiempo disponible para responder corresponde a los ingresos, por lo tanto cuantas más respuestas o
tiempo tengan disponibles los animales, menos estará su conducta influida por los aumentos en el coste del reforzador.
Problemas con las - El punto de deleite es una característica molar de la conducta. Se basa en una medida de cada respuesta acumulada a lo largo de un bloque temporal
aproximaciones amplio.
de En el ejemplo del niño que estudiaba y veía TV, el punto de deleite lo podía haber alcanzado viendo todo el tiempo la TV antes de estudiar o
regulación alternando ambas respuestas.
conductual Desde la aproximación punto de deleite conductual no importa que estrategia utilizara, sin embargo sí que es importante desde el punto de deleite
molar.
- Otro problema es que las respuestas durante un período de línea de base libre no siempre tienen el mismo valor como respuestas que ocurren como
parte de una contingencia instrumental impuesta. Es decir, debemos asumir que estudiar en ausencia de una restricción de respuesta impuesta
externamente tiene que tener el mismo valor que estudiar para obtener acceso a la TV. Sin embargo esto es incorrecto, correr por placer es diferente
que cuando se requiere por una contingencia instrumental impuesta (correr en una clase de gymnasia).
- La regulación conductual no estudia los procesos conductuales moleculares, por lo tanto no dice nada acerca de cómo los organismos defienden una
combinación preferida de bienes o actividades.
Contribuciones de 1. La regulación conductual y el principio de Premack nos alejó de la consideración de los reforzadores como tipos especiales de estímulos o como
la regulación tipos especiales de respuestas.
conductual 2. Los procedimiento de condicionamiento instrumental ya no se considera que “estampan” o “fortalecen” la conducta instrumental, en su lugar es
visto como una nueva distribución de respuestas.
3. No existe una distinción fundamental entre las respuestas instrumentales y las reforzadoras. Se distinguen únicamente por los papeles asignados a
ellas mediante un procedimiento de condicionamiento instrumental.
4. La regulación conductual y la economía conductual aceptan la idea de que los organismos responden para maximizar sus beneficios
5. La regulación conductual y la economía conductual han proporcionado caminos nuevos para describir las restricciones que imponen varios
procedimientos de condicionamiento instrumental en el repertorio de conducta de un organismo.

lOMoARcPSD|1999571
3. COMENTARIOS FINALES
En este apartado se realiza una comparación a nivel general entre el punto 1 y el 2 de este tema, es decir, la estructura asociativa y la regulación conductual.
Características propias de cada teoría que no comparte con la otra
Asociacionismo
- Concepto de asociación
- Exploración de los circuitos neuronales
- Nivel molecular: El objetivo son los estímulos específicos, las respuestas y sus conexiones.
- Está relacionada con procesos específicos (asociaciones E-R, E-C, R-C, etc)
Regulación conductual
- Concepto de regulación conductual (puntos de deleite y restricciones del programa)
- Poca aplicación neurológica
- Nivel molar de agregados de conducta.
- Está relacionada con metas a largo plazo

lOMoARcPSD|1999571
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO
1. IDENTIFICACIÓN Y MEDIDA DEL CONTROL POR EL ESTÍMULO
¿Cómo podemos afirmar que una respuesta instrumental está bajo el control de ciertos estímulos?
Respuesta Experimento en palomas: Reforzamiento consistente en picotear un triángulo rojo con fondo rojo. Cuando la paloma aprendió a picotear de forma
diferencial estable el triángulo con fondo rojo se separaron los estímulos (por un lado el triángulo y por otro el fondo rojo) y se midió la respuesta en cada uno de
y discriminación ellos. El resultado fue que picoteaba mucho más el fondo rojo que el triángulo. Por lo tanto decimos que el fondo rojo controla la conducta de picoteo
de estímulos mejor que el triángulo.
Otro concepto importante aquí es el de discriminación de estímulos: Un organismo muestra discriminación de estímulos si responde de forma
diferente a dos o más estímulos.
Generalización Se dice que un organismo muestra generalización de estímulos si responde de forma similar a dos o más estímulos (semejantes)
de estímulos Gradiente de generalización de estímulos: Experimento en Palomas: Picoteaban una tecla de 580nm de longitud de onda, se demostró que ante
variaciones de la longitud entre 570 y 590 seguían respondiendo de la misma forma. El intervalo donde se generalizan las respuestas (570-590) es lo
que se conoce como gradiente de generalización del estímulo.
Los gradientes de Los gradientes facilitan información acerca del grado de sensibilidad de la conducta de un organismo ante la variación de un aspecto particular del
generalización ambiente. Los investigadores pueden determinar exactamente el grado en que tiene que modificarse un estímulo para producir un cambio en la
del conducta.
estímulo como - Si un gradiente es muy plano (gráfico pág 222) quiere decir que el rasgo que se varía en la prueba de generalización no controla la conducta
medidas del instrumental.
control - Por el contrario, si el gradiente es muy acusado (gráfico 221) quiere decir que el organismo responde en mayor medida a algunos estímulos de prueba
por el estímulo que a otros.
Resumiendo: “Lo acusado del gradiente de generalización de un estímulo proporciona una medida precisa del grado de control del estímulo”. La
generalización y la respuesta diferencial son fenómenos opuestos.

lOMoARcPSD|1999571
2. FACTORES DEL ESTÍMULO Y LA RESPUESTA EN EL CONTROL POR EL ESTÍMULO
Capacidad La capacidad sensorial y de orientación determinan qué estímulos se incluyen en el mundo sensorial de un organismo. Lo que esté fuera de su rango
sensorial sensorial no existe para un organismo (los seres humanos no podemos oir los ultrasonidos, sin embargo los perros sí)
y orientación
Facilidad relativa Aparte de tener la capacidad sensorial, la intensidad con que los organismos aprenden sobre un estímulo depende de la facilidad relativa de
del condicionamiento de otras claves presentes en la situación. Esto se conoce como ensombrecimiento. Ejemplo de un niño que aprende a leer viendo
condicionamiento los dibujos de un libro ignorando las frases. Luego al ir describiendo los dibujos parecerá que está leyendo cuando en realidad no es así.
de varios Cuanto más intenso sea el estímulo, más rápido se condicionará y ensombrecerá el aprendizaje del estímulo más débil.
estímulos
Tipos de Es más probable que ciertos tipos de estímulos adquieran control sobre la conducta instrumental con reforzamiento positivo que con reforzamiento
reforzamiento negativo.
Ejemplo en Palomas
- Reforzamiento positivo (comida) con tono y luz roja: Respondieron más a la luz roja
- Reforzamiento negativo (descarga) con tono y luz roja: Respondieron más al tono
Esto se puede explicar por los sistemas de conducta que se activan en cada caso. En el caso de la alimentación las claves visuales son más dominantes
(luz roja) mientras que en el caso de evitar el peligro son más importantes los tonos (el animal oye a un depredador
acercarse)
Por lo tanto, para una misma combinación de estímulos se pueden dar respuestas diferentes dependiendo del tipo de condicionamiento empleado,
debido al sistema de conducta que se activa en cada caso.
Tipos de Otro factor importante es el tipo de respuesta requerida para el refozamiento. En un experimento con perros se demostró que las respuestas que se
respuesta diferencian por la localización (levantar la para derecha/levantar la pata izquierda) es más probable que estén bajo el control de la característica
instrumental especial de las claves auditivas. Por el contrario las respuestas que se diferencian por la naturaleza (hacer/no hacer) es más probable que
lleguen a estar bajo el control de la naturaleza de la clave auditiva. páginas 226-228
A todo este fenómeno lo llamamos: efecto de la naturaleza-localización
El efecto de naturaleza-localización es un ejemplo de asociación selectiva. Hay otros ejemplos de asociación selectiva:
Claves relacionadas con el sabor – Asociadas con la enfermedad
Claves audiovisuales – Asociadas con descarga eléctrica
Elementos del Aproximación elemental del estímulo: Los distintos elementos que forman un estímulo (localización, color, sonido, etc) son tratados por el organismo
estímulo frente como rasgos distintivos y sepadados del ambiente.
a claves Aproximación de la clave configuracional: (es lo contrario a lo anterior): Los estímulos son percibidos como un todo integral y no se dividen en partes
configuracionales más pequeñas.
en los estímulos Aunque parezcan aproximaciones opuestas, se han elaborado teorías para unificarlas. Se piensa que en ciertas circunstancias predomina el control
compuestos elemental mientras que en otras condiciones predomina el control de las características configuracionales.

lOMoARcPSD|1999571
3. FACTORES DE APRENDIZAJE EN EL CONTROL POR EL ESTÍMULO

El hecho de que ciertos estímulos puedan percibirse no asegura que llegarán a controlar la conducta. Para que ciertos estímulo lleguen a controlar la conducta, también
depende de lo que el organismo haya aprendido de ellos.
Pavlov: La generalización del estímulo se da porque el aprendizaje sobre el EC llega a tranferirse a otros estímulos.
Lashley y Wade (contrarios a Pavlov): La generalización del estímulo ocurre si los organismos no han aprendido a distinguir las diferencias entre estímulos. Por lo tanto la
generalización del estímulo refleja ausencia de aprendizaje.
Entrenamiento Los participantes se exponen a dos estímulos diferentes (luz roja y otra verde) pero solo se les refuerza en uno de los dos colores. Figura 8.7 pág 231
en El estímulo que señala disponibilidad de reforzamiento se denomina E+ o ED (e de)
discriminación El estímuo que señala la falta de reforzamiento se denomina E- o EΔ (e delta)
de A medida que progresa el entrenamiento, la respuesta de los organismos en presencia de E+ aumenta mientras que la respuesta en presencia de E-
estímulos declina. Cuando tanto E+ como E- han adquirido control sobre la conducta del organismo, se llaman estímulos discriminativos.
Programa múltiple de reforzamiento: el procedimiento de la figura 8.7 es un ejemplo de este tipo de programa. En un programa múltiple funcionan
diferentes programas de reforzamiento en presencia de diferentes estímulos.
Efectos del Para poder hacernos una idea de la precisión de control que el E+ adquiere sobre la conducta instrumental no basta con solamente observar la
entrenamiento respuesta diferencial ante E+ y E-. Se debe también determinar lo acusado del gradiente de generalización.
en Varios experimentos realizados por Jenkins y Harrison aportaron las siguientes conclusiones:
discriminación - El entrenamiento en discriminación aumenta el control por el estímulo de la conducta instrumental
sobre el control - Una dimensión particular del estímulo (como la frecuencia tonal) es más probable que adquiera control sobre la respuesta si el E+ y el E- difieren a lo
por el estímulo largo de la dimensión del estímulo
Rango de Los procedimientos de discriminación pueden ser utilzados para situar la conducta instrumental de un organismo bajo el control de una amplia variedad
posibles de estímulos
Estímulos Estos procedimientos se utilizan a menudo para evaluar la capacidad sensorial de los animales.
discriminativos
Tenemos un E+ (luz roja) y un E- (tono intenso)
Un organismo puede aprender 3 cosas diferentes con prácticamente los mismos resultados:
1- Responder sólo ante la presencia de E+ y no aprender nada acerca de E-
2- Aprender a suprimir la respuesta durante E- pero no aprender nada acerca del E+
¿Qué se 3- Aprender el significado tanto de E+ como de E-: teoría de Spence del aprendizaje de discriminación
aprende Se basa en la tercera opción que acabamos de ver.
en el La mera observación de que los organismos responden más al E+ que al E- no es suficiente para probar que han aprendido algo acerca de ambos
entrenamiento estímulos. Por lo tanto haremos experimentos donde utilizaremos los gradientes de generalización del estímulo.
por Gradiente de generalización del estímulo excitatorio: Si se ha condicionado una tendencia excitatoria al E+, debe observarse un gradiente de
discriminación? generalización acusado con la mayor cantidad de respuesta ante el E+.
Gradiente de generalización del estímulo inhibitorio: Si se ha condicionado una tendencia inhibitoria al E-, entonces los estímulos que difieran
progresivamente del E- deberían ser cada vez menos efectivos en inhibir la respuesta instrumental.
Algunos experimentos relacionados con esto muestran que el entrenamiento en discriminación puede producir tanto condicionamiento excitatorio al E+
como condicionamiento inhibitorio al E-.

lOMoARcPSD|1999571
Lo que aprende el sujeto sobre el E+ puede influir en la respuesta al E- y viceversa, sobre todo si ambos se encuentran relacionados de alguna manera.
Discriminación intradimensional: Se produce cuando el E+ y el E- son semejantes excepto por un rasgo o atributo. La discriminación intradimensional es
una forma de ejecución experta.
Por ejemplo, si entrenamos una luz de 500 nm como E+ y una luz de 600 nm como E-, y luego presentamos 4 luces de 450, 490, 590 y 650 nm cómo
Interacciones estímulos de prueba. El máximo de respuesta no se emite ante la luz de 490 nm (que es valor más parecido al E+ original: 500 nm), sino ante un valor
entre distinto en dirección opuesta al E-, en este caso: 450 nm.
el E+ y el E-: Explicación de Spence del desplazamiento del máximo: La explicación de Spence a este fenómeno se basa en la interacción en forma de superposición
desplazamiento matemática de los valores absolutos de los E+ y E- originales. En otras palabras, Spence considera que, independientemente de los estímulos que se
del máximo presenten en la prueba de generalización, es posible calcular el valor del rasgo del estímulo hacia el que va a desplazarse el máximo de respuestas
atendiendo exclusivamente a los valores netos de los E+ y E- originales. Por ejemplo, si el E+ es una luz de 100 nm y el E- una luz de 50 nm, puede
deducirse que el máximo de respuesta se emitirá ante una luz de 150 nm, independientemente del valor que tengan en ese rasgo los estímulos de
prueba que se presenten.
Explicaciones alternativas del desplazamiento del máximo: La explicación alternativa asume que los organismos aprenden a responder a un estímulo
basándose en la relación de ese estímulo con otras claves de la situación
Entrenamiento De la misma forma que el entrenamiento en discriminación potencia la respuesta diferencial, el entrenamiento en equivalencia potencia la respuesta
de generalizada o equivalencia de estímulos.
equivalencia El emparejamiento de estímulos diferentes con la misma consecuencia crea equivalencia funcional entre esos estímulos con la consecuencia de que una
de estímulos respuesta condicionada a uno de ellos se generalizará a los otros.
Se dice que existe una clase de equivalencia si sus miembros poseen 3 propiedades matemáticas:
1) Reflexividad o igualdad (A=A, B=B, C=C)
2) Simetría (si A lleva a B, diremos que también B lleva a A)
3) Transitividad (Si A lleva a B y B lleva a C, diremos que A lleva a C)
4. CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES
Estímulo discreto: Aquel que se presenta durante un breve período de tiempo y tiene un comienzo y un final claros.
Sin embargo los estímulos discretos suceden en presencia de un fondo de claves contextuales que también pueden proporcionar una fuente importante de información
acerca de la conducta aprendida.
Las claves contextuales pueden llegar a controlar la conducta de varias formas.
En un experimento con codornices macho, mostraban predilección por contextos en los que previamente se les habían presentado una hembra
sexualmente receptiva. Por lo tanto las asociación de claves contextuales con el reforzamiento sexual aumentó la preferencia por estas claves.
Control por Este experimento muestra que las claves contextuales pueden llegar a controlar la conducta si sirven como señal para un EI o un reforzador.
claves Entonces…¿Sirven las claves conductuales para controlar la conducta cuando no señalan ningún reforzamiento, sino que simplemente son estímulos de
contextuales fondo?
En varios experimentos se concluyó que efectivamente las claves contextuales (sin reforzador) también pueden llegar a controlar la conducta
instrumental. Además el control contextual por el estímulo puede ocurrir sin que un contexto esté más fuertemente asociado con el reforzamiento que
otro.

lOMoARcPSD|1999571
Control de las Relaciones binarias: Son las relaciones entre dos eventos (un EC y un EI)
relaciones Modulador: En ciertas circunstancias la naturaleza de una relación binaria está determinada por un tercer suceso llamado modulador.
condicionales Relación condicional: Es la relación de un modulador con la relación binaria que señala.
Control condicional en el condicionamiento pavloviano: El concepto fundamental del control condicional es que un evento señala la relación entre otros
dos eventos.
Ejemplo con EC (luz naranja) y la presentación de comida (EI)
Establecer una relación condicional requiere introducir un tercer suceso (modulador) que indica cuándo la presentación de luz en la tecla terminará con
comida. Podría ser un estímulo auditivo. Los resultados muestras que los pájaros picoteaban la tecla naranja mucho más cuando se presentaba después
de la presentación del modulador que cuando se presentaba como un elemento aislado. Por lo tanto la presencia del modulador facilita la respuesta al
EC de la luz de la tecla.
Un estímulo discriminativo facilita la respuesta instrumental mientras que el modulador facilita la respuesta elicitada por el EC.
Estímulos discriminativos: Reciben este nombre los moduladores (E+ y E-) en los procedimientos de discriminación instrumental.
Otras terminologías:
(En el condicionamiento pavloviano)
Facilitación: Es otro nombre con el que se conoce al control condicional de la respuesta, debido a que el modulador facilita la respuesta al EC.
Facilitador: Otro nombre con el que se conoce al modulador.
(en el condicionamiento clásico)
Establecimiento de la ocasión: lo mismo que facilitación
Establecedor de la ocasión: lo mismo que facilitador
Distinción entre la excitación y la modulación
- La extinción es un procedimiento en el cual un estímulo previamente condicionado se presenta repetidamente pero se omite el EI. El resultado típico de
la extinción es que disminuye la respuesta condicionada.
La diferencia en los efectos de un procedimiento de extinción sobre los estímulos condicionados excitatorios y los establecedores de la ocasión está
relacionada con lo que se señala en cada uno de los procedimientos (y aquí es donde encontramos la distinción):
- Un estímulo condicionado excitatorio señala la próxima presentación del EI. La ausencia del EI después de la presentación del EC durante la extinción es
una violación de esa expectativa. Por lo tanto el valor como señal del EC tiene que reajustarse en la extinción para estar en consonancia con la nueva
realidad. Un reajuste como éste no se requiere en un procedimiento de extinción de un establecedor de la ocasión.
Por otro lado…
- Un establecedor de la ocasión señala una relación entre un EC y un EI. La ausencia del EI cuando se presenta el establecedor de la ocasión (o
modulador) por sí solo durante la extinción no significa que la relación entre el EC y el EI haya cambiado. En consecuencia la habilidad del modulador para
promover la respuesta elicitada por el EC permanece intacta durante la extinción.
Modulación frente a condicionamiento configuracional: Antes veíamos un experimento con modulador (sonido) junto a un EC (luz naranja) y un EI
(presetnación de comida). Para que el sonido sirva como una señal de que la luz de la tecla se emparejará con la comida, el sonido y la luz de la tecla
tiene que ser tratados como elementos independientes más que como una clave configuracional combinada. Por tanto, los efectos modulatorios
requieren la respuesta al compuesto estimular como constituido por elementos independientes estimulares.
Compuesto serial: Para promover que los organismos traten los compuestos estimulares como construidos por elementos independientes, los
investigadores presentan los elementos uno tras otro, en lugar de simultáneamente.

lOMoARcPSD|1999571
CAPITULO 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA
La extinción implica la omisión del EI o reforzador.

- Extinción en el condicionamiento clásico: incluye presentaciones repetidas del
estímulo condicionado por sí solo.
- Extinción en el condicionamiento instrumental: Implica no volver a presentar el
reforzador como una consecuencia de la respuesta instrumental.
El resultado es que la respuesta condicionada (ya sea clásica o instrumental) disminuye.
Por ello se piensa que la extinción es lo contrario a la adquisición (como en el Modelo de
Rescorla y Wagner) sin embargo esto es incorrecto.
Diferencia entre extinción y olvido
Extinción: Se produce por la omisión del EI que sigue a las presentaciones del EC o la
omisión del reforzador que sigue a la respuesta instrumental.
Olvido: Disminución de la respuesta condicionada que se da con el paso del tiempo.
1. EFECTO DE LOS PROCEDIMIENTOS DE EXTINCIÓN
- La respuesta disminuye cuando no vuelve a producir reforzamiento

- Además la variabilidad de la respuesta aumenta (si la llave de mi casa un día no
abre la puerta intentaré introducirle de distintas maneras a ver si lo consigo)
Estos efectos se muestran en un experimento con ratas en el que la extinción produjo una
disminución en el número de secuencias de respuesta que los sujetos realizaban pero
aumentó la variabilidad de esas secuencias. Sin embargo es importante señalar que aparte
de la variabilidad de respuestas también seguía dándose la respuesta inicial previa a la
extinción, por lo tanto podemos decir que la estructura básica de la conducta instrumental
se altera muy poco por el hecho de introducir la extinción.
Por lo tanto: La extinción disminuye la tasa de respuesta e incrementa la variabilidad de
respuesta, pero no altera de otro modo la estructura de la conducta.
Además de estos efectos podemos encontrar otros efectos emocionales como
consecuencia de la extinción:
Frustración: Reacción emocional inducida por la falta de un reforzador esperado. Puede
derivar en agresión.
2. EXTINCIÓN Y APRENDIZAJE ORIGINAL
Recuperación espontánea tras el condicionamiento pavloviano: El efecto de la extinción se pierde con el tiempo. Por lo tanto la respuesta
condicionada volverá a estar presente si el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción.
Recuperación Recuperación espontánea tras el condicionamiento instrumental: En un experimento con ratas se demostró que la respuesta cuya recuperación se
espontánea comprobó tras un período de descanso posterior a la extinción (R-Descanso) se dio a una tasa mucho más alta que la respuesta cuya recuperación se
midió sin un período de descanso posterior a la extinción (R-No descanso).
Por lo tanto: La introducción de un período de descanso tras la extinción produjo una recuperación sustancial en la respuesta.

lOMoARcPSD|1999571
Renovación: Se refiere a la recuperación de la ejecución propia de la adquisición que se da cuando se cambian las claves contextuales que estaban
presentes durante la extinción.
En un experimento con ratas se comprobó que un miedo condicionado y posteriormente extinguido se renovava cuando se retiraba al grupo de ratas
del nuevo contexto y se volvía a introducir en el contexto original de aprendizaje.
Por lo tanto: El hecho de que el miedo condicionado se renovara, indica que la pérdida de supresión durante la fase de extinción no refleja
Renovación del desaprendizaje de la respuesta de miedo condicionado.
condicionamiento La renovación también puede darse si el sujeto se retira del contexto de adquisición a un contexto alternativo que no es el de la adquisición original.
excitatorio Sin embargo en este caso la renovación no es tan sólida como cuando se lleva al contexto original.
original Otra explicación de la renovación: propiedades excitatorias condicionadas del contexto de renovación:
1) Contexto A: Adquisición original
2) Contexto B. Extinción
3) Vuelta al contexto A que tiene propiedades excitatorias ya que es ahí donde se produjo la adquisición.
Sin embargo algunos experimentos han demostrado que esto no es así
Implicación en la terapia de conducta: Aunque un procedimiento terapeútico sea efectivo extinguiendo una fobia en la seguridad de una sala de
consulta del terapeuta, el miedo condicionado puede volver a presentarse cuando el paciente se enfrente con un EC de miedo en un contexto
diferente.
Restauración
de la ejecución Como ya hemos visto antes: La renovación reactiva una conducta aprendida previamente mediante el cambio del contexto a condiciones más
propia de aproximadas a las presentes cuando la conducta se adquirió con anterioridad.
la extinción De la misma forma que recuperamos la respuesta original, también podemos recuperar la respuesta de la extinción, (osea la “no respuesta”) Esto tiene
mucho que ver con la recuperación espontánea ya que la conducta propia de la extinción puede restaurarse (contrarrestando la recuperación
espontánea) presentando las claves que estaban presentes durante la fase de extinción.
Restablecimiento: Procedimiento que sirve para restaurar la respuesta a un estímulo condicionado extinguido.
Ejemplo con patatas fritas: Si cojo aversión a las patatas fritas porque me puse enfermo en un viaje tras comerlas, la aversión se extinguirá comiendo
patatas fritas en varias ocasiones sin caer enfermo. Sin embargo, el fenómeno del restablecimiento sugiere que si se cae enfermo otra vez por alguna
Restablecimiento razón, la aversión a las patatas fritas podría reaparecer aunque la enfermedad no tuviera nada que ver con ellas.
de la excitación Al igual que ocurría con el efecto de renovación, es importante considerar si el efecto del restablecimiento puede ser un resultado del
condicionada condicionamiento contextual. El condicionamiento contextual es un posible factor contribuyente debido a que las presentaciones del EI que se dan
durante la fase de restablecimiento pueden producir un condicionamiento de las claves contextuales de la situación experimental.
Diversos estudios han demostrado que el papel del contexto en estos casos es suprimir la ambigüedad de significado de un estímulo que tiene una
historia mezclada de condicionamiento y extinción. El contexto tiene un efecto pequeño en los estímulos que tienen una historia sólo de
condicionamiento.
En realidad se considera el restablecimiento como una forma de renovación: las claves contextuales condicionadas proporcionan algunas de las claves
contextuales para la respuesta excitatoria en circunstancias normales. Estas claves contextuales se extinguen cuando se presenta el EC por sí solo
durante la extinción.

lOMoARcPSD|1999571
Sensibilidad En una contingencia operante (instrumental), el procedimiento de devaluación de un reforzador consiste en asociar de forma pavloviana el estímulo
a la devaluación que se está usando para reforzar una conducta (comida, por ejemplo) con algún otro estímulo de naturaleza inversa, es decir, aversivo (cloruro de litio,
del reforzador por ejemplo). El efecto resultante es una disminución de la respuesta operante que ha sido reforzada con el reforzador devaluado aunque ésta
respuesta nunca haya sido contingente con el estímulo aversivo, ni siquiera con el reforzador tras el proceso de devaluación.
En una contingencia clásica (pavloviana, respondiente), el procedimiento es muy similar y consiste en asociar el EI (con el que se estaba
condicionando el EC) con otro EI de naturaleza inversa. De nuevo, el efecto encontrado es una disminución de la RC ante el EC, aunque el EC nunca se
haya relacionado directamente con el EI aversivo.
Lo relevante para el capítulo que nos ocupa (Extinción de la conducta condicionada) es que este efecto (el de la devaluación del reforzador) se observa
también en estímulos (en el caso del condicionamiento clásico) y respuestas (en el caso del condicionamiento operante) que han sido sometidas a
procedimientos de extinción. Es decir, que después de extinguir un EC, por ejemplo, si devaluamos el EI con el que se condicionó, la RC ante ese EC
será todavía menor que si simplemente lo hubiésemos extinguido.
Este fenómeno se usa como evidencia para defender que los procesos de extinción no eliminan las asociaciones realizadas durante el
condicionamiento. Es decir, que las asociaciones establecidas (EC-EI o R-Er) durante el aprendizaje no desaparecen durante la extinción, aunque el
sujeto no emita la RC o la R.

Apuntes Capitulo1 9 Psicologia Del Aprendizaje

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Apuntes Capitulo1 9 Psicologia Del Aprendizaje

Diunggah oleh

Hak Cipta:

Format Tersedia

lOMoARcPSD|1999571

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

D) ASPECTOS METODOLÓGICOS DEL ESTUDIO DEL APRENDIZAJE

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

La Elementos de la perspectiva de proceso general Implicaciones metodológicas de la perspectiva de proceso general

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Alternativas a la investigación con animales

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

CAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

LA NATURALEZA DE LA CONDUCTA ELICITADA

El concepto Un reflejo se compone de dos elementos: un estímulo elicitante y su correspondiente

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

EFECTOS DE LA ESTIMULACIÓN REPETIDA

Efecto de habituación: Disminución de la tendencia a responder producido por la estimulación repetida.

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Implicaciones de la teoría del proceso dual

CARACTERÍSTICAS DE LA HABITUACIÓN Y SENSIBILIZACIÓN

1. Curso temporal Curso temporal de sensibilización Curso temporal de la habituación

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

APLICACIÓN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

CAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

LOS PRIMEROS AÑOS DEL CONDICIONAMIENTO CLÁSICO

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Este tipo de condicionamiento pretende predecir la ausencia del estímulo incondicionado.

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

CAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

¿A QUÉ DEBEN SU EFICACIA LOS ESTÍMULOS CONDICIONADOS E INCONDICIONADOS?

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

La medición del aprendizaje se hacía midiendo la supresión de volver a beber.

Hipótesis 2: Enfermar tras tomar un alimento en mal estado

¿QUÉ DETERMINA LA NATURALEZA DE LA RESPUESTA CONDICIONADA?

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

¿CÓMO SE ASOCIAN LOS ESTÍMULOS CONDICIONADO E INCONDICIONADO?

Si tenemos dos estímulo A y B y emparejamos fuertemente el estímulo A con un EI,

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS

PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INSTRUMENTAL

APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO INSTRUMENTAL

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL

- Estimulo apetitivo: Una consecuencia placentera.

Y ahora los 4 procedimientos:

NOMBRE DEL CONTINGENCIA RESPUESTA-CONSECUENCIA RESULTADO

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO INSTRUMENTAL

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

2. El Cantidad y naturaleza del reforzador

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

retroalimentación de la respuesta. Hay dos:

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Su distribución está prohibida | Descargado por Manuel Lu (mislunas2010@gmail.com)

Se puede medir de varias formas: