Esquemas Llanos

ANTECENDENTES HISTRICOS DE LA PSICOLOGA DEL APRENDIZAJE Llanos Mern.
Psicologa del aprendizaje
APROXIMACIONES TERICAS Y FILOSFICAS AL ESTUDIO DEL APRENDIZAJE CONSOLIDACIN DE LA PSICOLOGA DEL APRENDIZAJE COMO CIENCIA
EXPERIMENTAL
Origen en la filosofa griega.
Los elementos del pensamiento estn entendan los fenmenos mentales en base a unidades
relacionados entre s por simples reglas de Siglo XIX: discretas (corpsculos) que interaccionaban entre s.
Asociacionismo conexin. fundadores Contigidad como principio explicativo fundamental (la
Aristteles: 3 principios de asociacin: de la interaccin se daba por contacto en el tiempo). Si dos
semejanza, contraste y frecuencia contigua de Psicologa eventos sucedan repetidamente en contigidad se daba
ideas una asociacin entre ellos estmulo-respuesta.
La nica fuente de informacin acerca del Thordike: la fuerza de la asociacin E-R depende de la propia
Empirismo britnico Ley del
mundo procede de la experiencia sensorial consecuencia de la accin. El efecto de una accin acta
efecto retroactivamente para sellar la asociacin que conduce a tal
Distincin entre mente (estudiada por introspeccin) y efecto. Esta es la base del CO.
cuerpo (estudiado por las ciencias naturales). Watson: la psicologa, tal como la ve el conductista, es una
Conocimiento racional: innato, exclusivo del hombre, rama de las ciencias naturales, objetiva y experimental. Sus metas
Dualismo procedente de Dios. tericas son la prediccin y control de la conducta. La introspeccin
no forma parte de sus mtodos.
cartesiano arco reflejo: cuando un acontecimiento externo Conductis- Canon de Morgan: en ningn caso debemos interpretar una
excita un rgano sensorial se produce el movimiento
mo accin como resultado del ejercicio de una facultad superior, pero
reflejo. s puede interpretarse como resultado del ejercicio de una facultad
menos elevada en la escala psicolgica.
Hace que el concepto de arco reflejo se incorpore Positivismo filosfico: la ciencia solo puede construirse
definitivamente en la P. experimental. con hechos observables
Sechenov: la causa inicial de toda conducta radica
Dualismo La consecucin del reforzador reduce las necesidades del
siempre en la estimulacin sensorial externa, sin la cual, Hull
cartesiano organismo (impulsos) y dirige a la accin (incentivo).
no es posible el pensamiento.
Pavlov: recupera el principio de asociacin por Conducta propositiva: La conducta est determinada por
contigidad e inici el condicionamiento clsico o eventos internos que no son observables directamente, sino
pavloviano (CC). Tolman que se infieren a travs de los cambios en la conducta.
Darwin: explicacin sobre la evolucin de las especies defensor de un esquema E-E, donde el organismo no es un
basada en la seleccin natural. elemento pasivo.
Teora de la Teora del control externo: ambiente como primer Conducta operante libre: se presenta sin la intervencin
evolucin mecanismo evolutivo. de in estmulo antecedente observable.
Skinner
Funcionalismo: las estructuras y procesos moldeados La conducta se mantiene por sus consecuencias
por la evolucin tienen una funcin til para el organismo. ambientales.
Psicologa del Aprendizaje 2015-16 Llanos Mern
TEMA 2: CONDICIONAMIENTO CLSICO, FUNDAMENTOS
COMIENZOS DEL ESTUDIO DEL CC Y

NATURALEZA DE LA ASOCIACIN
Comienzos del estudio del Naturaleza de la

Condicionamiento Clsico asociacin
Pavlov (Rusia, S. XIX) aplic el mtodo CONCEPTOS BSICOS DE Asociacin estmulo- Asociacin estmulo-
cientfico al estudio de los reflejos. CONDICIONAMIENTO CLSICO: respuesta (E-R). estmulo (E-E).
Experimento estudi el Reflejos condicionados: lo que
funcionamiento del sistema digestivo de anteriormente Pavlov denomin reflejos
los perros y descubri que no slo psquicos. Postura defendida en EEUU por Postura defendida por Pavlov.
segregaban jugos gstricos con la comida Estmulo neutro (EN): el sonido en un influencia de Thorndike. Considera que lo que el perro
en la boca, sino tambin ante la visin de principio, pues no provoca ninguna Se consider que el animal asocia es el EC con el EI
la comida o de la persona que les daba respuesta aparte de la de orientacin. aprende una asociacin entre el (metrnomo con la comida), y
de comer, y a estas ltimas secreciones Estmulo condicional (EC): El EN EC y la RI, siendo la RC elicitada que la RC sera elicitada por
las denomin secreciones psquicas (sonido) que despus de su presentacin directamente por el EC. medio de la representacin del EI
por ser resultado de un reflejo qumico. junto con el EI provocar una respuesta
por el EC (el sonido representa la
Utiliz como respuesta la saliva particular (en este caso salivacin). La
comida).
producida por el perro ante los distintos respuesta provocada por EC se llama
estmulos. Pasos que se siguieron: respuesta condicional (RC).
Presentacin del sonido de un Estmulo incondicional (EI): estmulo
metrnomo en solitario (estmulo que provoca una respuesta particular sin
neutro): no produca ninguna respuesta. necesidad de entrenamiento previo (la
Presentacin del sonido seguido de la comida provoca salivacin). La respuesta
introduccin de comida en la boca del provocada por el EI se llama respuesta
animal: la comida provoca salivacin. incondicional (RI).
Tras varios ensayos de Para poner a prueba que aprendizaje se estaba dando se utiliz la
emparejamiento sonido-comida el perro devaluacin del EI: disminuir el valor del EI una vez que ya se ha
salivaba tambin ante el sonido. conseguido el CC, presentndolo en solitario numerosas veces. Esto
demostr que en la primera fase del aprendizaje de CC la asociacin es E-E.
SITUACIONES
EXPERIMENTALES
Condicionamiento Condicionamiento Seguimiento del Aprendizaje de

del miedo del parpadeo signo aversin al sabor
Watson y Rayner: los patrones de Skinner: experimento con ratas. El reflejo palpebral consiste en Seguimiento del signo o Presenta algunas
reaccin emocional de la infancia Relacion una luz (EC) con una descarga el parpadeo que se produce automoldeamiento. El primer caractersticas
solo eran miedo, ira y amor, que (EI) y midi la respuesta de miedo que cuando, por ejemplo, se acerca
experimento de este tipo lo especiales: puede
mediante CC se incrementaban. consista en paralizacin. Para medir la un objeto o un soplo de aire realizaron Brown y Jenkins llegar a adquirirse una
Experimento: condicionamiento paralizacin de la rata se ha desarrollado repentinamente a los ojos. con palomas. En l, el sujeto fuerte aversin al
del miedo en un nio de 9 meses. la tcnica respuesta emocional Este reflejo tiene lugar en se aproxima y toma contacto sabor con un solo
Los experimentadores midieron la condicionada (REC) o supresin distintas especies y su con el estmulo que seala la emparejamiento
respuesta de miedo mediante la condicionada. Para calcular en qu condicionamiento se produce disponibilidad del EI sabor-malestar;
conducta de retirada ante el medida el EC suprime la conducta se al presentar, por ejemplo, un (normalmente comida). Esta pueden transcurrir
estmulo. Hicieron sonar una barra utiliza la razn de supresin. tono (EC) antes del soplo de respuesta solo se produce si horas antes de que el
de acero detrs del nio lo que le A medida que el EC va tomando valor aire a los ojos (EI). Tras varios se empareja EC-EI. Es EI siga al EC y
produjo sobresalto y llanto. En la predictivo (el animal aprende que el EC emparejamientos EC-EI el necesario que el EC tenga una producirse
fase de condicionamiento se le va seguido de la descarga), la rata ir sujeto parpadear ante el EC localizacin precisa para que aprendizaje. Ambas
present una rata blanca, y cuando paralizndose en su presencia, por lo presentado en solitario. se produzca el seguimiento, caractersticas son
el nio estaba tocndola se haca que la escala es inversa: un mayor nivel
(experimento con conejos). pudiendo estar alejado del EI. adaptativas.
sonar la barra, lo que haca que el de condicionamiento (=mayor nivel de
nio se alejara de la rata. Tras paralizacin) es indicado por un nivel
varios emparejamientos, el nio ms bajo de razn de supresin. El nivel
haba desarrollado miedo a la rata. mximo de condicionamiento es 0.
Adems, generaliz ese miedo a
otros estmulos parecidos (ej.: Razn de supresin=
conejo blanco).
CONDICIONAMIENTO PAVLOVIANO EXCITATORIO: Se produce cuando se presenta un EC seguido de un EI. Este emparejamiento produce una RC ante la
presentacin en solitario del EC porque se ha aprendido que predice la aparicin del EI. Los EI pueden ser apetitivos (ej.: comida) o aversivos (ej.: descarga).
Procedimientos tpicos de CPE en funcin del intervalo entre estmulos (entre el

comienzo del EC y el comienzo del EI dentro de un ensayo).
Condicionamiento Condicionamiento Condicionamiento Condicionamiento

de demora de huella simultneo hacia atrs
Procedimiento de condicionamiento El EI se presenta un tiempo despus de El EC y el EI se presentan El EI se presenta antes del EC en todos
clsico en el que el EC est presente al que haya terminado el EC. Ese tiempo simultneamente en cada ensayo de los ensayos. Como despus del EC
menos hasta que aparece el EI, y en ese entre el final del EC y el inicio del EI se condicionamiento y tienen la misma viene un intervalo entre ensayos en el
momento puede continuar o terminar. llama intervalo de huella (empeora el duracin el EC no predice el EI y la que no se presenta el EI el sujeto trata
Es el ms frecuente y el que obtiene un aprendizaje a medida que aumenta el RC obtenida es ms escasa.
mejor aprendizaje. el EC como seal de no EI.
intervalo).
Ensayo de prueba: sirve para medir el grado de No todas las respuestas obtenidas son resultado de la
condicionamiento y consiste en presentar el EC sin el EI y asociacin EC-EI: respuestas pseudocondicionamiento
as asegurarnos que la respuesta que estamos midiendo es (aquellas que se producen como consecuencia de
la RC. Es esencial en los condicionamientos simultneos y procesos distintos al condicionamiento) y sensibilizacin
hacia atrs. (proceso de aprendizaje no asociativo, que se produce
Medicin de Procedimientos cuando la presentacin en solitario de un estmulo
Registro de la magnitud de la RC: cantidad de la
las RC de control produce cada vez ms respuesta).
conducta que se est dando. En la REC se registra la
cantidad de supresin de la conducta. control aleatorio: procedimiento de control. Hay
Medicin de la probabilidad de una RC registrando la cuatro tipos: EC en presencia del EI (EC-EI); EC solo (EC-no
frecuencia con la que ocurre ante el EC. EI); EI solo (no EC-EI), no presentar EC ni EI (no EC-no EI).
Medicin de la latencia de la RC (rapidez con la que Para ser ideal debe tener el mismo n de ensayos del EC y
aparece cuando se presenta el EC). del EI que el procedimiento experimental.
CONDICIONAMIENTO PAVLOVIANO INHIBITORIO: Se aprende cuando NO se va a presentar un EI. El EC indica la ausencia del EC. Puede emplearse para EI
aversivos (ej.: un EC nos indica la ausencia de descarga) o apetitivos (ej.: un EC que nos indique la ausencia de comida).
Procedimientos tpicos de CPI: para que se desarrolle inhibicin condicionada es

necesario un contexto excitatorio previo.
Procedimiento estndar de Inhibicin Desemparejamiento Casos de inhibicin

inhibicin condicionada diferencial explcito en los que el EC va
seguido del EI
Presentacin de dos tipos de ensayos Se presentan ensayos de un EC+ seguido Presentacin del EC y del EI
entremezclados aleatoriamente, uno del EI entremezclados con ensayos de separados por un periodo de tiempo Inhibicin de demora: si se utiliza
para condicionamiento excitatorio y otro un EC- sin ir seguido del EI. Los sujetos muy amplio. Es un caso concreto de un condicionamiento de demora y el
para condicionamiento inhibitorio. En el aprenden a discriminar ambos inhibicin condicionada por EC es de larga duracin el animal se
primero un EC+ es emparejado con un EI estmulos, presentan la RC ante el EC+ contingencia o correlacin negativa, comporta como si la parte inicial del
y por otro lado el EC+ se presenta junto pero no ante el EC-. en el que es menos probable que el EC marcase un periodo de ausencia
con un EC- formando un estmulo EI se presente tras el EC. del EI.
compuesto EC+EC- que no va seguido de condicionamiento de huella:
EI. Los sujetos aprenden a responder cuando el intervalo de huella es de
ante el EC+ cuando se presenta solo, y a gran tamao da lugar a un
no responder ante el EC+EC-. El EC- se ha condicionamiento inhibitorio.
convertido en seal de ausencia del EI. Sistema de respuestas bidireccionales: formados por condicionamiento hacia atrs:
respuestas que pueden variar en direcciones opuestas establece el EC como seal de
respecto a una lnea base de ejecucin normal. usencia del EI.
Prueba de estmulo compuesto o sumacin:
MEDICIN DE LA INHIBICIN presentacin conjunta del estmulo inhibitorio junto con
CONDICIONADA el excitatorio. Si el EC es inhibitorio deber reducir la RC
que se da ante el excitatorio.
Prueba del retraso en la adquisicin: si un estmulo se
ha convertido en inhibitorio, necesitar ms ensayos
para conseguir el mismo grado de excitacin que un EN.
EXTINCIN: procedimiento en el que ya no se presenta el EI tras el EC, y tras repetidas ocasiones de presentar solo el EC tiene como resultado la disminucin
o incluso desaparicin de la RC. Se denomina extincin tanto el procedimiento como el resultado obtenido.
Los siguientes fenmenos demuestran que durante la extincin no se elimina la

asociacin EC-EI, si no que se establece otra asociacin entre EC y la ausencia de EI.
Desinhibicin Recuperacin Renovacin de la Restablecimiento de la

espontnea RC excitacin condicionada
Consiste en la presentacin de un nuevo Se da si dejamos pasar un tiempo sin Surgi del estudio del papel del Ocurre si el EI se presenta en
estmulo junto con el EC durante la fase contacto con el EC y el EI tras la fase de contexto en la extincin. La solitario tras la extincin. Esto
de extincin. Si al perro, en la fase de extincin y presentamos despus el EC renovacin de la RC se da en hace que vuelva a darse la RC ante
extincin se le presenta la luz (que tiene nuevamente. La RC se recupera cualquier contexto que sea distinto al el EC en una prueba posterior.
ya condicionada la comida) y un sonido, espontneamente, aunque sea a menor que tuvo lugar la extincin. Parece
el perro vuelve a salivar. Esto demuestra nivel. que el contexto acta como una clave
que la RC se recupera en presencia de que ayuda a eliminar la ambigedad
un estmulo novedoso sin necesidad del del significado de un EC.
nuevo entrenamiento. As mismo, si queremos restaurar la
ejecucin propia de la extincin
tendremos que introducir claves
contextuales que reactiven la
memoria de la extincin.
TEMA 3: MECANISMOS ASOCIATIVOS Y TEORAS DEL CC
Caractersticas de los
estmulos
Intensidad Novedad: los estmulos novedosos provocan reacciones ms

intensas que aquellos a los que ya estamos habituados. El efecto
de la ausencia de novedad es el de preexposicin y puede ser:
Un EI o un EC intensos tienen como consecuencia una aceleracin
del aprendizaje de un procedimiento de condicionamiento y una
mayor expresin de la RC. Relacionado con este concepto est el Preexposicin al EC o inhibicin latente: Preexposicin al EI: cuando el EI se presenta
de saliencia un estmulo saliente es aqul que es ms Cuando el EC aparece repetidamente en varias veces sin asociacin previa con el EC,
perceptible o significativo que otros para ese organismo. ausencia del EI, esto retrasa la adquisicin de la deja de ser novedoso, lo que dificulta el
EC saliente: aqul que capta fcilmente la atencin, lo que lo asociacin EC-EI posterior, dificultando el aprendizaje posterior. Al igual que en la
hace propicio para ser utilizado en un procedimiento de condicionamiento. inhibicin latente, el estmulo deja de predecir
condicionamiento. Semejanza con el efecto de habituacin: en consecuencias importantes, por lo que dejamos
EI saliente: los EIs, debido a su significacin biolgica, son ambos, la falta de novedad hace que se preste de prestarle atencin.
salientes por naturaleza, pero no siempre van a ser igual menos atencin a aquellos estmulos que no Perspectiva de la interferencia asociativa: si
significativos segn el momento (un EI como la comida ser ms predicen ninguna consecuencia relevante, por lo el EC o el EI son expuestos previamente, la
saliente para un animal en ayuno que para otro que acaba de que no provocan ninguna RC. capacidad asociativa de dichos estmulos
comer). Diferencia con el efecto de habituacin: la disminuir de cara a emparejarse con estmulos
Intensificar un estmulo puede aumentar la saliencia del mismo, habituacin es una disminucin de la respuesta, nuevos. En este caso, el recuerdo de lo ocurrido
favoreciendo que el animal le preste ms atencin. Si utilizamos mientras que la inhibicin latente supone un en la fase de preexposicin interfiere sobre la
dos EI simultneamente obtenemos un condicionamiento ms retraso en el aprendizaje posterior. asociacin EC-EI.
fuerte ante el EC. A partir de cierta intensidad o saliencia no hay
variacin en el condicionamiento ni en la RC.
Ej.: Amplitud de una RC

(milmetros del
movimiento del
miembro) en grupos con
distintas intensidades de
EI (descarga; 1, 2, 3 y 4
miliamperios.
estmulos
Naturaleza: tipos y relevancia

de los estmulos
Relevancia de los
Tipos de estmulo
estmulos
El tipo de estmulo utilizado va a determinar el condicionamiento La relevancia de un EC se mide segn su pertinencia con respecto al EI. El
y la RC que va a tener lugar. condicionamiento es mejor si el EC y el EI guardan una relacin en un contexto
El condicionamiento y la RC no sern los mismos si utilizamos natural. As, en un contexto real, los animales pueden enfermar o sentir malestar
un EI apetitivo, como la comida (RC=salivacin), o uno aversivo cuando comen alimentos en mal estado, de ah que el condicionamiento entre un
como una fuente de dolo (condicionamiento de miedo). sabor (EC) y un malestar (EI) genere una RC de aversin mayor. De la misma
La modalidad sensorial del EC tambin determina en gran forma, es ms fcil que un animal sufra dao fsico (en el condicionamiento, el
medida la forma de la RC, a pesar de ser en inicio un estmulo provocado por una descarga EI) provocado por un dao externo, por ejemplo,
neutro con funcin de anticipar el EI. Distintos ECs producen un depredador, que relaciona con ciertos estmulos visuales o auditivos (ECs).
distintos tipos de RCs. Experimento: a un grupo de ratas se les Ningn EC es ms efectivo en general, slo con aquel EI con el que por
presentaba como EC un tono sonoro y a otros una luz, ambos seguidos cuestiones ambientales se combina mejor.
de comida. La forma de la RC vari segn el EC: ante el tono las ratas La explicacin terica para estos ejemplos de relevancia o pertenencia de EC
movan la cabeza mientras que ante la luz mostraban conductas como
con el EI, se centra en que el EC provoca la activacin de ciertos sistemas de
ponerse de pie.
conductas. El sistema de conducta que se activa depende del estado emocional
Tambin es importante la capacidad sensorial del animal, ya
del animal y la naturaleza del EI (ante un EI de comida, el EC activa conductas de
que no todos procesan los estmulos de la misma forma.
bsqueda; ante un EI de descarga, el EC activa conductas defensivas).
Caractersticas como la luz, color o posicin, para algunos es ms
fcil de procesar que para otros.
estmulos
Naturaleza: la fuerza biolgica. Carcter biolgico atribuible a la mayora de EI, pero no de EC, ya que tienen la
capacidad de elicitar ciertas respuestas por s solos (Ej.: un EI como comida elicita respuestas de bsqueda como Contigidad
aproximacin, ingesta o salivacin). Segn Pavlov, para que el condicionamiento tuviera lugar el EC tena que tener temporal entre
menos fuerza biolgica que el EI. Sin embargo, el condicionamiento puede darse en los siguientes casos: estmulos
Estmulos con distinta fuerza Condicionamiento de dos Condicionamiento de dos Intervalo EC-EI: la RC es ms dbil
biolgica: condicionamiento estmulos con fuerza biolgica: estmulos sin fuerza biolgica: cuando el intervalo EC-EI es mayor.
de segundo orden contracondicionamiento precondicionamiento sensorial Tambin afecta a la forma de la RC:
cuando el intervalo EC-EI es corto se
Un EC inicialmente neutro, que ha dan ms conductas de orientacin
Pavlov afirmaba inicialmente que un Si queremos que se establezca una
sido expuesto a un condicionamiento hacia el EC, mientras que si es largo
estmulo que ya tiene fuerza biolgica no asociacin entre dos estmulos neutros,
con un EI, puede a su vez hacer de EI las conductas ms probables son
puede servir como EC para un nuevo por ejemplo, un tono (EC1) y una luz (EC2),
para un nuevo condicionamiento, ya hacia el EI.
condicionamiento (si una rata haba el problema que aparece es que no
que ha adquirido una fuerza biolgica Intervalo entre ensayos (IEE): el
asociado ya una luz con una descarga, no tenemos una RC medible. Para ello, se
que no tena antes. Este efecto se condicionamiento es mejor, y por
poda asociar la misma luz con comida). establece un emparejamiento del EC1 con
denomina condicionamiento de tanto tambin la expresin de la RC,
El fenmeno de contracondicionamiento un EI en la segunda fase, lo que da lugar a
segundo orden. Se trata de un cuando los ensayos EC-EI estn
muestra que esta idea es errnea: es un una RC. Si el aprendizaje EC1-EC2 tuvo
condicionamiento de orden superior, distanciados entre s.
procedimiento que se utiliza para variar lugar en la primera fase, el EC2 provocar
lo que quiere decir que puede tener Las mejores condiciones para un
o invertir la respuesta condicionada una respuesta similar a la mostrada en la
distintos niveles. El aprendizaje ms condicionamiento se dan con
anterior utilizando un EI distinto al segunda fase. Este procedimiento se
bsico, EC-EI, corresponde a un intervalos EC-EI cortos y aislados en
utilizado previamente. denomina precondicionamiento sensorial.
condicionamiento de primer orden. el tiempo (amplio IEE).
TEMA 3: MECANISMOS ASOCIATIVOS Y TEORS DEL CC
CONTINGENCIA: concepto que se utiliza para medir el grado en que una clave o estmulo, el EC, es un buen predictor de la aparicin de otro, el EI. Las
posibles alternativas de emparejamiento entre EC-EI son 4 y se resumen en una tabla de contingencia.
Tipos de contingencia. P1= probabilidad de que se d el EI despus del EC; P0= probabilidad de que se d el EI despus de la NO
aparicin del EC; P= ndice resultante del clculo de la contingencia, puede estar entre 1 y -1.
Contingencia Contingencia Contingencia

positiva nula negativa
Si la aparicin del EC es un buen predictor del EI, el Si la probabilidad de que el EI aparezca en presencia Indica que el EC es un gran predictor de ausencia
EI debe ocurrir con ms probabilidad cuando el EC o en ausencia del EC es la misma, la contingencia del EI, pero no de su presencia. Esto implica que el
ha sido presentado previamente que en ausencia de tiene un valor numrico de 0. Esto implica, en teora, EI es menos probable en presencia del EC, lo que
este. En este caso se da un condicionamiento una ausencia total de condicionamiento. hace que ste ltimo sirva como predictor de la NO
excitatorio. P(EI|EC) = P(EI|noEC), es decir, P1=P0 aparicin del EI.
P(EI|EC) > P(EI|noEC), es decir, P1 > P0 P=0 P (EI|EC) < P(EI|noEC), es decir, P1<P0
P>0 Aunque en teora debera darse una falta de P<0
En el caso de que el EI solo ocurra en presencia condicionamiento, en la prctica tiene lugar el efecto Cuando la contingencia es negativa el
del EC y nunca en su ausencia, la contingencia ser de irrelevancia aprendida: el sujeto aprende que no condicionamiento es inhibitorio.
perfecta: P=1 (P= P(EI|EC) P(EI|noEC) = 1-0=1). hay relacin entre EC y EI lo que retrasa un posterior
aprendizaje de dicha relacin.
a: nmero de ensayos en los que habiendo aparecido el EC despus aparece el EI. S EC-S EI.
Tabla de Contingencias b: nmero de ensayos en los que habiendo aparecido el EC despus no aparece el EI. S EC- No EI.
c: nmero de ensayos en los que no habiendo aparecido el EC, despus s aparece el EI. No EC- S EI.
EI NO EI
d: nmero de ensayos en los que ninguno de los dos estmulos aparece. No EC-No EI.
EC a b La probabilidad de que se d el EI despus del EC (P1) se calcula teniendo en cuenta las veces que el
NO EC c d CI aparece despus de que lo haga el EC en funcin de todas las veces, en total, que ha aparecido el EC:
P1= P(EI|EC) = a/(a+b).
La probabilidad de que el EI tenga lugar tras la NO aparicin del EC se calcula: P0= P(EI|noEC) = c/(c+d).
El ndice resultante de este clculo de contingencia (P) = P1-P2.
FENMENOS DE COMPETICIN DE CLAVES: en estos fenmenos se da una competicin entre los distintos ECs presentes para
ser el mejor predictor del EI. As, puede ocurrir que se d una contingencia perfecta EC-EI y aun as la RC no tenga lugar.
Ensombrecimiento Bloqueo
En este experimento son dos los ECs presentes de forma simultnea. Por El bloqueo es un efecto que consta de dos fases de entrenamiento. La
ejemplo, una luz (EC1) y un sonido (EC2), que queremos condicionar con una aparicin conjunta de dos ECs igualmente contingentes con el EI determina
descarga posterior (EI) para provocar una respuesta de miedo. Aunque la la RC frente a cada uno de ellos. Inicialmente se asocia EC1-EI y cuando ste
contingencia entre EC1 y EI y entre EC2 y EI es perfecta, ambos ECs van a est completamente condicionado se aade el segundo EC2. La poca fuerza
competir para ser un mejor predictor del EI. Por eso, al aparecer juntos, EC2 de la RC ante el EC2 en la fase de prueba muestra que el aprendizaje previo
ensombrece a EC1, teniendo como consecuencia una menos RC frente al del EC1 bloquea el desarrollo de la RC ante el EC2 aadido en la segunda
EC1 con respecto a ese mismo EC en un grupo de control en el que no ha fase.
tenido lugar el Ensombrecimiento.
Fase 1 Fase 2 Prueba Resultado
Entrenamiento Prueba Resultado Experimental EC1-EI (EC1+EC2)-EI EC2? Poca RC
Gr. Experimental (EC1+EC2)-EI EC1? Poca RC Control EC1/EI (EC1+EC2)-EI EC2? RC media
Gr. Control EC1-EI EC1? Mucha RC
Hay que controlar que los grupos experimental y de control sean lo ms
este efecto puede revertirse si se lleva a cabo una recuperacin del parecidos metodolgicamente hablando, por ello se presentan los estmulos
Ensombrecimiento. Para ello, tras el Ensombrecimiento, debemos mostrarle el mismo nmero de veces en ambos grupos, pero en el caso del grupo
al sujeto que ahora el estmulo ensombrecido ya no es un buen predictor del control se presentan explcitamente desemparejados el EC1 y el EI para que
EI, con lo que conseguimos que la RC frente al EC ensombrecido aumente. no se cree la asociacin.
Si invertimos las fases de entrenamiento en un diseo de bloque, da lugar
Fase 1 Fase 2 Prueba Resultado al bloqueo hacia atrs.
Experimental (EC1+EC2)-EI EC2-no EI EC1? Mucha RC
Control (EC1+EC2)-EI --- EC1? Poca RC Fase 1 Fase 2 Prueba Resultado
Experimental (EC1+EC2)-EI EC1-EI EC2? Poca RC
Control (EC1+EC2)-EI EC1/EI EC2? RC media
TEORAS DEL APRENDIZAJE: MODELO RESCORLA-WAGNER. La principal caracterstica de este modelo es que asume que en un ensayo de condicionamiento el
aprendizaje slo tiene lugar si el EI es sorprendente. Sugiere que la fuerza asociativa entre un EC y un EI aumenta en cada ensayo, hasta que el EC predice
completamente el EI y ste deja de ser sorprendente, punto en el cual dicha fuerza alcanza su mximo posible.
Frmula principal del modelo Rescorla-Wagner y otros fenmenos del aprendizaje:
Bloqueo, extincin e inhibicin condicionada

Vn = (-Vn-1)
en el modelo Rescorla-Wagner
V es el incremento de la fuerza asociativa, n el ensayo del que la estamos Bloqueo: En la primera fase del condicionamiento, en la asociacin entre EC1 y
calculando. Puede oscilar entre valores de -1 a 1. EI, dicho EC adquiere un valor positivo a medida que transcurren los ensayos hasta
y se refiere a la saliencia del EC y el EI respectivamente, es decir, cmo llegar a la asntota del aprendizaje. Durante la segunda fase de entrenamiento, los
de significativos son. Numricamente, se puede expresar entre un mnimo de 0 ensayos continan, pero se aade el EC2 al EC1, ambos seguidos del EI. Como e
y un mximo de 1. El EI por lo general es muy significativo para el sujeto (por EC2 no se ha presentado con anterioridad, no tiene fuerza asociativa aun y su valor
ejemplo, comida) y por eso se le puede adjudicar un 1 para los clculos; al EC inicial V es 0. Es decir, las frmulas son las mismas, pero en el clculo referente a
suele tomar un valor de 0,5 al no ser tan relevante. ese segundo EC que se acaba de introducir, Vn-1 ser igual a 0 porque al ser nuevo
(lambda) es la magnitud del EI. Si llega a la perfeccin, es decir, que no hay fuerza asociativa alguna en el ensayo anterior. El modelo explica esto por la
siempre detrs del EC se presente el EI, estara a su mximo nivel, que se ausencia de sorpresa, ya que el EI ya era predicho por el EC1 de forma eficaz y, por
denomina asntota. Sus valores oscilan entre 0 y 1. Sin embargo, para los lo tanto, el EC2 no es necesario para anticipar el EI.
clculos es ms sencillo utilizar una escala de 0 a 100. Extincin: en este caso, como no hay EI alguno, es 0. La frmula del
Vn-1 es la fuerza asociativa en el ensayo anterior al que estamos calculando. incremento nos va a dar un resultado negativo, es decir, tenemos que restarle a la
Indica el aprendizaje previo sobre la relacin EC-EI llevado a cabo hasta ese fuerza asociativa que tenamos en el ensayo anterior, y como consecuencia
momento. Sus valores oscilan entre 0 y 1. En el primer ensayo es 0, en el obtendremos un valor negativo y en la grfica se va a ver una cada. Cunto ms se
segundo ensayo es la V (fuerza asociativa neta) del primero y as sucesivamente. sabe en el ensayo anterior, ms rpida es la extincin. En modelo afirma que este
Una vez que tenemos el incremento de la fuerza asociativa (V), para saber en fenmeno consiste en un desaprendizaje, lo cual no es correcto porque no se
qu nivel de fuerza asociativa se est en un ensayo concreto se calcula la fuerza ajusta a lo que se conoce como extincin.
asociativa neta con la siguiente frmula: V= Vn-1 + V. Inhibicin condicionada: en este fenmeno, un EC predice la ausencia de la
Conclusin: el incremento de la fuerza asociativa en un determinado aparicin posterior de un EI. Durante la fase de entrenamiento un EC1 es
aprendizaje (Vn) es directamente proporcional a la saliencia de ambos emparejado con un EI hasta llegar a la asntota de aprendizaje (V=1). En la segunda
estmulos ( y ) y depende de la diferencia entre el mximo de aprendizaje fase, ese mismo EC1 se empareja con el EC que va a convertirse en inhibitorio
adquirible () y la fuerza de la asociacin hasta el ensayo anterior (Vn-1). (EC2) siendo ambos seguidos de la ausencia del EI. Como consecuencia, la fuerza
asociativa del EC1 ir decreciendo hasta llegar a 0.
TEORAS DEL APRENDIZAJE:

MODELO RESCORLA-WAGNER
Problemas del modelo y ejemplo de cmo utilizar las frmulas:
Problemas del modelo Ejemplo
La extincin de la inhibicin condicionada: este modelo afirma que si se Cmo calcular la fuerza asociativa, bloqueo y extincin con los siguientes datos:
presenta repetidamente un inhibidor condicionado sin ir acompaado del EI (=0) la = 0,5 (EC)
inhibicin se extinguir. Segn este modelo, el EC anteriormente inhibidor se ir = 1 (EI)
convirtiendo en excitatorio poco a poco. Pero esto ocurre en realidad. Las = 100 (mxima fuerza asociativa EC-EI)
investigaciones muestran que no presentar el EI tras un EC inhibitorio puede Fuerza asociativa EC-EI (OJO! Nos estamos refiriendo a la fuerza asociativa
aumentar sus propiedades inhibitorias. Es posible que el error del modelo est en neta (V), no a la acumulacin; por lo que antes hay que calcular el incremento de
considerar la excitacin y la inhibicin como procesos opuestos y de signo contrario. la fuerza asociativa para aplicar la frmula V= Vn-1 + V).
Extincin de la excitacin condicionada: este modelo considera la extincin Vn = (-Vn-1) calculamos este dato y despus aplicamos la frmula de V.
como un desaprendizaje, pero no es una explicacin correcta. Fenmenos como la V = 0,5x1(100-0) = 50
V= Vn-1 + V = 50+25 = 75
recuperacin espontnea, renovacin o la reinstauracin muestran que la extincin V = 0,5x1 (100-50) = 25
no es un desaprendizaje sino un aprendizaje distinto. V = 0,5x1 (100-75) = 12,5 V = 75+12,5 = 87,5
La inhibicin latente (preexposicin al EC): para este modelo, como el EI no V = 0,5x1 (100-87,5) = 6,75 V = 87,5+6,75 = 94
aparece ni es esperado durante la fase de preexposicin al EC, no hay asociacin EC- Bloqueo: aadimos un segundo EC, que al ser nuevo no tiene fuerza asociativa
EI y el valor de V no vara, siempre es 0, por lo que no debera afectar al aprendizaje anterior, por lo que Vn-1 = 0.
en la fase de condicionamiento. Sin embargo, los datos muestran que el aprendizaje V(EC1) = 0,5 (100-94) = 3 V = 94+3 = 97
a dicho condicionamiento se ve retrasado por la previa exposicin al EC. V(EC2) = 0,5 (100-94) = 3 V = 0+3 = 3
Bloqueo: hay veces en las que se produce el efecto contrario al bloqueo, es decir, Extincin: no se presenta EI, por lo que = 0. El resultado ser negativo pues
aumenta la RC ante e EC2 presentado en conjunto con el EC1. A este fenmeno se le muestra un decremento de la fuerza asociativa.
denomina contrabloqueo o aumentacin y no puede ser explicado por el modelo V = 0,5x1 (0-87,5) = -43,7 V= 87,543,7 = 43,8
Rescorla-Wagner, segn el cual la aparicin del EC2 no produce sorpresa ninguna en
los ensayos compuestos ya que el EI era predicho con efectividad por el EC1.
OTRAS TEORAS DEL

APRENDIZAJE
Hiptesis del comparador Modelos atencionales Modelo SOP (Wagner)
Segn esta hiptesis la RC no solo depende de la Wagner sostiene que un estmulo

Teora de Teora de sorprendente tiene mejor procesamiento en
asociacin EC-EI, sino tambin del resto de
Mackinstosh Pearce-Hall nuestra MCP (memoria a corto plazo) y por lo
asociaciones que puedan establecerse entre las
claves del contexto y el EI. El sujeto en un ensayo tanto mayor probabilidad de mantenerse en
de condicionamiento aprende que: el EC y el EI nuestra MLP (memoria a largo plazo). Dentro
estn asociados, y que las claves contextuales y Este modelo sostiene que los de nuestro sistema de procesamiento de la
Esta teora afirma que, en un
el EI tambin lo estn. animales ignoran los estmulos informacin, un estmulo nos resulta
contexto de aprendizaje, no
Si la fuerza asociativa EC-EI es mayor que predictores redundantes. Tiene sorprendente si no est ya presente en
debemos malgastar recursos
aquella que presenta la asociacin entre las como base la idea de que la nuestra MCP.
prestando atencin a estmulos
claves contextuales y la EI; la RC tendr lugar atencin que se presta a un EC Este modelo representa el condicionamiento
que conocemos bien, pero, sin
(contingencia positiva). depende de lo efectivo que sea utilizando nodos y redes neuronales. Wagner
embargo, s debemos prestar
Si la asociacin EC-EI es ms dbil que la dicho EC prediciendo el EI. Cuanto asume que el condicionamiento da lugar a
atencin a aquellos que todava no
asociacin entre las claves del contexto y el EI mejor predictor sea, mayor una asociacin entre la representacin
controlamos con seguridad. As,
no se mostrar la RC esperada ante el EC. Ocurre atencin le prestaremos. Tambin (denominada nodo) del EC y la del EI. Las
prestaremos cada vez menos
porque el animal percibe como mayor la depende dicha atencin del resto asociaciones entre nodos se conocen como
atencin a un EC en la medida en
probabilidad del EI en presencia del contexto y de los ECs: si nuestro EC no es conexiones. Los nodos del EC y el EI se activan
que con cada ensayo se convierta
no del EC (contingencia negativa). mejor predictor del EI que los cuando los estmulos reales lo hacen, y ocurre
en mejor predictor del EI.
Hay, por tanto, tres tipos de asociaciones: EC- dems ECs, le prestaremos menos a dos niveles distintos de intensidad:
EI (asociacin directa); EC-claves del contexto y o ninguna atencin. A1: estado en el que el nivel de activacin
claves del contexto-EI (asociaciones indirectas). es alto y la atencin que se presta al estmulo
Destaca que en esta hiptesis no existen las tambin lo es. El nodo solo puede mantenerse
asociaciones inhibitorias y que la comparacin en A1 un breve intervalo de tiempo.
entre las asociaciones excitatorios determina la A2: menor nivel de activacin; atencin
manifestacin de la RC, pero no el aprendizaje. ms perifrica y menos focalizada.
Psicologa del Aprendizaje 2015/16 Llanos Mern
TEMA 4: PRINCIPIOS BSICOS DEL CONDICIONAMIENTO OPERANTE
ANTECEDENTES
HISTRICOS
Thorndike y la Ley del El anlisis experimental del

Efecto comportamiento de Skinner
Los trabajos de Thorndike son el comienzo del estudio cientfico del Skinner desarrolla la idea de que los reflejos podran ser estudiados como
condicionamiento instrumental, al que denomin aprendizaje por ensayo y error. conductas ms que como un reflejo del sistema nervioso o de la mente: distingue
Para este autor, el aprendizaje ocurre porque se fortalecen las conexiones que se entre el condicionamiento de los reflejos de Pavlov y el tipo de aprendizaje
forman entre los estmulos y las respuestas cuando dan lugar a un estado de propuesto por Thorndike, lo que le llev a formular que la conducta se regula
satisfaccin para el animal. Denomin a esto conexionismo. tanto por el condicionamiento de los reflejos o condicionamiento respondiente
Experimento: meta a gatos en diferentes caja problema, una especie de jaulas como por el operante.
de las que podan salir al activar algn tipo de resorte desde el interior, y al salir el Empleo de los trminos condicionamiento operante y condicionamiento
investigador les daba una cierta cantidad de comida. En los primeros intentos instrumental: el termino operante refleja la capacidad del sujeto para operar
tardaban un tiempo considerable y exploraban la caja hasta dar por casualidad con sobre su ambiente, mientras que el termino instrumental tiene en cuenta el
el mecanismo de apertura. Segn transcurra los ensayos y repetan la tarea, el hecho de que la conducta del sujeto es el instrumento para obtener el
tiempo que tardaban en accionar el mecanismo y en salir de la caja era menor. reforzador.
Este tiempo que pasaba desde que comenzaba el ensayo hasta que el sujeto sala Procedimientos de operante libre: Skinner utiliz experimentos en los que el
de la caja, llamado latencia de escape, era la medida que Thorndike utiliz para la sujeto poda ejecutar una respuesta repetidamente sin la intervencin del
evaluacin de la ejecucin del aprendizaje. Estableci que la entrega de comida experimentador. En ellos, la respuesta puede ocurrir en cualquier momento y de
fortaleca la conexin entre la situacin y la respuesta. forma repetida mientras el sujeto siga en la caja de condicionamiento. La variable
Ley del efecto: de las muchas respuestas dadas en la misma situacin, las que dependiente medida en este caso es la tasa de respuesta, o nmero de
vayan acompaadas o inmediatamente seguidas de satisfaccin para el animal, en respuestas por unidad de tiempo.
igualdad de condiciones, se conectarn ms firmemente con la situacin; de
manera que cuando vuelva a presentarse, volvern a darse con gran probabilidad.
DEFINICIN DE CO: proceso que da lugar a que la probabilidad de una respuesta se vea modificada por sus consecuencias, es decir, por los efectos que tiene el
ambiente sobre ella. Si el resultado del comportamiento es beneficioso para el animal la conducta se fortalecer, siendo ms probable que se emita de nuevo en
circunstancias parecidas. Si el resultado es perjudicial, ducha conducta tender a desaparecer del repertorio del sujeto.
La descripcin de la conducta operante requiere habitualmente de tres trminos y sus interrelaciones funcionales. stos son:
El estmulo discriminativo La respuesta El reforzador
Las claves contextuales en el CO reciben el nombre de La respuesta operante se define por los Un reforzador es cualquier suceso o evento que al hacerse
estmulos discriminativos (Eds) y sealan la ocasin para efectos que provoca en el ambiente. Cuando contingente con una respuesta cambia la probabilidad de
que, si la conducta se presenta, sea seguida por una una respuesta produce el mismo efecto que aparicin de esa respuesta en el futuro. Por tanto, se define
consecuencia. Es decir, un estmulo en principio neutro, otra, estaremos hablando de la misma en funcin de los efectos que tiene sobre la conducta.
puede indicar si el reforzador est disponible y, por tanto, operante porque producen los mismos efectos Reforzamiento condicionado: la conducta humana
indica al sujeto cundo ha de responder. Esto implica sobre el ambiente. Por tanto, la operante se muchas veces no es controlada por reforzadores primarios
reforzar una respuesta en una situacin, pero no en otra. define por su funcin, no por su forma. (ej.: comida), sino que depende de la historia de
Cuando un Ed va seguido de una respuesta cuya Cuando hablamos de la conducta, sta puede reforzamiento (Ej.: elogios, crticas o juicios sobre nuestro
consecuencia es apetitiva, sta se ve reforzada y la adoptar distintas formas (topografa) teniendo comportamiento pueden fortalecer o debilitar la conducta).
probabilidad de que ocurra aumente si dicho estmulo la misma funcin. Hablamos de clases de Este tipo de eventos adquieren sus efectos debido a las
est presente posteriormente. respuesta cuando nos estamos refiriendo a experiencias que la gente ha tenido con ellos a lo largo de
Cuando una respuesta operante no es seguida de una cualquier forma de ejecutar una conducta con sus vidas. El reforzamiento condicionado o reforzamiento
consecuencia reforzante, el estmulo que precede la una funcin similar. Ej.: si queremos conseguir secundario se refiere a un estmulo o evento que
respuesta se conoce como estmulo delta (E), y en su comida, podemos hacerlo nosotros mismos o originalmente no es reforzante, pero que puede adquirir
presencia la probabilidad de emitir la operante disminuye. pedirle a otro que lo haga. Ambas sera la capacidad de reforzamiento mediante la asociacin repetida
El trmino control por el estmulo se refiere a cmo los misma clase de respuesta porque cumplen la con otro que previamente era reforzante. Es decir, la
estmulos que preceden una conducta pueden controlar la misma funcin, pero tienen una topografa o conducta se fortalece debido a sucesos que tienen un efecto
ocurrencia de sta, lo cual no quiere decir que el Ed forma diferente. que depende de la historia de reforzamiento del sujeto.
provoque la respuesta.
Entre estos tres trminos se establece una contingencia que se define como: en presencia de un
estmulo discriminativo, el reforzador se presentar si, y slo si, la respuesta operante sucede.
ACLARACIONES ENTRE
CONCEPTOS
Reforzador- Respuesta discreta- Topografa- Instancia de respuesta Interacciones clsicas

reforzamiento operante libre funcin y clase de respuesta y operantes en el
control de la conducta
El evento sera el reforzador, y Experimentos de ensayo Topografa: punto de vista Instancia de respuesta: En el CO, para poder reforzar o
el procedimiento o proceso el discreto: la variable estructural de una conducta, la forma unidad mnima de conducta castigar una conducta es necesario
reforzamiento. El dependiente es la latencia de de la respuesta, sus propiedades o que se refiere a la ocurrencia que dicha conducta ocurra con
reforzamiento produce respuesta. El ensayo comienza caractersticas fsicas, entendida particular y especfica de una cierta probabilidad. Cuando esta
incrementos en la conducta, y cuando el sujeto es dispuesto en como una secuencia de movimientos respuesta teniendo en cuenta probabilidad es muy baja hay
los reforzadores son los el aparato y ste puede que ocurren en el tiempo. Desde el adems su topografa. ciertas soluciones para no tener
eventos que hacen que el nicamente emitir, y el punto de vista del CO las Clase de respuesta: todas que esperar a que se d por
reforzamiento produzca esos investigador registrar, una consecuencias de una respuesta las formas en las que la casualidad, lo que llevara mucho
efectos. Cuando el respuesta en cada ensayo. pueden modificar su topografa o ejecucin de la respuesta tiempo. Una de ellas es el
procedimiento disminuye la Procedimientos de operante forma. Ej.: para empujar una puerta puede llevar a una funcin automoldeamiento: hacer primero
conducta, se denomina castigo libre: la variable dependiente podemos hacerlo con la mano o con el
similar. un procedimiento de CC que
y los eventos utilizados cuando para medir el aprendizaje es la pie, el resultado es el mismo, pero si
se presenta la conducta son de tasa de respuesta, y los sujetos estamos en pblico ser menos probable empareje un estmulo neutro (luz)
naturaleza aversiva. Hay que que lo hagamos con el pie. con algo apetitivo (comida), con lo
pueden emitir la respuesta de
distinguir as entre forma constante y Funcin: es la relacin de la que la luz pasar tras varios
consecuencia apetitiva repetidamente sin que el respuesta con los estmulos ensayos a ser un EC. Una vez que la
(reforzador) y consecuencia investigador tenga que antecedentes y las consecuencias de luz provoca la RC, podemos
aversiva (castigo). la misma. Dos respuestas con la someterla a control operante
manipular al sujeto de ninguna
misma forma pueden tener funcin haciendo que solo aparezca la
forma entre ensayo y ensayo.
diferente, y dos respuestas con comida cuando la paloma la
distinta topografa tener la misma picotea, pasando de ser un EC a un
funcin. En el ejemplo anterior la Ed que correlaciona con la comida
funcin sera abrir la puerta. cuando el animal presiona la tecla
(respeta operante).
PROCEDIMIENTOS BSICOS DEL

CONDICIONAMIENTO OPERANTE
APETITIVO AVERSIVO Contingencia: relacin de dependencia funcional entre dos

componentes de un condicionamiento, que se establece
CONTINGENCIA Refuerzo positivo: Castigo positivo:
cuando uno de los componentes correlaciona con el otro. En
POSITIVA La conducta provoca consecuencias La conducta provoca consecuencias
CO, hablamos de contingencia positiva cuando una respuesta
positivas. negativas.
La conducta La conducta es seguida de una consecuencia, y de contingencia negativa
CONTINGENCIA Entrenamiento de omisin o castigo Entrenamiento de escapa y evitacin o cuando una respuesta elimina o previene la aparicin de una
NEGATIVA negativo: reforzamiento negativo: consecuencia. Dependiendo del tipo de contingencia y de la
La conducta provoca la omisin de La conducta provoca la omisin de algo naturaleza apetitiva o aversiva de la consecuencia, se
algo bueno. malo. establecen los 4 procedimientos fundamentales de CO que
La conducta La conducta aparecen en la tabla.
Reforzamiento positivo (entrenamiento de recompensa): tiene lugar en el momento en que una consecuencia apetitiva
se presenta de forma contingente a una respuesta, lo que provoca un aumento de la fuerza de la respuesta: su intensidad,
su frecuencia de aparicin, etc. De esta forma, cuando el sujeto emite la conducta, se presenta un evento apetitivo. Si la
respuesta que queremos medir no est presente en el repertorio natural del animal, como presionar una palanca, se pude
Procedimientos destinados a emplear el moldeamiento o mtodo de aproximaciones sucesivas: reforzar respuestas o conductas que se vayan
aumentar conductas aproximando a la respuesta final que queremos medir, y dejar de reforzarlas (extinguirlas) segn vamos consiguiendo
respuestas ms cercanas a nuestro objetivo.
Escape y evitacin (reforzamiento negativo): en el procedimiento de escape eliminamos o detenemos un evento
aversivo como resultado de una respuesta operante, por lo que la respuesta aumenta; en el procedimiento de evitacin la
respuesta impide que se presente el evento de naturaleza aversiva. En laboratorio, es normal que estos dos
procedimientos se presenten de forma conjunta, aprendindose primero una respuesta de escape y luego de evitacin.
Castigo o castigo positivo: se aplica una consecuencia aversiva de forma contingente a la respuesta o conducta, y tiene
como resultado la disminucin de la misma. La consecuencia aversiva se presenta cuando el sujeto emite la respuesta
operante, y no se presenta si no la emite. Para poder castigar una respuesta antes ha tenido que ser reforzada. As, el castigo
Procedimientos destinados a consiste en la disminucin de una respuesta previamente reforzada debido a la imposicin de una contingencia de tipo
disminuir conductas aversivo sobre dicha respuesta.
Entrenamiento de omisin o castigo negativo: tiene como resultado una disminucin en la fuerza de la respuesta porque
se elimina o previene la aparicin de una consecuencia apetitiva de forma contingente a la respuesta. Si el sujeto emite la
respuesta operante, la consecuencia ser la no presentacin de un evento apetitivo.
LA EXTINCIN EN EL
REFORZAMIENTO POSITIVO
Fenmenos que muestran

Fenmeno de que la extincin no es
extincin
desaprendizaje
La extincin en el CO es el procedimiento mediante el cual una respuesta que previamente se La extincin es un procedimiento en el que una respuesta
reforzaba, se deja de reforzar. anteriormente reforzada ya no produce reforzamiento,
Estallido de extincin: efecto de la extincin sobre la conducta que consiste en un aumento de la pero la posibilidad de emitir la respuesta sigue
tasa de respuesta los primeros ensayos en los que dejamos de presentar el reforzador que antes se disponible. Consiste en un nuevo aprendizaje por lo que
presentaba. Posteriormente la respuesta comienza a disminuir de forma gradual. no implica ni desaprendizaje ni olvido, como muestran
Aumento de la variabilidad de la respuesta: efecto que ocurre al comienzo del procedimiento de los siguientes fenmenos:
extincin. Tiene una posible explicacin adaptativa: la variacin conductual aumenta las probabilidades Recuperacin espontnea: fenmeno en el que se
de entrar de nuevo en contacto con el reforzador o con otras posibles fuentes de reforzamiento. observa cierta recuperacin de la respuesta cuando
Como consecuencia de la extincin es habitual encontrarse con un estado emocional que se suele dejamos pasar cierto tiempo sin que el sujeto sea
denominar frustracin y que da lugar a que surjan respuestas emocionales incondicionadas, como la expuesto a sesiones de extincin.
agresin en humanos. Renovacin: consiste en la recuperacin de la
Resistencia a la extincin: las respuestas operantes que han sido reforzadas en pocas ocasiones se respuesta extinguida en un contexto diferente al que se
extinguen de forma lenta, pero cuando una respuesta ha sido reforzada en mltiples ocasiones llev a cabo el procedimiento de extincin.
muestra menor resistencia a la extincin, sobre todo cuando en la fase de adquisicin se ha utilizado Restauracin: se da cuando se vuelve a situar los
un programa de reforzamiento continuo (efecto de sobreentrenamiento en la extincin). La resistencia sujetos en el contexto original de la extincin.
a la extincin aumenta de forma importante cuando se utiliza un programa de reforzamiento parcial o Restablecimiento: en este caso, despus de extinguir
intermitente (efecto del reforzamiento parcial). la respuesta, el sujeto es expuesto de forma no
Otras variables que influyen en la persistencia de la respuesta durante la extincin son la magnitud contingente al reforzador, lo que hace que la respuesta
del reforzador y la inmediatez de la recompensa. Cuando la magnitud de la recompensa durante la vuelva a aparecer sin que sta d lugar a reforzamiento.
adquisicin es alta y se administra de forma continua, la resistencia a la extincin disminuye. Ocurre lo
contrario cuando las recompensas grandes se administran intermitentemente, como consecuencia del
efecto del reforzamiento parcial. Por otro lado, cuando la demora en la presentacin del reforzador es
baja, la resistencia a la extincin es mayor.
FENMENOS DEL
La conducta La deriva instintiva y el concepto Los cambios en la cantidad y

supersticiosa de relevancia o pertinencia calidad de la recompensa
Experimento de supersticin (Skinner): pona palomas en Deriva instintiva: Tendencia de

cajas independientes y les daba comida cada 15 segundos El contraste conductual es un fenmeno, relacionado con la
algunos animales a mostrar motivacin, que se basa en el hecho de que la efectividad de un
independientemente de lo que hicieran. Lo que observ es que respuestas instintivas que compiten
los animales actuaban como si su comportamiento controlara reforzador para controlar la conducta puede verse modificada
con la respuesta requerida cuando por la experiencia previa con el mismo reforzador cuando ste
la entrega del reforzador cuando no era as. Skinner explic son entrenados mediante
este comportamiento mediante la idea del reforzamiento es de una magnitud o calidad diferente. Si aumente o disminuye
procedimientos de condicionamiento el reforzador, en relacin a lo que percibamos antes, tiene
accidental o adventicio, es decir, si una respuesta ocurre operante. consecuencias en nuestra conducta y emociones.
cuando se entrega el reforzador, esa conducta se ve reforzada. Pertinencia o relevancia: se
Experimento de Staddon y Simmelhag: encontraron que las Contraste conductual positivo: se refiere al hecho de que los
refiere a que algunas respuestas se sujetos responden ms a un reforzador favorable si
respuestas emitidas por los animales se podan agrupar en dos relacionaran de modo natural con el
categoras a las que llamaron conductas de nterin y previamente han recibido un peor premio que si no han tenido
reforzador como consecuencia de la esta experiencia anterior.
terminales. Las conductas de nterin eran aquellas actividades historia evolutiva del animal, por lo
del animal que tenan lugar en el medio del intervalo, cuando Contraste conductual negativo: Se refiere al hecho de que
que sern ms fciles de condicionar los sujetos responden menos a un reforzador desfavorable si
faltaba bastante tiempo para la aparicin del reforzador. Las que otras dependiendo del
conductas terminales eran aquellas que ocurran al final del han recibido previamente un mejor premio que si no han tenido
reforzador que usemos. esta experiencia previa.
intervalo y prximas en el tiempo a la aparicin del reforzador.
Argumentaron que no es el reforzamiento lo que origina un Grupo Fase 1 Fase 2 Resultado
aumento en la frecuencia de las conductas de nterin, sino que
Grupo A (Pequeo- Recompensa Recompensa Misma
stas son respuestas que un sujeto emite de forma innata pequeo) pequea pequea respuesta
cuando la probabilidad de reforzamiento es baja. Grupo B (Pequeo- Recompensa Recompensa Aumento de
Herrstein. Diferenci entre: supersticiones idiosincrticas, grande) pequea grande respuesta
que son aquellas motivadas por la experiencia propia anterior Grupo C (Grande- Recompensa Recompensa Misma
con situaciones de reforzamiento, y supersticiones sociales que grande) grande Grande respuesta
Grupo D (Grande- Recompensa Recompensa Disminucin
las personas han mantenido a lo largo del tiempo.
pequeo) grande pequea de respuesta
FENMENOS DEL
La controlabilidad de las Los efectos de la demora del

La devaluacin del
consecuencias aversivas y el reforzamiento: el procedimiento
reforzador
efecto de indefensin aprendida de marcado
Indefensin aprendida: cuando los animales son sometidos a La demora del reforzamiento ocurre cuando existe un Devaluacin del reforzador:
situaciones en las que tienen poco o ningn control desarrollan periodo de tiempo entre la respuesta que da lugar al Procedimiento que consiste en
una reaccin emocional en la que manifiestan un comportamiento reforzador y la entrega posterior del mismo. Puede disminuir asociar al reforzador que se est
pasivo ante dichas circunstancias o circunstancias parecidas. o aumentar la conducta, o incluso modificarla respecto al utilizando un estmulo o evento de
Experimento: Para determinar el efecto de la indefensin aprendida reforzamiento no demorado. Hay que obtener una lnea base naturaleza contraria.
Seligman y colaboradores realizaron un diseo tridico que se muestra de respuesta estable a partir de la cual poder observar los El efecto resultante de este
en la tabla. Se someti a tres grupos de perros a diferentes situaciones efectos de la presentacin demorada del reforzador. Cuando procedimiento es una disminucin
experimentales con dos fases (fase de preexposicin al entrenamiento la lnea base es estable y se impone una demora,
escape/evitacin y fase de aprendizaje). El grupo acoplado, el nico que de la respuesta operante que ha
normalmente sta da lugar a una reduccin de la respuesta. sido reforzada con el reforzador
haba recibido descargas inescapables durante la preexposicin,
Procedimiento de marcado: Es una forma de evitar los devaluado, aunque esta respuesta
mostraba un aprendizaje escape/evitacin mucho ms lento, ya que la
efectos de la demora en la entrega del reforzador. Este nunca haya sido contingente al
fase 1 haba generado en los animales la expectativa de que su conducta
no tena ningn efecto sobre las consecuencias aversivas. procedimiento consiste en marcar la respuesta haciendo que estmulo aversivo.
Inmunizacin: proceso que se desarrolla cuando un sujeto sta pueda diferenciarse de otros eventos que ocurren
tiene una primera experiencia con descargas escapables que durante el periodo de demora.
bloquea el desarrollo de la indefensin aprendida cuando se
presentan descargas inescapables en una fase posterior.
Grupo Fase de Fase de Resultado
preexposicin aprendizaje conductual
escape/evitacin
Escape Descargas Seal-descarga Aprendizaje
controlables rpido
Acoplado Descargas Seal-descarga Aprendizaje
incontrolables lento
Control Sin descargas Seal-descarga Aprendizaje
rpido
TEMA 5: PROGRAMAS Y TEORAS DEL REFORZAMIENTO
PROGRAMAS BSICOS DE REFORZAMIENTO: son la forma en que se programan los reforzadores en contingencia con la emisin de una respuesta
operante. Cada uno de ellos especifica una regla que determina las condiciones en las que una respuesta puede ser reforzada.
Programas de reforzamiento continuo: en ellos, Programas de reforzamiento intermitente o parcial:

cada respuesta correcta es reforzada (Ej.: slo se refuerzan algunas respuestas que emite el
interruptor de la luz). sujeto, no todas. Producen un aprendizaje ms
duradero y son ms difciles de extinguir.
Programas de razn: el reforzador Programas de intervalo: la respuesta se

depende slo del nmero de respuestas refuerza slo si ocurre cuando ha transcurrido
efectuadas por el sujeto. Es decir, se un cierto periodo de tiempo. Es decir, debe
debe emitir un nmero concreto de pasar un determinado tiempo desde la
respuestas antes de que la ltima de consecucin del reforzador anterior antes de
ellas sea reforzada. que la respuesta sea reforzada de nuevo.
Programa de razn fija (RF): el Programa de razn variable (RV): Programa de intervalo fijo (IF): son Programa de intervalo variable
nmero de respuestas requerido requiere un nmero de respuestas aquellos que reforzarn la primera (IV): son aquellos donde vara la
para que se administre el que vara de una ocasin a la respuesta que ocurra una vez haya cantidad de tiempo a transcurrir
reforzador es siempre el mismo. Se siguiente, de manera irregular, transcurrido un tiempo siempre entre un reforzador y el
abrevia RF seguido del nmero de alrededor de un nmero promedio igual desde que se dispens el siguientes antes de que la
respuestas requeridas (Ej.: RF-50). de respuestas por cada reforzador. ltimo reforzador. Es decir, el respuesta sea reforzada, dando
El programa RF-1 sera un Ej.: en un programa RV-100 se intervalo de tiempo es constante. lugar a un valor promedio de
reforzamiento continuo, puesto que conseguir el reforzador si en intervalo entre reforzadores. Es
sera reforzada cada respuesta. promedio se han emitido 100 decir, el periodo de tiempo vara
respuestas, pudiendo ser en unas de una recompensa a otra.
ocasiones ms y en otras menos (el
valor medio es 100).
PROGRAMAS BSICOS DE REFORZAMIENTO REGISTRO ACUMULATIVO. Cada una de los 4 programas bsicos produce una ejecucin conductual caracterstica
que se puede observar en la forma en la que se distribuyen las respuestas, por medio de un registrador acumulativo. Este tipo de registro permite medir tanto el
nmero de respuestas como el nmero de pausas, el tiempo transcurrido entre ellas (TER: tiempo entre respuestas) o el tiempo total sin responder, siendo el
resultado una curva acumulativa continua que refleja las tasas de respuesta. Veamos el registro acumulativo de cada uno de los 4 programas:
Programa de razn fija (RF): Programa de razn variable (RV): Programa de intervalo fijo (IF): Programa de intervalo variable (IV):
Tasas elevadas de respuesta, que se Tasas de respuesta muy altas y El intervalo de tiempo establecido Ejecucin con una tasa de
mantienen desde la primera respuesta constantes. solo indica cundo est disponible el respuesta constante y estable, sin
despus de haber obtenido el reforzador Las pausas post-reforzamiento son reforzador, no cundo se entrega. pausas (Ej.: la pesca).
hasta la siguiente respuesta reforzada. mucho menos probables que en los Se caracteriza por una pausa post- Tanto en los programas de IV como
Esta ejecucin alta y estable ocurre programas RF, ya que el programa reforzamiento ms o menos en los de IF el reforzador est
cuando la razn es relativamente impide que el sujeto adquiera una prolongada en funcin de la duracin disponible hasta que se realice la
pequea. impresin exacta del nmero de del intervalo, y por una progresiva respuesta, sin importar el tiempo que
Cuando la razn es mayor (RF-50), se respuestas requeridas para obtener el aceleracin posterior de la tasa de esto lleve. Sin embargo, hay ocasiones
observa una pausa post-reforzamiento reforzador (Ej.: mquinas respuesta en cada uno de los en las que se restringe el tiempo que
que se sigue de la transicin casi tragaperras). intervalos, de manera que la tasa est disponible el reforzador, es decir,
instantnea de una tasa alta de respuesta mayor de respuesta se produce cerca se estipula un tiempo lmite para
posterior (carrera de razn). del final del intervalo. Esta pauta de conseguirlo: esta clase de restriccin
Tensin de la razn: si se aumenta conducta se conoce como festoneado se llama duracin limitada.
demasiado el valor de la razn, las pausas (Ej.: pautas de estudio en exmenes).
son ms largas o, en casos extremos, el La ejecucin en un programa IF
sujeto puede dejar de responder. refleja la precisin del sujeto para
contar el tiempo.
PROGRAMAS DE RAZN VS PROGRAMAS DE

INTERVALO FUNCIONES DE RETROALIMENTACIN.
Programas de razn vs Funciones de

programas de intervalo retroalimentacin
Semejanzas: los programas de RF e IF producen pausas post-reforzamiento Funciones de retroalimentacin: Son descripciones de las posibles relaciones
y tasas altas de respuesta tras la pausa; los programas de RV e IV mantienen existentes entre aspectos ambientales relacionados con la ocurrencia del
tasas estables de respuesta y no presentan pausas. reforzador (por ejemplo, su frecuencia de ocurrencia) y aspectos de ejecucin
Diferencias: conductual (como puede ser, por ejemplo, la frecuencia de ocurrencia de la
Cuando se igualan las tasas y patrones de reforzamiento, la tasa de respuesta). Por lo general en los programas de razn se encuentran funciones
respuesta suele ser mayor en los programas de razn que en los de intervalo. lineales, mientras que en los programas de intervalo se encuentran funciones
En los programas de intervalo, la tasa de respuesta no influye directamente hiperblicas. Las funciones de retroalimentacin se corresponden con una
sobre la frecuencia de administracin de los reforzadores (la tasa de explicacin molar de las relaciones del ambiente con la conducta.
reforzamiento), mientras que la tasa de reforzamiento vara de manera directa
con los cambios en la tasa de respuesta en los programas de razn. En los programas de razn, la tasa de
Posibles explicaciones a estas diferencias (Baum): reforzamiento que obtiene el sujeto es
1. Explicacin molecular: los programas de intervalo (particularmente IV) proporcional a la tasa de respuesta
tienden a reforzar TER largos, porque el mero paso del tiempo lleva a un realizada. Cuando ms rpido se
incremento en la probabilidad de reforzamiento. Dado que los programas IV se responda (menor requisito de razn),
generan TER largos, stos se reforzarn y llegarn a predominar, reduciendo mayor tasa de reforzamiento. Como
as la tasa de respuesta. En los programas de razn (particularmente RV) es resultado se obtiene una funcin lineal.
ms probable que el reforzador acte sobre TER cortos, dada la tendencia de En los programas de intervalo, cuanto
los sujetos a responder en rfagas. ms corto es el programa, mayor
2. Explicacin molar: en los programas de RV existe una correlacin directa margen para que pequeos incrementos
entre la tasa de respuesta y la tasa de reforzamiento, por lo que la tasa de en tasas bajas de respuesta produzcan
respuesta tender a aumentar para maximizar la tasa de reforzamiento. En los incrementos importantes en la tasa de
programas IV, sin embargo, no existe ninguna relacin entre la tasa de reforzamiento. Las funciones se aplanan
respuesta y la tasa de reforzamiento: por mucho que se incremente la primera a partir de una tasa de respuesta,
no variar la segunda. porque la tasa mxima de reforzamiento
viene establecida por el programa
TEORA Y PROGRAMAS DE REFORZAMIENTO

DIFERENCIAL DE LOS TIEMPOS ENTRE RESPUESTAS (TER).
Teora del reforzamiento Programas de reforzamiento

diferencia de los TER diferencial de los TER
La teora del reforzamiento diferencial de los TER se basa en que Este tipo de programas se disearon para probar que el reforzamiento diferencial de
los reforzadores no slo refuerzan ejecutar una determinada los TER es posible, para lo que se refuerzan especficamente TER cortos y TER largos.
respuesta, sino que tambin refuerzan el hacerlo a un Se requiere que el sujeto responda a una tasa particular para obtener el reforzador. El
determinado ritmo, con un determinado espaciamiento entre reforzamiento de una determinada respuesta vendr determinado en funcin del
respuestas. En todos los programas de CO se refuerzan tiempo transcurrido entre dicha respuesta y la respuesta anterior. El diseo bsico de
especficamente TER de una duracin determinada. estos programas es elegir un tiempo determinado y reforzar nicamente los TER que
En los programas de razn los tiempos entre respuesta largos sean ms largos o ms cortos que ese tiempo.
posponen el reforzamiento. De hecho, cuanto ms rpido Reforzamiento Diferencial de tasas Bajas de respuesta (RDB): se refuerza una
complete el sujeto el requerimiento de la razn, ms rpido respuesta slo si ocurre despus de que haya transcurrido cierta cantidad de tiempo
recibir el reforzador. Por tanto, un programa de razn favorece desde la respuesta anterior. As, el sujeto tiene que refrenar su respuesta hasta que
tiempos entre respuestas cortos y por consiguiente una tasa de ha pasado un cierto periodo de tiempo y, si no se consigue, se reinicia nuevamente el
respuestas alta. intervalo de tiempo especificado por el programa. Se refuerzan los TER largos.
En los programas de intervalo la probabilidad de recompensa Ej.: estos programas se pueden encontrar en la coordinacin de los pasos de baile o de
aumenta con tiempos entre respuestas ms largos y esto implica los instrumentos musicales, donde cualquier aceleracin en la conducta lleva a un
tasas de respuestas ms bajas. resultado no reforzado (sino castigado).
Reforzamiento Diferencial de tasas Altas de respuesta (RDA): se refuerza una
respuesta slo si ocurre antes de que haya transcurrido cierta cantidad de tiempo
tras la respuesta precedente. Se refuerzan los TER cortos. Este procedimiento
fomenta, por tanto, tasas altas de respuesta.
Ej.: contestar un cuestionario con tiempo lmite para cada pregunta, de manera que si
no se respondiese a una pregunta en el tiempo especificado se saltara a la siguiente,
forzndose a responder antes de que venza el tiempo estipulado.
PROGRAMAS COMPUESTOS DE REFORZAMIENTO PROGRAMAS ALTERNANTES Y SECUENCIALES. Los programas compuestos resultan de la aplicacin de dos o
ms programas bsicos de reforzamiento y pueden dividirse en dos bloques: aquellos donde la presentacin de los programas componentes es secuencial y
aquellos donde los componentes se presentan de forma simultnea. En primer lugar, veremos los programas secuenciales.
Programas compuestos secuenciales de reforzamiento: Hace referencia a la

Sin Ed Con Ed presentacin en sucesin de al menos dos programas bsicos de
reforzamiento, destacando los programas mixto, mltiple, tndem y
Alternantes Mixto Mltiple
encadenado, cuya diferencia radica en cmo se pasa de uno a otro de los
Secuenciales Tndem Encadenado
programas componentes (de forma alternante o estrictamente secuencial) y
si existe seal discriminativa para los mismos.
Programa mixto: se presentan dos o ms programas bsicos alternndose al azar. El cambio de un programa a otro de los
programas es independiente de la conducta del sujeto, ya que depende de la duracin de un tiempo establecido con anterioridad
por el experimentador. Ej.: si cada componente dura 10 minutos, durante los 10 primeros puede estar funcionando un programa IF-
60 y en los 10 minutos siguientes va a funcionar el segundo programa, por ejemplo, RF-50 y al terminar su tiempo, volver a
Programas empezar el programa IF-60 (as sucesivamente).
alternantes Programa mltiple: es igual que el mixto con la diferencia de que cada componente se seala con una clave discriminativa distinta
(luz, sonido) y el sujeto es informado en todo momento de en qu parte del programa se encuentra. Si un Ed indica que las
respuestas pueden ser reforzadas de acuerdo a reforzamiento positivo, y un Ed diferente seala la imposibilidad de reforzamiento,
nos encontramos ante un programa donde se establece una discriminacin entre n Ed positivo y un Ed negativo (E). El aprendizaje
consiste en emitir la respuesta en presencia del E+ y omitirla en presencia del E-.
Programa tndem: consta de al menos dos programas simples que se presentan siempre en el mismo orden. Los sujetos
experimentales deben completar el primer programa para poder iniciar el segundo, al final del cual consiguen la administracin del
reforzador. En este programa, al contrario que en los anteriores, solo es posible conseguir el reforzador si se cumplen en sucesin
Programas todos los programas componentes. Completar uno de ellos slo da lugar a la posibilidad de realizar el siguiente.
secuenciales
Programa encadenado: es igual que el tndem, pero en este caso cada uno de los programas simples est sealado de manera
diferente. Habitualmente la terminacin del primer programa se acompaa del encendido de una luz o la presentacin de un
sonido, que permanece en funcionamiento durante el segundo programa hasta el momento de la consecucin del reforzador.
PROGRAMAS COMPUESTOS DE REFORZAMIENTO

PROGRAMAS SIMULTNEOS
Programas Programas
concurrentes combinados
Son los ms importantes y conocidos. Se caracterizan por disponer Consisten en combinaciones de un programa de razn y otro de intervalo, y
simultneamente de al menos dos programas bsicos de reforzamiento. En los existen al menos tres tipos:
programas concurrentes se puede cambiar de un programa a otro sin que Programa alternativo: se refuerza una respuesta cada vez que se cumple con
normalmente haya sido necesario haber completado un tiempo o un nmero de el requisito del programa de razn o el de intervalo, existiendo as dos formas
respuestas en cada uno de los programas. Los sujetos experimentales, como de conseguir el reforzamiento.
consecuencia, deben elegir entre responder a uno u otro de los programas que Programa conjunto: se refuerza una respuesta cada vez que se cumple al
componen el programa concurrente. De esta forma, los programas concurrentes mismo tiempo con el requisito de razn y del intervalo.
estudian los mecanismos de la conducta de eleccin (para ello, se mide el Programa entrelazado: la respuesta que se refuerza viene determinado por
nmero de respuestas en cada uno de los componentes del programa y se dos programas, pero la disposicin de uno de ellos se altera por el desarrollo del
calcula la proporcin en que se distribuyen las respuestas en cada uno de ellos). otro. Una posibilidad es que cierta suma de respuestas y de tiempo debe darse
antes de que la respuesta sea reforzada.
RESUMEN: CLASIFICACIN GENERAL DE LOS PROGRAMAS COMPUESTOS.

MIXTO
SECUENCIALES
PROGRAMAS MLTIPLE
COMPUESTOS
SECUENCIALES TNDEM
ALTERNANTES
PROGRAMAS ENCADENADO
COMPUESTOS
PROGRAMAS CONCURRENTES
COMPUESTOS
SIMULTNEOS COMBINADOS ALTERNATIVO, CONJUNTIVO Y ENTRELAZADO.
CONCUTA DE
ELECCIN
Estudio y medida de la La ley de igualacin

conducta de eleccin (Herrnstein)
La conducta de eleccin se ha estudiado: Esta teora formula que la tasa relativa de respuesta relativa entre dos
Tradicionalmente, utilizando un procedimiento de premios concurrentes: alternativas concurrentes (disponibles al mismo tiempo) es igual a la tasa (o
- Se daba a elegir entre dos actividades diferentes. frecuencia) relativa de reforzamiento en cada una de ellas. Dicho de otro modo:
- Se meda el tiempo que el animal empleaba en cada una de las opciones. si tenemos dos posibilidades de respuesta, cada una con un programa de
- Se inferan las preferencias relativas de los sujetos, en base a los resultados que reforzamiento diferente, hay que elegir cmo responder a ellas. Por tanto, voy a
se obtenan. repartir mi tiempo y esfuerzo en proporcin a lo que pueda conseguir de cada
- Este tipo de procedimiento no es adecuado porque se estn comparando entre una de ellas: esto implica que, si de uno de los programas podemos sacar ms
s actividades que requieren dos respuestas distintas. reforzamiento que del otro, lgicamente, nos dedicaremos ms a l.
Actualmente, se utilizan los programas concurrentes: en ellos, se aplican dos Matemticamente, esto se representa con la siguiente frmula:
programas de reforzamiento a la vez y el sujeto debe elegir entre las distintas
alternativas, que requieren una respuesta operante idntica. La conducta de
eleccin se refleja en la distribucin de las respuestas en las dos opciones
alternativas, de forma que el sujeto distribuir sus respuestas entre las dos Ra/Rb = tasas relativas de respuesta en las alternativas a y b respectivamente.
opciones en funcin del programa de reforzamiento de cada una de ellas. Fa/Fb = tasas relativas de reforzamiento en las alternativas a y b.
La medida de la conducta de eleccin se realiza mediante la tasa relativa de
respuesta en cada una de las alternativas (se puede realizar del mismo modo con Si en la alternativa a se ofrece una mayor frecuencia de reforzamiento que en la
la tasa relativa de reforzamiento). b tambin se dar un mayor nmero de respuestas en esta alternativa y viceversa.
Si los reforzadores se distribuyen por igual en las dos alternativas, las
Ra = tasa relativa de respuesta en la alternativa a. respuestas tambin se distribuirn al 50% entre las dos alternativas.
Rb = tasa relativa de respuesta en la alternativa b. Existen tambin otros parmetros del reforzador que se pueden igualar
(frecuencia, magnitud, demora).
La razn ser R=0,5 Si el sujeto elige igualmente entre las dos opciones. Maximizacin: comportamiento adaptativo que implica elegir en exclusiva la
La razn ser R>0,5 si la tasa de respuesta en a es mayor que en b. alternativa ms favorable, para ahorrar tiempo y esfuerzo (entre dos programas
La razn ser R<0,5 si la tasa de respuesta en b es mayor que en a. de razn diferentes, siempre se elige la alternativa que tiene la razn ms baja).
CONCUTA DE ELECCIN LEY

GENERALIZADA DE LA IGUALACIN
Sesgos en el estudio de la Ley generalizada de

igualacin la igualacin (Baum)
Cuando se tiene que elegir entre dos alternativas de respuesta, se suele Baum ampli la ley de igualacin para corregir los sesgos e incorporar las
producir un comportamiento de alternancia, caracterizado por el cambio desviaciones por sobreigualacin e ingraigualacin, de forma que la frmula
intermitente de una alternativa de respuesta a otra sin que guarde relacin qued de la siguiente forma:
con los reforzadores asociados a cada una de dichas alternativas. Para evitar
esta influencia no deseable en los laboratorios de psicologa del aprendizaje,
donde se pretende estudiar el comportamiento de eleccin guiado
simplemente por las consecuencias del reforzamiento en las diferentes K = sesgo de respuesta. Si no existe sesgo k=0, si hay sesgo k>1 o k<1
alternativas, se ha recurrido a un procedimiento denominado demora por el dependiendo del sesgo del que se trate.
cambio (DPC). Este procedimiento consiste en introducir un periodo S = sensibilidad a las tasas relativas de reforzamiento.
temporal breve (2 o 3 segundos), despus de la primera respuesta a una de
las alternativas, antes de que pueda entrar en funcionamiento el programa Si s y k fueran 1, la frmula se reducira a la de Herrnstein (no hay influencia de
de reforzamiento asociado a dicha alternativa. Si los sujetos persisten en su sesgos). Hay veces en las que el animal no acta conforme a la ley de igualacin
comportamiento de alternancia, y se ha introducido la contingencia de DPC, y le dedica ms o menos respuestas a una alternativa (siempre la MS
no podran obtener ningn reforzador en ninguna de las alternativas de VENTAJOSA) de las que la ley formula: fenmenos de infraigualacin y
respuesta. La consecuencia normal en estos casos es que los sujetos sobreigualacin.
abandonen su comportamiento de alternancia. Igualacin perfecta: s=1.
Otros de los sesgos ms frecuentes en los experimentos de eleccin Infraigualacin: s<1. Cuando el animal responde menos de lo previsto por la
realizados en laboratorio son: la disposicin espacial de las alternativas de igualacin en el programa ms ventajoso (sensibilidad reducida a las tasas
respuesta, el color y la iluminacin de dichas alternativas o la fuerza relativas de reforzamiento).
requerida para responder en cada una de ellas. En un programa concurrente Sobreigualacin: s>1. Cuando la mejor alternativa es valorada por encima
de reforzamiento se requiere que las alternativas de respuesta difieran de lo que predice la igualacin (responden ms) (mayor sensibilidad a la tasa
exclusivamente en las caractersticas de reforzamiento. relativa de reforzamiento).
CONCUTA DE
ELECCIN
Cmo realizamos los clculos?: Deducir las

tasas relativas de respuesta y reforzamiento y
cundo hay infraigualacin o sobreigualacin.
Cuando el programa concurrente est compuesto exclusivamente por programas de razn. En este caso, lo que ocurre es que al elegir la opcin ms ventajosa la otra
se descarta del todo (maximizacin). Por ejemplo, imaginemos que tenemos 2 palancas, la palanca A con un programa de RF5 y la otra, la B, con un programa de RF10. Si
damos, por ejemplo, 20 respuestas: en la palanca A obtendra 4 reforzadores (un reforzador cada 5 respuestas), mientras que en la B obtendramos solamente 2
reforzadores (un reforzador cada 10 respuestas). As, sin con el mismo nmero de respuestas voy a obtener ms recompensa en la palanca A, paso totalmente de la B (no
me interesa gastar tiempo o energa en ella). Por tanto, la tasa relativa de respuesta y/o reforzamiento sera 1 para la palanca A y 0 para la palanca B.
En el caso de programas concurrentes formados por programas de intervalo, el sujeto dar un mayor nmero de respuesta a la opcin ms ventajosa, en funcin de
los reforzadores que puede conseguir, pero no obvia por completo la otra opcin. Imaginemos la palanca A con un programa IF5, y la palanca B con un programa IF10: lo
primero que tenemos que hacer es deducir qu opcin es la ms ventajosa, en este caso sera la A (obtendramos 6 reforzadores uno cada 5 min), mientras que en la
palanca B solo obtendramos 3 reforzadores (1 cada 10 min). As, la tasa de reforzamiento se calcula dividiendo los reforzadores que consigo en cada opcin sobre el total
de reforzadores (9 para este caso). Por lo tanto:
Fa = 6/9= 0,66; Ra= 0,66 (la tasa de respuesta es igual que la de reforzamiento, de acuerdo a la ley de igualacin) y Fb= 3/9=0,33; Ra=0,33. En caso de que en el problema
no nos diesen el tiempo total, podemos poner el que queramos pues el resultado ser siempre el mismo. En este ejemplo, por tanto, nos dedicaramos en un 66% a la
palanca A que es la ms ventajosa, y en un 33% a la palanca B.
Para saber si existe sobreigualacin o infraigualacin. Para el ejemplo anterior de IF, tenemos un Fa=0,66, si por ejemplo nos dicen que la Ra de un animal en A es
0,75 estaremos ante una sobreigualacin (el animal responde ms de lo esperado); si nos dicen que la Ra es de 0,50 sera infraigualacin (el animal responde menos de lo
esperado). OJO: para hacernos picar, pueden darnos los datos de la opcin menos ventajosa (esto no nos sirve, SIEMPRE necesitamos los de la ms ventajosa). As, si nos
diesen los datos Fb=0,40 y Rb=0,50 lo primero que tenemos que hacer es apuntarnos los datos de A: como el tope 1, sera Fa=0,60 y Ra=0,50. Visto de la siguiente
manera es ms claro:
Palanca B:
Fb=040
Rb=050
TEORAS DE LA LEY DE
IGUALACIN
Aproximacin Aproximacin Mejoramiento

molecular molar
Los sujetos eligen cualquier alternativa de respuesta Los sujetos distribuyen sus respuestas entre La teora del mejoramiento puede considerarse una
con mejores probabilidades de obtener un reforzamiento las diferentes alternativas con el fin de sntesis entre las aproximaciones molecular y molar.
en ese momento (probabilidad momentnea). maximizar la cantidad de reforzamiento total. Esta teora asume que los sujetos cambian de una
Afirma que el cambio de una alternativa de respuesta a Los animales distribuyen sus respuestas de alternativa a otra para mejorar la tasa local de
otra se realiza en el momento en que la probabilidad acuerdo a un clculo global de las tasas reforzamiento. As, eligen la alternativa que en cada
momentnea de reforzamiento sea mayor en la otra relativas de reforzamiento entre las dos momento presenta mejor tasa local de reforzamiento (n
alternativa. alternativas de respuesta, eligiendo ms la que de respuestas o reforzadores/tiempo dedicado a
Explica bastante bien la distribucin de respuestas en proporciona una mayor tasa de reforzamiento. responder).
programas concurrentes de intervalo, donde los animales Esta teora se formul para explicar la Intrnseco a la teora del mejoramiento es la igualacin
podran responder de muchas maneras, pero lo hacen de eleccin en programas concurrentes de razn. temporal:
forma muy aproximada a como predice la teora. Dificultades: no puede explicar la conducta - Al elegir la alternativa que proporciona un mejor
de eleccin en los programas RV-IV; dificultad reforzamiento: darn una mayor tasa de respuesta,
para explicar por qu los animales prefieren obtendrn una mayor tasa de reforzamiento y
reforzadores variables a fijos, aunque se permanecern ms tiempo en esa alternativa.
ofrezca igual tasa de reforzamiento. - Respondern menor a la alternativa menos favorable, se
obtendrn menos reforzadores, pero tambin
permanecern menos tiempo en esa alternativa.
Por lo tanto, las tasas locales de respuesta y de
reforzamiento sern iguales en las diferentes alternativas
de respuesta
IMPULSIVIDAD Y AUTOCONTROL: PROGRAMAS CONCURRENTES ENCADENADOS. Procedimiento de reforzamiento complejo, en el que se permite
al participante elegir cul de varios programas simples de reforzamiento funcionar. Una vez realizada la eleccin, las alternativas rechazadas no
estarn disponibles durante algn tiempo. Constan de, al menos, dos fases.
1 fase: eslabn de eleccin. El sujeto elige entre dos opciones de

respuesta idnticas.
2 fase: eslabn terminal. Programa de reforzamiento.
Caractersticas: la oportunidad de obtener el reforzamiento se da slo en el
eslabn terminal; estos programas implican una eleccin con compromiso
(una vez realizada una eleccin, el sujeto est comprometido con esa eleccin
hasta el final del eslabn terminal); la consecuencia de responder en el
eslabn inicial es un estmulo asociado con el eslabn terminal que se
convierte en reforzador condicionado; los sujetos igualan la tasa relativa de
respuesta con la tasa relativa de reforzamiento en los eslabones terminales;
tambin igualan la tasa relativa de respuesta en el eslabn inicial con la tasa
relativa de reforzamiento en el eslabn terminal.
El autocontrol se trata de elegir una recompensa grande pero demorada sobre

una recompensa pequea e inmediata (impulsividad).
Los procedimientos usados en los estudios de autocontrol han sido:
1. Procedimiento de eleccin directa (programa concurrente simple): se prefiere
la recompensa pequea inmediata. No se muestra autocontrol. La inmediatez del
reforzador influye ms en la eleccin del sujeto que la magnitud del mismo.
2. Programa concurrente encadenado: si se impone un tiempo de demora
suficiente antes del componente terminal se muestra autocontrol, es decir, se
prefiere la recompensa grande demorada.
Si se impone una demora constante a la entrega de ambas recompensas, es
ms probable que los sujetos muestren autocontrol y prefieran la recompensa
grande demorada. Esto es porque demorar un poco la entrega del reforzador
pequeo hace que su fuerza se debilite y se prefiere esperar a uno de mayor
magnitud. El valor de un reforzador se reduce en funcin del tiempo que se tiene
que esperar para obtenerlo (Rachlin y Green).
TEORAS E-E TOLMAN.
TEORA DE LA PRIVACIN DE RESPUESTA
TEORAS DEL APRENDIZAJE INSTRUMENTAL

TEORAS ASOCIACIONISTAS
Teoras E-R Teoras E-E
Thorndike: su aportacin fue la formulacin de la Ley del efecto. Postula que la Tolman: para Tolman los reforzadores no actan directamente sobre la
asociacin entre la situacin ambiental (E) y la respuesta (R) depende de la propia asociacin E-R, sino que la conducta est mediada por eventos internos como las
consecuencia de la accin, por tanto, el papel del reforzador es crear la asociacin expectativas de recompensa.
E-R. Si la consecuencia es positiva para el sujeto, la respuesta tender a repetirse, Distingui entre aprendizaje y ejecucin. El reforzador no es necesario para el
pero si no lo es, tender a desaparecer. aprendizaje, pero s para la ejecucin.
Guthier: la funcin del reforzador es facilitar la formacin de una asociacin
entre E-R. Fue el primero en diferenciar entre actos y movimientos.
Hull: la consecucin del reforzador refuerza la formacin de una asociacin E-R
debido a una reduccin del impulso (necesidad biolgica), al tiempo que incita a la
accin (incentivo). La ejecucin conductual va a depender de la fuerza del hbito,
del nivel del impulso y del valor del incentivo.
TEORAS DEL APRENDIZAJE INSTRUMENTAL

TEORAS DE SELECCIN DE RESPUESTAS
Teora de la probabilidad Teora de la privacin

diferencial (Premarck) de respuesta
Premarck: Dadas dos respuestas en un procedimiento de condicionamiento La restriccin de la respuesta reforzadora es el factor crtico para el
instrumental, la respuesta ms probable reforzar a la menos probable y la reforzamiento instrumental.
respuesta menos probable no reforzar a la ms probable. Los programas de reforzamiento incrementarn la ocurrencia de una respuesta
Principio de Premarck: el efecto del reforzamiento se basa en la probabilidad operante por encima de su lnea base, si y solo si dichos programas privan al
diferencial de 2 actividades y tiene un gran poder predictivo: individuo de realizar la respuesta reforzadora.
- Primero se observa la probabilidad o preferencia de dos actividades cuando el Para que una actividad pueda funcionar como reforzador hay que restringir la
sujeto no est limitado (establecimiento de la lnea base). realizacin de dicha actividad en relacin con su punto de bienestar (lnea base),
- Segundo se establece una relacin de reforzamiento en la que la actividad pero no es necesario que tenga que ser la ms preferida.
preferida (A) se limita, y debe ocurrir solo de forma contingente con la realizacin Predice que la tasa de respuesta y la tasa de reforzamiento deben relacionarse
de la actividad menos preferida (B) (Actividad preferida: reforzador/ actividad en forma de U invertida en vez de forma lineal: a medida que disminuye la
menos preferida: instrumental). frecuencia de reforzamiento, la tasa de respuesta instrumental aumenta (porque
- Resultado: la actividad reforzada ocurre a menor probabilidad que en el beneficio de obtener el reforzador compensa el hecho de responder ms) pero
condiciones de libre acceso y la actividad instrumental aumenta su probabilidad de si posteriormente aumenta el requisito del programa y baja ms la frecuencia de
ocurrencia. reforzamiento, el coste de responder no compensa, por tanto, disminuyen las
- Ej.: podrs ver la tele (A), cuando hayas recogido los platos (B). respuestas.
TEMA 6: CONTROL DE LA CONDUCTA POR EL ESTMULO
Control Los estmulos de control en el CC son: los estmulos

Pavloviano incondicionados (EI) para las respuestas reflejas (RI) y los
CONTROL POR EL ESTMULO: hace referencia a la explicacin de estmulos condicionados (EC) para las respuestas elicitadas (RC).
un comportamiento por la aparicin de algn evento anterior
Los eventos de control en la conducta operante son los estmulos
(causa). Este evento causal funciona como un estmulo de
discriminativos (Eds):
control sobre la conducta.
Estmulos discriminativos positivos (Ed+ o E+): aquellos que
mantienen una contingencia positiva con el reforzamiento de la
Control conducta, mediante el entrenamiento de recompensa o el de
Operante escape/evitacin. Aumentan la probabilidad de que se produzca
la conducta.
Estmulos discriminativos negativos o estmulos delta (E- o
E): aquellos que son contingentes con el castigo, con el
enteramiento de omisin o con la extincin de la conducta.
Disminuyen la probabilidad de que se produzca la conducta.
Un mismo Ed puede modificar la probabilidad de emisin de varias conductas, es decir, no son exclusivos. De la misma
forma, una conducta puede estar bajo el control de diferentes Eds.
La presencia de un Ed no modifica la probabilidad de cualquier operante, solo de aquellas con las que ha mantenido
Caracterstiacas de los alguna relacin de contingencia con su reforzamiento, castigo o extincin.
estmulos discriminativos. La presencia de un Ed no implica la aparicin de un reforzador o estmulo aversivo por s mismo, indica que existe una alta
o baja probabilidad de que tras emitir la conducta sta sea reforzada o castigada.
Si una conducta est bajo el control de un Ed+, debe de haberse condicionado tambin uno o ms Ed- para esa misma
conducta, y a la inversa. (Ej.: decir pap E+: padre; E-: resto de personas).
Igual que el control de un EC puede extinguirse, el control de un discriminativo tambin si la conducta deja de ser
contingente con la consecuencia.
Perspectiva funcional: un estmulo puede ser cualquier evento siempre y cuando su presencia produzca alguna reaccin en
el sujeto, es decir, que su presencia produzca la emisin de una conducta.
Perspectivas sobre los Perspectiva estructural o topogrfica: basada en las propiedades fsicas del estmulo. Un estmulo puede ser exteroceptivo
estmulos si proviene del medio externo, o interoceptivo si proviene del medio interno (latido del corazn). Los estmulos propioceptivos
son aquellos generados por la posicin y el movimiento del cuerpo. Por ltimo, los relacionales son aquellos que dependen de
la conexin que mantienen entre s dos o ms elementos. Segn esta perspectiva los estmulos estn compuestos por rasgos o
propiedades: todos los estmulos comparten algn rasgo y se diferencian de los dems en algn otro.
GENERALIZACIN Y
DISCRIMINACIN
Generalizacin Discriminacin
Cuando un estmulo adquiere cierto control sobre la conducta (EI, EC o Ed) todos No siempre lo adaptativo es responder de la misma forma ante estmulos
los rasgos que lo componen adquieren cierto grado de control, unos ms que diferentes (generalizar), ya que en ocasiones pequeas diferencias entre
otros. Esto implica que cualquier estmulo que comparta alguno de esos rasgos, estmulos pueden tener consecuencias completamente diferentes. La
aunque no se haya tenido experiencia previa con l, tambin puede ejercer discriminacin consiste en responder de manera diferente ante estmulos
cierto control sobre esa conducta del sujeto, y cuntas ms o menos propiedades diferentes, y esta capacidad requiere entrenamiento. A este entrenamiento se le
compartan, el control ser ms o menos parecido al que ejerce el estmulo denomina condicionamiento discriminativo o reforzamiento diferencial, y al
original que se ha condicionado. Este fenmeno se denomina generalizacin del comportamiento resultante conducta discriminativa o respuesta diferencial.
estmulo y sus caractersticas son: Hay dos tipos de entrenamiento discriminativo: por control pavloviano y por
Es una respuesta similar a dos o ms estmulos semejantes, pero diferentes control operante.
del estmulo original.
Es una capacidad innata.
Tiene valor adaptativo: nos permite comportarnos de manera efectiva ante
estmulos nuevos.
El control por el estmulo es un continuo en cuyos extremos se encuentran la generalizacin y la discriminacin, en posiciones
opuestas. Esto significa que cuando un sujeto est demostrando una alta generalizacin tambin podra etiquetarse como una baja
discriminacin, y la inversa.
La generalizacin no es ms adaptativa que la discriminacin, ni al contrario. Que una cosa u otra sea ms adaptativa que la otra
va a depender de las exigencias del ambiente.
La generalizacin y la discriminacin se pueden producir con todos los estmulos que ejercen control sobre la conducta, incluido
los estmulos discriminativos.
LOS GRADIENTES DE GENERALIZACIN: es la representacin grfica de la relacin sistemtica entre la semejanza de los estmulos
generalizados con el estmulo original y la cantidad de control que ejercen sobre la conducta.
Mtodos de medicin del Tipos de gradientes de

control por el estmulo generalizacin
El control que un estmulo no entrenado (estmulo de prueba o generalizado) ejerce sobre una Caractersticas de los gradientes de generalizacin:
conducta es directamente proporcional a su semejanza con el estmulo que adquiri ese control Sirven para medir el control por el estmulo.
durante un proceso de condicionamiento (E+ o E- original o criterio). Esta relacin se puede Cuanto ms acusado sea el gradiente de respuesta, mayor
comprobar a travs de varios mtodos: discriminacin.
Estmulo nico: consiste en entrenar a varios grupos de sujetos para que un estmulo Cuanto ms plana es la pendiente, ms generalizacin.
adquiera cierto control (convirtindolo en E+ o E-) y despus exponer a cada grupo a un estmulo Gradientes excitatorios: la exposicin a estmulos generalizados
de prueba diferente, en cuanto a su parecido con el estmulo original. Comparando la respuesta semejantes a discriminativos positivos o ECs excitatorios generan
de los grupos ante el estmulo de prueba, se observa que cuanto mayor es el parecido de ste gradientes con forma de U invertid, en los que la mayor cantidad de
con el estmulo original mayor es la fuerza de la respuesta. Ventajas: evitan la posible influencia respuestas se observa en los valores cercanos al E+ original y van
en la R por la experiencia con varios E de prueba; Inconvenientes: son ms costosos. decreciendo segn se alejan de l.
Estmulos mltiples: el estmulo criterio se presenta junto a otros diferentes, uno cada vez y Gradientes inhibitorios: son el resultado a la exposicin a
en extincin. Se mide la fuerza de la respuesta ante las combinaciones entre el estmulo original estmulos de prueba semejantes a estmulos discriminativos
y los estmulos de prueba en cada sujeto. Ventajas: cada sujeto experimenta todas las positivos o a ECs inhibitorios. El gradiente tiene forma de U y suele
combinaciones de estmulos original-prueba; Inconvenientes: el orden en que son presentados ser menos inclinado. En ellos, el nmero de respuestas registrado va
puede alterar la fuerza de la respuesta ante los otros estmulos. aumentando a medida que el estmulo de prueba presentado se
Generalizacin mantenida: se alternan ensayos reforzados con el estmulo criterio con el diferencia ms del E- original.
estmulo de prueba en extincin. El sujeto tiene experiencia con todos los estmulos de prueba
generalizados varias veces y en orden aleatorio. Ventajas: los sujetos experimentan todas las
combinaciones estmulo original-prueba; Inconvenientes: al alternar ensayos reforzados del E+
con ensayos en extincin de los E de prueba favorece la discriminacin y el gradiente presenta
una menor generalizacin.
Mtodo Entrenamiento Prueba

Estmulo nico EC-EI E1/E2/E3/
Estmulos mltiples EC-EI EC+E1, EC+E2, EC+E3
Generalizacin mantenida EC-EI, E1, EC-EI, E2, EC-EI
CONTROL CONDICIONAL. Ocurre cuando el control que ejercen ciertos estmulos sobre nuestra conducta est matizado, o depende de la
presencia de otros eventos. El control condicional implica la adicin de un nuevo trmino a la contingencia mnima.
Modulacin (control Discriminacin condicional

condicional pavloviano) (control condicional operante)
Los pioneros del estudio del control condicional en el CC fueron Rescorla y Las discriminaciones condicionales se definen como aquellas situaciones de
Holland. Empezaron a estudiarlo casi simultneamente, por lo que hay cierta control operante en las que la funcin del Ed (como positivos o negativos)
duplicidad de trminos para referirse al estmulo de control condicional. Rescorla depende de la presencia de otro evento, denominado estmulo condicional. En
lo denomin facilitador y Holland establecedor de la ocasin. michas ocasiones a los estmulos condicionales se les llama muestras y a los
En una situacin de modulacin la contingencia que mantienen el EC y el EI estmulos discriminativos comparaciones.
depende de la aparicin de un estmulo anterior. Ej.: si tras una luz, la aparicin La contingencia operante en este tipo de situaciones aumenta de tres (Eds-
de un sonido va seguida de comida, pero en ausencia de la luz el mismo sonido no respuesta-consecuencia) a cuatro trminos (Eds-R-C-E. Condicional). Ej.: en el
va seguido de comida, la luz terminar modulando la funcin del sonido como EC siguiente ejemplo, la presencia del estmulo condicional 1 convierte al Ed1 en un
excitatorio apetitivo. discriminativo positivo para la conducta R, y al Ed2 en un discriminativo negativo para la
Luz-sonido(EC) Comida (EI) // no luz-sonido(EC) No comida (EI) misma conducta. Sin embargo, el estmulo condicional 2 convierte al Ed1 en un
Luz-no sonido (EC) no comida (EI) // no luz-no sonido comida (EI) discriminativo negativo, y al Ed2 en discriminativo positivo. As, si consideramos un
interruptor de la luz como Ed para la conducta de pulsar, hemos de considerar que su
El estmulo que seala la relacin/contingencia entre el EC y el EI (en el
funcin depende de otros factores, como que la luz ya est encendida o sea de da: en
ejemplo la luz) se caracteriza por: no elicita por s mismo respuestas excitatorias
presencia de la luz (EC1) el interruptor (Ed1) cumple funciones de Ed- para la conducta de
ni inhibitorias, no mantiene ninguna relacin de contingencia con la aparicin del pulsar; en presencia de la oscuridad (EC2) sus funciones seran de Ed+.
EI y este modulador no es extingue.
El estmulo condicional por s solo no controla ninguna respuesta, sino la

interaccin entre el condicional y el discriminativo.
Capacidad sensorial.
RELACIONADOS CON LOS Facilidad relativa de condicionamiento de los elementos de un compuesto.
ESTMULOS Modalidad sensorial.
Discriminabilidad.
Intensidad de los estmulos discriminativos.
Aprendizaje de rasgo positivo.
Relacin respuesta-reforzador.
RELACIONADOS CON LA RESPUESTA Respuesta de observacin a la muestra.
Respuesta diferencial.
FACTORES QUE AFECTAN AL CONTROL RELACIONADOS CON LA Disposiciones de aprendizaje.
POR EL ESTMULO EXPERIENCIA PREVIA Efecto de sobreaprendizaje en la inversin.
Experiencia de reforzamiento no diferencial.
Tipos de entrenamiento discriminativos.
Eficacia relativa de los elementos del estmulo como seales para el
reforzamiento.
Tipo de reforzamiento.
RELACIONADOS CON EL
Consecuencia diferencial.
ENTRENAMIENTO DISCRIMINATIVO Duracin del intervalo entre ensayos.
Grado de entrenamiento.
Entrenamiento en discriminacin sin errores.
Intervalo entrenamiento-prueba.
Capacidad sensorial: es necesario que el estmulo que se presenta pueda ser percibido por los sentidos. La parte de la realidad ante la que
podemos reaccionar es como mximo aquella para la que nuestros rganos sensoriales estn preparados, y hay sonidos, olores y colores que
estn fuera del rango de audicin, olfato y vista humano que no funcionan como estmulo para nosotros, pero s para otras especies.
Facilidad relativa de condicionamiento de los elementos de un compuesto: los estmulos pueden competir por el control de la conducta y
los ms salientes o intensos dificultarn el condicionamiento de los ms dbiles (Ensombrecimiento).
Modalidad sensorial: hay una gran variedad de estmulos que pueden utilizarse con xito en los estudios, pero los ms comunes con
Factores relacionados animales han sido los visuales (teclas iluminadas de distintos colores o con lneas en distintas orientaciones).
con los estmulos Discriminabilidad: cuanto mayor son las diferencias fsicas de los estmulos, ms sencillo es discriminarlos. Las influencias ambientales
(factores inherentes a las situaciones experimentales) tambin influyen en la discriminabilidad.
Intensidad de los estmulos discriminativos: la intensidad de los Eds entrenados afecta a los gradientes de generalizacin, hacindolos
menos simtricos y desplazando el mximo de respuesta ante un valor diferente al Ed+ original. Los gradientes generados por estmulos de
prueba intensos suelen ser una funcin monotnica (creciente cuando el Ed+ es ms intenso que el Ed-, y decreciente en el caso inverso).
Aprendizaje del rasgo positivo: cuando el elemento predictivo nico que distingue al E+ del E- forma parte fsicamente de la presentacin
del E+, los sujetos aprenden mejor que cuando el rasgo distintivo forma parte de la presentacin del E-.
Relacin respuesta-reforzador: se tiende a elegir la respuesta congruente con el sistema. Ej.: experimento de Dobrezcka, en el que se entrenaba a
perros en discriminacin drcha.-izda./actuar-no actuar mediante estmulos auditivos que diferan tanto en su posicin (delante/detrs) como en su
naturaleza (zumbador/metrnomo). Demostraron que es ms probable que las respuestas que estn diferenciadas por la localizacin (drcha./izda.)
Factores queden bajo el control de la distinta posicin de los Ed (delante/detrs) y que las respuestas que estn diferenciadas por su naturaleza queden bajo el
relacionados control del tipo de estmulo (zumbador/metrnomo).
con la respuesta Respuesta de observacin a la muestra: establecer como requisito una respuesta de observacin a la muestra facilita el aprendizaje de las
discriminaciones condicionales. Se considera requisito de observacin a la muestra cuando se refuerza alguna conducta del sujeto orientada al estmulo
condicional. Ej.: retener los estmulos de comparacin hasta que el sujeto toque la muestra.
Respuesta diferencial: el aprendizaje de la discriminacin diferencial es ms rpido cuando se requieren respuestas diferentes para cada E muestra.
Disposiciones de aprendizaje: la discriminacin de nuevos estmulos mejora si se administra de antemano un entrenamiento previo de discriminacin
con otros estmulos. La experiencia con cualquier problema de discriminacin favorece las habilidades generales de resolucin de problemas que ayudan
Factores al organismo a afrontar un problema difcil posteriormente. La generalizacin de la discriminacin aprendida puede ser: intradimensional (cuando se
relacionados con alterna la misma dimensin del estmulo. Ej.: Tarea 1 discriminar rojo-verde; Tarea 2 discriminar azul-amarillo) o extradimensional o
la experiencia interdimensional (cuando implica estmulos en otra dimensin estimular. Ej.: Tarea 1 discriminar dos colores; Tarea 2 discriminar dos sonidos).
previa Efecto del sobreaprendizaje en la inversin: el sobreentrenamiento en una discriminacin dada favorece el aprendizaje en la discriminacin inversa.
Experiencia de reforzamiento no diferencial: el reforzamiento no diferencial puede afectar a aprendizajes anteriores con estmulos distintos. El
reforzamiento diferencial o entrenamiento discriminativo potencia la atencin y reduce la generalizacin.
Tipos de entrenamientos discriminativos: simultneo (E+ y E- aparecen a la vez en cada ensayo; E+ es contingente con el reforzamiento y E- con la
extincin o castigo; se acaba respondiendo exclusivamente sobre el E+; un ejemplo es el programa concurrente), sucesivo o procedimiento de
discriminacin de respuesta/no respuesta (go-no go) (los estmulos no aparecen al mismo tiempo; se acaba respondiendo en los ensayos en los que
est presente el E+ y no hacindolo en los que est el E-; un ejemplo es el programa mltiple).
Eficacia relativa de los elementos del estmulo como seales para el reforzamiento: Los Ed sealan la forma o el momento en que se va a producir
Factores el reforzamiento. Si en un compuesto, un E es mejor predictor de la disponibilidad de reforzamiento que otro, es ms probable que adquiera el control
relacionados de la conducta.
con el Tipo de reforzamiento: el control por el estmulo est en parte determinado por el tipo de reforzamiento que se utilice. Por ejemplo, los estmulos
entrenamiento visuales tienen ms probabilidad de adquirir control sobre la conducta reforzada positivamente, y los E auditivos sobre la reforzada negativamente.
discriminativo Consecuencia diferencial: en tareas de discriminacin simple, si se usan consecuencias diferenciales para cada combinacin entre el Ed y la respuesta,
se mejora la discriminacin; en la descremacin condicional tambin se mejora con reforzamiento diferencial.
Duracin del intervalo entre ensayos: la ejecucin mejora al aumentar el intervalo entre la realizacin de los ensayos.
Grado de entrenamiento: cuanto mayor es el entrenamiento, ms acusado es el gradiente de generalizacin.
Entrenamiento en discriminacin sin errores: se presenta el E- con menor intensidad que el E+ y se va aumentando gradualmente su intensidad
hasta igualarla al E+. Resultado: discriminacin sin errores, y se mejora la adquisicin de la misma.
Intervalo entrenamiento-prueba: cuanto mayor es este intervalo, mayor es la generalizacin (gradiente ms plano).
INTERACCIONES
EXCITATORIAS-INHIBITORIAS
Desplazamiento del Efecto de la Tendencia

mximo General o Tendencia Central
Efecto de interaccin entre el control excitatorio e inhibitorio presente en Desplazamiento del mximo de respuestas respecto al E+ original, como efecto
cada estmulo de prueba cuando el entrenamiento de discriminacin ha sido de la distribucin respecto a este, de los estmulos generalizados presentados.
intradimensional. Se observa que el sujeto responde en mayor proporcin ante un valor diferente
El resultado de este fenmeno es que el mximo de respuestas en el al E+ original que se acerca al valor medio de los estmulos de prueba a los que se
gradiente de generalizacin no se observa en presencia del E+ original sino ante expone.
otro estmulo cuyo valor en la dimensin pertinente se aleja del E+ en direccin Explicacin: Teora relacional de Thomas. La respuesta generalizada no se basa
opuesta al E-. Esto implica que: en las caractersticas absolutas de los estmulos, sino en sus referencias relativas
- El efecto del desplazamiento del mximo est en funcin de la semejanza del E- en funcin de los estmulos con los que tiene experiencia.
con el E+.
- A > semejanza entre E+ y E- > desplazamiento del mximo. Grupos Estmulos de prueba Mximo de respuesta
- Cuanto mayor es la discriminacin entre el E+ y el E- menor es el efecto del (nm) en:
desplazamiento producido por la interaccin de ambos. Inferiores al E+ (525 nm) 485, 495, 505, 515, 525 515 nm
- Aunque se denomine desplazamiento del mximo, tambin se produce Superiores al E+ (525 525, 535, 545, 555, 565 535 nm
desplazamiento del mnimo. nm)
- El entrenamiento en discriminacin sin errores no produce desplazamiento Simtrico 505, 515, 525, 535, 545 525 nm
del mximo en la prueba de generalizacin.
Explicacin de Spence: el entrenamiento en discriminacin intradimensional Ej.: A los sujetos se les ensea una luz de color rojo, para poder identificarla ms tarde.
produce gradientes de generalizacin excitatorios e inhibitorios centrados en el Despus se forman tres grupos:
E+ y el E-. Como el E+ y el E- son semejantes los gradientes de generalizacin de Primer grupo: se les muestra una luz roja seguida de unos tonos de rojo ms suaves.
la excitacin y la inhibicin se superponen. Debido a esta superposicin, la Segundo grupo: se les muestra una luz roja seguida de unos tonos rojos ms fuertes.
inhibicin generalizada del E- suprime la respuesta al E+ producindose el Tercer grupo: la luz roja va seguida de unos tonos ms suaves y otros ms fuertes.
desplazamiento del mximo. El modelo de Spence es un modelo de aprendizaje Resultados: el grupo 1 identifica una luz roja algo ms suave que la originalmente
basado en las propiedades individuales y absolutas del estmulo. presentada, el 2 una luz roja algo ms fuerte y los del tercer grupo acertarn en el tono
exacto.
TEORAS SOBRE LA
GENERALIZACIN
Generalizacin como proceso Hiptesis inversa: Teora atencional: Respuesta mltiple:

primario: Pavlov, Hull Blough Shutherland y Mackintosh Staddon
Pavlov: bas su explicacin en el La generalizacin se debe a que los Considera que el fallo en la Incluye el resto de conductas que
concepto de irradiacin, semejante al sujetos no pueden discriminar entre los discriminacin (responsable de la despliega el sujeto, adems de la
efecto de la onda al tirar un objeto al estmulos de prueba a los que son generalizacin) se debe a la falta de respuesta objetivo, dentro del anlisis
agua. Cada estmulo produce excitacin expuestos (fallo en discriminacin). As, atencin hacia el rasgo pertinente del Ed. del fenmeno de la generalizacin.
en una zona concreta del crtex cerebral, es la capacidad de los sujetos para Tiene dos procesos: Diferencia entre dos categoras de
de manera que estmulos parecidos discriminar ciertos estmulos lo que 1. El cerebro procesa cada dimensin del conductas: terminales (controladas por
pueden activar zonas fsicamente determina si mostrarn o no estmulo por separado a travs de la presencia del E+ y fortalecidas por la
adyacentes. A medida que el estmulo se generalizacin. analizadores especficos que representan presencia del reforzador) y de nterin
aleja del E+ original, la excitacin se cada dimensin del estmulo por (las que aparecen en ausencia del E+ o
vuelve ms dbil. separado (color, brillo, tamao). Al presencia del E-).
Hull: defendi que el cerebro no inicio, la fuerza del analizador depende Remplaza el concepto de inhibicin
perciba los estmulos como algo nico, de la saliencia de la dimensin. El por el de competicin: las respuestas
con un solo valor por dimensin, sino que reforzamiento afectar a la fuerza de los terminales quedaran bajo el control
cada rasgo es percibido como una analizadores activos, de manera que la excitatorio de los E+, las conductas de
horquilla de valores. As, cuantos ms dimensin ms saliente se condicionar nterin estaran controladas por los E- y
valores comparta el estmulo de prueba ms que el resto. ambas tendencias excitatorias se
con las regiones condicionadas con el E+ 2. Se desarrolla un vnculo entre una generalizaran a los estmulos de prueba.
original, mayor ser el control que ejerza. respuesta especfica y un analizador. Ej.: El resultado de esta competencia
Otras teoras que conciben la unin entre elegir una tecla roja y el formara los diferentes gradientes.
generalizacin como proceso primario analizador correspondiente al color.
son: la teora de Spence y el enfoque
relacional de Thomas.
TEMA 7: CONTROL AVERSIVO EN EL CONDICIONAMIENTO OPERANTE
ESTIMULACIN AVERSIVA EN EL CO
CASTIGO, ESCAPE Y EVITACIN.
APETITIVO AVERSIVO De los cuatro procedimientos del CO

REFUERZO POSITIVO O ENTRENAMIENTO CASTIGO POSITIVO O CASTIGO. La los aversivos son el castigo (castigo
DE RECOMPENSA. La conducta provoca conducta provoca consecuencias positivo) y el entrenamiento
CONTINGENCIA POSITIVA consecuencias positivas (reforzador) negativas Reduce la probabilidad de escape/evitacin. Mientras que con el
Aumenta la probabilidad de emisin de la emisin de la conducta castigo las conductas tienen como
conducta. consecuencia la aparicin de un
ENTRENAMIENTO DE OMISIN O REFORZAMIENTO NEGATIVO O evento aversivo por lo que disminuye
CASTIGO NEGATIVO. La provoca la no ENTRENAMIENTO DE su emisin, en el entrenamiento
CONTINGENCIA NEGATIVA aparicin o retirada de algo bueno ESCAPE/EVITACIN. La conducta provoca escape/evitacin se busca huir de la
Reduce la probabilidad de emisin de la la no aparicin o retirada de una
estimulacin aversiva, lo que da lugar
conducta. consecuencia aversiva Aumenta la
a un aumento de la conducta.
probabilidad de emisin de la conducta.
Entrenamiento de escape: la consecuencia aversiva est presente; no desaparece hasta

la emisin de la conducta (desplazamiento o manipulacin); la operante es reforzada por la
supresin del evento aversivo; la probabilidad de emitir la respuesta aumenta.
Entrenamiento de evitacin: el sujeto es expuesto a la presencia peridica de la
Diferencias consecuencia aversiva; la emisin de la operante impide o retrasa la aparicin de esa
consecuencia; la operante se emite ANTES de que el estmulo aversivo aparezca; la
probabilidad de emitir la respuesta aumenta.
Castigo: para poder aplicar un castigo, la conducta debe emitirse con cierto grado de
Castigo, escape y evitacin probabilidad; la conducta va seguida de la consecuencia aversiva; la probabilidad de emitir
la respuesta disminuye.
En todos los procedimientos el sujeto moldea su conducta para reducir al mximo su

Semejanzas exposicin a la estimulacin aversiva, es decir, mediante el aumento de los periodos de
seguridad.
PROCEDIMIENTOS DE CO Y
ESTADOS EMOCIONALES
Estados emocionales provocados Teora de la respuesta emocional

por los estmulos condicionada
Adems de la RI especfica, los estmulos elicitadores provocan en los sujetos Propuesta por Estes, es la ms relevante para explicar el efecto en la conducta
estados emocionales, estados que pueden asociarse al resto de los eventos de los procedimientos de castigo. La idea bsica es que un EC excitatorio aversivo
antecedentes (convirtindolos en ECs). El efecto emocional de los ECs suele provoca ciertas respuestas emocionales (como la paralizacin) por el hecho de
etiquetarse as: estar emparejado con una consecuencia aversiva (por ejemplo, una descarga).
Esas respuestas emocionales condicionadas son incompatibles con otras
- ECs excitatorios apetitivos generan estados como esperanza.
respuestas, como la de presin de una palanca (la rata no puede quedarse
- ECs excitatorios aversivos generan estados como ansiedad.
paralizada y al mismo tiempo presionar la palanca). Por tanto, la tasa de presin
-ECs inhibitorios apetitivos generan estados como tristeza.
de palanca se suprime durante la presentacin del EC.
- ECs inhibitorios aversivos generan estados como alivio.
En los procedimientos de reforzamiento negativo: los estmulos

discriminativos positivos (Ed+), las conductas de escape o evitacin generan
estados de alivio.
En los procedimientos de castigo: los estmulos delta o estmulos
discriminativos negativos (Ed-) y las conductas castigadas generan estados
de ansiedad. Los EI aversivos provocan miedo.
Aunque la estimulacin aversiva, independientemente de la respuesta puede
producir cierta supresin de la conducta instrumental, la estimulacin aversiva
producida por la ejecucin de la respuesta es mucho ms eficaz.
CONDUCTA DE EVITACIN: consiste en la aparicin y mantenimiento de una

conducta que tiene como consecuencia la ausencia de un estmulo aversivo.
Procedimientos de evitacin:
EVITACIN DISCRIMINADA
Procedimiento (ensayos discretos) Elementos y relaciones de contingencia Teoras explicativas
En la evitacin discriminada (o sealada) existen claves En este tipo de ensayos encontramos tres Teora Bifactorial de Mowrer. Sostiene que en el
que sealan el acontecimiento aversivo (descarga). Esta elementos: la seal de aviso, la respuesta operante y aprendizaje de evitacin estn implicados dos
tcnica utiliza ensayos discretos y requiere muchos la consecuencia aversiva. procesos interdependientes: el Condicionamiento
ensayos. Cada ensayo se inicia con la presentacin de un Las contingencias que se establecen entre ellos son: Clsico de miedo y el reforzamiento operante de la
evento neutro (luz/tono) al que se denomina seal, Contingencia Respuesta-Seal de aviso: la emisin respuesta de evitacin a travs de la reduccin del
que va a funcionar como Ed+. Despus, dependiendo de de la respuesta operante conlleva la desaparicin de la miedo. Primero, es necesario que el miedo se
lo que haga el sujeto hay dos posibilidades: seal de aviso, lo que convierte su relacin en una condicione al EC. Segn Mowrer, la operante se
Ensayo de escape: si el sujeto no emite la respuesta contingencia de escape. refuerza por la reduccin del miedo (o ansiedad)
requerida para la evitacin durante un intervalo entre la Contingencia Respuesta-Consecuencia: aunque generado por el EC (seal), y no por impedir la
seal y el EI aversivo, se presenta el EI programado y se inicialmente se produce una contingencia de escape aparicin del EI (descarga). Se explica la conducta de
mantiene hasta que la emite, despus de lo cual tanto la (dar la respuesta implica hacer desaparecer la evitacin en trminos de escape del miedo
seal como el EI cesan. La respuesta instrumental se descarga que est producindose), cuando el condicionado, ms que en trminos de prevencin de
considera una forma de escape, ya que suprime la entrenamiento est ms avanzado la contingencia ser la descarga.
descarga elctrica en curso. de evitacin (realizar a tiempo la conducta impide la Hiptesis de Schoenfeld. No utiliza el miedo como
Ensayo de evitacin: si el sujeto emite la respuesta llegada de la consecuencia aversiva). variable intermediaria. Segn esta hiptesis, la seal
requerida antes de que se presente el EI aversivo, la Contingencia Seal de aviso-Consecuencia: adquiere por CC funciones de consecuencia aversiva
seal cesa y se omite el EI en ese ensayo. durante los ensayos de escape se produce un secundaria o condicionada. Los animales en la
Durante los primeros momentos del entrenamiento, la condicionamiento excitatorio aversivo entre la seal y situacin de evitacin no pueden huir de la descarga
mayora de los ensayos son de escape y, segn va la descarga (seal seguida de descarga), porque no est presente; lo que emiten es una
avanzando el entrenamiento, empiezan a predominar condicionamiento que se somete a extincin en los respuesta de escape reforzada por la retirada de la
los ensayos de evitacin. ensayos de evitacin, en los que la seal adquiere la retirada de la seal. La evitacin sera una situacin de
funcin de Ed+ para la conducta de evitacin. reforzamiento negativo secundario.
CONDUCTA DE
EVITACIN
Procedimientos de evitacin: evitacin no Procedimientos de evitacin: evitacin de

discriminada de operante libre (Sidman) descarga aleatoria (Herrnstein-Hineline)
Procedimiento:
Procedimiento:
- Se programa una descarga para que ocurra peridicamente, sin aviso.
- Caja de Skinner con una palanca y dos mquinas dispensadoras de
- Se especifica una determinada conducta como R de evitacin. La emisin de esta respuesta
descargas: mquina A con una frecuencia de descargas mayor y mquina B
impedir la descarga durante un periodo de tiempo fijo.
con una frecuencia de descargas menor.
- Las respuestas de evitacin se pueden dar en cualquier momento y, ocurra cuando
- Las descargas eran intensas, breves y se programan en tiempos irregulares.
ocurran, reinician el intervalo R-EI (por eso se denomina de operante libre).
- La respuesta de evitacin es la presin de la palanca.
- El procedimiento se construye a partir de dos intervalos de tiempo: intervalo E-E o Reloj
- La emisin de la respuesta produce el cambio de programa: al principio se
choque-choque (intervalo entre las descargas en ausencia de una respuesta) e intervalo R-E
conectaba la mquina A (mayor frecuencia de descargas), cuando se
o Reloj respuesta-choque (intervalo entre la respuesta y la descarga programada, es decir, el
presionaba se desconectaba y se conectaba la B, que se mantena activa
periodo de seguridad).
hasta dispensar una descarga, entonces se volva a conectar la A.
- Ej.: cuando guardamos peridicamente un documento de texto (R) para evitar perder los
Explicacin: Herrnstein explic el reforzamiento de la conducta de
cambios realizados (E aversivo).
evitacin no tanto como el resultado de omitir o retardar la presentacin del
Hiptesis propioceptiva (Sidman): todas las conductas que realiza el sujeto en la
estmulo aversivo, sino como al debido a la reduccin de su frecuencia total:
situacin experimental quedan asociadas a la descarga. La propia conducta del sujeto
contingencia total negativa entre la tasa de respuesta y las consecuencias
funcionara como seal y le producir ansiedad. La nica forma de escapar de la ansiedad es
aversivas.
emitiendo la respuesta operante.
Hiptesis interoceptivo-temporal (Anger): el paso del tiempo es el que producira la VARIABLES QUE AFECTAN AL REFORZAMIENTO NEGATIVO:
ansiedad (a travs de la interiorizacin de los dos intervalos o relojes). La forma de Intensidad del estmulo aversivo: a mayor intensidad, mayor
escapar de la ansiedad es emitiendo la conducta. Tanto esta teora como en la de Sidman velocidad de adquisicin de la conducta reforzada negativamente.
explican la conducta de evitacin como una forma de escape ante el EC aversivo. Experiencia previa: la familiaridad con la estimulacin aversiva puede
Hiptesis de la seal de seguridad (Dinsmoor): seala el reforzamiento positivo como reducir la efectividad de las consecuencias aversivas.
causa de la conducta de evitacin. Los estmulos asociados a periodos de seguridad Intervalo E-E e Intervalo R-E: a < intervalo E-E y > intervalo R-E mayor
(espaciales y propioceptivos) se convierten en EC inhibitorios aversivos, reforzando la aprendizaje.
respuesta de evitacin. Tiene un mayor apoyo emprico.
>= Mayor que <=Menor que
CASTIGO
Aproximaciones tericas Variables que afectan al castigo
Thorndike: el reforzamiento positivo y el castigo implican procesos Intensidad del estmulo aversivo: a mayor intensidad, mayor supresin de la conducta.
simtricamente opuestos. Mientras que el reforzamiento positivo favorece Inmediatez y demora del estmulo aversivo: a mayor inmediatez del castigo, mayor
la conducta, el castigo la debilita. Es decir, las consecuencias negativas de supresin de la conducta.
una conducta debilitan la asociacin entre dicha conducta y los estmulos Cambios graduales en la intensidad del estmulo aversivo: la exposicin inicial suave a
presentes en la situacin. un estmulo aversivo reduce los efectos de un castigo intenso posterior (y al revs).
Teora de la respuesta emocional condicionada (Estes): los diversos Experiencia previa: una historia extensa de reforzamiento previo reduce los efectos del
estmulos que el sujeto experimenta antes de dar la respuesta castigada castigo.
provocan respuestas emocionales condicionadas por el hecho de estar Efectos discriminativos del estmulo aversivo: si la respuesta se castiga en presencia de
emparejados con una estimulacion aversiva. Estas respuestas emocionales un estmulo discriminativo (estmulo delta), pero no cuando el estmulo est ausente, se
condicionadas son incompatibles con la respuesta castigada. trata de castigo discriminativo. Con una exposicin continuada al discriminativo, los efectos
Teora de las respuestas competitivas reforzadas negativamente: supresores del castigo se limitan a la presencia de dicho estmulo.
explica el castigo en trminos de adquisicin de respuestas incompatibles Programa de castigo: generalmente, los programas de castigo continuo son ms efectivos
con la respuesta castigada. La supresin de la conducta se explica en que los intermitentes.
trminos de fortalecimiento de aquellas respuestas competitivas que evitan Programa de reforzamiento compuesto: toda tcnica de castigo es una tcnica mixta, ya
eficazmente la consecuencia aversiva. que castigar una conducta requiere que sta haya sido reforzada o est siendo reforzada a la
vez. Podemos encontrarnos tres casos: castigo sobre lneas-base apetitivas (actan
simultneamente el castigo y el reforzamiento positivo sobre la misma respuesta), castigo
sobre lneas-base defensivas (concurren el castigo y el reforzamiento negativo) y castigo
sobre lneas-base de extincin (se castiga una respuesta que previamente ha sido reforzada,
pero que en el momento de aplicar el castigo est siendo extinguida).
Existencia de una conducta alternativa reforzada: la disponibilidad de una fuente
alternativa de reforzamiento aumenta la supresin de las respuestas producida por el
castigo.
Manipulaciones motivacionales: supresin de la conducta si se reduce la motivacin para
realizar dicha conducta.
CASTIGO
Eficacia relativa del castigo para Fenmenos paradjicos en

suprimir la conducta el castigo
Los primeros trabajos experimentales sobre el castigo concluyeron que su La conducta masoquista: puede aparecer cuando el reforzamiento positivo
capacidad para moldear la conducta era reducida y poco estable en el tiempo. slo est disponible cuando se castiga la respuesta. El castigo se convierte as en
Estudios posteriores han demostrado que la conducta puede ser suprimida de una seal o estmulo discriminativo para la disponibilidad de un refuerzo positivo.
manera absoluta en pocos ensayos si se controlan determinados parmetros (si no, Otra forma de adquirir la conducta masoquista es mediante el
puede no suprimirse totalmente o reaparecer). contracondicionamiento de la consecuencia aversiva, emparejando un estmulo
con otro de efecto inverso, pero ms fuerte: por ejemplo, emparejar un EI
aversivo (descarga pequea) con un EI apetitivo (comida) ms intenso e ir
VENTAJAS: DESVENTAJAS: modificando paulatinamente la intensidad (hasta que tenga mayor intensidad EI
Provoca una reduccin de la Genera una serie de efectos aversivo que el apetitivo).
conducta a corto y largo plazo. colaterales no deseables: ansiedad, Crculo vicioso: aparece ante conductas reforzadas negativamente
Alto grado de inmediatez. agresin, neurosis (escape/evitacin). El propio evento aversivo adquiere funciones de
Alta resistencia a un posterior Puede dar lugar a una discriminativo (seal) para esa conducta. Y en procedimiento de castigo ese
recondicionamiento. redistribucin no prevista de la estmulo aversivo no suprimir esa conducta, sino que la aumentar.
conducta del sujeto.
Posibilidad de ampliar los estmulos
generadores de ansiedad para el
sujeto (por generalizacin), pudiendo
dar lugar al desarrollo de trastornos
del comportamiento.
TEMA 7: COTROL AVERSIVO EN EL CONDICIONAMIENTO OPERANTE
OTRAS ESTRATEGIAS DE
SUPRESIN DE LA CONDUCTA
Entrenamiento de Modificacin de la fuerza de Modificaciones

Extincin
omisin las conductas alternativas motivacionales
Similitudes con la evitacin: Cualquier modificacin que convierta Consiste en romper la contingencia Se puede suprimir la conducta
- Contingencia negativa Respuesta- a las respuestas alternativas en ms Respuesta-Reforzador tanto positiva atendiendo a variables motivacionales. La
Reforzador atractivas reducir la probabilidad de como negativa (escape/evitacin). motivacin se operativiza atendiendo a: el
- Intervalos Consecuencia-Consecuencia emisin de la conducta objetivo. Esto se Implica un nuevo aprendizaje. grado de privacin/saciedad respecto al
(E-E). puede conseguir: Un cambio en el contexto (respecto al reforzador y/o el valor del reforzador.
- Intervalos Respuesta-Consecuencia (R-E) - Manipulando las variables relacionadas que ha estado presente durante la Podemos reducir la conducta:
- No hay seales de aviso. con la competitividad de la respuesta extincin), un tiempo sin contacto con el - Ante reforzadores primarios (EI):
- La emisin de la respuesta retrasa la respecto a otra respuesta disponible: discriminativo extinguido o la exposicin saciando al sujeto respecto al reforzador
aparicin del reforzador. modificando el intervalo R-E de las al reforzador sin que se haya emitido la mediante sobreexposicin al EI;
Variables que determinan su eficacia: alternativas (demora del reforzamiento) operante, pueden provocar la devaluando el reforzador asocindolo con
- Los intervalos E-E tienen que ser obteniendo as una mayor frecuencia de restauracin de la capacidad de control otro estmulo de signo contrario
menores que los intervalos R-E. reforzadores en la R alternativa; de los discriminativos que habamos (aversivo).
- Se debe empezar por valores pequeos modificando la intensidad, calidad o extinguido y, por tanto, la emisin de la - Ante reforzadores secundarios (EC):
del intervalo R-E e ir aumentndolos cantidad del reforzador. conducta que habamos suprimido. saciando mediante sobre exposicin al EI
progresivamente. - Fortaleciendo alguna respuesta cuya del que se condicion el EC; mediante
Otras caractersticas: emisin sea incompatible con la anterior: contracondicionamiento (cambiar el signo
- El entrenamiento de omisin tiene en vez de castigar la respuesta, reforzar o del reforzador de positivo a negativo);
como efecto inmediato una tasa residual premiar la contraria. mediante extincin presentando el EC sin
de respuesta. ir seguido del EI.
- Esta tasa desaparece a largo plazo. - Ante reforzadores secundarios
- Se produce una eliminacin total de la generalizados (dinero, atencin): son
conducta. muy resistentes a la saciedad y a la
- Alta resistencia al recondicionamiento. extincin.
Utilizacin de la tcnica de contraste
conductual negativo.
TEMA 7: COTROL AVERSIVO EN EL CONDICIONAMIENTO OPERANTE
PROGRAMAS CONCURENTES Y ESTIMULACIN AVERSIVA
Conducta de Conducta auto-

eleccin controlada e impulsiva
Eleccin y Eleccin y Reforzamiento

reforzamiento negativo castigo negativo Castigo
Al igual que en los estmulos con El efecto del castigo en programas Conducta impulsiva: elegir el escape Conducta impulsiva: eleccin del
reforzamiento positivo, diferentes concurrentes ha sido menos estudiado. del evento aversivo con menor valor castigo de mayor intensidad o duracin,
experimentos demuestran que la Los diferentes estudios indican que relativo (menor tiempo de desaparicin pero ms demorado.
conducta de eleccin controlada por los sujetos son capaces de ajustar su del evento aversivo, menor reduccin Conducta auto-controlada: eleccin
reforzamiento negativo eleccin a ciertas caractersticas del de la intensidad del evento aversivo, del castigo ms leve pero inmediato.
(escape/evitacin) y analizada a travs castigo. etc.) pero ms inmediato. Resultados: varan en funcin de la
de programas concurrentes, tambin se Aunque la tasa de respuesta general Conducta auto-controlada: elegir el manipulacin de las variables (valor del
ajusta a la ley de igualacin. decrece (una vez se ha adquirido por evento con mayor valor relativo y ms estmulo y tiempo de demora). Por
Los sujetos reparten sus respuestas reforzamiento positivo), la tasa relativa demorado. ejemplo, cuando se aumenta la demora
entre las diferentes alternativas, en se ajusta a la frecuencia relativa de Resultados encontrados en los en los programas concurrentes
funcin de la frecuencia de castigo en cada alternativa. experimentos: mayor proporcin de encadenados, mayor es el nmero de
reforzamiento de las mismas. El incremento de la tasa relativa de elecciones impulsivas. elecciones auto-controladas.
La reduccin de la tasa de refuerzo castigo en una alternativa reduce la
negativo funciona de la misma manera tasa relativa con la que era elegida.
que la reduccin de la tasa de refuerzo
positivo.

Esquemas Llanos

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Esquemas Llanos

Diunggah oleh

Hak Cipta:

Format Tersedia

ANTECENDENTES HISTRICOS DE LA PSICOLOGA DEL APRENDIZAJE Llanos Mern.

Psicologa del aprendizaje

COMIENZOS DEL ESTUDIO DEL CC Y

Comienzos del estudio del Naturaleza de la

Condicionamiento Condicionamiento Seguimiento del Aprendizaje de

Procedimientos tpicos de CPE en funcin del intervalo entre estmulos (entre el

Condicionamiento Condicionamiento Condicionamiento Condicionamiento

Procedimientos tpicos de CPI: para que se desarrolle inhibicin condicionada es

Procedimiento estndar de Inhibicin Desemparejamiento Casos de inhibicin

Los siguientes fenmenos demuestran que durante la extincin no se elimina la

Desinhibicin Recuperacin Renovacin de la Restablecimiento de la

Intensidad Novedad: los estmulos novedosos provocan reacciones ms

Ej.: Amplitud de una RC

Naturaleza: tipos y relevancia

Contingencia Contingencia Contingencia

Frmula principal del modelo Rescorla-Wagner y otros fenmenos del aprendizaje:

Bloqueo, extincin e inhibicin condicionada

TEORAS DEL APRENDIZAJE:

Problemas del modelo y ejemplo de cmo utilizar las frmulas:

Problemas del modelo Ejemplo

OTRAS TEORAS DEL

Hiptesis del comparador Modelos atencionales Modelo SOP (Wagner)

Segn esta hiptesis la RC no solo depende de la Wagner sostiene que un estmulo

Thorndike y la Ley del El anlisis experimental del

El estmulo discriminativo La respuesta El reforzador

Reforzador- Respuesta discreta- Topografa- Instancia de respuesta Interacciones clsicas

PROCEDIMIENTOS BSICOS DEL

APETITIVO AVERSIVO Contingencia: relacin de dependencia funcional entre dos

Fenmenos que muestran

La conducta La deriva instintiva y el concepto Los cambios en la cantidad y

Experimento de supersticin (Skinner): pona palomas en Deriva instintiva: Tendencia de

La controlabilidad de las Los efectos de la demora del

Programas de reforzamiento continuo: en ellos, Programas de reforzamiento intermitente o parcial:

Programas de razn: el reforzador Programas de intervalo: la respuesta se

PROGRAMAS DE RAZN VS PROGRAMAS DE

Programas de razn vs Funciones de

TEORA Y PROGRAMAS DE REFORZAMIENTO

Teora del reforzamiento Programas de reforzamiento

Programas compuestos secuenciales de reforzamiento: Hace referencia a la

PROGRAMAS COMPUESTOS DE REFORZAMIENTO

RESUMEN: CLASIFICACIN GENERAL DE LOS PROGRAMAS COMPUESTOS.

Estudio y medida de la La ley de igualacin

CONCUTA DE ELECCIN LEY

Sesgos en el estudio de la Ley generalizada de

Cmo realizamos los clculos?: Deducir las

Aproximacin Aproximacin Mejoramiento

1 fase: eslabn de eleccin. El sujeto elige entre dos opciones de

El autocontrol se trata de elegir una recompensa grande pero demorada sobre

TEORAS E-E TOLMAN.

TEORA DE LA PRIVACIN DE RESPUESTA

TEORAS DEL APRENDIZAJE INSTRUMENTAL

Teoras E-R Teoras E-E

TEORAS DEL APRENDIZAJE INSTRUMENTAL

Teora de la probabilidad Teora de la privacin

Control Los estmulos de control en el CC son: los estmulos

Mtodos de medicin del Tipos de gradientes de

Mtodo Entrenamiento Prueba

Modulacin (control Discriminacin condicional

El estmulo condicional por s solo no controla ninguna respuesta, sino la

Desplazamiento del Efecto de la Tendencia

Generalizacin como proceso Hiptesis inversa: Teora atencional: Respuesta mltiple:

APETITIVO AVERSIVO De los cuatro procedimientos del CO

Entrenamiento de escape: la consecuencia aversiva est presente; no desaparece hasta

En todos los procedimientos el sujeto moldea su conducta para reducir al mximo su