Anda di halaman 1dari 11

Facultad de Psicologa

Asignatura: Aprendizaje y Condicionamiento


Profesor: Pablo Adarraga <pablo.adarraga@uam.es>

UNIVERSIDAD AUTONOMA
DE MADRID

Prctica 1: Condicionamiento de una rata virtual


El trabajo se articula en tres partes:
1.- Establecimiento de un reforzador secundario.
2.- Moldeado de la R de presin de palanca
3.- Aplicacin de programas de refuerzo y extincin.

1.- Establecimiento de un reforzador secundario.


Se trata de entrenar a la rata mediante condicionamiento clsico, de forma que el sonido que
se produce al pulsar la palanca acte como un estmulo condicionado (EC) con valor apetitivo
para el organismo, y que como tal pueda ser utilizado como reforzador en fases posteriores.
Puesto que la RC que vamos a establecer es esencialmente una respuesta emocional
condicionada (REC) que no va acompaada de reacciones motrices que podamos observar
fcilmente, necesitaremos alguna forma de saber cmo progresa la adquisicin. En la vida
real tendramos que usar alguna tcnica de laboratorio para medir dicho progreso, pero con el
programa Sniffy es ms fcil, ya que nos permite "ver dentro de la mente" de la rata los
estados de las asociaciones que va aprendiendo.
Para ello, en el men Windows seleccionaremos "Mind windows" (ventanas de la mente), y en
el submen correspondiente, "operant associations".

Ahora tendremos en el espacio de la aplicacin una nueva ventana:

Las tres posibles asociaciones que aparecen estn todas "a cero", ya que estamos trabajando
con una rata ingenua (que todava no ha recibido entrenamiento alguno). A medida que
progresemos, los histogramas correspondientes nos permitirn ver el grado en que cada una
de esas asociaciones se ha establecido. De momento slo nos interesa la primera, sound-food
(sonido-comida), ya que vamos a usar el sonido de la palanca como EC y la comida que cae
en el comedero como EI.
Para ello vamos a seguir la siguiente regla:
Cada vez que la rata est cerca del comedero y orientada (mirando) hacia l, le
administraremos el EC seguido del EI.
Para administrar el par EC-EI basta con que pulsemos una vez la barra espaciadora o, como
alternativa, que hagamos click con el ratn sobre la palanca del comedero. Cualquiera de
estas acciones provocar el sonido caracterstico de la palanca (una especie de "clonc") que
usamos como EC, seguido rpidamente de la aparicin en el cuenco del comedero de una
pellet (un pequeo fragmento de comida), que acta como EI.
En esta fase es importante que la rata "vea" la comida nada ms sonar el EC, pues as la
demora EC-EI ser ms breve y la asociacin se establecer mejor. Mientras la rata
permanezca orientada hacia el comedero, consumiendo el ltimo EI que le hemos dado,
conviene aprovechar para darle ms pares EC-EI: podemos usar "rfagas", siempre y cuando
se mantenga bien orientada. En cambio, cuando la rata se aleje o mire hacia otros lugares no
debemos administrarle nada.
Si todo va bien, a los pocos minutos el organismo comenzar a aprender la asociacin
pavloviana entre el sonido y la comida, lo cual se manifestar en el histograma de la ventana
de asociaciones:

Si proseguimos unos minutos, la fuerza de la asociacin seguir creciendo:

Cuando la fuerza de la asociacin alcance las tres cuartas partes del mximo posible se puede
considerar suficiente (obsrvese la indicacin en la ventana lab assistant):

Como nos indica la ventana lab assistant, ya se puede utilizar el sonido de la palanca como
reforzador para moldear la conducta de la rata. Por tanto, el objetivo de esta primera fase
est cumplido.

2.- Moldeado de la conducta de presin de palanca.


Aunque es bastante probable que a estas alturas la rata ya haya presionado la palanca alguna
que otra vez, sern con seguridad muy pocas. El objetivo de esta fase es implantar la
conducta de presin de palanca con cierta estabilidad. Puesto que su tasa es muy baja o nula,
vamos a moldearla. Recordemos que el moldeado o shaping es el reforzamiento de
aproximaciones sucesivas a la conducta objetivo: vamos a ir reforzando conductas que cada
vez ms "lleven" al organismo a la que deseamos.
Dada la configuracin de la caja de Skinner que estamos usando, la rata debe alzarse sobre
sus patas traseras ("rampar") para poder accionarla. Por tanto, una posible secuencia de
moldeado es la siguiente:
a) Reforzamos la conducta de rampado en cualquier punto de la cmara.
b) Una vez que la conducta de rampado sea fuerte, la reforzamos slo si ocurre en las
inmediaciones de la palanca.
Con esto, la rata realizar muchos rampados cerca de la palanca, y acabar pulsndola
aunque sea por casualidad.
Una tpica conducta de rampado:

Empezaremos, pues, por reforzar este tipo de conductas en cualquier punto de la caja.
Para observar el progreso del moldeado nos serviremos de nuevo de la ventana de
asociaciones, pero ahora nos vamos a fijar sobre todo en el histograma de la derecha (action
strengh) que nos indica hasta qu punto ha resultado reforzada de momento la conducta
objetivo (el rampado, en nuestro caso). Al cabo de unos minutos de recompensar a la rata
por rampar, veremos fcilmente que tal conducta se produce con ms frecuencia y tendremos
ya una cierta altura en la barra:

Cuando el histograma supere aproximadamente la mitad, podemos pasar a recompensar slo


los rampados que se produzcan en la pared del fondo de la cmara y cerca de la palanca. Es

posible que la action strength se resienta un poco al hacer este cambio, pero ello debera ser
transitorio. Si vemos que decae demasiado, volvemos a reforzar los rampados en cualquier
parte de la caja durante un rato, hasta que el histograma suba un poco ms que la primera
vez.
Una vez que los rampados cerca de la palanca estn suficientemente reforzados, comenzarn
a aparecer cada vez ms frecuentemente las respuestas casuales de presin de palanca. La
barra central, bar-sound, que refleja la fuerza de la asociacin operante entre la presin de
palanca y el R+ secundario (el sonido) comenzar a crecer un poco tambin. Este es un buen
momento para hacer dos cosas:
a) Automatizar la administracin de recompensas al pulsar la palanca (si no lo hemos hecho
antes).
Para ello seleccionaremos en el men Experiment la opcin Design operant conditioning
experiment:

En el cuadro de dilogo que aparece, nos aseguraremos de que en el desplegable


Reinforcement action aparece seleccionada bar press.

Ahora la caja administrar automticamente comida cada vez que la rata presione la palanca.
b) Empezar a registrar la conducta de presin de palanca. Para ello, ponemos en marcha el
registro acumulativo, usando Windows | Cumulative records | Cumulative record:1

El registro acumulativo aparece en una nueva ventana, normalmente en la parte inferior de la


ventana del programa:

En todo caso, siempre podemos mover las ventanas a nuestro gusto para ver todo
cmodamente.

Ahora podemos ver temporalmente las Rs de presin de palanca que ha dado la rata hasta
ahora, ms las que sigue dando. Los trazos cortos oblicuos que cortan el registro acumulativo
indican los momentos en que la rata ha recibido recompensa.
Podemos seguir durante unos minutos recompensando manualmente los rampados en la
proximidad de la palanca, pero enseguida veremos que las respuestas de presin de palanca
van a ms. Esto se pondr de manifiesto tanto en el histograma bar-sound como en el
registro acumulativo:

A estas alturas ya podemos dar por concluido el moldeado. La rata seguir aumentando su R
de presin de palanca slo por efecto del R+ que le da automticamente la caja:

En este momento, tenemos la R de presin de palanca bajo refuerzo continuo, y podemos ver
que sigue fortalecindose hasta llegar al mximo. Por tanto, hemos cubierto el objetivo de
esta fase.

Merece la pena notar dos cosas: una, que ha aparecido una segunda ventana de registro
acumulativo. Esto se debe simplemente a que los registros en el programa Sniffy tienen una
longitud limitada; no reviste la menor importancia terica. Y dos, que el lab assistant nos
indica que la rata est lista para probar los efectos de distintos programas de refuerzo
(reinforcement schedules). Eso nos permite proceder a la ltima fase del trabajo.

3.- Aplicacin de programas de refuerzo y extincin


El objetivo de esta fase es aplicar a la rata los cuatro programas bsicos de refuerzo y realizar
dos extinciones de la respuesta de presin de palanca. La estructuracin temporal de estas
situaciones queda al arbitrio del estudiante. Por ejemplo, a partir de la rata condicionada en la
fase anterior, puede hacerse lo siguiente:
-

Aplicar programas RF de exigencia creciente (RF-5. RF10, etc.)


Pasar a programas IF (IF-10", IF-30"...)
Extinguir la R
Volver a aplicar refuerzo continuo
Pasar a programas IV
Pasar a programas RV
Extinguir la R.

O cualquier otra secuencia que el estudiante prefiera. Tambin existe la posibilidad de que
cada uno de los programas bsicos se apliquen siempre a partir del mismo fichero original (la
rata en refuerzo continuo) que se obtuvo en la fase anterior... o cualquier otra combinacin.

Para aplicar un programa de refuerzo a la rata, usaremos de nuevo Experiment | Design


operant conditioning experiment. Supongamos que deseamos programar la caja para que
aplique un RF-5. Entonces seleccionaremos las opciones marcadas en el cuadro:

A partir del momento en que pulsemos OK, la caja administrar recompensa a cada quinta R
(RF-5). En el registro acumulativo aparecer automticamente una anotacin del cambio de
programa que hemos hecho.
Otro ejemplo: para poner la cmara operante en IV-10", marcaramos estas otras opciones:

Y as sucesivamente. Para extinguir la R, simplemente seleccionaramos la opcin "Extinction".


Como es lgico, al realizar cada cambio tendremos que dejar a la rata un cierto tiempo en la
nueva situacin hasta que aprenda a amoldar su comportamiento a la misma.
Es importante tener en cuenta que los aumentos muy bruscos de exigencia pueden hacer que
la R se extinga. Por ejemplo, si pasamos directamente de RF-5 a RF-50, resulta probable que
se produzca extincin. Siempre que hagamos un cambio conviene vigilar los histogramas de
las fuerzas de asociacin, as como el registro acumulativo, para asegurarnos de que la
conducta de la rata se est adaptando.

Entrega del trabajo


Lo que se entrega para evaluacin del trabajo es lo siguiente:
- Portada adaptada a partir de la plantilla suministrada
- Extractos comentados de los registros acumulativos obtenidos en la fase 3.
La entrega debe realizarse en papel y con la fecha lmite indicada en la pgina de la
asignatura: http://www.uam.es/personal_pdi/psicologia/adarraga/cto-p1.html
Puedes descargar la plantilla de la portada en esa misma pgina.
Selecciona los fragmentos relevantes de los registros acumulativos obtenidos, es decir,
aquellos que muestren cambios (por ejemplo aumentos o disminuciones de la TR), efectos ya
conocidos (pausas post-reforzamiento, explosin de respuesta...) o patrones tpicos de los
distintos programas (tasa muy altas, festoneado, etc.)
Copia esos fragmentos mediante captura de pantalla y/o algn programa de edicin de
imgenes. Sirvindote de este ltimo, aade anotaciones e interpretaciones a los registros.
Puedes usar flechas y texto, bocadillos tipo comic... como prefieras. Por ejemplo: "Aqu se
observa que al pasar a RV-5 la TR comienza a subir", "esto parece un pico de respuesta", "la
TR se ha estabilizado", "aqu parece que comienza a decaer la TR"...
Una vez que lo tengas, lo grapas con la portada y listo. Aunque esto es lo nico que se
requiere a efectos de evaluacin, te animo a que explores otras opciones ms avanzadas que
ofrece el programa.
Si te surgen dudas durante la realizacin de la prctica, recuerda que el lugar preferente para
consultarlas es el foro de la asignatura.
Buena suerte :)

Anda mungkin juga menyukai