Aprendizaje T6

TEMA 6 PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIN -PROGRAMAS SIMPLES.
- razn fija - razn variable - intervalo fijo - intervalo variable -PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA - RDA (reforzamiento diferencial tasas altas) - RDB (reforzamiento diferencial tasas bajas) Hasta aqu incluyen UNA NICA RESPUESTA y el reforzamiento de esa respuesta no proporcionan una visin completa de la conducta. -ANLISIS DE LA CONDUCTA DE ELECCIN: - ELECCIN CON COMPROMISO: - programas concurrentes
- programas concurrentes encadenados
Un programa de reforzamiento: es un programa o regla que determina cmo y cundo la ocurrencia de una respuesta ir seguida de un reforzador. Estos programas se investigan normalmente en cajas de Skinner. Estudian muy bien LOS FACTORES que controlan el mantenimiento de la conducta y su realizacin continuada. Zeiler denomin a estos programas EL GIGANTE DURMIENTE del anlisis de la conducta 1.- PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE En estos programas SIMPLES 1 solo factor determina qu ocurrencia de la respuesa instrumental se refuerza. a.- PROGRAMAS DE RAZN El reforzamiento depende slo del nmero de respuestas que el organismo realiza. Se cuenta en n. de respuesta ocurridas y entregar el reforzador cada vez que se alcance el n. requerido. REFORZAMIENTO CONTINUO (RFC). Slo sucede en el laboratorio. REFORZAMIENTO PARCIAL O INTERMITENTE: las respuestas se refuerzan slo alguna vez. a.a.- RAZN FIJA: predictible (nmero predecible de respuestas para cada refuerzo). Cuando cada 10 respuestas apretar una palanca por cada reforzador RF 10. (pagar por el nmero de piezas que montan), etc..Es decir, un programa de reforzamiento continuo es tambin un programa de razn fija. Es un programa de
reformaziento continuo RFC (razn fija continua). Los organismos sueles responder a una tasa constante PERO moderada, slo se dan pausas breves e impredecibles. (una paloma, al principio picotear ms para conseguir comida y luego lo har ms lentamente a medida que sacie el apetito).Se da una tasa constante y alta una vez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar. Esta caracteristica de la respuesta se puede observar en un REGISTRO ACUMULATIVO DE LA CONDUCTA: representa la forma de repetirse una respuesta a lo largo del tiempo. (n. respuestas totales o acumuladas en un momento determinado de tiempo). La pendiente de la linea trazada por este registro representa la TASA DE RESPUESTA del sujeto. La tasa 0 de respuesta que se observa justo despus del reforzamiento se llama PAUSA POSREFORZAMIENTO. La longitud de esta pausa est controlada por el requerimiento de la razn subsiguiente . Por eso de llama tambin PAUSA PRERAZN LA CARRERA DE LA RAZN: es la tasa de respuesta ALTA y ESTABLE que completa cada requerimiento de la razn. Si el requerimiento de la razn se incremente un poco (de RF 120 a RF 150), la tasa de respuesta puede permanecer igual durante la carrera de razn, Con aumentos considerables ocurren pausas posreforzamiento ms largas. Este efecto se llama TENSIN DE LA RAZN por eso no hay que aumentar la razn requerida demasiado rpido, puede desistir por completo. Un programa intermitente de razn fija: se da un patrn de respuestas muy diferentes. No es probable pausas en medio de la accin de marcar un nmero de telfono, a.b.- RAZN VARIABLE: IMPREDECIBLE mediante la variacin del nmero de respuestas requerido para el reforzamiento de una ocasin a la siguiente. Sigue siendo de razn porque el reforzamiento depende del n. de respuestas que realiza el organismo. Este RV ( aqui se utiliza el nmero MEDIO (la media) de respuestas requerido, al principio 13, luego 7, etc... por eso RV 10): Como es impredecible las pausas son menos probables con esos programas RV (hay una tasa claramente estable). Se pueden dar pausas posreforzamiento pero son menos intensas b.:- PROGRAMAS DE INTERVALO tras cierta cantidad de TIEMPO b.a.- INTERVALO FIJO: cantidad FIJA de tiempo IF 4 minutos el tiempo establecido no varia de una ocasin a otra. El patrn de respuesta se llama FESTN DEL INTERVALO FIJO. Un IF 4 minutos no garantiza que el reforzador se proporcionar en algn momento a los largo del intervalo de tiempo. Se requieren respuestas como en RAZN. El intervalo determina slo cundo el reforzador est disponible, NO cundo se entrega (programacin de los exmenes se parecen al IF, al principio se dedica poco
tiempo al estudio, se estudia ms una semana antes del exmen, la tasa se incremente cuando se aproxima el da de examen). b.b. INTERVALO VARIABLE TIEMPO IMPREDECIBLE IV tiempo impredecible para dispensar el reforzador . Es un intervalo MEDIO (la media) IV 2 minutos . Se tiene que realizar una respuesta. Los reforzadores no se dan gratis. No hay pausas con tasas de respuestas CONSTANTES. b.c.- PROGRAMAS DE INTERVALO Y ESPERA LIMITADA Son programas FUERA de laboratorio, el reforzador est disponible SLO durante PERIODOS LIMITADOS. (horario restaurantes). Este tipo de RESTRICCIN en cuanto al tiempo que permanece el reforzador disponible se llama ESPERA LIMITADA.Esta restriccin se puede aplicar tanto a IF como a IV. COMPARACIN DE LOS PROGRAMAS DE RAZN Y DE INTERVALO RF y IF: ambos producen una pausa posreforzamiento despus de de la administracin de cada reforzador. Ambos reciben altas tasas de respuesta JUSTO ANTES de la administracin del siguiente reforzador. RV y IV: mantienen tasas estables de respuestas SIN PAUSA PREDECIBLE. Los programas de razon y intervalo activan DIFERENTES CAMBIOS NEUROQUMICOS en el cerebro. Los programas de razn son capaces de producir tasas de respuesta MS ALTAS que los programas de intervalo. El factor crtico es el espaciamiento entre respuestas que se da justo antes del reforzamiento. Reforzamiento diferencial del tiempo interrespuesta: TIR Es el intervalo entre una respuesta y la siguiente TIR o tiempo interrespuesta. Si se refuerzan los TIRs cortos = el sujeto realiza TIRs cortos. Si se refuerzan TIRs largos = realiza TIRs largos. Con TIRs cortos = responder a una tasa ALTA. Sujeto que produce TIRs largos, responder a una tasa baja. Un programa de razn = favorece que no se espere mucho entre las respuestas.Favorece tiempos interrespuesta cortos Un programa de intervalo =no favorecen los TIRs cortos, sino una ejecucin con TIRs largos, que deriva en tasas de respuestas ms bajas que en razn. PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA: fuera del laboratorio, en situaciones que requiere tasas de respuesta particulares (deporte de velocidad , cadena de montaje) Ni razn e intervalo requieren una tasa especifica de respuesta para conseguir el reforzamiento. Los programas de tasas de respuesta requieren una tasa particular para obtener el reforzador. Depende aqu de cun pronto ocurra tras la respuesta precedente. Por ejem. Que una respuesta se refuerce slo si ocurre 5 segundos
siguientes a la respuesta precedente.Entonces su tasa de respuesta ser de 12 por minuto o mayor RDA (Reforzamiento diferencial de tasas altas). Fomenta tasas altas de respuesta. En RDA una respueta se refuerza slo si ocurre ANTES de que haya transcurrido cierta cantidad de tiempo TRAS la respuesta precedente. EL reforzamiento diferencial de tasas bajas RDB fomentan que los sujetos respondan lentamente, pues se refuerza una respuesta SOLO si ocurre DESPUES de que haya transcurrido cierta cantidad de tiempo desde la respuesta previa. CONDUCTA DE ELECCIN: PROGRAMAS CONCURRENTES( al mismo tiempo 2 ms programas) La situacin de eleccin ms simple = 2 respuestas alternativas, cada una de stas seguidas por un reforzador de acuerdo con su propio programa de reforzamiento. Se empez estudiando la conducta de eleccin utilizando LABERINTOS en T especialmente. Actualmente se utilizan cajas de Skinner equipadas con 2 manipulandos, como 2 teclas de picoteo. Los 2 programas ocurren al mismo tiempo (o concurrentemente) El sujeto es libre de cambiar de una tecla de respuesta a la otra PROGRAMA CONCURRENTE que permiten una medicin continua de la eleccin. Programa A (IV 60 seg.) Tecla A Programa B (RF 10) Tecla B
LAS MEDIDAS DE LA CONDUCTA DE ELECCIN Entre 2 respuesta alternativas. Hay 2 formas de medicin: 1.- calcular la TASA RELATIVA DE RESPUESTA de cada alternativa. Es decir de la tecla A se divide su tasa de respuesta por la tasa total de respuesta: RA/ (RA + RB) La forma de distribucin de la conducta entre las 2 alternativas de respuesta est muy influida por el programa de reforzamiento que funciona en cada respuesta. 2.- calcular la TASA RELATIVA DE REFORZAMIENTO conseguido para cada alternativa de rspuesta se calcula igual que la anterior: rA/ (rA + rB) LA LEY DE LA IGUALACIN La tasa relativa de respuesa y la tasa relativa de reforzamiento son iguales. Herrnstein establece esta relacin como una ley de conducta. - La primera expresin matemtica:
RA/(RA +RB) = rA/rA + rB) Como antes RA y RB = tasas de respuesta en las teclas A y B rA y rB = tasas de reforzamiento conseguidas en cada alternativa de respuesta. - La segunda expresin matemtica: RA/RB = rA/rB Representan el mismo principio bsico: Las tasas relativas de respuesta se IGUALAN con las tasas relativas de reforzamiento INFRAIGUALACIN, SUPRAIGUALACIN Y SESGO DE RESPUESTA La Ley de igualacin indica que las elecciones NO se hacen de forma caprichosa (son una funcin ordenada de las tasas de reforzamiento). Actualmente las tasas relativas de respuesta NO SIEMPRE se igualan exactamente con las tasas relativas de reforzamiento. Se aaden 2 parmetros b, s a la frmula RA/RB = b(rA/rB)elevado el parentesis a s) S= representa la SENSIBIIDAD de la conducta a la eleccin a las tasas relativas de reforzamiento. Cuando existe una igualacin perfecta s = 1, las tasas relativas de respuesta son una funcin DIRECTA de las tasas relativas de reforzamiento. INFRAIGUALACIN:un tipo de desviacin perfecta incluye una sensibilidad reducida de la conducta de eleccin a las tasas relativas de reforzamiento y se acomoda dando al exponente s un valor MENOR a 1. Se encuentra la infraigualacin ms a menudo que la supraigualacin. Hay muchas variables que influyen. Hacer ms difcil el cambio de una alternativa de respuesta a otra INCREMENTE el parmetro de sensibilidad. SUPRAIGUALACIN :se acomodan los resultados dotando al exponente de un valor MAYOR a 1. B= sesgo (en ingls bias). Estos sesgos influyen en las respuestas cuando las alternativas de respuesas son DIFERENTES . Una preferencia (o sesgo) por una respuesta o un reforzador sobre la otra influye en el parmetro del sesgo b. Si no hay sesgos b= 1. LA LEY DE LA IGUALACIN Y EL VALOR DEL REFORZADOR La relacin de igualacin se ha extendido a otros aspectos de los reforzadores distintos de su tasa de ocurrencia. La tasa relativa de respuesta es una funcin de la cantidad relativa de cada reforzador, y la demora relativa del reforzamiento. La tasas relativas de respuesta estn determinadas por la PALATABILIDAD de los reforzadores( Cualidad de ser grato al paladar un alimento.) Cuando mayores, ms sabrosos y ms inmediatos sean los reforzadores, mayor ser el
valor. No se sabe cmo se combinan las diferentes caracteristicas para determinar su valor. LA LEY DE LA IGUALACIN Y LOS PROGRAMAS SIMPLES DE REFORZAMIENTO Incluso las situaciones de respuesta nica pueden involucrar una ELECCIN. La eleccin es realizar la respuesta especificada y ocuparse en otras posibles actividades . Esto permite la aplicacin de la ley de la igualacin a programas de reformaziento de respuesta nica. Aunque recientemente se pone en duda. MECANISMOS DE LA LEY DE IGUALACIN Es una ley DESCRIPTIVA de la naturaleza y no una ley mecanicista (no explica los mecanismos que son responsables de la distribucin de las respuestas). Esta ley ignora CUNDO se realizan las respuestas individuales. TEORIAS MOLARES: explican agregados de respuestas y se relacionan con la distribucin total de respuestas y reforzadores en las situaciones de eleccin, TEORIAS MOLECULARES se centran en lo que ocurre alnivel de las respuestas individuales y consideran la igualacin como el rsultado neto de estas elecciones individuales. TEORIAS DE MEJORAMIENTO: caracteristicas de la conducta que no son ni molares ni moleculares, sino algo intermedio entre ellas. IGUALACIN Y MAXIMIZACIN DE LAS TASAS DE REFORZAMIENTO La conducta de eleccin : se basan en la idea de que los organismos DISTRIBUYEN sus acciones entre las alternativas de respuestas para recibir la MXIMA cantidad de reforzamiento posible. Esta idea de que los organismos MAXIMIZAN el reforzamiento se utiliza para explicar la conducta de eleccin en los distintos anlsis:Los mecanismos son: 1.- MAXIMIZACIN MOLECULAR: siempre se elige cualquier alternativa de respuesta con MEJORES PROBABILIDADES de que sea reforzada en ese momento. Se centran en las tasas GLOBALES de respuesta y reforzamiento, calculadas sobre la duracin total de una sesin experimental. 2.- MAXIMIZACIN MOLAR: el organismo distribuye sus respuestas entre las VARIAS ALTERNATIVAS a fin de maximizar la cantidad de reforzamiento que consiguen a la LARGA. Se centran en agregados de conducta sobre algn periodo de TIEMPO ms que enlas respuestas de eleccin indivdual 3.- MEJORAMIENTO operan en una escala TEMPORAL que est entre molar y molecular. Se refiere a hacer algo mejor. Es la meta ms modesta (o inocente) de slo hacer que la situacin sea mejor. (mejor de cmo esa situacin ha sido en el pasado reciente). Los resultados a una situacin limitada (no en su totalidad a
largo plazo). Las tasas LOCALES se calculan sobre el periodo de tiempo que un sujeto dedica a una alternativa particular de respuesta. Esta tasa es siempre MAYOR que su tasa global. La teoria de mejoramiento asume que los organismos cambian de una alternativa de respuesta a otra para MEJORAR la TASA LOCAL de reforzamiento que estn recibiendo. El mecanismo de mejoramiento da como resultado LA IGUALACIN. ELECCIN CON COMPROMISO Se die a la gente que carecce de AUTOCONTROL si elige una recompensa pequea a corto plazo en lugar de esperar para conseguir un beneficio mayor pero ms demorado LOSPROGRAMAS CONCURRENTES ENCADENADOS DE REFORZAMIENTO Programa A (RV 10) * * Programa B (RF 10) * *
Eslabon terminal TECLA A
Eslabn terminal TECLA B Eslabn de eleccin(no es el reforzador primario)
Hay 2 fases o eslabones: Durante la primera fase el ESLABON DE ELECCIN elige entre 2 programas alternativos. Responder a este eslabon de eleccin NO PROPORCIONA RESULTADOS, slo cuando se encuentre en le ESLABON TERMINAL. Cuando se escoge A o B est comprometido hasta el final del eslabn terminal del programa por eso implican ELECCI CON COMPROMISO Se prefiere la alternativa de razn variable. RV . La variedad parece ser la SAL DE LA VIDA. El eslabn terminal se convierte en REFORZADOR CONDICIONADO, La conducta de eleccin est gobernada tanto por los programas de eslabn terminal como por cualquier programa que funcione en el enlace inicial. ESTUDIOS DE AUTOCONTROL Autocontrol: es elegir una recompensa grande demorada sobre una recompensa pequea inmediata. El autocontrol es ms fcil si la alternativa tentadora (un pastel) no est tan claramente disponible (en la carta hay pastel y verduras). Una propiedad general de la conducta de eleccin: Si las recompensas se entregan rpidamente tras una rspuesta de eleccin, los sujetos generalmente PREFIEREN una recompensa pequea inmediate ms que una recompensa grande demorada. Sin embargo, si se aade una demora CONSTANTE a la entrega de ambas recompensas, los sujetos muestran autocontrol y prefieren la recompensa grande demorada.
EXPLICACIONES DEL AUTOCONTROL Principio general: el valor de un reforzador se REDUCE en funcin de cunto tiempo se tiene que esperar para obtenerlo. La frmula para esta reduccin en el valor se llama FUNCIN DESCONTADORA DEL VALOR. V= M/(1+ KD) FUNCIN DEL DECAIMIENTO HIPERBLICO M= magnitud de la recompensa D= demora de la recompensa K= parmetro de la tasa descontadora Cuando se entrega el reforzador sin demora D=0, el valor del reforzador est directamente relacionado con su magnitud (los reforzadores ms grandes tienen valores mayores). Incrementar la demora de las recompensas grande y pequea hacce ms FCIL que se muestre autocontrol seleccionando el reforzador ms grande pero con ms demora. LAS FUNCIONES DESCONTADORAS Y LOS PROBLEMAS DE AUTOCONTROL EN LA ADICCIN A LA DROGA El abuso de sustancias frecuentemente REFLEJA una serie de elecciones IMPULSIVAS. Las funciones descontadoras de la recompensa era mucho ms acusada para los adictos a la herona, es decir, el valor del dinero DISMINUYO muy rpido si la recepcin del dinero iba a demorarse. Esta funcin acusada del descuento de la recompensa indica UNA FALTA DE CONTROL es decir, IMPULSIVIDAD. PUEDE ENTRENARSE EL AUTOCONTROL? S. Una persona que no puede tolerar esperar el tiempo necesario para obtener recompensas grandes tiene que olvidarse de obtener estos reforzadores. Siempre y cuando las tareas de entrenamiento implicasen BAJO ESFUERZO, el entrenamiento con la recompensa demorada INCREMENT la preferencia por la recompensa ms grande demorada. Por lo tanto, el entrenamiento con reforzamiento demorado produce AUTOCONTROL.

Aprendizaje T6

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Aprendizaje T6

Diunggah oleh

Hak Cipta:

Format Tersedia

TEMA 6 PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIN -PROGRAMAS SIMPLES.

- programas concurrentes encadenados

Eslabon terminal TECLA A

Eslabn terminal TECLA B Eslabn de eleccin(no es el reforzador primario)

Anda mungkin juga menyukai