Anda di halaman 1dari 19
Dos psicologias: El conductismo postskinneriano y la Psicologia cognoscitiva* Howard Rachlin*™” La esencia del conductismo skinneriano es su fe en que una ciencia completa de la conducta puede establecerse sin el uso de términos mentales. El precio que Skinner pagé por su rechazo de los térmi- nos “mentales” fue su aceptacidn de causas “internas” (Zuriff, 1979). Willard Day (1969) refiere de la manera siguiente, el inter- cambio entre Skinner y el filésofo Michael Scriven: “Skinner obje- ta... no lo privado, sino lo mental”. Este tipo de conductismo que aqui llamamos skinneriano, ha sido frecuentemente denominado “conductismo radical”. La eleccidn opuesta, la aceptacion de situaciones que son mentales y el rechazo de motivaciones que son (intrinsecamente) privadas reci- be, algunas veces, el nombre de “conductismo metodoldgico” y en ocasiones “conductismo légico”. El conductismo postskinneriano es técnicamente una forma de conductismo metodoldgico 0 ldégico, debido a que acepta los términos mentales y rechaza las causas internas. Enel siglo XX, el conductismo metodoldgico ha tomado muchas formas. Por un lado, el operacionismo psicolégico, como el de E.G, Boring.y S.S. Stevens (Stevens, 1936) que de acuerdo a la tradicion de Wundt y de Tichner (en una linea de maestro a alumno que iba * Este artfculo fue preparado con el apoyo de un subsidio de los Institutos Nacionales de Salud. z ** State University of New York at Stony Brook. 33 de Wundt a Titchner, de éste a Boring y de éste ultimo a Stevens), argiifa que las sensaciones no tenfan un cardcter privado pucs era factible identificarlas con las respucstas verbales y no verbales a los estimulos simples (la sensacién de “rojo”, por ejemplo, se iden- tificaba con la afirmacién verbal “veo un objeto rojo”, 0 su equiva- lente). Este punto de vista condujo a Skinner (1979) a seftalar: “Mientras el operacionismo de Boring le limita a basarse en mi conducta externa, yo todavia permanezco interesado en lo que po- dria denominarse el Boring desde dentro” (p. 295). El operacionismo psicolégico afirmaba que los estados psicolé- gicos mds complejos, al igual que las creencias, podian ser estudia- das, cientfficamente, s6lo en la extensién en que fueran analizadas en sus sensaciones componentes. De acuerdo a Stevens, “los datos de los sentidos” de naturaleza objetiva, no son s6lo fundamentales para la psicologfa, sino para todas las ciencias. No tinicamente las creencias individuales de todos los dias se supone que estén forma- das por sensaciones (en la forma como objetivamente las pucden medir los psicélogos), sino que también las teorfas cientificas es- lin, a fin de cuentas, basadas en los mismos elementos. La Psicolo- gia, en tanto se dedica a estudiar los informes de las personas sobre sus sensaciones, cs de acuerdo a Stevens, “la ciencia propedéuti- ca”, la que precede a todas las otras. Los “neo-realistas” como Holt (1915) también sefialaron que to- da la vida mental “est afuera”, en el mundo, Pero al contrario de Boring y Stevens, los neo-realistas concebfan a los objetos y a nuestras relaciones con ellos, como patrones temporalmente ex- tendidos, opuestos a las pronunciaciones verbales discretas. La diferencia entre los “neo-realistas” como Holt y los operacionistas psicolégicos como Stevens es paralela a Ia que aparece entre los gestaltistas y Wundt. El mentalismo de Wundt y el operacionismo de Stevens fucron moleculares y estructurales, mientras que el mentalismo de los gestaltistas y el operacionismo de Holt eran mo- lares y funcionales. El operacionismo neo-realfstico de Holt tuvo una fuerte influen- cia sobre Tolman (Smith, 1986) y J.R. Kantor (Zuriff, 1984) y en algtin sentido subyace al enfoque post-skinneriano. Hay empero, varias razones para no clasificar al conductismo post-skinneria- no como un mero neo-realismo: en primer lugar, los neo-realistas, 34 al explicar algin estado mental, como la conciencia, en térmi- nos de patrones temporalmente extendidos de conducta, identi- ficaban otros estados mentales con los objetos externos mismos. Los dolores y los colores eran tratados por los neo-realistas como ca- racteristicas que poscian los objetos en el mundo (al igual que las sillas y las mesas) y no como caracteristicas de la conducta. El post-skinnerismo (como yo lo concibo) es “completamente” con- ductista. Segundo, los neo-realistas no contaban con un método cientifico claro. Rechazaban la teorfa materialista del “rosario” de la causalidad (eficiente) pero no la sustituyeron por otra y por lo tanto, eran vulnerables a las criticas que actualmente les dirigen los fildsofos a los conductistas (metodoldgicos) de que si bien pueden explicar los estados mentales, no son capaces de explicar las inte- tacciones entre estados mentales. Fodor (1981, p. 5) dice: Las cau- sas mentales tienen efectos abiertos en virtud de sus interacciones mutuas. El conductismo no proporciona ningtin andlisis satisfacto- rio de las afirmaciones que articulan esa clase de interacciones. No obstante, el conductismo postskinneriano, no es vulnerable a la critica de Fodor. Como lo indica Kantor (1963), el conductismo moderno viene a ser el renacimiento del naturalismo aristotélico cn la ciencia, El conductismo skinneriano avanza en una mayor medi- da en esa direccién, El naturalismo aristotélico trata la interaccién entre estados mentales en los términos de una ciencia de las causas finales. Las causas finales interacttian entre si no como lo hacen las bolas de bi- llar (una bola empuja a la que Ie sigue) en la forma como lo plantea la “teoria del rosario” de la causalidad eficiente, sino como un con- junto de objetivos y de subobjetivos entremezclados a la manera como ocurre cuando, paso por paso, se construye una casa. El con- ductismo postskinneriano es, esencialmente, una versién empitica y experimental del andlisis aristotélico. El resto de este articulo esté dedicado a la presentacién de la Psi- cologfa post-skinneriana, con el fin de lograr lo siguiente: delinear en forma clara los lfmites entre el conductismo post-skinneriano y la psicologia, llamémosle, tipo, para asi asignarle a cada una su propio papel en el esfuerzo de comprender las mentes de los seres humanos y de los no-humanos; trazar el desarrollo del concepto de “reforzamiento” en el condicionamiento instrumental y su estado 35 — TRIMER cicro 7 SEGUNDO CicLO 1 meee. ¢ CINICOS. ESCEPIICOS, EsToIcos. | "TES Prraton’ Y 'y epicuncos tt { é ANTES 1 g SOCRATES ( \ 2 ty i is LOS FILOSOFOS @ i vcRecio my i E [DE LANATURALEZA iy Hi 7 t Fa ty conpucrismo & | & Hj I ty ' iam: \ ry EXPERIMENTACION 1 \ IFECHNER) t je 1 CUANTIFICACION I E (1 (kant, HERRARTY ie 1 g 1 i & 1 LOCKE, | 3% oy Lestiz & “oy DESCARTES F a, HOBBES | é TEBTULANO) || OST 1omas ' & PLOTINO’ SAN AGUSTIN, 1 SIGLOS ANTES DE CRISTO TIT yy, SIOLOS DESPUES DF CRISTO, © 2 ” 2 Re Re 9 @ 7 1 Figura 1. Los dos ciclos de Ia historia psicolégica. Tomados de Kantot (1963) p. 161. actual cn la psicologfa, como una causa final y por ultimo, de modo incidental, identificar a los psicélogos que se hallan comprometidos en Ja investigacidn postskinneriana (sin importar las protestas que ex- presan, pues como conductista y observador, me reservo el derecho de decirles lo que ellos realmente piensan). La emergencia del conductismo postskinneriano La diferencia mds importante entre Skinner y el conductismo post- skinneriano es la presencia de términos mentales en la corriente mencionada a! tiltimo y su ausencia en la primera. ¢Por qué la ciencia psicoldégica necesita términos mentales? Skinner (1 938) sefialaba que sdlo habfa dos tipos basicos de conducta: las respon- dientes, que son clases de conducta (como Ia dilatacién pupilar en una persona 0 [a salivacién en los perros) evocados por la estimula- cién que inmediatamente les antecede y las operantes, las cuales son clases de conducta que se hallan correlacionadas con las con- secucncias ambientales inmediatas. Como ejemplos de operantes 36 Se encuentran: las presiones de la palanca por parte de las ratas, los picoteos de las claves de respuestas por las palomas y toda la con- ducta animal que normalmente es considerada como voluntaria, Los aspectos del ambiente que son cruciales para la dindmica de las ope- tantes y de las respondicntes son los est{mulos que anteceden a las respondientes y los reforzadores de las operantes, consecuencias que por lo general, aumentan la tasa de emisién de las operantes (el condicionamiento operante estudia las relaciones entre operautes y reforzamientos). Asi mismo, son de importancia para las operantes, los estfmulos discriminativos en cuya presencia tiene lugar una determinada relacién operante-reforzador. Un ejemplo de estf{- mulo discriminativo es el letrero de abierto-cerrado en la puerta de una tienda que sefiala que hay una determinada relacién entre empujar la puerta (la Operante) y abrir la puerta (el reforzador). En ninguna parte hay términos mentales, Algunas veces Skinner (1953) ofrece “interpretaciones” en las que el uso de vocablos men- talistas en el habla cotidiana se explica en términos de operantes, reforzadores y estfmulos discriminativos. El autocontrol, por ejem- plo no viene a ser otra cosa que una operante de evitacién ante cier- tos estimulos discriminativos (‘Déjame esconderme de ti Satin”), como podria ser cruzar al lado opuesto de la calle, para evitar el olor evocativo de una salchichonerta, La terminologia no-mentalis- ta de Skinner ha servido muy bicn para el andlisis de operantes co- mo picoteo de claves por pichones, presiones de la palanca de las ralas y apretones de botones por parte de seres humanos (Honig y Staddon, 1977), Por otra parte, los patrones de conducta descubier- los en una situacién con una especie, aparecen en otras situaciones con otras especies. Estos patroncs cambian en una forma sistemati- ca con las variables motivacionales del tipo de la privacién del re- forzador y la dosis de una droga. Las técnicas skinnerianas han tenido mucho €xito en dreas de la terapia de conducta que van des- de el tratamiento de las psicosis severas al control del peso. La gran ventaja que tiene cuando se les aplica es que se enfocan sobre las consecuencias, lo que Skinner Ilama “las contingencias de reforza- miento”. Por ejemplo, muchas mujeres (y algunos hombres) sufren de agorafobia, se mantienen encerrados en Sus casas, tienen ataques de panico en los sitios publicos y consecuentemente se resisten a dejar sus casas. Cuando se buscan las causas y se plantea el trata- 37 miento de dicha conducta, los terapeutas de conducta skinnerianos, no consideran sélo los antecedentes, sino también las consecue " cias: evitacién del trabajo, evitacion de tentaciones sexu co atencion prestada por amigos y parientes, etc. Cuan 0 on Ja cone ducta que se ha vuclto poco funcional, se fees “ con cone cias, se hace posible, en muchos casos, el desarro oO “ " ‘pia exitosa mediante la sustitucién de la conduct inadecuada, po. s y que logre fines equivalentes. ; wa Benicas SianeHEnEs han sido igualmente exitonts cuando se les aplica a las tareas directivas en los tuegeslos y en Areas qn normalmente se consideran como cognitivas, como la ane la lectura y de las matemiticas a los nifios y en el nive’ I de oy Hios de preparatoria, la ensefianza de cursos como anatomia o leng oan embargo, a pesar de esos Exitos, no ha sido posible en el laboratorio operante o en muchas dreas de aplicacion ae ‘ ductismo skinneriano, dividir toda la conducta en sesporiien Sea operantes. Recuérdese que una respondiente debe corre acionar- se con un estfmulo que Ja anteceda y una operante oon un mi ie dor que sea su consecuencia. Qué, por ejemplo, refuerza ae de no aceptar un cigarrillo que se le ofrece a un fumador a ade ya no fumar? Para referirse a actos como esos y para establece: a‘ tamientos de los mismos, los terapeutas de conducta han tomado inos, ninguno de ellos satisfactorio. . SE Ean mn Homme (1965) permanecen leales al i aad mo skinneriano (cl conductismo radical) y han desattol a ° una psicologia operante del organismo “oculto 5 fable de a (Nota tes internas (cubiertas), operantes internas (cubiertany es H sh del traductor; neologismo que pretende seguir el sentido y las re- glas de formacién de “coverants” en inglés) y estimulos discrimi- nativos internos. De acuerdo a estos psicslogos, Ja pesom ead nicga aceptar un cigarrillo se refuerza a sf misma (se da za maditas en la espalda, por asi decirlo). Esta concepcién tiene pro momas ie gicos y empfricos. Légicamente, si una persona puede relorzat sus propias acciones por qué se retiene de reforzar alguio le a ace tos? ,Qué es lo que refuerza el proporcionar 0 el retire reo “a mientos? (Catania, 1975). Empfricamente no hay evidencia de q 38 el auto-reforzamiento trabaje, mds bien se tienen datos de que no trabaja (Castro y Rachlin, 1980). El otro camino tomado por los terapeutas de conducta les ha Ile- vado a la terapia conductual cognitiva (Mahoney, 1974). Los tera- peutas de conducta cognitivos retienen las técnicas skinnerianas para los actos que son claramente reforzados, Pero cuando los re- forzadores ambientales no son obvios 0 inmediatos, abandonan por completo el conductismo y se refieren a estados mentales, conside- rados como causas internas. De esta manera, la persona que se nie- gaa aceptar un cigarrillo, lo hace porque cree que éso cs mejor para su salud y porque desea ser saludable. Un terapeuta, entonces, lo que necesita es fortalecer las creencias y los descos de las perso- nas, mediante argumentos ldgicos 0 pidiéndoles a los pacientes que repitan aseveraciones sobre sus creencias 0 a través del re- forzamiento a dichas creencias. Incluso este tiltimo procedimiento es cognitivo, no conductual, pues descansa sobre la suposicién de que las aseveraciones s6lo hacen evidentes estados internos y que el reforzamiento no acttia, inicamente, sobre la aseveracién ex- terna, sino también sobre la creencia interna. Después de todo, es la negativa a aceptar cigarrillos (lo que la creencia se dice que cau- sa) lo que el terapeuta trata de fortalecer y no la aseveracion verbal. En principio no hay nada equivocado en la terapia cognitiva. Si las personas tienen creencias que constituyen estados internos y sus creencias producen acciones especificas, hay que cambiar la creen- cia para modificar la accién. Desde el punto de vista del conductismo ldgico o metodoldgico, los terapeutas cognitivos cometen lo que Ryle (1949) llama un “error categorial”. Si una creencia no es nada mds que un patron de acciones (como los conductistas postskinnerianos plantean), enton- ces Ja afirmacion de una creencia es meramente una de esas accio- nes. Cuando se altera la aseveracién, podria afectarse la creencia sdlo en la medida en Ja que se Ilegue a afectar una parte del patron, sin que se llegue a la fuente central de los distintos componentes del patrén en cuestién. La Quinta Sinfonia de Becthoven, por ejemplo, es un patron de notas con cuatro notas muy familiares al principio. Cuando se escuchan esas notas, tocadas por una orques- ta, se tiene répidamente la seguridad de que va a escucharse el res- to. Si se alteran esas cuatro notas, se modificard seriamente la 39 Quinta Sinfonia de Beethoven (en una extensidn, tal vez, que al- guien podria llamar al resultado de otra manera), pero ese cambio no tiene necesariamente ningtin efecto sobre las otras notas. Pero, de nuevo, quiz el conductismo ldgico esté equivocado. Es posible que haya un estado central, mds o menos innato, con una representacién mds o menos coherente en el sistema nervioso, que controle toda aquella conducta que para un observador externo constituya una evidencia de que la persona que se comporta de esa manera tiene creencias. Si se altera la creencia (como cuando se di- ce 9a. de Schubert en lugar de Sa. de Beethoven) entonces se alte- ran todos los que serfan sus efectos conductuales. Los terapeutas cognitivos, lo que tratan, entonces, es de encontrar los antecedentes centrales, las causas eficientes, el nticleo, el meollo, el origen, la c4mara de control de la conducta movida por creencias, la esencia misma de las creencias de las personas. El problema que tienen es que abandonaron lo que hizo el programa de Skinner exitoso —su concentracién en las consecuencias mds que en los antecedentes. Un terapeuta cuyo foco son las causas centrales eficientes (el cé6- mo) de las creencias de una persona, tiende a perder de vista que el reforzamiento (lo que obtiene una persona), otorgado a un cierto comportamiento —los efectos de la creencia de una persona en sus relaciones con su familia, amigos o con su ambiente en general— viene a ser el “porqué” de la creencia. Por supuesto, nada de esto importa en relacién con la efectivi- dad, demostrada, de la terapia cognitiva de conducta. Por desgra- cia, la terapia cognitiva de conducta ha comprobado ser tan efectiva como la terapia farmacoldgica (frente a problemas, como la depre- sidn clinica, por ejemplo), pero no ha probado ser mejor que la tera- pia de conducta sola, frente a la mayor parte de los problemas clinicos (Turk, Meichenbaum y Genest, 1983). Las razones de su popularidad actual, entonces, no se fundan en su éxito como trata- miento sino (supongo), en lo facil y segura que es su aplicacién. Si usted tuviera que extraer inferencias acerca de su conducta, lo mds probable es que hubiese menos probabilidad de que se le demostra- Ta su error, si sus inferencias sc reficren a estados mentales internos, invisibles, que si sus planteamientos hacen mencién a reforzadores, también invisibles. Los patrones conducta-reforzamiento pueden, 40 eventualmente, aparecer, pero los estados mentales internos, lo mas probable es que nunca se le aparezcan al terapeuta. Hay, empero, una tercera via que es factible seguir cuando se estd frente a un acto que aparentemente no tiene un estfmulo evocador y ningtn reforzamiento visible —la via del conductis- mo post-skinneriano, que trata el reforzamiento, no como un suce- so, sino como una relacién establecida, entre una conducta y su ambiente, a lo largo de perfodos muy prolongados. En los laborato- tios, los picotazos de las palomas, los apretones de palancas de las ratas, las presiones de botones de los seres humanos, son los obje- tos de estudio de los post-skinnerianos preocupados por encontrar las relaciones molares entre estas formas de comportamiento y sus reforzadores. Dentro del laboratorio skinncriano, el lenguaje (ope- rantes, respondientes, reforzadores, etc.) ha recibido pocas adicio- nes (tasas relativas de reforzamiento y de respuesta, la distincién entre tasas locales y totales) y ese conjunto de vocablos es por lo general, suficiente para describir las relaciones investigadas. Pero, incluso en el laboratorio post-skinneriano, no se encuentra la mis- ma disposicién anterior a usar con rigidez tales palabras. Términos co- mo “valor”, “auto-control”, “tentacién”, “memoria” y “libertad” han comenzado a aparecer en la literatura del condicionamiento ope- rante. En la medida en la que estos términos implican inferencias, se refieren a partes previas y subsecuentes a los patrones de con- ducta de larga duracién, mds bien que a fenémenos que ocurren en el interior del animal. Apuntan a algo que no pucde ser visto. Pero ese algo sc encuentra en el tiempo (antes y después del acto actual) y no en un espacio (el interior del organismo que realiza una deter- minada conducta). Debido a que los terapéutas de conducta se han inclinado por la primera de las dos vias (la terapia a la conducta cubierta 0 terapia cognitiva de conducta), la tercera via, el conductismo post-skinne- tiano, no ha sido aplicado por los psicdlogos o los fildsofos moder- nos a los problemas que se encuentran fuera del laboratorio (ver, sin embargo, Rachlin, 1980). Para encontrar un andlisis sélido y co- herente de tipo post-skinneriano, a las situaciones de la vida coti- diana, es necesario retrotraerse en cl tiempo y en el espacio hasta la antigua Grecia, a la ciencia de las causas finales de Arist6teles. 41 La siguiente seccién traza el desarrollo del concepto basico de rteforzamiento instrumental, desde sus inicios de tipo mecanicista, hasta su concepcioén contempordnea como causa final (en la forma de una funcién de utilidad econdémica). En el curso de esta seccién se describirdn algunos de los trabajos de laboratorios del moderno conductismo post-skinneriano, La tltima seccién intentaré ilustrar la compatibilidad existente entre los objetivos de la ciencia cognos- citiva y el conductismo, cuando se les analiza a través del concepto conductista y cognoscitivista de “probabilidad”. La probabilidad se eligié como un término ilustrativo, porque tiene un claro sentido conductual (una frecuencia relativa) y un sentido cognoscitivista, también claro (un estado de creencias). Ademds, mucha investiga- cién y reflexidn tedrica se ha realizado, en forma separada, para analizar a la probabilidad en los dos sentidos que previamente men- cioné y por otra parte, mi propia investigaci6n est dirigida a explo- rar las relaciones entre cl sentido cognoscitivista y conductual del término de probabilidad. El reforzamiento como una causa final El término reforzamiento fue usado por E.L. Thorndike (1911) para describir sus experimentos con gatos en “la caja de proble- mas”. Los gatos cran puestos en una caja de madera con un enreja- do, Para escapar de la caja los animales podian presionar una palanca, jalar una cuerda 0 alcanzar, a través del enrejado, cl pasa- dor de la puerta. Cuando se les introducfa por primera vez en la ca- ja, saltaban, daban de arafiazos en distintas partes, caminaban en circulos, etc., hasta que “accidentalmente” movian el mecanismo de escape. Esa secuencia era el primer “ensayo”. Con cada nuevo ensayo, se acortaba el tiempo necesario para que cl gato saliera de la caja, hasta que al Ultimo, bastaba con ponerlo en el interior de la caja para que de inmediato se dirigiera al mecanismo de escape pa- ra operarlo. Para explicar este proceso, Thorndike formulé la hipdtesis de que se formaban un conjunto de conexiones internas entre “la situa- ci6n” (el interior de la caja de problemas) y las distintas respuestas que el gato daba a esa situacién (olfateo, rascado, saltos, etc.). Ese 42 conjunto de conexiones internas formaba una “familia jerdrquica de habitos” en la que ciertas conexiones individuales son inicial- mente fuertes y otras mds débiles. Cuando al gato se le pone por primera vez dentro de la caja, recorre la jerarquia: Primero se acti- van las conexiones mas fuertes, luego las que les siguen en fuerza y asf de esa manera. Cuando, al tiltimo, una conexidn especifica per- mite la apertura de la caja, dicha conexién es “reforzada” (La ley del efecto de Thorndike). En la figura 2a. se ilustra el mecanis- mo descrito de reforzamiento. El reforzamiento sirve para elevar, dentro de la jerarqufa de h4- bitos, la conexidn que hay entre la representacidn interna del esti- mulo (E) y la representacién interna de la respuesta (R). Debido a que en el siguiente ensayo esa concxién es fortalecida, la res- puesta que permite abrir la caja llega a presentarse mds pronto, Tras muchos ensayos, dicha conexién interna se ha hecho tan fuerte (a) AMBIENTE ANIMAL SITUACION RESPUFSTA IMECANISMO, DE ESCAPE REFORZADOR (b) AMBIENTE ANIMAL SITUACION RED NERVIOSA CONTIGEN CIA OPERANTE REFORZADOR Figura 2. (a) El modclo de Thorndike del reforzamiento de las conexiones E-R. (b) La concepcién de Skinner del reforzamiento directo a las respuestas. 43 (se ha elevado tanto en la jerarquia en relacidn con otras respues- tas) que la respuesta de apertura de la caja ocurre casi de inmedia- to. Varios puntos deben ser notados en relacién con la ley del efecto. Primero, cs un modelo que bisicamente es “cognitivo”. Thorndike estaba interesado, sobre todo, en las conexiones existen- tes entre las representaciones internas de la situacién y la respuesta. El “aprendizaje” consiste en fortalecer tales conexiones. La con- ducta pone en evidencia que el aprendizaje ha ocurrido. Segundo, el modelo es relativamente simple. Es de notarse que no contiene ninguna representacién interna de los objetivos 0 propésitos del animal. La conducta propositiva, de acuerdo a Thorndike, emerge de la operacidn de los mecanismos descritos, sin que se forme una representacién coherente de los mismos. El modelo de Thorndike ces entonces, una forma simple de un buen ntimero de modelos cog- nitivos a los que Dennett (1978) Hama “sistemas intencionales”. Thorndike habia definido los reforzadores como objetos placen- teros y a los objetos placenteros como elementos a los cuales el or- ganismo gencralmente se acerca.! El sistema que Hull (1952) desarroll6 postcriormente, vino a ser una cuantificacién y elabora- ci6n del de Thorndike, con el agregado de que habia un mecanismo in- terno, distinto, que explicaba la activacién del reforzamicnto (pero sin indicar que existfa una representaci6n interna coherente del reforza- miento). De acuerdo a Hull, un reforzamiento ocurre cuando se re- duce una necesidad (posteriormente, un impulso). La privacién de alimento, por ejemplo, crea una necesidad que es reducida con la comida. De esta manera, cuando un animal privado de alimen- to, come, todas las conexiones E-R son activadas y reforzadas. En teoria, el psicélogo podria obtener del bidlogo una lista de lo que necesita un individuo de una determinada especie, para sobrevivir. Luego, el psicdlogo, podria privar al animal de alguno de esos ele- mentos necesarios para la sobrevivencia y usar ese elemento para reforzar cualquier conexién E-R. Las relaciones entre privacién, la cantidad del elemento proporcionado y la fuerza de la conexién E- R, deberian componer el conjunto de “leyes del aprendizaje”. Ese 1 El caso simétrico, los objetos displacenteros 0 dolorosos que reducen la fuerza de las conexiones, fue llamado por Thorndike “La ley negativa del efecto”. Es motivo de una fuerte disputa, que estd mds alld de nuestros pro- pésitos el presentar, si existe o no, una ley negativa del efecto o si de una manera més general, el castigo es simétrico al reforzamiento. 44 fue el programa que Hull intenté desarrollar para la psicologfa, un programa que recibié diversas criticas de Skinner y de Tolman. Tolman y sus estudiantes sefialaron, primero, que la reducci6n de necesidades no es necesaria ni suficiente para explicar el apren- dizaje.? Por ejemplo, la sacarina no reduce ninguna necesidad apa- rente de una rata y sin embargo, sirve, exactamente igual que la comida, para reforzar el aprendizaje del Jaberinto, mientras que unas vitaminas, que las ratas si necesitan, no funcionan (incluso en sus formas naturales) como reforzamiento. La reaccién de Hull an- te esa evidencia fue la de cambiar el concepto de “reduccidn” de ne- cesidad por el de “reduccién” de impulso. En lugar de referirse a la lista proporcionada por los bidlogos, los propios psicdlogos debe- rfan determinar, en un experimento, cudles eran los impulsos basi- cos de un animal. El problema con Ia reduccién de impulsos, que fue sciialado inmediatamente por Tolman y sus seguidores, radica- ba en que tan pronto como un nuevo reforzador se descubria, de inmediato se postulaba un impulso que le correspondiera. Por ejemplo, cuando se demostré que la oportunidad de jugar con un rompecabezas reforzaba el aprendizaje de varias respuestas en los monos, se propuso de inmediato un impulso para el juego, del mismo modo que se plantearon impulsos de curiosidad, de aprecio. de exploracién y tantos otros mas de la misma naturaleza, La reduc. cidn del impulso termin6 por convertirse en una teoria del refor- zamiento de muy diffcil manejo, no sélo por su circularidad (las concepciones circulares pueden ser muy utiles), sino debido a que al postular un mimero igual de impulsos y de reforzadores, la teorfa no proporcionaba elementos para organizar a los reforzadores. La objecion de Skinner al sistema de Hull no se dirigi6 a los pro- blemas suscitados por la naturaleza de los teforzamicntos, como lo ha- bia hecho Tolman (Skinner sentia que una vez que un reforzador era descubierto, sin importar lo que fuera, podia utilizarse con cualquier 2 La concepcién de Tolman (1949) de “mapas cognoscitivos, disponibi- lidad medios-fines y signos-expectactivas gestalticas”, como caracteristicas de los organismos, las cuales sirven de mediacidn entre los estimulos y las respuestas, fueron una elaboracién de los sistemas de Thorndike y de Hull que permitié plantear la existencia de representaciones internas coherentes de los propésitos y de los fines. El papel del reforzamiento como base auto. matica de la conducta con caracteristicas aparcntemente propositivas, fue minimizado en el modelo del aprendizaje de Tolman. , 45 operante). Lo que fue objeto de la critica de Skinner fue la suposi- cién, dentro del sistema de Hull, de que el reforzamiento actuaba para fortalecer una conexién E-R interna. El ncurofisidlogo She- rrington (1906) habia reiterado y demostrado de una manera enfati- ca, el argumento de Dewey (1906) de que los reflejos no existen como algo interno en el animal. Un estfmulo, de acuerdo a She- rrington, no tiene una representacién coherente interna (y menos las “situaciones”). La via que un estfmulo sigue en el sistema ner- vioso es segtin Sherrington, difusa. Sin embargo, en un lugar cercano al punto en el que la respuesta es disparada, la difusién se concentra en lo que dicho autor Ilamé la via final comin, Skinner (1938) analiz6 la evidencia disponible para demostrar que ni siquiera esa via final comtin del reflejo, tenfa una representaci6n interna co- herente. Una respuesta refleja, conforme a Skinner, se convierte en focal en la conducta “abierta”, la via final convin del reflejo es la respucsta misma (ver figura 2b). Un reflejo, scgdn este autor, es un fendémeno completamente abierto, una correlacidn entre un estimu- lo externo y una respuesta abierta. Si como Skinner sefialaba, no existe ninguna representacidn coherente en las conexiones estimu- lo respuestas, el reforzamicnto no puede fortalecer dichas conexio- nes. De acuerdo a Skinner, el reforzamiento fortalece, no las conexiones internas E-R, sino (a través de una red nerviosa com- pleja), la respuesta abierta misma. El paso importante siguiente en las concepciones modernas del reforzamienio lo dio David Premack (1965). Primero, Premack transformé la familia jerdrquica de habitos en una jerarquia skinne- riana de respuestas emitidas, no asociadas a los estimulos, Para Premack, todos los reforzadores son en realidad respuestas. El re- forzador, entonces, es comer la manzana. El ambiente contribuye proporcionando la oportunidad para que dicha respuesta se haga (ofrece la disponibilidad de la manzana). La posicién de una res- puesta en la jerarqufa de Premack (su valor) puede medirse (para un animal dado en un estado determinado) cuando se le pone en rela- cin con otras respucstas en pruebas de eleccidn. El reforzamiento por si mismo es la contingencia de una respuesta altamente valora- da sobre una respuesta de un valor inferior. La raz6n por la que una rata hambrienta eleva la tasa de apretones de la palanca después de que la comida se hace contingente con la opresi6n de la palanca, es 46 que la comida tiene, en las mediciones, un valor superior al de la presidn de la palanca (en otras palabras, la rata hambrienta eligira comer en lugar de presionar la palanca). La mayor parte del trabajo experimental de Premack sobre este t6pico consiste en demostra- ciones ingeniosas de la consistencia que existe entre el orden de respuestas en las pruebas de eleccién, la capacidad de la respuesta mds valorada para reforzar a la de valor inferior y la falta de capaci- dad de la respuesta con valores inferiores para reforzar a la que tic- ne valores superiores. Por ejemplo, si a una rata se le priva de la posibilidad de que realice una respuesta motora (como la de pre- sién de la barra), pero no se le priva de comida, la comida no refor- zara la presion de la barra sino que esta tltima seré la que refuerce la comida de la rata. k Notese lo que ha sucedido en el curso de la transicién de Thorn dike a Premack. La teorfa de Thorndike es una teoria del aprendiza- je. Algo permanente le ocurre a una conexién interna E-R cuando es fortalecida. Puede decirse que de esa manera el animal adquiere un reflejo o un hdbito. La teoria de Premack, empero, es, estricta- mente, una teoria del desempefio. Cuando se restauran las condi- ciones previas, el animal hace inmediatamente lo que antes habfa hecho. Si en una rata hambrienta, la comida se hace contingente con la presion de la palanca, aumentard entonces la presién de esta Ultima, sila comida se hace independiente de la presion de la palan- ca, la presion de la palanca bajard a su nivel anterior. Nada es fortale- cido en una forma permanente, nada cs aprendido. El interés del investigador ha cambiado, ya no se preocupa de las relaciones inter- nas en el animal sino que ahora presta mas bien atencién a las rela- ciones entre el animal y su ambiente, se ha dado un cambio de los esfuerzos de saber “cémo” ocurre la respuesta a tratar de saber “por qué” ocurre. El modelo de Premack depende, criticamente, de las pruebas de eleccién para poder determinar el valor reactivo de un par de res- puestas, sin embargo, las pruebas de eleccién pueden variar bas- tante y varios procedimientos de eleccién es posible que tengan resultados muy diferentes. Un método para obtener de mancra clara, sin ambigiiedades, el valor relativo de un reforzador enuna variedad de pruebas de eleccién, fue desarrollado por Richard 47 Herrnstein (1970) y William Baum (1973). La “Ley del aparea- miento” de Herrnstein (generalizada por Baum), dice: (R1/R2)=(r1/r2)s_ (1) Dicho lo anterior con palabras: En un experimento de eleccién, la proporcién de las tasas de un par de respuestas (R1/R2) iguala la proporcién de las tasas de reforzamiento (r1/r2) contingentes sobre de ellas, elevado a una potencia “s”. Se ha encontrado que la ecua- cién (1) de la ley del apareamicnto se aplica a cualquier contingen- cia respuesta-reforzador sin importar si R1 y R2 son tasas de la misma respuesta 0 si R1 se concibe como una respuesta discreta y R2 como cualquier accidén que el animal haga, diferente a la res- puesta discreta. No obstante, cuando R1 y R2 representan tasas de respuesta con valores casi equiparables (como serfa el que la palo- ma picotee, sea a la placa derecha 0 a la de la izquierda en la caja de Skinner), entonces, la proporcién de la tasa de respuestas (R1/R2) teflejaré, completamente, cl valor relativo de sus consecuencias (11/12). Entonces, la ley del apareamiento proporciona una especie de escala conductual para medir el valor relativo de los reforzadores. En tanto que constituye una generalizacién empirica, la ley del apa- reamiento ha recibido apoyo experimental de la misma manera que cualquier otra ley psicoldgica (William, 1988). Las variacio- nes que se le han hecho (Baum, 1973, Fantino y Davison, 1983), no han retado su validez empfrica basica. Un factor critico del éxito empfrico de la ley del apareamiento es su cardcter “molar”. Las tasas de respuesta (R1/R2) y las tasas de reforzamiento (r1/r2) se conciben, usualmente, como algo que ocurre en la misma situacién. Supongamos que en una sesi6n experimental de “T” minutos, una paloma picotea 100 veces un manipulandum (un disco iluminado o una clave de respuestas) y 50 veces otro, entonces R1 = 100/T, R2 = 50/T y R1/R2 = 100/50. Las tasas de reforzamiento (r1 y r2) son calculadas de manera co- rrespondiente. Ademés la relacién entre R1 y rl y entre R2 y r2 (la contingencia de reforzamiento) no necesita ser uno a uno, basta con que exista una correlacion positiva. En los experimentos de Skin- ner, los reforzadores individuales siguen inmediatamente a las res- puestas individuales, pero en la conducta de la vida cotidiana no se da el reforzamiento de modo tan répido y confiable. Para una perso- na que busca controlar su peso, por ejemplo, la relacién entre comi- 48 da y peso es mucho més vaga. Cuando entre respuestas y reforzado- res se programan en el laboratorio relaciones correlativas (como opuestas a las relaciones uno a uno) Ia ley del apareamiento todavia describe las elecciones del sujeto (Baum y Rachlin, 1969), El exponente “s” es una medida de “sensibilidad”. Cuando las respucstas individuales son discretas y discriminables (como dos claves para una paloma o dos palancas para una rata, comparadas con la eleccién que un estudiante pueda hacer entre dos escuelas) y ademas los reforzadores son independientes entre si (no son sus- titutos econémicos como una Coca o una Pepsi, ni complementos econémicos como el zapato izquierdo y el derecho), la sensibilidad Se acerca a la unidad. Empero, si estas condiciones patron son vio- ladas, la sensibilidad varfa de la unidad en una forma sistemdtica (Baum, 1974, Rachlin, 1978). Tal vez, la aplicacién mds significativa de la relacién de aparea- miento a los problemas de la vida cotidiana, la encontremos en cl area del autocontrol (Ainslie, 1975, Logue, 1988, Mazur y Logue, 1978, Rachlin y Green, 1972). En la medida en que maduran las personas se hacen mds sensibles a las tasas totales de reforzamiento y menos sensibles a los retardos individuales. Un nifio de 4 afios pucde preferir una barra de dulce hoy, en lugar de 10 barras mafia- na, pero se espera de los adolescentes que cambien un placer inme- diato por el trabajo que significa el estudio, gracias a la promesa de felicidad (0 evitacién de la miscria) que se les hace para afios fu- turos, Una implicacion de la ecuacién (1) del apareamiento se ilustra en la figura 3, Aqutse plantea que un animal tiene que clegir, no entre dos tasas de reforzamicnto en una situaci6n, sino entre dos situaciones. Una es de corta duracién con recompensas relativamente inmediatas (como ira una fiesta en la noche), Vamos a Iamarla situacidn “pla- centera”. La otra es de larga duracién con recompensas mayores pero relativamente retardadas (como estudiar 4 afios para obtener un grado y un mejor trabajo) a la que vamos a denominar situacién “buena”. En la figura 3 el grado de beneficio de la situacién “bue- na” resulta ser mayor que el de la meramente placentera. El hecho de que la situacién “buena” se tepresente a la derecha de la placen- 49 tera, indica que se alcanza en un tiempo posterior. Las lineas mds finas trazadas (abajo a la izquierda) desde la parte de arriba de las GRADO DE BENEFICIO. BUENO PLACENTERO f TIEMPO => Figura 3. Funciones de descuento en relacién con cl grado de beneficio presente a partir de una situacién placentera relativamente inmediata y una situacién buena relativamente més tardfa. El tiempo presente se mueve a lo largo de la abscisa. Iineas mds grucsas, representan las “funciones de descuento” que son predichas por la ley del apareamiento. Representan el “valor 50 presente” de una recompensa distante, en donde el “presente” se mueve con el tiempo a Jo largo de la abscisa. Las funciones de des- cuento aumentan con el tiempo de la misma manera que el costo de un compromiso se hace mayor en la medida que se acerca la fecha de su cumplimiento. Conforme pasa el tiempo y los retardos para las situaciones placenteras y buena se hacen cada vez mis cortos, el denominador de la fraccién, por el que se calcula la tasa de reforza- miento, se hace progresivamente m4s pequeiio, acercdndose a la unidad del tiempo. Cuando las situaciones buena y placentera son relativamente distantcs (en el punto “Y” en la figura 3) el valor pre- sente de la situacién “buena” es mds alto que cl de la meramente “placentera”. La ley del apareamiento predice entonces que la si- tuacién “buena” serd elegida en ese punto. De este modo, los estu- diantes son muy trabajadores al principio, antes de que las tentaciones aparezcan y el trabajo escolar se haga mas oneroso. Posteriormen- te, (en el punto X) los valores relativos de las condiciones alternali- vas se invicrten. Si una tarde en la que es necesario estudiar, alguien invita al alumno a una fiesta, puede verse que el hecho de que sucumba a la tentacidn, resulta de las interacciones entre las re- compensas y sus correspondientes retardos y no es el producto de una batalla “interna” (Esto no quiere decir que no ocurra batalla “jnterna” alguna). Los parémetros de las funciones de descuento de las palomas pueden ser muy diferentes a los de los seres humanos (segundos versus afios) pero se tiene evidencia (Rachlin, Raineri y Cross, en prensa) que la forma general (hiperbdlica) predicha por la ley del apareamiento, es la misma para ambas especies. Una implicacién de la figura 3 es que si en el punto Y se hace disponible una eleccién para “evitar’” la tentacién que surgiré en el punto X, el animal hard esa eleccién. Los pichones, por ejemplo, eligen comprometerse en esa via alternativa (Ainslic, 1975, Ra- chlin y Green, 1972) y los individuos humanos realizan, por su- puesto, una conducta semejante (Por ejemplo, si elijo que mi salario de 9 meses se extienda 12 meses y pierdo de esa manera el interés que gano, podrfa buscar recibir una pequefia cantidad adi- cional al término de los nueve meses que me evite tener la tentacién de gastar todo y quedarme sin dinero durante el verano de tres me- ses). El estudio de la tentacién, el compromiso, el retardo de la gra- S1 tificacién y el autocontrol en términos de funciones de descuento en los humanos y en los no-humanos es una rama activa de inves- tigacién, en la actualidad, dentro del conductismo post-skinne- riano, Mientras la respuesta de compromiso de una paloma puede con- sistir en el picoteo de una clave, las personas se comprometen, fre- cuentemente, a obtener recompensas mayores, aunque retardadas, mediante una reestructuracion de su conducta en unidades més lar- gas (que ocupan perfodos mAs extendidos de tiempo). Por ejemplo, Ja persona que planca su comida con un dia, una semana, 0 un mes de anticipacién, puede controlar su peso de mejor manera que el in- dividuo que tiene que hacer decisiones 10 0 20 veces al dia de co- mer 0 no, pequefios refrigerios. En la medida en que el patrén de la conducta humana se hace mds complejo, lo bueno obtenido es cada vez menos distinguible del patrén mismo. La ley del apareamicnto de Herrnstein dice que los patrones de conducta se aparean a los patrones de recompensa, pero esa formulacién pierde su sentido (como medio de medir el valor) cuando los dos lados de la ecuacién representan lo mismo. Por ejemplo, la persona cuyo patrén de comida es describible, tini- camente sobre largos periodos de tiempo, controla “ipso facto”, su propia comida. De manera similar, las formas complejas de arte, miisica y literatura, se dice que son buenas en virtud de la forma compleja que adquieren ellas mismas. Para poder lograr un desarrollo ulterior del concepto de reforza- miento (como un valor) se necesita tratar el problema de cémo el valor puede aumentar con la complejidad. Un enfoque destinado a ello, consiste en pedir prestado de la microeconomia el concepto de conducta individual dirigida a obtener la utilidad m4xima frente a varias constricciones (Allison, 1983, Hursh, 1978, Lea, Tarpy y Webly, 1987, Rachlin, Battalio, Kagel y Green, 1981, Staddon, 1979). La figura 4 muestra un modelo econdémico muy simplifica- do. Los cfrculos delgados representan los contornos de valor cons- tante de una funcidn de utilidad circular. Estos contornos pueden considerarse como los contornos de altitud en un mapa que repre- senta una colina que sube hacia arriba desde la derecha de su punto de origen (O). La linea diagonal gruesa representa una constriccién ambiental simple; la suma de las dos tasas de respuestas (R1+R2) 52 no puede exceder cierto valor fijo. Entonces, todas las combinacio- nes posibles de R1 y R2se hallan confinadas al tridngulo de la dere- cha formado por los dos ejes y la linea diagonal gruesa. El punto X representa el valor maximo (el punto més alto de Ia colina) que pue- de obtenerse bajo esa clase de constricciones. Modelos parecidos al que acabamos de presentar han mostrado ser capaces de explicar la conducta que aparece bajo los distintos tipos de programas de re- forzamiento estudiados por Skinner, asf como en las condiciones de eleccion mas complejas que permitieron derivar la ley del apa- teamiento de Herrnstein (Rachlin, 1978). Un zasgo critico de esos modelos es que el valor maximo obtenido con una sola respuesta es menor que el que podria obtenerse con una mezcla proporcional (un patrén) de las dos respuestas. En el grado en el que se agreguen mds dimensiones, el valor méximo obtenible es cada vez mayor, Consecuentemente, la complejidad aumenta el valor. , El procedimicnto empirico para investigar los modelos del tipo que ilustramos en Ia figura 4, es el que sigue: a) Obsérvense los patrones conductuales bajo un conjunto selec- cionado de constricciones ambientales. b) Infiérase una funcién de utilidad a partir de los patrones ob- servados, bajo la suposicién que la utilidad ser la maxima dentro del conjunto de constricciones observadas o impues- tas en cl paso a. c) Dada la funcién de utilidad y la suposicién de maximaliza- ci6n, hdgase una prediccion de la conducta bajo un conjunto nuevo de constricciones (atin no observadas). d) Revisese la funcién de utilidad sobre la base de la desviacion, que pudiera encontrarse entre la conducta predicha y la ana ducta real. El proceso planteado no es mas que una investigacidn destinada aencontrar las causas finales. El resultado del proceso relativo a la funcién de utilidad “es” una causa final en el sentido exacto que Aristoteles le daba al término, El concepto de reforzamiento de Skinner, del cual surgis el concepto post-skinneriano de funciones de utilidad conductual es a fin de cuentas, una version simple de una causa final. En la medida que el reforzamiento Mega a inferirse de observaciones de la conducta abierta (ya sea aumentos sim- ples de la tasa individual de tespuesta, resultados de una prueba de 53 ° R2 Figura 4, La tasa de una respuesta (R1) contra otra (2) la Afsea diagonal rape f iccid: debe exceder una s ad constriccién de que R1 mds R2 no : i ee circulares delgadas representan contornes ce igual, Valsts ae SontoF Cf A ntro qui dl ‘or valor se encuentran mds cercanos al ce! ! alors Jos, BI punto X ee el Valor més alto que se puede lograr bajo la constriocin impuesta. eleccién o conducta bajo constricciones) sin hacer referencias biologfa, la fisiologia o la introspecci6n, los reforzadores as{inferidos vienena ser causas finales en el sentido aristotélico. scitesiaurn La siguiente seccién ilustra la diferencia entre la psico gia co s noscitiva y la post-skinneriana en términos de las concepciones distintas que una y otra tienen sobre la probabilidad. 54 Probabilidad La figura 5 a pesar de sus complicaciones es una representacién simplificada de cémo los modelos cognoscitivo y conductual (a partir de este punto le vamos a quitar el adjetivo de post-skinneria- no y nos limitaremos a hablar de conductismo o de psicologia con- ductual, etc.) tratan conceptos idénticos. La doble linea vertical representa los I{mites entre una persona y su mundo. Nétese que cinco Ifneas horizontales, tres s6lidas y dos punteadas, cruzan los Ifmites. Las Ifneas sdlidas son las tres varia- bles conductuales criticas. La de arriba, dirigida hacia la persona, representa los “datos” o la informacidn, de cualquier tipo, recibida por la persona ¢ incluye estimulos del tipo de los silbatazos que dan los trenes, luces rojas y verdes de las senales de tréfico, o instruc- ciones proporcionadas por un psicdlogo a un sujeto experimental. Estos estfmulos informativos pucden funcionar de dos maneras: se- fialar resultados significativos (como los trenes que son sefialados por sus silbatazos o la comida que es sefialada por tonos sonoros en los experimentos de Pavlov). En estos tiltimos casos los fenédmenos Sefialadores se denominan “estimulos condicionados” o EC. La re- lacion de los EC a los fendmenos ambicntales significativos (esti- mulos incondicionados 0 ET) es independiente de la conducta del animal. En términos skinnerianos se trata de una relacién que viene a ser una “contingencia respondiente”, El proceso total, en el que quedan incluidos los efectos sobre la conducta, recibe el nombre de “condicionamiento respondicnte”. Alternativamente, la informacion podria sefialar, no un fend- meno significativo, sino la relacién entre una “conducta” y su “resultado”, una relacién que de acuerdo a Skinner se Jama “con- tingencia operante”. Los estimulos significativos que seiialan la pre- sencia de una contingencia operante se denominan estimulos “discriminativos”. Las luces rojas y verdes de las sefiales de tréfico indican la relacién que existe entre cruzar la calle y la probabilidad de tener un accidente (o ser multado) y vienen a ser estfmulos “dis~ criminativos” (0 ED). El proceso total, junto con sus efectos sobre la conducta, corresponde al “condicionamiento operante”.3 3,_ Hay un fuerte debate entre los conductistas (que ignoraremos por com- pleto aqui) acerca de si el condicionamiento respondiente es realmente una forma de condicionamiento operante o viceversa. 55

Anda mungkin juga menyukai