Anda di halaman 1dari 35

1690 1898 1900-1930 Década de 1920

A mente como uma tábu/a A lei do efeito Edward Aprendizagem por O surgimento do
rasa A partir de idéias que Thorndike propõe a Lei do associação O fisiologista behaviorismo John 8.
remontam a Aristóteles, o Efeito, que mostra que os russo Ivan Pavlov faz a primeira Watson propõe a teoria do
filósofo John Locke argumenta comportamentos que levam a demonstração empírica de uma behaviorismo, que enfatiza que
que todo o conhecimento é resultados satisfatórios aprendizagem associativa todo comportamento é
adquirido pelo contato com o provavelmente serão repetidos. simples, tal como um cão determinado por forças externas
ambiente. associando o som de uma e que só os comportamentos
campainha à chegada de que podem ser manipulados e
alimento. observados têm valor para a
ciência psicológica.
1930-1960 1940-1950 1948 Década de 1960 Década de 1960-90
Aprendizagem por Abordagem cognitiva à Aprendizagem por alteração Teoria da aprendizagem Aprendizagem como um
reforço B.F. Skinner aprendizagem Edward sináptica O psicólogo social Acreditando que o mecanismo evoluído John
desenvolve a teoria do Tolman, entre outros, estabelece canadense Donald Hebb propõe behaviorismo ignora o contexto Garcia argumenta que certos
condicionamento operante, que os fundamentos da revolução que a aprendizagem resulta de social da aprendizagem, Albert tipos de aprendizagem
afirma que os comportamentos cognitiva na psicologia, alterações nas conexões Bandura mostra que as pessoas envolvem mecanismos especiais
são controlados por reforço ou argumentando que a sinapticas. A ciência psicológica aprendem comportamentos ao que evoluem por meio da
punição. O metada de aprendizagem não e a mudança tem demonstrado que os observar se os outros são seleção natural.
modificação de comportamento, no comportamento como tal, e princípios básicos dessa proposta recompensados ou punidos por
amplamente utilizado, baseia-se sim a aquisição de novos estão certos apresentar aqueles
nessa teoria. conhecimentos ou cognições. comportamentos.
182 GAZZANIGA e HEATHERTON

O
s soldados americanos que lutaram no Vietnã usavam drogas com
freqüência para lidar com as condições infernais da guerra. As estimativas
sugerem que, na década de 1960, o uso de drogas entre os soldados
americanos, incluindo substâncias narcóticas como heroína e ópio, atingiu
proporções epidêmicas. O difundido uso de drogas não foi muito surpreendente -
a década de 1960 foi uma época em que os jovens experimentaram uma variedade
de drogas, os soldados tinham fácil acesso a muitas delas e as drogas eram
temporariamente efetivas para ajudá-los a lidar com os horrores da guerra . Eles as
utilizavam para lidar com o medo, a depressão, a saudade de casa, o tédio e a
repressividade dos regu lamentos do exército. Os soldados também eram atraídos
pelas qualidades euforizantes e recompensadoras das drogas: eles gostavam de
ficar "altos". Embora o exército estivesse ciente do uso de drogas pelos soldados,
isso era praticamente ignorado, visto como algo que al iviava a pressão que eles
sofriam .
Começando em 1971, o exército passou a testar obrigatoriamente os soldados
quanto ao uso de drogas, a fim de identificar e desintoxicar os usuários antes de
eles voltarem aos Estados Unidos. Mais de 1 em 20 soldados testaram positivo para
drogas narcóticas, mesmo sabendo antecipadamente que seriam testados .
Imaginando que muitos dos que não conseguiam ficar sem a droga sequer por um
curto período de tempo teriam se tornado adietas a narcóticos, os responsáveis
temeram que uma multidão de soldados aditas retornando do Vietnã invadissem as
instituições de tratamento existentes. A Casa Branca pediu a uma equipe de
cientistas comportamentais que acompanhassem um grupo de soldados que est ava
retornando, para avaliar a extensão do problema de adição.
Chefiada pela epidemiologista comportamental Lee Robins, a equipe de
pesqu isa exam inou uma amostra aleatória de 898 soldados que deixaram o Vietnã
em setembro de 1971. Robins e colaboradores encontraram níveis extremamente
elevados de uso de drogas entre os soldados estadunidenses no Vietnã (Robins et
ai., 1975). Mais de 90% relataram beber álcool, quase três quartos usavam
maconha e quase metade usava narcóticos como heroína, morfina e ópio.
Aproximadamente metade dos soldados que usavam narcóticos tinha sintomas de
Quais são os mecanismos básicos
responsáveis pela aprendizagem? adicção ou acreditava que não conseguiria abandonar o hábito de usar drogas. Os
achados sugeriam que aproximadamente 1 soldado em 5 dos que voltavam do
Como o comportamento é
moldado por recompensas e Vietnã era adieto. Dada a idéia prevalente de que a adicção era um transtorno
punições? biológico com uma baixa taxa de recuperação, esses achados indicavam que
O que é aprendido observando- dezenas de milhares de adietas de heroína logo estariam inundando as cidades dos
se os outros? Estados Unidos. Mas isso não aconteceu.
Por que certas experiências são Robins e colaboradores examinaram o uso de drogas entre os soldados depois
recompensadoras? que eles voltaram aos Estados Unidos. Dos que aparentemente estavam ad ietas a
Qual é a base neural da narcóticos no Vietnã, só metade buscou drogas ao voltar aos Estados Unidos, e um
aprendizagem? número ainda menor manteve a adicção a narcóticos. Aproximadamente 95% dos
adietas já não usavam drogas alguns meses após seu retorno, o que é um índice de

1972 1970-Década de 90 Década de 1990-


Expectativas e As bases neurais da 2000
aprendizagem Robert aprendizagem Os estudos de
Modelos de redes neurais
Rescorla e Allan Wagner Eric Kandel sobre os mecanismos
baseadas em computadores
propõem que a aprendizagem celulares e moleculares da
Computadores modernos super-
ocorre quando os organismos aprendizagem em um tipo de
rápidos permitem que os
desenvolvem expectativas que criatura invertebrada recebem
cientistas desenvolvam modelos
lhes permitem predizer eventos um prêmio Nobel em 2000.
de aprendizagem de rede
futuros.
neural.
CIÊNCIA PSICOLÓGICA 183

abandono espantosamente elevado, considerando-se que o índice de sucesso dos


aprendizagem Uma mudança
"'lelhores tratamentos é, tipicamente, de apenas 20%-30%. Um estudo de
duradoura de comportamento
seguimento de longo prazo realizado no início da década de 1990 confirmou que resultante da experiência.
::>oucos dos que eram adictos no Vietnã continuaram adictos.
Como é possível que indivíduos adictos a narcóticos tenham conseguido,
simplesmente, abandoná-los ao mudar de ambiente? Nós encontraremos algumas
elas respostas neste capítulo quando examinarmos o impacto do ambiente e das
'ecompensas sobre a aprendizagem, incluindo como as pessoas desenvolvem
'lábitos como uso de drogas e os fatores que mantêm esses comportamentos .

..\ aprendizagem é uma mudança relativamente duradoura de comportamento resultante da ex-


Jeriência. Ela ocorre quando os organismos se beneficiam da experiência para que seus futuros
comportamentos sejam mais bem adaptados ao ambiente. Os teóricos da aprendizagem costumam
focar o comportamento observável e não os estados internos ou os processos mentais, uma aborda-
gem às vezes referida como behaviorismo. A aprendizagem compartilha aspectos comuns com a
memória (o que discutiremos no próximo capítulo), no sentido de que ambas se referem a mudanças
duradouras que se seguem a uma exposição ao ambiente. Mas os psicólogos, tradicionalmente, têm
\isto a aprendizagem e a memória como separadas, com os teóricos da aprendizagem concentrando-
se na aquisição de comportamentos, e os teóricos da memória focando a retenção e recuperação de
conhecimentos. Além disso, o estudo da aprendizagem baseia-se, tipicamente, em sujeitos não-hu-
;nanos, especialmente ratos, ao passo que a pesquisa da memória tem sido conduzida principalmen-
'e com humanos. No entanto, a distinção entre aprendizagem e memória é um tanto arbitrária, pois
há uma sobreposição significativa na visão que os cientistas psicológicos contemporâneos têm dos
dois processos. Na verdade, mecanismos biológicos similares estão envolvidos na aprendizagem e na
memória. O foco deste capítulo será na relação entre os estímulos ambientais e as respostas compor-
tamentais manifestas.

COMO SE DESENVOLVEU O ESTUDO


COMPORTAMENTAL DA APRE DIZAGEM"
Osurgimento da teoria da aprendizagem no início do século XX deveu-se em parte
à insatisfação de alguns psicólogos com o difundido uso de relatos verbais para avaliar
estados mentais. Na época, as idéias freudianas estavam no âmago da teorização psico-
lógica. Para avaliar os processos mentais inconscientes que acreditavam ser os determi-
nantes primários do comportamento, Freud e seus seguidores utilizavam técnicas como
a análise de sonhos e a associação livre. O psicólogo estadunidense John B. Watson
(1878-1968) (Figura 6.1) desprezava qualquer forma de empreendimento psicológico
centrado em coisas que não podiam ser observadas diretamente, tais como os eventos
mentais das pessoas. Ele argumentava que a teoria freudiana era não-científica e basi-
camente sem sentido. Segundo Watson, o comportamento manifesto era o único indica-
dor válido da atividade psicológica. Embora reconhecesse a existência de pensamentos
e crenças, ele negava que pudessem ser estudados por métodos científicos.
Watson fundou a escola do behaviorismo, que se baseava na crença de que os ani-
mais e os humanos nascem com o potencial de aprender qualquer coisa. Baseado na idéia
de John Locke da tábula rasa (do latim, "lousa em branco"), que afirma que os bebês
nascem sem saber nada e que todo o conhecimento é adquirido por experiências senso-
riais, o behaviorismo afirmava que o ambiente e seus efeitos associados sobre os organis-
mos eram os únicos determinantes da aprendizagem. Watson estava tão convencido da
preeminência do ambiente que afirmou, ousadamente: "Dê-me uma dúzia de bebês sadi-
os, bem-formados e o meu próprio mundo especificado para criá-los, e eu garanto que
poderei tomar qualquer um deles, aleatoriamente, e treiná-lo para se tornar um especia-
lista em algo que eu escolher - médico, advogado, artista, comerciante, e sim, inclusive FIGURA 6 1 O estadunidense John B. Watson foi o
um mendigo pedinte ou um ladrão, independentemente de seus talentos, inclinações, fundador do behaviorismo e um de seus mais ardentes
tendências, capacidades, vocação e raça de seus ancestrais" (Watson, 1924, p. 82). defensores.
184 GAZZANIGA e HEATHERTON

As resoostas comoortamentais são condicionad


Watson teve uma influência incrível sobre o estudo da psicologia nos Estaê .
dos. O behaviorismo foi o paradigma psicológico dominante até a década de :
influenciou os métodos e as teorias de todas as áreas da psicologia. Watson <lese:
veu suas idéias sobre o behaviorismo depois de ler a obra do fisiologista russ.:::i
Pavlov (1849-1936) (Figura 6.2), um notável cientista que ganhara um prêmio _·
por seu trabalho sobre o sistema digestivo. Pavlov estava interessado no reflexo -~
a resposta automática e não-aprendida que ocorre quando o estímulo do alie:•
apresentado a animais famintos. Para o seu trabalho sobre o sistema digestivo. .-"-
criou um aparelho que coletava saliva de cães (Figura 6.3) . Ele colocou vários tr~
alimento na boca de um cão e mediu diferenças na produção de saliva. Como t2..:.
avanços científicos importantes, a contribuição de Pavlov à psicologia começou cc-
uma simples observação. Um dia, ele percebeu que os cães ficavam salivando bem a::
tes de provarem o alimento. Na verdade, os cães começavam a salivar no momento e::
que um técnico do laboratório entrava na sala, ou sempre que eles viam as tigelas ql!:::
usualmente continham o alimento. O gênio de Pavlov foi reconhecer que essa respo ~
comportamental era uma janela para a mente em funcionamento. Diferentemente d :
reflexos inatos, a salivação pela visão de uma tigela não é automática e, portanto, de -:::
ter sido adquirida por meio da experiência. O entendimento de que os cães poderia=
associar tigelas e técnicos de laboratório ao alimento levou Pavlov a dedicar o restar.:=
Ivan Pavlov realizou um trabalho
revolucionário sobre o condicionamento clássico.
de sua vida ao estudo dos princípios básicos da aprendizagem.

Experimentos de Pavlov Em um típico experimento pavloviano, um estímu:;


neutro não-relacionado ao reflexo salivar, tal como tocar uma campainha, é apresentado juntameme
com um estímulo que confiavelmente produz o reflexo, tal como o alimento. Esse emparelhamemo
conhecido como um experimento condicionante, é repetido algumas vezes; então, em experimence;;
críticos, o som da campainha é apresentado sozinho e o reflexo salivar é medido. Pavlov descobri:_
que nessas condições o som da campainha, sozinho, produzia saliva. Esse tipo de aprendizagem E
Quais são os mecanismos básicos
responsáveis pela aprendizagem?
agora referido como condicionamento clássico ou condicionamento pavloviano. O condicionamen-
to clássico ocorre quando um objeto neutro passa a eliciar uma resposta reflexa quando é associa-
do a um estímulo que já produz a resposta.
Pavlov chamou a salivação eliciada pelo alimento de resposta incondicionada (RI).
porque ela ocorria sem qualquer treinamento anterior. As respostas incondicionadas são compor-

condicionamento clássico Um
tipo de resposta aprendida que
l tamentos não-aprendidos, automáticos, tal como qualquer reflexo simples. Da mesma forma, o
alimento foi referido como o estímulo incondicionado (EI). Na resposta reflexa normal, o
ocorre quando um objeto neutro
passa a eliciar uma resposta reflexa
ao ser associado a um estímulo que
já produz essa resposta. Janela de observação
resposta incondicionada
(RI} Uma resposta que não precisa
ser aprendida, tal como um reflexo.
estímulo incondicionado
(EI) Um estímulo que elicia uma
resposta, tal como um reflexo, sem
qualquer aprendizagem anterior.

O aparelho de Pavlov
para coletar saliva. Era apresentada ao cão
uma tigela contendo carne. Um tubo ligado
às glândulas salivares levava a saliva para Tubo coletor das
um recipiente que media a quantidade de glândulas salivares
salivação.
CIÊNCIA PSICOLÓGICA 185

~ento (EI) leva à salivação (RI). Como o soar da campainha produz salivação depois de apenas
estímulo condicionado (EC) Um
:=ia repetição, ela é chamada de estímulo condicionado (EC): ela só estimula a salivação estímulo que só elicia uma resposta
....=pois de ocorrer a aprendizagem. O reflexo salivar que ocorre quando só o estímulo condiciona- depois de ter ocorrido
é apresentado é conhecido como a resposta condicionada (RC) : é uma resposta adquirida aprendizagem.
-:.:e foi aprendida. Observe que tanto a resposta incondicionada quanto a condicionada são a resposta condicionada
sa:.±vação, mas elas não são idênticas: a campainha produz menos saliva do que o alimento. A (RC) Uma resposta que foi
·::sposta condicionada geralmente é mais fraca que a resposta incondicionada. O processo de aprendida .
-Jndicionamento é ilustrado na Figura 6.4. aquisição A formação gradual de
uma associação entre os estímulos
condicionados e incond icionados.
Aqui sição, extinção e recuperação espontânea Como muitos outros cientistas na época,
:?z·:lov foi profundamente influenciado pelo livro A Origem das Espécies, de Darwin. Pavlov acredita- extinção Um processo em que a
resposta condicionada é
que o condicionamento era a base de como os animais aprendiam a se adaptar ao seu ambiente. enfraquecida quando o estímulo
.A.ü aprender a predizer quais objetos trazem prazer ou dor, os animais adquirem novos comporta- condicionado é repetido sem o
:::entos que são adaptativos ao ambiente. Por exemplo, vamos supor que, toda vez que chove, uma estímulo incondicionado.
:Janta deliciosa e nutritiva floresce. O animal que aprende essa associação procurará essa planta recuperação espontânea Um
"mpre que chover. A aquisição, a aprendizagem inicial de um comportamento, é a formação processo em que uma resposta
-;radual de associações entre os estímulos condicionados e incondicionados. Baseado em sua pesqui- previamente extinta ressurge após
a apresentação do estímulo
sa. Pavlov concluiu que o elemento crítico na aquisição de uma associação aprendida é os estímulos condicionado.
::x:orrerem juntos no tempo, o que é referido como contigüidade. Pesquisas subseqüentes mostraram
~:.re o condicionamento mais forte ocorre quando existe um breve intervalo entre o EC e o E!.
Depois que um comportamento é adquirido, por quanto tempo ele persiste? Por exemplo, e se o
:;.;:;imal procurar os brotos saborosos após a chuva, mas eles pararem de aparecer? Os animais, às
-ezes, têm de desaprender associações prévias quando elas deixam de ser adaptativas. Vamos ver
::orno isso acontece. Após o condicionamento, a campainha (EC) leva à salivação (RC), porque o
z.1Ílnal aprende a associar a campainha com a comida (E!). Se a
::ampainha for apresentada várias vezes e o alimento não che-
~ar, o animal aprende que a campainha não é um bom preditor
:o alimento e, portanto, a resposta salivar gradualmente desa-
~ece. Esse processo é conhecido como extinção . A resposta
:ondicionada é extinta quando o estímulo condicionado deixa
:e predizer o estímulo incondicionado (Figura 6.5).
Mas suponha que a planta deliciosa só floresça durante
:una certa época do ano. Aresposta adaptativa é verificar de vez
::m quando para ver se a planta floresceu depois da chuva. No EI RI

iaboratório, uma situação análoga ocorre quando o estímulo


condicionado é apresentado um longo tempo depois da extin-
ção. Soar a campainha vai novamente produzir a resposta con-
Condicionamento
dicionada da salivação (veja a Figura 6.5). Essa recuperação
espontânea, em que o EC extinto novamente produz uma RC,
e temporária e irá desaparecer rapidamente, a menos que o EC
seja novamente emparelhado com o E!. Mesmo um único empa- +
relhamento do EC com o E! restabelecerá a RC, que mais uma
vez diminuirá se os emparelhamentos EC-EI não continuarem.
Assim, a extinção inibe, mas não rompe o vínculo associativo. É Estímulo neutro EI
uma nova forma de aprendizagem que se sobrepõe à associação
prévia; o que é aprendido é que a associação original já não é
verdadeira (Bouton, 1994).

Após o condicionamento

:1G Inicialmente, o EI elicia a RI. Durante a aquisição, o


EC anteriormente neutro é emparelhado com o EI. Finalmente, o EC EC RC
elicia a RC. Observe que a RI costuma ser mais forte do que a RC.
186 GAZZANIGA e HEATHERTON

Generalização, discriminação e condicionamento de segunda ordem Em qual-


generalização do
estímulo Ocorre quando
quer situação de aprendizagem, existem centenas de estímulos possíveis que podem ser associados
estímulos semelhantes, mas não ao estímulo incondicionado para produzir a resposta condicionada. Como o cérebro determina qual
idênticos, ao estímulo condicionado desses estímulos é relevante? Por exemplo, suponha que nós condicionamos classicamente um cão,
produzem a resposta cond icionada . de modo que ele saliva (RC) quando ouve um tom de 1.000 Hz (Hertz). Depois que a RC for estabe-
discriminação do lecida, tons semelhantes a 1.000 Hz também a produzirão, mas quanto mais distantes de 1.000 Hz
estímulo Uma tendência forem os tons, menos o cão irá salivar (Figura 6.6). Ageneralização do estímulo ocorre quando
aprendida de diferenciar entre dois
estímulos semelhantes se um estiver
estímulos semelhantes, mas não idênticos, ao EC produzem a RC. A generalização é adaptativa
consistentemente associado ao porque, na natureza, o EC raramente é experienciado repetidamente de modo idêntico. Leves dife-
estímulo incondicionado e outro renças em variáveis como o ruído de fundo, a temperatura e a iluminação levam a percepções leve-
não. mente diferentes do EC, de modo que os animais aprendem a responder a variações no EC.
Evidentemente, há limites para a generalização. Às vezes, é importante para os animais distin-
guir entre estímulos similares. Por exemplo, duas espécies de plantas podem parecer semelhantes,
mas uma é venenosa. A discriminação do estímulo significa que os animais aprendem a dife-
renciar entre dois estímulos semelhantes se um estiver consistentemente associado ao estímulo con-
dicionado e o outro não estiver. Em vários estudos, Pavlov e seus alunos demonstraram que os cães
podiam aprender a fazer distinções muito finas entre estímulos semelhantes, tais como sutis diferen-
ças em tons de cinza.
Às vezes, um estímulo condicionado não se toma diretamente associado a um estímulo incondici-
onado, mas sim a outros estímulos que já estão associados ao E!, um fenômeno conhecido como condi-
cionamento de segunda ordem. Em um dos primeiros estudos de Pavlov, foi formado um vínculo de EC-
EI entre um tom e um alimento, de modo que o tom (EC) levava à salivação (RC). Após esse
condicionamento, foi realizada uma segunda sessão de treinamento em que um quadrado preto foi
repetidamente apresentado ao mesmo tempo em que o tom. Não houve nenhum E! durante essa fase
do estudo. Após muitas repetições, o quadrado preto foi apresentado sozinho e também produziu sali-
vação. O condicionamento de segunda ordem ajuda a explicar a complexidade das associações apren-
didas (Figura 6. 7). Quando algumas pessoas vão ao dentista, ficam nervosas simplesmente ao entrar no
prédio. Isso ocorre porque entrar no prédio (EC 1) prediz entrar no consultório do dentista (EC 2), que

Descanso Descanso
de 24h de 24h
15

u
UJ
Extinção
o
(apenas o EC)
].. 10
Primeira Segunda
Aquisição recuperação recuperação
(emparelhamentos EC-EI) espontânea espontânea
(apenas o EC) (apenas o EC)

"' ' '

· ~·
V1
Q)
-o 5 ' '
' '
V1
' '
õ"' '
'
'
'
l'J ' '
' '
' '
' '
' '

2 4 6 8 1o 12 14 16 18 20 22 2 4 6 8 2 4 6 8
Triais

FIGURA 6.5 Durante a aquisição, os emparelhamentos EC-EI levaram a uma maior aprendizagem, de modo que o EC pode produzir a RC. Entretanto,
se o EC for apresentado sem o EI, a RC acaba se ext1ngu1ndo. Mais tarde, se o EC for apresentado sOZ1nho ele produzirá uma fraca RC, conhecida como
recuperação espontânea. Essa RC irá rapidamente se extinguir se o EI não aparecer.
CIÊNCIA PSICOLÓGICA 187

prediz encontrar o dentista (EC 3), que usa broca (EI) que leva a uma
resposta de medo. Aassociação entre o prédio do consultório e a perfura-
ção do dente com a broca está distante algumas etapas, mas o condiciona-
mento é suficiente para produzir sentimentos de nervosismo.

As fobias e adicções têm componentes


u
aprendidos cr:
ro
<::i
ro
<>
O condicionamento clássico ajuda a explicar alguns fenômenos o
1..1...

comportamentais, incluindo fobias e adicções.

Fobias e seu tratamento As fobias são medos adquiridos des-


proporcionais à ameaça real. Fobias comuns incluem o medo de altura,
de cães, insetos, cobras e do escuro. Segundo a teoria do condiciona-
mento clássico, as fobias se desenvolvem pela generalização de uma Tons mais baixos EC Tons mais altos
experiência de medo, tal como quando a pessoa que é picada por uma
Tons dos estímulos
vespa passa a ter medo de todos os insetos que voam.
Os animais podem ser classicamente condicionados para ter medo
de objetos neutros. Por exemplo, se a um animal for repetidamente apre- FIGURA 6.6 A salivação máxima ocorre no EC de 1.000 Hz, mas
sentado um lampejo de luz seguido por um choque elétrico moderada- estímulos semelhantes ao EC também produzem a RC. A força da RC
mente doloroso, ele logo apresentará respostas fisiológicas e comporta- diminui conforme o tom diverge de 1.000 Hz.
mentais indicando medo, tal como mudança no ritmo cardíaco, sempre
que vir um lampejo de luz. De forma semelhante, os soldados, como os
soldados estadunidenses que lutaram no Vietnã, às vezes desenvolvem fobias a objetos e eventos fobias Medos adquiridos
associados à batalha, tal como a visão de uniformes, sons de batalha e até da língua vietnamita. desproporcionais à ameaça real.
Pavlov referiu-se a essas fobias aprendidas como respostas emocionais condicionadas.

' J

131
EC1 EC2

~
\ J
FIGURA 6.7 Após a aquisição, o EC
à RC. Se outro objeto for emparelhado com
o EC, ele também se tornará um EC, e
produzirá a RC. Esse condicionamento de
EC3 RC segunda ordem ajuda a explicar a
aprendizagem complexa.
188 GAZZANIGA e HEATHERTON

Técnicas do condicionamento clássico foram valiosas para a criação de terapias comportamen-


tais para tratar fobias. Por exemplo, expor a pessoa a pequenas doses do estímulo temido ao mesmo
tempo em que ela é envolvida em uma tarefa agradável, o contracondicionamento, pode ajudá-la a
superar seu medo. Joseph Wolpe, um terapeuta comportamental, desenvolveu um tratamento for-
mal baseado no contracondicionamento, conhecido como dessensibilização sistemática (Wolpe, 1997).
Os pacientes são ensinados a relaxar os músculos e, quando forem capazes disso, são solicitados a
imaginar o objeto ou a situação temidos, enquanto continuam os exercícios de relaxamento. Final-
mente, a pessoa é exposta ao estímulo temido enquanto está relaxando. Aidéia geral é que a cone-
xão EC à RC 1 (medo) possa ser rompida ao se criar uma nova conexão EC à RC 2 (relaxamento). O
tratamento comportamental das fobias se mostrou muito efetivo.

Ad icção a drogas O condicionamento clássico também desempenha um papel importante na


adicção a drogas. Efeitos condicionados da droga são comuns. Por exemplo, o cheiro do café pode
tornar-se um estímulo condicionado, levando os bebedores de café a se sentirem ativados e excita-
dos. Da mesma forma, já que a agulha se torna um EC, os adietas à heroína se injetam às vezes com
água, quando não existe heroína disponível, para reduzir sua fissura. Essas associações aprendidas
demonstram o poder do condicionamento e o potencial de problemas. Quando ex-adietas à heroína
são expostos a deixas ambientais associadas ao uso da droga, eles geralmente experienciam fissura e
sensações fisiológicas semelhantes às que experienciavam durante a abstinência, o desagradável
estado de tensão e ansiedade que ocorre quando os adietas param de usar drogas. Assim, os adietas
que deixam de usar drogas em centros de tratamento muitas vezes têm recaídas quando retornam ao
seu antigo ambiente. Eles experienciam efeitos de abstinência condicionada. No laboratório, apre-
sentar a adietas à heroína ou cocaína deixas associadas à ingestão de drogas leva à fissura e a uma
variedade de respostas fisiológicas associadas à abstinência, tais como mudanças no ritmo cardíaco
e na pressão sangüínea. Em um estudo com adietas à heroína (Maas et al., 1998), a IRM funcional
encontrou atividade significativa no córtex pré-frontal e no cingulado anterior, parte do sistema
límbico associada à motivação, quando foram apresentadas aos sujeitos deixas referentes à cocaína.
A extensão da ativação no cingulado anterior estava relacionada a níveis auto-relatados de fissura.
Um estudo recente utilizando imagens de PET encontrou ativações semelhantes na região límbica
quando os pesquisadores mostraram a adietas um vídeo com cenas de uso de cocaína (Figura 6.8,
Childress et al., 1999).

FIGURA 6.8 PET mostrando ativação


da amígdala e do cingulado anterior em
adietas à cocaína abstinentes, quando
assistiram a vídeos com cenas da natureza
ou deixas de cocaína . As áreas com maior
ativação são mostradas em vermelho.
CIÊNCIA PSICOLÓGICA 189

Os princípios do condicionamento clássico podem nos ajudar a entender como os soldados do


Vietnã mencionados no início deste capítulo foram capazes de parar de tomar narcóticos quando
retornaram aos Estados Unidos. Para os soldados aditas, todas as deixas para o uso de drogas esta-
vam relacionadas ao Vietnã e seu ambiente militar associado. Quando eles voltaram para casa, ne-
nhuma dessas deixas estava por perto e, conseqüentemente, os soldados não experienciaram efeitos
condicionados de abstinência.
Outro cenário possível é a quantidade usual de heroína ter produzido, nos Estados Unidos,
efeitos maiores do que o esperado, um efeito desagradável que poderia ter desencorajado o uso
posterior.
O teórico da aprendizagem Shepard Siegel realizou uma pesquisa fascinante mostrando que os
efeitos da tolerância à droga são específicos para certas situações. A tolerância é um processo pelo
qual os aditas precisam de quantidades de droga cada vez maiores para produzir os mesmos efeitos.
Segundo a pesquisa de Siegel, os efeitos da tolerância são maiores quando a droga é tomada sempre
no mesmo lugar. A tolerância pode ser tão grande que os adietas regularmente usam doses da droga
que seriam fatais para o usuário inexperiente. Reciprocamente, os achados de Siegel implicam que,
se os adietas tomarem suas grandes doses usuais em um ambiente diferente, novo, é mais provável
que tenham uma overdose (Siegel et ai., 1982; Siegel, 1984).

O condicionamento clássico envolve mais do que


contigüidade
A explicação original de Pavlov sobre o condicionamento clássico era a de que quaisquer dois
eventos que fossem apresentados ao mesmo tempo, em contigüidade, produziriam uma associação
aprendida. Pavlov e seus seguidores acreditavam que a força da associação era determinada por
fatores como a intensidade dos estímulos condicionados e incondicionados, com a maior intensida-
de associada à maior aprendizagem. Em meados da década de 1960, percebeu-se ser mais provável
que alguns estímulos condicionados produzissem aprendizagem do que outros, e que a contigüidade
não era suficiente para criar associações EC-El.

Significado evolutivo Segundo Pavlov, qualquer objeto ou fenômeno pode ser convertido em
um estímulo condicionado durante repetições de condicionamento. Assim, uma luz, tom, cor ou
odor pode ser associado ao estímulo incondicionado. A idéia de que todos os estímulos são igual-
mente capazes de produzir condicionamento é conhecida como equipotencialidade. Entretanto, pare-
ce que nem todos os estímulos são igualmente potentes. Pesquisas realizadas pelo psicólogo John
Garcia e seus colegas mostraram que certos emparelhamentos de estímulos apresentam uma proba-
bilidade maior de se tornarem associados. Por exemplo, animais que recebem veneno em seu ali-
mento aprendem rapidamente a evitar os sabores ou cheiros associados ao alimento envenenado
(Garcia e Koeling, 1966). Nesses casos, apenas algumas repetições já são suficientes para produzir
uma evitação duradoura do alimento que estava envenenado. Essas aversões condicionadas ao ali-
mento são fáceis de produzir com sabor ou cheiro, mas muito difíceis de produzir com luz ou som.
Isso faz sentido, pois o sabor e o cheiro são as principais deixas que guiam o comportamento alimen-
tar nos animais. De um ponto de vista evolutivo, os animais que rapidamente associam um certo
sabor à doença e, portanto, evitam esse sabor, apresentam uma probabilidade maior de sobreviver e
transmitir seus genes.
Outras pesquisas mostram que é mais fácil condicionar macacos para temer cobras do que
temer objetos como flores ou coelhos (Cook e Mineka, 1989). O psicólogo Martin Seligman (1970)
argumentou que os animais são geneticamente programados para temer objetos específicos, o que
ele chama de prontidão biológica. Aprontidão ajuda a explicar por que as fobias tendem a ser de
coisas que apresentam um perigo potencial (cobras, fogo, alturas) e não de objetos que representam
pouca ameaça (flores, sapatos, bebês).
No nível mais geral, os pesquisadores contemporâneos estão interessados em como o condicio-
namento clássico ajuda os animais a aprender respostas adaptativas (Hollis, 1997; Shettleworth, prontidão biológica A idéia de
2001). O valor adaptativo de uma determinada resposta varia de acordo com a história evolutiva do que os animais estão
biologicamente programados para
animal. Por exemplo, aversões a sabores são fáceis de condicionar em ratos, mas difíceis de condicio- aprender a temer objetos
nar em pássaros, porque eles dependem mais da visão do que do sabor para selecionar alimentos. No específicos.
entanto, os pássaros aprendem rapidamente a evitar uma deixa visual que foi associada à doença.Os
190 GAZZANIGA e HEATHERTON

ratos ficam imóveis e têm sobressaltos se o EC é auditivo, mas erguem-se nas patas traseiras quando
modelo de Rescorla-
Wagner Um modelo cognitivo de
o EC é uma deixa visual (Holland, 1977). Essas diferenças podem refletir o significado e o perigo
cond icionamento clássico, que potencial associado a estímulos auditivos e visuais no ambiente.
afirma que a força da associação
EC-EI é determinada pela extensão A perspectiva cognitiva Antes da década de 1970, a maioria dos teóricos da aprendizagem
em que o estímulo incondicionado
é inesperado.
animal só estava preocupada com estímulos e respostas observáveis. Nas últimas três décadas, os
teóricos da aprendizagem colocaram uma ênfase maior em tentar compreender os processos men-
tais que estão por trás do condicionamento. Um princípio importante que surgiu é que o condiciona-
mento clássico é um meio pelo qual os animais vêm a predizer a ocorrência de eventos. Osurgimento
da consideração dos processos mentais, tais como predição e expectativa, é referido como a perspec-
tiva cognitiva da aprendizagem (Hollis, 1997).
Robert Rescorla (1966) conduziu um dos primeiros estudos salientando o papel da cognição na
aprendizagem. Segundo ele, para que a aprendizagem possa ocorrer, o estímulo condicionado preci-
sa ser um preditor acurado do estímulo incondicionado. Por exemplo, um estímulo que ocorre antes
do E! é mais facilmente condicionado do que um que vem depois dele. Mesmo que os dois sejam
ambos apresentações contíguas com o E!, o primeiro estímulo é mais facilmente aprendido porque
ele prediz o E!, em vez de vir antes dele. Na verdade, em todas as condições de condicionamento,
alguma demora entre o EC e o E! é ótima para a aprendizagem. A duração da demora varia depen-
dendo da natureza dos estímulos condicionado e incondicionado. Por exemplo, condicionamos o
piscar os olhos ao associar um som (EC) com um sopro de ar nos olhos (E!), o que leva ao piscar. A
aprendizagem ótima do condicionamento do piscar é medida em milissegundos. Em contraste, aver-
sões condicionadas a sabores geralmente levam muitas horas, uma vez que os efeitos nocivos do
consumo de veneno normalmente levam tempo para ocorrer.
Estímulos novos também são mais facilmente associados ao estímulo incondicionado do que os
estímulos familiares. Por exemplo, cães podem ser condicionados mais facilmente com o cheiro novo
de amêndoas do que com cheiros mais familiares ao seu ambiente. Depois de aprendido, um estímu-
lo condicionado pode impedir a aquisição de um novo estímulo condicionado, um fenômeno conhe-
cido como efeito bloqueador. Por exemplo, um cão que adquiriu o cheiro de amêndoas (EC) como um
bom preditor do alimento (E!) não precisa procurar outros preditores. Além disso, um estímulo que
está associado ao EC pode agir como um desencadeador ou estabelecedor de ocasião para o EC (Sch-
majuk et ai., 1998). Por exemplo, um cão aprende que o cheiro de amêndoas só prediz comida
quando é precedido por um som ou lampejo de luz, e não nas outras vezes. Ocheiro ou a luz indicam
se a associação entre o cheiro de amêndoas e a comida é ativa ou não.
Em 1972, os teóricos da aprendizagem Robert Rescorla e Allan Wagner publicaram um modelo
cognitivo do condicionamento clássico que modificou profundamente o nosso entendimento da apren-
dizagem (Rescorla e Wagner, 1972). O modelo de Rescorla-Wagner afirma que a força da asso-
ciação EC-EI é determinada pela extensão em que o E! é inesperado ou surpreendente. Segundo o
modelo, o condicionamento é um processo pelo qual os organismos aprendem a esperar o estímulo
incondicionado baseados no estímulo condicionado. Seu cachorrinho de estimação balança o rabo e
corre em círculos quando você começa a abrir uma lata de comida porque espera ser alimentado
logo. De acordo com Rescorla e Wagner, seu cachorrinho desenvolveu uma representação mental em
que o som do abridor de latas prediz o aparecimento de comida. Quando o E! ocorre inesperadamen-
te, o animal presta atenção aos eventos do ambiente que poderiam tê-lo produzido. Por exemplo,
digamos que você vai usar um abridor manual porque o elétrico está estragado. Seu cachorro vê a
comida ser colocada diante dele mesmo sem ter ouvido a lata sendo aberta. Ele logo aprenderá a
antecipar ser alimentado pelos movimentos de pulso que você faz com o novo abridor.
Segundo Rescorla e Wagner, quando as expectativas são contrariadas, nós automaticamente
buscamos possíveis explicações para o estímulo incondicionado. O modelo de Rescorla-Wagner é um
modelo matemático de condicionamento, com uma fórmula que calcula a extensão em que as expec-
tativas atuais predizem acuradamente o E!. Aaprendizagem envolve fazer ajustes na expectativa do
E! até que a predição seja acurada. Quanto maior a surpresa do E!, mais a aprendizagem é necessária
para uma predição acurada e, conseqüentemente, mais o condicionamento acontece. O modelo de
Rescorla-Wagner consegue explicar uma ampla variedade de fenômenos de condicionamento. Con-
sidere o bloqueio, em que um novo estímulo deixa de ser associado ao estímulo incondicionado
quando está presente um estímulo condicionado bem-estabelecido. Nesse caso, porque o animal
aprendeu a associação EC-EI, o E! não é uma surpresa e, portanto, não é feita nenhuma associação
entre o novo estímulo e o estímulo incondicionado.
CIÊNCIA PSICOLÓGICA 191

Mark Bouton e colaboradores (1999) demonstraram que o contexto do fundo, além da prediti-
\idade, novidade e expectativa, desempenha um papel importante no condicionamento clássico.
Considere o processo de extinção, em que o desempenho será reduzido se o EC for apresentado
muitas vezes sem o E!. Segundo a pesquisa de Bouton, se o animal for colocado em um novo contex-
to ele produzirá uma RC em resposta ao EC, como se tivesse esquecido a extinção. Por exemplo,
suponha que um rato recebe condicionamento de medo: cada vez que um EC é apresentado, ele
recebe um choque como o E!. Depois, o rato é colocado em um novo contexto e recebe o EC sem o
choque, o que finalmente extingue as respostas de medo. Quando o animal é colocado de volta no
contexto original e lhe é apresentado o EC, ele produz uma resposta de medo. Essa explicação de
mudança de contexto pode ser útil para se entender a recuperação espontânea de respostas previa-
mente extintas, pois a passagem do tempo, em si, reflete uma mudança de contexto. Da perspectiva
cognitiva, o contexto proporciona deixas importantes sobre quando o EC prediz o E!.

Como se desenvolveu o estudo comportamental da aprendizagem?


O behaviorismo, liderado por John B. Watson, focalizava aspectos observáveis do comportamento. Pavlov
desenvolveu a teoria do condicionamento clássico para explicar a associação aprendida entre estímulos neutros e
comportamentos reflexos. O condicionamento ocorre quando o estímulo condicionado passa a ser associado ao
estímulo incondicionado. Para que ocorra aprendizagem, o estímulo condicionado precisa ser um preditor confiável
do estímulo incondicionado, não simplesmente contíguo. Um modelo cognitivo que explica a maioria dos
fenômenos de condicionamento é o modelo de Rescorla-Wagner, que afirma que a intensidade do
condicionamento é determinada pela extensão em que o estímulo incondicionado é inesperado ou surpreendente.

•:§
EM QUE O CONDICIONAMENTO OPERANTE É ·~
DIFERENTE DO CONDICIONAMENTO CLÁSSICO? ·-·
Ocondicionamento clássico é um processo relativamente passivo em que o sujeito associa eventos
que acontecem ao seu redor. Essa forma de condicionamento não explica as muitas vezes em que um
dos eventos ocorre devido a alguma ação por parte do sujeito. Nós não sentamos passivamente
esperando que a comida nos seja apresentada; nós saímos e vamos comprá-la. ossos comportamen-
tos geralmente representam um meio para um fim. Nós compramos comida para comê-la, estuda- Como o comportamento é
moldado por recompensas e
mos para tirar boas notas e trabalhamos para ganhar dinheiro. Assim, muitas das nossas ações são punições?
instrumentais: elas são realizadas com um propósito. Nós aprendemos a nos comportar de certas
maneiras para sermos recompensados, e evitamos nos comportar de certas maneiras para não ser-
mos punidos: isso se chama condicionamento instrumental ou condicionamento operante. B.E Skinner,
o psicólogo mais estreitamente associado a esse tipo de aprendizagem, escolheu o termo operante
para expressar a idéia de que os animais operam sobre o ambiente para produzir um efeito. O con-
dicionamento operante é o processo de aprendizagem em que as conseqüências de uma ação
determinam a probabilidade de ela ser realizada no futuro.
O estudo do condicionamento operante começou no porão da casa do psicólogo William James
em Cambridge, Massachusetts. Um jovem aluno de graduação trabalhando com James, Edward
Thorndike, fora influenciado por Darwin e estava estudando se os animais não-humanos mostravam
sinais de inteligência. Como parte de sua pesquisa, Thorndike construiu um aparelho que era como
uma caixa a ser decifrada, uma pequena jaula com uma porta tipo armadilha (Figura 6.9). A porta
tipo armadilha só se abriria se o animal realizasse uma ação específica, tal como puxar um cordão.
Thorndike colocou animais privados de comida, geralmente gatos, dentro da caixa a ser decifrada
para ver se eles conseguiriam descobrir como escapar. Para motivar os gatos, ele colocou comida do
lado de fora, junto à caixa. Quando os gatos eram colocados na caixa, eles geralmente se empenha-
vam em uma série de comportamentos improdutivos em uma tentativa de escapar. Após 5 ou 10 condicionamento operante Um
minutos de luta, o gato puxava acidentalmente o cordão e a porta se abria. Thorndike então pegava o processo de aprendizagem em que
as conseqüências de uma ação
gato e o colocava de volta na caixa e repetia o experimento. Thorndike descobriu que os gatos determinam a probabilidade de ela
puxavam o cordão mais rapidamente em cada repetição, até aprenderem a escapar da caixa em ser realizada no futuro.
segundos. Baseado nessa linha de pesquisa, Thorndike desenvolveu uma teoria geral da aprendiza-
192 GAZZANIGA e HEATHERTON

gem, conhecida como a lei do efeito, que afirma que qualquer com-
portamento que leve a um "estado de coisas satisfatório" tem maior
probabilidade de ocorrer novamente, e que os que levam a um "estado
de coisas incômodo" têm menor probabilidade de ocorrer novamente.

O reforço aumenta o comportamento


Trinta anos depois de Thorndike, outro aluno de graduação de psi-
cologia em Harvard, B.F. Skinner (1904-1990) (Figura 6.1 O) desenvol-
veu uma teoria mais formal da aprendizagem baseada na lei do efeito.
Skinner fora profundamente influenciado por John E.Watson e compar-
tilhava sua filosofia do behaviorismo. Ele, portanto, fez objeções aos
aspectos subjetivos da lei do efeito de Thorndike: estados de "satisfa-
ção" não são observáveis empiricamente. Skinner cunhou o termo refor-
ço para descrever eventos que produzem uma resposta aprendida. Um
reforço é um estímulo que ocorre após uma resposta e aumenta a pro-
babilidade de essa resposta ser repetida. Skinner acreditava que os com-
F GUR. 6. Thorndike utilizou uma caixa a ser decifrada, bastante portamentos, do estudar ao comer e ao dirigir do lado certo da rua,
simples, como esta aqui desenhada, para avaliar a aprendizagem em gatos. ocorrem porque foram reforçados.

A caixa de Skinner Skinner desenvolveu um aparelho simples para avaliar o condicionamen-


to operante, a chamada caixa de Skinner, uma pequena câmara ou jaula em que uma alavanca (ou
chave de resposta) está conectada a um suprimento de comida ou água. Um animal, usualmente um
rato ou um pombo, é colocado dentro da caixa; quando ele pressiona a alavanca, aparece a comida
ou a água. As primeiras pesquisas de Skinner utilizavam labirintos em que os ratos tinham de dar
uma volta específica para ter acesso ao reforço. Depois que o rato completava o experimento, Skin-
ner tinha de pegar o rato e colocá-lo de volta no início. Ele criou a caixa de Skinner, ou a câmara
operante, conforme ele a chamava, porque cansou de ter de pegar os ratos constantemente. Com a
caixa de Skinner, os ratos podiam ser expostos a repetidos experimentos de condicionamento sem
que o experimentador tivesse de fazer qualquer coisa além de observar. Mais tarde, Skinner criou
aparelhos de registro mecânico que possibilitavam que os experimentos fossem realizados sem que
fosse necessário o experimentador estar presente.

Modelagem Com pouco a fazer dentro de uma caixa de Skinner, o animal acaba pressionando a
alavanca mais cedo ou mais tarde. Um dos maiores problemas encontrados no condicionamento ope-
lei do efeito A teoria geral de rante fora da caixa de Skinner é que você precisa esperar até que o animal emita a resposta apropriada
aprendizagem de Thorndike, que antes de poder dar o reforço. Digamos que você está tentando ensinar seu cachorro a rolar no chão. Em
afirma que qualquer vez de esperar que ele realize essa ação espontaneamente, você pode usar uma técnica de condiciona-
comportamento que leve a um
mento operante para ensinar seu cachorro a fazer isso. O processo, chamado modelagem, envolve
"estado de coisas satisfatório" tem
maior probabilidade de ocorrer reforçar comportamentos que são cada vez mais semelhantes ao comportamento desejado. Você inicial-
novamente e que aqueles que mente recompensa o seu cachorro por qualquer comportamento que se assemelhe, ainda que levemen-
levam a um "estado de coisas te, a rolar, tal como deitar. Uma vez que esse comportamento foi estabelecido, você se torna mais
incômodo" têm menor
seletivo nos comportamentos a serem reforçados. Reforçar sucessivas aproximações irá eventualmente
probabilidade de ocorrer de novo.
produzir o comportamento desejado, conforme o seu cachorro aprender a discriminar qual comporta-
reforço Um estímulo que se
mento está sendo reforçado (Figura 6.11). Amodelagem é um procedimento poderoso, capaz de con-
segue a uma resposta e aumenta a
probabilidade de essa resposta ser dicionar animais a realizarem façanhas surpreendentes: pombos jogam pingue-pongue, cachorros to-
repetida. cam piano e porcos fazem tarefas domésticas como apanhar roupas e passar o aspirador. Amodelagem
modelagem Um processo de também tem sido utilizada para ensinar habilidades sociais apropriadas a pessoas mentalmente doen-
condicionamento operante que tes; linguagem a crianças autistas; e habilidades básicas, como vestir a roupa, a indivíduos mentalmen-
envolve reforçar comportamentos te retardados. De modo mais geral, pais e educadores utilizam freqüentemente formas sutis de modela-
cada vez mais semelhantes ao
comportamento desejado.
gem para incentivar nas crianças comportamentos apropriados.
reforços primários Reforços que
Os reforços podem ser condicionados Os reforços mais óbvios são aqueles necessários
são inatamente reforçadores, tais
como aqueles que satisfazem para a sobrevivência, como alimento ou água. Os que satisfazem necessidades biológicas são referidos
necessidades biológicas. como reforços primários. Do ponto de vista evolutivo, o valor de aprendizagem dos reforços primá-
rios fazem muito sentido, pois os organismos que realizam repetidamente comportamentos reforçados
CIÊNCIA PSICOLÓGICA 193

por alimento e água têm maior probabilidade de sobreviver e transmitir


seus genes. Mas muitos reforços aparentes não satisfazem diretamente
necessidades biológicas básicas. Por exemplo, dinheiro é apenas pedaços
de metal ou papel, mas muitas pessoas trabalham duro para consegui-lo.
Da mesma forma, um cumprimento, o abraço de um amigo, ou um ''/\' em
urna prova podem ser reforçadores. Eventos ou objetos que servem como
reforço, mas não satisfazem necessidades biológicas são referidos como
reforços secundários. Os reforços secundários se tomam estabeleci-
dos por meio do condicionamento clássico. Nós aprendemos a associar
um estímulo neutro, tal como dinheiro de papel (EC) com, por exemplo,
alimento (E!). Evidentemente, o dinheiro também assume outros signifi-
cados, como poder ou segurança, mas o ponto essencial é que um objeto
neutro passa a ser significativo por sua associação com estímulos incondi-
cionados. Animais podem ser condicionados a realizar tarefas a fim de
receber fichas, que mais tarde podem ser trocadas por comida. As fichas,
emsi, reforçam assim o comportamento. Utilizando princípios semelhan-
êes, muitas prisões, hospitais de doentes mentais e salas de aula estabele-
ceram uma economia de fichas, em que as pessoas ganham fichas por com-
;iletar certas tarefas. Essas fichas podem ser guardadas e, mais tarde,
uocadas por objetos ou privilégios.

Potência do reforço Alguns reforços são mais poderosos que


:iutros. Uma teoria integrativa do reforço foi proposta pelo psicólogo
'.)avid Premack, que teorizou que o valor de um reforço específico pode
ser determinado pela quantidade de tempo em que um organismo rea-
liza aquele comportamento quando está livre para escolher qualquer 1
1 1

coisa. Por exemplo, você pode observar que a maioria das crianças esco-
lhe passar mais tempo comendo sorvete do que espinafre, o que indica .~
·~
que comer sorvete é mais reforçador. Uma grande vantagem da teoria
de Premack é que ela consegue explicar diferenças individuais de valo-
res. Indubitavelmente, algumas pessoas preferem espinafre a sorvete:
?Ortanto, para elas, o espinafre serve como um reforço mais potente. FIGURA 6.1 O B.F. Skinner (visto aqui mostrando a ca1Xa de S nner)
Uma extensão lógica da teoria de Premack é que uma atividade foi um dos mais influentes psicólogos de todos os tempos.
mais valorizada pode ser usada para reforçar o desempenho de uma
atividade menos valorizada, o que é conhecido como o princípio de Pre-
mack. Os pais utilizam o princípio de Premack o tempo todo: "Coma o seu espinafre e depois você
ganhará sobremesa"; "Termine o seu tema de casa e depois você poderá sair".

Tanto o reforço como a punição podem ser reforços secundários Eventos


positivos ou negativos ou objetos que servem como
reforço por seu repetido
O reforço e a punição têm efeitos opostos sobre o comportamento. Enquanto o reforço aumenta emparelhamento com os reforços
o comportamento, a punição o diminui. Formalmente, a punição é o processo pelo qual as conseqüên- primários.
cias de uma ação reduzem a probabilidade de a ação ser repetida. Por exemplo, dar um choque punição Um estímulo que se
elétrico em um rato por ele pressionar uma alavanca irá diminuir o número de vezes que ele pressio- segue a uma resposta e diminui a
probabilidade de a resposta ser
na a alavanca. Tanto o reforço como a punição podem ser positivos ou negativos. repetida .
reforço positivo O aumento na
Reforço positivo e negativo O reforço positivo aumenta a probabilidade de um com- probabilidade de um
portamento ser repetido ao administrar um estímulo agradável. O reforço positivo geralmente é comportamento ser repetido após a
referido como recompensa. Os comportamentos que são recompensados aumentam em freqüência, administração de um estímulo
tal como trabalhar duro por elogios ou dinheiro. Em contraste, o reforço negativo aumenta o agradável, referido como
recompensa .
comportamento pela remoção de um estímulo aversivo. Por exemplo, um rato é negativamente refor-
çado quando precisa pressionar uma alavanca para desligar um choque elétrico. Observe como o reforço negativo O aumento na
probabilidade de um
reforço negativo é diferente da punição, em que o rato recebe um choque por pressionar a alavanca. comportamento ser repetido pela
O reforço negativo não é punição. O reforço - positivo ou negativo - aumenta a probabilidade de remoção de um estímulo aversivo.
um comportamento, enquanto a punição diminui essa probabilidade. O reforço negativo é muito
194 GAZZANIGA e HEATHERTON

comum na vida cotidiana. Você fecha a porta da sua sala para deixar o barulho de fora.
Você muda de canal para evitar assistir a um programa ruim na televisão. Em qualquer
caso, você está tentando escapar de ou evitar um estímulo indesejado, que é o reforço
negativo.

Punição positiva e negativa A punição reduz o comportamento, mas pode


fazer isso por meios positivos ou negativos. Apunição positiva diminui a probabili-
dade de um comportamento ocorrer de novo ao administrar um estímulo aversivo. A
punição negativa diminui a probabilidade de um comportamento ao remover um
estímulo agradável. Os jovens cujos privilégios de motorista são revogados por excesso
de velocidade apresentam menor probabilidade de andar acima da velocidade da pró-
xima vez que estiverem atrás da direção do carro. Embora perder os privilégios de
motorista seja uma forma de punição negativa, receber uma multa por excesso de velo-
cidade é uma forma de punição positiva. A Figura 6.12 apresenta uma visão geral do
reforço e punição positivos e negativos.

Efetividade da punição parental A punição é freqüentemente utilizada pe-


los pais que querem que seus filhos se comportem bem. Mas muitos psicólogos contem-
porâneos acreditam que a punição muitas vezes é aplicada de modo ineficiente e que
também pode ter conseqüências imprevistas e indesejadas. Para que a punição seja
efetiva, ela deve ser aplicada imediatamente, de modo a ficar clara a relação entre o
FIGURA 6.11 O processo de modelagem pode ser comportamento indesejado e a punição. Eela também só deve ser aplicada a comporta-
usado para treinar comportamentos extraordinários. Aqui mentos indesejados. Mas aqui há um considerável potencial de confusão. Às vezes, a
vemos um cachorro treinado fazendo esqui aquático punição é aplicada após uma ação desejada, como quando um aluno é punido depois de
numa apresentação de barcos.
admitir que colou na prova. O aluno pode associar a punição com ser honesto, em vez
de com a infração original; o resultado pode ser o aluno aprender a não dizer a verdade.
Apunição também pode levar a emoções negativas, como medo ou ansiedade, que
podem ser associadas, por condicionamento clássico, à pessoa que administra a punição. Uma crian-
ça pode aprender a temer um dos pais ou a professora em vez de parar com o comportamento
indesejado. Outro problema com a punição é que ela freqüentemente não consegue superar os as-
pectos reforçadores do comportamento. Na vida real, qualquer comportamento é freqüentemente
reforçado de múltiplas maneiras. Por exemplo, chupar o dedo pode ser reforçado porque faz a crian-
ça se sentir bem e alivia emoções negativas ou fome. Aameaça de punição por chupar o dedo pode
não ser suficiente para superar as recompensas que o ato traz, embora possa reforçar o segredo.
Finalmente, o uso de punições físicas, como bater, ensina à criança que violência é um comporta-
mento apropriado para os adultos (nós examinaremos a aprendizagem por imitação ainda neste
capítulo). Por essas e outras razões, a maioria dos psicólogos recomenda que o reforço seja utilizado
em lugar da punição. Uma criança que recebe cumprimentos por ser um bom aluno provavelmente
apresentará um desempenho acadêmico melhor do que aquele que foi punido por se sair mal.
Mas há ocasiões em que a punição deve ser considerada. Por exemplo, uma criança pequena
que está fazendo algo extremamente perigoso precisa ser parada imediatamente. Uma firme repri-

Índice de respostas

punição positiva A punição q ue o Aumenta Diminui


-o
ocorre quando se administ ra um QJ
:::J !'.l
estímu lo que diminui a O' e
QJ
Reforço positivo Punição positiva
probabilidade de um E .!!1., Vl
QJ (pressionar a alavanca - comida) (pressionar a alavanca - choque)
o
u
QJ
Vl o_
co mportament o acontecer N _2 <(
novamente. "'
'+--
:::J
"'.ê
+-' +-' o
punição negativa A punição que Vl
o QJ
Vl
~ Reforço negativo Punição negativa
ocorre quando se remove um 5;-o o> (pressionar a (pressionar a
est ímu lo que diminui a ~ E
<(
QJ
cr: alavanca - desliga o choque) alavanca - remove a comida
proba b il idade de um
compo rtamento acontecer
novamente.
FIGURA 6.12 Visão geral do reforço e da punição negativos e positivos.
CIÊNCIA PSICOLÓGICA 195

:nenda é apropriada e geralmente efetiva para impedir que a criança toque em um fogão quente ou
atravesse a rua correndo sem olhar. Para que a punição seja efetiva, deve fazer três coisas. Primeiro,
ela deve ser imediata. Segundo, deve ser suficientemente desagradável para superar os aspectos
reforçadores do comportamento. Finalmente, deve ser seguida de reforço do componamento apro-
?riado. Uma punição comum utilizada em creches para lidar com crianças desobedientes é o interva-
:oou tempo fora, em que a criança é removida da situação para pensar sobre as conseqüências do
comportamento inadequado. O sucesso das técnicas de um tempo fora depende da disposição dos
::uidadores de executar a punição. Um dos erros mais comuns dos pais é ameaçar freqüentemente
com castigos e nunca colocá-los em prática. Os pais que não cumprem suas ameaças ensinam às
crianças que as ameaças podem ser seguramente ignoradas.

O condicionamento operante é influenciado por


esquemas de reforço
Com que freqüência deve ser dado o reforço? Para uma aprendizagem rápida, você poderia
:eforçar o comportamento desejado cada vez que ele ocorrer, o que é conhecido como reforço
contínuo. No mundo real, o comportamento raras vezes é reforçado continuamente. Os animais
;ião encontram comida todas as vezes que procuram por ela, e as pessoas não recebem elogios
sempre que se comportam de maneira aceitável. Amaioria dos comportamentos é reforçada intermi-
:entemente, o que é referido como reforço parcial. O efeito do reforço parcial sobre o condiciona-
;nento depende do esquema de reforço.
1 ,.

Esquemas de razão e de intervalo O reforço parcial pode ser administrado com base no
JÚmero de respostas comportamentais ou na passagem do tempo. Por exemplo, os operários de uma
fábrica podem ser pagos pela produção (resposta comportamental) ou por hora (passagem do tem-
;><>). No esquema de razão, o reforço se baseia no número de vezes que o comportamento ocorre,
como, por exemplo, reforçar cada terceira ou décima ocorrência do comportamento. Nos esque-
mas de intervalo, o reforço se baseia em uma unidade de tempo específica, como um minuto ou
llffia hora. Em geral, o reforço de razão leva à maior resposta do que o reforço de intervalo. Os
operários pagos por produção geralmente são mais produtivos do que os pagos por hora, especial-
:nente se houver incentivos para níveis mais elevados de produtividade.

Esquemas fixos e variáveis O reforço parcial também pode ser dado em um esquema fixo
ou variável. No esquema fixo, o reforço é dado consistentemente, seguindo-se a um número espe-
cífico de ocorrências ou depois de uma quantidade específica de tempo. Independentemente de
serem pagos por produção ou por hora, os operários normalmente são pagos de acordo com um
mdice fixo, ganhando o mesmo por cada peça produzida ou por cada hora. O índice de reforço é
inteiramente previsível. No esquema variável de reforço, o reforço é aplicado em índices diferen- reforço contínuo Um tipo de
aprendizagem em que o
tes ou em momentos diferentes. O sujeito não sabe quantos comportamentos precisam ser executa- comportamento desejado é
dos ou quanto tempo precisa passar antes que o reforço ocorra. Um exemplo de um reforço variável reforçado sempre que ocorre.
é o vendedor que só é pago quando um cliente concorda em comprar um produto. reforço parcial Um tipo de
A influência dos esquemas de reforço sobre o comportamento pode ser observada nos hábitos aprendizagem em que o
de estudo dos alunos. Idealmente, os alunos vão estudar ao longo de todo o semestre, mas a realida- comportamento é reforçado
de é que, quando os exames são realizados em pontos fixos, os alunos tendem a estudar muito antes intermitentemente.
do exame e a não estudar nada depois. É típico do reforço de intervalo fixo que o comportamento só esquema de razão O reforço é
seja realizado quando é o momento de o reforço ser administrado. Quando os exames são num baseado no número de vezes que o
comportamento ocorre.
esquema de intervalo variável, tal como testes-surpresa, os alunos tendem a estudar mais freqüente-
mente e mais consistentemente. Os padrões de comportamento tipicamente observados em diferen- esquema de intervalo O reforço
é baseado em uma unidade de
tes esquemas de reforço podem ser vistos na Figura 6.13. tempo específica.
esquema fixo O reforço é
Persistência comportamental O esquema de reforço também afeta a persistência do com- oferecido consistentemente sempre
portamento. O reforço contínuo é altamente efetivo para a aquisição de um comportamento, mas se que o comportamento ocorre.
o reforço pára, o comportamento se extingue rapidamente. Por exemplo, sempre que você coloca esquema variável O reforço é
dinheiro em uma máquina de venda de algum produto, ela lhe dá esse produto. Se ela pára de lhe aplicado em índices diferentes ou
dar o produto, você rapidamente deixará de lhe dar dinheiro. Em contraste, uma máquina caça- em momentos diferentes.
níqueis paga em um esquema de razão variável. As pessoas continuam colocando seu dinheiro nas
196 GAZZANIGA e HEATHERTON

máquinas caça-níqueis mesmo que a máquina raramente reforce seu


1.000 comportamento. O efeito de extinção do reforço parcial descre-
ve a maior persistência de comportamento sob o reforço parcial, devido
à dificuldade de detectar a ausência de reforço. Durante o reforço con-
750
tínuo, é fácil detectar quando o reforço cessou. Mas se o comportamen-
V1
.113
to é reforçado só parte do tempo, o sujeito precisa repetir o comporta-
V1
oo_ 500 mento comparativamente mais vezes para detectar a ausência de reforço.
V1
Q)
cr:
Assim, quanto menos freqüente o reforço durante o treinamento, maior
a resistência à extinção. Para condicionar um comportamento que você
250 quer que persista, reforce-o continuamente durante a aquisição inicial e
depois mude lentamente para o reforço parcial. Os pais seguem natu-
ralmente essa estratégia ao ensinar os filhos a usar o vaso sanitário e
10 20 30 40 50 60 70 80 outros comportamentos.
Tempo (minutos)

A biologia e a cognição influenciam o


FIGURA 6.13 Essas curvas mostram a aprendizagem típica em comportamento operante
diferentes esquemas de reforço. Quanto mais íngreme a linha, mais altos
os índices de resposta . As marcas nas linhas indicam quando o reforço foi Behavioristas como B.E Skinner acreditavam que todos os compor-
dado. Observe que o reforço de razão leva ao índice mais elevado de tamentos podiam ser explicados por princípios simples de condiciona-
resposta . mento. O romance de Skinner, Walden Two, descreve uma utopia em que
todos os problemas da sociedade são resolvidos por meio de princípios de
condicionamento operante. Na realidade, contudo, existem limites para
explicar o comportamento humano por meio de esquemas de reforço. Abiologia impõe limites à apren-
dizagem, e o reforço nem sempre tem de estar presente para que a aprendizagem aconteça.

Limitações biológicas Embora os behavioristas acreditassem que qualquer comportamento


podia ser moldado por meio de reforço, agora está claro que os animais têm dificuldade em aprender
comportamentos que se opõem à sua adaptação evolutiva. Um bom exemplo de limites biológicos foi
obtido pelos Breland, um casal de psicólogos que utilizou técnicas de condicionamento operante
para treinar animais para comerciais (Breland e Breland, 1961). Eles descobriram que muitos dos
animais recusavam-se a realizar certas tarefas que lhes tinham sido ensinadas. Por exemplo, eles
treinaram um guaxinim para colocar moedas em um cofrinho em formato de porco, mas embora o
guaxinim inicialmente tenha aprendido a tarefa, ele eventualmente se recusou a depositar as moe-
das. Em vez disso, ele ficou sobre o cofre e esfregou as moedas com as patinhas. O comportamento
de esfregar não foi reforçado; ele, na verdade, adiou o reforço. Uma explicação para o comportamen-
to do guaxinim é que a tarefa era incompatível com comportamentos adaptativos inatos. Oguaxinim
associou a moeda à comida e a tratou da mesma maneira: esfregar o alimento com as patas é inato
nos guaxinins. Em uma linha semelhante, os pombos podem ser treinados para bicar chaves a fim de
evitar choques elétricos. Entretanto, eles podem aprender a evitar choques batendo as asas, porque
esse é o seu meio natural de escapar. O psicólogo Robert Bolles argumenta que os animais têm
reações inatas de defesa a estímulos ameaçadores (Bolles, 1970). O condicionamento é mais efetivo
quando a associação entre a resposta comportamental e o reforço é semelhante às predisposições
inatas do animal.
A perspectiva evolutiva vê o cérebro como uma compilação de módulos específicos para dife-
rentes domínios, cada um responsável por diferentes funções cognitivas. Isso sugere que a aprendi-
zagem é o resultado de muitos mecanismos únicos que resolvem problemas individuais adaptativos.
não o resultado de mecanismos de aprendizagem geral (Rozin e Kalat, 1971; Shettleworth, 2001).
Conforme argumenta o psicólogo evolutivo Randy Gallistel (2000), as pessoas aceitam prontamente
que os pulmões são adaptados para a respiração, e os ouvidos, para a audição. Ninguém argumenta-
ria que os pulmões podem ser usados para ouvir e os pulmões, para respirar. Não existe nenhum
"órgão geral dos sentidos''. Assim, faz igual sentido postular que existe uma variedade de mecanis-
mos de aprendizagem que têm evoluído para resolver problemas específicos. Considere uma formiga
efeito de extinção do reforço que deixa o ninho para procurar comida. Tipicamente, a formiga faz um caminho tortuoso e indireto
parcial A maior persistência do
comportamento sob reforço parcial até encontrar comida, momento em que toma um caminho direto para o ninho, mesmo em território
do que sob reforço contínuo. desconhecido. Isso difere do que seria esperado de modelos tradicionais de aprendizagem. Aformi-
ga jamais foi recompensada por seguir o caminho, e nunca houve uma associação classicamente
CIÊNCIA PSICOLÓGICA 197

condicionada entre os objetos ambientais pouco familiares e o caminho mais direto para o ninho. Em
mapas cognitivos Uma
vez disso, processos mentais que calculam pequenas mudanças de distância e direção fornecem uma representação visuoespacial do
solução para o caminho mais direto para casa. O que Gallistel quer dizer é que a aprendizagem ambiente.
consiste em capacidades de aprendizagem especializadas, que resolvem os problemas adaptativos aprendizagem
enfrentados pelos animais em seu ambiente. latente Aprendizagem que
ocorre na ausência de reforço.
Distinção aquisição-desempenho Outro desafio à idéia de que o reforço é responsável
por todos os comportamentos é que a aprendizagem pode ocorrer sem reforço. Edward Tolman, um
dos primeiros teóricos cognitivos, argumentou que o reforço tem maior impacto sobre o desempenho
do que sobre a aprendizagem. Na época, Tolman estava realizando experimentos em que ratos ti-
nham de aprender a percorrer labirintos complexos para obter alimento. Tolman acreditava que os
ratos criavam mapas cognitivos, representações espaciais do labirinto, que os ajudavam a apren-
der a encontrar rapidamente a comida. Para testar sua teoria, Tolman e seus alunos estudaram três
grupos de ratos cuja tarefa era percorrer um labirinto até uma "caixa-alvo" que continha o reforço,
geralmente comida. O primeiro grupo não recebeu qualquer reforço, e seu desempenho foi bastante
fraco. Sem nenhuma caixa-alvo a encontrar, os ratos vagavam pelo labirinto. Um segundo grupo foi
reforçado em cada tentativa e aprendeu a encontrar a caixa-alvo rapidamente. O grupo crítico foi o
;erceiro, que não foi reforçado nas primeiras dez tentativas, mas foi depois reforçado nas subseqüen-
tes. Tolman descobriu que esse grupo apresentou uma curva de aprendizagem surpreendentemente
rápida, de modo que alcançou imediatamente o grupo que fora continuamente reforçado (Figura
6.14). Esse resultado implica que os ratos tinham aprendido um mapa cognitivo do labirinto e foram
capazes de usá-lo quando tiveram acesso ao reforço. Tolman utilizou o termo aprendizagem la-
tente para se referir à aprendizagem que ocorre na ausência de reforço.
Outra forma de aprendizagem que ocorre na ausência de reforço é a aprendizagem por insight
- uma forma de solução de problemas (discutida no Capítulo 8) em que uma solução surge subita-
mente após um período de inação ou da contemplação do problema. Você provavelmente teve esse
tipo de experiência, em que rumina sobre um problema por um tempo e então, subitamente, sabe a
resposta. O reforço não fornece uma explicação adequada do processo de aprendizagem por insight,
embora possa predizer se o comportamento será repetido subseqüentemente.

Economia comportamental da aprendizagem Uma abordagem relativamente nova


ao entendimento do condicionamento operante con-
sidera o valor do reforço no contexto dos princípios
econômicos básicos, tais como oferta e demanda.
Quando a oferta de alguma coisa é pequena, essa coi- 10
sa costuma ser mais valorizada e, portanto, serve como
Nenhuma recompensa
um reforço mais potente. Às vezes, as considerações , de alimento
econômicas são mais complicadas. O que você prefe- 8
'/
--><--"
Vl
re, $100 hoje ou $1.000 no próximo ano? Embora possa eQ:;
parecer que o último pagamento seria mais reforça- QJ
6
dor, seu valor é descontado porque existe uma demo- 'O
l1l

ra significativa antes de ele ser recebido. Mas e se você '6


•QJ
4
estiver precisando do dinheiro agora? Nesse caso, es- ~
~
perar tem um custo adicional. Na verdade, os adultos Regularmente recompensados '
2 '
comsalários mais baixos descontam futuros pagamen-
tos mais freqüentemente do que os que ganham salá- Nenhum alimento até o Dia 11 ~
rios mais altos (Green et al., 1996). No âmago da abor- o
dagem comportamental econômica está a idéia de que o 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
as pessoas e outros animais freqüentemente precisam
Dias
escolher entre reforços. O valor subjetivo do reforço é
afetado por quanto tempo a pessoa tem de esperar
para recebê-lo e pela probabilidade de ele ser real-
FIGURA 6.14 Ratos que foram regularmente reforçados por percorrer corretamente
mente recebido. Essa abordagem ajudou no entendi- um labirinto apresentaram um desempenho melhorado com o passar do tempo quando
mento de diversos comportamentos, especialmente comparados a ratos que não receberam reforço. Os ratos que não foram reforçados nas 1O
aqueles associados à adição. Warren Bickel e colabo- primeiras tentativas e sim nas posteriores apresentaram uma mudança imediata de
radores (1999; Madden et al., 1997) descobriram que desempenho, indicando que tinham aprendido o caminho através do labirinto, mas que sua
tanto fumantes como adietas à heroína descontavam aprendizagem não fora revelada, ou estava latente, até ser reforçada.
198 GAZZANIGA e HEATHERTON

futuras recompensas mais freqüentemente do que os não-adietas, o que pode contribuir para seus
problemas de impulsividade e autocontrole. A questão de adiar a gratificação imediata para obter
recompensas no longo prazo é discutida mais detalhadamente no Capítulo 9.
Aescolha comportamental também está implicada em estudos sobre a procura de alimento por
parte de animais, ou o forragear. Os animais escolherão comer dependendo da probabilidade de o
alimento estar presente, do custo de energia associado a obter o alimento e dos riscos associados a
predadores (Shettleworth, 2001). Deve o animal comer todas as frutinhas de um canteiro e depois
procurar outro canteiro, ou deve guardar um pouco para mais tarde e procurar mais canteiros? Os
novos canteiros talvez tenham frutinhas, mas talvez não.Os pesquisadores que estudam animais em
seus ambientes naturais descobrem que os animais são extremamente sensíveis aos índices relativos
de reforço entre diferentes canteiros. O tempo que eles gastam comendo num canteiro é influencia-
do pelo índice de reforço, o índice relativo de reforço em outros canteiros e o tempo que levam até
chegar a esses outros canteiros. Ateoria do forrageamento ótimo descreve como os animais que vivem
distantes da civilização escolhem prover seus próprios esquemas de reforço. Ela prediz que os ani-
mais, às vezes, agirão de modo aparentemente arriscado. Considere um animal que se depara com a
escolha de se alimentar em dois locais que têm a mesma quantidade média de alimento, só que um
é muito mais variável, às vezes não tem nenhuma comida e às vezes tem montes de comida. Se o
animal está morrendo de fome, sua melhor chance de sobrevivência está em seguir a estratégia
aparentemente arriscada de forragear no local mais variável. Os animais também aprendem a variar
como comem de acordo com a probabilidade de ser atacados por predadores. Pesquisas da Universi-
dade de Lethbridge, no Canadá, descobriram que os ratos comem muito rápido quando estão no
escuro, especialmente quando foram privados de comida (Wishaw et al., 1992). Embora comer rápi-
do seja ótimo para consumir grandes quantidades de alimento, não é ótimo para a digestão. Quando
na luz, os ratos comem mais devagar, mas esquadrinham freqüentemente o ambiente em busca de
predadores. Essas variações refletem o fato de mesmo um comportamento simples como comer
requer inúmeros cálculos para detectar o custo e o benefício associados a diferentes opções compor-
tamentais. As escolhas feitas pelo animal refletem capacidades de aprendizagem especializadas que
são adaptativas ao ambiente.

o
Em que o condicionamento operante é diferente do condicionamento clássico?
O condicionamento clássico envolve a associação aprendida entre estímulos neutros e reflexivos. O
condicionamento operante é uma forma de aprendizagem em que os estímulos que se seguem a comportamentos
determinam a probabilidade de os comportamentos serem repetidos. Os reforços positivos aumentam o
comportamento ao proporcionar uma recompensa, ao passo que os reforços negativos aumentam o
comportamento ao remover um estímulo aversivo. O reforço contínuo é melhor para a aquisição de um novo
comportamento, enquanto o reforço parcial, especialmente o reforço de razão variável, é mais resistente à
extinção. A punição só é efetiva quando é aplicada imediatamente após o comportamento indesejado. A punição
muitas vezes é utilizada de modo inefetivo e tem uma série de conseqüências indesejadas. A biologia impõe limites
para o que os animais podem aprender, e os animais têm dificuldade em adquirir comportamentos que são
incompatíveis com respostas adaptativas evolutivas.

COMO O FATO DE OBSERVAR OS OUTROS AFETA


A APRENDIZAGEM'?
Suponha que você está tentando ensinar alguém a pilorar um avião. Como você poderia aplicar
princípios de aprendizagem discutidos neste capítulo para atingir seu objetivo? Reforçar comporta-
mentos arbitrários corretos obviamente seria uma estratégia desastrosa para treinar aspirantes a
pilotos. Da mesma forma, ensinar as pessoas a jogar futebol, comer com pauzinhos chineses ou
executar passos complexos de dança requer mais do que simplesmente reforçar. No caso de muitos
O que é aprendido observando- comportamentos, nós não aprendemos fazendo, e sim observando as ações dos outros. Nós aprende-
se os outros? mos coisas como etiqueta social pela observação, e aprendemos se devemos ficar ansiosos em uma
situação olhando e vendo os outros ficarem ansiosos. Igualmente, nós adquirimos muitas das nossas
CIÊNCIA PSICOLÓGICA 199

atitudes sobre política, religião, pessoas e objetos de fontes externas, tais como nossos pais, pares,
aprendizagem observacional
professores e a mídia. Nesta seção, nós examinamos a aprendizagem que ocorre ao observarmos o A aprendizagem que ocorre
comportamento dos outros. quando comportamentos são
adquiridos ou modificados após
exposição a outras pessoas que
estão realizando o comportamento.
A aprendizagem pode ocorrer por meio da observação
A aprendizagem observacional, que ocorre quando comportamentos são adquiridos ou
modificados após a exposição a outras pessoas que estão realizando o comportamento, é um podero-
so instrumento adaptativo para os humanos e para os animais. Os animais aprendem que o alimento
pode ser comido com segurança ao observar o que os pais comem e aprendem a temer objetos
perigosos ao observar os pais evitarem aqueles objetos. Da mesma forma, as crianças adquirem
crenças e habilidades básicas observando os pais e outros modelos de papel. Qualquer pai ou mãe
lhe dirá que as crianças pequenas são como esponjas, absorvendo tudo o que acontece ao seu redor.
Elas aprendem olhando, tanto quanto fazendo.

Os estudos observacionais de Bandura O trabalho mais completo sobre a aprendiza-


gem observacional foi conduzido por Albert Bandura (Figura 6.15) na década de 1960. Em uma
agora clássica série de estudos, crianças pré-escolares assistiram a um filme de um adulto brincando
com um grande boneco inflável chamado Bobo (Figura 6.16) . No filme, o adulto ou brincava tran-
qüilamente com Bobo ou atacava o boneco furiosamente, batendo nele com um bastão, socando-o
no nariz e chutando-o pela sala. Quando, mais tarde, as crianças foram colocadas para brincar com
alguns brinquedos, incluindo o boneco Bobo, as que tinham visto o filme mais agressivo apresenta-
ram uma probabilidade duas vezes maior de agir agressivamente em relação ao boneco (Bandura et
ai., 1961). Esses resultados sugerem que a exposição à violência na mídia pode aumentar a probabi-
lidade de as crianças agirem agressivamente. Essa posição é discutida em "Estudando a mente:
Violência e agressão na mídia''.

Aprendizagem observacional do medo A aprendizagem observacional também ocorre


em animais. Por exemplo, a psicóloga Susan Mineka investigou se os macacos Rhesus desenvolveri-
am uma fobia de cobras ao observar outros macacos reagindo a elas com medo. Ela percebera que os
macacos criados em laboratório não temiam cobras, ao passo que os criados longe da civilização
tinham um grande medo delas. Mineka e seus colegas desenvolveram um experimento com dois
grupos de macacos, um grupo criado longe da civilização e um grupo criado no laboratório. Para
obter comida, os macacos tinham de alcançar atrás de uma caixa que continha ou uma
cobra ou um objeto neutro. Quando a cobra estava na caixa, os macacos selvagens não
só não tocavam na comida, como também demonstravam sinais de perturbação, como
agarrar-se à jaula e fazer caras ameaçadoras (Figura 6.17). Os macacos criados em
laboratório alcançavam atrás da caixa quer ela contivesse a cobra quer não, e não de-
monstravam nenhum sinal aparente de medo. Mineka então mostrou aos macacos cria-
dos em laboratório a resposta assustada dos macacos selvagens para ver se ela afetaria
sua reação à cobra. Os macacos criados em laboratório desenvolveram rapidamente
medo de cobras, e esse medo perdurou por um período superior a três meses (Mineka et
ai., 1984).

Os animais e os seres humanos imitam os outros


Os animais e os humanos imitam prontamente as ações dos outros. Em um estudo,
pombos observaram outros pombos sendo reforçados em um alimentador (um aparelho
que liberava alimento) quando pisavam em uma barra ou bicavam o alimentador direta-
mente. Quando os pombos que estavam observando os outros foram, eles próprios, colo-
cados diante do alimentador, eles tendiam a usar a mesma técnica que tinham visto (Zen-
tall et ai., 1996). Igualmente, estratégias novas de uso de ferramentas foram observadas
em colônias de macacos, com os macacos bebês imitando o comportamento dos adultos. FIGURA 6. 15 Albert Bandura realizou importantes
Com poucos dias de vida, os recém-nascidos humanos imitam as expressões faciais que pesquisas mostrando que as pessoas podem aprender
observam e continuam a imitar gestos e outras ações conforme amadurecem. pela observação.
200 GAZZANIGA e HEATH ERTON

FIGURA 6.16 Cenas do clássico estudo com o boneco Bobo. Depois de ver um adulto agir
agressivamente (fileira superior), as crianças (nas duas fileiras inferiores) imitaram o que tinham visto.

A imitação do comportamento observado geralmente é referida como modelação, no sen-


tido de que os humanos ou os animais reproduzem os comportamentos de modelos - aqueles que
estão sendo observados. A modelação nos humanos é influenciada por vários fatores. Em geral, é
mais provável que imitemos as ações de modelos
atraentes, com status elevado e um tanto parecidos
conosco. Além disso, a modelação só será efetiva se o
observador for fisicamente capaz de imitar o com-
portamento. Simplesmente observar Tiger Woods fa-
zer a bola voar quase 300 metros com um golpe não
significa que poderíamos fazer isso se nos dessem um
taco de golfe.

Reforço vicário Outro fator que determina a


imitação do modelo pelos observadores é o fato de o
modelo ser reforçado por executar o comportamento.
Em outro estudo, Bandura e colaboradores mostraram
a crianças um filme de um adulto brincando agressi-
vamente com um boneco Bobo, mas dessa vez o filme
tinha três finais diferentes (Bandura et ai., 1963). Uma
condição controle não mostrava nenhuma conseqüên-
cia para o comportamento do modelo, enquanto o se-
gundo filme mostrava o adulto sendo recompensadc
com doces e elogios, e a terceira mostrava o adultc
FIGURA 6.17 Mineka propunha que os macacos alcançassem atrás da caixa
sendo espancado e verbalmente repreendido. Quan-
transparente para obter comida. Quando a caixa transparente continha uma cobra, os
macacos selvagens se recusavam a alcançar atrás da caixa. Ao observar as ações desses do, subseqüentemente, brincaram com um boneco
macacos, os macacos criados em laboratório, que originalmente não temiam cobras, Bobo, as crianças que tinham observado o modelo ser
aprenderam a ter medo delas. Isso sugere que os medos podem ser aprendidos pela recompensado apresentavam uma probabilidade mui-
observação. to maior de agir agressivamente em relação ao bonecc
VIOLÊNCIA E AGRESSÃO NA MÍDIA
Os aparelhos de televisão nos Estados Unidos ficam ligados uma televisão se tornam agressivos mais tarde. Talvez ajam
média de cinco ou seis horas por dia, e as crianças pequenas agressivamente aqueles que assistiram a uma quantidade excessiva
freqüentemente passam mais tempo assistindo à televisão do que de televisão e, portanto, tiveram menos oportunidades de
realizando qualquer outra atividade, incluindo trabalhos escolares desenvolver habilidades sociais. Correlação não prova causação.
(Roberts, 2000). Existe muita violência nos programas de televisão. Somente por estudos de laboratório cuidadosos em que os
A criança média testemunha mais de cem mil atos violentos na participantes sejam designados aleatoriamente a condições
televisão antes de concluir o ensino fundamental; você, experimentais é que poderemos determinar causalidade.
provavelmente, assistiu a mais de 18 mil assassinatos antes de Obviamente, não é prático designar aleatoriamente diferentes
começar a faculdade. Mais recentemente, as crianças também crianças a diferentes tipos de mídia, e é eticamente questionável
tiveram acesso ao vídeo e ao cabo, onde vêem filmes mostrando fazer crianças assistirem à violência se pensamos que isso as
violência gráfica e sexualizada, completamente inadequados para tornará mais agressivas.
crianças. Que efeito essa maciça exposição à violência tem sobre o Apesar dos problemas na interpretação de estudos específicos,
comportamento agressivo? a maioria dos cientistas acredita que existe uma relação direta
Três décadas de pesquisa vinculam o assistir à violência com entre exposição à violência e comportamento agressivo. Na
violência imitativa, comportamento agressivo, aceitação da verdade, uma recente declaração conjunta da American Academy
violência como solução, sentimentos de hostilidade aumentada e of Pediatrics, da American Academy of Child and Adolescent
disposição a aplicar estímulos dolorosos a outras pessoas. Alguns Psychiatry, da American Medical Association, da American
pesquisadores realizaram estudos de laboratório controlados em Academy of Family Psysicians e da American Psychological
que designavam aleatoriamente crianças para assistir a clipes de Association concluiu que uma imensa quantidade de estudos
filmes violentos ou neutros e mediam subseqüentemente o "aponta esmagadoramente para uma conexão causal entre a
comportamento agressivo. Em geral, comparadas às que assistiram violência na mídia e o comportamento agressivo em algumas
aos filmes neutros, as crianças expostas à violência apresentavam crianças" (Joint Statement [Declaração Conjunta]), 2000, p. 1).
maior probabilidade de agir de maneira agressiva durante tarefas De que maneira a violência na mídia promove agressão nos
subseqüentes. Um estudo de Leonard Eron e seus colegas adolescentes? Uma possibilidade é que a exposição a quantidades
descobriu que os hábitos de assistência à televisão aos 8 anos de maciças de violência nos filmes, que representam mal a prevalência
idade prediziam comportamento violento e atividade criminal aos da violência na vida real, leva os adolescentes a acreditarem que a
30 anos (Eron, 1987). O tamanho do efeito médio (a magnitude da violência é algo comum e inevitável. Uma vez que poucas pessoas
associação entre variáveis independentes e dependentes), são punidas por agir de forma violenta nos filmes, as crianças
determinado por médias estatísticas de centenas de estudos, é podem vir a acreditar que esses comportamentos são justificados
quase tão grande como o que vincula o cigarro ao câncer e é (Bushman e Huesman, 2001). Isto é, a descrição da violência nos
maior do que o tamanho do efeito para o não-uso de camisinha e filmes ensina às crianças possíveis roteiros sociais para resolver
a transmissão do HIV ou para a exposição ao chumbo e o QI nas problemas sociais. Ao ensaiar mentalmente o roteiro, ou observar o
crianças (Bushman e Anderson, 2001). mesmo roteiro encenado muitas vezes em diferentes filmes, uma
Existem, todavia, alguns problemas com os estudos sobre esse criança pode vir a acreditar que a brutalidade é uma maneira
tópico. O psicólogo social Jonathan Freedman (1984) observa que efetiva de resolver problemas e lidar com as pessoas que nos
muitos dos chamados comportamentos agressivos apresentados incomodam (Huesman, 1998).
pelas crianças poderiam ser interpretados como comportamentos Talvez o efeito mais prejudicial de assistir a repetidos episódios
brincalhões, em vez de agressão.Uma preocupação mais séria é se de violência gráfica seja a dessensibilização do espectador, que ao
os estudos são generalizáveis para o mundo real, o que se refere à testemunhar episódios violentos subseqüentes apresenta uma
sua validade externa. A exposição a clipes de filmes violentos no resposta emocional diminuída (Bushman e Anderson, 2001). Assim
laboratório é diferente de assistir à televisão na vida real. Os clipes como os campos de treinamento do exército habituam os soldados
de filmes utilizados no laboratório são geralmente breves e aos horrores do combate, a violência nos filmes amortece as
extremamente violentos, e as crianças assistem a eles sozinhas. No respostas emocionais e cognitivas das crianças diante de cenas de
mundo real, os episódios de violência são misturados com material sangue e violência gráfica.Colocando de modo simples: após
não-violento, e as crianças assistem a eles junto com outras que assistir a close-ups excruciantemente vividos de pessoas sendo
podem amenizar o efeito. mutiladas, espancadas, estupradas ou torturadas, essas imagens
Até os estudos longitudinais que avaliam os hábitos infantis de deixam de produzir uma grande reação nos espectadores. Dessa
televisão e o comportamento violento posterior não conseguem maneira, as crianças talvez estejam sendo socializadas para serem
provar satisfatoriamente que a televisão causou o insensíveis à dor e ao sofrimento dos outros. A exposição à
comportamento. É muito possível que outras variáveis, como violência na mídia pode inclusive contribuir para comportamentos
personalidade, pobreza ou negligência parental, tenham um adolescentes violentos, como os recentes tiroteios em escolas.
efeito sobre os hábitos de televisão e as tendências violentas. Embora seja altamente improvável que a exposição à mídia seja a
Afinal de contas, nem todos os que assistem à violência na causa dos tiroteios nas escolas, ela pode ser um fator que promove
um estado mental capaz de atuar ímpetos e impulsos violentos.

do que as crianças do grupo-controle. Em contraste, as que tinham visto o modelo ser castigado
apresentavam uma probabilidade menor de agir agressivamente do que o grupo-controle. Isso signi-
fica que essas crianças não aprenderam o comportamento? Não. Quando as crianças, mais tarde,
modelação A imitação do
receberam pequenos presentes para realizar as ações do modelo, todas conseguiram realizá-las con- comportamento por meio da
fiavelmente. É importante distinguir entre a aquisição de um comportamento e o seu desempenho. aprendizagem observacional
Todas as crianças aprenderam o comportamento, mas apenas as que viram o modelo ser recompen-
202 GAZZANIGA e HEATHERTON

sado executaram o comportamento. A aprendizagem vicária ocorre quando as pessoas apren-


aprendizagem vicária
A aprendi zagem que ocorre
dem as conseqüências de uma ação ao observar os outros serem recompensados ou punidos por
quando as pessoas aprendem as realizar a ação.
conseqüências de uma ação ao
observar outros sendo Neurônios de espelho O que acontece no cérebro durante a aprendizagem de imitação? Um
recompensados ou punidos por
executar uma ação.
estudo fascinante descobriu que neurônios do córtex pré-motor chamados neurônios em espe·
lho são ativados quando um macaco observa outro macaco alcançando um objeto (Rizzolatti et ai ..
neurónios em espelho
Neurônios do córtex pré-motor que
1996). Esses neurônios em espelho são os mesmos que seriam ativados se o próprio macaco execu-
são ativados quando se observa tasse o comportamento. Éespecialmente provável que os neurônios em espelho sejam ativados quando
outro executar uma ação. os macacos observam um macaco-alvo realizar um movimento com algum objetivo, como estender o
braço para pegar um objeto. Nem a visão do objeto sozinho, nem a mera visão do macaco-alvo levam
à ativação desses neurônios em espelho.
Neurônios em espelho semelhantes foram identificados em humanos, utilizando-se imagens de
PET de registros elétricos do cérebro (Gallese e Goldman, 1998). Assim, sempre que você observa
outra pessoa executando uma ação, circuitos neurais similares estão descarregando nos cérebros de
ambos. A função dos neurônios em espelho está atualmente aberta a debate. Esse sistema pode
servir como a base da aprendizagem de imitação, mas observe que a descarga dos neurônios em
espelho não leva ao comportamento imitativo no observador. Isso levou alguns teóricos a especular
que os neurônios em espelho nos ajudam a explicar e predizer o comportamento dos outros. Em
outras palavras, eles nos ajudam a nos colocarmos no lugar das pessoas que observamos para com-
preender melhor suas ações.

o
Como observar os outros afeta a aprendizagem?
Grande parte dos comportamentos é aprendida observando-se os comportamentos dos outros. As crianças
aprendem a linguagem, habilidades sociais e atitudes políticas observando seus pais, pares e professores, e nós
ensinamos habilidades complexas, como fazer uma cirurgia e dirigir um carro, por demonstração. Animais não-
humanos também aprendem pela observação: qual alimento é seguro comer e quais objetos devem ser temidos. As
pessoas imitam modelos que são atraentes, tem status elevado e certa semelhança com elas próprias. A modelação
tem maior probabilidade de ocorrer quando o modelo foi recompensado por seu comportamento e é menos
provável quando o mode lo fo i punido. O condicionamento vicário influencia na execução de um comportamento,
mas não em sua aprendizagem. É possível que os neurônios em espelho, que descarregam quando um
comportamento é observado, sejam a base neural da aprendizagem de imitação.

QUAL É A BASE BIOLÓGICA DA RECOMPENSA?


Embora as pessoas utilizem freqüentemente o termo "recompensa" como sinônimo de reforço
positivo, Skinner e outros behavioristas tradicionais definiram o reforço estritamente em termos de
aumentar ou não a freqüência de um comportamento. Na verdade, eles evitaram cuidadosamente
qualquer especulação sobre a possibilidade de as experiências subjetivas terem algo a ver com o
comportamento, pois acreditavam ser impossível estudar empiricamente os estados mentais. Mas a
revolução biológica começou a nos mostrar como aprendemos. Nesta seção, nós examinamos a base
biológica do reforço e sua aplicação ao entendimento dos comportamentos condicionados, tais como
a adicção a drogas.

A auto-estimulação é um modelo de recompensa


Uma das primeiras descobertas apontando para o papel dos mecanismos neurais no reforço
aconteceu devido a um pequeno erro cirúrgico. Na década de 1950, Peter Milner e James Olds
estavam testando se a estimulação elétrica de uma região específica do cérebro facilitaria a apren-
dizagem. Para ver se a aprendizagem observada por eles fora causada pela atividade do cérebro
ou pelas qualidades aversivas do estímulo elétrico, Olds e Milner administraram choques elétricos
CIÊNCIA PSICOLÓGICA 203

ao cérebro de ratos somente quando os ratos estavam em uma localização específica na jaula. A
auto-estimulação intracraniana
lógica era que se a aplicação da eletricidade fosse aversiva, os ratos evitariam seletivamente aque- (intracranial self-stimulation.
la localização. Felizmente para a ciência, eles administraram os choques na parte errada do cére- ICSS) Um procedimento em que
bro e, em vez de evitar a área da jaula associada à estimulação elétrica, os ratos voltaram ligeiro, os anima is conseguem se auto-
aparentemente querendo mais. administrar choques elétricos a
áreas específicas do cérebro.

Centros do prazer Olds e Milner, então, criaram um experimento para ver se os ratos pressio- sistema mesolímbico de
dopamina O importante sistema
nariam uma alavanca para se auto-administrar um choque em locais específicos do cérebro, um cerebral envolvido na recompensa,
procedimento subseqüentemente referido como auto-estimulação intracraniana (ICSS) (Fi- que conecta a área tegmentar
gura 6.18) . Os ratos se auto-administravam eletricidade aos seus cérebros com gosto, pressionando ventral (ATV) ao núcleo
a alavanca centenas de vezes por hora (Olds e Milner, 1954). Olds e Milner se referiram às regiões do accumbens.
cérebro que sustentam a ICSS como centros do prazer. Embora os behavioristas pudessem objetar ao
cermo "prazer", ficou claro para todo o mundo que a ICSS era um poderoso reforço. Em um experi-
mento, ratos que haviam estado em uma dieta quase de inanição por dez dias tinham de escolher
entre alimento e a oportunidade de se administrar a ICSS. Eles escolheram a estimulação elétrica
mais de 80% das vezes! Os ratos privados também escolheram a estimulação elétrica em vez de água
ou parceiros sexuais receptivos; eles inclusive atravessaram uma dolorosa grade eletrificada para
poder receber a ICSS. Os ratos mantinham a estimulação intracraniana até entrar em colapso por
exaustão. Descobriu-se que macacos testados em estudos semelhantes pressionam uma barra para
obter estimulação elétrica até 8 mil vezes por hora (Olds,1962).

Estimulação elétrica e reforço natural A maioria dos psicólogos acredita que as regiões
da ICSS são as mesmas ativadas por reforços naturais, como alimento, água e sexo. A estimulação
elétrica aplicada aos centros do prazer em ratos elicia comportamentos naturalmente motivados,
como comer, beber e copular com um parceiro disponível. Igualmente, privar um animal de alimento
ou água leva à ICSS aumentada, o que é interpretado como indicando que o animal está tentando
obter o estado subjetivo associado à recompensa natural. Finalmente, os mecanismos neurais que
estão por trás da ICSS e da recompensa natural parecem utilizar o mesmo sistema neurotransmissor, Por que certas experiências são
a dopamina. Em termos de condicionamento operante, essa evidência sugere que a dopamina serve recompensadoras?
como a base neuroquímica do reforço positivo.

A dopamina sinaliza a recompensa


Os primeiros estudos de mapeamento indicaram que a ICSS mais
forte e mais confiável ocorria no feixe prosencefálico medial (FPM), que
consiste numa coleção, ou feixe, de axônios que ligam o mesencéfalo ao
prosencéfalo (Figura 6.19). Atravessando o FPM está o sistema me-
solímbico de dopamina, que conecta a área tegmentar ventral (ATV) -
ao núcleo accumbens. Esse sistema é o mecanismo cerebral mais impor-
cante por trás da recompensa (Wise e Rompre, 1989). A estimulação \ "'
elétrica do FPM ativa esse sistema e leva à liberação de dopamina no
núcleo accumbens. Lesões nessa via interferem na ICSS e em outros com- Eletrodo implantado
portamentos naturalmente motivados, como comer, beber e copular. no cérebro

Ativação do núcleo accumbens Quase sempre que fazemos


algo agradável, o prazer que sentimos resulta da ativação de neurônios
de dopamina no núcleo accumbens. Por exemplo, apreciar a comida
depende da atividade de dopamina. Ratos famintos que recebem comi-
da têm uma liberação aumentada de dopamina no núcleo accumbens e,
quanto maior a fome, maior a liberação de dopamina (Ralis et al., 1980).
A comida tem um sabor melhor quando estamos com fome e a água é
mais recompensadora quando estamos com sede porque existe uma maior
liberação de dopamina em condições de privação do que de não-privação.
No condicionamento operante, a liberação de dopamina estabele-
ce o valor de um reforço. Drogas que bloqueiam os efeitos da dopamina FIGURA 6.18 Um rato se auto-administra eletricidade aos centros
perturbam o condicionamento operante. Por exemplo, Jim Stellar e seus do prazer no cérebro.
204 GAZZANIGA e HEATHERTON

Córtex colaboradores ensinaram ratos a percorrer um labirinto a fim de receber


frontal estimulação elétrica, mas quando injetaram um bloqueador de dopamina
nos ratos tiveram de ligar a corrente elétrica para fazer com que os ratos
percorressem o labirinto (Stellar et ai., 1983). O bloqueador diminuía o
valor do reforço da estimulação elétrica. Como poderíamos esperar, as
drogas que aumentam a ativação da dopamina, como a cocaína e as anfe-
taminas, aumentam o valor de recompensa dos estímulos.

Os reforçadores secundários também dependem da


dopamina Os reforçadores naturais parecem sinalizar recompensas
diretamente pela ativação dos receptores de dopamina no núcleo accum-
bens. Mas e os reforçadores secundários, como dinheiro ou boas notas?
Por um processo de condicionamento clássico, estímulos neutros que ini-
cialmente não conseguem estimular a liberação de dopamina passam fa-
cilmente a consegui-lo depois de serem emparelhados com estímulos in-
condicionados. Em um estudo, apresentou-se a macacos uma porta tipo
ventral guilhotina que se abria ocasionalmente. Aabertura da porta não ativava a
atividade de dopamina. Os experimentadores, então, colocaram maçãs
FIGURA 6.19 A via mesolímbica da dopamina conecta a área na entrada da porta, de modo que a abertura da porta foi associada ao
tegmentar ventral ao núcleo accumbens. Essa via está envolvida na estímulo incondicionado da comida. Após várias repetições de condicio-
recompensa. namento, a abertura da porta levou, sozinha, a uma liberação aumentada
de dopamina (Ljungberg et ai., 1992). Assim, a visão de uma pessoa ama-
da, tirar uma boa nota ou ganhar um belo cheque de pagamento podem
estar condicionados para produzir ativação de dopamina. As drogas que bloqueiam os efeitos da
dopamina parecem bloquear as qualidades recompensadoras da maioria das atividades. Os portado-
res da síndrome de Tourette, um transtorno de controle motor, recebem bloqueadores de dopamina
para controlar os movimentos involuntários do corpo. Esses indivíduos têm dificuldade em controlar
movimentos corporais involuntários. Eles, geralmente, também têm dificuldade em manter a medi-
cação, pois sentem que as drogas lhes roubam o prazer da vida.

A dependência de drogas tem componentes


aprendidos e biológicos
Ao longo da história, as pessoas descobriram que ingerir determinadas substâncias pode alterar
seu estado mental de maneiras desejáveis. Os problemas sociais decorrentes do uso de drogas são
bem conhecidos. Mesmo o uso legal de drogas, como fumar cigarros, pode ser mortal. Por que as
pessoas se arriscam a morrer ou a sofrer prejuízos para obter um prazer momentâneo? Pense nos
soldados estadunidenses descritos no início deste capítulo. Por que eles tomaram drogas mesmo
sabendo que, se fossem pegos, isso poderia retardar sua muito desejada partida do Vietnã? As pes-
quisas dos psicólogos fornecem algumas explicações fisiológicas, comportamentais, cognitivas e so-
ciais para o uso de drogas. Esta seção focaliza os aspectos recompensadores do uso de drogas, das
perspectivas da teoria da aprendizagem e biológica.

Dependência física e psicológica O termo dependência física é sinônimo de adicção,


um estado fisiológico em que deixar de ingerir uma substância leva a sintomas de abstinência, um
estado desagradável caracterizado por ansiedade, tensão e fissura (desejo descontrolado de alguma
coisa). Adependência física está freqüentemente associada à tolerância, de modo que cada vez mais
dependência física Sinónimo de
adicção, o estado fisiológico em que
e mais da droga precisa ser consumida para haver o mesmo efeito subjetivo. A dependência psi-
deixar de ingerir uma substância cológica se refere ao uso habitual e compulsivo da substância, apesar das conseqüências. Amaioria
específica leva a sintomas corporais das adições envolve tanto fatores fisiológicos como psicológicos, e os pesquisadores estudam a adi-
de abstinência . ção em múltiplos níveis, como pode ser visto em ''li.travessando os níveis de análise: Compreendendo
dependência psicológica Uso a adicção".
habitual de substâncias, apesar das
conseqüências, e uma necessidade
compulsiva de continuar utilizando Reforço negativo e positivo O abuso de drogas tem aspectos de reforço negativos e positi-
a droga. vos. Os adietes habitualmente abusam de drogas para escapar aos aspectos psicológicos e físicos da
abstinência, desse modo reforçando negativamente o uso de drogas. As pessoas também tomam
CIÊNCIA PSICOLÓGICA 205

drogas para esquecer seus problemas ou lidar com o estresse, e isso também envolve reforço negati-
estimulantes
rn. Lembre que uma das razões pelas quais os nossos soldados no Vietnã tomavam narcóticos era psicomotores Drogas que at ivam
para escapar dos horrores da guerra. o sistema nervoso sim pát ico e
O uso de drogas também é positivamente reforçado. As pessoas usam drogas para se sentir aument am a atividade
bem.O potencial de adicção de uma droga específica é determinado pela velocidade de seus efeitos co mportamental e mental.
~ecompensadores. Por exemplo, a heroína entra no cérebro mais facilmente do que a morfina; assim,
embora a heroína e a morfina tenham efeitos idênticos sobre os receptores de opiáceos, a maior
·;elocidade da heroína a torna mais aditiva do que a morfina. Pela mesma razão, é mais provável que
as pessoas se tornem adietas à cocaína de crack, que fumam, do que à cocaína em pó, que cheiram,
;x>rque fumar aumenta a velocidade com que a cocaína chega ao cérebro.
Osistema mesolímbico de dopamina é o sistema cerebral mais importante envolvido no reforço
;x>sitivo do uso de drogas. Como acontece no caso da ICSS, comida, água e sexo, a maioria das
drogas aditivas - incluindo álcool, nicotina, heroína, cocaína e maconha - estão associadas à
Jlaior liberação de dopamina no núcleo accumbens. As drogas aumentam a liberação da dopamina
ou impedem a terminação normal de seu sinal neural. A maioria dos pesquisadores concluiu que a
liberação de dopamina é uma condição necessária para o reforço e para a dependência (Koob, 1999).

Estimulantes psicomotores Os estimulantes psicomotores, incluindo a cocaína e as


anfetaminas, são drogas que aumentam a atividade comportamental e mental. Essas drogas ativam
o sistema nervoso simpático (aumentando o ritmo cardíaco e a pressão sangüínea), melhoram o
aumor e perturbam o sono. Elas também são altamente reforçadoras. A cocaína é derivada das
~olhas da planta coca, encontrada principalmente na América do Sul. Os usuários de cocaína experien-
ciam uma onda de confiança e sentimentos agradáveis. Eles ficam alertas, cheios de energia, sociá-
':eis e sentem pouca necessidade de sono. Um farmacêutico da Geórgia, John Pemberton, ficou tão
1II1pressionado com a cocaína que a adicionou à água com soda, para
:una digestão mais fácil, criando assim a Coca-Cola (Figura 6.20). Em 1

1906, o governo dos Estados Unidos decretou que a cocaína era ilegal, e §
ela foi retirada da bebida. Até hoje, contudo, a Coca-Cola é feita de folhas .~
.~
de coca das quais foi retirada a cocaína. Ao contrário dos efeitos positivos
da cocaína, o uso habitual de grandes quantidades pode levar à paranóia e
a comportamentos psicóticos e violentos (Ottieger et ai., 1992).
As anfetaminas são estimulantes psicomotores, sintetizados utili-
zando-se métodos simples de laboratório, que ganham as ruas com no-
Jles como speed, meth, ice e crystal. As anfetaminas têm uma longa histó-
ria de uso para perder peso e se manter acordado. Mas as anfetaminas
têm efeitos colaterais negativos - como insônia, ansiedade e problemas
cardíacos - e as pessoas tornam-se adietas rapidamente. Elas raramen-
te são utilizadas para propósitos médicos legítimos. Os estimulantes psi-
comotores geralmente funcionam interferindo na reabsorção normal de
dopamina pelo neurônio liberador, o que permite à dopamina permane-
cer na sinapse e, assim, estender seus efeitos. As anfetaminas também
aumentam a liberação de dopamina pelos neurônios relevantes. As dro-
gas que bloqueiam a ação da dopamina reduzem as propriedades refor-
çadoras dos estimulantes psicomotores.

Álcool Os estadunidenses têm um relacionamento de amor-ódio


com o álcool. Por um lado, beber moderadamente é um aspecto aceito
da interação social normal. Por outro, o álcool é uma fonte importante
de muitos problemas sociais, como abuso conjugal e outras formas de IT RELIEVES EX H AUSTION
violência. O álcool é um fator em mais de metade de todos os aciden-
tes fatais de carro, matando mais de 20 mil pessoas por ano. Mais
estadunidenses são mortos por motoristas bêbados a cada dois anos
do que morreram em toda a guerra do Vietnã (Koshland, 1989). Além
disso, um quarto das vítimas de suicídio e um terço das vítimas de
homicídio apresentam níveis de álcool no sangue que satisfazem o
critério legal de comprometimento das funções mentais. Um estudo re-
cente descobriu que aproximadamente um terço dos alunos universi- FIGURA 6.20 Uma das primeiras propagandas de Coca-Cola.
COMPREENDENDO A ADICÇÃO
Considerando apenas as substâncias comumente abusadas, como as 1995). Essas crianças também tendem a ter um mau
drogas ilegais, o álcool e as drogas de prescrição, é provável que a relacionamento com os pais, o que, por sua vez, promove a maior
maioria das pessoas conheça e se preocupe com alguém que é associação a grupos desviantes de iguais e assim por diante. Então é
adieto. Se incluirmos a nicotina e a cafeína, é provável que os adietes o ambiente familiar que leva ao uso de álcool e drogas? Alguns
sejam a maioria em quase todos os países do mundo. A perguntas teóricos, funcionando no nível genético de análise, sugerem que
que a ciência psicológica se faz sobre a adicção incluem: Por que as uma predisposição herdada para a busca de sensação pode
pessoas usam drogas? Por que algumas pessoas se tornam adietas? predizer comportamentos que aumentam o risco do uso de
Por que os adietes continuam abusando das drogas, quando elas substâncias, tal como se juntar a usuários de drogas e assistir a
causam tanto caos e sofrimento pessoal? Para compreendermos vídeos de música que apresentam as drogas como fascinantes. Na
realmente a adicção, é necessário tratar dessas questões de múltiplas verdade, há evidências de que existem componentes genéticos na
perspectivas, do nível genético ao nível neuroquímico, dos níveis adicção, especialmente para o alcoolismo. Mas é importante
individual/da personalidade aos níveis social/cultural. salientar que existem poucas evidências diretas de um gene
Muitas teorias relacionadas à iniciação do uso de drogas ou separado para "alcoolismo" ou "adicção". O que poderia ser
álcool entre crianças ou adolescentes focalizam o nível de análise herdado é um agrupamento de características, incluindo certos
social/cultural. Elas exploram os processos sociais de aprendizagem traços de personalidade, uma preocupação diminuída com riscos
que enfatizam o papel dos pais, dos iguais e da mídia de massa. Por ou prejuízos pessoais e um sistema nervoso cronicamente baixo no
exemplo, no início da década de 1990, a campanha publicitária de que se refere à excitação. Por sua vez, esses fatores tornam muito
Joe Camel anunciava que o consumo de cigarros Camel aumentara mais provável que determinadas pessoas explorem as drogas e
10 vezes entre os adolescentes; em certo momento, mais crianças gostem delas.
pequenas eram capazes de identificar Joe Camel do que Mickey As pessoas continuam usando drogas e álcool porque essas
Mouse (Mizerski, 1995). As teorias da aprendizagem social também substâncias modificam o estado mental de uma maneira desejável.
enfatizam a auto-identificação com grupos de alto risco (p. ex., No nível neuroquímico, os cientistas estão interessados na adicção
"chapados" ou "drogados") como central para a iniciação do uso porque as drogas agem em sistemas neurotransmissores no
de drogas e álcool. Os adolescentes desejam encaixar-se em algum cérebro responsáveis pela motivação e pela emoção. Algumas
lugar, mesmo que seja em grupos percebidos pela sociedade como drogas ativam mecanismos de recompensa, principalmente pela
desviantes. ativação do caminho mesolímbico de dopamina. Outras drogas
No nível individual/da personalidade, alguns adolescentes diminuem a ansiedade e agem contra a depressão. Cresce o
apresentam maior probabilidade de experimentar drogas ilegais e interesse pelo estudo dos centros cerebrais envolvidos em
abusar de álcool. As crianças com elevada busca de sensação (um comportamentos aditivos, como o núcleo accumbens e várias
traço de personalidade que envolve busca de novidades e regiões dos lobos frontais.
disposição para correr riscos) estão mais sujeitas a se associar a Um dos aspectos mais fascinantes da adicção é que apenas
grupos desviantes e a usar álcool, tabaco e drogas (Wills et ai., cerca de 5%-10% das pessoas que utilizam drogas, fora tabaco e

tários relatou ter feito sexo durante um episódio recente de embriaguez, e os bebedores mais
pesados apresentavam grande probabilidade de terem feito sexo com um parceiro novo ou casual
(Leigh e Shafer, 1993). Isso coloca os bebedores pesados em um grande risco de exposição à AIOS.
O custo global dos problemas de bebida, variando da ausência no trabalho ao atendimento de
saúde, é estimado em mais de cem bilhões de dólares anualmente.
A maioria dos indivíduos que bebem o faz moderadamente, embora o estadunidense médio
acima de 14 anos consuma o equivalente a dois galões e meio de álcool puro por ano, o que corres-
ponde a quase 600 latinhas de cerveja (USDHHS, 1993). Foi estimado que 10% dos bebedores con-
somem mais de 50% da quantidade total de álcool consumido, e cerca de 15 milhões de estaduni-
denses satisfazem os critérios para o alcoolismo, definido como uma busca anormal de álcool, com
certa perda de controle sobre o beber, acompanhado por efeitos fisiológicos de tolerância e abstinên-
cia. Cerca de 90% dos alunos no final do ensino médio experimentaram álcool e, em um recente
levantamento, quase um terço deles relatou ter tido um episódio de beber pesado (cinco ou mais
doses) nas últimas duas semanas.
Uma das razões pelas quais as pessoas consomem álcool é pelos efeitos esperados ou antecipa-
dos que o álcool terá sobre suas emoções e seu comportamento. Tanto os bebedores pesados como os
alcoolismo Busca anormal de leves acreditam que o álcool pode reduzir a ansiedade, o que leva muitas pessoas a tomarem uma
álcool, caracterizada pela perda de dose ou duas depois de um dia difícil. Infelizmente, as evidências disponíveis não apóiam essa cren-
controle sobre o beber e ça: embora doses moderadas de álcool estejam associadas a um humor positivo aumentado, doses
acompanhada por efeitos
fisiológicos de tolerância e mais elevadas estão associadas à piora do humor. Igualmente, embora o álcool possa interferir no
abstinência . processamento cognitivo das deixas de ameaça, o que tornaria os eventos ansiogênicos menos per-
turbadores quando as pessoas estão embriagadas, isso só ocorre se as pessoas bebem antes do evento
:kool, tornam-se adietas. Na verdade, a vasta maioria dos Mais promissores são os tratamentos baseados na
=stadunidenses experimentou o álcool, e mais de 90 milhões deles farmacologia. Por exemplo, a terapia de reposição de nicotina (via
:xperimentaram drogas ilícitas. No entanto, a maioria usa o álcool chiclete ou adesivos) tem-se mostrado uma grande ajuda para os
JJ drogas com moderação (especialmente álcool) ou os que estão tentando deixar de fumar. A metadona já é conhecida
:xperimenta por um tempo e depois os abandona completamente. há tempo como um tratamento efetivo para os que estão
::rn um importante estudo a distância, Jonathan Shedler e Jack tentando deixar de usar heroína . Em ambos os casos, o tratamento
3 ock (1990) descobriram que as pessoas que haviam experimentado imita os efeitos das drogas aditivas, mas de uma maneira que não
:;rogas e álcool na adolescência eram mais bem ajustadas na idade é tão satisfatória para o usuário. Basicamente, esses métodos
:dulta do que as que nunca tinham experimentado. Tanto os proporcionam efeitos suficientes da droga para afastar os
:ostêmios completos como os usuários pesados de drogas tinham sintomas de abstinência, mas não fornecem o componente
:Yoblemas de ajustamento, se comparados aos experimentadores. positivamente reforçador do uso da droga, principalmente porque
-odavia, isso não significa que todo o mundo deve sair correndo seus efeitos são lentos e duradouros. Existem evidências recentes
::iara experimentar drogas e álcool, ou que os pais devem incentivar de que as drogas que aumentam a atividade de serotonina podem
=sse comportamento. Afinal de contas, não existe maneira de saber ser úteis no tratamento da adicção. Os pacientes relatam menor
:::uem se tornará adieto. fissura quando recebem essas drogas, o que também parece
Dada a seriedade dos problemas de álcool e drogas, um grande reduz ir as propriedades reforçadoras de algumas substâncias
:sforço científico tem visado ao tratamento da adicção. Alguns dos aditivas.
::>rimeiros tratamentos da adicção baseavam-se na teoria da Enquanto os neurocientistas comportamentais estão
:orendizagem. Por exemplo, a terapia de aversão emprega desenvolvendo tratamentos para adites, os psicólogos aplicados
:>rincípios do condicionamento clássico para diminuir o uso de estão tentando evitar a adicção, em primeiro lugar. Estão sendo
Jrogas. Os alcoolistas recebem drogas que fazem com que eles se testados alguns programas para ajudar os adolescentes a resistir à
- ritam doentes quando consomem álcool e, ao longo do tempo, pressão do grupo e a evitar comportamentos que os colocam em
=es passam a associar o álcool à sensação de náusea. Outras risco de se tornarem adietes. Muitos desses programas esclarecem
::iesquisas tentam formar vínculos associativos entre a parafernália os perigos do uso de drogas. Por enquanto, ainda não sabemos se
::as drogas e choques elétricos. Infelizmente, métodos baseados no algum desses programas será efetivo, especialmente porque a
:ondicionamento clássico têm tido apenas um sucesso mínimo. efetividade é medida no longo prazo (Lynam et ai., 1999; White e
~tilizando técnicas do condicionamento operante, alguns Pitts, 1998). No entanto, algumas equipes interdisciplinares estão
::>esquisadores comportamentais têm tentado empregar os trabalhando para identificar os fatores de risco que levam à
:>rincípios do reforço para ensinar os alcoolistas a moderar a bebida. adicção, assim como os fatores comportamentais e sociais que

I .~
:Ornbora esses programas tenham tido algum sucesso, seu uso é podem evitar comportamentos aditivos.
:xtremamente controverso, pois certas pessoas acreditam que, para .~

::> alcoolista, nenhuma quantidade de álcool é apropriada .

:nsiogênico. Segundo essa pesquisa, beber depois de um dia difícil pode, na verdade, fazer com que
as pessoas focalizem e remoam mais seus problemas (Sayette, 1993). Outras pesquisas que investi-
gam os efeitos reais e esperados do álcool sobre o comportamento são discutidas em "Utilizando a
ciência psicológica: Álcool e comportamento".
O álcool envolve diferentes sistemas neurotransmissores, incluindo a ativação de receptores de
GABA, opiáceos endógenos e dopamina (veja o Capítulo 3). Diversas evidências sugerem que os
aspectos reforçadores do álcool se devem à ativação da via mesolímbica de dopamina, como aconte-
i:e com outras drogas aditivas. O álcool também interfere nos processos neuroquímicos envolvidos
aa memória, o que explica por que a perda de memória pode-se seguir à ingestão excessiva de álcool.
_.\ ingestão de álcool prolongada pode causar uma lesão cerebral extensiva. Asíndrome de Korsakoff é
um transtorno relacionado ao álcool, caracterizado por grave perda de memória, deterioração inte-
'. ectual e perturbação nas sensações.

Opiáceos Uma das drogas mais usadas pelos soldados estadunidenses no Vietnã foi a heroína,
que faz parte da família das drogas conhecidas como opiáceos, juntamente com a morfina e a codeí-
na. Essas drogas têm um imenso valor de recompensa ao aumentar a ativação de dopamina no
núcleo accumbens e se ligar aos receptores de opiáceos, produzindo sentimentos de relaxamento,
analgesia e euforia. Antes da virada do século XX, a heroína era comprada facilmente sem prescrição
e comercializada pela Bayer Aspirin Company. A heroína provoca uma onda de intenso prazer que
muitos adictos descrevem como semelhante ao orgasmo, que depois evolui para um estupor agradá-
vel, relaxado. Aativação dual dos receptores de opiáceos e dos receptores de dopamina pode expli-
car por que a heroína e a morfina são tão aditivas.
ÁLCOOL E COMPORTAMENTO
Alan Marlatt, um dos mais importantes pesquisadores sobre abuso
de álcool e drogas, comenta que as pessoas vêem o álcool como o Fora m informados
"elixir mágico", capaz de aumentar as habi lidades sociais, o prazer Tônica Álcool
sexual, a confiança, o poder e a agressão. As expectativas em
relação aos efeitos do álcool são aprendidas muito cedo na vida: as
crianças vêem que as pessoas que bebem se divertem muito e que
Tônica Efeitos da
beber é um aspecto importante de muitas celebrações (Figura Controle
expectativa
6.21). Os adolescentes podem ver os bebedores como saciáveis e
adultos, duas coisas que eles desejam, desesperadamente, ser.
Assim, por meio da observação, as crianças aprendem que o
Rece beram - - - - - - - - + - - - - - - --
consumo do álcool tem efeitos positivos. Foi mostrado que as
crianças com expectativas muito positivas em relação ao álcool
tendem mais a começar a beber e ser bebedoras pesadas do que as Efeitos Expectativa
que não compartilham essas expectativas. Álcoo l f isiológicos mais o
Segundo os psicólogos sociais Jay Hull e Charles Bond, as verdadeiros fisiológico
expectativas têm um profundo efeito sobre o comportamento.
Para estudar os verdadeiros efeitos do álcool, os pesquisadores dão
aos sujeitos ou água tônica ou álcool e depois lhes dizem que
receberam água tônica ou álcool, embora não necessariamente em
correlação com os conteúdos da bebida verdadeira (Figura 6.22). FIGURA 6.22 O consumo de álcool inclui, tipica mente, efeitos
fisiológicos e de expectativa. O planejamento de placebo balanceado
permite que os pesquisadores examinem separadamente essas influências
sobre o comportamento.

Esse p/anejamento de p/acebo balanceado permite uma


comparação dos que pensam que estão bebendo água tônica, mas
na verdade estão bebendo álcool, com aqueles que pensam que
estão bebendo álcool, mas na verdade estão bebendo água tônica .
Os pesquisadores podem, então, separar os efeitos das drogas dos
efeitos das crenças pessoais. Essa pesquisa demonstrou que o
álcool realmente prejudica os processos motores, o processamento
da informação e o humor, independentemente de as pessoas
acharem que consumiram álcool. Em contraste, a crença de ter
consumido álcool levou à desinibição de vários comportamentos
sociais, como excitação sexual e agressão, independentemente de
a pessoa ter, de fato, consumido álcool (Hull e Bond, 1986). Assim,
alguns dos comportamentos das pessoas, quando intoxicadas, são
explicados por crenças aprendidas sobre a intoxicação, e não pelas
propriedades farmacológicas do álcool. Às vezes, a farmacologia e
as expectativas aprendidas funcionam de maneiras opostas. Por
FIGURA 6.21 Muitos fabricatnes de bebidas alcoólicas difundem a exemplo, o álcool tende a aumentar a excitação sexual, mas
idéia de que beber se associa a bons momentos. interfere no desempenho sexual.

o
Qual é a base biológica da recompensa?
Embora os behavioristas evitassem qualquer referência aos estados mentais internos, está claro que o reforço
positivo geralmente funciona porque proporciona a experiência subjetiva de prazer. A base neural desse refo rço é a
liberação de dopamina na via mesolímbica de dopamina. Empenhar-se em comportamentos naturalmente
motivados, auto-administrar-se eletricidade no cérebro e ingerir drogas ou álcool, tudo isso leva à ma ior ativação
dos neurônios de dopamina no núcleo accumbens, o que está associado à experiência subjetiva de prazer.
Compreender as bases neurais do reforço ajuda a explicar o condicionamento complexo, tal como o
desenvolvimento da adição, que envolve tanto reforço positivo como negativo.
CIÊNCIA PSICOLÓGICA 209

COMO A APRENDIZAGEM OCORRE NO NÍVEL habituação Um decréscimo na


NEURONAL'? resposta comportamental após
repetida exposição a estímulos não-
De uma perspectiva biológica, os cientistas acreditam há muito tempo que a aprendizagem ameaçadores.
envolve mudanças relativamente permanentes no cérebro, que resultam da exposição a eventos sensibilização Um aumento na
ambientais. As raízes dessa idéia podem ser traçadas a alguns cientistas, incluindo o pesquisador resposta comportamental após
alemão Richard Semon que, em 1904, propôs que as memórias são armazenadas por meio de mu- exposição a um estímulo
ameaçador.
danças no sistema nervoso. Semon chamou a armazenagem de material aprendido de engrama, um
termo posteriormente popularizado pelo eminente psicólogo Karl Lashley. Em 1948, o psicólogo
canadense Donald Hebb (Figura 6.23) propôs que a aprendizagem resulta de alterações em cone-
xões sinápticas. Segundo Hebb, quando um neurônio excita outro, acontece um processo de cresci-
J1ento ou mudança metabólica que fortalece a sinapse entre os dois. Subseqüentemente, a descarga
de um dos neurônios torna muito mais provável a descarga do outro. Embora tenha havido algumas
:.nterpretações diferentes do postulado de Hebb, a maioria delas pode ser resumida como "células
que descarregam juntas formam rede neural juntas". Hebb não tinha a tecnologia para examinar se
sua hipótese era verdadeira ou não, mas nós sabemos que a sua teoria básica estava certa.
Segundo a regra de Hebb, o cérebro é bastante plástico, e novas conexões neuronais se desen-
·:olvem em função da aprendizagem. Portanto, a aprendizagem deve estar associada a um número
aumentado de conexões sinápticas no cérebro. Um experimento sustentando essa idéia foi realizado
µelos psicólogos Mark Rosenzweig e Edward Bennett. Eles dividiram ninhadas de ratos em dois
grupos e criaram um deles em um ambiente enriquecido, contendo uma variedade de brinquedos
?ªra os animais explorarem e brincarem à vontade. O segundo grupo foi criado em um ambiente
empobrecido, uma gaiola simples em uma sala pouco iluminada.Os cérebros dos dois grupos de
ratos se desenvolveram de maneira bem diferente. Os que foram criados no ambiente enriquecido
dnham maior quantidade de córtex e evidências de um maior número de sinapses em todo o cérebro
'Rosenzweig et ai., 1972). Além disso, a neuroquímica desses ratos sugeria um funcionamento mai-
or de acetilcolina, um neurotransmissor que reconhecidamente melhora a memória. Esse e outros
estudos subseqüentes mostraram que as condições ambientais durante os anos formativos têm uma Qual é a base neural da
profunda influência sobre a capacidade posterior de aprendizagem. aprendizagem?

Habituação e sensibilização são modelos simples


de aprendizagem
O que acontece nas sinapses que leva à aprendizagem? Uma resposta é encontrada
em pesquisas com invertebrados simples como a aplysia, um pequeno caracol marinho
que come algas (Figura 6.24). Aaplysia é uma espécie excelente para estudarmos a apren-
dizagem, pois tem um número relativamente pequeno de neurônios, alguns dos quais são
suficientemente grandes para serem vistos sem microscópio (Kandel et al., 1995). O psi-
cólogo fisiológico Eric Kandel e colaboradores utilizaram a aplysia para estudar a base
neural de dois tipos de aprendizagem simples: habituação e sensibilização. Em resultado
de sua pesquisa, Kandel recebeu o prêmio Nobel de medicina em 2000.
A habituação é um decréscimo na resposta comportamental após uma exposi-
ção repetida a estímulos não-ameaçadores. Quando um animal encontra um estímulo
novo, ele presta atenção ao estímulo, o que é conhecido como resposta de orientação. Se
o estímulo não é prejudicial nem recompensador, o animal aprende a ignorá-lo. Nós nos
habituamos constantemente a eventos sem significado ao nosso redor. Por exemplo,
recoste-se na cadeira e escute. Talvez você consiga ouvir o barulho de um relógio, do
ventilador do computador ou de seus colegas tocando música no quarto ao lado. Você,
na verdade, nem estava percebendo esses ruídos de fundo por estar habituado a eles. A
habituação na aplysia pode ser facilmente demonstrada tocando-se nela. Os primeiros
toques fazem com que ela retraia suas guelras, mas depois de aproximadamente 10
toques ela deixa de responder, e isso dura cerca de duas ou três horas. Repetidos experi-
mentos de habituação podem levar a um estado de habituação que dura várias semanas. FIGURA 6.23 Donald Hebb propôs que a
A sensibilização é um aumento na resposta comportamental após uma exposi- aprendizagem resulta de mudanças em conexões
ção a estímulos ameaçadores. Por exemplo, imagine que você sente um cheiro de quei- sinápticas: Células que descarregam juntas formam rede
mado enquanto está estudando. Não é provável que você se habitue a esse cheiro. Aliás, neural juntas.
210 GAZZANIGA e HEATHERTON

você provavelmente vai prestar maior atenção ao sen-


tido do olfato, para avaliar a possível ameaça de fogo,
e ficará extremamente vigilante para qualquer indica·
ção de fumaça ou chamas. Em geral, a sensibilização
leva a uma responsividade aumentada a outros estí-
mulos. Dar um choque elétrico na cauda na aplysia
leva à sensibilização. Após o choque, um leve toque
em qualquer lugar do corpo fará com que a aplysia
retraia as guelras.
A pesquisa de Kandel com a aplysia mostra que
alterações no funcionamento da sinapse levam tanto à
habituação como à sensibilização. Em ambos os tipos
de aprendizagem simples, a liberação de neurotrans-
missores dos neurônios pré-sinápticos é alterada, com
uma redução na liberação de neurotransmissores le-
vando à habituação, e um aumento na liberação de
neurotransmissores levando à sensibilização. Conhe-
cer as bases neurais da aprendizagem simples nos dá
FIGURA 6.24 A aplysia é um animal marinho invertebrado utilizado para o estudo das os fundamentos para compreender processos de apren-
bases neuroquímicas da aprendizagem.
dizagem mais complexos.

A potenciação a longo prazo é uma candidata à base


celular da aprendizagem
Para compreender a aprendizagem no cérebro complexo dos mamíferos, os pesquisadores in-
vestigaram um fenômeno conhecido como potenciação a longo prazo. A palavra potenciar significa
fortalecer, tornar alguma coisa mais potente. Apotenciação a longo prazo (PLP) é o fortaleci-
mento da conexão sináptica para que os neurônios pós-sinápticos sejam ativados mais facilmente.
Para demonstrar a PLP, os pesquisadores primeiro estabelecem a extensão em que estimular um
neurônio eletricamente leva a um potencial de ação num segundo neurônio. Eles, então, estimulam
intensamente o primeiro neurônio, eletricamente, talvez com cem pulsos de eletricidade em cinco
segundos. Finalmente, um pulso elétrico simples é readministrado para medir a extensão da ativa-
ção do segundo neurônio. Como vocês podem ver na Figura 6.25, a PLP ocorre quando a estimulação
elétrica intensa aumenta a probabilidade de que estimular um neurônio leve a um potencial de ação
no segundo neurônio. Enquanto a habituação e a sensibilização na aplysia são devidas a mudanças
na liberação de neurotransmissores do neurônio pré-sináptico, a PLP resulta de mudanças no neurô-
nio pós-sináptico que fazem com que ele seja ativado mais facilmente.
Algumas linhas de evidência apóiam a idéia de que a potenciação a longo prazo pode ser a base
celular da aprendizagem e da memória (Beggs et ai., 1999). Por exemplo, os efeitos da PLP são mais
facilmente observados nos locais do cérebro que sabemos estarem envolvidos na aprendizagem e na
memória, como o hipocampo. Além disso, as mesmas drogas que melhoram a memória também
levam à maior PLP, e as que bloqueiam a memória também bloqueiam a PLP. Finalmente, o condicio-
namento comportamental produz efeitos neuroquímicos quase idênticos à PLP.
O processo de potenciação a longo prazo também apóia a afirmação de Hebb de que a aprendi-
zagem resulta do fortalecimento de conexões sinápticas que descarregam juntas. A regra de Hebb
pode ser usada para explicar uma variedade de fenômenos de aprendizagem, incluindo o condicio-
namento clássico. Os neurônios que sinalizam o estímulo incondicionado estão ativos no mesmo
momento em que estão ativos os que sinalizam o estímulo condicionado. Após diversas repetições,
as sinapses que conectam esses dois eventos ficam fortalecidas, de modo que quando uma descarre-
potenciação a longo prazo ga a outra descarrega automaticamente, produzindo a resposta condicionada.
{PLP) O fortalec iment o de uma
Tomadas juntas, as evidências sugerem que a potenciação a longo prazo pode ser o processo
conexão sináptica de modo que os
neurônios pós-si ná pticos são básico responsável pela aprendizagem complexa no cérebro. Entretanto, o nosso conhecimento de
ativados ma is facil mente. como a PLP funciona ainda é muito pequeno, e os achados são contraditórios. A essa altura, é mais
seguro concluir que a PLP é uma razoável candidata à base celular da aprendizagem.
CIÊNCIA PSICOLÓGICA 211

A aprendizagem pode ser simulada por redes neurais


computadorizadas
Trabalhando em vários níveis de análise, os cientistas psicológicos desenvolveram modelos
computadorizados de redes neurais para compreender como o cérebro aprende. O computador é
:.lllla metáfora amplamente utilizada para a mente em funcionamento. Tanto o cérebro quanto o
::omputador recebem informações como input, processam essa informação e criam output na forma
:le ações ou comportamentos. Os modelos computadorizados de aprendizagem são geralmente refe-
:idos como modelos conexionistas por serem, grosso modo, baseados na idéia de que os neurônios
estão conectados ou associados entre si. Em vez de neurônios, os modelos computadorizados têm
:midades, que são conectadas umas às outras na rede neural computadorizada.
Um modelo conexionista simples é mostrado na Figura 6.26. Observe que esse modelo tem três
::amadas de unidades: ele absorve informações através das unidades de input, processa essas infor-
;nações nas unidades ocultas e gera uma ação através das unidades de output. Exatamente como um
Jeurônio pode descarregar ou não, as unidades do computador também podem ser excitatórias ou
;nibitórias, e a força de suas conexões é modificada pela aprendizagem.

Regras de aprendizagem A regra pela qual os modelos conexionistas operam baseia-se no


p-au em que o output do modelo está de acordo com o input. Por exemplo, suponha que você está
:entando aprender o nome de alguém. Quando vê o rosto dessa pessoa, tenta lembrar-se do nome dela.
Quando o output (i. é, o nome lembrado) não está de acordo com o input (i. é, o rosto relevante), você
ajusta a força da associação entre as unidades, para que o output se tome mais semelhante ao que deve
ser. Por exemplo, talvez você lembre o nome Karen, quando ele na verdade é Kathy. Para corrigir o erro,
sua rede neural fortalece a associação entre o rosto da pessoa e "Kathy" e enfraquece a associação entre
o rosto e "Karen". Após muitas tentativas, você chama a Kathy pelo nome certo. Subseqüentemente, a
conexão entre o rosto da pessoa e o nome Kathy é fortalecida sempre que você os associa.

Cada ponto representa a amplitude da


resposta a uma estimulação fraca de
0,4
teste.

Eletrodo aplica !'l


... .. . .. . .. :
. ·····•·· ............. ·····
Vl
o
pulsos elétricos ~ 0,2 •• 1""••• 1••.,t• •' S• I• •.
<lJ
• • eL•• • e•• • ••
cr:

o.o
........
•• l:'à···
• •••

o 30 60 90 120

i
Salva de
Tempo (minutos)

estimulação
forte

FIGURA 6.25 Um neurônio pré-


sináptico recebe um breve pulso elétrico,
que provoca uma leve resposta no
neurônio pós-sináptico. Aplicar choques
elétricos intensos e freqüentes faz com que
o neurônio pós-sináptico responda mais.
Quando um pulso elétrico simples é
Axônio aplicado subseqüentemente, ele provoca
um efeito maior no neurônio pós-sináptico
do que originalmente.
212 GAZZANIGA e HEATHERTON

Os modelos conexionistas "aprendem" mais ou menos como o


Output modelo Rescorla-Wagner de condicionamento clássico discutido anterior-
mente neste capítulo. Em ambos os modelos, quanto maior o desvio em
relação à expectativa, mais ocorre aprendizagem. Se o rosto de Kathy
desencadeou um output do nome ·~ake", você vai precisar aprender
muito! Entretanto, depois que o input estiver de acordo com o output
Processamento apropriado, vai ocorrer relativamente pouca aprendizagem.

O modelo de processamento distribuído paralelo Um


dos modelos conexionistas mais conhecidos de aprendizagem é o mo-
Input
delo de processamento distribuído paralelo (PDP) desenvolvido por Da-
vid Rumelhart e James McClelland. Um aspecto importante do modelo
" "Camm
' ' h o ativa' do de PDP é que ele se baseia em como as redes neurais realmente operam.
Por exemplo, ele vê as conexões neuronais como ricamente distribuídas
FIGURA 6.26 Uma rede simples com três camadas de unidades.
por todo o cérebro e envolve um processamento paralelo, em que tudo
acontece ao mesmo tempo. Isso é um avanço em relação aos modelos
seriais, em que se pensava que a aprendizagem ocorria em uma ordem
fixa, como a seqüência de operações em um programa de computador.
O cérebro humano é maciçamente paralelo, com milhões de sinapses dentro das redes neurais
descarregando ao mesmo tempo. No modelo de PDP, cada unidade da rede pode conectar-se com
todas as outras unidades e ser ativada ou inibida por outras unidades da rede. Essencialmente, cada
unidade se soma às várias mensagens inibitórias e excitatórias das outras unidades e é ativada quan-
do essa soma ultrapassa um limiar crítico. Dessa maneira, as unidades no modelo de PDP operam
como os neurônios quando estes integram informações de outros neurônios para determinar se irão
descarregar.

Redes neura is complexas Modelos conexionistas como o de PDP são valiosos para concei-
tualizar situações de aprendizagem complexa, como a aquisição de conceitos abstratos e linguagem.
Considere, por exemplo, um veterano da Guerra do Vietnã que experiencia um ataque de pânico
durante uma discussão sobre um possível recrutamento militar. A teoria tradicional da aprendiza-
gem tem dificuldade para explicar a associação entre a discussão de uma questão de política e a
experiência da Guerra do Vietnã. Mas do ponto de vista do PDP essa conexão faz perfeito sentido. A
informação sobre recrutamento e guerras está armazenada em uma rede neural em que a ativação
de uma parte da rede leva à ativação do restante.

o
Como a aprendizagem ocorre no nível neuronal?
Os pesquisadores estão identificando rapidamente as bases neurofisiológicas da aprendizagem. Muit o do que se
aprendeu confirma as teorias de Hebb de que os neurônios que descarregam juntos formam rede neural juntos. O
trabalho de Kandel com a aplysia mostrou que a habituação e a sensibil ização, duas formas simples de
aprendizagem, ocorrem pela alteração na liberação de neurotransmissores. A descoberta da potenciação a longo
prazo mostra que uma intensa estimulação de neurônios pode fortalecer sinapses, aumentando a probabilidade de
que a ativação de um neurônio aumente a descarga de outros neurônios na rede. Modelos computadorizados de
redes neurais têm ajudado a predizer como se dá a aprendizagem complexa.

CONCLUSÃO
O behaviorismo tem sido uma força poderosa na ciência psicológica desde o início do século
XX. Amudança de métodos subjetivos para métodos objetivos estabeleceu a psicologia como ciência.
Um interesse renovado pelos processos mentais acabou levando muitos a abandonarem os princípios
estritos do behaviorismo, mas o condicionamento básico e os processos de aprendizagem ainda
servem como princípios fundamentais no entendimento da mente e do comportamento. Os cientis-
tas psicológicos empregam os princípios de aprendizagem em investigações em todos os níveis de
análise, das conexões sinápticas da aplysia à transmissão cultural de princípios e valores morais. De
CIÊNCIA PSICOLÓGICA 213

fato, o estudo da aprendizagem, em si, diminuiu nas últimas décadas porque os psicólogos abraça-
ram muitos princípios de aprendizagem como um fato básico e passaram adiante para outros proble-
mas. Por essas razões, o campo da aprendizagem serve como um exemplo excelente de como a
pesquisa psicológica se baseia em princípios cumulativos. Os princípios dos condicionamentos clás-
sico e operante são metodologias básicas utilizadas por todos os neurocientistas para estudar os
mecanismos cerebrais. Por sua vez, os recentes avanços nas técnicas da neurociência, resultantes da
revolução biológica permitiram um entendimento mais complexo dos processos de aprendizagem. A
aprendizagem ocorre no cérebro, e o nosso acesso relativamente novo às técnicas de imagem cere-
bral está reacendendo o interesse pelos processos básicos de condicionamento. Compreender as
bases neuroquímicas da aprendizagem pode nos ajudar a desenvolver tratamentos mais efetivos
para uma variedade de problemas psicológicos, incluindo fobias e drogadição.

LEITURAS ADICIONAIS
Carlson, N. R. (2001). Physiology of behavior (7th ed.). Needharn Heights, MA: Allyn & Bacon.
Kandel, E. R.; Schwartz, J. H.; Jessell, T. M. (2000). Principies of neural science (4th ed.). NewYork: McGraw-Hill.
Lieberrnan, D. A. (1993). Leaming: Behavior and cognition. Pacific Grove, CA: BrooksCole.
Rescorla, R. A. (1988). Behavioral studies of Pavlovian conditioning. Annual Reviews of Neuroscience, 329-352.
Schwartz, B.; Bobbin, S. J. (1995). Psychology of leaming and behavior (4th ed.). New York: W W Nonon.
Zigrnond, M. J.; Bloorn, F. E.; Landis, S. C.; Roberts, J. L.; Squire, L. R. (1999). Fundamental neuroscience.
San Diego, CA: Academic Press.
G291c Gazzaniga, Michael S.
Ciência psicológica: mente, cérebro e comportamento I
Michael S. Gazzaniga e Todd F. Heatherton; trad . Maria
Adriana Veríssimo Veronese . - 2. imp. rev. - Porto Alegre:
Artmed, 2005.

ISBN 978-85-363-0432-8

1. Psicologia - Ciência. 1. Heatherton, Todd F. li. Título

CDU 159.9.01/.98

catalogação na publicação: Mônica Ballejo Canto - CRB 10/1023