Anda di halaman 1dari 13

Aulas Terico-prticas. Psicologia da Aprendizagem.

Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

2 PARADIGMA.
CONDICIONAMENTO OPERANTE

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

INTRODUCO.
Os principios do Condicionamento Operante (CO) encontram-se numa srie de
observaes semicausais realizadas pelo Loyd Morgan (1904) sobre ces e
tambm numa srie de experimentos com gatos realizados pelo Thorndike (1911).
Morgan:
um dos primeiros psiclogos britnicos que hipotetizou que..... toda conducta
pensante dos animais, poderia ser explicada por uma aprendizagem simples que
l denominou ensaio-erro. A esta concluso chega aps ter observado como um
co aprendeu a abrir a porta do jardm.
Thorndike, Edward Lee:
um dos primeiros psiclogos americanos e um dos primeiros psicopedagogos.
Ele fez experimentos controlados com gatos. Para iso, contruiu uma espcie de
jaula com paus de madeira. Em cada experimento deixava um gato com muita
fome dentro y colocava comida fra e visible. O gato queria sir e comer. Na
maiora dos casos, o gato podia escapar e comer, quer executando bem uma
conduta mecnicamente orientada (atirar de ums corda e presionar um resorte)
quer executando

uma conducta orientada por s prprio (lamberse, rascar..)

sendo o experiemntador quem abria a porta. O gato encerrado, comezava a


moder e a araar os barrotes para colocarse entre os paus: metia as patas
atirando tudo o que encontrava (dentro e fra da jaula). Assm, at que chagava
um momento no que de forma acidental ia a presionar o resorte e a atirar da
corda, com que abria a porta e j podia comer. Gradualmente, nos ensaios
sucessivos,

aquelas

conductas

que

no

conduziam

ao

sucesso

iam

progressivamente desaparecendo; embora as conductas que conduciam ao

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

sucesso iam aumentando. Finalmente, aps muitos ensaios, o gato aprendia a


abrir a porta. A partires dos seus experimentos, Thorndike formula a sua
conhecida Lei do efeito (a peza angular da moderna psicologia da
aprendizagem).
Segundo esta lei quando uma conducta est seguida de uma recompensa,
aumenta a probabilidade de se repetir; e quando est seguida de uma punio ou
castigo, disminue a probabilidade de se repetir
Detrs desta lei, encontramos a ideia escondida de que todo comportamento
funcional: tudo o que fazemos feito para algo. Esta lei explica grande parte do
nosso comportamento... Com todos estes antecedentes aparece uma nova figura.

SKINNER.
Segundo as suas observaes e reflexes, o co de Morgan e os gatos de
Thorndike, no aprenderam por Condicionamento Clssico, mas sm por um novo
e diferente processo de aprendizagem: o condicionamento operante.
Este atrevido terico, opnha-se assm as influentes teorias do seu tempo, onde
se entendeia que toda a aprendizagem estava constituida por reflxos
condicionados.
As suas opinies comem a publicarse numa srie de artigos no ano 1930 que
vo ser resumidas depois num livro A conducta dos organismos, no 1.938. Aqu
estabelece a diferena entre ambos condicionamentos, tratando de explicar que,
no caso do CC, a resposta uma resposta respondente, inevitvel... uma vez
associado o EC e o EI, a resposta do sujeito inevitvel), e no caso do CO, a
resposta uma resposta operante.

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

Os dois condicionamentos so muito importantes para o ajuste do sujeito ao meio.


O elemento chave do CC seria a substituio de estmulos (EI por EC). No CO
no h sunstituio. O organismo seleciona entre um conjunto de respostas,
aquelas que o reforzam e que o levam ao sucesso.

Experimento de Skinner.
Consistia em introduzir um rato com muita fome numa cmara. Os elementos
fundamentais so uma pequena palanca ou resorte que est conectada a um
dispensador de alimento, que quando presionado, provoca que o dispensador de
alimentos, proporcione um pedao de comida, que vai cair ao comedero da
cmara onde est o rato. O rato no sabe que tem de presionar a palanca para
conseguir a comida. Mas a sua conduta exploratria fiz com que chegara o
momento em que por acaso presionara a palanca e consegue uma bola de
comida que rapidamente consome. Este comportamente pouco a pouco vai-se
fazendo mais frequente ata que ao fim, o rato aprende a presionar a palanca co
fim de conseguir aquele pedao de comida. Segundo passa o tempo, vai-se
incrementando a frequncia da conducta de presionar a palanca, devido s
consequncias que se seguem. Podemos reconhecer claramente dois elementos:
1. a resposta central ou operante (neste caso, pulsar a palanca)
2. a consequncia (neste ejemplo, a comida)
E conclue-se que existe uma relao entre os dois elementos de forma que,
quando a resposta vai seguida dum reforo (neste caso), a probabilidade de
apario futura desa resposta, aumenta.

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

Se a resposta for seguida de consequncias aversivas (do tipo... uma descarga


elctrica) punitivas, a probabilidade da apario futura desa resposta dimine.
Pelo que, segundo o Skinner, o Condicionamento Operante consiste na mudana
ou probabilidade de apario de uma conducta, em funo das consequncias
que se seguem a estas conductas

Elementos do Condicionamento Operante


Estmulos elicitantes: so os que precedem regularmente a resposta e a suscitam
ou provocam de forma obrigatria e necessria; so os EI e os EC (por ejemplo,
um pedao de carne vai provocar a salivao queira ou no o co)
Estmulos operacionais: so os que convidam execuo, mas no a provocam
de uma forma obrigatria (por ejemplo, a presena de um professoer na sala de
aula pode informar a os alunos de que se espera deles sileno, mas os alunos
so livres para fazer bem ou mal)
Desta forma, podemos concluir que qualquer conducta no elicitada ( dizer, no
produzida de forma necessria) por um estmulo uma resposta operante. Uma
resposta operante tem sempre carcter instrumental e manipulativo e mediante a
qual o sujeito manipula o ambiente para CONSEGUIR algm reforo ou fugir
dalguma situao aversiva.
Geralmente, os estmulos operacionais so os que provocam as respostas
operantes.
O grau de controlo sob as conductas das pessoas, que podemos conseguir por
mdio do Condicionamento Operante, extraordinrio!!

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

O reforo qualquer consequncia que segue a uma conducta e que aumenta a


probabilidade (intensidade e frequncia) de que esa conducta aparea
novamente. Quando as consequncias tm um valor reforzante natural,
espontneo para a pessoa, sem precissar o sujeito de adiestramentos ou
aprendizagems prvias, defne-se como Reforzos Primrios. Quando as
consequncias que seguem a uma resposta operante, tm um valor reforzante
aprendido prviamente por associao com reforzos primrios, ento falamos de
Reforos Secundrios (por ejemplo, o dinheiro vainos permitir conseguir comida,
roupa, casa.... consequncias que em princpio, funcionam como reforos
primrios). Os reforos secundrios so muito fciles de criar, so muito
generalizveis e tm uma grande eficcia. Estas tres caractersticas, amplam o
mbito de aplicao do Condicionamento Operante. Entre os reforos
secundrios, os que mais destacam pela sua potncia so o facto de prestar
ateno e a aprobao social. Os reforos secundrios so fundamentais para
modificar o comportamento das pessoas!! Mas... ento, se no forem aplicados
correctamente, podem produzir conductas desadaptadas.
O castigo ou punio qualquer consequncia que se segue a uma conducta e
que dimine a probabilidade (intensidade e frequncia) de que esa conducta
aparece novamente Aqueles castigos que tm um valor punitivo natural, sem
necessidade de que ste valor for prviamente aprendido pelo individuo, defnese como um Castigo Primrio (tal o caso dos castigos fsicos..). Os Castigos
Secundrios so auqelas consequncias inicialmente neutra, mas que pos
asociao con castigos primrios, acabam por adquirir um valor puntivo ou
aversivo (por ejemplo, o tom de voz mais elevado....)

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

A clasificao anterior responde ao critrio do valor natural e/ou aprendido


que as consequncias quer reforzantes quer punitivas tm nas pessoas.
Mas existem outras clasificaes, por ejemplo sta que atende como critrio ao
ponto de vista conductual. Segundo esta clasificao podemos falar de reforzos
e punies positivos y negativos, sendo que positivo refere-se administrao e
negativo retirada.

Reforo positivo: uma consequncia (geralmente agradvel) que depois de ser

administrada contingentemente (seguida) a uma conducta, aumenta a


probabilidade (intensidade e frequncia) de apario de dita conducta. (Ej: a
comida, o abrigo...)

Reforo negativo: uma consequncia (geralmente desagradvel) que sendo

retirada contingentemente a uma conducta, aumenta a probabilidade


(intensidade e frequncia) de apario de dita conducta.

Punio positiva: uma consequncia (geralmente desagradvel) que sendo

administrada contingentemente a uma conducta, dimine a probabilidade


(intensidade e frequncia) de apario de dita conducta.

Punio negativa: uma consequncia (geralmente agradvel e geralmente um


reforo positivo) que sendo retirada contingentemente a uma conducta, dimine
a probabilidade (intensidade e frequncia) de apario de dita conducta.

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

Procedimentos que se derivam desta clasificao:


A. Recompensa: basada na utilizao de um reforo positivo. Se uma
resposta vai seguida de um reforo positivo, a probabilidade de apario de
esa resposta aumenta
B. Escape e evitao: basada na utilizao de reforos negativos. Quando
uma resposta est seguida de um reforo negativo, a probabilidade de
apario de esa resposta aumenta
C. Castigos: basados na utilizao contingente conducta de castigos
positivos e negativos. Se uma resposta va seguida de castigos, for do tipo
que for, a probabilidade de que esta resposta aparaa novamente dimine.
Concluses:
- o castigo SEMPRE dimine a conducta
- o reforzo SEMPRE aumenta a conducta
- o reforzo negativo e os castigos (positivo e/ou negativo) se basam em
estmulos aversivos. Denomnam-se procedimentos de controlo aversivo.

Medidas das Consequncias (reforos e/ou punies) aplicadas a uma


conducta.
1. Tempo de latncia. Refre-se ao tempo que se passa desde que o sujeito
d uma resposta ata que aparece a consequncia. Quanto maior for o
tempo de latncia, minor a fora do condicionamento. Quanto maior a
inmediatez com que a consequncia aparece ( dizer, quanto menor tempo
de latncia), maior a fora do condicionamento.

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

2. Variabilidade. Refre-se s diferentes modalidades em que podem


apresentar-se as consequncias a uma mesma conducta. Quanto maior for
a variabilidade que as consequncias a uma conducta tem, menor a fora
do

condicionamento.

Quanta

maior

estabilidade

no

tipo

de

consequncias que uma conducta tem, maior a fora do condicionamento.


3. Magnitude. Refre-se ao nvel que a consequncia pode chegar, sendo
que quanto maior for a sua magnitude, mais rpido ser a aprendizagem.

Fenmenos bsicos do Condicionamento Operante.


A. Aquisio (administrao dum reforo/punio contingente a uma
conduta)
B. Extino (consiste en fazer que uma determinada resposta deixe de ser
seguida do respectivo reforo/punio; quer dizer, retirar as consequncias
que acostumavam a seguir a uma resposta operante, o que vai conducir ao
desaparecimento da resposta instrumental previamente adquirida). mais
lenta que a aquisio. As variveis das que depende a extino so:
i. O tipo de programa de reforzamento aplicado durante a
aquisio. Se o programa foi intermitente, a resistncia
extino sempre maior
ii. O n de vezes que foi reforzada a resposta
iii. A motivao do sujeito durante o processo do reforzamento
C. Recondicionamento

(consiste

em

que

quando

foi

extinta

uma

consequncia, se de novo voltar-mos a aplicar esa consequncia

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

contingente conducta dum individuo, ste aprender de uma forma mis


rpida a repetir a conducta que desencadeava esa consequncia)
D. Discriminao (o individuo capaz de distinguir as consequncias
similares aquela que causou a repetio de uma conducta dada, e s
responde perante punio/reforo inicial). A conduta do sujeito no se
produz de forma aleatria.
E. Generalizao da resposta (estmulo, no Cond. Clssico).(O sujeito
reproduz conductas similares a que foi reforada/punida; sabe que perante
um leque de conductas semelhantes, as conseqencias vo ser sempre as
mesmas)
F. Generalizao da consequncia (respostas no Cond. Clssico) (O sujeito
obtem como resultado a uma conducta, um leque de consequncias
semelhantes entre s).

Escalas ou programas de reforo.


As escalas de reforo referem-se aos programas atravs dos quais o reforo
administrado. No geral, supom-se que quanto mais rpido se apresentar a
consequncia contingente/consecutiva resposta, maior ser a sua eficcia. No
caso dos reforos, por ejemplo, muito importante que se administrem de uma
forma IMEDIATA resposta que queremos reforar. De facto, quando o tempo de
latncia grande, pode que durante ese tempo aparezam resposras intermdias
e serem esas s que estamos reforzando e no a primeira. Um reforo demorado
no tempo, mesmo que for de grande magnitude, tem muito pouco efeito.

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

Existem fundamentalmente dois grandes grupos de escalas ou programas de


reforo:

1. Escalas de reforo CONTNUO (nestas escalas todas as respostas


operantes so seguidas do reforo). Consiste em que o sijeito vai ser
reforzado SEMPRE que execute correctamente a resposta esperada.
Normalmente, neste caso, a aquisio muito rpida, mas, estas
aprendizagens tm pouca resistncia extino.

2. Escalas de reforo INTERMITENTE (nestas escalas, somente algumas


respostas e em algumas ocasies, so seguidas de reforo). Tm muita
resistncia extino.
2.a. Escala de reforo intermitente por proporo de resposta
- FIXA: O reforo aparece aps un nmero fixo e determinado de
respostas, Neste programa, o sujeito deve responder durante un n
determinado de vezes de forma correcta, para poder conseguir o
reforzo. Ese n fixo, por exemplo: FR=10, siginifica que cada 10
respostas certas aparece um reforo; FR=900, significa que cada
900 respostas certas, administra-se um reforo. Este tipo de
programa o que consegue que o individue execute a resposta
desejada com maior rapidez!.
- VARIVEL: O reforo administrado aleatoriamente volta de uma
mdia de respostas, de modo que o sujeito nunca saiba quando vai
ser reforado. O n de vezes que o sujeito deve repetir a resposta

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

certa, antes de ser aplicado o reforo, vara em funo do valor


mdio especificado pelo programa. O critrio que se utiliza para
decidir qual ser este valor mdio , que no deve existir um n de
respostas sem reforzar, igual ou maior ao dobre do tamanho da
proporo. Por exemplo, VR=10 significa que vamos dar o reforo
num promdio de 10 respostas, mas nunca deixaremos 20 respostas
(o dobre da mdia) sem reforar. (Por exemplo, podemos reforzar ao
individuo nas respostas 1, 12, 23, 31, 49, etc... Neste caso, os
comportamentos so muito difceis de extinguir. A resistncia
extino muito muito forte.

2.b. Escala de reforo intermitente por intervalo de tempo


- FIXO: O reforo consequente resposta emitida, aps un
intervalo de tempo. O reforo entregue primeira resposta certa
que ocorra, depois de que um determinado perodo de tempo tenha
passado, contabilizando sempre a partir da ltima resposta
reforada. (Por exemplo, FI=1 minuto, indica que no minuto x se d
um reforo. A partir deste momento contabilza-se 1 minuto e depois
de transcurrir este minuto reforza-se a primeira resposta certa que
d o sujeito).
- VARIVEL: A durao do intervalo varia tambm aleatoriamente,
volta de uma mdia temporal determinada. Se asume como critrio
implcito, para definir a durao do intervalo, que nunca devemos
deixar um intervalo de tempo sim reforo que for igual ou maior ao

Aulas Terico-prticas. Psicologia da Aprendizagem.


Pfra. Doutora Lydia Platas. Universidade Lusiada de Porto.

dobre do tamanho do intervalo. (Por exemplo, VI=20 seg.. Tempo de


treino = 180 seg. Pelo tanto, 180/20=9 reforos que sero aplicados.
Estes 9 reforos poderam ser aplicados nos segundos 3 33 42
75 100... , mas nunca o intervalo sem reforo deve superar os 40
segundos.

Anda mungkin juga menyukai