€DfTOlRfl PCDflGÕGICR
€ UnreRSITflftM ITDflL
ISBN 978-85-12-60340-7
Metodologia da
Pesquisa em
Ciências Sociais
Um tratamento conceituai
Tradução do original em inglês:
Behavioral Research — a conceptual approach
Copyright © 1979 by Holt, Rinehart and Winston
Tradução:
Helena Mendes Rotundo
Revisão técnica:
José Roberto Malufe
Professor-Assistente de Metodologia da Pesquisa em Educação, na PUC/SP
ISBN 978-85-12-60340-7
© E.P.U. - Editora Pedagógica e Universitária Ltda., São Paulo, 1980. Todos os direitos reservados.
A reprodução desta obra, no todo ou em parte, por qualquer meio. sem autorização expressa e por
escrito da Editora, sujeitará o infrator, nos lermos da lei n" 6.895, de 17-12-1980. à penalidade
prevista nos artigos 184 e 186 do Código Penal, a saber: reclusão de um a quatro anos.
E. P. U. - Telefone (0++11) 3168-6077 - Fax. (0++11) 3078-5803
E-Mail: vendas@epu.com.br Site na Internet: http://www.epu.com.br
Rua Joaquim Floriano, 72 - 6“ andar - conjunto 65/68 - 04534-000 São Paulo - SP
Impresso no Brasil Printed in Brazil
Fred N . Kerlinger
Universidade de Amsterdã
Metodologia da
Pesquisa em
Ciências Sociais
Um tratamento
conceituai
Oi l O íDIITOM K M G Ó G O
€ liWtSllfMIffl ILTDd.
Para
William Clark Trow
Theodore M. Newcomb
Sumário
VII
Sobre o autor
J.R.M.
Uma terceira finalidade do livro é definir e explicar algumas das
principais questões controvertidas associadas à pesquisa sócio-científica.
As controvérsias surgem e multiplicam-se devido a conflitos e diferenças
de valores. Às vezes, entretanto, nascem de concepções errôneas a respeito
dos problemas que estão subjacentes a elas. Para que serve a pesquisa?
Por que fazer pesquisas? O que é objetividade? Por que a objetividade é
considerada tão importante pelos cientistas? O que são pesquisa básica e
pesquisa aplicada? Pode-se medir a inteligência humana? Como os valo
res afetam a ciência e a pesquisa? Mal-entendidos sobre tais problemas
dificultam a compreensão da ciência e da pesquisa. O presente livro,
portanto, tenta analisar e colocar esses problemas em perspectiva, embora
não pretenda resolvê-los.
Há dois públicos que são especialmente visados por este texto.
O primeiro é formado por aqueles que desejam conhecer algo da natureza
e dos problemas da ciência e da pesquisa em psicologia, sociologia,
educação e outras disciplinas comportamentais. O que significa, por
exemplo, estudar cientificamente a inteligência e o preconceito? Como
são abordados problemas assim tão complexos e difíceis de apreender?
O segundo tipo de público é o formado por estudantes universitários
que estão terminando seus cursos de graduação, ou iniciando a pós-
graduação, em praticamente qualquer disciplina, inclusive disciplinas
não-científicas, e que necessitam compreender a ciência e a pesquisa
comportamentais. Os estudantes de ciências comportamentais acharão o
livro particularmente pertinente e útil. Entretanto, eu o concebi como
um texto geral e um guia para estudantes de várias disciplinas, ainda
que sua ênfase seja psicológica, sociológica e educacional.
O livro tem três partes principais. Na primeira parte, que abrange
os capítulos 1, 2 e 3, é discutida a natureza da ciência e da pesquisa
científica. Os termos necessários são definidos, as idéias fundamentais
são explicadas e ilustradas, e são introduzidos um ou dois pontos contro
vertidos — por exemplo, a questão da objetividade. Os capítulos 1 e 3
são, provavelmente, os capítulos mais importantes do livro, porque
discutem qual é a meta da ciência e por que, e revelam a essência e o
propósito dos problemas e hipóteses da pesquisa científica. Esta parte,
portanto, poderia ser chamada de fundamentos conceituais do tema.
A segunda parte — capítulos de 4 a 13 — trata dos aspectos
técnicos da pesquisa comportamental que são, em minha opinião, os
mais importantes. Ninguém pode compreender realmente a ciência e a
pesquisa comportamental sem compreender pelo menos as mais funda
mentais das idéias técnicas. Por exemplo, a idéia de aleatoriedade é
fundamental. Não se pode compreender experimentos ou ter qualquer
tipo de idéia clara do que seja estatística e delineamento de pesquisa sem
compreender funções e processos aleatórios e o seu uso na pesquisa
XII
Prefácio
XI
regressão múltipla e análise discriminante de modo preciso e não-técnico?
Essa é uma boa pergunta, e para a qual não existe uma resposta pronta
e fácil. O problema é que, se não forem discutidas as abordagens multi-
variadas à pesquisa e à análise de dados, deixa-se uma grande lacuna no
conhecimento e na compreensão que terá o leitor sobre a pesquisa com-
portamental. A pesquisa comportamental passa, atualmente, por uma
verdadeira revolução, a meu ver, precisamente por causa, em grande parte,
da abordagem multivariada e do ultra-rápido computador moderno.
Problemas de pesquisa, que antes não poderiam ser contemplados por
uma incapacidade de se fazer as complexas análises envolvidas, são hoje
abordados quase rotineiramente. Assim, decidiu-se incluir o assunto, a
um nível conceptual e semitécnico. Há a conseqüente supersimplifica-
ção, ignorando-se diversos problemas importantes. Os riscos, entretanto,
talvez sejam compensados por uma imagem melhor e mais completa que
o leitor poderá adquirir. Pelo menos, estes capítulos poderão aumentar o
interesse e difundir uma abordagem fascinante, com muitas probabili
dades para a teoria e a pesquisa significativas e criativas.
A terceira parte do livro, capítulos 14, 15 e 16, discute e explora
diversos problemas controvertidos e mal compreendidos, que trazem
considerável preocupação à ciência e aos cientistas. Um deles — feliz
mente, relativamente fácil de manejar — é a natureza e a finalidade do
computador. Não há dúvida de que o computador foi e é uma das
influências mais fortes na pesquisa comportamental contemporânea.
Esta influência é examinada no capítulo 14. Os notáveis poderes do com
putador são descritos e analisados com o propósito de se compreender o
que o computador pode fazer e, o que é praticamente tão importante
quanto isso, o que o computador não pode fazer. Depois de estabelecida
essa base, procurou-se também esclarecer um ou outro mal-entendido
sobre o computador e o seu lugar na pesquisa e na ordem das coisas.
Os dois últimos capítulos do livro, capítulo 15 e 16, exploram basica
mente um certo número de problemas mal compreendidos e contro
vertidos, que intrigam e desorientam os pesquisadores e os indivíduos
que observam a ciência e a pesquisa. Por exemplo, a questão de para
que serve a ciência é atacada diretamente, e são tiradas conclusões que
poderão desconcertar alguns leitores. Qualquer atividade humana com
plexa é controvertida. A ciência não é exceção. Decidi, portanto, que
alguns dos mal-entendidos mais perturbadores e importantes sobre. a
ciência e a pesquisa teriam que ser abordados. Naturalmente, ao se fazer
isso, há um risco considerável. Poderá parecer que se está tomando
partido em um debate. Na realidade, o que se está assumindo é menos
um partido em um debate do que uma posição baseada no que se
considera ser a natureza da ciência. Novamente, isto se toma um
obstáculo à compreensão. Por exemplo, muitas pessoas acreditam que o
XIV
contemporânea. A cobertura desta parte é ampla e diversificada. Inclui
relações, probabilidade, delineamento de pesquisa, mensuração e análise
multivariada. É o núcleo técnico do livro, mas na sua maior parte
expresso em linguagem não-técnica.
O capítulo 4 estabelece a base: examina relações e explicações e
tenta mostrar como estão subjacentes a todo o empreendimento científico.
O capítulo 5 apresenta uma abordagem intuitiva à probabilidade e à
estatística. A importância da idéia de aleatoriedade, mencionada acima,
é fortemente enfatizada. Os capítulos 6, 7 e 8 formam uma unidade
sobre experimentação e delineamento de pesquisa. Os delineamentos de
pesquisa têm o propósito essencial de fornecer quadros de referência que
tomem possível responder diferentes questões de pesquisa. Os capítulos 6
e 7 esboçam os princípios de tais quadros de referência. O capítulo 8
mostra as semelhanças e diferenças entre a pesquisa experimental e a
não-experimental. Raramente essa distinção tão importante é discutida
na bibliografia. Considero-a suficientemente importante para justificar
um capítulo inteiramente dedicado a ela. A distinção e as suas con-
seqüências, tais como apresentadas no capítulo 8 e em outros trechos do
livro, podem ser questionadas. Todavia, por mais corretas ou incorretas
que sejam julgadas a definição, as distinções e as conseqüências, não há
dúvida de que o tema requer divulgação e compreensão.
Mensuração é a principal preocupação do capítulo 9. Assim como a
estatística, a mensuração psicológica é uma das maiores conquistas de
nossos tempos. Embora tenha ainda um longo caminho pela frente, boa
parte deste já é conhecido, e uma parcela do núcleo desse conhecimento
está condensada no capítulo 9. A despeito de ser uma grande realização,
a mensuração tem sido também o calcanhar de Aquiles de grande parte
da pesquisa comportamental. O capítulo ajuda a esclarecer suas forças e
fraquezas.
O capítulo 10 procura descrever um volumoso e importante tipo de
pesquisa — em termos gerais denominado “investigação sociológica” —
cujas principais características são sua natureza não-experimental, sua
mensuração e seus modos de análise. Temos este tipo de pesquisa quando,
por exemplo, os pesquisadores estudam principalmente o que pode ser
chamado de “variáveis sociológicas” — classe social, status ocupacional,
sexo, preferências religiosas e políticas, e assim por diante — e quando
o método predominante de observação é a contagem, geralmente a conta
gem de características “sociológicas” de indivíduos. O capítulo ocupa-se
de suas características e de seu uso na pesquisa comportamental.
A inclusão dos capítulos 11, 12 e 13, sobre a abordagem multiva
riada, é essencial em um livro sobre a pesquisa comportamental contem
porânea. Algumas pessoas poderão achar que o assunto é muito complexo
para um livro deste tipo. Como se poderia explicar análise fatorial,
XIII
propósito da pesquisa científica é aumentar o bem-estar humano. Quando
isso é categoricamente negado, e se afirma que o propósito da pesquisa
científica é a teoria, ou a compreensão e explicação, não é de se admirar
que surjam dificuldades. Pretende-se, entretanto, explicar de tal maneira
as coisas, que as razões para as afirmações feitas possam ser compreendi
das e, pelo menos, consideradas. Assim, os últimos dois capítulos do
livro exploram controvérsias e mal-entendidos. Tentam colocar em
perspectiva três ou quatro das maiores questões, em parte filosóficas, da
ciência e da pesquisa.
Embora possa ser considerado metodológico, num sentido amplo,
este não é um livro de métodos. Não se tenta ensinar como fazer pesquisa.
Toda a ênfase é posta em compreender pesquisa. Na verdade, é provavel
mente impossível compreender qualquer assunto complexo sem trabalhar
ativamente com ele. Para compreender realmente a estatística, a maioria
das pessoas precisaria trabalhar com problemas estatísticos, por exemplo.
Todavia, um nível substancial de compreensão pode ser alcançado por
uma forma vicária de trabalhar com os problemas. Muitos de tais
“trabalhos vicários” são dados no livro. Por exemplo, uma característica
importante do livro é a descrição de pesquisas reais, geralmente acom
panhada da teoria em que se baseiam os estudos, bem como as questões
colocadas pelos pesquisadores. Assim, o livro descreve a maneira pela
qual as pesquisas têm sido feitas e é, portanto, numa certa medida,
metodológico. Mas deixa quase que completamente de lado os métodos
reais de fazer observações, medir variáveis, analisar dados e assim por
diante. A necessidade de informações sobre esses tópicos é atendida, numa
certa medida, pelo Apêndice, no qual são discutidos tipos de pesquisa
diferentes dos tratados no texto, bem como alguns métodos de observação.
Embora saiba o quanto me ajudou, não creio que minha mulher
compreenda realmente até que ponto ela é uma parte importante deste
livro. Em todo caso, por suportar minhas rabugices e frustrações,
deixando de lado o que ela considerava obstáculos menores, dando-me
apoio e ânimo, eu lhe agradeço.
Amsterdã, Holanda
junho de 1978 Fred N. Kerlinger
XV
1 A natureza da ciência e da pesquisa científica
1
informação válida e fidedigna sobre fenômenos complexos, inclusive o
complexo fenômeno do próprio homem. Era preciso superar explicações
absolutistas, metafísicas e mitológicas de fenômenos naturais — ou pelo
menos suplementá-las — com uma abordagem até certo ponto exterior
ao homem O sucesso da ciência como abordagem do conhecimento e
compreensão de fenômenos naturais tem sido notável. Mas a compreen
são da ciência e da abordagem usada pelos cientistas tem sido conside
ravelmente menos notável. Pode-se dizer que a ciência é seriamente
mal compreendida.
O objetivo básico deste livro é ajudar o leitor a compreender
abordagem, o pensamento e os métodos da ciência e da pesquisa cien
tífica. Seu foco especial se dirigirá para a pesquisa em psicologia, socio
logia e educação. A abordagem geral é a mesma, ou pelo menos basica
mente semelhante, em todas as ciências. Estudaremos esta abordagem
muito cuidadosamente. Entretanto, há dificuldades e problemas especiais
na ciência e pesquisa comportamentais que precisamos conhecer se qui
sermos entender tal pesquisa. 1 Em outras palavras ,a abordagem geral do
conhecimento e compreensão da física e da psicologia é a mesma, mas os
detalhes da teoria e investigação são muito diferentes. Por exemplo, a
complexidade e a ambigüidade do comportamento humano, geralmente
considerado como mais complexo e ambíguo do que os objetos do mundo
físico, criam grandes problemas de observação e inferência válidas e
fidedignas. Medir aspectos do comportamento humano — agressividade,
preconceito, preferências políticas e realização escolar, por exemplo —
é geralmente mais difícil do que medir as propriedades dos corpos
físicos.
É grande a necessidade de compreender a ciência e a abordagem
científica. Esta necessidade é grande principalmente na psicologia, socio
logia e educação, dada a urgência dos problemas humanos e sociais que
os pesquisadores estudam, e dada a natureza controvertida de alguns
dos problemas e métodos das ciências comportamentais. Este livro se
concentra nesta necessidade.*
2
Natureza geral da ciência
A ciência é um empreendimento preocupado exclusivamente com
o conhecimento e a compreensão de fenômenos naturais. Os cientistas
desejam conhecer e compreender as coisas. Eles querem poder dizer:
se fizermos isto aqui, acontecerá aquilo ali. Se frustrarmos as crianças,
provavelmente elas agredirão outras, seus pais, seus professores e até
a si próprias. Se observarmos uma organização com regras relativamente
rígidas a restringir seus membros, digamos, os professores de uma escola,
poderemos esperar encontrar considerável insatisfação entre eles.
Os cientistas, então, querem “ conhecer” os fenômenos. Eles querem
saber, entre outras coisas, o que produz o comportamento agressivo em
crianças e adultos. Querem saber se a frustração conduz à agressão.
Querem saber os efeitos dos meios restritivos ou permissivos de admi
nistração sobre os membros de uma organização. Em resumo, querem
“ compreender” de que maneira se relacionam os fenômenos psicoló
gicos, sociológicos e educacionais.
3
da mudança sobre a outra variável. Estas idéias devem ficar claras depois
de lermos a discussão dos dois estudos que vêm a seguir.
4
inteligência superior ao do outro. No tipo de pesquisa em que se usam
dois grupos e um tratamento especial é aplicado a um deles, este grupo
é frequentemente chamado “ grupo experimental” . O outro, ao qual não
se faz nada em especial, chama-se “ grupo de controle” .
No início do experimento, todos os alunos foram elogiados por seu
trabalho. Isto foi usado para estabelecer médias de recompensa para
os professores das crianças. (Naturalmente os professores diferem quanto
à recompensa que usam.) Depois de seis sessões, as médias de recom
pensa ficaram estabilizadas e o experimento propriamente dito começou.
Os professores do grupo experimental, das crianças a receberem trata
mento especial ou experimental, foram avisados para dobrarem ou tripli
carem a recompensa, enquanto os professores do grupo de controle
foram avisados para "manterem o trabalho em ordem” . No fim de um
período de três semanas foi feito um teste de leitura com as crianças.
A análise dos resultados dos testes mostrou que o grupo experi
mental ou da “ recompensa maciça” fez o teste melhor do que o grupo
de controle. Esta conclusão foi inferida de um teste estatístico da dife
rença entre a média de pontos de leitura entre os dois grupos: a média
do grupo experimental foi maior do que a média do grupo de controle.
Mais tarde explicaremos o princípio que rege tais testes estatísticos.
Por enquanto, pode-se dizer que a recompensa maciça teve resultados
aumentando a contagem de pontos do grupo experimental em compa
ração com o número de pontos feitos pelo grupo de controle, Se se
pode dizer que recompensas maciças funcionam com crianças negras
carentes e que possam ou devam ser usadas com elas, dependerá de
outras pesquisas, destinadas a averiguar se os mesmos resultados são
obtidos repetidamente — isso se chama replicação — e testando o
reforçamento em geral com diferentes tipos de crianças. Em outras
palavras, os resultados de um estudo são sugestivos, embora não conclu
sivos. Talvez as crianças negras carentes necessitem de reforço maciço
— mas talvez não.2
5
que as variáveis A e B estão relacionadas, queremos dizer que existe
algo em comum entre as duas variáveis, alguma ligação entre elas.
Suponhamos que os dois círculos da figura 1.1 representem essências
do que sejam A e B. Isto é, A representa a essência do que seja a va
riável A. É a substância de A. O círculo B, naturalmente, representa a
essência de B. Observe que os círculos A e B se sobrepõem e que a
superposição é indicada por traços horizontais. Isso indica que algo das
essências de A e B é compartilhado. Uma parte de A é igual a uma
parte de B e vice-versa. Esta faixa compartilhada, indicada pela área
de traços finos, representa a relação entre A e B. A pode ser inteligência
e B aproveitamento escolar. A superposição na figura 1.1 é a relação
entre as duas. O que é esta propriedade dividida? É difícil dizer sem
outras evidências. Pode ser aptidão ou habilidade verbal; pode ser o
que se denominou inteligência geral. Mas voltemos ao nosso exemplo.
Os psicólogos e sociólogos fizeram grande número de pesquisas
sobre classes sociais e descobriram sua importância para a explicação de
diferentes tipos de comportamento: recreação, eleições e criação dos
filhos, por exemplo, são fenômenos associados às classes sociais. Miller
e Swanson (1960) levantaram a hipótese, entre outras coisas, de uma
relação entre a classe social dos pais e o tempo que levavam para
desmamar os filhos. Foi perguntado a uma amostra de 103 mães da
classe média e da classe trabalhadora de uma grande cidade do
meio-oeste como estavam criando seus filhos. O resultado de uma per
gunta sobre o tempo do desmame é apresentado na tabela 1.1. Os
números nas casas representam a quantidade de mães que eram da classe
média ou da classe trabalhadora e que haviam desmamado os filhos
mais cedo ou mais tarde.
O estudo dos números nas diferentes casas da tabela indica que as
mães da classe média parecem desmamar os filhos mais cedo do que
as mães da classe trabalhadora. Das 55 mães de classe média, 33 des
mamavam cedo enquanto 22 desmamavam tarde; das 48 mães da classe
Figura 11
6
Tabela 1.1 Classe social e tempo de desmame, estudo de Miller e Swanson (I960).*
Cedo Tarde
Classe média 33 22
(0,60) (0,40) 55
Classe trabalhadora 17 31
(0,35) (0,65) 48
50 53 103
* As entradas nas casas são freqüências: número de mães. As cifras entre parên
teses são proporções, por exemplo, 33/55 = 0,60. Se as proporções forem multi
plicadas por 100, obtêm-se as porcentagens: (33/55) (100) = (0,60) (100) = 60
por cento, ou 60 por cento das mães da classe média disseram que desmamaram
seus filhos cedo.
7
não estar presente entre todas as mães. Ê necessário mais pesquisa para
reforçar a afirmação e a certeza que se pode ter quanto à sua "verdade” .
Estes dois estudos têm um bom número de aspectos que são caracte
rísticos da pesquisa comportamental. Primeiro, um é um estudo experi
mental, o outro não-experimental. Segundo, eles ilustram a objetividade,
uma característica da pesquisa científica que logo examinaremos. Ter
ceiro, seu uso de análise quantitativa elementar irá nos ajudar a apro
fundar mais na análise e estatística. Por exemplo, no estudo de Clark
e Walberg, foram calculadas e comparadas as médias e no estudo de
Miller e Swanson, foram tabuladas e comparadas as freqüências. Estes
são dois dos modos mais comuns de se fazer análise quantitativa. Quarto,
os problemas, relações e metodologia de ambos os estudos são simples
e claros; serão úteis para ilustrar colocações a serem feitas em discussões
subseqüentes.
Mais pertinentes ao tema principal deste capítulo é o que os estudos
tentaram fazer, quais foram seus objetivos. Um dos objetivos do estudo
de Clark e Walberg foi compreender e explicar o aproveitamento, ou
antes, um certo aspecto do aproveitamento, o chamado subaproveita-
mento. Um dos objetivos do estudo de Miller e Swanson foi explicar o
desmame, que é, naturalmente, um aspecto do trabalho de cuidar de uma
criança. As palavras “ compreender” e “ explicar” devem ser interpretadas
num sentido amplo. Quando dizemos que “ compreendemos” um fenô
meno, queremos dizer que conhecemos suas características — pelo
menos algumas — o que o produz e quais as suas relações com outros
fenômenos. Queremos dizer que tentamos “ explicar” o fenômeno. Po
demos dizer o que provavelmente o tenha causado, o que o influencia
agora, o que o influenciará e no que ele influencia. É importante obser
var aqui que nossa compreensão de um fenômeno é sempre incompleta,
parcial e probabilística. Sem dúvida, muito do nosso conhecimento do
mundo, especialmente do fenômeno social e humano, é parcial e
até falho.
A realização é um fenômeno importante no mundo ocidental.
Quando dizemos que procuramos “ compreendê-lo” , em parte queremos
dizer que desejamos saber por que certas pessoas conseguem grandes
coisas, enquanto outras conseguem muito pouco. Ou, mais ambiciosa
mente, queremos saber por que certos grupos conseguem tanto e outros
tão pouco. Por exemplo, McClelland (1961), num livro estimulante,
The Achieving Society, relatou uma pesquisa voltada para uma questão
geral: Como e por que as pessoas de diferentes países diferem em sua
motivação para a realização? É possível se estender muito discutindo
um conceito tão rico quanto o de realização. O núcleo da idéia de com
preensão e explicação, entretanto, é que explicamos um fenômeno espe
cificando o que está relacionado a ele.
8
Clark e Walberg se interessaram por explicar um aspecto relativa
mente limitado da realização. Eles desejavam explicar e compreender a
realização em leitura, de crianças negras que eram geralmente defi
cientes, na realização escolar. Queriam saber se o reforçamento maciço
da realização iria afetá-la positivamente. Estudaram, então, a relação
entre o reforçamento e a realização em leitura. Conseguiram mostrar
que o reforçamento maciço afetava positivamente a realização das
crianças em leitura. Eles, até certo ponto, “ explicaram” a realização por
que mostraram uma coisa que a afetou. 6
O fenômeno “ explicado” por Miller e Swanson foi o desmame, ou,
talvez mais exatamente, a técnica de cuidar de crianças, que inclui entre
outras coisas métodos disciplinares, tipos de recompensas usadas e mé
todos para induzir à obediência. Eles mostraram, por exemplo, que mães
da classe média e da classe operária diferem nas suas práticas de des
mame. Assim estabeleceram uma relação, por um lado, entre classes
sociais e por outro, no método de desmame. Mostraram que algumas
diferenças observadas no desmame eram devidas à classe social, em
outras palavras. Assim, até certo ponto, eles “ explicaram” as diferenças
nas práticas de desmame.
Vamos interromper nossa discussão a respeito das metas e propó
sitos científicos para discutirmos duas características importantíssimas
da ciência. A primeira, objetividade, é uma característica metodológica
controvertida e difícil de entender. A segunda é a natureza empírica da
ciência. Após discutirmos estas características, estaremos em melhor
posição para continuar a discussão principal. Pode ser dito clara e
categoricamente que sem o “ método” ou “ critério” de objetividade, ou
sem a abordagem e a atitude empírica, a ciência como é conhecida no
mundo moderno não seria possível. O que significa esta afirmativa? E o
que ela tem a ver com a natureza da pesquisa científica?
9
sua influência e predileções. Em vez de estarem em suas cabeças, as
idéias testadas são objetivadas, feitas objetos “ do lado de fora” , objetos
que têm uma existência, por assim dizer, separada de seus inventores.
Qualquer um pode observar um experimento e como ele é feito; e coisa
pública.
Todo conhecimento do mundo é afetado, e até distorcido de certa
forma, pelas predisposições dos observadores. Quanto mais complexas
as observações, mais se afastam da realidade física, e quanto maiores
as inferências feitas, maiores as probabilidades de distorção. Quando o
cientista físico lida com pesos, por exemplo, há uma baixa probabilidade
de distorção: existem pequenas oportunidades para pontos de vista
pessoais, inclinações e prenoções entrarem no processo. Mas considerem
se as possibilidades de distorção no estudo e mensuração de autoritaris
mo, dogmatismo, inteligência, nível de aspiração, realização, classe social,
ansiedade e criatividade.
Tomemos apenas uma destas variáveis, a criatividade. Embora .
concordemos que vamos estudar e medir a criatividade, podemos ter
idéias muito diferentes do que seja a criatividade. Essas idéias diferentes,
estas percepções diferentes, podem influenciar nossas observações de,
digamos, criatividade em crianças. Um ato comportamental que para
um indica criatividade pode não indicar criatividade para outro e essas
diferenças em percepção podem afetar nossa mensuração. Em outras
palavras, as verdadeiras observações do comportamento criativo podem
ser muito diferentes, dependendo de quem observa, a não ser que se
concorde em adotar um método de observação — e se ater rigidamente
a ele.
Objetividade é um acordo entre juízes “ especialistas” relativo ao
que é observado, ou o que deve ser ou o que foi feito em pesquisa.
Suponhamos que um cientista observe alguma coisa e anote essa obser
vação, digamos, em forma numérica. Outro, de igual competência,
observa a mesma coisa, independentemente, e registra sua observação.
Se o processo puder ser repetido com resultado idêntico ou parecido
— isto é, se há acordo entre as observações dos cientistas — consegue-se
objetividade. Em algumas áreas da ciência, como na química e física,
por exemplo, a objetividade não é problema sério, graças aos instru
mentos de alta precisão, como os microscópios eletrônicos. Tais instru
mentos aumentam a probabilidade de acordo entre os juízes, porque, ao
usá-los, juízes diferentes provavelmente obterão e anotarão os mesmos
resultados. Além disso, a máquina tem menos possibilidade de influen
ciar observações e de ser influenciada pela natureza do que estiver
sendo observado.
A definição de objetividade como acordo entre juízes não deve
ser interpretada com estreiteza: é bastante ampla. O que significa isto?
10
A condição principal para satisfazer o critério de objetividade é, ideal
mente, que quaisquer observadores com um mínimo de competência
concordem em seus resultados. Em psicologia e educação, por exemplo,
usam-se testes e escalas objetivas. São chamados “ objetivos” porque'
qualquer pessoa, devidamente orientada, pode avaliá-los e obter os mes
mos resultados (com pequena margem de erro). A expressão “ testes
objetivos” não significa que os testes sejam em si mesmos “ objetivos” .
Eles o são porque a contagem de pontos é a mesma, não impor
tando quem os avalie. Por outro lado, a correção de respostas em
redações depende muito mais do julgamento pessoal do juiz, enquanto
tais julgamentos são virtualmente excluídos em testes objetivos. (Deve
ser notado, entretanto, que a avaliação de redações pode ser feita de
maneira muito mais objetiva do que geralmente se faz.)
Mudemos um pouco a perspectiva. No estudo Clark e Walberg a
mensuração do aproveitamento em leitura foi mais objetiva do que a
mensuração de tempo de desmame no estudo de Miller e Swanson por
que o primeiro foi medido com um teste de tipo objetivo, enquanto o
segundo foi medido através de entrevistas. Qualquer um que avaliasse o
teste de leitura obteria os mesmos resultados. Mas dois entrevistadores
poderiam mostrar diferenças na mensuração de tempo de desmame, no
caso por dois motivos. O primeiro acaba de ser dado: juízes diferentes
podem interpretar as respostas do entrevistado diferentemente. Uma mãe
pode dizer que desmamou seu filho quando a criança tinha entre 7 e 9
meses. Um entrevistador pode se satisfazer com esta resposta e anotá-la,
mas outro pode querer se aprofundar mais e acabar descobrindo que
a mãe desmamou o filho aos seis meses. O segundo motivo se deve à
falta de memória da mãe: ela pode simplesmente não se lembrar quando
desmamou o filho e dizer que foi aos dez meses, quando de fato foi
aos oito. Não existe tal ambigüidade com mensuração de tipo objetivo
(embora não esteja isenta de outros tipos de dificuldades). Um teste de
leitura de tipo objetivo, por exemplo, tem regras explícitas para a ava
liação das respostas. A resposta a qualquer pergunta só pode ser ou cor
reta ou incorreta: há pouca margem para a iniciativa ou o julgamento
do avaliador.
A importância da objetividade exige mais explicação ainda. Embora
seja aplicada geralmente a observações e mensuração científicas, a idéia
é mais ampla. Quando os psicólogos fazem experimentos, lutam por
objetividade. Isso significa que fazem sua pesquisa controlando de tal
modo a situação experimental e descrevendo de tal modo o que fazem
que outros psicólogos poderão repetir o experimento e obter resultados
iguais ou semelhantes. Em outras palavras, a objetividade ajuda o pes
quisador a “ sair” de si mesmo, ajuda-o a conseguir condições publica
mente replicáveis e, conseqüentemente, descobertas publicamente averi-
11
guáveis. A ciência é um empreendimento social e público, como tantos
outros empreendimentos humanos, mas uma regra importantíssima do
empreendimento científico é que todos os procedimentos sejam objetivos
— feitos de tal forma que haja ou possa haver acordo entre juízes
especialistas. Esta regra dá à ciência uma natureza distinta, quase remota,
porque quanto maior a objetividade mais o procedimento se afasta das
características humanas — e de suas limitações. Por exemplo, a obje
tividade quase glacial de partes das ciências naturais, cujos experimentos
são feitos em laboratórios e em circunstâncias altamente controladas,
cujas observações são feitas quase inteiramente por máquinas de alta
precisão e fidedignidade, parece coisa muitíssimo distante de gente e de
suas preocupações sociais e pessoais. (Isto não significa que os cientistas
que pesquisam e controlam as máquinas sejam imunes a erros.)
Comparem-se agora os procedimentos em psicologia e educação. O
cientista físico pode “ sair de si mesmo” mais facilmente do que o cien
tista comportamental, porque é mais fácil para ele preparar uma pesquisa
e testar hipóteses “ fora” e longe de suas próprias predileções e inclina
ções e de outros. Isto acontece porque os procedimentos são mais fáceis
de ser “ objetivados” . Uma vez que o funcionamento de um processo
físico fique compreendido, pode ser repetido e medido pela maioria de
técnicos e cientistas competentes. Em outras palavras, há uma replica-
bilidade relativamente alta.
Em pesquisa sociológica, psicológica e educacional, entretanto, isto
é verdadeiro em grau muito menor. A manipulação de variáveis psicoló
gicas, como a coesão de grupo, a atmosfera em sala de aula, estilos de
liderança e ansiedade, é muito mais difícil de ser feita objetivamente
por causa da maior complexidade, amplitude de variação e acessibili
dade a influências outras que as do pesquisador. Igualmente, a mensu-
ração de variáveis comportamentais, tais como inteligência, realização,
atitudes, classe social e motivação é mais sujeita a influências sistemá
ticas e casuais, tornando mais difícil — embora não impossível, como
pretendem alguns críticos — vários observadores concordarem em suas
observações e mensurações. Isto não significa, entretanto, que os proce
dimentos do psicólogo não sejam objetivos. Na verdade, eles freqiiente-
mente podem possuir um nível de objetividade relativamente alto. Eles
são simplesmente menos objetivos do que os do cientista físico.
Não há qualquer diferença de princípio, por outro lado, entre o
uso do critério de objetividade pelo cientista físico e pelo cientista com
portamental. A única diferença está no grau de objetividade. Já foi dito
que as ciências comportamentais não podem ser verdadeiramente cientí
ficas porque não podem usar os métodos das ciências físicas. Isto não
é assim, a não ser num sentido puramente literal. Em todas as ciências
são usados a mesma abordagem e os mesmos métodos gerais. Assim está
12
longe de ser impossível chegar-se à objetividade nas ciências comporta-
mentais; isto já foi conseguido com sucesso, muitas vezes. É apenas
mais difícil.
Objetividade e explicação
Figura 1.2
13
objetividade, entretanto, é uma característica indispensável e inseparável
da ciência e da pesquisa científica.
7 Tais enunciados não podem ser gerais demais porque, se forem, não podem ser
refutados. Como veremos mais tarde, os enunciados científicos têm que ser pas
síveis de serem submetidos a teste e acessíveis a serem mostrados como falsos
se realmente o forem.
14
A abstração, parte do poder da ciência, está sempre distante das
preocupações comuns e do calor do relacionamento humano. Isto por
definição; é parte da natureza da ciência. Sem tal abstração, não há
ciência. O mesmo quanto a objetividade, que também tende a fazer a
ciência parecer fria e distante. Parece distante e fria porque os testes
das proposições científicas são feitos “ lá fora’’, o mais longe possível
das pessoas e suas emoções, desejos, valores e atitudes, incluindo os do
próprio cientista. Mas é isto precisamente o que deve ser feito. Deve-se
obedecer ao cânone da objetividade — ou abandonar a ciência.
15
pesquisa científica sistemática e-controlada. Aqui está um exemplo que
nos ajudará a compreender o que “ empírico” significa para a ciência.
Uma pesquisa científica foi feita para determinar se é possível
animais e seres humanos aprenderem a controlar reações do sistema
nervoso autônomo. Podem, por exemplo, diminuir as batidas cardíacas
ou aumentar a secreção da urina à vontade? (Miller, 1971, caps. 55, 56).
Tanto velhas quanto novas crenças dizem que isso não é possível. Então,
a generalização é: as pessoas não conseguem controlar reações gover
nadas pelo sistema nervoso autônomo. Acontece que a afirmação talvez
não seja verdadeira: descobriu-se que animais (e talvez pessoas) podem
ser treinados para fazerem coisas tais como aumentar e diminuir as
batidas cardíacas, aumentar e diminuir sua secreção urinária e até alterar
sua pressão sanguínea (Miller, 1971, Parte XI). Um enunciado empiri
camente orientado seria: os animais podem, dentro de certos limites,
controlar reações do sistema nervoso autônomo, recebendo “ instrução”
apropriada. Os animais podem ser ensinados a, por exemplo, aumentar
ou diminuir as batidas cardíacas e aumentar ou diminuir sua secreção
urinária. Não é fácil, mas já foi feito. São afirmativas empíricas, já que
estão baseadas em evidência científica.
Por ser empírica, não significa necessariamente que uma afirma
tiva seja verdadeira. Se baseada em pesquisa científica e evidência, é
mais provavelmente verdadeira do que uma afirmativa baseada intei-
ramente em crenças. Entretanto, pode ainda não ser verdadeira. A
afirmativa acima, de que é possível aprender a controlar o sistema ner
voso autônomo até certo ponto, embora apoiada pela evidência da pes
quisa científica, pode acabar sendo refutada a longo prazo. Pode não
ser possível obter os mesmos resultados no próximo ou no ano seguinte,
ou na Austrália assim como na América. Ê possível que as descobertas
de pesquisa apoiando o enunciado fossem o resultado de alguma causa
temporária e não reconhecida, característica apenas da situação parti
cular em que foi feita a pesquisa. Não obstante, a probabilidade de uma
afirmativa baseada em evidência empírica ser verdadeira é maior do
que a probabilidade de uma afirmativa não-empírica ser verdadeira. Evi
dência empírica cuidadosamente obtida, como veremos, é um corretivo
saudável e necessário para as crendices do homem e um meio salutar
de diminuir sua ignorância. Evidência não-empírica, por outro lado,
pode e às vezes ajuda a perpetuar a ignorância, como fazem os velhos
provérbios. E, em resumo, a evidência empírica freqüentemente controla
nossa mania desenfreada de fazer afirmações sobre as coisas, afirmações
que podem ou não ser verdadeiras.
A palavra “ empírica” então é importante porque mostra uma ma
neira de olhar o mundo e as pessoas profundamente diferente da
maneira tradicional, que procura explicações apelando para a autoridade,
16
senso comum, ou para a razão. O homem é basicamente egoísta? Po
demos citar a Bíblia, Freud ou Shakespeare; podemos dizer que é
auto-evidente ou óbvio que o homem é basicamente egoísta ou não-
egoísta; ou podemos raciocinar cuidadosamente na base da autoridade
e da observação e concluir que o homem é basicamente egoísta ou
não-egoísta. Esta é mais ou menos a maneira tradicional.
Os cientistas, entretanto, não estão satisfeitos com essa maneira.
Se acham que a questão é cientificamente respondível — muitas questões
não podem ser respondidas cientificamente — então eles abordam o
problema diferentemente. Embora possam apresentar uma explanação
teórica, sempre fica em suas cabeças uma pergunta a importunar: O
que dirá a evidência científica? Decidindo primeiro como definir e
medir o egoísmo, o cientista preparará um estudo ou uma série de
estudos para tentar determinar até onde o egoísmo motiva o comporta
mento humano e como isto é feito. Fará, então o estudo sob condições
controladas e, depois de analisar os resultados obtidos, chegará a con
clusões que parecerão saltar da evidência. A evidência, então, é o centro
de todo o processo. Sem ela as conclusões geralmente não têm valor
científico.
Alguns leitores podem ficar em dúvida quanto à importância desta
distinção entre abordagens empíricas e não-empíricas. Podem dizer que
é óbvio, até auto-evidente, que procuramos evidências para as afirma
tivas que fazemos. Pessoas racionais sempre farão isto. Mas a questão
é justamente esta: às vezes fazem, mas muitas vezes não. Nossos siste
mas de crenças — religiosas, políticas, econômicas, educacionais — são
sem dúvida poderosos e freqiientemente guiam nosso comportamento,
não a evidência. Parece que é muito difícil usar a evidência empírica
como hábito. Se não o fosse, muitos dos problemas sociais que enfren
tamos poderiam ser resolvidos, admitindo-se a existência de boa vontade
e motivação adequada. Para compreender a ciência e a pesquisa cientí
ficas, portanto, é necessário um esforço contínuo e consciente, nada fácil,
porque a necessária atitude empírica exige no mínimo uma suspensão
temporária de poderosos sistemas de crenças. Em outras palavras, a
primeira e última corte de apelação da ciência é a evidência empírica.
17
Figura 1.3
18
Na teoria, duas variáveis, inteligência e motivação para a realiza
ção, são influências diretas; acredita-se que ambas influenciem a reali
zação escolar sem passarem pelas outras variáveis. Estas influências
diretas são mostradas pela figura 1.3: as setas de inteligência e motiva
ção para a realização vão para realização na universidade. Acredita-se
que as outras duas variáveis, situação econômica familiar e classe social,
tenham influência indireta na realização escolar; elas “ atravessam” a
motivação para a realização. Acredita-se, por exemplo, que em geral,
quanto mais afluente a família, maior a motivação para a realização.
Igualmente a classe social influencia a motivação para a realização: ra
pazes e moças da classe média têm maiores motivos para desejarem
progredir que os jovens das classes trabalhadoras. A inteligência, além
de sua influência direta na realização escolar — quanto maior a inteli
gência, maior a realização — tem influência indireta na realização esco
lar através da motivação para a realização: quanto maior a inteligência,
maior a motivação para a realização.
Temos então uma teoria da realização escolar, que pode ser boa
ou má, dependendo de quão bem explique a realização escolar. É bas
tante testável. Todas as variáveis são suscetíveis de mensuração satisfa
tória (embora uma teoria não tenha necessariamente que ter apenas
variáveis mensuráveis) e há técnicas analíticas que podem permitir testes
bastante claros das relações especificadas na teoria.
Outras finalidades da ciência, além da teoria e explicação, foram
propostas. Não precisamos elaborar as mais técnicas destas, pois geral
mente já são dedutíveis da teoria como propósito. Há um alegado pro
pósito da ciência, entretanto, que dá muitos problemas e que confundiu
um bocado a compreensão clara da finalidade da ciência. Essa alegada
finalidade está contida em afirmações como as que se seguem, todas
elas estreitamente relacionadas: “ A finalidade da ciência é melhorar o
destino do homem” ; “ A finalidade da psicologia e sociologia é ajudar
a melhorar a sociedade humana” ; “ A finalidade da pesquisa educacional
é melhorar a prática e o pensamento educacional” . Sem dúvida, os
sentimentos por detrás de tais afirmativas são fortes — e não é de se
admirar. Parece óbvio que a finalidade da ciência é melhorar o destino
do homem; parece tão auto-evidente!
A confusão, sem dúvida, surgiu porque os efeitos dos progressos
científicos muitas vezes aumentaram o bem-estar do homem — mas
também feriram o bem-estar humano — principalmente através de aper
feiçoamentos tecnológicos possibilitados por pesquisas e descobertas
científicas desinteressadas. Mas isto não significa que o propósito da
ciênica seja melhorar o bem-estar humano, assim como seu propósito
não é ajudar a promover guerras. Uma interpretação mais exata é que a
melhoria da vida pode ser subproduto da ciência, um produto afortu
nado, embora não necessário das descobertas e do trabalho científico.
19
Há um parodoxo aqui. Parece óbvio que o propósito da ciência é
melhorar a humanidade. Entretanto, é uma posição perigosa porque
conduz, entre outras coisas, a distorções. As distorções resultam de duas
ou três razões. Uma, a mistura de forte compromisso e a exigência de
programas sociais e políticos, por um lado, e a pesquisa científica de
problemas de tais programas, por outro, parecem induzir preconceitos
e o que foi chamado percepção seletiva. Isto significa que vemos o que
desejamos ou precisamos ver em vez do que realmente existe. Esta
tendência é tão forte que quase cheguei ao ponto de pensar que cien
tistas comportamentais não deveriam pesquisar coisas que advogam
apaixonadamente. Ou melhor, quando pesquisarem, devem criar e usar
salvaguardas excepcionalmente elaboradas contra suas próprias incli
nações.
Uma segunda razão para distorções é que tendemos a confundir
missões sociais e científicas e isto leva a distorcer o que vemos, a des
gastar nossa objetividade e, mais importante, nosso compromisso com
a objetividade. O desgaste do compromisso com a objetividade é peri
goso para um cientista, pois, como já ficou dito, a objetividade é uma
característica científica inconfundível e indispensável. Sua perda destrói
a própria ciência.
Voltando ao argumento principal, a ciência e a pesquisa científica
são absolutamente neutras. Os resultados de pesquisas científicas podem
e são usados tanto para bons propósitos quanto para maus. Fazemos uso
de bombas atômicas, instrumentos de destruição baseados na teoria
científica, pesquisa em física e campos relacionados; usamos também
descobertas atômicas para a dessalinização da água, para a criação de
energia praticamente ilimitada, e assim por diante. Bondade e maldade,
melhora e deterioração, felicidade e sofrimento humanos, são assuntos
para as pessoas que resolveram fazer certas coisas que têm boas ou más
conseqüências, que melhoram ou pioram as coisas, que promovem a
felicidade humana ou que aumentam seu sofrimento. Naturalmente os
resultados da ciência podem ser usados para ajudar a tomar tais deci
sões, e os cientistas, como seres humanos, podem participar na tomada
de decisões, mas a ciência em si, estritamente falando, não tem nada
a ver com as decisões. Isto porque a preocupação da ciência — e é a
única atividade humana em larga escala cuja preocupação é tão desin
teressada — diz respeito apenas à compreensão e explicação de fenô
menos naturais.
Enfatizo fortemente a finalidade da ciência desta forma porque a
concepção errada exposta acima, levada ao extremo lógico de colocar
o bem-estar humano como finalidade fundamental da ciência, conduz
finalmente a um desgaste da própria ciência e à conseqüente diminuição
da compreensão dos fenômenos físicos e humanos. O último capítulo
20
deste livro examinará novamente este problema com mais detalhes. O
motivo por que o propósito da ciência como teoria foi enfatizado aqui
é que a tentativa de sua aceitação a esta altura muito nos ajudará a
compreender o conteúdo deste livro. Esta ênfase nos manterá ligados à
essência e à natureza da ciência e não nos permitirá sermos distraídos
por considerações estranhas. Por exemplo, se falarmos do chamado
subaproveitamento de crianças brilhantes, vamos poder focalizar a com
preensão do aproveitamento ao invés de remédios específicos para o
problema. Ao fazer isto, naturalmente, já teremos assumido que a com
preensão científica do problema pode aumentar as possibilidades nossas
e dos outros de encontrar soluções práticas para o problema.
21
2. Conceitos comportamentais científicos e
definições
Variáveis
22
algumas vezes exibe inteligência. Não é fácil ver o que “ agressão” repre
senta. Para o psicólogo, “ agressão” pode significar um estado interior
que predispõe a pessoa a certos tipos de comportamentos chamados
“ agressivos” . Para o pesquisador psicológico, entretanto, “ agressão”
significa tipos diferentes de comportamentos que têm as características
de ferir outros ou a si próprio, física e psicologicamente. Devem ser
bastante específicos; devem definir “ agressão” especificando de alguma
forma o que são comportamentos “ agressivos” . Fazem isto para poderem
medir ou manipular a “ agressão". A idéia de “ variável” deve ficar clara
depois que examinarmos tipos e exemplos de variáveis.
23
a um grupo de crianças um reforçamento maciço e a um segundo grupo,
reforçamento regular. Esta manipulação, com efeito, cria uma variável.
Sempre que os pesquisadores preparam condições experimentais, eles
criam variáveis. Nós chamamos tais variáveis variáveis experimentais ou
variáveis manipuladas. Pode-se demonstrar que elas satisfazem a defini
ção dada acima, embora não façamos isto aqui.
Há, então, três tipos gerais de variáveis na pesquisa comporta-
mental: variáveis categóricas, variáveis medidas e variáveis experimen
tais ou manipuladas. O reforçamento, no estudo de Clark e Walberg, é,
como ficou dito, uma variável experimental. Classe social (classe média
e trabalhadora) no estudo de Miller e Swanson sobre classe social e
criação dos filhos, descrito no capítulo 1, é uma variável categórica.
Exemplos de variáveis medidas são inteligência, ansiedade, autoritarismo,
aptidão verbal e realização escolar. São chamadas variáveis medidas
porque são “ medidas” com um teste ou outro instrumento que produz
resultados que vão de altos a baixos.
24
Outros tipos de variáveis
25
Relações
Estudos e experimentos
26
dizer, simplesmente, que os sujeitos são designados para os grupos
experimentais de tal forma que qualquer um possa se tornar membro
de qualquer grupo, sem ser possível dizer de qual grupo ele participará.
É possível fazer-se um experimento sem designação aleatória, embora
não seja desejável. Vamos deixar o assunto de designação aleatória para
o capítulo 6, porque o assunto exige explicações mais completas e
detalhadas.
A segunda característica básica de um experimento foi mostrada
no capítulo 1 — manipulação. Agora podemos ser mais precisos: mani
pulação de variáveis independentes. (Variáveis dependentes quase nunca
são manipuladas.) Repetmrio: isto significa mie o pesquisador faz coisas
diferentes com grupos diferentes de indivíduos. Suponhamos que eu
ensine quatro grupos de alunos do quarto ano com quatro métodos dife
rentes. Isto é uma manipulação. Suponhamos que eu queira estudar os
efeitos dos tipos de tomada de decisão na produtividade do grupo. Tenho
um grupo de 90 pessoas que divido em 3 grupos de 30, denominando-os
Ai, Á2 e A3. As pessoas do grupo Ai terão o máximo de oportunidades
de participar das decisões do grupo (as quais são uma parte da manipu
lação), as do grupo Ao uma ou outra oportunidade de participar,
e as do grupo A3 nenhuma oportunidade. Isto também é uma ma
nipulação.
A manipulação experimental varia da mais simples à mais com
plexa. A manipulação da variável independente de Clark e Walberg foi
simples: dois grupos, um recebendo reforçamento maciço, o outro, re
gular. Para que o leitor não pense que toda ou mesmo a maioria das
manipulações se limitam a dois grupos, examinemos uma ligeira exten
são da manipulação até três grupos. Aronson e Mills (1959), num inte
ressante experimento sócio-psicológico, testaram a idéia de que quanto
mais dificuldade se encontrar para entrar em um grupo, mais os mem
bros deste grupo darão valor a ele. Os membros de um grupo receberam
uma iniciação severa, os de outro, uma iniciação suave e aos membros
do grupo restante não se exigiu nada para se tornarem membros do
grupo (o “ grupo de controle” ). (A manipulação incluiu a leitura, por
jovens do sexo feminino, de palavras que variavam em termos de
obscenidade.) Foi predito que os membros do primeiro grupo valoriza
riam mais a participação no grupo, os membros do segundo, um pouco
menos, e os do terceiro — o grupo de controle — valorizariam menos
ainda. (A expectativa foi c.ontirmada pelos resultados.) Isto também é
uma manipulação: foram feitas coisas diferentes sistematicamente com
os três grupos. As virtudes e outras características deste poderoso método
de obter conhecimento serão exploradas mais tarde. Veremos também
que é perfeitamente possível manipular mais do que uma variável inde
pendente por vez.
27
Há vários tipos de estudo científico. Um experimento é apenas um
deles. Todos os outros são não-experimentais. Um levantamento de
opiniões é não-experimental. Assim é toda a investigação das relações
entre variáveis quando não há manipulação. O estudo de Miller e
Swanson sobre classe social e criação de filhos é um exemplo. Não
foi um experimento porque não houve manipulação de uma variá
vel independente. Freqüentemente a distinção é mal entendida. Estudos
que são não-experimentais são às vezes chamados experimentos. Entre
tanto, a distinção é muito importante porque as conclusões de um expe
rimento bem conduzido geralmente são mais fortes do que as conclusões
de um estudo bem conduzido que não seja um experimento. Voltaremos
a esta distinção no capítulo 8 .
Dados
28
Apesar de seu uso específico, "dados” também se refere a quase
qualquer evidência obtida em pesquisas. Pode-se até afirmar que "dados”
e “ evidência” são usados quase como sinônimos. As observações feitas
por ministérios de educação e anotadas sob determinada forma são cha
madas “ dados” . Saídas de computador são chamadas "dados” . Pontos
obtidos em testes são chamados “ dados” .
Variação e variância
29
e relacionados através das suas variações. O que significa esta afirmação
ligeiramente estranha? Virtualmente nenhum conhecimento científico
seria possível se o fenômeno não variasse. O psicólogo não poderia
estudar a inteligência se a inteligência das pessoas não variasse. O soció
logo não poderia estudar classes sociais e suas relações com outras
variáveis se as pessoas e grupos não diferissem em classes sociais. Diz-se
que um grupo de pessoas, por exemplo, alunos de quarta série, é alta
mente variável em inteligência. Outra maneira de dizer isto é: a variância
de inteligência da classe é grande. Por outro lado, a variância de inteli
gência de um grupo de candidatos ao doutorado pode ser pequena. Se
por ora o leitor puder confiar na veracidade destas afirmações sobre
variação, vamos apoiar esta confiança con razões em um capítulo
posterior.
Embora não se discuta bastante estatística neste livro, é imperativo
que conheçamos alguns termos estatísticos e seu significado geral.
“ Variância” é um termo tanto estatístico quanto geral. É geral enquanto
significa a variabilidade do fenômeno, como discutido acima. Os cien
tistas comportamentais usam-no muito desta forma. “ Variância” é tam
bém uma medida estatística que expressa a variabilidade de qualquer
conjunto de medidas, e, assim, indiretamente, de qualquer conjunto de
indivíduos. 2 Os cientistas comportamentais falam muito sobre a va
riância de um fenômeno ou sobre a variância de uma variável afetada
pela variância de outra variável. O pesquisador educacional poderá' per
guntar: “ Quanto da variância de realização é devida à variância de inte
ligência, à variância de motivação, à variância de background familiar?”
Isto é simplesmente uma maneira resumida e semitécnica de dizer: “ As
crianças de alto grau de inteligência têm alta realização e as crianças de
inteligência inferior têm baixa realização? As crianças com alta motiva
ção se saem bem e as crianças com baixa motivação não se saem bem?
Crianças de ambiente familiar favorável se saem bem, enquanto
crianças de ambiente familiar desfavorável não se saem bem?
Esta é uma maneira de dizer que as variáveis covariam, variam
juntas de modos sistemáticos. Assim, os pesquisadores falam freqüente-
mente em covariância, um termo técnico que significa a variância com
partilhada por duas ou mais variáveis. Olhe novamente para a figura 1.1.
A parte sombreada representa a covariância ou a variância compartilhada
pelas duas variáveis.
Olhe os números na tabela 2.1. Os dois grupos de números em I
covariam perfeitamente. Os dois grupos de números, a e b, são os
mesmos: para um número alto em a, há um número alto em b; para
2 Uma -discussão técnica e geral do termo, das idéias por detrás dele e de como é
usado, pode ser encontrada em Kerlinger (1973, cap. 6).
30
Tabela 2.1 Três conjuntos de pares de postos* expressando covariâncias e
relações diferentes.
I II ui
a b a b a b
i 1 i 5 i 3
2 2 2 4 2 5
3 3 3 3 3 1
4 4 4 2 4 4
5 5 5 1
•rj 5 2
Alto Alto Baixo
Positivo Negativo
Probabilidade
31
de desassossego e ansiedade em nós induzidos pela incerteza do nosso
mundo. Eles nos oferecem um credo ou uma pessoa a seguir cegamente,
com promessas de grandes recompensas.
A ciência e a pesquisa comportamental não nos oferecem certeza.
(Nem a ciência natural!) Não oferece nem mesmo certeza relativa.
Oferece apenas conhecimento probabilístico: Se A for feito, então pro
vavelmente B ocorrerá. A afirmativa usada antes, "A frustração leva à
agressão.” , é na verdade incorreta. Uma afirmativa mais correta é: “ A
frustração provavelmente leva à agressão” . Uma maneira de definir a
pesquisa comportamental pode ser dizer que ela é um meio de ajudar a
reduzir a incerteza. A pesquisa empiricv jamais pode nos dizer que
alguma coisa é certamente assim. Pode, entretanto, dizer: “ As probabi
lidades de tal coisa ser assim ou a.«sado são de 7 ) para 30” .
A probabilidade e o pensamento probamiísnco são o núcleo da
moderna ciência e pesquisa comportamental. Infelizmente, é difícil defi
nir a probabilidade satisfatoriamente. Vamos usar uma abordagem
intuitiva, como sempre, mas o leitor fica avisado de que pode desa
gradar os especialistas. A probabilidade de um acontecimento é o número
de casos “ favoráveis” dividido pelo número total de casos (igualmente
possíveis). (“ Caso favorável” significa qualquer resultado estipulado ou
previsto.) Seja f = número de casos favoráveis. E p = número de
casos favoráveis dividido pelo número total de casos, N. Seja o caso
favorável à ocorrência de cara no lançamento de uma moeda. Então p é
a proporção de caras em N lançamentos, ou p = f/N . Já que há duas
possibilidades no lançamento de uma moeda, p = 1/ 2. O caso ou evento
favorável pode ser o 6 do dado. Então, p '= 1/6: a probabilidade de
ocorrer um 6 é 1/6. Se houver 50 homens e 50 mulheres em determinada
amostra de 100 pessoas, a probabilidade de escolher um homem (ou
mulher) é 50/100 = 1/2 (num processo de seleção imparcial).
Isto tudo é muito simples. Mas a probabilidade pode ser complexa.
Nossa preocupação aqui, entretanto, é apenas com a compreensão preli
minar e intuitiva. Em geral, o leitor precisa compreender que todos os
enunciados científicos são probabilísticos. Sempre há incerteza. As ciên
cias naturais oferecem maior certeza do que as comportamentais. Aliás,
todas as disciplinas científicas são mais ou menos incertas. Todas as afir
mativas, em outras palavras, vêm acompanhadas com um valor p implícito
ou explícito. É por isso que a bibliografia da ciência comportamental
fala tanto em “ tendências” .
O leitor não deverá ficar muito preocupado se não apreendeu com
pletamente os termos e expressões dados acima. Leva-se tempo para
acostumar-se a eles. O que precisamos a esta altura é uma familiaridade
geral. As lacunas serão preenchidas mais tarde. Em todo caso, agora
temos suficientes definições para continuarmos com a discussão principal.
32
3. Problemas, hipóteses e variáveis
33
“ precisa” , “ deve” . Elas pedem julgamento das coisas a serem avaliadas.
“ Qual é o melhor (mais eficiente, mais desejável e assim por diante)
jeito de fazer isto ou aquilo?” é uma questão de valor. Assim como “ O
método A é melhor que o método B para alcançar igual oportunidade
educacional?” As proposições ou enunciados de valor são semelhantes,
só que são sentenças afirmativas em vez de interrogativas. Exemplos:
“ A avaliação dos professores, pelos alunos, ajudará a melhorar o
ensino” ; “ É errada a discriminação contra as minorias” ; “ Não matarás” ;
“ O professor precisa compreender as necessidades do aluno” . A quali
dade de julgamento e os imperativos morais contidos nestas afirmativas
são óbvios. Mais importante, não há modo de testar tais afirmativas
empiricamente. O enunciado “ É errada a discriminação contra as mino
rias” , por exemplo, não afirma relação ou implicação de relação entre
variáveis que possa ser testada; apenas dá um julgamento moral sobre
uma prática social.
A ciência, como ciência, não pode então dar respostas a questões
de engenharia e valor porque não pode testar tais proposições e mostrar
sua correção ou incorreção. Quando alguém me diz que religião é uma
boa coisa, eu só posso concordar ou discordar — amar ou odiar meu
interlocutor, fazer paz com ele ou lutar. Não posso, como cientista,
sujeitar a afirmativa a um teste empírico, principalmente porque ela
contém um julgamento humano — algo é “ bom” — e a ciência é e
sempre foi estúpida em questão de julgar qualquer coisa.
Pode ser dito, por enquanto, que proposições testáveis contêm
variáveis que podem ser medidas ou manipuladas ou que implicam tais
medições e manipulações de variáveis. Aqui estão três proposições testá
veis, uma delas já bem familiar: “ A frustração produz agressão” ;
“ Quanto maior a coesão de um grupo, maior influência tem sobre seus
membros” ; “ As condições das favelas produzem delinqüência” . Observe
que estes enunciados têm variáveis que podem ser medidas ou mani
puladas: frustração, agressão, coesão de grupo, influência, condições de
favela, delinqüência. Quando se diz que estes enunciados são testáveis,
isso não implica que eles são “ bons” enunciados que levam à “ boa”
pesquisa científica. A única coisa que se quer dizer é que de alguma
forma são capazes de ser provados corretos ou incorretos, pela evidência.
Proposições de valor e de engenharia, então, não são cietificamente
testáveis. Há outros tipos de proposições que não são testáveis e que
são muito difíceis de ser categorizadas. Sua característica comum parece
ser a falta de clareza e uma espécie de virtude. Eis alguns exemplos:
“ A doença é uma manifestação da vontade de Deus” ; “ As práticas e as
instituições democráticas combinam peculiarmente com o ethos do povo
americano” ; “ A harmonia racial depende da compreensão mútua” ; “ A
maturidade humana depende da auto-atualização” . Para o cientista, tais
34
enunciados têm pouco ou nenhum significado. Naturalmente, têm signi
ficado para religiosos, políticos, pais, professores e novelistas, mas se
mantêm além do alcance da ciência.
Tais questões, propostas desta forma, não são testáveis, ou porque
lhes falta a forma de questões ou proposições testáveis (que discutire
mos mais tarde) ou porque a linguagem em que são expressas é tão
vaga que as torna cientificamente intratáveis. Eis outro exemplo da
educação. Ê um problema que, embora tenha intrigado e importunado
os pesquisadores de educação durante meio século, é virtualmente
irrespondível cientificamente, pelo menos desta forma: “ O que faz um
professor bem sucedido?” Para muitos educadores, isto pode não parecer
um problema. Eles acham que sabem a resposta; acham que sabem o
que é um professor bem-sucedido. Até agora, entretanto, o problema
não foi resolvido — num sentido científico.
Há diversas razões pelas quais ainda não foi resolvido. Para come
çar, a questão é inútil porque não há o enunciado de uma relação entre
variáveis. Portanto, não pode ser testada ou respondida cientificamente.
(Com toda a honestidade, talvez jamais seja respondida.) Por outro lado,
o problema é extremamente complexo: tem inúmeras facetas que não
são imediatamente aparentes, tornando-se difícil lidar com elas. Por
éxemplo, o que se quer dizer com “ bem sucedido” ? Bem sucedido em
conseguir que os alunos aprendam, será? Aprender o quê? O que signi
fica “ aprender” ? O “ sucesso” está ligado a certas características pessoais
e profissionais dos professores? Ao que os professores realmente fazem
em classe? Às suas atitudes? “ Bem sucedido” também implica “ mal
sucedido” . O que significa um professor mal sucedido? Este “ mal su
cedido” significa o oposto de “ bem sucedido” ? Ou é diferente apenas?
Ou “ mal sucedido” é uma idéia tão complexa quanto “ bem sucedido” ?
Em resumo, temos aqui uma questão complexa cuja dificuldade
não foi percebida. É de se admirar, então, que não tenha sido resolvida?
Problemas
35
realização em leitura entre crianças negras carentes?” O problema geral
do estudo de Miller e Swanson pode ser colocado: “ Mães de diferentes
classes sociais usam tipos diferentes de criação?” Um problema mais
específico (Ver tabela 1.1) é: “ O tempo de desmame de crianças difere
nas classes média e trabalhadora?” Estes problemas são bem específicos;
e, naturalmente, podem ser apresentados de maneira mais geral.
Há muitos anos Hurlock (1925) perguntou: “ Qual é o efeito de
diferentes tipos de incentivo no desempenho dos alunos?” Este problema
é mais geral. Eis outro (Etzioni, 1964): “ O conflito aumenta ou impede
a eficiência de organizações?” Um interessante problema sócio-psicoló
gico foi apresentado por Frederiksen, Jensen e Beaton (1968): “ Como
o clima organizacional afeta o desempenho administrativo?” Berkowitz
(1959) fez esta importante pergunta: “ Sob condições de deflagração
de hostilidade, como o anti-semitismo influi no deslocamento da agres
são?” Ou, quando frustradas, pessoas altamente anti-semitas exibem
comportamentos mais agressivos em relação aos outros, que pessoas
menos anti-semitas?” Em seu importantíssimo estudo inter-cultural sobre
“ categorias naturais” de cognição, Rosch (1973) fez a seguinte pergunta:
“ Protótipos naturais de cor e forma facilitam a aprendizagem de cate
gorias de cor e forma?” 1
Repetindo, um problema de pesquisa científica em primeiro lugar
é uma questão, uma sentença em forma interrogativa. Segundo, uma
questão que geralmente pergunta alguma coisa a respeito das relações
entre fenômenos ou variáveis. A resposta à questão é procurada na pes
quisa. Clark e Walberg, baseando-se em suas descobertas, puderam afir
mar que o reforçamento maciço melhorava á leitura de crianças negras
carentes. Miller e Swanson puderam afirmar que as mulheres da classe
média tinham tendência a desmamar seus filhos mais cedo que as mães
da classe trabalhadora.
Três critérios de bons problemas de pesquisa e proposições de pro
blemas podem ajudar-nos a compreender problemas de pesquisa. Pri
meiro, o problema deve expressar uma relação entre duas ou mais
variáveis. Pergunta: “ A está relacionado com B ?” “ Como A e B estão
relacionados com C ?” Embora haja exceções neste critério, são raras.
Segundo, o problema deve ser apresentado em forma interrogativa. A
interrogação tem a virtude de apresentar o problema diretamente. No
exemplo de Hurlock, dado acima, o problema é apresentado diretamente
pela pergunta sobre a relação entre incentivos e desempenho.
O terceiro critério é mais complexo. Exige que o problema seja
tal que implique possibilidades de testagem empírica. (Veja “ O Caráter
36
Empírico da Ciência” no capítulo 1.) Testagem empírica significa que
seja obtida evidência real sobre a relação apresentada no problema.
Obter evidência na questão incentivos-desempenho de Hurlock signi
fica manipular (ou medir) incentivos, medir o desempenho do aluno e ava
liar o suposto efeito do incentivo sobre o desempenho. Às vezes é difícil
dizer claramente que o problema tem implicações de testagem empírica.
Entretanto, é preciso fazer a distinção para que a pesquisa tenha possi
bilidade de dar certo. As principais dificuldades com questões não-tes-
táveis são o fato de não serem enunciados de relações (“ O que é o
conhecimento?” “ Como se deve ensinar a ler?” ), ou seus constructos ou
variáveis serem difíceis ou impossíveis de definir de maneira a poderem
ser manipulados ou medidos. Isto geralmente funciona com questões de
valor e moral, questões que indagam sobre o certo e o errado das coisas,
suas qualidades ou defeitos ou sua desejabilidade ou indesejabilidade.
Vamos nos concentrar novamente em juízos de valor. Tomemos afirma
tivas como: “ A democracia é o melhor de todos os sistemas de governo” :
“ Igualdade é tão importante quanto liberdade” e “ O casamento é bom” .
São juízos de valor; não são testáveis cientificamente. A não-testabilidade
de juízos de valor já foi discutida, mas a distinção entre juízos de valor
e enunciados empíricos ou testáveis é tão importante que devemos exa-
miná-la de novo um pouco mais analiticamente.
Dizer que alguma coisa é boa ou má, melhor ou pior, é dar um
julgamento humano. Só o homem pode dizer que uma coisa é boa ou
má — e não se discute. Nenhum procedimento científico pode conter
uma resposta sobre a relativa desejabilidade de uma coisa. As afirma
tivas científicas dizem simplesmente: “ Se isto for verdade, então pro
vavelmente acontecerá aquilo” ; “ Se se frustram as pessoas, elas prova
velmente agredirão outras, agredirão objetos ou elas próprias” . Tais
afirmativas não têm comprometimento com virtude ou defeito, desejabi
lidade ou indesejabilidade, valor moral ou falta de valor moral. Nem
podem fazer tal comprometimento. Na verdade, o cientista, como pessoa,
pode fazer tal julgamento — e pode ser sábio ou tolo como qualquer
um — mas ao fazer isto ele sai fora de seu papel de cientista.
É neste sentido que a ciência é neutra. Não é neutra por haver
alguma virtude especial em ser neutra. É simplesmente a natureza da
ciência, que está em testar relações empíricas entre fenômenos ou variá
veis — e, para fazer isto, exige que o fenômeno seja de natureza a ser
observado, manipulado ou medido. Enquanto o cientista pode estudar
valores, como valores, e sua relação com outros fenômenos — por
exemplo, ele pode estudar como a posse de certos valores econômicos
influencia a maneira de as pessoas votarem (“ O capitalismo é bom” ,
“ A propriedade privada é sagrada” ) — ele não pode estudar proposi
ções que incluam julgamentos éticos ou morais. Simplesmente não há
37
maneira de chegar aos referentes empíricos de palavras como “ deveria” ,
“ conviria” , “ bom” , “ mau” e “ precisaria” .
Hipóteses
38
dida com um ou mais dos muitos testes disponíveis de capacidade
mental ou de deficiência mental. Naturalmente pode surgir um problema
difícil em decidir o que é ou não é “ deficiência” . Mas o que interessa
aqui é determinar se a variável pode ser medida.
A hipótese “ Privação na infância produz deficiência mental mais
tarde” é uma hipótese porque enuncia uma relação conjetural entre
variáveis que podem ser manipuladas ou medidas. A relação é expressa
pela palavra “ produz” . Uma palavra ou expressão de relação une de
alguma forma as variáveis: “ produz” , “ está positivamente relacionada
a” , “ é uma função de” , e assim por diante. Um modo melhor de com
preender todas estas afirmativas, entretanto, é traduzi-las todas para
enunciados “ se-então” . Embora não haja regras fixas para se escrever hi
póteses — há várias espécies, todas legítimas e úteis — a maioria pode
ser colocada na forma se-então: “ Se p, então q” , p e q sendo contructos
ou variáveis. “ Se frustração, então agressão” ; “ Se privação na infância,
então deficiência na realização escolar mais tarde” ; “ Se reforçamento,
então aumento na aprendizagem” . Em todos estes enunciados duas va
riáveis estão ligadas entre si como as palavras “ se” e “ então” . Colocado
muito simplesmente, uma hipótese é quase sempre um enunciado de
uma relação, a natureza da relação sendo especificada até certo ponto
pela estrutura se-então do enunciado.
Consideramos hipóteses com duas variáveis apenas. Na pesquisa
comportamental moderna, entretanto, é mais provável haver mais de
duas variáveis. As hipóteses serão então: “ Se p, então q, sob as condi
ções r e s” . Se incentivo positivo (p), então aprendizagem aumentada
(q), dado sexo feminino (r) e classe média (s). Outra maneira de simbo
lizar esta hipótese é: “ Se p, e p2 e p3, então q” ; “ Se incentivo positivo
(p,) e sexo feminino (P2) e classe média (P3), então aumento na apren
dizagem (q)” . Voltaremos mais tarde aos problemas multivariáveis, ou
“ mui tivariados” . São muito importantes.
Em resumo, hipóteses são enunciados conjeturais de relações e são
estas conjeturas que são testadas na pesquisa. Vejamos agora por que
as hipóteses são importantes.
39
discutido no capítulo 1. Isto quer dizer que as hipóteses são uma fer
ramenta poderosa para o avanço do conhecimento porque, embora for
muladas pelo homem, podem ser testadas e mostradas como provavel
mente corretas ou incorretas à parte dos valores e crenças do homem.
Naturalmente, os cientistas querem que suas idéias sobre a realidade
concordem com a “ realidade” .
Um psicólogo social, por exemplo, pode acreditar que um método
por ele criado de lidar com o preconceito, chamado método K, seja mais
eficiente do que outros em diminuir, o preconceito. Ele acha que se K
fosse usado sistematicamente em escolas de segundo grau e em univer
sidades, ajudaria a reduzir o preconceito contra as minorias onde quer
que fosse usado. Ele está dizendo que o método K é mais eficiente do
que outros métodos e mais eficiente do que não fazer nada. Se ele for
testar sua crença cientificamente, ele terá que achar um meio de ficar
de fora de sua crença, saindo para fora de si mesmo. As hipóteses aju
dam a fazer isto. O psicólogo social pode formular uma hipótese de que
o método K, depois de uso suficiente, resultará em maior diminuição de
preconceito do que, digamos, os métodos L e M (e talvez outros mé
todos ou nenhum método).
A hipótese agora é uma afirmativa “ lá fora” , independente do pes
quisador. Está “ fora dele” no sentido de que, apesar de sua crença
pessoal, predileções e inclinações — sua aversão pelo preconceito, por
exemplo — pode ser testada fora de suas crenças, predileções e vieses.
Embora esteja pessoalmente a favor do método K, sua crença de que o
método K seja superior não pode afetar o teste da hipótese e o resultado.
Assim, as hipóteses são meios especialmente potentes de preencher obje
tivamente as lacunas entre uma crença pessoal e a realidade empírica.
São ferramentas para testar a realidade e podem ser mostradas como
provavelmente corretas ou incorretas, independentemente do investigador.
As hipóteses têm outras virtudes. Uma delas é que podem ser, e
frequentemente são, deduzidas da teoria. Qualquer teoria de importância
terá um número de implicações empíricas que podem ser deduzidas
dela. Foi escrito um livro inteiro (Dollard, Doob, Miller, Mowrer & Sears,
1939) sobre as implicações da hipótese geral de que a frustração produz
agressão. Na verdade, esta hipótese geral é bastante ampla para ser o
enunciado básico de uma teoria, a teoria da agressão. Tem implicações
empíricas. Por exemplo, se frustrarmos as crianças, elas agredirão outras
crianças, adultos ou elas próprias. Dollard e seus colegas até salienta
ram que se podem deduzir implicações marxistas da hipótese geral: “ Se
o trabalhador for explorado (recebendo salários baixos, trabalhando
horas extras e assim por diante), ele ficará frustrado. Se continuar frus
trado por um longo período, ele acabará se revoltando e destruindo seu
frustrador, a burguesia” . A questão é que qualquer teoria, se realmente
40
for uma teoria, terá muitas implicações para serem testadas; ela gerará
(com ajuda, naturalmente) muitas hipóteses testáveis. Sem dúvida é
assim que as teorias são testadas.
Hipóteses e testabilidade
41
assumindo que indiquem repressão? Embora o assunto seja muito mais
complexo, espero que um pouco da essência da dificuldade tenha sido
transmitido.
As relações da teoria, então, não podem ser testadas satisfatoria
mente, pelo menos por enquanto, porque os constructos que entram nas
relações, os p e q dos enunciados se p, então q, não podem ser levados
ao nível de operação empírica. Isto não significa, como já se disse, que
as idéias de Freud não sejam científicas. Tal enfoque é simplificado
demais. Pode-se deduzir muitas hipóteses testáveis da teoria de Freud.
E talvez até os conceitos freudianos mais difíceis finalmente se renderão
à habilidade científica.
42
A semelhança de crenças influi mais em aceitar os outros que a
semelhança de raça? (Rokeach & Mezei, 1966). Este problema tão
controvertido, pergunta, com efeito, se a semelhança de crença é mais
poderosa do que a semelhança (e diferença) de raça em influenciar as
pessoas a aceitarem outras. Se um branco concorda com as crenças de
um negro, ele irá aceitá-lo mais do que aceitaria um branco de cujas
crenças ele discordasse? Se for conservador, por exemplo, ele aceitará
os conservadores negros em geral mais do que aceitaria brancos liberais?
São perguntas fascinantes, difíceis de responder. Temos aqui um pro
blema que é enunciado implicando termos quantitativos, já que vamos
usar “ mais” . (Parece que a resposta é Sim, crença é mais importante
do que raça, mas não em todas as circunstâncias.)
Já foi dito que muitos, talvez a maioria dos problemas da pesquisa
comportamental, têm mais que uma variável independente. Aqui está
um enunciado de problema com três variáveis independentes: Como a
aptidão acadêmica, a realização no ginásio e o nívfel de aspiração influen
ciam a realização acadêmica? (Worell, 1959). Tais problemas com múl
tiplas variáveis estão mais próximos da realidade psicológica e social;
eles refletem com mais nitidez as complexas estruturas causais dos fenô
menos, neste caso, a realização acadêmica.
Eis uma hipótese derivada do primeiro problema dado acima. “ A
prática em uma função mental não tem efeito sobre a futura aprendiza
gem desta função mental” (Gates & Taylor, 1925). Observe a estrutura
se p, então q da hipótese: “ Se prática numa função mental, então (não)
futura aprendizagem da função mental” . Observe também a forma nega
tiva da hipótese: “ A prática (treino) não tem efeito” . Isto é raro. A
maioria das hipóteses especifica alguma direção do efeito. (A hipótese
foi corroborada.)
Uma hipótese mais convencional: “ Indivíduos que têm papéis
ocupacionais iguais ou semelhantes terão atitudes semelhantes em rela
ção a coisas significativamente relacionadas ao papel ocupacional” . Isto
significa, por exemplo, que os médicos manterão crenças e atitudes
semelhantes em relação a assuntos médicos. Se a hipótese for apoiada
pela evidência, concluímos que a maioria dos médicos pensa igual no
que se refere a cuidados médicos.
Nossa hipótese final é uma hipótese que vem sendo cada vez mais
testada na pesquisa comportamental contemporânea: “ Pessoas anti-semi
tas deslocarão agressão para outros quando sua hostilidade estiver
deflagrada” (Berkowitz, 1959). Aqui há duas variáveis — anti-semitismo
e deflagração de hostilidade — que levam ao deslocamento da agressão.
A hipótese diz que o anti-semitismo “ produzirá” agressão deslocada
apenas sob a circunstância de deflagração de hostilidade. Isto é, a estru
tura do argumento é: Se p, então q, dado r; ou Se anti-semitismo, então
43
Figura 3.1
Variáveis
Obviamente, variável é uma coisa que varia, que tem valores dife
rentes. Medimos, digamos, o nível de aspiração de um grupo de crianças.
Para cada criança obtemos uma nota, algum tipo de número. Dizemos
44
que medimos a variável “ nível de aspiração” . Embora intuitivamentè
atraente, até instrutiva, esta definição não é realmente uma definição.
E também não é exata.
Uma variável é um símbolo ao qual são atribuídos algarismos.
Exemplos de tais símbolos são A, x, M ou inteligência, nível de aspira
ção, ansiedade. A variável x pode assumir um conjunto dé valores numé
ricos, por exemplo, pontos obtidos em um teste de inteligência ou de
leitura. A variável A pode assumir os valores a,, a> e a?„ e assim por
diante, que podem representar os valores numéricos obtidos por uma
médida de atitude feita com uma escala de sete pontos. Podemos obter
os resultados de atitude de quatro indivíduos: a, = 6, a2 = 3, as = 5,
ai, — 4. A é uma variável. Se quisermos, podemos dar-lhe o nome de
Atitude em relação às mulheres.
Esta definição de variável é simples e geral, embora um pouco
afastada do senso comum. É geral porque abrange todos os casos conce
bíveis e tipos de variáveis. E, embora seja um tipo de definição que não
pertence ao senso comum — pode parecer estranho até — não é nada
complicada e é fácil de entender. Há símbolos que podem ser letras dc
alfabeto, palavras ou expressões curtas: X, Y, A, K, inteligência, atitudes
em relação às mulheres, ansiedade, classe social, nível de aspiração,
retenção, preferência religiosa, renda e assim por diante. Logicamente,
variáveis são propriedades que tomam valores diferentes. Algumas variá
veis podem ter muitos valores, até um número infinito (teoricamente;
por outro lado, variável podem ter um mínimo de dois valores. 3 Inteli
gência, retenção, atitudes em relação às mulheres, podem ter vários valo
res. Sexo tem apenas dois valores, geralmente 1 e 0, 1 sendo designado
para um sexo e 0 para o outro. Morto-vivo, empregado-desempregado
são também variáveis de dois valores ou dicotômicas. Classe social,
geralmente, tem dois, três ou quatro valores. Preferência religiosa é um
tanto diferente. Embora seja uma variável chamada nominal ou cate
górica (veja abaixo), os valores a ela atribuídos são invariavelmente 1 e 0,
mas por enquanto não vamos mostrar como isso é feito.
Antes de mudarmos de assunto, devemos observar que variáveis
são também conceitos e constructos. Um conceito é, naturalmente, um
termo geral que expressa a suposta idéia central por trás de objetos
particulares relacionados. Quando os cientistas falam sobre os conceitos
usados em seu trabalho, chamam-lhes freqüentemente “ constructos” .
“ Constructo” é um termo útil porque indica a natureza sintética das
variáveis psicológicas e sociológicas. Expressa a idéia de que os cientistas
3 É possível, por definição, uma variável ter só um valor. Nestes caso é chamada
constante. Lidamos quase que exclusivamente com variáveis de dois ou mais
valores.
45
freqüentemente usam termos de acordo com a necessidade e exigências
de suas teorias e pesquisas. Inteligência, aptidão, ansiedade, locus de
controle, agressão, autoritarismo, classe social, sexo e realização são
todos constructos. Se a definição de “ variável” dada acima pode ser
satisfeita — isto é, se algarismos puderem ser atribuídos a objetos de
acordo com regras — então, podemos chamar de variável um cons-
tructo. O leitor encontrará freqüentemente estes termos na bibliogra
fia da psicologia e educação, mas eles nem sempre serão usados pre
cisamente. Entretanto, deve ser lembrado que há diferenças entre eles.
Por exemplo, é bom saber que, embora seja teoricamente possível
transformar a maioria dos constructos em variáveis, nem sempre é pra
ticamente possível fazê-lo. Um exemplo, a repressão de Freud, foi dado
anteriormente.
Definições operacionais
46
assim por diante) é o resultado no teste de inteligência X, ou inteligência
é o que o teste de inteligência X mede. Esta definição nos diz o que
fazer para medir a inteligência. Diz ao pesquisador para usar o teste
de inteligência X. Realização pode ser definida citando um teste padro
nizado de realização, um teste feito pelo professor, ou notas dadas pelos
professores. Aqui temos três maneiras diferentes de definir operacional
mente o mesmo constructo. O leitor não deverá se preocupar com esta
multiplicidade de definições operacionais; faz parte de sua flexibilidade
e força. Afinal, um constructo como realização tem várias facetas em
momentos diferentes. Consideremos até o exemplo óbvio de diferentes
áreas de realização: leitura, aritmética, artes e assim por diante.
Vejamos um exemplo mais difícil. Suponhamos que queiramos
definir a variável “ consideração” . Pode ser definida operacionalmente
arrolando-se comportamentos de crianças que são presumivelmente com
portamentos que expressam consideração, e fazendo os professores obser
varem e classificarem os comportamentos das crianças numa escala de
cinco pontos. Tais comportamentos podem ser: quando uma criança diz
a outra: “ com licença” , “ desculpe” ; quando uma criança entrega um
brinquedo pedido a outra; ou quando uma criança ajuda outra em
uma tarefa.
- O tipo de definição discutido pode ser chamado uma definição
operacional medida. Ela mostra ao pesquisador como medir (e observar)
uma variável. Lembre-se das variáveis de Miller e Swanson, classe
social e tempo de desmame. Há também definições operacionais experi
mentais que mostram ao pesquisador como manipular uma variável. Por
exemplo, o reforçamento pode ser definido operacionalmente dando os
detalhes de como os indivíduos devem ser reforçados — como Clark
e Walberg fizeram. No estudo sobre os efeitos dos diferentes incentivos
sobre o desempenho de alunos em aritmética, já mencionado, Hurlock
(1925) elogiou algumas crianças, criticou outras e ignorou outras. A
frustração pode ser definida como um impedimento de alcançar uma
meta, uma definição constitutiva com implicações claras para a manipu
lação experimental. Isto foi muito bem realizado por Barker, Dembo e
Lewin (1943), que definiram frustração operacionalmente descrevendo
crianças em uma sala de jogos “ com um número muito grande de brin
quedos muito atraentes, mas inacessíveis.” (Os brinquedos foram deixados
atrás de uma tela de arame; as crianças podiam vê-los, mas não tocá-los.)
Como outras idéias apresentadas neste livro, a definição operacional
é uma invenção notável. Como ficou dito no início deste tópico, é uma
ponte entre conceitos ou constructos e observações, comportamentos e
atividades reais. Para esclarecer, veja a figura 3.2. A figura mostra os
dois níveis nos quais os cientistas operam: o nível dos constructos e
hipóteses (I) e o nível da observação e manipulação (II). Os dois níveis
47
Figura 3.2
48
duas definições operacionais, entretanto, podem dar resultados dife
rentes. Se ambas forem “ boas” definições operacionais, devem estar em
perfeito acordo.
Em um interessante estudo mencionado anteriormente, Walster e
outros (1973) definiram uma de suas principais variáveis com muita
habilidade. Tentaram, em sua pesquisa, encontrar a resposta para uma
antiga pergunta: “ As ‘mulheres difíceis’ são mais atraentes para os
homens do que as mulheres não tão difíceis?” Sujeitos do sexo masculino
receberam cinco pastas contendo informações sobre uma mulher. Três
delas continham “ formulários para a seleção de candidatos” , contendo
as possíveis reações da mulher a cinco homens seus prováveis candidatos.
Essas reações eram anotadas como marcas feitas pela mulher numa escala
partindo de “ escolhido com toda certeza” . Ou seja, cada “ mulher”
fizera, presumivelmente, cinco marcas em cinco pastas, e estas marcas
indícavam-na como “ fácil” ou “ difícil” . Por exemplo, a que marcasse
em todas as escalas “ escolhido com toda certeza” era uma mulher
“ fácil” . Se, por outro lado, ela não se entusiasmasse com nenhum dos
candidatos, era “ difícil” . A categoria mais interessante e decisiva foi a
mulher “ seletivamente difícil” : ela não desejava nenhum dos outros
homens além de você (uma das pastas referia-se ao sujeito). Este proce
dimento, então, era a definição operacional de “ dificuldade” da mulher,
uma definição muito habilidosa.
Nos exemplos acima, observe que a definição operacional mostra
com bastante detalhe o que o pesquisador deve fazer para medir as
variáveis. Holtzman e Brown especificamente relataram como a média
de notas seria calculada, e Walster e outros detalharam o procedimento
para obter medidas de “ dificuldade” . Iguaimente, em situações experi
mentais, as definições operacionais especificam o que os experimenta
dores devem fazer para manipular uma ou mais variáveis independentes.
Elas dão as operações envolvidas.
Nada, entretanto, ficou dito sobre a qualidade das definições opera
cionais. Como as definições constitutivas, elas podem ser boas ou más,
bem ou mal concebidas. Tem havido críticas às definições operacionais
(e à filosofia do operacionalismo que as inspirou), que erraram comple
tamente o alvo. Foi dito, por exemplo, que nenhuma definição opera
cional jamais pode expressar o significado completo e a riqueza de
conceitos como agressão, repressão, ansiedade, autoritarismo, aprendi
zagem, realização e assim por diante. Exatamente. Jamais poderá. Mas
acontece o mesmo com as definições constitutivas! Definições operacio
nais são definições limitadas freqüentemente muito limitadas, cujo
objetivo é ajudar o pesquisador a chegar a aspectos da “ realidade”
comportamental. Há sempre o perigo de fracionar de tal modo um
conceito que este passe a ter pequena relevância para o seu “ verdadeiro”
49
significado. Isto não implica, contudo, que seja impossível inventar e
usar definições operacionais que aproximem aspectos significativos da
“ realidade” conceituai. Difícil, mas não impossível. Sem dúvida, o
sucesso científico em inventar e usar definições tão limitadas tem sido
gratificante. À medida que avançarmos em nosso estudo veremos exem
plos cada vez mais marcantes de definições operacionais e o ir e vir
entre os dois níveis de operação da ciência.
50
4. Relações e explicações
51
Figura 4.1
52
Conjuntos
Relações
53
Figura 4.2
no teste, Marie recebeu 131, Jacob 127 e assim por diante. Temos, então,
dois conjuntos, um de cinco nomes representando as cinco crianças e
um de cinco números representando os pontos feitos pelas crianças em
um teste de inteligência.
Talvez possamos tornar o exemplo um pouco mais interessante.
Estude a figura 4.3. O conjunto dos cinco resultados no teste de inteli
gência, X, está à esquerda. O conjunto da direita, S (de “ sexo” ), tem
dois membros, M e F, significando masculino e feminino. Os membros
dos dois conjuntos, X e S, estão ligados por linhas, assim: se um resul
tado em X é de um menino, trace uma linha até M; sc o resultado for
de uma menina, trace uma linha até F. Desta forma mostramos a relação
entre os resultados e as letras M e F, ou, mais geralmente, uma relação
entre inteligência e sexo. Podemos acreditar que as meninas (nesta
amostra, ou talvez em Amsterdã) são mais inteligentes que os meninos.
Para testar isto podemos calcular a média de pontos dos meninos e
meninas e compará-las. As médias são 125 para as meninas e 110 para
os meninos. Podemos concluir que as meninas são mais inteligentes
do que os meninos, sem dúvida uma conclusão arriscada! A questão
agora não é a adequação da conclusão mas o uso de conjuntos para
estudar uma relação.
Esta discussão bastante óbvia de conjuntos pode ser estendida a
números maiores de casos e variáveis mais complexas. Não importa
quantos casos e quão complexas as variáveis, os princípios básicos e as
regras são as mesmas. Mais objetivamente, definimos uma relação, uma
54
relação entre inteligência e sexo. Como? Ligamos simplesmente os
membros de um conjunto, X, aos membros de outro, S, usando a
regra simples para traçar as linhas, dada acima. Agora damos uma
definição abstrata de "relação” que é completamente geral e que se
aplica a todos os casos.
Uma relação é um conjunto de pares ordenados. Um par ordenado
são dois objetos de qualquer espécie em que há uma ordem fixa para
os objetos aparecerem ou para serem colocados. Na figura 4.2, Marie,
131 é um par ordenado. O conjunto de pares ordenados são os dois
conjuntos na figura 4.2, colocados juntos, os nomes em primeiro lugar
e os pontos em segundo: ■{ (Marie, 131), (Jacob, 127), (Annie, 119),
(Pieter, 108), (Jan, 95) }•. Em outras palavras, “ ordenado” significa
tomar os membros de um dos conjuntos, primeiro, e os membros do
outro, depois. O conjunto de pares mencionado é uma relação. Pode
não ser interessante, importante ou mesmo significativo, mas é uma
relação.
Na figura 4.3 também foi dada uma relação, embora um pouco
mais difícil de se ver. Se apresentarmos a relação de outra forma, como
na figura 4.4, é mais fácil ver. De novo temos um conjunto de pares
ordenados: { (131, F), (127,M), (119, F), (108, M), (95, M) Esta é,
por definição uma relação. Neste caso, entretanto, é um pouco mais
significativa: o conjunto de pares ordenados expressa uma relação entre
os pontos do teste de inteligência e o sexo dos participantes, ou, mais
simplesmente, entre inteligência e sexo.
X S
Figura 4.3
55
Figura 4.4
56
\ H
\
Figura 4.5
57
A direção e a magnitude das relações
58
X = Discriminação
Figura 4.6
simas linhas mais tarde, quando veremos como elas expressam relações
clara e sucintamente.
Os pontos representados e a linha de regressão indicam que a
hipótese é apoiada por estes “ dados” ? A resposta é sim — indicam. Os
pontos representados indicam que grandes valores de X, Discriminação,
são acompanhados por grandes valores de Y, Violência, valores médios
de X por valores médios de Y e valores baixos de X por valores baixos
de Y. O enunciado “ Se discriminação, então violência” parece estar
correto. Especificamente, os grupos minoritários que sofreram a maior
discriminação foram os mais violentos, e os grupos minoritários que
receberam menos discriminação foram os menos violentos. A relação
não é perfeita — há exceções, por exemplo (3,1) e (7,4) no gráfico —
mas em geral se mantém.
Mas ainda não discutimos diretamente a magnitude da relação.
Dissemos que os valores altos de Y “ acompanham” os valores altos
de X e valores menores de Y “ acompanham” valores menores de X.
Naturalmente, este é um enunciado de magnitude, mas desejamos ser
mais precisos. Queremos saber até que ponto a relação é “ forte” ou
“ fraca” . Se a direção da linha de regressão for da esquerda inferior
para a direita superior no gráfico e todos os pontos se encontrarem pre
cisamente sobre a linha, a relação é “ perfeita” e positiva. Tais relações
perfeitas quase nunca acontecem na pesquisa comportamental. Às vezes
todos os pontos representados se aproximam da linha. Quando isso
59
acontece, a relação é “ forte” . Quando não, quando se encontram dis
persos relativamente longe da linha, a relação é “ fraca” ou até se
aproxima de zero. (No último caso, a própria linha seria horizontal,
ou quase. Explicaremos isto mais adiante.)
Há meios ainda mais precisos de expressar a direção e magnitude
das relações. Um meio muito usado é através da correlação e do chamado
coeficiente de correlação. “ Correlação” significa exatamente o que diz
a palavra: a co-relação entre dois conjuntos de valores ou a variação
conjunta dos valores de X e Y, como já foi explicado. “ Coeficiente de
correlação” , um termo muito usado na pesquisa, é uma medida da inter
dependência, da variação conjunta, do aumento ou decréscimo simultâ
neo de dois conjuntos de valores numéricos. Por sua grande importância
na pesquisa, estudemos as idéias de relação, correlação, direção e magni
tude mais profundamente.
Embora do ponto de vista definicional seja correto dizer que uma
relação é um conjunto de pares ordenados, tal definição apenas esclarece
a idéia de uma relação. Não ajuda os cientistas a tirarem conclusões a
partir dos dados. Eles desejam saber a direção e a magnitude das rela
ções, como já ficou dito. A direção de uma relação é ela ser positiva ou
negativa (ou mais complexa). Se os dois conjuntos de medidas de um
conjunto de pares ordenados variam juntos — os pesquisadores dizem
“ covariam” — na mesma direção, a relação é positiva. Se variam simul
taneamente (juntas) na direção oposta, a relação é negativa^
Na tabela 4.1 são apresentados três conjuntos de pares ordenados.
No conjunto A, os valores de X e Y têm a mesma ordem de postos. 2
X Y X Y X Y
1 2 1 8 1 4
2 4 2 6 2 8
3 5 3 5 3 5
4 6 4 4 4 2
5 8 5 2 5 6
2 Os valores da tabela 4.1 não são postos. Entretanto, podem ser facilmente
convertidos em postos; por exemplo, os postos dos valores de Y em A são
5, 4, 3, 2, 1.
60
Por outro lado, no conjunto B a ordem de postos dos dois conjuntos
de valores é oposta, isto é, os valores altos de X são acompanhados por
valores baixos de Y [por exemplo (5,2), (4,4) ], e os valores baixos
de X são acompanhados por valores altos de Y [por exemplo (1,8),
(2,6)]. Os pares de conjuntos de pares ordenados mostrados em C não
têm direção discernível; os dois não mostram tendência sistemática a
variar de uma ou outra forma. O conjunto foi incluído na tabela para
ilustrar o caso de “ nenhuma relação” , ou, mais precisamente, relação
zero, e para contrastá-lo com os conjuntos A e B.
A magnitude de uma relação é a extensão na qual dois conjuntos
de medidas variam simultaneamente (covariam) positiva ou negativa
mente. No conjunto A da tabela 4.1, a magnitude da relação é alta
porque as ordens de postos de X e Y são idênticas. Igualmente alta é a
relação de B porque as ordens de grau são completamente opostas.
Entretanto, os dois conjuntos de números variam juntos: os números
mais baixos de Y acompanham os números mais altos de X , e os núme
ros mais altos de Y acompanham os números mais baixos de X. No
conjunto C, entretanto, não se percebe variação sistemática simultânea
dos dois conjuntos de números. É como se os números do segundo con
junto fossem incluídos ao acaso (e foram). Em tais casos, costuma-se
dizer que “ não há relação” entre os conjuntos. É óbvio que esta é uma
maneira meio inexata de falar, porque qualquer conjunto de pares
ordenados é uma relação. Entretanto, na linguagem corrente da pesquisa,
os pares ordenados do conjunto C seriam mencionados como não mos
trando relação alguma. A expressão correta é “ relação zero” .
Será possível ser mais preciso sobre as magnitudes das relações
dos conjuntos de medidas da tabela 4.1? Felizmente sim. Uma medida
muito útil da magnitude das relações é o coeficiente de correlação,
que já foi mencionado e explicado ligeiramente há pouco. Ê simples
mente um índice, em forma decimal, que indica a direção e a magnitude
da covariação de dois conjuntos de valores. 3
Tais índices variam de —1,00, passando por 0,00, até +1,00.
+ 1,00 indica uma relação positiva perfeita, — os dois conjuntos de
61
pontos têm exatamente a mesma ordem de postos, por exemplo, como
em A da tabela 4.1 — e — 1,00 indica uma relação negativa perfeita,
como em B da tabela. O (zero), naturalmente, indica "nenhuma relação” ,
ou “ relação zero” . Todas as frações decimais entre —1,00 e + 1 ,0 0
são possíveis: —0,78; —0,51; —0,08; 0,12; 0,42; 0,83; e assim por
diante. Muitos coeficientes ou índices de relações como estes são usados
nas ciências comportamentais, mas neste livro estamos preocupados prin
cipalmente com a compreensão e interpretação de tais índices e não com
seu cálculo. 4
Gráficos de relações
62
Y Y Y
Figura 4.7
63
de uma teoria do preconceito, que essas características se combinam
para produzir o preconceito contra membros de grupos minoritários.
O pesquisador tem vários meios de descobrir até onde está correto.
Suponhamos que ele construa uma escala para medir a extensão em
que os indivíduos possuam as características dadas acimã. Chamemos
isto Escala A. Ele usa também outra escala, a escala AS, que pesquisas
anteriores mostraram medir o anti-semitismo, ou o preconceito contra
os judeus. Ele está estudando, então, um aspecto da relação entre autori
tarismo e anti-semitismo. Ele poderia, naturalmente, ter medido as ati
tudes dos sujeitos em relação a negros, estrangeiros, índios e outros
grupos minoritários. Entre as várias pessoas que responderam às duas
escalas, suponhamos que foram selecionadas 10 para representar todo
o grupo e que os dez pares de pontos sejam os da tabela 4.2. (Dez
conjuntos de pares ordenados dificilmente bastariam para avaliar uma
relação com fidedignidade. Geralmente os cientistas comportamentais
usam muitos mais. Entretanto, o princípio é o mesmo, quer se usem
10 ou 10.000 conjuntos de pares.)
O pesquisador quer saber a direção e a magnitude de sua relação:
seu sinal, positivo ou negativo, e até onde os dois conjuntos de valores
covariam Primeiro, os dois conjuntos de valores, com os de autoritaris
mo sempre em primeiro lugar e os de anti-semitismo em segundo, são
um conjunto de pares ordenados e, portanto, uma relação. É fácil ver
a direção da relação: é positiva porque há uma tendência marcante
dos valores altos de A serem acompanhados por valores altos de As —
por exemplo, (6,2; 5,7), (5,9; 5,3) — e igualmente para valores A e AS
baixos — por exemplo, (3,5; 4,0), (3,9; 3,5).
Não é tão fácil avaliar a magnitude da relação, isto é, até onde é
pronunciada a tendência de os valores de A e AS “ caminharem juntos” :
alta com alta, média com média e baixa com baixa. O exame de con
juntos de pares ordenados parece indicar que a covariação dos pontos,
seu “ caminhar juntos” , é pronunciada. Para ver isto mais claramente,
os postos dos valores, postos de 1 a 10, com 1 indicando o valor mais
alto e 10 o rriais baixo, estão indicados na tabela 4.2 ao lado dos pontos
de A e AS (entre parênteses). Observe que em geral os postos vão
juntos: os postos baixos de A combinam com os postos baixos de AS,
acontecendo o mesmo com os postos médios e altos. Resumindo, a
relação entre autoritarismo e anti-semitismo, nesta amostra, é positiva
e “ substancial” . É “ substancial” até onde? É possível e aconselhável
calcular os índices da magnitude das relações. Tais índices são chamados
coeficientes de correlação, como já ficou sabido.6
64
Tabela 4.2 Dez valores fictícios de autoritarismo e anti-semitismo selecionados de
um grande grupo de tais valores, com a ordem de postos dos valores a.
a Os números entre parênteses são os postos dos valores, com 1 sendo alto e 10 baixo.
65
Inteligência
Figura 4.8
66
QI Realização
145 51
125 57
118 60
110 48
100 54
97 35
90 32
Embora os sete círculos não se tenham colocado na linha reta que passa
o mais próximo possível de todos os círculos simultaneamente — a linha
traçada no gráfico — eles se mantêm bastante perto dela. (Lembre-se
de que esta linha se chama linha de regressão.) Outro meio de ter alguma
idéia da magnitude da relação é ^comparar os postos dos dois conjuntos
de pontos, como já fizemos. Isto fica para o leitor como um exercício.
Agora suponhamos que tomamos uma relação com direção negativa
e consideravelmente menor em magnitude. Tal relação é mostrada no
gráfico da figura 4.10. Suponhamos que ela mostre a relação entre a
afluência de um bairro e a delinqüência. Novamente temos sete pontos.
Desta vez, entretanto, estão mais espalhados; estão mais distantes da
linha traçada, o mais próxima possível de todos os pontos. Além disso,
a direção da linha, que agora corre da esquerda superior para a direita
inferior do gráfico, é diferente. Indica que a relação é negativa: à
67
medida que o bairro se torna mais afluente, há menos delinqüência.
Mas agora a relação é muito mais fraca do que era na figura 4.9, onde
os pares de pontos estavam mais perto da linha de regressão. Observe
que quatro dos pontos (os pequenos círculos) estão bem distantes da
linha. Em suma, a relação é negativa e não é muito forte.
Afluência
Figura 4.10
68
Muitas variáveis, naturalmente, não têm nenhuma relação entre si,
a não ser por acaso: sua relação é zero ou próxima de zero. Isto quer
dizer que o conhecimento de uma variável não contribui para o conhe
cimento de outra variável. Não se pode dizer, por exemplo, que enquanto
uma variável aumenta a outra variável aumenta ou diminui. Tal situa
ção é mostrada na figura 4.11, onde 100 pares de números entre 0 e 100
foram marcados. Os números foram obtidos de duas colunas de números
equiprováveis de um ou dois algarismos, numa tabela maior de tais
números (Kerlinger, 1973, pp. 715 e 717, duas últimas colunas de
números de dois algarismos) . 7 Casualidade e números aleatórios, um
importante desenvolvimento técnico e científico moderno, serão expli
cados no capítulo 5. É suficiente dizer, por enquanto, que números alea
tórios são como o resultado do jogo de dados ou de moedas: não há
ordem dedutível ou previsível de espécie alguma nos números. Não se
pode predizer — já que ambos os conjuntos de números são casuais —
nenhum número a partir de outro. Se aparecer um 90 em uma coluna,
pão se pode dizer que é provável que um número alto o acompanhe na
outra coluna, o mesmo para números baixos e médios. Em linguagem
comum, os números dos pares estão todos misturados: todas as combi
nações possíveis podem ocorrer, mas não se pode prever um número
a j>artir de outro.
Compare a figura 4.11 com as figuras 4.9 e 4.10. Nas duas últimas
houve um “ caminhar junto” sistemático dos números, embora tenha
havido consideravelmente menos “ caminhar junto” na figura 4.10 do
que na 4.9. Mas pode-se ver que os círculos da figura 4.11 estão por
todo o gráfico e, mais importante, não há ordem discemível ou
“ caminhar junto” . Este é um estado de relação zero.
Ainda temos muito o que dizer sobre relações neste livro. Elas são
o recheio e o núcleo da ciência. Compreender que o objetivo maior da
ciência é a explicação e que a explicação vem principalmente do estudo
das relações é compreender a base da ciência. Agora vamos tentar
amarrar as idéias de explicação e relações e, já que estamos no assunto,
falar da importante idéia de teoria.
69
pelo menos neste mundo, dizer-se diretamente o que uma coisa é. Jamais
poderemos chegar à “ essência” total de alguma coisa (embora os místicos
nos digam o contrário). Em ciência queremos explicar fenômenos
naturais. Por exemplo, queremos explicar “ preconceito” , o que quer
dizer que vamos dizer como nasce, por que nasce, como caminha, o
que o afeta, o que ele afeta e assim por diante.
Explicar alguma coisa, pelo menos satisfatoriamente, certamente é
uma das tarefas mais difíceis que podemos empreender. Mais que isto,
é literalmente impossível explicar tudo sobre algum fenômeno, ou sobre
conjuntos de fenômenos. E explicar tudo sobre preconceito, por exem
plo, simplesmente não é possível, principalmente se quisermos que boa
parte de nossa explanação venha apoiada em evidência empírica. Em
outras palavras, a “ verdade” absoluta é para sempre impossível. Mas
aproximações razoáveis a explicações de fenômenos naturais podem ser
dadas de maneira científica satisfatória.
O único meió, então, de explicar alguma coisa, é determinar de
que maneira esta coisa se relaciona com outras coisas. Assim a explica
ção do preconceito significa descobrir como o preconceito se relaciona
com outros fenômenos naturais. Se estivéssemos interessados apenas no
desenvolvimento do preconceito em crianças, teríamos que saber pelo
menos em que idade as crianças tomam consciência de “ outros grupos” .
A relação seria entre a idade e conhecimento ou consciência de
outros grupos.
Já dissemos que a ciência lida apenas com fenômenos naturais e
explicações “ naturais” de tais fenômenos. Explicar o preconceito, por
exemplo, dizer que ele faz parte da natureza humana, que todo o indi
víduo é “ naturalmente” preconceituoso em relação a grupos diferentes
do seu, não é uma explicação no sentido científico porque usa um
termo, “ natureza humana” , que é tão vago que se torna inacessível à
observação científica. Onde encontramos “ natureza humana” ? Como
podemos medi-la? Ou pode-se dizer: “ Deus fez grupos diferentes e as
diferenças levam à hostilidade” . Isto também não é uma explanação no
sentido científico. Invocar Deus como a causa das diferenças, retira a
afirmativa do âmbito da preocupação científica. Mais ainda, pode-se
retorquir que Deus fez todos os homens iguais. Dizer que diferenças
levam à hostilidade, embora uma afirmativa melhor porque pelo menos
implica a possibilidade de observação, ainda é vago demais para a obser
vação científica. Todas as diferenças de grupos? Algumas apenas? Que
espécie? Que espécie de hostilidade? Sob que circunstâncias? E assim
por diante.
Naturalmente há muitas “ explicações” para o comportamento hu
mano e para fenômenos. “ Doença é castigo pelo pecado” ; “ As depressões
eçonômicas são devidas aos judeus” ; “ Os pretos são músicos inatos” .
70
Tais “ explicações” são cientificamente sem valor porque não podem
ser submetidas a investigações científica e a testes. Sem dúvida, uma
grande contribuição da ciência é sua rejeição de “ explicações” que real
mente nada explicam. A explicação pode referir-se apenas a fenômenos
naturais, e “ fenômenos naturais” significam ocorrências no mundo
observável. Qualquer fenômeno, para ser um fenômeno natural, precisa
ser observável, potencialmente mensurável ou manipulável. Não é neces
sário ser visto diretamente. Mas precisa haver alguma evidência de suas
manifestações no mundo empírico. “ Preconceito” , neste sentido, implica
em certo tipo de comportamento.
Como, então, a ciência explica o preconceito — ou qualquer outro
fenômeno natural? Repetindo, pode ser explicado apenas pelas suas rela
ções com outros fenômenos. Necessariamente tais explicações são sempre
parciais e incompletas. Foi descoberto, por exemplo, que o autoritarismo
está positivamente ligado ao preconceito (Adorno e outros, 1950):
pessoas muito autoritárias tendem também a ser preconceituosas contra
judeus, negros e estrangeiros. Descobriu-se também que se a maioria das
pessoas de determinado grupo de indivíduos tem crenças estereotipadas
(crenças relativamente fixas e rígidas) sobre membros de outro grupo, elas
então tenderão a ter atitudes negativas em relação aos membros do
outro grupo. Ficou dito também — e provado por evidência (Dollard e
outros, 1939) — que a frustração leva à agressão, que muitas pessoas
são social e economicamente frustradas e dirigem a hostilidade resultante
para outros grupos. Temos aqui, então, fenômenos relacionados com o
preconceito: autoritarismo, estereotipia e frustração. Assim, temos uma
explicação parcial de preconceito.
Preconceito é um conceito ou constructo bastante difícil. Vamos
tomar um fenômeno ou variável igualmente complexo, mas talvez mais
facilmente ilustrável, realização, e sintetizar uma explicação. Fazemos
isto usando um exemplo de uma explanação teórica semelhante àquela
dada quase no fim do capítulo 1. A importância das idéias justifica
o exemplo adicional. Suponhamos que queremos saber por que certos
alunos não se saem bem na escola. Já sabemos que inteligência é uma
variável explanatória: crianças abaixo de um certo nível de inteligência
tendem a não se sair bem na escola. 8 Mas muitas dessas crianças se
saem bem — e muitas crianças de nível superior de inteligência não
se saem bem. Apenas inteligência, então, é uma explicação parcial.
Sabe-se também que crianças de classes sociais mais baixas não se saem
tão bem na escola, comparadas às crianças de classe média. Há muito se
71
pensa também, embora sem apoio muito forte de evidência, que a mo
tivação — desejar ou não desejar sair-se bem — é uma variável impor
tante que influencia a realização escolar.
Agora vamos colocar uma “ explicação” de realização escolar com
as três variáveis que acabamos de mencionar. Tenha em mente que este
exemplo é muito simplificado. A realização escolar é um fenômeno com
plexo, cuja explicação ainda confunde cientistas e educadores. Estamos
dando uma explicação apenas parcial e limitada com fim pedagógico.
Em todo caso, a “ explicação” está representada na figura 4.12. As setas
indicam as relações ou influência. Uma seta de linha contínua e uma só
ponta indica “ influência” ; uma seta de linha interrompida e duas pontas
indica uma influência mútua, ou simplesmente uma relação. (“ Influência”
geralmente implica um efeito numa só direção; “ relação” implica que a
influência pode ser numa direção ou noutra, ou em ambas.)
A explanação assim representada indica que inteligência e motiva
ção influenciam diretamente na realização escolar. As crianças mais inte
ligentes tendem a fazer melhor o trabalho escolar, e as crianças que estão
mais interessadas no trabalho escolar e mais desejosas de fazê-lo, fazem
um trabalho melhor. Inteligência e classe social e inteligência e motivação
influenciam-se mutuamente. Crianças de classe média, por exemplo, têm
em média pontos mais altos em testes de inteligência, e as crianças mais
altamente motiváveis são, em média, crianças de maior inteligência. A
motivação é influenciada diretamente pela classe social. Crianças-das
classes trabalhadoras não se interessam tanto pelo trabalho escolar como
as de classe média, talvez porque o ambiente menos afluente não con
duza à aceitação entusiástica do aprendizado e do estudo. (Além disso,
72
a escola norte-americana é uma instituição de classe média.) A classe
social não exerce efeito direto sobre a realização escolar, então, influen
cia a realização apenas indiretamente, através da inteligência e da moti
vação.
O objetivo deste exemplo não é sua adequação ou validade. Antes,
o objetivo é mostrar como é uma explicação comportamental científica
de um fenômeno e como as relações são o recheio de tal explicação.
O fenômeno da realização escolar é “ explicado” pela relação entre, de
um lado, inteligência, motivação e classe social, e, de outro, realização
escolar — e também pelas relações entre inteligência, motivação e classe
social.
Todo o conjunto de variáveis e as relações especificadas entre elas
podem ser chamadas uma “ teoria” . Naturalmente, esta deveria ser
chamada uma “ pequena teoria” , ou o embrião de uma teoria, porque
um fenômeno tão complexo quanto realização escolar dificilmente pode
ria ser explicado por três variáveis. Entretanto, a maioria das teorias
científicas consiste em tais relações sistemáticas entre variáveis. Uma
teoria, então, é um conjunto de constructos inter-relacionados (variáveis),
definições e proposições que apresentam uma visão sistemática de um
problema especificando relações entre variáveis, com a finalidade de
explicar fenômenos naturais.
Esta discussão sobre “ explicação" em' ciência foi necessária para
tirar o mistério da explicação e da teoria científicas. Toda explicação,
naturalmente, usa relações. A diferença entre explicações científicas e
explicações não-científicas de fenômenos, entretanto, é profunda. É inse
parável das palavras “ sistemática” , “ controlada” e “ empírica.” A dife
rença deve ficar mais clara à medida que continuarmos discutindo.
73
5. Probabilidade e estatística
74
A despeito das diferenças de graus de certeza, é importante com
preender que todas as ciências são probabilísticas. O pensamento do
cientista em todos os campos é fundamentalmente o mesmo. Entretanto,
os cientistas discordam radicalmente nos níveis de probalidade que comu-
mente se associam aos fenômenos e relações com que trabalham. Se
quisermos compreender ciências como a psicologia e a sociologia, é
também importante termos capacidade de pensar e viver em paz com as
afirmativas probabilísticas. Precisamos entender perfeitamente que cada
asserção, cada afirmativa de relação vem acompanhada de uma “ etique
ta” probabilística. Sempre que dizemos “ Se p, então q” , o que dizemos é
“ Se p, então provavelmente q” . O que acontece na vida se repete na
ciência: a certeza é um mito, para sempre fora do nosso alcance.
A estatística é uma filha da probabilidade. Em parte é um instru
mento que mostra aos cientistas em que medida o resultado de suas
pesquisas é seguro, e, assim, quanto suas asserções são dignas de con
fiança. O principal resultado de Clark e Walberg, a diferença média de
realização em leitura entre os grupos experimental e de controle, provou
que sua hipótese sobre o efeito do reforço maciço no aproveitamento
em leitura de crianças càrantes negras foi “ empiricamente válido” .
(“ Empiricamente válido” significa que a evidência da pesquisa apoia
uma asserção sobre uma relação.) A única maneira, pelo menos que
conhecemos hoje, pela qual poderiam avaliar a validade empírica da
afirmativa foi usar o raciocínio estatístico e probabilístico e métodos
estatísticos de avaliação. O que significa isto?
Quando obtemos o resultado de uma pesquisa, queremos saber se
podemos confiar nele. Se repetirmos o experimento várias vezes, obtere
mos os mesmos resultados a cada repetição? Se a resposta for sim, os
resultados são confiáveis. A diferença entre a média de pontos de leitura
dos grupos de Clark e Walberg é confiável? Podemos acreditar que se
Clark e Walberg tivessem feito o mesmo experimento ou experimento
semelhante três, quatro ou mais vezes, eles teriam conseguido os mesmos
ou resultados semelhantes: as mesmas ou diferenças semelhantes entre a
média de pontos de leitura do grupo experimental e do grupo de controle?
Um teste estatístico de seus resultados pode responder a esta pergunta.
Embora a finalidade deste livro não permita entrar nos detalhes de tais
testes estatísticos, precisamos ter uma compreensão geral de como estatís
tica e probabilidade “ funcionam” , como usam as idéias de acaso e casua
lidade para ajudarem os cientistas a chegarem a conclusões sobre os
resultados de suas pesquisas.
Probabilidade e estatística são temas interessantes, intrigantes e até
fascinantes. Apesar das concepções errôneas associadas à sua natureza e
uso, ambas estão próximas da realidade porque se assemelham à natureza
e modelo de nossas vidas e penetram a essência de nosso pensamento e
75
comportamento. Tomemos como exemplo uma tomada de decisão.
Constantemente tomamos decisões sobre o que fazemos. Os resultados,
naturalmente, nunca são certos. Somos, então, calculadores quase esta
tísticos e probabilíticos — embora muita gente pudesse se irritar com a
idéia de que suas vidas e decisões têm natureza estatística. Afinal, a
estatística trabalha com números e minha vida não se baseia em números!
Mas nossas vidas são baseadas em números, explícita ou implicitamente.
Sempre há probabilidades numéricas associadas aos resultados de nossos
atos e decisões, embora raramente saibamos quais são essas probabili
dades.
Eis um paradoxo. A estatística e a probabilidade lidam essencial
mente com incertezas; na pesquisa, entretanto, elas nos ajudam a ter
mais certeza dos resultados que obtemos! Isto não significa que podemos
ter certeza dos próprios resultados, dos resultados em si, mas que pode
mos atribuir graus de certeza aos resultados com bastante precisão. Se fiz
uma experiência com um grupo experimental e um grupo de controle,
por exemplo, e obtive a diferença entre os dois grupos na direção pre
vista, posso garantir que esta diferença seja suficientemente grande para
justificar minha confiança de que é uma “ diferença verdadeira” ? Poderei
dizer algo como: “ A probabilidade de que a diferença de média de
pontos dos dois grupos não é fortuita, não é devida ao acaso, é alta.
Há apenas uma possibilidade em cem de que a diferença seja devida ao
acaso” . Embora probabilística, é uma afirmativa forte.
Probabilidade
76
possíveis). (“ Favorável” significa favorável a um acontecimento cuja
probabilidade estamos avaliando.) Isto é expresso pela equação:
77
dades ao longo de qualquer uma das ramificações do gráfico. Por
exemplo, a probabilidade de três caras é: 1/2. 1/2. 1/2 = 1/8. A proba
bilidade de Ci, C2, C3, é 1/2 . 1/2 . 1/2 = 1/8. Neste exemplo, a proba
bilidade é a mesma em cada ramificação porque a probabilidade de C ou
c é sempre 1/2. Em muitos problemas, entretanto, haverá probabilidades
diferentes e o cálculo não é tão simples assim. No próximo exemplo
que estudarmos as probabilidades não serão de 1/2.
O principal problema em cálculos de probabilidade é determinar o
número total de possibilidades, depois de cuidadosa conceituação do pro
blema. Mas por que trabalhar com um problema tão trivial quanto este
jogo de nioeda? Nós o escolhemos porque o raciocínio e o método são
semelhantes na maioria dos problemas de probabilidade. Naturalmente
entram outras complexidades nos problemas reais. Por exemplo, con
cluímos que no jogo da moeda as probabilidades de cara e coroa são
iguais. Nos problemas reais isto pode não acontecer. Além disso, há
invariavelmente muito mais possibilidades. Entretanto, as mesmas idéias
permeiam a maioria dos problemas de probabilidade.
Tomemos um exemplo mais realista. Suponhamos que temos uma
amostra de 100 eleitores, 60 democratas e 40 republicanos. Se pusermos
Terceira
jogada
Figura 5.1
78
os nomes dos eleitores (em pedaços de papel) numa uma, misturá-los
bem e tirarmos um, qual é a probabilidade de sair um republicano?
É de 40/100 = 0,40. (Costuma-se expressar probabilidades em forma
decimal.) Isto é óbvio e não é preciso nenhuma elaboração. Mas suponha
mos que vamos precisar de 30 pessoas para uma pesquisa. Quantos
democratas e quantos republicanos vamos ter se tirarmos 30 pedaços
de papel da urna? Devemos ter 60/100 x 30 = 18 democratas e
40/100 x 30 = 12 republicanos. Teremos exatamente estes números?
Provavelmente não. Mas teremos números aproximados deles se mistu
rarmos bem os pedaços de papel depois de cada vez que tirarmos.
Deve ser algo assim: (18, 12), (19, 11), (20, 10), (17, 13), (16, 14), e por
aí vai. Estas são as possibilidades mais prováveis. Se tirássemos 10 demo
cratas e 20 republicanos, ou 1 democrata e 29 republicanos, ficaríamos
muito surpresos. A primeira combinação é improvável, a segunda alta
mente improvável.
Acaso
79
Um conjunto de 100 números, de 0 a 9, é dado na tabela 5.1 em
conjuntos de dez cada. Estes números foram tirados de um enorme con
junto de tais números aleatórios. (Esqueça a última linha da tabela por
enquanto.) Estude os números. Você terá dificuldade de encontrar qual
quer forma de regularidade ou sistema neles. Não há números pares ou
ímpares sucessivamente recorrentes; não há seqüências regulares de
números. Eles são, com efeito, imprevisíveis. (Se alguém levar suficiente
mente longe a busca, sempre acabará encontrando alguma coisa).
Resumindo, quando os eventos são aleatórios, não podemos pre
dizê-los individualmente. É estranho, entretanto, podermos predizê-los
com ótimos resultados no total. Isto é, podemos predizer os resultados
de grande número de eventos. Embora não possamos prever, ao jogar
uma moeda, se vai dar cara ou coroa, podemos, atirando-a mil vezes,
predizer com considerável exatidão o número total de caras e coroas.
Se tirarmos uma amostra de 100 crianças de uma população de 400,
200 meninos e 200 meninas, não podemos predizer se uma determinada
criança será menino ou menina, mas podemos predizer com bastante
exatidão o número total de meninos e meninas em nossa amostra — neste
caso, 50 meninos e 50 meninas — contanto que a amostragem seja
casual e a amostra numerosa.
Uma manifestação importante da segurança de previsão estatística
do comportamento de grandes conjuntos de números é dada na parte
inferior da tabela 5 .1 . São médias aritméticas. Cada média é calculada
para 10 números aleatórios. Sempre podemos predizer com considerável
exatidão que os valores dessas proporções estarão próximos do “ valor
teórico’’ da média dos números de 0 a 9. Esta média teórica é
Tabela 5.1 C onjun to d e 100 núm eros aleatórios, de 0 a 9, e m é d ias calcu lad as
de su bcon ju n tos do s núm eros.
1 2 3 4 5 6 7 8 9 10
9 0 8 0 4 6 0 7 7 8
7 2 7 4 9 4 7 8 7 7
6 2 8 1 9 3 6 0 3 9
7 9 9 1 6 4 9 4 7 7
3 3 1 1 4 1 0 3 9 4
8 9 2 1 3 9 6 7 7 3
4 8 3 0 9 2 7 2 3 2
1 4 3 0 0 2 6 9 7 5
3 1 8 8 4 5 2 1 0 3
2 t 4 8 9 2 9 3 0 1
M édia 5,0 3,9 5,3 2.4 5,7 3,8 5,2 4,4 5,0 4,9 M édia total = 4,56
80
0 + 1 + . . . 9)/10 = 4,5. Observe que seis das 10 médias estão
acima de 4,5 e quatro abaixo de 4,5.
Só uma, a quarta, 2,4, afasta-se muito de 4,5. Quanto mais números
se usar para calcular as médias, mais próximas elas provavelmente
ficarão da média teórica. Se, por exemplo, calcularmos a média de todos
os 100 números na tabela 5.1, teremos 4,56, muito perto de 4,5. Tal
comportamento regularmente previsível de grandes conjuntos de números
é muito útil em pesquisa. Dá ao cientista um quadro de referência para
avaliar resultados no sentido de que ele possa conferir os resultados
obtidos confrontando-os com os resultados “ teoricamente” esperados ou
baseados no acaso.
81
o desejo percebido de pertencer ao grupo. Suponhamos que as três médias
dos três grupos nesta medida fossem, Ai = 5,2; A2 = 4,7; A3 = 3,5.
(Os resultados refletem uma escala com 7 pontos, 1 significando muito
pouca exibição de desejo de entrar para 0 grupo e 7 significando enorme
desejo.)
Essas médias apoiam a hipótese. Será? Ai, o grupo mais sofrido,
teve a média mais alta; A2, que sofreu menos, chegou em segundo lugar;
e A3, que nada sofreu, recebeu a média mais baixa. Mas supondo que
alguém objete, dizendo que este resultado foi casual, que poderia ter
acontecido facilmente se os membros do grupo tivessem tirado os pontos
de um chapéu ou — aliás, a mesma coisa — tivessem respondido ao
instrumento simplesmente escrevendo quaisquer respostas às perguntas.
Como posso saber que estas três médias não são um dos muitos resul
tados que poderiam facilmente ter sido obtidos por acaso? Como posso
“ testar” as três médias para avaliar seu suposto afastamento de tais
expectativas baseadas no acaso?
Para acalmar momentaneamente a curiosidade do leitor, mas talvez
não satisfatoriamente, pode ser usada uma técnica estatística conhecida
como análise de variância para testar com precisão os resultados e seu
afastamento da expectativa baseada no acaso. Suponhamos, entretanto,
que eu não saiba nada a respeito de análise de variância. Mesmo asssim
posso testar a hipótese? Sim, mas não tão bem. Vamos então inventar
um teste. Embora não seja grande coisa, é melhor que teste nenhum e
tem a virtude de demonstrar de maneira simples como funciona e é
aplicada a teoria das probabilidades.
A hipótese apresentada acima implica numa ordem de postos das
médias dos três grupos experimentais. Ela prediz, com efeito, que os
membros de Ai, o grupo que mais sofreu, acharão o grupo muitíssimo
desejável; que os membros de A2, o grupo que sofreu menos, achará
o grupo desejável mas não lhe dará tanto valor quanto Ai; e que os
membros de À3, o grupo que não sofreu, darão o menor valor. Assim é
prevista uma ordem de postos pela hipótese: os pontos de At serão em
média maiores que os de A2 e os de A2, maiores do que os de A3.
Se aceitarmos a média dos grupos como indicativa da avaliação do grupo
sobre ser membro do grupo e deixar At, A2 e A3 representarem as médias,
então- a hipótese pode ser escrita simbolicamente: Ai > A2 > A3,
onde > significa “ maior que” . Então essa ordem de postos é: 1 2 3.
Uma vez que as médias obtidas foram At = 5,2: A2 = 4,7 e A3 = 3,5;
a hipótese parece confirmada, como ficou indicado. Mas talvez este
resultado tenha acontecido por acaso.
Aplique a teoria das probabilidades. Quais são as possibilidades?
Queremos testar a hipótese com uma fração, cujo denominador terá um
número que expresse todas as possibilidades. Quantas possíveis ordens
de postos de três médias podem ocorrer? Anote-as:
82
1 2 3
1 3 2
2 1 3
2 3 1
3 1 2
3 2 1
83
Assim, a probabilidade de obter 1 2 3 4 é de 1/24 = 0,04, que significa
que há cerca de 4 possibilidades em 100 de obter 1 2 3 4 apenas por
acaso — e é uma boa margem de segurança. Seu eu disser que minha
hipótese é 1 2 3 4, e é isto que obtenho, posso ficar bastante seguro de
que meu resultado não é casual e que as condições de sofrimento sem
dúvida influenciaram a percepção do desejo de ser membro do grupo.
(Sugere-se que o leitor verifique todas as possíveis ordens de postos para
perceber a validade deste raciocínio.)
Este teste ainda não é muito bom, contudo. Aqui ele foi usado com
um exemplo realístico para ilustrar a idéia de probabilidade. No entanto,
testes estatísticos mais poderosos são baseados em raciocínio semelhante.
A medida que avançarmos, tentaremos mostrar o raciocínio atrás de tais
testes, mesmo que não descrevamos como fazer os testes.
84
pesquisador manipulando duas variáveis ao mesmo tempo para estudar
seu efeito separado e possivelmente conjunto sobre uma variável depen
dente. Suponhamos que um educador tenha motivos para acreditar que
métodos diferentes de ensino da leitura funcionem diferentemente com
tipos diferentes de material de leitura. As duas variáveis devem ser
manipuladas ou manejadas de sorte que o manejo de uma não influencie
a outra por causa do manejo ou manipulação ou por causa da natureza
das variáveis. Suponhamos que o pesquisador usou dois métodos para o
ensino da leitura, Ai e A2, e dois tipos de material de leitura, B, e B2,
correspondentes a material difícil e material fácil. Suponhamos ainda que
0 método Ai leve muito mais tempo para aplicar que o método Aa, e
que 0 espaço de tempo gasto em ensinar reduza a dificuldade de qualquer
material de leitura. Haveria, então, uma falta de independência, porque
o método Ai traz em si, por assim dizer, um fator relacionado com a
dificuldade do material (variável B). Em outras palavras, o método Ai
tenderá a funcionar melhor com material de leitura mais difícil, não por
causa da natureza do método, mas simplesmente porque exige mais
tempo de ensino do que 0 método A2. Há, então, falta de independência
entre as variáveis A e B, já que um aspecto extrínseco da varíavel A,
espaço de tempo de ensino, está relacionado com a variável B, dificuldade
do material.
Outro exemplo de falta de independência encontra-se na mensura-
ção. Se, digamos, dermos um teste com dez itens a certo número de
crianças e depois somarmos os pontos de cada criança nos dez itens
para obter 0 total — um procedimento comum — estamos assumindo
que os dez itens são independentes e suas respostas também indepen
dentes. Esta suposição é satisfeita razoavelmente em muitos testes e
medidas e o procedimento é útil e válido. Mas suponhamos que pedísse
mos às crianças que numerassem os dez itens por ordem de importância
(ou qualquer outro critério). Os itens e suas respostas já não são mais
independentes, porque antes que o item 1 seja escolhido como o mais
importante, há 10 escolhas. Depois da primeira escolha, restam nove
itens a serem escolhidos. Depois de escolher os nove primeiros itens
resta apenas um — e não há escolha. As respostas a itens posteriores,
em outras palavras, serão afetadas pelas escolhas anteriores. Isto é falta
sistemática de independência. Tal falta de independência afeta a esta
tística e sua interpretação. Isto não quer dizer que a ordem de postos e
métodos semelhantes não possa ser manuseada probabilística e estatisca-
mehte. Aliás, mostramos como um simples problema de ordem de postos
pode ser resolvido usando a teoria das probabilidades. Ela simplesmente
ilustra a falta de independência. Em suma, muitas técnicas estatísticas
supõem independência e seu uso e interpretação com fenômenos ou pro
cedimentos não-independentes pode nos confundir.
85
Fizemos esta digressão sobre a independência para tentar esclarecer
a concepção probabilística errônea esboçada antes. Os resultados de
eventos casuais anteriores não afetam os resultados de eventos subseqüen-
tes — ou talvez devêssemos dizer que não devem afetar eventos
subseqüentes. Se a probabilidade de sair cara no primeiro lançamento de
moeda é de 1/2, será de 1/2 no décimo, no vigésimo, no qüinquagésimo,
sejam quais forem os resultados anteriores. Isto acontecerá a não ser
que se tenha feito alguma coisa para mudar a moeda ou o jogo, ou que
tenha havido alguma influência extrínseca atuando, como no experimento
sobre os métodos de ensino da leitura mencionado acima.
Acaso e pesquisa
86
outra. A falta de resultados sistemáticos e a insignificância das diferen
ças entre as médias estão mostradas na coluna denominada “ Diferença” .
Tais resultados são característicos de resultados obtidos em bases for
tuitas ou casuais. Compare-os com as médias reais de Clark e Walberg
e a diferença entre elas ( + 4,76). A estatística, então, ajuda-nos a deter
minar ou avaliar se os resultados obtidos “ realmente” diferem dos
“ resultados” que seriam obtidos sob condições de acaso.
Grupo Grupo
Experimento experimental controle Diferença
M, m2 Diferença Mx m2 Diferençaa
a As últimas três colunas são simplesmente uma continuação das três primeiras.
87
casual para avaliar os resultados de dados obtidos na pesquisa. Um
conjunto de 20 pares de médias e as diferenças entre as médias é mos
trado na tabela 5.3. Estas médias foram obtidas por um processo casual.
Um computador gerou 4.000 números aleatórios de 0 a 100. Depois
foram calculadas as médias de 40 conjuntos de 100 números cada um.
Essas médias foram emparelhadas, pondo-se a primeira média com a
vigésima primeira média, a segunda com a vigésima segunda, e assim
por diante.3 As diferenças, sob a coluna “ Diferença” , foram calculadas
subtraindo em cada par a segunda média da primeira média.
Concentremo-nos nas 20 diferenças. Elas vão de — 10,37 a 9,72.
Há 9 diferenças positivas e 11 negativas. Isto se aproxima da expectativa
de casualidade, pois com números aleatórios esperamos aproximadamente
igual número de diferenças para mais ou para menos. (Deixemos os
sinais de mais ou de menos por ora, para simplificar a discussão.)
Suponhamos que fizemos um experimento com dois grupos e
obtivemos médias de 52,40 e 42,25. A diferença entre estas médias é
52,40 — 42,25 = 10,15. Usando as diferenças entre as médias da
tabela 5 .3 com base casual, desejamos avaliar a chamada “ significância
estatística” da diferença 10,15. Um resultado “ estatisticamente signifi-
cante” é o que se afasta “ suficientemente” da expectativa de acaso ou de
uma base casual. Os 10,15 obtidos diferem tanto do acaso? É um resul
tado estatisticamente significante?
Voltemos às diferenças da tabela 5.3. As duas maiores diferenças
são 10,37 e 9,72. Isto significa que 10 por cento (2/20 = 0,10) das 20
diferenças são maiores do que 9. Se quisermos aceitar cerca de 10 por
cento de risco de estarmos errados, podemos dizer que a diferença
obtida no experimento, 52,40 — 42,25 ou 10,15, excede à expectativa
de acaso. (Se tivéssemos levado em consideração os sinais das diferenças,
o risco teria sido menor. Por quê?)
Suponhamos, entretanto, que não estamos satisfeitos com 10 por
cento de risco. Queremos ter mais certeza de que nossa diferença experi
mental de 10,15 seja um afastamento “ real” da expectativa casual.
Em outras palavras, queremos diminuir a probabilidade de fazer um
erro e aceitar o que realmente é uma diferença casual como uma “ verda
deira” diferença. Assim dizemos que a probabilidade deve ser de 0,05,
ou 5 por cento, em vez de 0,10, ou 10 por cento. Cinco por cento de
20 é 1: 20 x 0.5 = 1. Neste caso tomamos apenas uma diferença, a
mais alta, 10,37. Conforme as diferenças dadas na tabela 5.3, há uma
probabilidade em 20, ou 5 por cento — a probabilidade é 0,05 — de
88
obter uma média de 10,37 ou maior, por acaso. Obtivemos a diferença
de 10,15. Já que há só uma diferença tão grande na tabela, podemos
dizer que o resultado experimental obtido, a diferença entre a média
do grupo de controle e experimental, provavelmente não seja resultado
do acaso. Em outras palavras, há apenas uma possibilidade em 20, ou
uma probabilidade de 1/20 = 0,05, de que nossa diferença seja uma
diferença casual. Concluímos, então, que a média do grupo experimental
é estatisticamente maior que a do grupo de controle. Dizemos que a
diferença entre as médias é “ estatisticamente significante” .
O leitor deve saber que este procedimento — chamado procedi
mento Monte Cario — não é o meio pelo qual os pesquisadores costumam
avaliar a significância estatística de seus resultados. A demonstração foi
feita apenas para mostrar a natureza do pensamento, para manufaturar,
por assim dizer, uma base casual com a qual avaliar um resultado
experimental particular. Mas a idéia por detrás dos métodos mais sofisti
cados atualmente usados é muito parecida. Outra falha de nossa
demonstração foi usar apenas 20 pares de médias. Um procedimento
Monte Cario melhor teria usado 2.000 ou 20.000 médias e faria o
computador emparelhar as médias ao acaso. Entretanto, a essência da
idéia esteve presente: foi avaliado um resultado experimental confron
tando-o com uma base causal.
89
descrição. Temos pouco interesse nele neste livro. O segundo propósito
é comparativo e inferencial. A média pode ser comparada às médias de
outros grupos. Médias de grupos diferentes, então, podem ser compa
radas com o fim de testar hipóteses e inferir se as hipóteses são ou não
confirmadas. Outras estatísticas além das médias podem ser igualmente
comparadas, naturalmente.
Uma estatística é uma medida calculada de uma amostra, como ficou
claro. Uma estatística é uma medida resumida: ela sumariza, ou expressa
em forma resumida, algum aspecto de uma amostra. A média expressa a
tendência central dos pontos, seu nível geral. Esta propriedade tem
grande utilidade, principalmente na pesquisa experimental, onde freqüen-
temente são comparadas as tendências centrais de grupos de resultados.
Lembre-se que foram comparadas as médias de grupos de reforçamento
maciço e regular no estudo de Clark e Walberg. O chamado desvio
padrão, outra estatística, expressa a variabilidade de um conjunto de
pontos; é uma expressão resumida de quanto é heterogêneo um conjunto
de pontos. Entre outras coisas, usando-a, pode-se avaliar a homogenei
dade ou heterogeneidade de diferentes conjuntos de pontos.
Uma população é um conjunto de todos os objetos ou elementos sob
consideração. Todas as crianças de 8 anos de Genebra, Suíça, são uma
população. Todos os homens de um exército são uma população. Amostra
é uma porção de uma população, geralmente aceita como representativa
da população. Para estudar e testar uma hipótese de Piaget sobre um
aspecto do pensamento das diferenças de 8 anos, podemos tirar uma
amostra de 100 dessas crianças da população de crianças de oito anos
de Genebra. Uma medida calculada dos resultados de todos os membros
de uma população é chamado um valor de população. Se calcularmos
uma média de todos os resultados de teste de inteligência de todas as
crianças de oito anos de Genebra, a média é um valor de população. Se,
entretanto, calcularmos a média da amostra de 100 crianças tiradas
da população, a média é uma estatística. Há muitas estatística, das quais
estudaremos algumas.
As idéias de valores de população e estatísticas e de população e
amostra, parecem confundir as pessoas, parcialmente, imagino eu, porque
a diferença entre elas é às vezes arbitrária, uma questão de definição.
Isto acontece particularmente na pesquisa comportamental porque fre-
qíientemente as populações são inacessíveis — até o recenseamento dos
Estados Unidos não pode cobrir todos os norte-americanos — e porque
as amostras podem ser tratadas como populações para propósitos de
pesquisa. Um exemplo simples é sexo. Homens e mulheres são amostras
de todos os seres humanos. Digamos que a população seja o conjunto
de todos os seres humanos de San Francisco. Os homens e as mulheres
de San Francisco são amostras dessa população. Mas o pesquisador pode
90
ter um bom motivo — seu problema pode incluir só mulheres — para
estudar as características e comportamento somente das mulheres. As
mulheres de San Francisco, então, tornam-se a população. Agora,
suponhamos que o pesquisador use um instrumento psicológico destinado
a medir as atitudes em relação às mulheres com todas as mulheres que
vivem em San Francisco. Ele calcula a média e o desvio padrão dos
resultados da medida de atitude de todas essas mulheres. A média e o
desvio padrão são valores de população.
É muito pouco provável, entretanto, que até o pesquisador mais
cuidadoso possa ou queira estudar todas as mulheres de qualquer cidade.
É muito mais provável que ele queira estudar uma amostra de mulheres
escolhidas em uma população. Suponhamos, neste caso, que a amostra
consista de 700 mulheres de San Francisco. Se o pesquisador aplicar a
escala de atitudes às 700 mulheres e calcular a média e o desvio padrão,
estes serão estatísticos, porque foram calculados a partir de amostras.
O segundo propósito da estatística, ajudar a fazer inferências segu
ras a partir de dados de observação, centraliza-se nas palavras “ inferên
cia” e “ segura” . Uma inferência é uma proposição ou generalização deri
vada pelo raciocínio, de outras proposições, ou da evidência. Na estatís
tica,. as inferências podem ser tiradas de testes do que é chamado hipó
teses estatísticas. Da diferença de médias entre o grupo experimental e o
de controle do estudo de Clark e Walberg, do uso apropriado de um
teste estatístico e do raciocínio, “ concluímos” que a média do grupo
experimental é maior que a média do grupo de controle. Isto é, temos
duas estatísticas, duas médias, calculadas dos resultados do grupo experi
mental e do grupo de controle. Subtraímos uma média de outra, neste
caso a média do grupo de controle da média do grupo experimental. Se a
diferença for “ suficientemente grande” , o que quer dizer maior do que
alguns valores concebidos como expectativa baseada no acaso, concluímos
que o grupo experimental obteve pontos mais altos de leitura em média.
Tal uso inferencial da estatística é o núcleo da estatística na pesquisa
comportamental contemporânea. A palavra “ segura” , citada acima, refe
re-se à estabilidade dos resultados obtidos e assim à estabilidade das
inferências feitas a partir dos resultados. Se obtivermos uma certa dife
rença entre as médias dos dois grupos, diferença igual ou semelhante
aparecerá outras vezes se o experimento for várias vezes repetido? Se
tivermos um certo conjunto de freqüências em um cruzamento de
variáveis ou tabulação cruzada, como no exemplo de Miller e Swanson,
no capítulo 1, obteremos padrões semelhantes de freqüências — e iguais
afastamentos das expectativas baseadas no acaso — se o estudo for
repetido? A estatística nos ajuda a responder tais perguntas, dando-nos
assim meios poderosos de avaliarmos a estabilidade a validade empírica
de nossas inferências a partir de dados.
91
Concepção errônea da estatística
92
menos no que se refere a cada criança individualmente. Assim, todo o
procedimento é irrelevante à inteligência e realização de crianças verda
deiras. Argumentos semelhantes aplicam-se a toda a amplitude das ope
rações estatísticas.
É claro que este erro de concepção está baseado em idéias imper
feitas dos propósitos e usos da estatística. Todas as estatísticas são abstra
ções. Qualquer estatística em particular pode não corresponder aos resul
tados de um indivíduo em particular. Mas nem deveria! Seus propósitos
são muito diferentes. Adeptos dessa concepção errônea parecem querer
que a estatística mostre a “ verdadeira realidade” , que faça alguma coisa
mágica, enfim. Como toda a criação do homem, ela pode fazer apenas o
que lhe foi destinado, e isto sempre se limitou a aspectos especiais de
uma “ realidade” . Uma média estatística é apenas uma média estatística,
mais nada. Não pretende ser “ igual” a qualquer indivíduo. Mas pode ter
um poder explanatório considerável, até grande, quando usada e interpre
tada adequadamente.
O propósito da estatística, então, não é mostrar a chamada realidade
ou refletir as idiossincrasias dos indivíduos. Antes, seu principal propósi
to é ajudar os pesquisadores a chegarem ao significado de conjuntos de
dados. Assim, é de ajuda indispensável na interpretação de dados. Pode-se
dizer que a estatística disciplina os dados, agindo sobre eles de sorte a se
tirar inferências seguras de observações empíricas. Sem dúvida seria
difícil conceber a pesquisa comportamental moderna sem ela. Natural
mente, há perigos em seu uso. Pode-se ter dados inadequados e se acomo
dar numa espúria sensação de suficiência, mergulhando em cálculos e
operações estatísticos. Pode-se generalizar além dos dados e usar a
estatística para acreditar e fazer os outros acreditarem que tal generali
zação é conveniente e correta quando, de fato, é inconveniente e errada.
A despeito dos perigos e dificuldades, a estatística, a teoria das probabili
dades por trás dela e a idéia fundamental e fecunda de acaso são ferra
mentas úteis e poderosas, cujo grande valor é nossa tarefa apreciar.
93