Anda di halaman 1dari 7

disponvel em www.scielo.

br/prc

Subtestes Semelhanas, Vocabulrio e Compreenso do WISC-III:


Pontuao Objetiva ou Subjetiva?

WISC-III Subtests of Similarities, Vocabulary and Comprehension:


Objective or Subjective Scoring?

Vera Lucia Marques de Figueiredo*, Jaciana Marlova Gonalves Arajo,


Taise Costa Dias, & Marcela Vargas Busetti
Universidade Catlica de Pelotas, Pelotas, Brasil

Resumo
Este trabalho visou analisar a pontuao dos subtestes Semelhanas, Vocabulrio e Compreenso do
WISC-III, tendo em vista que podem envolver maior subjetividade do avaliador. Participaram do estudo
42 psiclogos de diferentes Estados do Brasil, os quais corrigiram as respostas de 6 protocolos do teste
selecionados aleatoriamente da amostra de padronizao ao contexto brasileiro. Tomando-se como
referncia os escores totais, o subteste Vocabulrio apresentou maior variabilidade nas pontuaes, seguido
por Compreenso. Considerando-se o total de itens analisados em cada subteste, Semelhanas apresentou
a maior concordncia entre os avaliadores. Entretanto, os resultados evidenciaram que os trs subtestes
envolvem a subjetividade do avaliador na pontuao das respostas.
Palavras-chave: WISC-III; Psicometria; Subtestes Verbais.

Abstract
In all psychological tests, scoring should be of concern for examiners because the accuracy of results
depends, at some extent, on the quality of the correction. This work aims to examine the correction, by
different psychologists, of the scores for the Wechsler Intelligence Scale for Children (WISC-III) subtests
of Similarities, Vocabulary and Comprehension since these are the subtests where examiners subjec-
tivity seemingly most influences scoring. Forty two psychologists from different states in Brazil parti-
cipated in this study. They corrected the answers of six test protocols randomly selected from a stan-
dardization sample for the Brazilian context. Taking as reference the total scores, the Vocabulary subtest
showed greater variability in score, followed by the Comprehension one. Considering the total number of
items tested in each subtest, Similarities had the highest agreement among raters. The results showed
that all the three subtests involve subjectivity on behalf of the examiner to score the answers. Continuing
in this study, we also aim to determine test reliability based on interrater agreement.
Keywords: WISC-III; Psychometric; Verbal Subtests.

O teste psicolgico uma ferramenta capaz de auxi- Segundo Pasquali (1999), a melhor maneira de obser-
liar no diagnstico e na tomada de deciso do psiclogo. var um fenmeno psicolgico atravs da medida. Esse
Entretanto, para garantir sua eficcia, condio essen- pressuposto reforado por Alchieri e Cruz (2003), para
cial que este instrumento de aferio esteja calibrado e os quais os testes so operaes empricas utilizadas pela
que os usurios tenham domnio dos procedimentos de Psicologia a fim de estudar as diferentes manifestaes
uso e interpretao. Identificar as limitaes da tcnica e do seu objeto, os processos psquicos e os comportamen-
as dificuldades provenientes de seu emprego uma tare- tos deles decorrentes.
fa importante que vai auxiliar seus usurios a minimizar A medida um procedimento emprico e como tal no
os erros de estimao. A proposta deste trabalho apon- est isento de erro. O erro est sempre presente em qual-
tar os problemas envolvidos na etapa de correo (pontua- quer medida, podendo ser creditado prpria observa-
o) de uma tcnica amplamente empregada para avaliar o, amostragem ou ao prprio evento que foi avaliado
a inteligncia de crianas e adolescentes. (Pasquali, 2003). Uma das formas de minimizar os erros
no processo de correo de um teste fundamentar as
decises nas regras do manual. Para Cunha (2000), em
*
Endereo para correspondncia: Universidade Catlica relao aos escores para pontuar um teste, geralmente,
de Pelotas, Escola de Psicologia, Rua Almirante Barroso, as instrues que constam nos manuais so suficientes.
1202, Centro, Pelotas, RS, Brasil, CEP 96010-280. E-
mail: verafig@terra.com.br, jacianamga@hotmail.com,
A familiarizao com o teste e o uso correto do manual
taise.cdias@hotmail.com e marcelabusetti@hotmail.com auxiliaro na atribuio dos diferentes escores e sero

449
Psicologia: Reflexo e Crtica, 23 (3), 449-455.

teis para que o examinador saiba quando os dados de mento do examinador. Por essa razo, especialistas nes-
que dispe so suficientes ou quando deve estimular o te instrumento sugerem que, para evitar a subjetividade
examinando a falar mais. Essas recomendaes, no do avaliador na correo e assegurar o menor nmero
sentido de melhor entender o raciocnio subjacente possvel de erros na apurao dos resultados, os protoco-
resposta, no implicam em quebra de instrues na los devem ser corrigidos por mais de um profissional,
administrao. Por outro lado, mesmo que o examinando alm do prprio aplicador (Sattler, 1992).
seja o foco principal, a testagem e a atribuio de esco- No WISC-III (Wechsler, 1991), a pontuao de itens
res devem tambm exigir ateno por parte do exa- dos subtestes verbais deve ser baseada nas respostas da
minador. amostra de padronizao. Essas respostas esto inclu-
Quando ocorrem respostas inusitadas, bem diversas das no manual do teste abaixo de cada item dos respec-
das constantes entre os exemplos do manual, a ade- tivos subtestes, ilustrando os vrios tipos e nveis de res-
quao ou a correo de tais respostas deve ser julgada postas. Tambm h critrios gerais para orientar o exa-
pelo examinador. Ele deve, tambm, consultar profis- minador, principalmente no subteste Vocabulrio. Em
sionais especializados ou obras especficas para se algumas situaes, entretanto, tais informaes parecem
certificar de que a atribuio de tal escore pode ser insuficientes para que o profissional possa pontuar com
razovel (Cunha, 2000). certeza uma determinada resposta, posto que, muitas
A aplicao e pontuao corretas do teste iro deter- vezes, o examinando emite respostas bastante diferentes
minar uma interpretao precisa da habilidade do exa- das registradas no manual.
minando. O conceito de fidedignidade refere-se a quan- Segundo Sattler (1992), a pontuao dos subtestes Se-
to o escore obtido no teste se aproxima do escore ver- melhanas, Vocabulrio e Compreenso exige conside-
dadeiro do sujeito num trao qualquer. A fidedignidade rvel habilidade. Alm disso, para o autor, um estudo
de um teste est intimamente ligada ao conceito de cuidadoso deve ser feito nos critrios de pontuao para
varincia-erro, sendo este definido como a variabilidade ajudar a reduzir possveis erros. Na pesquisa desenvol-
nos escores produzida por fatores estranhos ao construto vida por Sattler, Andres, Squire, Wisely e Maloy (1978)
(Pasquali, 2001). com o WISC-R, 110 psiclogos e estudantes de gradua-
H vrios mtodos para estimar a preciso de um tes- o pontuaram 726 respostas ambguas nos subtestes
te e, entre eles, est a fidedignidade dos avaliadores Semelhanas, Vocabulrio e Compreenso. Um nvel de
que, segundo Anastasi e Urbina (2000), pode ser deter- 80% de concordncia na pontuao foi alcanado em
minada com base em uma amostra de protocolos dos somente 51% das respostas de Semelhanas, 49% de
testes pontuados independentemente por dois ou mais Compreenso e 38% de Vocabulrio, evidenciando difi-
examinadores. Segundo McIntire (2000) e (Pasquali culdade na pontuao das respostas.
(2001), entre os fatores que podem influenciar os resul- Na verso americana do teste WISC-III, foi estabelecida
tados dos testes no-objetivos, encontra-se a opinio do a fidedignidade entre avaliadores para os subtestes Se-
apurador, como fator de deciso. Nesse caso, preciso melhanas, Vocabulrio e Compreenso. Sessenta proto-
mais de um apurador para garantir a preciso do resul- colos foram selecionados aleatoriamente da amostra de
tado no teste. padronizao e quatro avaliadores pontuaram, indepen-
O Wechsler Intelligence Scale for Children-Third dentemente, os trs subtestes. No estudo, foi usado um
Edition (WISC-III) um teste de inteligncia utilizado tipo de correlao Intra-Classe para avaliar a concordn-
em crianas entre 6 e 16 anos. Sendo um dos mais utili- cia entre juzes. Quando os escores totais dos subtestes
zados para avaliar a inteligncia, ele estima a capacida- foram utilizados nas anlises, as concordncias obtidas
de intelectual, estabelecendo um perfil das habilidades entre avaliadores foram de 0,98 para Semelhanas, 0,98
cognitivas, e administrado por psiclogos, tanto da para Vocabulrio e 0,97 para Compreenso. Os resul-
rea educacional quanto clnica. O desenvolvimento tados mostram que tais subtestes, apesar de exigirem
cognitivo do examinando avaliado por meio dos esco- maior julgamento do examinador, podem ser pontuados
res obtidos nas diferentes tarefas do teste, os quais so muito confiavelmente (Wechsler, 1991).
comparados com os esperados para sua idade. A exa- Estudos mostram que os examinadores que utilizam
tido na pontuao dos resultados essencial para as escalas Wechsler de inteligncia cometem erros de
garantir um diagnstico preciso. Contudo, nenhum administrao e de pontuao com grande freqncia.
estudo sobre a preciso dos avaliadores foi feito na As pesquisas apontam que grande parte do percentual de
adaptao do instrumento ao contexto brasileiro. erros encontrados no WISC-III e WISC-IV so cometi-
Segundo Wechsler (1991), a correo da maioria dos dos na fase de pontuao, com tendncia a superestimar
itens do WISC-III objetiva e exige pequena ou nenhu- os escores (Belk, LoBello, Ray, & Zachar, 2002; Loe,
ma interpretao de critrios por parte do examinador. Kadlubek, & Marks, 2007). Por outro lado, Sherman e
J em alguns subtestes, como Compreenso, Semelhan- Taylor (2001) identificaram, no subteste de Compreen-
as, Vocabulrio e Informao, os itens exigem julga- so, o efeito da experincia dos avaliadores, uma vez que

450
Figueiredo, V. L. M., Arajo, L. M. G., Dias, T. C. & Busetti, M. V. (2010). Subtestes Semelhanas, Vocabulrio e Compreenso do
WISC-III: Pontuao Objetiva ou Subjetiva?

psiclogos mais experientes foram mais rigorosos na pon- Para este estudo, foram considerados o gabarito for-
tuao do que alunos do incio da graduao. Simes et mulado pelas pesquisadoras (escores esperados), as
al. (2000) analisaram a concordncia entre avaliadores pontuaes em cada item e os escores totais atribudos
nos subtestes Semelhanas, Vocabulrio, Compreenso pelos avaliadores aos subtestes (escores observados). Para
e Labirintos em um estudo no qual quatro profissionais a anlise das pontuaes, as somas dos escores de cada
pontuaram independentemente 40 protocolos do teste. O subteste foram comparadas ao gabarito. Calcularam-se
subteste identificado como mais difcil de pontuar obje- as diferenas entre o gabarito e os escores observados e,
tivamente foi Compreenso. pos-teriormente, as freqncias dessas diferenas, o que
No Brasil, no h trabalhos divulgados relacionados possibilitou identificar o percentual de profissionais que
dificuldade de pontuao das respostas do WISC-III. No encontraram os mesmos escores previstos (diferena
manual do teste (Wechsler, 2002) a autora da adaptao igual a zero foi interpretada como concordncia); para
aponta a necessidade de desenvolver estudos relativos tais diferenas consideraram-se valores positivos, como
preciso na pontuao. Por essa razo, o presente estudo tendncia a superestimao e escores negativos, como
teve como objetivo identificar o nvel de concordncia subestimao.
entre os avaliadores na tarefa de pontuar itens dos trs
subtestes que exigem maior julgamento dos avaliadores. Resultados

Mtodo Os psiclogos que participaram como avaliadores eram


95,3% (N=40) do sexo feminino, com idade mdia de 39
Participantes anos (DP=10,84), sendo que 42,8% (N=18) residiam na
Em contato com especialistas reconhecidos na comu- regio sul, 47,6% (N=20) na regio sudeste, 4,7% (N=2)
nidade cientfica por sua prtica na utilizao do WISC- na regio centro-oeste e 4,7% (N=2) na regio nordeste.
III, solicitou-se a indicao de outros profissionais que Entre eles, 47,3% (N=20) tinham mestrado, 26,2%
tambm utilizassem o teste. Dessa forma, formou-se uma (N=11), alguma especializao e 21,4% (N=9), doutora-
rede com 60 psiclogos de diferentes Estados do Brasil do, sendo que 4,8% da amostra (N=2) no especificaram
que foram convidados a participar do estudo. Entretan- sua formao. Os contextos mais freqentes de utiliza-
to, apenas 42 demonstraram interesse, devolvendo o o do teste pelos avaliadores eram clnica e pesquisa,
material enviado. em atividades como docncia e prtica de avaliao psi-
colgica. Um ndice de 85% (N= 35) dos avaliadores
Material relatou experincia tanto na aplicao quanto na corre-
Foram selecionados aleatoriamente do banco de dados o do WISC-III, sendo que 60% (N=24) deles utilizam
da pesquisa de padronizao do WISC-III ao contexto somente o manual como recurso para a correo. Os de-
brasileiro (Wechsler, 2002) seis protocolos do teste com mais recorrem a material complementar como artigos e
o registro das respostas colhidas em tal ocasio e o mate- apostilas de cursos. Os psiclogos tinham, em mdia,
rial foi encaminhado via correio, com envelope selado e 15,5 anos de formados (DP=10,5).
subscrito para facilitar a devoluo. Os protocolos exa- Na reviso dos protocolos recebidos, identificaram-se
minados pelos psiclogos eram de crianas e adolescen- alguns problemas como, por exemplo, itens e subtestes
tes de escolas pblicas com idades entre 9 e 15 anos. no pontuados e escores totais no somados ou somados
Juntamente com os protocolos, foram enviadas aos pro- incorretamente. Entre as razes que podem ter contri-
fissionais: (a) uma ficha de dados de identificao; (b) budo para estas falhas, pode-se pensar na falta da ins-
uma carta de livre consentimento informado; e (c) uma truo, por parte das pesquisadoras, de que os escores
carta contendo orientaes sobre o procedimento para individuais de cada subteste deveriam ser somados por
execuo da tarefa. Os psiclogos deveriam pontuar, suporem que essa tarefa seria automaticamente reali-
seguindo os critrios do manual do teste, as respostas zada pelos avaliadores. A falta de concluso da tarefa, ou
registradas nos protocolos. Em caso de dvidas na pon- seja, deixar itens sem pontuao por parte de alguns ava-
tuao de algum item, poderia colocar entre parnteses a liadores, pode estar associada pouca disponibilidade
pontuao alternativa. de tempo, uma vez que o trabalho de pontuao consis-
tiu em uma atividade exaustiva. Os avaliadores no re-
Procedimentos para Anlise dos Dados gistraram algumas somas em funo de dvidas na pontu-
A digitao e anlise dos dados foram realizadas nos ao de determinados itens. Por esse motivo, os clculos
programas SPSS e Excel, utilizando-se medidas de ten- que utilizaram as somas dos escores nem sempre repre-
dncia central, anlises de freqncias e teste Qui-qua- sentaram a totalidade dos avaliadores (N=42).
drado. Foram calculados, com base no total de respostas Na pontuao dos itens, os psiclogos foram solicita-
analisadas, os percentuais de avaliadores (de 40 a 100%) dos a indicar quando tivessem dvidas no escore a ser
que deram a mesma pontuao em cada um dos itens. atribudo a cada resposta. Ao analisar a freqncia de

451
Psicologia: Reflexo e Crtica, 23 (3), 449-455.

tais dvidas, identificaram-se no subteste Vocabulrio os tas dadas pelos examinandos, o que possibilita que cada
itens 7, 11, 15 e 21; em Semelhanas, os itens 2, 7, 8 e profissional utilize critrios prprios para decidir sobre
11; e em Compreenso, os itens 2, 6, 7 e 12 como os que a pontuao.
causaram mais dvidas na pontuao, considerando os Ao pontuarem, os avaliadores no mostraram tendn-
seis protocolos. Exemplificando as respostas que foram cia na estimao, exceto em Vocabulrio, onde, dos seis
mais dbias em cada subteste, temos em Vocabulrio protocolos analisados, quatro apresentaram um percen-
(item 21 aflio) respostas como inquieta e nervosa, tual maior de avaliadores que superestimaram o escore
suscitando dvidas para a pontuao em 33% dos profis- total em relao ao gabarito. No item 4, (guarda-chuva)
sionais; em Semelhanas (item 11 famlia-tribo) foram por exemplo, a resposta No deixa a gente se molhar
um monte de pessoas, pai, irmos, conjunto de pes- foi avaliada com dois pontos por 88% dos juzes, mos-
soas, e unio, enquanto que, em Compreenso (item trando tendncia supervalorizao, uma vez que, se-
7 briga), chamava ou falava com a me e conver- gundo o manual, a pontuao deveria ser um. O manual
sava com ela. Tais respostas foram pontuadas com es- contm a orientao de que dois pontos devem ser atri-
cores entre 0 e 1 ponto. Entretanto, os profissionais budos a respostas que do idia de proteo e de situa-
registraram que tinham dvidas de que a pontuao pode- o em que se usa o objeto, tal como Mantm a pessoa
ria variar de 0 a 2 pontos. Nos registros dos avaliadores, seca quando chove. Os dados confirmam, em parte, os
as dificuldades ocorreram tanto pelo fato de as respostas estudos de Belk et al. (2002) e Loe et al. (2007), que
no constarem nos exemplos oferecidos pelo manual, encontraram uma tendncia dos avaliadores em superes-
como pela falta de inquritos, que resultou em respostas timar os escores dos subtestes verbais.
incompletas e/ou duvidosas. Segundo Sattler (1992), o Com base nos escores totais de cada subteste estima-
manual do WISC-III apresenta um limitado nmero de dos pelos avaliadores, as medidas de tendncia central
exemplos, causando dificuldade no estabelecimento de encontradas para cada um foram calculadas e os dados
critrios precisos que se apliquem s diferentes respos- aparecem nas Tabelas 1, 2 e 3.

Tabela 1
Escores Esperados e Observados no Subteste Semelhanas
Escores Concordncia Escores Observados
Protocolos N
esperados (%)
Moda Mdia (DP) Mn-Mx (a)
1 38 13 46,3 13 12,93 1,21 10-15 5
2 39 11 40,4 11 10,38 1,13 8-13 5
3 39 23 26,3 23 22,52 2,07 17-26 9
4 39 8 40,5 8 7,86 1,41 4-11 7
5 39 9 35,6 9 9,71 1,17 8-13 5
6 38 22 31,7 23 22,46 1,27 19-26 7
Nota. N = nmero de respostas vlidas constantes em cada protocolo; a = amplitude.

Tabela 2
Escores Esperados e Observados no Subteste Vocabulrio
Escores Concordncia Escores Observados
Protocolos N
esperados (%)
Moda Mdia (DP) Mn-Mx (a)
1 37 18 12,3 20 19,37 2,84 10-24 14
2 40 22 33,3 22 22,0 1,79 15-24 9
3 39 34 11,9 32 32,45 1,97 27-36 9
4 38 26 22,0 26 25,0 2,82 19-31 11
5 39 24 28,5 24 24,21 2,31 16-30 14
6 38 34 11,8 35 34,79 2,89 29-43 14
Nota. N = nmero de respostas vlidas constantes em cada protocolo; a = amplitude.

452
Figueiredo, V. L. M., Arajo, L. M. G., Dias, T. C. & Busetti, M. V. (2010). Subtestes Semelhanas, Vocabulrio e Compreenso do
WISC-III: Pontuao Objetiva ou Subjetiva?

Tabela 3
Escores Esperados e Observados no Subteste Compreenso
Escores Concordncia Escores Observados
Protocolos N
esperados (%)
Moda Mdia (DP) Mn-Mx (a)
1 37 16 20,0 16 15,85 2,58 9-21 12
2 37 10 39,0 10 10,0 1,10 8-12 4
3 39 20 31,0 20 21,21 2,49 18-28 10
4 37 15 17,5 14 15,10 2,74 10-23 13
5 37 14 50,0 14 13,3 1,45 10-16 6
6 37 25 25,0 25 26,68 2,77 21-32 11
Nota. N = nmero de respostas vlidas constantes em cada protocolo; a = amplitude.

Nas Tabelas 1, 2 e 3 observa-se que, quanto concor- Ainda nas Tabelas 1, 2 e 3, em relao variabilidade
dncia dos avaliadores, em relao aos escores totais, dos escores, observa-se que Vocabulrio (mdia=11,8;
Vocabulrio evidenciou o menor e Semelhanas o maior DP=2,48) e Compreenso (mdia=9,3; DP =3,55) foram
percentual de concordncia em relao ao gabarito. Es- os subtestes que apresentaram maior variabilidade e Se-
tes resultados no coincidem com os de Wechsler (1991), melhanas (mdia=6,3; DP =1,63), apesar da menor
que apontou Compreenso como o de menor ndice de amplitude, tambm evidenciou disperso. Talvez, por
concordncia entre juzes, ao estabelecer o coeficiente Vocabulrio e Compreenso propiciarem maior ocorrn-
de fidedignidade (0,90). Para Sattler et al. (1978), Voca- cia de respostas diferentes das apresentadas no manual,
bulrio foi identificado como o subteste que envolve maior aumente a possibilidade de a pontuao ser influenciada
subjetividade na correo. Deve-se levar em conta que a pela subjetividade do avaliador.
pontuao dada pelas pesquisadoras no teve a preten- Para cada subteste foi realizada a anlise da freqn-
so de ser considerada como a correta, mas como uma cia das pontuaes de cada item, independentemente de
referncia que, ao mostrar-se discrepante dos escores dos o escore ser 2, 1 ou 0. Considerando o total de itens pon-
avaliadores, permitiu identificar a influncia do julga- tuados, calculou-se a percentagem dos que apresentaram
mento na correo. concordncia entre avaliadores igual ou superior a 40%.
As modas, valores mais freqentes de uma distribui- A percentagem de concordncia foi calculada a partir
o, foram prximas aos valores esperados, enquanto as das pontuaes dadas pelos avaliadores a todas as res-
mdias mostraram maior variabilidade devido influn- postas de um mesmo subteste. Assim, como havia dife-
cia dos valores extremos, observados na amplitude das rentes protocolos do teste a serem pontuados, a resposta
pontuaes. Entretanto, a proximidade das mdias e das dada a cada item foi considerada independentemente; por
modas sugere uma distribuio normal. Pelo clculo do exemplo, o item 1 de qualquer subteste, considerando-se
Qui-quadrado, compararam-se os escores esperados com os 6 protocolos, foi analisado como tendo 6 respostas
os da mdia observada; os valores foram menores que o distintas.
tabelado 2 (5, N = 42) = 16,75, p< 0,05, demonstrando Conforme a Tabela 4, dentro de um total de 79 respos-
que as diferenas no foram estatisticamente significati- tas analisadas no subteste Compreenso, apenas em 20%,
vas, ou seja, que os escores observados foram bastante todos os juzes (100%) deram a mesma pontuao. To-
prximos aos esperados. mando-se como referncia o critrio de 80%, valor que
Apesar de estatisticamente no se observarem dife- pode ser considerado como leniente, em Semelhanas, a
renas significativas, sob o ponto de vista qualitativo, o concordncia na pontuao ocorreu em 87% dos 84 itens
desejado seria que pesquisadoras e avaliadores encon- analisados, enquanto, a menor concordncia pde ser
trassem a mesma pontuao, uma vez que esta deter- observada no subteste Compreenso, em que os juzes
minar os coeficientes de inteligncia (QIs) dos exa- concordaram em apenas 65% das pontuaes. Os dados
minandos, pois escores diferentes resultariam em QIs diferem dos de Sattler et al. (1978), que encontraram
distintos para um mesmo sujeito. Entretanto, os escores 80% de concordncia em 51% dos itens de Semelhan-
mnimos e mximos e, conseqentemente, a ampli- as, 49% de Compreenso e 38% de Vocabulrio no
tude, demonstram variabilidade no julgamento, resul- WISC-R. O percentual de itens em que houve concor-
tando em valores considerados outliers. Ao calcular os dncia na pesquisa de Sattler et al. (1978) foi menor,
valores extremos, tomando-se dois desvios-padro em provavelmente, pelo fato de terem sido analisadas so-
relao mdia, identificaram-se em Vocabulrio, Se- mente respostas ambguas, enquanto, no presente estu-
melhanas e Compreenso, respectivamente 10, 9 e 6 do, todas as respostas registradas nos protocolos foram
pontuaes fora da faixa mdia. consideradas.

453
Psicologia: Reflexo e Crtica, 23 (3), 449-455.

Tabela 4
Percentagem Acumulativa de Itens Com a Mesma Pontuao e os Diferentes Critrios de Concordncia

Critrios de concordncia entre avaliadores Percentagem acumulativa de itens nos Subtestes


Compreenso Semelhanas Vocabulrio
(N=79) (N=84) (N=110)

100% 20 30 20
90% 51 71 56
80% 65 87 74
70% 73 93 85
60% 87 95 88
50% 100 99 93
40% 100 100 100

Observa-se que o subteste Semelhanas foi o que apre- Com base nos resultados, conclui-se ser necessria a
sentou maior concordncia entre avaliadores, em prati- aplicao rigorosa dos testes, com os inquritos per-
camente todos os nveis de critrios considerados e os tinentes, e, ainda, a elaborao de um material comple-
menores ndices foram observados, de maneira geral, em mentar que disponibilize critrios para analisar outras
Compreenso. Os resultados coincidiram com os de verbalizaes freqentes no contexto brasileiro, auxi-
Simes et al. (2000), para os quais o subteste mais difcil liando os psiclogos na correo dos subtestes mais sub-
de pontuar objetivamente foi Compreenso. jetivos. Sua finalidade seria a ampliao das respostas-
Os resultados demonstram a influncia da subjetivida- modelo que consistem atualmente na traduo das res-
de na pontuao dos subtestes Semelhanas, Vocabul- postas da amostra de padronizao americana, as quais
rio e Compreenso do WISC-III, corroborando a afirma- exemplificam as pontuaes de cada item, apresentadas
o de Pasquali (2001) de que, em testes no-objetivos, no manual brasileiro.
quando a opinio do apurador entra como fator de deci- O estudo teve algumas limitaes: (a) Percentual de
so, esta pode influenciar os resultados. No caso do WISC- recusas, que impossibilitou uma maior representativi-
III, as conseqncias podem ser funestas, uma vez que o dade dos profissionais que trabalham com o WISC-III;
desenvolvimento cognitivo do examinando (expresso em (b) Protocolos entregues incompletos ou no revisados
QI) determinado por meio dos escores obtidos no teste pelos avaliadores, provavelmente pela tarefa ter exigido
segundo a atribuio do avaliador. muito tempo para sua realizao, o que dificultou algu-
mas anlises. Por outro lado, como ponto positivo, des-
Concluso taca-se a amplitude do estudo, ou seja, o aumento do
nmero de avaliadores, da abrangncia geogrfica, e da
Os subtestes do WISC-III so considerados por quantidade de protocolos analisados, quando comparado
Wechsler (1991) como provas objetivas. Entretanto, os aos procedimentos utilizados nos trabalhos consultados
trs subtestes analisados apresentaram divergncias nas (Belk et al., 2002; Loe et al., 2007; Sherman & Taylor,
pontuaes, mesmo com o estabelecimento de um crit- 2001; Simes et al., 2000; Wechsler, 1991).
rio de 80% de concordncia entre avaliadores. Os sub- Priorizaram-se como foco do presente estudo, anlises
testes Vocabulrio e Compreenso apresentaram maior qualitativas concernentes aos subtestes que causam mais
possibilidade de discordncia na pontuao, enquanto dvidas na pontuao, tentando apresentar aos profissio-
Semelhanas, a menor, sendo este o que eliciou respos- nais as dificuldades e os erros mais freqentes. Dando
tas menos complexas dos examinandos e, conseqente- continuidade a este trabalho, pretende-se, em um pr-
mente, respostas mais fceis de pontuar. ximo estudo, apresentar as anlises psicomtricas rela-
A relevncia da etapa de correo dos dados de um tivas aos coeficientes de fidedignidade com base nos
teste psicolgico est associada interpretao dos re- avaliadores (coeficiente de correlao Intra-Classe), para
sultados, uma vez que escores divergentes produziro, complementar os dados sobre a preciso do instrumento.
no caso das escalas de inteligncia, QIs falseados. Os
resultados da pesquisa reforam que a correo dos Referncias
subtestes Vocabulrio, Compreenso e Semelhanas do
WISC-III exige familiaridade com os critrios de pon- Alchieri, J. C., & Cruz, R. M. (2003). Avaliao psicolgica:
tuao, uma vez que envolvem subjetividade. Portanto, Conceitos, mtodos e instrumentos (Vol. 1). So Paulo, SP:
importante que os psiclogos consultem os pares sem- Casa do Psiclogo.
pre que ocorrerem dvidas, para que a anlise seja revi- Anastasi, A., & Urbina, S. (2000). Fidedignidade. In A.
sada na tentativa de minimizar possveis erros. Anastasi & S. Urbina, Testagem psicolgica (7. ed., pp. 84-

454
Figueiredo, V. L. M., Arajo, L. M. G., Dias, T. C. & Busetti, M. V. (2010). Subtestes Semelhanas, Vocabulrio e Compreenso do
WISC-III: Pontuao Objetiva ou Subjetiva?

105). Porto Alegre, RS: Artes Mdicas.


Belk, M. S., LoBello, S. G., Ray, G. E., & Zachar, P. (2002).
WISC-III administration, clerical, and scoring errors made
by student examiners. Journal of Psychoeducational
Assesment, 20, 290-300.
Cunha, J. A. (2000). Escalas Wechsler. In J. A. Cunha (Ed.),
Psicodiagnstico V. (5. ed., Vol 1, pp. 529-602). Porto Ale-
gre, RS: Artes Mdicas.
Loe, S. A., Kadlubek, R. M., & Marks, W. J. (2007).
Administration and scoring errors on the WISC-IV among
Graduate Student Examiners. Journal of Psychoeducational
Assesment, 25(3), 237-247.
McIntire, S., & Miller, L. (2000). Foundations of Psychological
Testing. Boston: McGraw-Hill.
Pasquali, L. (1999). Testes referentes a construto: Teoria e
modelo de construo. In L. Pasquali, Instrumentos psico-
lgicos: Manual prtico de elaborao (pp. 21-52). Braslia,
DF: LabPAM.
Pasquali, L. (2001). Tcnicas de exame psicolgico - TEP.
Manual. So Paulo, SP: Casa do Psiclogo.
Pasquali, L. (2003). Teoria da medida. In L. Pasquali,
Psicometria: Teoria dos testes na Psicologia e na Educa-
o (Vol. 1, pp. 23-51). Petrpolis, RJ: Vozes.
Sattler, J. (1992). Assessment of children: WISC-III and
WPPSI-R supplement. San Diego, CA: Jerome M. Sattler.
Sattler, J. M., Andres, J. R., Squire, L. S., Wisely, R., & Maloy,
C. F. (1978). Examiner scoring of ambiguous WISC-R
responses. Psychology in the schools (4nd ed., Vol. 15, pp.
486-489). San Diego, CA: Verlag Chemie.
Sherman, L., & Taylor, A. (2001). Experimentally manipulated
bias in school psychologists scoring of WISC-III protocols.
Paper presented at the annual meeting of the Mid-Western
Educational Research Association, Chicago, IL. Retrieved
November 22, 2008, from http://www.users.muohio.edu/
shermalw/mwera_version5_files/mwera_version5.htm
Simes, M. R., Santos, M. J. S., Pereira, M., Albuquerque, C.
P., Vilar, M., Lana, C., et al. (2000, ago.). Estudos de pre-
ciso com a WISC-III: Acordo intercotadores e teste-reteste
[Abstract]. In Anais da VII Conferncia Internacional Ava-
liao Psicolgica: Formas e Contextos (pp. 25). Belo
Horizonte, MG.
Wechsler, D. (1991). Wechsler Intelligence Scale for Children
- WISC-III: Manual (3th ed.). San Antonio, TX: Psychological
Corporation.
Wechsler, D. (2002). Escalas de Inteligncia Wechsler para
Crianas: Manual (3. ed., V. L. Marques de Figueiredo,
Adaptao e padronizao brasileira). So Paulo, SP: Casa
do Psiclogo.

Recebido: 20/02/2009
1 reviso: 03/08/2009
Aceite final: 02/09/2009

455

Anda mungkin juga menyukai