Anda di halaman 1dari 26

Laboratrio de Psicologia, 4(1): 65-90 (2006)

2006, I.S.P.A.

Qual a fiabilidade do alfa de Cronbach?


Questes antigas e solues modernas?
Joo Maroco
Teresa Garcia-Marques
Instituto Superior de Psicologia Aplicada, Portugal

Resumo
A anlise da consistncia interna de uma medida psicolgica uma necessidade aceite na comunidade
cientfica. Entre os diferentes mtodos que nos fornecem estimativas do grau de consistncia de uma
medida salienta-se o ndice de Cronbach sobre o qual acenta a confiana da maioria dos investigadores.
Os utilizadores deste mtodo tm-no sugerido como conservador especialmente para os casos em que
os itens da escala so heterogneos, so dicotmicos ou definem estruturas multi-factoriais: o alfa de
Cronbach fornece uma sub-estimativa da verdadeira fiabilidade da medida. Neste artigo apresentamos e discutimos o mtodo de Cronbach, com nfase na inferncia sobre este ndice e nas propostas
alternativas a este mtodo de estudo da consistncia interna. Por ltimo faremos uma breve
referncia discusso que emerge no campo no que concerne a interpretao deste ndice feita pelas
perspectivas psicomtrica vs. datamtrica.
Palavras-chave: Alfa de Cronbach, Fiabilidade, Psicometria.

Abstract
The analysis and report of a psychological measures internal consistency is a well established
requirement in the scientific community. Among the several available methods to estimate internal
consistency, Cronbachs ranks high in most researchers preferences. However, Cronbachs
underestimates the true reliability specially when the scales items are heterogeneous, dichotomous, or
define multi-factorial structures. Thus, it is a conservative estimator of internal consistency. In this
paper, we discuss Cronbachs with emphasis on inference and on alternative proposals to estimate
internal consistency. We also make reference to the emerging discussion in the psychometric vs.
datametric interpretations of Cronbachs .
Key words: Cronbach Alpha, Psychometric, Reliability.
A correspondncia relativa a este artigo dever ser enviada para: Joo Maroco, Instituto Superior de Psicologia Aplicada, Rua Jardim do Tabaco, 34,
1149-041 Lisboa; E-mail: jpmaroco@ispa.pt

66

J. Maroco & T. Garcia-Marques

Qualquer referencia a questes de fiabilidade1 (reliability) de uma medida suscita referncia ao ndice
alfa de Cronbach. A maioria dos investigadores, talvez com excepo daqueles que dedicam alguma
ateno rea da psicometria, tende no apenas a consider-lo o ndice universalmente aconselhvel
para o estudo mtrico de uma escala (qualquer que sejam as suas caractersticas) como tendem a
perceb-lo como fornecendo estimativas fiveis da fiabilidade de uma escala.
Neste artigo pretendemos chamar ateno dos leitores para a diversidade de ndices alternativos ao
ndice de Cronbach e para as caractersticas deste ltimo. Queremos responder questo da validade e
fiabilidade das suas estimativas. Para podermos compreender a questo analisaremos em primeiro lugar
o conceito de fiabilidade de uma medida, as propostas para a sua estimativa, para nos focarmos de seguida
de forma mais aprofundada na proposta associada ao nome de Cronbach. Neste artigo adicionamos
informao detalhada para aqueles que se interessam pela forma como as estatsticas so desenvolvidas
e definidas e por isso assume-se que o leitor interessado nestas temticas ter proficincia bsica com a
formulao estatstica. Contudo, e procurando instrumentalizar esta reviso de literatura para o
utilizador menos interessado nos pormenores tcnicos, fornecemos informao sobre o modo como este
ndice se pode calcular com dois programas estatsticos de utilizao ubqua nas cincias scias e
humanas: o SPSS e o STATISTICA (Anexo), com nfase nas limitaes e interpretaes da estimao da
fiabilidade de um instrumento.
Apontaremos de seguida algumas limitaes e ms interpretaes associadas ao uso do ndice de
Cronbach, apresentando as alternativas de clculo actualmente aceites como melhores estimadores de
fiabilidade de uma escala. Apresentamos ainda a formulao que permitir ao leitor interessado utilizar
estes estimadores que no se encontram ainda disponveis nos softwares, mas que so j exigidos por
algumas publicaes das cincias sociais e humanas (como por exemplo o caso dos intervalos de
confiana para o alfa de Cronbach).
Por fim confrontaremos o leitor com duas perspectivas tericas associadas ao significado de uma
estimativa de fiabilidade. Indica-nos ela que o instrumento utilizado para obter uma medida fivel
ou apenas que os dados com o instrumento so fiveis?

O conceito de fiabilidade
A fiabilidade de uma medida refere a capacidade desta ser consistente. Se um instrumento de medida
d sempre os mesmos resultados (dados) quando aplicado a alvos estruturalmente iguais, podemos
confiar no significado da medida e dizer que a medida fivel. Dizemo-lo porm com maior ou menor
grau de certeza porque toda a medida sujeita a erro. Assim a fiabilidade que podemos observar nos
nossos dados uma estimativa, e no um dado.
Qualquer medida, classificao X obtida por uma escala ou teste por um indivduo, tem sempre
duas componentes aditivas (ver e.g., Pasquali, 2003): o verdadeiro score (resultado), capacidade,
classificao ou medida () do objecto e o erro de medida do atributo ou capacidade do objecto (x):
(1)
Erro a variabilidade observada no processo de mensurao de um mesmo objecto. Ausncia de
erro consistncia. Consistncia assim o termo fundamental para definir o conceito de fiabilidade.
2

Optamos pela traduo do termo reliability por fiabilidade. Em outros textos este termo tem sido traduzido por preciso, fidelidade,
fidedignidade.

O alfa de Cronbach

67

Fiabilidade vs. validade


Mas o erro (x) associado variabilidade observada um erro aleatrio (o que uma caracterstica
desejada mas que se pretende ser de magnitude reduzida). O erro pode porm ser sistemtico. O erro
sistemtico traduz no uma questo de fiabilidade mas uma questo de Validade. O instrumento com
erro sistemtico um instrumento com validade reduzida, um instrumento que est a medir algo que
no era suposto medir (mesmo que o faa de forma fivel). Qualquer medida para ser vlida enquanto
medida de um dado construto, tem necessariamente de ser fivel. Pelo que, a fiabilidade surge como
condio necessria, mas no suficiente, para a validade. Note-se que os dados de uma medida no
fivel, so dados aleatrios, logo dados sem significado. Nada nos dizem. Assim sendo, dados no
fiveis, no so, igualmente validos, visto no traduzirem o conceito que pretenderiam traduzir. Assim
a fiabilidade de uma medida o primeiro passo para saber da sua validade. No entanto se esta
condio necessria validade ela no suficiente. Aps garantir fiabilidade necessrio pr de lado
a hiptese de existncia de erro sistemtico, para podermos garantir validade.
Fiabilidade e unidimensionalidade
importante notar que se uma medida unidimensional, ela apresenta de certo uma maior
consistncia. No entanto, a consistncia de uma medida nada diz sobre a sua dimensionalidade. Na
verdade a escala pode ter vrios factores e ainda assim apresentar um nvel de consistncia interna
elevado (ver e.g., Cortina, 1993). A consistncia uma condio necessria mas no suficiente para a
unicidade da escala. Um conjunto de itens pode apresentar elevada consistncia interna, i.e.,
apresentarem-se interrelacionados, mas ainda assim definir uma escala multidimensional (Green,
Lissitz, & Mulaik, 1977; Cortina, 1993).
A elevada consistncia na presena de multidimensionalidade indica que os itens que compem
as diferentes dimenses de uma medida esto fortemente correlacionados, apesar das dimenses em si,
estabelecerem uma relao inferior quela que observada entre os itens que as compem. Com um
exemplo corriqueiro percebe-se facilmente o conceito. Imaginemos que queremos uma medida do
tamanho do p de uma pessoa. Medimos as suas meias, os seus tnis, as suas pantufas, etc. O grau de
relao entre as diferentes medidas elevado e a sua mdia pode fornecer-nos uma estimativa fivel
do tamanho do p do indivduo. Nunca confundiramos no entanto, o p com o sapato, nem a meia com
o sapato. Seriam dimenses distintas que nos informam sob o mesmo constructo subjacente. Contudo,
e ao contrrio deste exemplo, a ortogonalidade de factores nem sempre aparente nas medidas
psicolgicas o que, associado, tradio de se forar a existncia de uma estrutura factorial ortogonal,
desaconselha a aplicao da fiabilidade como medida de dimensionalidade. E claro est, uma escala
pode ser unidimensional e por falta de fiabilidade da sua medida ou elevado erro de medida, apresentar
fraca consistncia. Voltaremos adiante a este conceito.
O conceito estatstico de fiabilidade
Considerando o erro aleatrio como variabilidade intra-sujeito, os dados associados a uma medida
permitem-nos inferir a sua fiabilidade atravs da varincia observada intra e inter-sujeitos/objectos.
Quanto maior a varincia intersujeitos [V()] maior a informao que essa medida transporta;
pelo contrrio, se esta varincia for nula, a medida constante, e a informao transportada
naturalmente, reduzida. Assumindo, teoricamente, que a caracterstica mensurada () independente
do erro de medida (x), a varincia geral dos dados [V(X)] dada por:

68

J. Maroco & T. Garcia-Marques

(2)
i.e., a varincia observada nos dados a soma da varincia intersujeitos e dos erros de medio
(variancia intra-sujeitos). A fiabilidade de um instrumento, teste ou escala ento formalmente
definida como sendo a fraco da varincia (informao) do score verdadeiro (no medido
directamente) que retida pelo score observado:
(3)
Por exemplo, um =0.80 indica que 80% da varincia observada nos scores do teste devida ao facto
de se estar a medir diferentes objectos (varincia real) enquanto que o restante 20% resultante do erro
de medida (variabilidade associada medida do mesmo objecto). Mas, como separar as componentes
de variabilidade V() e V()?

Como estimar a consistncia de uma medida?


A lgica de qualquer processo de estimativa conhecida de forma intuitiva por todos ns. Tomemos
como exemplo intuitivo, o uso de uma balana numa charcutaria. Encomendamos 100g de fiambre, o
mostrador da balana marcou 101g. Por alguma razo o empregado repete o processo de mensurao.
Se volta a marca 101g, no nos espantamos. A segunda medida estabeleceu uma relao perfeita com
a segunda. E se marcar 105g? Percebemos que a balana comete erros, porque induz variabilidade
intra-fiambre. Se repetssemos o processo e o resultado fosse 100g 101g 104g 101g, teramos uma
estimativa da grandeza dos erros cometidos pela balana. Estes parecem relativamente
insignificante. Mas, se o resultado fosse 80g, 106g, 85g, 119g essa estimativa sugeria um erro de
elevada grandeza. Torna-se saliente neste exemplo que o processo bsico para estimar a consistncia
de uma medida envolve a repetio da mensurao sob o mesmo objecto adicionada avaliao da
relao entre as diferentes medidas obtidas.
Estimao da magnitude da fiabilidade
assim possvel estimar a fiabilidade de um medida se tivermos, pelo menos duas medidas de um
mesmo objecto. Esta estimativa de consistncia entre as duas medidas vai depender da fora da relao
existente entre as duas medidas e da sua variabilidade.
Em termos estatsticos, V() e V()? so passveis de serem estimados com base em, pelo menos,
duas medidas X1 e X2 de um mesmo objecto:
(4)
Estas duas medidas apresentam 3 propriedades importantes, de acordo com a teoria clssica da medida:
a) a capacidade real latente () mantm-se inalterada e no afectada pelos erros [Cov(, x1)=0]; b) a
variao observada entre X1 e X2 devida aos erros aleatrios (x1 e x2) que so independentes
[Cov(x1, x2)=0] e de valor esperado nulo [E(x1)=0 e E(x2)=0] e c) X1 e X2 covariam pois partilham
. Esta partilha, estimada pela covarincia entre X1 e X2, fulcral estimao operacional da

O alfa de Cronbach

69

fiabilidade j que intuitivo que quanto maior a fraco da varincia de X1 e X2 que devida a , maior
a correlao entre as duas medidas. A covarincia entre X1 e X2, i.e., a varincia comum de X1 e X2,
essencialmente, uma estimativa de V() (sendo o elemento comum de X1 e X2). Estandardizando a
covarincia, i.e., dividindo a covarincia de X1 e X2 pelos desvios-padro de X1 e X2 obtm-se:
(5)
que forma ubqua do coeficiente de correlao de Pearson. Uma vez que X1 e X2 medem supostamente a mesma caracterstica ou medida expectvel que SX1=SX2=SX donde:
(6)
A fiabilidade pode assim ser estimada pelo coeficiente de correlao de duas medies convergentes.
De (6) resulta a definio operacional de fiabilidade: correlao entre duas formas paralelas ou
convergentes do teste ou instrumento de medida. sobre esta forma, usando medidas repetidas, que a
fiabilidade geralmente estimada. A forma mais intuitiva a de utilizar o mesmo instrumento em
momentos distintos e este procedimento designa-se teste re-teste. Se existir estabilidade na medida os
resultados estaro fortemente relacionados. Quando falamos em medidas psicolgicas sabemos porm
que existem factores que podem induzir diferenas nas respostas apenas por estarmos a aceder a uma
medida junto de um mesmo individuo duas vezes com o mesmo instrumento. Esta a razo de ser do
procedimento de comparao de formas equivalentes. Sabendo-as equivalentes pressupomos que os seus
resultados estejam relacionados informando-nos igualmente da estabilidade ou consistncia da medida.
Fiabilidade enquanto consistncia interna de uma medida
Na Psicologia e nas Cincias Sociais, so geralmente usadas escalas multi-item (usualmente
construdas segundo a metodologia proposta por Likert, 1932) para avaliar diferentes capacidades,
caracteristicas de personalidade, ou outras dimenses psicolgicas. Em muitas circunstncias o score
total da escala resulta da combinao dos itens (por exemplo, por soma) e os resultados so submetidos
a anlise de fiabilidade. Se a nossa medida uma escala com vrios itens, podemos estrategicamente
pressupor que metade dos itens mede o mesmo que a outra metade, sendo formas equivalentes de
medida. Mas o que mede exactamente a correlao entre os scores das duas metades do teste e o total
da escala? O procedimento de split-half, proposto por C. Spearman (1910) e W. Brown (1910) refere
que se a correlao entre as medidas fornecidas por duas metades da escala for elevada a escala tem
coerncia com o teste na sua globalidade, i.e., tem consistncia interna: As duas metades do teste
medem o mesmo constructo. Se a correlao for baixa, as duas metades medem constructos diferentes.
A correlao entre as duas metades de um teste dada por:
(7)
onde
a varincia dos resultados totais do teste (i.e., a varincia dos scores totais do
teste (i.e., a varincia dos scores totais
de cada indivduo i nos k itens) e S2T1 e S2T1 so as
varincias dos resultados totais das metades 1 e 2 do teste. Assumindo, a homogeneidade de
covarincias e varincias, e usando as correlaes no redundantes entre os k itens, assumidas como

70

J. Maroco & T. Garcia-Marques

a
homogneas (12=13==21=23==) e estimadas pela correlao mdia entre os itens (r),
expresso (7) pode ser reescrita como:

(8)
de referir porm (ver e.g., Laveault & Grgoire, 2002) que (i) a fiabilidade calculada deste modo
fornece a preciso do resultado total a partir dos resultados parciais das metades do teste o que pode
sub-estimar a verdadeira fiabilidade total (aquela que de facto interessa) e (ii) depende da forma de
diviso dos itens pelas duas metades ou formas equivalentes.
A informao fornecida pelos diferentes procedimentos no exactamente a mesma. Tal levou
considerao de trs tipos de fiabilidade (ver por exemplo, Krathwohl, 1998). A fiabilidade de
estabilidade avalia a consistncia com que uma medida se perpetua ao longo do tempo; por outro lado,
a fiabilidade de equivalncia avalia a consistncia com que diferentes formas de um teste ou instrumento medem um mesmo constructo latente. Finalmente, a consistncia interna avalia a consistncia
com que um determinado conjunto de itens de medida estima um determinado constructo ou dimenso
latente. Estudar a consistncia interna de uma medida como uma estimativa da sua fiabilidade tem a
vantagem de apenas implicar um processo de mensurao. Assim, so vrias as propostas de ndices
que nos permitem aceder a essa estimativa. Spearman e Brown, propuseram uma correco que
permite, em termos prticos, corrigir a sub-estimao da consistncia pelo mtodo split-half.
Considerando a correlao entre as metades T1 e T2 do teste, a consistncia corrigida de SpearmanBrown estimada por:
(9)
Contudo, essa correco s produz estimativas da verdadeira correlao entre as metades do teste,
quando estas respeitam a definio de formas estritamente paralelas. Se as varincias das duas metades
forem muito diferentes, a estimativa da fiabilidade do teste na sua globalidade corre o risco de ser
errnea (Laveault & Grgoire, 2002).
O segundo problema com a estimativa da fiabilidade resultante da forma de diviso dos itens
ainda mais srio. possvel conceber vrias metades (por exemplo itens impares vs. itens pares como
na proposta inicial de Spearman) e nada nos garante que os resultados fossem os mesmos (raramente
so). Os clculos de consistncia so, assim, afectados pela forma de diviso dos itens e qualquer
coeficiente de fiabilidade calculado desta forma , em certo, grau incorrecto (Cronbach & Shavelson,
2004). Um processo possvel de ultrapassar este problema, seria ento o de conceber todas as metades
possveis, e estabelecer as diferentes relaes entre essas metades, computando a sua mdia como um
ndice de consistncia interna. Kuder e Richardson (1937) tentaram clarificar a disperso dos clculos
da consistncia provocados pela multiplicidade de modos de diviso do teste em partes paralelas e
propuseram dois ndices que se distinguiram como medida de consistncia interna: KR 20 e KR21.
No caso dos itens serem dicotmicos (e.g., Certo e Errado; Sim e No codificados respectivamente como Xij=1e Xij=0 onde i=1, , n representa os n sujeitos avaliados nos j=1, k itens da
escala ou teste) a consistncia interna dada pela frmula 20 de Kuder e Richardson:

(10)

O alfa de Cronbach

71

Onde pj a proporo de 1 do item j (j=1, , k) (se 1 indicar a resposta correcta, ou a presena


atributo de interesse, pj reflecte o coeficiente de dificuldade do item) e qj=1-pj. A expresso pjqj estima
varincia do item j e S2T a varincia do total da escala. Se os itens tiverem sensivelmente o mesmo
coeficiente de dificuldade e a mesma varincia, a fiabilidade pode ser estimada pela frmula KR21 de

clculos mais simples (e generalizvel) uma vez que depende apenas da mdia do teste (X) e da
varincia dos resultados totais:
(11)
Se os itens tiveram graus de dificuldade muito diferentes o KR21 d tendencialmente resultados
inferiores ao KR20.
Em virtude da sua simplicidade e em particular da proposio de que a fiabilidade podia ser
determinada pela aplicao singular do instrumento, a KR20 foi adaptada rapidamente pela maioria
dos cientistas das cincias sociais no clculo da fiabilidade. Contudo, apenas quando os pressupostos
do mtodo se verificam, esta formula estima de forma consistente a verdadeira fiabilidade (). Em
particular, se as covarincias inter-itens no forem homogneas, a KR20 sub-estima de forma
consistente a verdadeira fiabilidade e, contrariamente ao objectivo inicial, exige a aplicao do
instrumento a pelo menos duas amostras independentes. Atento a este problema, e numa tentativa de
unificar o conceito de fiabilidade em torno da ideia original de Sperman, L. Guttman (1945) derivou
seis frmulas que permitem estimar um limite inferior para a a partir de uma nica aplicao do
instrumento de medida repetidamente a um nico sujeito (Zimmerman, Williams, Zumbo, & Ross,
2005).
De entre as seis frmulas propostas por Guttman, destacam-se os 2, 3 e 4.
(12)

Onde
um clculo auxiliar na determinao de 2. O 3, uma extenso da KR20, o que segundo
Guttman (1945) pura coincidncia:

(13)

O coeficiente 4 (Fiabilidade split-half de Guttman)


(14)
Guttman recomenda que se experimente com a diviso em duas metades (1 e 2) do instrumento que
maximize 4, usando depois o maior dos 2 e 3 como estimativa do limite inferior da fiabilidade. Num
estudo posterior, e reconhecendo que o pressuposto de independncia dos erros da teoria clssica de
media irrealista em muitas situaes, Guttman (1953) expandiu as suas frmulas de forma a
considerarem erros de medida correlacionados apesar de estas frmulas serem actualmente pouco
usadas (Zimmerman et al., 2005).

72

J. Maroco & T. Garcia-Marques

O alfa de Cronbach: Uma estimativa estatstica da consistncia interna


L. J. Cronbach publica, em 1951, um artigo quase enciclopdico onde discute os problemas associados
estimao da consistncia interna de uma escala ou teste e as propostas de outros autores para o seu
clculo. Neste artigo seminal, Cronbach considerando as derivaes anteriores de Kuder-Richarson e
Guttman, e assumindo os mesmos pressupostos mas sem limites no padro de classificao dos itens,
formaliza uma proposta de estimativa de consistncia interna a partir das varincias dos itens e dos
totais do teste por sujeito, que ficou conhecida como o ndice alfa de Cronbach.
A frmula proposta por Cronbach :

(15)

onde k o nmero de itens do instrumento,


a varincia do item j (j=1, ..., k) e S2T
a varincia dos totais da escala definida em (8).
Esta frmula uma aplicao particular do coeficiente de correlao intra-classes popularizado na
dcada de 40 por R. A. Fisher em aplicaes biomtricas e ubiquamente conhecida por de Cronbach
apesar de este coeficiente no ser mais do que uma generalizao do KR20 proposto alguns anos antes
por Kuder e Richardson (1937) para itens dicotmicos2. Nos ltimos 50 anos, o de Cronbach, tem
satisfeito a funo que os psicometristas procuravam desde os primeiros trabalhos de Spearman e
Brown, para uma medida valida de consistncia interna e a medida de consistncia, compreendida ou
no, usada por excelncia. Curiosamente, como refere Cronbach e Shavelson (2004), a designao de
alfa (inicialmente Alfa de Kuder-Richardson) pretendia apenas reflectir a convico do autor de que
esta frmula simplesmente a primeira de um conjunto de clculos necessrios para avaliar as
propriedades de uma escala para alm da fiabilidade. Usando a soma de varincias, o de Cronbach
algebricamente idntico ao 3 de Guttman. Contudo, Guttman derivou os seus lambdas como uma
estimativa do limite inferior da fiabilidade, impondo que, para que estas formas estimassem a verdadeira
fiabilidade, era necessrio que todas as varincias-covarincias inter-itens fossem homogneas.
Porque a frmula do de Cronbach no faz assumpes relativas homogeneidade das
varincias-covarincias inter-itens, este ndice subestima a verdadeira consistncia de uma medida
(veremos adiante outros factores que provocam a subestimao do ). Na realidade, raramente os itens
de um instrumento apresentam a mesma variabilidade e/ou grau de dificuldade, pelo que o de
Cronbach tende a subavaliar a fiabilidade total de uma medida, estimando de forma conservadora a
verdadeira fiabilidade. Uma forma de lidar com este problema a de promover tal homogeneidade por
estandardizao dos itens antes de calcular o ndice ou a de trabalhar directamente com coeficientes de
correlao (covarincia estandardizada), o que resulta num ndice de Cronbach estandardizado.
O de Cronbach standardizado calculado a partir da correlao mdia (r) dos k(k-1)/2
coeficientes de correlao no-redundantes inter-itens:
(16)
que a frmula (8) de Sperman-Brown sobre o pressuposto de homogeneidade de correlaes interitens. A frmula (16) ilustra o facto de que o , que deve variar entre 0 a 1, poder ser inferior 0, o que
acontece quando a correlao mdia entre os itens negativa.
2

A varincia do item dada por


1 no item j. Substituindo

reduz-se a S2j=pjqj se X for uma varivel dicotmica com realizaes 0 e 1 sendo pj a proporo de
por em (13) obtm-se (15).

O alfa de Cronbach

73

O que indica um determinado valor de alfa de Cronbach?


O ndice estima quo uniformemente os itens contribuem para a soma no ponderada do
instrumento, variando numa escala de 0 a 1. Esta propriedade conhecida por consistncia interna da
escala, e assim, o pode ser interpretado como coeficiente mdio de todos as estimativas de
consistncia interna que se obteriam se todas as divises possveis da escala fossem feitas (Cronbach,
1951). Cortina (1993) descreve outras interpretaes para o ndice de Cronbach, referindo que o
uma medida estvel de fiabilidade pois no est sujeito variabilidade resultante da forma como o
instrumento ou teste dividido para calcular a fiabilidade split-half. Do que foi apresentado at agora
torna-se claro que quanto mais elevadas forem as covarincias (ou correlaes entre os itens) maior
a homogeneidade dos itens e maior a consistncia com que medem a mesma dimenso ou constructo
terico. Por outro lado a consistncia interna estima a fiabilidade de um instrumento porque quanto
menor a variabilidade de um mesmo item numa amostra de sujeitos, menor o erro de medida que
este possui associado (ver e.g., Pasquali, 2003). Assim, quanto menor for a soma das varincias dos
itens [o numerador das frmulas (10), (13) e (15)] relativamente varincia total dos sujeitos, mais o
coefeciente se aproxima de 1, significando que mais consistente e, consequentemente, mais fivel o
instrumento. De acordo com esta definio, o , por vezes, interpretado como uma medida de
saturao de um factor comum (ou constructo latente) de primeira ordem (i.e., uma medida do grau em
que um nico factor latente motiva a correlao entre todos os itens de uma escala). Contudo, como
referimos anteriormente, ainda que um conjunto de itens com elevado, defina a presena forte de
factor comum, um elevado no demonstra a presena de uma escala uni-factorial. Pelo que sendo o
uma medida de fiabilidade ele no nos informa sobre dimensionalidade.
De um modo geral, um instrumento ou teste classificado como tendo fiabilidade apropriada
quando o pelo menos 0.70 (Nunnally, 1978). Contudo, em alguns cenrios de investigao das
cincias sociais, um de 0.60 considerado aceitvel desde que os resultados obtidos com esse
instrumento sejam interpretados com precauo e tenham em conta o contexto de computao do
ndice (DeVellis, 1991). Peterson (1994) numa meta-anlise da utilizao do de Cronbach na
literatura das cincias sociais e humanas, observou um mdio de 0.70 (na medio de valores) a 0.82
(na medio da satisfao com o trabalho). Com poucas excepes, este autor no observou nenhuma
relao entre a magnitude do e o design experimental das caractersticas investigadas. A Tabela 1,
resume os nveis de fiabilidade recomendados por diversos autores, que pelo exposto anteriormente,
deve servir como uma base de partida e no como critrio definitivo de classificao.
Tabela 1
Critrios de recomendao de Fiabilidade estimada pelo de Cronbach (adaptado de Peterson, 1994)
Autor
Davis, 1964, p. 24

Condio
Previso individual
Previso para grupos de 25-50 indivduos

Kaplan & Sacuzzo, 1982, p. 106

Investigao fundamental
Investigao aplicada

Murphy & Davidsholder, 1988, p. 89

Fiabilidade inaceitvel
Fiabilidade baixa
Fiabilidade moderada a elevada
Fiabilidade Elevada

Nunnally, 1978, p. 245-246

Investigao preliminar
Investigao fundamental
Investigao aplicada

considerado aceitvel
Acima de 0.75
Acima de 0.5
0.7-0.8
0.95
<0.6
0.7
0.8-0.9
>0.9
0.7
0.8
0.9-0.95

74

J. Maroco & T. Garcia-Marques

Como referimos anteriormente o clculo do de Cronbach permite que este assuma valores negativos
quando as correlaes inter-itens so, elas prprias, negativas. Um negativo reflecte normalmente
um erro srio na codificao dos pontos dos itens e a soluo passa pela recodificao (inverso) dos
pontos de forma a assegurar que todos os itens esto codificados na mesma direco conceptual.
Adicionalmente, um muito baixo pode reflectir a codificao errada de itens ou a mistura de itens
de dimenses diferentes exigindo a reavaliao da base terica que motivou a construo da escala.

A fiabilidade do de Cronbach: Computao de intervalos de confiana


Como j referimos, o ndice de Cronbach uma estimativa lower-bound da fiabilidade de uma
medida (ver exemplo, Crocker & Algina, 1986), pelo que, a verdadeira estimativa de fiabilidade dos
dados actuais tem baixa probabilidade de ser mais pequena e elevada probabilidade de ser muito maior
do que o valor reportado. Mas tal no significa que o ndice associado a uma nica medida no possa
estar a sobre-estimar o que ocorrer num segundo momento de mensurao. Apenas quer dizer que a
distribuio da estimativa est centrada abaixo do verdadeiro valor de fiabilidade da medida. Qual
poder ento ser esse valor?
Estando toda a estimativa estatstica sujeita a erro isto qualquer a medida est impregnada de
varincia por explicar, a estimativa do ndice de Cronbach no nenhuma excepo. Quando o
investigador possui ao seu dispor a inferncia estatstica, deixa de ser suficiente reportar a fiabilidade
com base numa nica estimativa pontual de . O intervalo de confiana apresenta maior informao
de diagnstico da fiabilidade e por isso o seu clculo recomendado por diversas publicaes
peridicas (por exemplo a Educational and Psychological Measurment; Fan & Thompson, 2001).
Hoydt (1941) demonstrou que o pode ser expresso como uma funo simples dos quadrados
mdios dos sujeitos (QMS)e dos quadrados mdios dos itens x sujeitos (QMSxI), obtidos de uma de
ANOVA em blocos casualizados. Assim, o pode estimar-se como:
(17)
A partir deste resultado, e sabendo que o rcio de quadrados mdios apresenta distribuio F-Snedecor,
Kristof (1963) e Feldt (1965) demonstram que ^~1(1)F[(k1) (n1); (n1)] se os itens apresentarem
distribuio normal multivariada com matriz de varincias-covarincias homogneas (simetria
composta) (Feldt, 1990). Um intervalo de confiana exacto para a (1)x100% pode ento ser
estimado por (para uma deduo mais recente deste intervalo ver Kistner & Muller, 2004):
(18)
Onde ^ a estimativa amostral do e f/2; [(n1), (n1); (k1)] e f1/2; [(n1), (n1); (k1)] so os quantis da
F-Snedecor nos percentis /2 e 1/2 com (n1) e (k1) (n1) graus de liberdade respectivamente.
O estudo das caractersticas distribucionais do de Cronback permite igualmente o
desenvolvimento de estatstica inferencial e o teste de hipteses relativas magnitude do valor .
assim possvel testar a probabilidade de erro associada afirmao de que o teste tem um coeficiente
de fiabilidade igual ou superior a, por exemplo, 0.70.
Como descrito em Feldt (1965) e mais recentemente em Charter e Feldt (1996), um teste de
hipteses a H0:=0 vs. H1:0 pode fazer-se com a estatstica de teste:

O alfa de Cronbach

75

(19)
Se, para um nvel de significncia , Wf/2; [(n1), (n1); (k1)] ou se Wf1/2; [(n1), (n1); (k1)] rejeita-se
H0. contudo de referir que o teste bilateral tem interesse reduzido uma vez que de uma forma geral
estamos interessados em que o nosso seja superior a um valor limite (0.6 ou 0.7, ver Tabela 1) para
aceitar o instrumento como fivel. O teste H0:0 vs. H1:>0 onde 0=0.7 (ver e.g., Nunnaly &
Bernstein, 1994; Fan & Thompson, 2001; Iacobucci & Duhacheck, 2003) de aplicao mais
generalizada. Naturalmente, rejeita-se a H0 se Wf1; [(n1), (n1) (k1)].
Investigao mais recente sobre as propriedades distribucionais do (van Zyl et al., 2000; Kistner
& Muller, 2004) demonstraram que (13) o estimador de mxima verosimilhana de quando os itens
apresentam distribuio normal multivariada e simetria composta. medida que n, a estatstica
^ o estimador de mxima verosimilhana de e Q a varincia dada, em
^ )~N(0,Q) onde
n(
forma matricial, por:
(20)
Onde 11xk=[1 1 1 1] um vector de k 1s, a matriz de covarincias populacionais entre os itens
(geralmente estimada pela matriz de covarincias amostrais S) e tr a funo trao (soma dos
elementos diagonal de uma matriz). Esta expresso, em forma algbrica pode exprimir-se como:

(21)

Onde ij o elemento ij da matriz . No caso do estandardizado () e sobre os mesmos pressupostos


anteriores, a expresso 17 simplifica-se a (Duhachek et al. 2005):
(22)
Intervalos de confiana assimptticos a (1)x100% para (e substituindo Q por Q) podem ento
obter-se com a expresso3.
(23)
Onde Q/n o erro-padro de. A estatstica de teste para o teste de hipteses a ento
(24)
A rejeio de H0 ocorre quando o valor absoluto de Z for superior ou igual ao quantil da N(0,1) no
percentil 1/2 no caso do teste bilateral ou quando Z for superior ou igual ao quantil da N(0,1) no
percentil 1 no caso do teste unilateral direita.
3

Iacobucci e Duhacheck (2003) apresentam em Anexo Macros de SPSS e SAS para calcular o , o erro-padro do e o intervalo de confiana.

76

J. Maroco & T. Garcia-Marques

Duhacheck e Iacobucci (2004) compararam propostas alternativas de outros autores para o


clculo do intervalo de confiana para o assumindo a validade dos pressupostos descritos e, numa
srie de simulaes de Monte-Carlo, apresentam resultados que demonstram a superioridade das
frmula (23) (em particular para amostras de grande dimenso) e (18) (em particular para amostras de
dimenso moderada) relativamente a outras alternativas de clculo.

Factores que afectam a magnitude do ndice de fiabilidade: variabilidade e simetria da


distribuio
Porque as caractersticas da varincia observada nos dados a base de inferncia de uma estimativa de
fiabilidade, depreende-se que as caractersticas dos participantes utilizados num estudo afectam a
fiabilidade de uma dada medida:
() A mesma medida, quando administrada a uma amostral de sujeitos mais homogneos ou mais
heterogneos produzir scores com diferentes fiabilidades (p. 839, Thompson, 2002).
Assim sendo, todas as caractersticas dos contextos de recolha dos dados que estejam directa ou
indirectamente relacionadas com uma maior variabilidade observada nos dados (quer intra quer inter)
afectam igualmente o valor do ndice de Cronbach. De uma forma geral quanto menor a variabilidade
das resposta intra-sujeitos e maior a variabilidade das respostas inter-sujeitos, maior o . Por outro lado
o , geralmente, maior quando existe homogeneidade de varincias inter-itens do que quando no
existe.
Sabendo que o nmero de observaes so um factor que influencia a variabilidade observada
(quanto menor a dimenso da amostra maior ser a estimativa da sua varincia) assim de esperar que
instrumentos de medida com um maior nmero de itens tenham valores de superiores e de erro-padro inferiores aos instrumentos com um menor nmero de itens (ver por exemplo, Brown, 2001).
Em termos gerais, os instrumentos cujos resultados se apresentam normalmente distribudos (e.g.,
escalas construdas com a metodologia de Likert) tm valores de superiores aos associados a
distribuies assimtricas. Contudo, e no captulo da inferncia sobre o , Yuan e Bentler (2002)
demonstraram, na sua explorao extensiva dos efeitos do enviesamento e achatamento, que estes
ndices so razoavelmente robustos violao do pressuposto da normalidade multivariada. A validade
do pressuposto da simetria composta pode ser avaliada pelo teste M de Box (ver e.g., Maroco, 2003,
pp. 157-158). Porm, e semelhana de outros testes de ajustamento, este teste sensvel a desvios da
normalidade e para amostras de grande dimenso, mesmo pequenos desvios entre as varinciascovarincias levam rejeio do pressuposto de homogeneidade (acrscimo do erro de tipo I). Por
outro lado, a presena de covarincias heterogneas no apresenta um efeito considervel sob a
estimao do mas aumenta o erro-padro da estimativa. Finalmente, a heteroscedasticidade de
varincias provoca a reduo do com um aumento reduzido do erro-padro da estimativa
(Duhacheck & Iacobucci, 2004).
Assim sendo os valores de devem sempre ser interpretados luz das caractersticas da medida
a que se associa, e da populao onde essa medida foi feita. Contudo, e apesar das limitaes
estimao da fiabilidade pelo de Cronbach, este permanece a medida mais usada da fiabilidade de
um instrumento.

O alfa de Cronbach

77

Limitaes do alfa de Cronbach e propostas alternativas


O facto do ndice de Cronbach apresentar enviesamentos para estimativas inferiores verdadeira
fiabilidade de uma medida, faz com que outras propostas surjam no campo. Cronbach em colaborao
com outros autores (Cronbach, Rajaratnam, & Gleser, 1963) rapidamente se aperceberam das
limitaes do em particular face aos pressupostos restritivos que a sua aplicao exigia, e que, de um
modo geral, so difceis de realizar. Assim, um novo desenvolvimento da teoria da fiabilidade foi
proposto com base na anlise das propriedades aditivas dos modelos de anlise de varincia e do
coeficiente de correlao inter-classes. Contudo, devido complexidade desta nova teoria, designada
por teoria da generabilidade, e falta de procedimentos para estimar de forma eficiente muitos dos seus
parmetros, esta no tem assumido relevncia prtica e a sugesto do seu uso cauteloso continua em
voga (Weiss & Davidson, 1981; Jones & Applebaum, 1989).
O sub-estima a verdadeira fiabilidade principalmente no caso em que o instrumento define uma
escala multifactorial (Cortina, 1993; Osbourn, 2000). Tal acontece uma vez que o requer poder
discriminante equivalente entre itens e unidimensionalidade da escala (representada por pesos
factoriais iguais para todos os itens no modelo unifactorial analtico; Komaroff, 1997; McDonald,
1999)4. Osbourn (2000) e Kamata et al. (2003), numa srie de estudos de simulao de Monte-Carlo,
testaram vrios estimadores alternativos de fiabilidade em diferentes escalas multidimensionais. Os
seus resultados demonstraram que os mtodos do alfa estratificado (25) e da mxima fiabilidade (26)
so os melhores estimadores da verdadeira fiabilidade. Em particular, o alfa estratificado o que
apresenta melhor performance em condies de multidimensionalidade apesar das diferenas entre os
dois estimadores no serem considerveis (Kamata et al., 2003). de referir porm, que num contexto
real, Feldt e Qualls (1996), observaram que, em mdia, as duas formulas diferem em aproximadamente
1% nas suas estimativas de consistncia interna de testes de aptido matemtica (conceitos e
problemas).
O alfa estratificado foi proposto por Cronbach, Shonenman, e McKie (1965) para instrumentos
cujos itens podem ser agrupados em f sub-testes ou factores de acordo com o seu contedo.
O ndice alfa estratificado definido como:
(25)
onde S2i a varincia dos itens que constituem o factor i (i=1, ..., f), i o de Cronbach para o factor
i e S2T a varincia do total do instrumento.
O estimador de mxima fiabilidade foi deduzido por Li et al. (1996) e assume que um instrumento
ou escala constitudo por vrios factores ou sub-escalas onde (a) os itens que constituem cada uma
das sub-escalas so paralelos, i.e., apresentam a mesma fiabilidade e varincia e (b) os itens nas
diferentes sub-escalas podem apresentar diferentes fiabilidades e varincias (Osbourn, 2000)5.
O estimador de mxima fiabilidade uma extenso da fiabilidade de Spearman-Brown para K
factores onde o factor i (i=1, , K) constitudo por ki itens paralelos:
4

Esta condio conhecida por tau-equivalente. Por definio, a condio tau-equivalente necessria, mas no suficiente, para que o seja um
estimador no enviesado da fiabilidade. Esta condio requer que os scores verdadeiros () para duas aplicaes do teste difiram apenas por uma
constante como ilustrado pelas equaes (14) (Lord & Novic, 1968).
Se estas duas condies so vlidas, os itens de todas as sub-escalas dizem-se congenricos. As equaes correspondentes so com X1=1+x1
e X2=2+x2 com 12 e V(x1)V(x2).

78

J. Maroco & T. Garcia-Marques

(26)

Onde ri a fiabilidade
da sub-escala
i e a correlao comum entre as sub-escalas. Para duas sub

-escalas, =r12/r1r2 onde r12 a correlao mdia entre os itens da sub-escala 1 com os itens da sub-escala 2. Para mais de duas sub-escalas, estimado pela mdia de todas os s calculados para as
sub-escalas duas-a-duas.
Partindo da generalizao do modelo de medida em uso na Anlise factorial, McDonald (1999)
define um novo ndice de fiabilidade como sendo o rcio da varincia estimada e da varincia total
de um modelo de medida unifactorial.
No caso multidimensional, o modelo factorial de medida
(27)
Onde X a matriz nxk dos scores observados dos n sujeitos nos k itens, F matrix nxp dos scores
factoriais dos n sujeitos nos p factores, a matriz kxp dos pesos factoriais dos k itens nos p factores
e E a kxn matriz dos erros. O multidimensional ento dado por:
(28)
Onde 11xk um vector de k 1s, =Cov(F) e a matriz de covarincias estimada na amostra.
Kamata et al. (2003) demonstram que o MD ligeiramente superior ao Estr e ao FM em particular
quando a correlao entre os factores reduzida (<0.5), chamando porm ateno que o MD pode
sobre-estimar a verdadeira fiabilidade.
A subestimao do de Cronbach tambm severa quando os itens so dicotmicos (e.g.,
Correcto vs. Incorrecto, ou Sim vs. No) porque o coeficiente de correlao entre itens
dicotmicos (coeficiente Phi) tende a subestimar a correlao populacional. Sun, Chou, Stacy, Ma,
Unger, e Gallaher 2006, propem assim o clculo do calculado para itens dicotmicos a partir dos
coeficiente de correlao mdio inter-itens utilizando o limite superior do coeficiente .
Este limite dado por:

(29)

Onde pi e pj so as propores do sucesso (e.g., proporo da realizao sim) dos itens i e j


respectivamente, organizados de forma que pipj.
Em estudos de simulao de Monte Carlo preliminares, Sun et al. (2006) demonstram que o
calculado a partir de subestima seriamente a consistncia interna enquanto que o calculado a partir
de MAX tem tendncia a sobre-estimar a consistncia interna. Provavelmente, o verdadeiro valor de
consistncia interna encontrar-se- entre as duas estimativas.

O alfa de Cronbach

79

Consequncias de uso de dados com fraca fiabilidade


So essencialmente duas as consequncias directas de uso de dados com fraca fiabilidade: (a) Existe
elevada probabilidade da medida no ser valida O resultado pode nada dizer sobre o constructo que se
pretendia medir. Mas mesmo se a medida for vlida, (b) O erro de medida elevado, pelo que a
variabilidade observada afecta o poder de qualquer teste estatstico realizado, aumentando a probabilidade de resultados no-significativos. [Ver Wilkinson e a APA Task force on Statistical Inference (1999)
interpreting the size of observed effects requires an assessment of the reliability of the scores p. 596].

Consideraes finais: Datametria vs. psicometria


Em 1999 um conjunto de autores liderados por Wilkinson autodesignaram-se de APA Task Force for
Statistical Inference produzindo um documento que referencia algumas questes estatsticas que tm
sido mal interpretados pelos investigadores em psicologia. Com o objectivo de introduzir alguma
ordem no caos este documento (que pode ser consultado nas pginas do site da APA) chama a
ateno para alguns cuidados a ter com o uso dos mtodos estatsticos. Relativamente aos mtodos de
estimativa da fiabilidade de um instrumento de medida o documento refere:
(...) importante notar que um teste no fivel ou no-fivel (...) assim sendo os autores devem
fornecer os coeficientes de fiabilidade dos dados a serem analisados, mesmo quando o foco da sua
pesquisa no psicomtrico (p. 570).
Ao fazer esta proposta Wilkinson e colaboradores parecem adoptar a posio explicitamente tomada
por Thompson (1994) e Vacha-Haase (1998) que referem que nenhum teste ou instrumento fivel
apenas os dados so fiveis ou no-fiveis. Segundo estes autores apenas se pode falar de score
reliaibility e errado inferir a partir de uma estimativa de de Cronbach que este ou no fivel.
Em 2000, Shlomo S. Sawilowsky reage fortemente a esta posio, e num artigo intitulado
Psychometrics Versus Datametrics: Comment on Vacha-Haases Reliability Generalization Method
and Some EPM Editorial Policies, contra-argumenta a afirmao de que no podemos inferir a
fiabilidade de um instrumento a partir da estimativa de um de Cronbach.
Referindo, Test reliability is psychometric terminology and score reliability is a score-centric
termonilogy (datametrics), Sawilowsky contrape a viso clssica psicomtrica com a sugesto de
Thompson e Vacha-Haase. O argumento bsico de Sawilowsky o comportamento daqueles que usam
instrumentos de medida. Ele analisa um grande nmero de analises de fiabilidade de uma medida e que
apenas 17,5% dos autores assumem uma posio de datametria, seguindo a maioria explicitamente
uma viso psicomtrica. Apenas assim, faz sentido o facto destes autores utilizarem a informao
relativa fiabilidade como critrio de seleco de uma escala como melhor que outra.
Numa atitude sensata podemos ter em conta alguns dos argumentos da posio psicometrica e
datamtrica no nosso comportamento face a estimativas de fiabilidade. Vejamos ento os pressupostos
em que nos podemos basear para sustentar qualquer posio:
a) Um de Cronbach apenas uma estimativa da fiabilidade dos dados obtidos com um dado
instrumento (datametria);

80

J. Maroco & T. Garcia-Marques

b) A fiabilidade dos dados afectada pela preciso do instrumento utilizado para medir
(psicometria) (apesar de existirem outras variveis capazes de afectarem a fiabilidade dos
nosso dados, existem balanas calibradas e no-calibradas);
c) A utilizao de uma nica estimativa de fiabilidade como base para concluir sobre um
instrumento sujeita a erro, visto que qualquer estimativa est igualmente sujeita a erro;
d) Podemos estimar o erro da inferncia estatstica associada ao uso da informao sobre a
fiabilidade dos nossos dados para concluir sobre a fiabilidade do instrumento com base na
estimao de intervalos de confiana;
e) S o uso repetido do instrumento com diferentes amostras nos indica algo sobre a validade do
processo inferencial: um instrumento que repetidamente gera dados fiveis pode dizer-se, com
maior confiana, fivel.

Assim sendo, defendemos a posio de Wilkinson e da APA Task Force for Statistical Inference (1999),
de que qualquer utilizao de um instrumento deve implicar a anlise das suas caractersticas mtricas,
visto que nos diz algo sobre a validade dos dados a serem interpretados. Mas, consideramos que apesar
de um instrumento fivel poder gerar dados no-fiveis em dadas circunstancias (por exemplo, uma
balana em circunstancias de fraca gravidade), a fiabilidade uma caracterstica, essencialmente
associada ao instrumento de medida utilizado e amostra onde este foi aplicado.
Sem dvida alguma, o de Cronbach um instrumento til para a investigao da fiabilidade de
uma medida, e por tal permite o estudo da preciso de um instrumento. Contudo, necessrio ter em
conta o que este instrumento , e o que pretende medir, para que o seu uso seja eficaz e no induza a
erros. O valor de fiabilidade estimado pelo no uma caracterstica de um instrumento. uma
estimativa da fiabilidade dos dados obtidos que nos podem informar sobre a preciso do instrumento.
Essa estimativa sujeita a influencias vrias, que devem ser tidas em conta na sua interpretao.
Assim, a estimativa sujeita a enviesamentos e erros vrios. No s se sabe ser a estimativa uma sub-avaliao (para o qual existem propostas de correco), como possvel calcularmos os seus
intervalos de confiana, e estes devem ser sempre reportados de forma a transmitir um nvel de
confiana estimativa obtida e ao erro associado a esta estimativa. A extrapolao de uma estimativa
de fiabilidade obtida com resultados associados a um dado estudo e dadas circunstncias deve ser feita
com a ponderao de um processo inferencial que se sabe sujeito a erro. H que garantir a fiabilidade
da estimativa de fiabilidade de uma medida.

Anexo 1
Uso do SPSS no calculo do alfa de Cronbach
Para ilustrar o clculo do de Cronbach com o SPSS, utilizaremos uma base de dados relativamente
simples que envolve apenas 6 itens (Tabela 2). O instrumento utilizado a escala de medida do estado
de esprito (mood) desenvolvida por Garcia-Marques (ver Garcia-Marques, 2004) tendo sido avaliado
em 24 sujeitos.

O alfa de Cronbach

81

Tabela 2
Base de Dados usada no clculo do de Cronbach com o SPSS e com o Statistica
Sujeito
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

Negativo
7
6
8
8
9
7
7
6
8
4
4
4
7
9
8
4
8
7
5
9
9
4
5
3

Triste
7
7
8
7
8
8
8
7
7
6
3
4
8
9
7
2
8
6
6
7
5
7
7
2

Cansado
5
7
4
6
9
8
4
4
4
2
4
4
8
9
7
6
6
3
4
8
3
6
3
4

Aborrecido
6
7
7
7
6
6
7
8
7
7
4
6
7
9
6
3
8
4
7
7
6
5
7
6

Mal_bem
8
7
8
8
9
8
7
7
7
7
4
4
7
9
8
4
8
4
4
2
5
6
6
4

Tenso_rec
6
2
8
8
9
8
7
8
7
7
3
4
6
8
8
2
7
5
5
5
5
4
8
3

Para calcular o necessrio calcular o total da escala por sujeito (i.e., a soma de todos os itens por
sujeito) e a partir destes totais por sujeito calcular a varincia total (S2T) e a varincia de cada um dos
j=1, ..., 6 itens (S2j). Estes clculos resumem-se na tabela seguinte:
Sujeito
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Varincia

Negativo
7
6
8
8
9
7
7
6
8
4
4
4
7
9
8
4
8
7
5
9
9
4
5
3
3.739

Triste
7
7
8
7
8
8
8
7
7
6
3
4
8
9
7
2
8
6
6
7
5
7
7
2
3.645

Cansado
5
7
4
6
9
8
4
4
4
2
4
4
8
9
7
6
6
3
4
8
3
6
3
4
4.232

Aborrecido
6
7
7
7
6
6
7
8
7
7
4
6
7
9
6
3
8
4
7
7
6
5
7
6
1.810

Mal_bem
8
7
8
8
9
8
7
7
7
7
4
4
7
9
8
4
8
4
4
2
5
6
6
4
3.781

Tenso_rec
6
2
8
8
9
8
7
8
7
7
3
4
6
8
8
2
7
5
5
5
5
4
8
3
4.476

Soma
39
36
43
44
50
45
40
40
40
33
22
26
43
53
44
21
45
29
31
38
33
32
36
22
75.679

82

J. Maroco & T. Garcia-Marques

Usando agora (15):

No SPSS, para calcular o de Cronbach, recorra ao menu: AnalyzeUScaleUReliability analysis:

Passe os 6 itens para a caixa Itens e seleccione o modelo Model: Alfa. Clique no boto
para
definir as estatsticas a calcular. Seleccione as opes Descriptives (para produzir as estatsticas
descritivas para cada um dos itens), Scale (para produzir a estatstica descritiva para o total da escala
e Scale if item deleted (para calcular a evoluo do a se cada um dos itens for eliminado da anlise).
Seleccione ainda a opo Correlations na rea Inter-item para calcular a correlao inter-itens e o
R2 (coeficiente de determinao linear) entre cada um dos itens e os restantes itens:

O alfa de Cronbach

Clique no boto

83

para obter os Outputs:

Figura 1. de Cronbach e estatstica descritiva dos itens com o SPSS.


O quadro Reliabity Statistics apresente as estimativas do de Cronbach e do estandardizado que
so, neste exemplo, 0.856 e 0.861 respectivamente. O quadro Item Statistics apresenta a mdia e o
desvio-padro de cada um dos 6 itens e o quadro Inter-item correlation matrix apresente as
correlaes inter-intens. O sumrio de todos os itens apresentado no quadro Summary Itens
Statistics enquanto que a estatstica descritiva da escala (i.e., da soma dos itens para cada sujeito)
apresentada no quadro Scale Statistics. Finalmente, o quadro Item-Total Statistics apresenta o efeito
da remoo de cada um dos itens no total da escala. Por exemplo, se o item Negativo fosse removido,
a mdia da escala passaria a ser 30.38 e a varincia 52.766. De maior interesse so as colunas com a
correlao entre os scores do item e o total da escala (3 coluna), o coeficiente de determinao
mltipla (R2) entre o item e os restantes itens da escala (4 coluna), e o valor do de Cronbach da
escala se esse item fosse eliminado da escala (5 coluna). No nosso exemplo, o item que est pior
correlacionado quer com o total da escala quer com os outros itens o item Cansado. Se este item

84

J. Maroco & T. Garcia-Marques

for eliminado, o a de Cronbach passaria a ser 0.882 (em vez do 0.856 actual). Pelo contrrio se o iten
Triste fosse eliminado o novo seria 0.790. A anlise conjunta do R2 e dos valores do se o item
for eliminado permite perceber qual a qualidade dos itens e o seu contributo para a consistncia
interna da escala. Naturalmente, podem eliminar-se os itens cuja remoo aumente consideravelmente
o da escala. contudo de referir que outros critrios, nomeadamente a relevncia do item, podem
contrapor sua remoo.
Finalmente, um Intervalo de confiana a 95% para dado por (18) uma vez que a amostra de
dimenso reduzida:

Consultando uma tabela da distribuio F e sabendo que f0.025;[23,115]=1/f0.975;[115,23] vem

Um Intervalo de confiana a 95% para ]0.744;0.930[. Nenhum dos softwares vulgarmente


utilizados nas cincias sociais e humanas, estima um intervalo de confiana para o , pelo que os
clculos tem de ser feitos de forma manual.

Anexo 2
Uso do Statistica 7 no clculo de ndice de Cronbach
O clculo do no Statistica faz-se no menu StatisticsUMultivariate Exploratory TechniquesU
Reliability/Item analysis:

O alfa de Cronbach

Depois clique no boto


2 a 7:

Clique agora no boto


items/scale:

Clique agora no boto

85

para definir as variveis (itens) a analisar. Selecione as variveis

e seleccione na patilha Advanced a opo Compute multiple regression

para obter o quadro dos resultados.

Neste quadro clique no boto


para obter as estatsticas descritivas dos itens, ou no
boto
para obter as correlaes inter-itens. Clique na patilha
para
continuar com a anlise. No quadro seguinte clique na patilha Advanced para obter mais estatsticas
descritivas ou clique no boto
para obter o quadro final:

86

J. Maroco & T. Garcia-Marques

O de Cronbach 0.856 e o 0.861. A correlao mdia inter-itens 0.528, a mdia da escala


36.875, etc... Cada uma das patilhas/botes do quadro acima permite obter diferentes anlises
adicionais consistncia interna da escala. Por exemplo o boto
permite obter as
correlaes entre os itens e o total da escala e a anlise do a se cada um dos itens for eliminado:

Figura 2. de Cronbach com o Statistica


Uma anlise interessante que no se encontra no SPSS, a previso de em quanto variaria o se
fossem adicionados mais itens escala (assumindo que a correlao mdia inter-itens aps a adio
dos novos itens se mantinha inalterada). Clique na patilha More items? e digite 4 na caixa Number
of new items, Repare que a adio de 4 novos itens escala permitiria aumentar o para 0.908:

O alfa de Cronbach

87

Um outro tipo de anlise com interesse a do nmero de itens que preciso adicionar para que o
assuma um determinado valor. Clique na patilha How many? e digite 0.95 na caixa Desired
reliability:

Note que, assumindo que todas as correlaes inter-itens se mantm idntica s correlaes inter-itens
da escala antiga, seria necessrio adicionar 13 itens escala para que o a passasse a 0.95.

Referncias
Brown, W. (1910). Some experimental results in the correlation of mental abilities. British Journal of
Psychology, 3, 296-322.

88

J. Maroco & T. Garcia-Marques

Brown, J. D. (2001). Statistics Corner. Questions and answers about language testing statistics: Can we
use the Spearman-Brown prophecy formula to defend low reliability? Shiken: JALT Testing &
Evaluation SIG Newsletter, 4(3), 7-9.
Charter, R. A., & Feldt, L. S. (1996). Testing the equality of two alpha coefficients. Perceptual and Motor
Skills, 82, 763-768.
Cortina, J. M. (1993). What is coefficient alpha? An examination of theory and application. Journal of
Applied Psychology, 78, 98-104.
Crocker, L., & Algina, J. (1986). Introduction to classical and modern test theory. New York: CBS
College Publishing.
Cronbach, L. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297-37.
Cronbach, L. J., & Shavelson, R. J. (2004). My current thoughts on coefficient alpha and successor
procedures. Educational and Psychological Measurement, 64(3), 391-418.
Cronbach, L. J., Rajaratnam, N., & Gleser, G. C. (1963). Theory of generalizability: A liberalization of
reliability theory. The British Journal of Statistical Psychology, 16, 137-163.
Cronbach, L. J., Schnemann, P., & McKie, D. (1965). Alpha coefficients for stratifiedparallel tests.
Educational and Psychological Measurement, 25, 291-312.
Davis, F. B. (1964). Educational measurements and their interpretation. Wadsworth Publishing Co.:
Belmont, California.
DeVellis, R. F. (1991). Scale development: Theory and applications. Newbury Park, CA: SAGE
Publications.
Duhacheck, A., Coughlan, A. T., & Iacobucci, D. (2005). Results on the standard error of the coefficient
alpha index of reliability. Marketing Science, 24(2), 294-301.
Duhachek, A., & Iacobucci, D. (2004). Alphas Standard Error (ASE): An accurate and precise
confidence interval estimate. Journal of Applied Psychology, 89(5), 792-808.
Fan, X., & Thompson, B. (2001). Confidence intervals about score reliability coefficients, please: An
EPM guidelines editorial. Educational and Psychological Measurement, 61, 517-531.
Feldt, L. S. (1965). The approximate sampling distribution of Kuder-Richardson reliability coefficient
twenty. Psychometrika, 30, 357-370.
Feldt, L. S. (1990). The sampling theory for the intraclass reliability coefficient. Applied Measurement
in Education, 3, 361-367.
Garcia-Marques, T. (2004). A mensurao da varivel Estado de Esprito na populao portuguesa.
Laboratrio de Psicologia, 2(1), 77-94.
Green, S. B., Lissitz, R. W., & Mulaik, S. A. (1977). Limitations of coefficient alpha as an index of test
unidimensionality. Educational and Psychological Measurement, 37, 827-838.
Guttman, L. (1945). A basis for analyzing test-retest reliability. Psychometrika, 10, 255-282.
Guttman, L. (1953). Reliability formulas that do not assume experimental independence. Psychometrika,
18, 225-239.
Hoyt, C. J. (1941). Test reliability estimated by analysis of variance. Psychometrika, 6, 153-160.
Iacobucci, D., & Duhachek, A. (2003). Advancing alpha: Measuring reliability with confidence.
Journal of Consumer Psychology, 13(4), 478-487.
Jones, L. V., & Appelbaum, M. I. (1989). Psychometric methods. Annual Review of Psychology, 40,
23-43.

O alfa de Cronbach

89

Kamata, A., Turhan, A., & Darandari, E. (2003). Estimating reliability for multidimensional composite
scale scores. Annual meeting of American Educational Research Association, Chicago, April
2003.
Kaplan, R., & Saccuzzo, D. (1982). Psychological testing: Principles, applications and issues. Monterey,
CA: Brooks/Cole Publishing Company.
Kistner, E. O., & Muller, K. E. (2004). Exact distributions of intraclass correlation and Cronbachs
alpha with Gaussian data and general covariance, Psychometrika, 69(3), 459-474.
Komaroff, E. (1997). Effect of simultaneous violations of essential tau-equivalence and uncorrelated
error on coefficient alpha. Applied Psychological Measurement, 21, 337-348.
Krathwohl, D. R. (1998). Methods of educational and social science research: An integrated approach.
(2nd ed.). New York: Addison-Wesley.
Kristof, W. (1963). The statistical theory of stepped-up reliability when a test has been divided into
several equivalent parts. Psychometrika, 28, 221-228.
Kuder, G. F., & Richardson, M. W. (1937). The theory of the estimation of test reliability. Psychometrika,
2, 151-160.
Laveault, D., & Grgoire, J. (2002). Introduao s teorias dos testes em cincias humanas. Porto: Porto
Editora.
Li, H., Rosenthal, R., & Rubin, D. B. (1996). Reliability of measurement in psychology: From SpearmanBrown to maximal reliability. Psychological Methods, 1, 98-107.
Likert, R. (1932). A technique for the measurement of attitudes. Archives of Psychology, 140.
Lord, F. M., & Novick, R. (1968). Statistical theories of mental test scores. Reading MA: AddisonWesley.
Maroco, J. (2003). Anlise estatstica com utilizao do SPSS. Lisboa: Edies Slabo.
McDonald, R. P. (1999). Test Theory: Unified treatment. Lawrence Erlbaum Associates.
Murphy, K. R., & Davidshofer, C. O. (1988). Psychological testing: Principles and applications.
Englewood Cliffs, New Jersey: Prentice Hall.
Nunnally, J. C. (1978). Psychometric theory. New York: McGraw-Hill Inc.
Nunnally, J. C., & Bernstein, I. (1994). Psychometric theory. New York: McGraw-Hill.
Osbourn, H. G. (2000). Coefficient alpha and related internal consistency reliability coefficients.
Psychological Methods, 5, 343-355.
Pasquali, L. (2003). Psicometria teoria dos testes na psicologia e na educao. Petrpolis: Ed. Vozes.
Peterson, R. A. (1994). A meta-analysis of Cronbachs coefficient alpha. Journal of. Consumer Research,
21(2), 381-391.
Spearman, C. (1910). Correlation calculated from faulty data. British Journal of Psychology, 3, 271-295.
Sawilowsky, S. S. (2000). Psychometrics versus datametrics: Comment on Vacha-Haases Reliability
generalization method and some EPM Editorial Policies. Educational and Psychological
Measurement, 60(2), 157-173.
Sun, W., Chou, C-P., Stacy, A. W., Ma, H., Unger, J., & Gallaher, P. (2006). SAS and SPSS Macros to
calculate standardized Cronbachs alpha using upper bound phi coefficient for dichotomous items.
Behavior Research Methods (In press).
Thompson, B. (1994). Guidelines for authors. Educational and Psychological Measurement, 54, 837847.

90

J. Maroco & T. Garcia-Marques

Thompson, B. (Ed.). (2002). Contemporary thinking on reliability issues. Newbury Park, CA: Sage.
Thompson, B., & Vacha-Haase, T. (2000). Psychometrics is datametrics: The test is not reliable.
Educational and Psychological Measurement, 60, 174-195.
Vacha-Haase, T. (1998). Reliability generalization: Exploring variance in measurement error affecting
score reliability across studies. Educational and Psychological Measurement, 58, 6-20.
van Zyl, J. M., Neudecker, H., & Nel, D. G. (2000). On the distribution of the maximum likelihood
estimator of Cronbachs alpha. Psychometrika, 65, 271-280.
Weiss, D. J., & Davison, M. L. (1981). Test theory and methods. Annual Review of Psychology, 32,
629-658.
Wilkinson, L., & Task Force on Statistical Inference, APA Board of Scientific Affairs. (1999).
Statistical methods in psychology journals: Guidelines and explanations. American Psychologist,
54(8), 594-604.
Yuan, K., & Bentler, P. M. (2002). On robustness of the normal-theory cased asymptotic distributions
of three reliability coefficient estimates. Psychometrika, 67, 251-259.
Zimmerman, D. W., Williams, R. H., Zumbo, B. D., & Ross, D. (2005). Louis Guttmans Contributions
to Classical Test Theory. International Journal of Testing, 5, 81-95.

Submisso: 18/05/2006

Aceitao: 03/07/2006

Anda mungkin juga menyukai