Bibliografia a estudar:
1) Pedro A. Morettin & Wilton O. Bussab. Estatstica Bsica. (Captulo 4)
2) Levin; Fox e Forde. Estatstica para Cincias Humanas, 11 ed. Ed. Pearson (Cap 12 Cpia)
Exerccios:
Referentes a bibliografia acima.
varivel Y
Ensino
Ensino Mdio
varivel X
Fundamental
Ensino
Superior
Total
Capital
11
Interior
12
Outra
13
Total
12
18
36
A linha dos totais fornece a distribuio da varivel Y e a coluna dos totais fornece a distribuio
da varivel X. Distribuies assim obtidas so chamadas de distribuies marginais. A tabela de
dupla entrada com frequncias absolutas (ex. tabela acima) tambm comumente chamada tabela
de contingncia.
J vimos que pode-se trabalhar uma tabela de dupla entrada com as frequncias relativas, que
podem ser expressas de trs formas:
a) em relao ao total geral;
b) em relao ao total da varivel disposta nas colunas;
c) em relao ao total da varivel disposta nas linhas.
a) Distribuio conjunta das propores em relao ao total geral das variveis X e Y
varivel Y
Ensino
varivel X
Fundamental
Ensino
Mdio
Ensino
Superior
Total
Capital
11,00%
14,00%
6,00%
31,00%
Interior
8,00%
19,00%
6,00%
33,00%
Outra
14,00%
17,00%
5,00%
36,00%
Total
33,00%
50,00%
17,00%
100,00%
Distribuio Marginal
da varivel X
Ensino
Mdio
Ensino
Superior
Total
Capital
33,00%
28,00%
33,00%
31,00%
Interior
25,00%
39,00%
33,00%
33,00%
Outra
42,00%
33,00%
34,00%
36,00%
Total
100,00%
100,00%
100,00%
100,00%
A Idia de existncia/ausncia de associao entre duas variveis tem por base a observao
na seguinte tabela de dupla entrada:
Exemplo 1:
Distribuio da escolha do curso (Y) em relao ao sexo de 200 estudantes (X)
Sexo
Masculino
Feminino
Total
Curso
Economia
85 (61,00%)
35 (58,00%)
120 (60,00%)
Administrao
55 (39,00%)
25 (42,00%)
80 (40,00%)
Outra
200 (100,00%)
so prximos
Exemplo 2:
Distribuio da escolha do curso (Y) em relao ao sexo de 200 estudantes (X)
Sexo
Masculino
Feminino
Total
Curso
Fsica
120 (60,00%)
Cincias Sociais
40 (29,00%)
80 (40,00%)
Outra
40 (67,00%)
200 (100,00%)
Exerccio:
Construa o grfico de colunas mltiplas, colunas empilhadas, para a tabela (b) do exemplo regio
de procedncia versus grau de instruo. Com base na observao do grfico, decida se h
evidncia de associao , ou no, entre essas variveis. Justifique.
MEDIDAS DE ASSOCIAO ENTRE DUAS VARIVEIS QUALITATIVAS NOMINAIS:
O QUI-QUADRADO 2
Um coeficiente de associao expressa, por meio de um nmero, a fora da associao entre as
variveis sendo:
a proximidade de zero indica ausnca de associao.
em geral, coeficientes de associao podem assumir valores pertencentes a [0,1] ou [-1,1].
quanto maior o valor em mdulo , significa que o grau de associao mais forte.
Coeficiente de contingncia ( K. Pearson): Seja a tabela de distribuio conjunta, com
frequncias absolutas, de duas variveis qualitativas apresentada conforme abaixo:
Y
B1
B2
A1
n11
A2
Bs
Total
n 12
n1s
n 1.
n21
n22
n2s
n 2.
Ar
nr1
nr2
nrs
n r.
Total
n .1
n .2
n .s
Notao:
categoria Bs
: soma dos elementos da linha r, ou ainda, total de elementos classificados na
categoria Ar
O coeficiente de contingncia para quantificar a associao entre estas variveis dado por:
C =
2
2n
nij eij 2
, onde nij so as frequncias observadas e eij so as
j =1
e ij
frequncias esperadas sob hiptese de independncia entre as variveis, calculadas por
n n
e ij = i. j. .
n
sendo
2= i=1
r
2 /n
r 1 s 1
2
n k 1
sendo k o nmero de linhas ou colunas da tabela de contingncia, o que for menor. Se o nmero de
linhas for igual ao nmero de colunas, usa-se k como este nmero. O valor de V pertence ao
intervalo [0,1].
V=
Interpretao:
Evidncia de que as variveis X e Y no so associadas se V 0,00
Quanto mais prximo V for de 1 mais forte o grau de associao entre as variveis
X e Y.
Podemos usar a seguinte escala:
V [ 0,0.3[ : evidncia de associao fraca
V [ 0.3,0.7[ : evidncia de associao moderada
V [ 0.7,1 .0 ] : evidncia de associao forte
Exerccios:
Para cada uma das tabelas de dupla entrada abaixo:
a) Utilizando um coeficiente adequado, C , T ou V de Cramer, verifique se h evidncias de que
as variveis so ou no so associadas. Caso possvel, classifique o grau de associao.
b) Construa a tabela de dupla entrada com as frequncias relativas em relao ao total da Varivel
disposta nas linhas .
c) Construa o grfico de colunas mltiplas, com colunas empilhadas, para a tabela do item (b).
Somente com a observao do grfico e decida se aparentemente h ou no associao entre as
variveis. Justifique.
SINTOMA
SUICIDA
PRESENTE
AUSENTE
Totais
PSICTICO
27
35
NEURTICO
12
33
45
Totais
20
60
80
TIPO DOENTE
Cncer
Cncer
controlado
Cncer
no
controlado
Totais
Cirurgia
58
65
Radioterapia
42
13
55
Totais
100
20
120
Tratamento