Anda di halaman 1dari 7

ANLISE BIDIMENSIONAL

Bibliografia a estudar:
1) Pedro A. Morettin & Wilton O. Bussab. Estatstica Bsica. (Captulo 4)
2) Levin; Fox e Forde. Estatstica para Cincias Humanas, 11 ed. Ed. Pearson (Cap 12 Cpia)
Exerccios:
Referentes a bibliografia acima.

At o momento trabalhamos basicamente em como organizar dados referentes a somente uma


varivel ( tabelas, grficos, medidas centrais, medidas de disperso, etc...) , mas tambm de
muito interesse analisar o comportamento conjunto de duas ou mais variveis.
O principal objetivo desse tipo de anlise explorar relaes entre as variveis, como por exemplo,
verificar se h alguma associao entre elas e o grau de dependncia.
Associao: mudana no comportamento de uma varivel na presena ou no de informao sobre
a outra varivel.
Grau de dependncia: magnitude ou fora da associao.
Nesta disciplina, nos atentaremos somente a analisar de forma conjunta duas variveis. Neste caso,
podemos ter trs situaes:
a) as duas variveis so qualitativas;
Ex: ser que a regio de procedncia do indivduo influencia no grau de instruo do mesmo?
Ser que a classe social influencia na confiana na integridade da polcia local(alta, moderada,
baixa)?
b) duas variveis quantitativas;
Ex: ser que a renda bruta mensal familiar influencia no percentual gasto com sade de uma
famlia?
c) uma varivel qualitativa e outra quantitativa.
Ex: ser que a regio de procedncia do indivduo influencia no salrio?
Ser que a classe scio-econmica do indivduo influencia no tempo de uso de internet?
Tabelas, grficos e medidas numricas sero apresentados para o estudo bidimensional de variveis.
ESTUDO BIDIMENSIONAL DE DUAS VARIVEIS QUALITATIVAS NOMINAIS
Primeiro instrumento necessrio para compreenso do comportamento conjunto de duas variveis
qualitativas nominais sua distribuio conjunta, definida como uma tabela de dupla entrada com
as frequncias cruzadas das duas variveis em questo:

varivel Y
Ensino
Ensino Mdio
varivel X
Fundamental

Ensino
Superior

Total

Capital

11

Interior

12

Outra

13

Total

12

18

36

A linha dos totais fornece a distribuio da varivel Y e a coluna dos totais fornece a distribuio
da varivel X. Distribuies assim obtidas so chamadas de distribuies marginais. A tabela de
dupla entrada com frequncias absolutas (ex. tabela acima) tambm comumente chamada tabela
de contingncia.
J vimos que pode-se trabalhar uma tabela de dupla entrada com as frequncias relativas, que
podem ser expressas de trs formas:
a) em relao ao total geral;
b) em relao ao total da varivel disposta nas colunas;
c) em relao ao total da varivel disposta nas linhas.
a) Distribuio conjunta das propores em relao ao total geral das variveis X e Y
varivel Y
Ensino
varivel X
Fundamental

Ensino
Mdio

Ensino
Superior

Total

Capital

11,00%

14,00%

6,00%

31,00%

Interior

8,00%

19,00%

6,00%

33,00%

Outra

14,00%

17,00%

5,00%

36,00%

Total

33,00%

50,00%

17,00%

100,00%

Distribuio Marginal
da varivel X

Distribuio Marginal da varivel Y


11% dos indivduos vm da Capital e tem Ensino Fundamental
31% dos indivduos vm da Capital
33% dos indivduos tem o Ensino Fundamental

b) Distribuio da procedncia dos indivduos em relao ao grau de instruo


varivel Y
Ensino
varivel X
Fundamental

Ensino
Mdio

Ensino
Superior

Total

Capital

33,00%

28,00%

33,00%

31,00%

Interior

25,00%

39,00%

33,00%

33,00%

Outra

42,00%

33,00%

34,00%

36,00%

Total

100,00%

100,00%

100,00%

100,00%

33% dos indivduos que tem o Ensino Fundamental vm da Capital


c) Distribuio do grau de instruo dos indivduos (%) em relao a regio de procedncia
Exerccio: construir a respectiva tabela de distribuio conjunta.

A Idia de existncia/ausncia de associao entre duas variveis tem por base a observao
na seguinte tabela de dupla entrada:
Exemplo 1:
Distribuio da escolha do curso (Y) em relao ao sexo de 200 estudantes (X)
Sexo
Masculino
Feminino
Total
Curso
Economia

85 (61,00%)

35 (58,00%)

120 (60,00%)

Administrao

55 (39,00%)

25 (42,00%)

80 (40,00%)

Outra

140 (100,00%) 60 (100,00%)

200 (100,00%)

Parece haver associao entre as variveis Escolha do curso e sexo???


Para no haver dependncia entre estas variveis, esperaramos que as propores de alunos em
cada um dos cursos sejam semelhantes em cada sexo:

61% e 58% so prximos


39% e 42%

so prximos

parece que no h relacionamento


entre sexo e escolha entre estes
cursos

Exemplo 2:
Distribuio da escolha do curso (Y) em relao ao sexo de 200 estudantes (X)
Sexo
Masculino
Feminino
Total
Curso
Fsica

100 (71,00%) 20 (33,00%)

120 (60,00%)

Cincias Sociais

40 (29,00%)

80 (40,00%)

Outra

140 (100,00%) 60 (100,00%)

40 (67,00%)

200 (100,00%)

Parece haver associao entre as variveis Escolha do curso e sexo???


Veja que:

71%, 33% so muito diferentes


parece que sexo influencia na escolha
do curso, nesta situao.
aparentemente meninas preferem
Cincias Sociais e meninos preferem Fsica.

29%, 67% so muito diferente

Exerccio:
Construa o grfico de colunas mltiplas, colunas empilhadas, para a tabela (b) do exemplo regio
de procedncia versus grau de instruo. Com base na observao do grfico, decida se h
evidncia de associao , ou no, entre essas variveis. Justifique.
MEDIDAS DE ASSOCIAO ENTRE DUAS VARIVEIS QUALITATIVAS NOMINAIS:
O QUI-QUADRADO 2
Um coeficiente de associao expressa, por meio de um nmero, a fora da associao entre as
variveis sendo:
a proximidade de zero indica ausnca de associao.
em geral, coeficientes de associao podem assumir valores pertencentes a [0,1] ou [-1,1].
quanto maior o valor em mdulo , significa que o grau de associao mais forte.
Coeficiente de contingncia ( K. Pearson): Seja a tabela de distribuio conjunta, com
frequncias absolutas, de duas variveis qualitativas apresentada conforme abaixo:
Y

B1

B2

A1

n11

A2

Bs

Total

n 12

n1s

n 1.

n21

n22

n2s

n 2.

Ar

nr1

nr2

nrs

n r.

Total

n .1

n .2

n .s

Notao:

n .s : soma dos elementos da coluna s, ou ainda, total de elementos classificados na


n r.

categoria Bs
: soma dos elementos da linha r, ou ainda, total de elementos classificados na
categoria Ar

O coeficiente de contingncia para quantificar a associao entre estas variveis dado por:
C =

2
2n

nij eij 2
, onde nij so as frequncias observadas e eij so as
j =1
e ij
frequncias esperadas sob hiptese de independncia entre as variveis, calculadas por
n n
e ij = i. j. .
n
sendo

2= i=1
r

Justificativa da construo do coeficiente de contingncia C:


LOUSA
Interpretao:
Evidncia de que as variveis X e Y no so associadas se C 0,00
Evidncia de que as variveis X e Y so associadas se C for significativamente diferente de
zero.
Quanto maior o valor de C, maior o grau de associao entre as variveis X e Y.
Observao: o coeficiente de contingncia C pertence a [0,1], porm, seu valor mximo depende
de r e s, nmero de linhas e colunas da tabela de contingncia.
Modificao do Coeficiente de Contingncia:
T=

2 /n
r 1 s 1

o valor de T pertence a [0,1], e se r = s , o valor mximo de T 1.


Interpretao:
Evidncia de que as variveis X e Y no so associadas se T 0,00
Se r = s , quanto mais prximo T for de 1 mais forte o grau de associao entre as variveis
X e Y.
Se r = s, podemos usar a seguinte escala:
T [ 0,0.3[ : evidncia de associao fraca
T [ 0.3,0.7[ : evidncia de associao moderada
T [ 0.7,1.0 ] : evidncia de associaao forte
5

Alternativa para o coeficiente de contingncia: Coeficiente V de Cramer

2
n k 1
sendo k o nmero de linhas ou colunas da tabela de contingncia, o que for menor. Se o nmero de
linhas for igual ao nmero de colunas, usa-se k como este nmero. O valor de V pertence ao
intervalo [0,1].
V=

Interpretao:
Evidncia de que as variveis X e Y no so associadas se V 0,00
Quanto mais prximo V for de 1 mais forte o grau de associao entre as variveis
X e Y.
Podemos usar a seguinte escala:
V [ 0,0.3[ : evidncia de associao fraca
V [ 0.3,0.7[ : evidncia de associao moderada
V [ 0.7,1 .0 ] : evidncia de associao forte

Exerccios:
Para cada uma das tabelas de dupla entrada abaixo:
a) Utilizando um coeficiente adequado, C , T ou V de Cramer, verifique se h evidncias de que
as variveis so ou no so associadas. Caso possvel, classifique o grau de associao.
b) Construa a tabela de dupla entrada com as frequncias relativas em relao ao total da Varivel
disposta nas linhas .
c) Construa o grfico de colunas mltiplas, com colunas empilhadas, para a tabela do item (b).
Somente com a observao do grfico e decida se aparentemente h ou no associao entre as
variveis. Justifique.
SINTOMA
SUICIDA

PRESENTE

AUSENTE

Totais

PSICTICO

27

35

NEURTICO

12

33

45

Totais

20

60

80

TIPO DOENTE

Cncer

Cncer
controlado

Cncer
no
controlado

Totais

Cirurgia

58

65

Radioterapia

42

13

55

Totais

100

20

120

Tratamento

Anda mungkin juga menyukai