Anda di halaman 1dari 13

AULA: 13-16

Anlise Bidimensional

Prof. Vctor Hugo Lachos Dvila

Introduo
Freqentemente estamos interessados em analisar duas
variveis conjuntamente
P.E. nos dados da empresa podemos estar interessados em
comparar os salrios dos casados e solteiros.
Quando consideramos duas variveis, podemos ter 3 situaes e as
tcnicas de anlise so diferentes.
a) as duas qualitativas (tabela de contingncia)
b) as duas quantitativas (grficos de disperso)
c) uma qualitativa e outra quantitativa (tabela de
contingncia)
possvel quantificar a relao entre as variveis em estudo

Variveis Qualitativas
Analisamos o comportamento conjunto de X: grau de
instruo e Y: regio de procedncia.
Tabela 1:Tabela de freqncias absolutas das variveis X e Y
Tabela de
dupla
entrada

Podemos construir tabelas de freqncias relativas.


Existe varias possibilidades de construo e depende
do objetivo do problema.

Relativa ao total geral


Tabela 1:Tabela de freqncias relativas ao total geral das
variveis X e Y

11% dos empregados vm da capital e tem ensino fundamental.


31% dos indivduos vm da capital, 33% do interior e 36% de
outras regies.
33% tem ensino fundamental.

Relativa ao total de colunas


Tabela 1:Tabela de freqncias relativas ao total de coluna das
variveis X e Y

Entre os empregados com instruo at o ensino fundamental,


33% vm da capital.
Entre os empregados com ensino mdio, 28% vm da capital.
Comparamos a distribuio da procedncia conforme o grau de
instruo.
De modo anlogo, podemos construir a distribuio do grau de
instruo conforme a procedncia.!!!
5

Grfico 1:Distribuio da regio de procedncia por grau de


instruo

Associao entre variveis qualitativas


Exemplo: Queremos verificar se existe ou no associao
entre o sexo (X) e a carreira escolhida (Y) por 200 alunos
de economia e administrao
Tabela 4:Tabela de freqncias absolutas (relativas) dos alunos
segundo o sexo (X) e curso escolhido (Y)

Independente do sexo 60% preferem economia e 40% preferem


administrao.
No sexo masculino essas propores so 61% e 39% e no
feminino 58 e 42%, as quais so prximas d e 60 e 40 (marginais)
Forte indicio de no haver dependncia entre as variveis sexo e
curso (no associadas)
7

Exemplo: Queremos verificar se existe ou no associao


entre o sexo (X) e a carreira escolhida (Y) por 200 alunos
de Fsica e Cincias Sociais
Tabela 5:Tabela de freqncias absolutas (relativas) dos alunos
segundo o sexo (X) e curso escolhido (Y)

Independente do sexo 60% preferem economia e 40% preferem


administrao.
No sexo masculino essas propores so 71% e 29% e no
feminino 33 e 67%. Disparidade bem acentuada nas propores
Forte indicio de haver dependncia entre as variveis sexo e
curso (associadas)
8

Exemplo: Queremos verificar se a criao de determinado


tipo de cooperativa est associada com algum fator regional
Tabela 6:Cooperativas autorizadas a funcional por tipo e estado

Notamos que existe certa associao entre as variveis.


Caso no houvesse associao, esperaramos que em cada
estado tivssemos 24% de escolas e 12% de outros tipos.
Assim, o nmero esperado de cooperativas de consumidores no
estado de So Paulo seria 648*0.24=156 e no Paran
301*0.24=72....
9

Tabela 7:Valores esperados assumindo independncia entre as


variveis tipo de cooperativa e fator regional

Notamos fortes discrepncias entre os valores observados (O), e


esperados (E) assumindo que as variveis
no fossem associadas.

Uma medida de afastamento global pode ser dada pela soma de


todas essas medidas. (Qui-quadrado de Pearson)

Colunas Filas

(O
i 1

j 1

ij

Eij ) / Eij
2

. Um valor grande de X indica associao entre as variveis. No


exemplo acima temos:
2

(214 156) / 156 ... (48 72) / 72 173,24


2

10

Associao entre variveis quantitativas


Quando as duas variveis so quantitativas podemos usar o
mesmo tipo de anlise para variveis qualitativas. (transformando
as variveis)
Uma ferramenta bastante til o grfico de disperso.
Exemplo:
Tabela 8: Nmero de anos de servio (X) por nmero de
clientes (Y) de agentes de uma companhia de seguros

Notamos que medida que aumenta o tempo de servio, aumenta


o nmero de clientes, logo parece haver uma associao entre
essas variveis
11

Grfico 2: Grfico de disperso para as variveis X: anos de


servio e Y: nmero de clientes
80
Nmero de Cleintes

70
60
50
40
30
20
10
0
0

10

12

Anos de Servio

Grfico 3: Tipos de associaes entre duas variveis


25
20
15
10
5
0
0

10

12

10
8
6
4
2
0
-2 0
-4
-6
-8
-10
-12

10

12

12

Coeficiente de correlao
Nun conjunto de dados com n pares de valores para as variveis
Xe Y o coeficiente de correlao (r) que mede a dependncia
linear entre elas calculado como:
n

rXY

( x x )( y
i 1

yi )

[ ( xi xi ) ][ ( yi yi ) ]
i 1

i 1

(x y
i 1

nxi yi )
n

[ xi nxi ][ ( y
2

i 1

i 1

nyi ]

Propriedades

sempre um nmero entre -1 e 1


Correlao igual a zero no indica independncia entre as
variaveis
|r| prximo a 1, indica alta associao entre as variveis
|r| prximo a 0, indica no associao entre as variveis
|r| prximo a 0.5, indica associao moderada
13