Anda di halaman 1dari 5

ANLISE DE CORRELAO

9 de Maro
COVARINCIA
J vimos, quando estudamos as propriedades da varincia da soma de duas
variveis estatsticas, que existe uma medida estatstica, que denominamos por
covarincia, definida pela seguinte expresso:
( )( )
N
Y y X x
S
N
i
i i
y x

1
,
issemos que esta grande!a " uma medida da associao linear entre duas
variveis# $xploremos esta afirmao:
1 % &e 'ouver uma associao linear perfeita entre as variveis, teremos (i ) *
+
,
*
1
-i, vindo:
( )( ) ( )( )
Y X X X
N
i
i i
N
i
i i
y x
S S S S b
N
X b x b X x
N
Y y X x
S



1
1
1 1
1
,
porque
X Y
S b S
1

#
.omo &( " sempre positiva, se *
1
for negativo, temos Y X y x
S S S
, #
/% &e a associao entre as variveis for parcial, ento (i ) *
+
, *
1
-i , i, com a
m"dia de $i !ero, varincia positiva e no associada com -# 0ssim sendo, temos:
( )( ) ( )( )
( )( ) ( )
Y X X X
N
i
i i
N
i
i
N
i
i i
N
i
i i
y x
S S S S b
N
e X x
N
X b x b X x
N
X b e x b X x
N
Y y X x
S
<





1
1 1
1 1
1
1 1
1
,
porque agora
/ /
1
/
E X Y
S S b S + , vem
1
/ /
1
1 2 3 b S S S S S b
E Y X X X
#
4i!emos
( ) +
1

N
i
i i
e X x
porque E no est relacionada com X 3ver 52#
5% 6o limite, se no 'ouver a associao linear entre as variveis, vir
E Y
S S
,
de que resulta a covarincia igual !ero 3no limite, para termos a varincia de ( finita,
ser necessrio que b
1
se7a !ero2#
COEFICIENTE DE CORRELAO DE PEARSON
8erificamos que o domnio de variao da .ovarincia " o con7unto
[ ]
Y X Y X
S S S S 9 # 0ssim, torna%se mais fcil medir a associao linear entre as variveis
estatsticas dividindo a covarincia pelo produto dos desvios padro# esta forma, esta nova
medida que se c'ama :coeficiente de correlao de ;earson<, tem domnio de variao =%19 1>#
Y X
Y X
S S
S
r
,

&e r ) 1 ou r ) %1, a associao linear entre as variveis estatsticas " perfeito#


Propriedade da Covarincia e do Coe!icien"e de corre#a$%o
a2 0 .ovarincia entre uma varivel esta tstica e uma constante " !ero:
1?
( )( )
+
1
,

N
a a X x
S
N
i
i
a x
*2 &e multiplicarmos uma varivel estatstica por uma constante, a covarincia vem multiplicada
por essa constante# 6o entanto, o coeficiente de correlao vem inalterado
( )( ) ( )( )
y x
N
i
i
N
i
i i
by ax
abS
N
Y y X x ab
N
Y b by X a ax
S
,
1 1
,



x x
Y X
Y X
by ax
r
bS aS
abS
r
, ,
,

c2 &
-, (
)
Y X N y x

1 2 # 3
&ODELO DE RE'RESSO
J vimos que as variveis estatsticas podem estar :estatsticamente
relacionadas<# @uer isto di!er que podemos explicar parte da varincia de uma varivel
3a varivel explicada2 A custa de outra varivel 3a varivel explicativa2#
&endo que eu o*servo duas variveis, x
i
e y
i
que esto relacionadas de forma no
o*servvel,
{ } ( ) ( ) { } ,### 2 3 , 2 3 2 , 3 2,###, , 3 2, , 3
/ / / / 1 1 1 1 / / 1 1
+ + x F y x F y y x y x y x
n n
,
ser necessrio desco*rir as Bleis da 6ature!aB que relacionam as v#e# 6o sentido de ser
possvel :estimar< a Cei que relaciona as v#e#, ten'o, por 'ipDtese de partida, afirmar
que a lei " Enica 3invariante no espao1tempo2: ( ) ( ) { } ,### 2 3 , 2 3
/ / / 1 1 1
+ + x F y x F y
6uma primeira fase, vamo%nos de*ruar so*re leis lineares do tipo:
+ + X B B Y
1 +
6esta relao linear, a varivel X " explicativa 3tam*"m denominada por
independente2 e a varivel Y " explicada 3tam*"m denominada por dependente2#
0o parmetros B
+
e B
1
so descon'ecidos e no o*servveis# 0ssim sendo, a
questo que agora temos que resolver " como o*ter :estimativas< para esses parmetros#
&("odo do &)ni*o +,adrado -OLS . Ordinar/ Lea" S0,are1
@uando se apresentamos a Bm"dia aritm"tica simplesB, explicamos que se
existisse como grande!a caracterstica da populao o Bvalor m"dio populacionalB, ,
no o*servvel, poderamos, a partir de uma amostra BrepresentativaB estim%lo, com
um erro#
0gora estamos no mesmo tipo de situao: existe uma lei caracterstica da
populao,
+ + X B B Y
1 +
, no o*servvel, e queremos estimar os parmetros do
modelo a partir de uma amostra BrepresentativaB#
F estimador ser uma expresso matemtica que permite, no a*stracto, o*ter
uma estimativa para o parmetro 3um nEmero concreto2 a partir de uma amostra
concreta# ;or exemplo, se eu digo que o estimador para o valor m"dio da populao "

n x
i
1 2 3 G
, estou a falar no a*stracto# &e medir os valores numa amostra concreta e
calcular
HI # I ? 1 2 9 / I H 3 G + + +
, estou a falar numa estimativa concreta#
F estimador dever ter duas propriedades importantes: eve ser cJntrico e
eficiente#
1I
O 0,e ( er c2n"rico3 como os indivduos da amostra so escol'idos
aleatoriamente, se tiv"ssemos outra amostra, teramos outros indivduos e por
consequJncia, outra estimativa# &e ,o estimador for cJntrico, se tiv"ssemos um nEmero
muito grande de amostras 3no limite, um nEmero infinito2, em que a cada amostra
corresponderia, no concreto, uma estimativa diferente, em m"dia, a estimativa
corresponderia ao verdadeiro valor do parmetro# F antDnimo ser ter um estimador
enviesado 3por defeito ou por excesso2#
O 0,e ( er e!icien"e3 como o verdadeiro valor do parmetro " descon'ecido, ao
tomarmos a estimativa como se fosse o seu verdadeiro valor, cometemos um erro
3veremos a seguir que " possvel avaliar este erro2# e todos os estimadores possveis, o
estimador eficiente " o que, em m"dia, ter menos erro K se tiv"ssemos um nEmero
muito grande de amostras 3no limite, um nEmero infinito2, em que a cada amostra
corresponderia, no concreto, uma estimativa diferente, o erro seria dado pela varincia
das estimativas#
8e7amos como existem muitos estimadores possveis: no exemplo do estimador
do valor m"dio, poderemos utili!ar, em ve! da m"dia amostral, a m"dia dos dois valores
extremos da amostra#
;rova%se que o estimadores o*tidos pelo &("odo do &)ni*o +,adrado so
cJntricos e eficientes 3so* certos pressupostos2#
E"i*adore do 45
6uma A amostra concreta, temos o sistema y
i
) B
+
+B
1
x
i
,
i
que " indeterminado
porque tem n equaLes e n , / incDgnitas 3os n
i
Ms mais os dois parmetros2#
J que no posso sa*er os verdadeiros valores dos parmetros nem dos termos
no explicados 3desvios2, vou procurar um estimador para os parmetros que minimi!e
o erro da estimao# 0ssumindo que os desvios so nulos e que *
+
e *
1
so as
estimativas de N
+
e N
1
, respectivamente# $nto, a estimativa de O ser:
i i
x b b y
1 +
G +
.omo queremos um estimador eficiente, vou calcular qual ser a varincia do
erro de estimao:
( ) ( ) ( )

n x b b y n y y EQM y y e
i i i i i i i
1 2 3 1 G 9 G
/
1 +
/ /
$ vamos minimi!ar esta varincia
0 diferena entre considerar a soma dos termos e os seus quadrados " que, sendo
que com *ase na amostra no podemos determinar exactamente o modelo verdadeiro,
no caso da soma, existe um continuo de soluLes possveis e no caso dos quadrados, a
soluo ", na maioria dos casos, Enica#
0gora determinemos o que descon'ecemos minimi!ando a expresso anterior, o
que se consegue resolvendo o sistema das condiLes de primeira ordem 37aco*iano2:
( ) ( ) [ ]
( ) ( ) [ ]

'

+ + + +
+ + + +
+ 1 ### 2 3 2 3
+ 1 ### 2 3 2 3 /
/ / 1 + / 1 1 1 + 1
1
/ 1 + / 1 1 + 1
+
n x x b b y x x b b y
db
dEQM
n x b b y x b b y
db
dEQM
$m termos de erros teremos:
1P
[ ]
[ ]

'

'

+ +
+ +
+ ,
+
+ 1 ###
+ 1 ### /
/ / 1 1
1
/ 1
+
x e S
e
n x e x e
db
dEQM
n e e
db
dEQM
0 primeira equao pode ser simplificada em
12
( ) ( )
X b b Y
n x x b b n y y
1 +
/ 1 1 + / 1
+ 1 ### 1 ###
+

+ + + +
0 segunda equao pode ser simplificada em
[ ]
[ ]

'

'



/ /
1
1 +
/
1 +
1 +
G
G G
+ 1
G G
+ 1
G G
X n x
X Y n x y
b
X b Y b
n x b x b x y
n x b b n y
i
i i
i i i i
i i
;odemos ainda verificar que
1
b
se pode calcular com a covarincia e com o
quadrado do desvio padro de X 3varincia2:
/2
/
,
/ / /
1
2 3
2 23 3
X
X Y
i
i i
i
i i
S
S
X x
Y y X x
X n x
X Y n x y
b

enominam%se estas duas equaLes como :$quaLes 6ormais< 3p#/?H2


$xiste tam*"m uma associao entre o coeficiente de correlao e b
1
:
X
Y
x y
S
S
b
, 1

0ssumindo que os desvios no o*servveis so uma componente aleatDria,
podemos utili!ar como estimativa do desvio padro desses desvios os Berros amostraisB:
n e Se S x b b y e
i i i i
1 2, 3
/
1 +
+
6otamos que o valor para o erro ser um mnimo se a varincia de - for positiva
3a matri! das segundas derivadas, a 'esseana, for definida positiva2:
1H
( )
/
/
/
/
1
/
/
+ 1
/
1 +
/
+
/
/
?
? ?
/ /
/ /
#
#
x
S
x x n
x x
x n
b d
dEQM
db db
dEQM
db db
dEQM
b d
dEQM


1
]
1

1
1
1
1
]
1

1Q

Anda mungkin juga menyukai