Anda di halaman 1dari 10

07-10-2011

Estatística
Análise de Correlação

Paula Rodrigues

Análise de Correlação
Quando se trabalha com duas variáveis, estamos muitas vezes
interessados em avaliar quer o tipo de relações existentes entre
estas, quer a magnitude (ou intensidade) e a direcção desta
associação ou correlação.
O coeficiente de correlação linear é uma estatística que
permite avaliar a magnitude e a direcção da associação ou
correlação existente entre duas variáveis.
Este coeficiente mede a associação entre duas variáveis sem
qualquer tipo de assunção de funcionalidade, isto é, nenhuma
das variáveis é tida como dependente da outra variável.

1
07-10-2011

Análise da Correlação
Quando se fala em relações entre 2 fenómenos,
podemos ter 2 situações distintas:
 existe uma relação funcional entre as variáveis: o
valor de uma é exactamente determinado a partir do
valor da outra (exemplo: perímetro de uma
circunferência).
 as variáveis estão relacionadas, mas o valor de uma
não determina exactamente o valor da outra (exemplo:
em geral, a altura e o peso de uma pessoa estão
relacionados).

Análise da Correlação
Consideremos o segundo tipo de relação:
A altura e o peso das pessoas estão relacionados, no entanto, a
relação entre estes dois fenómenos não se pode representar por
uma fórmula, de tal modo que, se soubermos a altura de uma
pessoa possamos imediatamente saber o seu peso exacto ou vice-
versa.
Correlação
entre as variáveis

É possível utilizar métodos para avaliar a existência e o grau da


relação entre as duas variáveis (altura e peso) – é este o objectivo
da correlação.

2
07-10-2011

Correlação Linear

A correlação linear procura medir a relação entre duas


variáveis X e Y através da disposição das observações
da variável (X, Y) em torno de uma recta.

Ao conjunto de pontos que representam as


observações xi , yi , i  1,2,..., n , num sistema de eixos,
chama-se diagrama de dispersão.

Diagrama de Dispersão
Exemplo: Considere os seguintes dados, que representam o número de idas
mensais ao ginásio e a distância (em km) a que a casa dos os inquiridos se
encontra do ginásio:
Distância x (km) N.º idas ao
ginásio
1 8
3 5
4 8
6 7
8 6
10 3
12 5
14 2
14 4
18 2

3
07-10-2011

Tipos de Correlação
Correlação Linear Positiva:

A correlação entre 2 variáveis é considerada positiva


se, quando uma das variáveis varia num determinado
sentido, a outra tem tendência a variar nesse mesmo
sentido (isto é, se a valores crescentes de X estiverem
associados valores crescentes de Y, ou se a valores
decrescentes de X estiverem associados valores
decrescentes de Y).

Correlação Linear Positiva

4
07-10-2011

Tipos de Correlação
Correlação Linear Negativa:

A correlação entre 2 variáveis é considerada negativa


se, quando uma das variáveis varia num determinado
sentido, a outra tem tendência a variar no sentido
contrário (isto é, se a valores crescentes de X
estiverem associados valores decrescentes de Y, ou se
a valores decrescentes de X estiverem associados
valores crescentes de Y).

10

Correlação Linear Negativa

5
07-10-2011

11

Tipos de Correlação
Correlação Linear Nula:

A correlação entre 2 variáveis é considerada nula


quando não há relação linear entre as variáveis X e Y,
ou seja, quando os 2 fenómenos ocorrem de forma
independente.

12

Correlação Linear Nula

6
07-10-2011

13

Coeficiente de Correlação Linear


Coeficiente de Correlação Linear:
Mede a correlação linear existente entre duas
variáveis X e Y, representa-se por e define-se por:

 x  
n

i  x yi  y
rXY  i 1

 x   
n n
 x   yi  y
2 2
i
i 1 i 1

14

Coeficiente de Correlação Linear


O coeficiente de correlação linear varia entre -1 e 1,
sendo que:
 0  rXY  1  Correlação linear positiva

Se rXY  1 , a correlação é positiva perfeita

(a relação linear entre as variáveis é exacta, todos os


pontos se situam sobre uma mesma recta, de declive
positivo)

7
07-10-2011

15

Coeficiente de Correlação Linear


  1  rXY  0  Correlação linear negativa

Se rXY  1 , a correlação é negativa perfeita


(a relação linear entre as variáveis é exacta, todos os
pontos se situam sobre uma mesma recta, de declive
negativo)

 rXY  0  Correlação linear nula

16

Coeficiente de Correlação Linear


Aplicando as propriedades dos somatórios e a definição de valor
médio, o coeficiente de correlação pode ser escrito na seguinte
forma:
n n

n x  y i i

 i 1
xi yi  i 1
n
i 1
S X ,Y
rXY  
 S X  SY
    
2 2
  n  n

 n



 x
  
i
   n



 y
 
i
 

 
 i 1
xi 2   i 1    
n  
  i 1

yi 2   i 1  
n 

   
   
   

8
07-10-2011

17

Coeficiente de Correlação Linear


Para efectuar os cálculos envolvidos na expressão do coeficiente
de correlação linear, é habitual construir-se uma tabela com todas
as quantidades necessárias à determinação do referido
coeficiente:

2 2
xi yi xi yi xi yi

    

n n n n n

x y x y x y
2 2
i i i i i i
i 1 i 1 i 1 i 1 i 1

18

Coeficiente de Correlação Linear


Exercício:
A probabilidade de uma parturiente dar à luz um bebé m o síndrome de
Down aumenta significativamente com a idade. Numa determinada
maternidade obteve-se a seguinte informação:
X1 = Idade X2 = Incidência do Síndrome de Down (%)
18 0,0348
19 0,0535
22 0,0504
23 0,0752
27 0,0746
28 0,1000
31 0,0945
Determine o coeficiente de correlação linear.

9
07-10-2011

19

Coeficiente de Correlação Linear


Resolução:

7 7 7 7

i 1
x1i  168 
i 1
x2i  0,483 
i 1
x12i  4172 x
i 1
2
2i  0,03676

x x
i 1
1i 2i  12,225 rx1 , x2  0,913

10

Anda mungkin juga menyukai