Anda di halaman 1dari 26

Covarincia, correlao e regresso linear

Marilena Meira

Dados multidimensionais
Quando dispomos de duas ou mais sries de dados devemos usar outras medidas estatsticas para entender como as duas sries se relacionam. As duas medidas mais largamente usadas so a correlao e a covarincia.

Covarincia

A Covarincia uma medida que descreve a variabilidade dos componentes das diferentes dimenses em relao com os restantes. Mostra como as sries variam entre si. Relao entre duas sries de medidas.

Interpretao da covarincia
Valor positivo: As duas sries de valores aumentam ou diminuem juntas. Valor negativo: Quando uma aumenta a outra diminui. Valor zero: As duas sries so independentes.

Relao entre as variveis


Um problema com o qual nos deparamos freqentemente se determinada varivel est ou no relacionada com outra(s) e em que grau. Exemplos: Horas dirias de exerccio x desempenho do ginasta Propaganda de divulgao x venda de produto Divulgao de escndalo de um poltico x nmero de votos para este poltico Desnutrio x altura da criana Anemia x desempenho do aluno na escola

Exerccios
Calcular covarincia das duas sries de dados e interpretar o resultado:

Resultado

1352.417 122.947

Covarincia positiva: As duas sries aumentam juntas.

Covarincia em trs ou mais dimenses


Calcular todas as covarincias possveis formando uma matriz. Horas dirias de estudo x horas de laser x desempenho do aluno na escola Para trs dimenses:

A covarincia sempre calculada em duas dimenses. Aplicar a frmula para cada duas variveis:

Exerccios para prxima aula

Regresso
Regresso: Predio de uma varivel em funo de outra atravs da equao da reta. Y = ax + b

Diagrama de disperso

Reta de regresso
Reta resultante do ajuste de uma funo linear entre 2 variveis y e x. Para obter a reta de regresso necessrio calcular o Coeficiente angular (Coeficiente de regresso) e o intercepto da reta com a ordenada.
Varivel dependente Varivel independente

Equao da reta de regresso


(a)

a (b) y = ax + b onde b = y - ax

y = ax + b

Exerccio para prxima aula


Calcular a equao da reta de regresso a partir dos dados:
X 1,9 3,0 4,1 5,2 6,0 6,9 8,1 9,0 10 Y 6,9 8,9 11,2 13,5 15 16,9 18,9 21,0 23

Exerccio
Calcular a equao da reta entre duas sries X e Y sabendo dos dados: X = 20,2; Y = 10,5; Cov(X,Y) = 5 y = ax + b onde b = y - ax S2 = 2

Correlao
Correlao: Grau de associao entre variveis quantitativas. usada para determinar se h relacionamento entre 2 variveis.

Covarincia e correlao
Covarincia: uma medida no padronizada do grau no qual com que as variveis se relacionam. A correlao a medida padronizada da relao entre duas variveis. Ela pode ser calculada a partir da covarincia.

Coeficiente de correlao linear


Serve para detectar padres lineares (somente os lineares). Coeficiente de correlao linear de pearson: r ou = xy x.y Mede o grau de relacionamento linear entre os valores emparelhados x e y em uma amostra.

Coeficiente de correlao

Outra forma:

Coeficiente de correlao

Coeficiente de correlao
A correlao nunca pode ser maior do que +1 ou menor do que -1. Uma correlao prxima a zero indica que as duas variveis no esto relacionadas. Uma correlao positiva indica que as duas variveis movem juntas, e a relao forte quanto mais a correlao se aproxima de um. Uma correlao negativa indica que as duas variveis movem-se em direes opostas, e que a relao tambm fica mais forte quanto mais prxima de menos 1 a correlo ficar.

Coeficiente de correlao
Duas variveis que esto perfeitamente correlacionadas positivamente (r=1) movemse essencialmente em perfeita proporo na mesma direo, enquanto dois conjuntos que esto perfeitamente correlacionados negativamente movem-se em perfeita proporo em direes opostas.

Coeficiente de correlao (r)

Coeficiente de determinao
Se r = 0,897 ento r2 = 0,8046 ou 80,46%, Ou seja, a variao de y explicada em 80,46% pela variao de x.

2 r

Exerccio para prxima aula


Calcular o coeficiente de correlao a partir dos dados abaixo:
X 1,9 3,0 4,1 5,2 6,0 6,9 8,1 9,0 10 Y 6,9 8,9 11,2 13,5 15 16,9 18,9 21,0 23

Uso do Origin
Equao da reta no Origin Coloca os dados no workshet deixa apenas o x e y deleta as outras colunas Plot line line seleciona apenas o y Analysis fitting fit linear Yes Coeficiente de correlao Statistic Descriptive statistic correlation coefficient