Anda di halaman 1dari 4

FICHA INFORMATIVA

Dados bidimensionais
Muitas vezes h estudos estatsticos que incidem no sobre uma varivel mas sim sobre duas variveis que se supem relacionadas. Por exemplo: O nmero de elementos de um agregado familiar e o nmero de divises da habitao. O tempo de estacionamento num parque e o preo a pagar pelo estacionamento. A classificao interna dos alunos de uma escola e a classificao obtida no Exame Nacional. Suponha-se que numa turma do 12 ano, as classificaes internas a Portugus, tiveram a seguinte distribuio: N do aluno
1 2 3 4 5 6 7 8 9 10 11 12

Classificao interna (x)


12 10 13 12 11 10 15 16 12 18 10 20

Exame Nacional (y)


11 9 14 12 10 11 16 15 13 15 8 18

Quando se pretende estudar duas variveis conjuntamente, os dados observados aparecem sob a forma de pares de valores. Neste estudo, a cada elemento da populao corresponde ento um par ordenado de valores (x, y), em que x representa a classificao interna do aluno e y representa a classificao obtida no exame nacional. Os dados bidimensionais so ento:
(12,11) (10,9) (13,14) (12,12) (11,10) (10,11) (15,16) (16,15) (12,13) (18,15) (10,8) (20,18)

e representao grfica d-se o nome de diagrama de disperso ou nuvem de pontos:

O diagrama de disperso muito til pois permite observar o tipo de associao entre as variveis x e y. Observando o 1 grfico ao lado, verifica-se que, em mdia, quando a varivel x aumenta, a varivel y tambm aumenta. Diz-se que h uma associao positiva entre as variveis. Observando o 2 grfico ao lado, verifica-se que, em mdia, quando a varivel x aumenta, a varivel y diminui. Diz-se que h uma associao negativa entre as variveis. No 3 grfico, a nuvem de pontos encontra-se bastante dispersa, o que faz prever que no existe uma associao clara entre as duas variveis. Diz-se que no existe associao entre as variveis.

Observando os diagramas de disperso, possvel, intuitivamente, verificar ou no a existncia de associao entre as duas variveis em estudo. Para quantificar o grau de associao de associao linear utiliza-se o coeficiente de correlao linear, que se representa por r. O coeficiente de correlao indica o grau de associao linear entre as duas variveis. Prova-se que r

[-1,1].
r=

(x
n i =1 n i =1 i

x yi y
2 n

)(

) )
2

( x x) ( y
i =1

Conhecido o valor de r pode avaliar-se o grau de associao linear entre as duas variveis de acordo com o seguinte esquema:

Exemplos:

Correlao positiva perfeita r = 1

Quando a correlao entre duas variveis forte, os pontos do diagrama de disperso situam-se em torno de uma recta. H muitas rectas que se podem desenhar, mas um dos critrios mais comuns o de tornar mnima a soma dos quadrados dos desvios dos pontos em relao recta. A essa recta d-se o nome de recta de regresso e tem as seguintes caractersticas: Trata-se da recta que passa pelo ponto (x, y) - centro de gravidade - que melhor se ajusta aos pontos do diagrama de disperso. A recta de regresso pode ser definida por uma equao do tipo y = ax + b, onde a e b so nmeros reais. Prova-se que esta recta passa no ponto (x, y) e que o seu declive o est relacionado com o coeficiente de correlao, tendo o mesmo sinal. A recta de regresso pode no passar por qualquer dos pontos do diagrama de disperso.

Vejamos como determinar a recta de regresso e o coeficiente de correlao, relativamente ao exemplo inicial, recorrendo calculadora grfica:

FIM

Anda mungkin juga menyukai