Anda di halaman 1dari 10

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

LECTURA 11: REGRESIN Y CORRELACIN LINEAL SIMPLE (PARTE II)


TEMA 21: CORRELACIN LINEAL SIMPLE
1. INTRODUCCIN:
El analisis de correlacin estudia la intensidad o asociacin entre dos o ms
variables cuantitativas , sin que necesariamente exista un relacin funcional entre
ellas. Cuando se trata de dos variables solamente, se habla de correlacin simple y
cuando se trata de ms de dos variables se habla de correlacin mltiple.
Existen variables que estn correlacionadas linealmente como ejemplo : la captura
de pescado en toneladas mtricas y el nmero de embarcaciones, la satisfaccin y
la participacin del personal, aprendizaje y tcnicas de estudio, los beneficios y los
dividendos en el valor de las acciones, etc., que es el tema que trataremos en esta
sesin de aprendizaje.
2.
DEFINICIN:
La correlacin estudia la asociacin o relacin entre dos variables, es decir mide el
grado de relacin entre ellas, mediante un coeficiente o ndice. La medida del grado
de asociacin entre dos variables se llama coeficiente de correlacin lineal simple.
Es importante indicar que correlacin no indica causalidad . El hecho que dos
variables estn altamente correlacionadas no implica que X causa a Y ni Y causa a
X.
Cuando se extrae una muestra de n pares de observaciones (x i, yi), i=1,2,,n de la
poblacin (x,y) no necesariamente independientes. El estimador puntual del
coeficiente de correlacin poblacional p es el coeficiente de correlacin muestral r de
Pearson, que se define por:

r
[n

xy (
(

x)(

x) ] [n

y)
y

y) ]

1
Elaborado por
Fecha
Versin

: Mg. Carmen Barreto R.


: Febrero 2010
:2

3.

CARACTERSTICAS:
r puede ser positivo o negativo
-1 r

Si r =0; no existe correlacin lineal entre las variables x e y.


Si r<0 ; la correlacin lineal es negativa entre las variables x e y.
Si r>0 ; la correlacin lineal es positiva entre las variables x e y.
Si r =

1; existe una correlacin lineal perfecta entre las variables x e y

Si r se acerca a + 1 a -1, la correlacin lineal entre las variables x e y es


bien estrecha.
Tamben podemos decir que cuando:
- 0

- 0.5
x e
- 0.8
x e
4.

0.5
r

existe una correlacin lineal dbil entre las variables x e y.


0.8 existe una correlacin lineal moderada entre las variables

y.
r

existe una correlacin lineal alta o fuerte entre las variables

y.

TIPOS DE CORRELACIN
Tipos

Grfico
y

Correlacin lineal positiva:


A medida que aumenta x , y
tamben aumenta.

x
y

Correlacin lineal negativa:


A medida que x aumenta, y
disminuye.

x
y

Sin correlacin:
x e y no se agrupan linealmente.
x

5.

PRUEBA DE HIPTESIS PARA EL COEFICIENTE DE CORRELACIN

POBLACIONAL ( ).
Puede ser que el coeficiente de correlacin poblacional sea cero y que una muestra
engaosa hizo que se asumiera equivocadamente una relacin, por consiguiente se
debe probar la hiptesis sobre el coeficiente de correlacin poblacional. Se siguen
los siguientes pasos:
1.

Formulacin de hiptesis:
H0 : = 0
H1 :
0

2.

Nivel de significancia:

3.

Estadstica de prueba:
r
t
tn 2
sr
NOTA: La estadstica de prueba nos sirve para hallar el vaor experimental
tk y el valor tabular t 0 t1 / 2 ; n 2

4.

Establecimiento de los criterios de decisin:

1-

/2
-to

R.R.
R.A.: Si t

R.A
.
[-to , to], se acepta Ho .

to
R.R.

R.R.: Si tk < -to o tk > to , se rechaza Ho .

5.

Clculos:
tk

6.

sr

Donde:

sr

1 r
n 2

Decisin:
Se acepta o se rechaza la hiptesis

Ejemplo 1:
Deniz Yesiltepe tiene una comercializadora de computadoras y quiere saber si
existe alguna relacin lineal entre el nmero de llamadas hechas en un mes y el
nmero de computadoras vendidas. Para ello, toma una muestra aleatoria de 10
representantes de ventas y determina el nmero de llamadas hechas por cada uno
el mes pasado, as como el nmero de computadoras que vendi., los resultados se
muestran en la siguiente tabla:
X
Y

a)
b)
a)

10
30

15
35

20
40

25
45

28
47

30
50

35
55

40
60

45
70

50
72

Graficar el diagrama de dispersin e indicar si existe correlacin lineal entre las


variables.
Determine el coeficiente de correlacin lineal e interprete.
0)
Pruebe si el coeficiente de correlacin poblacional es diferente de cero (
para un nivel de significancia =0.05 .

Solucin:
a)

Diagrama de
dispersin
80
70
60
50
40
30

20
10
0
5

10

15

20

25

30

35

40

45

50

55

Observando el grfico vemos que dichas variables tienen una correlacin lineal
positiva entre el nmero de llamadas realizadas en el mes y el nmero de
computadoras vendidas.
b)

Utilizando el coeficiente de correlacin lineal de Pearson:


r

n
n

Entonces:
x = 298
y2 = 27168

xy (
( x)

x)( y)
2
n y (

x2 = 10384
xy = 16641

y)

y = 504
n = 10

Reemplazando las sumatorias en la frmula obtenemos:

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

r = 0.9951
Dicho valor nos indica que existe una alta correlacin lineal positiva.
c)

Para probar la relacin lineal entre las variables, llevamos a cabo la


contrastacin de coeficiente de correlacin lineal poblacional ( 0).

1.

Formulacin de Hiptesis
H0 :

H1 :

2.

Nivel de significacin:

3.

Estadstica de prueba:
t
t

4.

r
sr

tn

= 0.05

t8

Establecimiento de los criterios de decisin:


:

1-

=0.95

/2
0

-2.306
R.R.

R.A

R.A.: Si tk

2.306
R.R.

[-2.306., 2306], se acepta H


.
o

R.R.: Si tk < - 2.306 o tk > 2.306, se rechaza


Ho.
to

t1

/ 2,n 2

t 0.975,8 2.306

5.

Clculos:
tk

tk

6.

r
sr

1 (0.9951)
10

; Donde : s r

0.9951 0
0.0313

0.0313

31.79

Decisin:

Como tK = 31.79 R.R., rechazamos H0,, lo que quiere decir que


existe correlacin lineal entre las variables.

0 ; por lo tanto

Ejemplo 2:
En base a una muestra aleatoria de 12 se desea saber si existe relacin lineal entre
el precio en euros (X) por el que se adquiri una impresora laser y el nmero de
aos de antigedad (Y)

N de aos de
antigedad (X)
Precio en (Y)

a)
b)
c)

10

466

418

434

487

516

462

475

501

594

553

551 589

Graficar el diagrama de dispersin e indicar si existe correlacin lineal entre las


variables.
Determine el coeficiente de correlacin lineal e interprete.
0)
Pruebe si el coeficiente de correlacin poblacional es diferente de cero (
para un nivel de significancia =0.05

Solucin:
a)

Diagrama de Dispersin
700
600
500

400
300
200
100
0
0

10

12

b)

Utilizando el coeficiente de correlacin lineal de Pearson:


Entonces:
x = 63

x2 = 431

y = 6046

y2 = 3082898
xy = 29880
n = 12
Reemplazando las sumatorias en la frmula obtenemos:
r = -0.9702
Dicho valor nos indica que existe una alta correlacin entre el numero de aos de
antiguedad y el precio en euros por el que se adquiri una impresora lasser.
c)

Para probar la relacin lineal entre las variables, llevamos a cabo la


contrastacin de coeficiente de correlacin lineal poblacional ( 0).

1.

2.

Formulacin de Hiptesis
H0 :

H1 :

Nivel de significacin:
n

r
3.

( x)

x)(
n

y)
y

y)

Estadstica de prueba:
t
t

4.

xy (

= 0.05

tn

sr

t10

Establecimiento de los criterios de decisin:

1-

=0.95

/2
-2.228
R.R
.

0
R.A
.

2.228
R.R
.

R.A.: Si t k [-2.228, 2.228], se acepta Ho .


R.R.: Si t k < - 2.228 t k > 2.228, se rechaza Ho .

Donde:

5.

/ 2,n 2

t 0.975,10

2.228

Clculos:
tk

tk

6.

t o t1

r
sr

; Donde : s r

0.9701 0
0.07

1 (0.9701)
12

0.07

13.86

Decisin:

Como tK = 13.86 R.R., rechazamos H0, lo que quiere decir que


existe correlacin lineal entre las variables.

0 ; por lo tanto

Anda mungkin juga menyukai