Anda di halaman 1dari 21

Regresin Lineal Simple

Mg. Deyanira Paz Rubio


CORRELACION LINEAL

Definicin

Es un mtodo que permite estudiar el grado en


que dos variables ,una dependiente (Y ) y la
otra independiente ( X ), estn linealmente
relacionadas entre si.

Diagrama de dispersin

Es una grfica de los datos muestrales que


muestra la ubicacin de los puntos (x,y) de la
variable Bidimensional (X,Y) en un sistema de
coordenadas rectangulares.
TIPOS DE CORRELACION

80
100
70
90
60
80
50
70 40
60 30
50 20
10 r=-0,95
40 r=0,9
0
30
140 150 160 170 180 190 200
140 150 160 170 180 190 200

Correlacin Positiva (Directa) Correlacin Negativa (Inversa)

330
recta o parbola?
280

230

180

130

80 r=0,1
30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Correlacin no Lineal No existe Correlacin


COEFICIENTE DE CORRELACIN LINEAL

La correlacin lineal se mide mediante el coeficiente de


correlacin de Pearson y se define

r=
n xy - x y
n x 2
- ( x) n y - ( y)
2 2 2

Karl Pearson
(1857 1936)
PROPIEDADES DE R

Slo toma valores en [-1,1]


Si r=0, no existe asociacin lineal entre las variables
Si r = - 1, existe una relacin lineal perfecta negativa
Si r = +1, existe una relacin lineal perfecta positiva.
Cuanto ms cerca est r de +1 o -1, mejor ser el grado de
relacin lineal.

Relacin Relacin
No existe asociacin directa
inversa lineal
perfecta perfecta

-1 0 +1
INTERPRETACION DEL COEFICIENTE DE CORRELACION

-0.75 -0.25 0.25 0.75

Prof. Segundo I. Ponte Valverde


EJEMPLO 1

Consideramos que las ventas se relacionan con los gastos en publicidad y


si tenemos los datos que se presentan en la siguiente tabla entonces
podremos observar la siguiente grfica:

Gastos en Diagrama de Dispersin


Ventas en
Ao publicidad en 1.2
millones (Y)
millones (X) 1

Ventas en Millones
1998 3 20 0.8
1999 5 40 0.6
2000 5 80
0.4
2001 6 120
2002 6 90 0.2

2003 7 125 0
2004 4 35 0 0.2 0.4 0.6 0.8 1 1.2
Gastos en Publicidad (Millones)
2005 8 135

Observando el grfico podemos decir que las ventas y el gasto en publicidad


tienen una correlacin Directa o Positiva.
Publicidad
N Ventas (Y) XY X2 Y2
(X)
1998 3 20 60 9 400
1999 5 40 200 25 1600
2000 5 80 400 25 6400
2001 6 120 720 36 14400
2002 6 90 540 36 8100
2003 7 125 875 49 15625
2004 4 35 140 16 1225
2005 8 135 1080 64 18225
Total 44 645 4015 260 65975
X Y XY X2 Y2

n 8, x 5.5, y 80.625

r=
n xy - x y
8(4015) - 44(645)
0.932
n x 2
- ( x) n y - ( y )
2 2 2
8(260) - 44 8(65975) - 645
2 2

La correlacin entre los gastos de publicidad y las ventas es r=0.932.


ANLISIS DE REGRESIN LINEAL

Definicin

El anlisis de regresin lineal simple trata de


establecer la forma de la relacin entre dos
variables de modo que permita predecir una
variable Dependiente (Y) a partir de una
variable Independiente ( X ).

Modelo de Regresin Lineal Poblacional

Y 0 1 X e
Francis Galton donde
Primo de Darwin
Estadstico y aventurero o y 1 : Parmetros o coeficientes del modelo
Fundador (con otros) de Y : Variable dependiente
la estadstica moderna
para explicar las teoras X : Variable Independiente
de Darwin.
e : Error aleatorio
REGRESIN LINEAL ESTIMADA

Como los parmetros o y 1 son desconocidos, es necesario estimar los valores de esos
parmetros a travs de datos muestrales.

Ecuacin de Regresin muestral

Y b0 b1 X

donde

bo y b1 : Son las estimaciones de los parmetros o y 1


: Estimacin de Y para un valor determinado x
MTODO DE MNIMOS CUADRADOS

El mtodo de mnimos cuadrados consiste en hallar los valores bo y b1


de la ecuacin de regresin muestral, de manera que la suma de
cuadrados de los errores alrededor de la lnea de regresin sea mnima

e (y
2
i y i ) 2 min

Karl Friedrich Gauss


Propuso el mtodo de
mnimos cuadrados.
Fue el primero en
demostrar que la
ecuacin estimada Los valores bo y b1 de la ecuacin de regresin se determinan
minimiza la suma de
cuadrados de los
resolviendo el siguiente sistema de ecuaciones normales:
errores.
MTODO DE MNIMOS CUADRADOS

Sistemas de ecuaciones normales

y = b n+b x
0 1

xy = b x + b x
0 1
2

De donde obtenemos

b 0 = y - b1x b1 =
n xy- x y
n x - ( x)
2 2

INTERPRETACION DE LOS COEFICIENTES DE REGRESION:


bo: es el valor de prediccin de Y, cuando la variable independiente X toma valor cero.
b1: es el cambio promedio de Y cuando X cambia en una unidad de medicin.
si b 1 > 0, la tendencia lineal es creciente.
Si b 1 <0, la tendencia lineal es decreciente.
Si b 1 = 0 no hay regresin.
EJEMPLO 2

Una empresa tiene 7 vendedores, y se quiere analizar las ventas


mensuales (en miles de soles) frente a los aos de experiencia. Los datos
estn en la siguiente tabla.

N Experiencia (X) Ventas(miles)

1 13 26
2 16 33
3 30 36
4 2 16
5 8 26
6 6 19
7 31 38
DIAGRAMA DE DISPERSIN

1.2

Ventas (Miles) 0.8

0.6

0.4

0.2

0
0 0.2 0.4 0.6 0.8 1 1.2

Experiencia

Segn el diagrama de dispersin existe una relacin aproximadamente


lineal.
CALCULO DE LOS COEFICIENTES DE REGRESIN

N
Experiencia Ventas(miles)
(X) (Y) XY X2 Y2
1 13 26 338 169 676
2 16 33 528 256 1089
3 30 36 1080 900 1296
4 2 16 32 4 256
5 8 26 208 64 676
6 6 19 114 36 361
7 31 38 1178 961 1444
X= 106 Y=194 XY=3478 X2=2390 Y2=5798

n 7 ; x
x 106 15.14 ; y
194
27.71
n 7 7

nn xy - x y 7(3478) -106(194) 0.688


b1 x y 2 nxy 2
i 1 n x - ( x )3478 7(2390) - 106 2
i i 7(15.14)(27.71)
b1 n 0.688
2390 7(15.14)
2

x 2
i
nx 2
i 1
b0 y - b x 27.71- 0.688 (15.14) 17.29
b0 y b1 x 27.71 ( 0.688 )15.14 17.29
ECUACIN DE REGRESIN

Entonces la ecuacin de regresin estimada ser:

Y 17.29 0.688 X

Interpretacin del coeficiente de regresin, b1

b1 = 0.688. Por cada ao adicional de experiencia que adquiera un vendedor,


sus ventas se incrementan 0.688(s/1000) = s/ 688

Prediccin de las ventas para un empleado con X=40 aos de experiencia

Y 17.29 0.688( 40 ) 44.826

Un empleado con 40 aos de experiencia en ventas, vender


aproximadamente S/.44826
COEFICIENTE DE DETERMINACIN ( R2 )

El coeficiente de determinacin es el porcentaje de la variacin total en la variable dependiente


( Y ),que es explicado por la variacin en la variable independiente ( X ).
El coeficiente de determinacin mide la bondad de ajuste de un modelo de regresin y se
define por.


n 2
yi y
R 1-
2 i=1
r2

n 2
yi y
i=1

Caractersticas:

i) Es un valor no negativo ya que se encuentra entre 0 y 1 0 R2 1


ii) Es un valor muy importante en cualquier anlisis de regresin, ya que muestra el grado
hasta el cual estn relacionadas la variabilidad de X e Y
COEFICIENTE DE DETERMINACIN ( R2 )

Ejemplo: Del ejemplo sobre la regresin entre los aos de experiencia y las ventas
tenemos:

r 0.939 , por lo cual R 0.939 0.883


2 2

Interpretacin: El 88.3% de las variaciones de las ventas (Y) son explicados por los
aos de experiencia. Existe adems un (100-88.3)% = 11.7% que no es explicado por
los aos de experiencia.
Verificando mis Logros

Los datos se refieren a las notas del examen de ingreso ( X ) y el examen de


eficiencia laboral ( Y ) de 5 operadores de mquina

X Y

35 60
45 75
55 95
50 80
60 90

a. Grafique el diagrama de dispersin


b. Calcule e interprete el coeficiente de correlacin
c. Hallar la ecuacin de regresin Y = bo+ b1 X
d. cual sera la nota en eficiencia laboral de un operador de mquina que tuvo
una nota de 70 en el examen de ingreso
e. Calcule e interprete el coeficiente de determinacin
Prof. Segundo I. Ponte Valverde
Oficina de Investigacin

Anda mungkin juga menyukai