Anda di halaman 1dari 38

ANALISIS DE

REGRESION Y
CORRELACION
Scatterplot of Precio vs Area
220000

200000

Precio

180000

160000

140000

Mgr. Sonia Urquidi B.

120000
1000

1500

2000
Area

2500

3000

OBJETIVOS
Describir la relacin entre dos o ms
variables
Describir la fuerza de la relacin entre las
variables independientes y la variable
dependiente
Aplicar a la realidad
Especificar y Estimar un Modelo de Relacin
entre las variables econmicas relativas a
una determinada cuestin conceptual

CONTENIDO
1.
2.
3.
4.
5.
6.
7.

Introduccin
Regresin simple
Regresin lineal simple
Anlisis de correlacin
Pruebas para parmetros poblacionales
Anlisis de regresin mltiple
Coeficiente de correlacin mltiple

1. Introduccin
Publicidad Ventas
35
350
50
450
40
360
65
540
55
520
45
420
70
560

Regresin

y correlacin son las


dos herramientas estadsticas
ms poderosas y tiles que se
pueden utilizar para solucionar
muchos problemas.
Es un mtodo de anlisis de
datos que sirve para poner en
evidencia las relaciones que
existen entre diversas variables

Con

la regresin, se pretende identificar


y cuantificar alguna relacin funcional
entre dos o ms variables.
Una variable puede depender de una o
ms variables.
Si solo depende de una, se puede decir
que Y depende de X:
Y = f(X)
Regresin simple

Si

depende de varias:
Y =f (X1, X2,,Xn)
Regresin mltiple
Demanda est en funcin de:

2. Regresin simple
Es

la relacin entre dos


variables.
Puede ser:
Lineal: a medida
que X cambia Y
cambia en una
cantidad
constante

Curvilnea

Curvilnea

3. Regresin Lineal Simple


Se trata de predecir el comportamiento
de Y usando X.
El modelo de regresin lineal simple
es de la forma:
Pendiente

Y X
0

Variable
dependiente o
respuesta

Intercepto

Error
aleatorio

Variable independiente
o predictora o
explicativa

Ejemplos
Y

Ventas
X es la publicidad
La recta es:
Y = 124 + 6 X

Variacin vertical
Variacin horizontal

Intercepto Pendiente

Lnea de regresin estimada

El modelo de regresin lineal es estimado por la


ecuacin

Y X e
0

Estimaciones
Solo

puede
estimarse

Error

Lnea de regresin estimada

El modelo de regresin estimada es:

Y X
0

Interpretacin de los Coeficientes de


Regresin:

Interpretacin del intercepto 0 :


Indica el valor promedio de la variable de
respuesta Y cuando X es cero. Si se tiene
certeza de que la variable predictora X no puede
asumir el valor 0, entonces la interpretacin no
tiene sentido.
Interpretacin de la pendiente :
1
Indica el cambio promedio en la variable de
respuesta Y cuando X se incrementa en una
unidad.

La

ecuacin para estimar los


parmetros de regresin es:

Es

Y X
0

la recta que mejor se ajusta a los


datos muestrales
De lo que se trata es de estimar

MINIMOS CUADRADOS
ORDINARIOS
Procedimiento

matemtico para
estimar la recta de regresin.
M.C.O produce una recta que se
extiende por el centro del
diagrama de dispersin
aproximndose a todos los
puntos de datos ms que
cualquier otra recta.

Diagrama de
dispersin

Ejemplo

Ventas

Publicidad Ventas
35
350
50
450
40
360
65
540
55
520
45
420
70
560

600

500

400

300

200

100

0
0

10

20

30

40

50

60

70

80

Cambiando

origen de los ejes

Ventas y Publicidad
620

570

520

470

420

370

320
30

35

40

45

50

55

60

65

70

75

Agregando

la recta estimada

Ventas y Publicidad

Y X

620

570

520

470

420

370

320
30

35

40

45

50

55

60

65

70

75

Ventas y Publicidad

Y X

620

570

520

Yi

470

420

370

320
30

35

40

45

50

55

60

65

70

75

Ventas y Publicidad

Y X

620

570

520

Error

Yi

470

420

370

320
30

35

40

45

50

55

60

65

70

75

ERROR
DIFERENCIA ENTRE LOS
VALORES REALES DE Y

Y EL ESTIMADO DE Y

Yi

Error (Yi Yi )


(Y i Yi ) 0
M.C.O HACE QUE SE MINIMICE
LA SUMA DE ESTOS ERRORES AL
CUADRADO

(
Y

Y
)

mnimo
i
i
2


(
Y

Y
)

mnimo
i
i
2

COMO LA RECTA ESTIMADA ES:

Y 0 1 X i
REEMPLAZANDO VALORES:

(Y i 0 1 X i ) mnimo
2

(Y i 0 1 X i ) mnimo
2

DERIVANDO LOS PARAMETROS E


IGUALANDO A O Y APLICANDO SUMAT.

Y i n 0 1 X i

Y
X

X
i i

0
i
1
i

La

recta estimada es:

Yi 124 .34 6.47 X

SUPUESTOS

REGRESION

DEL MODELO DE

1.

El trmino de error es una variable


aleatoria distribuida normalmente
Para cada valor de X, no necesariamente
existe un solo valor de Y

Algunas veces Y estar por encima de la


recta de regresin y otras por debajo, da el
llamado error, los mismos que se
distribuyen en forma normal y
aleatoriamente alrededor de la recta de
regresin poblacional

2.

Varianzas iguales de los valores

M.C.O

asume que las varianzas en los


valores de Y es la misma para todos los
valores de X.

Supuesto de HOMOSCEDASTICIDAD

Y en la prctica?

2.

Los trminos de error son


independientes uno de otro

El

trmino error encontrado para un valor


de Y, no se relaciona con el trmino de
error para cualquier otro valor de Y

Esto puede verse analizando el diagrama de


los errores de los datos muestrales, si no se
observa ningn patrn, se puede asumir
que los trminos de error no se relacionan.
Si no cumple este supuesto, se dice que hay
autocorrelacin.

4. Medidas de bondad de ajuste


A

la recta de regresin, se la
denomina tambin la recta del ajuste
ptimo, sin embargo es necesario
conocer qu tan bien se ajustan los
datos a esta recta
1. Error estndar de la estimacin
2. Coeficiente de determinacin

Error estndar de la estimacin:


Es

Se

una medida del grado de

dispersin de los valores


i
alrededor de la recta de regresin

Mide la variacin de los puntos de los


datos por encima y por debajo de la recta
Ventas y Publicidad
620
570
520
470
420
370
320
30

35

40

45

50

55

60

65

70

75

Qu pasa si todos los puntos


estn sobre la recta?
Cunto es el error de estimacin?
As ocurre en la realidad?
Siempre hay dispersin
Es medida por el error estndar
de la estimacin

Error estndar de la

estimacin:

Se
Ventas
350
450
360
540
520
420
560

Se

(Y i Yi )
n2

Y est (Yi Y est)^2


350,79
0,69
447,84
4,42
383,14
537,70
544,89
24,64
480,19
1.579,77
415,49
19,86
577,24
299,94
2.467,03

2467 ,03
Se
72

Se 22,21

Error estndar de la

estimacin: Se, tambin se


puede calcular:

Se CME
SCE
CME
n2
( SC XY )
SCE SCY
SC X

A TRAVS DE EXCEL
Estadsticas de la regresin
Coeficiente de
correlacin
mltiple
0,97139156
Coeficiente de
determinacin R^2
0,94360156
R^2 ajustado
0,93232187
Error tpico
22,2127395
Observaciones
7

GRACIAS

Anda mungkin juga menyukai