Anda di halaman 1dari 20

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

MTODOS PREDICTIVOS
MNIMOS CUADRADOS ORDINARIOS
Resumen de Clases

Introduccin a MP

Introduccin a los Pronsticos


Short review
Introduccin

Regresin Simple
Regresin Simple
La linea de mnimos cuadrados que mejor se ajusta
Estimaciones puntuales de mnimos cuadrados
Coeciente de determinacin y correlacin simple
Intrvalo de prediccin para un valor individual de y
Prueba F global
Prueba T

Regresin Mltiple
Introduccin
Enfoque matricial
Coeciente de determinacin mltiple R 2
Prueba F global
Prueba T

Regresin Cuadrtica
Introduccin
Ejemplo

Interaccin y V. Ficticia
Interaccin
Variable cticia

Series temporales
Introduccin
Modelado de la tendencia mediante funciones polinomiales
Fin

UNAP

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Regresin Mltiple

Por: Oliver Amadeo Vilca Huayta


ovilca@gmail.com

Noviembre 2015

Regresin Simple

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Regresin Cuadrtica Interaccin y V. Fictic

Short review

Captulo 1:

REGRESIN
MNIMOS CUADRADOS ORDINARIOS

In mathematics, a matrix (plural matrices) is a rectangular array of


numbers, symbols, or expressions, arranged in rows and columns.
The individual items in a matrix are called its elements or entries.
An example of a matrix with 2 rows and 3 columns is
"

1 9 13
20 5 6

Matrices of the same size can be added or subtracted element by


element. The rule for matrix multiplication, however, is that two
matrices can be multiplied only when the number of columns in
the rst equals the number of rows in the second.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin a MP

Short review

Short review

Matrix Multiplication

Matrix Multiplication

In mathematics, matrix multiplication is a binary operation that


takes a pair of matrices, and produces another matrix: If A is an
n m matrix and B is an m p matrix,

A11 A12 A1m


A22 A2m
..
..
..
.
.
.
An1 An2 Anm

A21
A=
..
.

B21
B=
..
.

B11

B12
B22
..
.

..
.

B1p
B2p
..
.

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

the matrix product AB is dened to be the n p matrix.

AB =

Bm1 Bm2 Bmp

(AB)11 (AB)12 (AB)1p


(AB)21 (AB)22 (AB)2p
..
..
..
..
.
.
.
.
(AB)n1 (AB)n2 (AB)np

where each i, j entry is given by multiplying the entries Aik (across


row i of A) by the entries Bkj (down column j of B), for k = 1, 2,
..., m, and summing the results over k:
(AB)ij =

m
X

Aik Bkj

k=1

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Short review

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Short review
The inverse of a square matrix

Illustration:
The gure to the right illustrates diagrammatically the product of
two matrices A and B, showing how each intersection in the
product matrix corresponds to a row of A and a column of B.
42 matrix
43 matrix
a11 a12 " 23 matrix #
x12 x13


b12 b13

a31 a32 b22 b23


x32 x33

The values at the intersections marked with circles are:


x12 = a11 b12 + a12 b22

(1)

x13 = a11 b13 + a12 b23

(2)

x32 = a31 b12 + a32 b22

(3)

x33 = a31 b13 + a32 b23

(4)

The inverse of a square matrix A, sometimes called a reciprocal


matrix, is a matrix A1 such that
AA1 = I

(5)

where I is the identity matrix. Courant and Hilbert (1989, p. 10)


to denote the inverse matrix.
use the notation A
A square matrix A has an inverse i the determinant |A| 6= 0
(Lipschutz 1991, p. 45). The so-called invertible matrix theorem is
major result in linear algebra which associates the existence of a
matrix inverse with a number of other equivalent properties. A
matrix possessing an inverse is called nonsingular, or invertible.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Short review

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Short review
For example, consider the following matrix:

Finding the inverse of a matrix


A variant of Gaussian elimination called Gauss-Jordan elimination
can be used for nding the inverse of a matrix, if it exists. If A is a
n by n square matrix, then one can use row reduction to compute
its inverse matrix, if it exists. First, the n by n identity matrix is
augmented to the right of A, forming a n by 2n block matrix [A|I].
Now through application of elementary row operations, nd the
reduced echelon form of this n by 2n matrix. The matrix A is
invertible if and only if the left block can be reduced to the identity
matrix I; in this case the right block of the nal matrix is A1 . If
the algorithm is unable to reduce the left block to I, then A is not
invertible.

2 1
0

2 1
A = 1
0 1
2

To nd the inverse of this matrix, one takes the following matrix


augmented by the identity, and row reduces it as a 3 by 6 matrix:

2 1
0 1 0 0

2 1 0 1 0
[A|I] = 1
0 1
2 0 0 1

By performing row operations, one can check that the reduced row
echelon form of this augmented matrix is:

1 0 0

[I|B] = 0 1 0
0 0 1

3
4
1
2
1
4

1
2

1
4
1
2
3
4

1
1
2

Thus the product AB is dened only if the number of columns in A is equal to the number of rows in B.
Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin a MP

Regresin Simple

Short review

Short review

Inversa por el mtodo de la matrix de cofactores

Inversa por el mtodo de la matrix de cofactores

Sea la Matriz A:

1 2 3
a11 a12 a13

a22 a23 = 4 5 6
a31 a32 a33
7 8 9

A = a21

La matriz de cofactores es:



a
22
+ a

32


a

C = 12
a32



a12
+
a22


5

+ 8


2

C =
8



2
+
5



a
a
a23
21 a23
21 a22

+

a31 a33
a31 a32
a33


a13

a33


a

+ 11
a31


a13

a33


a

11
a31


a
a
a13
11
11 a13
+

a21
a21 a23
a23



a12


a32

a12

a22

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic


3

9


1

+
7


3

9


1


7

4 6
4 5
6





+





9
7 9
7 8

1 3
1
3




+
4 6
4
6


2

5

3
6
3

C = 6 12 6
3
6
3

Nota: La matrix adjunta es la transpuesta de la matrix de


cofactores.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin a MP

Short review

Short review

Cramers rule

Propiedades

Writing the transpose of the matrix of cofactors, known as an


adjugate matrix, can also be an ecient way to calculate the
inverse of small matrices, but this recursive method is inecient
for large matrices. To determine the inverse, we calculate a matrix
of cofactors:

A1

C11 C21 Cn1

C12 C22 Cn2

1
1 T
= C =
..
..
..
..

.
.
.
A
A .
C1n C2n Cnn

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Furthermore, the following properties hold for an invertible matrix


A:
(A1 )1 = A
(kA)1 = k 1 A1 for nonzero scalar k
(AT )1 = (A1 )T
For any invertible n-by-n matrices A and B, (AB)1 = B 1 A1 .
More generally, if A1 , ..., Ak are invertible n-by-n matrices, then
1
1 1
(A1 A2 ...Ak1 Ak )1 = A1
k Ak1 ...A2 A1
det(A1 ) = det(A)1 .

where |A| is the determinant of A, C is the matrix of cofactors, and


C T represents the matrix transpose.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Porqu es importante los mtodos predictivos?


La nalidad de los modelos predictivos es la obtencin de
pronsticos acerca de la evolucin futura de determinadas
variables.
Es importante en muchas empresas y entidades ya que las
predicciones de hechos futuros se pueden incorporar al proceso
de toma de decisiones.
La intuicin no necesariamente da los mejores resultados.
Mejora la planeacin y competitividad.

El anlisis de regresin es una tcnicca estadstica para


investigar y modelar la relacin entre variables.
Son muchas las aplicaciones y las hay en casi cualquier
campo: ingeniera, ciencias, fsicas y qumicas, economa,
administracin, biologa y en las ciencias sociales, de hecho,
puede ser que el anlisis de regresin sea la tcnica estadstica
ms usada (Montgomery et al., 2007).

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Pronsticos
Las predicciones de hechos y condiciones futuros se llaman
pronsticos.

Pronosticos
La informacin tranversal consta de valores observados en
un punto en el tiempo.
Notas del ltimo examen del semestre.
ndice de percepciones de corrupcin 2012, america latina.
Nmero de consultas realizadas a un Sistema Informacin
durante el ltimo mes.

Se analiza los datos para poder identicar un patrn que se


pueda utilizar para describirlo. Luego, este patrn se
extrapola, o se ampla, hacia el futuro con el objeto de
preparar un pronstico. Se apoya en el supuesto de que el
patrn que se identic sigue siendo el mismo en el futuro.

Una serie de tiempo es una sucesin cronolgica de


observaciones de una variable en particular.

No se puede esperar que una tcnica de prediccin d buenas


predicciones a menos que esta hiptesis sea vlida.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Poblacin de la ciudad de Puno con respecto al tiempo.


ndice de percepciones de corrupcin en Per, del 2000 al 2012.
Venta de licencias de un Software en los 10 ltimos aos.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Partes de una serie de tiempo:


Tendencia. Movimiento hacia arriba o abajo de las series de
tiempo con respecto a un periodo de tiempo. Reeja el
crecimiento o declinacin de larga duracin en las series de
tiempo.
Ciclo. Se reere a los movimientos hacia arriba y hacia abajo
alrededor de los niveles de la tendencia. Tiene una duracin de
dos a 10 aos.
Variaciones estacionales. Son patrones peridicos en una serie
de tiempo que se completa en un ao civil que se repite cada
ao. Ventas en diciembre como resultado de la fecha navidea.
Fluctuaciones irregulares. Movimientos errticos que siguen un
patrn indenido. Representan lo que resta despus que han
sido explicados la tendencia, el ciclo y las variaciones
estacionales. Causada por lo que no se puede predecir, a
saber, huelgas, etc.

Mtodos para establecer pronsticos:


Cualitativos: Opinin de expertos para establecer pronsticos
para predecir en forma subjetiva hechos futuros. Cuando no
hay datos histricos. Se utiliza tambin para predecir cambios
en los patrones de datos histricos.
Cuantitativos: Anlisis de datos histricos para pronosticar
valores futuros de una variable en la que se tenga inters.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin
Medicin de la magnitud de los errores

Medicin de los errores de pronstico


Desviacin absoluta:

et = yt yt

et = |yt yt |

yt valor real de la variable de inters en el periodo de tiempo t.


yt el valor predicho.

Desviacin absoluta media DAM:


t=1 |et |

et error de pronstico para un pronstico particular yt .


Con frecuencia un examen de los errores de pronstico en el
tiempo indica si la tcnica de prediccin va de acuerdo o no
con el patrn. Por ejemplo: si una tcnica de prediccin
predice exctamente la tendencia, la variacin estacional o el
componente cclico que estn presentes en una serie de
tiempo, los errores de pronstico reejarn slo el componente
irregular.

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

t=1 |yt

yt |

Error cuadrtico:
(et )2 = (yt yt )2
Error cudrtico medio (ECM):
Pn

2
t=1 (et )

n
Introduccin a MP

Pn

Pn

Introduccin a MP

Regresin Simple

Pn

t=1 (yt

yt )2

Regresin Mltiple

Introduccin
Medicin de la magnitud de los errores

Una manera de medir el error de pronstico que facilita la


comparacin de diferentes series de tiempo con valores de distintas
magnitudes es dividir las desviaciones absolutas entre el valor real
yt y luego multiplicarlo por 100.
Error absoluto de porcentaje EAP:
|yt yt |
|et |
(100) =
(100)
yt
yt
Error absoluto de porcentaje medio EAPM:
Pn

t=1 EAPt

100

Pn

t=1

|yt yt |
yt

Captulo 2:

REGRESIN LINEAL SIMPLE

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Regresin Simple

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Regresin Simple

Los modelos de regresin en los que se emplea una variable


dependiente y una variable independiente se denominan modelos
de regresin lineal (o de una recta) simple.
Modelo de regresin lineal simple
y = uy ;x + = 0 + 1 x +
uy ;x es el valor medio de la variable dependiente y cuando el
valor de la variable independiente es x . Recta de medias.

y
Variable dependiente
Variable respuesta
Variable respuesta
Ejm: Consumo de combustible por semana

x
Variable independiente
Variable predictora
Variable regresora (Montgomery)
Ejm: Temperatura promedio por hora
durante la semana

Cuadro: Denominaciones de las variables.

0 es la ordenada al origen. 0 es el valor medio de y


cuando x es igual a cero.
1 es la pendiente, es el cambio (incremento o decremento)
en el valor medio de y asociado con un incremento de una
unidad de x .
es un trmino de error que describe los efectos sobre y de
todos los otros factores que no son los valores de la variable
independiente x .
Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

La linea de mnimos cuadrados que mejor se ajusta

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

La linea de mnimos cuadrados que mejor se ajusta

Escoge 0 y 1 de tal manera que para un conjunto de datos, la


P
suma de residuos al cuadrado et2 sea lo mas pequeo posible.
X

et2 =

(yt yt )2 =

(yt 0 1 xt )2

Para que sea lo mmino, se deriva respecto a 0 y 1 :


2
El mtodo de mnimos cuadrados fue descrito primero por
Carl Friedrich Gauss alrededor 1794.
El da de Ao Nuevo de 1801, el astrnomo italiano Giuseppe
Piazzi descubri el planeta Ceres. Fue capaz de seguir su
rbita durante 40 das. Durante el curso de ese ao, muchos
cientcos intentaron estimar su trayectoria con base en las
observaciones de Piazzi. La mayora de evaluaciones fueron
intiles; el nico clculo sucientemente preciso, que permiti
al astrnomo Franz Xaver von Zach, reencontrar a Ceres al
nal del ao fue el mtodo Gauss.

(yt 0 1 xt ) = 0

xt (yt 0 1 xt ) = 0

(6)
(7)

Reordenando se obtiene las denominadas ecuaciones normales:


X
X

yt

xt yt

= 0 n + 1
= 0

(8)

xt

xt + 1

xt2

Resolviendo el sistema de ecuaciones para 0 y 1 se tiene:


P P
P

1 =

xi yi

xi2

xi

Pn

xi )2
n

yi

0 = y 1 x

(9)

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Estimaciones puntuales de mnimos cuadrados

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Estimaciones puntuales de mnimos cuadrados

Sea n la cantidad de observaciones, asimismo, y =

yi

yx=

xi

La estimacin puntual de los mnimos cuadrados de la


pendiente:
P P

(xi x )(yi y )
P
=
(xi x )2

1 =

Introduccin a MP

xi yi

xi2

xi
yi
n
P
( xi )2
n

SSxy
SSxx

La estimacin puntual de los mnimos cuadrados de la


ordenada al origen 0 es:

Suposiciones para el modelo de regresin


La media de la poblacin de los valores potenciales del
trmino de error es igual a cero.
Suposicin de la varianza constante (homoscedasticidad)
: La varianza de la poblacin de los valores potenciales del
trmino de error no depende del valor de x. La varianza
constante se denota como 2 .
Suposicin de normalidad: La poblacin de los valores
potenciales del trmino de error tiene una distribucin normal.
Suposicin de independencia: Un valor cualquiera del
trmino de error es estadsticamente independiente de
cualquier otro valor de .

0 = y 1 x
Con objeto de simplicar la notacin, con frecuencia se omiten los
P
P
en lugar de ni=1
lmites de la sumatoria. Es decir usamos
Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Coeciente de determinacin y correlacin simple

Variacin inexplicada: Suma de los errores de prediccin al


cuadrado que se obtiene cuando usamos la variable predictora
x (otro nombre para SSE).
P
SSE = ni=1 (yi yi )2
Variacin explicada:
Pn
2
i=1 (yi y )

i=1

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Coeciente de determinacin simple r 2


El coeciente de determinacin simple: Es una medida de
utilidad del modelo de regresin lineal simple.
r2 =

Tambin se puede calcular utilizando la frmula:


r =

n
X
i=1

(yi yi )2 +

n
X
i=1

(yi y )2

variacion explicada
variacion total

r 2 es la proporcin de la variacin total en los n valores


observados de la variable dependiente que explica el modelo
de regresin lineal simple.

Se puede demostrar que:


(yi y )2 =

Regresin Simple

Coeciente de determinacin y correlacin simple

Variacin total: Suma de los errores de prediccin al


cuadrado que se obtiene cuando no empleamos la variable
predictora x . Mide la cantidad total de variacin que muestran
los valores observados de y .
P
2
Pn
Pn
( ni=1 yi )
2
2
SSyy = i=1 (yi y ) = i=1 yi
n

n
X

Introduccin a MP

Pn
(xi x )2
Pn i=1
2

12

i=1 (yi

y)

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Coeciente de determinacin y correlacin simple

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Coeciente de determinacin y correlacin simple

Coeciente de correlacin simple r


Coeciente de correlacin simple: Medida de relacin entre
dos variables y y x , varia entre -1 y 1. Un valor cercano a cero
quiere decir que hay una pequea relacin lineal entre y y x .
Un valor de r cercano a 1 signica que y y x tienen una fuerte
tendencia a desplazarse juntas en una forma lineal con una
pendiente positiva (correlacin positiva, no signica que exista
una relacin causa efecto).

r = + r 2 si la pendiente es positiva

r = r 2 si la pendiente es negativa

Para efectuar las pruebas de hiptesis cuando se aplica el modelo


de regresin lineal, es necesario calcular las estimaciones puntuales
2 y (la varianza constante y la desviacin estndar de las
diferentes poblaciones de trminos de error)
Error cuadrtico medio y error estndar
Una estimacin puntual de 2 es el error cuadrtico medio:
s2 =

SSE
n2

Una estimacin puntual de es el error estndar:


s

Coeciente de correlacin simple tambin se puede calcular


usando la frmula que da automticamente el signo (+ o -):

s=

SSE
n2

SSxy
r=p
SSxx SSyy
Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Intrvalo de prediccin para un valor individual de y

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Intrvalo de prediccin para un valor individual de y

El valor de la distancia para la regresin lineal simple


Para un valor particular x0 de x es:
Valor de distancia =

Introduccin a MP

1 (x0 x )2
+
n
SSxx

Intrvalo de prediccin para un valor individual de y


Si se sustentan las suposiciones de regresin, un intrvalo de
prediccin 100(1 ) % para un valor individual de y cuando
la variable independiente es x0 es:
(n2)
[
y t[/2] s 1 + valor de distancia]

Intrvalo de conanza
Esta dado por:

(n2)
[
y t[/2] s valor de distancia]

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Intrvalo de prediccin para un valor individual de y

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Intrvalo de prediccin para un valor individual de y

Sean: Muestra n = 6
Variacin inexplicada:
SSE = 13.276
q
SSE
Entonces: s = n2 = 1.8218 (error estndar)
Tambin x0 = 8 que da: y = 23,1238
2
0 x )
= 1.3238
Valor de Distancia = n1 + (xSS
xx
El intervalo de conanza de 95 % da un /2 = 2,5 % = 0,025
En la tabla de distribucin T (one-tailed test) se tiene:
(n2)
(62)
t[/2] = t[0,25] = 2,776

p
(4)
[
y t[0,25] s 1 + valor d.] = [23,1238 2,776(1,8218) 1 + 1,3238]
= [10,3; 35,9]

Este intervalo signica que tenemos 95 % de conanza de que y


dado x0 = 8 este entre 10.3 y 35.9.

Consumo de combustible por semana


Consumo de combustible por semana
7
8
9
10 11 12 13 14

Regresin Simple

Introduccin a MP

25

30

35
40
45
50
55
Temperatura promedio por hora durante la semana

60

65

Intrvalo de prediccin para un valor individual al 95%

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Prueba F global

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Prueba F global

Prueba F para el modelo de regresin lineal simple


Una manera de evaluar la utilidad del modelo de regresin es
probar la signicancia de la relacin de regresin entre y y x .
Probamos la hiptesis nula:
H0 : 1 = 0
Es decir, que la relacin de regresin entre y y x no es
signicante. Contra:
Ha : 1 6= 0
Lo cual quiere decir que la relacin entre y y x es signicante.
Si se puede rechazar H0 al nivel de signicancia , entonces
se dice que el modelo de regresin lineal simple es signicante
en el nivel de signicancia .

Prueba F para el modelo de regresin lineal simple


Denamos la estadstica F global como
F (modelo) =

Variacion explicada
(Variacion inexplicada)/(n 2)

Tambin denimos el valor p relacionado con F(modelo) como


el rea bajo la curva de distribucin F(con 1 y n 2 grados de
libertad) a la derecha de F(modelo). Se puede aceptar Ha : en
el nivel de signicancia si se mantiene algunas de las
condiciones siguientes:
F(modelo) > F[]
valor p <

Donde el punto F[] se basa en 1 grados de libertad para el


numerador y n 2 para el denominador.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Prueba F global

Introduccin a MP

Regresin Simple

Regresin Mltiple

Prueba T

Por otro lado, tambin se puede utilizar el valor de p (pvalue).


El valor de p correspondiente al estadstico de prueba Fmodelo ,
basado en la distribucin F con un grado de libertad en el
numerador y n 2 grados de libertad en el denominador es:

Prueba T
La prueba t se utiliza para efectuar la prueba de hiptesis
sobre los coecientes de la regresin lineal simple. Se utiliza un
estadstico basado en la distribucin t para probar la hiptesis
de dos colas que la pendiente, es igual a alguna constante b.

pvalue = 1 P(F Fmodelo )

H0 : 1 = b
H1 : 1 6= b

Asuminedo que el nivel de signicancia es 0.05, y si pvalue <


0.05. Se rechaza la H0 . Lo cual implica que existe una relacin
entre X e Y .

Es estadstico de prueba es:

En hoja de calculo: =DISTR.F.CD( Fmodelo , 1 , n-2) donde la


funcin devuelve la distribucin (de cola derecha) de
probabilidad F (grado de diversidad) para dos conjuntos de
datos.

Donde:

t =

de(1 )

O bien: 1-Distr.f.n( Fmodelo ,1,n-2,VERDADERO), donde la funcin


devuelve la distribucin (de cola izquierda) de probabilidad F .
Introduccin a MP

Regresin Cuadrtica Interaccin y V. Fictic

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Prueba T

1 b
de(1 )

v P
u
(y
y )2
u
s
t
P n2 2 =
=

(x x)

SSxx

Sigue una distribucin t con n 2 grados de libertad, donde n


es el nmero total de observaciones.
Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Prueba T

Prueba T
Condicin del punto de rechazo H0 si
(n2)

Prueba T
Proceso similar para la prueba de hiptesis del coeciente de
intercepcin (ordenada al origen). El estadstico de prueba es:

|t| > t[/2]

t =

(n2)

Donde t[/2] es el valor crtico para la hiptesis de dos colas.


Es el percentil de la distribucin t correspondiente a la
probabilidad acumulada de (1 /2) y es el nivel de
signicancia.
Si el valor de b es cero, entonces la hiptesis prueba para la
signicancia de la regresin. Es decir, la prueba indica si el
modelo de regresin ajustado es til para explicar las
variaciones en las observaciones o si se est tratando de
imponer un modelo de regresin cuando no existe una relacin
entre X e Y . La falla en el rechazo de la H0 implica que no
hay relacin lineal entre X e Y .

0 b
de(0 )

Donde:
de(0 )

v
"
uP
u (y y )2 1
x2
t
+P
=

n2

(x x)2

=s

1
x2
+
n SSxx

El valor de p (pvalue) se puede obtener como sigue:


pvalue = 2(1 P(T t))
En hoja de calculo: =DISTR.T.2C( abs(t) , n-2 ) donde la
funcin devuelve la distribucin t de Student de dos colas.
bien: 2*(1-Distr.t.n(abs(t),n-2,VERDADERO), donde la funcin
devuelve la distribucin t de Student de cola izquierda.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Captulo 3:

REGRESIN LINEAL MLTIPLE

Los modelos de regresin en los que se emplean ms de una


variable independiente (regresora) se denominan modelos de
regresin mltiple. Para expresar una variable dependiente en
funcin de cualquier cantidad de variables independientes.
Modelo de regresin mltiple
y = uy ;x1,x2 , ,xk + = 0 + 1 x1 + 2 x2 + + k xk + .
uy ;x1,x2 , ,xk es el valor medio de la variable dependiente y
cuando los valores de la variables independientes son
x1 , x2 , , xk .

0 , 1 , 2 , , k son parmetros de regresin (desconocidos)


que relacionan el valor medio de y con x1 , x2 , , xk .

es un trmino de error que describe los efectos sobre y de


todos los otros factores que no son los valores de las variables
independientes x1 , x2 , , xk .
Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Introduccin a MP
Introduccin

Modelo de regresin mltiple


Este modelo describe a un hiperplano en el espacio de k
dimensiones de las variables xj .
El parmetro j representa el cambio esperado en la respuesta
y por cambio unitario en xj cuando todas las dems variables
regresoras xi (i 6= j) se mantienen constante. Por esta razn,
los parmetros j , j = 1, 2, ..., k se les llama con frecuencia
coecientes de regresin parcial.
La siguiente gura muestra la grca tridimensional de un
modelo de regresin de dos variables independientes.
y = 0 + 1 x1 + 2 x2 +

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

n <- 45; x <- runif(n,0,10); y <- runif(n,0,10);


z <- 0.2*x + 0.4*y + rnorm(n,mean=2,sd=0.5)
Modelo <- lm(z ~ x + y)
summary(Modelo)
coefs <- coef(Modelo)
a <- coefs["x"]; b <- coefs["y"]; c <- -1;
d <- coefs["(Intercept)"]
X1 <- seq(0, 10, length.out = 8);
X2 <- X1
r <- function(x,y) { a*x+b*y+d }
Z2 <- outer(X1, X2, r); Z2;
plot3d(x,y,z,type="s",col="blue",size=0.7,box=FALSE,
xlab="X1",ylab="X2",zlab="Y")
planes3d(a, b, c, d, alpha=0.3)

Introduccin a MP

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

p<-persp(X1,X2,Z2,theta=120,phi=8,zlim=c(0,10),
xlim=c(0,10),r=4,d=0.1,xlab="X1",ylab="X2",
border="blue",col="lightblue")
points(trans3d(x,y,z,p),col="red",type="p",pch=20)

Call: lm(formula = z ~ x + y)
Residuals:
Min
1Q
Median
3Q
-0.78078 -0.39042 0.01556 0.35693

Max
0.83648

Coefficients:
Estimate Std. Error t value
(Intercept) 2.26731
0.18502 12.254
x
0.18312
0.02569
7.127
y
0.37395
0.02627 14.232
--Signif. codes: 0 *** 0.001 ** 0.01

Pr(>|t|)
1.86e-15 ***
9.57e-09 ***
< 2e-16 ***
* 0.05 . 0.1

Residual standard error: 0.4734 on 42 degrees of freedom


Multiple R-squared: 0.8678,Adjusted R-squared: 0.8615
F-statistic: 137.9 on 2 and 42 DF, p-value: < 2.2e-16
Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Interpretacin de los parmetros de regresin:


y = 0 + 1 x1 + 2 x2 +
Consumo de combustible = f(temperatura horaria promedio ,
ndice de enfriamiento)
Los parmetros relacionan la media de la variable dependiente
con las variables independientes en un sentido global.
0 : ordenada al origen.
1 : cambio en el consumo medio de combustible a la semana
que se asocia con el incremento de un grado en la temperatura
promedio cuando no cambia el ndice de enfriamiento.
2 : cambio en el consumo medio de combustible a la semana
que se asocia con el incremento de una unidad en el ndice de
enfriamiento cuando no cambia la temperatura horaria
promedio.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Enfoque matricial

Hay k variables regresoras y n observaciones y el modelo que


relaciona las variables regresoras con la variable de repuesta es:
yi = 0 + 1 xi1 + 2 xi2 + + k xik + i , para i = 1, 2, , n
Este es un modelo de n ecuaciones que en notacin matricial
puede expresarse como: Y = X + donde:

Suposiciones para el modelo de regresin mltiple


En cualquier combinacin dada de valores de x1 , x2 , , xk

La media de la poblacin de los valores potenciales del


trmino de error es igual a cero.

Suposicin de la varianza constante: La varianza de la


poblacin de los valores potenciales del trmino de error no
depende de la combinacin de valores de x1 , x2 , , xk . La
varianza constante se denota como 2 .

Y =

Suposicin de normalidad: La poblacin de los valores


potenciales del trmino de error tiene una distribucin normal.

y1
y2
..
.

X =

yn

0

1

=
2
..
.

Suposicin de independencia: Un valor cualquiera del


trmino de error es estadsticamente independiente de
cualquier otro valor de .

1 x11 x12 . . . x1k


1 x21 x22 . . . x2k
..
..
.. . .
..
.
.
.
.
.
1 xn1 xn2 . . . xnk

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Enfoque matricial

Introduccin a MP

Regresin Simple

1
2
..
.

Introduccin a MP

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Enfoque matricial

Supongamos que se dispone de n > k observaciones. Se supone


que el trmino de error del modelo tiene E () = 0, Var () = 2 y
que los errores no estn correlacionados. Se desea determinar los
estimadores de mnimos cuadrados ordinarios que minimice:

Las estimaciones puntuales de mnimos cuadrados:



0

1

(X X ) X Y =
2
..
.

Y es el vector columna de los n valores observados de la


variable dependiente y1 , y2 , . . . , yn

Y =

y1
y2
..
.
yn

X =

1 x11 x12 . . . x1k


1 x21 x22 . . . x2k
..
..
.. . .
..
.
.
.
.
.
1 xn1 xn2 . . . xnk

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Enfoque matricial

Introduccin a MP

Regresin Simple

Regresin Mltiple

Enfoque matricial

Para efectuar las pruebas de hiptesis cuando se aplica el modelo


de regresin lineal, es necesario calcular las estimaciones puntuales
2 y (la varianza constante y la desviacin estndar de las
diferentes poblaciones de trminos de error)

Variacin inexplicada y explicada


Variacin total:
SSyy =

n
X
i=1

(yi y ) =

n
X

2
i=1 yi )

Pn

yi2

i=1

Error cuadrtico medio y error estndar


Una estimacin puntual de 2 es el error cuadrtico medio:

Variacin inexplicada:
SSE =

n
X
i=1

(yi yi ) =

n
X

yi2

i=1

s2 =

X Y

SSE
n (k + 1)

Una estimacin puntual de es el error estndar:

Variacin explicada:

s
n
X
i=1

Introduccin a MP

Regresin Cuadrtica Interaccin y V. Fictic

(
(yi y ) = X Y
2

Regresin Simple

Coeciente de determinacin mltiple R

2
i=1 yi )

Pn

Regresin Mltiple

S=

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin a MP

Regresin Simple

SSE
n (k + 1)

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Prueba F global

Variacin total: SSyy =

Pn

2
i=1 (yi y ) =

Pn

Variacin inexplicada:
P
P
SSE = ni=1 (yi yi )2 = ni=1 yi2 X Y
Pn

i=1 (yi

Variacin explicada:

y )2

2
i=1 yi

(
= X Y

Pn

Pn

y
i =1 i

y
i =1 i

Coeciente de determinacin mltiple:

Coeciente de determinacin mltiple ajustado (R 2 ajustado):


k
R2 = R
n1
2



n1
n (k + 1)

H0 : 1 = 2 = = k = 0
La cual establece que ninguna de las variables independientes
est relacionado signicativamente con y (la relacin de
regresin no es signicante).

variacion explicada
R =
variacion total

Coeciente de correlacin mltiple: R = R 2


2

Una prueba F para el modelo de regresin lineal


Una manera de evaluar la utilidad del modelo de regresin es
probar la signicancia de la relacin de regresin entre y y
x1 , x2 , , xk (k+1 parmetros). Probamos la hiptesis nula:

Ha : por lo menos uno de 1 , 2 , , k no es igual a cero.


Lo cual quiere decir que por lo menos una de las variables
independientes est signicativamente relacionado con y .

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Prueba F global

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Prueba T

Una prueba F para el modelo de regresin lineal


Denamos la estadstica F global como
F (modelo) =

(Variacion explicada)/k
(Variacion inexplicada)/[n (k + 1)]

Prueba de la signicancia de la variable independiente xj


Cules variables independientes afectan signicativamente a
y ? (individualmente). Para probar la signicancia de xj
probamos la hiptesis nula contra la hiptesis alternativa:
H0 : j = 0

Tambin denimos el valor p relacionado con F(modelo) como


el rea bajo la curva de distribucin F que tiene k y
[n (k + 1)] grados de libertad a la derecha de F(modelo). Se
puede aceptar Ha : en el nivel de signicancia si se mantiene
algunas de las condiciones siguientes:

Ha : j 6= 0
La estadstica de prueba.
t=

F(modelo) > F[]


valor p <

S cjj

, cjj de la matriz (X X )1

Condicin del punto de rechazo H0 si

Donde el punto F[] se basa en k grados de libertad para el


numerador y n (k + 1) para el denominador.

(n(k+1))

|t| > t[/2]


n (k + 1) grados de libertad.

Introduccin a MP

Regresin Simple

Introduccin

Seccin 3.2:

Regresin Cuadrtica

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Una forma til del modelo de regresin lineal es la que se


denomina modelo de regresin cudrtica.
Modelo de regresin cuadrtica
y = 0 + 1 x + 2 x 2 + .
Donde 0 + 1 x + 2 x 2 es uy ;x es el valor medio de la variable
dependiente y cuando es valor de la variable independiente es
x.
0 , 1 , 2 son parmetros de regresin (desconocidos) que
relacionan el valor medio de y con x.
es un trmino de error que describe los efectos sobre y de
todos los otros factores que no son x y x 2 .

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Ejemplo

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Ejemplo

Ejemplo
Una compaia desea mejorar la cantidad de kilmetros
recorridos por galn de gasolina en los automviles que usan
su gasolina. Los qumicos de la compaa recomiendan un
aditivo (Cripton19) se mezcle con la gasolna.

X = Nmero de unidades de aditivo


0
0
0
1
1
1
2
2
2
3
3
3
4
4
4

Determinar la cantidad de unidades de aditivo que se debe


mezclar con la gasolina para maximizar las millas recorridas. A
la compaa le gustara predecir la cantidad mxima de millas
recorridas por galn que se puede alcanzar utilizando el
aditivo.

Y = Cantidad de millas recorridas


25.8
26.1
25.4
29.6
29.2
29.8
32.0
31.4
31.7
31.7
31.5
31.2
29.4
29.0
29.5

Cuadro: Millas recorridas segn unidades de aditivo.


Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Ejemplo

Introduccin a MP

Regresin Simple

Ejemplo

scatter y x, title("Millas Recorridas segn aditivo")


subtitle("Mtodos Predictivos 2011") caption("Fuente: Elaboracin
propia") scheme(sj)
Millas Recorridas segn aditivo

24

26

Millas recorridas
28
30

32

Mtodos Predictivos 2011

Fuente: Elaboracin propia

2
Aditivo

generate xx = x*x
regres y x xx

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Ejemplo

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Ejemplo

Cantidad de aditivo que maximiza los kilmetros recorridos


Ecuacin de prediccin de mnimos cuadrados ordinarios:

GRAFICA DE LA ECUACION DE PREDICCION


32
Kilometros por galon

y = 25,71524 + 4,976191x 1,019048x 2


Cantidad de unidades de aditivo que maximiza los kilmetros
recorridos:
Usamos clculo diferencial (y el software Maxima):
di(25.71524 + 4.976191*x - 1.019048*x*x , x , 1);
4.976191 - 2.038096*x
solve( %,x),oat;

30
28
26
24

x = 2.44 unidades de aditivo.

22

La cantidad predicha de kilometros recorridos por galn:

Unidades de aditivo

ev(25.71524 + 4.976191*x - 1.019048*x*x , x=2.44 );


31.7901 kilmetros por galn.
Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Interaccin

Seccin 3.3:

Interaccin y Variables Ficticias

Iteraccin
Con frecuencia los modelos de regresin mltiple contienen
variables de interaccin, que se forma al multiplicar las
variables independientes.
Es conveniente recurrir a la variable de interaccin si la
relacin entre el valor medio de la variable dependiente y y
una de las varibles independientes depende del valor de otra
variable independiente.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Variable cticia

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Variables cticias para modelar variables independientes


cualitativas
Se puede modelar los efectos de los distintos niveles de una
variable independiente cualitativa usando las variables
cticias (denominados tambin variables indicadoras).

Seccin 4

Regresin de series temporales

Por ejemplo para modelar efectos de la ubicacin en centros


comerciales y sobre las calles:
(

DM =

Introduccin a MP

1 si la tienda esta en un centro comercial


0 en otro lado

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Introduccin

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Modelado de la tendencia mediante funciones polinomiales

Modelos de regresin de series temporales


En la mayora de las ramas de la ciencia, ingeniera y
comercio, hay variables medidas secuencialmente en el
tiempo. Estos datos forman una serie de tiempo.
Estos modelos relacionan la variable dependiente yt con
funciones del tiempo.
El uso de estos modelos representan grandes ventajas cuando
los parmetros que describen las series temporales que se
desea pronosticar son constantes en el tiempo.

El modelado de la tendencia es
yt = TRt + t
yt = el valor de la serie temporal en el periodo t.
TRt = la tendencia en el periodo t.
es el trmino de error en el periodo t..
Tendencias tiles
Sin tendencia, que se modela como TRt = 0 , quiere decir
que no hay crecimiento o declinacin durante un largo periodo
en las series temporales.
Tendencia lineal, que se modela como TRt = 0 + 1 t,
signica que hay crecimiento lineal durante un largo periodo
en el tiempo.
Tendencia cuadrtica, que se modela como
TRt = 0 + 1 t + 2 t 2 , signica que hay crecimiento
cuadrtico durante un largo periodo en el tiempo.

Introduccin a MP

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Modelado de la tendencia mediante funciones polinomiales

En series temporales es comn la correlacin serial, esto es,


resultados del periodo de tiempo actual estn correlacionados
con resultados de periodos anteriores. De este modo se
transgrede el supuesto de que los errores son independientes,
un supuesto importante y necesario para la validez de los
mtodos de regresin basados en los mnimos cuadrados
ordinarios.

Regresin Simple

Fin

Gracias por su atencin.

Regresin Simple

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Modelado de la tendencia mediante funciones polinomiales

Deteccin de autocorrelacin
A.

Introduccin a MP

Introduccin a MP

Regresin Mltiple

Regresin Cuadrtica Interaccin y V. Fictic

Deteccin de autocorrelacin
Una prctica (estadstica) comn es ver los valores de la
correlacin entre y y valores rezagados de y para diferentes
periodos. Tales valores se denominan autocorrelaciones. La
autocorrelacin de rezago l es la correlacin entre y y valores
de y rezagados por l periodos (entre yt y ytl ):
Pn

Autocorrelacion(l) =

t=l+1 (yt y )(yt1


Pn
2
t=1 (yt y)

y)

Anda mungkin juga menyukai