Anda di halaman 1dari 19

NDICE

DEDICATORIA
INTRODUCCIN
CAPTULO I
REGRESIN LNEAL
1.1 CONCEPTO......................................................................................................... 4
1.2 HISTORIA ............................................................................................................ 5
1.3 MODELO DE REGRESIN LNEAL ............................................................... 5
1.4 HIPTESIS DEL MODELO DE REGRESIN LNEAL CLSICO ............. 6
CAPTULO II
TIPOS DE REGRESIN LNEAL
2.1 REGRESIN LNEAL SIMPLE ............................................................................. 8
2.1.1 SUPOSICIONES DE LA REGRESIN LNEAL ......................................... 9
2.1.2 ESTIMACIN DE LA ECUACIN DE REGRESIN MUESTRAL .......... 9
2.1.3 ANTECEDENTES DEL PROBLEMA .......................................................... 10
2.1.4 DESARROLLO .............................................................................................. 10
2.1.5 HIPTESIS ..................................................................................................... 11
2.1.6 INTERPRETACIN ...................................................................................... 12
2.2 REGRESIN LNEAL MULTIPLE ...................................................................... 13
2.2.1 CONCEPTO .................................................................................................... 13
2.2.2 FRMULA ....................................................................................................... 14
CAPTULO III
RECTAS DE REGRESIN
3.1 CONCEPTO ........................................................................................................... 15
3.2 CORRELACION .................................................................................................... 15
CAPTULO IV
APLICACIN DE LA REGRESIN LNEAL
4.1 LNEAS DE TENDENCIA..................................................................................... 16
4.2 MEDICINA .............................................................................................................. 16
BIBLIOGRAFIA............................................................................................................. 17
ANEXOS........................................................................................................................ 18
DEDICATORIA

Este trabajo lo dedico a mis padres


por apoyarme para afrontar mis retos
y seguir adelante con mis metas,
tener valor para afrontar los
problemas, ya que ellos me
mostraran que ese ser el mejor
camino para ser mejor persona.
INTRODUCCION

La regresin lineal es una tcnica estadstica utilizada para estudiar las


relaciones entre variables. Se adapta a una amplia variedad de situaciones. En
la investigacin social, el anlisis de regresin se utiliza para predecir un amplio
rango de fenmenos, desde medidas econmica hasta diferentes aspectos del
comportamiento humano. En el contexto de la investigacin de mercados, puede
utilizarse para determinar en cual de diferentes medios de comunicaciones
puede resultar ms eficaz intervenir; o predecir el nmero de ventas de u
determinado producto. En fsica se utiliza para caracterizar la relacin entre
variables o para calibrar medidas, Etc.

Tanto en el caso de dos variables (regresin simple) como en el mas de dos


variables (regresin mltiple), el anlisis de regresin lineal puede utilizarse para
explorar y cuantificar la relacin entre una variable llamada dependiente o criterio
(Y) y una o ms variables llamadas independientes o predictorias ((1, 2, , ),
as como para desarrollar una ecuacin lineal con fines predictivos. Adems, el
anlisis de regresin lineal lleva asociados una serie de procedimientos de
diagnstico (anlisis de los residuos, puntos de influencia) que informan sobre la
estabilidad e idoneidad del anlisis y que proporcionan pistas sobre como
perfeccionarlo.

Mi objetivo es el proporcionar los fundamentos de la regresin lineal e intentar


fomentar la comprensin de cuando y como utilizar la regresin lineal, y como
interpretar los resultados.
CAPITULO I

REGRESION LINEAL

1.1 CONCEPTO

En estadstica la regresin lineal o ajuste lineal es un modelo matemtico


usado para aproximar lar relacin de dependencia entre una variable
dependiente y las variables independientes y un trmino aleatorio . Este
modelo puede ser expresado como:

= 0 + 1 2 + 2 2 + + +

Donde:

: Variable dependiente, explicada o


regresando

1, 2, Variables explicativas
independientes o regresores.

0, 1, 2, , : Parmetros, miden la
influencia que las variables . .
Explicativas tienen sobre el regresando.

Donde 0 es la interseccin o trmino constante, las ( > 0) son los


parmetros respectivos a cada variable independiente, y es el nmero de
parmetro independientes a tener en cuenta en la regresin. La regresin
lineal puede ser contrastada con la regresin no lineal.
1.2 HISTORIA
La primera forma de regresin lineal documentada fue el mtodo de los
mnimos cuadrados que fue publicada por Legendre en 1805, Gauss public
un trabajo en donde desarrollaba de manera ms profunda el mtodo de los
mnimos cuadrados,1 y en dnde se inclua una versin del teorema de
Gauss-Mrkov.
El trmino regresin se utiliz por primera vez en el estudio de variables
antropomtricas: al comparar la estatura de padres e hijos, donde result que
los hijos cuyos padres tenan una estatura muy superior al valor medio,
tendan a igualarse a ste, mientras que aquellos cuyos padres eran muy
bajos tendan a reducir su diferencia respecto a la estatura media; es decir,
"regresaban" al promedio.2 La constatacin emprica de esta propiedad se
vio reforzada ms tarde con la justificacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de tcnicas de
regresin, que emplean modelos basados en cualquier clase de funcin
matemtica. Los modelos lineales son una explicacin simplificada de la
realidad, mucho ms giles y con un soporte terico mucho ms extenso por
parte de la matemtica y la estadstica.
Pero bien, como se ha dicho, se puede usar el trmino lineal para distinguir
modelos basados en cualquier clase de aplicacin.

1.3 MODELO DE REGRESION LINEAL


El modelo lineal relaciona la variable dependiente Y con K variables
explcitas ( = 1, ), o cualquier transformacin de estas que generan
un hiperplano de parmetro desconocidos.

= +

Donde es la perturbacin aleatoria que recoge todos aquellos factores de


la realidad no controlables u observables y que por tanto se asocian con el
azar, y es la que confiere al modelo su carcter estocstico. En el caso ms
sencillo, con una sola variable explcita, el hiperplano es una recta:
= 1 + 2 +

El problema de la regresin consiste en elegir unos valores determinados


para los parmetros desconocidos de modo que la ecuacin quede
completamente especificada. Para ello se necesita un conjunto de
observaciones. En una observacin i-sima (i= 1,... I) cualquiera, se registra
el comportamiento simultneo de la variable dependiente y las variables
explcitas (las perturbaciones aleatorias se suponen no observables).

Los valores escogidos como estimadores de los parmetros , son los


coeficientes de regresin sin que se pueda garantizar que coincida n con
parmetros reales del proceso generador. Por tanto, en

Los valores son por su parte estimaciones o errores de la perturbacin


aleatoria.

1.4 HIPTESIS DEL MODELO DE REGRESIN LINEAL CLSICO

Esperanza matemtica nula: ( )=0. Para cada valor de X la


perturbacin tomar distintos valores de forma aleatoria, pero no tomar
Sistemticamente valores positivos o negativos, sino que se supone
tomar algunos valores mayores que cero y otros menores que cero, de
tal forma que su valor esperado sea cero.
Homocedasticidad: Var( ) = ( ) = 2 = 2 para todo t.
Todos los trminos de la perturbacin tienen la misma varianza que es

desconocida. La dispersin de cada en torno a su valor esperado


es siempre la misma.
Incorrelacin o independencia: Cov.( , ) = ( = , para
todo t,s con t distinto de s. Las covarianzas entre las distintas
perturbaciones son nulas, lo que quiere decir que no estn
correlacionadas. Esto implica que el valor de la perturbacin para
cualquier observacin muestral no viene influenciado por los valores de
las perturbaciones correspondientes a otras observaciones mustrales.
Regresores estocsticos.
Independencia lineal. No existen relaciones lineales exactas entre los
regresores.
T>K+1. Suponemos que no existen errores de especificacin en el
modelo, ni errores de medida en las variables explicativas.
Normalidad de las perturbaciones: ~(0, 2
CAPITULO II

TIPOS DE REGRESION LINEAL

2.1 REGRESION LINEAL SIMPLE

La Regresin y la correlacin son dos tcnicas estadsticas que se pueden


utilizar para solucionar problemas comunes en los negocios.
Muchos estudios se basan en la creencia de que es posible identificar y
cuantificar alguna Relacin Funcional entre dos o ms variables, donde una
variable depende de la otra variable.
Se puede decir que Y depende de X, en donde Y y X son dos variables
cualquiera en un modelo de Regresin Simple.
"Y es una funcin de X"
Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
X es la variable independiente.
En el Modelo de Regresin es muy importante identificar cul es la variable
dependiente y cul es la variable independiente.
En el Modelo de Regresin Simple se establece que Y es una funcin de
slo una variable independiente, razn por la cual se le denomina tambin
Regresin Divariada porque slo hay dos variables, una dependiente y otra
independiente y se representa as:
Y = f (X)
"Y est regresando por X"
La variable dependiente es la variable que se desea explicar, predecir.
Tambin se le llama regresando o variable de respuesta.
La variable Independiente X se le denomina variable explicativa o regresor
y se le utiliza para explicar Y.
2.1.1 SUPOSICIONES DE LA REGRESIN LINEAL

Los valores de la variable independiente X son fijos, medidos sin error.


La variable Y es aleatoria
Para cada valor de X, existe una distribucin normal de valores de Y
(subpoblaciones Y)
Las variancias de las subpoblaciones Y son todas iguales.
Todas las medias de las subpoblaciones de Y estn sobre la recta.
Los valores de Y estn normalmente distribuidos y son estadsticamente
independientes.

2.1.2 ESTIMACIN DE LA ECUACIN DE REGRESIN MUESTRAL

Consiste en determinar los valores de "a" y "b " a partir de la muestra, es


decir, encontrar los valores de a y b con los datos observados de la
muestra. El mtodo de estimacin es el de Mnimos Cuadrados, mediante
el cual se obtiene:

Que se interpreta como:


a es el estimador de a
Es el valor estimado de la variable Y cuando la variable X = 0
b es el estimador de b , es el coeficiente de regresin
Est expresado en las mismas unidades de Y por cada unidad de X.
Indica el nmero de unidades en que vara Y cuando se produce
un cambio, en una unidad, en X (pendiente de la recta de regresin).
Un valor negativo de b sera interpretado como la magnitud del decremento
en Y por cada unidad de aumento en X.

2.1.3 ANTECEDENTES DEL PROBLEMA


Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos
(Y, kg) de una muestra de 12 hombres adultos. Para cada estatura fijada
previamente se observ el peso de una persona seleccionada de entre
el grupo con dicha estatura, resultando:
X 152 155 152 155 157 152 157 165 162 178 183 178

Y 50 61.5 54.5 57.5 63.5 59 61 72 66 72 84 82


Con estos datos vamos a plantear una ecuacin de regresin simple que nos
permita pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, y
contrastaremos nuestra hiptesis con la prueba F.

2.1.4 DESARROLLO

Representacin matemtica y grfica de los datos:

Representacin Matemtica

I.C. para la I. C.
estatura pesos Regresin Lineal media individual

datos x y x ^2 y ^2 xy y est. Residual L. I. L. S. L. I. L. S.

1 152 50 23104 2500 7600 56.43 -6.43 53.07 59.79 47.30 65.56

2 155 61.5 24025 3782.3 9532.5 59.03 2.47 56.09 61.97 50.05 68.02

3 152 54.5 23104 2970.3 8284 56.43 -1.93 53.07 59.79 47.30 65.56

4 155 57.5 24025 3306.3 8912.5 59.03 -1.53 56.09 61.97 50.05 68.02

5 157 63.5 24649 4032.3 9969.5 60.77 2.73 58.05 63.48 51.85 69.68
6 152 59 23104 3481 8968 56.43 2.57 53.07 59.79 47.30 65.56

7 157 61 24649 3721 9577 60.77 0.23 58.05 63.48 51.85 69.68

8 165 72 27225 5184 11880 67.71 4.29 65.17 70.24 58.85 76.57

9 162 66 26244 4356 10692 65.11 0.89 62.65 67.56 56.27 73.94

10 178 72 31684 5184 12816 78.99 -6.99 74.65 83.33 69.45 88.52

11 183 84 33489 7056 15372 83.32 0.68 78.01 88.64 73.31 93.34

12 178 82 31684 6724 14596 78.99 3.01 74.65 83.33 69.45 88.52

Representacin Grfica

2.1.5 HIPTESIS

1.5 HO: No hay relacin entre la variable peso y la variable estatura.


HA: Hay relacin entre la variable peso y la variable estatura.

Tabla de anlisis de
varianza
Fuente
de Grados de Suma de Cuadrados

estadstico
Variacin libertad cuadrados medios F

Debido a

la
regresin 1 1061.1 1061.1 73.08

error 10 145.2 14.5

total 11 1206.3

Se obtiene un valor F = 73.08 > 4.96, con lo cual se rechaza la


hiptesis nula y aceptamos que la variable estatura est relacionada con la
variable peso con un 95% de confianza.
De acuerdo al desarrollo matemtico hemos obtenido los siguientes
clculos:

Lo que nos permite obtener los coeficientes a y b.


Luego,
b = 1223 / 1409.667 = 0.8676
a = 65.25 (0.8676) (162.167) = -75.446

2.1.6 INTERPRETACIN

La ecuacin de regresin estimada es:

Coeficiente de correlacin: R= 0.9379


Coeficiente de determinacin: R=0.8796
El valor de b = 0.8676 indica el incremento del peso en kilogramos, en
promedio, por cada centmetro de aumento en la estatura de los hombres
adultos.
El valor de a, no tiene interpretacin prctica en el ejemplo, se interpretara
como el valor obtenido, en promedio, para el peso Y, cuando la estatura es 0.
Utilizando la ecuacin de regresin para estimar o predecir valores de la
variable Y: Para una talla de 180 se obtiene un peso de 80.7 kg.
Cunto se espera que pese (en promedio) una persona que mide 1.60 m?
Sustituyendo el valor de inters en la ecuacin:

2.2 REGRESION LINEAL MULTIPLE

2.2.1 CONCEPTO
La regresin lineal mltiple permite trabajar con una variable a nivel de
intervalo o razn. De la misma manera es posible analizar la relacin entre
dos o ms variables a travs de ecuaciones.

Constantemente en la prctica de la investigacin estadstica se encuentran


variables que de alguna manera estn relacionadas entre s, por lo que es
posible que una de las variables puedan relacionarse matemticamente en
funcin de otras u otras variables.

Maneja Varias Variables independientes. Cuenta con varios parmetros. Se


expresan de la forma.
2.2.2 FROMULA

= 0 + 1 +

Donde es el error asociado a la medicin i del valor y siguen los


supuestos de modo que ~ (0, 2 ) (media cero, varianza constante e igual
a un y 1 con )
CAPITULO III

RECTAS DE REGRESION

3.1 CONCEPTO
Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos
(o tambin llamada diagrama de dispersin) generada por una distribucin
binomial. Matemticamente, son posiblemente dos rectas de mximo ajuste.

3.1.1 La recta de regresin de Y sobre X


= + ( )
2

3.1.2 La recta de regresin de X sobre Y


= + ( )
2

3.2 CORRELACION

La correlacin ("r") de las rectas determinar la calidad del ajuste. Si r es cercano


o igual a 1, el ajuste ser bueno y las predicciones realizadas a partir del modelo
obtenido sern muy fiables (el modelo obtenido resulta verdaderamente
representativo); si r es cercano o igual a 0, se tratar de un ajuste malo en el que
las predicciones que se realicen a partir del modelo obtenido no sern fiables (el
modelo obtenido no resulta representativo de la realidad). Ambas rectas de
regresin se intersecan en un punto llamado centro de gravedad de la
distribucin.
CAPTULO IV

APLICACIONES DE LA REGRESIN LINEAL

4.1 LNEAS DE TENDENCIA


Una lnea de tendencia representa una tendencia en una serie de datos
obtenidos a travs de un largo perodo. Este tipo de lneas puede decirnos si un
conjunto de datos en particular (como por ejemplo, el PIB, el precio del petrleo
o el valor de las acciones) han aumentado o decrementado en un determinado
perodo.8 Se puede dibujar una lnea de tendencia a simple vista fcilmente a
partir de un grupo de puntos, pero su posicin y pendiente se calcula de manera
ms precisa utilizando tcnicas estadsticas como las regresiones lineales. Las
lneas de tendencia son generalmente lneas rectas, aunque algunas variaciones
utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la
lnea.

4.2 MEDICINA

En medicina, las primeras evidencias relacionando la mortalidad con el fumar


tabaco9 vinieron de estudios que utilizaban la regresin lineal. Los
investigadores incluyen una gran cantidad de variables en su anlisis de
regresin en un esfuerzo por eliminar factores que pudieran producir
correlaciones espurias.

En el caso del tabaquismo, los investigadores incluyeron el estado socio-


econmico para asegurarse que los efectos demortalidad por tabaquismo no
sean un efecto de su educacin o posicin econmica. No obstante, es imposible
incluir todas las variables posibles en un estudio de regresin.10 11 En el
ejemplo del tabaquismo, un hipottico gen podra aumentar la mortalidad y
aumentar la propensin a adquirir enfermedades relacionadas con el consumo
de tabaco. Por esta razn, en la actualidad las pruebas controladas aleatorias
son consideradas mucho ms confiables que los anlisis de regresin.
BIBLIOGRAFIA

ESTADISTICA, Richard C. Weimer


ESTADISTICA,Wm C. Bromw
Estadistica inferencial.RichardC. Weimer
ANEXOS