Anda di halaman 1dari 29

REGRESIN

Regresin - Correlacin

Anlisis que requieren la consideracin de 2


o ms variables cuantitativas en forma
simultnea.

Anlisis de Regresin: estudia la relacin


funcional de una o ms variables respecto de
otra

Anlisis de Correlacin: estudia la magnitud o


grado de asociacin entre las variables
Regresin Lineal Simple

Conceptos:
Regresin simple: interviene una sola variable
independiente
Regresin mltiple: intervienen dos o ms
variables independientes
Regresin no lineal: la funcin que relaciona
los parmetros no es una combinacin lineal
en los parmetros
Regresin Lineal Simple
Objetivo:
Hallar una funcin o un modelo matemtico para
predecir y estimar el valor de una variable a partir de
valores de otra, ambas cuantitativas.
La variable Y: que es la dependiente (respuesta,
predicha, endgena). Es la variable que se desea
predecir o estimar y
la variable X: que es la independiente (predictora,
explicativa, exgena). Es la variable que provee las
bases para estimar.
Regresin Lineal Simple
y
f(y)

. E(y/x) + bx
y/x=
.

x1 x2
Modelo terico
Regresin Lineal Simple
y yi=E(y/x) = + b x +ei
y4 .{
e4

y3 .} e3
y2 e2 {.

y1 .} e1

x1 x2 x3 x4 x
Modelo estadstico
Regresin Lineal Simple
y bx e
y / x E(Y / X ) bx
Interpretacin de los Coeficientes de Regresin:
: es la ordenada al origen
Indica el valor medio poblacional de la variable respuesta Y cuando X es
cero. Si se tiene certeza de que la variable predictora X no puede asumir
el valor 0, entonces la interpretacin no tiene sentido.
b: es la pendiente de la lnea de regresin
Indica el cambio o modificacin del valor medio poblacional de la variable
respuesta Y cuando X se incrementa en una unidad.
e: es un error aleatorio
e = y ( + x)
Estimacin de la lnea de regresin
usando Mnimos Cuadrados
n

= i
n
Se debe Minimizar ei2 ( y bx i ) 2

i 1 i 1

e2 e2
Derivando 0 0
b

se obtiene un par de ecuaciones normales para el


modelo, cuya solucin produce
n n

x y i i
a y bx
n

x y i i i 1
n
i 1

b i 1
n

n
( xi ) 2
x
i 1
2
i i 1
n
Estimadores
1 x2
a N ( E( a ) ;V ( a ) S e (
2
)
n ( x x) 2

1
b N ( E ( b ) b ; V ( b) S 2 e ( )
( x x) 2

1 ( x x ) 2
y N ( E( y ) bx;V ( y ) S 2 e ( 0 )
n ( x x) 2

S 2e
1
( y i y)2 b( x i x) ( y i y)
n2

S 2e
1
( y i y)2 b 2 ( x i x)2
n2
REGRESION LINEAL SIMPLE

Estimar los valores de y (variable dependiente) a partir de los


valores de x (variable independiente)

y y

y a bx

x
Modelo estimado
Interpretacin de los coeficientes de
regresin estimados

La pendiente b indica el cambio promedio


estimado en la variable respuesta cuando la variable
predictora aumenta en una unidad adicional.

La ordenada al origen a indica el valor promedio


estimado de la variable respuesta cuando la variable
predictora vale 0. Sin embargo carece de
interpretacin prctica si es irrazonable considerar que
el rango de valores de x incluye a cero.
Lneas posibles de regresin en la regresin
lineal simple
Relacin lineal Relacin lineal No hay relacin
positiva negativa

Ey Ey Ey
La pendiente b
Lnea de * es negativa La pendiente b
regresin es 0

* La pendiente b *
Lnea de Lnea de regresin
es positiva
regresin

x
x x

* Ordenada al origen
REGRESION LINEAL SIMPLE

y a bx
Estimar los valores de y (variable
dependiente) a partir de los valores
de x (variable independiente)
y yi y
yi y
y y
y

x
x
Anlisis de Variancia en el anlisis de regresin

El enfoque desde el anlisis de variancia se basa en la


particin de sumas de cuadrados y grados de libertad
asociados con la variable respuesta Y.
La variacin de los Yi se mide convencionalmente en
trminos de las desviaciones

(Yi Yi )
La medida de la variacin total SCtot, es la suma de las
desviaciones al cuadrado

(Y Y )
2
i i
Desarrollo formal de la particin
Consideremos la desviacin
(Yi Yi )
Podemos descomponerla en

Y i
Y (Y Y) (Y Y )
i i i

T R E
(T): desviacin total
(R): es la desviacin del valor ajustado por la regresin
con respecto a la media general
(E): es la desviacin de la observacin con respecto a la
lnea de regresin
Desarrollo formal de la particin

Si consideremos todas las observaciones y elevamos al cuadrado para que


los desvos no se anulen

Y Y (Y Y) (Y Y )
2 2 2

i i i i

SCtot SCreg SCer

(SCtot): Suma de cuadrados total


(SCreg): Suma de cuadrados de la regresin
(SCer): Suma de cuadrados del error
Dividiendo por los grados de libertad, (n-1), (1) y
(n-2), respectivamente cada suma de cuadrados, se obtienen los
cuadrados medios del anlisis de variancia.
Cada un de estos cuadrados medios tiene una distribucin Ji Cuadrado.
Estimacin de la variancia de los trminos del
error (2)

Dado que los Yi provienen de diferentes distribuciones de


probabilidades con medias diferentes que dependen del
nivel de X, la desviacin de una observacin Yi debe ser
calculada con respecto a su propia media estimada Yi.
Por tanto, las desviaciones son los residuales

Yi - Yi = ei
Y la suma de cuadrados es:
n n n
SC (Y Y ) (Y a bX ) e
e i i
2
i 1
2 2
i
i 1 i 1 i 1
Estimacin de la variancia de los trminos del error
(2)
La suma de cuadrados del error, tiene n-2 grados de
libertad asociados con ella, ya que se tuvieron que estimar
dos parmetros.
Por lo tanto, las desviaciones al cuadrado dividido por los
grados de libertad, se denomina cuadrados medios

n 2

SC e
CM e i 1 i

n2 n2
e

Donde CM es el Cuadrado medio del error o cuadrado


medio residual. Es un estimador insesgado de 2
Tabla del anlisis de varianza

Fuentes de Grados de Suma de Cuadrados Medios F


Variacin Libertad Cuadrados
Debido a la 1 SCR CMR=SCR/1 CMR/CMEE
regresin
Debido al n-2 SCEE CMEE=SCEE/(n-2)
Error
Total n-1 SCTot

La hiptesis nula Ho: b = 0 se rechaza si el p-valor de


la prueba de F es menor que el nivel de significacin.
Error estndar de la estimacin
Se o Sy/x

Mide la dispersin o alejamiento promedio de los puntos


con respecto a la recta estimada.
1
s 2
e
n2
(y i y i ) 2

s 2
e
1
n2
(y i y) 2
b (x i x)(y i y)
Un ingeniero encargado del rea de calidad de
una empresa manufacturera, desea analizar la
vida til de una herramienta de corte (el
tiempo que mantiene una calidad aceptable de
funcionamiento) para presentar un plan de
reemplazo. Ya que sin duda, las herramientas
de corte pueden determinar el xito o fracaso
de un proceso de mecanizado.

Las herramientas de corte ms conocidas son:


brocas, fresas, limas, sierras, herramientas de
tornear, etc.

Fresa
Brocas
helicoidales
Teniendo en cuenta que la vida til se ve afectada
por varios aspectos como: el ambiente operacional,
las condiciones de produccin o de mantenimiento y
el desgaste presentado por su uso, decide
comenzar a investigar la relacin funcional entre la
velocidad de corte (metros por minuto) y el tiempo
de vida (horas de uso) de la herramienta. Para ello
tom herramientas nuevas, del mismo tipo, y a cada
una (al azar) las someti a diferentes velocidades de
corte registrando en cada caso la vida til en horas.
Los datos recogidos se muestran en la tabla:
Velocidad Vida
(Metros por minuto) (Horas)
20 8,7
20 9,5
25 8,5
25 7,7
25 8,4
30 7,3
30 6,1
30 7,3
35 6,8
35 5,7
35 6,1
40 4,3
40 4,2

x = 390 x =12250 y = 90,6 y = 663,9


xy = 2591
a) Dibujar el diagrama de dispersin.

10
9
8
7
Vida til

6
5
4
3
2
1
0
0 10 20 30 40 50
Velocidad
y = -0,2309x + 13,897
10
R2 = 0,9027
9
8
7
Vida til

6
5
4
3
2
1
0
0 10 20 30 40 50
Velocidad
Prueba de hiptesis para el
coeficiente de regresin b

H0 : b = 0 vs H1: b 0
b-b
t t
Variable pivotal Sb ( n -2)

Conclusin: Con un nivel de significacin del 5 %


tengo evidencias suficientes para suponer que existe
una relacin funcional poblacional del tiempo de vida
til de la herramienta en funcin de la velocidad de
corte, o que sea, por cada metro/minuto que se
incrementa la velocidad de corte se modifica o
cambia el valor medio poblacional del tiempo de vida
til de la herramienta.
Intervalo de confianza para el
coeficiente de Regresin

b t n 2;1 / 2 S b b b t n2;1 / 2 S b

(-0,281214< b < -0,180585)

Con una confianza de 95 %, podra decir que el intervalo


(-0,2812 ; -0,1805) horas/(metros/minuto) encerrara al
verdadero valor de la pendiente de la recta de regresin.
Esto es, con una confianza de 95 %, podra decir que el
intervalo
(-0,2812 ; -0,1805) horas/(metros/minuto) encerrara al
verdadero cambio del promedio poblacional del tiempo de
vida de la herramienta, para un aumento unitario en la
velocidad de corte.
10
9
desviacin no explicada
8 desviacinTotal
desviacin explicada
7
Vida til

6
5
4
3
2
1
0
0 10 20 30 40 50
Velocidad
ANOVA en Regresin

Ho: b = 0
H 1: b 0

ANLISIS DE
VARIANZA
Grados de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 1 29,3254545 29,3254545 102,01004 6,6927E-07

Residuos 11 3,16223776 0,28747616


Total 12 32,4876923

Anda mungkin juga menyukai