Regresin - Correlacin
Conceptos:
Regresin simple: interviene una sola variable
independiente
Regresin mltiple: intervienen dos o ms
variables independientes
Regresin no lineal: la funcin que relaciona
los parmetros no es una combinacin lineal
en los parmetros
Regresin Lineal Simple
Objetivo:
Hallar una funcin o un modelo matemtico para
predecir y estimar el valor de una variable a partir de
valores de otra, ambas cuantitativas.
La variable Y: que es la dependiente (respuesta,
predicha, endgena). Es la variable que se desea
predecir o estimar y
la variable X: que es la independiente (predictora,
explicativa, exgena). Es la variable que provee las
bases para estimar.
Regresin Lineal Simple
y
f(y)
. E(y/x) + bx
y/x=
.
x1 x2
Modelo terico
Regresin Lineal Simple
y yi=E(y/x) = + b x +ei
y4 .{
e4
y3 .} e3
y2 e2 {.
y1 .} e1
x1 x2 x3 x4 x
Modelo estadstico
Regresin Lineal Simple
y bx e
y / x E(Y / X ) bx
Interpretacin de los Coeficientes de Regresin:
: es la ordenada al origen
Indica el valor medio poblacional de la variable respuesta Y cuando X es
cero. Si se tiene certeza de que la variable predictora X no puede asumir
el valor 0, entonces la interpretacin no tiene sentido.
b: es la pendiente de la lnea de regresin
Indica el cambio o modificacin del valor medio poblacional de la variable
respuesta Y cuando X se incrementa en una unidad.
e: es un error aleatorio
e = y ( + x)
Estimacin de la lnea de regresin
usando Mnimos Cuadrados
n
= i
n
Se debe Minimizar ei2 ( y bx i ) 2
i 1 i 1
e2 e2
Derivando 0 0
b
x y i i
a y bx
n
x y i i i 1
n
i 1
b i 1
n
n
( xi ) 2
x
i 1
2
i i 1
n
Estimadores
1 x2
a N ( E( a ) ;V ( a ) S e (
2
)
n ( x x) 2
1
b N ( E ( b ) b ; V ( b) S 2 e ( )
( x x) 2
1 ( x x ) 2
y N ( E( y ) bx;V ( y ) S 2 e ( 0 )
n ( x x) 2
S 2e
1
( y i y)2 b( x i x) ( y i y)
n2
S 2e
1
( y i y)2 b 2 ( x i x)2
n2
REGRESION LINEAL SIMPLE
y y
y a bx
x
Modelo estimado
Interpretacin de los coeficientes de
regresin estimados
Ey Ey Ey
La pendiente b
Lnea de * es negativa La pendiente b
regresin es 0
* La pendiente b *
Lnea de Lnea de regresin
es positiva
regresin
x
x x
* Ordenada al origen
REGRESION LINEAL SIMPLE
y a bx
Estimar los valores de y (variable
dependiente) a partir de los valores
de x (variable independiente)
y yi y
yi y
y y
y
x
x
Anlisis de Variancia en el anlisis de regresin
(Yi Yi )
La medida de la variacin total SCtot, es la suma de las
desviaciones al cuadrado
(Y Y )
2
i i
Desarrollo formal de la particin
Consideremos la desviacin
(Yi Yi )
Podemos descomponerla en
Y i
Y (Y Y) (Y Y )
i i i
T R E
(T): desviacin total
(R): es la desviacin del valor ajustado por la regresin
con respecto a la media general
(E): es la desviacin de la observacin con respecto a la
lnea de regresin
Desarrollo formal de la particin
Y Y (Y Y) (Y Y )
2 2 2
i i i i
Yi - Yi = ei
Y la suma de cuadrados es:
n n n
SC (Y Y ) (Y a bX ) e
e i i
2
i 1
2 2
i
i 1 i 1 i 1
Estimacin de la variancia de los trminos del error
(2)
La suma de cuadrados del error, tiene n-2 grados de
libertad asociados con ella, ya que se tuvieron que estimar
dos parmetros.
Por lo tanto, las desviaciones al cuadrado dividido por los
grados de libertad, se denomina cuadrados medios
n 2
SC e
CM e i 1 i
n2 n2
e
s 2
e
1
n2
(y i y) 2
b (x i x)(y i y)
Un ingeniero encargado del rea de calidad de
una empresa manufacturera, desea analizar la
vida til de una herramienta de corte (el
tiempo que mantiene una calidad aceptable de
funcionamiento) para presentar un plan de
reemplazo. Ya que sin duda, las herramientas
de corte pueden determinar el xito o fracaso
de un proceso de mecanizado.
Fresa
Brocas
helicoidales
Teniendo en cuenta que la vida til se ve afectada
por varios aspectos como: el ambiente operacional,
las condiciones de produccin o de mantenimiento y
el desgaste presentado por su uso, decide
comenzar a investigar la relacin funcional entre la
velocidad de corte (metros por minuto) y el tiempo
de vida (horas de uso) de la herramienta. Para ello
tom herramientas nuevas, del mismo tipo, y a cada
una (al azar) las someti a diferentes velocidades de
corte registrando en cada caso la vida til en horas.
Los datos recogidos se muestran en la tabla:
Velocidad Vida
(Metros por minuto) (Horas)
20 8,7
20 9,5
25 8,5
25 7,7
25 8,4
30 7,3
30 6,1
30 7,3
35 6,8
35 5,7
35 6,1
40 4,3
40 4,2
10
9
8
7
Vida til
6
5
4
3
2
1
0
0 10 20 30 40 50
Velocidad
y = -0,2309x + 13,897
10
R2 = 0,9027
9
8
7
Vida til
6
5
4
3
2
1
0
0 10 20 30 40 50
Velocidad
Prueba de hiptesis para el
coeficiente de regresin b
H0 : b = 0 vs H1: b 0
b-b
t t
Variable pivotal Sb ( n -2)
b t n 2;1 / 2 S b b b t n2;1 / 2 S b
6
5
4
3
2
1
0
0 10 20 30 40 50
Velocidad
ANOVA en Regresin
Ho: b = 0
H 1: b 0
ANLISIS DE
VARIANZA
Grados de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 1 29,3254545 29,3254545 102,01004 6,6927E-07