La finalidad de una ecuación de regresión es estimar los valores de una variable con base
en los valores conocidos de la otra. Otra forma de emplear una ecuación de regresión es
para explicar los valores de una variable en términos de otra. El análisis de regresión
únicamente indica qué relación matemática podría haber, de existir una.
Las suposiciones que se realizan al aplicar las técnicas de regresión lineal son:
• El modelo propuesto es lineal (es decir existe relación entre la variable explicativa y la
variable explicada, y esta relación es lineal). Es decir se asume que:
Donde:
Y´ se lee Y prima, es el valor pronosticado de la variable Y para un valor seleccionado de
X.
a es la ordenada de la intersección con el eje Y, es decir, el valor estimado de Y cuando X
= 0.
Dicho de otra forma, corresponde al valor estimado de Y, donde la recta de regresión cruza
el eje Y, cuando X = 0.
B es la pendiente de la recta, o el cambio promedio en Y´ por unidad de cambio
(incremento o decremento) en la variable independiente X.
X es cualquier valor seleccionado de la variable independiente.
Con esta expresión se hace referencia al proceso matemático que sirve para ajustar
una línea recta a través de un conjunto de datos bivariables asentados en una gráfica de
dispersión. Dicha línea se conoce como línea de regresión simple.
El primer paso es recoger datos experimentales correspondientes a n individuos con
información de dos variables cuantitativas: una de ellas se considera variable
explicativa (Variable x) y la otra se considera variable respuesta (Variable y). El modelo que
se asume es:
y = β0 + x β1 + ε
Valores Y
4
0
0 1 2 3
Método de mínimos cuadrados
Es el procedimiento más utilizado por adaptar una recta aun conjunto de punto se le que conoce
como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes:
Para un valor dado de X, por ejemplo, X1, habrá una diferencia entre el valor Y1
y el correspondiente valor de la curva C. Esta diferencia se denota por D1, que se conoce como
desviación, error o residuo.
De todas las curvas de aproximación a una serie de datos puntuales la curva que tiene la propiedad
de que: D21 + D22 + . . . + D2N