200
Y=f(X) 150
Rend.
100
Ejemplo 1 50
Dosis
1 75 150
2 25 50 Nota: Las observaciones caen exactamente sobre la línea de
3 130 260 relación funcional
CB-412 3 CB- 412 4
1 60
Horas hombr e
variables
1 40
1 20
1 00
Ejemplo 2
80
Horas hombre
60
40
0
0 10 20 30 40 50 60 70 80 90
1
Figura 3 Conceptos básicos
Coordenadas de puntos de control utilizados Análisis de Regresión: Es un procedimiento estadístico que estudia
para corregir la columna de los niveles la relación funcional entre variables.Con el objeto de predecir una
en función de la/s otra/s.
digitales de una imagen satelital
Análisis de Correlación: Un grupo de técnicas estadísticas usadas
7000
para medir la intensidad de la relación entre dos variables
6000
Diagrama de Dispersión: Es un gráfico que muestra la intensidad y el
5000
sentido de la relación entre dos variables de interés.
Variable dependiente (respuesta, predicha, endógena): es la
4000
2000
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
X
CB-412 11 X
CB- 412 12
2
Ausencia de Correlación Correlación Fuerte y Positiva
10 10
9 9
8 8
7 7
6 6
Y 5 Y 5
4 4
3 3
2 2
1 1
0 0
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
X
CB-412 13
X
CB- 412 14
3
Análisis de Regresión Supuestos de Regresión Lineal
Clásica
Objetivo: determinar la ecuación de regresión para • Cada error est á normalmente distribuido
predecir los valores de la variable dependiente (Y)
con:
en base a la o las variables independientes ( X).
– Esperanza de los errores igual a 0
Procedimiento: seleccionar una muestra a partir de
la población, listar pares de datos para cada – Variancia de los errores igual a una
observación; dibujar un diagrama de puntos para constante 2.
dar una imagen visual de la relación; determinar la – Covariancia de los errores nulas para todo
ecuación de regresión. ij
* La pendiente 1 *
es positiva Línea de regresió n Línea de regresi ón
Ecuación estimada de
b0 y b1 regresi ón
y=b0 +b1 x
proporcionan estimados Estadísticos de la muestra x x x
0 y 1 b0.b 1
* Ordenada al origen 0
CB-412 21 CB- 412 22
4
Estimación de la variancia de los Estimación de la variancia de los
términos del error (2 ) términos del error (2)
Debe ser estimada por varios motivos Dado que los Yi provienen de diferentes distribuciones
• Para tener una indicación de la variabilidad de probabilidades con medias diferentes que
de las distribuciones de probabilidad de Y. dependen del nivel de X, la desviación de una
• Para realizar inferencias con respecto a la observación Y i debe ser calculada con respecto a su
función de regresión y la predicción de Y. propia media estimada Y i.
Por tanto, las desviaciones son los residuales
• La lógica del desarrollo de un estimador de
2 para el modelo de regresión es la misma Yi - ˆ
Yi = e i
que cuando se muestrea una sola población Y la suma de cuadrados es:
• La variancia de cada observación Y i es 2 , la n n n
SCe ( Yi ˆ
Yi ) (Yi a bX 1) e i
2 2 2
CB-412 27
(Y Y )
i
CB- 412
i
2
28
Y Y ( Y
2 2
Podemos descomponerla en
i
ˆY) ( Y Y
2
ˆ) i i i
Y Y (Y
i
ˆY ) (Y Y
i
ˆ) i i
SC tot SCreg SC er
T R E (SCtot): Suma de cuadrados total
(T): desviación total (SCreg ): Suma de cuadrados de la regresión
(SCer ): Suma de cuadrados del error
(R): es la desviación del valor ajustado por la
regresión con respecto a la media general Dividiendo por los grados de libertad, (n-1), (k) y
(E): es la desviación de la observación con respecto (n-2), respectivamente cada suma de cuadrados, se
a la línea de regresión obtienen los cuadrados medios del análisis de
CB-412 29 variancia. CB- 412 30
5
Cálculo del R2 a través de la
Coeficiente de Determinación siguiente fórmula
Coeficiente de Determinación, R2 - es la
proporción de la variación total en la
(y y )
R ˆ
2
variable dependiente Y que es explicada o
2 c
contabilizada por la variación en la variable
(y y )
2
independiente X.
o
– El coeficiente de determinación es el
cuadrado del coeficiente de correlación, y
varia entre 0 y 1.
Ejemplo
Inferencia en Regresión
Se desean comparar los rendimientos predichos a partir de la
• Los supuestos que establecimos sobre los información obtenida por 3 sensores sobre los rendimientos
reales por parcelas de lotes de maíz. Los rendimientos (Y) y el
errores nos permiten hacer inferencia sobre los rindes predichos de 4 sensores se presentan a continuación
los parámetros de regresión (prueba de Sensor 1 Sensor 4 Sensor 5 Rendimiento
4 5 ,9 5
T ít u lo
PR ED_R endimiento
4 5 ,9 5 3 8 ,4 1
P RED _R endimi ento
3 8 ,4 1 3 0 ,8 7
3 0 ,8 7 2 3 ,3 3
2 3 ,3 3 1 5 ,7 9
0 ,2 2 0 ,2 6 0 ,3 0 0 ,3 4 0 ,3 7
B 4
1 5 ,7 9
0 ,0 7 8 0 ,0 9 2 0 ,1 0 7 0 ,1 2 1 0 ,1 3 5
R e n d im ie n t o
B5 P R E D _ R e n d im ie n t o
R e n d im ie n to
PR ED _ R e n d im ie n to
Y = 338.71*X - 4.87
Y = 155.37*X – 13.25
CB-412 35 CB- 412 36
R2 = 0.32 R2 = 0.57
6
T ít u lo
4 5 ,9 5
PR ED_R en d imi en to
3 8 ,4 1
3 0 ,8 7
2 3 ,3 3
1 5 ,7 9
0 ,0 7 1 0 ,0 7 6 0 ,0 8 1 0 ,0 8 7 0 ,0 9 2
B 1
R e n d im ie n t o
P R E D _ R e n d im ie n t o
Y = - 1004.34*X +112.24
CB-412 R2 = 0.44 37