REGRESIN
1. Introduccin
2. Definicin
Consiste en la medicin del grado de dependencia de una variable dependiente Y sobre una
variable independiente (o de regresin) X. La variable independiente es manipulada por el
experimentador. Es decir, el experimentador decide qu valores tomar la variable independiente,
mientras los valores de la variable dependiente estn determinados por la relacin, si existe, entre
ambas variables.
Ejemplo: Y = f(x)
Es una ecuacin que define la relacin lineal entre dos variables donde una variable
depende de la otra variable.
Se puede decir que Y depende de X. Y = f(X) Como Y depende de X, entonces: Y es la
variable dependiente, explicativa o de prediccin . X es la variable independiente o variable
respuesta.
3. Ejemplo
Un anlisis a este diagrama de dispersin indica que, si bien una curva no pasa exactamente por
todos los puntos, existe una evidencia fuerte de que los puntos estn dispersos de manera aleatoria
alrededor de una lnea recta. Por consiguiente, es razonable suponer que la media de la VA Y est
relacionada con X por la siguiente relacin lineal:
Donde:
- 0,1, reciben el nombre de Coeficientes de Regresin, los cuales son parmetros que deben
estimarse a partir de datos muestrales.
La manera apropiada para generalizar este hecho, con un modelo Probabilstica Lineal es suponer
que el valor esperado de Y es una funcin lineal de X, pero que para una valor fijo de X, el valor real
de Y est determinado por el valor medio de la funcin (el modelo lineal) ms un trmino que
representa un error aleatorio, por ejemplo:
Este modelo recibe el nombre de MODELO DE REGRESIN LINEAL SIMPLE, ya que solo tiene
una variable independiente o regresor.
4. Mtodo de mnimos cuadrados
5.
6. Supngase ahora que se tienen n pares de observaciones (x1, y1); (x2, y2);;(xn, yn). En
el siguiente grfico puede observarse una representacin grfica de dispersin de los
datos observados y un candidato para la recta de Regresin. Las estimaciones de
deben dar como resultado una lnea que, en algn sentido, se ajuste mejor
a los datos.
El Mtodo de Mnimos Cuadrados: consiste en estimar los coeficientes de
regresin (
) de modo que se minimice la suma de los cuadrados de las
distancias verticales que hay entre cada valor observado y la recta de
regresin estimada.
y i 0 1 xi u i
0 y 1 coeficient es de regresin
0 intercepto
1 pendiente
CORRELACIN
1. Definicin
Consiste en determinar el grado de asociacin (interdependencia) entre dos variable. En la
Correlacin se est interesado en saber si dos variables covaran, es decir, si varan juntas.
2. Nube de puntos o diagrama de dispersin.
a. Correlacin directa: Sobre la nube de puntos puede trazarse una recta que se
ajuste a ellos lo mejor posible, La recta correspondiente a la nube de llamada recta
de puntos de la distribucin es una recta creciente. regresin.
b. Correlacin inversa
3. Coeficiente De Correlacin
4. Ejemplo
Un investigador desea determinar la asociacin entre la biomasa marina y la cantidad de clorofila. El
investigador por tanto, saca repetidas muestras de agua de un lugar de muestreo en un lago y mide
la cantidad de clorofila y la biomasa en cada muestra repetida. En esta situacin el investigador no
tiene control sobre una u otra variable, puesto que ambosvalores encontrados en las muestras
sernlos que la naturaleza provee. Por ello, estas variables son aleatorias y la correlacin es el
procedimiento estadstico adecuado.
Conceptos bsicos
1. Regresin: Es un procedimiento estadstico que estudia la relacin funcional entre
variables.Con el objeto de predecir una en funcin de la/s otra/s.
2. Correlacin: Un grupo de tcnicas estadsticas usadas para medir la intensidad de la relacin
entre dos variables
3. Diagrama de Dispersin: Es un grfico que muestra la intensidad y el sentido de la relacin
entre dos variables de inters.
4. Variable dependiente (respuesta, predicha, endgena): es la variable que se desea predecir
o estimar
5. Variables independientes (predictoras, explicativas exgenas). Son las variables que
proveen las bases para estimar.
6. Regresin simple: interviene una sola variable independiente
7. Regresin mltiple: intervienen dos o ms variables independientes.
8. Regresin lineal: la funcin es una combinacin lineal de los parmetros.
9. Regresin no lineal: la funcin que relaciona los parmetros no es una combinacin lineal