Anda di halaman 1dari 10

Regresión y correlación

Regresión:
• Es el análisis que se utiliza para hacer predicciones.
• La regresión mide en forma funcional, a través de una ecuación, la posible
relación entre las variables con el objeto de predecir una de ellas en función
de la(s) otra(s).
Correlación:
• Es dirige sobre todo a medir la intensidad o fuerza con que están relacionadas
linealmente las variables.
• Se utiliza para medir la intensidad de la asociación entre variables numéricas.
• Mide la fuerza y la dirección de la relación lineal entre dos variables
cuantitativas.
Diagramas de dispersión (incluir dibujos)
Un diagrama de dispersión es una representación gráfica de la
relación entre dos variables, muy utilizada en las fases de
Comprobación de teorías e identificación de causas raíz y en el
Diseño de soluciones y mantenimiento de los resultados obtenidos.
REGRESIÓN SIMPLE.
 La naturaleza de la relación puede tomar muchas formas, desde las
sencillas hasta las extremadamente complicadas. La más sencilla
consiste en una línea, es decir, una relación lineal. Se establece que
Y es una función de sólo una variable independiente. Se le
denomina también regresión bivariada, porque solo hay dos
variables. Se represente por la formula.
𝒀 = 𝒇(𝒙)
CORRELACIÓN SIMPLE.
 Es cuando se estudia el grado de asociación o dependencia entre
dos variables. Se mide por un coeficiente de correlación,
representado por “r”.
Estimación de parámetros
 La función de regresión lineal simple es expresado como:
Y = β0 + β1x + ε
 La estimación de parámetros consiste en determinar los
parámetros β0 y β1 y a partir de los datos muéstrales observados;
es decir, deben hallarse valores como β0 y β1 de la muestra, que
represente a β0 y β1 respectivamente.
 Una técnica matemática utilizada para determinar los valores de β0
y β1 que mejor se ajuste a los datos observados se conoce como
métodos de mínimos cuadrados. Cualquiera de los valores de
β0 y β1 que sean diferentes a los determinados por el método de
mínimos cuadrados tendrían como resultados una suma mayor de
las diferencias al cuadrado del valor real de “Y” y su valor predicho.
 Al utilizar el método de mínimos cuadrados obtendremos las
siguientes dos ecuaciones conocidas como ecuaciones normales

 Debemos resolverlas de manera simultánea para obtener β0 y β1.


Ya que se tienen dos ecuaciones con dos incógnitas, podemos
resolverlas de la manera siguiente:
 Examinando las ecuaciones, observamos que se tienen cinco
cantidades que deben calcularse con el fin de determinar β0 y
β1. Estas son, n, el tamaño de la muestra;
σ𝑛𝑖=1 𝑋𝑖 , la suma de los valores X σ𝑛𝑖=1 𝑋𝑖2 , la suma de los
cuadrados de X.
σ𝑛𝑖=1 𝑌𝑖 , la de los valores de Y; y σ𝑛𝑖=1 𝑋𝑖 𝑌𝑖 , la suma de los productos
cruzados de X yY.
 La deducción de las formulas normales mediante el método de
mínimos cuadrados se realiza de la misma manera para otras
funciones de grados superiores, logarítmicas y potencial; con la
cualidad de que tiene que estar en dos dimensiones, (x y); para
tres dimensiones requiere análisis adicional.
 Suma de Cuadrados del Total (SCT): mide la dispersión
(variación total) en los valores observados de Y. Este término se
utiliza para el cálculo de la variancia de la muestra.
 Suma de Cuadrados explicada (Suma de Cuadrados
debido a la Regresión, SCR): mide la variabilidad total en los
valores observados de Y en consideración a la relación lineal
entre X eY.
 Suma de Cuadrados residual (inexplicada, Suma de
Cuadrados del Error, SCE): mide la dispersión de los valores
Y observado respecto a la recta de regresión Y (es la cantidad que
se minimiza cuando se obtiene la recta de regresión).
Análisis de Variancia para la regresión
lineal simple
 Cuando cada partición se asocia a una porción
correspondiente del total de grados de libertad, la técnica es
conocida cono análisis de variancia (ANVA), que
generalmente se presenta en un cuadro de la siguiente forma:

La prueba estadística “F” evalúan las hipótesis:


 Hp: β1 = 0. No existe una regresión lineal entre X e Y.
 Ha: β1 ≠ 0. Existe regresión lineal de Y en función de X.
EJEMPLO:
 Las notas de 12 alumnos de una clase en Matemáticas y Física son
las siguientes:

1. Hallamos el coeficiente de correlación


2. Calculamos las media aritméticas

3. Calculamos las desviaciones típicas

4. Aplicamos la fórmula de coeficiente de correlación lineal.

Anda mungkin juga menyukai