Anda di halaman 1dari 52

Mtodo de los mnimos cuadrados.

Polinomio aproximador
Tratamiento de datos
Polinomio aproximador La clase PolRegesion. El procedimiento de Seidel Ejercicios Bibliografa

Supongamos que hemos medido un conjunto de pares de datos (xi, yi) en una experiencia, por ejemplo, la posicin de un mvil en ciertos instantes de tiempo. Queremos obtener una funcin y=f(x) que se ajuste lo mejor posible a los valores experimentales. Se pueden ensayar muchas funciones, rectas, polinomios, funciones potenciales o logartmicas. Una vez establecido la funcin a ajustar se determinan sus parmetros, en el caso de un polinomio, sern los coeficientes del polinomio de modo que los datos experimentales se desven lo menos posible de la frmula emprica. La funcin ms sencilla es la funcin lineal y=ax+b que hemos tratado en la pgina anterior. El procedimiento de ajustar los datos experimentales a una lnea recta se denomina regresin lineal

Polinomio aproximador
Queremos aproximar un polinomio de grado n, a un conjunto de m pares de datos (xi, yi) de modo que n m. Sea el polinomio P(x)=a0+a1x+a2x2+...anxn Se calcula la cantidad

Para obtener los valores de los coeficientes del polinomio aproximador se tienen que determinar los valores de los coeficientes a0, a1, a2, ...an de forma que la cantidad S tome un valor mnimo. Hagamos las derivadas parciales de S respecto de a0, a1, a2, ...an iguales a cero

(1) Obtenemos un sistema de n+1 ecuaciones con n+1 incgnitas, a0, a1, a2, ...an Ejemplo: Supongamos que tenemos 4 pares de datos y que queremos ajustarlos al polinomio de segundo grado y=a0+a1x+a2x2 x y x0 y0 x1 y1 x2 y2 x3 y3

Las ecuaciones (1) se escribirn

agrupando trminos

Volvamos al sistema de n+1 ecuaciones con n+1 incgnitas. Introduzcamos las expresiones

(2) Se obtiene el siguiente sistema de n+1 ecuaciones con n+1 incgnitas

(3) Si todos los puntos son distintos, el sistema de ecuaciones tiene una solucin nica. Para resolver el sistema de ecuaciones se puede emplear alguno de los varios procedimientos existentes. El mtodo empleado en este programa es el mtodo de iteracin. Ya que la matriz del sistema de ecuaciones es positiva, para este sistema se emplea el procedimiento de Seidel.

La clase PolRegesion.
La clase PolRegresion tiene los siguientes miembros dato
public class PolRegresion { private double[] x; //datos private double[] y; private int nDatos; double[][] m; //matriz de los coeficientes double[] t; //trminos independientes public double[] a; //polinomio a[0]+a[1]x+a[2]x2+... public int grado; //grado del polinomio

El constructor inicializa los miembros, array x, array y que guardan los resultados experimentales y el nmero nDatos de dichos datos. El constructor crea la matriz m, el vector t, y reserva espacio para el array que va a guardar los coeficientes del polinomio a, cuyo grado se guarda en el miembro grado.
public PolRegresion(double[] x, double[] y, int grado) { this.x=x; this.y=y; nDatos=x.length; this.grado=grado; t=new double[grado+1]; m=new double[grado+1][grado+1]; a=new double[grado+1]; }

A partir de datos (xi, yi) se tiene que obtener la matriz m cuadrada de los coeficientes (3) de dimensin n (grado+1) y el vector t de dimensin n usando las frmulas (2). La funcin miembro coeficientes calcula los elementos del vector t y de la matriz m.
private void coeficientes(){ double[] s=new double[2*grado+1]; double suma; for(int k=0; k<=2*grado; k++){ suma=0.0; for(int i=0; i<nDatos; i++){ suma+=potencia(x[i], k); } s[k]=suma; } for(int k=0; k<=grado; k++){ suma=0.0; for(int i=0; i<nDatos; i++){ suma+=potencia(x[i], k)*y[i]; } t[k]=suma; } for(int i=0; i<=grado; i++){ for(int j=0; j<=grado; j++){ m[i][j]=s[i+j]; } } }

La funcin coeficientes llama a la funcin auxiliar potencia para calcular la potencia de un nmero elevado a un exponente entero
private double potencia(double base, int exp){ double producto=1.0; for(int i=0; i<exp; i++){ producto*=base; } return producto; }

El procedimiento de Seidel
Finalmente, nos queda la tarea de resolver el sistema de n ecuaciones con n incgnitas (n es el grado del polinomio). El procedimiento empleando es el de Seidel. Explicaremos este procedimiento mediante un ejemplo. Sea el sistema lineal de tres ecuaciones

Se despeja x1 en la primera ecuacin, x2 en la segunda y x3 en la tercera. Reducindose el sistema a una forma conveniente para aplicar el procedimiento de iteracin o de aproximaciones sucesivas.

(4) Como podemos apreciar, las diagonales de la matriz de los coeficientes de las x son ceros. Tomemos como aproximacin inicial

La primera aproximacin se escribe

Se introduce la primera aproximacin de x0 en la segunda ecuacin. Se introduce la primera aproximacin de x0 y de x1 en la tercera ecuacin, y as sucesivamente. De este modo el mtodo de Seidel ofrece una mejor convergencia que la iteracin simple. La segunda aproximacin es

En general el mtodo se Seidel lo podemos escribir del siguiente modo.

En todo proceso iterativo, es preciso establecer la condicin de finalizacin, no puede correr el proceso de forma indefinida. El error relativo entre dos iteraciones consecutivos k y k+1 de los valores que toman cada una de las incgnitas xi deber ser menor que un cierto valor (por ejemplo, una milsima).

Veamos ahora el cdigo En primer lugar, transformamos la matriz m de los coeficientes del sistema de ecuaciones (3) y el vector t de los trminos independientes, para expresarlo de la forma (4) adecuada para la iteracin. Para ello, se divide los elementos de cada fila i por el elemento correspondiente de la diagonal principal m[i][i] y se cambia de signo. Los elementos de la diagonal m[i][i] se hacen cero.
for(int i=0; i<=grado; i++){ aux=m[i][i]; for(int j=0; j<=grado; j++){ m[i][j]=-m[i][j]/aux; } t[i]=t[i]/aux; m[i][i]=0.0; }

Se elige la aproximacin inicial, y se guardan en el array p de las incgnitas


p[0]=t[0]; for(int i=1; i<=grado; i++){ p[i]=0.0; }

Se calcula siguiente aproximacin y se guarda en el array a de las incgnitas


for(int i=0; i<=grado; i++){ a[i]=t[i]; for(int j=0; j<i; j++){ a[i]+=m[i][j]*a[j]; } for(int j=i+1; j<=grado; j++){ a[i]+=m[i][j]*p[j]; } }

La iteracin actual a es la iteracin anterior p en el siguiente clculo


for(int i=0; i<=grado; i++){ p[i]=a[i]; }

El proceso se repite, hasta que se cumple la condicin de finalizacin.Para ello, calculamos el error relativo de cada una de las incgnitas. Guardamos en la variable maximo el mayor de los errores relativos.

maximo=0.0; for(int i=0; i<=grado; i++){ error=Math.abs((a[i]-p[i])/a[i]); if (error>maximo) maximo=error; }

Todo el procedimiento lo ponemos en el interior de un bucle do...while que se ejecuta hasta que se cumple que el valor de la variable maximo sea menor o igual que una milsima.
double error=0.0, maximo=0.0; do{ error=0.0; maximo=0.0; for(int i=0; i<=grado; i++){ a[i]=t[i]; for(int j=0; j<i; j++){ a[i]+=m[i][j]*a[j]; } for(int j=i+1; j<=grado; j++){ a[i]+=m[i][j]*p[j]; } error=Math.abs((a[i]-p[i])/a[i]); if (error>maximo) maximo=error; } for(int i=0; i<=grado; i++){ p[i]=a[i]; } }while(maximo>0.001);

El cdigo completo de la clase PolRegresion es el siguiente


public class PolRegresion { private double[] x; //datos private double[] y; private int nDatos; double[][] m; //matriz de los coeficientes double[] t; //trminos independientes public double[] a; //polinomio a[0]+a[1]x+a[2]x2+... public int grado; //grado del polinomio public PolRegresion(double[] x, double[] y, int grado) { this.x=x; this.y=y; nDatos=x.length; this.grado=grado; t=new double[grado+1]; m=new double[grado+1][grado+1]; a=new double[grado+1]; } private void coeficientes(){ double[] s=new double[2*grado+1]; double suma; for(int k=0; k<=2*grado; k++){ suma=0.0; for(int i=0; i<nDatos; i++){ suma+=potencia(x[i], k); }

s[k]=suma; } for(int k=0; k<=grado; k++){ suma=0.0; for(int i=0; i<nDatos; i++){ suma+=potencia(x[i], k)*y[i]; } t[k]=suma; } for(int i=0; i<=grado; i++){ for(int j=0; j<=grado; j++){ m[i][j]=s[i+j]; } } } private double potencia(double base, int exp){ double producto=1.0; for(int i=0; i<exp; i++){ producto*=base; } return producto; } //procedimiento de Seidel public void calculaPolinomio(){ coeficientes(); //matriz double aux; for(int i=0; i<=grado; i++){ aux=m[i][i]; for(int j=0; j<=grado; j++){ m[i][j]=-m[i][j]/aux; } t[i]=t[i]/aux; m[i][i]=0.0; } // aproximacin inicial double[] p=new double[grado+1]; p[0]=t[0]; for(int i=1; i<=grado; i++){ p[i]=0.0; } //aproximaciones sucesivas double error=0.0, maximo=0.0; do{ maximo=0.0; for(int i=0; i<=grado; i++){ a[i]=t[i]; for(int j=0; j<i; j++){ a[i]+=m[i][j]*a[j]; } for(int j=i+1; j<=grado; j++){ a[i]+=m[i][j]*p[j]; } error=Math.abs((a[i]-p[i])/a[i]); if (error>maximo) maximo=error; } for(int i=0; i<=grado; i++){ p[i]=a[i]; }

}while(maximo>0.001); } }

Ejercicios
Determinar el polinomio aproximador de segundo grado para la siguientes tablas de datos, tomadas de una experiencia con fluidos x y 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4

0.375 0.625 0.750 0.815 0.875 1.00 1.065 1.125

x y

0.05 0.25

0.1 0.42

0.15 0.58

0.2 0.72

0.25 0.85

0.3 0.98

0.35 1.10

0.4 1.12

x y

0.05 0.28

0.1 0.50

0.15 0.64

0.2 0.75

0.25 0.82

0.3 0.90

0.35 0.95

0.4 1.02

El siguiente applet permite introducir los datos experimentales y ajustarlos mediante un polinomio de grado menor o igual al nmero de datos. Los datos que aparecen cuando se inicia el applet en los controles de edicin corresponden a la primera tabla. Se elige el grado del polinomio pulsando en el botn titulado Grado polinomio>> y a continuacin se pulsa en el botn titulado Calcular. Se observa a la derecha la representacin de los datos, del polinomio de ajuste y los valores de los coeficientes del polinomio. P(x)=a0+a1x+a2x2+...anxn Para ensayar con otros datos se pulsa el botn titulado Borrar, y a continuacin se introducen los pares de datos en los controles de edicin respectivos.

PolRegresion.java, RegresionApplet2.java, MiCanvas.java

Bibliografa
B.P. Demidowitsch, Maron, Schuwalowa. Mtodos numricos de anlisis. Editorial Paraninfo (1978), pgs 21-23. Demidovich, Maron. Clculo numrico fundamental. Editorial Paraninfo (1977), pgs 339-340.

Metodo Minimos Cuadrados


Buscar

El mtodo de mnimos cuadrados para el calculo de la ecuacin de una recta a travs de los datos de inters da la lnea de mejor ajuste, para llegar a la ecuacin de tendencia por mnimos cuadrados se resuelven dos ecuaciones simultneamente. ECUACION PARA LA LINEA DE TENDENCIAS Y=na + bt
2

tY = at + bt Pero el mejor mtodo para para determinar a + b es


ntY-(Y)(t)

LA PENDIENTE b=_______________
nt2-(t)2

EL PUNTO DONDE N SE INTERCEPTA AL EJE Y


Y n t b

a=___ - b ____

Las ventas de una cadena de comestibles desde 2003 son los siguientes. ao ventas(y) t ty y 2003 7 1 7 1 2004 10 2 20 4 2005 9 3 27 9 2006 11 4 44 16 2007 13 5 65 25 total 50 15 163 55

Para simplificar los clculos se reemplaza los valores de formula. PENDIENTE LA CUAL ES.. 5(163)50(15) = 1.3
5(55)(15)

EL PUNTO DONDE 50 = - 1.3 15 = 6.1


SE INTERSEPTA 5 5

EL EJE Y La ecuacin de tendencia es y= 6.1 + 1.3t donde las ventas se expresan en millones de dlares.
Buscar

EDIT
FixFlowSkin powered by PmWiki

www.MiTecnologico.com

Politica de Privacidad _

FSICA PNDULO SIMPLE INTRODUCCIN Un pndulo es un objeto suspendido de un punto, de modo que puede oscilar. Es muy fcil construir un pndulo y con el se puede estudiar las propiedades que le pertenecen. Lo que se leer mas adelante consiste en un trabajo de fsica, el cual, da a conocer el estudio de las relaciones que existen entre el perodo de un pndulo:

Su masa Su amplitud Su largo DESCRIPCIN TERICA PERODO: Se define como el tiempo que se demora en realizar una oscilacin completa. Para determinar el perodo se utiliza la siguiente expresin T/ N de Osc. ( tiempo empleado dividido por el nmero de oscilaciones). FRECUENCIA: Se define como el nmero de oscilaciones que se generan en un segundo. Para determinar la frecuencia se utiliza la siguiente ecuacin N de Osc. / T ( nmero de oscilaciones dividido del tiempo) AMPLITUD: Se define como la mxima distancia que existe entre la posicin de equilibrio y la mxima altura. CICLO: Se define como la vibracin completa del cuerpo que se da cuando el cuerpo parte de una posicin y retorna al mismo punto. OSCILACIN: Se define como el movimiento que se realiza siempre al mismo punto fijo LEYES DEL PENDULO 1)El periodo de un pndulo es independiente de su amplitud. Esto significa que si se tienen 2 pendulos iguales (longitud y masa), pero uno de ellos tiene una asmplitud de recorrido

mayor que el otro, enambas condiciones la medida del periodo de estos pndulos es el mismo. 3) El periodo de un pndulo es directamente proporcional a la raz cuadrada de su longitud. Esto significa que el periodo de un pndulo puede aumentar o disminuir de acuerdo a la raz cuadrada de la longitud de ese pndulo. Pndulo Simple:Un pndulo simple se define como una partcula de masa m suspendida del punto O por un hilo inextensible de longitud l y de masa despreciable. Si la partcula se desplaza a una posicin 0 (ngulo que hace el hilo con la vertical) y luego se suelta, el pndulo comienza a oscilar.

El pndulo describe una trayectoria circular,un arco de una circunferencia de radio l. Estudiaremos su movimiento en la direccin tangencial y en la direccin normal. Las fuerzas que actan sobre la partcula de masa m son dos

Una fuerza vertical, el peso mg

La accin del hilo, una fuerza T en la direccin radial Descomponemos el peso en la accin simultnea de dos componentes, mgsenq en la direccin tangencial y mgcosq en la direccin radial. DESCRIPCIN DELEXPERIMENTO Amarrar el plomo al hilo de volantin Tomar las medidas segn la tabla(0.5m,1.0m,.4.5m,) Desplazar el plomo hasta cierto angulo Soltar el plomo y tomar el tiempo de 10 oscilaciones Anotarlos resultados en la tabla de datos MATERIALES 6 metros aproximadamente de hilo de volantin Un plomo de pescar de 50g Huincha de medir Cronmetro

Anlisis de los grficos 1)A medida que aumenta el largo del pndulo, aumenta su periodo 2)Su periodo no varia mucho desde distintas amplitudes 3)El Periodo2 del pndulo es proporcional al largo TABLA DE DATOS Largo (mt) 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 Tiempo (seg.) 15,32 20,63 24,99 30,05 31,8 34,93 36,1 39,3 Conclusin Desarrollando la experiencia del movimiento pendular hemos pdido verificar las leyes que rigen estel movimiento. Realizando nosotros mismos las experiencias necesarias. Estas leyes que fueron establecidas hace muchos aos, aun siguen vigentes como los primeros tiempos en que fueron escritas . Periodo T(seg.) 1.532 2.063 2.499 3.005 3.18 3.493 3.61 3.93 T2 (seg2) 2,347024 4,145296 6,245001 9,030025 10,1124 12,201049 13,0321 15,4449

Fundamentos fsicos
Un pndulo simple se define como una partcula de masa m suspendida del punto O por un hilo inextensible de longitud l y de masa despreciable. Si la partcula se desplaza a una posicin 0 (ngulo que hace el hilo con la vertical) y luego se suelta, el pndulo comienza a oscilar.

El pndulo describe una trayectoria circular, un arco de una circunferencia de radio l. Estudiaremos su movimiento en la direccin tangencial y en la direccin normal. Las fuerzas que actan sobre la partcula de masa m son dos

el peso mg La tensin T del hilo

Descomponemos el peso en la accin simultnea de dos componentes, mgsen en la direccin tangencial y mgcos en la direccin radial.

Ecuacin del movimiento en la direccin radial

La aceleracin de la partcula es an=v2/l dirigida radialmente hacia el centro de su trayectoria circular. La segunda ley de Newton se escribe man=T-mgcos Conocido el valor de la velocidad v en la posicin angular podemos determinar la tensin T del hilo. La tensin T del hilo es mxima, cuando el pndulo pasa por la posicin de equilibrio, T=mg+mv2/l Es mnima, en los extremos de su trayectoria cuando la velocidad es cero, T=mgcos0

Principio de conservacin de la energa

En la posicin =0 el pndulo solamente tiene energa potencial, que se transforma en energa cintica cuando el pndulo pasa por la posicin de equilibrio.

Comparemos dos posiciones del pndulo: En la posicin extrema =0, la energa es solamente potencial. E=mg(l-lcos0) En la posicin , la energa del pndulo es parte cintica y la otra parte potencial

La energa se conserva v2=2gl(cos-cos0) La tensin de la cuerda es T=mg(3cos-2cos0) La tensin de la cuerda no es constante, sino que vara con la posicin angular . Su valor mximo se alcanza cuando =0, el pndulo pasa por la posicin de equilibrio (la velocidad es mxima). Su valor mnimo, cuando =0 (la velocidad es nula).

Ecuacin del movimiento en la direccin tangencial

La aceleracin de la partcula es at=dv/dt. La segunda ley de Newton se escribe mat=-mgsen La relacin entre la aceleracin tangencial at y la aceleracin angular es at= l. La ecuacin del movimiento se escribe en forma de ecuacin diferencial

(1)

Medida de la aceleracin de la gravedad


Cuando el ngulo es pequeo entonces, sen , el pndulo describe oscilaciones armnicas cuya ecuacin es

=0sen( t+ )
de frecuencia angular 2=g/l, o de periodo

La ley de la gravitacin de Newton describe la fuerza de atraccin entre dos cuerpos de masas M y m respectivamente cuyos centros estn separados una distancia r. La intensidad del campo gravitatorio g, o la aceleracin de la gravedad en un punto P situado a una distancia r del centro de un cuerpo celeste de masa M es la fuerza sobre la unidad de masa g=F/m colocada en dicho punto.

su direccin es radial y dirigida hacia el centro del cuerpo celeste. En la pgina dedicada al estudio del Sistema Solar, proporcionamos los datos relativos a la masa (o densidad) y radio de los distintos cuerpos celestes. Ejemplo: Marte tiene un radio de 3394 km y una masa de 0.11 masas terrestres (5.981024 kg). La aceleracin g de la gravedad en su superficie es

Tenemos dos procedimientos para medir esta aceleracin

Cinemtica

Se mide con un cronmetro el tiempo t que tarda en caer una partcula desde una altura h. Se supone que h es mucho ms pequea que el radio r del cuerpo celeste.

Oscilaciones

Se emplea un instrumento mucho ms manejable, un pndulo simple de longitud l. Se mide el periodo de varias oscilaciones para minimizar el error de la medida y se calculan el periodo P de una oscilacin. Finalmente, se despeja g de la frmula del periodo. De la frmula del periodo establecemos la siguiente relacin lineal.

Se representan los datos "experimentales" en un sistema de ejes:


P2/(42) en el eje vertical y La longitud del pndulo l en el eje horizontal.

La pendiente de la recta es la inversa de la aceleracin de la gravedad g.

Agregar a favoritos

Invitar a un amigo

Ayuda

Portugus

Regstrese! | Iniciar sesin Monografas Nuevas Publicar Blogs Foros Busqueda avanzada Principio del formulario
Buscar

Final del formulario Buscar ms trabajos sobre... + Matematicas Monografias.com > Matematicas Descargar Imprimir Comentar

Ver trabajos relacionados Mtodos lineales y estimacin por mnimos cuadrados Enviado por victor_j_mata Anuncios Google Pregunte al Profesor 5 Profesores estn en lnea ahora. Pregunte y obtenga su respuesta ya! JustAnswer.es/Matemticas Proyecto Pelcula Video Envulvete y somete tu video. La audiencia puede ser de millones. firefoxflicks.mozilla.org Tus deberes gratis Resolvemos 1000 tareas cada da! Rpido y gratis Misdeberes.es

Introduccin Mtodos de los mnimos cuadrados Error estndar en la estimacin Coeficiente de determinacin Coeficiente de correlacin Regresin lineal mltiple Estimacin de los coeficientes Inferencias en la regresin lineal mltiple Prediccin Correlacin Bibliografa

INTRODUCCIN El presente trabajo forma parte de los objetivos y contenidos de aprendizaje de la ctedra ESTADSTICA, que pretende desarrollar las habilidades para la utilizacin de los mtodos lineales y estimacin de mnimos cuadrados.

Para lograr este fin, se realizo la consulta de una bibliografa bsica la cual permiti desarrollar los conceptos y ejemplos, como base para realizar una exposicin adecuada en el saln de clases. En este trabajo bsicamente se habla de cmo desarrollar la aplicacin de los mtodos lineales y estimacin por mnimos cuadrados, adems de inferencia, prediccin y correlacin. Se desarrollaron una serie de ejemplos mediante los cuales se trata de presentar manera mas sencilla usar estos mtodos. El Equipo # 4

Mtodos de mnimos cuadrados. El procedimiento mas objetivo para ajustar una recta a un conjunto de datos presentados en un diagrama de dispersin se conoce como "el mtodo de los mnimos cuadrados". La recta resultante presenta dos caractersticas importantes: 1. Es nula la suma de las desviaciones verticales de los puntos a partir de la recta de ajuste (Y - Y) = 0. 2. Es mnima la suma de los cuadrados de dichas desviaciones. Ninguna otra recta dara una suma menor de las desviaciones elevadas al cuadrado (Y - Y) 0 (mnima). El procedimiento consiste entonces en minimizar los residuos al cuadrado Ci Re emplazando nos queda

La obtencin de los valores de a y b que minimizan esta funcin es un problema que se puede resolver recurriendo a la derivacin parcial de la funcin en trminos de a y b: llamemos G a la funcin que se va a minimizar:

Tomemos las derivadas parciales de G respecto de a y b que son las incgnitas y las igualamos a cero; de esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del modelo

que pueden ser resueltas por cualquier mtodo ya sea igualacin o matrices para obtener los valores de a y b.

Derivamos parcialmente la ecuacin respecto de a

Primera ecuacin normal

Derivamos parcialmente la ecuacin respecto de b

Segunda ecuacin normal

Los valores de a y b se obtienen resolviendo el sistema de ecuaciones resultante. Veamos el siguiente ejemplo: En un estudio econmico se desea saber la relacin entre el nivel de instruccin de las personas y el ingreso. EJEMPLO 1 Se toma una muestra aleatoria de 8 ciudades de una regin geogrfica de 13 departamentos y se determina por los datos del censo el porcentaje de graduados en educacin superior y la mediana del ingreso de cada ciudad, los resultados son los siguientes: CIUDAD : 1 2 3 4 5 6 7 8 % de (X) Graduados : 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2 Ingreso (Y) Mediana : 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (0000)

Tenemos las ecuaciones normales

y = na + bx xy = ax + bx

Debemos encontrar los trminos de las ecuaciones y, x, xy, x Por tanto procedemos de la siguiente forma:

XY

4.2 4.9 7.0

7.2 6.7

30.24 51.84 32.83 44.89

17.0 119.00 289.00

6.2 3.8 7.6 4.4 5.4 43.5

12.5 77.50 156.25 6.3 23.94 39.69

23.9 181.64 571.21 6.0 26.40 36.00

10.2 55.08 104.04 89.8 546.63 1292.92

Sustituyendo en las ecuaciones los resultados obtenidos tenemos: 43.50 = 8a + 89.8b 546.63 = 89.8a + 1292.92b multiplicamos la primera ecuacin por (-89.8) y la segunda por (8) as: 43.50 = 8a + 89.8b (-89.8) 546.63 = 89.8a + 1292.92b (8) -3906.30 = -718.4a - 8064.04b 4373.04 = 718.4a + 10343.36b 466.74 = -0- 2279.32b

Este valor de b lo reemplazamos en cualquiera de las ecuaciones para obtener a as:

Reemplazando b = 0.20477 en la primera ecuacin normal

43.5 = 8a + 89.8 (0.20477) 43.5 = 8a + 18.3880 43.5 - 18.3880 = 8a 25.1120 = 8a

Tenemos entonces que los coeficientes de regresin son : a = 3.139 y b = 0.20477. Por tanto la ecuacin de regresin nos queda:

Significa entonces que por cada incremento en una unidad en X el valor de 0.20477

se aumenta en

Esta ecuacin permite estimar el valor de para cualquier valor de X, por ejemplo: Una ciudad que tiene un porcentaje de graduados a nivel superior del 28% la mediana de ingreso para la ciudad ser:

Los valores a y b tambin se pueden obtener de la siguiente forma: partiendo de las ecuaciones normales tenemos:

Si dividimos todos los trminos de la ecuacin (1) entre n nos queda:

Tenemos entonces que el primer termino es termino es la incgnita b multiplicada por

el segundo termino es la incgnita a y el tercer por tanto nos queda:

entonces

Reemplazando a en la ecuacin (2) tenemos

a = 5.4375 0.20477 (11.2250) = 5.4375 2.2985 = 3.139 Se debe tener presente la diferencia entre el valor de obtenido con la ecuacin de regresin

y el valor de Y observado. Mientras es una estimacin y su bondad en la estimacin depende de lo estrecha que sea la relacin entre las dos variables que se estudian; Y es el valor efectivo, verdadero obtenido mediante la observacin del investigador. En el ejemplo Y es el valor mediano del ingreso que obtuvo el investigador

utilizando todos los ingresos observados en cada ciudad y es el valor estimado con base en el modelo lineal utilizado para obtener la ecuacin de regresin Los valores estimados y observados pueden no ser iguales por ejemplo la primera ciudad tiene un ingreso mediano observado de Y = 4.2 al reemplazar en la ecuacin el porcentaje de graduados obtenemos un estimado de

Grficamente lo anterior se puede mostrar as:

Claramente se observa en la grfica que hay una diferencia entre el valor efectivo de Y y el valor estimado; esta diferencia se conoce como error en la estimacin, este error se puede medir. A continuacin se ver el procedimiento. Error estndar en la estimacin El error estndar de la estimacin designado por sYX mide la disparidad "promedio" entre los valores observados y los valores estimados de . Se utiliza la siguiente formula.

Debemos entonces calcular los valores de para cada ciudad sustituyendo en la ecuacin los valores de los porcentajes de graduados de cada ciudad estudiada.

4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4

7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2

4.6 4.5 6.6 5.7 4.4 8.0 4.4 5.2

-0.4 0.4 0.4 0.5 -0.6 -0.4 0.0 0.2

0.16 0.16 0.16 0.25 0.36 0.16 0.00 0.04 1.29

Syx = 0.46 (decenas de miles $)

Como esta medida trata de resumir la disparidad entre lo observado y lo estimado, es decir, trata de medir la diferencia promedio entre lo observado y lo estimado esperado de acuerdo al modelo, puede considerarse como un indicador del grado de precisin con que la ecuacin de regresin, describe la relacin entre las dos variables. Este error estndar se ve afectado por las unidades y sus cambios ya que es una medida absoluta, pues, se da en la misma unidad

de medida que esta dada la variable Y; en el ejemplo 0.46 sern decenas de miles de pesos, razn por la cual no es posible comparar con las relaciones de variables dadas en distinta unidad de medida. Es necesario entonces calcular una medida que interprete o mida mejor el grado de relacin entre las variables.

Coeficiente de determinacin. El cambio de la variable Y generalmente depende de muchos factores, en ocasiones, difciles de identificar; con el modelo lineal simple, slo tenemos presente uno. Por ejemplo, en nuestro caso la mediana del ingreso depende no slo del porcentaje de graduados en el nivel superior, que es, el factor que tenemos presente, pueden entrar a jugar factores tales como, la distribucin de la edad en la poblacin, la distribucin por sexo en la poblacin, la industrializacin de la ciudad, el numero de universidades y muchos otros. El coeficiente de determinacin mide o interpreta la cantidad relativa de la variacin que ha sido explicada por la recta de regresin, es decir, la proporcin de cambio en Y explicado por un cambio en la variable X ( X es el factor que se utiliza para calcular la recta de ajuste o ecuacin de regresin, en el ejemplo es el porcentaje de graduados en el nivel superior en cada ciudad). Para el ejemplo el Coeficiente de determinacin va a medir la proporcin del cambio en el ingreso mediano de cada ciudad, debido o explicado por un cambio en el porcentaje de graduados en el nivel superior. Veamos algunos componentes de la variabilidad en el anlisis de regresin: La diferencia entre cada valor de Y observado y media se denomina variacin de Y.

La diferencia entre estimado y media , es la variacin tenida en cuenta por la ecuacin de regresin, razn por la cual se denomina variacin explicada de Y.

La diferencia entre Y observado y estimado, son variaciones consideradas debidas a factores diferentes al tenido presente por la ecuacin de regresin por eso se llama: variacin no explicada de Y.

La diferencia entre Y observado y estimado, son variaciones consideradas debidas a factores diferentes al tenido presente por la ecuacin de regresin por eso se llama: variacin no explicada de Y.

La sumatoria de las diferencias en cada una de las formas de variacin la podemos representar as:

Grficamente esta relacin se puede representar as:

Se dijo anteriormente, que el coeficiente de determinacin es la proporcin de cambio explicado en Y, por cambio en X, es decir, la proporcin que representa la variacin explicada de la variacin total. Recuerde una proporcin es la relacin de una parte con el total, por tanto, el coeficiente de determinacin ser:

En otras palabras el coeficiente de determinacin es la relacin entre la variacin explicada y la variacin total. Su valor siempre estar Para su calculo se procede as:

4.2 4.9 7.0 6.2

5.44 5.44 5.44 5.44

-1.24 -1.24 1.56 0.76

1.54 0.29 2.43 0.58

4.6 4.5 6.6 5.7

-0.84 -0.84 1.16 0.26

0.71 0.88 1.35 0.07

-0.4 0.4 0.4 0.5

0.16 0.16 0.16 0.25

3.8 7.6 4.4 5.4

5.44 5.44 5.44 5.44

1.64 2.16 1.04 0.4

2.69 4.66 1.08 0.001

4.4 8.0 4.4 5.2

-1.04 2.56 -1.04 -0.24

1.08 6.55 1.08 0.06

-0.6 -0.4 0.0 0.2

0.36 0.16 0.00 0.04

43.5

13.271

11.78

1.29

Generalmente esta proporcin se expresa como porcentaje por tanto podemos decir que

r = 88.76%

como conclusin podemos decir que el 88.76% de la variacin en el ingreso mediano de las ciudades de la muestra esta relacionada o explicada por la variacin en el porcentaje de graduados en educacin Superior en cada ciudad.

Coeficiente de correlacin Este Coeficiente como ya se dijo mide la fuerza de la relacin entre las variables. El coeficiente tiene el signo que tiene b y su valor estar El signo menos en el ndice significa una relacin negativa y un signo ms una correlacin positiva. El coeficiente se obtiene sacando la raz cuadrada al coeficiente de determinacin y se simboliza con "r".

En este caso el coeficiente r tiene signo positivo ya que toma el valor de b obtenido con las ecuaciones normales toma valor positivo. A continuacin se da, a modo de orientacin , como podran interpretarse los valores de r (positivo o negativo)

0.0 0.2 0.4 0.7 0.9

a a a a a

0.2 0.4 0.7 0.9 1.0

Correlacin muy dbil, despreciable Correlacin dbil. bajo Correlacin moderada Correlacin fuerte, alto, importante Correlacin muy fuerte, muy alto

La correlacin entre los valores de dos variables es un hecho. El que lo consideremos satisfactorio o no, depende de la interpretacin. Otro problema que representa la correlacin es cuando se pregunta si una variable, de algn modo causa o determina a la otra. La correlacin no implica causalidad. Si las variables X e Y estn correlacionadas, esto puede ser por que X causa a Y, o porque Y causa a X o porque alguna otra variable afecta tanto a X como Y, o por una combinacin de todas estas razones; o puede ser que la relacin sea una coincidencia.

Modelo de regresin lineal con el uso de matrices. Al ajustar un modelo de regresin lineal mltiple, en particular cuando el nmero de variables pasa de dos, el conocimiento de la teora matricial puede facilitar las manipulaciones matemticas de forma considerable. Suponga que el experimentador tiene k variables independientes x1, x2,....,xk, y n observaciones y1, y2,...., yn, cada una de las cuales se pueden expresar por la ecuacin yi = b 0 + b 1x1i +b 2x2i +.+ b kxki +e i

Este modelo en esencia representa n ecuaciones que describen cmo se generan los valores de respuesta en el proceso cientfico. Con el uso de la notacin matricial, podemos escribir la ecuacin y=Xb + e donde

Entonces la solucin de mnimos cuadrados para la estimacin de b que se ilustra en la seccin Estimacin de coeficientes, "Regresin lineal mltiple" implica encontrar b para la que SSE = (y - Xb)'(y - Xb) se minimiza. Este proceso de minimizacin implica resolver para b en la ecuacin

No presentaremos los detalles relacionados con las soluciones de las ecuaciones anteriores. El resultado se reduce a la solucin de b en (X'X)b = X'y

Ntese la naturaleza de la matriz X. Aparte del elemento inicial, el i-simo rengln representa los valores x que dan lugar a la respuesta yi. Al escribir

las ecuaciones normales se pueden escribir en la forma matricial AB=g Si la matriz A es no singular, podemos escribir la solucin para el coeficiente de regresin como b = A-1g =(XX)-1Xy De esta forma se puede obtener la ecuacin de prediccin o la ecuacin de regresin al resolver un conjunto de k + 1 ecuaciones con un nmero igual de incgnitas. Esto implica la inversin de la matriz X'X de k + 1 por k + 1. Las tcnicas para invertir esta matriz se explican en la mayora de los libros de texto sobre determinantes y matrices elementales. Por supuesto, se dispone de muchos paquetes de computadora de alta velocidad para problemas de regresin mltiple, paquetes que no slo imprimen estimaciones de los coeficientes de regresin, sino que tambin proporcionan otra informacin relevante para hacer inferencias respecto a la ecuacin de regresin. Ejemplo 1 Se midi el porcentaje de sobrevivencia de cierto tipo de semen animal, despus del almacenamiento, en varias combinaciones de concentraciones de tres materiales que se utilizan para aumentar su oportunidad de sobrevivencia. Los datos son los siguientes:

y(% sobrevivencia) x1(peso %) x2(peso %) x3(peso %) 25,5 31,2 25,9 38,4 18,4 26,7 26,4 25,9 32 25,2 1,74 6,32 6,22 10,52 1,19 1,22 4,10 6,32 4,08 4,15 5,30 5,42 8,41 4,63 11,60 5,85 6,62 8,72 4,42 7,60 10,80 9,40 7,20 8,50 9,40 9,90 8 9,10 8,70 9,20

39,7 35,7 26,5

10,15 1,72 1,70

4,83 3,12 5,30

9,40 7,60 8,20

Estime el modelo de regresin lineal mltiple para los datos dados. SOLUCIN: Las ecuaciones de estimacin de mnimos cuadrados, (X'X)b = X'y, son

= De los resultados de una computadora obtenemos los elementos de la matriz inversa

y despus, con el uso de la relacin b = (XX)-1 Xy, los coeficientes estimados de regresin son b0= 39.1574, b1 = 1.0161, b2 = -1.8616, b3 = -0.3433. De aqu nuestra ecuacin de regresin estimada es

Para el caso de una sola variable independiente, el grado del polinomio de mejor ajuste a menudo se puede determinar al graficar un diagrama de dispersin de los datos que se obtienen de un experimento que da n pares de observaciones de la forma {(xi, yi); i = 1, 2, .... n}.

= Al resolver estas r + 1 ecuaciones, obtenemos las estimaciones b0, b1,....., br y por ello generamos la ecuacin de prediccin de regresin polinomial

El procedimiento para ajustar un modelo de regresin polinomial se puede generalizar al caso de ms de una variable independiente. De hecho, el estudiante de anlisis de regresin debe, en esta etapa, tener la facilidad para ajustar cualquier modelo lineal en, digamos, k variables independientes. Suponga, por ejemplo, que tenemos una respuesta Y con k = 2 variables independientes y se postula un modelo cuadrtico del tipo yi = b 0 + b 1x1i + b 2x2i +b 11x21i+ b 22x22i+b 12x1i x2i+e I donde yi, i = 1, 2, ..., n, es la respuesta para la combinacin (x1i, x2i) de las variables independientes en el experimento. En esta situacin n debe ser al menos 6, pues hay seis parmetros a estimar mediante el procedimiento de mnimos cuadrados. Adems, como el modelo contiene trminos cuadrticos en ambas variables, se deben usar al menos tres niveles de cada variable. El lector debe verificar con facilidad que las ecuaciones normales de mnimos cuadrados (X'X)b = X'y estn dadas por:

Ejemplo 2 Los siguientes datos representan el porcentaje de impurezas que ocurren a varias temperaturas y tiempos de esterilizacin durante una reaccin asociada con la fabricacin de cierta bebida.

Tiempo de esterilizacin, x2 (min) Temperatura, x1 (C) 75 15 14.05 14.93 100 10.55 9.48 125 7.55 6.59

20

16.56 15.85

13.63 11.75

9.23 8.78

25

22.41 21.66

18.55 17.98

15.93 16.44

Estimar los coeficientes de regresin en el modelo m Y|x = b 0 + b 1 x1 +b 2 x2+b 11 x12+b 22 x22+ ..+ b 12 x1 x2 SOLUCIN: b0 = 56,4668 b1 = -0,36235 b2 = -2,75299 b11 =0,00081 b22 = 0,08171 b12 = 0,00314

y nuestra ecuacin de regresin estimada es

Muchos de los principios y procedimientos asociados con la estimacin de funciones de regresin polinomial caen en la categora de la metodologa de respuesta superficial, un conjunto de tcnicas que los cientficos e ingenieros han utilizado con bastante xito en muchos campos. Problemas como la seleccin de un diseo experimental apropiado, en particular para casos donde hay un nmero grande de variables en el modelo, y la eleccin de las condiciones "ptimas" de operacin sobre x1,x2,.....,xk a menudo se aproximan a travs del uso de estos mtodos. Para una exposicin ms amplia se remite al lector a Response Surface Methodology: Process and Product Optimization Using Designed Experiments de Myers y Montgomery. Regresin lineal mltiple. En la mayor parte de los problemas de investigacin donde se aplica el anlisis de regresin se necesita ms de una variable independiente en el modelo de regresin. La complejidad de la mayor parte de los mecanismos cientficos es tal que para ser capaces de predecir una respuesta importante se necesita un modelo de regresin mltiple. Cuando este modelo es lineal en los coeficientes se denomina modelo de regresin lineal mltiple. Para el caso de k variables independientes X1, X2,....,Xk, la media de Y| X1, X2,....,XK est dada por el modelo de regresin lineal mltiple m Y|x1, x2 ,, xk = b 0 + b 1 x1 +..+ b k xk

y la respuesta estimada se obtiene de la ecuacin de regresin de la muestra

donde cada coeficiente de regresin b i se estima por bi de los datos de la muestra con el uso del mtodo de mnimos cuadrados. Como en el caso de una sola variable independiente, el modelo de regresin lineal mltiple a menudo puede ser una representacin adecuada de una estructura ms complicada dentro de ciertos rangos de las variables independientes. Tcnicas de mnimos cuadrados similares tambin se pueden aplicar al estimar los coeficientes cuando el modelo lineal involucra, digamos, potencias y productos de las variables independientes. Por ejemplo, cuando k = 1, el experimentador puede pensar que las medias m Y|x1 no caen en una lnea recta pero que se describen de forma ms apropiada con el modelo de regresin polinomial

m Y|x = b 0 + b 1 x +b 2 x2+ ..+ b r xr

y la respuesta estimada se obtiene de la ecuacin de regresin polinomial

En ocasiones surge confusin cuando hablamos de un modelo polinomial como de un modelo lineal. Sin embargo, los estadsticos por lo general se refieren a un modelo lineal como uno en el cual los parmetros ocurren linealmente, sin importar cmo entran las variables independientes al modelo. Un ejemplo de un modelo no lineal es la relacin exponencial m Y|x = a b x, que se estima con la ecuacin de regresin

Existen muchos fenmenos en la ciencia y en la ingeniera que son inherentemente no lineales por naturaleza y, cuando se conoce la estructura real, desde luego se debe hacer un intento para ajustar el modelo presente. La literatura sobre estimacin por mnimos cuadrados de modelos no lineales es voluminosa. El estudiante que quiera una buena explicacin de algunos aspectos de este tema debe consultar Classical and Modern Regression with Applications de Myers.

Estimacin de los coeficientes. En esta seccin obtenemos los estimadores de mnimos cuadrados de los parmetros b 0 + b 0, b 1,...., b k mediante el ajuste del modelo de regresin lineal mltiple

m Y|x1 , x2,......, xk = b 0 + b 1x1+ b 2x2+ b kxk

a los puntos de datos i= 1,2,....,n y n >k }, donde yi es la respuesta observada para los valores x1i, x2i,........., xki, de las k variables independientes x1 , x2,......, xk .Cada observacin (x1i, x2i,......,xki, yi) satisface la ecuacin

yi = b 0 + b 1x1i +b 2x2i +.+ b kxki +e i o yi = b0 + b1x1i +b2x2i +.+ bkxki +ei, donde e i y ei son el error aleatorio y residual, respectivamente, asociados con la respuesta yi . Al utilizar el concepto de mnimos cuadrados para llegar a las estimaciones b0, b1,..., bk, minimizamos la expresin

Al diferenciar SSE a su vez con respecto a b0,b1, b2,......,bk, e igualar a cero, generamos un conjunto de k + 1 ecuaciones normales

Estas ecuaciones se pueden resolver para b0, b1,b2, ..., bk mediante cualquier mtodo apropiado para resolver sistemas de ecuaciones lineales. Ejemplo 1 Se realiz un estudio sobre un camin de reparto ligero a diesel para ver si la humedad, temperatura del aire y presin baromtrica influyen en la emisin de xido nitroso (en ppm).

Las mediciones de las emisiones se tomaron en diferentes momentos, con condiciones experimentales variantes. Los datos son los siguientes:

xido nitroso, y 0,90 0,91 0,96 0,89 1,00 1,10 1,15 1,03 0,77 1,07

Humedad Temperatura x1 x2

Presin x3

xido nitroso y

Humedad Temperatura x1 x2

Presin x3

72,4 41,6 34,3 35,1 10,7 12,9 8,3 20,1 72,2 24,0

76,3 70,3 77,1 68,0 79,0 67,4 66,8 76,9 77,7 67,7

29,18 29,35 29,24 29,27 29,78 29,39 29,69 29,48 29,09 29,60

1,07 0,94 1,10 1,10 1,10 0,91 0,87 0,78 0,82 0,95

23,2 47,4 31,5 10,6 11,2 73,3 75,4 96,6 107,4 54,9

76,8 86,6 76,9 86,3 86,0 76,3 77,9 78,7 86,8 70,9

29,38 29,35 29,63 29,56 29,48 29,40 29,28 29,29 29,03 29,37

El modelo es: m Y|x1, x2, x3 = b 0 + b 1 x1 + b 2 x2 +..+ b 3 x3 Ajuste este modelo de regresin lineal mltiple a los datos dados y despus estime la cantidad de xido nitroso para las condiciones donde la humedad es 50%, la temperatura 76F y la presin baromtrica 29,30.

SOLUCIN Para las ecuaciones normales encontramos que

La solucin de este conjunto de ecuaciones da las estimaciones nicas b0 = -3.507778, b1= -0.002625, b2= 0.000799, b3= 0.154155. Por tanto, la ecuacin de regresin es

Para 50% de humedad, una temperatura de 76 F y una presin baromtrica 29,30, la cantidad estimada de xido nitroso es

Regresin polinomial. Suponga ahora que deseamos ajustar la ecuacin polinomial m Y|x = b 0 + b 1 x +b 2 x2+ ..+ b r xr a los n pares de observaciones {(xi, yi); i = 1,2,..., n}. Cada observacin, yi satisface la ecuacin yi = b 0 + b 1xi +b 2xi2+ ..+ b r xi2+e i o yi = b0 + b1xi +b2xi2+ ..+ br xir+ei donde r es el grado del polinomio, y e i, y ei son de nuevo el error aleatorio y residual asociados con la respuesta yi. Aqu, el nmero de pares, n, debe ser al menos tan grande como r + 1, el nmero de parmetros a estimar. Ntese que el modelo polinomial se puede considerar como un caso especial del modelo de regresin lineal mltiple ms general, donde hacemos x1 = x, x2 = x2, ..., xr. = xr. Las ecuaciones normales toman la forma:

que se resuelve como antes para b0, b1,.........., br

Ejemplo 2 Dados los datos x y 0 1 2 3 4 5 6 7 8 9

9,1 7,3 3,2 4,6 4,8 2,9 5,7 7,1 8,8 10,2

Ajustar una curva de regresin de la forma m Y|x = b 0 + b 1 x +b 2 x2 y despus estime m Y|x

SOLUCIN:

De los datos dados, encontramos que

Al resolver las ecuaciones normales obtenemos b0=8,697 , b1=-2,341, b2= 0,288 Por tanto:

Inferencias en la regresin lineal mltiple. Una de las inferencias ms tiles que se pueden hacer con respecto a la calidad de la respuesta pronosticada y0 que corresponde a los valores x10, x20,...., xk0, es el intervalo de confianza sobre la respuesta media m | x10, x20,...., xk0 . Nos interesa construir un intervalo de confianza sobre la respuesta media para el conjunto de condiciones dado por

X0 = *x10, x20,...., xk0+ Aumentamos las condiciones sobre las x por el nmero 1 a fin de facilitar el uso de la notacin matricial. Como en el caso k = 1 si hacemos la suposicin adicional de que los errores son independientes y se distribuyen de forma normal, entonces las Bj son normales, con media, varianzas y convarianzas.

tambin est normalmente distribuida y es, de hecho, un estimador insesgado para la respuesta media sobre el que intentamos unir los intervalos de confianza. La varianza de escrita en notacin matricial simplemente como funcin de condicin x0, es , (X'X)1, y el vector de

Si esta expresin se expande para un caso dado, digamos k = 2, se ve fcilmente que explica de manera apropiada las varianzas y covarianzas de las Bi. Despus de reemplazar por s2, el intervalo de confianza de 100(1 )% sobre m | x10, x20,...., xk0 . se puede construir a partir de la estadstica:

que tiene una distribucin t con n k 1 grados de libertad.

Intervalo Un intervalo de confianza de (1 )100% para la respuesta media m | x10, x20,...., de xk0 es confianz a para: m | x10, x20,...., xk0 donde ta /2 es un valor de la distribucin t con n-k grados de libertad.

La cantidad a menudo se llama error estndar de prediccin y por lo general aparece en el impreso de muchos paquetes de regresin para computadora.

Ejemplo 1

Con el uso de los datos del ejemplo 1 correspondiente al "Modelo de regresin lineal con el uso de matrices", construya un intervalo de confianza de 95% para la respuesta media cuando x1 = 3%, x2 = 8%, y x3 = 9%. SOLUCIN De la ecuacin de regresin del ejemplo 1 correspondiente al "Modelo de regresin lineal con el uso de matrices", el porcentaje estimado de sobrevivencia cuando x1 = 3%, x2 = 8%, y x3 = 9% es

A continuacin encontramos que:

Con el uso del cuadrado medio del error, s2 = 4.298 o s = 2.073, y de la tabla A.4, vemos que t0.025 = 2.262 para 9 grados de libertad. Por tanto, un intervalo de confianza de 95% para el porcentaje medio de sobrevivencia para x1 = 3%, x2 = 8%, y x3= 9% est dado por

o simplemente . Como en el caso de la regresin lineal simple, necesitamos hacer una clara distincin entre el intervalo de confianza de la respuesta media y el intervalo de prediccin sobre una respuesta observada. Esta ltima proporciona un lmite dentro del cual podemos decir con un grado de certeza preestablecido que caer una nueva respuesta observada. Un intervalo de prediccin para una sola respuesta pronosticada considerar las diferencias de la variable aleatoria . se establece de nuevo al

Se puede mostrar que la distribucin muestral es normal con media

y varianza

De esta manera el intervalo de prediccin de (1 )100% para un solo valor de prediccin y0 se puede construir a partir de la estadstica

que tiene una distribucin t con n k 1 grados de libertad.

Intervalo de prediccin para y0

Un intervalo de prediccin de (1-)100% para una sola respuesta y0 est dado por:

donde t/2 es un valor de la distribucin t con n k 1 grados de libertad.

Ejemplo 2 Con el uso de los datos del ejemplo 1 correspondiente a el tema "Modelo de regresin lineal con el uso de matrices" construya un intervalo de prediccin de 95% para una respuesta individual del porcentaje de sobrevivencia cuando x1 = 3%, x2 = 8%, y x3 = 9%. SOLUCIN: Con referencia a los resultados del ejemplo 1 de esta seccin, encontramos que el intervalo de prediccin de 95% para la respuesta y0 cuando x1= 3%, x2 = 8%, y x3 = 9% es

que se reduce a . Ntese, como se espera, que el intervalo de prediccin es considerablemente menos estrecho que el intervalo de confianza para el porcentaje de sobrevivencia media en el ejemplo 1. Un conocimiento de las distribuciones de los estimadores de los coeficientes individuales permite al experimentador construir intervalos de confianza para los coeficientes y probar hiptesis acerca de ellos.

De esta manera podemos utilizar la estadstica

con n k 1 grados de libertad para probar las hiptesis y construir intervalos de confianza sobre j. Por ejemplo, si deseamos probar:

calculamos la estadstica:

y no rechazamos H0 si Ejemplo 3

donde

tiene n k 1 grados de libertad.

Para el modelo del ejemplo 1 correspondiente al "Modelo de regresin lineal con el uso de matrices", pruebe la hiptesis de que 2 = -2,5 en el nivel de significancia 0.05 contra la alternativa de que 2> -2,5. SOLUCIN: Clculos:

Decisin : rechazar H0 y concluir que 2> -2,5

PREDICCION. Existen varias razones para construir una regresin lineal. Una, por supuesto, es predecir valores de respuesta a uno o mas valores de la variable independiente. En este aparte nos enfocamos en los errores asociados con la prediccin. La ecuacin = a +bx se puede usar para predecir o estimar la respuesta media yx en x = xo no es necesariamente uno de los valores preseleccionados, o se puede utilizar para predecir un solo valor o de la variable Yo cuando x = xo. Esperaramos que el error de prediccin fuese

mas alto en el caso de un solo valor predicho en el caso donde se predice una media. Esto, entonces, afectara el ancho de nuestros intervalos para valores que se predicen. Suponga que el experimentador desea construir un intervalo de confianza para yx. Utilizaremos el estimador puntual o = A + Bxo para estimar yx = .a + b c o se puede mostrar que la distribucin muestral de o es normal con media:

Y varianza: La ultima se sigue del hecho que Cov(, B) = 0. De esta forma el intervalo de confianza de (1 - a )100% sobre la respuesta media yx .Se puede construir a partir de la estadstica :

Que tiene una distribucin t con n 2 grados de libertad

Intervalo de confianza para yx:.

CORRELACION. Hasta este punto hemos supuesto que la variable de regresin independiente x es una variable fsica o cientfica pero no una variable aleatoria. De hecho, en este contexto , x a menudo se llama variable matemtica, que, en el proceso de muestreo, se mide con un error insignificante. En muchas aplicaciones de las tcnicas de regresin es mas realista suponer que X y Y son variables aleatorias y que las mediciones {(Xi, Yi) ; i= 1, 2, ..., n} son observaciones de una poblacin que tiene la funcin de densidad conjunta f(x, y). Consideremos el problema de medir la relacin entre las dos variables X y Y. Por ejemplo, si X y Y representan la longitud y circunferencia de una clase particular de hueso en el cuerpo de un adulto, podemos realizar un estudio antropolgico para determinar si los valores grandes de X se asocian con valores

grandes de Y, y viceversa. El anlisis de correlacin intenta medir la fuerza de tales relaciones entre dos variables por medio de un solo numero llamado coeficiente de correlacin.

En teora a menudo se supone que la distribucin condicional f(y x) de Y, para valores fijos de X, es normal con una media yx = a + b c o y varianza s yx = s y X tambin se distribuye con normalmente con x y varianza s x. La densidad conjunta de X y Y es entonces: Donde X es ahora una variable aleatoria independiente del error aleatorio E. Como la media del error aleatorio E es cero, se sigue que:

Al sustituir para a y s en la expresin anterior para f( x, y), obtenemos la distribucin normal bivariada:

La constante r (rho) se llama coeficiente de correlacin poblacional y juega un papel importante en muchos problemas de anlisis de datos de dos variables. El valor de r es 0 cuando b = 0 , que resulta cuando en esencia no hay una regresin lineal; es decir, la lnea de regresin es horizontal y cualquier conocimiento de X no es de utilidad para predecir Y. Como debemos tener s y s , y r 1 por ello -1 r 1. Los valores de r = 1 solo ocurren cuando s = 0, en cuyo caso tenemos una relacin lineal perfecta entre las dos variables. de esta manera un valor de r igual a +1 implica una relacin lineal perfecta con una pendiente positiva, mientras que un valor de r igual a 1 resulta de una relacin lineal perfecta con pendiente negativa. Se puede decir entonces que las estimaciones mustrales de r cercanas a la unidad

en magnitud implican una buena correlacin o una asociacin lineal entre X y Y, mientras que valores cercanos a cero indican poca o ninguna correlacin.

Se debe sealar que en estudios de correlacin, como en problemas de regresin lineal, los resultados que se obtienen solo son tan buenos como el modelo que se supone. En las tcnicas de correlacin que aqu se estudian se supone una densidad normal bivariada para las variables X y Y, con el valor medio de Y en cada valor x linealmente relacionado con x. Para observar la conveniencia de la suposicin de linealidad, a menudo es til una graficacin preliminar de los datos experimentales. Un valor del coeficiente de correlacin muestral cercano a cero resultara de datos que muestren un efecto estrictamente aleatorio como se indica en la figura a :

en donde se puede observar poca o ninguna relacin causal. Es importante recordar que el coeficiente de correlacin entre dos variables es una media de su relacin lineal, y que un valor de r* = 0 implica una falta de linealidad y no una falta de asociacin. Por ello, si existe una fuerte relacin cuadrtica entre X y Y como se indica en la figura b, podemos aun obtener una correlacin cero que indique una relacin no lineal. * formula del calculo de r

BIBLIOGRAFA

Casuso, Rafael L. "Clculo de probabilidades e inferencia estadstica", UCAB. Caracas. 1996. Mendenhall, Schaeffer y Wackely. "Estadstica matemtica con aplicaciones", Edit. Iberoamrica. Mxico. 1986. Mendelhall, William y Sincich. "Probabilidad y estadstica para ingeniera y ciencias", Edit. Prentice may. Mxico. 1997. Miller, Irwin y otros. "Probabilidad y estadsticas para ingenieros", Edit. Prentice may. 4ta edicin. Mxico. 1992. Ross, Sheldon. "Probabilidad y estadsticas para ingeniera y ciencias", Edit. Mc Graw Hill. Mxico. 2001. Universidad Simn Bolvar , Por: Hernando Snchez Santibez http://www.usb.edu.co/facultades/administracion/publicaciones/regresion_correlacion.pdf WALPOLE, Myers y Myers (1998), "Probabilidad y Estadstica para Ingenieros", Edit. Prentice Hall, Mxico.

Vctor Jos Mata. Alexander Snchez. Caracas 27 de Mayo de 2004

Comentarios

Jueves, 3 de Abril de 2008 a las 15:09 | 0 Jenny Liliana Martinez Bueno, la verdad soy nueva en esto, pero lo que sucede es que estoy viendo econometra en la universidad y no entiendo muy bien como comprobar la hiptesis nula en una matriz, ya que me dan una matriz de varianza y covarianza. jennyli87@gmail.com Mostrando 1-1 de un total de 1 comentarios. Pginas: 1 El comentario ha sido publicado.

Para dejar un comentario, regstrese gratis o si ya est registrado, inicie sesin.

Principio del formulario

Agregar un comentario

Enviar comentario

Los comentarios estn sujetos a los Trminos y Condiciones Final del formulario

Trabajos relacionados Distribucin Normal Distribucin Normal. Funcin de densidad. La distribucin binomial. Esta distribucin es frecuentemente utilizada en l... Estructura y funcionamiento del Programa Races Carlos alberto PrezEl programa esta compuesto por la funcin principal raices y 9 subfunciones: Raices (principal; Cuad... El poder del Solver Ejemplo de cmo usar "SOLVER". En estos tiempos donde se habla de la tecnologa, informacin, sociedad del conocimient... Ver mas trabajos de Matematicas Nota al lector: es posible que esta pgina no contenga todos los componentes del trabajo original (pies de pgina, avanzadas formulas matemticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versin original completa, puede descargarlo desde el men superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposicin de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual

uso que se le de a esta informacin. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de informacin. El Centro de Tesis, Documentos, Publicaciones y Recursos Educativos ms amplio de la Red. Trminos y Condiciones | Haga publicidad en Monografas.com | Contctenos | Blog Institucional Monografias.com S.A. cerrar

Iniciar sesin Ingrese el e-mail y contrasea con el que est registrado en Monografias.com Principio del formulario E-mail: Contrasea: Regstrese gratis Olvid su contrasea? Ayuda

Recordarme en este equipo


Iniciar sesin

Final del formulario

Anda mungkin juga menyukai