Anda di halaman 1dari 36

Regresin Exponencial mediante el

Mtodo de los Mnimos Cuadrados


Enviado por Mario Orlando Surez Ibujes

Regresin exponencial mediante el principio de los mnimos cuadrados - Monografias.com


Regresin exponencial mediante el principio de los mnimos cuadrados
Fue Francis Galton (1822-1911) quien utiliz por primera vez el trmino regresin para
indicar que, aunque influida por la estatura de sus padres, la estatura de los hijos
"regresaba" a la media general.
La regresin examina la relacin entre dos variables, pero restringiendo una de ellas con el
objeto de estudiar las variaciones de una variable cuando la otra permanece constante. En
otras palabras, la regresin es un mtodo que se emplea para predecir el valor de una
variable en funcin de valores dados a la otra variable.
En todos los casos de regresin existe una dependencia funcional entre las variables. En el
caso de dos variables, siendo una de ellas (X) variable independiente y la otra (Y) la
dependiente, se habla de regresin de Y sobre X; Por ejemplo, los ingenieros forestales
utilizan la regresin de la altura de los rboles sobre su dimetro, lo cual significa que
midiendo el dimetro (variable independiente) y reemplazando su valor en una relacin
definida segn la clase de rbol se obtiene la altura, y aun sin necesidad de clculos
aprecian la altura utilizando grficas de la funcin de dependencia, altura = funcin del
dimetro.
Cuando la curva de regresin de y sobre x es exponencial, es decir para cualquier x
considerada, la media de la distribucin est dada por la siguiente ecuacin predictora:

Ejemplo ilustrativo: Las cifras siguientes son datos sobre el porcentaje de llantas radiales
producidas por cierto fabricante que an pueden usarse despus de recorrer cierto nmero
de millas:

Miles de Millas recorridas


(X)

15

25

30

35

40

Porcentaje til (Y)

99

95

85

55

30

24

20

15

1) Elaborar el diagrama de dispersin.


2) Ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados.
3) Calcular la ecuacin predictora.
4) Graficar la ecuacin predictora.
5) Estimar qu porcentaje de las llantas radiales del fabricante durarn 50000 millas.
Solucin:
1) Elaborando el diagrama de dispersin empleando Excel se obtiene la siguiente figura:

Empleando el programa Graph se obtiene la siguiente figura:

2) Se llena la siguiente tabla:

Resolviendo empleando Excel se muestra en la siguiente figura:

Reemplazando valores en el sistema se obtiene:

Resolviendo empleando Excel se muestra en la siguiente figura:

3) Reemplazando en la ecuacin predictora se obtiene:

4) Graficando la ecuacin predictora empleando Excel se obtiene la siguiente figura:

En Graph se obtiene la siguiente figura:

5) La estimacin del porcentaje de llantas radiales que durarn 50000 millas se obtiene
reemplazando en la ecuacin predictora el valor de X = 50

Entonces el porcentaje sera de 9,106%

1. Recta de mejor ajuste (Recta de regresin)


Empezamos intentando construir una funcin lineal de demanda. Suponga que su
investigacin de mercado muestra las siguientes estadsticas de venta para casas de varios
precios durante el ao pasado:
Precio (Miles de dlares)

160

180

200

220

240

260

280

Ventas de nueva casas este ao

126

103

82

75

82

40

20

Queremos utilizar estos datos para construir una funcin de demanda para el mercado de
los bienes races. (Recuerde que una funcin de demanda especifica la demanda, y, medida
aqu por ventas anual, como una funcin del precio, x.) Aqu est una traza de y contra x:

Los datos sugiera una recta, ms o menos, y entonces una relacin lineal entre y y x. Aqu
son varias rectas que se acercan a los puntos:

P Cul recta ajusta los puntos lo ms estrechamente que posible?


R Nos gustara que las ventas que pronosticara la recta (los valores pronosticados )
estuvieran tan cerca como fuera posible de las ventas reales (los valores observados). Las
diferencias entre los valores esperados y los valores pronosticados, que son los errores
residuales, son las distancias verticales que se marcan in la figura ms abajo.
Error residual = Valor observado - Valor pronosticado

P Entonces como podemos hacerlo?


R Sumamos primero todos los cuadrados de los errores residuales para obtener un solo
error que se llama el suma de los errores al cuadrado (SSE -- siglas en ingls de "Sum of
Squares Error") y escogemos la recta que se da el ms pequeo valor de SSE. Esta recta se
llama la recta de mejor ajuste, recta de regresin, o recta de mnimos cuadrados
asociada a los datos.
Ejemplo 1: Calculando SSE para una recta dada
Supngase que nos gustara calcular SSE para una recta especifica, como y=x+300 como mostrada
ms abajo:

Tenemos la siguiente tabla de valores:

y Observado
y

y Pronosticado
y =x+300

Error residual
yy

160

126

140

-14

180

103

120

-17

200

82

100

-18

220

75

240

82

260

40

280

20

Entonces, para la recta y=x+300


SSE

Suma de los valores de errores residuales

- 14 - 17 - 18 - 5 + 22 + 0 + 0

-32

P Muy bien. Ahora sabemos como se calcula el valor de SSE para una recta ya dada.
Como hallamos la recta de mejor ajuste; es decir, la recta para que SSE es lo menor?
R Presentaremos aqu la formula que la determina. Justificarla necesita clculo; puede
consultar el capitulo de funciones de varias variables en Clculo Aplicado para una
explicacin detallada.
Recta de regresin (o mejor ajuste)

La recta que se ajusta mejor a los n puntos (x1 y1) (x2 y2)

(xn yn) tiene

la forma
y=mx+b
donde
Pendiente=m=n

Interseccin=b=n
Aqu,

(x2)

x 2n

ym

xy

significa "la suma de." As,


xy= suma del productos =x1y1+x2y2+ +xnyn
valores de x=x1+x2+ +xn
+yn

x= suma del

y= suma del valores de y=y1+y2+

x2= suma del valores de x2=x21+x22+ +x2n

El uso de las formulas as bastante fcil, como se muestra el siguiente ejemplo.


Ejemplo 2: Calculando la recta de regresin a mano
Determine la recta de regresin asociada a los siguientes datos:
xx

yy

1.5

1.6

2.1

3.0

Solucin Para aplicar las formulas, es mejor organizar los datos en forma de tabla como
sigue: (Cuando ha rellenado los valores de xy y x2 correctamente, pulse "Sumas" para
obtener la suma de cada columna.)
xx

yy

1.5

xyxy

x2x2

1.6

2.1

3.0

x= 10

y= 8.2

xy=

x2=

Sustituyendo los valores correctos de la tabla ms arriba en las formulas, obtenemos


Pendiente=m=n

(x2)

5 Interseccin=b=n

x 2n

ym

xy

y =4(30)1024(23)(10)(8 2)=0

x =48 2(0 5)(10)=0 8

Por lo tanto, la recta de regresin es


y=0 5x+0 8

Antes de seguir... Aqu esta una traza de los pontos de dados y la recta de regresin.

Observe que ni siquiera pasa la recta por uno de los puntos, pero es la recta que se ajusta
mejor a los puntos.

Regresamos a los datos sobre la demanda para el mercado de los bienes races con la que
empezamos este tema.
Ejemplo 3: Funcin de demanda

Obtenga la ecuacin de demanda que se ajusta mejor a los siguientes datos, y sela para
pronosticar ventas anuales de casas preciadas a $140,000.
Precio (Miles de dlares)

160

180

200

220

240

260

280

Ventas de nueva casas este ao

126

103

82

75

82

40

20

Solucin Aqu esta una tabla como la que usamos ms arriba para organizar las
calculaciones:
xx

yy

xyxy

x2x2

160

126

20,160

25,600

180

103

18,540

32,400

200

82

16,400

40,000

220

75

16,500

48,400

240

82

19,680

57,600

260

40

10,400

67,600

280

20

x=1540

5,600

y=528

78,400

xy=107 280

x2=350 000

Sustituyendo estos valores en la formula (con n=7), obtenemos


Pendiente=m=n

(x2)

x 2n

)(528) 0 7929 Interseccin=b=n

xy

ym

y =7(350 000)154027(107 280)(1540


x

7528(0 7928571429)(1540) 249 9

Observe que usamos el valor ms exacto que pudimos obtener en la calculadora, m 0


7928571429, en lugar del valor redondeado (0 7929) en la calculacin de b. Eso ilustra la
sigiuente regla general:
Al calcular, no redondee los resultados intermedios; en vez de eso, utilice los resultados ms
exactos que puede obtener, usando los valores guardados en su computadora o calculadora si es
posible.

Por lo tanto, la recta de regresin es


y=0 7929x+249 9
Ahora podemos utilizar esta ecuacin pronosticar las ventas anuales de casa cuyo precio es
$140,000:
Ventas anuales de casas preciadas a $140,000

redondee al nmero entero ms


cercano

Antes de seguir... Ms abajo est una traza de la recta de regresin.

P Si mis puntos estn en una recta, est la recta de mejor ajuste?


R S. Si los puntos estn en una recta, el valor mnimo posible de SSE es cero, y eso sucede
si se usa la recta que pasa por todos los puntos. Una consecuencia de este hecho es que se
puede usar la herramienta regresin en su graficadora o la herramienta regresin en este
sitio para calcular la ecuacin de la recta que pasa por dos puntos especificados.

P Si no todos los untos estn en una recta, cmo puedo saber cunto se acercan a una
recta?
R Hay un nmero que mide la "bondad de ajuste" de la recta de regresin llamado
coeficiente de correlacin. Este nmero, que se representa por r, est entre 1 y 1. Cuanto
ms se acerca r a1 o 1, el ajuste es mejor. Si el ajuste es malo, se acerca r a 0. Si el ajusto
es exacto, r=1 para una recta con pendiente negativa, o r=1 para una recta de pendiente
positiva. La figura ms abajo muestra varios conjuntos de puntos con sus rectas de
regresin, y los valores correspondientes de r.

El coefficiente de correlacin se puede calcular con la siguiente formula. Para obtener la se


requieren buenos conocimientos de estadstica.
Coeficiente de correlacin

Coeficiente de correlacin =r=n


y2

xy

x2

x 2

y 2

2. Curva exponencial de mejor ajuste (Curva exponencial regresin)


P Ahora sabemos como ajustar una recta a un conjunto de datos. Que hay una curva
exponencial de la forma
y=Arx ?

R La idea es convertir una curva exponencial a una recta por medio de logaritmos, como sigue:
Empiece con la funcin exponencial
y=Arx

y tome el logaritmo de ambos lados:


logy=log(Arx)

Las propiedades de logaritmos nos dan entonces


logy logy =logA+logrx o =logA+xlogr

Esto expresa logy como una funcin lineal de x, con


Pendiente =m=logr Interseccin =b=logA

Por lo tanto, si calculamos la recta de mejor ajuste usando logy como una funcin de x,
entonces la pendiente y la interseccin en y seran dados como ms arriba, y despus
podemos obtener los coeficientes r y A por
r A =10m =10b

Para resumir,
Regresin exponencial

Para obtener la curva exponencial de mejor ajuste de la forma


y=Arx

1. Obtenga la recta de regresin usando los datos (x logy).


2. Los coeficientes deseados A y r son entonces
r A =10m =10b
donde m y b son la pendiente y interseccin de la recta de regresin.

Ejemplo 4: Ventas de Compaq

Ingresos de ventas de computadores Compaq (una marca ahora extinguida) son mostrados
en la siguiente tabla, donde t representa aos desde 1990.* Obtenga el modelo exponencial
de regresin para los datos.
tt = Ao (1990 = 0)

RR = Ingreso ($ billn)

11

25

* Datos son redondeados. Fuente: Informes de compaa/The New York Times, Enero 27,
1998, p. D1.
Solucin Pues necesitamos modelar logR como una funcin lineal de t, primero
construimos una tabla con x=t y y=logR , y entonces calculamos la recta de regresin,
y=mx+b.
x (=t)x (=t)

y (=logR)y (=logR)

0.477121

0.602060

1.04139

1.39794

En lugar de hacer la calculacin a mano como hicimos ms arriba, podemos utilizar la


herramienta regresin en este sitio para hacerlo automticamente. Simplemente ingrese los
valores de x y y y pulse el botn "y=mx+b". (S, la herramienta puede hacer regresin
exponencial directamente, pero preferimos que sabe usted como funciona!)
La recta de regresin que obtenemos es
y=0 13907x+0 42765

Por lo tanto, el modelo exponencial deseado es

R=Art
,
donde r=10m=100 13907 1 3774, y A=100 42765 2 6770.

Nuestra modelo de ingresos es, por lo tanto,


R=2 6770(1 3774)t
.

Antes de seguir... Vaya a la herramienta regresin, ingrese los datos originales (sin tomar
logaritmos) y pulse el botn "y=a(bx)". Qu encuentra?
Note: Pues hemos tomado logaritmos antes de hacer la regresin lineal, se puede decir que
la curva de regresin exponencial no es la curva que minimiza SSE para los datos
originales, esta curva minimiza SSE para los datos tranformados --- es decir, para los datos
(x logy). Por lo tanto, la curva de regresin exponencial no es la curva exponencial de
mejor ajuste en el sentido "estricto." Vea los libros de texto "Applied Calculus" para un
mtodo obtener esta curva.

3. Otras formas de regresin


A la herramienta de regresin se puede encontrar tambin curvas de regresin de las siguientes
formas:
y=ax2+bx+c y=ax3+bx2+cx+d y=axb (Regresin cuadrtica) ( Regresin
cbica) (Regresin potencia)

En la calculadora TI-83/84, se puede encontrar todos estos y tambin los siguientes:


y=ax4+bx3+cx2+dx+e y=asin(bx+c) (Regresin curtica) (Regresin seno)

Interpolacin lineal
La interpolacin lineal parte de dos puntos y pretende establecer la lnea recta que pasa por ambos
puntos. De esta forma podremos determinar los puntos intermedios entre ambos puntos como los
puntos que pertenecen a esa recta.
La ecuacin de la recta es:
y=a+bx
siendo

y la variable dependiente. Se representa en el eje de ordenadas, en vertical

x la variable independiente. Se representa en el eje de abcisas, en horizontal

a la constante de la recta. Es el punto de corte con el eje y

b la pendiente de la recta

No es lo mismo Interpolar que calcular la recta de regresin o lnea de tendencia. Cuando


disponemos de una nube de puntos y efectuamos un ajuste por el mtodo de los mnimos cuadrados
no todos los puntos caen en la recta de regresin, salvo que estemos en un caso de correlacin
perfecta, donde R2 es igual a 1.
Si nicamente disponemos de dos puntos (dos parejas de datos (x,y)) podemos calcular la recta de
regresin y habremos obtenido una recta que pasa exactamente por esos dos puntos. Esa recta es la
misma que hubiramos obtenido si buscamos la recta de interpolacin. Por tanto, en el caso de una
recta, es lo mismo interpolar que ajustar por mnimos cuadrados cuando nicamente disponemos de
dos puntos. La recta pasa justo por esos dos puntos y la correlacin es perfecta, siendo R2 igual a 1.
Esto lo podemos ver en la Hoja1 de nuestro fichero.

Hemos representado la recta utilizando los grficos de tipo dispersin con lneas suavizadas y
marcadores.

Sobre la recta obtenida hemos aadido una lnea de tendencia.

La ventana que se abre nos permite aadir diferente lneas de tendencia:

Exponencial

Lineal

Logartmica

Polinmica

Potencial

Media mvil

Elegiremos, para este caso, la lineal y al final de la ventana marcaremos las opciones:

Presentar ecuacin en el grfico

Presentar el valor R cuadrado en el grfico

Observamos que R2 es igual a 1 y que la ecuacin de la recta es:

y=0,5x+1

Al tratarse nicamente de dos puntos en la nube de datos la recta pasa exactamente por ellos y el
ajuste es perfecto (R2=1).

La ecuacin de la recta se puede obtener con la siguientes funciones estadsticas.

a es la constante =INTERSECCION.EJE(conocido_y;conocido_x)

b es la pendiente =PENDIENTE(conocido_y;conocido_x)

Aunque estamos hablando de interpolacin se ha de considerar que no estamos aplicando los


clsicos mtodos de interpolacin. Lo que hacemos es efectuar un ajuste por el mtodo de los
mnimos cuadrados a una nube de datos que nicamente tiene dos puntos, por lo que
necesariamente la recta de regresin que obtenemos pasa por esos dos puntos. Siendo la correlacin
perfecta podemos inferir que la recta de regresin coincide con la recta que obtendramos mediante
los mtodos de interpolacin lineal.

Interpolacin Parablica
Una parbola es un polinomio de grado 2, cuya ecuacin es:
y=a+bx+cx2
En la Hoja2 de nuestro fichero podemos ver un caso en el que nos dan 3 puntos. Nuestra nube de
puntos es pequea y lo que pretendemos es encontrar la parbola que pasa justo por esos tres
puntos. Si lo conseguimos habremos obtenido una interpolacin parablica.

Pulsando con el botn derecho del ratn sobre el grfico (justo sobre la curva) obtenemos el men
contextual y elegimos Agregar lnea de tendencia.

Tambin marcamos abajo las opciones:

Presentar ecuacin en el grfico

Presentar el valor R cuadrado en el grfico

As veremos la ecuacin de la parbola:


y tambin veremos el coeficiente de determinacin que es R2=1, lo cual indica que estamos en un
caso de correlacin perfecta.
Observar que aunque aumentemos el grado del polinomio (lo que aqu Excel llama 'Ordenacin') no
por ello mejora el valor de R2 ya que lo mximo que puede valer es 1.

La sorpresa es que al trazar Excel la parbola (lnea negra) no coincide con la curva (lnea azul), y
ambas curvas pasan por los tres puntos. La respuesta es que existen muchas formas de interpolar y
por lo que vemos Excel en la curva azul ha elegido otro mtodo muy diferente del que nosotros
estamos buscando. Nosotros queramos una parbola y usando este sistema hemos obtenido la
parbola, que es un polinomio de grado 2.

Si aumentamos el grado del polinomio en la ventana de las opciones de la lnea de tendencia no


cambia la curva ajustada y no mejora R2 ya que al llegar a 1 ha llegado al mximo. R2 igual a 1
indica que estamos ante un ajuste perfecto por lo que no se gana nada intentando aumentar el grado
del polinomio.

Para calcular la ecuacin de la parbola debemos determinar los valores de sus parmetros: a, b y c.
Nos reservamos el mtodo para ms adelante, ya que lo aplicaremos para un caso de un polinomio
de grado 4 y como es un mtodo matricial es vlido para cualquier grado.
A la vista del grfico podemos observar la ecuacin de la parbola:
y=a+bx+cx2
en nuestro caso es: y=1+0,5x-2x2

Polinomio grado 3
En la Hoja3 de nuestro fichero pretendemos obtener el polinomio de interpolacin que pasa por 4
parejas de datos.

La curva que obtenemos es la siguiente.

Nuevamente, observamos que pese a estar en el caso de correlacin perfecta (R 2=1) nuestro
polinomio de grado 3 (color negro) no coincide con la curva del grfico generada por Excel (color
azul).

Polinomio grado 4
En la Hoja4 disponemos de 5 parejas de datos, con lo que podemos obtener un polinomio de grado
4.

Aqu tambin R2=1 ya que el polinomio pasa por todos los puntos.

Interpolacin: determinacin de la curva


En la Hoja5 vamos a estudiar un caso real. Nos proporcionan datos para construir dos curvas.

Por cada curva son cinco parejas de datos, por lo que el polinomio al que queremos llegar es de
grado 4. Siempre el grado del polinomio es uno menos que el nmero de parejas de datos. Esto se
debe a que para determinar un polinomio de grado 4 necesitamos determinar 5 parmetros:

y=a+bx+cx2+dx3+ex4
Los cinco parmetros a determinar son: a, b, c, d, e.
En lugar de usar esta terminologa vamos a denotar a los parmetros as: a 0, a1, a2, a3, a4, a5.
Por tanto el polinomio de grado 4 ser este:
y=a0+a1x+a2x2+a3x3+a4x4
Esta expresin se puede escribir de forma matricial y as es vlida no solo para polinomios de grado
4 sino para polinomios de cualquier grado.
y=AX
Siendo A un vector fila con todos los parmetros del polinomio:
a0, a1, a2, a3, a4, ......, an.
Siendo X un vector columna con la variable x elevada a los diferentes grados:
x0, x1, x2, x3, x4, ......, xn.
Excel dispone de una funcin matricial que calcula todos los parmetros del vector A. La funcin
que emplearemos es la siguiente:
{=+ESTIMACION.LINEAL(y;x^{1;2;3;4})}
Hemos aadido las llaves {} para indicar que es una funcin matricial, pero no debemos escribir
nosotros esas llaves, ya que es Excel el que las pone al validar con CONTROL + MAYSCULAS +
ENTER.

Creamos una tabla para la Curva 1. En la zona amarilla escribimos nuestra funcin matricial.

=+ESTIMACION.LINEAL(Curva1;X^{1;2;3;4})
Previamente hemos nombrado los siguientes rangos.

Para la Curva 2 construimos una tabla similar.

En las celdas amarillas de esta segunda tabla escribimos la siguiente frmula matricial:
=+ESTIMACION.LINEAL(Curva2;X^{1;2;3;4})

Los valores interpolados son los dados por la siguiente tabla. Establecemos el valor de x (color
verde) y luego con SUMAPRODUCTO calculamos el valor y interpolado para cada curva.

Lo que estamos haciendo es una regresin mltiple donde las variables que usamos las hemos
transformado para que sean los diferentes valores de la variable x elevados al grado necesario.
La correlacin es perfecta. Se puede comprobar dando valores a x en la celda J20 y viendo que para
los valores de la tabla original de datos los valores interpolados que se obtienen son los mismos que
los de la tabla de datos.

Prctica
Usando este mtodo puede intentar obtener el polinomio de grado 4 que interpola los datos de la
Hoja4. Puede comprobar si lo ha realizado correctamente ya que en el grfico se ve la ecuacin del
polinomio a la que ha de llegar.
Obtendr los siguientes valores.

El polinomio obtenido es:


y=1+0,5x-2x2+0,3x3+0,2x4
Para facilitar el clculo hemos dejado la tabla preparada con sus nombres de rango creados.

Falta introducir la frmula matricial ESTIMACION.LINEAL que ha de introducirse en las celdas


amarillas del rango E5:I5.

Para introducir una frmula matricial ha de seguir tres pasos.

ESTIMACION.LINEAL es una frmula matricial.


Como toda frmula matricial requiere 3 pasos:
1. Seleccionar la zona amarilla (rango E5:I5)
2. Escibir la frmula matricial
=+ESTIMACION.LINEAL(miY;miX^{1;2;3;4})
3. No pulse ENTER para validar.
Debe pulsar las 3 teclas siguientes:
CONTROL + MAYUSCULAS + ENTER