Anda di halaman 1dari 9

1

REGRESIÓN POLINÓMICA PARA EL ESTUDIO DEL CRECIMIENTO DEL CONSUMO


DE GAS NATURAL EN LA CIUDAD DE BOGOTÁ
Tarquino Aparicio Jonattan Morrison
maximaciencia@gmail.com
FUNDACIÓN UNIVERSITARIA KONRAD LORENZ

RESUMEN

Para el estudio del consumo de gas natural se encuentran en diferentes fuentes de información, datos
tabulados y graficados que no permiten un entendimiento sobre el comportamiento o relación de los
mismos, al igual de que no brindan modelo alguno que sirva de herramienta para la realización de
predicciones sobre el comportamiento futuro de los propios datos.

Se presenta el planteamiento de manera definitiva en donde se expresa lo que se busca. Luego se presenta
el método numérico que se aplica para poder dar solución a la problemática planteada. Se continúa con una
explicación teórica muy general del método desde el punto de vista del análisis numérico. Se ponen en
claro cuales son los insumos necesarios para la realización del estudio. Se realiza seguidamente la
aplicación del método para la consecución de la solución buscada, terminando con una sencilla conclusión
del resultado obtenido.

ÍNDICE DE TÉRMINOS

Mínimos Cuadrados: Expresión que se refiere a la minimización de la sumatoria de los cuadrados de las
distancias entre los valores de rango de puntos dispersos y los valores del rango de polinomios de
aproximación a dichos puntos dispersos sobre los correspondientes valores de dominio.

Regresión polinómica: método numérico originado en la aplicación analítica del cálculo multivariado, a la
minimización de funciones suma de cuadrados de distancias entre puntos dispersos y puntos de polinomios
de aproximación a dichos puntos de dispersos.

Sistema de ecuaciones normales: refiérase en regresión polinómica, a los sistemas de ecuaciones que son
resultado de la minimización de la sumatoria de mínimos cuadrados.

Coeficiente de determinación: valor real entre 0 y 1 que mide la calidad del ajuste del modelo de regresión
a los datos.

Coeficiente de correlación: Un valor real entre -1 y 1 e indica la intensidad de la relación de determinado


grado entre variables relacionadas, así como el sentido de la misma. De otra forma mide que tan
relacionadas están dos variables, con respecto a un tipo de regresión.
2

INTRODUCCIÓN

En la vida real es común encontrarse con ciertas relaciones entre variables, de las cuales se desea encontrar
su patrón de comportamiento o tratar de tener un modelo de predicción del mismo ya sea perfecto o
aproximado.

Son muchos los casos en los cuales tan solo se poseen tabulaciones o conjuntos pequeños de puntos de
estas relaciones y es necesario encontrar un método o forma para hallar un modelo matemático que los
explique.

En este trabajo se presenta el caso del crecimiento del crecimiento porcentual del consumo de gas natural
para la ciudad de Bogotá, como función del tiempo dado en años. Para ello solo se cuenta con algunos
datos tabulados y graficados y se pretende aplicar una técnica de regresión para los mismos.

Puede ello servir para realizar estimaciones dentro del intervalo sobre el cual están dados los datos o para
realizar predicciones al menos aproximadas de la relación entre las variables.
3

PLANTEAMIENTO DEL PROBLEMA

El problema a solucionar es la obtención de una función que modele datos obtenidos acerca a del consumo
de gas natural en la ciudad de Bogotá, debido a que dichos datos son solo información primaria sobre la
cual no se puede tener una aproximación sobre el comportamiento e interrelación de los propios datos, al
igual que no es posible realizar predicciones futuras ni al menos aproximadas de dicho comportamiento o
interrelación.
Con base en el estudio realizado es posible dar una alternativa de solución a los requerimientos. Cabe notar
que este es un problema real, para el cual se tiene información propia u original sin modificaciones.
Las variables relacionadas son El crecimiento porcentual versus tiempo en años dentro del intervalo 1998-
2007.

MÉTODO A APLICAR

Para la solución se ha aplicado el método de regresión polinómica de tercer grado, ya que este método
permite generar un polinomio grado tres que modela los datos, acorde con la forma como los mismos se
hallan distribuidos, permitiendo tener una aproximación del comportamiento e interrelación sobre las
variables de estudio.

EXPLICACIÓN DEL MÉTODO

La regresión polinómica de grado tres busca la obtención de un polinomio y los coeficientes del mismo,
que al evaluarse para los valores del dominio obtenido previamente de los datos, se obtengan valores de
rango que en distancia traten de no deferir mucho de los valores de rango de los datos.
Se basa en la minimización de una función que es la sumatoria de cuadrados de las diferencias entre los
valores del rango del polinomio y los valores de rango de los datos previos por lo que a este tipo de método
se le conoce como regresión por mínimos cuadrados. “Mínimo porque se busca minimizar dicha función”.
Lo anterior implica que la función al estar en términos de los coeficientes del polinomio se transforma en
una función multivariada que para minimizarla se requiere de las derivadas parciales de la misma con
respecto a cada una de las variables de la cual depende. “En otras palabras. De los coeficientes del
polinomio”.
Al final se logra obtener un sistema de ecuaciones normales el cual se puede resolver numérica o
analíticamente para hallar los valores de los coeficientes del polinomio.
Empleando un poco el lenguaje matemático lo anterior sería:
Supongamos que se conocen los datos (xo, yo),(x1, y1),…..(xn, yn) con x0, x1, ….., xn números reales
distintos, y se desea encontrar un polinomio

Pm(x) = a0 + a1x + a2x2 + ….. + am xm, con m<n (1)

tal que:
n 2 n 2
2 m
S(a0 , a1 ,.....,a m ) pm x k yk a 0 a1x k a 2 x k ,.....,a x
m k yk
k 0 k 0
sea mínima. (2)
4

P1) El grado m del polinomio pm(x) se puede escoger previamente con base en algún resultado teórico,
alguna expectativa o por la aplicación que se le pretenda dar al polinomio. En cualquier caso estamos
“libres” de elegir el grado que parezca mejor. En muchos casos el grado será uno y el polinomio obtenido
se llamará la recta que mejor se ajusta o la recta de mínimos cuadrados para la tabla de datos.

P2) Volviendo a la función S(a0, a1, ….., am), una condición necesaria para la existencia de un mínimo
relativo de esta función es que las derivadas parciales de S(a0, a1, ….., am) con respecto a aj, j = 0, 1, 2,
…,m sean cero.

Resultan entonces las siguientes m+1 ecuaciones lineales en las incógnitas a0, a1, ….., am :

n
S
2 a0 a 1x k a 2 x 2k ..... a m x mk yk 0 (3)
a0 k 0
n
S
2 a0 a 1x k a 2 x 2k ..... a m x mk yk xk 0 (4)
a1 k 0
n
S
2 a0 a 1x k a 2 x 2k ..... a m x mk y k x 2k 0 (5)
a2 k 0

..........
n
S
2 a0 a 1x k a 2 x 2k ..... a m x mk y k x kj 0 (6)
aj k 0

.......... ..
n
S
2 a0 a 1x k a 2 x 2k ..... a m x mk y k x mk 0 (7)
am k 0

P3) Si en las ecuaciones anteriores se cancela el 2, desarrolla los paréntesis y se usa que:
n
a0 n 1 a0 (8) , obtenemos:
k 0
n n n n
n 1 a0 x k a1 x 2k a 2 ..... x mk a m yk
k 0 k 0 k 0 k 0
n n n n n
xk a0 x 2k a 1 x 3k a 2 ..... x mk 1
am x k yk
k 0 k 0 k 0 k 0 k 0
n n n n n
x 2k a 0 x 3k a 1 x 4k a 2 ..... x mk 2
am x 2k y k
k 0 k 0 k 0 k 0 k 0
. (9)
... ...
.
n n n n n
x kj a 0 x 1k j
a1 x 2k j
a2 ..... x mk j
am x kj y k
k 0 k 0 k 0 k 0 k 0
:::
n n n n n
x mk a 0 x 1k m
a1 x 2k m
a2 ..... x mk m
am x mk y k
k 0 k 0 k 0 k 0 k 0
5

El anterior es el sistema de ecuaciones normales que al resolverse se obtendrían los valores de las variables.

Es posible obtener conocimiento aproximado sobre que tan eficiente es el polinomio obtenido en cuanto a
la modelización de los datos por medio del coeficiente de determinación R² Empleando:

n n n n n n
2 3
n
( x)( y) n
( x )( y) n
( x y)( y)
SCR a1( xy k1 k1
) a2( x y k1 k1
) a3( x3 y k1 k1
)
k1 n k1 n k1 n (10)

n
( y)2
n
SCR
SCT ( y2 k 1

n
) R2
k 1 (11)
SCT (12)

Y empleando el coeficiente de correlación que es:

R R2 SCR / SCT (13)

INSUMOS EMPLEADOS

Para el desarrollo del trabajo se han empleado datos originales del crecimiento porcentual del consumo de
gas natural para la ciudad de Bogotá en el periodo 1998-2007, los cuales se fueron el resultado de un
estudio realizado por la empresa de energía de Bogotá. Dichos datos se encuentran en la siguiente tabla en
la cual se hace una correspondencia entre los años y los valores de x. Dicha correspondencia o intercambio
de dominio de realiza con el fin de poder aproximar la curva de regresión a los datos.

años X Y en %
1998 1 41,5
1999 2 40,4
2000 3 37,8
2001 4 23,7
2002 5 15,3
2003 6 11
2004 7 18,4
2005 8 16
2006 9 23,7
2007 10 16,5
Tabla 1
6

La relación anterior se encuentra graficada con rojo en la página 11 en [1].

La línea roja de la gráfica anterior, es solo una interpolación lineal rudimentaria, que no asegura el
comportamiento de la nube de puntos que se tienen.

APLICACIÓN DEL MÉTODO AL PROBLEMA

Forma general del polinomio a obtener

P(x) = a₀ + a₁x + a₂x² + a₃x³

Tabla de valores para el estudio

x y x² y² x³ x⁴ x⁵ x⁶ XY X²y x³y
1 41,5 1 1722,25 1 1 1 1 41,5 41,5 41,5
2 40,4 4 1632,16 8 16 32 64 80,8 161,6 323,2
3 37,8 9 1428,84 27 81 243 729 113,4 340,2 1020,6
4 23,7 16 561,69 64 256 1024 4096 94,8 379,2 1516,8
5 15,3 25 234,09 125 625 3125 15625 76,5 382,5 1912,5
6 11 36 114,49 216 1296 7776 46656 64,2 385,2 2311,2
7 18,4 49 338,56 343 2401 16807 117649 128,8 901,6 6311,2
8 16 64 256 512 4096 32768 262144 128 1024 8192
9 23,7 81 561,69 729 6561 59049 531441 213,3 1919,7 17277,3
10 16,5 100 272,25 1000 10000 100000 1000000 165 1650 16500
Tabla 2
Matriz de coeficientes

n n n
2
n 10 xk 55 xk 385 xk 3 3025
k 1 k 1 k 1
n n n n
2 3
xk 55 xk 385 xk 3025 xk 4 25333
k 1 k 1 k 1 k 1
n n n n
2 3 4
xk 385 xk 3025 xk 25333 xk 5 220825
k 1 k 1 k 1 k 1
n n n n
3 4 5
xk 3025 xk 25333 xk 220825 xk 6 1978405
k 1 k 1 k 1 k 1

Matriz inversa

3, 7666667 2, 638889 0,5 0, 027778


2, 638889 2,1161194 0, 42735 0, 024637
0,5 0, 42735 0, 090035 0.005342
0, 027778 0, 024637 0, 005342 0, 000324
7

Vector de términos independientes:

n
yk 244
k 0
n
xk yk 1106, 3
k 0
n
xk 2 yk 7185, 5
k 0
n
xk 3 yk 55406, 3
k 0
Valor de las variables

a 0 53,35
a1 8, 402817
a2 0,194639
a3 0, 032304
Polinomio buscado:

f ( x) 53,35 8,402817 x 0,194639 x2 0,032304 x3 (14)

Empleando las ecuaciones para el cálculo del coeficiente de determinación R² y de correlación R se tiene
que:

SCR
R2 0,818348 R R2 SCR / SCT 0,905
SCT
(15) (16)
8

A continuación se muestra las gráficas tanto de los datos originales como la de la curva de regresión

CONCLUSIONES SOBRE EL RESULTADO OBTENIDO

De acuerdo al resultado obtenido, el polinomio obtenido modela los datos en un 82% aproximadamente, lo
cual indica que la regresión polinómica grado tres es confiable en buena medida si lo que se pretende es
tener un conocimiento sobre la tendencia de los datos.
Se puede afirmar entonces que la tendencia de los datos es polinomial de grado tres en un 82%
aproximadamente. De seguir con dicha tendencia se podría estimar el crecimiento porcentual para los
siguientes años, solo evaluando el polinomio grado tres obtenido.
9

REFERENCIA BIBLIOGRÁFICA

Chapra Steven C & Canele Raymond. Métodos numéricos para Ingenieros. Tercera Edición. MacGraw-
Hill. México. P466-486

REFERENCIA EN INTERNET

[1] Extraído el 1 de Abril, 2009 http://www.semana.com/documents/Doc-1740_2008916.pdf

Regresión Polinómica. Extraído el 1 de Mayo, 2009 de


http://www.ingenieria.uady.mx/weblioteca/CompApp/aproximacion/poli/Regresionpolinomial.htm

Regresión Polinómica. Extraído el 1 Mayo, 2009 de http://costaricalinda.com/Estadistica/Polino.htm