Anda di halaman 1dari 16

Tecnolgico de Monterrey

Relacin entre datos de energa y demanda de un sistema elctrico


Proyecto de Mtodos Estadsticos

Paola Madrigal Montores 12/3/2013

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013

Contenido
1. 2. Introduccin .................................................................................................................... 3 Datos................................................................................................................................ 4

3. Mtodo de anlisis: Regresin lineal simple ...................................................................... 5 Criterio de Mnimos Cuadrados ......................................................................................... 5 Estimadores de Mnimos Cuadrados Ordinarios ................................................................ 6 Error de prediccin, estimacin de la varianza y coeficiente de determinacin R2 ........... 6 4. Evaluacin: ...................................................................................................................... 7 Par (x,y): Media(x)-Demanda(y) ........................................................................................ 9 Par (x,y): Mediana(x)-Demanda(y) .................................................................................. 11 Par (x,y): Mximo(x)-Demanda(y)................................................................................... 14 5. Conclusin:.................................................................................................................... 16

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013

1. Introduccin
Cuando se trata de analizar sistemas elctricos de potencia, uno de los parmetros indispensable de conocer es la demanda del sistema, ya que esta determina: la generacin elctrica instalada, la direccin de los flujos de carga, la planeacin para la expansin del sistema, entre otros. La demanda en los sistemas de potencia presenta un comportamiento que no es constante. La modelacin del consumo de la electricidad ha servido de punto de partida para comprender cules son los principales factores que afectan a la demanda. Los estudios formales que existen para pronosticar la evolucin de la demanda, han mostrado que esta depende en gran medida de la temperatura, el tamao de la poblacin, el crecimiento econmico, el costo de la electricidad, la actividad econmica de la regin, y otros factores. Si bien, los cambios en la demanda proveniente de consumidores individuales pueden ser rpidos y frecuentes, conforme se va ascendiendo en la estructura del sistema de potencia (distribucin, subtransmisin y transmisin), los cambios en la demanda se vuelven ms pequeos y sutiles, por tanto, se puede asumir que a nivel de transmisin los cambios en la demanda son respetablemente predecibles, y dependen de las condiciones previamente mencionadas. Por otro lado, las entidades federales a cargo del manejo y coordinacin de la energa, generalmente no publican datos de demanda, sino que publican los consumos energticos de los sistemas. Por tanto, si se requiere establecer un perfil que modele la demanda de un sistema, es necesario analizar todos los factores que tienen efecto sobre su comportamiento. Sin embargo, este tratamiento aunque correcto puede resultar costoso (en tiempo y recursos). El objetivo de este trabajo de investigacin es identificar cul es la medida que mejor se ajusta al comportamiento de la demanda, a partir de datos de consumo energtico mensual en un periodo dado. El sistema que se analiza es el de Baja California. La informacin con la que se cuenta para el estudio consiste en los consumos energticos mensuales correspondientes a un perodo de ocho aos, y las correspondientes demandas mximas reportadas en el mismo perodo. Se utiliza un modelo de regresin simple, en el que se evala: la media, la mediana, y el mximo, contra el dato de demanda mxima anual. El anlisis de regresin se realiza con la ayuda de la herramienta R Studio.

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013

2. Datos
La informacin sobre el consumo de energa se obtiene del Sistema de Informacin Energtica (SIE) que consta de una base de datos alimentada por empresas, comisiones, institutos y por la Secretaria de Energa (SENER). En este sistema se concentra la informacin estadstica y georeferenciada del sector energtico, la cual se actualiza de manera peridica. Del SIE es posible obtener informacin sobre el historial del consumo elctrico de los estados de la Repblica Mexicana, dentro del periodo que abarca del ao 2005 al ao 2012. La informacin que proporciona se especifica en megawatt-hora (MWh), en base mensual. En la Tabla 2.1, se muestran los datos obtenidos del SIE. Se presentan los consumos mensuales registrados del sistema de Baja California, en el perodo 2005-2012. Tabla 2.1. Consumos energticos mensuales de Baja California del 2005-2012.
Mes/Ao Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 2005 617641 559917 610427 627736 651544 758560 869025 938722 864065 747759 646226 604726 2006 631985 600801 659786 615436 693912 842839 972483 1003329 953652 801938 697445 631597 2007 660869 630895 661417 645698 705818 806334 936819 1012356 1007197 808022 711480 636226 2008 663704 655804 659538 679647 710430 808204 956445 1076591 997277 883700 722109 595488 2009 627889 600657 629252 636985 719268 793592 940190 1026115 979403 839814 684426 612672 2010 634220 614370 652467 570864 671344 752720 933147 991191 938994 854647 717128 617832 2011 654571 620838 675341 657667 704048 765048 974278 1033671 1035669 843113 706599 646054 2012 678962 642585 686286 677252 765092 859742 978168 1072648 1027562 922813 742844 627552

Los datos de la demanda mxima presentada en Baja California (en megawatt) se obtienen del Programa de Obras e Inversiones del Sector Elctrico 2012 (POISE) desarrollado por la Comisin Federal de electricidad (CFE). En la Tabla 2.2, se presentan las demandas correspondientes al perodo analizado, de acuerdo al reporte del POISE Tabla 2.2. Demandas mximas anuales reportadas en Baja California.
Ao 2005 2006 2007 2008 2009 2010 2011 2012 Demanda (MW) 1961.00 2095.00 2208.00 2092.00 2132.00 2229.00 2327.00 2469.00

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013

3. Mtodo de anlisis: Regresin lineal simple


El anlisis de regresin es la parte de la estadstica que investiga la relacin entre dos o ms variables, las cuales estn relacionadas de forma no deterministica. Este anlisis permite desarrollar procedimientos para hacer inferencias sobre los parmetros de un modelo, y obtener una medida cuantitativa (el coeficiente de correlacin) de la medida en la que estn relacionadas las dos variables. La expresin matemtica ms simple para relacionar dos variables x y y, es una relacin linear, de la forma:

Esta ecuacin describe la recta de regresin y corresponde al modelo estadstico de regresin, con pendiente e intercepto en y . La variable x se establece como la variable independiente (o predictiva) y la variable y, como la variable dependiente. De esta forma, para un valor fijo de x, se tendr un valor de respuesta y. Los errores e, son el componente estadstico del modelo, los cuales se distribuyen normalmente alrededor de la recta. Si se dice que y no tiene relacin lineal con x. Si se dice que tiene una relacin con x, conforme x, disminuye, la respuesta media de y, disminuye. Por otro lado, si y tiene una relacin lineal con x, conforme x aumenta, tambin aumenta la respuesta media de y.

Criterio de Mnimos Cuadrados


El principio de los mnimos cuadrados establece que una lnea provee un buen ajuste a pares de datos si las distancias verticales (las desviaciones) de los puntos observados a la lnea de regresin son pequeas. La medida de qu tan bueno es el ajuste entre datos es la suma de los cuadrados de las desviaciones. Por tanto, la lnea que mejor se ajusta es la que presenta la menor suma posible de los cuadrados de las desviaciones. Dados los puntos (xi, yi), las desviaciones verticales de la lnea y=a+bx ser:

La suma de los cuadrados de las desviaciones verticales de los puntos (xi, yi),....,(xn, yn) a la lnea es entonces:

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013 A estos valores se les conoce como los estimadores de mnimos cuadrados y se les denota como: y ; estos son los valores que minimizan . Esto es, y son tales que f( , ) para cualquier a y b. La lnea de regresin estimada o lnea de mnimos cuadrados es entonces la lnea con ecuacin: + x

Estimadores de Mnimos Cuadrados Ordinarios


El estimador del coeficiente de la pendiente El estimador del intercepto de la lnea de regresin es:

de la lnea de regresin es:

Si r es la correlacin (x es fija) entre Y y x,

Error de prediccin, estimacin de la varianza y coeficiente de determinacin R2


El error de prediccin est dado por la diferencia:

En el que a los , se les conoce como residuales. El error de suma de cuadrados (SSE) es:

El SSE puede ser interpretado como una medida de cunta variacin en y, no es explicada por el modelo. Por ejemplo, si SSE=0, indica que toda la variacin de y est siendo explicada por el modelo. Una medida cuantitativa de la cantidad total de variacin en los valores observados de y est dada por la suma total de cuadrados (SST): 6

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013 La varianza de la respuesta Y:

El coeficiente de determinacin se interpreta como la proporcin observada de la variacin de y que puede ser explicada por el modelo de regresin lineal simple (que se atribuye a una relacin lineal aproximada entre y y x. Entre ms cercano a 1, mayor variabilidad explicada. El coeficiente de determinacin est dado por:

4. Evaluacin:
Se parte del supuesto de que la demanda mxima de un ao se puede modelar de manera lineal a travs de algn estadstico del consumo de energa, por ejemplo: media, mediana o mximo. A continuacin se muestran las grficas de los consumos de energa correspondientes los aos: 2005, 2006 y 2007.

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013

A partir de los datos de consumo elctrico mensual, se calcula para cada ao: la media, la mediana y el mximo; los cuales se compararn con la demanda mxima conocida del ao correspondiente. En la Tabla 4.1 se muestran los datos mencionados. Tabla 4.1. Estadsticos y demanda de Baja California.
2005 2006 2007 2008 2009 2010 2011 2012 Media 708029.00 758766.92 768594.25 801222.64 770690.01 757372.02 788258.38 823086.74 Mediana 648885.00 695678.50 708649.00 716269.50 701847.15 694235.98 705323.63 753967.69 Mximo 938722.00 1003329.00 1012356.00 1076591.00 1026115.31 991191.40 1035669.29 1072648.16 Demanda 1961.00 2095.00 2208.00 2092.00 2132.00 2229.00 2327.00 2469.00

Se comparan las medidas de los datos contra la demanda a travs de una regresin lineal simple. De esta forma, los pares de datos que se analizarn, son: media(x)-demanda (y), mediana(x)-demanda (y), mximo(x)-demanda(y). Como se observa, en todos los casos, la demanda es la variable de respuesta, mientras que las medidas de los consumos funcionan como variables predictivas. El objetivo es encontrar la medida que mejor se relacione con la demanda. A continuacin se presentan las evaluaciones individuales. Los modelos de regresin lineal se basan en las siguientes suposiciones: el error se distribuye de forma normal, existe homogeneidad en la varianza, y los datos son independientes. En cada caso se evala que se cumpla con las suposiciones.

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013

Par (x,y): Media(x)-Demanda(y)


El primer paso consiste en calcular la correlacin entre la media y la demanda, y obtener el modelo lineal de las variables. Los clculos se hacen utilizando R.
> fit1 Call: lm(formula = demanda1 ~ media) Coefficients: (Intercept) 0.053050 media 0.003523

> cor(demanda1,media) [1] 1

Como vemos, la correlacin que obtenemos es 1. La recta ajustada de prediccin de nuestro sistema ser: +0.003523x +0.003523*media La grfica de dispersin de los datos con la recta ajustada:

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013 1. Normalidad y homogeneidad

La grfica de residuos contra predichos no muestra con claridad si existe o no un patrn en los datos, por tanto, se decide hacer una prueba de normalidad sobre los residuales, en este caso, la de Shapiro-Wilk. Adicionalmente, se presenta un grfico de QQplots.

Prueba de hiptesis: 1. 2. Se utilizar el estadstico de prueba 3. Se rechazar H0 si


(

.
)

. 10

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013 4. 5. Como: , por lo que no se rechaza H0.

6. Los residuales tienen una distribucin normal.


Shapiro-Wilk normality test data: residuo W = 0.9355, p-value = 0.567

2. Independencia: Prueba de Durbin-Watson


Durbin-Watson test data: fit1 DW = 2.839, p-value = 0.844 alternative hypothesis: true autocorrelation is not 0

D=0, indica una autocorrelacin dependiente. D=2, indica una autocorrelacin independiente. Como vemos, la D obtenida es mayor a 2. Adems, si calculamos el coeficiente de autocorrelacin= -0.9195. No se trata de un coeficiente de auto correlacin bajo, sin embargo, al evaluar con un p-valor con 5% de significancia, vemos que el p-valor obtenido es de 0.844, por tanto, no se rechaza la hiptesis nula y se puede considerar que los datos son independientes. En la grfica de residuales parece que hay un patrn, sin embargo, el QQ plot y la prueba de normalidad muestran que el error se distribuye de forma normal. La correlacin que se obtiene con este modelo es muy buena, al ser una correlacin de 1. A continuacin se obtienen las correlaciones y los modelos de regresin de los otros estadsticos para concluir cul puede predecir de mejor forma la demanda.

Par (x,y): Mediana(x)-Demanda(y)


Se calcula la correlacin entre la mediana y la demanda, as como los coeficientes para establecer el modelo de regresin de los datos.
> fit2 Call: lm(formula = demanda1 ~ mediana) Coefficients: (Intercept) -1.062e+02 mediana 4.019e-03

> cor(mediana,demanda1) [1] 0.9640545

11

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013 En este caso, vemos que la correlacin obtenida es de 0.9640. La recta de prediccin de los datos estar dada por: +0.004019x +0.004019*mediana La grfica de dispersin de los datos con la recta ajustada:

1. Normalidad y homogeneidad

Se realiza la prueba de normalidad de Shapiro-Wilk sobre los residuales.

12

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013

Prueba de hiptesis: 1. 2. Se utilizar el estadstico de prueba 3. Se rechazar H0 si 4. 5. Como: , por lo que no se rechaza H0.
(

.
)

6. Los residuales tienen una distribucin normal.


Shapiro-Wilk normality test data: residuo W = 0.8345, p-value = 0.06617

2. Independencia: Prueba de Durbin-Watson


Durbin-Watson test data: fit2 DW = 2.7286, p-value = 0.7901 alternative hypothesis: true autocorrelation is greater than 0

Como vemos, la D obtenida es mayor a 2. El coeficiente de autocorrelacin= 0.8643. Como vemos, en este caso tenemos un coeficiente de correlacin alto, en comparacin con el anterior. Sin embargo, si evaluamos mediante el p-valor con un nivel 13

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013 de significancia de 5%, vemos que el p-valor es mucho mayor que 0.05, por tanto, no rechazamos Ho, lo cual indica que no hay autocorrelacin entre los datos. Nuevamente vemos que la suposicin de un modelo lineal para los datos es vlida.

Par (x,y): Mximo(x)-Demanda(y)


Finalmente, se calcula el modelo de regresin del mximo con la demanda.
> fit3 Call: lm(formula = demanda1 ~ maximo) Coefficients: (Intercept) 42.143536 maximo 0.002626

> cor(demanda1,maximo) [1] 0.9736856

La correlacin obtenida con este par es de 0.9736. La recta de prediccin de los datos estar dada por: +0.002626x +0.002626*maximo La grfica de dispersin de los datos con la recta ajustada:

14

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013 1. Normalidad y homogeneidad

| Se realiza la prueba de normalidad de Shapiro-Wilk sobre los residuales. Prueba de hiptesis: 1. 2. Se utilizar el estadstico de prueba 3. Se rechazar H0 si 4. 5. Como: , por lo que no se rechaza H0.
(

.
)

6. Los residuales tienen una distribucin normal. 15

Relacin entre datos de energa y demanda de un sistema elctrico December 3, 2013


Shapiro-Wilk normality test data: residuo W = 0.9935, p-value = 0.99887

2. Independencia: Prueba de Durbin-Watson


Durbin-Watson test data: fit2 DW = 1.2152, p-value = 0.1532 alternative hypothesis: true autocorrelation is not 0

La D obtenida es de 1.2152, con lo que se obtiene un coeficiente de autocorrelacin de 0.1076, el cual indica que los datos no estn autocorrelacionados. Esto se sustenta si evaluamos con el p-value con un nivel de significancia de 5%, por tanto, no rechazamos Ho, que indica que no hay autocorrelacin.

5. Conclusin:
En todos los casos se comprobaron los supuestos de normalidad en el residuo (error) y de independencia entre los datos. Al cumplirse las suposiciones, es posible afirmar que los datos se pueden modelar mediante una regresin lineal. Se compararon los resultados obtenidos en los modelos de regresin de los estadsticos evaluados mediante el coeficiente de determinacin.
CDD Media 1 Mediana 0.96 Mximo 0.97

La recta que mejor se ajusta es la que relaciona la demanda con la media. Al tener un coeficiente de determinacin de 1, es posible decir que la variabilidad de la demanda es bastante bien explicada a travs de la media. Por tanto, se asume que el estadstico que predice mejor a la demanda, de los tres evaluados es la media.

16

Anda mungkin juga menyukai