Anda di halaman 1dari 15

Universidad Nacional Autónoma

De
Nicaragua
Recinto Universitario «Rubén Darío»
Facultad de Ciencia e Ingeniería
Departamento de Biología.

Presentado por:

Albert Arostegui.

Junieth Baltodano.

Séfora Rodríguez.

Dirigido a:

Prof. Oliver Morales.

Carrera:

Gerencia Ambiental y de los Recursos Naturales.


Introducción.

En el presente trabajo se abordará el tema de regresión lineal para dos variables (una dependiente
y otra independiente). El objetivo es aplicar lo aprendido en clases y analizar los valores resultantes
del empleo de las fórmulas propuestas por el docente.

Para empezar se explica que un modelo es una función que se ajusta a datos reales u observados,
y en este caso se trabajará con uno lineal, es decir de la forma: 𝑌𝑖 = 𝑏𝑋𝑖 + 𝑎, donde se puede
apreciar que la variable independiente (𝑋i) tiene potencia 1, así como los parámetros b y a. Cabe
destacar que dicho modelo, al graficarse en el plano cartesiano genera una recta (Gujarati y Porter,
2010).

Se establecerá una función de regresión muestral (FRM) para una serie de datos anuales de las
siguientes variables: emisiones de dióxido de carbono (CO2) y el consumo de energía primaria.
Ambas fueron obtenidas de la base de datos de la Comisión Económica para América Latina y el
Caribe (CEPAL), y son los registros del país de Argentina en el período 1995-2014.

El modelo será:

𝑌̂𝑖 = 𝑏̂𝑋𝑖 + 𝑎̂ + 𝜇̂ 𝑖

Donde:

𝑌̂𝑖 : Representa la emisión de CO2 en millones de toneladas equivalentes de dióxido de carbono


(MtCO2e).

𝑋𝑖 : Consumo de energía primaria en miles de barriles equivalentes de petróleo (KBEP).

𝑏̂: Pendiente de la recta.

𝑎̂: Intercepto

𝜇̂ 𝑖 : Término conocido como perturbación estocástica o error.

Se aclara que el símbolo ^ (conocido como “gorro” o circunflejo) denota que el elemento sobre el
cual se sitúa es una estimación.
Breve descripción de las variables.

Antes de establecer el modelo, se describirá brevemente las variables seleccionadas.

Dióxido de carbono (CO2): Es un gas incoloro e inodoro, tiene una mayor densidad que el aire y
puede acumularse en zonas bajas provocando un déficit de oxigeno (FISQ, 2006). Cabe mencionar
que se trata de uno de los gases de efecto invernadero; en otras palabras, tiene la capacidad de
reabsorber y reemitir luz infrarroja a la Tierra, su origen puede ser natural y/o antropogénico
(Montaño y Sandoval, 2007).

En la siguiente gráfica se presenta el comportamiento de las emisiones de CO2 en la República de


Argentina en el período 1995-2014.

Elaboración propia.
Fuente: Comisión Económica para América Latina y el Caribe.

Energía primaria.

Se considera energía primaria a la disponible en la naturaleza antes de ser transformada, entre de


las cuales la más utilizada es la que proviene de los combustibles fósiles.

En la siguiente gráfica se presenta el consumo de energía primaria (en miles de barriles


equivalentes de petróleo) en la República de Argentina en el período 1995-2014.
Elaboración propia.
Fuente: Comisión Económica para América Latina y el Caribe.

Fórmulas 1 y 2.

Para calcular los estimadores de la FRM, se aplicarán las siguientes fórmulas (las cuales se obtienen
por el método de mínimos cuadrados):

∑ 𝑥𝑖 𝑦𝑖
𝑏̂ = (1)
∑ 𝑥𝑖2

𝑎̂ = 𝑌̅ − 𝑏̂𝑋̅ (2)

Donde:

𝑥𝑖 𝑦 𝑦𝑖 : Representan las desviaciones de las variables X (consumo de energía primaria) y Y


(emisión de CO2) con respecto a sus medias.

𝑌̅: Media de valores de la variable Y.

𝑥 2 : Representa la variación de valores de la variable X.

𝑋̅: Media de valores de la variable X.


Para los cálculos aritméticos que implican las ecuaciones (1) y (2) se hará uso del programa de
Excel, de modo que se ordenará en tablas.

Tabla 1. Cálculos aritméticos.


n X Y x y xy x^2
1 78216.5238 171.6882 43592.0554 -59.16452 2579103.21 1900267294
2 80363.8268 176.7979 -41444.752 -54.05482 2240288.8 1717667501
3 84829.3848 178.8852 -36979.194 -51.96752 1921717.17 1367460818
4 94347.2468 180.0961 -27461.332 -50.75662 1393844.52 754124777
5 98382.9855 187.9365 -23425.593 -42.91622 1005338.03 548758440
6 102224.262 189.803 -19584.317 -41.04972 803930.808 383545472
7 101598.938 199.592 -20209.641 -31.26072 631768.009 408429589
8 106581.007 203.0892 -15227.572 -27.76352 422771.069 231878958
9 108638.295 207.9248 -13170.283 -22.92792 301967.266 173456375
10 113648.895 210.5826 -8159.6841 -20.27012 165397.809 66580444.6
11 113776.026 208.8372 -8032.5528 -22.01552 176840.859 64521904.5
12 112784.173 216.4434 -9024.4064 -14.40932 130035.596 81439910.9
13 112043.115 211.8413 -9765.4642 -19.01142 185655.38 95364291
14 119897.812 221.0264 -1910.7675 -9.826324 18775.8205 3651032.44
15 136280.427 243.2078 14471.8481 12.355076 178800.783 209434387
16 156470.292 242.1423 34661.7125 11.289576 391316.038 1201434313
17 141013.99 269.8823 19205.4107 39.029576 749579.037 368847800
18 148694.08 269.2249 26885.5004 38.372176 1031655.15 722830132
19 143870.895 285.4867 22062.3153 54.633976 1205352 486745756
20 137632.975 278.337 15824.3957 47.484276 751409.973 250411499
21 141975.421 275.3133 20166.8414 44.460576 896629.385 406701492
22 150187.34 281.012 28378.761 50.159276 1423458.11 805354076
23 149394.242 288.7383 27585.6631 57.885576 1596812 760968809
24 156154.72 281.4725 34346.1407 50.619776 1738593.95 1179657381
25 156207.608 291.9572 34399.0285 61.104476 2101934.61 1183293162
∑ 3045214.48 5771.3181 5.2387E-10 8.5265E-1 24042975.4 1.5373E+10
Media X: 121808.5792 Media Y: 230.852724

Elaboración propia

Fuente: Comisión Económica para América Latina y el Caribe


Reemplazando en (1) y (2), se tiene:

∑ 𝑥𝑖 𝑦𝑖 24042975.38
𝑏̂ = 2 = = 0.001563992
∑ 𝑥𝑖 15372825617.81

𝑎̂ = 230.852724 − 0.001563992 ∗ 121808.5792 = 40.34508091

De modo que el modelo que relaciona las emisiones de CO2 y el consumo de energía primaria en
Argentina, queda de la siguiente manera aproximado a cuatro cifras decimales:

𝑌̂ = 0.0016𝑋 + 40.3451

Como se puede apreciar la pendiente del modelo es 0.0016, por tanto, por cada mil barriles
equivalentes de petróleo de consumo de energía primaria, las emisiones de CO2 incrementarán o
disminuirán de forma directa -respecto a la variable independiente- con una proporción constante
de 1600 toneladas aproximadamente, debido al signo positivo de la pendiente. Por otro lado, el
valor del intercepto es 40.3451, el cual se puede interpretar como el valor promedio de emisiones
de CO2, cuando no interfiere la variable del consumo de energía primaria (X=0).

Fórmulas 3, 4, 5 y 6.

Para el análisis del modelo, se debe tomar en cuenta las medidas de variación, ya que así como los
valores reales de las variables cambian, también cambiarán los errores y estimadores.

Varianza del error:

2
∑ 𝜇̂ 𝑖2
𝜎̂ = (3)
𝑛−𝑘

Desviación estándar del error:

𝜎̂ = √𝜎̂ 2 (4)

Desviación estándar del intercepto:

∑ 𝑋𝑖2
̂= √
𝜎𝑎 ∙ 𝜎̂ (5)
𝑛 ∑ 𝑥𝑖2
Desviación estándar de la pendiente:

𝜎̂ 2
̂= √
𝜎𝑏 (6)
∑ 𝑥𝑖2

Tabla 2. Valores de Y estimada, error, error al cuadrado y X al cuadrado.

𝑌̂ 𝜇̂𝑖 𝜇̂𝑖 2 X^2


162.675101 9.01309934 81.2359598 6117824595
166.033465 10.7644348 115.873056 6458344658
173.017562 5.86763803 34.4291761 7196024526
187.903421 -7.80732143 60.954268 8901402979
194.215284 -6.27878424 39.4231315 9679211836
200.22301 -10.42001 108.576609 1.045E+10
199.245008 0.34699166 0.12040321 1.0322E+10
207.036924 -3.94772364 15.5845219 1.136E+10
210.254506 -2.32970627 5.42753132 1.1802E+10
218.091044 -7.50844383 56.3767287 1.2916E+10
218.289876 -9.45267615 89.3530865 1.2945E+10
216.738625 -0.29522512 0.08715787 1.272E+10
215.579617 -3.73831669 13.9750117 1.2554E+10
227.864299 -6.83789903 46.7568631 1.4375E+10
253.486578 -10.2787778 105.653273 1.8572E+10
285.063363 -42.921063 1842.21765 2.4483E+10
260.889832 8.99246844 80.8644886 1.9885E+10
272.90143 -3.67652996 13.5168725 2.211E+10
265.358007 20.1286927 405.164268 2.0699E+10
255.601951 22.7350487 516.882437 1.8943E+10
262.393501 12.9197986 166.921195 2.0157E+10
275.236878 5.7751225 33.3520398 2.2556E+10
273.996479 14.7418212 217.321293 2.2319E+10
284.569811 -3.09731127 9.59333707 2.4384E+10
284.652527 7.30467264 53.3582424 2.4401E+10
∑ 5771.3181 2.558E-13 4113.0186 3.8631E+11

Elaboración propia
Reemplazando en (3) y (4):

4113.0186
𝜎̂ 2 = = 178.8269
23

𝜎̂ = √178.8269 = 13.3726

Es decir 13.3726 es la desviación estándar de los errores en relación a la línea de mejor ajuste o
bien a la recta que se genera a partir del modelo estimado.

Reemplazando en (5):

386306074785.88
̂ = √
𝜎𝑎 ∗ 13.3726 = 13.4071
25 ∗ 15372825617.81

Reemplazando en (6):

178.8269
̂= √
𝜎𝑏 = 0.00010785
15372825617.81

Fórmulas 7, 8 y 9.

Es importante tener alguna prueba de la calidad del modelo establecido, una de las formas de saber
que tan bien se ajusta la recta estimada a las observaciones reales, es el coeficiente de
determinación:

𝑏̂ 2 ∑ 𝑥𝑖2
𝑟2 = (7)
∑ 𝑦𝑖2

Dado que ya se calcularon todos los valores requeridos para la formula (ver en anexo 1 la tabla en
la que se define el valor de la variación de la variable Y), solo se debe reemplazar en (7), entonces:

(0.001563992)2 ∙ 15372825617.81
𝑟2 = = 0.9014
41716.03834

El valor de 𝑟 2 informa que la variable seleccionada (consumo de energía primaria) explica un


90.14% a la variación de la variable dependiente.
Dado a que 𝑟 2 tiene la inconveniencia de aumentar si se anexan más variables regresoras, Henry
Theil desarrolló la 𝑟̅ 2 con el fin de penalizar el acto de agregar variables explicativas por obtener
un mejor coeficiente de determinación (Gujarati y Porter, 2010).

∑ 𝜇𝑖2
𝑟̅ 2 = 1 − 𝑛 − 2𝑘 (8)
∑ 𝑦𝑖
𝑛−1

Reemplazando en (8):

4113.0186
2
𝑟̅ = 1 − 23 ⁄
41716.03834 = 0.8971
24

Este valor significa que dado al ajuste de involucrar los grados de libertad, la variable independiente
explica en un 89.71% a la variación de la variable dependiente, como se puede apreciar, muy
cercano a 𝑟 2 .

Coeficiente de Pearson: Mide la fuerza de relación lineal entre las variables X y Y (Triola, 2009),
se calcula por medio de la fórmula:

∑ 𝑥𝑖 𝑦𝑖
𝑟= (9)
√∑ 𝑥𝑖2 ∑ 𝑦𝑖2

Reemplazando:

24042975.38
𝑟= = 0.9494
√15372825617.81 ∙ 41716.03834

Los valores de r siempre están entre -1 a 1, es decir: −1 ≤ 𝑟 ≤ 1, en este caso se observa que r es
muy cercano a 1, indicando una relación lineal positiva entre el consumo de energía primaria y las
emisiones de CO2 en Argentina. Se puede tomar al coeficiente de Pearson como un cálculo formal
para determinar si existe o no relación lineal positiva o negativa entre dos variables, pues de manera
más rudimentaria la tendencia es apreciable por medio de una gráfica de dispersión (véase anexo
4).
Conclusiones.

 La pendiente del modelo es positiva, por tanto, entre el consumo de energía primaria y las
emisiones de CO2 existe una relación directa, es decir, si la primera variable crece, la
segunda también, y si los valores de la primera variable decrecen, en consecuencia lo harán
los de la segunda.
 El coeficiente de determinación tiene un valor alto, por ende existe evidencia de que la
variable independiente elegida para el modelo es buena para explicar al comportamiento de
los valores de las emisiones de CO2 en Argentina.
 El coeficiente de Pearson, indica una fuerte relación lineal positiva entre el consumo de
energía primaria y las emisiones de CO2, lo cual constata lo mencionado sobre el signo de
la pendiente del modelo.
Bibliografía.

Fichas Internacionales de Seguridad Química. (2006). Dióxido de carbono. Extraído de


http://www.insht.es/InshtWeb/Contenidos/Documentacion/FichasTecnicas/FISQ/Ficheros
/0a100/nspn0021.pdf

Gujarati, D., & Porter, D. (2010). Econometría. México: McGraw-Hill.

Montaño, N., & Sandoval, A. (2007). Contaminación atmosférica y salud. Elementos. 14 (065).
Recuperado de http://www.redalyc.org/pdf/294/29406504.pdf

Triola, M. (2009). Estadística. México: Pearson Educación.


Anexos

Anexo 1. Variación de la variable Y con respecto a su media.

Y 𝑦2
171.6882 3500.4409
176.7979 2921.924
178.8852 2700.62355
180.0961 2576.23488
187.9365 1841.80228
189.803 1685.07984
199.592 977.232865
203.0892 770.813265
207.9248 525.689699
210.5826 410.877927
208.8372 484.683297
216.4434 207.628618
211.8413 361.434243
221.0264 96.5566434
243.2078 152.647903
242.1423 127.454526
269.8823 1523.3078
269.2249 1472.42389
285.4867 2984.87133
278.337 2254.75647
275.3133 1976.74282
281.012 2515.95297
288.7383 3350.73991
281.4725 2562.36172
291.9572 3733.75699
∑ 5771.3181 41716.0383
Anexo 2. Estimación de regresión en Eviews.
Anexo 3. Estimación por medio de análisis de datos en Excel.

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.949423184
Coeficiente de determinación R^2 0.901404381
R^2 ajustado 0.897117615
Error típico 13.37261739
Observaciones 25

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 37603.01974 37603.01974 210.2760861 4.63851E-13
Residuos 23 4113.018602 178.8268957
Total 24 41716.03834

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
Intercepción 40.34508777 13.40711495 3.009229645 0.006253295 12.61035739 68.07981814 12.61035739 68.07981814
Variable X 1 0.001563992 0.000107855 14.50089949 4.63851E-13 0.001340877 0.001787107 0.001340877 0.001787107
Anexo 4. Gráfico de dispersión.

Anda mungkin juga menyukai