Anda di halaman 1dari 57

Diplomado en Gestión de Operaciones y

Logística

Módulo: Pronósticos de la Demanda


Profesor: Christian Ferrada
septiembre y octubre 2018
Introducción
• Proyectar es una práctica común en los negocios, que ayuda en la toma de decisiones,
principalmente en la programación de la producción, del transporte y del personal. Además,
provee una guía para la planeación estratégica de largo plazo.
• Existen conceptos clave que es importante distinguir:
– Proyección: es sobre predecir el futuro lo más exacto posible, dada la información
disponible (sobre datos pasados y sobre el conocimiento de eventos futuros que podrían
afectar las proyecciones).
– Objetivo: es lo que nos gustaría que pase. Debe relacionarse con la proyección y
planificación.
– Planificación: es una respuesta a las proyecciones y objetivos. Involucra acciones que se
deben alcanzar para que las proyecciones coincidan con los objetivos.
• Otra distinción entre proyección y planificación es que la primera se relaciona con eventos
externos que en general no son controlables, mientras que la segunda se relaciona con
eventos internos que en general sí son controlables.
• El ejemplo más básico de proyección corresponde a las ventas de una compañía.
• Las ventas se determinan por la interacción de la economía nacional, clientes, competencia,
marketing, entre otros.
• La planificación, en cambio, involucra decisiones en áreas como marketing, producción,
finanzas y objetivos de la compañía.

2
Flujos de
información en la
proyección de
ventas y
planificación del
negocio

3
Categorías y ejemplos de distintos
métodos de proyección
• Cuantitativa: existe suficiente información cuantitativa.
– Explicativa: comprender la forma en que variables explicativas como precios y publicidad
afecta las ventas.
– Series de tiempo: predecir la continuación de patrones históricos como el crecimiento
de las ventas o del producto nacional bruto.
• Cualitativa: se dispone de poca o ninguna información cuantitativa, pero existe suficiente
conocimiento cualitativo.
– Predecir la velocidad de internet en 20 años más.
– Proyectar cómo el aumento en el precio del petróleo afectará su consumo.
• No predecible: se dispone de muy poca o ninguna información.
– Predecir los efectos del viaje interplanetario.
– Predecir el descubrimiento de energía nueva y más barata que no contamine.

4
Pasos básicos en la tarea de pronóstico
1. Definición del problema: comprende el entendimiento de cómo los pronósticos serán
utilizados, quién los requiere y cómo la función de pronosticar encaja en la organización.
Por ejemplo, consideremos la pregunta de un gerente de una empresa fabricante de productos
de papel:
“Tenemos un control de inventarios computarizado y obtenemos información diaria, semanal y
mensual, pero nuestra situación de inventarios es mala. Tenemos exceso de inventarios en las
fábricas y en las bodegas. ¿Podemos obtener mejores proyecciones de la producción y demanda
futuras y así reducir nuestros inventarios y ahorrar costos de bodegaje?”

2. Recolectar información: estadística y juicio y experiencia de personal clave.


Por ejemplo, la producción y demanda mensual de distintos SKU en los últimos 3 años. También
usar información relevante al análisis, como la ocurrencia y duración de caídas en la producción
debido a fallas en los equipos.

5
Pasos básicos en la tarea de pronóstico
3. Análisis exploratorio preliminar: gráficos de los datos, versus otros datos, construcción de
estadísticas descriptivas, descomposición de los datos en tendencia, estacionalidad, ciclos,
datos inusuales.

4. Elección y ajuste de modelos: cada modelo se basa en supuestos e involucra la estimación de


parámetros que deben ser obtenidos ajustando el modelo a los datos pasados.
Ejemplos de métodos son las regresiones lineales, suavizamiento exponencial, Box-Jenkins
ARIMA, modelos de intervención, de transferencia, ARMA multivariados.

5. Usar y evaluar el modelo de proyección: se debe evaluar las ventajas y desventajas del
modelo de proyección a medida que pasa el tiempo. Un ejercicio útil es ver cómo el modelo
se ajusta a los datos conocidos y cómo proyecta valores futuros que se van conociendo a
medida que el tiempo transcurre. Se debe distinguir entre errores de ajuste (del modelo) y
errores de proyección (asociados a la incerteza sobre el futuro).

6
Transformaciones y ajustes a los datos
• Para remover variabilidad que crece en el tiempo: se pueden utilizar transformaciones como
raíz cuadrática, raíz cubica, logaritmo natural o negativo del inverso.
• Por ejemplo, la producción de energía eléctrica en Chile presenta una volatilidad que crece
en el tiempo, pero la transformación −1/𝑌𝑡 la reduce (la volatilidad se calcula en una ventana
móvil que cubre los últimos dos años).

Generación de energía eléctrica CDEC (GWh)


7.000 400
6.000 300
5.000

σ(Yt)
200
Yt

4.000
3.000 100

2.000 0

2013
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012

2014
2015
2016
2017
2018
Generación de energía eléctrica CDEC (GWh)
0E+0 2E-5

-1E-4

σ(-1/Yt)
-1/Yt

-2E-4 1E-5

-3E-4

-4E-4 0E+0
2000

2004
1999

2001
2002
2003

2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018

7
Transformaciones y ajustes a los datos
• Ajustes calendario: largo del mes varía en un 10% y puede resultar en un efecto estacional:
31 − 28
= 10%
30
• Si la serie original es 𝑌𝑡 y la serie donde se remueve el efecto calendario es 𝑊𝑡 , la serie
ajustada satisface:
365.25/12
𝑊𝑡 = 𝑌𝑡 ×
número de días en el mes 𝑡
• Meses con más días (como enero) reflejan una producción de leche en Chile sobreestimada,
mientras que en meses con menos días (como febrero) ocurre lo contrario. La serie ajustada
corrige estos efectos.

Elaboración de leche fluida


41
serie original
40
39 serie ajustada
millones de lts

38
37
36
35
34
33
32
31
dic-16

dic-17
jul-15

dic-15

jul-16

jul-17
mar-15
abr-15

mar-16
abr-16

mar-17
abr-17
jun-15

jun-16

ene-17

jun-17
ene-15

ago-15

ene-16

ago-16

ago-17
feb-15

may-15

oct-15

feb-16

oct-16

feb-17
sep-15

may-16

sep-16

may-17

oct-17
sep-17
nov-15

nov-16

8 nov-17
Transformaciones y ajustes a los datos
• Otro tipo de ajuste en series de tiempo se origina por efectos de la inflación y por cambios en
la población.
• Por ejemplo, el precio de un auto hace 10 años en pesos no es comparable a los precios
actuales. Precios sin ajustar se denominan precios corrientes, mientras que pesos ajustados
en relación a un año base se llaman precios constantes.
• Otro ajuste se da por ejemplo al analizar el número de usuarios del transporte público. En
este caso, se debería ajustar esta serie por la población en la zona analizada.

9
Descomposición de una serie de tiempo
• Usualmente se identifican dos componentes: tendencia-ciclo y estacionalidad.
• La tendencia-ciclo representa cambios en el nivel de la serie más de largo plazo.
• La estacionalidad se refiere a fluctuaciones periódicas de largo constante que son causadas
por cosas como lluvias, mes del año, vacaciones, y políticas corporativas.
• Un tercer componente corresponde a error o aleatoriedad y que se asume es igual a la
diferencia entre la serie original y los dos componentes mencionados anteriormente
(tendencia-ciclo y estacionalidad). Por lo mismo, también se le denomina componente
irregular o remanente.
• La descomposición de una serie se representa como:
𝑌𝑡 = 𝑓(𝑆𝑡 , 𝑇𝑡 , 𝐸𝑡 )
• Donde 𝑌𝑡 es la serie de tiempo observada en la fecha 𝑡, 𝑆𝑡 es el componente estacional, 𝑇𝑡 es
el componente tendencia-ciclo y 𝐸𝑡 es el componente irregular.
• Si se asume una forma aditiva, entonces:
𝑌𝑡 = 𝑆𝑡 + 𝑇𝑡 + 𝐸𝑡
• Alternativamente, la descomposición multiplicativa tiene la forma:
𝑌𝑡 = 𝑆𝑡 × 𝑇𝑡 × 𝐸𝑡
• Se sugiere el uso del método multiplicativo si la estacionalidad varía proporcionalmente con
el nivel de la serie original.

10
Descomposición de una serie de tiempo
• En vez de elegir una descomposición aditiva o multiplicativa, se puede transformar la
descomposición multiplicativa y recuperar una aditiva aplicando logaritmos.
𝑌𝑡 = 𝑆𝑡 × 𝑇𝑡 × 𝐸𝑡
ln 𝑌𝑡 = ln 𝑆𝑡 + ln 𝑇𝑡 + ln 𝐸𝑡
• ¿Por qué es relevante eliminar la estacionalidad de una serie?
Porque algunas veces no es de interés. Por ejemplo, para el desempleo mensual es importante
saber si un aumento se debe a un empeoramiento de la economía y no por ejemplo al aumento
de desempleados que buscan empleo (que corresponden a una variación estacional).

11
Obtención de la tendencia-ciclo:
Promedio móvil
• Al usar un promedio móvil se ocupan observaciones próximas en el tiempo que
probablemente son cercanas en valor y este promedio entrega una estimación razonable de
la tendencia-ciclo de esa observación.
• Cada promedio se calcula botando la observación más antigua y agregando la próxima.
• El promedio móvil de orden 𝑘 (o 𝑘 MA) cuando 𝑘 es impar se define como el promedio de la
observación y 𝑚 = (𝑘 − 1)/2 puntos hacia cada lado:
1 𝑚
𝑇𝑡 = 𝑌𝑡+𝑗
𝑘 𝑗=−𝑚
• Por ejemplo, un 3 MA calculado en la segunda observación es igual a:
1
𝑇2 = (𝑌1 + 𝑌2 + 𝑌3 )
3
• Mientras más observaciones se usan en el cálculo, es más probable eliminar aleatoriedades,
pero también más términos (e información) se pierde. Además, promedios de muchos datos
pueden eliminar saltos genuinos o ciclos que pueden ser de interés.

12
Obtención de la tendencia-ciclo:
Promedio móvil
• Si 𝑘 es par se puede utilizar un promedio que da un peso igual a 1 para todas las
observaciones y un peso de 0,5 para los extremos, donde se agrega una observación,
resultando en un promedio calculado con un número impar de datos.
• Por ejemplo, un 4 MA calculado en la “segunda y media” observación es igual a:
1
𝑇2,5 = (𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 )
4
• En la “tercera y media” observación:
1
𝑇3,5 = (𝑌2 + 𝑌3 + 𝑌4 + 𝑌5 )
4
• Promediando estos dos promedios móviles (lo que corresponde a un doble promedio móvil,
denotado como 2 × 𝑘 MA):
𝑇2,5 + 𝑇3,5 1 1 1
𝑇3′′ = = 𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 + (𝑌2 + 𝑌3 + 𝑌4 + 𝑌5 )
2 2 4 4
1 1 1 1
𝑇3′′ = 𝑌1 + 2𝑌2 + 2𝑌3 + 2𝑌4 + 𝑌5 = 𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 + 𝑌5
8 4 2 2

13
Obtención de la tendencia-ciclo:
Promedio móvil
• Por ejemplo consideremos las viviendas en Chile cuyas construcciones se encuentran
autorizadas.
• El promedio móvil 3 MA muestra variaciones estacionales mientras que el promedio móvil 2
× 12 MA sigue el ciclo sin estar contaminado por la variación estacional.

Ventas viviendas nuevas, CChC (unidades)


9.000
serie original
8.000
3 MA
7.000 2 x 12 MA
6.000

5.000

4.000

3.000

2.000
jul-03

jul-04

jul-05

jul-06

jul-07

jul-08

jul-09

jul-10

jul-11

jul-12

jul-13

jul-14

jul-15

jul-16

14 jul-17
Descomposición aditiva usando un
promedio móvil para la tendencia-ciclo
• Paso 1: obtener la tendencia-ciclo con un promedio Serie original: ventas viviendas

móvil centrado 2 × 12 MA. 8.000


6.000
• Paso 2: la serie sin tendencia-ciclo se obtiene 4.000
2.000
restando la tendencia-ciclo a los datos: 03 05 07 09 11 13 15 17

𝑅𝑡 = 𝑌𝑡 − 𝑇𝑡 = 𝑆𝑡 + 𝐸𝑡 Tendencia-ciclo
• Paso 3: el componente estacional 𝑆𝑡 se calcula 8000
como el promedio de la serie sin tendencia-ciclo 𝑅𝑡 6000
4000
2000
para cada mes (asumiendo estos son constantes de 03 05 07 09 11 13 15 17
año a año).
• Paso 4: el componente irregular 𝐸𝑡 se calcula Sin tendencia-ciclo
1500
restando a la serie original la estacionalidad y la 0
tendencia-ciclo estimados: -1500
𝐸𝑡 = 𝑌𝑡 − 𝑆𝑡 − 𝑇𝑡 03 05 07 09 11 13 15 17

Estacionalidad
1500
0
-1500
03 05 07 09 11 13 15 17

Componente irregular
1500
0
-1500
15 03 05 07 09 11 13 15 17
Descomposición multiplicativa usando un
promedio móvil para la tendencia-ciclo
• Paso 1: obtener la tendencia-ciclo con un promedio Serie original: ventas viviendas

móvil centrado 2 × 12 MA. 8.000


6.000
• Paso 2: la serie sin tendencia-ciclo se obtiene 4.000
2.000
dividiendo la tendencia-ciclo a los datos: 03 05 07 09 11 13 15 17

𝑅𝑡 = 𝑌𝑡 /𝑇𝑡 = 𝑆𝑡 /𝐸𝑡 Tendencia-ciclo


• Paso 3: el componente estacional 𝑆𝑡 se calcula 8000
como el promedio de la serie sin tendencia-ciclo 𝑅𝑡 6000
4000
2000
para cada mes (asumiendo estos son constantes de 03 05 07 09 11 13 15 17
año a año).
• Paso 4: el componente irregular 𝐸𝑡 se calcula Sin tendencia-ciclo
1,4
dividiendo a la serie original la estacionalidad y la 1
tendencia-ciclo estimados: 0,6
𝐸𝑡 = 𝑌𝑡 /(𝑆𝑡 ∗ 𝑇𝑡 ) 03 05 07 09 11 13 15 17

Estacionalidad
1,2
1,0
0,8
03 05 07 09 11 13 15 17

Componente irregular
1,5
1
0,5
16 03 05 07 09 11 13 15 17
Otra forma para separar la tendencia del
ciclo: Filtro de Hodrick y Prescott
• Es usado principalmente en el análisis de ciclos de negocios reales.
• Remueve el componente cíclico 𝑐𝑡 de una serie de datos 𝑌𝑡 . La tendencia es 𝜏𝑡 = 𝑌𝑡 − 𝑐𝑡 y
para cada fecha se obtiene resolviendo (donde 𝜆 =6,25, 1.600 o 129.600 si se usa con datos
anuales, trimestrales o mensuales, respectivamente):
𝑇 𝑇
2
min (𝑌𝑡 − 𝜏𝑡 ) + 𝜆 [ 𝜏𝑡+1 − 𝜏𝑡 − (𝜏𝑡 − 𝜏𝑡−1 )]2
𝜏𝑡 𝑡=1 𝑡=1
• El primer término penaliza desviaciones respecto a la tendencia, y el segundo, variaciones en
el crecimiento de la tendencia.
• En el caso del PIB trimestral en Chile el componente tendencial HP es muy parecido al
obtenido por el promedio móvil centrado 2 × 12 MA, aunque es menos variable.

PIB, MMM$ encadenado año 2013


40.000
serie original
35.000 2 x 12 MA
componente tendencial HP
30.000

25.000

20.000

15.000
mar-98

mar-07
mar-96
mar-97

mar-99
mar-00
mar-01
mar-02
mar-03
mar-04
mar-05
mar-06

mar-08
mar-09
mar-10
mar-11
mar-12
mar-13
mar-14
mar-15
mar-16
mar-17
mar-18
17
Calculando el filtro de Hodrick y Prescott
en Excel
• Se hace uso de la herramienta Solver de Excel.
• Se minimiza la función objetivo haciendo variar las celdas que contienen las tendencias 𝜏𝑡 .
• Solver posee opciones de convergencia que son importantes de configurar para que el
problema se resuelva con gran exactitud. A modo de ejemplo, una buena configuración es la
siguiente:

18
Calculando el filtro de Hodrick y Prescott
en Excel
• Podemos comparar los resultados de Excel con los obtenidos por un software estadístico
como Stata. Notamos que el componente tendencial 𝜏𝑡 es igual al comparar ambos métodos
(columna O en Excel y columna HP_yt_sm_1 en Stata).
• El componente cíclico se obtiene calculando 𝑐𝑡 = 𝑌𝑡 − 𝜏𝑡 . También este resultado es igual en
ambos métodos (columna S en Excel y columna HP_yt_1 en Stata).

19
Comparando el filtro HP y la
descomposición multiplicativa
• El filtro de Hodrick y Prescott aplicado al PIB
Serie original: PIB
trimestral en Chile se muestra gráficamente abajo,
45.000
mientras que la descomposición multiplicativa de 30.000
la misma serie usando una tendencia-ciclo 15.000

calculada con un promedio móvil centrado 2 × 12 96 98 00 02 04 06 08 10 12 14 16 18

MA se muestra a la derecha. Tendencia-ciclo


• Se observa que el filtro HP está diseñado para 45.000
30.000
recuperar el componente cíclico.
15.000
96 98 00 02 04 06 08 10 12 14 16 18

Serie original: PIB Sin tendencia-ciclo


45.000 1,05
30.000 1,00
15.000 0,95
96 98 00 02 04 06 08 10 12 14 16 18 96 98 00 02 04 06 08 10 12 14 16 18

Componente tendencial HP Estacionalidad


45.000 1,04
30.000 1,00
15.000 0,96
96 98 00 02 04 06 08 10 12 14 16 18 96 98 00 02 04 06 08 10 12 14 16 18

Componente cíclico HP Componente irregular


2.000,00 1,02
0,00 1,00
-2.000,00 0,98
20
96 98 00 02 04 06 08 10 12 14 16 18 96 98 00 02 04 06 08 10 12 14 16 18
Proyectando con promedios móviles y
suavizamientos exponenciales
• El promedio simple es el método más sencillo para proyectar. Sin embargo, su uso requiere
que los datos sean estacionarios, es decir, el proceso que genera los datos está en equilibrio
alrededor de un valor constante (la media) y la varianza alrededor de la media también
permanece constante en el tiempo.
• Lo anterior se cumple difícilmente pues una serie de datos en general posee tendencia y
patrones estacionales (por ejemplo, mayores ventas de kerosene durante meses fríos).
• La proyección de una serie de datos usando el promedio simple se define como:
1 𝑡
𝐹𝑡+1 = 𝑌𝑖
𝑡 𝑖=1
• Cuando se tiene un nuevo dato 𝑌𝑡+1 la proyección para 𝑡 + 2 es el nuevo promedio
incluyendo los datos previamente observados más este nuevo dato:
1 𝑡+1
𝐹𝑡+2 = 𝑌
𝑡 + 1 𝑖=1 𝑖
• Para ahorrar en cálculos se puede escribir esta proyección de forma recursiva:
𝑡𝐹𝑡+1 + 𝑌𝑡+1
𝐹𝑡+2 =
𝑡+1

21
Promedio móvil
• Incluyen la información más reciente y mejoran el supuesto de mantener un promedio
constante.
• A medida que se agrega una nueva observación, se calcula un nuevo promedio removiendo la
observación más antigua y agregando la más nueva.
• La proyección usando un promedio móvil de orden 𝑘, o MA(𝑘) está dada por:
1 𝑡 𝑌𝑡 + 𝑌𝑡−1 + ⋯ + 𝑌𝑡−𝑘+1
𝐹𝑡+1 = 𝑌𝑖 =
𝑘 𝑖=𝑡−𝑘+1 𝑘
• Notar que esto es distinto a 𝑘 MA, que correspondía al suavizador de promedio móvil de
orden 𝑘 utilizado en la descomposición de una serie.
• El promedio móvil para proyectar es mejor que el promedio simple pues considera los datos
más recientes, pero no está diseñado para manipular tendencia o estacionalidad.
• Reescribiendo para el siguiente período:
𝑌𝑡+1 + 𝑌𝑡 + ⋯ + 𝑌𝑡−𝑘+2 𝑌𝑡+1 − 𝑌𝑡−𝑘+1
𝐹𝑡+2 = = 𝐹𝑡+1 +
𝑘 𝑘
• Es decir, la nueva proyección 𝐹𝑡+2 ajusta la proyección anterior 𝐹𝑡+1 con una 𝑘-ésima parte
de la diferencia entre 𝑌𝑡+1 y 𝑌𝑡−𝑘+1 .

22
Suavizamiento exponencial
• Una extensión al promedio móvil es el promedio móvil ponderado, donde cada observación
posee un ponderador 𝑤𝑖 que suman uno, 𝑖 𝑤𝑖 = 1..
• La proyección usando un promedio móvil ponderado de orden 𝑘, o WMA(𝑘) está dada por:
1 𝑡 𝑤𝑡 𝑌𝑡 + 𝑤𝑡−1 𝑌𝑡−1 + ⋯ + 𝑤𝑡−𝑘+1 𝑌𝑡−𝑘+1
𝐹𝑡+1 = 𝑤𝑖 𝑌𝑖 =
𝑘 𝑖=𝑡−𝑘+1 𝑘
• El suavizamiento exponencial considera ponderadores que caen exponencialmente a medida
que las observaciones son mas antiguas, con una caída determinada por un parámetro 𝛼
(constante que varía entre 0 y 1).
• Asumiendo que la proyección para el dato 𝑌𝑡 que aún no conocemos es 𝐹𝑡 .
• Una vez conocido el dato 𝑌𝑡 sabemos que el error de proyección fue 𝑌𝑡 − 𝐹𝑡 .
• El suavizamiento exponencial toma la proyección del período anterior y la ajusta usando el
error de proyección:
𝐹𝑡+1 = 𝐹𝑡 + 𝛼 (𝑌𝑡 − 𝐹𝑡 )
• Si 𝛼 es elevado, entonces la nueva proyección se corrige sustancialmente por el error de la
proyección previa. Otra forma de escribir el suavizamiento es como un promedio ponderad
entre el dato más reciente y la proyección más reciente:
𝐹𝑡+1 = 𝛼𝑌𝑡 + (1 − 𝛼)𝐹𝑡

23
Suavizamiento exponencial
• Es útil expandir la fórmula de suavizamiento exponencial 𝐹𝑡+1 = 𝛼𝑌𝑡 + (1 − 𝛼)𝐹𝑡 usando sus
componentes previos:
𝐹𝑡 = 𝛼𝑌𝑡−1 + (1 − 𝛼)𝐹𝑡−1
• Usando la expresión de 𝐹𝑡 en 𝐹𝑡+1 :
𝐹𝑡+1 = 𝛼𝑌𝑡 + 1 − 𝛼 𝐹𝑡 = 𝛼𝑌𝑡−1 + 1 − 𝛼 𝐹𝑡−1 = 𝛼𝑌𝑡 + 1 − 𝛼 𝛼𝑌𝑡−1 + 1 − 𝛼 2 𝐹𝑡−1
• Repitiendo esta sustitución de 𝐹𝑡−1 usando sus componentes, de 𝐹𝑡−2 usando sus
componentes, y así sucesivamente:
𝐹𝑡+1 = 𝛼𝑌𝑡 + 𝛼 1 − 𝛼 𝛼𝑡−1 + 𝛼 1 − 𝛼 2 𝑌𝑡−2
+𝛼 1 − 𝛼 3 𝑌𝑡−3 + ⋯ + 𝛼 1 − 𝛼 𝑡−1 𝑌1 + (1 − 𝛼)𝑡 𝐹1
• Entonces, 𝐹𝑡+1 representa un promedio móvil ponderado de todas las observaciones
pasadas.
• Si por ejemplo, 𝛼 = 0,2, entonces el ponderador asignado a 𝑌𝑡 es 0,2, el ponderador
asignado a 𝑌𝑡−1 es 0,2 × 0,8 = 0,16, el ponderador asignado a 𝑌𝑡−2 es 0,2 × 0,82 = 0,128,
el ponderador asignado a 𝑌𝑡−3 es 0,2 × 0,83 = 0,1024, …
• El valor inicial 𝐹1 en general se asume igual al primer dato observado 𝐹1 = 𝑌1 . Algunos
softwares estadísticos (como Stata) lo calculan como el promedio de los datos observados 𝑌𝑡
en la primera mitad de la muestra de datos.

24
Suavizamiento exponencial con tendencia
• Formulado por Holt en 1957.
• Se asumen dos parámetros 𝛼 y 𝛽 y tres ecuaciones:
𝐿𝑡 = 𝛼𝑌𝑡 + (1 − 𝛼)(𝐿𝑡−1 + 𝑏𝑡−1 )
𝑏𝑡 = 𝛽(𝐿𝑡 − 𝐿𝑡−1 ) + (1 − 𝛽) 𝑏𝑡−1
𝐹𝑡+𝑚 = 𝐿𝑡 + 𝑏𝑡 𝑚
• 𝐿𝑡 denota una estimación del nivel de la serie en la fecha 𝑡 y 𝑏𝑡 denota una estimación de la
tendencia de la serie en la fecha 𝑡.
• La primera ecuación ajusta el nivel 𝐿𝑡 con la tendencia previa 𝑏𝑡−1 y el valor suavizado
anterior 𝐿𝑡−1 .
• La tendencia 𝑏𝑡 también se actualiza por la diferencia de los dos valores suavizados
(𝐿𝑡 − 𝐿𝑡−1 ) y por la estimación previa de la tendencia 𝑏𝑡−1 .
• La tercera ecuación sirve para proyectar. La tendencia 𝑏𝑡 se multiplica por el número de
periodos que se proyectan hacia delante 𝑚 y a los que se suma su nivel base 𝐿𝑡 .
• Este método también se llama suavizamiento exponencial doble (donde la diferencia de la
tendencia respecto a su valor previo presenta correlación serial):
𝐹𝑡 = 𝛼𝑌𝑡−1 + (1 − 𝛼)𝐹𝑡−1
′′
𝐹𝑡′′ = 𝛼𝐹𝑡−1 + (1 − 𝛼)𝐹𝑡−1

25
Suavizamiento exponencial con tendencia y
estacionalidad
• Es una extensión al método de Holt de 1957 por Winters en 1960.
• Se asumen tres parámetros 𝛼, 𝛽 y 𝛾 y 4 ecuaciones. Asumiendo una descomposición
multiplicativa:
𝑌𝑡
𝐿𝑡 = 𝛼 + (1 − 𝛼)(𝐿𝑡−1 + 𝑏𝑡−1 )
𝑆𝑡−𝑠
𝑏𝑡 = 𝛽(𝐿𝑡 − 𝐿𝑡−1 ) + (1 − 𝛽) 𝑏𝑡−1
𝑌𝑡
𝑆𝑡 = 𝛾 + (1 − 𝛾) 𝑆𝑡−𝑠
𝐿𝑡
𝐹𝑡+𝑚 = (𝐿𝑡 +𝑏𝑡 𝑚)𝑆𝑡−𝑠+𝑚
• 𝐿𝑡 denota el nivel de la serie, 𝑏𝑡 la tendencia, 𝑆𝑡 el componente estacional (𝑠 es el largo de la
estacionalidad) y 𝐹𝑡+𝑚 es la proyección 𝑚 períodos hacia adelante.
• La estacionalidad se modela como un índice que corresponde aproximadamente a la división
del valor de la serie 𝑌𝑡 y su valor suavizado 𝐿𝑡 .
• Notar que 𝐿𝑡 no contiene estacionalidad, mientras que 𝑌𝑡 sí.
• En el caso de una descomposición aditiva:
𝐿𝑡 = 𝛼(𝑌𝑡 − 𝑆𝑡−𝑠 ) + (1 − 𝛼)(𝐿𝑡−1 + 𝑏𝑡−1 )
𝑏𝑡 = 𝛽(𝐿𝑡 − 𝐿𝑡−1 ) + (1 − 𝛽) 𝑏𝑡−1
𝑆𝑡 = 𝛾(𝑌𝑡 − 𝐿𝑡 ) + (1 − 𝛾) 𝑆𝑡−𝑠
𝐹𝑡+𝑚 = 𝐿𝑡 + 𝑏𝑡 𝑚 + 𝑆𝑡−𝑠+𝑚

26
Aplicación de promedios móviles y
suavizamiento exponencial: crema pastelera
• Consideremos la proyección de una serie de ventas de crema pastelera.
• Más específicamente, un producto usado para la fabricación de tortas que es relleno en
polvo de preparación instantánea de formato de envasado en saco de 8 kg (con 20 bolsas por
saco).
• La serie de tiempo cubre desde enero 2010 hasta octubre 2017 (94 meses).
• ¿Cómo determinar el mejor método de proyección? Una forma es elegir el modelo que
presenta el menor error cuadrático medio (ECM), es decir, que minimiza:
𝑇 2 𝑇 2
𝑡=1(𝑌𝑡 − 𝐹𝑡 (𝜃)) 𝑡=1 𝑒𝑡 (𝜃)
min 𝐸𝐶𝑀 = min = min
𝜃 𝜃 𝑇 𝜃 𝑇
• La raíz del error cuadrático medio (RECM) muestra una medida de error promedio.
• La forma cuadrática del error penaliza más errores más grandes y simétricamente si son
positivos o negativos.
• Por ejemplo, en el método de suavizamiento exponencial con tendencia y estacionalidad de
Holt-Winters debemos elegir el set de parámetros 𝜃 = {𝛼, 𝛽, 𝛾} que minimiza el promedio de
los errores de proyección al cuadrado.
• Para encontrar la solución se puede utilizar la herramienta Solver de Excel.
• Notar que los errores se calculan como la diferencia entre la serie original y la serie
proyectada por el modelo que se está evaluando.

27
Aplicación de promedios móviles y
suavizamiento exponencial: crema pastelera
• Ventas de crema pastelera.

Ventas de crema pastelera Ventas de crema pastelera


2.500 2.500
serie original
MA(3)
WMA(3)
2.000 2.000
ventas

ventas
1.500 1.500

1.000 1.000

500 500
ene-10 ene-11 ene-12 ene-13 ene-14 ene-15 ene-16 ene-17 ene-16 abr-16 jul-16 oct-16 ene-17 abr-17 jul-17 oct-17

• Se calcula el promedio móvil de orden 3 MA(3) y un promedio móvil ponderado de orden 3


WMA(3) usando como ponderadores 𝑤𝑡 = 0,5, 𝑤𝑡−1 = 0,3 y 𝑤𝑡−2 = 0,2.
• En los 94 − 2 = 92 datos (no se consideran los primeros dos datos) la RECM es igual a 203,2
en el caso del MA(3) y a 148,4 en el caso del WMA(3).
• Esta métrica sugeriría preferir entonces el WMA(3) por sobre el MA(3) para proyectar. El
valor proyectado para noviembre 2017 es igual al último promedio móvil calculado (1.704 en
el caso del WMA(3) y 1.717 en el caso del MA(3)).

28
Aplicación de promedios móviles y
suavizamiento exponencial: crema pastelera
• El suavizamiento exponencial arroja los siguientes valores:

• Notar que en Excel y en Stata obtenemos un valor de 𝛼 = 0,8426.


• También que asumimos 𝐹1 = 1.318,8 que es igual al promedio de las ventas observadas
durante los primeros 47 meses (primera mitad de la muestra).
• La RECM, igual a 296,1, es algo mayor que la calculada anteriormente mediante MA(3) y
WMA(3).

29
Aplicación de promedios móviles y
suavizamiento exponencial: crema pastelera
• El suavizamiento exponencial con tendencia arroja los siguientes valores:

• Los valores iniciales se obtienen estimando sobre la primera mitad de datos una regresión
𝑌𝑡 = 𝑎 + 𝑏 × 𝑡, donde 𝑡 es una tendencia que parte en 1 en la primera observación. Los
valores iniciales satisfacen 𝐿0 = 𝑎 y 𝑏0 = 𝑏.
• La RECM, igual a 291,2 en Excel y en Stata, es algo menor a la del suavizamiento exponencial,
indicando que la tendencia mejora levemente el modelamiento.
30
Aplicación de promedios móviles y
suavizamiento exponencial: crema pastelera
• El suavizamiento exponencial con tendencia y estacionalidad arroja los siguientes valores:

• La RECM, igual a 144,8 en Excel y a 144.3 en Stata, es bastante menor a las calculadas
anteriormente bajo MA(3), WMA(3), suavizamiento exponencial y suavizamiento exponencial
con tendencia. El coeficiente de suavizamiento 𝛼 ahora es bastante menor a lo anteriores.

31
Aplicación de promedios móviles y
suavizamiento exponencial: crema pastelera
• La metodología para obtener los valores iniciales en el cálculo del suavizamiento exponencial
con tendencia y estacionalidad es la siguiente:
– Al igual que en el suavizamiento exponencial con tendencia se estima sobre la primera
mitad de datos una regresión 𝑌𝑡 = 𝑎 + 𝑏 × 𝑡, donde 𝑡 es una tendencia que parte en 1
en la primera observación. Los valores iniciales satisfacen 𝐿0 = 𝑎 y 𝑏0 = 𝑏.
– Para calcular los valores estacionales iniciales se estima una regresión de 𝑌𝑡 sobre 𝐿
variables binarias asociadas a la estacionalidad y considerando la primera mitad de
datos. Esta regresión se realiza sin constante:
12
𝑌𝑡 = 𝛽𝑚𝑒𝑠 × 𝑑𝑚𝑒𝑠
𝑚𝑒𝑠=1
– En nuestro ejemplo de la crema pastelera, son 12 variables binarias asociadas cada una
a un mes del año y se usa como muestra de estimación a los primeros 94/2 = 47 datos.
– También sobre la primera mitad de datos se calcula el promedio de la serie observada
𝑇/2
𝜇 = 𝑡=1 𝑌𝑡 /𝑇.
– Finalmente, el valor inicial de los factores estacionales es igual a 𝛽𝑚𝑒𝑠 /𝜇.

32
Aplicación de promedios móviles y
suavizamiento exponencial: crema pastelera
• ¿Qué método de los vistos anteriormente sería recomendable para proyectar?
• Una buena idea para decidir es ver gráficamente las proyecciones y también la tabla
comparativa de RECM:
Proyecciones venta de crema pastelera

Método de proyección RECM


2.000
MA(3) 203,2
1.500 WMA(3) 148,4

1.000
Suavizamiento exponencial 296,1
Serie original
Proyección MA(3) SE con tendencia 291,2
Proyección WMA(3)
500 Proyección suavizamiento exponencial SE con tendencia y estacionalidad 144,8
Proyección SE con tendencia
Proyección SE con tendencia y estacionalidad
0

• La menor RECM se asocia al suavizamiento exponencial con tendencia y estacionalidad.


• La RECM del WMA(3) es bastante parecida, pero este método no permite proyectar más allá
de un período hacia adelante.

33
Modelo de regresión
• Hemos visto hasta ahora métodos de descomposición y de suavizamiento exponencial. El
primero es intensivo en cálculos y está más orientado hacia el análisis de los datos que a su
proyección. El segundo, en cambio, es apropiado para proyectar en el corto plazo de manera
sencilla, siendo también útil por ejemplo cuando se necesita un gran número de
proyecciones.
• Otro método disponible para proyectar consiste en el modelamiento de la relación entre la
serie que interesa proyectar y un conjunto de variables explicativas.
• La forma más básica de relación asume linealidad entre dos variables :
𝑌𝑡 = 𝑎 + 𝑏𝑋𝑡 + 𝑒𝑡
• Donde la variable a explicar (o dependiente) es 𝑌, la variable explicativa es 𝑋 y 𝑒 es el error
de modelamiento.
• El método de Mínimos Cuadrados Ordinarios (MCO) permite obtener los parámetros del
modelo de regresión 𝑎 (constante o intercepto) y 𝑏 (pendiente) minimizando la suma de los
errores estimados 𝑒𝑡 = 𝑌𝑡 − 𝑌𝑡 al cuadrado, es decir, min 𝑇𝑡=1 𝑒𝑡2 .
• Notar que 𝑌𝑡 es el valor de la variable dependiente que es estimado por el modelo.

34
Aplicación del modelo de regresión:
GroceryLand Supermarkets
• Es una cadena regional de tiendas de abarrotes con más de 300 locales ubicados en el medio
oeste de Estados Unidos.
• El director corporativo de marketing de la compañía desea estudiar el efecto del precio en las
ventas semanales de las botellas de dos litros de su marca propia de bebida.
• Al iniciar el proyecto, se reúne con el vicepresidente de ventas y otros miembros de la
compañía. Deciden que sería razonable aumentar el precio de la botella de dos litros desde
0,5 a 2 dólares.
• Para recabar los datos necesarios para analizar la relación entre el precio y la ventas, el
director selecciona una muestra aleatoria de 20 tiendas y después asigna un precio de venta
al azar entre 0,5 y 2 dólares en cada una.
• El director contacta a cada uno de los 20 gerentes de las tiendas incluidas en el estudio para
informarles el precio y pedirle que reporten las ventas del producto al final de la semana.
• ¿Cómo podemos estimar la relación entre precio y ventas? ¿Con esta estimación, qué
podemos decir sobre el impacto de cambiar el precio sobre la venta de bebidas?

35
Aplicación del modelo de regresión:
GroceryLand Supermarkets
• Podemos obtener los resultados de la regresión lineal en Excel mediante varias formas. La
más simple es graficando los datos y obteniendo la línea de tendencia. Una segunda
alternativa es usando la herramienta Análisis de datos que calcula las estadísticas más
relevantes de un análisis de regresión. Un tercera es usando la herramienta Solver, donde se
puede calcular manualmente los valores de los coeficientes 𝑎 y 𝑏 que resuelven el problema
de minimización .
• Estimaremos un modelo de la forma:
𝑣𝑒𝑛𝑡𝑎𝑠𝑡 = 𝑎 + 𝑏 × 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 +𝑒𝑡
• En este caso, queremos analizar el efecto explicativo de la variable 𝑝𝑟𝑒𝑐𝑖𝑜 sobre la variable
dependiente 𝑣𝑒𝑛𝑡𝑎𝑠.
• Gráficamente tenemos que:
200

150 y = -109,69x + 193,54


R² = 0,8889
ventas

100

50

0
0,50 0,75 1,00 1,25 1,50 1,75 2,00
36 precio
Aplicación del modelo de regresión:
GroceryLand Supermarkets
• El gráfico anterior es del tipo dispersión en Excel, donde la variable 𝑣𝑒𝑛𝑡𝑎𝑠 se graficó en el
eje Y.
• Excel permite agregar una línea de tendencia donde se eligen las opciones asociados a
presentar la ecuación y presentar el valor R cuadrado en el gráfico.
• Otra forma de obtener la regresión lineal es usando la herramienta análisis de datos:

37
Aplicación del modelo de regresión:
GroceryLand Supermarkets
• Una tercera forma de obtener la regresión lineal es usando la herramienta Solver:

• Notamos que con los tres métodos obtenemos los mismos resultados: un intercepto
𝑎 = 193,54 y una pendiente 𝑏 = −109,69.
• También vemos en el gráfico que la línea estimada está por debajo de las observaciones
cuando el precio es bajo y por encima cuando el precio es alto. Esto se soluciona por ejemplo
aplicando la transformación logaritmo natural a las ventas.
38
Aplicación del modelo de regresión:
GroceryLand Supermarkets
• Aplicando la transformación logaritmo natural a las ventas tenemos un modelo ln-lineal:
6

5 y = -2,0119x + 6,1816
R² = 0,9889

ln(ventas) 4

2
0,50 0,75 1,00 1,25 1,50 1,75 2,00
precio

39
Aplicación del modelo de regresión:
GroceryLand Supermarkets
• Al aplicar logaritmo natural a las ventas tenemos un intercepto 𝑎 = 6,18 y una pendiente i
𝑏 = −2,01.
• El coeficiente de determinación R cuadrado (que profundizaremos más adelante) sube desde
0,8889 a 0,9889 si es que se consideraban las ventas en nivel.
• El intercepto 𝑎 representa el promedio de la variable dependiente bajo la condición que la
variable explicativa es igual a cero:
𝑣𝑒𝑛𝑡𝑎𝑠𝑡 = 𝑎 + 𝑏 × 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 +𝑒𝑡
𝐸 𝑣𝑒𝑛𝑡𝑎𝑠𝑡 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 = 0 = 𝐸 𝑎 + 𝑏 × 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 +𝑒𝑡 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 = 0 = 𝐸 𝑎 + 𝑏 × 0 + 𝑒𝑡
= 𝐸 𝑎 + 𝐸 𝑏 × 0 + 𝐸 𝑒𝑡 = 𝑎
• Donde usamos el resultado que el promedio de los errores del modelo es igual a cero.
• Es decir, según nuestro modelo ln-lineal se espera que el logaritmo natural de las ventas sea
igual a 6,18 cuando el precio es igual a cero (o que las ventas sean igual a exp(6,18) = 483,8
cuando el precio de venta es igual a cero).

40
Aplicación del modelo de regresión:
GroceryLand Supermarkets
• La pendiente denota cómo cambios en la variable explicativa afectan a la variable
dependiente. En el caso del modelo lineal:
𝑣𝑒𝑛𝑡𝑎𝑠𝑡 = 𝑎 + 𝑏 × 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 +𝑒𝑡
𝜕𝑣𝑒𝑛𝑡𝑎𝑠𝑡 𝜕𝑎 + 𝑏 × 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 +𝑒𝑡
= =𝑏
𝜕𝑝𝑟𝑒𝑐𝑖𝑜𝑡 𝜕𝑝𝑟𝑒𝑐𝑖𝑜𝑡
• En el modelo lineal un aumento de un dólar en el precio de la bebida disminuye en 109,69 las
ventas.
• En el modelo ln-lineal:
ln(𝑣𝑒𝑛𝑡𝑎𝑠𝑡 ) = 𝑎 + 𝑏 × 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 +𝑒𝑡
𝜕 ln(𝑣𝑒𝑛𝑡𝑎𝑠𝑡 ) 𝜕(𝑎 + 𝑏 × 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 +𝑒𝑡 )
= =𝑏
𝜕𝑝𝑟𝑒𝑐𝑖𝑜𝑡 𝜕𝑝𝑟𝑒𝑐𝑖𝑜𝑡
• El cambio del logaritmo natural es aproximadamente igual al cambio porcentual:
𝜕 ln(𝑣𝑒𝑛𝑡𝑎𝑠𝑡 ) 𝜕 ln(𝑣𝑒𝑛𝑡𝑎𝑠𝑡 ) 𝜕𝑣𝑒𝑛𝑡𝑎𝑠𝑡 1 𝜕𝑣𝑒𝑛𝑡𝑎𝑠𝑡 𝜕𝑣𝑒𝑛𝑡𝑎𝑠𝑡 1
= = =
𝜕𝑝𝑟𝑒𝑐𝑖𝑜𝑡 𝜕𝑣𝑒𝑛𝑡𝑎𝑠𝑡 𝜕𝑝𝑟𝑒𝑐𝑖𝑜𝑡 𝑣𝑒𝑛𝑡𝑎𝑠𝑡 𝜕𝑝𝑟𝑒𝑐𝑖𝑜𝑡 𝑣𝑒𝑛𝑡𝑎𝑠𝑡 𝜕𝑝𝑟𝑒𝑐𝑖𝑜𝑡
∆𝑣𝑒𝑛𝑡𝑎𝑠𝑡 1

𝑣𝑒𝑛𝑡𝑎𝑠𝑡 ∆𝑝𝑟𝑒𝑐𝑖𝑜𝑡
• Si las ventas crecen por ejemplo desde 10 a 15 unidades: ∆𝑣𝑒𝑛𝑡𝑎𝑠𝑡 = 5 y 𝑣𝑒𝑛𝑡𝑎𝑠𝑡 = 10,
resultando en un cambio porcentual igual a ∆𝑣𝑒𝑛𝑡𝑎𝑠𝑡 /𝑣𝑒𝑛𝑡𝑎𝑠𝑡 = 5/10 = 50%.
• En nuestro modelo ln-lineal 𝑏 = −2,01, es decir, para un cambio pequeño en el precio de las
bebidas de 1 centavo (1/100 dólares) las ventas predichas por el modelo caerían en
2,01/100 = 2%.
41
Aplicación del modelo de regresión:
GroceryLand Supermarkets
• La pregunta original de GroceryLand era ver el efecto de un aumento en el precio de venta de
un tipo de bebida de producción propia desde 0,5 a 2 dólares.
• El coeficiente 𝑏 en el modelo ln-lineal es una semi-elasticidad que refleja el impacto
porcentual de un cambio pequeño en la variable explicativa precio. Dado que el aumento de
precio desde 0,5 a 2 va desde el menor hasta el mayor precio de la muestra, la semi-
elasticidad no es la mejor medida de análisis (pues asume cambios pequeños). Una
alternativa es estimar las ventas predichas por el modelo bajo los dos escenarios de precios:
ln(𝑣𝑒𝑛𝑡𝑎𝑠𝑡 ) = 𝑎 + 𝑏 × 𝑝𝑟𝑒𝑐𝑖𝑜𝑡 +𝑒𝑡
ln(𝑣𝑒𝑛𝑡𝑎𝑠𝑡 ) = 𝑎 + 𝑏 × 𝑝𝑟𝑒𝑐𝑖𝑜𝑡
• Donde 𝑏 representa la pendiente estimada en la muestra de datos, a diferencia de 𝑏 que es la
pendiente del modelo teórico.
• Entonces:
𝐸[ln 𝑣𝑒𝑛𝑡𝑎𝑠𝑡 |𝑝𝑟𝑒𝑐𝑖𝑜𝑠𝑡 = 0,5] = 𝑎 + 𝑏 × 0,5 = 5,18
𝐸[ln 𝑣𝑒𝑛𝑡𝑎𝑠𝑡 |𝑝𝑟𝑒𝑐𝑖𝑜𝑡 = 2] = 𝑎 + 𝑏 × 2 = 2,16
• Las ventas predichas por el modelo y en los datos de GroceryLand alcanzan a exp(5,18) =
176,9 cuando el precio es igual a 0,5 y a exp(2,16) = 8,7 cuando el precio es igual a 2.
• Se recomendaría entonces aumentar los precios en baja cuantía para no impactar tanto las
ventas. A modo de referencia, el precio promedio en la muestra es 1,16 y las ventas
promedios son de 66,3. Aumentar el precio promedio a 1,25 resultaría en ventas esperadas
de 39,1 unidades. La decisión óptima debería incorporar información adicional por ejemplo
sobre costos y utilidades.
42
Calidad de ajuste del modelo de regresión:
R cuadrado
• Una medida de ajuste muy popular es el R cuadrado, que refleja la proporción de la variación
en la variable dependiente 𝑌 que es explicada por la variación del modelo (o de la regresión
de 𝑌 sobre 𝑋). A continuación derivaremos se cálculo.
• Denotando el valor predicho y el error estimado por el modelo como:
𝑌𝑡 = 𝑎 + 𝑏 × 𝑋𝑡
𝑒𝑡 = 𝑌𝑡 − 𝑌𝑡
• Se puede descomponer la desviación de los datos 𝑌𝑡 respecto a su media 𝑌 como:
𝑌𝑡 − 𝑌 = 𝑌𝑡 − 𝑌𝑡 + (𝑌𝑡 − 𝑌)
• El término de la izquierda es la desviación total, el primero de la derecha es la desviación no
explicada (o error 𝑒𝑡 ) y el segundo de la derecha es la desviación explicada por el modelo.
• Elevando al cuadrado y sumando sobre todos los datos:
𝑌𝑡 − 𝑌 2 = (𝑌𝑡 − 𝑌𝑡 )2 +(𝑌𝑡 − 𝑌)2 +2(𝑌𝑡 − 𝑌𝑡 )(𝑌𝑡 − 𝑌)
2
𝑌𝑡 − 𝑌 = (𝑌𝑡 − 𝑌𝑡 )2 + (𝑌𝑡 − 𝑌)2 + 2 (𝑌𝑡 − 𝑌𝑡 )(𝑌𝑡 − 𝑌)

• El término de la izquierda es la variación total de 𝑌 (o suma de los cuadrados total, TSS), el


primero de la derecha es la variación residual de 𝑌 (o suma de los cuadrados de los errores,
ESS), el segundo de la derecha es la variación explicada de 𝑌 (o suma de los cuadrados de la
regresión, RSS), y el tercero de la derecha es igual a cero (usando dos propiedades de MCO:
𝑒𝑡 = 0 y 𝑒𝑡 𝑋𝑡 = 0).

43
Calidad de ajuste del modelo de regresión:
R cuadrado
• De la derivación anterior:
𝑇𝑆𝑆 = 𝐸𝑆𝑆 + 𝑅𝑆𝑆
• La suma de los cuadrados total (𝑇𝑆𝑆) es igual a la suma de los cuadrados de los errores (𝐸𝑆𝑆)
más la suma de los cuadrados de la regresión (𝑅𝑆𝑆).
• Dividiendo por 𝑇𝑆𝑆:
𝐸𝑆𝑆 𝑅𝑆𝑆
1= +
𝑇𝑆𝑆 𝑇𝑆𝑆
• El R cuadrado se define como:
𝐸𝑆𝑆 𝑅𝑆𝑆
𝑅2 = 1 − =
𝑇𝑆𝑆 𝑇𝑆𝑆
• Es decir, es igual a la proporción de la variación total en la variable dependiente 𝑌 que es
explicada por la variación del modelo (o de la regresión de 𝑌 sobre 𝑋).
• Otra forma de escribir el R cuadrado es usando el error estimado 𝑒𝑡 = 𝑌𝑡 − 𝑌𝑡 = 𝑦𝑡 − 𝑦𝑡 ,
donde las minúsculas representan la desviación respecto a la media 𝑦𝑡 = 𝑌𝑡 − 𝑌.
• En un modelo con una variable explicativa 𝑌𝑡 = 𝑎 + 𝑏𝑋𝑡 + 𝑒𝑡 se cumple que 𝑦𝑡2 = 𝑦𝑡2 +
𝑒𝑡2 = 𝑏 2 𝑥𝑡2 + 𝑒𝑡2 .
• Entonces el R cuadrado satisface la siguiente expresión:
2
𝑒𝑡2 𝑦𝑡2 𝑏 2 𝑥𝑡2
𝑅 =1− = =
𝑦𝑡2 𝑦𝑡2 𝑦𝑡2

44
Calidad de ajuste del modelo de regresión:
R cuadrado
• Notar que el R cuadrado es una estadística descriptiva y no siempre un R cuadrado alto
significa que el modelo es muy bueno o un R cuadrado bajo que el modelo es muy malo.
• Por ejemplo, en los siguientes casos un R cuadrado puede llevar a conclusiones erradas sobre
la calidad de ajuste del modelo:
– Un R cuadrado alto puede surgir en un análisis de serie de tiempo solo porque se explica
una variable que crece en el tiempo con otra que también lo hace y por lo tanto explica
la variación de la variable bajo análisis.
– Un R cuadrado bajo puede surgir cuando a pesar de incluir buenas variables explicativas,
existe una gran variación entre individuos en un análisis de corte transversal.

45
Calidad de ajuste del modelo de regresión:
test 𝐹 y test 𝑡
• El modelo de regresión puede relacionar la variable de interés con 𝐾 variables explicativas:
𝑌𝑡 = 𝑏0 + 𝑏1 𝑋1,𝑡 + 𝑏2 𝑋2,𝑡 + ⋯ + 𝑏𝐾 𝑋𝐾,𝑡 + 𝑒𝑡
• Por conveniencia de notación la constante ahora es 𝑏0 (anteriormente era 𝑎).
• El test 𝐹 analiza estadísticamente que todos los coeficientes estimados en el modelo de
regresión sean distintos de cero. Así podemos responder si es que existe una relación
estadísticamente significativa entre 𝑌 y todas las variables explicativas.
• En la ecuación anterior la hipótesis nula 𝐻0 e hipótesis alternativa 𝐻1 de este test son:
𝐻0 : 𝑏0 = 𝑏1 = ⋯ = 𝑏𝐾 = 0
𝐻1 : 𝑏𝑘 ≠ 0, para al menos algún valor de 𝑘
• El valor del test 𝐹 se calcula como:
𝑅 2 /𝐾
𝐹=
(1 − 𝑅 2 )/(𝑇 − 𝐾 − 1)
• Donde 𝐾 es el número de variables explicativas y 𝑇 es el número de datos.
• En cambio, el test 𝑡 analiza estadísticamente si es que un coeficiente estimado en el modelo
de regresión es igual a cero. En este caso las hipótesis nula y alternativa son:
𝐻0 : 𝑏𝑘 = 0
𝐻1 : 𝑏𝑘 ≠ 0
• El valor del test 𝑡 se calcula como:
𝑡 = 𝑏𝑘 /𝜎(𝑏𝑘 )

46
Calidad de ajuste del modelo de regresión:
test 𝐹 y test 𝑡
• El valor del test 𝑡 se calcula como:
𝑡 = 𝑏𝑘 /𝜎(𝑏𝑘 )
• Notar que 𝑏𝑘 es el coeficiente 𝑏𝑘 estimado en el análisis de regresión.
• El estadístico 𝑡 corresponde al ratio entre el coeficiente estimado y su error estándar.
• 𝜎(𝑏𝑘 ) se calcula como:
𝜎(𝑏𝑘 ) = 𝜎(𝑒)(𝑋 ′ 𝑋)−1
• 𝜎(𝑒) es el error estándar del error estimado del modelo, que se calcula como:
2
𝑒𝑡2
𝜎(𝑒) =
𝑇−1
• 𝑋 es la matriz de dimensión 𝑛 × (𝐾 + 1) donde la primera columna contiene solo unos
(asociados a la constante) y las otras columnas son los vectores de las variables explicativas.

47
Aplicación del ajuste del modelo de
regresión: ventas de autos
• Usaremos información mensual desde 2009 de la Asociación Nacional Automotriz de Chile
(ANAC) relativa a las ventas de autos nuevos.
• Para motivar el análisis, vemos que la ANAC proyectó ventas de 350.000 autos para el 2017
(p.119 en https://www.anac.cl/wp-content/uploads/2017/11/Anuario-2017.pdf):

48
Aplicación del ajuste del modelo de
regresión: ventas de autos
• Proyectaremos las ventas de autos livianos y medianos usando como variables explicativas el
índice mensual de actividad económica (imacec) y la tasa de interés de colocación.
• La primera variable mide la evolución del poder adquisitivo de la población chilena y la
segunda refleja el costo de financiamiento de créditos de consumo.
• Primero veremos gráficamente las series:
45.000 140 45.000 40
40.000 40.000 35
120
35.000 35.000 30
100 30.000
30.000 25
80 25.000
25.000 20
20.000
20.000 60 15
15.000
15.000 10.000 10
40
10.000 5.000 5
20
5.000 0 0
0 0 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 Ventas autos nuevos, ANAC
Ventas autos nuevos, ANAC Imacec Tasas anuales nominales de colocación promedio consumo

• Las ventas de autos siguen un patrón estacional similar al del imacec y alcanzaron sus
mínimos cuando la tasa de financiamiento estaba en valores elevados.

49
Aplicación del ajuste del modelo de
regresión: ventas de autos
• Estimamos un modelo de regresión lineal restringiendo los datos hasta diciembre 2016:

45.000
ventas
40.000 ventas predichas

35.000

30.000

25.000

20.000

15.000

10.000

5.000

0
2009 2010 2011 2012 2013 2014 2015 2016

• Podemos comprobar el cálculo del R cuadrado:


𝑅𝑆𝑆 1.191.115.043
𝑅2 = = = 0,300923457
𝑇𝑆𝑆 3.958.199.379
• Es decir, un 30% de la variabilidad en las ventas de autos nuevos es explicada por
nuestro modelo de regresión usando imacec y tasa de financiamiento.
50
Aplicación del ajuste del modelo de
regresión: ventas de autos
• El valor del intercepto 𝑎 = −16.381 nos dice que el modelo predice ventas negativas en caso
que el imacec y la tasa de financiamiento fuesen iguales a cero.
• Obtenemos que 𝑏𝑖𝑚𝑎𝑐𝑒𝑐 = 396,7 ± 86,9 y que 𝑏𝑡𝑎𝑠𝑎 = 135,6 ± 321,8.
• El error estándar del imacec es relativamente bajo, pero el de la tasa es elevado.
• Con un 95% de probabilidad el coeficiente asociado a la tasa se mueve entre 135,6 ±
1,985801814 × 321,8 = −503,4; 774,7 .
• El coeficiente 𝑏𝑡𝑎𝑠𝑎 = 135,6 posee un test asociado a la hipótesis nula que sea igual a cero
que se distribuye 𝑡-Student con 𝑇 − 𝐾 = 95 − 2 = 93 grados de libertad. Esta distribución
se grafica abajo (vemos que si 𝑡 ≥ 1,985801814, el área bajo la curva es igual a 95%, lo
que se usa para la construcción de los intervalos de confianza de 𝑏𝑘 junto con el resultado
que 𝑡 = 𝑏𝑘 /𝜎(𝑏𝑘 ), es decir, el intervalo de confianza del 95% para 𝑏𝑘 es igual a 𝑏𝑘 ± 𝑡95% ×
𝜎(𝑏𝑘 )): Distribución t-Student
0,045
0,04
0,035
0,03
0,025
0,02
0,015
0,01
0,005
0
-4 -3 -2 -1 0 1 2 3 4
51 t
Aplicación del ajuste del modelo de
regresión: ventas de autos
• El intervalo de confianza del 90% para 𝑏𝑘 es igual a 𝑏𝑘 ± 𝑡90% × 𝜎 𝑏𝑘 = 135,6443799 ±
1,661403674 × 321,8214899 = -399,0; 670,3 .
• Podemos comprobar el cálculo del estadístico 𝑡 para la tasa de financiamiento :
𝑏𝑡𝑎𝑠𝑎 135,6443799
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = = = 0,421489503
𝜎 𝑏𝑡𝑎𝑠𝑎 321,8214899
• ¿Qué pasa si calculamos el intervalo de confianza usando este valor de 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 ?
𝑏𝑘 ± 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 × 𝜎 𝑏𝑘 = 135,6443799 ± 0,421489503 × 321,8214899 = 0; 271,3 .
• Es decir, el estadístico 𝑡 calculado en la regresión limita el intervalo de confianza a
contener o no el valor cero para el coeficiente 𝑏𝑡𝑎𝑠𝑎 (que es justamente la hipótesis nula
que estamos testeando).
• El análisis de regresión también muestra el 𝑝-valor asociado al estadístico 𝑡, que
corresponde a la probabilidad de obtener un valor de |𝑡| tan grande como el calculado en los
datos (𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 ) bajo el supuesto que el parámetro es igual a cero. Para aclarar esto,
notemos que en nuestro análisis:
Pr 𝑡 ≥ 0,421489503 = 0,67437029.
• Si el intervalo de confianza de 95% no contiene al cero, el 𝑝-valor debe ser menor a 0,05.
• En general, si el 100𝛾% intervalo de confianza no contiene al cero, el 𝑝-valor debe ser menor
a 1 − 𝛾.
• La hipótesis nula 𝐻0 : 𝑏𝑘 = 0 se rechaza si |𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 | ≥ 𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 .

52
Aplicación del ajuste del modelo de
regresión: ventas de autos
• De lo anterior se concluye que la estimación de 𝑏𝑡𝑎𝑠𝑎 posee mucha incerteza y por lo tanto
no es muy confiable como variable explicativa.
• Sin embargo, la teoría e intuición nos dicen que la tasa de financiamiento sí debiese ser una
variable explicativa relevante para explicar las ventas de autos nuevos.
• En general, es recomendable incorporar variables en el análisis que se justifiquen en la teoría
e intuición a pesar de que resulten siendo poco significativas una vez estimado el modelo de
regresión.
• Es más, el hecho que una variable sea poco significativa solo es válido bajos los datos y
supuestos considerados, pero no implica que sea mal predictor ni que deba ser eliminada.

53
Aplicación del ajuste del modelo de
regresión: ventas de autos
• ¿Qué se puede decir sobre el test 𝐹?
• Podemos comprobar el cálculo del test 𝐹:
𝑅 2 /𝐾 0,300923457 /2
𝐹= = = 20,01632142
(1 − 𝑅 2 )/(𝑇 − 𝐾 − 1) (1 − 0,300923457 )/(96 − 2 − 1)
• La hipótesis nula se rechaza si 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 ≥ 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 .
• Los grados de libertad del test 𝐹 son (𝐾, 𝑇 − 𝐾 − 1).
• El 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 al 95% de confianza con (2,93) grados de libertad es 3,094337433. Por lo tanto se
rechaza la hipótesis nula 𝐻0 : 𝑏0 = 𝑏𝑖𝑚𝑎𝑐𝑒𝑐 = 𝑏𝑡𝑎𝑠𝑎 = 0 y se concluye que la relación entre las
ventas y la constante y las dos variables explicativas sí es estadísticamente significativa.
• Notemos que Pr 𝐹 ≥ 20,01632142 = 5,89386𝐸-08 que es lo que reporta Excel bajo el
rótulo “Valor crítico de 𝐹” siendo que corresponde al 𝑝-valor del estadístico 𝐹.

54
Aplicación del ajuste del modelo de
regresión: ventas de autos
• Ahora proyectaremos las ventas de autos para los meses de 2017.
• Al usar un modelo de regresión para proyectar se debe tener información sobre los valores
futuros de las variables explicativas. Situados en diciembre 2016 podemos obtener
expectativas sobre el movimiento en el imacec y tasas de interés usando información de la
Encuesta de Exceptivas Económicas (EEE), realizada mensualmente por el Banco Central de
Chile y publicados sus resultados en www.bcentral.cl.
• En diciembre 2016 se esperaba los siguientes valores:

Variables consideradas en la EEE Valor esperado en dic-2016


imacec a nov-2016 1,3%
PIB IV trimestre 2016 0,9%
PIB 2017 2,0%
TPM ene-2017 3,5%
TPM feb-2017 3,25%
TPM en 5 meses más 3,25%
TPM en 11 meses más 3,0%

55
Aplicación del ajuste del modelo de
regresión: ventas de autos
• Proyectando con los coeficientes estimados hasta diciembre 2016 y con las expectativas
económicas a la misma fecha se tiene una proyección de ventas iguales a 349.117 siendo que
el valor realizado ex-post sabemos que fue igual a 360.900.
• Nuestra proyección con dos variables es muy similar a la obtenida por la ANAC (que era igual
a 350.000).
• Gráficamente:
45.000
ventas
40.000 ventas proyectadas

35.000

30.000

25.000
20.000

15.000

10.000

5.000

0
2009 2010 2011 2012 2013 2014 2015 2016 2017

• Nuestro modelo no fue capaz de capturar el aumento de ventas en los últimos meses del
año. Más adelante, con la metodología ARIMA, capturaremos dependencia temporal de la
variable dependiente, que en este ejercicio hubiese sido útil pues habría considerado que en
los últimos meses de 2016 las ventas fueron mayores.
56
Aplicación del ajuste del modelo de
regresión: ventas de autos
• El intervalo de confianza de la proyección de un modelo de regresión está determinado por la
desviación estándar:
𝜎(𝑌0 ) = 𝜎𝑒 1 + 𝑐′(𝑋 ′ 𝑋)−1 𝑐
• Donde 𝑐 = 1 𝑋1∗ 𝑋2∗ … 𝑋𝐾∗ ′ es el vector de nuevos valores usados para las variables
explicativas y 𝑋 es la matriz de dimensión 𝑛 × 𝐾 + 1 donde la primera columna contiene solo
unos y las otras columnas son los vectores de las variables explicativas.
• Por ejemplo, el valor proyectado a diciembre 2017 es igual a 33.772 (como referencia, el
valor observado fue igual a 34.758).
• Las ventas proyectadas están sub-estimadas en el futuro. Esto se puede deber a que no se
incluyeron variables explicativas relevantes como el tipo de cambio, confianza de los
consumidores, índice de precios de los automóviles, campañas de ventas de autos, etc.
• La desviación estándar de las ventas predichas para diciembre 2017 es de 5.396,96, es decir,
el modelo de proyección refleja que el ajuste no es muy cercano a los valores verdaderos y
por lo tanto la incerteza asociada al modelo es relativamente alta (un error estándar igual al
16% del valor predicho en un mes).
• ¿Cuánto sería el intervalo de confianza del 95% de incerteza de la proyección al mes de
diciembre 2017?

57

Anda mungkin juga menyukai