Anda di halaman 1dari 177

UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA

MÁSTER UNIVERSITARIO EN ESTADÍSTICA APLICADA

CAPÍTULO 4

SERIES TEMPORALES
Autores:

Lucía Inglada Pérez. Licenciada en Ciencias Matemáticas. Doctora en


Economía. Profesora Tutora UNED. Investigadora Instituto Carlos III CIBER.

Vicente Inglada López de Sabando. Licenciado en Ciencias Matemáticas.


Ingeniero de Caminos. Doctor en Ciencias Económicas y Empresariales.
Estadístico Facultativo. Profesor Asociado. Departamento de Economía
Aplicada y Estadística. UNED

Alberto Muñoz Cabanes. Doctor en Economía. Profesor Colaborador Doctor.


Departamento de Economía Aplicada y Estadística. UNED.
UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA

FUNDACIÓN GENERAL DE LA UNED

MÁSTER EN ESTADÍSTICA
APLICADA

MATERIAL DIDÁCTICO

Capítulo 4

4
Máster en Estadística Aplicada
5
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

CAPÍTULO 4

SERIES TEMPORALES

ÍNDICE

1. INTRODUCCIÓN ......................................................................................... 11
1.1. Conceptos básicos ................................................................................ 11
1.2. Interés de su estudio.............................................................................. 13
1.3. Características de una serie temporal ................................................... 14
1.4. Ejemplos ................................................................................................ 17
2. NUMEROS ÍNDICES ................................................................................... 18
2.1. Conceptos básicos ................................................................................ 18
2.1.1. Agregados macroeconómicos ......................................................... 18
2.1.2. Definición de números índices ........................................................ 19
2.2.2. Conceptos básicos .......................................................................... 20
2.2. Índices de precios .................................................................................. 22
2.2.1. Tipos ............................................................................................... 22
2.2.2. Ejemplo: Índice de precios al consumo. .......................................... 23
3. COMPONENTES DE UNA SERIE TEMPORAL .......................................... 24
3.1. Descomposición de una serie temporal ................................................. 24
3.2. Tendencia .............................................................................................. 25
3.2.1. Factores causales ........................................................................... 25
3.2.2. Modelización ................................................................................... 27
3.3. Componente estacional ......................................................................... 32
3.3.1. Características básicas ................................................................... 32
3.3.2. Modelización ................................................................................... 32
3.3.3. Índice de estacionalidad .................................................................. 34
4. FUNCIONES DE AUTOCORRELACIÓN..................................................... 35
4.1. Conceptos básicos ................................................................................ 35
4.1.1. Operador de retardo ........................................................................ 35
4.1.2. Operador diferencias ....................................................................... 35
4.1.3. La transformación logarítmica ......................................................... 36
4.2. Funciones de autocorrelación ................................................................ 36
4.2.1. Función de Autocorrelación Simple ................................................. 36
4.2.2. Función de Autocorrelación Parcial ................................................. 37
5. SERIES ESTACIONARIAS.......................................................................... 38
5.1. Características de las series estacionarias ............................................ 38
5.2. Proceso Ruido Blanco ........................................................................... 39
5.3. Transformaciones para conseguir estacionariedad ............................... 41

6
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

6. PROCESOS AUTORREGRESIVOS ............................................................ 44


6.1. Caracterización teórica .......................................................................... 44
6.1.1. Tipos de representación .................................................................. 44
6.1.2. Modelo AR(1) .................................................................................. 45
6.1.3. Modelo AR(2) .................................................................................. 46
6.2. Aspectos prácticos de los procesos AR ................................................. 49
7. MODELOS DE MEDIA MÓVIL .................................................................... 52
7.1. Caracterización teórica .......................................................................... 52
7.1.1. Representaciones ........................................................................... 52
7.1.2. Características teóricas ................................................................... 53
7.2. Aspectos prácticos de los procesos MA ................................................ 55
7.3. Comparación entre procesos MA y AR .................................................. 58
8. MODELOS ARMA ....................................................................................... 59
8.1. Caracterización teórica .......................................................................... 59
8.1.1 Tipos de Representación ................................................................. 59
8.1.2. Características teóricas de un proceso ARMA(1,1)......................... 60
8.2. Aspectos prácticos ................................................................................. 62
9. SERIES NO ESTACIONARIAS: MODELOS ARIMA(P,D,Q) ...................... 65
9.1. Caracterización teórica .......................................................................... 65
9.2. Estimación y diagnosis .......................................................................... 66
10. MODELOS PARA PROCESOS ESTACIONALES .................................... 67
10.1. Introducción ......................................................................................... 67
10.2. Caracterización teórica de los Modelos estacionales .......................... 69
10.2.1. Proceso AR(1) estacional.............................................................. 69
10.2.2. Proceso MA(1) estacional ............................................................. 71
10.3. Aspectos prácticos ............................................................................... 73
10.3.1. Modelo AR estacional ................................................................... 73
10.3.2. Modelo MA estacional ................................................................... 76
10.4. Modelo ARMA estacional..................................................................... 78
11. MODELOS MULTIPLICATIVOS ................................................................ 80
11.1. Caracterización teórica ........................................................................ 80
11.2. Aspectos prácticos ............................................................................... 81
11.2.1. Conceptos básicos ........................................................................ 81
11.2.2. Funciones de autocorrelación ....................................................... 83
12. DIAGNOSIS DEL MODELO ...................................................................... 86
12.1. Conceptos básicos .............................................................................. 86
12.2. Instrumentos y etapas.......................................................................... 87
12.2.1. Diagnosis sobre los parámetros .................................................... 87
12.2.2. Diagnosis sobre los residuos ........................................................ 88
12.3. Otros aspectos relevantes ................................................................... 89
13. ANÁLISIS DE INTERVENCIÓN................................................................. 91
13.1. Modelo general .................................................................................... 91
13.2. Efectos y Variables de Intervención ..................................................... 92

7
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

14. PREDICCIÓN ............................................................................................. 95


14.1. Predicciones para modelos estacionarios............................................ 95
14.1.1. Predicción puntual con modelos univariantes ............................... 95
14.1.2. Predicciones por intervalo ............................................................. 99
14.2. Predicción para modelos no estacionarios ........................................ 101
15. PROCESO DE MODELIZACIÓN ............................................................. 102
15.1. Etapas................................................................................................ 102
15.2. Identificación del modelo ................................................................... 103
15.2.1. Transformaciones de la serie ...................................................... 103
15.2.2. Criterios de identificación ............................................................ 104
15.3. Ajuste y diagnosis del Modelo ........................................................... 106
16. SOFTWARE: PROGRAMAS TRAMO Y SEATS ..................................... 109
16.1. Introducción ....................................................................................... 109
16.1.1. Descarga del programa ............................................................... 109
16.1.2. Principales características ........................................................... 110
16.1.3. Programa TRAMO....................................................................... 111
16.1.4. El programa SEATS .................................................................... 116
16.1.5. Conexión entre TRAMO y SEATS............................................... 119
16.2. Descripción de las principales componentes e instrucciones ............ 120
16.2.1. Ventana principal......................................................................... 120
16.2.2. Entrada de datos y especificación del modelo ............................ 122
16.2.3. Procedimiento automático ........................................................... 125
16.2.4. Parámetros del modelo ............................................................... 127
16.2.5. Variables de regresión y análisis de intervención........................ 128
16.2.6. Ejecución de los programas y ficheros output de resultados ...... 132
16.2.7. Gráficos ....................................................................................... 136
16.2.8. Otras utilidades ........................................................................... 137
17. CASOS PRÁCTICOS............................................................................... 138
17.1. Tráfico aéreo ...................................................................................... 138
17.1.1. Fuente y descripción de los datos ............................................... 138
17.1.2. Modelización automática ............................................................. 138
17.1.3. Transformaciones para conseguir estacionariedad ..................... 139
17.1.4. Modelo final ................................................................................. 143
17.1.5. Diagnosis de los residuos del modelo ......................................... 147
17.2. Víctimas mortales en accidentes de tráfico........................................ 152
17.2.1. Fuente y descripción de los datos ............................................... 152
17.2.2. Modelización Automática ............................................................ 152
17.1.3. Transformaciones para conseguir estacionaridad ....................... 153
17.2.4. Modelo final ................................................................................. 158
17.2.5. Diagnosis de los residuos del modelo ......................................... 161
17.3. Ocupados .......................................................................................... 166
17.3.1. Fuente y descripción de los datos ............................................... 166
17.3.2. Modelización automática ............................................................. 166
17.3.3. Transformaciones para conseguir estacionariedad ..................... 167
17.3.4. Modelo final ................................................................................. 169
17.3.5. Diagnosis de los residuos del modelo ......................................... 172
BIBLIOGRAFÍA ............................................................................................. 176

8
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

9
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

10
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

1. INTRODUCCIÓN

1.1. Conceptos básicos

 Series temporales

Una serie temporal consiste en una secuencia o sucesión de datos,


observaciones o valores de una o varias variables, que son medidos en
determinados momentos del tiempo, y ordenados cronológicamente. Para el
denominado análisis de series temporales se emplean diferentes metodologías
que contribuyen a entender e interpretar los datos constituyentes de la serie
temporal, extrayendo la información más relevante sobre las conexiones
existentes y haciendo posible el pronóstico y previsión fiable de su
comportamiento futuro.

Es precisamente la previsión de su evolución futura una de las utilizaciones


más frecuentes del análisis de series temporales, que se extiende a
prácticamente todos los campos científicos y forma parte relevante del
contenido de numerosas disciplinas como son la estadística o la econometría.

Cabe distinguir entre series univariantes cuando se observa una variable y


series multivariantes cuando se observan varias variables en un mismo
momento.

 Características de los datos temporales:

Los datos temporales se caracterizan por:

 Ser dependientes. No se puede considerar que la observación


correspondiente al momento t es independiente de lo que hayamos
observado en el momento t-1. Como consecuencia, y a diferencia del
caso de datos de sección cruzada, la ordenación de las observaciones
es fundamental.

 Las observaciones se obtienen en un entorno que evoluciona. No cabe


asumir que se dispone de T observaciones de la misma variable
aleatoria.

Las series univariantes corresponden al caso de observar una única variable


mientras que las series multivariantes se corresponden con el caso de observar
en un mismo momento varias variables.

11
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Algunos ejemplos populares de series temporales son: los datos


meteorológicos, valoración de acciones de la Bolsa, tráfico, datos económicos,
etc. En particular, muchos fenómenos económicos –paro, producción industrial,
ventas de una empresa, tasa de inflación, inversión empresarial, etc.–
evolucionan a lo largo del tiempo y por ello su estudio requiere una medición
periódica y sistemática que da lugar para cada una de las variables a
secuencias de datos que se denominan series temporales.

 Muestras aleatorias

Las principales características que definen a una muestra aleatoria son las
siguientes:

 Evolución y progresión de los datos desde una realización hasta las


siguientes.
 La media constituye un factor clave de atracción.
 La desviación típica o estándar es un factor que controla la divergencia
existente respecto a la media. Por tanto, la incertidumbre sobre posibles
realizaciones futuras está acotada.
 Independencia entre observaciones. La media condicional y la varianza
condicional coinciden con la media absoluta y la varianza absoluta.

 Proceso estocástico

Cabe, asimismo, indicar que el mecanismo generador de los datos que


conforman las series temporales:

 No es fijo
 Pero no cambia por completo entre una observación y la siguiente

Por lo tanto, una serie temporal muestra:

A) Evolución en los parámetros que rigen las propiedades estadísticas del


proceso generador de datos.

B) Dependencia entre observaciones, aun cuando se corrigen los datos


originales para eliminar la evolutividad.

Por ejemplo, el fenómeno económico de la inflación mensual sería una


secuencia de variables aleatorias x(1) x(2) … x(t) … x(T) … Esta secuencia de
variables aleatorias {x(t)} se denomina proceso estocástico.

Una serie temporal es, en definitiva, una realización finita de un proceso


estocástico {x(t)}.

12
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Por ejemplo, el número trimestral de desocupados en España, cuyo análisis se


incluye como uno de los casos prácticos de este tema, es un proceso
estocástico {x(t)}, mientras que el número de desocupados en España existente
en un trimestre concreto t es precisamente la variable aleatoria x(t) de ese
proceso estocástico. Este número de desocupados observados en el mes t es
una realización de x(t), pero no debe olvidarse que muchas otras realizaciones
del proceso serían posible.

1.2. Interés de su estudio

En muchos casos, el análisis de series temporales con datos de diversa índole


-económicos, financieros, etc.-, adquiere un carácter sumamente relevante.
Entre algunas de las aplicaciones de esta disciplina cabe indicar las siguientes.

 Análisis macroeconómico: Es interesante, por ejemplo, estudiar y


prever la evolución de los precios, la producción, importaciones y otras
muchas variables de coyuntura económica.

 Sociología: Es interesante, por ejemplo, estudiar las tasas de divorcio,


delitos, etc.

 Análisis financiero: Es relevante disponer de previsiones fiables sobre


series financieras como, por ejemplo, evolución del índice de Ibex de la
bolsa de Madrid.

 Sector de la energía: Nos interesa disponer, por ejemplo, de


previsiones sobre la demanda de energía eléctrica en cada momento.

 Ecología: Es relevante disponer de previsiones fiables sobre


contaminación de aire, del agua, etc.

 Demografía: Analizar el número de nacidos, fallecidos o matrimonios.

13
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

1.3. Características de una serie temporal

Las características básicas de una serie temporal son las siguientes:

A) Periodicidad

Se define la periodicidad una serie temporal como el intervalo de tiempo que


transcurre entre cada toma de datos. Así, por ejemplo, de acuerdo con la
duración de dicho intervalo, algunos tipos de periodicidad son los siguientes:

 Periodicidad anual: Se dispone del dato una vez al año. Un ejemplo es la


serie del Producto Interior Bruto anual.

 Periodicidad mensual: Se toma el dato una vez al mes, obteniéndose por


tanto 12 datos al año. Un ejemplo es la serie del número mensual de
accidentes de tráfico.

 Periodicidad trimestral: Se observa el dato una vez al trimestre


obteniéndose, por tanto, 4 datos al año. Un ejemplo de este tipo es la
serie de tasas de actividad procedente de la Encuesta de Población
Activa que tiene periodicidad trimestral.

 Otras posibles periodicidades: semestrales (2 datos al año), diarias (365


datos al año) etc.

B) Tendencia

Se afirma que una serie posee tendencia cuando su valor no permanece en un


rango constante y por lo tanto crece o decrece a largo plazo.

Serie con tendencia descendente


800000

Evolución del número anual de nacimientos en España


700000
Fuente: INE. Serie anual
600000

500000

400000

300000

200000

100000

0
1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996

14
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Serie con tendencia descendente


10000
Evolución del tráfico aéreo interior de viajeros en España
9000 (Miles de pasajeros) Fuente: Ministerio de Fomento

8000

Tráfico interior
7000
Tendencia lineal
6000

5000

4000

3000

2000
ene-99

ene-00

ene-01

ene-02

ene-03

ene-04

ene-05

ene-06

ene-07
Meses

Serie sin tendencia


0,25

0,20

0,15

0,10

0,05

0,00

-0,05

-0,10

-0,15

-0,20

-0,25
feb-81
feb-82
feb-83
feb-84
feb-85
feb-86
feb-87
feb-88
feb-89
feb-90
feb-91
feb-92
feb-93
feb-94
feb-95
feb-96
feb-97
feb-98
feb-99
feb-00
feb-01
feb-02
feb-03
feb-04
feb-05
feb-06
feb-07

Meses

C) Volatilidad (variabilidad)

Una serie es homocedástica cuando su volatilidad (variabilidad) es constante a


lo largo del tiempo. Si varía a lo largo del tiempo, la serie es heterocedástica.

Serie heterocedástica
10000

9000 Evolución del tráfico aéreo interior de viajeros en España


(Miles de pasajeros) Fuente: Ministerio de Fomento
8000

7000

6000

5000

4000

3000

2000
ene-99

ene-00

ene-01

ene-02

ene-03

ene-04

ene-05

ene-06

ene-07

Meses

15
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Serie homocedástica
0,139

0,104

0,070

0,035

0,000

-0,035

-0,070

-0,104

-0,139
7-1981
4-1982
1-1983

7-1984
4-1985
1-1986

7-1987
4-1988
1-1989
10-1983

7-1990
4-1991
1-1992
10-1986

7-1993
4-1994
1-1995
10-1989

7-1996
4-1997
1-1998
10-1992

7-1999
4-2000
1-2001
10-1995

7-2002
4-2003
1-2004
10-1998

7-2005
4-2006
1-2007
10-2001

10-2004

10-2007
D) Ciclo estacional

El ciclo estacional aparece únicamente en series de periodicidad menor que la


anual. Surge por causas naturales (estaciones del año), costumbres sociales
(Navidad), etc. Un ejemplo es la evolución del tráfico aéreo interior mensual en
España, cuyo gráfico se presenta a continuación.

Tráfico aéreo interior en España. Periodicidad mensual


10000

9000

8000 Evolución del tráfico aéreo interior de viajeros en España (Miles de pasajeros)
7000

6000

5000

4000

3000

2000

1000

0
ene-80
ene-81
ene-82
ene-83
ene-84
ene-85
ene-86
ene-87
ene-88
ene-89
ene-90
ene-91
ene-92
ene-93
ene-94
ene-95
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-06
ene-07

Meses

F) Combinación de características

Las series pueden tener simultáneamente: Tendencia, heterocedasticidad y


ciclo estacional. A continuación, se muestran algunos ejemplos de este
comportamiento.

16
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

1.4. Ejemplos

Algunos ejemplos de series temporales de diferente periodicidad son los


siguientes:

800000

Evolución del número anual de nacimientos en España


700000 Fuente: INE. Serie anual
600000

500000

400000

300000

200000

100000

0
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
70,00

60,00

50,00

40,00

Evolución de la tasa de actividad total en España


30,00
Fuente: EPA (INE). Serie trimestral
20,00

10,00

0,00
19771
19781
19791
19801
19811
19821
19831
19841
19851
19861
19871
19881
19891
19901
19911
19921
19931
19941
19951
19961
19971
19981
19991
20001
20011
20021
20031
20041
20051
20061
20071
20081

140

Evolución del Índice General de Producción Industrial en España


120
Fuente: INE (Serie mensual)

100

80

60

40

20

0
ene-80
ene-81
ene-82
ene-83
ene-84
ene-85
ene-86
ene-87
ene-88
ene-89
ene-90
ene-91
ene-92
ene-93
ene-94
ene-95
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-06
ene-07

17
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

2. NUMEROS ÍNDICES

2.1. Conceptos básicos

2.1.1. Agregados macroeconómicos

La utilización de agregados es muy común en el análisis económico para


describir la evolución de las economías nacionales o realizar comparaciones
internacionales. Algunos de los agregados más utilizados son la producción
total, el consumo, la inversión o el nivel de precios. Estos agregados son
consecuencia de las decisiones individuales de los agentes económicos.

 Agregados de cantidades

El análisis que se realiza a continuación se centra en la producción agregada,


aunque lo contenido en este apartado es aplicable a cualquier otro agregado
como el consumo o la inversión.

Cuando nos planteamos medir la producción total de un país debemos


determinar la forma en que agregamos o sumamos las producciones de los
distintos bienes y servicios que se ofrecen en la economía. Al tratarse de
bienes heterogéneos no podemos sumar las unidades físicas totales, sino que
es necesario transformar estas unidades físicas en una unidad común. Esta
medida común es el valor a precios de mercado de los bienes. De este modo,
la producción total en el período t se expresa como:

N
Yt = ∑ yit pit
i =1

Donde yit es el número de unidades físicas del bien i que se ofrecen en la


economía y pit es el precio por unidad del bien i. Por último, N es el número
total de bienes que se ofrece. Para evitar la doble contabilidad solamente se
incluyen los bienes finales que se producen en la economía, es decir aquellos
destinados al consumo o inversión sin sufrir transformación posterior.

La producción total en el período t depende del número de unidades físicas


producidas de cada bien, así como del precio de las mismas en ese instante.
Por tanto, la evolución de la producción depende tanto de la evolución del
número de unidades físicas producidas como de la evolución de los precios. En
algunas ocasiones podemos estar interesados en separar el efecto de ambos
cambios, cantidades y precios, sobre la evolución de la producción total.

18
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Para aislar el efecto de cambio de precios y recoger exclusivamente los


cambios en la producción física se construye un agregado, en el que los
precios se fijan en su valor en un período de referencia, t = 0. El agregado
resultante se conoce como producción a precios constantes del año 0, Yt C ,
mientras que el calculado con los precios del año t es la producción a precios
corrientes Yt.

N
Yt C = ∑ Yit pi 0
i =1

De manera que Yt C = Y0 y la variación en la producción a precios constantes a


lo largo del tiempo se debe exclusivamente a la variación en las unidades
físicas producidas.

 Deflactor implícito

El cociente entre la producción a precios corrientes y la producción a precios


constantes se conoce como deflactor implícito:

Yt
Pt = DEFLACTOR = .100
Yt C

La tasa de variación del deflactor implícito constituye precisamente la tasa de


inflación de la variable que estamos estudiando.

A partir de esta última expresión es sencillo recuperar series reales a partir de


series nominales, deflactándolas con los deflactores correspondientes e
inversamente.

2.1.2. Definición de números índices

Para analizar la evolución de una serie temporal, resultan útiles los números
índices. Si se elige un año de referencia o año base, por ejemplo, t = 0,
asignando el valor 100 al índice en ese año, los índices simples temporales
correspondientes a cada t, Ito, se obtienen mediante la expresión siguiente:

Yt
I t0 = .100
Y0

En definitiva, los valores numéricos del índice responden a una escala arbitraria
que asigna el valor 100 al año base. El valor concreto que tome en un período
no es relevante en sí mismo, sino en tanto que nos informa de la evolución
temporal de la variable. Este tipo de variable se llama número índice simple y
es la forma más sencilla de resumir el cambio dinámico de un proceso

19
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

económico. Para una variable cualquiera xt es posible construir un índice


simple que describe su comportamiento temporal.

Existen también los índices espaciales:

Yti
I ttij = .100
Ytj

Donde t y j son el período y el área de referencia, respectivamente; e índices


mixtos:

Yti
I tij0 = .100
Y0 j

Donde 0 y j son, respectivamente, el período y el área de referencia.

2.2.2. Conceptos básicos

 Enlaces:

Se supone que disponemos de dos índices simples alternativos, lt92 e It95 sobre
una serie de precios, por ejemplo:

Año 89 90 91 92 93 94 95 96 97 98 99
It92 90 95 98 100 104 217 110
It95 100 114 119 126 130

A partir de esta información se quiere elaborar un solo índice de precios. Es


posible convertir los valores del índice en base 95 a base 92 de la forma
siguiente:

I 95,92
I t 92 = I t 95
I 95,95

También es posible convertir los valores del índice en base 92 a base 95


mediante la expresión siguiente:

I 92,92
I t 95 = I t 92
I 95,92

Este proceso se conoce como enlace entre dos series.

20
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Cambios de base

Para cambiar el año base del índice, por ejemplo, del 93 al 96, se utiliza la
expresión siguiente:

100
I t 96 = I t 93
I 96,93

 Tasas de variación

Un fenómeno muy común, principalmente en las series económicas, es su


crecimiento. Hasta ahora se han revisado una serie de herramientas que nos
permiten medir cantidades o precios en un instante de tiempo. Para estudiar la
evolución temporal de las mismas cabe simplemente representar los valores
anteriores. Esto pone en evidencia un fenómeno muy común en las series
económicas, el crecimiento. Sin embargo, los cambios cíclicos y en general, la
evolución a corto plazo de la serie puede quedar oculta por la tendencia de la
misma. Para resaltar esto último se utilizan las tasas de variación de la
variable. La tasa de variación de horizonte 1 de la variable xt se expresa como:

xt +1 − xt
γ xt = t = 1,..., T
xt

 La linealización de las tasas de crecimiento

Muy frecuentemente las oscilaciones entre los valores de las series en


diferentes momentos de tiempo, (xt - xt-h) son proporcionales al nivel inicial (xt-h)
y en estos casos los aumentos en estas variables suelen considerarse en
términos del nivel inicial.

Para evitar esta proporcionalidad, y conseguir que la tasa de crecimiento en


cada observación sea independiente de la magnitud de dicha observación, se
utiliza la transformación logarítmica de la serie. Su demostración es sencilla:
La tasa de crecimiento en t-1 es: mh = t
(x − xt −1 ) ; Por tanto: x = x (1 + m )
t t −1 h
xt −1
Aplicando logaritmos: log xt = log xt −1 + log(1 + mh )

Pero para el caso de que la tasa de variación sea de una magnitud pequeña,
como suele ser el caso, se cumple que: log(1 + mh ) ≈ mh ; por lo tanto, mh se
puede definir linealmente como: mh = log xt − log xt −1

En definitiva, la transformación logarítmica elimina la ley de la proporcionalidad


de las oscilaciones de muchas variables económicas.

21
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

2.2. Índices de precios

2.2.1. Tipos

Para poder estudiar el cambio en los precios de los productos que consume un
individuo, al igual que ocurría al tratar de medir el producto, es indispensable
agregar. En este sentido, deben construirse agregados de precios que reflejen
el coste de los consumos individuales para luego agregar precios de cestas de
consumo de más de una persona. Los bienes y servicios que un agente
económico consume durante un período de tiempo determinado (un año),
constituyen su cesta de consumo.

Un agregado individual de precios para el individuo j con las correspondientes


N
ponderaciones de cada producto es: API t j = ∑ pitα itj
i =1

La ponderación de cada producto puede ser:


p qj
α itj = 1 N o α itj = N it it
p qj∑i =1 it it

Estas alternativas dan origen a distintos tipos de índices. Así, en el primer caso
todos los bienes reciben la misma ponderación mientras que en el segundo la
ponderación de cada bien es proporcional al peso que representa el gasto del
individuo j en el bien i sobre el gasto total del individuo j.

Para construir los agregados de precios colectivos (para J individuos) se


selecciona una cesta de bienes que se considere representativa del consumo
de los individuos del colectivo y ponderamos a cada bien con la ponderación
J
siguiente: α it = ∑ α itj β j

j =1
N

∑p it qitj
Donde β es una ponderación de los individuos, por ejemplo: β itj = J
i =1
.
∑∑
N j
i =1
pit q it
j =1

En definitiva, se lleva a cabo una media ponderada de las ponderaciones


individuales, siendo la ponderación del individuo j igual al peso del gasto total
del individuo j sobre el gasto total de la economía.

J N
Así, el índice de precios colectivo es el siguiente: APt = ∑∑ pitα itj β j

j =1 i =1

22
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En general, lo que nos interesa no es tanto el coste de una cesta de consumo


sino su evolución en el tiempo. Para estudiar esta evolución se construye un
número índice mediante el método descrito en el apartado anterior.

En la práctica, los índices de precios no se calculan a partir de la expresión


anterior. En su lugar se obtiene un índice de precios simple para cada bien i de
la cesta seleccionada y se elige un esquema de ponderaciones de bienes.
Estos índices se conocen como índices compuestos o sintéticos. Para ello
existen varias posibilidades:

N
pi 0 qij0 N
 Índice de Laspeyres: I = ∑ I w
L i L
donde w =
L
y ∑w L
=1

t0 t0 i i N j i
i =1
i =1
p q
i0 i0 i =1

N
pit qitj N
 Índice de Paasche: I tP0 = ∑ I ti0 wiP donde wiP = y ∑w P
=1
∑i =1 pit q
N j i
i =1 it i =1

2.2.2. Ejemplo: Índice de precios al consumo.

El índice de Precios al Consumo (IPC) en España es una media ponderada que


recoge los precios de 428 bienes y servicios. Las ponderaciones de cada bien
se determinan a partir de la Encuesta de Presupuestos Familiares (EPF)
elaborada por el Instituto Nacional de Estadística (INE).

En la EPF para cada hogar de la muestra seleccionada se calcula la proporción


de cada uno de los 428 bienes y servicios en el gasto total. La ponderación
final de cada bien en el IPC se obtiene ponderando las ponderaciones
individuales de cada hogar con la proporción que representa el gasto de ese
hogar sobre el gasto total de la economía. Con estas ponderaciones el INE
elabora mensualmente la media ponderada de los precios de los 428 bienes,
siendo el índice de precios resultante un índice de precios tipo Laspeyres.

Se construye también un índice en el que no se incluyen ni bienes alimenticios


ni energéticos, que define la denominada inflación subyacente.

Entre los posibles inconvenientes del índice cabe indicar los siguientes:

Se trata de un índice de ponderaciones fijas, por lo que podría sobrevalorarse


la inflación al no tener en cuenta los efectos sustitución producidos por los
cambios en los precios relativos de los distintos bienes y servicios.

En general, refleja en mayor medida la evolución de precios de los hogares de


más renta.

23
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

3. COMPONENTES DE UNA SERIE TEMPORAL

3.1. Descomposición de una serie temporal

 Descomposición tradicional

Tradicionalmente se ha utilizado la descomposición siguiente de la serie


temporal Xt.

X t = Tt ⋅ S t ⋅ Ct ⋅ rt

Siendo:
 Tt: Tendencia
 St: Factor estacional
 Ct: Factor cíclico
 rt: Factor residual de fluctuaciones

Cabe interpretar esta descomposición tradicional de las series temporales en el


sentido de que los factores tendenciales, estacionales y cíclicos pueden
formularse en términos estrictamente matemáticos de modo que es posible
cuantificarlos sin error en cualquier momento t. En este contexto, el único
término estocástico en la descomposición es rt, que podía obtenerse como
elemento residual después de comparar Xt con Tt·St·Ct.

Es posible obtener una formulación lineal de la descomposición clásica


tomando logaritmos en la expresión anterior:
log X t = log Tt + log S t + log Ct + log rt . Esta última ecuación nos permite
comprobar que mediante la transformación logarítmica de los datos se obtiene
una descomposición aditiva de Xt.

A continuación, se describen las principales características que definen cada


una de las componentes citadas.

A) Tendencia

La tendencia puede ser:

 Constante

 Variable: La tendencia cambia con el tiempo, tanto en magnitud como en


dirección.

B) Estacionalidad: Corresponde, por ejemplo, al caso de que los valores de


unos meses determinados están sistemáticamente por encima o por debajo de
la media del año.

24
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

C) Componente irregular: Corresponde a variaciones aleatorias alrededor de


las componentes anteriores.

Puede ser:

 Constante
 Variable: La variabilidad varía con el tiempo o con la magnitud de la
serie.

 Interpretación actual

En la interpretación actual de la descomposición de una serie temporal, los


factores no observados, tales como tendencia, estacionalidad y ciclo, no se
consideran como deterministas y sí como estocásticos. Por tanto, existe
incertidumbre sobre la evolución futura de la tendencia y el comportamiento
futuro de los factores estacionales y cíclicos.

A continuación, se describen las principales características que definen cada


una de las componentes citadas.

3.2. Tendencia

La tendencia es aquella parte de la variable que se perpetúa hacia el futuro. Si


una serie temporal va aumentando (o disminuyendo) sistemáticamente se dice
que tiene tendencia.

Si la serie temporal tiene una tendencia determinista, esta tendencia se puede


predecir sin incertidumbre.

3.2.1. Factores causales

Los principales factores que causan las tendencias son los siguientes:

A) Crecimiento de la población. En tal caso se pueden expresar los datos en


términos relativos a la correspondiente población: tasa de paro, renta nacional
per cápita, etc.

B) Inflación mantenida en el tiempo. En tal caso se pueden expresar los


datos en términos reales, es decir, en términos de precios constantes: ingresos
turísticos en términos reales, índice de producción industrial, etc.

Generalmente las tendencias vienen causadas por otros factores además de


los anteriores. Así las variables per cápita en términos reales todavía muestran
tendencia, caso, por ejemplo, del PIB per cápita en términos reales.

25
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

C) Cambios tecnológicos: Telecomunicaciones, electrónica, informática, etc.

D) Cambios lentos en las preferencias, hábitos, regulaciones sociales,


costumbres, etc.; afecta a variables tales como empleo femenino, estudiantes
graduados, etc.

A continuación, se presentan algunos ejemplos de series anuales donde se


distingue nítidamente la existencia de una tendencia.

En la serie temporal anual correspondiente al número de nacimientos en


España, que se representa en la figura adjunta, se observa una clara tendencia
descendente hasta el año 1998 pero a partir de dicho año se presenta una
suave tendencia al crecimiento.

800000

Evolución del número anual de nacimientos en España


700000 Fuente: INE. Serie anual
600000

500000

400000

300000

200000

100000

0
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008

Asimismo, en la serie temporal mensual correspondiente al tráfico aéreo interior


en España que se representa en la figura adjunta, se observa una nítida
tendencia de crecimiento, como se comprueba con las líneas que representan
en el gráfico, respectivamente, las tendencias lineal y exponencial.
10000

9000 Evolución del tráfico aéreo interior de viajeros en España


8000
(Miles de pasajeros) Fuente: Ministerio de Fomento

7000

6000

5000

4000

3000

2000

1000

0
ene-80
ene-81
ene-82
ene-83
ene-84
ene-85
ene-86
ene-87
ene-88
ene-89
ene-90
ene-91
ene-92
ene-93
ene-94
ene-95
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-06
ene-07

Meses

26
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

3.2.2. Modelización

En la expresión X t = Tt + rt se necesita especificar un modelo para la tendencia


Tt . En esta ecuación rt es un componente estocástico de carácter incierto y,
por tanto, X t es también de carácter estocástico independientemente de la
naturaleza de la tendencia, incluso aunque esta pueda ser determinista.

 Tendencia determinista

Una tendencia es determinista si conociendo sus valores pasados se puede


determinar sin error sus valores futuros. Con tendencias deterministas no hay
incertidumbre sobre ellas, toda la incertidumbre sobre X t radica en rt .

A) Modelo de tendencia lineal

A1) Media constante

En el caso de que la serie tuviera una media constante se podría representar


mediante la expresión:
zt = m + ε t

A2) Tendencia lineal

Otro tipo corresponde al caso en que la serie tiene una tendencia creciente o
decreciente lineal.

Su expresión sería la siguiente: zt = a + bt + ε t , donde a y b son parámetros fijos


y en este caso la variable zt crece b unidades en cada unidad de tiempo.

Las tendencias también pueden ser exponenciales cuando la variable zt


aparece en forma de logaritmos como se muestra a continuación:
log zt = a + bt + ε t
zt = exp[a + bt + ε t ]

Asimismo, la tendencia se puede representar como Tt = a + b tiempot ; donde


tiempo es una variable artificial que en cada momento t toma precisamente el
valor t.

27
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En relación con la tendencia lineal cabe destacar los siguientes aspectos.

 Como se deduce de la expresión anterior los parámetros a y b vienen


expresados en la misma unidad de medida que zt .

 El parámetro a es el valor de la tendencia en el momento anterior al


comienzo de la muestra.

 El parámetro b representa el incremento lineal o adicional respecto al


tiempo que va experimentando la tendencia en cada momento. Si la
tendencia es decreciente toma un valor negativo.

 En general las tendencias son crecientes, en cuyo caso el parámetro b


es positivo. Algunas series pueden mostrar tendencias decrecientes en
un periodo de tiempo como el número de nacimientos o la cuota de
mercado de una empresa en un sector.

B) Tendencias no lineales respecto al tiempo:

Si ∇ es un operador que aplicado a una variable temporal zt , la transforma en


sus primeras diferencias: ∇zt = zt − zt −1 , la tendencia lineal implica que los
incrementos tendenciales ∇Tt = Tt − Tt −1 = b son constantes.

Cuando eso no se cumple la tendencia no es lineal. Por ejemplo, porque los


incrementos tendenciales ∇Tt son crecientes o decrecientes.

B1) Tendencia parabólica o polinomial de 2º orden

En este caso la expresión de la tendencia es la siguiente: Tt = a + bt + ct 2

Cabe indicar que en esta expresión la tendencia no sólo depende del nivel de
la variable tiempo sino también de su cuadrado, por lo que no es lineal.

En el caso de tendencia cuadrática, los incrementos tendenciales vienen


determinados por ∆Tt = b + c(2t − 1) ; con lo que no son constantes. Además de
acuerdo con el signo de c puede suceder lo siguiente:

 SI c > 0 los incrementos tendenciales son monotónicamente crecientes,


desde el principio si b ≥ 0 o desde t > [(c-b)/2c] si b < 0.

 SI c < 0 los incrementos son monotónicamente decrecientes, desde el


principio si b < 0 o desde t > [(c-b)/2c] si b>0.

28
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

B2) Tendencias polinomiales de orden superior a 2

La expresión de la tendencia para el caso de Tendencias polinomiales de orden


superior a 2 es la siguiente:

Tt = a + b1t + b2 ct 2 + .... + br ct r

Como ocurría en el caso cuadrático, a partir de un determinado momento


pueden ser sistemáticamente crecientes (br > 0) o decrecientes (br < 0).

Pero además mientras que en el caso cuadrático los incrementos tendenciales


podían, como máximo, cambiar una vez de signo, en este caso los incrementos
pueden cambiar varias veces de signo con lo que la tendencia pierde su
carácter de componente suave. De hecho, polinomios de este tipo tienden a
captar, además de la tendencia, diferentes oscilaciones en las series
temporales. Por ello, en general, los esquemas polinomiales de orden superior
a uno no se utilizan para representar tendencias en series económicas.

B3) Tendencias exponenciales

Se trata de un tipo de tendencia no lineal que resulta muy útil para series
económicas. Para introducir estas tendencias recuérdese la propiedad de
proporcionalidad que muestran las series económicas y que se mencionó al
hablar de la descomposición tradicional de una serie temporal. Esta propiedad
implica que la evolución de la serie, a partir de un determinado nivel inicial, es
proporcional al nivel de partida.

La tendencia lineal anterior se puede expresar de la forma siguiente.


Tt = Tt −1 + b
En esta expresión se observa que a partir de un nivel inicial (t = t-1) la
tendencia (y en consecuencia z t evoluciona de forma aditiva, incorporando en
cada momento un crecimiento b; es decir, no hay proporcionalidad en la
evolución de la tendencia lineal.

La aproximación logarítmica de una tasa b como la anterior es fácil de obtener.


A partir de la aproximación de Taylor de primer orden de una función f (z t ) , se
obtiene que f (zt ) ≈ f (zt −1 ) + (zt − zt −1 ) f ′(zt −1 ) . Luego para f (zt ) = log Tt , se
(T − Tt −1 )
obtiene: log Tt ≈ log Tt −1 + t
Tt −1
(T − T )
En definitiva, log Tt − log Tt −1 = ∇ log T = t t −1
Tt −1

Esta aproximación se puede considerar adecuada para magnitudes pequeñas


de la tasa de crecimiento.

29
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En general, una serie con tendencia exponencial vendrá dada por el modelo:
zt = exp(a + bt )exp(ε t )

La tendencia y el modelo anterior para zt no son lineales, pero como se ha


comprobado anteriormente, la transformación logarítmica los convierte en
lineales:

log zt = a + bt + ε t ; En resumen, un modelo con tendencia exponencial se puede


considerar, asimismo, como un modelo con tendencia log-lineal, es decir, con
tendencia lineal en la transformación logarítmica de los datos.

En log zt = a + bt + ε t ; b es un factor incremental que se incorpora en cada


momento de forma multiplicativa pero no debe olvidarse que las unidades de b
no son las de zt .

Cabe considerar al parámetro b como (aproximadamente) una tasa de


crecimiento en tanto por uno.

Ejemplo: En el gráfico adjunto se muestra el ajuste de una tendencia


exponencial a la serie temporal del tráfico aéreo interior de viajeros en España.
La ecuación de la línea exponencial ajustada es log zt = log 23,378 + 0,0001 t + ε t

10000

9000
Evolución del tráfico aéreo interior de viajeros en España
(Miles de pasajeros) Fuente: Ministerio de Fomento
8000

7000

6000
Tráfico interior

5000
Tendencia Exponencial y = 23,379e0,0001x

4000

3000

2000

1000

0
ene-95
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-06
ene-07
ene-93
ene-94
ene-91
ene-92
ene-80
ene-81
ene-82
ene-83
ene-84
ene-85
ene-86
ene-87
ene-88
ene-89
ene-90

Meses

 Conclusiones

A modo de resumen, cabe señalar que los modelos de tendencia determinística


aconsejables para series económicas son:

 La tendencia exponencial si la serie evoluciona con la propiedad de


proporcionalidad.

 La tendencia lineal, en caso contrario.

30
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Pero en determinadas series, caracterizadas por estar acotado el crecimiento,


estos modelos son claramente inapropiados.

Asimismo, cabe destacar la existencia de similitudes entre la tendencia lineal y


la exponencial ya que ambas tienen una formulación o se pueden reformular de
modo lineal, con lo que la tendencia en tales casos está compuesta de dos
elementos: nivel inicial e incremento.

Ambas componentes se definen sobre parámetros fijos: Nivel inicial: parámetro


a e incremento: parámetro b.

31
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

3.3. Componente estacional

3.3.1. Características básicas

En muchas series temporales, por ejemplo, económicas, las medias parciales


frecuentemente evolucionan con el tiempo de forma cíclica, con un solo ciclo o
un número entero de ciclos en un año. Este efecto se denomina el componente
estacional de una serie temporal.

La estacionalidad aparece frecuentemente en los datos económicos debido a:

 El influjo de variables climáticas


 Las normas y costumbres sociales que se repiten año tras año

Los factores que producen estacionalidad suelen perpetuarse en el futuro.


Debido a esta característica, el ciclo estacional es distinto de otros ciclos
económicos, caso del ciclo de negocios) que no suelen perpetuarse en el
futuro.

3.3.2. Modelización

Análogamente al caso de la tendencia, es posible modelizar mediante variables


ficticias la estacionalidad determinista. La estacionalidad se deriva de aquellos
componentes de la serie que se repiten sistemáticamente en un periodo de
tiempo determinado, por ejemplo, un año.

En este caso, para obtener las desviaciones con respecto a la tendencia y al


componente estacional, ajustaríamos el siguiente modelo de regresión:

z t = α + βt + δ 1D1t + δ 2 D2 t + δ 3 D3t + ε t , siendo D1 , D2 y D3 tres variables ficticias


que toman el valor 1 en el trimestre 1,2 y 3, respectivamente, y cero en todos
los demás.

 Ejemplos

A continuación, se muestran varios ejemplos de series con crecimiento


sistemático y estacionalidad.

32
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En el primer ejemplo, correspondiente a la serie mensual del índice de


producción industrial, se observa tanto el crecimiento sistemático de la serie
como su estacionalidad ya que en los meses de agosto presenta un descenso
acusado de su magnitud.

140

Evolución del Índice General de Producción Industrial en España


120
(Serie mensual)

100

80

60

40

20

0
ene-80
ene-81
ene-82
ene-83
ene-84
ene-85
ene-86
ene-87
ene-88
ene-89
ene-90
ene-91
ene-92
ene-93
ene-94
ene-95
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-06
ene-07
Asimismo, en el segundo ejemplo, correspondiente a la serie mensual de
tráfico aéreo interior de viajeros, se observa tanto el crecimiento sistemático de
la serie como su estacionalidad ya que en los meses de verano presenta un
aumento acusado de su magnitud.

10000

9000
Evolución del tráfico aéreo interior de viajeros en España
8000 (Miles de pasajeros)

7000

6000

5000

4000

3000

2000

1000

0
ene-80
ene-81
ene-82
ene-83
ene-84
ene-85
ene-86
ene-87
ene-88
ene-89
ene-90
ene-91
ene-92
ene-93
ene-94
ene-95
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-06
ene-07

Meses

33
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

3.3.3. Índice de estacionalidad

Para medir el grado de estacionalidad de una serie temporal, se utiliza una


medida, denominada índice o tasa de estacionalidad que se define, para el
caso de series mensuales, como el cociente entre la suma de las magnitudes
de los meses estacionales y el total anual. De esta forma, se dispone de índice
de estacionalidad para cada año y podemos seguir su evolución temporal.

Este concepto se ha aplicado para medir el grado de estacionalidad del tráfico


interior de viajeros en España, construyendo a partir de los datos mensuales de
tráfico en el periodo 1980-2007, el índice de estacionalidad.

Esta tasa de estacionalidad que mide el comportamiento estacional del tráfico


1
X max + X max
2
+ X max
3
para cada año se define de la siguiente manera: TEA t =
X tot

Donde:

TEAt = Tasa de estacionalidad del año t (1980, 1981,.2007)


1 2 3
X max , X max , X max , = El número de viajeros en los tres meses que reflejen mayor
movimiento en cada año (Julio, agosto y septiembre).
Xtot = El número total de viajeros del año de referencia.

En el gráfico adjunto se muestra la evolución del índice anual de estacionalidad


calculado, comparándolo con el índice de homogeneidad, que correspondería
al caso de que el tráfico fuera constante todos los meses sin atisbos de
estacionalidad.

0,4

Tasa anual de estacionalidad en el tráfico interior de viajeros

0,3

0,2

TASA ANUAL DE ESTACIONALIDAD (Interior) HOMOGENEIDAD

0,1

0,0
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006

34
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

4. FUNCIONES DE AUTOCORRELACIÓN

4.1. Conceptos básicos

Antes de definir y describir las funciones de autocorrelación es necesario


conocer un conjunto de diversos operadores que poseen una nomenclatura
específica y se utilizan muy frecuentemente en el análisis de series temporales.
Todos ellos se describen a continuación.

4.1.1. Operador de retardo

El operador de retardos, L (también denominado B), retrasa una posición la


observación: LZ t = Z t −1 .

Es decir, el operador L o B aplicado a Zt retrasa una posición y la convierte en


Zt-1.

En el caso de aplicarlo k veces: B k Z t = Z t − k

El objetivo básico de este operador es poder disponer de procesos más


manejables.

 Propiedades

Entre las propiedades de este operador cabe indicar las siguientes:


Lk Z t = Z t − k
L(φZ t ) = φLZ t = φZ t −1
L( Z t + Yt ) = LZ t + LYt = Z t −1 + Yt −1

4.1.2. Operador diferencias

El operador diferencia regular ∇ o D resta a cada elemento de la serie la


observación anterior: ∇Z t = Z t − Z t −1

La expresión puede escribirse de la forma siguiente:

∇Z t = Z t − Z t −1 = Z t − LZ t = (1 − L )Z t

Por lo tanto, cabe concluir que aplicar o tomar una diferencia regular equivale a
premultiplicar Zt por (1-L).

Si se toman dos diferencias de orden 1, se representa por ∇ 2 Z t .

35
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

4.1.3. La transformación logarítmica

En relación con la transformación logarítmica, consistente en tomar el logaritmo


en la variable, cabe señalar que como se ha demostrado en un apartado
anterior, posee la cualidad de que la diferencia de los logaritmos de dos
observaciones en t y t-1 es equivalente (aproximadamente) a la tasa de
variación de dicha variable entre t-1 y t.

Zt Z − Z t −1 Z − Z t −1
log( Z t ) − log( Z t −1 ) = log( ) = log(1 + t )≈ t
Z t −1 Z t −1 Z t −1

4.2. Funciones de autocorrelación

En general una serie temporal Z1 Z2 Z3 ..... Zt tiene una estructura de


dependencia del tipo: z1 → z2 → z3→ z4 ; donde la flecha indica que Zt
influye sobre Zt+1.

Para analizar y modelizar la serie temporal es necesario identificar la estructura


que la genera, es decir, la forma en que influyen las observaciones del pasado
en las futuras.

Para ello se dispone de las herramientas o funciones siguientes que nos sirven
para representar la estructura de dependencia:

 Función de Autocorrelación Simple (FAS)

 Función de Autocorrelación Parcial (FAP)

A continuación se describen las principales características de cada una de


ellas.

4.2.1. Función de Autocorrelación Simple

La Función de Autocorrelación Simple proporciona el coeficiente de correlación


entre una observación y las siguientes. Se define por tanto, como una función r,
tal que ∀k rk = corr ( y t y t − k ) es decir, devuelve el coeficiente de correlación lineal
simple entre las variables yt e yt − k , que puede expresarse de la forma
siguiente:

cov ( y t y t − k )
rk = , ∀k
var ( y t ) var ( y t − k )

36
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

La FAS nos proporciona información sobre como una observación influye en


las siguientes. Hay un valor para cada grado de separación (retardos) por lo
que es una sucesión de números: ρ1, ρ2, ρ3, …., ρk que representan:

 ρ1: La influencia de una observación zi sobre la siguiente zi+1

 ρ2: La influencia de una observación zi sobre la segunda posterior zi+2

 ρk: La influencia de una observación zi sobre la k retardos posterior zi+k

Entre las propiedades de la Función de Autocorrelación Simple cabe destacar


las siguientes:

 Los valores de la FAS ρ1, ρ2, ρ3, …., ρk, están acotados entre [-1,+1].

 Cuando un ρk vale cero quiere decir que no existe relación entre la


observación zi y la separada k retardos, zi+k.

 Cuando un ρk es próximo a +1, la relación entre zi y la separada k


retardos, zi+k es muy fuerte y positiva.

 Cuando un ρk es próximo a -1, la relación entre zi y la separada k


retardos, zi+k es muy fuerte y negativa.

4.2.2. Función de Autocorrelación Parcial

La Función de autocorrelación parcial (FAP) se define como una función φ


tal que φkk = corr ( y t y t − k / y t −1 , y t − 2 ,..., y t − k −1 ) , ∀k , es decir, devuelve la correlación
lineal existente entre yt e yt − k , pero descontando el efecto que tienen los
retardos intermedios sobre ellas. Para medir esta correlación parcial basta con
construir una regresión como la siguiente:

y t = φk 0 + φk 1 y t −1 + φk 2 y t − 2 + ... + φkk y t − k + ε t

Donde el último coeficiente sería el coeficiente de correlación parcial de orden


k. Salvo para k = 1 , el resto de los valores de la FAS y FAP serán distintos.

En definitiva, proporciona la relación directa existente entre observaciones


separadas por k retardos, es decir por ejemplo, cómo influye z1 sobre z3
directamente, sin pasar por z2.

37
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

5. SERIES ESTACIONARIAS

5.1. Características de las series estacionarias

Como se ha indicado anteriormente, se parte del supuesto de que la serie que


se está analizando es la realización de un proceso estocástico: sucesión de
variables aleatorias ordenadas en el tiempo Y(1), Y(2),...,Y(T).

Un proceso estocástico puede generar, en teoría, infinitas realizaciones durante


el periodo t =1,…,T. Si dispusiéramos de varias realizaciones del proceso,
entonces la media de cada una de las variables que lo componen podría ser
estimada mediante la expresión siguiente:

∑ y( )
j =1
t
j

µ̂ t =
m

Sin embargo, en la práctica, sólo disponemos de una única realización y, por lo


tanto, no es posible estimar los momentos de las variables aleatorias que
componen el proceso.

Para poder estimar los momentos (media, varianza etc.) de cada variable en el
periodo t, es necesario restringir las propiedades del proceso estocástico. Las
restricciones que se imponen en este sentido son las denominadas de
estacionariedad.

En este sentido se define un proceso como estacionario si cumple las


condiciones siguientes:

1) E (Y (t )) = µ , ∀t
2) Var (Y (t )) = σ 2 < ∞, ∀t
3) Cov (Y (t ), Y (t + h )) = γ (h ), ∀t

La primera condición nos permite estimar la media (que es común a todas las
variables) mediante la media muestral. Lo mismo puede afirmarse de las otras
dos condiciones. En la práctica, las condiciones de estacionariedad nos
permiten estimar las autocorrelaciones (medida de la dependencia lineal entre
observaciones separadas por h periodos de tiempo) mediante las
autocorrelaciones muestrales.

38
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En resumen, las características de una serie estacionaria son las siguientes:

 No tiene tendencia

 Es homocedástica

 No tiene ciclos estacionales

 La estructura de dependencia se mantiene constante, es decir si una


observación influye sobre la posterior, éste hecho ocurre siempre y no
únicamente entre las dos observaciones determinadas. Se trata de una
condición importante para modelizar la serie y poder prever su evolución
porque si el fenómeno que genera la serie cambia, sería imposible poder
prever la evolución de la serie.

 La influencia de cada observación sobre las posteriores decrece con el


tiempo.

5.2. Proceso Ruido Blanco

A continuación se describen las principales características del proceso


denominado ruido blanco que es un proceso simple estacionario que nos sirve
de gran ayuda para representar cualquier serie temporal.

El denominado Ruido Blanco es una serie estacionaria at en la que ninguna


observación influye en las siguientes. Sus principales características son las
siguientes.

E (at ) = 0
Var (at ) = σ a2
Cov (at , at −h ) = 0 , ∀h ≠ 0

Cuando además de las tres condiciones anteriores asumimos que at sigue una
distribución Normal, entonces decimos que at es un ruido blanco Gaussiano. En
este caso, las at son serialmente independientes y los gráficos que representan
tanto a su FAS como a su FAP se componen de una sucesión de palos o
barras no significativos.

39
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En el gráfico siguiente se representa un ejemplo de una serie con un proceso


ruido blanco.
12. 5

10

7. 5

2. 5

-2. 5

-5

-7. 5

-10

-12. 5
0 500 1000 1500 2000

Cabe señalar que el objetivo básico del análisis de series temporales es


descomponer la serie observada en una parte que depende del pasado y otra
que es impredecible. Este último proceso se conoce como innovación y debe
tener las características de ser un ruido blanco:

y t = f ( y t −1 ,..., y1 ) + at
E (at ) = 0
Var (at ) = σ a2
Cov (at , at − h ) = 0, ∀h

 Funciones de autocorrelación:

Las funciones de autocorrelación del ruido blanco son las siguientes:

Autocovarianza y autocorrelacion
σ 2 k = 0
γk =  a
0 k ≠ 0
1 k = 0
ρk = 
0 k ≠ 0
1 k = 0
φkk = 
0 k ≠ 0

En resumen todos los elementos de las FAS y FAP del proceso ruido blanco
son significativamente nulos.

40
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

5.3. Transformaciones para conseguir estacionariedad

Para conseguir una serie final estacionaria, que es nuestro objetivo básico en el
proceso de modelización de la serie temporal original, se dispone de una serie
de transformaciones que se describen a continuación. Aplicando las
transformaciones adecuadas conseguimos que los sucesivos componentes
irregulares (residuos) sean cada vez más parecidos a un ruido blanco y
transformar nuestra serie original en una estacionaria.

A continuación se describen las transformaciones idóneas para conseguir la


estacionariedad en media y varianza, respectivamente.

A) Estacionariedad en Media:

En el caso de que una serie temporal no sea estacionaria en media porque


tiene tendencia (creciente o decreciente), es posible eliminar esta tendencia
tomando simplemente diferencias regulares.

El ejemplo más sencillo de este hecho es el denominado camino aleatorio, es


decir: y t = y t −1 + ε t donde ε t es un proceso de ruido blanco. La serie yt no es
estacionaria, pero su primera diferencia regular sí que lo es, ya que:
∇y t = y t − y t −1 = ε t y un ruido blanco es un proceso estacionario por definición.

Por ejemplo, en el gráfico adjunto, que representa a una variable yt que sigue
un camino aleatorio, se observa que es una serie no estacionaria en media ya
que tiene una nítida tendencia decreciente.

Sin embargo, si aplicamos o tomamos una diferencia regular, ∇yt a la serie


original se obtiene una serie estacionaria en media como se muestra en el
gráfico adjunto.

Camino aleatorio Diferencia Regular


4
0.5
y
0.0
2
-0.5

-1.0
0
-1.5

-2.0 -2

-2.5

-3.0 -4
20 40 60 80 100 120 140 160 180 200 20 40 60 80 100 120 140 160 180 200

y DY

41
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En la práctica, la mayor parte de las series temporales económicas necesitan 1


o a lo sumo 2 diferencias regulares para que tenga una media incondicional
estable. Es decir, si al tomar la primera diferencia regular, la serie todavía
deambula alrededor de una media global y por tanto, todavía no la podemos
considerar estacionaria, la solución consiste en tomar dos diferencias
regulares:
∇ 2 y t = (1 − B ) y t = y t − 2 y t −1 + y t − 2 t
2

No es necesario tomar tres diferencias regulares para inducir estacionariedad


en media, ya que esto implicaría un crecimiento explosivo de la serie en nivel
que no se observa en general con datos económicos.

B) Estacionariedad en Varianza

Muchas series temporales muestran una variabilidad o volatilidad que cambia


con su nivel (con su media). Para eliminar esta no estacionariedad en varianza
se utiliza la familia de transformaciones de Box-Cox. La idea es que si yt no es
estacionaria en varianza, existe un valor de un parámetro llamado λ , tal que la
serie transformada ytλ sí lo es. Además, puede aplicarse a la serie original un
cambio de origen (a través de un parámetro m ) cuando la trasformación
requiere valores positivos.

La expresión general de esta familia de transformaciones es la siguiente:


 ( yt + m)λ − 1
 si λ ≠ 0
ytλ ,m =  λ
 ln( y + m) si λ =
 t 0

Donde, si el valor del parámetro λ es cero nos indica que la transformación


adecuada es la logarítmica, caso muy frecuente en el proceso de análisis de
series temporales, particularmente económicas.

 Proceso de análisis:

El proceso de análisis para elegir la transformación más adecuada se basa en


la observación de la evolución conjunta de las medias y desviaciones típicas a
lo largo del tiempo. En esta evolución caben las posibilidades siguientes:

A) Si se observa en la serie que a medida que crecen las medias (µ ) la


dispersión (σ ) se mantiene constante, la elección más adecuada de λ es uno.
Es decir, no habría que realizar ninguna transformación a los datos, ya que son
estacionarios en varianza.

B) Si a medida que crece la media crece la dispersión de manera


aproximadamente lineal, la transformación más adecuada es la logarítmica, es
decir, λ = 0 .
42
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

C) Si a medida que crece la media crece la dispersión, pero no de modo lineal,


sino cada vez en mayor magnitud, la elección más adecuada es λ > 0 . No
obstante, en la práctica este caso no es útil ya que la transformación de los
datos en la mayoría de los casos no tiene una interpretación económica
sencilla.

Por tanto, cabe concluir en que la decisión es: λ = 0 , o bien, λ = 1 , es decir, o


se sigue trabajando con la serie original o con la serie en logaritmos.

En general, cabe afirmar que la transformación más habitual en el análisis de


series temporales económicas es la transformación logarítmica que reduce la
escala de las observaciones más extremas y por tanto es la más adecuada
para estabilizar la variabilidad de la variable cuando dicha variabilidad se
incrementa con el nivel de la serie. Sin embargo, no debe olvidarse que esta
transformación por sí misma, no cambia la tendencia de la variable.

 Interpretación de las transformaciones de datos

Cabe interpretar de la forma siguiente a las transformaciones mencionadas de


los datos de la serie temporal original.

Si sólo se toma una diferencia regular a los datos, la serie transformada


z t = y t − y t −1 , se interpreta como el cambio en el valor de yt entre un período y
el siguiente.

Si se toma el logaritmo y una diferencia regular, la serie transformada


z t = ∇ ln y t , se interpreta como la tasa logarítmica de variación (en tanto por
uno) entre un período y el siguiente, constituyendo un indicador de crecimiento
de la serie. Para comprobarlo basta con operar de la siguiente forma:
 y   y   y − y t −1  y t − y t −1
∇ ln y t = ln y t − ln y t −1 = ln  t  = ln  t − 1 + 1 = ln  t + 1 ≈
 y t −1   y t −1   y t −1  y t −1
Siendo este último término la tasa de variación de la serie entre t y t+1.

Si se toma el logaritmo y dos diferencias regulares, la serie transformada


zt = ∇ 2 ln y t , se interpreta como el cambio en la tasa logarítmica de variación
entre un período y el siguiente y de alguna forma representaría un indicador de
la tasa de aceleración en el crecimiento.

Si se toma el logaritmo conjuntamente con una diferencia estacional de período


s , la serie transformada, zt = ∇ s ln y t = ln y t − ln y t − s , puede interpretarse como
la tasa logarítmica de variación acumulada en s períodos y representaría un
indicador de crecimiento acumulado en un ciclo estacional.

43
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

6. PROCESOS AUTORREGRESIVOS
Mientras que en el caso de las series temporales que siguen el proceso que
hemos denominado de ruido blanco las observaciones no tienen ninguna
relación entre sí, las series que se van a analizar a continuación siguen
procesos donde existe una dependencia específica entre las observaciones.

6.1. Caracterización teórica

6.1.1. Tipos de representación

Un proceso estocástico sigue un modelo AR de orden p, AR( p ) , si cualquier


{ yt }t =1
n
variable del proceso se puede escribir de la forma siguiente:
yt = δ + φ1 yt −1 + φ2 yt −2 + ....φ p yt − p + ε t , donde ε t es un proceso de ruido blanco, δ
es la constante del modelo y los parámetros φ1 , φ2 ,....φ p son los llamados
parámetros autorregresivos. Este modelo nos indica que la variable yt se
explica por su propio pasado hasta el retardo p y de hecho, no es más que
una autorregresión donde los regresores son los sucesivos retardos de la
variable endógena.

El proceso autorregresivo más simple es el de orden 1, proceso AR(1). En este


caso, el modelo se escribe de la forma siguiente: y t = δ + φ1 y t −1 + ε t , donde sólo
hay un parámetro autorregresivo y el error sigue un proceso de ruido blanco.

Siempre es posible escribir de otra forma estos procesos, usando el operador


retardo, es decir: y t = δ + φ1By t + ε t ⇒ (1 − φ1B ) y t = δ + ε t , donde en esta
representación aparece un polinomio de orden uno en B , (1 − φ1B ) , llamado el
polinomio característico de un AR(1).

Finalmente, la tercera representación aparece al dividir ambos lados de la


δ εt
expresión anterior por el polinomio AR(1). Es decir, y t = + ;
1 − φ1B 1 − φ1B
1
Sabiendo que = 1 + φ1B + φ12 B 2 + φ13 B 3 + .... y que al ser δ una constante,
1 − φ1B
δ δ
= , se deduce que un AR(1) tiene una representación equivalente
1 − φ1B 1 − φ1
δ
dada por: y t = + ε t + φ1ε t −1 + φ12ε t − 2 + φ13ε t − 3 + .....
1 − φ1

En resumen, la variable yt viene explicada por una constante más una suma
ponderada de infinitos errores pasados y el contemporáneo.

44
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

6.1.2. Modelo AR(1)

Las principales características del proceso AR(1): y t = δ + φ1 y t −1 + ε t se


describen a continuación.

Media: Tomando esperanzas a ambos lados del modelo, se tiene que la media
es E ( y t ) = δ + φ1Ey t −1 , ya que ε t tiene media nula. Suponiendo la existencia de
estacionariedad en media, E ( yt ) = E ( yt −1 ) y la media del proceso es
δ
E ( yt ) = µ = , ∀t .
1 − φ1

Varianza: La varianza del proceso será la suma de varianzas ya que es la


covarianza entre y t −1 y ε t es nula. Es decir, var ( y t ) = φ12 var ( y t −1 ) + σ ε2 , al ser la
varianza del ruido constante e igual a σ ε2 . Suponiendo estacionariedad en el
segundo momento, var( yt ) = var( yt −1 ) y la varianza del proceso es finalmente
σ ε2
var ( y t ) = γ 0 = , ∀t
1 − φ12

Esta varianza es finita y positiva si se cumple la condición de que φ1 < 1 ,


llamada condición de estacionariedad de un AR(1). El que se cumpla esta
condición es equivalente a que el módulo de la raíz del polinomio AR(1) sea
1
mayor que la unidad, ya que 1 − φ1 B = 0 ⇒ B >1 ⇒ B = >1 ⇒ φ1 < 1
φ1

Función de autocovarianzas. Para calcular las magnitudes de las


autocovarianzas de orden 1, 2, etc., conviene escribir el modelo en
yt φ1 yt −1 + ε t donde
desviaciones con respecto a las medias de las variables:=
δ δ
y= yt − e y=
t −1 yt −1 − .
1 − φ1 1 − φ1
t

De esta forma se obtienen las correspondientes covarianzas:


γ 1 = cov( yt yt −1 ) = E ( yt yt −1 ) = E[(φ1 yt −1 + ε t ) yt −1 ] = φ1 E ( yt2−1 ) + E (ε t yt −1 ) = φ1γ 0
γ2 = E[(φ1 yt −1 + ε t ) yt − 2 ] =
E ( yt yt − 2 ) =
cov( yt yt − 2 ) = φ1 E ( yt −1 yt − 2 ) + E (ε t yt − 2 ) =
φ1γ 1 =
φ12γ 0

En general:

γj =cov( yt yt − j ) =E ( yt yt − j ) =E[(φ1 yt −1 + ε t ) yt − j ] =φ1 E ( yt −1 yt − j ) + E (ε t yt − j ) =φ1γ j −1 =φ1jγ 0
, donde se ha aplicado el supuesto de estacionariedad en varianza y en
covarianza. En definitiva, la covarianza entre dos variables distintas sólo
cambia con la distancia entre ellas, no con el tiempo.

45
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Función de autocorrelación simple o FAS teórica. Bajo el supuesto de


estacionariedad, se cumplen las siguientes igualdades:

r0 = 1
γ 1 φ1γ 0
=
r1 = = φ1
γ0 γ0
γ 2 φ12γ 0
=
r2 = = φ12
γ0 γ0
γ j φ1j γ 0
Y, en general, rj = = = φ1j
γ0 γ0

Función de autocorrelación parcial o FAP teórica: La regresión que habría


que llevar a cabo para determinar el primer valor de la FAP, φ11 , es la siguiente:
y t = φ10 + φ11 y t −1 + ε t pero como la expresión del modelo AR(1)
es y t = δ + φ1 y t −1 + ε t , se deduce, al comparar el proceso AR(1) con la regresión
anterior, que el primer valor de la FAP coincide con el parámetro
autorregresivo: φ11 = φ1 .

El resto de los valores de la FAP de un AR(1) son todos nulos, dado que la
regresión que se debería efectuar para determinar el segundo valor de esta
función, φ22 , sería y t = φ20 + φ21 y t −1 + φ22 y t − 2 + ε t pero el modelo AR(1) indica que
no puede haber autocorrelación parcial de orden 2 en un AR(1) ya que si la
hubiera, tendríamos un proceso AR(2).

En definitiva, φ11 = φ1 y φ jj = 0 , ∀j > 1 . Por tanto, cabe destacar que en un AR(1)


la FAS no llega a cortarse nunca, aunque decae por estacionariedad, mientras
que por el contrario, la FAP se corta a partir del primer valor. Cabe concluir,
finalmente, que el orden de los AR se debe observar y deducir de la FAP.

6.1.3. Modelo AR(2)

A continuación se muestran las principales características teóricas de un


proceso AR(2) que sigue el modelo: y t = δ + φ1 y t −1 + φ2 y t − 2 + ε t

Media: Tomando esperanzas a ambos lados del proceso y sabiendo que ε t es


ruido blanco, se obtiene que la media es igual a E ( y t ) = δ + φ1E ( y t −1 ) + φ2 E ( y t − 2 )
e imponiendo la condición de estacionariedad se deduce la expresión final:
δ
E ( yt ) = µ = , ∀t
1 − φ1 − φ2

46
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Varianza y función de autocovarianzas:

 δ  
2

γ 0 = var ( y t ) = E  y t −   = E (yˆ t2 ) = E [(φ1 yˆ t −1 + φ2 yˆ t − 2 + ε t ) yˆ t ] =


 1 − φ − φ 2  
1 
= φ1E ( yˆ t −1 yˆ t ) + φ2 E ( yˆ t − 2 yˆ t ) + E (ε t yˆ t ) = φ1γ 1 + φ2γ 2 + σ ε2

Donde se asume estacionariedad en el segundo momento. La varianza del


proceso depende de los sucesivas autocovarianzas, γ 1 y γ 2 . Por tanto, se
obtienen las magnitudes siguientes:

γ=
1 cov( yt yt −1= ) E[(φ1 yt −1 + φ2 yt − 2 + ε t ) yt −1=
) E ( yt yt −1= ]
φ1 E ( yt2−1 ) + φ2 E ( yt − 2 yt −1 ) + E (ε t yt −1 ) =+
= φ1γ 0 φ2γ 1

γ 2= cov( yt yt − 2 = ) E[(φ1 yt −1 + φ2 yt − 2 + ε t ) yt − 2=


) E ( yt yt − 2 = ]
φ1 E ( yt −1 yt − 2 ) + φ2 E ( yt2− 2 ) + E (ε t yt − 2 ) =
= φ1γ 1 + φ2γ 0

Y en general, la ley que genera las autocovarianzas de cualquier orden es:

γ j = cov ( y t y t − j ) = E ( yˆ t yˆ t − j ) = φ1γ j −1 + φ2γ j − 2 , ∀j > 0

Para obtener las expresiones anteriores, se ha utilizado el hecho de que, por


estacionariedad, la función de autocovarianzas es simétrica, es decir, γ j = γ − j .
Si se resuelve el sistema de ecuaciones para γ 0 , γ 1 y γ 2 , obtenemos una
expresión de la varianza del proceso que depende de los parámetros del
modelo, es decir, φ1 , φ2 y σ ε2 :

γ0 =
(1 − φ2 )σ ε2
(1 + φ2 )[1 − (φ1 + φ2 )][1 − (φ1 − φ2 )]
Para que esta varianza sea positiva y finita, se han de cumplir las tres
condiciones siguientes sobre los parámetros: φ2 < 1 , φ2 + φ1 < 1 , φ2 − φ1 < 1 que
son las llamadas condiciones de estacionariedad de un AR(2).

Análogamente a lo que ocurría con un AR(1), el que se cumplan estas


condiciones sobre los parámetros implica que las dos raíces del polinomio
característico son, en módulo, mayores que la unidad. Es decir, el polinomio
1 − φ1 B − φ2 B 2 siempre puede expresarse como el producto (1 − G1 B)(1 − G2 B)
donde G1−1 y G2−1 son las dos raíces del polinomio AR(2) y G1 , G2 son los
factores del polinomio. Las raíces G1−1 y G2−1 pueden ser reales o complejas
conjugadas, es decir, del tipo a ± bi donde i es el número imaginario. Si
G1−1 > 1 y G2−1 > 1 el proceso es estacionario o no explosivo.
47
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Función de autocorrelación simple (FAS) teórica:

Bajo las condiciones de estacionariedad, se cumplen las expresiones


siguientes:

r0 = 1
γ φ γ +φ γ φ
r1 = 1 = 1 0 2 1 =φ1 + φ2 r1 ⇒ r1 = 1
γ0 γ0 1 − φ2
γ 2 φ1γ 1 + φ2γ 0
=
r2 = = φ1r1 + φ2
γ0 γ0

Y, en general, rj = φ1rj −1 + φ2 rj − 2 , ∀j > 0

Por lo tanto, se trata de un sistema recursivo donde a partir del valor de r1 se


obtiene r2 . Con estos dos últimos se obtiene r3 y así sucesivamente. Este
sistema es conocido como sistema de ecuaciones de Yule-Walker. En realidad,
la expresión rj = φ1rj −1 + φ2 rj − 2 , ∀j > 0 es una ecuación en diferencias finitas de
segundo grado, siendo la solución general de la misma: rj = A1G1j + A2G2j .

Donde A1 y A2 son constantes a determinar a partir de las condiciones


iniciales, es decir, r0 = 1 que implica que = r1 φ1 /1 − φ2 . Si el
1 A1 + A2 así como=
proceso es estacionario, los coeficientes rj serán menores que la unidad y
existirán dos alternativas:

A) Los dos factores ( G1 y G2 ) del polinomio AR(2) son reales. En este caso el
decaimiento en la expresión primitiva es la suma de dos exponenciales y la
forma de la FAS dependerá de que G1 y G2 tengan igual signo o el opuesto.

B) Los dos factores ( G1 y G2 ) del polinomio AR(2) son complejos conjugados.


En este caso, se puede comprobar que la función decaerá de forma sinusoidal.

48
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Función de autocorrelación parcial (FAP) teórica:

La regresión que habría que llevar a cabo para determinar el primer valor de la
PACF, φ11 , es: yt =
φ10 + φ11 yt −1 + ε t

La comparación con el modelo AR(2) ( yt = δ + φ1 yt −1 + φ2 yt − 2 + ε t ) nos indica que


φ11 ≠ 0 aunque no es exactamente igual al parámetro autorregresivo φ1 como
ocurría en el modelo AR(1) ya que su magnitud es φ11= r1= φ1 /1 − φ2 .

El segundo valor de la FAP se determina a partir de la regresión:

φ20 + φ21 yt −1 + φ22 yt − 2 + ε t


yt =

Si lo comparamos con el Modelo anterior AR(2): yt = δ + φ1 yt −1 + φ2 yt − 2 + ε t se


deduce que en un AR(2), el segundo valor de la FAP no sólo es distinto de cero
sino que debe coincidir con el segundo parámetro autorregresivo, es decir
φ22 = φ2 . Análogamente se puede comprobar que los valores sucesivos de la
FAP son nulos. Es decir, la FAP de un AR(2) se anula a partir del tercer valor,
indicándonos el orden del proceso.

6.2. Aspectos prácticos de los procesos AR

En este apartado se describen desde una perspectiva práctica las principales


características de los gráficos que representan a las funciones de
autocorrelación de los procesos autorregresivos.

En este sentido, cabe señalar que la función de autocorrelación simple de un


proceso AR(p) es una mezcla de exponenciales, a causa de los términos con
raíces reales, y de sinusoidales, consecuencia de las raíces complejas
conjugadas. Su estructura puede llegar a ser, en consecuencia, muy compleja.
En la práctica para determinar el orden se introduce la función de
autocorrelación parcial. En el AR(1) el efecto de zt-2 sobre zt es siempre el que
existe a través de zt-1, y dado zt-1, el valor de zt-2 es irrelevante para prever zt.
Sin embargo, en un AR(2) además del efecto de zt-2 que se transmite a zt a
través de zt-1, existe un efecto directo de zt-2 sobre zt. Esta idea es la clave para
la utilización de la función de autocorrelación parcial.

49
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Proceso AR(1)

En un proceso AR(1) (zt = φ zt-1 + at) cada observación recibe influencia directa
de la observación anterior y se construye a partir de la anterior más una
perturbación aleatoria (at). Este proceso es estacionario si la magnitud de φ es
menor que 1. En caso contrario sería un proceso explosivo.

Por ejemplo, si φ = 0,5 y z9 = 50 sustituyendo en la expresión anterior, se


obtiene z10 = 0,5 x 50 + at = 25 + at. Si no existiera el término at, la serie sería
determinista, y conocido un valor de z ya conoceríamos todos los demás.

En el gráfico adjunto se muestran las funciones de autocorrelación simple


(FAS) y parcial (FAP) de un modelo AR(1) con φ1 positivo. Se observa que
todos los elementos (palos) de la FAS son positivos y decaen o disminuyen
lentamente. Asimismo, en la FAP solo aparece el primer palo como significativo
y es positivo.

FAS y FAP para el Modelo AR(1) (con φ1 = 0,95)


FAS FAP

Finalmente, en el gráfico adjunto se muestran la función de autocorrelación


simple (FAS) y parcial (FAP) de un modelo AR(1) con φ1 negativo. Se observa
que los elementos (palos) de la FAS son positivos y negativos alternadamente
y sus valores absolutos disminuyen lentamente. Asimismo, en la FAP solo
aparece el primer palo como significativo y es negativo.

FAS y FAP para el Modelo AR(1) (con φ1 =−0,95)


FAS FAP

50
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Procesos autorregresivos de segundo orden AR(2)

La función de autocorrelación simple (FAS) de un modelo AR(2) es muy


compleja, admitiendo varias posibilidades, en función de cómo sean las raíces
del polinomio característico. Por el contrario, la función de autocorrelación
parcial (FAP) tiene únicamente los dos primeros palos significativos.

Así, por ejemplo, en el gráfico adjunto se muestran las funciones de


autocorrelación simple (FAS) y parcial (FAP) de un modelo AR(2) con φ1 y φ2
positivos. Se observa que la FAS es muy compleja, admitiendo varias
posibilidades, en función de cómo sean las raíces del polinomio característico.
Por el contrario, la FAP tiene únicamente los dos primeros palos significativos y
son positivos.

FAS y FAP para el Modelo AR(2) (con φ1 = 0,78, φ2 = 0,2)


FAS FAP

Este procedimiento de identificación de este tipo de procesos se puede


extender a todo proceso AR(p). La forma del gráfico de la FAS dependerá de si
las raíces del polinomio característico son reales o imaginarias (siempre con
módulo menor que la unidad), mientras que la FAP presentará siempre solo p
palos significativos.

Finalmente, en relación con la FAP cabe destacar los siguientes rasgos.

 Cada raíz real positiva aporta una estructura decreciente de palos


positivos

 Cada raíz real negativa aporta una estructura decreciente de palos de


signos alternados

 Cada pareja de raíces imaginarias conjugadas aporta una estructura


sinusoidal.

51
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

7. MODELOS DE MEDIA MÓVIL


Como se ha mencionado anteriormente, un proceso autorregresivo (AR) tarda
bastante tiempo en absorber los impactos externos. Los procesos AR no
pueden representar series de memoria muy corta, modelizan bien series en las
que un impacto del exterior va absorbiéndose lentamente durante muchos
periodos. Sin embargo, hay series en las que la absorción de los impactos se
hace muy rápidamente: tienen incidencia durante uno o dos periodos pero
luego la serie vuelve a su comportamiento normal. Una familia de procesos que
tiene esta propiedad de memoria muy corta son los procesos de media móvil, o
procesos MA de su nombre inglés,” moving average”. Por todo ello es
necesario introducir otra familia de procesos de memoria corta denominados
procesos de media móvil (“moving average”).

Un ejemplo es el volumen de tráfico aéreo. La necesidad de viajar es grande:


Empresas, turismo, etc. Si ocurre un impacto sobre este mercado suele durar
poco tiempo como sucedió a causa de la denominada “Guerra del Golfo”, con
una reducción de los pasajeros pero por un tiempo limitado.

7.1. Caracterización teórica

7.1.1. Representaciones

Se dice que un proceso sigue una estructura de Medias Móviles de orden q ,


MA( q ) si cualquier variable del proceso puede escribirse como:

y t = δ + ε t − θ1ε t −1 − θ 2ε t − 2 − .... − θ qε t − q

donde ε t es ruido blanco, δ es la constante del modelo y θ1 , θ 2 ,..., θ q son los


llamados parámetros media móvil.

En el caso de MA(1), la representación convencional es: y t = δ + ε t − θ1ε t −1


donde ε t es ruido blanco y sólo aparece un parámetro de media móvil.

La interpretación del modelo no es sencilla con esta representación. Usando el


operador retardo, se obtiene la segunda representación: y t = δ + (1− θ1B )ε t
donde aparece el polinomio característico de una MA(1), es decir, 1 − θ1B . Para
que los polinomios característicos de los AR y los MA sean comparables, los
parámetros MA llevan el signo negativo.

52
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Finalmente, la tercera representación de una MA(1) es la siguiente:

yt δ
= + ε t o bien:
1 − θ1 B 1 − θ1 B

δ
yt = − θ1 y t −1 − θ12 y t − 2 − θ13 y t − 3 − .... + ε t
1 − θ1

A partir de esta última representación del modelo, cabe concluir que se puede
considerar a un proceso MA(1) como equivalente a un proceso AR de orden
muy elevado, de hecho, un MA(1) equivale a un AR( ∞ ). No obstante, es
importante resaltar que esta última representación sólo es razonable si se
cumple la condición de que θ1 < 1 , que implica que el pasado reciente de una
variable pesa más al explicar su presente que el pasado más alejado en el
tiempo. A la condición de que θ1 < 1 se le llama condición de invertibilidad de
una MA(1). Nos indica la condición que ha de cumplirse para que tenga sentido
invertir una MA(1) en su representación alternativa de tipo AR.

7.1.2. Características teóricas

A continuación se estudian, desde una perspectiva eminentemente teórica las


diversas características de los modelos MA.

Media: Para estimar la media se toman esperanzas a ambos lados del modelo
y t = δ + ε t − θ1ε t −1 , obteniendo: E ( y t ) = δ , ∀t

En este sentido, cabe concluir que la media de este tipo de procesos es


constante, sin necesidad de imponer la condición de estacionariedad. El motivo
de este comportamiento es que cualquier MA(1) se puede definir como la
combinación de variables que son ruido blanco y por lo tanto se trata de un
proceso estacionario, de manera similar al propio ruido blanco.

Varianza: La expresión de la varianza para el modelo MA(1) es la siguiente:

[ ]
var ( y t ) = γ 0 = E ( y t − δ ) = E [(ε t − θ1ε t −1 )(ε t − θ1ε t −1 )] = E (ε t2 ) + θ12 E (ε t2−1 ) = (1 + θ12 )σ ε2
2

Por tanto, cabe concluir nuevamente que la varianza es finita y positiva sin
imponer ninguna condición adicional porque un proceso MA es estacionario por
la propia construcción. Sólo hay que imponer una condición de invertibilidad,
pero no de estacionariedad.

53
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Función de autocovarianzas: La expresión para esta función es la siguiente:

γ1 = cov( yt yt −1 ) = E[( yt − δ )( yt −1 − δ )] = E[(ε t − θ1ε t −1 )(ε t −1 − θ1ε t − 2 )] =−θ1σ ε2


γ 2= cov( yt yt − 2 )= E[( yt − δ )( yt − 2 − δ )]= E[(ε t − θ1ε t −1 )(ε t − 2 − θ1ε t −3 )]= 0

Deduciéndose a partir de la expresión anterior que: γ j= 0 , ∀j > 1

Función de autocorrelación simple o FAS teórica. Las expresiones y


magnitudes de los elementos de la FAS son los siguientes:

r0 = 1
γ1 − θ1σ ε2 − θ1
r1 = = =
γ 0 (1 + θ1 )σ ε (1 + θ12 )
2 2

γ
r2 = 2 = 0
γ0
rj = 0 , ∀j > 1

Función de autocorrelación parcial o FAP teórica. Para determinar los


valores teóricos de la FAP en los procesos MA, es necesario usar su
representación equivalente de tipo AR. Por tanto, la regresión auxiliar para
encontrar el primer valor de la FAP es: y t = φ10 + φ11 y t −1 + ε t

Asimismo, el Modelo MA(1) tiene la siguiente expresión:


δ
yt = − θ1 y t −1 − θ12 y t − 2 − θ13 y t − 3 − .... + ε t
1 − θ1

Si comparamos ambas expresiones, cabe concluir que φ11 ≈ −θ1 , o bien,


φ11 =−θ1 si θ12 =
0 (debe recordarse que el primer valor de la FAP coincide con el
primero de la FAS). Se puede comprobar que el resto de los valores de la FAP,
son distintos de cero y aproximadamente iguales a:

φ11 ≈ −θ1
φ22 ≈ −θ12
φ jj ≈ −θ1j , ∀j

54
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

7.2. Aspectos prácticos de los procesos MA

En este apartado se describen, desde una perspectiva práctica, las principales


características de los gráficos que representan a las funciones de
autocorrelación de los procesos de media móvil MA. El objetivo es poder
comparar dichas autocorrelaciones con las estimadas para la serie de interés y
poder decidir cuál es potencialmente el modelo que ha generado dicha
variable.

 Procesos de media móvil de primer orden MA(1)

Los modelos MA están diseñados para absorber los impactos rápidamente.


Así, el modelo MA(1) los absorbe en un periodo. En concreto, si en el periodo
21 ocurre un impacto que hace que la serie sufra un desplazamiento, ese
impacto se absorbe en el periodo 22, y en el periodo 23 la serie estaría de
nuevo a su nivel normal. Asimismo, el proceso MA(2) absorbe el impacto en
dos periodos, luego volvería a su nivel normal en la observación 24.

Como se ha indicado anteriormente, si un proceso es MA(1), sus valores


estarán formados (son combinación lineal) por los efectos externos o
innovaciones muy recientes, en concreto, el actual εt y el inmediatamente
anterior εt-1.

Los procesos MA, por ser la suma de procesos estacionarios, son siempre
estacionarios. Sin embargo, si las raíces de su ecuación característica no
tienen módulo mayor que la unidad, el efecto de las observaciones pasadas
aumentaría con el tiempo, lo que evidentemente no es conveniente para
representar series.

En el gráfico adjunto se muestran la función de autocorrelación simple (FAS) y


parcial (FAP) de un modelo MA(1) con θ1 positivo. Se observa que en la FAS
solo aparece el primer elemento (palo) como significativo y es negativo,
mientras que todos los elementos (palos) de la FAP son negativos y decaen o
disminuyen lentamente.

FAS y FAP para el Modelo MA(1) (con θ1 =0,95)


FAS FAP

55
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Finalmente, en el gráfico adjunto se muestran la función de autocorrelación


simple (FAS) y parcial (FAP) de un modelo MA(1) con θ1 negativo. Se observa
que en la FAS solo aparece el primer palo como significativo y es positivo,
mientras que los elementos (palos) de la FAP son positivos o negativos
alternadamente y sus valores absolutos disminuyen lentamente.

FAS y FAP para el Modelo MA(1) (con θ1 =−0,95)


FAS FAP

Cabe señalar que existe una dualidad entre los procesos AR y los MA. En este
sentido, la FAS se corta en los MA con un palo significativo para el caso de
MA(1) y no se comporta así en los AR, mientras que al contrario, la FAP se
corta en los procesos AR y no se corta en los MA donde posee estructura. A
fines de identificación del modelo, la conclusión fundamental es que el
orden de los AR se obtiene observando la FAP mientras que el orden de
los MA radica en la FAS.

 Procesos de media móvil de segundo orden MA(2)

En el proceso de media móvil de orden 2, MA(2), se tarda 2 períodos en


absorber los impactos. La función de autocorrelación simple (FAS) de estos
procesos tiene únicamente los dos primeros palos significativos, mientras que
la función de autocorrelación parcial (FAP) tendrá una estructura, cuyo tipo
depende de los signos de los parámetros, pero siempre presentando un
proceso de decaimiento o decrecimiento en valor absoluto.

La función de autocorrelación simple (FAS) de un modelo AR(2) es muy


compleja, admitiendo varias posibilidades, en función de cómo sean las raíces
del polinomio característico. Por el contrario, la función de autocorrelación
parcial (FAP) tiene únicamente los dos primeros palos significativos.

Así, por ejemplo, en el gráfico adjunto se muestran las funciones de


autocorrelación simple (FAS) y parcial (FAP) de un modelo MA(2) con θ1 y θ2
positivos. Se observa que la FAS tiene únicamente los dos primeros palos
significativos y son negativos siempre, mientras que la FAP presenta una
estructura decreciente.
FAS y FAP para el Modelo MA(2) (con θ1 =0,78 y θ2 =0,2)
FAS FAP

56
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Para completar el análisis, en el gráfico adjunto se muestran las funciones de


autocorrelación simple (FAS) y parcial (FAP) de un modelo MA(2) con θ1
positivo y θ2 negativo. Se observa que la FAS tiene únicamente los dos
primeros palos significativos, siendo el primero negativo y el segundo positivo
mientras que la FAP presenta una estructura decreciente en módulo pero
alternada en su signo.

FAS y FAP para el Modelo MA(2) (con θ1 =1 y θ1 =−0,95)

FAS FAP

 MA(q)

Este procedimiento de identificación de este tipo de procesos se puede


extender a todo proceso MA(q). La forma del gráfico de la FAP dependerá de si
las raíces del polinomio característico son reales o imaginarias (siempre con
módulo menor que la unidad), mientras que la FAS presentará siempre solo p
palos significativos.

En relación con la FAP cabe destacar los siguientes rasgos:

 Cada raíz real positiva aporta una estructura decreciente de palos


positivos
 Cada raíz real negativa aporta una estructura decreciente de palos de
signos alternados
 Cada pareja de raíces imaginarias conjugadas aporta una estructura
sinusoidal.

Los resultados obtenidos para los modelos MA(1) y MA(2) pueden extenderse
al modelo MA(q) que viene dado por: yt = δ + ε t − θ1ε t −1 − θ 2ε t −2 − ...... − θ qε t −q

En este caso, el valor de la variable en el momento t es una combinación lineal


de las q últimas innovaciones que la serie haya recibido, más la innovación
contemporánea. Por tanto, tardaría q períodos en absorber los impactos.

Los modelos MA(q) siempre son estacionarios y la media de yt coincide con la


constante δ del modelo. Además, los elementos de la FAS son
significativamente distintos de cero hasta el orden q y después no son
significativos, existiendo, por tanto, un punto de corte en el retardo q.
Asimismo, los elementos de la FAP decaen o disminuyen en valor absoluto.

57
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

7.3. Comparación entre procesos MA y AR

Comparando el comportamiento de los procesos AR y MA, cabe extraer las


siguientes conclusiones:

 Los procesos AR tardan en absorber los impactos mientras que los MA


absorben los impactos rápidamente.
 La FAS de los procesos AR posee una amplia estructura decreciente
mientras que en los procesos MA existen q palos significativos, siendo q
el orden del proceso.
 La FAP de los procesos AR posee p palos significativos, siendo q el
orden del proceso, mientras que en los procesos MA existe una amplia
estructura decreciente.

 Dualidad entre los procesos AR y MA

Como se ha comprobado anteriormente, existe una dualidad entre los procesos


AR y MA, de manera que la FAP de un MA(q) tiene la estructura de la FAS de
un AR(q), e inversamente la FAS de un MA(q) tiene la estructura de la FAP de
un AR(q).

Además un proceso AR(p) puede escribirse como un proceso MA(∞), es decir,


como suma infinita de innovaciones. A continuación se deduce esta expresión
para el caso del proceso AR(2) .

Un proceso estocástico que sigue una estructura AR(2) se puede escribir


como: y t = δ + φ1 y t −1 + φ2 y t − 2 + ε t donde ε t es ruido blanco y los parámetros
autorregresivos son φ1 y φ2 .

La representación utilizando el operador retardo es: (1 − φ1B − φ2 B 2 )y t = δ + ε t


donde el polinomio característico de un AR(2) es 1 − φ1B − φ2 B 2 . La tercera
representación de un AR(2) se obtiene dividiendo ambos lados del modelo por
δ εt
el polinomio característico: y t = +
1 − φ1 − φ2 1 − φ1B − φ2 B 2

Esta última representación es equivalente a la expresión de un proceso MA( ∞ ):


δ
yt = + ε t + ϕ1ε t −1 + ϕ 2ε t − 2 + ϕ 3ε t − 3 + .... ya que:
1 − φ1 − φ2
1
=1 + ϕ1 B + ϕ 2 B 2 + ϕ3 B 3 + .... .
1 − φ1 B − φ2 B 2

Paralelamente, un proceso MA(q) puede expresarse como un AR(∞), es decir,


como suma infinita de valores anteriores de la serie.

58
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

8. MODELOS ARMA
8.1. Caracterización teórica

8.1.1 Tipos de Representación

Un proceso estocástico sigue un modelo ARMA(p,q) si cualquier variable del


mismo se puede escribir de la forma siguiente:
yt = δ + φ1 yt −1 + ..... + φ p yt − p + ε t − θ1ε t −1 − θ 2ε t − 2 − .... − θ qε t − q

Utilizando el operador retardo B , una expresión alternativa es la siguiente:


( ) ( )
1 − φ1B − φ2 B 2 − .... − φ p B p y t = δ + 1 − θ1B − θ 2 B 2 − .... − θ q B q ε t , donde ε t es un
proceso de ruido blanco y aparecen dos polinomios, el polinomio característico
de la parte autorregresiva (AR), 1 − φ1B − φ2 B 2 − .... − φ p B p y el polinomio
característico de la parte de media móvil (MA): 1 − θ1B − θ 2 B 2 − .... − θ q B q

En la práctica es frecuente encontrarse con series cuya representación posee


una parte AR que modeliza el efecto residual y otra parte MA que modeliza la
absorción de impactos.

En definitiva, AR(1)+MA(1)=ARMA(1,1) y en general, AR(p)+MA(q)=


ARMA(p,q). Además, cabe citar que mientras que al sumar procesos MA
resultan nuevos procesos MA, en el caso de sumar procesos AR resulta un
proceso ARMA. Por todo ello, se deduce la existencia de procesos ARMA
cuando se trata de procesos suma de otros y alguno de ellos tiene estructura
AR.

 Proceso ARMA(1,1)

Una primera expresión del proceso ARMA(1,1) es: y t = δ + φ1 y t −1 + ε t − θ1ε t −1

Otra representación del modelo anterior, extrayendo los polinomios


característicos, es la siguiente: (1 − φ1B ) y t = δ + (1 − θ1B )ε t

Asimismo, cabe destacar que, dependiendo de si dividimos el modelo por el


polinomio AR o por el polinomio MA, un proceso ARMA(1,1) se puede escribir
como un AR( ∞ ) o alternativamente como un MA( ∞ ). Para demostrarlo basta
con dividir en los dos miembros de la expresión anterior por 1 − θ1B ,
obteniendo:

1 − φ1B δ
yt = + εt
1 − θ1 B 1 − θ1 B

59
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Pero como se cumple que:


1 − φ1B
= (1 − φ1B )(1 + θ1B + θ12 B 2 + ....) = 1 + (θ1 − φ1 )B + θ1 (θ1 − φ1 )B 2 + θ12 (θ1 − φ1 )B 3 + ...
1 − θ1 B

La representación AR del proceso es la siguiente:

δ
yt = + (φ1 − θ1 ) y t −1 + θ1 (φ1 − θ1 ) y t − 2 + θ12 (φ1 − θ1 ) y t − 3 + ...... + ε t
1 − θ1

Expresión que tiene sentido solo si el pasado más reciente tiene un peso mayor
que el pasado más alejado. Para ello, ha de cumplirse que θ1 < 1 , es decir, la
condición de invertibilidad de la parte MA del proceso.

8.1.2. Características teóricas de un proceso ARMA(1,1)

A continuación se describen desde un enfoque teórico, las principales


características en relación con la media y las funciones de autocovarianzas y
de autocorrelación de un proceso ARMA(1,1): y t = δ + φ1 y t −1 + ε t − θ1ε t −1

Media: Tomando esperanzas en la expresión anterior del proceso ARMA(1,1),


se obtiene: E ( y t ) = δ + φ1E ( y t −1 ) y al cumplirse las condiciones de
δ
estacionariedad, se obtiene que: E ( y t ) = , ∀t
1− φ

Función de autocovarianzas: Si se resta la media δ a los dos miembros de la


expresión del modelo ARMA(1,1), se obtiene que yˆ t = φ1 yˆ t −1 + ε t − θ1ε t −1

A partir de la expresión anterior se deduce que las autovarianzas son las


siguientes:

γ 0 = E (yˆ t2 ) = E [(φ1 yˆ t −1 + ε t − θ1ε t −1 ) yˆ t ] = φ1γ 1 + σ ε2 − θ1 (φ1σ ε2 − θ1σ ε2 )


γ 1 = E ( yˆ t yˆ t −1 ) = E [(φ1 yˆ t −1 + ε t − θ1ε t −1 ) yˆ t −1 ] = φ1γ 0 − θ1σ ε2

Resolviendo la ecuación anterior en relación con γ 0 y γ 1 , se obtiene que:


θ (θ − 2φ )
γ 0 = 1 1 2 1 σ ε2
1 − φ1

En esta expresión se deduce que para que esta varianza sea finita, es
necesario que se cumpla la condición de ser φ1 < 1 , es decir, la condición de
estacionariedad de un AR(1).

El resto de los valores de la función de autocovarianzas son:


60
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

γ 1 = φ1γ 0 − θ1σ ε2
γ 1 = φ1γ 1 γ 2 = φ1γ 1

Y, en general,
γ j = φ1γ j −1 , ∀j ≥ 2

En resumen, excepto para el primer valor γ 1 , el perfil de las autocovarianzas de


un ARMA(1,1) es similar al de un proceso AR(1).

Función de autocorrelación simple o FAS:

γ 1 φ1γ 0 − θ1σ ε2 θσ2


r1 = = = φ1 − 1 ε
γ0 γ0 γ0

γ 2 φ1γ 1
r2 = = = φ1r1
γ0 γ0

y, en general, rj = φ1rj −1 , ∀j ≥ 2 . En definitiva, la FAS de un ARMA(1,1) no se


llega a anular nunca, análogamente a lo que sucede en cualquier proceso
mixto, y va disminuyendo por estacionariedad.

Función de autocorrelación parcial o FAP: Como ya se ha mencionado, la


representación de un ARMA(1,1) en un AR( ∞ ), es:
δ
yt = + (φ1 − θ1 ) y t −1 + θ1 (φ1 − θ1 ) y t − 2 + θ12 (φ1 − θ1 ) y t − 3 + ...... + ε t
1 − θ1

Por tanto, a partir de esta expresión se deduce que las magnitudes de los
elementos de la FAP son los siguientes:

φ11 ≈ φ1 − θ1
φ22 ≈ θ1 (φ1 − θ1 )
φ33 ≈ θ12 (φ1 − θ1 )

En general, φ jj ≈ θ1j −1 (φ1 − θ1 ) , ∀j ≥ 1 . Se deduce, en definitiva, que la FAP para


un proceso ARMA(1,1) tampoco se llega a cortar. Esta función irá decayendo a
causa de la condición de invertibilidad. En este sentido, cabe destacar que en
un proceso ARMA han de cumplirse tanto las condiciones de estacionariedad
como de invertibilidad.

61
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

8.2. Aspectos prácticos

En este apartado se describen, desde una perspectiva práctica, las principales


características de los gráficos que representan a las funciones de
autocorrelación de los procesos ARMA. El objetivo es poder comparar dichas
autocorrelaciones con las estimadas para la serie de interés y poder decidir
cuál es potencialmente el modelo que ha generado dicha variable.

 Modelos ARMA(p,q)

Debido a que el modelo ARMA(p,q) está compuesto, en su forma más general,


de una parte autorregresiva AR(p) y de otra de media móvil MA(q), para
identificar el modelo adecuado bastaría con aplicar sobre la FAS y FAP, los
criterios mencionados anteriormente al estudiar ambos tipos de modelos.

En este sentido, cabe hacer las siguientes apreciaciones sobre la FAS y FAP
del modelo ARMA(p,q).

 FAS: Los primeros q elementos o palos de un proceso ARMA dependen


de la parte MA. Precisamente estos elementos le van a permitir a la
serie absorber rápidamente los impactos externos, que es una
característica de los modelos MA. A partir del retardo q se producirá un
decrecimiento de los palos que vendrá dado por la estructura AR.

 FAP: Al contrario de lo que sucede con la FAS, los primeros p elementos


de la FAP dependen de la parte AR. Por tanto, cabe citar que a partir del
retardo p se producirá un decrecimiento de los palos que vendrá dado
por la estructura MA.

Un criterio muy práctico para la selección del modelo ARMA más adecuado, es
basarse en dónde se observa más estructura. Pueden ocurrir las alternativas
siguientes:

 Si se observa más estructura en la FAS, mientras que en la FAP solo


hay uno o dos palos significativos se trata de un modelo AR.

 Si, por el contrario, se observa más estructura en la FAP, mientras que


en la FAS hay solamente uno o dos palos significativos, sería un modelo
MA.

 Finalmente, si en ambas funciones se observa una amplia estructura,


cabe concluir que se trata de modelos ARMA con parte autorregresiva y
parte media móvil.

62
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Ejemplos

En el gráfico adjunto se muestran las funciones de autocorrelación simple


(FAS) y parcial (FAP) de un modelo ARMA(1,1) con φ1 positivo y θ1 negativo.
Se observa que existe una amplia estructura en ambas funciones de
autocorrelación y que en la FAS todos los elementos (palos) son positivos
mientras que los elementos de la FAP cambian de signo alternadamente.

FAS y FAP para el Modelo ARMA(1, 1) (con φ1 = 0,95, θ1 = −0,95)


FAS FAP

Otro ejemplo corresponde al gráfico adjunto, donde se muestran las funciones


de autocorrelación simple (FAS) y parcial (FAP) de un modelo ARMA(1,1) con
φ1 negativo y θ1 positivo. Se observa que existe una amplia estructura en
ambas funciones de autocorrelación, pero al contrario que en el ejemplo
anterior, los elementos de la FAS cambian de signo alternativamente, mientras
que todos los elementos de la FAP tienen el signo negativo.

FAS y FAP para el Modelo ARMA(1, 1) (con φ1 = −0,95, θ1 = 0,95)


FAS FAP

Asimismo, en el gráfico adjunto se muestran las funciones de autocorrelación


simple (FAS) y parcial (FAP) de un modelo ARMA(1,1) con φ1 positivo y θ1
positivo. Se observa que existe una amplia estructura en ambas funciones de
autocorrelación y que tanto los elementos de la FAS como de la FAP tienen
todos signo positivo.

FAS y FAP para el Modelo ARMA(1, 1) (con φ1 = 0,9, θ1 = 0,5)


FAS FAP

63
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Finalmente, en el gráfico adjunto se muestran las funciones de autocorrelación


simple (FAS) y parcial (FAP) de un modelo ARMA(1,1) con φ1 y θ1 negativos.
Se observa que existe una amplia estructura en ambas funciones de
autocorrelación. Además, tanto los elementos de la FAS como de la FAP
cambian de signo alternativamente.

FAS y FAP para el Modelo ARMA(1, 1) (con φ1 = −0,9, θ1 = −0,5)


FAS FAP

64
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

9. SERIES NO ESTACIONARIAS: MODELOS ARIMA(P,D,Q)

9.1. Caracterización teórica

Los modelos ARMA descritos en el apartado anterior son útiles para ajustar
series estacionarias. Sin embargo, como ya hemos visto, las series reales no
son habitualmente estacionarias. En el caso de que una serie no sea
estacionaria hay que transformarla como se indicó anteriormente: eliminando la
tendencia, mediante la aplicación del operador diferencia o la
heterocedasticidad, mediante la transformación logarítmica.

De esta forma se definen los denominados procesos ARIMA(p,d,q) que se


forman a partir de la aplicación de d veces el operador diferencia a la serie
original y del correspondiente modelo ARMA(p,q), a la serie ya diferenciada y
que posee carácter estacionario. Por tanto, en un modelo ARIMA(p,d,q), p es el
orden de la parte autorregresiva de la serie estacionaria, d es el número de
diferencias regulares necesarias para eliminar la tendencia, haciendo
estacionaria la serie y finalmente, q es el orden de la parte de media móvil de la
serie estacionaria. Cabe afirmar que el modelo ARIMA es un modelo ARMA
con raíces unitarias. Por ejemplo, un proceso ARIMA(1,1,1) corresponde a un
proceso ARMA(1,1) en el que se ha aplicado una diferencia regular.
Normalmente solo se utilizan los valores de d = 1 ó 2.

Antes de continuar con la continuar con la caracterización teórica del modelo


ARIMA es conveniente introducir otros conceptos previos como el de proceso
integrado. En general, se afirma que un proceso es integrado de orden h ≥ 0, y
se representa por I(h), cuando al aplicar el operador diferencia h veces se
obtiene un proceso estacionario. Un proceso estacionario es, por tanto,
siempre I(0). En la práctica, la mayoría de las series no estacionarias que son
integradas tienen un orden h ≤ 2. Cabe resaltar, asimismo, que al diferenciar un
proceso estacionario se obtiene otro proceso estacionario.

Para llegar a la representación final del modelo ARIMA(p,d,q), se parte del


supuesto de que la serie de interés es integrable de orden d: I(d), es decir, hay
que tomar d diferencias para que sea estacionaria, obteniendo la nueva serie:
ω t = ∇ d y t ; siendo ∇ el operador diferencia.

Una vez que la serie ha sido transformada, el modelo ARMA se ajusta a la


nueva serie, obteniendo: ωt = φ1ωt −1 + ..... + φ pωt − p + at − θ1at −1 − .... − θ q at − q

En resumen, el modelo ARIMA(p,d,q) para la serie yt admite la expresión


siguiente: ∇ d y t = φ1∇ d y t −1 + ..... + φ p ∇ d y t − p + at − θ1at −1 − .... − θ q at − q

65
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Sabiendo que ∇ ≡ 1 − B , siendo B el operador retardo, y suponiendo que ha


sido necesario aplicar logaritmos para estabilizar la varianza así como que
existe una constante c en el modelo final, una expresión alternativa y
simplificada del proceso ARIMA(p,d,q) es la siguiente:
φ p (B )∇ log y t = c + θ q (B )at . En donde: φ p (B ) = 1 − φ1B − φ2 B − ..... − φ p B p es el
d 2

polinomio AR(p); θ q (B ) = 1 − θ1B − θ1B 2 − .... − θ q B q es el polinomio MA(q).

Es posible obtener otras expresiones alternativas para el modelo ARIMA(p,d,q),


utilizando las diversas representaciones existentes para los modelos AR(p) y
MA(q) que lo integran y que se describieron con detalle en los correspondientes
apartados.

Cabe concluir, por tanto, que la representación final y general de una serie es
el modelo ARIMA(p,d,q). Así, por ejemplo, en el caso de que una serie zt
requiera 2 diferencias para llegar a ser estacionaria en tendencia, haya que
transformarla a logaritmos para estabilizar la varianza, y se le identifique un
modelo AR(2), cabe afirmar, finalmente, que la serie log(zt) sigue un modelo
ARIMA(1,2,0).

Un modelo ARIMA muy frecuente en el análisis de series temporales es el


denominado de las líneas aéreas (airline) que en su parte regular corresponde
al proceso MA(1), después de aplicar una diferencia regular. Por tanto, el
modelo de la parte regular, utilizando la nomenclatura citada sería
ARIMA(0,1,1).

9.2. Estimación y diagnosis


Una vez identificada la serie, es decir cuando ya se conoce el modelo
ARIMA(p,d,q) que puede seguir la serie, es preciso estimar los parámetros del
modelo. La estimación de modelos ARIMA es compleja y utiliza algoritmos de
optimización no lineales para calcular los valores de los parámetros utilizando
el método de máxima verosimilitud. Entre los resultados de la estimación
figuran los valores estimados de todos los parámetros con sus errores estándar
y estadísticos t. Todo ello se mostrará al exponer los casos prácticos de
análisis de series temporales en el último apartado.

A continuación del proceso de estimación es necesario efectuar la diagnosis


del modelo elegido. En este sentido, aunque la diagnosis se estudiará con
mayor detalle en un apartado posterior, cabe citar que está basada
esencialmente en el análisis de las FAS y FAP de los residuos. Si una serie
está bien identificada y se le ajusta un modelo correcto, los residuos deben
carecer de estructura, es decir, deben corresponder a un proceso de ruido
blanco, cuyas características básicas se expusieron en su momento. Entre
estas características referentes a la FAS y FAP, hay que comprobar que no
existe ningún valor significativo mediante el correspondiente test, por ejemplo el
de Box-Pierce que proporciona información sobre si los primeros palos de la
función de autocorrelación de los residuos son nulos. Otro test que es
conveniente realizar es el de rachas.
66
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

10. MODELOS PARA PROCESOS ESTACIONALES


10.1. Introducción

La estacionalidad es un tipo de no estacionariedad en media muy frecuente en


la práctica. Una serie temporal es estacional si tiende a repetir una pauta de
comportamiento cada período estacional denotado por s. En el caso de series
mensuales es muy frecuente que el período estacional sea de un año, es decir
s = 12, ya que 12 meses es el número de observaciones que forman el ciclo
estacional.

Las series estacionales tienen una estructura de dependencia estacional que


se caracteriza porque un periodo de un año actúa sobre el periodo equivalente
del año siguiente directamente.

En definitiva, en las series estacionales existe una cadena de influencia


adicional de cada periodo actuando sobre su equivalente del año siguiente:

z1 → z13 → ..... → zt −12 → zt → zt +12 → ....

Se distinguen, en resumen, dos tipos de estructuras de influencia:

A) Estructura Regular: se refiere a la relación entre una observación y las


siguientes consecutivas. Corresponde a los modelos ya estudiados en
apartados anteriores. Se ajustaría la parte regular mediante un modelo ARIMA
(p,d,q).

La cadena de dependencia sería: z1 → z2 → … → zt-1 → zt →zt+1 → …

B) Estructura Estacional: se refiere a la relación entre periodos equivalentes


actuando directamente. Se ajustarían modelos ARIMA estacionales.

La cadena de dependencia para datos mensuales sería: z1 → z13 → … → zt-12


→ zt →zt+12 → …

Asimismo, si los datos fueran trimestrales (Estacionalidad de orden 4) la


cadena de dependencia sería la siguiente: z1 → z5 → … → zt-4 → zt →zt+4 → …

De la misma forma que al tomar diferencias regulares se induce


estacionariedad en la parte regular (no estacional) de una serie, al tomar una
diferencia estacional se inducirá estacionariedad en la parte estacional.

67
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Es decir, si tal y como se confirmará empíricamente en uno de los casos


prácticos, la serie correspondiente al número de pasajeros en transporte aéreo
es estacional, ya que vuelan más pasajeros en los meses de vacaciones (julio,
agosto y septiembre) que en otros meses, al tomar una diferencia estacional a
esta serie se conseguirá que ahora los meses de Julio estén unos por encima,
otros por debajo y otros en la media; lo mismo pasará con los meses de
agosto, etc.

A continuación, se muestra el gráfico de la primera diferencia estacional del


logaritmo del número de pasajeros, ∇12 ln ( past ) . Se comprueba que esta serie
ya no es estacional, a pesar de que todavía no es estacionaria en media
(deambula con respecto a la media global) porque es necesario tomar, al
menos, una diferencia regular.

10

Evolución del tráfico aéreo interior de viajeros en España


(Logaritmos de Miles)

7
ene-80
ene-81
ene-82
ene-83
ene-84
ene-85
ene-86
ene-87
ene-88
ene-89
ene-90
ene-91
ene-92
ene-93
ene-94
ene-95
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-06
ene-07

Meses

0,4
Evolución del tráfico aéreo de viajeros en España
0,3 (Diferencia estacional)

0,2

0,1

0,0

-0,1

-0,2

-0,3
feb-81
feb-82
feb-83
feb-84
feb-85
feb-86
feb-87
feb-88
feb-89
feb-90
feb-91
feb-92
feb-93
feb-94
feb-95
feb-96
feb-97
feb-98
feb-99
feb-00
feb-01
feb-02
feb-03
feb-04
feb-05
feb-06
feb-07

68
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

10.2. Caracterización teórica de los Modelos estacionales

10.2.1. Proceso AR(1) estacional

Un proceso AR(1) estacional de período s = 4 , es denotado por AR(1) 4 y su


expresión básica es: y t = Φ1 y t −4 + ε t donde ε t es ruido blanco y Φ1 es un
parámetro AR(1) estacional.

Otra representación alternativa de este modelo es la siguiente:

(1 − Φ B )y
1
4
( )
= ε t donde 1 − Φ1B 4 es el polinomio característico de un AR(1)4.
t

y tal como ocurre en el modelo AR(1) regular, este modelo será estacionario si
las raíces del polinomio 1 − Φ1B 4 = 0 están dentro del círculo unidad. Esto
equivale a que Φ<1.

Finalmente, dividiendo por el polinomio en ambos lados de la expresión


anterior, se obtiene: y t = ε t + Φ1ε t − 4 + Φ12ε t −8 + Φ13ε t −12 + .....
1
ya que = 1 + Φ1B 4 + Φ12 B 8 + Φ13 B12 + ....... Es decir, un proceso AR(1)4
1 − Φ1 B 4
tiene una representación equivalente de tipo MA(∞)4.

A continuación se describen las principales propiedades teóricas de este tipo


de modelos:

Media: E ( y t ) = Φ1E ( y t − 4 ) y aplicando la condición de estacionariedad, se


obtiene que E ( y t ) = 0 , ∀t .

Varianza: var ( y t ) = Φ12 var ( y t − 4 ) + σ ε2 y aplicando la condición de


σε 2
estacionariedad, se obtiene que: γ 0 = , ∀t
1 − Φ12

Es importante indicar que, como se observa en la ecuación anterior, es


necesario imponer la condición de que Φ1 < 1 para que la varianza sea finita.
Esta es precisamente la condición de estacionariedad de un proceso AR(1)
estacional.

69
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Función de autocovarianzas: Los elementos de la función de autocovarianzas


son los siguientes:

γ 1 = E ( y t y t −1 ) = E [(Φ1 y t − 4 + ε t ) y t −1 ] = 0
γ2 =γ3 = 0
γ 4 = E ( y t y t − 4 ) = E [(Φ1 y t − 4 + ε t ) y t − 4 ] = Φ1γ 0
γ5 = γ6 = γ7 = 0
γ 8 = E ( y t y t −8 ) = E [(Φ1 y t − 4 + ε t ) y t −8 ] = Φ1γ 4 = Φ12γ 0
γ 9 = γ 10 = γ 11 = 0
γ=9 γ=
10 γ= 11 0
γ 12 = Φ1 γ 0 y así sucesivamente.
3

En definitiva, cabe concluir que la función de autocovarianzas de un AR(1)4


tiene el mismo perfil que la de un AR(1), pero únicamente en los retardos
s, 2s, 3s,… , siendo s el período estacional.

Función de autocorrelación simple o FAS: Los elementos o palos de la FAS,


suponiendo el cumplimiento de las condiciones de estacionariedad, son los
siguientes:

r1 = r2 = r3 = 0
γ Φγ
r4 = 4 = 1 0 = Φ1
γ0 γ0
r5 = r6 = r7 = 0
γ 8 Φ12γ 0
r8 = = = Φ12
γ0 γ0
r9 = r10 = r11 = 0
γ 12 Φ13γ 0
r12 = = = Φ13 y así sucesivamente.
γ0 γ0

Análogamente a lo expuesto para la función de covarianzas, cabe concluir que


la FAS de un AR(1) estacional puro reproduce el perfil de un AR(1) regular, en
los retardos que son múltiplos enteros del período estacional.

70
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Función de autocorrelación parcial o FAP: En relación con los elementos o


palos de la FAP, suponiendo el cumplimiento de las condiciones de
estacionariedad y utilizando la representación convencional de un AR(1)4,
γ t = Φ1 y t −4 + ε t se deduce que el único valor de la FAP de este proceso distinto
de cero es el cuarto, es decir: φ44 = Φ1 y φ jj = 0 , ∀j ≠ 4

Cabe resaltar que el paralelismo con el proceso AR(1) regular sigue existiendo
ya que el orden de un AR(1)4 se detecta en la FAP, en este caso, en el retardo
4 al ser los datos trimestrales. En el caso de que la serie fuera mensual, la
caracterización de este proceso sería idéntica en los retardos 12, 24, 36, etc.

10.2.2. Proceso MA(1) estacional

Un proceso MA(1) estacional de período s = 4 , es denotado por MA(1)4 y


admite las representaciones siguientes:

 y t = ε t − Θ1ε t − 4 donde ε t es ruido blanco y Θ1 es el parámetro media


móvil estacional.

 y t = (1 − Θ1B 4 )ε t donde 1 − Θ1B 4 es el polinomio MA(1) estacional de


período 4.

 y t = −Θ1 y t − 4 − Θ12 y t −8 − Θ13 y t −12 − .... + ε t donde ésta última representación


es un proceso AR(∞) 4 . Esta representación tiene sentido si se cumple la
condición de invertibilidad de una MA(1) estacional, es decir, si Θ1 < 1

A continuación se describen las principales propiedades teóricas de este tipo


de modelos.

Media: E ( y t ) = 0 , ∀t

Varianza: var ( y t ) = γ 0 = (1 + Θ12 )σ ε2 , ∀t

Función de autocovarianzas:

γ 1 = E ( y t y t −1 ) = E [(ε t − Θ1ε t − 4 )(ε t −1 − Θ1ε t −5 )] = 0


γ2 =γ3 = 0
γ 4 = E ( yt yt −4 ) = E [(ε t − Θ1ε t −4 )(ε t −4 − Θ1ε t −8 )] = −Θ1σ ε2
γ j = 0 , ∀j > 4

71
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Función de autocorrelación simple o FAS:

r1 = r2 = r3 = 0
γ Θ1
r4 = 4 = −
γ0 1 + Θ12
rj = 0 , ∀j > 4

 Función de autocorrelación parcial o FAP:

A partir de la representación de MA(1) 4 en su calidad de AR(∞) 4 , es posible


deducir los valores de la FAP:

y t = −Θ1 y t − 4 − Θ12 y t −8 − Θ13 y t −12 − .... + ε t


φ11 = φ22 = φ33 = 0
φ44 ≈ −Θ1
φ55 = φ66 = φ77 = 0
φ11 = φ22 = φ33 = 0
φ88 ≈ −Θ12
φ99 = φ10,10 = φ11,11 = 0
φ12,12 ≈ −Θ13 y así sucesivamente.

72
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

10.3. Aspectos prácticos

En este apartado se describen, desde una perspectiva práctica, las principales


características de los gráficos que representan a las funciones de
autocorrelación de los procesos estacionales. El objetivo es poder comparar
dichas autocorrelaciones con las estimadas para la serie de interés y poder
decidir cuál es potencialmente el modelo que ha generado dicha variable.

10.3.1. Modelo AR estacional

10.3.1.1. Modelo AR(1) estacional

Como se ha descrito anteriormente, el modelo autorregresivo de primer orden


estacional AR(1)s de período s sigue una ecuación: yt = Φ1 yt − s + ε t donde ε t es
ruido blanco y Φ1 es un parámetro AR(1) estacional

Si como es muy frecuente, los datos fueran mensuales la expresión sería la


siguiente: y t = Φ1 y t −12 + ε t . Es decir que la observación actual, yt depende de la
equivalente del año anterior y t −12 y un ruido blanco.

Otra representación alternativa de este modelo en forma polinómica es la


siguiente: (1 − Φ1B12 )y t = ε t , donde (1 − Φ1B12 ) es el polinomio característico de
un AR(1)12, y tal como ocurre en el modelo AR(1) regular, este modelo será
estacionario si las raíces del polinomio (1 − Φ1B12 = 0) están dentro del círculo
unidad. Esto equivale a que Φ1 < 1 .

En relación con las FAS y FAP del modelo AR(1)s , cabe hacer las siguientes
apreciaciones.

 La FAS de un AR(1)s es idéntica a la de un AR(1) regular, es decir


presenta una estructura decreciente en sus elementos o palos, que
pueden ser bien positivos o bien alternados según que el parámetro
autorregresivo Φ sea positivo o negativo.

 La única diferencia con el AR(1) regular es que los palos están


separados por s retardos: el primer palo corresponde al retardo s, el
segundo al 2s y así sucesivamente. Más concretamente, si la serie tiene
estacionalidad mensual (s=12) el primer palo aparecerá en el retardo 12,
el segundo en el 24 y así sucesivamente. Asimismo, si la serie tiene
estacionalidad trimestral (s=4) los palos corresponderían a los retardos
4, 8, 12 etc.

73
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Por el contrario, la FAP del modelo AR(1) estacional, de forma similar al


caso regular solo tendrá un elemento significativo, precisamente en el
retardo s. Para el caso de estacionalidad mensual aparecerá en el
retado 12 y en caso de estacionalidad trimestral en el retardo 4.

 Ejemplos

En el gráfico adjunto se muestran las funciones de autocorrelación simple


(FAS) y parcial (FAP) de un modelo AR(1)12 estacional con φ1 positivo. Se
observa que existe una estructura decreciente en la FAS con todos los
elementos (palos) positivos en los retardos 12, 24, .., mientras que en la FAP
solamente hay un palo significativo y positivo, correspondiente al retardo 12.

FAS y FAP para el Modelo AR(1)12 estacional (con Ф1 = 0,9)


FAS FAP

Asimismo, en el gráfico adjunto se muestran las funciones de autocorrelación


simple (FAS) y parcial (FAP) de un modelo AR(1)12 estacional con φ1 negativo.
Se observa en la FAS que existe una estructura decreciente en los elementos
(palos) correspondientes a los retardos estacionales (12, 24,..) alternando su
signo. Por otro lado, en la FAP solamente hay un palo significativo y negativo
correspondiente al retardo 12.

FAS y FAP para el Modelo AR(1)12 estacional (con Ф1 = −0,9)


FAS FAP

74
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

10.2.1.2. Extensión a modelos AR(p) Estacional

Los modelos AR estacionales de orden superior a uno siguen la misma pauta


que el modelo regular correspondiente. Así es, por ejemplo, para el caso del
AR(2)12 con estacionalidad mensual, cuya expresión básica es
y t = Φ1 y t −12 + Φ 2 y t − 24 + ε t o bien en forma polinómica: (1 − Φ1B12 − Φ 2 B 24 )y t = ε t

El modelo será estacionario cuando las raíces de (1 − Φ1B12 − Φ 2 B 24 ) = 0 estén


fuera del círculo unidad.

 FAS y FAP del AR(2)s

En relación con las FAS y FAP del modelo AR(2 )12 , cabe hacer las siguientes
apreciaciones.

 FAS: Si las raíces son negativas, se observa una estructura decreciente


con palos sucesivos alternados y separados por 12 retardos. En el caso
de que las raíces fuesen imaginarias, se observaría una estructura
sinusoidal separada por 12 retardos.

 FAP: Se observan siempre, de forma similar al AR(2) regular, dos palos


en los retardos 12 y 24. Por lo tanto, en el caso de modelos AR
estacionales la observación del gráfico de la FAP es la clave para
identificar el modelo.

 Modelo AR(p)s

En el caso general, el modelo AR( p )s , cuya expresión es


y t = Φ1 y t − s + Φ 2 y t − 2 s + .... + Φ p y t − ps + ε t , será estacionario cuando las raíces de
(1 − Φ B
1
s
− Φ 2 B 2 s − ....Φ p B ps ) = 0 , estén fuera del círculo unidad.

Asimismo, en relación con las FAS y FAP del modelo AR( p )s , cabe hacer las
siguientes consideraciones.

 La FAS del AR(p)s tendrá una estructura decreciente de palos en los


retardos estacionales.

 Asimismo, en la FAP existirán palos significativos en los p primeros


retardos estacionales: s, 2s....

75
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

10.3.2. Modelo MA estacional

10.3.2.1. Modelo MA(1) estacional

Como se ha descrito anteriormente, el modelo MA(1)s, cuya expresión es


y t = ε t − Θ1ε t − s admite también la representación en forma polinómica
y t = (1 − Θ1B s )ε t donde 1 − Θ1B s es el polinomio MA(1) estacional de período s.

En relación con las FAS y FAP del modelo MA(1)s , cabe hacer las siguientes
apreciaciones.

 La FAP de un MA(1)s es idéntica a la de un MA(1) regular, es decir


presenta una estructura decreciente en sus elementos o palos, que
pueden ser bien positivos o bien alternados según que el parámetro θ
sea positivo o negativo.

 La única diferencia con el MA(1) regular es que los palos están


separados por s retardos: el primer palo corresponde al retardo s, el
segundo al 2s y así sucesivamente. Más concretamente, si la serie tiene
estacionalidad mensual (s=12) el primer palo aparecerá en el retardo 12,
el segundo en el 24 y así sucesivamente. Asimismo, si la serie tiene
estacionalidad trimestral (s=4) los palos corresponderían a los retardos
4, 8, 12, etc.

 Por el contrario, la FAS del modelo MA(1)s estacional, de forma similar al


caso regular, solo tendrá un elemento significativo, precisamente en el
retardo s. Para el caso de estacionalidad mensual aparecerá en el
retado 12 y en caso de estacionalidad trimestral en el retardo 4.

 Ejemplos

En el gráfico adjunto se muestran las funciones de autocorrelación simple


(FAS) y parcial (FAP) de un modelo MA(1)12 estacional con θ1 positivo. Se
observa que en la FAS existe un único elemento (palo) significativo y con signo
negativo, correspondiente al retardo 12. Por el contrario, en la FAP se observa
una estructura decreciente en los palos (todos negativos) correspondientes a
retardos estacionales (12, 24, …)

FAS y FAP para el Modelo MA(1)12 estacional (con θ1 = 0,9)


FAS FAP

76
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Asimismo, en el gráfico adjunto se muestran las funciones de autocorrelación


simple (FAS) y parcial (FAP) de un modelo MA(1)12 estacional con θ1 negativo.
Se observa que en la FAS existe un único elemento (palo) significativo y
positivo, correspondiente al retardo 12. Por el contrario, en la FAP se observa
una estructura decreciente, y con signo alternado, en los palos
correspondientes a retardos estacionales (12, 24, …)

FAS y FAP para el Modelo MA(1)12 estacional (con θ1 =− 0,9)


FAS FAP

10.2.1.2. Extensión al modelo MA(Q) estacional

Los modelos MA estacionales de orden superior se comportan de forma


equivalente al MA regular del mismo orden.

Su expresión es: y t = ε t − Θ1ε t − s − Θ 2ε t − 2 s − .... − Θ qε t − qs

Otra expresión alternativa a la anterior en forma polinómica es la siguiente:


( )
y t = 1 − Θ1B s − Θ 2 B 2 s − .... − Θ q B qs ε t

Asimismo, en relación con las FAS y FAP del modelo MA(q )s , cabe hacer las
siguientes consideraciones.

 En la FAS del MA(q)s se observan palos significativos en los q primeros


retardos estacionales: s, 2s....

 En la FAP del modelo MA(q) estacional se observa una estructura


decreciente de palos en los retardos estacionales: s,2s,…...

77
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

10.4. Modelo ARMA estacional

Al analizar series temporales es habitual observar la existencia de patrones


estacionales transitorios relacionados normalmente con motivos institucionales
o meteorológicos. Los modelos ARMA necesitan órdenes muy grandes para
representar estos patrones estacionales y así se pierde la ventaja del número
reducido de parámetros de los modelos. La alternativa para representar estos
fenómenos consiste en los modelos ARMA multiplicativos estacionales que
aunque imponen restricciones son razonables en la práctica.

La expresión del modelo ARMA(1,1)s es: y t = Φ1 y t − s + ε t − Θ1ε t − s


Este modelo se puede expresar en forma de polinomio de la manera siguiente:
(1 − Φ1B s )yt = (1 − Θ1B s )ε t
En general, el ARMA(p,q)s tendrá la ecuación:

(1 − Φ B
1
s
− Φ 2 B 2 s − .... − Φ p B ps )y t = (1 − Θ1B s − Θ 2 B 2 s − .... − Θ q B qs )ε t

Debido a que el modelo ARMA(p,q)s está compuesto, en su forma más general,


de una parte autorregresiva AR(p)s y de otra de media móvil MA(q)s, para
identificar el modelo adecuado bastaría con aplicar sobre las FAS y FAP, los
criterios mencionados anteriormente al estudiar ambos tipos de modelos.

En este sentido, cabe hacer las siguientes apreciaciones sobre las FAS y FAP
del modelo ARMA(p,q)s.

 FAS: Los primeros q elementos o palos correspondientes a retardos


estacionales de un proceso ARMA estacional dependen de la parte MA
estacional. A partir del retardo q se producirá un decrecimiento de los
palos que vendrá dado por la estructura AR.

 FAP: Al contrario de lo que sucede con la FAS, los primeros p elementos


correspondientes a retardos estacionales de la FAP dependen de la
parte AR. Por tanto, cabe citar que a partir del retardo p se producirá un
decrecimiento de los palos en retardos estacionales que vendrá dado
por la estructura MA.

78
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En este sentido, un criterio muy práctico para la selección del modelo ARMA
estacional más adecuado, es basarse en dónde se observa más estructura en
los retardos estacionales. Pueden ocurrir las alternativas siguientes:

 Si se observa más estructura en la FAS, mientras que en la FAP solo


hay uno o dos palos significativos en los retardos estacionales, se tratará
de un modelo AR.

 Si, por el contrario, se observa más estructura en la FAP, mientras que


en la FAS hay solamente uno o dos palos significativos correspondientes
a los retardos estacionales, sería un modelo MA.

 Finalmente, si en ambas funciones se observa una amplia estructura,


cabe concluir que se trata de modelos ARMA estacionales con parte
autorregresiva y parte media móvil.

 Ejemplos:

En el gráfico adjunto se muestran las funciones de autocorrelación simple


(FAS) y parcial (FAP) de un modelo ARMA(1,1)12 estacional con Φ1 negativo y
Θ1 positivo. Se observa tanto en la FAS como en la FAP estructura. En el caso
de la FAS el signo de sus elementos, correspondientes a retardos estacionales
(12, 24, …), cambia en cada elemento, mientras que en el caso de la FAP, sus
palos correspondientes a retardos estacionales son todos negativos.

FAS y FAP para el Modelo ARMA(1,1)12 (con Φ1 = −0,9, Θ1 = 0,9)


FAS FAP

Finalmente, en el gráfico adjunto se muestran las funciones de autocorrelación


simple (FAS) y parcial (FAP) de un modelo ARMA(1,1)12 estacional con Φ1
positivo y Θ1 negativo. Se observa estructura tanto en la FAS como en la FAP.
En el caso de la FAS, el signo de los elementos correspondientes a retardos
estacionales (12, 24, …), es siempre positivo, mientras que en el caso de la
FAP, el signo de sus elementos, correspondientes a retardos estacionales,
cambia en cada elemento respecto al anterior.

FAS y FAP para el Modelo ARMA(1,1)12 (con Φ1 = 0,9, Θ1 = −0,9)


FAS FAP

79
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

11. MODELOS MULTIPLICATIVOS

11.1. Caracterización teórica

Para completar el proceso de modelización de series temporales es necesario


fijarse tanto en la estructura de autocorrelación regular como en la estacional
de una serie temporal. Por ejemplo, si se identifica una estructura AR(1) regular
y AR(1)4 a una serie trimestral, el modelo que queda es multiplicativo y se
escribiría de la forma siguiente: (1 − Φ1 B 4 )(1 − φ1 B ) yt = ε t ,

En la expresión anterior aparecen, multiplicando, los dos polinomios


característicos de ambas estructuras, la regular y la estacional. El motivo de
utilizar esta estructura de tipo multiplicativo consiste en que durante el proceso
de análisis de series temporales, el primer paso que se lleva a cabo consiste en
identificar el modelo correspondiente a la estructura que mejor se observe en
las FAS y FAP correspondientes. Si se supone que la estructura que primero
se identifica es la regular, entonces el modelo inicial en nuestro análisis sería el
siguiente: (1 − φ1B ) y t = at donde at es el término de error.

El paso siguiente consiste en estimar este modelo, escribiendo el mismo de la


( )
forma siguiente: 1 − φˆ1B yˆ t = aˆ t donde φˆ1 representa el parámetro autorregresivo
estimado y ât son los residuos resultantes. Del análisis de estos residuos
podría deducirse que todavía queda estructura sin modelar. Es decir, en los
gráficos de las FAS y FAP residuales podría detectarse una estructura
estacional de tipo AR(1), observando los coeficientes 4,8,12..., de las mismas.
Por tanto, el modelo que seguirían los residuos ât es: (1 − Φ1 B 4 )aˆt = ε t donde εt
es un proceso de ruido blanco.

εt
Esta última ecuación se puede escribir como: aˆt = y sustituyendo en el
1 − Φ1 B 4
modelo correspondiente a yt , se obtiene que:

(1 − φ1 B ) yt = ε t 4 ⇒ (1 − Φ1 B 4 )(1 − φ1 B ) yt = ε t
1 − Φ1 B

Es decir, se ha obtenido un modelo multiplicativo que habría que reestimar. El


análisis de los residuos resultantes de este nuevo modelo, es decir, de εˆt , nos
indicaría si éstos ya proceden de un ruido blanco o es necesario de nuevo
reformular.

80
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En general, si una serie tiene tanto estructura regular como estacional, el


modelo resultante es multiplicativo. La regla básica para este tipo de modelos
consiste en que los polinomios AR (tanto regular como estacional) multiplican a
la variable y los polinomios MA (tanto regular como estacional) multiplican al
error del modelo. Por ejemplo, la forma de formular que una variable yt sigue
una estructura ARMA(1,1) X ARMA(0,1)12 es la siguiente:
(1 − φ1 B ) yt = (1 − θ1 B )(1 − Θ1 B )ε t
12

La representación más general de un modelo multiplicativo es un proceso


ARMA (p,q)xARMA(p,q)s donde s es el período estacional. Utilizando la
representación del modelo, basada en los polinomios característicos, se
obtienen las expresiones siguientes:

φ p (B )Φ P (B ) y t = θ q (B )ΘQ (B )ε t

Siendo:

φ p (B ) = 1 − φ1B − φ2 B 2 − .... − φ p B p
θ q (B ) = 1 − θ1B − θ 2 B 2 − .... − θ q B q
Φ p (B ) = 1 − Φ1B s − Φ 2 B 2 s − .... − Φ P B Ps
Θ q (B ) = 1 − Θ1B s − Θ 2 B 2 s − .... − ΘQ B Qs

11.2. Aspectos prácticos

11.2.1. Conceptos básicos

Para poder realizar el análisis de las series temporales, una hipótesis


fundamental es que el proceso sea estacionario. Un proceso estacionario en la
media exige que toda serie o realización del mismo se separe sólo
eventualmente de dicho valor medio al que debe sistemáticamente retornar a lo
largo de su historia. Se trata de series sin tendencia a crecer o disminuir en el
tiempo, siempre oscilantes alrededor de un valor medio. Análogamente, un
proceso estacionario en la varianza implica realizaciones en las que la serie
mantenga un grado de dispersión similar a lo largo del tiempo. Es decir, la serie
presentará oscilaciones alrededor de la media que no deberán aumentar o
disminuir a lo largo del tiempo.

La mayoría de las series económicas no son estacionarias en la media o en la


varianza o en ambas a la vez. El análisis Box-Jenkins para series temporales lo
que precisamente intenta es, mediante unas transformaciones adecuadas,
convertir a la serie primitiva en estacionaria.

81
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Toda serie que presenta, por ejemplo, una tendencia lineal de crecimiento,
puede transformarse en estacionaria en la media calculando sus primeras
diferencias, que sobre una recta son constantes. En definitiva, para el
tratamiento de la no estacionariedad en la media se propone la diferenciación
sucesiva de la serie, aprovechando la propiedad de que gozan una gran parte
de los procesos estocásticos (los denominados homogéneos), de convertirse
en estacionarios a través de habitualmente una o dos diferencias o, en general,
de d diferencias.

Una vez realizado el análisis de la serie diferenciada, es necesario obtener


resultados válidos para la serie original, por lo que habrá que realizar la
operación inversa de sumar o integrar d veces. Se denominan procesos
integrados a estos procesos que sufren esta doble operación de diferenciarlos
para que se conviertan en estacionarios y de integrarlos o sumarlos, una vez
finalizado el correspondiente análisis.

Un modelo ARIMA (p, d, q) surge a partir de un modelo ARMA (p, q) definido


sobre una serie que exige d integraciones. Por lo tanto, se trata de un modelo
autorregresivo de orden p, integrado d veces y de medias móviles de orden q.
Todo ello se aplica de forma análoga al caso de existir estacionalidad,
generándose el correspondiente modelo ARIMA (p,d,q) (P,D,Q)12 para el caso
de estacionalidad mensual.

Por otro lado, incluso antes de proceder a la diferenciación de un proceso, es


norma habitual utilizar la transformación adecuada de los datos originales, a fin
de garantizar especialmente que los residuos del modelo ajustado tengan una
varianza constante y procurar distribuciones aproximadamente normales. Las
transformaciones más utilizadas para favorecer la homocedasticidad son del
tipo Box-Cox y muy especialmente la transformación logarítmica como se ha
indicado en apartados anteriores.

A continuación se desglosan los conceptos anteriores en forma de esquema


para facilitar su comprensión.

Cabe citar los siguientes puntos en relación con la identificación práctica del
modelo de las series temporales que ya son estacionarias, una vez hechas las
transformaciones pertinentes.

82
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Las series tienen dos tipos de estructura de dependencia:

 Estructura regular. Se ajustan modelos ARIMA(p,d,q) para la parte


regular

 Estructura estacional. Se ajustan modelos ARIMA estacionales.

Los modelos estacionales pueden ser AR(1)12 o MA(1)12, o presentar


estructuras más complejas como modelos ARMA. En principio la parte
estacional se puede modelizar de la misma forma que la parte regular. La
identificación se realiza estudiando las FAS y la FAP en los retardos
estacionales. Cuando una serie tiene parte regular y parte estacional, la FAS
presenta una interrelación entre ellas.

Hay que modelizar la parte regular ARIMA(p,d,q) y también la parte estacional:


ARIMA(P,D,Q)s. El modelo conjunto se denomina ARIMA(p,d,q)x(P,D,Q)s.

Esta nomenclatura nos indica lo siguiente:

 La serie ha necesitado d diferencias regulares para ser estacionaria.


 La serie ha necesitado D diferencias de orden s para ser estacionaria
 Por tanto, la serie ∇ d ∇ Ds yt es estacionaria.
 La parte regular de la serie estacionaria ∇ d ∇ Ds y t sigue un modelo
ARMA(p,q)
 La parte estacional de la serie estacionaria ∇ d ∇ Ds y t sigue un modelo
estacional ARMA(P,Q)s

11.2.2. Funciones de autocorrelación

En relación con las funciones de autocorrelación de los modelos


ARMA(p,q)xARMA(P,Q)12 , cabe indicar, en primer lugar, que cuando una serie
tiene parte regular y parte estacional, puede haber interacción entre ellas, tanto
en la FAS como en la FAP.

En este sentido, la identificación se realiza estudiando y fijándose en los palos


correspondientes a retardos estacionales tanto en la FAS como en la FAP. Así
por ejemplo, si la serie es mensual, hay que fijarse en los palos de la FAS y de
la FAP separados por 12 retardos.

Otras características que cabe destacar de las FAS y FAP de este tipo de
modelos son las siguientes:

83
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

A) FAS:

 En los retardos bajos se observa únicamente la parte regular.


 En los retardos estacionales (12, 24,...) se observa básicamente la parte
estacional.
 En los retardos cercanos a los estacionales se observa la interacción
entre las dos partes. A ambos lados del retardo estacional aparece la
FAS regular.

B) FAP:

 En los retardos bajos se observa únicamente la FAP de la parte regular.

 A la derecha de cada retardo estacional aparece la FAP regular. Si el


coeficiente estacional es positivo la FAP aparece invertida. Si es
negativo, aparece con su signo.

 A la izquierda de los coeficientes estacionales aparece la FAP con su


signo.

A continuación se muestran las FAS y FAP de varios tipos de procesos que


siguen modelos multiplicativos ARMA(p,q)xARMA(P,Q)12 donde p, q, P y Q
toman los valores 0 ó 1. En estos gráficos se observan en las FAS y FAP los
rasgos citados anteriormente.

FAS y FAP para el Modelo ARMA(0,1)xARMA(0,1)12 (con θ1 = 0,5, Θ1 = 0,9)


FAS FAP

FAS y FAP para el Modelo ARMA(0,1)xARMA(0,1)12 (con θ1 = 0,1, Θ1 = 0,9)


FAS FAP

FAS y FAP para el Modelo ARMA (0,1)xARMA(0,1)12 (con θ 1 = −0,5, Θ1 = −0,9)


FAS FAP

84
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

FAS y FAP para el Modelo ARMA(1,0)xARMA(0,1)12 (con φ1 = 0,5, Φ1 = 0,9)


FAS FAP

FAS y FAP para el Modelo ARMA(1,0)xARMA(1,0)12 (con φ1 = 0,1, Φ1 = 0,9)


FAS FAP

FAS y FAP para el Modelo ARMA (1,0)xARMA(1,0)12 (con φ1 = −0,5, Φ1 = −0,9)


FAS FAP

85
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

12. DIAGNOSIS DEL MODELO


12.1. Conceptos básicos

La estimación de un modelo ARIMA(p,d,q) implica haber realizado


satisfactoriamente la etapa de identificación del modelo. Si una serie está bien
identificada, y se le ajusta el modelo correcto, los residuos de la serie deben
carecer completamente de estructura. Como se ha mencionado anteriormente,
una serie sin estructura de dependencia es precisamente el denominado ruido
blanco.

El ruido blanco es una serie estacionaria producida por observaciones


independientes. Los elementos de sus FAS y FAP teóricas son de magnitud
nula, es decir ningún elemento o palo debe ser significativo.

Una vez identificado y estimado el modelo univariante que consideramos más


adecuado para explicar el proceso de generación de los datos, se pasa a la
siguiente etapa denominada diagnosis en la que se comprueba y analiza el
grado de validez del modelo especificado y ajustado.

La diagnosis de modelos ARIMA que es la etapa posterior a la estimación del


modelo, se basa precisamente en este hecho clave: Si la serie está bien
ajustada, sus residuos deben ser ruido blanco. Si el ajuste es satisfactorio se
consigue eliminar la estructura existente en las FAS y FAP de la serie inicial
mediante la aplicación del modelo, y las correspondientes funciones de los
residuos finales son ruido blanco sin ningún elemento significativo.

Así, tras ajustar un modelo y comprobar la significatividad de los coeficientes se


lleva a cabo la diagnosis del mismo basada en los aspectos siguientes.

 FAS y FAP de los residuos. En el caso de que la serie esté bien


ajustada, la FAS y la FAP de los residuos debe ser nula. En la práctica
se debe comprobar que ninguno de los elementos de las funciones es
significativo.

 Test de no significatividad de los palos de la FAS y la FAP. El test de


Box-Pierce proporciona información sobre si los primeros palos de la
función de autocorrelación simple de los residuos son cero o no. Este
test indica problemas cuando el p-valor es bajo, por ejemplo menor que
0,05. Cuanto mayor sea, hay más evidencia a favor de que los residuos
son ruido blanco.

 Test de rachas y estructuras anormales en los residuos.

86
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Finalmente, cabe destacar que la etapa de diagnosis nos sirve para:

 Comprobar si el modelo escogido es adecuado


 Discriminar entre posibles modelos

12.2. Instrumentos y etapas

La diagnosis del modelo estimado se divide en dos etapas que se describen a


continuación.

12.2.1. Diagnosis sobre los parámetros

En relación con la diagnosis sobre los parámetros, cabe destacar los siguientes
puntos.

A) Los parámetros estimados deben cumplir las condiciones de


estacionariedad y/o invertibilidad, dependiendo del tipo de modelo. Para
el cumplimiento de dichas condiciones, hay que comprobar que los módulos
(valores absolutos) de las raíces de los polinomios característicos son mayores
que la unidad. Mientras que los procesos AR puros han de cumplir condiciones
de estacionariedad, los MA puros sólo han de cumplir condiciones de
invertibilidad, pues ya son estacionarios. Finalmente, los procesos mixtos o
ARMA han de cumplir tanto las condiciones de estacionariedad como las de
invertibilidad.

B) Además, los parámetros estimados han de ser estadísticamente


distintos de cero. Para ello, se sigue partiendo de la hipótesis de normalidad
en los términos de errores y por tanto, es factible calcular los ratios t asociados
a cada parámetro y compararlos con una t de Student de n − k grados de
libertad, donde k es el número de parámetros del modelo univariante.

C) Asimismo, no debe olvidarse que las correlaciones entre los parámetros


estimados han de ser bajas. Magnitudes de las correlaciones muy altas
(mayores que ±0.8 ) indican una especificación deficiente. Por ejemplo, si el
modelo más adecuado es un MA(1), que como ya se mencionado puede
escribirse como (1 + θ1 B + θ12 B 2 + ...) yt =
ε t y aproximamos este modelo por un
AR(2), estamos estimando φ1 = θ1 y φ2 = θ12 , y obteniendo una magnitud de la
correlación entre φ1 y φ2 muy alta, porque el segundo parámetro es el cuadrado
del primero. Por tanto, magnitudes altas de correlaciones entre los parámetros
estimados, pueden indicarnos que en lugar del modelo AR( p ) que se está
estimando, el modelo correcto debería ser un MA de orden más bajo, o bien
que si estoy estimando un MA( q ), el modelo correcto debería ser un AR de
orden inferior.

87
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

D) En un modelo adecuado no deben existir factores en la parte AR ni en


la parte MA susceptibles de cancelarse mutuamente. Cabe recordar que
tanto el polinomio AR como el MA del modelo ARMA( p, q ) : φ p (B ) yt = θ q (B )ε t
admiten una descomposición en sus factores. En el AR, la descomposición es
φ p (B ) = 1 − φ1B − φ2 B 2 − .... − φ p B p = (1 − G1B ) × (1 − G2 B ) × .... × (1 − G p B ) , mientras que
en el MA sería
θ q (B ) = 1 − θ1B − θ 2 B − .... − θ q B = (1 − R1B ) × (1 − R2 B ) × .... × (1 − Rq B ).
2 q

Una vez efectuadas estas descomposiciones, si el polinomio AR tuviera algún


factor común con el polinomio MA, se cancelarían y se reduciría el orden del
modelo. Por tanto, esto nos indicaría que hemos sobreparametrizado el
modelo.

12.2.2. Diagnosis sobre los residuos

Es fundamental realizar una diagnosis sobre los residuos resultantes del


modelo estimado hasta conseguir que sean ruido blanco. El proceso es el
siguiente:

A) Si el modelo estimado es correcto, los residuos resultantes deben ser


ruido blanco. Para ello una condición necesaria es que la serie de residuos
sea estacionaria en media y en varianza. Si la serie residual tiene tendencia,
habría que tomar una diferencia regular adicional. Asimismo, si la serie de
residuos no es estacionaria en varianza, habría que utilizar en general la
transformación logarítmica.

B) Las FAS y FAP muestrales de los residuos no deben presentar ninguna


estructura conocida [AR(1), MA(1), AR(2), etc.]. De hecho, ambas funciones
deben prácticamente coincidir y los coeficientes deben ser estadísticamente
cero. Si se encontrara alguna estructura conocida en las FAS y FAP residuales,
ésta nos indica en qué sentido reformular el modelo ya estimado. Además de
observar los gráficos de las FAS y FAP residuales, existen varios estadísticos
para contrastar la hipótesis nula de que los residuos han sido generados por un
ruido blanco o no.

Uno de los más sencillos es el estadístico de Box- Pierce, calculado como:

m
Q (m ) = N ∑ rˆj2 ≈ χ m2 − p − q − P −Q
j =1

Donde N es el número de datos después de diferenciar, es decir,


N = n − d − sD siendo n el número de datos originales, d el número de
diferencias regulares, s el período estacional y D el número de diferencias
estacionales; r̂j es la estimación del j-ésimo coeficiente de la ACF y m es el
número de autocorrelaciones que se incluyen en el estadístico.
88
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Es decir, se pueden calcular Q (2 ), Q (3),...., Q (36 ) . Escogido el valor de m , si el


estadístico Q (m ) > χ c2(α % ) se rechaza la hipótesis nula de ruido blanco y a la
inversa. Estos estadísticos, de alguna manera, resumen las FAS y FAP
residuales, pero no las sustituyen. En algunas ocasiones, el valor numérico de
este estadístico puede ser engañoso porque, por ejemplo, puede rechazar la
existencia de ruido blanco y, sin embargo observando ambas funciones, no se
encuentran estructuras reconocibles, sino que existen distorsiones por la
existencia de valores atípicos. Asimismo, en otras ocasiones, el estadístico nos
induce a no rechazar la existencia de ruido blanco, pero la observación de las
FAS y FAP nos indican que hay una estructura conocida en ellas, aunque
dentro de las bandas de significación.

C) La serie de residuos no debe presentar muchos valores atípicos. En


este sentido, el número de atípicos fuera de las bandas de ± 2 desviaciones
típicas no debería ser superior al 5% de las observaciones y análogamente, el
número de atípicos fuera de las bandas de ± 3 desviaciones típicas no debería
superar al 1% de las observaciones. Cabe recordar que la existencia de
residuos atípicos muy grandes puede distorsionar gravemente las FAS y FAP,
así como los estadísticos Q.

12.3. Otros aspectos relevantes

Aparte de los aspectos mencionados en la diagnosis de parámetros y residuos


cabe destacar otros puntos relevantes que se describen a continuación.

A) Siempre se debe elegir el modelo adecuado que tenga el mínimo número de


parámetros posible. En este sentido, no debe olvidarse que por ejemplo, un
AR(2) o un AR(3) son en ocasiones, aproximaciones de un MA(1). En estos
casos se observarían correlaciones altas entre los parámetros autorregresivos
estimados.

B) Asimismo, cabe citar que cuando se sobrediferencia, también se está


sobreparametrizando el modelo. Así, por ejemplo, si el modelo adecuado es:
=yt φ1 yt −1 + ε t y se sobrediferencia, queda (1 − φ1 B)∇yt = ∇ε t , donde
∇ε t = (1 − B)ε t es una MA(1) no invertible que cancelaría con la diferencia que
hemos tomado innecesariamente. Por ello, la MA no invertible suele ser un
testigo revelador de que se ha sobrediferenciado así como de que el modelo
correcto debe ser otro más sencillo.

89
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

C) La varianza residual estimada es un instrumento útil para discriminar entre


modelos alternativos de una misma serie. Es decir, si se utiliza el estimador de

la varianza residual, σˆ ε2 =
(
SR φˆ,θˆ, δˆ), donde el numerador representa la suma
n−k
de cuadrados de residuos de un modelo y el denominador representa los
grados de libertad del mismo, el hecho de añadir un nuevo parámetro porque
estemos sobreparametrizando (no porque sea necesario), hará que disminuyan
el valor del numerador y del denominador y por tanto, la varianza residual no
disminuirá apenas.

D) Muchas veces es útil reestimar el modelo ya identificado y estimado,


suprimiendo las últimas observaciones disponibles y predecir éstas como un
ejercicio para evaluar la capacidad predictiva del modelo. Si el modelo es
adecuado, las predicciones intramuestrales han de ser satisfactorias.

 Resumen

En la tabla siguiente se describen, de forma resumida, los principales aspectos


que deben considerarse en relación con los instrumentos de identificación de
los diversos parámetros del modelo.

Instrumentos de
Parámetro Observaciones
identificación
Se trata de conseguir que la
variabilidad de los datos sea
• Gráfico media-desviación
λ (Transformación de Box- independiente de su nivel. En
típica
Cox) series económicas es habitual
• Gráfico de la serie temporal
λ=0, lo que supone transformar
logarítmicamente los datos.
• Gráfico de la serie temporal Se trata de conseguir que los
d (orden de diferenciación) • FAS (decrecimiento lento y datos fluctúen en torno a una
lineal) media aproximadamente estable
• Media muestral de la serie Si la media de la serie
diferenciada transformada es significativa, el
Término constante
• Desviación típica de la modelo debe incluir un término
media constante
La FAP tiene p valores no nulos
• FAP de orden p
p (orden del término AR) Un proceso AR finito y
• FAS infinita
estacionario equivale a un MA(∞)
La FAS tiene q valores no nulos.
• FAS de orden q
q (orden del término MA) Un proceso MA finito e invertible
• FAP infinita
equivale a un AR(∞)

90
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

13. ANÁLISIS DE INTERVENCIÓN

13.1. Modelo general


Una extensión del modelo ARIMA descrito en los apartados anteriores es el
denominado análisis de intervención que nos permite estimar el efecto de
determinados fenómenos o sucesos mediante la incorporación de las
correspondientes variables en el análisis.

En relación con este nuevo modelo para la serie temporal, cabe destacar que
los valores de la serie temporal se ponen en relación, no sólo con su pasado,
sino también con los valores contemporáneos de otras series, que actúan como
variables explicativas o “inputs”.

Estas variables pueden ser variables deterministas (o incluso series


económicas) diseñadas para modelizar diversos efectos como por ejemplo los
siguientes:

 Efectos calendario, causados por irregularidades en la unidad de tiempo


como pueden ser: distinto número de días laborables y festivos, años
bisiestos o celebración de la Semana Santa en distintos meses.

 Valores atípicos (outliers) debidos a fenómenos como cambios


legislativos, fenómenos naturales, cambios en el tipo impositivo,
huelgas, etc. En este caso se dice que el modelo es “de intervención”.

La expresión del modelo final es la siguiente: ln(Yt ) = TD t + E t + O t + N t

Donde las variables representan los siguientes efectos:

 TDt recoge los efectos de calendario vinculados al ciclo semanal


(Trading Day).

 Et recoge, los efectos de la Semana Santa o Pascua (Easter) móvil.

 Ot (Outliers) representa una combinación de modelos de intervención


asociados a factores de tipo extraordinario que afectan a la serie de
manera no recurrente.

 Nt finalmente caracteriza el comportamiento estocástico de la serie.

La expresión anterior constituye una descomposición preliminar de la serie en


un componente determinista, resultado de agregar los efectos de calendario e
intervención, y otro estocástico que representa los movimientos observados
asociados a la respuesta de un sistema lineal a una secuencia de innovaciones
de tipo ruido blanco. A continuación se examina cada componente de la
ecuación anterior con más detalle.
91
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

13.2. Efectos y Variables de Intervención

 Efecto del ciclo semanal: TDt

El efecto del ciclo semanal se puede recoger de diversas formas. Una de ellas
es a través de una variable de tipo determinista que representa el efecto del
ciclo semanal (días laborables) que se define de la siguiente forma: (número de
días de tipo j (laborables) en el mes t - (número de sábados y domingos en el
mes t) x 5/2, con j = lunes, ...,viernes.

 Efecto de la Semana Santa móvil

Este efecto también es representado por medio de un término lineal de la


forma:
E t = γ P(τ )t

Donde P(τ) expresa la proporción que representa la semana de Pascua en el


t

mes t, habiéndose considerado que su efecto se percibe en los τ días


anteriores al Lunes de Pascua.

 Efecto asociado a sucesos atípicos: Ot

La expresión formal de estos efectos, derivada del análisis de intervención, es:


k
O t = ∑ Vh (B )I tTh
h =1

Donde I tTh es una variable binaria de tipo impulso que adopta un valor unitario
en la observación Th y nulo en los restantes, siendo Th la observación en que
tiene lugar el acontecimiento atípico o extraordinario.

El filtro Vh (B ) recoge los efectos dinámicos asociados a la observación


anómala.

92
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Existen los tres tipos siguientes de atípicos:

A) Impulso

En este primer tipo la expresión del filtro es la siguiente: Vh (B ) = v h

Cabe señalar que en el caso de un impulso o atípico aditivo, el efecto de la


observación anómala es inmediato y su duración es de sólo un período.

Producen un cambio en el nivel de una sola observación de la serie. Este tipo


de atípicos pueden modelizarse mediante la variable siguiente:

1 si t = t*
X tI =
0 si t ≠ t*

B) Escalón

El caso opuesto al impulso, en el que dicho efecto es permanente, se


representa introduciendo una raíz unitaria en el denominador del filtro racional,
lo que equivale a una integración del impulso registrado.
Vh (B ) = h
v
1− B

En este tipo de atípicos se produce un cambio en el nivel de todas las


observaciones posteriores a una fecha dada y pueden modelizarse mediante la
variable siguiente:

1 si t ≥ t*
X tI =
0 si t < t*

C) Transitorio

Finalmente, existe una situación intermedia entre las dos anteriores, en la que
el efecto de la observación anómala no es permanente pero persiste durante
algún tiempo. Se puede recoger su efecto mediante un filtro del tipo siguiente:

Vh (B ) =
vh
0 <δ <1
1 − δB

93
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Este tipo de valores atípicos recibe el nombre de “transitorio”, poseyendo una


función de respuesta al impulso monótona y convergente controlada por el
parámetro δ , y estando su signo determinado por el de vh.

Naturalmente, si δ = 0 o si δ = 1 se obtienen, respectivamente, los atípicos


aditivo y de cambio de nivel antes comentados.

Dadas sus características, los atípicos aditivos y transitorios son atribuidos a la


señal irregular de la serie y los cambios de nivel son asociados a la tendencia,
en ambos casos con un carácter determinista y, por lo tanto, predecible con
exactitud.

94
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

14. PREDICCIÓN

Cabe recordar que uno de los objetivos básicos del análisis de series
temporales es predecir una serie de datos no determinista que contiene un
componente aleatorio.

Si este componente aleatorio es estacionario, es posible desarrollar técnicas


eficientes para predecir valores futuros de la serie.

Si el componente aleatorio no es estacionario, primeramente se debe convertir


dicho componente en estacionario, a continuación se predice dicho
componente y, finalmente, se deshace la conversión para recuperar la
predicción que nos interese.

A continuación se describen los principales aspectos relacionados con la


predicción en los diferentes tipos de modelos de series temporales estudiados.

14.1. Predicciones para modelos estacionarios

14.1.1. Predicción puntual con modelos univariantes

En este caso se trata de predecir (estimar) los valores futuros de la variable yt ,


contando con la información disponible t = 1, 2,..., N . Además yˆ t (k ) es la
predicción de y en el instante t con horizonte k períodos hacia adelante. La
predicción con un error cuadrático medio mínimo, viene determinada por:

yˆ t (k ) = E ( yt +k / I t ) = Et ( yt +k )t

Donde I t es el conjunto de información disponible hasta el instante t y Et


representa el valor esperado, dada la información hasta el instante t.

95
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

14.1.1.1. Predicciones puntuales para modelos autorregresivos

A) Modelo AR(1): y t = δ + φ1 y t −1 + ε t

A1) Caso de que el horizonte sea de 1 período:

La predicción con un error cuadrático medio mínimo, viene determinada por:


yˆ t (1) = Et ( yt +1 ) = Et (δ + φ1 yt + ε t +1 ) = δ + φ1 yt , donde se han tenido en cuenta dos
condiciones:

 yt está en el conjunto de información disponible.

 Et (ε t +1 ) = E (ε t +1 ) = 0 por ser ε t un proceso de ruido blanco. Es decir, por


ausencia total de autocorrelación es lo mismo calcular la esperanza
condicionada a un conjunto de información que la esperanza
incondicional que es nula.

A2) Caso de que el horizonte sea de 2 períodos:

Esta predicción depende de la anterior:

yˆ t (2 ) = Et ( yt +2 ) = Et (δ + φ1 yt +1 + ε t +2 ) = δ + φ1Et ( yt +1 ) = δ (1 + φ1 ) + φ12 yt

A3) Caso de que el horizonte sea de k períodos:

La predicción es: yˆ t (k ) = Et ( yt +k ) = δ (1 + φ1 + φ12 + .... + φ1k +1 ) + φ1k yt

En definitiva, se observa que en un AR(1), la información muestral relevante en


la predicción es el último dato observado de la serie, cuyo peso es mayor en la
predicción con horizonte 1 o 2 períodos que con horizontes muy lejanos.
Además, la predicción a horizonte k períodos utiliza las predicciones en los
períodos anteriores. Es decir, las predicciones a distintos horizontes temporales
se pueden calcular de modo recursivo.

96
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

B) Modelo AR(2): yt (2 ) = δ + φ1 yt +1 + φ2 yt +2 + ε t

B1) Caso de que el horizonte sea de 1 período:

La predicción es: yˆ t (1) = Et ( yt +1 ) = Et (δ + φ1 yt + φ2 yt −1 + ε t +1 ) = δ + φ1 yt + φ2 yt −1

Donde yt e yt −1 son los dos últimos datos observados de la serie.

B2) Caso de que el horizonte sea de 2 períodos:

La predicción es: yˆ t (2 ) = Et ( yt +2 ) = Et (δ + φ1 yt +1 + φ2 yt + ε t +2 ) = δ + φ1Et ( yt +1 ) + φ2 yt

De nuevo, se observa que en un AR(2) la información relevante en la


predicción a cualquier horizonte son las dos últimas observaciones de la serie.
Por tanto, en un AR( p ) entrarán las últimas p observaciones. La manera más
fácil de calcular las predicciones es de modo recursivo, es decir, la predicción a
horizonte 2 depende de la predicción a horizonte 1 y así sucesivamente.

14.1.1.2. Predicciones puntuales para modelos de medias móviles

A) MA(1): yt = δ + ε t − θ1ε t −1

A1) Caso de que el horizonte sea de 1 período:

La predicción es: yˆ t (1) = Et (δ + ε t +1 − θ1ε t ) = (δ − θ1εˆt ) donde se ha tenido en


cuenta que ε t es ruido blanco y por eso, Et (ε t +1 ) = Et (ε t ) = 0 , pero la Et (ε t ) no
puede ser cero, salvo que el residuo asociado a ese instante lo sea. De hecho,
el valor esperado de esa innovación dada la información hasta t no es más que
el residuo asociado a esa fecha, εˆt .

A2) Caso de que el horizonte sea de 2 períodos:

La predicción es: yˆ t (2 ) = Et ( yt +2 ) = Et (δ + ε t +2 − θ1ε t +1 ) = δ .

En general: yˆ t (k ) = δ , ∀k ≥ 2 . En este sentido, se afirma que un proceso MA(1)


sólo tiene memoria de 1 período porque sólo podemos predecir con un valor
distinto a la media de la serie un período hacia adelante.

97
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

B) MA(2): yt = δ + ε t − θ1ε t −1 − θ 2ε t −2

B1) Caso de que el horizonte sea de 1 período:

La predicción es: yˆ t (1) = Et ( yt +1 ) = Et (δ + ε t +1 − θ1ε t − θ 2ε t −1 ) = δ − θ1εˆt − θ 2εˆt −1 , y en


este caso se utilizan los dos últimos residuos.

B2) Caso de que el horizonte sea de 2 períodos:

La predicción es: yˆ t (2 ) = Et ( yt +2 ) = Et (δ + ε t +2 − θ1ε t +1 − θ 2ε t ) = δ − θ 2εˆt y a partir de


aquí, se comprueba que se cumple yˆ t (k ) = δ , ∀k ≥ 3 . Por tanto, para un
proceso MA( q ), tendremos que yˆ t (k ) = δ , ∀k ≥ q + 1 .

14.1.1.3. Predicciones puntuales para modelos ARMA

A) ARMA(1,1): yt = δ + φ1 yt −1 + ε t − θ1ε t −1

A1) Caso de que el horizonte sea de 1 período:

La predicción es: yˆ t (1) = Et ( yt +1 ) = Et (δ + φ1 yt + ε t +1 − θ1ε t ) = δ + φ1 yt − θ1εˆt

A2) Caso de que el horizonte sea de 2 períodos:

La predicción es: yˆ t (2 ) = Et ( yt +2 ) = Et (δ + φ1 yt +1 + ε t +2 − θ1ε t +1 ) = δ + φ1Et ( yt +1 )

Y así sucesivamente.

98
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

14.1.2. Predicciones por intervalo

Para calcular las predicciones por intervalo se utiliza el resultado ya conocido


de que si el error del modelo sigue una distribución normal, el intervalo de
confianza para el valor desconocido yt + k es: yˆ t (k ) ± 2dtˆ = [et (k )], donde dtˆ[et (k )]
es la desviación típica estimada del error de previsión a horizonte k períodos.
Para ello, es necesario calcular el error de previsión como et (k ) = yt +k - yˆ t (k ) en
todos los modelos ya estudiados. En todos los casos, la esperanza del error de
previsión a cualquier horizonte es cero.

 AR(1): y t = δ + φ1 y t −1 + ε t

El error de previsión con horizonte 1 período es:


et (1) = yt +1 − Et ( yt +1 ) = (δ + φ1 yt + ε t +1 ) − (δ + φ1 yt ) = ε t +1

Su varianza es, por tanto, var[et (1)] = σ ε2

El error de previsión con horizonte 2 períodos es:


et (2 ) = yt +2 − Et ( yt +2 ) = (δ + φ1 yt +1 + ε t +2 ) − (δ + φ1Et ( yt +1 )) = ε t +2 + φ1et (1) = ε t +2 + φε t +1

Por lo que: var[et (2 )] = (1 + φ12 )σ ε2

En general: var[et (k )] = (1 + φ12 + φ14 + ... + φ12 (k −1) )σ ε2 . Es decir, a medida que crece el
horizonte de predicción también crece la varianza del error de predicción.

 AR(2): yt (2 ) = δ + φ1 yt +1 + φ2 yt +2 + ε t .

El error de previsión 1 período hacia delante es:


et (1) = yt +1 − Et ( yt +1 ) = (δ + φ1 yt + φ2 yt −1 + ε t +1 ) − (δ + φ1 yt + φ2 yt −1 ) = ε t +1
Y por tanto: var[et (1)] = σ ε2 .

El error de previsión con horizonte 2 períodos es:

et (2 ) = yt +2 − Et ( yt +2 ) = (δ + φ1 yt +1 + φ2 yt +1 + ε t +2 ) − (δ + φ1Et ( yt +1 ) + φ2 yt ) = ε t +2 + φε t +1

Por tanto, var[et (2 )] = (1 + φ12 )σ ε2

99
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

El error de previsión con horizonte 3 períodos es:

et (3) = yt +3 − Et ( yt +3 ) = (δ + φ1 yt +2 + φ2 yt +1 + ε t +3 ) − (δ + φ1Et ( yt +2 ) + φ2 Et ( yt +1 )) =
= ε t +3 + φ1et (2 ) + φ2 et (1) = φ1 (ε t +2 + φ1ε t +1 ) + φ2ε t +1 + ε t +3 = (φ12 + φ2 )ε t +1 + φ1ε t +2 + ε t +3

[ (
Por tanto, var[et (3)] = 1 + φ12 + φ12 + φ2 σ ε2 )]
2

Y así, sucesivamente. De nuevo, la varianza del error de predicción es mayor


cuanto mayor es el horizonte para el que queremos predecir.

 MA(1): yt = δ + ε t − θ1ε t −1

El error de previsión con horizonte 1 período es:


et (1) = yt +1 − Et ( yt +1 ) = (δ + ε t +1 − θ1ε t ) − (δ − θ1ε t ) = ε t +1

Por tanto, var[et (1)] = σ ε2

El error de previsión con horizonte 2 períodos es:


et (2 ) = yt +2 − Et ( yt +2 ) = (δ + ε t +2 − θ1ε t +1 ) − δ = ε t +2 − θ1ε t +1

Asimismo, var[et (2 )] = (1 + θ12 )σ ε2

Y en general, et (2 ) = yt +k − Et ( yt +k ) = ε t +k − θ1ε t +k −1
var[et (k )] = (1 + θ12 )σ ε2 , ∀k > 1

Es decir, en un proceso MA(1) la varianza del error de predicción permanece


constante a partir de un horizonte de predicción de dos períodos.

100
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

14.2. Predicción para modelos no estacionarios

Se parte del supuesto de que el modelo que siguen los datos de una variable
yt es un ARIMA(1,1,0), es decir: (1 − φ1B )∇yt = ε t

Anteriormente se han descrito la forma de generar previsiones de la variable


estacionaria ∇yt , por lo que si ahora se buscan las previsiones para la variable
no estacionaria yt , se puede recurrir a que ∇ = (1 − B ) .

Por tanto, el modelo anterior es: (1 − φ1B )(1 − B ) yt = ε t

[
Y multiplicando ambos polinomios: 1 − (φ1 + 1)B + φ1B yt = ε t
2
]
O bien, yt = (φ1 + 1) yt −1 − φ1 yt −2 + ε t

Las predicciones de yt se pueden calcular de forma recursiva:


yˆ t (1) = Et ( yt +1 ) = Et [(φ1 + 1) yt − φ1 yt −1 + ε t +1 ] = (φ1 + 1) yt − φ1 yt −1
yˆ t (2 ) = Et ( yt +2 ) = (φ1 + 1)Et ( yt +1 ) − φ1 yt
yˆ t (3) = Et ( yt +3 ) = (φ1 + 1)Et ( yt +2 ) − φ1Et ( yt +1 )

Y así sucesivamente.

Otra posibilidad muy frecuente es que la variable original haya necesitado la


transformación logarítmica para que sea estacionaria. Supongamos que hemos
generado previsiones de la variable en log, es decir, zt = ln yt y ahora
necesitamos las previsiones para la original yt . Entonces:
y = e zt ⇒ Et ( yt +1 ) = e Et ( zt +1 ) , donde hay un error en esta aproximación. Si la
variable tiene logaritmos y diferencias, primeramente se recuperan las
predicciones de la variable en logaritmos y finalmente, se deshace el logaritmo.

101
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

15. PROCESO DE MODELIZACIÓN

15.1. Etapas

Dentro del proceso de construcción de un modelo para una serie temporal, de


acuerdo con la metodología Box-Jenkins para el análisis de series temporales,
cabe distinguir las etapas siguientes:

A. Identificación de un modelo ARIMA para los datos y residuos en su


caso.

En esta fase se analizan los gráficos de la serie original y de sus


transformadas, obtenidas mediante la aplicación de las diferencias regular,
estacional y/o la transformación logarítmica, que se consideren adecuadas para
que la serie final sea estacionaria.

Asimismo, se analizan los gráficos de las FAS y FAP y se utilizan los contrastes
necesarios sobre dichas funciones.

B. Ajuste de la serie

En esta fase se estiman los parámetros del modelo identificado anteriormente.

C. Diagnosis del modelo estimado

Durante esta etapa del proceso de modelización, se verifica la idoneidad del


modelo estimado en la etapa anterior. Para ello junto al análisis del gráfico de
los residuos y de las FAS y FAP, se aplica una batería de contrastes sobre los
residuos obtenidos para comprobar si siguen el modelo de ruido blanco.

D. Utilización del modelo

Si la diagnosis del modelo estimado nos permite afirmar su validez, pasaríamos


a la etapa final de su utilización para, por ejemplo, fines de predicción.

En el caso de que los diagnósticos realizados no permitan considerar como


válido el modelo inicialmente elegido, volveríamos de nuevo a la primera etapa
con el fin de identificar y posteriormente estimar un modelo más satisfactorio.

102
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

15.2. Identificación del modelo

15.2.1. Transformaciones de la serie

 Gráfico de la serie

El primer paso en el proceso de modelización, dentro de la etapa de


identificación del modelo, consiste en representar gráficamente la serie,
su función de autocorrelación simple (FAS) y su función de
autocorrelación parcial (FAP).

La observación y análisis de estos gráficos y la aplicación de los contrastes


necesarios nos indican si la serie es estacionaria o no. Según sean los motivos
por los que la serie no es estacionaria, habrá que aplicar uno de los siguientes
procedimientos hasta hacerla estacionaria.

 Si tiene tendencia: Se toman diferencias regulares hasta que


desaparezca. Se tomaría una diferencia cuando el nivel evoluciona sin
tendencia o cuando la tendencia tiene un ritmo de crecimiento constante
y dos diferencias cuando el ritmo de crecimiento es variable.
Normalmente el orden de la diferencia será 1, y raramente será mayor
que 2.

 Si es heterocedástica, es decir, no tiene varianza constante, habrá que


transformar la serie. En series económicas, generalmente con tomar el
logaritmo es suficiente, aunque existen transformaciones más
complejas, dentro de la familia de Box-Cox.

 Si es estacional: Se toman diferencias estacionales hasta que


desaparezca el patrón que se repite. En la práctica es muy raro tener
que aplicar más de una diferencia estacional. Si hay estacionalidad y el
ritmo de crecimiento es variable, hay que tomar una diferencia regular y
otra estacional.

 Gráficos de las FAS y FAP

Una vez que el gráfico de la nueva serie transformada de la original nos indica
que es estacionaria, estamos en condiciones de deducir su estructura,
representando gráficamente su función de autocorrelación simple (FAS) y su
función de autocorrelación parcial (FAP).

103
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

15.2.2. Criterios de identificación

En el análisis de las FAS y la FAP, los criterios siguientes deben tenerse en


cuenta:

a) Tipo de evolución de los elementos de las FAS y FAP.

Cabe la posibilidad de que el decrecimiento de la altura de las barras o palos


de las funciones sea exponencial. También pueden aparecer una alternancia
de los signos o una forma sinusoidal. En este sentido, la alternancia depende
de los signos de los parámetros, mientras que la forma sinusoidal es debida a
la existencia de raíces complejas en la ecuación característica del proceso.

Si no hay decaimiento exponencial, suele deberse a que la serie es integrada


ya que para éstas el decrecimiento es lineal, no exponencial. Cabe recordar
que una serie es integrada cuando al tomar diferencias se convierte en una
serie estacionaria. Por ejemplo, si la serie estacionaria sigue un modelo
ARMA(p,q) y se han tomado d diferencias regulares, se trataría de modelos
ARIMA(p,d,q).

b) Identificación del tipo de proceso en la parte regular

Para determinar el tipo de proceso en la parte regular, una primera posibilidad


es que una de las dos funciones de autocorrelación muestre una amplia
estructura como la descrita anteriormente, mientras que la otra muestra
algunas barras o palos que salen de la banda de significatividad. La posición de
la última de estas barras, que suele coincidir con el número de barras que
sobresalen, nos indica el orden del proceso. Según sea la FAS la que presenta
la estructura amplia, o la FAP, interpretaremos que el proceso es AR o MA,
respectivamente.

Asimismo, hay situaciones que no son tan diáfanas como la indicada


anteriormente; en estos casos puede tratarse de un modelo con las dos partes,
la AR y la MA. Estos son los modelos ARMA(p,q). Sus funciones FAS y FAP
son combinaciones de las de ambas partes, por lo que son difíciles de
identificar a simple vista.

Combinando el análisis de la FAS y la FAP, la identificación de los procesos


estacionarios puede reducirse a decidir cuál de las dos funciones es finita. Para
ello nos fijamos a partir de qué retardo termina o muere la FAS o la FAP para
de esta forma determinar el orden del proceso.

104
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En la tabla siguiente se muestra un resumen de las diferentes posibilidades


existentes en relación con la naturaleza del proceso generador:

FAS
Finita Infinita
Finita Ruido blanco AR
FAP
Infinita MA ARMA

c) Identificación del modelo estacional

En el caso de que sea necesario modelizar la parte estacional junto a la


regular, hay que tener en cuenta los aspectos siguientes en el análisis de las
FAS y FAP.

 Retardos bajos: En estos retardos se observaría únicamente la parte


regular.

 Retardos estacionales: En estos retardos se observaría básicamente la


parte estacional.

 Alrededor de los retardos estacionales: En estos retardos se


observaría la interacción existente entre la parte regular y estacional

d) Caso de ruido blanco

Las FAS y FAP de un ruido blanco (serie de datos procedentes de variables sin
ninguna estructura común, es decir, independientes entre sí) tienen
teóricamente todos sus coeficientes nulos o no significativos en los gráficos
correspondientes.

e) Bandas de significatividad

Respecto a las bandas de significatividad, cabe recordar que las líneas de


significatividad que aparecen en los gráficos de las funciones de
autocorrelación suelen determinar una zona de una significatividad del 95%, es
decir, el coeficiente que sobresale se puede considerar diferente de cero con
un 95% de seguridad. Esto quiere decir que sería admisible la existencia de un
5% de barras que sobresalgan sin motivo real. Tal es el caso cuando hay algún
palo aislado que no cuadra con el resto de la estructura de barras. Cuando hay
20 barras por ejemplo, puede suceder que una se haya salido erróneamente de
la banda de significatividad.

105
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

f) Contraste de aleatoriedad de Box-Pierce

Una opción que también se puede utilizar en este proceso de análisis de las
FAS y FAP, es aplicar el contraste de aleatoriedad de Box-Pierce. Este
contraste está diseñado para estudiar si se puede considerar que una serie
está formada por variables incorreladas o no, ya que cabe recordar que para
variables con distribución normal, el ser independientes y estar incorreladas
son condiciones equivalentes. Este contraste nos señala si los datos se pueden
considerar ruido blanco o no, según sea su p-valor mayor que 0,05 o no.
Además, este contraste puede considerarse como una medida de la
“estructura” que no se debe puramente al azar: cuanto mayor sea el p-valor,
menos estructura hay bajo nuestros datos.

15.3. Ajuste y diagnosis del Modelo

Observando los gráficos citados y aplicando los contrastes adecuados citados


en el apartado anterior, identificamos el tipo de modelo adecuado para nuestra
serie, o al menos cuáles son los primeros candidatos que debemos probar.

A continuación se estima el modelo identificado ARIMA(p,d,q)x(P,D,Q)s ; donde


cada elemento significa lo siguiente:

 “d”: Es el número de diferencias regulares que se han tomado para


hacer la serie estacionaria
 “D”: Es el número de diferencias estacionales de orden s que se han
tomado para hacer la serie estacionaria
 “p”: Es el orden de la parte AR regular
 “q”: Es el orden de la parte MA regular
 “P”: Es el orden de la parte AR estacional
 “Q”: Es el orden de la parte MA estacional
 “s”: Es el tipo de estacionalidad (12 para mensual)

Finalmente, en la etapa de diagnosis, ya descrita con detalle en un apartado


anterior, se valora la validez del modelo estimado.

Aunque la etapa de diagnosis ha sido descrita ampliamente en un apartado


anterior, a continuación se muestran algunos aspectos característicos de dicha
etapa que completan o aclaran la descripción anterior

106
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En este sentido, en el proceso de valoración del grado de ajuste del modelo


hay dos aspectos destacables:

 Significatividad y grado de necesidad de todos los términos del modelo


estimado.

 Grado de similitud de la serie de residuos del modelo estimado con el


proceso de ruido blanco.

A) Significatividad y grado de necesidad de todos los términos del


modelo estimado.

Como ya conocemos, para que un término del modelo propuesto sea


significativo, el valor absoluto del estadístico “t” ha de ser mayor que 2, a la
vez que el p-valor de ese contraste (que mide si se puede considerar nulo o no)
es menor que 0,05. Los coeficientes que no cumplan estas dos condiciones no
son necesarios en el modelo, porque no hay evidencia de que sean diferentes
de cero. Esto nos puede servir de ayuda en la búsqueda de un modelo lo más
sencillo posible.

B) Grado de similitud de la serie de residuos del modelo estimado con el


proceso de ruido blanco

En relación con el diagnóstico de que los residuos de modelo estimado sigan


un proceso de ruido blanco, existen numerosos contrastes de hipótesis,
expresados en forma de estadísticos, que se han descrito en el apartado
dedicado a la diagnosis del modelo y que se aplicarán en los casos prácticos.

Por ejemplo, en el caso del test de Box-Pierce, aplicado a los residuos después
de ajustar el modelo, cabe afirmar que dicho contraste confirma con más fuerza
que los residuos son ruido blanco cuanto mayor es su p-valor. El nivel mínimo
es 0,05, es decir, debe suceder que el p-valor sea mayor que 0,05; y cuando
mayor sea, más evidencia existirá que los residuos sean ruido blanco y por lo
tanto mejor se habrá captado en el modelo la parte que no se debe al azar.

Otro recurso consiste en observar, tras ajustar el modelo ARIMA, los gráficos
de las funciones FAS y FAP de los residuos, lo que nos dará una información
análoga a la del contraste de aleatoriedad de Box-Pierce, pero de forma
gráfica.

Asimismo, cabe recordar que si se ha transformado la serie original, el modelo


encontrado es el de la serie transformada, no el de la serie original.

Finalmente, se muestran a continuación, a modo de resumen, algunos criterios


útiles para el proceso de elección del modelo más adecuado.

107
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 El modelo estimado debe cumplir satisfactoriamente con todas las


condiciones gráficas y numéricas necesarias y que han sido descritas
anteriormente.

 Los residuos obtenidos después de ajustar el modelo deben seguir un


proceso de ruido blanco.

 Entre dos modelos que sólo difieran en el p-valor del contraste de Box-
Pierce, se elegirá el que tenga un valor superior, ya que ofrece más
garantías de que los residuos que proporciona el modelo sean ruido
blanco.

 Entre los que verifican las mismas condiciones numéricas, se elegiría el


más sencillo posible, es decir, el que necesite menos parámetros. Cabe
recordar que por ejemplo un modelo ARMA(p,q) necesita “p+q”
parámetros.

 Cuando el orden de una parte del modelo estimado, AR o MA, es muy


alto, es interesante probar el hecho de añadir algún término de la otra
parte para, de esta forma, cancelar y consecuentemente restarle orden a
ésta.

 Finalmente, como regla general, cabe concluir en que en la elección del


modelo final debe buscarse el equilibrio entre simplicidad y eficacia,
porque no debe olvidarse que siempre sería posible añadir parámetros
indefinidamente al modelo para obtener mejoras.

108
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16. SOFTWARE: PROGRAMAS TRAMO Y SEATS


16.1. Introducción

Entre las numerosas herramientas o programas estadísticos y econométricos


para el análisis estadístico de series temporales, cabe destacar el programa
denominado TRAMO que además puede descargarse gratuitamente. Existen
diversas componentes que conforman dicho software: programas TRAMO
("Time series Regression with ARIMA noise, Missing values and Outliers") y
SEATS "Signal Extraction in ARIMA Time Series"); del programa TERROR
("TRAMO for Errors") y del programa TSW, una versión Windows de TRAMO-
SEATS con algunas modificaciones y añadidos desarrollada por G. Caporello y
A. Maravall, en el Banco de España.

A continuación se indican las principales características de dicho software en


sus distintas versiones de los programas y herramientas que están disponibles
para su descarga.

16.1.1. Descarga del programa

Los programas TRAMO y SEATS están incluidos dentro del módulo


denominado TSW y constituyen dos herramientas informáticas, de carácter
libre para el usuario, muy potentes y completas para el análisis y predicción de
las series temporales. Pueden descargarse en la siguiente página web del
Banco de España, existiendo versiones para DOS, Windows, etc.

https://www.bde.es/bde/es/secciones/servicios/Profesionales/Programas_estadi
/Programas_estad_d9fa7f3710fd821.html
https://www.bde.es/bde/es/secciones/servicios/Profesionales/Programas_estadi
/Programas.html

Asimismo, una breve descripción técnica de dichos programas se encuentra


en:
https://www.bde.es/bde/es/secciones/servicios/Profesionales/Programas_estadi
/Notas_introduct_3638497004e2e21.html

Más información, acompañada con numerosos documentos y ejemplos (la


mayoría en lengua inglesa) sobre este software se puede encontrar en:
https://www.bde.es/bde/es/secciones/servicios/Profesionales/Programas_estadi
/Trabajos_sobre__0ac07f3710fd821.html

Para cada sistema operativo existe una manual disponible con las principales
instrucciones Por ejemplo, para Windows el manual se encuentra en:
https://www.bde.es/f/webbde/SES/servicio/Programas_estadisticos_y_econome
tricos/Programas/ficheros/tswrm.pdf

109
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.1.2. Principales características

Los programas TRAMO y SEATS constituyen dos herramientas


independientes, pero complementarias, para el análisis univariante y la
extracción de señales en series temporales. Es precisamente esa
complementariedad, reforzada por la posibilidad de una fácil integración de
ambos entornos, la que permite referirse a ellos en conjunto como un marco
completo de análisis de series temporales, de fácil manejo y de gran eficiencia.

En 1995 la agencia estadística EUROSTAT comienza a utilizar TRAMO y


SEATS en el tratamiento periódico que realiza de miles de series. A partir de
ese momento, otras agencias y organismos los han ido incorporando en sus
actividades de forma generalizada.

Se trata de una parametrización muy general que en el marco de la


metodología Box-Jenkins suele resultar apropiada para series temporales
mensuales, trimestrales, etc. Están dirigidos fundamentalmente al análisis de
series temporales de frecuencia mensual o más baja y es, por tanto, para este
tipo de datos para los que el programa está especialmente pensado. Otro
aspecto a tener en cuenta es que en todo momento se trata con modelos
lineales.

Están estructurados para satisfacer las necesidades de un analista experto


aunque pueden utilizarse también de forma automática sobre un gran número
de series.

Sus principales aplicaciones son: predicción, ajuste estacional, estimación de la


tendencia-ciclo, construcción de indicadores, interpolación, detección y
corrección de observaciones atípicas, estimación de efectos especiales y
control de calidad de los datos.

El programa TRAMO puede ser utilizado independientemente de SEATS, como


un programa para el análisis detallado de series temporales, ya que permite la
estimación, predicción e interpolación de modelos de regresión con
observaciones ausentes y errores ARIMA, en presencia de varios tipos de
outliers. Las variables de regresión pueden ser incluidas por el usuario (tales
como variables económicas que se piensa que pudieran estar relacionadas con
la serie), o generadas por el programa, como es el caso del efecto de día
laborable, el efecto Semana Santa o Pascua y variables de intervención del tipo
impulso, escalón, o, en general, cualquier posible secuencia de ceros y unos.

110
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

El programa TRAMO elimina de la serie a los efectos especiales, identifica y


elimina automáticamente los efectos de varios tipos de outliers (atípicos) e
interpola las observaciones ausentes. También dispone de un módulo de
identificación automática de modelos que puede ser muy útil, tanto para los
expertos en series temporales, a los que releva de tareas monótonas, como
para los que no lo son, poniendo a su alcance las técnicas de los modelos
ARIMA, que hasta hace poco sólo podían ser utilizadas por personal
especializado. El procedimiento de modelización automática está basado en
estimar primero las raíces unitarias y utilizar después el criterio BIC (criterio
bayesiano de información) para especificar un modelo ARMA a la serie
diferenciada.

TRAMO y SEATS entran dentro de la categoría de los denominados métodos


basados en modelos ARIMA para descomponer una serie temporal en sus
componentes no observados (es decir, para extraer de una serie sus distintas
señales).

16.1.3. Programa TRAMO

El modelo que el programa TRAMO asume por defecto para la parte


estocástica responde al ARIMA(0,1,1)(0,1,1)12 que se suele denominar “modelo
de las líneas aéreas” y tiene la expresión siguiente:
( 1 − B) ( 1 − B )Z t = ( 1 + θ1B) ( 1 + Θ1B ) at
s s

Este modelo es de uso frecuente en esta literatura, ya que ofrece una


representación univariante razonable de muchas series temporales, y en
particular de las series de actividad económica. En la opción por defecto se
realiza, también, un diagnóstico sobre la media de los residuos. En caso de ser
significativamente distinta de cero se incorpora una constante al modelo.

111
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.1.3.1. Principales características

El programa se estructura en tomo a tres módulos principales que, si se usa la


rutina de instalación por defecto de TRAMO, se corresponden a tres
subdirectorios: SERIES, GRAPH y OUTPUT.

 Resultados del programa

Los resultados del programa aparecen en “c:\TRAMO\OUTPUT\n-serie.out”.


La extensión de la información puede ser modificada. Además de los
resultados finales de la identificación, estimación, diagnóstico y predicción, el
fichero en su forma más extensa contiene información completa sobre el
proceso de decisión del programa, con lo cual se consigue transparencia en el
proceso, fundamentalmente si éste incluye alguna opción automática.

 Diagnosis de los resultados

Un aspecto que conviene subrayar es el apartado de diagnosis de los


resultados. En este sentido, el programa presenta información sobre los t-
valores de los parámetros estimados, sus correlaciones, estadísticos y
contrastes de rachas (run test) sobre los residuos y los estadísticos de Ljung-
Box, entre otros.

 Gráficos y vectores auxiliares

La rutina GRAPH permite la visualización gráfica de un conjunto de resultados


que el programa almacena automáticamente en ficheros situados en el
subdirectorio del mismo nombre. Las opciones que se presentan son:

1. Menú Series: Serie original y transformada, serie extrapolada de


predicciones y series corregidas de atípicos, de efectos especiales (efecto
calendario y Semana Santa) y de efectos de regresión en general.
2. Menú ACF: Correlograma y correlograma parcial de los residuos y
correlograma de la serie diferenciada.
3. Menú Regoutse: Efecto separado y conjunto de los atípicos, variables de
regresión y efectos especiales.

En definitiva, se trata de un amplio glosario de ficheros auxiliares que pueden


ser recuperados y exportados para tratamientos posteriores con otros
programas (hojas de cálculo, Matlab, etc.). Su visualización gráfica se realiza a
través de un cómodo sistema de menús. La alternativa overlay permite la
superposición de varios gráficos, facilitando las tareas de comparación.

112
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.1.3.2. Principales prestaciones

 Transformaciones previas

Existe la posibilidad de un diagnóstico sobre la posible idoneidad de una


transformación logarítmica de los datos. La diagnosis automática es muy útil,
por ejemplo, para el tratamiento masivo de series heterogéneas.

 Estimación

La estimación de los parámetros del modelo se realiza mediante algoritmos de


máxima verosimilitud, bien exacta o aplicando mínimos cuadrados
incondicionales.

Asimismo, es posible fijar varios parámetros relacionados con los algoritmos


como son valores iniciales, criterios de convergencia, etc.

 Tratamiento de observaciones atípicas

Uno de los aspectos destacables del programa se relaciona con la detección y


corrección de distintos tipos de observaciones atípicas (outliers).

El análisis más general se realiza sobre tres tipos de atípicos considerados en


la literatura:

 Aditivos
 Cambios de nivel
 Cambio temporal de nivel

El parámetro que define la sensibilidad de la búsqueda puede ser fijado por el


usuario. Su valor por defecto depende de la longitud de la serie. Como en otros
programas de series temporales, la detección y corrección de efectos atípicos
puede hacerse de forma automática o no hacerse.

 Detección y corrección automática de outliers

Cuando se analizan los datos de series temporales, es corriente encontrar


atípicos que tienen su origen en intervenciones incontroladas o inesperadas,
como huelgas, determinadas medidas de política económica, desastres,
errores en la transcripción de datos, etc. Como los modelos ARIMA que se
utilizan frecuentemente en series temporales están diseñados para recoger la
información de procesos que tienen una cierta homogeneidad, los outliers y los
cambios estructurales influyen en la eficiencia y la bondad del ajuste de dichos
modelos.

113
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Predicción

Las utilidades que TRAMO ofrece para el análisis de predicción tienen dos
vertientes. Por un lado, el programa permite reservar un cierto número de
observaciones de la parte final de la muestra para evaluar las predicciones que
se obtienen del modelo univariante que ha sido estimado con la primera parte
de ésta. Esto aporta información sobre la estabilidad postmuestral del modelo.
Si se desea, el programa genera los errores de predicción un período hacia
adelante sobre un intervalo de las últimas observaciones de longitud a
determinar, realizando un contraste de estabilidad postmuestral basado en un
estadístico F. Por otro lado, TRAMO permite también generar predicciones a
distintos horizontes temporales a partir de una fecha que puede ser fijada por el
usuario.

Si se ha aplicado a la variable de partida una transformación logarítmica, las


predicciones sobre el nivel original pueden calcularse por medio de la
distribución lognormal o aplicando la transformación exponencial sobre la
predicción en logaritmos.

 Variables de regresión

Aparte de las utilidades de que dispone TRAMO para la introducción de


variables de regresión por parte del usuario y para la creación de diversos tipos
de variables de intervención, se ofrece la capacidad de diagnosis y generación
automática de determinadas variables relacionadas con la corrección del efecto
Semana Santa y de la heterogeneidad del número de laborables de cada mes.
Por defecto, este apartado está desactivado, por lo que en series en las que el
usuario considere que estos efectos puedan tener importancia, debe
modificarse esta opción. Este será el caso, por ejemplo, si se trabaja con series
mensuales de actividad (ventas, producción, series de transporte, etc.).

 Identificación automática de modelos

El procedimiento de identificación (especificación de la transformación


estacionaria y de los órdenes de los polinomios en el operador retardo)
automática de un modelo univariante constituye una de las utilidades más
sobresalientes del programa.

A este proceso de identificación automática se le puede incorporar cualquiera


de las prestaciones que se han tratado en puntos anteriores, como detección
de atípicos, reconstrucción de observaciones ausentes, tratamiento del efecto
calendario, etc.

114
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.1.3.3. Principales conclusiones

En función de todo lo expuesto anteriormente, cabe concluir que el principal


potencial que para un usuario puede tener el programa TRAMO, se puede
desglosar en tres apartados:

A) Como rutina de modelización automática. Este es, sin duda, un aspecto


de gran utilidad, para cualquier tipo de usuario.

B) Como herramienta útil en muchos de los aspectos relacionados con el


análisis univariante de series temporales. TRAMO ofrece un amplio conjunto de
opciones e instrumentos que cubren las operaciones más frecuentemente
involucradas en este tipo de estudios.

C) En interconexión con el programa SEATS.

En definitiva, cabe concluir en que su potencial es evidente, sobre todo cuando


se pretende una automatización completa del proceso de modelización y
extracción de señales de una serie temporal.

115
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.1.4. El programa SEATS

16.1.4.1. Conceptos básicos

El objetivo fundamental del programa SEATS es la extracción de señales a


partir de una serie temporal.

El programa descompone una serie que sigue un modelo ARIMA en varias


componentes. La descomposición puede ser aditiva o multiplicativa.

Las componentes consideradas en SEATS son: tendencia, componente


estacional, ciclo y componente irregular.

La tendencia representa la evolución a largo plazo de la serie y presenta un


pico en la frecuencia 0. El componente estacional recoge los picos espectrales
en las frecuencias estacionales y el ciclo recoge la fluctuación periódica con
período mayor que un año. También puede incorporar desviaciones
estacionarias con respecto a la tendencia. Finalmente, el componente irregular
recoge el comportamiento errático, del tipo ruido blanco, y tiene por tanto un
espectro plano. Los componentes vienen determinados y se deducen
plenamente de la estructura del modelo ARIMA (agregado) de la serie
observada, que puede ser identificado directamente a partir de los datos.

El modelo tratado por SEATS es el de una serie integrada lineal con


innovaciones gaussianas. Como esta hipótesis puede que no se cumpla y
siempre es necesario un modelo, SEATS ha sido diseñado para ser usado
conjuntamente con el programa TRAMO, que ha sido descrito más arriba.

16.1.4.2. La extracción de señales

Tradicionalmente, en el análisis estadístico de una serie temporal (Zt) se


consideran cuatro tipos de componentes:

 Tendencia, que recoge la evolución subyacente de la serie

 Estacionalidad, que condensa las oscilaciones sistemáticas cuasi


regulares de la serie dentro del año

 Ciclo, que aglomera desviaciones sistemáticas respecto de la tendencia


de la serie ajustada de estacionalidad

 Irregular o ruido residual

116
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.1.4.3. La metodología SEATS

La forma de actuar de SEATS, en lo que se refiere a la extracción de señales,


requiere los siguientes pasos:

 Especificación de un modelo para la serie observada de entre la familia


de modelos definida en el apartado anterior para TRAMO
 Descomposición de la parte ARIMA en modelos ortogonales para cada
uno de los componentes
 Asignación de las variables determinísticas a los componentes en
función de la naturaleza de los efectos modelizados
 Estimación de los distintos componentes, basada en la metodología de
extracción de señales
 Diagnosis de los resultados obtenidos y cálculo de variables de interés
relacionadas

Por tanto, el primer paso es ajustar un modelo a los datos. Existen tres
posibilidades:

 Introducir un modelo especificado por el usuario

 Utilizar el modelo automático ajustado por TRAMO

 Estimar el modelo por defecto del programa SEATS, el “modelo de las


líneas aéreas”

En muchas de las aplicaciones este último planteamiento es suficientemente


aceptable. Pero cuando las series tengan una modelización compleja por la
existencia de observaciones ausentes, atípicos, etc., lo óptimo, será recurrir al
programa TRAMO para obtener un modelo de partida para SEATS.

Otros aspectos relacionados con el modelo ajustado y su análisis, como la


posibilidad de tomar o no logaritmos, estimación, predicción, etc., también se
contemplan de forma independiente en SEATS.

Una característica sobresaliente del programa es la posibilidad de asignar las


distintas variables de regresión al componente al que el usuario considere que
correspondan, realizando el programa automáticamente los ajustes que la
teoría impone sobre las variables para su adaptación. Esta facilidad se muestra
aún más atractiva si el fichero de entrada proviene de TRAMO, pues en este
caso todas las variables de regresión introducidas automáticamente en el
modelo, tales como el efecto calendario, atípicos, etc., tendrán asignados los
componentes a los que corresponden sin que el usuario deba preocuparse por
ello.

117
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.1.4.4. Salidas del programa

 Gráficos y vectores auxiliares

La presentación y la forma de operar del programa en este apartado es


equivalente a la ya descrita cuando se ha descrito el programa TRAMO. De
nuevo permite la cómoda visualización de los principales resultados de interés.
Estos se subdividen en cinco menús que agrupan las principales prestaciones
que cubre el programa:

A) Menú Series: Serie original y transformada, residuos, tendencia,


estacionalidad, serie ajustada de estacionalidad, pseudo-innovaciones de los
modelos parciales de los componentes, tasas de crecimiento, etc.
B) Menú ACF.
C) Menú Espectro.
D) Menú Filtro: Todos los filtros y pesos utilizados en la descomposición.
E) Menú Predicción: Predicciones de la serie original con sus bandas de
confianza, serie transformada, tendencia y estacionalidad.

Todos los resultados obtenidos, y en particular todos los correspondientes a los


gráficos anteriores, se almacenan de forma ordenada, siendo posible su
recuperación de forma simple para tratamientos posteriores en otros entornos.

 Resultados del programa

Aparte de la información anterior, al igual que en TRAMO, en el fichero output


aparece toda la información fundamental relativa a la aplicación que SEATS ha
ejecutado. En este caso, dada la enorme cantidad de información que SEATS
puede generar y su compleja interpretación, sí que puede resultar conveniente
controlar el tipo de salida.

La salida muy reducida permite una rápida y fácil inspección para comprobar
que tanto el modelo estimado como los componentes obtenidos son
adecuados. La opción reducida proporciona, básicamente, un listado de todas
las series de interés, un resumen de la estimación del modelo, un estudio
detallado de los residuos, los modelos de los componentes, señales extraídas y
errores de revisión. Por otro lado, la opción detallada amplía la anterior
permitiendo, además, el seguimiento de todo el proceso que haya tenido lugar.

118
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.1.4.4. Conclusiones sobre SEATS

El programa SEATS se puede considerar una potente, rápida, sólida y


metodológicamente novedosa herramienta que cubre perfectamente el objetivo
para el que fue creado: la extracción de señales.

Es habitual utilizar la extracción de señales como herramienta para otros


estudios, por ejemplo de coyuntura. En este caso el programa permite una fácil
exportación de vectores de datos para tratamientos personalizados en otros
entornos.

16.1.5. Conexión entre TRAMO y SEATS

Hasta ahora se ha descrito el funcionamiento independiente de TRAMO y


SEATS. Sin embargo, es en su funcionamiento conjunto donde la potencialidad
de los programas se revela más claramente. La interconexión entre ambos
entornos es un aporte en sí mismo.

Una de las posibilidades más atractivas que aporta el uso conjunto de estos
programas es su habilidad para llevar a cabo de forma automática el
tratamiento completo y masivo de series temporales. En tal caso, TRAMO
genera automáticamente un modelo y el fichero de entrada para SEATS con
los parámetros adecuados. Problemas de incompatibilidad, como por ejemplo
modelos generados por TRAMO con descomposición no admisible en SEATS,
son solucionados automáticamente.

Las opciones que activan el proceso automático comparten lo siguiente:

 Contraste sobre la transformación logarítmica


 Identificación y corrección de observaciones atípicas (aditivos,
transitorios y cambios de nivel)
 Identificación y estimación por máxima verosimilitud exacta del modelo
ARIMA
 Interpolación de observaciones ausentes
 Predicción de las series
 Descomposición del modelo; si éste no admite una descomposición
admisible, se utiliza una aproximación
 Estimación y predicción de las señales
 Diagnóstico e inferencia asociados con la descomposición.

Existe, además, la opción de contrastar el efecto Semana Santa y el efecto


calendario así como la posibilidad de que el proceso de identificación del
modelo sea rápida y sencilla o bien más cuidadosa y completa.

119
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Resumen

El programa TRAMO ofrece un amplio abanico de instrumentos que cubren las


etapas de identificación, estimación, diagnóstico y predicción con modelos
ARIMA.

Entre las aportaciones fundamentales de TRAMO merece una mención


especial la rutina de identificación automática de modelos. Otras herramientas,
como las relacionadas con la detección y modelización de atípicos son también
eficientes y novedosas desde el punto de vista metodológico.

El programa SEATS implementa de manera eficiente la metodología de


extracción de señales basada en modelos univariantes de forma reducida y
debe considerarse como un valioso instrumento para el análisis de coyuntura y
de política económica.

Es sin duda en la utilización conjunta de TRAMO y SEATS donde se


encuentran las mayores potencialidades de estos programas, ya que su fácil
interconexión permite una automatización prácticamente completa del análisis
de una serie temporal.

16.2. Descripción de las principales componentes e instrucciones

16.2.1. Ventana principal

Barra de tareas

120
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Como se muestra en la imagen adjunta, la ventana principal del software TSW


está compuesta por:

 Barra de Tareas (Tools Bar)


 Navigation Tree
 Campos de Atributos de las Series (Attributes fields)
 Iter Parameter
 Opción de Programas (Programs Option)

A continuación se describen cada uno de estos elementos.

 Barra de tareas (Tools Bar):

La Barra de Tareas contiene los siguientes botones:

 Series: Permite cargar uno o varios ficheros con series temporales de


datos
 +Model: Permite especificar un modelo para las series seleccionadas
 ++Model: Permite especificar un modelo (el mismo) para todas las
series cargadas en el navigation tree
 Run: Ejecuta los programas Seats/Tramo
 Output, Out-Tables, and Out-Matrix: Visualiza los ficheros estándar de
salida (output) de los programas Seats/Tramo
 Graph: Muestra los gráficos obtenidos en la ejecución de los programas
 Save: Permite guardar el “navigation tree” en un fichero (*.gbf)
 Load: Carga un tree guardado
 DbXplore: Es el gestor de una herramienta de una pequeña base de
datos (Db).
 About: Muestra la información del programa

Además en la primera pantalla aparecen los siguientes elementos:

 Atributos de las series (Series Attributes):


 Nombre (Name)
 Número de observaciones ( #of Observations) (NZ; incluye las que
faltan)
 Año de inicio (Starting Year)
 Número correspondiente al periodo de la primera observación (First
Observation Period) (Por ejemplo, para series mensuales: 1 para enero,
2 para febrero, etc.)
 Parámetro MQ (Parameter MQ): Número de observaciones por periodo
(12 si es mensual, 4 si es trimestral, etc.)

121
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Iter Parameter: Admite las posibilidades siguientes:

 Iter = 0 Una serie y especificación de un modelo (caso normal).


 = 1 Una serie y varias especificaciones del modelo.
 = 2 Muchas series y una especificación del modelo común a todas ellas
(la especificación puede ser simplemente un procedimiento automático).
 = 3 varias series y una especificación del modelo para cada una.

 Opción de programa (Program option):


 Seats: Se ejecutará solo SEATS
 Tramo: Se ejecutará solo TRAMO
 Tramo/Seats: Se ejecutarán ambos programas (caso normal).
 Terror: Se ejecutará el Programa TERROR.

 Ejecutar sobre un intervalo (Run on Interval):

Para una serie con observaciones en t = 1,….,NZ, es posible seleccionar un


intervalo del periodo muestral, y ejecutar TSW solamente para ese intervalo. El
intervalo empieza en la observación "First Obs", y termina en "Last Obs".

16.2.2. Entrada de datos y especificación del modelo

Una vez ya dentro del programa con el ejecutable TSW, para cargar una serie
temporal basta con hacer clic en el botón Series. Como se muestra en la figura
adjunta, el programa abre una ventana donde es posible seleccionar el fichero
que contiene la serie deseada.

122
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

La lista inicial de ficheros de datos aparece dentro de la carpeta donde se haya


incluido el programa TSW, normalmente en el directorio C:\Program
Files\Tsw\Series. Si el fichero de datos está en otra carpeta, se busca el fichero
moviéndose por las carpetas como se hace habitualmente en Windows.

TSW acepta dos tipos de formato del fichero de datos: texto o Excel.

123
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Para el caso más usual de disponer de los datos en Excel es importante citar lo
siguiente:

 Cada columna corresponde a una serie

 La primera fila de cada columna del fichero de datos debe contener el


nombre de las serie correspondiente

 La segunda fila debe contener los cuatro números siguientes separados


por un espacio: El número total de observaciones; Año de inicio; periodo
de comienzo de la serie dentro del año de inicio y finalmente, número de
observaciones por año.

 Las filas restantes deben contener los correspondientes datos (uno por
fila).

Ejemplo: Si solo existe una serie denominada precio que es mensual, empieza
en febrero de 1972 y termina en diciembre de 2005, en el fichero de datos
Excel, existirá una sola columna y las 2 primeras filas serán las siguientes:

precio
395 1972 2 12
A partir de la fila tercera se incluye ordenadamente en cada fila el
correspondiente valor de la serie temporal precio.

Como se muestra en la ventana principal, la serie seleccionada se incorpora al


Navigation Tree.

124
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Especificación del modelo

Para el caso usual de seleccionar una sola serie se muestra a continuación el


proceso de las operaciones necesarias para especificar y ejecutar el modelo.

Haciendo click en el botón Model (Model Button), que está activo solamente
en el caso de que una serie haya sido seleccionada, el programa muestra una
ventana con sucesivas páginas que permiten seleccionar los parámetros de
entrada (input) que definen el modelo.

La ventana contiene tres páginas con los parámetros de entrada (input


parameters). Es importante conocer que se dispone siempre de una ayuda
para entender el significado de cada uno de dichos parámetros, tecleando F1
después de seleccionar el correspondiente parámetro.

16.2.3. Procedimiento automático

La primera página de la ventana que define los parámetros del modelo,


contiene propiamente el Procedimiento automático que está controlado por
los parámetros RSA. Dicho parámetro RSA para el procedimiento automático
puede tomar 5 valores, del 1 al 5 (el valor = 0 corresponde al caso de no utilizar
el proceso automático).

Es aconsejable, por su carácter más general (ya que sin ninguna restricción
sobre la especificación del modelo ARIMA, se contrastan todos los posibles
efectos: Calendario, Semana Santa, bisiestos, etc.), utilizar las alternativas 4 o
5 para RSA que se diferencian nada más en la forma de especificación del
efecto calendario.

Cabe indicar que las configuraciones automáticas correspondientes a cada


valor del parámetro RSA pueden modificarse posteriormente incorporando los
nuevos valores de los parámetros.

A continuación se describe las especificaciones correspondientes a cada valor


de RSA en el procedimiento automático.

 = 0: Parámetro no activo.

 = 1: Como RSA = 3, pero el modelo de líneas aéreas (Airline) es usado


siempre por defecto.

 = 2: Como RSA = 4, pero el modelo de líneas aéreas (Airline) es usado


siempre por defecto.

125
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 = 3: El programa contrasta la especificación de logaritmo o nivel


(log/level) e interpola las observaciones que faltan (si existen) y realiza la
identificación automática del modelo y la detección de los atípicos
(outliers). Tres tipos de atípicos son considerados: aditivos, cambios
transitorios y escalones. El nivel de significación para los atípicos es
determinado por el programa y depende del número de observaciones o
longitud de la series. Se estima el modelo completo por máxima
verosimilitud y se realizan previsiones para un horizonte de dos años. El
modelo se descompone en sus componentes y se obtienen estimadores
óptimos y previsiones de dichas componentes, así como del error
cuadrático medio. Estas componentes son la tendencia-ciclo, estacional
e irregular y en ocasiones la componente transitoria. Si no fuera posible
una descomposición admisible, se sustituye por un modelo que sí lo
admita.

 = 4: Como en el caso anterior pero se realiza un precontraste por la


presencia de días de trabajo (efecto calendario), año bisiesto y Semana
Santa con el primer efecto definida como una sola variable o parámetro
(día de trabajo/no trabajo).

 = 5: Como RSA = 4, pero la especificación del efecto calendario usa 6


parámetros (cada día de la semana puede ser diferente).

Es importante indicar que las configuraciones automáticas correspondientes al


parámetro RSA pueden modificarse, una vez establecidos los parámetros RSA,
mediante la introducción de los nuevos parámetros modificados.

126
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.2.4. Parámetros del modelo

La segunda y tercera páginas del modelo contienen, respectivamente, a los


parámetros específicos del modelo ARIMA y otros parámetros relevantes
(ARIMA Model parameters y Others)

127
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Comprobación y modificación de los Parámetros de entrada (Input


Parameters)

Una vez que los parámetros de entrada que especifican el modelo han sido
introducidos, seleccionando “Model 0“ en el Navigation Tree y haciendo clic con
el botón derecho del ratón, aparece la opción Show Parameters List como se
muestra en la figura siguiente.

Esto nos permite, por tanto, haciendo click en Edit, modificar los valores de los
parámetros, por ejemplo, el valor de RSA (Default corresponde a la opción por
defecto).

16.2.5. Variables de regresión y análisis de intervención

Para introducir variables de regresión en nuestro modelo, como por ejemplo es


el caso de realizar un análisis de intervención sobre atípicos (outliers en los
residuos), el procedimiento es el siguiente:

En general, las variables de regresión se introducen como vectores columna de


números (en la primera fila estaría el primer valor) en formato texto o en Excel.
La variable debe estar extendida hasta el final del periodo de predicción.

Cuando IUSER = -1, pueden introducirse conjuntamente varias variables de


regresión como una matriz en formato texto o como varias columnas en un
fichero Excel, figurando:

 1ª Columna: 1ª variable de regresión


 2ª Columna: 2ª variable de regresión
 Y así sucesivamente.

Con mayor detalle, en la página 3 ("Others…"), con el valor de IREG = k > 0, se


muestra una nueva ventana que nos permite caracterizar las denominadas
variables de regresión (regression variables) y sus parámetros asociados.

128
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Admite las posibilidades siguientes.

− Cuando IUSER = 1 el usuario introduce la variable de regresión,


observación por observación y en este caso NSER = 1. Mediante REGEFF
se determina a cuál componente de SEATS se asigna la variable de regresión.
No debe olvidarse que deben completarse los valores de la variable de
regresión también para el periodo de previsión (ILONG = NZ + FORECAST
HORIZON). Haciendo click en el campo "Regression", se muestran las celdas
para poder introducir la variable.

− Cuando IUSER = - 1, las variables de regresión son leídas de un fichero. Este


fichero debe ser una matriz con ILONG filas y k columnas. Cada columna
representa una variable de regresión. Establecemos NSER = k y los valores de
REGEFF and ILONG correspondientes. Haciendo click con el botón derecho
del ratón (r.m.b.) en el campo "Regression", y posteriormente en el comando
"OpenFile", se abre una ventana que nos permite cargar el fichero con las
variables de regresión del directorio que lo contiene.

− Cuando IUSER = 2, k outliers son considerados (k = 1, 2, …). Solamente


se necesita introducir NSER = k, y haciendo click en el campo en blanco, se
muestra la ventana siguiente.

129
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Se introduce cada outlier en una fila que debe contener dos números. El
primero nos indica la posición del outlier (número de observación), y el segundo
define el tipo de outlier (AO: Outlier Aditivo (Additive); TC: Cambio Transitorio
(Transitory Change); LS: Cambio de Nivel (Level shift)).

− Cuando IUSER = - 2 la variable de regresión contiene un vector (array) con


festivos (holidays), que se combina con la variable Trading Day. Nos sirve para
estimar el denominado efecto calendario. Debe establecerse NSER e ILONG, y
haciendo click en el campo en blanco, el usuario puede introducir los festivos
(holidays) o, leerlo de un directorio mediante el r.m.b.

− Cuando IUSER = 0 la variable de regresión es una variable de intervención


construida por el programa. Cada variable de intervención tiene que ser
introducida como una variable de regresión separada.

Después de establecer REGEFF, NSER=1, e ILONG, el parámetro ISEQ = k


nos indica que la variable de intervención contiene k secuencias de unos.
DELTA = d indica que el operador 1/(1-dB) se aplica a estas secuencias de
unos, DELTAS = ds indica que el operador 1/(1 - dsBs) se aplica a las
secuencias de unos, y ID1Ds = 1, que se aplica a dicha secuencia el operador
1/∇∇s. Haciendo click en el campo en blanco, introducimos las secuencias de
unos. La primera columna contiene la posición donde comienza la secuencia y
la segunda contiene la longitud de la secuencia.

Ejemplo: Se parte de una serie mensual con 161 observaciones. Se introduce


una variable de intervención como regresor. Para cada variable de
intervención, NSER = 1, e ILONG = 161 + 24 = 185 (cabe recordar que 24 es el
número de elementos de la predicción por defecto para series mensuales).

130
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

A continuación se muestra la pantalla con los datos input de entrada de esta


variable. Se observa que existen dos secuencias de unos (ISEQ=2). La primera
corresponde a un cambio de nivel en la observación 21 (starting position) ya
que DELTA=1 y la duración es de un solo periodo.

Asimismo, existe un efecto rampa que comienza en la posición 85 y se


desarrolla a lo largo de 5 meses ya que DELTA=1 y la duración (length) es de 5
periodos.

En el programa SEATS la variable se asigna a la componente ciclo-tendencia


(REGEFF=1).

131
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.2.6. Ejecución de los programas y ficheros output de resultados

 Estimación del modelo

Una vez que el modelo ha sido especificado en su totalidad, para estimarlo y


ejecutar los programas TRAMO y/o SEATS, se marca el nombre de la serie en
el Navigation Tree, y se hace click en el icono RUN. Cuando se termina la
estimación el Navigation Tree (expandido) es el siguiente.

La parte situada por encima de “ Θ − Preadjusted Series” se refiere al


programa TRAMO, mientras que parte situada por debajo corresponde al
programa SEATS. Asimismo, la primera vez que aparece el nombre de la serie
hace referencia a las series originales mientras que la segunda vez se refiere a
la serie preajustada (linearized).

El primer modelo contiene el fichero input para TRAMO, mientras que el


modelo segundo contiene el fichero input que se ha creado para SEATS.

 Principales Ficheros de resultados (Output Files)

Los ficheros output se encuentran en los directorios:


PROGRAMFILES\TSW\OUTPUT\TRAMO
PROGRAMFILES\TSW\OUTPUT\SEATS
Con el nombre igual al “mismo nombre de la serie.out” ("seriesname.out")
siendo series name el nombre de la serie que aparecía en la primera fila del
fichero de datos.

En TRAMO existen tres ficheros de resultados:

 Output file
 Out-tables
 Summary output

132
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Es importante recordar que cada vez que TSW se vuelve a iniciar, los ficheros
del directorio OUTPUT son borrados. Por ello en el caso de que se desee
utilizarlos posteriormente deben copiarse en otro directorio antes de salir del
programa.

 OUTPUT FILE

Una vez ejecutado el modelo, cuando se marca el nombre de la primera serie,


haciendo click en el icono OUTPUT, se obtiene el fichero output (output file) de
TRAMO.

Análogamente, cuando se marca el nombre el nombre de la serie en la parte


inferior del Navigation Tree, haciendo click en el icono OUTPUT, se obtiene el
fichero output de SEATS.

Los dos ficheros output se almacenan en los directorios OUTPUT\TRAMO y


OUTPUT\SEATS, con el mismo nombre: “seriesname.out”.

 OUT-TABLES

Una vez marcado el nombre de la serie en la parte superior, haciendo click en


el icono OUT-TABLES, se muestra un fichero que contiene las variables
producidas por TRAMO, extendidas con las previsiones.

Las columnas contienen las variables siguientes:


Columna 1ª: Fecha de la observación
Columna 2ª: Series Originales
Columna 3ª: Series Interpoladas
Columna 4ª: Series preajustadas
Columna 5ª: Residuos (TRAMO)
Columna 6ª: Media Determinística
Columna 7ª: Efecto Trading day (y año bisiesto, si existe)
Columna 8ª: Efecto Semana Santa (Easter)
Columna 9ª: Outliers Aditivos
Columna 10ª: Cambios Transitorios
Columna 11ª: Cambios de Nivel

133
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Cuando aparece por segunda vez marcado el nombre de la serie, haciendo


click en el icono OUT-TABLES, se muestra un fichero con las series producidas
por SEATS, extendidas a lo largo del periodo de previsión.

 Summary Output para cada serie:

En el caso ITER=0 (una serie, un fichero input) el fichero Summaryt.txt es


disponible en OUTPUT. Contiene el siguiente resumen de los resultados de
TRAMO (Summaryt.txt):

 Input Parameters

Especifica los parámetros introducidos por el usuario

Model Fit

Contiene diversos tests como los siguientes:

Nz: Número de observaciones en la serie.


Lam:
Mean:
p,d,q,bp,bd,bq: Órdenes (P, D, Q) (BP, BD, BQ)s del modelo ARIMA estimado
SE(res): Desviación típica de los Residuos.
BIC: Criterio Bayesino de Información.
Q-val: Estadístico Ljüng-Box-Pierce para la autocorrelación de residuos
N-test: Estadístico Bowman-Shenton para la Normalidad de los residuos.
SK(t): t-value para Ho: Sesgo de los residuos = 0.
Kur(t): t-value pars Ho: Kurtosis de los residuos = 3.
QS: Estadístico Pierce para autocorrelación estacional en los residuos.
Q2: Q- Estadístico para autocorrelación en los cuadrados de los residuos.
Runs: t-test para rachas (aleatoriedad) en los signos de los residuos.

134
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Parámetros ARMA

Efectos determinísticos (total)

TD: Número de variables Trading Day (incluyendo (Año Bisiesto)


EE: Presencia/ausencia de efecto Semana Santa (Easter)
# OUT: Número total de Outliers
AO: Número de outliers Aditivos
TC: Número de outliers Cambio Transitorio
LS: Número de outliers cambio de Nivel
REG: Número de variables de regresión (adicionales)
MO: Número de observaciones que faltan.

Efecto Calendario
TD1, …. ,TD6: Estimaciones de los efectos de las 6 variables Trading Day
LY: Estimación del efecto del año bisiesto
EE: Estimación del efecto Semana Santa

También se indican los t-values.

Outliers

Se enumeran los outliers detectados y corregidos; primeramente los Outliers


Aditivos, después, cambios transitorios, y finalmente, cambios de nivel. Se dan
la fecha y su t-value para cada outlier.

Variables de Regresión

Las variables de Regresión (su número = IREG) son enumeradas en el orden


en que fueron introducidas. También se muestran las estimaciones de los
coeficientes y sus t-values.

 Out-matrix:

Cuando se ejecuta TSW con un input conteniendo varias series y/o varios
modelos (caso de ITER ≠ 0) no se generan los ficheros summary.txt. En su
lugar, el resumen de resultados se almacena bajo el icono Out Matrix.

135
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.2.7. Gráficos

Haciendo click en el icono GRAPH se dispone de numerosos tipos de gráfico


producidos por Seats/Tramo que pueden visualizarse, imprimir o grabar.

La ventana está dividida en Navigation Tree (similar al de la ventana principal)


y Plotting Area. Es posible expandirlo o reducirlo haciendo clic sobre él.

Los gráficos se dividen en las clases siguientes: SERIES, ACF, FILTERS,


SPECTRA, FORECAST, y REGOUTSE

Por ejemplo, haciendo clic en SERIES se dispone de los tipos de gráficos que
se muestran en la imagen siguiente:

Existen diversas posibilidades para cambiar el aspecto de los gráficos: Cambio


de las fuentes y el color del título, cambio de escala, transformarlo en 3
dimensiones, etc.

136
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

16.2.8. Otras utilidades

 Grabar/Cargar (SAVE / LOAD)

Haciendo click en el icono SAVE, se graba el navigation tree en un fichero


(*.gbf). De esta forma pueden grabarse las series con sus modelos y son
almacenadas en el directorio PROGRAM FILES\TSW\SAVED).

Haciendo click en el icono LOAD, se muestran los ficheros .gbf en el directorio


SAVED (o en otro directorio donde estuvieran almacenados) y pueden
incorporarse al Navigation Tree.

También los ficheros guardados como Excel en out-Tables o out-Matrix, son


almacenados por defecto en el directorio SAVED.

 Caso de varias series y/o Modelos: parámetro ITER (ITER parameter)

Todo lo anteriormente visto se refiere al caso más usual de una serie y un


modelo. Existen otras posibilidades que se muestran a continuación:

ITER = 1: Una serie; varias especificaciones de modelos:


Después de establecer ITER = 1 y seleccionar una serie, se introducen los
modelos haciendo click en el botón MODEL++. Haciendo click en RUN, se
estiman todos los casos.

ITER = 2: Varias series; una especificación de modelo:

Después de establecer ITER = 2, varias series pueden seleccionarse,


presionando la tecla Ctrl y haciendo click en las series. Haciendo click en
MODEL++, se introduce una especificación del modelo que es la misma para
todas las series.

Haciendo click en RUN, se modelizan todas la series.

ITER = 3: Varias series; cada una con una especificación de modelo diferente:

Después de establecer ITER = 3, varias series pueden seleccionarse, cada una


con un modelo diferente. Para cada serie, MODEL+ establece la especificación
del modelo.

137
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

17. CASOS PRÁCTICOS


17.1. Tráfico aéreo

17.1.1. Fuente y descripción de los datos

El primer caso práctico que se presenta a continuación corresponde al análisis


estadístico de la serie mensual del número de pasajeros (expresado en miles)
en el transporte aéreo interior para los aeropuertos españoles. Los valores
correspondientes a esta serie se pueden encontrar dentro de la página web
siguiente donde se muestran numerosas series temporales de la economía
española.

http://serviciosede.mineco.gob.es/Indeco/BDSICE/Busquedas/Busquedas_new.
aspx

En concreto la serie TRAFICO AEREO INTERIOR TOTAL. PASAJEROS está


incluida en el grupo 2: Indicadores de Producción y Demanda Nacional y
servicios.

Con el número 245120 y tiene carácter mensual. Abarca desde enero de 1980
hasta diciembre de 2007 con un total de 336 observaciones.

17.1.2. Modelización automática

Se ha utilizado el software TSW que abarca los programas TRAMO y SEATS


para efectuar la modelización de la serie temporal mensual correspondiente al
tráfico interior de pasajeros en los aeropuertos españoles.

Dentro del programa TRAMO se ha utilizado el modo automático para


identificar y estimar el modelo. Asimismo, para determinadas aplicaciones,
especialmente gráficos de la serie y de sus correspondientes diferencias
regulares y estacionales, se ha utilizado EXCEL.

Como se ha descrito anteriormente, la primera página de la ventana que define


los parámetros del modelo, contiene el Procedimiento automático que está
controlado por los parámetros RSA.

Es aconsejable, por su carácter más general (ya que sin ninguna restricción
sobre la especificación del modelo ARIMA, contrasta todos los posibles efectos:
calendario, Semana Santa, bisiestos, etc.), utilizar las alternativas 4 o 5 para
RSA que se diferencian nada más que en la forma de especificación del efecto
del ciclo semanal ya que en el primer caso estima mediante una sola variable el
efecto de los días laborables (de lunes a viernes) mientras que en el segundo
estima el efecto de cada día por separado respecto al domingo (seis variables).

138
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Cabe indicar que las configuraciones automáticas correspondientes a cada


valor del parámetro RSA pueden modificarse posteriormente incorporando los
nuevos valores de los parámetros. Así por ejemplo, entre otras cuestiones se
ha modificado el nivel de confianza para la estimación de outliers.

En este ejercicio después de contrastar diversas alternativas se ha optado por


el valor de RSA= 4.

También se ha utilizado este programa para obtener las FAS y FAP de la serie
temporal original, de la serie obtenida mediante la aplicación de logaritmos, de
las series derivadas de la original mediante la aplicación de diferencias
regulares y/o estacionales, etc. Para ello basta con modificar los parámetros
que existen por defecto en el programa, incluyendo en su lugar los nuevos,
correspondientes al nuevo modelo que se estima en cada ocasión.

En los siguientes apartados se ofrecen los principales resultados de la


aplicación del programa TRAMO en modo automático a la serie seleccionada.

17.1.3. Transformaciones para conseguir estacionariedad

10000

9000

8000 Evolución del tráfico aéreo interior de viajeros en España (Miles de pasajeros)
7000

6000

5000

4000

3000

2000

1000

0
ene-80
ene-81
ene-82
ene-83
ene-84
ene-85
ene-86
ene-87
ene-88
ene-89
ene-90
ene-91
ene-92
ene-93
ene-94
ene-95
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-06
ene-07

Meses

Dentro de la etapa de identificación del modelo, que constituye la primera fase


del proceso de modelización, el análisis del gráfico adjunto donde se
representa la evolución mensual de los pasajeros en transporte aéreo interior
(realizado en Excel) nos muestra los siguientes hechos:

a) Parece existir una variabilidad proporcional a la media. Esta última


característica desaparecería al transformar logarítmicamente los datos.

b) Parece que existen diversas tendencias a lo largo del periodo analizado.


Para solucionarlo existe la alternativa de aplicar el operador diferencia regular.

c) Existe un ciclo estacional que se pone de manifiesto con un mayor volumen


de viajeros durante los meses de verano. Para solucionarlo existe la alternativa
de aplicar el operador diferencia estacional.
139
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Otros posibles efectos que deben considerarse son los siguientes:

d) La celebración de la Semana Santa en diferentes meses (marzo o abril)


puede tener consecuencias sobre el movimiento de pasajeros en dichos
meses.

e) El diferente número de días laborables en cada mes puede tener también su


repercusión sobre el número de pasajeros. Este efecto, denominado
comúnmente "calendario", se manifiesta, por ejemplo, en el caso del mes de
febrero de los años bisiestos que tiene un día más que los demás años.

Asimismo, en los gráficos adjuntos que muestran las FAS y FAP de la serie
original, se observa la existencia de una amplia estructura en sus elementos
que nos confirma la necesidad de realizar diversas transformaciones para
conseguir estacionariedad. Estos gráficos no son imprescindibles para la
modelización ya que lo que nos interesa es la FAS y FAP de los residuos del
modelo final y están realizados en TRAMO. Para obtenerlos, el procedimiento
(un poco complicado es el siguiente: Hacemos click en la pestaña model con
RSA=0, y a continuación en la pestaña Arima Model. Una vez allí se pone 0 en
P; Q; D; BP; BQ; y BD. Después run este model y en la pestaña graph dentro
del directorio ACF tenemos los gráficos buscados: acf of residuals y partial acf
of differenced series que coinciden con los correspondientes acf y partial acf de
la serie original ya que hemos puesto las diferencias regular y estacional = 0,
es decir sin diferencias. Realmente lo que estamos haciendo es estimar un
modelo sin diferencias y sin estructura alguna y por ello coinciden las funciones
de autocorrelación simple y la parcial de los residuos de este modelo con las de
la serie original.

Para evitar estos problemas, de acuerdo con la metodología Box-Jenkins para


el análisis de series temporales se realizan las siguientes transformaciones y
operaciones:

140
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

A) Utilización de los logaritmos de los valores de la serie primitiva con el


fin de reducir la posible heterocedasticidad.

10

Evolución del tráfico aéreo interior de viajeros en España


(Logaritmos de Miles)

7
ene-80
ene-81
ene-82
ene-83
ene-84
ene-85
ene-86
ene-87
ene-88
ene-89
ene-90
ene-91
ene-92
ene-93
ene-94
ene-95
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-06
ene-07
Meses

El análisis del gráfico adjunto (en EXCEL) donde se representa la evolución


mensual del logaritmo de la serie original ( Yt = Log(PAI t ) ) nos muestra que una
vez realizada dicha transformación ya no existe la heterocedasticidad de la
serie original. En este sentido, el procedimiento automático del programa
TRAMO corrobora la necesidad de efectuar dicha transformación.

Sin embargo, se siguen observando tendencias en media y estacionalidad.


Consecuentemente, se pasa a analizar: Yt = ∇∇12 Log(PAI t ) .

B) Aplicación de una diferencia regular y otra estacional con el objetivo


de eliminar, respectivamente, las tendencias en media y la estacionalidad.

Serie con una diferencia regular sobre logaritmo de la serie original


0,4
Evolución del tráfico aéreo interior de viajeros en España
0,3 (Diferencia regular de logaritmos)

0,2

0,1

0,0

-0,1

-0,2

-0,3

-0,4
feb-80
feb-81
feb-82
feb-83
feb-84
feb-85
feb-86
feb-87
feb-88
feb-89
feb-90
feb-91
feb-92
feb-93
feb-94
feb-95
feb-96
feb-97
feb-98
feb-99
feb-00
feb-01
feb-02
feb-03
feb-04
feb-05
feb-06
feb-07

Meses

El análisis del gráfico adjunto (en EXCEL o en GRAPH de TRAMO) donde se


representa la nueva serie, obtenida mediante la aplicación de una diferencia
regular a la transformada logarítmica de la serie original Yt = ∇Log(PAI t ) , nos
muestra que ya no existe ningún tipo de tendencia. En este sentido, el
procedimiento automático del programa TRAMO corrobora la necesidad de
efectuar dicha transformación. Sin embargo, se observa que sigue existiendo
estacionalidad con valores superiores en los meses de verano.
141
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Consecuentemente, se pasa a analizar: Yt = ∇∇12 Log(PAI t ) .

Serie con una diferencia regular y otra estacional sobre logaritmo de la serie original
0,25
Evolución del tráfico aéreo interior de viajeros en España.
0,20
(Diferencia regular y estacional de logaritmos)
0,15

0,10

0,05

0,00

-0,05

-0,10

-0,15

-0,20

-0,25
feb-81
feb-82
feb-83
feb-84
feb-85
feb-86
feb-87
feb-88
feb-89
feb-90
feb-91
feb-92
feb-93
feb-94
feb-95
feb-96
feb-97
feb-98
feb-99
feb-00
feb-01
feb-02
feb-03
feb-04
feb-05
feb-06
feb-07
Meses

El análisis del gráfico, adjunto (en EXCEL) donde se representa la nueva serie
obtenida mediante la aplicación de una diferencia estacional a la serie anterior
(diferencia regular del logaritmo de la serie original) nos muestra que no existe
ningún tipo de tendencia y se ha eliminado la estacionalidad. En este sentido,
el procedimiento automático del programa TRAMO (en el fichero output)
corrobora la necesidad de efectuar dicha transformación. Sin embargo, todavía
se observa la existencia de algunos residuos anómalos, como por ejemplo, en
los meses de celebración de Semana Santa –Marzo y abril-.

Asimismo, en los gráficos adjuntos (en TRAMO aparecen en la pestaña graph


con el nombre acf of differenced series y partial acf of differenced series) que
muestran las FAS y FAP de la serie derivada de la original mediante la
aplicación de una diferencia regular y otra de orden 12, se observa la existencia
de elementos significativos en las correspondientes al primer retardo y al
número 12 lo que nos podría sugerir un modelo IMA(1,1)xIMA(1,1)12 para el
ajuste óptimo de la serie.

142
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En definitiva, una vez obtenida la estacionariedad en la serie mediante la


aplicación de la transformación logarítmica y los operadores diferencia regular y
estacional, respectivamente, estamos en condiciones de identificar y estimar el
modelo ARIMA final que podría incluir otros efectos como Semana Santa móvil,
efecto calendario y existencia de atípicos.

17.1.4. Modelo final

Se ha utilizado el procedimiento automático de TRAMO para estimar el modelo.


Los parámetros de TRAMO utilizados por el programa en dicha estimación
automática aparecen en el correspondiente fichero output.

El programa identificó la presencia de una raíz unitaria en la parte regular de la


serie y de una raíz estacional, admitiendo, además, la transformación
logarítmica de la serie original, por lo que aplica el polinomio diferenciador (1-B)
(1-B12).

Finalmente, el modelo seleccionado y estimado, de acuerdo con el


procedimiento automático de TRAMO, tiene la siguiente expresión:

Log(PAI t ) = TD t + BI t + E t + O t + N t , donde Log(PAIt ) es el logaritmo del


número de pasajeros en vuelos interiores en España y las demás variables
representan los siguientes efectos:

 TDt ; BIt y Et recogen, respectivamente, los efectos de calendario


vinculados al ciclo semanal, años bisiestos y a la Semana Santa móvil.

 Ot representa una combinación de modelos de intervención asociados a


factores de tipo extraordinario que afectan a la serie de manera no
recurrente y que se suelen denominar atípicos (outliers).

 Nt caracteriza el comportamiento estocástico de la serie.

La expresión anterior constituye una descomposición preliminar de la serie en


una componente determinista, resultado de agregar los efectos de calendario e
intervención, y otra estocástica que representa los movimientos observados
asociados a la respuesta de un sistema lineal a una secuencia de innovaciones
de tipo ruido blanco.

A continuación se examina cada componente de la expresión anterior con


mayor detalle.

143
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Efecto del ciclo semanal y año bisiesto: TDt y BIt

Formalmente, el efecto del ciclo semanal se recoge a través de dos variables


de tipo determinista que representan, respectivamente, el efecto del ciclo
semanal (días laborables) y de los años bisiestos con 29 días en febrero.

Para la primera variable (TDt) TRAMO usa la expresión siguiente: número de


días de tipo j (laborables) en el mes t - (número de sábados y domingos en el
mes t) x 5/2, con j = lunes, ...,viernes.

De acuerdo con el procedimiento automático del programa TRAMO se han


considerado dos parámetros, correspondientes, respectivamente, al número de
días laborables y a los años bisiestos como variables explicativas del efecto
calendario. En la tabla siguiente se presentan los resultados de la estimación
(que aparecen, junto a su t-ratio y desviación típica (SE), en el fichero
output).que nos muestra la alta significatividad del variable relacionada con el
número de días laborables para explicar la evolución del tráfico aéreo interior.

Estimación del efecto calendario


Parámetro Estimación Desviación típica t-ratio
Laborables 0,00174 0,00044 3,98
Bisiestos 0,01934 0,01020 1,89

Las variables exógenas que hemos utilizado en este caso son un ejemplo de lo
que en Econometría se conoce como “efectos calendario”. Estos efectos son
muy importantes ya que, además de afectar a muchas variables económicas
(típicamente las ligadas al calendario laboral o a los hábitos de consumo, como
producción o ventas), tienen la ventaja de resultar exactamente predecibles.

 Efecto de la Semana Santa móvil

El efecto de la Semana Santa móvil se modeliza mediante la introducción de


una variable dummy, con el fin de aislar el efecto producido sobre el tráfico de
pasajeros a causa de que la celebración de la Semana Santa se realiza en
diferente mes (marzo o abril). Esta variable toma el valor 1 para el mes en el
que se celebra dicha festividad y cero para el resto de los meses. Debe
determinarse el número de días que se consideran incluidos en dicho efecto,
dato que es especialmente relevante en el caso de existir solapamiento de la
Semana Santa en los dos meses de marzo y abril.

Este efecto es representado por medio de un término lineal de la forma:


E t = γ P(τ )t donde P(τ)t expresa la proporción que representa la Semana Santa
en el mes t, habiéndose considerado que su efecto se percibe en los τ días
anteriores al Domingo de Resurrección. Se ha supuesto una duración de 6 días
(τ=6), como suele realizarse frecuentemente, de acuerdo con el procedimiento
automático.

144
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En la tabla siguiente se presentan los resultados (que aparecen como Easter,


junto a su tipo, t-ratio y desviación típica (SE), en el fichero output, una vez
realizada la modelización automática).de la estimación de este efecto,
obtenidos mediante el procedimiento automático del programa TRAMO.

Estimación del efecto de la Semana Santa móvil

Parámetro Estimación Desviación típica t-ratio


Et 0,0455 0,0067 6,80

Se aprecia un efecto positivo, claramente significativo de la Semana Santa


(aumento del 4,55% en el tráfico aéreo interior) y de mayor magnitud que los
efectos del ciclo semanal.

 Efecto asociado a sucesos atípicos: Ot

La expresión formal de los efectos asociados a sucesos atípicos, derivada del


análisis de intervención es:
k
O t = ∑ Vh (B )I tTh donde I tTh es una variable binaria de tipo impulso que adopta
h =1
un valor unitario en la observación Th y nulo en los restantes, siendo Th la
observación en que tiene lugar el acontecimiento atípico o extraordinario. El
filtro Vh (B ) recoge los efectos dinámicos asociados a la observación anómala.

En la tabla siguiente se presentan los resultados de la estimación de este


efecto, obtenidos mediante el procedimiento automático del programa TRAMO
(los valores de los outliers aparecen, junto a su tipo, t-ratio y desviación típica
(SE), en el fichero output, una vez realizada la modelización automática).

Estimación del efecto asociado a los atípicos


Desviación
Fecha Tipo Estimación t-ratio
típica
1991:02 Transitorio -0,173 0,0287 -6,03
1991:04 Aditivo 0,114 0,0261 4,36

Examinando la tabla anterior se aprecia que existen dos valores atípicos, de


carácter transitorio y aditivo (impulso), respectivamente, en los meses de
febrero y abril de 1991. Probablemente tienen relación con la denominada
guerra del Golfo que se desarrolló en esas fechas.

145
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Componente estocástico: Nt

El modelo para el componente estocástico, identificado y estimado mediante el


procedimiento automático del programa TRAMO, implica p=P=0 y d=D=q=Q=1,
esto es, el conocido modelo “de las líneas aéreas”, donde la especificación del
componente estocástico sigue una representación integrada y de medias
móviles (ARIMA) de tipo multiplicativo ARIMA (0,1,1)(0,1,1)12:

Nt =
(1 − θ1B )(1 − θ12 B12 )
(1 − B )(1 − B12 )
at

La estimación del modelo anterior por máxima verosimilitud exacta, utilizando el


procedimiento automático del programa TRAMO junto con todos los efectos
deterministas antes descritos nos ofrece los siguientes resultados para la parte
estocástica (los valores de los parámetros AR y/o MA, junto a su t-ratio y
desviación típica (SE) se muestran en el fichero output, una vez realizada la
modelización automática).

Estimación del modelo ARIMA de la parte estocástica


Desviación
Parámetro Estimación t-ratio
típica
θ1 –0,350 0,0531 –6,61
θ12 –0,556 0,0490 --11,32

Además, la desviación típica de los residuos (σa) es 0,0348 y la correlación


entre ambos parámetros es –0,0919.

Otra posible componente del modelo como es la media, no se muestra


significativamente distinta de cero (t-ratio= 0,8415), de acuerdo con los
resultados obtenidos en el procedimiento automático del programa TRAMO.

146
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

17.1.5. Diagnosis de los residuos del modelo

El análisis de los residuos obtenidos con el fin de corroborar la idoneidad del


modelo elegido se realiza a continuación.

 Gráfico de los residuos

0,139
RESIDUOS DEL MODELO DE TRÁFICO AÉREO INTERIOR
11-1996; 0,11159
0,104

0,070

0,035

0,000

-0,035

-0,070

-0,104

-0,139
7-1981
4-1982
1-1983

7-1984
4-1985
1-1986

7-1987
4-1988
1-1989
10-1983

7-1990
4-1991
1-1992
10-1986

7-1993
4-1994
1-1995
10-1989

7-1996
4-1997
1-1998
10-1992

7-1999
4-2000
1-2001
10-1995

7-2002
4-2003
1-2004
10-1998

7-2005
4-2006
1-2007
10-2001

10-2004

10-2007
El gráfico de los residuos obtenidos en la estimación automática puede llevarse
a cabo en EXCEL a partir de los valores de los residuos mostrados dentro de la
pestaña out tables en un fichero denominado summary tables o bien tomar en
TRAMO el gráfico de los residuals en la pestaña graph una vez realizada (run)
la modelización automática.

El análisis del gráfico adjunto (en EXCEL) donde se representa la evolución de


los residuos del modelo ajustado, junto a las bandas correspondientes,
respectivamente, a dos y tres veces la desviación típica de los residuos (0,035)
(valor obtenido del fichero output de TRAMO), nos muestra que siguen un
proceso de ruido blanco. En este sentido, en dicho gráfico se observa que solo
existe un valor atípico (outlier) de magnitud superior a tres veces la desviación
típica en Noviembre de 1996 y cabe recordar que al disponer de 336
observaciones en nuestra serie original, se aceptaría la existencia de ruido
blanco hasta con 3 residuos (el 1% del total de valores para dicho nivel de
significación) fuera de la banda de 3 veces la desviación típica y 15 (el 5% del
total de valores para dicho nivel de significación) fuera de las bandas de 2
veces la desviación típica.

147
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Gráfico de las FAS y FAP

Una vez estimado (run) el modelo en TRAMO utilizando el procedimiento


automático (RSA= 4 ó 5), en la pestaña graph aparecen numerosos gráficos.
Entre ellos nos encontramos con el acf of residuals que es la función de
autocorrelación simple correspondiente a los residuos de la estimación del
modelo adoptado. Sin embargo, TRAMO no ofrece directamente la función de
autocorrelación parcial de dichos residuos y dicho gráfico lo realizamos en
EXCEL con los valores correspondientes obtenidos en la estimación y que
TRAMO nos muestra en el fichero que tiene extensión out dentro de la pestaña
output. Dentro de este fichero encontramos estos valores denominados partial
autocorrelations (cuidado en no confundirse porque debajo de dichos valores
aparece una fila con los valores de su SE, la desviación típica).

El análisis de los gráficos siguientes donde se representan las FAS (de


TRAMO) y FAP (de EXCEL) de los residuos del modelo final ajustado nos
muestra que no hay indicios de estructura con una sola barra en esta última,
superior a 2 veces la desviación típica.

0,39

0,34 Función de autocorrelación parcial de los residuos del modelo final


0,28 del tráfico aéreo interior
0,22

0,17

0,11

0,06

0,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
-0,06

-0,11

-0,17

-0,22

-0,28

-0,34

-0,39

148
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Criterios para diagnosis de los residuos

A continuación obtenemos las magnitudes la desviación típica y media de los


residuos, los estadísticos de sesgo (skewness), kurtosis, Durbin-Watson, Ljung-
Box y de rachas. Todos ellos aparecen en el fichero output obtenido después
de la modelización automática en TRAMO.

En la tabla siguiente se muestran las magnitudes obtenidas para los diferentes


criterios de diagnosis de los residuos así como las correspondientes
magnitudes de referencia.

Cabe afirmar que los diagnósticos residuales no muestran ningún síntoma de


mala especificación. La desviación típica estimada de los residuos es 0,0348, la
media estimada de la serie de residuos no resulta significativamente distinta de
cero (t-value = 0,8415), el test de normalidad, así como los de sesgo y kurtosis,
no permiten rechazar la hipótesis nula de normalidad de los mismos (0,6279
frente a un valor crítico al 95 por ciento de 5,99), el estadístico de Durbin-
Watson es 2,01, el estadístico de Ljung - Box de orden 24 es 27,89 y los tests
de rachas sobre los residuos y sobre la función de autocorrelación no muestran
desviaciones sobre la aleatoriedad de los mismos.

Magnitudes de
Criterios Magnitudes
referencia
Desviación típica de los residuos: 0,0348 El menor valor posible
BIC (Criterio de Información Bayesiano): -6,6116 El menor valor posible
< 6 (95% de la chi
Normalidad: 0,6279 cuadrado con 2 grados
de libertad)
Valor absoluto < 2 x SE
Sesgo: -0,0506 (SE = 0,1374)
(<0,274)
Kurtosis 3,1927 (SE = 0,2747) < 3+2 X SE (<3,55)
< 34 (95% de la chi
Ljung-Box Q (24 autocorrelaciones): 27,89 cuadrado con 22 grados
de libertad)
< 6 (95% de la chi
Estadístico de Pierce: 0,94 cuadrado con 2 grados
de libertad)
< 34 (95% de la chi
Estadístico Q para los cuadrados de los
18,89 cuadrado con 22 grados
residuos:
de libertad)
<2 (95% del estadístico
Rachas en los residuos: T-VALUE= 1,0110
t)

149
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En resumen, el diagnóstico del modelo estimado, basado en el estudio de sus


residuos, ofrece los siguientes resultados:

A). Analizando las funciones de autocorrelación simple y parcial no se detecta


estructura dinámica en los residuos, como se puede ver en la representación
simbólica del correlograma extendido.

B). En el mismo sentido, el estadístico Q de Ljung y Box y los contrastes de


rachas, aplicados a los residuos y a su función de autocorrelación simple, no
rechazan la hipótesis nula de ausencia de estructura, al nivel de significación
del 5 por ciento.

C) Finalmente otros contrastes realizados como el de Jarque Bera no rechazan


la hipótesis de normalidad.

Por lo tanto, el modelo estimado corresponde al tradicionalmente denominado


de las líneas aéreas ARIMA (0,1,1) (0,1,1)12, donde se han efectuado
intervenciones para aislar el efecto calendario, el de la Semana Santa y dos
atípicos.

Los valores de los estadísticos obtenidos así como los de las funciones de
correlación simple y parcial corroboran la bondad de la modelización efectuada.

Consecuentemente, el modelo univariante siguiente resulta válido.

MODELO FINAL DEL TRÁFICO INTERIOR DE PASAJEROS :


Semana Santa, efecto calendario y con dos atípicos. ARIMA(0,1,1)(0,1,1)12

LPAITt = 0 ,0455 I tSS + 0 ,00174 I LAB


t + 0 ,01934 I BIS
t − 0 ,1732 I 1991:2
t + 0 ,1114 I 1991:4
t + Nt
( 6,80 ) ( 3,98 ) ( 1,89 ) ( − 6 ,03 ) ( 4 ,36 )

∇∇12 N t = ( 1 - 0 ,3504 B) ( 1 - 0 ,5558 B 12 )a t


( 6,61 ) ( 11,32 )

Donde at es ruido blanco, con media significativamente nula y desviación típica de 0 ,0341

Este modelo se puede escribir también de la forma siguiente:

150
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

MODELO FINAL DEL TRÁFICO INTERIOR DE PASAJEROS :


Semana Santa, efecto calendario y con dos atípicos. ARIMA(0,1,1)(0,1,1)12

LPAITt ⊗ 100 = 4,55 I tSS + 0,17 I LAB


t + 1,93 I BIS
t − 17,32 I 1991:2
t + 11,14 I 1991:4
t +

+
(1 − 0 ,3504 B )(1 - 0 ,5558 B 12
) aˆ
(1 − B )(1 - B12 ) t

Con esta notación, los coeficientes de las variables exógenas tienen un


significado claro como semi-elasticidades. Así por ejemplo, cabe afirmar que la
Semana Santa produce un aumento estimado del 4,55% en el número de
pasajeros en comparación con un mes sin Semana Santa.

 Resumen y conclusiones

Las principales conclusiones que se pueden extraer del análisis realizado sobre
la serie temporal, consistente en el tráfico mensual de viajeros en los
aeropuertos españoles, son las siguientes.

(a) El análisis de la serie original, confirmado por el procedimiento automático


del programa TRAMO, ha revelado la conveniencia de transformar
logarítmicamente la serie analizada, con el fin de estabilizar su varianza y hacer
más adecuada la modelización lineal subsiguiente.

(b) Asimismo, el análisis de la serie original, confirmado por el procedimiento


automático del programa TRAMO, ha revelado la conveniencia de aplicar una
diferencia regular y otra estacional a nuestra serie original, con el fin de eliminar
la tendencia y estacionalidad.

(c) Como nuestra el procedimiento automático del programa TRAMO, existen


efectos deterministas claramente significativos, vinculados a la composición y
duración del mes y a la Semana Santa móvil.

(d) Aplicando el procedimiento automático del programa TRAMO se han


detectado efectos asociados a observaciones anómalas de diversos tipos,
vinculados posiblemente a la Guerra de Golfo en 1991.

(e) El diagnóstico realizado sobre los residuos del modelo, aplicando


numerosos criterios, indican una situación correcta de estimación, tratándose
de un ruido blanco.

(f) El modelo ARIMA estimado para la parte estocástica corresponde al


denominado de líneas aéreas, es de tipo equilibrado y el término irregular
teórico sería un ruido blanco.

151
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

17.2. Víctimas mortales en accidentes de tráfico

17.2.1. Fuente y descripción de los datos

El caso práctico que se presenta a continuación corresponde al análisis


estadístico de la serie mensual de víctimas mortales en accidentes producidos
en las carreteras españolas. Los valores correspondientes a esta serie se
pueden encontrar dentro de la página web siguiente de la Dirección General de
Tráfico donde se muestran numerosas series temporales referentes a los
accidentes de tráfico.

Se encuentra en: Inicio Seguridad vial Estadísticas e indicadores Accidentes


con víctimas, fallecidos 30 días, heridos graves y leves Series históricas

En concreto, la serie correspondiente al número de víctimas mortales en


accidentes de tráfico está incluida en:

http://www.dgt.es/es/seguridad-vial/estadisticas-e-indicadores/accidentes-
30dias/series-historicas/

Se trata de un fichero EXCEL donde aparecen diversas tablas. La que nos


interesa es la siguiente:

TABLA 3 - NÚMERO DE MUERTOS EN VÍAS INTERURBANAS Y URBANAS


POR MESES

Esta serie tiene carácter mensual y abarca desde enero de 1998 hasta
diciembre de 2008 con un total de 132 observaciones.

17.2.2. Modelización Automática

Se ha utilizado el software TSW que incluye los programas TRAMO y SEATS


para efectuar la modelización de la serie temporal mensual correspondiente al
tráfico interior de pasajeros en los aeropuertos españoles.

Dentro del programa TRAMO se ha utilizado el modo automático para


identificar y estimar el modelo. Asimismo, para determinadas aplicaciones,
especialmente gráficos de la serie y de sus correspondientes diferencias
regulares y estacionales, e incluso la FAP de los residuos del modelo final que
es difícil de obtener con TRAMO, se ha utilizado EXCEL.

152
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Como se ha descrito anteriormente, la primera página de la ventana que define


los parámetros del modelo, contiene el Procedimiento automático que está
controlado por los parámetros RSA.

Es aconsejable, por su carácter más general (ya que sin ninguna restricción
sobre la especificación del modelo ARIMA, contrasta todos los posibles efectos:
calendario, Semana Santa, bisiestos, etc.), utilizar las alternativas 4 o 5 para
RSA, que se diferencian nada más que en la forma de especificación del efecto
del ciclo semanal ya que en el primer caso estima mediante una sola variable el
efecto de los días laborables (de lunes a viernes) mientras que en el segundo
estima el efecto de cada día por separado respecto al domingo (seis variables).

Cabe indicar que las configuraciones automáticas correspondientes a cada


valor del parámetro RSA pueden modificarse posteriormente incorporando los
nuevos valores de los parámetros. Así por ejemplo, entre otras cuestiones se
ha modificado el nivel de confianza para la estimación de outliers.

En este ejercicio después de contrastar diversas alternativas se ha optado por


el valor de RSA= 4.

También se ha utilizado este programa para obtener las FAS y FAP de la serie
temporal original, de la serie obtenida mediante la aplicación de logaritmos, de
las series derivadas de la original mediante la aplicación de diferencias
regulares y/o estacionales, etc. Para ello basta con modificar los parámetros
que existen por defecto en el programa, incluyendo los nuevos,
correspondientes al nuevo modelo que se estima en cada ocasión.

En los siguientes apartados se ofrecen los principales resultados de la


aplicación del programa TRAMO en modo automático a la serie seleccionada.

17.1.3. Transformaciones para conseguir estacionariedad

Dentro de la etapa de identificación del modelo que constituye la primera fase


del proceso de modelización, el análisis del gráfico adjunto, donde se
representa la evolución mensual de las víctimas mortales en accidentes de
carretera, nos muestra los siguientes hechos:

a) Parece existir una variabilidad proporcional a la media. Esta última


característica desaparecería al transformar logarítmicamente los datos.

b) Parece existir diversas tendencias a lo largo del periodo analizado. Para


solucionarlo existe la alternativa de aplicar el operador diferencia regular.

c) Existe un ciclo estacional que se pone de manifiesto con un mayor volumen


de víctimas mortales durante los meses de verano. Para solucionarlo existe la
alternativa de aplicar el operador diferencia estacional.

153
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Otros posibles efectos que deben analizarse son los siguientes:

d) La celebración de la Semana Santa en diferentes meses (marzo o abril)


puede tener consecuencias sobre el número de víctimas mortales en dichos
meses.

e) El diferente número de días laborables en cada mes puede tener también su


repercusión sobre el número de pasajeros. Este efecto, denominado
comúnmente "calendario", se manifiesta, por ejemplo, en el caso del mes de
febrero de los años bisiestos que tiene un día más que los demás años.
800

Evolución del número mensual de víctimas mortales en


700 accidentes de carretera en España
600

500

400

300

200

100

0
ene-98

ene-99

ene-00

ene-01

ene-02

ene-03

ene-04

ene-05

ene-06
jul-98

jul-99

ene-07
jul-00

jul-01

ene-08
jul-02

jul-03

jul-04

jul-05

jul-06

jul-07

jul-08
Meses

Asimismo, en los gráficos adjuntos que muestran las FAS y FAP de la serie
original, se observa la existencia de una amplia estructura en sus elementos
que nos confirma la necesidad de realizar diversas transformaciones para
conseguir estacionariedad.

154
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Para evitar estos problemas, de acuerdo con la metodología Box-Jenkins para


el análisis de series temporales se realizan las siguientes transformaciones y
operaciones:

A) Utilización de los logaritmos de los valores de la serie primitiva con el


fin de reducir la posible heterocedasticidad.
7

Evolución del número de víctimas mortales en accidentes


de carretera en España (Logaritmos)

5
ene-98
jul-98
ene-99
jul-99
ene-00
jul-00
ene-01
jul-01
ene-02
jul-02
ene-03
jul-03
ene-04
jul-04
ene-05
jul-05
ene-06
jul-06
ene-07
jul-07
Meses

El análisis del gráfico adjunto donde se representa la evolución mensual del


logaritmo de la serie original ( Yt = Log(MUE t ) ) nos muestra que una vez
realizada dicha transformación ya no existe la heterocedasticidad de la serie
original. En este sentido, el procedimiento automático del programa TRAMO
corrobora la necesidad de efectuar dicha transformación.

Sin embargo, se siguen observando tendencias en media y estacionalidad.


Consecuentemente, se pasa a analizar: Yt = ∇∇12 Log(MUE t ) .

155
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

B) Aplicación de una diferencia regular y otra estacional con el objetivo


de eliminar, respectivamente, las tendencias en media y la estacionalidad.

Serie con una diferencia regular sobre logaritmo de la serie original


0,4
Evolución del número de víctimas mortales en accidentes
0,3 de carretera en España (Diferencia regular de logaritmos)

0,2

0,1

0,0

-0,1

-0,2

-0,3

-0,4
ago-98

ago-99

ago-00

ago-01

ago-02

ago-03

ago-04

ago-05

ago-06

ago-07

ago-08
feb-98

feb-99

feb-00

feb-01

feb-02

feb-03

feb-04

feb-05

feb-06

feb-07

feb-08
Meses

El análisis del gráfico adjunto donde se representa la nueva serie, obtenida


mediante la aplicación de una diferencia regular a la transformada logarítmica
de la serie original Yt = ∇Log(MUE t ) , nos muestra que ya no existe ningún tipo
de tendencia. En este sentido, el procedimiento automático del programa
TRAMO corrobora la necesidad de efectuar dicha transformación. Sin embargo,
se observa que sigue existiendo estacionalidad con valores superiores en los
meses de verano.

Consecuentemente, se pasa a analizar: Yt = ∇∇12 Log(MUE t ) .

156
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Serie con una diferencia regular y otra estacional sobre logaritmo de la serie original
0,40
Número de víctimas mortales en accidentes de tráfico
0,30 (Diferencia regular y estacional de logaritmos)
0,20

0,10

0,00

-0,10

-0,20

-0,30

-0,40
feb-99

feb-00

feb-01

feb-02

feb-03

feb-04

feb-05

feb-06

feb-07

feb-08
ago-99

ago-00

ago-01

ago-02

ago-03

ago-04

ago-05

ago-06

ago-07

ago-08
Meses

El análisis del gráfico adjunto donde se representa la nueva serie obtenida


mediante la aplicación de una diferencia estacional a la serie anterior
(diferencia regular del logaritmo de la serie original) nos muestra que no existe
ningún tipo de tendencia y se ha eliminado la estacionalidad. En este sentido,
el procedimiento automático del programa TRAMO corrobora la necesidad de
efectuar dicha transformación.

Asimismo, en los gráficos adjuntos que muestran las FAS y FAP de la serie
derivada de la original mediante la aplicación de una diferencia regular y otra
de orden 12, se observa la existencia de elementos significativos en las
correspondientes al primer retardo y al número 12 lo que nos podría sugerir un
modelo IMA(1,1)xIMA(1,1)12 para el ajuste óptimo de la serie.

157
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En definitiva, una vez obtenida la estacionariedad en la serie mediante la


aplicación de la transformación logarítmica y los operadores diferencia regular y
estacional, respectivamente, estamos en condiciones de identificar y estimar el
modelo ARIMA final que podría incluir otros efectos como Semana Santa móvil,
efecto calendario y existencia de atípicos.

17.2.4. Modelo final

Se ha utilizado el procedimiento automático de TRAMO para estimar el modelo.


Los parámetros de TRAMO utilizados por el programa en dicha estimación
automática aparecen en el correspondiente fichero output.

El programa identificó la presencia de una raíz unitaria en la parte regular de la


serie y de una raíz estacional, admitiendo, además, la transformación
logarítmica de la serie original, por lo que aplica el polinomio diferenciador (1-B)
(1-B12).

El modelo seleccionado y estimado, de acuerdo con el procedimiento


automático de TRAMO, tiene la siguiente expresión:

Log(MUE t ) = TD t + O t + N t , donde Log(MUE t ) es el logaritmo del número


de víctimas mortales en España y las demás variables representan los
siguientes efectos:

 TDt recoge los efectos de calendario vinculados al ciclo semanal.

 Ot representa una combinación de modelos de intervención asociados a


factores de tipo extraordinario que afectan a la serie de manera no
recurrente y que se suelen denominar atípicos (outliers).

 Nt caracteriza el comportamiento estocástico de la serie.

Otras posibles variables como la correspondiente a los años bisiestos y la


Semana Santa móvil no se incluyen al no mostrarse significativas.

La expresión anterior constituye una descomposición preliminar de la serie en


una componente determinista, resultado de agregar los efectos de calendario e
intervención, y otra estocástica que representa los movimientos observados,
asociados a la respuesta de un sistema lineal a una secuencia de innovaciones
de tipo ruido blanco.

A continuación se examina cada componente de la expresión anterior con


mayor detalle.

158
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Efecto del ciclo semanal: TDt

Formalmente, el efecto del ciclo semanal se recoge a través de una variable de


tipo determinista que representa el efecto del ciclo semanal (días laborables).
Para esta variable (TDt) TRAMO usa la expresión siguiente: número de días de
tipo j (laborables) en el mes t - (número de sábados y domingos en el mes t) x
5/2, con j = lunes, ...,viernes.

De acuerdo con el procedimiento automático del programa TRAMO, se ha


considerado un parámetro correspondiente al número de días laborables como
variable explicativa del efecto calendario. En la tabla siguiente se presentan los
resultados de la estimación que nos muestra la alta significación de la variable
relacionada con el número de días laborables para explicar la evolución del
tráfico aéreo interior.
Estimación del efecto calendario

Parámetro Estimación Desviación típica t-ratio


Laborables -0,00717 0,00196 -3,67

 Efectos asociados a sucesos atípicos: Ot

La expresión formal de estos efectos, derivada del análisis de intervención es:


k
O t = ∑ Vh (B )I tTh donde I tTh es una variable binaria de tipo impulso que adopta
h =1
un valor unitario en la observación Th y nulo en los restantes, siendo Th la
observación en que tiene lugar el acontecimiento atípico o extraordinario. El
filtro Vh(B) recoge los efectos dinámicos asociados a la observación anómala.

En la tabla siguiente se presentan los resultados de la estimación de este


efecto, obtenidos mediante el procedimiento automático del programa TRAMO.

Estimación del efecto asociado a los atípicos


Fecha Tipo Estimación Desviación típica t-ratio
2007:11
(observación Cambio de nivel -0,1634 0,0401 -4,08
número 119)

Examinando la tabla anterior, se aprecia que existe un valor atípico, que


consiste en un cambio de nivel negativo y muy significativo en noviembre de
2007. Este outlier está asociado a la promulgación de la Ley Orgánica 15/2007,
de 30 de noviembre, por la que se modifica la Ley Orgánica 10/1995, de 23 de
noviembre, del Código Penal en materia de seguridad vial. Se estima la
magnitud de este efecto en el 16,3% de reducción del número de víctimas
mortales.

159
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Efecto de la introducción del carné por puntos

El efecto de la introducción del carné por puntos en junio 2006 podría estimarse
mediante el análisis de intervención, definiendo la correspondiente variable,
pero el problema que existe es que no sabemos ni el tipo de efecto ni la fecha y
duración del impacto de esta medida. En definitiva sería necesario introducir
diversas variables de intervención hasta encontrar aquella que resultase más
satisfactoria. Sin embargo, una solución más sencilla para estimar dicho efecto
consiste en que, en el modelo ya definido, ir variando el nivel de confianza para
los atípicos hasta que se detecte el outlier correspondiente al efecto buscado.
En este caso basta con reducir el nivel del 3,21 que por defecto utiliza el
programa TRAMO en el procedimiento automático hasta 2,8, obteniéndose el
resultado siguiente:

Estimación del efecto asociado al carné por puntos


Fecha Tipo Estimación Desviación típica t-ratio
2006:8
(observación Aditivo (impulso) -0,2069 0,0686 -3,02
número 104)

Por lo tanto, cabe concluir que el efecto del carné por puntos es un impulso
transitorio de magnitud -0,2069 en el mes de agosto de 2006, que se traduce
en un descenso del 20,7% en el número de víctimas mortales.

 Componente estocástico: Nt

El modelo para el componente estocástico, identificado y estimado mediante el


procedimiento automático del programa TRAMO, implica p=P=0 y d=D=q=Q=1,
esto es, el conocido modelo “de las líneas aéreas”, donde la especificación del
componente estocástico sigue una representación integrada y de medias
móviles (ARIMA) de tipo multiplicativo ARIMA (0,1,1)(0,1,1)12:

Nt =
(1 − θ1B )(1 − θ12 B12 )
(1 − B )(1 − B12 )
at

La estimación del modelo anterior por máxima verosimilitud exacta, utilizando el


procedimiento automático del programa TRAMO junto con todos los efectos
deterministas antes descritos nos ofrece los siguientes resultados para la parte
estocástica.

Estimación del modelo ARIMA de la parte estocástica


Desviación
Parámetro Estimación t-ratio
típica
θ1 -0,839 0,0578 -14,52
θ12 -0,729 0,0949 -7,68

160
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Además la desviación típica de los residuos (σa) es 0,0735 y la correlación


entre ambos parámetros del modelo es -0,2506.

Otra posible componente del modelo como es la media, no se muestra


significativamente distinta de cero (t-ratio = 1,3629), de acuerdo con los
resultados obtenidos en el procedimiento automático del programa TRAMO.

17.2.5. Diagnosis de los residuos del modelo

El análisis de los residuos obtenidos con el fin de corroborar la idoneidad del


modelo elegido se realiza a continuación.

 Gráfico de los residuos

El análisis del gráfico adjunto, donde se representa la evolución de los residuos


del modelo ajustado junto a las bandas correspondientes, respectivamente, a
dos y tres veces la desviación típica de los residuos (0,073), nos muestra que
siguen un proceso de ruido blanco. En este sentido, en dicho gráfico se
observa que no existe ningún valor de magnitud superior a tres veces la
desviación típica y solo 5 con magnitud superior al doble de la desviación típica
residual. Precisamente uno de estos últimos residuos, correspondiente al mes
de agosto de 2006, estaría relacionado con la introducción del carné por puntos
en junio de 2006, cuyo efecto se ha estimado anteriormente. Cabe recordar
que al disponer de 132 observaciones en nuestra serie original, se aceptaría la
existencia de ruido blanco hasta con 1 residuo (el 1% del total de valores para
dicho nivel de significación) fuera de la banda de 3 veces la desviación típica y
7 (el 5% del total de valores para dicho nivel de significación) fuera de las
bandas de 2 veces la desviación típica.

0,294
RESIDUOS DEL MODELO DEL NÚMERO DE VÍCTIMAS MORTALES
0,220

0,147

0,073

0,000

-0,073

-0,147

Efecto del Carné de conducir por puntos


-0,220 en Junio de 2006 8-2006; -0,216

-0,294
4-1999
7-1999

1-2000
4-2000
7-2000

1-2001
4-2001
7-2001
10-1999

1-2002
4-2002
7-2002
10-2000

1-2003
4-2003
7-2003
10-2001

1-2004
4-2004
7-2004
10-2002

1-2005
4-2005
7-2005
10-2003

1-2006
4-2006
7-2006
10-2004

1-2007
4-2007
7-2007
10-2005

1-2008
4-2008
7-2008
10-2006

10-2007

10-2008

161
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Gráfico de las FAS y FAP

El análisis de los gráficos siguientes, donde se representan las FAS y FAP de


los residuos del modelo final ajustado, nos muestra que no hay indicios de
estructura con una sola barra en esta última, superior a 2 veces la desviación
típica.

0,555

0,463
Función de autocorrelación parcial de los residuos del modelo final
del número de víctimas mortales
0,370

0,278

0,185

0,093

0,000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
-0,093

-0,185

-0,278

-0,370

-0,463

-0,555

162
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Criterios para diagnosis de los residuos

En la tabla siguiente se muestran las magnitudes obtenidas para los diferentes


criterios de diagnosis de los residuos así como las correspondientes
magnitudes de referencia.

Cabe afirmar que los diagnósticos residuales no muestran ningún síntoma de


mala especificación. La desviación típica estimada de los residuos es 0,1239; la
media estimada de la serie de residuos no resulta significativamente distinta de
cero (t-value = 0,8415); el test de normalidad así como los de sesgo y kurtosis
no permiten rechazar la hipótesis nula de normalidad de los mismos (0,6279
frente a un valor crítico al 95 por ciento de 5,99); el estadístico de Durbin -
Watson es 1,97, el estadístico de Ljung - Box de orden 24 es 23,37 y los tests
de rachas sobre los residuos y sobre la función de autocorrelación no muestran
desviaciones sobre la aleatoriedad de los mismos.

Magnitudes de
Criterios Magnitudes
referencia
Desviación típica de los residuos: 0,0735 El menor valor
BIC (Criterio de Información Bayesiano): -5,0949 El menor valor
< 6 (95% de la chi cuadrado
Normalidad: 0,04134
con 2 grados de libertad)
Valor absoluto < 2 x SE
Sesgo: -0,0127 (SE = 0,2265)
(<0,453)
Kurtosis 2,9115 (SE = 0,4529) < 3+2 x SE (<3,95)
< 34 (95% de la chi
Ljung-Box Q (24 autocorrelaciones): 23,37 cuadrado con 22 grados de
libertad)
< 6 (95% de la chi cuadrado
Estadístico de Pierce: 2,73
con 2 grados de libertad)
< 34 (95% de la chi
Estadístico Q para los cuadrados de los residuos: 20,58 cuadrado con 22 grados de
libertad)
Rachas en los residuos: T-VALUE= 1,30 < 2 (95% del estadístico t)

En resumen, el diagnóstico del modelo estimado, basado en el estudio de sus


residuos, ofrece los siguientes resultados:

A). Analizando las funciones de autocorrelación simple y parcial no se detecta


estructura dinámica en los residuos, como se puede ver en la representación
del correlograma.

B). En el mismo sentido, el estadístico Q de Ljung y Box y los contrastes de


rachas, aplicados a los residuos y a su función de autocorrelación simple, no
rechazan la hipótesis nula de ausencia de estructura, al nivel de significación
del 5 por ciento.

163
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

C) Finalmente otros contrastes realizados como el de Jarque Bera no rechazan


la hipótesis de normalidad.

Por lo tanto, el modelo estimado corresponde al tradicionalmente denominado


de las líneas aéreas ARIMA (0,1,1) (0,1,1)12, donde se han efectuado
intervenciones para aislar el efecto del ciclo semanal, y un atípico.

Los valores de los estadísticos obtenidos así como los de las funciones de
correlación simple y parcial corroboran la bondad de la modelización efectuada.
Consecuentemente, el modelo univariante siguiente resulta válido.

MODELO FINAL DEL NÚMERO DE VÍCTIMAS MORTALES :


Efecto calendario y con un atípico. ARIMA(0,1,1)(0,1,1)12

LMUEt = - 0 ,00717 I tLAB − 0 ,1634 I t2007:11+ N t


( − 3,67 ) ( 4 ,36 )

∇∇12 N t = ( 1 - 0 ,839 B) ( 1 - 0 ,729 B12 )at


( 14,52 ) ( 7,68 )

Donde at es ruido blanco, con media significativamente nula y desviación típica de 0 ,0735

Este modelo se puede escribir también de la forma siguiente:

MODELO FINAL DEL NÚMERO DE VÍCTIMAS MORTALES :


Efecto calendario y con un atípico. ARIMA(0,1,1)(0,1,1)12

( 1 − 0 ,839 B) ( 1 − 0 ,729 B12 )


LMUEt ⊗ 100 = − 0,717 I tLAB − 16,34 I t2007:11+ aˆt
( 1 − B) ( 1 − B12 )

Con esta notación, los coeficientes de las variables exógenas tienen un


significado claro como semi-elasticidades. Así por ejemplo, cabe afirmar que la
introducción de las nuevas medidas recogidas en la Ley de Seguridad Vial ha
supuesto con carácter permanente un descenso estimado del 16,34% en el
número de víctimas mortales.

164
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Resumen y conclusiones

Las principales conclusiones que se pueden extraer del análisis realizado sobre
la serie temporal, consistente en el número mensual de víctimas mortales en
accidentes de tráfico acaecidos en las carreteras españolas, son las siguientes.

(a) El análisis de la serie original, confirmado por el procedimiento automático


del programa TRAMO, ha revelado la conveniencia de transformar
logarítmicamente la serie analizada, con el fin de estabilizar su varianza y hacer
más adecuada la modelización lineal subsiguiente.

(b) Asimismo, el análisis de la serie original, confirmado por el procedimiento


automático del programa TRAMO, ha revelado la conveniencia de aplicar una
diferencia regular y otra estacional a nuestra serie original, con el fin de eliminar
la tendencia y estacionalidad.

(c) Como nuestra el procedimiento automático del programa TRAMO, existe un


efecto determinista claramente significativo, vinculado a la composición del
mes.

(d) Aplicando el procedimiento automático del programa TRAMO se han


detectado efectos asociados a una observación anómala del tipo escalón,
vinculado a la nueva Ley de Seguridad Vial de noviembre de 2007.

d) Aplicando el procedimiento automático del programa TRAMO se ha


detectado que el efecto de la introducción del carné por puntos en junio de
2006 es un descenso del 20,7% en el número de víctimas mortales.

(e) El diagnóstico realizado sobre los residuos del modelo, aplicando


numerosos criterios, indican una situación correcta de estimación, tratándose
de un ruido blanco.

(f) El modelo ARIMA estimado para la parte estocástica corresponde al


denominado de líneas aéreas, es de tipo equilibrado y el término irregular
teórico sería un ruido blanco.

165
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

17.3. Ocupados

17.3.1. Fuente y descripción de los datos

El caso práctico que se presenta a continuación corresponde al análisis


estadístico de la serie trimestral de ocupados extraída de la Encuesta de
Población Activa. Los valores correspondientes a esta serie se pueden
encontrar dentro de la página web siguiente donde se muestran numerosas
series temporales de la economía española.

http://serviciosede.mineco.gob.es/Indeco/BDSICE/Busquedas/Busquedas_new.
aspx

En concreto, la serie correspondiente al total de ocupados está incluida dentro


del grupo 1: mercado Laboral

Con el número 120000 Ocupados totales, tiene carácter trimestral y abarca


desde el primer trimestre de 1980 hasta el cuarto trimestre de 2007 con un total
de 112 observaciones.

17.3.2. Modelización automática

Se ha utilizado el software TSW que incluye los programas TRAMO y SEATS


para efectuar la modelización de la serie temporal trimestral correspondiente al
número de ocupados.

Dentro del programa TRAMO se ha utilizado el modo automático para


identificar y estimar el modelo. Asimismo, para determinadas aplicaciones,
especialmente gráficos de la serie y de sus correspondientes diferencias
regulares y estacionales, e incluso la FAP de los residuos del modelo final que
es difícil de obtener con TRAMO, se ha utilizado EXCEL.

Como se ha descrito anteriormente, la primera página de la ventana que define


los parámetros del modelo, contiene el Procedimiento automático que está
controlado por los parámetros RSA.

Es aconsejable, por su carácter más general (ya que sin ninguna restricción
sobre la especificación del modelo ARIMA, contrasta todos los posibles efectos:
calendario, Semana Santa, bisiestos, etc.), utilizar las alternativas 4 o 5 para
RSA, que se diferencian nada más en la forma de especificación del efecto del
ciclo semanal ya que en el primer caso estima mediante una sola variable el
efecto de los días laborables (de lunes a viernes) mientras que en el segundo
se estima el efecto de cada día por separado, respecto al domingo (seis
variables).

166
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Cabe indicar que las configuraciones automáticas correspondientes a cada


valor del parámetro RSA pueden modificarse posteriormente incorporando los
nuevos valores de los parámetros. Así por ejemplo, entre otras cuestiones se
ha modificado el nivel de confianza para la estimación de outliers.

En este ejercicio después de contrastar diversas alternativas se ha optado por


el valor de RSA= 4.

También se ha utilizado este programa para obtener las FAS y FAP de la serie
temporal original, de la serie obtenida mediante la aplicación de logaritmos, de
las series derivadas de la original mediante la aplicación de diferencias
regulares y/o estacionales, etc. Para ello basta con modificar los parámetros
que existen por defecto en el programa, incluyendo los nuevos,
correspondientes al nuevo modelo que se estima en cada ocasión.

En los siguientes apartados se ofrecen los principales resultados de la


aplicación del programa TRAMO en modo automático a la serie seleccionada.

17.3.3. Transformaciones para conseguir estacionariedad


25000

EVOLUCIÓN TRIMESTRAL DEL NÚMERO DE OCUPADOS


20000

15000

10000

5000

0
19801
19811
19821
19831
19841
19851
19861
19871
19881
19891
19901
19911
19921
19931
19941
19951
19961
19971
19981
19991
20001
20011
20021
20031
20041
20051
20061
20071

Dentro de la etapa de identificación del modelo, que constituye la primera fase


del proceso de modelización, existen un grupo de posibles transformaciones
que se pueden aplicar sobre la serie original del número de ocupados, que se
muestra en el gráfico adjunto, con el fin de conseguir una serie estacionaria.

167
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

A continuación se describen los resultados que se obtienen aplicando el


procedimiento automático del programa TRAMO sobre la necesidad de aplicar
dichas transformaciones.

A) Utilización de los logaritmos de los valores de la serie primitiva con el fin


de reducir la posible heterocedasticidad.

De acuerdo con la modelización automática del programa TRAMO, no es


necesario tomar logaritmos en la serie original.

B) Aplicación de una diferencia regular y otra estacional con el objetivo de


eliminar, respectivamente, las tendencias en media y la estacionalidad.

De acuerdo con la modelización automática del programa TRAMO, es


necesario aplicar una diferencia regular y otra estacional de orden 4 en la serie
original.

Todo ello se corrobora mediante la observación de los correspondientes


gráficos. Así, el análisis del gráfico adjunto donde se representa la nueva serie
obtenida mediante la aplicación de una diferencia regular a la transformada
logarítmica de la serie original nos muestra que ya no existe ningún tipo de
tendencia. Sin embargo, se observa que sigue existiendo estacionalidad.

Serie con una diferencia regular sobre la serie original


500
EVOLUCIÓN TRIMESTRAL DE LA DIFERENCIA REGULAR
DEL NÚMERO DE OCUPADOS

-500
19801
19811
19821
19831
19841
19851
19861
19871
19881
19891
19901
19911
19921
19931
19941
19951
19961
19971
19981
19991
20001
20011
20021
20031
20041
20051
20061
20071

168
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Asimismo, el análisis del gráfico adjunto donde se representa la nueva serie


obtenida mediante la aplicación de una diferencia estacional a la serie anterior
(diferencia regular de la serie original) nos muestra que no existe ningún tipo de
tendencia y se ha eliminado la estacionalidad.
300
EVOLUCIÓN TRIMESTRAL DE LA DIFERENCIA REGULAR Y
ESTACIONAL DEL NÚMERO DE OCUPADOS

-300
19801
19811
19821
19831
19841
19851
19861
19871
19881
19891
19901
19911
19921
19931
19941
19951
19961
19971
19981
19991
20001
20011
20021
20031
20041
20051
20061
20071
17.3.4. Modelo final

Se ha utilizado el procedimiento automático de TRAMO para estimar el modelo.


Los parámetros de TRAMO utilizados por el programa en dicha estimación
automática aparecen en el correspondiente fichero output.

El programa identificó la presencia de una raíz unitaria en la parte regular de la


serie y de una raíz estacional, admitiendo, además, la transformación
logarítmica de la serie original, por lo que aplica el polinomio diferenciador (1-B)
(1-B4).

El modelo seleccionado y estimado, de acuerdo con el procedimiento


automático del programa TRAMO, tiene la siguiente expresión:

OCU t = O t + N t , donde OCU t es el número trimestral de ocupados y las


demás variables representan los siguientes efectos:

 Ot representa una combinación de modelos de intervención asociados a


factores de tipo extraordinario que afectan a la serie de manera no
recurrente y que se suelen denominar atípicos (outliers).

 Nt caracteriza el comportamiento estocástico de la serie.

169
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

Otras posibles variables como la correspondiente al ciclo semanal, los años


bisiestos y la Semana Santa móvil no se incluyen en el modelo al no mostrarse
significativas.

La expresión anterior constituye una descomposición preliminar de la serie en


una componente determinista, resultado del efecto intervención, y otra
estocástica que representa los movimientos observados, asociados a la
respuesta de un sistema lineal a una secuencia de innovaciones de tipo ruido
blanco.

A continuación se examina cada componente de la expresión anterior con


mayor detalle.

 Efecto asociado a sucesos atípicos: Ot

La expresión formal de estos efectos, derivada del análisis de intervención es:


k
O t = ∑ Vh (B )I tTh donde I tTh es una variable binaria de tipo impulso que adopta
h =1
un valor unitario en la observación Th y nulo en los restantes, siendo Th la
observación en que tiene lugar el acontecimiento atípico o extraordinario. El
filtro Vh(B) recoge los efectos dinámicos asociados a la observación anómala.

En la tabla siguiente se presentan los resultados de la estimación de este


efecto, obtenidos mediante el procedimiento automático del programa TRAMO.

Estimación del efecto asociado a los atípicos

Fecha Tipo Estimación Desviación típica t-ratio


1987:02 Cambio de nivel 187,83 41,895 4,01

Examinando la tabla anterior se aprecia que existe un valor atípico significativo,


consistente en un cambio de nivel positivo, en el segundo trimestre de 1987.

170
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Componente estocástico: Nt

El modelo para el componente estocástico, identificado y estimado mediante el


procedimiento automático del programa TRAMO, implica P=q=0 y d=D=p=Q=1,
donde la especificación del componente estocástico sigue una representación
integrada ARIMA de tipo multiplicativo con una parte autorregresiva regular y
otra parte de media móvil estacional: ARIMA (1,1,0)(0,1,1)12:

Nt =
(1 − θ B ) a
4

φ (B )(1 − B )(1 − B )
4
4 t
1

La estimación del modelo anterior por máxima verosimilitud exacta, utilizando el


procedimiento automático del programa TRAMO junto con todos los efectos
deterministas antes descritos nos ofrece los siguientes resultados para la parte
estocástica.

Estimación del modelo ARIMA de la parte estocástica


Desviación
Parámetro Estimación t-ratio
típica
φ1 -0,765 0,0698 -10,97
Θ4 -0,669 0,8410 -7,95

Además, la desviación típica de los residuos (σa) es 57,72 y la correlación entre


ambos parámetros del modelo es 0,329.

Otra posible componente del modelo como es la media, no se muestra


significativamente distinta de cero (t-ratio = 0,988), de acuerdo con los
resultados obtenidos en el procedimiento automático del programa TRAMO.

171
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

17.3.5. Diagnosis de los residuos del modelo

El análisis de los residuos obtenidos con el fin de corroborar la idoneidad del


modelo elegido se realiza a continuación.

 Gráfico de los residuos


173
RESIDUOS DEL MODELO FINAL DE OCUPADOS
2-1993; 149,53
115

58

-58

-115

-173
3-1981
2-1982
1-1983
4-1983
3-1984
2-1985
1-1986
4-1986
3-1987
2-1988
1-1989
4-1989
3-1990
2-1991
1-1992
4-1992
3-1993
2-1994
1-1995
4-1995
3-1996
2-1997
1-1998
4-1998
3-1999
2-2000
1-2001
4-2001
3-2002
2-2003
1-2004
4-2004
3-2005
2-2006
1-2007
4-2007
El análisis del gráfico adjunto donde se representa la evolución de los residuos
del modelo ajustado, junto a las bandas correspondientes, respectivamente, a
dos y tres veces la desviación típica de los residuos (57,72), nos muestra que
siguen un proceso de ruido blanco.
En este sentido, en dicho gráfico se observa que no existe ningún valor de
magnitud superior a tres veces la desviación típica y solo 4 con magnitud
superior al doble de la desviación típica residual. Cabe recordar que al disponer
de 112 observaciones en nuestra serie original, se aceptaría la existencia de
ruido blanco hasta con 1 residuo (el 1% del total de valores para dicho nivel de
significación) fuera de la banda de 3 veces la desviación típica y 5 (el 5% del
total de valores para dicho nivel de significación) fuera de las bandas de 2
veces la desviación típica.

172
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Gráfico de las FAS y FAP

El análisis de los gráficos siguientes donde se representan las FAS y FAP de


los residuos del modelo final ajustado nos muestra que no hay indicios de
estructura con una sola barra superior a 2 veces la desviación típica.
0,49
Función de autocorrelación parcial de los residuos del modelo final del
0,39 número de ocupados

0,29

0,19

0,10

0,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
-0,10

-0,19

-0,29

-0,39

-0,49

 Criterios para diagnosis de los residuos


En la tabla siguiente se muestran las magnitudes obtenidas para los diferentes
criterios de diagnosis de los residuos así como las correspondientes
magnitudes de referencia.

Cabe afirmar que los diagnósticos residuales no muestran ningún síntoma de


mala especificación. La desviación típica estimada de los residuos es 57,72; la
media estimada de la serie de residuos no resulta significativamente distinta de
cero (t-value = 0,9879); el test de normalidad, así como los de sesgo y kurtosis,
no permiten rechazar la hipótesis nula de normalidad de los mismos (0,7476
frente a un valor crítico al 95 por ciento de 5,99); el estadístico de Durbin-
Watson es 2,24; el estadístico de Ljung-Box de orden 16 es 10,65 y los tests de
rachas sobre los residuos y sobre la función de autocorrelación no muestran
desviaciones sobre la aleatoriedad de los mismos.

Criterios Magnitudes Magnitudes de referencia


Desviación típica de los residuos: 57,721 El menor valor posible entre modelos
BIC (Criterio Bayesiano de El menor valor posible entre modelos
8.214
información):
< 6 (95% para la chi cuadrado con 2
Normalidad: 0,7476
grados de libertad)
Sesgo: 0,0936 (SE = 0,2379) Valor absoluto < 2 x SE (< 0,476)
Kurtosis: 2,6336 (SE = 0,4758) < 3+2 x SE (< 3,952)
< 23,7 (95% para la chi cuadrado con 14
Ljung-Box Q (orden 16): 10,65
grados de libertad)
< 6 (95% para la chi cuadrado con 2
Estadístico de Pierce: 2,73
grados de libertad)
Estadístico Q para los cuadrados de los < 26,3 (95% para la chi cuadrado con 16
15,00
residuos (orden 16): grados de libertad)
Rachas en los residuos: T-Value= -0,1952 < 2 (95% para el estadístico t)

173
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

En resumen, el diagnóstico del modelo estimado, basado en el estudio de sus


residuos, ofrece los siguientes resultados:

A) Analizando las funciones de autocorrelación simple y parcial no se detecta


estructura dinámica en los residuos, como se puede ver en la representación
del correlograma.

B) En el mismo sentido, el estadístico Q de Ljung y Box y los contrastes de


rachas, aplicados a los residuos y a su función de autocorrelación simple, no
rechazan la hipótesis nula de ausencia de estructura, al nivel de significación
del 5 por ciento.

C) Finalmente otros contrastes realizados como el de Jarque Bera no rechazan


la hipótesis de normalidad.

Por lo tanto, el modelo estimado corresponde a ARIMA (1,1,0) (0,1,1)4, donde


se han efectuado intervenciones para aislar el efecto de un atípico.

Los valores de los estadísticos obtenidos así como los de las funciones de
correlación simple y parcial corroboran la bondad de la modelización efectuada.
Consecuentemente, el modelo univariante siguiente resulta válido.

MODELO FINAL DEL NÚMERO DE OCUPADOS :


Efecto calendario y con un atípico. ARIMA(0,1,1)(0,1,1)12

OCU t = 187,83 I 1987:2


t + Nt
( 4 ,01 )

∇∇12( 1 - 0 ,765B)N t = ( 1 - 0 ,669 B 4 )at


( 10,97 ) ( 7,95 )

Donde at es ruido blanco, con media significativamente nula y desviación típica de 41,895

174
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

 Resumen y conclusiones

Las principales conclusiones que se pueden extraer del análisis realizado sobre
la serie temporal consistente en el número trimestral de ocupados, son las
siguientes.

(a) El análisis de la serie original confirmado por el procedimiento automático


del programa TRAMO, no ha revelado la conveniencia de transformar
logarítmicamente la serie analizada.

(b) Asimismo, el análisis de la serie original, confirmado por el procedimiento


automático del programa TRAMO, ha revelado la conveniencia de aplicar una
diferencia regular y otra estacional a nuestra serie original, con el fin de eliminar
la tendencia y estacionalidad.

(c) Como muestra el procedimiento automático del programa TRAMO, los


efectos vinculados a la composición y duración del mes y a la Semana Santa
móvil no son significativos.

(d) Aplicando el procedimiento automático del programa TRAMO se han


detectado efectos asociados a una observación anómala del tipo cambio de
nivel, en el segundo trimestre de 1987.

(e) El diagnóstico realizado sobre los residuos del modelo, aplicando


numerosos criterios, indican una situación correcta de estimación, tratándose
de un ruido blanco ya que no hay indicios ni de sobrediferenciación ni de falta
de invertibilidad.

(f) El modelo final estimado es ARIMA(1,1,0)(0,1,1)4. Para la parte estocástica


corresponde al ARMA(1,4) y el término irregular teórico es un ruido blanco.

175
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

BIBLIOGRAFÍA

 Bibliografía Básica:

- Box, G.E.P., G.M. Jenkins y G.C. Reinsel (1994): Time Series Analysis:
Forecasting and Control, Englewood Cliffs: Prentice Hall.
- Caporello G., Maravall A., y F.J. Sánchez (2001): Program TSW reference
manual, Banco de España.
- Caporello G., y A. Maravall (2004): Program TSW revised reference manual,
Banco de España.
- Espasa, A. y Cancelo, J.R. (1993): Métodos cuantitativos para el análisis de la
coyuntura económica, Alianza Editorial, Madrid.
- Peña, D. (2005): Análisis de series temporales, Alianza Editorial.
- Wei, W.S. (2005): Time Series Analysis: Univariate and Multivariate Methods,
Addison-Wesley.

 Bibliografía Complementaria

- Aznar, A. y Trivez, F.J. (1993): Métodos de Predicción en Economía II.


Análisis de series temporales. Editorial Ariel Economía, Barcelona.
- Bell, W.R. y Hillmer, S.C. (1983): "Modeling time series with calendar
variation", Journal of the American Statistical Association, vol. 78, n. 383, p.
526-534.
- Box, G.E.P., G.M. Jenkins y G.C. Reinsel (1994): Time Series Analysis:
Forecasting and Control, Englewood Cliffs: Prentice Hall.
- Box, G.E.P., y G.C. Tiao (1975): "Intervention Analysis with Applications to
Economic and Environmental Data," Journal of the American Statistical
Association, 70, pp. 70-79.
- Enders, W. (1995): Applied Econometric Times Series. John Wiley & Sons,
Inc. United States.
- Hillmer, S.C. y Tiao, G.C. (1982) "An ARIMA model-based approach to
seasonal adjustment", Journal of the American Statistical Society, vol. 77, n.
377, p. 63-70.
- Lawless, S.F. (1982): Statistical Models and Methods for lifetime data. Wiley
Sons.
- Lorenzo, F. y J.M. Revuelta (1996): “TRAMO Y SEATS: Un marco univariante
y extracción de señales de series temporales completo para el análisis”,
Revista de Economía Aplicada, 11, 201- 214.
- Maravall A. (2002): ·An application of TRAMO-SEATS: automatic procedure
and sectoral aggregation The Japanese Foreign Trade Series”, Documentos de
trabajo del Banco de España, 2002.
- Maravall A., y R. Kaiser Remiro (2000):”An Application of TRAMO-SEATS:
Changes in Seasonality and Current Trend-Cycle Assessment. The German
Retail Trade Turnover Series”, Documentos de trabajo del Banco de España,
11, 2000, 1-37.

176
Máster en Estadística Aplicada
Universidad Nacional de Educación a Distancia

- Maravall A., y R. Kaiser Remiro (2000): “Notes on time series analysis, arima
models and signal extraction”, Documentos de trabajo del Banco de España,
ISSN 0213-2710, 12, 2000, 9-79.
- Peña, D. (1991): Estadística, Modelos y Métodos. Alianza Universidad.
- Pulido, A. y Pérez García, J. (2001): Modelos Econométricos, Editorial
Pirámide, Madrid.
- Quilis E. M. (1999): “Índice de disponibilidades de bienes de equipo:
Modelizacion ARIMA-AI, componentes subyacentes y patrón cíclico”, Boletin
Trimestral de Coyuntura, 31, 111-139, Instituto Nacional de Estadística.
- Tiao, G.C. y G.E.P. Box (1981). "Modeling Multiple Time Series with
Applications," Journal of the American Statistical Association, 76 (376), pp. 802-
816.

177
Máster en Estadística Aplicada

Anda mungkin juga menyukai