En particular los procesos estocásticos que se desarrollan en el tiempo, en los que el tiempo
es el índice del proceso, se suelen denominar series cronológicas o series de tiempo y en lo
que sigue, a menos que se indique lo contrario, el tiempo será, por lo general, el conjunto
índice de referencia.
Como se ha señalado, en cada punto del tiempo los procesos estocásticos pueden tener
múltiples realizaciones de modo que ellos se desenvuelven en dos espacios: el del tiempo (o
si se prefiere el del conjunto índice) y el de las variables aleatorias donde se manifiestan las
realizaciones. En el ejemplo de las monedas se consignaron dos realizaciones en el espacio
de las variables aleatorias W.
El tiempo será denotado mediante t que es un elemento del conjunto T y será representado
en la recta real, de manera sintética, T = { t / - ∞< t < ∞} y el espacio de variables aleatorias
W posee elementos que serán denotados mediante w, es decir: W ={ w/- ∞< w < ∞}y será
representado en el eje de ordenadas.
A modo de ejemplo se presentarán dos realizaciones del proceso estocástico “lanzar cuatro
veces una moneda”. Se supondrá que se trata de un juego donde uno gana $1 si sale cara y
pierde $1 si sale ceca, que la riqueza inicial del jugador es $10 (con probabilidades
simétricas, es decir iguales a 0,5) y que las realizaciones son TTCT y CCCT.
Si la realización es TTCT, en términos de ingresos es: -1, -1, 1, -1 y en términos de riqueza
es 10, 9, 8, 9, 8. Estos valores pueden ser representados en el espacio de las variables
aleatorias y corresponden a los puntos 0, 1, 2, 3 y 4 del tiempo respectivamente.
A cada una de las realizaciones posibles de la variable aleatoria le corresponde una cierta
probabilidad que, en este caso, puede ser obtenida mediante la distribución binomial.
En este ejemplo tanto el tiempo como el espacio de variables aleatorias fue discreto ya que
la binomial es una variable aleatoria discreta, pero ambos pueden ser continuos o puede que
uno sea continuo y el otro discreto. En lo que sigue el tiempo será discreto medido por días,
meses, trimestres o años y el espacio de las variables aleatorias muchas veces será continuo
ya que se utilizará en gran medida la distribución normal.
También en el ejemplo anterior se consideró solo un proceso “lanzar cuatro veces una
moneda” correspondiente a un único jugador que lo hace contra un contrincante, un
ejemplo extraído de la economía, es cuando se considera individualmente la producción de
cemento o la de acero, etc. Estos procesos se denominan univaluados o univariados. Pero
puede suceder que se consideren en forma conjunta, como por ejemplo la producción de
cemento, la de acero y el producto bruto interno, la riqueza correspondiente a 3 jugadores,
etc.; en estos casos se trata de procesos multivaluados o multivariados y se verá que son
importantes las relaciones mutuas entre los procesos. En una primera etapa se considerarán
procesos o series de tiempo individuales o univaluadas.
ALEA
3
-1
-2
-3
-4
250 500 750 1000
Pero, por otra parte, en el mundo real de los fenómenos económicos y financieros no es
posible conocer las distribuciones de probabilidad que requiere el concepto de estacionariedad
fuerte. Es por ello que la estacionariedad fuerte es reemplazada en el análisis por la
denominada estacionariedad en sentido débil que incluye solamente a la media, a la varianza y
a las covarianzas. Se dirá entonces que una serie de tiempo o un proceso estocástico es
estacionario en sentido débil si la media, la varianza y las covarianzas son constantes en el
tiempo, es decir, no dependen del tiempo. En símbolos E ( yt ) = µ , Var (yt ) = σ2 y Covar (yt ,
yt -s ) = γs donde µ y σ2 son constantes y en γs el subíndice s denota el “lag” o separación entre
las variables.
Se verifica inmediatamente que todos los procesos estacionarios en sentido fuerte lo son en
sentido débil, pero la recíproca no es necesariamente cierta, aunque en el caso de normalidad
la estacionariedad débil determina la estacionariedad fuerte o estricta.
Ejercicios
8) Cuáles son las propiedades del ruido blanco? Puede ensayar una explicación acerca de por
qué, con qué finalidad, le habrán atribuido esas propiedad?
Este modelo puede utilizarse cuando uno piensa que el valor actual de una serie puede ser
explicado por el inmediato anterior, es decir la observación precedente sintetiza toda la
información acerca del desarrollo de un fenómeno.
Se trata de una suma de infinitos términos y para que tenga sentido debe ser a1 < 1 . Nótese
que si 1 - a1L = 0 significa que a1 L = 1 o bien a 1 = 1 / L, es decir, como soluciones de la
denominada ecuación característica a1 y L se comportan en forma inversa. Uniendo ambos
resultados y considerando un círculo unitario la expresión anterior se suele expresar como que
el valor de los parámetros del modelo, los a1, se hallan dentro del círculo unitario (el radio es
igual a uno) o bien que las raíces del polinomio característico se hallan fuera del mismo. De
esta manera se pueden generalizar los resultados.
Por otra parte, observemos el proceso generador de los datos partiendo del momento 0 con el
valor y0 . Así que: y1 = a1 y0 + ε 1 y2 = a1 y1 + ε 2 = a1 (a1 y0 + ε 1 ) + ε 2 . Si se efectúan los
2
productos resulta: y2 = a1 y0 + a1 ε 1 + ε 2 , y ,en general, si se sigue de la misma manera: y t
= a1t y0 + a1t-1 ε 1 + ……+ ε t. Como a1 < 1 entonces cuando t crece a1t y0 tiende a cero y la
suma es convergente.
1) Se generó alea. 2) se generó y=0 3) se generó y=.6* y(-1) + alea. En este paso antes de
cerrar la ventana se modificó el tamaño de la muestra colocando sample 2 1000.
Y
5
-1
-2
-3
-4
250 500 750 1000
Vamos a hallar los principales momentos del proceso autoregresivo de orden 1 y veremos que
es estacionario en forma débil. Ya hemos visto que el módulo de a1 debe ser menor que 1.
Por otra parte considerando la expresión yt = ε t + a 1 ε t-1 + a12 ε t - 2 +……. Resulta entonces:
Var (yt )= σε2 (1 + a12 + a14 +……) = σε2 / (1 - a12 ). En el ejemplo: Var (yt ) = 1/ 0,64 = 1,5625
y el desvío estándar es 1,25.
s e2 a1s
Se puede demostrar que g s = y que r s , el coeficiente de autocorrelación de orden s es
1 - a12
r s = a1s . Como │ a 1 │< 1 entonces r s decae exponencialmente. En el ejemplo r1 = 0,60, r 2 =
0,36 , etc.
Los resultados anteriores muestran que en el proceso autoregresivo de orden uno con a1 < 1 es
estacionario y que la media, la varianza y las autocovarianzas no dependen del tiempo. Por lo
tanto es un proceso estacionario en sentido débil.
90
Series: Y
80 Sample 1 1000
Observations 1000
70
60 Mean 0.082353
Median 0.100407
50 Maximum 4.215779
Minimum -3.876506
40
Std. Dev. 1.227421
30 Skewness -0.023443
Kurtosis 2.852344
20
Jarque-Bera 1.000026
10 Probability 0.606523
0
-3.75 -2.50 -1.25 0.00 1.25 2.50 3.75
La media es 0,08 y el desvío estándar es 1,227. Las autocorrelaciones (A) y las autocorrelaciones
parciales (AP) se muestran en el cuadro siguiente. Por ejemplo la primer autocorrelación es 0,623,
la de orden dos es 0,375 y así siguiendo. Puede observarse que decaen exponencialmente.
Las autocorrelaciones parciales indican la relación entre dos variables, por ejemplo entre y t y yt –s
sin que intervenga la dependencia lineal que esas variables tienen con las variables intermedias,
yt –s+1, yt –s+2, …. yt –1, es decir es la correlación “neta” entre esas dos variables libres de la influencia
lineal de las otras. Como el procedimiento de cálculo es complicado lo omitimos, pero se pueden
recurrir a la bibliografía especializada. Una explicación clara y bastante detallada se puede
encontrar en William S. Wei, Time Series Analysis, Addison Wesley, 1990. En el caso del AR (1)
puede demostrarse que solo la primer autocorrelación parcial es distinta de cero.
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
El Eviews presenta dos estadísticos para comprobar si las autocorrelaciones son distintas de cero.
Uno de ellos es el test de Bartlett referido a las autocorrelaciones muestrales. Bajo la hipótesis que
son ruido blanco ( media cero) y para grandes muestras el desvío estándar es aproximadamente
El Eviews traza dos líneas paralelas a cero por esos puntos y por ejemplo se observa que solo la
primer autocorrelación parcial es distinta de cero y que las autocorrelaciones declinan
rápidamente, la séptima autocorrelación no es significativamente distinta de cero.
También presenta el denominado estadístico Q cuyos autores son G. Ljung y G. Box cuyo
propósito es igual que el anterior, ver si un grupo de autocorrelaciones es significativamente
s
r2
distinto de cero. Su fórmula es: Q = N ( N + 2)� k y posee distribución c 2 con s grados de
k =1 ( N - k )
Si se considera la autocorrelación de orden 1 el valor de Q es: 1000 * (1002) * (0,623) 2 / (1000 -1)
= 389,295. El valor de c 2 con 1 grado de libertad considerando una prueba unilateral con un nivel
de significación del 5% es 5,024 de modo que como el valor empírico supera al teórico se rechaza
H0 , es decir la autocorrelación de orden 1 es distinta de cero. Al valor 389,295 suministrado por el
Eviews le corresponde un área a su izquierda de 1,18* 10 -86 lo que significa que, en este caso la
probabilidad de cometer un error de tipo 1 es cero y uno puede confiar en que la autocorrelación
de orden 1 es distinta de cero.
Las claves para identificar un proceso AR (1) se encuentran básicamente en las funciones de
autocorrelación y de autocorrelación parcial. Las funciones de autocorrelación declinan
exponencialmente y las funciones de autocorrelación parcial presentan un solo pico significativo
distinto de cero.
Ejercicios.
Halle la media, la varianza y las primeras autocorrelaciones teóricamente y compárelas con las
obtenidas mediante el programa. Comente los resultados de los tests de Bartlett y Q.
4. Cómo comprobaría que el modelo es adecuado? (Sugerencia: “La prueba del budín es
comerlo”)
En este caso tanto la observación precedente como la de dos períodos atrás influencian el
desarrollo de la serie. Si esta influencia correspondiera exclusivamente a la observación ocurrida
dos períodos atrás el coeficiente a1 resultaría nulo y el término a1 yt carecería de sentido en el
modelo.
En el caso de las soluciones reales la conducta del proceso es, con las consiguientes salvedades,
bastante similar a la del AR (1) pero las raíces complejas incorporan comportamientos distintos.
Como estas raíces están relacionadas con exponenciales, las que pueden expresarse mediante las
funciones seno y coseno que están caracterizadas por desarrollos ondulatorios, cabe esperar que
estos desarrollos estén presentes cuando se analiza un AR (2) cuyas raíces son complejas.
Para que el proceso sea estacionario en forma débil se requiere que: las raíces características del
polinomio ( 1- L a1 – L2 a2 ) se hallen fuera del círculo unitario. Ahora bien, como es más
conveniente expresar esta relación en función de los coeficientes del modelo y recordando la
relación inversa entre las raíces puede escribirse ai < 1 . En este caso i =1,2. Estas condiciones
referidas al círculo unitario implican: 1) a2 < 1 ; 2) a2 - a1 < 1 y 3) a1 + a2 <1.
a1 a 2 + 4a2 a1 a 2 + 4 a2
- + 1 y - - 1 se verifica que si a12 > 4a2 son reales y distintas, si
2a2 2a2 2a2 2 a2
a12 = 4a2 son reales e iguales y si a12 < 4a2 son complejas conjugadas.
Si las raíces son reales la función de autocorrelación decae a medida que aumenta el lag, si las
raíces son complejas posee características sinusoidales, su gráfica es ondulatoria.
La función de autocorrelación parcial presenta dos picos significativos en las dos primeras
autocorrelaciones parciales.
A modo de ejemplo se presentará un modelo AR (2) estacionario con raíces complejas, cuya
ordenada al origen, a0, valga 0 , con perturbaciones normales cuya varianza es: Var (ε t ) = 4. Se
utilizarán 500 observaciones.
Una de esas raíces será: 0,3 + (0,09 - 4.0,5) ½ = 0,3 + 1,38 i donde i representa a la unidad
imaginaria, esto es i = (-1) ½ . La conjugada de esta es: 0,3 – 1,38 i.
Para generar el proceso se efectuaron los siguientes pasos: 1) Se generó la serie alea=2*nrnd, esta
es una serie normal con desvío estándar 2 y varianza 4. 2) se generó la serie y=2. 3) se generó la
El término aleatorio tiene media cero y varianza 4, la instrucción y=2 es la que hace que la serie se
inicie en el valor 2 ya que es el primer valor de la serie.
El gráfico de la serie se presenta más abajo. Una primer ojeada parece mostrar que es estacionario,
que no tiene tendencia ya sea esta creciente o decreciente y que los valores fluctúan en torno a la
media cero. Sin embargo uno no puede confiarse en la vista puesto que lo que uno ve y opina en
consecuencia puede no congeniar con lo que otro ve y lo que a su vez opina sobre lo mismo y si
bien una visión del gráfico es importante, esto no asegura que se cumplan las especificaciones
técnicas comentadas anteriormente, es decir, a partir del gráfico y sobre todo en casos de duda,
uno puede creer que la serie es estacionaria cuando las pruebas estadísticas indican lo contrario.
Y
8
-4
-8
-12
50 100 150 200 250 300 350 400 450 500
En el diagrama gráfico que sigue se pueden observar los estadísticos suministrados por el
Eviews.
Se ve que la media es cero. La varianza del proceso se puede calcular mediante la fórmula:
(1 - a2 )s e2
Var ( yt ) =
(1 + a2 )[(1 - a2 ) 2 - a12 ]
En nuestro ejemplo esta apreciación teórica, resulta 5,56 con un desvío estándar de 2,36.
Fue obtenida reemplazando el valor de los parámetros, a1 = 0,3 y a2 = -0, 5, en la fórmula
precedente y es comparable con el valor suministrado por el Eviews que es 2,52.
50
Series: Y
Sample 1 500
40 Observations 500
Mean -0.009020
30 Median 0.187458
Maximum 6.759619
Minimum -8.899268
20 Std. Dev. 2.524218
Skewness -0.233447
Kurtosis 3.141750
10
Jarque-Bera 4.960066
Probability 0.083740
0
-8 -6 -4 -2 0 2 4 6
En el gráfico siguiente se presentan las autocorrelaciones, las autocorrelaciones parciales y
los estadísticos ya comentados. Se puede apreciar el carácter ondulatorio de la función de
autocorrelación y que la función de autocorrelación parcial presenta solo dos picos
significativos correspondientes a las dos primeras autocorrelaciones. El test de Bartlett
indica que los límites de la zona crítica son ± 0,089; estos valores son superados por las dos
primeras autocorrelaciones parciales. El test Q muestra, por ejemplo, que la primer
autocorrelación es distinta de cero.
El próximo paso puede consistir entonces en analizar las correlaciones entre los datos para
obtener alguna información adicional. Esto se puede efectuar considerando el correlograma
con el cual presumiblemente podemos pensar que un AR de orden 2, explique
satisfactoriamente el pgd.
Si efectuamos una regresión mediante MCO utilizando el Eviews, con y como variable dependiente
y como regresores a esta misma variable rezagada uno y dos períodos podríamos tener más
asidero para sustentar nuestra conjetura. Los resultados se presentan seguidamente.
Dependent Variable: Y
Prob(F-statistic) 0.000000
El estadístico “t” indica que solo la constante no es significativamente distinta de cero, por
lo que habría que descartarla del modelo, en cambio la muestra presenta evidencias que los
otros parámetros son distintos de cero.
40 Mean -0.014699
Median 0.064167
Maximum 5.749982
30 Minimum -6.166241
Std. Dev. 2.058431
20 Skewness -0.160993
Kurtosis 2.902906
10 Jarque-Bera 2.346877
Probability 0.309302
0
-6 -4 -2 0 2 4 6
Por último, se efectuó nuevamente la regresión, pero suponiendo que se trata de un AR(3)
es decir se ha incorporado Y(-3) en el cálculo. Se puede observar que los resultados
sugieren que el parámetro correspondiente a Y(-3) no es significativamente distinto de cero,
concordando con el pgd del modelo.
Dependent Variable: Y
Este requerimiento de síntesis que es común en los análisis científicos, ha sido denominado
“parsimonia” por los autores G. Box y G. Jenkins en su libro Time Series Analysis
Forecasting and Control, Holden Day 1976, quienes prácticamente estructuraron la
metodología de las series cronológicas a tal punto que a esta se la suele denominar
metodología de Box-Jenkins.
Ejercicios.
2. Con los datos del ejercicio anterior efectúe 3 regresiones empleando un AR(1), un AR(2)
y un AR(3). Analice los valores t- Student de cada modelo, los otros estadísticos y el
correlograma de los residuos. Compare los resultados y extraiga conclusiones.
-b1
En el MA (1) la autocorrelación de orden 1 vale: r1 = y vale cero si se trata de una
1 + b12
autocorrelación de orden superior. Es decir la función de autocorrelación presenta un solo
valor distinto de cero.
El gráfico sugiere que se trata de una serie estacionaria. El modelo fue elaborado para que
su media fuera 1 y para que su varianza resultara 4,64 o bien que su desvío estándar fuera
2,15. Estos resultados se pueden obtener aplicando las fórmulas de media y varianza
presentadas más arriba con los valores propuestos para el modelo.
Y
10
-2
-4
-6
-8
50 100 150 200 250 300 350 400 450 500
50
Series: Y
Sample 1 500
40 Observations 499
Mean 1.042765
30 Median 1.029320
Maximum 8.193766
Minimum -5.979475
20 Std. Dev. 2.341380
Skewness 0.140900
Kurtosis 2.964754
10
Jarque-Bera 1.676919
Probability 0.432376
0
-6 -4 -2 0 2 4 6 8
El test de Bartlett indica que los límites de la región crítica para las funciones de
autocorrelación y de autocorrelación parcial con un nivel de significación del 5% con 500
observaciones son: ± 2/ (500)½ = ± 0,0894. Se aprecia que solo la primer autocorrelación
supera a ese nivel y que las autocorrelaciones parciales declinan gradualmente, indicio de
que este proceso puede identificarse como un MA(1).
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
Cuál es el significado de esto?. Por una parte que si │b 1│<1 el MA (1) es invertible, es
decir se transforma en un AR infinito y esto a su vez indica una síntesis o parsimonia del
modelo MA en el sentido que con los pocos términos (ε t - b1 ε t -1) representa los infinitos
términos del otro. De todos modos, otra interpretación de esto es una comprobación del
problema que representa el azar: el MA representa azar, ruido, lo no explicado, así que
necesito infinitos términos para hallar una “explicación”.
Esto significa también que el AR es parsimonioso con respecto al MA ya que con un solo
término explicativo a1 yt -1 cumple lo que al MA le demanda infinitos términos.
yt = ε t - b1 ε t-1 - b2 ε t - 2
Ejercicios.
1) Genere un MA (2) sin constante con b1 = -0,4 ; b2 = 0,5 y {ε t } ruido blanco normal
con varianza 9. Número de observaciones: 500. Grafique y comente los resultados.
4) Con los datos obtenidos en el ejercicio 1 estime el modelo mediante el Eviews, obtenga
el correlograma de los residuos y explíquelo con referencia particular a los tests Q y de
Bartlett.
En los modelos ARMA (1, 1) tanto las funciones de autocorrelación como las de
autocorrelación parcial decaen exponencialmente, pero esta última tiene una forma más
complicada.
50
Series: Y
Sample 1 500
40 Observations 500
Mean -0.150129
30 Median -0.156165
Maximum 3.182568
Minimum -2.942601
20 Std. Dev. 1.096396
Skewness 0.033370
Kurtosis 2.785262
10
Jarque-Bera 1.053473
Probability 0.590529
0
-3 -2 -1 0 1 2 3
Puede observarse que las funciones de autocorrelación y de autocorrelación parcial declinan y que
presentan valores significativamente distintos de cero.
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
Los resultados de la regresión que se consignan más abajo muestran que los coeficientes
son: el autoregresivo 0,64 y el de medias móviles 0,46, comparables con los suministrados
al modelo que fueron 0,60 y 0,40 respectivamente.
Se puede apreciar que los estadísticos t muestran que los coeficientes son
significativamente distintos de cero y que el correlograma de los residuos sugiere que estos
son ruido blanco, es decir no aportan información adicional al modelo. Los valores críticos
de los estadísticos Q y de Bartlett no son superados por las autocorrelaciones estimadas
para ese modelo.
Dependent Variable: Y
Method: Least Squares
MA Backcast: 1
Ejercicios.
1. Genere un Arma (2;1) sin constante donde a1 = 0,50; a2 = 0,30 y b1 = 040. Emplee 500
observaciones y ε t ~ N ( 0,1). Muestre los estadísticos y el correlograma.
2. Con los datos del Ejercicio 1 efectúe una regresión utilizando el modelo original Arma
(2,1) y alternativamente los modelos Arma (2,2), AR(3), MA(2). En cada caso halle el
correlograma de los residuos. Comente los resultados.
Enero de 2010