Anda di halaman 1dari 14

EJEMPLO DE APLICACIN DE MODELIZACIN ARIMA A LA SERIE DE COTIZACIONES DIARIAS DE TERRA - LYCOS NOVIEMBRE 1999 A JUNIO 2001

CURSO DE TCNICAS DE PREVISIN DE VARIABLES FINANCIERAS PROGRAMA CITIUS

Junio 2001 Prof. Rafael de Arce Dpto. de Economa Aplicada Rafael.dearce@uam.es

MODELIZACIN DE LA COTIZACIN DIARIA DE TERRALYCOS DESDE EL 18/11/99 HASTA EL 25/06/01


El objetivo de este documento es ilustrar el empleo de un modelo ARIMA para la prediccin de la evolucin diaria de un activo financiero. En este caso se han tomado los valores de la empresa TERRA-LYCOS. A lo largo del documento se irn indicando los procedimientos seguidos en el programa e-views para obtener la informacin que aparece y se comenta. Las instrucciones utilizadas en la barra de E-views para la obtencin de la salida correspondiente se escriben en azul y en cursiva. Los pasos que se exponen intentarn cubrir las siguientes etapas en la identificacin de un modelo ARIMA: A. Determinacin de la estacionariedad en media y en varianza de la serie a modelizar: filtrado y anlisis de orden de integacin. B. Identificacin de la serie a partir del correlograma y por comparacin con los modelos tericos elementales. C. Estimacin del modelo propuesto en la fase (B) y comprobacin de la presencia de un ruido blanco. D. Prediccin con el modelo propuesto

A.- PROCURANDO LA ESTACIONARIEDAD EN MEDIA Y EN VARIANZA Estacionariedad en media PRIMER GRFICO DE LA SERIE ORIGINAL: CONSTRATACIN DE DOS TENDENCIAS (Plot ultimo)
160 140 120 100 80 60 40 20 0 50 100 150 200 ULTIMO 250 300 350 400

Para comenzar el anlisis se propone hacer el grfico de la serie original ya que, intuitivamente, si dicho grfico presenta algn tipo de tendencia, sta ser signo claro de no estacionariedad en media; es decir, la media no ser constante para todas las observaciones del proceso aleatorio a modelizar. En el ejemplo propuesto (la serie es la del valor de cierre diario de la accin de TERRALYCOS, al que hemos llamado ultimo), es clara la presencia de dos momentos de tendencias opuestas. La primera se produce desde el inicio de la serie hasta la observacin 67 (para ver la serie se puede escribir el comando show ultimo y comprobar as que, efectivamente, es el punto 67 donde se alcanza el mximo del primer perodo ascendente). La segunda ocurre desde la observacin 68 hasta el final del perodo. Adems, la primera tendencia podra quedar bien definida de forma lineal; mientras que la segunda se asemejara ms a una tendencia parablica. En cualquier caso, esto se puede comprobar haciendo ambas (u otras) para cada perodo y observando el R cuadrado obtenido y su ajuste grfico. Despus de comprobar con un ajuste lineal, uno parablico, uno exponencial, etc, se determin que el mejor ajuste posible era uno lineal hasta la observacin 67 y otro parablico desde la observacin 68 hasta el final. Para distinguir ambas situaciones, se gener una variable ficticia
1,...DESDEOBS 67 FICDESDE 68 = 0.............RESTO

para generar dicha variable se sigui la siguiente secuencia de valores en e-views: SMPL 1 400 GENR FICDESDE68 = 0 SMPL 68 400 GENR FICDESDE68 = 1 SMPL 1 400 Para describir la tendencia lineal del primer perodo (hasta la observacin 67), se gener la siguiente variable:
1,2,3,4,...HASTAOBS 67 FIC 67 = 0.............RESTO

la cadena de comandos empleados en E-views fue la siguiente: SMPL 1 400 GENR FIC67 = 0 SMPL 1 1 GENR FIC67 = 1 SMPL 2 67 GENR FIC67 = 1+FIC67(-1) SMPL 1 400

El resultado de estimar el modelo propuesto para la tendencia fue el siguiente (LS ULTIMO C FIC67 FICDESDE68 @TREND @TREND()^2 )
Dependent Variable: ULTIMO Method: Least Squares Sample: 1 400 Included observations: 400 Variable C FIC67 FICDESDE68 @TREND() @TREND()^2 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 15.73859 2.414181 126.2561 -0.734680 0.001025 0.916777 0.915934 9.451406 35284.98 -1463.525 0.129704 Std. Error 2.335531 0.064977 3.894582 0.029691 6.27E-05 t-Statistic 6.738765 37.15426 32.41840 -24.74460 16.36686 Prob. 0.0000 0.0000 0.0000 0.0000 0.0000 42.51412 32.59763 7.342625 7.392518 1087.817 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

GRFICO DE AJUSTE TENDENCIA Y RESIDUO (pulsando la solapa superior RESID)


150

100 40 50 20 0 0

-20 50 100 Residual 150 200 250 Actual 300 350 Fitted 400

Dando por suficiente esta estimacin de la tendencia (todos los parmetros son significativamente diferentes de cero a la luz del contraste t-estadstico y la R cuadrado es bastante elevada. Adems, el grfico nos muestra un buen grado de acompaamiento de la serie real actual - y la tendencia propuesta fitted -), obtenemos, empleando como serie filtrada de tendencia el residuo de esta regresin, una serie con media constante. Se emplea como serie filtrada de tendencia (es decir, serie estacionaria en media) la diferencia entre la serie original y esta tendencia estimada; es decir, el residuo de la regresin anterior.
ULTIMO I = TENDENCIA I + FILTRADAI FILTRADAI = ULTIMO I TENDENCIA I

Para guardar la serie del residuo de forma que el propio e-vierws no la vaya cambiando al hacer nuevas regresiones, escribimos: MAKERESID FILTRADA Siendo esta nueva serie FILTRADA la que utilizaremos para la modelizacin ARIMA.

Estacionariedad en varianza Para ello seguiremos las fases propuestas por Dolado y otros (1992) en la aplicacin del contraste Ampliado de Dickey-Fuller, que se podran resumir en las siguientes: 1. Determinar una regresin con trminos autorregresivos suficientes para eliminar la posible autocorrelacin en el residuo, as como con trmino independiente y variable de tendencia. Por supuesto, incluyendo la variable endgena (sin diferenciar) con un retardo. 2. Comprobar que, efectivamente, el residuo no est correlacionado (Durbin Watson). Si es as, comprobar la significatividad de la tendencia (t-estadstica comparada con las tablas de McKinnon). Si no lo fuera, re-estimar el modelo suprimiendo esta variable explicativa. Si lo es, comprobar la significatividad del trmino constante y proceder del mismo modo. 3. Cuando, con o sin estos trminos, hayamos cerrado este proceso, comparar el valor de la t-estadstica de la variable endgena con los valores tabulados de Mckinnon. Si aceptamos la nulidad del parmetro (valor absoluto de la testadstica inferior al de Mckinnon), diremos que la serie tiene por lo menos una raz unitaria, siendo necesaria diferenciarla una vez para eliminarla. 4. En cualquier caso, deberemos comprobar, para la serie ya diferenciada por tener una raz, si existe una segunda raz, repitiendo el proceso ahora con la endgena igual a dos diferencias de la original.

1.- Aplicacin del contraste al modelo no restringido ms amplio posible:


FILTRADA = FILTRADAt FILTRADAt 1 = c + at + bFILTRADAt 1 + FILTRADAt i
i=1 4

En E-views: SHOW FILTRADA PULSAR EN VIEW Y EN LA OPCIN Unit Root Test

La ventana siguiente preguntar cuantos retardos poner en el autorregresivo (cuatro por defecto) y sobre qu serie (en niveles, primeras diferencias o segundas diferencias). DJESE EN PRIMERAS DIFERENCIAS. INCLYASE TENDENCIA (TREND) Y CONSTANTE (INTERCEPT).

El resultado es el siguiente:
ADF Test Statistic -2.803379 1% Critical Value* 5% Critical Value 10% Critical Value -3.9853 -3.4229 -3.1341

*MacKinnon critical values for rejection of hypothesis of a unit root. Augmented Dickey-Fuller Test Equation Dependent Variable: D(FILTRADA) Method: Least Squares Sample(adjusted): 6 400 Included observations: 395 after adjusting endpoints Variable FILTRADA(-1) D(FILTRADA(-1)) D(FILTRADA(-2)) D(FILTRADA(-3)) D(FILTRADA(-4)) C @TREND(1) R-squared Adjusted R-squared S.E. of regresin Sum squared resid Log likelihood Durbin-Watson stat Coefficient -0.051342 0.184603 -0.185851 -0.008835 -0.204581 -0.085285 0.000241 0.130288 0.116839 3.190202 3948.827 -1015.183 1.940777 Std. Error 0.018314 0.049856 0.050574 0.050060 0.049381 0.326667 0.001408 t-Statistic -2.803379 3.702753 -3.674845 -0.176479 -4.142939 -0.261076 0.171174 Prob. 0.0053 0.0002 0.0003 0.8600 0.0000 0.7942 0.8642 -0.022221 3.394675 5.175608 5.246120 9.687455 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Sobre este resultado hay que comentar: A partir del contraste estadstico de Durbin-Watson (1,94), se puede confirmar que no hay autocorrelacin o que el nmero de retardos elegido ha sido suficiente para eliminar sta. Si no fuera as, habra que aumentar el nmero de retardos antes de seguir adelante, aunque cuatro son casi siempre suficientes. El valor del ADF (2.803379) es inferior al de Mackinnon, por lo que podramos sospechar la existencia de una raz unitaria. An as, este punto no se puede confirmar hasta encontrarnos con un modelo en el que las explicativas sean significativas (tendencia y constante), ya que, por el momento, los estadsticos t estn sesgados a la baja. Por lo anterior, en siguiente lugar comprobaremos si ha de incluirse o no la explicativa tendencia (@trend(1)). Observando la t-stastistic parece claro que no 1 y que la probabilidad de equivocarme cuando rechazo la hiptesis de nulidad del parmetro de esta variable es del 86,42%. Por ello, se vuelve a estimar este modelo, ahora sin incluir el trmino TREND o incluyendo slo INTERCEPT.

Repitiendo el proceso en E-Views, al llegar a esta pantalla:

Lo correcto sera comprobar esta t-statistic con las tablas de McKinnon al efecto, pero la diferencia sera muy pequea, por lo que aqu miraremos directamente el valor comparado con la t de Student habitual.

La salida obtenida entonces es la siguiente


ADF Test Statistic -2.804595 1% Critical Value* 5% Critical Value 10% Critical Value -3.4490 -2.8691 -2.5708

*MacKinnon critical values for rejection of hypothesis of a unit root. Augmented Dickey-Fuller Test Equation Dependent Variable: D(FILTRADA) Method: Least Squares Date: 06/27/01 Time: 17:29 Sample(adjusted): 6 400 Included observations: 395 after adjusting endpoints Variable FILTRADA(-1) D(FILTRADA(-1)) D(FILTRADA(-2)) D(FILTRADA(-3)) D(FILTRADA(-4)) C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -0.051295 0.184623 -0.185811 -0.008828 -0.204490 -0.036588 0.130222 0.119043 3.186219 3949.125 -1015.198 1.940792 Std. Error 0.018289 0.049793 0.050510 0.049998 0.049316 0.160349 t-Statistic -2.804595 3.707780 -3.678676 -0.176562 -4.146499 -0.228175 Prob. 0.0053 0.0002 0.0003 0.8599 0.0000 0.8196 -0.022221 3.394675 5.170620 5.231059 11.64815 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Es preceptivo ahora comprobar la significatividad del trmino constante. Como ocurre lo mismo que con la tendencia, deberemos estimar un modelo sin ste tampoco:

El resultado de estimacin es el siguiente:


ADF Test Statistic -2.807441 1% Critical Value* 5% Critical Value 10% Critical Value -2.5708 -1.9403 -1.6161

*MacKinnon critical values for rejection of hypothesis of a unit root. Augmented Dickey-Fuller Test Equation Dependent Variable: D(FILTRADA) Method: Least Squares Date: 06/27/01 Time: 17:31 Sample(adjusted): 6 400 Included observations: 395 after adjusting endpoints Variable FILTRADA(-1) D(FILTRADA(-1)) D(FILTRADA(-2)) D(FILTRADA(-3)) D(FILTRADA(-4)) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -0.051284 0.184719 -0.185718 -0.008760 -0.204343 0.130106 0.121184 3.182345 3949.654 -1015.224 1.940787 Std. Error 0.018267 0.049731 0.050447 0.049936 0.049252 t-Statistic -2.807441 3.714355 -3.681424 -0.175422 -4.148929 Prob. 0.0052 0.0002 0.0003 0.8608 0.0000 -0.022221 3.394675 5.165691 5.216057 14.58262 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Donde ahora se puede contrastar si el parmetro de la variable original retardada es nulo o no a partir de las tablas de McKinnon. En el caso de confirmarse este extremo, hablaramos de la existencia de una raz o de que, por lo menos, la serie es integrada de orden uno. En nuestro ejemplo, el valor de la t-stastic (cociente entre el parmetro y la desviacin tpica del mismo estimadas) es superior en valor absoluto a los valores tabulados por McKinnon, por lo que rechazamos la nulidad del mismo. Es decir, decimos que la serie es ya integrada de orden cero o, lo que es lo mismo, ESTACIONARIA EN VARIANZA con una probabilidad del 99%.

ADF Test Statistic

-2.807441

1% Critical Value* 5% Critical Value 10% Critical Value

-2.5708 -1.9403 -1.6161

B. IDENTIFICACIN DEL PROCESO GENERADOR DE DATOS O DE LA ESTRUCTURA ARIMA Una vez confirmadas, u obtenidas mediante las necesarias transformaciones, la estacionariedad en media y varianza de la serie, procedemos a identificar cul es el proceso ARIMA que mejor se ajusta a la forma de la funcin de autocorrelacin de esta serie a partir de las funciones de autocorrelacin tericas definibles para distintos procesos: AR(1) AR(2) MA(1) MA(2) ARMA(1,1) Por citar los ms corrientes Escribimos la funcin de autocorrelacin total y parcial de la serie FILTRADA en E views: IDENT FILTRADA (a la pregunta sobre el nmero de lags pondremos algo que nos permita comparar tres ejercicios completos, tanto en la parte regular como en la estacional) .
yt yt yt yt yt = 0 + 1 yt 1 + t = 0 + 1 yt 1 + 2 yt 2 + t = 0 + 1 t 1 + t = 0 + 1 t 1 + 1 t 2 + t = 0 + 1 yt 1 + 2 t 2 + t

Este correlograma coincide de forma muy aproximada con el de un proceso AR(1), por lo que estimamos el modelo como:
FILTRADA = 0 + 1FILTRADA1 + t t t

C. ESTIMACIN DEL MODELO PROPUESTO En E-views LS FILTRADA C AR(1) , obtenindose la siguiente salida:

Dependent Variable: FILTRADA Method: Least Squares Date: 06/27/01 Time: 17:49 Sample(adjusted): 2 400 Included observations: 399 after adjusting endpoints Convergence achieved after 4 iterations Variable C AR(1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Inverted AR Roots Coefficient -0.623517 0.932811 0.874197 0.873880 3.335433 4416.670 -1045.790 1.633207 .93 Std. Error 2.490868 0.017760 t-Statistic -0.250321 52.52350 Prob. 0.8025 0.0000 -0.033326 9.392037 5.252082 5.272077 2758.718 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

40

20

30 20 10 0 -10 -20 50 100 Residual 150 200 250 Actual 300 Fitted 350 400

-20

Donde, el coeficiente del autorregresivo es significativo y el ajuste es del 87,4%. Si la identificacin es plenamente correcta, el correlograma del residuo de esta regresin debe presentar un ruido blando, comprobable grficamente o con el estadstico de Box Pierce o el de L-JUNG BOX2, siendo ste ltimo el que aparece en la salida a la izquierda:
A partir de una serie de simulaciones sobre la Q de Box-Pierce, se comprob que este estadstico podra estar infravalorando el nivel de significacin a partir del cual se debe rechazar la existencia de un ruido
2

IDENT RESID

Autocorrelation .|* *|. *|. *|. .|* .|. .|. .|. *|. .|. .|* .|. .|. .|* | | | | | | | | | | | | | |

Partial Correlation .|* *|. .|. **|. .|* *|. .|. .|. .|. .|. .|* .|. .|. .|* | | | | | | | | | | | | | | 1 2 3 4 5 6 7 8 9 10 11 12 13 14

AC 0.181 -0.122 -0.090 -0.185 0.092 0.034 0.017 0.030 -0.071 0.021 0.121 0.044 -0.024 0.098

PAC 0.181 -0.161 -0.038 -0.189 0.162 -0.085 0.056 -0.023 -0.018 0.025 0.123 -0.005 -0.019 0.165

Q-Stat Prob 13.231 19.266 22.575 36.405 39.861 40.320 40.437 40.806 42.869 43.051 49.078 49.862 50.094 54.087 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

El valor de la Q-Stat (L Jung-Box) nos muestra una probabilidad igual a cero de que haya alguna autocorrelacin en el residuo; es decir, afirma que estamos ante un Ruido Blanco. Si no lo fuera, deberamos aumentar el modelo especificado incluyendo otros trminos ARIMA visibles en el propio correlograma del RESID. E. UTILIZACIN DEL MODELO PARA PREDECIR Ya se ha obtenido un modelo que se podra resumir como:

blanco. Por ello se propuso la correccin a la frmula anterior que ahora por L Jung Box y que intenta paliar este problema de infravaloracin.

Q * ( k ) = N( N + 2) ( N t )1 rt 2 k2
t =1

Con este criterio, valores de la Q experimental calculada segn esta expresin superiores al valor tabulado de la chi-cuadrado nos llevaran a rechazar la existencia de un ruido blanco (los valores de la funcin de autocorrelacin seran, globalmente, diferentes de cero).

Para predecir esta serie FILTRADA, hay que poner un SMPL a futuro y presionar el botn Forecast:

Obtendremos entonces una serie de prediccin llamada FILTRADAF. Para obtener la serie de las acciones de TERRA-LYCOS de prediccin, deberemos incorporar a sta el valor de prediccin de la tendencia, para lo cual no habr ms que dar valores a futuro a las variables empleadas @trend() ya los da por defecto e-views -, FIC67 FICDESDE68. Aplicando los coeficientes de la regresin: (LS ULTIMO C FIC67 FICDESDE68 @TREND @TREND()^2 ) Obtendremos ahora un FORECAST para los cinco perodos siguientes:

Para obtener nuestra prediccin de TERRA LYCOS, tan slo ser necesario sumar la prediccin de la serie filtrada (FILTRADAF) y la de la tendencia (ULTIMOF): SMPL 375 405 GENR TERRAPRED= FILTRADAF + ULTIMOF

Anda mungkin juga menyukai