Anda di halaman 1dari 18

Predicciones de Valores Temporales,

Caso de Uso: Bolsa de Valores


Diego Vel asquez Ros
diego.velasquez@ucsp.edu.pe
Universidad Cat olica San Pablo
Ciencia de la Computaci on
Arequipa - Per u
10 de Diciembre del 2011
Abstract
Este documento presenta un conjunto de procedimientos de minera de
datos, obteniendo indicadores econ omicos que ayudan a la construcci on
de predicciones de corto plazo para un nivel de actividad econ omica; los
cuales ser an indexados a una red neuronal para aprovechar la informaci o
y disminuir el riesgo de cualquier empresario para la toma de desiciones
en cuanto a la inversi on dentro de la bolsa de valores que se har a uso como
caso de estudio la bolsa de valores del Per u.
1 Introducci on
Tradicionalmente, la prediccion de agregados macroeconomicos se ha realizado
utilizando modelos estructurales que se construyen alrededor de las relaciones
que se derivan de la Teora Economica. Estas estimaciones se utilizan prin-
cipalmente para realizar el dise no y la evaluacion de la poltica economica de
mediano y largo plazo.
Sin embargo, es frecuente que en el ejercicio real de la Polotica Macroeconomica
se requieran predicciones de muy corto plazo. Por ejemplo, en la alta direccion
del Sector P ublico se necesita decidir el lmite de gasto p ublico en un determi-
nado mes, para lo cual se deben estimar los ingresos tributarios de ese perodo.
Como es sabido, la recaudacion por impuestos esta principalmente determi-
nada por el nivel de actividad economica. Por lo tanto un buen indicador de
la evolucion del producto se reejara en una correcta prediccion del nivel de
ingresos, y con ello en una buena decision respecto al monto de gastos que se
efectuara.
Otra utilidad de estas predicciones de frecuencia corta es que permiten prever
la inminencia de una recesion, con lo cual las autoridades economicas tendran
un margen de accion que les ayude a minimizar los efectos de estas inevitables
uctuaciones de las economas en la produccion y en el empleo.
1
En este contexto, las relaciones en las que se basan los Modelos Macroeconometricos
pueden verse afectadas por el ruido propio de una frecuencia corta. A su vez, los
modelos econometricos son estructuras complicadas que utilizan gran cantidad
de variables exogenas, que deben ser un tipo de entrada para las predicciones.
Es decir, las predicciones de estos modelos son condicionales a que los valores
que se han supuesto respecto a las variables exogenas sean validos. En modelos
para economoas peque nas y abiertas como la Peruana, las variables exogenas
tpicamente suelen ser: precios de commodities, terminos de intercambio, crec-
imiento de la demanda mundial, entre otras. Como es claro, los supuestos que
se hagan sobre estas variables, ademas de implicar un alto costo en tiempo de
investigacion y analisis de la coyuntura internacional suelen tener un alto mar-
gen de error, invalidando las predicciones de las variables endogenas.
Es por ello que desde hace mucho tiempo se vienen utilizando metodologas
estadsticas basadas en el concepto de Indicadores & Lderes para realizar
predicciones de la evolucion futura del nivel de actividad en el muy corto
plazo. Estas tecnicas, a pesar de ser bastante antiguas recien se han gener-
alizado en nuestro pas. En particular bancos y consultoras privadas realizan
un seguimiento de estos indicadores y los utilizan para efectuar pronosticos
de corto plazo. Ademas, un reciente informe del Consorcio de Investigacion
Economica propone tambien la utilizacion de un indicador adelantado, que es
conceptualmente consistente con el que aqu se presenta. A su vez, debido al de-
sarrollo reciente de los metodos cuantitativos en la Ciencia Economica, han ido
apareciendo nuevas tecnicas que aunadas a la mejora tecnologica de las mod-
ernas computadoras han puesto a disposicion de los investigadores una serie
de metodologas que permiten obtener mejores y mas acertadas estimaciones y
predicciones.
1.1 Problema - Objetivo
La cantidad de datos que administra la bolsa de valores es grande, pero aun asi
no solo la transfomacion y comprension de dichos datos son relevantes para que
un empresrio tome una desicion de inversion conable; la experiencia es la parte
mas importante en este proceso, ya que aumenta el porcentaje de abilidad para
el empresario que se dedca o labora en este campo.
Para poder determinar la abilidad de los datos y por ende para la toma de
desiciones nal, es que se optara por aplicar un modelo de predicciones estad
isticas indexado a una minea de series temporales.
2 Conceptos
2.1 Series Temporales
Una serie temporal es una secuencia de valores observados a lo largo del tiempo,
y, por tanto, ordenados cronologicamente. Aunque el tiempo es una variable
continua, en la practica se usan mediciones en periodos equidistantes. Dada
esta denicion, resulta difcil imaginar alg un area cientca en la que no aparez-
can datos que puedan ser considerados como series temporales.
2
Hoy en da el analisis de colecciones de datos ordenados en el tiempo es fun-
damental en muchos campos como la ingeniera, la medicina o el mundo de
los negocios. Estudiar como se ha comportado una variable hasta el momento
puede ser de gran valor a la hora de predecir su comportamiento futuro. Del
mismo modo, determinar que otros valores han tenido un comportamiento sim-
ilar puede ayudar a decidir las acciones que se deberan llevar a cabo, bien sea
para conservar la evolucion actual o bien para modicarla radicalmente.
Se puede pensar que con una comparacion secuencial de dos series temporales
dadas bastara para saber si son similares o no. Sin embargo, no se trata de
realizar un rastreo secuencial de dos secuencias temporales sino que se trata
de encontrar metodos o tecnicas que ayuden a disminuir ese rastreo. Esto es
muy importante si se tiene en cuenta la cantidad de informacion que se puede
encontrar en determinadas bases de datos, sobre todo si se tiene que extraer
informacion especca de un dominio concreto. Las tecnicas que facilitan la
extraccion de informacion de estas bases de datos forman parte del campo de
la minera de datos.
Lo primero que se necesita para poder hacer minera de datos con series tempo-
rales es una medida de la distancia ([2] , [3]) entre dos secuencias temporales. Lo
que se pretende es buscar secuencias temporales que se parecen entre s, buscar
aquellas secuencias que se parecen a una dada o buscar patrones de compor-
tamiento dentro de una secuencia temporal. En denitiva, se necesita estudiar
cuando dos secuencias temporales son similares o no y por lo tanto una primera
cuestion importante es establecer una medida de la distancia. Sin embargo,
en muchos casos, esto no es suciente dado que es necesario un paso previo
de limpieza y transformacion de las secuencias temporales antes de proceder a
la comparacion propiamente dicha. Estas transformaciones forman parte del
analisis de las series temporales, tanto lineales [4], como no lineales. Los traba-
jos desarrollados hasta la fecha buscan series o secciones de series temporales
que se parecen entre s. Sin embargo, en algunos ambitos puede ser necesario
buscar una seccion de la serie caracterstica, normalmente denominada patron.
Existen varios trabajos relacionados con la b usqueda de patrones, campos como
la estadstica, el procesamiento de la se nal [5], algoritmos geneticos, y el re-
conocimiento de voz, los cuales ofrecen una variedad de tecnicas que se pueden
elegir para formalizar una algoritmo de comparacion.
Encontrar patrones ha sido una de las tareas basicas de la Ciencia. En oca-
siones se encuentran simetras que sirven para la prediccion del comportamiento
de ciertos fenomenos, incluso antes de que se entienda la razon o causa que jus-
tica esa conducta.
Si dados los valores pasados de una serie no es posible predecir con total -
abilidad el siguiente valor esperado de la variable objeto de estudio, se dice que
la serie es no determinista o aleatoria. Este comportamiento es el que, en prin-
cipio, parecen tener las series temporales de la demanda economica nanciera.
En este contexto se engloba este estudio: se pretende demostrar la existencia
de un comportamiento logico y ordenado de las curvas de precios utilizando
procedimientos propios de minera de datos. Evidentemente, aunque el valor
futuro de una serie temporal no sea predecible con total exactitud, para que
3
tenga interes su estudio, el resultado tampoco puede ser completamente aleato-
rio, existiendo alguna regularidad en cuanto a su comportamiento en el tiempo
haciendo posible su modelado y, por ende, su prediccion. Por tanto, el objetivo
nal es el de realizar una estimacion de valores futuros de la demanda en funcion
del comportamiento pasado de la serie, ya que este hecho servira para hacer una
buena planicacion de recursos en funcion de la demanda esperada en el futuro
prevista por el modelo.
Figure 1: Ejemplo de series temporales de la bolsa de valores
Modelado de Series Temporales
La forma tpica de comenzar a analizar una serie temporal es mediante su rep-
resentacion graca. Para tal n, se utiliza un sistema cartesiano en el que los
valores o periodos de tiempo se llevan al eje de abscisas y los valores de la se-
rie, se llevan al eje de ordenadas. El resultado es un diagrama de dispersivon,
con la particularidad de que el eje de abscisas se reserva siempre a la misma
variable: el tiempo. Mediante este tipo de representacion se pueden detectar
las caractersticas mas sobresalientes de una serie, tales como la amplitud de las
oscilaciones, la posible existencia de ciclos, los puntos de ruptura o la presencia
de valores atpicos o anomalos. La metodologa utilizada para estudiar las se-
ries temporales se basa fundamentalmente en descomponer las series en varias
componentes: tendencia,variacion estacional o periodica y otras uctuaciones
irregulares.
1. Tendencia. Es la direccion general de la variable en el periodo de ob-
servacion, es decir el cambio a largo plazo de la media de la serie. Para
determinar claramente si una serie responde a una determinada ley (crec-
imiento, decrecimiento o estabilidad) se requiere que esta posea un n umero
bastante elevado de muestras. Dicha tendencia puede corresponder a di-
versos perles, tales como lineal, exponencial o parabolico. Cuando se
4
analiza este factor, se prescinde de las variaciones a corto y medio plazo.
Este parametro resulta de vital importancia al aplicar tecnicas de clus-
tering, ya que sera precisamente este parametro el que se utilizara para
modelar los diferentes grupos generados y sobre el que se realizaran las
medidas de distancia para ver si un elemento pertenece a un grupo o a
otro.
2. Estacionalidad. Corresponde a uctuaciones periodicas de la variable,
en periodos relativamente cortos de tiempo. Esta componente tiene un
marcado caracter economico.
3. Otras uctuaciones irregulares (Aleatoriedad). Despues de extraer
de la serie la tendencia y variaciones cclicas, nos quedara una serie de
valores residuales, que pueden ser, o no, totalmente aleatorios. Se trata
de una circunstancia similar a la del punto de partida, pues ahora tambien
interesa determinar si esa secuencia temporal de valores residuales puede
o no ser considerada como aleatoria pura. Los factores que causan estas
variaciones son de diferente ndole y son muy difciles de aislar y predecir.
No obstante, si por alguna causa se es capaz de determinar que factores
son los que afectan a una serie temporal y se asume una inuencia de-
terminista una vez ocurridos, se podra pensar en estos valores como
precursores de cambios en la tendencia de la serie.
Figure 2: Descomposicion de una serie temporal en sus componentes
5
2.1.1 Defnicion de volatilidad
En nuestros das el termino volatilidad ha adquirido una gran importancia para
cualquier persona relacionada con los mercados nancieros, aunque solo sea
como espectador. Para la mayora volatilidad es sinonimo de riesgo, pero para
los operadores nancieros este termino adquiere diferentes signicados seg un
sea el rol que desempe nen en el mercado. Por lo tanto, se debe entender a la
volatilidad no como un unico parametro, sino como un conjunto de conceptos
relacionados entre s.
Ejemplo:
Volatilidad de una accion: Parametro que mide el riesgo total de una
accion, esto es, el riesgo diversicable y el riesgo de mercado. Proporciona
una medida de la dispersion o variabilidad de la rentabilidad de dicha
accion. Matematicamente es la desviacion estandar de la rentabilidad de
las acciones de una empresa.
Volatilidad de una opcion: Hace referencia a la volatilidad del activo
subyacente al que se reere la opcion.
Volatilidad implcita: Es la volatilidad que, de acuerdo con las carac-
tersticas de la opcion, se ha de introducir en la formula de valoracion para
obtener el precio al que cotiza la opcion
Volatilidad de las instituciones nancieras: El riesgo administrativo
de las entidades nancieras puede ser calculado mediante la estimacion de
probabilidad de riesgo de default, comparando las garantas y plazos de
los valores prestados con los plazos de los valores tomados.
La propia estructura del mercado nos presenta los precios de los activos -
nancieros como un proceso que evoluciona a lo largo del tiempo, de igual forma
la rentabilidad derivada de esos cambios posee una estructura temporal asociada
a los cambios en los precios, por ende es adecuado considerar a la volatilidad
como una serie temporal y no como un unico parametro que se mantiene a lo
largo del tiempo. Podemos, entonces, denir inicialmente a la volatilidad como
una medida de la intensidad de los cambios aleatorios o impredecibles en la
rentabilidad o en el precio de un valor. Gracamente se asocia la volatilidad
con la amplitud de las uctuaciones del rendimiento en torno a su valor medio.
La clasica vision de la volatilidad como una constante de la funcion de dis-
tribucion de los rendimientos de un activo nanciero quedo obsoleta hace ya
mucho tiempo, para dar paso a una nueva idea del concepto de volatilidad que
se ajusta mucho mas a la vision del fenomeno de la gran variabilidad de los
mercados nancieros. Los modelos nanciero-econometricos se adaptan a esta
nueva realidad de la volatilidad. Introducen que cada vez mas nuevos factores,
tal vez algo mas subjetivos, pero mas adecuados a esta cambiante realidad.
6
2.1.2 Caractersticas de la Volatilidad
Repasando la literatura nanciera se puede admitir que la volatilidad se carac-
teriza por:
Exceso de curtosis: La distribucion de los rendimientos presenta un
elevado grado de concentracion alrededor de los valores centrales de la
variable.
Existencia de clusters: periodos de alta y baja volatilidad. Si la volatil-
idad es alta en un periodo, tiende a seguir si

A c ndolo; si es baja en un
periodo tiende a seguir siendo baja en el periodo siguiente.
Discontinuidades de saltos en los precios: De manera ocasional se
pueden producir valores altos de volatilida en momentos concretos.
Los periodos de alta y baja volatilidad acostumbran a venir seguidos
de periodos en los que la volatilidad es mas moderada a largo plazo.
Comportamiento asimetrico de las series: La volatilidad puede ser
afectada de forma diferente (con rendimientos positivos o negativos) seg

A
o
n
lleguen al mercado buenas o malas noticias. Los rendimientos negativos,
mayores y m

As infrecuentes llevan a incrementos mayores en las futuras


volatilidades.
Movimientos conjuntos de la volatilidad: cuando se estudian difer-
entes series endito mercado, se observa como los movimientos importantes
en un mercado est

An relacionados con movimientos importantes en otros


mercados. Esto pone en evidencia la utilidad de los modelos multivariantes
para serie temporales, pues permiten analizar estas relaciones cruzadas.
2.2 Minera de Series Temporales
La minera de datos es una de las tecnicas mas utilizadas actualmente para
analizar la informacion de las bases de datos. No es mas que una etapa, aunque
la mas importante, del descubrimiento de la informacion en bases de datos
(KDD o Knowledge discovery in databases), entendiendo por descubrimiento
la existencia de una informacion valiosa pero desconocida y escondida con an-
terioridad. Este proceso consta de varias fases, como se detalla mas adelante,
e incorpora distintas tecnicas del aprendizaje automatico, las bases de datos,
la estadstica, la inteligencia articial y otras areas de la informatica y de la
informacion en general.
Algunos autores distinguen dos tipos de minera de datos[1]:
1. Mdp o minera de datos predictiva, es decir, prediccion de datos, basicamente
tecnicas estadsticas. Las tareas de datos que producen modelos predic-
tivos son la clasicacion y la regresion.
2. Mddc o minera de datos para el descubrimiento del conocimiento, us-
ando basicamente tecnicas de ingeniera articial, siendo estas las tecnicas
descritas en este trabajo. Las tareas que producen modelos descriptivos
son el agrupamiento (clustering), las reglas de asociacion secuenciales y el
analisis correlacional, como se vera mas delante.
7
Clustering o agrupamiento. En sntesis, consiste en la obtencion
de grupos, que tienen los elementos similares, a partir de los datos.
Estos elementos u objetos similares de un grupo son muy diferentes
a los objetos de otro grupo.
Reglas de asociacion. Su objetivo es identicar relaciones no
explcitas entre atributos categoricos. Una de las variantes de re-
glas de asociacion es la secuencial, que usa secuencias de datos.
Analisis correlacional. Utilizada para comprobar el grado de simil-
itud de los valores de dos variables numericas.
El proceso de minera de datos tiene unas indiscutibles ventajas que se
pueden sintetizar en las siguientes:
Proporciona poder de decision a los usuarios y es capaz de medir las
acciones y resultados de la mejor manera.
Contribuye a la toma de decisiones tacticas y estrategicas.
Supone un ahorro economico a las empresas y abre nuevas posibilidades
de negocio.
Es capaz de generar modelos prescriptitos y descriptivos.
2.2.1 Pasos necesarios para la extraccion de conocimiento
Como se se nalo al comienzo del captulo, la minera de datos es solo una fase
de un proceso mas amplio cuya nalidad es el descubrimiento de conocimiento
en bases de datos (KDD). Independientemente de la tecnica que se use en el
proceso de extraccion de datos, los pasos que deben ser seguidos son siempre
los mismos:
1. Denicion del problema. En el proceso de minera de datos el primer
paso consiste en denir claramente el problema que se intenta abordar.
2. Integracion y recopilacion de datos. En un primer momento, hay
que localizar las fuentes de informacion, y los datos obtenidos se llevan a
un formato com un para que resulten mas operativos.
3. Filtrado: seleccion, limpieza y transformacion de datos. Una
vez homogeneizados los datos, se ltran y se rechazan los no validos o los
incorrectos, seg un las necesidades, o bien se corrigen o se reduce el n umero
de variables posibles mediante clustering, redondeo, etc.
4. Fase de minera de datos. Algoritmos de extraccion de conocimiento
Esta fase es la mas caracterstica y por ese motivo se suele denominar
minera de datos a todo el proceso en KDD.
Obtencion de un modelo de conocimiento
Una vez realizado el ltrado, se tiene que producir nuevo conocimiento
que pueda ser utilizado por el usuario. Hay que obtener un modelo de
conocimiento que se base en los datos recopilados y para ello hay que
8
determinar la tarea de minera mas adecuada, descriptiva o prescriptiva;
posteriormente, elegir el tipo de modelo aunque pueden tambien usarse
varias tecnicas a la vez para generar distintos modelos teniendo en cuenta
que cada tecnica obliga a un preproceso diferente de los datos.
5. Fase de interpretacion y evaluacion del modelo. Una vez que ya
hemos obtenido el modelo hay que proceder a su validacion, comprobando
que las conclusiones son validas y satisfactorias, es decir, vericando si los
resultados obtenidos son coherentes.
Figure 3: Fases de una minera de datos
3 Prediccion de series temporales: tecnicas y
modelos a comparar
Cuando se habla de tecnica de prediccion se hace referencia a aquellas tecnicas
dirigidas a descubrir comportamientos regulares que sean capaces de modelar
la conducta de un sistema. Consecuentemente, una aplicacion inmediata es
la de saber como evolucionaran los valores de una serie temporal. La mayor
parte del esfuerzo se invierte en descubrir los patrones de comportamiento y,
por esta razon, es un tema que esta en constante investigacion [54]. El mayor
inconveniente que se encuentra en este tipo de tareas es la alta correlacion que
puede llegar a existir entre los atributos.
9
3.1 Prediccion basada en metodos lineales
Los metodos de prediccion lineales son aquellos que intentan modelar el com-
portamiento de una serie temporal mediante una funcion lineal. Entre estos
metodos se destacan los modelos AR, MA, ARMA y ARIMA. Estos modelos
son una clase de procesos estocasticos y tienen una metodologa com un. Para
construir ambos modelos se siguen los pasos siguientes:
1. Identicacion del modelo bajo ciertas hipotesis.
2. Estimacion de parametros.
3. Validacion del modelo.
4. Prediccion.
Modelos ARCH y GARCH
Los modelo ARCH y GARCH se concentran principalmente en modelar los
cambios de varianza (o volatilidad). Generalmente estos modelos no llevan a un
mejor pronostico puntual de la serie, pero pueden llevar a una mejor estimacion
de la varianza, lo que permite tener intervalos de prediccion mas conables y una
mejor medicion del riesgo. Esto puede ser especialmente importante en algunas
series de tiempo economicas y nancieras, en las que pueden existir cambios im-
portantes en la varianza de la serie a lo largo del tiempo. Engle (1982) propuso
el modelo ARCH, que signica modelo auto regresivo condicionalmente hete-
rocedastico, el cual hace parte de la familia de modelos adecuados para modelar
la volatilidad de una serie.
Una clase mas general de modelos, los GARCH (modelos generalizados auto
regresivos condicionalmente heterocedasticos), que extiende la clase de los mod-
elos ARCH, fue introducida por Bollerslev (1991). En estos la estructura de la
varianza condicional depende, ademas del cuadrado de los errores retrasados q
perodos como en el modelo ARCH(q), de las varianzas condicionales retrasadas
p perodos.
Modelo EGARCH o exponential GARCH
Los modelos GARCH no reejan completamente la naturaleza de la volatil-
idad de algunos activos nancieros. Estos modelos no tienen en cuenta un
comportamiento asimetrico propio de la volatilidad de los retornos de las series
nancieras, que es el efecto de apalancamiento. En otras palabras, la volatilidad
se comporta diferente frente a innovaciones positivas que frente a negativas. No
reacciona de la misma manera frente a un alza en el precio de un activo que con
respecto a una cada en el precio de este. En los modelos GARCH, dado que la
volatilidad depende del cuadrado de los errores, esta es afectada simetricamente
por las innovaciones positivas y negativas. Ademas, los parametros para la
volatilidad tienen restricciones: deben ser no negativos. Modelan el efecto de
asimetra de los GARCH.
10
3.2 Prediccion basada en metodos no lineales
Los metodos de prediccion no lineales son aquellos que intentan modelar el
comportamiento de una serie temporal mediante una funcion no lineal. Esta
funcion no lineal suele ser combinacion lineal de funciones no lineales cuyos
parametros hay que determinar. Los metodos globales se basan en encontrar
una funcion no lineal que modele los datos de salida en funcion de los datos
de entrada. Dentro de los metodos globales no lineales se encuentran las redes
neuronales articiales que presentan la ventaja de que no necesitan conocer la
distribucion de los datos de entrada, las maquinas de vector soporte (SVM)
que son unos clasicadores muy potentes de losofa similar a las RNA y la
Programacion Genetica (PG) donde se puede elegir que tipo de funcion no
lineal modela el comportamiento de los datos.
Redes neuronales
Las redes neuronales buscan una solucion a determinados problemas como la
evolucion de unos sistemas inspirados en el cerebro humano y no como una se-
cuencia de pasos, tal y como se hace habitualmente. Estos sistemas, por tanto,
poseen una cierta inteligencia que resultante de combinar elementos simples de
proceso interconectados, neuronas, que operan de manera paralela son capaces
de resolver determinadas tareas entre las que destacan la prediccion, la opti-
mizacion, el reconocimiento de patrones o el control.
Existen cuatro aspectos que caracterizan una red neuronal: su topologa, el
mecanismo de aprendizaje, tipo de asociacion realizada entre la informaci on
de entrada y salida, y la forma de representacion de estas informaciones.
1. Topologa de las redes neuronales. La arquitectura de las redes neu-
ronales consiste en la organizacion y disposicion de las neuronas formando
capas mas o menos alejadas de la entrada y salida de la red. En este
sentido, los parametros fundamentales de la red son: el n umero de capas,
el n umero de neuronas por capa, el grado de conectividad y el tipo de
conexiones entre neuronas.
2. Mecanismo de aprendizaje.El aprendizaje es el proceso por el cual una
red neuronal modica sus pesos en respuesta a una informacion de entrada.
Los cambios que se producen durante el proceso de aprendizaje se reducen
a la destruccion, modicacion y creacion de conexiones entre las neuronas,
la creacion de una nueva conexion implica que el peso de la misma pasa
a tener un valor distinto de cero, una conexion se destruye cuando su
peso pasa a ser cero. Se puede armar que el proceso de aprendizaje ha
nalizado (la red ha aprendido) cuando los valores de los pesos permanecen
estables.
11
3. Tipo de asociacion entre las informaciones de entrada y salida.
Las redes neuronales articiales no son mas que sistemas que almace-
nan cierta informacion aprendida. Dicha informacion se registra de forma
distribuida en los pesos asociados a las conexiones entre neuronas de en-
trada y salida. Existen dos formas primarias de realizar esa asociacion de
entrada/salida. Una primera sera la denominada heteroasociacion, que
se reere al caso en el que la red aprende en parejas de datos [(A
1
,B
1
),
(A
2
,B
2
)...(A
n
,B
n
)], de tal forma que cuando se presente cierta informacion
de entrada A
i
, debera responder generandola correspondiente salida B
i
.
La segunda se conoce como autoasociacion, donde la red aprende cier-
tas informaciones A
1
,A
2
...A
n
, de tal forma que cuando se le presenta una
informacion de entrada realizara una autocorrelacion, respondiendo con
uno de los datos almacenados, el mas parecido al de la entrada. Estos
dos mecanismos de asociacion de asociacion dan lugar a dos tipos de redes
neuronales: las redes heteroasociativas y las autoasociativas.
4. Representacion de la infomacion de entrada y salida. Las redes
neuronales pueden tambien clasicarse en funcion de la forma en que se
representan las informaciones de entrada y las respuestas o datos de salida.
As un gran n umero de redes, tanto los datos de entrada como de salida son
de naturaleza analogica, cuando esto ocurre, las funciones de activacion de
las neuronas seran tambien continuas, del tipo lineal o sigmoidal. Otras
redes solo admiten valores discretos o binarios a su entrada, generando
tambien unas respuestas en la salida de tipo binario. En este caso, las
funciones de activacion de las neuronas son de tipo escalon.
Figure 4: Ejemplo de una Red Neuronal
12
4 Implementaci on
4.1 Pasos Previos a un modelo ARCH
El inversionista tiene interes en analizar media y varianza condicional y al emisor
le interesa, ademas, la media y varianza no condicional. Comencemos con un
modelo autorregresivo de primer orden:
y
t
= r
0
+ r
1
y
t1
+ a
t
(1)
donde el termino a
t
es un proceso de ruido blanco: sucesion de variables aleato-
rias, independientes y con media constante, suponemos igual a cero y varianza
asimismo constante
E(a
t
) = 0; V ar(a
t
) =
2
a (2)
La media no condicional (la posicion de largo plazo):
E [y
t
] =
r
0
1 r
1
(3)
La media condicional al tiempo t(la posicion de corto plazo):
E [y
t+1
|
t
] = r
0
+ r
1
y
t
(4)
donde y
t
es parte del conjunto de informacion
La varianza no condicional es constante y es dada por:
V ar [y
t
] =

2
1 r
2
1
(5)
La varianza condicional es constante y es dada por:
V ar [y
t
E [y
t1
|
t1
]] =
2
(6)
Es importante tener en cuenta que la media y varianza condicionales ofrecen
informacion relevante que no se debe desechar. La varianza condicional es mas
peque na por lo que el riesgo inversor es menor:

2
1 r
2
1
>
2
(7)
13
4.2 Modelos ARCH
La estructura basica del modelo es:
y
t
= a
t
.
t
(8)

2
t
=
0
+
1
.y
2
t1

0
> 0, 0 <
1
< 1 (9)
Sustituyendo (8) en (9)
y
t
=
_
_

0
+
1
.y
2
t1
_
.E
t1
(y
t
) = 0 (10)
su esperanza y varianza condicional son:
V ar
t1
(y
t
) = E
t1
y
2
t1
=
_

0
+
1
.y
2
t1
_
.E
t1
_
a
2
t
_
=
0
+
1
.y
2
t1
(11)
por lo que la varianza condicional de los rendimientos vara en funcion de la
realizacion del proceso y
t
.
En resumen tenemos que:
E [a
t
] = 0
1. La varianza no condicional de a
t
es constante:
E
_
a
2
t

=

0
1
1
2. La media condicional es:
E [a
t
|
t1
] = 0
3. La varianza condicional esta dada por:
E
_
a
2
t
|
t1

=
0
+
1
.a
2
t1
Lo importante es que la serie a
t
es no correlacionada. Es decir no existen
relaciones lineales entre sus valores en distintos instantes en el tiempo. Sin
embargo los errores no son independientes ya que estan relacionados por sus
segundos momentos por una ecuacion en diferencias. Es decir que y
2
t
si esta
autocorrelacionado.
14
A medida que el valor de
1
se acerque mas a uno, tendremos el analogo
a una caminata al azar en la varianza y a medida que
1
se acerque a cero,
el efecto ARCH tendra poca persistencia. Extendiendo esta clase de manera
general obtenemos:
a
t
= V
t
_

0
+
1
a
2
t1
+
1
a
2
t1
+ ... +
q
a
2
tq
(12)
siendo

0
> 0

q
0
La ecuacion (12) se llama un ARCH(q) con estos se incorpora al analisis los
fenomenos de volatilidad variable, como son los episodios de alto nerviosismo o
incertidumbre en el mercado.
Su varianza condicional estara dada por:

2
t
=
0
+
1
a
2
t1
+ ... +
q
a
2
tq
4.3 Modelos EGARCH o exponencial de GARCH
Para explicar bien este modelo se hace referencia a la curva de impactos
asimetricos en la cual hacen notar que en el mercado de capitales no reper-
cuten igual las buenas noticias que las malas noticias, los movimientos a la baja
en el mercado vienen con mayores volatilidades que los movimientos al alza.
Cuando el rendimiento cae por abajo de lo esperado nos lleva a un escenario
donde las noticias son malas, esto viene asociado a la observacion de que la
volatilidad se incrementa y por otra parte cuando las noticias son buenas la
volatilidad disminuye.
Este modelo permite que la volatilidad condicional sea una funcion asimetrica
del pasado de los datos, su forma funcional puede ser escrita como:
a
t
= V
t

2
t
log(
2
t
) =
0
+
1
_
a
t1

2
t1
_
+
1
log(
2
t1
) +
_

a
t

2
t1

_
2

_
El modelo EGARCH permite que las noticias buenas o malas (shocks),
afecten a la volatilidad de diferentes maneras. El lado izquierdo de la ecuacion
es el logaritmo de la varianza condicional. Esto implica que el efecto palanca es
exponencial mas que cuadratico.
La persistencia en la volatilidad viene indicada por el parametro , mientras
que
1
mide la magnitud del efecto apalancamiento. La hipotesis del efecto
apalancamiento se testea con la signicatividad de
1
, si este coeciente es dis-
tinto de cero signica que el impacto es asimetrico. En este modelo se espera
que
1
< 0, lo que implicara que innovaciones negativas tuviesen un mayor
impacto sobre la volatilidad que innovaciones positivas de igual tama no.
15
El caso general sera:
a
t
= V
t

2
t
(13)
log(
2
t
) =
0
+ g
_
a
t1

2
t1
_
+
p

j=1

j
g
_
a
tj1

2
tj1
_
+
q

i=1

i
log
_

2
ti
_
(14)
Para esto se recomienda utilizar la funcion g como:
g(z) =
1
z +
2
(|z| E |z|) (15)
5 Resultados
Figure 5: Indice del Producto Bruto Real Peruano
16
Figure 6: Resultados con datos de tipo de cambio de dolar en el Peru, usando
indicadores y estadisticas pre-procesadas para insertarlo en los Modelos GARCH
y EGARCH
6 Propuesta
Los porcentajes de conabilidad que plantean las diferentes tecnicas que se usan
en estadsticas nancieras para que un empresario pueda descidir invertir o no en
la bolsa de valores no son tan buenos, es por eso ellos optan por sus conocimien-
tos y experiencia en el campo para disminuir los riesgos
Una ves optenidos los datos procesados y transformados en una minera de
series temporales, usaremos una red neuronal para aumentar la conabilidad de
los datos y disminuir el porcentaje de riesgos que puede tener un empresario al
tomar una desicion de inversi on en la bolsa de valores.
17
References
[1] U. M. Fayyad, G. Piatetski-Shapiro, and P. Smith From data mining to
knowledge discovery. AAAI-MIT Press, 1996.
[2] T. H. Cormen and C. E. Leiserson. Introduction to algorithms. The MIT
Press, 2003.
[3] H. V. Jagadish. A retrieval technique for similar shapes. ACM SIGMO
Symp, on the Management of Data, 1991.
[4] A. Matus-Castillejos and R. Jentzsch. A time series data management
framework. IEEE Proceedings of the International Conference on Infor-
mation Technology: Coding and Computing, 2005.
[5] R. Hippenstiel, H. El-Kishky, and P. Radev. On time-series analysis and
signal classication. IEEE Conference Record of the 38th Asilomar Con-
ference on Signals, Systems and Computers, 2004.
[6] Rafael de Arce. Introducci on a los Modelos Autoregresivos con Het-
erocedasticidad condicional(ARCH). Programa de Doctorado en Mod-
elizacion Economica del Instituto LR Klein diciembre de 1998.
http://www.uam.es/otroscentros/klein/doctras/doctra9806.pdf
[7] Fabian Moerchen Algorithms For Time Series Knowledge Mining. Hans-
Meerwein-Str., Marburg, Germany, Databionic Research Group
[8] Hyong-Jun Kim, Seong-Min Yoon, Hwan-Gue Cho Capability and Lim-
itation of Financial Time-Series Data. Prediction using Symbol String
Quantization International Conference on Convergence and Hybrid Infor-
mation Technology, 2009.
[9] Jessica Lin Eamonn Keogh Stefano Lonardi Jerey P. Lankford Donna M.
Nystrom Visually Mining and Monitoring Massive Time Series. Com-
puter Science & Engineering Department University of California, River-
side
[10] Bera, A. K. y M.L. Higgins A Ssurvey of ARCH models: properties, esti-
mation and testing. Journal of economics surveys, num 7, 1993
[11] Marta Casas Monsegny, Edilberto Cepeda Cuervo MODELOS ARCH,
GARCH Y EGARCH: APLICACIONES A SERIES FINANCIERAS.
[12] De Arce, Rafael Introducci on a los modelos autoregresivos con heterocedas-
ticidad condicional (ARCH).. I. L. Klein, diciembre de 1998
18

Anda mungkin juga menyukai