Anda di halaman 1dari 61

Series Temporales y Minera de

flujos de datos
Seminario: Software para procesamiento de
series temporales y flujo de datos

Parte I: Series Temporales

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
ndice
Prerrequisitos.
Series Temporales en R. Instalacin de paquetes.
Lectura de datos. Formato y creacin de objetos de series.
Metodologa de anlisis y modelado.
Anlisis de tendencia en R.
Anlisis de estacionalidad en R.
Estacionaridad.
Modelos ARIMA y seleccin del modelo.
Prediccin.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Prerrequisitos
En este seminario se asume lo siguiente:

El alumno conoce las tcnicas para anlisis y prediccin de


series temporales impartidas en clase de teora.
El alumno est familiarizado con el entorno R.
El alumno tiene instalado en el PC el entorno R y la
biblioteca tseries (recomendable tambin R Studio).
El alumno ha descargado los ficheros de apoyo a este
seminario.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Prerrequisitos: Repaso de teora
Modelo AR(p): p

X (t ) i X (t i ) (t )
i 1

Modelo MA(q):
q

X (t ) (t ) i
(t i )
i 1

Modelo ARMA(p, q): p q

X (t ) i X (t i ) (t ) i
(t i )
ACF: i 1 i 1

Cov [ X ( t ), X ( t k )]
k
Var [ X ( t )] Var [ X ( t k )]

PACF: Mide la dependencia/contribucin concreta que tiene un


instante anterior k para predecir el instante actual.
Manuel Pegalajar Cullar (manupc@decsai.ugr.es)
Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Prerrequisitos: Comandos tiles de R
Conviene repasar el uso de los siguientes comandos en R, de uso
habitual:
Gestin de ficheros: setwd(carpeta), list.files(), scan ,
Gestin de memoria de trabajo: rm(list=ls()),
Scripts y bibliotecas: source(script), library,
Creacin de matrices: rbind, cbind,
Diferenciacin e integracin discreta: diff, diffinv,
Grficos: plot, plot.ts, lines,
Obtencin de ayuda: ?comando

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
ndice
Prerrequisitos
Series Temporales en R. Instalacin de paquetes.
Lectura de datos. Formato y creacin de objetos de series.
Metodologa de anlisis y modelado.
Anlisis de tendencia en R.
Anlisis de estacionalidad en R.
Estacionaridad.
Modelos ARIMA y seleccin del modelo.
Prediccin.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series temporales en R. Instalacin de paquetes
Para trabajar con series temporales en R, es recomendable contar
con las bibliotecas de Series Temporales que estn disponibles en el
repositorio R-CRAN. Instalar el paquete tseries:
Install.packages(tseries); Install.packages(DAAG)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series temporales en R. Instalacin de paquetes
Otras bibliotecas de R especializadas en series temporales:
forecast, astsa, etc.
Cmo leer/cargar una biblioteca para usar sus funciones: comandos
library/require

Carga la biblioteca

Proporciona ayuda sobre un comando dado

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
ndice
Prerrequisitos
Series Temporales en R. Instalacin de paquetes.
Lectura de datos. Formato y creacin de objetos de series.
Metodologa de anlisis y modelado.
Anlisis de tendencia en R.
Anlisis de estacionalidad en R.
Estacionaridad.
Modelos ARIMA y seleccin del modelo.
Prediccin.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Lectura de datos. Formato y creacin de series
Usualmente, los datos estarn en un fichero con formato estndar
(texto plano, csv, etc.). Para leer un fichero:
1. Establecer la ruta del directorio donde deseamos trabajar.
2. Cargar los datos con funciones estndar de R (scan, read,
etc.). Ejemplo:
setwd: Cambia el directorio de trabajo

list.files: Lista los ficheros en el directorio de trabajo

scan: Lee un fichero de datos en forma de vector

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Lectura de datos. Formato y creacin de series
Podemos tambin encontrar los datos en formato de tabla.
1. Leer la tabla
2. Transformarla al formado deseado. Ejemplo:

read.table: Lee tabla desde fichero.


skip=1: Salta la primera lnea

Seleccionamos las columnas de


inters, y las pasamos a serie (array)
numrico

ts: Crea un objeto serie temporal, comenzando


en enero de 1949, con una frecuencia de 12
meses
Manuel Pegalajar Cullar (manupc@decsai.ugr.es)
Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Lectura de datos. Ejemplo
Carguemos los datos de la serie SerieLaboratorioDatos.dat y
mostrmosla por pantalla.

setwd: Cambia el directorio de trabajo si no


ests en l

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
ndice
Prerrequisitos
Series Temporales en R. Instalacin de paquetes.
Lectura de datos. Formato y creacin de objetos de series.
Metodologa de anlisis y modelado.
Anlisis de tendencia en R.
Anlisis de estacionalidad en R.
Estacionaridad.
Modelos ARIMA y seleccin del modelo.
Prediccin.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series estacionarias y no estacionarias
La metodologa Box-Jenkins para TSP engloba:
Dividir la serie X(t) en tendencia T(t), estacionalidad S(t) y una
componente irregular ( E(t) ). Enfoque aditivo:
X(t)= T(t) + S(t) + E(t)
Clculo de la tendencia:
regresiones, filtrado de la seal, diferenciacin, etc.
Clculo de la estacionalidad:
Valor medio de los valores de la serie dentro del mismo punto
estacional.
Metodologa:
Eliminar tendencia y estacionalidad de la serie,
Hacer E(t) estacionaria y aplicar mtodos paramtricos
Manuel Pegalajar Cullar (manupc@decsai.ugr.es)
Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Metodologa de anlisis y modelado
La metodologa que seguiremos para modelar series debe seguir los
siguientes pasos:
1. Anlisis de tendencia. Tiene tendencia la serie? Modelarla
y eliminarla.
2. Anlisis de estacionalidad. Sufre la serie de
estacionalidad? Modelarla y eliminarla.
3. Estacionaridad. Es estacionaria la serie? En caso
contrario, hacerla estacionaria.
4. Aplicar modelos paramtricos. En nuestro caso, modelos
autorregresivos y de medias mviles.
5. Prediccin. Predecir en base a todas las componentes
modeladas.
Manuel Pegalajar Cullar (manupc@decsai.ugr.es)
Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
ndice
Prerrequisitos
Series Temporales en R. Instalacin de paquetes.
Lectura de datos. Formato y creacin de objetos de series.
Metodologa de anlisis y modelado.
Anlisis de tendencia en R.
Anlisis de estacionalidad en R.
Estacionaridad.
Modelos ARIMA y seleccin del modelo.
Prediccin.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Tendencia. Ejemplo
Parece que la serie podr modelarse con tendencia lineal. Si la
diferenciamos X(t) X(t)-X(t-1), deberamos obtener una serie
con media prxima a 0.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Tendencia. Ejemplo
Adems, observamos que la varianza no vara a lo largo de la
serie. Si no fuese as, la serie necesitara un pre-procesamiento (por
ejemplo, transformacin logartmica). Todo esto es con vistas a
validar la estacionariedad de la serie.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Tendencia. Comprobacin de preprocesamiento
Aqu vemos un ejemplo de serie que s necesitara una
transformacin logartmica para asegurarnos posteriormente de que
sea estacionaria.

Se nota claramente cundo una serie necesita pre-


procesamiento para alcanzar estacionariedad (media y varianza
constantes a lo largo de la serie)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Tendencia: Mtodos
Estimacin funcional: Aproximar la tendencia de la serie como
una funcin. Requiere realizar hiptesis sobre el modelo que rige la
tendencia. Ejemplo (I): Modelo lineal.
Filtrado: Esta opcin consiste en aplicar un filtro de medias
mviles para estimar la tendencia. 1
k /2

X (t )
k
X (t i )
i k / 2

Filtrado

Regresin cuadrtica

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Tendencia: Mtodos
Diferenciacin: Se diferencia la seal hasta que desaparezca la
tendencia. X ( t ) X ( t ) X ( t 1 )
En R: Xprima<- diff(X)

Diferenciacin

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Tendencia. Ejemplo
Volvamos a nuestro ejemplo.
En principio, parece que una tendencia lineal puede ser buena
opcin:

lm: Linear Model


serie= f(tiempo)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Tendencia. Ejemplo
Mostramos la serie junto con el modelo de tendencia:

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Tendencia. Ejemplo
Parece buena aproximacin, pero debemos asegurarnos. Mostrar
los residuos nos puede ayudar a ver que el error se distribuye
uniformemente.
Un test estadstico nos puede ayudar a ver que el error se
distribuye de forma normal.
Aceptamos el modelo.
(supera el test)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Tendencia. Ejemplo
Por ltimo, eliminamos la tendencia de la serie.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
ndice
Prerrequisitos
Series Temporales en R. Instalacin de paquetes.
Lectura de datos. Formato y creacin de objetos de series.
Metodologa de anlisis y modelado.
Anlisis de tendencia en R.
Anlisis de estacionalidad en R.
Estacionaridad.
Modelos ARIMA y seleccin del modelo.
Prediccin.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Comprobacin de estacionalidad: Ejemplo
La estacionalidad es una componente de la serie que, de estar
presente, implica que varios valores de un intervalo se repiten
consecutivamente a lo largo del tiempo, con un periodo determinado.
La grfica de ACF puede ayudar a calcular el periodo.

La grfica muestra
periodicidad de longitud
12

Otras alternativas: FFT, alisado de Holts-Winter, etc.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Anlisis de estacionalidad en R
Cmo calcular los valores de la estacionalidad? Para un periodo P,
calculando la media para cada valor desde 1 hasta el periodo, de los
valores de la serie X espaciados de P en P. Ejemplo para P=12:

S(1)=media(X(1), X(13), X(25), X(37)...)


S(2)=media(X(2), X(14), X(26),X(38) ...)
S(3)=media(X(3), X(15), X(27),X(39) ...)
...
S(11)=media(X(11), X(23), X(35), ...)
S(12)=media(X(12), X(24), X(36), ...)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Clculo de estacionalidad: Ejemplo
Calcularemos en R la estacionalidad para nuestro ejemplo:

Estos son los valores


que se repiten a lo
largo de toda la serie

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Eliminar la estacionalidad: Ejemplo
Para eliminar la estacionalidad, restaremos los valores de la misma
en toda la serie:

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Eliminar la estacionalidad: Ejemplo
Posteriormente, restamos la estacionalidad a la serie sin tendencia:

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
ndice
Prerrequisitos
Series Temporales en R. Instalacin de paquetes.
Lectura de datos. Formato y creacin de objetos de series.
Metodologa de anlisis y modelado.
Anlisis de tendencia en R.
Anlisis de estacionalidad en R.
Estacionariedad.
Modelos ARIMA y seleccin del modelo.
Prediccin.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series estacionarias y no estacionarias
Una serie estacionaria es aquella cuya media y varianza no
varan con el tiempo.
La estacionaridad (no confundir con estacionalidad) indica que
las propiedades estadsticas de la serie no varan en el tiempo y, por
tanto, los datos pueden estudiarse bajo un mismo modelo
paramtrico independiente del tiempo.
La condicin de estacionaridad es un requisito que debe
cumplirse para poder aplicar modelos paramtricos de anlisis y
prediccin de series de datos.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series estacionarias y no estacionarias
Cmo saber si una serie es estacionaria?
Test estadsticos: Dickey-Fuller Ampliado (Test ADF)
Grficamente: Observando las grficas de autocorrelacin
(ACF) y autocorrelacin parcial (PACF).

En R:
acf(serie), pacf(serie): Grficos de ACF y PACF de una serie.
adf.test(serie) (paquete tseries): Test ADF. El valor
resultante pvalue < 0.05 indica que la serie es estacionaria con
un nivel de confianza del 95%.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series estacionarias y no estacionarias
Si la serie es estacionaria, la grfica del ACF debe converger
rpidamente a 0. Ejemplos de ACFs de series NO estacionarias:

ACF ACF

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series estacionarias y no estacionarias
Si la serie es estacionaria, la grfica del ACF debe converger
rpidamente a 0. Ejemplos de ACFs de series estacionarias:

ACF ACF ACF

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series estacionarias: Ejemplo
Volvamos a nuestro ejemplo: Es la serie estacionaria?

Parece que s, pero no podemos estar completamente seguros.


Deberemos probar varios modelos para asegurarnos.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series estacionarias: Ejemplo
Volvamos a nuestro ejemplo: Es la serie estacionaria?
Si la serie es estacionaria, pasaramos a construir un modelo
ARIMA (p, 0, q).
Si no es estacionaria, pasaramos a buscar la diferenciacin d
necesaria para construir un modelo ARIMA(p, d, q)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series estacionarias: Ejemplo

Por tanto, en este punto tenemos ya dos posibles modelos:


Un ARIMA(p, 0, q)
Un ARIMA(p, 2, q)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
ndice
Prerrequisitos.
Series Temporales en R. Instalacin de paquetes.
Lectura de datos. Formato y creacin de objetos de series.
Metodologa de anlisis y modelado.
Anlisis de tendencia en R.
Anlisis de estacionalidad en R.
Estacionariedad.
Modelos ARIMA y seleccin del modelo.
Prediccin.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Clculo de parmetros p y q de un modelo ARIMA
El clculo se realiza visualizando los ACF y PACF de la serie.
No existe una regla concreta para obtencin de los parmetros
ptimos en todos los casos, pero s una gua de ayuda:
El ACF de un modelo ARMA (p,0) decrece
rpidamente hacia cero (con valores positivos, negativos,
alternando o con forma sinusoidad). Su PACF indica el
valor de p, contabilizando la posicin del ltimo valor
distinto de 0 (que no est por debajo del umbral).
Un valor se considera distinto de cero si no est en el rango (-
2/sqrt(N), 2/sqrt(N)), con N=longitud de la serie.
Para modelos ARMA(0, q), la gua es simtrica entre el ACF y el
PACF. No hay gua para los ARMA(p, q).

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Clculo de parmetros p y q de un modelo ARIMA
Ejemplos de ACF para modelos ARMA(p, 0) (PACF para
ARMA(0, q):

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Clculo de parmetros p y q de un modelo ARIMA
Ejemplos de PACF para modelos ARMA(p, 0) (PACF para
ARMA(0, q):

Valor=1
Valor=2

Valor=3

Valor=2
Valor=2

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Clculo de parmetros p y q: Ejemplo
Volvamos a nuestra serie. Asumamos el modelo ARIMA(p, 0, q)
(el otro modelo se abordar ms adelante). Calcularemos p y q a
partir de los ACF y PACF.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Clculo de parmetros p y q: Ejemplo
Volvamos a nuestra serie. Asumamos el modelo ARIMA(p, 0, q)
(el otro modelo se abordar ms adelante). Calcularemos p y q a
partir de los ACF y PACF.

En base a los resultados, estaramos ante un modelo


ARIMA(2, 0, 0)
Manuel Pegalajar Cullar (manupc@decsai.ugr.es)
Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Clculo de parmetros p y q: Ejemplo
Asumamos ahora el modelo ARIMA(p, 2, q). Calcularemos p y q
a partir de los ACF y PACF.

Podra ser un
ARIMA(0, 2, 1 2)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Clculo de parmetros p y q: Ejemplo
Por tanto, hemos concluido que:
El modelo podra ser ARIMA(2, 0, 0), si asumimos
irrelevantes los picos que quedan muy poco por encima del
umbral en el ACF de la serie sin tendencia ni estacionalidad.
El modelo podra ser ARIMA(0, 2, X), si asumimos
relevantes los puntos, donde X podra ser o 1, o 2:
ARIMA(0, 2, 1); ARIMA(0, 2, 2)

Tenemos 3 modelos que queremos probar.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Modelos ARIMA y prediccin
Una vez seleccionados lor parmetros, para ajustar un modelo
ARIMA(p, d, q) en R:
Modelo<- arima(serie, order=c(p,d,q), xreg=1:length(serie))
Para predecir los siguientes N valores de la serie dentro del
modelo:
Prediccion<- predict(Modelo, n.ahead=N, newxreg =
(length(serie)+1):length(serie) + N) )
DatosPredichos <- Prediccion$pred
Estimacin de los errores de prediccin:
Errores <- Prediccion$se

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Modelos ARIMA: Ejemplo
De vuelta a nuestro ejemplo, en R tendramos los siguientes
modelos:

Para visualizar el ajuste:

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Seleccin del mejor modelo
Normalmente, tendremos varios modelos entre los que decidir cul
puede ser el mejor.
Es necesario un criterio para poder discriminar entre 2 modelos
diferentes de representacin de una serie (no slo considerando la
bondad del ajuste, sino tambin la complejidad del modelo).
Usaremos el criterio de Akaike (AIC). A menor valor de AIC, ms
preferible es el modelo.
AIC = 2k + n Log(RSS/n)
k= grados de libertad del modelo
n= nmero de datos en el modelo
RSS= Residual Sum of Squares (suma de errores al cuadrado)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Seleccin del mejor modelo
Tambin hay que comprobar la bondad del ajuste mediante el
anlisis de los residuos, mediante tests de aleatoriedad y normalidad.
Tests de Box-Pierce/Ljung-Box: Comprueban la aleatoriedad (p-
value pequeo= no son aleatorios).
En R: Box.test(datos)
Tests de Shapiro-Wilk/Jarque Bera: Comprueban la
normalidad de los datos (p-value pequeo= no son de distribucin
normal).
En R: shapiro.test(datos) / jarque.bera.test(datos)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
En nuestra serie de ejemplo
Comprobacin de la aleatoriedad de los errores del modelo.

Los 3 modelos pasan el test de Box-Pierce

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
En nuestra serie de ejemplo
Comprobacin de la distribucin normal de los residuos.

Los 3 modelos pasan el test de Jarque-Bera (p-value > 0.05)

Tambin el de Shapiro-Wilk (p-value > 0.05)

Aparentemente, los 3 modelos no presentan inconsistencias. Con


cul nos quedamos?
Manuel Pegalajar Cullar (manupc@decsai.ugr.es)
Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Seleccin del mejor modelo
El criterio de informacin de Akaike (AIC): Proporciona una
medida que contempla la precisin del ajuste del modelo y su
complejidad.

Nos quedamos con el


ARIMA(2, 0, 0)

Se prefiere el modelo 1. Es el
mejor considerando errores del
modelo y complejidad

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
ndice
Prerrequisitos.
Series Temporales en R. Instalacin de paquetes.
Lectura de datos. Formato y creacin de objetos de series.
Metodologa de anlisis y modelado.
Anlisis de tendencia en R.
Anlisis de estacionalidad en R.
Estacionariedad.
Modelos ARIMA y seleccin del modelo
Prediccin.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Modelos ARIMA y prediccin
Para predecir los siguientes valores de la serie:
Utilizar el modelo para predecir los prximos valores de la
serie.
Deshacer los cambios realizados en orden inverso
Diferenciaciones (si ha habido)
Estacionalidad (si ha habido)
Tendencia (si ha habido)
Transformaciones de los datos (si ha habido)

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Prediccin: Ejemplo
Paso 1: Prediccin con el modelo. Vamos a predecir los 12
prximos valores.

Paso 2: Aadimos los datos al final de la serie

Paso 3: Incluimos la estacionalidad

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Prediccin: Ejemplo
Paso 4: Calculamos la tendencia para los valores predichos y la
incluimos.

Paso 5: Como no hay preprocesamiento previo, hemos terminado.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Prediccin: Ejemplo
La serie final:

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Prediccin: Ejemplo
Trabajo de laboratorio:
Escribir un script R con todos los pasos seguidos en este guin.
Incluir comentarios explicando con detalle para qu sirve cada
una de las funciones utilizadas, los pasos seguidos y
justificarlos.
Entregar al profesor.

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada
Series Temporales y Minera de
flujos de datos
Seminario: Software para procesamiento de
series temporales y flujo de datos

Parte I: Series Temporales

Manuel Pegalajar Cullar (manupc@decsai.ugr.es)


Dpto. Ciencias de la Computacin e I.A., Universidad de Granada