1
Caractersticas
Tendencias
Ruido
Ejemplos
Tendencia y estacionalidad
Concentracin de CO2
medida en el observatorio de Mauna Loa, Hawaii.
Hawaii. 3
Ejemplos
Variacin suave pero sin tendencia a largo plazo
Ejemplos
Tendencia no lineal
Ejemplos
Conjuntos de datos reales
Estacionalidad a corto y largo plazo,
posibles cambios de comportamiento
y ruido
Llamadas diarias
a un call-
call-center
7
Visualizacin
Visualizacin
Banking [Banking to 45 degrees]
degrees]
k
1
si =
2k + 1 j = k
xi + j
11
Filtrado de series temporales
Medias mviles [moving averages]
averages]
Ejemplos: Gaussiana,
Gaussiana, ventana de Hamming
Hamming
12
http://en.wikipedia.org/wiki/Window_function#Hann_window
k=5
13
Filtrado de series temporales
Medias mviles [moving averages]
averages]
si = xi + (1 ) si 1
16
18
si = xi + (1 )( si 1 + ti 1 )
ti = (si si 1 ) + (1 )ti 1
Uso en prediccin:
xi + h = si + hti
20
NOTA:
pi modela el componente peridico de la seal,
donde k es el perodo observado.
21
Filtrado de series temporales
Suavizado exponencial triple
(a.k.a. mtodo de Holt-
Holt-Winters
Winters))
ESTACIONALIDAD ADITIVA
si = ( xi pi k ) + (1 )( si 1 + ti 1 )
ti = (si si 1 ) + (1 )ti 1
pi = (xi si ) + (1 ) pi k
xi + h = si + hti + pi k + h
22
Tcnicas de regresin
La prediccin (numrica) es
Similar a la clasificacin:
Se construye un modelo a partir de un conjunto de
entrenamiento.
Se utiliza el modelo para predecir el valor de una
variable (continua u ordenada).
Diferente a la clasificacin:
El modelo define una funcin continua.
Mtodos de regresin
Regresin lineal
Regresin no lineal
rboles de regresin (p.ej. CART)
26
Tcnicas de regresin
Regresin lineal simple
Una nica variable independiente:
y = w0 + w1 x
donde w0 (desplazamiento
desplazamiento)) y w1 (pendiente
pendiente))
son los coeficientes de regresin.
regresin.
(x i x )( y i y )
w = y w x w = i =1
0 1 1 |D|
(x x )2
i =1
i
27
Tcnicas de regresin
Regresin lineal simple
28
Tcnicas de regresin
Regresin lineal simple
Tcnicas de regresin
Regresin lineal mltiple
Varias variables independientes:
y = w0 + w1 x1+ w2 x2 +
32
Tcnicas de regresin
Regresin lineal simple
33
Tcnicas de regresin
Regresin lineal simple
34
Tcnicas de regresin
Coeficiente de correlacin
35
Tcnicas de regresin
Coeficiente de correlacin
Tcnicas de regresin
Coeficiente de correlacin
37
Tcnicas de regresin
Coeficiente de correlacin
38
Tcnicas de regresin
Coeficiente de correlacin
El cuarteto de Anscombe
(4 conjuntos de datos con el mismo coeficiente de correlacin) 39
Tcnicas de regresin
Coeficiente de correlacin
Ventaja de r
No depende de las unidades usadas en la medicin.
Limitaciones de r
Slo mide dependencia lineal entre las variables.
40
Tcnicas de regresin
Coeficiente de correlacin
k
( x )( x
i i+k )
1
c(k ) = i =1
con =
x i
i
( x
i =1
) 2 i =1
42
Funcin de autocorrelacin
Caso prctico
Conjunto de datos
Mediciones de CO2 en Mauna Loa (Hawaii
(Hawaii))
46
Caso prctico
Tendencia: Apreciamos una tendencia no lineal:
Tendencia:
Intentamos ajustarla con una funcin de la forma xk
Nota: Todas las curvas de ese tipo pasan por (0,0) y (1,1)
OK!
k=1.35
48
Ajuste de la funcin f(x) = 35*(x/350)^1.35
Caso prctico
Para comprobar que no vamos mal,
calculamos los residuos (valor original aproximacin):
Caso prctico
Estacionalidad:
Estacionalidad:
Apreciamos una periodicidad anual (cada 12 valores)
52
Caso prctico
En la figura anterior no se ve mucho hacemos zoom:
54
Caso prctico
Aadimos lneas que nos ayuden a ver si los residuos
estn sesgados:
Caso prctico
El ajuste que hemos realizado (1959-
(1959-1990):
57
Caso prctico
Nuestra prediccin del futuro (1991-
(1991-2010)
58
Ms tcnicas de anlisis
Forecasting
http://en.wikipedia.org/wiki/Forecasting
59
Bibliografa
Jiawei Han
& Micheline Kamber:
Kamber:
Data Mining:
Mining:
Concepts and Techniques [8.2]
Morgan Kaufmann
Kaufmann,, 2006.
ISBN 1558609016
Philipp K. Janert:
Janert:
Data Analysis
with Open Source Tools [Part I]
OReilly,, 2010.
OReilly
ISBN 0596802358 60