Anda di halaman 1dari 42

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2.

Series temporales Antonio Alaminos

2. Series temporales Una de las estrategias para estudiar el cambio o la evolucin de los fenmenos sociales consiste en evaluar la huella que dejan con el paso del tiempo, en bsqueda del patrn o estructura que muestre el fenmeno social. Ciertamente, el estudio longitudinal de los fenmenos sociales es una oportunidad importante para apreciar las cicatrices que la historia deja en la sociedad. Esto es apreciable en la mayor parte de las actividades de la sociedad, tanto econmicas como polticas o cvicas. As, en el grfico siguiente, donde se indican el nmero de corridas de toros en Espaa desde 1901, es posible apreciar varias anomalas.

En una actividad social de carcter ldico existen dos cicatrices evidentes. La primera de ellas entre 1936 y 1939, la segunda entre 1976 y 1981. Ms tarde, cuando empleemos mtodos de suavizacin para revelar con mayor nitidez la estructura de la serie, estas dos cicatrices se harn incluso ms visibles. La serie de corridas de toros por temporada nos cuenta la siguiente historia: un periodo relativamente estable (estacionario) entre 1901 y 1936. Existe una cada sbita, indicando algn hecho atpico (una posible intervencin), y posteriormente inicia una recuperacin hasta un nivel equivalente al anterior a la intervencin. Desde principios de la dcada de los 50 se inicia una tendencia al alza que se har especialmente acelerada en la dcada de los 60. En 1975 se produce una inflexin decreciente 12

I. Huellas en el tiempo

que tocara fondo en el 1981 (cae de 678 corridas en 1974 a 390 en 1981). A partir de 1982 se produce una recuperacin que alcanzara niveles equivalentes a 1974 en el ao 1993. Este comentario de la serie es una historia sin personajes ni acontecimientos. Un indicador de algo. Para un socilogo espaol se encuentran las cicatrices de la guerra civil, los planes de desarrollo, la incertidumbre de la transicin poltica y la crisis econmica, la normalizacin de la vida social y poltica tras el gobierno socialista de 1982. Como podemos apreciar, las series temporales, es decir, observar el desarrollo en el tiempo de los fenmenos sociales, son de gran utilidad para estudiar los cambios que han acaecido en la sociedad. Incluso con indicadores que en principio no parecen importantes para el anlisis sociolgico. Otro aspecto importante de las series temporales es su capacidad para revelar la regularidad en el comportamiento social. Esta regularidad se hace especialmente evidente en el caso de las series temporales. As, consideremos la audiencia media de televisin segn hora y da de la semana.

La regularidad diaria es evidente, y si bien en fines de semana se aprecia una cada de nivel, la distribucin de la audiencia entre horas parece modificarse poco. Gran parte de la vida cotidiana esta compuesta de acciones repetidas, reguladas socialmente. En ese sentido, la regularidad que muestran algunas variables, como la audiencia media de televisin por horas

13

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

del da, es un indicador de estructuras comunes ms profundas. Esta regularidad no es de tipo normativo, impuesta por unas normas sociales.

Es importante, no obstante, diferenciar entre diferentes fuentes de regularidad social, sealando los matices internos de la regularidad que puede ser objeto de la actividad sociolgica. Como seala E. Lamo Ahora bien, es sab ido que sobre el concepto cientfico-newtoniano de ley se superpuso otro ms antiguo: el que establece una conexin de tipo normativo entre fenmeno antecedente o fenmeno consecuente, especialmente en la obra de Talcott Parsons, ha tratado de encontrar en dicha normatividad la causa de las regularidades sociales. Ello supondra reducir el concepto de la ley social al de norma. Creo, pues, conveniente, antes de nada, rechazar esta posibilidad terica para devolverle al concepto de ley su autonoma cientfica en sociologa1. El problema radica en que el sistema normativo puede hacer comprensibles las regularidades del comportamiento individual, pero no explicar tales comportamientos ni tampoco las regularidades del agregado y ambos fenmenos son sustancialmente diferentes. As, Von Hayek ha propuesto distinguir tajantemente entre el sistema de reglas de conducta que gobierna el comportamiento de los miembros individuales del grupo [] por un lado, y por otro, el orden o pauta de acciones que resulta de aquel para el grupo como totalidad2. De este modo, la norma interpretada individualmente no responde de los comportamientos agregados. Es decir, la regularidad normativa (o tica) permite comprender acontecimientos singulares, i.e., acciones, pero no explicar regularidades tpicas del agregado3, pues stas no dependen slo de las acciones. Del anlisis, concluye E. Lamo4, se debe distinguir radicalmente el orden normativo del social, y ello por varias razones. Primero, porque para que la norma efectivamente cause regularidades en la conducta social, esto es, que genere orden social es preciso que exista nico sistema normativo, que haya consenso cognitivo, de forma que los actores interpreten las normas del mismo modo. Estos tres
1 2

Ibd., p. 87. Von Hayek, Notes on the Evolution of the Systems of Rules of Conduct, Studies in Philosophy, Politics and Economics, Citado en E. Lamo de Espinosa, op., cit., p. 8. 3 K. Popper, Rationality and the Status of the Rationality Principle (1967), citado por J.C. Zapatero en K. Popper y la metodologa de las ciencias sociales, en Cuadernos Econmicos de ICE, 3-4 (1977), p. 103. 4 E. Lamo de Espinosa, La sociedad reflexiva, op. cit., pp. 88-91. 14

I. Huellas en el tiempo

principios son de dudosos cumplimiento, dado que la nocin de que existe un nico sistema normativo es muy restrictiva, adems las situaciones no son nunca definidas individualmente por cada actor sino negociadas entre los diferentes participantes, y por ltimo, suponiendo que hay consenso cognitivo, las normas son interpretadas por los actores de modos diferentes. La segunda razn porque no toda regularidad resulta del seguir una regla. As pues, si tanto la conducta normativa como la desviada son regulares y previsibles tendremos que concluir que la base de dicho orden reside fuera del sistema normativo y que, por el contrario, lo incluye a l. Tercero, porque las regularidades normativas pueden, a su vez, ser explicadas en s mismas. Y por ltimo, dado que las normas nos permiten explicar las regularidades de la conducta individual, pero no permiten ni explicar ni comprender las regularidades del agregado y ambos tipos de fenmenos son, esencialmente, diferentes. Con ello se puede concluir que analticamente es separable el tema de la accin del orden social, o dicho de otro modo, la norma social de la ley social. Las normas se predican de conductas concretas y pueden ser violadas por actores aislados; la ley social, por el contrario, se predica del agregado y precisamente por ello no puede ser violada por actores aislados, aunque s puede ser alterada (que no violada) por la colectividad al menos de dos modos: alterando las acciones individuales y/o alterando su suma. No cabe en todo caso sealar una situacin determinista, en la medida que existen posibilidades de cambio en los dos niveles individual y agregado. Es importante la distincin entre la accin normativa (basada en el debe hacer/debe ser) y la de tipo probabilstico que se postula para la regularidad no normativa. Las regularidades sociales, en trminos probabilsticos es lo que se denominara ley sociolgica. Como advierte E. Lamo, (la sociologa) Necesita que haya hechos sociales; pero si adems quiere ser ciencia nomottica necesita que haya leyes sociales5. No debe en todo caso, confundirse la nocin de ley con la de teora. El rasgo diferencial entre leyes y teoras se encuentra en que las leyes hacen referencia a las caractersticas empricas de los fenmenos, o sea, a aspectos observables y no a conceptos tericos o abstractos. Tal y como seala M. Navarro,
5

Ibd.,. p. 95. 15

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

la aproximacin desde el constructivismo afirma la naturaleza no determinista en la constitucin de cualquier regularidad social al mismo tiempo que destaca el papel contingente e histrico de las construcciones sociales. El construccionismo social que inicia la sociologa weberiana parte, pues, de acciones sociales individuales entrelazadas, ms o menos permanentes o transitorias. Cualquier relacin social puede quebrarse en todo momento y por ello, slo podemos afirmar la regularidad en trminos de probabilidad de conducta y no de normas: la relacin social consiste slo y exclusivamente aunque se trate de formaciones sociales como Estado, iglesia, corporacin, matrimonio, etc.- en la probabilidad de que una forma determinada de conducta social, de carcter recproco por su sentido, haya existido, existe o pueda existir6. Las regularidades que estamos considerando seran en todo caso, agregadas y probabilsticas. Wilfredo Pareto, ilustre antecedente de la sociologa matemtica destacaba los problemas en la deteccin de regularidades: Las distorsiones que se aprecian en las diferentes regularidades son producto de los errores y limitaciones propias del ser humano. En ese sentido, afirmaba que 7. Hablando propiamente no puede haber excepciones a las leyes econmicas y sociolgicas, en la misma forma que las otras leyes cientficas. Una uniformidad no uniforme no tiene sentido. Pero las leyes cientficas no tienen una existencia objetiva. La imperfeccin de nuestro espritu no nos permite considerar los fenmenos en su conjunto y estamos obligados a estudiarlos separadamente. En consecuencia, en lugar de uniformidades generales que estn y que quedarn siempre ignoradas, estamos obligados a considerar un nmero infinito de uniformidades parciales, que crecen, se superponen y se oponen de mil maneras. Cuando consideramos una de esas uniformidades, y que sus efectos son modificados u ocultos por los efectos de otras uniformidades, que no tenemos la intencin de considerar, decimos de ordinario, pero la expresin es impropia, que la uniformidad o la ley considerada sufre de excepciones. Si es admitida esta forma de

Max Weber, Economa y sociedad Mxico, Fondo de Cultura Econmica, 1969, p.22, citado por M. Navarro, "Apuntes para una teora de la cultura econmica", en VV. AA. Escritos de Teora Sociolgica en homenaje a Luis Rodrguez Ziga, Madrid, CIS, 1992, p.792 16

I. Huellas en el tiempo

hablar, las leyes fsicas, y aun las matemticas, comportan excepciones, lo mismo que las leyes econmicas. (...) (8).Una ley o una uniformidad no es verdadera sino bajo ciertas condiciones, que nos sirven precisamente para indicar cules son los fenmenos que queremos destacar del conjunto. Por ejemplo, las leyes qumicas que dependen de la afinidad son diferentes, segn que la temperatura se mantenga en ciertos lmites, o los sobrepase. Hasta una cierta temperatura los cuerpos no se combinan; ms all de esa temperatura se combinan, pero si aumenta todava ms all de cierto lmite se disocian. (9)Esas condiciones son unas implcitas y otras explcitas. No se debe hacer entrar entre las primeras ms que las que son entendidas fcilmente por todos y sin el menor equvoco; si no eso sera un jeroglfico y no un teorema cientfico. No hay proposicin que no se pueda certificar como verdadera bajo ciertas condiciones a determinar. Las condiciones de un fenmeno son parte integrante de ese fenmeno, y no pueden ser separadas. (10).No conocemos, ni podremos jams conocer, un fenmeno concreto en todos sus detalles; siempre hay un residuo. (...). (11) Puesto que no conocemos enteramente ningn fenmeno concreto, nuestras teoras de esos fenmenos no son ms que aproximadas. (...)7. Destaca en la nocin de Pareto que el fenmeno es indisociable de sus condiciones de realizacin pero tambin que un mismo proceso puede generar regularidades distintas, incluso contradictorias. En ese sentido, M. Navarro destaca como la progresin de los esquemas de decisin instrumental adquieren una mayor complejidad conformen se difunden como culturalmente adecuados para la toma de decisiones.El hecho sociolgico bsico que hay que resaltar y que gua toda la concatenacin de fenmenos que se han expuesto hasta este momento, es la aparicin en nuestras sociedades de conductas econmicas definidas, que han tenido, a su vez, influencia en la aparicin de un complejo de conductas no econmicas, todas ellas con un carcter masivo y que se hacen ms centrales, en la vida de los hombres, que tienen
7

W. Pareto, Manual de economa poltica, Genve, Librairie Droz, 1964 17

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

un carcter abstracto y complejo, que requieren un mayor nmero de conocimientos y que ofrecen una previsible perspectiva de aumentar el nmero de complejidad y de generalizarse socialmente8. Para M. Navarro, la difusin de un esquema de actuacin como es el desarrollado dentro de la cultura econmica adquiere una generalizacin y complejidad cada vez mayor, lo que puede conducir a fenmenos sociales contradictorios. La vida social es tan compleja que las mismas fuerzas que llevan la Mercado y a la democracia desarrollan otras, en alguna medida contrarias, como la burocracia. El desarrollo del mercado y la competencia, genera, monopolio y burocracia, regulaciones, controles y salvaguardias. La aparicin y la evolucin del capitalismo han propiciado estos fenmenos. Pueden no ser necesarios, pero se han manifestado de ese modo9. Esta complejidad por la que una dinmica social puede asociar y provocar de algn modo el desarrollo de otras contrarias es lo que contribuye a hacer borrosas determinadas regularidades sociales. La nocin misma de regularidad puede aparecer denominada como ley social en un sentido blando. Otros autores como J. Elster prefieren matizar sustituyendo la palabra ley por mecanismo () debilidad de la teora ms famosa de la explicacin cientfica, la propuesta por Carl Hempel. El sostiene que la explicacin equivale a la deduccin lgica del acontecimiento a explicar, con leyes generales y declaraciones de las condiciones iniciales como las premisas. Una objecin es que las leyes generales pueden expresar correlacin pero no causa. Otra es que las leyes, aunque sean genuinamente causales pueden ser anticipadas por otros mecanismos. Es por eso que aqu he puesto el acento en los mecanismos y no en las leyes. Esto no es un profundo desacuerdo filosfico. Un mecanismo causal tiene un nmero finito de eslabones. Cada eslabn se debe describir mediante una ley general y en ese sentido por una caja negra acerca de cuyos engranajes internos permanecemos en la ignorancia. Pero para los fines prcticos- los fines del cientfico social en accin es importante el lugar del acento dinmico de la explicacin cientfica: el impulso a

M. Navarro, "Apuntes para una teora de la cultura econmica", en VV. AA. Escritos de Teora Sociolgica en homenaje a Luis Rodrguez Ziga, Madrid, CIS, 1992, p. 786. 9 Ibd. p.793 18

I. Huellas en el tiempo

producir explicaciones cada vez ms finas10. Esta matizacin se corresponde en un sentido global con los planteamientos de Pareto y responde a la dinmica entre generalizacin y detalle en la explicacin para alcanzar una mejor determinacin de las regularidades. Otro aspecto interesante procede desde el mbito de la generalizacin y lo local. En este contexto reaparece el debate sobre la utilidad local de las generalizaciones. Nuevamente la dicotoma entre sociologa como ciencia o tecnologa. P. von Morpurgo, reflexiona como11 El carcter de las ciencias sociales est ntimamente vinculado a su reivindicacin de universalidad. Si se puede determinar la regularidad de algunos fenmenos, y por consiguiente establecer leyes que tengan un alcance casi universal, esa reivindicacin se puede aceptar. No obstante, con una vasta aplicacin de este principio se corre el riesgo de ignorar la diversidad local. En efecto, en estos ltimos cincuenta aos, las ciencias sociales y sus repercusiones han cobrado mayor fuerza gracias a la mejora de sus mtodos e instrumentos de investigacin aplicables a escala reducida. Es evidente que, en materia de elaboracin de polticas, los resultados y recomendaciones adecuadamente detallados y relacionados con un entorno especfico son ms pertinentes que las vastas generalizaciones. No parece, sin embargo, que ambas tareas sean excluyentes, sino ms bien complementarias.
La caracterstica distintiva en la sociologa aplicada es el empleo de mtodos formales para la construccin de modelos en el anlisis de los fenmenos sociales. As, T. Fararo en la introduccin de su manual afirma como12 este libro pretende ser una contribucin a acelerar la formalizacin de las teoras as como a restituir la capacidad explicativa de la teora mediante el empleo de modelos. Los dos conceptos clave son formalizacin y representacin mediante modelos. La actividad de la sociologa matemtica no se dirige a una labor de formalizacin per se de la teora sociolgica, sino que contribuye a ello mediante el desarrollo de modelos formalizados, generalmente de carcter matemtico. La observacin es importante, dado que la funcin del anlisis lgico se circunscribe a la elaboracin de los modelos. Es evidente que el empleo y desarrollo de modelos dentro de una teora ayuda a su

10 11

J. Elster, Tuercas y tornillos Barcelona, Gedisa. 1996 p. 16 P. von Morpurgo, op. cit., 19

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

formalizacin y potencia la consistencia interna. Esta tarea constituye una aproximacin metodolgica bastante definida a la realidad social. En ese sentido, cabe recordar como una de las caractersticas del mtodo cientfico es, segn Hanson, la bsqueda de un modelo en el que insertar los datos: En una disciplina de bsqueda en crecimiento, la investigacin se dirige, no a reordenar viejos hechos y explicaciones en modelos formales ms elegantes, sino ms bien al descubrimiento de nuevos esquemas de explicacin13. A este respecto, la misma opinin sostiene Allais Cuando se analizan los fenmenos sociales sobre todo los econmicos, se revela la existencia de regularidades tan sorprendentes como las que encontramos en las ciencias fsicas (). Toda ciencia se basa en modelos, ya sean descriptivos o explicativos o estn destinados a hacer pronstico o a tomar decisiones14. En ese sentido, la nocin de representacin es uno de los ncleos importantes en la actividad de la sociologa aplicada.

2.1. Descripcin de una serie temporal Los datos, con los que se genera una serie temporal, poseen una caracterstica especial. Son datos que aparecen ordenados en el tiempo, donde no solamente son importante los valores que alcanza la variable, sino tambin en que orden temporal aparecen esos valores. Es muy importante que ese orden temporal este equiespaciado15. As, por ejemplo, un conjunto de datos Yt (t= 1,2,3, ... n) donde el intervalo entre Yt e Yt+1 es fijo y constante. A partir de esto podemos definir una serie temporal como un conjunto de observaciones obtenidas mediante la medicin de una sola variable, de un modo regular, en el trascurso de un perodo de tiempo. Para que este tipo de datos en forma de serie temporal puedan ser modelados con una cierta garanta es importante que cumplan varios requisitos. a) en primer lugar, que exista una serie de datos con el suficiente recorrido histrico. Situndonos en un escenario ptimo, 40 observaciones o ms. Cuanto mayor sea la trayectoria de los datos ms posibilidades de modelado ofrece, pudindose testar un mayor nmero de interpretaciones acerca del comportamiento de la serie. No obstante, existe un aforismo
12

T. Fararo, Mathematical Sociology: an introduction to fundamentals. New York, Wiley, 1973. p.15 13 Citado en T.A. Sebeok One, Two, ThreeUberty en U. Eco y T.A. Sebeok (eds.) El signo de los tres. Dupin, Holmes, Peirce. Barcelona, Lumen. 1989. p.74 14 M. Allais, La pasin por la investigacin en M. Szenberg (ed) Grandes economistas de Hoy, Madrid, Debate, 1994 15 Este criterio pone en primer plano la importancia del tratamiento de los casos perdidos en estos mtodos de modelado. 20

I. Huellas en el tiempo

informal que afirma "una observacin en el tiempo constituye una medicin, dos observaciones definen una tendencia y tres observaciones constituyen una serie temporal". En trminos de anlisis tcnico es una definicin muy grosera; sin embargo, conceptualmente recoge uno de los aspectos ms definitorios de una serie temporal: la importancia de que un fenmeno social disponga del suficiente recorrido temporal para poder expresar libremente la variabilidad que pueda haber experimentado. b) en segundo lugar, es necesario que existan pautas de variacin y regularidades en esos datos. Si no existe regularidad es imposible modelar. En ese sentido un componente elevado de aleatoriedad en los datos dificultar detectar alguna regularidad en ellos. Los dos aspectos anteriores constituyen requisitos tanto del anlisis de series temporales como de otros muchos anlisis. En trminos generales, el anlisis de series temporales tiene una doble utilidad. En primer lugar permite diagnosticar la trayectoria de un fenmeno social. En segundo, orientar sobre el futuro de ese fenmeno. Tal y como afirma Nelson (1973) "primero, debe informarnos sobre el mecanismo particular que genera el cambio en el trascurso del tiempo, y segundo, debe de permitirnos emplear ese mecanismo para predecir el futuro". Desde este punto de vista, el conocimiento de las reglas que rigen el cambio permite determinar aproximadamente el comportamiento en el futuro de la variable; es decir, del fenmeno social en estudio. El estudio de series temporales lleva asociado habitualmente el penetrar en el futuro, ya sea a efectos de control metodolgico (como parte de un diagnostico del ajuste), o como finalidad del modelado. Por ello, el modelar series temporales implica el descubrir pautas regulares y sistemticas en los datos, de modo que nos permitan construir un modelo matemtico que explique el comportamiento pasado de la serie. A partir de ello, se intentar predecir el comportamiento futuro ms probable en el fenmeno social que define la serie temporal. No obstante, en este escenario de modelado, para que el futuro sea predecible debe de ser semejante al pasado en lo que se refiere a los factores que generan el comportamiento de la serie. Es decir, las reglas que rigen el cambio deben mantenerse estables en el futuro, dado que el "mecanismo" modelado se pone a funcionar para generar los valores futuros de la variable. Por lo tanto, cualquier cambio brusco en el medio donde se desenvuelve el "mecanismo", o en los elementos que componen el "mecanismo" podrn inducir a error. Podemos pensar que la eficacia del modelo depender, por lo tanto, de la "profundidad" en

21

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

que estn operando sus reglas en el sistema social, por un lado, y del contexto evolucionario o revolucionario en el que se desarrolla el fenmeno social en estudio. Un modelado elaborado sobre una realidad social epidrmica (epifenomenica), determinara un "mecanismo" con predicciones excesivamente contingentes. La eficacia del modelado de una serie temporal depender ms de la reflexin sociolgica que le concede un mbito de existencia, determinando los "mecanismos" a revelar, que de las tcnicas instrumentadas para acceder a ellos. En otro sentido, el proceso o fenmeno social en estudio puede desenvolverse en un entorno social en equilibrio dinmico o en profunda y rapida trasformacin. La posible existencia de discontinuidades (una guerra civil, una revolucin, un golpe de estado, etc.) matiza las probabilidades futuras de realizacin de la serie. De este modo, una serie temporal se modela segn sus propias caractersticas, pero su futuro se evala por sus circunstancias o contexto. Precisamente, el estudio de series temporales puede plantearse desde estrategias diferentes. A efectos prcticos aqu distinguiremos entre las que operan modelando de forma mecnica la evolucin de la variable y aquellas que incorporan teora, a modo explicativo de la evolucin de la serie. Esto no implica que el estudio de la serie no facilite una explicacin del fenmeno social en la primera de las estrategias. Muy probablemente su anlisis muestre o sugiera relaciones importantes con otras variables y factores. La distincin que aqu introducimos esta en relacin con la participacin de variables distintas a la serie en el ajuste matemtico de un modelo. En otras palabras, en la relacin del fenmeno social que estamos estudiando con su contexto. Habitualmente la distincin se refleja tanto en el mtodo de modelado empleado como en las variables que en l participan. Por lo general, un modelado "cerrado" sobre la variable producir un ajuste mecnico (con una participacin limitada de la teora). Sern modelos univariables o con variables instrumentales para apoyar el modelo (como una variable numrica para expresar el paso del tiempo). Por el contrario, un anlisis temporal con teora implicar el empleo de la serie como variable dependiente de otras variables que la explican. Entre los primeros mtodos exploratorios univariantes consideraremos los de suavizado (para revelar el patrn externo de variacin tiempo dependiente) y los que destacan la descomposicin analtica de la serie en diferentes patrones de variabilidad interna. Si apreciamos la variacin de la serie que se recoge en el grfico siguiente la pregunta es evidente, cmo podemos analizar una trayectoria tan zigzagueante como la que registra esa variable?

22

I. Huellas en el tiempo

Para ello, en primer lugar, necesitamos un tratamiento analtico, un conjunto de conceptos para poder mirar la serie. En general, podemos considerar que esa variacin comprende cuatro componentes que pueden identificarse por separado: tendencia, ciclo, estacionalidad y residuales. Esta descomposicin analtica de la serie permite un modelado ms eficaz en la medida que los conceptos se ligan obviamente con propiedades de esta. Tendencia. La tendencia en una serie indica si la trayectoria se mantiene en un nivel concreto o muestra una progresin creciente o decreciente. Una serie temporal puede interpretarse en todo su recorrido temporal o por etapas. As, si bien es cierto que para algunas series existe una tendencia comn en todo su recorrido temporal (creciente o decreciente), en otras se hace evidente la existencia de diferentes etapas. Por ejemplo, en el grfico anterior de las corridas de toros, puede apreciarse que existen dos etapas diferenciadas, la primera entre 1901 y 1950 donde la tnica es eminentemente estacionaria (es decir, que se modifica puntualmente al alza y a la baja pero respetando un cierto nivel medio), mientras que desde los 50 en adelante la serie muestra una tendencia global creciente (con el "bache" de 1975 a 1981 que no puede interpretarse como declive real dado que la recuperacin de la serie es inmediata).

23

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

En otros casos si que es posible determinar una tendencia comn a toda la serie temporal. El grfico siguiente, donde se recoge el nmero de hijos nacidos fuera del matrimonio en Espaa entre 1975 y 1997, muestra una tendencia creciente.

24

I. Huellas en el tiempo

Una tendencia decreciente si consideramos el nmero de nacimientos dentro del matrimonio para el mismo periodo.

No obstante, es evidente que la nocin de tendencia es con frecuencia una cuestin de recorrido temporal. Un recorrido corto es probable que ofrezca una imagen de la serie distinto a un recorrido ms prolongado. Ciclo. La nocin de ciclo se refiere a variaciones superiores al ao. No son estrictamente peridicas, por lo que no existe una previsin del momento de su inicio, recorrido o fin. Dependiendo del tipo de datos puede o no aparecer en las series, mostrando un ciclo o varios. Es importante destacar que la nocin de ciclo define una estructura previsible e implica una pauta de recesin-depresin-recuperacin. Un descenso en una serie que sea atribuible a factores coyunturales o intervenciones, seguido de una recuperacin no debera considerarse ciclo. En economa se consideran diferentes tipos de ciclo, desde ciclos cortos con una duracin aproximada de 28 a 36 meses, a ciclos largos que se reflejen en perodos de 50 o ms aos. El empleo de estos ciclos no es frecuente en sociologa, si bien aparecen con frecuencia en el anlisis histrico.

25

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

Estacionalidad. Supone una regularidad que se repite cada doce meses y constituye, especialmente para determinados fenmenos socioeconmicos, una pauta esencial a identificar, sobre todo en predicciones a corto plazo.

Los movimientos estacionales se caracterizan por tener una periodicidad fija, aun cuando su amplitud puede ser variable. La estacionalidad es muy importante en sociologa en la medida que muchos de los fenmenos sociales se rigen por la estacionalidad. Esto es evidente para los ritos de cohesin (normalmente asociados a fiestas regladas por las estaciones del ao), pero tambin para otros muchos fenmenos. Veamos seguidamente varios ejemplos de estacionalidad. En primer lugar, uno evidente, como es la temperatura media mensual. Las temperaturas medias tienen una relacin importante con las estaciones del ao. En esta serie se aprecia el patrn de regularidad que se repite mes tras mes, ao tras ao.

26

I. Huellas en el tiempo

Este patrn tan regular no solo se produce en fenmenos naturales. Debemos considerar como muchas de las actividades de la sociedad se desarrollan relacionadas con la estacionalidad, como son las vacaciones por ejemplo. En ese sentido, otra serie que reproduce un patrn muy estable es el de turistas que visitan Espaa, cuando lo consideramos mensualmente. Esto es interesante, en la medida que muestra como covarian temporalmente el factor climtico y el factor turstico. El siguiente grfico muestra la llegada de extranjeros que se declaran turistas en cada mes.

27

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

Son muchos los fenmenos sociales de carcter estacional, en la medida que expresan dependencia de tradiciones vinculadas al calendario. Algunas son evidentes, como la venta de helados o la compra de juguetes en navidad; en estos patrones, la libertad es menor, al asociarse uno al calor y el otro a la tradicin. Sin embargo, en fenmenos sociales donde la libertad individual puede ser mayor, al poder elegirse cualquier momento del ao, la eleccin se muestra con una regularidad importante cuando se considera de modo agregado. Este es el caso de las bodas.

28

I. Huellas en el tiempo

Este tipo de regularidad se vincula a factores tradicionales asociados a la estacionalidad agraria y ritos religiosos. En otros fenmenos sociales la estacionalidad tiende a atenuarse, como es el caso de los nacimientos, debido a mltiples factores (especialmente laborales). No obstante, la estacionalidad contina siendo visible, evidentemente, reduciendo su perfil conforme disminuye el nmero de nacimientos.

29

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

Un caso distinto es el de los fallecimientos, donde la eleccin del individuo se reduce bastante y, no obstante, el componente estacionalidad permanece debido a su asociacin con factores climticos.

Como podemos apreciar, la estacionalidad aparece en multitud de fenmenos sociales, en la medida que muchos de estos ritos se vinculan con la mtrica temporal del ao y sus estaciones (ya sea por ritos sociales, factores climticos, incidencias de patologas, etc.). Es importante recordar que la estacionalidad aparecer solo en el caso de que los datos estn expresados mensualmente. Esta no puede aparecer cuando los datos recogen cantidades expresadas anualmente, dado que por definicin, en esa cantidad anual se encuentra resumida la estacionalidad mensual. As, si consideramos la serie siguiente, ha desaparecido la posibilidad de estacionalidad al aparecer expresadas anualmente. La serie recoge el nmero diagnosticado de casos de sida entre 1981 y 1996.

30

I. Huellas en el tiempo

Residual. Es improbable que los elementos anteriores consigan resumir cada uno de los factores que dan forma a la serie temporal. Cuando ya han sido identificadas la presencia y forma de la tendencia, la estacionalidad o los ciclos, aun queda variacin por explicar. Cuanto ms aleatorio sea dicho "resto" mejor recogidas estarn las regularidades en el modelo. En ese sentido, la bondad del ajuste que la descomposicin de la serie ha conseguido se expresa en los residuales que produce. Esencialmente, una explicacin correcta de cmo vara la serie producir residuales sin estructura, es decir, que varan al azar (sin ciclo o estacionalidad) con una variabilidad homogenea en torno a un valor estable (normalmente cero, es decir, sin tendencia). Si al graficar una serie residual mostrara tendencia implicara que la serie contena cambios de nivel que no fueron considerados al modelar. El grfico siguiente muestra una serie residual sin tendencia, ciclo o estacionalidad, variando aleatoriamente en torno a su media, con un nivel estable.

31

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos
800

600

400

200

-200

RESIDUAL

-400

-600 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210

Nmero secuencial

Sobre la base de lo anterior, podemos concluir que una serie temporal yt, puede expresarse como resultado de la relacin entre sus componentes. Siendo Yt la serie temporal observada, Tt la tendencia, Ct el factor cclico, Et la estacionalidad y Rt el residual del ajuste. Estos cuatro son los componentes ms generales de una serie temporal y cada uno de ellos adquirir ms o menos importancia segn el fenmeno modelado o la tcnica empleada. Como ya sabemos, la relacin entre los factores explicativos puede ser aditiva o multiplicativa. Aditiva Multiplicativa Yt = Tt + Ct + Et + Rt Yt = Tt * Ct * Et * Rt

En la especificacin aditiva presuponemos que cada uno de los elementos influye independientemente en la forma final de la serie. As, la magnitud de la estacionalidad sera independiente de su posicin dentro de una tendencia. Por el contrario, en el caso de la especificacin multiplicativa se produce un efecto de interaccin. Por ejemplo, la intensidad de la estacionalidad es ms elevada cuando ms fuerte es la tendencia. En ese sentido, modelar la serie implica ir retirando los diferentes elementos que la definen hasta que solo quede el residual sin estructura.

Retirar tendencia 32

I. Huellas en el tiempo

Aditiva Yt - Tt = Ct + Et + Rt Desestacionalizar Aditiva Yt - Et = Tt + Ct + Rt

Multiplicativa Yt / Tt = Ct * Et * Rt

Multiplicativa Yt / Et = Tt * Ct * Rt

Retirar tendencia y desestacionalizar Aditiva Yt - Tt - Et = Ct + Rt Multiplicativa Yt / Tt *Et = Ct * Rt

Por ultimo retirando el componente cclico

Residual Aditiva Yt - Tt - Et - Ct = Rt Multiplicativa Yt / Tt * Et * Ct = Rt

Donde el residual es, evidentemente, el resto que queda tras retirar la tendencia, el ciclo o la estacionalidad. Si bien el mtodo general de descomposicin considera los cuatro elementos, no siempre estos estn presentes. Este el caso de una serie expresada anualmente, donde evidentemente el factor estacional difcilmente puede estar presente. Un caso parecido lo encontraremos en series con trayectorias relativamente cortas, donde la presencia de ciclos sea difcil de determinar. En estos casos, no corresponde descomponer dichos elementos. El proceso formal de modelado considera la descomposicin de la serie en sus elementos, siempre es importante evaluar y diagnosticar la serie temporal desde un punto de vista descriptivo. A modo orientativo, el primer paso para analizar una serie temporal es graficarla y considerar varios aspectos. 1 Contiene una tendencia clara, es decir, una persistencia en el tiempo a crecer o decrecer? 2 Es estacional, es decir, una pauta cclica que se repite de modo continuado cada ao? 3 Su variacin es suave o con cambios bruscos, de un perodo al siguiente? 33

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

4 Se aprecian cambios bruscos, o rupturas en el comportamiento de la serie, o es muy parecida desde el principio hasta el fin? 5 La variacin a corto plazo es semejante en toda la serie? Esta variacin crece o decrece con el paso del tiempo, es decir, su variabilidad entre dos puntos es cada vez mayor o menor? Y el nivel general que presente la serie, muestra saltos de nivel o permanece estable? 6 Existen valores atpicos, que aparecen lejos del resto de la serie? Es conveniente evaluar que esos valores pueden corresponder a sucesos especiales, que deben de controlarse si deseamos desvelar el proceso que subyace a la serie. Los aspectos mencionados actan como orientaciones con respecto a los procedimientos de modelado que se utilicen. Podemos considerar, (y advirtiendo la existencia de excepciones) que las tcnicas ms importantes para el modelado de series temporales pueden clasificarse en dos tipos: a) aquellos que con una elaboracin terica importante plantean un modelado apoyado sobre una especificacin; normalmente identificados mediante una ecuacin estructural; para ello postulan la existencia de relaciones entre la serie que pretende explicar y otras variables significativas. Posteriormente se testara el modelo empleando datos en forma de serie temporal. Es un modelo generalmente de tipo confirmatorio que postula un conocimiento del sistema de relaciones en que se desenvuelve la variable a modelar o predecir. b) modelos elaborados empricamente, generalmente de modo exploratorio dado que el modelo esta basado en aquel ajuste matemtico que mejor refleja la evolucin de los datos. Se efectan diferentes chequeos de la serie temporal y se descubre finalmente el modelo ecuacional que mejor se ajusta a su variacin. El modelo se determina mediante una dinmica de identificacin - estimacin - diagnostico / identificacin - estimacin - diagnostico, y as sucesivamente hasta conseguir la mejor identificacin. Uno de los mtodos ms extendidos es el conocido como ARIMA desarrollado por Box y Jenkins. Otros, quizs de los ms elementales, actan suavizando la serie de modo que ofrezca con claridad al proceso que le da forma. Los modelos sin teora son de tipo exploratorio, donde se intenta conocer la evolucin en el tiempo del fenmeno social en estudio. En ese sentido, no existe explcitamente, ninguna orientacin terica que deba ser confirmada sino ms bien aproximaciones matemticas que faciliten un buen ajuste. Este tipo de mtodos intentan conocer la estructura real de la serie temporal, evitando que la variabilidad puntual que se produce en el cambio de un momento temporal al siguiente no obscurezca la presencia de una regularidad profunda (en el caso que esta exista). Es interesante emplear estos mtodos de forma exploratoria para conocer en que 34

I. Huellas en el tiempo

condiciones de variabilidad se encuentran las variables que muestran la evolucin en el tiempo de distintos fenmenos sociales. 2.2. Mtodos exploratorios En primer lugar consideraremos las tcnicas que se basan en la suavizacin de la serie. Puede considerarse, pues, estas tcnicas de modelado como exploratorias y de apoyo para el diagnostico de la estructura profunda de cambio. Vamos a considerar a efectos meramente clasificatorios dos actuaciones de suavizacin; en primer lugar aquellas que mediante ponderaciones (coeficientes sinteticos como son la media o la mediana) buscan la reduccin de la variabilidad y en, segundo lugars, otras que optan por el ajuste ptimo de una lnea sobre la base del empleo de una funcin matemtica16. La operacin que realiza el modelo sobre los datos o valores de la serie en ambas estrategias de modelado son complementarios. La aplicacin de funciones que expresen la variacin se ajustan sobre los valores, operando desde fuera, aproximndose a los datos y su trayectoria. Por el contrario, el modelado mediante coeficientes sintticos permite que el posible modelo emerja desde los mismos datos. El modelo no se aproxima a los datos, si no que los datos se aproximan al modelo, mediante una accin exploratoria. En esta lgica un concepto importante es el de resuavizacin. Se denomina resuavizacin cuando se suaviza varias veces una serie temporal, tomando como base de suavizacin los resultados de la suavizacin anterior. En ese sentido, cada resuavizacin aleja al modelo de la serie original, al operar sobre los coeficientes sintticos procedentes de modelarla. En general, la suavizacin mediante coeficientes sintticos prescinde de la historia de la serie y suaviza sustituyendo cada valor por aquellos que le estn prximos, es decir, localmente prximos. En definitiva, basndose en la autocorrelacin que pueda estar presente en la serie. Por ello, cada valor tiende a estar correlacionado positivamente con el que le precede y el que le sucede. Se modeliza suavizando en longitudes cortas y prediciendo en funcin a los valores ms recientes en la serie. La aplicacin de funciones matemticas tiende a apoyarse sobre la historia de la serie. Esto es interesante cuando el perodo de tiempo empleado en la serie tiende a eliminar la

Incluidas las estrategias alternativas, de tipo analtico, que se apoyan sobre la nocin de realizacin estocstica, a diagnosticar mediante medias mviles, autoregresin y diferencias. Es decir, emplea las nociones de suavizacin y ajuste matemtico conjuntamente.

16

35

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

autocorrelacin (es decir, bastante espaciada en el tiempo), al distanciarse un valor del que le sigue, y por lo tanto no existiendo una contigidad importante entre los procesos que generan los valores observados. En esa situacin las ltimas observaciones no son ms tiles que las anteriores as que recurrimos a la estructura que revela la historia de la serie y sus posibilidades de proyeccin. 2.2.1. La suavizacin mediante ponderaciones Siguiendo a Tukey (1977) la finalidad de suavizar una serie es obtener una visin clara de lo general, una vez que se han descartado los detalles. Al suavizar se eliminan los movimientos bruscos de la serie que no forman parte de la tendencia que le subyace. Hemos de considerar que las variaciones bruscas y puntuales en la serie pueden suceder por causas muy diversas. Por ejemplo, parte de esa variacin pueden deberse a errores, procedentes de muestreo o de medicin. En esas situaciones, suavizar la serie ayuda a revelar la estructura que contiene. No obstante, en muchas situaciones la serie varia abruptamente reflejando de forma correcta el fenmeno que expresa. Por ello, siempre es til graficar los datos brutos junto a la serie suavizada para evaluar que variabilidad se desprecia. Los procedimientos de suavizado de la serie no imponen ninguna estructura apriorstica sobre la forma que adopte el ajuste. La tcnica de suavizacin que se emplee puede estar predeterminada, pero la forma que adopte la serie suavizada viene dada por los mismos datos. Por ello, un mismo procedimiento de suavizacin aplicado a diferentes series produce diferentes formas en las series suavizadas, expresando la estructura propia de cada una de ellas. Esto no es as para el caso, por ejemplo, de ajustes funcionales. Esta es una cuestin importante, dado que la estrategia de suavizacin mantiene la estructura (personalidad) propia de cada serie. Existen diferentes procedimientos de suavizado. En general, para suavizar una serie temporal se reemplaza cada valor por otro suavizado, que viene dado por el valor original y por el de sus vecinos en la serie. El valor suavizado debera estar prximo de aquellos otros valores a los que representa, excepto los que se puedan considerar como atpicos. En definitiva, buscamos un nmero que nos resuma de forma ms o menos robusta la variabilidad. Bsicamente, se trata de dos decisiones: qu puntos vecinos a los que va a ser suavizado pueden ser considerados como locales y qu cambios seran atpicos. Los procedimientos que vamos a considerar seguidamente responden a las dos cuestiones anteriores con el siguiente planteamiento: consideramos los valores contiguos a los que est siendo suavizado como vecinos de este, y pensaremos como reales aquellos cambios de

36

I. Huellas en el tiempo

direccin que vienen apoyados sobre al menos dos puntos sucesivos. Como ya sabemos, podemos emplear estadsticos clsicos (media), como robustos (mediana) expresadas en formas distintas de ponderaciones. En esta intencin de revelar la posible estructura interna de una serie, es decir, del cambio que muestra un fenmeno social en el trascurso del tiempo, vamos a considerar la serie de suicidios en Espaa.

400

300

200

100

Suicidios

0 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210

1981-1998 Nmero mensual de suicidios

Una forma inmediata de suavizar de modo robusto es seleccionar un conjunto de puntos, habitualmente tres, y sustituir el valor central17 por un coeficiente sinttico que reduzca y exprese la variabilidad de los tres puntos temporales. Por ejemplo, la mediana. Este procedimiento se sigue correlativamente para toda la serie. Este procedimiento expresa una suavizacin muy local, excepto en el caso de emplear un nmero mayor de puntos. El rango de puntos temporales es una decisin del investigador, si bien lo habitual es emplear tres valores. Como ejemplo, para suavizar la serie del nmero de suicidios por mes, tomaremos un rango temporal de tres meses y como valor representativo de la variabilidad en esos tres meses la mediana.

17

La posicin que ocupe el valor suavizado en relacin con su correlato la serie original puede ser centrada, es decir, en la misma posicin temporal o descentrada, donde el valor suavizado se desplaza una o ms posiciones temporales hacia el futuro. 37

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

Ene Feb Mar

108 109 123

109

para el siguiente mes su valor promedio

Feb Mar Abr y para abril Mar Abr May

109 123 107

109

123 107 153

123

Creando una nueva serie a partir de las medianas de cada grupo de tres valores en la serie original. El resultado global de aplicar este procedimiento de suavizacin es el siguiente.

Suicidios: suavizacin medianas mviles Suicidios Medianas Ene 108 0 Feb 109 109 Mar 123 109 Abr 107 123 May 153 129 (/) (/) Sep 120 120 Oct 100 100 Nov 97 100 Dic 111 0

Este procedimiento se seguira hasta acabar con la serie. En los extremos de la serie suavizada no encontraremos una mediana por defecto, dado que el procedimiento emplea medianas centradas y no esta definido para operar con los valores de los extremos en la serie que ser suavizada. El empleo de medianas descentradas o la interpolacin se emplean para estimar dichos valores perdidos. Como interpolacin, un procedimiento inmediato consiste en emplear directamente los valores en los extremos de la serie original.

38

I. Huellas en el tiempo

300

200

100

MEDIANAM

0 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210

1981-1998 nmero mensual de suicidios

Como procedimiento habitual, es interesante comparar la serie suavizada con la original para evaluar los residuales que genera el ajuste. En la evaluacin del ajuste anterior con medianas mviles, simplemente substraemos a los valores suavizados (las medianas) el nmero de suicidios real (Yt). De este modo, los nmeros negativos indicaran una infraestimacin y los positivos una sobreestimacin. Meses Ene Feb Mar Abr May (...) Abr May Jun Jul Ago Sep Oct Nov Dic Suicidios 108 109 123 107 153 () 120 147 138 140 133 120 100 97 111 Mediana Mvil 109 109 123 129 () 147 138 140 138 133 120 100 100 Residual 0 -14 16 -24 () 27 -9 2 -2 0 0 0 3 -

39

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos
80

60

40

20

-20

-40

RESIDUAL

-60

-80 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210

1981-1998 error de ajuste (suicidios)

Puede apreciarse mediante la evaluacin de los residuales que existen valores atpicos en primavera y verano, tanto sobreestimacin como infraestimacin. Al igual que se emplea la mediana es factible emplear otros coeficientes sintticos, como es la media. Considerada una media mvil centrada de cinco (es decir correspondiendo al valor central de los valores empleados) para un tiempo t vendra expresada por

MMt = 1/5 (At-2 + At-1 + At + At+1 + At+2) Y para el tiempo t+1

MMt+1 = 1/5 (At-1 + At + At+1 + At+2 + At+3) Continuando con el rango temporal de la suavizacin con medianas, una media mvil de tres meses se determina, de igual modo, sumando los valores de tres meses consecutivos y dividiendo el resultado por 3. Repitiendo este procedimiento cada tres meses obtenemos una nueva serie de valores suavizados. Consideremos, por ejemplo, la serie que indica el nmero de presos en las crceles espaolas.

40

I. Huellas en el tiempo

50000

40000

30000

20000

PRESOS

10000 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210

1982-1999 total poblacin reclusa mensual

Meses Ene Feb Mar Abr

Presos 22405 23290 23438 23662

Medias mviles 23044= (22405+23290+23438)/3 23463 = (23290+23438+23662)/3 23607

50000

40000

30000

20000

3MEDIAM

10000 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210

1982-1999 total poblacin reclusa mensual

41

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

Al igual que con la suavizacin con medianas es posible evaluar los residuales Meses Ene Feb Mar Abr May Jun Jul Presos 22405 23290 23438 23662 23721 23731 23086 Medias 23044 23463 23607 23705 23513 23311 Residual -246 25 -55 -16 -218 225

Nuevamente, empleamos los residuales para evaluar el ajuste tal y como hicimos para las medianas. Destacan especialmente como aquellos meses que en la serie original mostraban un contraste importante, aparecen con diferencias mucho ms atenuadas en la serie suavizada. El motivo de esa suavizacin especial en los meses con mayor variabilidad es que la media, al ser un promedio poco robusto, distribuye el valor de los valores atpicos entre los meses que le son adyacentes. Esto puede constituir un problema importante si los casos atpicos corresponden con un error de algn tipo o con informacin relevante al fenmeno social en estudio.

3000

2000

1000

-1000

-2000

-3000

RESIDUAL

-4000

-5000 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210

Residual ajuste 3mediamovil

La suavizacin de la serie tambien depende del nmero de puntos temporales que empleemos para suavizar. Las series anteriores han sido suavizadas a tres puntos (MM3). Sin 42

I. Huellas en el tiempo

embargo, el empleo de ms puntos temporales para suavizar puede mostrar con mayor claridad la estructura subyacente a la serie. Como ejemplo consideremos el nmero de encuestas realizadas mensualmente por el Centro de Investigaciones Sociolgicas entre 1962 y 1994. Vamos a mostrar la serie en sus valores mensuales, para despus efectuar una suavizacion con medias moviles a tres (MM3), a siete (MM7) y a doce meses (MM12).

100000

80000

60000

40000

TOTMES

20000

4 99 -1 AR 992 -M ,-1 01 UN 990 -J ,-1 8 01 E P 198 -S - 7 01 EC 198 -D 01 AR 985 -M -1 01 UN 983 -J -1 1 01 E P 198 -S - 0 01 EC 198 -D 01 AR 978 -M -1 01 UN 976 -J -1 4 01 E P 97 -S -1 3 01 EC 197 - D R- 1 01 A 97 -M -1 01 UN 969 -J -1 7 01 E P 196 -S - 6 01 EC 196 -D 01 AR 964 -M -1 01 UN -J 01

FECHA

Podemos apreciar como la serie expresada en su valor original, donde se recoge el nmero de entrevistas realizadas por mes, muestra una estructura bastante irregular. Cuando se procede a la suavizacin, la estructura que contiene emerger, expresando el mecanismo o razn que explica la variabilidad global de esta. Vamos a proceder efectuando sucesivas suavizaciones, a tres, siete y doce meses, de modo que sea posible contrastar los diferentes efectos que produce en la expresin de la serie.

43

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

FECHA

50000

40000

30000

20000

10000

40000

30000

20000

10000

FECHA

4 99 -1 AR 992 -M ,-1 01 UN 990 -J ,-1 8 01 E P 98 -S -1 7 01 EC 198 -D 01 AR 985 -M -1 01 UN 983 -J -1 1 01 E P 98 -S -1 0 01 EC 198 -D 01 AR 978 -M -1 01 UN 976 -J -1 4 01 E P 97 -S -1 3 01 EC 197 - D R01 A 71 -M -19 01 UN 969 -J -1 7 01 E P 196 -S - 6 01 EC 196 -D 01 AR 964 -M -1 01 UN -J 01

4 99 -1 AR 992 -M ,-1 01 UN 990 -J ,-1 8 01 E P 98 -S -1 7 01 EC 198 -D 01 AR 985 -M -1 01 UN 983 -J -1 1 01 E P 98 -S -1 0 01 EC 198 -D 01 AR 978 -M -1 01 UN 976 -J -1 4 01 E P 97 -S -1 3 01 EC 197 - D R01 A 71 -M -19 01 UN 969 -J -1 7 01 E P 196 -S - 6 01 EC 196 -D 01 AR 964 -M -1 01 UN -J 01

44
MM3

MM7

I. Huellas en el tiempo

30000

20000

10000

MM12

4 99 -1 AR 992 -M ,-1 01 UN 990 -J ,-1 8 01 E P 98 -S -1 7 01 EC 198 -D 01 AR 985 -M -1 01 UN 983 -J -1 1 01 E P 98 -S -1 0 01 EC 198 -D 01 AR 978 -M -1 01 UN 976 -J -1 4 01 E P 97 -S -1 3 01 EC 197 - D R01 A 71 -M -19 01 UN 969 -J -1 7 01 E P 196 -S - 6 01 EC 196 -D 01 AR 964 -M -1 01 UN -J 01

FECHA

Finalmente la estructura se revela con una gran claridad al incrementar el intervalo suavizado. Cada uno de los cambios de nivel coincide aproximadamente con los cambios en la direccin del Centro de Investigaciones Sociolgicas. Tal y como advertimos estos cambios de nivel no eran apreciables en el anlisis de los datos en bruto, Como advertimos, tanto en el caso de medianas como de medias, es factible resuavizar una serie ya suavizada, simplemente operando nuevamente sobre ella. Esta suavizacin progresiva se repite hasta que no se producen ms cambios. Cada resuavizacin, es decir, suavizacin sobre la serie ya suavizada se denomina interaccin. Normalmente dos o tres resuavizaciones sobre los datos (interacciones) son suficientes para que no se produzcan ms cambios. No obstante, cuando se trata de medianas, el proceder sobre una serie suavizada cambia en poco los datos. Los valores promediados para suavizar o resuavizar pueden cubrir perodos de cualquier longitud. Cuanto mayor sea la longitud del perodo, ms suavizada ser la serie que trace la media mvil, si bien tendr como desventaja que detectar peor los cambios de direccin en la serie de datos original.

45

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

Meses Ene Feb Mar Abr May Jun Jul

Presos 22405 23290 23438 23662 23721 23731 23086

3Medias 23044 23463 23607 23705 23513 23311

3MediasR2 3MediasR3 23372 23592 23524 23608 23570 23509 23477 23312 23340

50000

40000

30000

20000

4MEDIAM

10000 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210

1982-1999 total poblacin reclusa mensual

Tambin cabe la posibilidad de resuavizar mediante medias una serie suavizada mediante medianas. No obstante, hacer eso implica que se concede el mismo peso a todas las observaciones promediadas. En otras palabras, que se le concede el mismo peso (1/3) a las tres observaciones. Sin embargo, dado que los datos en este caso ya han sido suavizados previamente, podra ser ms sensato conceder ms peso al valor central.

Sistemas de ponderacin. Es interesante considerar una aproximacin alternativa al concepto de media y mediana. En cierto modo, ambos coeficientes representan sistemas de ponderacin de los datos. As, por ejemplo, podemos considerar que la mediana de un conjunto de nmeros impar consiste en ponderar por 1 el valor central (despus de ordenar los datos) y por cero

46

I. Huellas en el tiempo

todos los dems. De este modo, para un archivo de datos compuesto por siete casos, por ejemplo con valores {4,3,1,5,6,1,6}, la mediana se define como ((1 X 0) + (1 X 0) + (3 X 0) + (4 X 1) + (5 X 0) + (6 X 0) + (6 X 0)). Para el caso de valores en nmero par, uno de los procedimientos indica que deben promediarse aritmticamente los dos valores centrales de la distribucin ordenada. Esto consiste evidentemente en sumar los dos valores centrales y dividirlos por 2. La misma operacin, resulta de multiplicar cada uno de los dos valores centrales por 0,5 (es decir ponderar por 0,5)18. As, en el caso de {4,3,3,1,5,6,1,6}, la mediana se define como ((1 X 0) + (1 X 0) + (3 X 0) + (3 X 0,5) +(4 X 0,5) + (5 X 0) + (6 X 0) + (6 X 0)). Resulta evidente que una mediana es simplemente la ponderacin por coeficientes distintos de cero de aquellos que ocupan la posicin central en la distribucin ordenada, y por cero todos los dems. La media es el resultado de un procedimiento equivalente, tal y como se puede deducir de lo ya expuesto. La media aritmtica consiste en sumar los valores de la distribucin y dividirla por el nmero de valores. As, la media de cuatro valores (n = 4), por ejemplo, {4,10,4,6} es igual a ((4 + 10 + 4 + 6) / 4) = 6. El mismo resultado obtendremos si ponderamos por (1 / n) = .25. De este modo, ((4 X .25) + (10 X .25) + (4 X .25) + (6 X .25) = 6. En ese sentido, la media responde a la lgica de administrar un sistema de ponderacin previo a la suma de todos los valores, al igual que en el caso de la mediana. Es interesante destacar varios aspectos de esta aproximacin. En primer lugar, el carcter democrtico de la media. La media aritmtica es un coeficiente democrtico que concede el mismo peso a todos los valores. No hay casos que tengan mayor importancia que otros o que sean especiales (en un sentido u otro). A todos los valores se les concede el mismo peso o importancia. Esto no sucede en el caso de la mediana, donde toda la representacin del conjunto de valores recae en uno o dos valores. Como hemos apreciado, estos valores privilegiados en la posicin central se ponderan por 1 o reparten entre dos. Todos los dems valores se reducen a cero. Desaparecen del coeficiente de representacin que supone la mediana. En el caso del anlisis de series temporales, podemos considerar que todos los valores tienen la misma importancia y por lo tanto ponderar por medias aritmticas mviles (segn el subconjunto de valores que se definan para determinar la media) o privilegiar el valor central del tramo elegido para suavizar (medianas mviles).

18

(A+B) / 2 = (A / 2) + (B / 2) = (A X 0,5) + (B X 0,5)

47

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

Consideremos el caso de una media mvil de tres. A modo ilustrativo podemos pensar que para cada subconjunto de tres valores temporalmente ordenados, tendremos el pasado, el presente y el futuro (este futuro esta realizado y conocemos su valor, para el momento temporal que define el segundo valor, este valor es futuro, se produce despus de l; del mismo modo que el presente es el futuro del pasado). Desde esta perspectiva, al ponderar para suavizar mediante medias aplicamos un criterio democrtico concediendo el mismo peso al pasado, al presente y al futuro. No obstante, podemos conjugar diferentes pesos o importancias para cada valor, en cada subconjunto de valores, segn lo que represente. De este modo, podemos privilegiar el pasado, el presente o el futuro segn conveniencia. As, en el caso de una serie temporal que cambia con brusquedad conservando poca memoria del pasado, puede ser conveniente suavizar dando mayor peso al futuro y menor al pasado, en la idea de que cuando se producen cambios importantes, lo ltimo que pas es lo ms prximo a lo que pueda pasar. De este modo, desde la ponderacin igualitaria que supone las medias mviles, es factible articular diferentes sistemas de ponderacin que otorguen una importancia desigual al pasado, el presente y el futuro. Estos sistemas de ponderacin suponen una estrategia de suavizacin importante. De hecho, algunos de estos sistemas tienen nombre propio, como es el caso de Hanning. Vamos a considerar dos procedimientos de ponderacin a efectos de ilustrar su funcin y eficacia sobre series temporales, tanto descriptiva como predictivamente: hanning y suavizado (alisado) exponencial. Hanning. Un procedimiento de suavizacin basado en ponderaciones es el definido por el meteorlogo austriaco del siglo XIX Julio Von Hann. Consiste en, dados tres valores consecutivos, a los dos valores adyacentes al que va a ser suavizado se le concede una importancia de 1/4 a cada uno de ellos y al valor central un peso de 1/2. El modo operativo de conseguir esto es calcular la media de los dos valores adyacentes (la skip mean) y despus promediar con ella el valor que va a ser suavizado. As, (22405 + 23438)/2 = 22921,5 despus (22921,5 + 23290)/2 = 23106

22405 23290 23438

22921,5

23106

48

I. Huellas en el tiempo

O lo que es lo mismo, [(22405)(.25)]+[(23290)(.5)]+[(23438)(.25)], empleando directamente ponderaciones.

Meses Ene Feb Mar Abr May

Presos 22405 23290 23438 23662 23721 (/)

Hanning 23106 23457 23621 23709

50000

40000

30000

HANNING

20000

10000 ENE NOV DIC SEP JUL MAY JUN MAR ENE NOV DIC SEP JUL JUN OCT AGO ABR FEB OCT AGO

1982-1999 total poblacin reclusa mensual

Precisamente, si aplicamos este criterio para suavizar la serie ya suavizada mediante medianas, normalmente se genera una serie completamente suavizada que revela con claridad la estructura que contiene. Como ya sabemos, es perfectamente factible el resuavizar mediante distintas combinaciones de ponderaciones. Suavizacin exponencial. Esta tcnica de ponderacin (hanning) sobre la serie temporal, puede extenderse hacia otras frmulas, en funcin de los objetivos del investigador. De este modo, si el investigador esta interesado en describir, parecera lo ms sensato conceder ms peso a los valores centrales, mientras que si el inters es predictivo puede

49

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos

resultar interesante conceder ms peso a los valores recientes en la serie. As, a efectos descriptivos, la ponderacin conceder ms peso al valor central; si el inters es predictivo, el peso ser mayor o menor segn la posicin temporal del valor en la serie. Para predecir, puede ser til dar un peso mayor al ltimo valor en la serie. Por ejemplo, un 70% al ltimo valor, el 20% al penltimo y el 10% al antepenltimo. Consideremos este sistema de ponderacin para la serie de presos. Meses Presos Suavizacin ponderada Ene 22405 Feb 23290 Mar 23438 Abr 23662 May 23721

23305=(23438x0,7)+(23290x0,2)+(22405x0,1) 23580= (23662x0,7)+(23438x0,2)+(23290x0,1) 23681= (23721x0,7)+(23662X0,2)+(23438x0,1) (/)

50000

40000

30000

20000

10000 ENE NOV DIC SEP JUL MAY JUN MAR ENE NOV DIC SEP JUL JUN OCT AGO ABR FEB OCT AGO

1982-1999 total poblacin reclusa mensual

No hay necesidad de ms operaciones dado que los pesos suman 1. En todo caso, un problema importante surge cuando existe una estructura estacional contenida en la serie, dado que se producira una amplificacin del efecto de las influencias estacionales. En general, al igual que en las medias mviles simples, las medias mviles ponderadas funcionan mejor en series libres de estacionalidad.

50

I. Huellas en el tiempo

Es evidente que los coeficientes de ponderacin as como el nmero de datos que van a intervenir en la suavizacin es una decisin del investigador. Partiendo de la nocin de suavizacin ponderada se desarrolla el procedimiento denominado suavizacin exponencial (tambin conocido como alisado exponencial). El procedimiento de alisado exponencial se apoya sobre la prediccin del valor de la serie en un momento del tiempo y la diferencia entre esta prediccin y su valor real en ese momento. Para ello se toman los dos primeros valores de la serie (por ejemplo, enero y febrero) y se promedian. El resultado de dicho promedio se considera la prediccin para febrero. Para estimar el valor de marzo tomaremos el valor estimado para febrero y le sumaremos el resultado de multiplicar por un coeficiente de ponderacin (entre 0 y 1) la diferencia entre el valor predecido para febrero y el valor real que alcanzo la serie en ese mes. En ese sentido, la suavizacin exponencial se basa en la dinmica entre prediccin y correccin (sobre la base de la diferencia entre prediccin y realidad = error) mediante un sistema de ponderacin. Meses Ene Feb Mar Abr Presos 22405 23290 23438 23662 Meses Ene Feb Mar Abr May Jun Jul Suavizacin exponencial 22848 = (22405+23290)/2 23035 = 22848+ (.4*(23290-22848)) 23190 = 23035 + (.4*(23438-23035)) Presos 22405 23290 23438 23662 23721 23731 23086 (/) Exponencial 22848 23025 23190 23379 23516 23602

51

Huellas en el tiempo y el tiempo en sus huellas (2011-2012). 2. Series temporales Antonio Alaminos
50000

40000

30000

Exponencial

20000

10000 ENE NOV DIC SEP JUL MAY JUN MAR ENE NOV DIC SEP JUL JUN OCT AGO ABR FEB OCT AGO

1982-1999 total poblacin reclusa mensual

El coeficiente de ponderacin que se aplica sobre la diferencia entre la prediccin y el valor observando, es decidido por el investigador y produce suavizaciones de la serie diferentes segn el que se elija; tambin influye evidentemente en la prediccin para el valor siguiente en la serie. Este procedimiento de suavizacin exponencial es, en definitiva, una forma simplificada de una progresin geomtrica. El peso estar entre 0 y 1. Cuando esta prximo a 0.1, toma en cuenta alrededor de 20 perodos previos en el nuevo valor predecido. Para coeficientes de 0.5 slo emplea los ltimos tres valores. En general, los valores entre 0.1 y 0.3 funcionan bastante bien para suavizar y modelar un gran nmero de series. Cuando los valores se aproximan a 1 implica que la serie presenta cambios muy abruptos (que aconsejara otras tcnicas) o la presencia de estacionalidad. El procedimiento para determinar la ponderacin ms efectiva es simplemente, prueba y error; actualmente existen paquetes estadsticos que efectan un rastreo o bsqueda en rejilla que permite determinar los valores ptimos de ponderacin.

Ajuste En lo que se refiere al mtodo de evaluacin de la bondad del ajuste, uno de los procedimientos ms extendidos divide la serie en dos periodos: histrico y de validacin, con la finalidad de determinar la mejor ponderacin para el perodo histrico y comprobar

52

I. Huellas en el tiempo

posteriormente su ajuste con los datos del perodo de validacin. Emplear este tipo de diagnstico requiere el separar aproximadamente un tercio de los datos, usualmente los ms recientes, que sern utilizados posteriormente para valorar el ajuste. El modelo o modelos propuestos se estiman y ajustan sobre los dos tercios restantes. Ser de la comparacin entre las predicciones que efectan los diferentes modelos y los datos reales de donde surgir la decisin sobre el mejor modelo. Este grupo de datos que se excluyen del ajuste para poder contrastar las predicciones de los diferentes modelos se denomina perodo de validacin, mientras que las observaciones que se emplean para ajustar los diferentes modelos son llamados perodo histrico. En resumen, el procedimiento ms utilizado para evaluar los diferentes ajustes desarrollados sobre los datos del periodo histrico se basa en el anlisis del error (serie residual) producto de la comparacin entre la prediccin y los datos del periodo de validacin Recordemos que de la comparacin entre prediccin y valor real se obtiene una serie. Si el modelo es apropiado, las estadsticas que se estimaron a partir del error de ajuste para el perodo histrico tendern a parecerse a los correspondientes al error de ajuste de las estimaciones en el perodo de validacin. De hecho, tericamente los residuales podran ser menores en el perodo de validacin, lo que indicaran un modelado ptimo.

53

Anda mungkin juga menyukai