1/33
Autor
ltima
actualizacin
Septiembre 2012
Versin
1.0
2/33
TABLA DE CONTENIDOS
DATOS ESTADSTICOS.................................................................................................................................5
2.1.1
2.1.2
2.2
METADATOS ESTADSTICOS........................................................................................................................6
2.2.1
Metadatos Estructurales..................................................................................................................7
2.2.2
Metadatos de Referencia..................................................................................................................7
3
BREVE INTRODUCCIN AL MODELO DE INFORMACIN SDMX (SDMX INFORMATION
MODEL).................................................................................................................................................................9
4
INTRODUCCIN.........................................................................................................................................12
4.2
4.3
4.4
4.5
4.5.1
4.5.2
4.6
4.7
CONJUNTOS DE METADATOS....................................................................................................................25
4.8
4.9
4.10
4.11
RESTRICCIONES (CONSTRAINTS).........................................................................................................29
4.12
GLOSARIO..................................................................................................................................................33
3/33
El libro del estudiante tiene como objetivo proporcionar a los usuarios interesados una
introduccin general al Modelo de Informacin SDMX (SDMX Information Model):
Al finalizar el libro del estudiante, el lector deber ser capaz de entender el funcionamiento
bsico del modelo de informacin SDMX (SDMX Information Model).
El libro del estudiante es el segundo de un nmero de libros que juntos, ofrecen un conjunto
completo de informacin para operar SDMX, con una atencin especial en el modelo de
datos.
Ref.
Ttulo
[01]
Introduccin a SDMX
[02]
[03]
Mensajes SDMX-ML
[04]
[05]
[06]
[07]
[08]
Prerrequisitos
Este libro del estudiante puede que requiera la lectura del primer libro del estudiante.
4/33
Los datos estadsticos son a menudo un conjunto de observaciones numricas que tienen
alguna referencia de tiempo asociada a las mismas. Se asocian con un conjunto de valores de
metadatos, que representan conceptos especficos, y que adems, actan como identificadores
y descriptores de los datos. Estos valores de metadatos y conceptos pueden entenderse como
dimensiones identificadas de un sistema multidimensional coordinado, que a su vez describen
lo que a menudo se conoce como cubo de datos (dibujo 1).
Dimensin
Pas
Medida
Measure
TI
20 aos
20 years
Dimensin
Edad
Ages
24.7
24.7
2009-02
Dimensin
Periodo
Existen diferentes organizaciones de datos a la hora de presentar datos estadsticos. Los datos
de tabla se pueden formatear como una tabla multidimensional, en formato de serie temporal
(Time series) o en formato de datos transversales (Cross-sectional).
El ejemplo de organizacin de datos de serie temporal (Time series) (tabla 2) presenta los
datos estadsticos de acuerdo a perodos de observacin anuales. En esta tabla solo nos
fijamos en una entidad (FR = Francia) geogrfica (GEO) para el desarrollo del nmero de
tipos de establecimientos tursticos a lo largo de un perodo especfico.
La organizacin de datos transversales (Cross-sectional) se usa para el intercambio de datos
con ms de un tipo de observacin en un conjunto de datos (tabla 3). Esto significa que est
indicada para situaciones donde los datos estadsticos consisten de mltiples observaciones
(A100 Hoteles y similares, B010 Campings de turistas y B020 Residencias
vacacionales) en un momento concreto de tiempo.
Un ejemplo de tabla estadstica multidimensional se presenta en el dibujo 3 (en la pgina 7).
En este ejemplo se presentan dos capas de dimensin en las columnas de la tabla (actividad y
tiempo)
5/33
A100
Hoteles y similares
B010
Campings de turistas
B020
Residencias vacacionales
2002A00
18768
8354
1934
2003A00
18617
8331
1968
2004A00
18598
8289
2251
2005A00
18689
8174
2329
Tiempo
A100
Hoteles y similares
B010
Campings de turistas
B020
Residencias vacacionales
AT
14204
540
3388
ES
17827
1220
4843
FR
18135
8052
2406
IT
34058
2587
61810
Pas
El trmino metadatos es, sin lugar a dudas, muy amplio. Para empezar, se puede hacer una
distincin entre metadatos estructurales, que son aquellos conceptos usados en la
descripcin e identificacin de datos y metadatos estadsticos, y metadatos de referencia
(metadatos explicativos adicionales, por ejemplo, a una metodologa o aspectos de calidad).
Los siguientes prrafos proporcionarn una explicacin ms en profundidad de estos dos
tipos, metadatos estructurales y de referencia, usados para expresar estructuras de datos y
metadatos y para entender conjuntos de metadatos y datos en relacin al modelo de
informacin SDMX (SDMX Information Model).
6/33
2.2.1
Metadatos Estructurales
Los conjuntos de datos estadsticos son descritos por un conjunto de valores de metadatos,
tomados de conceptos especficos. Los conceptos actan como identificadores y descriptores
de los datos. Este sistema de conceptos que identifican y describen datos toma la forma de
dimensiones identificadas en un cubo multidimensional de datos.
Los metadatos estructurales se organizan en definiciones de estructuras. Una Definicin de
Estructura de Datos (DSD, Data Structure Definition, en ingls)/Definicin de Estructura
de Metadatos (MSD, Metadata Structure Definition) describe cmo se organizan los
conjuntos de datos/metadatos y define el mecanismo para aadir referencias a aquellos
conjuntos de datos/metadatos que son descritos por los metadatos estructurales.
A los conceptos que se usan en una definicin de estructura de datos se les da un "rol de uso"
de dimensin, atributo, y medida en esa misma definicin. La definicin de la estructura de
datos, cualquiera que sea la estructura modelada de un cubo de datos, puede incluir
tambin conceptos especiales, como por ejemplo la dimensin medida, para representar las
medidas mltiples de una organizacin de datos transversales.
Cuando los conceptos toman su valor de un conjunto de valores conocidos (cdigos),
entonces los objetos conocidos como "Listas de Cdigos" (Code List) pueden ser vinculados
a la representacin de conceptos o, ms frecuentemente, asignados al concepto relacionado en
la DSD (Familia Clave) (Key Family).
2.2.2 Metadatos de Referencia
Los conjuntos de metadatos mencionados arriba se relacionan con el modelo SDMX para
aportar metadatos explicativos adicionales, que a menudos son expresados en SDMX como
metadatos de referencia. Los metadatos de referencia se presentan generalmente en un
formato textual, usando conceptos que describen el contenido, la metodologa y la calidad de
los datos, que pueden desgranarse de la siguiente manera:
Estos son, en su mayora, metadatos que no forman parte integral del conjunto de datos
estadsticos. Por el contrario, stos tienen que ver con metadatos relacionados con
colecciones enteras de datos. Los metadatos de referencia son metadatos de contenido que
aportan ms informacin sobre los datos estadsticos, con el fin de que su interpretacin sea
ms significativa.
Los metadatos de referencia se estructuran en relacin a una "definicin de estructura de
metadatos" (MSD: Metadata Structure Definition). Una definicin de estructura de metadatos
describe cmo se organizan los conjuntos de metadatos que contienen metadatos de
referencia, y define el mecanismo para aadir referencias a los datos estadsticos o los
metadatos estructurales con los que estos metadatos de referencia se relacionan.
Eurostat tiene definida una estructura de metadatos que se llama estructura de metadatos
Euro-SDMX (ESMS: Euro-SDMX Metadata Structure). sta contiene la descripcin y
representacin de conceptos de metadatos estadsticos que han de usarse para documentar
7/33
datos estadsticos y proporcionar informacin til para asegurar la calidad de los datos y el
proceso de produccin en general.
8/33
9/33
Los estndares SDMX ofrecen un modelo comn y mltiples formatos de datos que ofrecen
la posibilidad de intercambian cualquier tipo de cubo de datos. Para que se puedan procesar
automticamente los datos de una variedad de fuentes, la estructura de este cubo tiene que
10/33
estar definida de una manera que se ajuste al modelo de informacin SDMX (SDMX
Information Model).
En el modelo de informacin SDMX (SDMX Information Model), los metadatos
estructurales se representan mediante una lista de conceptos organizados por listas
denominadas "esquemas de conceptos" (Concept Schemes). Los conceptos son las piezas
bsicas del engranaje SDMX: los conceptos existen y se mantienen separados de cualquier
estructura que los use.
El modelo de informacin SDMX (SDMX Information Model) proporciona objetos para la
estructuracin no solo de datos, sino tambin de metadatos de referencia.
El modelo de informacin SDMX (SDMX Information Model) permite el intercambio y el
almacenamiento de metadatos de referencia independientemente de los datos que se estn
describiendo. Los metadatos de referencia se pueden mantener guardados en lo que se conoce
como repositorio de metadatos. En consecuencia, un sistema de difusin puede difundir datos
con los metadatos de referencia relacionados, que se extraen a peticin desde el repositorio de
metadatos de referencia.
Los metadatos de referencia tambin se pueden indexar para ofrecer funciones de bsqueda.
Para lograr esto, un informe de metadatos podra ser procesado, por ejemplo, por un servicio
de registro para extraer su informacin estructural. Esta informacin estructural permite
catalogar los metadatos y que un usuario lo pueda solicitar.
El proceso de provisin y gestin del flujo de conjuntos de datos o metadatos est cubierto
tambin por el modelo de informacin SDMX (SDMX Information Model), mediante
metadatos asociados que se ocupan del aprovisionamiento de datos. Los metadatos son
tiles para aqullos que necesitan entender el contenido y la forma de una produccin de
datos del proveedor. Cada proveedor de datos puede describir de una manera estndar el
contenido y las dependencias existentes en los conjuntos de datos y metadatos que estos
producen, y aportar informacin sobre la planificacin y el mecanismo que sigue la provisin
de sus datos y metadatos. Esto permite la automatizacin de algunas funciones de validacin
y control, as como la posibilidad de gestionar el informe de datos.
Para organizar y gestionar el intercambio y la difusin de datos y metadatos, el modelo de
informacin SDMX (SDMX Information Model) incluye tambin informacin sobre
esquemas de clasificacin y categoras de dominios, junto con sus relaciones con conjuntos
de datos y metadatos (por favor comprese con la seccin 4.12).
11/33
12/33
REF_AREA
Nombre
(Ingls)
(Francs)
(Ingls)
(Francs)
Descripcin
Un esquema de concepto (Concept Scheme) es un objeto SDMX mantenido por una agencia
y que contiene una lista de conceptos sobre los que se pueden construir definiciones de
estructuras de datos y metadatos (Data Structure Definition & Metadata Structure Definition).
Se pueden crear muchos esquemas de conceptos. Los esquemas de concepto (Concept
Schemes) generalmente agrupan conceptos relevantes para una nica estructura, aunque una
definicin de estructura de datos/metadatos (Data/Metada Structure Definition) puede usar
conceptos de esquemas de concepto (Concept Schemes) diferentes.
4.3 Listas de Cdigos (Code List)
por una agencia. Una lista de cdigos es simplemente un conjunto de valores que se usan para
la representacin de un concepto (dimensin o atributo) en definiciones de estructuras de
datos/metadatos (Data/Metadata Structure Definitions).
Ejemplo: CL_UNIT_MULT
Cdigo
Descripcin
Unidades
Decenas
Centenas
Miles
Decenas de miles
Millones
Miles de millones
Cada cdigo est definido exclusivamente por un valor y una descripcin que puede
proporcionarse en varios idiomas.
El modelo permite que una lista de cdigos (Code List) tenga una jerarqua simple de
cdigos. En ese caso, la jerarqua se hace mediante la definicin de un cdigo padre como
mximo para cdigos hijo.
Ejemplo : CL_NUTS
Cdigo
Descripcin
Cdigo
padre
BE2
VLAAMS GEWEST
BE3
REGIONE WALLONE
BE31
BE3
BE32
Prov. Hainaut
BE3
BE321
Ath
BE32
BE322
Charleroi
BE32
BE323
Mons
BE32
BE324
Mouscron
BE32
BE33
Prov. Lieja
BE3
BE34
BE3
BE35
Prov. Namur
BE3
Tabla 7 Lista jerrquica de cdigos (Code List) de regiones (NUTS, siglas en francs de Nomenclatura
de las Unidades Territoriales Estadsticas)
14/33
Como se muestra en el dibujo superior, la definicin de estructura de datos est formada por
tres conjuntos de conceptos:
lista de medidas.
lista de atributos.
15/33
Las dimensiones son aquellos conceptos que describen datos estadsticos y forman el
identificador (clave) de los datos relacionados. Para lograr esto, las dimensiones se agrupan
en claves, que permitirn la identificacin de un conjunto de datos particular (por ejemplo,
una serie).
La lista de medidas comprende una medida para los datos de serie temporal (Time series): la
medida primaria. sta suele asociarse con el concepto OBS_VALUE y mide un fenmeno
estadstico a lo largo de un perodo de tiempo. Solamente puede haber una medida primaria
declarada en la DSD (Data Structure Definition). Esto significa que en una serie temporal
(Time series) SDMX solo puede haber un concepto de medida.
Por otro lado, para la organizacin de datos transversales (Cross-sectional), se puede declarar
una dimensin de medida que contenga las medidas transversales mltiples (ver seccin
4.5.2).
La lista de atributos comprende uno o ms atributos. Los atributos son conceptos que se
usan para proporcionar ms informacin sobre alguna parte de un conjunto de datos. Cada
atributo de la definicin de estructura de datos debe asignarse a una parte identificada del
conjunto de datos (en el modelo, esto se conoce como nivel de asociacin o nivel de
agrupamiento).
Las claves consisten en dimensiones, cuyos valores combinados en un conjunto de datos
identifican nicamente valores de datos observados (serie o seccin). Un valor de
observacin particular en una serie temporal se identifica con la clave y con el tiempo de este
valor particular. El modelo de informacin SDMX (SDMX Information Model) permite crear
subconjuntos de claves llamados claves de grupo. Este subconjunto de dimensiones de clave
forma una clave parcial cuyos valores combinados identifican un subconjunto del cubo, al
que los atributos estn vinculados, aportando metadatos sobre el objeto identificado. Por
tanto, el propsito del descriptor de clave de grupo es el de definir un subconjunto
perteneciente al descriptor de clave completa al que se pueden adjuntar atributos de datos.
Dentro de un grupo, algunos conceptos descriptores tienen valores que son los mismos para
todas las series dentro del grupo, mientras que otros conceptos descriptores s se pueden
cambiar. La regla a cumplir es que los conceptos descriptores han de ser adjuntados al nivel
de agrupamiento donde se vuelven variables. Por tanto, si dentro de un nico conjunto de
datos, todos los contenidos de una serie comparten un nico valor para un concepto
descriptor, entonces ese concepto descriptor deber adjuntarse al nivel de serie. Esta regla
tambin asume que el nivel elegido es el nivel estructural ms alto, donde todos los
subgrupos compartirn el mismo valor.
Los niveles de asociacin de conceptos descriptores siempre se encuentran al menos en el
nivel donde el concepto resulta significativo: as pues, no se puede adjuntar el concepto
descriptor frecuencia en el nivel de observacin, porque como concepto que es, solamente
puede operar en el nivel de serie (esto es, con mltiples observaciones hechas durante un
tiempo).
El siguiente ejemplo sobre organizacin de datos de serie temporal aplicada a las estadsticas
de negocios de corto plazo de la produccin industrial (STS, Short-Term Business Statistics),
ilustra los elementos presentes en su relacionada definicin de estructura de datos (Data
Structure Definition). En el contexto de este ejemplo, se presta atencin especial a cuestiones
de agrupamiento. El dibujo 5 inferior - Esquema de estructura de datos (Data Structure
Scheme) de STS, se prolonga mediante casillas grises que contienen los conceptos STS
relacionados (ej.: STS_Indicator) y las representaciones del valor codificado para los
conceptos codificados (Coded Concepts) (ej: CL_STS_INDICATOR, la lista de cdigos
relacionada con el concepto STS_INDICATOR).
16/33
Las estructuras de datos de serie temporal (Time-series Data Structures) como la del ejemplo
STS superior admiten los siguientes niveles de asociacin o niveles de agrupamiento:
NIVEL
IDENTIFICACIN
Conjunto de
datos
Clave de
grupo
Identificada por un valor para cada una de las dimensiones que forman
la clave de grupo, por ejemplo, una clave de grupo formada por
FREQUENCY, ADJUSTMENT, STS_ACTIVITY, STS_INDICATOR,
STS_INSTITUTION y STS_BASE_YEAR;
Clave de
serie
Observacin
REF_AREA="BE"
ADJUSTMENT="N"
STS_INDICATOR="TOTV"
STS_ACTIVITY="NS0080"
STS_INSTITUTION="1"
STS_BASE_YEAR="2005"
ndice
2008M01
2008M02
2008M03
2008M04
2008M05
2008M06
2008M07
2008M08
2008M09
2008M10
2008M11
2008M12
95.19
87.13
97.09
111.45
121.23
137.76
108.19
112.15
103.09
99.65
101.23
97.76
Trimestral
ndice
2008Q01
94.24
2008Q02
122.79
2008Q03
107.24
2008Q04
98.29
Al agrupar no existe ningn requisito por el que se deba tener una nica dimensin omitida
de una clave parcial (Partial Key); puede ser cualquier subconjunto del conjunto de
dimensiones ordenadas (esto es, todas las dimensiones excepto la dimensin tiempo, que
nunca puede ser declarada como perteneciente a la clave de grupo o parcial (Group/Partial
Key)). Todos los grupos declarados en la definicin de estructura de datos (Data Structure
Definition) han de ser nicos, esto quiere decir que no se pueden tener claves parciales
duplicadas. En SDMX, los datos se pueden agrupar para que funcionen como un paquete de
informacin til. Por tanto, para datos STS es posible un agrupamiento del rea de referencia
(REF_AREA) o STS_ACTIVITY, adems de otras dimensiones de clave (Key Dimensions).
Debajo, se ilustra el ejemplo de un grupo "REF_AREA". Este grupo se declara porque no
existe ninguna variacin para los atributos de pases diferentes. Esto es para todas las
dimensiones excepto la dimensin REF_AREA que forma la clave parcial (o clave de grupo).
Por tanto, la dimensin REF_AREA , que no es parte de un grupo, tiene un valor que vara
dentro del nivel de serie (para la organizacin de datos de serie temporal STS).
18/33
En el ejemplo se toman dos conjuntos de valores de claves parciales (claves de grupo) para
organizar los datos (grupo 1 y grupo 2). Los grupos se diferencian entre s solamente en las
claves por valor de actividad. En cada grupo, imaginamos dos conjuntos de claves que
identifican las series temporales (serie 1 y serie 2) cuyos valores de clave se diferencian solo
por el rea de referencia. Una vez que se ha definido un agrupamiento, los atributos
relevantes se adjuntan a los grupos (ej.: los atributos de nivel de grupo en el ejemplo: ttulo y
decimales).
Ejemplo del grupo "REF_AREA":
El conjunto de datos STS se representa como serie temporal en formato CSV:
M;BE;N;TOTV;NS0080;1;2005;2008-04;95.19;E;F
M;BG;N;TOTV;NS0080;1;2005;2008-04;138.05;A;F
M;BE;N;TOTV;NS0080;1;2005;2008-05;87.13;E;F
M;BG;N;TOTV;NS0080;1;2005;2008-05;137.76;A;F
M;BE;N;TOTV;NS0060;1;2005;2008-04;101.24;E;F
M;BG;N;TOTV;NS0060;1;2005;2008-04;165.59;A;F
M;BE;N;TOTV;NS0060;1;2005;2008-05;86.59;E;F
M;BG;N;TOTV;NS0060;1;2005;2008-05;168.55;A;F
Estructura de datos STS (STS Data Structure): Las dimensiones son: frequency; reference
area; adjustment; indicator; activity; institution; base_year; time_period. Los atributos son:
obs_status; confidentiality; decimals y title
Por favor tngase en cuenta que la clave de grupo ha de mostrarse en las series de las que
dependan stas para establecer el vnculo, ya que las series vinculadas no pueden estar integradas
en los grupos para los datos de SDMX-ML compacto
Grupo 1: Frequency = M; adjustment =N; indicator = TOTV; activity = NS0080; institution = 1;
base_year = 2005; Title = ndice de Facturacin Industrial Total de bienes de consumo no
duraderos; Decimals = 2.
Grupo 2: Frequency = M; adjustment =N; indicator = TOTV; activity = NS0060; institution = 1;
base_year = 2000; Title = ndice de Facturacin Industrial Total de bienes de consumo
duraderos; Decimals = 2.
Serie 1: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0080; institution = 1;
base_year = 2005, reference area =BE
Observaciones
time_period = 2008-04; observation value =95.19; status =E; confidentiality = F
time_period = 2008-05; observation value =87.13; status =E; confidentiality = F
Serie 2: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0080; institution = 1;
base_year = 2005, reference area =BG
Observaciones
time_period = 2008-04; observation value =138.05; status = A; confidentiality = F
time_period = 2008-05; observation value =137.76; status = A; confidentiality = F
Serie 1: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0060; institution = 1;
base_year = 2000, reference area =BE
Observaciones
time_period = 2008-04; observation value =101.24; status =E; confidentiality = F
time_period = 2008-05; observation value =86.59; status =E; confidentiality = F
Serie 2: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0060; institution = 1;
base_year = 2005, reference area =BG
Observaciones
time_period = 2008-04; observation value =165.59; status = A; confidentiality = F
time_period = 2008-05; observation value =168.55; status = A; confidentiality = F
19/33
Tiempo
Blgica
BE
Bulgaria
BG
NS0080
NS0060
Bienes de consumo
Bienes de consumo
duraderos
2008-04
2008-05
2008-04
95.19 e
87.13 e
101.24 e
138.05
137.76
165.59
2008-05
86.59 e
168.55
e: Estimaciones de Eurostat
Tabla 10 - STS ndice de facturacin industrial total (tabla multidimensional)
Identificador
Lista de cdigos
Nivel de
asociacin
DIMENSIONES
1
Frecuencia
FREQ
CL_FREQ
rea de referencia
REF_AREA
CL_REF_AREA
Ajuste
ADJUSTMENT
CL_ADJUSTMENT
Tipo de ndice
STS_INDICATOR
CL_STS _INDICATOR
Actividad
STS_ACTIVITY
CL_STS _ACTIVITY
Tipo de institucin
STS_INSTITUTION
CL_STS_INSTITUTION
Ao base
STS_BASE_YEAR
CL_STS_BASE_YEAR
Perodo de referencia
TIME_PERIOD
MEDIDAS
ndice de facturacin
OBS_VALUE
ATRIBUTOS
CL_OBS_STATUS
Observacin
Confidencialidad
OBS_CONF
CL_OBS_CONF
Observacin
Formato de tiempo
TIME_FORMAT
CL_TIME_FORMAT
Serie
Ttulo
TITLE
Decimales
DECIMALS
Grupo
CL_DECIMALS
Grupo
Tabla 11 Conceptos de estructura de datos (Data Structure Concepts) del ejemplo en serie temporal
(Time series)
20/33
las claves de serie temporal (Time series Keys), cada una de las cuales define la clave
de una serie temporal que, cuando se combina con un perodo de tiempo, identifica
exclusivamente a una observacin;
opcionalmente las claves de grupo (Group Keys), que (conceptualmente) comprenden
un conjunto de claves de serie temporal (Time series Keys) para el cual pueden
presentar valores de atributo;
valores de atributo, que se presentan para un objeto especfico como puede ser el de
un conjunto de datos (Dataset), clave de grupo (Group Keys), clave de serie temporal
(Time series Key) o observacin.
serie temporal (Time series), para cada clave puede haber uno o ms valores de observacin
en diferentes momentos dentro de un perodo de tiempo. Los valores de atributo pueden
presentarse, y cada uno de estos valores pueden adjuntarse al nivel apropiado: conjunto de
datos (Dataset), clave de series (Series Key), clave de grupo (Group Key) o directamente un
valor de observacin.
El conjunto de datos (Dataset) puede incluir una referencia al flujo de datos, el cual por su
parte, se encuentra vinculado (obligatoriamente) a la definicin de una estructura de datos
(Data Structure Definition). Una aplicacin puede entonces usar el flujo de datos para
recuperar la DSD (Data Structure Definition) y as procesar o validar el conjunto de datos
(Dataset).
4.5.2 Conjunto de Datos Transversal (Cross-sectional)
Los datos transversales (cross-sectional) son aquellos tipos de datos estadsticos que no se
encuentran organizados como lo suelen estar los de serie temporal. Estos datos se organizan
entorno a otra dimensin no temporal del cubo de datos estadsticos.
Las representaciones transversales (cross-sectional) de los datos pueden obtenerse de la
misma definicin de estructura de datos (Data Structure Definition) de la que obtienen su
estructura las representaciones de serie temporal, siempre que se aporten los metadatos
estructurales adicionales que sean necesarios.
Esta funcionalidad permite a mltiples medidas (denominadas medidas transversales - Crosssectional Measures) ser declaradas en una definicin de estructura de datos (Data Structure
Definition), asociada con los valores de representacin de una dimensin. Cuando los datos
se estructuran para representar a un conjunto de mltiples observaciones en un momento
concreto de tiempo, la seccin (una o ms observaciones para cada medida declarada)
reemplaza a las series en la estructura de datos.
Cada medida lleva al menos una dimensin de la clave (la dimensin de medida) (Measure
Dimension) en el nivel de observacin, mientras que el perodo de tiempo se adjunta en un
nivel ms alto dentro de la estructura de datos (el nivel de grupo, que se detalla ms abajo).
El resto de la clave se encuentra en el nivel de seccin (o ms arriba), de la misma manera en
que se adjunta al nivel de serie para estructuras de datos de serie temporal.
Por ejemplo, si la dimensin ACTIVIDAD (ACTIVITY Dimension) se declara como
dimensin de medida en la definicin de estructura de datos STS (tabla 12), entonces
definimos varias secciones que corresponden a varios posibles valores de la dimensin,
digamos NS0080, NS0060, y NS0050.
Los conceptos que describen las tres medidas transversales (cross-sectional) tienen que
definirse para declararse luego en la definicin de estructura de datos (Data Structure
Definition). Por ejemplo:
Nombre
concepto
CONGIND
NS0080
MIGDCG
NS0060
MIGCDI
NS0050
Tabla 12 Conceptos de la dimensin de medida ACTIVIDAD
22/33
En tal situacin, la definicin de los conceptos de los datos STS se ve enriquecida con tres
nuevas medidas:
Identificador
Lista de cdigos
Nivel de
asociacin
DIMENSIONES
1
Frecuencia
FREQ
CL_FREQ
Seccin
rea de referencia
REF_AREA
CL_REF_AREA
Seccin
Ajuste
ADJUSTMENT
CL_ADJUSTMENT
Seccin
Tipo de ndice
STS_INDICATOR
CL_STS_INDICATOR
Seccin
Dimensin Actividad /
Medida
STS_ACTIVITY
CL_STS_ACTIVITY
Observacin
Tipo de institucin
Ao base
STS_BASE_YEAR
Perodo de referencia
TIME_PERIOD
CL_STS_BASE_YEAR
Seccin
Grupo
CONGIND
Industria de bienes de
consumo duraderos
MIGDCG
Industria de bienes de
capital
MIGCDI
ATRIBUTOS
Estado de observacin
OBS_STATUS
CL_OBS_STATUS
Observacin
Confidencialidad
OBS_CONF
CL_OBS_CONF
Observacin
Formato de tiempo
TIME_FORMAT
CL_TIME_FORMAT
Seccin
Ttulo
TITLE
Decimales
DECIMALS
Grupo
CL_DECIMALS
Grupo
Tabla 13 Conceptos de estructura de datos (Data Structure Concepts) del ejemplo con medidas
transversales (Cross-sectional Measures)
23/33
Las siguientes tablas ilustran las dos representaciones de datos: serie temporal y transversal:
NS0060
Bienes de consumo
duradero
82.4
97.1
121.3
104.4
121.8
120.3
NS0050
Industria de bienes de
capital
93.7
106.8
134.9
106.4
134.5
136.6
NS0060
Bienes de consumo
duradero
NS0050
Industria de bienes de
capital
ES
99.6
104.6
108.4
FR
102.3
92.8
93.4
IT
100.8
82.4
93.7
24/33
En SDMX, los conjuntos de datos se presentan o difunden segn una definicin de flujo de
datos. La definicin de flujo de datos se vincula a la definicin de estructura de datos (Data
Structure Definition) y puede asociarse con uno o ms dominios de temas. Esto facilita la
bsqueda de datos segn un esquema de materia organizado (llamado esquema de categora
en el modelo) ya que estos proporcionan una manera de clasificar datos para su recogida,
presentacin o publicacin.
26/33
GESMES
ESTAT+STS+2.0.xml
EUROSTAT_STS_TS.gsm
Flujos de datos
SDMX2
GESMES
Produccin en industria
SSTSIND_PROD_M
STSIND_PROD_M, _Q
DSD
STSIND_FACT_M, _Q
SSTSIND_PED_M
STSIND_PED_M, _Q
STSIND_EMPL_M, _Q
STSIND_HORA_M, _Q
STSIND_GANA_M, _Q
SSTSIND_PREC_M
STSIND_PREC_M
SSTSCONS_PROD_M,
_Q
STSCONS_PROD_M, _Q
STSCONS_ORD_M, _Q
STSCONS_EMPL_M, _Q
STSCONS_HORA_M, _Q
STSCONS_GANA_M, _Q
STSCONS_PREC_M, _Q
STSCONS_PERM_M, _Q
SSTSRTD_FACT_M
STSRTD_FACT_M
STSRTD_EMPL_M, _Q
SSTSSERV_FACT_M,
_Q
STSSERV_PREC_Q
STSSERV_EMPL_Q
STSSERV_FACT_M, _Q
STSSERV_PREC_Q
STSSERV_EMPL_M, _Q
STSOTRO_OTRO_M, _Q
DSD (Data Structure Definition) y flujos de datos tomados del proyecto SDMX OPEN DATA
INTERCHANGE (SODI) de Eurostat
27/33
El flujo de datos (Data flow) o metadatos (Metadata flow) es mantenido por la organizacin
que recoge o cosecha los datos o metadatos para su uso o publicacin. El flujo de datos
(Data flow) se vincula a una definicin de estructura de datos (Data Structure Definition)
(definicin de estructura en el diagrama), pero por el contrario, una DSD (Data Structure
Definition) puede servir como base para ms de un flujo de datos (Data flow). Igualmente, el
flujo de metadatos (Metadata flow) se vincula a la definicin de estructura de metadatos
(Metadata Structure Definition). Los conjuntos de datos (Data set) o metadatos (Metadata set)
de un flujo de datos o metadatos de referencia pueden ser proporcionados por muchos
proveedores de datos (Data providers) y cualquier proveedor de datos (Data provider) puede
presentar o publicar conjuntos de datos (Data sets) o metadatos (Metadata sets) para muchos
flujos de datos (Data flows) o metadatos (Metadata flows). Habitualmente un proveedor de
datos (Data provider) puede aportar conjuntos de datos (Data sets) o metadatos (Metadata
sets) para muchos temas o categoras de datos estadsticos.
28/33
En SDMX, un proveedor de datos (Data provider) es una organizacin que produce datos o
metadatos de referencia disponibles para otras organizaciones. Los proveedores de datos
(Data providers) pueden proporcionar conjuntos de datos (Data set) a muchos flujos de datos
(Data flows) diferentes. Los flujos de datos (Data flows) pueden incorporar datos
provenientes de ms de un proveedor de datos (Data provider). Con el fin de gestionar este
proceso, el proveedor de datos (Data provider) se vincula a la definicin de flujo de datos o
definicin de flujo de metadatos mediante un acuerdo de provisin (Provision Agreement):
objetos que nos dicen qu proveedores de datos (Data providers) estn aportando qu datos a
qu flujos de datos (Data flows). Lo mismo se cumple para los flujos de metadatos (Metadata
flows).
4.10 Acuerdo de Provisin (Provision Agreement)
29/33
con flujos de datos (Data flows), que habitualmente describen los temas que se cubren
(= restricciones relacionadas con contenido);
con el acuerdo de provisin (provision agreement), que aporta una descripcin
completa de restricciones temporales (Time-related Constraints) y restricciones de
contenido.
30/33
Ejemplo:
Un proveedor de datos (data provider) podra suprimir la presentacin de varios productos
confidenciales presentes en datos de comercio exterior, donde el valor por unidad excediera una
cantidad especfica (ej.: 10 millones de euros).
Ejemplo:
Un proveedor de datos (data provider) podra suprimir la presentacin de varios productos
confidenciales presentes en datos de comercio exterior (como maquinara especial o armas). En
consecuencia, los respectivos valores codificados (coded values) de la lista de cdigos (Code List) del
productor se excluiran del informe.
STS_CONS
STS_CONS_PRO
STS_CONS_LAB
STS_TS
SBS
SBS_NA
SBS_IND_CO
SBS_DT
SBS_SERV
TOUR
PROM
ISCO
Descripcin
Un esquema de categora para industria,
comercio y servicios
Descripcin
Industria, Comercio y Servicios
Estadsticas de Negocios a Corto Plazo (ENCP)
ENCP Industria
ENCP ndice de Produccin Industrial
ENCP ndice de Facturacin Industrial
ENCP Construccin
ENCP ndice de Produccin de Construccin
ENCP ndice de Mano de Obra de Construccin
Estadsticas de Turismo
Estadsticas de Produccin de Bienes
Manufacturados
Estadsticas de Sociedad de Informacin
32/33
Glosario
Concepto
Definicin
DSD
ESMS
GESMES
ID
Identificador (Identifier)
IT
MSD
NUTS
SBS
SDMX
SDMX-IM
SDMX-ML
SODI
STS
XML
Estadsticas
Tabla 17 - Glosario
33/33