Anda di halaman 1dari 33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Gua de auto-aprendizaje en SDMX n. 2


Libro del estudiante
El modelo de informacin SDMX

1/33

Gua de auto-aprendizaje en SDMX

Autor

Libro del estudiante n. 2 - El modelo de informacin SDMX

Eurostat, Direccin A: Cooperacin en el Sistema Estadstico Europeo;


cooperacin internacional; recursos
Unidad A6: Cooperacin estadstica

ltima
actualizacin

Septiembre 2012

Versin

1.0

2/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

TABLA DE CONTENIDOS

OBJETIVO DEL LIBRO DEL ESTUDIANTE..........................................................................................4

DATOS ESTADSTICOS Y METADATOS ESTRUCTURALES Y DE REFERENCIA.......................5


2.1

DATOS ESTADSTICOS.................................................................................................................................5

2.1.1

Datos en Formato de Serie Temporal (Time series)........................................................................6

2.1.2

Datos en Formato Transversal (Cross-sectional)............................................................................6

2.2

METADATOS ESTADSTICOS........................................................................................................................6

2.2.1

Metadatos Estructurales..................................................................................................................7

2.2.2

Metadatos de Referencia..................................................................................................................7

3
BREVE INTRODUCCIN AL MODELO DE INFORMACIN SDMX (SDMX INFORMATION
MODEL).................................................................................................................................................................9
4

LOS OBJETOS SDMX PRINCIPALES....................................................................................................12


4.1

INTRODUCCIN.........................................................................................................................................12

4.2

CONCEPTO Y ESQUEMA DE CONCEPTO....................................................................................................12

4.3

LISTAS DE CDIGOS (CODE LIST)............................................................................................................13

4.4

DEFINICIN DE ESTRUCTURA DE DATOS (DSD)......................................................................................15

4.5

CONJUNTO DE DATOS (DATASET).............................................................................................................21

4.5.1

Conjunto de datos de serie temporal (Time series Dataset)..........................................................21

4.5.2

Conjunto de Datos Transversal (Cross-sectional).........................................................................22

4.6

DEFINICIN DE ESTRUCTURA DE METADATOS (MSD: METADATA STRUCTURE DEFINITION).................24

4.7

CONJUNTOS DE METADATOS....................................................................................................................25

4.8

DEFINICIN DE FLUJO DE DATOS (DATAFLOW )Y METADATOS (METADATA FLOW)...............................26

4.9

PROVEEDOR DE DATOS (DATA PROVIDER)...............................................................................................29

4.10

ACUERDO DE PROVISIN (PROVISION AGREEMENT)..........................................................................29

4.11

RESTRICCIONES (CONSTRAINTS).........................................................................................................29

4.12

ESQUEMA DE CATEGORA (CATEGORY SCHEME)................................................................................31

GLOSARIO..................................................................................................................................................33

3/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Objetivo del Libro del Estudiante

El libro del estudiante tiene como objetivo proporcionar a los usuarios interesados una
introduccin general al Modelo de Informacin SDMX (SDMX Information Model):

el modelo de informacin SDMX (SDMX Information Model) para datos;

el modelo de informacin SDMX (SDMX Information Model) para metadatos;

los objetos principales del modelo de informacin SDMX (SDMX Information


Model);

Al finalizar el libro del estudiante, el lector deber ser capaz de entender el funcionamiento
bsico del modelo de informacin SDMX (SDMX Information Model).
El libro del estudiante es el segundo de un nmero de libros que juntos, ofrecen un conjunto
completo de informacin para operar SDMX, con una atencin especial en el modelo de
datos.

Ref.

Ttulo

[01]

Introduccin a SDMX

[02]

El Modelo de Informacin SDMX (SDMX Information Model)

[03]

Mensajes SDMX-ML

[04]

Definicin de Estructura de Datos (Data Structure Definition)

[05]

Definicion de Estructura de Metadatos (Metadata Structure


Definition)

[06]

Tecnologas basadas en XML usadas en SDMX

[07]

Arquitecturas SDMX de mtodo pull para compartir datos - Parte


1

[08]

Arquitecturas SDMX de mtodo pull para compartir datos - Parte


2
Tabla 1 Libros del estudiante sobre SDMX

Prerrequisitos
Este libro del estudiante puede que requiera la lectura del primer libro del estudiante.

4/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Datos Estadsticos y Metadatos Estructurales y de Referencia


2.1 Datos Estadsticos

Los datos estadsticos son a menudo un conjunto de observaciones numricas que tienen
alguna referencia de tiempo asociada a las mismas. Se asocian con un conjunto de valores de
metadatos, que representan conceptos especficos, y que adems, actan como identificadores
y descriptores de los datos. Estos valores de metadatos y conceptos pueden entenderse como
dimensiones identificadas de un sistema multidimensional coordinado, que a su vez describen
lo que a menudo se conoce como cubo de datos (dibujo 1).
Dimensin
Pas

Medida
Measure
TI

20 aos
20 years

Dimensin
Edad
Ages

24.7
24.7

2009-02

Dimensin
Periodo

Dibujo 1 Cubo multidimensional de datos

Existen diferentes organizaciones de datos a la hora de presentar datos estadsticos. Los datos
de tabla se pueden formatear como una tabla multidimensional, en formato de serie temporal
(Time series) o en formato de datos transversales (Cross-sectional).
El ejemplo de organizacin de datos de serie temporal (Time series) (tabla 2) presenta los
datos estadsticos de acuerdo a perodos de observacin anuales. En esta tabla solo nos
fijamos en una entidad (FR = Francia) geogrfica (GEO) para el desarrollo del nmero de
tipos de establecimientos tursticos a lo largo de un perodo especfico.
La organizacin de datos transversales (Cross-sectional) se usa para el intercambio de datos
con ms de un tipo de observacin en un conjunto de datos (tabla 3). Esto significa que est
indicada para situaciones donde los datos estadsticos consisten de mltiples observaciones
(A100 Hoteles y similares, B010 Campings de turistas y B020 Residencias
vacacionales) en un momento concreto de tiempo.
Un ejemplo de tabla estadstica multidimensional se presenta en el dibujo 3 (en la pgina 7).
En este ejemplo se presentan dos capas de dimensin en las columnas de la tabla (actividad y
tiempo)

5/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

2.1.1 Datos en Formato de Serie Temporal (Time series)

Nmero de establecimientos tursticos Serie temporal (Time series)


FREC: A Anual
GEO: FR Francia
TOUR_INDICATOR: A001 Establecimientos
UNIT: NBR Nmero
Actividad

A100
Hoteles y similares

B010
Campings de turistas

B020
Residencias vacacionales

2002A00

18768

8354

1934

2003A00

18617

8331

1968

2004A00

18598

8289

2251

2005A00

18689

8174

2329

Tiempo

Tabla 2 Datos en formato de serie temporal (Time series)


2.1.2 Datos en Formato Transversal (Cross-sectional)

Nmero de establecimientos tursticos Transversal (Cross-sectional)


TIEMPO: 2007A00
TOUR_INDICATOR: A001 - Establecimientos
UNIT: NBR Nmero
Actividad

A100
Hoteles y similares

B010
Campings de turistas

B020
Residencias vacacionales

AT

14204

540

3388

ES

17827

1220

4843

FR

18135

8052

2406

IT

34058

2587

61810

Pas

Tabla 3 Datos en formato de datos transversales (Cross-sectional)

2.2 Metadatos Estadsticos

El trmino metadatos es, sin lugar a dudas, muy amplio. Para empezar, se puede hacer una
distincin entre metadatos estructurales, que son aquellos conceptos usados en la
descripcin e identificacin de datos y metadatos estadsticos, y metadatos de referencia
(metadatos explicativos adicionales, por ejemplo, a una metodologa o aspectos de calidad).
Los siguientes prrafos proporcionarn una explicacin ms en profundidad de estos dos
tipos, metadatos estructurales y de referencia, usados para expresar estructuras de datos y
metadatos y para entender conjuntos de metadatos y datos en relacin al modelo de
informacin SDMX (SDMX Information Model).

6/33

Gua de auto-aprendizaje en SDMX

2.2.1

Libro del estudiante n. 2 - El modelo de informacin SDMX

Metadatos Estructurales

Los conjuntos de datos estadsticos son descritos por un conjunto de valores de metadatos,
tomados de conceptos especficos. Los conceptos actan como identificadores y descriptores
de los datos. Este sistema de conceptos que identifican y describen datos toma la forma de
dimensiones identificadas en un cubo multidimensional de datos.
Los metadatos estructurales se organizan en definiciones de estructuras. Una Definicin de
Estructura de Datos (DSD, Data Structure Definition, en ingls)/Definicin de Estructura
de Metadatos (MSD, Metadata Structure Definition) describe cmo se organizan los
conjuntos de datos/metadatos y define el mecanismo para aadir referencias a aquellos
conjuntos de datos/metadatos que son descritos por los metadatos estructurales.
A los conceptos que se usan en una definicin de estructura de datos se les da un "rol de uso"
de dimensin, atributo, y medida en esa misma definicin. La definicin de la estructura de
datos, cualquiera que sea la estructura modelada de un cubo de datos, puede incluir
tambin conceptos especiales, como por ejemplo la dimensin medida, para representar las
medidas mltiples de una organizacin de datos transversales.
Cuando los conceptos toman su valor de un conjunto de valores conocidos (cdigos),
entonces los objetos conocidos como "Listas de Cdigos" (Code List) pueden ser vinculados
a la representacin de conceptos o, ms frecuentemente, asignados al concepto relacionado en
la DSD (Familia Clave) (Key Family).
2.2.2 Metadatos de Referencia

Los conjuntos de metadatos mencionados arriba se relacionan con el modelo SDMX para
aportar metadatos explicativos adicionales, que a menudos son expresados en SDMX como
metadatos de referencia. Los metadatos de referencia se presentan generalmente en un
formato textual, usando conceptos que describen el contenido, la metodologa y la calidad de
los datos, que pueden desgranarse de la siguiente manera:

metadatos conceptuales, que describen a los conceptos usados y su implementacin


prctica;
metadatos metodolgicos, que describen a los mtodos usados en la generacin de
datos;
metadatos de calidad, que describen los distintos aspectos relacionados con la calidad
de los datos estadsticos.

Estos son, en su mayora, metadatos que no forman parte integral del conjunto de datos
estadsticos. Por el contrario, stos tienen que ver con metadatos relacionados con
colecciones enteras de datos. Los metadatos de referencia son metadatos de contenido que
aportan ms informacin sobre los datos estadsticos, con el fin de que su interpretacin sea
ms significativa.
Los metadatos de referencia se estructuran en relacin a una "definicin de estructura de
metadatos" (MSD: Metadata Structure Definition). Una definicin de estructura de metadatos
describe cmo se organizan los conjuntos de metadatos que contienen metadatos de
referencia, y define el mecanismo para aadir referencias a los datos estadsticos o los
metadatos estructurales con los que estos metadatos de referencia se relacionan.
Eurostat tiene definida una estructura de metadatos que se llama estructura de metadatos
Euro-SDMX (ESMS: Euro-SDMX Metadata Structure). sta contiene la descripcin y
representacin de conceptos de metadatos estadsticos que han de usarse para documentar

7/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

datos estadsticos y proporcionar informacin til para asegurar la calidad de los datos y el
proceso de produccin en general.

8/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Breve Introduccin al Modelo de Informacin SDMX (SDMX Information Model)

El modelo de informacin SDMX (SDMX Information Model) proporciona un amplio


conjunto de objetos formales y sus relaciones existentes para representar datos y metadatos
estadsticos, actores, procesos, y recursos presentes en intercambios estadsticos. Aparte de
los objetos descritos en detalle en el libro del estudiante, el modelo de informacin SDMX
(SDMX Information Model) incluye definiciones en detalle de modelos tcnicos y dems
componentes que se muestran de forma resumida a continuacin:
Conjunto de Estructuras y Mapeados (Structure Set and Mappings): los conjuntos de
estructuras permiten agrupar metadatos estructurales para formar una descripcin completa
de las relaciones entre conjuntos especficos relacionados de datos y metadatos. Los
conjuntos de estructuras pueden usarse para mapear dimensiones y atributos entre s, para
mapear conceptos, mapear listas de cdigos (Codelist) y mapear esquemas de categora
(Category Schemes).
Informe taxonmico: un informe taxonmico permite a una organizacin vincular
(opcionalmente de una forma jerarquizada) un nmero de cubos de datos o definiciones de
flujo de datos, que forman un informe completo de datos o metadatos.
Proceso y Transiciones: en cualquier sistema que procese datos y metadatos, el propio
sistema est constituido por una serie de procesos y en cada uno de estos procesos, los datos
o metadatos pueden sufrir una serie de transiciones. El modelo de proceso es un modelo
genrico que puede capturar informacin clave acerca de estas fases de una manera textual y
tambin de una manera ms formalizada mediante el uso de expresiones.
Transformacin y Expresiones: en el modelo, este paquete permite hacer un seguimiento de
cmo los datos se adquieren o derivan. El modelo puede usarse igualmente para definir
transformaciones/derivaciones de datos y para definir comprobaciones de integridad con la
ayuda de expresiones (ej.: la suma de A+B ha de ser igual a C).
El dibujo 2 a continuacin describe las caractersticas esenciales que ofrece el modelo de
informacin SDMX (SDMX Information Model) para la presentacin de datos y metadatos.

Dibujo 2 Elementos principales del modelo de informacin SDMX (SDMX


Information Model)

9/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

El soporte de este diagrama es el flujo de datos o metadatos (Data/Metadata Flow), que es


mantenido por la organizacin que recoge datos o metadatos. El flujo de datos se vincula a
una definicin de estructura de datos (DSD: Data Structure Definition) mientras que un
flujo de metadatos se vincula a una definicin de estructura de metadatos (MSD: Metadata
Structure Definition). La DSD o MSD definen a la estructura de datos o metadatos e
identifican los elementos con los que los metadatos relacionados se pueden relacionar.
Los datos o metadatos estn a disposicin de muchos proveedores. Cualquier proveedor
puede proporcionar o publicar datos o metadatos para varios flujos de datos o metadatos, en
relacin al acuerdo de provisin.
El flujo de datos y metadatos puede vincularse tambin a uno o ms temas estadsticos
(categora) dentro de un esquema de materias (esquema de categora) (Category Scheme). Un
esquema de categora proporciona una forma de clasificar datos para su recogida, informe o
publicacin.
Ejemplo:

Se definen cuatro categoras para estadsticas de negocios a corto


plazo (STS-Short-Term Business Statistics) dentro del proyecto
Intercambio de Datos Abiertos SDMX (SDMX Open Data
Interchange (SODI)):
o

SSTSCONS SODI Estadsticas a corto plazo sobre


construccin;

SSTSIND SODI Estadsticas a corto plazo sobre industria;

SSTSRTD SODI Estadsticas a corto plazo sobre comercio


al por menor;

SSTSSERV SODI Estadsticas a corto plazo sobre


servicios.

Cada uno de estos se vincula con uno o ms flujos de datos. En el


caso de SSTSCONS, por ejemplo, los siguientes flujos de datos se
definen para los datos que se recogen:
o

SSTSCONS_PROD_M (Produccin en construccin total,


construccin de edificios, ingeniera civil mensual);

SSTSCONS_PROD_Q (Produccin en construccin total,


construccin de edificios, ingeniera civil trimestral);

Los flujos de datos como SSTIND_PROD_M se vinculan a una nica


definicin de estructura de datos (ej.: ESTAT+STS+2.1.xml).

Un acuerdo de provisin representa el marco o acuerdo entre el


proveedor de datos y un receptor que regula como se intercambia
un
conjunto
de
datos
o
metadatos
(por
ejemplo,
SSTSCONS_PROD_M_DE1.xml Proveedor de Datos: Oficina
Federal de Estadstica, Alemania; Receptor: Eurostat).

Los estndares SDMX ofrecen un modelo comn y mltiples formatos de datos que ofrecen
la posibilidad de intercambian cualquier tipo de cubo de datos. Para que se puedan procesar
automticamente los datos de una variedad de fuentes, la estructura de este cubo tiene que
10/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

estar definida de una manera que se ajuste al modelo de informacin SDMX (SDMX
Information Model).
En el modelo de informacin SDMX (SDMX Information Model), los metadatos
estructurales se representan mediante una lista de conceptos organizados por listas
denominadas "esquemas de conceptos" (Concept Schemes). Los conceptos son las piezas
bsicas del engranaje SDMX: los conceptos existen y se mantienen separados de cualquier
estructura que los use.
El modelo de informacin SDMX (SDMX Information Model) proporciona objetos para la
estructuracin no solo de datos, sino tambin de metadatos de referencia.
El modelo de informacin SDMX (SDMX Information Model) permite el intercambio y el
almacenamiento de metadatos de referencia independientemente de los datos que se estn
describiendo. Los metadatos de referencia se pueden mantener guardados en lo que se conoce
como repositorio de metadatos. En consecuencia, un sistema de difusin puede difundir datos
con los metadatos de referencia relacionados, que se extraen a peticin desde el repositorio de
metadatos de referencia.
Los metadatos de referencia tambin se pueden indexar para ofrecer funciones de bsqueda.
Para lograr esto, un informe de metadatos podra ser procesado, por ejemplo, por un servicio
de registro para extraer su informacin estructural. Esta informacin estructural permite
catalogar los metadatos y que un usuario lo pueda solicitar.
El proceso de provisin y gestin del flujo de conjuntos de datos o metadatos est cubierto
tambin por el modelo de informacin SDMX (SDMX Information Model), mediante
metadatos asociados que se ocupan del aprovisionamiento de datos. Los metadatos son
tiles para aqullos que necesitan entender el contenido y la forma de una produccin de
datos del proveedor. Cada proveedor de datos puede describir de una manera estndar el
contenido y las dependencias existentes en los conjuntos de datos y metadatos que estos
producen, y aportar informacin sobre la planificacin y el mecanismo que sigue la provisin
de sus datos y metadatos. Esto permite la automatizacin de algunas funciones de validacin
y control, as como la posibilidad de gestionar el informe de datos.
Para organizar y gestionar el intercambio y la difusin de datos y metadatos, el modelo de
informacin SDMX (SDMX Information Model) incluye tambin informacin sobre
esquemas de clasificacin y categoras de dominios, junto con sus relaciones con conjuntos
de datos y metadatos (por favor comprese con la seccin 4.12).

11/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Los Objetos SDMX Principales


4.1 Introduccin

El modelo de informacin SDMX (SDMX-IM SDMX Information Model) describe un


conjunto de objetos formales con el fin de mostrar una visin estndar del proceso de
intercambio estadstico.
Est basado en un conjunto de objetos que conceptualiza al mundo real en el marco de
actividades para compartir e intercambiar datos/metadatos estadsticos. Los siguientes
prrafos tratan de clarificar los principales objetos necesarios para entender las funciones
bsicas del modelo de informacin SDMX (SDMX Information Model).
4.2 Concepto y Esquema de Concepto

Los conceptos juegan un papel importante en el modelo de informacin SDMX (SDMX


Information Model), ya que se usan para describir la estructura de una tabla estadstica
multidimensional (dibujo 3 - Tabla estadstica multidimensional con sus conceptos) o la
estructura de un informe de metadatos. En el modelo de informacin SDMX (SDMX
Information Model), los conceptos pueden tener una representacin de valor especfica (valor
codificado, formato numrico, formato de fecha, cadena, etc.) que puede definirse a su vez en
el esquema de concepto.
En el ejemplo inferior, los conceptos identifican los diferentes elementos pertenecientes a una
tabla estadstica multidimensional de turismo. La tabla 4 muestra la lista de conceptos usados
adems de su representacin codificada.

Dibujo 3 Tabla estadstica multidimensional con sus conceptos

12/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Tabla 4 Ejemplo de estructura de concepto de la tabla superior

Los conceptos se identifican en esquemas de conceptos mediante un ID y un nombre en al


menos una lengua, y tambin pueden aadirse descripciones multilinges opcionales de los
conceptos.
Ejemplo: un concepto que describe a un pas de referencia podra definirse de la siguiente
manera:

Concepto: rea de referencia


ID

REF_AREA

Nombre

(Ingls)

Reference country code

(Francs)

Code du pays de rfrence

(Ingls)

Country from which the population migrate

(Francs)

Pays partir duquel la population migre

Descripcin

Tabla 5 rea de referencia de concepto

Un esquema de concepto (Concept Scheme) es un objeto SDMX mantenido por una agencia
y que contiene una lista de conceptos sobre los que se pueden construir definiciones de
estructuras de datos y metadatos (Data Structure Definition & Metadata Structure Definition).
Se pueden crear muchos esquemas de conceptos. Los esquemas de concepto (Concept
Schemes) generalmente agrupan conceptos relevantes para una nica estructura, aunque una
definicin de estructura de datos/metadatos (Data/Metada Structure Definition) puede usar
conceptos de esquemas de concepto (Concept Schemes) diferentes.
4.3 Listas de Cdigos (Code List)

En el modelo de informacin SDMX (SDMX Information Model), una lista de cdigos


(Code List) es un objeto que contiene una lista de cdigos, y que adems, estn mantenidos
13/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

por una agencia. Una lista de cdigos es simplemente un conjunto de valores que se usan para
la representacin de un concepto (dimensin o atributo) en definiciones de estructuras de
datos/metadatos (Data/Metadata Structure Definitions).

Ejemplo: CL_UNIT_MULT
Cdigo

Descripcin

Unidades

Decenas

Centenas

Miles

Decenas de miles

Millones

Miles de millones

Tabla 6 Ejemplo de lista de cdigos (Code List) de unidades multiplicadoras

Cada cdigo est definido exclusivamente por un valor y una descripcin que puede
proporcionarse en varios idiomas.
El modelo permite que una lista de cdigos (Code List) tenga una jerarqua simple de
cdigos. En ese caso, la jerarqua se hace mediante la definicin de un cdigo padre como
mximo para cdigos hijo.

Ejemplo : CL_NUTS
Cdigo

Descripcin

Cdigo
padre

BE2

VLAAMS GEWEST

BE3

REGIONE WALLONE

BE31

Prov. Brabant Wallon

BE3

BE32

Prov. Hainaut

BE3

BE321

Ath

BE32

BE322

Charleroi

BE32

BE323

Mons

BE32

BE324

Mouscron

BE32

BE33

Prov. Lieja

BE3

BE34

Prov. Luxemburgo (B)

BE3

BE35

Prov. Namur

BE3

Tabla 7 Lista jerrquica de cdigos (Code List) de regiones (NUTS, siglas en francs de Nomenclatura
de las Unidades Territoriales Estadsticas)

14/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

4.4 Definicin de Estructura de Datos (DSD)

La definicin de estructura de datos es el nombre que recibe un conjunto de explicaciones


sobre cmo se construye un conjunto de datos y cmo habr de interpretarse. Esta
descripcin de datos se construye sobre conceptos estadsticos. Muchas organizaciones se
refieren a esta definicin de estructura de datos (Data Structure Definition) como familia
clave (Key Family), y por tanto, los dos nombres son sinnimos.
La definicin de estructura de datos, mantenida por una agencia de mantenimiento (ej.:
Eurostat) es una descripcin de todos los metadatos estructurales necesarios para comprender
la estructura del conjunto de datos. De hecho, la definicin de estructura de datos vincula los
datos estadsticos a los metadatos estructurales mediante la asignacin de conceptos
descriptores a los elementos de los datos estadsticos.

Dibujo 4 Definicin de estructura de datos (Data Structure Definition)

Como se muestra en el dibujo superior, la definicin de estructura de datos est formada por
tres conjuntos de conceptos:

dimensiones que comprenden dimensiones no asociadas a claves y listas de claves:


o descriptor de clave;
o descriptor(es) de clave de grupo; puede haber ms de un descriptor de clave de
grupo.

lista de medidas.

lista de atributos.

Los conceptos dimensiones, medidas, y atributos se pueden tomar de cualquier esquema de


concepto (Concept Scheme) que se encuentre mantenido, y estos no tienen que venir de la
misma agencia o esquema.

15/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Las dimensiones son aquellos conceptos que describen datos estadsticos y forman el
identificador (clave) de los datos relacionados. Para lograr esto, las dimensiones se agrupan
en claves, que permitirn la identificacin de un conjunto de datos particular (por ejemplo,
una serie).
La lista de medidas comprende una medida para los datos de serie temporal (Time series): la
medida primaria. sta suele asociarse con el concepto OBS_VALUE y mide un fenmeno
estadstico a lo largo de un perodo de tiempo. Solamente puede haber una medida primaria
declarada en la DSD (Data Structure Definition). Esto significa que en una serie temporal
(Time series) SDMX solo puede haber un concepto de medida.
Por otro lado, para la organizacin de datos transversales (Cross-sectional), se puede declarar
una dimensin de medida que contenga las medidas transversales mltiples (ver seccin
4.5.2).
La lista de atributos comprende uno o ms atributos. Los atributos son conceptos que se
usan para proporcionar ms informacin sobre alguna parte de un conjunto de datos. Cada
atributo de la definicin de estructura de datos debe asignarse a una parte identificada del
conjunto de datos (en el modelo, esto se conoce como nivel de asociacin o nivel de
agrupamiento).
Las claves consisten en dimensiones, cuyos valores combinados en un conjunto de datos
identifican nicamente valores de datos observados (serie o seccin). Un valor de
observacin particular en una serie temporal se identifica con la clave y con el tiempo de este
valor particular. El modelo de informacin SDMX (SDMX Information Model) permite crear
subconjuntos de claves llamados claves de grupo. Este subconjunto de dimensiones de clave
forma una clave parcial cuyos valores combinados identifican un subconjunto del cubo, al
que los atributos estn vinculados, aportando metadatos sobre el objeto identificado. Por
tanto, el propsito del descriptor de clave de grupo es el de definir un subconjunto
perteneciente al descriptor de clave completa al que se pueden adjuntar atributos de datos.
Dentro de un grupo, algunos conceptos descriptores tienen valores que son los mismos para
todas las series dentro del grupo, mientras que otros conceptos descriptores s se pueden
cambiar. La regla a cumplir es que los conceptos descriptores han de ser adjuntados al nivel
de agrupamiento donde se vuelven variables. Por tanto, si dentro de un nico conjunto de
datos, todos los contenidos de una serie comparten un nico valor para un concepto
descriptor, entonces ese concepto descriptor deber adjuntarse al nivel de serie. Esta regla
tambin asume que el nivel elegido es el nivel estructural ms alto, donde todos los
subgrupos compartirn el mismo valor.
Los niveles de asociacin de conceptos descriptores siempre se encuentran al menos en el
nivel donde el concepto resulta significativo: as pues, no se puede adjuntar el concepto
descriptor frecuencia en el nivel de observacin, porque como concepto que es, solamente
puede operar en el nivel de serie (esto es, con mltiples observaciones hechas durante un
tiempo).
El siguiente ejemplo sobre organizacin de datos de serie temporal aplicada a las estadsticas
de negocios de corto plazo de la produccin industrial (STS, Short-Term Business Statistics),
ilustra los elementos presentes en su relacionada definicin de estructura de datos (Data
Structure Definition). En el contexto de este ejemplo, se presta atencin especial a cuestiones
de agrupamiento. El dibujo 5 inferior - Esquema de estructura de datos (Data Structure
Scheme) de STS, se prolonga mediante casillas grises que contienen los conceptos STS
relacionados (ej.: STS_Indicator) y las representaciones del valor codificado para los
conceptos codificados (Coded Concepts) (ej: CL_STS_INDICATOR, la lista de cdigos
relacionada con el concepto STS_INDICATOR).
16/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Dibujo 5 Esquema de estructura de datos (Data Structure Scheme) de STS

Las estructuras de datos de serie temporal (Time-series Data Structures) como la del ejemplo
STS superior admiten los siguientes niveles de asociacin o niveles de agrupamiento:

NIVEL

IDENTIFICACIN

Conjunto de
datos

Nivel superior; el conjunto de datos completo;

Clave de
grupo

Identificada por un valor para cada una de las dimensiones que forman
la clave de grupo, por ejemplo, una clave de grupo formada por
FREQUENCY, ADJUSTMENT, STS_ACTIVITY, STS_INDICATOR,
STS_INSTITUTION y STS_BASE_YEAR;

Clave de
serie

Identificada por un valor para cada una de las dimensiones de la clave,


por ejemplo,
FREQUENCY,
ADJUSTMENT, REF_AREA,
STS_ACTIVITY, STS_INDICATOR, STS_INSTITUTION &
STS_BASE_YEAR;

Observacin

Identificada por un valor para cada una de las dimensiones de la clave


adems del valor tiempo, por ejemplo, FREQUENCY,
ADJUSTMENT, REF_AREA, STS_ACTIVITY, STS_INDICATOR,
STS_INSTITUTION y STS_BASE_YEAR, y TIME_PERIOD.
Tabla 8 Niveles de asociacin

El grupo ms comn que se usa es el SiblingGroup, en el que se incluyen todas las


dimensiones, excepto la frecuencia del informe. Este grupo se defina habitualmente en el
pasado, porque la mayora de atributos que no se encuentran directamente vinculados a la
observacin particular, no varan en cuanto a sus valores referidos de frecuencia. Por tanto,
resultara un tanto redundante el repetir valores de atributos para las series donde solo la
17/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

frecuencia cambia. En consecuencia, estos atributos podan adjuntarse en el nivel


SiblingGroup.
Teniendo en cuenta el ejemplo STS de arriba, un grupo sibling puede definirse con la
siguiente combinacin de valores de clave:

REF_AREA="BE"

ADJUSTMENT="N"

STS_INDICATOR="TOTV"

STS_ACTIVITY="NS0080"

STS_INSTITUTION="1"

STS_BASE_YEAR="2005"

Las series correspondientes se muestran en la tabla 9 para dos frecuencias diferentes


(mensual y trimestral):

ndice de Facturacin Industrial Total


Actividad = NS0080
(Solo para fines ilustrativos datos ficticios)
Mensual

ndice

2008M01
2008M02
2008M03
2008M04
2008M05
2008M06
2008M07
2008M08
2008M09
2008M10
2008M11
2008M12

95.19
87.13
97.09
111.45
121.23
137.76
108.19
112.15
103.09
99.65
101.23
97.76

Trimestral

ndice

2008Q01

94.24

2008Q02

122.79

2008Q03

107.24

2008Q04

98.29

Tabla 9 Datos del grupo sibling en forma de tabla

Al agrupar no existe ningn requisito por el que se deba tener una nica dimensin omitida
de una clave parcial (Partial Key); puede ser cualquier subconjunto del conjunto de
dimensiones ordenadas (esto es, todas las dimensiones excepto la dimensin tiempo, que
nunca puede ser declarada como perteneciente a la clave de grupo o parcial (Group/Partial
Key)). Todos los grupos declarados en la definicin de estructura de datos (Data Structure
Definition) han de ser nicos, esto quiere decir que no se pueden tener claves parciales
duplicadas. En SDMX, los datos se pueden agrupar para que funcionen como un paquete de
informacin til. Por tanto, para datos STS es posible un agrupamiento del rea de referencia
(REF_AREA) o STS_ACTIVITY, adems de otras dimensiones de clave (Key Dimensions).
Debajo, se ilustra el ejemplo de un grupo "REF_AREA". Este grupo se declara porque no
existe ninguna variacin para los atributos de pases diferentes. Esto es para todas las
dimensiones excepto la dimensin REF_AREA que forma la clave parcial (o clave de grupo).
Por tanto, la dimensin REF_AREA , que no es parte de un grupo, tiene un valor que vara
dentro del nivel de serie (para la organizacin de datos de serie temporal STS).
18/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

En el ejemplo se toman dos conjuntos de valores de claves parciales (claves de grupo) para
organizar los datos (grupo 1 y grupo 2). Los grupos se diferencian entre s solamente en las
claves por valor de actividad. En cada grupo, imaginamos dos conjuntos de claves que
identifican las series temporales (serie 1 y serie 2) cuyos valores de clave se diferencian solo
por el rea de referencia. Una vez que se ha definido un agrupamiento, los atributos
relevantes se adjuntan a los grupos (ej.: los atributos de nivel de grupo en el ejemplo: ttulo y
decimales).
Ejemplo del grupo "REF_AREA":
El conjunto de datos STS se representa como serie temporal en formato CSV:
M;BE;N;TOTV;NS0080;1;2005;2008-04;95.19;E;F
M;BG;N;TOTV;NS0080;1;2005;2008-04;138.05;A;F
M;BE;N;TOTV;NS0080;1;2005;2008-05;87.13;E;F
M;BG;N;TOTV;NS0080;1;2005;2008-05;137.76;A;F
M;BE;N;TOTV;NS0060;1;2005;2008-04;101.24;E;F
M;BG;N;TOTV;NS0060;1;2005;2008-04;165.59;A;F
M;BE;N;TOTV;NS0060;1;2005;2008-05;86.59;E;F
M;BG;N;TOTV;NS0060;1;2005;2008-05;168.55;A;F
Estructura de datos STS (STS Data Structure): Las dimensiones son: frequency; reference
area; adjustment; indicator; activity; institution; base_year; time_period. Los atributos son:
obs_status; confidentiality; decimals y title
Por favor tngase en cuenta que la clave de grupo ha de mostrarse en las series de las que
dependan stas para establecer el vnculo, ya que las series vinculadas no pueden estar integradas
en los grupos para los datos de SDMX-ML compacto
Grupo 1: Frequency = M; adjustment =N; indicator = TOTV; activity = NS0080; institution = 1;
base_year = 2005; Title = ndice de Facturacin Industrial Total de bienes de consumo no
duraderos; Decimals = 2.
Grupo 2: Frequency = M; adjustment =N; indicator = TOTV; activity = NS0060; institution = 1;
base_year = 2000; Title = ndice de Facturacin Industrial Total de bienes de consumo
duraderos; Decimals = 2.
Serie 1: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0080; institution = 1;
base_year = 2005, reference area =BE
Observaciones
time_period = 2008-04; observation value =95.19; status =E; confidentiality = F
time_period = 2008-05; observation value =87.13; status =E; confidentiality = F
Serie 2: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0080; institution = 1;
base_year = 2005, reference area =BG
Observaciones
time_period = 2008-04; observation value =138.05; status = A; confidentiality = F
time_period = 2008-05; observation value =137.76; status = A; confidentiality = F
Serie 1: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0060; institution = 1;
base_year = 2000, reference area =BE
Observaciones
time_period = 2008-04; observation value =101.24; status =E; confidentiality = F
time_period = 2008-05; observation value =86.59; status =E; confidentiality = F
Serie 2: Frequency = M; adjustment =N; indicator = TOTV; activity =NS0060; institution = 1;
base_year = 2005, reference area =BG
Observaciones
time_period = 2008-04; observation value =165.59; status = A; confidentiality = F
time_period = 2008-05; observation value =168.55; status = A; confidentiality = F

19/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

ndice de Facturacin Industrial Total (IFIT)


datos mensuales (2005 = 100)
No ajustadas estacionalmente o por das de trabajo
Actividad
rea de referencia

Tiempo

Blgica

BE

Bulgaria

BG

NS0080

NS0060

Bienes de consumo

Bienes de consumo
duraderos

2008-04

2008-05

2008-04

95.19 e

87.13 e

101.24 e

138.05

137.76

165.59

2008-05
86.59 e
168.55

e: Estimaciones de Eurostat
Tabla 10 - STS ndice de facturacin industrial total (tabla multidimensional)

Pos. en Dimensin o nombre


clave
de atributo

Identificador

Lista de cdigos

Nivel de
asociacin

DIMENSIONES
1

Frecuencia

FREQ

CL_FREQ

rea de referencia

REF_AREA

CL_REF_AREA

Ajuste

ADJUSTMENT

CL_ADJUSTMENT

Tipo de ndice

STS_INDICATOR

CL_STS _INDICATOR

Actividad

STS_ACTIVITY

CL_STS _ACTIVITY

Tipo de institucin

STS_INSTITUTION

CL_STS_INSTITUTION

Ao base

STS_BASE_YEAR

CL_STS_BASE_YEAR

Perodo de referencia

TIME_PERIOD
MEDIDAS

ndice de facturacin

OBS_VALUE
ATRIBUTOS

Estado de observacin OBS_STATUS

CL_OBS_STATUS

Observacin

Confidencialidad

OBS_CONF

CL_OBS_CONF

Observacin

Formato de tiempo

TIME_FORMAT

CL_TIME_FORMAT

Serie

Ttulo

TITLE

Decimales

DECIMALS

Grupo
CL_DECIMALS

Grupo

Tabla 11 Conceptos de estructura de datos (Data Structure Concepts) del ejemplo en serie temporal
(Time series)

20/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

4.5 Conjunto de Datos (Dataset)

El conjunto de datos contiene datos y metadatos relacionados cuyo contenido se ajusta a la


especificacin de una definicin de estructura de datos (Data Structure Definition).
Segn se ilustra en el dibujo 6, la definicin de estructura de datos (Data Structure
Definition) puede vincularse con una definicin de flujo de datos. El flujo de datos (ver
seccin 4.8) define aquellos metadatos relacionados con un flujo de datos que se recoge o
difunde. Tales metadatos contienen, por ejemplo, la periodicidad de los informes y qu
organizaciones presentan un determinado conjunto de datos.

Dibujo 6: Vista general de un conjunto de datos (Dataset)

4.5.1 Conjunto de datos de serie temporal (Time series Dataset)

El conjunto de datos de serie temporal comprende:

las claves de serie temporal (Time series Keys), cada una de las cuales define la clave
de una serie temporal que, cuando se combina con un perodo de tiempo, identifica
exclusivamente a una observacin;
opcionalmente las claves de grupo (Group Keys), que (conceptualmente) comprenden
un conjunto de claves de serie temporal (Time series Keys) para el cual pueden
presentar valores de atributo;
valores de atributo, que se presentan para un objeto especfico como puede ser el de
un conjunto de datos (Dataset), clave de grupo (Group Keys), clave de serie temporal
(Time series Key) o observacin.

La estructura principal de un conjunto de datos (Dataset) es un conjunto de claves y claves de


grupo (Group Keys). Cada clave comprende un conjunto de valores de clave; un valor para
cada una de las dimensiones definidas en la definicin de estructura de datos. En el caso de la
21/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

serie temporal (Time series), para cada clave puede haber uno o ms valores de observacin
en diferentes momentos dentro de un perodo de tiempo. Los valores de atributo pueden
presentarse, y cada uno de estos valores pueden adjuntarse al nivel apropiado: conjunto de
datos (Dataset), clave de series (Series Key), clave de grupo (Group Key) o directamente un
valor de observacin.
El conjunto de datos (Dataset) puede incluir una referencia al flujo de datos, el cual por su
parte, se encuentra vinculado (obligatoriamente) a la definicin de una estructura de datos
(Data Structure Definition). Una aplicacin puede entonces usar el flujo de datos para
recuperar la DSD (Data Structure Definition) y as procesar o validar el conjunto de datos
(Dataset).
4.5.2 Conjunto de Datos Transversal (Cross-sectional)

Los datos transversales (cross-sectional) son aquellos tipos de datos estadsticos que no se
encuentran organizados como lo suelen estar los de serie temporal. Estos datos se organizan
entorno a otra dimensin no temporal del cubo de datos estadsticos.
Las representaciones transversales (cross-sectional) de los datos pueden obtenerse de la
misma definicin de estructura de datos (Data Structure Definition) de la que obtienen su
estructura las representaciones de serie temporal, siempre que se aporten los metadatos
estructurales adicionales que sean necesarios.
Esta funcionalidad permite a mltiples medidas (denominadas medidas transversales - Crosssectional Measures) ser declaradas en una definicin de estructura de datos (Data Structure
Definition), asociada con los valores de representacin de una dimensin. Cuando los datos
se estructuran para representar a un conjunto de mltiples observaciones en un momento
concreto de tiempo, la seccin (una o ms observaciones para cada medida declarada)
reemplaza a las series en la estructura de datos.
Cada medida lleva al menos una dimensin de la clave (la dimensin de medida) (Measure
Dimension) en el nivel de observacin, mientras que el perodo de tiempo se adjunta en un
nivel ms alto dentro de la estructura de datos (el nivel de grupo, que se detalla ms abajo).
El resto de la clave se encuentra en el nivel de seccin (o ms arriba), de la misma manera en
que se adjunta al nivel de serie para estructuras de datos de serie temporal.
Por ejemplo, si la dimensin ACTIVIDAD (ACTIVITY Dimension) se declara como
dimensin de medida en la definicin de estructura de datos STS (tabla 12), entonces
definimos varias secciones que corresponden a varios posibles valores de la dimensin,
digamos NS0080, NS0060, y NS0050.
Los conceptos que describen las tres medidas transversales (cross-sectional) tienen que
definirse para declararse luego en la definicin de estructura de datos (Data Structure
Definition). Por ejemplo:

Nombre
concepto

de Valor correspondiente de la dimensin de medida


ACTIVIDAD

CONGIND

NS0080

MIGDCG

NS0060

MIGCDI

NS0050
Tabla 12 Conceptos de la dimensin de medida ACTIVIDAD
22/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

En tal situacin, la definicin de los conceptos de los datos STS se ve enriquecida con tres
nuevas medidas:

Pos. en Dimensin o nombre de


clave
atributo

Identificador

Lista de cdigos

Nivel de
asociacin

DIMENSIONES
1

Frecuencia

FREQ

CL_FREQ

Seccin

rea de referencia

REF_AREA

CL_REF_AREA

Seccin

Ajuste

ADJUSTMENT

CL_ADJUSTMENT

Seccin

Tipo de ndice

STS_INDICATOR

CL_STS_INDICATOR

Seccin

Dimensin Actividad /
Medida

STS_ACTIVITY

CL_STS_ACTIVITY

Observacin

Tipo de institucin

STS_INSTITUTION CL_STS_INSTITUTION Seccin

Ao base

STS_BASE_YEAR

Perodo de referencia

TIME_PERIOD

CL_STS_BASE_YEAR

Seccin
Grupo

MEDIDAS (de la Dimensin de Medida de Actividad)


Industria de bienes de
consumo

CONGIND

Industria de bienes de
consumo duraderos

MIGDCG

Industria de bienes de
capital

MIGCDI
ATRIBUTOS

Estado de observacin

OBS_STATUS

CL_OBS_STATUS

Observacin

Confidencialidad

OBS_CONF

CL_OBS_CONF

Observacin

Formato de tiempo

TIME_FORMAT

CL_TIME_FORMAT

Seccin

Ttulo

TITLE

Decimales

DECIMALS

Grupo
CL_DECIMALS

Grupo

Tabla 13 Conceptos de estructura de datos (Data Structure Concepts) del ejemplo con medidas
transversales (Cross-sectional Measures)

23/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Las siguientes tablas ilustran las dos representaciones de datos: serie temporal y transversal:

ndice de Facturacin Industrial Total (IFIT) Serie Temporal


REF_AREA_REF: Italia
INDICATOR: IFIT
BASE YEAR: 2005
Indicador
NS0080
Bienes de consumo
Tiempo
2007M01
100.8
2007M02
106.5
2007M03
121.2
2007M04
97.7
2007M05
111.9
2007M06
116

NS0060
Bienes de consumo
duradero
82.4
97.1
121.3
104.4
121.8
120.3

NS0050
Industria de bienes de
capital
93.7
106.8
134.9
106.4
134.5
136.6

ndice de Facturacin Industrial Total (IFIT) Transversal


TIME: 2007M01
INDICATOR: IFIT
BASE YEAR: 2005
Indicador
NS0080
Bienes de consumo
Pas

NS0060
Bienes de consumo
duradero

NS0050
Industria de bienes de
capital

ES

99.6

104.6

108.4

FR

102.3

92.8

93.4

IT

100.8

82.4

93.7

Tabla 14 Tabla de serie temporal y transversal

4.6 Definicin de Estructura de Metadatos (MSD: Metadata Structure Definition) 1

Una definicin de estructura de metadatos (Metadata Structure Definition) define el


contenido vlido de un conjunto de metadatos (Metadata Set) (ver 4.7) en trminos de los
conceptos que comprenden la estructura del conjunto de metadatos (Metadata Set), cmo se
relacionan los conceptos en trminos de su papel en el conjunto de metadatos (Metadata Set),
y el contenido vlido de cada uno de los conceptos cuando se usan en un conjunto de
metadatos (Metadata Set).
Las definiciones de estructuras de metadatos (Metadata Structure Definition) se estructuran
de una manera bastante simple, porque los metadatos de referencia estn menos estructurados
que los datos estadsticos agregados. La estructura ms simple de estos consiste en una lista
plana o una jerarqua.
Una MSD (Metadata Structure Definition) lleva una serie de conceptos (que pueden tener
como origen esquemas de concepto (Concept Schemes) distintos) y los organiza, por
ejemplo, en una jerarqua. Adems, tambin seala para cada concepto si su informe es
La MSD (Metadata Structure Definition) y los conjuntos de metadatos se describen con
ms detalle en el libro del estudiante 5 Definicin de Estructura de Metadatos
(Metadata Structure Definition)
1

24/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

necesario u opcional, y asigna una representacin de un concepto (listas de cdigos (Code


List), formato de texto, etc.). Adems, identifica el tema(s) (denominado identificador de
objetivo target identifier) de los metadatos publicados, siempre en relacin con qu datos
los metadatos de referencia se estn presentando.
4.7 Conjuntos de Metadatos

Dibujo 7 Conjunto de metadatos

Un conjunto de metadatos de referencia (Reference Metadata Set) se presenta para un flujo


de metadatos dado que ha de ajustarse a una definicin de estructura de metadatos (Metadata
Structure Definition). Las claves de objetivo (target keys) identifican los datos de objetivo o
el objeto de metadatos para el que se declaran los atributos de metadatos (con sus valores
particulares). El hecho de que el conjunto de metadatos incluya una referencia al flujo de
metadatos, que se encuentra estrictamente vinculado a la definicin de estructura de
metadatos (Metadata Structure Definition), permite que una aplicacin recupere la MSD
(Metadata Structure Definition) para que la presentacin de los metadatos pueda procesarse,
y validarse, si as se requiere.
Un conjunto de metadatos de referencia (Reference Metadata Set) alberga informacin sobre
casi cualquier objeto dentro de la visin SDMX formal de intercambios estadsticos, y puede
describir:

los que mantienen los datos o definiciones estructurales;

la planificacin para la publicacin de datos;

el flujo de un nico tipo de datos en un espacio de tiempo;

la calidad de los datos (segn lo estipulado en un marco de calidad de datos).

Los conjuntos de metadatos (Metadata Set) generalmente comprenden mltiples informes de


metadatos, y cada informe define a su vez:
25/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

un objeto nico, al que los metadatos de referencia se vinculan;

los valores presentados de los atributos de metadatos (como se especifica en la MSD


(Metadata Structure Definition)) que son los que forman la estructura especfica de la
declaracin.

4.8 Definicin de Flujo de Datos (Dataflow) y Metadatos (Metadata Flow)

En SDMX, los conjuntos de datos se presentan o difunden segn una definicin de flujo de
datos. La definicin de flujo de datos se vincula a la definicin de estructura de datos (Data
Structure Definition) y puede asociarse con uno o ms dominios de temas. Esto facilita la
bsqueda de datos segn un esquema de materia organizado (llamado esquema de categora
en el modelo) ya que estos proporcionan una manera de clasificar datos para su recogida,
presentacin o publicacin.

26/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Flujos de datos definidos para STS


SDMX2

GESMES

ESTAT+STS+2.0.xml

EUROSTAT_STS_TS.gsm

Flujos de datos

SDMX2

GESMES

Produccin en industria

SSTSIND_PROD_M

STSIND_PROD_M, _Q

DSD

Facturacin en industria, total, nacional,


internacional, reparto de la internacional en la zona
euro y fuera de la zona euro
Nuevos pedidos recibidos en industria, total,
nacional, no nacional, reparto de la no nacional en
la zona euro y fuera de la zona euro
Nmero de personas empleadas, nmero de
empleadores en la industria
Horas trabajadas en industria
Sueldos y salarios brutos en industria
Precios de produccin en industria, total, mercado
nacional, mercado internacional, reparto del
internacional en la zona euro y fuera de la zona
euro, precios de importacin (total, zona euro,
fuera de la zona euro)
Produccin de construccin, total, construccin de
edificios, ingeniera civil
Nuevos pedidos recibidos en construccin, total,
construccin de edificios e ingeniera civil
Nmero de personas empleadas, nmero de
empleadores, en construccin
Horas trabajadas en construccin
Sueldos y salarios brutos en construccin
Precios de produccin en construccin, costes de
construccin, costes materiales, costes laborales
Permisos de construccin, nmero de residencias o
metros cuadrados de superficie de suelo til
Facturacin del comercio al por menor, valor
apreciado o deflactado
Nmero de personas empleadas, nmero de
empleadores en el comercio al por menor
Facturacin en reparaciones y otros servicios,
valor apreciado o deflactado
Precios de produccin en otros servicios
Nmero de personas empleadas, nmero de
empleadores en reparaciones y otros servicios
Cualquier otro indicador no mencionado en la lista
superior

STSIND_FACT_M, _Q

SSTSIND_PED_M

STSIND_PED_M, _Q
STSIND_EMPL_M, _Q
STSIND_HORA_M, _Q
STSIND_GANA_M, _Q

SSTSIND_PREC_M

STSIND_PREC_M

SSTSCONS_PROD_M,
_Q

STSCONS_PROD_M, _Q
STSCONS_ORD_M, _Q
STSCONS_EMPL_M, _Q
STSCONS_HORA_M, _Q
STSCONS_GANA_M, _Q
STSCONS_PREC_M, _Q
STSCONS_PERM_M, _Q

SSTSRTD_FACT_M

STSRTD_FACT_M
STSRTD_EMPL_M, _Q

SSTSSERV_FACT_M,
_Q
STSSERV_PREC_Q
STSSERV_EMPL_Q

STSSERV_FACT_M, _Q
STSSERV_PREC_Q
STSSERV_EMPL_M, _Q
STSOTRO_OTRO_M, _Q

Tabla 15 STS - DSD y flujos de datos (SDMX & GESMES)

DSD (Data Structure Definition) y flujos de datos tomados del proyecto SDMX OPEN DATA
INTERCHANGE (SODI) de Eurostat
27/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Un flujo de datos se puede ver como la publicacin constante de un conjunto de datos, ya


que se van aadiendo nuevas observaciones a las ya existentes, o como subsecuencias de
conjuntos de datos que se van publicando con el mismo tema y estructura. Los flujos de
datos pueden entenderse como conjuntos de datos que no estn limitados en el tiempo.
Las estructuras de datos y los flujos de datos (Data flows) son propiedad de las agencias, y
estn mantenidos por las mismas. En un entorno de recogida de datos, tanto las estructuras de
datos como los flujos de datos (Data flows) sern mantenidos por la agencia encargada de
recoger los datos.
El diagrama inferior describe las caractersticas esenciales que ofrece el modelo de
informacin SDMX (SDMX Information Model) para la presentacin o publicacin de datos
y metadatos. El pivote de este diagrama es el flujo de datos o metadatos (Data or Metadata
flow).

Dibujo 8 Definicin de flujo de datos y metadatos (Data and Metadata flow)

El flujo de datos (Data flow) o metadatos (Metadata flow) es mantenido por la organizacin
que recoge o cosecha los datos o metadatos para su uso o publicacin. El flujo de datos
(Data flow) se vincula a una definicin de estructura de datos (Data Structure Definition)
(definicin de estructura en el diagrama), pero por el contrario, una DSD (Data Structure
Definition) puede servir como base para ms de un flujo de datos (Data flow). Igualmente, el
flujo de metadatos (Metadata flow) se vincula a la definicin de estructura de metadatos
(Metadata Structure Definition). Los conjuntos de datos (Data set) o metadatos (Metadata set)
de un flujo de datos o metadatos de referencia pueden ser proporcionados por muchos
proveedores de datos (Data providers) y cualquier proveedor de datos (Data provider) puede
presentar o publicar conjuntos de datos (Data sets) o metadatos (Metadata sets) para muchos
flujos de datos (Data flows) o metadatos (Metadata flows). Habitualmente un proveedor de
datos (Data provider) puede aportar conjuntos de datos (Data sets) o metadatos (Metadata
sets) para muchos temas o categoras de datos estadsticos.
28/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

El modelo de informacin SDMX (SDMX Information Model) permite que se adjunten


restricciones a la definicin de flujo de datos. Las restricciones pueden tener que ver con la
periodicidad de la publicacin o un subconjunto de posibles dimensiones de clave que se
permiten en un conjunto de datos (Data set). Las restricciones se tratan en un prrafo inferior
dedicado a las mismas.
Una definicin de flujo de metadatos es muy similar a una definicin de flujo de datos, pero
tambin describe, categoriza y restringe a conjuntos de metadatos (Metadata set). En un
conjunto de metadatos (Metadata set) slo hace falta una referencia a la definicin del flujo
de metadatos, ya que esto habilita a una aplicacin a poder identificar la definicin de
estructura de metadatos (Metadata Structure Definition) relevante que a su vez la habilitar
para validar y procesar los metadatos.
4.9 Proveedor de Datos (Data Provider)

En SDMX, un proveedor de datos (Data provider) es una organizacin que produce datos o
metadatos de referencia disponibles para otras organizaciones. Los proveedores de datos
(Data providers) pueden proporcionar conjuntos de datos (Data set) a muchos flujos de datos
(Data flows) diferentes. Los flujos de datos (Data flows) pueden incorporar datos
provenientes de ms de un proveedor de datos (Data provider). Con el fin de gestionar este
proceso, el proveedor de datos (Data provider) se vincula a la definicin de flujo de datos o
definicin de flujo de metadatos mediante un acuerdo de provisin (Provision Agreement):
objetos que nos dicen qu proveedores de datos (Data providers) estn aportando qu datos a
qu flujos de datos (Data flows). Lo mismo se cumple para los flujos de metadatos (Metadata
flows).
4.10 Acuerdo de Provisin (Provision Agreement)

Un "acuerdo de nivel de servicio" es inherente a cualquier intercambio de estadsticas.


SDMX incorpora esta idea en objetos denominados "acuerdos de provisin" (Provision
Agreement).
Esta informacin describe la manera en la que los conjuntos de datos (Data sets) y los
conjuntos de metadatos (Metadata sets) son proporcionados por un proveedor de datos (Data
provider). Un acuerdo de provisin (Provision Agreement) puede restringirse en trminos de
subconjuntos de claves (Keys) o valores de cdigo (Codes value) de la misma manera que
con una definicin de flujo de datos o metadatos.
Por tanto, un proveedor de datos (Data Provider) puede expresar el hecho de que proporciona
un flujo de datos (Data flow) particular que cubre un conjunto especfico de pases y temas,
con una planificacin particular de la publicacin (calendario de publicacin).
4.11 Restricciones (Constraints)

El trmino "restricciones" (constraints) en el modelo de informacin SDMX lleva integrada


una serie de informacin: temas especficos sobre qu datos o metadatos se presentan dentro
de un conjunto de datos (Data set) tericamente posibles (tal como son descritos por una
definicin de estructura de datos o definicin de estructura de metadatos de referencia (Data
Structure Definition or reference Metadata Structure Definition)), y el perodo de tiempo
cubierto por los datos y metadatos estadsticos.
Las restricciones (constraints) se asocian:

29/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

con flujos de datos (Data flows), que habitualmente describen los temas que se cubren
(= restricciones relacionadas con contenido);
con el acuerdo de provisin (provision agreement), que aporta una descripcin
completa de restricciones temporales (Time-related Constraints) y restricciones de
contenido.

Restricciones temporales (Time-related Constraints):


Las restricciones temporales (Time-related Constraints) se definen generalmente en el
acuerdo de provisin (provision agreement). La provisin de datos puede restringirse por un
proveedor de datos (data provider) en lo referido a los perodos que se presentan. Por
ejemplo, datos que solo se proporcionan desde el ao 2000 porque existen problemas de
datos incompletos y fiabilidad con datos ms antiguos.
Otra restriccin temporal (Time-related Constraint) podra suponer que un proveedor de datos
(data provider) restringiera la provisin de datos a conjuntos de datos (Data sets) anuales
solamente para un indicador estadstico, mientras que la mayora de los otros proveedores de
datos (data providers) presentasen conjuntos de datos (Data sets) trimestrales y anuales para
el mismo indicador.
Restricciones de contenido:
El proveedor de datos o metadatos (Data or Metadata Provider) puede aplicar restricciones
(constraints) al mbito de los datos o metadatos que suministra, en trminos de rangos de
claves (Keys ranges) o conjuntos de claves (Keys sets) completas. Estas restricciones de
contenido de una provisin de datos pueden especificarse para una definicin de flujo de
datos, una definicin de flujo de metadatos, y un acuerdo de provisin (provision agreement).
stas restringen el uso de una definicin de estructura correspondiente a un conjunto de
datos/metadatos (Data/Metadata sets) en relacin a la definicin de flujo de datos o acuerdo
de provisin (provision agreement) (restricciones de aprovisionamiento). Por tanto, el
conjunto de datos (Data set) o conjunto de metadatos (Metadata set) resultante, en base a una
DSD (Data Structure Definition) o MSD (Metadata Structure Definition), puede restringirse
al:

especificar uno o ms conjuntos de claves (Key sets) tomadas de un conjunto terico


que podra crearse de las dimensiones (a menudo llamado "producto cartesiano") que
pueden incluirse o excluirse de un conjunto completo de claves usadas en la
definicin de estructura de datos (Data Structure Definition) (o definicin de
estructura de metadatos (Metadata Structure Definition)). El conjunto completo de
claves representa todas las posibles combinaciones de valores de las dimensiones de
clave. Un proveedor de datos (data provider) podra suministrar datos para un
subconjunto de valores codificados en una de las dimensiones que comprenden la
clave;
Ejemplo:
Un proveedor de datos (data provider) podra presentar solo un conjunto limitado de indicadores (ej.:
en STS, solo las actividades del ejemplo anterior: NS0080, NS0060 y NS0050) o limitar el informe de
tablas de comercio a importaciones y exportaciones con pases socios especficos (ej.: proporcionar
solamente datos de comercio con estados miembros de la UE).
Por tanto en ambos casos la provisin de datos se encuentra restringida, ya que una parte de los valores
de las dimensiones de clave est excluida del intercambio de datos.

30/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

especificar una o ms regiones de cubos, cada una de las cuales comprende un


conjunto de selecciones especficas que, juntas, pueden ser incluidas o excluidas del
conjunto de valores que son vlidos para una dimensin, atributo o medida. Cada
seleccin especifica la lista restringida de valores que son vlidos. Esta lista ha de ser:
o

bien un conjunto completo o subconjunto de la representacin completa


especificada para la dimensin, atributo o medida relevantes en la definicin de
estructura de datos;

Ejemplo:
Un proveedor de datos (data provider) podra suprimir la presentacin de varios productos
confidenciales presentes en datos de comercio exterior, donde el valor por unidad excediera una
cantidad especfica (ej.: 10 millones de euros).

o bien un conjunto o subconjunto de la lista de valores vlidos (lista de


cdigos (Code List)) especificada para un componente de identificador.

Ejemplo:
Un proveedor de datos (data provider) podra suprimir la presentacin de varios productos
confidenciales presentes en datos de comercio exterior (como maquinara especial o armas). En
consecuencia, los respectivos valores codificados (coded values) de la lista de cdigos (Code List) del
productor se excluiran del informe.

4.12 Esquema de Categora (Category Scheme)

Las listas de categoras (Category list) se mantienen a travs de agencias de mantenimiento.


Un esquema de categora (Category Scheme) proporciona una manera de clasificar los datos
para su recogida, informe, o publicacin. ste est constituido por una simple jerarqua de
categoras (una categora puede tener una o ms categoras hijo), que en SDMX pueden
incluir cualquier tipo de clasificacin til para la organizacin de datos y metadatos.
Con el fin de ofrecer la posibilidad de hallar datos y metadatos, la definicin de flujo de datos
y la definicin de flujo de metadatos pueden tambin vincularse a una o ms categoras
dentro de uno o ms esquemas de categora, como por ejemplo, un esquema de dominios de
temas o categoras de informe. Los esquemas de categora (Category Schemes) ms
habituales pueden comprender muchas categoras de alto nivel como finanzas, economa,
salud, turismo, transporte, y demografa de una organizacin. Cada una de stas podra
segmentarse a su vez en categoras de bajo nivel formando as una jerarqua de categoras.
El descender por la jerarqua nos llevar finalmente a la categora de ms bajo nivel, donde
los flujos de datos (Data flows) y metadatos (Metadata flows) se encuentran vinculados.
Estos flujos identifican a los conjuntos de datos (Data sets) y metadatos (Metadata sets) que
los pblica (proveedores de datos (data providers)).
En el ejemplo ficticio de la tabla 16, este patrn se muestra de forma desgranada para la
primera categora ENCP, en concreto para STS_IND y STS_CONS. Como consecuencia, un
flujo de datos SDMX (SDMX Dataflow) asumido (STS_IND_PROD_M) se vinculara a la
categora STS_IND_PROD.
31/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Esquema de Categora (Categoras SDMX ficticias para fines ilustrativos)


CATEGORYSCHEME_ID
INDU_TRADE_SRV_SCHEME
CATEGORY_ID
ICTS
STS
STS_IND
STS_IND_PROD
STS_IND_TOVT

STS_CONS
STS_CONS_PRO
STS_CONS_LAB

STS_TS
SBS
SBS_NA
SBS_IND_CO
SBS_DT
SBS_SERV

TOUR
PROM
ISCO

Descripcin
Un esquema de categora para industria,
comercio y servicios
Descripcin
Industria, Comercio y Servicios
Estadsticas de Negocios a Corto Plazo (ENCP)
ENCP Industria
ENCP ndice de Produccin Industrial
ENCP ndice de Facturacin Industrial

ENCP Construccin
ENCP ndice de Produccin de Construccin
ENCP ndice de Mano de Obra de Construccin

ENCP Comercio y Servicios


Estadsticas de Negocios Estructurales (ENE)
ENE Indicadores Principales
ENE Industria y Construccin
ENE Comercio
ENE Servicios

Estadsticas de Turismo
Estadsticas de Produccin de Bienes
Manufacturados
Estadsticas de Sociedad de Informacin

Tabla 16 Ejemplo: Esquema de categora (Category Scheme) - Industria, comercio y servicios

32/33

Gua de auto-aprendizaje en SDMX

Libro del estudiante n. 2 - El modelo de informacin SDMX

Glosario

La tabla 17 presenta una lista de conceptos y acrnimos con sus definiciones.

Concepto

Definicin

DSD

Definicin de Estructura de Datos (Data Structure Definition)

ESMS

Estructura de Metadatos Euro SDMX (Euro SDMX Metadata


Structure)

GESMES

Mensaje de intercambio de datos GESMES (Generic Statistical


Message)

ID

Identificador (Identifier)

IT

Tecnologas de la Informacin (Information Technology)

MSD

Definicin de Estructura de Metadatos (Metadata Structure


Definition)

NUTS

Nomenclatura de las Unidades Territoriales


(Nomenclature of Territorial Units for Statistics)

SBS

Estadstica de Negocios Estructurales (Structural Business


Statistics)

SDMX

Intercambio de Datos y Metadatos Estadsticos (Statistical Data


and Metadata eXchange)

SDMX-IM

Modelo de Informacin SDMX (SDMX Information Model)

SDMX-ML

Lenguaje de Marcas SDMX formato XML para el intercambio


de datos y metadatos estructurados en SDMX (SDMX Markup
Language)

SODI

Intercambio de Datos Abiertos SDMX (SDMX Open Data


Interchange)

STS

Estadsticas de negocios a Corto Plazo (Short Term Business


Statistics)

XML

Lenguaje de Marcas Extensible (EXtensible Markup Language)

Estadsticas

Tabla 17 - Glosario

33/33

Anda mungkin juga menyukai