La arominiación de datos es muy importa cuando se trabaja con datos de diferentes fuentes y se
dispone de un esquema de datos establecido. Con la armonización, los datos que provienen de
otras instituciones son “adaptados” a los formatos y esquemas requeridos y predefinidos con
anterioridad.
1. Validar geometría
Haciendo uso del complemento Vector > Topology Checker se obtiene el siguiente resultado, imagen
2:
Imagen 2. Comprobación de la topología
Una vez que se han identificado los objetos con errores en la geometría se deberá proceder a
realizar tareas de corrección de estos errores. La primera opción para esto es hacer uso de las
herramientas de edición que dispone QGIS y realizar esta tarea manualmente; siendo esta la más
recomendada.
Otra alternativa al momento de corregir errores en la geometría de las capas es usar herramientas
automáticas; una de estas es v.clean que se encuentra disponible en Processing > Toolbox > GRASS >
v.clean.
Nota: A pesar de que las herramientas automáticas de corrección de geometrías ahorran mucho
tiempo, los resultados que estas arrojen deben ser revisados cuidadosamente y en algunos casos
es posible que se requiera una corrección manual usando las herramientas de edición de
geometrías.
2. Armonizar datos geográficos usando GeoKettle
La herramienta Seleccionar valores (Select values) permite realizar el caso de armonización de datos
más simple, imagen 6).
En el caso de existir procesos más complejos de adaptación o conversión de los datos es posible
agrupar la funcionalidad de varias trasformaciones mediante la creación de un nuevo Trabajo (Job) en
el que se hacen llamadas a las transformaciones antes definidas.
Imagen 7. Diagrama de trabajo (job)
Una de las ventajas de ejecutar transformaciones dentro de un (Trabajo) Job es que las
transformaciones que no son dependientes pueden ser ejecutadas de forma paralela, lo cual
permite optimizar tiempos y aprovechar los recursos de cómputo de los equipos. En la imagen 7,
se presenta un Trabajo (Job) que realiza un proceso de transformación simultánea de cinco
coberturas.
QGIS al ser un software especializado para el tratamiento de datos geográficos es ideal para
procesos de armonización que requieran geoprocesamiento. Sin embargo, para procesos de
armonización relativamente simples también es útil QGIS mediante el uso de la herramienta
Processing > Toolbox > Refactor fields.
Imagen 10. Ventana de refactorización de campos
Al igual que GeoKettle, QGIS, dispone de un entorno de trabajo gráfico para modelar procesos
denominado Graphical Modeler.
4. Conclusiones
GeoKettle es una herramienta muy potente para trabajar con datos tabulares; a pesar de tener
soporte para realizar cálculos con datos geográficos no es recomendable realizarlos en GeoKettle.
Una de las principales ventajas de GeoKettle es su interfaz de trabajo visual en la que cada
función o proceso es representado como un nodo de un grafo. La versión más reciente de
GeoKettle actualmente es la 2.5, misma que no ha sido actualizada desde el 2013 debido a que la
firma propietaria de GeoKettle ya no desarrolla más esta herramienta sino que más bien
actualmente desarrolla la herramienta Pentaho Community Edition la cual dispone de un pluggin
para el manejo de datos geográficos.
QGIS por su parte es una herramienta muy potente cuando se requiere realizar transformaciones
de datos geográficos. Gracias a que QGIS integra varias librerías de terceros brinda la posibilidad
de acceder a una gran variedad de formatos de datos geográficos. La posibilidad de crear modelos
gráficos de los procesos de transformación, así como la posibilidad de crear funcionalidades
personalizadas mediante scripts son características de QGIS dignas de destacar notablemente. En
mi opinión QGIS es la mejor opción gratuita para la armonización de datos geográficos, sin
desmerecer a las herramientas GeoKettle y Pentaho que bien podrían servir como complemento
a esta tarea.