La naturaleza es perfecta, nuestra interpretación de ella... no tanto
La naturaleza es perfecta, nuestra interpretación de ella... no tanto
Aquí entramos ya en cuestiones más técnicas y peliagudas centradas en la preparación de los datos que vamos a utilizar para los análisis espaciales. Puede que estés abordando zonas poco habitadas y menos complejas o ciudades con miles o millones de habitantes, en cualquier caso, lo ideal es ser estricto con la información desde un principio, así ahorrarás trabajo luego cuando el sistema escale.
Para afrontar esta fase inicial es necesario tener en cuenta una serie de aspectos importantes:
Los formatos de entrada que utilizamos son extremadamente simples, de hecho, el procesado de datos se realiza a partir de archivos con coordenadas (elementos puntuales) y un mínimo de atributos posibles o bien una combinación de raster y diccionarios.
La selección de un formato simple obedece a la necesidad de crear una estructura que pueda ser igualmente válida para cualquier tipo de dato espacial, o lo que es lo mismo, que este disponible o pueda ser rápidamente creada en cualquier archivo de entrada que se reciba.
Los archivos requieren una estructura específica de almacenamiento, que es distinta a la utilizada para la cartografía como vimos en la organización de de la información.
Los formatos pueden ser trabajados dentro de un SIG, ordenando y eliminado columnas de atributos, para luego ser exportados o bien pueden exportarse sin cambios para, mediante las aplicaciones auxiliares, obtener los formatos buscados.
Los datos que recibimos, en el mejor de los casos, solo requieren modificaciones mínimas como, por ejemplo, reproyectar una capa geográfica. Hay que considerar que la metodología trabaja en coordenadas métricas y que todas las capas tienen que estar en el mismo sistema de proyección geográfico, por lo que resulta muy útil realizar el cambio cuando procedemos a guardar el archivo en la estructura local indicada anteriormente. Más adelante explicaremos como preparar la información de acuerdo a los formatos diseñados para el sistema en función si son capas raster o vectoriales.
Desgraciadamente, habitualmente las capas de información más interesantes suelen requerir estrategias de procesado más complejas antes de poder utilizarlas tal como nos gustaría. Como ejemplo, para el caso del Distrito Metropolitano de Quito, tenemos el catastro y el viario, así como otro tipo de capas temáticas que nos permiten evaluar la actividad comercial u otras dinámicas sociales. El tratamiento que se realiza a cada una de ellas representa un manual propio en si mismo y, de hecho, hemos elaborado reportes específicos que explican las aproximaciones llevadas a cabo para poder hacer más útil los datos originales. El problema que tiene esta parte, es que algunas fase metodológicas dependen mucho del dato de origen, el cual puede variar considerablemente de una región a otra, de ahí que no sea de fácil adaptación.
Pre-procesado simple
En condiciones normales, lo habitual es abrir la capa de datos que queramos evaluar en un Sistema de Información Geográfico (nosotros trabajamos en Qgis... Si existe mundo más allá del ArcGis y sus productos derivados), ver como está, que nos dice, qué área cubre e identificar posibles problemáticas. Las operaciones a realizar serán, en primer lugar una re-proyección al sistema de trabajo seleccionado (por ejemplo, para el Distrito Metropolitano de Quito utilizamos WGS84 UTM 17S), para almacenarla adecuadamente en nuestra estructura local. A continuación, si consideramos que es lo suficientemente importante para utilizarla en las operaciones de procesado, debemos determinar la forma más adecuada de operar con ella. En este sentido podría ser:
Una Unidad de Análisis Espacial (UAE), que nos permite analizar el territorio en divisiones espaciales
Una capa raster que transferirá sus valores a elementos vectoriales o UAEs.
Una capa vectorial que puede operar de dos formas, bien para caracterizar a o ser caracterizada por una capa raster o UAE.
Tanto las capas UAE como raster pueden estar previamente definidas como capas vectoriales poligonales. De ser el caso, deben ser rasterizadas en función del uso que se les quiera dar, siempre considerando que el formato final será *.grd.
Para las UAEs tenemos que rasterizar utilizando el identificador único de objeto y exportar la capa de atributos cuya estructura final deberá ser: ID, CODIGO, PERIMETRO, AREA, XCOOR e YCOOR (coordenadas del centroide y separado por espacios). De tal forma que obtendremos dos archivos en paralelo, uno en formato *.grd y otro en *.csv separado por espacios.
Para las capas raster, podría ser necesario añadir un archivo diccionario para las categorías que representan los valores contenidos en el raster.
Las capas vectoriales siempre las vamos a representar como puntos espaciales. Si la capa en origen es ya de puntos no hay problema, pero en el caso que sea lineal (p.e. carreteras), hay que discretizarla (convertirla en una capa de puntos equidistantes). En el caso de ser elementos poligonales de pequeño tamaño (p.e. edificios) entonces también consideraremos el centroide. En todos los casos generaremos un archivo compuesto por los siguientes campos: ID, TIPO, XCOOR e YCOOR (separado por espacios).
Este tipo de situación es la más frecuente para la gran mayoría de capas de información, las cuales serán exportadas a nuestra tercera estructura de directorios para que puedan ser procesadas a nivel espacial.
Hay una serie de capas geográficas que son fundamentales para nuestro sistema, siendo una de las fuentes fundamentales el catastro y el viario desde el punto de vista antrópico. ¿Por qué?, porque básicamente nos permite construir en detalle el entramado urbano de nuestra ciudad o área de estudio y porque serán una base fundamental para geolocalizar capas posteriores (por ejemplo, es muy común encontrarnos con datos que carecen de coordenadas pero si disponen de la dirección). En este esfuerzo hay que considerar que buscamos representar la ciudad real, por oposición a la oficial, dado que uno de nuestros fines es trabajar en riesgo. En muchas ciudades la información oficial solo tiene en cuenta una parte, dejando extensas áreas sin información.
Del catastro obtenemos la base para generar la capa de edificaciones. Este elemento no suele estar disponible como tal (al menos en el contexto ecuatoriano), dado que se centra en el concepto de propiedad (no importa el edificio en si, sino a quien le pertenecen las distintas partes que lo integran). Así, no se considera la estructura de la casa o edificio como elemento unitario, sino que se realizan subdivisiones del mismo. El motivo es que el catastro registra lo que considera legal, no es, por tanto, una cartografía que trata de representar lo que existe en el territorio. Esto hace que el balance entre la información alfanumérica disponible y su representación espacial esté totalmente descompensado en beneficio de la primera (muchos más datos alfanuméricos que geográficos). Esta situación creemos que es bastante común a muchas ciudades en latinoamérica, por lo que siempre serán necesarios trabajos específicos antes de poder utilizar los datos catastrales con otros fines distintos a los que fueron diseñados.
Por otra parte, esta fuente nos permite disponer de datos descriptivos importantes de las construcciones (elementos que componen una edificación o partes anexas como los jardines), atributos básicos para empezar a construir un modelo de exposición. En el caso del Distrito Metropolitano de Quito (DMQ) realizamos numerosas operaciones para geolocalizar los datos alfanuméricos y caracterizar más ampliamente los lotes (propiedades) relacionado unas capas y otras (a veces mediante campos comunes otras mediante cruces espaciales). Una vez terminado este cálculo, las capas resultantes, además de estar geolocalizadas, presentan muchos más atributos, los cuales nos permiten operar más fácilmente con ellas. De esta primera fase pasamos luego a crear una capa de edificaciones, que debemos completar también a partir de la integración de otras fuentes cartográficas.
El viario es otra base fundamental y está también ligado a los números o placas de las edificaciones (cuando existen). Su importancia radica en la posibilidad de geolocalizar datos que, en origen, no lo estén pero si dispongan de dirección. En este sentido, el viario hay que entenderlo desde un punto de vista amplio, considerando cualquier tipo de vía de transporte por muy pequeña que sea (senderos, caminos de tierra, etc). En riesgo y planificación de estrategias de mitigación, estas vías nos ayudan a saber cómo llegar a determinados sitios o salir de ellos. Seguramente, es una capa que también hay que completar, dado que muchas veces se centra en las principales zonas urbanas y menos en las rurales. En este sentido, para el DMQ también hemos realizado un desarrollo que permite integrar distintos tipos de cartografía para completar el viario y que podría ser utilizado en cualquier lugar. Paralelamente, hemos desarrollado toda una metodología que ayuda a geolocalizar datos a partir de direcciones con la mayor precisión posible. La verdad es que no es una tarea fácil y varía mucho en función de las ciudades y el sistema de codificación de direcciones que utilice (al lado de la tiendita de la tía María es imposible de localizar de forma automática).
Otras capas generadas obedecen a temáticas específicas, p.e. en el DMQ calculamos el potencial comercial e industrial de la ciudad añadiendo los lugares donde pueden existir actividades de este tipo registradas, bien en el pasado, bien en el presente. Este desarrollo permite combinar datos ya georeferenciados e ir descartando aquellos que ya están presentes en la capa principal, la cual se va llenando con nuevos elementos. Para este ejemplo llegamos a utilizar 10 capas geográficas distintas, obteniendo un resultado que supera los 250 mil locales comerciales y/o industriales. Esto no quiere decir que estén en activo, pero si muestra donde pueden llevarse a cabo más actividades. Así vamos construyendo datos que no existen como tales en el contexto de la administración local o bien solo están parcialmente.
Los tiempos necesarios que se invierten en obtener o mejorar datos pueden variar, a veces varias semanas o meses de trabajo. Lo importante es hacerlo de forma automatizada para facilitar los procesos de actualización (no tiene sentido procesar un catastro manualmente, para a los 6 meses tener que repetir todo el proceso de nuevo). Esto hace que, a veces, la adición de una simple columna haya implicado un esfuerzo considerable, de ahí que se priorice la información fundamental, para luego ir introduciendo el resto.