Escuela De Datos

Elecciones, Contratos públicos y Ciencia Abierta: la mezcla en el #ODD19 Guatemala

Daniel Villatoro — Mon, 22 Apr 2019 20:46:23 +0000

En Guatemala, el OpenDataDay se enfocó en tres temas, cada uno con dinámicas diferentes y espacios de aprendizaje.

Datos y elecciones

Aprovechando que en Guatemala hay elecciones este año, se presentaron proyectos electorales innovadores que usan tecnología y datos. Cada proyecto recolecta y comparte datos abiertos que ayudan a los ciudadanos a votar de manera informada.

Estos fueron los proyectos presentados:

¿Por quién voto? es una plataforma virtual en la que los usuarios llenan un cuestionario que compara sus respuestas con las de los partidos que compiten en la elección. Esto permite que cada usuario identifique primero su propia posición ideológica, pero también qué tan cercana es su postura con la de la oferta política. Además, la plataforma recolecta datos demográficos y de localización de los usuarios que participan en estos cuestionarios. El proyecto busca que estos datos estén accesibles para que analistas puedan identificar futuros proyectos de investigación.

3de3 es un proyecto que demanda transparencia de los candidatos políticos, invitándoles a compartir tres documentos importantes: su declaración fiscal, una declaración de intereses (para prevenir conflictos de interés futuros) y su declaración patrimonial.

La Papeleta es un directorio creado por Guatecambia que convierte los documentos legales de registro de candidatos del Tribunal Supremo Electoral, los cuales son PDFs escaneados. Como resultado, presenta registros transcritos y con datos legibles por máquina.

Rastreando el flujo de dinero público

La fellowship de Escuela de Datos consiste en un proyecto de investigación que mapea el proceso de contrataciones públicas en Guatemala. En relación con los valores de las Contrataciones Abiertas, entender cómo funcionan es un primer paso importante. Por eso, se aprovechó esta reunión con la comunidad local de usuarios de datos abiertos para entender sus necesidades, el nivel de interés que tienen por los datos abiertos sobre contrataciones públicas y las mejores maneras para explicar este proceso y lograr una interacción productiva con estos esfuerzos por la transparencia. Sofía Montenegro, nuestra actual fellow, presentó algunos hallazgos de esta investigación y el proceso.

Ciencia Abierta

Este espacio fue liderado por Kevin Martinez-Folgar, un investigador en epidemiología que brindó una introducción al marco de referencia que indica que los hallazgos científicos sean abiertos, consejos sobre cómo conducir investigación bajo este paradigma y una lista de recursos en línea para aprender y aplicar esta manera de hacer ciencia.

Navegamos por OSF.io para entender cómo ser abiertos en todas las fases del ciclo de investigación científica, ArXiv.org para conocer este servidor y su archivo de artículos científicos y Zenodo para publicar y divulgar hallazgos. También revisamos algunos proyectos en github y aprendimos sobre la identificación de nuestros documentos en el mundo digital a través del Digital Object Identifier System.

Por último, dimos un vistazo por los contenidos disponibles sobre el MOOC (Curso masivo y abierto en línea) de Ciencia Abierta, el OpenScienceMOOC y reflexionamos sobre la poca disponibilidad de conocimiento para las audiencias en español.

—-

Esta actividad fue organizada por Escuela de Datos y su fellowship local en Guatemala, con la ayuda de los entrenadores y los proyectos que presentaron su trabajo.

Lo bueno, lo malo, lo geek. 10 librerías de código para resolver tus proyectos de visualización de datos

invitado — Mon, 22 Apr 2019 18:42:59 +0000

La visualización de datos es un arte y una ciencia, ya que, «una imagen vale más que mil líneas de datos». Existen librerías de código que hacen esta labor un poco más manejable.

¿Qué es una librería? ¿Cómo funciona?

Una librería es un kit de herramientas que contiene recursos que se pueden reutilizar. ¿No queremos empezar todo desde 0 verdad? Puedes hacer un llamado dentro de tu código a estas librerías para reutilizar aquellos recursos que necesites.

Para poder usar las siguientes librerías necesitas tener conocimientos previos de programación, pero si no los tienes, puedes usar las siguientes herramientas que no necesitan de código.

4 factores a considerar antes de escoger una librería.

Antes de decidir cuál libreria utilizar es necesario tomar en cuenta los siguientes aspectos:

1.- El formato de los datos que vas a utilizar.

Los datos que deseas visualizar están en un .csv, en un .sql, en un pdf, etc. Las librerías trabajan con ciertos formatos por lo que debes buscar la que más se adecúe a tu situación.

2.- ¿Qué tan personalizable es?

Algunas librerías son restrictivas. Las más fáciles de aprender son más limitadas mientras que las más complejas son más personalizables.

3.- Los tipos de gráficos disponibles.

Revisa bien que la librería genere ese gráfico que estas buscando.

4.- ¿Qué tan fácil de aprender es? ¿Se puede encontrar buena documentación sobre ella?

Sabemos que a veces necesitamos las cosas para ayer. Si estás en un apuro, no pierdas tu tiempo con algo complicado. Si dispones de más tiempo hay una infinidad de cosas por descubrir en librerías complejas.

A continuación, las librerías

D3.js

http://d3js.org

D3.js es una librería JavaScript para manipular documentos basados en datos. D3 utiliza HTML, SVG y CSS. D3 te da completamente el control: es muy customizable. Con ella, puedes crear desde gráficas sencillas como barras, hasta visualizaciones complejas, como gráficos relacionales o visualizaciones con mapas.

? Ventajas

Es una librería muy popular con una comunidad muy activa, lo que facilita el aprendizaje y te brinda respuestas rápidas a tus preguntas.
Es compatible con la librería Javascript React.
Existen varias librerías como C3.js o Metrics Graphics.js, que usan D3 en el back-end, lo cual reduce el trabajo para obtener buenos gráficos.
Sin dependencias y fácil de configurar.
D3 ofrece un increíble nivel de interactividad.

? Desventajas

La curva de aprendizaje es compleja. De esta manera, si lo que se deseas obtener es un gráfico sencillo, quizá esta no sea una buena opción.
Requiere librerías adicionales para exportar los gráficos.

Processing.js

http://processingjs.org/

Processing.js es una librería JavaScript que permite hacer visualizaciones de datos, arte digital, animaciones interactivas, gráficos educativos, videojuegos, etc. Trabaja con estándares web y cualquier complemento. Processing.js es el proyecto hermano de Processing.

? Ventajas

Processing.js está escrito en JavaScript y usa el elemento
Utiliza estándares web modernos.
Si sabes codificar en Processing no necesitas aprender Javascript.

? Desventajas

Processing.js utiliza el concepto de un directorio de datos, donde se encuentran las imágenes y otros recursos. Processing.js no incluye esto. Como resultado, siempre se debe proporcionar páginas de archivos (por ejemplo, imágenes).
Processing.js necesita tu ayuda al anular métodos de superclase sobrecargados. Esto quiere decir que cuando se hereden métodos de una clase, no se podrá sobrescribir.
Solo tiene dos modos de renderizado. Si estás pasando de Processing (el cual tiene muchos modos de Renderizado) a Processing.js, puede ser un poco problemático.

Google Charts

https://developers.google.com/chart/?hl=en

Google Charts es un servicio web que permite crear gráficos con la información que se le proporciona y es de fácil uso. Es la librería que soporta Google Analytics, por lo que se puede usar en diferentes formatos como Json, Javascript y plugins que se pueden integrar con varios lenguajes de programación.

? Ventajas

Es personalizable. Puedes hacer tus propios gráficos para que combinen con tu web.
Se conecta a tus datos en tiempo real utilizando una variedad de herramientas y protocolos.
Compatibilidad con varios navegadores.
Puedes utilizar un código embebido Javascript en tu página web.
Es gratis
Puede generar los gráficos mediante Hojas de cálculo, bases de datos SQL, archivos CSV y hacer actualizaciones automáticas.

? Desventajas

No te da un procesamiento estadístico sofisticado.
Requiere una conexión de red.

Chartjs.js

http://www.chartjs.org/

Chart.js es una biblioteca de JavaScript que permite dibujar diferentes tipos de gráficos responsive mediante el elemento canvas de HTML5.

? Ventajas

Es responsivo
Modular (Funcionalidades separadas)
Open Source, así puedes compartir y modificar el código fuente.
La documentación de chart.js está bien organizada y provee información detallada de cada una de las características.

? Desventajas

Funciona mejor para algo rápido y simple. En caso de un proyecto complejo y más personalizado, esta librería no es la adecuada.

Vis.js

http://visjs.org/

Una librería de visualización dinámica web. La librería está diseñada para ser fácil de usar, manejar grandes cantidades de datos dinámicos y permitir la manipulación e interacción con los datos.

? Ventajas

Responsivo
Modular (Funcionalidades separadas)
Open Source
Vis.js tiene un showcase de proyectos y documentación clara

? Desventajas

Lento: Cuando el gráfico tiene muchos detalles se necesita poner un mensaje “Cargando” para que los usuarios lo sepan.

Sigma.js

http://sigmajs.org/

Sigma es una librería JavaScript dedicada a las visualizaciones de datos. Facilita la publicación de gráficos de redes en páginas web y permite a los desarrolladores integrar su exploración en aplicaciones web.

? Ventajas

Bastante adaptable
Se puede agregar toda la interactividad deseada
Apto para principiantes.

? Desventajas

Cuando los nodos están conectados por varios bordes, estos se tienden a superponer y se necesita un plugin adicional para solucionar el problema.

Flot Charts

http://www.flotcharts.org/

Flot es una librería JavaScript para jQuery para visualizar datos, con un enfoque en el uso simple, aspecto atractivo y características interactivas.

? Ventajas

Fácil de usar y con amplia documentación disponible.
A la hora de hacer gráficos con ejes, admite múltiples ejes en Y(el eje vertical), lo cual es importante para poder correlacionar tendencias
Configuración Simple.

? Desventajas

Tiene un número limitado de tipos de gráficos que puedes hacer.

Chartist.js

https://gionkunz.github.io/chartist-js/

Chartist.js es una librería Javascript open-source con charts responsive. Genera los gráficos en SVG (al ser vectoriales son DPI-independientes). Es una librería muy sencilla de usar muy flexible y muy ligera que ocupa sólo 10 Kb y no tiene dependencias.

? Ventajas

Gran flexibilidad al usar CSS
Utiliza formatos SVG para los gráficos
Completamente responsivo
Sin dependencias y fácil de configurar

? Desventajas

No todos los navegadores soportan sus animaciones.

Plot.ly

https://plot.ly/

Plotly es una librería Python que genera gráficos interactivos de calidad en línea. Ejemplos gráficos de líneas, diagramas de dispersión, gráficos de áreas, gráficos de barras, barras de error, diagramas de cajas, histogramas, mapas de calor, subtramas, ejes múltiples, gráficos polares y gráficos de burbujas.

? Ventajas

Gran soporte para ejes complejos y múltiples.
Herramientas integradas de zoom y filtrado en gráficos y mapas.
Tiene una documentación clara con opciones y ejemplos.
Gráficos interactivos.

? Desventajas

Los gráficos no funcionan en todos los navegadores.

Seaborn

http://seaborn.pydata.org/

Seaborn es una librería de visualización de datos para Python basada en matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos.

? Ventajas

Genera gráficos atractivos visualmente.
Los gráficos tienen muchas características para personalizar.
Documentación clara y muchos ejemplos disponibles.

? Desventajas

Si estás acostumbrado a la librería para python Matplotlib los parámetros en Seaborn son diferentes aunque Seaborn esté basado en Matplotlib, esto puede ser confuso.

Por Pamela Gonzáles

La visualización de datos, una ciencia y un arte

invitado — Mon, 22 Apr 2019 18:30:39 +0000

Alberto Cairo en su libro “The Truthful Art” describe la verdad como una variable continua, un espectro entre ser un absoluto mentiroso y ser una persona completamente veraz (en otras palabras un Dios). Partiendo de ello, la verdad es una aspiración, o mejor dicho un “arte”. Navegar en la incertidumbre es lo que nos toca a todos.

No obstante, la visualización de datos es además una ciencia. Nos exige escoger entre los métodos de codificación para transformar los datos en información valiosa que pueda aportar al conocimiento de ideas.

¿cómo llegamos a elegir?

No existe una respuesta definitiva. Una gran herramienta abierta y disponible que explica los distintos métodos de codificación que existen en la visualización es la herramienta data viz Project . Ahí se puede desagregar los gráficos por uso: comparación, correlación, distribución, data geo referencial, tendencias en el tiempo, etc.

Además la página tiene una sección (input) que expone las opciones de gráficas para distintos formatos de datos. Por ejemplo, si queremos mostrar la correlación entre dos variables el método más utilizado (no el único) es el gráfico de dispersión (scatter plot).

Fuente: http://datavizproject.com/data-type/scatter-plot/

Por otra parte, si lo que se quiere es mostrar distintos valores y comparar entre sí, entonces nos serviría utilizar una gráfica de barras o líneas (esta última en caso de que exista datos de carácter temporal).

Fuente: http://datavizproject.com/data-type/bar-chart-horizontal/

Seleccionar el método de codificación es la ciencia. Para convertirnos en buenos analistas por lo tanto necesitamos desarrollar una habilidad numérica. En mi experiencia este tipo de destreza, en el cual desempolvamos mucha estadística, no es algo que deba considerarse ajeno o para ciertas disciplinas, al contrario como cualquier otro aprendizaje es constante práctica. Para alguien que transitó de la área social y de humanidades, hacia los datos creo que esto es alcanzable para todo aquel que logre una dosis entre curiosidad, mucha, pero mucha disciplina.

Amarrando lo anterior, no existe un solo camino para la visualización de datos, de hecho, es cada vez más importante el uso de ganchos para evitar el rebote (bouncing) como lo explica la editora del Guardian Us, Mona Chalabi, esto sucede cuando un lector o usuario decide abandonar el sitio y permanece por menos de diez segundos en la nota. Este fenómeno de rebote es cada vez más frecuente, sobre todo por lo difícil que resulta mantener la atención de lectores en un ambiente de abundancia.

A raíz de esto surgen nuevos mecanismos para innovar y hacer gráficas más atractivas, con el objetivo de resaltar los datos y la información pero conservando en gran medida los mismos métodos de visualización (enconding). En el ejemplo de Mona Chalabi se presenta la temática de la desigualdad utilizando como base lo que gana un hombre blanco en Estados Unidos para ilustrar de forma comparativa la diferencia entre esta cifra con otros grupos étnicas, segmentados por género. Lo significativo de este ejemplo es que en esencia la gráfica es de barras, pero el toque innovador es el uso del billete de dólar para ilustrar los valores.

fuente: http://monachalabi.com/illustrations/

El hecho de que la visualización sea un arte y una ciencia implica un diseño imperfecto, una verdad a medias. No obstante, esto no es un disuasivo, si no una motivación para emprender en el juego creativo de sumar significado y especialmente participar en una conversación con otros.

Por Sofía Montenegro

Usando QGIS y OpenStreetMap (OSM) para mapear edificaciones

invitado — Mon, 01 Apr 2019 17:43:30 +0000

En esta entrada utilizaremos en conjunto QGIS y OpenStreetMap para identificar edificaciones dentro de la franja de arena donde se encuentra la ciudad de Puntarenas, Costa Rica. Asumiremos que el ejercicio es parte de una cuantificación de futuros daños que podría sufrir la ciudad de Puntarenas dado al aumento del nivel del mar asociado al cambio climático y vendría a funcionar como un ejemplo de proyectos en los que el análisis de datos informa sobre los posibles daños del cambio climático.

Sobre las herramientas

QGIS es un programa de Sistemas de Información Geográfica (SIG) gratuito y de código abierto con una interfaz gráfica amigable al usuarios disponible para distintas plataformas. Actualmente es la opción gratuita más completa y fácil de usar para realizar análisis de datos espaciales. QGIS se puede descargar desde www.qgis.org

OpenStreetMap (OSM) es una plataforma colaborativa en internet para crear mapas editables y libres. En esta plataforma cualquier persona puede modificar, editar y agregar información espacial sobre cualquier lugar en el mundo. Se podría decir que OpenStreetMap es un Wikipedia de mapas, donde los datos generados no solamente se pueden desplegar en el sitio web de la plataforma, si no que también pueden descargarse y ser analizados en herramientas de SIG. A pesar de que los datos que se presentan en OSM no son oficiales, en muchos regiones del mundo son los únicos existentes, por lo que se deben considerar como una fuente importante de datos geográficos libres y gratuitos.

¿Cuántas edificaciones hay en una región?

Objetivo del tutorial:

Identificar y analizar utilizando QGIS y OSM las distintas edificaciones que existen en la franja de arena donde se encuentra la ciudad de Puntarenas, en Costa Rica

Notas para tomar en cuenta durante el tutorial:

El tutorial se realizará utilizando la versión en inglés de QGIS versión 3.4

Se recomienda hacer este tutorial luego del anterior tutorial Creando mapas en QGIS

Parte 1. Enfocando nuestro análisis al área de Puntarenas

Para comenzar nuestro análisis debemos enfocarnos en nuestra área de estudio y para esto debemos utilizar varias herramientas de QGIS.

Abrir QGIS dando doble click al ícono.

Agregar mapa base de OpenStreetMap al visor de QGIS utilizando la ventana de Browser y la opción de XYZ Tiles y dando doble click a OpenStreetMap.

Al hacer esto el mapa del mundo se despliega en la ventana principal de QGIS y en la ventana de Layers nos aparece OpenStreetMap.

Asegurarnos que el sistema de coordenadas del mapa es el que deseamos. En este caso WGS84. Para esto debemos dar click en la esquina inferior derecha de la ventana de QGIS, donde dice EPSG:3857.

En la ventana que se abre, escribir IGNF:WGS84G en el espacio de Filter y seguidamente dar click en World Geodetic System 1984 que aparece en la subventana de Coordinate reference systems of the world y dar click en OK. (Para entender mejor qué son los sistemas de coordenadas, se recomienda ver el material sobre Coordenadas geográficas).

De esta manera estamos haciendo que QGIS trabaje en un sistema de coordenadas específico, lo que nos va a servir para poder guiar nuestro análisis a una ubicación específica (ciudad de Puntarenas).

En la barra inferior de la ventana de QGIS escribir (copiar y pegar) en el espacio Coordinate: las coordenadas del centro de la ciudad de Puntarenas -84.82353,9.97530 y la escala de 1:50000 en el espacio de Scale. De esta manera ubicaremos nuestro «mapa» en la ciudad de Puntarenas.

Parte 2. Utilizando el plugin QuickOSM

QGIS tiene una gran cantidad de plugins gratuitos que permiten realizar distintos tipos de análisis. Para este ejercicio utilizaremos el plugin QuickOSM que nos permitirá descargar desde QGIS los datos de OSM.

Dar click en Plugins – Manage and Install Plugins…

En la ventana de Plugins escribir QuickOSM y luego en Install plugin.

Esperar a que se descargue e instale el plugin y luego cerrar la ventana.
Abrir QuickOSM haciendo click en Vector – QuickOSM – QuickOSM

En la ventana de QuickOSM, seleccionar building en el menú de Key y Canvas Extent en el menú bajo a Value. De esta manera le estamos diciendo a QGIS que descargue únicamente los objetos codificados como edificios en el área que está desplegada en la ventana principal.

Nota: OSM tiene una gran cantidad de códigos para los distintos objetos que se representan en sus mapas. La guía de todos los códigos que utiliza OSM se puede ver en el siguiente enlace: https://wiki.openstreetmap.org/wiki/ES:Map_Features

Damos click en Run query para correr la búsqueda y descarga de los datos.

Al hacer esto QuickOSM nos descarga los puntos y polígonos de los edificios que han sido digitalizados en OSM por la comunidad en nuestra área de estudio.

Parte 3. Analizando los datos de OSM

Ahora que tenemos los datos en nuestro SIG podemos hacer múltiples análisis. Lo primero es un conteo de cuantas edificaciones tenemos en esa nueva capa.

Damos click derecho en la capa building con ícono en forma de cuadro (esto significa que el tipo de dato es polígono) y luego hacemos click en Open Attribute Table para de esta manera ver la tabla de atributos de la capa y cuantas entidades hay en ella.

Si navegamos la tabla de atributos hasta el final, podemos ver que el total de entidades que hay en esta capa ( ~ edificios) son 271 (esto para la fecha en que se escribió el tutorial). ¿Serán estos todos los edificios que existen en Puntarenas? Para esto podemos cargar una imagen de GoogleEarth y hacer una comparación visual.

Damos click derecho en el XYZ Tiles de la ventana Browser y luego click en New Connection…

En la ventana de XYZ Connection llenar en Name: Imágenes Google Earth y en URL copiar y pegar la siguiente dirección y dar click en OK. http://mt0.google.com/vt/lyrs=y&hl=en&x={x}&y={y}&z={z}&s=Ga

De esta manera hacemos que QGIS pueda cargar como mapa base las imágenes de Google Earth.

Nota: en caso de querer ampliar la lista de mapas base de QGIS, pueden utilizar el script en Python que hizo Klas Karlsson: https://twitter.com/klaskarlsson/status/972757121933733889

Ya agregada la nueva conexión a las imágenes de GoogleEarth, hacemos doble click en ella: XYZ Tiles – Imágenes Google Earth. Luego de que se despliegue la imagen, en la ventana de Layer arrastramos y soltamos esta nueva capa sobre la capa de OpenStreetMap para de esta forma poder ver los edificios sobre la imagen.

Efectivamente podemos ver a simple vista que la capa de edificios de OSM no representa todos los edificios que existen en la ciudad de Puntarenas. ¿Qué podemos hacer si lo que queremos es saber cuantas edificaciones hay en esta área? La primera opción es tomar el tiempo para editar en OSM desde las imágenes áreas los edificios que hacen falta, la otra opción es descargar todas las entidades que tiene OSM en esta área y buscar alguna que refleje mejor el número de edificios.

Volvemos a abrir QuickOSM y en este caso únicamente seleccionamos Canvas Extent y hacemos click en Run query. De esta manera se descargarán todos los objetos que existen en el área de estudio.

Reacomodamos las capas en la ventana Layers para tener la imagen de GoogleEarth debajo de los nuevos puntos allKeys.

Abrimos la tabla de atributos de esta nueva capa de puntos y vemos que hay 141 entidades.

Si también reacomodamos las capas y ponemos los polígonos de building bajo los puntos de allKeys vemos que en muchos casos estos no se sobreponen, por lo que podríamos decir a manera de un estimado rápido que hay más de 412 (271 polígonos + 141 puntos) edificaciones y puntos de interés en la ciudad de Puntarenas.

Por Guillermo Durán

Ingeniero forestal y geógrafo, fellow en cambio climático por la Iniciativa Latinoamericana por los Datos Abiertos y Escuela de Datos. Tiene experiencia en el uso de diferentes tecnologías, como programación en R, PostgreSQL, ArcGIS y QGIS. Su trabajo en biogeografía lo ha llevado a diseñar áreas protegidas en Panamá, georeferenciar los datos de los museos de Historial Natural o trabajar en las distribuciones de ciertas especies en futuros climáticos usando Machine Learning. Guillermo estudió ingeniería forestal en Instituto Tecnológico de Costa Rica y luego obtuvo una maestría en Geografía en la Universidad Estatal de San Francisco, California. Ha colaborado con el Centro de Investigaciones Geofísicas de la Universidad de Costa Rica con el análisis y visualización de modelos climáticos.

Creación de mapas en QGIS

invitado — Mon, 01 Apr 2019 17:19:18 +0000

Esta entrada presenta una introducción general de cómo hacer mapas en QGIS. Pretende servir para incentivar el uso de QGIS en personas ajenas a los profesionales en Sistemas de Información Geográfica (SIG) y promover el uso de herramientas gratuitas de análisis de datos geográficos.

Para el tutorial utilizaremos los datos del Sistema Nacional de Información Territorial (SNIT) de Costa Rica, del Índice de Desarrollo Humano (IDH) Cantonal 2016 de Costa Rica y la versión 3 de QGIS.

QGIS es un programa de Sistemas de Información Geográfica (SIG) gratuito y de código abierto con una interfaz gráfica amigable al usuarios disponible para distintas plataformas. Actualmente es la opción gratuita más completa y fácil de usar para realizar análisis de datos espaciales. QGIS se puede descargar desde www.qgis.org

Objetivo del tutorial:

Elaborar un mapa de Costa Rica que resalte con nombre y en un gradiente de color los valores del índice de desarrollo humano de los 10 cantones con los valores menores.

Notas para tomar en cuenta durante el tutorial:

El tutorial se realizará utilizando la versión en inglés de QGIS versión 3.2.3.

Parte 1: Abrir QGIS y cargar los datos de límites cantonales del SNIT

Dar doble click al ícono de QGIS.

Dar click en Layer – Add Layer – Add WFS Layer…

De esta manera estaremos agregando al QGIS la dirección del WebFeatureService (WFS) del SNIT para los datos oficiales de Costa Rica escala 1:5,000. Para más información sobre qué es un WFS pueden acceder la entrada anterior del blog sobre tipos de datos geográficos.

En la ventana que aparece, dar click en el botón de New de la sección Server connections.

Seguidamente escribiremos en el espacio Name el nombre que le queremos dar a este conjunto de datos, por ejemplo: CartografiaCR_1:5000.

En el espacio URL copiaremos la dirección del servicio del SNIT para estos datos:

http://geos.snitcr.go.cr/be/IGN_5/wfs?

Dar click en OK para aceptar y cerrar esa ventana.

Vale la pena mencionar que el SNIT es la Infraestructura de Datos Espaciales (IDE) oficial de Costa Rica. En esta plataforma se pueden encontrar datos geográficos producidos por distintas instituciones públicas del país. Estos datos geográficos se sirven tanto en formatos OGC (estándares de datos para poderlos desplegarlos en programas de SIG sin necesidad de descargar todo el conjunto de datos en la computadora) así como también en la herramienta de mapas online con que cuenta la plataforma. En nuestro caso usaremos QGIS para trabajar los datos porque nos da mayor flexibilidad que la herramienta web.

La lista completa de fuentes de información y conjuntos de datos con que cuenta el SNIT se puede acceder acá.

Muchos países cuentan desde hace varios años con IDEs donde se pueden acceder muchos conjuntos de datos geográficos libremente. Normalmente con una búsqueda de Google pueden encontrar el IDE del país o gobierno local donde viven.

Dar click en Connect

Seguidamente aparecerá la lista de capas que tiene ese conjunto de datos. Cada una de estas viene siendo como una tabla – cuadro con información geográfica. En nuestro caso queremos desplegar la que tiene la información sobre los límites cantonales del país.

Dar click en Límite Cantonal 1:5mil y en Add (esquina inferior derecha de la ventana).

Luego aparecerá una ventana con el indicador de la descarga de la capa seleccionada. Al ser una capa con una escala bastante fina (1:5000), el tamaño de la información es grande, por lo que dependiendo de la velocidad de conexión podrá tomarse varios segundos en desplegarse.

La capa desplegada muestra un polígono por cada cantón del país. Nótese que en Layers (ventana inferior izquierda) se muestra la capa que recién agregamos y hay un checkbox donde podemos ocultar y volver a hacer visible la capa.

Parte 2: Cargar tabla con datos del IDH

Los datos del Índice de Desarrollo Humano (IDH) que se utilizarán en este ejercicio son tomados del trabajo del PNUD y la Universidad de Costa Rica Atlas de Desarrollo Humano Cantonal de Costa Rica 2016. En nuestro caso utilizaremos los datos de los 10 cantones con menor índice de IDH para el año 2014.

Copiar y guardar la siguiente tabla en un archivo con terminación .csv. Esto puede hacerse copiando y pegando la tabla en una hoja de Excel y guardándola como archivo .csv (archivo separado por comas).

Nota: Como es necesario mantener las tildes de los nombres de los cantones, el archivo se debe salvar con el formato de codificación de caracteres UTF-8. Dependiendo de la versión de Excel que se utilice, esto está en la lista de tipos de archivos del guardar como.

Canton	2014
Los Chiles	0.617
Talamanca	0.634
Matina	0.645
Upala	0.651
La Cruz	0.651
Coto Brus	0.669
Guácimo	0.670
Guatuso	0.670
Alajuelita	0.676

En QGIS dar click en Layer – Add Layer – Add Delimited Text Layer … y seleccionar el archivo creado en el paso anterior.

La ventana deberá tener la información como la que se ve a continuación.

Nótese que el Encoding también debe ser UTF-8 y que en el cuadro de Geometry definition indicamos el No geometry (attribute only table). Esto último significa que la tabla que estamos agregando no tiene información geográfica.

Dar click en Add para importar la tabla al QGIS y luego Close para cerrar la ventana.

Nótese que ahora en la lista de capas del QGIS nos aparecen las dos que cargamos anteriormente pero que la última, al no tener información geográfica (coordenadas), no tiene el checkbox desplegarla y ocultarla. Si queremos ver esta tabla debemos darle click derecho a la capa y luego click izquierdo en Open Attribute Table.

Parte 3: Unión de tablas por atributo común

Como vimos anteriormente tenemos dos «capas» cargadas en QGIS, una tiene información geográfica (polígonos con los cantones de Costa Rica) y la otra únicamente tiene información tabular (Cantones y valor de IDH). Lo que debemos hacer ahora es unir estas dos capas por un campo común.

Para ver la tabla de atributos de la capa del SNIT, le damos también click derecho y luego click izquierdo en Open Attribute Table. En sus atributos vemos que hay una columna con el nombre de los cantones en un formato similar a la tabla con IDH (letra inicial en mayúscula y nombres con tildes), lo que hace que podamos unir ambas tablas usando los nombres de los cantones.

Dar click derecho en la capa del SNIT y click izquierdo en Properties.

Damos click en la pestaña de Join y damos click en el signo de + de la esquina inferior izquierda. Seguidamente seleccionamos para Join layer la tabla con los valores de IDH, para Join field la columna Canton y en Target field la columna nom_canton de los atributos de la capa del SNIT. Luego de esto damos click en OK.

Si ahora abrimos la tabla de atributos de la capa del SNIT y vemos las últimas columnas, podemos notar que se agregó una columna nueva con el nombre de la tabla de IDH. Esta nueva columna tiene valores numéricos para únicamente los 10 cantones de la tabla, el resto de cantones tienen valores nulos (NULL).

Parte 4: Elaboración de mapa

Hacemos zoom a la parte continental de Costa Rica con el botón de lupa:

Dar doble click en la capa original del SNIT para ver las propiedades. En la nueva ventana dar click en la pestaña de Symbology.

De las opciones de la simbología, en el menú superior seleccionar Categorized, en Column la columna que queremos utilizar (la de la tabla con los valores de IDH), en Color ramp alguna paleta de colores atractiva (en mi caso seleccioné Viridis). Luego dar click en el botón de Classify para ver la clasificación de colores de cada valor de IDH.

Ya que el color amarillo que se asignaría a los cantones en que el IDH es nulo es muy llamativo (último valor de la lista de colores), podemos dar click en él y seleccionar un color más neutro, en mi caso seleccioné el color blanco.

Dar click en OK para ver las modificaciones que se hicieron.

Para que el mapa muestre los nombres de los 10 cantones con menores valores de IDH volvemos a entrar a las propiedades de la capa del SNIT (doble click o click derecho y luego click izquierdo en Properties…).

En el menú de las propiedades damos click en la pestaña de Labels. Y ahí en el menú superior damos click en Rule-based labeling.

Ahora vamos a crear una regla para que el mapa únicamente muestre los nombres de los cantones con valores de IDH (10 cantones con menores IDH). Para esto damos click en el signo de + en la parte inferior derecha de la ventana y en el campo de Filter copiamos la expresión de:

«IDH10cantones_2014» IS NOT NULL

En la misma ventana dar click al cuadro de Labels y en el menú de Label with seleccionar la columna con los nombres de los cantones que queremos utilizar como etiquetas: nom_cant.

Si se explora la parte inferior de la ventana de Edit Rule se ven las opciones para cambiar el tipo de letra, color, tamaño, etc. Ajustarlo al gusto y dar click en OK.

Al regresar a la ventana de propiedades, quitarle el check a la regla de (no filter) (ver la captura de pantalla abajo) y dar click en OK.

En caso de querer cambiar los colores, tipo y tamaño de letra se puede hacer nuevamente desde la ventana de propiedades de la capa, haciendo click en el ícono de edición:

Parte 5: Exportar el mapa

Para darle los toques finales al mapa, agregar simbología, título y escala utilizamos la herramienta de layout. La accedemos en el menú de Project – New Print Layout…

En la ventana que aparece damos click en OK

En el menú de la ventana de Layout hacemos click en Add Item – Add Map y seguidamente marcamos arrastrando y soltando en la hoja blanca la extensión que queremos que tenga nuestro mapa.

Agregamos la leyenda haciendo click en Add Item – Add Legend y seleccionamos con click de arrastrar y soltar donde queremos la leyenda en nuestro mapa.

Para corregir los elementos de la leyenda (eliminar el nombre de la tabla de IDH y corregir el nombre de la capa del SNIT) damos click en la leyenda. Nos damos cuenta que está seleccionada por los cuadros celestes que se marcan en sus bordes.

5.1. En el menú de Item Properties de la derecha de la ventana hacemos click para desmarcar el checkbox de Auto update.

5.2. En esa misma sección de la ventana damos click en la tabla con valores de IDH para seleccionarla y luego damos click en el botón de – (color rojo), en la parte inferior de la ventana, para eliminarla de la leyenda.

5.3. En esa misma sección de la ventana damos click en la capa del SNIT y luego en el botón de edición. Cambiamos el nombre que se desplegará en la leyenda para esa capa.

5.4 Damos click en OK para aceptar los cambios.

Agregamos escala del mapa haciendo click en Add Item – Add Scale Bar y marcamos arrastrando y soltando en la hoja blanca la posición y tamaño que queremos que tenga.

Agregamos el título del mapa haciendo click en Add Item – Add Label y marcamos arrastrando y soltando la posición y tamaño del cuadro donde queremos que esté el título.

Cambiamos el nombre del título haciendo click en el cuadro del título y luego en la pestaña de Item Properties al lado derecho de la ventana. En el espacio de Main properties escribimos el título y en las opciones de Appearance – Font el tamaño y tipo de letra.

Finalmente exportamos el mapa haciendo click en el menú de Layout – Export as Image y seleccionando el formato y nombre de archivo que se desee.

Por Guillermo Durán

Introducción a los formatos de datos espaciales

invitado — Mon, 01 Apr 2019 15:50:30 +0000

En esta publicación estaremos hablando sobre los datos espaciales, sus características más importantes y ejemplos de tipos de información en que se utilizan. En la primera parte nos enfocaremos en generalidades sobre los tipos de datos espaciales, qué tipos existen y qué tipo de información guardan. En la segunda entraremos más en detalle sobre los distintos archivos más populares para guardar estos tipos de datos.

Tipos de datos espaciales:

Los datos espaciales se pueden agrupar en dos tipos generales: los datos vectoriales y los datos rasterizados (o también llamados datos raster o «mapas de bits»). Estos dos tipos existen ya que por sus características, cada uno puede representar de mejor manera distintos componentes del espacio. Por ejemplo: los datos de caminos, ubicaciones de edificaciones o poblados normalmente se guardan como datos vectoriales, mientras que las imágenes de satélite o fotos aéreas como datos raster. En el caso de ambos, existen formatos de datos abiertos y propietarios.

Antes de entrar en detalle de los distintos formatos utilizados es importante tener claras las entidades que componen ambos tipos de datos espaciales:

Los datos vectoriales pueden representar tres tipos distintos de entidades: puntos, líneas y polígonos.

En el caso de los puntos, cada punto tiene coordenadas X-Y que definen su ubicación en el espacio.
En el caso de las líneas, cada línea tiene un par de coordenadas para cada uno de sus vértices. El ejemplo más sencillo es una recta, que se representaría como la línea que existe entre las coordenadas de su punto de inicio y las de su punto final.
Los polígonos son datos con coordenadas para cada uno de los vértices que lo componen. Un polígono podría pensarse como el área que se limita por un conjunto de líneas consecutivas que inician y terminan en el mismo punto.

Vale mencionar que una característica importante de los datos vectoriales es que cada una de sus entidades (cada línea, punto o polígono de un archivo) puede tener una tabla de atributos asociados. Esto significa que, por ejemplo, cada sección de un camino puede tener una tabla de atributos con información como «material de que está hecho», «número de carriles», «grosor del pavimento», etc.

Los datos raster, en cambio, son una malla (o dicho técnicamente, una matriz) donde cada celda (o pixel) tiene un tamaño similar y un valor específico. En el caso de las imágenes a color, el raster estaría compuesto por tres matrices sobrepuestas, cada una con celdas que tienen el valor correspondiente a un color primario (enlace a teoría del color). Cuando se utilizan imágenes de satélite u otros sensores (multiespectrales o hiperespectrales) cada archivo puede contener hasta cientos de matrices que representan distintos rangos de lo observado.

Aparte de imágenes, es común tener en archivos raster modelos de elevación digital, que son «imágenes» (una sola matriz) con los valores de elevación promedio del área que corresponde a cada celda.

En resumen:

Los archivos vectoriales los usamos para guardar geometrías como puntos, líneas o polígonos. Usualmente representan entidades del paisaje que se acoplan a esas características como: centros de pueblos, ubicación de edificios, ríos, caminos, lotes o predios.

Los archivos raster los utilizamos para guardar imágenes o conjuntos de datos espaciales donde haya una gradación entre valores y/o cuando los límites entre los componentes del paisaje son muy difusos; por ejemplo: fotos aéreas, imágenes de satélite, modelos de elevación o modelos climáticos.

Tipos de archivos para datos espaciales

Shapes

En el caso de los archivos vectoriales, el formato más popular es el shapefile. Este es un archivo que fue desarrollado originalmente por la empresa ESRI y que puede contener únicamente un tipo de dato vectorial (o puntos, o líneas o polígonos). Los archivos shape realmente son un conjunto de archivos binarios que para desplegarlos deben tener el mismo nombre y ubicarse en un mismo folder. Los tres archivos básicos que componen un shapefile terminan en .shp, .shx y .dbf.

GeoJSON

Uno de los formatos abiertos más utilizados para distribuir datos geográficos es el GeoJSON. Este, al igual que el JSON popularmente utilizado en el web, es un archivo de texto pero que también guarda las coordenadas de los vértices de las entidades que se representan. Al ser un archivo de texto, en geometrías complejas (con muchos vértices) su tamaño será mucho mayor que cuando los datos se guardan en formatos binarios .

GeoPackage

Otro formato abierto que ha tomado fuerza en la comunidad de usuarios de SIG es el GeoPackage (terminación de archivos en .gpkg). Este es un archivo binario (es un contenedor de la base de datos SQLite) que tiene la gran ventaja de poder contener tanto datos vectoriales como raster e inclusive tablas de metadatos.

KML

El Keyhole Markup Language (KML) es un tipo de formato abierto originalmente utilizado para desplegar y guardar datos en Google Earth pero que se ha vuelto común entre los usuarios de datos geográficos de otras plataformas. El formato se utiliza para guardar datos vectoriales pero también puede contenter en archivos con terminación .kmz imágenes sobrepuestas, íconos y otros elementos.

CSV

Vale la pena mencionar que en su representación más simple (puntos), los archivos vectoriales también pueden representarse como texto separado por comas (.csv), con columnas para los pares de coordenadas.

GeoTIFF

En el caso de los datos raster, existen una gran variedad de archivos capaces de almacenarlos. Uno de los más populares es el GeoTIFF, una modificación al popular archivo de imágenes TIFF, pero que le permite guardar datos con coordenadas geográficas. Normalmente el archivo con terminación .tif debe de acompañarse con un archivo del mismo nombre pero con terminación .tfw, que es el world file que le da la referencia geográfica al raster.

Otros archivos propietarios comunes para guardar datos raster y que también se pueden leer en muchos de los programas más utilizados son los .img del software ERDAS Imagine y los archivos .sid, también conocidos como MrSID.

NetCDF

En cuanto a formatos abiertos para datos raster, el más utilizado, especialmente para datos climáticos, es el netCDF (terminación de archivos en .nc). Este formato es sumamente ágil para guardar todo tipo de datos y tiene muchas ventajas para el procesamiento en herramientas gratuitas. Dependiendo de la fuente de los datos, estos archivos pueden llegar a pesar teras completos, por lo que su manipulación puede requerir más experiencia en el manejo y análisis de este tipo de datos.

WebServices

Los estándares de servicios web para datos geográficos más populares actualmente son los WMS y WFS. Estos se accesan a través de un URL que puede integrarse a sitios web y programas de SIG para desplegar o descargar los datos. Muchos de los portales de Infraestructura de Datos Espaciales (IDEs) de los gobiernos sirven ambos tipos de servicios web y son una fuente muy importante para obtener datos geográficos oficiales.

El Web Feature Service (WFS) es un protocolo que proporciona datos vectoriales y que, dependiendo del programa en que se estén desplegando, permite guardar localmente los datos en cualquiera de los formatos para vectores que se mencionaron anteriormente.

Los Web Map Service (WMS) sirven datos en mapas de bits («imágenes») que, a diferencia de los WFS, no pueden descargarse como datos crudos. Si, por ejemplo, se utiliza un IDE para accesar fotos aéreas o mapas antiguos, se debería de utilizar un WMS.

Por Guillermo Durán

Ingeniero forestal y geógrafo, fellow en cambio climático por la Iniciativa Latinoamericana por los Datos Abiertos y Escuela de Datos. Tiene experiencia en el uso de diferentes tecnologías, como programación en R, PostgreSQL, ArcGIS y QGIS. Su trabajo en biogeografía lo ha llevado a diseñar áreas protegidas en Panamá, georeferenciar los datos de los museos de Historial Natural o trabajar en las distribuciones de ciertas especies en futuros climáticos usando Machine Learning. Guillermo estudió ingeniería forestal en Instituto Tecnológico de Costa Rica y luego obtuvo una maestría en Geografía en la Universidad Estatal de San Francisco, California. Ha colaborado con el Centro de Investigaciones Geofísicas de la Universidad de Costa Rica con el análisis y visualización de modelos climáticos.

¿Qué son los sistemas de coordenadas cartográficas?

invitado — Mon, 01 Apr 2019 15:15:32 +0000

¿Qué es lo que hay que considerar cuando queremos hacer un mapa? Te explicamos los sistemas de coordenadas cartográficas, cómo funcionan, qué sistemas de proyección existen y cómo influencian tus trabajos con geodatos.

Cuando elaboramos un mapa o croquis que trata de representar con cierta precisión el espacio físico se nos hace necesario utilizar un sistema de referencia, sin este no sería posible ubicar en el mapa nuestros datos. Este sistema de referencia es lo que comúnmente conocemos como coordenadas cartográficas.

Normalmente esos valores – las coordenadas – son dos números que representan la ubicación de lo que queremos posicionar en el mapa, y se ubican con relación a los puntos cardinales. Estos valores muestran la ubicación horizontal de lo que queremos localizar, un valor es la ubicación en el eje X (este – oeste) y el otro en el eje Y (norte – sur). Puede darse también el caso de que las coordenadas tengan un tercer valor que corresponda a la ubicación en el eje vertical (elevación, eje Z), pero estas últimas no son comúnmente utilizadas.

Cada sistema de coordenadas tiene un nombre, código y parámetros que lo definen. Estas características son necesarias para transformar entre distintos sistemas con la mayor precisión posible y así desplegar correctamente en un mismo mapa las ubicaciones de datos con coordenadas de sistemas distintos. El identificador para cada distinto sistema de coordenadas se conoce como el CRS (del inglés Coordinate Reference System) y sin este no se ubicarían correctamente nuestros datos. Cuando se necesita conocer el CRS de un conjunto de datos se recomienda utilizar el sitio http://epsg.io, en este se encuentra la información y parámetros de la mayoría de los sistemas de coordenadas cartográficas utilizados en el mundo.

¿Coordenadas proyectadas o no proyectadas?

Cuando utilizamos conjuntos de datos que poseen coordenadas cartográficas, llegaremos a notar que muchos de estos tienen coordenadas con unidades distintas: unas coordenadas pueden estar en grados – minutos – segundos, otras en números positivos y negativos con muchos decimales o inclusive en metros o pies. La razón de estas diferencias es la problemática que existe cuando tratamos de representar en una superficie plana la superficie de la Tierra.

La Tierra es una esfera (o técnicamente, un elipsoide – achatada en los polos) por lo que si queremos representarla en una superficie plana como un mapa o una pantalla de computadora, tendremos distintos problemas relacionados a distorsiones de los elementos que se quieren mostrar. Un ejemplo de este problema de transformación de superficies distintas es cuando vemos en un mapa del mundo que el tamaño de Groenlandia es similar al de todo el continente Africano (como antiguamente en Google Maps) y en realidad el área de Groenlandia es unas 14 veces menor a la de toda África.

Para el abordaje de este problema existen distintos sistemas de coordenadas, y un cartógrafo, dependiendo de la situación y objetivos del mapa a realizar, decidirá escoger entre sistemas de coordenadas que muestren fielmente, por ejemplo, la forma de los elementos del mapa. En otros casos, el cartógrafo preferirá que las proporciones de las áreas de estos elementos se acerquen más a los reales (comprometiendo la forma de estos). Normalmente si el mapa que estamos haciendo es de un área muy pequeña, no deberíamos de preocuparnos por estas distorsiones, pero si es de un continente o del planeta sí deben de tenerse en cuenta.

Cuando las coordenadas se dan como ángulos (grados-minutos-segundos o grados-minutos y decimales o grados con decimales) se le llaman coordenadas no proyectadas (algunos inclusive las llaman coordenadas geográficas) y se les dice así porque estos valores se dan por el ángulo que se produce en el centro de la tierra entre la ubicación del dato y un punto de referencia (Meridiano de Greenwich o el paralelo del Ecuador). En este caso las coordenadas se dan en pares Lat Long, siendo la latitud la coordenada en el eje Y, con valor positivo si está al norte del ecuador y negativo si está al sur. La longitud es en el eje X y posee valores negativos que representan ubicaciones al oeste del Meridiano de Greenwich y positivos al este.

En caso de que las coordenadas se den en unidades de distancia (metros, pies, etc.) se les llaman coordenadas proyectadas, ya que para generar estos valores hubo que proyectar la superficie del planeta en una superficie plana. Aunque existen muchos sistemas de proyección, el más utilizado es el UTM (Universal Transverse Mercator), el mismo que antiguamente utilizaba Google Maps.

Afortunadamente la mayoría de herramientas para trabajar con datos geográficos, tanto los programas de sistemas de información geográfica (QGIS, ArcGIS, gvSIG), análisis de datos (R/Python) como para visualización en web (D3, Leaflet), manejan muchos sistemas de coordenadas.

Para quienes deseen conocer más sobre el tema, un video educativo de Vox muestra de manera sencilla las tecnicalidades que envuelven el problema de representar la superficie de la Tierra en una superficie plana:

Jason Davies tiene una excelente animación en D3 de los distintas proyecciones y cómo cambia la forma y tamaño de los distintos componentes del mapa de acuerdo al sistema de coordenadas utilizado: https://www.jasondavies.com/maps/transition/

Tips para trabajar con coordenadas

Cada país cuenta con un sistema de coordenadas oficial y algunos tienen varios (¡en Costa Rica, un país diminuto, tenemos 3 sistemas de coordenadas que en algún momento fueron oficiales!); por consiguiente, saber en cuál sistema están las coordenadas del conjunto de datos a veces puede ser una labor compleja. Aún así se pueden dar varios tips:

Si los datos tienen coordenadas no proyectadas (valores en ángulos: grados-minutos-segundos, grados con decimales, grados-minutos con decimales) lo más probable es que estén en el sistema de coordenadas WGS84 (CRS EPSG:4326), este también es el sistema de coordenadas que utilizan nativamente los dispositivos de navegación por satélite (GPS).
Si los datos vienen de un sistema catastral nacional, las coordenadas posiblemente sean proyectadas y estén en el sistema de coordenadas oficial del país. En caso de no conocer el CRS, pueden buscarlo con el nombre del país en el enlace que se dio anteriormente.
Si se están tomando los datos de mapas impresos, normalmente la información del sistema de coordenadas se da en la parte inferior del mismo.

Por Guillermo Durán

Así es como Latinoamérica va a celebrar el #OpenDataDay

Daniel Villatoro — Fri, 01 Mar 2019 00:41:53 +0000

Un año más, el Día de los Datos Abiertos celebra iniciativas de transparencia en todo el mundo, con más de 200 eventos programados. En Latinoamérica, SocialTIC y Escuela De Datos se une a la celebración en 4 países a través de expediciones de datos, charlas, talleres, meet-ups y rallys dateros.

A la vez, en otros países de la región organizaciones amigas trabajarán alrededor de un mismo objetivo: concientizar sobre la necesidad de abrir los datos públicos para que sean accesibles y puedan ser reutilizados para generar valor.

Este sábado 2 de marzo es el Día de los Datos Abiertos y te compartimos algunos de los eventos programados para celebrarlo. Tú también puedes unirte al evento más cercano y a la celebración mundial usando el hashtag #ODD19.

? Ciudad de México – Sábado 2 de marzo

Toda una kermés datera: un día de talleres, expedición de datos, proyectos, rally de obra pública, retos de datos de la ciudad. Gibrán Mena de SocialTIC estará dando un taller sobre extracción de datos de solicitudes de información de la plataforma Infomex

Conoce más sobre el Evento, su Agenda y Regístrate para participar.

? San José, Costa Rica – Sábado 2 de marzo

La Comisión de Gobierno Abierto junto a organizaciones de sociedad civil, academia y ciudadanía activa organizan un espacio de charlas, talleres y conocimiento.

En este evento, Eugenia Loría, fellow de Contrataciones Abiertas de Escuela de Datos, estará hablando sobre casos de uso en las contrataciones públicas de Costa Rica, así como presentando una guía temática de apertura de datos que desarrolló.

Conoce más sobre el evento, su Agenda y Regístrate para participar.

? La Paz, Bolivia – Sábado 9 de marzo

BoliviaTechHub y Escuela de Datos organizan un encuentro en el que se aprenderá sobre los básicos de Datos Abiertos y Contataciones Abiertas. Luego, se conocerá sobre cómo a través de los presupuestos analizar la equidad de género y se realizará una expedición de datos para abrir información del Sistema de Contrataciones del Estado. Pamela González, fellow de Contrataciones Abiertas de Escuela de Datos estará liderando una sesión.

Conoce más sobre el Evento y Regístrate para participar en estos enlaces.

? Ciudad de Guatemala – Sábado 9 de marzo

Escuela de Datos va a crear un espacio que te permita aprender cómo usar los datos de las contrataciones públicas, además de guiar un ejercicio sobre el proceso y la transparencia. Sofía Montenegro, fellow de Escuela de Datos compartirá los hallazgos de su proyecto sobre transparencia que busca entender cómo funciona este sistema. Además una meet-up con los proyectos de tecnología cívica que buscan incidir en las próximas elecciones generales

El Open Data Day o Día de los Datos Abiertos es una celebración anual de los datos abiertos alrededor del mundo. Distintos grupos crearán eventos locales en este día y utilizarán los datos abiertos en sus comunidades para crear aplicaciones, visualizaciones, liberar datos o publicar análisis sobre el estado de los datos abiertos. Es una oportunidad para mostrar los beneficios de los datos abiertos y potenciar su uso.

Las actividades de este año se concentran en cuatro ejes:

Ciencia Abierta
Rastreo de flujos de dinero público
Mapeo abierto
Desarrollo equitativo

Puedes conocer los otros eventos que estarán sucediendo en este enlace y así conocer a la comunidad de datos abiertos de tu país en https://opendataday.org/#map

Fellows Estado Abierto en Costa Rica: Conóceles.

Daniel Villatoro — Thu, 09 Aug 2018 15:21:00 +0000

Este año comenzamos una nueva modalidad de fellowship, la Fellowship Estado Abierto, a través de la cual líderes locales colaboran con instituciones públicas para afrontar los retos de abrir datos desde el sector público.

Esta generación tendrá la oportunidad de trabajar en conjunto con dos instituciones del Gobierno de Costa Rica, así como en colaboración con la Iniciativa Latinoamericana de Datos Abiertos (ILDA) y Escuela de Datos.

Guillermo Durán – Cambio Climático

@gds506

A Guillermo le interesa hacer entendibles los análisis de datos a través de la visualización. Tiene experiencia en el uso de diferentes tecnologías, como programación en R (tidyverse, shiny y data.table), PostfreSQL, ArcGIS y QGIS.

Su trabajo en biogeografía lo ha llevado a diseñar áreas protegidas en Panamá, georeferenciar los datos de los museos de Historial Natural o trabajar en las distribuciones de ciertas especies en futuros climáticos usando Machine Learning. Guillermo estudió ingeniería forestal en Instituto Tecnológico de Costa Rica y luego obtuvo una maestría en Geografía en la Universidad Estatal de San Francisco, California. Forma parte del Centro de Investigaciones Geofísicas de la Universidad de Costa Rica con el análisis y visualización de modelos climáticos.

Guillermo estará trabajando en utilizar indicadores sobre el estado del medio ambiente, los Objetivos de Desarrollo Sustentable y relacionarlos con el cambio climático junto a la Dirección de Cambio Climático del Ministerio de Ambiente y Energía.

Eugenia Loria – Contrataciones Abiertas

Eugenia tiene experiencia en el uso de software estadísticos como SPSS, Minitab, JMP, Eviews y lenguajes de programación como R. Busca explicar las contrataciones a través de la relación entre variables y modelos explicativos, así como la evaluación del impacto de los diferentes programas.

Ha trabajado en la Banca Central de Costa Rica y en órganos multilaterales. Tiene experiencia en la docencia. Su área de fortaleza es la estadística descriptiva y el análisis de datos.

Le interesa usar su creatividad para promover el uso de datos y estadística para la toma de decisiones en el ámbito público. Cree en el poder de la alfabetización en datos. Ve la transparencia como una oportunidad para eficientar el trabajo del sector público.

Eugenia se dedicará a trabajar en Contrataciones Abiertas, una oportunidad para la rendición de cuentas y la transparencia, junto a la Dirección General de Administración de Bienes y Contratación Administrativa del Ministerio de Hacienda.

El programa de la fellowship Datos Abiertos para el Estado Abierto está diseñado para que nuestros fellows puedan organizar talleres, eventos de comunidad en Costa Rica y contenidos educativos, además de generar proyectos de mayor alcance con las instituciones aliadas.Este programa es apoyado por el fondo de transparencia del Banco Interamericano de Desarrollo (BID) y la colaboración de la Fundación Avina.

La Fellowship Estado Abierto continúa con el trabajo desarrollado por ILDA y la Universidad de Costa Rica capacitando a más de 140 personas en el servicio civil, y busca aumentar la conciencia sobre la alfabetización de datos en el sector público y fortalecer comunidades que, juntas, pueden poner en práctica sus habilidades para hacer el cambio que quieren ver en el mundo.

Flourish: visualizaciones fáciles en base a plantillas

Daniel Villatoro — Thu, 12 Jul 2018 14:41:05 +0000

Esta herramienta de visualización te permite crear gráficos, mapas e historias interactivas en línea. Se basa en una serie de principios básicos que pretenden facilitar el trabajo para cualquier usuario:

No se requiere código solo conectar los datos con las librerías de plantillas con las que cuenta
Flexibilidad hacia arriba al permitirle a algunos usuarios poder crear plantillas privadas y a la medida
Storytelling animado para poder guiar a las audiencias a través de datos. Explicándolos ya sea a través de la publicación o a medida que interactúan.
Embeds y descargas ya que los proyectos se pueden incrustar en cualquier página, pero también se pueden descargar como archivos crudos o raw para otros usos.

¿Qué plantilla escoger?

De momento, Flourish se encuentra en una fase beta en la que ofrece 17 plantillas que te mostramos y comentamos.

Globo terráqueo de conexiones

Esta plantilla tridimensional es ideal para visualizar un flujo de datos como patrones de migración, transferencias monetarias o vuelos. Cada fila en el conjunto de datos es representada como un arco entre dos locaciones, el cual tiene un tamaño escalable dependiendo del flujo.

Para usar esta plantilla necesitas tener las siguientes columnas: locación de origen, locación de destino y valor. Lo mejor es que los orígenes y destinos estén acompañados de la codificación de países ISO Alpha-3 (códigos de tres letras). Sino, puedes especificar latitud, longitud y un nombre para desplegar.

Barra apilada para resultados electorales

Un gráfico de barras apiladas (stacked bar) ideal para resultados electorales. Con él puedes mostrar un resultado general, o especificar por regiones que pueden ser seleccionadas de un menú dropdown. Incluye una funcionalidad que permite construir coaliciones, alternando los partidos en las leyendas para personalizarlas y también la opción de agregar datos históricos para comparar los resultados actuales con la elección anterior.

Para usar esta plantilla cada fila debería ser una región (país, estado, departamento o municipio). Esa región debería tener una columna con su nombre y una columna por cada partido en la elección.

Carrera de caballos

Este tipo de gráfico muestra el cambio de un rango o su evolución en cierto tiempo. Esta visualización es muy utilizada para mostrar los datos de cualquier tipo de competencia o «carrera»: candidatos en unas elecciones, equipos de futbol en una competencia, por ejemplo. Grafica en dos modalidades y permite animaciones entre ambas: un gráfico lineal que traza los valores en bruto y un gráfico de evolución que calcula y traza los rangos de estos datos.

Para usar esta plantilla cada fila después de los encabezados debe corresponder a un participante de la carrera. En las columnas se señalará: nombre del participante y cuantas columnas sean necesarias para cada «etapa» de la carrera (semanas, días, años, montos, etc). Todas las etapas se grafican con el mismo ancho.

Mapa de íconos

En este mapa interactivo usas iconos, imágenes o emojis para marcar un lugar. La plantilla crea una calve que se duplica para que los usuarios puedan hacer click tanto a una categoría o a un ícono.

Para usar esta plantilla necesitas una hoja de cálculo con una fila para cada elemento en el mapa y sus respectivas latitud y longitud. Para agregar íconos debes tener una columna como categoría.

Gráficos de lineas, barras y pie o pastel

Elige entre un gráfico de líneas, uno de barras (incluso si son agrupadas o apiladas), de área o de pie. Para utilizar esta plantilla necesitas una columna con «etiquetas» (que pueden ser categorías, fechas, números, etc) y una o más columnas con «valores» (que debe contener números). Cada columna de valores crea una línea, barra o pedazo de pie, por lo que agrega cuantas requieras. Para seleccionar entre las opciones solo intercambia entre las opciones en «chart type«.

Mapamundi

Un mapa del mundo con opciones para colorearlo en escala, señalarlo con puntos y ventanas emergentes. Para graficar usa un conjunto de datos para los colores y otro para los círculos en coordinadas específicas.

Para utilizar este gráfico tus datos deberían contener una columna con nombres de región y una o más columna con valores. Los nombres de las regiones deberían coincidir con los datos de ejemplo precargados.

Gráfico de redes

Una red de puntos vinculados como un diagrama de nodos. Para lograr esta unión, el conjunto de datos debe de tener al menos dos columnas con los vínculos. Cada fila especifica los puntos (que se mostrarán como círculos) que se vinculan entre sí (a través de una línea). Se puede incluir una tercera columna que se use para definir el ancho del vínculo.

Si bien una hoja de cálculo es suficiente para crear un diagrama de red, una segunda hoja de «Puntos» permite una mayor flexibilidad. En lugar de dejar que Flourish determine todos los puntos para agregar a la red en función de los enumerados en la hoja Vínculos, las filas en la hoja Puntos definen la colección completa de puntos y se puede usar para asignar color a grupos codificados o tamaño a los puntos.

Capacidades y límites

Como muchos programas gratuitos, Flourish funciona bajo un esquema freemium. La versión gratis te permite publicar y compartir visualizaciones o incrustarlas en tu website. Estos trabajos permanecen públicos y cualquiera puede acceder a ellos, lo cual es bueno para comunicadores y medios, pero no tanto para organizaciones que lidian con información sensible. Existen versiones de pago personales y para empresas que te permiten descargar el código HTML y hospedarlo en tu propio servidor.

Con todas las versiones de Flourish puedes descargar un archivo .SVG que luego puedes abrir y editar en programas como Adobe Illustrator. Esto hace que Flourish sea una herramienta útil también para aquellos que trabajan en medios impresos y hacen infografías.

Flourish tiene también un programa para que organizaciones periodísticas tengan una cuenta premium de manera gratuita que les permita trabajos privados, plantillas personalizadas y proyectos compartidos. Si formas parte de un medio puedes aplicar a través de este formulario al programa.

Como siempre, queremos saber si te resultó útil nuestro tutorial y nos encantaría ver qué visualizaciones creas con Flourish. Escríbenos por twitter a @EscuelaDeDatos