Elecciones, Contratos públicos y Ciencia Abierta: la mezcla en el #ODD19 Guatemala

Daniel Villatoro - el abril 22, 2019 en Experiencias, Fellowship, Noticias

En Guatemala, el OpenDataDay se enfocó en tres temas, cada uno con dinámicas diferentes y espacios de aprendizaje.

Etiquetas: día de los datos abiertos, elecciones, Guatemala, odd, open data day, tecnología civica Sin Comentarios »

Lo bueno, lo malo, lo geek. 10 librerías de código para resolver tus proyectos de visualización de datos

invitado - el abril 22, 2019 en Tutoriales, Uncategorized

La visualización de datos es un arte y una ciencia, ya que, «una imagen vale más que mil líneas de datos». Existen librerías de código que hacen esta labor un poco más manejable.

¿Qué es una librería? ¿Cómo funciona?

Una librería es un kit de herramientas que contiene recursos que se pueden reutilizar. ¿No queremos empezar todo desde 0 verdad? Puedes hacer un llamado dentro de tu código a estas librerías para reutilizar aquellos recursos que necesites.

Para poder usar las siguientes librerías necesitas tener conocimientos previos de programación, pero si no los tienes, puedes usar las siguientes herramientas que no necesitan de código.

4 factores a considerar antes de escoger una librería.

Antes de decidir cuál libreria utilizar es necesario tomar en cuenta los siguientes aspectos:

1.- El formato de los datos que vas a utilizar.

Los datos que deseas visualizar están en un .csv, en un .sql, en un pdf, etc. Las librerías trabajan con ciertos formatos por lo que debes buscar la que más se adecúe a tu situación.

2.- ¿Qué tan personalizable es?

Algunas librerías son restrictivas. Las más fáciles de aprender son más limitadas mientras que las más complejas son más personalizables.

3.- Los tipos de gráficos disponibles.

Revisa bien que la librería genere ese gráfico que estas buscando.

4.- ¿Qué tan fácil de aprender es? ¿Se puede encontrar buena documentación sobre ella?

Sabemos que a veces necesitamos las cosas para ayer. Si estás en un apuro, no pierdas tu tiempo con algo complicado. Si dispones de más tiempo hay una infinidad de cosas por descubrir en librerías complejas.

A continuación, las librerías

D3.js

http://d3js.org

D3.js es una librería JavaScript para manipular documentos basados en datos. D3 utiliza HTML, SVG y CSS. D3 te da completamente el control: es muy customizable. Con ella, puedes crear desde gráficas sencillas como barras, hasta visualizaciones complejas, como gráficos relacionales o visualizaciones con mapas.

? Ventajas

Es una librería muy popular con una comunidad muy activa, lo que facilita el aprendizaje y te brinda respuestas rápidas a tus preguntas.
Es compatible con la librería Javascript React.
Existen varias librerías como C3.js o Metrics Graphics.js, que usan D3 en el back-end, lo cual reduce el trabajo para obtener buenos gráficos.
Sin dependencias y fácil de configurar.
D3 ofrece un increíble nivel de interactividad.

? Desventajas

La curva de aprendizaje es compleja. De esta manera, si lo que se deseas obtener es un gráfico sencillo, quizá esta no sea una buena opción.
Requiere librerías adicionales para exportar los gráficos.

Processing.js

http://processingjs.org/

Processing.js es una librería JavaScript que permite hacer visualizaciones de datos, arte digital, animaciones interactivas, gráficos educativos, videojuegos, etc. Trabaja con estándares web y cualquier complemento. Processing.js es el proyecto hermano de Processing.

? Ventajas

Processing.js está escrito en JavaScript y usa el elemento <canvas> de HTML5. Convierte tu código JavaScript y lo ejecuta.
Utiliza estándares web modernos.
Si sabes codificar en Processing no necesitas aprender Javascript.

? Desventajas

Processing.js utiliza el concepto de un directorio de datos, donde se encuentran las imágenes y otros recursos. Processing.js no incluye esto. Como resultado, siempre se debe proporcionar páginas de archivos (por ejemplo, imágenes).
Processing.js necesita tu ayuda al anular métodos de superclase sobrecargados. Esto quiere decir que cuando se hereden métodos de una clase, no se podrá sobrescribir.
Solo tiene dos modos de renderizado. Si estás pasando de Processing (el cual tiene muchos modos de Renderizado) a Processing.js, puede ser un poco problemático.

Google Charts

https://developers.google.com/chart/?hl=en

Google Charts es un servicio web que permite crear gráficos con la información que se le proporciona y es de fácil uso. Es la librería que soporta Google Analytics, por lo que se puede usar en diferentes formatos como Json, Javascript y plugins que se pueden integrar con varios lenguajes de programación.

? Ventajas

Es personalizable. Puedes hacer tus propios gráficos para que combinen con tu web.
Se conecta a tus datos en tiempo real utilizando una variedad de herramientas y protocolos.
Compatibilidad con varios navegadores.
Puedes utilizar un código embebido Javascript en tu página web.
Es gratis
Puede generar los gráficos mediante Hojas de cálculo, bases de datos SQL, archivos CSV y hacer actualizaciones automáticas.

? Desventajas

No te da un procesamiento estadístico sofisticado.
Requiere una conexión de red.

Chartjs.js

http://www.chartjs.org/

Chart.js es una biblioteca de JavaScript que permite dibujar diferentes tipos de gráficos responsive mediante el elemento canvas de HTML5.

? Ventajas

Es responsivo
Modular (Funcionalidades separadas)
Open Source, así puedes compartir y modificar el código fuente.
La documentación de chart.js está bien organizada y provee información detallada de cada una de las características.

? Desventajas

Funciona mejor para algo rápido y simple. En caso de un proyecto complejo y más personalizado, esta librería no es la adecuada.

Vis.js

http://visjs.org/

Una librería de visualización dinámica web. La librería está diseñada para ser fácil de usar, manejar grandes cantidades de datos dinámicos y permitir la manipulación e interacción con los datos.

? Ventajas

Responsivo
Modular (Funcionalidades separadas)
Open Source
Vis.js tiene un showcase de proyectos y documentación clara

? Desventajas

Lento: Cuando el gráfico tiene muchos detalles se necesita poner un mensaje “Cargando” para que los usuarios lo sepan.

Sigma.js

http://sigmajs.org/

Sigma es una librería JavaScript dedicada a las visualizaciones de datos. Facilita la publicación de gráficos de redes en páginas web y permite a los desarrolladores integrar su exploración en aplicaciones web.

? Ventajas

Bastante adaptable
Se puede agregar toda la interactividad deseada
Apto para principiantes.

? Desventajas

Cuando los nodos están conectados por varios bordes, estos se tienden a superponer y se necesita un plugin adicional para solucionar el problema.

Flot Charts

http://www.flotcharts.org/

Flot es una librería JavaScript para jQuery para visualizar datos, con un enfoque en el uso simple, aspecto atractivo y características interactivas.

? Ventajas

Fácil de usar y con amplia documentación disponible.
A la hora de hacer gráficos con ejes, admite múltiples ejes en Y(el eje vertical), lo cual es importante para poder correlacionar tendencias
Configuración Simple.

? Desventajas

Tiene un número limitado de tipos de gráficos que puedes hacer.

Chartist.js

https://gionkunz.github.io/chartist-js/

Chartist.js es una librería Javascript open-source con charts responsive. Genera los gráficos en SVG (al ser vectoriales son DPI-independientes). Es una librería muy sencilla de usar muy flexible y muy ligera que ocupa sólo 10 Kb y no tiene dependencias.

? Ventajas

Gran flexibilidad al usar CSS
Utiliza formatos SVG para los gráficos
Completamente responsivo
Sin dependencias y fácil de configurar

? Desventajas

No todos los navegadores soportan sus animaciones.

Plot.ly

https://plot.ly/

Plotly es una librería Python que genera gráficos interactivos de calidad en línea. Ejemplos gráficos de líneas, diagramas de dispersión, gráficos de áreas, gráficos de barras, barras de error, diagramas de cajas, histogramas, mapas de calor, subtramas, ejes múltiples, gráficos polares y gráficos de burbujas.

? Ventajas

Gran soporte para ejes complejos y múltiples.
Herramientas integradas de zoom y filtrado en gráficos y mapas.
Tiene una documentación clara con opciones y ejemplos.
Gráficos interactivos.

? Desventajas

Los gráficos no funcionan en todos los navegadores.

Seaborn

http://seaborn.pydata.org/

Seaborn es una librería de visualización de datos para Python basada en matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos.

? Ventajas

Genera gráficos atractivos visualmente.
Los gráficos tienen muchas características para personalizar.
Documentación clara y muchos ejemplos disponibles.

? Desventajas

Si estás acostumbrado a la librería para python Matplotlib los parámetros en Seaborn son diferentes aunque Seaborn esté basado en Matplotlib, esto puede ser confuso.

Por Pamela Gonzáles

Etiquetas: d3, google charts, librerías, plot.ly, presentar, visualización Sin Comentarios »

La visualización de datos, una ciencia y un arte

invitado - el abril 22, 2019 en Guest posts

Alberto Cairo en su libro “The Truthful Art” describe la verdad como una variable continua, un espectro entre ser un absoluto mentiroso y ser una persona completamente veraz (en otras palabras un Dios). Partiendo de ello, la verdad es una aspiración, o mejor dicho un “arte”. Navegar en la incertidumbre es lo que nos toca a todos.

No obstante, la visualización de datos es además una ciencia. Nos exige escoger entre los métodos de codificación para transformar los datos en información valiosa que pueda aportar al conocimiento de ideas.

¿cómo llegamos a elegir?

No existe una respuesta definitiva. Una gran herramienta abierta y disponible que explica los distintos métodos de codificación que existen en la visualización es la herramienta data viz Project . Ahí se puede desagregar los gráficos por uso: comparación, correlación, distribución, data geo referencial, tendencias en el tiempo, etc.

Además la página tiene una sección (input) que expone las opciones de gráficas para distintos formatos de datos. Por ejemplo, si queremos mostrar la correlación entre dos variables el método más utilizado (no el único) es el gráfico de dispersión (scatter plot).

Fuente: http://datavizproject.com/data-type/scatter-plot/

Por otra parte, si lo que se quiere es mostrar distintos valores y comparar entre sí, entonces nos serviría utilizar una gráfica de barras o líneas (esta última en caso de que exista datos de carácter temporal).

Fuente: http://datavizproject.com/data-type/bar-chart-horizontal/

Seleccionar el método de codificación es la ciencia. Para convertirnos en buenos analistas por lo tanto necesitamos desarrollar una habilidad numérica. En mi experiencia este tipo de destreza, en el cual desempolvamos mucha estadística, no es algo que deba considerarse ajeno o para ciertas disciplinas, al contrario como cualquier otro aprendizaje es constante práctica. Para alguien que transitó de la área social y de humanidades, hacia los datos creo que esto es alcanzable para todo aquel que logre una dosis entre curiosidad, mucha, pero mucha disciplina.

Amarrando lo anterior, no existe un solo camino para la visualización de datos, de hecho, es cada vez más importante el uso de ganchos para evitar el rebote (bouncing) como lo explica la editora del Guardian Us, Mona Chalabi, esto sucede cuando un lector o usuario decide abandonar el sitio y permanece por menos de diez segundos en la nota. Este fenómeno de rebote es cada vez más frecuente, sobre todo por lo difícil que resulta mantener la atención de lectores en un ambiente de abundancia.

A raíz de esto surgen nuevos mecanismos para innovar y hacer gráficas más atractivas, con el objetivo de resaltar los datos y la información pero conservando en gran medida los mismos métodos de visualización (enconding). En el ejemplo de Mona Chalabi se presenta la temática de la desigualdad utilizando como base lo que gana un hombre blanco en Estados Unidos para ilustrar de forma comparativa la diferencia entre esta cifra con otros grupos étnicas, segmentados por género. Lo significativo de este ejemplo es que en esencia la gráfica es de barras, pero el toque innovador es el uso del billete de dólar para ilustrar los valores.

fuente: http://monachalabi.com/illustrations/

El hecho de que la visualización sea un arte y una ciencia implica un diseño imperfecto, una verdad a medias. No obstante, esto no es un disuasivo, si no una motivación para emprender en el juego creativo de sumar significado y especialmente participar en una conversación con otros.

Por Sofía Montenegro

Etiquetas: alberto cairo, presentar, visualización Sin Comentarios »

Usando QGIS y OpenStreetMap (OSM) para mapear edificaciones

invitado - el abril 1, 2019 en Tutoriales

En esta entrada utilizaremos en conjunto QGIS y OpenStreetMap para identificar edificaciones dentro de la franja de arena donde se encuentra la ciudad de Puntarenas, Costa Rica. Asumiremos que el ejercicio es parte de una cuantificación de futuros daños que podría sufrir la ciudad de Puntarenas dado al aumento del nivel del mar asociado al cambio climático y vendría a funcionar como un ejemplo de proyectos en los que el análisis de datos informa sobre los posibles daños del cambio climático.

Lee el resto de la entrada →

Etiquetas: geodatos, mapeo, open street map, OSM, QGIS Sin Comentarios »

Creación de mapas en QGIS

invitado - el abril 1, 2019 en Tutoriales

Esta entrada presenta una introducción general de cómo hacer mapas en QGIS. Pretende servir para incentivar el uso de QGIS en personas ajenas a los profesionales en Sistemas de Información Geográfica (SIG) y promover el uso de herramientas gratuitas de análisis de datos geográficos.

Lee el resto de la entrada →

Etiquetas: geodatos, QGIS Sin Comentarios »

Introducción a los formatos de datos espaciales

invitado - el abril 1, 2019 en Tutoriales

En esta publicación estaremos hablando sobre los datos espaciales, sus características más importantes y ejemplos de tipos de información en que se utilizan. En la primera parte nos enfocaremos en generalidades sobre los tipos de datos espaciales, qué tipos existen y qué tipo de información guardan. En la segunda entraremos más en detalle sobre los distintos archivos más populares para guardar estos tipos de datos. Lee el resto de la entrada →

Etiquetas: cartografia, Datos Geográficos, geodato, geodatos, geolocalización, georeferencia Sin Comentarios »

¿Qué son los sistemas de coordenadas cartográficas?

invitado - el abril 1, 2019 en Uncategorized

¿Qué es lo que hay que considerar cuando queremos hacer un mapa? Te explicamos los sistemas de coordenadas cartográficas, cómo funcionan, qué sistemas de proyección existen y cómo influencian tus trabajos con geodatos.

Lee el resto de la entrada →

Etiquetas: cartografia, coordenadas, geodatos, geolocalización Sin Comentarios »

Así es como Latinoamérica va a celebrar el #OpenDataDay

Daniel Villatoro - el marzo 1, 2019 en Uncategorized

Un año más, el Día de los Datos Abiertos celebra iniciativas de transparencia en todo el mundo, con más de 200 eventos programados. En Latinoamérica, SocialTIC y Escuela De Datos se une a la celebración en 4 países a través de expediciones de datos, charlas, talleres, meet-ups y rallys dateros.

A la vez, en otros países de la región organizaciones amigas trabajarán alrededor de un mismo objetivo: concientizar sobre la necesidad de abrir los datos públicos para que sean accesibles y puedan ser reutilizados para generar valor.

Este sábado 2 de marzo es el Día de los Datos Abiertos y te compartimos algunos de los eventos programados para celebrarlo. Tú también puedes unirte al evento más cercano y a la celebración mundial usando el hashtag #ODD19.

Lee el resto de la entrada →

Etiquetas: Escuela de datos, ODD19, open data day, OpenData Sin Comentarios »

Fellows Estado Abierto en Costa Rica: Conóceles.

Daniel Villatoro - el agosto 9, 2018 en Fellowship

Este año comenzamos una nueva modalidad de fellowship, la Fellowship Estado Abierto, a través de la cual líderes locales colaboran con instituciones públicas para afrontar los retos de abrir datos desde el sector público.

Esta generación tendrá la oportunidad de trabajar en conjunto con dos instituciones del Gobierno de Costa Rica, así como en colaboración con la Iniciativa Latinoamericana de Datos Abiertos (ILDA) y Escuela de Datos.

Lee el resto de la entrada →

Etiquetas: Cambio climático, datos abiertos, Escuela de datos, estado abierto, Eugenia Loria, fellowship, gobierno de Costa Rica, Guillermo Duran, ilda, iniciativa latinoamericana de datos abiertos, Ministerio de Ambiente y Energía, ministerio de hacienda, Open Data, School of Data Sin Comentarios »

Flourish: visualizaciones fáciles en base a plantillas

Daniel Villatoro - el julio 12, 2018 en Tutoriales

Esta herramienta de visualización te permite crear gráficos, mapas e historias interactivas en línea. Se basa en una serie de principios básicos que pretenden facilitar el trabajo para cualquier usuario:

No se requiere código solo conectar los datos con las librerías de plantillas con las que cuenta
Flexibilidad hacia arriba al permitirle a algunos usuarios poder crear plantillas privadas y a la medida
Storytelling animado para poder guiar a las audiencias a través de datos. Explicándolos ya sea a través de la publicación o a medida que interactúan.
Embeds y descargas ya que los proyectos se pueden incrustar en cualquier página, pero también se pueden descargar como archivos crudos o raw para otros usos.

Lee el resto de la entrada →

Etiquetas: data pipeline, flourish, flourish studio, graficas, graficas de barras, graficos de redes, herramientas, infografias, plantillas, presentar, tutorial, visualización, visualización de datos Sin Comentarios »

4 factores a considerar antes de escoger una librería.

D3.js

? Ventajas

? Desventajas

Processing.js

? Ventajas

? Desventajas

Google Charts

? Ventajas

? Desventajas

Chartjs.js

? Ventajas

? Desventajas

Vis.js

? Ventajas

? Desventajas

Sigma.js

? Ventajas

? Desventajas

Flot Charts

? Ventajas

? Desventajas

Chartist.js

? Ventajas

? Desventajas

Plot.ly

? Ventajas

? Desventajas

Seaborn

? Ventajas

? Desventajas

Entradas recientes