Estás navegando por el archivo de invitado.

Lo bueno, lo malo, lo geek. 10 librerías de código para resolver tus proyectos de visualización de datos

- el abril 22, 2019 en Tutoriales, Uncategorized

La visualización de datos es un arte y una ciencia, ya que, «una imagen vale más que mil líneas de datos». Existen librerías de código que hacen esta labor un poco más manejable.

¿Qué es una librería? ¿Cómo funciona?

Una librería es un kit de herramientas que contiene recursos que se pueden reutilizar. ¿No queremos empezar todo desde 0 verdad? Puedes hacer un llamado dentro de tu código a estas librerías para reutilizar aquellos recursos que necesites.

Para poder usar las siguientes librerías necesitas tener conocimientos previos de programación, pero si no los tienes,  puedes usar las siguientes herramientas que no necesitan de código.

4 factores a considerar antes de escoger una librería.

Antes de decidir cuál libreria utilizar es necesario tomar en cuenta los siguientes aspectos:

1.- El formato de los datos que vas a utilizar.

Los datos que deseas visualizar están en un .csv, en un .sql, en un pdf, etc. Las librerías trabajan con ciertos formatos por lo que debes buscar la que más se adecúe a tu situación.

2.- ¿Qué tan personalizable es?

Algunas librerías son restrictivas. Las más fáciles de aprender son más limitadas mientras que las más complejas son más personalizables.

3.- Los tipos de gráficos disponibles.

Revisa bien que la librería genere ese gráfico que estas buscando. 

4.- ¿Qué tan fácil de aprender es? ¿Se puede encontrar buena documentación sobre ella?

Sabemos que a veces necesitamos las cosas para ayer. Si estás en un apuro, no pierdas tu tiempo con algo complicado.  Si dispones de más tiempo hay una infinidad de cosas por descubrir en librerías complejas.

A continuación, las librerías 

 

D3.js

http://d3js.org

D3.js es una librería JavaScript para manipular documentos basados en datos. D3 utiliza HTML, SVG y CSS. D3 te da completamente el control: es muy customizable. Con ella, puedes crear desde gráficas sencillas como barras, hasta visualizaciones complejas, como gráficos relacionales o visualizaciones con mapas.

? Ventajas

  • Es una librería muy popular con una comunidad muy activa, lo que facilita el aprendizaje y te brinda respuestas rápidas a tus preguntas.
  • Es compatible con la librería Javascript React.
  • Existen varias librerías como C3.js o Metrics Graphics.js, que usan D3 en el back-end, lo cual reduce el trabajo para obtener buenos gráficos.
  • Sin dependencias y fácil de configurar.
  • D3 ofrece un increíble nivel de interactividad.

? Desventajas

  • La curva de aprendizaje es compleja. De esta manera, si lo que se deseas obtener es un gráfico sencillo, quizá esta no sea una buena opción.
  • Requiere librerías adicionales para exportar los gráficos.

 

Processing.js

http://processingjs.org/

Processing.js es una librería JavaScript que permite hacer visualizaciones de datos, arte digital, animaciones interactivas, gráficos educativos, videojuegos, etc. Trabaja con estándares web y cualquier complemento. Processing.js es el proyecto hermano de Processing.

? Ventajas

  • Processing.js está escrito en JavaScript y usa el elemento <canvas> de HTML5. Convierte tu código JavaScript y lo ejecuta.
  • Utiliza estándares web modernos.
  • Si sabes codificar en Processing no necesitas aprender Javascript.

? Desventajas

  • Processing.js utiliza el concepto de un directorio de datos, donde se encuentran las imágenes y otros recursos. Processing.js no incluye esto. Como resultado, siempre se debe proporcionar páginas de archivos (por ejemplo, imágenes).
  • Processing.js necesita tu ayuda al anular métodos de superclase sobrecargados. Esto quiere decir que cuando se hereden métodos de una clase, no se podrá sobrescribir.
  • Solo tiene dos modos de renderizado. Si estás pasando de Processing (el cual tiene muchos modos de Renderizado) a Processing.js, puede ser un poco problemático.

Google Charts

https://developers.google.com/chart/?hl=en

Google Charts es un servicio web que permite crear gráficos con la información que se le proporciona y es de fácil uso.  Es la librería que soporta Google Analytics, por lo que se puede usar en diferentes formatos como Json, Javascript y plugins que se pueden integrar con varios lenguajes de programación.

? Ventajas

  • Es personalizable. Puedes hacer tus propios gráficos para que combinen con tu web.
  • Se conecta a tus datos en tiempo real utilizando una variedad de herramientas y protocolos.
  • Compatibilidad con varios navegadores.
  • Puedes utilizar un código embebido Javascript en tu página web.
  • Es gratis
  • Puede generar los gráficos mediante Hojas de cálculo, bases de datos SQL, archivos CSV y hacer actualizaciones automáticas.

? Desventajas

  • No te da un procesamiento estadístico sofisticado.
  • Requiere una conexión de red.

Chartjs.js

http://www.chartjs.org/

Chart.js es una biblioteca de JavaScript que  permite dibujar diferentes tipos de gráficos responsive mediante el elemento canvas de HTML5.

? Ventajas

  • Es responsivo
  • Modular (Funcionalidades separadas)
  • Open Source, así puedes compartir y modificar el código fuente.
  • La documentación de chart.js  está bien organizada y provee información detallada de cada una de las características.

? Desventajas

  • Funciona mejor para algo rápido y simple. En caso de un proyecto complejo y más personalizado, esta librería no es la adecuada.

 

Vis.js

http://visjs.org/

Una librería de visualización dinámica web. La librería está diseñada para ser fácil de usar, manejar grandes cantidades de datos dinámicos y permitir la manipulación e interacción con los datos.

? Ventajas

  • Responsivo
  • Modular (Funcionalidades separadas)
  • Open Source
  • Vis.js  tiene un showcase de proyectos y documentación clara

? Desventajas

  • Lento: Cuando el gráfico tiene muchos detalles se necesita poner un mensaje “Cargando” para que los usuarios lo sepan.

Sigma.js

http://sigmajs.org/

Sigma es una librería JavaScript dedicada a las visualizaciones de datos. Facilita la publicación de gráficos de redes en páginas web y permite a los desarrolladores integrar su exploración en aplicaciones web.

? Ventajas

  • Bastante adaptable
  • Se puede agregar toda la interactividad deseada
  • Apto para principiantes.

? Desventajas

  • Cuando los nodos están conectados por varios bordes, estos se tienden a superponer y se necesita un plugin adicional para solucionar el problema.

 

Flot Charts

http://www.flotcharts.org/

Flot es una librería JavaScript para jQuery para visualizar datos, con un enfoque en el uso simple, aspecto atractivo y características interactivas.

? Ventajas

  • Fácil de usar y con amplia documentación disponible.
  • A la hora de hacer gráficos con ejes, admite múltiples ejes en Y(el eje vertical), lo cual es importante para poder correlacionar tendencias
  • Configuración Simple.

? Desventajas

  • Tiene un número limitado de tipos de gráficos que puedes hacer.

 

Chartist.js

https://gionkunz.github.io/chartist-js/

Chartist.js es una librería Javascript open-source con charts responsive. Genera los gráficos en SVG (al ser vectoriales son DPI-independientes). Es una librería muy sencilla de usar muy flexible y muy ligera  que ocupa sólo 10 Kb y no tiene dependencias.

? Ventajas

  • Gran flexibilidad al usar CSS
  • Utiliza formatos SVG para los gráficos
  • Completamente responsivo
  • Sin dependencias y fácil de configurar

? Desventajas

  • No todos los navegadores soportan sus animaciones.

 

Plot.ly

https://plot.ly/

Plotly es una librería Python que genera gráficos interactivos de calidad en línea. Ejemplos gráficos de líneas, diagramas de dispersión, gráficos de áreas, gráficos de barras, barras de error, diagramas de cajas, histogramas, mapas de calor, subtramas, ejes múltiples, gráficos polares y gráficos de burbujas.

? Ventajas

  • Gran soporte para ejes complejos y múltiples.
  • Herramientas integradas de zoom y filtrado en gráficos y mapas.
  • Tiene una documentación clara con opciones y ejemplos.
  • Gráficos interactivos.

? Desventajas

  • Los gráficos no funcionan en todos los navegadores.

 

Seaborn

http://seaborn.pydata.org/

Seaborn es una librería de visualización de datos para Python basada en matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos.

? Ventajas

  • Genera gráficos atractivos visualmente.
  • Los gráficos tienen muchas características para  personalizar.
  • Documentación clara y muchos ejemplos disponibles.

? Desventajas

  • Si estás acostumbrado a la librería para python Matplotlib los parámetros en Seaborn son diferentes aunque Seaborn esté basado en Matplotlib, esto puede ser confuso.

Por Pamela Gonzáles

La visualización de datos, una ciencia y un arte

- el abril 22, 2019 en Guest posts

Alberto Cairo en su libro “The Truthful Art” describe la verdad como una variable continua, un espectro entre ser un absoluto mentiroso y ser una persona completamente veraz (en otras palabras un Dios). Partiendo de ello, la verdad es una aspiración, o mejor dicho un “arte”. Navegar en la incertidumbre es lo que nos toca a todos.

No obstante, la visualización de datos es además una ciencia. Nos exige escoger entre los métodos de codificación para transformar los datos en información valiosa que pueda aportar al conocimiento de ideas.

¿cómo llegamos a elegir?

 

No existe una respuesta definitiva. Una gran herramienta abierta y disponible que explica los distintos métodos de codificación que existen en la visualización es la herramienta  data viz Project .  Ahí se puede desagregar los gráficos por uso: comparación, correlación, distribución, data geo referencial, tendencias en el tiempo, etc.

 

Además la página tiene una sección (input) que expone las opciones de gráficas para  distintos formatos de datos. Por ejemplo, si queremos mostrar la correlación entre dos variables el método más utilizado (no el único) es el gráfico de dispersión (scatter plot).

 

Fuente: http://datavizproject.com/data-type/scatter-plot/

 

Por otra parte, si lo que se quiere es mostrar distintos valores y comparar entre sí, entonces nos serviría utilizar una gráfica de barras o líneas  (esta última en caso de que exista datos de carácter temporal).

 

Fuente: http://datavizproject.com/data-type/bar-chart-horizontal/

 

Seleccionar el método de codificación es la ciencia. Para convertirnos en buenos analistas por lo tanto necesitamos desarrollar una habilidad numérica. En mi experiencia este tipo de destreza, en el cual desempolvamos mucha estadística, no es algo que deba considerarse ajeno o para ciertas disciplinas, al contrario como cualquier otro aprendizaje es constante práctica. Para alguien que transitó de la área social y de humanidades, hacia los datos creo que esto es alcanzable para todo aquel que logre una dosis entre curiosidad, mucha, pero mucha disciplina.   

 

Amarrando lo anterior, no existe un solo camino para la visualización de datos, de hecho, es cada vez más importante el uso de ganchos para evitar el rebote (bouncing) como lo explica la editora del Guardian Us, Mona Chalabi, esto sucede cuando un lector o usuario decide abandonar el sitio y permanece por menos de diez segundos en la nota. Este fenómeno de rebote es cada vez más frecuente, sobre todo por lo difícil que resulta mantener la atención de lectores en un ambiente de abundancia.

 

A raíz de esto surgen nuevos mecanismos para innovar y hacer gráficas más atractivas, con el objetivo de resaltar los datos y la información pero conservando en gran medida los mismos métodos de visualización (enconding). En el ejemplo de Mona Chalabi se presenta la temática de la desigualdad utilizando como base lo que gana un hombre blanco en Estados Unidos para ilustrar de forma comparativa la diferencia entre esta cifra con otros grupos étnicas, segmentados por género. Lo significativo de este ejemplo es que en esencia la gráfica es de barras, pero el toque innovador es el uso del billete de dólar para ilustrar los valores.

 

fuente: http://monachalabi.com/illustrations/

 

El hecho de que la visualización sea un arte y una ciencia implica un diseño imperfecto, una verdad a medias. No obstante, esto no es un disuasivo, si no una motivación para emprender en el juego creativo de sumar significado y especialmente participar en una conversación con otros.

 

Por Sofía Montenegro

Usando QGIS y OpenStreetMap (OSM) para mapear edificaciones

- el abril 1, 2019 en Tutoriales

En esta entrada utilizaremos en conjunto QGIS y OpenStreetMap para identificar edificaciones dentro de la franja de arena donde se encuentra la ciudad de Puntarenas, Costa Rica. Asumiremos que el ejercicio es parte de una cuantificación de futuros daños que podría sufrir la ciudad de Puntarenas dado al aumento del nivel del mar asociado al cambio climático y vendría a funcionar como un ejemplo de proyectos en los que el análisis de datos informa sobre los posibles daños del cambio climático.

Lee el resto de la entrada →

Creación de mapas en QGIS

- el abril 1, 2019 en Tutoriales

Esta entrada presenta una introducción general de cómo hacer mapas en QGIS. Pretende servir para incentivar el uso de QGIS en personas ajenas a los profesionales en Sistemas de Información Geográfica (SIG) y promover el uso de herramientas gratuitas de análisis de datos geográficos.

Lee el resto de la entrada →

Introducción a los formatos de datos espaciales

- el abril 1, 2019 en Tutoriales

En esta publicación estaremos hablando sobre los datos espaciales, sus características más importantes y ejemplos de tipos de información en que se utilizan. En la primera parte nos enfocaremos en generalidades sobre los tipos de datos espaciales, qué tipos existen y qué tipo de información guardan. En la segunda entraremos más en detalle sobre los distintos archivos más populares para guardar estos tipos de datos. Lee el resto de la entrada →

¿Qué son los sistemas de coordenadas cartográficas?

- el abril 1, 2019 en Uncategorized

¿Qué es lo que hay que considerar cuando queremos hacer un mapa? Te explicamos los sistemas de coordenadas cartográficas, cómo funcionan, qué sistemas de proyección existen y cómo influencian tus trabajos con geodatos.

Lee el resto de la entrada →

Haciendo mapas con ArcGIS en línea

- el octubre 12, 2017 en Guest posts, Tutoriales

Desde Bogotá D.C., Andrés Forero  , especialista en GIS y datos geográficos, nos envía este post como parte de una serie de tutoriales  sobre datos geográficos y cómo podemos aprovecharlos desde distintos software para su edición y publicación.

Lee el resto de la entrada →

Cómo crear un mapa 3D de Buenos Aires, Argentina

- el octubre 4, 2017 en Uncategorized

Por Nicolas Grossman y Bruno Salerno

Los mapas son excelentes herramientas para visualizar datos de una ciudad y compararlos entre zonas de la misma. Pero si además podemos graficar los edificios en tres dimensiones, la visualización resulta más impactante aún. En este tutorial contamos cómo realizamos el mapa que muestra los precios promedio del metro cuadrado en cada parcela de la ciudad de Buenos Aires (Argentina) y San Pablo (Brasil), con sus respectivos edificios en 3D.

Lee el resto de la entrada →

Del Storytelling al StoryMap: espacializando Datos Abiertos en Colombia

- el agosto 16, 2017 en Experiencias, Guest posts, Tutoriales

Desde Bogotá D.C., Andrés Forero  , especialista en GIS y datos geográficos, nos envía este post como una introducción a una serie tutorial sobre datos geográficos y cómo podemos aprovecharlos desde distintos softwares para su edición y publicación.

Bien sabemos la importancia de los datos en nuestra sociedad hoy en día; grandes empresas almacenan sobre una base de datos información que describe gustos, costumbres y actividades personales. Si tienes una sesión activa desde una cuenta Google o Microsoft y deseas buscar un vuelo que vaya desde Bogotá hasta Ciudad de México, es probable que aparezca en tu pantalla, minutos u horas después, promociones en diferentes aerolíneas para que salgas del país. Si abres Instagram y buscas como etiqueta #Tulúm o #Cartagena, el aplicativo probablemente te sugiera lugares para pasar vacaciones junto a la playa a través de un anuncio.

Los datos gubernamentales no son la excepción. Haz de cuenta que desde el momento en que empezaste a leer este artículo han robado a diez personas en tu ciudad. ¿Qué variables puedes analizar allí?

El mapa anterior muestra algunos delitos reportados en la ciudad de Cali, los cuales pueden ser consultados y descargados directamente desde el Portal de Datos Abiertos de Colombia.

Entender la información geográfica es una iniciativa que debe ir tomando forma y debe inculcarse desde a la sociedad civil hacia los tomadores de decisiones. Las oportunidades y debilidades que presenta un dato geográfico son las mismas que presenta esa tabla que necesitas para procesar en un software estadístico pero que es publicada como PDF.

Cuando pides un UBER, los puntos de partida y de llegada que estableces deben estar ligados a un sistema de coordenadas. La dirección que escribes debe estar estructurada y estandarizada para que pueda identificarse en el aplicativo.

Ahora, haz de cuenta que una persona llama a la policía para reportar el robo de sus pertenencias en Cali; conocer con exactitud el lugar donde sucedió el evento puede resultar en análisis espaciales robustos que permitan establecer la cobertura de patrullas de policía para atender áreas específicas o establecer programas que garanticen seguridad hacia la sociedad civil.

Hacer proyectos de este tipo no son para nada complejos, por el contrario, existen herramientas que facilitan el procesamiento de esta información ya sea desde software libre o software licenciado gratuito para desarrolladores y para usted, amigo datero. ¡Todos somos parte del cambio!

Aquí hay algunos recursos online para que puedas conocer las ventajas y desventajas asociadas con los Sistemas de Información Geográfica: QGIS como software libre brinda la posibilidad de utilizarlo gratuitamente desde cualquier computadora, aquí encuentras cómo puedes utilizarlo. Por otro lado, ArcGIS Online es una alternativa que permite realizar análisis en la nube únicamente creando una cuenta como desarrollador, la cual es gratuita. aquí encuentras cómo puedes utilizarlo.

Integrarlos puede ser útil. Por ejemplo, desde el escritorio puedo establecer cuáles son los campos que veré posteriormente sobre un mapa: ¿Necesito la fecha? ¿Necesito el nombre del delito? ¿Habrá que modificar la simbología? Estos procesamientos que pueden llegar a ser complejos para alguien quien inicia en el mundo SIG puede hacerlo desde QGIS. Teniendo establecido qué información quieres publicar, ArcGIS Online te permitirá visualizar este contenido desde la web y allí hacer análisis únicamente seleccionando qué deseas utilizar.

Imagen 1. Análisis en ArcGIS Online
Fuente: autoría propia.

 

Observemos este mapa

 

Agregando los delitos a la capa de comunas podemos establecer cuál de ellas presenta mayor criminalidad con un criterio de clasificación.

Este análisis es solo una introducción de qué se puede llegar a hacer y cómo podemos empezar a construir soluciones innovadoras bajo un contexto netamente espacial. Bienvenidos al infoactivismo geográfico.

¿Cómo elegir gráficos según las seis W del periodismo?

- el agosto 9, 2017 en Fuentes de datos, Guest posts

Screen_Shot_2017_08_09_at_1_44_48_PM

Este post es una contribución de Hassel Fallas, periodista costarricense basada en análisis de datos, quien lo escribió originalmente para su sitio La Data Cuenta. Escuela de Datos replica este y otros contenidos de La Data Cuenta con autorización de la autora.

 

 


Elegir el gráfico más apropiado para contar tu historia con datos es una de las decisiones más cuidadosas que como periodista debes enfrentar.

¿Por qué? Simplemente  los gráficos no son accesorios para que un artículo se vea “más lindo”. Si los gráficos no cuentan una historia en sí mismos, sino son claros, comprensibles, usables, capaces de informar y de generar conocimiento- de un vistazo- los convertirás en una pérdida de tiempo y de espacio.

Tampoco los puedes seleccionar basándote en tu gusto personal y criterios estéticos, aconseja Alberto Cairo en su libro El arte funcional.

Una de las mejores formas de elegirlos es aplicando la lógica de las 6 W, las mismas que aprendiste desde el inicio de tu carrera para darle estructura a una noticia.

Esa es la idea de Fréderik Ruys, diseñador y periodista basado en análisis de datos en Holanda, quien creó este sistema que llama Taxonomía del infográfico, una combinación de preguntas básicas y la forma más recomendable de responderlas de manera visual.

Su infografía ha sido de tanta utilidad en mi trabajo como periodista de datos que la traduje al español-muy libremente- para quienes deseen emplearla como material de consulta.

Taxonomi_a_de_visualizacio_n

La puedes descargar en PDF aquí

Si te es útil, ¡compártela!