Daniel Villatoro – Escuela De Datos http://es.schoolofdata.org evidencia es poder Sun, 25 Mar 2018 15:39:12 +0000 es hourly 1 https://wordpress.org/?v=5.3.2 114974193 Los dos caras de los datos: la plática y la práctica. Así las vivimos en el Festival Guatemalteco de Gobierno Abierto http://es.schoolofdata.org/2017/11/17/los-dos-caras-de-los-datos-la-platica-y-la-practica-asi-las-vivimos-en-el-festival-guatemalteco-de-gobierno-abierto/ http://es.schoolofdata.org/2017/11/17/los-dos-caras-de-los-datos-la-platica-y-la-practica-asi-las-vivimos-en-el-festival-guatemalteco-de-gobierno-abierto/#respond Fri, 17 Nov 2017 19:55:37 +0000 http://es.schoolofdata.org/?p=2354 Durante dos días, autoridades, miembros de organizaciones sociales, periodistas y académicos se reunieron para hablar sobre un tema: cómo Guatemala puede ser un Estado más abierto. El 7 y 8 de noviembre Escuela De Datos se unió a este esfuerzo para llevar esas ideas a la práctica.

En un espacio dinámico para compartir experiencias, ideas e iniciativas realizamos dos expediciones de datos con toques un poco diferentes. La primera estaba enfocada a la visualización. Llevamos al espacio físico ideas abstractas y tablas de datos que suelen estar poco accesibles cuando no son llevadas a lo visual. La segunda estaba enfocada al análisis a través de programación y código.


Ambos grupos trabajaron con datos del programa Monitoreo Ciudadano que Hivos realiza en la prevención y atención de grupos vulnerables a la epidemia del VIH.

La plática

Para empezar el Visualizatón, hablamos sobre cómo visualizar información implica apuntar con un dardo a un propósito.  “Visualizamos datos porque esto nos permite explicar mejor, reducir el esfuerzo cognitivo y facilitar la generación de conocimiento” fueron los mensajes claves de una primera charla que yo guié.

Luego, Sergio Araiza (México) nos acompañó para hablar sobre las narrativas y cómo la difusión de datos clave se puede nutrir con el uso de símbolos, contrastes e imágenes que nos hagan “ver la historia que los datos cuentan de una manera tan fácil y directa como una fotografía”.

La práctica

Luego de dividirse en los dos grupos, llegó la hora de trabajar.

 

Al primer grupo le esperaba una mesa llena de cartulina, estampas, marcadores y otros materiales que les permitiría llevar a lo físico esas ideas que estuvieron desarrollando a lo individual. Eran aproximadamente 60 personas entre las cuales habían trabajadores municipales invitados al evento por el Instituto Republicano Internacional, estudiantes universitarios y personas poco familiarizadas con el uso de datos.

Al segundo grupo lo esperaban mesas y conexiones para que llegaran con sus computadoras a trabajar y seguir la serie de ejercicios y retos que les tenían preparados. Partiendo de la misma información, esta sesión estaba enfocada en analizar estos datos pero utilizando código y fue liderada por Sebastián Oliva, programador y fellow de Escuela, junto al cientista de datos especializado en salud, Kevin Folgar.

Con un grupo de programadores y cientistas sociales que sabían usar código, Sebastian y Kevin repasaron cómo funcionan los tipos de datos y cómo manipularlos a través de Python.

Para ello utilizaron Pandas —la librería que permite operar y analizar tablas numéricas y series de tiempo— y los Notebooks de Jupyter —que permiten escribir, correr, combinar y republicar código—.

Con estas habilidades lograron hacer ejercicios en los que agruparon y filtraron los datos del programa de monitoreo en salud  para también generar cálculos a través de tablas dinámicas.

Los resultados

Lo que queríamos lograr con el Visualizatón era que los usuarios poco acostumbrados a manejar datos perdieran el miedo, analizaran de qué manera enfocar la información y la pudieran plasmar de una manera creativa para luego explicarle al grupo un detalle o una situación particular de este conjunto de datos.

Al segundo grupo lo esperaban mesas y conexiones para que llegaran con sus computadoras a trabajar y seguir la serie de ejercicios y retos que les tenían preparados. Partiendo de la misma información, esta sesión estaba enfocada en analizar estos datos pero utilizando código y fue liderada por Sebastián Oliva, programador y fellow de Escuela, junto al cientista de datos especializado en salud, Kevin Folgar.

Con un grupo de programadores y cientistas sociales que sabían usar código, Sebastian y Kevin repasaron cómo funcionan los tipos de datos y cómo manipularlos a través de Python.

Para ello utilizaron Pandas —la librería que permite operar y analizar tablas numéricas y series de tiempo— y los Notebooks de Jupyter —que permiten escribir, correr, combinar y republicar código—.

Con estas habilidades lograron hacer ejercicios en los que agruparon y filtraron los datos del programa de monitoreo en salud  para también generar cálculos a través de tablas dinámicas.

Los resultados

Lo que queríamos lograr con el Visualizatón era que los usuarios poco acostumbrados a manejar datos perdieran el miedo, analizaran de qué manera enfocar la información y la pudieran plasmar de una manera creativa para luego explicarle al grupo un detalle o una situación particular de este conjunto de datos.

Aunque el segundo grupo estaba mucho más familiarizado al análisis de datos, no conocían muchas de las funciones que el lenguaje Python nos permite construir. Entre todos fueron siguiendo los ejercicios, conociendo las librerías y evaluando en qué ocasiones cierto código soluciona los problemas que encontramos en cualquiera de los pasos del Data Pipeline.

Sobre el festival de Gobierno Abierto

Esta fue la primera edición del Festival de Gobierno Abierto en Guatemala. Escuela de Datos se unió a este esfuerzo en otras actividades también y a lo largo del Festival participamos en distintas mesas y charlas.

Sergio Araiza moderó un conversatorio sobre cómo el periodismo se ha vuelto más colaborativo e involucra a otros actores para compartir métodos, datos y verificaciones. A él se le unieron dos de los cuatro proyectos que la fellowship de Escuela de Datos en este año ha asesorado para aplicar el Open Contracting Standard. “La colaboración, los datos abiertos y la tecnología permiten intercambiar conocimiento que mejore los procesos y niveles de investigación desde los medios de comunicación en el mundo digital” fue una de las conclusiones”.

Por la noche, los becados al festival de otros municipios y algunos de El Salvador y Honduras pudieron tener una plática más abierta sobre tecnología cívica y de qué manera su uso puede ayudarles a solventar los problemas que afligen a sus ciudadanos.
Aprovechamos la oportunidad para recordarles a todos que existen los “10 mandamientos del Open Data” y hubo siempre una oportunidad para aprender en medio de las bromas del #OpenDataJesus. Y para cerrar, aprovechamos que en el festival también estaba otro personaje, el #OpenGovJedi para predicar a todas las galaxias que los datos tienen un rol importante para transparentar la gestión pública y fortalecer la participación de los ciudadanos en sus instituciones.

Este evento fue organizado por los proyectos Munis Abiertas y Congreso Transparente, con el apoyo de la DW Akademie, quienes nos invitaron e incluyeron en la agenda. Para saber más sobre todas las actividades que esta maratón de Gobierno Abierto incluyó puedes seguir el hashtag #FGA en twitter.

 

Flattr this!

]]>
http://es.schoolofdata.org/2017/11/17/los-dos-caras-de-los-datos-la-platica-y-la-practica-asi-las-vivimos-en-el-festival-guatemalteco-de-gobierno-abierto/feed/ 0 2354
Combinando bases de datos con Tableau Public de manera automática http://es.schoolofdata.org/2016/10/24/combinando-bases-de-datos-con-tableau-public-de-manera-automatica/ http://es.schoolofdata.org/2016/10/24/combinando-bases-de-datos-con-tableau-public-de-manera-automatica/#respond Mon, 24 Oct 2016 20:15:57 +0000 https://es.schoolofdata.org/?p=1837 En ocasiones, tenemos dos o más bases de datos que queremos combinar por un factor común. El uso de datos es más efectivo cuando puedes combinar varias bases de datos y ver cómo se relacionan entre ellas. Tableau Public es un programa que nos permite hacer esto de manera sencilla. En este tutorial veremos cómo hacerlo.

Al combinar datos de manera automática te ahorras el tedioso trabajo de tener que emparejar de manera manual dos o varios set de datos.

Al combinar datos de manera automática te ahorras el tedioso trabajo de tener que emparejar de manera manual dos o varios set de datos.

 

  • Instala el programa

 

Este programa gratuito te permite importar tus datos para crear visualizaciones interactivas. Todo tu trabajo se guarda en tu usuario y se puede compartir a través de códigos embed o iframes. Otra ventaja es que el programa está disponible para los sistemas operativos Windows y Mac. Para descargar la aplicación, entra en este link y sigue las instrucciones que el instalador te señala.

2) Asegúrate de que tus datos compartan un denominador común

Cuando quieres unir bases de datos debes asegurarte de que ambas compartan algún campo que vincule los dos sets de datos. Por ejemplo, si tienes dos set de datos sobre los países de Latinoamérica, tu denominador común puede ser el nombre del país. O si tienes datos sobre denuncias y delitos de los partidos políticos, el denominador común puede ser el nombre o las siglas del partido.

3) Repasa la teoría de los conjuntos

Tableau Public te permite realizar dos tipos de combinaciones.

La primera, es una unión interior.

image00

 

 

 

 

En este tipo de unión, sólo se copiaran los datos en los que el denominador común de ambas fuentes de datos coincida. Por ejemplo, si tenemos un set de datos sobre alfabetización en  todos los países del mundo y lo combinamos con datos sobre el acceso a la educación primaria en los países de Latinoamérica, nuestra base de datos combinada solo mostrará los datos de los países de Latinoamérica.

La segunda, es una unión izquierda.

image01

 

 

 

 

En este tipo de unión, se copiarán todos los datos de tu primera fuente de datos y sólo se agregarán los datos de la segunda fuente cuando estos coincidan en denominador común. Las filas que no tengan coincidencias se mostrarán como valores nulos. Siguiendo nuestro ejemplo, nuestra base de datos combinada mostraría los datos de alfabetización de todos los países del mundo, pero aquellos que no forman parte de Latinoamérica no contarían con datos sobre el acceso a educación primaria.

4) Abre el programa y conecta tu primera fuente de datos

Al iniciar, el programa te invita a conectar a un archivo de base de datos, que puede ser en formatos Excel (xls, xlsx), Archivos de texto (csv) o Access. Selecciona tu primer set de datos. En nuestro ejemplo, sería el archivo con el porcentaje de alfabetización de todos los países del mundo.

image03

 

 

 

 

5) Añade tu segunda fuente de datos

Haz click en la palabra añadir y agrega una segunda base de datos. En nuestro ejemplo, es el archivo con el porcentaje de acceso a la educación primaria en los países latinoamericanos.

image05

 

 

 

 

6) Arrastra ambos sets de datos y conéctalos

Al arrastrar las diferentes hojas de cálculo a la pantalla de Tableau Public, el programa te mostrará la relación que estás creando entre ambas bases de datos y te dará una muestra de cómo luce tu conexión de datos.

image06

 

 

 

 

7) Edita la conexión

Haz click en los dos círculos unidos que se muestran entre tus fuentes de datos para abrir una ventana de edición de tu unión. En esta pestaña debes de decidir si quieres una combinación interior o una combinación izquierda. También debes de indicar cuál es la categoría en tus fuentes de datos que coincide o es igual en ambas. En este caso, seleccionamos el campo Country (País) para que combine los datos de cada país de manera automática.

image04

 

 

 

 

Siguiendo el ejemplo, si decides hacer una conexión interior, la combinación de estas dos bases de datos sólo te mostraria 42 filas con los datos de alfabetización y acceso a educación primaria de los 42 países de Latinoamérica y el Caribe.

En cambio, si eliges una conexión izquierda, el set de datos resultante te mostraría 254 filas con los nombres de todos los países del mundo y sus datos sobre alfabetización, pero los datos sobre acceso a educación primaria solo estarían en los países latinoamericanos. El resto de países tendría un valor nulo en esta categoría.

Durante todo el proceso, Tableau Public te muestra una previsualización de cómo se ve tu set de datos combinado debajo de la sección en la que editas las uniones.

8) Copiar y guardar.

Selecciona todas las filas y columnas de tu base de datos combinada haciendo click en la esquina superior izquierda de la previsualización que te muestra el programa. Copia el contenido con la combinación Ctrl+C o ⌘+C,  pégalo en el editor de hojas de cálculo de tu preferencia y guárdalo.

Así, de manera sencilla, puedes combinar bases de datos con muchos campos y sin tener que prestar atención y copiar manualmente las coincidencias. Esta práctica es de mucha utilidad cuando quieres combinar diferentes estadísticas sobre varios lugares, o cuando quieres combinar una base de datos con datos georeferenciales con una que contenga estadísticas.

La combinación izquierda te puede servir para identificar valores que coincidan entre dos bases de datos. Esto es de mucha utilidad cuando estás creando hipótesis para investigaciones o quieres comprobar relaciones entre listados de personas o entidades.

Flattr this!

]]>
http://es.schoolofdata.org/2016/10/24/combinando-bases-de-datos-con-tableau-public-de-manera-automatica/feed/ 0 1837
Fact-checking: la fiebre que se contagia por toda Latinoamérica http://es.schoolofdata.org/2016/07/19/fact-checking-la-fiebre-que-se-contagia-por-toda-latinoamerica/ http://es.schoolofdata.org/2016/07/19/fact-checking-la-fiebre-que-se-contagia-por-toda-latinoamerica/#respond Tue, 19 Jul 2016 14:22:57 +0000 https://es.schoolofdata.org/?p=1685 Ves a un político dando un discurso. “Está mintiendo”, te dices. Y allí se queda. Muchos políticos mienten, pero muchas veces los medios no se esfuerzan lo suficiente por comprobar si lo que una fuente de información dice es verdad o no. Es allí donde la comprobación de datos o fact checking entra al juego. Verificar que lo que se dice en el discurso público tenga credibilidad es una manera de hacer que las figuras públicas rindan cuentas. Lo mejor es que en los últimos años ha surgido un boom en la aplicación de estos principios a la realidad latinoamericana.

Existen iniciativas que se dedican a eso, a tomar de lo que se discute en los medios y comprobar la veracidad de lo que se dice a través de los datos disponibles. Uno de los grandes “culpables” de este boom latinoamericano por el fact-checking es Chequeado, un medio que busca mejorar el debate público que suele basarse en prejuicios, ideologías e intereses y no en datos y hechos. Lo hace verificando las declaraciones de personas públicas -como políticos, economistas o empresarios-, medios de comunicación y otras instituciones. Clasifican esos dichos como “verdadero” o “falso, con base en los hechos y datos que encuentran.
Este medio definió una serie de pasos que busca seguir en cada ocasión, y los compartió en muchas capacitaciones y talleres, lo que desencadenó el surgimiento de otros proyectos de chequeo en medios tradicionales y alternativos en América Latina.

Otros proyectos surgieron por su cuenta, pero ahora podemos conocer al menos 17 iniciativas de verificación del discurso público en 10 países de Latinoamérica.

La metodología que Chequeado estableció consiste en una serie de ocho pasos que culmina al brindarle a la frase una calificación en base a lo que se pudo comprobar, la cual varía desde verdadero hasta falso y todos los grises enmedio que se puedan preestablecer.

  1. Seleccionar una frase del ámbito público que sea verificable (Datos, no opiniones).
  2. Ponderar su relevancia, ya sea por el tema o por quién la dijo.
  3. Consultar a la fuente original, a la persona o institución que la dijo
  4. Consultar a la fuente oficial, aquella institución gubernamental que se encarga del tema y debería tener datos relacionados.
  5. Consultar a fuentes alternativas, como organizaciones sociales, centros de investigación y la academia.
  6. Ubicar la frase en su contexto
  7. Confirmar, relativizar o desmentir la afirmación que se seleccionó
  8. Calificar la declaración con una etiqueta que varía entre verdadero y falso.

50 sombras de la verdad

¿Existe una verdad a medias? ¿Y si digo la verdad, pero en un contexto engañoso? Por todas estos y otros problemas con la verificación de la veracidad en lo que alguien dice, las clasificaciones varían mucho, dependiendo de quien verifica. Chequeado estableció nueve grados para sus chequeos que van así: verdadero; verdadero +; verdadero, pero…; discutible, apresurado, exagerado, engañoso, insostenible y falso. Existen ocasiones en las que más de una calificación se podría aplicar.

Las clasificaciones expresan la conclusión a la que llegan los periodistas los sitios de fact-checking sobre la veracidad de los dichos en el ámbito social.

Según el recuento de los sitios latinoamericanos de chequeo que mencionamos, cada uno elige la manera de calificar que se acomode mejor en sus capacidades y en la manera en que quiere comunicarse con su público. Usando lenguaje popular o la misma identidad del medio, vemos como la verificación de datos siendo aplicada de maneras creativas.

Fact2

Las clasificaciones de La Casaquera, Politígrafo, Preto no Branco, Truco, El Sabueso, El Polígrafo, UY Check y Conpruebas

Un show en vivo

Los discursos de los presidenciables son la excusa perfecta para que a la verificación de datos se le añada la emoción por la inmediatez. En Costa Rica, el periódico Nación verificó en vivo el mensaje anual del presidente Luis Guillermo Solís en un especial que mostraba a tiempo real las verificaciones que se lograban comprobar, minuto a minuto.

Y por varios años, Chequeado ha invitado a que cualquier persona contribuya a su chequeo de los discursos presidenciales y puso a funcionar un portal para los chequeos en vivo, como puedes ver en este vídeo.

Si encontraste algún proyecto de verificación de datos en tu país, ¿por qué no pruebas contribuir enviándole una frase para que chequeen?
*¿Conoces una iniciativa latinoamericana de fact-checking que no hayamos mencionado? Mándanos un tuit con información sobre ella. Puedes encontrarme como @danyvillatoro y asegúrate de incluir a @EscuelaDeDatos para que podamos agregarla al mapa.

 

 

 

Flattr this!

]]>
http://es.schoolofdata.org/2016/07/19/fact-checking-la-fiebre-que-se-contagia-por-toda-latinoamerica/feed/ 0 1685