Estás navegando por el archivo de Daniel Villatoro.

Los dos caras de los datos: la plática y la práctica. Así las vivimos en el Festival Guatemalteco de Gobierno Abierto

- el noviembre 17, 2017 en Expediciones de Datos, Experiencias, Noticias

Durante dos días, autoridades, miembros de organizaciones sociales, periodistas y académicos se reunieron para hablar sobre un tema: cómo Guatemala puede ser un Estado más abierto. El 7 y 8 de noviembre Escuela De Datos se unió a este esfuerzo para llevar esas ideas a la práctica.

En un espacio dinámico para compartir experiencias, ideas e iniciativas realizamos dos expediciones de datos con toques un poco diferentes. La primera estaba enfocada a la visualización. Llevamos al espacio físico ideas abstractas y tablas de datos que suelen estar poco accesibles cuando no son llevadas a lo visual. La segunda estaba enfocada al análisis a través de programación y código.

Lee el resto de la entrada →

Combinando bases de datos con Tableau Public de manera automática

- el octubre 24, 2016 en Tutoriales

En ocasiones, tenemos dos o más bases de datos que queremos combinar por un factor común. El uso de datos es más efectivo cuando puedes combinar varias bases de datos y ver cómo se relacionan entre ellas. Tableau Public es un programa que nos permite hacer esto de manera sencilla. En este tutorial veremos cómo hacerlo.

Al combinar datos de manera automática te ahorras el tedioso trabajo de tener que emparejar de manera manual dos o varios set de datos.

Al combinar datos de manera automática te ahorras el tedioso trabajo de tener que emparejar de manera manual dos o varios set de datos.

 

  • Instala el programa

 

Este programa gratuito te permite importar tus datos para crear visualizaciones interactivas. Todo tu trabajo se guarda en tu usuario y se puede compartir a través de códigos embed o iframes. Otra ventaja es que el programa está disponible para los sistemas operativos Windows y Mac. Para descargar la aplicación, entra en este link y sigue las instrucciones que el instalador te señala.

2) Asegúrate de que tus datos compartan un denominador común

Cuando quieres unir bases de datos debes asegurarte de que ambas compartan algún campo que vincule los dos sets de datos. Por ejemplo, si tienes dos set de datos sobre los países de Latinoamérica, tu denominador común puede ser el nombre del país. O si tienes datos sobre denuncias y delitos de los partidos políticos, el denominador común puede ser el nombre o las siglas del partido.

3) Repasa la teoría de los conjuntos

Tableau Public te permite realizar dos tipos de combinaciones.

La primera, es una unión interior.

image00

 

 

 

 

En este tipo de unión, sólo se copiaran los datos en los que el denominador común de ambas fuentes de datos coincida. Por ejemplo, si tenemos un set de datos sobre alfabetización en  todos los países del mundo y lo combinamos con datos sobre el acceso a la educación primaria en los países de Latinoamérica, nuestra base de datos combinada solo mostrará los datos de los países de Latinoamérica.

La segunda, es una unión izquierda.

image01

 

 

 

 

En este tipo de unión, se copiarán todos los datos de tu primera fuente de datos y sólo se agregarán los datos de la segunda fuente cuando estos coincidan en denominador común. Las filas que no tengan coincidencias se mostrarán como valores nulos. Siguiendo nuestro ejemplo, nuestra base de datos combinada mostraría los datos de alfabetización de todos los países del mundo, pero aquellos que no forman parte de Latinoamérica no contarían con datos sobre el acceso a educación primaria.

4) Abre el programa y conecta tu primera fuente de datos

Al iniciar, el programa te invita a conectar a un archivo de base de datos, que puede ser en formatos Excel (xls, xlsx), Archivos de texto (csv) o Access. Selecciona tu primer set de datos. En nuestro ejemplo, sería el archivo con el porcentaje de alfabetización de todos los países del mundo.

image03

 

 

 

 

5) Añade tu segunda fuente de datos

Haz click en la palabra añadir y agrega una segunda base de datos. En nuestro ejemplo, es el archivo con el porcentaje de acceso a la educación primaria en los países latinoamericanos.

image05

 

 

 

 

6) Arrastra ambos sets de datos y conéctalos

Al arrastrar las diferentes hojas de cálculo a la pantalla de Tableau Public, el programa te mostrará la relación que estás creando entre ambas bases de datos y te dará una muestra de cómo luce tu conexión de datos.

image06

 

 

 

 

7) Edita la conexión

Haz click en los dos círculos unidos que se muestran entre tus fuentes de datos para abrir una ventana de edición de tu unión. En esta pestaña debes de decidir si quieres una combinación interior o una combinación izquierda. También debes de indicar cuál es la categoría en tus fuentes de datos que coincide o es igual en ambas. En este caso, seleccionamos el campo Country (País) para que combine los datos de cada país de manera automática.

image04

 

 

 

 

Siguiendo el ejemplo, si decides hacer una conexión interior, la combinación de estas dos bases de datos sólo te mostraria 42 filas con los datos de alfabetización y acceso a educación primaria de los 42 países de Latinoamérica y el Caribe.

En cambio, si eliges una conexión izquierda, el set de datos resultante te mostraría 254 filas con los nombres de todos los países del mundo y sus datos sobre alfabetización, pero los datos sobre acceso a educación primaria solo estarían en los países latinoamericanos. El resto de países tendría un valor nulo en esta categoría.

Durante todo el proceso, Tableau Public te muestra una previsualización de cómo se ve tu set de datos combinado debajo de la sección en la que editas las uniones.

8) Copiar y guardar.

Selecciona todas las filas y columnas de tu base de datos combinada haciendo click en la esquina superior izquierda de la previsualización que te muestra el programa. Copia el contenido con la combinación Ctrl+C o ⌘+C,  pégalo en el editor de hojas de cálculo de tu preferencia y guárdalo.

Así, de manera sencilla, puedes combinar bases de datos con muchos campos y sin tener que prestar atención y copiar manualmente las coincidencias. Esta práctica es de mucha utilidad cuando quieres combinar diferentes estadísticas sobre varios lugares, o cuando quieres combinar una base de datos con datos georeferenciales con una que contenga estadísticas.

La combinación izquierda te puede servir para identificar valores que coincidan entre dos bases de datos. Esto es de mucha utilidad cuando estás creando hipótesis para investigaciones o quieres comprobar relaciones entre listados de personas o entidades.

Fact-checking: la fiebre que se contagia por toda Latinoamérica

- el julio 19, 2016 en Experiencias, Fuentes de datos, Uncategorized

Ves a un político dando un discurso. “Está mintiendo”, te dices. Y allí se queda. Muchos políticos mienten, pero muchas veces los medios no se esfuerzan lo suficiente por comprobar si lo que una fuente de información dice es verdad o no. Es allí donde la comprobación de datos o fact checking entra al juego. Verificar que lo que se dice en el discurso público tenga credibilidad es una manera de hacer que las figuras públicas rindan cuentas. Lo mejor es que en los últimos años ha surgido un boom en la aplicación de estos principios a la realidad latinoamericana.

Existen iniciativas que se dedican a eso, a tomar de lo que se discute en los medios y comprobar la veracidad de lo que se dice a través de los datos disponibles. Uno de los grandes “culpables” de este boom latinoamericano por el fact-checking es Chequeado, un medio que busca mejorar el debate público que suele basarse en prejuicios, ideologías e intereses y no en datos y hechos. Lo hace verificando las declaraciones de personas públicas -como políticos, economistas o empresarios-, medios de comunicación y otras instituciones. Clasifican esos dichos como “verdadero” o “falso, con base en los hechos y datos que encuentran.
Este medio definió una serie de pasos que busca seguir en cada ocasión, y los compartió en muchas capacitaciones y talleres, lo que desencadenó el surgimiento de otros proyectos de chequeo en medios tradicionales y alternativos en América Latina.

Otros proyectos surgieron por su cuenta, pero ahora podemos conocer al menos 17 iniciativas de verificación del discurso público en 10 países de Latinoamérica.

La metodología que Chequeado estableció consiste en una serie de ocho pasos que culmina al brindarle a la frase una calificación en base a lo que se pudo comprobar, la cual varía desde verdadero hasta falso y todos los grises enmedio que se puedan preestablecer.

  1. Seleccionar una frase del ámbito público que sea verificable (Datos, no opiniones).
  2. Ponderar su relevancia, ya sea por el tema o por quién la dijo.
  3. Consultar a la fuente original, a la persona o institución que la dijo
  4. Consultar a la fuente oficial, aquella institución gubernamental que se encarga del tema y debería tener datos relacionados.
  5. Consultar a fuentes alternativas, como organizaciones sociales, centros de investigación y la academia.
  6. Ubicar la frase en su contexto
  7. Confirmar, relativizar o desmentir la afirmación que se seleccionó
  8. Calificar la declaración con una etiqueta que varía entre verdadero y falso.

50 sombras de la verdad

¿Existe una verdad a medias? ¿Y si digo la verdad, pero en un contexto engañoso? Por todas estos y otros problemas con la verificación de la veracidad en lo que alguien dice, las clasificaciones varían mucho, dependiendo de quien verifica. Chequeado estableció nueve grados para sus chequeos que van así: verdadero; verdadero +; verdadero, pero…; discutible, apresurado, exagerado, engañoso, insostenible y falso. Existen ocasiones en las que más de una calificación se podría aplicar.

Las clasificaciones expresan la conclusión a la que llegan los periodistas los sitios de fact-checking sobre la veracidad de los dichos en el ámbito social.

Según el recuento de los sitios latinoamericanos de chequeo que mencionamos, cada uno elige la manera de calificar que se acomode mejor en sus capacidades y en la manera en que quiere comunicarse con su público. Usando lenguaje popular o la misma identidad del medio, vemos como la verificación de datos siendo aplicada de maneras creativas.

Fact2

Las clasificaciones de La Casaquera, Politígrafo, Preto no Branco, Truco, El Sabueso, El Polígrafo, UY Check y Conpruebas

Un show en vivo

Los discursos de los presidenciables son la excusa perfecta para que a la verificación de datos se le añada la emoción por la inmediatez. En Costa Rica, el periódico Nación verificó en vivo el mensaje anual del presidente Luis Guillermo Solís en un especial que mostraba a tiempo real las verificaciones que se lograban comprobar, minuto a minuto.

Y por varios años, Chequeado ha invitado a que cualquier persona contribuya a su chequeo de los discursos presidenciales y puso a funcionar un portal para los chequeos en vivo, como puedes ver en este vídeo.

Si encontraste algún proyecto de verificación de datos en tu país, ¿por qué no pruebas contribuir enviándole una frase para que chequeen?
*¿Conoces una iniciativa latinoamericana de fact-checking que no hayamos mencionado? Mándanos un tuit con información sobre ella. Puedes encontrarme como @danyvillatoro y asegúrate de incluir a @EscuelaDeDatos para que podamos agregarla al mapa.