Estás navegando por el archivo de Experiencias.

Continúa el mapeo de vías y necesidades en México

Marcos Ge - el septiembre 27, 2017 en Experiencias, Fuentes de datos, Noticias, Uncategorized

CC atribución, compartir igual. By Patricia Curiel

 

 

 

 

 

 

 

El flujo de ayuda proveniente de la desbordante salida de la población a las calles de la Ciudad de México tras el terremoto del 19 de septiembre, población que dejó centros de trabajo y hogares propios para auxiliar a otros, se convierte también en un flujo de información que es necesario organizar para garantizar que la ayude llegue donde se requiere.

Miles de voluntarixs, con pico, pala y casco, pero también con alimentos, vendas, jeringas y otros materiales médicos llegaron a hacer fila para remover escombros o aliviar necesidades básicas de la población a cada uno de los más de 40 derrumbes en la ciudad.  Siguen llegando, aunque ahora con menos frecuencia, olas voluntarias que en en un principio hacían fila para llevar alimentos a centros de acopio rebasados, o que ya no podían almacenar el suficiente tiempo alimentos percederos. Esta fuerza política enfocada en la ayuda al otro irá languideciendo conforme pasen los días, a menos que hagamos un esfuerzo por lo contrario.

Aquí encuentras las fuentes y salidas de datos para el alivio de los terremotos del 7 y 19 de septiembre en México, y que afectaron principalmente a los estados de Chiapas, Oaxaca, Puebla, Morelos, Estado de México y Ciudad de México.

OSM México

         Desde el 9 de septiembre, un equipo liderado por Miriam González, Celine Jacquin, Edgar Lemus y al que se sumaron pronto Sandra Hernández y Vianney Pars, así como activistas ligadas a Openstreetmap México, iniciaron el trabajo de digitalizar la primera capa de información crucial para facilitar llegada de alivio humanitario a zonas de desastre: las vías de comunicación y edificios derrumbados.

Pero del más reciente terremoto sólo hay cuatro tareas completas de cartografía al 100%: la de Axochiapan, Morelos, y Atlixco, Atzitzihuacán y Atzala, en el estado de Puebla; mientras que faltan otras ocho tareas de mapeo relacionadas con el más reciente terremoto y otras tantas tareas de validación de esos mismos mapeos.

Existen dos formas de cartografía básicos, en sitio y remoto. Para sumarte al mapeo y validación, puedes ver esta capacitación que grabó Miriam en los días posteriores al sismo del 19 de septiembre.

En cuanto a la visualización de los datos que mapea OSM y su equipo de decenas de voluntarixs, el esfuerzo más comprensivo de agregación de datos lo llevó a cabo Leonel Castañeda , quien publica http://mapa.sismomexico.org/  gracias al trabajo de “deploy” que facilitó Codeando México, plataforma que agrega y visualiza datos no sólo de OSM, sino de las siguientes plataformas.

  • Manos a la obra, la plataforma más actualizada de ofertas y publicación de necesidades de ayuda, y que por defecto ofrece de una manera clara la descarga de su base de datos. Ojo: esta fuente de datos se actualiza en el sitio de manos a la obra, pero las capas que aparecen en mapasismomexico, por alguna razón no están actualizadas.
  • Mapillary, que es una herramienta muy usada en la cartografía para openstreetmap, pues permite subir a los servidores de esta organización fotografías y reportes de manera intuitiva
  • Verificado19s, un grupo de voluntarias y voluntarios que verifica las necesidades publicadas en redes sociales a partir de llamadas telefónicas y publica anuncios verificados.

En el grupo de trabajo se creó un subgrupo de depuración de datos, cuyo papel fue homologar en una base destino las bases heterogéneas que existen, con un proceso de limpieza de datos geográficos en el proceso.

Los grupos de pobladores autónomos y activistas críticos de los efectos del dominio del Estado mexicano y sus instituciones, así como de empresas y asociaciones alineadas con este,  pueden usar también plataformas creadas y gestionadas con software libre para reunir datos de centros de acopio y daños en inmueble. Un ejemplo de esta opción es solidaridat.mx.

Es necesario indicar que esta última realiza una labor exclusivamente de registro, no de vinculación inmediata con especialistas estructuralistas, como sí hace salvatucasa.mx, quienes acercan los reportes a estos expertos para la revisión de los inmuebles.

¿De qué fueron los Datos y Chiliguaros en #Abrelatam-Condatos17?

Daniel Villatoro - el agosto 30, 2017 en Experiencias, Noticias

En el contexto de Abrelatam-Condatos17, los eventos de formación de comunidad son extremadamente relevante. El más exitoso de ellos en la región, Datos y Tragos, se realizó una vez más en la capital de Costa Rica el jueves 24 de agosto, organizado por Socialtic y en colaboración con Impact Hb Sna José, Manatí, Open Knowledge y, claro, Escuela de Datos.

Conoce aquí algunos de los proyectos que se presentaron.

⏺Ojo Público – Comic “La guerra por el agua” (Perú)

Este cómic interactivo cuenta la historia del conflicto por el acceso al agua y la proyección del ambiente cuando llegan proyectos mineros de grande escala a pueblos de Perú.
Se nutre de una  base de datos sobre privilegios fiscales en ese país, en diferentes industrias por 10 años.
El cómic guia al lector a traves de historias graficas en donde ve, oye y lee sobre los problemas

⏺Transparencia Presupuestaria – Observatorio del Gasto ( México)

<iframe width=”560″ height=”315″ src=”https://www.youtube.com/embed/xW-OvRSYESo” frameborder=”0″ allowfullscreen></iframe>

Esta plataforma te muestra más de 600 programas de gobierno, los proyectos que se estan ejecutando en físico y en pagos.
A través de mapas muestran todos los proyectos en desarrollo en México

Hicieron un Rally de Datos en la calle en el que las personas podian usar el mapa para seguir los diferentes proyectos en su localidad. Durante el OpenDataDay las personas visualizaron, visitaron y conocieron los proyectos en su comunidad.

Además hicieron un curso online masivo sobre ¿Cómo entender el presupuesto?

⏺DataUY – Dónde reciclo (Uruguay)
Es un mapa que muestra donde estan todos los puntos de reciclaje en Montevideo con información sobre los programas y

Lo revolucionario fue que este proyecto voluntario género interés de la cámara de la industria trabaja con reciclaje patrocinó este proyecto y se interesó en invertir en él.

⏺40 Municipios bajo la lupa – Ojo Con Mi Pisto (Guatemala

Una colección de fichas sobre los datos sobre los integrantes de 40 concejos municipales

Incluye un buscador de denuncias y fichas con el historial de los 500+ funcionarios

Entre los hallazgos de las investigaciones, 8 de cada 10 alcaldes tienen algun tipo de antecedente en la contraloria, servicios de contratacion, sanciones, denuncias y otros problemas en la administración pública.

⏺Indice de Progreso Social — Estudio Manatí (Costa Rica)

El diseño de experiencia de usuario de este estudio costarricense permitio mostrar de una manera practica indicadores sobre como un país suple las necesidades de sus ciudadanos

Entrevistaron a usuarios potenciales de estos indices para construir una plataforma que genera visualizaciones como: Mapas cloropetos, una tabla de puntaje de cada país clasificada por color y poder comparar los datos entre paises.

Socialprogressindex.com

⏺ Japiqay.pe — Asociación civil Japiqay (Perú)
El proyecto se resume en recuperar la memoria sobre las investigaciones de corrupción en los ultimos 40 años.
Desde 1980 (la etapa democrática) esta organización ha recuperado documentos oficiales, certificaciones y otros registros sobre malas prácticas.
Recupera los trabajos de investigación en el Congreso, la Contraloria y el Poder Judicial ademas de nombrar que de los miles de investigados muy pocos han sido procesados o sentenciados y se reciclan facilmente en el sistema de administración pública.
Funciona como un repositorio de pruebas e historial de delitos.

⏺El desafío de data, fiscalidad y desigualdad — Oxfam (Latinoamérica)

Ante el problema de la creciente brecha social, Oxfam ha recopilado más de 60 indicadores en 22 paises de Latinoamerica y el Caribe. Por eso abrieron una convocatoria para explicar y conectar a públicos no especializados con las injusticias fiscales

Hasta el 22 de septiembre aceptan las inscripciones para proyectos comunicacionales que cuenten historias con los datos, comparen un tema o pais y usen la creatividad para abordar estos temas

⏺Dashboard de herramientas – DataSketch (Colombia)

Varias opciones para crear visualizaciones y genera r graficos descargables y embedeables.

Sus herramientas abarcan desde la visualización, el análisis y la limpieza de datos. Además, tiene la posibilidad de mejorar el código, a través de contribuciones

⏺ Indice de municipios —Fundación Conocimiento Abiero (Argentina)

Adaptando el indice global de datos abiertos, en este indice evaluaron varias ciudades que cuentan con portales de datos abiertos.

El ranking aborda temas como trabsporte, compras y contrataciones,

⏺ La tierra esclava – Eldiario.es y Elfaro.net (España y El Salvador)

Este proyecto de investigación revisó los monocultivos en paises como Guatemala, Colombia y Brasil, y su consumo en el mercado mundial.

Muestra visualizaciones sobre el flujo de la comercialización de estas plantaciones y cómo se conectan

Además, produjeron reportajes de investigacion en multimedia que cuentan como la industria de azúcar en Guatemala opera como cartel, como en Honduras la palma africana arrasa con los bosques y otras historias.

⏺ Radiografia Politica — Fundacion Ciudadanía y Desarrollo (Ecuador)

Una plataforma para generar perfiles sobre funcionarios públicos. La información se nutre de los sitios oficiales de gobierno que suele estar dispersa en más de 20 sitios diferentes.

La plataforma permite descargar hojas de calculo con datos sobre su función pública, su trayectoria en el sector privado y la actividad política. Revisa antecedentes judiciales, penales, formación académica y procesos de investigación y contraloría

La plataforma está disponible en código abierto y está disponible para que otros la implementen y mejoren el código.

⏺ La Data (México)

La Data es un medio digital nuevo, especializado en periodismo de datos.

Fue fundado por Morlan, una consultora de visualización y análisis de datos. Su primera historia analiza diversos datos sobre la violencia contra las mujeres en la Universidad Autonoma de México, que incluye desde acoso verbal hasta violaciones a estudiantes, investigadoras y profesoras.

El lanzamiento de este proyecto es el lunes 28 de agosto.

Escuela de Datos: 5 “abrelatames” juntos.

Marcos Ge - el agosto 19, 2017 en Experiencias, Noticias

Junio de 2013, Uruguay, Montevideo: frente a una naciente comunidad de personas interesadas en el uso de la tecnología para el impacto social, se presentó Escuela de Datos en el primer ABRELATAM de la historia.

Este 2017, del 23 al 25 de agosto se lleva a cabo la quinta edición de esta desconferencia, que busca atar los esfuerzos de las comunidades y desatar los nudos que puedan encontrarse en el camino hacia un uso libre de los datos para el impacto social. En estos años, Escuela de Datos ha generado decenas de encuentros para crear comunidad, talleres, publicado cientos de contenidos y cursos gratuitos.

Muchas de estas acciones han sido ejecutadas por una comunidad en cuyo corazón están las y los fellows, aquí recapitulamos algunos de sus logros, cuya amplificación se debe, en gran medida, a cada ABRELATAM. ¡Conócelxs!

Antonio Cucho

Antonio Cucho Gamboa, fellow por Perú A finales de 2013 y  principios de 2014, fundó la organización Open Data Perú y se postuló en 2014 para el fellowship. Al tener capacidades técnicas como programador y unirse a periodistas co fundó la publicación online de periodismo de investigación Ojo Público.

Su experiencia organizando comunidades de datos abiertos comenzó en el encuentro regional más relevante para los datos abiertos en Latinoamérica: Abrelatam (2014).

Tras terminar su fellowship, Antonio se mudó para integrarse al equipo de periodismo de datos de Univision Noticias, medio estadounidense dirigido a la población hispana en Estados Unidos. Con Univision Data ha desarrollado diferentes trabajos relacionados con la defensa de los derechos de la población de contexto hispanoparlante, como un mapa interactivo para mostrar la población hispana que aún no domina el idioma inglés, describir los resultados de medio siglo de guerra en Colombia. Además, promovió la primera plataforma de factchecking en español (dentro del territorio estadunidense): “El Detector de Mentiras”.

A pesar de radicar fuera de Perú, su trabajo con ese país no ha concluido, lidera el desarrollo y coordina la investigación de la primera plataforma de contrataciones abiertas en  su país de origen. Este es un esfuerzo en conjunto de la comunidad Open Data Perú y la OSC Proética para promover la transparencia en las contrataciones estales, identificando diferentes patrones que permitirán a especialistas realizar una exploración más sencilla dentro de miles de contrataciones que contienen irregularidades en el proceso.

Si quieres saber más de lo que hizo Antonio durante su fellowship, da clic aquí.

Julio López

Durante su Fellowship, en 2015, Julio se concentró en datos de la industria de extracción, a través de su trabajo con Natural Resource Governance Institute.

Julio se encuentra trabajando como consultor de la División de Energía del Banco Interamericano de Desarrollo (BID), donde apoya la implementación de la Iniciativa Energía Sostenible para Todos (SEforAll) en América Latina y el Caribe. Antes de incorporarse al BID, trabajó en la Organización Latinoamericana de Energía (OLADE) como especialista de información energética y previamente coordinó proyectos de investigación en políticas públicas para think tanks y OSCs en América Latina.

En 2015 desarrolló su Fellowship en Escuela de Datos, donde trabajo en fortalecer la comunidad local de datos abiertos en Ecuador y colaboró con un proyecto global sobre datos de proyectos de industrias extractivas. Recientemente es co-fundador de @Datalat, una iniciativa civil sobre el uso de datos y tecnología en Ecuador.

Omar Luna

Tras su fellowship en 2015, Omar Luna dedicó sus esfuerzos en El Salvador a la colaboración con el medio independiente El Faro,  con quienes capacita a estudiantes de periodismo en diversos rubros políticos y de datos con el objetivo de la construcción de dos grandes productos: una base de datos que le sirva a El Faro para crear una visualización de datos de cara a las elecciones de diputados 2018-2021, así como la consolidación del Observatorio de Comunicación Política de la Universidad Centroamericana (UCA).

También colabora con Proyecto Cero, donde Omar lideró la construcción de una base de datos que visibiliza la toma de decisiones clave en la Asamblea Legislativa.. Omar conoció a la coordinadora, Claudia Ortiz,  el año pasado durante el desarrollo del fellow.

Una de las colaboraciones más cercanas y estrechas que tuvo durante y después de mi fellowship ha sido con el equipo de la unidad de datos de El Diario de Hoy (EDH). Su editora periodística, Lilian Martínez, y su editora de visualización, Norma Ramírez, contactaron a Omar para que desarrollara capacitaciones constantes en uso de hojas de cálculo y software de visualización. Con EDH también ha creado visualizaciones sobre temas como embarazo adolescente y personas desaparecidas.

Phi Requiem

En 2014, Phi Requiem dedicó su fellowship a la formación de capacidades entre periodistas y activistas centroamericanos. Hoy su vocación de capacitación continúa. Con la iniciativa Hagamos Data (#HagamosData), se encuentra entrenando un más amplio grupo de personas para el uso de datos: por una parte entrena entrenadores, y por otra entrena a público no especializado. Se encuentra en un proceso de acompañamiento con la organización con el National Democratic Institute (NDI) para el uso de datos.

Phi también colaboró con el equipo que desarrolló Ruido CDMX, la plataforma construida con hardware libre y código abierto para la recolección y visualización de ruido en la Ciudad de México. Actualmente se encuentra desarrollando una segunda fase de este proceso, Ruido en las Ciudades, con software y hardware libres de generaciones más eficientes y accesibles que las de la anterior. El objetivo es acercar la creación de estos recolectores de datos a un grupo muy diverso de la población para generar datos abiertos sobre este fenómeno, de amplio impacto ambiental y de salud.

Si quieres saber más del trabajo de Phi Requiem durante su fellowship, da clic aquí

Camila Salazar

Camila desarrolló su fellowship en 2015.  Ella tiene un grado universitario en periodismo y obtuvo un segundo grado en Economía.

Tras el fellowship, Camila se ha desenvuelto como periodista de datos en la Unidad de Datos del Diario La Nación.  Estos son los proyectos en los que participó en el último año:

  • Aplicación para calcular el salario en el sector público, para la que ejecutó una investigación sobre el sistema de remuneraciones en el sector público.
  • Factchecking en vivo del discurso presidencial.
  • También desarrolla multitud de investigaciones, como esta sobre el sector cooperativo en Costa Rica.
Además de ser periodista en campo, Camila comparte su conocimiento a través de la docencia universitaria, talleres y actividades sobre periodismo de datos. El semestre anterior impartió el curso de Periodismo de Datos en la Universidad de Costa Rica.  Es un curso que forma parte del plan de estudios del Bachillerato en Periodismo.

Si quieres saber más sobre la labor de Camila durante su fellowship, da clic aquí.

Raisa Valda

Dedicó su fellowship a generar comunidades de datos abiertos en toda Bolivia, así como a conectar con organizaciones aliadas para su proyecto de datos contra violencia de género Cuántas Más.

  • Fue seleccionada para ser parte de la Escuela de Incidencia de Ciudadano Inteligente (Chile) para trabajar sobre género y tecnologías.
  • También la invitaron, desde la Embajada de Suecia en Bolivia, a participar en Stockholm Internet Forum 2017(SIF17) on Internet Freedom for Global Development en mayo de este año.
  • Fue invitada a dictar un módulo de docencia junto a la Fundación para el Periodismo de La Paz en su Diplomado en periodismo digital, sobre redes sociales y otras tecnologías en el periodismo, en julio de 2017.
  • Participará en el IX Congreso de la AEB – Estudios de Internet y sociedad en Bolivia, con una ponencia sobre datos abiertos y ciudadanía, en julio de este año.

Raisa está dedicada íntegramente a Cuántas Más. A partir de los datos que obtuvieron en 2016 sobre los casos de feminicidio, hallaron dos que llamaron su atención:

1. en el 78% de los casos se trataban de feminicidios íntimos (esposos,concubinos, novios, ex novios, ex esposos, ex concubinos),
2. en el 34% de los casos, las víctimas tenían menos de 20 años de edad.
Por ello, en el primer trimestre de este año, centraron su trabajo de prevención en el abordaje de violencias dentro las relaciones de noviazgo en la adolescencia con una ruta de talleres (“No es que me pidas así”) piloto por 6 ciudades de Bolivia.
Se trata de talleres piloto para los que Raisa desarrolló una metodología que permite a los adolescentes, entre 15 y 17 años, hablar sobre sus percepciones de violencia y cómo la entiende; y a partir de ello generar mensajes en audiovisual en sus propios códigos lingüísticos (nada solemne, nada políticamente correcto). Este material no se difundirá como una campaña masiva, no es el propósito; sino a través de sus propias redes de manera natural.
Cuántas Más tiene el propósito de centrar su trabajo, para esta gestión, en temas violencia que involucra a jóvenes, sea en las relaciones de noviazgo (basadas en encuestas y estudios realizados por la Coordinadora de la Mujeres) o en su desenvolvimiento en la universidad (basado en un estudio realizado por UNFPA sobre la UMSA).

Ximena Villagrán

Durante y tras su fellowship, Ximena ha sido catedrática titular de Periodismo de Datos en la Universidad del Istmo. Es también consultora para proyectos periodísticos y talleres de periodismo de datos en Honduras, El Salvador y Guatemala para la agencia internacional Internews, con quienes comenzó su colaboración, al igual que Omar, durante el fellowship.

Hoy Ximena está fundando su propia iniciativa de periodismo de datos, El Intercambio, que propone un vínculo íntimo entre crónica y periodismo de datos y busca dotar a los periodistas de un rol más activo en la búsqueda de fondos para el periodismo independiente.

Junto con Omar Luna, desarrolló una extensa currrícula para periodistas de datos en toda Centroamérica. Hoy también es consultora para la nueva unidad de datos del medio guatemalteco Prensa Libre y trabaja en un proyecto de explicación, a través de los datos, con la publicación también guatemalteca Nómada.

Daniel Villatoro

Daniel Villatoro se desempeña hoy como reportero senior en el medio guatemalteco Plaza Pública. Además de escribir crónica y desarrollar investigaciones de datos, tras la fellowship, Daniel incursionó en prácticas artísticas a través de los datos.

Daniel desarrolló una investigación sobre ingresos económicos por hora trabajada y de acuerdo con etnia y género, para concluir rasgos visibles de explotación en las poblaciones femeninas de Guatemala.

Con esta investigación generó mapas y visualizaciones que dieron soporte a una propuesta en acrílico y billetes, para visualizar con elementos cotidianos las opresiones también cotidianas. Su solución formal se expuso durante Nuevas Proporciones.

 “Las gráficas son representaciones, recursos que se manifiestan visualmente para mostra relaciones […] Huyendo de la representación, busco trabajar las gráficas con los objetos mismos en vez de representarlos: algo tan obvio como personificar al dinero con un billete o al tiempo con un reloj”, puede leerse en la justificación de su proyecto.

Daniel Villatoro se ocupa, también desde el periodismo, constantemente con temas de opresión de clase y de etnia, sobre el ingreso de grandes capas de la población. Así ha desarrollado investigaciones con mapas y visualizaciones de datos  como esta, que aborda la insuficiencia del salario mínimo, como en muchos otros, en su país.

Sebastián Oliva

Sebastián se interesó por la computación desde una temprana edad. Cursó estudios universitarios en Ingeniería y Física. Sin embargo, mantuvo siempre un profundo interés por las ciencias sociales y la interacción y aplicaciones interdisciplinarias de las ciencias exactas. Sebastián ha trabajado tanto para empresas de tecnología, como para varios proyectos relacionados con tecnología y sociedad, como la creación de software y hardware libre en su natal Guatemala.

Hizo una pasantía en Google, en la división de nube, trabajando con almacenamiento no relacional y adquiriendo conocimientos en Python. Fue parte de los equipos ganadores de DAL 2014 y finalista del Space Apps Challenge 2014. Su interés por Escuela de Datos se dá naturalmente al alinear el impacto social con capacidades técnicas de análisis, extracción, procesamiento y presentación de datos. Entre sus otros intereses se encuentra la fotografía, principalmente​ documental, y los juegos de estrategia y rol.

Del Storytelling al StoryMap: espacializando Datos Abiertos en Colombia

invitado - el agosto 16, 2017 en Experiencias, Guest posts, Tutoriales

Desde Bogotá D.C., Andrés Forero  , especialista en GIS y datos geográficos, nos envía este post como una introducción a una serie tutorial sobre datos geográficos y cómo podemos aprovecharlos desde distintos softwares para su edición y publicación.

Bien sabemos la importancia de los datos en nuestra sociedad hoy en día; grandes empresas almacenan sobre una base de datos información que describe gustos, costumbres y actividades personales. Si tienes una sesión activa desde una cuenta Google o Microsoft y deseas buscar un vuelo que vaya desde Bogotá hasta Ciudad de México, es probable que aparezca en tu pantalla, minutos u horas después, promociones en diferentes aerolíneas para que salgas del país. Si abres Instagram y buscas como etiqueta #Tulúm o #Cartagena, el aplicativo probablemente te sugiera lugares para pasar vacaciones junto a la playa a través de un anuncio.

Los datos gubernamentales no son la excepción. Haz de cuenta que desde el momento en que empezaste a leer este artículo han robado a diez personas en tu ciudad. ¿Qué variables puedes analizar allí?

El mapa anterior muestra algunos delitos reportados en la ciudad de Cali, los cuales pueden ser consultados y descargados directamente desde el Portal de Datos Abiertos de Colombia.

Entender la información geográfica es una iniciativa que debe ir tomando forma y debe inculcarse desde a la sociedad civil hacia los tomadores de decisiones. Las oportunidades y debilidades que presenta un dato geográfico son las mismas que presenta esa tabla que necesitas para procesar en un software estadístico pero que es publicada como PDF.

Cuando pides un UBER, los puntos de partida y de llegada que estableces deben estar ligados a un sistema de coordenadas. La dirección que escribes debe estar estructurada y estandarizada para que pueda identificarse en el aplicativo.

Ahora, haz de cuenta que una persona llama a la policía para reportar el robo de sus pertenencias en Cali; conocer con exactitud el lugar donde sucedió el evento puede resultar en análisis espaciales robustos que permitan establecer la cobertura de patrullas de policía para atender áreas específicas o establecer programas que garanticen seguridad hacia la sociedad civil.

Hacer proyectos de este tipo no son para nada complejos, por el contrario, existen herramientas que facilitan el procesamiento de esta información ya sea desde software libre o software licenciado gratuito para desarrolladores y para usted, amigo datero. ¡Todos somos parte del cambio!

Aquí hay algunos recursos online para que puedas conocer las ventajas y desventajas asociadas con los Sistemas de Información Geográfica: QGIS como software libre brinda la posibilidad de utilizarlo gratuitamente desde cualquier computadora, aquí encuentras cómo puedes utilizarlo. Por otro lado, ArcGIS Online es una alternativa que permite realizar análisis en la nube únicamente creando una cuenta como desarrollador, la cual es gratuita. aquí encuentras cómo puedes utilizarlo.

Integrarlos puede ser útil. Por ejemplo, desde el escritorio puedo establecer cuáles son los campos que veré posteriormente sobre un mapa: ¿Necesito la fecha? ¿Necesito el nombre del delito? ¿Habrá que modificar la simbología? Estos procesamientos que pueden llegar a ser complejos para alguien quien inicia en el mundo SIG puede hacerlo desde QGIS. Teniendo establecido qué información quieres publicar, ArcGIS Online te permitirá visualizar este contenido desde la web y allí hacer análisis únicamente seleccionando qué deseas utilizar.

Imagen 1. Análisis en ArcGIS Online
Fuente: autoría propia.

 

Observemos este mapa

 

Agregando los delitos a la capa de comunas podemos establecer cuál de ellas presenta mayor criminalidad con un criterio de clasificación.

Este análisis es solo una introducción de qué se puede llegar a hacer y cómo podemos empezar a construir soluciones innovadoras bajo un contexto netamente espacial. Bienvenidos al infoactivismo geográfico.

Prepárate para aprender Python, guía de instalación de bibliotecas.

invitado - el julio 20, 2017 en Experiencias, Tutoriales, Uncategorized

Este post es una colaboración de Sebastián Oliva para Escuela de Datos. Es parte complementaria de los webinars y tutoriales que estamos publicando sobre Python y las bibliotecas del mismo lenguaje Pandas y Anaconda.

Saludos compañeros, bienvenidos a este micro-post respecto a la instalación y uso de Python para análisis de datos.

Python

 

 

 

 

 

 

Python es un lenguaje de programación, el cual es interpretado por un programa ejecutable, en el caso de Windows, un python.exe que ejecuta archivos .py (archivos de texto conteniendo codigo fuente).

# Este es un comentario
1 + 2 # esta es una operación valida, retorna 2
print("Hola Mundo!")
import antigravity

El primer paso es obtener entonces una instalación de Python. Actualmente existen dos versiones, Python 2 y Python 3. Python 3 es la versión actual y más reciente. A pesar de que hay aún algunas librerias que no han actualizado, la gran mayoría está disponible para ambas versiones.

Python

Puedes descargar Python de el sitio oficial. https://www.python.org/downloads/

Windows

En Windows el instalador asocia la extension .py, instala el editor de texto IDLE, e instala la terminal de Python. Puedes compobar tu instalación de tus rutas mediante presionar Windows + R y tecleando ahi python.exe.

Mac y Linux

El instalador para Mac OS asocia Python a la extension .py En Linux asegura de instalar el paquete python3 tambien asegure de instalar el paquete virtualenv.

Ecosistema

El segundo paso y uno de los grandes atractivos del ecosistema Python es el manejo de paquetes y dependencias. Actualmente existen varios instaladores de paquetes, que utilizan una estructura a común. Setuptools, Pip y Conda. Es también importante notar que Python permite la opción de instalarse dentro de un ambiente virtual, virtualenv. Virtualenv permite empaquetar una aplicación y sus dependencias en un espacio aislado, permitiéndote instalar versiones distintas de paquetes varios o congelar un proyecto a una cierta versión.

Paquetes Varios

Entre los paquetes mas usados está Numpy, software de manejo numérico. Pandas, NumPy, jupyter.

NumPy y Pandas son librerias que permiten manipulacion de datos.

Jupyter Notebooks te permite crear documentos que incluyen código, matemática, visualizaciones y texto. Soporta mas de 40 lenguajes en particular Python, R y Julia. También se pueden crear widgets interactivos.

matplotlib, seaborn

Anaonda

Conda es una distribución de paquetes cientificos, entre ellos, Python. Conda para Python incluye una variedad de paquetes muy útiles, Virtualenv, pandas, jupyter y más.

Miniconda es una version básica, que unicamente incluye a conda, Python y otros paquetes básicos. Anaconda es la versión completa e incluye mas de que 150 paquetes. conda install es el instalador de paquetes que permite utilizar esto paquetes

Puedes descargar Anaconda de https://www.continuum.io/downloads

Espacios de trabajo de Anaconda

Anaconda permite el manejo de espacios de trabajo, esto permite la organizacion de archivos relacionados, ambientes virtuales (virtualenv, R, etc).

Conclusiones y pasos siguientes

El proceso de instalación de Python es sencillo, el verdadero reto esta en el uso del lenguaje y en poder expresar algoritmos e ideas. Existe una gran variedad de tutoriales del lenguaje Python, entre ellos, uno de los mas destacados es Python Para Todos: http://mundogeek.net/tutorial-python/

Datos. ¿Qué tienen que ver con los Objetivos de Desarrollo Sostenible?

invitado - el julio 19, 2017 en Experiencias, Guest posts, Uncategorized

Sustainable Development Goal #1: No Poverty

Este texto es una colaboración de Fredy Rodríguez, coordinador del Área de Datos del Think Thank para Latinoamérica y Caribe CEPEI.

En 2015, 193 líderes mundiales se comprometieron ante las Naciones Unidas con la Agenda 2030 sobre el Desarrollo Sostenible, la cual está compuesta por diecisiete (17) Objetivos Globales y 169 metas para lograr tres cosas: erradicar la pobreza extrema, combatir la desigualdad y la injusticia, y encontrar soluciones al cambio climático en 15 años, de los cuales ya han transcurrido año y medio.

 

No tenemos un plan b para resolver los problemas del mundo, ya que no tenemos un planeta b

 – Ban ki-moon-

 

El escenario de la Agenda 2030 presenta como consenso que los Objetivos de Desarrollo Sostenible (ODS) requieren un esquema robusto de generación y análisis de información pública y privada, tanto a nivel nacional como subnacional. Esto implica contar con información de calidad, con mayor nivel de desagregación de los datos y con una cobertura más amplia, que sirva tanto para la medición del progreso como para la toma de decisiones basadas en evidencia.

 

Es por esto que le fue delegado a la Comisión Estadística de Naciones Unidas –el cuerpo de más alto nivel en el Sistema Estadístico Global que reúne a los diferentes directivos de las Oficinas Nacionales de Estadística– la responsabilidad de formular el marco de indicadores globales para los objetivos y metas de la Agenda 2030.

 

Para lograr lo anterior, se creó el Grupo Interagencial y de Expertos sobre Indicadores ODS (IAEG-SDG por sus siglas en inglés) que forman Brasil, Colombia y México, representando a América Central y Sudamérica. A junio de 2017, el grupo tiene definido un esquema de 230 indicadores que se están poniendo a prueba para revisar la viabilidad y pertinencia de su medición.

 

Dada la importancia de la información para los ODS, asociada al logro de una unión de esfuerzos, se crea la Alianza Global de Datos para el Desarrollo Sostenible (GPSDD por sus siglas en inglés), con el fin de facilitar espacios de discusión entre sociedad civil, academia, sector privado, gobiernos, filantropía, organismos multilaterales, etc., promoviendo la llamada revolución de los datos, que no es otra cosa que usar nuevas fuentes de datos y mejorar la calidad y apertura de los datos en torno al desarrollo sostenible. Por su parte, la Conferencia Estadística de las Américas de la Comisión Económica para América Latina y el Caribe le dio prioridad a los ODS, ya que por primera vez se elaboró una declaración denominada “Declaración de La Mitad del Mundo”, en la que se incluyó como primer punto del documento lo siguiente:

 

“Reafirmamos nuestro compromiso con la generación de estadísticas de calidad, que sirvan para el seguimiento de las agendas nacionales de la Agenda 2030 para el Desarrollo Sostenible”[1]

 

 

En el contexto latinoamericano, existen algunas acciones planteadas por países como Colombia, Costa Rica y México, que son lideradas principalmente por las Oficinas Nacionales de Estadística para la creación de la hoja de ruta para la medición de los ODS.

 

La primera de ellas es el diagnóstico de disponibilidad de información, que toma como referencia los Planes Estadísticos Nacionales (PEN) para realizar un análisis de oferta y demanda de la información existente. De esto se obtiene la línea base de la información para los ODS, estado de calidad de los datos y factibilidad de producir nueva información o usar fuentes no tradicionales[2] de datos en los casos de que existan brechas para medir los Objetivos Globales en todo el territorio nacional.

 

En la otra cara de la moneda, existen países de nuestra región sin inicar el proceso para la implementación de los ODS y mucho menos el de identificación de necesidades de información para su medición: es un gran reto la apropiación del tema y la gestión de recursos para la implementación de esta agenda.

 

En el uso de fuentes no tradicionales de datos está el uso del Big Data, ya que un número considerable de instituciones prefieren los datos del sector privado, los cuales, aunque no tienen un gran rigor técnico como los que podrían tener las oficinas estadísticas nacionales, resultan más actualizados y permiten tomar decisiones rápidas. No obstante, existen teorías que critican estas fuentes al considerar que no tienen una calidad suficiente para tomar decisiones. Por ejemplo: el uso de datos de telecomunicaciones tiene una gran volumen de información valiosa, pero es posible que las personas de países de renta baja que no tienen acceso a telefonía móvil no estén en las mediciones y, por tanto, quedan fuera del radar de las políticas públicas.

 

El principio esencial de los ODS es “no dejar a nadie atrás”. Para esto se requieren datos desagregados y de calidad que incluyan a todos los aspectos de la agenda 2030

 

 

Los trabajos avanzados por el gobierno permiten identificar retos que deben ser enfrentados más allá de la definición última de los indicadores, desafíos que hacen referencia a la capacidad de contar con los datos necesarios para su medición y la necesidad de coordinar esfuerzos interinstitucionales para establecer responsabilidades en la recolección, procesamiento, análisis y difusión de la información. Sin embargo, la participación de organizaciones diferentes a gobierno, especialmente las que cuentan con fuentes no tradicionales de financiamiento, no se ha incluido en las discusiones y tampoco se les han asignados roles específicos para que empiecen a entregar sus datos.

 

Otro de los mayores retos es el de las políticas de datos abiertos, que son insuficientes para identificar los actores del ecosistema de datos para el desarrollos sostenible. De acuerdo con el mapeo de datos www.datarepublica.org realizado en tres paìses (Colombia, Costa Rica y México), los principales datos que se pueden acceder libremente a través de la Web son los difundidos por organizaciones de gobierno.  En contraste, el sector privado es aquel con menor cantidad de datos publicados, lo cual invita a la reflexión sobre las políticas de datos abiertos en el sentido de que deben ser masificadas a todos los sectores, teniendo en cuenta que los ODS son una responsabilidad colectiva por los impactos y efectos que cada sector realiza en las temáticas de estos ambiciosos objetivos.

 

Para finalizar, se concluye que las dificultades en materia de medición y obtención de datos están asociadas al logro de una implementación con enfoque multisectorial, es decir, que involucre a todos los actores, desde el ciudadano de pie hasta el gobierno. Dada la naturaleza multidimensional de este proceso, es necesario dedicar atención a la gestión de información de calidad por parte de todos los actores, especialmente en los países que requieren un apoyo especial para producir su información básica y que con esta agenda requieren un mayor esfuerzo económico para cubrir las demandas de información.

 

Por lo tanto, el sector privado, el gobierno, y los demás actores deben convertirse en aliados que brinden y gestionen la consecución de datos para el desarrollo sostenible, sirviendo como un bien público que mejora la vida de todos.

[1] Resolución de la Reunión de la Conferencia Estadística de las Américas de la Comisión Económica para América Latina, 2015.

[2] Las fuentes no tradicionales son las que se generan a través de big data, imágenes, etc, que no hacen parte de las fuentes tradicionales que son las encuestas y censos.

http://es.scoda.okfn.org/files/2017/07/Screen-Shot-2017-07-18-at-4.58.38-PM.png

¿Qué implica la data de género?

Raisa Valda Ampuero - el junio 14, 2017 en Experiencias, Guest posts

Vivas Nos Queremos 8
En uno de los encuentros que tuvimos en Abrelatam 2016, a Majo Greloni (directora de Comunicación y Campañas Online en Wingu) y a mi nos motivó la curiosidad de identificar los desafíos sobre género y datos desde la diversidad que siempre caracteriza a este evento; fuimos voluntarias para conducir esta mesa y uno de los desafíos que se quedó rondando en mi cabeza tenía que ver con identificar qué se puede hacer con la poca data de género que tenemos para incidir en políticas públicas.

Entrando a una reflexión más profunda, me doy cuenta de que cuando empezamos una conversación sobre data de género, en la mayoría de los casos la primera puntualización que resalta es hablar sobre violencia de género y la ausencia de información que llega a ser una suerte de común denominador en Latinoamérica. Lo primero tiene que ver con que tendemos a limitar el tema de género al enfoque de violencia por el contexto urgente de nuestros países, y esa mirada es necesaria aunque no la única; lo segundo, un poco más preocupante, tiene que ver con la falta de datos de género, y si existen, la cuestionable calidad de los mismos.

Cuando hablamos de data de género no nos referimos meramente a un indicador enunciativo de hombres y mujeres dentro una base de datos: estamos hablando de todas las dimensiones que comprenden estos dos diferenciadores mayores, yendo a la construcción cultural y social más allá de lo biológicamente determinado. Esta construcción implica la comprensión de la vida de las mujeres y las disparidades, los desafíos políticos y legales que enfrentan y les impide avanzar; elementos que normalmente resultan ausentes de los datasets ante la falta del corte de género como componente primario de las bases de datos.

La perspectiva de género, en este sentido, alude no sólo al potencial de granularidad y calidad de datos y su consiguiente valor derivado del análisis, sino también a su potencial político, transformador de la realidad, es decir, una propuesta política que exige un compromiso a favor de la construcción de relaciones de igualdad de género. Sin buenos datos, nos perdemos de detalles cruciales que pueden cambiar disparidades y acortar caminos en los desafíos planteados; no podemos ver con precisión qué es lo que necesita ser modificado, si es que las soluciones planteadas funcionan o no, o si hay progreso en lo que estamos haciendo.

 

Desde cualquiera que sea nuestra rama de interés, la data de género implica no solamente una cuestión técnica que en definitiva tiene un peso importante y que determina la calidad de futuros análisis, al mismo tiempo hablamos de una cuestión basada en política y por lo tanto, la determinación de qué valores medir. En ese sentido, si consideramos que tenemos recursos limitados para la recolección de datos, la elección sobre qué medir, cómo medirlo y quién está midiendo puede profundizar una división inadecuada de datos y proporcionar datos sexistas o poco útiles.

No hay igualdad de género sin igualdad de datos

“Medimos lo que valoramos y si no es parte de la mentalidad que, por ejemplo, el trabajo no remunerado de las mujeres en el hogar tiene un valor económico además de otros beneficios y, por lo tanto, no medimos ese trabajo, entonces no podemos ver cómo las mujeres impulsan el desarrollo económico y productivo de los países”, dice Emily Courey Pryor, directora de la iniciativa Data2X de la Fundación de las Naciones Unidas, cuyo objeto es mejorar la disponibilidad y el uso de los datos de género.

El vínculo entre los datos de género y el empoderamiento económico de las mujeres es un ejemplo enorme, y sin embargo es sólo una de las múltiples áreas en las que esta data es carente o inexistente.

Pasar por alto estas valoraciones contribuye a una cultura de invisibilidad; como el ejemplo expuesto por Courey existen otros tantos, relacionados por ejemplo a la edad reproductiva de las mujeres, que según la OMS, se define entre 15 y 49 años; y sin embargo las niñas menores de 15 años representan 2 millones de los 7,3 millones de embarazos de niñas menores cada año en los países en desarrollo, según UNFPA. Estos 2 millones de niñas no aparecen en las estadísticas y sin embargo están ahí.

La data de género, precisa y completa, abre la puerta a la identificación y consiguiente subsanación de estas brechas de datos, que a su vez se traducen en promoción de políticas efectivas para el cierre de brechas de desigualdad.

Con este panorama, conversando con Natália Mazzote (Co-Directora en Gênero e Número y Administradora de programas en Escola de Dados Brasil), concordamos que las varias implicaciones de los datos de género se convierten en un reto desde el punto de vista de la planificación estratégica: contamos con bases de datos e información sobre temas varios, como por ejemplo la empleabilidad en carreras universitarias tecnológicas, pero no contamos con información suficiente para medir, por ejemplo, la asimetría de género pues el recorte de datos de género se excluye o no se considera como importante dentro de estas recolecciones; a fin de cubrir esta brecha, el proceso al que normalmente recurrimos quienes trabajamos género desde distintas perspectivas, es el de crear una estructura propia recurriendo a fuentes alternas, especialistas en la materia y otros.

Esto implica un gran esfuerzo al momento de generar bases de datos y análisis como resultado de investigaciones, y poner este conjunto disponible para cualquier interesado; pero por momentos queda limitado al alcance local al no tener estándares internacionales que nos permitan tener una comparación macro de lo que está pasando a nivel regional.

 

Dos esfuerzos más visibles para subsanar la falta de estándares internacionales, mejorar la disponibilidad y el uso de los datos de género son:

  • Publicado en septiembre de 2015, los 16 indicadores globales “Listos para medir” (Ready to Measure) y monitorear los resultados para mujeres y niñas sobre los Objetivos de Género de los Objetivos de Desarrollo Sostenible (ODS), lanzados por la Organización de las Naciones Unidas con una nueva agenda de desarrollo sostenible y metas al 2030; los 17 objetivos que componen este compromiso han planteado un escenario más transversal para el tratamiento de las disparidades de género: la incorporación sistemática de una perspectiva de género en la implementación de la agenda global de trabajo, reflejada en la identificación de la meta 5 denominada “Igualdad de Género” y 11 ODS incluyen metas específicas desagregadas por género.

Impulsado por Data2x, quienes han identificado 28 brechas de datos en cinco ámbitos: salud, educación, oportunidades económicas, participación política y seguridad humana, ya cuentan con definiciones acordadas internacionalmente, que se elaboran a través de los instrumentos de recolección de datos disponibles, que ya cuentan con una cobertura relativamente amplia, que no tienen sesgos de género incorporados, y que están basados en las recomendaciones de ONU Mujeres, el Grupo Interinstitucional y de Expertos sobre Estadísticas de Género, el Grupo de Trabajo Abierto, los indicadores de los ODS y la actual lista de la Comisión de Estadística de las Naciones Unidas, incluyendo pero no limitado a la meta cinco sobre Igualdad de Género de los Objetivos de Desarrollo Sostenible. Están en la búsqueda de unir esfuerzos con otros socios, expertos y agencias nacionales para poner a prueba los indicadores “Listos para medir” y motivar el inicio de la recolección de datos de género.

  • Más reciente, de septiembre de 2016, la iniciativa emblemática “Haciendo que cada mujer y cada niña cuenten” (Making Every Woman and Girl Count) de ONU Mujeres. El programa de cinco años invertirá los recursos y la experiencia necesarios, centrándose en 12 países pioneros, para generar, priorizar y utilizar los datos de género. Ayudará a los países a formular políticas basadas en datos concretos y orientadas a aplicar plenamente los progresos logrados en relación con los objetivos de desarrollo sostenible (GDS).

 

En ambos casos existen objetivos claramente trazados, en búsqueda de resultados que ciertamente no veremos en el corto plazo, pero que significan un esfuerzo importante por trascender en la necesidad de mejores datos de género.

 

La labor continua y el rol desde sociedad civil

 

En el continuo ejercicio de demanda y generación de mejor data de género por parte de la ciudadanía hacia los gobiernos, vale la penar que como ejercicio recordemos y apliquemos los Principios Básicos para la Revolución de Datos para el Desarrollo Sostenible, presentado en el informe de la revolución de datos “Un mundo que cuenta” (A world that counts) de Naciones Unidas, para entender qué pedimos, cuáles las características que necesitamos y cómo lo pedimos:

  1. CALIDAD Y RELEVANCIA DE LOS DATOS: Lo había mencionado anteriormente, la invisibilización del corte de género deriva en un análisis de dataset sesgados, lo que limita la posibilidad de generar transformaciones.
  2. DESAGREGACIÓN DE DATOS: Se ha considerado al corte de género como omnipresente en las bases de datos, sabemos que se hizo, pero en algún punto alguien consideró que no eran importantes para el análisis; esta práctica invisibiliza realidades.
  3. OPORTUNIDAD DE DATOS: Los datos retrasados ​​son datos negados; la falta de datos desagregados y en el tiempo oportuno significan un dificultad mayor y una demora para la pertinente revisión de las políticas públicas.
  4. TRANSPARENCIA DE DATOS Y APERTURA: Todos los datos sobre cuestiones públicas y / o financiados por fondos públicos, incluidos los datos producidos por el sector privado, deberían hacerse públicos y “abiertos por defecto”, con excepciones estrictas para las preocupaciones reales de seguridad o privacidad. En lo relacionado a género específicamente, la falta de transparencia y apertura de estos datos está generando poca precisión en la identificación de problemas y posibles soluciones, en lo que demandamos al aparato público.
  5. DATOS DE USABILIDAD Y CURACIÓN: La arquitectura de datos debe poner gran énfasis en el diseño centrado en el usuario y en interfaces amigables para el usuario, considerando que los usuarios frecuentes de estos datos, además de los organismos públicos, son organizaciones de sociedad civil. Datasets incomprensibles o información con componentes de complejidad innecesarios, como PDFs con contraseña, no facilitan el consumo de datos.
  6. PROTECCIÓN DE DATOS Y PRIVACIDAD: Es necesario elaborar normativa clara, políticas y marcos jurídicos sólidos que regulen la inclusión y la exclusión voluntaria, la extracción de datos, la reutilización con otros fines, la transferencia y la difusión. Los ciudadanos deberían poder comprender y controlar mejor sus propios datos y proteger a los productores de datos de las demandas de los gobiernos y de otros ataques.
  7. GOBIERNO DE LOS DATOS E INDEPENDENCIA: En la alternancia del poder político, muchas oficinas nacionales de estadística se ven afectadas en sus procesos y continuidad de acciones, las coloca en una posición de vulnerabilidad a la influencia de los grupos políticos y de interés. La calidad de los datos debe ser protegida y mejorada mediante el fortalecimiento y la garantía de que son funcionalmente autónomos, independientes de los ministerios sectoriales y de la influencia política.
  8. RECURSOS Y CAPACIDAD DE LOS DATOS: Una doble responsabilidad, por una parte requiere inversiones, por ejemplo, en capital humano, mejores tecnologías, infraestructura, datos geoespaciales y sistemas de gestión principalmente en sistemas gubernamentales; por otra debe desarrollarse la capacidad de ciencia de datos en los servidores públicos y organizaciones de sociedad civil para generar valor agregado a partir de datos, ello puede convertirse en un elemento complementario de calidad a las estadísticas oficiales.
  9. DERECHOS DE DATOS: Es la comprensión de que la revolución de los datos está estrechamente vinculada al ejercicio y resguardo de los derechos humanos, entre otros, el derecho a ser contados, el derecho a la identidad, el derecho a la privacidad ya la propiedad de los datos personales, el derecho al debido proceso, por nombrar algunos, pero que en esencia implican.

 

Finalmente, como periodistas, investigadores y activistas las puertas están abiertas para replantearnos la perspectiva de nuestras causas y empezar a dar enfoque de datos a los temas de género: ello nos conduce a una discusión en un nivel más puntual y efectivo, trascendiendo más allá de lo mediático y empujando a la reflexión más objetiva que se enfoque justamente en subsanar aquellas disparidades invisibilizadas; los datos son la herramienta más concreta para incidir en políticas públicas.

 

 

Relevancia de datos abiertos: del discurso al impacto

Marcos Ge - el mayo 29, 2017 en DAL, Experiencias, Fuentes de datos, Guest posts

Chasm

CC by SA Monyo Kararan

Hay todavía un abismo entre el discurso de datos abiertos y el impacto que esta apertura, publicación, vinculación y otras prácticas tienen en la vida de las poblaciones globales. El puente entre los extremos de ese abismo es la relevancia de los datos, es decir, la capacidad que estos tienen para ser aprovechados efectivamente por las diversas poblaciones globales. Este abismo parece especialmente insondable para poblaciones que son política y socialmente excluidas.

La vinculación de los dos extremos de ese hueco es cada vez de una necesidad mayor, toda vez que organismos, oficiales y autónomos globales, han adoptado en mayor o menor medida dicho discurso de apertura de datos.

Es necesario en este punto, a la vez que admitir los avances, prestar atención a las muchas deficiencias en políticas de apertura en regiones específicas, reconocer que la apertura no es un fin en sí mismo, y que resulta trivial si no viene aparejada de garantías de acceso y uso de los conjuntos de datos. Más aún, resulta indispensable establecer mecanismos concretos y específicos para corregir esta deficiencia.

Para ello deben desarrollarse estándares contextuales, técnicos y de evaluación,  con miras a la inclusión de amplias poblaciones que se beneficien del impacto de las políticas de apertura de datos.

El eje técnico

Dear W3C

CC by NC SA Paul Downey

En un sentido técnico, la relevancia de datos es una métrica de calidad de datos que vincula los sets de datos disponibles con el interés de actores sociales. En este mismo sentido, parte del abismo entre apertura e impacto es irónicamente un vacío de (meta)datos: aquellos que se refieren a las potencialidades de “consumo” de dichos conjuntos de datos.

En una publicación sobre prácticas recomendables para la publicación de datos en la web,  el World Wide Web Consortium (W3C) detalla una serie de criterios para que los conjuntos de datos sean vinculables y aprovechables en máximo grado. Entre estas prácticas, se encuentra el uso de un Vocabulario para el Uso de Conjuntos de datos (DUV, por sus siglas en inglés), para proveer un modo de retroalimentación entre “consumidores” y “publicadores” de datos sobre el uso de los mismos. Por ejemplo, agregando metadatos descriptivos a los conjuntos de datos, tanto sobre la base en sí misma, como de sus posibles usos. De esta manera, se generan metadatos que permiten contrastar el uso sugerido y el reuso dado.

Estas nuevas prácticas se adscriben a los principios FAIR y concuerdan con el espíritu de distribución y acceso universal que originalmente concibió internet.

Phil Archer, una de las diecinueve personas que redactó las recomendaciones, describe el propósito del documento de la siguiente manera:

“Quiero una revolución. No una revolución política, ni ciertamente una revolución violenta, pero una revolución a fin de cuentas. Una revolución de la manera en la que las personas piensan sobre compartir datos en la red”.

El eje contextual

Ayot2inapa

CC by SA Marcos Ge

Para implementar relevancia hace falta una revolución que sí es de índole política: el reconocimiento de necesidades prioritarias en la publicación de conjuntos de datos, con respecto a necesidades de todos los grupos poblacionales, pero con especial atención a datos sobre garantías individuales que son sistemáticamente violentadas por gobiernos y otros actores sociales en distintas latitudes globales.

Por ejemplo, en el contexto mexicano, la Corte Interamericana de Derechos Humanos (CIDH) detalla en uno de sus informes más recientes no sólo algunas de las violaciones sistemáticas de Derechos Humanos: desaparición, desaparición forzada, tortura, ejecuciones extrajudiciales, injusticia; sino también las poblaciones más vulneradas por estas violaciones: mujeres, pueblos indígenas, niñas, niños, adolescentes, defensoras de derechos humanos, personas migrantes, personas lesbianas, gay, bisexuales, trans y otras formas de disentimiento sexual.

En países en que se viven estas condiciones, es indispensable que este contexto de Derechos Humanos sea considerado como un factor determinante para la elaboración de políticas de apertura de datos relevantes. Aparejada a estas políticas, sólo la instrumentación de reglamentaciones y mecanismos concretos de análisis de la demanda de datos puede proveer a estas poblaciones de elementos para su defensa, que convengan efectivamente en la mejora de sus vidas.

Un paso más para asegurar la relevancia de los datos abiertos es la creación de mecanismos específicos que garanticen que poblaciones política y económicamente excluidas tengan acceso a un volumen y calidad de datos suficientes que les permita trabajar para erradicar las prácticas mismas que han promovido su exclusión.

Es decir, debe existir una concordancia entre las políticas de apertura de datos y la agenda pública propuesta por un gobierno abierto para el empoderamiento de la población, agenda que ya de por sí debe incluir a las poblaciones mencionadas.

Para la elaboración de estándares de todo tipo sobre políticas de relevancia de datos deben ser llamadas a participar no solamente especialistas en defensa de derechos, legislaciones nacionales e internacionales y otras disciplinas, sino principalmente representantes de estas poblaciones vulneradas y despojadas de la vida o de factores que permitan una vida digna.

Hoy en día, la generación y publicación de datos con esta perspectiva se está llevando a cabo por organizaciones activistas. En México, por ejemplo, periodistas e investigadores independientes hicieron pública una base de datos sobre personas desaparecidas, y en Bolivia son activistas quienes construyen una base de datos sobre feminicidios; en España periodistas organizaron datos sobre la brecha de clase en el acceso a medicamentos; en Estados Unidos, un profesor universitario creó una base de variables relevantes para la comunidad LGBTTI; y desde el Reino Unido, el medio The Guardian creó una plataforma que muestra el número de personas de raza negra que mueren por causa de disparos de policías.

El eje de evaluación

Derivado del emparejamiento de los nuevos estándares técnicos propuestos por la W3C con las prioridades humanitarias globales, las poblaciones tendrían herramientas para exigir no sólo la calidad de los datos en los términos tradicionales de formatos de apertura, sino también en cuanto a su relevancia.

Por ejemplo, la encuesta global Open Data Survey, de la que proviene el Open Data Index de la organización Open Knowledge International, contiene algunas preguntas sobre la accesibilidad legal y técnica de los conjuntos de datos como una medida de su calidad. El Open Data Barometer, por otra parte, tiene un apartado de impacto social de la apertura de datos. Este año destaca, entre otras cosas, que el impacto en transparencia y rendición de cuentas disminuyó un 22%, mientras que el impacto en emprendimientos se incrementó 15%, lo cual ilustra que ciertos grupos sociales se están beneficiando de la apertura más que otros.

El aprovechamiento de la información es clave para que los conjuntos de datos puedan ser relevantes, no hay relevancia sin aprovechamiento y no hay aprovechamiento sin acceso a la información. En el caso ilustrado por el Open Data Barometer, los conjuntos de datos son relevantes solamente para emprendedores, lo cual implica que no necesariamente son relevantes para cualquier otro grupo poblacional.

No obstante, se necesitan más detalles para la evaluación de la relevancia de los datos a nivel nacional y local. En 2015, el investigador Juan Ortiz Freuler publicó el Estado de la Oferta y la Demanda de Datos Abiertos Gubernamentales tras la implementación de normativas de la defenestrada Alianza por el Gobierno Abierto en México, (de la cual las organizaciones de ese país decidieron salir, precisamente, debido a la evidencia de espionaje en contra de defensores de la salud y otros activistas con software de uso exclusivo gubernamental).

El informe de Freuler mostró, entre otros análisis, que la mayoría de las solicitudes de información (emparentadas con la demanda de datos abiertos) fueron realizadas por personas con grado académico de licenciatura, lo cual implica una profunda brecha de acceso a ellos respecto de poblaciones no profesionalizadas.

En su Uso y Cumplimiento de la Legislación de Acceso a la Información Pública en Brasil, Chile y México , los investigadores Silvana Fumega y Marcos Mendiburu ofrecen también algunos ejemplos de las ventajas de obtener datos sobre la demanda de información pública.

Por ejemplo, en la investigación de Fumega y Mendiburu se detalla que México incorpora dentro de la Ley General de Transparencia y Acceso a la Información Pública (LGTAIP) la obligación del organismo garante de recopilar datos sobre las solicitudes de información pública.

Con esta obligación, tanto el Estado como actores independientes pueden llegar a la conclusión de que en 2013 los institutos de seguridad social nacionales en México y Brasil  y el ministerio de salud en Chile fueron las instancias públicas que más  solicitudes de información recibieron. A partir de esa información es posible tomar medidas para jerarquizar la información de dicha instancia de salud pública.

Simultáneamente, los datos estadísticos sobre las personas que hacen las solicitudes, como su edad, género o escolaridad, abonan a la necesidad de delinear con datos también las políticas públicas de datos abiertos.

Así, la estandarización técnica de ciertas prácticas permitiría obtener y cruzar datos sobre el uso y propósito de los mismos; la priorización contextual permitirá garantizar que poblaciones excluidas y en riesgo puedan beneficiarse tanto como el resto de los grupos sociales; y la evaluación permitirá monitorear el resultado de las prácticas mencionadas. 

En la publicación de las recomendaciones a las que antes aludí, sobre publicación de datos en internet, la W3C proponía generar a través de ellas una revolución exclusivamente tecnológica. No obstante, su articulación con estas otras formulaciones podría provocar una muy necesaria revolución que sí pertenece al orden de lo político: el empoderamiento de las comunidades a través del uso de conjuntos de datos.

El mapa musical de Bogotá

invitado - el mayo 22, 2017 en Experiencias, Fuentes de datos, Guest posts

Esta publicación es una contribución de la iniciativa Datasketch, que nace en Bogotá para promover el conocimiento del análisis y visualización de datos entre todas las capas de la sociedad (y no sólo entre especialistas), a nivel local y global.

Nuestros amigos de Datasketch accedieron a enriquecer el blog de Escuela de Datos con publicaciones periódicas. Su primera entrega es la aplicación de datos Mapa Musical de Bogotá, que realizaron haciendo un ejercicio de crowdsourcing sobre canciones emblemáticas del país y diseñando con javascript esta visualización interactiva.

Mapas de redes: así investigamos el poder en nuevo aeropuerto mexicano

invitado - el mayo 8, 2017 en Experiencias, Fuentes de datos, Noticias

Este post es una colaboración de Claudia Ocaranza, periodista de datos e investigación del Proyecto Organización, Desarrollo, Educación e Investigación (PODER), sobre la investigación Torre de Control, que navega y visualiza cientos de contratos de proveedores para la construcción del Nuevo Aeropuerto Internacional de la Ciudad de México (NAICM).

“El mundo es un pañuelo” decimos jocosamente cuando encontramos una conexión inesperada con otra persona. En la élite política y económica mexicana (y regional) esta frase debe repetirse mucho, ya que cuando empezamos a conectar puntos encontramos infinidad de conexiones inesperadas que en demasiados casos acaban generando grandes beneficios. La técnica, que por supuesto hace un uso extensivo de datos, se llama mapas o redes de poder.

Pero, ¿cómo se construyen las redes de poder? Existen diferentes formas y la finalidad siempre es mostrar las conexiones entre dos o más sujetos (personas, empresas u organizaciones). En el Proyecto sobre Organización, Desarrollo, Educación e Investigación (PODER) aplicamos esta técnica en la investigación empresarial y normalmente diferenciamos entre el mapa horizontal (proveedores, clientes y competidores) y el vertical (propietarios, accionistas, matrices y subsidiarias). Los datos que generamos los guardamos en una base de datos libre y abierta llamada QuiénEsQuién.wiki.

El último proyecto en el que hemos aplicado esta técnica es el de Torre de Control, un gran mapa de poder de todo el proceso de contratación de proveedores para la construcción del Nuevo Aeropuerto Internacional de la Ciudad de México.

 

Analizando la publicación, que nos guía a través de los contratos por medio de “diapositivas”, vemos dos elementos esenciales que nos orientan a través de ella: las conexiones y los nodos. Siguiendo el orden en que van apareciendo, primero tenemos el nodo central, el NAICM, luego están los tipos de contratación y en la tercera diapositiva están todos los contratos que hemos rastreado. Las empresas ganadoras de cada uno de los contratos aparecen en la cuarta diapositiva, y en la quinta la investigación vertical de ellas: a quién pertenecen.

A pesar de ser una red de poder, la TorreDeControl.org no es un mapa clásico de relaciones, dónde las conexiones no están estratificadas como lo están en este caso. Seguro que habrán visto redes más complejas que mapean las relaciones entre distintos actores. Aún así no hay una forma correcta de hacer los mapas de poder, todo depende de lo que quieras contar.

 

¿Dónde encontramos los datos? Esta pregunta no es sólo para los mapas de poder, sino para cualquier proyecto datero que quieras hacer. En el caso de la TorreDeControl.org bajamos, limpiamos y sistematizamos la información de más de 200 contratos realizados entre el Grupo Aeroportuario de la Ciudad de México (GACM) y diferentes proveedores, ya sean empresas, personas u organizaciones.

La limpieza y el análisis de los datos de contratos públicos, pero también de las empresas que participan en esas licitaciones y adjudicaciones, nos puede ayudar para encontrar relaciones que a simple vista no resultan tan evidentes. Para Torre de Control accedimos a data de Compranet, el repositorio de compras públicas del gobierno mexicano, datos.gob.mx, y realizamos solicitudes de información. Además trabajamos con nuestra propia base de datos de QuiénEsQuién.Wiki, en la que tenemos la información de las empresas y empresarios.

Así, pudimos construir una sola base de datos en la que unimos la información de los contratos con la de las empresas ganadoras, como sus socios, accionistas y miembros del Consejo de Administración. Con esto elevamos el nivel de conocimiento sobre quiénes (empresas y empresarios) se benefician con la construcción del NAICM. Como era de esperarse, el poder se concentra en ciertas empresas y sus socios, inversionistas, accionistas y consejeros, que suelen repetirse en las compañías de mayor poder.

Por tomar un ejemplo, el empresario Carlos Slim está relacionado con al menos 10 contratos del NAICM, ya sea a través de empresas matrices, subsidiarias y hasta familiares que también ganaron contratos.

 

Los datos que obtuvimos para Torre de Control reflejan que Radiomóvil Dipsa, S.A. de C.V. obtuvo por adjudicación directa el contrato para los servicios de telefonía celular. Esa es toda la información que se puede obtener de Compranet; sin embargo, revisando los datos empresariales de Radiomóvil Dipsa, encontramos que es subsidiaria de América Móvil.

Operadora CICSA, de Grupo Carso, propiedad de Carlos Slim, ganó en consorcio con otras empresas el contrato más jugoso del nuevo aeropuerto, la construcción del edificio terminal, por más de 84 mil millones de pesos. A su vez Grupo Carso tiene como inversionistas a seis bancos que también son prestamistas de un crédito para el Grupo Aeroportuario por más de 3 mil millones de dólares. (Desde PODER reporteamos esta data, aquí puedes leer nuestra nota.)

Ya encontramos las relaciones, ahora ¿cómo las mapeamos? Responder a cuatro preguntas nos ayudará para conocer cómo se mueve el poder: desde dónde surge, hacia dónde, dentro de dónde y con qué finalidad se ejerce. En el caso de Slim, el poder surge desde sus empresas hacia el Grupo Aeroportuario de la Ciudad de México, el cual decide cómo y a quién adjudicar las obras del aeropuerto. La finalidad, claro, es participar en la megaobra que recibirá una inversión de más de 180 mil millones de pesos.

Muchas veces tener una visualización nos ayuda a entender mejor los flujos de poder. Existen herramientas que nos permiten mapear estas redes de forma sencilla. Por mencionar dos, Gephi y VIS de Dashboard sirven para mostrar gráficamente cómo se relacionan dos o más sujetos.

La información se guía por redes de poder”, escribió Miguel Ángel Bastenier. El análisis de datos limpios y organizados nos lleva a dar sentido a montañas de información y a hacer evidente relaciones de poder que marcan el rumbo de las decisiones sobre megaproyectos que suceden en nuestro país.