Estás navegando por el archivo de Experiencias.

Escuela de Datos: 5 “abrelatames” juntos.

Marcos Ge - el Agosto 19, 2017 en Experiencias, Noticias

Junio de 2013, Uruguay, Montevideo: frente a una naciente comunidad de personas interesadas en el uso de la tecnología para el impacto social, se presentó Escuela de Datos en el primer ABRELATAM de la historia.

Este 2017, del 23 al 25 de agosto se lleva a cabo la quinta edición de esta desconferencia, que busca atar los esfuerzos de las comunidades y desatar los nudos que puedan encontrarse en el camino hacia un uso libre de los datos para el impacto social. En estos años, Escuela de Datos ha generado decenas de encuentros para crear comunidad, talleres, publicado cientos de contenidos y cursos gratuitos.

Muchas de estas acciones han sido ejecutadas por una comunidad en cuyo corazón están las y los fellows, aquí recapitulamos algunos de sus logros, cuya amplificación se debe, en gran medida, a cada ABRELATAM. ¡Conócelxs!

Antonio Cucho

Antonio Cucho Gamboa, fellow por Perú A finales de 2013 y  principios de 2014, fundó la organización Open Data Perú y se postuló en 2014 para el fellowship. Al tener capacidades técnicas como programador y unirse a periodistas co fundó la publicación online de periodismo de investigación Ojo Público.

Su experiencia organizando comunidades de datos abiertos comenzó en el encuentro regional más relevante para los datos abiertos en Latinoamérica: Abrelatam (2014).

Tras terminar su fellowship, Antonio se mudó para integrarse al equipo de periodismo de datos de Univision Noticias, medio estadounidense dirigido a la población hispana en Estados Unidos. Con Univision Data ha desarrollado diferentes trabajos relacionados con la defensa de los derechos de la población de contexto hispanoparlante, como un mapa interactivo para mostrar la población hispana que aún no domina el idioma inglés, describir los resultados de medio siglo de guerra en Colombia. Además, promovió la primera plataforma de factchecking en español (dentro del territorio estadunidense): “El Detector de Mentiras”.

A pesar de radicar fuera de Perú, su trabajo con ese país no ha concluido, lidera el desarrollo y coordina la investigación de la primera plataforma de contrataciones abiertas en  su país de origen. Este es un esfuerzo en conjunto de la comunidad Open Data Perú y la OSC Proética para promover la transparencia en las contrataciones estales, identificando diferentes patrones que permitirán a especialistas realizar una exploración más sencilla dentro de miles de contrataciones que contienen irregularidades en el proceso.

Si quieres saber más de lo que hizo Antonio durante su fellowship, da clic aquí.

Julio López

Durante su Fellowship, en 2015, Julio se concentró en datos de la industria de extracción, a través de su trabajo con Natural Resource Governance Institute.

Julio se encuentra trabajando como consultor de la División de Energía del Banco Interamericano de Desarrollo (BID), donde apoya la implementación de la Iniciativa Energía Sostenible para Todos (SEforAll) en América Latina y el Caribe. Antes de incorporarse al BID, trabajó en la Organización Latinoamericana de Energía (OLADE) como especialista de información energética y previamente coordinó proyectos de investigación en políticas públicas para think tanks y OSCs en América Latina.

En 2015 desarrolló su Fellowship en Escuela de Datos, donde trabajo en fortalecer la comunidad local de datos abiertos en Ecuador y colaboró con un proyecto global sobre datos de proyectos de industrias extractivas. Recientemente es co-fundador de @Datalat, una iniciativa civil sobre el uso de datos y tecnología en Ecuador.

Omar Luna

Tras su fellowship en 2015, Omar Luna dedicó sus esfuerzos en El Salvador a la colaboración con el medio independiente El Faro,  con quienes capacita a estudiantes de periodismo en diversos rubros políticos y de datos con el objetivo de la construcción de dos grandes productos: una base de datos que le sirva a El Faro para crear una visualización de datos de cara a las elecciones de diputados 2018-2021, así como la consolidación del Observatorio de Comunicación Política de la Universidad Centroamericana (UCA).

También colabora con Proyecto Cero, donde Omar lideró la construcción de una base de datos que visibiliza la toma de decisiones clave en la Asamblea Legislativa.. Omar conoció a la coordinadora, Claudia Ortiz,  el año pasado durante el desarrollo del fellow.

Una de las colaboraciones más cercanas y estrechas que tuvo durante y después de mi fellowship ha sido con el equipo de la unidad de datos de El Diario de Hoy (EDH). Su editora periodística, Lilian Martínez, y su editora de visualización, Norma Ramírez, contactaron a Omar para que desarrollara capacitaciones constantes en uso de hojas de cálculo y software de visualización. Con EDH también ha creado visualizaciones sobre temas como embarazo adolescente y personas desaparecidas.

Phi Requiem

En 2014, Phi Requiem dedicó su fellowship a la formación de capacidades entre periodistas y activistas centroamericanos. Hoy su vocación de capacitación continúa. Con la iniciativa Hagamos Data (#HagamosData), se encuentra entrenando un más amplio grupo de personas para el uso de datos: por una parte entrena entrenadores, y por otra entrena a público no especializado. Se encuentra en un proceso de acompañamiento con la organización con el National Democratic Institute (NDI) para el uso de datos.

Phi también colaboró con el equipo que desarrolló Ruido CDMX, la plataforma construida con hardware libre y código abierto para la recolección y visualización de ruido en la Ciudad de México. Actualmente se encuentra desarrollando una segunda fase de este proceso, Ruido en las Ciudades, con software y hardware libres de generaciones más eficientes y accesibles que las de la anterior. El objetivo es acercar la creación de estos recolectores de datos a un grupo muy diverso de la población para generar datos abiertos sobre este fenómeno, de amplio impacto ambiental y de salud.

Si quieres saber más del trabajo de Phi Requiem durante su fellowship, da clic aquí

Camila Salazar

Camila desarrolló su fellowship en 2015.  Ella tiene un grado universitario en periodismo y obtuvo un segundo grado en Economía.

Tras el fellowship, Camila se ha desenvuelto como periodista de datos en la Unidad de Datos del Diario La Nación.  Estos son los proyectos en los que participó en el último año:

  • Aplicación para calcular el salario en el sector público, para la que ejecutó una investigación sobre el sistema de remuneraciones en el sector público.
  • Factchecking en vivo del discurso presidencial.
  • También desarrolla multitud de investigaciones, como esta sobre el sector cooperativo en Costa Rica.
Además de ser periodista en campo, Camila comparte su conocimiento a través de la docencia universitaria, talleres y actividades sobre periodismo de datos. El semestre anterior impartió el curso de Periodismo de Datos en la Universidad de Costa Rica.  Es un curso que forma parte del plan de estudios del Bachillerato en Periodismo.

Si quieres saber más sobre la labor de Camila durante su fellowship, da clic aquí.

Raisa Valda

Dedicó su fellowship a generar comunidades de datos abiertos en toda Bolivia, así como a conectar con organizaciones aliadas para su proyecto de datos contra violencia de género Cuántas Más.

  • Fue seleccionada para ser parte de la Escuela de Incidencia de Ciudadano Inteligente (Chile) para trabajar sobre género y tecnologías.
  • También la invitaron, desde la Embajada de Suecia en Bolivia, a participar en Stockholm Internet Forum 2017(SIF17) on Internet Freedom for Global Development en mayo de este año.
  • Fue invitada a dictar un módulo de docencia junto a la Fundación para el Periodismo de La Paz en su Diplomado en periodismo digital, sobre redes sociales y otras tecnologías en el periodismo, en julio de 2017.
  • Participará en el IX Congreso de la AEB – Estudios de Internet y sociedad en Bolivia, con una ponencia sobre datos abiertos y ciudadanía, en julio de este año.

Raisa está dedicada íntegramente a Cuántas Más. A partir de los datos que obtuvieron en 2016 sobre los casos de feminicidio, hallaron dos que llamaron su atención:

1. en el 78% de los casos se trataban de feminicidios íntimos (esposos,concubinos, novios, ex novios, ex esposos, ex concubinos),
2. en el 34% de los casos, las víctimas tenían menos de 20 años de edad.
Por ello, en el primer trimestre de este año, centraron su trabajo de prevención en el abordaje de violencias dentro las relaciones de noviazgo en la adolescencia con una ruta de talleres (“No es que me pidas así”) piloto por 6 ciudades de Bolivia.
Se trata de talleres piloto para los que Raisa desarrolló una metodología que permite a los adolescentes, entre 15 y 17 años, hablar sobre sus percepciones de violencia y cómo la entiende; y a partir de ello generar mensajes en audiovisual en sus propios códigos lingüísticos (nada solemne, nada políticamente correcto). Este material no se difundirá como una campaña masiva, no es el propósito; sino a través de sus propias redes de manera natural.
Cuántas Más tiene el propósito de centrar su trabajo, para esta gestión, en temas violencia que involucra a jóvenes, sea en las relaciones de noviazgo (basadas en encuestas y estudios realizados por la Coordinadora de la Mujeres) o en su desenvolvimiento en la universidad (basado en un estudio realizado por UNFPA sobre la UMSA).

Ximena Villagrán

Durante y tras su fellowship, Ximena ha sido catedrática titular de Periodismo de Datos en la Universidad del Istmo. Es también consultora para proyectos periodísticos y talleres de periodismo de datos en Honduras, El Salvador y Guatemala para la agencia internacional Internews, con quienes comenzó su colaboración, al igual que Omar, durante el fellowship.

Hoy Ximena está fundando su propia iniciativa de periodismo de datos, El Intercambio, que propone un vínculo íntimo entre crónica y periodismo de datos y busca dotar a los periodistas de un rol más activo en la búsqueda de fondos para el periodismo independiente.

Junto con Omar Luna, desarrolló una extensa currrícula para periodistas de datos en toda Centroamérica. Hoy también es consultora para la nueva unidad de datos del medio guatemalteco Prensa Libre y trabaja en un proyecto de explicación, a través de los datos, con la publicación también guatemalteca Nómada.

Daniel Villatoro

Daniel Villatoro se desempeña hoy como reportero senior en el medio guatemalteco Plaza Pública. Además de escribir crónica y desarrollar investigaciones de datos, tras la fellowship, Daniel incursionó en prácticas artísticas a través de los datos.

Daniel desarrolló una investigación sobre ingresos económicos por hora trabajada y de acuerdo con etnia y género, para concluir rasgos visibles de explotación en las poblaciones femeninas de Guatemala.

Con esta investigación generó mapas y visualizaciones que dieron soporte a una propuesta en acrílico y billetes, para visualizar con elementos cotidianos las opresiones también cotidianas. Su solución formal se expuso durante Nuevas Proporciones.

 “Las gráficas son representaciones, recursos que se manifiestan visualmente para mostra relaciones […] Huyendo de la representación, busco trabajar las gráficas con los objetos mismos en vez de representarlos: algo tan obvio como personificar al dinero con un billete o al tiempo con un reloj”, puede leerse en la justificación de su proyecto.

Daniel Villatoro se ocupa, también desde el periodismo, constantemente con temas de opresión de clase y de etnia, sobre el ingreso de grandes capas de la población. Así ha desarrollado investigaciones con mapas y visualizaciones de datos  como esta, que aborda la insuficiencia del salario mínimo, como en muchos otros, en su país.

Sebastián Oliva

Sebastián se interesó por la computación desde una temprana edad. Cursó estudios universitarios en Ingeniería y Física. Sin embargo, mantuvo siempre un profundo interés por las ciencias sociales y la interacción y aplicaciones interdisciplinarias de las ciencias exactas. Sebastián ha trabajado tanto para empresas de tecnología, como para varios proyectos relacionados con tecnología y sociedad, como la creación de software y hardware libre en su natal Guatemala.

Hizo una pasantía en Google, en la división de nube, trabajando con almacenamiento no relacional y adquiriendo conocimientos en Python. Fue parte de los equipos ganadores de DAL 2014 y finalista del Space Apps Challenge 2014. Su interés por Escuela de Datos se dá naturalmente al alinear el impacto social con capacidades técnicas de análisis, extracción, procesamiento y presentación de datos. Entre sus otros intereses se encuentra la fotografía, principalmente​ documental, y los juegos de estrategia y rol.

Del Storytelling al StoryMap: espacializando Datos Abiertos en Colombia

invitado - el Agosto 16, 2017 en Experiencias, Guest posts, Tutoriales

Desde Bogotá D.C., Andrés Forero  , especialista en GIS y datos geográficos, nos envía este post como una introducción a una serie tutorial sobre datos geográficos y cómo podemos aprovecharlos desde distintos softwares para su edición y publicación.

Bien sabemos la importancia de los datos en nuestra sociedad hoy en día; grandes empresas almacenan sobre una base de datos información que describe gustos, costumbres y actividades personales. Si tienes una sesión activa desde una cuenta Google o Microsoft y deseas buscar un vuelo que vaya desde Bogotá hasta Ciudad de México, es probable que aparezca en tu pantalla, minutos u horas después, promociones en diferentes aerolíneas para que salgas del país. Si abres Instagram y buscas como etiqueta #Tulúm o #Cartagena, el aplicativo probablemente te sugiera lugares para pasar vacaciones junto a la playa a través de un anuncio.

Los datos gubernamentales no son la excepción. Haz de cuenta que desde el momento en que empezaste a leer este artículo han robado a diez personas en tu ciudad. ¿Qué variables puedes analizar allí?

El mapa anterior muestra algunos delitos reportados en la ciudad de Cali, los cuales pueden ser consultados y descargados directamente desde el Portal de Datos Abiertos de Colombia.

Entender la información geográfica es una iniciativa que debe ir tomando forma y debe inculcarse desde a la sociedad civil hacia los tomadores de decisiones. Las oportunidades y debilidades que presenta un dato geográfico son las mismas que presenta esa tabla que necesitas para procesar en un software estadístico pero que es publicada como PDF.

Cuando pides un UBER, los puntos de partida y de llegada que estableces deben estar ligados a un sistema de coordenadas. La dirección que escribes debe estar estructurada y estandarizada para que pueda identificarse en el aplicativo.

Ahora, haz de cuenta que una persona llama a la policía para reportar el robo de sus pertenencias en Cali; conocer con exactitud el lugar donde sucedió el evento puede resultar en análisis espaciales robustos que permitan establecer la cobertura de patrullas de policía para atender áreas específicas o establecer programas que garanticen seguridad hacia la sociedad civil.

Hacer proyectos de este tipo no son para nada complejos, por el contrario, existen herramientas que facilitan el procesamiento de esta información ya sea desde software libre o software licenciado gratuito para desarrolladores y para usted, amigo datero. ¡Todos somos parte del cambio!

Aquí hay algunos recursos online para que puedas conocer las ventajas y desventajas asociadas con los Sistemas de Información Geográfica: QGIS como software libre brinda la posibilidad de utilizarlo gratuitamente desde cualquier computadora, aquí encuentras cómo puedes utilizarlo. Por otro lado, ArcGIS Online es una alternativa que permite realizar análisis en la nube únicamente creando una cuenta como desarrollador, la cual es gratuita. aquí encuentras cómo puedes utilizarlo.

Integrarlos puede ser útil. Por ejemplo, desde el escritorio puedo establecer cuáles son los campos que veré posteriormente sobre un mapa: ¿Necesito la fecha? ¿Necesito el nombre del delito? ¿Habrá que modificar la simbología? Estos procesamientos que pueden llegar a ser complejos para alguien quien inicia en el mundo SIG puede hacerlo desde QGIS. Teniendo establecido qué información quieres publicar, ArcGIS Online te permitirá visualizar este contenido desde la web y allí hacer análisis únicamente seleccionando qué deseas utilizar.

Imagen 1. Análisis en ArcGIS Online
Fuente: autoría propia.

 

Observemos este mapa

 

Agregando los delitos a la capa de comunas podemos establecer cuál de ellas presenta mayor criminalidad con un criterio de clasificación.

Este análisis es solo una introducción de qué se puede llegar a hacer y cómo podemos empezar a construir soluciones innovadoras bajo un contexto netamente espacial. Bienvenidos al infoactivismo geográfico.

Prepárate para aprender Python, guía de instalación de bibliotecas.

invitado - el Julio 20, 2017 en Experiencias, Tutoriales, Uncategorized

Este post es una colaboración de Sebastián Oliva para Escuela de Datos. Es parte complementaria de los webinars y tutoriales que estamos publicando sobre Python y las bibliotecas del mismo lenguaje Pandas y Anaconda.

Saludos compañeros, bienvenidos a este micro-post respecto a la instalación y uso de Python para análisis de datos.

Python

 

 

 

 

 

 

Python es un lenguaje de programación, el cual es interpretado por un programa ejecutable, en el caso de Windows, un python.exe que ejecuta archivos .py (archivos de texto conteniendo codigo fuente).

# Este es un comentario
1 + 2 # esta es una operación valida, retorna 2
print("Hola Mundo!")
import antigravity

El primer paso es obtener entonces una instalación de Python. Actualmente existen dos versiones, Python 2 y Python 3. Python 3 es la versión actual y más reciente. A pesar de que hay aún algunas librerias que no han actualizado, la gran mayoría está disponible para ambas versiones.

Python

Puedes descargar Python de el sitio oficial. https://www.python.org/downloads/

Windows

En Windows el instalador asocia la extension .py, instala el editor de texto IDLE, e instala la terminal de Python. Puedes compobar tu instalación de tus rutas mediante presionar Windows + R y tecleando ahi python.exe.

Mac y Linux

El instalador para Mac OS asocia Python a la extension .py En Linux asegura de instalar el paquete python3 tambien asegure de instalar el paquete virtualenv.

Ecosistema

El segundo paso y uno de los grandes atractivos del ecosistema Python es el manejo de paquetes y dependencias. Actualmente existen varios instaladores de paquetes, que utilizan una estructura a común. Setuptools, Pip y Conda. Es también importante notar que Python permite la opción de instalarse dentro de un ambiente virtual, virtualenv. Virtualenv permite empaquetar una aplicación y sus dependencias en un espacio aislado, permitiéndote instalar versiones distintas de paquetes varios o congelar un proyecto a una cierta versión.

Paquetes Varios

Entre los paquetes mas usados está Numpy, software de manejo numérico. Pandas, NumPy, jupyter.

NumPy y Pandas son librerias que permiten manipulacion de datos.

Jupyter Notebooks te permite crear documentos que incluyen código, matemática, visualizaciones y texto. Soporta mas de 40 lenguajes en particular Python, R y Julia. También se pueden crear widgets interactivos.

matplotlib, seaborn

Anaonda

Conda es una distribución de paquetes cientificos, entre ellos, Python. Conda para Python incluye una variedad de paquetes muy útiles, Virtualenv, pandas, jupyter y más.

Miniconda es una version básica, que unicamente incluye a conda, Python y otros paquetes básicos. Anaconda es la versión completa e incluye mas de que 150 paquetes. conda install es el instalador de paquetes que permite utilizar esto paquetes

Puedes descargar Anaconda de https://www.continuum.io/downloads

Espacios de trabajo de Anaconda

Anaconda permite el manejo de espacios de trabajo, esto permite la organizacion de archivos relacionados, ambientes virtuales (virtualenv, R, etc).

Conclusiones y pasos siguientes

El proceso de instalación de Python es sencillo, el verdadero reto esta en el uso del lenguaje y en poder expresar algoritmos e ideas. Existe una gran variedad de tutoriales del lenguaje Python, entre ellos, uno de los mas destacados es Python Para Todos: http://mundogeek.net/tutorial-python/

Datos. ¿Qué tienen que ver con los Objetivos de Desarrollo Sostenible?

invitado - el Julio 19, 2017 en Experiencias, Guest posts, Uncategorized

Sustainable Development Goal #1: No Poverty

Este texto es una colaboración de Fredy Rodríguez, coordinador del Área de Datos del Think Thank para Latinoamérica y Caribe CEPEI.

En 2015, 193 líderes mundiales se comprometieron ante las Naciones Unidas con la Agenda 2030 sobre el Desarrollo Sostenible, la cual está compuesta por diecisiete (17) Objetivos Globales y 169 metas para lograr tres cosas: erradicar la pobreza extrema, combatir la desigualdad y la injusticia, y encontrar soluciones al cambio climático en 15 años, de los cuales ya han transcurrido año y medio.

 

No tenemos un plan b para resolver los problemas del mundo, ya que no tenemos un planeta b

 – Ban ki-moon-

 

El escenario de la Agenda 2030 presenta como consenso que los Objetivos de Desarrollo Sostenible (ODS) requieren un esquema robusto de generación y análisis de información pública y privada, tanto a nivel nacional como subnacional. Esto implica contar con información de calidad, con mayor nivel de desagregación de los datos y con una cobertura más amplia, que sirva tanto para la medición del progreso como para la toma de decisiones basadas en evidencia.

 

Es por esto que le fue delegado a la Comisión Estadística de Naciones Unidas –el cuerpo de más alto nivel en el Sistema Estadístico Global que reúne a los diferentes directivos de las Oficinas Nacionales de Estadística– la responsabilidad de formular el marco de indicadores globales para los objetivos y metas de la Agenda 2030.

 

Para lograr lo anterior, se creó el Grupo Interagencial y de Expertos sobre Indicadores ODS (IAEG-SDG por sus siglas en inglés) que forman Brasil, Colombia y México, representando a América Central y Sudamérica. A junio de 2017, el grupo tiene definido un esquema de 230 indicadores que se están poniendo a prueba para revisar la viabilidad y pertinencia de su medición.

 

Dada la importancia de la información para los ODS, asociada al logro de una unión de esfuerzos, se crea la Alianza Global de Datos para el Desarrollo Sostenible (GPSDD por sus siglas en inglés), con el fin de facilitar espacios de discusión entre sociedad civil, academia, sector privado, gobiernos, filantropía, organismos multilaterales, etc., promoviendo la llamada revolución de los datos, que no es otra cosa que usar nuevas fuentes de datos y mejorar la calidad y apertura de los datos en torno al desarrollo sostenible. Por su parte, la Conferencia Estadística de las Américas de la Comisión Económica para América Latina y el Caribe le dio prioridad a los ODS, ya que por primera vez se elaboró una declaración denominada “Declaración de La Mitad del Mundo”, en la que se incluyó como primer punto del documento lo siguiente:

 

“Reafirmamos nuestro compromiso con la generación de estadísticas de calidad, que sirvan para el seguimiento de las agendas nacionales de la Agenda 2030 para el Desarrollo Sostenible”[1]

 

 

En el contexto latinoamericano, existen algunas acciones planteadas por países como Colombia, Costa Rica y México, que son lideradas principalmente por las Oficinas Nacionales de Estadística para la creación de la hoja de ruta para la medición de los ODS.

 

La primera de ellas es el diagnóstico de disponibilidad de información, que toma como referencia los Planes Estadísticos Nacionales (PEN) para realizar un análisis de oferta y demanda de la información existente. De esto se obtiene la línea base de la información para los ODS, estado de calidad de los datos y factibilidad de producir nueva información o usar fuentes no tradicionales[2] de datos en los casos de que existan brechas para medir los Objetivos Globales en todo el territorio nacional.

 

En la otra cara de la moneda, existen países de nuestra región sin inicar el proceso para la implementación de los ODS y mucho menos el de identificación de necesidades de información para su medición: es un gran reto la apropiación del tema y la gestión de recursos para la implementación de esta agenda.

 

En el uso de fuentes no tradicionales de datos está el uso del Big Data, ya que un número considerable de instituciones prefieren los datos del sector privado, los cuales, aunque no tienen un gran rigor técnico como los que podrían tener las oficinas estadísticas nacionales, resultan más actualizados y permiten tomar decisiones rápidas. No obstante, existen teorías que critican estas fuentes al considerar que no tienen una calidad suficiente para tomar decisiones. Por ejemplo: el uso de datos de telecomunicaciones tiene una gran volumen de información valiosa, pero es posible que las personas de países de renta baja que no tienen acceso a telefonía móvil no estén en las mediciones y, por tanto, quedan fuera del radar de las políticas públicas.

 

El principio esencial de los ODS es “no dejar a nadie atrás”. Para esto se requieren datos desagregados y de calidad que incluyan a todos los aspectos de la agenda 2030

 

 

Los trabajos avanzados por el gobierno permiten identificar retos que deben ser enfrentados más allá de la definición última de los indicadores, desafíos que hacen referencia a la capacidad de contar con los datos necesarios para su medición y la necesidad de coordinar esfuerzos interinstitucionales para establecer responsabilidades en la recolección, procesamiento, análisis y difusión de la información. Sin embargo, la participación de organizaciones diferentes a gobierno, especialmente las que cuentan con fuentes no tradicionales de financiamiento, no se ha incluido en las discusiones y tampoco se les han asignados roles específicos para que empiecen a entregar sus datos.

 

Otro de los mayores retos es el de las políticas de datos abiertos, que son insuficientes para identificar los actores del ecosistema de datos para el desarrollos sostenible. De acuerdo con el mapeo de datos www.datarepublica.org realizado en tres paìses (Colombia, Costa Rica y México), los principales datos que se pueden acceder libremente a través de la Web son los difundidos por organizaciones de gobierno.  En contraste, el sector privado es aquel con menor cantidad de datos publicados, lo cual invita a la reflexión sobre las políticas de datos abiertos en el sentido de que deben ser masificadas a todos los sectores, teniendo en cuenta que los ODS son una responsabilidad colectiva por los impactos y efectos que cada sector realiza en las temáticas de estos ambiciosos objetivos.

 

Para finalizar, se concluye que las dificultades en materia de medición y obtención de datos están asociadas al logro de una implementación con enfoque multisectorial, es decir, que involucre a todos los actores, desde el ciudadano de pie hasta el gobierno. Dada la naturaleza multidimensional de este proceso, es necesario dedicar atención a la gestión de información de calidad por parte de todos los actores, especialmente en los países que requieren un apoyo especial para producir su información básica y que con esta agenda requieren un mayor esfuerzo económico para cubrir las demandas de información.

 

Por lo tanto, el sector privado, el gobierno, y los demás actores deben convertirse en aliados que brinden y gestionen la consecución de datos para el desarrollo sostenible, sirviendo como un bien público que mejora la vida de todos.

[1] Resolución de la Reunión de la Conferencia Estadística de las Américas de la Comisión Económica para América Latina, 2015.

[2] Las fuentes no tradicionales son las que se generan a través de big data, imágenes, etc, que no hacen parte de las fuentes tradicionales que son las encuestas y censos.

http://es.scoda.okfn.org/files/2017/07/Screen-Shot-2017-07-18-at-4.58.38-PM.png

¿Qué implica la data de género?

Raisa Valda Ampuero - el Junio 14, 2017 en Experiencias, Guest posts

Vivas Nos Queremos 8
En uno de los encuentros que tuvimos en Abrelatam 2016, a Majo Greloni (directora de Comunicación y Campañas Online en Wingu) y a mi nos motivó la curiosidad de identificar los desafíos sobre género y datos desde la diversidad que siempre caracteriza a este evento; fuimos voluntarias para conducir esta mesa y uno de los desafíos que se quedó rondando en mi cabeza tenía que ver con identificar qué se puede hacer con la poca data de género que tenemos para incidir en políticas públicas.

Entrando a una reflexión más profunda, me doy cuenta de que cuando empezamos una conversación sobre data de género, en la mayoría de los casos la primera puntualización que resalta es hablar sobre violencia de género y la ausencia de información que llega a ser una suerte de común denominador en Latinoamérica. Lo primero tiene que ver con que tendemos a limitar el tema de género al enfoque de violencia por el contexto urgente de nuestros países, y esa mirada es necesaria aunque no la única; lo segundo, un poco más preocupante, tiene que ver con la falta de datos de género, y si existen, la cuestionable calidad de los mismos.

Cuando hablamos de data de género no nos referimos meramente a un indicador enunciativo de hombres y mujeres dentro una base de datos: estamos hablando de todas las dimensiones que comprenden estos dos diferenciadores mayores, yendo a la construcción cultural y social más allá de lo biológicamente determinado. Esta construcción implica la comprensión de la vida de las mujeres y las disparidades, los desafíos políticos y legales que enfrentan y les impide avanzar; elementos que normalmente resultan ausentes de los datasets ante la falta del corte de género como componente primario de las bases de datos.

La perspectiva de género, en este sentido, alude no sólo al potencial de granularidad y calidad de datos y su consiguiente valor derivado del análisis, sino también a su potencial político, transformador de la realidad, es decir, una propuesta política que exige un compromiso a favor de la construcción de relaciones de igualdad de género. Sin buenos datos, nos perdemos de detalles cruciales que pueden cambiar disparidades y acortar caminos en los desafíos planteados; no podemos ver con precisión qué es lo que necesita ser modificado, si es que las soluciones planteadas funcionan o no, o si hay progreso en lo que estamos haciendo.

 

Desde cualquiera que sea nuestra rama de interés, la data de género implica no solamente una cuestión técnica que en definitiva tiene un peso importante y que determina la calidad de futuros análisis, al mismo tiempo hablamos de una cuestión basada en política y por lo tanto, la determinación de qué valores medir. En ese sentido, si consideramos que tenemos recursos limitados para la recolección de datos, la elección sobre qué medir, cómo medirlo y quién está midiendo puede profundizar una división inadecuada de datos y proporcionar datos sexistas o poco útiles.

No hay igualdad de género sin igualdad de datos

“Medimos lo que valoramos y si no es parte de la mentalidad que, por ejemplo, el trabajo no remunerado de las mujeres en el hogar tiene un valor económico además de otros beneficios y, por lo tanto, no medimos ese trabajo, entonces no podemos ver cómo las mujeres impulsan el desarrollo económico y productivo de los países”, dice Emily Courey Pryor, directora de la iniciativa Data2X de la Fundación de las Naciones Unidas, cuyo objeto es mejorar la disponibilidad y el uso de los datos de género.

El vínculo entre los datos de género y el empoderamiento económico de las mujeres es un ejemplo enorme, y sin embargo es sólo una de las múltiples áreas en las que esta data es carente o inexistente.

Pasar por alto estas valoraciones contribuye a una cultura de invisibilidad; como el ejemplo expuesto por Courey existen otros tantos, relacionados por ejemplo a la edad reproductiva de las mujeres, que según la OMS, se define entre 15 y 49 años; y sin embargo las niñas menores de 15 años representan 2 millones de los 7,3 millones de embarazos de niñas menores cada año en los países en desarrollo, según UNFPA. Estos 2 millones de niñas no aparecen en las estadísticas y sin embargo están ahí.

La data de género, precisa y completa, abre la puerta a la identificación y consiguiente subsanación de estas brechas de datos, que a su vez se traducen en promoción de políticas efectivas para el cierre de brechas de desigualdad.

Con este panorama, conversando con Natália Mazzote (Co-Directora en Gênero e Número y Administradora de programas en Escola de Dados Brasil), concordamos que las varias implicaciones de los datos de género se convierten en un reto desde el punto de vista de la planificación estratégica: contamos con bases de datos e información sobre temas varios, como por ejemplo la empleabilidad en carreras universitarias tecnológicas, pero no contamos con información suficiente para medir, por ejemplo, la asimetría de género pues el recorte de datos de género se excluye o no se considera como importante dentro de estas recolecciones; a fin de cubrir esta brecha, el proceso al que normalmente recurrimos quienes trabajamos género desde distintas perspectivas, es el de crear una estructura propia recurriendo a fuentes alternas, especialistas en la materia y otros.

Esto implica un gran esfuerzo al momento de generar bases de datos y análisis como resultado de investigaciones, y poner este conjunto disponible para cualquier interesado; pero por momentos queda limitado al alcance local al no tener estándares internacionales que nos permitan tener una comparación macro de lo que está pasando a nivel regional.

 

Dos esfuerzos más visibles para subsanar la falta de estándares internacionales, mejorar la disponibilidad y el uso de los datos de género son:

  • Publicado en septiembre de 2015, los 16 indicadores globales “Listos para medir” (Ready to Measure) y monitorear los resultados para mujeres y niñas sobre los Objetivos de Género de los Objetivos de Desarrollo Sostenible (ODS), lanzados por la Organización de las Naciones Unidas con una nueva agenda de desarrollo sostenible y metas al 2030; los 17 objetivos que componen este compromiso han planteado un escenario más transversal para el tratamiento de las disparidades de género: la incorporación sistemática de una perspectiva de género en la implementación de la agenda global de trabajo, reflejada en la identificación de la meta 5 denominada “Igualdad de Género” y 11 ODS incluyen metas específicas desagregadas por género.

Impulsado por Data2x, quienes han identificado 28 brechas de datos en cinco ámbitos: salud, educación, oportunidades económicas, participación política y seguridad humana, ya cuentan con definiciones acordadas internacionalmente, que se elaboran a través de los instrumentos de recolección de datos disponibles, que ya cuentan con una cobertura relativamente amplia, que no tienen sesgos de género incorporados, y que están basados en las recomendaciones de ONU Mujeres, el Grupo Interinstitucional y de Expertos sobre Estadísticas de Género, el Grupo de Trabajo Abierto, los indicadores de los ODS y la actual lista de la Comisión de Estadística de las Naciones Unidas, incluyendo pero no limitado a la meta cinco sobre Igualdad de Género de los Objetivos de Desarrollo Sostenible. Están en la búsqueda de unir esfuerzos con otros socios, expertos y agencias nacionales para poner a prueba los indicadores “Listos para medir” y motivar el inicio de la recolección de datos de género.

  • Más reciente, de septiembre de 2016, la iniciativa emblemática “Haciendo que cada mujer y cada niña cuenten” (Making Every Woman and Girl Count) de ONU Mujeres. El programa de cinco años invertirá los recursos y la experiencia necesarios, centrándose en 12 países pioneros, para generar, priorizar y utilizar los datos de género. Ayudará a los países a formular políticas basadas en datos concretos y orientadas a aplicar plenamente los progresos logrados en relación con los objetivos de desarrollo sostenible (GDS).

 

En ambos casos existen objetivos claramente trazados, en búsqueda de resultados que ciertamente no veremos en el corto plazo, pero que significan un esfuerzo importante por trascender en la necesidad de mejores datos de género.

 

La labor continua y el rol desde sociedad civil

 

En el continuo ejercicio de demanda y generación de mejor data de género por parte de la ciudadanía hacia los gobiernos, vale la penar que como ejercicio recordemos y apliquemos los Principios Básicos para la Revolución de Datos para el Desarrollo Sostenible, presentado en el informe de la revolución de datos “Un mundo que cuenta” (A world that counts) de Naciones Unidas, para entender qué pedimos, cuáles las características que necesitamos y cómo lo pedimos:

  1. CALIDAD Y RELEVANCIA DE LOS DATOS: Lo había mencionado anteriormente, la invisibilización del corte de género deriva en un análisis de dataset sesgados, lo que limita la posibilidad de generar transformaciones.
  2. DESAGREGACIÓN DE DATOS: Se ha considerado al corte de género como omnipresente en las bases de datos, sabemos que se hizo, pero en algún punto alguien consideró que no eran importantes para el análisis; esta práctica invisibiliza realidades.
  3. OPORTUNIDAD DE DATOS: Los datos retrasados ​​son datos negados; la falta de datos desagregados y en el tiempo oportuno significan un dificultad mayor y una demora para la pertinente revisión de las políticas públicas.
  4. TRANSPARENCIA DE DATOS Y APERTURA: Todos los datos sobre cuestiones públicas y / o financiados por fondos públicos, incluidos los datos producidos por el sector privado, deberían hacerse públicos y “abiertos por defecto”, con excepciones estrictas para las preocupaciones reales de seguridad o privacidad. En lo relacionado a género específicamente, la falta de transparencia y apertura de estos datos está generando poca precisión en la identificación de problemas y posibles soluciones, en lo que demandamos al aparato público.
  5. DATOS DE USABILIDAD Y CURACIÓN: La arquitectura de datos debe poner gran énfasis en el diseño centrado en el usuario y en interfaces amigables para el usuario, considerando que los usuarios frecuentes de estos datos, además de los organismos públicos, son organizaciones de sociedad civil. Datasets incomprensibles o información con componentes de complejidad innecesarios, como PDFs con contraseña, no facilitan el consumo de datos.
  6. PROTECCIÓN DE DATOS Y PRIVACIDAD: Es necesario elaborar normativa clara, políticas y marcos jurídicos sólidos que regulen la inclusión y la exclusión voluntaria, la extracción de datos, la reutilización con otros fines, la transferencia y la difusión. Los ciudadanos deberían poder comprender y controlar mejor sus propios datos y proteger a los productores de datos de las demandas de los gobiernos y de otros ataques.
  7. GOBIERNO DE LOS DATOS E INDEPENDENCIA: En la alternancia del poder político, muchas oficinas nacionales de estadística se ven afectadas en sus procesos y continuidad de acciones, las coloca en una posición de vulnerabilidad a la influencia de los grupos políticos y de interés. La calidad de los datos debe ser protegida y mejorada mediante el fortalecimiento y la garantía de que son funcionalmente autónomos, independientes de los ministerios sectoriales y de la influencia política.
  8. RECURSOS Y CAPACIDAD DE LOS DATOS: Una doble responsabilidad, por una parte requiere inversiones, por ejemplo, en capital humano, mejores tecnologías, infraestructura, datos geoespaciales y sistemas de gestión principalmente en sistemas gubernamentales; por otra debe desarrollarse la capacidad de ciencia de datos en los servidores públicos y organizaciones de sociedad civil para generar valor agregado a partir de datos, ello puede convertirse en un elemento complementario de calidad a las estadísticas oficiales.
  9. DERECHOS DE DATOS: Es la comprensión de que la revolución de los datos está estrechamente vinculada al ejercicio y resguardo de los derechos humanos, entre otros, el derecho a ser contados, el derecho a la identidad, el derecho a la privacidad ya la propiedad de los datos personales, el derecho al debido proceso, por nombrar algunos, pero que en esencia implican.

 

Finalmente, como periodistas, investigadores y activistas las puertas están abiertas para replantearnos la perspectiva de nuestras causas y empezar a dar enfoque de datos a los temas de género: ello nos conduce a una discusión en un nivel más puntual y efectivo, trascendiendo más allá de lo mediático y empujando a la reflexión más objetiva que se enfoque justamente en subsanar aquellas disparidades invisibilizadas; los datos son la herramienta más concreta para incidir en políticas públicas.

 

 

Relevancia de datos abiertos: del discurso al impacto

Marcos Ge - el Mayo 29, 2017 en DAL, Experiencias, Fuentes de datos, Guest posts

Chasm

CC by SA Monyo Kararan

Hay todavía un abismo entre el discurso de datos abiertos y el impacto que esta apertura, publicación, vinculación y otras prácticas tienen en la vida de las poblaciones globales. El puente entre los extremos de ese abismo es la relevancia de los datos, es decir, la capacidad que estos tienen para ser aprovechados efectivamente por las diversas poblaciones globales. Este abismo parece especialmente insondable para poblaciones que son política y socialmente excluidas.

La vinculación de los dos extremos de ese hueco es cada vez de una necesidad mayor, toda vez que organismos, oficiales y autónomos globales, han adoptado en mayor o menor medida dicho discurso de apertura de datos.

Es necesario en este punto, a la vez que admitir los avances, prestar atención a las muchas deficiencias en políticas de apertura en regiones específicas, reconocer que la apertura no es un fin en sí mismo, y que resulta trivial si no viene aparejada de garantías de acceso y uso de los conjuntos de datos. Más aún, resulta indispensable establecer mecanismos concretos y específicos para corregir esta deficiencia.

Para ello deben desarrollarse estándares contextuales, técnicos y de evaluación,  con miras a la inclusión de amplias poblaciones que se beneficien del impacto de las políticas de apertura de datos.

El eje técnico

Dear W3C

CC by NC SA Paul Downey

En un sentido técnico, la relevancia de datos es una métrica de calidad de datos que vincula los sets de datos disponibles con el interés de actores sociales. En este mismo sentido, parte del abismo entre apertura e impacto es irónicamente un vacío de (meta)datos: aquellos que se refieren a las potencialidades de “consumo” de dichos conjuntos de datos.

En una publicación sobre prácticas recomendables para la publicación de datos en la web,  el World Wide Web Consortium (W3C) detalla una serie de criterios para que los conjuntos de datos sean vinculables y aprovechables en máximo grado. Entre estas prácticas, se encuentra el uso de un Vocabulario para el Uso de Conjuntos de datos (DUV, por sus siglas en inglés), para proveer un modo de retroalimentación entre “consumidores” y “publicadores” de datos sobre el uso de los mismos. Por ejemplo, agregando metadatos descriptivos a los conjuntos de datos, tanto sobre la base en sí misma, como de sus posibles usos. De esta manera, se generan metadatos que permiten contrastar el uso sugerido y el reuso dado.

Estas nuevas prácticas se adscriben a los principios FAIR y concuerdan con el espíritu de distribución y acceso universal que originalmente concibió internet.

Phil Archer, una de las diecinueve personas que redactó las recomendaciones, describe el propósito del documento de la siguiente manera:

“Quiero una revolución. No una revolución política, ni ciertamente una revolución violenta, pero una revolución a fin de cuentas. Una revolución de la manera en la que las personas piensan sobre compartir datos en la red”.

El eje contextual

Ayot2inapa

CC by SA Marcos Ge

Para implementar relevancia hace falta una revolución que sí es de índole política: el reconocimiento de necesidades prioritarias en la publicación de conjuntos de datos, con respecto a necesidades de todos los grupos poblacionales, pero con especial atención a datos sobre garantías individuales que son sistemáticamente violentadas por gobiernos y otros actores sociales en distintas latitudes globales.

Por ejemplo, en el contexto mexicano, la Corte Interamericana de Derechos Humanos (CIDH) detalla en uno de sus informes más recientes no sólo algunas de las violaciones sistemáticas de Derechos Humanos: desaparición, desaparición forzada, tortura, ejecuciones extrajudiciales, injusticia; sino también las poblaciones más vulneradas por estas violaciones: mujeres, pueblos indígenas, niñas, niños, adolescentes, defensoras de derechos humanos, personas migrantes, personas lesbianas, gay, bisexuales, trans y otras formas de disentimiento sexual.

En países en que se viven estas condiciones, es indispensable que este contexto de Derechos Humanos sea considerado como un factor determinante para la elaboración de políticas de apertura de datos relevantes. Aparejada a estas políticas, sólo la instrumentación de reglamentaciones y mecanismos concretos de análisis de la demanda de datos puede proveer a estas poblaciones de elementos para su defensa, que convengan efectivamente en la mejora de sus vidas.

Un paso más para asegurar la relevancia de los datos abiertos es la creación de mecanismos específicos que garanticen que poblaciones política y económicamente excluidas tengan acceso a un volumen y calidad de datos suficientes que les permita trabajar para erradicar las prácticas mismas que han promovido su exclusión.

Es decir, debe existir una concordancia entre las políticas de apertura de datos y la agenda pública propuesta por un gobierno abierto para el empoderamiento de la población, agenda que ya de por sí debe incluir a las poblaciones mencionadas.

Para la elaboración de estándares de todo tipo sobre políticas de relevancia de datos deben ser llamadas a participar no solamente especialistas en defensa de derechos, legislaciones nacionales e internacionales y otras disciplinas, sino principalmente representantes de estas poblaciones vulneradas y despojadas de la vida o de factores que permitan una vida digna.

Hoy en día, la generación y publicación de datos con esta perspectiva se está llevando a cabo por organizaciones activistas. En México, por ejemplo, periodistas e investigadores independientes hicieron pública una base de datos sobre personas desaparecidas, y en Bolivia son activistas quienes construyen una base de datos sobre feminicidios; en España periodistas organizaron datos sobre la brecha de clase en el acceso a medicamentos; en Estados Unidos, un profesor universitario creó una base de variables relevantes para la comunidad LGBTTI; y desde el Reino Unido, el medio The Guardian creó una plataforma que muestra el número de personas de raza negra que mueren por causa de disparos de policías.

El eje de evaluación

Derivado del emparejamiento de los nuevos estándares técnicos propuestos por la W3C con las prioridades humanitarias globales, las poblaciones tendrían herramientas para exigir no sólo la calidad de los datos en los términos tradicionales de formatos de apertura, sino también en cuanto a su relevancia.

Por ejemplo, la encuesta global Open Data Survey, de la que proviene el Open Data Index de la organización Open Knowledge International, contiene algunas preguntas sobre la accesibilidad legal y técnica de los conjuntos de datos como una medida de su calidad. El Open Data Barometer, por otra parte, tiene un apartado de impacto social de la apertura de datos. Este año destaca, entre otras cosas, que el impacto en transparencia y rendición de cuentas disminuyó un 22%, mientras que el impacto en emprendimientos se incrementó 15%, lo cual ilustra que ciertos grupos sociales se están beneficiando de la apertura más que otros.

El aprovechamiento de la información es clave para que los conjuntos de datos puedan ser relevantes, no hay relevancia sin aprovechamiento y no hay aprovechamiento sin acceso a la información. En el caso ilustrado por el Open Data Barometer, los conjuntos de datos son relevantes solamente para emprendedores, lo cual implica que no necesariamente son relevantes para cualquier otro grupo poblacional.

No obstante, se necesitan más detalles para la evaluación de la relevancia de los datos a nivel nacional y local. En 2015, el investigador Juan Ortiz Freuler publicó el Estado de la Oferta y la Demanda de Datos Abiertos Gubernamentales tras la implementación de normativas de la defenestrada Alianza por el Gobierno Abierto en México, (de la cual las organizaciones de ese país decidieron salir, precisamente, debido a la evidencia de espionaje en contra de defensores de la salud y otros activistas con software de uso exclusivo gubernamental).

El informe de Freuler mostró, entre otros análisis, que la mayoría de las solicitudes de información (emparentadas con la demanda de datos abiertos) fueron realizadas por personas con grado académico de licenciatura, lo cual implica una profunda brecha de acceso a ellos respecto de poblaciones no profesionalizadas.

En su Uso y Cumplimiento de la Legislación de Acceso a la Información Pública en Brasil, Chile y México , los investigadores Silvana Fumega y Marcos Mendiburu ofrecen también algunos ejemplos de las ventajas de obtener datos sobre la demanda de información pública.

Por ejemplo, en la investigación de Fumega y Mendiburu se detalla que México incorpora dentro de la Ley General de Transparencia y Acceso a la Información Pública (LGTAIP) la obligación del organismo garante de recopilar datos sobre las solicitudes de información pública.

Con esta obligación, tanto el Estado como actores independientes pueden llegar a la conclusión de que en 2013 los institutos de seguridad social nacionales en México y Brasil  y el ministerio de salud en Chile fueron las instancias públicas que más  solicitudes de información recibieron. A partir de esa información es posible tomar medidas para jerarquizar la información de dicha instancia de salud pública.

Simultáneamente, los datos estadísticos sobre las personas que hacen las solicitudes, como su edad, género o escolaridad, abonan a la necesidad de delinear con datos también las políticas públicas de datos abiertos.

Así, la estandarización técnica de ciertas prácticas permitiría obtener y cruzar datos sobre el uso y propósito de los mismos; la priorización contextual permitirá garantizar que poblaciones excluidas y en riesgo puedan beneficiarse tanto como el resto de los grupos sociales; y la evaluación permitirá monitorear el resultado de las prácticas mencionadas. 

En la publicación de las recomendaciones a las que antes aludí, sobre publicación de datos en internet, la W3C proponía generar a través de ellas una revolución exclusivamente tecnológica. No obstante, su articulación con estas otras formulaciones podría provocar una muy necesaria revolución que sí pertenece al orden de lo político: el empoderamiento de las comunidades a través del uso de conjuntos de datos.

El mapa musical de Bogotá

invitado - el Mayo 22, 2017 en Experiencias, Fuentes de datos, Guest posts

Esta publicación es una contribución de la iniciativa Datasketch, que nace en Bogotá para promover el conocimiento del análisis y visualización de datos entre todas las capas de la sociedad (y no sólo entre especialistas), a nivel local y global.

Nuestros amigos de Datasketch accedieron a enriquecer el blog de Escuela de Datos con publicaciones periódicas. Su primera entrega es la aplicación de datos Mapa Musical de Bogotá, que realizaron haciendo un ejercicio de crowdsourcing sobre canciones emblemáticas del país y diseñando con javascript esta visualización interactiva.

Mapas de redes: así investigamos el poder en nuevo aeropuerto mexicano

invitado - el Mayo 8, 2017 en Experiencias, Fuentes de datos, Noticias

Este post es una colaboración de Claudia Ocaranza, periodista de datos e investigación del Proyecto Organización, Desarrollo, Educación e Investigación (PODER), sobre la investigación Torre de Control, que navega y visualiza cientos de contratos de proveedores para la construcción del Nuevo Aeropuerto Internacional de la Ciudad de México (NAICM).

“El mundo es un pañuelo” decimos jocosamente cuando encontramos una conexión inesperada con otra persona. En la élite política y económica mexicana (y regional) esta frase debe repetirse mucho, ya que cuando empezamos a conectar puntos encontramos infinidad de conexiones inesperadas que en demasiados casos acaban generando grandes beneficios. La técnica, que por supuesto hace un uso extensivo de datos, se llama mapas o redes de poder.

Pero, ¿cómo se construyen las redes de poder? Existen diferentes formas y la finalidad siempre es mostrar las conexiones entre dos o más sujetos (personas, empresas u organizaciones). En el Proyecto sobre Organización, Desarrollo, Educación e Investigación (PODER) aplicamos esta técnica en la investigación empresarial y normalmente diferenciamos entre el mapa horizontal (proveedores, clientes y competidores) y el vertical (propietarios, accionistas, matrices y subsidiarias). Los datos que generamos los guardamos en una base de datos libre y abierta llamada QuiénEsQuién.wiki.

El último proyecto en el que hemos aplicado esta técnica es el de Torre de Control, un gran mapa de poder de todo el proceso de contratación de proveedores para la construcción del Nuevo Aeropuerto Internacional de la Ciudad de México.

 

Analizando la publicación, que nos guía a través de los contratos por medio de “diapositivas”, vemos dos elementos esenciales que nos orientan a través de ella: las conexiones y los nodos. Siguiendo el orden en que van apareciendo, primero tenemos el nodo central, el NAICM, luego están los tipos de contratación y en la tercera diapositiva están todos los contratos que hemos rastreado. Las empresas ganadoras de cada uno de los contratos aparecen en la cuarta diapositiva, y en la quinta la investigación vertical de ellas: a quién pertenecen.

A pesar de ser una red de poder, la TorreDeControl.org no es un mapa clásico de relaciones, dónde las conexiones no están estratificadas como lo están en este caso. Seguro que habrán visto redes más complejas que mapean las relaciones entre distintos actores. Aún así no hay una forma correcta de hacer los mapas de poder, todo depende de lo que quieras contar.

 

¿Dónde encontramos los datos? Esta pregunta no es sólo para los mapas de poder, sino para cualquier proyecto datero que quieras hacer. En el caso de la TorreDeControl.org bajamos, limpiamos y sistematizamos la información de más de 200 contratos realizados entre el Grupo Aeroportuario de la Ciudad de México (GACM) y diferentes proveedores, ya sean empresas, personas u organizaciones.

La limpieza y el análisis de los datos de contratos públicos, pero también de las empresas que participan en esas licitaciones y adjudicaciones, nos puede ayudar para encontrar relaciones que a simple vista no resultan tan evidentes. Para Torre de Control accedimos a data de Compranet, el repositorio de compras públicas del gobierno mexicano, datos.gob.mx, y realizamos solicitudes de información. Además trabajamos con nuestra propia base de datos de QuiénEsQuién.Wiki, en la que tenemos la información de las empresas y empresarios.

Así, pudimos construir una sola base de datos en la que unimos la información de los contratos con la de las empresas ganadoras, como sus socios, accionistas y miembros del Consejo de Administración. Con esto elevamos el nivel de conocimiento sobre quiénes (empresas y empresarios) se benefician con la construcción del NAICM. Como era de esperarse, el poder se concentra en ciertas empresas y sus socios, inversionistas, accionistas y consejeros, que suelen repetirse en las compañías de mayor poder.

Por tomar un ejemplo, el empresario Carlos Slim está relacionado con al menos 10 contratos del NAICM, ya sea a través de empresas matrices, subsidiarias y hasta familiares que también ganaron contratos.

 

Los datos que obtuvimos para Torre de Control reflejan que Radiomóvil Dipsa, S.A. de C.V. obtuvo por adjudicación directa el contrato para los servicios de telefonía celular. Esa es toda la información que se puede obtener de Compranet; sin embargo, revisando los datos empresariales de Radiomóvil Dipsa, encontramos que es subsidiaria de América Móvil.

Operadora CICSA, de Grupo Carso, propiedad de Carlos Slim, ganó en consorcio con otras empresas el contrato más jugoso del nuevo aeropuerto, la construcción del edificio terminal, por más de 84 mil millones de pesos. A su vez Grupo Carso tiene como inversionistas a seis bancos que también son prestamistas de un crédito para el Grupo Aeroportuario por más de 3 mil millones de dólares. (Desde PODER reporteamos esta data, aquí puedes leer nuestra nota.)

Ya encontramos las relaciones, ahora ¿cómo las mapeamos? Responder a cuatro preguntas nos ayudará para conocer cómo se mueve el poder: desde dónde surge, hacia dónde, dentro de dónde y con qué finalidad se ejerce. En el caso de Slim, el poder surge desde sus empresas hacia el Grupo Aeroportuario de la Ciudad de México, el cual decide cómo y a quién adjudicar las obras del aeropuerto. La finalidad, claro, es participar en la megaobra que recibirá una inversión de más de 180 mil millones de pesos.

Muchas veces tener una visualización nos ayuda a entender mejor los flujos de poder. Existen herramientas que nos permiten mapear estas redes de forma sencilla. Por mencionar dos, Gephi y VIS de Dashboard sirven para mostrar gráficamente cómo se relacionan dos o más sujetos.

La información se guía por redes de poder”, escribió Miguel Ángel Bastenier. El análisis de datos limpios y organizados nos lleva a dar sentido a montañas de información y a hacer evidente relaciones de poder que marcan el rumbo de las decisiones sobre megaproyectos que suceden en nuestro país.

¿Cómo celebramos el Open Data Day 2017 en Quito?

Julio López - el Marzo 14, 2017 en Experiencias, Guest posts, Noticias

Texto por Lisette Arévalo Gross (@larevalogross) *Periodista ecuatoriana de Gkillcity y Datalat

Con las cerca de 60 sillas completamente llenas, a las 09:00 comenzó el Open Data Day 2017. Por segunda vez en Ecuador (aquí la edición 2016), Datalat y MediaLabUIO organizaron este evento para fomentar el uso de datos abiertos para la transformación social. Iván Terceros y Margarita Yepez del Medialab UIO y Datalat, dieron la bienvenida a los asistentes. El enfoque de este Open Data Day fue medio ambiente y datos abiertos, en su mayoría, las actividades se enfocan en cómo utilizar herramientas de datos abiertos en este contexto. A continuación hacemos un repaso de dichas actividades que se agruparon en 4 talleres y 5 charlas sobre proyectos con datos, networking y una actividad de cierre hands on.

Agradecemos a todos los asistentes, a los equipos de MediaLabUIO y Datalat, y a todas las organizaciones que apoyaron el evento: Urbamapp, Gkillcity, Biciacción, LlactaLab, Mi Bus UIO, OuiShare Quito, Verde Muskuna, Handytec y Fundación Ciudadana y Desarrollo. Todos estos esfuerzos enriquecen la comunidad local de datos abiertos, y sobre todo fomentar el uso de datos abiertos en ONGs, gobiernos, empresas y sociedad civil.

Talleres

  • DatClima, datos y técnicas – Verde Muskuna, Marco Calderón, director de Verde Muskuna, compartió técnicas y datos acerca del clima. Con ejemplos cortos, los asistentes conocieron las tendencias históricas del clima en el Ecuador, técnicas para trabajar con grandes volúmenes de datos climáticos, impactos de los cambios en el clima sobre la producción agrícola, y portales para generar y descargar información del clima futuro. Como conclusión del taller, se establecieron las prioridades para la generación y manejo de datos del clima, así como ideas para estudios complementarios.
  • Datos abiertos 1.0 – Datalat, Julio López, de la Escuela de Datos y Datalat, realizó un taller para aquellos que por primera vez se acercan al al uso de datos abiertos. Desde funcionarios del Municipio de Quito hasta periodistas, los asistentes aprendieron a diferenciar una base de datos abiertos de una cerrada, qué pasos seguir en caso de no tener acceso a información, herramientas para visualizar datos, cómo transformar pdfs en excels, y más técnicas básicas. Los asistentes utilizaron un ejemplo de cuántos metros cuadrados existen por habitante en Quito para repasar paso a paso cómo manejar una base de datos para responder una incógnita.
  • Mining semi-structured data with Elasticsearch & Kibana – Handytec, El taller estuvo a cargo del director ejecutivo de Handytec, empresa dedicada a proveer herramientas y soluciones estratégicas para la captura, procesamiento, análisis y visualización de grandes bases de datos. Diego Montúfar presentó el stack de Elastic como herramienta para almacenar, procesar y visualizar datos semi estructurados y Big Data. Los participantes estuvieron expuestos a tres casos de uso: Análisis de Redes sociales en tiempo real, Clickstream Análisis y Log Analytics. La charla se llevó a cabo con 20 asistentes de diversos perfiles profesionales y todos mostraron interés profundo en la herramienta. Algunos solicitaron un taller técnico más detallado para aprender a utilizar la herramienta.
  • Técnicas de mapeo y visualización de datos – Urbamapp, el quipo de Urbamapp explicó las razones y beneficios de mapear; una presentación con antecedentes destacados acerca de mapas al servicio de investigaciones y de herramientas de mapeo gratis y privadas; en este punto, se mostró un demo de Urbamapp como una aplicación útil para recolectar información georreferenciada. Los asistentes hicieron un ejercicio práctico que les permitió mapear árboles cercanos y diferenciarlos con las etiquetas: “árboles patrimoniales” y “no patrimoniales”. Finalmente, los participantes y el equipo de Urbamapp tuvieron una charla más cercana sobre cómo usar la app para sus proyectos académicos y de investigación.

Charlas sobre proyectos con Datos

  • Factchecking – Gkillcity, Lisette Arévalo Gross, editora de la revista digital Gkillcity y miembro de Datalat, quien habló sobre la primera plataforma de factchecking del país, El Verificador. El objetivo, explicó Arévalo, es que a través de bases de datos se pueda verificar que lo que dicen los políticos y las figuras de poder sea verdad.
  • Datos y mapa de movilidad – Mi Bus, Fernando Ledesma presentó la plataforma Mi bus que cuenta con datos de rutas y localización de paradas recolectados en la ciudad de Quito sobre el transporte masivo privado, esta iniciativa se podría ampliar a otras ciudades del país.
  • Territorios colaborativos para proyectos ambientales – Ouishare Quito, presentó un proyecto relacionado a los desperdicios en la ciudad de Quito, presentaron indicadores sobre la cantidad de comida y desperdicios en la ciudad y el potencial para implementar proyectos de economía colaborativa a través de un banco de alimentos.
  • Laboratorio de Movilidad y Encuesta del Perfil del Ciclista- Biciaccion y  Llactalab, Carlos Zurita presentó las actividades desarrolladas en el laboratorio de movilidad y la información que han venido recopilando sobre ciclistas urbanos. Asimismo, Daniel Orellana de Llactalab lanzó la primera encuesta para definir el perfil del ciclista en el país que estarán desarrollando en este 2017.
  • Acceso, datos y participación ciudadana – Fundación Ciudadanía y Desarrollo, Marcelo Espinel hizo un recuento de los proyectos que la fundación viene trabajando con el uso de datos abiertos y acceso a la información, por ejemplo el Observatorio Legislativo, y la plataforma web “Queremos saber” Asimismo, en el tema electoral y de datos lanzaron una herramienta para informar mejor a los ciudadanos sobre los candidatos y funcionarios públicos, Radiografía Política.

Visualización Análoga 

La jornada del Open Data Day Ecuador cerró con una actividad hands-on a cargo de Estela Navarrete (@bluewake) de Datalat sobre visualizaciones análogas, en la que los participantes representan datos estadísticos en el espacio público utilizando diversos materiales didácticos. En nuestro ejercicio formamos grupos de trabajo para analizar datos relacionados a gestión de residuos y movilidad, y los resultados fueron creativas representaciones que se tomaron las instalaciones del MediaLabUIO en Ciespal y generaron una dinámica discusión sobre la problemática medioambiental en nuestro país.

Latinoamérica se alista para el Open Data Day 2017

Julio López - el Febrero 21, 2017 en Experiencias, Fuentes de datos, Guest posts, Noticias

Este post se publicó también en el Blog de conocimiento abierto Abierto al Público, del Banco Interamericano de Desarrollo (BID)  aquí.

Por quinto año consecutivo la comunidad global de datos abiertos celebrará el Open Data Day (ODD), una iniciativa ya conocida y liderada por Open Knowledge International. A lo largo del sábado 4 de marzo, grupos locales organizan eventos que buscan utilizar los datos abiertos de sus comunidades para promover que más personas conozcan sus beneficios y fomentar la adopción de políticas de datos en gobiernos, iniciativa privada y sociedad civil.

En este 2017, el ODD se enfocará en 4 áreas temáticas: rastreo de dinero público, datos abiertos de investigación, el medio ambiente y derechos humanos. En su renovado sitio web, el ODD ofrece varios recursos para entender mejor estas cuatro áreas, incluyendo bases de datos abiertas, y una herramienta para crear el logo con el nombre de la ciudad del evento.

 

 

El Open Data Day da inicio a un 2017 que tendrá otros eventos regionales sobre datos abiertos (Abrelatam y Condatos en Costa Rica) y sobre todo puede ser una gran oportunidad para que las comunidades locales trabajen por una agenda local colaborativa. De momento ya han sido registrados más de 160 eventos en el mapa del ODD y a continuación te presentamos los eventos que se desarrollarán en ciudades latinoamericanas.

Argentina

  • Buenos Aires

La Fundación Conocimiento Abierto y otras organizaciones de la sociedad civil y entidades gubernamentales organizan el 4to encuentro por el ODD y buscan generar un espacio de diálogo y una jornada con paneles, presentación y mesas temáticas al aire libre. Ingresa aquí para más.

  • Rosario

Open Data Day llega a Rosario donde por primera vez se está organizando un evento. Para ver más detalles recomendamos seguir a Accion Colectiva .

Brasilia, Maceió y Teresina, Brasil

 

  • Brasilia celebra el OOD con un Hackaton sobre rastreo de dinero público e invita a todos los sectores de la sociedad a participar. Más información aquí.

 

  • En la ciudad de Maceió, Alagoas, se celebrará el OOD los días 10 y 11 de marzo con un taller para evangelizar al público sobre el poder de los datos abiertos para la innovación y la transparencia, sobretodo, busca comprometer a representantes del poder público para expandir sus iniciativas de apertura de datos. Más información sobre el evento aquí.

 

 

Colombia

  • Bogotá

 

Una jornada organizada por BigData Colombia para aprender sobre conceptos y el uso de datos se desarrollará en la Universidad Santo Tomás.

La agenda y más información del evento se ha publicado acá

 

 

 

  • Medellín

En Medellín, la Fundación Gobierno Abierto Colombia está organizando una feria de intercambio o trueque de Datos Abiertos sobre el medio ambiente, incluyendo la calidad del aire en la ciudad. Más información del evento aquí.

 

 

 

 

 

Ecuador

 

 

  • Quito

Por segundo año consecutivo en Quito, Datalat y MediaLabUIO están organizando un encuentro que incluye talleres, charlas y actividades hands-on sobre el apertura y uso de datos abiertos, así como un taller para usar datos locales relacionados al medio ambiente. Más informacion disponible en este enlace

 

El Salvador

 

  • San Salvador

 

El Grupo Local de la Open Knowledge International El Salvador está preparando por tercer año consecutivo un evento por el ODD 2017, más información se publicará en su pagina de facebook.

Guatemala

  • Ciudad de Guatemala

Escuela de Datos y Red Ciudadana están preparando un evento local por el ODD, para mayor información recomendamos visitar el sitio web o seguirlos en Twitter.

México

  • Ciudad de México

Por cuarto año en la Ciudad de México diferentes grupos de usuarios de datos abiertos se reunirán para participar en talleres, charlas y una expedición de datos.

Más información disponible en su Twitter @socialtic y en su blog.

 

Panamá

En la ciudad de Panamá, Ipandetec y otras organizaciones locales están organizando un taller de visualizaciones y un meet-up sobre datos abiertos, para mayor información recomendamos seguir su sitio web.

Paraguay

En Asunción, Open Data Paraguay, Girolabs y TEDIC están organizando actividades para el Open Data Day.

Por otra parte, Senatics y Koga Impact Lab están haciendo lo propio desde Gobierno en Asunción.

Uruguay

 

  • Montevideo

La comunidad de los Cafés de DATA  en Montevideo  está organizando un encuentro para renovar y mejorar el proyecto ATuNombre.uy, que permite visualizar las calles de Montevideo que llevan nombre de mujer y conocer más de esas mujeres y sus historias. Más información aquí.

 

 

 

 

Paysandú

Por primera vez en la ciudad fronteriza de Paysandú (Uruguay), Data Concepción y Subsidios.uy organiza un evento de esta índole para crear un mapa interactivo de las inundaciones en la costa argentina y uruguaya. Más información en el sitio web del evento.

 

 

Para el día del evento:

 

  • El sábado 4 de marzo súmate a la conversación en Twitter usando el hashtag #OpenDataDay y #ODD17
  • ¿Quiéres conocer más y ver otros eventos alrededor del mundo ? Revisa la página del evento oficial en español http://opendataday.org/es_mx

 

¿Cómo organizar un evento local? No hay receta, pero puedes identificar y contactar a grupos locales que trabajen con datos abiertos (gobierno, universidades, empresas privadas, sociedad civil, etc), organicen un meet-up, registrarlo en el mapa del evento (donde también puedes crear un logo) y empezar a difundirlo. Hay varias plataformas donde puedes publicarlo (eventbride, meet-uo y hasta google forms).