Estás navegando por el archivo de Omar Luna.

Cómo hacer visualizaciones de datos con Tableau

- el diciembre 29, 2016 en Tutoriales, Uncategorized

Mi incursión en Tableau surgió como una oportunidad. Hace dos años, trabajaba en una Organización No Gubernamental (ONG) en El Salvador especializada en el tema de mujeres. Mi exjefe estaba por comprar un software especializado en visualizar datos. Se me acercó y me preguntó: «¿Le interesaría aprenderlo?» Dudé. No mucho, pero dudé. Y, pese a las dificultades iniciales, acepté el reto y heme aquí intentando que la gente lo ame tanto como yo lo hago.

De ahí, cada que puedo recomiendo Tableau, una herramienta creada por tres entusiastas de los datos en la Universidad de Stanford, como un excelente aliado en visualización cuando carecemos de equipos multidisciplinarios (conformado por visualizadores, infografistas, diseñadores, entre otros), pues se sustenta en el concepto one man band para contar cierto tipo de temáticas con gráficos. ¡Ojo! Tiene una versión pagada, pero si trabajas en una universidad o lo utilizas para fines académicos puedes solicitar una copia GRATUITA para dos años y válida para ser instalada en dos computadoras acá: http://www.tableau.com/academic/students.

Por eso, hoy quiero compartir contigo cómo puedes hacer visualizaciones de mapas y gráficas que, en su momento, impactaron al funcionario salvadoreño con un set de datos que trabajé durante mi paso por dicho proyecto, enfocado en la problemática de mujeres salvadoreñas deportadas de México y Estados Unidos, un fenómeno que casi no había sido analizado ni comprendido del todo en mi país. Sin más, zambullámonos en el vasto y fascinante mundo de Tableau, ¿sí?

¡Bellísimo así!

Es lo primero que dirás al abrir la nueva versión de Tableau, pues su edición 10 ha apostado por una interfaz más intuitiva para quien se anime a explorar el noble arte de la visualización. Te lo digo yo porque vengo de donde asustan, ya que me tocó aprender a utilizarlo en su versión 7. Como puedes ver en el menú de la izquierda, puedes conectar tus bases desde un archivo (ya sea .xls, .csv, .tsv, entre otros) hasta aquellas que tengas trabajadas en un servidor (MySQL, Oracle Server, etcétera).

image00

 

 

¡Comencemos! Conectaremos mi archivo con la opción Conectar a un archivo > Excel. Buscaremos la base trabajada en mi computadora y Tableau se tomara unos momentos para procesarla. ¡Voilá! Tendremos una previsualización para que podamos revisar la data antes de trabajar con ella. Esta deberías verla de la siguiente forma:

image12

El trabajo de carpintería con una base de datos se vuelve fundamental, pues dicho set se encuentra preparado para ser leído por un programa de computadora como Tableau con el objetivo de que puedan realizarse todas las conexiones y relaciones necesarias para analizar datos que nos hagan ver más allá de lo evidente (Thunder, Thunder,Thundercats, ¡oooooooooooh!).

A ojo de buen cubero, puedes ver que Tableau automáticamente establecer una diferenciación entre aquellos valores que son textos y números; no puede establecer que los años, las latitudes y longitudes son variables que pueden trabajarse de forma diferenciada en el caso de una visualización.

Para cambiarlas, haz clic sobre el ícono Numeral (#) que aparece arriba de dichas categorías > Rol geográfico > Latitud/Longitud. Finalizado este paso, verás que ha cambiado el ícono Numeral (#) por un globo terráqueo. ¡Eso significa que funcionó! ¡Yey! De igual forma, sigue los mismos pasos para la variable Ano y cambíalo por una Cadena que nos servirá para analizar los años de forma continua.

image02

 

 

 

 

¡A trabajar! Demos clic en el recuadro naranja denominado Hoja 1 y sigamos el camino datero hacia nuestro canvas en blanco. Qué belleza, ¿no? Tableau establece una clara diferenciación entre cada aspecto clave de visualización (filtros, marcas, gráficos, hojas, dashboards, entre otros) y, además, simplifica el trabajo mediante el arrastre de variables hacia determinados campos o con solo darle doble clic a las medidas y dimensiones podemos verlas desplegadas en nuestro canvas.

image23

 

Comencemos con un mapa. Para desplegarlo, haz doble clic en Longitud y Latitud; te aparecerá un punto geográfico que localizará a El Salvador en un mapa de OpenStreet. Como necesitamos visibilizar a los 262 municipios del país para visibilizar la temática de las mujeres repatriadas, arrastremos las Medidas Departamento y Municipio hacia la opción Detalle del Menú Marcas. ¡Listo!

image21

¿Ves? Ya podemos ver cómo cambia nuestra forma de visualizar mapas. Gracias a Tableau, podemos estilizar colores y tamaños de los puntos con cantidades o tasas; arrastremos Municipio y Tasa por cada 100,000 habitantes a las opciones Color y Tamaño del menú Marca respectivamente. Así, podemos mostrar la gravedad, repitencia de un fenómeno u otra problemática nacional.

image16

 

 

Pero, ¿qué pasa si no deseas los colores y tamaños preestablecidos de Tableau? Tableau te ofrece la maravillosa ventaja de arreglarlos a tu gusto en las opciones del menú Marca. Acá, yo cambié un poco el tamaño y utilicé la paleta de color púrpura de la herramienta. Para modificarlo, hice lo siguiente: di clic a la opción Color del Menú Marca > Editar Colores > Seleccionar paleta de colores > Púrpura > Asignar Paleta > Aceptar. ¡Y me quedó así!

ya

 

¡Momento! ¡Falta algo! Exacto: limpiar la descripción emergente. Aún contempla la Latitud y Longitud, así como otras variables útiles para describir el fenómeno en cada localidad. Dado que nos interesa que la gente se familiarice y lo entienda de un vistazo, arrastremos las siguientes Medidas a la opción Descripción emergente (Tooltip) del Menú Marcas: Forma de repatriacion y Cantidad.

Por las demás variables, ¡tranquilo! Ya se encuentran contempladas en dicho apartado. Para limpiar la suciedad persistente en el Tooltip puedes editar y condensar la información a lo más importante. ¡Ojo! No abuses de la paleta de colores, pues tu historia puede difuminarse ante una paleta de colores infinita e innecesaria. Finalizada tu edición, dale clic a Aceptar. ¡Primera hoja lista!

Do the evolution!
Como la rola de Pearl Jam, esta herramienta te ayuda a ver cómo evoluciona un fenómeno con gráficas de líneas o áreas. Para ver este caso, hagamos lo siguiente. Agreguemos una nueva hoja a nuestro libro de trabajo, haciendo clic en el botón inferior derecho, ubicado cerca de la hoja Mapa. En ella, arrastraremos la dimension de los años y la medida Cantidad a los apartados de columnas y filas respectivamente. ¿Ves cómo se despliega ahora?

image13

 

 

 

 

 

 

 

 

Maticemos el grado de intensidad de la gráfica arrastrando la medida Cantidad en la opción Color del menú Marcas y editemos el color a púrpura. Así, daremos aire de familia a nuestra visualización. Ahora bien, para vislumbrar las cantidades, arrastremos la medida Cantidad al campo Etiqueta del menú Marca y así podrás ver cómo se presentó el fenómeno en general durante tres años.

 

 

 

 

 

 

 

 

 

 

 

Si eres curioso como yo, notarás que al pasar el cursor sobre los puntos, verás que la Descripción emergente no tiene lo que necesitamos. Por eso, arrastraremos las siguientes variables a Descripción emergente: Departamento y Forma de repatriacion. Nuevamente, condensemos y editemos para resaltar lo importante. Así, tendremos un before and after espectacultar. Maravilloso, ¿verdad?

image07

 

 

 

 

 

 

 

 

 

 

 

Entre el mapa y el gráfico, ¿notaste elementos comunes que pueden servir para filtros? Yo también. Sazonemos nuestras hojas con ellos para que sean aplicables en un dashboard. Arrastremos las dimensiones Departamento y Forma de repatriación al campo Filtros, ubicado arriba del menú Marca. Seleccionemos todas sus variables y apliquémoslas a ambas hojas. Para el caso de los años, solo se lo aplicaremos al mapa, dado que ya contamos con un gráfico que muestra la evolución en el tiempo.

image10

 

 

 

 

 

 

 

 

 

 

 

image06

 

 

 

 

 

 

 

 

 

 

 

image04

 

 

 

 

 

 

 

 

 

 

 

¿Y si hacemos un muñeco?

¡Llegó el momento! Creemos un dashboard. Este es un elemento que contendrá nuestras hojas y otros elementos de interés para nuestra visualización. Accedamos a él con el botón Nuevo dashboard, ubicado cerca del botón Nueva hoja. ¡Voilá! Un canvas con la posibilidad de visibilizar el fenómeno de mujeres repatriadas a El Salvador. Arrastremos nuestras dos hojas para que nos queden así:

image11

 

 

 

 

 

 

 

 

 

 

 

Ordenemos la casa. Coloquemos la cantidad de tasas como valor flotante. Para hacerlo, haremos clic derecho sobre la flecha desplegable hacia abajo del contenedor de tasas y seleccionaremos la opción Flotante. Deshágamonos de las leyendas de colores de los municipios haciendo clic en la X que aparece en su contenedor. Finalizado esto, convoquemos los filtros a escena. Haremos clic sobre la flecha negra desplegable en el contenedor de la hoja Mapa y seleccionaremos la opción Filtro > Ano, Forma de repatriación y Departamento. Estos aparecerán de la siguiente forma:

image18

 

 

 

 

 

 

 

 

 

 

 

¡Yo sé! Aún no se ve lindo nuestro dashboard. Coloquemos dos filas imaginarias arriba de nuestro mapa. ¿Cómo? Utilicemos la opción Objetos > En blanco para colocarlas en el dashboard. Al principio, nos saldrán fuera de lugar, pero podemos arrastrarlas para acomodarlas en lo más alto de nuestra visualización. Una vez posicionadas, necesitamos redactar un titular y un indicador que guié a nuestro usuario a darse un vueltín por nuestra visualización.

Hagámoslo realidad haciendo clic en la opción Texto del Menú Objetos. Posteriormente, posicionemos el titular en la primera fila y el indicador en la siguiente. Terminado esto, elimina la fila del titular y despliega el titular en toda la fila; con el indicador ocurre lo contrario, dado que deberás arrastrar los filtros posterior a él. Acómodalos y obtendrás como resultado lo siguiente:

image01

 

 

 

 

 

 

 

 

Prescindamos del titular del Mapa. Haremos clic sobre la flecha desplegable del contenedor Mapa y le quitaremos el cheque a la opción Título. ¡Se fue, se fue! Ahora, pulamos el títular de nuestra gráfica. ¿Cómo? Hagamos clic sobre su titular y redactemos: Cantidad de mujeres repatriadas en. Finalizado eso, haremos clic en Insertar y coloquemos las siguientes variables en nuestro titular: ATTR(Departamento) – ATTR(Forma de repatriacion). Así, le daremos interactividad una vez el usuario se valga de los filtros para analizar la información. image14

 

 

 

 

 

 

 

 

 

 

 

 

image08

 

 

 

 

 

 

 

 

 

 

 

Ah, ¡lo olvidaba! También, puedes formatear el título para darle el mismo realce que al titular de nuestro dashboard. ¡Ojo! Siempre, siempre, siempre cita la fuente de dónde obtuviste la información, dado que eso te será de mucha utilidad para respaldar de dónde fue extraída y qué otras consideraciones tomaste en cuenta al momento de analizar la data, como el caso de las tasas.

 

¿Con quién se queda el Tableau?

Supongamos que ya tenemos nuestra visualización como la queremos. Acá, solo nos queda publicarlo en línea. Para eso, Tableau nos pide que elaboremos un extracto de nuestra información como respaldo. ¡Manos a la obra! Iremos a la barra de Menús > Datos > Extraer Datos. Acá, aparecerá un menú donde podremos añadir todas las variables clave que se extraerán de tu data.

image25

 

 

 

 

 

 

 

 

 

 

 

 

Haremos clic a la opción Añadir y seleccionaremos Año. A continuación, aparecerá una ventana emergente donde estarán todos los años. Escogélos todos y daremos clic en el botón Aceptar. Seguiremos el mismo procedimiento para el resto de variables; finalizado este procedimiento, crearemos el extracto dando clic en el botón Extracto.

image19

 

 

 

 

 

 

 

 

 

 

 

image03

 

 

 

 

 

 

 

 

 

 

 

image19

 

 

 

 

 

 

 

 

 

 

 

¡Ya casi, ya casi! Ahora vamos a la opción Servidor de la barra de menú. Escogeremos Tableau Public > Guardar en Tableau Public como… En cuanto hagamos eso, nos aparecerá una ventana donde ingresaremos nuestro correo electrónico y nuestra clave para acceder a nuestra cuenta. Si no cuentas con una, ¡tranquilo! Esta herramienta te permite crearla durante este proceso.

image17

 

 

 

 

 

 

 

 

 

 

 

 

image15

 

 

 

 

 

 

 

 

 

 

 

 

image05

 

 

 

 

 

 

 

 

 

 

 

Tan pronto como ingresemos nuestros datos, nos pedirá que redactemos el nombre de nuestra visualización. En este caso, le puse Mujeres repatriadas en El Salvador. Damos clic al botón Guardar. La herramienta procesará… ¡Voilá! ¡Nuestro Tableau aparecerá desplegado en nuestro perfil público de Tableau, donde podemos editarle detalles, como una breve descripción, qué tipo de formatos autorizamos a la herramienta para que la gente pueda descargar, entre otras utilidades.

image20

 

 

 

 

 

 

 

 

 

 

 

¿Tableau o no Tableau? ¡Esa es la cuestión!

Mi recomendación es que apuestes por Tableau. Y, si tu medio de comunicación u organización puede adquirirlo, mucho que mejor, pues una clara diferencia entre la versión gratuita y la versión pagada es que tienes mejor cobertura de seguridad, acceso al servidor pagado (con mejor seguridad que el público) y mayor lectura de líneas de registro y formato de apertura de ciertos archivos.

Sumado a eso, concuerdo con Ojo Público (2016) al garantizarte que la creación de filtros permite que los usuarios consulten y obtengan resultados personalizados en datos. Y, sobre todo, el hecho de que no se necesita saber programación para usarla, pues, al descubrir que algunas de sus funcionalidades provienen de herramientas como Excel, la cosa pinta mucho que mejor.

¡Eso sí! “Sobre advertencia, no hay engaño”. Actualmente, la mayoría de información sobre esta herramienta se encuentra en inglés, su foro de atención al usuario se tarda un poco (¡o un siglo!) en responder y algunos gráficos, como el mapa de relleno, dejan mucho que desear cuando son regiones o naciones foráneas a Estados Unidos…

Aun así, es una herramienta que promete mucho en su nueva actualización, a la que vale la pena acercarse por facilitarte un poco más las cosas a la hora de visibilizarse historias con datos, así como el grado de interactividad que le brinda al usuario y, si ya con esto no logro convencerte, te reto a que la pruebes y nos compartas qué te parece y que no debajo de esta publicación o en nuestro Twitter (@EscueladeDatos). Cheers!

¡Data Wrangler: limpia tus bases en un tris!

- el septiembre 13, 2016 en Expediciones de Datos, Experiencias, Fuentes de datos, Uncategorized

Amo el trabajo de datos. Pero hay una cosa que no me gusta: la limpieza. ¿No te ha pasado alguna vez? ¡A mí sí y sigo contando! Por eso, quiero enseñarte cómo utilizar una herramienta para hacer al mal tiempo buena y cara: Wrangler. Esta es una herramienta interactiva GRATUITA, desarrollada por el proyecto de investigación Stanford/Berkeley, que sirve para la limpieza y transformación de datos.

Con ella, te lo prometo, pasarás menos tiempo limpiando y más tiempo analizando tus datos a la hora de elaborar bases de datos. ¿Te animas a probarla? Bueno, pues, lee y te cuento cómo la probé con una tabla de datos, sobre las primeras tres jornadas de CONCACAF 2016-2017, que extraje de Mismarcadores.com.

1

 

 

 

 

¡Menor tiempo, mejor limpieza!
Un profesor en la «U» solía decirme que, lo bueno si breve, dos veces bueno. Y eso es lo que evoca Wrangler al momento de utilizarlo. Para comenzar, ingresa a http://vis.stanford.edu/wrangler/, donde encontrarás un botón al que hasta el más curioso y entusiasta datero dará clic con su provocativo Try It Now (¡Pruébala ahora!).

34

 

 

 

 

Como verás a continuación, la interfaz de Wrangler es sencilla. Un poco primaria para algunos, pero los resultados son prometedores para quienes deseamos limpiar datos rápido y bien. ¿Ves cómo está la tabla? Fea, ¿verdad?5

 

 

 

 

Para mejorarla, lo primero que hice fue seleccionar la primera fila de la tabla y acudí al auxilio de la opción Promote para que la primera fila sea el encabezado de cada una de nuestras columnas. Así, ya tenemos un encabezado con el cual la carpintería datera puede comenzar. ¡Eso sí! Para cambiar cada uno de sus nombres puedes dar doble clic y ¡listo! ¡Ya tienes categorías!

6 7

 

 

 

 

Ahora, rellenemos los espacios en blanco de cada jornada. Para eso, sombreé la columna JORNADA. Y me fui a la opción Fill, con la cual puedes reemplazar las columnas/filas en blanco por insumos de valor. Para este caso, le indiqué que debía rellenar todo espacio debajo de JORNADA que estuviera en blanco.

¿Cómo? Colocando lo siguiente en su barra de opciones:

Column JORNADA

Direction: above

Row: JORNADA is null

Finalizado esto, aparecerá una opción con nuestros comandos en el menú SUGGESTIONS. Dale clic al signo de «más» y verás cómo empieza a tomar forma la cosa.

8

 

 

 

 

Sí, yo también vi esas filas en blanco que no aportan nada en cada JORNADA. Para eliminarlas, selecciona cada una de las columnas e ingresa a la opción DELETE, donde podrás prescindir de cada una de ellas en el menú de la izquierda, dando clic al signo más en el menú SUGGESTIONS.

9

 

 

 

 

Mejor, ¿no? Ahora, tenemos otra piedrita en el camino: ¡Fecha y hora están unidas! Pero, que no panda el cúnico. Para separarlas, me di a la tarea de hacer lo siguiente:

1) Seleccioné la columna FECHA

2) Fui a la opción SPLIT y coloca WHITESPACE en la variable after.

3) Y voilá…

10

 

 

 

 

¡Eso sí! No pases por alto cambiar las columnas SPLIT a FECHA y HORA respectivamente. Ahora, veo que el MARCADOR está igual de sucio. Por tanto, tendremos que separar cada uno de esas ÊÊ que les mantienen unidos. ¡Empecemos entonces! Yo comencé por el marcador del equipo 2 e hice esto:

1) Sombreé la columna MARCADOR

2) Fui a la opción SPLIT y coloca ÊÊ en la variable after.

3) ¡Listo! ¡Ya me lo separó!

11

 

 

 

 

Ahora, viene lo mejor: ¿cómo quitamos esas ÊÊ del marcador del equipo 1? Antes de separar, sombreemos las ÊÊ y sígueme con lo siguiente:

1) Vamos a la opción SPLIT

2) Coloquemos ÊÊ en la opción on

3) ¡Mira qué padre! ¡Nos separó las ÊÊ del marcador!

4) ¡No olvides renombrar la columna separada como MARCADOR EQUIPO 1!

12

 

 

 

 

¡Solo nos queda prescindir de la columna en blanco del anterior SPLIT! Y, para eso, ve a la opción DROP y dale clic a la primera opción que te presenta el menú SUGGESTIONS.

13

 

 

 

 

¿Qué hacemos ahora? Ve a la opción EXPORT que se encuentra debajo de SUGGESTIONS y haz clic. Te saldrá una pantalla con la tabla de datos limpia. Copíala y llévala a tu Text Edit (Mac) o Bloc de Notas (Windows). Pega el archivo y guárdalo como un texto sin formato con extensión .csv.

15

 

 

 

 

Ahora, si la curiosidad te mata como a mí me pasó, abrí el .csv en Excel… ¡Y este fue el resultado!

16

 

 

 

 

¡Justo algo con lo cual podemos trabajar! ¡Gracias por oír mis plegarias dateras, Wrangler!

¿Por qué confiar en Wrangler?

«¿Para qué tanto problema?», dijo sabiamente Juan Gabriel. Y yo le creo… yo te invito a darle un voto de confianza a Wrangler. ¿Por qué? Porque me ha pasado que se me va el tiempo (¡y la vida!) manipulando datos exclusivamente para que las herramientas de visualización y análisis las leen. Pero, ¡oh, sorpresa! Muchas veces, el resultado no es el esperado porque la limpieza no fue lo que yo deseaba.

Y, en esos deseos de cosas imposibles, Wrangler está diseñadas para acelerar esos procesos; más, si tienes a un editor o a tu jefe exigiendo bases de datos y visualizaciones rápidas y bien ejecutadas. Con este insumo, pasarás menos tiempo lidiando con tus datos y mucho más aprendiendo de ellos al tener las preguntas correctas que te ayuden a sustentar/refutar hipótesis de periodismo de datos.

También, te permite la transformación interactiva de información sucia que puedes encontrar a diario en insumos de análisis para cualquier proyecto en el cual te encuentres trabajando. Y, lo que más me encanta, te ayuda a exportar datos para su utilización en mis dos inseparables amigos: Excel o Tableau. ¡Yeeeeeeeeeeeeeey!
Por los registros, ¡no te preocupes! Una vez exportes la data trabajada, la herramienta volverá a su fase original con las bases precargadas (¡otra razón para amarte, Wrangler!). Ya si esto no te convence, anímate a probarla y compartirnos qué te parece y que no. ¡No te quedes con las ganas y comparte con nosotros tus impresiones acá o en nuestro Twitter (@EscueladeDatos)! ¡Cambio y fuera!

 

 

 

 

Redes de poder, Linkurious en los Panama Papers

- el agosto 9, 2016 en DAL, Guest posts, Tutoriales

Un domingo el mundo digital colapsó con un bombazo: todos sabemos algo de los #PanamaPapers, una de las mayores filtraciones periodísticas de la historia, donde podemos encontrar a personalidades de todo el mundo haciendo de las suyas en paraísos fiscales para ocultar su dinero del pago de impuestos en sus respectivos países.

Mucho se ha hablado de dicha situación, pero más veladamente de qué herramientas se utilizaron para analizar lo que el académico español Alex Rayón (2016) considera todo un proyecto de Big Data por la enorme cantidad de documentos que fueron analizados para realizar diversos insumos periodísticos, comprendidos por 2.6 terabytes, 11.5 millones de documentos.

Por esa razón, como Escuela de Datos, detallaremos un poco acerca de la herramienta Linkurious (en su versión de prueba), que te permitirá trazar y visualizar los vínculos de documentación obtenida por temas y sujetos de investigación.

Iluminando los caminos de la opacidad

«¿Cómo se hace para que un proyecto de este calibre sea navegable?», te preguntarás. Para el Consorcio Internacional de Periodistas de Investigación (ICIJ, en inglés), fueron clave tres aspectos relevantes: la colaboración de equipos multidisciplinarios a escala global, la interfaz amigable e intuitiva de Linkurious y, en última instancia, la protección a la seguridad brindada por la herramienta para que ningún periodista sufriera situaciones de riesgo por la publicación de los #PanamaPapers.

Con este panorama, es posible que tengas una base similar a los #PanamaPapers y quieras echarla a andar. Y, para explicarte a grandes rasgos cómo utilizar esta herramienta, utilicé la base de Facebook que ellos tienen registrada en su directorio, el cual puede ser de tu interés para comenzar a implementar mapas de influencia, como el que te mostraré.
1.- Una vez seleccionemos Facebook (de cualquiera de las dos formas), nos aparecerá nuestro canvas. Para comenzar a editar relaciones, seleccionamos el nodo proporcionado al lado izquierdo de la pantalla.

Linkurious 1

2.- Para averiguar las relaciones de Facebook, haremos doble clic para expandirlo. ¡Ojo! Cuando veas el halo blanco alrededor de cada nodo, significa que todos están conectados a Facebook y cada arista representa el grado de relación que tienen entre sí. Y, cuando hagamos clic en una relación, sus relaciones se desplegarán y podremos ver sus propiedades en el lado izquierdo, como acabo de hacerlo con Friend.ly.

Linkurious(1).docx 2

3.- Otra cosa interesante radica en filtrar los resultados por categorías haciendo clic en aquellas que nos interesen junto al nombre del nodo o relación. También, podemos buscar un nodo o relación en particular utilizando la barra de búsqueda, como acabo de hacerlo con qué empresas ha adquirido Facebook con la categoría Acquired.

Linkurious(1).docx 3

4.- Al igual que ampliamos las relaciones de Facebook, utilicé las variables Expand (Expandir) y Collapse (Reducir) en el nodo WhatsApp para que puedas ver de qué forma se pueden desglosar los diferentes elementos que pueden ser relevantes o no para nuestra visualización en un mapa de influencia.

Linkurious(1).docx 4

Linkurious(1).docx 5

5.- Si comenzamos a ver que nuestra visualización es demasiado compleja para nuestra audiencia, podemos seleccionar determinadas áreas en nuestro mapa de influencias y comenzar a ocultarlos seleccionándolos manualmente o utilizando la opción Toggle Lasso del botón Seleccionar. Una vez hayas hecho esto, utiliza el botón Hide (Ocultar), ubicado en el panel de la izquierda, para difuminar relaciones que consideres irrelevantes o poco importantes, como podrás contemplar a continuación.

Linkurious(1).docx 6Linkurious(1).docx 7

 

 

 

 

6.- Para mejorar la forma en que se visualiza tu mapa de influencia, puedes utilizar el botón layout, ubicado en la barra inferior derecha, donde puedes encontrar opciones de jerarquización para posicionar tus nodos, de tal forma que puedas mejorar la visualización. Acá, puedes ver cómo cambió la visualización que tenía. Recuerda: es importante que consideres dónde lo publicarás y cómo deseas llegar a tu audiencia con tu investigación.

Linkurious(1).docx 8

7.- Si eres un quisquilloso de los colores predeterminados de los programas como yo, te cuento que Linkurious te deja personalizar los nodos, de acuerdo a las necesidades de visualización que tengas. Para eso, debes irte al ícono de Engrane ubicado en la parte superior derecha del programa y ubicarte en la opción Diseño, donde podrás seleccionar las paletas e íconos para personalizar y diferenciar tu mapa de influencia a la hora de visualizarlo en tu sitio.

Linkurious(1).docx 9

8.- Supongamos que estamos de acuerdo con esta visualización y deseas compartirlo ya. Para eso, tienes diferentes opciones en Menú: puedes enviárselo a miembros de tu equipo por correo electrónico, obtener un web widget para insertarlo en tu sitio o exportarlo a varios formatos para utilizarlo en presentaciones, ponencias o en charlas de Datos y Cervezas.

Linkurious(1).docx 10Linkurious(1).docx 11

¿Vale la pena?

Yo te animo a que utilices la versión de prueba con bases de datos que actualmente tengas y, si esta te convence, pídele a tu editor o superior, comprar la versión pro para echar a andar iniciativas macro relacionadas con corrupción, transparencia y manejo de fondos públicos en tu país. Siempre me gusta decir que la tecnología y las herramientas no revelan nada por sí solas, pero pueden ayudarnos a encontrar las historias detrás de los datos, ya que pueden ayudarnos a realizar las preguntas correctas y así entender de forma clara, precisa y concisa los resultados que nos devuelvan.

Con los #PanamaPapers, queda claro una cosa: la consolidación de iniciativas periodísticas que combinan los mejores elementos y técnicas de la investigación y las nuevas tecnologías, un panorama cada vez más cercano y que paulatinamente está llegando paso firme a las salas de redacción e iniciativas de la sociedad civil. Me alegra muchísimo que esto venga para quedarse y, si tienes dudas sobre cómo utilizar esta herramienta, no dudes en escribirnos debajo de este post o búscanos en nuestras redes sociales como Escuela de Datos.

 

 

 

Cómo hacer estadística básica con Excel

- el julio 12, 2016 en Uncategorized

Yo tuve miedo alguna vez. ¡Ajá, miedo a los datos! Por eso, estudié Comunicación Social y pensé: «¡Uff! Jamás tendré que ver un dato en mi vida!» Pero la vida puede ser irónica; a veces, muy juguetona. Y heme aquí: invitando a la gente a quitarse el miedo a los datos —como yo alguna vez lo tuve. Yo sé; no es cosa fácil y sencilla, pero esta vez quiero enseñarte algo que te ayudara a zambullirte poco a poco en el juego de los datos.

Me refiero a las funciones estadísticas básicas de Excel. Sí, podrá sonar aburrido y tedioso, pero gracias a ellas, podemos realizar el análisis de datos almacenados en un dataset. Esto nos permite realizar análisis estadístico de información, del cual se pueden establecer inferencias y obtener así diferentes elementos de valor que nos hagan «ver más allá de lo evidente».

¡Así que, sin más preámbulo, comencemos!

A. Promedio o media aritmética
Como su nombre lo indica, se calcula sumando un grupo de números, el cual se divide por el recuento total de los mismos. Por ejemplo, para calcular el promedio de casos de violencia intrafamiliar reportados por la Policía Nacional Civil (PNC) hasta finales de junio en los 14 departamentos de El Salvador, debemos ir al botón de función, buscar la fórmula PROMEDIO (o Average, según tengas configurado tu Excel) y escoger de qué casilla a cuál contemplará el promedio.

En mi caso, la fórmula de Promedio aparecerá así: =AVERAGE(D3:D16). Y, una vez, sigamos estos pasos, tendremos el siguiente promedio de casos de violencia intrafamiliar en El Salvador.

1. Promedio

B. Mediana

Es el número intermedio de un grupo de números; es decir, la mitad de los números son superiores a la mediana y la mitad tiene valores menores a ella. En este caso particular, se procede a escribir la siguiente fórmula: =MEDIANA(D3:D16) o, en su defecto, =MEDIAN(D3:D16), con lo cual obtendremos el siguiente cálculo

2. MEDIANA

“Pero, ¿cómo así que da 16?”, podrás pensar. Bueno, para obtener la mediana en un conjunto de valores totales pares, Excel sumó ambas cantidades del dataset y las dividió entre dos, con lo cual nos indica que existe una mediana de 16 de casos de violencia intrafamiliar en este consolidado.

  1. Moda

Es el número que aparece más frecuentemente en un grupo de números. Sigamos con la base de la PNC. Sí, a ojo de buen cubero, podrás distinguir cuál es el dato que más se repite; podemos sacar la moda de una forma sencilla y accesible escribiendo la siguiente fórmula: =MODA(D3:D16) o, si tu Excel está en inglés como el mío, =MODE(D3:D16)

3. MODA

  1. Mínimo

Esta función nos ayuda a calcular el valor más bajo o mínimo en un rango de datos. Ya lo viste, ¿verdad? Pero lo importante es que sepas cómo calcularlo para futuros datasets con los que tengas que trabajar. Más si son descomunales, comparados con este. Para obtenerlo, te invito a que escribas la siguiente fórmula en tu Excel: =MIN(D3:D16). ¡Sí, no importa si tienes tu Excel en inglés o español!

4. MINIMO

  1. Máximo

Para obtener el máximo, se calcula el valor más alto o máximo en un rango de datos. Yo sé que también ya lo ubicaste; cuando tengas que trabajar con datasets, no será tan fácil de identificar como en este caso particular. Para obtenerlo, solo tendrás que escribir la fórmula de la siguiente forma: =MAX(D3:D16). Sencillo, ¿no?

5. MAXIMO

  1. Contar

Como bonus track, es muy importante que hablemos de esta función. Esta nos ayuda a contar cuántos datos hay en un conjunto de celdas. Por ejemplo, con esta base que tengo, quiero saber cuántos registros de violencia intrafamiliar tiene esta base de la PNC de El Salvador; esto se logra escribiendo la siguiente fórmula =CONTAR(D3:D16) o, en inglés, =COUNT(D3:D16)

BT. CONTAR

  1. Contar

Como bonus track, es muy importante que hablemos de esta función. Esta nos ayuda a contar cuántos datos hay en un conjunto de celdas. Por ejemplo, con esta base que tengo, quiero saber cuántos registros de violencia intrafamiliar tiene esta base de la PNC de El Salvador; esto se logra escribiendo la siguiente fórmula =CONTAR(D3:D16) o, en inglés, =COUNT(D3:D16).