¿Te equivocaste de maleta?

Introducción

Todas nuestras hojas de cálculo deben estar organizadas como un portafolio de dinero listo para depositarse en un banco.

Imagen de Hair in the Gate. Licencia sin especificar: pedimos permiso para compartir en los comentarios (01/2013)

El dinero debe estar perfectamente arreglado de una forma predecible, en unidades estándares, e incluso probablemente tendrá un olor agradable. La hoja de cálculo es feliz con esta situación. Nos recompensará contando, clasificando y graficando todo lo que le pidamos.

Pero, normalmente, las hojas de cálculo no corren con esta suerte. En realidad nosotros ordenamos los datos como la imagen a continuación…

 

Imagen de Science Education Resource Centre. Licencia CC-NC-SA 3.0.

Nuestra pedante hoja de cálculo nos castigará. ¿Todas clases de peluches, tamaños y colores en una misma maleta? ¿Qué podemos hacer para arreglar este desastre?

Al final de esta sección, aprenderás a:

  • Analizar datos de tal manera que te darás cuenta en dónde ocurrió el error.

  • Cambiar la estructura de los datos para hacerlos más útiles.

  • Algunos consejos sobre lo que debes de evitar cuando trabajes con tus propios datos.

    Algunos trabajos

    Necesitas:

    • Hojas de cálculo Excel u Open/Libre Office.

    • Una copia de los datos del manual de GRAIN: “land grabbing” (en inglés).

    Una tarea rápida (15 minutos)

    Descarga estas hojas de trabajo y sigue los pasos. Esta sección usa hojas de cálculo con características especiales. A lo largo del tutorial se te dirá cómo usarla, pero primero intentalo tú. Aplica un auto-filtro y continúa viendo qué sucede en cada paso, para que detectes cómo cambian tus datos.

    Veamos el siguiente ejemplo: Pensemos que en la oficina, el jefe vigila quién va a las juntas, y que tiene toda esa información en una hoja de cálculo como la que se muestra a continuación:

  • Las hojas de cálculo no son intuitivas: Podrías producir un reporte erróneo de asistencia usando herramientas como auto-filtros. Esto se debe a que las hojas de cálculo ven los datos como un todo; no por nombres. Es como si una sola persona llamada “Allan, Rastus, Carl, Tito” hubiera ido a la junta del lunes. Para hacer mejor manejo de tus datos, sería mejor que cada dato estuviera en una celda diferente.

    Así que separa los datos en celdas y columnas diferentes. Esto se puede hacer de manera automática. Primero, ve en las funciones que tiene tu hoja de cálculo al apartado de Texto a Columnas (Text to Columns). Selecciona los datos en la columna B y haz clic en Datos → Texto a columnas. Usa una coma como separador. Debes de poner el nombre de la columna de forma manual.

    Después de hacer esto, te quedarán algunos espacios en blanco. ¿Te acuerdas de cómo quitarlos? Si no, ve al apartado del hombre invisible.

    Ahora que aprendiste a dividir el texto, la información es más manejable. ¿Pero si tu oficina fuera de mucho más personas? Sería un trabajo muy pesado. Pero… ¿y si pudieras tomar los datos originales para acomodarlos a lo largo de la columna? Esto se llama transposición y la puedes hacer de manera manual, o usando las opciones de pegado especial.

    ¡Mucho mejor! Pero, para que los datos tengan sentido, le tenemos que agregar “fronteras” o celdas como si fueran datos porque tenemos muchos espacios vacíos en la columna días de junta (Meeting Day). Esto es terrible; tendremos que agregar esos datos en la columna A.

  • Esto permitirá que los datos puedan ser usados de manera eficiente. ¡Inténtalo!

    Una tarea larga (30 minutos – 2 horas)

    Consulta Problem 5: Structural problems – data in inconvenient places (en inglés). Es un ejercicio que te permitirá entender mejor cómo las hojas de cálculo y los datos mal organizados no son tus mejores aliados. Si te sientes con mucho entusiasmo, intenta resolver Problem 6: from “banabas” to “bananas” – dealing with inconsistencies in data. En este ejercicio te enseñan cómo explorar, corregir y  volver a armar una base de datos. Hace un amplio uso de todas la funciones de las hojas de cálculo como validación, tablas dinámicas, concatenación de datos. Es difícil, pero al final notarás la diferencia.

     Lista de lecturas:

    • En el ejercicio corto usamos las siguientes funciones:

      • La función Texto a columna, que es super útil cuando debemos de poner los datos en la misma maleta. Aquí está otro tutorial para hacerlo en Excel, y uno para Open/Libre Office. En las hojas de Google, esta función no existe, pero la función separar (SPLIT function) hace lo mismo.

      • La transposición, que cambia filas y columnas, se ve con detalle en el tutorial de Excel elaborado por Tech Republic,  y en uno para Open Office, de Solveig Haugland. El Data and Design Guide de Tactical Technology Collective tiene un capítulo que se llama Growing out of Spreadsheets, Quedándonos sin hojas de cálculo, y que trata sobre los problemas relacionados con datos que están mal organizados.

    Descansa y reflexiona

    ¿Qué nos enseñó este capítulo sobre la manera de guardar datos en las hojas de cálculo?

    ¡Ya terminaste el limpiado de datos!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *