Limpieza Básica de Datos con Editor de Consultas

Lectura
25 min~4 min lectura

Concepto clave

La limpieza básica de datos en Power BI es el proceso de preparar tus datos crudos para que sean confiables y útiles en tus análisis. Imagina que estás organizando tu oficina antes de una reunión ejecutiva: quitas documentos duplicados, ordenas carpetas y aseguras que toda la información esté actualizada. De la misma manera, en Power BI, el Editor de Consultas (también conocido como Power Query) es tu herramienta principal para esta tarea.

Este proceso es fundamental porque los datos del mundo real rara vez vienen perfectos. Pueden tener errores como valores vacíos, formatos inconsistentes o columnas irrelevantes. Si construyes un dashboard ejecutivo con datos sucios, tomarás decisiones basadas en información incorrecta. La limpieza transforma datos "crudos" en datos "listos para analizar", lo que llamamos datos de calidad.

Cómo funciona en la práctica

Vamos a limpiar un archivo CSV de ventas con problemas comunes. Supongamos que tienes estos datos:

FechaProductoCantidadPrecio UnitarioVendedor
01/01/2024Laptop51200María
01/01/2024Laptop51200María
02/01/2024Mouse50Carlos
03/01/2024Teclado380Ana
04/01/2024Monitor2300Pedro

Pasos en el Editor de Consultas:

  1. Eliminar duplicados: Selecciona todas las columnas y haz clic en "Eliminar duplicados" para quitar la fila repetida.
  2. Manejar valores vacíos: En la columna "Cantidad", reemplaza los valores vacíos por 0 usando "Reemplazar valores".
  3. Cambiar tipos de datos: Asegúrate de que "Fecha" sea tipo fecha, "Cantidad" y "Precio Unitario" sean números enteros/decimales.
  4. Crear columna calculada: Agrega una columna "Total" con la fórmula: [Cantidad] * [Precio Unitario].
El Editor de Consultas registra cada paso que realizas. Si tus datos fuente cambian, solo necesitas actualizar la consulta y todos los pasos se aplicarán automáticamente.

Caso de estudio

Una empresa de retail necesita un dashboard de ventas mensuales. Reciben datos de múltiples tiendas en un Excel con estos problemas: nombres de productos en mayúsculas y minúsculas mezclados (ej., "LAPTOP", "laptop"), fechas en formatos diferentes ("01-ene-2024", "2024/01/01"), y una columna "Comentarios" que no es útil para el análisis.

Solución en Power BI:

  • Usa "Transformar" → "Minúsculas" en la columna "Producto" para estandarizar.
  • Convierte la columna "Fecha" a tipo fecha usando "Usar primera fila como encabezados" y "Cambiar tipo".
  • Elimina la columna "Comentarios" con "Eliminar columnas".
  • Resultado: datos limpios listos para visualizar en un gráfico de ventas por producto.

Errores comunes

  1. No revisar tipos de datos: Si una columna numérica se importa como texto, los cálculos fallarán. Siempre verifica y cambia los tipos después de cargar los datos.
  2. Eliminar datos sin análisis: Borrar filas con valores vacíos puede perder información valiosa. En su lugar, reemplázalos con ceros o promedios cuando sea apropiado.
  3. Ignorar duplicados: Los datos duplicados inflan tus métricas. Usa la función "Eliminar duplicados" en todas las columnas relevantes.
  4. No documentar los pasos: Si no nombras claramente tus pasos en el Editor de Consultas, será difícil entender o modificar el proceso más tarde.
  5. Limpiar en Excel en lugar de Power BI: Hacer limpieza manual en Excel antes de importar a Power BI es ineficiente. Usa el Editor de Consultas para automatizar y mantener consistencia.

Checklist de dominio

  • Puedo cargar datos desde una fuente común (Excel, CSV) a Power BI.
  • Sé cómo abrir el Editor de Consultas y navegar por su interfaz.
  • Puedo identificar y eliminar filas duplicadas en mis datos.
  • Sé reemplazar valores vacíos o incorrectos en columnas clave.
  • Puedo cambiar tipos de datos (ej., texto a número, texto a fecha).
  • Sé crear una columna calculada simple usando operaciones aritméticas.
  • Puedo aplicar los cambios y cerrar el Editor de Consultas para volver a Power BI.

Limpieza de datos de ventas mensuales

Descarga el archivo ventas_mensuales.csv (simulado con datos de ejemplo) y sigue estos pasos en Power BI:

  1. Abre Power BI Desktop y haz clic en "Obtener datos" → "Texto/CSV" para importar el archivo.
  2. En el Editor de Consultas, observa los datos: hay una columna "Fecha" con formato inconsistente, una columna "Producto" con nombres en mayúsculas y minúsculas mezclados, y valores vacíos en "Cantidad".
  3. Estandariza la columna "Producto" convirtiendo todo a minúsculas usando la opción "Transformar".
  4. Cambia el tipo de datos de la columna "Fecha" a "Fecha" usando el menú desplegable en el encabezado de la columna.
  5. Reemplaza los valores vacíos en "Cantidad" con 0 usando "Reemplazar valores".
  6. Crea una nueva columna llamada "Total Venta" que multiplique "Cantidad" por "Precio Unitario".
  7. Elimina la columna "Notas" que no es necesaria para el análisis.
  8. Aplica los cambios y cierra el Editor de Consultas. Verifica en la vista "Datos" de Power BI que los cambios se hayan aplicado correctamente.
Pistas
  • Usa la función "Minúsculas" en la pestaña "Transformar" para la columna "Producto".
  • Para reemplazar valores vacíos, selecciona la columna "Cantidad", ve a "Reemplazar valores" y deja el campo "Valor a buscar" vacío.

Evalua tu comprension

Completa el quiz interactivo de arriba para ganar XP.