Introducción a Power Query en Power BI
¿Qué es Power Query y por qué lo necesitas?
Imagina que recibes un archivo Excel con ventas del último trimestre, pero los datos están desordenados: fechas en diferentes formatos, nombres de productos con errores tipográficos, valores numéricos mezclados con texto, y filas vacías que interfieren con tus cálculos. ¿Cuánto tiempo tardarías en limpiar todo manualmente?
Power Query responde a esta pregunta con una filosofía clara: transformar datos no debería requerir programación. Esta herramienta, integrada nativamente en Power BI Desktop, te permite realizar operaciones complejas de limpieza y preparación de datos mediante una interfaz visual intuitiva, similar a un puzzle donde cada pieza representa una transformación.
Power Query no modifica tus datos originales. Crea una secuencia de pasos que se aplican cada vez que actualizas tu fuente de datos, garantizando reproducibilidad y consistencia.
El Editor de Power Query
Para acceder a Power Query en Power BI Desktop, existen varias rutas:
- Desde la vista de informe: clic en "Obtener datos" → seleccionar origen → se abre automáticamente el editor
- Desde la vista de tabla: clic derecho en una tabla → "Editar consulta"
- Tecla rápida: Ctrl + Shift + E
Componentes de la interfaz
| Área | Función |
|---|---|
| Cinta de opciones | Contiene las pestañas Inicio, Transformar, Agregar columna y Ver |
| Panel de consultas | Muestra todas las consultas disponibles en tu modelo |
| Vista previa | Tabla con los datos tal como se ven con los pasos aplicados |
| Barra de fórmulas | Muestra el código M generado por cada paso |
| Pasos aplicados | Lista de todas las transformaciones aplicadas en orden |
Tu primera consulta: paso a paso
Vamos a crear una consulta desde cero para entender el flujo de trabajo completo:
- Obtener datos: Ve a Inicio → Obtener datos → Texto/CSV. Selecciona cualquier archivo de prueba o crea uno simple con tres columnas: Fecha, Producto, Ventas.
- Vista previa: Power Query muestra una previsualización de los datos. Verás cómo Power Query interpreta automáticamente cada columna.
- Nombrar la consulta: En el panel derecho, cambia "Consulta1" por algo descriptivo como "Ventas_Mensuales".
- Explorar columnas: Haz clic en los encabezados. Verás que Power Query detecta automáticamente el tipo de datos (texto, número, fecha, etc.).
- Transformar datos: Explora las pestañas Transformar y Agregar columna para ver las decenas de opciones disponibles.
- Cerrar y aplicar: Ve a Inicio → Cerrar y aplicar. Los datos se cargarán al modelo de Power BI.
Tipos de transformaciones esenciales
1. Cambiar tipo de datos
Power Query intenta adivinar los tipos de datos, pero no siempre acierta. Para cambiar un tipo:
- Selecciona la columna
- Ve a Transformar → Tipo de datos
- Elige el tipo correcto (texto, número entero, número decimal, fecha, fecha/hora, etc.)
2. Eliminar duplicados
Selecciona una o varias columnas → clic derecho → "Eliminar duplicados". Esto es crucial cuando importas datos de sistemas que pueden contener registros repetidos.
3. Eliminar valores nulos o vacíos
Ve a Inicio → Reducir filas → Eliminar filas → Eliminar vacías. También puedes usar "Eliminar errores" si prefieres trabajar con filas problemáticas.
4. Reemplazar valores
Selecciona la columna → clic derecho → "Reemplazar valores". Ingresa el valor a buscar (ej: "N/A") y el valor de reemplazo (ej: vacío o "0").
5. Dividir columnas
Si tienes "Nombre_Apellido" en una columna, ve a Transformar → Dividir columna → Por delimitador. Power Query separará automáticamente en dos columnas.
6. Combinar consultas
Imagina que tienes una tabla de "Ventas" y otra de "Clientes". Para unir información:
- Ve a Inicio → Combinar consultas → Combinar consultas como nueva
- Selecciona la primera tabla y la columna común (ej: ID_Cliente)
- Selecciona la segunda tabla y su columna común
- Elige el tipo de combinación (Interna, Izquierda, etc.)
- Expande las columnas deseadas de la segunda tabla
Columnas personalizadas y calculadas
La pestaña "Agregar columna" te permite crear nuevas columnas basándote en cálculos:
- Columna personalizada: Escribe una fórmula en el editor de fórmulas M. Ejemplo: [Precio] * [Cantidad] para obtener el total.
- Columna a partir de ejemplos: Ideal para principiantes. Escribes uno o dos ejemplos del resultado deseado y Power Query deduce el patrón.
- Columna de índice: Genera números secuenciales 1, 2, 3... útil para identificar registros.
// Ejemplo de fórmula M personalizada
"Margen" = [Precio_Venta] - [Costo] // Calcula diferencia
"Porcentaje" = [Margen] / [Costo] * 100 // Calcula porcentaje
El lenguaje M: qué hay detrás
Cada paso que aplicas en Power Query genera código en el lenguaje "M" (Power Query Formula Language). No necesitas aprender M para usar Power Query, pero entenderlo te da superpoderes:
Ver más: Ejemplo de código M generadolet
Origen = Csv.Document(File.Contents("C:\Datos\ventas.csv"),[Delimiter=",", Columns=3, Encoding=65001, QuoteStyle=QuoteStyle.None]),
#"Encabezados promovidos" = Table.PromoteHeaders(Origen, [PromoteAllScalars=true]),
#"Tipo cambiado" = Table.TransformColumnTypes(#"Encabezados promovidos",{{"Fecha", type date}, {"Producto", type text}, {"Ventas", Int64.Type}}),
#"Filas filtradas" = Table.SelectRows(#"Tipo cambiado", each [Ventas] > 0)
in
#"Filas filtradas"
Este código muestra claramente cómo Power Query: 1) Lee el archivo CSV, 2) Promueve los encabezados, 3) Cambia tipos de datos, y 4) Filtra filas con ventas mayores a cero.
Buenas prácticas para principiantes
- Nombra tus pasos descriptivamente: En lugar de "Paso cambiado1", usa "Tipo_Fecha_Corregido" o "Duplicados_Eliminados".
- Orden de operaciones importa: Filtra primero las filas innecesarias antes de hacer transformaciones. Menos datos = mayor velocidad.
- Revisa tipos de datos: Un error común es dejar fechas como texto, lo cual causa problemas en visualizaciones.
- Desactiva la carga de consultas intermedias: Si una consulta solo sirve como base para otra, haz clic derecho → "Habilitar carga" → desactiva para ahorrar memoria.
- Documenta tu trabajo: Usa el panel de propiedades para añadir descripciones a tus consultas.
Power Query es tu mejor aliado en el análisis de datos. Invierte tiempo en dominar sus fundamentos y notarás cómo tu productividad se multiplica exponencialmente.
Errores comunes y cómo evitarlos
| Error | Causa | Solución |
|---|---|---|
| "No se puede cambiar el tipo" | Valores no numéricos en columna | Limpia valores inválidos primero |
| Filas duplicadas inesperadas | Combinación con clave duplicada | Revisa duplicados en tabla base |
| Datos se pierden al actualizar | Pasos muy sensibles a cambios | Usa filtros robustos, no filtros exactos |
| Consulta muy lenta | Demasiados pasos o datos sin filtrar | Reduce filas lo antes posible |
Integración con el modelo de datos
Una vez que terminas de transformar en Power Query, los datos se cargan al modelo de datos de Power BI. Allí podrás:
- Crear relaciones entre tablas
- Definir jerarquías
- Crear medidas con DAX
- Configurar seguridad a nivel de fila
Resumen y próximos pasos
En esta lección has aprendido:
- Qué es Power Query y por qué es fundamental en Power BI
- La interfaz del Editor de Power Query y sus componentes
- Cómo crear tu primera consulta paso a paso
- Transformaciones esenciales: tipos de datos, duplicados, filtros, reemplazo
- Cómo combinar consultas mediante uniones
- Creación de columnas personalizadas
- Buenas prácticas y errores comunes
¿Qué sucede cuando Power Query intenta cambiar una columna de texto a número y encuentra valores como "N/A" o espacios vacíos?
- A) Los valores se convierten automáticamente a 0
- B) Se genera un error y debes resolverlo manualmente
- C) Power Query elimina automáticamente las filas problemáticos
- D) Los valores se convierten a texto "0"
Power Query modifica directamente los archivos de datos originales de donde importamos la información.
- A) Verdadero, siempre actualiza los archivos originales
- B) Falso, solo crea una secuencia de pasos aplicados que se ejecutan cada vez que se actualizan los datos
- C) Depende del tipo de archivo seleccionado
- D) Solo modifica archivos Excel, no CSV
¿Cuál es la diferencia entre "Combinar consultas" y "Anexar consultas" en Power Query?
- A) Son exactamente lo mismo
- B) Combinar une tablas lado a lado (por columnas), anexar une tablas una debajo de otra (por filas)
- C) Combinar es más rápido que anexar
- D) Anexar solo funciona con bases de datos SQL
Ejercicio práctico sugerido
Para reforzar lo aprendido, realiza este ejercicio:
- Crea un archivo CSV con datos ficticios de 20 ventas (Fecha, Cliente, Producto, Cantidad, Precio_Unitario)
- Incluye deliberadamente errores: algunas fechas mal formateadas, productos duplicados, precios como texto
- Importa el archivo en Power BI usando Power Query
- Realiza las siguientes transformaciones: corrige tipos de datos, elimina duplicados, crea una columna calculada "Total" (Cantidad × Precio_Unitario)
- Exporta tus pasos aplicados y observa el código M generado