Apache Airflow: Construcción de Pipelines ETL Automatizados con DAGs

Apache Airflow: Construcción de Pipelines ETL Automatizados con DAGs

Curso práctico para data engineers que desean dominar Apache Airflow en la orquestación de pipelines ETL complejos. Aprenderás a diseñar, programar y monitorear DAGs robustos, integrando herramientas como Python, bases de datos y APIs. Al finalizar, serás capaz de automatizar flujos de datos escalables en entornos productivos.
0 Estudiantes
20 Clases
Elena Suárez
Elena Suárez

Instructora

Acerca de este curso

Curso práctico para data engineers que desean dominar Apache Airflow en la orquestación de pipelines ETL complejos. Aprenderás a diseñar, programar y monitorear DAGs robustos, integrando herramientas como Python, bases de datos y APIs. Al finalizar, serás capaz de automatizar flujos de datos escalables en entornos productivos.
Elena Suárez
Elena Suárez
8 Cursos
0 Estudiantes

Elena Suárez es Diseñadora instruccional y UX con base en Caracas, Venezuela. Su trabajo se enfoca en transformar temas complejos en rutas de aprendizaje claras, prácticas y fáciles de seguir.

Ha acompañado a estudiantes, profesionales y equipos de empresas en procesos de formación online, combinando teoría útil con ejercicios aplicables desde la primera clase.

En Cursalo diseña experiencias de aprendizaje con ejemplos reales, lenguaje directo y una estructura pensada para avanzar paso a paso sin perder contexto.

Elena Suárez
Resumen del temario

Este curso incluye 4 modulos, 20 lecciones y 6:50 horas de materiales.

Fundamentos de Airflow y Configuración del Entorno
5 Partes | 1:20 Horas
Instalación de Airflow con Docker para Desarrollo Local
Gratis

Concepto claveLa instalación de Apache Airflow con Docker para desarrollo local es una estrategia que permite crear un entorno aislado y reproducible donde puedes diseñar, probar y depurar tus DAGs (Directed Acyclic Graphs) sin afectar sistemas de producción. Imagina que Docker es como una caja de herramientas portátil: dentro tienes todo lo necesario (Airflow, sus dependencias, bases de datos) empaquetado en contenedores, listo para usar en cualquier máquina. Esto elimina problemas de compatibi

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Estructura de un DAG: Tasks, Dependencies y Scheduling
Gratis

Concepto claveUn DAG (Grafo Acíclico Dirigido) en Apache Airflow es la unidad fundamental que define un flujo de trabajo automatizado. Piensa en él como un plano arquitectónico para tus pipelines de datos, donde cada paso del proceso se representa como un Task (tarea) y las relaciones entre ellos como Dependencies (dependencias). La magia está en que Airflow no solo ejecuta estas tareas, sino que las Schedule (programa) automáticamente según cronogramas definidos, similar a cómo un sistema de ri

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Configuración de Conexiones y Variables en la Interfaz Web
Gratis

Tipo de lección: VideoConcepto claveEn Apache Airflow, las conexiones y variables son mecanismos fundamentales para gestionar credenciales y configuraciones de manera segura y centralizada. Las conexiones almacenan información de autenticación para sistemas externos como bases de datos, APIs o servicios en la nube, mientras que las variables permiten almacenar valores configurables que pueden ser reutilizados en multiples DAGs.Imagina que estás construyendo una red de tuberías en una planta indu

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Práctica: Crear tu Primer DAG que Ejecuta un Script Python
Gratis

Concepto claveUn DAG (Grafo Acíclico Dirigido) en Apache Airflow es la unidad fundamental para definir workflows de datos. Piensa en él como un plano arquitectónico para tu pipeline ETL: especifica qué tareas deben ejecutarse, en qué orden y bajo qué condiciones, pero sin definir el momento exacto de ejecución (eso lo maneja el scheduler).En la práctica, un DAG es un archivo Python que describe dependencias entre tareas usando operadores. La analogía perfecta es una receta de cocina: los ingredi

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Quiz: Conceptos Básicos de Airflow y Configuración
Gratis

Tipo de lección: QuizConcepto claveApache Airflow es una plataforma de orquestación de flujos de trabajo que permite programar y monitorear pipelines de datos mediante DAGs (Directed Acyclic Graphs). Un DAG es una colección de tareas con dependencias definidas que se ejecutan en un orden específico, similar a cómo una receta de cocina tiene pasos secuenciales: no puedes hornear un pastel antes de mezclar los ingredientes.La arquitectura de Airflow se basa en componentes clave: el scheduler (que

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Operadores y Sensores para Automatizar Tareas ETL
5 Partes | 1:40 Horas
Uso de Operadores PythonOperator y BashOperator en ETL
Gratis

Concepto claveEn Apache Airflow, los operadores son los componentes fundamentales que ejecutan tareas especificas dentro de un DAG. Piensalos como las herramientas en una caja de un ingeniero de datos: cada una tiene una funcion unica. El PythonOperator te permite ejecutar codigo Python arbitrario, ideal para transformaciones de datos complejas o integraciones con APIs. El BashOperator ejecuta comandos de shell, perfecto para mover archivos, ejecutar scripts externos o interactuar con sistemas d

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Integración con Bases de Datos: PostgresOperator y MySqlHook
Gratis

Concepto claveEn Apache Airflow, la integración con bases de datos es fundamental para pipelines ETL automatizados. Dos componentes esenciales son el PostgresOperator y el MySqlHook. El PostgresOperator es un operador que ejecuta comandos SQL directamente en PostgreSQL, ideal para tareas como crear tablas, insertar datos o ejecutar procedimientos almacenados. En cambio, MySqlHook es un hook (gancho) que proporciona una conexión programática a MySQL, permitiendo mayor flexibilidad para operacione

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Sensores para Esperar Archivos o APIs Externas
Gratis

Tipo de lección: VideoConcepto claveLos sensores en Apache Airflow son operadores especializados que esperan hasta que se cumple una condición externa antes de continuar con la ejecución del DAG. Piensa en ellos como guardianes que verifican si un archivo ha llegado a un bucket de S3, si una API externa está disponible, o si una base de datos tiene nuevos datos. Sin sensores, tus pipelines ETL podrían fallar porque intentan procesar datos que aún no existen.En el mundo real, imagina un sistema d

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Práctica: Construir un Pipeline que Extrae Datos de una API y los Guarda en CSV
Gratis

Concepto claveEn Apache Airflow, los operadores son las unidades básicas de trabajo que ejecutan tareas específicas, mientras que los sensores monitorean condiciones externas antes de permitir que el flujo continúe. Para un pipeline ETL que extrae datos de una API, necesitas combinar ambos: un sensor para verificar que la API esté disponible y operadores para realizar la extracción y transformación.Imagina que estás construyendo una línea de ensamblaje en una fábrica. Los operadores son como las

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz: Operadores, Sensores y su Aplicación en ETL
Gratis

Tipo de lección: QuizConcepto claveEn Apache Airflow, los operadores son las unidades básicas de trabajo que ejecutan tareas específicas dentro de un DAG. Piensa en ellos como los trabajadores especializados en una línea de producción: cada uno sabe exactamente qué hacer (extraer datos, transformarlos, cargarlos) y solo necesita las instrucciones correctas para ejecutarse.Los sensores, por otro lado, son operadores especializados que esperan por una condición externa antes de continuar. Imagina

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Manejo de Dependencias, Errores y Monitoreo
5 Partes | 1:40 Horas
Configuración de Retries, Timeouts y Alertas por Email
Gratis

Concepto claveEn Apache Airflow, la configuración de retries, timeouts y alertas por email es fundamental para construir pipelines ETL robustos que puedan manejar fallos temporales sin intervención manual. Imagina un sistema de entrega de paquetes: si el primer intento falla por tráfico, el sistema programa reintentos automáticos; si el paquete tarda demasiado, se marca como timeout y se notifica al remitente. De manera similar, en Airflow, los retries permiten que una tarea se reintente automát

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Branching y SubDAGs para Flujos Condicionales
Gratis

Concepto claveEn Apache Airflow, los flujos de trabajo no siempre son lineales. Muchas veces necesitamos tomar decisiones basadas en datos o condiciones externas. Aquí es donde entran en juego dos herramientas poderosas: Branching y SubDAGs.El Branching (ramificación) permite que tu DAG tome diferentes caminos segun el resultado de una tarea. Imagina que eres un chef en un restaurante: cuando recibes un pedido, primero verificas si tienes todos los ingredientes. Si los tienes, procedes a cocinar

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Monitoreo con Logs y Métricas en la Interfaz Web
Gratis

Tipo de lección: Video Monitoreo con Logs y Métricas en la Interfaz Web de Airflow La capacidad de monitorear el comportamiento de tus DAGs y tasks es lo que separa un pipeline experimental de uno listo para producción. Apache Airflow no solo automatiza la ejecución de flujos de trabajo, sino que proporciona una interfaz web rica en herramientas de observabilidad. Esta lección se adentra en el uso práctico de los logs y métricas integrados, enseñándote a transformar datos crudos de ejecución en

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Práctica: Implementar un DAG con Manejo de Errores y Notificaciones
Gratis

Práctica: Implementar un DAG con Manejo de Errores y Notificaciones En esta lección práctica, integraremos todos los conceptos teóricos sobre robustez en Apache Airflow para construir un DAG de producción. Un pipeline ETL no es útil si falla silenciosamente en mitad de la noche. Por lo tanto, la capacidad de manejar errores de forma elegante y notificar a los equipos responsables es tan crítica como la lógica de transformación de datos en sí. Pasaremos de un DAG básico a uno resiliente, que no s

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz: Dependencias, Manejo de Errores y Monitoreo
Gratis

Tipo de lección: Quiz Quiz: Evaluando tu Dominio en Dependencias, Manejo de Errores y Monitoreo Has llegado a un punto crucial en tu aprendizaje de Apache Airflow. Las lecciones anteriores te han equipado con las herramientas teóricas y prácticas para diseñar DAGs, definir dependencias, gestionar fallos y observar el comportamiento de tus pipelines. Este quiz no es una simple evaluación de memoria; es una herramienta de diagnóstico diseñada para consolidar tu comprensión y prepararte para implem

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Proyecto Integrador: Pipeline ETL Complejo con Airflow
5 Partes | 2:10 Horas
Diseño del Pipeline: Extracción de Datos de Múltiples Fuentes (APIs y Archivos)
Gratis

Introducción al Diseño de Extracción de Múltiples Fuentes En el núcleo de cualquier pipeline ETL robusto se encuentra la fase de extracción, una etapa crítica donde la calidad, confiabilidad y estructura de los datos obtenidos sientan las bases para todo el proceso posterior. En un proyecto integrador con Apache Airflow, esta fase se vuelve significativamente más compleja cuando debemos orquestar la recolección de información desde orígenes heterogéneos, como APIs RESTful con límites de tasa, ar

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Transformación de Datos con Pandas y Almacenamiento en Base de Datos
Gratis

Introducción a la Transformación y Carga en un Pipeline Airflow En esta lección, nos adentramos en el núcleo del procesamiento de datos dentro de un DAG de Airflow. Hasta ahora, hemos aprendido a extraer datos de diversas fuentes. El siguiente paso crítico, y el foco de esta lección, es la Transformación y la Carga. Aquí es donde los datos en bruto se convierten en información valiosa, estructurada y lista para el análisis. Utilizaremos Pandas, la biblioteca de análisis de datos por excelencia d

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Orquestación del DAG: Scheduling, Dependencias y Parámetros Dinámicos
Gratis

Tipo de lección: Video Introducción a la Orquestación Avanzada en Airflow La verdadera potencia de Apache Airflow se despliega cuando dominamos la orquestación de nuestros DAGs. Más allá de definir tareas y sus dependencias lineales, un pipeline ETL complejo exige un control preciso sobre cuándo se ejecuta, cómo se adapta a diferentes condiciones y cómo fluyen los datos entre sus componentes. Esta lección se adentra en los mecanismos que convierten un DAG simple en un sistema de producción robus

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Práctica: Implementar y Ejecutar el Pipeline Completo en tu Entorno Local
Gratis

Práctica: Implementar y Ejecutar el Pipeline Completo en tu Entorno Local Has llegado al momento culminante del curso. En esta lección, pasarás de los conceptos teóricos y los ejercicios fragmentados a la construcción y ejecución de un pipeline ETL completo utilizando Apache Airflow en tu propia máquina. Este proyecto integrador simulará un escenario realista: procesar datos de ventas de una tienda online, enriquecerlos con información de clientes, realizar agregaciones y finalmente cargar los r

Tiempo de estudio 40 Minutos
Archivos adjuntos 0
Quiz: Evaluación del Proyecto Integrador y Mejores Prácticas
Gratis

Tipo de lección: Quiz Evaluación de un Pipeline ETL Complejo: Del Código a la Operación Llegar al final del proyecto integrador no significa simplemente tener un DAG que se ejecute. La evaluación de un pipeline ETL en Apache Airflow implica una revisión multidimensional que abarca la corrección funcional, la robustez operativa, la eficiencia y la mantenibilidad a largo plazo. En esta lección, nos transformaremos en revisores expertos, capaces de auditar nuestro propio trabajo o el de un equipo,

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Responder al comentario
Comentarios Aprobacion

Tu comentario sera visible despues de la aprobacion del administrador.

0
0 Reseñas
Calidad del contenido (0)
Habilidades del instructor (0)
Valor de compra (0)
Calidad de soporte (0)
Responder a la resena
Enviar respuesta

Tu respuesta a esta reseña será visible para todos los usuarios.

Apache Airflow: Construcción de Pipelines ETL Automatizados con DAGs
Gratis

Este curso incluye

Soporte del formador
Favorito
Compartir

Curso specifications

Secciones
4
Lecciones
20
Capacidad
Ilimitado
Duración
6:50 Horas
Estudiantes
0
Fecha de Created
4 abr. 2026
Fecha de Updated
21 jun. 2026
Elena Suárez

Diseñadora instruccional y UX · Venezuela

Ricardo dave

Data Analyst at Microsoft

El instructor no esta disponible actualmente.
I am not available for 2 days due to a business trip
Apache Airflow: Construcción de Pipelines ETL Automatizados con DAGs
Estas viendo
Apache Airflow: Construcción de Pipelines ETL Automatizados con DAGs
Hablar por WhatsAppContactar por WhatsApp