Apache Airflow: Orquestación de Pipelines ETL Complejos con DAGs

Apache Airflow: Orquestación de Pipelines ETL Complejos con DAGs

Curso práctico para data engineers que desean dominar Apache Airflow en la automatización de pipelines ETL. Aprenderás a diseñar, programar y monitorear DAGs complejos, integrando múltiples fuentes de datos y herramientas. Al finalizar, serás capaz de implementar soluciones robustas de orquestación en entornos productivos.
0 Estudiantes
21 Clases
Alejandro Torres
Alejandro Torres

Instructora

Acerca de este curso

Curso práctico para data engineers que desean dominar Apache Airflow en la automatización de pipelines ETL. Aprenderás a diseñar, programar y monitorear DAGs complejos, integrando múltiples fuentes de datos y herramientas. Al finalizar, serás capaz de implementar soluciones robustas de orquestación en entornos productivos.
Alejandro Torres
Alejandro Torres
9 Cursos
0 Estudiantes

Alejandro Torres es Mentor de programación y datos con base en Bogotá, Colombia. Su trabajo se enfoca en transformar temas complejos en rutas de aprendizaje claras, prácticas y fáciles de seguir.

Ha acompañado a estudiantes, profesionales y equipos de empresas en procesos de formación online, combinando teoría útil con ejercicios aplicables desde la primera clase.

En Cursalo diseña experiencias de aprendizaje con ejemplos reales, lenguaje directo y una estructura pensada para avanzar paso a paso sin perder contexto.

Alejandro Torres
Resumen del temario

Este curso incluye 4 modulos, 21 lecciones y 7:30 horas de materiales.

Fundamentos de Airflow y Configuración del Entorno
5 Partes | 1:40 Horas
Instalar Airflow Localmente con Docker
Gratis

Concepto claveInstalar Apache Airflow con Docker es como montar una fábrica de procesamiento de datos en un contenedor estandarizado. En lugar de construir manualmente cada máquina con todas las dependencias, Docker te permite empaquetar Airflow y todo su entorno en una imagen reproducible que funciona igual en cualquier sistema. Esto elimina el famoso "problema del funciona en mi máquina" que tanto afecta a los ingenieros de datos.La analogía perfecta es compararlo con un kit de muebles prefabr

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Explorar la Interfaz Web y Comprender la Arquitectura
Gratis

Concepto claveApache Airflow es una plataforma de orquestación de flujos de trabajo que permite programar, monitorear y gestionar pipelines de datos complejos mediante DAGs (Directed Acyclic Graphs). La arquitectura de Airflow se compone de varios componentes clave que trabajan en conjunto para ejecutar tus tareas de manera confiable y escalable.Imagina que estás coordinando una cadena de producción en una fábrica: el scheduler es el planificador que decide qué tareas ejecutar y cuándo, los work

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Crear tu Primer DAG con Operadores Básicos
Gratis

Tipo de lección: VideoConcepto claveUn DAG (Grafo Acíclico Dirigido) en Apache Airflow es la unidad fundamental de orquestación que define un flujo de trabajo de datos. Piensa en él como un plano arquitectónico para tu pipeline ETL: especifica qué tareas deben ejecutarse, en qué orden y bajo qué condiciones. La clave está en "acíclico" - las tareas no pueden crear bucles infinitos, asegurando que el flujo siempre avance hacia una conclusión.Los operadores son los componentes que ejecutan el trab

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Práctica: Configurar un DAG que Descargue Datos de una API
Gratis

Introducción: Construyendo Nuestro Primer Pipeline de Datos En esta lección práctica, pasaremos de la teoría a la acción, configurando nuestro primer DAG (Grafo Acíclico Dirigido) funcional en Apache Airflow. El objetivo es crear un pipeline automatizado que se conecte a una API pública, descargue datos en un formato estructurado y los prepare para su posterior procesamiento. Este es el núcleo de la orquestación ETL: automatizar la extracción de datos de fuentes externas de manera confiable y pr

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz: Conceptos Básicos de Airflow
Gratis

Tipo de lección: Quiz Evaluación de Conceptos Fundamentales de Apache Airflow Bienvenido a este quiz de evaluación intermedia. Esta lección no introduce nuevos conceptos, sino que sirve como un punto de control crucial para consolidar tu comprensión de los pilares de Apache Airflow. Un dominio sólido de estos fundamentos es lo que separa a un usuario que simplemente ejecuta DAGs de un ingeniero capaz de diseñar, depurar y optimizar orquestaciones robustas en producción. El formato de preguntas y

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Diseño de DAGs Avanzados y Manejo de Dependencias
5 Partes | 1:40 Horas
Utilizar Operadores Específicos para ETL (Python, Bash, SQL)
Gratis

Introducción a los Operadores Específicos de ETL en Apache Airflow En el núcleo de cualquier pipeline ETL (Extract, Transform, Load) orquestado con Apache Airflow se encuentran los operadores. Mientras que los DAGs definen el flujo y las dependencias, son los operadores las unidades de trabajo que ejecutan las tareas reales. En esta lección, nos adentraremos más allá del PythonOperator y el BashOperator básicos, para explorar cómo utilizar operadores específicos y especializados que se adaptan d

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Configurar Dependencias con set_upstream y set_downstream
Gratis

Lección: Configurar Dependencias con set_upstream y set_downstream Introducción al Control de Flujo en Airflow En el núcleo de Apache Airflow reside el concepto del Grafo Acíclico Dirigido (DAG), que no es más que una representación visual y lógica de tu flujo de trabajo. Sin embargo, un DAG es una estructura estática hasta que no defines cómo se relacionan sus componentes, las tareas. Aquí es donde entran en juego las dependencias. Configurar dependencias es el acto de orquestar el orden de eje

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Implementar Branching y Condicionales en DAGs
Gratis

Tipo de lección: Video Introducción al Branching y Condicionales en Airflow En el diseño de pipelines de datos, rara vez todos los flujos de trabajo son lineales y secuenciales. A menudo, necesitamos tomar decisiones basadas en el resultado de una tarea anterior, la fecha de ejecución, el contenido de un archivo o cualquier otra condición externa. Aquí es donde el branching (ramificación) y los condicionales se vuelven herramientas esenciales. En Apache Airflow, estas no son estructuras de contr

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Práctica: Construir un DAG con Múltiples Tareas y Dependencias
Gratis

Introducción al Diseño de DAGs Complejos En lecciones anteriores, has aprendido los fundamentos de un DAG (Grafo Acíclico Dirigido) y cómo crear tareas simples. Sin embargo, el verdadero poder de Apache Airflow se despliega cuando orquestamos pipelines complejos con múltiples tareas que tienen relaciones de dependencia intrincadas. En esta práctica, pasaremos de la teoría a la construcción de un DAG que simula un escenario realista de procesamiento de datos, donde el orden, el manejo de errores

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz: DAGs y Dependencias en Airflow
Gratis

Tipo de lección: QuizEvaluacion del moduloResponde estas preguntas para comprobar que puedes aplicar los criterios principales del modulo.

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Integración con Fuentes de Datos y Herramientas Externas
5 Partes | 1:45 Horas
Conectar Airflow a Bases de Datos (PostgreSQL, MySQL)
Gratis

Introducción: La Importancia de la Conexión a Bases de Datos en Airflow Apache Airflow, en su esencia, es un orquestador. Su poder no reside en procesar datos por sí mismo, sino en coordinar de manera elegante y confiable dónde, cuándo y cómo se ejecutan las tareas que sí lo hacen. En el contexto de los pipelines ETL y ELT, el destino y origen más común de esos datos son las bases de datos relacionales. Por lo tanto, la capacidad de conectar Airflow de forma segura, eficiente y manejable a siste

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Usar Hooks para Integrar con APIs y Servicios Cloud
Gratis

Introducción a los Hooks en Apache Airflow En el ecosistema de Apache Airflow, un Hook es un componente fundamental que actúa como un puente o interfaz estandarizada para la comunicación con sistemas externos. A diferencia de los operadores, que están diseñados para ejecutar una tarea específica, los hooks se centran en la gestión de la conexión y la autenticación, proporcionando un cliente o una sesión reutilizable para interactuar con una API, una base de datos o un servicio en la nube. Su pro

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Configurar Sensores para Esperar Eventos Externos
Gratis

Tipo de lección: Video Introducción a los Sensores en Apache Airflow En el mundo de la orquestación de datos, no todos los procesos pueden o deben ejecutarse de inmediato. A menudo, un paso en tu pipeline depende de que un evento externo ocurra: que un archivo llegue a un bucket de S3, que una partición se materialice en Hive, o que una base de datos termine un proceso de carga. Aquí es donde los Sensores de Apache Airflow brillan. Un Sensor es un tipo especial de operador diseñado para esperar,

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Práctica: Crear un Pipeline que Consuma Datos de una API y los Guarde en una BD
Gratis

Introducción: El Pipeline API-to-Database En el núcleo de la orquestación moderna de datos se encuentra la capacidad de conectar sistemas dispares de manera automatizada y confiable. Esta lección práctica te guiará en la construcción de un DAG de Apache Airflow que realiza una tarea fundamental: extraer datos de una API REST externa, transformarlos ligeramente para asegurar su calidad y estructura, y finalmente cargarlos en una base de datos relacional para su posterior análisis. Este patrón, co

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz: Integración y Hooks en Airflow
Gratis

Tipo de lección: QuizEvaluacion del moduloResponde estas preguntas para comprobar que puedes aplicar los criterios principales del modulo.

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Proyecto Integrador: Pipeline ETL Complejo con Monitoreo
6 Partes | 2:25 Horas
Diseñar la Arquitectura del Pipeline ETL
Gratis

Introducción: La Importancia de un Diseño Arquitectónico Sólido Antes de escribir una sola línea de código en Apache Airflow, es fundamental dedicar tiempo al diseño de la arquitectura de nuestro pipeline ETL. Un diseño bien pensado no es un lujo, sino una necesidad para la orquestación de procesos complejos. Esta fase determina la escalabilidad, mantenibilidad, resiliencia y eficiencia de todo el sistema de datos. Un error común es lanzarse directamente a codificar DAGs y tareas sin un plan cla

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Implementar el DAG con Extracción de Múltiples Fuentes
Gratis

Introducción a la Extracción de Múltiples Fuentes en un DAG de Airflow En lecciones anteriores, hemos construido DAGs que interactúan con una sola fuente de datos. Sin embargo, la realidad de los pipelines de datos en producción es considerablemente más compleja. Un pipeline ETL complejo típicamente consume información de diversos orígenes: bases de datos SQL y NoSQL, APIs RESTful, archivos planos en sistemas cloud storage, streams de datos, y más. La orquestación efectiva de estas extracciones

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Agregar Transformaciones de Datos y Carga a Destino
Gratis

Tipo de lección: Video Transformaciones de Datos en Airflow: Más Allá de la Extracción Simple En lecciones anteriores, hemos dominado la extracción de datos desde múltiples fuentes y su almacenamiento provisional. Sin embargo, el corazón de un pipeline ETL reside en la transformación. Esta fase es donde los datos crudos se convierten en información valiosa, estructurada y lista para el análisis. En Airflow, las transformaciones no ocurren por arte de magia; deben ser diseñadas intencionalmente d

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Configurar Alertas y Monitoreo con Logs y Métricas
Gratis

Configurar Alertas y Monitoreo con Logs y Métricas en Apache Airflow En esta lección, avanzaremos más allá de la simple ejecución de tareas para construir un sistema de observabilidad robusto para nuestros pipelines ETL. Un pipeline que no puede ser monitoreado, alertado y depurado eficientemente es un pipeline frágil en un entorno de producción. Aquí, aprenderás a transformar tu DAG de un conjunto de instrucciones a un sistema vivo, instrumentado con capacidades para informarte sobre su salud,

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Práctica: Desplegar y Ejecutar el Pipeline en un Entorno Simulado
Gratis

Introducción al Despliegue en un Entorno Simulado Llegó el momento de integrar todo el conocimiento adquirido. Esta lección práctica te guiará en el despliegue y ejecución de un pipeline ETL complejo en un entorno simulado, un paso crucial antes de llevarlo a producción. Un entorno simulado replica las condiciones de un sistema real, pero de forma aislada y controlada, permitiéndote probar la orquestación, las dependencias, el manejo de errores y el monitoreo sin riesgo. Utilizaremos Docker Comp

Tiempo de estudio 40 Minutos
Archivos adjuntos 0
Quiz del modulo 4
Gratis

Tipo de lección: QuizEvaluacion del moduloResponde estas preguntas para comprobar que puedes aplicar los criterios principales del modulo.

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Responder al comentario
Comentarios Aprobacion

Tu comentario sera visible despues de la aprobacion del administrador.

0
0 Reseñas
Calidad del contenido (0)
Habilidades del instructor (0)
Valor de compra (0)
Calidad de soporte (0)
Responder a la resena
Enviar respuesta

Tu respuesta a esta reseña será visible para todos los usuarios.

Apache Airflow: Orquestación de Pipelines ETL Complejos con DAGs
Gratis

Este curso incluye

Soporte del formador
Favorito
Compartir

Curso specifications

Secciones
4
Lecciones
21
Capacidad
Ilimitado
Duración
7:30 Horas
Estudiantes
0
Fecha de Created
3 abr. 2026
Fecha de Updated
21 jun. 2026
Alejandro Torres

Mentor de programación y datos · Colombia

Ricardo dave

Data Analyst at Microsoft

El instructor no esta disponible actualmente.
I am not available for 2 days due to a business trip
Apache Airflow: Orquestación de Pipelines ETL Complejos con DAGs
Estas viendo
Apache Airflow: Orquestación de Pipelines ETL Complejos con DAGs
Hablar por WhatsAppContactar por WhatsApp