CursosEmpresasBlogLiveConfPrecios

Contenido del curso

Introducción a Apache Airflow

  • 1
    Introducción al curso

    Introducción al curso

    03:05 min
  • 2
    ¿Para qué sirve airflow?

    ¿Para qué sirve airflow?

    05:34 min
  • 3
    ¿Por qué usar airflow?

    ¿Por qué usar airflow?

    02:56 min
  • 4
    Resumen módulo 1

    Resumen módulo 1

    00:47 min

Conceptos básicos

  • 5
    DAG

    DAG

    Viendo ahora
  • 6
    Tasks y Operators

    Tasks y Operators

    02:13 min
  • 7
    Scheduler

    Scheduler

    02:04 min

Instalación y configuración

  • 8
    Instalación de Apache Airflow usando Docker

    Instalación de Apache Airflow usando Docker

    03:14 min
  • 9
    Posibles configuraciones

    Posibles configuraciones

    04:34 min
  • 10
    Variables y conexiones

    Variables y conexiones

    04:15 min

Implementando un DAG

  • 11
    Implementando un DAG

    Implementando un DAG

    05:57 min
  • 12
    Bash Operator

    Bash Operator

    03:47 min
  • 13
    Python Operator

    Python Operator

    04:20 min
  • 14
    Definiendo dependencias entre tareas

    Definiendo dependencias entre tareas

    06:23 min
  • 15
    Custom Operator

    Custom Operator

    06:40 min

Orquestar y monitorizar procesos

  • 16
    Orquestando un DAG I

    Orquestando un DAG I

    10:31 min
  • 17
    Orquestando un DAG II

    Orquestando un DAG II

    06:32 min
  • 18
    Monitoring

    Monitoring

    07:22 min
  • 19
    Task Actions

    Task Actions

    13:13 min
  • 20
    Trigger Rules

    Trigger Rules

    14:18 min

Sensores

  • 21
    ¿Qué son los sensores?

    ¿Qué son los sensores?

    01:16 min
  • 22
    ExternalTaskSensor

    ExternalTaskSensor

    06:16 min
  • 23
    FileSensor

    FileSensor

    07:02 min

Templates con Jinja

  • 24
    ¿Qué son los templates con Jinja?

    ¿Qué son los templates con Jinja?

    06:48 min

XComs

  • 25
    ¿Qué son los Xcoms?

    ¿Qué son los Xcoms?

    06:17 min

BranchPythonOperator

  • 26
    BranchPythonOperator

    BranchPythonOperator

    05:40 min

Proyecto

  • 27
    Definición del proyecto

    Definición del proyecto

    03:41 min

Cierre del curso

  • 28
    Cierre del curso

    Cierre del curso

    01:35 min
  • 29
    Comparte tu proyecto de Platzi explora el espacio con Airflow y certifícate

    Comparte tu proyecto de Platzi explora el espacio con Airflow y certifícate

Tomar examen

DAG

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads

      Comentarios

      Royer Guerrero Pinilla

      Royer Guerrero Pinilla

      Estudiante
      Hace 4 años
      Lucas Gonzalez

      Lucas Gonzalez

      Estudiante
      Hace 4 años
      Rafael Alejandro Belalcázar Burbano

      Rafael Alejandro Belalcázar Burbano

      Estudiante
      Hace 4 años
      Víctor Mazo

      Víctor Mazo

      Estudiante
      Hace 3 años
      Carlos Eduardo Bracho Rosales

      Carlos Eduardo Bracho Rosales

      Estudiante
      Hace 3 años
      Mario Alexander Vargas Celis

      Mario Alexander Vargas Celis

      Estudiante
      Hace 2 años
      Santiago Andres Gelvez Camargo

      Santiago Andres Gelvez Camargo

      Estudiante
      Hace 23 días
      Screenshot 2022-11-01 at 10.38.21 PM.png
      👉 Considero destacar que cada unos de los items dentro del DAG se llaman task y tienen un operador que es básicamente el tipo de tarea

      ✨ Los estados de nuestra tarea pueden tener los siguientes estados

      Screenshot 2022-11-01 at 10.41.22 PM.png

      ✨ Los tipos de operador basicos son

      • SimpleHttpOperator
      • MySqlOperator
      • PostgresOperator
      • MsSqlOperator
      • OracleOperator
      • JdbcOperator
      • DockerOperator
      • HiveOperator
      • S3FileTransformOperator
      • PrestoToMySqlOperator
      • SlackAPIOperator

      Mas operadores https://airflow.apache.org/docs/apache-airflow-providers/operators-and-hooks-ref/index.html

      DAG( Directed Acyclic Graph)

      • Los Workflow los Podemos realizar a través de los DAG. Viene del concepto de los grafos y debe tener 2 cualidades. En primer lugar una dirección. Todas las aristas fluyen hacia una dirección. La segunda cualidad es que no pueden tener ciclos. Una arista que sale de un nodo no puede volver a ese nodo.

      Dejo por aquí la documentación oficial con la explicación de lo que es un DAG.

      https://airflow.apache.org/docs/apache-airflow/stable/concepts/dags.html

      En resumen, un DAG es la representación gráfica y estructural de un workflow, o en otras palabras, es una representación de las tareas que se van a ejecutar y la forma en la que se ejecutan.

      👀 Aqui el DAG Automatizar las pipelines: Airflow

      Un DAG (Directed Acyclic Graph) es un componente central en Apache Airflow que representa un flujo de trabajo. Este flujo está compuesto por tareas individuales y sus dependencias, organizadas de manera que sigan una estructura de grafo dirigido y acíclico.

      Características principales de un DAG

      1. Dirigido:
        • Cada tarea en un DAG tiene una dirección específica, indicando el flujo lógico de las dependencias.
        • Por ejemplo, si Task A → Task B, significa que Task B se ejecutará después de que Task A haya finalizado correctamente.
      2. Acíclico:
        • No puede haber bucles o ciclos en el flujo de trabajo.
        • Esto asegura que las tareas no entren en un estado de ejecución infinita.
      3. Configuración programática:
        • Los DAGs se definen en código Python, lo que brinda flexibilidad para agregar lógica personalizada en la definición de tareas o dependencias.

      Estructura de un DAG

      Un DAG en Airflow se configura definiendo:

      • Nombre del DAG: Identificador único del flujo.
      • Programación (Schedule): Frecuencia con la que debe ejecutarse el flujo (diario, semanal, cada hora, etc.).
      • Conjunto de tareas: Tareas individuales que conforman el flujo.
      • Dependencias entre tareas: Relaciones que determinan el orden de ejecución.

      from airflow import DAG from airflow.operators.dummy import DummyOperator from datetime import datetime

      # Crear el DAG dag = DAG( 'mi_primer_dag', description='Un ejemplo básico de DAG', schedule_interval='@daily', # Se ejecutará diariamente start_date=datetime(2023, 1, 1), # Fecha de inicio del DAG catchup=False # Evita ejecutar tareas atrasadas )

      # Definir las tareas inicio = DummyOperator(task_id='inicio', dag=dag) proceso = DummyOperator(task_id='proceso', dag=dag) fin = DummyOperator(task_id='fin', dag=dag)

      # Definir dependencias inicio >> proceso >> fin

      Elementos clave en un DAG

      1. Tareas (Tasks):

        • Componentes individuales del flujo.
        • Pueden ser operadores predefinidos, como BashOperator, PythonOperator, o tareas personalizadas.
      2. Dependencias:

        • Se especifican usando >> (dependencia directa) o << (dependencia inversa).
        • Ejemplo:tarea1 >> [tarea2, tarea3]
      3. Programación (Schedule):

        • Define cuándo se debe ejecutar el DAG.
        • Puede ser con expresiones cron (0 12 * * *) o intervalos predefinidos como @daily, @hourly.
      4. Fecha de inicio y fin:

        • El start_date marca cuándo comienza el DAG.
        • Opcionalmente, un end_date puede limitar su ejecución.
      5. Propiedades adicionales:

        • Retries: Número de intentos en caso de fallo.
        • Timeout: Límite de tiempo para ejecutar las tareas.
        • Catchup: Permite ejecutar tareas atrasadas si el DAG se activa después de la fecha de inicio.

      Ventajas de los DAGs

      1. Visualización clara:
        • Airflow proporciona una interfaz gráfica para observar la estructura del DAG y el estado de las tareas.
      2. Escalabilidad:
        • Los DAGs permiten manejar flujos complejos con dependencias múltiples.
      3. Reutilización:
        • Los DAGs definidos en código son fáciles de modificar, mantener y reutilizar.

      Usos comunes de los DAGs

      1. Pipelines de ETL/ELT:
        • Extracción, transformación y carga de datos de sistemas fuente a un Data Warehouse o Data Lake.
      2. Procesos de Machine Learning:
        • Automatización de entrenamientos, evaluaciones y despliegues de modelos.
      3. Reportes automatizados:
        • Generación y envío de reportes periódicos.
      4. Integraciones de sistemas:
        • Orquestar sincronización de datos entre APIs o bases de datos.

      En resumen, un DAG es el núcleo de cualquier flujo de trabajo en Apache Airflow, proporcionando una estructura programable, visualizable y altamente escalable para ejecutar tareas dependientes.

      En definitiva, la gran mayoría de job posts para Data Engineering que me he encontrado mencionan DAG de alguna forma. Y es que la herramienta resume mucho del trabajo que se hace en este rol y DAG brinda esa facilidad de asegurar que las cosas no se rompan porque si.