CursosEmpresasBlogLiveConfPrecios

Definiendo dependencias entre tareas

Clase 14 de 29 • Curso de Fundamentos de Apache Airflow

Contenido del curso

Introducción a Apache Airflow

  • 1
    Introducción al curso

    Introducción al curso

    03:05 min
  • 2
    ¿Para qué sirve airflow?

    ¿Para qué sirve airflow?

    05:34 min
  • 3
    ¿Por qué usar airflow?

    ¿Por qué usar airflow?

    02:56 min
  • 4
    Resumen módulo 1

    Resumen módulo 1

    00:47 min

Conceptos básicos

  • 5
    DAG

    DAG

    02:33 min
  • 6
    Tasks y Operators

    Tasks y Operators

    02:13 min
  • 7
    Scheduler

    Scheduler

    02:04 min

Instalación y configuración

  • 8
    Instalación de Apache Airflow usando Docker

    Instalación de Apache Airflow usando Docker

    03:14 min
  • 9
    Posibles configuraciones

    Posibles configuraciones

    04:34 min
  • 10
    Variables y conexiones

    Variables y conexiones

    04:15 min

Implementando un DAG

  • 11
    Implementando un DAG

    Implementando un DAG

    05:57 min
  • 12
    Bash Operator

    Bash Operator

    03:47 min
  • 13
    Python Operator

    Python Operator

    04:20 min
  • 14
    Definiendo dependencias entre tareas

    Definiendo dependencias entre tareas

    Viendo ahora
  • 15
    Custom Operator

    Custom Operator

    06:40 min

Orquestar y monitorizar procesos

  • 16
    Orquestando un DAG I

    Orquestando un DAG I

    10:31 min
  • 17
    Orquestando un DAG II

    Orquestando un DAG II

    06:32 min
  • 18
    Monitoring

    Monitoring

    07:22 min
  • 19
    Task Actions

    Task Actions

    13:13 min
  • 20
    Trigger Rules

    Trigger Rules

    14:18 min

Sensores

  • 21
    ¿Qué son los sensores?

    ¿Qué son los sensores?

    01:16 min
  • 22
    ExternalTaskSensor

    ExternalTaskSensor

    06:16 min
  • 23
    FileSensor

    FileSensor

    07:02 min

Templates con Jinja

  • 24
    ¿Qué son los templates con Jinja?

    ¿Qué son los templates con Jinja?

    06:48 min

XComs

  • 25
    ¿Qué son los Xcoms?

    ¿Qué son los Xcoms?

    06:17 min

BranchPythonOperator

  • 26
    BranchPythonOperator

    BranchPythonOperator

    05:40 min

Proyecto

  • 27
    Definición del proyecto

    Definición del proyecto

    03:41 min

Cierre del curso

  • 28
    Cierre del curso

    Cierre del curso

    01:35 min
  • 29

    Comparte tu proyecto de Platzi explora el espacio con Airflow y certifícate

Tomar examen

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads
        Gerardo Mayel Fernández Alamilla

        Gerardo Mayel Fernández Alamilla

        student•
        hace 3 años

        también se pueden combinar:

        from airflow import DAG from airflow.operators.python import PythonOperator from airflow.operators.bash import BashOperator from datetime import datetime def print_hello(): return print('hello world with python in airflow') with DAG(dag_id='dependencias', description='DAG con dependencias', schedule_interval='@once', start_date=datetime(2022, 7, 1)) as dag: t1 = PythonOperator(task_id='t1_primer_task_python', python_callable=print_hello) t2 = BashOperator(task_id='t2_task_bash', bash_command='echo "Tarea 2"') t3 = BashOperator(task_id='t3_task_bash', bash_command='echo "Tarea 3"') t4 = BashOperator(task_id='t4_task_bash', bash_command='echo "Tarea 4"') t1.set_downstream([t2, t3]) [t2, t3] >> t4
          Ezequiel Saldivar

          Ezequiel Saldivar

          student•
          hace 2 años

          no tiene sentido hacer eso.

        Daniel Santiago Merchán

        Daniel Santiago Merchán

        student•
        hace 3 años

        Ya se siente el poder de Airflow!

        Captura de Pantalla 2022-10-23 a la(s) 9.01.16 p.m..png
          Eric Bellet

          Eric Bellet

          teacher•
          hace 3 años

          Excelente Daniel 😁

        Nahuel Cueliche

        Nahuel Cueliche

        student•
        hace 4 meses

        Para ejecutar tareas en Apache Airflow en un entorno separado, debes utilizar un ejecutor que permita la distribución del trabajo. Puedes optar por el CeleryExecutor o el DaskExecutor. Estos ejecutores permiten que Airflow envíe las tareas a un cluster de trabajadores, procesando así el trabajo en máquinas distintas.

        Debes configurar tu archivo airflow.cfg para especificar el executor adecuado y asegurarte de que los trabajadores estén correctamente instalados y configurados para recibir las tareas. Esto permite una separación efectiva entre el procesamiento y la ejecución de tareas en Airflow.

        Daniel Olave

        Daniel Olave

        student•
        hace un año
        Así se vio mi ejemplo realizado con el material del curso
        Oscar Correcha

        Oscar Correcha

        student•
        hace 2 años

        No me funciono, debi usar un DummyOperator, alguien sabe el por que? Gracias

          Eric Bellet

          Eric Bellet

          teacher•
          hace 2 años

          ¿Qué error obtuviste?

        Oscar Gama

        Oscar Gama

        student•
        hace 2 años
        from airflow import DAG from airflow.operators.python_operator import PythonOperator from datetime import datetime def print_hello(): print("Hello Oscar :)") with DAG(dag_id="python_operator", description="Nuestro primer DAG utilizando Python Operator", schedule_interval="@once", start_date=datetime(2023, 10, 18)) as dag: t1 = PythonOperator(task_id="hello_with_Python", python_callable=print_hello)
        Marco Andres Loaiza Delgado

        Marco Andres Loaiza Delgado

        student•
        hace 3 años

        con 5 tareas: --> t3 t1 ---> t2 |-->t5 --> t4

        from airflow import DAG from airflow.operators.python import PythonOperator from airflow.operators.bash import BashOperator from datetime import datetime import time def prints(): timestamp = int(time.time()) # Print the timestamp print("Current timestamp:", timestamp) def prints2(): time.sleep(3) timestamp = int(time.time()) # Print the timestamp print("Current timestamp2:", timestamp) with DAG( dag_id='dependencias', description='our first DAG making depencies between taks', schedule_interval='@once', start_date=datetime(2023,8,3) ) as dag: t1=PythonOperator(task_id='task1', python_callable=prints ) t2=BashOperator(task_id="task2", bash_command="echo 'Hello platzis people'" ) t3=PythonOperator(task_id='task3', python_callable=prints2 ) t4=BashOperator(task_id="task4", bash_command="echo 'task4'" ) t5=BashOperator(task_id="task5", bash_command="echo 'task5'" ) """ \--> t3 t1 ---> t2 \--> t4 """ #t1.set_downstream(t2) #t2.set_downstream([t3,t4]) """ \--> t3 t1 ---> t2 |-->t5 \--> t4 """ t1 >> t2 >> [t3,t4] >> t5
        Marvin Avila Burgos

        Marvin Avila Burgos

        student•
        hace 3 años

        Dependencies are a powerful and popular Airflow feature. In Airflow, your pipelines are defined as Directed Acyclic Graphs (DAGs). Each task is a node in the graph and dependencies are the directed edges that determine how to move through the graph. Because of this, dependencies are key to following data engineering best practices because they help you define flexible pipelines with atomic tasks.

        Throughout this guide, the following terms are used to describe task dependencies:

        Upstream task: A task that must reach a specified state before a dependent task can run. Downstream task: A dependent task that cannot run until an upstream task reaches a specified state.

        Elias Dudamel

        Elias Dudamel

        student•
        hace 3 años

        Me gusta mucho este tipo de herramientas, se puede combinar con aws lambda y se puede hacer muchas cosas interesantes

        from airflow import DAG from airflow.operators.python import PythonOperator from airflow.operators.bash import BashOperator from datetime import datetime def print_hello(country, **kwargs): print(f'I am processing this {country}') with DAG(dag_id='dependecias' , description='Creando dependencias entre tareas' , start_date=datetime(2023, 6, 7) , schedule_interval='@once') as dag: t1 = PythonOperator(task_id='process_ar' , python_callable=print_hello , op_kwargs={'country':'AR'}) t2 = PythonOperator(task_id='process_uy' , python_callable=print_hello , op_kwargs={'country':'UY'}) t3 = BashOperator(task_id='process_mx' , bash_command="echo 'processing MX'") t4 = BashOperator(task_id='process_co' , bash_command="echo 'processing CO'") t1 >> [t2, t3] >> t4
          Eric Bellet

          Eric Bellet

          teacher•
          hace 3 años

          Totalmente, con AWS Lambda y Airflow hay un potencial muy grande

        Elitsoft Chile

        Elitsoft Chile

        student•
        hace 3 años

        Un paso más...

        IMG_005-multiplestareas.jpg

        Alfonso Andres Zapata Guzman

        Alfonso Andres Zapata Guzman

        student•
        hace 3 años

        Poderoso:

        t1 >> [t3, t4] >> t5 >> t7 t2 >> t5 t6 >> [t7, t8] >> t9
        Captura de pantalla 2023-05-05 102210.png

        ~ Por cierto, ya conectamos en LinkedIn? ~

        Conectemos en LinkedIn, GitHub, Medium o Redes sociales

        Freddy Norberto Montañez Gordillo

        Freddy Norberto Montañez Gordillo

        student•
        hace 3 años
        dependencies.png
        B)
        Camilo Andrés Rodriguez Higuera

        Camilo Andrés Rodriguez Higuera

        student•
        hace 5 meses

        Me parece muy práctica y legible la forma de usar ambas nomenclaturas. Me recuerda a los diagramas de P&ID.

        José Alberto Ortiz Vargas

        José Alberto Ortiz Vargas

        student•
        hace 3 años

        ¿Se pueden crear dependencias entre DAGs?

          Eric Bellet

          Eric Bellet

          teacher•
          hace 3 años

          Correcto, más adelante en el curso lo hacemos. Se hace con los sensores

        José Alberto Ortiz Vargas

        José Alberto Ortiz Vargas

        student•
        hace 3 años

        ¿Cual es la diferencia entre **set_downstream **y set_upstream?

          Eric Bellet

          Eric Bellet

          teacher•
          hace 3 años

          La diferencia es como defines el orden entre las tareas, la downstream es más natural

        Katerine Perdomo

        Katerine Perdomo

        student•
        hace 3 años

        Tengo esta linea en mi yaml file pero continuo viendo los ejemplos, que puedo hacer para que no se sigan viendo? Gracias

        AIRFLOW__CORE__LOAD_EXAMPLES: 'false'
          Eric Bellet

          Eric Bellet

          teacher•
          hace 3 años

          Tendrías que regenerar la imagen de Docker, docker compose build

          Alfonso Andres Zapata Guzman

          Alfonso Andres Zapata Guzman

          student•
          hace 3 años

          Ejecuta en consola:

          docker-compose up airflow-init docker-compose up -d

          ~ Por cierto, ya conectamos en LinkedIn? ~

          Conectemos en LinkedIn, GitHub, Medium o Redes sociales

        Santiago Ortiz Ceballos

        Santiago Ortiz Ceballos

        student•
        hace 3 años

        hubiera sido util que corrieras esa tarea, en mi caso la corro y aumenta el contador de "runs" pero no se ve nada en "recent tasks" y en "graph" no muestra que se haya ejecutado nada

          Eric Bellet

          Eric Bellet

          teacher•
          hace 3 años

          Puede ser que los filtros de búsqueda no estén bien. Intenta ejecutar varios días

        Randy José Agustín Montenegro Socha

        Randy José Agustín Montenegro Socha

        student•
        hace 10 meses

        Resultado:

        Eduard Giraldo Martínez

        Eduard Giraldo Martínez

        student•
        hace un año

        Entendiendo un poco esto:

        • Procesamiento de datos segmentados: Dividir datasets grandes para procesarlos en paralelo.
        <!---->
        • Pipeline de ML: Entrenar diferentes modelos simultáneamente con los mismos datos.
        <!---->
        • Alertas y notificaciones: Enviar notificaciones a distintos canales según resultados.
        <!---->
        • Validaciones de calidad: Ejecutar diferentes controles de calidad en paralelo.

        Actualizaciones de dashboards: Actualizar distintas visualizaciones tras procesar datos.

        Me dio curiosidad de cómo conectar varios flujos y pues este fue el resultado:

        Aqui el code

        from`` airflow ``import`` DAG from`` airflow.operators.python ``import`` PythonOperator from`` airflow.operators.bash ``import`` BashOperator from`` datetime ``import`` datetime

        def print_hello():    print('Hello!') with`` DAG(``dag_id`` = 'dependencia_python_bash',        ``description`` = 'primer DAG creando dependencias entre task',        start_date`` = datetime(2025,3,31),        ``schedule_interval`` = '@once') ``as`` dag: t1 = PythonOperator(``task_id`` = 'tarea1', python_callable`` = print_hello)        t2 = BashOperator(``task_id`` = 'tarea2',                    ``bash_command`` = 'echo "tarea2!"')        t3 = BashOperator(``task_id`` = 'tarea3',                    ``bash_command`` = 'echo "tarea3!"')        t4 = BashOperator(``task_id`` = 'tarea4',                    ``bash_command`` = 'echo "tarea4!"')        # Nuevas tareas después de t3``        t3a = BashOperator(``task_id`` = 'tarea3a',                    bash_command`` = 'echo "tarea3a!"')        # Nuevas tareas después de t4``        t4a = BashOperator(``task_id`` = 'tarea4a',                    ``bash_command`` = 'echo "tarea4a!"')        t4b = BashOperator(``task_id`` = 'tarea4b',                    ``bash_command`` = 'echo "tarea4b!"')        t4c = BashOperator(``task_id`` = 'tarea4c',                    ``bash_command`` = 'echo "tarea4c!"')            t1 >> t2 >> [t3, t4]    t3 >> [t3a, t4a]    t4 >> [t4a, t4b]    t4b >> t4c

          Eduard Giraldo Martínez

          Eduard Giraldo Martínez

          student•
          hace un año

          t1 >> t2 >> [t3, t4]    t3 >> [t3a, t4a]    t4 >> [t4a, t4b]    t4b >> t4c

        Anthony Isaac García Anaya

        Anthony Isaac García Anaya

        student•
        hace un año

        ¿Cuál usar?

        • Bitshift (>> y <<) es más limpio y más común en DAGs modernos.
        • set_downstream() y set_upstream() pueden ser útiles si necesitas claridad en algunos casos o cuando defines dependencias dentro de funciones.

        En la práctica, se recomienda usar >> y << porque hacen el código más legible.