CursosEmpresasBlogLiveConfPrecios

Definiendo dependencias entre tareas

Clase 14 de 29 • Curso de Fundamentos de Apache Airflow

Clase anteriorSiguiente clase

Contenido del curso

Introducción a Apache Airflow

  • 1
    Introducción al curso

    Introducción al curso

    03:05 min
  • 2
    ¿Para qué sirve airflow?

    ¿Para qué sirve airflow?

    05:34 min
  • 3
    ¿Por qué usar airflow?

    ¿Por qué usar airflow?

    02:56 min
  • 4
    Resumen módulo 1

    Resumen módulo 1

    00:47 min

Conceptos básicos

  • 5
    DAG

    DAG

    02:33 min
  • 6
    Tasks y Operators

    Tasks y Operators

    02:13 min
  • 7
    Scheduler

    Scheduler

    02:04 min

Instalación y configuración

  • 8
    Instalación de Apache Airflow usando Docker

    Instalación de Apache Airflow usando Docker

    03:14 min
  • 9
    Posibles configuraciones

    Posibles configuraciones

    04:34 min
  • 10
    Variables y conexiones

    Variables y conexiones

    04:15 min

Implementando un DAG

  • 11
    Implementando un DAG

    Implementando un DAG

    05:57 min
  • 12
    Bash Operator

    Bash Operator

    03:47 min
  • 13
    Python Operator

    Python Operator

    04:20 min
  • 14
    Definiendo dependencias entre tareas

    Definiendo dependencias entre tareas

    Viendo ahora
  • 15
    Custom Operator

    Custom Operator

    06:40 min

Orquestar y monitorizar procesos

  • 16
    Orquestando un DAG I

    Orquestando un DAG I

    10:31 min
  • 17
    Orquestando un DAG II

    Orquestando un DAG II

    06:32 min
  • 18
    Monitoring

    Monitoring

    07:22 min
  • 19
    Task Actions

    Task Actions

    13:13 min
  • 20
    Trigger Rules

    Trigger Rules

    14:18 min

Sensores

  • 21
    ¿Qué son los sensores?

    ¿Qué son los sensores?

    01:16 min
  • 22
    ExternalTaskSensor

    ExternalTaskSensor

    06:16 min
  • 23
    FileSensor

    FileSensor

    07:02 min

Templates con Jinja

  • 24
    ¿Qué son los templates con Jinja?

    ¿Qué son los templates con Jinja?

    06:48 min

XComs

  • 25
    ¿Qué son los Xcoms?

    ¿Qué son los Xcoms?

    06:17 min

BranchPythonOperator

  • 26
    BranchPythonOperator

    BranchPythonOperator

    05:40 min

Proyecto

  • 27
    Definición del proyecto

    Definición del proyecto

    03:41 min

Cierre del curso

  • 28
    Cierre del curso

    Cierre del curso

    01:35 min
  • 29

    Comparte tu proyecto de Platzi explora el espacio con Airflow y certifícate

  • Tomar el examen del curso
    • Gerardo Mayel Fernández Alamilla

      Gerardo Mayel Fernández Alamilla

      student•
      hace 3 años

      también se pueden combinar:

      from airflow import DAG from airflow.operators.python import PythonOperator from airflow.operators.bash import BashOperator from datetime import datetime def print_hello(): return print('hello world with python in airflow') with DAG(dag_id='dependencias', description='DAG con dependencias', schedule_interval='@once', start_date=datetime(2022, 7, 1)) as dag: t1 = PythonOperator(task_id='t1_primer_task_python', python_callable=print_hello) t2 = BashOperator(task_id='t2_task_bash', bash_command='echo "Tarea 2"') t3 = BashOperator(task_id='t3_task_bash', bash_command='echo "Tarea 3"') t4 = BashOperator(task_id='t4_task_bash', bash_command='echo "Tarea 4"') t1.set_downstream([t2, t3]) [t2, t3] >> t4
        Ezequiel Saldivar

        Ezequiel Saldivar

        student•
        hace un año

        no tiene sentido hacer eso.

      Daniel Santiago Merchán

      Daniel Santiago Merchán

      student•
      hace 3 años

      Ya se siente el poder de Airflow!

      Captura de Pantalla 2022-10-23 a la(s) 9.01.16 p.m..png
        Eric Bellet

        Eric Bellet

        teacher•
        hace 3 años

        Excelente Daniel 😁

      Daniel Olave

      Daniel Olave

      student•
      hace un año
      Así se vio mi ejemplo realizado con el material del curso
      Oscar Correcha

      Oscar Correcha

      student•
      hace 2 años

      No me funciono, debi usar un DummyOperator, alguien sabe el por que? Gracias

        Eric Bellet

        Eric Bellet

        teacher•
        hace 2 años

        ¿Qué error obtuviste?

      Oscar Gama

      Oscar Gama

      student•
      hace 2 años
      from airflow import DAG from airflow.operators.python_operator import PythonOperator from datetime import datetime def print_hello(): print("Hello Oscar :)") with DAG(dag_id="python_operator", description="Nuestro primer DAG utilizando Python Operator", schedule_interval="@once", start_date=datetime(2023, 10, 18)) as dag: t1 = PythonOperator(task_id="hello_with_Python", python_callable=print_hello)
      Marco Andres Loaiza Delgado

      Marco Andres Loaiza Delgado

      student•
      hace 2 años

      con 5 tareas: --> t3 t1 ---> t2 |-->t5 --> t4

      from airflow import DAG from airflow.operators.python import PythonOperator from airflow.operators.bash import BashOperator from datetime import datetime import time def prints(): timestamp = int(time.time()) # Print the timestamp print("Current timestamp:", timestamp) def prints2(): time.sleep(3) timestamp = int(time.time()) # Print the timestamp print("Current timestamp2:", timestamp) with DAG( dag_id='dependencias', description='our first DAG making depencies between taks', schedule_interval='@once', start_date=datetime(2023,8,3) ) as dag: t1=PythonOperator(task_id='task1', python_callable=prints ) t2=BashOperator(task_id="task2", bash_command="echo 'Hello platzis people'" ) t3=PythonOperator(task_id='task3', python_callable=prints2 ) t4=BashOperator(task_id="task4", bash_command="echo 'task4'" ) t5=BashOperator(task_id="task5", bash_command="echo 'task5'" ) """ \--> t3 t1 ---> t2 \--> t4 """ #t1.set_downstream(t2) #t2.set_downstream([t3,t4]) """ \--> t3 t1 ---> t2 |-->t5 \--> t4 """ t1 >> t2 >> [t3,t4] >> t5
      Marvin Avila Burgos

      Marvin Avila Burgos

      student•
      hace 2 años

      Dependencies are a powerful and popular Airflow feature. In Airflow, your pipelines are defined as Directed Acyclic Graphs (DAGs). Each task is a node in the graph and dependencies are the directed edges that determine how to move through the graph. Because of this, dependencies are key to following data engineering best practices because they help you define flexible pipelines with atomic tasks.

      Throughout this guide, the following terms are used to describe task dependencies:

      Upstream task: A task that must reach a specified state before a dependent task can run. Downstream task: A dependent task that cannot run until an upstream task reaches a specified state.

      Elias Dudamel

      Elias Dudamel

      student•
      hace 3 años

      Me gusta mucho este tipo de herramientas, se puede combinar con aws lambda y se puede hacer muchas cosas interesantes

      from airflow import DAG from airflow.operators.python import PythonOperator from airflow.operators.bash import BashOperator from datetime import datetime def print_hello(country, **kwargs): print(f'I am processing this {country}') with DAG(dag_id='dependecias' , description='Creando dependencias entre tareas' , start_date=datetime(2023, 6, 7) , schedule_interval='@once') as dag: t1 = PythonOperator(task_id='process_ar' , python_callable=print_hello , op_kwargs={'country':'AR'}) t2 = PythonOperator(task_id='process_uy' , python_callable=print_hello , op_kwargs={'country':'UY'}) t3 = BashOperator(task_id='process_mx' , bash_command="echo 'processing MX'") t4 = BashOperator(task_id='process_co' , bash_command="echo 'processing CO'") t1 >> [t2, t3] >> t4
        Eric Bellet

        Eric Bellet

        teacher•
        hace 2 años

        Totalmente, con AWS Lambda y Airflow hay un potencial muy grande

      Elitsoft Chile

      Elitsoft Chile

      student•
      hace 3 años

      Un paso más...

      IMG_005-multiplestareas.jpg

      Alfonso Andres Zapata Guzman

      Alfonso Andres Zapata Guzman

      student•
      hace 3 años

      Poderoso:

      t1 >> [t3, t4] >> t5 >> t7 t2 >> t5 t6 >> [t7, t8] >> t9
      Captura de pantalla 2023-05-05 102210.png

      ~ Por cierto, ya conectamos en LinkedIn? ~

      Conectemos en LinkedIn, GitHub, Medium o Redes sociales

      Freddy Norberto Montañez Gordillo

      Freddy Norberto Montañez Gordillo

      student•
      hace 3 años
      dependencies.png
      B)
      Nahuel Cueliche

      Nahuel Cueliche

      student•
      hace 2 meses

      Para ejecutar tareas en Apache Airflow en un entorno separado, debes utilizar un ejecutor que permita la distribución del trabajo. Puedes optar por el CeleryExecutor o el DaskExecutor. Estos ejecutores permiten que Airflow envíe las tareas a un cluster de trabajadores, procesando así el trabajo en máquinas distintas.

      Debes configurar tu archivo airflow.cfg para especificar el executor adecuado y asegurarte de que los trabajadores estén correctamente instalados y configurados para recibir las tareas. Esto permite una separación efectiva entre el procesamiento y la ejecución de tareas en Airflow.

      Camilo Andrés Rodriguez Higuera

      Camilo Andrés Rodriguez Higuera

      student•
      hace 3 meses

      Me parece muy práctica y legible la forma de usar ambas nomenclaturas. Me recuerda a los diagramas de P&ID.

      José Alberto Ortiz Vargas

      José Alberto Ortiz Vargas

      student•
      hace 3 años

      ¿Se pueden crear dependencias entre DAGs?

        Eric Bellet

        Eric Bellet

        teacher•
        hace 3 años

        Correcto, más adelante en el curso lo hacemos. Se hace con los sensores

      José Alberto Ortiz Vargas

      José Alberto Ortiz Vargas

      student•
      hace 3 años

      ¿Cual es la diferencia entre **set_downstream **y set_upstream?

        Eric Bellet

        Eric Bellet

        teacher•
        hace 3 años

        La diferencia es como defines el orden entre las tareas, la downstream es más natural

      Katerine Perdomo

      Katerine Perdomo

      student•
      hace 3 años

      Tengo esta linea en mi yaml file pero continuo viendo los ejemplos, que puedo hacer para que no se sigan viendo? Gracias

      AIRFLOW__CORE__LOAD_EXAMPLES: 'false'
        Eric Bellet

        Eric Bellet

        teacher•
        hace 3 años

        Tendrías que regenerar la imagen de Docker, docker compose build

        Alfonso Andres Zapata Guzman

        Alfonso Andres Zapata Guzman

        student•
        hace 3 años

        Ejecuta en consola:

        docker-compose up airflow-init docker-compose up -d

        ~ Por cierto, ya conectamos en LinkedIn? ~

        Conectemos en LinkedIn, GitHub, Medium o Redes sociales

      Santiago Ortiz Ceballos

      Santiago Ortiz Ceballos

      student•
      hace 3 años

      hubiera sido util que corrieras esa tarea, en mi caso la corro y aumenta el contador de "runs" pero no se ve nada en "recent tasks" y en "graph" no muestra que se haya ejecutado nada

        Eric Bellet

        Eric Bellet

        teacher•
        hace 3 años

        Puede ser que los filtros de búsqueda no estén bien. Intenta ejecutar varios días

      Randy José Agustín Montenegro Socha

      Randy José Agustín Montenegro Socha

      student•
      hace 7 meses

      Resultado:

      Eduard Giraldo Martínez

      Eduard Giraldo Martínez

      student•
      hace 8 meses

      Entendiendo un poco esto:

      • Procesamiento de datos segmentados: Dividir datasets grandes para procesarlos en paralelo.
      <!---->
      • Pipeline de ML: Entrenar diferentes modelos simultáneamente con los mismos datos.
      <!---->
      • Alertas y notificaciones: Enviar notificaciones a distintos canales según resultados.
      <!---->
      • Validaciones de calidad: Ejecutar diferentes controles de calidad en paralelo.

      Actualizaciones de dashboards: Actualizar distintas visualizaciones tras procesar datos.

      Me dio curiosidad de cómo conectar varios flujos y pues este fue el resultado:

      Aqui el code

      from`` airflow ``import`` DAG from`` airflow.operators.python ``import`` PythonOperator from`` airflow.operators.bash ``import`` BashOperator from`` datetime ``import`` datetime

      def print_hello():    print('Hello!') with`` DAG(``dag_id`` = 'dependencia_python_bash',        ``description`` = 'primer DAG creando dependencias entre task',        start_date`` = datetime(2025,3,31),        ``schedule_interval`` = '@once') ``as`` dag: t1 = PythonOperator(``task_id`` = 'tarea1', python_callable`` = print_hello)        t2 = BashOperator(``task_id`` = 'tarea2',                    ``bash_command`` = 'echo "tarea2!"')        t3 = BashOperator(``task_id`` = 'tarea3',                    ``bash_command`` = 'echo "tarea3!"')        t4 = BashOperator(``task_id`` = 'tarea4',                    ``bash_command`` = 'echo "tarea4!"')        # Nuevas tareas después de t3``        t3a = BashOperator(``task_id`` = 'tarea3a',                    bash_command`` = 'echo "tarea3a!"')        # Nuevas tareas después de t4``        t4a = BashOperator(``task_id`` = 'tarea4a',                    ``bash_command`` = 'echo "tarea4a!"')        t4b = BashOperator(``task_id`` = 'tarea4b',                    ``bash_command`` = 'echo "tarea4b!"')        t4c = BashOperator(``task_id`` = 'tarea4c',                    ``bash_command`` = 'echo "tarea4c!"')            t1 >> t2 >> [t3, t4]    t3 >> [t3a, t4a]    t4 >> [t4a, t4b]    t4b >> t4c

        Eduard Giraldo Martínez

        Eduard Giraldo Martínez

        student•
        hace 8 meses

        t1 >> t2 >> [t3, t4]    t3 >> [t3a, t4a]    t4 >> [t4a, t4b]    t4b >> t4c

      Anthony Isaac García Anaya

      Anthony Isaac García Anaya

      student•
      hace 9 meses

      ¿Cuál usar?

      • Bitshift (>> y <<) es más limpio y más común en DAGs modernos.
      • set_downstream() y set_upstream() pueden ser útiles si necesitas claridad en algunos casos o cuando defines dependencias dentro de funciones.

      En la práctica, se recomienda usar >> y << porque hacen el código más legible.

    Escuelas

    • Desarrollo Web
      • Fundamentos del Desarrollo Web Profesional
      • Diseño y Desarrollo Frontend
      • Desarrollo Frontend con JavaScript
      • Desarrollo Frontend con Vue.js
      • Desarrollo Frontend con Angular
      • Desarrollo Frontend con React.js
      • Desarrollo Backend con Node.js
      • Desarrollo Backend con Python
      • Desarrollo Backend con Java
      • Desarrollo Backend con PHP
      • Desarrollo Backend con Ruby
      • Bases de Datos para Web
      • Seguridad Web & API
      • Testing Automatizado y QA para Web
      • Arquitecturas Web Modernas y Escalabilidad
      • DevOps y Cloud para Desarrolladores Web
    • English Academy
      • Inglés Básico A1
      • Inglés Básico A2
      • Inglés Intermedio B1
      • Inglés Intermedio Alto B2
      • Inglés Avanzado C1
      • Inglés para Propósitos Específicos
      • Inglés de Negocios
    • Marketing Digital
      • Fundamentos de Marketing Digital
      • Marketing de Contenidos y Redacción Persuasiva
      • SEO y Posicionamiento Web
      • Social Media Marketing y Community Management
      • Publicidad Digital y Paid Media
      • Analítica Digital y Optimización (CRO)
      • Estrategia de Marketing y Growth
      • Marketing de Marca y Comunicación Estratégica
      • Marketing para E-commerce
      • Marketing B2B
      • Inteligencia Artificial Aplicada al Marketing
      • Automatización del Marketing
      • Marca Personal y Marketing Freelance
      • Ventas y Experiencia del Cliente
      • Creación de Contenido para Redes Sociales
    • Inteligencia Artificial y Data Science
      • Fundamentos de Data Science y AI
      • Análisis y Visualización de Datos
      • Machine Learning y Deep Learning
      • Data Engineer
      • Inteligencia Artificial para la Productividad
      • Desarrollo de Aplicaciones con IA
      • AI Software Engineer
    • Ciberseguridad
      • Fundamentos de Ciberseguridad
      • Hacking Ético y Pentesting (Red Team)
      • Análisis de Malware e Ingeniería Forense
      • Seguridad Defensiva y Cumplimiento (Blue Team)
      • Ciberseguridad Estratégica
    • Liderazgo y Habilidades Blandas
      • Fundamentos de Habilidades Profesionales
      • Liderazgo y Gestión de Equipos
      • Comunicación Avanzada y Oratoria
      • Negociación y Resolución de Conflictos
      • Inteligencia Emocional y Autogestión
      • Productividad y Herramientas Digitales
      • Gestión de Proyectos y Metodologías Ágiles
      • Desarrollo de Carrera y Marca Personal
      • Diversidad, Inclusión y Entorno Laboral Saludable
      • Filosofía y Estrategia para Líderes
    • Diseño de Producto y UX
      • Fundamentos de Diseño UX/UI
      • Investigación de Usuarios (UX Research)
      • Arquitectura de Información y Usabilidad
      • Diseño de Interfaces y Prototipado (UI Design)
      • Sistemas de Diseño y DesignOps
      • Redacción UX (UX Writing)
      • Creatividad e Innovación en Diseño
      • Diseño Accesible e Inclusivo
      • Diseño Asistido por Inteligencia Artificial
      • Gestión de Producto y Liderazgo en Diseño
      • Diseño de Interacciones Emergentes (VUI/VR)
      • Desarrollo Web para Diseñadores
      • Diseño y Prototipado No-Code
    • Contenido Audiovisual
      • Fundamentos de Producción Audiovisual
      • Producción de Video para Plataformas Digitales
      • Producción de Audio y Podcast
      • Fotografía y Diseño Gráfico para Contenido Digital
      • Motion Graphics y Animación
      • Contenido Interactivo y Realidad Aumentada
      • Estrategia, Marketing y Monetización de Contenidos
    • Desarrollo Móvil
      • Fundamentos de Desarrollo Móvil
      • Desarrollo Nativo Android con Kotlin
      • Desarrollo Nativo iOS con Swift
      • Desarrollo Multiplataforma con React Native
      • Desarrollo Multiplataforma con Flutter
      • Arquitectura y Patrones de Diseño Móvil
      • Integración de APIs y Persistencia Móvil
      • Testing y Despliegue en Móvil
      • Diseño UX/UI para Móviles
    • Diseño Gráfico y Arte Digital
      • Fundamentos del Diseño Gráfico y Digital
      • Diseño de Identidad Visual y Branding
      • Ilustración Digital y Arte Conceptual
      • Diseño Editorial y de Empaques
      • Motion Graphics y Animación 3D
      • Diseño Gráfico Asistido por Inteligencia Artificial
      • Creatividad e Innovación en Diseño
    • Programación
      • Fundamentos de Programación e Ingeniería de Software
      • Herramientas de IA para el trabajo
      • Matemáticas para Programación
      • Programación con Python
      • Programación con JavaScript
      • Programación con TypeScript
      • Programación Orientada a Objetos con Java
      • Desarrollo con C# y .NET
      • Programación con PHP
      • Programación con Go y Rust
      • Programación Móvil con Swift y Kotlin
      • Programación con C y C++
      • Administración Básica de Servidores Linux
    • Negocios
      • Fundamentos de Negocios y Emprendimiento
      • Estrategia y Crecimiento Empresarial
      • Finanzas Personales y Corporativas
      • Inversión en Mercados Financieros
      • Ventas, CRM y Experiencia del Cliente
      • Operaciones, Logística y E-commerce
      • Gestión de Proyectos y Metodologías Ágiles
      • Aspectos Legales y Cumplimiento
      • Habilidades Directivas y Crecimiento Profesional
      • Diversidad e Inclusión en el Entorno Laboral
      • Herramientas Digitales y Automatización para Negocios
    • Blockchain y Web3
      • Fundamentos de Blockchain y Web3
      • Desarrollo de Smart Contracts y dApps
      • Finanzas Descentralizadas (DeFi)
      • NFTs y Economía de Creadores
      • Seguridad Blockchain
      • Ecosistemas Blockchain Alternativos (No-EVM)
      • Producto, Marketing y Legal en Web3
    • Recursos Humanos
      • Fundamentos y Cultura Organizacional en RRHH
      • Atracción y Selección de Talento
      • Cultura y Employee Experience
      • Gestión y Desarrollo de Talento
      • Desarrollo y Evaluación de Liderazgo
      • Diversidad, Equidad e Inclusión
      • AI y Automatización en Recursos Humanos
      • Tecnología y Automatización en RRHH
    • Finanzas e Inversiones
      • Fundamentos de Finanzas Personales y Corporativas
      • Análisis y Valoración Financiera
      • Inversión y Mercados de Capitales
      • Finanzas Descentralizadas (DeFi) y Criptoactivos
      • Finanzas y Estrategia para Startups
      • Inteligencia Artificial Aplicada a Finanzas
      • Domina Excel
      • Financial Analyst
      • Conseguir trabajo en Finanzas e Inversiones
    • Startups
      • Fundamentos y Validación de Ideas
      • Estrategia de Negocio y Product-Market Fit
      • Desarrollo de Producto y Operaciones Lean
      • Finanzas, Legal y Fundraising
      • Marketing, Ventas y Growth para Startups
      • Cultura, Talento y Liderazgo
      • Finanzas y Operaciones en Ecommerce
      • Startups Web3 y Blockchain
      • Startups con Impacto Social
      • Expansión y Ecosistema Startup
    • Cloud Computing y DevOps
      • Fundamentos de Cloud y DevOps
      • Administración de Servidores Linux
      • Contenerización y Orquestación
      • Infraestructura como Código (IaC) y CI/CD
      • Amazon Web Services
      • Microsoft Azure
      • Serverless y Observabilidad
      • Certificaciones Cloud (Preparación)
      • Plataforma Cloud GCP

    Platzi y comunidad

    • Platzi Business
    • Live Classes
    • Lanzamientos
    • Executive Program
    • Trabaja con nosotros
    • Podcast

    Recursos

    • Manual de Marca

    Soporte

    • Preguntas Frecuentes
    • Contáctanos

    Legal

    • Términos y Condiciones
    • Privacidad
    • Tyc promociones
    Reconocimientos
    Reconocimientos
    Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
    Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
    Logo reconocimientoPrimera Startup EdTech · 2018
    Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
    Logo reconocimientoCEO Mejor Emprendedor del año · 2024
    De LATAM conpara el mundo
    YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads