CursosEmpresasBlogLiveConfPrecios

Definiendo dependencias entre tareas

Clase 14 de 29 • Curso de Fundamentos de Apache Airflow

Clase anteriorSiguiente clase

Contenido del curso

Introducción a Apache Airflow
  • 1
    Introducción al curso

    Introducción al curso

    03:05
  • 2
    ¿Para qué sirve airflow?

    ¿Para qué sirve airflow?

    05:34
  • 3
    ¿Por qué usar airflow?

    ¿Por qué usar airflow?

    02:56
  • 4
    Resumen módulo 1

    Resumen módulo 1

    00:47
Conceptos básicos
  • 5
    DAG

    DAG

    02:33
  • 6
    Tasks y Operators

    Tasks y Operators

    02:13
  • 7
    Scheduler

    Scheduler

    02:04
Instalación y configuración
  • 8
    Instalación de Apache Airflow usando Docker

    Instalación de Apache Airflow usando Docker

    03:14
  • 9
    Posibles configuraciones

    Posibles configuraciones

    04:34
  • 10
    Variables y conexiones

    Variables y conexiones

    04:15
Implementando un DAG
  • 11
    Implementando un DAG

    Implementando un DAG

    05:57
  • 12
    Bash Operator

    Bash Operator

    03:47
  • 13
    Python Operator

    Python Operator

    04:20
  • 14
    Definiendo dependencias entre tareas

    Definiendo dependencias entre tareas

    06:23
  • 15
    Custom Operator

    Custom Operator

    06:40
Orquestar y monitorizar procesos
  • 16
    Orquestando un DAG I

    Orquestando un DAG I

    10:31
  • 17
    Orquestando un DAG II

    Orquestando un DAG II

    06:32
  • 18
    Monitoring

    Monitoring

    07:22
  • 19
    Task Actions

    Task Actions

    13:13
  • 20
    Trigger Rules

    Trigger Rules

    14:18
Sensores
  • 21
    ¿Qué son los sensores?

    ¿Qué son los sensores?

    01:16
  • 22
    ExternalTaskSensor

    ExternalTaskSensor

    06:16
  • 23
    FileSensor

    FileSensor

    07:02
Templates con Jinja
  • 24
    ¿Qué son los templates con Jinja?

    ¿Qué son los templates con Jinja?

    06:48
XComs
  • 25
    ¿Qué son los Xcoms?

    ¿Qué son los Xcoms?

    06:17
BranchPythonOperator
  • 26
    BranchPythonOperator

    BranchPythonOperator

    05:40
Proyecto
  • 27
    Definición del proyecto

    Definición del proyecto

    03:41
Cierre del curso
  • 28
    Cierre del curso

    Cierre del curso

    01:35
  • 29

    Comparte tu proyecto de Platzi explora el espacio con Airflow y certifícate

    00:00
    Gerardo Mayel Fernández Alamilla

    Gerardo Mayel Fernández Alamilla

    student•
    hace 3 años

    también se pueden combinar:

    from airflow import DAG from airflow.operators.python import PythonOperator from airflow.operators.bash import BashOperator from datetime import datetime def print_hello(): return print('hello world with python in airflow') with DAG(dag_id='dependencias', description='DAG con dependencias', schedule_interval='@once', start_date=datetime(2022, 7, 1)) as dag: t1 = PythonOperator(task_id='t1_primer_task_python', python_callable=print_hello) t2 = BashOperator(task_id='t2_task_bash', bash_command='echo "Tarea 2"') t3 = BashOperator(task_id='t3_task_bash', bash_command='echo "Tarea 3"') t4 = BashOperator(task_id='t4_task_bash', bash_command='echo "Tarea 4"') t1.set_downstream([t2, t3]) [t2, t3] >> t4
      Ezequiel Saldivar

      Ezequiel Saldivar

      student•
      hace un año

      no tiene sentido hacer eso.

    Daniel Santiago Merchán

    Daniel Santiago Merchán

    student•
    hace 3 años

    Ya se siente el poder de Airflow!

    Captura de Pantalla 2022-10-23 a la(s) 9.01.16 p.m..png
      Eric Bellet

      Eric Bellet

      teacher•
      hace 3 años

      Excelente Daniel 😁

    Daniel Olave

    Daniel Olave

    student•
    hace un año
    Así se vio mi ejemplo realizado con el material del curso
    Oscar Correcha

    Oscar Correcha

    student•
    hace 2 años

    No me funciono, debi usar un DummyOperator, alguien sabe el por que? Gracias

      Eric Bellet

      Eric Bellet

      teacher•
      hace 2 años

      ¿Qué error obtuviste?

    Oscar Gama

    Oscar Gama

    student•
    hace 2 años
    from airflow import DAG from airflow.operators.python_operator import PythonOperator from datetime import datetime def print_hello(): print("Hello Oscar :)") with DAG(dag_id="python_operator", description="Nuestro primer DAG utilizando Python Operator", schedule_interval="@once", start_date=datetime(2023, 10, 18)) as dag: t1 = PythonOperator(task_id="hello_with_Python", python_callable=print_hello)
    Marco Andres Loaiza Delgado

    Marco Andres Loaiza Delgado

    student•
    hace 2 años

    con 5 tareas: --> t3 t1 ---> t2 |-->t5 --> t4

    from airflow import DAG from airflow.operators.python import PythonOperator from airflow.operators.bash import BashOperator from datetime import datetime import time def prints(): timestamp = int(time.time()) # Print the timestamp print("Current timestamp:", timestamp) def prints2(): time.sleep(3) timestamp = int(time.time()) # Print the timestamp print("Current timestamp2:", timestamp) with DAG( dag_id='dependencias', description='our first DAG making depencies between taks', schedule_interval='@once', start_date=datetime(2023,8,3) ) as dag: t1=PythonOperator(task_id='task1', python_callable=prints ) t2=BashOperator(task_id="task2", bash_command="echo 'Hello platzis people'" ) t3=PythonOperator(task_id='task3', python_callable=prints2 ) t4=BashOperator(task_id="task4", bash_command="echo 'task4'" ) t5=BashOperator(task_id="task5", bash_command="echo 'task5'" ) """ \--> t3 t1 ---> t2 \--> t4 """ #t1.set_downstream(t2) #t2.set_downstream([t3,t4]) """ \--> t3 t1 ---> t2 |-->t5 \--> t4 """ t1 >> t2 >> [t3,t4] >> t5
    Marvin Avila Burgos

    Marvin Avila Burgos

    student•
    hace 2 años

    Dependencies are a powerful and popular Airflow feature. In Airflow, your pipelines are defined as Directed Acyclic Graphs (DAGs). Each task is a node in the graph and dependencies are the directed edges that determine how to move through the graph. Because of this, dependencies are key to following data engineering best practices because they help you define flexible pipelines with atomic tasks.

    Throughout this guide, the following terms are used to describe task dependencies:

    Upstream task: A task that must reach a specified state before a dependent task can run. Downstream task: A dependent task that cannot run until an upstream task reaches a specified state.

    Elias Dudamel

    Elias Dudamel

    student•
    hace 2 años

    Me gusta mucho este tipo de herramientas, se puede combinar con aws lambda y se puede hacer muchas cosas interesantes

    from airflow import DAG from airflow.operators.python import PythonOperator from airflow.operators.bash import BashOperator from datetime import datetime def print_hello(country, **kwargs): print(f'I am processing this {country}') with DAG(dag_id='dependecias' , description='Creando dependencias entre tareas' , start_date=datetime(2023, 6, 7) , schedule_interval='@once') as dag: t1 = PythonOperator(task_id='process_ar' , python_callable=print_hello , op_kwargs={'country':'AR'}) t2 = PythonOperator(task_id='process_uy' , python_callable=print_hello , op_kwargs={'country':'UY'}) t3 = BashOperator(task_id='process_mx' , bash_command="echo 'processing MX'") t4 = BashOperator(task_id='process_co' , bash_command="echo 'processing CO'") t1 >> [t2, t3] >> t4
      Eric Bellet

      Eric Bellet

      teacher•
      hace 2 años

      Totalmente, con AWS Lambda y Airflow hay un potencial muy grande

    Elitsoft Chile

    Elitsoft Chile

    student•
    hace 3 años

    Un paso más...

    IMG_005-multiplestareas.jpg

    Alfonso Andres Zapata Guzman

    Alfonso Andres Zapata Guzman

    student•
    hace 3 años

    Poderoso:

    t1 >> [t3, t4] >> t5 >> t7 t2 >> t5 t6 >> [t7, t8] >> t9
    Captura de pantalla 2023-05-05 102210.png

    ~ Por cierto, ya conectamos en LinkedIn? ~

    Conectemos en LinkedIn, GitHub, Medium o Redes sociales

    Freddy Norberto Montañez Gordillo

    Freddy Norberto Montañez Gordillo

    student•
    hace 3 años
    dependencies.png
    B)
    Nahuel Cueliche

    Nahuel Cueliche

    student•
    hace 2 meses

    Para ejecutar tareas en Apache Airflow en un entorno separado, debes utilizar un ejecutor que permita la distribución del trabajo. Puedes optar por el CeleryExecutor o el DaskExecutor. Estos ejecutores permiten que Airflow envíe las tareas a un cluster de trabajadores, procesando así el trabajo en máquinas distintas.

    Debes configurar tu archivo airflow.cfg para especificar el executor adecuado y asegurarte de que los trabajadores estén correctamente instalados y configurados para recibir las tareas. Esto permite una separación efectiva entre el procesamiento y la ejecución de tareas en Airflow.

    Camilo Andrés Rodriguez Higuera

    Camilo Andrés Rodriguez Higuera

    student•
    hace 3 meses

    Me parece muy práctica y legible la forma de usar ambas nomenclaturas. Me recuerda a los diagramas de P&ID.

    José Alberto Ortiz Vargas

    José Alberto Ortiz Vargas

    student•
    hace 3 años

    ¿Se pueden crear dependencias entre DAGs?

      Eric Bellet

      Eric Bellet

      teacher•
      hace 3 años

      Correcto, más adelante en el curso lo hacemos. Se hace con los sensores

    José Alberto Ortiz Vargas

    José Alberto Ortiz Vargas

    student•
    hace 3 años

    ¿Cual es la diferencia entre **set_downstream **y set_upstream?

      Eric Bellet

      Eric Bellet

      teacher•
      hace 3 años

      La diferencia es como defines el orden entre las tareas, la downstream es más natural

    Katerine Perdomo

    Katerine Perdomo

    student•
    hace 3 años

    Tengo esta linea en mi yaml file pero continuo viendo los ejemplos, que puedo hacer para que no se sigan viendo? Gracias

    AIRFLOW__CORE__LOAD_EXAMPLES: 'false'
      Eric Bellet

      Eric Bellet

      teacher•
      hace 3 años

      Tendrías que regenerar la imagen de Docker, docker compose build

      Alfonso Andres Zapata Guzman

      Alfonso Andres Zapata Guzman

      student•
      hace 3 años

      Ejecuta en consola:

      docker-compose up airflow-init docker-compose up -d

      ~ Por cierto, ya conectamos en LinkedIn? ~

      Conectemos en LinkedIn, GitHub, Medium o Redes sociales

    Santiago Ortiz Ceballos

    Santiago Ortiz Ceballos

    student•
    hace 3 años

    hubiera sido util que corrieras esa tarea, en mi caso la corro y aumenta el contador de "runs" pero no se ve nada en "recent tasks" y en "graph" no muestra que se haya ejecutado nada

      Eric Bellet

      Eric Bellet

      teacher•
      hace 3 años

      Puede ser que los filtros de búsqueda no estén bien. Intenta ejecutar varios días

    Randy José Agustín Montenegro Socha

    Randy José Agustín Montenegro Socha

    student•
    hace 7 meses

    Resultado:

    Eduard Giraldo Martínez

    Eduard Giraldo Martínez

    student•
    hace 8 meses

    Entendiendo un poco esto:

    • Procesamiento de datos segmentados: Dividir datasets grandes para procesarlos en paralelo.
    <!---->
    • Pipeline de ML: Entrenar diferentes modelos simultáneamente con los mismos datos.
    <!---->
    • Alertas y notificaciones: Enviar notificaciones a distintos canales según resultados.
    <!---->
    • Validaciones de calidad: Ejecutar diferentes controles de calidad en paralelo.

    Actualizaciones de dashboards: Actualizar distintas visualizaciones tras procesar datos.

    Me dio curiosidad de cómo conectar varios flujos y pues este fue el resultado:

    Aqui el code

    from`` airflow ``import`` DAG from`` airflow.operators.python ``import`` PythonOperator from`` airflow.operators.bash ``import`` BashOperator from`` datetime ``import`` datetime

    def print_hello():    print('Hello!') with`` DAG(``dag_id`` = 'dependencia_python_bash',        ``description`` = 'primer DAG creando dependencias entre task',        start_date`` = datetime(2025,3,31),        ``schedule_interval`` = '@once') ``as`` dag: t1 = PythonOperator(``task_id`` = 'tarea1', python_callable`` = print_hello)        t2 = BashOperator(``task_id`` = 'tarea2',                    ``bash_command`` = 'echo "tarea2!"')        t3 = BashOperator(``task_id`` = 'tarea3',                    ``bash_command`` = 'echo "tarea3!"')        t4 = BashOperator(``task_id`` = 'tarea4',                    ``bash_command`` = 'echo "tarea4!"')        # Nuevas tareas después de t3``        t3a = BashOperator(``task_id`` = 'tarea3a',                    bash_command`` = 'echo "tarea3a!"')        # Nuevas tareas después de t4``        t4a = BashOperator(``task_id`` = 'tarea4a',                    ``bash_command`` = 'echo "tarea4a!"')        t4b = BashOperator(``task_id`` = 'tarea4b',                    ``bash_command`` = 'echo "tarea4b!"')        t4c = BashOperator(``task_id`` = 'tarea4c',                    ``bash_command`` = 'echo "tarea4c!"')            t1 >> t2 >> [t3, t4]    t3 >> [t3a, t4a]    t4 >> [t4a, t4b]    t4b >> t4c

      Eduard Giraldo Martínez

      Eduard Giraldo Martínez

      student•
      hace 8 meses

      t1 >> t2 >> [t3, t4]    t3 >> [t3a, t4a]    t4 >> [t4a, t4b]    t4b >> t4c

    Anthony Isaac García Anaya

    Anthony Isaac García Anaya

    student•
    hace 9 meses

    ¿Cuál usar?

    • Bitshift (>> y <<) es más limpio y más común en DAGs modernos.
    • set_downstream() y set_upstream() pueden ser útiles si necesitas claridad en algunos casos o cuando defines dependencias dentro de funciones.

    En la práctica, se recomienda usar >> y << porque hacen el código más legible.

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads