CursosEmpresasBlogLiveConfPrecios

Aplicando transfer learning

Clase 7 de 17 • Curso de Transfer Learning con Hugging Face

Clase anteriorSiguiente clase

Contenido del curso

Introducción al Hub de Hugging Face
  • 1
    Introducción al transfer learning

    Introducción al transfer learning

    05:00
  • 2
    Machine learning abierto para todo el mundo

    Machine learning abierto para todo el mundo

    08:01
  • 3
    Las tasks en machine learning

    Las tasks en machine learning

    06:42
  • Quiz: introducción al Hub de Hugging Face

Primeros pasos con transfer learning y transformers
  • 4
    Tus primeros modelos pre-entrenados usando pipeline

    Tus primeros modelos pre-entrenados usando pipeline

    15:13
  • 5
    Explorando los datasets

    Explorando los datasets

    04:14
  • 6
    Introducción a los Transformers

    Introducción a los Transformers

    09:09
  • 7
    Aplicando transfer learning

    Aplicando transfer learning

    04:36
  • Quiz: Primeros pasos con transfer learning

Computer vision
  • 8
    Carga de dataset para computer vision

    Carga de dataset para computer vision

    15:32
  • 9
    Procesamiento de dataset para computer vision

    Procesamiento de dataset para computer vision

    11:15
  • 10
    Configurando un Trainer para computer vision

    Configurando un Trainer para computer vision

    18:19
  • 11
    Entrenamiento y evaluación de modelo de computer vision

    Entrenamiento y evaluación de modelo de computer vision

    07:14
  • Quiz: Computer vision con Hugging Face

Procesamiento de lenguaje natural
  • 12
    Carga de dataset para NLP

    Carga de dataset para NLP

    06:56
  • 13
    Procesamiento de dataset para NLP

    Procesamiento de dataset para NLP

    16:02
  • 14
    Configurando un Trainer para NLP

    Configurando un Trainer para NLP

    14:06
  • 15
    Entrenamiento y evaluación de modelo de NLP

    Entrenamiento y evaluación de modelo de NLP

    07:28
  • Quiz: NLP con Hugging Face

Comparte en el Hub
  • 16
    El Hub como tu curriculum para machine learning

    El Hub como tu curriculum para machine learning

    05:37
  • 17
    Compartir tu modelo en el Hub de Hugging Face

    Compartir tu modelo en el Hub de Hugging Face

    14:48
    Mauricio Combariza

    Mauricio Combariza

    student•
    hace 3 años

    Pasos para afinar un modelo:

    1. Descartar la cabeza del transformer pre-entrenado. Es decir le estamos quitando la última capa del transformer.
    2. Agrega cabezas nuevas para tu tarea. Ésta capa depende de la tarea que deseemos.
    3. Entrena con: 3.a Tensor flow o PyTorch 3b1 Si usas PyTorch usa el trainer de la librería transformers. 3b2 Si usas keras/tensorflow has el entrenamiento.

    Que curso tan increible, en pocas clases te abre todo un universo de posibilidades !!!

      Juan R. Vergara M.

      Juan R. Vergara M.

      student•
      hace 2 años

      Gracias por el resumen 📝👍

      Patricio Sánchez Fernández

      Patricio Sánchez Fernández

      student•
      hace 2 años

      Excelente resumen, Mauricio.

    Nicolas Velasquez Lopez

    Nicolas Velasquez Lopez

    student•
    hace 3 años

    Pregunté a chatGPT cuales son los pasos que debería seguir si quiero hacer transfer learning:

    Si deseas hacer transfer learning, puedes seguir los siguientes pasos:

    Selección del modelo base: Elige un modelo base pre-entrenado que tenga características similares a tu problema. Puedes encontrar modelos pre-entrenados en bibliotecas de aprendizaje profundo como TensorFlow, PyTorch, y Keras.

    Preparación de datos: Prepara tus datos en un formato que sea compatible con el modelo pre-entrenado que has elegido. Si tu conjunto de datos es muy diferente al conjunto de datos original en el que se entrenó el modelo pre-entrenado, es posible que necesites hacer ajustes y transformaciones adicionales.

    Ajuste fino del modelo: Descongela las últimas capas del modelo pre-entrenado y re-entrena todo el modelo con tus datos. Es importante establecer una tasa de aprendizaje adecuada y un tamaño de lote apropiado para evitar que el modelo se sobreajuste o subajuste.

    Evaluación del modelo: Evalúa el rendimiento del modelo ajustado con tus datos. Si el modelo no se desempeña de manera satisfactoria, puedes ajustar la arquitectura del modelo, experimentar con diferentes tasas de aprendizaje o hiperparámetros, o agregar capas adicionales al modelo.

    Uso del modelo: Una vez que hayas ajustado el modelo, puedes utilizarlo para realizar predicciones en nuevos datos. También puedes continuar ajustando el modelo con nuevos datos para mejorar su rendimiento.

    Recuerda que el transfer learning no es una solución universal para todos los problemas de aprendizaje profundo, pero puede ser una técnica muy útil para mejorar el rendimiento de un modelo con conjuntos de datos limitados o para reducir el tiempo y costo de entrenamiento de un modelo.

    Creo que es bastante acertado y concuerda con lo que dice la clase, sin embargo no me queda claro si hay que reentrenar todo el modelo o solo las capas nuevas 🤔

      Carlos Alberto Bustamante Gaytan

      Carlos Alberto Bustamante Gaytan

      student•
      hace 3 años

      Según yo lo adecuado sería trabajar con la última capa, pero como siempre depende de cada proyecto y problema planteado, lo que si es que es una aplicación muy útil. Imagina que quieres tratar con un problema de clasificación. Si la cantidad de datos que tienes es insuficiente (por ejemplo 1000 imágenes), puedes tener problemas si quisieras hacer el modelo desde cero (en temas de underfitting), pero si usas el Transfer Learning puedes obtener mejores resultados si ese modelo pre-entrenado fue entrenado con muchos más datos (por ejemplo 1,000,000). De esa manera te evitas hacer Data Augmentation o tener que obtener más datos.

      Patricio Sánchez Fernández

      Patricio Sánchez Fernández

      student•
      hace 2 años

      Chat GPT no lo soluciona todo, pero ¡Qué increíble herramienta! Ayuda a reducir la curva de aprendizaje.

    reacosta7383

    reacosta7383

    student•
    hace 3 años

    El transfer learning solo puede ser usado sobre transformers?

      FELIX  DAVID CORDOVA GARCIA

      FELIX DAVID CORDOVA GARCIA

      student•
      hace 3 años

      No, se usa bastante con redes neuronales convolucionales

    Maria Barrera

    Maria Barrera

    student•
    hace 3 años

    ¡Hola, Omar! ¿Qué tal? tengo una pregunta loca, supongamos que identificamos un modelo de lenguaje clínico que predice la posible palabra enmascarada de acuerdo al contexto ej: paciente que presenta <mask> arterial alta, quizá ese modelo tenga mayor afinidad hacia la palabra <presión>. Luego, usamos ese mismo modelo para hacer un NER clínico (entre las entidades supongamos que tenemos procedimiento, anatomía y sustancia) y obtenemos una métrica decente pero no tan buena.

    ¿Fue "NO sabio" haber usado un modelo de enmascarado en lugar de uno de NER propiamente?, pero una de las razones de la elección por ese modelo se debe a que fue entrenado con muchos datos clínicos entre ellos artículos, historias clínicas, patentes clínicas, etc.

    Es posible usar el encoder de ese modelo de enmascarado y concatenarlo a la entrada de un decoder propiamente de algún modelo de NER clínico??? (una limitante es que no encuentro una modelo de NER clínico tanto para procedimientos, medicamentos, anatomía, sustancias químicas, conceptos, etc), no sé si me hago entender xd.

    ¡Gracias!

      Omar Uriel Espejel Díaz

      Omar Uriel Espejel Díaz

      teacher•
      hace 3 años

      Me parece que lo ideal es usar o (1) el modelo del lenguaje (el enmascarado) con los datos clínicos y después crear tu propio NER afinando este modelo; o (2) encontrar un NER con lo que buscas y usarlo como modelo pre-entrenado (luego afinar con tus datos).

      Fusionar los dos modelos sería complejo porque probablemente utilicen diferentes tokenizadores y vocabulario, entre otras cosas.

      Maria Barrera

      Maria Barrera

      student•
      hace 3 años

      ¡Gracias, Omar! Continuaré con la opción 1.

    Joaquín Ricardo Svoboda Abregú

    Joaquín Ricardo Svoboda Abregú

    student•
    hace 3 años

    esta muy bueno el curso pero es un poco dificil entenderte, como que hablas susurrando y algunas palabras al final las decis tan bajito que ni se te escucha. entiendo que puede ser que quizas tengas un bebe en la casa y no lo queres despertar, solo es un poco molesto. igual muy bueno el curso

    Oscar Stiven Correa Guanare

    Oscar Stiven Correa Guanare

    student•
    hace 2 años

    Que estrategia me recomiendan para hacer fine tuning a un modelo que pueda entregar un valor entre 0 y 10 para determinar si una palabra clave de búsqueda se corresponde con la descripción de un producto?

    MARIA TERESA PANIAGUA RIVERA

    MARIA TERESA PANIAGUA RIVERA

    student•
    hace 2 años

    Gracias

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads