CursosEmpresasBlogLiveConfPrecios

Propagación hacia atrás

Clase 7 de 9 • Curso de Redes Neuronales y Backpropagation 2017

Contenido del curso

Retropropagación: Visión general

  • 1
    Cómo funciona el aprendizaje supervisado en una Red Neuronal

    Cómo funciona el aprendizaje supervisado en una Red Neuronal

    10:21 min
  • 2
    Un LEGO a la vez: Explicando las matemáticas de cómo aprenden las Redes Neuronales

    Un LEGO a la vez: Explicando las matemáticas de cómo aprenden las Redes Neuronales

    02:25 min

Evaluación de errores

  • 3
    Función de costo, supuestos y probabilidad

    Función de costo, supuestos y probabilidad

    04:51 min
  • 4
    Un Ejemplo Concreto: Aprendiendo la Función XOR

    Un Ejemplo Concreto: Aprendiendo la Función XOR

    02:14 min

Optimización matemática

  • 5
    Cuál es el algoritmo de retropropagación

    Cuál es el algoritmo de retropropagación

    06:26 min
  • 6
    Actualizar los pesos de la red neuronal utilizando gradientes

    Actualizar los pesos de la red neuronal utilizando gradientes

    10:19 min
  • 7
    Propagación hacia atrás

    Propagación hacia atrás

    Viendo ahora
  • 8
    Demo: aprendiendo a separar clases

    Demo: aprendiendo a separar clases

    14:08 min
  • 9
    Implementación y ejemplos de redes neuronales funcionando

    Implementación y ejemplos de redes neuronales funcionando

    01:35 min
Tomar examen

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads

      El objetivo de este paso es actualizar los pesos de la red neuronal en una dirección que minimiza la función de pérdida. Como veremos mas adelante, este es un algoritmo recursivo, el cual reutiliza gradientes previamente calculadas y se basada plenamente en funciones diferenciables. Ya que estas actualizaciones reducen la función de pérdida, una red ‘aprende’ a aproximar las etiquetas de nuevas observaciones. Una propiedad llamada generalización.

      Este paso va en orden reverso que la propagación hacia adelante. Este calcula la primera derivada de la función de pérdida con respecto a los pesos de la red neuronal de la capa de salida (dLoss/dW2) y luego los de la capa escondida (dLoss/dW1). Expliquemos en detalle cada uno.

      dLoss/dW2:

      La regla de la cadena dice que podemos descomponer el calculo de gradientes de una red neuronal en funciones diferenciables:

      Aquí están las definiciones de funciones usadas arriba y sus primeras derivadas:

      Screen Shot 2017-11-13 at 12.23.35 PM.png

      Mas visualmente, queremos actualizar los pesos W2 (en azul) en la figura de abajo. Para eso necesitamos calcular tres derivadas parciales a lo largo de la cadena.

      Insertando esos valores esas derivadas parciales nos permiten calcular gradientes con respecto a los pesos W2 como sigue.

      El resultado es una matriz de 3x2 llamada dLoss/dW2, la cual actualizara los valores originales de W2 en una dirección que minimiza la función de pérdida.

      dLoss/dW1:

      Calculando la regla de la cadena para actualizar los pesos de la primera capa escondida W1 exhibe la posibilidad de reutilizar cálculos existentes.

      Mas visualmente, el camino desde la capa de salida hasta los pesos W1 toca derivadas parciales ya calculadas en capas mas superiores.

      Por ejemplo, la derivada parcial dLoss/dh2 y dh2/dz2 ha sido ya calculada como una dependencia para aprender los pesos de la capa de salida dLoss/dW2 en la sección anterior.

      Ubicando todas las derivadas juntas, podemos ejecutar la regla de la cadena de nuevo para actualizar los pesos de la capa escondida W1:

      Finalmente, asignamos los nuevos valores de los pesos y hemos completado una iteración del entrenamiento de la red neuronal!

      Comentarios

        Andres Leonardo Arevalo

        Andres Leonardo Arevalo

        student•
        hace 8 años

        Si alguien fuera tan amable de explicarme. No logro comprender porque se dan estos cambios
        dW2 por dh1

        chain_w1.png

        Y el cambio de dz2/ dh1 por la matriz de pesos W2,

        chain_w1_numbers.png

          Juan Esteban  Lucero Cabezas

          Juan Esteban Lucero Cabezas

          student•
          hace 8 años

          En el orden de tus preguntas,

          1. dW2 no se cambia dh1, el dh1 aparece cuando haces regla de la cadena (reglas de derivacion) a la derivada dLoss/dh1. Como la funcion Loss depende de z2 y z2 depende de h1, usando la regla de la cadena puedes hacer la relacion entre Loss y h1, la cual es la se muestra en la primera imagen. Por eso dW2 no tiene nada que ver.
          2. De videos pasados sabemos que z2 = W2 * h1, entonces como z2 es una transformacion lineal entre h1 y los pesos W2 (en terminos simples, porque se multiplican), la derivada dz2/dh1 = W2
          Andres Leonardo Arevalo

          Andres Leonardo Arevalo

          student•
          hace 8 años

          Te agradezco mucho tu explicación me fue de mucha ayuda, para el segundo punto el profesor lo muestra también en el siguiente cuadro.

          Captura de pantalla 2018-03-05 a la(s) 10.58.22 p. m..png
        Enrique Ortuno

        Enrique Ortuno

        student•
        hace 7 años

        Por que en dLoss/dW2 se usa la transpuesta? Cuando en la formula inicial NO se menciona para nada la transpuesta?

        Alonso Melgar Lopez

        Alonso Melgar Lopez

        student•
        hace 8 años

        Existe un pequeño error de dedo, en la derivada del primero renglón de la cuadricula ya que se realiza la derivada de “Loss” con respecto a “W2” cuando en realidad eso es lo que lo se esta buscando en ultima instancia, por lo que la derivada de “Loss” es con respecto a “h2”

        CodeCogsEqn2.jpg

        Aprovecho la ocasión para felicitarlos por tan excelente curso y esperando que sea el inicio de muchos cursos mas con esta temática.

        Victor Daniel Aguirre Gil

        Victor Daniel Aguirre Gil

        student•
        hace 7 años

        Una manera muy simple de explicarlo, muchas gracias.

        Miguel

        Miguel

        student•
        hace 6 años

        Porque α es igual a 0.001

          Diego Fernando Charfuelan Burbano

          Diego Fernando Charfuelan Burbano

          student•
          hace 6 años

          es una tasa de aprendizaje, se escoge segun la necesidad y experiencia del diseñador de la red

          Bryan David Rosas Rojas

          Bryan David Rosas Rojas

          student•
          hace 6 años

          que criterio utiliza el diseñador para elegir este valor?