tengo dudas en este fragmento de codigo optimizer.zero_grad() loss.backward() optimizer.step()

Pepito Dev

Pepito Dev

Pregunta
studenthace 6 años

tengo dudas en este fragmento de codigo optimizer.zero_grad() loss.backward() optimizer.step()

1 respuestas
para escribir tu comentario
    Andres Mauricio Cano Causil

    Andres Mauricio Cano Causil

    studenthace 5 años

    Por lo que investigue y entendi.

    optimizer.zero_grad() es para inicializar los parametros necesarios para calcular el descenso de la gradiente.

    loss.backward() es para hacer un back propagation que consiste en calcular el error, penalizar los pesos de cada caracteristica que se usan para hacer la prediccion o ir hacia atras de capa en capa y penalizar a las neuronas culpables de ese error (en deep learning) para asi calcular nuevos pesos con la ayuda de la gradiente. PD: Entre mayor sea la carga de responsabilidad de error para cada peso, mas grande sera el cambio en su nuevo valor.

    optimizer.step() es el que mueve el punto en el descenso de la gradiente, es decir el que efectua el nuevo valor de los pesos. (Corregirme si estoy equivocado en alguno de esos terminos)

Curso de Introducción a Machine Learning 2019

Curso de Introducción a Machine Learning 2019

El Machine Learning no es una moda pasajera, es algo que llegó para quedarse y siempre le ha interesado a la humanidad. Aprende las bases para el desarrollo de proyectos de aprendizaje automático. Domina el aprendizaje supervisado resolviendo un problema de clasificación de imágenes y construye un modelo de clasificación binaria de imágenes. ¡Comienza ya con el Curso de Introducción a Machine Learning de Platzi!

Curso de Introducción a Machine Learning 2019
Curso de Introducción a Machine Learning 2019

Curso de Introducción a Machine Learning 2019

El Machine Learning no es una moda pasajera, es algo que llegó para quedarse y siempre le ha interesado a la humanidad. Aprende las bases para el desarrollo de proyectos de aprendizaje automático. Domina el aprendizaje supervisado resolviendo un problema de clasificación de imágenes y construye un modelo de clasificación binaria de imágenes. ¡Comienza ya con el Curso de Introducción a Machine Learning de Platzi!