Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Curso de TensorFlow.js

Curso de TensorFlow.js

Alejandro Santamaria

Alejandro Santamaria

Entrenando un modelo

8/21
Recursos

Aportes 7

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

en que momento vamos a instalar todo para empezar a programar?

¿Se puede utilizar las mismas imágenes de entrenamiento para la evaluación? Es decir ingresamos 10 imágenes para entrenarle alguna de esas imágenes se puede utilizar para evaluar.

Antes de entrenar el modelo debemos decidir 3 cosas:

  • Un optimizador: Que optimizador utilizar?
  • Una funcion de perdida: Que funcion de perdida utilizar?
  • Una lista de metricas: Cual es la lista de metricas con base a las cuales iremos monitoreando el aprendizaje de nuestro modelo.

En una clase del curso de Introducción a Machine Learning se explica como usar el Neural Network Playground. --> Link a la clase

Funciones de pérdida
Es el objetivo que el modelo intentará minimizar. Su meta es devolver un número que indique “que tan mal” está la predicción del modelo. Este cálculo se realiza para cada “lote” de datos de entrenamiento. Existen algunas funciones predefinidas como “categoricalCrossentropy” o “meanSquaredError”.

🔹 categoricalCrossentropy

Medida de entropía que permite clasificar claramente entre dos categorías

🔹 meanSquaredError

Distancia mínima cuadrada entre los puntos que el modelo está aprendiendo y el punto que se esta prediciendo.

  • La función de pérdida se irá calculando de manera repetitiva para cada batch de datos y finalmente, el optimizador será el encargado de ir moviendo los parámetros tal que la función de pérdida sea mínima.

La regularización y normalización de los datos favorece los cálculos de los valores de parámetros (pesos) y el acercamiento acelerado al menor costo (pérdida) en el entrenamiento. Al llevar todos los features (valores de entrada) a un rango controlado entre 0 y 1 ó, -1 y 1 la cantidad de iteraciones necesarias para llegar al mínimo de la función de pérdida (o costo) es generalmente menor por lo que el tiempo necesario para el entrenamiento del modelo se podría reducir considerablemente.

Cabe aclarar que este modelo no funciona cuando el digito dibujado no es encuentra en el centro, para esto existen las redes neuronales convolucionadas