Introducción al aprendizaje por transferencia

Cursos Empresas Blog Live Conf Precios

Contenido del curso

Cómo utilizar TensorFlow 2.0 con Python

Manejo y preprocesamiento de datos para redes neuronales

Optimización de precisión de modelos

Almacenamiento y carga de modelos

Fundamentos de aprendizaje por transferencia

Resultados de entrenamiento

Tomar examen

Introducción al aprendizaje por transferencia

Resumen

El transfer learning es una técnica valiosísima que nos permite aprovechar modelos ya entrenados por otros devs para usarlos en nuestros datasets.

A través de este módulo comprenderemos qué es el aprendizaje por transferencia, cómo cargar sistemas pre-entrenados, cómo consumirlos desde fuentes de terceros y cómo aplicarlos a nuestros proyectos.

¿Cómo funciona el aprendizaje por transferencia?

Para entender cómo funciona el transfer learning vamos a hacer una analogía: cuando eras niño aprendiste a manejar bicicleta, durante ese aprendizaje entendiste los conceptos de equilibrio, fuerza, velocidad y demás. En el futuro, cuando aprendas a manejar moto, podrás trasladar gran parte de los conceptos que ya aprendiste para obtener ventaja en este nuevo aprendizaje.

A nivel de máquina el transfer learning se hace a través de las features o características del modelo que entrenaste originalmente. Supón que tienes un detector de manzanas y ahora quieres detectar otras frutas (naranjas, piñas, etc).

No será necesario volver a entrenar un modelo desde el inicio dado que ya posees una configuración que detecta formas y colores, bastaría con hacer algunas iteraciones sobre este modelo principal con los nuevos datos y obtendrás un modelo igual de funcional.

En la red puedes encontrar decenas de configuraciones que han sido entrenadas por meses de la mano de grandes protagonistas de la investigación del deep learning.

El proceso de configuración será el de eliminar la capa final de la red que vamos a aprovechar (la capa de predicciones original) y la sustituiremos por nuestra propia configuración de salida.

Usando una red ya entrenada

Antes de usar un modelo pre-entrenado es fundamental entender su arquitectura.

La arquitectua MobileNet V2 fue diseñada para detección de objetos en dispositivos embebidos y móviles, su entrada es una imágen de 300x300 pixeles y a través de una serie de capas convolucionales con max pooling se adquieren todas las features a clasificar con un sistema de redes neuronales. Si quisieramos usarla, bastaría con eliminar la última capa y personalizarla a nuestra necesidad.

Para esta ocasión cargaremos el modelo Inception versión 3 (otra arquitectura altamente conocida de redes convolucionales). Importaremos nuestras dependencias de Keras y cargaremos la configuración desde la locación donde estén guardadas en disco, crearemos un modelo secuencial y lo inyectaremos desde la primer capa (nota que no se incluye la capa de salida).

Se añade nuestra nueva capa de salida y se configura al modelo como no entrenable.

from tensorflow.keras.layers import Dense
from tensorflow.keras.Model import Sequential
from tensorflow.keras.applications.inception_v3 import InceptionV3

## URL incepction model
weights_file = "/tmp/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5"

new_model = Sequential()
new_model.add(InceptionV3(include_top = False,
                          weights = weights_file))

new_model.add(Dense(num_classes, activation = "softmax"))
new_model.layers[0].trainable = False

Con esto podemos aprovechar cientos de modelos ya entrenados por otros IA devs.

Contribución creada por Sebastián Franco Gómez.

Jhon Freddy Tavera Blandon

student

El aprendizaje por transferencia ofrece varias ventajas:

Acelera el entrenamiento: Al aprovechar el conocimiento adquirido en la tarea fuente, el modelo para la tarea objetivo puede aprender más rápido y con menos datos. Esto es especialmente útil para tareas donde la recopilación de datos es costosa o difícil.

Mejora el rendimiento: En muchos casos, el aprendizaje por transferencia puede conducir a un mejor rendimiento en la tarea objetivo, incluso si el modelo pre-entrenado no fue diseñado específicamente para esa tarea. Esto se debe a que el modelo pre-entrenado ha aprendido representaciones generales del mundo que pueden ser útiles para una amplia gama de tareas.

Reduce la necesidad de datos: El aprendizaje por transferencia puede ser particularmente beneficioso cuando se dispone de conjuntos de datos pequeños para la tarea objetivo. Al utilizar un modelo pre-entrenado, el modelo objetivo puede aprender a partir de menos datos de los que necesitaría si se entrenara desde cero.

Tipos de aprendizaje por transferencia:

Aprendizaje por transferencia fina (fine-tuning): En este enfoque, se ajusta el modelo pre-entrenado en la tarea objetivo. Esto implica modificar las capas superiores del modelo para que se adapten a los datos específicos de la tarea objetivo.

Extracción de características (feature extraction): En este enfoque, se utilizan las capas iniciales del modelo pre-entrenado como extractor de características. Las características extraídas se utilizan luego para entrenar un nuevo modelo lineal o de otro tipo en la tarea objetivo.

Ejemplos

Visión artificial: Se puede utilizar para entrenar modelos de reconocimiento de objetos, clasificación de imágenes y segmentación de imágenes.

Procesamiento del lenguaje natural: Se puede utilizar para entrenar modelos de traducción automática, análisis de sentimientos y resumen de texto.

Robótica: Se puede utilizar para entrenar robots para realizar tareas como la navegación, la manipulación de objetos y el reconocimiento de voz.

Cómo utilizar TensorFlow 2.0 con Python

Redes Neuronales y TensorFlow: Crea Modelos de IA desde Cero

Programación con TensorFlow 2 y Python: Fundamentos y Aplicaciones

Manejo y preprocesamiento de datos para redes neuronales

Carga y Procesamiento de Bases de Datos en Inteligencia Artificial

Carga de Bases de Datos JSON desde GCP en Google Colab

Codificación Base64 y Gestión de Imágenes en Google Colab

Preprocesamiento y limpieza de datos

Keras datasets

Datasets generators

Aprende a buscar bases de datos para deep learning

Cómo distribuir los datos

Crear la red neural, definir capas, compilar, entrenar, evaluar y predicciones

Optimización de precisión de modelos

Métodos de regularización: overfitting y underfitting

Recomendaciones prácticas para ajustar un modelo

Métricas para medir la eficiencia de un modelo: callback

Monitoreo del entrenamiento en tiempo real: early stopping y patience

KerasTuner: construyendo el modelo

KerasTuner: buscando la mejor configuración para tu modelo

Almacenamiento y carga de modelos

Almacenamiento y carga de modelos: pesos y arquitectura

Criterios para almacenar los modelos

Fundamentos de aprendizaje por transferencia