Aplicando data augmentation

Clase 17 de 25 • Curso de Redes Neuronales Convolucionales con Python y Keras

Contenido del curso

Redes convolucionales y su importancia

Mi primera red neuronal convolucional

Manejo de imágenes

Fundamentos de redes neuronales convolucionales

Resolviendo un problema de clasificación

Optimización de red neuronal convolucional

Resolviendo una competencia de Kaggle

Resumen y siguientes pasos

Tomar examen

Comentarios

Rafael Betancur

student•

Link base de datos: https://www.kaggle.com/alarcon7a/cnn-data-sources

Carlos Felipe Saldarriaga Bejarano

student•

Algunos resultados de Nhaga con la siguiente configuración:

datagen = ImageDataGenerator(rotation_range=60,
                            width_shift_range=0.4,
                            height_shift_range=0.4,
                            zoom_range=0.3,
                            horizontal_flip=True,
                            fill_mode='reflect',
                            brightness_range=[0.3,1.4]                   
)

Alarcon7a

student•

que bella :3

Gonzalo Rojas Alvarez

student•

Omi, la gata, viendo el vacío

Videl Chavez Benavente

student•

Este módulo contiene utilidades para el preprocesamento y ampliación de imágenes. ImageDataGenerator: Es una clase que permite generar lotes de datos de imágenes con transformaciones en tiempo real, como rotación, cambio de tamaño, recorte, etc. Se puede usar para aumentar el conjunto de datos y evitar el sobreajuste. array_to_img: Es una función que convierte un arreglo de Numpy a una imagen de PIL (Python Imaging Library). Se puede usar para visualizar o guardar una imagen a partir de un arreglo. img_to_array: Es

Santiago Andres León Daza

student•

Ya tengo nuevo wallpaper

Jorge Andrés Robledo Ariza

student•

¿Cómo se haría en el caso de querer cargar la imagen en img = load_img y se encontrara el archivo en un repositorio o una url?

Alarcon7a

student•

import urllib.request
from PIL import Image
  
urllib.request.urlretrieve(
  'https://media.geeksforgeeks.org/wp-content/uploads/20210318103632/gfg-300x300.png',
   "gfg.png")
  
img = Image.open("gfg.png")
img.show()

José Daniel Cala Suárez

student•

Buenas. :D

Me queda la duda de cómo seria la sintaxis si quisiera usar un directorio local, es decir, una carpeta definida y sin tener la imagen en la misma carpeta que el archivo del programa.

Alarcon7a

student•

puedes ubicar la ruta que sea, incluso una ruta de algun repostorio

Jose Alberto Murcia Navas

student•

Que 'class_mode' debo usar en el 'train_generator' si quiero clasificar 3 o más clases ???

Alarcon7a

student•

categorical que es la clase default

Miguel Angel Echavarria Velez

student•

como puedo crear los subcarpetas para tener varios opciones de imágenes en la base de datos?

Alarcon7a

student•

Así es, más adelante en el curso aplicamos data augmentation de ese modo

Miguel Angel Echavarria Velez

student•

que código puedo usar si quiero guardar las imágenes para aumentar mi base de datos

Miguel Angel Echavarria Velez

student•

con augmentation ?

santiago henao

student•

entonces esta parte del codigo compara

train_generator= datage.flow_from_directory('/kaggle/input/cnn-data-sources/cats_and_dogs/train', target_size= (150,150), batch_size=32, class_mode= 'binary')

Ricardo Cruz

student•

Aqui totoro!!

Mario Alexander Vargas Celis

student•

Para aplicar data augmentation en tus modelos de clasificación de imágenes, puedes utilizar bibliotecas como TensorFlow y Keras, que proporcionan herramientas fáciles de usar para generar imágenes aumentadas durante el entrenamiento del modelo.

### Pasos para aplicar data augmentation en un flujo de trabajo de clasificación de imágenes:

1. **Cargar y preprocesar los datos**: Primero, necesitas un conjunto de datos de imágenes. En este ejemplo usaremos CIFAR-10 como conjunto de datos.

2. **Definir el generador de imágenes con augmentación**: El generador de datos será el que aplique las transformaciones aleatorias a las imágenes.

3. **Entrenar el modelo con datos aumentados**: Usar el generador para alimentar el modelo durante el entrenamiento.

### Ejemplo práctico en Keras con ImageDataGenerator


import tensorflow as tf

from tensorflow.keras.preprocessing.image import ImageDataGenerator

from tensorflow.keras.datasets import cifar10

import matplotlib.pyplot as plt



\# Cargar el conjunto de datos CIFAR-10

(x\_train, y\_train), (x\_test, y\_test) = cifar10.load\_data()



\# Normalizar los datos a un rango entre 0 y 1

x\_train = x\_train.astype('float32') / 255.0

x\_test = x\_test.astype('float32') / 255.0



\# Definir el generador de imágenes con augmentación

datagen = ImageDataGenerator(

&#x20;   rotation\_range=20,       # Rotación de hasta 20 grados

&#x20;   width\_shift\_range=0.2,   # Desplazamiento horizontal del 20%

&#x20;   height\_shift\_range=0.2,  # Desplazamiento vertical del 20%

&#x20;   horizontal\_flip=True,    # Voltear la imagen horizontalmente

&#x20;   zoom\_range=0.2           # Aplicar zoom hasta un 20%

)



\# Previsualización de augmentación en algunas imágenes

sample\_images = x\_train\[:5]

fig, axes = plt.subplots(1, 5, figsize=(15, 15))



for i, img in enumerate(sample\_images):

&#x20;   augmented\_image = datagen.random\_transform(img)

&#x20;   axes\[i].imshow(augmented\_image)

&#x20;   axes\[i].axis('off')



plt.show()



\# Crear un modelo simple

model = tf.keras.models.Sequential(\[

&#x20;   tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input\_shape=(32, 32, 3)),

&#x20;   tf.keras.layers.MaxPooling2D((2, 2)),

&#x20;   tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),

&#x20;   tf.keras.layers.MaxPooling2D((2, 2)),

&#x20;   tf.keras.layers.Flatten(),

&#x20;   tf.keras.layers.Dense(64, activation='relu'),

&#x20;   tf.keras.layers.Dense(10, activation='softmax')

])



\# Compilar el modelo

model.compile(optimizer='adam', loss='sparse\_categorical\_crossentropy', metrics=\['accuracy'])



\# Entrenar el modelo usando el generador de datos con augmentación

history = model.fit(datagen.flow(x\_train, y\_train, batch\_size=32),

&#x20;                   epochs=10, validation\_data=(x\_test, y\_test))



\# Evaluar el modelo

test\_loss, test\_acc = model.evaluate(x\_test, y\_test)

print(f'Test accuracy: {test\_acc:.4f}')

### Explicación del código:

1. **Cargar y normalizar los datos**:

- Cargamos el conjunto de datos CIFAR-10 y normalizamos los valores de los píxeles a un rango de 0 a 1.

2. **ImageDataGenerator**:

- Definimos el generador de imágenes, especificando las transformaciones que queremos aplicar. En este caso, incluimos rotación, traslación horizontal/vertical, zoom y flip horizontal.

3. **Visualización de augmentación**:

- Se muestra cómo algunas imágenes del conjunto de datos original son transformadas aleatoriamente con data augmentation para darle más diversidad al conjunto de datos de entrenamiento.

4. **Modelo de red neuronal**:

- Creamos un modelo simple de CNN (red neuronal convolucional) con dos capas convolucionales seguidas de capas de pooling y una capa densa para la clasificación.

5. **Entrenamiento con augmentación**:

- Durante el entrenamiento, las imágenes de entrenamiento se pasan por el generador de datos, el cual aplica data augmentation en tiempo real.

6. **Evaluación**:

- Finalmente, se evalúa el modelo en el conjunto de pruebas (sin data augmentation).

### ¿Por qué usar data augmentation?

- **Evita el sobreajuste**: El modelo no memoriza los datos de entrenamiento, ya que cada imagen se transforma de manera aleatoria en cada época.

- **Mejora la generalización**: Al exponer al modelo a múltiples variaciones de las imágenes, se entrena para detectar características importantes de las imágenes y no solo sus características específicas.

### ¿Qué transformaciones aplicar?

Las transformaciones dependen del tipo de datos con los que estés trabajando. Si tienes imágenes de objetos que pueden estar en diferentes orientaciones, como en CIFAR-10, las transformaciones como rotación, flips y desplazamientos son útiles. Si trabajas con imágenes donde el contexto espacial es importante, como en medicina, deberías ser más cuidadoso con qué transformaciones aplicas.

Este flujo de trabajo es aplicable para muchos otros problemas de visión por computadora y mejora el rendimiento del modelo con conjuntos de datos limitados.

Jhon Freddy Tavera Blandon

student•

img = load_img('/kaggle/input/projfreddy/DL.png')
x = img_to_array(img)
x = np.expand_dims(x, axis=0)
datagen = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.4,
    horizontal_flip=True,
    fill_mode='nearest'
)



i = 0
for batch in datagen.flow(x, batch_size=10):
    plt.figure(i)
    imgplot = plt.imshow(array_to_img(batch[0]))
    i += 1
    if i % 4 == 0:  # Mostrar solo 4 imágenes aumentadas
        break

plt.show()

Daniel Fernando Murcia Perdomo

student•

Mis perritas

Incluso en ciertas iteraciones, el target puede quedar por fuera de la imagen generada

datagen = ImageDataGenerator(rotation_range=60,
                            width_shift_range=0.4,
                            height_shift_range=0.4,
                            zoom_range=0.3,
                            horizontal_flip=True,
                            fill_mode='reflect',
                            brightness_range=[0.3,1.4]                   
) 

import urllib.request
from PIL import Image
  
urllib.request.urlretrieve(
  'https://media.geeksforgeeks.org/wp-content/uploads/20210318103632/gfg-300x300.png',
   "gfg.png")
  
img = Image.open("gfg.png")
img.show()

import tensorflow as tf

from tensorflow.keras.preprocessing.image import ImageDataGenerator

from tensorflow.keras.datasets import cifar10

import matplotlib.pyplot as plt

\# Cargar el conjunto de datos CIFAR-10

(x\_train, y\_train), (x\_test, y\_test) = cifar10.load\_data()

\# Normalizar los datos a un rango entre 0 y 1

x\_train = x\_train.astype('float32') / 255.0

x\_test = x\_test.astype('float32') / 255.0

\# Definir el generador de imágenes con augmentación

datagen = ImageDataGenerator(

&#x20;   rotation\_range=20,       # Rotación de hasta 20 grados

&#x20;   width\_shift\_range=0.2,   # Desplazamiento horizontal del 20%

&#x20;   height\_shift\_range=0.2,  # Desplazamiento vertical del 20%

&#x20;   horizontal\_flip=True,    # Voltear la imagen horizontalmente

&#x20;   zoom\_range=0.2           # Aplicar zoom hasta un 20%

)

\# Previsualización de augmentación en algunas imágenes

sample\_images = x\_train\[:5]

fig, axes = plt.subplots(1, 5, figsize=(15, 15))

for i, img in enumerate(sample\_images):

&#x20;   augmented\_image = datagen.random\_transform(img)

&#x20;   axes\[i].imshow(augmented\_image)

&#x20;   axes\[i].axis('off')

plt.show()

\# Crear un modelo simple

model = tf.keras.models.Sequential(\[

&#x20;   tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input\_shape=(32, 32, 3)),

&#x20;   tf.keras.layers.MaxPooling2D((2, 2)),

&#x20;   tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),

&#x20;   tf.keras.layers.MaxPooling2D((2, 2)),

&#x20;   tf.keras.layers.Flatten(),

&#x20;   tf.keras.layers.Dense(64, activation='relu'),

&#x20;   tf.keras.layers.Dense(10, activation='softmax')

])

\# Compilar el modelo

model.compile(optimizer='adam', loss='sparse\_categorical\_crossentropy', metrics=\['accuracy'])

\# Entrenar el modelo usando el generador de datos con augmentación

history = model.fit(datagen.flow(x\_train, y\_train, batch\_size=32),

&#x20;                   epochs=10, validation\_data=(x\_test, y\_test))

\# Evaluar el modelo

test\_loss, test\_acc = model.evaluate(x\_test, y\_test)

print(f'Test accuracy: {test\_acc:.4f}')

img = load_img('/kaggle/input/projfreddy/DL.png')
x = img_to_array(img)
x = np.expand_dims(x, axis=0)
datagen = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.4,
    horizontal_flip=True,
    fill_mode='nearest'
)



i = 0
for batch in datagen.flow(x, batch_size=10):
    plt.figure(i)
    imgplot = plt.imshow(array_to_img(batch[0]))
    i += 1
    if i % 4 == 0:  # Mostrar solo 4 imágenes aumentadas
        break

plt.show()

Aplicando data augmentation

Redes convolucionales y su importancia

La importancia del computer vision

¿Qué herramientas usaremos para redes neuronales convolucionales?

¿Qué son las redes convolucionales?

Mi primera red neuronal convolucional

Creando nuestra primera red convolucional

Entrenando nuestra primera red convolucional

Manejo de imágenes

Consejos para el manejo de imágenes

Manejo de imágenes con Python

Fundamentos de redes neuronales convolucionales

Kernel en redes neuronales

El kernel en acción

Padding y Strides

Capa de pooling

Arquitectura de redes convolucionales

Resolviendo un problema de clasificación

Clasificación con redes neuronales convolucionales

Creación de red convolucional para clasificación

Entrenamiento de un modelo de clasificación con redes convolucionales

Optimización de red neuronal convolucional

Data augmentation