Fine-tuning en detección de objetos: data augmentation

Detección de objetos

import tensorflow as tf

import numpy as np

\# Supón que tienes una imagen de entrada y sus bounding boxes

def augment\_image(image, boxes):

&#x20;   \# Convertir las bounding boxes a \[ymin, xmin, ymax, xmax] (formato de TensorFlow)

&#x20;   boxes = tf.convert\_to\_tensor(boxes, dtype=tf.float32)

&#x20;   boxes = tf.expand\_dims(boxes, axis=0)

&#x20;   \# Aplicar traslación y rotación a la imagen y ajustar las bounding boxes

&#x20;   image, boxes = tf.image.random\_flip\_left\_right(image, boxes)

&#x20;   image, boxes = tf.image.random\_contrast(image, 0.8, 1.2), boxes

&#x20;   image, boxes = tf.image.random\_brightness(image, max\_delta=0.1), boxes

&#x20;   \# Aplanar las bounding boxes

&#x20;   boxes = tf.squeeze(boxes, axis=0)

&#x20;  &#x20;

&#x20;   return image, boxes.numpy()

\# Ejemplo de uso

image = tf.random.normal(\[256, 256, 3])  # Imagen de ejemplo

boxes = \[\[0.1, 0.2, 0.5, 0.7]]           # Ejemplo de bounding box

augmented\_image, augmented\_boxes = augment\_image(image, boxes)

import albumentations as A

from albumentations.pytorch import ToTensorV2

\# Transformación de data augmentation

transform = A.Compose(\[

&#x20;   A.HorizontalFlip(p=0.5),

&#x20;   A.RandomBrightnessContrast(p=0.2),

&#x20;   A.RandomRotate90(p=0.5),

&#x20;   A.Resize(256, 256),

], bbox\_params=A.BboxParams(format='pascal\_voc', label\_fields=\['class\_labels']))

\# Ejemplo de aplicación

image = np.random.randint(0, 255, (256, 256, 3), dtype=np.uint8)

bboxes = \[\[10, 15, 100, 150]]  # Bounding box en formato Pascal VOC

class\_labels = \[1]  # Etiquetas de clase

\# Aplicar la transformación

transformed = transform(image=image, bboxes=bboxes, class\_labels=class\_labels)

augmented\_image = transformed\['image']

augmented\_bboxes = transformed\['bboxes']

import tensorflow as tf

import numpy as np

\# Supón que tienes una imagen de entrada y sus bounding boxes

def augment\_image(image, boxes):

&#x20;   \# Convertir las bounding boxes a \[ymin, xmin, ymax, xmax] (formato de TensorFlow)

&#x20;   boxes = tf.convert\_to\_tensor(boxes, dtype=tf.float32)

&#x20;   boxes = tf.expand\_dims(boxes, axis=0)

&#x20;   \# Aplicar traslación y rotación a la imagen y ajustar las bounding boxes

&#x20;   image, boxes = tf.image.random\_flip\_left\_right(image, boxes)

&#x20;   image, boxes = tf.image.random\_contrast(image, 0.8, 1.2), boxes

&#x20;   image, boxes = tf.image.random\_brightness(image, max\_delta=0.1), boxes

&#x20;   \# Aplanar las bounding boxes

&#x20;   boxes = tf.squeeze(boxes, axis=0)

&#x20;  &#x20;

&#x20;   return image, boxes.numpy()

\# Ejemplo de uso

image = tf.random.normal(\[256, 256, 3])  # Imagen de ejemplo

boxes = \[\[0.1, 0.2, 0.5, 0.7]]           # Ejemplo de bounding box

augmented\_image, augmented\_boxes = augment\_image(image, boxes)

import albumentations as A

from albumentations.pytorch import ToTensorV2

\# Transformación de data augmentation

transform = A.Compose(\[

&#x20;   A.HorizontalFlip(p=0.5),

&#x20;   A.RandomBrightnessContrast(p=0.2),

&#x20;   A.RandomRotate90(p=0.5),

&#x20;   A.Resize(256, 256),

], bbox\_params=A.BboxParams(format='pascal\_voc', label\_fields=\['class\_labels']))

\# Ejemplo de aplicación

image = np.random.randint(0, 255, (256, 256, 3), dtype=np.uint8)

bboxes = \[\[10, 15, 100, 150]]  # Bounding box en formato Pascal VOC

class\_labels = \[1]  # Etiquetas de clase

\# Aplicar la transformación

transformed = transform(image=image, bboxes=bboxes, class\_labels=class\_labels)

augmented\_image = transformed\['image']

augmented\_bboxes = transformed\['bboxes']

Fine-tuning en detección de objetos: data augmentation

Introducción a Computer Vision

¿Qué es la visión computarizada y cuáles son sus tipos?

Detección de objetos

Introducción a object detection: sliding window y bounding box

Generando video de sliding window

Introducción a object detection: backbone, non-max suppression y métricas

Visualización de IoU en object detection

Tipos de arquitecturas en detección de objetos

Arquitecturas relevantes en object detection

Utilizando un dataset de object detection

Carga de dataset de object detection

Exploración del dataset de object detection

Visualización de bounding boxes en el dataset de object detection

Aumentado de datos con Albumentation

Implementando Albumentation en object detection

Visualizando imágenes con aumentado de datos

Utilizando un modelo de object detection pre-entrenado

Probar detección de objetos con modelo pre-entrenado

Fine-tuning en detección de objetos

Fine-tuning en detección de objetos: carga de datos

Fine-tuning en detección de objetos: data augmentation

Fine-tuning en detección de objetos: entrenamiento

Fine-tuning en detección de objetos: visualización de objetos

Segmentación de objetos

Introduciendo la segmentación de objetos

Tipos de segmentación y sus arquitecturas relevantes

¿Cómo es un dataset de segmentación?

Utilizando un dataset de segmentación de objetos

Visualización de nuestro dataset de segmentación

Creando red neuronal U-Net para segmentación

Entrenando y estudiando una red de segmentación

Generando predicciones con modelo de object segmentation

Un paso más allá

El estado de la cuestión en computer vision

Comparte tu proyecto de detección y segmentación de objetos para conducción autónoma y certifícate