Introducción a Computer Vision

1

¿Qué es la visión computarizada y cuáles son sus tipos?

Detección de objetos

2

Introducción a object detection: sliding window y bounding box

3

Generando video de sliding window

4

Introducción a object detection: backbone, non-max suppression y métricas

5

Visualización de IoU en object detection

6

Tipos de arquitecturas en detección de objetos

7

Arquitecturas relevantes en object detection

8

Utilizando un dataset de object detection

9

Carga de dataset de object detection

10

Exploración del dataset de object detection

11

Visualización de bounding boxes en el dataset de object detection

12

Aumentado de datos con Albumentation

13

Implementando Albumentation en object detection

14

Visualizando imágenes con aumentado de datos

15

Utilizando un modelo de object detection pre-entrenado

16

Probar detección de objetos con modelo pre-entrenado

17

Fine-tuning en detección de objetos

18

Fine-tuning en detección de objetos: carga de datos

19

Fine-tuning en detección de objetos: data augmentation

20

Fine-tuning en detección de objetos: entrenamiento

21

Fine-tuning en detección de objetos: visualización de objetos

Quiz: Detección de objetos

Segmentación de objetos

22

Introduciendo la segmentación de objetos

23

Tipos de segmentación y sus arquitecturas relevantes

24

¿Cómo es un dataset de segmentación?

25

Utilizando un dataset de segmentación de objetos

26

Visualización de nuestro dataset de segmentación

27

Creando red neuronal U-Net para segmentación

28

Entrenando y estudiando una red de segmentación

29

Generando predicciones con modelo de object segmentation

Quiz: Segmentación de objetos

Un paso más allá

30

El estado de la cuestión en computer vision

31

Comparte tu proyecto de detección y segmentación de objetos para conducción autónoma y certifícate

No se trata de lo que quieres comprar, sino de quién quieres ser. Invierte en tu educación con el precio especial

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

12 Días
5 Hrs
35 Min
22 Seg

Introducción a object detection: sliding window y bounding box

2/31
Recursos

Aportes 7

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Prueben con la versión !pip install opencv-python-headless==4.8.0.76 Actualizado 26/09/2023

Que emocionante aprender detección y segmentación de objetos, segunda clase y el curso ya se volvió muy interesante.

he tenido incoveniente para instalar la version 4.1.2.30 ![](https://static.platzi.com/media/user_upload/image-0d305f8e-5f78-4a48-a911-fdb81f400f98.jpg)
instale la versión por defecto a la fecha 3/10/23: !pip install opencv-python-headless

Algo muy parecido a una convolucional genial!!

La \*\*detección de objetos\*\* es una técnica clave en la visión computarizada que no solo reconoce qué objetos están presentes en una imagen, sino que también los localiza mediante \*\*bounding boxes\*\* (cajas delimitadoras). Este proceso es esencial para aplicaciones como la conducción autónoma, la vigilancia, la robótica, y muchas otras. \### 1. ¿Qué es la detección de objetos? La detección de objetos consiste en identificar instancias de objetos de una o más clases (como personas, automóviles, animales, etc.) en una imagen o video y marcarlos con una \*\*caja delimitadora\*\* que define la posición y el tamaño de cada objeto. \### 2. Técnicas básicas de detección de objetos \#### a. Sliding Window El método de \*\*ventana deslizante (sliding window)\*\* es uno de los enfoques más básicos y antiguos en la detección de objetos. Este método implica: \- \*\*Dividir la imagen\*\*: La imagen se divide en secciones más pequeñas utilizando una ventana de tamaño fijo que se desliza sobre toda la imagen en diferentes posiciones y escalas. \- \*\*Extracción de características\*\*: Para cada posición de la ventana, se extraen características de la imagen que luego se envían a un clasificador (por ejemplo, SVM o una red neuronal simple). \- \*\*Clasificación\*\*: El clasificador determina si la región de la imagen contiene o no el objeto de interés. \- \*\*Escaneo a múltiples escalas\*\*: Para detectar objetos de diferentes tamaños, la ventana se redimensiona y se vuelve a escanear la imagen. \*\*Ventajas\*\*: \- Simplicidad en su implementación y comprensión. \- Compatible con cualquier clasificador o algoritmo de extracción de características. \*\*Desventajas\*\*: \- \*\*Computacionalmente costoso\*\*: Escanear la imagen a diferentes escalas y posiciones requiere mucho tiempo de procesamiento, especialmente en imágenes de alta resolución. \- \*\*Ineficiencia\*\*: No es práctico para aplicaciones en tiempo real. \#### b. Bounding Box Una \*\*bounding box\*\* es un rectángulo que rodea el objeto detectado y se utiliza para marcar su ubicación en la imagen. Las coordenadas de una bounding box se suelen definir mediante cuatro valores: `(x\_min, y\_min, x\_max, y\_max)`, donde `(x\_min, y\_min)` representa la esquina superior izquierda y `(x\_max, y\_max)` la esquina inferior derecha. Las bounding boxes se utilizan junto con los algoritmos de detección de objetos para presentar visualmente dónde se encuentra un objeto detectado dentro de la imagen. \### 3. Limitaciones del enfoque tradicional El enfoque de sliding window, aunque funcional, es ineficiente para tareas complejas debido a la alta carga computacional y al procesamiento redundante de áreas de la imagen. Esto llevó al desarrollo de métodos más avanzados como: \- \*\*Redes convolucionales (CNN)\*\* para una extracción de características más eficiente. \- \*\*R-CNN (Regions with CNN features)\*\*: Mejora la selección de regiones al aplicar una red convolucional en cada propuesta de región. \- \*\*YOLO (You Only Look Once)\*\* y \*\*SSD (Single Shot MultiBox Detector)\*\*: Técnicas modernas que procesan la imagen completa en un solo paso para detectar objetos en tiempo real. \### 4. ¿Cómo mejoran las técnicas modernas la detección de objetos? Las técnicas modernas, como YOLO y SSD, reemplazan el enfoque de sliding window con redes neuronales que procesan la imagen en su totalidad y predicen simultáneamente múltiples bounding boxes y las clases de los objetos. Esto resulta en una detección de objetos mucho más rápida y precisa, ideal para aplicaciones en tiempo real. \*\*Ventajas de los métodos avanzados\*\*: \- \*\*Detección en tiempo real\*\*: Las redes como YOLO pueden procesar múltiples cuadros por segundo. \- \*\*Precisión mejorada\*\*: Mejor rendimiento en términos de precisión y localización de los objetos. \- \*\*Escalabilidad\*\*: Capacidad para trabajar con múltiples clases de objetos de diferentes tamaños. En conclusión, la \*\*detección de objetos\*\* ha evolucionado significativamente desde enfoques tradicionales como la \*\*sliding window\*\* hasta métodos más avanzados que emplean \*\*bounding boxes\*\* y técnicas de deep learning para mejorar la eficiencia y precisión.
2/10/2024 la version que maneja ahora es la: !pip install opencv-python-headless==4.9.0.80 Si en el futuro les sale un error, ahi debe decir que version deberían usar, saludos.