Introducción a Computer Vision

1

¿Qué es la visión computarizada y cuáles son sus tipos?

Detección de objetos

2

Introducción a object detection: sliding window y bounding box

3

Generando video de sliding window

4

Introducción a object detection: backbone, non-max suppression y métricas

5

Visualización de IoU en object detection

6

Tipos de arquitecturas en detección de objetos

7

Arquitecturas relevantes en object detection

8

Utilizando un dataset de object detection

9

Carga de dataset de object detection

10

Exploración del dataset de object detection

11

Visualización de bounding boxes en el dataset de object detection

12

Aumentado de datos con Albumentation

13

Implementando Albumentation en object detection

14

Visualizando imágenes con aumentado de datos

15

Utilizando un modelo de object detection pre-entrenado

16

Probar detección de objetos con modelo pre-entrenado

17

Fine-tuning en detección de objetos

18

Fine-tuning en detección de objetos: carga de datos

19

Fine-tuning en detección de objetos: data augmentation

20

Fine-tuning en detección de objetos: entrenamiento

21

Fine-tuning en detección de objetos: visualización de objetos

Quiz: Detección de objetos

Segmentación de objetos

22

Introduciendo la segmentación de objetos

23

Tipos de segmentación y sus arquitecturas relevantes

24

¿Cómo es un dataset de segmentación?

25

Utilizando un dataset de segmentación de objetos

26

Visualización de nuestro dataset de segmentación

27

Creando red neuronal U-Net para segmentación

28

Entrenando y estudiando una red de segmentación

29

Generando predicciones con modelo de object segmentation

Quiz: Segmentación de objetos

Un paso más allá

30

El estado de la cuestión en computer vision

31

Comparte tu proyecto de detección y segmentación de objetos para conducción autónoma y certifícate

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

No se trata de lo que quieres comprar, sino de quién quieres ser. Invierte en tu educación con el precio especial

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

11 Días
18 Hrs
0 Min
16 Seg

Introducción a object detection: backbone, non-max suppression y métricas

4/31
Recursos

Aportes 3

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Trabajando con métricas de object detection

Intersección entre uniones (IOU): la verdadera posición del objecto sobre la predicción del modelo

Non-max supression: Selecciona un bounding box correcto de los múltiples bounding boxes superpuestos

Métricas importantes:

- mean average precision (mAp): métrica de accuracy

- número de frames por segundo: Es cuántos frames es capaz de procesar nuestro modelo por segundo de manera efectiva. Es muy importante para evaluar el modelo en la vida real

Para los que no entendimos bien el ejemplo, quizás esto les puede ayudar, les recomendaría que hagan a mano los cálculos para ver lo que hace la formula.

La detección de objetos es una técnica clave en la visión por computadora que permite identificar y localizar objetos en imágenes o videos. Para comprender su funcionamiento, es importante conocer algunos conceptos básicos como el \*\*backbone\*\*, \*\*non-max suppression (NMS)\*\* y las \*\*métricas de evaluación\*\*. \### 1. \*\*Backbone\*\* El \*backbone\* es una red neuronal pre-entrenada que se utiliza como base para extraer características de las imágenes. Esta red actúa como un extractor de características profundo y convierte una imagen de entrada en un conjunto de mapas de características que se pueden procesar para detectar objetos. \*\*Ejemplos de backbones comunes:\*\* \- \*\*ResNet\*\*: Una red residual que facilita el entrenamiento de redes muy profundas gracias a sus conexiones residuales. \- \*\*VGG\*\*: Una red más sencilla pero eficaz para la extracción de características, aunque es más costosa computacionalmente. \- \*\*MobileNet\*\*: Ideal para aplicaciones en dispositivos con recursos limitados debido a su eficiencia. \- \*\*EfficientNet\*\*: Un backbone más moderno que ofrece un buen equilibrio entre precisión y rendimiento computacional. \### 2. \*\*Non-Max Suppression (NMS)\*\* El \*Non-Max Suppression\* es un proceso utilizado para reducir la cantidad de cajas delimitadoras superpuestas. Cuando un modelo de detección de objetos predice múltiples cajas para un mismo objeto, NMS selecciona la caja con la puntuación más alta y elimina las otras si su área de superposición excede un umbral definido. \*\*Funcionamiento de NMS:\*\* 1\. Se ordenan todas las cajas predictivas por la puntuación de confianza en orden descendente. 2\. Se selecciona la caja con la puntuación más alta y se añade al resultado final. 3\. Se eliminan las cajas que tienen un IoU (Intersección sobre Unión) mayor que un umbral predefinido con la caja seleccionada. 4\. Se repite el proceso hasta que no queden más cajas por evaluar. \*\*Ventaja\*\*: NMS ayuda a reducir las detecciones redundantes, permitiendo un resultado más claro y preciso. \### 3. \*\*Métricas de Evaluación\*\* Para medir el rendimiento de los modelos de detección de objetos, se utilizan varias métricas, siendo las más comunes: \- \*\*IoU (Intersección sobre Unión)\*\*: Es la métrica clave para determinar la precisión de las predicciones. Mide la superposición entre la caja predictiva y la caja de verdad de campo. Se calcula como el área de intersección dividido por el área de unión de ambas cajas. Un IoU de 1 significa que la predicción es perfecta. \- \*\*mAP (mean Average Precision)\*\*: \- \*\*AP (Average Precision)\*\*: Calcula el área bajo la curva de precisión-recall para una clase específica. \- \*\*mAP\*\*: Es el promedio de APs calculado para todas las clases. Una métrica de evaluación común en la detección de objetos que proporciona una idea del rendimiento general del modelo. \- \*\*Precisión y Recall\*\*: \- \*\*Precisión\*\*: Mide la cantidad de verdaderos positivos sobre todos los positivos predichos. Una alta precisión indica pocas detecciones falsas positivas. \- \*\*Recall\*\*: Mide la cantidad de verdaderos positivos sobre todos los positivos reales. Un alto recall indica que se detectan la mayoría de los objetos presentes. \*\*Ejemplo de Evaluación\*\*: Un modelo con un mAP alto es capaz de detectar y localizar objetos con precisión y consistencia, lo cual es esencial en aplicaciones como la vigilancia, el análisis de imágenes médicas, la conducción autónoma y más. \### \*\*Resumen\*\* \- \*\*Backbone\*\*: Extrae características de las imágenes. \- \*\*NMS\*\*: Reduce las detecciones redundantes seleccionando las cajas más significativas. \- \*\*Métricas de evaluación\*\*: IoU, mAP, precisión y recall ayudan a medir el rendimiento de los modelos de detección. Estos conceptos son la base para comprender y mejorar los modelos de detección de objetos y son fundamentales para quienes trabajan en aplicaciones de visión por computadora.