Comprender la visión computarizada

1

¿Por qué aprender computer vision?

2

¿Qué es la visión computarizada?

3

Tipos de visión computarizada

4

Introducción a object detection: clasificación + localización

5

Aprende a identificar problemas

Dimensionamiento de proyecto de visión computarizada

6

Cómo definir los tiempos de tu proyecto

7

Cómo costear tu proyecto

8

Cómo identificar los roles necesarios en el proyecto

9

Producto mínimo viable en computer vision

Obtención y procesamiento de los datos

10

Obtención de datos para tu proyecto

11

Limpieza de la base de datos

12

Distribución de datos en entrenamiento y testeo

13

Etiquetado de los datos de test

14

Etiquetado de los datos de train

15

Transforma tu base de datos a TFRecord

16

Transformar CSV a TFRecord

Entrena, testea y optimiza tus modelos

17

Librerías a importar durante fase de entrenamiento

18

Fase de entrenamiento del modelo

19

Balanceo de imágenes y data augmentation

20

Entrena, evalua y optimiza con TensorBoard

21

Validación de modelo en un entorno de ejecución

22

Re-entrenamiento del modelo para obtener mejores resultados

23

Seguimiento de centroides con OpenCV

24

Configuración de los centroides con OpenCV

25

Algoritmo de dirección y conteo con OpenCV

26

Crea un ciclo de entrenamiento de tu modelo: MLOps

Producto con visión computarizada en producción

27

Prepara tu entorno en Google Cloud Platform

28

Carga y preprocesamiento de modelos

29

Postprocesamiento de modelos

30

Despliega y consume tu modelo en producción

31

Bonus: aprende a apagar las máquinas de GCP para evitar sobrecostos

Siguientes pasos en inteligencia artificial

32

Siguientes pasos en inteligencia artificial

33

Comparte tu proyecto de detección de vehículos en carretera y certifícate

Crea una cuenta o inicia sesión

¡Continúa aprendiendo sin ningún costo! Únete y comienza a potenciar tu carrera

No se trata de lo que quieres comprar, sino de quién quieres ser. Aprovecha el precio especial.

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

12 Días
20 Hrs
23 Min
5 Seg

Tipos de visión computarizada

3/33
Recursos

Aportes 8

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

3. Tipos de visión computarizada

Los siguientes son tipos de visión computarizada.

Clasificación de objetos

Reciben imágenes y entregan una etiqueta.

Subtipos

  • Clasificación multiclase: Clasifica más de un tipo de objeto pero un sólo por imagen.
  • Clasificación de múltiples etiquetas. Clasifica más de un objeto en la misma imagen.

Detección de objetos

Sirve para localizar los objetos relevantes en la imagen para luego poderlos clasificar.

Segmentación de imágenes

Permite dividir la imagen en áreas de características similares o por sus propiedades de contorno.

Subtipos

  • Segmentación semántica: Objetos similares son agrupados en un sólo grupo.
  • Segmentación de instancias: Objetos similares son clasificados en grupos separados.
  • Segmentación panóptica: Divide absolutamente todos los píxeles de la imagen en grupos. Es muy costoso computacionalmente.

Interesante, gracias a esta clase aprendí que lo que necesito en temas de clasificación con imágenes satelitales es una clasificación multi-etiquetas y una segmentación panóptica. Gracias

  • Clasificacion de objetos
    • Multiclase
    • Multiples etiquetas
  • Deteccion de objetos
  • Segmentacion de imagenes
    • Semantica
    • Instancias
    • Panoptica
La visión computarizada engloba varias técnicas y enfoques, cada uno orientado a resolver diferentes tipos de problemas visuales. Aquí te explico algunos de los principales tipos de visión computarizada y sus aplicaciones. \### 1. \*\*Detección de Objetos\*\* \- Consiste en identificar y localizar objetos específicos en una imagen o video. Este tipo de visión computarizada no solo reconoce la presencia de un objeto (como un auto o una persona) sino que también determina su posición dentro de la imagen. \- \*\*Aplicaciones\*\*: Detección de peatones en vehículos autónomos, seguridad mediante vigilancia y sistemas de conteo de objetos en manufactura. \### 2. \*\*Reconocimiento de Imágenes\*\* \- El reconocimiento de imágenes es la capacidad de clasificar una imagen en una categoría o etiqueta. El sistema compara la imagen con una base de datos de imágenes previamente etiquetadas y determina a qué clase pertenece. \- \*\*Aplicaciones\*\*: Clasificación de imágenes en redes sociales, diagnóstico médico, clasificación de productos en ecommerce. \### 3. \*\*Segmentación de Imágenes\*\* \- La segmentación de imágenes consiste en dividir una imagen en varias partes o segmentos con el fin de simplificar su análisis. Estos segmentos suelen representar diferentes objetos o áreas de interés. \- \*\*Tipos de segmentación\*\*: \- \*\*Segmentación semántica\*\*: Etiqueta cada píxel de la imagen de acuerdo a la clase de objeto (por ejemplo, césped, cielo, carretera). \- \*\*Segmentación por instancias\*\*: Similar a la semántica, pero diferencia entre instancias individuales de una clase (como cada persona en una multitud). \- \*\*Aplicaciones\*\*: Análisis médico de imágenes, segmentación de tumores, vehículos autónomos para segmentar la carretera y los objetos. \### 4. \*\*Reconocimiento Facial\*\* \- Este tipo de visión computarizada se centra en detectar y reconocer rostros humanos, y en algunos casos identificar a la persona. Utiliza puntos clave como los ojos, nariz y boca para realizar la identificación. \- \*\*Aplicaciones\*\*: Autenticación de usuarios en dispositivos móviles, control de acceso y sistemas de vigilancia. \### 5. \*\*Detección de Movimiento y Seguimiento de Objetos\*\* \- La detección de movimiento permite identificar cambios en una escena a lo largo del tiempo. El seguimiento de objetos (o "tracking") va un paso más allá al seguir la trayectoria de un objeto a través de múltiples fotogramas. \- \*\*Aplicaciones\*\*: Seguridad y vigilancia, deportes para el análisis de rendimiento, realidad aumentada (AR). \### 6. \*\*Reconocimiento de Texto (OCR - Optical Character Recognition)\*\* \- OCR es una técnica que convierte texto en imágenes a texto digital. Permite que las máquinas lean y procesen el contenido textual de imágenes, como documentos escaneados o placas de automóviles. \- \*\*Aplicaciones\*\*: Digitalización de documentos, reconocimiento de matrículas, lectura de etiquetas en almacenes. \### 7. \*\*Análisis de Imágenes Médicas\*\* \- Este tipo de visión computarizada se especializa en analizar imágenes médicas, como radiografías, resonancias magnéticas y tomografías. Los algoritmos pueden detectar patrones y anomalías en estas imágenes, asistiendo a los profesionales médicos en el diagnóstico. \- \*\*Aplicaciones\*\*: Diagnóstico de enfermedades, identificación de tumores, monitoreo del progreso de enfermedades. \### 8. \*\*Reconstrucción 3D\*\* \- La reconstrucción 3D busca crear una representación tridimensional de un objeto o una escena a partir de múltiples imágenes 2D. Esto se realiza mediante técnicas de fotogrametría y modelos tridimensionales. \- \*\*Aplicaciones\*\*: Realidad aumentada y virtual, diseño de productos, mapeo y cartografía, arquitectura. \### 9. \*\*Visión Estéreo\*\* \- En la visión estéreo, se utilizan dos o más cámaras para simular la percepción de profundidad, similar a la visión humana. Esto permite que el sistema calcule distancias y posiciones de objetos en un espacio tridimensional. \- \*\*Aplicaciones\*\*: Robots móviles, drones, sistemas de navegación en vehículos autónomos. \### 10. \*\*Análisis de Expresiones Faciales\*\* \- Esta técnica permite identificar y clasificar emociones basadas en la expresión facial de las personas. El sistema analiza los movimientos de músculos faciales que corresponden a emociones específicas, como alegría, tristeza o sorpresa. \- \*\*Aplicaciones\*\*: Atención al cliente, análisis de marketing, investigación en psicología. Cada tipo de visión computarizada utiliza algoritmos y modelos específicos para lograr sus objetivos, y algunos proyectos pueden combinar varias de estas técnicas para resolver problemas complejos.
# Tipos de visión computarizada **1. Reconocimiento de objetos** Este tipo de visión computarizada se centra en identificar y clasificar objetos en una imagen o video. Los algoritmos analizan características visuales para asignar etiquetas a los objetos detectados (por ejemplo, personas, autos, animales). **2. Detección de objetos** A diferencia del reconocimiento de objetos, que solo clasifica una imagen completa, la detección de objetos también incluye la localización exacta de estos dentro de la imagen, especificando la posición de cada objeto. **3. Segmentación de imágenes** Este tipo divide una imagen en diferentes segmentos o regiones, clasificando cada píxel según su pertenencia a un objeto específico. Puede ser **segmentación semántica** (clasificar cada píxel en una categoría) o **segmentación de instancias** (separar cada instancia de un objeto individualmente). **4. Reconocimiento facial** La visión computarizada se utiliza para identificar y verificar rostros humanos. Los sistemas de reconocimiento facial extraen características únicas de los rostros, como la distancia entre los ojos o la forma de la mandíbula, para hacer comparaciones y **5. Reconocimiento de patrones** Este tipo de visión computarizada busca identificar patrones específicos dentro de las imágenes o secuencias de video. Puede usarse para detectar texturas, formas repetitivas o patrones complejos en datos visuales. **6. Análisis de movimiento (Optical Flow)** Se centra en la detección y análisis de objetos en movimiento en secuencias de video. Este tipo de visión computarizada se utiliza para calcular la dirección y velocidad del movimiento de objetos en una escena. **7. Reconstrucción 3D** Utiliza varias imágenes bidimensionales (2D) o secuencias de video para generar un modelo tridimensional (3D) de un objeto o un entorno. Esto se utiliza en muchas aplicaciones donde es necesario obtener una visión más completa del espacio.. **8. Visión estéreo** Este enfoque se basa en la utilización de dos cámaras (como nuestros ojos) para calcular la profundidad y distancia de los objetos en una imagen. Las cámaras capturan dos perspectivas diferentes de una escena y, mediante la comparación, se puede calcular la distancia de los objetos. **9. Reconocimiento óptico de caracteres (OCR)** Se utiliza para identificar y convertir texto impreso o escrito a mano en un formato digital editable. OCR es ampliamente utilizado para digitalizar documentos y procesar información de imágenes de texto. **10. Análisis de emociones** Este tipo de visión computarizada detecta y analiza expresiones faciales para interpretar el estado emocional de las personas.
🫠🫠

Muy practico e interesante

Segmentación panóptica y segmentación de instancias!
Ahí vamos!