Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Curso de Azure Cognitive Services

Curso de Azure Cognitive Services

Luis Antonio Ruvalcaba Sánchez

Luis Antonio Ruvalcaba Sánchez

Oportunidades con visión computacional

15/27
Recursos

Aportes 2

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Imagenes en Computer Vision deben ser: Tamaño menor a 4 Mb dimensiones dee 50 *50 pixeles.

¿Qué es visión computacional?

Proporciona acceso a algoritmos avanzados que procesan imágenes y devuelven información basada en las características visuales de interés.

  • Servicio: Análisis de imágenes.
    Descripción: Extrae características visuales de las imágenes, como objetos, caras, contenido para adultos y descripciones de texto generadas automáticamente.

  • Servicio: Reconocimiento óptico de caracteres (OCR).
    Descripción: Extrae el texto de las imágenes incluyendo el texto impreso y manuscrito de imágenes y documentos. Usa modelos basados en aprendizaje profundo y funciona con texto en diversas superficies y fondos. Entre estos se incluyen documentos de la empresa, facturas, recibos,pósteres, tarjetas de presentación, cartas y pizarras.

¿Para qué sirve?

Puede ayudar en muchos escenarios de administración de activos digitales (DAM) permitiendo a las empresas la organización, almacenamiento, gestión de permisos y derechos digitales.
Ejemplo: Agrupar e identificar imágenes basadas en logotipos, caras, colores, ubicaciones.

Requisitos de imagen

Es necesario que las imágenes cumplan los siguientes requisitos:

  • Formato JPEG, PNG, GIF o BMP.
  • El tamaño de la imagen debe ser inferior a 4 MB.
  • Las dimensiones de la imagen deben ser mayores a 50 x 50 píxeles.

Escenarios de uso

  • Interpretación de imágenes y sugerencia de título.
  • Sugerir etiquetas para indexar imágenes.
  • Categorizar imágenes.
  • Identificar objetos en las imágenes.
  • Reconocer personas famosas y sitios emblemáticos en una imagen.
  • Leer el texto de una imagen.

Descripción de una imagen

Ejemplo: análisis de una imagen del Empire State Building de Nueva York.
Resultados del análisis:

  • Foto en blanco y negro de una ciudad.
  • Foto en blanco y negro de una ciudad grande.
  • Edificio blanco grande en una ciudad.

Detección de objetos

Permite devolver las coordenadas de los objetos detectados en una imagen analizada.

Detección de marcas

Permite identificar marcas comerciales utilizando una
base de datos existente de miles de logotipos reconocidos globalmente.
Ejemplo: ‘Microsoft’ (Confidence: 68%).

Detección de caras

Permite detectar y analizar caras humanas en una imagen,
además, tiene la capacidad de estimar la edad y detectar
el área en la imagen donde se localizan caras.