Creación de Mapas de Calor para Análisis de Tránsito en Videos

Clase 4 de 16 • Curso de Visión Artificial con Python

Resumen

La seguridad visual mediante análisis de video se ha convertido en una herramienta fundamental para entender el comportamiento de los clientes en espacios comerciales. A través de técnicas de procesamiento de imágenes y detección de movimiento, podemos generar mapas de calor que revelan patrones de interés y flujo de personas, proporcionando información valiosa para la toma de decisiones estratégicas en retail. Veamos cómo implementar esta tecnología y qué beneficios ofrece para optimizar la disposición de productos y mejorar la experiencia del cliente.

¿Cómo crear mapas de calor a partir de videos de seguridad?

El desafío de Vision Security para ILAC consiste en analizar un video de los pasillos de una tienda para determinar dónde se detienen los clientes, cuánto tiempo permanecen en cada posición y qué están observando. El producto final es un mapa de calor que visualiza estas concentraciones de actividad.

Para este proyecto, podemos utilizar Google Colab o trabajar localmente. Google Colab ofrece algunas ventajas, como el acceso a GPU para procesamiento más rápido, aunque tiene limitaciones para la visualización de video en tiempo real. Sin embargo, para el análisis de videos pregrabados, funciona perfectamente.

El proceso básico incluye:

Cargar el video mediante OpenCV.
Utilizar técnicas de detección de movimiento para identificar áreas de actividad.
Acumular esta información en un mapa de calor.
Normalizar y visualizar los resultados.

¿Qué herramientas necesitamos para el análisis de video?

Para implementar esta solución, necesitamos las siguientes bibliotecas:

import cv2
import numpy as np
import matplotlib.pyplot as plt

OpenCV nos proporciona un método especialmente útil para detectar movimiento entre frames a lo largo del video. Este método puede extraer el fondo y resaltar solo lo que se está moviendo, ya sean personas, animales o incluso objetos como cortinas.

El método recibe tres parámetros principales:

History: número de frames utilizados para distribuir el fondo
Sensibilidad: para detectar cambios (distinguiendo entre movimientos menores y significativos)
Detección de sombras: para considerar o ignorar las sombras en el análisis

¿Cómo se genera y se interpreta un mapa de calor?

El proceso para generar el mapa de calor consiste en:

Iniciar un acumulador en cero.
Sustraer el fondo de cada frame para determinar las áreas de movimiento.
Acumular la máscara de movimiento a lo largo del tiempo.
Superponer esta información acumulada sobre el video original.

El resultado es un mapa donde las áreas de color rojo más intenso representan lugares donde los clientes permanecieron más tiempo. Por ejemplo, si un cliente estuvo parado mucho tiempo en una posición específica, esa área aparecerá con un rojo más intenso en el mapa.

# Ejemplo conceptual del código
fgbg = cv2.createBackgroundSubtractorMOG2(history=500, varThreshold=16, detectShadows=True)
heatmap = np.zeros((height, width), dtype=np.float32)

while True:
    ret, frame = cap.read()
    if not ret:
        break
    
    # Aplicar sustracción de fondo
    fgmask = fgbg.apply(frame)
    
    # Acumular la máscara en el mapa de calor
    heatmap += fgmask

¿Cómo normalizar los mapas de calor para una mejor interpretación?

En entornos con mucho flujo de personas, como centros comerciales, el mapa de calor podría saturarse y verse completamente rojo. Para solucionar esto, se aplica una normalización:

Se toma el valor mínimo y se lleva a cero.
El valor máximo obtenido en el mapa se lleva a 255.

Esto permite una mejor visualización de las diferencias relativas en la concentración de actividad. Además, podemos utilizar diferentes escalas de color, como "viridis" (azul-violeta), para mejorar la interpretación visual.

# Normalización del mapa de calor
normalized_heatmap = cv2.normalize(heatmap, None, 0, 255, cv2.NORM_MINMAX)

Esta normalización nos ayuda a identificar áreas de mayor interés para los clientes, lo que puede informar decisiones sobre la ubicación de productos o la reorganización del espacio comercial.

¿Qué limitaciones tiene esta técnica y cómo superarlas?

Una limitación importante de este enfoque es que detecta cualquier movimiento, no solo el de las personas. Esto puede generar resultados engañosos cuando hay objetos en movimiento en la escena.

Por ejemplo, en el segundo video analizado (un parque con personas), una cuerda en movimiento generó una concentración alta en el mapa de calor, desviando la atención del flujo real de personas.

Este problema ocurre porque el método de sustracción de fondo detecta cualquier cambio en la escena, sin distinguir entre tipos de objetos. Para aplicaciones centradas en el comportamiento humano, necesitamos filtrar específicamente el movimiento de personas.

La solución a este problema se encuentra en técnicas más avanzadas de visión por computadora, como la detección de personas mediante modelos de aprendizaje profundo. Estos modelos pueden identificar específicamente figuras humanas y seguir su movimiento, ignorando otros objetos en movimiento.

El análisis de video para seguridad y marketing ofrece información valiosa sobre el comportamiento de los clientes en espacios comerciales. Mediante la creación de mapas de calor, podemos identificar áreas de mayor interés y optimizar la disposición de productos. Aunque la técnica básica tiene limitaciones, como la detección indiscriminada de movimiento, existen soluciones avanzadas que permiten enfocarse específicamente en el comportamiento humano. ¿Has implementado alguna vez análisis de video en tu negocio? ¿Qué insights has obtenido? Comparte tu experiencia en los comentarios.

Dabney Rueda

student•

Se equivocaron en el orden de los videos, este debería ser después de la clase 4

Percy Tejada

student•

El código de la clase lo encuentran en el siguiente enlace:

Diego Ernesto Cuaycal Tirira

student•

Gracias

Víctor Trigo

student•

Es posible crear un video donde se vea frame por frame como se crea el Heatma?, y no solo el resultado final

Iván Alexis Nocua Benitez

student•

El numero de frames usados para construir el modelo, ¿es un valor standard o hay que ajustar ese valor siempre? ¿Si hay que ajustarlo, como sabria el numero de frames de cierto video?

Carlos Bustillo

teacher•

El número de frames por segundo (FPS) a utilizar depende:

De cuántos FPS puede capturar tu cámara.
Cuántos frames tu aplicación / modelo puede analizar.
Cuántos frames realmente necesitas analizar.

Vamos con un ejemplo hipotético que suele pasar:

Tengo una cámara que puede capturar 25 FPS.
Mi modelo puede realizar predicciones a una latencia de 0.4 segundos.

Hay muchas industrias que solo suelen analizar 1 FPS en sus aplicaciones porque no hay mucha variación en 1 solo segundo.

Así que si solo necesitamos analizar 1 FPS, nuestro modelo podría hacer inferencias en los 0.4 segundos y tendríamos que esperar 0.6 segundos hasta que venga el nuevo frame a analizar.

Conocer esto también te ayuda a evitar colas, porque a veces capturas más frames de lo que podes procesar en "tiempo real".

Nina Papas

student•

enlace del codigo roto.

Carlos Bustillo

teacher•

Puedes encontrar el notebook en el repositorio del curso: https://github.com/platzi/computer-vision/blob/main/1__Procesamiento_de_Im%C3%A1genes_con%20_OpenCV/2__Procesamiento_con_OpenCV.ipynb 🙌

Victor Matias Marquez

student•

Profe, una consulta. En la parte del método que usamos para sustraer el fondo. Los valores de los parámetros, history, varThreshold, detecShadows, de que dependen? Osea porque en history podría poner 100 en vez de 500, que cambiaría?

Gustavo Guillermo Alonso

student•

El curso que estaba buscando!! muchas gracias

Francisco López Velázquez

student•

Para comprender bien la teoría, ¿qué temas específicos debo revisar? Entiendo que está relacionado con matemáticas, pero me gustaría saber exactamente qué área o concepto debo estudiar. Hasta ahora solo entiendo que se deben establecer parámetros para este video, pero si la situación cambia, entonces también cambiarán los parámetros.

Jonatan Yesid Santamaría Largo

student•

enlace del codigo roto.

Carlos Bustillo

teacher•

Puedes encontrar el notebook en el repositorio del curso: https://github.com/platzi/computer-vision/blob/main/1__Procesamiento_de_Im%C3%A1genes_con%20_OpenCV/2__Procesamiento_con_OpenCV.ipynb 🙌

Creación de Mapas de Calor para Análisis de Tránsito en Videos

Introducción y Visión General de SecureVision AI

Implementación de Sistemas de Computer Vision en Negocios

Procesamiento y Análisis de Imágenes y Videos con AI

Procesamiento de Imágenes y Fundamentos de OpenCV

Procesamiento de Imágenes en Tiempo Real con OpenCV y Python