En la arquitectura U-Net el mapa de segmentación resultante es de tamaño 388x388, más pequeño que la imagen de entrada 572x572. ¿Esto lim...

Víctor Trigo

Víctor Trigo

Pregunta
studenthace 3 años

En la arquitectura U-Net el mapa de segmentación resultante es de tamaño 388x388, más pequeño que la imagen de entrada 572x572. ¿Esto limita el alcance del modelo? ¿Es decir, no segmenta objetos en las imágenes que se encuentren en los bordes?

1 respuestas
para escribir tu comentario
    Sergio Paniego

    Sergio Paniego

    teacherhace 3 años

    Hola, Víctor:

    Muy buena pregunta! El modelo sí cubre todo el ancho y alto de la imagen, segmentando también aquellas zonas cercanas a los bordes. La diferencia entre el tamaño de entrada y de salida se debe a las convoluciones y el relleno de las mismas a lo largo de la arquitectura de red. Así que nos devuelve un mascara de segmentación para toda la imagen pero de un tamaño un poco más pequeño. Puedes leer el paper original (U-Net: Convolutional Networks for Biomedical Image Segmentation) para tener más detalles al respecto!

    Un saludo.

Curso de Detección y Segmentación de Objetos con TensorFlow

Curso de Detección y Segmentación de Objetos con TensorFlow

Domina la detección y segmentación de objetos con TensorFlow. Aprende a entrenar modelos, trabajar con datasets especializados y aplicar técnicas avanzadas como el tuneo fino, usando redes tipo UNet y arquitectura encoder-decoder.

Curso de Detección y Segmentación de Objetos con TensorFlow
Curso de Detección y Segmentación de Objetos con TensorFlow

Curso de Detección y Segmentación de Objetos con TensorFlow

Domina la detección y segmentación de objetos con TensorFlow. Aprende a entrenar modelos, trabajar con datasets especializados y aplicar técnicas avanzadas como el tuneo fino, usando redes tipo UNet y arquitectura encoder-decoder.