Crea una cuenta o inicia sesión

¡Continúa aprendiendo sin ningún costo! Únete y comienza a potenciar tu carrera

¿Qué son las redes convolucionales?

3/25
Recursos

Aportes 10

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Una convolución es un filtro que pasa sobre una imagen, la procesa, y extrae características que muestran algo en común en la imagen.
(Introducción a las redes neuronales convolucionales)
https://www.youtube.com/watch?v=mO1fNuOhjtw

Red Neuronal Convolucional (CNN)

Comparto este recurso de DotCSV, en el cual, enseña el como funcionan las Redes Neuronales Convolucionales: https://www.youtube.com/watch?v=V8j1oENVz00

Qué son las redes convolucionales?

Una red convolucional es una representación programática de la visión humana, que pasas por filtros para extraer información de relevancia de una imagen para poder clasificarla dentro de cierta categoría.

Como funciona?

Una convolución es un filtro que pasa sobre una imagen desde la esquina superior izquierda hasta la esquina inferior derecha, la procesa pasando uno a uno por los pixeles de la imagen y extrae características que muestran algo en común en la imagen.

Analizan las imágenes desde sus bordes, características, forma, etc.; todo lo que el cerebro ha sido entrenado, de la misma forma lo hace una red convolucional, de una manera más programática de llevarlo a cabo.

A modo de sumario:

  • Red neuronal especializada en el reconocimiento de imágenes.

  • Intenta simular el comportamiento de la corteza visual del cerebro humano.

  • el Kernel Size se refiere al tamaño del filtro, que como es cuadrado solo se indica una de las dimensiones.

  • el Padding es el tamaño del marco (en pixeles adicionales) que se agrega a la imagen, de tal forma que los pixeles de las esquinas y bordes de la imagen original, no se pierdan del todo con la convolución.

Tres conptos adicionales

Convolución

  • La operación de convolución es fundamental en las CNN. Consiste en deslizar un filtro (kernel) sobre la entrada para realizar operaciones locales, capturando patrones como bordes, texturas y formas.

Capas Convolucionales

  • Las CNN suelen tener capas convolucionales que aplican múltiples filtros para extraer características jerárquicas de la entrada. Estas capas ayudan a la red a aprender representaciones cada vez más complejas.

Capas de Pooling

  • Después de las capas convolucionales, se suelen aplicar capas de pooling (submuestreo) para reducir la dimensionalidad espacial de la representación y preservar las características más importantes.
Muy interesante este tema de la clasificación de objetos. Hace un par de meses escuché una conferencia sobre Ludwig Wittgenstein, y ahora con esta clase puedo hacer conexiones con el tema de la filosofía. Aunque Platón ya hablaba de la clasificación de los objetos y de las formas, fue Ludwig Wittgenstein, con su Tractatus logico-philosophicus, quien amplió el tema de la clasificación de las cosas e hizo uno de los mayores aportes filosóficos. Si les interesa, acá está la clase magistral sobre Ludwig Wittgenstein: <https://www.youtube.com/watch?v=X7Rb56kZQSk>

Comparto un recurso donde explican que es una convolución
https://www.youtube.com/watch?v=KuXjwB4LzSA

Una red convolucional es una representación programática de la visión humana, que pasas por filtros para extraer información de relevancia de una imagen para poder clasificarla dentro de cierta categoria.

🫶🏼🫶🏼

Una pena, una plataforma tan buena como platzi y voy a tenerr que abandonar porque los videos se cortan. Cantidad de usuarios con el mismo problema. Es imposible seguir ningun curso.