Crea una cuenta o inicia sesión

¡Continúa aprendiendo sin ningún costo! Únete y comienza a potenciar tu carrera

No se trata de lo que quieres comprar, sino de quién quieres ser. Invierte en tu educación con el precio especial

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

12 Días
17 Hrs
11 Min
31 Seg

¿Qué son las redes convolucionales?

3/25
Recursos

Aportes 12

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Una convolución es un filtro que pasa sobre una imagen, la procesa, y extrae características que muestran algo en común en la imagen.
(Introducción a las redes neuronales convolucionales)
https://www.youtube.com/watch?v=mO1fNuOhjtw

Red Neuronal Convolucional (CNN)

Comparto este recurso de DotCSV, en el cual, enseña el como funcionan las Redes Neuronales Convolucionales: https://www.youtube.com/watch?v=V8j1oENVz00

Qué son las redes convolucionales?

Una red convolucional es una representación programática de la visión humana, que pasas por filtros para extraer información de relevancia de una imagen para poder clasificarla dentro de cierta categoría.

Como funciona?

Una convolución es un filtro que pasa sobre una imagen desde la esquina superior izquierda hasta la esquina inferior derecha, la procesa pasando uno a uno por los pixeles de la imagen y extrae características que muestran algo en común en la imagen.

Analizan las imágenes desde sus bordes, características, forma, etc.; todo lo que el cerebro ha sido entrenado, de la misma forma lo hace una red convolucional, de una manera más programática de llevarlo a cabo.

A modo de sumario:

  • Red neuronal especializada en el reconocimiento de imágenes.

  • Intenta simular el comportamiento de la corteza visual del cerebro humano.

  • el Kernel Size se refiere al tamaño del filtro, que como es cuadrado solo se indica una de las dimensiones.

  • el Padding es el tamaño del marco (en pixeles adicionales) que se agrega a la imagen, de tal forma que los pixeles de las esquinas y bordes de la imagen original, no se pierdan del todo con la convolución.

Tres conptos adicionales

Convolución

  • La operación de convolución es fundamental en las CNN. Consiste en deslizar un filtro (kernel) sobre la entrada para realizar operaciones locales, capturando patrones como bordes, texturas y formas.

Capas Convolucionales

  • Las CNN suelen tener capas convolucionales que aplican múltiples filtros para extraer características jerárquicas de la entrada. Estas capas ayudan a la red a aprender representaciones cada vez más complejas.

Capas de Pooling

  • Después de las capas convolucionales, se suelen aplicar capas de pooling (submuestreo) para reducir la dimensionalidad espacial de la representación y preservar las características más importantes.
Muy interesante este tema de la clasificación de objetos. Hace un par de meses escuché una conferencia sobre Ludwig Wittgenstein, y ahora con esta clase puedo hacer conexiones con el tema de la filosofía. Aunque Platón ya hablaba de la clasificación de los objetos y de las formas, fue Ludwig Wittgenstein, con su Tractatus logico-philosophicus, quien amplió el tema de la clasificación de las cosas e hizo uno de los mayores aportes filosóficos. Si les interesa, acá está la clase magistral sobre Ludwig Wittgenstein: <https://www.youtube.com/watch?v=X7Rb56kZQSk>

Comparto un recurso donde explican que es una convolución
https://www.youtube.com/watch?v=KuXjwB4LzSA

Una red convolucional es una representación programática de la visión humana, que pasas por filtros para extraer información de relevancia de una imagen para poder clasificarla dentro de cierta categoria.

Las \*\*redes neuronales convolucionales\*\* (o CNN, por sus siglas en inglés: \*\*Convolutional Neural Networks\*\*) son un tipo especial de red neuronal diseñada específicamente para procesar datos que tienen una estructura de rejilla, como imágenes. Son ampliamente utilizadas en tareas de visión por computadora, como el reconocimiento de objetos, la detección de rostros y la clasificación de imágenes. \### Características clave de las redes convolucionales: 1\. \*\*Capas convolucionales (Convolutional Layers):\*\* Estas capas son el corazón de las CNN. En lugar de conectar cada neurona con todas las entradas, como en las redes completamente conectadas, las capas convolucionales aplican un \*\*filtro\*\* (o \*\*kernel\*\*) que se desplaza sobre la imagen (o cualquier entrada estructurada), detectando patrones locales como bordes, texturas o formas específicas. \- El resultado de aplicar el filtro se llama \*\*mapa de características\*\* o \*\*feature map\*\*. \- Los filtros son \*\*aprendibles\*\*, lo que significa que durante el entrenamiento, la red ajusta estos filtros para captar características importantes de la imagen. 2\. \*\*Pooling (Submuestreo):\*\* Después de las capas convolucionales, suele aplicarse una capa de \*\*pooling\*\*, que reduce la dimensionalidad de los mapas de características. El tipo más común es el \*\*max-pooling\*\*, que selecciona el valor máximo de una región del mapa de características, ayudando a reducir el tamaño de la imagen y a mantener las características más importantes. 3\. \*\*ReLU (Rectified Linear Unit):\*\* Es una función de activación que introduce no linealidades en la red. En las CNN, la función \*\*ReLU\*\* (Rectified Linear Unit) se usa después de la operación de convolución para reemplazar todos los valores negativos por cero, ayudando a acelerar el proceso de aprendizaje. 4\. \*\*Capas completamente conectadas (Fully Connected Layers):\*\* Después de varias capas convolucionales y de pooling, las características extraídas se pasan a una o más capas completamente conectadas. Estas capas son similares a las utilizadas en las redes neuronales tradicionales y combinan todas las características extraídas para realizar la tarea final, como la clasificación. 5\. \*\*Aprendizaje de características jerárquicas:\*\* Las CNN tienen la capacidad de aprender características jerárquicas. Las primeras capas aprenden a detectar bordes simples, las capas intermedias capturan formas más complejas y, finalmente, las últimas capas capturan representaciones abstractas de alto nivel de los objetos. \### Ejemplos de aplicaciones de redes convolucionales: \- \*\*Clasificación de imágenes:\*\* Reconocimiento de objetos en imágenes, como en el famoso dataset ImageNet. \- \*\*Detección de objetos:\*\* Identificación y localización de objetos en una imagen. \- \*\*Segmentación de imágenes:\*\* Dividir una imagen en regiones basadas en diferentes clases de objetos. \- \*\*Reconocimiento facial:\*\* Identificación y verificación de rostros en imágenes o videos. \- \*\*Diagnóstico médico:\*\* Análisis de imágenes médicas como rayos X, resonancias magnéticas o tomografías. \### Ventajas: \- \*\*Capacidad de detección automática de características:\*\* Las CNN no requieren que las características sean diseñadas manualmente, ya que aprenden directamente a partir de los datos de entrada. \- \*\*Reducción de parámetros:\*\* Gracias al uso de filtros compartidos y la reducción de dimensionalidad a través de pooling, las CNN son más eficientes que las redes totalmente conectadas cuando se trata de procesar datos como imágenes. Las CNN han revolucionado la visión por computadora y han permitido grandes avances en el reconocimiento y procesamiento de imágenes.
Las redes neuronales convolucionales son un tipo de red neuronal artificial especialmente diseñadas para procesar datos con estructura de rejilla, como imágenes o señales de audio. Se inspiran en la corteza visual primaria del cerebro humano, que también procesa la información visual de manera jerárquica a través de capas de neuronas.
🫶🏼🫶🏼

Una pena, una plataforma tan buena como platzi y voy a tenerr que abandonar porque los videos se cortan. Cantidad de usuarios con el mismo problema. Es imposible seguir ningun curso.