Una red neuronal convolucional es una categoría de las redes neuronales artificiales en la que se intenta simular las neuronas en la corteza visual primaria de un cerebro.
No es un secreto que este tipo de redes están llegando con cada vez más fuerza a nuestras vidas y su presencia se empieza a sentir en todos los sectores económicos. Su capacidad de aprendizaje con distintas entradas de datos para resolver problemas de clasificación o regresión las hacen extremadamente útiles en el momento de resolverlos.
En Platzi ya hemos visto el potencial de este tipo de redes neuronales, e incluso cómo funcionan totalmente desde cero. Para más información, te invito a que comiences con el Curso de Fundamentos de Redes Neuronales con Python y Keras.
¿Qué tal si llevamos una red neuronal al siguiente nivel y le enseñamos a “ver” e interpretar el mundo como los seres humanos lo hacemos? A través de nuestros ojos (mediante estímulos visuales). Aquí es donde entran en juego las redes neuronales convolucionales.
Así es, estamos hablando de una tecnología asombrosa con oportunidades infinitas en el campo de computer vision. Y sí, aquí tenemos otro término muy interesante. Computer vision, o visión artificial, es un subcampo de la inteligencia artificial encargado de simular la corteza visual de nuestro cerebro.
Un sinnúmero de posibilidades, todo basándonos en los estímulos visuales del contenido digital en imágenes o videos:
¿Alguna vez has pensado en por qué sabes que un auto es un auto, o un humano es un humano? ¿O por qué puedo distinguir entre un perro y un gato?
La respuesta se encuentra en cómo se entrenó nuestro cerebro para reconocer e identificar ciertas características en los objetos que vemos. De esta manera, cuando vemos estas características las podemos asociar a una salida especifica (una clasificación). Veamos un ejemplo:
Características | Clasificación |
---|---|
Cuatro ruedas, espejos, luces, forma alargada, vidrio panorámico. | Auto |
Ojos grandes y de colores vistosos, bigotes, orejas en punta, cola, cuatro patas, peludo | Gato |
Hocico alargado, cuatro patas largas, pelaje corto, dientes largos, cola peluda, cascos en las patas, músculos | Caballo/Zebra |
Ahora el reto es enseñar a una inteligencia artificial a identificar estas características y que logre hacer una abstracción con el fin de clasificar las imágenes.
Son la base de la clasificación de imágenes, que es a su vez el primer paso para adentrarnos en el mundo del computer vision.
Clasificar imágenes suena a algo simple, pero tiene un potencial enorme. Por ejemplo: reconocimiento de patrones cancerígenos en imágenes de rayos X, estado de frescura de frutas o vegetales, clasificar señales de tránsito, objetos en la vía, distintos tipos de animales, enfermedades en la piel, clasificar imágenes de personas como una red convolucional que distinga entre Freddy y Christian 🤯.
Existen un sin numero de posibilidades y todas parten de un principio sencillo: deslizar una pequeña matriz en las imágenes con el fin de extraer sus características.
Paso a paso esta matriz está identificando bordes, texturas y demás características. Lo interesante es que en cuanto más profunda sea la red, más específicas serán las características que se extraen. Características como la detección de ojos, pelaje de un animal, detalles en los dientes y demás de este estilo.
Sigue tu aprendizaje en el Curso de Redes Neuronales Convolucionales con Python y Keras en el que aprenderemos conceptos como:
Y muchos otros temas que te ayudaran a crear tus primeras redes convolucionales. Así que te espero en el curso con hambre de conocimiento, para que juntos continuemos este maravilloso viaje del deep learning y computer vision.
¡Qué genial! Saber los fundamentos de lo que hago en mi trabajo y como funcionan los procesos que se llevan a cabo, estupendo poder entenderlo.
A qué te dedicas emilys?
Trabajo en una plataforma que construye IA.
Interesante y conciso @alarcon7a
Lo que más me impresiona es que actualmente se esté logrando el reconocimiento de enfermedades en RMN, Rayos X, tomografías y electroencefalogramas.
Cuando logremos descifrar una función, que relacione visualmente estos padecimientos con análisis (por supuesto con IA) del código genético del paciente, habremos literalmente descubierto el orígen de prácticamente cualquier enfermedad visualmente reconocible.
Interesante post.
Qué buen tema el que escogiste Carlos, las redes neuronales es un tema que me apasiona. Esta tecnología es extremadamente útil para el mejoramiento de la sociedad y los procesos industriales.
Mi meta para el próximo año es entrar a este maravilloso mundo, junto con ciencias de datos y un pequeño avance en desarrollo de entornos 3D 😄
Muchas gracias por el artículo!!
Eso es demasiado brutal
que interesante, el NLP es muy interesante en esta area del las redes neuronales