Cómo las redes neuronales procesan datos

Clase 28 de 32 • Fundamentos de Ingeniería de Software

Resumen

Las redes neuronales son la base de mucha de la inteligencia artificial moderna. Aquí entenderás con claridad cómo funcionan sus capas, qué hace la función sigmoide y por qué la computación paralela con GPUs fue clave para el auge del machine learning. Con ejemplos prácticos y lenguaje directo, verás cómo se conectan conceptos como perceptrón, feed forward network, backpropagation y cadenas de Markov.

¿Cómo funcionan las redes neuronales y por qué importan?

Las redes neuronales se inspiran en el cerebro: neuronas con sinapsis que reciben señales, las transforman y disparan salidas. En computación, los inputs son datos en memoria RAM que alimentan la red, se procesan en capas y producen un resultado. La idea central: entrenar con ejemplos donde conoces la entrada y la salida.

Una red prueba muchas transformaciones en paralelo y apaga las que no funcionan.
Las que sí se acercan al resultado esperado “se refuerzan” con mayor peso y bias.
Este ciclo iterativo se ajusta con backpropagation para aprender de los errores.

¿Qué es una neurona artificial?

Una neurona recibe varios valores de entrada, los multiplica por pesos, suma todo y aplica una función de activación. El resultado se pasa a la siguiente capa. Así, muchas neuronas colaboran para aproximar salidas complejas.

Entradas: horas de estudio y de sueño en un ejemplo educativo.
Pesos: importancia relativa de cada entrada.
Bias: desplazamiento que ajusta la activación.

¿Cómo se entrena con datos sin frustrarse?

El entrenamiento requiere paciencia. Si algo no se entiende a la primera, dejar que el proceso siga ayuda a asimilar ideas difíciles. La recomendación: manejar expectativas y frustración; es normal cuando los conceptos son nuevos y densos.

Entrena con pares de entrada-salida conocidos.
Observa si la red acierta; si no, reajusta pesos y bias.
Repite muchas veces en paralelo.

¿Qué tipos de redes existen?

Existen múltiples arquitecturas con distintos usos y complejidad.

Perceptrón: la forma más básica con una sola capa.
Feed forward network: datos entran por capas y salen al final.
Redes recurrentes y simétricas: variantes para secuencias o estructuras específicas.
Backpropagation: mecanismo para corregir errores usando datos de prueba.

Además, hay técnicas complementarias como las cadenas de Markov, útiles para predicción de texto: si un patrón se repite frecuentemente, es probable que se repita de nuevo.

¿Qué hacen las funciones de activación y la función sigmoide?

La función de activación decide si una neurona “se enciende” y cuánto. Tres ejemplos ilustran su rol: escalón, signo y sigmoide. La sigmoide recorre un gradiente continuo entre 0 y 1 y ofrece más matices para aprender.

Función de pasos: salida binaria 0 o 1.
Función de signos: valores en −1, 0 o 1.
Función sigmoide: curva suave entre 0 y 1 para probar “todas las probabilidades”.

¿Cómo operan pesos y bias en la salida?

Primero se suman entradas ponderadas por sus pesos; luego se aplica la activación. Ajustar pesos dice “qué es más importante” (por ejemplo, estudio sobre sueño); el bias desplaza la curva para afinar cuándo se activa.

Suma ponderada: entrada × peso, luego sumatoria.
Activación: transforma la suma en señal útil.
Ajuste: si falla, backpropagation corrige pesos y bias.

¿Por qué esta matemática luce compleja?

Al expresarse formalmente, aparecen sumatorias y funciones; puede intimidar. Pero el proceso práctico es siempre el mismo: combinar entradas con pesos, sumar, activar y corregir; repetir hasta aproximar bien el objetivo.

¿Cómo se aplican en visión por computadora y qué computación requiere?

En visión, cada píxel puede ser un input. Por eso se necesita gran capacidad de cómputo. El auge reciente no vino por “matemática nueva”, sino por acceso a cómputo paralelo en la nube y GPUs.

Infraestructura: Google Cloud, Amazon Web Services, Azure.
Procesadores paralelos: la GPU como estándar para correr muchas operaciones a la vez.
Industria: Nvidia invierte en hardware especializado para IA.

¿Se detecta un semáforo con IA o con reglas?

Depende. A veces no se usan redes neuronales, sino filtros de color y condicionales if para hallar patrones de luces roja, amarilla y verde en una “cajita”. Es un recordatorio: no todo problema requiere IA; hay soluciones con algoritmos simples.

Filtrado de colores brillantes.
Búsqueda de patrones circulares en una región.
Recorte y análisis por resolución de cámara.

¿Cómo identifica un modelo un automóvil específico?

Una red analiza primero grupos de píxeles, luego patrones más grandes y rasgos como ruedas o logo. Múltiples redes colaboran: “parece metálico”, “parece automóvil”, “parece Audi”, “parece A7”. El proceso es intensivo y se beneficia de cómputo masivo en paralelo.

De lo simple a lo complejo: píxel, textura, forma, clase.
Capas sucesivas afinan la predicción.
Salida final: la clase más probable.

Si te interesa profundizar en cómo se conectan estos temas con ingeniería de software, en el curso Fundamentos de Ingeniería de Software de Platzi se exploran decisiones técnicas y su porqué: Platzi.com/fundamentos.

¿Quieres seguir la conversación? Escribe qué parte te retó más o qué concepto de activación, pesos o backpropagation te gustaría ver con más ejemplos.

Rodrigo Urquizo Yepez

student•

Para los que quieren introducirse a este mundo o recien estan comenzando esta explicacion tiene varios errores: Primero el decir que las redes neuronales no realizan operaciones matematicas,regresiones,etc,es todo lo contrario, una NN esta basada en multiplicar nuestros inputs por los pesos y luego a eso aplicar una funcion de activacion la cual puede ser una regresion lineal o una funcion sigmoide lo cual vendria a ser una regresion logistica, en realidad hay muchas funciones de activacion dependiendo del problema. Segundo, los pesos no se eligen por la importancia de tus datos, se inician de forma aleatoria o usando metodos estadisticos, los pesos son el corazon de tu modelo de ML, y el que tiene que configurarlos no eres tu, es el algoritmo. Tercero, no se asusten con la funcion sigmoide o con las demas funciones, parece lo mas dificil pero en realidad es lo mas facil xd, es teoria de precalculo que la pueden aprender en un dia.Lo mas dificil que veran en mi opinion seran los metodos de optimizacion, lo cual no se explica en el video, pero que es vital para acelerar el aprendizaje de la NN e involucra conocimientos en algebra lineal,calculo diferencial y calculo multivariable.

No es algo utópico de entender, yo lo veia muy complicado al inicio e incluso imposible pero sepan que no es asi, al fin de cuentas todo se reduce en sumas y restas al momento de ejecutar codigo.Solo tienen que pensar que es algo que les va a costar, pero que es posible de lograr con mucho esfuerzo y vale la pena.

Luis Javier Jaramillo García

student•

Genial, gracias por el aporte.

Henry Caicedo Velasco

student•

Excelente aporte

Enrique Mendoza

student•

Platzi = Futura historia de mi vida. Gracias por todos los conocimientos que comparten.

josue cieza

student•

Gracias Platzi¡

Raynier Garrido

student•

Para mí ha sido toda mi historia en el ultimo año jajajaja

David Santiago González Ramos

student•

Con este curso mi panorama de los que es la tecnología y la computación se amplió como 1000 veces de lo que pensaba!!! Lo mejor es que tooodo es apasionante y por medio de @platzi me motivo a aprender de todo eso!

Paola Arévalo

student•

Eso es genial David! A mi me sucedió igual y yo soy economista. ¿Qué otros cursos te han motivado a seguir en el mundo de la tecnología?

Fernando Jesús Paredes Rios

student•

A mi también me parece sumamente interesante todo esto y también estudié economía y ahora estoy haciendo una segunda carrera en ingenieria

Joel Vicente Nieto Gómez

student•

En la universidad, tuve la materia de Procesos Estocásticos, en la que me enseñaron las Cadenas de Markov, un tema muy interesante donde luego desarrolle como proyecto una aplicación tal que prediciera la calidad del aire de una región en Naucalpan(México), rellene mis matrices con datos históricos tomados de unas antenas que miden la calidad del aire y con un proceso markoviano de decisión modele mi sistema y ahora es impresionante saber que cosas como el autocorrector de Google tiene detrás algoritmos que usan Cadenas de Markov.

Luis Alberto Acosta Fuenmayor

student•

que excelente!

Javier Nicolás Nieto

student•

wow, que interesante tu proyecto!!

Jose Antonio Rojas Ollarves

student•

Tengo un aporte para dejar mas clara esta clase, si quieres debatir estoy abierto a debates:

APORTE

--> Primero que nada hay que entender que existen muchos tipos de redes neuronales artificiales, sus tipos generalmente se basan en un uso particular, en este ejemplo explicare una red neuronal para la comparacion de patrones.

Red neuronal artificial: estan basadas en como funcionan las neuronas del cerebro, se crean apartir de los elementos que se le establecen para su distinto caso de estudio, su funcion es separar elementos en categorias cuando los elementos no son muy claros de entender de forma no lineal.

--> Entonces tenemos que una red neuronal es un sistema que se basa para estudiar un caso deacuerdo a su categoria de red neuronal creada. Entonces haremos una red neuronal de comparacion para ello lo que necesitamos es:

1. Establecer los parametros: De lo que vamos a comprar. Ahora cuales son esos parametros? Pues pueden ser las variables que tenemos como por ejemplo, una manzana, los parametros pueden ser:

	* Color
	* Sabor
	* Textura
	* Tamaño
	* Forma

2. Entrenamiento: Pasamos a indicarle a una red neuronal, que seria una manzana y que no es una manzana, para esto tenemos que colocar distintos casos, donde rigidamente establecemos cuales si son los parametros que conforman a una manzana, y cuales no son, estos casos los tenemos que hacer de forma aleatoria desde los que mas se parecen hasta los que no se parecen, de esta forma, lo estaremos ayudando para que en su fase de entrenamiento tenga

3. Resultado: Luego de pasar por un entrenamiento donde ya sabe el caso que va a estudiar, hacemos la muestra de campo en este caso mostramos una manzana y una pera y la neurona o puede decir cual es o cual no es la manzana o señalarlo, esto depende de como este todo configurado.

Conny María Barrios Moreno

student•

Muchas gracias ❤️!

Juan Camilo Maldonado Perez

student•

Men esta genial, lo entendi a la primera, muy bien aplicado.

Eduardo Rasgado Ruiz

student•

En los algoritmos del vehículo autónomo de google se utiliza lo que Freddy menciona al inicio, the Markov Assumption, en el 5to paso de la adaptación de la Baysesian Rule, aplicada a la predicción de la posisión de un vehículo en base a sus acciones pasadas. Un vehículo autónomo actual desprecia esto de tomar en cuenta los estados pasados directos incluidos los algoritmos como el Simultaneous Localization And Mapping(SLAM), que tanto este como la aplicación de la Bayessian Rule están dirigidos a los sensores LIDAR de los vehículos autónomos.
Actualmente se utilizan más las redes neuronales para las decisiones dinámicas de un vehículo en un gran mundo cambiante como las carreteras y calles de ciudades.
Aún así los algoritmos que mencioné sirven mucho para robots en espacios cerrados, robots de ayuda o exploración de terreno desconocido o terreno que se desea mapear para su posterior navegación con mayor fluidez.
Por ahora puede que no le entiendan, pero lo mas cool de todo esto es que lo que menciono puede programarse en python aunado a C++, pero gran parte de ello en python, usando matrices, algoritmos programados bajo programación Orientada a Objetos y programación Funcional, librerías como Opencv, Scikit-learn para Machine Learning, así como Tensor Flow para deep learning, la ingeniería de software es apasionante! Adentrense al mundo de Python, Data Science, Inteligencia Artificial y verán que hasta pueden programar redes neuronales que aprendan a conducir vehículos en GTA V.

Diego Fernando Ramos Aguirre

student•

Genial!!!

josue cieza

student•

Gracias por el aporte.

Iván Arcos

student•

me encontré este esquema de lo que nos explicó Freddy 3 tipos de redes neuronales que usa la IA 👇🏼

Conny María Barrios Moreno

student•

Muchas gracias ❤️!

Marcos Monteverde

student•

Tremendo, gracias!

Antonio Villavicencio Garzón

student•

Me darían más fuentes o material para estudiar por mi cuenta sobre redes neuronales y cómo hacer práctica sobre esto?

Freddy Vega

Team Platzi•

Empieza por leer de Algebra Lineal y regresiones. Eso te da las bases de redes neuronales 😄

Antonio Villavicencio Garzón

student•

Los conocimientos sobre Algebra Lineal y regresiones sí los tengo de la universidad. Quisiera entender sobre las funciones de activación y sobre las diferentes algoritmos que puedo utilizar.

Diego Fernando Ramos Aguirre

student•

Espectacular!!!

Diego Rubio

student•

ahhahahaah

Juan Sebastián Sierra Sánchez

student•

Freddy definitivamente es elmejor profesor de platzi, lastimosmente solo he visto 30 cursos y me falta mucho data para poder afirmmar esto con seguridad, pero de todos los profesores que he tenido, Freddy te engancha hablando, tiene un muy buen manejo de público, te desafia mientras te enseña, y se nota el gran conocimiento que maneja porque realmente sabe demasiado. Con este curso aprendi que la tecnología no es tan dificil como parece en un principio.

Andrés Fernando Cortés Pinzón

student•

Juan, realmente si es un excelente profesor, tiene buena pedagogía y muy claros los temas que enseña, como él tambien recomiendo a Sacha y a Carlos Hernández, los tres son muy buenos en lo que hacen y creo, en mi experiencia que todo se aprende fácil con ellos, poruqe he tomado cursos con otros profesores más que se nota que saben mucho de los temas que enseñan pero no lo transmiten tan bien .

Miguel Angel Reyes Moreno

student•

¿Por qué en los archivos y enlaces hay una foto de la bandera de la Unión Europea? jajaja

Thomas André Dale Guevara

student•

Qué es una red neuronal

Las redes neuronales funcionan exactamente igual cómo funcionan las neuronas en nuestro cerebro, a nivel conceptual el cerebro humano tiene alrededor de 100 mil millones de neuronas que serían las bolitas verdes. Las neuronas tienen conexiones y reciben señales eléctricas y con las señales deciden qué hacer si dispara más fuerte o lento. La combinación de todas estas son las que crean el conocimiento. Nosotros recibimos inputs (sentidos: gusto olfato, etc.). Los inputs son datos que pasamos por memoria RAM a un algoritmo. Le damos una serie de datos a la red neuronal y la entrenan (con estos datos este es el resultado). Un ejemplo de red neuronal es una estudiante que tiene que estudiar para un examen. El estudiante empieza a notar los datos y nota que en el día que tenía el examen estudió 4 horas y durmió 6 y ese fue el resultado del examen. Otro día estudio 2 horas y durmió 8 y se da otro resultado.

Función sigmoide: si le pasamos 5, 50=0, 50.1=0.5. Va de todos los números del 0 al 5 para que las neuronas tengan muchas opciones y diferentes lugares activa diferentes puntos del sigmoide. De esa manera las neuronas prueban cada uno de los datos y lo comparan con su base de datos de entrenamiento para ver que tanto se parecen. Las neuronas que funcionaron sirven para aprendizaje.

Cadenas de Marcov: así es cómo funciona el auto predicción del teclado. Si una persona múltiples veces ha hecho esto, lo más probable es que lo vuelva a hacer. Si solemos escribir “Hola amigo” al escribir “Hola”, el teclado nos va a sugerir “amigo”.

Los autos que se conducen solos son una combinación de algoritmos de inteligencia artificial con algoritmos que no tiene que ver con inteligencia artificial. Como para un semáforo usan una cámara con un filtro que resalta los colores brillantes, rojo, verde, amarillo y buscan en la imagen un patrón de cajita donde haya círculos de sus colores muy brillantes.

Cristian David Quiroz Salas

student•

Gracias por la explicación 💚💚

Andrés Soret Chacin

student•

Muy buena explicación, muchas gracias por haberla compartido 😁👍

Alejandro Sanchez Rosas Sánchez Rosas

student•

esto no aparece en la app movil de platzi, el curso de fundamentos de ingenieria de software termina en “comomfunciona zip :arboles vinarios”

Arnaldo Guillen

student•

Muy cierto, yo estaba entrando a dar mi examen y resulta q hay cuatro vídeos más.

Usuario anónimo

user•

Ya esta solucionado.

Katterine Rivera Menocal

student•

ya terminé el curso de fundamentos de ingenieria de software, y no veo más información ni más clases sobre redes neuronales, además de ésta clase...

Agustín Armando Lozano Salas

student•

Estoy de acuerdo, pero ten en cosnideración que ya el curso es bastante pesado.

Ramdhei López Arcila

student•

Ésto es contenido bonus, son videos extra que explican otros conceptos que si bien no son ajenos al curso, no tienen una sección para ellos mismos.

José Alejandro Méndez Sánchez

student•

Se me vino a la mente, como sería un auto conduciendo solo en mi país Venezuela, donde el mayor porcentaje de las veces los semáforos se encuentran dañados, se me vinieron a la cabeza muchas preguntas fáciles de responder que en países desarrollados ni siquiera serian problemas.

Eduardo Rasgado Ruiz

student•

Bro, te aconsejo checar en youtube sobre el coche autónomo de NVIDIA, optimizado brutalmente para manejar en lugares tan cabrones como india, caminos sin pavimentación como en México, y ciudades como las de Venezuela o aqui en México que nadie respeta la ley de tránsito. Los vehículos autónomos no toman decisiones de si o no, ya funcionan como un cerebro humano capaz de decidir en los ambientes más hostiles del planeta en base a decisiones estocásticas o de probabilidades.

Aunque falta mas camino por recorrer, no estamos muy lejos de notar todo lo que comento.

Jaime Arley González Paez

student•

Al ver esta clase me doy cuenta de lo complejos que somos los seres humanos y de la gigantesca capacidad de procesamiento que tenemos en nuestra cabezota. Creo que nosotros somos máquinas biológicas, tenemos periféricos de entrada y de salida, tenemos sentidos para recibir la información de nuestro mundo y sentidos para dar un resultado. Creo que las redes neuronales son un pilar muy importante para desarrollar inteligencia artificial. Vamos por buen camino.

CRISTIAN FABIAN HERRERA PILLIMUE

student•

que buena reflexión!!

Julio David Rojas Loo

student•

Acabe el curso de Fundamentos de ingeniera de software en el #platziday y la verdad fue el mejor uso de mi tiempo.

Juan Miguel Garcia Carballo

student•

Se corto mi pregunta, la escribi en aportes de todas formas

Massimo Di Berardino

student•

Hola Juan, podrías compartir tu pregunta por acá, no sé donde quedo la otra para poder ayudarte.

Gerardo Jesús Mota Olguín

student•

Las redes neuronales artificiales son un modelo computacional vagamente inspirado en el comportamiento observado en su homólogo biológico. Consiste en un conjunto de unidades, llamadas neuronas artificiales, conectadas entre sí para transmitirse señales.

Nelson Gonzalez Escalante

student•

Freddy, te felicito. Esta clase despertó mi curiosidad hacia el "Machine Learning". Agradezco el compromiso por parte del Team Platzi para crear esta lección.

Cómo las redes neuronales procesan datos

Computación, procesadores y memoria

Cómo funciona el código binario en computadores

Cómo funciona un email desde Enter hasta notificación

Cómo funcionan los circuitos electrónicos

Procesadores y arquitecturas de CPU

System on a chip: cómo funciona tu smartphone

Cómo funcionan disco duro, RAM y CPU

Cómo la GPU convierte archivos en píxeles

Periféricos y sistemas de entrada de información

La evolución de la arquitectura de la computación

Cómo funciona Internet

Introducción a las redes y protocolos de Internet

Puertos y protocolos de red

Anatomía de una IP: 32 bits en 4 bytes

Cables submarinos: cómo viaja internet

Qué es un dominio, DNS o Domain Name System

Por qué tu test de velocidad miente

Cómo funciona la velocidad en internet

Qué es el Modelo Cliente/Servidor

Cómo funciona una petición HTTP

Internet es más grande de lo que crees

Sistemas operativos

Diferencias entre Windows, Linux, Mac, iOS y Android

Permisos, niveles de procesos y privilegios de ejecución

Sistemas operativos móviles vs desktop

Sistemas operativos embebidos e Internet of Things

Archivos y estructuras de datos

Metadatos, cabeceras y extensiones de archivos

Por qué JPG pesa menos que BMP

Compresión de video con H264 y MP3

Cómo funcionan los algoritmos de compresión ZIP

Contenido Bonus

Cómo las redes neuronales procesan datos

¿Qué es SQL y NoSQL?

Variables y ciclos con combate Pokémon

Raspberry Pi: cómo crear proyectos IoT reales

Principios de la ingeniería de software sostenible