¿Que herramientas usaremos para redes neuronales?

Clase 2 de 29 • Curso de Fundamentos de Redes Neuronales con Python y Keras

Contenido del curso

Fundamentos en la arquitectura de redes neuronales

Redes neuronales con Python

Manejo de redes neuronales con Keras

Cierre

Resumen

Trabajar con redes neuronales requiere elegir las herramientas adecuadas, y entender cómo se conectan entre sí marca la diferencia entre avanzar con fluidez o perder tiempo valioso. A continuación se explican los frameworks, backends y recursos de hardware que se utilizan para construir modelos de deep learning de forma práctica.

¿Cuáles son los principales backends para redes neuronales?

Un backend es el motor de cálculo que ejecuta las operaciones matemáticas detrás de una red neuronal. Los más populares son:

TensorFlow: desarrollado por Google, es uno de los más utilizados en la industria y la academia [00:17].
PyTorch: creado por Meta, destaca por su flexibilidad y su adopción creciente en investigación [00:17].
Theano: fue uno de los primeros backends orientados a deep learning, pionero en el uso de GPU para cálculos simbólicos [00:34].
Microsoft Cognitive Toolkit (CNTK): orientado al uso empresarial dentro del ecosistema de Microsoft [00:39].

Cada uno tiene sus fortalezas; la elección depende del proyecto y del contexto profesional. Lo importante es comprender que todos cumplen la misma función: resolver operaciones numéricas masivas que las redes neuronales demandan.

¿Qué papel cumple Keras y por qué no es un backend?

Keras no es un backend, sino un API [00:48]. Esto significa que no realiza los cálculos por sí mismo, sino que ofrece una interfaz simplificada para consumir un backend como TensorFlow o PyTorch. Su gran ventaja es la facilidad de uso: permite definir arquitecturas de redes neuronales con pocas líneas de código, ocultando la complejidad interna del motor de cálculo.

El flujo de trabajo queda así:

Keras recibe las instrucciones del usuario y las traduce.
TensorFlow (el backend elegido en este contexto) ejecuta las operaciones.
La GPU proporciona la potencia de cómputo necesaria para procesar datos a gran escala [01:25].

¿Por qué la GPU es más eficiente que la CPU en deep learning?

La GPU (Graphics Processing Unit) fue diseñada originalmente para renderizar gráficos en videojuegos, pero su arquitectura resulta ideal para deep learning [01:07]. A diferencia de la CPU, que maneja pocas tareas complejas de forma secuencial, la GPU puede ejecutar miles de operaciones matemáticas en paralelo. Esto la convierte en la opción preferida cuando se entrenan redes neuronales con grandes volúmenes de datos [01:16].

¿Qué notebook se recomienda para practicar?

Existen varias plataformas de notebooks interactivos: DeepNote, Jupyter, Google Collaboratory y Visual Studio Code [01:40]. Para este tipo de proyectos se recomienda Google Colab, un servicio gratuito que permite consumir GPU o CPU en la nube y ejecutar código en Python 3 sin necesidad de configurar nada en la máquina local [01:48].

Colab es especialmente útil porque:

No requiere instalación.
Ofrece acceso gratuito a GPU.
Permite compartir y colaborar en tiempo real.

¿Cómo se conectan todas estas herramientas entre sí?

El esquema completo funciona como una cadena bien definida. El usuario escribe código en un notebook de Colab usando Keras como interfaz de alto nivel. Keras traduce esas instrucciones y las envía a TensorFlow, que actúa como backend. TensorFlow, a su vez, aprovecha los recursos de la GPU disponible en la nube para realizar los procesamientos numéricos intensivos y devolver los resultados [01:25].

Entender esta arquitectura es fundamental antes de construir cualquier modelo, porque permite tomar decisiones informadas sobre rendimiento, costo y escalabilidad. Si ya dominas Python y tienes curiosidad por el funcionamiento interno de las redes neuronales, el siguiente paso natural es comprender qué es deep learning, junto con sus ventajas y limitaciones.

Comentarios

Alfonso Morán

student•

Resumen de la clase: _ Las herramientas más conocidas para manejar redes neuronalnes son TensorFlow y PyTorch. _ Keras es una API, se utiliza para facilitar el consumo del backend. _ Utilizaremos la tarjeta GPU, porque permite procesas más datos matemáticos necesarios en el deep learning.

Francisco Garcia [C6]

student•

Gracias

Luis Fernando Callisaya Surco

student•

Gracias

Maria Virginia Gómez Sandoval

student•

Las GPU´s son super rapidas para procesar datos tal como lo demuestra este video de CPU vs GPU https://www.youtube.com/watch?v=-P28LKWTzrI

Francisco Garcia [C6]

student•

Gracias por el aporte

Juan R. Vergara M.

student•

Gracias 👍

Aaron Fabrizio Calderon Guillermo

student•

TENSOR FLOW: BACKEND
PYTORCH: BACKEND
KERAS: NO ES UN BACKEND, ES UN API. ESTA HECHO PARA FACILITAR EL CONSUMO DE UN BACKEND. LO UTILIZAREMOS PARA CONECTAR CON TENSORFLOW Y ESTE UTILIZARA GPU (PARTE DE LA CPU QUE PROCESA DATOS A GRAN ESCALA EFICIENTEMENTE)

Jhon Freddy Tavera Blandon

student•

Librerías de Aprendizaje Profundo:

TensorFlow:

Desarrollado por Google, es una biblioteca de código abierto que se ha convertido en una de las más populares para el aprendizaje profundo.

Keras:

Una interfaz de alto nivel que funciona sobre TensorFlow y facilita la construcción y experimentación con modelos neuronales.

PyTorch:

Desarrollado por Facebook, ofrece flexibilidad y facilidad de uso, siendo especialmente popular en la investigación académica.

Luis Rogelio Reyes Hernandez

student•

Si son rebeldes sin causa y son lo suficientemente afortunados como para tener una tarjeta gráfica integrada de Nvidia Aqui les dejo una guía para configurar el uso de Nvidia con tensorflow y Docker

Angel Martinez

student•

Que paso con el curso de Pytorch, ya no esta disponible

Darío Cabezas

student•

¿Qué herramientas usaremos para redes neuronales?

Frameworks

TensorFlow
PyTorch
Theano
Microsoft Cognitive Toolkit
Keras
torch

En este curso se utilizará Keras API → TensorFlow → GPU

Notebooks

Deepnote
Colab
Jupyter Notebook
Visual Studio Code

Hugo Montoya Diaz

student•

El poderosisimo Google Colab

Jose Barboza

student•

go! xd

Alarcon7a

student•

jajaj... a decir verdad es un lenguaje muy estable para ciencia de datos.

Jorge Eduardo Enciso Agudelo

student•

Hola una pregunta, mi pc tiene mucha GPU para usar y quiero usar para deep learning, en Colab es facil activar la GPU pero en local no mucho. Tienen recursos para poder activar la GPU desde local y probar que deverdad se este usando. Algo como las graficas de Colab.

Oscar Danilo Guzmán Villanueva

student•

Yo soy ingeniero y estoy muy metido en IA, mi hermano está estudiando estadística y aprendiendo sobre R, el lenguaje de programación estadístico. ¿Saben si hay librerías o algún desarrollo en IA para R de forma que él pueda entrar a este mundillo con la misma herramienta que le están enseñando en este momento?

Sebastian Martinez

student•

Hola estoy interesado en este curso pero soy nuevo en esto de la programacion lo puedo hacer a este curso o se me va a hacer dificil seria mejor empezar con algun curso de iniciaciacion en programacion

Alarcon7a

student•

Te recomiendo al menos tener un manejo básico de Python y los cursos de manipulación de datos con pandas y numpy y de visualización de datos con matplltlib y numpy

Emanuel Shimizu

student•

Hola, en este curso también te enseñarán a animar o sólo a dijujar, alguien me ayuda con esta pregunta?, me interesa animar

Mauricio Cruz

student•

Qué significa que Tensorflow sea un backend? Que cuando lo ejecutamos realmente las operaciones suceden en el servidor?

Alarcon7a

student•

que por dentro de las instrucciones de Keras que es lo que usaremos en el curso en realidad esta ejecutando el motor de tensorflow.

Javier Camilo Díaz Salinas

student•

Después de investigar. Siento que el profe esta equivocado con la definición del concepto Backend. Y lo que hace es confundir mas a los estudiantes.

En el contexto de desarrollo web:

Backend se refiere a la parte del sistema o aplicación que se ejecuta en el servidor. Es responsable de procesar la lógica del lado del servidor, manejar solicitudes y respuestas, interactuar con la base de datos y proporcionar los datos y servicios necesarios para que la aplicación funcione correctamente. El backend se ocupa de la gestión de la autenticación, autorización, lógica empresarial y la integración con otros sistemas o servicios.

Pero en el contexto que estamos interesados que es Deep Learning y redes neuronales:

Backend se refiere a la implementación subyacente o el motor de ejecución utilizado por una biblioteca o framework de Deep Learning, como TensorFlow, PyTorch, Theano o Microsoft Cognitive Toolkit (CNTK). El backend realiza los cálculos y optimizaciones necesarios para entrenar y ejecutar modelos de redes neuronales. Puede estar optimizado para diferentes tipos de hardware, como CPUs, GPUs o TPUs, y proporciona las funcionalidades necesarias para construir y trabajar con modelos de redes neuronales.

Por tanto TensorFlow, PyTorch, Theano y Microsoft Cognitive Toolkit (CNTK) son Librerías o Frameworks (refiere a una colección de herramientas, funciones y APIs que facilitan la construcción, entrenamiento y evaluación de modelos de redes neuronales) que tienen un Backend propio (proporcionan la implementación subyacente y el motor de ejecución utilizado por una biblioteca o framework).

Ese Backend en cada libreria no se identifica con un nombre como tal, por ejemplo en el caso de TensorFlow seria el Backend de TensorFlow.

JAVIER SANTIAGO SALGADO

student•

Empecé a probar deepnote, lo único que no me gusto fue lo de 50 horas ¿50 horas en este tipo de proyectos para un amateur o iniciante es mucho o poco? ¿Cuál es su experiencia?

Anthony Ismael Manotoa Moreno

student•

Hola :)

Tienes 50 horas solo de entrada, pero en tu dashboard encontrarás una tablita con retos (sencillos), si los cumples, tendrás un total de 750 horas. Eso es lo equivalente a correr sin parar un notebook por todo un mes.

Justo hoy noche (entre las 18:00 y 20:00 COL), publicaré un blog aquí en Platzi sobre cómo usar y sacar el máximo provecho a Deepnote, hay algunas cosas muy interesantes 👀

Clayton Jhordan Iliquin Zavaleta

student•

Genial, gracias por la info, justo tenía la idea de corre un proyecto y en kaggle se me acabaron las horas gratis de uso de GPU del mes XD

Juan Diego Sánchez Rodríguez

student•

Keras corre sobre Tensorflow, es una forma de hacer la vida del programador más sencilla.

Ricardo Cruz

student•

Tensorflow de Google donde fueron creados modelos como GEMINI o GPT-2.!!😊 Y Pytorch de Meta donde se crearon modelos como META, CLAUDE, LLAMA.!!👀

Mario Alexander Vargas Celis

student•

Para trabajar con redes neuronales, existen diversas herramientas y bibliotecas de software que facilitan su desarrollo y entrenamiento. A continuación se enumeran las más utilizadas, organizadas por categorías:

### 1. **Frameworks de Deep Learning**

Estos frameworks proporcionan las herramientas necesarias para diseñar, entrenar y evaluar redes neuronales, especialmente aquellas con múltiples capas (redes neuronales profundas).

- **TensorFlow**: Uno de los frameworks más populares desarrollado por Google. Ofrece flexibilidad para crear desde redes neuronales simples hasta complejas arquitecturas de deep learning. Se integra bien con GPUs y TPUs para acelerar el entrenamiento de modelos.

- **PyTorch**: Desarrollado por Facebook, es conocido por su facilidad de uso y flexibilidad, lo que lo hace popular tanto en investigación como en producción. PyTorch permite construir y entrenar redes neuronales dinámicamente, lo que facilita la experimentación.

- **Keras**: Es una API de alto nivel que corre sobre TensorFlow (antes compatible también con otros backends). Ofrece una manera sencilla de crear modelos de redes neuronales mediante una interfaz amigable. Ideal para prototipado rápido.

- **MXNet**: Otro framework de deep learning que es eficiente, escalable y flexible. Se utiliza especialmente en aplicaciones de aprendizaje automático distribuidas.

- **Theano**: Aunque ha quedado en segundo plano frente a otros frameworks, Theano fue pionero en la computación simbólica y aún es relevante en algunos proyectos de investigación.

### 2. **Herramientas de Modelado Automatizado**

Estas herramientas permiten crear modelos de redes neuronales automáticamente o con mínima intervención, simplificando el proceso de experimentación.

- **AutoKeras**: Es una herramienta de AutoML basada en Keras que permite la creación automática de redes neuronales optimizando su arquitectura para un conjunto de datos determinado.

- **TPOT**: Automatiza el proceso de selección de modelos y características, encontrando la mejor configuración para una tarea específica de machine learning.

- **H2O.ai**: Ofrece una plataforma para el modelado automatizado de redes neuronales y otros modelos de machine learning, además de ser escalable para grandes volúmenes de datos.

### 3. **Bibliotecas para Procesamiento de Datos**

Estas bibliotecas son esenciales para preparar y manejar los datos que se alimentarán a las redes neuronales.

- **NumPy**: Biblioteca fundamental en Python para manejar arrays y realizar operaciones matemáticas. La mayoría de los frameworks de deep learning lo utilizan como base para operaciones numéricas.

- **Pandas**: Utilizada para la manipulación y análisis de datos tabulares, muy útil para la preparación de datos antes de pasarlos a las redes neuronales.

- **Dask**: Ideal para trabajar con datasets grandes que no caben en memoria. Permite realizar procesamiento paralelo distribuido.

- **scikit-learn**: Aunque no está específicamente enfocada en redes neuronales, es muy útil para preprocesar datos (normalización, división de datos, etc.) y para integrar modelos con redes neuronales.

### 4. **Aceleradores de Hardware**

Las redes neuronales requieren grandes cantidades de cómputo, y algunas herramientas y plataformas permiten optimizar este proceso.

- **GPUs**: Las unidades de procesamiento gráfico (GPUs) son fundamentales para entrenar redes neuronales más rápido. Frameworks como TensorFlow y PyTorch soportan aceleración con GPUs (por ejemplo, usando CUDA de NVIDIA).

- **TPUs**: Las Tensor Processing Units (TPUs) son hardware especializado diseñado por Google para el entrenamiento eficiente de redes neuronales en TensorFlow.

- **cuDNN**: Biblioteca de NVIDIA que acelera operaciones comunes en deep learning (como convoluciones), utilizada por frameworks como TensorFlow y PyTorch cuando se usan GPUs.

### 5. **Herramientas de Visualización**

La visualización es clave para entender el comportamiento de las redes neuronales y analizar su desempeño durante el entrenamiento.

- **TensorBoard**: Es la herramienta de visualización de TensorFlow que permite monitorear métricas como la pérdida, la precisión y los gráficos de la red durante el entrenamiento.

- **Matplotlib**: Aunque no está centrada en deep learning, es ampliamente utilizada para graficar resultados y visualizar datos, especialmente durante el proceso de desarrollo de modelos.

- **Seaborn**: Complementa a Matplotlib y facilita la creación de gráficos estadísticos atractivos y útiles para análisis de datos previos a la creación de redes neuronales.

### 6. **Plataformas de Entrenamiento en la Nube**

Dado que entrenar redes neuronales puede requerir muchos recursos computacionales, las plataformas en la nube son una solución eficiente para escalar el entrenamiento.

- **Google Colab**: Ofrece acceso gratuito a GPUs y TPUs para entrenar modelos de redes neuronales en la nube utilizando un entorno Jupyter Notebook.

- **Amazon SageMaker**: Plataforma de Amazon Web Services (AWS) para construir, entrenar y desplegar modelos de machine learning, incluidas redes neuronales, con soporte para TensorFlow, PyTorch, y MXNet.

- **Microsoft Azure ML**: Servicio en la nube de Microsoft que facilita la creación y entrenamiento de redes neuronales y otros modelos de machine learning.

- **Paperspace Gradient**: Una plataforma que permite entrenar redes neuronales usando GPUs en la nube, compatible con TensorFlow y PyTorch.

### 7. **Bibliotecas Especializadas**

Algunas bibliotecas se enfocan en áreas específicas del uso de redes neuronales.

- **OpenCV**: Ideal para redes neuronales aplicadas a visión por computadora. Facilita el procesamiento de imágenes y videos para su uso en modelos.

- **spaCy**: Biblioteca centrada en el procesamiento del lenguaje natural (NLP). Integra modelos basados en redes neuronales para tareas como etiquetado de palabras, análisis sintáctico y reconocimiento de entidades.

- **Transformers (Hugging Face)**: Biblioteca popular para redes neuronales en procesamiento del lenguaje natural, centrada en el uso de modelos de transformers como BERT, GPT, y otros.

### 8. **Herramientas de Experimentación y Gestión de Modelos**

Estas herramientas permiten gestionar experimentos, versiones de modelos y sus resultados.

- **MLflow**: Una plataforma para gestionar el ciclo de vida de los modelos de machine learning, incluida la experimentación y el despliegue de modelos.

- **Weights & Biases (W&B)**: Herramienta para el seguimiento y gestión de experimentos en machine learning, que facilita la visualización y el análisis de redes neuronales durante el entrenamiento.

### Conclusión

Las herramientas para redes neuronales son muy variadas y permiten abordar todas las fases del desarrollo, desde el procesamiento de datos, la creación de modelos, el entrenamiento acelerado, la visualización y hasta la implementación en la nube. La elección de las herramientas adecuadas dependerá del tipo de problema que se esté abordando y de los recursos disponibles.

Alan Javier Sánchez Sánchez

student•

Alguien podría ayudarme en la selección de una computadora, tengo pensado una MacBook con el chip M3, sin embargo, no sé si es buena para la creación de inteligencia artificial.

Cristhian Rodrigo Alave Sanjines

student•

Keras no es un backend, es un api con el cual nos facilita el consumo de un backend como tensorflow, pytorch. Tensorflow a su vez usara GPU (realizara calculos matematicos a gran escala de forma mas eficiente).
Keras va a hablar con el backend con tensorflow y este usara recursos de la GPU para darnos resultados matematicos.

Jaison Hernando Velasco Camacho

student•

link roto https://platzi.com/cursos/deep-learning/

¿Que herramientas usaremos para redes neuronales?

Fundamentos en la arquitectura de redes neuronales

La importancia de las redes neuronales en la actualidad