El equipo de OpenAI lo hizo de nuevo, ya en 2021 nos habían entregado un producto sin precedentes que fue GPT3 y este año 2022 Dalle 2, esto generó un antes y un después en el uso de IA generativa. Pero el pasado 30 de noviembre anunciaron el lanzamiento de ChatGPT, el modelo más avanzado de IA basada en NLP con una interfaz de chat.
📌 Para aprender más y mantenerte actualizado sobre todo lo que puedes hacer con ChatGPT te recomendamos:
Esta tecnología ahora es capaz de admitir errores, cambiar y corregir premisas erróneas, negar la generación de contenido ofensivo o violento. También responde con mayor precisión y lo mejor es que, por ahora, es totalmente gratis. Cualquier persona lo puede probar al alcance de un clic.

¿En qué consiste el modelo GPT 3.5?
Podemos considerar a ChatGPT parte del modelo GPT3.5 de OpenAI, por supuesto sabemos que GPT3 es un modelo que entiende el lenguaje y puede crear nuevas oraciones basadas en secuencias de palabras. Algo que hace muy especial a esta nueva tecnología es RLHF, lo que significa “Reinforcement Learning from Human Feedback”. Es decir, un aprendizaje por refuerzo basado en las opiniones de mejora de humanos.
Esto es muy interesante, puesto que desde hace mucho tiempo la inteligencia artificial se apoya del aprendizaje por el refuerzo, el cual consiste en premiar o castigar a un algoritmo con el fin de enseñarle qué es lo que se debe y no debe hacer.
Sí, es similar a cuando entrenas a un perrito para que aprenda a comportarse. Al portarse bien lo premias con ricas galletas, pero si lo hace mal, se le castiga con un leve regaño o el ruido de un periódico. Esto anteriormente se automatizaba para que un mismo modelo enseñara a la máquina cuando hace algo bien y cuando no, un ejemplo de esto es AlphaTensor, del que ya hablamos previamente.

Algo a resaltar es que el feedback en ChatGPT se hizo con humanos expertos, en resumen RLHF es un tipo de aprendizaje automático con el cual una computadora intenta mejorar sus habilidades haciendo cosas y luego recibiendo comentarios de personas sobre cómo lo hizo.
Por ejemplo, si una computadora está aprendiendo a dominar un juego, podría intentarlo y luego preguntar a una persona si lo hizo bien o mal. Este equipo luego usará la información para mejorar la próxima vez que practique el juego.
Otra forma en que RLHF puede ser útil es si una computadora está tratando de reconocer diferentes tipos de frutas en una imagen. El ordenador podría mostrar la imagen a una persona y preguntarle si identificó la fruta correctamente. Si lo hizo bien, el equipo lo recordará y si lo hizo mal, tratará de mejorar la próxima vez.

Lo más interesante es que este último párrafo lo escribió ChatGPT 🤯

¿Qué puedo lograr con ChatGPT?
Tu imaginación es el límite. Ya sea para ayudar a redactar un blog, como lo hice anteriormente, o en casos específicos al solicitar un código de programación, recetas de cocina, tareas del colegio o universidad. Existe un mundo de posibilidades y aquí te traigo algunos ejemplos.
1. Explicación y sintaxis de código
En este caso el prompt fue “podrías escribir una red neuronal convolucional que reciba imágenes de 128x128 y clasifique al final entre 3 distintas clases en TensorFlow?”

2. Creación de canciones o poemas
Cuenta con una capa de abstracción muy superior a lo que veníamos viendo en el estado de arte de textos generativos.

3. Temas emocionales 🤯
No, no olvide ningún cumpleaños, pero es una prueba de si entiende sobre sentimientos, emociones y cómo trabajarlas.

Como mencioné antes, tu imaginación es el límite, te invito a que utilices esta herramienta y me compartas tus resultados en Twitter o cualquier red social; además, si por alguna razón no son los resultados esperados o con algún tipo de violencia, lo puedes reportar al equipo de OpenAI, pues incluso hay un concurso para el mejor feedback.
Limitaciones de ChatGPT
Por supuesto cuenta con algunas limitantes como lo son:
- Ilusiones: el modelo nos dice información errónea y asegura que es totalmente cierta.
- Conocimiento hasta antes de 2022: de manera que si le preguntamos sobre algo muy actual, seguro no lo sabe.
- Sesgos por género, raza, religión: es algo que se debe atacar y terminar.
- Limitación al crear contenido que considere violento u ofensivo: lo cual es algo muy bueno.

¿Cómo puedo emplear ChatGPT?
Simplemente, debes entrar en la página oficial de OpenAI y crear tu cuenta, ¡Escribe en el módulo de chat lo que tú quieras! Así que espero puedas sacarle provecho a esta tecnología y como siempre, te dejo algunos enlaces que pueden ser útiles.
- Página oficial de ChatGPT
- ChatGPT
- PPO
- Lessons Learned on Language
- Curso de Prompt Engineering con ChatGPT
¡Sígueme en Instagram/Twitter/TikTok como @alarcon7a y charlemos de temas relacionados con datos e inteligencia artificial! 🙂
Curso de ChatGPT