33

Colombiano hace parte del equipo que entrenó a ChatGPT: ¡Conócelo!

4028Puntos

hace un año

En los últimos meses, en Platzi hemos estado hablando de inteligencia artificial. Esto me motivó a aprender más sobre el tema y a escribir el blog Inteligencia artificial con ChatGPT. Durante mi último viaje, conocí a un colombiano que trabaja en ChatGPT.

Fue emocionante y decidí hacerle algunas preguntas para poder aprender más y compartirlo con toda la comunidad de Platzi. Me sorprendió gratamente la cantidad de información que me proporcionó. Espero que les guste tanto como a mí.

Juan Felipe Cerón Uribe es un bogotano que se desempeña como matemático e ingeniero de sistemas. Su objetivo profesional es mitigar el riesgo de una catástrofe causada por la inteligencia artificial, la cual podría amenazar la existencia de la humanidad. Nos recomendó una excelente lectura sobre este tema.


¿Cómo empezaste a trabajar en inteligencia artificial? ¿Y qué haces actualmente?

Mi camino comenzó cuando estudiaba ciencia de datos y machine learning en línea en 2015 mientras estaba en la universidad en Colombia. Después de graduarme en 2019, comencé a trabajar como Ingeniero de machine learning que combina ciencia de datos, ingeniería de datos, ingeniería de software e inteligencia artificial. Dos años después, tuve la oportunidad de trabajar en deep learning, desarrollando una base de datos para reconocimiento de voz.

Esa primera experiencia en NLP (procesamiento de lenguaje natural), que es mi área actual de trabajo, fue una pasantía en Stanford Existential Risks Initiative. Esa también fue mi primera exposición a los riesgos catastróficos de la Inteligencia Artificial.

En mayo de 2022, comencé a trabajar en Open AI y desde entonces formo parte del equipo de investigación que entrenó a ChatGPT. Mi primer proyecto estuvo relacionado con la recolección adversarial de datos. Hoy en día, mi trabajo se basa en plantear experimentos que intentan solucionar problemas fundamentales del modelo (por ejemplo, las alucinaciones) y evaluar su desempeño.

Mi papel en varios proyectos está relacionado con el proceso de recolección de datos, más específicamente, la recolección de preferencias humanas sobre el comportamiento de los chatbots.

¿Cómo ves el futuro de la inteligencia artificial?

Hablaré sobre NLP, que es el área en la que tengo experiencia y donde la mayoría de los laboratorios (OpenAI, Anthropic, DeepMind, Google Brain) están centrando sus esfuerzos. En los próximos 5 años, espero que los chatbots cambien fundamentalmente la forma en que el público en general accede a la información en Internet (actualmente se utilizan principalmente los motores de búsqueda).

También serán parte integral de muchos «software de oficina» (como Word, Excel y entornos de programación como VSCode), lo que aumentará la productividad de los trabajos que requieren tareas cognitivas, es decir, la capacidad de procesar información nueva.

¿Cuál es principal reto?

El principal reto de los chatbots hoy en día es su tendencia a producir información imprecisa, o, en términos técnicos, a producir alucinaciones. A pesar de que en la mayoría de los casos producen información valiosa, la posibilidad de recibir una alucinación hace que no podamos confiar plenamente en los chatbots, como confiamos en Wikipedia, y hace que muchos casos de uso sean imprácticos. Este es el problema del billón de dólares.

Desde una perspectiva más amplia, el mayor reto de la humanidad con respecto a la inteligencia artificial es alinearla con nuestros objetivos y valores. Es posible que en el próximo siglo creemos una inteligencia superior a la nuestra. El gran poder que tenemos sobre las demás especies de nuestro planeta se basa en nuestra inteligencia.

De igual forma, una inteligencia artificial más inteligente que nosotros podríamos arrebatarnos nuestro poder y, con él, nuestra habilidad de definir nuestro propio destino. Este artículo de AGI Fundamentals es una buena introducción al tema.

¿Qué le dirías a estudiantes que quieren empezar en la campo de la inteligencia artificial?

Les diría que necesitan ser mitad científicas y mitad ingenieras. Este campo es muy empírico, lo que significa que se desarrolla a partir de la experimentación, en contraste con las matemáticas que se desarrollan a partir de la teoría. Por lo tanto, es importante ser científica. Además, muchos experimentos requieren implementaciones retadoras, por lo que también es relevante ser ingeniera.

También es fundamental estar al tanto de nuevas tendencias, ya que este campo evoluciona constantemente. En particular, esto implica que es más valioso ir amplio que profundo. Ningún algoritmo es el estado del arte por más de 6 meses, por lo que un conocimiento profundo puede volverse obsoleto.

En cambio, muchos avances del campo consisten en aplicar ideas generadas en un contexto a otro contexto nuevo. Por lo tanto, tener un panorama amplio te da herramientas que pueden ser útiles.

Las bases teóricas son álgebra lineal, probabilidad y estadística. Un curso básico de cada una es suficiente.


Espero que esta entrevista te anime a seguir conociendo más sobre la Inteligencia Artifical, en Platzi tenemos la Escuela de Data Science e Inteligencia Artificial. Esta te puede ayudar en tu camino.

Paula
Paula
paucgarzon

4028Puntos

hace un año

Todas sus entradas
Escribe tu comentario
+ 2
Ordenar por:
3
17620Puntos

me encanto la frase “Ningún algoritmo es el estado del arte por más de 6 meses, por lo que un conocimiento profundo puede volverse obsoleto.” En unas cuantas palabras dice demaciado.

1
26607Puntos

This is a revealing post. I’m going to start with Linear Algebra.

1
768Puntos

estaría interesante si sacan información de promps para sacar el máximo de las ia s

1
14556Puntos

Genial saber este caso, este blog es inspirador, motivador y lleno de realismo. Muchas gracias 😄