El fin de año se acerca y es un momento para reflexionar sobre los avances y logros del año que está a punto de terminar 💚. En el campo de la inteligencia artificial, el 2022 ha sido muy importante, de hecho para mi ha sido el gran protagonista de este año, con la aparición de nuevos modelos y tecnologías que han revolucionado la forma en que interactuamos con la IA.
Desde el desarrollo de sistemas de reconocimiento de voz más precisos hasta la creación de algoritmos de aprendizaje automático más sofisticados y, por supuesto, un avance colosal de IA generativa. Este año ha visto un sinfín de innovaciones.
A medida que nos acercamos al final de 2022, es emocionante imaginar todo lo que el próximo año y la próxima década nos traerá en esta tecnología 🚀. Por ahora, en Platzi te traemos el top 5 de nuevos modelos IA que nos dejó este increíble 2022.
Ten en cuenta que este conteo NO tiene ningún tipo de orden o prioridad por ningún tipo de característica 💚
Fue en abril de 2022 cuando el equipo de OpenAI sorprendió una vez más a toda la comunidad, pues publicó una página entera dedicada a un nuevo modelo llamado Dalle 2. Como su nombre lo indica, es la segunda versión de Dalle, que en el 2021 fue el primer algoritmo text to image, pero del que lamentablemente no pudimos ver una API o poder usarlo realmente.
Con el lanzamiento de su segunda versión, mediante un sistema de lista de espera, fue que toda la comunidad empezó a probar de primera mano esta tecnología que contaba con mejoras increíbles. La principal de ellas es que ahora utilizaban algo llamado modelos de diffusion, para poder generar cualquier imagen, en cualquier estilo, por más loco que parezca y simplemente con un pequeño texto 🤯, y como era de esperar, esto rompió internet y marcó todo un antes y un después en el mundo del IA.
Por supuesto no pasó mucho tiempo antes de que la comunidad creara nuevos productos y modelos con una arquitectura similar a Dalle 2. Por ejemplo, modelos como lo son Midjourney que cuenta con increíbles resultados en una calidad inimaginable, o modelos como Stable Diffusion de Stability.ai un modelo que es totalmente libre y gratuito con resultados increíbles.
En mayo el equipo de DeepMind anuncia a “Gato”, un nuevo modelo que deja a la comunidad interesada en IA totalmente sin palabras. Destaca porque es el primer modelo realmente productivo de algo llamado “modelos generalistas” o “agentes generalistas”.
Justamente, lo maravilloso de Gato es eso, es un modelo multi-modal, multi-task, multi-embodiment, lo que significa que un mismo modelo, con exactamente los mismos pesos y un único entrenamiento es capaz de realizar hasta 600 tareas totalmente distintas entre sí 🤯.
Sí, ya habíamos visto modelos como GPT3 que hacen múltiples tareas, pero solo son de procesamiento de texto, con gato podemos hacer múltiples inferencias totalmente distintas entre sí. Es un modelo que literalmente puede procesar texto, catalogar imágenes, jugar videojuegos de Atari, apilar u ordenar bloques con un brazo robótico 🤯.
Gato decide de acuerdo a su entorno y variables de entrada como responder a una tarea, ya sea generando un texto, una imagen, presionando botones o moviendo un brazo, ¡lo que es algo increíble!
Por supuesto, los resultados no son tan certeros como modelos que están entrenados específicamente para una actividad, pero es el primer gran paso en la construcción de una IA general que pueda desempeñar múltiples tareas. Sí, tal cual como lo hace un humano 🚀.
De principiante a experto: aprende inteligencia artificial desde cero
Uno de los modelos que más me asombro este año, realmente una maravilla de algoritmo. En octubre, nuevamente el equipo de DeepMind nos regala una sorpresa y llega AlphaTensor, un modelo que se basa en AlphaZero, una IA capaz de aprender a jugar de manera profesional juegos de mesa basados en movimientos de fichas en algún tablero, como por ejemplo ajedrez, Go o shogui.
Lo interesante acá es que le presentaron a este modelo un problema algebraico que es la multiplicación de matrices en un espacio tridimensional. El objetivo era resolver la operación en la menor cantidad de movimientos posibles, así es, tomaron la multiplicación de matrices como un juego de movimientos 🤯.
Mira esta clase sobre: Qué es lenguaje algebraico y cómo entender las expresiones algebraicas
La buena noticia es que, efectivamente, ahora contamos con un método más sencillo de resolver esta operación y lo desarrolló una inteligencia artificial.
Lo mejor de todo es que la operación de producto entre matrices es altamente utilizada en el procesamiento de tensores para entrenar modelos de IA. De manera que, una inteligencia artificial está ayudando a mejorar los modelos matemáticos que usa la inteligencia artificial, lo que es sorprendente y abre la puerta a modelos más rápidos y más robustos.
Hablar de AlphaFold en 2022 puede ser trampa, pues realmente es un modelo lanzado en 2020. No obstante, en julio de este año, el equipo de DeepMind publicó una base de datos totalmente libre para institutos de investigación y demás personas interesadas de más de 200 millones de estructuras de proteína, todas descubiertas con este increíble modelo de IA, aumentando esta base exponencialmente.
Y es que tal como lo lees, AlphaFold es un modelo de IA encargado de predecir la forma de una proteína, y las estructuras de proteína son el secreto de la biología y la vida misma 💚; se encuentran en cada célula y al conocer su estructura se puede entender cómo funciona y para qué sirve esa proteína.
Con ello, literalmente estamos decodificando los secretos de la vida misma, y al entenderlo podemos crear medicamentos más efectivos, encimas que ayuden con la descomposición de plásticos, mejorar el sistema inmunológico, combatir la resistencia a antibióticos y básicamente cualquier aspecto biológico 🚀
En noviembre de este año el equipo de OpenAI nos anuncia la salida de ChatGPT, un modelo increíble del procesamiento del lenguaje natural embebido en un módulo de chat. A este modelo podríamos llamarlo GPT3.5, tiene un increíble entendimiento del lenguaje y está entrenado con millones de páginas de internet, repositorios de código e innumerables conversaciones.
Lo mejor de todo es que el equipo de OpenAI (por ahora) nos entrega a ChatGPT totalmente gratis en https://chat.openai.com/. Lo sorprendente de este modelo es que puedes pedirle lo que sea en su base de conocimientos que va hasta antes del 2022 y responde muy profesionalmente, incluso si le pido algo tan loco como:
“Crea una canción al ritmo del reggaeton entre un amor prohibido entre el lenguaje SQL y el lenguaje python.”
(Ritmo de reggaeton)
SQL y Python, dos lenguajes que se aman
Pero su relación es prohibida, es una pasión oculta
SQL es el lenguaje de bases de datos, siempre organizado
Python es el lenguaje de programación, siempre innovado
Pero a pesar de sus diferencias, se atraen sin parar
Y juntos hacen cosas increíbles, un equipo sin igual
SQL dice "daré todos mis datos, solo quería estar a tu lado"
Python responde “te quiero, pero no podemos seguir así”
Es un amor prohibido, que nadie puede saber
Pero en secreto se juntan, y juntos hacen magia
SQL y Python, dos lenguajes que se aman
Pero su relación es prohibida, es una pasión oculta
(Fin del ritmo de reggaeton)
Parte del secreto de los buenos resultados de ChatGPT es que fue re entrenado utilizando Reinforcement Learning from Human Feedback (RLHF) que es una técnica basada en el feedback humano para mejorar el algoritmo. Muy a alto nivel funciona así:
Fácilmente haría un top 10 o top 20 de modelos o investigaciones de inteligencia artificial, pues el mundo recordará al 2022 como un año emocionante donde se catapultó esta tecnología 🚀.
Ahora, haré una mención especial a algunos modelos increíbles que nos acompañaron este año.
Y la lista puede seguir con muchos más modelos y papers interesantes que nos dejó este 2022. Te invito a que dejes en el sistema de comentarios algún modelo interesante que no mencione.
¡Sígueme en Instagram/Twitter/TikTok como @alarcon7a, para hablar sobre IA y datos! Ten un muy feliz y prospero año nuevo🙂
Que buen post, hasta ahora lo leo, un hurra! por la IA y otro para escritores como Alarcon7a
Dios mío me encanta todo lo que está pasando con la inteligencia artificial, ¡Es muy loco todo!
Excelente contenido siempre actualizado a este campo de la inteligencia artificial que nos apasiona
Gracias por la recopilación, desconocía AlphaTensor 🙌
¡Excelente resumen, gracias Alarcón! 😄
Es la próxima revolución industrial y tenemos que ser parte de ella. Existen muchos miedos, como cuando llego la automatización a la industria de manufactura. pero el tiempo nos enseño que la tecnología potencializa el crecimiento humano y si la dominamos responsablemente podremos solucionar lo que sea.
Hola! me llegó una alerta que ya está disponible un curso de cómo utilizar ChatGPT, pero no encuentro el link, lo tendrán a la mano? Gracias !!
Que emocionante ver en vivo como la ciencia ficción se convierte en realidad
Genial. Muchas gracias por toda la información
Que hace que se hablaba de chatGPT pero nadie sabia como funciona, y ahora uno ve que todo el mundo sabe del tema o ofrece cursos, es impresionante como se adapto a nosotros con gran facilidad y se empieza a destacar la importancia de saber manejar dicha herramienta.
Gran artículo!
Ansioso por saber que nos dejará el 2023 la IA.
Increible a lo que se ha llegado con las IA
Thanks a lot @Alarcon7a to keep us up to date with all this advantages!! 💚 let’s go to see what will bring the 2023!
éxitos a todos, prospero año 2023 de la mano de platzi seremos los que saquemos la cara con estas tecnologías en Latinoamérica.
super interesante tema. saludos desde Guayaquil
Muy Buena recopilación, ya suponía que ChatGTP debería estar en alguna parte del top 😄
Sorprendido, Gracias y Feliz año nuevo a todos.
Cada vez estoy mas sorprendido por lo que estan logrando con la tecnologia, de verdad que no aguanto por ser parte del cambio y estar dando mi aporte en este campo