Vectores y Embeddings en Modelos de Lenguaje

Clase 2 de 16Curso de Prompt Engineering

Resumen

¿Qué son los embeddings y por qué son importantes?

Entender cómo los modelos de lenguaje se comunican es crucial hoy en día debido al auge de herramientas como ChatGPT y plataformas como Cloud. Estos modelos utilizan embeddings, que son vectores n-dimensionales, para comprender nuestro lenguaje de forma computacional. Un embedding es similar a una dirección exacta: permite identificar características específicas de nuestras palabras, ubicándolas de manera precisa en un espacio multidimensional.

¿Cómo funcionan los vectores en términos sencillos?

Imagínate buscando un libro en una biblioteca. Necesitas saber en qué piso, qué estantería y qué ubicación exacta ocupa para encontrarlo fácilmente. De la misma manera funcionan los vectores:

  • Un vector es simplemente un punto ubicado en un plano (con eje X, eje Y, incluso eje Z).
  • En términos prácticos, podría representar dimensiones físicas como distancia recorrida, ancho y alto de objetos.
  • Los embbedings toman esta idea aún más allá, utilizando múltiples dimensiones para describir características específicas.

¿Qué ejemplos cotidianos aclaran este concepto?

Usamos vectores multidimensionales sin darnos cuenta cada día:

  • Cuando escribimos una reseña en un restaurante evaluamos múltiples variables: calidad del menú, ambiente, música, frescura de los alimentos, servicio y hasta añadimos fotos, generando así un vector descriptivo de nuestra experiencia.
  • Al proporcionar una dirección física detallada en Google Maps, sumamos dimensiones como país, ciudad, alcaldía o municipio, colonia, calle, número exterior e interior, entre otras.

Este enfoque multidimensional es idéntico a cómo operan los modelos de lenguaje actuales utilizando embbedings.

¿Qué papel desempeñan las similitudes semánticas?

Las similitudes semánticas permiten que los modelos identifiquen y relacionen palabras con significados relacionados o similares, independientemente del idioma. Por ejemplo:

  • La palabra aguacate en español y la palabra avocado en inglés comparten relaciones semánticas (ambas son frutas, son verdes, tienen texturas similares).
  • Por su relación semántica, los modelos pueden inferir equivalencias y traducir con precisión, aun sin ser específicamente entrenados para ello.

Esto explica por qué algunas herramientas como ChatGPT pueden cambiar de idioma con facilidad durante una conversación sin perder precisión.

¿Cómo influye la elección de palabras en los resultados de ChatGPT?

La elección específica de palabras en un prompt es determinante porque cada palabra lleva al modelo a diferentes áreas en este espacio vectorial multidimensional:

  • Palabras cercanas semánticamente, como perro y gato, generan resultados relacionados.
  • Palabras más lejanas, como perro y banana, producirán resultados significativamente distintos.

Este conocimiento te permitirá mejorar la calidad en los resultados obtenidos cuando interactúas con herramientas de inteligencia artificial.

Invito a comentar si alguna vez habías considerado esta manera de entender el funcionamiento de estas herramientas tan presentes en nuestro día a día.