Para llegar a tener el chat funcionando se hizo lo siguiente:
- Se comenzó guartdando la documentación en una base de datos, cada uno de los archivos en un json.
- Se importaron estos json en formato de documents de LangChain uno por uno.
- Despues se crearon más documents a partir de los datos previous para partir la data en pequeños textos.
- Se convirtieron estos fragmentos de texto en números utilizando embbedings
- Los fragmentos anteriores se guardan en una base de datos vectorial como chrome
- Esta base se convierte a un retriever para poder obtener los fragmentos de texto que más se parecen a la pregunta.
Con todo esto se crea una cadena (retriever, query a resolver y un modelo).
El proceso se resumirÃa en que el query (pregunta) ingresado es recibido por un modelo de chat (open ai) y va a buscar en la base de datos de chroma cuales son los fragmentos de texto que podrÃan resolver la duda.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?