¿Cuántos tokens/palabras emplea la lectura de documentos PDF? ¿Hay alguna medición diferente para los tokens al leer los documentos con o...

César Piña M.

César Piña M.

Pregunta
student
hace 2 años

¿Cuántos tokens/palabras emplea la lectura de documentos PDF? ¿Hay alguna medición diferente para los tokens al leer los documentos con o sin imágenes o incluso el tamaño de los documentos?

2 respuestas
    Anibal Rojas

    Anibal Rojas

    teacher
    hace 2 años

    Uy, excelente pregunta! Para la que no tengo una respuesta exacta, no conseguí documentación. Yo lo analizo así: El PDF no pasa directamente al LLM sino que es procesado primero y el texto es extraído. En mi experiencia, las imágenes en un PDF no son procesadas antes por un modelo de visión.

    César Piña M.

    César Piña M.

    student
    hace 2 años

    Profe, ¿entonces al ser extraídas las palabras del Doc. estas consumen los mismos tokens que si se tratase de un texto plano empleado en el chat directo con GPT? Ojalá pronto nos explique OpenAI en su documentación el tema de los tokens con el procesamiento y análisis de documentos. Un saludo!!

Curso de ChatGPT

Curso de ChatGPT

Utiliza ChatGPT para analizar datos, crear textos, imágenes y asistentes personalizados. Aprende a estructurar prompts efectivos, limpiar información y adaptar la herramienta a tu trabajo y dispositivos.

Curso de ChatGPT
Curso de ChatGPT

Curso de ChatGPT

Utiliza ChatGPT para analizar datos, crear textos, imágenes y asistentes personalizados. Aprende a estructurar prompts efectivos, limpiar información y adaptar la herramienta a tu trabajo y dispositivos.