Configuración de OpenAI en N8N para análisis OCR de imágenes
Clase 6 de 16 • Curso de N8N
Resumen
Lograr que un archivo binario sea interpretado como texto plano utilizando inteligencia artificial es clave para automatizar tareas y proyectos digitales. A continuación encontrarás el proceso detallado para hacer dicha transformación fácilmente usando la plataforma OpenAI y N8N.
¿Cómo configurar la API key en OpenAI?
El primer paso esencial implica preparar tu entorno configurando una API key válida para comunicarte con OpenAI. Estos son los pasos claves:
- Ingresa a la página de OpenAI (platform.openAI.com).
- Para nuevos usuarios, crear una cuenta con un correo electrónico nuevo proporciona créditos iniciales útiles para hacer pruebas.
- En la esquina superior derecha, encuentra la opción API key y genera tu secret key.
- Una vez obtenida, regresa a N8N para configurar las credenciales necesarias.
Ya con estos pasos completos, tu conexión entre N8N y OpenAI estará preparada para recibir y analizar información.
¿Cómo analizar imágenes con OpenAI desde N8N?
Para que la inteligencia artificial pueda analizar y convertir imágenes, configura el nodo correspondiente siguiendo estas sencillas instrucciones:
- En N8N, haz clic en el símbolo de más (+) ubicado en la parte superior derecha.
- Escribe OpenAI en la búsqueda.
- Selecciona la acción (Actions > Image actions) y luego Analyze an image.
- Configura credenciales previamente generadas.
- Coloca las siguientes opciones:
- Resource: Image
- Operation: Analyze Image
- Model: GPT-ForO (seleccionado por su eficiencia en costos)
Finalmente, el campo text input necesita un prompt específico para análisis OCR (fecha, monto, glossa, proveedor y empresa). Este prompt será proporcionado en las notas de sesión y debe generar una respuesta final en formato JSON.
¿Cómo convertir resultados JSON a texto plano en N8N?
Luego de obtener el análisis en formato JSON, convierte fácilmente esta información a texto plano mediante el nodo llamado Edit fields en N8N:
- Haz clic nuevamente en el símbolo de más (+) superior derecho.
- Busca Edit fields.
- Selecciona Manual mapping.
- En la opción rack input fields here, asigna un nombre identificador como "foto telegram".
- Deja el tipo como string.
- En el campo valor, ingresa la expresión en formato JSON:
{{JSON.content}}
Con estos pasos, tu contenido JSON se convierte directamente en texto plano, facilitando posteriores análisis o procesos automatizados en distintos entornos digitales.
Este proceso detallado permite claramente transformar imágenes binarias en contenidos útiles utilizando el poder de OpenAI y la flexibilidad de la plataforma automatizadora N8N. ¿Te ha resultado sencillo seguir estos pasos? ¡Comparte cualquier duda o experiencia en los comentarios!