Configuración de OpenAI en N8N para análisis OCR de imágenes

Clase 6 de 16Curso de N8N

Resumen

Lograr que un archivo binario sea interpretado como texto plano utilizando inteligencia artificial es clave para automatizar tareas y proyectos digitales. A continuación encontrarás el proceso detallado para hacer dicha transformación fácilmente usando la plataforma OpenAI y N8N.

¿Cómo configurar la API key en OpenAI?

El primer paso esencial implica preparar tu entorno configurando una API key válida para comunicarte con OpenAI. Estos son los pasos claves:

  1. Ingresa a la página de OpenAI (platform.openAI.com).
  2. Para nuevos usuarios, crear una cuenta con un correo electrónico nuevo proporciona créditos iniciales útiles para hacer pruebas.
  3. En la esquina superior derecha, encuentra la opción API key y genera tu secret key.
  4. Una vez obtenida, regresa a N8N para configurar las credenciales necesarias.

Ya con estos pasos completos, tu conexión entre N8N y OpenAI estará preparada para recibir y analizar información.

¿Cómo analizar imágenes con OpenAI desde N8N?

Para que la inteligencia artificial pueda analizar y convertir imágenes, configura el nodo correspondiente siguiendo estas sencillas instrucciones:

  • En N8N, haz clic en el símbolo de más (+) ubicado en la parte superior derecha.
  • Escribe OpenAI en la búsqueda.
  • Selecciona la acción (Actions > Image actions) y luego Analyze an image.
  • Configura credenciales previamente generadas.
  • Coloca las siguientes opciones:
  • Resource: Image
  • Operation: Analyze Image
  • Model: GPT-ForO (seleccionado por su eficiencia en costos)

Finalmente, el campo text input necesita un prompt específico para análisis OCR (fecha, monto, glossa, proveedor y empresa). Este prompt será proporcionado en las notas de sesión y debe generar una respuesta final en formato JSON.

¿Cómo convertir resultados JSON a texto plano en N8N?

Luego de obtener el análisis en formato JSON, convierte fácilmente esta información a texto plano mediante el nodo llamado Edit fields en N8N:

  • Haz clic nuevamente en el símbolo de más (+) superior derecho.
  • Busca Edit fields.
  • Selecciona Manual mapping.
  • En la opción rack input fields here, asigna un nombre identificador como "foto telegram".
  • Deja el tipo como string.
  • En el campo valor, ingresa la expresión en formato JSON:
{{JSON.content}}

Con estos pasos, tu contenido JSON se convierte directamente en texto plano, facilitando posteriores análisis o procesos automatizados en distintos entornos digitales.

Este proceso detallado permite claramente transformar imágenes binarias en contenidos útiles utilizando el poder de OpenAI y la flexibilidad de la plataforma automatizadora N8N. ¿Te ha resultado sencillo seguir estos pasos? ¡Comparte cualquier duda o experiencia en los comentarios!