1

Convierte imagen a texto ¡usando inteligencia artificial!.

Hola!
Seguro alguna vez has necesitado transcribir muchísimo texto desde una imagen o un vídeo a texto plano… ojalá hubiera una forma de automatizarlo. Bueno, de hecho sí la hay y es muy sencillo; sobretodo ahora que completaste tu curso de introducción a la terminal. En este tutorial te enseñaré a hacer un script con el cual tomarás una captura de pantalla y convertirás los gráficos a texto, usando inteligencia artificial!
Comencemos:
Lo primero es instalar las dependencias que necesitaremos:

  • tesseract es un software de open source que en pocas palabras convertirá la imagen que le pasemos como parámetro en texto.
sudo apt install tesseract-ocr
  • También necesitamos el paquete lenguaje, indispensable para que tesseract funcione con el lenguaje que uses, acá pondremos inglés, alternativamente puedes descargarlos todos.
sudo apt install tesseract-ocr-eng 
sudo apt install tesseract-ocr-all #tambien puedes simplemente instalarlso todos
  • Ahora la utilidad para tomar la captura de pantalla, (uso esta porque fue más facil para que funcionara el script, si puedes hacerlo funcionar con otra, me encantaría ver como lo hiciste!)
sudo apt install tesseract-ocr-eng

-xclip, con esta utilidad usamos de manera dinámica el portapeles de nuestro pc. ctrl+c ctrl+v desde la terminal.

sudo apt install xclip

¡Perfecto! Ya estamos listos para hacer nuestro script, es muy sencillo:

#!/bin/bash
maim -squ post.png
      tesseract -l spa post.png post &&
      sed -i '$d' post.txt &&
      sed '$ s/.$//' post.txt &&
      cat post.txt | xclip -selection clipboard

Ahora solo tienes que cambiar los permisos del archivo para que sea ejectuable y si gustas asignarlo a una hotkey en tu teclado para ser mucho más productivo.

Escribe tu comentario
+ 2