Me he dado cuenta de que en linux existen pocas herramientas gráficas para OCR, y las que existen no son muy claras.
Por ello, el otro día, al utilizar tesseract por consola me dije ¿por qué no hacer un programa en gambas que haga esto por mí?
Afortunadamente, con esta herramienta esto es algo muy sencillo, así que me dispuse a ello.
Ahora está en desarrollo, pero le daré unos retoques y la publicaré para todo aquel que quiera usarla, con compatibilidad para tesseract, ocrad y gocr y a lo mejor alguna opción de configuración, aunque básico.
Me parece una herramienta muy fácil de hacer pero útil. Cualquier sugerencia será bien recibida.
Un saludo.
Editado:
Este proyecto ha sido liberado bajo GPL en Launchpad https://launchpad.net/oocr para que cualquiera pueda modificarlo, redistribuirlo, etc.
Por ahora no hace mucho, solo comprueba que los motores están instalados, y si no te los deja instalar desde el propio programa. Y luego, puedes elegir el motor, elegir el archivo y te muestra en un textarea el resultado.
Es poca cosa, pero en el futuro podría convertir al vuelo las imágenes, leer directamente de lo escaneado, tener opciones, etc.
Me gusta hacer aplicaciones que me resultan útiles porque creo que les puede resultar útiles a otros. Y creo que en Linux faltan aplicaciones que simplifiquen el proceso del reconocimiento de caracteres al usuario.
Un saludo.
Por cierto, como ya he dicho, si alguien quiere ayudar puede hacerlo directamente desde launchpad, solo tiene que decírmelo para que lo agregue.