Hace unos días vengo preparando este programa que sirve para ayudar a pasar un PDF a EPUB encargándose del trabajo mas tedioso que es extraer el texto y la imágenes y generar el código xhtml.
La operación es la siguiente:
1) Abrir un archivo PDF
2) Leer todo el documento
3) Editar los metadatos del "futuro" epub.
4) Guardarlo como EPUB
El programa esta preparado para PDF de "texto" y también para los de origen escaneado, pero debe ser nítido y de buena calidad, caso contrario el ocr es mediocre. De momento no efectué pruebas con este tipo de PDF, los de escaneo.
Si todo va bien, es decir que tienen todas la dependencias [1] instaladas, se abrira el EPUB con vuestro editor o lector de EPUB por defecto.
[1] imagemagick texlive-extra-utils mupdf-tools sigil poppeler-utils ghostscript tesseract-ocr tesseract-ocr-spa
Bueno es una etapa bastante preliminar así que agradeceré cualquier comentario o detección de errores para mejorarlo.ç
Saludos.
ebook-optimizer-0.0.9.tar.gz | ||
Descripción: | Descargar |
|
Nombre del archivo: | ebook-optimizer-0.0.9.tar.gz | |
Tamaño: | 59.57 KB | |
Descargado: | 30 veces |
ebook-optimizer-0.0.9.tar.gz | ||
Descripción: | Descargar |
|
Nombre del archivo: | ebook-optimizer-0.0.9.tar.gz | |
Tamaño: | 59.57 KB | |
Descargado: | 30 veces |
ebook-optimizer-0.0.9.tar.gz | ||
Descripción: | Descargar |
|
Nombre del archivo: | ebook-optimizer-0.0.9.tar.gz | |
Tamaño: | 59.57 KB | |
Descargado: | 30 veces |