Saludos a todos! Después de unas vacaciones intempestivas y tempestuosas...
Celebro que
pedete haya presentado el ScanTailor en el foro, y que ya esté siendo aprovechado. Un gran programita. Lo hallé hace un mes, buscando una manera eficaz de hacer alguna "postproducción" a las páginas escaneadas, que usé "crudas" en los primeros eBooks que armé y compartí hace meses, y ante los cuales quedé muy disconforme: muy pesados, imprácticos para leer e imprimir... Lo utilicé a lo largo del mes de julio, con otros eBooks que ya toca compartir, y ahora estoy menos disconforme.
Gracias
pedete por todas las útiles observaciones. Coincido en que hacer el proceso de OCR es muy útil y necesario, pero usar el Acrobat para el OCR, no me parece una buena opción; según mis pruebas, por mucho, más eficaz es el Abbyy FineReader. Los resultados que da con libros impresos toscamente o disparejos, o incluso con fotocopias pobres, sorprenden positivamente, incluso a 300 DPI. Tenía una versión gratuita del Sprint 6 que vino con un escáner, pero no soportaba los tifs servidos por el ScanTailor. Después de varias, varias, pruebas y errores (interfaces en cirílico puro, cracks inválidos o infectados) hallé una versión del AbbyyFineReader 9 que es instalar y usar, y corre con total estabilidad. Se descarga por torrent,
en esta página de The Pirate Bay.Entonces, yo lo veo así: ScanTailor para procesar las páginas escaneadas; AbbyFineReader para pasar el OCR y crear un PDF con los TIFS del ScanTailor; el Acrobat para reemplazar las páginas fallidas, crear bookmarks...
También prefiero usar el Acrobat para las portadas, las comprime muy bien, de manera automática: suelto un TIF de 12 megas y me da una página PDF de 400 KB, que no se ve mal y puedo añadir al PDF principal.
@
HerrK: si te haces con el FineReader, podrías cargarle también el PDF del libro de Albiac para practicarle el OCR, y verás que los resultados son más que útiles. A 600 dpi como está, dará pocos errores y permitirá que una larga cita no tenga que ser copiada tecleando. Para ese u otro libro, lo recomendable es marcar la opción "Thorough Reading", menos rápida y más precisa. Salud!