Tema ebook - convertir pdf a otro formato mas manejable

No, yo utilizo Calibre y me armo de paciencia cuando voy a leer. Después de 40 minutos ya te has acostumbrado a que el texto esté sin justificar y has asimilado las erratas más comunes (dos palabras juntas, palabras separadas que no deberían estarlo, separaciones con guiones en mitad de línea o confusión de letras gráficamente parecidas).

Todo eso te lo evitas con el método que he expuesto. Te lo digo por experiencia propia.
 
Todo eso te lo evitas con el método que he expuesto. Te lo digo por experiencia propia.

Ekritt, necesito un poco de ayuda que estoy muy verde todavía.

He seguido todos los pasos que has dicho pero el resultado es un pequeño aborto :roto2:

Tengo espaciados sin motivo, la última letra de cada frase cortada, puesta en un punto y aparte, y nada más en esa línea hasta la siguiente que vuelve a repetir lo ya descrito.

Tambie´n se me han ido al carajo las sangrías, los márgenes y la alineación justificada. ¿Todo esto es normal o es que soy un zoquete y lo he convertido mal?
 
Ekritt, necesito un poco de ayuda que estoy muy verde todavía.

He seguido todos los pasos que has dicho pero el resultado es un pequeño aborto :roto2:

Tengo espaciados sin motivo, la última letra de cada frase cortada, puesta en un punto y aparte, y nada más en esa línea hasta la siguiente que vuelve a repetir lo ya descrito.

Tambie´n se me han ido al carajo las sangrías, los márgenes y la alineación justificada. ¿Todo esto es normal o es que soy un zoquete y lo he convertido mal?

Todo depende, claro, del tipo de libro de que hablemos. Si has seleccionado un libro con fotos, columnas, y cosas raras, entonces puede ser normal lo que pasa. Si es un libro de solo texto, normal y corriente, entonces no.

Si conviertes directamente el pdf a mobi o epub en el calibre, puede que te quede de esa manera, porque en el pdf al final de cada linea le ponen un salto de linea. Luego al convertirlo a mobi eso se traslada en sangrias raras y justificaciones raras también.

El mobipocket te resuelve eso, te deja el pdf traducido a html, sin saltos de linea raros.

Si antes has usado el briss, te habrás eliminado toda la paginación y todo el encabezado que se repite en cada página.
 
Para ser exactos, se trata de este pdf.

http://www.integralbook.com/wp-cont...l_.Mundo_.de_.los_.Sue_os.Lucidos.Spanish.pdf

Sí que puede tener unos márgenes y unas sangrías un poco raritas, pero la mitad del texto se ve como una página normal (en pdf) y en el kindle de pena.

Fotos me parece que tiene 3 o 4.

Sí, antes usé el briss. Igual sería una opción no utilizarlo y pasar directamente del mobipocket al calibre. No sé. ¿Qué me sugieres?

Edito para actualizar: He probado a mandar el documento pdf directamente, y aunque no puedo cambiar el tamaño de la fuente (se ve un poco pequeñito para mi gusto) y pierdo las funciones de número de página y navegación por el texto, se ve por lo general de maravilla. No entiendo nada.
 
Última edición:
Ese libro siguiendo 'mis' pasos te queda de cine.

No te saltes ningún paso. Tiene pies de paginas con la paginación, si no usas briss te quedará fatal.
 
Pues lo he hecho paso a paso y el resultado ha sido nefasto. Evidentemente algo habré hecho mal. A ver, repito y describo lo que hago.

1) Abro briss, cargo el libro, le doy a cancel para que no me elimine la portada, y sin tocar nada de lo que me aparece -me refiero a los rectángulos azules- lo guardo.

2) Abro mobipocket creator, cargo el archivo (dejo el idioma en español y la codificacion western 1252). Después le doy a "build", compresión standar y sin encriptar. Se me crea una carpeta con una buena colección de archivos en ella.

3) Abro el calibre. En lugar de seleccionar un directorio con todos esos archivos (que tengo opción a ello o eso me dice), selecciono nada más que el html. De ahí le doy a convertir libro. No toco nada de la configuración y me limito a darle a aceptar. Me salen tres archivos, mobi, metadata.opf y un zip.

4) Paso el mobi al kindle y cosecho los resultados. Fracaso total y visualizado esperpéntico...
 
Yo utilizo el ABBY pdf converter.

Es una especie de OCR sobre pdf (si no es un pdf escaneado directamente "lee" los caracteres) y me lo convierte a un archivo . doc (word), y de ahí al formato que quiera. Con el Sigil edito (e.g. si quiero añadir un ínfice o T.O.C.) y con el Calibre lo convierto al formato que quiera.

Lo bueno que tiene el programa de OCR es que puedo escoger lo que quiero capturar seleccionando porciones de cada página, diferenciando entre columnas de texto, gráficos y tablas en el orden que especifique sin que se equivoque interpretando texto de imágenes y tablas.

Es un poco laborioso, pero la edición se simplifica mucho y quedan muy bien.

Los pasos serían:

1. PDF a DOC con el ABBY en mi caso.
2. Edito el DOC y guardo como página web (HTML)
3. Edito el HTM con el Sigil para añadirle la TOC (índice y saltos de página) y guardo como EPUB.
4. Si necesito convertirlo a otro formato utilizo el Calibre.
 
Yo utilizo el ABBY pdf converter.

Es una especie de OCR sobre pdf (si no es un pdf escaneado directamente "lee" los caracteres) y me lo convierte a un archivo . doc (word), y de ahí al formato que quiera. Con el Sigil edito (e.g. si quiero añadir un ínfice o T.O.C.) y con el Calibre lo convierto al formato que quiera.

Lo bueno que tiene el programa de OCR es que puedo escoger lo que quiero capturar seleccionando porciones de cada página, diferenciando entre columnas de texto, gráficos y tablas en el orden que especifique sin que se equivoque interpretando texto de imágenes y tablas.

Es un poco laborioso, pero la edición se simplifica mucho y quedan muy bien.

Los pasos serían:

1. PDF a DOC con el ABBY en mi caso.
2. Edito el DOC y guardo como página web (HTML)
3. Edito el HTM con el Sigil para añadirle la TOC (índice y saltos de página) y guardo como EPUB.
4. Si necesito convertirlo a otro formato utilizo el Calibre.

Yo he hecho un proceso parecido:
1. He descargado el libro de Stephen Laberge en pdf
2. Con briss le he quitado el pie de página con el número
3. Lo he pasado a word, pero en mi caso con el programa nuance pdf profesional
4. En word he unificado el tipo y tamaño de fuente y el espaciado entre líneas. Además con la herramienta reemplazar he eliminado todos los guiones como L tumbada.
5. Lo he pasado a epub con el programa sigil.
6. Lo he pasado a mobi con calibre.

El resultado es el siguiente:
suenyos-lucidos-stephen-la-berge.rar

Faltaría arreglar los saltos de página, pero eso ya habría que hacerlo de forma manual.
 
Pues lo he hecho paso a paso y el resultado ha sido nefasto. Evidentemente algo habré hecho mal. A ver, repito y describo lo que hago.

1) Abro briss, cargo el libro, le doy a cancel para que no me elimine la portada, y sin tocar nada de lo que me aparece -me refiero a los rectángulos azules- lo guardo.

2) Abro mobipocket creator, cargo el archivo (dejo el idioma en español y la codificacion western 1252). Después le doy a "build", compresión standar y sin encriptar. Se me crea una carpeta con una buena colección de archivos en ella.

3) Abro el calibre. En lugar de seleccionar un directorio con todos esos archivos (que tengo opción a ello o eso me dice), selecciono nada más que el html. De ahí le doy a convertir libro. No toco nada de la configuración y me limito a darle a aceptar. Me salen tres archivos, mobi, metadata.opf y un zip.

4) Paso el mobi al kindle y cosecho los resultados. Fracaso total y visualizado esperpéntico...

En el mobipocket dejalo todo como está por defecto: 'afrikkaans e international'.

El resultado se puede leer, pero no es fantástico, tienes razón. Siguen saliendo saltos de linea raros y algunas palabras las corta en dos lineas.

Es el primer libro en el que me sucede algo así.
 
Le pego un UP a este tema porque me estoy volviendo loco.

1. PDF a DOC con el ABBY en mi caso.
2. Edito el DOC y guardo como página web (HTML)
3. Edito el HTM con el Sigil para añadirle la TOC (índice y saltos de página) y guardo como EPUB.
4. Si necesito convertirlo a otro formato utilizo el Calibre.

Me he bajado el Abby (que por cierto, maravilla de programa), pero estoy atrancado en el paso 2 porque lo que me guarda es una aberración (si bien es cierto, que como estaba trasteando no he editado al 100% el texto en doc).

También la portada del archivo PDF previamente cortada con briss para que quedara bien, me la joroba y me la gira Abby, no sé por qué. ¿Hay alguna forma de editar la página? (me refiero a eliminarla, diseñar una y agregarla después).

¿Cómo se utiliza el sigil para agregar un índice y que lo relacione con las páginas?

Y ya por último, ¿Es estrictamente necesario pasarlo a html y de ahí a mobi/epub? ¿No se puede hacer directamente desde docx?
 
Aquí os dejo otro: Willus.com's K2pdfopt

Éste está pensado sobre todo para pasar PDFs escritos a varias columnas a una sola. La pega es que de inmediato no tiene nada (al menos en Linux), te tienes que poner un rato hasta que das con la configuración que le va bien a tu PDF. A cambio, puedes modificar al detalle un montón de parámetros.
 
Volver