[pyar] Generar pdf de archivos .doc .docx .xls .xlsx

Francisco J Capdevila fjcapdevila en gmail.com
Vie Mayo 4 17:23:44 -03 2018


Hace algunos años implementamos (con Nahuel Defossé a.k.a D3f0) algo
parecido a lo que menciona Javier. Primero intentamos usando Libreoffice a
pelo, como menciona Javier. Luego terminamos usando unoconv[0], que es una
especie de wrapper que corre Libreoffice por detrás.
Uno de los mayores problemas ocurría cuando convertíamos más de un
documento a la vez. En aquellos tiempos había un bug en Libreoffice (que
dudo que hayan solucionado) que hacía crashear a Libreoffice si se
convertían dos o más documento en simultaneo.
En nuestro caso teníamos que convertir decenas de miles de documentos y no
era viable hacerlo en serie. Para poder paralelizar usamos Celery como cola
de tareas y teníamos N workers que corrían dentro de contenedores Docker
con unoconv + libreoffice-headless. De esa forma podíamos convertir N
documentos a la vez.

Pregunta: Realmente necesitas convertir el documento de
doc/docx/odt/loquesea a PDF? No podés generarlo directamente en PDF?
En nuestro caso no era una opción, pero nos hubiese ahorrado varios dolores
de cabeza.


Francisco J. Capdevila

[0] https://github.com/dagwieers/unoconv


El vie., 4 may. 2018 a las 17:08, Luis Andraschnik (<
luis.andraschnik en gmail.com>) escribió:

> Gracias Javier!
>
> Tenés idea si se puede embeber libreoffce en Python ?
> Tenés que tener una instalación completa o funciona stand-alone?
>
> Salut2
>
> El 4 de mayo de 2018, 17:05, Javier Pepe <javierpepe en gmail.com> escribió:
>
>> Hola
>>
>> En python directamente no encontre, pero lo que podes usar es libreoffice
>> desde linea de comandos:
>> libreoffice --headless --invisible --convert-to pdf file.doc  --outdir
>> /tmp/
>>
>> Te toma todos los formatos que puede abrir el libreoffice.
>>
>>
>>
>> El vie., 4 de may. de 2018 a la(s) 17:02, Luis Andraschnik (
>> luis.andraschnik en gmail.com) escribió:
>>
>>> Hola Grupo!
>>>
>>> Saben si existe alguna librería en python para generar pdf de documentos
>>> de office??
>>>
>>> Existe utilidades para manipular o extraer datos pero no vi nada de
>>> generar pdf
>>>
>>> Gracias!
>>> Luis
>>>
>>>
>>>
>>>
>>> <https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail> Libre
>>> de virus. www.avast.com
>>> <https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
>>> <#m_-4579822071872747224_m_7858188253093799055_m_-1648547959421694218_m_-3505654927131166870_DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>
>>> _______________________________________________
>>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>>> Sitio web: http://www.python.org.ar/
>>>
>>> Para administrar la lista (o desuscribirse) entrar a
>>> http://listas.python.org.ar/listinfo/pyar
>>>
>>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>>> Argentina - http://www.usla.org.ar
>>
>>
>> _______________________________________________
>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>> Sitio web: http://www.python.org.ar/
>>
>> Para administrar la lista (o desuscribirse) entrar a
>> http://listas.python.org.ar/listinfo/pyar
>>
>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>> Argentina - http://www.usla.org.ar
>>
>
> _______________________________________________
> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
> Sitio web: http://www.python.org.ar/
>
> Para administrar la lista (o desuscribirse) entrar a
> http://listas.python.org.ar/listinfo/pyar
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20180504/0ab8e2b2/attachment-0001.html>


Más información sobre la lista de distribución pyar