HTML / PDF в DOC (X) в командной строке Linux?

13254
studiohack

Мне нужно конвертировать PDF или HTML + CSS в DOC или DOCX под Linux, это может быть из командной строки или с помощью языка сценариев.

Любая идея?

3

5 ответов на вопрос

1
Pekka 웃

Вы можете сделать это с помощью OpenOffice из командной строки. Существуют также мосты для языков сценариев - узнайте больше на сайте OpenOffice. Существует один для PHP, который называется PUNO, но у меня пока нет личного опыта.

Он очень плохо разбирает HTML, игнорируя большую часть CSS 15 лет назад 0
1
Colin Pickard

Вы можете конвертировать HTML в .doc, используя макрос OpenOffice, смотрите эту ветку:

http://www.oooforum.org/forum/viewtopic.phtml?p=44367#44367

преобразовать pdf в .doc намного сложнее из-за множества различного контента, который может быть внутри PDF - довольно часто PDF-файлы используются для таких вещей, как отсканированный текст.

1
voyager

Вы можете использовать, pdftohtmlчтобы сделать HTML-файл из PDF.

Word может открывать HTML-файлы напрямую.

0
jammypeach

Я только что наткнулся на этот вопрос и после еще немного погуглил нашел pandoc: http://johnmacfarlane.net/pandoc/README.html

Простая команда создаст файл docx или pdf (или rtf и т. Д.) Из html-ввода следующим образом:

pandoc -o output.docx input.html 

Он также может писать в стандартный вывод (с некоторыми форматами) и читать из стандартного ввода.

Не уверен, что он находится в репозиториях Debian / Ubuntu, но в репозитории epel 6 для Redhat / CentOS 6 ( yum install pandoc).

Надеюсь, это поможет кому-то :)

-1
voyager

Конвертация документов

Текущий список прошлых примеров.

Конвертировать любой тип документа в PDF

Как конвертировать слайды Powerpoint в JPEG с помощью OpenOffice API? (слайд сплиттер)

Список многих прошлых примеров конверсии

Список фильтров

Список доступных конвертеров в OOo 2.0 (1.9.x)? Инструкция по созданию списка фильтров

Рекурсивная папка HTML в PDF, Txt, SXW, DOC

Рекурсивная папка с SXD на SDC (StarCalc 5)

Настройка размера изображения для экспорта в JPEG

Конвертация Xcel в Calc с использованием API

Очень похожий, преобразование Xcel в текст

Пакетный режим конвертации

Конвертация документов

VB: преобразование файлов Excel в текстовые файлы

Общие документы Visual Basic преобразования текста ...

Преобразование Word -> PDF из командной строки http://www.oooforum.org/forum/viewtopic.php?t=3772 http://www.oooforum.org/forum/viewtopic.php?t=5513 http: / /www.oooforum.org/forum/viewtopic.php?t=3768

Инструмент PyOpenOffice для конвертации SXW в PDF без использования OOo

Конвертировать Word -> Writer из командной строки

Конвертировать Excel -> PDF из командной строки

http://www.oooforum.org/forum/viewtopic.php?t=5596 http://www.oooforum.org/forum/viewtopic.php?p=21050#21050

Конвертировать SXC в CSV из командной строки

Конвертировать PPT в HTML из командной строки ...

Конвертировать PPT в HTML короткий пример ...

Конвертировать PPT в PDF короткий пример ...

смотри хвост конца нити ...

Конвертирование SXW -> PDF

Рисовать экспорт в PDF

В Python ...

Тема о преобразовании документа в PDF в Java

Конвертируйте SXW в DOC с помощью Java
http://www.oooforum.org/forum/viewtopic.phtml?p=81846#81846

Я написал конвертер пакетных документов
http://www.oooforum.org/forum/viewtopic.php?t=3525 http://www.oooforum.org/forum/viewtopic.php?t=2810 http: // www. oooforum.org/forum/viewtopic.php?p=10311#10311 вы можете получить его здесь
http://www.ooomacros.org/user.php#95532 подробнее об этом здесь ...
http: //www.oooforum .org / форум / viewtopic.php? Т = 5708

Макрос для сохранения в трех форматах
http://www.oooforum.org/forum/viewtopic.php?t=3612 Макрос для сохранения резервных копий с отметками времени
http://www.oooforum.org/forum/viewtopic.php?t=7674

Откройте HTML с Writer, а не через Интернет, чтобы экспортировать
http://www.oooforum.org/forum/viewtopic.php?t=3973 http://www.oooforum.org/forum/viewtopic.php?p=44367#44367
Как преобразовать HTML в OpenOffice File?
http://www.oooforum.org/forum/viewtopic.php?t=11580
pblm размера страницы при преобразовании HTML в PDF
http://www.oooforum.org/forum/viewtopic.phtml?p=63682#63682

Обсуждение, которое заканчивается в утилите DocConverter.
http://www.oooforum.org/forum/viewtopic.php?t=2668

Конвертировать DBF в XLS, SXC, PDF и HTML
http://www.oooforum.org/forum/viewtopic.php?t=5728

Хороший пример кода Visual Basic ... преобразование документов
http://www.oooforum.org/forum/viewtopic.php?t=7673

Рисование экспорта и печати
http://www.oooforum.org/forum/viewtopic.php?t=3620

Использование исходного кода OOo для чтения / преобразования / записи документов в форматах, поддерживаемых его фильтрами. http://www.oooforum.org/forum/viewtopic.php?t=5785

у меня никто не работает 15 лет назад 0

Похожие вопросы