Как открыть PDF-файлы в LibreOffice Writer, а не в Draw?

6752
einpoklum

Некоторые веб-сайты предлагают конвертацию файлов PDF в файлы DOCX или ODT; и я думаю, что Adobe Acrobat (по крайней мере, полная версия) предлагает функциональность экспорта во все виды форматов. Но в LibreOffice, если я открываю PDF-файлы, он открывается в Draw. Теперь ничья хороша не всегда.

Итак, могу ли я как-то открыть PDF-файлы в документе LO Writer?

Примечание: меня, очевидно, интересуют PDF-файлы, которые можно на законных основаниях воспринимать как документы Writer, например, экспортированные из текстового процессора. Таким образом, открытие их в виде десятков кадров, разбросанных по странице, - это не то, что мне нужно. Этого можно достичь, открыв в Draw, скопировав все и вставив в Writer. Я хочу, чтобы текст был в хороших последовательных абзацах, надеюсь, с согласованными стилями (даже если синтезирован) и т. Д.

3
Очевидно, что нет прямого способа открыть PDF-документ в * Writer * или сохранить его в формате ODT из * Draw *. Однако существует множество инструментов для преобразования PDF-документов в ODT-документы, как в режиме онлайн, так и в виде отдельных приложений. Тем не менее, преобразование всегда «ненадежно», потому что PDF - это * формат описания страницы *, теряющий разрывы строк исходного документа. DrMoishe Pippik 7 лет назад 0
@DrMoishePippik: Но часто PDF - это результат преобразования / распечатки _документа_, над которым вы затем хотите поработать. Смотрите мое редактирование вопроса. Кроме того, вы предлагаете мне спросить на SR.SX? einpoklum 7 лет назад 0
Тот факт, что вы используете LibreOffice, может показаться спорным или неловким, но Word 2016 может как открывать и конвертировать файлы PDF, так и сохранять файлы в ODT. music2myear 7 лет назад 0
При конвертации из ODT в PDF многое (намеренно) теряется. Например, файл PDF может потерять все исходные символы CR / LF (символы абзаца) и добавить собственные разрывы строк в конце * каждой строки текста в документе PDF, как показано *, а не в конце параграф. DrMoishe Pippik 7 лет назад 0
@DrMoishePippik: Большая часть этого может быть легко восстановлена, и онлайн-инструменты делают это. Кроме того, PDF-файлы могут содержать метаданные, так что практически все эти материалы потеряны (но я не уверен, что LibreOffice сохраняет). einpoklum 7 лет назад 0
На самом деле, он часто не восстанавливается, а * синтезируется * посредством оптического распознавания символов (OCR), который воссоздает фактический формат абзаца на основе макета страницы. В крайнем случае это документ PDF, который не содержит текста, только * изображения * текста. OCR - единственный способ восстановить текст из такого файла. DrMoishe Pippik 7 лет назад 0
@DrMoishePippik: Я принимаю различие между восстановлением и синтезом. Тем не менее, я не говорю о сканированных изображениях, для которых требуется распознавание текста, я говорю о PDF-файлах, сгенерированных на компьютере, которые зачастую изначально были документами MS-Word или LO Writer. einpoklum 7 лет назад 0

1 ответ на вопрос

3
fixer1234

LibreOffice не имеет встроенной возможности открывать или импортировать случайные файлы PDF в документ Writer (и нет доступных расширений, которые добавляют это). Как вы заметили, его можно импортировать в Draw, а затем сохранить как ODT, но результаты оставляют желать лучшего. Несколько лет назад существовало расширение PDF Importer, которое было включено по умолчанию начиная с версии 4; это то, что теперь позволяет открывать PDF в Draw и обрабатывать гибридные PDF.

Если вы создаете PDF самостоятельно, вы можете экспортировать его из Writer как «гибридный» PDF. Это встраивает ODT копию документа в PDF. В этом случае PDF-файл можно открывать и редактировать в Writer, и все форматирование сохраняется. Гибридные PDF-файлы описаны здесь: https://wiki.documentfoundation.org/Faq/Writer/PDF_Hybrid .

В противном случае существуют сторонние приложения и веб-службы, которые преобразуют PDF-файл в формат ODT, который затем можно открыть в Writer. Вот несколько из них:

  • Online2PDF, CloudConvert, Zamzar и file-converter-online все конвертируют в PDF и из PDF для различных форматов, включая ODT.

  • Convertio также включает в себя возможность запуска распознавания текста в файле изображения PDF для восстановления документа и форматирования.

  • Сейда и Smallpdf не конвертируются в ODT, но они могут конвертировать в форматы MS Office, которые LibreOffice может открывать и использовать.

Я не пользовался всеми этими услугами, и прошло уже много лет с тех пор, как я использовал любую из них, поэтому я не могу посоветовать вам, насколько хорошо работает какая-либо из этих служб. Я подозреваю, что разные службы могут работать лучше с документами с разными характеристиками, поэтому вы можете поэкспериментировать с несколькими службами, чтобы увидеть, какая из них лучше всего работает с вашим документом.

Есть также некоторые загружаемые конверсионные приложения, некоторые бесплатные, некоторые бесплатные на ограниченном уровне, а некоторые платные. Я не использовал ни одного, поэтому не могу дать совет, но варианты легко найти с помощью поиска Google.

Итак, вы говорите, что код этих инструментов является проприетарным или, по крайней мере, не частью кодовой базы LO? einpoklum 7 лет назад 0
@einpoklum, я не уверен в причине, почему это не особенность, как в MS Office. Но, насколько я могу судить, ни один из основных бесплатных офисных пакетов с открытым исходным кодом не предлагает этого. WPS Office включает конвертацию PDF в MS Office в свой премиум-продукт, но не в бесплатную версию. fixer1234 7 лет назад 0

Похожие вопросы