Как искать и выделять длинные отрывки в файле PDF?

1139
flen

Я сделал несколько основных моментов на Kindle Touch для файлов PDF. Kindle сохраняет выделенный текст в отдельном файле, а не в самих PDF-файлах. У меня есть весь текст отрывков, которые я хочу выделить, что мне нужно: программа, которая может найти длинные фразы, а затем выделить эти фразы. Таким образом, я могу построить макрос для этой программы, чтобы сделать цикл и делать это для всех моих текстовых отрывков.

Я пробовал Adobe Acrobat XI, но у Acrobat есть ограничение на количество слов, которые я могу найти (~ 28 символов). Я знаю, что могу разделить основные моменты, но для меня важно не делать этого. Итак, мои вопросы:

  1. Есть ли программное обеспечение, которое может сделать это? (Найдите длинную строку и, найдя ее, выделите ее и сохраните измененный PDF-файл?)

  2. У Acrobat есть консоль JavaScript, может кто-нибудь, кто подкован, предложить мне скрипт для этого? (Я могу написать какой-то очень простой Python, но без Java / JavaScript)

Я на Windows 7 Ultimate x64

Спасибо!

2
В качестве обходного пути можно использовать инструмент «Редакция», возможно, с использованием пользовательских регулярных выражений (вы можете настроить его в Acrobat, но это немного не так), а затем заменить аннотации «Редакция» обычными аннотациями Highlight. В качестве альтернативы вы можете использовать Redax от Appligent, который позволяет добавлять регулярные выражения через пользовательский интерфейс. Max Wyss 9 лет назад 0
Спасибо за ваше предложение! Ваше решение имеет то преимущество, что позволяет осуществлять поиск по 256 символам, но не более: / по крайней мере, это то, что я нашел при поиске изменений. Хотя это уже улучшение, я хотел что-то, что позволило бы осуществлять полный поиск по абзацу (> 400 символов) или, в идеале, без ограничений на символы flen 9 лет назад 0

1 ответ на вопрос

0
Ramiro

В Adobe Acrobat PRO X есть возможность добавить действие, вызываемое для выделения. Он использует параметр выделения и редактирования, но вместо того, чтобы редактировать найденный текст, он заменяет его подсветкой. Я попробовал это с файлом Kindle clippings.txt, и он работает как шарм. Я ненавижу ADOBE, хотя, поэтому я пытаюсь найти подобное решение для другого PDF-ридера.

Два парня создали AppleScript для программы чтения Mac OS X Skim PDF (которую я люблю), но я не мог заставить их работать. Я исследую это возможное решение в другом вопросе. Файл действий для ADOBE имеет расширение .sequ. Я не могу найти это сейчас в Google, но я знаю, что это там. К сожалению, я переименовал файл, поэтому не могу точно указать его источник.

Для проектов GitHub для Skim, см.

мои вырезки-в-PDF

Обезжиренное-AppleScript

Спасибо, но я пользователь Windows ... Я изучил Javascript и JS API Acrobat и написал себе скрипт для Acrobat Pro XI, который может это сделать. Это требует некоторой полировки, и я очень занят прямо сейчас, но в следующие месяцы я намереваюсь поместить это здесь. Если вам интересно, PM me, и я передам вам предварительную версию (это может искать только неограниченный текст на данной странице (то есть, если текст растягивается на 2 или более страниц, он не найдет его), но будет искать все страницы. Мне нужно улучшить его, чтобы снять это ограничение) flen 8 лет назад 0

Похожие вопросы