Как определить перевернутые (повернутые на 180 °) страницы в файле PDF?

361
Gryph

У меня есть тысячи файлов PDF. Наш добросердечный человек, который просканировал их всех на существование, в какой-то момент застеклился, потому что некоторые отборы страниц были отсканированы вверх ногами.

Я рассчитал, что для ручного просмотра всех этих страниц потребуется 12 часов. Это не учитывает корректировку (справа также есть цифровой ярлык, бонусные баллы, если вы можете понять, как его сохранить!).

Любая помощь или понятие, в каком направлении искать, будет высоко ценится.

1

1 ответ на вопрос

2
JaredT

Если страница содержит текст, который распознает Acrobat OCR, вы можете избежать использования функции «Распознать текст», как я узнал по этой ссылке .

Из последнего поста на этой странице:

В Acrobat XI можно использовать Tools / Recognize Text / Aa In This File, который будет обрабатывать и обрабатывать страницы для распознавания текста, то есть делать его документом с возможностью поиска. Когда я делаю это на нескольких отсканированных вручную документах с перевернутыми страницами, изображение поворачивается на 180 градусов, то есть корректируется ориентация сканирования вручную.

10/10 за простое решение. Будет сообщать, если это действительно работает (даже если это медленно, как все, черт возьми). Gryph 6 лет назад 0
Подтвердил, что это работает на моем образце - который полон шума и цифр, почерка. К сожалению, он не распознает текст, который уже находится справа, и поддерживает его, даже если этот текст был применен с помощью нумерации Adobe Bates. Однако, на вопрос, который я задал, это заполняет требование 100%. Gryph 6 лет назад 0
О, облом это не работает полностью. Надеюсь, это сэкономит вам немного сил! JaredT 6 лет назад 0