В этом посте приведен пример сценария для чтения множества отдельных страниц и создания многостраничного PDF. Cuneiform сама по себе не создает многостраничных документов. Как извлечь текст с помощью OCR из PDF в Linux?
Как извлечь текст из PDF-файла на основе изображений, используя Cuneiform в терминале
903
codezombie
клинопись -l рус -f текст -o outocr.txt input.pdf
Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я использую Fedora Linux 25 (x86_64).
1 ответ на вопрос
2
gantner
Похожие вопросы
-
9
В чем разница между командами "su -s" и "sudo -s"?
-
14
PDF Viewer в Windows
-
4
Требуется хороший бесплатный образ Ubuntu Server VMWare
-
-
8
Firefox PDF плагин для просмотра PDF в браузере на Windows
-
4
Каковы различия между основными дистрибутивами Linux? Я замечу?
-
2
Ограничить использование процессора для Flash в Firefox?
-
2
Как мне заставить мой микрофон работать под Debian GNOME?
-
2
Конки установки - образцы / идеи?
-
3
Каковы различия между оконными менеджерами Linux?
-
2
ThunderBird / Синхронизация освещения с SE k770i