Новые вопросы с тегом «ocr»

Всего найдено 159 вопросов

0
голосов
0
ответов
362
просмотра

Ошибка в обучении Тессеракта с jTessBoxEditor

Я объединил около 50 изображений в один файл .tif с помощью jTessBoxEditor (Linux), но когда я пытаюсь получить файл .box с этим кодом: tesseract mjchar.tif mjchar -l eng --psm 10 batch.nochop makebox произошла ошибка: Tesseract Open Source OCR Engine v4.0.0-beta.1 с Leptonica Ошибка в findFileFo...
спросил J.C.Liu 5 лет назад

0
голосов
0
ответов
357
просмотров

Как отсортировать и упорядочить большое количество изображений и инфографики, которые содержат объем текста?

Мне нужно отсортировать большое количество графиков, инфографики по «темам», годам и т. Д. Я перепробовал много программ для этого - классическая версия lightroom и версия CC, которая имеет AI и машинное обучение, но не распознает текст. Digikam может распознавать только лица и находить по цветам,...
спросил 5 лет назад

-1
голосов
0
ответов
400
просмотров

Кто-нибудь знает, что означают различные цвета после использования OCR в Google Docs?

Документы Google при использовании OCR на изображении преобразуют документ в текст. Однако текст - это разные цвета на спектре. Кто-нибудь знает, почему разные цвета создаются для разного текста? Вот пример изображения, которое я использую. https://ibb.co/9s1Dz0W
спросил John Thompson 5 лет назад

0
голосов
0
ответов
397
просмотров

Почему я не могу запустить Acrobat ClearScan OCR для PDF после удаления текстового слоя?

Даже после того, как я удалю скрытый текст (через «Удалить скрытый»), я все еще не могу запустить OCR с «ClearScan» (то есть «Редактируемый текст и изображения»). Это странно, потому что текстовый слой, по-видимому, исчез, но при запуске OCR выдается ошибка «Acrobat не может выполнить распознавание,...
спросил user1125483 6 лет назад

0
голосов
0
ответов
365
просмотров

Разбиение изображения текста на слова - возможно ли это?

Мне интересно, есть ли способ разделить отсканированную копию страницы (то есть изображение) на изображения составляющих ее слов. Сканируемая книга написана на индийском языке, для которого OCR (оптическое распознавание символов) не будет работать. Цель состоит в том, чтобы иметь цифровую версию кни...
спросил user1993 6 лет назад

0
голосов
1
ответ
789
просмотров

AutoHock для поиска изображений

Я изучаю, как использовать autohotkey, и я хотел создать скрипт, который открывает игру из Steam и автоматически подключается к определенному серверу. Мой код до сих пор: F1:: Run, steam://rungameid/346110 Sleep, 15000 <--- This is more or less the time that my computer takes to load it, and I wa...
спросил J0ki 6 лет назад

0
голосов
0
ответов
267
просмотров

Вставить PDF в Word, и он все еще доступен для поиска?

Когда я вставляю pdf-файл в Word, он выглядит как изображение еще после того, как OCR обработал документ. Если я иду в строку инструментов и использую «Вставить»> Объект> Текст из файла. Я получаю все из текста и картинок, но не так, как PDF-документ. PDF документ находится на одной стороне,...
спросил Pepsi111 6 лет назад

1
голосов
0
ответов
732
просмотра

Будет ли извлекать жестко запрограммированные субтитры, как эта работа?

У меня есть mp4 с жестко закодированными субтитрами, и я хочу сделать файл SRT. Я попытался использовать программное обеспечение для распознавания видео AviSub. Время было правильным, но само слово было очень неточным, поэтому я получил файл SRT, который выглядит так: 1 00:01:22,277 --> 00:01:27,...
спросил chicago1356 6 лет назад

31
голосов
4
ответа
5076
просмотров

Как создать PDF с отсканированными страницами, но выбрать текст?

Сегодня я получил PDF от нашего поставщика, и он содержал несколько напечатанных и отсканированных страниц с подписями и т. Д. Я открыл его в Acrobat Reader DC. Но, к моему удивлению, текст из явно отсканированных изображений можно было выбрать и скопировать как текст. Смотрите скриншот: Очевидно,...
спросил Vojtěch Dohnal 6 лет назад

2
голосов
1
ответ
371
просмотр

Каков наилучший метод для работы с текстом JPEG?

У меня относительно простая графика; техническая схема с различными частями текста. Текст на другом языке (чешский / словацкий). Он напечатан достаточно четко, чтобы его можно было точно распознать и интерпретировать с помощью (Android) распознавания Google Translate. В любом случае, я хотел бы заме...
спросил tjt263 6 лет назад

2
голосов
1
ответ
3072
просмотра

Общие сведения о параметрах распознавания текста в Adobe Acrobat: «Изображение с возможностью поиска», «Изображение с возможностью поиска (точное)» и «Редактируемый текст и изображения»

В Adobe Acrobat (я использую Pro DC, если это имеет значение) есть три варианта OCR: "Поиск изображений". "Доступное для поиска изображение (точное)". «Редактируемый текст и изображения». Каковы различия между этими тремя вариантами? В частности, что определяет размер выходного файла? Прямо сей...
спросил Kenny LJ 6 лет назад

0
голосов
0
ответов
842
просмотра

Как использовать Onenote 2016 в качестве OCR на ПК

* Обратите внимание, что я использую компьютер для всего этого. Я пытаюсь извлечь текст из снимка экрана, сделанного на моем компьютере, и когда я попробовал методы, предложенные в видео и перечисленной статье; Я не могу вынести текст из img Ссылки, которые я использовал для исследования: Microsoft...
спросил GoalBike 7 лет назад

0
голосов
0
ответов
302
просмотра

Извлечь текст из изображений, ocr

Извлечение текста из изображений? У меня много изображений, я искал и нашел несколько онлайн-конвертеров, но он не работает, потому что у меня есть 10.000 изображений, поэтому мне нужен массовый инструмент, может кто-нибудь помочь мне с этим, спасибо
спросил michael johns 7 лет назад

1
голосов
0
ответов
471
просмотр

Как распечатать документ с таблицей и экспортировать в текст (с правильным текстом влево / вправо / вверх / вниз)?

У меня есть документ со многими страницами, которые имеют столбчатые таблицы, подобные следующим. #1 2.1 This is some text. It can go onto the next line like this. #2 1.3 More text. #3 3.2 And some more text that goes on to the next line also. #4 2.3 And some more text. Когда я OCR документа, каже...
спросил studgeek 7 лет назад

-1
голосов
1
ответ
616
просмотров

Как я могу конвертировать .png изображение в .pdf с текстом OCR?

У меня есть файл .png, который представляет собой скриншот статьи, которую я нашел в Интернете. Я хотел бы получить его PDF-версию со всем текстом, который можно выбрать. Есть ли приложения или инструменты, которые делают это?
спросил Trindaz 7 лет назад

0
голосов
0
ответов
332
просмотра

PDF файл безумно сложен, два слоя, оптическое распознавание невозможно

Я имею дело с загадкой. У меня есть этот файл PDF, который я аннотировал и выделил. Думая, что смогу позже скопировать и вставить абзацы. Это оказалось неправильно, копирование текста невозможно. Поэтому я скачал программное обеспечение для распознавания текста «PDF Elements Pro 6». И все же по како...
спросил Arthur van Erps 7 лет назад

1
голосов
0
ответов
701
просмотр

Как автоматически определить язык текста на фотографии и перевести его

Мне удалось встроить приложение OCR для обнаружения текста по фотографии https://obserbot.com/, но оно только извлекает точный текст из фотографии и не конвертирует его на нескольких языках. Я хочу, чтобы приложение распознавало текстовый язык и автоматически переводило его на язык читателя в зависи...
спросил Abdullah Hussain 7 лет назад

1
голосов
0
ответов
394
просмотра

Извлечение PDF-данных с использованием категорированных аннотаций

Существуют ли какие-либо инструменты для извлечения данных из файлов PDF с использованием этого метода. Допустим, у меня есть 3 категории Изображение - это будет прямоугольная аннотация, которая обрежет ту конкретную область, где размещена аннотация Заголовок - это еще одна аннотация прямоугольника...
спросил bman 7 лет назад

0
голосов
1
ответ
902
просмотра

Как извлечь текст из PDF-файла на основе изображений, используя Cuneiform в терминале

клинопись -l рус -f текст -o outocr.txt input.pdf Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я использую Fedora Linux 25 (x86_64).
спросил codezombie 7 лет назад

0
голосов
1
ответ
2508
просмотров

Как я могу преобразовать банковские выписки в формате PDF в файл Excel или CSV?

Я просто делаю мою налоговую декларацию в Великобритании (Да, я оставил ее до последней минуты). Мой банк (общенациональный) разрешит мне загружать транзакции за последние 15 месяцев в виде файла CSV, но разрешит мне загружать любые выписки в формате PDF. Поэтому мне нужно использовать операторы PDF...
спросил Ian Ringrose 7 лет назад

3
голосов
3
ответа
774
просмотра

Как эффективно отсканировать 130 000 бумажных страниц за 10 дней

У меня есть довольно большой проект, который в конечном итоге принесет пользу обществу, и я ищу любую помощь, которую смогу собрать. У меня есть около 130 000 страниц, которые нужно оцифровать. Многие из них находятся в упаковках со скобами или на бумаге, которой более 40 лет (и она довольно тонкая...
спросил Gryph 7 лет назад

0
голосов
3
ответа
296
просмотров

Захват текста на странице с белым фоном от фотографии

Я намереваюсь преобразовать фотографию с текстом на странице с белым фоном в текстовый файл. Цель - захватить весь текст на этих изображениях. Я Google, и я основал imagemagick и этот инструмент: SCAN Image to TEXT Но это ли лучший вариант? Возможно ли захватить текст на фотографии? Спасибо
спросил Edgar Oliveira 7 лет назад

0
голосов
1
ответ
533
просмотра

Можно ли «откатиться» в PDF без OCR?

Я использую Automator в сочетании с Abbys Finereader для просмотра папки для новых отсканированных документов PDF. Finereader распознает документ и экспортирует его в новый PDF-файл в той же папке. Уже месяц я пользуюсь настройкой экспорта «text over page image». Руководства пользователя поясняют эт...
спросил Knob1 7 лет назад

2
голосов
1
ответ
825
просмотров

Adobe не может выполнить распознавание: эта страница больше максимального размера страницы 45 дюймов на 45 дюймов

Я попытался запустить инструмент распознавания текста в PDF и получить следующее сообщение об ошибке: Adobe не может выполнить распознавание (OCR) на этой странице, потому что: эта страница превышает максимальный размер страницы 45 дюймов на 45 дюймов. Есть ли способ обойти OCR на PDF? Я использу...
спросил Franck Dernoncourt 8 лет назад

1
голосов
1
ответ
403
просмотра

Распознавание текста на страницах, содержащих текст и изображения, в Acrobat XI Pro

Почему Acrobat XI Pro не разрешает сканирование с помощью оптического распознавания текста на страницах, содержащих как изображения, так и отображаемый текст? Образец PDF на скриншоте был создан из документа MS Word. Первая строка была напечатана; вторая строка - скриншот отдельного документа. Это к...
спросил P Fitz 8 лет назад

-1
голосов
1
ответ
633
просмотра

OCR испортил Ghostscript

В прошлом году в Ghostscript была обнаружена ошибка. Это задокументировано здесь: http://bugs.ghostscript.com/show_bug.cgi?id=696116 Помечено Статус: РАЗРЕШЕНО WONTFIX В конце концов, правопреемник Кен Шарп пишет: «К сожалению, я не вижу никаких перспектив для решения этой проблемы в Ghostscript»....
спросил Paul Bergström 8 лет назад

2
голосов
0
ответов
454
просмотра

Смешная OCR-ситуация

У меня есть отсканированный многостраничный PDF-файл с разрешением 300 точек на дюйм в системе Ubuntu 16.04. Когда я запускаю следующую команду: pdfocr -t -l swe -i *.pdf -o newfile.pdf В результате получается файл, полностью читаемый OCR. Каждое слово доступно для поиска независимо от размера и фо...
спросил Paul Bergström 8 лет назад

1
голосов
0
ответов
364
просмотра

Как я могу получить изображение текста, где я могу указать шрифт (файл TFF)?

Есть ли какой-нибудь способ быстро переписать большой объем текста странным шрифтом (например, что-то вроде BulletMix: https://www.fontstock.net/4041/bulletmix.html )? У меня есть доступ к фотошопу, но онлайн-метод предпочтительнее. Я посмотрел в Интернете, но не могу найти правильный поиск в Google...
спросил Lee 8 лет назад

5
голосов
5
ответов
5811
просмотров

Включить распознавание текста в Greenshot

Я бегу Windows 10с Microsoft Office professional Plus 2016на моем компьютере. Похоже, что функция MS OCR включена в моей системе, так OneNoteкак может копировать текст из изображения. Но как включить эту функцию для Greenshot? В настоящее время у меня есть следующее меню после создания скриншота: У...
спросил vico 8 лет назад

2
голосов
0
ответов
1203
просмотра

Как сжимать файлы PDF в кодировке Tesseract, сохраняя встроенный текст из OCR?

Я экспериментировал с использованием Tesseract для распознавания моих PDF-файлов, и он был в основном успешным, особенно с текстами немецкого языка Fraktur (готический шрифт старого стиля), которые такие инструменты, как Adobe Acrobat, не могут правильно распознать. Проблема в том, что выходные фай...
спросил Jason 8 лет назад