Новые вопросы с тегом «ocr»

Всего найдено 159 вопросов

голосов

ответов

362

просмотра

Ошибка в обучении Тессеракта с jTessBoxEditor

Я объединил около 50 изображений в один файл .tif с помощью jTessBoxEditor (Linux), но когда я пытаюсь получить файл .box с этим кодом: tesseract mjchar.tif mjchar -l eng --psm 10 batch.nochop makebox произошла ошибка: Tesseract Open Source OCR Engine v4.0.0-beta.1 с Leptonica Ошибка в findFileFo...

ocr tesseract-ocr

спросил J.C.Liu 5 лет назад

голосов

ответов

357

просмотров

Как отсортировать и упорядочить большое количество изображений и инфографики, которые содержат объем текста?

Мне нужно отсортировать большое количество графиков, инфографики по «темам», годам и т. Д. Я перепробовал много программ для этого - классическая версия lightroom и версия CC, которая имеет AI и машинное обучение, но не распознает текст. Digikam может распознавать только лица и находить по цветам,...

спросил 5 лет назад

-1

голосов

ответов

400

просмотров

Кто-нибудь знает, что означают различные цвета после использования OCR в Google Docs?

Документы Google при использовании OCR на изображении преобразуют документ в текст. Однако текст - это разные цвета на спектре. Кто-нибудь знает, почему разные цвета создаются для разного текста? Вот пример изображения, которое я использую. https://ibb.co/9s1Dz0W

images ocr google-docs

спросил John Thompson 5 лет назад

голосов

ответов

397

просмотров

Почему я не могу запустить Acrobat ClearScan OCR для PDF после удаления текстового слоя?

Даже после того, как я удалю скрытый текст (через «Удалить скрытый»), я все еще не могу запустить OCR с «ClearScan» (то есть «Редактируемый текст и изображения»). Это странно, потому что текстовый слой, по-видимому, исчез, но при запуске OCR выдается ошибка «Acrobat не может выполнить распознавание,...

adobe-acrobat ocr clearscan

спросил user1125483 6 лет назад

голосов

ответов

365

просмотров

Разбиение изображения текста на слова - возможно ли это?

Мне интересно, есть ли способ разделить отсканированную копию страницы (то есть изображение) на изображения составляющих ее слов. Сканируемая книга написана на индийском языке, для которого OCR (оптическое распознавание символов) не будет работать. Цель состоит в том, чтобы иметь цифровую версию кни...

pdf image-editing ocr image-processing

спросил user1993 6 лет назад

голосов

ответ

789

просмотров

AutoHock для поиска изображений

Я изучаю, как использовать autohotkey, и я хотел создать скрипт, который открывает игру из Steam и автоматически подключается к определенному серверу. Мой код до сих пор: F1:: Run, steam://rungameid/346110 Sleep, 15000 <--- This is more or less the time that my computer takes to load it, and I wa...

cpu autohotkey gaming ocr steam

спросил J0ki 6 лет назад

голосов

ответов

267

просмотров

Вставить PDF в Word, и он все еще доступен для поиска?

Когда я вставляю pdf-файл в Word, он выглядит как изображение еще после того, как OCR обработал документ. Если я иду в строку инструментов и использую «Вставить»> Объект> Текст из файла. Я получаю все из текста и картинок, но не так, как PDF-документ. PDF документ находится на одной стороне,...

microsoft-word pdf search text-formatting ocr

спросил Pepsi111 6 лет назад

голосов

ответов

732

просмотра

Будет ли извлекать жестко запрограммированные субтитры, как эта работа?

У меня есть mp4 с жестко закодированными субтитрами, и я хочу сделать файл SRT. Я попытался использовать программное обеспечение для распознавания видео AviSub. Время было правильным, но само слово было очень неточным, поэтому я получил файл SRT, который выглядит так: 1 00:01:22,277 --> 00:01:27,...

ffmpeg subtitles ocr

спросил chicago1356 6 лет назад

голосов

ответа

5076

просмотров

Как создать PDF с отсканированными страницами, но выбрать текст?

Сегодня я получил PDF от нашего поставщика, и он содержал несколько напечатанных и отсканированных страниц с подписями и т. Д. Я открыл его в Acrobat Reader DC. Но, к моему удивлению, текст из явно отсканированных изображений можно было выбрать и скопировать как текст. Смотрите скриншот: Очевидно,...

pdf adobe-acrobat adobe-reader ocr

спросил Vojtěch Dohnal 6 лет назад

голосов

ответ

371

просмотр

Каков наилучший метод для работы с текстом JPEG?

У меня относительно простая графика; техническая схема с различными частями текста. Текст на другом языке (чешский / словацкий). Он напечатан достаточно четко, чтобы его можно было точно распознать и интерпретировать с помощью (Android) распознавания Google Translate. В любом случае, я хотел бы заме...

pdf jpeg image-editing ocr text-manipulation

спросил tjt263 6 лет назад

голосов

ответ

3072

просмотра

Общие сведения о параметрах распознавания текста в Adobe Acrobat: «Изображение с возможностью поиска», «Изображение с возможностью поиска (точное)» и «Редактируемый текст и изображения»

В Adobe Acrobat (я использую Pro DC, если это имеет значение) есть три варианта OCR: "Поиск изображений". "Доступное для поиска изображение (точное)". «Редактируемый текст и изображения». Каковы различия между этими тремя вариантами? В частности, что определяет размер выходного файла? Прямо сей...

adobe-acrobat ocr

спросил Kenny LJ 6 лет назад

голосов

ответов

842

просмотра

Как использовать Onenote 2016 в качестве OCR на ПК

* Обратите внимание, что я использую компьютер для всего этого. Я пытаюсь извлечь текст из снимка экрана, сделанного на моем компьютере, и когда я попробовал методы, предложенные в видео и перечисленной статье; Я не могу вынести текст из img Ссылки, которые я использовал для исследования: Microsoft...

windows ocr microsoft-onenote-2016

спросил GoalBike 7 лет назад

голосов

ответов

302

просмотра

Извлечь текст из изображений, ocr

Извлечение текста из изображений? У меня много изображений, я искал и нашел несколько онлайн-конвертеров, но он не работает, потому что у меня есть 10.000 изображений, поэтому мне нужен массовый инструмент, может кто-нибудь помочь мне с этим, спасибо

windows ocr

спросил michael johns 7 лет назад

голосов

ответов

471

просмотр

Как распечатать документ с таблицей и экспортировать в текст (с правильным текстом влево / вправо / вверх / вниз)?

У меня есть документ со многими страницами, которые имеют столбчатые таблицы, подобные следующим. #1 2.1 This is some text. It can go onto the next line like this. #2 1.3 More text. #3 3.2 And some more text that goes on to the next line also. #4 2.3 And some more text. Когда я OCR документа, каже...

adobe-acrobat ocr

спросил studgeek 7 лет назад

-1

голосов

ответ

616

просмотров

Как я могу конвертировать .png изображение в .pdf с текстом OCR?

У меня есть файл .png, который представляет собой скриншот статьи, которую я нашел в Интернете. Я хотел бы получить его PDF-версию со всем текстом, который можно выбрать. Есть ли приложения или инструменты, которые делают это?

pdf conversion png ocr document-scanning

спросил Trindaz 7 лет назад

голосов

ответов

332

просмотра

PDF файл безумно сложен, два слоя, оптическое распознавание невозможно

Я имею дело с загадкой. У меня есть этот файл PDF, который я аннотировал и выделил. Думая, что смогу позже скопировать и вставить абзацы. Это оказалось неправильно, копирование текста невозможно. Поэтому я скачал программное обеспечение для распознавания текста «PDF Elements Pro 6». И все же по како...

mac pdf text-editing ocr

спросил Arthur van Erps 7 лет назад

голосов

ответов

701

просмотр

Как автоматически определить язык текста на фотографии и перевести его

Мне удалось встроить приложение OCR для обнаружения текста по фотографии https://obserbot.com/, но оно только извлекает точный текст из фотографии и не конвертирует его на нескольких языках. Я хочу, чтобы приложение распознавало текстовый язык и автоматически переводило его на язык читателя в зависи...

ocr tesseract-ocr

спросил Abdullah Hussain 7 лет назад

голосов

ответов

394

просмотра

Извлечение PDF-данных с использованием категорированных аннотаций

Существуют ли какие-либо инструменты для извлечения данных из файлов PDF с использованием этого метода. Допустим, у меня есть 3 категории Изображение - это будет прямоугольная аннотация, которая обрежет ту конкретную область, где размещена аннотация Заголовок - это еще одна аннотация прямоугольника...

pdf csv extract ocr annotations

спросил bman 7 лет назад

голосов

ответ

902

просмотра

Как извлечь текст из PDF-файла на основе изображений, используя Cuneiform в терминале

клинопись -l рус -f текст -o outocr.txt input.pdf Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я использую Fedora Linux 25 (x86_64).

linux pdf fedora ocr

спросил codezombie 7 лет назад

голосов

ответ

2508

просмотров

Как я могу преобразовать банковские выписки в формате PDF в файл Excel или CSV?

Я просто делаю мою налоговую декларацию в Великобритании (Да, я оставил ее до последней минуты). Мой банк (общенациональный) разрешит мне загружать транзакции за последние 15 месяцев в виде файла CSV, но разрешит мне загружать любые выписки в формате PDF. Поэтому мне нужно использовать операторы PDF...

microsoft-excel pdf csv ocr

спросил Ian Ringrose 7 лет назад

голосов

ответа

774

просмотра

Как эффективно отсканировать 130 000 бумажных страниц за 10 дней

У меня есть довольно большой проект, который в конечном итоге принесет пользу обществу, и я ищу любую помощь, которую смогу собрать. У меня есть около 130 000 страниц, которые нужно оцифровать. Многие из них находятся в упаковках со скобами или на бумаге, которой более 40 лет (и она довольно тонкая...

archiving scanning ocr paper document-scanning

спросил Gryph 7 лет назад

голосов

ответа

296

просмотров

Захват текста на странице с белым фоном от фотографии

Я намереваюсь преобразовать фотографию с текстом на странице с белым фоном в текстовый файл. Цель - захватить весь текст на этих изображениях. Я Google, и я основал imagemagick и этот инструмент: SCAN Image to TEXT Но это ли лучший вариант? Возможно ли захватить текст на фотографии? Спасибо

photos ocr

спросил Edgar Oliveira 7 лет назад

голосов

ответ

533

просмотра

Можно ли «откатиться» в PDF без OCR?

Я использую Automator в сочетании с Abbys Finereader для просмотра папки для новых отсканированных документов PDF. Finereader распознает документ и экспортирует его в новый PDF-файл в той же папке. Уже месяц я пользуюсь настройкой экспорта «text over page image». Руководства пользователя поясняют эт...

pdf scanning ocr abbyy

спросил Knob1 7 лет назад

голосов

ответ

825

просмотров

Adobe не может выполнить распознавание: эта страница больше максимального размера страницы 45 дюймов на 45 дюймов

Я попытался запустить инструмент распознавания текста в PDF и получить следующее сообщение об ошибке: Adobe не может выполнить распознавание (OCR) на этой странице, потому что: эта страница превышает максимальный размер страницы 45 дюймов на 45 дюймов. Есть ли способ обойти OCR на PDF? Я использу...

pdf adobe-acrobat ocr

спросил Franck Dernoncourt 8 лет назад

голосов

ответ

403

просмотра

Распознавание текста на страницах, содержащих текст и изображения, в Acrobat XI Pro

Почему Acrobat XI Pro не разрешает сканирование с помощью оптического распознавания текста на страницах, содержащих как изображения, так и отображаемый текст? Образец PDF на скриншоте был создан из документа MS Word. Первая строка была напечатана; вторая строка - скриншот отдельного документа. Это к...

adobe-acrobat ocr

спросил P Fitz 8 лет назад

-1

голосов

ответ

633

просмотра

OCR испортил Ghostscript

В прошлом году в Ghostscript была обнаружена ошибка. Это задокументировано здесь: http://bugs.ghostscript.com/show_bug.cgi?id=696116 Помечено Статус: РАЗРЕШЕНО WONTFIX В конце концов, правопреемник Кен Шарп пишет: «К сожалению, я не вижу никаких перспектив для решения этой проблемы в Ghostscript»....

pdf ocr ghostscript

спросил Paul Bergström 8 лет назад

голосов

ответов

454

просмотра

Смешная OCR-ситуация

У меня есть отсканированный многостраничный PDF-файл с разрешением 300 точек на дюйм в системе Ubuntu 16.04. Когда я запускаю следующую команду: pdfocr -t -l swe -i *.pdf -o newfile.pdf В результате получается файл, полностью читаемый OCR. Каждое слово доступно для поиска независимо от размера и фо...

pdf ocr ghostscript tesseract-ocr

спросил Paul Bergström 8 лет назад

голосов

ответов

364

просмотра

Как я могу получить изображение текста, где я могу указать шрифт (файл TFF)?

Есть ли какой-нибудь способ быстро переписать большой объем текста странным шрифтом (например, что-то вроде BulletMix: https://www.fontstock.net/4041/bulletmix.html )? У меня есть доступ к фотошопу, но онлайн-метод предпочтительнее. Я посмотрел в Интернете, но не могу найти правильный поиск в Google...

fonts adobe-photoshop ocr transcription

спросил Lee 8 лет назад

голосов

ответов

5811

просмотров

Включить распознавание текста в Greenshot

Я бегу Windows 10с Microsoft Office professional Plus 2016на моем компьютере. Похоже, что функция MS OCR включена в моей системе, так OneNoteкак может копировать текст из изображения. Но как включить эту функцию для Greenshot? В настоящее время у меня есть следующее меню после создания скриншота: У...

windows-10 scanning ocr greenshot

спросил vico 8 лет назад

голосов

ответов

1203

просмотра

Как сжимать файлы PDF в кодировке Tesseract, сохраняя встроенный текст из OCR?

Я экспериментировал с использованием Tesseract для распознавания моих PDF-файлов, и он был в основном успешным, особенно с текстами немецкого языка Fraktur (готический шрифт старого стиля), которые такие инструменты, как Adobe Acrobat, не могут правильно распознать. Проблема в том, что выходные фай...

pdf compression adobe-acrobat ocr tesseract-ocr

спросил Jason 8 лет назад