Каков наилучший метод для работы с текстом JPEG?

337
tjt263

У меня относительно простая графика; техническая схема с различными частями текста.

Текст на другом языке (чешский / словацкий). Он напечатан достаточно четко, чтобы его можно было точно распознать и интерпретировать с помощью (Android) распознавания Google Translate. В любом случае, я хотел бы заменить текст на английский перевод.

В этом случае не составит труда просто вырезать / скрыть текущий текст, а затем добавить все новые текстовые поля с помощью основных инструментов редактирования. Но было бы неплохо, если бы я мог просто выбирать и редактировать текст так же, как это делают некоторые редакторы PDF.

Я попытался экспортировать JPEG / PNG в формате PDF, а затем отредактировать его в Libre Office. Но ничто не отличалось от создания пустого документа и вставки изображения; это был всего лишь один объект.

Я понимаю почему, и я не ожидаю волшебства. Но есть ли у кого-нибудь техника для этого?

2
По сути, вы спрашиваете, существует ли программа для редактирования графики, которая вроде бы распознает текстовые элементы на графике и преобразует их в реальный редактируемый текст? Если так, то я не знаю ни одного. Текст - это не просто текст, а шрифты, кернинг, межстрочный интервал и другие переменные. Похоже, это будет действительно крутая функция, хотя! Sandwich 6 лет назад 0
@Sandwich Большинство PDF-редакторов, которые я использовал, столкнулись с проблемами совместимости шрифтов. Особенно при редактировании документов из иностранных операционных систем. Это никогда не вызывало у меня никакого горя; Мне всегда удавалось конвертировать текст в родной шрифт. tjt263 6 лет назад 0
Тем не менее, PDF-файлы гораздо более «богаты», чем JPEG. PDF-файлы предназначены для обеспечения высококачественной печати с переносимого документа. Как таковые, они не только часто содержат встроенные файлы JPEG для изображений, но также могут хранить векторные данные для графики, а также текстовые данные с соответствующими директивами форматирования и самим фактическим шрифтом - все это скрыто в самом файле PDF. Вот почему многие PDF-файлы содержат текст для копирования и поиска. OCR - это то, к чему мы должны прибегать, когда нет НИКАКИХ текстовых данных, лежащих в основе, - оно пытается выяснить буквы из чисто пиксельных данных. Sandwich 6 лет назад 0

1 ответ на вопрос

2
Yorik

Самый простой способ сделать это (не смотря на сложность документа) - использовать программное обеспечение DTP для размещения изображения, блокировки изображения, а затем добавить отдельные текстовые поля с белым фоном. У вас будет очень точное размещение, и вы можете просто изменить размер окна, чтобы покрыть старый текст. Затем вы можете экспортировать в формате PDF или плоский формат изображения.

Scribus - это бесплатный DTP-пакет с открытым исходным кодом, аналогичный Quark или InDesign.

Word и т. Д. Часто содержат текстовые поля, но я считаю, что они громоздки по сравнению с программным обеспечением DTP.

Если вы достаточно хорошо очистите изображение, вы можете попробовать использовать Inkscape (с открытым исходным кодом) или Illustrator для «трассировки» или «прямой трассировки» изображения, и текст может оказаться редактируемым как нетекстовые векторные объекты, но это вероятно, будет проблематично, и даже тогда это займет больше времени, чем размещение новых текстовых полей.

Похожие вопросы