Yes, you can disable the dictionaries by defining a configuration file containing:
load_system_dawg F load_freq_dawg F
and specify it with the command.
Мне интересно использовать OCR для распознавания текста из документа, который не содержит слов. Скорее, это документ с длинной строкой «случайных» печатных символов. Я пытался использовать tesseract для сканирования текста, но, похоже, он ищет слова. Есть ли способ заставить tesseract просто распознавать символы?
Yes, you can disable the dictionaries by defining a configuration file containing:
load_system_dawg F load_freq_dawg F
and specify it with the command.