Капча контролирует поведение мыши. В то время как бот легко нажимает на кнопку в форме, трудно имитировать беспорядочное движение мыши, перемещаемой человеком.
Тем не менее, это не невозможно: https://www.youtube.com/watch?v=fsF7enQY8uI
Это графическое изображение, требующее громоздкого распознавания текста, которого нет у большинства ботов (очевидно)? Несмотря на это, это фиксированная графика, и на самом деле она не требует OCR, просто сопоставляя шаблон с библиотекой из одного элемента. Я просто не понимаю, как это создает непреодолимое препятствие, чтобы расстроить ботов.
Капча контролирует поведение мыши. В то время как бот легко нажимает на кнопку в форме, трудно имитировать беспорядочное движение мыши, перемещаемой человеком.
Тем не менее, это не невозможно: https://www.youtube.com/watch?v=fsF7enQY8uI
Текст в капче не был распознан OCR. OCR использовал стандартные правила распознавания текста.
Подходящий текст, как правило, искажается, а не проходит параллельно по прямым линиям; до горизонта и содержат случайный мусор, который OCR не может обработать.
то есть не соответствуют обычным правилам того, как должен выглядеть текст.
С распространением глубокого обучения становится только вопросом времени, когда капча не сработает ..
Существует много разных капч, некоторые требуют выбора нескольких графических изображений, имеющих тему (например, которые являются частями знака, которые впоследствии могут быть уточнены и затем добавлены в метод библиотеки ниже после того, как весь знак собран и текстовая графика извлеченный тем же методом), который компьютер не сможет распознать. С этим типом вас всегда просят идентифицировать известный сценарий и обычно неизвестного для добавления в библиотеку известных, как только достаточно идентичных ответов получено.
Наиболее распространенное использование изображений двумя способами:
1
Одно случайно искаженное изображение, сгенерированное из слова, затем добавлен лишний мусор, чтобы запутать распознавание Как «солить» список паролей, добавив «случайное» нежелательное слово, чтобы остановить радужную атаку.
2
Другой формой является использование фотографий (обычно слов) чего-то, что люди должны были решить, что это такое, потому что изображение слишком сложное, чтобы автоматически его распознавать. Обычно это вне параметров компьютерного программирования того, что определяет текст (или знак, или что-то еще) и часто окружено случайной средой.
Для этого требуется большая библиотека фотографий с известным «текстом» или другими параметрами, например, которые являются частью знака и т. Д.
Примечание:
библиотека для второго метода расширена за счет предоставления 2 изображений, которые пользователи пытаются правильно идентифицировать.
1 изображение является известным, а другое неизвестным.
Правильное решение известных доказывает, что вы не робот.
Тогда достаточное количество людей, сопоставляющих / отвечающих на неизвестное с одним и тем же ответом, означает, что он уже известен и может быть добавлен в известную библиотеку.
Так Google Maps определяет, что на самом деле являются знаками названий улиц / мест (а затем и текстом, который они содержат), и тексты проекта Гутенберга, которые не удалось распознать, были исправлены.