Как назначить разные IP при сканировании веб-страниц

1284
Mounarajan

Как я могу назначить другой IP-адрес во время сканирования

Я ползаю миллиарды страниц каждый день (выделение разных ip поможет блокировать генделя)

2
Вы можете попробовать использовать разные прокси для ваших запросов. Ben 8 лет назад 1
@Ben Не могли бы вы дать мне пример? Mounarajan 8 лет назад 0
Это зависит от того, как вы сканируете миллиарды сайтов. Возможно, ваш сайт-сканер предлагает эту опцию. Вы должны предоставить больше информации о вашем сканере. Ben 8 лет назад 0
я использую wget и curl для загрузки веб-страницы и использую регулярные выражения для извлечения данных с веб-страницы загрузки (вот как я создаю веб-сканеры) Mounarajan 8 лет назад 0
например, см. здесь: http://stackoverflow.com/questions/11211705/setting-proxy-in-wget. Затем вам нужно создать скрипт или небольшой инструмент, который перебирает список прокси и устанавливает их для каждого wget. Ben 8 лет назад 0

1 ответ на вопрос

0
ajimix

У вас есть разные варианты для разных IP-адресов. Обычно вам нужно использовать какой-нибудь прокси, я обычно рекомендую выбрать хороший VPN, который позволит вам легко переключать соединение между их серверами, чтобы вы могли легко иметь разные IP-адреса после их блокировки.

Поэтому обычно вы начинаете сканирование, а после блокировки IP-адреса вы можете переключиться на другой сервер из VPN и начать сканирование снова.

Просто убедитесь, что провайдер VPN позволяет вам делать это, а некоторые нет.

Другой вариант - использовать прокси для сканеров. Это услуга, которая предлагает вам конечную точку, по которой вы можете позвонить, и она всегда даст вам ответ. Таким образом, вам не нужно беспокоиться об IP-адресах, блокировках, ограничениях и т. Д.

Пока я знаю две службы proxycrawl и crawlera, я использовал обе, и они действительно хороши, proxycrawl дешевле и быстрее, чем другой. Я предлагаю вам попробовать оба варианта и использовать тот, который вам больше подходит.