Как узнать, нажал ли пользователь ссылку

307
usr371

У меня есть большие файлы трафика, которые я пытаюсь статистически проанализировать, чтобы проверить, нажимает ли пользователь ссылки на определенных сайтах.

Важно сказать, что мои пакеты отсортированы по потокам (IP1 <=> IP2).

Моей первой идеей было просмотреть содержимое пакетов и найти ссылки и ссылки, сохранить их все в какой-то структуре данных со своими отметками времени, а затем снова выполнить итерацию по пакетам для поиска запросов в момент, близкий к моменту появления ссылок. ,

Что-то вроде следующего псевдокода:

for each packet in each flow: search for "href" or "http://" or "https://" save the links with their timestamp for each packet in each flow: if it's an http request and its url matches some url in the list and the  time is close enough, record it 

Проблема этого кода в том, что некоторые (важные) ссылки генерируются динамически во время загрузки страницы, и их невозможно найти с помощью вышеуказанного метода.

Другая идея заключалась в проверке поля реферера в заголовке http и поиске пакетов, на которые ссылались соответствующие сайты. Этот метод генерирует много ложных срабатываний из-за фреймов и встроенных объектов.

Важно отметить, что это не мой сервер, и я намерен создать инструмент для статистического анализа поведения пользователей (таким образом, я не могу добавить какой-либо трекер кликов на свой сайт).

У кого-нибудь есть идея, что я могу сделать, чтобы проверить, нажимали ли пользователи ссылки в соответствии с их сетевым трафиком?
Любая помощь будет оценена!
Спасибо

0
Вы используете неправильный инструмент для работы. Почему бы (по крайней мере) не использовать журналы сервера? Кроме того, если ссылки генерируются динамически, вы не сможете получить эту информацию, не выполнив одно и то же поколение (оно должно следовать шаблону?) Или не догадайтесь. В конце концов, вероятно, есть только несколько способов получить доступ к определенному сайту. Seth 7 лет назад 0
Большое спасибо за Ваш ответ! Я думаю, что вы правы, и моя точка зрения здесь не так. Мое намерение состоит в том, чтобы определять поведение пользователей только по их трафику, и, согласно моим предположениям, у меня не будет доступа к самому серверу (в долгосрочной перспективе я бы хотел проверить поведение при нажатии на ссылку для нескольких (определенных) веб-сайтов, поэтому Я не могу использовать серверные программы). Я действительно видел, что есть щелчки, которые не появляются в пакете как их полная форма (но как объединение переменных). \ N Есть ли у вас какие-либо другие идеи о том, что я могу сделать, чтобы проверить это? usr371 7 лет назад 0

0 ответов на вопрос

Похожие вопросы