Боты, парсеры и прочее

mizaider

Проверенные
Сообщения
659
Реакции
1,288
Баллы
1,905
Уже длительное время я ловлю у себя на ресурсе подозрительный трафик.
Они не используют куки, яваскрипты, кеш, меняют сессии на одном ip, шлют много запросов в секунду, маскируются под поисковые боты при этом пытаются зарегистрироваться, запостить чонить и прочее.
Я ловлю их используя пару десятков признаков и вот, спустя время, я понимаю что алгоритм в основном не ошибается, или ошибается очень редко.
И я хотел бы поделиться с вами результатами которые вы можете использовать.

И так, по адресу https://forum.devsaid.com/ipban.php отдаётся актуальный json.
В нем:
  • ip - конечный ip адрес с которого было обращение
  • cookie - если 1 клиент юзает куки, 0 нет
  • js - если 1 клиент юзает JavaScript, 0 нет
  • reverse_dns - имя хоста который резолвится по этому ip
  • reverse_dns_ip - ip адрес который получен по имени хоста
  • reason - Причина почему данный IP попал в этот список
В этот список не попадают добросовестные пользователи, только крайне подозрительные. На сегодня там 813 записей.

P.S. "Пользователь не использует кеш продолжительное время" означает то что клиент загрузил более 10 страниц, но не загрузил их содержимое, фавикон, изображения, стили, что крайне подозрительно, браузер так себя не ведет)
 
Последнее редактирование:
Современный облачный хостинг провайдер | Aéza
Назад
Сверху Снизу