Known Bots

Known Bots 6.0.5

Нет прав для скачивания
Совместимость с XenForo
  1. 2.2
  2. 2.3
Видимый копирайт
Нет
Это дополнение XenForo 2.x добавляет дополнительные определения для обнаружения ботов в сеансах.

Это позволяет более точно определить количество пользователей и роботов, находящихся онлайн в любой момент времени.

Новые определения ботов автоматически извлекаются через API, а обнаруженные потенциальные новые боты отправляются обратно нам на анализ для включения в определения ботов.

По состоянию на сентябрь 2023 года наш файл определений ботов может обнаруживать более 1300 различных ботов, и у нас есть база данных, содержащая более 2300 строк пользовательских агентов, которые были идентифицированы как боты.

Статистика из нашего приложения для управления ботами, специально созданного для отслеживания и идентификации ботов и обслуживания API обновлений:

1695069588203.png


Требования

этого дополнения требуется PHP 7.0.0 или выше и работает на XenForo 2.x.

Использование

Когда вы посмотрите на «Текущие посетители», вы увидите идентифицированных дополнительных роботов — также посмотрите список «Роботы» на этой странице . example.com/community/online/?type=robot

1569992317809.png


Мы также добавляем текущее количество роботов в онлайн-виджет «Участники» и виджет онлайн-статистики (с текущей страницы посетителя). Это можно отключить через параметры.

1574032520691.png
1574032528995.png


В админке есть инструмент для отображения полного списка известных на данный момент ботов:

1695069691124.png


... и еще один инструмент, который позволяет вам протестировать строку пользовательского агента, чтобы увидеть, будет ли она обнаружена как бот или нет:

1589696060644.png


… и третий инструмент, который показывает список из 100 последних обнаруженных ботов, а также всех неопознанных пользовательских агентов, ожидающих отправки на анализ.

1695069791476.png


Новые определения ботов через API.

Это дополнение будет запрашиватьобновления у API KnownBots и автоматически применять их — больше не нужно вручную устанавливать обновления для получения новых списков ботов. Вы можете запросить API напрямую в любое время, а также отключить процесс автоматического обновления в пользу ручной загрузки файла JSON и загрузки данных с помощью сценария CLI. Инструкции по этому поводу можно найти ниже.

Новое в версии 5.

Версия 5 полностью переработана по сравнению с предыдущими версиями: обнаружение ботов теперь происходит до 15 раз быстрее, чем предыдущий метод. Обнаружение ботов также является более сложным — с помощью вторичной системы обнаружения на основе регулярных выражений, которая помогает идентифицировать сложные строки ботов, которые не могут быть сопоставлены с использованием совпадений простых текстовых строк, используемых по умолчанию.

Если боты не обнаружены, дополнение проверит пользовательский агент по списку допустимых строк регулярных выражений браузера - и, если он не считается действительным браузером, управляемым пользователем, он временно сохранит информацию в базе данных, прежде чем отправить ее обратно в базу данных. автору аддона по электронной почте для дальнейшего анализа.

Раньше система отправляла обратно только те пользовательские агенты, которые соответствовали ключевым словам: bot|crawl|spider. Этот новый метод обнаружения является значительно более комплексным и позволяет с гораздо большей точностью обнаруживать новых ботов, которые могут не идентифицировать себя с помощью традиционных ключевых слов.

Параметры

Показать статистику​


1695070173593.png


Включите, чтобы отображать статистику роботов в виджетах боковой панели.

Получение новых ботов.
1695070187734.png


Включите автоматическое получение новых идентификаторов ботов из поддерживаемого автором дополнения. Если вы отключите эту опцию, вам придется настроить свою собственную систему для обновления определений известных ботов — см. раздел «Интерфейс командной строки», где можно найти варианты, которые помогут здесь.

Хранить пользовательские агенты в базе данных и очищать ее после этого.
1695070239128.png


Включите сохранение неизвестных пользовательских агентов и бот-агентов в базе данных для дальнейшего анализа. Это следует использовать в сочетании с опцией «Электронная почта пользовательских агентов», чтобы отправлять неизвестные пользовательские агенты обратно автору дополнения для дальнейшего анализа и идентификации новых ботов. Вы также можете вручную отправить информацию об агенте пользователя автору дополнения через ветку обсуждения дополнения — используйте инструмент «Список обнаруженных ботов», чтобы отобразить неизвестные агенты пользователя.

Если эта опция включена, вы также можете выбрать, как долго хранить записи пользовательского агента, прежде чем они будут автоматически удалены из базы данных. При этом используется механизм «последнего посещения» для ведения списка недавно просмотренных ботов — будут удалены только те боты, которые не были замечены в последнее время. Для загруженных сайтов рассмотрите возможность снижения этого значения по сравнению с 90 днями по умолчанию, чтобы уменьшить размер хранимых данных. Установите количество дней на ноль, чтобы никогда не удалять данные пользовательского агента (не рекомендуется).

Пользовательские агенты электронной почты

1695070288929.png


Включите периодическую отправку строк пользовательского агента по электронной почте автору дополнения для дальнейшего анализа с целью обнаружения ранее неопознанных ботов. Эта опция действует только в том случае, если также включена опция «Хранить пользовательские агенты в базе данных».

По умолчанию система отправляет электронные письма непосредственно автору дополнения на адрес[email protected] , но вы можете настроить отправку электронных писем на любой адрес, если хотите проверить, какую информацию содержат электронные письма. Вы можете вручную переслать электронное письмо на указанный выше адрес или опубликовать строки пользовательского агента в теме поддержки для анализа.

Вы можете указать несколько адресов электронной почты, разделенных запятыми. Все адреса после первого представляют собой скрытую копию электронного письма, поэтому укажите известные боты@hampel.io.сначала, а затем на любые другие адреса электронной почты, на которые вы хотите получать электронное письмо, список получателей не будет виден автору дополнения.

Ведение журнала

Установите надстройку службы ведения журнала Monolog , чтобы регистрировать информацию об отправленных электронных письмах и выполненных запросах API.

Интерфейс командной строки

Предоставляются инструменты CLI, которые могут быть полезны в определенных случаях использования.

Получить ботов​

Получайте новых ботов через API. Используйте это для запуска собственного cron — выполняет ту же задачу, что и поставляемое задание XenForo Cron.

Bash:
$ php cmd.php known-bots:fetch

Используйте -f опцию для принудительного обновления, минуя флаг «последнее обновление» и повторно получая последние определения ботов.

Если вы используете эту команду через собственный cron, обязательно отключите прилагаемое задание XenForo Cron под названием «Известные боты: получение новых ботов из API».

Загрузить ботов​

Загрузите данные о ботах из файла knownbots.json, который уже находится в файловой системе.

Bash:
$ php cmd.php known-bots:load

Аддон ищет файл internal_data/knownbots.json— если вы загрузите его вручную и поместите обновленную версию в это место, вы сможете затем выполнить указанную выше команду для загрузки данных без вызова API.

Повторная обработка пользовательских агентов​

Перебирайте пользовательские агенты, хранящиеся в базе данных, и обновляйте определения на основе последних данных об обнаружении ботов.

Bash:
$ php cmd.php known-bots:reprocess

По умолчанию повторно обрабатываются только «неизвестные» пользовательские агенты. Используйте -a опцию для повторной обработки всех известных и неизвестных пользовательских агентов — полезно, если бот был ошибочно идентифицирован, но был обновлен в последних данных API.

Тестовые боты​

Проверьте предоставленную строку пользовательского агента и определите, распознается ли она как бот.

Bash:
$ php cmd.php known-bots:test {user-agent}

Не забудьте заключить в кавычки строки пользовательского агента, содержащие пробелы. Например:

Bash:
$ php cmd.php known-bots:test "Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)"
Found robot: [ahrefs]
Title: AhrefsBot

Используйте -s опцию, чтобы сохранить строки пользовательского агента в базе данных для дальнейшей обработки.

Заявление о конфиденциальности

Резюме​

В зависимости от включенных опций, автор дополнения собирает некоторую информацию о сайтах, использующих это дополнение, но она используется только для анонимной аналитики и в целях устранения неполадок и никогда не раскрывается третьим лицам, а также никогда не используется для маркетинга или каких-либо других целей. целях, отличных от работы этого дополнения.

Автор дополнения обязуется быть «добропорядочным гражданином» в отношении того, как используются и собираются данные. Мы также предоставляем возможность отключить или обойти определенные функции, если вам по-прежнему неудобно использовать системы так, как они задуманы.

Подробности​

Если включена опция «Извлечь новых ботов» , дополнение автоматически отправит запрос в , загрузив обновленный список определений ботов. Вы можете в любое время напрямую запросить этот API, чтобы узнать, что содержится в возвращаемых данных.

Вызовы API с помощью дополнения выполняются с использованием стандартного «недоверенного» HTTP-клиента, встроенного в XenForo, что означает, что они перенаправляются через прокси-сервер, если он у вас настроен. Стандартные файлы журналов веб-сервера на сервере API будут содержать информацию о сделанных запросах, включая IP-адрес вашего сервера (или прокси-сервера, если он используется), а также имя вашего форума, указанное в пользовательском агенте HTTP-клиента XenForo. Например:

Bash:
2400:8907:e001:xx::xxx - - [15/Aug/2023:00:00:07 +0000] "GET /api/bots?since=1691729327 HTTP/1.1" 200 119647 "-" "XenForo/2.x (https://www.example.com)"

Информация журнала HTTP-сервера используется исключительно в целях аналитики и устранения неполадок и никогда не предоставляется третьим лицам.

При включении опций «Хранить пользовательские агенты в базе данных» и «Отправлять пользовательские агенты по электронной почте» произойдет следующее:
  1. пользовательские агенты, которые не были обнаружены как бот или действительный браузер, будут храниться в базе данных.
  2. один раз в день на адреса электронной почты, указанные в настройках, будет отправляться электронное письмо со списком этих пользовательских агентов.
  3. эти строки пользовательского агента будут сопоставлены автором дополнения и использованы для идентификации новых ботов или для совершенствования действующей системы обнаружения браузера.
Отправленные электронные письма содержат только список строк пользовательского агента. Не содержится никакой информации, которая могла бы позволить получателю снять отпечаток пальца конкретного пользователя, зашедшего на ваш сайт: в данных нет IP-адреса или информации о пользователе.

Помимо списка строк пользовательского агента, единственной информацией, содержащейся в электронном письме, будет информация, автоматически добавленная в заголовок электронного письма почтовой программой форума и SMTP-серверами.

Электронные письма отправляются на [email protected] этот адрес по умолчанию, и любые электронные письма, отправленные на этот адрес, будут использоваться только с целью выявления новых ботов для добавления в это дополнение. Адреса электронной почты никогда не будут проданы или добавлены в какие-либо маркетинговые списки, даже в наши.

Если в электронных письмах, которые вы отправляете нам, обнаружены проблемы, мы можем отправить вам электронное письмо для установления связи, но это будет осуществляться в каждом конкретном случае и только в целях устранения неполадок в работе этого дополнения.

Вы можете проверить информацию, содержащуюся в электронных письмах, добавив свой собственный адрес электронной почты в параметры дополнения — текстовое поле принимает список адресов, разделенных запятыми. Например, установите адрес электронной почты: [email protected], [email protected]

Убедитесь, что первый адрес электронной почты является автором дополнения (если он указан) — все адреса электронной почты после первой записи будут скрыты — и поэтому автор дополнения не будет иметь никакой информации о том, кто еще получил электронные письма.

Обратите внимание, что электронные письма, полученные автором дополнения на [email protected]адрес, автоматически обрабатываются путем от нашего поставщика услуг электронной почты (SparkPost) и никогда не сохраняются во входящих сообщениях и не читаются человеком.

Адрес отправителя электронной почты регистрируется для целей устранения неполадок, но никогда не используется для каких-либо других целей.

Не отправляйте на этот адрес электронное письмо с вопросами о дополнении или для связи с автором дополнения — любые электронные письма, не содержащие действительную информацию об агенте пользователя, автоматически отклоняются автоматическим обработчиком. Пожалуйста, свяжитесь с автором дополнения через ветку обсуждения дополнения или личное сообщение.
Автор
XFI Bot
Скачивания
230
Просмотры
3,002
Первый выпуск
Обновление
Оценка
0.00 звёзд 0 оценок

Другие ресурсы пользователя XFI Bot

Поделиться ресурсом

Последние обновления

  1. Обновление 6.0.5

    исправление ошибки: совместимость XF2.3 для отправки новых ботов через вложение электронной почты
  2. Обновление 6.0.4

    Улучшена совместимость с XF 2.3.
  3. Обновление 6.0.3

    Это обновление содержит важное исправление для обработки неправильного формата UTF-8 в строках...
Назад
Сверху Снизу