Файл robots.txt

Raniyx · 5 Мар 2026

Sadorimatsu написал(а):
Есть хоть уже рабочий шаблон подачи в таком файле? Потому что вызывает лишь вопросы актуальность этой задумки. Одно дело помочь продвигать в поиске, другое платные рекламные гиганты этого просто не дадут, яндекс точно.

Прям рабочих шаблонов под данную задумку на xenforo у меня нет, но судя по примерам они все однотипные:

Код:

# Заголовок (обычно название сайта)

Мета описание ресурса.

## Раздел раз
[Название темы](ссылка на тему)
[Название темы](ссылка на тему)
[Название темы](ссылка на тему)

## Раздел два
по аналогии..

upd: Соответственно на нужные разделы вешать нужные ссылки для контекста.

Как я уже учитывал ранее, аддон у коллег просто собирает возможные и популярные темы на основе счетчика просмотров и реакций на сообщениях, а админы уже в панели жмут кнопки на добавление или отмену в файл, что-то могут руками вписывать, ну и массово одной кнопкой применяют изменения. Насчет llms-full.txt очень мало наслышан.

Raniyx написал(а):
Код:

# Заголовок (обычно название сайта) Мета описание ресурса. ## Раздел раз [Название темы](ссылка на тему) [Название темы](ссылка на тему) [Название темы](ссылка на тему) ## Раздел два по аналогии..

upd: Соответственно на нужные разделы вешать нужные ссылки для контекста.

Спросил тех самых коллег, у них шаблон почти такой же который я написал, за исключением некоторых правок:

Код:

# Название сайта (кратко без лишних описаний)
> Краткое мета описание (обычно что указывают в страницах html)

## Раздел раз (если форум)
[Название темы](ссылка на тему)
[Название темы](ссылка на тему)
[Название темы](ссылка на тему)
...

## Раздел два (если ресурс)
[Название темы](ссылка на тему): Краткое описание из ресурса через api xfrm
...

llms-full.txt мы пока не трогаем, поскольку оттачиваем сейчас сбор тем. Хотим получить полную выгрузку данных за квартал.

Интересно однако.

Sadorimatsu · 5 Мар 2026

Raniyx, за шаблон благодарю, аналогично мне и дипсик выдал. Но из всего возникает один вопрос, как понять, что это будет работать? И работает ли она в данный момент вообще? Потому что я не вижу ничего, кроме прописания вручную мета заголовка и описание + ссылка на нужные страницы и узлы. По факту такие вещи сами боты и хватают на автомате, а тут ещё упрощаем работу ИИ ботам... как по мне, нефиг им упрощать и себе усложнять жизнь. Я лично не особо понимаю полезности этой задумки, слишком уж смотрится это сыро и колхозно. Учитывая, что и без всего этого базовая индексация хватает самые свежие записи, тут же задумка подраздразумевает продвигать активные страницы и продвигать их чаще в поиск, базовая индексация это тоже делает, но медленней. Заниматься этим вручную, это идиотизм, без плагина такую работу не продвинуть, не мудрено, что гиганты отмахнули, очень сырое исполнение. Если не прав, то поправьте.

Sadorimatsu · 9 Мар 2026

Внёс важные изменения в список robots.txt, с учётом последних правок + изменения в ботах. Так же расписал тут варианты настроек. Рекомендую обновить.
Помимо этого, протестировал довольно важную настройку в вебмастере, найти которую можно в - Индексирование - Настройка GET-параметров:

Что это и для чего?

Clean-param (в robots.txt) - это инструкция для робота, как склеивать страницы ДО того, как он их обработает. Он экономит ресурсы сервера и говорит роботу, как эффективно загружать сайт, склеивая дубли на лету. Обычно достаточно прописать это.
Настройка GET-параметров (в Вебмастере) - это ваше прямое указание Яндексу, не тоже самое, что Clean-param, тут указываем какие параметры НЕ ВЛИЯЮТ на содержание страницы и их не нужно учитывать при индексации. Он следит за тем, чтобы в чистую поисковую выдачу не попал мусор, который вы уже прописали в robots.txt, и помогает убрать оттуда старые дубли. Иначе говоря он контролирует текущие URL и ДО и ПОСЛЕ. Помогает убрать мусор.

№	Параметр	Что делает
1	page	Номера страниц (пагинация)
2	prefix_id	Префиксы по категориям ресурсов
3	order	Сортировка
4	direction	Направление сортировки
5	content_type	Тип контента
6	user_id	ID пользователя
7	t	Временные метки
8	tab_id	Вкладки на странице
9	_debug	Отладочные параметры
10	desc	Описание (вероятно для фильтрации)
11	download_count	Счетчик скачиваний
12	reject	Отклонено
13	accept	Принято
14	update	Обновления

После заполнения, вам нужно поставить "Нет" в графе, "Учитывать параметр?".
Важное правило приоритета:
Если вдруг ваши настройки в Вебмастере и в robots.txt противоречат друг другу (например, в Вебмастере вы указали "учитывать", а в robots.txt прописали Disallow), Яндекс выберет то правило, которое ЗАПРЕЩАЕТ индексацию. Т.е. приоритет у запрета, что логично.

Параметр _debug можно не указывать, если у вас форум не бывает постоянно в режиме разработчика и вы не проводите разработку по ходу дела, в ином другом случае можно не указывать.

Если правильно настроите эти параметры, то забудете про дубли, по крайне мере у себя наблюдаю, как они исключаются. Рекомендуют ждать от 1-2 недель, чтобы увидеть реальный результат.

Вы можете заполнить по дефолту, как тут у себя, лишним не будет. Однако, если есть свои параметры, то вносим так же. Если наоборот надо учитывать переменные, то ставим "Да", но в XF это вряд ли будет нужно.

У меня после тестирования, чутка прибавились дубли, это нормально. Обязательно запомните по поводу этой статистики. Даже когда нет дублей в URL, но есть дубли на разных URL по заголовкам и описания, то вас это будут долбить постоянно, пока не измените. Если вам важны дубли таких заголовках, например у меня есть моды на разные игры и там одинаковые заголовки в их подразделах. От этого я никуда уйти не могу т.к. это удобства подачи, можно и забить хрен, на работу никак не скажется и на саму индексацию, но стата такая будет мозолить глаз. Если вам это мешает, изменяйте там, где показывает. Наша изначальная цель исключить дубли на уровне URL, чтобы получить чистую индексацию важного нам контента.

На этом мне больше шлифовать настройки robots и индексацию некуда. Остается дождаться апреля и посмотреть, что будет по итогам. Как бы не пришлось, что исправить.

25517 · 9 Мар 2026

Sadorimatsu написал(а):
_debug

ИМХО, но в проде лучше бы держать дебаг/девмод выключенным.
Тогда и прописывать это попросту не придётся.

Банально, у вас может быть плагин с уязвимостью, например от какого-нить Энди.
И выключенный дебаг позволит скрыть некоторые подробности о том, что у вас установлено.

Если на какой-то странице обнаружится проблема N+1, то это будет очень удобная точка для условного DDOS.
А поскольку, включенный дебаг позволяет увидеть кол-во запросов на странице - это всё сильно упрощает.

Но повторюсь, это чисто моё мнение.

Второй момент, включенный дебаг/девмод отключает некоторые микрооптимизации самого движка.
Мелочи, но всё равно приятно.

Ну и опережая вопрос по поводу как создавать те же самые модификации шаблонов.
Самый оптимальный вариант - просто создать плагин и в нём уже создавать модификации.
Можно будет протестить локально все изменения - это раз.
Контроль изменений через версии - это два.

Можно, конечно, врубать дебаг/девмод, создавать модификации и потом его вырубать.
Но как по мне, это не совсем удобно.

Sadorimatsu · 9 Мар 2026

25517 написал(а):
Самый оптимальный вариант - просто создать плагин и в нём уже создавать модификации.

У меня на это как раз создан плагин и на подобный случай и указал его, если у кого нет, то конечно, лучше убрать из списка. Так что тут вы правы. Но береженого бог бережёт, как говорится.

Mirovinger · 10 Мар 2026

25517 написал(а):
Ну и опережая вопрос по поводу как создавать те же самые модификации шаблонов.
Самый оптимальный вариант - просто создать плагин и в нём уже создавать модификации.
Можно будет протестить локально все изменения - это раз.
Контроль изменений через версии - это два.

Можно, конечно, врубать дебаг/девмод, создавать модификации и потом его вырубать.
Но как по мне, это не совсем удобно.

Хм, в большинстве случаев, используют релиз отсюда, а мы по заветам старых времён(привет Крису), возвращаем возможность создавать ТМС и без дебага, всем у кого приобретена копия движка, есть дополнение которое позволяет опять же без дебага добавлять ТМС.

Sadorimatsu · 12 Мар 2026

Небольшое обновление:

Добавить в User-agent: *

Код:

Disallow: /resources/authors/
Disallow: /resources/*/history
Disallow: /resources/*/reviews
Disallow: /resources/*/updates
Disallow: /resources/*/update/*/reactions
Disallow: /resources/categories/*/featured
Disallow: /resources/*?prefix_id=

Добавить в User-agent: Yandex

Код:

Clean-param: content&user_id&prefix_id&desc&page&download_count&reject&accept&update&_debug&direction&order&tab_id&t&rating
Disallow: /resources/authors/
Disallow: /resources/*/history
Disallow: /resources/*/reviews
Disallow: /resources/*/updates
Disallow: /resources/*/update/*/reactions
Disallow: /resources/categories/*/featured
Disallow: /resources/*?prefix_id=

Disallow: /resources/authors/*/ удалить, его заменяем на Disallow: /resources/authors/.

У нас в яндекс блоке стояло так:

Код:

Disallow: /resources/categories/*/featured
Disallow: /resources/*/update/*/reactions
Disallow: /resources/*/updates
Disallow: /resources/*/reviews
Disallow: /resources/*/history
Disallow: /resources/authors/*/

Простое замените новым на оба блока.

В Clean-param нужно добавить rating. Это новая переменная в оценке ресурсов, которой раньше не было на 2.2. В настройки GET-параметров тоже добавляем:

Информацию дополнил, как получил глобальный отчёт по обходу:

По поводу того, что у вас по обходу всё равно фиксирует как каноничную /members/, то не беспокоимся. Яндекс сам игнорирует правила обхода этих страниц и собирает их сам краулер для технического аудита, когда другие поисковики его игнорят. Почему так, вопрос к яндексу... но на общую выдачу повлиять вроде не должно, он сам решит, что ему выводить. Но то, что яндекс стал уже тупо игнорить свои же правила, это конечно умиляет.

artscripts · 12 Мар 2026

Sadorimatsu, Все же стоит оформить отдельным ресурсом, например тут

У Вас недостаточно прав для просмотра ссылок. Вход или Регистрация

Чтобы пользователи видели общую информацию и вы могли легко обновлять инструкции, а сейчас приходится кусками искать информацию по всему топику.

Sadorimatsu · 12 Мар 2026

artscripts, это предлагаю сделать по итогам, которые получим в апреле, пока не спешим, я просто дополняю информацию тем, что мне отчёты показывают. Сейчас уже видна общая картина после глобальной мне выдачи, так что смогу оценить эффективность настройки. Если всё будет отлично, то создам ресурс мануал на эту тему со всеми шаблонам и пояснениями для XF 2.2 и 2.3.

25517 · 12 Мар 2026

Sadorimatsu, точно также через обновление ресурса можно дополнять)

Тем более, что сами обновления по сути такие же посты.
Просто их удобнее будет посмотреть на отдельной вкладке.

Sadorimatsu · 12 Мар 2026

25517, можно, но пока нет внятной конкретики эффективности данной настройки. По итогам посмотрю, если всё нормуль и независимо будет там местами повод исправить что, то конечно ресурс создам и всё распишу, как и варианты настроек и манипуляций, как никак пора бы самим вникать, как эту фигню настраивать. К тому же мой вариант для 2.2 отлично себя обкатал весь прошлый год, а вот с 2.3 есть вопросы, которые важно изучить. Так же распишу и про IndexNow, с ним вообще свои занятные вещи.

Sadorimatsu · 13 Мар 2026

Да неужели он начал блочить members. У меня такое ощущение, что яндекс перестал учитывать свой блок, потому что до этого у меня даже на 2.2 members стоял на блоке и после обновления на 2.3 он его вдруг начал индексировать с прописанным правилом и вот пока не добавил в общий блок его блокировку с 5 марта, блок наконец тока сегодня показал, что 10 марта увидел блок, но вижу, что правило применялось спустя 4 дня, но отчёт от этом дал тока сегодня... надо будет провести эксперимент, будет ли реакция на удаление блока яндекса полностью. Возможно на 2.2 его стоит оставлять, а вот на 2.3 интересно получается. Мне казалось, что правила не должны зависить от платформы, но может я чего-то не знаю?

Efremov · 13 Мар 2026

Sadorimatsu, привет. А в чём преимущество закрытия тегов от индексации?

Sadorimatsu · 13 Мар 2026

Efremov, в том, что ничего кроме заголовков у них нет из коробки, естественно будет ругаться на отстутствие к ним мета описания. Без плагина, этот вопрос не решить. Об этом как раз активно пояснял товарищ тут - Файл robots.txt
Без доработки вывода тегов, выводить их в индексацию тока во вред. Можно конечно оставить, но поисковики всё равно будут ругаться на них. По крайне мере в яндекс 100%, однако по прямому запросу могут выводится. Гугл и другие хватают так таково, но это минус вам, потому что по тегу зайти то зайдут и непонятно, на что им там смотреть и куда лезть, ведь теги полезной информации тут не несут при подаче контента. Если нет возможности прописывать теги и доработать их выдачу, то они сгодятся лишь для внутреннего поиска, не более. Потому оставлять или убирать, чисто на ваше усмотрение. Я не призываю их полностью блочить.

Изначально теги служили для быстрого поиска по ключевым словам и они выводили именно те, что были наиболее активны по контенту их применения, принцип как фильтра, выводит весь доступный по запросу и всё. Раньше они были удобны по облаку тегов, сейчас это скорей пережиток, который оставили лишь для внутренней навигации. Лично для себя пользы особой от них не вижу. Тут зависит от вашего ТЗ. Но вариант из коробки бесполезен и рекомендую от индексации отрубать. Теги изначально удобно использовать, как подпись для контента. Например у вас много разного контента общего по смыслу, но они в разных категориях и разделах, вот тут теги и помогают фильтровать всю информацию где они упоминаются. Для индексации это бесполезная информация.

P.S. Любителям префиксов, как мне, нужно обязательно блочить вывод префсиков для индексации, как и убирать их упоминание из мета заголовков из тем форума и XFRM. И без модификатора это не решается. Как это решить, я распишу позже уже, когда буду мануал готовить.

Efremov · 14 Мар 2026

Sadorimatsu, ну у меня яша блокнул такие страницы тегов-

Код:

https://pfolio.top/tags/landingpage-na-creatium/

(не реклама).
Вроде как "не мусор", или я ошибаюсь?

Sadorimatsu · 14 Мар 2026

Efremov написал(а):
Вроде как "не мусор", или я ошибаюсь?

Загляни в код страницы и скажи, что видишь?

Виден заголовок тега, но при этом нет мета-описания к нему, НО у тебя есть общее описание от форума, которое будет выводится везде и так на каждый тег, где нет своего мета-описания, а это о чём говорит? О том, что на каждые кучи тегов, будут дубли именно мета-описания. На индексацию так таково не скажется, но это считается мусором в SEO, который на пользу не идёт, как правило. Например, у тебя в поиске будет выше шанс появление контента по этому тегу, но не факт, что тег у тебя стоит конкретно на твой нужный контент и не факт, что пользователь его найдёт в куче других тем по этому тегу и обычно пользователь будет теряться, а куда он попал, а где контент, что я ищу и непонятный список и т.д. Мы то понимаем, а рядовой пользователь нет. То, что пользователи на него выйдут, это факт, но если вас не смущают ошибки и такая подача, то теги можно смело открывать. Вреда по крайне мере не будет, но кучу ошибок на дубли вам обеспечено.

Контент считается чистым, если у вас хотя бы есть эти поля:

Код:

<title>ЗАГОЛОВОК</title>
<meta name="description" content="МЕТА-ОПИСАНИЕ" />

Объясню понятным языком:

<title> - Заголовок (мета-заголовок), самый важный обработчик для выдачи в любом поиске, хватают абсолютно все. Без него, страницу можно закрывать сразу.
<link rel="canonical" - Показывает поисковикам на основной (канонический) адрес страницы. Его цель указать на главный адрес и не строчить дубли по другим URL, но чаще всего на XF мы эти дубли ловим и они называются пагинацией (page-1/post-1, page-2/post-2 и т.д.), вот это надо блочить обязательно, а главный адрес должен быть всегда 1 в своём роде.
<meta name="description" - Краткое мета-описание для всех видов поисков. Чаще используется для сниппета.
<meta name="viewport" - Адаптация под мобильные устройства т.е. ваш контент заточен для мобилы.
Это важные пункты, которые в идеале должны быть на ваших основных страницах.

Но вы спросите, так у меня на каждой странице выводится заголовок названия сайта/форума и его описание. Разве этого недостаточно? Да, оно катируется для SEO и будет выводиться, НО никто не отменяет ошибки на дубли, потому что URL может и разные, но мета информация у всех одна и такие страницы как правило считаются мусором и не все могут пройти на выдачу в поиске. По выдаче тегов тоже самое, хоть у них и свои заголовки.

То что ниже, для SEO не имеют важного значения, но полезно, если у вас есть связка с соц.сетями.
<meta property="og:description" - Обработка описание в Open Graph (если есть картинки) для соц. сетей Facebook, ВКонтакте, LinkedIn и т.д.

og:url - ссылка на страницу.
og:site_name - название сайта.
og:type - тип контента.
og:title - заголовок для соцсетей.
og:image - картинка, которая будет показываться в посте.

<meta property="twitter:description" - Обработка для Twitter Card для X/Twitter, по коду и так думаю понятно.

Efremov · 14 Мар 2026

Sadorimatsu написал(а):
Загляни в код страницы и скажи, что видишь?

Посмотреть вложение 161415

Виден заголовок тега, но при этом нет мета-описания к нему, НО у тебя есть общее описание от форума, которое будет выводится везде и так на каждый тег, где нет своего мета-описания, а это о чём говорит? О том, что на каждые кучи тегов, будут дубли именно мета-описания. На индексацию так таково не скажется, но это считается мусором в SEO, который на пользу не идёт, как правило. Например, у тебя в поиске будет выше шанс появление контента по этому тегу, но не факт, что тег у тебя стоит конкретно на твой нужный контент и не факт, что пользователь его найдёт в куче других тем по этому тегу и обычно пользователь будет теряться, а куда он попал, а где контент, что я ищу и непонятный список и т.д. Мы то понимаем, а рядовой пользователь нет. То, что пользователи на него выйдут, это факт, но если вас не смущают ошибки и такая подача, то теги можно смело открывать. Вреда по крайне мере не будет, но кучу ошибок на дубли вам обеспечено.

Контент считается чистым, если у вас хотя бы есть эти поля:

Код:

<title>ЗАГОЛОВОК</title> <meta name="description" content="МЕТА-ОПИСАНИЕ" />

Объясню понятным языком:
<title> - Заголовок (мета-заголовок), самый важный обработчик для выдачи в любом поиске, хватают абсолютно все. Без него, страницу можно закрывать сразу.
<link rel="canonical" - Показывает поисковикам на основной (канонический) адрес страницы. Его цель указать на главный адрес и не строчить дубли по другим URL, но чаще всего на XF мы эти дубли ловим и они называются пагинацией (page-1/post-1, page-2/post-2 и т.д.), вот это надо блочить обязательно, а главный адрес должен быть всегда 1 в своём роде.
<meta name="description" - Краткое мета-описание для всех видов поисков. Чаще используется для сниппета.
<meta name="viewport" - Адаптация под мобильные устройства т.е. ваш контент заточен для мобилы.
Это важные пункты, которые в идеале должны быть на ваших основных страницах.

Но вы спросите, так у меня на каждой странице выводится заголовок названия сайта/форума и его описание. Разве этого недостаточно? Да, оно катируется для SEO и будет выводиться, НО никто не отменяет ошибки на дубли, потому что URL может и разные, но мета информация у всех одна и такие страницы как правило считаются мусором и не все могут пройти на выдачу в поиске.

То что ниже, для SEO не имеют важного значения, но полезно, если у вас есть связка с соц.сетями.
<meta property="og:description" - Обработка описание в Open Graph (если есть картинки) для соц. сетей Facebook, ВКонтакте, LinkedIn и т.д.

og:url - ссылка на страницу.

og:site_name - название сайта.

og:type - тип контента.

og:title - заголовок для соцсетей.

og:image - картинка, которая будет показываться в посте.

<meta property="twitter:description" - Обработка для Twitter Card для X/Twitter, по коду и так думаю понятно.

Спасибо тебе огромное за твои труды!

Sadorimatsu · 14 Мар 2026

Чувствую, создание мануала неизбежно

Кстати, по поводу мусорного контента, если вы даже открываете теги и вам всё показывает, то проблема такого мусора в том, что ваша основная страница может просто тупо плохо выводится в поиске при запросе, вместо неё вам выйдет какой-то пост из темы нужной вам страницы и по правилу пользователь должен попасть на 1 страницу темы или страницы ресурса, а попадает в связанное с ней обсуждение или даже тег с кучей других тем под ним. Дилемму ситуации думаю поняли?

Это вам для сравнения, чтобы понимали, чем важна отлаженная настройка.

Конечно, если вам это нормально, то это ваш выбор и ваш путь.

Zero-cold · 14 Мар 2026

Sadorimatsu написал(а):
в том, что ничего кроме заголовков у них нет из коробки, естественно будет ругаться на отстутствие к ним мета описания. Без плагина, этот вопрос не решить. Об этом как раз активно пояснял товарищ тут - Файл robots.txt
Без доработки вывода тегов, выводить их в индексацию тока во вред. Можно конечно оставить, но поисковики всё равно будут ругаться на них.

Теги без доп плагинов - это вредно 100%

Вот доп для открытия тегов:

Tag Essentials → отвечает за контент на странице тега (описание, синонимы, автоподбор тегов). Это база для индексации.
XenCustomize Enhanced Tagging → отвечает за мета-данные и превью (title/description/og:image). Это влияет на CTR в поиске и то, как выглядит сниппет.

Как пользоваться правильно:

Заполняй описание у тегов через Tag Essentials (200–600 знаков уникального текста, как мини-статья).
- Это то, что увидит и Google, и пользователь.
Через XenCustomize Enhanced Taggingдополняй каждый важный тег:
- Meta title (до 70 символов, ключ в начале).
- Meta description (до 149 символов, цепляющий, с ключами).
- OG image (чтобы красиво шарилось в соцсетях/мессенджерах).

То есть пользоваться нужно обоими одновременно:

Tag Essentials = наполнение страниц.
XenCustomize = контроль выдачи и кликабельности.

Raniyx · 14 Мар 2026

Zero-cold написал(а):
Tag Essentials → отвечает за контент на странице тега (описание, синонимы, автоподбор тегов). Это база для индексации.

Разве XFA Tags Generator не лучше себя показывает? Или все таки есть отличия? Сравнил сейчас функционал, в целом почти идентичны.

Файл robots.txt

Raniyx

Sadorimatsu

Sadorimatsu

Что это и для чего?

25517

Sadorimatsu

Mirovinger

Sadorimatsu

artscripts

Реклама, support, вопросы по проекту

Sadorimatsu

25517

Sadorimatsu

Sadorimatsu

Efremov

Sadorimatsu

Efremov

Sadorimatsu

Объясню понятным языком:

Efremov

Объясню понятным языком:

Sadorimatsu

Zero-cold

Raniyx

Мы ценим вашу конфиденциальность

Файл robots.txt

Что это и для чего?​

Реклама, support, вопросы по проекту

Объясню понятным языком:​

Объясню понятным языком:​

Мы ценим вашу конфиденциальность

Что это и для чего?

Объясню понятным языком:

Объясню понятным языком: