
Мы разберем 👇:
- как выстроить 🎯 сбор начальных запросов для интернет-магазина,
- 🛠️ использование подсказок для расширения семантики,
- 📊 анализ частотности: что важно учитывать,
- ✨ кластеризацию запросов для логичной структуры,
- и, конечно, как грамотно 🎖️ обработать кластеры для максимальной эффективности.
В службу поддержки Rush Analytics oптимизаторы часто обращаются с вопросом, как собрать полное семантическое ядро. В этой статье подробно расписаны все этапы, а также раскрыты некоторые фишки, которые мы используем в работе.
Краткий план действий по сбору семантики:
- Сбор начальных запросов по теме, тегов;
- Сбор подсказок;
- Сбор данных по частотности;
- Кластеризация;
- Обработка кластеров.
Опишем подробнее каждый этап.
1. Сбор начальных запросов
Для этого используем следующие методы:
Сбор левой колонки yandex wordstat. Можно использовать наш сервис (сбор левой колонки) — это позволяет собрать все доступные значения, которые выдает вордстат по главному слову. Можно вручную собирать данные из Yandex.Wordstat или использовать расширение для браузера Yandex Wordstat Assistant— которое облегчает работу и помогает сохранять нужные слова сразу же в отдельный документ.
- Сбор структуры у конкурентов. Здесь все просто – находим наиболее развитые по структуре сайты конкурентов, собираем основные названия категорий по теме.
- Если раздел по теме есть на сайте, но вам нужно расширить его структуру, используем данные Google Analitycs и данные Яндекс.Метрики. Рекомендуем использовать Canvas Analitycs – который позволяет достать данные из google analitycs без семплинга (объединения данных). Как это правильно сделать – будет описано в отдельном посте. В полученных данных выбираем запросы, которые могут быть маркерами и основной для подразделов на сайте.
- Еще одним способом получения начальных запросов является их генерация в Excel. Здесь есть несколько подходов:
Добавляем предлоги: «платье + на», «платье + для» и т.д.
Генерируем запросы со словами «купить + маркерное слово».
Генерируем запросы путем добавления наиболее часто употребляемых слов – «дешевые», «со скидкой», «распродажа».
Добавляем прилагательные и слова по теме: «узкие диваны», «ортопедические диваны», «диваны с ящиком для белья» и т.д. - Также можно брать тексты конкурентов в ТОП и тексты из wikipedia по теме и разбивать текст на n-граммы. После этого выбираем n-граммы, которые имеют смысл.
- Яндекс.Маркет – также может дать много полезной информации. В каждом разделе каталога Яндекс.маркет есть разделы «Рецепты», «Словарь терминов», «Самые желанные».
Раздел «Рецепты» отлично подойдет для определения самых популярных тегов, в том числе и для структуры раздела.
В разделе «Словарь терминов» вы найдете дополнительную углубленную информацию по характеристикам товаров, которая поможет разобраться что к чему, особенно если вы не знакомы с товаром. Также из текста можно выделить полезные n-граммы и также добавить их с список для сбора подсказок.
Раздел «Самые желанные» полезен для определения спроса и самых популярных товаров.
Все это делается для того, чтобы начальное ядро семантики, которое мы отправляем на подсказки было наиболее полным. Надо понимать, что подсказки чаще всего генерируются путем подстановки и перебора букв к заданным словам, и мы должны задать полный перечень возможных первоначальных запросов.
Получите бесплатно стратегию, в которой мы:
- Проведем комплексный SEO-аудит вашего сайта
- Выявим все возможности для роста трафика
- Рассчитаем прогноз увеличения заявок и продаж

2. Сбор подсказок
Мы загружаем полученный список первоначальных слов в сборщик подсказок. При сборе маркерных запросов в левой колонке wordstat вы можете увидеть лишние запросы, которые попадают по этому теме. Например, если вам нужна семантика по катушкам для рыбалки, введя этот запрос в wordstat.yandex.ru, вы видите лишние слова – “индукционная катушка”, “катушка для кабеля” и т.д.
Необходимо добавить стоп-слова прямо в проект сбора вордстата – так вы сэкономите деньги и время на обработку семантики потом.
3. Сбор данных по частотности
После получения списка подсказок, необходимо удалить лишние стоп-слова. Как это можно сделать в эксель – мы напишем отдельной статьей, так как там есть свои хитрости. Сейчас предлагаем воспользоваться сервисом удаления стоп-слов из семантики, который есть на нашем ресурсе.
Далее, загружаем список ключевых слов в сборщик wordstat, чтобы получить данные по частотности. Для определения потенциальности запроса лучше собирать все три значения – простое, в кавычках и с восклицательным знаком. Однако, для экономии, достаточно ориентироваться на значение в кавычках.
4. Кластеризация
Сервис кластеризации позволяет сгруппировать полученные запросы в группы – на основе ТОПа. Группировка может идти как по обозначенным вами маркерам, по данным wordstat или смешанным образом. Рекомендуется выбирать несколько уровней точности, чтобы определить, какой для вашей группы товаров наиболее оптимальный. В целом, действует правило – чем более конкурентная тематика, тем больший уровень точности можно выбирать.
Как это поэтапно работает – описано здесь.
В результате вы получаете файл, в котором кластеры отсортированы по частотности, с указанием суммарной частотности каждого кластера.
5. Обработка кластеров
Так как кластеризация, особенно с большим уровнем точности, дает большое количество групп, некоторые из них должны быть объединены в структуре.
Например, могут быть группы «детский интернет-магазин» и «интернет-магазин детских товаров». Объединение чаще всего происходить логически – эти две группы запросов имеют одни и те же леммы и один и тоже интент (желание пользователей). Также можно смотреть на результаты выдачи – если в выдаче по основным запросам кластеров есть хотя бы один общий сайт, похожий на ваш (например, интернет-магазин) – подобные группы можно объединять.
Как легко объединить большое количество групп – мы расскажем в отдельной статье.
Здесь без опыта и «чутья» оптимизатора может быть сложно – однако логика и наблюдение существующей выдачи по запросу вам даст необходимую для принятия решения информацию.