Что такое кластеризация

И как ее эффективно использовать



В мире анализа данных и машинного обучения термин "порог кластеризации" часто используется, но мало кто знает его истинное значение. В нашей статье мы проливаем свет на этот термин и объясняем его сущность. Порог кластеризации - это критическое значение, которое определяет, насколько близко должны быть объекты, чтобы они считались принадлежащими к одному кластеру. Мы исследуем различные методы определения порога кластеризации и объясняем, как его выбор может влиять на результаты анализа данных.

Под определением «кластеризация запросов» понимают группировку семантического ядра, разделенную по группам или кластерам. Продвижение каждого ключа осуществляется на разных посадочных страницах. Если сортировка по группам выполнена правильно – это имеет большое значение для сортировки сайтов в поисковиках, которые используются в системах для поиска.

Разделение по группам таких запросов происходит с учетом того, насколько они схожи в поисковой выдаче. Например, результаты по коммерческим порталам и по информационным сайтам могут существенно отличаться между собой. Если продвигать ключи из разных категорий на одной странице, то релевантность их со временем будет становиться меньше, а это значит, что не удастся добиться их продвижения в поисковой системе.

Например, возьмем два ключевика, указанных на фото ниже. И вроде бы продвигаться такие слова должны одинаково, но в ТОПе они выглядят несколько по-разному.

Получается, что два эти вроде бы похожих ключевика в разных поисковых системах определяются отличным интентом. А значит и продвигаться они должны на различных страницах. Но если у вас огромное количество фраз, то отследить их вручную не получится. В этом случае полезной будет такая функция, как кластеризация.

Кластеризация – для чего она необходима?

Кластеризация выполняет сразу несколько функций:

  • Если правильно провести кластеризацию, то вывести запросы в ТОП будет намного проще и в несколько раз быстрее, кроме того, этого не потребует дополнительных затрат. А вот если неправильно распределить запросы по кластерам, т.е. кластеризацию, то топовых позиций достичь не удастся.
  • Кластеризация позволит понять, какая структура должна быть у портала, какие страницы понадобятся в дальнейшем, и какую информацию на них нужно разместить, чтобы добиться высоких результатов.
  • Если кластеризацией объединить все запросы по группам, то каждый клиент сможет найти необходимые для себя страницы, а также полный ответ на заданный вопрос. Благодаря этому количество отказов сведется к минимуму, а количество продаж, наоборот, повысится. Также кластеризация положительно повлияет и на целевой трафик.

Разновидности группировок

Давайте поговорим о том, в какие группы можно объединить запросы, и какой из вариантов для каких тем подойдет. Также рассмотрим минусы каждого из вариантов.

Запросы, разделенные логически

Запросы можно разделить по тому, что именно искал клиент. Но такой вариант подойдет только в том случае, если у продавца мало конкурентов, и информации по этому товару также небольшое количество. Соответственно и информация по выдаче будет постоянно меняться, а значит результаты в ней могут быть не релевантны.

Дополнительный вариант того, как можно воспользоваться подобной разбивкой – это использовать ее в тех случаях, когда в СЯ много низкочастотных фрагментов. Конкуренция минимальная, у поисков мало информации о том, как ведут себя пользователи – соответственно, и результат выдачи будет минимальным.

Что же до иных случаев, то для них этот способ разбивки лучше не использовать, так как велик шанс того, что пользователь ошибется. И количество потраченного времени будет максимальное, особенно если речь идет о большом количестве ключей.

Разделение по семантической схожести

Ключевики имеет смысл объединить в одну группу, если в них пересекаются общие фрагменты. Например, «купить трактор», «синий трактор», «игрушка трактор» и так далее. Соответственно, общим здесь будет слово «трактор», и именно на него ориентируются при группировке запросов.

Несмотря на простоту такой группировки, результат зачастую бывает ошибочным, так как на одну страницу могут попасть и коммерческие, и некоммерческие запросы, а значит и выдача будет низкой.

Еще один параметр, который не учитывается при таком типе группировки – это интент человека. Если он при открытии ссылки не сможет найти те данные, которая его изначально интересовали, то он просто уйдет с этого сайта, и снова вернется в выдачу. Из-за этого становится сниженной конверсия.

Группировка, осуществляемая по ТОПам

Этот вариант группировки является более совершенным, так как он осуществляется через оценку схожести в поисковике.

Если для отличных ключей имеются одинаковые документы, то вполне возможно, что их можно будет объединить в одну группу. Соответственно, чем больше совпадений встречается, тем выше вероятность того, что запросы можно продвигать на одной странице. Если же таких совпадений вообще нет, то высока вероятность того, что ключи нужно продвигать на разных страницах.

Алгоритмы для ТОПов

Чтобы правильно выполнить кластеризацию, нужно вначале проверить ключевики по топам в поисковой выдаче, и лишь затем сегментировать спорные запросы вручную. Выполнить это можно разными способами – например, Soft, Middle или Hard. Рассмотрим каждый из этих вариантов кластеризаций более подробно.

Вариант Soft

При данном методе все запросы сравниваются с основным ключом, имеющим самую большую частность. В кластер входят все запросы, которые пересекаются с главным ключом. Ключевик оказывается в кластере в том случае, если URL выше такого показателя, как порог кластеризации.

Порог кластеризации это что? Это минимальное количество URL для создания группу. И если для Soft минимальным количеством является 4 URL, то для Hard-кластеризации — 3.

Здесь стоит добавить, что второстепенные запросы могут даже не пересекаться между собой, так как в кластер добавляется сразу много ключей. Эта кластеризация лучше всего показывает себя в молодых проектах, а также в темах с минимальным количеством конкурентов, где точность сортировки запросов не столь важна.

Лучше всего данная кластеризация подойдет для сайтов с небольшим количеством информации, либо интернет-магазинов, обладающих небольшим ассортиментом. Также данный метод можно использовать и для сайтов-визиток.

Hard

Этот вариант считается более жестким, и использовать его лучше либо в сложных тематиках, либо в темах, имеющих большую конкуренцию. Его имеет смысл использовать только в тех случаях, когда все ключи пересекаются между собой. Но помимо главных ключей также сравниваются и вспомогательные – кластер образуется, только если соблюдаются оба эти условия.

Порогом для данного случая кластеризации является не только совпадение главного ключа, но и всех остальных ключей, которые входят в кластер. Соответственно, чем выше будет такой вид порога, тем меньше ключей окажется в кластере.

Middle

Данный вариант является своего рода компромиссом между предыдущими двумя описанными методами. Для этого выбирается какой-то один основной ключевик, к которому привязывают все остальные фразы, которые прошли по критериям порога данного метода кластеризации. При этом программа сравнивает все фрагменты, зависимые от основного ключевика, друг с другом.

Как результат, все запросы связаны между собой, но при этом они могут отличаться в разных парах проверяемых URL. У запросов нет задачи пройти проверку на пересечение, а сопутствующие ключи находятся в группе вместе с задающим тематику ключевиком.

Такой метод используют либо на информационных сайтах, где большое семантическое ядро, либо в нишах, где слабая конкуренция. Благодаря этому удается добиться большей точности, чем в Soft, но при этом не отсеивается большая часть ключевиков, как это бывает с Hard.

Когда группировка запросов в ТОП дает неточный результат?

В некоторых случаях система может «обмануть» и дать неточный результат. Всего таких ситуаций можно насчитать как минимум пять:

  • Были неправильно установлены пороги. Например, вы указали, что достаточно будет всего одного совпавшего сайта, и им оказалась Википедия, которая есть в топе в 200 ключах. Соответственно, у вас появится один кластер в 200 запросов, и вы решите, что с помощью одного документа сможете продвинуть сразу 200 ключей.
  • Работа ведется по новой теме, которая возникла совсем недавно. Соответственно, ТОП-10 постоянно штормит, так как по этой теме появляются новые новости и статьи с разных источников. Соответственно, группировка по ТОПу в этом случае – не ваш вариант.
  • У вас много низкочастотных и небольших ключей, либо запросов, в которых от шести слов и более. У системы может возникнуть проблема с анализом поведения пользователей на выдаче, да и само качество выдачи может быть низким. Поэтому при проверке таких низкочастотных «хвостов» стоит обращать внимание еще и на потребность пользователей. В противном случае процедура кластеризации не будет работать как нужно.
  • Еще один вариант, который встречается редко, но все же также имеет место – это когда в выдаче слишком много результатов с одного портала. Соответственно, многие программы в такой момент начинают перевирать информацию. Предположим, что вы собираете информацию по депозитам, и у вас есть запрос «депозит Промсвязьбанк», по которому вы желаете попасть в ТОП. Как результат, информации с сайта Русского Стандарта может быть достаточно для того, чтобы склеить большое количество ключей, просто потому что было несколько результатов с одного сайта. Если такое произошло – стоит пересмотреть кластеры.
  • Много разных «добавок». Если на входе не была проведена фильтрация, о велика вероятность того, что в результате вы получите много небольших групп.

Это как минимум пять вариантов, но есть и другие, которые встречаются реже, но также имеют место.

Что делать, если кластеризация по ТОП не дала нужного результата?

Лучшее, что вы можете сделать для себя – это подобрать наиболее подходящий вариант. Но нужно понимать, что такая сортировка ключей «врет» лишь в самых крайних случаях. Однако даже если у вас популярная тема, о которой достаточное количество информации в интернете – рекомендуется оценивать интент пользователя. Самому подумать, что он хочет получить в результате запроса.

Также стоит использовать в процессе кластеризации метод и «силу». Стоит прогнать семантику сразу по нескольким программам, чтобы уровень «силы» был разный – 2, 3 или 4. То есть лучше указывать несколько одинаковых URL-адресов, которые должны быть в минимальном топе. Также можно будет попробовать прогнать запросы через несколько поисковых систем.

Способы кластеризации, которыми можно воспользоваться

Кластеризацию можно выполнить и вручную, если у вас несколько ключей, но гораздо рациональнее использовать для этого специальные программы. Итак, все способы кластеризации делятся на несколько вариантов:

  • Как уже и говорилось ранее, такая техника занимает много времени. А если ключей много, то самостоятельно отсортировать их по группам практически невозможно. Также велика вероятность ошибки с кластеризацией из-за человеческого фактора.
  • Различные сервисы. Благодаря им можно отработать большое количество информации. Однако результат может быть ошибочным, поэтому лучше воспользоваться сразу несколькими инструментами для кластеризаций.

Вот почему лучше воспользоваться сразу двумя вариантами кластеризации: сначала разделить запросы по группам в программе, а затем просмотреть их еще и вручную по принципам, описанным выше. Но при использовании конкретной программы также лучше прочитать, по каком принципу она работает. Среди программ встречаются те, которые ищут схожесть только по словоформам, а не по выдаче.

Автоматическая кластеризация

Большинство инструментов, используемых для кластеризации, основана на том, что анализирует выдачи в поисковых системах по конкретным ключам. Разница заключается лишь в том, что анализирует результат программный код, а не вы. Рассмотрим несколько наиболее популярных инструментов, который подходят для группировки запросов.

Just Magic

Преимущество этого сервиса заключается в том, что здесь можно не только выполнить распределение по группам, но и определить коммерческость запроса, что также важно при анализе семантического ядра. Для того чтобы отсортировать запросы по группам, нужно войти в «Сервисы», а затем выбрать «Кластеризатор». Именно здесь и совершается магия.

На рисунке можно увидеть, как работает сервис, состоящий из следующих полей:

  • Раздел «Метка» отображает название проекта, чтобы в дальнейшем его было проще найти в списке выполненных задач.
  • Раздел «Регион» выставляется либо буквами, либо кодом – сервис разбирает оба варианта.
  • Третьим пунктом идет определитель коммерческости. Если у вас уже имеется какое-то определенное СЯ, то галочку здесь можно и не ставить. Если же есть какие-то сомнения по запросам, то этой функцией лучше воспользоваться.
  • Еще одна функция – это домен, предназначенный для поиска релевантных страниц. Сюда вам нужно будет ввести свой домен. При нахождении подходящей страницы она появится в соответствующем поле.
  • Раздел «Фразы» предполагает, что сюда нужно будет ввести список своих ключевиков.

Сервис очень простой и понятный даже новичку. Когда все поля будут заполнены – следует нажать на клавишу «Отправить задачу», после чего останется дождаться результата.

В результате пользователь получит таблицу, где будет представлена информация о том, к какой группе относится ключ. Здесь же будет информация о количестве главных страниц сайта, имеющихся в выдаче, о коммерческости ключа (где 0 – это информационный, а 1 – это коммерческий запрос), а также о наиболее подходящих URL и теме, к которой относится ключевик. Эту информацию можно скачать, чтобы в дальнейшем можно было работать с семантическим ядром.

В результате пользователь получит таблицу, где будет представлена информация о том, к какой группе относится ключ. Здесь же будет информация о количестве главных страниц сайта, имеющихся в выдаче, о коммерческости ключа (где 0 – это информационный, а 1 – это коммерческий запрос), а также о наиболее подходящих URL и теме, к которой относится ключевик. Эту информацию можно скачать, чтобы в дальнейшем можно было работать с семантическим ядром.

Как видите, инструмент этот довольный удобный, так как в нем довольно редко встречаются спорные вопросы. Но у него есть один существенный минус – он является платным.

Key Collector

Этот сервис известен всем тем, кто занимается оптимизацией информационных и коммерческих порталов. В этой программ можно пройти кластеризацию бесплатно, но для этого уже должны быть собраны все ключи и информация по поисковой выдаче. После этого нужно перейти в раздел «Данные», а затем – в «Анализ групп».

Далее выбираем, как должны группироваться наши запросы – «по поисковой выдаче».

Здесь, также, как и в предыдущем сервисе, можно скачать все данные, а затем начать с ними работать.

Pixel Tools

Этот инструмент используется для того, чтобы не только поделить все ключевики по группам, но и создать правильную структуру сайта, если смотреть на этот вопрос с точки зрения СЕО-оптимизации. Также у этого сервиса есть несколько дополнительных функций, которые схожи с justmagic.

Также есть у этого сервиса и своего рода «изюминка». Помимо таких методов кластеризации, как Hard и Soft, здесь также предлагается такой инструмент, как «Пиксель Тулс». Это своего рода уникальный алгоритм, разработанный данной компанией, который анализирует информацию более точно. Разработчики рекомендуют использовать этот метод для классического продвижения по позициям. Например, если нужно продвигать по трафику, то можно воспользоваться Софт-методом. 

Как результат, пользователь может увидеть стандартный документ, состоящий из таких полей, как основной запрос, URL, группа, в которую входит ключ, позиция, а также количество основных страниц в выдаче.  

SEOQuick

Этот инструмент можно отнести к одному из самых простых – он только группирует запросы, но не ищет URL, которые подходят для продвижения. Лучше всего такой вариант подходит для смешанной кластеризации. Здесь можно будет сгруппировать ключи, а подбор страниц уже выполнить вручную.

Как результат, пользователь получит готовую таблицу, где все запросы разделены по группам.

Понятно, что у этого инструмента не так уж и много функций, но зато он является полностью бесплатным.

Coolakov

Это еще один сервис, благодаря которому можно разбить ключи на группы. И даже если вы пользуетесь такой программой впервые – она будет для вас предельно простой и понятной. Во время заполнения формы нужно будет ввести регион продвижения, список ключей, а также, если в этом есть необходимость, порог кластеризации. 

Преимущество этого сервиса заключается в том, что он также является полностью бесплатным. Как результат, вы получаете таблицу, где все ключи распределены по группам.

Каких-то дополнительных параметров сервис не показывает, но чаще всего этого и не требуется. Поэтому будем считать, что данный инструмент заслуживает внимания.

Заключение

Кластеризация необходима для того, чтобы лучше распределить ключи с позиции поисковых систем по посадочным страницам. Это один из основных способов построения СЯ, так как при наличии ошибок все работы по оптимизации придется выполнять по новой. От результатов группировки будут зависеть объем необходимой информации, его содержание, распределение ссылок внутри сайта, структура информационного или коммерческого портала, а также иные факторы.

Не важно, какой сервис вы выберете, платный или бесплатный, он все равно не гарантирует вам 100% результата. Группы, полученные в итоге, нужно дополнительно проанализировать вручную, и попробовать несколько вариантов точности кластеризации.

Также следует помнить, что разделение по группам нельзя провести лишь один раз и навсегда. Со временем выдача поменяется, поэтому хотя бы раз в год нужно пересматривать семантику, убирать ключи, которые уже не актуальны, и добавлять новые.

Подпишитесь на рассылку для предпринимателей
Вы будете получать новости по нашим направлениям, советы и кейсы предпринимателей
Вы подписаны!

Нажимая кнопку «Войти», Вы принимаете условия
Политики конфиденциальности

1 комментарий
Гость
20 июля 2023 года

Я нашел эту статью о кластеризации очень интересной и полезной. Она хорошо объясняет, зачем нужна кластеризация и какие есть разновидности группировок. Рассмотрение алгоритмов для ТОПов и причин неточных результатов действительно помогает. Если кластеризация по ТОП не дала желаемого результата, статья предлагает решения. Важно также узнать о различных способах кластеризации и автоматической кластеризации. Жду интересного заключения, чтобы обобщить полученные знания.

Ответить
Похожие статьи

Задача кластеризации

Классификация и кластеризация: отличия

Что такое кластер?

Поисковая оптимизация

Позиция в Яндексе по поисковым фразам онлайн

Типы поисковых запросов

Новые
Популярные
Просмотры: 620

Скрытая семантика

Просмотры: 760

Парсинг ключевых фраз

Просмотры: 1188

Поисковые подсказки

Просмотры: 6421

Что такое кластер?

Просмотры: 4687

Классификация и кластеризация: отличия

Просмотры: 3771

Что такое кластеризация

Класстеризация
  • Анализ сайтов кластер
  • Предоставление данных кластер
  • Отслеживание позиций кластер
  • Анализ конкурентов кластер
Некластеризация
  • Анализ сайтов Некластер1
  • Предоставление Неданных кластер
  • Отслеживание Непозиций кластер
  • Анализ конкурентов Некластер

а вот здесь шеф жжет с задачками(((((((