Кластеризация ключевых слов - это эффективный способ создания семантического ядра сайта. Точное построение запросов может направить клиентов к нужному товару или услуге без поиска.
Существует два типа автоматической кластеризации(кластеров):
- Кластеризация по фразам. Кластеризация по фразе основана на ее составе, то есть на пересечении слов. Такая группировка не всегда оправдана. Во многих случаях фразе присваивается неверный смысл (формы), и полученные группы приходится дорабатывать вручную. Например, именно такой вариант используется при группировке сервисом KeyCollector;
- Согласно актуальным запросам. Этот вариант предпочтительнее, поскольку он создает группы на основе страниц, отсортированных по заданному выражению. Синонимичные выражения, отсортированные по одной и той же странице, могут быть сгруппированы в один кластер.
В дополнение к методам кластеризации существует автоматическая плотность кластеризации. Плотность показывает, сколько перекрытий требуется для объединения фраз в одну группу.
При ранжировании страниц поисковые системы учитывают релевантность определенному запросу. Поэтому, если попытаться оптимизировать страницу под несовместимые ключевые фразы, она не попадет в топ-10 ни по одной фразе или даже по всем. Посетители, зашедшие на сайт по запросу, увидят несоответствующий контент, решат, что страница не для них, и уйдут. В результате коэффициент прямого возврата увеличится, а целевая страница не будет занимать высокие позиции в поисковых системах.
Сначала на основе поискового запроса определяются основные потребности людей в выбранной теме. Затем для каждой проблемы или задачи из семантического ядра выбираются фразы, которые описывают ее с разных сторон. Затем они объединяются в группу - семантический набор. Затем копирайтер ориентируется на них, чтобы дать точный ответ на соответствующей странице сайта.
Задача классификации заключается в восстановлении отображения от набора объектов к конечному набору меток классов. В этом случае классы предопределены, т.е. изначально существует приблизительное понимание того, какие объекты должны принадлежать каждому из них, и имеется обучающая выборка, содержащая экземпляры объектов и классы, к которым они принадлежат. В базовом направлении кластеризации объекты расслаиваются на конечное множество классов, но нет обучающего примера или определения природы классов. Тот факт, что модель кластеризации считает некоторые объекты "похожими" и относит их к какому-либо классу, является "открытием", сделанным моделью, и представляет собой новое знание. Также не существует обучающего примера. Ведь невозможно заранее знать, какие классы (а иногда и их количество) будут получены. Поэтому кластеризация - это задача обучения без наблюдения. Из-за общей схожести постановки задачи в литературе кластеризацию иногда также называют классификацией без наблюдения.
Кластеризация отличается от классификации тем, что нормативы для кластеризации устанавливаются людьми, а не алгоритмами. Этот способ автоматизированного обучения часто применяется к различным неструктурированным информационным массивам или формам, например, для автоматической сортировки коллекции изображений на мини-группы по расцветкам.