Методы кластеризации

Чтобы объяснить, как работает кластеризация, представим, что в нашем проекте три запроса: A, B и С. Сначала по всем запросам проверяется частота ("!Частота" в Яндексе), и запросы сортируются по частоте от большей к меньшей. Допустим, что частота запроса A — 100, запроса B — 50, а запроса С — 30.

Дальше по каждому запросу собирается ТОП‑10 сайтов в поисковой выдаче. Обозначим выдачу по запросам как выдачу A, выдачу B и выдачу С. Следующий этап — это сравнение URL в ТОПах между собой. За принцип сравнения URL отвечает метод кластеризации.

SOFT

При методе SOFT Топвизор сначала сравнивает выдачу B с выдачей A (за основу во всех методах всегда берется запрос с наибольшей частотой). Если в ТОПе B и ТОПе A есть одинаковые URL (столько, сколько указано в степени кластеризации), запрос B добавляется в группу к запросу A. То же самое происходит с выдачей С: Топвизор сравнивает выдачу С и A, и, если в них есть одинаковые URL, добавляет запрос С в группу к запросу A. При этом не учитывается, есть ли общие URL в выдачах по запросам B и С, они не сравниваются между собой. Получается, что при методе SOFT все запросы группы будут связаны с самым частотным запросом, но остальные запросы между собой могут быть не связаны.

Кластеризация запросов, Методы: Как работает кластеризация методом SOFT

MODERATE

При методе MODERATE запросы сравниваются попарно. Сначала берется выдача A и сравнивается с выдачей B. Если у них есть одинаковые URL, то запрос B помещается в одну группу с запросом A. Дальше берется выдача B и сравнивается с выдачей C. Если у них есть одинаковые URL, запрос C добавляется в группу к запросам A и B. При таком методе у запросов A и C может не быть общих URL, то есть все запросы будут попарно связаны друг с другом, но в разных парах URL в ТОПах по запросам могут быть разными.

Кластеризация запросов, Методы: Как работает кластеризация методом MODERATE

HARD

При методе HARD сравнивается выдача по всем запросам: A, B и C. Чтобы робот поместил их в одну группу, во всех трех ТОПах должны быть совпадающие URL. То есть одинаковые страницы (количество страниц = степень кластеризации) должны быть одновременно в выдаче A, B и C. Таком образом, все запросы будут максимально связаны между собой общими URL.

Кластеризация запросов, Методы: Как работает кластеризация методом HARD

Степень кластеризации

Степень кластеризации — это количество URL в поисковой выдаче, которые должны совпадать, чтобы запросы попали в одну группу. Например, если выбрана степень кластеризации 3, Робот будет искать совпадения по трем URL в выдаче и собирать такие запросы в одну группу.

Кластеризация запросов, Степень: Что значит степень кластеризации

Вероятность того, что по запросам в выдаче будет совпадение по 1‑3 URL выше, чем по 9‑10. Поэтому чем меньше степень кластеризации, тем полнее будет группа, а количество групп будет меньше. Если выбрана степень 8‑10, то групп будет много, а запросов в каждой группе будет мало.

Как можно протестировать разные методы кластеризации и сравнить результаты?
Чтобы выбрать несколько степеней кластеризации, поставьте флажок Отправить на почту при запуске операции, и вы получите результаты по всем степеням на e‑mail в виде файлов csv. Также в течение семи дней после кластеризации вы можете изменить Степень и Метод кластеризации по сниженной цене. Чтобы сделать перекластеризацию, нажмите на панели инструментов, выберите Степень и Метод и нажмите Изменить.