Shkondin.ru

Почему вредно знать о BM25?

Click to rate this post!
[Total: 14 Average: 2.9]

Директор? Да пошёл ты в жопу, директор!
Не до тебя сейчас (© Масяня)

Не очень понимаю людей, придерживающихся стратегии контент-маркетинга в стиле поручика Ржевского: «Я — Д’Артаньян, а вы все — …мушкетёры».

В двух словах, некий директор SEO-компании взялся утверждать, что  рынок SEO, которое не наука и не искусство, а всего лишь ремесло, умер. Потому что никто не готовит подмастерий. Кроме, видимо, самого директора.

Что само по себе странно, т.к. если кто-то берёт сайты на продвижение и достигает обещанных хотя бы на словах результатов, значит на рынке существует достаточное количество обученных ремесленников. Не являющихся Д’Артаньянами, но туго знающих своё ремесло.  А значит рынок жив.

Так может быть дело не в рынке, а в директоре?  Давай попробуем разобраться почему это так.

Один из вопросов,  который задаёт  директор соискателю:

Вы знаете, что такое ГЕОзависимые и ГЕОнезависимые запросы?

Да, знаю. Это анахронизм периода начала второй половины первого десятилетия 21 века. Когда в интерфейсе Яндексе существовала галочка «сайты из региона», не применялись переформулировки запросов в нынешних объёмах и не использовалась технология Спектр.

Сегодня, слава птицам, каждый запрос может быть и геозависимым и геонезависимым одновременно.  Это когда поисковик знает по поведению пользователей, что для кого-то данный запрос является информационным. То есть  кого-то интересует ответ на вопрос что это такое. И лучшим ответом  будет энциклопедия. В этом случае запрос трактуется и модифицируется поисковиком как геонезависимый.

А для других пользователей этот запрос является транзакционным. То есть они уже знают что это такое, но хотят узнать где и по какой цене эту штуковину приобрести.  Жителя Петербурга мало интересуют предложения из Москвы. И тот же самый запрос трактуется и модифицируется как геозависимый. С добавлением к исходному запросу топонима, а так же слов цена и купить. Пример? Пусть будет запрос гидромодуль.

То есть для оптимизатора важно знать как исходный запрос пользователя был изменён поисковиком.  А если применяется СПЕКТР, то любой изначально геозависимый запрос превращается поисковиком  в геонезависимый лёгким движением руки добавлением к исходному запросу довеска своими руками или фото. Или другим модифицирующим довеском, например что такое.

И это всё в рамках одного исходного запроса. Таким образом, [bctt tweet=»геозависимостью обладает не запрос, а ответ на него» via=»no»]

Оптимизатор может сам принять решение, как продвигать сайт по запросу: как по информационному или как по транзакционному. И выберет для оптимизации разные документы с сайта. Или создаст новые. И если продвижение не ограничивается одним Default-city, а подразумевает продвижение сразу по нескольким регионам, то лучше выбрать информационный вариант. Чем париться с перечислением всех регионов на странице.

А что хотел узнать у соискателя господин директор? Работал ли соискатель на рынке в дветысяче-лохматом году?

Перейдём к другому вопросу директора:

Вы знаете, что такое BM25?

Да-да-да. Это семейство ранжирующих функций, которые сильно влияли на позиции сайтов в вебпоиске. До изобретения PageRank.  Ещё знаю, что среди пресловутых 800 факторов ранжирования Яндекса данное сочетание букв применяется чаще других. Однако знания о BM25 скорее вредны для оптимизатора. И вот почему.

  1. И в этом случае гораздо важнее знать переформулировки исходного запроса.  Тот самый гидромодуль для хорошего ранжирования требует присутствия в документе, к примеру, слова чиллер. Можно ли извлечь данный факт из знания о BM25? Нет.
  2. Попытка оптимизировать документ под BM25, то есть подобрать «оптимальную» плотность ключевых слов в разных частях документа, вероятнее всего ухудшит метрики качества текста (читабельность, естественность, применение общеупотребимых и редких слов, синонимов и т.д. )  Влияние этих метрик на ранжирование ничуть не меньше, чем BM25. Это основы борьбы с дорвейным автогенерённым контентом.
  3.  Вообще любые попытки угодить поисковику больше, чем посетителю, вероятнее всего скажутся на ранжировании негативно.  Всё дело в поведенческих факторах ранжирования. То есть оптимизатору гораздо важнее знать как побудить посетителя к взаимодействию с сайтом, чем о BM25.

Спрашивал ли директор о признаках качественного и не очень качественного текста, о том как влиять на кликабельность сниппетов и нужно ли это делать, как побуждать посетителя взаимодействовать с сайтом? Нет.

Выводы:

Сегодня гораздо проще взять толкового копирайтера, чем искать реликтового seoшника, знающего о TF/IDF и BM25. Где найти такого копирайтера — отдельный вопрос. Но переучивать и его будет не легко. И обучить этого копирайтера азам оптимизации. Вместо того, чтобы обучать сеошника копирайтерскому ремеслу (не путать с продажей знаков за рубли).  Готовый оптимизированный текст, вышедший из под пера такого копирайтера, должен содержать все ключевые слова из переформулировки поисковой системы. Каковые можно и нужно определять автоматически, без человеческого участия.

Количество же повторений конкретного слова в тексте должно определяется исключительно коммерческой целесообразностью. А не мифической формулой, коэффициенты которой либо неизвестны вовсе, либо определяются с точностью плюс-минус лапоть. Текст должен побуждать посетителя купить, а не поблевать на экран.

Дополнительно такой текст хорошо прогнать через сервис Главред  (или его аналоги). Чтобы окончательно избавиться от воды, свойственной многим копирайтерам. Особенно пишущим тексты по ТЗ от seoшников. И заодно сделать этот текст 100% уникальным. В среднем по больнице такой текст проблем с ранжированием иметь не будет.

Если дизайнер, верстальщик и админ не запороли ПФ на корню.

Вышеизложенные соображения, на мой взгляд, очевидны для каждого практикующего сеошника. Директора же, застопорившегося в своём профессиональном развитии, как впрочем и положено начальнику, сосредоточенному на управлении, от собеседований по существу профессии лучше отстранить. Или я не прав?