Shkondin.ru

Заражённые запросы

Click to rate this post!
[Total: 0 Average: 0]

Время от времени, в сети появляются предложения купить набор «реальных поисковых запросов» объёмом n млн+ записей (не, m -мало, надо написать n)
Я, как последняя редиска, собираюсь немного подпортить этот биз. Ага.

Что вы должны знать, прежде, чем купить подобную базу.

Во-первых, за сумму всего лишь в $180 (из них $30 за доставку) можно получить такую базейку:

File sizes: approx. 24 GB compressed (gzip’ed) text files
Number of tokens: 1,024,908,267,229
Number of sentences: 95,119,665,584
Number of unigrams: 13,588,391
Number of bigrams: 314,843,401
Number of trigrams: 977,069,902
Number of fourgrams: 1,313,818,354
Number of fivegrams: 1,176,470,663

Там, конечно, нет информации по бидам и популярности у посетителей Гугля, но зная фразу, получить эту информацию не трудно. Это не запросы, а словосочетания, выдернутые из текстов, размещённых в интернете. Это важное отличие, и вот почему.

Во-вторых, нужно знать о существовании термина заражённые запросы. Не думаю, что их заражают специально, но тем не менее «заражение» есть. Дело вот в чём: все сервисы, транслирующие запросы, заточены под показы рекламы. Т.е. к пользовательским «ошибкам» (а они часто ленятся писать предлоги, союзы и прочие артикли) добавляются модификации запросов сервисом, которые (модификации) используются для того, чтобы рекламные объявления показывались почаще.

Привожу пример, конечно высосанный из пальца, но, надеюсь, хорошо иллюстрирующий проблему. Словосочетание из базы, упомянутой выше: serve as the integral. Встречается всего лишь 68 раз. Если вы не поняли, почему так редко, то вы как и я не настолько хорошо знаете английский, чтобы безошибочно определять где используется неопределённый артикль бля a, а где определённый the. Если в вышеупомянутом словосочетании поменять артикль с определённого на определённый, то такое словосочетание будет встречаться уже несколько десятков тысяч раз. Пользователи же при поиске документов, наверняка будут опускать артикль, а поисковик скорее всего предложит фразу serve integral, чтобы рекламодатель мог охватить не только эти две фразы, но и ещё несколько других, содержащих слова serve и integral. А теперь подумайте, что произойдёт, если вы заточите дорвей под фразу, которую часто ищут, но редко используют? Я так думаю, что умеренное использование подобных фраз сойдёт за ошибки, а если каждая страница сайта будет содержать редкие фразы, то его судьба предрешена. Как говорится, хотите — верьте, а хотите — проверьте.

Ну и в-третьих, небольшая задачка на сообразительность. Представьте, что у вас есть подобная база, содержащая информацию по стоимости клика, частоте запрашиваемости и количестве конкурентов. Определить все ниши, где есть заметный траффик, приличные биды и почти нет конкурентов, можно одним SQL запросом. Два контрольных вопроса: если вы эту базу собрали сами, будете ли вы её распространять своим конкурентам вместе с нишами, а если вы её купили и в ней по случайному совпадению 🙂 оказались не вырезанными вкусные ниши, будете ли вы счастливы, обнаружив через пару недель в этих нишах несколько десятков злобных конкурентов?