Заражённые запросы

Click to rate this post!
[Total: 0 Average: 0]

Время от времени, в сети появляются предложения купить набор “реальных поисковых запросов” объёмом n млн+ записей (не, m -мало, надо написать n)
Я, как последняя редиска, собираюсь немного подпортить этот биз. Ага.

Что вы должны знать, прежде, чем купить подобную базу.

Во-первых, за сумму всего лишь в $180 (из них $30 за доставку) можно получить такую базейку:

File sizes: approx. 24 GB compressed (gzip’ed) text files
Number of tokens: 1,024,908,267,229
Number of sentences: 95,119,665,584
Number of unigrams: 13,588,391
Number of bigrams: 314,843,401
Number of trigrams: 977,069,902
Number of fourgrams: 1,313,818,354
Number of fivegrams: 1,176,470,663

Там, конечно, нет информации по бидам и популярности у посетителей Гугля, но зная фразу, получить эту информацию не трудно. Это не запросы, а словосочетания, выдернутые из текстов, размещённых в интернете. Это важное отличие, и вот почему.

Во-вторых, нужно знать о существовании термина заражённые запросы. Не думаю, что их заражают специально, но тем не менее “заражение” есть. Дело вот в чём: все сервисы, транслирующие запросы, заточены под показы рекламы. Т.е. к пользовательским “ошибкам” (а они часто ленятся писать предлоги, союзы и прочие артикли) добавляются модификации запросов сервисом, которые (модификации) используются для того, чтобы рекламные объявления показывались почаще.

Привожу пример, конечно высосанный из пальца, но, надеюсь, хорошо иллюстрирующий проблему. Словосочетание из базы, упомянутой выше: serve as the integral. Встречается всего лишь 68 раз. Если вы не поняли, почему так редко, то вы как и я не настолько хорошо знаете английский, чтобы безошибочно определять где используется неопределённый артикль бля a, а где определённый the. Если в вышеупомянутом словосочетании поменять артикль с определённого на определённый, то такое словосочетание будет встречаться уже несколько десятков тысяч раз. Пользователи же при поиске документов, наверняка будут опускать артикль, а поисковик скорее всего предложит фразу serve integral, чтобы рекламодатель мог охватить не только эти две фразы, но и ещё несколько других, содержащих слова serve и integral. А теперь подумайте, что произойдёт, если вы заточите дорвей под фразу, которую часто ищут, но редко используют? Я так думаю, что умеренное использование подобных фраз сойдёт за ошибки, а если каждая страница сайта будет содержать редкие фразы, то его судьба предрешена. Как говорится, хотите – верьте, а хотите – проверьте.

Ну и в-третьих, небольшая задачка на сообразительность. Представьте, что у вас есть подобная база, содержащая информацию по стоимости клика, частоте запрашиваемости и количестве конкурентов. Определить все ниши, где есть заметный траффик, приличные биды и почти нет конкурентов, можно одним SQL запросом. Два контрольных вопроса: если вы эту базу собрали сами, будете ли вы её распространять своим конкурентам вместе с нишами, а если вы её купили и в ней по случайному совпадению 🙂 оказались не вырезанными вкусные ниши, будете ли вы счастливы, обнаружив через пару недель в этих нишах несколько десятков злобных конкурентов?

Поделиться Вконтакте
Плюсануть

6 комментариев к “Заражённые запросы

  1. Дааа, круто, что тут скажешь… одним постом два раза десятку выбить…
    тока я вот не понял, к чему последний вопрос? “будете ли вы счастливы” – не, не буду 🙂 И какие из этого надо сделать выводы?

  2. Выводы простые – если ты идёшь на рыбалку (на охоту, за грибами/ягодами и т.п.), то не стоит ломиться в те места, которые тебе настоятельно рекоммендуют. Рыбные места там, куда народ толпами не ломится. Мне довелось топтать дороги родины вдоль границы с финиками. Местных жителей кроме пограничников нет, а приезжих туда только по спецразрешению пущают. На рыбалку времени не было, но на ужин за 15 минут набирал белых грибов полный котелок размером исключительно 3-5 сантиметров…

  3. Действительно, мне та инфа про свежие рабочие базы 🙂 показались странными. Соображения – те же 🙂

  4. Ситуация с этой базой тоже не очень понятная.

    Там написано, что собрана с публичных страниц. Но включены ли сюда миллиарды дорвейных страниц или нет совершенно непонятно. И соответственно какой процент мусора в этом деле – хз:(.

  5. > И соответственно какой процент мусора в этом деле – хз

    Как правило, способы сделать реальные деньги не продают, поэтому мусора там, хоть отбавляй. Вот так вот

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *