Shkondin.ru

От какого поисковика вы не смогли бы отказаться?

Интересно узнать мнение читателей блога: представьте, что вам разрешают пользоваться только одним единственным поисковиком. Какой будет ваш выбор?

У меня выбор маленький: либо Яндекс либо Гугль. Хотя мне очень нравятся яндексовские  сервисы поиска по энциклопедиям, перевод и маркет, я всё же выберу Гугль. Я не представляю себе поиск по IT сайтам  без Гугля. За примером ходить далеко не надо. Запрос DOM2. В Яндексе на первых трёх страницах нет сайтов, описывающих Document Object Model Level 2. А в Гугле на первой же странице есть ссылка на w3.org даже в русской версии (в английской она есс-но первая).

Так что мой выбор — Гугль. А ваш?

Оптимизаторский чай

В дни кривых апдейтов я пью оптимизаторский чай:

 

 

оптимизаторский чай

Рекомендую — после него очень хороший сон. И никаких тревог 🙂
Из «профессиональных» чаёв есть ещё программерский бета-чай. Хотя я немножко программист, но этот чай я пить не рисковал, наверно потому, что хорошо знаю, что такое бета-версия продукта 🙂

Если серьёзно, то кривость апдейта определяется довольно легко: при поиске по точным словосочетаниям Яндекс показывает крайне короткие листинги. В кондиционной тематике, которая по понятным причинам меня интересует довольно сильно, есть один запрос, по которому выдаётся всего 9 сайтов, тогда как в нормальной ситуации таких сайтов больше тысячи. Впрочем, и в других тематиках полных листингов не много. Например, по довольно популярному запросу «пластиковые окна» Яндекс обещает показать более 1700 сайтов, хотя в действительности на данный момент показывает только 35 сайтов:

пластиковые окна

Так что пьём оптимизаторский чай и ждём корректирующего апдейта.

Русскоязычный блог Гугля

Как-то незаметно для многих русскопишущих (:)) сео-блоггеров прошло довольно любопытное событие: у Гугля появилась русская версия блога.

via

Праздник оптимизатора. Подарки от AOL.

Подарком являются данные живых запросов пользователей AOL Search. Вникать в происхождение этих данных мне честно говоря неохота. Брать тут. Я половину уже скачал, через полчаса начну их мучать. Видимо в БД заливка всю ночь производиться будет 🙂

Первые данные по обработке данных — количество кликов в зависимости от позиции:

Results in:
Total Searches:9,038,794
Total Clicks: 4,926,623

Click Rank1: 2,075,765
Click Rank2: 586,100 = 3.5x less
Click Rank3: 418,643 = 4.9x less
Click Rank4: 298,532 = 6.9x less
Click Rank5: 242,169 = 8.5x less
Click Rank6: 199,541 = 10.4x less
Click Rank7: 168,080 = 12.3x less
Click Rank8: 148,489 = 14.0x less
Click Rank9: 140,356 = 14.8x less
Click Rank10: 147,551 = 14.1x less

Подтверждено небольшое преимущество 10-го места над 9-м.

А вот на первые три места приходится ок 60% кликов, а не 75-80%, как считали некоторые.

Удачных исследований.

via

Update:

А вот и информация о происхождении данных:

This collection consists of ~20M web queries collected from ~650k users over three months…

Basic Collection Statistics
Dates:
01 March, 2006 — 31 May, 2006

Normalized queries:
36,389,567 lines of data
21,011,340 instances of new queries (w/ or w/o click-through)
7,887,022 requests for «next page» of results
19,442,629 user click-through events
16,946,938 queries w/o user click-through
10,154,742 unique (normalized) queries
657,426 unique user ID’s

Please reference the following publication when using this collection:

G. Pass, A. Chowdhury, C. Torgeson,  «A Picture of Search»  The First
International Conference on Scalable Information Systems, Hong Kong, June,
2006.

О рандоме в выдаче

Прочитал по диагонали 8-страничную тему об последнем апдейте Яндекса. Заметил интересное утверждение: мол де Воложу всё равно, какой из xK сайтов про кондиционеры будет первым, а какой — последним. Утверждение это приводилось в поддержку возможности рандомной выдачи в поиске. Я же утверждаю, что рандома не будет. И вот почему.

Во-первых, рандом очень сильно не понравится Сегаловичу. Нет, ему тоже скорее всего всё равно, какой именно сайт про кондиционеры будет первым, но вот случайность выбора этого сайта будет означать роспись в своём бессилии. С таким подходом можно смело вешать бутсы на гвоздь. Или клавку на стенку. Или вузовский «поплавок» на лацкан пиджака. Что суть одно и то же. А внукам-то что рассказывать? Как в борьбе с оптимизаторами не смог придумать ничего лучше, чем полный рандом? Что ж вполне возможно, но уж очень маловероятно.

А во-вторых, что, пожалуй, более важно, это мало понравится пользователям поисковика. Самым обычным, которые не знают о существовании закладок в браузере. Выбор кондиционера это не минутное дело, и если пользователь сегодня вышел на сайт по запросу «кондиционеры», а завтра не смог попасть на тот же сайт по тому же запросу (а при полном рандоме и трёх апдейтах в неделю это будет довольно распространённая ситуация) — он останется недовольным. Поисковиком, это ведь он не нашёл сегодня то, что прекрасно находил вчера. Если сумма недовольств будет достаточно большой, то пользователь будет жаловаться на свою жизнь (в Гаагский трибунал, ага :)) другим пользователям, пока кто-то не подскажет ему о существовании стабильных поисковых систем. А вдруг эти поисковики ему понравятся больше, чем Яндекс? 🙂

Итого: рассуждения оптимизаторов на тему рандома в выдаче — это от любви к халяве. Могу сказать даже больше: с точки зрения математики любое случайное число, сгенерированное на компьютере, является всего лишь псевдослучайным. А значит рано или поздно найдётся тот, кто уловит закономерность. Так что все за работу — оптимизацию ещё никто не отменил 🙂

Детская болезнь левизны в Яндексе

Наверное ни для кого не новость, что последние две недели с Яндексом творится что-то неладное. Кое-кто уже строит теорию нового алгоритма. Я же предпочитаю говорить о болезни Яндекса. Смотрите сами. Во-первых, с момента опубликования утилиты мониторинга апдейта не было положенных по расписанию 3-х апдейтов в неделю (соответствующие заявления Ильи Сегаловича заинтересованных отправляю поискать в Яндексе). Во-вторых, Яндекс путается в показаниях.

Вот два скриншота:

кондиционерыкондиционеры -qiwruyqwoigadjgshdlfkghlskjvn
Оба показывают результаты расширенной выдачи по «любимому» запросу кондиционеры. Во втором случае отминусовано несуществующее слово, т.е. запрос выглядит так кондиционеры -qiwruyqwoigadjgshdlfkghlskjvn. Как не трудно видеть, результаты различаются, хотя этого и не должно быть. В чём можно убедиться, проведя аналогичный эксперимент с любым неконкурентным запросом.

Я не буду утверждать, что такие накладки не связаны с изменениями в алгоритме, но мягко намекну, что делать далеко идущие выводы на нестабильной выдаче, мягко, говоря, не дальновидно 🙂 (сам не понял, что сказал :D)

Теперь пару слов о сегодняшнем апдейте, которого не было 🙂 Точнее, его не зафиксировала вышеупомянутая утилитка. То, что происходило ночью очень сильно напоминало положение дел примерно трёхнедельной давности. Продвигаемый сайт по ряду запросов вернулся на первую страницу. Но, больше всего меня радовал «вылетевший» на седьмую страницу запрос. Однако с утра всё вернулось в «поломанное» состояние: по прямому запросу сайт на 7-й странице, а по нему же, но отминусованному несуществующим словом, сайт на первой странице. Так что приходится запасаться терпением и ждать, пока Яндекс избавится от детской болезни левизны и как минимум актуализирует свой кэш.

Новый патент Google на PageRank

Читаем
Via

Update: первые впечатления. Хорошо заметные ссылки рулят сильнее (проверим), так же рулят интернациональные ссылки (знаем), ссылки с морд (ещё бы), ссылки с обновлённых документов (известно из старого патента).

Во власти ссылок

На днях открыл неприятную для себя особенность Яндекса. Сайт (его морда), продвигающийся по запросам вида товар XX1, товар XX2 и т.д, где XXk -бренд, застрял во втором десятке по некоторым из запросов. Стал изучать причины. Одной из них посчитал слишком далёкое расположение на странице слова товар и некоторых из брендов. Собственно такое упущение было сделано осознанно: бренды перечислялись через запятую, чтобы не писать слышком часто слово товар. Естественно, решил это упущение исправить, cгруппировав бренды на три списка: такие товары XX1, XX2; сякие товары XX3, XX4; разэдакие товары XX5, XX6.

В Гугле это группирование повлекло за собой практически моментальную коррекцию позиций в лучшую сторону от 3-х до 5-ти позиций. В Яндексе же никак не отразилось, даже после второго апдейта.
Выводы: адептом Миныча с его «учением о переколдовщике» мне явно не грозит стать в ближайшее время. А при утверждении «контент рулит» я буду улыбаться во все 32 зуба, если получится конечно 😀 Рулить-то он рулит, да только не в Яндексе.

Ушёл искать новые ссылки.