Подарком являются данные живых запросов пользователей AOL Search. Вникать в происхождение этих данных мне честно говоря неохота. Брать тут. Я половину уже скачал, через полчаса начну их мучать. Видимо в БД заливка всю ночь производиться будет 🙂
Первые данные по обработке данных – количество кликов в зависимости от позиции:
Results in:
Total Searches:9,038,794
Total Clicks: 4,926,623Click Rank1: 2,075,765
Click Rank2: 586,100 = 3.5x less
Click Rank3: 418,643 = 4.9x less
Click Rank4: 298,532 = 6.9x less
Click Rank5: 242,169 = 8.5x less
Click Rank6: 199,541 = 10.4x less
Click Rank7: 168,080 = 12.3x less
Click Rank8: 148,489 = 14.0x less
Click Rank9: 140,356 = 14.8x less
Click Rank10: 147,551 = 14.1x less
Подтверждено небольшое преимущество 10-го места над 9-м.
А вот на первые три места приходится ок 60% кликов, а не 75-80%, как считали некоторые.
Удачных исследований.
Update:
А вот и информация о происхождении данных:
This collection consists of ~20M web queries collected from ~650k users over three months…
Basic Collection Statistics
Dates:
01 March, 2006 – 31 May, 2006Normalized queries:
36,389,567 lines of data
21,011,340 instances of new queries (w/ or w/o click-through)
7,887,022 requests for “next page” of results
19,442,629 user click-through events
16,946,938 queries w/o user click-through
10,154,742 unique (normalized) queries
657,426 unique user ID’sPlease reference the following publication when using this collection:
G. Pass, A. Chowdhury, C. Torgeson, “A Picture of Search” The First
International Conference on Scalable Information Systems, Hong Kong, June,
2006.
Про проценты кликов по первым местам: 75-80% — возможно это не от общего числа кликов, а от общего числа пользователей.
Это подарок не только оптимизаторам. Хотя немного обидно за людей, чья личная информация оказалась доступна всем и каждому, но, будем считать, что они принесли себя в жертву науке.
Есть дурацкое правило про 20 – 80. Типа 20% первых позиций забирают 80% траффика.
Кстати, ещё один интересный момент: кликов меньше поисков почти в 2 раза. Т.е. кто-то ничего не находит, кто-то уточняет поиск, кто-то уходит по Adsense.
itman, нет там личной информации. IP заменены на ID.
По адресу http://aol.zanoza.lv можно увидеть, насколько причудливые запросы встречаются в этой базе.
Отличная информация, спасибо 😉
>Кстати, ещё один интересный момент: кликов меньше поисков почти в 2 раза. Т.е. кто-то ничего не находит, кто-то уточняет поиск, кто-то уходит по Adsense.
Может быть, кто-то уходит на другой поисковик, а кто-то смотрит не сайт, а кэш поисковика. А иногда информация видна сразу в выдаче. например, УРЛ нужного сайта.
>Первые данные по обработке данных – количество кликов в зависимости от позиции:
А мне так кажется, что смысл этого примерно такой же, как “средняя температура по больнице”. По каким-то фразам в топе сидят самые релевантные сайты , а по другим – и на третьей странице ничего интересного. Как следствие, в первом случае на пятерку приходится 95% трафика, а во втором – 0,5% (остальные меняют запрос).