о продвижении сайтов и улучшении конверсии

Артём В. Шкондин
(aka AiK)
оптимизатор
Skype: artyemvs

Автоматизированный отлов дорвеев

Гугль кооперируется с Википедией на предмет отлова спаммерских ссылок.
Идея логична. Вики спамят в промышленных масштабах и доры можно отстреливать на подлёте. Собственно логично и объявление о кооперации – оно само по себе уменьшит объёмы спама в Вики.

А мне вот что подумалось. Формочка в Яндексе (или кнопочка в баре для FF от Яндекса) «пожаловаться на спам» не очень полезна. Определение спама для поисковика весьма и весьма субъективно. Лично мне пользоваться этой формочкой некомфортно по моральным соображениям :) Я если и стучу на доры, то сразу на кучу однотипных, отправляя Александру Садовскому ссылку на запрос в Яндексе. На большой коллекции можно и алгоритм подкорректировать. Но! Я точно знаю, где я не буду ощущать никаких душевных терзаний определяя спам это или нет. В собственном блоге и форуме. В движке WordPress’а при модерации комментариев есть опция – пометить как спам. Нужно всего лишь дописать функцию, которая будет заодно сливать в Яндекс (Гугль, Рамблер) эти спаммерские сообщения. Или складывать их в одном месте, доступном в том числе и поисковикам. Подобный мод можно сделать и для других блогов и форумов на популярных движках. Работы не много, а информации для анализа будет море. Я даже с удовольствием размещу на форуме и блоге кнопочку: весь спам автоматом перенаправляется в поисковики.

Конечно, спамеры попытаются зафлудить такой механизм ложными жалобами, т.е. будут спамить в блоги и форумы нормальные сайты. Так что примитивный алгоритм «раз спамит, то в бан» не подойдёт. Но, нормальные сайты тем от доров и отличаются, что они друг на друга не похожи. Так что таким макаром можно будет вычистить как минимум типовые доры. Да и плюс одно дело спамить собственные ресурсы, зная, что расходы на спам окупятся, и совсем другое – спамить забесплатно чужие ресурсы. Так что поток «ложного» спама будет существенно меньше спама натурального.

Ну и в продолжение темы. Кроме отлова доров с помощью чужих ресурсов можно их отлавливать и на своих собственных. Более чем уверен, что комментарии, которые удаляют блоггеры на BlogSpot.com (Blogger.com) подвергаются Гуглем тщательному анализу. Если добавить немножко конспирологии, то Яндекс запросто мог создать с десяток каталогов и вычислять автосабмитеров по факту попадания во все эти каталоги…

Popularity: 19% [?]

16 Comments to Автоматизированный отлов дорвеев

  1. 13-10-2006 at 2:43 | Permalink

    Не, не пойдет. Тот факт, что сайт кто-то продвигает спамом, еще не означает, что сайт «плохой». Формально сайт не виноват, что его кто-то спамит (это ведь может быть и подстава). Спам — это коммент, а вот то, куда ведут его ссылки — не обязательно спам. Получатель ссылок не наказывается, наказывается донор.

    Пример: зайдите на рупоиск — он до сих пор не забанен и имеет PR 3. Думаете, в Гугле о нем не знают? Знают прекрасно. У них даже есть такой метод — все страницы, которые скрыто ссылаются на рупоиск или на блокнотик, автоматически считаются спамом.

  2. Maguire (harlot)
    13-10-2006 at 10:05 | Permalink

    >>>Но, нормальные сайты тем от доров и отличаются, что они друг на друга не похожи.
    Ну… далеко не факт. Смотря какой дорген :)
    >>>Да и плюс одно дело спамить собственные ресурсы, зная, что расходы на спам окупятся, и совсем другое – спамить забесплатно чужие ресурсы.
    Это совсем, имхо, не довод. Проспамить в числе тысячи своих страниц сотню чужих – вообще не проблема.
    >>>Если добавить немножко конспирологии, то Яндекс запросто мог создать с десяток каталогов и вычислять автосабмитеров по факту попадания во все эти каталоги…
    Ну вот, щас все стадо запалишь :)

  3. 13-10-2006 at 11:33 | Permalink

    Идея неплохая, но не масштабах всего рунета, я бы даже сказал до тех пор пока она кулуарная результаты будут видны. Возможно не вами, но спамерам вы жизнь попортите. Как только данный плагин станет популярным его можно будет списывать, потому что на каждый хитрый болт….

    Спам это проблема (а проблема ли?) поисковиков, а не рядового сетянина. т.е. неудобства конечно испытываем мы, а вот есть ли большая проблема у поисковиков вопрос…

    2Сергей
    Стук в Яндекс на сайт ещё не означает признание сайта спамерским. Тут нет прямой зависимости.

    На сколько я знаю… стоп, хм… что такое «скрытно ссылаются»? Ни одни сайт не признаётся спамом даже если с него линк стоит на откровенный дорвей, а вот коэффициенты понижающие и повышающие его рейтинг есть. Поэтому часто линк на «жирного» конкурента может только помочь :-)

  4. 13-10-2006 at 12:24 | Permalink

    «Скрыто ссылается» — это sneaky redirect в терминологии Google. Т.е. такой редирект, который пытаются скрыть от робота. У гугловских рейтеров есть указание: любой сайт с джаваскриптовым редиректом, ведущим на рупоиск, должен помечаться как спам.

  5. 13-10-2006 at 12:33 | Permalink

    комментарии, которые удаляют блоггеры на BlogSpot.com (Blogger.com) подвергаются Гуглем тщательному анализу

    Возможно и подвергаются, но! Все ссылки в комментариях обрамляются атрибутом rel=»nofollow», соответственно спамить туда бесполезно. По опыту знаю, что спамятся в основном т.н. «белые» сайты (mortgages, loans and etc.), видимо теми нерадивыми продвиганами, которые о существовании rel=»nofollow» понятия не имеют, а таких хватает.

  6. 13-10-2006 at 12:58 | Permalink

    2Сергей
    Простите, так Вы сами и написали алгоритм дорвея. Конечно это спам! Линк это одно, а редирект это другое. Не надо путать простых граждан (типа меня) :-)
    Наличие робота, которые выполняет редирект это тема отдельного топика ;-)

    +1 за blogger
    rel=”nofollow” и капчи хватит вам в 90 процентах случаев.

  7. Miha Kuzmin (KMY)
    13-10-2006 at 13:41 | Permalink

    >harlot, даже в самом расчудесном доргенераторе есть как минимум один очень даже константный блок. Список кивордов

    Толку правда ноль. Ибо списочек большой, и для одного дора киворды берутся разные.

  8. 13-10-2006 at 13:57 | Permalink

    Артём, открою страшную тайну, 50 процентов спамилок распознают наличие rel=”nofollow” и в случае присутствия данного тега спам не происходит.

    Порой эффективнее не слать отчеты о дорах Яндексу, а написать владельцам блокнотиков, рупоисков.

  9. 13-10-2006 at 14:15 | Permalink

    Тогда капча отсеет 80 (минимум) процентов спама. Самописная капча ещё процентов 15, ну а наличие предмодерации решит оставшиеся проблемы :-)
    Итого:
    rel=”nofollow”
    капча
    предмодерация – ручной спамер это увидев выкинет Ваш блог из своей базы

    и думаю о спаме Вы сможете забыть :-)

    Моё глубокое убеждение, что со спамом должны бороться поисковики, а не пользователи. Пользователь может себя защитить от этого явления в масштабах своего ресурса.

  10. 14-10-2006 at 21:31 | Permalink

    В общем, Артём, не морочьте голову и поставьте SpamKarma2 (это такой плагин для WordPress). Мне помогает.

  11. 15-10-2006 at 10:51 | Permalink

    а наши люди бы такую кнопочку поставили. спамеров бить – это же мечта блоггера

  12. 4-11-2006 at 22:14 | Permalink

    буде такой механизм будет реализован – появится рэкет, предлагающий или угрожающий «замочить» ресурс спамовыми ссылками на него.
    Краем уха слышал, что конкуренты друг друга так уже подсаживают.