Конференция WWW 2009 в Мадриде

Стендовый доклад 22 апреля 2009 года
Использование методов категоризации текстовых привязок и анализа графов для идентификации платных ссылок.

Кирилл Николаев
Яндекс
Москва, ул. Самокатная, д.1
7-495-739-70-00
kvn@yandex-team.ru
Екатерина Зудина
Яндекс
Москва, ул. Самокатная, д.1
7-495-739-70-00
zudina@yandex-team.ru
Андрей Горшков
Яндекс
Москва, ул. Самокатная, д.1
7-495-739-70-00
gorshkov@yandex-team.ru


АНОНС
Один из способов искусственного повышения рейтингов коммерческих страниц в индексах информационно-поисковых систем — размещение платных ссылок на эти страницы на других веб-сайтах. Умение выявлять платные ссылки повышает эффективность поисковой машины. В этой статье описывается новый метод идентификации платных ссылок. Он предусматривает, во-первых, обучение классификатора текстовых привязок и анализ исходящих коммерческих ссылок с различных веб-страниц; и во-вторых, анализ графа ссылок Рунета на основе полученных данных для выявления платных ссылок и сайтов, их продающих и покупающих. Проверка алгоритма на сформированных вручную тестовых выборках доказала его высокую эффективность.

Категории и тематики

H.3.3 [Поиск и обнаружение информации]: Фильтрация данных.

Основные термины

Алгоритмы, Разработка, Эксперимент.

Ключевые слова

Поисковые машины, модель языка, категоризация, анализ ссылок, машинное обучение, поиск данных в Интернете.

1. ВВЕДЕНИЕ

По нашим наблюдениям, основной метод оптимизации сайтов для поисковых машин (SEO), принятый в Рунете, — использование платных ссылок. Платные ссылки действительно влияют на рейтинги в индексах поисковиков, но не считаются спамом, поскольку встречаются в основном на вполне приличных страницах наряду с другими полезными ссылками и часто указывают на ценные коммерческие сайты. Платные ссылки, как правило, стоят больших денег, поэтому к их подготовке подходят особенно тщательно и непременно включают в текст привязки термины, соответствующие популярным коммерческим запросам с использованием актуальных для данного сайта ключевых слов. Создание платных ссылок вручную — сложная и кропотливая работа, поэтому неудивительно, что в них действительно содержатся актуальные сведения о целевом сайте. Тем не менее, умение выявлять платные ссылки значительно повышает эффективность рейтингов поисковых машин.

Этот процесс осуществляется в два этапа. Сначала проводится анализ текста и классификация тематик, а затем формируется стартовое множество страниц различной тематики и строится граф ссылок с использованием модифицированного алгоритма HITS [1], где «посредники» — это сайты, продающие ссылки, а «лидеры» — сайты, покупающие ссылки. Главная задача алгоритма — выявление непосредственно платных ссылок, а не сайтов, их продающих и покупающих.

2. АЛГОРИТМ

2.1 Классификатор текстов с точки зрения поисковой оптимизации

Параметр, определяющий коммерческую привлекательность текстового фрагмента, мы назвали показателем оптимизации текста. Мы взяли стартовое множество оптимизированных запросов с одного популярного SEO-сайта и создали на его основе простой классификатор текстов с точки зрения поисковой оптимизации, подобный описанному в статье [2], где использовались только две разновидности тематических запросов — оптимизированные и не оптимизированные. Воспользовавшись методом итерации, аналогичным тому, что описан в пункте 2.2, мы получили длинный список текстовых юниграмм (300 000) и биграмм (1 500 000), типичных для текстовых привязок на оптимизированных сайтах. Затем мы воспользовались пулом новостных текстов для генерации естественных текстовых юниграмм и биграмм и использовали полученные данные для создания улучшенного байесовского классификатора текстов с точки зрения поисковой оптимизации.

2.2 Классификатор тематик с точки зрения поисковой оптимизации

Чтобы создать алгоритм идентификации оптимизированных тематических запросов, мы отобрали 22 тематики, наиболее характерные для коммерческих сайтов (недвижимость, финансы, грузоперевозки и т. д.). Алгоритм идентификации тематических запросов состоит из двух частей. Для начала мы составили стартовое множество из 3350 монотематических ключевых слов, отобранных вручную. У каждого ключевого слова имеется собственный тематический спектр (ТС). Затем, используя тексты привязок с показателем оптимизации выше нуля, мы вычислили ТС для всех остальных ключевых слов, исходя из степени вероятности совпадения с другими ключевыми словами из стартового множества этого же текста привязки. Таким путем мы получили 64 000 ТС, которые затем использовали для категоризации текстовых привязок по принципу, который аналогичен описанному в статье [2].

На следующем этапе мы воспользовались упрощенным хост-графом, в котором насчитывается 20 миллионов ребер, содержащих текстовые привязки с показателем оптимизации выше нуля. С помощью вышеупомянутого алгоритма мы определили по две самых вероятных тематики для каждого ребра. Затем мы рассчитали ТС для целевых вершин на основе входящих ребер, чтобы сузить спектр для большинства целевых сайтов. Полученные тематики мы распространили на текстовые привязки всех входящих ссылок и исходя из этого составили новый словарь, насчитывающий около 200 000 слов и 800 000 словосочетаний. Такое обилие терминов позволило нам создать новый, более эффективный классификатор тематик на основе цепи Маркова первого порядка [3].

После этого словарь был вручную скорректирован с учетом грубых ошибок. Таким образом, составление словаря подобных объемов почти не требует человеческого вмешательства. Фактически, мы создали его автоматически, опираясь на работу, проделанную до нас SEO-оптимизаторами.

2.3 Классификаторы входящих и выходящих ссылок с точки зрения поисковой оптимизации

Для дальнейшего анализа мы воспользовались алгоритмом типа BHITS [4]. Ранее алгоритм HITS и его различные модификации уже использовались для выявления спама [5] [6], а теперь мы решили использовать его для обнаружения платных ссылок. Мы воспользовались двусторонним графом ссылок (страницы-источники слева, целевые хосты справа), убрав из него все известные спам-страницы, ссылки с линкферм и т. п. Мы усовершенствовали стандартный механизм подготовки ссылок HITS и удалили все ссылки, принадлежащие одному владельцу (владелец — это домен второго уровня, не являющийся хостом, или домен третьего уровня, расположенный на сервере хоста). Таким образом мы получили граф ссылок, насчитывающий 300 миллионов ребер, 50 миллионов страниц-источников и 19 миллионов целевых сайтов. Проанализировав ребра графа с помощью классификатора тематик (пункт 2.2) мы получили 1 миллион монотематических целевых сайтов.

В нашем алгоритме используются понятия оптимизированных входящих и исходящих ссылок, аналогичные соответственно «посредникам» и «лидерам» в классическом алгоритме HITS. Показатель оптимизации исходящих ссылок определяет вероятность того, является ли сайт продавцом ссылок. Показатель оптимизации входящих ссылок определяет вероятность того, продвигается ли сайт с помощью платных ссылок. Сайты с высокими показателями оптимизации входящих ссылок — это коммерческие ресурсы, использующие дорогостоящие средства SEO для повышения своих рейтингов в результатах запросов поисковых систем.

Страница, указывающая на целевые сайты различной тематики, вероятнее всего является продавцом ссылок. В качестве стартового множества мы отобрали 3 миллиона мультитематических страниц, которые имеют высокие показатели оптимизации исходящих ссылок и соответствуют ряду других параметров. Показатели оптимизации входящих и исходящих ссылок рассчитываются по стандартному алгоритму HITS (рис. 1) на основе двух итераций. На данном этапе нашей задачей было получить список целевых сайтов с высокими показателями оптимизации входящих ссылок. В результате в полученном списке насчитывается около 500 000 таких сайтов.

Seo-in — показатель оптимизации входящих ссылок; Seo-out — показатель оптимизации исходящих ссылок; Seed set — стартовое множество.
Рисунок 1. Вычисление показателей оптимизации входящих ссылок на основе показателей оптимизации исходящих ссылок стартового множества мультитематических страниц по двухчастному графу ссылок с использованием алгоритма HITS (показана одна итерация, T1, T2, T3 — тематики целевых сайтов).

2.4 Классификатор ссылок с точки зрения поисковой оптимизации

Показатель оптимизации ссылки определяет вероятность того, является ли она оплачиваемой. Ниже описан простой алгоритм, позволяющий определить этот показатель в один проход. Для начала нужно определить вероятность того, что на странице содержатся платные ссылки (SEOout), просуммировав следующие показатели: средний показатель оптимизации входящих ссылок целевого сайта (AvgSEOin), средний показатель оптимизации текстовых привязок (AvgSEOtext), количество целевых тематик (Nth) и некоторые другие параметры страницы по следующей формуле:

SEOout = k1?AvgSEOin + k2?AvgSEOtext + k3?NTh + … (1)

Затем на основе этих данных (показатель оптимизации текстовых привязок, показатель оптимизации исходящих ссылок страницы-источника, показатель оптимизации входящих ссылок целевого сайта и некоторые другие параметры ссылки) вычисляется показатель оптимизации интересующей нас ссылки:

SEOlink = l1?SEOtext + l2?SEOin + l3?SEOout + … (2)

Показатели ki и li были получены на основе обучающей выборки из 2500 ссылок, отобранных вручную, и около 10 000 ссылок, взятых из Википедии и с сайтов, являющихся продавцами ссылок.

Эти вычисления отнимают совсем не много времени и ресурсов и могут быть выполнены с помощью любой программы обработки баз ссылок.

3. РЕЗУЛЬТАТЫ

Чтобы определить точность и эффективность описанных алгоритмов, мы воспользовались тестовыми выборками, составленными при участии восьми экспертов. Для оценки алгоритма категоризации мы отобрали 2200 сайтов по выбранным тематикам (по 100 самых популярных сайтов на каждую), опираясь на данные популярного среди SEO-специалистов сайта рейтингов, и сформировали список входящих текстовых привязок с показателями оптимизации выше нуля методом случайной выборки. Если принадлежность текстовой привязки к той или иной тематике была очевидна, эксперты приписывали ее к одной из 22 тематик. Часть тестовой выборки (12 100 привязок) была использована для проверки и корректировки алгоритмов. Другая часть (3 800 привязок) — для оценки эффективности. В результате было установлено, что точность описанных алгоритмов достигает 94 %, а эффективность — 97 %.

Для проверки алгоритма идентификации платных ссылок мы использовали две тестовых выборки (табл. 1). Первая включает в себя около 1700 полезных естественных ссылок и 1850 платных ссылок, отобранных вручную методом случайной выборки (точность алгоритма оценивалась только по естественным ссылкам). Мы смогли идентифицировать ссылки, принадлежащие одному сервису обмена ссылками, и получили таким образом подборку платных ссылок, которую использовали в качестве второго тестового образца.
Из 300 миллионов ссылок, присутствующих в нашем графе, алгоритм идентифицировал как платные 50 миллионов ссылок (17 %).

Таблица 1. Результаты идентификации платных ссылок.

Тестовая выборка Точность Эффективность
1. 3550 ссылок 95 % 93 %
2. около 140 000 ссылок - 96 %

4. ЗАКЛЮЧЕНИЕ

Идентификация платных ссылок позволяет оценивать релевантность ссылок для коммерческих и некоммерческих запросов независимо друг от друга. В первом случае, платные ссылки учитываются при вычислении коммерческого рейтинга, а во втором — игнорируются. Это делает формулу вычисления рейтингов более эффективной и повышает качество поиска, нейтрализуя влияние чрезмерной оптимизации на некоммерческие поисковые запросы и делая результаты поиска более разнообразными.

Данный алгоритм может быть усовершенствован за счет применения аналогов microHITS к блокам ссылок в рамках механизма сегментации страниц Яндекса [7].

5. БЛАГОДАРНОСТИ

Хотим поблагодарить Сергея Певцова, Илью Сегаловича, Аркадия Борковского и Сергея Волкова за полезные замечания по данному вопросу.

6. ИСТОЧНИКИ

[1] Kleinberg, J. (1997). Authoritative sources in a hyperlinked environment. Journal of the ACM 46 (5): 604–632.
[2] T. H. Haveliwala. Topic-sensitive pagerank. In Proc. 11th International WWW Conference, pages 517-526, 2002.
[3] Lafferty J., Zhai, C. Document language models, query models, and risk minimization for IR. In Proceedings of SIGIR-2001, pp 111-119.
[4] K. Bharat and M.R. Henzinger, Improved algorithms for topic distillation in a hyperlinked environment, Proc. 21St Annual International ACM SIGIR, pp.104–111, 1998.
[5] B. Wu and B. Davison. Undue influence: Eliminating the impact of link plagiarism on web search rankings. Technical report, LeHigh University, 2005.
[6] Yasuhito Asano, Yu Tezuka, Takao Nishizeki. Improvement of HITS algorithms for spam links. APWeb/WAIM 2007, LNCS 4505, pp 479-490, 2007.
[7] S. Chakrabarti. Integrating the Document Object Model with Hyperlinks for Enhanced Topic Distillation and Information Extraction. ACM 1-58113-348-0/01/0005, 2001.

Перевод статьи http://www2009.org/proceedings/pdf/p1105.pdf

Google Bookmarks Digg Reddit del.icio.us Ma.gnolia Technorati Slashdot Yahoo My Web News2.ru БобрДобр.ru RUmarkz Ваау! Memori.ru rucity.com МоёМесто.ru Mister Wong

Запись оставлена в Direct . Автор: admin. Вы можете следить за комментариями к этой записи через ленту RSS 2.0.


Related posts:
  • Гугл подвигает Яндекс на 10% поиска
  • Методы поиска с помощью лингвистики и математики
  • Географический таргетинг в целях поисковой оптимизации (Google)
  • Яндекс заработал более 300 миллионов долларов в 2008 году
  • Google сократила более 50% внештатников

  • 92 комментариев на “Конференция WWW 2009 в Мадриде”

    1. kinar пишет:

      То есть Яша говорит, мол, вы, фирмы и компании, делайте свои деньги, а я буду свои. И не будем друг другу мешать. А если ты 16-лений пионер и делаешь ГС для того, чтобы банку пивка потом попить, то ты иди-ка отсюда, шкед! :)

    2. Кудрявцев Сергей пишет:

      Спасибо за текст, очень интересно…. Перечитаю еще не раз, чтобы до конца вкурить!

    3. Shtekker пишет:

      Спасибо за информацию, очень полезно. Из статьи понял, что Яндекс старается определить продажные ссылки, но никак продажные и продающие сайты, интересный вывод получается.

    4. Бубновое продвижение пишет:

      Ну что сказать, молодцы, придумали.
      Осталось еще увидеть эту новую выдачу.
      А вдруг она не понравится пользователю?

    5. Андрей пишет:

      Можно предположить что, бесплатные ссылки на тематических форумах и блогах теперь рулят..

    6. Обучение Форекс пишет:

      Что тут сказать, этого стоило ожидать. Постепенно все будем переходить на статьи, контекстные ссылки, и ссылки с блогов. Сапа в теперешнем виде будит потихоньку отмирать, но, думаю, они что-нибудь придумают, чтобы остаться на плаву. А вообще, нужно начинать клепать саттелиты под свои проекты, но для людей. Геморно, дорого, долго, но зато со временем они будут и на контексте приносить бабло и за счет них продвигать клиентсткие сайты без проблем.

    7. Поток пишет:

      Яша тупо гонит!

    8. Шин пишет:

      Вывод можно делать разные… А вот делать все тоже самое, что и советовали несколько лет назал сами яндексоиды - развивайте свои сайте, добавляйте уникальный контент!! :-)

    9. Wonder пишет:

      Вряд ли введут в ближайшее время, слишком уж велико изменение алгоритма.
      Как уже заметили выше, нас все больше толкают к статьям и контекстным ссылкам. СЕО все дальше уходит от старого доброго спама =)

    10. Completo пишет:

      Так была уже попытка выложить алгоритм, не учитывающий платные ссылки. При этом качество выдачи очень заметно ухудшилось и алгоритм спрятали в анналы. Видимо, о нем и рассказ.

    11. sladom пишет:

      Ох, Яндексойды. Сколько знаю СЕО, столько читаю аналогичный материал. Фиг вам…

    12. максус пишет:

      дня 4 назад у многих рухнули индексы.
      У меня , например, Ян отказался видеть половину ссылок на меня (большинство из куплено естественно в сапе)!
      Но тИЦ ещё держится прежний

    13. Gorgik пишет:

      Да, перечитать прийдется не раз, чтобы такую инфу “вкурить”… Думаю, для меня пока понятно одно - Яша по-прежнему тупит!

    14. Алекс пишет:

      Думаю биржи ссылок просто так не сдадутся, и смогут ответить на изменения в алгоритме.

    15. Редактор пишет:

      Насколько я понял этот анализ завязан на тематичности ссылок-площадок. Если соблюдать тематичность при покупке и продаже ссылок, то всё будет хорошо.

    16. Alex пишет:

      Интересная информация. Спасибо.

    17. Василий пишет:

      Яндекс научился отличать платные ссылки независимо от их оформления на странице, и эту инфу он собирается использовать для изменения выдачи в зависимости от коммерческого/некоммерческого запроса. Например, сдерживать влияние осколков ссылочной массы коммерческих анкоров-ссылок на некоммерческие запросы ;)

    18. Иришка пишет:

      Ну, собственно, дорогими ссылками обычно продвигаются качественные ресурсы. Никто не покупает ссылки по 200-500 долларов на говносайты. Так что, в какой то мере, покупка таких ссылок на сайт, может говорить и о том, что сайт неплохой, его наполняют, продвигают и он небезразличен создателям, значит и инфа на нем, скорее всего, нужная

    19. WebSole пишет:

      Будем покупать теперь с минимальным количеством сеоаут с монотематичных ресурсов. + не забывать что ссылка должна быть равна контенту.
      Делаем выводы

    20. realpromotiongroup пишет:

      2Редактор : продажные ссылки вычисляются на ура какой бы тематики они ни были

    21. вoфка пишет:

      Совершенно верно!
      теперь ссылки в сапе покупайте только для посещаемости.
      На вашу тИЦ деньги уже не повлияют

    22. Jekka пишет:

      Сначала гугль пессимизировал покупные, теперь и яша за ним. Типа тонкий намёк - продвижение через директ и адсенс.

    23. вебмастер пишет:

      Доклад, конечно, сдлеан на высоком научном уровне. Кто-нибудь может более простым языком объяснить - каким образом и по каким криетриям Яндекс определяет платные ссылки?

    24. Антон(G-S-G) пишет:

      Очень интересная вариация на тему идентификации платных ссылок, однако, как показывает практика послеарзамасового времени, не сильно уж яндекс и упераестя на эту самую идентификацию, а вообще стремление к тематическому обмену ссылками это всегда положительно. Не новость что покупать ссылки с сайтов нужно с минимальным их количеством на странице донора.

    25. Владик пишет:

      Посмотрим, что получится! Хотя мне нравится идея такого алгоритма.

    26. Lopes пишет:

      Дык кто-то из них вот только недавно заявлял, что платные ссылки являются важным фактором ранжирования)))) Ой, а кто же это был-то? :D Так что живем и будем жить, господа.

    27. psu пишет:

      Вам не кажется, что в формуле:
      SEOout = k1?AvgSEOin + k2?AvgSEOtext + k3?NTh + … (1)

      в первом слагаемом более логично быть AvgSEOout?

      AvgSEOin - средний показатель оптимизации входящих ссылок Посредника
      AvgSEOout - средний показатель оптимизации исходящих ссылок Посредника

    28. Павел пишет:

      Много уже говорили о постановке ссылок с тематических ресурсов. Теперь и сам Яндекс официально об этом заявил.

    29. seo collection races пишет:

      Платные от бесплатных ссылок отличаются методом их вывода?
      Тоесть наличие скрипта в теле страницы, с “логотипами”=словом кодом биржи:
      Сапы, маинлик, сетлинкс и еже с ними, является определяющим продажность?
      (исполнительные файлы бирж можно закрыть в роботсе)

    30. psu пишет:

      А имелась ввиду усредненное значение для акцепторов. Туплю.

    31. seoded пишет:

      Из всего прочитанного понял только, что покупать ссылки нужно на тематических сайтах и разбавлять анкоры, дабы они выглядели “некоммерческими”.

    32. seo пишет:

      По коммерческим запросам почти ничего не изменится…

    33. Seo пишет:

      Интересно, а каким будет следующий шаг Яндекса?

    34. wzp пишет:

      вроде для сайтов лидеров ничего не изменится. побьют плохих посредников. а оно и к лучшему.

    35. Канарейка пишет:

      Порадовало главное - Йандекс начал относиться к покупным ссылкам как к реалии сегодняшнего дня.

    36. Гексли пишет:

      Следующий шаг будет определние продажных статей.

    37. Техник пишет:

      Первый раз вижу, чтобы яндексоиды де-факто признали оптимизаторов действующей силой процесса работы поисковых систем без негатива. Даже скорее наоборот:
      “мы создали его автоматически, опираясь на работу, проделанную до нас SEO-оптимизаторами”. Во как!!!

    38. Игорь пишет:

      Определение платных ссылок и это всегда говорили в Яндексе не является сложной с точки зрения алгоритма проблемой. Посмотрите внимательно на сайты где мы все покупаем и продаем ссылки? даже самые нежадные продают 2-3 ссылки в блоке ))) на каждой странице ))) Ресурсы для определения тоже есть. Другое дело и об этом вскользь в статье написано - сила влияния этих ссылок на выдачу. По коммерческим запросам будут всегда платные ссылки больше учитываться, по некоммерческим меньше. Другое дело и это самое важное, что таким образом хорошо чистить базу от сайтов которые сделаны только для продажи ссылок! Поэтому господа вебмастера, начинаем делать качественные сайты!

    39. Евгений пишет:

      Складывается ощущение что в будующем подобный алгоритм приведеь к увеличению бюджета продвижения, делая его не выгодным в сравнении с директом. Поживем увидим

    40. Один пишет:

      Где же столько тематических ресурсов наковырять.

    41. Белое SEO пишет:

      Ну что ж, господа, теперь можно будет ожидать неэффективности черного SEO и снижения спроса на такие же программы?

    42. SEOinSoul пишет:

      Очень познавательная статья, теперь по другому нужно подходить к покупке ссылок. Яша молодей, развивается

    43. Mantis пишет:

      Яндексу респект ОГРОМНЫЙ. Эта работа, судя по докладу, очень серьезная.
      Молодцы!

    44. TSDrive пишет:

      Инфо довольно увлекательная, даже неспециалисту. Как по мне, то идем к тому, что линки в грамотно написанная статье,
      размещенной на тематическом сайте, будет значить больше, чем куча левых ссылок. Так что те, кто поддерживает
      тематические сайты, готовьте мешки для денег..

    45. aleks_white пишет:

      Весьма познавательная статья. Еще больше познавательны отзывы и кто как понял математические выкладки …
      :))
      Особенно рассмешило
      “… прийдется не раз, чтобы такую инфу “вкурить”… Думаю, для меня пока понятно одно - Яша по-прежнему тупит! ”

      Если честно, то я тоже туплю при попытке вникнуть в несложную математику, но
      видеть “мы создали его автоматически, опираясь на работу, проделанную до нас SEO-оптимизаторами” – действительно приятно и обнадеживает - завтра сеошники серьезно относящиеся к делу не будут выкинуты на обочину.

    46. Sciper пишет:

      Думаю все это только для того чтобы больше начали продвигать сайты Через ЯД.

    47. ruge пишет:

      А оно надо? Вы просто подумайте! Это ж естественный процесс. Покупают ссылки на те сайты, которые действительно соответствуют тематике и чем больше покупается ссылок, тем больше приносит прибыли сам сайт, т.е. он качественнее, он делается для людей, над ним работает команда и это его выгодно отличает от хомяков энтузастов-одиночек, которыми вы собираетесь запрудить поиск. Вы лучше занимайтесь тем, чтобы 1) тематика сайта дествительно соответствовала анкорам, которые размещаются на него (чтобы сайты не продвигались по левым запросам) 2) в поиске не было древних заброшенных ресурсов, информация на которых уже потеряла актуальность или вообще таких казусов как сейчас. По запросу “гостиницы Иваново” выходит статья про то как разрушали гостиницы автора Иванова. Чуете разницу. И это не сеошники такие плохие, это яндекс со своими алгоритамами. плывите по течению. Сеошники работают вместе с вами. Это нормально.

    48. стоматолог пишет:

      Перевод мясо - прочитал два раза нихрена непонел :)
      Пришлось на английском найти оригинал, гораздо более внятно изложено.

    49. admin пишет:

      Может потому что вы стоматолог?:) Вроде бы сильных претензий ни у кого не было до сих пор)

    50. Слоняра пишет:

      Вот я щас тут на этой странице ссылку на Сёрч поставил. Она учтется. Т.к. тут тоже про СЕО.

      Если бы я поставил ссылку на ггнуху - она бы неучлась, т.к. тематики не совпадают.

      Внимание вопрос:
      А как сказывается на эту страницу то, что большинство из вас натыкало ссылок на разные нетематичные сайты.

      Ответ: (Читай внимательно доклад, - Яшко не определяет продающие сайты - только ссылки.)

    51. admin пишет:

      Вообще, ссылки на нетематичные сайты я убрал, чтобы не злить яшку, мало ли что он там придумает:) Остальные ссылки вроде как подходят по тематике:)

    52. Сергей Кашин пишет:

      ….дык и как же теперь можно остоваться “белым и пушистым”?
      …блин….куда катимся???

    53. Arseo пишет:

      Страница, указывающая на целевые сайты различной тематики, вероятнее всего является продавцом ссылок.

      Имхо, самое ценное из всего доклада.

    54. admin пишет:

      не совсем понятна фраза “целевые сайты различной тематики”…

    55. fonsik пишет:

      Платные ссылки как были, так и останутся, главное ставить их нужно с “умом” не абы-кабы закупать массово, а именно ставить на тематических ресурсах, по тематике, ссылки это естественно и без них “никуда”, вот эти алгоритмы и для того, что бы определять качество ссылок на соответствующий ресурс с донора.

    56. Garya пишет:

      Спасибо за полезную информацию.

    57. Веня Таганский пишет:

      Короче получается, что некоммерчесские проекты платными ссылками двигать без мазы :(

    58. рено пишет:

      Спасиб за интересный материал.
      Да похоже дело труба.
      Ну я думаю всеравно прорвемся

    59. seo collection races пишет:

      Следущий этап развития продажных ссылок (как элемент ранжирования в топах поиска)
      = это контекстные ссылки. Так покрайнему выходит из статьи.

    60. Гоша пишет:

      А че это конференция яши проходила в мадриде :) Думаю, что под “платными ссылками” здесь имелось ввиду и биржы и статьи. Так что куда переходить не имеет значение. ПС давно уже умеют определять платные ссылки. Но теперь получается, что они не сколько борются с ними, а используют их в своих целях.

    61. Пузат пишет:

      Есть над чем задуматься, напишу на эту тему в блоге пост на днях.

    62. seo пишет:

      >Страница, указывающая на целевые сайты различной тематики, вероятнее всего является продавцом ссылок.
      платную ссылку нельзя определить 100% а значит будут методы ее скрытия;)

    63. Crank пишет:

      жалко очень, что платные ссылки рулить не будут…

    64. illusions пишет:

      Рано или поздно платные ссылки умрут, может не все сразу, но постепенно будут отмирать.

    65. Хомяк пишет:

      Не понимаю только одного. Доклад уже староват, а вроде как ссылки работают с бирж. Или это только выдвинутая теория без срока давности для продолжения сбора подобных мероприятий? Вообще не понятно, или они путают эффективность поиска с эффективностью Директа или нужно совсем уходить от ссылочного, т.к. качество поиска откатится на года три назад с так назаваемыми естественными ссылками, но без сео-ссылок. А это полный бред, любые внутренние факторы на сайте вычисляются опытным взглядом очень быстро. Возможно, они уверены, что сеошники за короткий срок накидают “нужных” ссылок… НЕ с бирж)))).

      >платную ссылку нельзя определить 100% а значит будут методы ее скрытия;)

      Увы, но если будут опредлены и не учтены хотя бы половина сео-ссылок, то эффективность работы с биржами будет ничтожной… Поднимать тарифы клиентам уже некуда и так. Остаются альтернативные варианты, коих навалом, с большими временными затратами, но с меньшими денежными расходами.

    66. Машенька и Медведи пишет:

      >>Ну, собственно, дорогими ссылками обычно продвигаются качественные ресурсы. Никто не покупает ссылки по 200-500 долларов на говносайты.

      Самое лучшее место линковать свои ресурсы (по мнению яндекса) - это Директ. И это рано или поздно свершится. Вплоть до того, что наберут негров, обучат их и они будут собирать нужные топы. Источник:

      *Чтобы определить точность и эффективность описанных алгоритмов, мы воспользовались тестовыми выборками, составленными при участии восьми экспертов. Для оценки алгоритма категоризации мы отобрали 2200 сайтов по выбранным тематикам (по 100 самых популярных сайтов на каждую…*

    67. seostorm пишет:

      Яндекс до сих пор не умеет нормально определять тематику. Так что все ссылки учитываются так же как и раньше..

    68. kysok sabaki пишет:

      Понятие “нормально - не нормально” оценочное и не может быть применено когда нет чёткого определения. Как раз понятие “тематика” попадает в категорию оценочных суждений. Поэтому однозначно и логично самостоятельное определение Яндексом (как и любой другой ПС) тематичности согласно собственных классификаторов. О чём, собственно, и было указано ещё в Ведении доклада.

    69. dodger пишет:

      Нда. Теперь точно только на статьи переходить или другую ПС.

    70. Блог leviaf.com пишет:

      Я думаю эти заявления руководства Яндекса либо абсолютная лож либо полуправда. Google однозначно наказывает все сайты за продажные ссылки. А что Яндекса намного умнее и имеет на это свое исключительно особое мнение. ;-)

    71. rast пишет:

      смешные отзывы некоторых личностей поражают ))
      тематику Я умеет определять. тематика у Я бывает либо коммерческая, либо некоммерческая. с вводом арзамаса и фактическим разделением выдачи на региональную (= коммерческую) и общую (=некоммерческую), встает вопрос о том, как двигать геонезависимые ключи. если ссылки по ним, как сказано в докладе, учитываться не будут. яндекс фактически дробит выдачу, для того, чтобы легче управлять ей. и последние наблюдения за апдейтами (то “ссылочный”, то “текстовый”) это подтверждают

    72. Sahok пишет:

      В ближайшее время будут рулить биржи статей. Собственно это правильное направление развитие ПС

    73. Владимир пишет:

      Вот и причина почему в сентябре у многих сайты из индекса повылетали

    74. Антон пишет:

      Вопрос: а смысл? Покупные статьи/ссылки как были, так и будут. В том или ином виде.

    75. Роман пишет:

      Мда… Яша не спит, и что не придумает лишь бы простым людям не давать спать)))
      но с другой стороны правильно, очищает Интернет от всякого мусора!

    76. владимир пишет:

      Если яшу так душит жаба от покупных ссылок, то пусть он сам создаст биржу ссылок и напишет здесь ссылки со 100% гарантией и успокоится и денег срубит, уродец

    77. Bruce пишет:

      Как по мне,- то действительно силы Яндекса направлены на то, что бы рулил директ ( как эдсенс), но все дело в том, что так или иначе нужны первоначальные ссылки (первоисточники), ибо поисковые запросы все-таки будут выдаваться по релевантности, которую никто не отменял,- а значит стоит и искать методы получения ссылок с других сайтов без их пессимизации. Итог все вычисления и расчеты Яндекса ( при вводе этого в действие) просто удорожают процесс seo-оптимизации, в принципе, насколько я знаю они к этому и стремятся.

    78. PS Group пишет:

      Возврат к сателлитам, что дорого и трудоемко или к постоянному строчу интересного контента, как для развиваемого сайта, так и для размещения на стороне - что тоже очень не дешево..
      Малобюджетные проекты обречены.

    79. modulator пишет:

      Считаю сателлиты гораздо перспективнее покупных ссылок.

    80. Ялта пишет:

      Только вот естественные ссылки выходит можно получать только с форумов и блогов…

    81. SeoPraktika пишет:

      Согласен с modulator`ом - и надежнее и перспективнее, только, если делать хорошие СДЛ.

    82. Алекс пишет:

      Забавно, но не тактично. Черная магия сео была и будет магией, здесь знание особых алгоритмов просто не уместно. поживем уведем, доводы далеко не убедительные.

    83. Алекс пишет:

      Тут одно правило, кто много работает, у того все индексируется и продвигается и в гугле и яше, возможно будем говорить об этом летом, в кругу заинтересованных людей.
      http://forum.searchengines.ru/showthread.php?t=454046

    84. ISurfer пишет:

      >>Страница, указывающая на целевые сайты различной тематики, вероятнее всего является продавцом ссылок.

      Примерно ясно.
      Схемы такие:
      1) Продавать по схеме 1-1-1.(теряем деньги)
      2) Покупать не более 1-2 ВС ссылок со страницы или внимательно смотреть куда страница ссылается. (дефицит доноров)
      или
      1) Уходим в ручной режим от автоматической продажи-покупки. (живем на работе)

      В любом случае - САПА из легкого заработка превращается в разновидность рабства.

    85. Михаил пишет:

      Теперь, для продвижения в яндексе надо будет покупать все в Яндекс-директе, а иначе можно сайт может вылететь из индекса,если не на всегда, то на долго….

    86. Алекс пишет:

      Пипец хитроумные Яндексоиды… Года через 2-3 вообще отменят понятие ссылки.

    87. Liafors пишет:

      >Короче получается, что некоммерчесские проекты платными ссылками двигать без мазы

      Постовые, обзоры, статьи…

    88. Юрокк пишет:

      Здравствуйте Уважаемые!
      seostorm пишет:

      Яндекс до сих пор не умеет нормально определять тематику. Так что все ссылки учитываются так же как и раньше..

      Полностью СОГЛАСЕН!
      Представьте статья:
      Как приготовить оливье - Описывается блюдо, продукты, посуда, процессы приготовления. Логично подумать что ссылки не только кулинарной тематики могут подойти например: Продажа ножей, микроволновки и т.д. Машина - на какой лучше за продуктами съездить, магазин автозапчастей - вдруг по дороге авто сломается и т.д. Делая на сайте кулинарных рецептов по мимо способов приготовления блюд, отдельную рубрику - ну скажем новости, где вам следует писать (уникальный контент, на разные темы, переплетая желательно с кулинарными рецептами). У Яши мозги закипят. Человек придумал алгоритмы которые конечно работают, поэтому нам приходится включать мозг. (Каспаров отжарил компьютера, а мы то Яшу и в зад и в перед и по диагонали будем)!

    89. www.pridetranslations.ru пишет:

      Возникает ощущение что Яндекс хочет всячески занизить в поисковой выдаче коммерческие сайты, для того, чтобы рос спрос на контекстную рекламу, приносящую Яндексу деньги. В интересах ли это конечного пользователя, вот в чем вопрос?

    90. Dan Sokolov пишет:

      pridetranslations.ru, в интересах, в интересах. запрос “пластиковые окна” не говорит однозначно о стремлении пользователя купить их. Поэтому с помощью “мадрида” Яндекс выпихивает в топ информационные сайты и порталы с большим пузом. Все рады и счастливы.

    91. Tiepalierly пишет:

      У меня небольшое замечание и до сих пор хочется, …

    92. Михаил пишет:

      Все усилия яндекса направлены на то чтобы получить барышы с директа.

      Мы экспериментально выяснили что ставки назначаются яндексом. Ни один раз бывали случаи, когда ставка за рекламу была 0.5 или 1 доллар, при этом в случае набора нужного словосочетания выдавалось только одно объявление - НАШЕ, все письма в яндекс с просьбой объяснить остались без ответа, почему ставка доллар, а не минимальная ставка, ведь конкурирующих объявлений нет. Есть еще много наблюдений относительно честности яндекса в директе, но это уже не тема для этой статьи.

      В любом случае мы от директа как от канала продаж отказались, цена выросла в разы эффективность в разы упала, а если прикроют и поисковую оптимизацию, то мы тратиться на тындекс не будем и будем искать другие каналы продаж.

      У тындекса любимое занятие свои косяки и жадность скрывать за тайными алгоритма и не разглашения - удобная позиция, доиграются до того, что кто-то не поленится и подаст жалобу в ФАС и заставит через суд раскрыть алгоритм и публиковать всю статистику, чтобы доказать что никаких надувательств нет. Яндекс барыги, вспомните о компании Coca-Cola, про какашки жучков пришлось признаться.

    Оставить комментарий

    Имя
    E-mail (не публикуется)
    Сайт
    Сообщение: