Ссылочное ранжирование.pptx
- Количество слайдов: 21
Ссылочное ранжирование
Релевантность текста ссылок на документ • Текст ссылок - образует “анкор-документ” • Анкор-документ является дополнением к продвигаемому (исходному) документу • Учитываются анкоры как внешних, так и внутренних ссылок
Релевантность текста ссылок на документ • Релевантность анкор-документа – определяется модификацией формулы BM 25 • В случае, если у ссылки нет анкора – то в ранжировании также учитывается околоссылочный текст “http: //www. yandex. ru - поисковая система Яндекс” • Анкор-документ, как и обычный документ – может быть заспамлен и на продвигаемую страницу могут быть наложены санкции.
Свойства естесственного анкор-документа: • Ключевые слова – в разных словоформах, падежах, числах и т. п. • Разнообразие употребляемых слов • 70 -80% анкоров – в виде прямой ссылки на страницу
Как правильно писать анкоры ссылок Текст анкора: • • Должен содержать ключевое слово Должен быть максимально лаконично вписан в котекст документа Должен помогать находить информацию Не должен мешать восприятию информации http: //www. artlebedev. ru/kovodstvo/sections/83/
Поисковые технологии ссылочного ранжирования
Page Rank
Page Rank – математическая модель, отражающая вероятность попадания веб-сёрфера на ту или иную страницу. http: //en. wikipedia. org/wiki/Page. Rank http: //digits. ru/articles/promotion/pagerank. html
Выводы: • Чем больше ссылающихся страниц на нашу – тем больше PR • Чем меньше на ссылающихся страницах других ссылок – тем больше PR • Чем больше PR ссылающихся страниц – тем больше PR нашей страницы
HITS • Ранжирование проводится на основе анализа связок автор-посредник (Портал). • При этом хороший автор, это та страница, которая чаще всего цитируется. • Хороший посредник — это та страница ссылки с которой ведут на хороших авторов. http: //en. wikipedia. org/wiki/HITS_algorithm
• Максимальный вес (PR) получают ссылки на сайт который является хорошим автором и хорошим посредником; • Меньший вес (PR) – ссылки в случае если сайт хороший автор/плохой посредник; плохой автор/хороший посредник; • Возможные санкции – в случае если сайт плохой автор и плохой посредник.
Trust Rank • Экспертом определяется набор страниц, заслуживающих доверия. • Анализируются связи надёжных страниц с другими страницами, которые также получают некую степень доверия при связи с надёжными • Trust. Rank уменьшается с увеличением расстояния между документом и множеством надёжных страниц. С уменьшением Trust. Rank – уменьшается передаваемый вес ссылки. http: //en. wikipedia. org/wiki/Trust. Rank
Как Яндекс определяет продажные (ненадёжные) ссылки? • Использование категоризации текстов ссылок и анализа графов для идентификации платных ссылок: http: //events-old. yandex. ru/public/conferences/www 2009. xml
Введение: На сегодняшний день основным методом поисковой оптимизации в Рунете являются платные ссылки. Платные ссылки оказывают искусственное воздействие на результаты поиска, но мы отделяем их от обычных спам-ссылок, так как платные ссылки часто встречаются на авторитетных страницах, соседствуют с естественными полезными ссылками на одном документе и указывают на полезные коммерческие сайты. Часть таких ссылок имеет высокую стоимость, на их оформление тратят значительные усилия. Текст дорогой платной ссылки всегда содержит ключевые слова и выражения из семантического ядра сайта. Тысячи оптимизаторов занимаются подобной, часто ручной, разметкой продвигаемых ресурсов. Таким образом, умение идентифицировать платные ссылки позволяет извлечь много полезной информации о размеченных ресурсах.
Yandex определяет показатель SEO-link как вероятность ссылки быть платной. Сначала оценивается вероятность того, что документ содержит платные ссылки (SEO-out данного документа), агрегируя следующие параметры: среднее значение SEO-in целей ссылок с данного документа (Avg. SEOin), среднее значение SEO-text текстов этих ссылок (Avg. SEOtext), количество уникальных тем целей (NTh) и некоторые другие параметры документа по следующей формуле: SEOout = k 1×Avg. SEOin + k 2×Avg. SEOtext + k 3×NTh + … (1) Затем, используя SEO-text текста ссылки, SEO-out документа-источника, SEO-in цели и некоторые другие параметры, мы вычисляем конечное значение SEO-link по следующей формуле: SEOlink = l 1×SEOtext + l 2×SEOin + l 3×SEOout + … (2) Параметры ki и li были подобраны на основе обучающей выборки
Алгоритм • Классификатор «SEO-text» - параметр, который показывает, насколько текстовый фрагмент «коммерчески интересен» ; • Классификатор «SEO-topic» - параметр, который показывает тематику текста ссылки; Классификаторы «SEO-out» и «SEO-in» - в классическом алгоритме HITS «посредники» (hubs) и «авторы» (authorities), соответственно. • SEO-out показывает вероятность того, что документ продает ссылки • SEO-in показывает вероятность того, что сайт продвигается с помощью платных ссылок • Документ, ссылающийся на сайты разных тематик, весьма вероятно продает ссылки. • Классификатор SEO-link – вероятность ссылки быть спамной
Оцениваем вероятность того, что документ содержит платные ссылки (SEO-out) • среднее значение SEO-in целей ссылок с данного документа (Avg. SEOin), • среднее значение SEO-text текстов этих ссылок (Avg. SEOtext), • количество уникальных тем целей (NTh) и некоторые другие параметры документа… SEOout = k 1×Avg. SEOin + k 2×Avg. SEOtext + k 3×NTh + … Затем, используя SEO-text текста ссылки, SEO-out документа-источника, SEO-in цели и некоторые другие параметры, мы вычисляем конечное значение SEO-link SEOlink = l 1×SEOtext + l 2×SEOin + l 3×SEOout
Выводы: 1. Чем меньше SEO-in документа – тем лучше будут работать ссылки; 1. Чем меньше SEO-out ссылающихся документов – тем лучше наш SEO-in; 1. SEO-in и SEO-out – зависят от: • Коммерческой привлекательности текста ссылки (SEO-text) • Разнообразия коммерческих тематик (NTh/SEO-topic)
Наши действия (на основании доклада Яндекса): • Покупать ссылки на качественных ресурсах (SEO-out может быть агрегирован для всего сайта в целом); • Покупать ссылки на документах, на которых мало внешних ссылок (не более 1 -2); • Если на документе есть другие внешние ссылки то покупать ссылку можно лишь в том случае, если тематика их текстов схожая; • Покупать ссылки с анкором http: //. . . Тк это уменьшит вероятность присутствия на документе ссылок разных тематик.