Устройство поисковой системы Петраков Александр
О чем будем говорить? 1. Пользователь, поисковая строка 2. Обработка запроса (региональность, спектр, опечатки, колдунщики…) 3. Матрица результатов поиска 4. Аналитика. Давайте поразмышляем 5. Выбор документа (индексация, фильтрация, robots. txt, пауки…)
Кадровый голод • Специалисты основываются на знаниях о прошлом. Отставание от реальности на 1 -2 месяца – лучший случай, 1 -2 года – обычно. • Нет понимания, почему получается то, что получается
Объем рынка SEO • 2012 – 8 млрд. рублей • 2013 – 10 млрд. рублей
Устройство поисковой системы
Пользователь • • Проблема Компьютер пользователя Персонализация результатов поиска Параметры страницы результатов пользователя
Поисковая строка • Подсказки • Живой поиск
Обработка запроса • • Региональность Тип запроса Спектр Колдунщики Машинное обучение Опечаточник Синонимы
Региональность • Автоматически по ip • Можно задать вручную • Гео. НЕзависимые запросы ( «купить окна в Москве» )
Спектр
Колдунщики • Полный список на help. yandex. ru
Машинное обучение • Уникальная формула ранжирования для каждой тематики
Опечаточник
Синонимы и аббревиатуры
Тип запроса • Навигационный, транзакционный, информационный • Односмысловой, многосмыловой • Новостной, информационный • И т. д.
Матрица результатов поиска 1. Контекстная реклама 2. Сниппеты 3. Новости 4. Яндекс. Адреса (карты) 5. Яндекс. Маркет 6. Пресс портрет 7. Кэш документов 8. Кэш поиска 9. Картинки, видео 10. …
Аналитика • Поведение пользователей на результатах выдачи • Персональная статистика пользователей
Выбор документа
Документ • • • Веб страница (html, php, asp и т. д. ). PDF, . xls, doc… Видео Картинки И т. д.
Попадание веб страницы в индекс • • Переход робота по ссылке webmaster. yandex. ru/addurl. xml Яндекс Бар Яндекс Метрика Яндекс Браузер Liveinternet Sitemap. xml
Фильтрация • Спам, санкции • Низкий статический вес
Робот-паук • • Краулинговый бюджет Обновление страниц Статический вес Инструкции для поисковых систем
Инструкции для поисковых систем • • Robots. txt Sitemap. xml Meta данные (noindex, nofollow) http протокол (код ответа)
Фильтры • • Спам Вирусы Ошибки на странице дубли
Индексация • • Видимый индекс Полный индекс Кэш страниц (текстовая, обычная) Текстовый индекс
Заниматься SEO – не шаманить!
Вопросы? Петраков Александр petrakov@clukva. ru +79631281687 При подготовке презентации использовались материалы topexpert. pro
О чем будем разговаривать дальше?