Лекция 1 Analytics.pptx
- Количество слайдов: 31
О чем? 1. Уникальность Интернета как объекта и среды исследований 2. Области исследования 3. Счетчики. Основные понятия интернет-статистики 1
1. Уникальность Интернета как объекта и среды исследований
УНИКАЛЬНОСТЬ • Сбор данных происходит автоматически и в реальном времени – Многие события, действия, метрики фиксируются «по умолчанию» – Результаты во многих случаях доступны в течение минут, секунд или даже долей секунды – Нет промежуточной стадии свода данных в базу данных • Нет географических барьеров – Из одной точки можно проводить исследования по всему миру – Не надо строить выборку населенных пунктов • Результаты не зависят от недобросовестности и пристрастности интервьюера 3
УНИКАЛЬНОСТЬ • Cобытия, действия, метрики фиксируются «по умолчанию» ; • Результаты доступны мгновенно: HTTP-запрос посетителя: • имя хоста (ip); • тип браузера; • URL перехода; • язык Подробная информация о браузере и системе: • версия браузера; • версия системы; • разрешение экрана; • поддержка flash; Файлы cookie: • информация о сеансе посетителя.
УНИКАЛЬНОСТЬ • Cобытия, действия, метрики фиксируются «по умолчанию» ; • Результаты доступны в течении долей секунды:
УНИКАЛЬНОСТЬ Нет промежуточной стадии свода данных в базу данных:
УНИКАЛЬНОСТЬ Нет географических барьеров – Из одной точки можно проводить исследования по всему миру – Не надо строить выборку населенных пунктов
УНИКАЛЬНОСТЬ • Интерактивность Интернета – … максимально упрощает получение и замер отклика, облегчает «обратную связь» – … приучает пользователей к коммуникации в режиме «вопрос-ответ» (обуславливает актуальность SEO) 8
УНИКАЛЬНОСТЬ • Информация в онлайне изначально «оцифрована» – Есть четкая фиксация событий (посещение сайта, поисковый запрос и т. д. ) Можно жаловаться на условность, неоднозначность и сложность многих интернет-методик – но тем не менее Интернет принципиально лучше измеряем, чем любое другое медиа
2. Области исследования
ОБЛАСТИ ИССЛЕДОВАНИЯ 1. Пользователи Интернета – – – Размер и динамика аудитории Состав аудитории: пол, возраст, уровень доходов и т. д. География аудитории Места и типы доступа Частота доступа 2. Предпочтения интернет-аудитории – – Занятия в Сети Тематические интересы Посещаемость тематических и функциональных сегментов Наиболее посещаемые сайты 11
ОБЛАСТИ ИССЛЕДОВАНИЯ 3. Поисковые интересы – – Частота поисковых запросов Тематические кластеры запросов Динамика и сезонность поисковых запросов География поисковых запросов 4. Частотный анализ контента – – Частота слов и наиболее популярные варианты написания/наименования Частота упоминания в новостях Частота упоминания в блогах Анализ контекста и эмоциональной окраски упоминаний в новостях и блогах 12
ОБЛАСТИ ИССЛЕДОВАНИЯ Частота поисковых запросов:
ОБЛАСТИ ИССЛЕДОВАНИЯ Тематические кластеры запросов:
ОБЛАСТИ ИССЛЕДОВАНИЯ Динамика и сезонность поисковых запросов: Выдвините гипотезу: что за месяцы и почему?
ОБЛАСТИ ИССЛЕДОВАНИЯ География поисковых запросов:
ОБЛАСТИ ИССЛЕДОВАНИЯ Частота упоминания контента:
ОБЛАСТИ ИССЛЕДОВАНИЯ Частота упоминания контента:
ОБЛАСТИ ИССЛЕДОВАНИЯ 5. Характеристики тематического сегмента – – – – – Объем и динамика аудитории Количество ресурсов и степень концентрации «Плотность» сегмента: пересечение аудитории между сайтами Активность аудитории: частота и глубина просмотра Соц-дем аудитории География аудитории Косвенные характеристики: распределение по дням недели и часам, «технометрика» Источники трафика: поисковые системы, поисковые фразы, каталоги Контекстная реклама: активность по ключевым словам, средняя цена 19
ОБЛАСТИ ИССЛЕДОВАНИЯ 6. Сравнение с конкурентами Помимо означенных в предыдущем разделе блоков, целесообразно сравнение с отдельными конкурентами – По объему постоянной/лояльной аудитории – По источникам трафика (ссылающимся доменам) и методам привлечения аудитории – По популярным разделам, сервисам и тематикам – По пересечениям аудиторий с другими сайтами – По заполненности сайтов рекламой и по списку рекламодателей – По частоте упоминаний сайтов в Интернете, в т. ч. в UGC – По узнаваемости брендов и удовлетворенности посетителей 20
ОБЛАСТИ ИССЛЕДОВАНИЯ 7. Статистика сайта: Посещаемость – – – Объем аудитории и трафика Активность аудитории: частота и глубина просмотра Динамика аудитории: сравнение по разным показателям. Месячный и годовой рост Суточные, недельные и сезонные колебания посещаемости География аудитории 8. Статистика сайта: Источники трафика – – – – Динамика «прямого» трафика Источники трафика: динамика ссылающихся доменов Источники трафика: поисковые фразы Позиция сайта в поисковиках Источники трафика и точки входа Источники трафика: сравнение качества Источники трафика: эффективность и ROI 21
ОБЛАСТИ ИССЛЕДОВАНИЯ 9. Статистика сайта: Интересы, навигация и usability – – – – – Распределение трафика по разделам и основным сервисам Распределение аудитории по разделам и основным сервисам Наиболее популярные каталоги и страницы (статьи, тематические рубрики, группы товаров, товары) Тематическая структура интересов Точки входа и единичные загрузки, трафикогенерирующие страницы Основные пути по сайту Пути до целевых страниц Страницы потери аудитории Использование элементов навигации по сайту Параметры запроса и просмотра страниц 22
ОБЛАСТИ ИССЛЕДОВАНИЯ 10. Анализ сегментов сайта – Анализируемые параметры • • • – Уникальная аудитория Объем трафика Активность аудитории Источники трафика Точки входа и популярные разделы Критерии сегментации • • • География Источник трафика Раздел сайта Тип посетителя (по активности, новый/старый) Достижение целевой страницы / целевое действие 23
3. Счетчики. Основные понятия интернет-статистики 24
СЧЕТЧИКИ • • • Основаны на вставляемом на страницы сайта коде вызова картинки (скрипта) с домена счетчика Обработка данных этих запросов позволяет определять множество параметров Идентификация пользователей по cookie-файлам Счетчики предназначены для рейтинговая сайтов и/или сборе аналитических данных для владельца сайта Публичность данных счетчиков – уникальная особенность российского рынка Альтернативная методика, дающая схожий набор данных – анализ собственных лог-файлов сайтов 25
СЧЕТЧИКИ: ТЕХНОЛОГИЯ • Код, размещаемый на страницах сайтов + Система первичного агрегирования, обработки, хранения данных и генерации конечных отчетов • Код: – – – Статичная часть – вызов картинки или пикселя Определяется время, IP адрес, id пользователя (cookie), адрес страницы, useragent (операционная система и браузер) Аналогичные данные собираются и анализируются через лог-файл Javascript Собирает дополнительные данные: ссылающаяся страница, разрешение экрана (окна), часовой пояс и т. д. Через сохранение cookie на компьютере пользователя определяется количество новых посетителей, количество уникальных посетителей, время с предыдущего посещения 26
СЧЕТЧИКИ: ПЛЮСЫ И МИНУСЫ • Плюсы – – – • Достоверность данных Нет выборочности, измеряется генеральная совокупность Постоянный мониторинг Минусы – – – Измеряется количество «кук» , а не реальных пользователей Нет данных (или ограничены данные) по демографии аудитории Сложность учета активности вне HTML (просмотр видео, IM, wap-сайты, игры, загрузка файлов) 27
СЧЕТЧИКИ: ХОСТ, COOKIE, ПОСЕТИТЕЛЬ § Определять количество посетителей сайта и идентифицировать их по IP-адресу (хосту) – это прошлый век § Альтернатива: cookie-файл – идентификатор уникальной комбинации учетной записи и браузера; «небольшой фрагмент данных, созданный веб-сервером и хранимый на компьютере пользователя в виде файла» § Разные счетчики и системы веб-статистики отличаются друг от друга по алгоритму подсчета количества посетителей без cookie и по алгоритму установки cookie для нового пользователя § В веб-интерфейсах, отчетах, профессиональных разговорах куки и посетители – синонимы. В действительности количество кук дает только примерную оценку количества реальных пользователей (живых людей), посетивших сайт 28
СЧЕТЧИКИ: ХОСТ, COOKIE, ПОСЕТИТЕЛЬ Один IP-адрес, несколько посетителей Общий домашний компьютер Корпоративная сеть Доступ через провайдерский прокси Доступ через публичный прокси (включая Opera Mini) Доступ через сеть сотовой связи / сеть Wi. Fi Интернет-кафе / иной публичный доступ Один посетитель, несколько IP-адресов Доступ через диалап Широкополосный доступ с динамическим IP Использование нескольких провайдеров Доступ с мобильного устройства (сотовая связь, Wi. Fi) Один cookie, несколько посетителей Компьютер с общей учетной записью Интернет-кафе Один посетитель, несколько cookies Использование нескольких компьютеров Использование нескольких браузеров Удаление куки / блокировка записи куки § Обычно кук больше, чем реальных посетителей, а реальных посетителей больше, чем хостов § Чем больше аудитория сайта, частота посещений и период анализа, тем больше посетителей на хост и кук на посетителя § Среднее количество кук на посетителя растет в целом по интернету § При ежедневном обновлении кук у 2% посетителей сайта и средней частоте 10 дней в месяц погрешность в объеме месячной аудитории составит 18% 29
СЧЕТЧИКИ: НЕКОТОРЫЕ ТЕРМИНЫ § Хит (Page view) – просмотр страницы (Spy. Log разделяет хит и загрузку; Top. Mail называет хиты «визитами» ) § Хост – уникальный ip-адрес § Посетитель – уникальный cookie § Суточная (недельная, месячная) аудитория – количество посетителей в сутки (неделю, месяц) § Сессия (Visit) – просмотр одной или нескольких страниц сайта одним посетителем в течение определенного периода времени § Глубина просмотра – количество хитов на сессию § Единичная загрузка – сессия из 1 хита. Доля единичных загрузок – «показатель отказов» (“bounce rate”) § Точка входа (выхода) – первая (последняя) страница сессии § Частота (frequency) – количество сессий одного посетителя за неделю/месяц или количество дней (за неделю/месяц), в которые посетитель приходил на сайт § Время на сайте, длительность сессии – считается условно/некорректно как время между первым и последним хитом сессии 30
ПАМЯТКА • • В интернет-статистике есть суммируемые и несуммируемые величины Суммировать можно те события, которые имеют однозначную привязку по времени и месту (сайту, странице) Суммируемые величины можно складывать – за разные периоды времени, для разных сайтов или разных разделов Суммируемые величины – хиты и (во времени, с оговорками) сессии Несуммируемые величины нельзя складывать, их не надо умножать и делить. Можно считать среднее Пример несуммируемой величины – посетители (а также сессии при суммирования разделов сайта или сайтов) Производные показатели (количество хитов, сессий и дней на посетителя, доля новых посетителей и т. д. ) также несуммируемы 31
Лекция 1 Analytics.pptx