Лекция 13 Выборочные исследования 2 План лекции 13
Лекция 13 Выборочные исследования
2 План лекции 13 Основы выборочного метода исследований Процесс выборочного обследования Методы формирования выборки Статистические методы определения объёма выборки и анализа выборочных статистик Процедуры вероятностных методов формирования выборок
3 Генеральная совокупность Генеральная совокупность, популяция (population) – совокупность всех элементов, обладающих рядом общих характеристик, которая охватывает полное множество элементов с точки зрения решения проблемы маркетингового исследования
4 Элементы и характеристики генеральной совокупности Элемент совокупности (element) – объект, являющийся источником или носителем исследуемых признаков генеральной совокупности Единица выборки (sampling unit)- базовая единица, содержащая элементы генеральной совокупности, подлежащие отбору
5 Способы изучения генеральной совокупности Перепись (Сensus) – сплошное обследование элементов генеральной совокупности Выборка (Sample) – подмножество элементов генеральной совокупности, отобранное для участия в обследовании Параметр – характеристика генеральной совокупности Статистика – характеристика (параметр) выборки
6 Выборка vs. перепись
7 Точность выборочного исследования Ошибка выборки Общая ошибка Систематическая (невыборочная) ошибка Ошибка наблюдения: исследователя связанные с респондентом связанные с инструментом измерения связанные с поведением интервьюера Ошибка ненаблюдения Определяет меру подобия структуры выборки структуре генеральной совокупности
8 Процесс выборочного обследования Определение основы выборки Определение метода формирования выборки Определение объема выборки Отбор элементов выборки и сбор данных Определение генеральной совокупности
9 Процесс выборочного обследования Определение основы выборки Определение метода формирования выборки Определение объема выборки Отбор элементов выборки и сбор данных Определение генеральной совокупности Элементы выборки Единицы выборки Географические Временные ограничения Кого включить? Кого исключить? Задачи исследования Альтернативы Строгость ограничений Удобство Воспроизводимость
10 Определение генеральной (целевой) совокупности Все водители автомобилей Люди, являющиеся в настоящее время собственниками VW Golf Люди, являющиеся в настоящее время собственниками хэтчбеков среднего размера Люди, ранее запрашивавшие информацию о моделях VW Golf Те, кто собирается приобретать автомобиль в течение ближайших 24 месяцев Те, кто собирается приобретать хэтчбек среднего размера в течение ближайших 24 месяцев Водители, в настоящее время владеющие хэтчбеком среднего размера и собирающиеся приобрести аналогичный автомобиль на замену в течение ближайших 24 месяцев
11 Процесс выборочного обследования Определение генеральной совокупности Определение метода формирования выборки Определение объема выборки Отбор элементов выборки и сбор данных Основа (база, контур) выборки, sampling frame – перечень элементов, из которых будет производиться выборка: может состоять из территориальных единиц, организаций, лиц и других элементов Список или процедура Проблемы: наличие полнота свежесть
12 Процесс выборочного обследования Определение генеральной совокупности Определение основы выборки Определение объема выборки Отбор элементов выборки и сбор данных Определение метода формирования выборки Вид исследования и тип отбора Детерминированный и вероятностный отбор Байесовские и традиционные Повторные и бесповторные
13 Репрезентативность выборки и методы её формирования В репрезентативной выборке состав обследуемых по выделенным параметрам (критериям) должен приближаться к соответствующим пропорциям в генеральной совокупности
14 Методы формирования выборки Детерминированная (неслучайная) Выборка Вероятностная (случайная) Поверхностная (типовая, экспертная) Квотная «Снежный ком» Метод удобства Систематическая Кластерная Стратифицированная Простая случайная Другие методы
15 Методы формирования выборки
16 Процесс выборочного обследования Определение генеральной совокупности Определение основы выборки Определение метода формирования выборки Отбор элементов выборки и сбор данных Объём (размер) выборки, sample size – количество элементов, которые необходимо изучить
17 Определение объёма выборки Объём выборки зависит от уровня однородности изучаемых объектов (! детализация) Минимальный размер однородной группы в выборке не должен быть меньше 30 Чем больше объём выборки, тем больше затраты на проведение исследований Точность результатов выборки ограничена Для случайных и репрезентативных выборок: чем больше размер, тем более надёжны результаты при заданной точности Методы определения объёма выборки на основе бюджета эвристический метод статистический метод
18 Типичные объёмы выборки
19 Статистический метод определения объёма выборки Статистический метод – нахождение минимально необходимого размера выборки с помощью статистических вычислений с использованием формул для определения границ доверительного интервала.
20 Параметры для определения объёма выборки и статистического анализа Средние значения возраст уровень расходов на продукты питания уровень удовлетворённости количество посещений ночных клубов в месяц, в год и т.д. Доли (пропорции) доля расходов на одежду в структуре семейного бюджета доля покупателей нового продукта в период Х доля лояльных/нелояльных покупателей и т.д. При использовании простой случайной выборки (МРВО или SRS) выбор формулы для расчета размера выборки зависит от требуемой информации:
21 Центральная предельная теорема Стандартная ошибка выборочного среднего Стандартная ошибка выборочной доли Для простых случайных выборок большого объема распределение выборочных средних приближается к нормальному в центре, равной истинному значению средней; истинная дисперсия равна средней выборочных дисперсий (1) (2) σх – стандартное отклонение (стандартная ошибка) выборочного среднего σ – стандартное отклонение (стандартная ошибка) выборочной доли (пропорции) σ – СКО среднего или доли генеральной совокупности p – доля (пропорция) n – объём выборки
22 «Правило трёх сигм» Практически все значения (99,7%) нормально распределённой случайной величины лежат в интервале +/– 3σ Абсолютное значение ошибки находится в 68,3% случаев – в пределах σ в 95,45% случаев – в пределах 2σ в 99,07% случаев – в пределах 3σ
23 «Правило трёх сигм» Практически все значения (99,7%) нормально распределённой случайной величины лежат в интервале +/– 3σ Абсолютное значение ошибки находится в 68,3% случаев – в пределах σ в 95,45% случаев – в пределах 2σ в 99,07% случаев – в пределах 3σ д.и. = х z×σx интервал , в котором находится значение среднего ГС с заданным уровнем достоверности Доверительный интервал
24 «Правило трёх сигм» Практически все значения (99,7%) нормально распределённой случайной величины лежат в интервале +/– 3σ Абсолютное значение ошибки находится в 68,3% случаев – в пределах σ в 95,45% случаев – в пределах 2σ в 99,07% случаев – в пределах 3σ Доверительная вероятность = уровень доверия = надёжность определяет коэффициент доверия z д.и. = х z×σx интервал , в котором находится значение среднего ГС с заданным уровнем достоверности Доверительный интервал
25 Статистические показатели для определения размера выборки , выборочное среднее p, выборочная доля (пропорция) σ2, дисперсия совокупности σ, стандартная ошибка выборочного среднего (σх) или доли (σ) – характеризует уровень точности z, коэффициент доверия – отражает надежность хz×σх или z×σ, доверительный интервал – оценка значения (диапазон значений) параметра ГС Точность – допустимая ошибка результата выборочного исследования Надёжность – повторение результатов
26 Коэффициент доверия Коэффициент доверия – количество стандартных ошибок, на которое точка удалена от среднего z – коэффициент доверия – выборочное среднее – генеральное среднее σх – стандартная ошибка выборочного среднего E (также обозначается как D) - максимально допустимое различие между выборочным и истинным средним , где (3) Определяется по выбранному уровню достоверности (доверительной вероятности)
27 Алгоритм определения объёма выборки Какие данные должны быть получены? Задать надёжность (уровень доверительной вероятности) Например, 95% или 95,45% Задать уровень точности дисперсия прошлых исследований оценка по выборочной дисперсии на основе мнения исследователя Пример: Анализ диапазона изменений характеристики: 14дней*1 000 руб.= 14 000, диапазон изменения [0;14 000], большинство укладывается в +/-3σ, т.е. 6σ: 14000/6=2333 руб. Конкретное значение (Е) например 3% Рассчитать объём выборки по формулам (4) или (5)
28 Расчёт размера выборки на основе средних значений z – коэффициент доверия σ – стандартное отклонение Е – максимально допустимое различие между выборочным и истинным средним _________ * (4) выводится из (1) и (3) , где (4)* 2
29 Расчёт размера выборки на основе долей z – коэффициент доверия Е – максимально допустимое различие между выборочным и истинным средним Р – доля совокупности, демонстрирующая определенное поведение , где (5)
30 Расчёт размера выборки на основе средних значений Изучается поведение покупателей в продовольственном магазине. Владелец магазина (эксперт) говорит, что при средней сумме чека 500-700 руб., среднее отклонение σ может составить 200 руб. В ходе опроса хотелось бы определить среднее значение с точностью (Е) до 20 руб., при уровне доверия 0,95 Дано: σ = 200 руб., Е = 20 руб., уровень доверия 95% Найти: объём выборки n Решение: Определить z : для надёжности 95% z=1,96 2 Рассчитать требуемый объём выборки: n=22*2002/202= 4*40000/400 =400 чел. Сравните: при уровне доверия 0,99 (z3) n= 900 чел. при точности до 10 руб. n=1600 чел при точности до 50 руб. n=64 чел
31 Факторы, определяющие размер выборки Число параметров (групп и подгрупп), анализ которых требуется провести (уровень детализации результатов) Например, для получения репрезентативной выборки по полу и возрасту – 2 параметра ( 400 чел.) по полу, возрасту, уровню лояльности – 3 параметра ( 600 чел.) Если репрезентативных вопросов несколько? Ценность информации и требуемая точность результатов Стоимость выборки Однородность изучаемых объектов (разброс параметра совокупности) Размер выборки НЕ зависит от размера генеральной совокупности
32 Метод доверительных интервалов (confidence level) В исследовании, целью которого было определение среднемесячных расходов семьи на покупки продовольственных товаров, была использована простая случайная выборка из 300 семей. В результате было установлено, что в среднем потребители тратят 6000 рублей в месяц на приобретение продуктов питания для семьи. Предыдущие исследования показали, что среднеквадратическое отклонение составляет 350 рублей. Необходимо найти доверительный интервал, который охарактеризует возможные значения среднемесячных расходов на продукты питания в ГС с определённым уровнем надёжности (например, 95%) Дано: n=300, σ = 350 руб., х = 6000 руб., уровень доверия 95% Найти: доверительный интервал Решение: Вычислить стандартную ошибку среднего: Определить z на основе стат. таблиц: для уровня доверия 95% z=1,96 Рассчитать доверительный интервал : хz×σ= 6000 1,96*20,2=6000 39.6 Доверительный интервал: 5960
33 Репрезентативная выборка населения России Состоит из 3600-9000 человек и 180 групп (страт): (два пола, три возраста, два образовательных уровня, три доходные группы, пять типов поселений) Доверительный интервал будет в пределах + 3 процентных пункта* для заданного уровня доверия Это значит, что если 30% (12% или 45%) респондентов заявили, что регулярно употребляют майонез, то долю потребителей майонеза в России можно оценить в 27-33 % (или 9-15 или 42-48% соответственно) prof.I. Skorobogatykh marketing research course
34 Эффективность выборки: компромисс «точность-стоимость» Издержки и время на проведение исследования растут примерно в той же пропорции, что размер выборки n*1,5 (+50%) $,t*1,5 (+50%) Ошибка исследования уменьшается пропорционально квадратному корню прироста размера выборки n*2 (+100%) σх*0,9 (-10%)
35 Вероятностные (случайные) выборки Простая случайная, simple random – каждый элемент генеральной совокупности имеет известную и равную вероятность быть отобранным (на основе теории больших чисел или статистической вероятности) Систематическая, systematic – метод, когда сначала задается отправная точка, затем из основы выборки выбирают каждый i-элемент Стратифицированная (расслоенная), stratified – двухэтапный метод: Разделение ГС на взаимоисключающие слои (страты) Случайный отбор элементов из каждого слоя. Каждый элемент относится только к одному слою Кластерная, cluster – одно-, двух- и многоступенчатый отбор: Разделение ГС на взаимоисключающие и взаимодополняющие подгруппы (кластеры). Каждый кластер – небольшая модель ГС. Отбор кластера (кластеров) для обследования Отбор элементов кластера: а) В выборку включаются все элементы отобранного кластера б) Случайный отбор элементов из каждого кластера ! Точность ! Эффективность
36 Процедура вероятностного отбора (Simple Random Sampling) Выберите основу выборочного обследования, присвойте порядковый номер каждому элементу списка Пример: список выпускников, статистическая таблица Определите объём выборки Пример: 10 из 950 элементов основы (числа выпускников в году Х) Определите систему (процедуру) случайного отбора: Бросание игральных костей, вытягивание номеров из шляпы и т.п.* Таблица случайных чисел Генератор случайных чисел Пример: в таблице случайных чисел выбирают три правые цифры из колонки (в списке выпускников – трёхзначные числа) и двигаются вниз, пока не будет отобрано 10 единиц ____________________________ * Номера в шляпе (суммы, получаемые при бросании костей, и т.д.) должны соответствовать элементам списка (основы выборки)
37 Процедура систематического отбора Определение подходящей основы выборки Каждый элемент основы выборки нумеруется от 1 до N (объем совокупности) (например, объем совокупности составляет 100 000 единиц, а желаемый объем выборки 1000 единиц) Определение интервала выборки i=N/n, который определяется как отношение объема совокупности N к объему выборки n (N = 100 000, n = 1000), i=100 Выберите случайное число, r, от 1 до 100, (например, 23) Выборка состоит из элементов: r, r+i,r+2i,r+3i,r+4i,...,r+(n-1)I (23.123.223.323.423.523…) !Отсутствие смещения в списке (например, при расположении в алфавитном порядке фамилии, начинающиеся с определенных букв могут преобладать)
38 Стратифицированный отбор Страты должны взаимно исключать и взаимно дополнять друг друга, каждый элемент совокупности относится только к одной страте Элементы стратификации – характеристики покупателя (социально-демографические), обычно – два элемента Пропорциональная стратифицированная выборка – отбор производится пропорционально размерам каждого сегмента Непропорциональная стратифицированная выборка – если в одних сегментах вариация признака больше, чем в других, то из первых отбирается большее количество элементов, за счет чего ошибка выборки в первом сегменте снижается, а во втором остается почти без изменения – общая ошибка выборки снижается
39 Территориальная выборка
40 Детерминированные (невероятностные) выборки Метод удобства, convenience – выборка создается из удобных для отбора элементов Поверхностная (типовая, экспертная), judgmental – элементы совокупности, которые отбираются на основе суждения исследователя «Снежный ком», snowball – случайным образом выбирается начальная группа респондентов, которые затем респонденты указывают на других лиц, готовых участвовать в опросе Квотная выборка, quota sampling – двухэтапная поверхностная выборка: Определение квот (контрольных групп), например демографическая структура ГС Отбор элементов методом удобства
41 Выборки для интернет-опросов Смещение выборки Отсутствие базы адресов электронной почты полнота списка использование нескольких адресов Доступные панели согласие участвовать в интернет-опросах
42 Преимущества и недостатки методов выборки
43 Малхотра Н. Маркетинговые исследования, Главы 11-12, С. 408-438, 443-467 Аакер Д., Кумар В., Дэй Д. Маркетинговые исследования, Главы 14-15, С. 416-442, 451-467 Черчилль Г., Браун Т. Маркетинговые исследования, Главы 15-17, С.388-457 Хили Дж. Статистика. Социологические и маркетинговые исследования, Главы 6-7, С.178-218 Литература к лекции 13
44 Малхотра Н. Маркетинговые исследования, Главы 14-15, С.519-547, С.552-598 Аакер Д., Кумар В., Дэй Д. Маркетинговые исследования, Главы 16-18, С. 480-501, 505-522, 528-550 Черчилль Г., Браун Т. Маркетинговые исследования, Главы 19-20, С. 502-518, 520-557 Хили Дж. Статистика. Социологические и маркетинговые исследования, Главы 8-11, С.225-348 Литература к лекции 14
45 Домашнее задание к лекции 14 Прочитайте рекомендованную литературу к лекции 14 (один из источников по выбору) Практическое задание (см. вложенные файлы)
2540-12_mr13_sampling.ppt
- Количество слайдов: 45