12_MR13_sampling.ppt
- Количество слайдов: 45
Лекция 13 Выборочные исследования
2 План лекции 13 1. 2. 3. 4. Основы выборочного метода исследований Процесс выборочного обследования Методы формирования выборки Статистические методы определения объёма выборки и анализа выборочных статистик 5. Процедуры вероятностных методов формирования выборок
3 Генеральная совокупность • Генеральная совокупность, популяция (population) – совокупность всех элементов, обладающих рядом общих характеристик, которая охватывает полное множество элементов с точки зрения решения проблемы маркетингового исследования
Элементы и характеристики генеральной совокупности • Элемент совокупности (element) – объект, являющийся источником или носителем исследуемых признаков генеральной совокупности • Единица выборки (sampling unit)базовая единица, содержащая элементы генеральной совокупности, подлежащие отбору 4
Способы изучения генеральной совокупности ü Перепись (Сensus) – сплошное обследование элементов генеральной совокупности ü Выборка (Sample) – подмножество элементов генеральной совокупности, отобранное для участия в обследовании • Параметр – характеристика генеральной совокупности • Статистика – характеристика (параметр) выборки 5
6 Выборка vs. перепись Факторы Характеристики Выборки Переписи Бюджет небольшой Продолжительность небольшая длительная большой небольшой Разброс характеристик небольшой Цена ошибки выборки низкая высокая низкая разрушающий неразрушающий да нет Размер генеральной совокупности Цена систематической ошибки Характер измерения Анализ частных случаев
7 Точность выборочного исследования Общая ошибка Ошибка выборки Систематическая (невыборочная) ошибка Ошибка ненаблюдения Определяет меру подобия структуры выборки структуре генеральной совокупности Ошибка наблюдения: • исследователя • связанные с респондентом • связанные с инструментом измерения • связанные с поведением интервьюера
8 Процесс выборочного обследования Определение генеральной совокупности Определение основы выборки Определение метода формирования выборки Определение объема выборки Отбор элементов выборки и сбор данных
9 Процесс выборочного обследования Определение генеральной совокупности ü ü Элементы выборки Единицы выборки Географические Временные ограничения Определение основы выборки Определение метода формирования выборки Определение объема выборки Отбор элементов выборки и сбор данных 1. Кого включить? 2. Кого исключить? • Задачи исследования • Альтернатив ы • Строгость ограничений • Удобство • Воспроизво димость
Определение генеральной (целевой) совокупности 10 • Все водители автомобилей • Люди, являющиеся в настоящее время собственниками VW Golf • Люди, являющиеся в настоящее время собственниками хэтчбеков среднего размера • Люди, ранее запрашивавшие информацию о моделях VW Golf • Те, кто собирается приобретать автомобиль в течение ближайших 24 месяцев • Те, кто собирается приобретать хэтчбек среднего размера в течение ближайших 24 месяцев Водители, в настоящее время владеющие хэтчбеком среднего размера и собирающиеся приобрести аналогичный автомобиль на замену в течение ближайших 24 месяцев
11 Процесс выборочного обследования Определение генеральной совокупности Основа (база, контур) выборки, sampling frame – перечень элементов, из которых будет производиться выборка: может состоять из территориальных единиц, организаций, лиц и других элементов Определение метода формирования выборки Определение объема выборки Отбор элементов выборки и сбор данных ØСписок или процедура ØПроблемы: • наличие • полнота • свежесть
12 Процесс выборочного обследования Определение генеральной совокупности Определение основы выборки Определение метода формирования выборки • Вид исследования и тип отбора • Детерминированный и вероятностный отбор Определение объема выборки Отбор элементов выборки и сбор данных ØБайесовские традиционные ØПовторные и бесповторные и
Репрезентативность выборки и методы её формирования 13 v В репрезентативной выборке состав обследуемых по выделенным параметрам (критериям) должен приближаться к соответствующим пропорциям в генеральной совокупности Детерминированный (неслучайный) отбор Вероятностный (случайный) отбор Отбор единиц выборки по субъективным представлениям исследователя случайным образом (методы мат. статистики) Вероятность попадания каждого элемента ГС в выборку неизвестна все единицы ГС имеют равный шанс быть отобранными в выборку не поддается оценке Можно оценить ошибку выборки и статистические характеристики ГС Точность результатов исследования
14 Методы формирования выборки Выборка Детерминированная (неслучайная) Вероятностная (случайная) Метод удобства Простая случайная Поверхностная (типовая, экспертная) Систематическая «Снежный ком» Стратифицированная Квотная Кластерная Другие методы
15 Методы формирования выборки
16 Процесс выборочного обследования Определение генеральной совокупности Определение основы выборки Определение метода формирования выборки Объём (размер) выборки, sample size – количество элементов, которые необходимо изучить Отбор элементов выборки и сбор данных
17 Определение объёма выборки • Объём выборки зависит от уровня однородности изучаемых объектов (! детализация) • Минимальный размер однородной группы в выборке не должен быть меньше 30 • Чем больше объём выборки, тем больше затраты на проведение исследований • Точность результатов выборки ограничена • Для случайных и репрезентативных выборок: чем больше размер, тем более надёжны результаты при заданной точности Методы определения объёма выборки Øна основе бюджета Øэвристический метод Øстатистический метод
18 Типичные объёмы выборки Вид исследования Минимальный объем Обычный диапазон Исследование для определения проблемы (потенциал рынка) 500 1 000 -2 500 Исследования для решения проблемы (определение цены) 200 300 -500 Тестирование товара 200 300 -500 Пробный маркетинг 200 300 -500 TV, радио, печатная реклама (на 1 рекламное объявление для определения его эффективности) 150 200 -300 10 магазинов 10 -20 магазинов 2 группы 4 -12 групп Аудит на пробном рынке Фокус-группы
19 Статистический метод определения объёма выборки Статистический метод – нахождение минимально необходимого размера выборки с помощью статистических вычислений с использованием формул для определения границ доверительного интервала.
20 Параметры для определения объёма выборки и статистического анализа При использовании простой случайной выборки (МРВО или SRS) выбор формулы для расчета размера выборки зависит от требуемой информации: Средние значения • возраст • уровень расходов на продукты питания • уровень удовлетворённости • количество посещений ночных клубов в месяц, в год • и т. д. Доли (пропорции) • доля расходов на одежду в структуре семейного бюджета • доля покупателей нового продукта в период Х • доля лояльных/нелояльных покупателей • и т. д.
21 Центральная предельная теорема Для простых случайных выборок большого объема распределение выборочных средних приближается к нормальному в центре, равной истинному значению средней; истинная дисперсия равна средней выборочных дисперсий Стандартная ошибка выборочного среднего выборочной доли (1) (2) σх – стандартное отклонение (стандартная ошибка) выборочного среднего σ – стандартное отклонение (стандартная ошибка) выборочной доли (пропорции) σ – СКО среднего или доли генеральной совокупности p – доля (пропорция) n – объём выборки
22 «Правило трёх сигм» Практически все значения (99, 7%) нормально распределённой случайной величины лежат в интервале +/– 3σ Абсолютное значение ошибки находится • в 68, 3% случаев – в пределах σ • в 95, 45% случаев – в пределах 2σ • в 99, 07% случаев – в пределах 3σ
23 «Правило трёх сигм» Практически все значения (99, 7%) нормально распределённой случайной величины лежат в интервале +/– 3σ Абсолютное значение ошибки находится Доверительный интервал • в 68, 3% случаев – в пределах σ д. и. = х z×σx • в 95, 45% случаев – в пределах 2σ интервал , в котором находится среднего ГС с • в 99, 07% случаев – в пределах 3σ значениедостоверности заданным уровнем
24 «Правило трёх сигм» Практически все значения (99, 7%) нормально распределённой случайной величины лежат в интервале +/– 3σ Доверительная вероятность = уровень доверия = надёжность определяет коэффициент доверия z Абсолютное значение ошибки находится Доверительный интервал • в 68, 3% случаев – в пределах σ д. и. = х z×σx • в 95, 45% случаев – в пределах 2σ интервал , в котором находится среднего ГС с • в 99, 07% случаев – в пределах 3σ значениедостоверности заданным уровнем
Статистические показатели для определения размера выборки 25 • , выборочное среднее • p, выборочная доля (пропорция) • σ2, дисперсия совокупности • σ, стандартная ошибка выборочного среднего (σх) или доли (σ ) – характеризует уровень точности • z, коэффициент доверия – отражает надежность • х z×σх или z×σ , доверительный интервал – оценка значения (диапазон значений) параметра ГС Точность – допустимая ошибка результата выборочного исследования Надёжность – повторение результатов
26 Коэффициент доверия – количество стандартных ошибок, на которое точка удалена от среднего , где (3) z – коэффициент доверия – выборочное среднее – генеральное среднее σх – стандартная ошибка выборочного среднего E (также обозначается как D) - максимально допустимое различие между выборочным и истинным средним Определяется по выбранному уровню достоверности (доверительной вероятности)
Алгоритм определения объёма выборки Какие данные должны быть получены? 1. Задать надёжность вероятности) (уровень доверительной ØНапример, 95% или 95, 45% 2. Задать уровень точности Øдисперсия прошлых исследований Øоценка по выборочной дисперсии Øна основе мнения исследователя Ø Пример: Анализ диапазона изменений характеристики: 14 дней*1 000 руб. = 14 000, диапазон изменения [0; 14 000], большинство укладывается в +/-3σ, т. е. 6σ: 14000/6=2333 руб. ØКонкретное значение (Е) например 3% 3. Рассчитать объём выборки по формулам (4) или (5) 27
28 Расчёт размера выборки на основе средних значений 2 , где (4)* z – коэффициент доверия σ – стандартное отклонение Е – максимально допустимое различие между выборочным и истинным средним _____ * (4) выводится из (1) и (3)
29 Расчёт размера выборки на основе долей , где (5) z – коэффициент доверия Е – максимально допустимое различие между выборочным и истинным средним Р – доля совокупности, демонстрирующая определенное поведение
30 Расчёт размера выборки на основе средних значений • Изучается поведение покупателей в продовольственном магазине. Владелец магазина (эксперт) говорит, что при средней сумме чека 500 -700 руб. , среднее отклонение σ может составить 200 руб. • В ходе опроса хотелось бы определить среднее значение с точностью (Е) до 20 руб. , при уровне доверия 0, 95 Дано: σ = 200 руб. , Е = 20 руб. , уровень доверия 95% Найти: объём выборки n Решение: 1. Определить z : для надёжности 95% z=1, 96 2 2. Рассчитать требуемый объём выборки: n=22*2002/202= 4*40000/400 =400 чел. Сравните: при уровне доверия 0, 99 (z 3) n= 900 чел. при точности до 10 руб. n=1600 чел при точности до 50 руб. n=64 чел
Факторы, определяющие размер выборки 31 • Число параметров (групп и подгрупп), анализ которых требуется провести (уровень детализации результатов) – Например, для получения репрезентативной выборки • по полу и возрасту – 2 параметра ( 400 чел. ) • по полу, возрасту, уровню лояльности – 3 параметра ( 600 чел. ) – Если репрезентативных вопросов несколько? • Ценность информации и требуемая точность результатов • Стоимость выборки • Однородность изучаемых объектов (разброс параметра совокупности) Размер выборки НЕ зависит от размера генеральной совокупности
32 Метод доверительных интервалов (confidence level) В исследовании, целью которого было определение среднемесячных расходов семьи на покупки продовольственных товаров, была использована простая случайная выборка из 300 семей. В результате было установлено, что в среднем потребители тратят 6000 рублей в месяц на приобретение продуктов питания для семьи. Предыдущие исследования показали, что среднеквадратическое отклонение составляет 350 рублей. Необходимо найти доверительный интервал, который охарактеризует возможные значения среднемесячных расходов на продукты питания в ГС с определённым уровнем надёжности (например, 95%) Дано: n=300, σ = 350 руб. , х = 6000 руб. , уровень доверия 95% Найти: доверительный интервал Решение: 1. Вычислить стандартную ошибку среднего: 2. Определить z на основе стат. таблиц: для уровня доверия 95% z=1, 96 3. Рассчитать доверительный интервал : х z×σ= 6000 1, 96*20, 2=6000 39. 6 Доверительный интервал: 5960<Xген<6040
Репрезентативная выборка населения России 33 • Состоит из 3600 -9000 человек и 180 групп (страт): (два пола, три возраста, два образовательных уровня, три доходные группы, пять типов поселений) • Доверительный интервал будет в пределах + 3 процентных пункта* для заданного уровня доверия • Это значит, что если 30% (12% или 45%) респондентов заявили, что регулярно употребляют майонез, то долю потребителей майонеза в России можно оценить в 27 -33 % (или 9 -15 или 42 -48% соответственно) prof. I. Skorobogatykh marketing research course
34 Эффективность выборки: компромисс «точность-стоимость» • Издержки и время на проведение исследования растут примерно в той же пропорции, что размер выборки Ø n*1, 5 (+50%) $, t*1, 5 (+50%) • Ошибка исследования уменьшается пропорционально квадратному корню прироста размера выборки Ø n*2 (+100%) σх*0, 9 (-10%)
Вероятностные (случайные) выборки 35 • Простая случайная, simple random – каждый элемент генеральной совокупности имеет известную и равную вероятность быть отобранным (на основе теории больших чисел или статистической вероятности) • Систематическая, systematic – метод, когда сначала задается отправная точка, затем из основы выборки выбирают каждый iэлемент • Стратифицированная (расслоенная), stratified – двухэтапный метод: ! Точн 1. Разделение ГС на взаимоисключающие слои (страты) ость 2. Случайный отбор элементов из каждого слоя. Каждый элемент относится только к одному слою • Кластерная, cluster – одно-, двух- и многоступенчатый отбор: 1. Разделение ГС на взаимоисключающие и взаимодополняющие подгруппы (кластеры). Каждый кластер – небольшая модель ГС. 2. Отбор кластера (кластеров) для обследования ! Эфф ектив 3. Отбор элементов кластера: ность а) В выборку включаются все элементы отобранного кластера б) Случайный отбор элементов из каждого кластера
36 Процедура вероятностного отбора (Simple Random Sampling) 1. Выберите основу выборочного обследования, присвойте порядковый номер каждому элементу списка • Пример: список выпускников, статистическая таблица 2. Определите объём выборки • Пример: 10 из 950 элементов основы (числа выпускников в году Х) 3. Определите систему (процедуру) случайного отбора: Ø Бросание игральных костей, вытягивание номеров из шляпы и т. п. * Ø Таблица случайных чисел Ø Генератор случайных чисел • Пример: в таблице случайных чисел выбирают три правые цифры из колонки (в списке выпускников – трёхзначные числа) и двигаются вниз, пока не будет отобрано 10 единиц ______________ * Номера в шляпе (суммы, получаемые при бросании костей, и т. д. ) должны соответствовать элементам списка (основы выборки)
37 Процедура систематического отбора 1. Определение подходящей основы выборки 2. Каждый элемент основы выборки нумеруется от 1 до N (объем совокупности) (например, объем совокупности составляет 100 000 единиц, а желаемый объем выборки 1000 единиц) 3. Определение интервала выборки i=N/n, который определяется как отношение объема совокупности N к объему выборки n (N = 100 000, n = 1000), i=100 4. Выберите случайное число, r, от 1 до 100, (например, 23) 5. Выборка состоит из элементов: r, r+i, r+2 i, r+3 i, r+4 i, . . . , r+(n-1)I (23. 123. 223. 323. 423. 523…) !Отсутствие смещения в списке (например, при расположении в алфавитном порядке фамилии, начинающиеся с определенных букв могут преобладать)
38 Стратифицированный отбор • Страты должны взаимно исключать и взаимно дополнять друга, каждый элемент совокупности относится только к одной страте • Элементы стратификации – характеристики покупателя (социально-демографические), обычно – два элемента Ø Пропорциональная стратифицированная выборка – отбор производится пропорционально размерам каждого сегмента Ø Непропорциональная стратифицированная выборка – если в одних сегментах вариация признака больше, чем в других, то из первых отбирается большее количество элементов, за счет чего ошибка выборки в первом сегменте снижается, а во втором остается почти без изменения – общая ошибка выборки снижается
39 Территориальная выборка
Детерминированные (невероятностные) выборки • • 40 Метод удобства, convenience – выборка создается из удобных для отбора элементов Поверхностная (типовая, экспертная), judgmental – элементы совокупности, которые отбираются на основе суждения исследователя «Снежный ком» , snowball – случайным образом выбирается начальная группа респондентов, которые затем респонденты указывают на других лиц, готовых участвовать в опросе Квотная выборка, quota sampling – двухэтапная поверхностная выборка: 1. Определение квот (контрольных групп), например демографическая структура ГС 2. Отбор элементов методом удобства
41 Выборки для интернет-опросов ü Смещение выборки ü Отсутствие базы адресов электронной почты – полнота списка – использование нескольких адресов ü Доступные панели – согласие участвовать в интернет-опросах
Преимущества и недостатки методов выборки 42 Метод удобства Низкая стоимость, продолжительность, Удобство отбора элементов Недостоверность, нерепрезентативность Поверхностная Низкая стоимость, удобство, небольшая продолжительность Не позволяет распространять результаты на всю совокупность Квотная Регулируется по определенным характеристикам Необъективность отбора, нет гарантии репрезентативности «Снежный ком» Позволяет оценить необычные для совокупности характеристики Большая продолжительность Простая случайная Проста для понимания, репрезентативна - результаты можно распространить на совокупность Сложно создать основу выборки Большие затраты Систематическая Позволяет увеличить репрезентативность, проще в применении, чем простая, не требуется основа выборки Может уменьшить репрезентативность Стратифицированн ая Включает все важные подгруппы совокупности, высокая точность Сложно выбрать подходящие переменные для стратификации, большие затраты на проведение Кластерная Легка в применении по сравнению с другими вероятностными, эффективна с точки зрения затрат Низкая точность, сложно рассчитать и оценить результаты
43 Литература к лекции 13 • Малхотра Н. Маркетинговые исследования, Главы 11 -12, С. 408 -438, 443 -467 • Аакер Д. , Кумар В. , Дэй Д. Маркетинговые исследования, Главы 14 -15, С. 416 -442, 451 -467 • Черчилль Г. , Браун Т. Маркетинговые исследования, Главы 15 -17, С. 388 -457 • Хили Дж. Статистика. Социологические и маркетинговые исследования, Главы 6 -7, С. 178218
44 Литература к лекции 14 • Малхотра Н. Маркетинговые исследования, Главы 14 -15, С. 519 -547, С. 552 -598 • Аакер Д. , Кумар В. , Дэй Д. Маркетинговые исследования, Главы 16 -18, С. 480 -501, 505 -522, 528 -550 • Черчилль Г. , Браун Т. Маркетинговые исследования, Главы 19 -20, С. 502 -518, 520 -557 • Хили Дж. Статистика. Социологические и маркетинговые исследования, Главы 8 -11, С. 225348
45 Домашнее задание к лекции 14 i. Прочитайте рекомендованную литературу к лекции 14 (один из источников по выбору) ØПрактическое задание (см. вложенные файлы)
12_MR13_sampling.ppt