Тема 8. определ объема выборки.ppt
- Количество слайдов: 44
Тема 8. Определение объема и процедуры выборки
7. 1. Понятие и этапы определения выборки Проект маркетингового исследования включает в себя изучение единиц, входящих в объект исследования (отдельные люди, семьи, организации и т. д. ). Указанное изучение может проводиться двумя основными способами: n Сплошное исследование – заключается в обследовании всех единиц объекта исследования n Несплошное исследование – заключается в обследовании только части единиц объекта исследования
В практике маркетинговых исследований в большинстве случаев проводиться несплошное исследование, которое обладает следующими преимуществами перед сплошным: n Более низкие временные и денежные затраты n Как правило, меньшие ошибки при сборе данных n Отсутствие необходимости в обладании полным перечнем элементов объекта исследования n В некоторых случаях – единственная возможность исследования Существует несколько подходов к проведению несплошного исследования. Наиболее распространенным является выборочное исследование Выборочное исследование – исследование подмножества совокупности, сформированной специальными статистическими методами с целью обеспечения принципа репрезентативности Под выборкой или выборочной совокупностью понимается указанное подмножество генеральной совокупности (т. е. всего объекта исследования) Репрезентативность выборки – способность выборочной совокупности в уменьшенном масштабе воспроизводить основные свойства генеральной совокупности
Выборочный план Основные понятия: n Генеральная совокупность – вся группа, про которую необходимо собрать информацию; n Выборка – часть совокупности, базовый уровень исследования; n Ошибка выборки – разница между полученными данными и фактическими по совокупности; n Контур выборки – все единицы совокупности, из которых будет формироваться выборка; n Ошибка контура выборки – степень отклонения контура выборки от генеральной совокупности; n Единица выборки – объект исследования. Не все элементы генеральной совокупности могут быть доступны. Это одна из причин применения выборки
Этапы проектирования выборки Задание объекта исследования На основе целей и задач МИ Определение основы выборки Определение процедуры выборки В зависимости от а) исслед. параметров; б) требуемой точности Реальный процесс формирования (включение элементов) в выборку Сбор первичных данных Перечень элементов, из которых будет определяться выборка. Контур выборки В зависимости от основы (контура) определяются методы формирования Определение объема выборки Отбор элементов выборки Обследование отобранных элементов
Проектирование выборки Задание объекта исследования: четко определяется содержание объекта, подлежащего изучению, исходя из целей и задач маркетингового исследования Определение основы выборки. Под основой выборки понимается перечень элементов, из которых будет производиться выборка Определение процедуры отбора: в зависимости от основы выборки определяется метод ее формирования Определение объема выборки: в зависимости от исследуемых параметров и требований к точности результатов определяется количество элементов, входящих в выборку Отбор элементов выборки: реальное заполнение выборочной совокупности элементами, подлежащими обследованию в определенном объеме и по определенной процедуре Обследование отобранных элементов: сбор первичных данных из элементов, отобранных в выборочную совокупность
7. 2. Основные типы выборки Классификация подходов к формированию выборки Вероятностная выборка – это выборка, в которую каждый элемент объекта исследования может попасть с заданной степенью вероятности Детерминированная выборка – это выборка, в которую элементы попадают на основании заранее определенных предпочтений или суждений Вероятностные выборки считаются более совершенными, поскольку они позволяют рассчитывать характеристики их репрезентативности, что в принципе, невозможно в случае детерминированных выборок. Однако детерминированные выборки менее сложны в проектировании и осуществлении, что делает их очень популярными
7. 2. Основные типы выборки (Г. Черчилль) Преднамеренная нерепрезентативная По методу «снежного кома» Детерминированная Квотная Типы выборки Простая случайная Вероятностная Стратифицированная (расслоенная) Непропорционально стратифицированная Пропорционально стратифицированная Групповая (гнездовая) систематическая территориальная
Основные типы выборки Вероятностные выборки – объектные процесс отбора, min субъективизма оценок, основа для оценки достоверных результатов Вероятностные выборки – это: n Выборка, в которую каждый элемент совокупности может включаться с некоторой заданной ненулевой вероятностью (Г. Черчилль) n Процедура выборочного наблюдения, в соответствии с которой каждый элемент совокупности имеет определенную вероятность включения в выборку (Н. Малхотра) n Все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку – случайная выборка (Е. П. Голубков)
Преимущества и недостатки вероятностных выборок Преимущества Недостатки Сфера эффективного применения Возможность оценить репрезентативность выборки (НО: детерминированная выборка может быть и более репрезентативной, например, консилиум врачей или комиссия приеме экзамена) Возможность оценки точности результатов Гарантирует, что каждая единица совокупности известная имеет равные шансы быть включенной в выборку Эффективна с точки зрения затрат Легка в применении и проста в понимании Результаты можно распространить на генеральную совокупность Имеют большую стоимость, большие затраты на проведение Сложно рассчитать и оценить результаты Низкая точность Необходимость предварительного определения каждой единицы совокупности, что при больших размерах совокупности сделать достаточно сложно Когда у предприятий возникает необходимость точного определения рыночной доли компании или объема продаж на всем рынке, применяют вероятностные выборки. Кроме этого можно использовать в телефонных опросах и исследованиях общенационального рынка, которые представляют информацию по категориям продуктов и частоте использования различных торговых марок а также психологических и демографических характеристиках потребителей.
Детерминированные выборки Выборка, основанная на неких частных предположениях или суждениях, обуславливающих отбор тех или иных элементов, при этом оценка вероятности включения в выборку произвольного элемента совокупности становиться невозможной (Г. Черчилль) n Это метод выборки, в котором не применяется процедура случайного отбора элементов. В значительной степени основан на индивидуальных предпочтениях исследователя (Н. Малхотра) n Невероятностный метод отбора, осуществляемый без использования понятий теорий вероятностей, вследствие чего невозможно рассчитать вероятность включения в выборку единицы совокупности (Е. П. Голубков) n
Преимущества и недостатки детерминированных выборок Преимущества Недостатки Сфера эффективного применения Менее сложны в проектировании и осуществлении Наибольшее удобство отбора элементов совокупности Минимальное количество затрат и усилий Невозможность гарантировать репрезентативность выборки Не позволяет оценить точность оценки и определить ошибки выборочного обследования Допустимы лишь при поисковых исследованиях, имеющих целью отработку определенных идей или представлений Не позволяет распространить полученные результаты на генеральную совокупность Тестирование идеи нового товара, упаковки и названия продукции, анализ эффективности рекламы (для которых обычно не требуется распространении результатов на всю целевую совокупность). Применимы также при проведении маркетинговых исследованиях продукции производственно технического назначения.
Вероятностные выборки Простая случайная n Стратифицированная n Групповая Простая случайная выборка – выборка, в которой каждый элемент объекта исследования с равной вероятностью может попасть в выборочную совокупность Основное преимущество простой случайной выборки – возможность применения статистических методов для точного определения степени ее репрезентативности Основной недостаток – необходимость обладания полным перечнем элементов исследуемой совокупности n
Основные типы вероятностной выборки 1. Простая случайная выборка – Каждый элемент, включаемый в выборку, обладает одной и той же заданной вероятностью попадания в число исследуемых элементов, и любая комбинация элементов исходной популяции может потенциально стать выборкой (Г. Черчилль) Это вероятностный метод выборки, согласно которому каждый элемент генеральной совокупности имеет равную вероятность отбора. Каждый элемент выбирается независимо от каждого другого элемента, и выборка формируется произвольным отбором элементов из основы выборки (Н. Малхотра) Это простой случайный отбор, который предполагает, что вероятность быть избранным в выборку известная и является одинаковой для всех единиц совокупности (Е. П. Голубков)
Преимущества и недостатки простой случайной выборки Преимущества Недостатки Простейший метод n Сложно создать формирования выборки основу выборочного наблюдения n Результаты можно распространить на всю n Большие затраты на совокупность проведение n Низкая точность n Не гарантирует репрезентативность n
2. Стратифицированная выборка – Расслоенная выборка – вероятностная выборка, формируемая в результате процедуры, состоящей из двух шагов: 1) генеральная совокупность делится на ряд непересекающихся исчерпывающих (т. е. все элементы страт должны войти в генеральную совокупность) ее подмножеств (частные совокупности); 2) в каждом подмножестве или группе производится независимый отбор элементов простых случайных выборок ( Г. Черчилль) Двухэтапный метод вероятностной выборки, согласно которому генеральная совокупность сначала делится на подгруппы или слои (страты). Затем элементы случайным образом выбираются из каждого слоя (Н. Малхотра) Несимметричное распределение совокупности, которая разделяется на различные подгруппы (страты). Далее для каждой страты с помощью случайного отбора формируется выборка (Е. П. Голубков)
Преимущества и недостатки стратифицированной выборки Преимущества Позволяет уменьшить ошибку выборочного обследования n Включает все важные подгруппы совокупности n Высокая точность n Недостатки Сложно подобрать подходящие переменные для стратификации n Невозможно стратифицирование с учетом многих переменных n Большие затраты на проведение n
3. Кластерная выборка – Групповая выборка – вероятностная выборка. Формируемая в результате процедуры состоящей из двух шагов: 1) генеральная совокупность делится на ряд непересекающихся исчерпывающих ее подмножеств (кластеров); 2) производится случайный отбор подмножеств (Г. Черчилль) Сначала изучаемая совокупность делится на взаимоисключающие и взаимодополняющие подгруппа, называемые кластерами. Затем с помощью вероятностного метода выборки, такого как простая случайная выборка, отбираются кластеры. В выборку включаются либо все элементы отобранного кластера, либо проводится их отбор вероятностным методом (Н. Малхотра) Метод вероятностного отбора, основанный на делении совокупности на подгруппы, каждая из которых представляет совокупность в целом (Е. П. Голубков)
Преимущества и недостатки кластерной выборки Преимущества Недостатки Легка в применении n Низкая точность n Эффективная с точки n Сложно рассчитать зрения затрат и оценить результаты n Репрезентативность результатов, полученных на основе исследований для группы кластеров, является высокой. Чем для одного кластера n
Н. Малхотра выделяет еще один тип вероятностной выборки как систематическая выборка – вероятностный метод выборки, в соответствии с которым сначала задают произвольную отправную точку, а затем из основы выборочного наблюдения последователь выбирает каждый 1 й элемент Е. П. Голубков включает в состав вероятностного метода – систематический отбор, который предполагает следующую процедуру: 1) необходимо получить полный список единиц генеральной совокупности; 2) каждому элементу совокупности присваивается показатель «Интервал скачка» , рассчитываемый как отношение размера совокупности к объему выборки (например, если используется телефонный справочник и интервал скачка был определен равным 250, то это означает, что каждый 250 й телефонный номер включается в выборку) Г. Черчилль: систематическая выборка – это вид групповой (кластерной выборки), которая предполагает отбор элементов с установленным шагом.
Преимущества и недостатки систематической выборки Преимущества Проста в применении n Не требуется основа выборки n Позволяет увеличить репрезентативность n Более экономичный и быстрый метод, по сравнению с простым случайным отбором n Недостатки Может уменьшить репрезентативность n
И так: Стратифицированная выборка – вероятностная выборка, в которую элементы отбираются в два этапа: сначала генеральная совокупность разделяется на непересекающиеся исчерпывающие подмножества, а затем в каждом из подмножеств производится отбор элементов по методу простой случайной выборки Подмножества, сформированные в рамках стратифицированной выборки, называются стратами Преимущества стратифицированной выборки: n Она дает более репрезентативные результаты n Разделение на страты позволяет охватить все слои, которые могут представлять особый интерес для исследователя (например, какие либо малочисленные сегменты) Групповая, или кластерная выборка – вероятностная выборка, которая формируется в три этапа: на первом этапе исследуемая совокупность делиться на несколько непересекающихся исчерпывающих подмножеств (кластеров), затем производиться случайный отбор подмножеств для исследования и, наконец в отобранных подмножествах вероятностным методом отбираются конкретные элементы для исследования Разновидностями групповой выборки являются систематическая и территориальная выборки. В первом случае отбор элементов производиться с установленным шагом (каждая n я единица), а во втором в качестве кластеров выступают территории
Основные типы детерминированной выборки Нерепрезентативная – Отбор элементов выборки осуществляется «случайным» образом, отбираются те элементы, которые являются или представляются наиболее доступными в период проведения отбора (Г. Черчилль) При использовании детерминированной выборки исследователи стремятся создать ее из удобных для отбора элементов. Отбор элементов для включения в выборку проводится, главным образом интервьюером (Н. Малхотра) Отбор на основе принципа удобства – формирование выборки осуществляется самым удобным с позиции исследователя образом, например, с позиции минимальных затрат времени и усилий, с позиции доступности респондентов. Выбор метода исследования и состава выборки производится субъективным образом. Пример, данный вид выборки типичен при телефонном опросе. Также при международных МИ – обследование не населения определенных стран, а жителей из этих стран, проживающих в другой стране (русские в США) (Е. П. Голубков) 1.
Преимущества и недостатки нерепрезентативной выборки Преимущества Недостатки Наименьшая стоимость n Необъективность отбора n Наименьшая n Выборка нерепрезентативная продолжительность (простое увеличение ее объема не делает более n Наибольшее удобство репрезентативной) отбора элементов n Допустимы лишь при поисковым исследованиях (нельзя для описательных исследований) n. Невозможность оценки ошибки (нельзя при каузальных) n
2. Преднамеренная (не вполне случайная) – Детерминированная выборка, элементы которой отбираются вручную, отбираются именно те элементы, которые по мысли исследователя отвечают целям обследования (Г. Черчилль) Поверхностная выборка – вид нерепзентативной выборки, в соответствии с которой элементы совокупности умышленно отбираются на основе суждений исследователя (Н. Малхотра) Отбор на основе суждений – основано на использовании мнений квалифицированных специалистов, экспертов относительно выборки (Е. П. Голубков)
Преимущества и недостатки преднамеренной выборки Преимущества Низкая стоимость n Удобство n Небольшая продолжительность n Недостатки Не позволяет распространить результаты на генеральную совокупность n Субъективна n
3. Выборка по методу «снежного кома» – Это вид преднамеренной выборки, при которой происходит отбор множества респондентов, обладающих потребными характеристиками и являющиеся информантами для дальнейшего отбора индивидов с нужными характеристиками (Г. Черчилль) Детерминированный выборочный метод, согласно которому случайным образом подбирается начальная группа респондентов. В дальнейшем отбор осуществляется из числа кандидатов, указанных первыми респондентами, или на основе представленной ими информации. Данный процесс происходит волнообразно, когда респонденты, прошедшие опрос, называют следующих кандидатов и т. д. (Н. Малхотра) Формирование выборки в процессе опроса – основано на расширении числа опрашиваемых на основе предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку меньшую, чем требуется в проводимом исследовании. Затем она по мере проведения обследования расширяется. (Е. П. Голубков)
Преимущества и недостатки выборки по методу «снежного кома» Преимущества Позволяет оценить необычные для совокупности характеристики n Недостатки Большая продолжительность n Не может использоваться при описательных и каузальных исследованиях n
4. Квотная выборка – Отбор конкретных элементов совокупности определяется выбором интервьюера, который соблюдает только те условия, которые были заданы квотой (Г. Черчилль) Детерминированный метод выборки, который представляет собой двухэтапную ограниченную поверхностую выборку. Первый этап включает создание контрольных групп, или квот, из элементов совокупности. На втором этапе выбор элементов основан на удобстве отбора или мнении исследователя (Н. Малхотра) Формирование выборки на основе квот (квотный отбор) – предполагает предварительной, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам) (Е. П. Голубков)
Преимущества и недостатки квотной выборки Преимущества Может регулироваться по определенным признакам. При этом квоты могут быть разные. n Недостатки Выборка может существенно отличатся от генеральной совокупности (напр. , в Совете университета – 2 представителя от факультета, Совет имеет средний возраст значительно высокий, чем в среднем по представителям n. Необъективность отбора, волюнтаризм полевых сотрудников (все решает интервьюер или исполнитель. Он может опросить своих приятелей, родственников) n Не гарантирует репрезентативность n. Увеличение числа характеристик удорожает обследование, часто делает невозможным определение выборки n
И так, Нерепрезентативные выборки основаны на отборе наиболее доступных элементов (множества знакомых, однокурсников, посетителей магазина в определенное время, читателей газеты или зрителей телеэкрана, коллег по работе). Такая выборка не позволяет получить полностью достоверные сведения об объекте исследования, поэтому ее рекомендуется использовать только при поисковых исследованиях Преднамеренные выборки основаны на отборе вручную тех элементов, которые, по мнению исследователя, отвечают целям исследования (исследование определенной группы людей, которые, как выяснилось по результатам предыдущих исследований, имеют такие характеристики поведения, как и вся исследуемая совокупность) Разновидность данной выборки – выборка по принципу «снежного кома» , которая заключается в определении первоначальных элементов, каждый из которых указывает на несколько новых, и т. д. Основной недостаток преднамеренной выборки – невозможность оценки ее ошибки и низкая степень репрезентативности
7. 3. Определение оптимального объема выборки Оптимальный объем выборки зависит от следующих параметров: n Тип выборки n Изучаемые характеристики их распределение в генеральной совокупности n Доступные ресурсы (финансовые, временные) для исследования При определении объема выборки исследователь использует два основных статистических параметра: n Точность оценки – величина ошибки результата в абсолютном или относительном выражении n Степень достоверности оценки – вероятность того, что оценка соответствует истинному значению при установленной точности При определении объема выборки исследователь должен достичь баланса между точностью и достоверностью
Определение объема простой случайной выборки Определить степень точности и достоверности оценки статистическими методами возможно только для вероятностных выборок. Наиболее несложными и разработанными являются методы такой оценки для простой случайной выборки. На этих методах основаны способы определения оптимального объема выборки
В общем случае для выборок достаточно большого объема (больше 30 элементов) при оценке среднего значения признака в генеральной совокупности объем определяется по следующей формуле: Где n – объем выборки t – аргумент нормированной функции Лапласа Ф(t). , соответствующий принятому уровню доверительной вероятности(т. е. вероятности, с которой истинное значение признака в генеральной совокупности не превысит установленной предельной ошибки), определяется по статистическим таблицам s генеральная дисперсия изучаемого признака, или среднеквадратичное отклонение ∆ предельная ошибка выборки (т. е. величина, устанавливающая границы интервала относительно выборочного среднего значения, в которые с указанной доверительной вероятностью попадает генеральное среднее значение изучаемого признака
95% ный доверительный интервал
На практике, если выборка формируется заново и схожие опросы не проводились, то s не известно. В этом случае целесообразно задавать погрешность ∆ в долях от среднеквадратического отклонения. Расчетная формула преобразуется и приобретает следующий вид:
Как правило, генеральная дисперсия неизвестна. В этом случае используют различные ее оценки. Если известна примерная величина средней, дисперсию находят из соотношения s ≈1/3 Xср. , где Х – значение изучаемого Если известны Хmax и Хmin, то можно определить дисперсию в соответствии с правилом «трех сигм» : s 1/6 (Хmax Хmin). Если распределение заведомо асимметричное, то s 1/5 (Хmax Хmin).
n При расчете величины выборки необходимо разумно подходить к установлению значения надежности (достоверности) и погрешности. Основной недостаток: Неоправданный выбор высоких значений надежности (например, 99%) или уменьшение погрешности (например, требование, чтобы оценка не отклонялась более чем на 1%) приводит к значительному увеличению объемов выборки, а следовательно, к росту затрат на проведение исследования.
Определение объема выборки с использованием перекрестной классификации n Используется для упорядочения данных n Составление перекрестных таблиц в целях учета взаимозависимости признаков элементов выборки n Необходимость учета, как специфики совокупности, так и специфики классификации Рассмотрим данный метод на следующем примере. Предположим, нужно оценить долю всех женщин, посещающих салон красоты и соотнести эту долю с возрастом и уровнем доходов этих женщин.
Рассмотрим следующие возрастные категории: до 24 лет, 24 40 лет, 40 50 лет и после 50 лет. Уровень дохода: менее 6000, 6000 8000 руб. , 8000 10000 руб. и свыше 10000. Таким образом, доля должна быть соотнесена с четырьмя возрастными категориями и четырьмя категориями, учитывающими уровень дохода. Можно рассчитать доли отдельно для каждого признака, учитывая их известную взаимозависимость, выражающую в том, что уровень, как правило, повышается с возрастом. Для учета названной взаимозависимости нужно рассмотреть оба этих признака. Для этого составляется перекрестная таблица, в которой возраст и уровень доходов соответствует тем или иным классификационным ячейкам таблицы
Доход Возраст До 24 лет Менее 6000 руб. 6000 -8000 руб. 8000 -10000 руб. Свыше 10000 руб. 24 -40 лет 40 -50 лет После 50 лет
Общее число ячеек равно 16. Для выборки, состоящей из 400 женщин, потенциальный размер ячейки при равномерном распределении элементов выборки по указанным категориям составит 400/16=25. Такое распределение элементов крайне маловероятно, и по этой причине исследователь может оказаться в ужасном положении, когда ему придется оценивать доли по единичным наблюдениям. Поэтому в данном случае исследователь определяет количество ячеек в таблице предполагаемой перекрестной классификации. Это количество определяется как произведение чисел классификационных уровней того и другого признаков. В данном случае мы перемножим четыре возрастных и четыре «доходных» уровней и получим 16 ячеек. Если минимальное количество наблюдений на ячейку будет определено равным 30, мы получим выборку объемом 480 единиц. Поскольку вероятность равномерного распределения элементов этой выборки между ячейками крайне мала, исследователю необходимо предварительно определить распределение элементов выборки. После выделения наиболее важных ячеек исследователь может определить требуемый объем выборки, обеспечивающий заданную точность и достоверность результатов. Следует взять за правило следующие требования: “объем выборки должен обеспечивать не менее 100 наблюдений для каждой первостепенной и не менее 20 50, наблюдений для каждой второстепенной классификационной состав ляющей”. Первостепенные классификационные составляющие соответствуют наиболее критичным, а второстепенные — наименее критичным ячейкам перекрестной классификации, принятой в данном обследовании.
Определение объема выборки с использованием результатов, полученных ранее n Психологическая комфортность для исследователя n Популярность среди еще неопытных исследователей n Весьма далек от идеального Источниками данных могут служить как общенациональные обследования, которые, как правило требуют использования больших объемов выборок, а также региональные или специальные
Вывод В зависимости от целей и предмета исследования исследователь выбирает для себя тип выборки и способ ее определения ее объема, т. е. наиболее эффективного для расчета именно оптимального размера выборки
Тема 8. определ объема выборки.ppt