ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ (статистические основы маркетингового
ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ (статистические основы маркетингового исследования) 1
Выборочное наблюдение научно обоснованный способ не сплошного наблюдения, при котором обследуется не вся совокупность, а лишь ее часть, отобранная по определенным правилам выборки и обеспечивающая получение данных, характеризующих всю совокупность в целом, то есть обеспечивающих репрезентативность выборки. 2
ТЕОРЕТИЧЕСКАЯ ОСНОВА ВЫБОРОЧНОГО МЕТОДА Закон больших чисел – при неограниченном увеличении объема выборки практически достоверно, что случайные выборочные характеристики как угодно близко приближаются (сходятся по вероятности) к параметрам (характеристикам) генеральной совокупности 3
ПРЕИМУЩЕСТВА ВЫБОРКИ o Экономия затрат на проведение, возможность расширить программу наблюдения; o Единственный метод анализа, если совокупность наблюдений бесконечная; o Снижаются ошибки регистрации; 4
Базовые понятия и обозначения Подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью, её объем (число элементов) обозначается N (аналог понятию случайной величины). Отобранная из генеральной совокупности часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или просто выборкой, её объем обозначается n. 5
ЗАДАЧА ВЫБОРОЧНОГО МЕТОДА Оценка параметров (характеристик) генеральной совокупности по данным выборки 6
ПОНЯТИЕ ОЦЕНКИ ПАРАМЕТРА Оценкой параметра (статистикой) называют всякую функцию результатов наблюдений случайной величины, с помощью которой судят о значении параметра распределения случайной величины. Статистика зависит от закона распределения случайной величины и числа n, она сама является случайной величиной. 7
Примеры оценок математического ожидания o Выборочное среднее; o Мода; o Медиана; o Полусумму наименьшего и наибольшего значений выборки 8
Свойства оценок o Несмещенность; o Состоятельность; o Эффективность. Если оценка удовлетворяет этим свойствам она является наилучшей оценкой параметра распределения. 9
Несмещенность Оценка параметра распределения является несмещенной его оценкой, если её математическое ожидание равно оцениваемому параметру, в противном случае оценка называется смещенной. Смысл: отсутствие систематической ошибки при оценивании 10
Состоятельность Оценка параметра называется состоятельной, если она удовлетворяет закону больших чисел, то есть сходится по вероятности к оцениваемому параметру. Смысл: чем больше n, тем точнее оценка Если оценка параметра несмещенная, а её дисперсия при n ‒›∞ стремится к нулю, то она является состоятельной. 11
Эффективность Оценка параметра является эффективной, если она имеет наименьшую дисперсию среди всех несмещенных оценок этого параметра, вычисленных по выборкам одного объема. Смысл: наиболее точная оценка, так как имеет наименьшую ошибку. 12
Методы нахождения оценок o Метод моментов (Пирсон) – выборочные моменты приравниваются к соответствующим теоретическим моментам распределения; o Метод максимального правдоподобия (Фишер) – оценивается плотность вероятности совместного появления результатов выборки - функция правдоподобия; o Метод наименьших квадратов (Гаусс) – оценка определяется из условия, что сумма квадратов отклонений выборочных данных от определяемой оценки минимальна. 13
Примеры оценок параметров o Частость является оценкой вероятности события. o Выборочная средняя несмещенная, состоятельная оценка матожидания нормально распределенной случайной величины; o Выборочная дисперсия смещенная, состоятельная оценка дисперсии нормально распределенной случайной величины. 14
Обозначения параметров В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей (обозначается р), средняя величина изучаемого варьирующего признака - генеральной средней (обозначается ), генеральная дисперсия – это σ². В выборочной совокупности долю изучаемого признака называют выборочной долей, или частостью (обозначается ω), а среднюю величину в выборке - выборочной средней (обозначается ), выборочная дисперсия обозначается s². 15
ФОРМУЛЫ РАСЧЕТА ПАРАМЕТРОВ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ 16
ФОРМУЛЫ РАСЧЕТА ПАРАМЕТРОВ ВЫБОРОЧНОЙ СОВОКУПНОСТИ 17
Виды отбора Индивидуальный отбор (простая, механическая, типическая (стратифицированная) выборки) - за один прием отбирается одна единица, а число приемов повторяется столько раз, сколько нужно отобрать единиц наблюдения из совокупности или из группы. Групповой отбор (серийная выборка), при котором за один прием отбирается несколько единиц (группа или серия). Комбинированный отбор - индивидуальный отбор сочетается с групповым. 18
Схемы отбора Бесповторная или безвозвратная схема отбора (невозвращенного шара) - каждая отобранная единица или серия не возвращается в совокупность и не может дважды попасть в выборку. Дает более точные результаты, основная схема отбора при проведении маркетинговых обследований Повторная или возвратная схема отбора (возвращенного шара) - одна и та же отобранная единица может два и более раз попасть в выборку. 19
ошибки репрезентативности При проведении выборочного наблюдения неизбежны ошибки, которые характеризуют размер расхождения между параметрами выборочного наблюдения и параметрами генеральной совокупности, они называются ошибками репрезентативности (∆). Абсолютные (предельные) ошибки выборочного среднего и выборочной доли: Их величина зависит от степени вариации (s 2) изучаемого признака, численности выборки (n), метода отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования (ta). 20
Условиями правильного проведения выборочного наблюдения является правильно организованный отбор единиц совокупности, который заключается: а) в строго объективном отборе единиц совокупности, при котором каждая из них получала бы абсолютно одинаковую возможность попасть в выборку, то есть случайности отбора; б) в достаточном количестве отобранных единиц совокупности, то есть в обеспечении репрезентативности выборки, которая обеспечена, если 21
СВЯЗЬ ПРЕДЕЛЬНОЙ И СРЕДНЕЙ ОШИБОК ВЫБОРКИ РАСЧЕТ ВЕЛИЧИН СРЕДНИХ ОШИБОК ВЫБОРКИ ЗАВИСИТ ОТ ВИДА ВЫБОРКИ 22
Простая случайная выборка Посредством жеребьевки, таблиц случайных чисел или датчиков случайных чисел из генеральной совокупности отбирается нужный % данных на основе индивидуального отбора по повторной или бесповторной схеме отбора. На практике в этом случае чаще используется бесповторная схема отбора. 23
Механическая выборка В генеральной совокупности единицы наблюдения определенным образом расположены (по алфавиту, по последовательности возникновения во времени или в пространстве). Отбор единиц ведется через определенный шаг отчета, например, каждая 100 или каждая 1000. Шаг отчета определяется как отношение N/n. Применяется только бесповторный отбор. 24
Абсолютная ошибка генерального среднего при простой случайной повторной выборки При случайном повторном индивидуальном отборе ошибка выборочной средней рассчитывается по формулам: где μх - средняя ошибка выборочной средней; σ2 – дисперсия признака в генеральной совокупности; s ² - дисперсия признака в выборочной совокупности; n - численность выборки; t=НОРМСТОБР(1 -(а/2)) в первом случае и t=СТЬЮДРАСПРОБР(а; n- 1) во втором случае, 25 где а – уровень значимости.
Пример1: Простая случайная выборка При обследовании 50 покупателей магазина, отобранных случайным образом за рабочий день выяснили, что средняя стоимость их покупки составила 300 рублей, а среднее квадратическое отклонение составило 10 рублей. Оценить с вероятностью 95% среднюю стоимость покупки, если применялась повторная схема отбора. n=50 чел. ; x=300 руб. ; s²=100; t=СТЬДРАСПРОБР(0, 05; 49)=2, 0095 ∆x=2, 0095√(100/49)=2, 87. Средняя стоимость покупки в магазине с вероятностью 95% находится в интервале от 300 -2, 87 до 300+2, 87 рубля. Проверим репрезентативность выборки: (2, 87/300)100%=1%<5%, выборка репрезентативна. 26
Предельная (абсолютная) ошибка генерального среднего при простой случайной бесповторной и механической выборок При случайном бесповторном индивидуальном отборе ошибка выборочной средней для механической и простой случайной выборки рассчитывается по формулам: 27
Пример2: Механическая выборка При обследовании каждого 20 -го покупателя магазина за рабочий день выяснили, что средняя стоимость покупки составила 300 рублей, а среднее квадратическое отклонение составило 10 рублей. Оценить с вероятностью 95% среднюю стоимость покупки, если в магазин всего пришло 1000 человек. n=50 чел. ; x=300 руб. ; s²=100; t=2, 0095 ∆x=2, 0095√((100/49)(1 -50/1000))=2, 8. Средняя стоимость покупки в магазине с вероятностью 95% находится в интервале от 300 -2, 8 до 300+2, 8 рубля. Проверим репрезентативность выборки: (2, 8/300)100%=0, 93%<5%, выборка более репрезентативна, чем при повторном отборе. 28
При случайном бесповторном индивидуальном отборе ошибка выборочной доли для механической и простой случайной выборки рассчитывается по формуле: При случайном повторном индивидуальном отборе ошибка выборочной доли для простой случайной выборки рассчитывается по формуле: где μp - средняя ошибка выборочной доли; w(1 -w) – дисперсия доли в выборочной совокупности; n - численность выборки, N-объем генеральной совокупности t-квантиль нормального распределения, задающий вероятность, с которой предсказывается генеральное среднее. 29
Пример3: Простая выборка При обследовании 1000 покупателей магазина за неделю выяснили, что доля покупателей продукции фирмы Sony составила 30%. Оценить с вероятностью 99, 7% долю покупателей этой фирмы, если в магазин всего пришло 10000 человек и использовалась повторная схема отбора. n=1000 чел. ; w=0, 3; w(1 -w)=0, 21; t=2, 975 ∆р=2, 975√(0, 21/999)=0, 043. Доля покупателей фирмы Sony в магазине с вероятностью 99, 7% находится в интервале от 0, 30 -0, 043 до 0, 3+0, 043. Проверим репрезентативность выборки: (4, 3%/30%)100%=14, 3%>5%, выборка нерепрезентативна. 30
Пример4: Механическая выборка При обследовании каждого 10 -го покупателя магазина за неделю выяснили, что доля покупателей продукции фирмы Sony составила 30%. Оценить с вероятностью 99, 7% долю покупателей этой фирмы, если в магазин всего пришло 10000 человек и схема отбора бесповторная. n=1000 чел. ; w=0, 3; w(1 -w)=0, 21; t=2, 975 ∆р=2, 975√((0, 21/999)(1 -1000/10000))=0, 04. Доля покупателей фирмы Sony в магазине с вероятностью 99, 7% находится в интервале от 0, 30 -0, 04 до 0, 3+0, 04. Проверим репрезентативность выборки: (4%/30%)100%=13%>5%, выборка нерепрезентативна. 31
ОПРЕДЕЛЕНИЕ ЧИСЛЕННОСТИ ВЫБОРКИ (ОПРОСА) n для простой случайной повторной выборки 32
Пример 5 Найдем объем выборки, которая будет репрезентативной для примера 3. Ошибка должна составлять 5% от 30%, то есть ∆р=0, 3*0, 05=0, 015 или 1, 5%. Тогда n=(2, 975² *0, 21)/(0, 015²)=8233 чел. , то есть одной неделей обследования не обойтись. 33
ОПРЕДЕЛЕНИЕ ЧИСЛЕННОСТИ ВЫБОРКИ (ОПРОСА) n для механической и простой случайной бесповторной выборки 34
Пример 6 В университете учится 10 тысяч студентов. Сколько студентов университета нужно обследовать в порядке механической выборки для определения среднего уровня каждодневных затрат, чтобы с вероятностью 95, 4% гарантировать ошибку 50 рублей, если максимальные затраты не могут превышать 1500 рублей, а минимальные 200 рублей. Оценим S² как (R/6)², так как 6 s≈R покрывают 99, 7% случаев по правилу 3 -х сигм. Тогда S²=(1300/6)²=46944; t=НОРМСТОБР(1 -0, 05/2)=1, 96 n=(1, 96²*46944*10000)/(50²*10000+1, 96²*46944)=72 человека. 35
ТИПИЧЕСКАЯ ВЫБОРКА Неоднородная генеральная совокупность подразделяется на однородные в отношении исследуемых признаков группы. По каждой группе определяется её объем Ni и выбирается объем выборки ni. ni может быть определен: o пропорциональным методом ni=n. Ni/N o оптимальным методом ni=n. Niσi/∑Niσi Далее из групп отбирается нужное число наблюдений как при простой случайной выборке. Данная выборка дает самую маленькую ошибку репрезентативности. Чем больше влияет группировочный признак на исследуемый признак, тем меньше ошибка репрезентативности (по теореме о сложении дисперсий) 36
Средняя из групповых дисперсий Для расчета ошибок в типической выборке при пропорциональном разбиении используется средняя из групповых дисперсий 37
Предельная (абсолютная) ошибка типической выборки пропорциональном методе При повторном и бесповторном индивидуальном отборе ошибка выборочной средней типической выборки рассчитывается по формуле: где μх - средняя ошибка выборочной средней; sˉ ² - средняя из групповых дисперсий признака в выборочной совокупности; 38
Пример7: Типическая выборка Группа населения Объем выборки, Средний доход, Групповая ni, тыс. чел. тыс. руб. выборочная дисперсия, si² Моложе трудоспособного 1 5 0, 2 возраста Трудоспособные 6 10 0, 5 Пенсионеры 3 0, 1 Итого 10 (5*1+10*6+3*3 (0, 2*1+0, 5*6+ )/10=7, 4 0, 1*3)/10=0, 35 Для определения среднего дохода населения города проведена 1% бесповторная выборка с отбором единиц пропорционально численности групп. Результаты представлены в таблице. Абсолютная ошибка выборки ∆х=2√(0, 35/9999)(1 - 10/100)=0, 0012 С вероятность 95% средний доход населения находится в пределах 7, 9388 - 7, 4012 тыс. руб. Относительная ошибка выборки 0, 0012*100%/7, 4=0, 016%. 39 Выборка репрезентативна.
При повторном и бесповторном индивидуальном отборе ошибка выборочной доли типической выборки пропорциональном методе рассчитывается по формулам: где μр - средняя ошибка выборочной доли; w(1 -w) - средняя из групповых дисперсий доли в выборочной совокупности; n - численность выборки; N-объем генеральной совокупности 40
ОПРЕДЕЛЕНИЕ ЧИСЛЕННОСТИ ВЫБОРКИ (ОПРОСА) n для типической повторной выборки пропорциональном методе 41
ОПРЕДЕЛЕНИЕ ЧИСЛЕННОСТИ ВЫБОРКИ (ОПРОСА) n для типической бесповторной выборки пропорциональном методе 42
Оптимальный метод разбиения Ошибка Повторная схема Бесповторная схема типическойвы отбора борки для выборочной средней для выборочной доли 43
СЕРИЙНАЯ ВЫБОРКА Применяется групповой отбор, а внутри отобранных m групп производится сплошное наблюдение. Серии (группы) состоят из единиц, связанных между собой территориально, организационно, во времени. Серии бывают равновеликие и неравновеликие. Вся генеральная совокупность состоит из М серий. Ошибка серийной выборки больше, чем при организации любой другой выборке. Используется для расчета ошибок межгрупповая (межсерийная дисперсия) δ² 44
Межгрупповая (межсерийная) выборочная дисперсия для равных m серий 45
Равновеликие серии Ошибка Повторная схема Бесповторная серийной отбора схема отбора выборки для выборочной средней для выборочной доли 46
Межгрупповая (межсерийная) выборочная дисперсия для неравных серий 47
Пример 8 Серийная выборка При контроле качества апельсинов проведена 10% серийная выборка. Из партии, содержащей 50 ящиков, отобрано по бесповторной схеме 5 ящиков. Результаты их обследования представлены в таблице: № ящика 1 2 3 4 5 Удельный вес брака, % 1, 2 1, 8 2, 0 1, 5 48
Пример 8 Установим с вероятностью 95% доверительный интервал бракованной продукции во всех 50 ящиков. w=(1, 2+1, 8+2+1+1, 5)/5=1, 5% δ²=((0, 012 -0, 015)²+(0, 018 -0, 015)²+(0, 02 -0, 015)²+(0, 01 - 0, 015)²+(0, 015 -0, 015)²)/5=0, 0000136 ∆p=2, 63√((0, 0000136/5)(1 -5/50))=0, 004 или 0, 4%; Репрезентативность: 100%0, 004/0, 015=27%>5% Итак, доля бракованных апельсинов находится в интервале 1, 5%± 0, 4% с вероятностью 95% 49
Комбинированная выборка основана на комбинированном отборе, то есть отобрав случайным образом серии, внутри их проводят также случайную выборку наблюдений. Схема отбора может быть повторной и бесповторной как на стадии отбора групп, так и на стадии отбора наблюдений внутри групп. 50
Абсолютная ошибка комбинированной выборки При повторной схеме отбора При бесповторной схеме отбора 51
Многоступенчатая выборка предполагает извлечение из генеральной совокупности последовательности уменьшающихся по объему групп единиц, пока не будут отобраны те группы или единицы, которые непосредственно будут обследованы. Абсолютная ошибка многоступенчатой выборки: 52
Малая выборка В практике статистического исследования используются малые выборки. Объем малой выборки обычно не превышает 30 единиц и может доходить до 4 -5 единиц. Абсолютная ошибка малой выборки µм. в. вычисляется по формуле: где s² м. в - дисперсия малой выборки 53
Поскольку при проведении малой выборки в качестве доверительной вероятности практически применяется значение 0, 95 или 0, 99, то для определения предельной ошибки выборки используются следующие значения t- критерия Стьюдента : n 0, 95 0, 99 4 3, 183 5, 841 5 2, 777 4, 604 6 5, 571 4, 032 7 2, 447 3, 707 8 2, 364 3, 500 9 2, 307 3, 356 10 2, 263 3, 250 15 2, 199 2, 921 54
Тема5. Выборочный метод.ppt
- Количество слайдов: 54

