Тема5.Выборочное наблюдение.ppt
- Количество слайдов: 40
ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ (статистические основы маркетингового исследования) 1
Выборочное наблюдение научно обоснованный способ несплошного наблюдения, при котором обследуется не вся совокупность, а лишь ее часть, отобранная по определенным правилам выборки и обеспечивающая получение данных, характеризующих всю совокупность в целом, то есть обеспечивающих репрезентативность выборки. 2
Базовые понятия Подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью, её объем обозначается N. Отобранная из генеральной совокупности часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или просто выборкой, её объем обозначается n. 3
Базовые понятия В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей (обозначается р), а средняя величина изучаемого варьирующего признака генеральной средней (обозначается ), генеральная дисперсия σ². В выборочной совокупности долю изучаемого признака называют выборочной долей, или частостью (обозначается ω), а среднюю величину в выборке - выборочной средней (обозначается ), выборочная дисперсия s². 4
Виды и схемы отбора: Индивидуальный отбор (простая, механическая, типическая (стратифицированная) выборки) - за один прием отбирается одна единица, а число приемов повторяется столько раз, сколько нужно отобрать единиц наблюдения из совокупности или из группы. Групповой отбор (серийная выборка), при котором за один прием отбирается несколько единиц (группа или серия). Комбинированный отбор - индивидуальный отбор сочетается с групповым. Бесповторная или безвозвратная схема отбора (невозвращенного шара) - каждая отобранная единица или серия не возвращается в совокупность и не может дважды попасть в выборку. Дает более точные результаты, основной при проведении маркетинговых обследований Повторная или возвратная схема отбора (возвращенного шара) - одна и та же отобранная единица может два и более раз попасть в выборку. 5
ошибки репрезентативности При проведении выборочного наблюдения неизбежны ошибки, которые характеризуют размер расхождения между параметрами выборочного наблюдения и параметрами генеральной совокупности, они называются ошибками репрезентативности (∆). Они зависят от степени вариации изучаемого признака, численности выборки, метода отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования. Абсолютные (предельные) ошибки выборочного среднего и выборочной доли: 6
Условиями правильного проведения выборочного наблюдения является правильно организованный отбор единиц совокупности, который заключается: а) в строго объективном отборе единиц совокупности, при котором каждая из них получала бы абсолютно одинаковую возможность попасть в выборку, то есть случайности отбора; б) в достаточном количестве отобранных единиц совокупности, то есть в обеспечении репрезентативности выборки, которая обеспечена, если 7
СВЯЗЬ ПРЕДЕЛЬНОЙ И СРЕДНЕЙ ОШИБОК ВЫБОРКИ РАСЧЕТ ВЕЛИЧИНЫ СРЕДНИХ ОШИБОК ВЫБОРКИ ЗАВИСИТ ОТ ВИДА ВЫБОРКИ 8
Простая случайная выборка Посредством жеребьевки, таблиц случайных чисел или датчиков случайных чисел из генеральной совокупности отбирается нужный % данных на основе индивидуального отбора по повторной или бесповторной схеме отбора. На практике в этом случае чаще используется бесповторная схема отбора. 9
Механическая выборка В генеральной совокупности единицы наблюдения определенным образом расположены (по алфавиту, по последовательности возникновения во времени или в пространстве). Отбор единиц ведется через определенный шаг отчета, например, каждая 100 или каждая 1000. Шаг отчета определяется как отношение N/n. Применяется только бесповторный отбор. 10
Абсолютная ошибка простой случайной повторной выборки При случайном повторном индивидуальном отборе ошибка выборочной средней рассчитывается по формуле: где μх - средняя ошибка выборочной средней; s ² - дисперсия признака в выборочной совокупности; n - численность выборки t-квантиль нормального распределения, задающий вероятность, с которой предсказывается генеральное среднее. 11
Пример1: Простая случайная выборка При обследовании 50 покупателей магазина, отобранных случайным образом за рабочий день выяснили, что средняя стоимость их покупки составила 300 рублей, а среднее квадратическое отклонение составило 10 рублей. Оценить с вероятностью 95% среднюю стоимость покупки, если применялась повторная схема отбора. n=50 чел. ; x=300 руб. ; s²=100; t=1, 96 ∆x=1, 96√(100/50)=2, 78. Средняя стоимость покупки в магазине с вероятностью 95% находится в интервале от 300 -2, 78 до 300+2, 78 рубля. Проверим репрезентативность выборки: (2, 78/300)100%=0, 93%<5%, выборка репрезентативна. 12
Предельная (абсолютная) ошибка простой случайной бесповторной и механической выборок При случайном бесповторном индивидуальном отборе ошибка выборочной средней для механической и простой случайной выборки рассчитывается по формуле: где μх - средняя ошибка выборочной средней; s ² - дисперсия признака в выборочной совокупности; n - численность выборки, N-объем генеральной совокупности t-квантиль нормального распределения, задающий вероятность, с которой предсказывается генеральное среднее. 13
Пример2: Механическая выборка При обследовании каждого 20 -го покупателя магазина за рабочий день выяснили, что средняя стоимость покупки составила 300 рублей, а среднее квадратическое отклонение составило 10 рублей. Оценить с вероятностью 95% среднюю стоимость покупки, если в магазин всего пришло 1000 человек. n=50 чел. ; x=300 руб. ; s²=100; t=1, 96 ∆x=1, 96√((100/50)(1 -50/1000))=2, 7. Средняя стоимость покупки в магазине с вероятностью 95% находится в интервале от 300 -2, 7 до 300+2, 7 рубля. Проверим репрезентативность выборки: (2, 7/300)100%=0, 9%<5%, выборка более репрезентативна, чем при повторном отборе. 14
При случайном бесповторном индивидуальном отборе ошибка выборочной доли для механической и простой случайной выборки рассчитывается по формуле: При случайном повторном индивидуальном отборе ошибка выборочной доли для простой случайной выборки рассчитывается по формуле: где μp - средняя ошибка выборочной доли; w(1 -w) – дисперсия доли в выборочной совокупности; n - численность выборки, N-объем генеральной совокупности t-квантиль нормального распределения, задающий вероятность, с которой предсказывается генеральное среднее. 15
Пример3: Простая выборка При обследовании 1000 покупателей магазина за неделю выяснили, что доля покупателей продукции фирмы Sony составила 30%. Оценить с вероятностью 99, 7% долю покупателей этой фирмы, если в магазин всего пришло 10000 человек и использовалась повторная схема отбора. n=1000 чел. ; w=0, 3; w(1 -w)=0, 21; t=2, 97 ∆р=2, 97√(0, 21/1000)=0, 043. Доля покупателей фирмы Sony в магазине с вероятностью 99, 7% находится в интервале от 0, 300, 043 до 0, 3+0, 043. Проверим репрезентативность выборки: (4, 3%/30%)100%=14, 3%>5%, выборка нерепрезентативна. 16
Пример4: Механическая выборка При обследовании каждого 10 -го покупателя магазина за неделю выяснили, что доля покупателей продукции фирмы Sony составила 30%. Оценить с вероятностью 99, 7% долю покупателей этой фирмы, если в магазин всего пришло 10000 человек и схема отбора бесповторная. n=1000 чел. ; w=0, 3; w(1 -w)=0, 21; t=2, 97 ∆р=2, 97√((0, 21/1000)(1 -1000/10000))=0, 04. Доля покупателей фирмы Sony в магазине с вероятностью 99, 7% находится в интервале от 0, 300, 04 до 0, 3+0, 04. Проверим репрезентативность выборки: (4%/30%)100%=13%>5%, выборка нерепрезентативна. 17
ОПРЕДЕЛЕНИЕ ЧИСЛЕННОСТИ ВЫБОРКИ (ОПРОСА) n для простой случайной повторной выборки 18
Пример 5 Найдем объем выборки, которая будет репрезентативной для примера 3. Ошибка должна составлять 5% от 30%, то есть ∆р=0, 3*0, 05=0, 015 или 1, 5%. Тогда n=(2, 97² *0, 21)/(0, 015²)=8233 чел. , то есть одной неделей обследования не обойтись. 19
ОПРЕДЕЛЕНИЕ ЧИСЛЕННОСТИ ВЫБОРКИ (ОПРОСА) n для механической и простой случайной бесповторной выборки 20
Пример 6 В университете учится 10 тысяч студентов. Сколько студентов университета нужно обследовать в порядке механической выборки для определения среднего уровня каждодневных затрат, чтобы с вероятностью 95, 4% гарантировать ошибку 50 рублей, если максимальные затраты не могут превышать 1500 рублей, а минимальные 200 рублей. Оценим S² как (R/6)², так как 6 s≈R покрывают 99, 7% случаев по правилу 3 -х сигм. Тогда S²=(1300/6)²=46944. n=(1, 96²*46944*10000)/(50²*10000+1, 96²*46944)=72 человека. 21
ТИПИЧЕСКАЯ ВЫБОРКА • • Неоднородная генеральная совокупность подразделяется на однородные в отношении исследуемых признаков группы. По каждой группе определяется её объем Ni и выбирается объем выборки ni. ni может быть определен: пропорциональным методом ni=n. Ni/N оптимальным методом ni=n. Niσi/∑Niσi Далее из групп отбирается нужное число наблюдений как при простой случайной выборке. Данная выборка дает самую маленькую ошибку репрезентативности. Чем больше влияет группировочный признак на исследуемый признак, тем меньше ошибка репрезентативности (по теореме о сложении дисперсий) 22
Средняя из групповых дисперсий Для расчета ошибок в типической выборке при пропорциональном разбиении используется средняя из групповых дисперсий 23
Предельная (абсолютная) ошибка типической выборки пропорциональном методе При повторном и бесповторном индивидуальном отборе ошибка выборочной средней типической выборки рассчитывается по формуле: где μх - средняя ошибка выборочной средней; sˉ ² - средняя из групповых дисперсий признака в выборочной совокупности; n - численность выборки; N-объем генеральной совокупности, t-квантиль нормального распределения, задающий вероятность, с которой предсказывается генеральное среднее. 24
Пример7: Типическая выборка Группа населения Объем выборки, ni, тыс. чел. Средний доход, тыс. руб Групповая выборочная дисперсия, si² Моложе трудоспособного возраста 1 5 0, 2 Трудоспособные 6 10 0, 5 Пенсионеры 3 3 0, 1 Итого 10 (5*1+10*6+3*3 )/10=7, 4 (0, 2*1+0, 5*6+ 0, 1*3)/10=0, 35 Для определения среднего дохода населения города проведена 1% бесповторная выборка с отбором единиц пропорционально численности групп. Результаты представлены в таблице. Абсолютная ошибка выборки ∆х=1, 96√(0, 35/10)(1 -10/1000)=0, 36 С вероятность 95% средний доход населения находится в пределах 7, 04 7, 76 тыс. руб. Относительная ошибка выборки 0, 36*100%/7, 4=4, 8%. 25 Выборка репрезентативна.
При повторном и бесповторном индивидуальном отборе ошибка выборочной доли типической выборки пропорциональном методе рассчитывается по формуле: где μр - средняя ошибка выборочной доли; w(1 -w) - средняя из групповых дисперсий доли в выборочной совокупности; n - численность выборки; N-объем генеральной совокупности, t-квантиль нормального распределения, задающий вероятность, с которой предсказывается генеральное среднее. 26
ОПРЕДЕЛЕНИЕ ЧИСЛЕННОСТИ ВЫБОРКИ (ОПРОСА) n для типической повторной выборки пропорциональном методе 27
ОПРЕДЕЛЕНИЕ ЧИСЛЕННОСТИ ВЫБОРКИ (ОПРОСА) n для типической бесповторной выборки пропорциональном методе 28
Оптимальный метод разбиения Ошибка типическойв ыборки для выборочной средней для выборочной доли Повторная схема отбора Бесповторная схема отбора 29
СЕРИЙНАЯ ВЫБОРКА Применяется групповой отбор, а внутри отобранных m групп производится сплошное наблюдение. Серии (группы) состоят из единиц, связанных между собой территориально, организационно, во времени. Серии бывают равновеликие и неравновеликие. Вся генеральная совокупность состоит из М серий. Ошибка серийной выборки больше, чем при организации любой другой выборке. Используется для расчета ошибок межгрупповая (межсерийная дисперсия) δ² 30
Межгрупповая (межсерийная) выборочная дисперсия для равных m серий 31
Равновеликие серии Ошибка серийной выборки для выборочной средней для выборочной доли Повторная схема отбора Бесповторная схема отбора 32
Межгрупповая (межсерийная) выборочная дисперсия для неравных серий 33
Пример 8 Серийная выборка При контроле качества апельсинов проведена 10% серийная выборка. Из партии, содержащей 50 ящиков, отобрано по бесповторной схеме 5 ящиков. Результаты их обследования представлены в таблице: № ящика 1 2 3 4 5 Удельный вес брака, % 1, 2 1, 8 2, 0 1, 5 34
Пример 8 Установим с вероятностью 95% доверительный интервал бракованной продукции во всех 50 ящиков. w=(1, 2+1, 8+2+1+1, 5)/5=1, 5% δ²=((0, 012 -0, 015)²+(0, 018 -0, 015)²+(0, 02 -0, 015)²+(0, 015 -0, 015)²)/5=0, 0000136 ∆p=1, 96√((0, 0000136/5)(1 -5/50))=0, 003 или 0, 3%; Репрезентативность: 100%0, 003/0, 015=20%>5% Итак, доля бракованных апельсинов находится в интервале 1, 5%± 0, 3% с вероятностью 95% 35
Комбинированная выборка основана на комбинированном отборе, то есть отобрав случайным образом серии, внутри их проводят также случайную выборку наблюдений. Схема отбора может быть повторной и бесповторной как на стадии отбора групп, так и на стадии отбора наблюдений внутри групп. 36
Абсолютная ошибка комбинированной выборки При повторной схеме отбора При бесповторной схеме отбора 37
Многоступенчатая выборка предполагает извлечение из генеральной совокупности последовательности уменьшающихся по объему групп единиц, пока не будут отобраны те группы или единицы, которые непосредственно будут обследованы. Абсолютная ошибка многоступенчатой выборки: 38
Малая выборка В практике статистического исследования используются малые выборки. Объем малой выборки обычно не превышает 30 единиц и может доходить до 4 -5 единиц. Абсолютная ошибка малой выборки µм. в. вычисляется по формуле: где s² м. в - дисперсия малой выборки tct –статистика Стьюдента 39
Поскольку при проведении малой выборки в качестве доверительной вероятности практически применяется значение 0, 95 или 0, 99, то для определения предельной ошибки выборки используются следующие значения t-критерия Стьюдента : n 0, 95 0, 99 4 3, 183 5, 841 5 2, 777 4, 604 6 5, 571 4, 032 7 2, 447 3, 707 8 2, 364 3, 500 9 2, 307 3, 356 10 2, 263 3, 250 15 2, 199 2, 921 40
Тема5.Выборочное наблюдение.ppt