5.Выборочное наблюдение.ppt
- Количество слайдов: 40
СТАТИСТИКА Выборочное наблюдение канд. физ. -мат. наук, доцент Ананьева Миляуша Сабитовна
Выборочное наблюдение 4 Выборочное наблюдение – вид несплошного обследования, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использованием специальных методов, а полученные в процессе обследования результаты с определенным уровнем вероятности распространяются на всю исходную совокупность.
Выборочное наблюдение 4 Преимущества выборочного наблюдения заключаются в экономии различного вида ресурсов: – финансовых, затрачиваемых на сбор и обработку данных, подготовку и оплату кадров; – материально-технических (канцелярские товары, оргтехника, расходные материалы, транспортное обслуживание и т. п. ); – трудовых, привлекаемых к обследованию на всех его этапах; – сокращении времени, затрачиваемого на получение первичной информации, на ее последующую обработку вплоть до публикации итоговых материалов.
Выборочное наблюдение 4 Назначение выборочного метода: – когда применение сплошного наблюдения невозможно из-за огромного массива данных или экономически нецелесообразно: • при изучении пассажиропотоков, рыночных цен, семейных бюджетов; • при оценке качества товаров, связанной с их уничтожением (дегустация, испытание кирпичей на прочность и т. п. – для проверки результатов сплошного.
Основные понятия 4 Весь массив статистических единиц – генеральная совокупность (ГС) • число единиц в ГС – N 4 Статистические единицы, отобранные для наблюдения – выборочная совокупность (выборка, ВС) • число единиц в выборке п 4 Отношение n/N называется относительным размером или долей выборки
Основные понятия 4 Качество результатов выборочного наблюдения зависит от репрезентативности выборки, • т. е. от того, насколько она представительна в ГС. 4 Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, • на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случайного.
Виды выборки 4 В зависимости от состава и структуры ГС подбирается вид выборки (способ отбора): » Собственно случайная (простая случайная) выборка – Механическая (систематическая) выборка – Типическая (стратифицированная, расслоенная) выборка – Серийная (гнездовая) выборка
Виды выборки Собственно случайный отбор: 4 Все единицы ГС нумеруются 4 Выполняется жеребьевка 4 Выпавшие номера соответствуют единицам, попавшим в выборку • количество выбранных номеров равно запланированному объему выборки • вместо жеребьевки используют генераторы случайных чисел 4 Виды случайного отбора: – повторный • каждая единица, отобранная в выборку, после наблюдения возвращается в ГС и может вновь обследоваться после очередного отбора • вероятность попадания в выборку для каждой единицы ГС одна и та же – бесповторный • обследованные единицы в ГС не возвращаются и не могут быть обследованы повторно • вероятность попадания в выборку для каждой последующей единицы ГС меняется (увеличивается, т. к. число единиц в совокупности становится меньше) • между оставшимися в ГС после очередного отбора единиц, вероятность попадания в выборку одинакова.
Виды выборки Собственно случайный отбор: 4 Для проведения отбора единиц в выборочную совокупность используется один из математических алгоритмов, например, метод прямой реализации: 1. Все единицы ГС, расположенные в случайном порядке или ранжированные по какому-либо признаку, нумеруются от 1 до N. 2. С помощью процессора случайных чисел получают n значений в интервале от 1 до N. Если первоначально случайные числа получены в интервале от 0 до 1, их необходимо умножить на N и округлить по правилам до целого значения. 3. Из сформированного списка единиц ГС отбираются единицы, соответствующие по номеру полученным случайным числам.
Виды выборки Собственно случайный отбор: 4 Упрощенный вариант метода прямой реализации – отбор единиц по таблице случайных чисел (Приложение). 4 Для проведения отбора могут быть использованы цифры любого столбца таблицы (необходимо учитывать объем ГС) – Пример. Объем ГС 70000 единиц. Требуется сформировать выборку объемом 500 единиц. – Тогда цифры таблицы перегруппировывают для получения пятизначных чисел следующим образом: 5489 5583 3156 0835 1988 3522 0935 7877 5665 7020 7555 7579 2550 2487 9477 5759 3554 5080 9074 7001 6303 6895 3371 3196 7231 – Для формирования выборки берут 500 чисел в интервале от 00001 до 70000, т. е. из списка единиц ГС отбирают единицы под номером 54895, 35220, 57593 и т. д. При этом номера свыше 70000 (75557, 93578 и т. п. ) будут проигнорированы
Виды выборки Собственно случайный отбор: 4 Упрощенный вариант метода прямой реализации – отбор единиц по таблице случайных чисел (Приложение). 4 Для проведения отбора могут быть использованы цифры любого столбца таблицы (необходимо учитывать объем ГС) – Пример. Объем ГС 70000 единиц. Требуется сформировать выборку объемом 500 единиц. – Тогда цифры таблицы перегруппировывают для получения пятизначных чисел следующим образом: 54895 35220 75557 57593 63036 58331 93578 57925 55450 89533 56083 77566 50248 80907 71319 51988 57020 79477 47001 67231 – Для формирования выборки берут 500 чисел в интервале от 00001 до 70000, т. е. из списка единиц ГС отбирают единицы с номерами 54895, 35220 и т. д. , не большими 70000 • Номера более 70000 (75557, 93578 и т. п. ) не рассматривают
Виды выборки 4 При проведении бесповторного отбора повторяющиеся номера следует учитывать только один раз. 4 При повторном отборе, если номер случайно встретится еще один или более раз, соответствующая этому номеру единица в каждом случае повторно включается в выборочную совокупность.
Виды выборки 4 Механический отбор: – отбираются единицы ГС с постоянным шагом N/п. • если ГС содержит 100 тыс. ед. , а требуется выбрать 1 тыс. ед. , то в выборку попадет каждая сотая единица (с номером 100) 4 Стратифицированный (расслоенный) отбор – осуществляется из неоднородной ГС, которую предварительно разбивают на однородные группы, – после чего отбирают единицы из каждой группы в ВС случайным или механическим способом пропорционально их численности в ГС. 4 Серийный (гнездовой) отбор: – случайным или механическим способом выбирают не отдельные единицы, а определенные серии (гнезда), внутри которых производится сплошное наблюдение.
Виды отбора (выборки) 4 Комбинированный отбор – объединение нескольких видов выборки • типическая и серийная, серийная и собственно-случайная • ошибка определяется ступенчатостью отбора. 4 Многоступенчатый называется отбор, при котором из ГС сначала извлекаются укрупненные группы, потом – более мелкие и так до тех пор, пока не будут отобраны обследуемые единицы. 4 Многофазный отбор, в отличие от многоступенчатой, предполагает сохранение одной и той же единицы отбора на всех этапах его проведения; при этом отобранные на каждой стадии единицы обследуются каждый раз –по более расширенной программе.
Этапы выборочного наблюдения 4 Процесс подготовки и проведения выборочного наблюдения включает ряд последовательных этапов: 1. Определение цели обследования. 2. Установление границ ГС. 3. Составление программы наблюдения и программы разработки данных. 4. Определение вида выборки, процента отбора и метода отбора. 5. Отбор необходимого числа единиц в выборку 6. Регистрация у отобранных единиц наблюдаемых признаков, предусмотренных программой наблюдения 7. Расчет выборочных характеристик и их ошибок. 8. Распространение полученных результатов на ГС.
Этапы выборочного наблюдения 4 Расчет обобщающих показателей: • средняя величина изучаемого признака • доля единиц, обладающих каким-либо значением этого признака 4 При необходимости следующий отбор (в соответствии с Программой наблюдения) 4 Новый аналогичный расчет: • обобщающие показатели нескольких выборок одной и той же ГС могут иметь разные значения, • обобщающие показатели выборки могут отличаться от реального их значения в ГС, если определить его с помощью сплошного наблюдения 4 и т. п.
Обобщающие показатели Показатель Число единиц совокупности ГС ВС N n р w= 1 p 1 w D г = 2 Dв Среднее значение (генеральная и выборочная) Доля единиц, обладающих каким-либо значением признака Доля единиц, не обладающих каким-либо значением признака Дисперсия
Ошибка выборки 4 Ошибка выборки – разность между значением обобщающих характеристик выборочной и генеральной совокупностей 4 Виды ошибок: – регистрации (систематические) • из-за неправильных или неточных сведений, невнимательности регистратора при заполнении анкет, формуляров и т. п. • легко обнаруживается и устраняется. – репрезентативности (случайные) • из-за несоблюдения принципа случайности отбора единиц в выборку • сложнее обнаружить и устранить
Средняя ошибка выборки 4 Ошибка выборки (отклонение выборочной средней от средней генеральной) 4 находится в прямой зависимости от дисперсии изучаемого признака в генеральной совокупности, 4 и в обратной зависимости – от объема выборки.
Ошибка выборки 4 При выборочном наблюдении дисперсия признака в ГС, как правило, не известна. 4 Связь между генеральной дисперсией и средней из всех возможных выборочных дисперсий:
Ошибка выборки 4 Ошибка выборки – разность между значением обобщающих характеристик выборочной и генеральной совокупностей 4 Виды изучаемых ошибок: • Средняя • Предельная
Средняя ошибка выборки 4 На практике в большинстве случаев из ГС в определенный момент времени производится только одна выборка, а при расчете ошибки используется дисперсия признака по этой выборке. 4 При достаточно большом объеме повторной выборки отношение n / n − 1 близко к 1, ее средняя ошибка
Средняя ошибка выборки 4 Для измерения ошибки выборки определяется ее средняя ошибка: • для повторного отбора: • для бесповторного отбора:
Предельная ошибка выборки 4 После отбора необходимо определить границы генеральных характеристик. 4 На основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. 4 Зная среднюю ошибку выборки, с определенной вероятностью можно оценить отклонение выборочной средней от генеральной и установить пределы, в которых находится изучаемый параметр (среднее значение) в ГС. 4 Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки . • определяется в долях средней ошибки с заданной вероятностью • =t , где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.
Предельная ошибка выборки 4 Предельная ошибка выборки зависит от величины ее средней ошибки и уровня вероятности, с которым гарантируется, что генеральная средняя не выйдет за указанные границы. 4 Теорема А. М. Ляпунова: – вероятность величины предельной ошибки при достаточно большом объеме ВС подчиняется нормальному закону распределения и может быть определена на основе интеграла Лапласа
Предельная ошибка выборки Р 0, 683 0, 950 0, 954 0, 997 t 1 1, 96 2 3 4 Наиболее часто используются значения t и соответствующие уровни вероятности Р: • Например, если при расчете предельной ошибки выборки t=2, то с вероятностью Р=0, 954 можно утверждать, что отклонение выборочной средней и генеральной средней не превысит двукратной величины средней ошибки выборки. • Вероятность P=0, 954 означает, что только в 46 случаях из 1000 ошибка может выйти за установленные границы. 4 Значения интеграла Лапласа (интегральной функции) при различных t находятся по справочным Приложениям.
Предельная ошибка выборки 4 Для определения границ генеральной доли (доли единиц, обладающих вариантом признака, применяется теорема: • Вероятность получения сколь угодно малого расхождения между выборочной долей и генеральной долей при достаточно большом объеме выборки будет стремиться к 1. 4 С учетом того, что вероятность расхождения между выборочной и генеральной долями подчиняется нормальному закону распределения, то она также определяется по интегральной функции Лапласа F(t) при заданном значении t.
Предельная ошибка выборки 4 После расчета предельной ошибки находят доверительный интервал обобщающей характеристики ГС совокупности: • для среднего значения • для доли единиц, обладающих каким-либо значением признака: 4 Таким образом, при выборочном наблюдении определяется не одно значение обобщающей характеристики ГС, а лишь ее доверительный интервал с заданным уровнем вероятности.
Ошибка выборки 4 Ошибка репрезентативности больше ошибки регистрации, а ее измерение – основная задача выборочного наблюдения. 4 Средняя ошибка меньше у бесповторной выборки, что способствует ее большему применению
Численность выборки 4 Разрабатывая программу выборочного наблюдения, задаются конкретным значением предельной ошибки и уровнем вероятности. 4 Неизвестной остается минимальная численность выборки, обеспечивающая заданную точность.
Численность выборки 4 Формула расчета численности выборки – Повторная выборка – Бесповторная выборка
Численность выборки 4 Результат всегда округляется в большую сторону • если получили необходимый объем выборки 493, 1 единицы, то обследовав 493 единицы не достигнут требуемой точности, поэтому должны быть охвачены 494 единицы. 4 Рассчитанное значение необходимого объема выборки может быть увеличено в большую сторону на несколько единиц. • если располагают необходимыми ресурсами, то можно охватить больший объем, включение в ВС 500 или 550 ед. только уменьшит значения полученных случайной и предельной ошибок. 4 Необходимый объем выборки будет тем больше, чем выше заданный уровень вероятности и чем сильнее варьирует наблюдаемый признак. 4 Повышение допустимой предельной ошибки выборки приводит к снижению необходимого ее объема. 4 Расчет необходимого объема выборки предполагает, что организаторы выборочного наблюдения уже на этапе его проектирования располагают по крайней мере косвенными данными о вариации изучаемых признаков. 4 Источники данных : – – – результаты исследования данного объекта в предшествующие периоды; результаты исследования аналогичных объектов (жителей других населенных пунктов, предприятий других регионов и т. п. ); специально проведенное небольшое по объему выборочное обследование данного объекта, ставящее целью лишь изучение вариации наблюдаемых признаков.
Численность выборки
Пример расчета
Пример расчета
Пример расчета
Пример расчета
Пример расчета
Пример расчета
Пример расчета
5.Выборочное наблюдение.ppt