6 Выборочное наблюдение.ppt
- Количество слайдов: 32
Выборочное наблюдение
Понятие выборочного наблюдения Выборочное наблюдение - вид статического наблюдения наиболее часто применяемый для экономических исследований. Выборочное наблюдение вид статистического наблюдения, при котором обследованию подвергается не вся изучаемая совокупность , а лишь часть её единиц, отобранных по определенным правилам.
Понятие генеральной и выборочной совокупности Генеральная совокупность – это совокупность единиц, из которой производится отбор. o Выборочная совокупность – это совокупность единиц, отобранных из генеральной совокупности. N – объем генеральной совокупности; n - объем выборочной совокупности (число единиц попавших в выборку); - генеральная средняя (среднее значение признака в генеральной совокупности; - выборочная средняя (среднее значение признака в выборочной совокупности); p – генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности); w – выборочная доля (доля единиц, обладающих данным признаком в генеральной совокупности); - генеральная дисперсия (дисперсия признака в генеральной совокупности); - выборочная дисперсия (дисперсия признака в выборочной совокупности); - среднее квадратическое отклонение признака в генеральной совокупности; - среднее квадратическое отклонение признака в выборочной совокупности. o
Понятие ошибки наблюдения Вычисленные по материалам выборочного наблюдения статистические показатели не будут точно совпадать с соответствующими характеристиками для всей совокупности. Величиной этих отклонений называется ошибка наблюдения, которая складывается из ошибки регистрации и ошибки репрезентативности.
Виды ошибок наблюдения o o Ошибки регистрации вызываются несовершенством измерительных приборов, неточностью подсчетов и др. Ошибки репрезентативности свойственны только несплошным наблюдениям. Ошибки репрезентативности характеризуют размер расхождения между величиной показателя, полученного в выборочной и генеральной совокупности в условиях одинаковой точности единичных наблюдений.
Виды ошибок репрезентативности Ошибки репрезентативности могут быть двух видов: o систематические ошибки возникают при нарушении установленных правил отбора единиц. o случайные ошибки возникают из-за недостаточно равномерного представления в выборочной совокупности различных категорий единиц генеральной совокупности. Величина случайной ошибки определяет надежность данных выборочного наблюдения, их пригодность для суждения о генеральной совокупности.
Предельная ошибка выборки o Величина называется предельной ошибкой выборки: ; ; - предельная (максимально возможная) ошибка средней; - предельная (максимально возможная) ошибка доли; - величина средней квадратической стандартной ошибки; t – коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки.
Предельная ошибка выборки В зависимости о принятой вероятности Р определяется значение коэффициента кратности (t) по удвоенной нормированной функции Лапласа. o. Величина средней ошибки в условиях большой выборки (n>30) по известным из теории вероятностей формулам: oпри случайной повторной выборке:
Простая случайная выборка При простой случайной выборке отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности в форме случайного отбора, при котором каждой единице генеральной совокупности обеспечивается одинаковая вероятность (возможность) быть выбранной. Случайный отбор может быть проведен в двух формах: o возвратная повторная выборка; o безвозвратная (бесповторная) выборка.
Предельная ошибка выборки Величина называется предельной ошибкой выборки: ; ; средней; - предельная (максимально возможная) ошибка доли; - величина средней квадратической стандартной ошибки; t - коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки.
Определение значения коэффициента кратности (t) В зависимости о принятой вероятности Р определяется значение коэффициента кратности (t) по удвоенной нормированной функции Лапласа. Величина средней ошибки в условиях большой выборки (n>30) по известным из теории вероятностей формулам: o при случайной повторной выборке: = ; o при случайной бесповторной выборке: = ; .
Расчет ошибок при большой выборке При расчете ошибок возникает затруднение потому, что величины и по генеральной совокупности неизвестны. Эти величины в условиях большой выборки заменяют величинами S (выборочная доля)и w (выборочная доля), рассчитанными по выборочной совокупности.
Таблица Способ отбора единиц повторный Средняя ошибка: для средней для доли Предельная ошибка : для средней для доли бесповторный
Использование формул предельной ошибки для решения задач трех видов: 1. Определение пределов генеральных характеристик с заданной степенью надежности (доверительной вероятностью) на основе показателей, полученных по данным выборки. Доверительные интервалы для генеральной средней – Доверительные интервалы для генеральной доли
Использование формул предельной ошибки для решения задач трех видов: 2. o Определение доверительной вероятности того, что генеральная характеристика может отличаться от выборочной не более чем на определенную заданную величину. Доверительная вероятность является функцией от t, определяемой по формуле По величине t определяется доверительная вероятность.
Использование формул предельной ошибки для решения задач трех видов: Определение необходимого объема выборки, который с практической вероятностью обеспечивает заданную точность выборки. Для расчета объема выборки необходимы следующие данные: o o o размер доверительной вероятности (P); коэффициент t, зависящий от принятой вероятности; величина генеральной вpq) совокупности; (или заменяются они величинами , полученными в предшествующих обследованиях или в при пробных выборках. величину максимально допустимой ошибки (или p); объем генеральной совокупности (N).
Формулы для определения численности простой случайной выборки Способ отбора единиц повторный бесповторный Численность выборки (n) для средней для доли 1 1 В случаях, когда частость w даже приблизительно неизвестна, в расчет вводят максимальную величину дисперсии доли, равную 0, 25 ( если w=0, 5, то w(1 - w)=0, 25
Необходимый объем выборки определяется на основе допустимой величины ошибки:
Расслоенная (типическая или районированная) выборка В составе генеральной совокупности с различным уровнем изучаемого признака желательно обеспечить более равномерное представительство в выборочной совокупности различных типов. Эта цель достигается применении расслоенной (типической или стратифицированной) выборки. При типической выборке неоднородная генеральная совокупность подразделяется на более однородные в отношении изучаемых признаков группы (типы, районы). По каждой группе определяется объем (Ni) и число подлежащих наблюдению единиц (ni). Отбор обследуемых единиц производится в каждой группе при помощи одного из способов случайного отбора – повторного или бесповторного.
Общее число единиц выборочной совокупности распределяется между группами пропорционально численности групп в составе генеральной совокупности. Такой отбор называется пропорциональным. Объем выборки для каждой группы определяется по формуле: ; где - удельный вес данной группы в генеральной совокупности; Общий объем выборки n=n 1+ n 2+…+ nk
Формулы для расчета ошибок типической выборки Способ отбора единиц повторный бесповторный Средняя ошибка ( ): для средней: при пропорциональном размещении единиц при оптимальном размещении единиц для доли: при пропорциональном размещении единиц при оптимальном размещении единиц
Серийная выборка заключается в том, что вместо случайного отбора единиц совокупности осуществляется отбор групп (серий). Внутри отобранных серий производится сплошное наблюдение. Отбор серий производится в порядке повторного или бесповторного отбора. Ошибка серийной выборки больше, чем при любом другом способе отбора. Серийный отбор широко используется на практике, что объясняется его организационными преимуществами.
Механическая выборка заключается в отборе единиц из генеральной совокупности через равные промежутки из определенного расположения их в генеральной совокупности (по алфавиту, в пространстве, последовательности появления по времени). При организации механического отбора определяют: o шаг отсчета – расстояние между отбираемыми единицами рассчитывается по формуле ; o выбор единицы, с которой начинают отчет производят путем случайного отбора из единиц первого интервала.
Механическая выборка Если в генеральной совокупности единицы располагаются случайным образом по отношению к изучаемому признаку, то механический отбор можно рассматривать как разновидность случайного бесповторного отбора, поэтому для оценки ошибки механической выборки применят формулы случайной бесповторной выборки: ;
Малые выборки Выборки, при которых наблюдением охватывается небольшое количество единиц (n<30) называют малыми выборками. o Предельная ошибка малой выборки определяется по формуле: Средняя ошибка малой выборки: ; где S 2 – дисперсия малой выборки - среднее значение признака по выборке; n-1 – число степеней свободы (n-1=k); t – коэффициент доверия малой выборки, зависящий не только от заданной доверительной вероятности, но и от численности единиц выборки
Расчет коэффициента доверия Вероятность того, что генеральная средняя находится в определенных границах, определяется по формуле ; где S(t) – значение функции Стъюдента. Для расчета коэффициента доверия t определяют значение функции S(t) по формуле S(t) =(P+1): 2. Затем по таблице распределения Стъюдента в зависимости от значения функции S(t) и числа степеней k(n-1) определяют значение t.
Метод моментных наблюдений применяется для получения структуры затрат рабочего времени, характеристики использования оборудования. Сущность метода состоит в периодической фиксации состояния наблюдаемых единиц в заранее установленные или случайно выбранные моменты времени. После окончания наблюдения рассчитывают долю отметок о каждом виде затрат времени в общем числе наблюдений. Доля времени, затраченного на данный вид работы, может быть оценена с помощью доли моментов, когда выполнялась эта работа, в общем числе наблюдений. Средняя ошибка доли определяется по формуле простой случайной выборки: , где w – доля отметок о данном состоянии процесса; n – количество моментов наблюдения.
Метод моментных наблюдений Предельная ошибка. Для определения численности моментов наблюдения используется формула: . Доверительная вероятность и величина допустимой ошибки устанавливаются исследователем. Как правило, величина w неизвестна, в этом случае ориентируются на наибольшую дисперсию, когда w=0, 5 [w(1 -w)=0, 25].
Дисперсионный анализ является методом изучения влияния одного или нескольких факторных признаков на результативный признак. В зависимости от количества факторов различают однофакторный и многофакторный анализ. В основе дисперсионного анализа лежит расчленение общей вариации изучаемого признака по источникам ее происхождения на два вида вариации: n систематическую вариацию, которая обусловлена изменением признака-фактора; n остаточную (случайную) вариацию, обусловленную действием прочих, случайных, не связанных с данным фактором обстоятельств. Для разграничения этих вариаций совокупность разбивают на группы по факторному признаку и исчисляют средние результативного признака по группам.
Дисперсионный анализ Групповые средние рассчитываются по формуле: , Общая средняя рассчитывается по формуле: , где - индивидуальные значения признака в группе; - число единиц, входящих в группу; n – общее число наблюдений
Дисперсионный анализ Если сравнение групповых средних показывает определенное различие в их уровне, то необходимо установить, является ли это различие существенным и вызвано ли оно влиянием признака-фактора. Рассчитывают два показателя дисперсии: - показатель вокруг общей средней (межгрупповая дисперсия); - показатель дисперсию. При сравнении показателей получают фактическое дисперсионное отношение: .
Дисперсионный анализ При проведении дисперсионного рассчитывают по формуле: анализа межгрупповую , дисперсию где ni – число единиц в группе; K 1=m-1 m – число групповых средних (число выделенных групп по признаку-фактору); Остаточную внутригрупповую дисперсию рассчитывают по формуле: = ; где K 2=n-m. По таблице F-распределения Р. Фишера при определенном уровне значимости (или доверительной вероятности) и числе степеней свободы (K 1 и K 2) определяется табличное дисперсионное отношение (Fтабл). Если Fрасч>Fтабл, то следует считать, что гипотеза о влиянии признакафактора не опровергается.
6 Выборочное наблюдение.ppt