Мет10 Генеральная совокупность и выборка.ppt
- Количество слайдов: 23
ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА. СПОСОБЫ ФОРМИРОВАНИЯ ВЫБОРКИ Методология исследований Презентация 10 Мет 10
Исследования сплошные и выборочные Что такое сплошные и выборочные исследования? Понятие о генеральной совокупности Все субъекты, подходящие для проведения исследования Самая большая генеральная совокупность – все человечество Методы аналитической статистики при исследовании генеральной совокупности не применяются Понятие выборки Andrew Rodionov, MD, MPH Sampling procedure 2
Генеральная совокупность и выборка Andrew Rodionov, MD, MPH Sampling procedure 3
Допущение Результаты, полученные на выборке можно распространить на всю генеральную совокупность (с известным допущением, выражаемым через вероятности ά- и β-ошибок) Andrew Rodionov, MD, MPH Sampling procedure 4
Почему исследователи любят выборочные исследования Меньше работы Меньше денег Меньше времени Меньше головной боли (? ) Andrew Rodionov, MD, MPH Sampling procedure 5
Оптимальный размер выборки В интересах исследователя В интересах реально существующей ситуации в генеральной совокупности Этический дуализм Andrew Rodionov, MD, MPH Sampling procedure 6
Вопросы, предваряющие процедуру выборки Как сделать репрезентативную выборку? или Как избежать ошибки отбора selection bias и Насколько я готов ошибиться исходя из того, что обследована будет не генеральная совокупность а выборка из нее? Andrew Rodionov, MD, MPH Sampling procedure 7
Способы формирования выборки. Понятие о рандомизации Выборки не основанные на вероятностях non-probability samples Выборки вероятностные probability samples Рандомизация randomization Andrew Rodionov, MD, MPH Sampling procedure 8
Выборки Нерепрезентативные Репрезентативные Основанные на вероятностях рандомизированные ик тод е ь м Не основанные на ст ате каз Рандомизированные До случайные о ьн л вероятностях Рандомизорованные сбалансированные Andrew Rodionov, MD, MPH Sampling procedure 9
Виды выборки не основанной на вероятностях Захватывающая выборка grab sample Удобная выборка sample of convenience Систематическая выборка systematic sample Andrew Rodionov, MD, MPH Sampling procedure 10
Захватывающая выборка (grab sample) – синоним выборка удобства (sample of convenience) Этот термин объединяет процедуру выборки и выборку, сформированную на ее основе, легкую для осуществления, но основанную на не-вероятностных методах. Опросы-людей-на-улицах и измерение артериального давления всем желающим на улицах в День Здоровья. Крайне плохо, а, чаще, совсем не генерализуются. Причем невозможно предсказать, какие типы систематических ошибок могут возникнуть Andrew Rodionov, MD, MPH Sampling procedure 11
Систематическая выборка (systematic sample) Процедура отбора, в соответствии с некоторым простым систематическим правилом, таким как первая буква фамилии или имени, рожденные в определенный день или занимающие определенные положения в списке Может привести к неучтенной систематической ошибке, что ограничивает генерализуемость Andrew Rodionov, MD, MPH Sampling procedure 12
Виды вероятностной выборки Простая случайная simple random sample Кластерная выборка cluster sample Стратифицированная выборка stratified sample Зонная выборка zone sample Многоэтапная выборка multilevel sample Andrew Rodionov, MD, MPH Sampling procedure 13
2057 6435 3278 7888 4022 0888 0605 4398 7899 5375 1120 4625 5112 3915 9223 0122 4114 0774 1493 5727 5329 7058 0099 0762 2646 0500 6411 6540 3504 4640 8857 2623 2213 5436 5978 4318 9380 5629 0820 2462 7788 3425 7577 2475 4886 2200 1429 0295 7573 1631 7804 2651 8692 0221 9965 8481 8921 5266 5003 3918 6982 2140 2820 5011 0114 8631 8555 2373 2369 8535 6177 7426 6981 5528 9051 7712 3844 7366 0919 6457 7521 3532 5957 4138 5291 0414 4971 4662 0759 8172 5937 8140 9029 2755 3188 1972 4690 5764 9832 1823 0486 2350 8361 8488 6430 3603 2901 8499 7197 0848 0802 5430 1376 9383 4865 9745 3458 3080 3275 0187 7707 4269 0022 3586 9839 7155 6489 6607 0480 4407 5914 8185 5896 7310 7106 9849 9902 6854 9203 5679 5041 6553 6247 7592 1650 3653 1727 3854 2940 0748 7103 1125 8745 9953 1426 3459 6778 5763 8004 4874 4867 Andrew Rodionov, MD, MPH 5023 3502 0521 6623 3047 4901 3860 1580 6641 0404 2660 3341 2557 3461 7545 2362 3985 3105 0046 1683 4244 2377 2598 2673 2108 1813 8907 5282 2580 5676 0453 3032 3500 8685 3262 5182 5513 9750 0405 2109 6917 0159 8602 2457 5206 procedure 0434 Sampling Простая случайная выборка Каждый индивидуум в генеральной совокупности имеет равные шансы быть отобранным Присвоение номеров каждому индивиду в выборочной рамке исследования и отбор с помощью таблицы случайных чисел Жребий Кубики Генератор случайных чисел Программа PEPI 2436 1133 3519 6751 0735 8784 9755 2428 7210 6269 9213 2399 4235 1106 6470 2902 6131 1185 0695 2304 9635 9134 384514
Кластерная выборка (cluster sample) – в качестве единицы отбора используется не индивидуум, а группа лиц Семья, дом, городской квартал Классы школы Цеха завода Дома микрорайона Andrew Rodionov, MD, MPH Sampling procedure 15
Стратифицированная выборка (stratified sample) Подразумевает разделение популяции на подгруппы в соответствии с некоторой важной характеристикой, такой как возраст или социоэкономический статус и отбор индивидуумов проводится отдельно из каждой страты Таким образом, распространенность данной характеристики выборки будет совпадать с таковой генеральной совокупности Выборка соответствует генеральной совокупности по структуре Andrew Rodionov, MD, MPH Sampling procedure 16
Зонная выборка (area sample) Метод выборки, который может быть использован, когда численность населения неизвестна Общая территория делится на подтерритории, подобно нанесению линий сетки на карту Подтерритории нумеруются и отбираются с использованием случайных чисел Далее в зависимости от обстоятельств может быть подсчитано население подтерриторий и сформирована выборочная рамка Andrew Rodionov, MD, MPH Sampling procedure 17
Многоэтапная выборка Первый этап – зонная Второй этап – кластерная Третий этап – стратифицированная по полу Andrew Rodionov, MD, MPH Sampling procedure 18
Понятие об ά- и β-ошибке Результаты тестирования нулевой гипо Нулевая гипотеза истинна да Результат проверки истинности нулевой гипотезы да нет Истиннопо β-ошибка ложительн ые ά-ошибка Истинноот рицательн 19 ые Andrew Rodionov, MD, MPH Sampling procedure
Понятие об ά- и β-ошибке Результаты тестирования нулевой гипо ά-ошибка – ошибка найти различия, при условии, что их нет на самом деле (нулевая гипотеза истинна) β-ошибка – ошибка не найти различия, которые в действительности имеются (нулевая гипотеза 20 Andrew Rodionov, MD, MPH Sampling procedure
ά- и β-ошибки в выборочном исследовании Вероятность ошибки – P value, величина p. Какую величину p мы можем допустить? pά <0. 05 pβ <0. 2 (0. 1) Что такое pά <0. 05 pβ <0. 2 0. 05 5% 1/20 0. 2 20% 1/5 Andrew Rodionov, MD, MPH Sampling procedure 21
Величина pά для выборки Величина p <0. 05 говорит о том, что я готов найти различия по какому-нибудь параметру менее чем в 5% выборок одинаковой численности, формируя их одну за другой случайным образом из генеральной совокупности, или что меньше чем одна выборка из двадцати не будет адекватно представлять по этому параметру генеральную совокупность или более чем 95% (более чем 19 из 20) всех таких 22 выборок будут адекватно представлять Andrew Rodionov, MD, MPH Sampling procedure
Общий вид Калязинского мужского Троицкого монастыря, около 1910 г. Восстановлено из слайдов С. А. Прокудина-Горского Библиотека Конгресса США Andrew Rodionov, MD, MPH Sampling procedure 23
Мет10 Генеральная совокупность и выборка.ppt