NewStat 2 Описательная статистика.pptx
- Количество слайдов: 80
Описательная статистика МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА.
ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ Это такой способ описания случайной величины, при котором любому значению переменной приписывается вероятность его появления Значение переменной Х Вероятность 3 0, 08 5 0, 24 7 0, 4 9 0, 16 11 0, 08 р
ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ Это такой способ описания случайной величины, при котором любому значению переменной приписывается вероятность его появления Эмпирический закон распределения – распределение признака, полученное на реальных данных исследования. В эмпирических распределениях описание производится через соотношение значения случайной величины и доли.
СПОСОБЫ ОПИСАНИЯ ЭМПИРИЧЕСКОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ i интервал n w n (нак) w (нак) 1 [66 - 75) 1 0, 02 2 [75 - 84) 2 0, 04 3 0, 06 3 [84 - 93) 13 0, 26 16 0, 32 4 [93 - 102) 11 0, 22 27 0, 54 ТАБЛИЧНЫЙ способ представления данных КВАНТИЛИ ГРАФИЧЕСКИЙ способ представления данных ПАРАМЕТРЫ распределения
ТАБЛИЧНЫЙ СПОСОБ интервал n w 1 [66 - 75) 1 0, 02 2 [75 - 84) 2 0, 04 3 0, 06 3 [84 - 93) 13 0, 26 16 0, 32 4 ПРЕДСТАВЛЕНИЯ ДАННЫХ i [93 - 102) 11 0, 22 27 0, 54 Таблицы распределения признака Частотная таблица Вариационный ряд Шкала измерения: - Номинальная Шкала измерения: - Порядковая - Метрическая n (нак) w (нак)
ЧАСТОТНАЯ ТАБЛИЦА Чаще всего - для представления формальных характеристик выборки, группы (пол, профессия и т. п. ) В таблице перечисляются все возможные значения переменной, которым ставится в соответствие частота и доля Значения Частота ni 5 15 30 7 11 Доля wi 0, 07 0, 22 0, 44 0, 10 0, 16 ni число встречаемости значения переменной wi отношение частоты к общему количеству наблюдений (человек)
ЧАСТОТНАЯ ТАБЛИЦА Доля Частость Относительная частота Значения Частота ni 5 15 30 7 11 Доля wi 0, 07 0, 22 0, 44 0, 10 0, 16 wi отношение частоты к общему количеству наблюдений (человек)
ВАРИАЦИОННЫЙ РЯД Ранжированный в порядке возрастания или убывания ряд значений с соответствующими частотами и долями Позиция ni wi нак. ni нак. wi % 1 2 3 24 28 19 0, 27 0, 32 0, 21 24 52 71 0, 27 0, 59 0, 80 27 59 80 4 5 6 7 8 10 2 4 1 1 0, 11 0, 02 0, 04 0, 01 81 83 87 88 89 0, 92 0, 94 0, 98 0, 99 1, 00 92 94 98 99 100
ИНТЕРВАЛЬНЫЙ ВАРИАЦИОННЫЙ РЯД Если вариативность признака велика (большое количество значений), то для удобства представления вариационного ряда рекомендуется разбить значения на интервалы [75… 84) [84… 93) [93… 102) ni 20 15 15 wi 0, 4 0, 3 нак. ni нак. wi % 20 35 50 0, 4 0, 7 1, 0 40 70 100
РАЗБИЕНИЕ НА ИНТЕРВАЛЫ 20 12 7 5
РАЗБИЕНИЕ НА ИНТЕРВАЛЫ ФОРМУЛА СТЕРДЖЕСА Число интервалов m=1+3, 322 lg(n) v Величина интервалов k=(xmax-xmin)/m v Начало первого интервала xнач=xmin-k/2 v интервалы Объем группы [75… 84) [84… 93) Кол-во интервалов [93… 102) ni 8 -11 20 15 4 15 wi 12 -22 0, 4 0, 3 5 0, 3 нак. ni нак. wi % 23 -45 46 -90 91 -181 182 -362 20 0, 4 35 0, 7 6 50 7 1, 0 8 40 70 9 100
ТАБЛИЧНОЕ ОТОБРАЖЕНИЕ ВАРИАЦИОННОГО РЯДА Накопленная Середина интервала частота i значения хi ni wi ni нак wi нак 1 [65… 75) 70 1 0, 02 2 [75… 85) 80 2 0, 04 3 0, 06 3 [85. . 95) 90 14 0, 28 17 0, 34 4 [95… 105) 100 15 0, 30 32 0, 64 5 [105. . 115) 110 8 0, 16 40 0, 80 6 [115. . 125) 120 8 0, 16 48 0, 96 7 [125. . 135) 130 2 0, 04 50 1, 00 Накопленная доля
ТАБЛИЧНОЕ ОТОБРАЖЕНИЕ ВАРИАЦИОННОГО РЯДА i значения хi ni 1 [65… 75) 70 1 2 [75… 85) 80 2 3 [85. . 95) 90 14 4 [95… 105) 100 15 5 [105. . 115) 110 8 6 [115. . 125) 120 8 7 [125. . 135) 130 2 wi ni нак 1 wi нак
ТАБЛИЧНОЕ ОТОБРАЖЕНИЕ ВАРИАЦИОННОГО РЯДА i значения хi ni 1 [65… 75) 70 1 2 [75… 85) 80 2 3 [85. . 95) 90 14 4 [95… 105) 100 15 5 [105. . 115) 110 8 6 [115. . 125) 120 8 7 [125. . 135) 130 2 wi ni нак 1 + 3 wi нак
ТАБЛИЧНОЕ ОТОБРАЖЕНИЕ ВАРИАЦИОННОГО РЯДА i значения хi ni wi ni нак 1 [65… 75) 70 1 1 2 [75… 85) 80 2 3 3 [85. . 95) 90 14 +17 4 [95… 105) 100 15 5 [105. . 115) 110 8 6 [115. . 125) 120 8 7 [125. . 135) 130 2 wi нак
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА (ЗАКОНА РАСПРЕДЕЛЕНИЯ) Для графического изображения вариационных рядов наиболее часто используются: ПОЛИГОН ГИСТОГРАММА КУМУЛЯТА
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА Полигон Строится, как правило, для дискретного вариационного ряда Позиция wi 1 м 2 м 3 м 24 28 19 0, 27 0, 32 0, 21 4 м 5 м 6 м 7 м 8 м 10 2 4 1 1 0, 11 0, 02 0, 04 0, 01 По оси Y частота (или доля) ni По оси X - значения переменной
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА Гистограмма для изображения интервального вариационного ряда ni wi [65… 75) 1 0, 02 [75… 85) 2 0, 04 [85. . 95) 14 0, 28 [95… 105) 15 0, 30 [105. . 115) 8 0, 16 [115. . 125) 8 0, 16 [125. . 135) 2 0, 04 По оси Y частота (или доля) значения По оси X - интервалы значений
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА Кумулята Кривая накопленных частот ni нак wi нак [65… 75) 1 0, 02 [75… 85) 3 0, 06 [85. . 95) 17 0, 34 [95… 105) 32 0, 64 [105. . 115) 40 0, 80 [115. . 125) 48 0, 96 [125. . 135) 50 1, 00 По оси Y Накопленная частота (или доля) значения По оси X - значения переменной
КВАНТИЛИ Вариационный ряд содержит достаточно полную информацию о вариации признака, однако обилие числовых данных усложняет их использование. Описание вариационного ряда с помощью квантилей Квантиль обозначается как хр Квантиль хр уровня р – это такое значение переменной, при котором вероятность встретить значения меньше его равна р.
КВАНТИЛИ Квантиль хр уровня р – это такое значение переменной, при котором вероятность встретить значения меньше его равна р. Например, в тесте на тревожность Х 0, 1 = 15, 4 балла С 10 -ти процентной вероятностью (р=0, 1 или 10%) будут встречаться значения меньше 15, 4 балла Х 0, 25 = 38, 7 балла С 25 -ти процентной вероятностью (р=0, 25 или 25%) будут встречаться значения меньше 38, 7 балла При этом, вероятность встретить значения между 15, 4 и 38, 7 баллами равна 0, 15 (0, 25 – 0, 1)
КВАНТИЛИ Процентили, квартили, децили , медиана– разновидность квантилей. Это такие значения переменной, которые делят все данные на равные доли. квантили Медиана Квартили Децили Процентили Кол-во частей Ме Q D P 2 4 10 100 Х 0, 5 Q 1 Q 2 Q 3 D 1 D 2 D 3 D 4 D 5 D 6 D 7 D 8 D 9 P 1 P 2 P 3 …. P 98 P 99
КВАНТИЛИ квантили Кол-во частей Квартили Q 4 x 0, 25 Q 1 x 0, 5 Q 2 75% 50% 25% Q 1 Q 2 Q 3 x 0, 75 Q 3 Значения переменной
КВАНТИЛИ зеленый красный желтый красный синий зеленый красный синий Stroop 3 карта «интерференция» 60 49 65 86 59 45 46 61 60 104 51 93 75 62 67 76 68 63 36 93 70 98 55 62 51 60 70 79 68 51 64 56 93 53 58 59 44 63 54 69 66 56 58 60 92 51 55 71 64 49
КВАНТИЛИ зеленый красный желтый красный синий зеленый красный синий Stroop 3 карта «интерференция» 36 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104
КВАНТИЛИ 36 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 Квантиль х0, 05 1) Найдем место расположения квантиля в этом ряду по формуле (N+1)*p = (50+1)*0, 05 = 2, 55
КВАНТИЛИ 36 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 Квантиль х0, 05 2) второй номер имеет значение равное 44, а третий – 45. Нам нужно вычислить значение соответствующее 2, 55. Это можно сделать с помощью пропорции: 2 2, 55 3 44 х0, 05 45 (х0, 05 – 44) → (45 – 44) → (2, 55 – 2) (3 – 2)
КВАНТИЛИ 36 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 Квантиль х0, 05 (х0, 05 – 44) = (2, 55 – 2)*(45 – 44)/(3 – 2)= 0, 55 х0, 05 = 0, 55 + 44 = 44, 55
КВАНТИЛИ 36 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 Квантиль х0, 1 Найдем место расположения квантиля в этом ряду по формуле (N+1)*p = (50+1)*0, 1 = 5, 1 Х 0, 1 = 49
44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 КВАНТИЛИ 36 76 79 86 92 93 93 93 98 104 вероятность разновидность значение x 0, 1 x 0, 25 x 0, 5 0, 10 D 1 49 0, 25 Q 1 54, 75 x 0, 9 0, 75 Q 3 0, 90 D 9 0, 50 Me Q 2 D 5
44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 КВАНТИЛИ 36 76 79 86 92 93 93 93 98 104 вероятность разновидность значение x 0, 1 x 0, 25 x 0, 5 0, 10 D 1 49 0, 25 Q 1 54, 75 x 0, 9 0, 75 Q 3 0, 90 D 9 0, 50 Me Q 2 D 5 61, 5
44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 КВАНТИЛИ 36 76 79 86 92 93 93 93 98 104 вероятность разновидность значение x 0, 1 x 0, 25 x 0, 5 0, 10 D 1 49 0, 25 Q 1 54, 75 x 0, 9 0, 75 Q 3 0, 90 D 9 0, 50 Me Q 2 D 5 61, 5 70
44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 КВАНТИЛИ 36 76 79 86 92 93 93 93 98 104 вероятность разновидность значение x 0, 1 x 0, 25 x 0, 5 0, 10 D 1 49 0, 25 Q 1 54, 75 x 0, 9 0, 75 Q 3 70 0, 90 D 9 92, 9 0, 50 Me Q 2 D 5 61, 5
КВАНТИЛИ значение x 0, 1 x 0, 25 x 0, 75 x 0, 9 49 54, 75 61, 5 70 92, 9
МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ Показатель, характеризующий область наиболее вероятных значений переменной Мода Мо Медиана Ме (med) Средняя М
МОДА Мода – значение переменной, которому соответствует наибольшая частота Номинальная шкала значение частота 5 15 30 7 11 Порядковая шкала Метрическая шкала Позиция ni интервалы xi ni 1 24 [65… 75) 70 1 2 28 [75… 85) 80 2 3 19 [85. . 95) 90 14 4 10 [95… 105) 100 15 5 2 [105. . 115) 110 8 6 4 [115. . 125) 120 8
МОДА значения 1 2 3 4 5 6 7 8 ni 24 28 19 10 28 4 1 1 Если таких значений несколько, то говорят о полимодальном распределении признака 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8
МЕДИАНА Медиана - значение признака, приходящегося на середину ранжированного ряда наблюдений Медиана – квантиль уровня 0, 5 Ме = 61, 5 36 53 60 64 75 44 54 60 65 76 45 55 60 66 79 46 55 60 67 86 49 56 61 68 92 49 56 62 68 93 51 58 62 69 93 51 58 63 70 93 51 51 59 59 63 64 70 71 98 104
МЕДИАНА ВАРИАЦИОННОГО РЯДА интервал [65… 75) [75… 85) [85. . 95) [95… 105) [105. . 115) [115. . 125) [125. . 135) xi 70 80 90 100 110 120 130 wi нак 0, 02 0, 06 0, 34 0, 64 0, 80 0, 96 1, 00 Медиана – квантиль уровня 0, 5 0, 34 95 0, 64 Х 0, 50 105 (х0, 50 – 95) → (0, 5 – 0, 34) (105 – 95) → (0, 64 – 0, 34) Me = х0, 50 100, 3
СРЕДНЕЕ ЗНАЧЕНИЕ (СРЕДНЕЕ-АРИФМЕТИЧЕСКОЕ) Взвешенная сумма значений переменной Сумма произведений всех вариантов на соответствующие доли (вероятности)
СРЕДНЕЕ 70 82 83 85 86 86 87 88 88 88 89 90 90 90 91 92 93 96 96 96 97 99 99 100 101 103 103 104 108 111 112 113 114 115 116 117 118 119 121 123 127 129 70+82+83+ … +123+127+129 50 =101, 5
СРЕДНЕЕ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 ni 1 2 14 wi 0, 02 0, 04 0, 28 ni нак 1 3 17 wi нак 0, 02 0, 06 0, 34 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 15 8 8 2 0, 30 0, 16 0, 04 32 40 48 50 0, 64 0, 80 0, 96 1, 00 = 70*0, 02+
СРЕДНЕЕ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 ni 1 2 14 wi 0, 02 0, 04 0, 28 ni нак 1 3 17 wi нак 0, 02 0, 06 0, 34 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 15 8 8 2 0, 30 0, 16 0, 04 32 40 48 50 0, 64 0, 80 0, 96 1, 00 = 70*0, 02+80*0, 04+
СРЕДНЕЕ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 ni 1 2 14 wi 0, 02 0, 04 0, 28 ni нак 1 3 17 wi нак 0, 02 0, 06 0, 34 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 15 8 8 2 0, 30 0, 16 0, 04 32 40 48 50 0, 64 0, 80 0, 96 1, 00 = 70*0, 02+80*0, 04+90*0, 28
СРЕДНЕЕ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 ni 1 2 14 wi 0, 02 0, 04 0, 28 ni нак 1 3 17 wi нак 0, 02 0, 06 0, 34 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 15 8 8 2 0, 30 0, 16 0, 04 32 40 48 50 0, 64 0, 80 0, 96 1, 00 = 70*0, 02+80*0, 04+90*0, 28+100*0, 3 … +110*0, 16+120*0, 16+130*0, 04=101, 8
ВЫБОР МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ В унимодальных симметричных распределениях мода, медиана и среднее совпадают. Среднее = Медиана = Мода
ВЫБОР МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ 12 10 8 6 4 2 0 90. 95. 100. 105. 110. 115. 120. 125. 130. Среднее = 104, 6 Медиана = 105, 98 Мода = 100
ВЫБОР МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ 16 14 Ни средняя, ни медиана не дают представления об этой группе 12 10 8 6 4 2 0 0. 1. 2. 3. 4. 5. 6. 7. 8. Среднее = 3, 85 Медиана = 2, 17
ВЫБОР МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ Если в организации Z сотрудники получают зарплату: 100 сотрудников по 10$ 1 сотрудник по 1000$ Средняя = 20 $
МЕРЫ ВАРИАТИВНОСТИ Кто стреляет более метко? 10 10 9 9 8 8 7 7 6 6 Средняя = 8, 8 № 1 Средняя = 6, 6 № 2
МЕРЫ ВАРИАТИВНОСТИ меры изменчивости характеризуют то, насколько кучно или рассеяно, симметрично или несимметрично, равномерно или неравномерно расположены значения переменной Размах R Междуквартильный и децильный размахи Дисперсия s 2 и станд. отклонение s Энтропия Н
РАЗМАХ 36 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 Размах R = Xmax – Xmin = 104 – 36 = 68
МЕЖДУКВАРТИЛЬНЫЙ И ДЕЦИЛЬНЫЙ РАЗМАХИ 36 45 46 49 49 51 51 значение 53 x 0, 1 x 0, 25 x 0, 75 44 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 D 1 49 Q 1 54, 75 Q 3 70 D 9 92, 9 x 0, 9 Междуквартильный размах Q 1 -3 = Q 3 – Q 1 = P 75 – P 25 = x 0, 75 – x 0, 25 = 70 – 54, 75 = 15, 25 Полу - междуквартильный размах Q = (Q 3 – Q 1)/2= (70 – 54, 75)/2 = 7, 6 Размах между 1 и 9 децилями D = (D 9 – D 1)/2= P 90 – P 10 = x 0, 9 – x 0, 1 = 92, 9 – 49 = 43, 9
ДИСПЕРСИЯ Дисперсия – взвешенная по отношению к числу наблюдений сумма квадратов отклонений значений переменной от средней Для сгруппированного (интервального) вариационного ряда
ДИСПЕРСИЯ 36 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 1) Рассчитать среднее = 64, 36
ДИСПЕРСИЯ 36 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 (36 – 64, 36)*(36 – 64, 36) = 804, 29 2) От каждого значения вычесть среднее, а разницу возвести в квадрат
ДИСПЕРСИЯ 804, 29 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 (36 – 64, 36)*(36 – 64, 36) = 804, 29 2) От каждого значения вычесть среднее, а разницу возвести в квадрат
ДИСПЕРСИЯ 804, 29 44 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 (44 – 64, 36)*(44 – 64, 36) = 414, 53 2) От каждого значения вычесть среднее, а разницу возвести в квадрат
ДИСПЕРСИЯ 804, 29 414, 53 45 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 (44 – 64, 36)*(44 – 64, 36) = 414, 53 2) От каждого значения вычесть среднее, а разницу возвести в квадрат
ДИСПЕРСИЯ 804, 29 414, 53 374, 81 46 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 (45 – 64, 36)*(45 – 64, 36) = 374, 81 2) От каждого значения вычесть среднее, а разницу возвести в квадрат
ДИСПЕРСИЯ 804, 29 414, 53 374, 81 337, 09 49 49 51 51 53 54 55 55 56 56 58 58 59 59 60 60 61 62 62 63 63 64 64 65 66 67 68 68 69 70 70 71 75 76 79 86 92 93 93 93 98 104 (46 – 64, 36)*(46 – 64, 36) = 337, 09 2) От каждого значения вычесть среднее, а разницу возвести в квадрат
ДИСПЕРСИЯ 804, 29 414, 53 374, 81 337, 09 235, 93 178, 49 129, 05 107, 33 87, 61 69, 89 40, 45 28, 73 19, 01 11, 29 5, 57 1, 85 0, 13 0, 41 2, 69 6, 97 13, 25 21, 53 31, 81 44, 09 113, 21 135, 49 214, 33 468, 29 763, 97 820, 25 1131, 65 1571, 33 804, 29 + 414, 53 + 374, 81 + …. + 1571, 33 = 10933, 52 3) Найти сумму получившихся квадратов по всем наблюдениям (испытуемым)
ДИСПЕРСИЯ 804, 29 414, 53 374, 81 337, 09 235, 93 178, 49 129, 05 107, 33 87, 61 69, 89 40, 45 28, 73 19, 01 11, 29 5, 57 1, 85 0, 13 0, 41 2, 69 6, 97 13, 25 21, 53 31, 81 44, 09 113, 21 135, 49 214, 33 468, 29 763, 97 820, 25 1131, 65 1571, 33 10933, 52 / 49 = 223, 13 (дисперсия) 4) Разделить сумму квадратов на количество человек в группе минус один
ДИСПЕРСИЯ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 ni 1 2 14 wi 0, 02 0, 04 0, 28 ni нак 1 3 17 wi нак 0, 02 0, 06 0, 34 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 15 8 8 2 0, 30 0, 16 0, 04 32 40 48 50 0, 64 0, 80 0, 96 1, 00 1) Сначала необходимо рассчитать среднее (в данном примере оно равно 101, 8)
ДИСПЕРСИЯ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 wi 0, 02 0, 04 0, 28 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 (xi – х)2 wi*(xi – х)2 0, 30 0, 16 0, 04 2) Для каждого интервала рассчитаем разницу между серединой интервала и средней; возведем эту разницу в квадрат
ДИСПЕРСИЯ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 wi 0, 02 0, 04 0, 28 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 (xi – х)2 wi*(xi – х)2 0, 30 0, 16 0, 04 (70 – 101, 8)2 2) Для каждого интервала рассчитаем разницу между серединой интервала и средней; возведем эту разницу в квадрат
ДИСПЕРСИЯ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 wi 0, 02 0, 04 0, 28 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 0, 16 0, 04 (xi – х)2 wi*(xi – х)2 (70 – 101, 8)2 (80 – 101, 8)2 (90 – 101, 8)2 (100 – 101, 8)2 (110 – 101, 8)2 (120 – 101, 8)2 (130 – 101, 8)2 2) Для каждого интервала рассчитаем разницу между серединой интервала и средней; возведем эту разницу в квадрат
ДИСПЕРСИЯ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 wi 0, 02 0, 04 0, 28 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 0, 16 0, 04 (xi – х)2 wi*(xi – х)2 1011, 24 475, 24 139, 24 3, 24 67, 24 331, 24 795, 24 2) Для каждого интервала рассчитаем разницу между серединой интервала и средней; возведем эту разницу в квадрат
ДИСПЕРСИЯ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 wi 0, 02 0, 04 0, 28 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 0, 16 0, 04 (xi – х)2 wi*(xi – х)2 1011, 24 475, 24 139, 24 3, 24 67, 24 331, 24 795, 24 0, 02 * 1011, 24 0, 04 * 475, 24 3) Для каждого интервала рассчитаем произведение доли с получившимися значениями квадратичных разниц
ДИСПЕРСИЯ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 wi 0, 02 0, 04 0, 28 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 0, 16 0, 04 (xi – х)2 wi*(xi – х)2 1011, 24 475, 24 139, 24 3, 24 67, 24 331, 24 795, 24 20, 22 19, 0 38, 99 0, 97 10, 76 53, 0 31, 81 3) Для каждого интервала рассчитаем произведение доли с получившимися значениями квадратичных разниц
ДИСПЕРСИЯ i 1 2 3 варианты [65… 75) [75… 85) [85. . 95) xi 70 80 90 wi 0, 02 0, 04 0, 28 4 5 6 7 [95… 105) [105. . 115) [115. . 125) [125. . 135) 100 110 120 130 0, 16 0, 04 (xi – х)2 wi*(xi – х)2 1011, 24 475, 24 139, 24 3, 24 67, 24 331, 24 795, 24 20, 22 19, 0 38, 99 0, 97 10, 76 53, 0 31, 81 4) Сумма произведений даст значение дисперсии 174, 76
ДИСПЕРСИЯ Стандартное квадратичное отклонение получается извлечением квадратного корня из дисперсии Из предыдущего примера: Дисперсия =174, 76 соответственно квадратичное отклонение = 13, 2
ЭНТРОПИЯ ШЕНОНА С помощью энтропии Шенона можно оценить вариативность в номинальных шкалах, поскольку приведенные выше меры изменчивости невозможно рассчитать для них H = - ∑[wi ·log 2(wi)] = -1, 443·∑[wi ·ln(wi)]
ЭНТРОПИЯ ШЕНОНА H = - ∑[wi ·log 2(wi)] = -1, 443·∑[wi ·ln(wi)] варианты ni 5 15 30 7 11 wi 0, 07 0, 22 0, 44 0, 10 0, 16 H = -1, 443*[0. 07*ln(0. 07) + 0. 22*ln(0. 22) + 0. 44*ln(0. 44) + 0. 1*ln(0. 1) + 0. 16*ln(0. 16)] = 2, 02
ДЛЯ НОМИНАЛЬНЫХ ПЕРЕМЕННЫХ Меры центральной тенденции ü Мода Меры вариативности ü Энтропия Шенона Н
ДЛЯ ПОРЯДКОВЫХ ПЕРЕМЕННЫХ Меры центральной тенденции ü Мода ü Медиана Меры вариативности ü Энтропия Шенона Н ü Размах ü Полумеждуквартильный размах ü размах между 1 и 9 децилем
ДЛЯ МЕТРИЧЕСКИХ ПЕРЕМЕННЫХ Меры центральной тенденции ü Мода ü Медиана ü Среднее Меры вариативности ü Энтропия Шенона Н ü Размах ü Полумеждуквартильный размах ü размах между 1 и 9 децилем ü Дисперсия
ПРИМЕР зеленый красный желтый красный синий зеленый красный синий Stroop 3 карта «интерференция» ВЫБОРКА из 127 человек № интервалы xi ni wi 1 2 3 4 5 6 7 8 [42 … 50) [50… 58) [58… 66) [66… 74) [74… 82) [82… 90) [90… 98) [98… 106) 46 54 62 70 78 86 94 102 9 21 36 29 15 10 6 1 0, 07 0, 17 0, 28 0, 23 0, 12 0, 08 0, 05 0, 01 ni нак wi нак 9 30 66 95 110 126 127 0, 07 0, 24 0, 52 0, 75 0, 87 0, 94 0, 99 1, 00
ПРИМЕР зеленый красный желтый красный синий зеленый красный синий Stroop 3 карта «интерференция» ВЫБОРКА из 127 человек 40 35 30 25 20 15 10 5 0 [42 … 50) [50… 58) [58… 66) [66… 74) [74… 82) [82… 90) [90… 98) [98… 106)
Интервальный ряд 51 51, 4 58 58, 3 65 65, 4 74 74 85, 2 85, 4 60 62 66, 4 66, 98 56 8 7, 85 148, 72 155, 14 12, 20 12, 46 2, 61 ряд Р 10 Р 25 Р 50 Ме Р 75 Р 90 Мо Средняя Размах Полу междуквартильный размах Дисперсия Станд. откл Энтропия