Статистика, лекция №

Скачать презентацию Статистика, лекция № Скачать презентацию Статистика, лекция №

статистика - слайды к лекции 5 обновлённый.ppt

  • Количество слайдов: 16

>     Статистика, лекция № 5 Показатели меры рассеяния признака: Статистика, лекция № 5 Показатели меры рассеяния признака: лимиты, вариационный размах, среднее линейное отклонение, дисперсия 22. 01. 2018 1

> Главной особенностью совокупности является наличие разнообразия между её членами, т. е.  вариации. Главной особенностью совокупности является наличие разнообразия между её членами, т. е. вариации. Учёт вариации того или иного признака в совокупности имеет большое значение для лингвиста, так как всякая вариация отражает разницу между выборками (и членами выборки внутри её). Без оценки вариации невозможно сравнение двух совокупностей. Лимиты (пределы) – значения крайних класс-интервалов 22. 01. 2018 2

> крайние класс-интервалы:  88 92 и 123 127    Хmin = крайние класс-интервалы: 88 92 и 123 127 Хmin = 90 мс Xmax = 125 мс Вариационный размах (R): R = x max - x min 90 125 x R (=35 мс) 22. 01. 2018 3

> Различие между единицами совокупности    называется вариацией.    Различие между единицами совокупности называется вариацией. 2 числовые значения представляют признака довольно сильно однородную 1 различаются группу R N. B. лимиты одни, а вариации - разные 22. 01. 2018 4

>Определение вариационного размаха, т. е. разницы между xmin и xmax , может в известной Определение вариационного размаха, т. е. разницы между xmin и xmax , может в известной степени указывать на степень вариации, но оно недостаточно. Во-первых, крайние величины в рядах не очень устойчивы и легко могут сдвигаться. Во-вторых, при одних и тех же пределах вариации распределение отдельных вариант в рядах может быть различно 22. 01. 2018 5

>  Для характеристики различий между отдельными  значениями случайной переменной x нужен такой Для характеристики различий между отдельными значениями случайной переменной x нужен такой показатель, который обобщал бы колеблемость всех вариант. (среднее абсолютное отклонение) Νβ! Среднее отклонение не улавливает истинной закономерности вариации. Более совершенные показатели, характеризующие вариацию - дисперсия (или варианса) и среднее квадратичное отклонение. Сущность дисперсионного анализа - в установлении роли отдельных факторов в изменчивости того или иного 22. 01. 2018 признака. 6

> Возникает важная задача разложения общей изменчивости признака на составные части, определяемые, с одной Возникает важная задача разложения общей изменчивости признака на составные части, определяемые, с одной стороны, изучаемыми конкретными факторами, а с другой - вызываемые случайными, неконтролируемыми причинами. N. B. дисперсионный анализ позволяет оценивать значимость влияния отдельных факторов, а также их относительную роль в общей изменчивости. Р. Фишер 22. 01. 2018 7

>     (Р. Фишер)    величина абстрактная, квадратичная (не (Р. Фишер) величина абстрактная, квадратичная (не σ 2 или S 2 = находится на числовой оси, нигде не откладывается, она не имеет размерности). Нужна для расчёта других величин, для сравнения двух критериев. Νβ! Формулы дисперсии для больших и малых выборок различны. Для малых выборок Σ (xi - xср)2 n - 1 иногда обозначают σ2 = через (ню) и называют n-1 число степеней свободы 22. 01. 2018 8

>Для больших выборок (для сгруппированных  вариационных рядов)     Σ mi Для больших выборок (для сгруппированных вариационных рядов) Σ mi (ai - xср )2 σ 2= n 22. 01. 2018 9

>  Как и в других случаях статистического   анализа, при дисперсионном следует Как и в других случаях статистического анализа, при дисперсионном следует исходить из первоначально принимаемой нулевой гипотезы, а именно, что данный фактор А, например, не влияет на изменчивость. Если верна нулевая гипотеза, 2 должна = 0, т. е. вся вариация сводится только к случайной. Для того, чтобы отбросить нулевую гипотезу, нужно доказать, что 2 достоверно отличается от нуля (т. е. с вероятностью не меньшей, чем 0, 95 или с уровнем достоверности 0, 05) 22. 01. 2018 10

>  Нулевая гипотеза: положение во фразе не влияет     Нулевая гипотеза: положение во фразе не влияет на длительность звука абсолютная частота прямые скобки означают модуль, середина т. е. число взято без знака + или - класс- интервала ai mi |ai - xср|2 mi |ai - xср|2 22. 01. 2018 11

>   4280 σ 2=  = 42, 8  100 22. 01. 4280 σ 2= = 42, 8 100 22. 01. 2018 12

> Из текста взяты 5 выборок по 500 знаменательных слов  каждая и определена Из текста взяты 5 выборок по 500 знаменательных слов каждая и определена частота глаголов в них. Пусть это будут следующие результаты: х1 = 95 х2 = 87 Нулевая гипотеза (возможная): частота глаголов в тексте не х3 = 94 определяется типом текста х4 = 104 х5 = 100 Определите дисперсию. 2 = 166: 4 = 41, 5 22. 01. 2018 13

> На первом этапе дисперсионного  анализа можно ограничиться только установлением   достоверности На первом этапе дисперсионного анализа можно ограничиться только установлением достоверности или недостоверности влияния изучаемого фактора. Однако в ряде случаев необходим более глубокий анализ: нужно подсчитать среднее квадратичное отклонение, коэффициент вариации и т. д. 22. 01. 2018 14

> Контрольные вопросы к лекции № 5 1. Что такое лимиты? 2. Что такое Контрольные вопросы к лекции № 5 1. Что такое лимиты? 2. Что такое вариационный размах? Приведите его символ. 3. Почему одного вариационного размаха недостаточно для характеристики вариативности признака? 4. Что такое среднее отклонение? Приведите его формулу. 5. Для чего служит дисперсия. Приведите её характеристики. 6. Приведите формулы дисперсии для малых и для больших выборок. 7. Решите задачу: в выборках, сопряжённых с предыдущей, также была определена частота глаголов (другой автор, но условия эксперимента аналогичные: 5 выборок по 500 слов каждая). Получены следующие переменные: х1= 80, х2 = 72, х3 = 87, х4 = 70, х5 = 85 Подсчитайте дисперсию и сравните две выборки (определите, в которой достоверность влияния предполагаемого фактора выше). 22. 01. 2018 15

>  Проверка решения задачи  Нулевая гипотеза:  частота глаголов в тексте не Проверка решения задачи Нулевая гипотеза: частота глаголов в тексте не определяется авторской манерой (σ2=0) N. B. Чем больше 2, тем выше достоверность влияния предполагаемого фактора (т. к. вариативность больше) 2 = 230, 6: 4 = 57, 7 1 = 41, 5 1 < 2 Ответ: нулевая гипотеза не может быть принята, авторская манера влияет на частоту глаголов: во второй выборке достоверность влияния авторской 22. 01. 2018 16 манеры на частоту глаголов в тесте выше