Скачать презентацию Описательные статистики Концепция сжатия экспериментальных данных Графическое Скачать презентацию Описательные статистики Концепция сжатия экспериментальных данных Графическое

Описательные статистики.ppt

  • Количество слайдов: 25

Описательные статистики Концепция сжатия экспериментальных данных Описательные статистики Концепция сжатия экспериментальных данных

Графическое представление 12 12 11 11 11 13 14 14 14 16 16 13 Графическое представление 12 12 11 11 11 13 14 14 14 16 16 13 11 14 13 15 10 10 11 12 11 11 11

Описательные статистики Меры центральной тенденции Меры рассеяния Показатели асимметрии Показатели эксцесса Описательные статистики Меры центральной тенденции Меры рассеяния Показатели асимметрии Показатели эксцесса

Требования к показателям Любой из показателей должен вычисляться с помощью строго определенного алгоритма. При Требования к показателям Любой из показателей должен вычисляться с помощью строго определенного алгоритма. При вычислении значения показателя, как правило, должны использоваться все имеющиеся данные. Показатель не должен иметь слишком абстрактный характер и должен обладать достаточно простыми и ясными свойствами, чтобы была возможна его содержательная интерпретация. Показатели должны быть достаточно устойчивы, т. е. не сильно различаться для отдельных выборок, взятых из одного и того же множества данных.

Показатели центральной тенденции Средняя арифметическая обладает рядом важных свойств: 1. Если каждую варианту статистической Показатели центральной тенденции Средняя арифметическая обладает рядом важных свойств: 1. Если каждую варианту статистической совокупности уменьшить или увеличить на некоторое произвольно взятое положительное число, то и средняя уменьшится или увеличится на это число. 2. Если каждую варианту разделить или умножить на какое-то одно и то же число, то и средняя арифметическая изменится во столько же раз. 3. Сумма отклонений вариант от их средней арифметической равна нулю. 4. Сумма квадратов отклонений вариант от их средней меньше суммы квадратов отклонений тех же вариант от любой другой величины.

Показатели центральной тенденции Средняя гармоническая. 5 студентов за 1 час набрали следующее количество жуков: Показатели центральной тенденции Средняя гармоническая. 5 студентов за 1 час набрали следующее количество жуков: 1 - 10, 2 20, 3 - 25, 4 - 30, 5 - 20. Всего 105 штук. Оценим итоги с помощью Х и Хh. X=21 жук. Xh=5/(1/10+1/25+1/30+1/20)=18. 31. Разница весьма заметна. Какая же из средних верна. Попробуем вычислить время, затраченное на 1 жука - 60/21=2. 86 мин. Верно ли это ? Проверим результат. первый студент затратил 6 мин, 2 - 3, 3 - 2. 4, 4 - 2, 5 - 3. В среднем получится 3. 38 мин. Видно, что средняя арифметическая непригодна для определения среднего времени, затрачиваемого на поимку 1 жука. Из приведенного примера видно, что средняя гармоническая применяется тогда, когда результаты наблюдений обнаруживают обратную зависимость, заданных обратными значениями вариант.

Показатели центральной тенденции Средняя квадратическая Средняя кубическая. Средняя геометрическая Количество волков в прошлом году Показатели центральной тенденции Средняя квадратическая Средняя кубическая. Средняя геометрическая Количество волков в прошлом году увеличилось в два раза и в этом еще в три раза. Ясно, что за два года численность выросла в 6 раз. Каков средний рост за год? Арифметическая средняя здесь непригодна, ибо если за год численность возросла бы в (2+3)/2=2, 5 раз, то за два года численность бы выросла в 2, 5*2, 5=6, 25 раз, а не в шесть раз. Геометрическая средняя дает правильный ответ: 6 = 2, 45 раз.

Показатели центральной тенденции Медиана (Md) определяется как срединное значение в ранжированном ряду данных. Это Показатели центральной тенденции Медиана (Md) определяется как срединное значение в ранжированном ряду данных. Это значит, что по обе стороны от нее расположено ровно по половине данных. Применительно к кривой распределения медиана представляет такую точку на оси абсцисс, что ордината, проходящая через нее, делит площадь под кривой на две равные части. Если число данных n в выборке нечетно, то медиана соответствует (n+1)/2 порядку значению в ранжированном ряду. Если же n четно, то медиана выбирается равной среднему арифметическому из двух значений, занимающих в этом ряду (n/2) и (n/2)+1 места по порядку. Сумма абсолютных значений отклонений всех значений ряда от его медианы есть величина наименьшая

Показатели центральной тенденции Мода (Mo) представляет собой наиболее часто встречающееся в распределении численностей значение. Показатели центральной тенденции Мода (Mo) представляет собой наиболее часто встречающееся в распределении численностей значение. Если к данным таблицы распределения численностей подобрать теоретическую кривую распределения, то мода равна абсциссе точки, имеющей максимальную для этой кривой ординату.

Показатели изменчивости Размах вариации. Это показатель представляющий собой разность максимальной и минимальной вариант совокупности. Показатели изменчивости Размах вариации. Это показатель представляющий собой разность максимальной и минимальной вариант совокупности. Чем сильнее варьирует признак, тем больше размах вариации и наоборот. Лимиты и размах вариации - простые и наглядные характеристики варьирования, однако им присущи существенные недостатки: при повторных измерениях одного и того же группового объекта они могут существенно изменяться; кроме того, они не отображают существенные черты варьирования. Более удобной характеристикой вариации мог бы служить показатель который строится на основании отклонений вариант от их средней. Сумма таких отклонений, взятая без учета знаков и отнесенная к числу наблюдений называется средним линейным отклонением.

Показатели изменчивости Дисперсия. Несмотря на явное преимущество среднего линейного отклонения перед лимитами и размахом Показатели изменчивости Дисперсия. Несмотря на явное преимущество среднего линейного отклонения перед лимитами и размахом вариации, этот показатель не получил широкого распространения на практике. Наиболее подходящим оказался показатель, построенный не на отклонениях вариант от их средних, а на квадратах этих отклонений, его называют дисперсией (рассеяние) и выражают формулой

Показатели изменчивости Ценность дисперсии заключается в том, что, являясь мерой варьирования числовых значений признака Показатели изменчивости Ценность дисперсии заключается в том, что, являясь мерой варьирования числовых значений признака вокруг их средней арифметической, она измеряет и внутреннюю изменчивость значений признака, зависящую от разностей между наблюдениями. Преимущество дисперсии перед другими показателями вариации состоит также в том, что она разлагается на составные компоненты, позволяя тем самым оценивать влияние различных факторов на величину учитываемого признака.

Показатели изменчивости Вместе с тем установлено, что рассчитываемая по формуле дисперсия оказывается смещенной по Показатели изменчивости Вместе с тем установлено, что рассчитываемая по формуле дисперсия оказывается смещенной по отношению к своему генеральному параметру на величину, равную n/n-1. (поправка Бесселя) Разность n-1, называют числом степеней свободы, под которым понимают число свободно варьирующих единиц в составе численно ограниченной статистической совокупности.

Показатели изменчивости Свойства дисперсии 1. Если каждую варианту совокупности уменьшить или увеличить на одно Показатели изменчивости Свойства дисперсии 1. Если каждую варианту совокупности уменьшить или увеличить на одно и то же постоянное число, то дисперсия не изменится. 2. Если каждую варианту совокупности умножить или разделить на одно и то же постоянное число А, то дисперсия уменьшится или увеличится в А 2 раз.

Показатели изменчивости Среднее квадратичное отклонение. Наряду с дисперсией важнейшей характеристикой варьирования является среднее квадратичное Показатели изменчивости Среднее квадратичное отклонение. Наряду с дисперсией важнейшей характеристикой варьирования является среднее квадратичное отклонение - показатель, представляющий корень квадратный из дисперсии. Эта величина в ряде случаев оказывается более удобной характеристикой варьирования чем дисперсия, так как выражается в тех же единицах, что и средняя арифметическая.

Показатели изменчивости Ошибка средней арифметической Показатели изменчивости Ошибка средней арифметической

Показатели изменчивости М S или М m Для описания объектов Для описания среднего М Показатели изменчивости М S или М m Для описания объектов Для описания среднего М S – 68% М 2 S – 95% М m – 68% М 2 m – 95% М 3 S – 99% М 3 m – 99% 95% объектов имеют такие значения 95% доверительный интервал для M В аналогичной группе, M будет находиться в этом диапазоне в 95% случаев

Стандартизованные данные Из информации о конкретном значении признака и знания средней всей совокупности, не Стандартизованные данные Из информации о конкретном значении признака и знания средней всей совокупности, не очевидно относительное положение интересующего нас значения. Тем не менее достаточно часто желательно иметь возможность описать место некоторого значения в совокупности данных. Это можно сделать, измеряя его отклонение от среднего в единицах стандартного отклонения, т. е. Величины zi носят название стандартизованных (стандартизированных) величин. Ясно, что при переходе к стандартизированным данным любое распределение численностей преобразуется в распределение со средним, равным нулю, и единичной дисперсией. Стандартизованные данные, как и коэффициент вариации, являются безразмерными величинами, поэтому с их помощью можно сравнивать между собой распределения численностей, имеющие разную размерность.

Показатели асимметрии и эксцесса При анализе распределения численностей значительный интерес представляет оценка отклонения данного Показатели асимметрии и эксцесса При анализе распределения численностей значительный интерес представляет оценка отклонения данного распределения от симметричного, или, иначе говоря, его скошенность. Наконец, графики некоторых распределений более заострены, а других — уплощены.

Асимметрия Асимметрия

Асимметрия Из этой формулы следует, что распределения, скошенные влево, имеют положительную асимметрию, а скошенные Асимметрия Из этой формулы следует, что распределения, скошенные влево, имеют положительную асимметрию, а скошенные вправо — отрицательную. Естественно, что для симметричных распределений, для которых среднее и медиана совпадают, асимметрия равна нулю. Известно, что величина As, определяемая по формуле, находится в интервале [-3, 3]. Но практически эта величина очень редко достигает своих крайних значений, и для умеренно асимметричных одновершинных распределений она по модулю обычно меньше единицы.

Асимметрия 0, 737568 Асимметрия 0, 737568

Асимметрия Если наблюдаемый нами признак формируется под воздействием большого числа независимых друг от друга Асимметрия Если наблюдаемый нами признак формируется под воздействием большого числа независимых друг от друга причин, каждая из которых вносит относительно небольшой вклад в величину этого признака, то вправе ожидать, что получаемое в результате эксперимента распределение численностей будет симметричным. Однако если для экспериментальных данных получена значительная величина асимметрии (большая по абсолютной величине, чем 0, 5), то можно предположить, что условия, указанные выше, не соблюдаются.

Экцесс Показано, что величина эксцесса для нормальной (гауссовой) кривой распределения, играющей в статистике, так Экцесс Показано, что величина эксцесса для нормальной (гауссовой) кривой распределения, играющей в статистике, так же как и в теории вероятностей большую роль, равна 3. Исходя из целого ряда соображений заостренность этой кривой принимают за стандарт и поэтому в качестве показателя эксцесса используют величину γ=Ех - 3. -0, 494003

Сокращение Русское название Английское название M Среднее арифметическое Mean Me Медиана Median Mo Мода Сокращение Русское название Английское название M Среднее арифметическое Mean Me Медиана Median Mo Мода Moda m Ошибка средней арифметической Standart error of mean S Стандартное отклонение Standart Deviation S 2 Дисперсия Variance As Асимметрия Skewness Ex Эксцесс Kurtosis