распределения данных.ppt
- Количество слайдов: 23
Распределение данных
Чаще всего в психологических исследованиях приходится иметь дело со следующими видами распределения данных:
Нормальное распределение и распределение Стьюдента показывают распределения выраженности количественного признака (метрических данных)
Биномиальное распределение показывает распределение качественного признака (номинативных данных). Пуассоновское распределение сортирует группы по числу объектов, обладающих признаком.
Кривая распределения - это предел, к которому стремится полигон частот при неограниченном увеличении объема статистической совокупности. Она дает характеристику некоторой генеральной совокупности, т. е. получаемые в эксперименте выборки лишь в той или иной степени приближаются к своему теоретическому пределу. Кривая распределения позволяет наглядно представить форму распределения, т. е. определенную закономерность специфической концентрации вариант в цельной статистической совокупности.
Основные типы форм распределения эмпирических результатов Принято выделять две большие группы кривых распределений: одновершинные и многовершинные (составные).
Основные типы форм распределения эмпирических результатов
Основные типы форм распределения эмпирических результатов Одновершинные распределения делятся на следующие группы: а) симметричные, т. е. такие, в которых идет равновероятное уменьшение величины признака по обе стороны от некоторого и максимально частого значения; примером таких является расположение людей по величине роста; б) умеренно асимметричные или скошенные, в которых убывание числовых значений переменной в одну из сторон выражено заметно сильнее; таковы, например, распределения подавляющего большинства измерений эффективности человеческой деятельности;
Основные типы форм распределения эмпирических результатов в) распределения крайне асимметричные, характерные, например, для распределения населения по величине материальной обеспеченности; г) U-образные, в которых наибольшая частота свойственна обоим крайним значениям признака, например, распределение облачности в районе Гринвичского меридиана.
Основные типы форм распределения эмпирических результатов
а - многовершинные, б - симметричные, в - умеренно скошенные, г - крайне асимметричные, д — U-образные.
Нормальное распределение Одним из важнейших в статистике является понятие нормального распределения. Оно применимо только для метрических данных! Нормальное распределение (называемое также распределением Гаусса) характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине, — часто.
Нормальное распределение возникает, когда данная случайная величина представляет собой сумму большого числа независимых случайных величин, каждая из которых играет в образовании всей суммы незначительную роль.
Нормальное распределение имеет колообразную форму, значения его моды, медианы и среднего арифметического равны. Распределение описывается формулой:
где u - высота кривой над любым заданным значением х; - стандартное отклонение; х - значение варианты; М - математическое ожидание, или среднее арифметическое значение; - число пи, равное 3, 142. . . ; е - основание натурального логарифма, равное 2, 718. .
Нормальное распределение Для различных значений и х может существовать бесконечное множество кривых нормального распределения. Выражение (x-M)/ , входящее в состав формулы, называется нормированным отклонением и обозначается буквой t. Нормированное отклонение показывает, на сколько сигм ( ) (т. е. единиц меры, которой служит среднее квадратическое отклонение) та или иная варианта совокупности отклоняется от среднего уровня варьирующего признака.
M-3 M-2 M- M M+ M+2 M+3
Если M=0, а =1, то площадь под кривой, описываемой уравнением, равна единице. Если ее принять за 100%, то для значений t в пределах: от -1 до +1 расположено 68, 3% всей площади; от -2 до +2 расположено 95, 4% всей площади; от -3 до +3 расположено 99, 7% всей площади. Следовательно, вероятность p любой варианты нормального распределения находиться в пределах: от -1 до +1 равна 0, 683; от -2 до +2 равна 0, 954; от -3 до +3 равна 0, 997. Эти выводы можно распространить и на любое нормальное распределение с математическим ожиданием М и средним квадратическим отклонением . Для любого нормального распределения
Следовательно, вероятность p любой варианты нормального распределения находиться в пределах: от -1 до +1 равна 0, 683; от -2 до +2 равна 0, 954; от -3 до +3 равна 0, 997. Эти выводы можно распространить и на любое нормальное распределение с математическим ожиданием М и средним квадратическим отклонением .
Для любого нормального распределения 1) 68, 3% площади под кривой лежит в пределах от М- до М+ , 2) 95, 4% площади под кривой лежит в пределах от М-2 до М+2 , 3) 99, 7% площади под кривой лежит в пределах от М-3 до М+3.
Это означает, что случайная величина х находится в диапазоне: M- < x < M+ с вероятностью р=0, 683; M-2 < x < M+2 с вероятностью р=0, 954; M-3 < x < M+3 c вероятностью р=0, 997.
Обычно в исследовательской практике принимаются три порога вероятности: р1 = 0, 95; р2 = 0, 99 и р3 = 0, 999. Этим вероятностям соответствуют определенные значения нормированных отклонений t: вероятности р1 = 0, 95 соответствует t = 1, 96; вероятности р2 = 0, 99 соответствует t = 2, 58; вероятности р3 = 0, 999 соответствует t = 3, 29.
Эмпирическим путем было установлено, что многие биологические параметры распределены подобным образом (рост, вес и так далее). Впоследствии психологи выяснили, что и большинство психологических свойств (показатели интеллекта, темпераментных особенностей, способностей и других психических явлений) также имеют нормальное распределение. Этот принцип учитывается при стандартизации тестовых методик. При этом чем больше объем выборки, тем достовернее полученное эмпирическое распределение приближается к нормальному. Нормальным распределением может быть только распределение с числом наблюдений не менее 30 (при наличии и прочих условий соответствия).


