Математические методы в психологии Зачем психологу математика?





































Описательная статистика.ppt
- Количество слайдов: 37
Математические методы в психологии
Зачем психологу математика?
Основные понятия математических измерений в психологии
Измерение ¡ Измерение - познавательный процесс, включающий исследование количественных характеристик материальных объектов с помощью соответствующих измерительных приборов. ¡ Измерение - присваивание чисел определенным объектам, свойствам, признакам, событиям или изменениям в соответствии с определенными правилами. ¡ Измерение - построение шкал посредством изоморфного отражения эмпирической системы с отношениями в численной системе с отношениями.
Шкалы ¡ Шкала - упорядоченная совокупность данных. ¡ Различают четыре типа шкал измерений: l номинальную, l порядковую, l интервальную, l шкалу отношений.
Номинальная шкала или шкала наименований - присваивание какому-либо свойству определенного обозначения или символа. Это группирование объектов, объединение их в классы. Разные классы отличаются друг от друга лишь в качественном отношении, допускает любые замены и перестановки обозначений. Примеры: классификация вкусовых качеств: А – сладкое, В – горькое, С – кислое, D – соленое; распределение людей по типам темперамента: А – холерики, В – сангвиники, С – флегматики, D – меланхолики. Дихотомическая шкала наименований, когда свойство может принимать только два значения, например: А (1): мужчина В (0): женщина верующий атеист
Порядковая шкала Ординарная (порядковая, ранговая) шкала предполагает ранжирование определенного свойства так, что А > B > C >. . . , когда в объектах можно обнаружить различия в степени выраженности признака или свойства. Ранговая шкала задает лишь порядок следования объектов в соответствии со степенью выраженности того или иного признака. Примеры: ¡ места, занятые студентами в соревновании; ¡ в психодиагностике (например, тест Спилбергера): утверждение: Я спокоен, собран, хладнокровен оценка: 1 (никогда) 2 (иногда) 3 (часто) 4 (всегда).
Интервальная шкала предполагает разбиение диапазона между двумя крайними точками на определенное число равных интервалов (категорий). Примеры: а) температурная шкала Цельсия; б) шкала уровня субъективного контроля по Роттеру: -3 -2 -1 0 +1 +2 +3 Абсолютно Не знаю Совершенно не согласен (не уверен) согласен На интервальной шкале нуль условен, он не указывает на отсутствие измеряемого свойства. Шкала допускает операции нахождения разности, суммы и среднего значения
Шкала отношений предполагает наличие естественного нуля, который означает полное отсутствие какого-либо свойства или признака. Шкала отношений является наиболее информативной шкалой, допускает любые математические операции и использование различных статистических приемов. Примеры шкалы физических характеристик (время, масса, объем, скорость и пр. ), шкалы физиологических характеристик в психофизиологии, где отсчет ведется от естественного нуля.
Генеральная и выборочная совокупности Генеральная совокупность – множество всех объектов, обладающих исследуемым свойством. Выборка (выборочная совокупность) – это группа объектов, удовлетворяющая следующим условиям: 1. Это группа объектов, доступная для изучения. 2. Это часть заранее намеченной генеральной совокупности. 3. Это группа, отобранная случайным образом так, чтобы любой объект генеральной совокупности имел одинаковую вероятность попасть в выборку. Основное свойство выборочной совокупности – репрезентативность – это способность выборки характеризовать соответствующую генеральную совокупность с определенной точностью и достаточной надежностью.
Переменная величина (или переменная) – количественно измеряемое свойство, принимающие различные значения. Примеры: l время решения задачи, l количество допущенных ошибок, l уровень тревожности или нейротизма, l коэффициент интеллекта и др. Психологические переменные испытывают на себе влияние многочисленных факторов и невозможно предсказать заранее, какое значение они примут, поэтому они являются случайными величинами. Значения переменных могут изменяться либо непрерывно, либо дискретно.
Математическая обработка данных
Представление данных Это подготовительный этап обработки данных с целями: l представления в наиболее компактной, удобной для обработки форме; l сохранения максимума содержащейся в них информации. Представление данных включает в себя ряд последовательных действий: l протоколирование, l табулирование данных, l создание таблиц сгруппированных частот, l построение диаграмм или полигона распределения частот и т. д.
Протоколирование и табулирование Протоколирование – заполнение базы данных или индивидуальных протоколов по всем исследуемым. Табулирование – оформление данных в форме таблиц, заполнение сводных таблиц №п/п Фамилия, имя, Другие данные Исследуемый отчество (если необходимо) показатель 1 2 … n Перед составлением сводной таблицы проводится ранжирование данных - данные выстраиваются в общий ряд по исследуемому признаку в порядке его возрастания или убывания: х1≤х2≤х3≤…≤хn, где n – общее число значений признака
Табулирование Затем строят таблицы распределения частот: №№ пп 1 2 … n-1 n xi fi При выборках большого объёма используются таблицы распределения сгруппированных частот: Номер класса (N) 1 2 … N-1 N Границы класса (xmin xmax) Среднее значение ( ) Частоты (fi ) Накопленные частоты (Fi)
Табулирование Для составления таблицы распределения сгруппированных частот необходимо: 1) общий диапазон изменения признака разделить на равные по ширине классы, их число в общем диапазоне определяется формулой Стэрджесса: N = 1 + 3, 322 lg n, где n – объем выборки, N – количество классов; 2) определить границы классов; 3) подсчитать частоты встречаемости признака в каждом классе.
Квантили Квантиль – точка на оси значений признака, делящая совокупность наблюдений в определенной пропорции. Для определения квантилей необходимо иметь ряд значений исследуемого признака, ранжированных в порядке возрастания величины. Разновидностей квантилей: квартили (Q) делят совокупность наблюдений на 4 равные части: 25: 50: 75%. квинтили (K) делят выборку на 5 равных частей: 20: 40: 60: 80%. децили (D) делят ранжированный ряд на 10 равных частей: D 1 = 10%, D 2 = 20%, . . . D 9 = 90%. процентили (Р) делят совокупность наблюдений на 100 частей (в процентном отношении).
Квантили Пример На 20 испытуемых определялся уровень личностной тревожности (УЛТ) по тесту Спилбергера. При ранжировании значений признака получен следующий вариационный ряд (см. таблицу). Определить значения 1 -го, 2 -го и 3 -го квартилей.
Графическое представление результатов Гистограмма – столбчатая фигура, у которой ширина каждого столбца – ширина класса, высота – соответствующая частота встречаемости признака. Полигон – ломаная, соединяющая точки с координатами ( , fi), где - среднее значение, fi – частота встречаемости признака на каждом интервале.
Основные числовые характеристики рядов данных
Меры центральной тенденции Центральная тенденция – это количественное (численное) значение признака, к которому тяготеет переменная величина. В психологических исследованиях в качестве мер центральной тенденции чаще всего используются l мода, l медиана l среднее арифметическое значение.
Мода (Mo)–наиболее часто встречающееся значение признака. При анализе таблицы сгруппированных частот определяется модальный класс - тот класс распределения, в который попадает наибольшее количество частот. В зависимости от того, сколько значений признака удовлетворяют определению моды, различают l мономодальные (имеющие одну моду), l бимодальные (имеющие две моды) l полимодальные распределения (имеют более чем две моды), l распределения, не имеющие моды (все значения признака встречаются примерно с одинаковой частотой).
Медиана (Md) – значение, которое делит ранжированный ряд пополам – среднее значение ранжированного ряда. Если число значений нечетное, то медиана соответствует среднему члену ряда, если четное, то медиана есть среднее между двумя центральными значениями Медиана соответствует 50 -му процентилю, 5 -му децилю или 2 -му квартилю в группе данных, т. е. Md = P 50 = D 5 = Q 2. Мода и медиана не учитывают разброса данных, и переменные, лежащие в стороне от центра, не влияют на их величину.
Среднее значение (среднее арифметическое), равно сумме значений переменной, деленной на их число. Для несгруппированных переменных среднее арифметическое вычисляется по формуле: Для сгруппированных переменных используют формулу: Взвешенное среднее используется в случаях, когда разные составляющие имеют разный «удельный вес» в формировании общей совокупности
Меры вариации (изменчивости) Для определения степени разнообразия (изменчивости) исследуемого параметра используются различные величины: l размах вариаций, l дисперсия, l стандартное отклонение, l коэффициент вариации и др.
Размах вариаций ( ) есть математическая разность между максимальной и минимальной величиной признака Размах от 10 -го до 90 -го процентиля (мера D) вычисляется следующим образом: Междуквартильный размах – это разность между 1 -м и 3 -м квартилями группы:
Дисперсия ( 2) представляет собой сумму квадратов отклонений значений признака от среднего: При расчете дисперсии вручную используют другую (рабочую) формулу:
Среднеквадратичное (стандартное) отклонение Стандартное отклонение ( х) соответствует квадратному корню из дисперсии.
Коэффициент вариации (V) есть отношение стандартного отклонения к среднему арифметическому значению, выраженное в процентах:
Распределения переменных величин и их числовые характеристики
Нормальное распределение (распределение Гаусса, распределение Муавра – Лапласа) – это распределение значений переменной величины в тех случаях, когда она варьирует случайным образом и не подвержена влиянию какого-либо систематического фактора. Формула нормального распределения: где: f – теоретическая частота значения x; σ – стандартное отклонение; a - среднее значение; 3, 142 (отношение длины окружности к диаметру); e 2, 718 (основание натурального логарифма).
Нормальная кривая Нормальное распределение имеет вид симметричной колообразной кривой, у которой: 1. Правая и левая ветви абсолютно симметричны. 2. Основные показатели центральной тенденции (мода, медиана и среднее арифметическое значение) совпадают и соответствуют самой высокой точке (вершине) распределения. 3. Правая и левая ветви асимптотически приближаются к оси абсцисс.
Сравнение эмпирического распределения с нормальным Существует ряд статистических критериев, позволяющих сравнить экспериментально полученное распределение с теоретическим (нормальным). Основными из них являются l коэффициент асимметрии, l показатель эксцесса, l критерий хи-квадрат Пирсона ( 2) l критерий Колмогорова - Смирнова.
Коэффициент асимметрии Распределение может быть приблизительно симметричным относительно среднего либо обладать асимметрией. Эмпирическое распределение считается соответствующим теоретическому (нормальному), если асимметрия при данной выборке не превышает граничного значения, найденного по таблице.
Коэффициент асимметрии (As) вычисляется по формуле: где zx – мера Пирсона При больших выборках (n>50) можно использовать упрощенную формулу:
Коэффициент эксцесса (Ех) характеризует компактность или «размытость» распределения значений переменной вокруг среднего
Коэффициент эксцесса (Ех) вычисляется по формуле Эмпирическое распределение соответствует нормальному (теоретическому), если Ex < Exкр (найдено по таблице)

