Скачать презентацию СТАТИСТИЧЕСКИЕ МЕТОДЫ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В ПСИХОЛОГИИ II Скачать презентацию СТАТИСТИЧЕСКИЕ МЕТОДЫ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В ПСИХОЛОГИИ II

Стат.методы и математич.моделирование_II часть.ppt

  • Количество слайдов: 45

СТАТИСТИЧЕСКИЕ МЕТОДЫ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В ПСИХОЛОГИИ (II часть) к. пс. н. Щеглова Э. СТАТИСТИЧЕСКИЕ МЕТОДЫ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В ПСИХОЛОГИИ (II часть) к. пс. н. Щеглова Э. А.

МНОГОМЕРНЫЕ МЕТОДЫ Многомерные методы позволяют обоснованно выбрать среди множества вероятностных статистических моделей такую, которая МНОГОМЕРНЫЕ МЕТОДЫ Многомерные методы позволяют обоснованно выбрать среди множества вероятностных статистических моделей такую, которая наилучшим образом соответствует исходным статистическим данным, характеризующим реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании большого статистического материала.

МНОГОМЕРНЫЕ МЕТОДЫ 1. Классификация методов по назначению: • Методы предсказания (экстраполяции): множественный регрессионный и МНОГОМЕРНЫЕ МЕТОДЫ 1. Классификация методов по назначению: • Методы предсказания (экстраполяции): множественный регрессионный и дискриминантный анализ. • Методы классификации: варианты кластерного анализа и дискриминантный анализ. • Структурные методы: факторный анализ и многомерное шкалирование.

МНОГОМЕРНЫЕ МЕТОДЫ 2. Классификация методов по исходным предположениям о структуре данных: • Методы, основанные МНОГОМЕРНЫЕ МЕТОДЫ 2. Классификация методов по исходным предположениям о структуре данных: • Методы, основанные на корреляционной модели, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов (факторный анализ, множественный регрессионный анализ, отчасти – дискриминантный анализ). • Методы, основанные на дистантной модели, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними (кластерный анализ, многомерное шкалирование, частично – дискриминантный анализ).

МНОГОМЕРНЫЕ МЕТОДЫ 3. Классификация методов по виду исходных данных: • Методы, использующие в качестве МНОГОМЕРНЫЕ МЕТОДЫ 3. Классификация методов по виду исходных данных: • Методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов (множественный регрессионный анализ, дискриминантный анализ и факторный анализ). • Методы, исходными данными для которых могут быть попарные сходства (различия) между объектами (кластерный анализ и многомерное шкалирование).

РЕГРЕССИОННЫЙ АНАЛИЗ РЕГРЕССИОННЫЙ АНАЛИЗ

РЕГРЕССИОННЫЙ АНАЛИЗ Ориентирован на планирование и прогнозирование, позволяет по имеющимся данным предсказывать новые результаты. РЕГРЕССИОННЫЙ АНАЛИЗ Ориентирован на планирование и прогнозирование, позволяет по имеющимся данным предсказывать новые результаты. Цель регрессионного анализа - статистически адекватно описать зависимость, прогнозируемых ( «выходных» ) переменных от ряда других независимых переменных. Независимые переменные – предикторы, регрессоры, факторы. Зависимые переменные – отклики.

МОДЕЛЬ ПРОСТОЙ ЛИНЕЙНОЙ РЕГРЕССИИ Y– предсказанное значение отклика, X - значение предиктора, b 0 МОДЕЛЬ ПРОСТОЙ ЛИНЕЙНОЙ РЕГРЕССИИ Y– предсказанное значение отклика, X - значение предиктора, b 0 - константа регрессии для отклика Y, b 1 - коэффициент регрессии для отклика Y, e – остаток для отклика Y.

МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ Y– предсказанное значение отклика, Xi - значения предикторов, b 0 МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ Y– предсказанное значение отклика, Xi - значения предикторов, b 0 - константа регрессии для отклика Y, bk - коэффициенты регрессии для отклика Y, e – остаток для отклика Y.

ТРЕБОВАНИЯ К ПРИМЕНЕНИЮ РЕГРЕССИОННОГО АНАЛИЗА • Исследование должно быть продумано по форме и исполнению. ТРЕБОВАНИЯ К ПРИМЕНЕНИЮ РЕГРЕССИОННОГО АНАЛИЗА • Исследование должно быть продумано по форме и исполнению. • Объем выборки N > 50. • Использование только метрических данных. • Соответствие вероятностных распределений предикторов, отклика и остатков нормальному закону. • Некоррелированность предикторов между собой.

МЕТОДЫ РЕГРЕССИОННОГО АНАЛИЗА • Стандартный метод учитывает при получении коэффициентов регрессии все изначально заданные МЕТОДЫ РЕГРЕССИОННОГО АНАЛИЗА • Стандартный метод учитывает при получении коэффициентов регрессии все изначально заданные предикторы. • Пошаговый метод (Stepwise) ориентирован на получение наилучшего (оптимального) подмножества предикторов, обеспечивающего наиболее высокое качество регрессии.

ПРЯМОЙ ПОШАГОВЫЙ МЕТОД В уравнение регрессии поочередно «включается» каждая переменная, начиная с предиктора, наиболее ПРЯМОЙ ПОШАГОВЫЙ МЕТОД В уравнение регрессии поочередно «включается» каждая переменная, начиная с предиктора, наиболее тесно коррелирующего с откликом. Процесс продолжается до тех пор, пока происходит прирост коэффициента множественной корреляции. В результате удается получить максимально возможное количество предикторов, обеспечивающих наиболее высокий коэффициент множественной корреляции.

ОБРАТНЫЙ ПОШАГОВЫЙ МЕТОД Процесс начинается с рассмотрения всех предикторов, которые затем поочередно исключаются из ОБРАТНЫЙ ПОШАГОВЫЙ МЕТОД Процесс начинается с рассмотрения всех предикторов, которые затем поочередно исключаются из уравнения регрессии. В результате получают минимальное количество предикторов, обеспечивающих статистически значимый коэффициент множественной корреляции.

РЕГРЕССИОННЫЙ АНАЛИЗ • R – коэффициент множественной корреляции, коэффициент характеризующий связь между значениями зависимой РЕГРЕССИОННЫЙ АНАЛИЗ • R – коэффициент множественной корреляции, коэффициент характеризующий связь между значениями зависимой и независимой переменных. • р – уровень статистической значимости, вероятность случайности полученного результата. • R 2– коэффициент детерминации, характеризующий долю дисперсии зависимой переменной, обусловленную воздействием со стороны независимой переменной (независимых переменных). • В-величины – константа и коэффициенты уравнения регрессии (нестандартизированные). • β – стандартные коэффициенты регрессии, представляют собой коэффициенты В для независимых переменных, представленных в z-шкале.

ФАКТОРНЫЙ АНАЛИЗ ФАКТОРНЫЙ АНАЛИЗ

ФАКТОРНЫЙ АНАЛИЗ Факторный анализ – метод, позволяющий свести большое количество исходных переменных к значительно ФАКТОРНЫЙ АНАЛИЗ Факторный анализ – метод, позволяющий свести большое количество исходных переменных к значительно меньшему числу факторов, каждый из которых объединяет исходные переменные, имеющие сходный смысл. Факторный анализ дает возможность количественно определить то, что непосредственно измерить невозможно, исходя из нескольких доступных измерению переменных.

ВИДЫ ФАКТОРНОГО АНАЛИЗА • Эксплораторный факторный анализ (разведочный) – создание оптимальной с математической точки ВИДЫ ФАКТОРНОГО АНАЛИЗА • Эксплораторный факторный анализ (разведочный) – создание оптимальной с математической точки зрения группировки переменных в факторы. • Конфирматорный факторный анализ (подтверждающий) – предназначен для проверки гипотез о числе факторов и их нагрузках.

БАЗОВЫЕ ПОНЯТИЯ • Факторизация – процедура извлечения факторов с помощью корреляционной матрицы исходных данных. БАЗОВЫЕ ПОНЯТИЯ • Факторизация – процедура извлечения факторов с помощью корреляционной матрицы исходных данных. • Факторная структура – набор выделенных в результате факторного анализа общих факторов, которые заменяют собой исходные признаки. • Фактор – латентная (скрытая) переменная.

БАЗОВЫЕ ПОНЯТИЯ • Общие факторы - выделяемые при факторном анализе латентные факторы, в той БАЗОВЫЕ ПОНЯТИЯ • Общие факторы - выделяемые при факторном анализе латентные факторы, в той или иной мере воздействующие на все рассматриваемые признаки. • Специфические факторы (невязки, остаточные факторы) - выделяемые при факторном анализе латентные факторы, воздействующие на какой-либо один определенный признак.

БАЗОВЫЕ ПОНЯТИЯ • Факторная нагрузка – коэффициент взаимосвязи между некоторой переменной и общим фактором, БАЗОВЫЕ ПОНЯТИЯ • Факторная нагрузка – коэффициент взаимосвязи между некоторой переменной и общим фактором, выражающий меру влияния фактора на признак. • Факторная матрица – матрица, составленная из координат общих факторов. • Факторный вес – коэффициент факторной матрицы, мера проявления фактора у отдельного объекта.

БАЗОВЫЕ ПОНЯТИЯ • Объясненная дисперсия – часть общей дисперсии, объясняемая с помощью выделенных факторов. БАЗОВЫЕ ПОНЯТИЯ • Объясненная дисперсия – часть общей дисперсии, объясняемая с помощью выделенных факторов. • Собственные значения – собственные значения матрицы, которые находятся для матрицы корреляций между признаками, построенной по нормированной матрице «объект - признак» .

ПРОЦЕДУРА ФАКТОРНОГО АНАЛИЗА 1. Подготовка исходной матрицы данных. 2. Вычисление корреляционной матрицы для всех ПРОЦЕДУРА ФАКТОРНОГО АНАЛИЗА 1. Подготовка исходной матрицы данных. 2. Вычисление корреляционной матрицы для всех переменных, участвующих в анализе. 3. Факторизация (извлечение факторов). 4. Вращение факторов для создания упрощенной структуры. 5. Оценка факторных значений и интерпретация факторов.

МЕТОДЫ ФАКТОРИЗАЦИИ • Метод главных компонент • Метод главных факторов • Метод максимального правдоподобия МЕТОДЫ ФАКТОРИЗАЦИИ • Метод главных компонент • Метод главных факторов • Метод максимального правдоподобия факторов • Каноническая факторизация Рао • Факторизация образов • Альфа-факторизация • Метод наименьших квадратов

ХОРОШАЯ ФАКТОРНАЯ МОДЕЛЬ • Если число найденных главных компонент (факторов) меньше, чем количество исходных ХОРОШАЯ ФАКТОРНАЯ МОДЕЛЬ • Если число найденных главных компонент (факторов) меньше, чем количество исходных переменных в 2 и более раза. • Если объясняемая этими факторами дисперсия не менее 70%, а следующая компонента дает вклад в суммарную дисперсию не более 5%. • Если выделенная факторная структура с содержательной точки зрения является логичной.

ВЫБОР ФАКТОРОВ При выборе значимых факторов следует руководствоваться: 1. целью и задачами исследования, 2. ВЫБОР ФАКТОРОВ При выборе значимых факторов следует руководствоваться: 1. целью и задачами исследования, 2. формальными критериями (критерий Кайзера, критерий «каменистой осыпи» и др. ).

ВРАЩЕНИЕ ФАКТОРОВ Вращение факторов – математическая процедура, позволяющая прояснить содержательный смысл выделенных факторов. ВИДЫ ВРАЩЕНИЕ ФАКТОРОВ Вращение факторов – математическая процедура, позволяющая прояснить содержательный смысл выделенных факторов. ВИДЫ ВРАЩЕНИЯ: • Варимакс • Прямой облимин • Квартимакс • Эквимакс • Промакс

ОЦЕНКА ФАКТОРНЫХ НАГРУЗОК • Нагрузки ≥ 0, 71 (фактор объясняет 50% дисперсии) — превосходные ОЦЕНКА ФАКТОРНЫХ НАГРУЗОК • Нагрузки ≥ 0, 71 (фактор объясняет 50% дисперсии) — превосходные нагрузки. • Нагрузки ≥ 0, 63 (фактор объясняет 40% дисперсии) — очень хорошие нагрузки. • Нагрузки ≥ 0, 55 (фактор объясняет 30% дисперсии) — хорошие нагрузки. • Нагрузки ≥ 0, 45 (фактор объясняет 20% дисперсии) — удовлетворительные нагрузки. • Нагрузки = 0, 32 (фактор объясняет 10% дисперсии) — слабые нагрузки.

ОЦЕНКА ФАКТОРНЫХ ВЕСОВ • Положительные факторные веса степень проявления фактора у объекта «выше средней» ОЦЕНКА ФАКТОРНЫХ ВЕСОВ • Положительные факторные веса степень проявления фактора у объекта «выше средней» . • Факторные веса близкие к нулю – средняя степень проявления фактора у объекта. • Отрицательные факторные веса – степень проявления фактора у объекта «ниже средней» .

УСЛОВИЯ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗА • Считается, что истинными причинами изучаемого явления являются не непосредственно УСЛОВИЯ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗА • Считается, что истинными причинами изучаемого явления являются не непосредственно наблюдаемые и доступные измерению признаки, а скрытые (латентные) факторы, количество которых, как правило, неизвестно исследователю. • Исходные переменные должны быть количественными. • Достаточный объем выборки (n не менее 150 чел. ) Число наблюдений должно быть в два раза больше числа переменных.

УСЛОВИЯ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗА • Выборка должна быть однородна. • Предполагается нормальность распределения исходных УСЛОВИЯ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗА • Выборка должна быть однородна. • Предполагается нормальность распределения исходных переменных. • Исходные переменные должны коррелировать между собой. • В большинстве разновидностей факторного анализа постулируется ортогональность и независимость выявляемых факторов (на практике выполняется не всегда).

ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ ФАКТОРНОГО АНАЛИЗА В отчете необходимо указать: • размерность первичной матрицы; • метод ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ ФАКТОРНОГО АНАЛИЗА В отчете необходимо указать: • размерность первичной матрицы; • метод факторизации и вращения; • количество выделенных факторов и критерий их выделения; • вклад каждого фактора в общую дисперсию и привести матрицу факторных нагрузок.

КЛАСТЕРНЫЙ АНАЛИЗ КЛАСТЕРНЫЙ АНАЛИЗ

КЛАСТЕРНЫЙ АНАЛИЗ Кластерный анализ – это ряд статистических методов, используемых для группировки объектов (наблюдений КЛАСТЕРНЫЙ АНАЛИЗ Кластерный анализ – это ряд статистических методов, используемых для группировки объектов (наблюдений или переменных) в классы (кластеры) на основе сходства их характерных признаков. Это многомерный статистический метод, предназначенный для решения задач классификации, позволяющий описать структуру совокупности объектов и отношений между ними.

КЛАСТЕРНЫЙ АНАЛИЗ Кластер – это группа элементов, характеризуемых общим свойством. Элементы, объединенные в один КЛАСТЕРНЫЙ АНАЛИЗ Кластер – это группа элементов, характеризуемых общим свойством. Элементы, объединенные в один кластер, являются более похожими друг на друга, более близкими по каким-либо характеристикам по сравнению с элементами, образующими другие кластеры.

МЕТОДЫ КЛАСТЕРНОГО АНАЛИЗА • Иерархические методы – первоначально все объекты рассматриваются как отдельные, кластеры. МЕТОДЫ КЛАСТЕРНОГО АНАЛИЗА • Иерархические методы – первоначально все объекты рассматриваются как отдельные, кластеры. Выстраивается «дерево» кластеров путем объединения (или разъединения) первоначально существовавших кластеров. • Итеративные методы – разбиение на кластеры получают из некоторого начального разбиения способом последовательных итераций. Число конечных кластеров исследователь задает самостоятельно.

МЕТОДЫ КЛАСТЕРНОГО АНАЛИЗА • Агломеративные методы – процедура кластеризации начинается с множества одноэлементных кластеров, МЕТОДЫ КЛАСТЕРНОГО АНАЛИЗА • Агломеративные методы – процедура кластеризации начинается с множества одноэлементных кластеров, соответствующих отдельным объектам, а заканчивается получением одного глобального общего кластера. • Дивизивные методы – множество объектов первоначально представляют один кластер, который затем разделяется на некоторое количество кластеров при определенном удовлетворяющем исследователя качестве разделения.

ОСНОВНЫЕ ЭТАПЫ КЛАСТЕРНОГО АНАЛИЗА 1. Подготовка матрицы «объект-признак» . 2. Выбор направления кластеризации. 3. ОСНОВНЫЕ ЭТАПЫ КЛАСТЕРНОГО АНАЛИЗА 1. Подготовка матрицы «объект-признак» . 2. Выбор направления кластеризации. 3. Выбор стратегии (метода) кластеризации – основного принципа разделения выборки на кластеры. 4. Выбор мер сходства или различия между кластерами (способа определения межкластерных расстояний). 5. Формирование кластеров. 6. Проверка результатов кластеризации. 7. Психологическая интерпретация полученных результатов кластеризации.

МЕТОДЫ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ • Межгрупповые связи • Внутригрупповые связи • Ближайший сосед • Дальний МЕТОДЫ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ • Межгрупповые связи • Внутригрупповые связи • Ближайший сосед • Дальний сосед • Центроидная кластеризация • Медианная кластеризация • Метод Варда.

МЕРЫ СХОДСТВА (РАЗЛИЧИЯ) МЕЖДУ КЛАСТЕРАМИ • Квадрат расстояния Евклида • Косинус • Корреляция Пирсона МЕРЫ СХОДСТВА (РАЗЛИЧИЯ) МЕЖДУ КЛАСТЕРАМИ • Квадрат расстояния Евклида • Косинус • Корреляция Пирсона • Расстояние Чебышева • Блок • Расстояние Минковского • Настроенная

ПРОВЕРКА РЕЗУЛЬТАТОВ КЛАСТЕРИЗАЦИИ Необходимо проверить: § не является ли полученное разбиение на кластеры случайным; ПРОВЕРКА РЕЗУЛЬТАТОВ КЛАСТЕРИЗАЦИИ Необходимо проверить: § не является ли полученное разбиение на кластеры случайным; § является ли разбиение надежным и стабильным на подвыборках данных; § существует ли взаимосвязь между результатами кластеризации и переменными, которые не участвовали в процессе кластеризации; § можно ли логически интерпретировать полученные результаты кластеризации.

ПРОЦЕДУРЫ ПРОВЕРКИ КАЧЕСТВА КЛАСТЕРИЗАЦИИ § анализ результатов кластеризации, полученных на определенных выборках набора данных; ПРОЦЕДУРЫ ПРОВЕРКИ КАЧЕСТВА КЛАСТЕРИЗАЦИИ § анализ результатов кластеризации, полученных на определенных выборках набора данных; § проведение кластеризации при изменении порядка наблюдений в наборе данных; § проведение кластеризации при удалении некоторых наблюдений; § проведение кластеризации на небольших выборках; § использование нескольких методов и сравнение полученных результатов.

УСЛОВИЯ ПРИМЕНЕНИЯ КЛАСТЕРНОГО АНАЛИЗА • Исследуемые психологические признаки должны быть количественными. • Распределение признаков УСЛОВИЯ ПРИМЕНЕНИЯ КЛАСТЕРНОГО АНАЛИЗА • Исследуемые психологические признаки должны быть количественными. • Распределение признаков должно быть близко к нормальному. • Показатели не должны коррелировать между собой. • Показатели должны быть устойчивыми, т. е. на их значения не должны оказывать влияние случайные факторы. • Выборка должна быть однородна, не содержать «выбросов» .

ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ КЛАСТЕРНОГО АНАЛИЗА В отчете необходимо указать: • какие данные подвергались кластеризации, направление ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ КЛАСТЕРНОГО АНАЛИЗА В отчете необходимо указать: • какие данные подвергались кластеризации, направление кластеризации; • метод кластеризации; • стратегию кластеризации и способ определения межкластерного расстояния; • результаты в табличном и графическом виде (таблицу шагов агломерации и дерево кластеризации); • количество выделенных кластеров и их состав.