Лекция_5-6_Факторный анализ_new.pptx
- Количество слайдов: 33
Анализ и представление данных психологического исследования Лекция 5. Группировка количественных переменных (Факторный анализ)
Факторный анализ – Совокупность методов, которые на реально существующих связей объектов (признаков) позволяют выявить латентные (неявные) обобщающие характеристики. Совокупность методов, призванная определить, насколько связанные (коррелирующие) переменные могут быть сгруппированы так, чтобы каждую группу можно было рассматривать как одну составную переменную (фактор), а не как ряд отдельных переменных.
Основные цели факторного анализа Сокращение числа переменных (редукция данных) Определение структуры взаимосвязей между переменными (классификация переменных) Косвенные оценки признаков, неподдающихся непосредственному измерению Преобразование исходных переменных к более удобному для интерпретации виду
Латентные переменные
Особенности факторно-аналитического исследования - 1 Необходимо наличие гипотез о латентных факторах, описывающих исследуемую реальность Набор переменных для наблюдения не должен быть случайным (по 5 -6 переменных на фактор) Показатели членов выборки должны покрывать весь спектр возможных значений по наблюдаемым переменным и латентным факторам Данные должны быть собраны на одной и той же выборке в один и тот же момент времени Необходим достаточный объем выборки:
Виды ФА Эксплораторный (разведочный) Цель – группировка связанных переменных. Первичные переменные выбираются без предварительных гипотез о латентных факторах. Используется на ранних этапах исследования. Конфирматорный (подтверждающий гипотезу) Цель – подтверждение уже выстроенной гипотезы о латентных факторах. Первичные переменные тщательно подбираются Используется на более поздних этапах исследования.
Эксплораторный ФА: Процедура обработки Подготовка исходной матрицы данных Вычисление матрицы взаимосвязей признаков Факторизация (выделение факторов) Вращение Подсчёт факторных значений Интерпретация факторов
(1) Подготовка исходной матрицы данных Переменные Наблюдения (объекты)
(2) Вычисление матрицы взаимосвязей признаков Корреляционная матрица Ковариационная матрица Матрица расстояний Если существуют несколько групп переменных, внутри которых коэффициенты корреляции больше по абсолютной величине, чем коэффициенты между переменными из разных групп, то каждая из этих групп детерминирована отдельным фактором.
(3) Выделение факторов По количеству собственных значений матрицы, превышающих 1 На основе анализа точечной диаграммы (график собственных значений, диаграмма «каменистой осыпи» ) В ручную, исходя из представлений исследователя
График собственных значений
(4) Процедура вращения факторов Вращение факторов – процесс поиска наиболее легко интерпретируемого решения для данного количества факторов. Ортогональный поворот Косоугольный поворот
(5) Матрица факторных нагрузок – матрица взаимосвязи между наблюдаемыми переменными и факторами Величина нагрузок отражает степень связи каждой наблюдаемой переменной с каждым фактором и интерпретируется как коэффициент корреляции между ними
(6) Интерпретация полученных факторов после вращения Каждый фактор задан группой первичных переменных Значимость фактора определяется его вкладом в общую дисперсию Если интерпретация невозможна, то ФА должен рассматриваться как неудачный
Особенности факторно-аналитического исследования - 2 Необходим достаточный объем выборки: 50 – очень плохая; 100 – плохая; 200 – средняя; 300 – хорошая Отсутствие нормальности распределения переменных не делает решение плохим В основе ФА лежит предположение о линейности связи между парами наблюдаемых переменных Необходимо отсутствие мультиколлинеаронсти и сингулярности наблюдаемых переменных
Критерии достоверности и надёжности ФА Результаты ФА можно назвать «хорошими» , если выделенная факторная структура с содержательной точки зрения «имеет смысл» , т. е. может быть проинтерпретирована.
Проблемы применения ФА Нет формальных статистических критериев правильности найденного решения Существует бесконечное множество вариантов вращения, дающих разные решения на одних и тех же переменных Часто используется для спасения плохо продуманного исследования, т. к. позволяет из хаотичной информации выстроить упорядоченную концепцию (что создаёт ему сомнительную репутацию)
Реализация эксплораторного ФА в SPSS Analyze – Data Reduction – Factor…
Виды ФА Эксплораторный (разведочный) Цель – группировка связанных переменных. Первичные переменные выбираются без предварительных гипотез о латентных факторах. Используется на ранних этапах исследования. Конфирматорный (подтверждающий гипотезу) Цель – подтверждение уже выстроенной гипотезы о латентных факторах. Первичные переменные тщательно подбираются Используется на более поздних этапах исследования.
Конфирматорный ФА: решаемые задачи – 1 Проверка факторной структуры методики измерения (опросная методика, тест) Проверка гипотезы о структуре сложного, многофакторного конструкта
Конфирматорный ФА: решаемые задачи – 2 Поиск промежуточных переменных (переменныхмедиаторов, переменных-модераторов) r = 0. 8 r = 0. 7
Конфирматорный ФА: решаемые задачи – 3 Сравнение факторных структур для нескольких групп наблюдений Например: совпадает ли факторная структура политических отношений чернокожего населения с аналогичной структурой белого населения?
Конфирматорный ФА: Процедура обработки Формулирование гипотез (число общих факторов, природа связи между факторами, величина факторных нагрузок) Проверка каждой модели на соответствие эмпирическим данным Сравнение моделей между собой и выбор той, которая лучше описывает эмпирические данные
Две гипотетические модели
Две гипотетические модели: путевые диаграммы Однофакторная модель Двухфакторная модель
Показатели согласованность (соответствия эмпирическим данным) Хи-квадрат (отражает различия между корреляционной матрицей исходных данных и корреляционной матрицей, полученной на основе модели) Нулевая гипотеза: модель соответствует эмпирическим данным Если p < о. 05, то нулевую гипотезу нужно отвергнуть
Показатели согласованность (соответствия эмпирическим данным) Среднеквадратичная ошибка приближения (RMSEA) В меньшей степени зависит от размера выборки Значения < 0. 100 считаются показателем хорошего согласия модели с эмпирическими данными
Показатели согласованность (соответствия эмпирическим данным) NFI (normed fit index) CFI (comparative fit index) GFI (goodness-of-fit index) TLI Значения > 0. 900 считаются показателем хорошего согласия модели с эмпирическими данными
Реализация конфирматорного ФА LISREL AMOS EQS Mplus
Представление результатов ФА


