Факторный анализ.ppt
- Количество слайдов: 31
Факторный анализ
• Модели факторного анализа имеют самую долгую историю : истоки восходят к трудам Ф. Гальтона (1822 -1918). • Первая работа, посвященная методу главных компонент - работа Пирсона (1901), • большой вклад внесли Ч. Спирмен(1927, 1946) при разработке теста на интеллект, Л. Терстоун(1947, 1951), Р. Кеттел (1947, 1951) и Г. Айзенк при разработке теории личности.
• Входными данными в методы факторного анализа является корреляционная или ковариационная матрицы. • Условие экономии: количество факторов должно быть не больше, чем количество наблюдаемых переменных, т. е. соотношения между n наблюдаемыми переменными должны объясняться возможно меньшим числом латентных факторов.
• Первый принцип, лежащий в основе классической модели ФА - постулат о линейной зависимости между наблюдаемыми характеристиками; • Второй - наблюдаемые переменные могут быть представлены как линейная комбинация некоторых латентных факторов.
Модель компонентного анализа • - наблюдаемые значения параметра j- го параметра у i-го объекта • - значение общего фактора Fj для объекта i • - нагрузка j-го параметра на p- й фактор • - отражает степень влияния фактора p
Модель факторного анализа • Общие факторы учитывают корреляцию между параметрами • Характеристические – остаточную дисперсию.
• Обобщенную математическую модель ФА в матричном виде можно представить: • K= AΦAт + L 2 • где A- матрица нагрузок, • K- корреляционная матрица • L 2 - матрица ошибок • Φ - единичная матрица факторов
Модель метода главных компонент • • • K- L 2 = AAт = VCVт где A- матрица нагрузок, K- корреляционная матрица L 2 - матрица ошибок C - диагональная матрица собственных значений V – матрица собственных векторов
Модель факторного анализа в виде дисперсий • Характерность состоит из специфических факторов и ошибки модели
Полнота факторизации Если Сj = 100, то это означает, что нет специфичности
Основные этапы ФА • 1. сбор эмпирических данных и подготовка корреляционной (ковариационной) матрицы, • 2. выделение первоначальных (ортогональных) факторов, • 3. вращение факторной структуры и содержательная интерпретация результатов ФА.
• Второй этап - это прежде всего выбор метода ФА. Перечислим некоторые, наиболее используемые в психологии : • Метод главных компонент, его модель имеет вид • K- L 2 = AAт = VCVт • где V- матрица собственных векторов, C- диагональная матрица собственных значений. • Т. е. в данном методе решение ищется в виде собственных векторов (факторы), а собственные значение характеризуют дисперсию (разброс) по факторам. • Метод главных факторов Для определения числа факторов используются различные статистические критерии, при помощи которых проверяется гипотеза о незначительности матрицы корреляционных остатков.
• Метод максимального правдоподобия (Лоули) в отличии от предыдущего основывается не на предварительной оценке общностей, а на априорном определении числа общих факторов и в случае большой выборки позволяет получить статистический критерий значимости полученного факторного решения. • Метод минимальных остатков (Харман) основан на минимизации внедиагональных элементов остаточной корреляционной матрицы, проводится предварительный выбор числа факторов. • Альфа-факторный анализ был разработан специально для анализа психологических данных, выводы носят в основном психометрический, а не статистический характер, минимальное количество общих факторов оценивается по собственным значениям и коэффициентам общности.
• Факторизация образов в отличие от классического ФА предполагает, что общность каждой переменной определяется как линейная регрессия всех остальных переменных. • Как видно из краткого описания, методы отличаются в основном по способу поиска решения основного уравнения ФА. Выбор метода требует большого опыта работы, однако некоторые исследователи используют несколько методов и выделенные во всех методах факторы и считают наиболее устойчивыми.
• Третий этап - это поворот факторов в пространстве для достижения простой структуры. Простая структура - это структура, в которой каждая переменная характеризуется преобладающим влиянием некоторого одного фактора. • Выделяются два класса вращения: ортогональное и косоугольное. • К ортогональным методам относятся методы varymax (Kaiser, 1958) - максимизируется разброс квадратов факторных нагрузок по каждому фактору в отдельности, что приводит к увеличению больших нагрузок и уменьшению маленьких. • Quartymax - простая структура в отличии от предыдущего метода получается для всех факторов одновременно. В некоторых случаях важнее получить простую структуру, чем сохранить ортогональность факторов, для достижения этого используются аналогичные методы косоугольного поворота: oblymin и oblymax.
• Выбор поворота ортогональной матрицы должен производиться в соответствии с некоторыми принципами или в соответствии в некоторой моделью. Можно придумать множество математических моделей. Более важно использовать те, который в основании имеют принципы в рамках конкретной науки. • Критерий 1 - вращение осуществляется до тех пор, пока по первому фактору не будет достигнуто максимальное разъединение соответствующих групп. (подобно дискриминантной функции). • Критерий 2 – путем вращения добиваются наилучшего предсказания одного множества через другое при отсутствии ограничений на дисперсии факторов.
• В основе многих методов поворота лежит простая структура (около 95% факторных исследований в психологии приводятся к окончательному решению с помощью приведения к простой структуре.
• Принципы простой структуры Терстоуна: • 1. каждому фактору соответствует большое количество нулевых нагрузок • 2. на каждую переменную оказывают влияние лишь немногие факторы. • Принцип Кэттела требует выполнения 1, но требует выполнения 2. • Более формально принципы можно сформулировать: • 1. в каждой строке должен быть хотя бы один ноль • 2. В каждом столбце факторное структуры должно по крайне мере r нулей (r- число общих факторов) • 3. для каждой пары столбцов можно найти по крайней мере параметров (эмп. Признаков), для которых элементы факторной структуры =0 в одном из двух столбцов и не равны 0 – в другом.
• Метод синтеза Такера • Предполагает двукратное проведения факторного анализа с одними и теми же переменными, но различных выборках. В основе лежит предположение, что фактор должен оказывать влияние в обоих выборках, хотя дисперсия может отличаться. Тогда, если совершить единственно правильный поворот, то факторные оси, полученные по обеим выборкам, будут параллельны, а факторные нагрузки – пропорциональны.
• Принцип конфакторного вращения Кеттела • Цель – получение наибольшей близости факторных структур, соответствующих разным исследованиям, а не в достижении пропорциональности. (хорошо работает с ортогональными факторами). Это метод совместного вращения. .
• • Программы вращения: аналитические топологические 2. Топологичсекие – определение некоторых пространств и геометрического представления данных в них и в максимизации количества точек, попадающих в некоторое подпространство. • 1. . Аналитические- действие основано на максимизации или минимизации некоторой математической функции от нагрузок всех переменных.
Методы факторного анализа • 1. Principal components – метод главных факторов • 2. Principal factor analysis – метод главных факторов • 3. Iterated communalities (MINRES)- метод минимальных остатков • 4. Maximum likelihood factors – метод максимального правдоподобия • 5. Centroid method – центроидный метод • 6. Principal axis method- метод главных компонент
Методы ортогонального поворота • 1. Varymax – максимизируется разброс квадратов факторных нагрузок по каждому фактору. Обеспечивает лучшее разбиение факторов за счет уменьшения числа переменных, связанных с каждым фактором. • 2. Quarnimax – максимизируется сумма квадратов факторных нагрузок одновременно по всем факторам. Имеет тенденцию к выделению генерального фактора, упрощающего интерпретацию за счет уменьшения числа факторов, связанных с каждой перменной. • Косоугольный поворот • Hierarchical analysis of oblique factors – метод, реализующий не ортогональное вращение, в результате которого достигается более простая структура
d Resp lab wtg goal mot d 0, 61 -0, 59 -0, 66 -0, 55 -0, 62 -0, 43 Resp -0, 59 0, 58 0, 65 0, 53 0, 6 0, 42 lab -0, 66 0, 65 0, 72 0, 59 0, 67 0, 47 wtg -0, 55 0, 53 0, 59 0, 49 0, 53 0, 38 goal -0, 62 0, 67 0, 5 0, 62 0, 43 mot -0, 43 0, 42 0, 47 0, 38 0, 43 0, 3
Корреляционная матрица 0, 36 0, 25 -0, 07 0, 23 -0, 17 0, 04 0, 25 0, 40 -0, 05 0, 17 -0, 12 0, 07 -0, 05 0, 02 -0, 03 0, 04 -0, 02 0, 23 0, 17 -0, 03 0, 27 -0, 15 0, 06 -0, 17 -0, 12 0, 04 -0, 15 0, 36 -0, 04 0, 07 -0, 02 0, 06 -0, 04 0, 09
Остаточная матрица d Resp lab wtg goal mot d 0, 39 0, 22 0, 01 0, 33 -0, 09 Resp 0, 22 0, 42 -0, 22 0 -0, 26 lab 0, 01 -0, 22 0, 28 0, 2 0, 15 -0, 42 wtg 0, 33 0 0, 21 0, 51 -0, 03 -0, 34 goal -0, 09 -0, 26 0, 15 0 0, 38 -0, 28 mot -0, 09 0, 26 -0, 42 -0, 34 -0, 28 0, 7
Факторы Factor 1 Factor 2 1 -0, 78 0, 19 2 0, 76 -0, 36 3 0, 85 0, 48 4 0, 69 0, 52 5 0, 79 0, 35 6 0, 55 -0, 77
Матрица нагрузок до поворота
Пространство факторов до поворота
Матрица нагрузок после поворота Factor 1 Factor 2 d -0, 564198 -0, 569049 Resp 0, 340121 0, 779228 lab 0, 977936 0, 130739 wtg 0, 811558 0, 074284 goal 0, 854358 0, 211390 mot -0, 071275 0, 976824 Expl. Var 2, 783995 1, 952494 Prp. Totl 0, 463999 0, 325416
Пространство факторов после поворота