
Причинный анализ и регрессии.pptx
- Количество слайдов: 14
Причинный анализ и регрессии
Причинный анализ Имеет место какое-либо социальное явление, которое характеризуется переменной Х. Оно зависит и причинно обусловлено другими данными социальными явлениями, характеризуемыми другими переменными соответственно У, Z.
Отношения между структурными переменными • • X Y (х обусловливает у) X Y (у обусловливает х) X Y (взаимное воздействие) X – Y (нет связи)
Регрессионный анализ - метод выявления статистической зависимости между исследуемыми переменными. - заключается в определении аналитического выражения связи, в котором изменение одной величины обусловлено влиянием одной или нескольких независимых величин.
Регрессия может быть: • Парной (однофакторной) и множественной (многофакторной). • По форме зависимости – линейной и нелинейной; • По направлению связи: 1. прямая (положительная), возникающая при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются; 2. обратная (отрицательная), проявляющаяся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.
При построении моделей регрессии должны соблюдаться следующие требования: 1. Совокупность исследуемых исходных данных должна быть однородной и описываться непрерывными функциями. 2. Моделируемые явления должны оцениваться одним или несколькими уравнениями причинно-следственных связей. 3. Все признаки должны иметь количественное (цифровое) выражение. 4. Наличие достаточно большого объема исследуемой выборочной совокупности. Обычно считают, что число наблюдений должно быть не менее чем в 5 -6, а лучше – не менее чем в 10 раз больше числа факторов. 5. Отсутствие количественных ограничений на параметры модели связи.
Линейный регрессионный анализ Техника регрессионного анализа, позволяющая выявлять и описывать взаимосвязи в виде линейных функций, называется линейным регрессионным анализом.
Оценка качества линейной регрессии: коэффициент множественной корреляции Коэффициент R является характеристикой общей силы линейной связи между переменными. • Значения коэффициента находятся в интервале от 0 до 1. • Чем ближе значение коэффициента к 1, тем плотнее линейная взаимосвязь, описанная в регрессионной модели. • Должен превышать 0, 5.
Коэффициент множественной детерминации (R-square) - доля общей дисперсии, которая объясняется регрессией и выражается через процентное соотношение. • Позволяет субъективно оценить качество уравнения регрессии. • Разность (100 -R^2) - процент дисперсии, который нельзя объяснить регрессией.
Требования к переменным: • Переменные должны быть измерены в шкале интервалов или отношений (количественные/метрические) • Нормальное распределение переменных • Отсутствие линейных взаимосвязей между переменными, когда одна переменная является линейной производной другой переменной (корреляция больше 0, 8 – bad) • Число варьирующих признаков в сравниваемых переменных должно быть одинаковым
Пример Model Summary Model 1 R , 605 е Adjusted R R Square. 366 Square , 366 Std. Error of the Estimate 587, 685 Durbin-Watson 1, 874 а Predictors - влияющие переменные (константа): расходы на проживание. b Dependent Variable - зависимая переменная: общие расходы на отдых.
Model Sum of Squares 1 Регрессия Остатки Всего 190625404, 593 335012199, 316 528637603, 910 ANOVAb df Mean Square 1 193625404, 6 970 345373, 401 971 F Sig. 560, 625 , 000 a а Predictors - влияющие переменные (константа): расходы на проживание. b Dependent Variable - зависимая переменная: общие расходы на отдых.
Coefficients 8 Unstandardized Coefficients Model B 1 (Constant) Расходы на проживание Std. Error 642, 273 31, 526 1, 596 , 067 Standarc zed Coeffic Hits t Sig. 20, 373 , 000 23, 678 , 000 Beta , 065 а Dependent Variable - зависимая переменная: общие расходы на отдых.