
ОТС 7 Взаимосвязи явлений Часть 1.11.ppt
- Количество слайдов: 25
Статистическое изучение взаимосвязей cоциально-экономических явлений
Для большинства статистических исследований любой сферы деятельности важно выявить существующие взаимосвязи между явлениями и процессами происходящими в обществе. Почти все наблюдаемые явления экономической жизни общества следствие действия определенных факторов. Например, получаемая предприятием прибыль связана с показателями: численностью работников, объемом основных производственных фондов и т. п.
Между общественными и экономическими явлениями существует два основных типа связи — функциональная и стохастическая. Кроме того, выделяют корреляционную связь, которая является частным случаем стохастической связи. Независимыми, или факторными, называют признаки, которые вызывают изменения других, связанных с ними, признаков. Признаки, изменение которых под воздействием определенных факторов требуется проследить, называют зависимыми, или результативными.
При функциональной связи изменение независимых переменных приводит к получению точно определенных значений зависимой переменной. Например, если обозначить через Х независимую переменную, а через Y – зависимую, связь Y=X 3+5 будет функциональной, так каждому значению Х соответствует точно определенное значение Y (при Х=0 значение Y=5, при Х=3 значение Y=14 и т. д. ), причем это значение не обязательно должно быть единственным. Так, функциональная зависимость вида позволит получить не одно, а два значения Y (например, при Х=1 значения Y = 4 и 6). Наиболее часто функциональные связи проявляются при изучении физических явлений, например в механике функциональной является зависимость расстояния, пройденного объектом, от скорости его движения и т. п.
В социально-экономической сфере функциональные зависимости также наблюдаются довольно часто – это плата за кредит, начисляемая на основе установленной процентной ставки; показатель доходности ценной бумаги, находящийся в функциональной зависимости от курса ценной бумаги; показатели рентабельности, фондоемкости и фондоотдачи, функционально зависящие от объема продукции и стоимости основных фондов и т. д.
При стохастической связи каждому значению независимой переменной Х соответствует множество значений зависимой переменной Y, причем неизвестно заранее, какое именно. Например, прибыль коммерческого банка связана с размером уставного капитала. Но нельзя вычислить точную величину прибыли при заданном значении уставного капитала, так как она зависит еще и от множества других факторов, среди которых имеются и случайные, действие которых приводит к статистической зависимости. Таким образом, стохастическая связь отличается от функциональной наличием действия на зависимую переменную большого числа факторов, как выявленных с целью описания зависимости в математической форме, так и случайных, действие которых трудно учесть при построении модели или же учитывать нецелесообразно ввиду их слабого влияния на зависимую переменную.
Корреляционной является связь между признаками, при которой изменение значений факторной переменной Х приводит к закономерному изменению среднего значения результативной переменной Y.
Корреляционная связь, как и функциональная, может быть прямой (положительной) или обратной (отрицательной). Прямая и обратная зависимости характеризуют направление связи между признаками, которую можно проиллюстрировать графически с помощью поля корреляции.
Корреляционный анализ начинается с расчета парных (линейных) коэффициентов корреляции. Парный коэффициент корреляции представляет собой меру линейной зависимости между двумя переменными на фоне действия остальных переменных, входящих в модель. где – среднее арифметическое значение х; – среднее арифметическое значение у; – среднее арифметическое значение из произведений σу – среднеквадратическое отклонение признака у; σх – среднеквадратическое отклонение признака х.
Парный коэффициент корреляции изменяется в пределах от -1 до +1. Абсолютное значение, равное единице, свидетельствует о том, что связь функциональная: -1 – обратная (отрицательная), +1 – прямая (положительная). Нулевое значение коэффициента указывает на отсутствие линейной связи между признаками.
Значение коэффициента корреляции (по модулю)* Качественная характеристика силы связи до 0, 3 Практически отсутствует (слабая) 0, 3– 0, 7 Средняя 0, 7– 0, 9 Высокая 0, 9– 0, 99 Весьма высокая
Расчетная таблица по коэффициенту корреляции № п/п Xi Yi Xi*Yi (Xi-Xср. )^2 (Yi-Yср. )^2 1 2 3 4 5 и т. д. (n) X 1 X 2 X 3 X 4 X 5 Y 1 Y 2 Y 3 Y 4 Y 5 X 1*Y 1 X 2*Y 2 X 3*Y 3 X 4*Y 4 X 5*Y 5 (X 1 -Xср. )^2 (X 2 -Xср. )^2 (X 3 -Xср. )^2 (X 4 -Xср. )^2 (X 5 -Xср. )^2 (Y 1 -Yср. )^2 (Y 2 -Yср. )^2 (Y 3 -Yср. )^2 (Y 4 -Yср. )^2 (Y 5 -Yср. )^2 ∑Xi ∑Yi ∑Xi*Yi ∑(Xi-Xср. )^2 ∑(Yi-Yср. )^2 Xср. Yср. (X*Y)ср. δx^2 δy^2 (дисперсия по Х) (дисперсия по У) δx δy (среднеквадрати ческое отклонение по Х) (среднеквадрати ческое отклонение по У) ∑ среднее
При корреляционной связи точки фактических наблюдений группируются возле некоторой линии или кривой, называемыми линиями регрессии, а описывающие их аналитические выражения – уравнениями регрессии.
Зная уравнение регрессии, можно для любых значений Х, подставляя их в уравнение, приближенно оценить значение зависимой переменной Y. Точность такой оценки будет тем выше, чем теснее группируются точки фактических наблюдений относительно линии регрессии, т. е. точность уравнения регрессии определяется тем, насколько тесной является взаимозависимость признаков Х и Y.
При построении парной регрессии (с одной факторной переменной) обычно используются следующие функции: линейная степенная показательная параболическая гиперболическая логарифмическая
Построение парного линейного уравнения регрессии Если имеется только один факторный признак, строится парная регрессия, выражающаяся уравнением прямой: Коэффициент регрессии а 1 показывает, на какую величину в среднем изменится результативный признак Y, если переменную Х увеличить на единицу ее собственного измерения. Постоянная величина уравнения а 0 характеризует усредненное влияние неучтенных в модели факторов (определяет начальные условия развития).
Параметры уравнения получают путем решения следующей системы нормальных уравнений: Где а 0 и а 1 определяются по следующим формулам: а 1=((X *Y ) - X i i ср. ср* Yср. а 0=Yср. -а 1*Xср. )/δx^2
Расчетная таблица по определению параметров уравнения регрессии и теоретических значений результативной переменной У № п/п Xi Yi Xi*Yi (Xi-Xср. )^2 Yт = а 0 + а 1*Xi Yi - Y т 1 2 3 4 5 и т. д. (n) X 1 X 2 X 3 X 4 X 5 Y 1 Y 2 Y 3 Y 4 Y 5 X 1*Y 1 X 2*Y 2 X 3*Y 3 X 4*Y 4 X 5*Y 5 (X 1 -Xср. )^2 (X 2 -Xср. )^2 (X 3 -Xср. )^2 (X 4 -Xср. )^2 (X 5 -Xср. )^2 Y т1 Y т2 Y т3 Y т4 Y т5 Y 1 – Y т1 Y 2 – Y т2 Y 3 – Y т3 Y 4 – Y т4 Y 5– Yт5 ∑ ∑Xi ∑Yi ∑Xi*Yi ∑(Xi-Xср. )^2 ∑Yт 0 среднее Xср. Yср. (X*Y)ср. δx^2 * * (дисперсия по Х)
Дисперсионный анализ • Правило сложения дисперсии: Добщая=Дфакторная+Достаточная , где Добщ. , Дфакт и Дост. , рассчитываются на основе Уi факт. , Yi теор. и Yсред. по следующим формулам: Добщ= ∑(Уi факт – Yсред)^2/n Дфакт =∑(Уi теор – Yсред)^2/n Дост = ∑(Уi факт – Уi теор )^2/n Если Дфакт > Дост, то уравнение регрессии статистически значимо
Расчетная таблица по определению трех видов дисперсии № п/п 1 2 3 4 5 и т. д. (n) ∑ сред. Yi Yт =a 0+a 1*xi (факт. ) (теор) Y 1 Y 2 Y 3 Y 4 Y 5 Y т1 Y т2 Y т3 Y т4 Y т5 (Y 1 -Yср. )^2 (Y 2 -Yср. )^2 (Y 3 -Yср. )^2 (Y 4 -Yср. )^2 (Y 5 -Yср. )^2 ∑Yi ∑Yт ∑(Yi-Yср. )^2 ∑(Yт-Yср. )^2 Yср. (Yi-Yср. )^2 (Yт – Yср. )^2 (Yi – Yт)^2 Д общ. (Yт1 -Yср. )^2 (Yт2 -Yср. )^2 (Yт3 -Yср. )^2 (Yт4 -Yср. )^2 (Yт5 -Yср. )^2 Д факторная (Y 1 – Yт1)^2 (Y 2 – Yт2)^2 (Y 3 – Yт3)^2 (Y 4 – Yт4)^2 (Y 5– Yт5)^2 ∑(Yi-Yт)^2 Д остаточная
На основе данного правила сложения дисперсии: Добщая=Дфакторная+Достаточная определяем отношение Дфакт к Добщ , которое называют эмпирическим коэффициентом детерминации и обозначают R^2, т. е. R^2= Дфакт/ Добщ R^2 принимает значения от 0 до 1, чем ближе R^2 к 1, тем выше степень влияния факторной переменной на результативную переменную.
Пример Допустим, что R^2=0, 87, то это говорит о том, что изменение результативной переменной Уi на 87% зависит от влияния факторной переменной Хi, включенной в уравнение регрессии и на 13% зависит от влияния других факторов
Если из эмпирического коэффициента детерминации (R^2) извлечь квадратный корень, то получим эмпирическое корреляционное отношение (R), т. е. : R=√ R^2, которое, как и парный коэффициент корреляции (rxy), характеризует тесноту связи между факторной и результативной переменными и также принимает значения от 0 до 1. Чем ближе R к 1(R→ 1) тем теснее взаимосвязь между исследуемыми переменными.
Если R=Irxy. I, то между факторной и результативной переменными существует линейная зависимость, выраженная линейным уравнением регрессии и делается окончательный вывод о наличии линейной связи между исследуемыми переменными. Если R≠Irxy. I, между исследуемыми переменными существует нелинейная связь, которая должна быть выражена через определенные нелинейные виды математической функции в уравнении регрессии.
ОТС 7 Взаимосвязи явлений Часть 1.11.ppt