Тема 8. СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА СВЯЗЕЙ




























Тема 8. Корреляция.ppt
- Количество слайдов: 28
Тема 8. СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА СВЯЗЕЙ
1. Виды связей между признаками явлений В статистике различают функциональную и стохастическую зависимости. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Функциональные связи между признаками изучаются в экономике посредством индексного метода. При стохастической связи каждому отдельному значению факторного признака х отвечает определенное множество значений результативного признака у. 2 Тема 8. Статистические методы анализа связей
Корреляционная связь между признаками х и у записывается в виде уравнения корреляционной связи, или уравнения регрессии: Y=f(х), где f (х) — определенный вид функции корреляционной связи, которая описывает линию регрессии. 3 Тема 8. Статистические методы анализа связей
Связи между явлениями и их признаками классифицируются по степени тесноты, направлению и аналитическому выражению. По степени тесноты связи различают (табл. 2): Таблица 2 Количественные критерии оценки тесноты связи 4 Тема 8. Статистические методы анализа связей
Для выявления наличия связи, ее характера и направления в статистике используются методы: l приведения параллельных данных, l графический; l аналитических группировок; l корреляции, l регресии. 5 Тема 8. Статистические методы анализа связей
2. Парная корреляция Рис. 1. Основные типы корреляции 6 Тема 8. Статистические методы анализа связей
В случае линейной связи ее теснота измеряется с помощью коэффициента парной корреляции и детерминации: Коэффициент детерминации = r 2. Коэффициент детерминации может быть выражен в процентах. 7 Тема 8. Статистические методы анализа связей
Оценка линейного коэффициента корреляции 8 Тема 8. Статистические методы анализа связей
3. Парная регрессия Наиболее часто для характеристики корреляционной связи между признаками применяют такие виды уравнений парной регрессии, или корреляционных уравнений: а) линейный (8. 2) б) параболический (8. 3) в) гиперболический (8. 4) г) степенной (8. 5) и др. где а 0 , а 1 — параметры уравнений регрессии, которые подлежат определению. 9 Тема 8. Статистические методы анализа связей
4. Частная и множественная корреляция Тема 8. Статистические методы анализа связей 10
Коэффициенты парной корреляции называются коэффициентами нулевого порядка. На их основе можно рассчитать коэффициенты частной корреляции первого порядка, когда элиминируется корреляция с одной переменной. Например: 11 Тема 8. Статистические методы анализа связей
12 Тема 8. Статистические методы анализа связей
Коэффициент частной детерминации переменной xk – это доля дисперсии у, дополнительно объясняемой при включении переменной хк, в величине дисперсии у, не объясненной ранее включенными в анализ переменными. 13 Тема 8. Статистические методы анализа связей
Коэффициент множественной детерминации показывает, в какой мере вариация результативного признака у определяется вариацией факторного признака х. Коэффициент детерминации принимает значение от 0 до 1. 14 Тема 8. Статистические методы анализа связей
Множественный коэффициент корреляции для двух факторных признаков вычисляется по формуле где ryx 1 — парные коэффициенты корреляции между признаками. ИЛИ Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: 0 ≤ R ≤ 1. 15 Тема 8. Статистические методы анализа связей
5. Множественная (многофакторная) регрессия Построение моделей множественной регрессии включает несколько этапов: 1. Выбор формы связи (уравнения регрессии). 2. Отбор факторных признаков. 3. Обеспечение достаточного объема совокупности. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. 16 Тема 8. Статистические методы анализа связей
пять типов моделей: 1) линейная: 2) степенная: 3) показательная: 4) параболическая: 5) гиперболическая: 17 Тема 8. Статистические методы анализа связей
Оценка и проверка качества модели После установления тесноты связи дают оценку значимости связи между признаками. Под термином «значимость связи» понимают оценку отклонения выборочных переменных от своих значений в генеральной совокупности посредством статистических критериев. Оценку значимости связи осуществляют с использованием F -критерия Фишера и t-критерия Стьюдента. Для парной регрессии (линейной и нелинейной) F - критерий Фишера рассчитывается по формуле: где [1, n -2] – число степеней свободы числителя и знаменателя зависимости. 18 Тема 8. Статистические методы анализа связей
Под термином «степень свободы» понимают целое число, которое показывает, сколько независимых элементов информации в переменных у нужно для суммы их квадратов, что объясняет соответствующую дисперсию: общую (σ 2 ) межгрупповую (δ 2), среднюю из групповых . Теоретическое значение F сравнивают с табличным (критическим) значением F табл. Последнее выбирают из справочных математических таблиц F- критерия Фишера в зависимости от степеней свободы 1, (п - 2) и принятого уровня значимости ά(альфа). Если F > Fтабл, то выборочная совокупность и связь между признаками является значимой. 19 Тема 8. Статистические методы анализа связей
Для парной линейной регрессии при r = R расчетные значения t - критерия Стьюдента вычисляются по формуле: где (п-2) — число степеней свободы. Для n <50 Где дисперсия коэффициента регрессии Для n>100 Критерий Стьюдента по данной формуле дает оценку значимости коэффициента корреляции R и 20 существенности связи Тема 8. Статистические методы анализа связей
Параметр модели признается статистически значимым, если tp >tkp (ά; n=n-k-1) где ά - уровень значимости критерия проверки гипотезы о равенстве нулю параметров, измеряющих связь, т. е. статистическая существенность связи утверждается при отклонении нулевой гипотезы об отсутствии связи; n = n - k - 1 - число степеней свободы, которое характеризует число свободно варьирующих элементов совокупности. n – число наблюдений k – число факторных признаков. 21 Тема 8. Статистические методы анализа связей
Таблица Вычисление коэффициентов ассоциации и контингенции Коэффициенты вычисляются по формулам: ассоциации и контингенции Коэффициент контингенции всегда меньше коэффициента ассоциации. 22 Тема 8. Статистические методы анализа связей
Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициентов взаимной сопряженности Пирсона-Чупрова. Эти коэффициенты вычисляются по следующим формулам: где φ2 — показатель взаимной сопряженности; φ — определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот, соответствующего столбца и строки. Вычитая из этой суммы « 1» , получим величину φ 2: К 1 - число значений (групп) первого признака; K 2 - число значений (групп) второго признака. 23 Чем 8. Статистические методы анализа и Кч к 1, тем теснее связь. Тема ближе величина Кп связей
Таблица Вспомогательная таблица для расчета коэффициента взаимной сопряженности 24 Тема 8. Статистические методы анализа связей
Ранговые коэффициенты связи Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена (ρ xy ) и Кендалла (τxy). Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками. 25 Тема 8. Статистические методы анализа связей
Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается по формуле где di 2 (Rxj – Ryj)- квадраты разности рангов; п — количество единиц в ряду. Коэффициент Спирмена принимает любые значения в интервале -1; 1. Если di=0 p=1 –существует тесная прямая связь. Если первому рангу по размеру одного признака соответствует последний ранг по размеру второго признака, второму рангу – предпоследний ранг второго признака и т. п. , то p = - 1 , и существует тесная обратная связь. Если значение p близко к 0, то связь слабая или ее вообще нет. 26 Тема 8. Статистические методы анализа связей
Ранговый коэффициент корреляции Кендалла (τ xy ) также может использоваться для измерения взаимосвязи между качественными и количественными признаками, характеризующими однородные объекты и ранжированные по одному принципу. Расчет рангового коэффициента Кендалла осуществляется по формуле п - число наблюдений; 2 S — сумма разностей между числом последовательностей и числом инверсий по второму признаку. 27 Тема 8. Статистические методы анализа связей
Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции (коэффициент конкордации) W , который вычисляется по формуле где т — количество факторов; п — число наблюдений; S — отклонение суммы квадратов рангов от средней квадратов рангов. 28 Тема 8. Статистические методы анализа связей

