Primer.ppt
- Количество слайдов: 19
Элементы теории корреляции Изучение разнообразных явлений сопровождается выяснением закономерностей, которым подчиняются характерные для данных явлений количественные соотношения или связи. При этом оказывается, что только для тех явлений, происхождение которых связывается с чётко учтёнными факторами, количественные соотношения или связи имеют вполне точный и определённый характер. В этом случае говорят, что количественные соотношения или связаны функциональной зависимостью. Статистической называют зависимость, при которой изменение одной из величин влечёт изменение распределения другой. . Корреляционная зависимость – это статистическая зависимость, которая проявляется в том, что при изменении одной из величин изменяется среднее значение другой.
Результаты эксперимента, данные наблюдений дают совокупность значений между переменными величинами в виде таблицы. Требуется выразить эту зависимость между переменными аналитически, т. е. в виде формулы. Такая формула очень облегчает анализ изучаемой зависимости. Формулы, служащие для аналитического представления опытных данных, принято называть эмпирическими формулами вида. Вид функции выбирается таким образом, чтобы график этой функции по возможности близко напоминал расположение на графике данных наблюдений. Покажем, как практически подбираются по способу наименьших квадратов коэффициенты для функции простейшего вида
. Пусть изучается система количественных признаков . В результате независимых опытов получены пар чисел Найдём по данным наблюдений выборочное уравнение прямой линии регрессии Y на X: . Угловой коэффициент прямой линии регрессии Y на X называют выборочным коэффициентом регрессии Y на X и обозначают (1 ) Подберём параметры и так, чтобы точки , построенные по данным наблюдений, на плоскости лежали как можно ближе к прямой (1). Уточним смысл этого требования. Назовём отклонением разность , где - вычисленная по уравнению (1) ордината, соответствующая наблюдаемому значению ; - наблюдаемая ордината, соответствующая .
Подберём параметры и так, чтобы сумма квадратов отклонений была минимальной. Так каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция этих параметров Для отыскания минимума приравняем нулю соответствующие частные производные: (2) Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно и : (3)
Решив эту систему, найдём искомые параметры: (4) (5)
Корреляционная таблица При большом числе наблюдений одно и то же значение может встретиться раз, одно и то же значение - раз, одна и та же пара чисел может наблюдаться раз. Поэтому данные наблюдений группируют, т. е. подсчитывают частоты , . Все сгруппированные данные записывают в виде таблицы, которая называется корреляционной. Y 0, 4 0, 6 0, 8 X 10 5 3 8 20 2 19 21 30 7 6 13 40 14 4 18 26 12 22
Отыскание параметров выборочного уравнения прямой линии регрессии по сгруппированным данным Для определения параметров уравнения прямой линии регрессии Y на X была получена система уравнений (3) (3 a) =
Из второго уравнения найдём , предварительно сократив на , и подставим в уравнение , получим Для определения второе уравнение умножим на и вычтем из первого: Учитывая, что , получим . Умножим обе части равенства на дробь : (6)
. , Обозначим правую часть данного равенства через получим Подставив значение в уравнение , получим окончательное выборочное уравнение прямой линии регрессии Y на X: - выборочный коэффициент корреляции .
Методика вычисления выборочного коэффициента корреляции Найти выборочное уравнение прямой линии регрессии Y на X по данным, приведённым в корреляционной таблице
При определении выборочного уравнения прямой линии регрессии основная задача сводится к определению . Для упрощения расчётов на практике переходят к условным вариантам Составим корреляционную таблицу в условных вариантах, выбрав в качестве ложных нулей С 1=30 и С 2=36.
В этом случае выборочный коэффициент корреляции вычисляют по формуле (при этом величина не изменится) Величины можно найти методом произведений или вычислить непосредственно исходя из определений этих величин: Для определения найдём предварительно и :
Остаётся указать способ вычисления , где - частота пары условных вариант . Можно доказать, что справедливы формулы: Для контроля целесообразно выполнить расчёты по обеим формулам и сравнить результаты; их совпадение свидетельствует о правильности вычислений.
В каждой клетке, в которой частота , записывают в правом верхнем углу произведение частоты на варианту . Например, в правых верхних углах клеток первой строки записаны произведения:
Складывают все числа, помещённые в правых верхних углах клеток одной строки и их сумму записывают в клетку этой же строки столбца . Например, для первой строки
Умножают варианту на и полученное произведение записывают в последнюю клетку той же строки . Например, в первой строке таблицы следовательно .
Сложив все числа столбца , получают сумму , которая равна искомой сумме . Например, в нашем случае , следовательно
, Для контроля аналогичные вычисления производят по столбцам: . произведения записывают в левый нижний угол клетки, содержащей частоту ; все числа, помещённые в левых нижних углах клеток одного столбца, складывают и их сумму записывают в строке V; далее умножают каждую варианту на V и результат записывают в клетках последней строки. Сложив все числа последней строки, получают сумму , которая также равна Найдём выборочный коэффициент корреляции:
Найдём шаги
Primer.ppt