23 стохастический анализ Я ДОП.ppt
- Количество слайдов: 38
Методика проведения анализа стохастических факторных систем • • • Понятие стохастической связи и задачи корреляционного анализа. Способ парной корреляции. Регрессионный анализ Множественный корреляционнорегрессионный анализ. Анализ временных рядов Вероятностный анализ и его использование в АХД
Понятие стохастической связи Стохастическая (вероятностная, корреляционная) зависимость характеризуется тем, что связи между факторами и результатом их взаимодействия не имеют постоянной формы, а носят случайный вероятностный характер. Выявление формы связи, то есть ее моделирование, осуществляется на основе выборочного наблюдения за последовательностью однородных, повторяющихся явлений путем исчисления средних для данной выборки характеристик. По связи между этими средними судят о характере зависимости в целом.
Способы исследования стохастических связей Для исследования стохастических связей используются стандартные способы статистического анализа: • сравнение, • параллельных и динамических рядов, • аналитические группировки, • графики. Однако они не дают возможности определить влияние каждого фактора на результативный показатель, т. е. провести факторный анализ. Для этой цели используются способы: • корреляционного, • дисперсионного, • компонентного, • многомерного факторного анализа. Наиболее широко используются методы корреляционнорегрессионного анализа. Необходимым условием их применения являетя наличие достаточно большого количества наблюдений о величине исследуемых факторных и результативных показателей (в динамике или за текущий период по совокупности однородных объектов).
Сущность корреляционного анализа Стохастическое исследование связи между показателями происходит с помощью методов корреляционного анализа коэффициентов и отношений корреляции. В переводе с латинского correlatio означает "соотношение, взаимная связь, взаимозависимость. Корреляционная (стохастическая) связь – это неполная, вероятностная зависимость между показателями, которая проявляется только в массе наблюдений. Парная корреляция – связь между двумя показателями, один из которых является факторным, а другой – результативным. Множественная корреляция – взаимодействие нескольких факторов с результативным показателем.
Необходимые условия применения корреляционного анализа • • наличие достаточно большого количества наблюдений о величине исследуемых факторных и результативных показателей (в динамике или за текущий год по совокупности однородных объектов). исследуемые факторы должны иметь количественное измерение и отражение в тех или иных источниках информации
Приемы корреляционного анализа В зависимости от характера исходной информации применяются разные приемы корреляционного анализа: • оценка парной корреляции между показателями с цифровой шкалой измерения; • ранговая корреляция и коэффициенты, рассчитанные по так называемым матрицам сопряженности при анализе связей между качественными показателями; • каноническая корреляция при анализе связи между группами показателей разной размерности; • частная корреляция, позволяющая исследовать связь между двумя показателями путем элиминирования (устранения) искажающего влияния на совместный одинаковый характер изменения (варьирования) двух показателей при общих для них одного или нескольких факторах; • множественная корреляция при оценке зависимости одного результативного показателя от группы факторов-аргументов.
Задачи корреляционного анализа • определить изменение результативного показателя под воздействием одного или нескольких факторов (в абсолютном измерении), то есть определить, на сколько единиц изменяется величина результативного показателя при изменении факторного на единицу; • установить относительную степень зависимости результативного показателя от каждого фактора. Для решения первой задачи подбирается соответствующий тип математического уравнения, которое наилучшим образом отражает характер изучаемой связи. Легче всего определить тип модели используя графический анализ
Способ парной корреляции В случае, если графический анализ показывает зависимость между фактором и результатом, можно использовать корреляционный анализ для оценки степени близости фактических точек разброса к функции того или иного вида
Парная корреляция при линейной зависимости Прямолинейную зависимость характеризует уравнение прямой: Y = a + bx где х – факторный показатель, Y – результативный показатель, a – постоянная величина результативного показателя, которая не связана с изменением данного фактора, b – показывает среднее изменение результативного показателя с повышением или понижением величины фактора на единицу его измерения. При такой связи с изменением факторного показателя на определенную величину результативный показатель равномерно возрастает или убывает. При криволинейной зависимости между изучаемыми явлениями уравнение связи решается по такому же принципу. Уравнение может быть уравнением гиперболы, параболы и т. д. Степень "прямолинейности" можно измерить с помощью Присоновского коффициента корреляции (линейного коэффициент корреляции r). Для линейной функции значение r находится в пределах от +1 до – 1. Этот коэффициент измеряет тесноту связи с линейной зависимостью.
Ранговая корреляция Используется если значения показателей нельзя численно измерить (например, при тестировании кандидатов или абитуриентов). Тогда ряды строят путем ранжирования (определения номера места) показателя в ряду. Далее находятся разницы между парами рангов (d) и коэффициент ранговой корреляции r (коэффициент Спирмена), где n – число значений в ряду.
Проверка линейности связи . В корреляционном анализе установлено, что связь считается тесной при коэффициенте корреляции более 0, 7 и средней, если он находится в пределах от 0, 5 до 0, 7. Коэффициент детерминации (возведенный в квадрат коэффициент корреляции) можно использовать для количественного определения характеристики, связывающей фактор и результат. Например, Если коэффициент детерминации = 0, 64 при расчете зависимости объема реализации от расходов на рекламу, то можно говорить о том, что 64% изменений в объеме реализации связаны с изменением расходов на рекламу.
Проверка линейности связи при анализе небольшого количества данных Коэффициенты корреляции, исчисленные по данным сравнительно небольшой статистической совокупности, могут искажаться под действием случайных причин. Поэтому необходима проверка их сущности. Для оценки значимости r применяется t-критерий Стьюдента. При этом определяется фактическое значение критерия tr и сравнивается с критерием tк, которое берется из справочника
Корреляционный анализ нелинейных связей Для нелинейных зависимостей оценка тесноты связи производится путем исчисления корреляционного отношения, которое можно применять при любой форме зависимости, однако для его исчисления сначала необходимо с помощью регрессионного анализа функцию и рассчитать выровненные значения результативного показателя У(Х). При истолковании получившихся значений необходимо оценивать результат с точки зрения логики. Например, при расчете двух рядов был получен весьма высокий коэффициент корреляции, однако явной причинной зависимости между рядами не наблюдается. Это может быть связано с тем, что оба эти ряда зависят от одной и той же третьей величины (фактора), который при анализе во внимание не принимался.
Регрессионный анализ Определение аналитической формы связи означает, что моделирование значений результативных показателей осуществляется под влиянием факторных показателей. При стохастическом подходе такая задача решается методом регрессионного анализа. Слово "регрессия" (латинское regressio) означает "движение назад". В отличие от корреляционного анализа, при котором выявляются связи, зачастую, между случайными величинами, при регрессионном анализе ставится задача нахождения средней величины случайной переменной в том случае, если величина другой переменной (или других переменных - в зависимости от поставленной задачи) известна. Регрессионный анализ включает в себя три этапа: • построение модели (аналитического уровня) взаимосвязи результативного показателя с взаимодействующими факторами; • решение принятой модели путем нахождения параметров регрессионного управления; • оценка и анализ полученных результатов. Линия регрессии – это линия наилучшего соответствия, проходящая через точки графика разброса.
Регрессия при линейной зависимости Уравнение линии регрессии при линейной зависимости могут быть рассчитаны на основе решения уравнения: y = a + bx по формулам:
Регрессия при параболической зависимости Уравнение линии регрессии при параболической зависимости могут быть рассчитаны на основе решения уравнения: по формулам:
Регрессия при гиперболической зависимости Уравнение линии регрессии при гиперболической зависимости могут быть рассчитаны на основе решения уравнения: по формулам:
Анализ чувствительности методом корреляционно-регрессионного анализа Чувствительность (эластичность) - мера реагирования одной переменной величины на изменение другой, т. е. число, показывающее процентное изменение одной переменной в результате однопроцентного изменения другой переменной. Например: ∆Xp = P/X * ∆X/ ∆P = (∆X/X) / (∆P / P) где ∆Xp – чувствительность (эластичность) показателя Х к изменению цены Р. Показателем Х могут быть: объем продаж в натуральном выражении или дефлированных ценах, себестоимость в дефлированных ценах и т. п. ∆X – абсолютное изменение показателя Х, связанное с изменением средней цены; Р – средняя цена отчетного периода либо темп инфляции. ∆P - абсолютное изменение средней цены.
Пример корреляционно-регрессионного анализа чувствительности год объем продаж (x), шт. индекс цен(y), % 1991 215 150 1992 170 300 1993 160 800 1994 175 500 1995 180 200 Для данного примера индекс цен можно считать независимой величиной, так как она не зависит от других рассматриваемых признаков. Соответственно объем продаж – величина зависимая, так как он зависит от цен на товар. Независимый показатель является факторным (Х), зависимый – результативным (Y).
Пример корреляционно-регрессионного анализа чувствительности год Индекс цен, % x 1991 1995 1992 1994 1993 итого 150 200 300 500 800 1950 -240 -190 -90 110 410 Объем продаж, шт. y 215 180 175 160 900 35 0 -10 -5 -20 tx 57600 36100 8100 12100 168100 282000 1225 0 100 25 400 1750 ty tx * ty -1, 01 -0, 80 -0, 38 0, 46 1, 73 1, 87 0 -0, 53 -0, 27 -1, 07 -1, 89 0 0, 2 -0, 12 -1, 85 -3, 66 Если знаки отклонений совпадают, следовательно, зависимость прямая, если не совпадают ( как в примере) – обратная Коэффициент детерминации r 2 = 0, 54, т. е. изменение результативного показателя на 54% объясняется изменением цены, а остальные 46% - другими неучтенными факторами.
Пример корреляционно-регрессионного анализа чувствительности (продолжение) Уравнение линии регрессии y = a + bx рассчитываем по формулам: Nп/п x y x 2 xy ŷ y- ŷ (y- ŷ)2 1 150 215 22500 32250 193, 83 21, 17 448, 18 2 200 180 40000 36000 190, 95 -10, 95 119, 87 3 300 170 90000 51000 185, 19 -15, 19 230, 62 4 500 175 150000 87500 173, 66 1, 34 1, 79 5 800 160 640000 128000 156, 37 3, 63 13, 15 итого 1950 900 1042500 334750 900 5 а +1950 b =900 1950 a + 1042500 b = 334750 a = 202, 5. и b = 0, 0576 Уравнение регрессии примет вид ŷ = 202, 5+0, 0576 x 813, 61 на его основе рассчитаем теоретические значения объема продаж ŷ и используемих для прогноза
Этапы множественного корреляционнорегрессионного анализа 1. 2. 3. 4. 5. 6. 7. Определяются факторы, которые оказывают воздействие на изучаемый показатель и выбираются наиболее существенные. Собирается и оценивается исходная информация (проверяется на точность, однородность, соответствие нормальному закону распределения). Изучается соответствие закону нормального распределения. Изучается характер и моделируется связь между факторами и результатом Проводится расчет основных показателей связи корреляционного анализа (коэффициентов в функции) Дается статистическая оценка результатов корреляционного анализа, т. е. рассчитываются отклонения фактических значений от рассчитанной по формуле величины. Практическое применение модели для прогнозирования и планирования величины показателя, так и для проведения факторного анализа
Множественный корреляционнорегрессионный анализ (этап 1) Определяются факторы, которые оказывают воздействие на изучаемый показатель и выбираются наиболее существенные. При отборе факторов необходимо выбирать только самые существенные. Факторы, которые критерий надежности по Стьюденту меньше табличного в расчет принимать не рекомендуется. Все выбранные факторы должны быть количественно измеримы и информация о них должна содержаться в учетных документах. Нельзя включать в модель взаимосвязанные факторы, т. е. такие, парный коэффициент корреляции между которыми больше 0, 85.
Множественный корреляционнорегрессионный анализ (этап 2) Собирается и оценивается исходная информация (проверяется на точность, однородность, соответствие нормальному закону распределения). Критерием однородности служат среднеквадратичное отклонение (σ ) и коэффициент вариации (V). Принято считать, что изменчивость вариационного ряда незначительна, если коэффициент вариации до 10%, средняя – 10 -20%, значительная 20 -33%, выше – информация неоднородна, из нее необходимо исключить нетипичные наблюдения, которые бывают в начале и в конце ранжированного ряда наблюдений.
Множественный корреляционнорегрессионный анализ (этап 2) Необходимый объем выборки данных (n) для корреляционного анализа проводят по следующей формуле: где V - вариация, в %, t - показатель надежности связи (определяется по специальным таблицам в зависимости от вероятности отклонения, так для вероятности в 5% он составляет 1, 96), m – показатель точности расчетов в %, которая для экономических расчетов составляет обычно 58%,
Множественный корреляционнорегрессионный анализ (этапы 3 и 4) • Изучается соответствие закону нормального распределения, т. е. масса собранных должна группироваться вокруг среднего значения. • Рассчитываются показатель асимметрии А (он должен быть равен 0, отрицательный - говорит о том, что преобладают значения выше среднего и наоборот) и показатель эксцесса Е (должен быть равен 0, положительное Е – островершинный график, отрицательное - плосковершинный. ) • Изучается характер и моделируется связь между факторами и результатом, т. е. подбирается математическое выражение, наиболее точно отражающее сущность исследуемой зависимости. Для обоснования функции используются те же приемы, что и в однофакторном анализе, однако поскольку процесс более сложен, его проводят обычно на ЭВМ по типовым программам.
Множественный корреляционнорегрессионный анализ (этапы 3 и 4) Временной лаг (t)- промежуток времени, через который проявляется реакция динамической системы на какой-то фактор. Рассчитывая временной лаг, строится взаимокорреляционная функция по времени и выявляется максимальное ее значение, величина переменной, при котором значение взаимокорреляционной функции rxy максимально. Иногда эта функция имеет несколько максимумов. Это говорит о периодичности, цикличности процесса, что также необходимо учитывать при прогнозировании. При прогнозировании используется функция y=f(x+t)
Множественный корреляционнорегрессионный анализ (этапы 5, 6, 7) • Проводится расчет основных показателей связи корреляционного анализа (коэффициентов в функции) • Дается статистическая оценка результатов корреляционного анализа, т. е. рассчитываются отклонения фактических значений от рассчитанной по формуле величины. • Практическое применение модели для прогнозирования и планирования величины показателя, так и для проведения факторного анализа, например: если у=5 х1 + 10 х2, то резерв Δу (Δх1) = 5 * Δх1
Анализ временных рядов Временным рядом назовем последовательность значений одного и того же показателя, измеренного через определенные интервалы времени. Классический пример такого ряда – объемы продаж по месяцам. Этот ряд зависит от спроса, а его анализ позволяет выявить закономерности спроса в течение года Сезонность- устойчивая закономерность внутригодичной динамики того или ингого явления.
Тренд и сезонность Тренд представляет собой общую систематическую линейную или нелинейную компоненту, которая может изменяться во времени. Сезонная составляющая - это периодически повторяющаяся компонента. различие между двумя видами сезонности. Бывает: • аддитивная (флуктуации не зависят от значений ряда Прогнозt=St + It-p ) • мультипликативная (флуктуации не зависят от значений временного ряда Прогнозt = St*It-p) Оба эти вида регулярных компонент часто присутствуют в ряде одновременно Для выявления тренда и сезонности используют сглаживание (экспоненциальное, скользящей средней, ниаменьших квадратов)) и корреляционный анализ. По выровненному ряду определяют вид тренда, методами корреляционного анализа рассчитывают уравнение, характеризующее тренд. Средние по нескольким годам для данного периода процентные отклонения фактических занных от тренда отражают сезонные составляющие.
Выравнивание временных рядов методом скользещей средней Сглаживание - способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друга. Скользящее среднее - метод, в котором каждый член ряда заменяется простым или взвешенным средним n соседних членов, где n - ширина "окна". Вместо среднего можно использовать медиану значений, попавших в окно. В этом случае результаты становятся более устойчивыми к выбросам имеющимся внутри окна (связанные, например, с ошибками измерений).
Выравнивание временных рядов методом скользещей средней (пример) годы Месяцы Итого за год 1 2 3 4 5 6 7 8 9 10 11 12 2000 1483 2496 7173 12634 12855 10960 6913 4646 2189 1927 1116 1125 65517 2001 1536 2799 4184 11690 10086 8362 6456 3626 1771 1155 1150 835 53650 2002 973 1373 2878 7554 14055 8456 5111 3596 1642 1204 384 535 47761 2003 1460 1102 3267 6586 10686 9577 5902 2814 1044 600 349 535 43922 Члены ряда в % к соответствующим звеньям скользящей средней 2000 2001 2002 2003 Сезонная волна (ндекс сезонности) Январь — 4 695 4 134 3 795 - 32, 7 23, 5 38, 5 31, 6 Февраль 3 717 4 633 4 077 3 796 67, 1 60, 4 33, 7 29, 0 47, 6 Март 7 528 4 574 4 070 3 738 95, 3 91, 5 70, 7 87, 4 86, 2 Апрель 7 931 4 524 4 067 3 688 159, 3 258, 4 185, 7 178, 6 195, 5 Май 6 928 4 494 4 037 3 661 200, 0 224, 5 348, 2 291, 8 266, 2 Июнь 5 945 4 483 3 993 3 660 184, 4 186, 5 211, 8 261, 7 211, 1 Июль 5 545 4 447 4 000 3 860 124, 7 145, 2 127, 8 152, 9 137, 7 Август 5 560 4 365 4 009 4 233 83, 6 83, 1 89, 7 66, 5 80, 7 Сентябрь 5 448 4 250 4 014 2 974 40, 2 41, 7 40, 9 35, 1 39, 5 Октябрь 5 284 4 024 3 990 1 068 36, 5 28, 7 30, 2 56, 2 37, 9 Ноябрь 5 088 4 017 3 809 495 21, 9 28, 6 10, 1 70, 6 32, 8 Декабрь 4 823 4 186 3 716 - 23, 3 20, 0 14, 4 — 19, 2 Звенья скользящей средней Месяцы
Вероятностный анализ (основные теримины) Риск – вероятность наступления события Вероятность = 0 - невозможность наступления конкретного события; Вероятность = 1 - непременное наступление события. Сумма вероятностей всех возможных вариантов равна единице. Альтернатива - это последовательность действий, направленных на решение некоторой проблемы (приобретать или не приобретать новое оборудование) Состояние среды - ситуация, на которую лицо, принимающее решение, не может оказывать влияние (например, благоприятный или неблагоприятный рынок, климатические условия и т. д. ). Исходы (возможные события) возникают в случае, когда альтернатива реализуется в определенном состоянии среды. Это некая количественная оценка, показывающая последствия определенной альтернативы при определенном состоянии среды (например, величина прибыли, величина урожая и т. д. ).
Методы оценки вероятности • объективный метод основан на вычислении частоты, с которой происходят некоторые события; • субъективная вероятность является предположением относительно определенного результата, основывающемся на суждении или личном опыте оценивающего
Модели принятия решений: • принятие решений в условиях определенности - лицо, принимающее решение (ЛПР) точно знает последствия и исходы любой альтернативы или выбора решения. • принятие решений в условиях риска - ЛПР знает вероятности наступления исходов или последствий для каждого решения. • принятие решения в условиях неопределенности - ЛПР не знает вероятностей наступления исходов для каждого решения.
Анализ в условиях определенности Используются детерминированные факторные модели для прогноза результата тех или иных возможных действий. Например: П=Д-Р, Д=Ц*К, Р=Рпер*К+Рпост К 0=100, Ц 0=200, Рпер0=20, Рпост0=10000, тогда П 0=100*200 -20*100 -10000=8000 Если К увеличить на 10%, тогда К 1=110, П 1=200*110 -20*110 -10000=9800
Анализ в условиях риска ЛПР знает (может оценить) вероятности наступления исходов или последствий для каждого решения. Рассчитывается математическое ожидание (среднее ожидаемое значение) - средневзвешенное всех возможных результатов, где в качестве весов используются вероятности их достижения. Далее используются методы корреляционного анализа. Дисперсия - средневзвешенное квадратов отклонений случайной величины от ее математического ожидания (т. е. отклонений действительных результатов от ожидаемых) - мера разброса. Квадратный корень из дисперсии называется стандартным отклонением. Обе характеристики являются абсолютной мерой вероятности наступления события. Коэффициент вариации - служит относительной мерой вероятности наступления события. Коэффициент корреляции - показывает связь между переменными, состоящую в изменении средней величины одного из них в зависимости от изменения другого
Анализ в условиях неопределенности Если имеет место неопределенность (т. е. существует возможность отклонения будущего от его ожидаемого состояния, но невозможно даже приблизительно указать вероятности наступления каждого возможного результата), то выбор альтернативы может быть произведен на основе одного из трех критериев: • Критерий MAXIMAX (критерий оптимизма) - определяет альтернативу, которая максимизирует максимальный результат для каждой альтернативы. • Критерий MAXIMIN (критерий пессимизма) - определяет альтернативу, которая максимизирует минимальный результат для каждой альтернативы. • Критерий БЕЗРАЗЛИЧИЯ - выявляет альтернативу с максимальным средним результатом (при этом действует негласное предположение, что каждое из возможных состояний среды может наступить с равной вероятностью; в результате выбирается альтернатива, дающая максимальную величину математического ожидания). Соответственно, по своему отношению к неопределенности люди подразделяются на пессимистов, оптимистов и нейтральных к неопределенности.


