
Временные ряды.pptx
- Количество слайдов: 78
ВРЕМЕННЫЕ РЯДЫ
СТРУКТУРА И ОСОБЕННОСТИ ВРЕМЕННЫХ РЯДОВ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ Динамика финансово-экономических показателей обычно отражается динамическими и временными рядами.
СТРУКТУРА И ОСОБЕННОСТИ ВРЕМЕННЫХ РЯДОВ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ Динамические ряды – упорядоченная совокупность последовательных наблюдений одного показателя y в зависимости от последовательно возрастающих или убывающих значений другого показателя x.
СТРУКТУРА И ОСОБЕННОСТИ ВРЕМЕННЫХ РЯДОВ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ Временные ряды – динамические ряды, у которых в качестве признака упорядочения выбрано время t.
ОПРЕДЕЛЕНИЕ Последовательность наблюдений одного показателя (признака), упорядоченная относительно последовательно возрастающих или убывающих значений другого показателя (признака) является одномерным рядом динамики Если признаком, по которому осуществляется упорядочивание ряда, является время, то такой динамический ряд носит название временного ряда
ПРЕДСТАВЛЕНИЕ ВРЕМЕННОГО РЯДА Табличная форма: Графическая форма: Векторная форма: yt = {y 1, y 2, … , yn}, или y(t), где n – количество членов ряда (t = 1, 2, …, n); длина ряда – время от начального наблюдения y 1 до последнего yn t 1 2 … N yt y 1 y 2 … yn
ЦЕНА НА НЕФТЬ, ЛОНДОН
ИМПОРТ НЕФТИ В США
EUR/USD
Всякий временной ряд состоит из отдельных уровней Уровни ряда – отдельные его значения, характеризующие изменение показателя во времени
ВЕЛИЧИНЫ ИЗМЕРЕНИЯ ВРЕМЕННЫХ РЯДОВ Абсолютные (размер прибыли, издержек) Относительные (объем производства продукции на душу населения) Средние за некоторый период (среднесуточная выработка продукции) Индексные (индексы роста накопленного дохода)
ВРЕМЕННЫЕ РЯДЫ БЫВАЮТ Моментными (характеризуют экономические явления на конкретный момент времени) 0 Интервальными t 1 t 2 t 3 … t (когда данные временного ряда образованы путем агрегирования за определенный промежуток времени) 0 t 1 t 2 t 3 . . . t
ВРЕМЕННЫЕ РЯДЫ БЫВАЮТ Стационарными (свойства стационарного ряда не из меняются во времени: постоянные среднее значение и дисперсия, автокорреляционная функция – функция одного аргумента – промежутка между двумя моментами времени, независимо от того, где во времени данный промежуток расположен) Нестационарными (показатели изменяются во времени)
ПРИМЕРЫ СТАЦИОНАРНЫХ РЯДОВ Стационарность около ненулевой константы Стационарность около нулевой константы Тренд-стационарность
СТРУКТУРА ВРЕМЕННЫХ РЯДОВ Динамика ВР формируется под влиянием 4 -х групп факторов: Долговременных (трендовых): Qt = f(t); Сезонных: St = (t); Циклических: Zt = (t); Случайных (нерегулярных): Ut = (t).
Тренд, Qt – устойчивое, систематическое изменение процесса на протяжении продолжительного периода Сезонные колебания, St – строго периодические колебания, которые наблюдаются на протяжении одного времененого периода, например, года
Долговременные циклические колебания, Zt – когда период колебаний составляет несколько временных периодов (лет) Случайная составляющая, Ut – составляющая временного ряда, когда из него выделены регулярные компоненты (тренд, сезонная и циклическая компоненты)
Тренд, сезонные колебания и циклические колебания называются регулярными или систематическими компонентами временного ряда
СВОЙСТВА СЛУЧАЙНЫХ КОМПОНЕНТ Случайность колебаний уровней остатков Соответствие распределения вероятностей уровней случайной компоненты нормальному закону Равенство нулю математического ожидания М ( εt ) ≈ 0 Независимость значений уровней остатков (отсутствие автокорреляции между ними)
Проверка адекватности трендовых моделей основана на проверке выполнения остатками вышеприведенных четырех свойств!
ВИДЫ МОДЕЛЕЙ Аддитивная Yt = Q t + S t + Z t + U t Мультипликативная Yt = Qt×St×Zt×Zt×Ut
ЭТАПЫ ПОСТРОЕНИЯ ПРОГНОЗОВ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ, ПРЕДСТАВЛЕННЫХ ВРЕМЕННЫМИ РЯДАМИ • Предварительный анализ временных рядов. • Построение моделей. • Оценка качества моделей. • Выбор лучшей модели. • Получение прогноза.
ОСНОВНЫЕ ЦЕЛИ АНАЛИЗА ВР Определить, какие из составляющих Qt, St, Zt, Ut формируют уровни ряда y 1, y 2, … , yn Рассчитать, количественные оценки параметров для тех регулярных функций f(t), которые являются составляющими ряда y 1, y 2, … , yn Проверить адекватное поведение нерегулярной функции (t) Построить эффективную прогнозную модель на основе базового периода временного ряда y 1, y 2 , … , y n
Предварительный анализ временных рядов 1. Выявление аномальных наблюдений. Метод Ирвина 2. Сглаживание временных рядов. Метод скользящей средней. Метод взвешенной скользящей средней. Метод экспоненциального сглаживания 3. Проверка наличия тренда. Метод проверки разностей средних уровней Метод Фостера. Стюарта 4. Вычисление количественных характеристик развития экономического процесса.
ПРОВЕРКА ТРЕБОВАНИЙ К ИСХОДНОЙ ИНФОРМАЦИИ И ЕЕ АНАЛИЗ ВР должны проверяться на Сопоставимость Однородность Устойчивость Полноту (представительность, репрезентативность) данных
СОПОСТАВИМОСТЬ Уровни ряда должны отвечать требованиям: 1) выражаться в одних и тех же единицах измерения; 2) иметь одинаковый шаг наблюдения; 3) рассчитываться по одной и той же методике; 4) охватывать одни и те же единицы совокупности; 5) соответствовать одинаковым интервалам или моментам времени. Несопоставимость чаще всего проявляется
ОДНОРОДНОСТЬ Отсутствие нетипичных и аномальных наблюдений и изломов тенденций
УСТОЙЧИВОСТЬ Преобладание закономерности над случайностью в изменении уровней ряда (на данном этапе строятся графики ряда и подвергаются визуальному анализу) Преобладание случайности Преобладание
ПОЛНОТА ДАННЫХ Означает достаточное число наблюдений для выполнения прогноза, из условий обнаружения закономерностей
1. ВЫЯВЛЕНИЕ АНОМАЛЬНЫХ НАБЛЮДЕНИЙ Причины аномальных наблюдений: Ошибки технического характера (ошибки первого рода), например, ошибки измерения и передачи информации – они подлежат устранению Ошибки объективного характера (ошибки второго рода), например, ошибки, возникающие в результате воздействия на данный процесс редко проявляющихся объективных факторов – устранены быть не могут
АНОМАЛЬНЫЕ НАБЛЮДЕНИЯ Устранение АН производится путем их замены средней арифметической соседних уровней ряда: yt = (yt – 1 + yt + 1 ) / 2 , или экспоненциальной скользящей средней
МЕТОД ИРВИНА Для каждого наблюдения начиная со второго, рассчитывается выражение: λt = | yt - yt-1 | / σy, где σy = - среднеквадратическое отклонение - среднее арифметическое значение y
МЕТОД ИРВИНА Рассчитанные значения λt сравниваются с табличным λtтабл , и если выполняется неравенство λt > λtтабл, то наблюдение аномально. Табличные значения λt: Число наблюдений, n Вероятность, p 0, 95 0, 99 10 1, 5 2, 0 20 1, 3 1, 8
ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ДАННЫХ. ВЫЯВЛЕНИЕ АНОМАЛЬНЫХ НАБЛЮДЕНИЙ
ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ДАННЫХ. ВЫЯВЛЕНИЕ АНОМАЛЬНЫХ НАБЛЮДЕНИЙ
ПРИМЕР. ПРОВЕРИТЬ ВР НА НАЛИЧИЕ АН. t yt yt-ytср (ytytср)2 1 15 2 21 3 23 4 12 5 17 -9 81 -3 9 -1 1 -12 144 -7 49 6 7 25, 5 34 30 6 36 10 100 8 27 9 25 10 36 3 9 1 1 12 144 0, 75 0, 25 1, 38 0, 63 1, 63 0, 5 0, 88 0, 25 1, 38 λt Здесь ∑yt = 240, ytср=24, ∑(yt-ytср) 2 = 574, σy ≈ 8 , λtтабл = 1, 5. Для 6 -го наблюдения λt > λtтабл , поэтому с вероятностью p=0, 95% можно предположить, что оно аномально. Поскольку его природа неизвестна, то АН относится к ошиб-кам второго рода и его заменяем на среднее арифметическое соседних уровней y 6 = (y 5 + y 7 ) / 2 = (17+34)/2 = 25, 5.
СГЛАЖИВАНИЕ ВР Сглаживание ВР позволяет более четко выявить тренд и подготовить ряд для построения модели прогнозирования.
МЕТОДЫ СГЛАЖИВАНИЯ ВР Простая скользящая средняя Взвешенная скользящая средняя Экспоненциальное сглаживание
МЕТОД ПРОСТОЙ СКОЛЬЗЯЩЕЙ СРЕДНЕЙ Выбирается интервал сглаживания m = 3, 5, 7, 9 (если необходимо сгладить мелкие колебания, то m выбирается, по возможности, большим, и m уменьшается, если необходимо сохранить мелкие волны) параметр: p=(m-1)/2. Вычисляется среднее арифметическое значение уровней в интервале сглаживания: Рассчитывается
МЕТОД ПРОСТОЙ СКОЛЬЗЯЩЕЙ СРЕДНЕЙ Интервал сглаживания смещается на один уровень ряда и вновь рассчитывается среднее арифметическое. Вычисления продолжаются до последнего уровня. Недостаток метода – первые и последние p уровней остаются не сглаженными.
МЕТОД ВЗВЕШЕННОЙ СКОЛЬЗЯЩЕЙ СРЕДНЕЙ ŷ Сглаживание производится по уравнению полинома ŷ с учетом весовых коэффициентов (для m=5) Особенности весовых коэффициентов: - симметричны относительно центрального члена; - сумма весов с учетом общего члена равна 1, 0.
МЕТОД ЭКСПОНЕНЦИАЛЬНОГО СГЛАЖИВАНИЯ Для выравнивания используются значения предыдущих уровней взятых с определенным весом 0 < α <1, 0. Расчетная формула: ŷ
ПРИМЕР. ПРОИЗВЕСТИ СГЛАЖИВАНИЕ УРОВНЕЙ ИЗВЕСТНОГО ВР РАЗЛИЧНЫМИ МЕТОДАМИ t 1 2 3 4 5 6 7 8 9 10 yt 15 21 23 12 17 25, 5 34 27 25 36 ytсгл пр - - 17, 6 19, 7 22, 3 23, 1 25, 7 29, 5 - - ytсгл взв - - 19, 7 15, 6 16, 2 26, 5 30, 9 28, 1 - - ytсгл эксп - - - 0, 7 - 25, 6 32, 7 α=
3. ПРОВЕРКА НАЛИЧИЯ ТРЕНДА Тренд – долговременная устойчивая тенденция изменения показателя во времени. Различают 3 вида: ↑ , убывающий, боковой ↓ →. возрастающий
СПОСОБЫ ВЫЯВЛЕНИЯ ТРЕНДА метод проверки разностей средних уровней; метод Фостера-Стьюарта; знаковый критерий Кокса и Стьюарта; метод автокорреляционных функций и другие.
МЕТОД ПРОВЕРКИ РАЗНОСТЕЙ СРЕДНИХ УРОВНЕЙ ВР разбивают на две примерно равные по числу уровней части, каждая из которых рассматривается как некоторая самостоятельная выборочная совокупность, имеющая нормальное распределение. Если ВР имеет тенденцию к тренду, то средние, вычисленные для каждой совокупности, должны существенно (значимо) различаться между собой. Если же расхождение незначительно, несущественно (случайно), то ВР не имеет тенденции. Проверка наличия тренда в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух нормально распределенных совокупностей.
4. ВЫЧИСЛЕНИЕ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК РАЗВИТИЯ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ Расчет абсолютных приростов: цепных ∆yцепн = yt - yt-1 , базисных ∆yбазисн = yt - y 1 , средних САП = (yn - y 1 ) / (n-1) , где y 1 , yt-1 , yn – первый, текущий, предшествующий и последний уровни ВР, соответственно.
4. ВЫЧИСЛЕНИЕ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК РАЗВИТИЯ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ САП может использоваться для прогнозирования: yn+k = yn + k · САП , где k – шаг прогнозирования. Недостаток САП – нельзя опираться только на последнее наблюдение, поскольку оно имеет случайное значение, поэтому низкое качество прогноза, нельзя построить доверительный интервал прогноза.
4. ВЫЧИСЛЕНИЕ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК РАЗВИТИЯ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ Расчет темпов роста: Цепных Базисных Средних Выявление Тцепн = yt / yt-1 , Тбазисн= yt / y 1 , Тсредн = автокорреляции. .
4. ВЫЧИСЛЕНИЕ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК РАЗВИТИЯ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ Выявление автокорреляции. Автокорреляция отражает взаимосвязь между уровнями временного ряда и она характеризуется коэффициентом автокорреляции: rl = , где l – количество шагов на которое сдвигаются уровни ряда. Если 0, 7 < |rl | < 1, 0, то имеет смысл выполнять прогноз на l шагов вперед.
КОРЕЛЛОГРАММА АВТОКОРРЕЛЯЦИОННОЙ ФУНКЦИИ
ПОСТРОЕНИЕ МОДЕЛЕЙ ВРЕМЕННЫХ РЯДОВ Формирование уровней ряда определяется закономерностями трех основных типов: Различают задачи: инерцией тенденции, инерцией взаимосвязи между последовательными уровнями ряда и инерцией взаимосвязи между исследуемым показателем и показателямифакторами, оказывающими на него причинное воздействие. анализа и моделирования тенденций, взаимосвязи между последовательными уровнями ряда, причинных взаимодействий между исследуемым показателем и показателями - факторами. Первая задача решается с помощью моделей кривых роста, вторая - с помощью адаптивных методов и моделей, а третья - с помощью регрессионных моделей.
МОДЕЛИ КРИВЫХ РОСТА Плавную кривую (гладкую функцию), аппроксимирующую временной ряд принято называть кривой роста. Аналитические методы выделения (оценки) неслучайной составляющей временного ряда с помощью кривых роста реализуются в рамках моделей регрессии, в которых в роли зависимой переменной выступает переменная yt, а в роли единственной объясняющей переменной время t.
ВИДЫ АППРОКСИМИРУЮЩИХ ФУНКЦИЙ Полиномиальные (полином q –й степени) yt=a 0+a 1 t+a 2 t 2+…+aq t q ; Экспоненциальные yt=a 0·ea 1 t – простая экспонента, yt=a 0+a 1·ea 2 t – модифицированная; S –образные t yt=a 0· a 1 a 2 – Гомперца, yt= a 0/(1+a 1·e – a 2 t ) – логистическая.
РАСЧЕТ ПАРАМЕТРОВ МОДЕЛИ 1 МНК Параметры большинства "кривых роста", как правило, оцениваются по 1 МНК, т. е. подбираются таким образом, чтобы график функции "кривой роста" располагался на минимальном удалении от точек исходных данных. Согласно 1 МНК при оценке параметров модели всем наблюдениям присваиваются равные веса, т. е. их информационная ценность признается равной, а тенденция развития на всем участке наблюдений – неизменной.
ПОСТРОИМ ГРАФИК У = F(T) y εt=yt-yp или ∑ ε 2 t= ∑(yt- yp)2 Yp=a 0+a 1 t εt yt yp t
Минимизируем сумму квадратов отклонений εt 2, для чего вычисляем частные производные по a 1, a 0 и приравниваем нулю. В результате решения системы уравнений получаем: Вычисленные значения параметров модели подставляются в уравнение модели: yp=a 0+a 1 t
ОЦЕНКА КАЧЕСТВА МОДЕЛИ Проверка адекватности 1. Проверка независимости (отсутствие автокорреляции). 2. Проверка случайности. 3. Соответствие ряда остатков нормальному закону распределения. 4. Равенство нулю средней ошибки. Оценка точности модели Среднеквадратическое отклонение. Минимальная по абсолютной величине ошибка. Средняя относительная ошибка аппроксимации.
ОЦЕНКА КАЧЕСТВА МОДЕЛИ ПРОГНОЗИРОВАНИЯ Модель считается хорошей со статистической точки зрения, если она адекватна и достаточно точна. Качество оценивается на основе исследования остаточной компоненты εt по критериям адекватности : Критерий поворотных точек или p - критерий (свойство случайности); R/S – критерий (нормальность распределения); Критерий Дарбина-Уотсона или d – критерий (свойство независимости остатков); Равенство математического ожидания нулю M(εt )= 0. и критериям точности : § Среднее квадратическое отклонение S; § Средняя относительная ошибка аппроксимации ε отн.
ПРОВЕРКА РАВЕНСТВА МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ НУЛЮ ( РАВЕНСТВО НУЛЮ СРЕДНЕЙ ОШИБКИ). Если случайная компонента имеет нормальное распределение, то проверка выполняется по t- критерию Стьюдента где – среднеарифметическое значение εt , Sε – стандартное (среднеквадратическое) отклонение значений εt. Если рассчитанное значение t- критерия Стьюдента меньше его табличного значения с уровнем значимости α и числом степеней свободы (n-1), то нулевая гипотеза H 0 о равенстве нулю математического ожидания принимается.
ПРОВЕРКА УСЛОВИЯ СЛУЧАЙНОСТИ ВОЗНИКНОВЕНИЯ ОТДЕЛЬНЫХ ОТКЛОНЕНИЙ ОТ ТРЕНДА критерий серий, критерий поворотных точек.
МЕТОД СЕРИЙ Ряд остатков ранжируется в порядке возрастания (убывания) и находится медиана остатков Возвращаясь к начальной последовательности остатков, каждое значение сравнивается с медианой Если значение остатка больше медианы, то ставится знак «+» Если меньше – то знак «-» При равенсте соответствующее значение остатка не учитывается Формируется последовательность из «+» и «-»
МЕТОД СЕРИЙ. ОПРЕДЕЛЕНИЕ Последовательность плюсов и минусов, которые идут подряд, называется серией Если есть один плюс (минус), который идет вслед за минусом (плюсом), то его следует считать отдельной серией
МЕТОД СЕРИЙ Определяется общее количество серий V и наибольшая протяженность одной серии k max. Для того, чтобы последовательность остатков имела случайный характер, k max не может быть очень большой, а количество серий – не очень маленьким
МЕТОД СЕРИЙ Для 5% уровня значимости рассчитываются два неравенства: k max < [3, 3(lgn+1)] V > [1/2(n+1 -1, 96(n-1)0. 5)], где квадратные скобки определяют целую часть числа Если хотя бы одно неравенство нарушается, то гипотеза о случайном характере остатков временного ряда отклоняется и, соответственно, трендовая модель (кривая роста) является неадекватной
КРИТЕРИЙ «ПИКОВ» , ИЛИ КРИТЕРИЙ ПОВОРОТНЫХ ТОЧЕК Значение случайной переменной считается поворотной точкой, если оно одновременно больше (меньше) соседних с ним элементов. Если остатки случайны, то поворотная точка приходится примерно на каждые 1, 5 наблюдения. Если их больше, то возмущения быстро колеблются и это не может быть объяснено только случайностью. Если же их меньше, то последовательные значения случайного компонента положительно коррелированны.
КРИТЕРИЙ ПОВОРОТНЫХ ТОЧЕК (P –КРИТЕРИЙ) Данный критерий служит для проверки свойства случайности колебаний остаточной компоненты относительно тренда. Значение εt считается поворотной точкой если выполняется одно из условий: εt-1< εt > εt+1 или εt-1> εt < εt+1. Свойство случайности с уровнем значимости 0, 05 выполняется, если фактическое количество поворотных точек p больше расчетного:
ПРОВЕРКА НЕЗАВИСИМОСТИ ОСТАТКОВ (ОТСУТСТВИЕ АВТОКОРРЕЛЯЦИИ) Критерий Дарбина-Уотсона (или d-критерий) εi = yiфакт – yi расч Критерий d распределен в интервале 0… 4.
ПРОВЕРКА НЕЗАВИСИМОСТИ ОСТАТКОВ Если d < 2, то присутствует положительная автокорреляция между остатками уровней Если d > 2 – то отрицательная Если 0 < d 1, то остатки содержат автокорреляцию Если d 1 < d 2, то имеется неопределенность
ПРОВЕРКА НЕЗАВИСИМОСТИ ОСТАТКОВ В случае неопределенности рассчитывается первый коэффициент автокорреляции по формуле Значение r (1) сопоставляется с табличным r (1)табл, и если r (1) < r (1)табл, то автокорреляция отсутствует, в противном случае присутствует (r(1)табл=0, 36 ).
ПРОВЕРКА НЕЗАВИСИМОСТИ ОСТАТКОВ Если d 2 < d < 2 , то ряд остатков не коррелирован Если d > 2, то d - критерий пересчитывается по 2 формуле: d’ = 4 – d и дальнейшие выводы делают по d’ * * 0 d * d 1 d 2 2 4 Для n = 15 значения d 1= 1, 08 и d 2=1, 36 (при уровне значимости 0, 05).
СООТВЕТСТВИЕ РЯДА ОСТАТКОВ НОРМАЛЬНОМУ ЗАКОНУ РАСПРЕДЕЛЕНИЯ R/S – критерий (нормальность распределения εt) рассчитывается как отношение размаха вариации случайной величины R = εt max- εt min к стандартному отклонению Sε = R/S=(εt max- εt min )/ Sε
R/S – КРИТЕРИЙ Если фактическое значение R/S попадает в диапазон таабличных значений: для n = 10 => R/S = 2, 670… 3, 685; для n = 20 => R/S = 3, 180… 4, 490; для n = 30 => R/S = 3, 470… 4, 890, при уровне значимости =0, 05, то H 0 нулевая гипотеза о ненормальном распределении εt отвергается и принимается альтернативная гипотеза H 1 о нормальном распределении случайной компоненты
КРИТЕРИИ ТОЧНОСТИ МОДЕЛИ В качестве статистических показателей точности модели применяются: среднее квадратическое отклонение Sε = , где n – количество уровней ряда, k - число факторов в модели. Чем меньше значение Sε тем выше точность модели; средняя относительная ошибка аппроксимации ε отн = , %. Если ε отн < 5% , то точность модели считается удовлетворительной, при ε отн > 10% - низкой. Точность модели можно оценивать и по коэффициенту детерминации R 2
ВЫБОР ЛУЧШЕЙ МОДЕЛИ производится по критериям адекватности и точности. Лучшей считается та модель, которая имеет лучшие показатели качества. Получение точечного и интервального прогноза Точечный прогноз получают путем подстановки в модель значений фактора времени на прогнозируемом шаге ŷn+k = a 0 + a 1·(n+k), где n + k = t. Поскольку вероятность точечного прогноза близка к нулю, то рассчитывается интервальный прогноз ŷn+k где uk = S· tα· [ŷn+k ± uk], . .
СТРОИМ ПРОГНОЗНЫЕ ЗНАЧЕНИЯ ПОКАЗАТЕЛЯ YT Точечный прогноз y Интервальный прогноз Yp=a 0+a 1 t Прошлое Будущее Настоящее t
Временные ряды.pptx