2008_l5.ppt
- Количество слайдов: 26
Побудова загальної лінійної економетричної моделі 1
n n n Крок 1. Знайомство з економічною теорією, висунення гіпотези взаємозв'язку. Чітка постановка задачі. Крок 2. Специфікація моделі. Використовуючи всі ті форми функцій, які можуть бути застосовані для вивчення взаємозв'язків, необхідно сформулювати теоретичні уявлення і прийняті гіпотези у вигляді математичних рівнянь. Ці рівняння встановлюють зв'язки між основними визначальними змінними за припущення, що всі ін ші змінні є випадковими. Крок 3. Формування масивів вхідної інформації згідно з метою та завданнями дослідження. 2
n n n Крок 4. Оцінка параметрів економетричної моделі методом найменших квадратів. Аналіз залишків дає змогу відповісти на запитання: чи не суперечить специфікація моделі передумовам «класичної» моделі лінійної регресії? Крок 5. Якщо деякі передумови моделі не виконуються, то для продовження аналізу треба замінювати специфікацію або застосовувати інші методи оцінювання параметрів. Крок 6. Проведення аналізу достовірності моделі та прогнозу за побудованою моделлю. 3
ПАРНА ЛІНІЙНА РЕГРЕСІЯ МЕТОД НАЙМЕНШИХ КВАДРАТІВ Лекція 5 4
n У загальному випадку парна лінійна регресія є лінійною функцією між залежною змінною Y і однією пояснюючою змінною X: Y=a 0+a 1 X. ¨ Співвідношення називається теоретичною лінійною регресійною моделлю; ¨ a 0 a 1 — теоретичні параметри (теоретичні коефіцієнти) регресії. ¨ принциповою в цьому разі є лінійність за параметрами a 0 і а 1 5
n n n Щоб визначити значення теоретичних коефіцієнтів регресії, необхідно знати й використовувати всі значення змінних X і Y генеральної сукупності ( що практично неможливо). Тому за вибіркою обмеженого обсягу будують так зване емпіричне рівняння регресії, у якому коефіцієнтами є оцінки теоретичних коефіцієнтів регресії: де а 0 оцінки невідомих параметрів а 1 і 6
Через розбіжність статистичної бази для генеральної сукупності та вибірки оцінки â 0 і â 1 практично завжди відрізняються від дійсних значень коефіцієнтів а 0 а 1, що призводить до розбіжності емпіричної та теоретичної ліній регресії. n Різні вибірки з однієї й тієї самої генеральної сукупності звичайно зумовлюють різні оцінки n 7
Можливе співвідношення між теоретичним і емпіричним рівняннями регресії 8
n Задачі лінійного регресійного аналізу полягають у тому, щоб за наявними статистичними даними (xi , yi), i=1, 2, . . . , n, для змінних X і Y: ¨ а) отримати найкращі оцінки â 0 â 1 невідомих параметрів а 0 і a 1, : ¨ б) перевірити статистичні гіпотези щодо параметрів моделі; ¨ в) перевірити, чи досить добре модель узгоджується зі статистичними даними (адекватність моделі даним спостережень). 9
Для відображення того факту, що кожне індивідуальне значення уі відхиляється відповідного умовного математичного сподівання, у модель уводять випадкову складову ui yi=M(Y | X = xi )+ui =a 0+a 1 xi + ui n Iндивідуальні значення уі складається з суми двох компонент — систематичної (a 0+a 1 xi) і випадкової ui n 10
Регресійне рівняння набуває вигляду Y =а 0+а 1 Х+и n Завдання полягає в тому, щоб за конкретною вибіркою (xi, yi), і = 1, 2. . . n, знайти такі значення оцінок невідомих параметрів a 0 і a 1, щоб побудована лінія регресії була найкращою ("найближчою" до точок спостережень за їх сукупністю) серед усіх інших прямих. n Мірою якості знайдених оцінок можуть бути визначені композиції відхилень ui, i=1, 2, . . . , n. n 11
n Наприклад, коефіцієнти a 0 і a 1 рівняння регресії можуть бути оцінені за умови мінімізації однієї з таких сум: 12
n 1) Перша сума не може бути мірою якості знайдених оцінок а через те, що існує безліч прямих (зокрема, У = у ), для яких. n 2) Метод визначення оцінок коефіцієнтів за умови мінімізації n називається методом найменших модулів (МНМ). 3) Найпоширенішим і теоретично обгрунтованим є метод визначення коефіцієнтів, при якому мінімізується n n носить назву метод найменших квадратів (МНК). 13
n Серед інших методів визначення оцінок коефіцієнтів регресії виділяють метод моментів (MM) і метод максимальної правдоподібності (MMП). 14
Метод найменших квадратів (НМК) n Нехай за вибіркою (xi, yi), і = 1, 2. . . n, потрібно визначити оцінки â 0 і â 1 емпіричного рівняння регресії n тобто підібрати такі значення коефіцієнтів рівняння, щоб сума квадратів відхилень була мінімальною 15
16
n У цьому разі n є квадратичною функцією двох параметрів â 0 і â 1, оскільки відомі дані спостережень: n квадратична функція Q неперервна, опукла та обмежена знизу (Q ≥ 0), тобто має мінімум. 17
n Необхідною умовою існування мінімуму неперервно диференційованої функції двох змінних є рівність нулю її частинних похідних: 18
n Поділивши обидва рівняння системи на n, отримаємо 19
n Згідно з МНК оцінки параметрів â 0 та â 1 визначаються за формулами n â 1 можна обчислити за формулою 20
n вибірковий кореляційний момент випадкових величин X та Y n вибіркова дисперсія Х 21
n тоді ¨ де rxy – стандартний коефіцієнт ¨ Sy стандартне відхилення У n кореляції Отже, коефіцієнт регресії пропорційний коефіцієнту кореляції, а коефіцієнти пропорційності використовують для зіставлення різних величин X і Y. 22
n n Таким чином, якщо коефіцієнт кореляції rxy вже розрахований, то неважко знайти коефіцієнт â 1 парної регресії. Якщо окрім рівняння регресії Y на X n n для тих самих емпіричних даних знайдено рівняння регресії X на Y n n то добуток коефіцієнтів â 1 та n дорівнює rxy 2 . 23
n Оцінки параметрів моделі або коефіцієнти регресійної моделі, обчислені методом найменших квадратів, будуть незміщеними, ефективними, і спроможними, якщо виконуються передумови методу найменших квадратів. ¨ Незміщенність коефіцієнтів моделі полягає в тому, що математичні сподівання коефіцієнтів моделі рівні параметрам моделі при будь якому обсязі вибірки. ¨ Ефективність коефіцієнтів моделі полягає в тому, що коефіцієнти мають найменші дисперсії в класі всіх лінійно незміщенних оцінок. ¨ Спроможність коефіцієнтів моделі полягає в тому, що зі збільшенням обсягу вибірки значення коефіцієнтів наближаються до істинних розмірів цих коефіцієнтів або параметрів моделі. 24
Передумови методу найменших квадратів 1. 2. 3. залежна змінна має бути випадковою; змінні можуть бути випадковими або детермінованими, але обов'язково змінюваними; дисперсії залишків моделі мають бути сталими для кожного фіксованого значення змінної; 25
4. 5. 6. 7. 8. автокореляція між залишками має бути відсутньою; залишки мають розподілятись за нормальним законом; кількість чинників у моделі має бути менше обсягу вибірки; між залишками і пояснювальними змінними не повинно бути зв'язку; чинники, що включаються в модель, не повинні бути пов'язаними між собою. 26
2008_l5.ppt