трусики женские украина

На головну

 Множинна регресія і кореляція - Економіко-математичне моделювання

Множинна регресія і кореляція

Нехай потрібно побудувати лінійну модель залежності деякого вихідного економічного показника, званого пояснюється змінної від набору вхідних показників, званих пояснюють змінними. Основним методом побудови таких моделей є метод найменших квадратів, сенс якого полягає в тому, щоб підібрати параметри моделі, які мінімізують суми квадратів відхилень модельних значень пояснюється змінної від істинних значень. Метод найменших квадратів реалізований у всіх статистичних пакетах програм, а також у засобах статистичного пакету Аналізу даних Microsoft Excel.

Нехай-спостережень пояснюється змінної, а-наблюденійоб'ясняющіх змінних. Завдання полягає в побудові по даній вибірці лінійної моделі залежності пояснюється змінної від вектора пояснюють змінних.

.

Тут- коефіцієнти моделі, які треба визначити, а- помилка вимірювання моделі.

Для адекватної роботи методу найменших квадратів потрібне виконання наступних гіпотез:

1.. (Специфікація моделі).

2. -детермінірованние величини, причому в матриці

стовпці лінійно незалежні, тобто ранг цієї матриці дорівнює.

3. - випадкова величина, яка задовольняє умовам

3а., Математичне очікування помилки дорівнює нулю;

3b., Дисперсія помилки не залежить від номера спостереження;

3с., Тобто помилки різних спостережень не залежать одне від одного.

Справедлива теорема Гаусса-Маркова, що за цих умов метод найменших квадратів дає найкращу в деякому розумінні модель. Якщо деякі з умов не виконуються, то доводиться використовувати більш складні методи.

В результаті застосування методу найменших квадратів знаходяться оцінки коефіцієнтів моделі. За цими оцінками і за значеннями пояснюють переменнихстроятся модельні значення пояснюється змінної. Позначимо черезотклоненіе істинного значення пояснюється змінної від модельного для-го спостереження (). Якість моделі оцінюється через суму квадратів відхилень моделі

.

(Error sum of squares) називається сумою квадратів помилок.

Метод найменших квадратів полягає в тому, що серед усіх можливих наборів коефіцієнтів моделі знаходиться набір, здатний мінімізувати.

Якщо всі коефіцієнти моделі, крім константи, дорівнюють нулю, то- середньому значенню пояснюється змінної. Тоді сума квадратів відхилень дорівнює

.

(Total sum of squares) називається загальною сумою квадратів.

За рахунок того, що не всі коефіцієнти моделі дорівнюють нулю, сума квадратів відхилень зменшується. Відповідно до цього величина

означає пояснень суму квадратів (regression sum of squares).

Після отримання оценокнеобходімо визначити, чи всі з них значимо відрізняються від нуля, так як, якщо коефіцієнт дорівнює нулю, це означає, що відповідна пояснює змінна не бере участі в моделі. Коефіцієнт значущий, якщо гіпотезу його рівності нулю треба відкинути. Відповідно значимістю коефіцієнта називається ймовірність того, що його знак збігається зі знаком його оцінки.

Для отриманої моделі необхідно вміти визначати, чи можна відкинути кілька вхідних в неї пояснюють змінних або додати змінні, що не входять в модель. З цією метою, проводять тест для визначення яка модель краще - «довга» або «коротка». Також необхідно перевіряти однорідність моделі для різних наборів змінних. Для цього призначений тест Чоу. Для оцінки адекватності моделі треба перевіряти тести на виконання умов теореми Гаусса-Маркова.

Тест на вибір «довгої» або «короткій» регресії

Даний тест використовується для відбору найбільш істотних пояснюють змінних. Наприклад, перехід від великого числа вихідних показників стану аналізованої системи до меншого числа найбільш інформативних змінних може бути обумовлений дублюванням інформації, що доставляється сильно взаємопов'язаними ознаками або неінформативні ознак, мало мінливих при переході від одного об'єкта до іншого. Так, якщо дві будь-які пояснюючі змінні сильно корельовані з результуючим показателемі один з одним, то часто буває достатньо включення в модель однієї з них, а додатковим внеском від включення інший можна знехтувати.

Нехай. Припустимо, що модель не залежить від последніхоб'ясняющіх змінних і їх можна виключити з моделі. Це відповідає гіпотезі

,

тобто последніекоеффіціентовравни.

Тест з перевірки даної гіпотези полягає в наступному:

1. Побудувати за МНК «довгу» (unrestricted) регресію по всіх параметрами знайти для неї.

2. Використовуючи МНК, побудувати «коротку» (restricted) регресію по первимпараметрамі знайти для неї.

3. Обчислити F-статистику:

4. Знайти критичну точку розподілу Фішера при обраному рівні значущості :.

5. Якщо, то гіпотезаотвергается, тобто слід використовувати «довгу» модель.

Якщо, то гіпотезапрінімается, тобто краще «коротка» модель.

Тест Чоу на однорідність залежності пояснюється змінної від пояснюють

На практиці нерідкі випадки, коли є дві вибірки пар значень залежної і пояснюватиме змінних. Наприклад, одна вибірка пар значень змінних об'емомполучена при одних умовах, а інша, обсягом, - при дещо змінених умовах. Необхідно з'ясувати, чи дійсно дві вибірки однорідні в регресійному сенсі? Іншими словами, чи можна об'єднати дві вибірки в одну і розглядати єдину модель регрессііпо (гіпотеза)?

Для перевірки гіпотезипріменяется тест Чоу (Chow), що складається в наступному:

1. Використовуючи МНК, побудувати модель за вибіркою об'емомо знайти для неї.

2. Нехай є підстави припускати, що вся вибірка складається з двох підвибірок об'емаміісоответственно. Для кожної з них будується лінійна регрессія.- сума квадратів відхилень значенійот регресійних значень, порахованих за першої підвибірки, - сума квадратів відхилень значенійот регресійних значень, порахованих за другою підвибірки.

3. Обчислити F - статистику:

,

де- число пояснюють змінних моделі.

4. Знайти критичну точку розподілу Фішера при обраному рівні значущості.

5. Якщо, то ми можемо об'єднати дві вибірки в одну. Якщо, то необхідно використовувати дві моделі.

Тести на гетероскедастичності

Гомоскедастичність - дисперсія кожного отклоненіяодінакова для всіх значень.

Гетероскедастичності - дисперсія що пояснюється змінної (отже, і випадкових помилок) непостійна.

У тестах на гетероскедастичності перевіряється основна гіпотеза (т.е. Модель Гомоскедастичність) проти альтернативної гіпотези: ні (т.е. Модель гетероскедастичності).

Тест Гольдфельда - Куандт (Goldfeld - Quandt)

Цей тест застосовується, як правило, коли є припущення про пряму залежність дисперсії помилок від величини деякої пояснюватиме змінної, що входить в модель.

Передбачається, чтоімеет нормальний розподіл. Тест включає в себе наступні кроки:

1. Упорядкувати дані по спадаючій (або за зростанням) тієї незалежної змінної, щодо якої є підозра на гетероскедастичності.

2. Ісключітьсредніх (у цьому упорядкуванні) спостережень (, де- загальна кількість спостережень).

3. Провести дві незалежних регресії первихнаблюденій і последніхнаблюденій і знайти, відповідно, і. Ізівибіраем велику і меншу величини, відповідно, і.

4. Скласти статістікуі знайти з розподілу Фішера, де- число пояснюють змінних моделі.

5. Якщо, то гіпотезаотвергается, тобто модель гетероскедастичності, а якщо, то гіпотезапрінімается, тобто модель Гомоскедастичність.

Тест Бреуша - Пагана (Breusch - Pagan)

Цей тест застосовується в тих випадках, коли передбачається, що дісперсіізавісят від деяких додаткових змінних. Нехай ,. Тест полягає в наступному:

1. Провести звичайну регресію і отримати. (Для цього в діалоговому вікні Регресія встановити прапорець на функцію Залишки)

2. Побудувати оцінку.

3. Провести регрессіюі знайти для неї пояснень частина варіації.

4. Побудувати статистику.

5. Якщо (де p - число змінних, від яких залежить), то має місце гетероскедастичності.

Якщо, то - Гомоскедастичність.

- Критична точка розподілу (хі-квадрат) при обраному рівні значущості, для знаходження якої виконати наступну послідовність дій: fxСтатістіческіеХІ2ОБР

Тест Дарбіна - Уотсона (Darbin-Watson) на наявність автокореляції

Цей тест використовується для виявлення автокореляції першого порядку, тобто перевіряється некоррелированности НЕ будь-яких, а тільки сусідніх величин. Сусідніми зазвичай вважаються сусідні в часі (при розгляді часових рядів) або за зростанням пояснюватиме переменнойзначенія.

Гіпотеза (автокорреляция відсутня).

Загальна схема критерію Дарбіна - Уотсона наступна:

1. За емпіричними даними побудувати рівняння регресії за МНК і визначити значення отклоненійдля кожного спостереження t (t = 1, 2, ..., n).

2. Розрахувати статистику DW:

3. По таблиці критичних точок розподілу Дарбіна -Уотсона для заданого рівня значущості, числа наблюденійі кількості пояснюють переменнихопределіть два значення: - нижня межа и- верхня межа (таблиця 2).

Повний варіант таблиці наведений у розділі Математико-статистичні таблиці (Таблиця 5. Значення dH і dB критерію Дарбіна-Уотсона на рівні значущості ? = 0,05 (n - число спостережень, р - число пояснюють змінних). Множинний кореляція регресія

Таблиця 2.

 Статистика Дарбіна - Уотсона, рівень значущості 0,05

 1 2 3 4 травень

 20 1,20 1,41 1,1 1,54 1,00 1,67 0,90 1,83 0,79 1,99

 21 1,22 1,42 1,13 1,54 1,03 1,66 0,93 1,81 0,83 1,96

 22 1,24 1,43 1,15 1,54 1,05 1,66 0,96 1,80 0,86 1,94

 23 1,26 1,44 1,17 1,54 1,08 1,66 0,99 1,79 0,90 1,92

 24 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,78 0,93 1,90

 25 1,29 1,45 1,21 1,55 1,12 1,66 1,04 1,77 0,95 1,89

4. Зробити висновки за правилом:

- Існує позитивна автокорреляция (), відкидається;

- Висновок про наявність автокореляції не визначено;

- Автокорреляция відсутня, приймається;

- Висновок про наявність автокореляції не визначено;

- Існує негативна автокорреляция (), відкидається.

Авіація і космонавтика
Автоматизація та управління
Архітектура
Астрологія
Астрономія
Банківська справа
Безпека життєдіяльності
Біографії
Біологія
Біологія і хімія
Біржова справа
Ботаніка та сільське господарство
Валютні відносини
Ветеринарія
Військова кафедра
Географія
Геодезія
Геологія
Діловодство
Гроші та кредит
Природознавство
Журналістика
Зарубіжна література
Зоологія
Видавнича справа та поліграфія
Інвестиції
Інформатика
Історія
Історія техніки
Комунікації і зв'язок
Косметологія
Короткий зміст творів
Криміналістика
Кримінологія
Криптологія
Кулінарія
Культура і мистецтво
Культурологія
Логіка
Логістика
Маркетинг
Математика
Медицина, здоров'я
Медичні науки
Менеджмент
Металургія
Музика
Наука і техніка
Нарисна геометрія
Фільми онлайн
Педагогіка
Підприємництво
Промисловість, виробництво
Психологія
Психологія, педагогіка
Радіоелектроніка
Реклама
Релігія і міфологія
Риторика
Різне
Сексологія
Соціологія
Статистика
Страхування
Будівельні науки
Будівництво
Схемотехніка
Теорія організації
Теплотехніка
Технологія
Товарознавство
Транспорт
Туризм
Управління
Керуючі науки
Фізика
Фізкультура і спорт
Філософія
Фінансові науки
Фінанси
Фотографія
Хімія
Цифрові пристрої
Екологія
Економіка
Економіко-математичне моделювання
Економічна географія
Економічна теорія
Етика

8ref.com

© 8ref.com - українські реферати


енциклопедія  бефстроганов  рагу  оселедець  солянка