трусики женские украина

На головну

 Аналіз часових рядів - Економіко-математичне моделювання

Введення

У даній главі розглядаються задачі опису впорядкованих даних, отриманих послідовно (у часі). Взагалі кажучи, впорядкованість може мати місце не тільки в часі, але й у просторі, наприклад, діаметр нитки як функція її довжини (одновимірний випадок), значення температури повітря як функція просторових координат (тривимірний випадок).

На відміну від регресійного аналізу, де порядок рядків в матриці спостережень може бути довільним, у тимчасових рядах важлива впорядкованість, а отже, інтерес представляє взаємозв'язок значень, що відносяться до різних моментів часу.

Якщо значення ряду відомі в окремі моменти часу, то такий ряд називають дискретним, на відміну від безперервного, значення якого відомі в будь-який момент часу. Інтервал між двома послідовними моментами часу назвемо тактом (кроком). Тут будуть розглядатися в основному дискретні часові ряди з фіксованою протяжністю такту, прийнятої за одиницю рахунку. Зауважимо, що часові ряди економічних показників, як правило, дискретно.

Значення ряду можуть бути вимірюваними безпосередньо (ціна, прибутковість, температура), або агрегованими (кумулятивними), наприклад, обсяг випуску; відстань, пройдений вантажоперевізниками за тимчасовою такт.

Якщо значення ряду визначаються детермінованої математичної функцією, то ряд називають детермінованим. Якщо ці значення можуть бути описані лише із залученням імовірнісних моделей, то часовий ряд називають випадковим.

Явище, що протікає в часі, називають процесом, тому можна говорити про детерминированном або випадковому процесах. В останньому випадку використовують часто термін "стохастичний процес". Аналізований відрізок часового ряду може розглядатися як приватна реалізація (вибірка) досліджуваного стохастичного процесу, що генерується прихованим імовірнісним механізмом.

Тимчасові ряди виникають у багатьох предметних областях і мають різну природу. Для їх вивчення запропоновані різні методи, що робить теорію часових рядів дуже розгалуженою дисципліною. Так, залежно від виду часових рядів можна виділити такі розділи теорії аналізу часових рядів:

- Стаціонарні випадкові процеси, що описують послідовності випадкових величин, імовірнісні властивості яких не змінюються в часі. Подібні процеси широко поширені в радіотехніці, метереологіі, сейсмології і т. Д.

- Дифузійні процеси, що мають місце при взаємопроникненні рідин і газів.

- Точкові процеси, що описують послідовності подій, таких як надходження заявок на обслуговування, стихійних і техногенних катастроф. Подібні процеси вивчаються в теорії масового обслуговування.

Ми обмежимося розглядом прикладних аспектів аналізу часових рядів, які корисні при вирішенні практичних завдань в економіці, фінансах. Основний упор буде зроблений на методи підбору математичної моделі для опису часового ряду і прогнозування його поведінки.

1.Цели, методи та етапи аналізу часових рядів

Практичне вивчення часового ряду передбачає виявлення властивостей ряду та отримання висновків про імовірнісний механізмі, породжує цей ряд. Основні цілі при вивченні часового ряду наступні:

- Опис характерних особливостей ряду в стислій формі;

- Побудова моделі часового ряду;

- Пророкування майбутніх значень на основі минулих спостережень;

- Управління процесом, що породжує часовий ряд, шляхом вибірки сигналів, що попереджають про прийдешні несприятливих подіях.

Досягнення поставлених цілей можливо далеко не завжди як через нестачу вихідних даних (недостатня тривалість спостереження), так через мінливість з часом статистичної структури ряду.

Перераховані цілі диктують значною мірою, послідовність етапів аналізу часових рядів:

1) графічне представлення й опис поведінки ряду;

2) виділення і виключення закономірних, невипадкових складових ряду, що залежать від часу;

3) дослідження випадкової складової часового ряду, що залишилася після видалення закономірною складовою;

4) побудова (підбір) математичної моделі для опису випадкової складової і перевірка її адекватності;

5) прогнозування майбутніх значень ряду.

При аналізі часових рядів використовуються різні методи, найбільш поширеними з яких є:

1) кореляційний аналіз, використовуваний для виявлення характерних особливостей ряду (періодичностей, тенденцій і т. Д.);

2) спектральний аналіз, що дозволяє знаходити періодичні складові часового ряду;

3) методи згладжування і фільтрації, призначені для перетворення часових рядів з метою видалення високочастотних і сезонних коливань;

4) моделі авторегресії і ковзного середнього для дослідження випадкової складової часового ряду;

5) методи прогнозування.

2.Структурние компоненти часового ряду

Як уже зазначалося, в моделі часового ряду прийнято виділяти дві основні складові: детерміновану і випадкову (рис.). Під детермінованої складової тимчасового рядапонімают числову послідовність, елементи якої обчислюються за певним правилом як функція часу t. Виключивши детерміновану складову з даних, ми отримаємо коливний навколо нуля ряд, який може в одному граничному випадку представляти чисто випадкові скачки, а в іншому - плавне коливальний рух. У більшості випадків буде щось середнє: деяка іррегулярностью і певний систематичний ефект, обумовлений залежністю послідовних членів ряду.

У свою чергу, детермінована складова може містити такі структурні компоненти:

1) тренд g, що представляє собою плавну зміну процесу в часі і зумовлений дією довготривалих факторів. Як приклад таких факторів в економіці можна назвати: а) зміна демографічних характеристик популяції (чисельності, вікової структури); б) технологічне та економічний розвиток; в) зростання споживання.

2) сезонний ефект s, пов'язаний з наявністю факторів, що діють циклічно із заздалегідь відомою періодичністю. Ряд в цьому випадку має ієрархічну шкалу часу (наприклад, всередині року є сезони, пов'язані з порами року, квартали, місяці) і в однойменних точках ряду мають місце подібні ефекти.

Рис. Структурні компоненти часового ряду.

Типові приклади сезонного ефекту: зміна завантаженості автотраси протягом доби, по днях тижня, порами року, пік продажів товарів для школярів в кінці серпня - початку вересня. Сезонна компонента з часом може змінюватися, або носити плаваючий характер. Так на графіку обсягу перевезень авіалайнерами (див рис.) Видно, що локальні піки, що припадають на свято Пасхи «плавають» через мінливість її термінів.

Циклічна компонента c, що описує тривалі періоди відносного підйому і спаду і складається з циклів змінної тривалості і амплітуди. Подібна компонента вельми характерна для рядів макроекономічних показників. Циклічні зміни обумовлені тут взаємодією попиту і пропозиції, а також накладенням таких факторів, як виснаження ресурсів, погодні умови, зміни в податковій політиці і т. П. Відзначимо, що циклічну компоненту вкрай важко ідентифікувати формальними методами, виходячи тільки з даних досліджуваного ряду.

«Вибухова» компонента i, інакше інтервенція, під якою розуміють істотне короткочасний вплив на часовий ряд. Прикладом інтервенції можуть слугувати події «чорного вівторка» 1994р., Коли курс долара за день виріс на кілька десятків відсотків.

Випадкова складова ряду відображає вплив численних факторів випадкового характеру і може мати різноманітну структуру, починаючи від найпростішої у вигляді «білого шуму» до дуже складних, описуваних моделями авторегресії-ковзного середнього (докладніше далі).

Після виділення структурних компонент необхідно специфікувати форму їх входження в тимчасовій ряд. На верхньому рівні уявлення з виділенням лише детермінованою і випадкової складових зазвичай використовують аддитивную або мультипликативную моделі.

Аддитивная модель має вигляд

;

мультипликативная -

,

де- значення ряду в момент t;

- Значення детермінованої складової;

- Значення випадкової складової.

У свою чергу, детермінована складова може бути представлена ??як адитивна комбінація детермінованих компонент:

,

як мультиплікативна комбінація:

,

або як змішана комбінація, наприклад,

3.Модель компонентів детермінованої складової часового ряду 3.1.Моделі тренда

Тренд відображає дію постійних довготривалих факторів і носить плавний характер, так що для опису тренда широко використовують поліноміальні моделі, лінійні за параметрами

,

де значення ступеня k полінома рідко перевищує 5.

Поряд з поліноміальними моделями економічні дані, що описують процеси росту, часто аппроксимируются наступними моделями:

- Експоненційної

.

Ця модель описує процес з постійним темпом приросту, тобто

- Логістичної

У процесу, описуваного логістичної кривої, темп приросту досліджуваної характеристики лінійно падає зі збільшенням y, тобто

- Гомперца

.

Ця модель описує процес, в якому темп приросту досліджуваної характеристики пропорційний її логарифму

.

Дві останні моделі задають криві тренда S-подібної форми, представляючи процеси з наростаючим темпом зростання в початковій стадії з поступовим уповільненням в кінці.

При підборі підходящої функціональної залежності, інакше специфікації тренда, дуже корисним є графічне представлення часового ряду.

Відзначимо також, що тренд, відображаючи дію довготривалих факторів, є визначальним при побудові довготривалих прогнозів. 3.2 Моделі сезонної компоненти

Сезонний ефект в тимчасовому ряді проявляється на «тлі» тренда і його виділення виявляється можливим після попередньої оцінки тренда. (Тут не розглядаються методи спектрального аналізу, що дозволяє виділити внесок сезонної компоненти в спектр без обчислення інших компонент ряду). Дійсно, лінійно зростаючий ряд помісячних даних буде мати схожі ефекти в однойменних точках - найменше значення в січні і найбільшу в грудні; однак навряд чи тут доречно говорити про сезонне ефекті: виключивши лінійний тренд, ми отримаємо ряд, в якому сезонність повністю відсутня. У той же час ряд, що описує помісячні обсяги продажів новорічних листівок, хоча і буде мати таку ж особливість (мінімум продажів в січні і максимум у грудні) буде носити скоріше всього коливальний характер щодо тренда, що дозволяє специфікувати ці коливання як сезонний ефект.

У найпростішому випадку сезонний ефект може проявлятися у вигляді суворо періодичної залежності.

, Для будь-якого t, де t - період сезонності.

У загальному випадку значення, віддалені на t можуть бути пов'язані функціональною залежністю, тобто

.

Приміром, сезонний ефект сам може містити трендовую складову, яка відображатиме зміна амплітуди коливань.

Якщо сезонний ефект входить в ряд адитивно, томодель сезонного ефекту можна записати як

,

де- булеві, інакше індикаторні, змінні, по одній на кожен такт всередині періоду t сезонності. Так, для ряду місячних даних = 0 для всіх t, крім січня кожного року, для якого = 1 і так далі. Коеффіціентпріпоказивает відхилення січневих значень від тренда, - відхилення лютневих значень і так далі до. Щоб зняти неоднозначність у значеннях коефіцієнтів сезонності, вводять додаткове обмеження, так зване умова репараметрізаціі, зазвичай

.

У тому випадку, коли сезонний ефект носить мультиплікативний характер, тобто

модель ряду з використанням індикаторних змінних можна записати у вигляді

Коефіцієнти, у цій моделі прийнято називати сезонними індексами.

Для повністю мультиплікативного ряду

зазвичай проводять процедуру лінеаризації операцією логарифмирования

.

Домовимося називати представлені моделі сезонного ефекту «індикаторними». Якщо сезонний ефект досить «гладкий» - близький до гармоніці, використовують «гармонійне» уявлення

,

де d - амплітуда, w - умови частоти (в радіанах в одиницю часу), a - фаза хвилі. Оскільки фаза зазвичай заздалегідь невідома. Останній вираз записують як

,

де ,.

Параметри А і В можна оцінити за допомогою зазвичай регресії. Кутова частота w вважається відомою. Якщо якість підгонки виявиться незадовільним, поряд з гармонікою w основної хвилі в модель включають додатково першу гармоніку (з подвоєною основною частотою 2w), при необхідності і другу і так далі гармоніки. В принципі, з двох уявлень: індикаторного і гармонійного - слід вибирати те, яке вимагатиме меншого числа параметрів.

3.3 Модель інтервенції

Інтервенція, що представляє собою вплив, що істотно перевищує флуктуації ряду, може носити характер «імпульсу» або «сходинки».

Імпульсний вплив короткочасно: почавшись, воно майже тут же закінчується. Поетапне вплив тривало, носить стійкий характер. Узагальнена модель інтервенції має вигляд

,

де- значення детермінованої компоненти ряду, описуваної як інтервенція;

- Коефіцієнти типу авторегресії;

- Коефіцієнти типу змінного середнього;

- Екзогенна змінна одного з двох типів;

(«Щабель»), або («імпульс»)

где-- фіксований момент часу, званий моментом інтервенції.

4.Методи виділення тренда

Наведені в п.3.1 специфікації ряду є параметричними функціями часу. Оцінювання параметрів може бути проведено за методом найменших квадратів так само, як в регресійному аналізі. Хоча статистичні передумови регресійного аналізу (див п.) У тимчасових рядах часто не виконуються (особливо п.5 - некоррелированности збурень), тим не менше оцінки тренда виявляються прийнятними, якщо модель специфікована правильно і серед спостережень немає великих викидів. Порушення передумов регресійного аналізу позначається не стільки на оцінках коефіцієнтів, скільки на їх статистичних властивостях, зокрема, спотворюються оцінки дисперсії випадкової складової і довірчі інтервали для коефіцієнтів моделі.

У літературі описуються методи оцінювання в умовах коррелированности збурень, проте їх застосування вимагає додаткової інформації про кореляцію спостережень.

Головна проблема при виділенні тренда полягає в тому, що підібрати єдину специфікацію для всього тимчасового часто неможливо, оскільки змінюються умови протікання процесу. Облік цієї мінливості особливо важливий, якщо тренд обчислюється для цілей прогнозування. Тут позначається особливість саме часових рядів: дані відносяться до «далекого минулого» будуть неактуальними, даремними або навіть «шкідливими» для оцінювання параметрів моделі поточного періоду. Ось чому при аналізі часових рядів широко використовуються процедури зважування даних.

Для обліку мінливості умов модель ряду часто наділяють властивістю адаптивності, принаймні, на рівні оцінок параметрів. Адаптивність розуміється в тому сенсі, що оцінки параметрів легко перераховуються в міру надходження нових спостережень. Звичайно, і звичайного методу найменших квадратів можна надати риси адаптивності, перераховуючи оцінки кожного разу, залучаючи до процесу обчислень старі дані плюс свіжі спостереження. Однак при цьому кожен новий перерахунок веде до зміни минулих оцінок, тоді як адаптивні алгоритми вільні від цього недоліку. 4.1 Ковзні середні

Метод ковзних середніх - один з найстаріших і широко відомих способів виділення детермінованої складової часового ряду. Суть методу полягає в усередненні вихідного ряду на інтервалі часу, довжина якого обрана заздалегідь. При цьому сам обраний інтервал ковзає уздовж ряду, зрушуючи кожного разу на один такт вправо (звідси назва методу). За рахунок усереднення вдається істотно зменшити дисперсію випадкової складової.

Ряд нових значень стає більш гладким, ось чому подібну процедуру називають згладжуванням часового ряду.

Процедуру згладжування розглянемо спочатку для ряду, що містить лише трендовую складову, на яку адитивно накладено випадкових компонент.

Як відомо, гладка функція може бути локально представлена ??у вигляді полінома з досить високим ступенем точності. Відкладемо від початку часового ряду інтервал часу довжиною (2m + 1) точок і побудуємо поліном ступеня m для відібраних значень і використовуємо цей поліном для визначення значення тренда в (m + 1) -й, середньої, точці групи.

Побудуємо для визначеності поліном 3-го порядку для інтервалу з семи спостережень. Для зручності подальших перетворень Занумеруем моменти часу всередині обраного інтервалу так, щоб його середина мала нульове значення, тобто t = -3, -2, -1, 0, 1, 2, 3. Запишемо шуканий поліном:

.

Константинаходім методом найменших квадратів:

.

Диференціюємо за коефіцієнтами:

;

;

.

Суми непарних порядків t від -3 до +3 рівні 0, і рівняння зводяться до вигляду:

;

;

;

.

Використовуючи перше і третє з рівнянь, отримуємо при t = 0:

(1)

Отже, значення тренда в точці t = 0 дорівнює середньозваженому значенню семи точок з цією точкою в якості центральної і вагами

, Які в силу симетрії можна записати коротше:

.

Для того щоб обчислити значення тренда в наступній, (m + 2) -й точці вихідного ряду (у нашому випадку п'ятої), слід скористатися формулою (1), де значення спостережень беруться з інтервалу, зрушеного на такт вправо, і т.д. до точки N-m.

Далі наводяться формули для підрахунку змінного середнього підбором полиномов другого і третього порядку до відрізків ряду довжиною до 9 точок:

кількість точок формула

5

7

9.

Властивості ковзають середніх:

1) сума ваг дорівнює одиниці (тому згладжування ряду, всі члени якого рівні однієї і тієї ж константі, повинно приводити до тієї ж константі);

2) ваги симетричні щодо серединного значення;

3) формули не дозволяють обчислити значення тренда для перших і останніх m значень ряду;

4) можна вивести формули для побудови трендів на парному числі точок, однак при цьому були б отримані значення трендів в серединах тимчасових тактів. Значення тренда в точках спостережень можна визначити в цьому випадку як полусумма двох сусідніх значень тренда.

Слід зазначити, що при парному числі 2m тактів в інтервалі усереднення (двадцять чотири години на добу, чотири тижні в місяці, дванадцять місяців на рік), широко практикується просте усереднення з вагами. Нехай є, наприклад, спостереження на останній день кожного місяця з січня по грудень. Просте усереднення 12 точок з весамідает значення тренда в середині липня. Щоб отримати значення тренда на кінець липня треба взяти середнє значення тренда в середині липня і середині серпня. Виявляється, це еквівалентно усреднению 13-місячних даних, але значення на краях інтервалу беруть з вагами. Отже, якщо інтервал згладжування містить парне число 2m точок, в усередненні задіють НЕ 2m, а 2m + 1 значень ряду:

.

Ковзаючі середні, згладжуючи вихідний ряд, залишають у ньому трендовую і циклічну складові. Вибір величини інтервалу згладжування повинен робитися із змістовних міркувань. Якщо ряд містить сезонний компонент, то величина інтервалу згладжування вибирається рівною або кратною періоду сезонності. У відсутності сезонності інтервал згладжування береться зазвичай в діапазоні три-сім

Ефект Слуцького-Юла

Розглянемо, як впливає процес згладжування на випадкову складову ряду, щодо якої будемо вважати, що вона центрована і сусідні члени ряду некорреліровани.

Ковзне середнє випадкового ряду x є:

.

В силу центрированности x і відсутності кореляцій між членами вихідного ряду маємо:

і.

Далі ,.

З отриманих співвідношень видно, що усереднення призводить до зменшення дисперсії коливань. Крім того члени ряду, отримані в результаті усереднення, не є тепер незалежними. Похідний, згладжений, ряд має ненульові автокорреляции (кореляції між членами ряду, розділених k-1 спостереженнями) аж до порядку 2m. Таким чином похідний ряд буде більш гладким, ніж вихідний випадковий ряд, і в ньому можуть проявлятися систематичні коливання. Цей ефект називається ефектом Слуцького-Юла.

4.2 Визначення порядку полінома методом послідовних різниць

Якщо є ряд, що містить поліном (або локально представляється поліномом) з накладеним на нього випадковим елементом, то було б природно дослідити, чи не можна виключити поліноміальну частина обчисленням послідовних різниць ряду. Дійсно, різниці полінома порядку k являють собою поліном порядку k-1. Далі, якщо ряд містить поліном порядку p, то перехід до різницям, повторений (p + 1) разів, виключає його і залишає елементи, пов'язані з випадковою компонентою вихідного ряду.

Розглянемо, наприклад, перехід до різницям у ряді, що містить поліном третього порядку.

0 1 8 27 64 125

1 7 19 37 61

6 12 18 24

6 6 6

0 0

Взяття різниць перетворює випадкову складову ряду.

У загальному випадку отримуємо:

;

;

;

;

.

З останнього співвідношення отримуємо

.

Отже, метод послідовних різниць змінної полягає в обчисленні перше, друге, третє і т.д. різниць, визначенні сум квадратів, розподілі наи т.д. і виявлення моменту, коли це відношення стає постійним. Таким чином ми отримуємо оцінки порядку полінома, що міститься у вихідному ряді, і дисперсії випадкового компонента.4.3.Методи експоненціального згладжування

Методи побудови функцій для опису спостережень досі грунтувався на критерії найменших квадратів, відповідно до якого всі спостереження мають рівну вагу. Однак, можна припустити, що недавнім точкам слід надавати в деякому розумінні більшу вагу, а спостереження, що відносяться до далекого минулого, повинні мати у порівнянні з ними меншу цінність. До деякої міри ми враховували це в ковзних середніх з кінцевою довжиною відрізка усереднення, де значення ваг, приписуваних групі з 2m + 1 значень, що не залежать від попередніх значень. Тепер звернемося до іншого методу виділення більш «свіжих» спостережень.

Розглянемо ряд терезів, пропорційних множнику b, а іменноі т.д. Так як сума ваг повинна дорівнювати одиниці, тобто, вагами фактично будуть т.д. (Передбачається, що 0Розглянемо найпростіший ряд, який дорівнює сумі постійної (рівень) і випадкової компоненти:

.

Будемо вважати, що ряд має нескінченну передісторію, т. Е. Час приймає значення t, t-1, t-2 ..., - ?. Знайдемо оценкууровня ряду, скориставшись мінімізацією зваженої суми квадратів:

.

У наведеному виразі розбіжності між наблюденнимі значеннями ряду і оцінкою рівня беруться з експоненціально убутними вагами в залежності від віку даних.

;;.

Отриману оценкуна момент t позначимо (t). Згладжене значення в момент t можна виразити через згладжене значення в минулий момент t-1 і нове спостереження:

Отримане співвідношення

(T) =

Перепишемо трохи інакше, запровадивши так звану постійну згладжування (0 ? a ? 1).

(T),

З отриманого співвідношення видно, що нове згладжене значення виходить з попереднього корекцією останнього на частку помилки, неузгодженості, між новим і прогнозним значеннями ряду. Відбувається свого роду адаптація рівня ряду до нових даними. 4.3.2 Експоненційне згладжування високих порядків

Узагальнимо метод експоненціального згладжування на випадок, коли модель процесу визначається лінійною функцією. Як і раніше, при заданому b мінімізуємо:

.

(Тут для зручності подання знаки ~ і U опущені).

,

З урахуванням того що

,,

отримуємо

Запишемо:.

Цю операцію можна розглядати як згладжування 1-го порядку. За аналогією побудуємо згладжування 2-го порядку:

.

?

;.

;

;

;

;

;

.

Розглянуту вище процедуру можна узагальнити на випадок поліноміальних трендів більш високого порядку n, при цьому алгебраїчні вирази будуть складніше. Наприклад, якщо модель описується параболою, то використовується метод потрійного експоненціального згладжування.

5. Оцінювання та виключення сезонної компоненти

Сезонні компоненти можуть представляти самостійний інтерес або виступати в ролі заважає фактора. У першому випадку необхідно вміти виділяти їх з ряду і оцінювати параметри відповідної моделі. Що ж стосується видалення сезонної компоненти з ряду, то тут можливі кілька способів.

Розглянемо спочатку процедуру оцінювання сезонних ефектів. Нехай вихідний ряд є повністю аддитивним, тобто

.

Необхідно оценітьпо наблюденним. Іншими словами, необхідно отримати оценкікоеффіціентовіндікаторной моделі.

Як уже зазначалося, сезонний ефект проявляється на тлі тренда, тому спочатку необхідно оцінити трендовую складову одним з розглянутих методів. Потім для кожного сезонавичісляют все відносяться до нього різниці

де, як зазвичай, - наблюденное значення ряду, - оцінене значення тренда.

Кожна з цих різниць дає спільну оцінку сезонного ефекту і випадкового компонента, відмінного, правда, від ісходногов силу взяття різниць.

Виробляючи усереднення отриманих різниць, отримують оцінки ефектів. Вважаючи, що вихідний ряд містить ціле число k періодів сезонності і обмежуючись простим середнім, маємо

З урахуванням умови репараметрізаціі, що вимагає, щоб сума сезонних ефектів дорівнювала нулю, отримуємо скориговані оцінки

.

У разі мультиплікативного сезонного ефекту, коли модель ряду має вигляд

,

обчислюють вже не різниці, а відносини

.

В якості оцінки сезонного індексавиступает середнє

.

На практиці вважається, що для оцінки сезонних ефектів часовий ряд повинен містити не менше п'яти-шести періодів сезонності.

Перейдемо тепер до способів видалення сезонного ефекту з ряду. Таких способів два. Перший з них назвемо «послетрендовий». Він є логічним наслідком розглянутої вище процедури оцінювання. Для адитивної моделі видалення сезонної компоненти зводиться до віднімання оціненої сезонної компоненти з вихідного ряду. Для мультиплікативної моделі значення ряду ділять на відповідні сезонні індекси.

Другий спосіб не вимагає попередньої оцінки ні трендової, ні сезонної компонент, а грунтується на використанні різницевих операторів.

Різницеві оператори.

При дослідженні часових рядів часто є можливість представити детерміновані функції часу простими рекурентними рівняннями. Наприклад, лінійний тренд

(1)

можна записати як

(2)

Останнє співвідношення виходить з (1) порівнянням двох значень ряду для сусідніх моментів t-1 і t. Враховуючи, що співвідношення (2) справедливо і для моментів t-2 і t-1, так що, модель (1) можна записати і у вигляді

(3)

Модель (3) не містить явно параметрів, що описують тренд. Більш компактно описані перетворення можна описати, використовуючи оператори взяття різниці назад

.

.

Моделі (2) і (3) можна записати як

,.

Виходить, різниця другого порядку повністю виключає з вихідного ряду лінійний тренд. Легко бачити, що різниця порядку d виключає з ряду поліноміальний тренд порядку d-1. Нехай тепер ряд містить сезонний ефект з періодом t, так що

(4).

Процедура переходу від ряду (t = 1,2, ..., T) до рядуназивается взяттям першої сезонної різниці, а операторсезонним різницевим оператором з періодом t. З (4) випливає, що

.

Виходить, взяття сезонної разностіісключает з тимчасового рядалюбую детерміновану сезонну компоненту.

Іноді виявляються корисними сезонні оператори більш високих порядків. Так, сезонний оператор другого порядку з періодом t є

.

Якщо ряд містить і тренд, і сезонну складову, їх можна виключити, послідовно застосовуючи операториі.

Легко показати, що порядок застосування цих операторів не істотний:

.

Відзначимо також, що детермінований тренд, що складається з тренда і сезонної компоненти, після застосування операторовіполностью вироджується, тобто. Однак записавши останнє рівняння в рекуррентной формі, отримуємо

.

З останнім співвідношення видно, яким чином ряд можна необмежено продовжувати, маючи спочатку принаймні t + 1 послідовних значення.

6. Моделі випадкової складової часового ряду

лінійний ряд тимчасової система

Для зручності викладу домовимося позначати тут випадкові величини так, як це прийнято в математичній статистиці - малими літерами.

Випадковим процесом X (t) на безлічі Т називають функцію, значення якої випадкові при кожному t I T. Якщо елементи Т рахункові (дискретний час), то випадковий процес часто називають випадковою послідовністю.

Повний математичний опис випадкового процесу припускає завдання системи функцій розподілу:

- Для кожного t I T, (1)

- Для кожної пари елементів

(2)

і взагалі для будь-якого кінцевого числа елементів

(3).

Функції (1), (2), (3) називають Кінцевомірними розподілами випадкового процесу.

Побудувати таку систему функції для довільного випадкового процесу практично неможливо. Зазвичай випадкові процеси задають за допомогою апріорних припущень про його властивості, таких як незалежність збільшень, марківський характер траєкторій і т. П.

Процес, у якого все скінченномірні розподілу нормальні, називається нормальним (гауссовским). Виявляється, що для повного опису такого процесу досить знання одно- і двовимірного розподілів (1), (2), що важливо з практичної точки зору, оскільки дозволяє обмежитися дослідженням математичного очікування і кореляційної функцією процесу.

У теорії часових рядів використовуються ряд моделей випадкової складової, починаючи від найпростішої - «білого шуму», до дуже складних типу авторегресії - змінного середнього та інших, які будуються на базі білого шуму.

Перш ніж визначати процес білого шуму розглянемо послідовність незалежних випадкових величин, для якої функція розподілу є

.

З останнього співвідношення випливає, що всі скінченномірні розподілу послідовності визначаються за допомогою одновимірних розподілів.

Якщо до того ж у такій послідовності складові її випадкові величини X (t) мають нульове математичне очікування і розподілені однаково при всіх t I T, то це - «білий шум». У випадку нормальності розподілу X (t) говорять про гауссовского білому шумі. Отже, гауссовский білий шум - послідовність незалежних нормально розподілених випадкових величин з нульовим математичним очікуванням і однаковою (загальною) дисперсією.

Більш складними моделями, широко використовуються в теорії і практиці аналізу часових рядів, є лінійні моделі: процеси змінного середнього, авторегресії і змішані.

Процес змінного середнього порядку qпредставляет собою зважену суму випадкових збурень:

(4),

де- незалежні однаково розподілені випадкові величини (білий шум);

- Числові коефіцієнти.

Легко бачити з визначення, що у процесу змінного середнього порядку q (скорочено CC (q)) статистично залежними є (q + 1) поспіль величин X (t), X (t-1), ..., X (tq) . Члени ряду, віддалені один від одного більше ніж на (q + 1) такт, статистично незалежні, оскільки в їх формуванні беруть участь різні складові.

Процесом авторегресії порядку p (скорочено АР (р)) називають виважену обурену суму p минулих значень часового ряду

(5),

де- випадкове обурення, чинне в поточний момент t;

- Числові коефіцієнти.

Висловлюючи послідовно відповідно до співвідношення (5) X (t-1) через X (t-2),. . . , X (tp-1), потім X (t-2) через X (t-3),. . . , X (t-p-2) і т.д. отримаємо, що X (t) є нескінченна сума минулих возмущенійІз цього випливає, члени процесу авторегресії X (t) і X (tk) статистично залежні при будь-якому k.

Процес АР (1) часто називають процесом Маркова, АР (2) - процесом Юла. У загальному випадку марковским називають такий процес, майбутнє якого визначається тільки його станом в сьогоденні і впливами на процес, які будуть надаватися в майбутньому, тоді як його стан до теперішнього моменту при цьому неістотно. Процес АР (1)

є марковским, оскільки його стан в будь моментопределяется через значення процесу, якщо відома величинау момент. Формально процес авторегресії довільного порядкатакже можна вважати марковским, якщо його станом в момент t вважати набір

(X (t), X (t-1),..., X (t-p-1)).

Більш повно моделі СС, АР, а також їх композиція: моделі авторегресії - змінного середнього розглядаються далі (п.10.1.5). Зауважимо тільки, що всі вони представляються окремими випадками загальної лінійної моделі

(6)

де- вагові коефіцієнти, число яких, взагалі-то кажучи, нескінченно.

Серед моделей випадкової складової виділимо важливий клас - стаціонарні процеси, такі, властивості яких не змінюються в часі. Випадковий процес Y (t) називається стаціонарним, якщо для будь-яких n, розподілу випадкових велічініодінакови. Іншими словами, функції скінченновимірних розподілів не змінюються при зсуві часу:

.

Утворюють стаціонарну послідовність випадкові величини розподілені однаково, так що визначений вище процес білого шуму є стаціонарним. 7.Чісловие характеристики випадкової складової

При аналізі часових рядів використовуються числові характеристики, аналогічні характеристикам випадкових величин:

- Математичне очікування (середнє значення процесу)

;

- Автоковаріаціонная функція

;

- Дисперсія

;

- Стандартне відхилення

- Автокореляційна функція

- Приватна автокорреляционная функція

Зауважимо, що в операторі функцііусредненіе відбувається при незмінному t, тобто є математичне очікування по безлічі реалізацій (взагалі-то кажучи, потенційних оскільки «у річку часу не можна увійти двічі»).

Розглянемо введені числові характеристики для стаціонарних процесів. З визначення стаціонарності випливає, що для будь-яких s, t і

поклавши = - t, отримуємо

(1)

Виходить, у стаціонарного процесу математичне очікування і дисперсія однакові при будь-якому t, а автоковаріаціонная і автокорреляционная функції залежать не від моменту часу s або t, а лише від їх різниці (лага).

Відзначимо, що виконання властивостей (1) ще не тягне стаціонарності в сенсі визначення з п.6. Проте сталість перших двох моментів, а також залежність автокореляційної функції тільки від лага виразно відбиває деяку незмінність процесу в часі. Якщо виконані умови (1), то говорять про стаціонарності процесу в широкому сенсі, тоді як виконання умов () означає стационарность у вузькому (строгому) сенсі.

Дане вище визначення білого шуму треба трактувати у вузькому сенсі. На практиці часто обмежуються білим шумом в широкому сенсі, під яким розуміють часовий ряд (випадковий процес), у якого = 0 і

Відзначимо, що Гаусовим процес, стаціонарний у вузькому сенсі, стационарен і в широкому сенсі.

Про стаціонарності в широкому сенсі судити набагато простіше. Для цього використовують різні статистичні критерії, що базуються на одній реалізації випадкового процесу.

8.Оценіваніе числових характеристик часового ряду

Оцінювання числових характеристик випадкового часового ряду в кожен момент часу вимагає набору реалізацій (траєкторій) відповідного випадкового процесу. Хоча час і не відтворено, проте умови протікання процесу іноді можна вважати повторюваними. Особливо це характерно для технічних додатків, наприклад, коливання напруги в електричній мережі протягом доби. Тимчасові ряди, які спостерігаються в різні добу, можна вважати незалежними реалізаціями одного випадкового процесу.

Інша ситуація при дослідженні процесів соціально-економічної природи. Як правило, тут доступна єдина реалізація процесу, повторити яку не представляється можливим. Отже, отримати оцінки середнього, дисперсії, ковариации можна. Однак для стаціонарних процесів подібні оцінки все-таки можливі. Пустьнаблюденние значення часового ряду в моментисоответственно. Традиційна оцінка среднегоможет служити оцінкою математичного очікування стаціонарного (в широкому сенсі) випадкового процесу.

Ясно, що така оцінка для стаціонарного ряду буде незміщеної. Спроможність цієї оцінки встановлюється теоремою Слуцького, яка в якості необхідного і достатнього умови вимагає щоб

,

де- автокорреляционная функція процесу.

Точність оцінювання середнього залежить від довжини N ряду. Вважається, що довжина N завжди повинна бути не менше так званого часу кореляції, під яким розуміють величину

T =.

Величина Т дає уявлення про порядок величини проміжку часу, на якому зберігається помітна кореляція між двома значеннями ряду.

Розглянемо тепер отримання оцінок значень автокореляційної функції. Як і колись, - спостережені значення часового ряду. Утворюємо (N-1) пар. Ці пари можна розглядати як вибірку двох випадкових величин, для яких можна визначити оцінку стандартного коефіцієнта кореляції. Потім складемо (N-2) парі визначимо оценкуі т.д. Оскільки при підрахунку очередногооб'ем вибірки змінюється, змінюється значення середнього і стандартного відхилення для відповідного набору значень. Для спрощення прийнято вимірювати всі змінні щодо середнього значення всього ряду замінювати дисперсійні члени в знаменнику на дисперсію ряду в цілому, тобто

,

де- середнє, рівне.

При великих N розбіжність в оцінках незначні. На практиці k беруть не вище N / 4.

Якщо ряд розглядається як генеральна сукупність нескінченної довжини, то говорять про автокореляції (теоретичних) і позначають їх. Масив коеффіціентовілі відповідних їм вибіркових коеффіціентовсодержат дуже цінну інформацію про внутрішню структуру ряду. Сукупність коефіцієнтів кореляції, нанесена на графік з координатами k (лаг) по осі абсцис ілібопо осі ординат, називають коррелограмм (теоретичної або вибіркової відповідно).

Точностниє характеристики оценкіполучени для гауссовских процесів. Зокрема, для гаусівського білого шуму, у якого все кореляції дорівнюють нулю ,. Математичне ожіданіедля гауссовского білого шуму виявляється не рівним нулю, а саме ,, тобто оценкаоказивается зміщеною. Величина зміщення убуває із зростанням обсягу вибірки і не настільки істотна в прикладному аналізі.

Оценкаасімптотіческі нормальна при, що дає підставу для побудови приблизного довірчого інтервалу. Широко застосовуваний 95% -інтервал є.

Межі довірчого інтервалу, нанесені на графік, називають довірчою трубкою. Якщо коррелограмм деякого випадкового процесу не виходить за межі довірчої трубки, то цей процес близький до білого шуму. Правда, ця умова можна вважати лише достатнім. Нерідко вибіркова коррелограмм гауссовского білого шуму містить один, а то й два викиду серед перших 20 оцінок, що природно ускладнює інтерпретацію подібної коррелограмми.

Поряд з автокорреляционной функцією при аналізі структури випадкового часового ряду використовується приватна автокорреляционная функція, значення якої суть приватні коефіцієнти кореляції.

9. Вільні від закону розподілу критерії перевірки низки на випадковість

Найпростішою гіпотезою, яку можна висунути щодо коливного ряду, що не має явно вираженого тренду, є припущення, що коливання випадкові. У випадкових рядах, відповідно до гіпотези, спостереження незалежні і можуть слідувати в будь-якому порядку. Для перевірки на випадковість бажано використовувати критерій, який не потребує будь-яких обмежень на вид розподілу сукупності, з якої, за припущенням, витягуються спостережувані значення.

1. Критерій поворотних точок полягає в підрахунку піків (величин, які більше двох сусідніх) і западин (величин, які менше двох сусідніх). Розглянемо ряд y1, ..., yN.

пік западина

yt-1 yt + 1yt-1> yt yt-1ytyt + 1yt-1ytyt + 1

Рис. Поворотні точки.

Для визначення поворотної точки потрібні три послідовних значення. Початкове і кінцеве значення не можуть бути поворотними точками, т. К. Невідомо y0і yN + 1. Якщо ряд випадковий, то ці три значення можуть слідувати в будь-якому з шести можливих порядків з однаковою ймовірністю. Тільки в чотирьох з них буде поворотна точка, а саме, коли найбільше або найменше з трьох значень знаходиться в середині. Отже, ймовірність виявлення поворотної точки в будь-якій групі з трьох значень дорівнює 2/3.

з с c c c c

b b b b b b

а а a a a a

Рис. Варіанти взаємного розташування трьох точок.

Для групи з N величин визначимо лічильну змінну Х.

i 1, якщо yt-1 yt + 1ілі yt-1> yt Х = i

i 0, в іншому випадку.

Тоді число поворотних точок р в ряді є просто, а їх математичне очікування є М [p] = 2/3 (N-2). Дисперсія числа поворотних точок обчислюється за формулою D [p] = (16N-29) / 90, а саме розподіл близько до нормального.

2. Критерій, заснований на визначенні довжини фази

Інтервал між двома поворотними точками називається фазою. Для того, щоб встановити наявність фази довжини d (наприклад, висхідній), потрібно виявити d + 3 членів, що містять падіння від першого члена до другого, потім послідовний підйом до (d + 2) -го члена і падіння до (d + 3) -ему члену.

1 2 3 4 d + 1 d + 2 d + 3 N

рис. 3. Фаза довжини d.

Розглянемо групу з d + 3 чисел, розташованих у порядку зростання. Якщо, не чіпаючи двох крайніх членів, витягти пару чисел з решти d + 1 і одне з них поставити в початок, а інше в кінець, отримаємо фазу довжини d. Существуетспособов такого вибору пари чисел і кожен член пари може бути поставлений в будь-який кінець, отже число висхідних фаз одно d (d + 1).

Крім того, поворотні точки будуть мати місце, якщо перший член послідовності поставити в кінець, а будь з решти, за винятком другого, помістити в початок. Число таких послідовностей складе (d + 1). Ще стільки ж послідовностей вийти якщо останній член у вихідній, зростаючою, послідовності поставити в початок, а будь-який інший, крім останнього, в кінець. У уникнення подвійного рахунку слід виключити випадок, коли перший член ставиться на останнє місце, а останній на перше. Таким чином, в послідовності з (d + 3) чисел з фазою довжиною d число випадків зростання складе

d (d + 1) +2 (d + 1) -1 = + 3d + 1.

Число можливих послідовностей з (d + 3) чисел дорівнює числу перестановок (d + 3) !, так що ймовірність або висхідній, або спадної фази дорівнює

.

У ряді довжини N послідовно можна виділити N-2-d груп по d + 3 членів. Т.ч. математичне очікування числа фаз довжини d

.

Можна показати, що математичне очікування загального числа фаз довжини від 1 до N-3

.

3.Крітерій, заснований на знаках різниць

Цей критерій полягає в підрахунку числа позитивних різниць першого порядку в ряді, інакше кажучи, числа точок зростання ряду. Для ряду з N членів отримуємо N-1 різниць. Визначимо лічильну змінну як

Якщо тепер позначити через з число точок зростання випадкового ряду, то

.

Розподіл досить швидко прагне до нормального з дисперсією

.

В основному даний критерій рекомендується для перевірки наявності лінійного тренда. З іншого боку, критерій, заснований на поворотних точках, погано підходить для виявлення тренда, тому накладення помітних випадкових коливань на помірний тренд призводить приблизно до того ж безлічі поворотних точок, що і при відсутності тренда. .Більше Досконалим, але більш складним критерієм для виявлення лінійного тренда є регресія y на t і перевірка значущості регресійного коефіцієнта.

4.Крітерій, заснований на рангових порівняннях

Ідею порівняння сусідніх значень ряду можна розвинути до порівняння всіх значень. Для даного ряду підрахуємо число випадків, коли черговий член ряду перевищує всі наступні. Всього для порівняння імеетсяN (N-1) пар. Нехай n загальне число випадків перевищення. Підраховують ранговий коефіцієнт кореляції Кендела

.

Якщо цей коефіцієнт значущий і позитивний, то ряд зростаючий, якщо негативний, то - регресний.

10.Теоретіческій аналіз стаціонарної випадкової складової лінійного виду

Розглядається загальна лінійна модель стохастичного процесу

, (1)

де- білий шум

- Вагові коефіцієнти.

Нагадаємо, що = 0 ,,

Введемо оператор зсуву на один крок назад В:

Багаторазове (для визначеності j-кратне) застосування оператора В, позначаємо як, даетС урахуванням введених позначень загальну лінійну модель можна записати як

()

де- лінійний оператор.

Знайдемо математичне сподівання, дисперсію і автоковаріаціонную функцію для процесу (1):

;

Для того щоб модель мала сенс, дісперсіядолжна бути кінцевою, тобто передбачається, що рядсходітся.

Крім цього припускають, що має місце так зване умова оборотності:

,

де замість В фігурують комплексні числа. З цієї умови випливає існування зворотного оператора

,

де, тобто такого, що

Розкриваючи твір в останньому виразі, групуючи однорідні почли і прирівнюючи їх до нуля, отримують вирази для визначення коефіцієнтів. Так, і так далі.

Множачи () наслева, одержимо, що оборотний процес може бути записаний у вигляді

,

або

(2)

Запис (2) відповідає авторегресійної схемою нескінченного порядку. Це ж співвідношення можна трактувати як лінійний предиктор для по усім минулим значенням часового ряду, а слагаемое- як випадкову помилку цього предиктора. Якщо відомі всі минулі значення ряду, то за формою (2) можна спрогнозувати майбутнє значення ряду. 10.1 \. Моделі авторегресії

Розглянемо більш докладно моделі випадкової складової, що є окремими випадками загальної лінійної моделі, а саме моделі авторегресії, змінного середнього і змішані, що широко застосовуються на практиці. 10.1.1 авторегресії першого порядку (марківський процес)

Модель АР (1) має вигляд

.

З використанням оператора зсуву У модель прийме вигляд

.

Звідси

Рассматріваякак суму нескінченно спадної геометричної прогресії зі знаменником а В отримуємо, що

(2)

Таким чином, марківський процес є окремий випадок загальної лінійної моделі, коефіцієнти якої змінюються за законом геометричної прогресії, тобто.

Вираз (2) можна отримати і з (1) безпосередньо, виражаячерез, через т.д.

Дісперсіяв відповідність із () є

Виходить, білий шум з дісперсіейпорождает у схемі Маркова випадковий процес із збільшеною дисперсією, рівної.

Для знаходження автоковаріаціонной функції Марківського процесу можна скористатися загальним виразом (). Однак більш наочний наступний шлях. Домножимо рівняння (1) марковского процесу наи візьмемо математичне очікування

.

Оскільки другий доданок в правій частині дорівнює нулю в силу некоррелированности возмущеніяв поточний момент з минулими значеннями ряду, отримуємо

(В силу стаціонарності)

З останнього співвідношення маємо

,

тобто а збігається з коефіцієнтом автокорреляціісредніх членів ряду. Помножимо тепер (1) наи візьмемо математичне очікування:

.

Замінюючи а наи ділячи на, одержуємо

.

Надаючи k значення 2,3, ... одержимо

.

Отже, в марковском процесі все автокорреляции можна виразити через першу автокореляції. Оскільки, автокореляційна функція марковского процесу експоненціально убуває при зростанні k.

Розглянемо тепер приватну автокорреляционную функцію марковского процесу. Ми отримали, що кореляція між двома членами ряду, віддаленими на два такту, тобто междуівиражается величиною. Нозавісіт від, АОТ. Виникає питання, чи збережеться залежність междуі, якщо залежність від серединного членаустранена. Відповідний приватний коефіцієнт кореляції є

.

Оскільки, чисельник дорівнює нулю. Аналогічно можна показати, що приватні коефіцієнти кореляції для членів ряду, віддалених на 3,4 і так далі тактів, також дорівнюють нулю. Таким чином, автокорреляция існує тільки завдяки кореляції сусідніх членів, що втім випливає з математичної моделі марківського процесу.

Завершуючи розгляд моделі АР (1), відзначимо, що вона вельми часто використовується в економіко-математичних дослідженнях для опису залишків лінійної регресії, що зв'язує економічні показники. Авторерессія другого порядку (процес Юла)

Авторегрессіонний процес Юла АР (2) описується рівнянням

(1)

З використанням оператора зсуву У модель запишеться як

,

де а (В) - Авторегрессіонний оператор, тобто а (В) =.

Властивості моделі залежать від корнейіполінома

= 0, (2)

який можна записати також у вигляді

(1-В) (1-В) = 0.

Для стаціонарності процесу (1) необхідно, щоб корніілежалі всередині одиничного кола (випадок комплексних коренів), або були менше одиниці (випадок дійсних коренів), що забезпечується при.

Пустьідействітельни і різні. Разложімна прості дроби

, (3)

де.

Розглядаючи окремі доданки в (3) як суми нескінченних геометричних прогресій, отримаємо

.

Виходить АР (2) є окремий випадок загальної лінійної моделі () з коефіцієнтами

.

Розглянемо тепер автокорреляционную функцію процесу Юла. Помножимо (1) по черзі наи, візьмемо математичні очікування і розділимо на. В результаті отримаємо

Цих рівнянь достатньо для определеніячерез перші дві автокорреляции і, навпаки, за ізвестнимможно знайти.

Множачи тепер (1) наполучім рекуррентное рівняння

, (4)

з якого можна знайти автокорреляции високих порядків через перші автокорреляции. Тим самим, повністю визначається коррелограмм процесу Юла.

Досліджуємо вид коррелограмми процесу АР (2).

Вираз (4) можна розглядати як різницеве ??рівняння другого порядку щодо r з постійними коефіцієнтами.

Загальне рішення такого рівняння має вигляд

,

де- корені характеристичного рівняння

(5)

Легко бачити, що рівняння (2) і (5) еквівалентні з точністю до заміни В на z і ділення обох частин на, так що коріння цих рівнянь співпадають, тобто

Загальне рішення різницевого рівняння (4) є

(6)

де коефіцієнти А і В знаходять з граничних умов при j = 0 і j = 1.

Таким чином, у разі дійсних коренів коррелограмм АР (2) являє собою, як видно з (6), суміш двох затухаючих експонент.

У разі комплектності корнейікоррелограмма процесу АР (2) виявляється загасаючої гармонікою.

Розглянемо тепер як поводиться приватна автокорреляционная функція процесу Юла. Відмінним від нуля виявляється лише коефіцієнт, що дорівнює. Приватні кореляції більш високих порядків дорівнюють нулю (докладніше цей процес розглядається далі). Таким чином, приватна коррелограмм процесу відривається відразу після лага, рівного одиниці.

У висновку відзначимо, що моделі АР (2) виявилися прийнятними при описі поведінки циклічної природи, прообразом якого служить маятник, на який впливають малі випадкові імпульси. Амплітуда і фаза такого коливального процесу будуть увесь час меняться.10.1.3. Авторегресія порядку р

Процес авторегресії порядку р, коротко АР (р), описується виразом

(1)

або

()

Рішення різницевого щодо y виразу (1) або () складається з двох частин: загального рішення, що містить р довільних констант, і приватного рішення. Загальне рішення є

, (2)

де- є постійні коефіцієнти,

(J = 1,2, ..., р) - корені характеристичного рівняння.

(3)

Стаціонарність ряду (2) має місце, якщо корені рівняння (3) мають модуль менше одиниці. Іншими словами, коріння повинні лежати всередині одиничного кола. Вважаючи, що ряд має досить довгу передісторію, спільним рішенням (2) можна знехтувати внаслідок загасання.

Часте рішення, як видно з (), є

Останнє співвідношення є форма подання авторегресійного процесу у вигляді загальної лінійної моделі.

Послідовно помножимо рівняння (1) на, візьмемо математичне очікування і розділимо на. Отримаємо систему рівнянь щодо коефіцієнтів кореляції:

, K = 1, 2, ..., p (4)

Враховуючи, що, і вводячи матричні позначення

,

запишемо (4) у вигляді

Pa = r (5)

Систему рівнянь (5) називають системою Юла-Уокера. З неї знаходимо, що

a = r (6)

Таким чином, знаючи перші р автокореляцій часового ряду, можна знайти по (3) автокорреляции більш високого порядку, тобто повністю відновити автокорреляционную функцію (що вже зазначалося при аналізі процесів АР (1) і АР (2)).

Поведінка автокореляційної функції залежить від коренів характеристичного полінома. Зазвичай коррелограмм процесу АР (р) складається із сукупності затухаючих синусоид.

Якщо у процесу АР (2) приватна автокорреляция членів ряду, розділених 2-ма або більшою кількістю членів, дорівнює нулю, то у процесу АР (р) нулю дорівнюють автокорреляции порядку р і вище. Виходить, приватна коррелограмм процесу АР (р) повинна дорівнювати нулю, починаючи з деякого моменту. Правда, треба зауважити, що цей факт має місце для нескінченного ряду. Для кінцевих реалізацій вказати місце обриву коррелограмми часто важко.

Отже, для процесу АР (р) приватна автокорреляционная функція обривається на лагу р, тоді як автокорреляционная функція плавно спадає. 10.1.4 Процеси змінного середнього

Узагальнена лінійна модель для процесів змінного середнього містить лише кінцеве число членів, тобто в (): = 0 k> q.

Модель набуває вигляду

(1)

(В (1) коеффіціентипереобозначени через.)

Співвідношення (1) визначає процес змінного середнього порядку q, або скорочено СС (q). Умова оборотності () для процесу СС (q) виконується, якщо коріння многочлена b (В) лежать поза одиничного кола.

Знайдемо дисперсію процесу СС (q):

Всі змішані твори відаравни нулю в силу некоррелированности збурень в різні моменти часу. Для знаходження автокореляційної функції процесу СС (q) послідовно помножимо (1) наи візьмемо математичне очікування

(2)

У правій частині виразу (2) залишаться тільки ті члени, які відповідають однаковим тимчасовим тактам (див. Рис)

(K = 2)

Отже, вираз (2) є

(3)

поділивши (3) на, отримаємо

(4)

Той факт, що автокореляційна функція процесу СС (q) має кінцеву протяжність (q тактів) - характерна особливість такого процесу. Есліізвестни, то (4) можна в принципі дозволити щодо параметрів. Рівняння (4) нелінійні і в загальному випадку мають кілька рішень, однак умова оборотності завжди виділяє єдине рішення.

Як уже зазначалося, оборотні процеси СС можна розглядати як нескінченні АР- процеси -АР (?). Отже, приватна автокорреляцонная функція процесу СС (р) має нескінченну протяжність. Отже, у процесу СС (q) автокорреляционная функція обривається на лагу q, тоді як приватна автокорреляционная функція плавно спадає. 10.1.5 Комбіновані процеси авторегресії - змінного середнього

Хоча моделі АР (р) і СС (q) дозволяють описувати багато реальні процеси, число оцінюваних параметрів може надаватися значним. Для досягнення більшої гнучкості та економічності опису при підборі моделей до спостережуваних часових рядах дуже корисними виявилися змішані моделі, що містять в собі і авторегресії і ковзне середнє. Ці моделі були запропоновані Боксом і Дженкінсом і отримали назву моделі авторегресії - змінного середнього (скорочено АРСС (р, q)):

(1)

З використанням оператора зсуву У модель (1) може бути представлена ??більш компактно:

, ()

де а (В) -авторегрессіонний оператор порядку р,

b (В) -оператор змінного середнього порядку q.

Модель () може бути записані і так:

Розглянемо найпростіший змішаний процес АРСС (1,1)

Згідно

(2)

Зі співвідношення (2) видно, що модель АРСС (1,1) є окремим випадком загальної лінійної моделі () з коефіцієнтами (j> 0)

З (2) легко отримати вираз для дисперсії:

Для отримання кореляційної функції скористаємося тим же прийомом, що і при аналізі моделей авторегресії. Помножимо обидві частини модельного представлення процесу АРСС (1,1)

наи візьмемо математичне очікування:

або (з урахуванням того, що другий доданок в правій частині рівності дорівнює нулю)

Поділивши коваріацііна дісперсіюполучаем вирази для автокорреляции

отримані співвідношення показують, чтоекспоненціально убуває від початкового значення, що залежить отіпрі цьому, якщо>, то загасання монотонне; при <- загасання коливальний.

Аналогічно може бути побудована автокорреляционная функція для загальної моделі АРСС (р, q).

Помножимо всі члени (1) на. Візьмемо математичне очікування і в результаті отримаємо наступне різницеве ??рівняння.

Де- взаємна ковариационная функція між y і. Оскільки возмущеніяв момент t і значення ряду в минулі моменти (див (2)) не корелюють, 0 при k> 0.

Звідси випливає, що для значенійq + 1 автоковаріаціі і автокорреляции задовольняють тим же співвідношенням, що і в моделі АР (р):

У результаті виявляється, що при q <р вся автокорреляционная функція буде виражатися сукупністю затухаючих експонент та / або затухаючих синусоїдальних хвиль, а при q> p буде qp значень, що випадають з даної схеми. 10.1.6 Інтегрована модель авторегрессіі- змінного середнього

Модель АРСС допускає узагальнення на випадок, коли випадковий процес є нестаціонарним. Яскравим прикладом такого процесу є «випадкові блукання»:

(1)

З використанням оператора зсуву модель (1) набуває вигляду

(2)

З (2) видно, що процес (1) розходиться, оскільки. Характеристичне рівняння цього процесу має корінь, рівний одиниці, тобто має місце прикордонний випадок, коли корінь характеристичного рівняння опинився на кордоні одиничному колі. У той же час, якщо перейти до перших різницям, то процессокажется стаціонарним.

У загальному випадку потрібно було, що нестаціонарний Авторегрессіонний операторв моделі АРСС має один або кілька коренів, рівних одиниці. Іншими словами, є нестаціонарним оператором авторегресії порядку p + d; d коренів рівняння = 0 рівні одиниці, а решта р коренів лежать поза одиничного кола. Тоді можна записати, що

,

де a (B) - стаціонарний оператор авторегресії порядку р (з корінням поза одиничного кола).

Введемо оператор різниці, такий що = (1-B), тоді нестаціонарний процес АРСС запишеться як

, (3)

де b (B) - оборотний оператор змінного середнього (поза його коріння лежить поза одиничного кола).

Для разностіпорядка d, то естьмодель

описує вже стаціонарний оборотний процес АРСС (р, q).

Для того щоб від ряду різниць повернутися до вихідного ряду требуется оператор s, зворотний:

Цей оператор називають оператором підсумовування, оскільки

.

Якщо ж вихідної є різниця порядку d, то для відновлення вихідного ряду знадобиться d - кратна ітерація оператора s, інакше d- кратне підсумовування (інтегрування). Тому процес (3) прийнято називати процесом АРИСС, додаючи до АРСС термін інтегрований. Коротко модель (3) записують як АРИСС (р, d, q), де р - порядок авторегресії, d - порядок різниці, q - порядок змінного середнього. Ясно, що при d = 0 модель АРИСС переходить в модель АРСС.

На практиці d зазвичай не перевищує двох, тобто d.

Модель АРИСС допускає подання, аналогічне загальної лінійної моделі, а так само у вигляді «чистого» процесу авторегресії (нескінченного порядку). Розглянемо, наприклад, процес АРИСС (1, 1, 1):

(4)

З (4) випливає, що

Звідси

(5)

У виразі (5) коефіцієнти, починаючи з третього, обчислюються за формулою.

Подання (5) цікаве тим, що ваги, починаючи з третього, зменшуються за експоненціальним законом. Тому, хоча формальнозавісіт від усіх минулих значень, проте реальний внесок у поточне значення внесуть кілька «недавніх» значень ряду. Тому рівняння (5) найбільше підходить для прогнозування.

11.Прогнозірованіе по моделі АРИСС

Як вже зазначалося, процеси АРИСС допускають представлення у вигляді узагальненої лінійної моделі, тобто

Природно шукати майбутнє (прогнозне) значення ряду в моментв вигляді

Очікуване значення, яке ми будемо позначати як

=

Перша сума в правій частині останнього співвідношення містять лише майбутні обурення (прогноз робиться в момент t, коли відомі минулі значення і ряду збурень) і для них математичне очікування дорівнює 0 за визначенням. Що ж стосується другого доданка, то обурення тут вже відбулися, так що

Таким чином

= (1)

Помилка прогнозу, що представляє розбіжність між прогнозним значенням і його очікуванням є

=

Дисперсія помилки звідси є

(2)

Прогнозування за співвідношенням (1) в принципі можливо, проте важко оскільки вимагає знання всіх минулих збурень. До того ж для стаціонарних рядів швидкість затуханіячасто виявляється недостатньою, не кажучи вже про нестаціонарних процесах, для яких рядирасходятся.

Оскільки модель АРИСС допускає й інші уявлення, розглянемо можливості їх використання для прогнозування. Нехай модель задана безпосередньо різницевим рівнянням

(3)

За відомим значенням ряду (результатами спостережень) і оціненим значенням збурень, спираючись на рекуррентную формулу (3) можна оцінити очікуване значення ряду в момент t + 1:

-, (4)

При прогнозуванні на два такту слід знову скористатися рекурентним співвідношенням (3), де в якості наблюденного значення ряду в момент t + 1 слід взяти передвіщену по (4) величину, то естьі так далі.

Нарешті, можливе прогнозування спираючись на подання процесу АРИСС у вигляді авторегресії (). Як уже зазначалося, незважаючи на те що порядок авторегресії нескінченний, вагові коефіцієнти в уявленні ряду убувають досить швидко, тому для обчислення прогнозу досить помірне число минулих значень ряду.

Дисперсія помилки прогнозу нашагов вперед є

і відповідно до виразу (2) дається виразом

У припущенні, що випадкові обурення є Гаусовим білим шумом, то естьможно розглядати довірчий інтервал для прогнозного значення ряду стандартним чином.

12.Технологія побудови моделей АРИСС

Описані вище теоретичні схеми будувалися в припущенні, що часовий ряд має нескінченну передісторію, тоді як реально досліднику доступний обмежений обсяг спостережень. Модель доводиться підбирати експериментально, підганяючи її до наявних у розпорядженні даними. Тому з позицій теоретичного застосування теорії аналізу часових рядів визначальне значення мають питання коректної специфікації моделі АРИСС (p, d, q) (її ідентифікації) і подальшого оцінювання її параметрів.

На етапі ідентифікації спостережені дані використовуються для визначення відповідного класу моделей і робляться попередні оцінки її параметрів, тобто будується пробна модель. Потім пробна модель підганяється до даних більш ретельно; при цьому первинні оцінки, отримані на етапі ідентифікації виступають в якості початкових значень в ітеративних алгоритмах оцінювання параметрів. І нарешті, на третьому етапі отримана модель піддається діагностичної перевірки для виявлення можливої ??неадекватності моделі і вироблення відповідних змін до ней.Рассмотрім перераховані етапи докладніше.

Ідентифікація моделі

Мета ідентифікації - отримати деяке уявлення про величини p, d, q і про параметри моделі. Ідентифікація моделі розпадається на дві стадії

1. Визначення порядку різниці d вихідного ряду.

2. Ідентифікація моделі АРСС для ряду різниць.

Основний інструмент, який використовується на обох стадіях - автокорреляционная і приватна автокорреляционная функції.

У теоретичній частині ми бачили, що у стаціонарних моделей автокоррелящііспадают із зростанням k вельми швидко (за корреляционному закону). Якщо ж автокорреляционная функція згасає повільно і майже лінійно, то це свідчить про нестаціонарності процесу, проте, можливо, його перша різниця стаціонарно.

Побудувавши коррелограмм для ряду різниць, знову повторюють аналіз і так далі. Вважається, що порядок різниці d, що забезпечує стаціонарність, досягнутий тоді, коли автокорреляционная функція процессападает досить швидко. На практиці досить переглянути близько 15-20 перших значень автокорреляции вихідного ряду, його перші і другі різниці.

Після того як буде отриманий стаціонарний ряд різниць, порядку d, вивчають загальний вигляд автокорреляционной та приватної автокореляційної функцій цих різниць. Спираючись на теоретичні властивості цих функцій можна вибрати значення p і q для АР і СС операторів. Далі при вибраних p і q будуються початкові оцінки параметрів авторегресії змінного середнього b = (). Для авторегресійних процесів використовуються рівняння Юла-Уокера, де теоретичні автокорреляции замінені на їх вибіркові оцінки. Для процесів змінного середнього порядку q тільки перші q автокореляцій відмінні від нуля і можуть бути виражені через параметри (див.). Заменяяіх вибірковими оценкаміі вирішуючи отримувані рівняння відносно, отримаємо оцінку. Ці попередні оцінки можна використовувати як початкові значення для отримання на наступних кроках більш ефективних оцінок.

Для змішаних процесів АРСС процедура оцінювання ускладнюється. Так для розглянутого в п. Процесу АРСС (1,1) Установки та, точніше їх оцінки, виходять з () з заменойііх вибірковими оцінками.

У загальному випадку обчислення початкових оцінок процесу АРСС (p, q) являє багатостадійну процедуру і тут не розглядається. Зазначимо лише, що для практики особливий інтерес мають АР і СС процеси 1-го і 2-го порядків і найпростіший змішаний процес АРСС (1,1).

На закінчення зазначимо, що оцінки автокореляцій, на основі яких будуються процедури ідентифікації можуть мати великі дисперсії (особливо в умовах недостатнього обсягу вибірки - кілька десятків спостережень) і бути сильно коррелірованни. Тому говорити про суворій відповідності теоретичної та емпіричної автокореляційних функцій не доводиться. Це призводить до ускладнень при виборі p, d, q, тому для подальшого дослідження можуть бути обрані кілька моделей.

лінійний ряд система часовий ряд

Розміщено на http: // www.

Авіація і космонавтика
Автоматизація та управління
Архітектура
Астрологія
Астрономія
Банківська справа
Безпека життєдіяльності
Біографії
Біологія
Біологія і хімія
Біржова справа
Ботаніка та сільське господарство
Валютні відносини
Ветеринарія
Військова кафедра
Географія
Геодезія
Геологія
Діловодство
Гроші та кредит
Природознавство
Журналістика
Зарубіжна література
Зоологія
Видавнича справа та поліграфія
Інвестиції
Інформатика
Історія
Історія техніки
Комунікації і зв'язок
Косметологія
Короткий зміст творів
Криміналістика
Кримінологія
Криптологія
Кулінарія
Культура і мистецтво
Культурологія
Логіка
Логістика
Маркетинг
Математика
Медицина, здоров'я
Медичні науки
Менеджмент
Металургія
Музика
Наука і техніка
Нарисна геометрія
Фільми онлайн
Педагогіка
Підприємництво
Промисловість, виробництво
Психологія
Психологія, педагогіка
Радіоелектроніка
Реклама
Релігія і міфологія
Риторика
Різне
Сексологія
Соціологія
Статистика
Страхування
Будівельні науки
Будівництво
Схемотехніка
Теорія організації
Теплотехніка
Технологія
Товарознавство
Транспорт
Туризм
Управління
Керуючі науки
Фізика
Фізкультура і спорт
Філософія
Фінансові науки
Фінанси
Фотографія
Хімія
Цифрові пристрої
Екологія
Економіка
Економіко-математичне моделювання
Економічна географія
Економічна теорія
Етика

8ref.com

© 8ref.com - українські реферати


енциклопедія  бефстроганов  рагу  оселедець  солянка