трусики женские украина

На головну

 Багатовимірний статистичний аналіз в системі SPSS - Економіко-математичне моделювання

Зміст

Введення

Глава 1. Множинний регресійний аналіз

Глава 2. Кластерний аналіз

Глава 3. Факторний аналіз

Глава 4. Дискримінантний аналіз

Список використаної літератури

Введення

Вихідна інформація в соціально-економічних дослідженнях представляється найчастіше у вигляді набору об'єктів, кожен з яких характеризується рядом ознак (показників). Оскільки число таких об'єктів і ознак може досягати десятків і сотень, і візуальний аналіз цих даних малоефективний, то виникають завдання зменшення, концентрації вихідних даних, виявлення структури і взаємозв'язки між ними на основі побудови узагальнених характеристик безлічі ознак і безлічі об'єктів. Такі завдання можуть зважитися методами багатовимірного статистичного аналізу.

Багатовимірний статистичний аналіз - розділ математичної статистики, присвячений математичним методам, спрямованим на виявлення характеру і структури взаємозв'язків між компонентами досліджуваного багатовимірного ознаки і призначеним для отримання наукових і практичних висновків.

Основна увага в багатовимірному статистичному аналізі приділяється математичним методам побудови оптимальних планів збору, систематизації та обробки даних, спрямованим на виявлення характеру і структури взаємозв'язків між компонентами досліджуваного багатовимірного ознаки і призначеним для отримання наукових і практичних висновків.

Вихідним масивом багатовимірних даних для проведення багатовимірного аналізу зазвичай служать результати вимірювання компонент багатовимірного ознаки для кожного з об'єктів досліджуваної сукупності, тобто послідовність багатовимірних спостережень. Багатовимірний ознака найчастіше інтерпретується як величина випадкова, а послідовність спостережень як вибірка з генеральної сукупності. У цьому випадку вибір методу обробки вихідних статистичних даних проводиться на основі тих чи інших припущень щодо природи закону розподілу досліджуваного багатовимірного ознаки.

За змістом багатовимірний статистичний аналіз може бути умовно розбитий на три основні підрозділи:

1. Багатомірний статистичний аналіз багатовимірних розподілів та їх основних характеристик охоплює ситуації, коли оброблювані спостереження мають імовірнісну природу, тобто інтерпретуються як вибірка з відповідною генеральної сукупності. До основних завдань цього підрозділу відносяться: оцінювання статистичне досліджуваних багатовимірних розподілів та їх основних параметрів; дослідження властивостей використовуваних статистичних оцінок; дослідження розподілів ймовірностей для ряду статистик, за допомогою яких будуються статистичні критерії перевірки різних гіпотез про ймовірнісної природі аналізованих багатовимірних даних.

2. Багатомірний статистичний аналіз характеру і структури взаємозв'язків компонент досліджуваного багатовимірного ознаки об'єднує поняття і результати, властиві таким методам і моделям, як регресійний аналіз, дисперсійний аналіз, коваріаційний аналіз, факторний аналіз і т.д. Методи, що належать до цієї групи, включають як алгоритми, засновані на припущенні про ймовірнісної природі даних, так і методи, що не укладаються в рамки будь-якої імовірнісної моделі (останні частіше відносять до методів аналізу даних).

3.Многомерний статистичний аналіз геометричної структури досліджуваної сукупності багатовимірних спостережень об'єднує поняття і результати, властиві таким моделям і методам, як дискримінантний аналіз, кластерний аналіз, багатовимірне шкалювання. Вузловим для цих моделей є поняття відстані, або міри близькості між аналізованими елементами як точками деякого простору. При цьому аналізуватися можуть як об'єкти (як точки, що задаються в просторі ознак), так і ознаки (як точки, що задаються в об'єктному просторі).

Прикладне значення багатовимірного статистичного аналізу полягає в основному в вирішенні наступних трьох завдань:

· Завдання статистичного дослідження залежностей між розглянутими показниками;

· Завдання класифікації елементів (об'єктів або ознак);

· Задача зниження розмірності розглянутого простору ознак і відбору найбільш інформативних ознак.

Множинний регресійний аналіз призначений для побудови моделі, що дозволяє за значеннями незалежних змінних отримувати оцінки значень залежної змінної.

Логістична регресія для вирішення задачі класифікації. Це різновид множинної регресії, призначення якої полягає в аналізі зв'язку між декількома незалежними змінними і залежною змінною.

Факторний аналіз займається визначенням відносно невеликого числа прихованих (латентних) факторів, мінливістю яких пояснюється мінливість всіх спостережуваних показників. Факторний аналіз спрямований на зниження розмірності розглянутої задачі.

Кластерний і дискримінантний аналіз призначені для розділення сукупностей об'єктів на класи, в кожен з яких повинні входити об'єкти в певному сенсі однорідні або близькі. При кластерному аналізі заздалегідь невідомо, скільки вийде груп об'єктів і якого вони будуть обсягу. Дискримінантний аналіз розділяє об'єкти за вже існуючими класами.

Глава 1. Множинний регресійний аналіз

Завдання: Дослідження ринку житла в Орлі (Радянський і Північний райони).

У таблиці наведено дані за ціною квартир в Орлі і по різних факторів, її обумовлює:

· Ціна;

· Загальна площа;

· Площа кухні;

· Житлова площа;

· Район;

· Поверх;

· Тип будинку;

· Кількість кімнат. (Рис.1)

Рис. 1 Вихідні дані

У графі «Район» використані позначення:

3 - Радянський (елітний, відноситься до центральних районів);

4 - Північний.

У графі «Тип будинку»:

1 - цегляний;

0 - панельний.

Потрібно:

1. Проаналізувати зв'язок усіх факторів з показником «Ціна» і між собою. Відібрати фактори, які найбільше підходять для побудови регресійної моделі;

2. Сконструювати фіктивну змінну, що відображає приналежність квартири до центральних і периферійних районах міста;

3. Побудувати лінійну модель регресії для всіх факторів, включивши в неї фіктивну змінну. Пояснити економічний зміст параметрів рівняння. Оцінити якість моделі, статистичну значущість рівняння і його параметрів;

4. Розподілити фактори (крім фіктивної змінної) за ступенем впливу на показник «Ціна»;

5. Побудувати лінійну модель регресії для найбільш впливових чинників, залишивши в рівнянні фіктивну змінну. Оцінити якість і статистичну значущість рівняння і його параметрів;

6. Обгрунтувати доцільність чи недоцільність включення в рівняння п. 3 і 5 фіктивної змінної;

7. Оцінити інтервальні оцінки параметрів рівняння з імовірністю 95%;

8. Визначити, скільки буде коштувати квартира загальною площею 74,5 м? в елітному (периферійному) районі.

Виконання:

1. Проаналізувавши зв'язок усіх факторів з показником «Ціна» і між собою, були відібрані фактори, які найбільше підходять для побудови регресійної моделі, використовуючи метод включення «Forward»:

А) загальна площа;

Б) район;

В) кількість кімнат.

Включені / виключені змінні (a)

 Модель Включені змінні Виключені змінні Метод

 1 Загальна площа. Включення (критерій: ймовірність F-включення> =, 050)

 2 Район. Включення (критерій: ймовірність F-включення> =, 050)

 3 Кількість кімнат. Включення (критерій: ймовірність F-включення> =, 050)

a Залежна змінна: Ціна

2. Змінна Х4 «Район» є фіктивною змінною, так як має 2 значення: 3-приналежність до центральному району «Радянський», 4- до периферійного району «Північний».

3. Побудуємо лінійну модель регресії для всіх факторів (включаючи фіктивну змінну Х4).

Отримана модель:

У = 348,349 + 35,788 Х1 -217,075 Х4 +305,687 Х7

Оцінка якості моделі.

Коефіцієнт детермінації R2 = 0,807

Показує частку варіації результативної ознаки під впливом досліджуваних факторів. Отже, близько 89% варіації залежної змінної враховано і обумовлено в моделі впливом включених факторів.

Коефіцієнт множинної кореляції R = 0,898

Показує тісноту зв'язку між залежною змінною У з усіма включеними в модель пояснюють чинниками.

Стандартна помилка = 126,477

Коефіцієнт Дарбіна - Уотсона = 2,136

Перевірка значущості рівняння регресії

Значення критерію F-Фішера = 41,687

Рівняння регресії слід визнати адекватним, модель вважається значущою.

Найбільш значимий фактор - кількість кімнат (F = 41,687)

Другий за значимістю фактор-загальна площа (F = 40,806)

Третій за значимістю фактор-район (F = 32,288)

4. Побудуємо лінійну модель регресію з усіма факторами (крім фіктивної змінної Х4)

За ступенем впливу на показник «Ціна» розподілили:

Найбільш значимий фактор - загальна площа (F = 40,806)

Другий за значимістю фактор-кількість кімнат (F = 29,313)

5. Включені / виключені змінні

 Модель Включені змінні Виключені змінні Метод

 1 Загальна площа. Включення (критерій: ймовірність F-включення> =, 050)

 2 Район. Включення (критерій: ймовірність F-включення> =, 050)

 3 Кількість кімнат. Включення (критерій: ймовірність F-включення> =, 050)

a Залежна змінна: Ціна

6. Побудуємо лінійну модель регресії для найбільш впливових факторів з фіктивною змінною, в нашому випадку вона і є одним з впливових факторів.

Отримана модель:

У = 348,349 + 35,788 Х1 -217,075 Х4 +305,687 Х7

Оцінка якості моделі.

Коефіцієнт детермінації R2 = 0,807

Показує частку варіації результативної ознаки під впливом досліджуваних факторів. Отже, близько 89% варіації залежної змінної враховано і обумовлено в моделі впливом включених факторів.

Коефіцієнт множинної кореляції R = 0,898

Показує тісноту зв'язку між залежною змінною У з усіма включеними в модель пояснюють чинниками.

Стандартна помилка = 126,477

Коефіцієнт Дарбіна - Уотсона = 2,136

Перевірка значущості рівняння регресії

Значення критерію F-Фішера = 41,687

Рівняння регресії слід визнати адекватним, модель вважається значущою.

Найбільш значимий фактор - кількість кімнат (F = 41,687)

Другий за значимістю фактор-загальна площа (F = 40,806)

Третій за значимістю фактор-район (F = 32,288)

7. Фіктивна змінна Х4 є значимим чинником, тому доцільно включити її в рівняння.

Інтервальні оцінки параметрів рівняння показують результати прогнозування за моделлю регресії.

З імовірністю 95% обсяг реалізації в прогнозованому місяці складе від 540,765 до 1080147000. Руб.

8. Визначення вартості квартири в елітному районі

Для 1 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 1

Для 2 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 2

Для 3 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 3

в периферійному

Для 1 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 1

Для 2 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 2

Для 3 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 3

Глава 2. Кластерний аналіз

Завдання: Дослідження структури грошових витрат і заощаджень населення.

У таблиці представлена ??структура грошових витрат і заощаджень населення по регіонах Центрального федерального округу Російської федерації в 2003 р Для наступних показників:

· ПТіОУ - купівля товарів і оплата послуг;

· Опів - обов'язкові платежі і внески;

· ПН - придбання нерухомості;

· ПФА - приріст фінансових активів;

· ДР - приріст (зменшення) грошей на руках у населення.

Рис. 8 Вихідні дані

Потрібно:

1) визначити оптимальну кількість кластерів для розбиття регіонів на однорідні групи за всіма группіровочним ознаками одночасно;

2) провести класифікацію областей ієрархічним методом з алгоритмом міжгрупових зв'язків і відобразити результати у вигляді дендрограмми;

3) проаналізувати основні пріоритети грошових витрат і заощаджень в отриманих кластерах;

4) порівняти отриману класифікацію з результатами застосування алгоритму внутрішньогрупових зв'язків.

Виконання:

1) Визначити оптимальну кількість кластерів для розбиття регіонів на однорідні групи за всіма группіровочним ознаками одночасно;

Для визначення оптимальної кількості кластерів потрібно скористатися ієрархічних кластерним аналізом і звернутися до таблиці «Кроки агломерації» до колонку «Коефіцієнти».

Ці коефіцієнти мають на увазі відстань між двома кластерами, визначене на підставі обраної дистанційній заходи (Евклідова відстань). На тому етапі, коли міра відстані між двома кластерами збільшується стрибкоподібно, процес об'єднання в нові кластери необхідно зупинити.

У підсумку, оптимальним вважається число кластерів, рівне різниці кількості спостережень (17) і номера кроку (14), після якого коефіцієнт збільшується стрибкоподібно. Таким чином, оптимальна кількість кластерів дорівнює 3. (Рис.9)

статистичний математичний аналіз кластерний

Рис. 9 Таблиця «Кроки агломерації»

2) Провести класифікацію областей ієрархічним методом з алгоритмом міжгрупових зв'язків і відобразити результати у вигляді дендрограмми;

Тепер, використовуючи оптимальну кількість кластерів, проводимо класифікацію областей ієрархічним методом. І у вихідних даних звертаємося до таблиці «Належність до кластерів». (Рис.10)

Рис. 10 Таблиця «Належність до кластерів»

На Рис. 10 чітко видно, що в 3 кластер потрапили 2 області (Калузька, Московська) та м Москва, у 2 кластер дві (Брянська, Воронезька, Івановська, Липецька, Орловська, Рязанська, Смоленська, Тамбовська, Тверська), в 1 кластер - Білгородська , Володимирська, Костромська, Курська, Тульська, Ярославська.

Рис. 11 Дендрограмма

3) проаналізувати основні пріоритети грошових витрат і заощаджень, в отриманих кластерах;

Для аналізу отриманих кластерів нам потрібно провести «Порівняння середніх». У вихідному вікні виводиться наступна таблиця (Рис. 12)

Рис. 12 Середні значення змінних

У таблиці «Середніх значень» ми можемо простежити, яким структурам віддається найбільший пріоритет у розподілі грошових витрат і заощаджень населення.

У першу чергу варто відзначити, що найвищий пріоритет у всіх областях віддається купівлі товарів і оплату послуг. Більше значення параметр приймає в 3 кластері.

2 місце посідає приріст фінансових активів. Найбільше значення в 1 кластері.

Найменший коефіцієнт в 1 і 2 кластерах у «придбання нерухомості», а в 3 кластері виявлено помітне зменшення грошей на руках у населення.

В цілому особливе значення для населення має покупка товарів і оплата послуг і незначне покупка нерухомості.

4) порівняти отриману класифікацію з результатами застосування алгоритму внутрішньогрупових зв'язків.

В аналізі міжгрупових зв'язків ситуація практично не змінилася, за винятком Тамбовської області, яка з 2 кластера потрапила в 1. (Рис.13)

Рис. 13 Аналіз внутрішньогрупових зв'язків

У таблиці «Середніх значень» ніяких змін не відбулося.

Глава 3. Факторний аналіз

Завдання: Аналіз діяльності підприємств легкої промисловості.

Є дані обстежень 20 підприємств легкої промисловості (Рис. 14) за наступними характерними ознаками:

· Х1 - рівень фондовіддачі;

· Х2 - трудомісткість одиниці продукції;

· Х3 - питома вага закупівельних матеріалів у загальних витратах;

· Х4 - коефіцієнт змінності обладнання;

· Х5 - премії та винагороди на одного працівника;

· Х6 - питома вага втрат від браку;

· Х7 - середньорічна вартість основних виробничих фондів;

· Х8 - середньорічний фонд заробітної плати;

· Х9 - рівень реалізованості продукції;

· Х10 - індекс постійного активу (відношення основних засобів та інших необоротних активів до власних коштів);

· Х11 - оборотність оборотних коштів;

· Х12 - невиробничі витрати.

Рис.14 Вихідні дані

Потрібно:

1. провести факторний аналіз наступних змінних: 1,3,5-7, 9, 11,12, виявити і інтерпретувати факторні ознаки;

2. вказати найбільш благополучні та перспективні підприємства.

Виконання:

1. Провести факторний аналіз наступних змінних: 1,3,5-7, 9, 11,12, виявити і інтерпретувати факторні ознаки.

Факторний аналіз - це сукупність методів, які на основі реально існуючих зв'язків об'єктів (ознак) дозволяють виявити латентні (неявні) узагальнюючі характеристики організаційної структури.

У діалоговому вікні факторного аналізу вибираємо наші змінні, вказуємо необхідні параметри.

Рис. 15 Повна пояснена дисперсія

По таблиці "Повною пояснене дисперсії» видно, що виділені 3 фактори, що пояснюють 74,8% варіацій змінних - побудована модель досить хороша.

Тепер інтерпретуємо факторні ознаки по «Матриці повернутих компонент»: (Рис.16).

Рис. 16 Матриця повернутих компонент

Фактор 1 найбільш тісно пов'язаний з рівнем реалізації продуктів і має зворотну залежність від невиробничих витрат.

Фактор 2 найбільш тісно пов'язаний з питомою вагою закупівельних матеріалів у загальних витратах і питомою вагою втрат від браку і має зворотну залежність від премій і винагород на одного працівника.

Фактор 3 найбільш тісно пов'язаний з рівнем фондовіддачі і оборотність оборотних коштів і має зворотну залежність від середньорічної вартості основних виробничих фондів.

2. Вказати найбільш благополучні та перспективні підприємства.

Для того, щоб виявити найбільш благополучні підприємства проведемо сортування даних по 3 факторним ознаками спаданням. (Рис.17)

Рис. 17

Найбільш благополучними підприємствами слід вважати: 13,4,5, так як в цілому по 3 факторам їх показники займають найбільш високі і стабільні позиції.

Глава 4. Дискримінантний аналіз

Оцінка кредитоспроможності юридичних осіб в комерційному банку

В якості значущих показників, що характеризують фінансовий стан організацій-позичальників, банком обрані шість показників (табл. 4.1.1):

QR (Х1) - коефіцієнт термінової ліквідності;

CR (Х2) - коефіцієнт поточної ліквідності;

EQ / TA (Х3) - коефіцієнт фінансової незалежності;

TD / EQ (Х4) - сумарні зобов'язання до власного капіталу;

ROS (Х5) - рентабельність продажів;

FAT (Х6) - оборотність основних засобів.

Таблиця 4.1.1. Вихідні дані

 Позичальник QR CR EQ / TA TD / EQ ROS,% FAT, раз

 1 0,614 2,982 0,592 0,303 13,179 2,712

 2 8,604 4,496 0,284 0,109 17,181 10,115

 3 6,207 4,423 0,366 0,228 15,385 2,151

Потрібно:

На основі дискримінантного аналізу з використанням пакета SPSS визначити, до якої з чотирьох категорій відносяться три позичальника (юридичних особи), які бажають отримати кредит у комерційному банку:

- Група 1 - з відмінними фінансовими показниками;

- Група 2 - з хорошими фінансовими показниками;

- Група 3 - з поганими фінансовими показниками;

- Група 4 - з дуже поганими фінансовими показниками.

За результатами розрахунку побудувати дискримінантні функції; оцінити їх значимість за коефіцієнтом Вілкса (?). Побудувати карту сприйняття і діаграми взаємного розташування спостережень у просторі трьох функцій. Виконати інтерпретацію результатів проведеного аналізу.

Хід виконання:

Для того щоб визначити, до якої з чотирьох категорій відносяться три позичальника, бажаючі отримати кредит у комерційному банку, будуємо дискримінантний аналіз, який дозволяє визначити, до якої з раніше виявлених сукупностей (навчальних вибірок) слід віднести нових клієнтів.

В якості залежної змінної виберемо групу, до якої може ставитися позичальник залежно від його фінансових показників. З даних завдання, кожній групі присвоюється відповідна оцінка 1, 2, 3 і 4.

Ненормовані канонічні коефіцієнти дискримінантних функцій, наведені на рис. 4.1.1, використовуються для побудови рівняння дискримінантних функцій D1 (X), D2 (X) і D3 (X):

1.) D1 (X) =

2.) D2 (X) =

3.) D3 (X) =

 Функція

 1 2 3

 Х1, 064, 363 -, 021

 Х2 1,818 2,073 -, 573

 Х3 9,328 -10,089 4,726

 Х4, 002, 003, 002

 Х5, 129, 048 -, 097

 Х6, 147, 092, 026

 (Константа) -6,112 1,170 -1,183

Рис. 4.1.1. Коефіцієнти канонічної дискримінантної функції

 Перевірка функції (й) Лямбда Вілкса Хі-квадрат ст.св. ЗНЧ.

 від 1 до 3, 017 139,005 18, 000

 від 2 до 3, 472 25,502 10, 004

 3, 878 4,436 4, 350

Рис. 4.1.2. Лямбда Уїлкса

Однак, оскільки значимість за коефіцієнтом Вілкса (рис. 4.1.2) другої і третьої функції більш 0.001, їх для дискримінації використовувати недоцільно.

Дані таблиці «Результати класифікації» (рис. 4.1.3) свідчать про те, що для 100% спостережень класифікація проведена коректно, висока точність досягнута у всіх чотирьох групах (100%).

Рис. 4.1.3. Результати класифікації

Інформація про фактичні та передвіщених групах для кожного позичальника наведені в таблиці «поточечной статистики» (рис. 4.1.4).

В результаті дискримінантного аналізі високою ймовірністю визначена приналежність нових позичальників банку до навчального подмножеству М1 - перший, другий і третій позичальник (порядковий номери 41, 42, 43) віднесено до підмножини М1 з відповідними ймовірностями 100%.

 Номер спостереження Фактична група найімовірнішого група

 Передвіщена група P (D> d | G = g) P (G = g | D = d)

 p ст.св.

 1 1 1 0,317601242 3 0,99

 ... ... ... ... ... ...

 41 несгруппірованних 1 0,107179896 3 січня

 42 несгруппірованних 1 3,07013E-34 1 Березня

 43 несгруппірованних 1 4,13563E-21 1 Березня

Рис. 4.1.4. Поточечной статистика

Координати центроїдів по групах наведені в таблиці «Функції в центроїди груп» (рис. 4.1.5). Вони використовуються для нанесення Центроїд на карту сприйняття (рис. 4.1.6).

 ГРУПА Функція

 1 2 3

 1 7,831, 610, 036

 2, 309 -1,455, 179

 3 -2,792, 074 -, 579

 4 -5,348, 771, 365

Рис. 4.1.5. Функції в центроїди груп

Рис. 4.1.6. Карта сприйняття для двох дискримінантних функцій D1 (X) і D2 (X) (* - центроид групи)

Поле «Територіальної карти» розділено дискримінантного функціями на чотири області: в лівій частині знаходяться переважно спостереження четвертої групи позичальників з дуже поганими фінансовими показниками, в правій частині - першої групи з відмінними фінансовими показниками, в середній і нижній частині - третьої і другої групи позичальників з поганими і хорошими фінансовими показниками відповідно.

Рис. 4.1.7. Діаграма розсіювання для всіх груп

На рис. 4.1.7 наведено об'єднаний графік розподілу всіх груп позичальників разом зі своїми центроїдами; його можна використовувати для проведення порівняльного візуального аналізу характеру взаємного розташування груп позичальників банку по фінансовими показниками. У правій частині графіка розташовані позичальники з високими показниками, у лівій - з низькою, а в середній частині - з середніми фінансовими показниками. Оскільки за результатами розрахунку друга дискримінантний функція D2 (X) виявилася незначущі, то відмінності координат центроїдів по цій осі незначні.

Оцінка кредитоспроможності фізичних осіб в комерційному банку

Кредитний відділ комерційного банку провів вибіркове обстеження 30 своїх клієнтів (фізичних осіб). На основі попереднього аналізу даних, позичальники оцінювалися за шістьма показниками (табл. 4.2.1):

Х1 - позичальник брав кредит в комерційних банках раніше;

Х2 - середньомісячний дохід сім'ї позичальника, тис. Руб .;

Х3 - термін (період) погашення кредиту, років;

Х4 - розмір виданого кредиту, тис. Руб .;

Х5 - склад сім'ї позичальника, чол .;

Х6 - вік позичальника, років.

При цьому по імовірності повернення кредиту виявлені три групи позичальників:

- Група 1 - з низькою ймовірністю погашення кредиту;

- Група 2 - з середньою ймовірністю погашення кредиту;

- Група 3 - з високою ймовірністю погашення кредиту.

Потрібно:

На основі дискримінантного аналізу з використанням пакета SPSS необхідно класифікувати трьох клієнтів банку (по ймовірності погашення кредиту), тобто оцінити належність кожного з них до однієї з трьох груп. За результатами розрахунку побудувати значимі дискримінантних функції, їх значущість оцінити за коефіцієнтом Вілкса (?). У просторі двох дискримінантних функцій для кожної групи побудувати діаграми взаємного розташування спостережень і об'єднану діаграму. Оцінити місце розташування кожного позичальника на цих діаграмах. Виконати інтерпретацію результатів проведеного аналізу.

Таблиця 4.2.1. Вихідні дані

 Позичальник Брався Чи кредит раніше (1 - так, 2 - ні) Середньомісячний дохід сім'ї позичальника, тис. Руб. Період погашення кредиту, років Розмір кредиту, тис. Руб. Склад сім'ї позичальника, чол. Вік позичальника, років

 1 1 36,47 10 450 6 43

 2 1 47,37 3 260 4 52

 3 1 46,85 9 470 3 44

Хід виконання:

Для побудови дискримінантного аналізу в якості залежної змінної виберемо ймовірність своєчасного погашення кредиту клієнтом. Враховуючи, що вона може бути низькою, середньою і високою, кожної категорії присвоїмо відповідну оцінку 1,2 і 3.

Ненормовані канонічні коефіцієнти дискримінантних функцій, наведені на рис. 4.2.1, використовуються для побудови рівняння дискримінантних функцій D1 (X), D2 (X):

1.) D1 (X) =

2.) D2 (X) =

 Функція

 1 лютому

 Брався Чи кредит раніше -2,566 3,291

 Середньомісячний дохід сім'ї, 290, 151

 Період погашення кредиту, 009, 631

 Розмір кредиту, 008 -, 009

 Склад сім'ї позичальника, чол -, 876 -, 231

 Вік позичальника, років, 032, 044

 (Константа) -4,286 -11,943

Рис. 4.2.1. Коефіцієнти канонічної дискримінантної функції

 Перевірка функції (й) Лямбда Вілкса Хі-квадрат ст.св. ЗНЧ.

 від 1 до 2, 104 55,549 12, 000

 2, 759 6,757 5, 239

Рис. 4.2.2. Лямбда Уїлкса

За коефіцієнтом Вілкса (рис. 4.2.2) для другої функції значимість більш 0.001, отже, її для дискримінації використовувати недоцільно.

Дані таблиці «Результати класифікації» (рис. 4.2.3) свідчать про те, що для 93,3% спостережень класифікація проведена коректно, висока точність досягнута в першій і другій групах (100% і 91,7%), менш точні результати отримані в третій групі (88, 9%).

Рис. 4.2.3. Результати класифікації

Інформація про фактичні та передвіщених групах для кожного клієнта наведені в таблиці «поточечной статистики» (рис. 4.2.4).

В результаті дискримінантного аналізі високою ймовірністю визначена приналежність нових клієнтів банку до навчального подмножеству М3 - перший, другий і третій клієнт (порядковий номери 31, 32, 33) віднесено до підмножини М3 з відповідними ймовірностями 99%, 99% і 100%.

 Номер спостереження Фактична група найімовірнішого група

 Передвіщена група P (D> d | G = g) P (G = g | D = d)

 p ст.св.

 1 2 2 0,720783301 2 0,97638652

 ... ... ... ... ... ...

 31 несгруппірованних 3 0,728612614 2 0,999624597

 32 несгруппірованних 3 0,000220059 2 0,999999998

 33 несгруппірованних 3 1,52747E-09 1 лютого

Рис. 4.2.4. Поточечной статистика

 Імовірність погашення кредиту Функція

 1 лютому

 1 -2,873, 503

 2 -, 289 -, 652

 3 3,258, 366

Рис. 4.2.5. Функції в центроїди груп

Координати центроїдів по групах наведені в таблиці «Функції в центроїди груп» (рис. 4.2.5). Вони використовуються для нанесення Центроїд на карту сприйняття (рис. 4.2.6).

Поле «Територіальної карти» розділено дискримінантного функціями на три області: в лівій частині знаходяться переважно спостереження першої групи клієнтів з дуже низькою ймовірністю погашення кредиту, в правій частині - третьої групи з високою ймовірністю, у середній - другої групи клієнтів із середньою ймовірністю повернення кредиту відповідно .

На рис. 4.2.7 (а - в) відображено прихильність клієнтів кожної з трьох груп на площині двох дискримінантних функцій D1 (X) і D2 (X). За цими графіками можна проводити детальний аналіз ймовірності погашення кредиту всередині кожної групи, судити про характер розподілу клієнтів і оцінювати ступінь їх віддаленості від відповідного центроїда.

Рис. 4.2.6. Карта сприйняття для трьох дискримінантних функцій D1 (X) і D2 (X) (* - центроид групи)

Так само на рис. 4.2.7 (г) в тій же системі координат наведено об'єднаний графік розподілу всіх груп клієнтів разом зі своїми центроїдами; його можна використовувати для проведення порівняльного візуального аналізу характеру взаємного розташування груп клієнтів банку з різними ймовірностями погашення кредиту. У лівій частині графіка розташовані позичальники з високою ймовірністю погашення кредиту, у правій - з низькою, а в середній частині - з середньою ймовірністю. Оскільки за результатами розрахунку друга дискримінантний функція D2 (X) виявилася незначущі, то відмінності координат центроїдів по цій осі незначні.

 б)

 г)

 а)

 в)

Рис. 4.2.7. Розташування спостережень на площині двох дискримінантних функцій для груп з низькою (а), середньої (б), високої (с) ймовірністю погашення кредиту і для всіх груп (г)

Список літератури

1. «Багатомірний статистичний аналіз в економічних задачах. Комп'ютерне моделювання в SPSS », Вузівський підручник, 2009

2. Орлов А.І. «Прикладна статистика» М .: Видавництво «Іспит», 2004

3. Фішер Р.А. «Статистичні методи для дослідників», 1954

4. Калініна В.М., Соловйов В.І. «Введення в багатомірний статистичний аналіз» Навчальний посібник ГУУ, 2003;

5. Ахім Бююль, Петер Цёфель, «SPSS: мистецтво обробки інформації» Изд-во DiaSoft, 2005р .;

6. http://ru.wikipedia.org/wiki

Авіація і космонавтика
Автоматизація та управління
Архітектура
Астрологія
Астрономія
Банківська справа
Безпека життєдіяльності
Біографії
Біологія
Біологія і хімія
Біржова справа
Ботаніка та сільське господарство
Валютні відносини
Ветеринарія
Військова кафедра
Географія
Геодезія
Геологія
Діловодство
Гроші та кредит
Природознавство
Журналістика
Зарубіжна література
Зоологія
Видавнича справа та поліграфія
Інвестиції
Інформатика
Історія
Історія техніки
Комунікації і зв'язок
Косметологія
Короткий зміст творів
Криміналістика
Кримінологія
Криптологія
Кулінарія
Культура і мистецтво
Культурологія
Логіка
Логістика
Маркетинг
Математика
Медицина, здоров'я
Медичні науки
Менеджмент
Металургія
Музика
Наука і техніка
Нарисна геометрія
Фільми онлайн
Педагогіка
Підприємництво
Промисловість, виробництво
Психологія
Психологія, педагогіка
Радіоелектроніка
Реклама
Релігія і міфологія
Риторика
Різне
Сексологія
Соціологія
Статистика
Страхування
Будівельні науки
Будівництво
Схемотехніка
Теорія організації
Теплотехніка
Технологія
Товарознавство
Транспорт
Туризм
Управління
Керуючі науки
Фізика
Фізкультура і спорт
Філософія
Фінансові науки
Фінанси
Фотографія
Хімія
Цифрові пристрої
Екологія
Економіка
Економіко-математичне моделювання
Економічна географія
Економічна теорія
Етика

8ref.com

© 8ref.com - українські реферати


енциклопедія  бефстроганов  рагу  оселедець  солянка