Головна
Банківська справа  |  БЖД  |  Біографії  |  Біологія  |  Біохімія  |  Ботаніка та с/г  |  Будівництво  |  Військова кафедра  |  Географія  |  Геологія  |  Екологія  |  Економіка  |  Етика  |  Журналістика  |  Історія техніки  |  Історія  |  Комунікації  |  Кулінарія  |  Культурологія  |  Література  |  Маркетинг  |  Математика  |  Медицина  |  Менеджмент  |  Мистецтво  |  Моделювання  |  Музика  |  Наука і техніка  |  Педагогіка  |  Підприємництво  |  Політекономія  |  Промисловість  |  Психологія, педагогіка  |  Психологія  |  Радіоелектроніка  |  Реклама  |  Релігія  |  Різне  |  Сексологія  |  Соціологія  |  Спорт  |  Технологія  |  Транспорт  |  Фізика  |  Філософія  |  Фінанси  |  Фінансові науки  |  Хімія

Перевірка гіпотези про незалежність двох випадкових величин для будь-якого типу шкал - Математика

С.В. Усатіков, кандидат фіз-мат наук, доцент; С.П. Грушевський, кандидат фіз-мат наук, доцент; М.М. Кириченко, кандидат соціологічних наук

У багатьох практичних завданнях ми досліджуємо об'єкти, що володіють декількома (двома або більше) ознаками, і хочемо з'ясувати, наскільки ці ознаки пов'язані між собою. Наприклад, у кожної людини є вік і місце народження, рівень освіти і річний дохід, стать і соціальна приналежність і т.п. Питання полягає в тому, чи можна за ступенем вираженості однієї ознаки судити про ступінь вираженості іншого, або ж знання про один нічого не додає до знання про інше (тобто ці ознаки проявляються незалежно один від одного). Відповіді на такі питання можуть мати значну практичну цінність. Наприклад, якщо ми встановимо, що ознаки "професія" і "політичні переконання" незалежні, то соціологічні опитування по прогнозу результатів виборів можна проводити без урахування професії опитуваних.

Перш за все слід дати визначення інтуїтивно зрозумілій ймовірнісної незалежності. А саме, випадкова подія А незалежно від випадкової події В, якщо ймовірність одночасної появи і події А, і події В в досвіді дорівнює добутку ймовірностей цих подій.

Іноді ознаки пов'язані жорстко: якщо професія - гірник або сталевар, то підлогу, безсумнівно, чоловічий. Тим самим за деякими значеннями ознаки "професія" можна дізнатися значення ознаки "стать". Інша крайність - відсутність зв'язку: якщо очі сірі, то яка професія? Дослідника в подібних завданнях цікавить, наскільки точно можна передбачити значення однієї ознаки за значенням іншого. Цій проблемі повинна передувати більш проста: треба спочатку перевірити чи існує взагалі який-небудь зв'язок між цими ознаками? Таким чином, виникає і вимагає перевірки наступна нульова гіпотеза: прояви однієї ознаки незалежні від проявів іншого в досвіді.

Відзначимо ще одну важливу обставину. Адже необхідно досліджувані ознаки якось виміряти, представити у вигляді поділок якийсь шкали, і дуже часто це не ділення секундоміра або лінійки. Як виміряти "професію", "політичні переконання" або "ступінь довіри"? Якщо привласнити проявам ознаки будь-які числові значення, дуже часто ці числа не можна навіть впорядкувати по зростанню.

Зауважимо ще також, що до перевірки незалежних ознак дуже часто можна звести задачу однофакторного аналізу про відсутність ефекту обробки. Тоді однією ознакою стає відгук, а іншим - спосіб обробки. Причому на відміну від розглянутого в попередньому пункті критерію Вілкоксона, Манна і Уїтні, способів обробки може бути і два, і три, і більше трьох.

Нехай перша ознака має шкалу х1, ..., хк. Наприклад, ознака "ліки" може бути х1 = "перше", х2 = "друге", х3 = "третє". Друга ознака має шкалу у1, ..., уl. Наприклад, ознака "результат" може бути у1 = "сприятливий" або у2 = "несприятливий"

Проведено n експериментів, в яких nij ряд поділки шкал xi (1Ј iЈ k) і y1 (1Ј jЈ l) з'явилися разом. Ці числа nij зручно записати у вигляді таблиці спряженості ознак розміру k · l.

Наприклад:

 результат yi першого = х1 другого = х2 третій = х3 всього

 у1 = сприятливий 29 = n11 38 = n21 53 = n31 120 = N1

 у2 = несприятливий 1 = n12 2 = n22 7 = n32 10 = N2

 всього 30 = n1 40 = n2 60 = n3 130 = n

Тут "ліки" можна трактувати як спосіб обробки, а "результат" як відгук. Відсутність ефекту обробки означає, що всі ці три ліки діють однаково і ознаки незалежні.

У цьому прикладі проведено n = 130 експериментів, в яких n11 = 29 разів перші ліки допомогло, n12 = 1 раз від першого ліки стало гірше і т.п.

Позначимо ni (1Ј iЈ k) суму чисел по стовпцях таблиці, а Nj (1Ј jЈ l) суму чисел по рядках таблиці. У даному прикладі n1 = 30 по одну колонку, n2 = 40 по дві колонки, N1 = 120 по першому рядку і т.п. Ясно, що ni / n є оцінка ймовірності появи поділу xi шкали, а Nj / n - ймовірність для yj. У свою чергу nij / n є оцінка ймовірності одночасної появи поділів xi і yj на шкалах першого і другого ознак.

Потрібно перевірити нульову гіпотезу про незалежність ознак.

Насамперед призначимо рівень значимості a - ймовірність помилково відкинути правильну нульову гіпотезу. Тепер будемо шукати те явище, чия ймовірність при вірній нульовій гіпотезі мала і дорівнює a. Якщо в досвіді це явище відбувається, то ми сміливо відкидаємо нульову гіпотезу (з ризиком помилки a).

За визначенням ймовірнісної незалежності, в осередках таблиці спряженості ознак повинні стояти (при вірній нульовій гіпотезі) такі числа Nij:

або

які ми називаємо очікуваними частотами. Якщо Nij і nij не збігаються, це ще нічого не означає, тому такі відхилення можуть бути викликані випадковістю. Числа nij є сумою більшого числа випадкових величин - окремих випробувань, тому по центральній граничній теоремі вони пожчіняются нормальному закону (рис.1). Можна довести, що середня m цього нормального закону дорівнює очікуваній частоті Nij, а середнє відхилення: s = Ц Nij. Отже числа

підкоряються Z- законом Гауса, а число

підпорядковується c 2-закону Пірсона з n = (к-1) (L-1) ступенями свободи (рис.2). Практично має бути для очікуваних частот Nij і 4, а якщо n и 8 і n и 40, то можна Nij и 1. В іншому випадку необхідні відповідні рядки і стовпці об'єднати з сусідніми сторокой і стовпцями таблиці спряженості ознак.

Згадавши правило "трьох s" для c 2-закону, можна сказати, що при a = 0,1 величина c 2Ј n +. Таким чином, при рівні значущості 10% (тобто з ризиком помилитися в 1 випадку з 10) гіпотеза про незалежність ознак відкидається, якщо підрахована чіслоc 2> n +. В іншому випадку спостереження не суперечать гіпотезі про незалежність.

Зауважимо, що при інших рівнях значущості a величину критичного значення c 2 необхідно брати з таблиць розподілу Пірсона в статистичних довідниках або підручниках.

Повернемося до нашого прикладу. Вважаємо за формулою c 2:

Число ступенів свободи n = (2-1) (3-1) = 2, отже критичне значення c 2 одно n + = 4. Оскільки обчислене c 2 »2,5 не перевищує критичного 4, нульова гіпотеза про незалежність не може бути відкинута, тобто всі три ліки діють приблизно однаково.

Список літератури

Для підготовки даної роботи були використані матеріали з сайту http://mschool.kubsu.ru
Живе минуле землі
Реферат виконав студент I курсу ЄГФ Міністерство освіти РФ Оренбурзький державний педагогічний університет Кафедра фізичної географії Оренбург 2000р. Введення Завдання даного реферату полягає, що, вивчаючи минуле землі, з точки зору науки палеонтології та історичної геології, ми зможемо зрозуміти

Структурна геологія
Курсова робота Введення. Метою даного курсового проекту є закріплення теоретичних положень дисципліни «Структурна геологія» і ряду інших суміжних геологічних дисциплін, розвитку знань та вмінь для проходження навчальної геологічної практики. Зміст курсового проекту в цілому відповідає проекту

Антропологизация в біології
1. Концепція биологизации Концепція биологизации в антропології, розглядає антропологію як самостійну наукову дисципліну, що відноситься до розряду наук про людину і вивчаючу специфіку різних серед і етнічних груп. Своєрідність досліджень, що проводяться фахівцями, зумовлена прагненням до

Біографія Миколи Гумільова
Одним з провідних поетів-акмеїстів був Микола Степанович Гумільов . Насправді ж, його творчість була набагато більш широко і різноманітно, а його життя було надзвичайно цікавою, хоча і завершилася трагічно. Микола Степанович Гумільов народився 3 квітня (за старим стилем) 1886 року в Кронштадті,

Традиції старообрядческого церковного співу: кошти музичної виразності
Дениса Н. Г. Про темп Богослужіння Протягом всієї моєї роботи в старообрядческих общинах я не раз задавався питанням, чому в різних храмах різниться тривалість богослужіння, одних і тих же співів? Час, швидкість руху в музиці, як відомо, визначається темпом. На власному досвіді я пересвідчився

Аудит ланцюжка прибутку в сервісі
Джеймс Хеськетт (James L. Heskett), професор логистики Гарвардського університету і Леонарда А. Шлезінгер (Leonard A. Schlesinger), професор Гарвардської бізнесу-школи. Аудит ланцюжка прибутку в сервісі допомагає компаніям визначити, які саме чинники стимулюють їх прибуток, і пропонує дії,

А чи була антична література?
Михайло Михайлович Постников, математик, лауреат Ленінської премії, професор, експерт по древній історії. Чи Могла антична література у відомих нам формах розвинутися на базі матеріальної культури античності і чи могла вона дійти до нас «через товщу часу»? Необхідність паперу для розвитку

© 2014-2022  8ref.com - українські реферати