Який статистичний тест слід вибрати для статистики курсу краху
Прості пояснення, приклади та іспитові завдання
Ця стаття заснована на загальній статті про тестування гіпотези. Рекомендую заздалегідь прочитати та зрозуміти цю статтю; це значно полегшує процес читання та розуміння цієї статті.
Таблиця для вибору тесту
Наступна таблиця (клацніть на ній, щоб отримати більший малюнок) показує, який є найбільш підходящим тестом для певного рівня масштабу цілі та впливу змінних. ->
Пояснення цьому можна знайти в решті статті. У самому кінці є кілька зразків вправ, які демонструють, як користуватися цією таблицею.

Спочатку визначте тип цільової змінної, потім тип вашої змінної. У цій таблиці ви знайдете відповідний метод аналізу ваших даних.
Швидке попередження: У багатьох ситуаціях вибрати правильний тест дуже просто, і є практично один варіант. Однак у деяких випадках існує кілька придатних тестів, які можуть бути використані. Наприклад, якщо є два можливих тести, то, можливо, один має ту перевагу, що він повинен робити менше припущень щодо даних (наприклад, нормальний розподіл), а інший матиме ту перевагу, що він може краще розпізнати фактичний ефект.
У цій таблиці я зібрав тести, які, на мій погляд, є або найпростішим, або найкращим рішенням для певного набору даних - важливо мати на увазі, що це не означає, що інші тести автоматично помиляються або гірші.
Пояснення таблиці
Існує ряд процедур тестування, які на перший погляд можуть здатися приголомшливими. Точний тест, який буде обраний у конкретній ситуації, залежить від ряду питань, на які потрібно відповісти ще раз у кожній ситуації.
Пошук зображень Google для "якого статистичного тесту" чи "якого статистичного тесту" надає безліч різних діаграм, які мають різну деталізацію і починаються по-різному. Деякі з них орієнтовані на цілі, тобто перше запитання: “Чого я хочу досягти?” А можливими цілями є, наприклад, “Порівняйте середнє з гіпотетичним значенням”. Інші діаграми базуються на властивостях даних. Тут починається питання "Що таке цільова змінна?", Незалежно від того, чи є вона номінальною чи постійною, наприклад. На мою думку, спочатку це легше, саме тому ми задаємо собі ці два запитання:
1.) Якого типу є цільовий розмір? -->
Цільова змінна - це характеристика, яка зміниться внаслідок ефекту впливу змінних. Це залежить від факторів впливу. Наприклад, якщо я хочу довести антигіпертензивний ефект нового препарату, тоді моєю цільовою змінною є артеріальний тиск, а змінною - лікарський засіб (наприклад, у вас буде дві групи, одна людина без ліків і одна людина з ліками).
Тепер визначте, якого типу (якого рівня масштабу) є ваш цільовий розмір:
2.) Які фактори, що впливають?
--> По-друге, ми повинні визначити, чи маємо ми взагалі впливаючу змінну, і якщо так, то який тип масштабу вона має.
Важливо: Не має значення, який розподіл мають змінні, що впливають. Тож, розподіляється впливаюча змінна, чи ні, для процедури тестування не має значення.
завдання
Для кожного з наступних випадків визначте, який тест підходить для кожного випадку. Спочатку визначте розмір цілі та визначте її тип (номінальний, порядковий тощо). Потім визначте, чи є одна або декілька змінних змін і який це тип. Потім за таблицею знайдіть відповідний тест.
(Якщо це спеціально не зазначено у вправі, ви не можете припустити нормального розподілу змінних.)
- 1а) Цільовим значенням тут є кількість сигарет на день. Це дані підрахунку, тому розмір цілі звичайно масштабується (ви також можете вважати його інтервальним). Впливає фактором є момент часу (до/після), тобто номінальна змінна з двома групами. Дві групи є парними, оскільки вимірювання пов’язані: ті самі люди були опитані до і після терапії. Відповідно до таблиці, відповідний тест тут Уілкоксон підписав ранг-тест.
- 1б) У порівнянні з 1а) тут змінюється єдине, що впливає змінна вже не лише дві, а декілька груп. Згідно з таблицею, ми зараз використовуємо Тест Фрідмана.
- 2а) Тут ви хочете перевірити просту частину. Існує номінальний результат для двох груп, і немає прогнозу. Ось такий Біноміальна проба правильний.
- 2b) Зараз змінної, яка впливає, досі немає, але цільова змінна наразі має кілька груп. Тут ви використовуєте один Тест на придатність хі-квадрат.
- 3a) Тут ви маєте номінальну цільову змінну з двома категоріями та кількома змінними, що впливають, безперервною та категоричною. A логістична регресія тут доречно.
- 3b) Результат безперервний, але зазвичай не розподіляється. Впливає фактор категоричний щодо двох груп. Оскільки дві групи (чоловіки та жінки) не є парними (як це було б, наприклад, до/після груп), найкраще взяти одну тут U-тест Вілкоксона-Манна-Уітні.
- 3в) Якщо груп більше двох, скористайтеся замість U-тесту Вількоксона-Манна-Уітні Проба Крускала-Уолліса.
- 4) За допомогою двох безперервних або нормально розподілених змінних можна обчислити кореляцію між ними та Тест кореляції Пірсона здійснювати. Як варіант, це також було б можливо лінійна модель (тобто лінійна регресія).
- 5) Результат зазвичай розподіляється, а фактор впливу є категоричним для двох груп. Це вкладається Т-тест із двома зразками.
- 6) Цільовою змінною є обрана сторона, тобто категоріальна змінна з кількома групами. Фактор впливу, освітній кваліфікація, також є категоричним. Тому вписується сюди Тест на хі-квадрат. Тест Фішера також є альтернативою. Він використовується у випадках із меншою кількістю даних, наприклад, менше 1000 спостережень, або якщо принаймні в одній з клітин перехресних таблиць є менше 5 спостережень.
- 7а) Тут досліджується вплив категоріальної впливає змінної на нормально розподілену цільову змінну. A АНОВА є правильним інструментом для цього, також можлива альтернатива модель лінійної регресії.
- 7b) Якщо є кілька факторів, що впливають, один звертається до множинна лінійна регресія назовні.
- 8а) Тут ви перевіряєте порядкову цільову змінну (без впливу на змінні) на медіані. A Знак тест може перевірити це.
- 8b) Цільова змінна все ще є порядковою, але зараз існує постійна впливаюча змінна. Можна обчислити кореляцію рангу Спірмена для цих двох змінних, а потім Тест Спірмена запустити, щоб перевірити кореляцію.
- 9а) Це категорична цільова змінна з двома групами (високий кров'яний тиск так/ні). Впливаюча змінна також має дві групи, і вона є парною, оскільки однакові люди вимірюються в групі «до» та «після». Отож є Тест Макнемара в.
- 9b) Якщо цільовий розмір зазвичай розподіляється замість категоричного, ви керуєте ним парний t тест назовні.
3 думки на тему “який статистичний тест вибрати? "
Мене бентежить ваш приклад змінних змін, що постійно впливають, або завдання 1: «Кількість дзвінків на комутаторі» та «сигарети на день» - це дискретні значення, чому вони тут виглядають як безперервні чи порядкові?