Вступ до статистичної потужності - DellaData

Випуск статистична потужність як правило, пов'язане з цим розрахунок кількості експериментальних одиниць. Цей розрахунок кількості експериментальних одиниць (пацієнти, тварини, рослини тощо) є центральне питання в клінічні дослідження або в експерименти на тваринахe, але також і в багато інших областей досліджень. Дійсно, включення a забагато, або навпаки a недостатня кількість є проблемний, принаймні фінансово, але також, часто, етично кажучи. Особливо це стосується випадків, коли експериментальний блок жертвують (наприклад, мишею) в кінці експерименту. Але також, наприклад, коли під час його оцінки більше пацієнтів, ніж потрібно, піддаються лікуванню, яке виявляється неефективним.

Термін “Номер потрібен"Значить, насправді"число, необхідне для досягнення певної потужності тесту”; це зазвичай встановлюється між 80 і 90%.

Щоб зрозуміти це поняття тестова потужність, потрібні деякі нагадування.

Нагадування про перевірку гіпотез

Гіпотези

класичні тести гіпотез які є тестами на перевагу (існують також тести на еквівалентність) базуються на дві гіпотези:

a нульова гіпотеза з статус кво, іншими словами, що це вказуєнічого не відбувається,
a альтернативна гіпотеза, який замість цього вказує, хто щоЩось відбувається (що ми намагаємося продемонструвати)

Наприклад, при порівнянні двох засобів, використовуючи тест t Стьюдента, ці припущення є:

Ці припущення можна переписати у формі:

Розподіл статистики тесту

Статистика t-тестів - це стандартизована різниця, це можна написати:

Деталізуючи елементи, статистика T дорівнює:

Де s² - об’єднана дисперсія:

Ця статистика відповідає розподілу Стьюдента при n_A + n_B -2 градусах свободи.

За нульовою гіпотезою

За припущенням H0, це розподіл зосереджений на 0; наприклад, з 98 ступенями свободи:

Це означає, що навіть якщо насправді два середні показники не відрізняються (тобто їх стандартизована різниця = 0), залежно від вибірки експериментальні одиниці в обробках А і В, статистика T може приймати різні значення. Але в переважній більшості випадків ці значення не є не надто далеко від 0, і це 'в середньому вони дорівнюють 0.

За альтернативною гіпотезою

За припущенням Н1, Dрозподіл статистики T зосереджено на іншому значенні (Delta_std), що є реальна стандартизована різниця між двома способами лікування (лікуванням популяцій), 3 наприклад:

Це означає, що навіть якщо насправді два середні показники відрізняються (тобто їх стандартизована різниця = Delta_std), залежно від вибірки експериментальних одиниць в обробках А і В, статистика Т може приймати різні значення. Але це у переважній більшості випадків ці значення не надто далекі від Delta_std, і це 'в середньому вони дорівнюють Delta_std.

Альфа-ризик

принцип статистичного тесту є з відхилити H0 (припущення, що нічого не відбувається) якщо статистика T перевищує певний поріг. Зазвичай ми приймаємо 5% ризику помилитися (це альфа-ризик).

Коли ми знаходимось у контексті a двостороння гіпотеза, воно існує тоді два пороги, a направо і один зліва. Поріг праворуч відповідає значенню T (за гіпотезою H0), за яким менше альфа/2, тобто 2,5% статистики Tт. Це те саме, симетрично ліворуч.

Іншими словами, навіть якщо середні показники не відрізняються (їх стандартизована різниця = 0), статистика T може приймати крайні значення, але ми встановлюємо межу, за якою ми все-таки дійдемо висновку, що є різниця. Теоретично лише 5% значень T перевищують цю межу, тому ми ризикуємо помилитися на 5%.

Ці пороги можна обчислити за допомогою функції qt (), яка приймає в якості аргументу:

p: ймовірність (1-альфа/2 у двосторонній або 1-альфа в односторонньому)
df: кількість ступенів свободи (= n_A + n_B - 2)