Потужність d; статистичний тест та помилки, яких слід уникати

Ця стаття про помилки в статистиці допоможе вам зрозуміти та уникнути загальних підводних каменів у статистичному тестуванні. Це остання з серії із трьох статей про використання статистичних тестів, які можна знайти на нашому блозі.

статистичні тести є потужними інструментами статистичного висновку, тобто вони дозволяють вивести властивості спостережуваної сукупності із зібраної вибірки. Але такої переваги неможливо досягти без зусиль! Зверніть увагу на можливі помилки.

Спочатку потрібно врахувати два бали наступне:

тест

  • Зразок необхідно взяти хаотично, тому випадкові вибірки, щоб мати неупереджені дані про сукупність.
  • Ви не можете бути впевнені чи є одна чи інша гіпотеза цілком істинною. Ви можете лише з певною ймовірністю відхилити чи не відхилити нульову гіпотезу (H0).

Дійсно, є 4 ситуації можливо залежно від того, чи H0 відповідає дійсності та відхиляє H0:

В реферат:

  • Помилка типу I: ми потомство нульова істинна гіпотеза (H0).
  • Помилка типу II: ми не відмовити помилкова нульова гіпотеза (H0).

Як ми можемо контролювати ці помилки ?

Відповідь на це питання вимагає введення важливої ​​концепції: рівень значущості

Рівень значущості

Якщо ви пам’ятаєте мою попереднє повідомлення на різних типах тестів ми розрахували значення р, яке було ймовірністю отримати статистику, яку ми спостерігаємо, або щось більш екстремальне (тобто далі від середнього: наприклад, різниця в оплаті праці між чоловіками та жінками більша, ніж або дорівнює 1%).

Ми сказали, що якщо значення p досить мало, ми відкидаємо нульову гіпотезу H0 (гіпотезу, що ця різниця просто зумовлена ​​випадковістю). Але що означає бути “досить маленьким”? 0,1 досить малий? А як щодо 0,05? Або 0,01 ?

Статистики зазвичай вибирають це "досить мале значення p" як 0,05 або 0,01, що становить 5% або 1% ймовірності виникнення. Вони позначають це конкретне значення р грецькою буквою α (альфа) і називають його рівень значущості. Отже, коли р менше або дорівнює α, ваше спостереження є значним, гіпотезу 0 можна відкинути.

Ви обираєте α !

Якщо ви не хочете помилково відкинути добре шановану гіпотезу, виберіть невелике значення для α, оскільки більший збільшить область відхилення розподілу ймовірностей.

Що таке "більш екстремальна" цінність ?

На прикладі гендерного розриву в оплаті праці ми спостерігали різницю в 1% на користь чоловіків. Отже, більш екстремальне значення тут означало б отримання різниці у заробітній платі, що перевищує або дорівнює 1%.

Але в якому напрямку? 1% на користь чоловіків? жінки? або обидва ?

Питання про напрямок тесту

Насправді ми також повинні вибрати Напрямок що нас цікавить відповідно до нашої альтернативної гіпотези:

Ха: чоловіки заробляють більше, ніж жінки

Такі статистичні дані, як Xα або Xα/2, називаються "критичними значеннями", оскільки вони визначають область відхилення.

Помилки типу I, як їх уникнути ?

Припустимо, що нульова гіпотеза справедлива з розподілом ймовірностей, що визначає ймовірність спостереження статистики. З рівнем значимості існує (100 х α)% ймовірність того, що статистика потрапить у затінені області, коли нульова гіпотеза відповідає дійсності.

Іншими словами, рівень значущості - це ймовірність відхилення нульової гіпотези, апріорі припускаючи її дійсність. Це саме визначення помилки типу I: відхилити H0, коли дійсне! Таким чином, ймовірність помилки типу I дорівнює нашому рівню значущості.

Вибір цінностей більше маленький для α зменшено ймовірність помилки I типу.

Помилки типу II, як їх уникнути ?

Помилка типу II виникає, коли ми відмовляємось відхилити нульову гіпотезу H0, яка не відповідає дійсності. Нехай припустимою гіпотезою є H1 з таким розподілом ймовірностей:

Для нашого прикладу гендерного розриву в оплаті праці H1 зазначає, що чоловіки заробляють на 2% більше, ніж жінки. Тож ми повинні знайти ймовірність не відкинути поганий H0, за умови, що H1 відповідає дійсності.

Не відхилення H0 означає, що різниця, яку ми спостерігали, була меншою за критичне значення 1%. Отже, нам потрібно розрахувати ймовірність отримання спостережень менш екстремальними, ніж це, припускаючи, що H1 відповідає дійсності. Це дає нам червону область, і ми позначаємо її грецькою літерою β (бета).

Заштрихована область червоним кольором - це ймовірність помилки типу II, але для гіпотези H1. Насправді ця помилка залежить від H1. З малюнка видно, що помилка типу II більша, якщо H1 ближче до неправильної гіпотези, яку ви не відкинули.

Потужність статистичного тесту

Потужність статистичного тесту - це ймовірність відхилення поганої нульової гіпотези H0, коли H1 справедлива. Він дорівнює 1-β.

Пам'ятати

Зменшення α йти

Збільшити α йти

Проблема помилок під час тестування іноді стає дещо складнішою для розуміння, тому, не соромтеся запитувати у мене додаткові пояснення, якщо це потрібно. Як ти гадаєш ? Який ваш досвід статистичного тестування? ?

Дякуємо за ваші запитання та коментарі !

Хамед Закерзаде

Математик ++