Статистика медичної дисертації, частина 1

Точне формулювання питання

Перш ніж розпочинати збір даних для докторської дисертації, слід ретельно спланувати своє дослідження. Для цього сформулюйте питання якомога точніше. Задайте собі питання: На яке питання має відповісти ваше дослідження?

Тоді подумайте, які дані вам потрібні, щоб мати можливість відповісти на це питання. Це змусить вас усвідомити,

які виміряні значення потрібно зібрати (наприклад, діагностична класифікація, стать, тяжкість симптомів),
У який момент часу ви збираєте виміряні значення (наприклад, до та після лікування, різні етапи курсу, лише один момент часу) і
з якої популяції слід збирати дані (наприклад, пацієнти з певним діагнозом, певні групи ризику).

Скільки справ потрібно?

Для того, щоб мати можливість оцінити, скільки випадків необхідно відповісти на ваше запитання перед початком збору даних, ви можете спланувати кількість справ. Тут визначається кількість випадків, які вам потрібні хоча б для того, щоб довести очікуваний/бажаний результат як значущий.

Попереднє планування обсягу вибірки має сенс:

Це дозволяє уникнути виявлення після аналізу, що зразок був занадто малим, щоб продемонструвати бажану різницю/зв'язок.
В іншому випадку це заощаджує вас від вкладання занадто багато часу, роботи та грошей у збір даних із непотрібно великої вибірки.

Безкоштовною програмою, яка підтримує розрахунок вибірки для різних конструкцій дослідження та методів аналізу, є G * power 3 (Heinrich-Heine-Universität Düsseldorf, 2013, http://www.gpower.hhu.de/)

Структура аналізу даних

Рис. 1: Структура аналізу даних, від Дж. Вебінгера, Д. Келлера, Б. Будріча: Як мені написати докторську дисертацію? Посібник для медичних працівників та стоматологів. Springer 2014.

Статистичний аналіз даних складається з двох компонентів: описової статистики та статистики на їх основі (див. Рис. 1).

описова статистика описує дані шляхом обчислення відповідних показників. Описова статистика також включає зображення, які ви можете використовувати для представлення даних та візуалізації можливих відмінностей/взаємозв’язків.

В статистика закриття розраховуються статистичні тести, які перевіряють значущість відмінностей/взаємозв’язків, описаних в описовій частині. Спостережувана різниця або асоціація вважається статистично значущою лише тоді, коли ймовірність (p) такого спостереження у випадково відібраній вибірці була б дуже низькою, якби насправді не було різниці/асоціації в загальній сукупності. Отже, лише з доведеною значимістю ви можете довіряти з низькою ймовірністю помилки (рівень значущості, часто встановлюється на рівні 5%), що спостережуваний ефект у вашому дослідженні виник не випадково, а що він відображає фактичну різницю/взаємозв'язок у загальній сукупності. Розрахунок розмірів ефекту (наприклад, коефіцієнт шансів, r, d, η2) також дозволяє оцінити розмір спостережуваного ефекту.

Вибір правильного методу

Описова статистика

Вибір правильного методу опису даних багато в чому залежить від типу змінної. Далі коротко згадуються деякі часто використовувані описові методи опису категоріальних даних (наприклад, стать, курці/некурящі, діагностична класифікація) та метричні дані (наприклад, тяжкість симптомів, значення шкали опитувальника).

Категоричні ознаки досліджуваної вибірки є описовими з Таблиці частот і - при поєднанні кількох категоріальних змінних - з Перехресні таблиці показано. Як підходить картина до цього гістограма або a згрупована гістограма (див. рис. 2).

Рис. 2: Згрупована гістограма для відображення категоріальних даних. Категоричні змінні: куріння (ні/так), хвороба (ні/так). Висота решіток показує кількість людей у кожній категорії.

Для опису метричних характеристик вибірки використовуються міри для центральної тенденції, напр. B. Середній і Медіана, і для розсіювання, напр. B. Стандартне відхилення, IQR, мінімум і максимум, розрахований. Крім того, можуть бути використані середні значення та стандартні відхилення Довірчі інтервали розрахувати. Вони описують діапазон значень, в яких середнє значення загальної сукупності z. Б. з 95% ймовірністю.

З одного боку, вони добре підходять для відображення метричних даних Ящикові ділянки, які показують як центральну тенденцію (медіана), так і розкид (IQR, мінімум, максимум), визначають відхилення та ілюструють групові порівняння, тобто порівняння між рівнями категоріальної змінної (див. рис. 3). З іншого боку, може бути з Гістограми (див. рис. 4) або - зокрема, щоб показати хронологічну послідовність - за допомогою Лінійні діаграми (див. рис. 5) зображують середні значення. Стандартні відхилення або довірчі інтервали у вигляді Бари помилок можна візуалізувати. Для спільного відображення підходять дві метричні змінні Розсіяні сюжети (див. рис. 6).

Рис. 3: Графічні ділянки для відображення метричних даних. Залежна метрична змінна: сила симптомів (шкала від 0 до 50), незалежна категоріальна змінна: куріння (ні/так). Розділювальна лінія в коробках показує медіану, довжина ящиків - IQR, кінцеві точки антен («вуса») показують мінімум і максимум, коло показує викид.

Рис. 4: Гістограми для відображення метричних даних. Залежна метрична змінна: сила симптомів (шкала від 0 до 50), незалежна категоріальна змінна: куріння (ні/так). Висота стовпчиків показує середні значення двох зразків, смуги помилок - стандартні відхилення.

Рис. 5: Лінійні діаграми для відображення метричних даних. Залежна метрична змінна: сила симптомів (шкала від 0 до 50), незалежні категоріальні змінні: лікування (плацебо/препарат), момент часу (до лікування/після лікування/подальшого вимірювання). Крапки показують середні значення двох груп у три рази, смужки помилок показують стандартні відхилення.

6: Діаграма розсіювання для відображення метричних даних. Метричні змінні: сила симптомів (шкала від 0 до 50), кількість сигарет на день (шкала від 0 до 40). Кожна точка відповідає окремому предмету і показує їх значення на двох метричних шкалах.