Основи статистики Яка різниця між дискретними та неперервними характеристиками - і коли вони є

Основи статистики: Яка різниця між дискретними та безперервними ознаками - і коли функції можна накопичувати?

У рамках вступної статистичної лекції зазвичай розглядається важливе питання, які властивості можна використовувати для класифікації статистичних ознак чи змінних. Велику частину часу обговорюється різниця між накопичувальними та ненакопичувальними характеристиками, а також безперервними та дискретними характеристиками, що, отже, також є предметом сьогоднішньої статті в блозі.

різниця

Кумулятивні та некумулятивні характеристики

Характеристика вважається накопичувальною, якщо вона може набувати декількох характеристик щодо однієї і тієї ж статистичної одиниці. Це має місце в особистому опитуванні, наприклад, з такими характеристиками, як хобі чи професійне навчання, оскільки цілком імовірно, що людина, яка тестує, може займатися дуже різними захопленнями або навіть закінчити кілька професійних тренувань. Отже, на запитання може бути одна або кілька дійсних відповідей. Інші ознаки, такі як рік народження або (біологічна) стать, з іншого боку, повинні розглядатися як не кумулятивні, оскільки на кожного суб’єкта може бути лише одна правильна інформація.

На практиці питання накопичення має велике значення, коли дані, зібрані за допомогою анкети, повинні бути перетворені в структуру таблиці. Якщо при створенні таблиці не помічається той факт, що характеристика може приймати кілька форм, і це помічається лише при введенні n-го запису даних, можливо, таблицю доведеться повністю відтворити і з введенням даних - принаймні частково - Почніть все спочатку. Тому, щоб уникнути нервової драми, варто вчинити на хвилинку паузу перед введенням даних, зібраних на комп’ютері - також з інших причин - і подумати, яка структура таблиці підходить для даних.

Дискретні та безперервні функції

Прості істини для складного світу

Характеристика вважається дискретною, якщо вона може приймати лише незліченну кількість проявів. На практиці це зазвичай означає, що кількість можливих виразів є скінченною. Це стосується, наприклад, шкільних оцінок, року народження, кольору волосся, статі чи кількості учасників заходу - у всіх цих випадках кількість можливих значень є скінченною і, як правило, може бути навіть повністю обмежена заздалегідь (наприклад, шкільні оцінки від 1 до 6, кількість учасників від 0 до максимум 10000 та ін. Pp.). У багатьох підручниках, крім "злічуваного безлічі виразів" із "злічуваним нескінченним безліччю виразів", дається друге визначення дискретних ознак, яке на перший погляд здається дещо заплутаним - зрештою, можна подумати, що набір або нескінченний, або один може їх порахувати.

Однак під цим мається на увазі те, що множина A - це нескінченна підмножина (також нескінченної) множини натуральних чисел N, елементи яких можна рахувати. Набір простих чисел, наприклад, є незліченно незліченною множиною, оскільки, хоча простих чисел нескінченно багато, вона менша за набір натуральних чисел (не кожне число є простим числом), і ви можете порахувати його елементи:, другий 3, третій 5 - і так далі і так далі ... Формально правильне визначення виразу «злічуваний нескінченний» («У теорії множин A множина A називається злічуваною нескінченною, якщо вона має ту саму потужність, що і Набір натуральних чисел. Це означає, що між A і набором натуральних чисел існує бієкція ".) Також можна прочитати у Вікіпедії.

Протилежністю дискретним ознакам є суцільні ознаки. Вони визначаються тим, що вони можуть приймати нескінченну кількість форм. На практиці це виражається тим, що теоретично додаткові нові значення завжди можна було вставити між двома знахідними значеннями суцільної характеристики, якщо основну характеристику можна виміряти лише з достатньою точністю. Прикладом цього є специфікація рівня води в см. Між двома інформаційними розмірами 10,5 см і 10,6 см можна додати будь-яку кількість додаткової інформації: 10,51 см, 10,511 см, 10,512 см та ін. В основному все, що можна виміряти фізично (зі збільшенням точності).

Типовою помилкою при розмежуванні неперервних та дискретних ознак, про яку слід все-таки згадати на цьому етапі, є припущення, що наявність десяткових знаків автоматично означає наявність безперервної ознаки. Наприклад, шкала Ріхтера, яка використовується для вимірювання сили землетрусів («Землетрус магнітудою 4,4 бала за шкалою Ріхтера затрясся сьогодні ...»), незважаючи на десяткові коми, має лише вузько обмежену кількість можливих значень і тому дискретна розглянути.

Квазінеперервні функції

Нарешті, буде розглянутий особливий випадок із квазінеперервними ознаками. Це ознаки, які в основному дискретні (тобто вони мають скінченну або злічувану нескінченну кількість проявів), але які мають стільки можливих проявів, що на практиці їх трактують як безперервні ознаки (і, отже, «квазістійкі») стати - звідси вираз «квазінеперервний»). Типовим прикладом цього є інформація про ціни (наприклад, в євро та копійках): Звичайно, інформація про ціну може мати лише обмежену кількість форм - але стільки (1,00 EUR; 1,01 EUR; 1,02 EUR. ...), що вона може Варто робити вигляд, що існує нескінченна кількість проявів - і розглядати фактично дискретну змінну як неперервну змінну.

Вправа: рівні шкали та типи змінних

Який рівень шкали (див. Попереднє повідомлення в блозі) має такі характеристики - і є вони безперервними чи дискретними?

- глибина води басейну
- Номери телефонів замовників судноплавства
- Ароматизатори морозива
- Шкільні оцінки за шкалою від 1 до 6
- Відстань між двома будівлями в см
- Ціна нового автомобіля в євро та копійках
- Колір волосся клієнтів у перукарні
- Температура тліючого колоди
- Рейтинг товару за шкалою від 1 до 5
- Вивчіть оцінки за шкалою від 1,0 до 5,0

Щоб переглянути рішення, натисніть тут.

Зміст та завдання, представлені тут, є частиною лекції «Основи статистики» на заочному ступені бакалавра з ділового адміністрування в Університеті прикладних наук Гарца. Повний огляд усього змісту цієї лекції в Науковій вежі можна знайти тут: Основи статистики.