Класифікація - описова статистика

Зворотна процедура, трактуючи суцільну (або квазінеперервну) ознаку як дискретну ознаку, або, як уже зазначалося, перетворення кардинально в звичайно масштабовану ознаку, також може бути корисною.

Характеристичні значення об'єднуються в групи або класи, наприклад, оскільки кожне значення зустрічається занадто рідко. Цей процес також називається групуванням (= Класифікація) даних.
У прикладі 14 вже описана класифікація метрично масштабованої характеристики ваги яєць на вагові класи S, M, L та XL. Ми виявили, що класифікація супроводжується втратою інформації. Однак це прийнято, оскільки видається більш доцільним розділити та упакувати яйця за ваговими класами, ніж показувати вагу кожного яйця окремо та окремо.

приклад

З одного боку, причиною цього при зборі даних є те, що багато домогосподарств навіть не знають, наскільки високий їх конкретний дохід, а, з іншого боку, прийняття уточнення доходів домогосподарств зростає, якщо про це потрібно заявляти лише в певних межах. З іншого боку, класифікація також має сенс при оцінці та виведенні даних, завдяки чому презентація, однак, перш за все чіткість і, отже, "візуальний інформаційний зміст" даних може бути значно покращена. До цього ми повернемось у наступному розділі під час представлення даних.

статистика

Зауважте

  • Групування/класифікація зазвичай супроводжується втратою інформації, оскільки точність вимірювання (штучно) значно знижується. Однак подання та, можливо, також статистична обробка можуть бути спрощені.
  • Кожна класифікація в основному відповідає перетворенню, принаймні назад до порядкової шкали. Властивість кардинальної шкали, а саме те, що відстані можна виміряти та змістовно інтерпретувати, насправді втрачається. Якби ми знали, що доктор Маттіас Медіан потрапляє до класу заробітної плати від 2000 до 3000 євро, ми вже не можемо стверджувати, наскільки менше він заробляє, ніж професор Райнер Стрейунг, який належить до класу заробітної плати від 5000 до 6000 євро, але лише те, що він заробляє менше або в межах певного діапазону Заробляли від 2000 до 4000 євро менше. Так само вже неможливо визначити різницю в зарплаті з іншими працівниками, які перебувають у тому ж класі заробітної плати, що і Dr. Середнє падіння.
  • "Стабілізація" служить для спрощення обробки статистичних даних, але можуть бути визначені "безглузді" (наприклад, 1,2 дитини) або неперевіряються (наприклад, зазначення середнього доходу для класифікації). Тож слід усвідомлювати цей факт, інтерпретуючи результати. До останнього ми повернемось, зокрема, у відповідний момент.

Інший цікавий зміст за темою

Причини квазіпостійних ознак

Можливо, тема причин квазіпостійних характеристик (основні терміни описової статистики) нашого онлайн-курсу також для вас Описова статистика Цікаво.

гістограма

Можливо, тема гістограм (розподілу частот) з нашого онлайн-курсу також для вас Описова статистика Цікаво.

Історія національних рахунків (VGR)

Можливо, ви також знайдете історію національних рахунків з нашого онлайн-курсу для вас Національні рахунки (VGR) Цікаво.