Статистика потужність даних; es! М; методи; Оцініть вибірку
Публікації
Статистика: сила даних!
Методи відбору проб
- Домашня сторінка
- Вибір зразка
- Імовірність вибірки
- Неімовірнісна вибірка
- Оцініть
- Вправи
- Відповіді
Архівний вміст
Інформація, зазначена як заархівована, надається для довідкових цілей, досліджень або ведення діловодства. Він не підпадає під дію веб-стандартів уряду Канади і не був змінений або оновлений з моменту його архівування. Щоб отримати цю інформацію в іншому форматі, будь ласка, зв’яжіться з нами.

Як ми зараз знаємо, метою опитування є отримання інформації про дану популяцію. Коли вибірку відібрано та дані зібрано (див. Розділ Збір даних) та оброблено (див. Розділ Обробка даних), завдання зіставлення даних, зібраних із вибірки, з усією сукупністю.
Оцінка - це процес визначення правдоподібного значення для спостережуваної змінної сукупності на основі даних, зібраних із вибірки. Зазвичай дослідники зацікавлені в вивченні оцінок великої кількості статистичних даних для різних змінних - підсумків, середніх значень та пропорцій найчастіше. Наприклад, вибіркове опитування може бути використано для отримання наступних статистичних даних: оцінок частки курців серед віку від 15 до 24 років, середнього заробітку чоловіків та жінок, які мають вищу освіту, та загальної кількості курців. все спостережуване населення.
Що лежить в основі процесу оцінювання - це вага вибірки одиниці, яка вказує кількість одиниць, включених до сукупності (включаючи саму вагу вибірки), і які представлені цією вибірковою одиницею. Вага вибірки є оберненою до ймовірності вибору одиниці.
-
Приклад № 1: Припустимо, місто Квебек вирішило надати користувачеві автобусних карток просування своїх громадських транспортних послуг. Для цього він обирає просту випадкову вибірку з 10 осіб із числа 30 пасажирів в автобусі. Оскільки проста вибіркова вибірка дає кожному представнику населення (у цьому випадку всім пасажирам в автобусі) рівні шанси бути обраним, кожен пасажир мав кожен третій шанс бути обраним. Це означає, що вага вибірки становить три для кожної вибраної одиниці, що означає, що кожна людина, включена до вибірки, представляє трьох людей у сукупності: себе та ще двох людей.
Для того, щоб оцінити цю вагу вибірки, можна взяти дані опитування для 10 вибраних пасажирів і скопіювати їх тричі, щоб створити штучну популяцію з 30 пасажирів. Тоді можна було б оцінити підсумки, середні показники або пропорції для фактичної сукупності, використовуючи відповідну статистику, розраховану за допомогою штучної сукупності. Однак, натомість статистики опитування призначають вагу вибірки для кожної одиниці, що входить до вибірки, і враховують цю вагу при встановленні оцінок.
Якби у людини, включеної до вибірки (з вагою вибірки 18), були блакитні очі та каштанове волосся, то це було б так, ніби загалом 18 людей із населення мали блакитні очі та каштанове волосся.
Щоб оцінити загальну кількість людей, які проживають на вашій вулиці, потрібно помножити кількість людей у домогосподарстві на кількість домогосподарств, включених до цієї ваги вибірки, а потім додати всі остаточні цифри. Наприклад, є 4 домогосподарства на одну особу (представлені домогосподарством номер 1), 4 домогосподарства з чотирма особами, 8 домогосподарства з двома особами (4 домогосподарства, представлені домогосподарством №3 та 4 домогосподарства, представлені номером 4) та 4 домогосподарства з 3 особами домогосподарства. Тоді ваша оцінка загальної кількості людей буде такою:
Приблизна кількість людей, які проживають на вашій вулиці
= (4 х 1) + (4 х 4) + (8 х 2) + (4 х 3)
= 48 осіб
Ви повинні зробити те саме, щоб оцінити середню кількість автомобілів на домогосподарство. Оцініть загальну кількість автомобілів, що належать домогосподарствам на вашій вулиці, а потім поділіть цю оцінку на фактичну кількість домогосподарств на вашій вулиці. Наприклад, є 4 домогосподарства, які не володіють автомобілем (представлені домогосподарством № 1), 8 домогосподарств, які володіють двома (представлені домогосподарством № 2 та домогосподарством № 5), і 8 домогосподарств у кожному, що мають одне (представлене номером домогосподарства) 3 та домогосподарство No 4).
Приблизна кількість автомобілів
= (4 x 0) + (8 x 2) + (8 x 1)
= 24 машини
Розрахункове середнє
= 24 ÷ 20
= 1,2 машини на домогосподарство
Самозважені плани
Всі одиниці вибірки не завжди мають однакову вагу вибірки. Деякі конструкції дають одиницям неоднакову ймовірність обрання, в результаті чого одиниці, що входять в одну і ту ж вибірку, мають різну вагу вибірки. Відповіді одного домогосподарства або бізнесу на опитувальник можуть представляти відповіді 200 одиниць населення, тоді як відповіді іншого домогосподарства чи підприємства на ту саму анкету можуть представляти лише 50 одиниць населення.
Коли кожна одиниця, включена до зразка, має однакову вагу відбору проб, план відбору проб називається самозваженим. Такий план економить час і є практичним на практиці, особливо для великих розмірів вибірки. Оскільки кожна одиниця має однакову вагу, такі ваги можна не враховувати при оцінці засобів та пропорцій. Середнє значення вибірки дає відповідну оцінку середнього значення для всієї сукупності.
Прості випадкові вибірки та систематизовані плани вибірки є прикладами самозважених планів. З цієї причини вони могли б полегшити обчислення у випадку Прикладу 2. Для оцінки середньої кількості автомобілів на домогосподарство, включене до населення, наприклад, ми могли використати таку саму середню величину, що і в вибірці. П'ять домогосподарств, що відібрали вибір, володіють загалом 6 автомобілями, що дає в середньому 1,2 машини на домогосподарство. Це той самий результат, що і результат, отриманий за допомогою процедури розрахунку ваги відбору.
Регулювання ваги
Ваги вибірки іноді коригуються перед оцінкою з двох основних причин:
-
Щоб врахувати відсутність відповідей на опитувальник: Використання ваг вибірки для встановлення оцінки добре працює, коли ви змогли взяти інтерв’ю у всіх вибраних одиниць. У прикладі 2, якщо два з п’яти домогосподарств відмовляються відповідати на вашу анкету або не доступні на момент опитування, ви отримаєте відповіді лише для трьох домогосподарств, що представлятиме лише 12 із 20 домогосподарств на вашій вулиці. Два підрозділи, які не відповіли б на вашу анкету, представляли б по чотири домогосподарства в кожному, а це означає, що ми не мали б інформації про кількість людей чи автомобілів для восьми домогосподарств, які мешкали на вашій вулиці. Для того, щоб внести коригування з урахуванням цього, статистики опитування зазвичай збільшують вагу одиниць, які відповіли на опитувальник, щоб врахувати втрату репрезентативності, спричинену відсутністю відповідей на останні. Метою було б використовувати лише три одиниці, про які ми мали б інформацію, але які все одно представляли б 20 домогосподарств на вашій вулиці.
Очевидно, що розшарування за датою випуску на екранах до вибірки вирішило б проблему. Однак у багатьох випадках ми маємо підсумки на рівні сукупності, але ми ігноруємо атрибут кожної одиниці, включеної у фрейм. Наприклад, з перепису населення ми знаємо, скільки чоловіків і жінок є в певному населеному пункті, але все, що ми маємо для вибірки - це список домогосподарств. Тому було б неможливо розшарувати наше населення за статтю. Прогнози населення за віком та статтю для кожної провінції часто використовуються в соціальних опитуваннях для коригування ваги вибірки.
Ми використовуємо скориговані ваги, щоб врахувати невідповідь на анкету опитування та/або зовнішні підрахунки для цілей оцінки так само, як вага вибірки використовувалась у прикладі №1.
Інші методи оцінки
Використання вагових коефіцієнтів для екстраполяції результатів вибірки - не єдиний метод оцінки, який існує, але найпростіший і єдиний, який ми обговоримо. Однак важливо знати, що існують інші методи, які можуть призвести до більш точних оцінок (наприклад, використання допоміжних даних). Процес оцінки повинен враховувати план відбору проб, який був використаний. В іншому випадку отримані оцінки можуть мати серйозні упередження.
Оцінка помилки вибірки
Приклади оцінок з використанням простої схеми випадкової вибірки
Проста випадкова вибірка - це найпростіший з усіх методів вибірки. Багато уваги приділяється оцінюванню за допомогою простої випадкової вибірки. Доступні прості формули для оцінки помилки вибірки для багатьох статистичних даних при використанні конструкції AES, тим більше, що це самозважена конструкція вибірки. Тут ми представляємо найпоширеніший оцінювач для встановлення (арифметичного) середнього та загальної сукупності за простою випадковою вибіркою.
Оцінка середнього показника сукупності
У випадку простої випадкової вибірки оцінка середнього значення сукупності така ж, як середнє значення вибірки:
або
х = спостережуване значення,
Примітка: Ми повинні використовувати x та n (малі літери), посилаючись на вибіркове опитування та X і НЕ (верхній регістр), коли йдеться про сукупність.
Якщо результати вибірки були зведені в таблицю частот, то оцінка середнього показника популяції така ж, як середнє значення вибірки. Тому,
або
х = спостережуване значення,
f = частота значення (скільки разів це значення спостерігалося у вибірці),
Приклад № 2: Фермер випадковим чином відбирає 10 яєць із великих (12 десятків) яєць (144 яйця), які він знаходить у своєму курнику. Він ретельно зважує кожне з 10 яєць. Наступні ваги були записані в грамах:
0,75, 0,70, 0,55, 0,50, 0,60, 0,65, 0,75, 0,65, 0,75 та 0,50
Яка середня вага цих яєць?
Ми можемо визначити за допомогою наведеної формули середню масу 10 відібраних яєць:
Оцінка загальної чисельності населення
Для простої випадкової вибірки формула для підрахунку загальної сукупності:
або
х = спостережуване значення,
Це просто оцінка середнього значення, помноженого на кількість одиниць, включених до сукупності. У попередньому прикладі середня вага яйця становить 0,64 грама; Тож має сенс думати, що загальна вага 144 яєць становитиме 92,16 грам (144 х 0,64 = 92,16 грам).
Якби результати вибірки були зведені до таблиці частот, формула оцінки для загальної сукупності мала б такий вигляд:
або
х = спостережуване значення,