Четверта фаза збору даних. Метод відбору проб - Akvopedia

Після завершення другої та третьої фаз посібника будуть визначені потреби у даних для проекту, а також місця для збору даних. У цьому розділі ви дізнаєтеся, як збирати дані, як формулювати питання, кому їх задавати та скільки людей буде опитано.
Зміст
- 1 Визначення вибірки
- 2 Перший крок: Визначте вибірку та цільову сукупність
- 3 Другий крок: Визначте розмір вибірки
- 3.1 Варіант А
- 3.2 Варіант Б
- 3.3 Варіант С
- 4 Третій крок: Визначте техніку відбору проб
- 5 Четвертий крок: мінімізуйте помилку вибірки
- 6 Подяка
Визначення вибірки
Як зазначено на третьому етапі, перед початком збору даних необхідний повний огляд вже наявних даних та відсутніх даних. Існуючі дані із зовнішніх джерел називаються вторинними, а дані, зібрані під час опитування, - первинними. У цьому розділі описано, як збираються первинні дані, на прикладі проведення опитування щодо характеристик (податок, рівень освіти тощо) серед жителів п’яти міст. Міста різного розміру і мають загалом 3200 домогосподарств. Ці 3200 домогосподарств становлять цільову сукупність опитування.
Перший крок: Визначте вибірку та цільову сукупність
Іноді для опитування може знадобитися охоплення всієї цільової сукупності, як у випадку картографування чи популяційних досліджень. Це зазвичай називають переписом населення. Однак цільові групи населення, як правило, великі та дорогі для ідентифікації. У цьому прикладі може бути неможливо відвідати 3200 домогосподарств у п’яти містах. Натомість слід обрати меншу вибірку, яка буде репрезентативною для сукупності та відображатиме характеристики популяції. Опитування, проведене на меншій кількості цільових людей, називається вибірковим опитуванням. За цією репрезентативною вибіркою результати можна отримати для всієї сукупності. У наступних розділах наводяться різні термінології, пов'язані з вибірковими опитуваннями, такі як обсяг вибірки та дизайн опитування. Ці концепції дозволять визначити кількість обстежень, необхідних для точного відображення реальних характеристик сукупності та обрання найкращого методу відбору вибірки цієї сукупності.
Визначення вибірки
- Визначте вибірку та цільову сукупність
- Визначте розмір вибірки
- Визначте техніку відбору проб
- Мінімізуйте помилку вибірки
Дизайн опитування
- Опишіть дизайн опитування
- Застосовуйте найкращі практики при розробці анкети
- Сформулюйте анкети відповідно до типу даних
- Виберіть тип запитання на основі потреб у даних
- Кроки для контролю якості
Вибір колектора даних
- Виберіть колектори даних
- Загальні поради щодо збирачів даних
Перш ніж розпочати розробку опитування, потрібно:
Крок другий: Визначте розмір вибірки
Першим кроком у вибірці є визначення відповідного обсягу вибірки. Не існує жорстких правил вибору розміру вибірки. Рішення може бути прийнято на основі цілей проекту, наявного часу, бюджету та ступеня необхідної точності.
Для того, щоб вибрати відповідний розмір вибірки, слід визначити ступінь точності, яку потрібно досягти. Для цього необхідно визначити інтервал та рівень довіри вибірки.
Довірчий інтервал, який також називають похибкою, становить плюс-мінус числа. У цьому діапазоні лежить ймовірність відповіді. Найбільш часто використовуваний довірчий інтервал становить +/- 5. Похибка або довірчий інтервал слід зменшити до +/- 2, щоб підвищити рівень точності даних. Наприклад, якщо запитання опитування: "Чи платить домогосподарство податки?" "І якщо 65% опитаних домогосподарств скажуть" так ", використовуючи довірчий інтервал +/- 5, ми можемо з упевненістю сказати, що якби ви задали питання 3200 домогосподарствам, між 60% (тобто 65-5) і 70% (тобто 65 + 5) також відповіли б "так".
Рівень впевненості вказує на рівень визначеності, якого потрібно досягти, і виражається у відсотках. Він відображає, наскільки добре відповіді обраної вибірки відображають відповіді загальної сукупності. Отже, 95% рівень довіри означає 95% впевненості. Чим нижчий рівень довіри, тим менша впевненість.
Більшість опитувань використовують рівень довіри 95% та інтервал довіри +/- 5. Як тільки рівень довіри та інтервал довіри поєднані, ми можемо бути впевнені на 95%, що якби всі домогосподарства (3200) були опитані, між 60% та 70 % домогосподарств у цільовій популяції відповіли б "так" на питання "чи платить домогосподарство податки? ".
Розмір вибірки можна визначити за допомогою будь-якого калькулятора стандартного розміру, такого як Survey Monkey або Raosoft. Використовуючи стандартний калькулятор обсягу вибірки (як це видно з таблиці 3) на прикладі 3200 домогосподарств у п'яти містах, можна дослідити різницю у розмірах вибірки на різних рівнях та довірчих інтервалах.
Варіант А
Якщо обраний довірчий інтервал 5% і якщо ми хочемо досягти рівня довіри 95%, обсяг вибірки становитиме 345 домогосподарств.
Варіант Б
Якщо хочеться отримати більшу точність і підвищити рівень довіри до 99%, рекомендований розмір вибірки буде 551.
Варіант С
Для ще більшої точності ми можемо вибрати довірчий інтервал 2% та рівень довіри 99% та отримати обсяг вибірки 1807.
Якщо час і ресурси дозволяють, можна вибрати більші вибірки та вибрати варіант С та взяти інтерв’ю у 1807 домогосподарств. Однак якість результатів, ймовірно, буде лише трохи кращою, ніж при варіанті А або В, оскільки швидкість підвищення точності поступово зменшується із збільшенням обсягу вибірки. Тому розмір вибірки повинен визначатися цілями дослідження та наявними ресурсами.
Таблиця 3: Розрахунок обсягу вибірки
| Фактори | Опис фактора | Варіант А | Варіант Б | Варіант С |
| Населення (ні) | Загальна сукупність, представлена вибіркою | 3200 | 3200 | 3200 |
| Рівень довіри (%) | Ймовірність того, що вибірка точно відображає характеристики сукупності | 95% | 99% | 99% |
| Довірчий інтервал (%) | Діапазон реакцій населення може відрізнятися від вибірки | 5 | 5 | 2 |
| Розрахований обсяг вибірки | 345 | 551 | 1807 рік |
Третій крок: Визначте техніку відбору проб
Після вибору обсягу вибірки для обстеження необхідно визначити техніку відбору, яка буде використана для відбору вибірки з цільової сукупності.
Відповідна техніка відбору проб залежить від характеру та цілей проекту. Методи вибірки можна умовно розділити на два типи: випадкові вибірки та невипадкові вибірки.
Випадкова вибірка:
- Проста довільна вибірка із заміною або без неї
- Стратифікована випадкова вибірка
- Систематична випадкова вибірка
Невипадкова вибірка:
- Навмисне або суб'єктивне відбір проб
- Зручність вибірки
- Вибірка суджень
- Вибірка квот
- Відбір проб сніжних куль
Таблиця 4: Розрахунок стратифікованої випадкової вибірки
| 1 | 2 | 3 | 4 |
| Розташування | Чисельність населення | Відсоток (%) населення | Розшарований розмір вибірки |
| Місто 1 | 1200 | 38% | 129 |
| Місто 2 | 900 | 28% | 97 |
| Місто 3 | 800 | 25% | 86 |
| Місто 4 | 180 | 6% | 19 |
| Місто 5 | 120 | 4% | 13 |
| Разом | 3200 | 345 |
Випадкова вибірка
Як випливає з назви, випадкова вибірка буквально означає вибірку вибіркової вибірки серед сукупності без будь-яких конкретних умов. Це можна зробити, вибравши вибірку зі списку, наприклад, з каталогу, або фізично в місці опитування. Щоб певне домогосподарство не було обрано більше одного разу, його можна виключити зі списку. Цей тип вибірки називається простою випадковою вибіркою без заміни. Якщо вибір не полягає у вилученні дублікатів домогосподарств зі списку, це буде проста довільна вибірка із заміною.
Систематична вибірка є найбільш часто використовуваним методом випадкової вибірки: загальна сукупність ділиться на обсяг вибірки, і отримана цифра стає інтервалом вибірки для відбору. Наприклад, якщо вибір - 20 зразків із загальної сукупності 100 осіб, інтервал вибірки буде п’ять. Систематична вибірка найкраще працює, коли популяція однорідна, тобто коли більшість людей мають однакові характеристики. У нашому прикладі інтервал вибірки буде дев'ять (3200/345 = 9 для рівня довіри 95% і довірчого інтервалу 5%), тому кожне дев'яте домогосподарство буде обрано в місті.
Однак популяції, як правило, змішані та неоднорідні. Необхідно визначити різні прошарки або характеристики та їх фактичну представленість (тобто відсоток) у популяції, щоб забезпечити достатнє включення всіх категорій цієї популяції. У таких випадках може бути використана методика стратифікованої випадкової вибірки, яка дозволяє спочатку розрахувати відсоток кожного шару популяції, а потім відібрати вибірку в однаковій пропорції, випадково чи систематично, у всіх шарах.
Якщо вибрано попередній приклад п’яти міст, для обчислення стратифікованої випадкової вибірки потрібно буде розрахувати відсоток кожного міста в обсязі вибірки 345, як показано в таблиці 4. У третій колонці для кожного міста вказується: відсоток від загальної кількості населення (3200). У четвертій колонці вибірка (345) розподілена пропорційно між п'ятьма містами. Наприклад, місто три, або 25% від загальної кількості населення, відбере 86 домогосподарств з інтервалом вибірки дев'ять (тобто 800/86) як для систематичного відбору проб.
Невипадкова вибірка
При невипадковій вибірці вибір вибірки відповідає набору спеціальних умов. Зазвичай його використовують у дослідженнях, де вибірку потрібно збирати на основі конкретних характеристик сукупності. Наприклад, вам може знадобитися вибрати лише домогосподарства, які мають автомобіль або мають дітей віком до шести років. Для цього ми свідомо вибрали б лише 345 або 551 домогосподарство, які мають ці характеристики. Його також називають навмисним або суб'єктивним відбором проб. Невипадкові методи вибірки включають зручність, оцінку, квотування та вибірку сніжних куль.
Крок четвертий: мінімізуйте помилку вибірки
Нормально допускати помилки при відборі зразків. Тому зусилля завжди повинні бути зосереджені на зменшенні кількості помилок вибірки та зробити обрану вибірку якомога репрезентативнішою для сукупності. Надійність зразка залежить від того, як мінімізувати помилку вибірки. Ступінь помилок вибірки варіюється залежно від техніки або методу, обраного для відбору вибірки.
Для зразків, вибраних випадковим чином із цільової сукупності, результатам, як правило, передує помилка вибірки +/-, яка є ступенем різниці між вибіркою та сукупністю. Метод випадкової вибірки може бути обраний, якщо дослідження вимагає знання величини помилки вибірки, прийнятної для обстеження. Випадкова вибірка допомагає регулювати дизайн обстеження, щоб досягти прийнятного рівня похибки. У невипадковій вибірці помилка вибірки залишається невідомою. Таким чином, метод випадкової вибірки може бути обраний, коли вибіркове опитування повинно зробити висновок про частку певної характеристики цільової сукупності. Але якщо хтось хоче знати уявлення мешканців щодо податкового законодавства чи шкільних програм, слід зібрати якомога більше уявлень, і тому вибрати не випадковий метод у ситуаціях, коли помилки вибірки чи пропорційна вибірка не є проблемою. . Невипадкові методи вибірки можуть бути дуже корисними в ситуаціях, коли цільову вибірку потрібно отримати дуже швидко з певними характеристиками.