Глава 6 Зважування та оцінка

6.0 Вступ

Оцінка - це процес обстеження, за допомогою якого оцінки невідомих параметрів сукупності виробляються на основі даних вибірки у можливому поєднанні з допоміжними даними інших джерел. Параметри населення, що представляють інтерес, включають загальну чисельність населення, середні показники та коефіцієнти, а також їх середні показники за кілька місяців опитування.

глава

Оцінки обстеження робочої сили (ОРС) складаються на основі ваг, пов'язаних з кожною особою, для якої доступні дані ЖРС. У цій главі описано кроки для розрахунку кінцевих ваг для оцінки. Розділ 6.1 описує розрахунок ваг, визначених за зразком, описаний у главі 2. Розділ 6.2 описує, як відкоригують ваги, визначені за зразком, для домогосподарств, що не відповідають, для того, щоб стати тим, що називається під-вагою. Розділ 6.3 описує складене калібрування, яке застосовується до підваг для узгодження із зовнішніми оцінками сукупності, для врахування недостатнього покриття та підвищення ефективності оцінок. У цьому розділі також описується інтегрований метод зважування, який забезпечує загальну кінцеву вагу для кожної людини в домогосподарстві. Нарешті, розділ 6.4 описує, як ваги використовуються для обчислення деяких основних параметрів сукупності, оцінених EPA. .

6.1 Вага, визначена планом відбору проб

6.1.1 Основна вага

Ця конструкція зразка самостійно зважується в шарах, оскільки вона має постійну базову вагу в кожному шарі.

Ваги, визначені конструкцією, були б еквівалентні базовим вагам, якби конструкція та сукупність залишалися незмінними. Однак, оскільки очікується, що первинні одиниці відбору проб (PSU) з часом зростатимуть, а систематична швидкість відбору буде фіксованою, обсяг вибірки постійно збільшуватиметься. Щоб уникнути такої ситуації, розмір вибірки контролюється за допомогою процедур вибірки, описаних у розділі 3.3.2: БД можуть бути відібрані за допомогою методу субвибірки БП або формування підкластерів; пласт може бути переставлений на основі актуальної інформації. Ці методи змінюють ймовірність вибору домогосподарств (та осіб). Тому необхідно скорегувати основні ваги, щоб створити конкретні ваги кластера, щоб врахувати ці процедури вибірки.

6.1.2 Кластерна вага

На жаль, властивість самозважування втрачається при використанні будь-якого з цих методів. Детальніше про ці методи можна знайти в дослідницькій роботі Кеннеді (1998). Коли ріст екстремальний, скорочення вибірки може бути непрактичним, і прошарок оновлюється, як описано нижче.

Кластерна субдискретизація

Формування підкластерів

Коли кластер зростає більше ніж у три рази за розміром і його вуличні схеми чітко визначені, зростаючий кластер ділиться на чотири або більше підкластерів. Відбирається вибірка двох з цих невеликих підкластерів, а потім вибірка домогосподарств від кожного вибраного підкластеру. Ця процедура еквівалентна додаванню іншого ступеня вибірки у зростаючі кластери. Це не змінює ймовірність відбору кластерів, а скоріше ймовірність відбору домогосподарств у зростаючих кластерах. Недостатня вага кластера відображає цей процес відбору.

Оновлення верств

Коли ріст настільки екстремальний, що згаданих вище процесів вибірки недостатньо, необхідне оновлення прошарку, як описано у розділі 3.3.2. Ми повинні оновити кількість житлових приміщень у всіх кластерах прошарку, і ми утворюємо нові кластери, поділяючи існуючі кластери в рамках цього нового перепису. Зразок прошарку оновлюється відповідно до методу Keyfitz (1951), модифікованого Дрю, Чодрі та Грей (1978), зберігаючи якомога більше спочатку вибраних блоків живлення. Нова вибірка вводиться протягом шести місяців. Тимчасовий ваговий коефіцієнт застосовується до всіх блоків живлення в пласті до повного встановлення. Цей ваговий коефіцієнт враховує нову інформацію з останнього підрахунку житла, інша інформація не відображається в активній вибірці.

6.1.3 Стабілізаційна вага

На завершальному етапі відбору проб систематичне відбір проб проводиться з фіксованою швидкістю. Оскільки завжди використовується однаковий коефіцієнт вибірки, зростання чисельності населення, а отже, і кількості домогосподарств призведе до поступового збільшення вибірки та збільшення витрат на вибірку, якщо не буде проведено стабілізації вибірки виконано. Стабілізація вибірки передбачає випадковий вибір домогосподарств із вибірки з метою збереження обсягу вибірки на очікуваному рівні. Цей випадковий вибір здійснюється шляхом систематичного відбору проб у кожному секторі стабілізації та незалежно від одного сектору стабілізації до іншого. Сектор стабілізації визначається як сектор, що містить усі домогосподарства, що належать до одного економічного регіону страхування зайнятості (EIER) та до тієї самої групи поновлення.

Розрахунок корекції стабілізації

Для простоти припустимо сектор стабілізації, де всі домогосподарства мають основну ймовірність відбору 1 на 200 на момент проектування обстеження та коефіцієнт корекції кластера 1. У цьому прикладі сектор стабілізації не розділений на підгалузі. Якщо очікуваний обсяг вибірки сектору стабілізації на момент обстеження становить 300 домогосподарств, а фактично використовувані показники вибірки дають 350 домогосподарств, то 50 домогосподарств слід випадковим чином вилучити із сектору стабілізації. Тому ймовірність відбору домогосподарств зменшується з 1 на 200 до 3 на 700 (тобто 1/200 помножена на 300/350). Помноження базової ваги 200 на коефіцієнт 350/300 дає стабілізаційну вагу 700/3 = 233,333333.

Домогосподарства, які мають одну з наступних двох характеристик, виключаються зі стабілізації зразків та стабілізаційного зважування:

  • Домогосподарства, які належать до кластеру, який був відібраний за методом I або II, описаним у розділі 6.1.2;
  • Домогосподарства, що живуть у житловому приміщенні недавнього будівництва, яке було додано до переліку кластерів і яке не може бути вилучене із вибірки (житло, вибране інтерв'юером).

Оскільки цим домогосподарствам не пощастило вилучити їх із вибірки, вони також виключаються зі стабілізаційного зважування.

6.2 Недостатня вага

Хоча робиться спроба опитати всі домогосподарства у вибраній вибірці, відмови та інші фактори унеможливлюють зв’язок з деякими домогосподарствами. Частина цього невиконання домогосподарства спочатку вирішується за допомогою методу поздовжньої імпутації (див. Розділ 5.3.3). Потім решта домогосподарств, які не відповіли, обробляються шляхом вилучення їх з файлу та виправлення зважених показників для домогосподарств, що відповідають, включаючи ті, що були приписані, за допомогою коефіцієнта корекції відсутності відповіді. Основним принципом є вибір моделі, яка підходить для невідомих ймовірностей відповіді, а потім розрахунок коефіцієнтів корекції відсутності відповіді відповідно до оберненої до оціненої ймовірності відповіді.

Кожен член даного домогосподарства-респондента має право на однаковий корекційний коефіцієнт відсутності відповіді, а отже, на однакову підвагу.

6.2.1 Категорії відсутності відповіді

Ключем до зменшення упередженості відсутності відповіді є визначення категорій відсутності відповіді, які чітко пояснюють механізм невідомої невідповіді та розвиток яких виправдовує гіпотезу про постійну ймовірність відповіді в межах категорій. Що стосується ефективності, бажано також, щоб категорії невідповіді були якомога одноріднішими щодо основних змінних, що цікавлять. Іншими словами, формування категорій повинно зробити респондентів даної категорії подібними до респондентів за основними змінними, що цікавлять. Таким чином, змінні, що використовуються для розробки категорій, повинні бути пов’язані з механізмом невідповіді та основними змінними, що цікавлять.

6.3 Підсумкові ваги

Останнім кроком у процесі зважування є розрахунок кінцевих ваг, які використовуються для отримання офіційних оцінок. Комбіноване калібрування та інтегрований метод зважування використовуються для отримання кінцевих ваг. Інтегрований метод зважування використовується для забезпечення загальної кінцевої ваги для кожної людини в домогосподарстві.

6.3.1 Композитний клин

Граничне коригування використовується з трьох причин: для забезпечення узгодженості з прогнозованими оцінками перепису населення та з усіма опитуваннями, що використовують ці оцінки перепису; враховувати недостатнє покриття; підвищити ефективність оцінок. Для того, щоб врахувати недостатнє покриття та підвищити ефективність оцінок, допоміжні змінні, які використовуються для калібрування, повинні співвідноситися з основними змінними, що представляють інтерес. Одним із способів досягнення цієї мети є вибір допоміжних змінних шляхом моделювання змінних, що цікавлять. Наприклад, відповідна модель може бачити, що зайнятість або безробіття пов'язані з віком та статтю людини.

підпадає під дію двох наборів обмежень: обмеження на розбиття полів та складене обмеження на розклинювання.

Імпутація допоміжних змінних управління

У першому методі обчислення середнього значення використовується для отримання модифікованого вектора: