3.9 Оцінка

Перш за все, до обговорення статистичних можливостей оцінки слід розглянути загальні джерела помилок.

Maier 2000

3.9.1 Джерела помилок в оцінці

В опитуваннях джерела помилок (спотворені відповіді) можуть виникати внаслідок помилок в приладі або неправильних відповідей учасника. Помилки в приладі можна мінімізувати за допомогою науково обґрунтованої структури. По-перше, однак, слід описати ефекти, які можуть мати місце при оцінці і не мають прямого відношення до інструменту чи респондента, а скоріше до "природи справи".

Це вибір ефектів, які необхідно враховувати під час впровадження та, насамперед, під час оцінки.

Статистична смертність

Говорять про статистичну смертність, коли вже неможливо взяти інтерв'ю у всіх, кого спочатку зазнав захід (наприклад, курс, семінар). Оцінка проводиться в курсі ділового адміністрування в Тюбінгені, де цей ефект наочно проілюстровано. Дивно, але оцінки семінарів часто несподівано дають дуже хороші або хороші оцінки.

Якщо уважніше поглянути на процес, виникають дві проблеми. По-перше, опитування проводиться десь наприкінці семестру під час лекції. Студенти, яким семінар виявився настільки поганим, що вони більше не приходять, неминуче не включаються в оцінку зі своєю думкою. Тож ви кидаєте слідство.

Соціальна бажаність

Друга проблема оцінки, описана вище, базується на соціальній бажаності, в даному випадку в поєднанні з негативними санкціями. Опитування проводиться незадовго до іспитів. Якщо оцінка виявляється поганою, слід побоюватися, що оцінки на іспитах будуть однаковими. Під соціальною бажаністю розуміється "поведінка відповіді, орієнтована на очікування екзаменатора" (Sassenberg/Kreutz 1999, p.61).

дозрівання

Учасник дозріває під час міри, але не обов'язково через міру. Це означає, що зміну можна визначити під час до- і після обстеження, але виникає проблема з атрибуцією: чи отримав учасник вигоду від міри чи інших подій, наприклад, зовнішніх розмов, читання газети?

Тенденція згоди (придбання)

Це означає згоду на питання без посилання на вміст. Це можна побачити у людей, які ствердно відповідають, наприклад, на наступне запитання: "Володіння вогнепальною зброєю має бути гарантоване в Німеччині в Основному законі". З цим явищем існує схема пояснення, з якою, як правило, погоджуються люди з низькою силою его.

Ефекти первинності та недавності

Ефект першості схожий на згадану раніше тенденцію до згоди, з тією різницею, що принципової згоди немає, а обраний перший варіант відповіді, який задовольняє учасника.

Ефект первинності можна припустити, якщо існує тенденція до однієї з перших відповідей у ​​списку. Ефект першості виникає порівняно часто з візуально доступними списками відповідей (пор. McClendon у Vogt 1999, с. 134). Теоретично це явище можна пояснити застосованим задовільним принципом, тобто респондент вибирає першу відповідь, яка його "задовольняє", внаслідок чого подальші варіанти відповіді ігноруються. Відсутність знань про тему питання чи відсутність інтересу до нього також може бути вирішальним (пор. Vogt 1999, с. 135).

На відміну від цього, спостерігається ефект недавньої реакції, коли тенденції відповіді тягнуться до однієї з останніх позицій у списку. Це відбувається v. a. в усних опитуваннях, коли респондент вже забув перші варіанти і, таким чином, робить вибір з останніх почутих пунктів.

Ефект ореолу

Якщо питання знаходиться в контексті попередніх питань, на нього можуть вплинути попередні питання чи відповіді. Потім респондент використовує попередні запитання та відповіді як керівництво. Цю проблему називають ефектом гало або випромінювання. Такі наслідки в основному виникають, коли питання якимось чином стосуються однієї і тієї ж теми або теми. Однак вони «доказуються лише у поодиноких випадках. Послідовні результати щодо певних ефектів послідовності, очевидно, недоступні »(Vogt 1999, с. 131; пор. Schnell et al. 1999, p. 320). Тим не менше, слід звернути увагу на можливі ефекти, пов'язані з контентом.

Центральна тенденція або похибка твердості

У випадку центральної тенденції респондент уникає крайніх проявів. Респонденти прагнуть до середини. Подібне явище, яке, як правило, є надзвичайно позитивним, описує Герль: «Проблема (.) Часто виникає, що учасники, як правило, роблять дуже сприятливі оцінки та оцінки свого курсу та/або свого викладача курсу. Потім окремі предмети іноді виявляють надзвичайно нерівні розподіли ". (Герл, 1983, с.46)

Ця проблема збігається з досвідом моєї курсової роботи. В оцінці від 85 до 100% учасників голосують за "дуже добре". Герл називає дві можливі причини такої поведінки: З одного боку, участь у курсі, на відміну від нормальних умов життя, насправді призводить до великого задоволення, відносно незалежного від дидактичної якості. Курс може сприйматися як відпустка із повсякденного життя.

З іншого боку, є цілком слушне друге пояснення: учасники не можуть бути використані для подання диференційованої критики викладача курсу, який на даний момент є керівним персоналом. Ще одним ускладнюючим фактором для поганої оцінки є те, що керівник курсу, як правило, доброзичливий і отримує хорошу оцінку з "симпатії" (або з жалю). Таким чином, можна дуже добре оцінити всі відповіді незалежно від питання.

Герл пропонує обчислювально узагальнити інші, бідніші категорії та порівняти їх із результатом дуже хороших оцінок (Gerl 1983, с.46).

Резюме служить загальним оглядом і може за певних обставин відновити надмірно позитивні відгуки.

3.9.2 Статистичні методи

На відміну від людського інтелекту, комп'ютерний інтелект може помилятися з набагато більшим ступенем точності. (Автор невідомий)

Статистика - це числові параметри, методи оцінки та найрізноманітніші графічні подання, що дозволяють значимо реєструвати та аналізувати дані спостереження.

Математичне оцінювання згідно з описовими процедурами

Вперше розміри та характеристики місця розташування та заходи розсіювання створюють враження очікуваних результатів. Ще одна дуже важлива мета - “створити певну чутливість з боку дослідника щодо наявних даних” (Maier et al. 2000, с.35). Це запобігає помилкам, які можуть відносно швидко вкрастись під час перетворення змінної. У повсякденному житті цей процес відбувається інтуїтивно, як коли ви керуєте рахунком у ресторані. Тож допомагає "напр. при визнанні неправдоподібних розподілів, авантюрних середніх значень або незвично великої кількості або менше дійсних значень "(там же Майер).

Описові процедури

Знання описових процедур є важливим, оскільки ці значення можуть бути автоматично розраховані пізніше, коли використовується програмне забезпечення, незалежно від того, наскільки безглуздими є вихідні значення або питання. Ось як розраховується питання “Наскільки висока частка іноземців у швейцарській гвардії у державі Ватикан”.

Для базового розуміння спочатку потрібно розуміння рівнів шкали.

По-перше, Номінальна шкала потрібні. При такому масштабуванні існує лише одне "або-або". Запитання розбиваються, наприклад, відповідно до статі та намірів голосувати. Відповіді не можна замовити, тому вони не мають рангу. Зазвичай немає проміжних стадій.

В Порядкова шкала На відміну від номінальної шкали, дані можна вводити в певний порядок, якщо певні характеристики формально є «більш цінними», ніж інші. Наприклад, якщо ви закінчите школу, Abitur вважає більше, ніж Realschule, що, в свою чергу, краще, ніж Hauptschule. Можна лише сказати, що щось краще, а не наскільки краще.

В Інтервальні шкали На додаток до властивостей іменної та порядкової шкал існує також можливість визначення різниці. Класичним прикладом будь-якої статистичної лекції є різниця температур - різниця між 10 і 20 градусами настільки ж велика, як і між 60 і 70 градусами.

В Шкала співвідношення На додаток до властивостей інших масштабувань додається постійно визначена нульова точка. Це дає можливість розрахувати коефіцієнти. Тож можна сказати, що людина А утричі старша за В, яка заробляє вдвічі більше.

[Таблиця 16: Порівняння номінальної, порядкової, інтервальної та співвідношення шкал за Maier та співавт. (2000, с. 36)

Розуміння масштабів - це перший фундаментальний крок у успішному застосуванні статистичних методів. Інтегруючи його в програмне забезпечення, категорії запитань можуть створюватися автоматично. У суспільствознавстві в основному є ознаки, що відповідають іменній та порядковій шкалі.

Також важливі центральні тенденції. Тут згадуються лише середнє арифметичне (середнє, середнє), режим (модальне значення), медіана (центральне значення) та квантилі.

Міри дисперсії дають уявлення про мінливість розподілу ознак. Міри дисперсії включають мінімум і максимум, діапазон, міжквартильний діапазон, стандартне відхилення, дисперсію та коефіцієнт дисперсії (відносна дисперсія).

Щоб не перевищити обсяг роботи, для пояснення тенденцій та заходів дисперсії слід звернутися до статистичних книг, які зазвичай пояснюють ці терміни в перших главах (див. Maier et al. 2000).

Аналітичні процедури

Метою аналітичного методу є перевірити, чи можна зробити висновки, які можна узагальнити, з отриманих даних, чи існують зв’язки між окремими змінними. Далі коротко викладено три важливі методи аналізу даних, які можуть представляти інтерес для оцінки та які автоматично обчислюються деякими з описаних програмних пакетів.

Перехресна таблиця (синоніми: двовимірний розподіл частоти, таблиця непередбачених ситуацій)

Перехресна таблиця показує взаємозв'язок між двома змінними. Вони перехрещені, і це показує розподіл частоти змінної, яка визначається характеристиками другої змінної. Ось простий приклад: Оцінка може запитати про задоволеність учасників. Крім того, під час оцінки визначається стать. Ці дві змінні перетинаються, і можна зробити твердження про задоволеність учасників залежно від статі.

Твердження можна перевірити на значущість за допомогою тесту chi 2, який зазвичай використовується для перехресних таблиць. Якщо є статистична значимість, показник асоціації цікавий. Ступінь асоціації виражає ступінь встановлених стосунків. Цього має бути достатньо, щоб мати можливість оцінити програмне забезпечення. Подальші та, перш за все, точні процедури процесу наведені у Maier et al. (2000, с.46 і далі).

Кореляційний аналіз

При кореляційному аналізі статистична залежність між двома метрично масштабованими змінними повинна бути кількісно визначена, за умови існування зв'язку. Подання на діаграмах відбувається за допомогою хмари точок. Якщо точки дифузно розсіяні, кореляції немає (коефіцієнт кореляції Пірсона r = 0). Якщо точки близькі і майже на уявній прямій, тоді коефіцієнт кореляції прагне до r = 1 (пор. Maier et al. 2000, p.62 ff.).

Факторний аналіз

Факторний аналіз часто використовується, коли дані доступні з невідомою структурою, тобто коли невідомо, як теоретично можуть бути зв’язані окремі змінні між собою. Ось яскравий приклад: анкета про купівлю автомобіля задає професію та важливість володіння автомобілем. Ці дані оцінюються факторним аналізом. Наступна діаграма показує сильні сторони факторного аналізу та подання у вигляді факторіальної карти.

[Рисунок 15: Приклад оцінки важливості власності автомобіля, показаний на факторіальній карті

Факторний аналіз йде навіть далі, ніж у прикладі, і пропонує дивовижні можливості для знань.

Знову ж Maier et al. (2000, с. 116 сл.) Для отримання додаткової інформації.

Остаточний роздум про статистику

Статистичні процеси можуть дати глибокі результати. Основна вимога є і залишається базовим розумінням статистичних процесів, навіть при використанні комп'ютерних опитувань. Наступний четвертий розділ показує, наскільки використання описових та аналітичних методів підтримується програмними рішеннями.