Моделі структурних рівнянь - Статистика Wiki Ratgeber Lexikon
Загальний вступ
Вивчаючи емпіричні факти, психологи, біологи, статистики тощо шукають зв’язок між різними змінними. Ці змінні можуть бути змодельовані за допомогою вимірюваних (спостережуваних), а також прихованих (неспостережуваних) змінних. Часто використовується метод лінійної регресії, за допомогою якого ви реєструєте лінійну залежність між досліджуваними вимірюваними змінними. Ви не отримуєте ніякої інформації про причину та наслідок (причинно-наслідковий зв'язок) між вашими змінними. Крім того, складні взаємозв'язки між вашими змінними можуть залишатися непоміченими.
Модель структурного рівняння може вирішити ці два моменти. Зокрема, це може дати вам уявлення про "приховані" структури ваших змінних (звідси і назва). Метод являє собою суміш факторного аналізу, лінійної регресії та аналізу шляху. У літературі термін "модель структурного рівняння" використовується для різних, але по суті подібних методів. Як і у більшості методів статистичного аналізу, вам також потрібно формувати гіпотези, а потім перевіряти їх на значущість. Ви також можете використовувати факторний аналіз для визначення прихованих змінних.
Модель структурного рівняння на практиці
Припустимо, ви робите таку гіпотезу:
Стреси та важка фізична робота погіршують стан здоров’я.
Як бачите, існує причинно-наслідковий зв’язок між екзогенними латентними змінними стрес і фізичною працею та ендогенним, латентним змінним станом здоров’я. За допомогою моделі структурного рівняння ви можете шукати структуру в контексті ваших змінних. Для цього вам потрібні вимірювані змінні для захоплення прихованих змінних. У цьому прикладі ви можете виміряти стрес, наприклад, за часом сну та втратою ваги. Ви можете виміряти фізичну роботу за спаленими калоріями та кількістю випадків виснаження. Ви можете виміряти стан здоров’я, наприклад, за допомогою рівня цукру в крові та артеріального тиску. Графічне зображення у вигляді діаграми шляху дуже корисне, щоб ви могли відстежувати свою модель. Наступна діаграма шляху це ілюструє

Графічне зображення моделі з наведеного вище прикладу з використанням діаграми шляхів.
Модель структурного рівняння у наведеному вище прикладі: Ви можете розпізнати вимірювані змінні як жовті квадрати, а приховані - як сині овали. Окреслено структурну модель. Пунктирні стрілки представляють структуру, яка вас цікавить. Ваша гіпотеза математично:
Параметри моделі і суттєво відрізняються від 0.
Параметри, а також і є вимірюваними параметрами і можуть бути визначені, наприклад, за допомогою факторного аналізу. Після визначення параметрів ви можете відповідно оновити схему шляху. Як альтернативу наведеній вище гіпотезі ви можете оцінити приховані змінні, тобто структуру моделі, використовуючи факторний або дисперсійний аналіз.
Як ви оцінюєте параметри?
Наступний приклад показує, як визначаються приховані змінні та оцінюються параметри. На малюнку нижче ви можете знайти графік розкиду двох вигаданих наборів даних про час сну та втрату ваги з 200 значеннями кожен. Кожен часовий ряд центрировався близько 0 (віднімаючи середнє значення від кожного значення). Щоб залишитися на наведеному вище прикладі, приховану змінну напругу потрібно визначити за допомогою факторного аналізу. Як ви можете бачити на малюнку, розподіл даних, тобто дисперсія даних, відбувається по різному
| змінна | параметр | значення |
| Перед сном | c1 | 0,3 |
| Втрата ваги | c2 | 0,7 |
Таблиця 1: Дисперсія даних
| змінна | Дисперсія |
| X1 | 0,97 |
| X2 | 4.88 |
| X1 ′ | 5.71 |
| X2 ′ | 0,15 |
Таблиця 2: Параметри для визначення коефіцієнта
Лінії походження різних розмірів. Тепер ви хочете пояснити дисперсію змінної напруги з вашими вимірюваними змінними до максимуму і відповідно шукаєте напрямок з максимальною дисперсією. Зробити це можна кількома методами.
Хорошим і часто використовуваним методом є метод основної осі (див. Аналіз основних компонентів). Цей метод визначає пряму лінію через початок координат, тобто першу головну вісь, вздовж якої розкид даних максимальний. За допомогою цього можна потім визначити другу головну вісь. Це має найбільшу дисперсію даних серед усіх прямих ліній через початок координат, які перпендикулярні першій головній осі. Ви аналогічно поступаєте, визначаючи подальші головні осі. Ви можете уявити метод як зміну всієї системи координат.
Для цих даних два основні компоненти на малюнку зображені двома перехрещеними лініями X1 'і X2'. Відхилення даних можна знайти в таблиці 1. Дисперсія вздовж вихідних координат (суцільні X1 та X2) менша за дисперсію вздовж першої головної осі X1 'і більша за дисперсію вздовж другої головної осі X2'. Потім ви можете розглядати цю нову змінну X1 ’як фактор 1, тобто приховану напругу змінної.
За допомогою цього методу ви отримуєте не тільки дисперсію, але й параметри та вихід. Результати цього можна знайти в таблиці 2. Ви можете розрахувати значення напруги прихованої змінної, що пояснюється вимірюваними змінними, за допомогою такого рівняння (скорочені назви змінних):
Отже, ви пояснюєте дисперсію даних за першим основним компонентом X1 '5,71. Дисперсія вздовж другого основного компонента X2 '0,15 є незрозумілою дисперсією, що становить 2,6% від поясненої дисперсії.
Після того, як ви визначили всі свої приховані змінні, ви можете оцінити параметри і, наприклад, за допомогою лінійної регресії. Відповідним рівнянням є, де для фізичної роботи виступає:
У цьому рівнянні дисперсія змінної здоров'я не пояснюється змінними в рівнянні. Найпростіший спосіб визначити параметри регресії і за допомогою статистичного програмного забезпечення. Більшість програм надають як оціночні значення, так і значимість оцінки. У таблиці нижче ви можете знайти приклад оцінки фіктивних значень даних. Результат може виглядати так, наприклад:
| змінна | Орієнтовна вартість | t-Статистика | р-значення |
| постійний | 0,04 | 0,59 | 0,55543 |
| стрес | 0,89 | 12.26 | 4.10E-25 |
| Робота | -0,64 | -9.30 | 2.78E-13 |
Метод
1. Формулювання питання (гіпотези): На цьому етапі вам слід добре подумати, яке саме питання ви хочете провести. Це центральний аспект вашої моделі, тобто її структура.
2. Вибір вимірюваних змінних та діаграма шляху: Для того, щоб емпірично перевірити свої гіпотези, вам потрібно вибрати вимірювані змінні. Вони повинні як підтвердити вашу гіпотезу, так і бути репрезентативними. Потім ви відображаєте всю модель графічно за допомогою діаграми шляху (як показано вище).
3. Розпізнайте структуру моделі: Використовуючи діаграму шляху, ви розпізнаєте передбачувані або очікувані зв’язки. Зокрема, це дає вам хороший огляд, який ви можете швидко втратити за допомогою декількох змінних.
4. Оцінка параметрів та перевірка на значущість: Оцінки параметрів у моделі структурного рівняння можуть відрізнятися. Найпоширенішими методами є лінійна регресія та факторний аналіз або аналіз основних компонентів, як ви могли бачити у прикладі вище. На практиці для цього використовуються програми, які виконують усі необхідні кроки для розрахунку. Важливими програмними пакетами для цього є, наприклад, SPSS Amos, Mplus або SmartPLS.
5. Можливі зміни в моделі: Ви можете відкинути параметри, які суттєво не відрізняються від 0. Потім ви видаляєте відповідні стрілки на діаграмі шляху. Незначущі параметри слід відкидати лише один раз. Подивившись на оновлену діаграму шляху, ви можете провести оцінку ще раз без відкинутих параметрів. Залежно від кінцевого результату, ви можете відхилити свою гіпотезу, зберегти її або перетлумачити.
література
Йореског, К. Г. і Сербом, Д. (1989). LISREL 7: Посібник із програми та програм (2-е видання). Чикаго, Іллінойс: SPSS