Розрахувати та зрозуміти статистичну кореляцію - на прикладі

Опубліковано 5 квітня 2019 року Валері Беннінг. Оновлено 21 липня 2020 року.

Кореляція говорить нам про ступінь взаємозв'язку між двома змінними.

Позитивна кореляція означає, що змінні розвиваються в одному напрямку. Отже, якщо одна змінна збільшується, зростає і інша змінна. У випадку негативної кореляції має місце навпаки: збільшення змінної 1 означає зменшення змінної 2.

Примітка. Кореляція завжди неорієнтована, тобто тобто не сказано, яка змінна спричиняє іншу. Навпаки, ми можемо використовувати кореляцію, щоб визначити, чи існує зв’язок та наскільки він сильний.

Зміст

Правильно визначати та інтерпретувати співвідношення

Кореляція позначається коефіцієнтом кореляції. Це завжди приймає значення від -1 до +1.

Приклад Ми хочемо визначити взаємозв'язок між зростом (змінна 1) та вагою (змінна 2) людей.

  • близький до числа 1 → сильна позитивна кореляція,
    z. Наприклад, люди вищого зросту мають вищу вагу.
  • близько до числа -1 → сильна негативна кореляція
    z. Наприклад, вищі люди легші у вазі.
  • близько до числа 0 → Навряд чи існує зв'язок між змінними висотою та вагою.

У таблиці наведено огляд розвитку двох змінних залежно від того, чи корелюють вони позитивно чи негативно.

Розробка кореляції прикладу змінних
Позитивна кореляція Змінна 1 збільшується → Змінна 2 збільшується Зі збільшенням розміру збільшується і вага.
Змінна 1 зменшується → Змінна 2 зменшується Якщо розмір зменшується, вага зменшується.
Змінна 2 збільшується → Змінна 1 збільшується Зі збільшенням ваги збільшується і розмір.
Змінна 2 зменшується → Змінна 1 зменшується Якщо вага падає, зменшується і розмір.
Негативна кореляція Змінна 1 збільшується → змінна 2 зменшується Якщо розмір збільшується, вага зменшується.
Змінна 1 зменшується → змінна 2 збільшується Якщо розмір зменшується, вага збільшується.
Змінна 2 збільшується → змінна 1 зменшується Якщо вага збільшується, розмір зменшується.
Змінна 2 зменшується → змінна 1 збільшується Якщо вага зменшується, розмір збільшується.
Примітка. Якщо ви хочете зробити твердження про напрямок взаємозв'язку або якщо у вас є залежна та незалежна змінна, ви можете скористатися регресійним аналізом.

Обчисліть співвідношення - Пірсон або Копієносець?

Для того, щоб розрахувати та вказати кореляцію, визначається коефіцієнт кореляції. Від шкали даних залежить, який коефіцієнт кореляції є правильним.

Використовуйте коефіцієнт кореляції Пірсона, якщо ваші дані метричні, і коефіцієнт кореляції рангу Спірмена, якщо у вас є порядкові дані.

Примітка. Для номінально масштабованих даних ми визначаємо коефіцієнт непередбачуваності, щоб вказати зв'язок між двома змінними.

Який ваш рахунок?

Дізнайтеся всередині 10 хв, чи ви ненавмисно створили плагіат.

  • 70+ мільярдів Інтернет-джерел
  • 69+ мільйонів публікацій
  • Надійний захист даних

зрозуміти

Інтерпретуйте кореляцію з графіком розсіювання

Окрім розрахунку коефіцієнта кореляції, ви можете створити графік розсіювання. Це ілюструє взаємозв'язок між двома змінними.

Ілюстрація показує графік розкиду для нашого прикладу з ростом і вагою людей. Ми бачимо, що існує позитивна кореляція, оскільки розподіл спостережень (балів) більше нагадує лінію.

Отже, змінні рухаються в одному напрямку, і ми можемо зробити висновок, що більший розмір йде рука об руку з більшою вагою.

Примітка. Якщо розподіл спостережень виглядає більше як лінія, це вказує на сильніший зв’язок між двома змінними і, отже, на вищий коефіцієнт кореляції (значення r), ніж якщо спостереження широко розсіяні.

Розсіяний графік у SPSS, Excel та Google Sheets

Виконайте наступні кроки, щоб створити графік розсіювання за допомогою SPSS, Excel та Google Sheets:

SPSS Excel
Таблиці Google
Графіка → Створення діаграми → Розсіяна/точкова діаграма
Вставка → Діаграма → Точка (X, Y) або діаграма розсіювання

Співвідношення та причинність

Визначаючи кореляцію, важливо зазначити, що кореляція є вказівкою, але не свідченням причинно-наслідкового зв’язку.

Це показує приклад спостереження за лелеками та народжуваністю:

Якщо ми спостерігаємо збільшену кількість лелек, а також рівень вища народжуваність в регіоні, ми можемо сказати, що існує кореляція, але не існує причинно-наслідковий зв’язок (наприклад, лелека приносить немовлят).

Якщо ви хочете з’ясувати, чи існує причинно-наслідковий зв’язок, вам слід провести експериментальне дослідження або регресійний аналіз з кількома контрольними змінними.

Часті запитання

Кореляція говорить нам про ступінь взаємозв'язку між двома змінними.

Використовуйте коефіцієнт кореляції Пірсона для метричних даних та коефіцієнт кореляції Спірмена для порядкових даних, для яких ви визначаєте кореляцію.

Ні, кореляція є ознакою, але не доказом причинно-наслідкового зв’язку між двома змінними.