Вступ до аналізу - завантаження ppt

Вступ до аналізу Ліцензія 3 - Математичні та статистичні інструменти Вступ до просторового аналізу шаблонів

Структура Статистичні нагадування Тест Колмогорова Смірнова Закон Пуассона Просторовий аналіз закономірностей Просторовий розподіл: цілі Аналіз квадратів Аналіз найближчого сусіда Функція G Функція F Функція К Ріплі за щільністю ядра

Тест Колмогорова Смірнова Непараметричний тест Колмогорова Смірнова Він полягає у обчисленні існуючих різниць між кумулятивними відносними розподілами частоти двох зразків та перевірці, чи може найбільша різниця бути випадковою чи ні (Добс). Принаймні для одного значення xi Simple на прикладі ...

Тест Колмогорова Смірнова Домашній асортимент чорного ведмедя (F&M) Діапазон домашнього сексу (км2) FM 37 72 94 504 60 173 49 18 560 50 274 168 102 20 Питання: Ступінь домашнього ареалу самців чорних ведмедів відрізняється від цього домену жінок? Припущення: Принаймні для одного значення xi

Тест Колмогорова Смірнова Freq cum abs. Часті диплом відн. Різниця. Різниця. макс. xi Fcum (xiF) Fcum (xiM) Fcum (xiF)/nF (A) Fcum (xiM)/nM (B) (A) - (B) Dobs 18 20 37 49 50 60 72 94 102 168 173 274 504 560 1 2 3 5 6 7 8 9 4 0,111 0,222 0,333 0,555 0,666 0,777 0,888 0,166 0,500 0,833 0,722

Тест Колмогорова Смірнова

Випробування Колмогорова Смірнова. Тут у випадку малих зразків nF & nM KSa, тоді ми відкидаємо H0 (відхилення занадто великих значень) Тут 48> 39, тому ми відкидаємо H0 Висновок: Ступінь домашнього ареалу самців суттєво відрізняється від ступеня жіночий домен.

Тест Колмогорова Смирнова Якщо, навпаки, n1 & n2 більше 25, ми обчислюємо: якщо Dobs> Da, гіпотеза H0 відхиляється на користь H1

Одна з непередбачених ситуацій має дуже низьку ймовірність. Закон Пуассона: P (m) Закон Пуассона: розривний теоретичний розподіл, що походить від біноміального закону. Одна з непередбачених ситуацій має дуже низьку ймовірність. В основному використовується при підрахунку людей чи подій, випадково розподілених у часі чи просторі. Біноміальний закон прагне до Пуассона, якщо p зменшується, а n збільшується. На практиці подія є рідкістю, якщо p 50.

Закон Пуассона: P (m) Приклад ... Пошук валют за допомогою металошукача. За 89 днів знайдено 48 монет.

s2 = m = 0,539 Закон Пуассона: P (m) Середня кількість знайдених валют на день: 48/89 = 0,539. Ймовірність знахідки, що відбулася в день D: p = 1/89 = 0,011. Кількість подій = 89 s2 = m = 0,539

Закон Пуассона: P (m)

Математичне сподівання: m = np Закон Пуассона: P (m) Математичне сподівання: m = np Дисперсія: s2 = npq; фактично s2 -> m

Просторовий аналіз - цілі Тут аналіз фокусується на статистичному аналізі основних моделей та процесів. Заключне питання: "У чому причина, чому ми спостерігаємо такий просторовий малюнок?" Процес є спочатку дослідницьким та кількісним. Тоді це має бути пояснювальним. У цьому вступі ми зосередимося головним чином на дослідницькому аспекті.

Просторовий аналіз - Аналіз з цілями R (безкоштовний, повний, швидкий, широко використовується в науці)

Ефекти першого та другого порядку

Просторовий розподіл Аналіз просторових властивостей усіх точок. Два підходи: Щільність з використанням аналізу "Квадрат". Виходячи з частоти розподілу або щільності точок у сітці. Відхилення/середнє співвідношення Порівняння з теоретичним розподілом частоти. Аналіз найближчого сусіда на основі відстані між точками.

Квадратний аналіз Розрахунок частот Вибірка перепису Кілька способів побудови квадратів. Зверніть увагу на їх розміри!

Квадратний аналіз Побудуйте сітку, елементи якої мають ширину: Розгляньте кожну клітинку як спостереження і підрахуйте кількість точок у кожній, щоб створити змінну X. Обчисліть дисперсію, середнє значення X та відношення дисперсії/середнього значення. Для рівномірного розподілу дисперсія дорівнює 0 Отже, відношення дисперсія/середнє має бути близьким до 0. Для випадкового розподілу дисперсія та середнє значення однакові (закон Пуассона). Отже, співвідношення дисперсія/середнє має бути близьким до 1. Для розподілу кластерного типу дисперсія велика. Отже, співвідношення дисперсія/середнє має бути більше 1. A = площа P = кількість балів

Квадратний аналіз x x x рівномірний кластер Випадкова дисперсія x рівномірний x RANDOM UNIFORM CLUSTER Відхилення N = кількість квадратів = 10

Квадратний аналіз Ми порівнюємо частоти, що спостерігаються в квадратах, із очікуваними частотами, які генеруються: Випадковою моделлю (закон Пуассона) Модель кластерного типу Однорідна модель (наприклад, кожна клітинка має точки P/Q) Дві можливості порівняння двох частоти розподілу: c2, Колмогоров-Смирнов

У середньому 4 бали за клітинку (l = 100/25). Дисперсія = 4,59 Квадратний аналіз 3 2 6 4 7 9 5 В середньому 4 бали на клітинку (l = 100/25). Дисперсія = 4,59

Квадратний аналіз Freq Obs, O Exp, E | O-E | | O - E | 2/E 1, 5 0,64 1,8 1,83 2 1, 5 0,64 1,8 1,83 2 6 3,7 2,3 1,49 3 4,9 1,1 0,25 4 2,9 1,7 5 3,9, 9 0,21 2,6 1,4 0,75 7 1,5 0,18 8, 7 0,74 9. 3 1,35 10 .1 0,13 Сума 25 χ2 = 9,3 Freq Obs, O Exp, E | OE | | O - E | 2/E 0-1 1 2,3 1,3 0,73 2-3 12 8,6 3,4 1,34 4-5 5 8,8 3,8 1,64 6 та + 7 5,3 1,7 0,54 Сума 25 χ2 = 4,3 Будьте обережні, однак, менше 5 спостережень в деяких класах! Ми перегрупуємось! χ20.05.2 = 6, отже, з 4.3 ми все ще не можемо відкинути H0. Кількість ступенів свободи в цьому випадку = 11‑1‑1 = 9, оскільки існує 11 класів частоти. Загальна сума відома (-1DF), а середнє значення оцінено за зразком (-1DF). χ20,05,9 = 16,9, отже, з 9,3 не можна відкинути H0.

Квадратний аналіз Колмогорова H0: дані відповідають моделі H1: дані не відповідають моделі K порівнюється з критичними значеннями з таблиць

Квадратний аналіз з R 27

Квадратний аналіз з R 28

Квадратний аналіз з R 29

Квадратний аналіз з R 30

Квадратний аналіз з R 31

Квадратний аналіз з R 32

Квадратний аналіз з R 33

Квадратний аналіз з R 34

Квадратний аналіз з R 29 >> 1 ! 35

Слабкі сторони результатів аналізу квадрату залежать від розміру та орієнтації квадратів! Ви повинні перевірити різні розміри (або орієнтації)

Слабкі сторони квадратового аналізу Це міра дисперсії, а не закономірності, оскільки вона базується на щільності, а не на їх взаємозв'язку між собою. Наприклад, аналіз Квадрат не може розрізнити ці дві закономірності. 37

Аналіз найближчого сусіда Використовує відстань між точками. Порівняйте середню відстань, що спостерігається між кожною точкою та її найближчим сусідом, із середньою відстанню, яка очікується, якщо розподіл був випадковим.

Аналіз найближчих сусідів - Функція G NNI = Dist. середнє значення Obs/Dist. очікуване середнє значення Для випадкового, NNI = 1 Для кластеру, NNI = 0 Для рівномірного, NNI = 2.149 Ми можемо використати тест звичайного розподілу, щоб побачити, чи відрізняється спостережуваний розподіл від шансу. Z = Dist Avg Obs - Dist. Сер. Досвід Стандартне відхилення

Тест аналізу найближчого сусіда (стандартна помилка)

Аналіз найближчого сусіда

Аналіз найближчого сусіда Розрахуйте (евклідову) відстань від кожної точки до найближчого сусіда, обчисливши гіпотенузу трикутника Сайт XY NN dNN A 1,7 8,7 B 2,79 4,3 7,7 C 0,98 5,2 7,3 D 6,7 9,3 2,50 E 5,0 6,0 1,32 F 6,5 4,55 13.12 Obs означає відстань

Аналіз найближчих сусідів Досконало розподілений 2,15 Більше розподілений, ніж випадковий Повністю випадковий 1 Більше згрупований, ніж випадковий Досконало згрупований

Аналіз найближчих сусідів Випадковий згрупований рівномірний NNI Середня відстань NNI Середня відстань NNI Середня відстань Z = 5,508 Z = -0,1515 Z = 5,855

Аналіз найближчого сусіда на R

Аналіз найближчого сусіда на R Між 0 і 1! Не випадково

Аналіз найближчих сусідів Переваги NNI враховує відстані Немає жодних проблем щодо розміру квадратів, як раніше. Недоліки Остерігайтеся крайових ефектів (зверніть увагу на розмір і форму) В основному, виходячи із середньої відстані. Ми не бачимо локальних варіацій (наприклад, інд. Згруповано локально, але не скрізь) Можливе коригування ефектів краю, але це не вирішує не всіх проблем. Є альтернативи. Вони засновані на розподілі всіх відстаней ...

Висновки - приклад функції G G під огинаючою => регулярний

Функція F (порожній простір) Візьміть центр усіх комірок пластинчатої сітки в області, що нас цікавить. Визначте мінімальну відстань від кожної з цих точок до подій у досліджуваній зоні.

Аналіз функції F Для однорідного процесу Пуассона функція F визначається як функція G: 𝐹 𝑟 = 1− 𝑒 −𝜆𝜋 𝑟 2 З l щільність подій на одиницю площі (щільність або інтенсивність).

Висновки - приклад функції Random F.

Висновки - приклад функції F F під конвертом => кластера

Висновки - приклад функції F F над конвертом => регулярний (насправді тут немає)

Висновки - приклад функції F Реальний випадок кластеризації

Аналіз функцій F і G на R

K Ріплі К використовується для визначення того, чи точкові процеси агрегуються або розсіюються на діапазоні відстаней (d) На основі кількості точок в радіусі (змінної), центрованої в кожній точці.

K Ріплі К Поділіть суму кількості точок, підрахованих на різних відстанях, на щільність, помножену на площу кола.

K Ripley's K Ми представляємо K (d) = f (d), і ми порівнюємо діаграму з тим, що дав би процес CSR (очікуваний) Для CSR, K (d) = pd2 K (d)> pd2 для кластера K (d) > pd2 => кластер

K by Ripley on R crimeK_env

Щільність ядра (ядро) Оцінка ядра (метод Парзена-Розенблатта) є непараметричним методом оцінки щільності ймовірності випадкової величини. Він базується на вибірці статистичної сукупності і дозволяє оцінити щільність у будь-якій точці опори.

Щільність серцевини (ядро)

Щільність серцевини (ядро) Вплив радіуса

Щільність серцевини (ядро)

Ліцензія 3 - Математичні та статистичні інструменти Автокореляція

Просторова автокореляція "всі речі пов’язані, але сусідні речі пов’язані більше, ніж далекі речі" Неприємність для статистичних тестів. Але також шанс дозволити просторову інтерполяцію. Просторова автокореляція є мірою подібності (кореляції) між пильними спостереженнями. спочатку часовий приклад (клімат, біологічні параметри тощо)

Часова автокореляція з R

Тимчасова автокореляція з R Команда acf обчислює кореляцію при різних "відставаннях" Сильна кореляція, коли точки близькі, потім поступово зменшується (принаймні тут)

Часова автокореляція з R

Просторова автокореляція Для просторової автокореляції це більш-менш одне і те ж, але будьте обережні: Час: 1 вимір Простір: 2 виміри Зверніть увагу на вимірювання відстані! Просторова автокореляція описує ступінь схожості спостережень (значень) у їх місцях (будь то точки, області чи растрові клітини) з усіма іншими. Тож нам потрібні дві речі: спостереження та місця.

Просторова автокореляція з R

Просторова автокореляція з R До речі, травневий аргумент команди by

Просторова автокореляція з R

Індекс Морана Індекс Морана (або Морана I) є мірою просторової автокореляції, розробленої Патріком Мораном. Просторова автокореляція характеризується кореляцією між географічно близькими вимірами вимірюваного явища

Індекс Морана Значення коливаються від -1 (що вказує на досконалу дисперсію) до +1 (досконала кореляція). Нульове значення є значущим для абсолютно випадкової просторової моделі.

Індекс Морана

Індекс Морана з R

Підказка Морана з R Phew! На щастя, функція реалізована в R

Індекс Морана з R

Індекс Морана з R (тест) Незначна позитивна кореляція

Графік Морана з R

Ліцензія 3 - Інтерполяція математичних та статистичних інструментів

Просторова інтерполяція Просторова інтерполяція - це процес використання точок з відомими значеннями для розрахункових значень в інших невідомих точках. Висока вартість та обмежені ресурси: Збір даних, як правило, проводиться лише в обмеженій кількості вибраних точок. У ГІС просторова інтерполяція цих точок може бути застосована для створення растрової поверхні з оцінками, зробленими для всіх растрових комірок.

Просторова інтерполяція Інтерполяція використовує векторні точки з відомими значеннями (відмінність уваги від моделей, розглянутих вище) для оцінки значень у невідомих положеннях для створення растрової поверхні, що охоплює цілу область. Результатом інтерполяції зазвичай є растровий шар. Важливо знайти відповідний метод інтерполяції, щоб оптимально оцінити значення невідомих позицій.

Підготовка даних за допомогою R

Розподіл лікарень Діаграма Вороного великі значення дають більший вплив на значення, найближчі до інтерпольованої точки Розподіл лікарень Яку лікарню вибрати відповідно до положення дискомфорту?

Діаграма Вороного великі значення дають більший вплив на значення, найближчі до інтерпольованої точки. Діаграма Вороного - це поділ площини на клітини з дискретного набору точок, званих "насінням". Кожна клітина охоплює один зародок і утворює безліч точок на площині, ближчих до цього зародка, ніж до всіх інших.

IDW: величина зваженої інтерполяції, зваженої на відстань, надає більший вплив на значення, найближчі до інтерпольованої точки. Великі значення p дають більший вплив на значення, найближчі до інтерпольованої точки

Інтерполяція: кілька інших варіантів великі значення дають більший вплив на значення, найближчі до інтерпольованої точки Кригінга, більш складна, але більш ефективна Інтерполяція природними сусідами