Статистика місяця Пошукова система Microsoft збільшує рівень виживання на
Нестатистика червня 2016 року - це новина про те, що вчені Microsoft можуть використовувати пошукову систему "Bing" для виявлення раку підшлункової залози, і це врятує життя.

Це раннє виявлення може "збільшити рівень виживання 5-річного пацієнта з 3 до 5 до 7 відсотків", пише New York Times. Вчені Microsoft (Журнал онкологічної практики) провели пошук у 6,4 мільйона користувачів щодо таких симптомів, як незрозуміла втрата ваги, та факторів ризику, таких як алкогольна залежність. За схемою запитів тоді спробували передбачити тих користувачів, які пізніше, очевидно, захворіли на рак, що було зроблено на підставі запитів типу „Чому я захворів на рак підшлункової залози?”. Süddeutsche Zeitung повідомив у своєму інтернет-виданні 9 червня під заголовком «Діагноз раку в пошуковій системі»: «У 5-15 відсотках випадків їм вдалося раннє виявлення. Більше вражає дуже мала кількість помилкових спрацьовувань. Менш ніж один із 10 000 користувачів був помилково класифікований як хворий на рак ".
Як тепер прийнято, людей не запитували, чи можна проаналізувати їхні особисті дані. Але що, якщо рівень виживання подвоїться? Зрештою, показано, що Бінг рятує життя. Насправді?
Ні. Зрештою, збільшення 5-річного рівня виживання нічого не говорить про те, чи рятує життя раннє виявлення. Це не важко зрозуміти. Подумайте про 100 людей, які всі помирають від інвазивного раку до 70 років. Якщо вони не пройдуть скринінг, рак буде виявлений пізно, а 5-річна виживаність низька. Якщо вони підуть на скринінг, рак буде виявлений раніше, і 5-річна виживаність зросте. У цьому прикладі ніхто не живе довше, просто довше з діагнозом. Відповідно, дослідження показують, що вищі показники виживання після скринінгу не пов'язані з нижчою смертністю. Хитрість із показниками виживання не нова. У нестатистиці жовтня 2014 року ми показали, як її можна використовувати для обману жінок щодо переваг скринінгу на рак молочної залози. Зараз вони намагаються переконати нас у перевагах великих даних.
Але як щодо невеликого показника хибнопозитивних результатів 1 із 10 000, виділеного ЗМІ? Чи означає це, що серед тих користувачів, яких алгоритм оцінює як позитивні, помилки майже ніколи не трапляються? Ні. Це теж легко пояснити. Візьмемо 100 000 користувачів, 10 з яких мають невиявлений рак підшлункової залози. При рівні виявлення 10 відсотків (середнє значення 5 і 15 відсотків), ми очікуємо, що лише один з цих 10 буде класифікований як позитивний, інші 9 видів раку будуть упущені. З 99 990 користувачів, які не страждають на рак, ми очікуємо, що 10 все одно будуть оцінені позитивно (хибнопозитивний показник 1 на 10 000). Це означає, що із загальної кількості 11 людей із позитивним результатом один має рак підшлункової залози, а 10 - жодного. Більшість тих, хто має позитивний тест, помилково класифікуються як такі, що страждають на рак. Отже, навіть якщо показник хибнопозитивних результатів низький, частка хибнопозитивних результатів у всіх позитивних випадках все одно може бути високою при таких рідкісних захворюваннях, як рак підшлункової залози.
Ви пам’ятаєте Google Flu Trends? Як і Bing, ця програма була розроблена для прогнозування поширення грипу на основі обшуків. Він був проголошений у 2009 році з фанфарами як яскравий приклад успіху великих даних. Зараз його поховали без роздумів після багатьох років передбачень, що він був занадто високим. Чи доктор Google або Dr. Бінг: Великі дані - це перш за все великий бізнес, і не обов'язково краща медична допомога.