Коли; промисловість досліджує великі дані Alliancy

Поширена оцифровка бізнесу

Для сприяння цій радикальній зміні поєднано кілька факторів. По-перше, збільшення потужності комп’ютера, що значно прискорює обробку. По-друге, узагальнена оцифровка бізнесу. Що ще важливіше, поява нових технологій (Hadoop, Map Reduce,
NoSQL, ...), які тепер обробляють феноменальні обсяги інформації в режимі реального часу і не мигаючи повікою. Навіть краще. Аналіз даних можна проводити лише на структурованих даних. Зараз ці інструменти дозволяють обробляти неструктуровані дані будь-якого типу, іншими словами переважну більшість доступних даних, які до того часу ми не знали, що робити. І ріг достатку не збирається пересихати, особливо з реальним потоком даних, які обіцяють пов’язані об’єкти.

“Де ви зі своїм проектом великих даних, містере Хоскінс? "

П'єр Наггар, директор EMEA з маркетингового агентства Turn, наводить випадок з американським клієнтом Kraft Foods, який використовував цю техніку для відновлення занепалого продукту. На основі багатих даних група підготувала різні повідомлення щодо цього асортименту та просунула їх до своїх клієнтів на основі їх поведінки в Інтернеті. Результат: "Збільшення вдячності бренду та намірів придбати" на 11% ", з рентабельністю витрат на рекламу" у два-три рази вище, ніж у попередніх кампаніях. "

Профілактичне і навіть прогнозне обслуговування, звичайно, є іншим додатком на вибір. Це вже практикувалося в Snecma, ще до того, як дійшло до великих даних. Зараз випадки множаться. Наприклад, SAP вказує на те, що виробник тракторів John Deere увійшов у нього, а німецький видавець навіть пропонує спеціальну програму прогнозного обслуговування навколо свого інструменту SAP Hana. Ми також відкриваємо такі програми, як оптимізація управління запасами. Французький стартап Lokad зробив це спеціальністю. Він розпочав свою діяльність у секторі роздрібної торгівлі та поширив свої послуги на авіаційну промисловість. Вимішуючи велику кількість даних з кількох джерел, він надає своїм клієнтам (півдюжини авіакомпаній) інформацію, щоб вони мали потрібні деталі в потрібному місці в потрібний час, причому з мінімальними витратами. Це одночасно дуже складна і вирішальна проблема для компаній. Вони повинні будь-якою ціною уникати знерухомлення літака на землі через відсутність запасних частин, і одночасно намагатися мінімізувати дуже дорогі запаси деталей.

“Великі дані - це не магія. Це наука, заснована на прикладній математиці та передовій інформатиці », - пояснює Бруно Тебуль. Це застереження наукового директора з досліджень та розробок та інновацій Keyrus, компанії з цифрових послуг, зроблено лише для кращого позначення реальної зміни парадигми, яка сталася з обробкою великих даних. “До цього часу статистики використовували математичні інструменти, здатні відповісти на точне запитання, використовуючи гіпотези на основі структурованих та історизованих даних. З приходом маси неструктурованих даних, таких як, зокрема, дані, які можна отримати в соціальних мережах, зробити це вже неможливо. Зараз ми працюємо в зворотному порядку: починаємо з наявних даних - ретельно збираємо, очищаємо та нормалізуємо - і намагаємось сформувати гіпотези. Це так званий метод викрадення, який працює шляхом висновку про найкраще пояснення з необроблених даних. І робота вченого з даних, за допомогою таких методів, як машинне навчання, зробити так, щоб значення випливало із даних, застосовуючи алгоритми, які найкраще підходять для кожного випадку. "

Ця радикальна зміна методу - яка не застаріває традиційні інструменти - стосується неструктурованих даних, таких як структуровані дані, що підлягають обробці. "Це іноді дозволяє несподіваним самородкам вийти з величезного кругообігу даних і знайти відповіді на запитання, які ми не обов'язково задавали собі. »Потужний, але не магічний !

Потенціал пов’язаних об’єктів

Випущений Michelin Solutions, Effifuel дозволяє паркам важких транспортних засобів зменшити споживання пального завдяки аналізу набору даних від транспортних засобів (перевірка та обслуговування шин, перевезення вантажу, маршрут, швидкість, перепад висот ...) і в перспективі за допомогою CGI.

Тим не менш, для промисловості додаток, який, мабуть, має найбільший потенціал, пов’язаний із пов’язаними об’єктами. Всякий раз, коли товар здатний постійно надавати масу інформації про свою поведінку - і про своїх користувачів - перед уявою відкривається величезне поле. Вже згадане попереджувальне обслуговування, очевидно, є першим використанням цього постійного моніторингу продуктів у режимі реального часу. Але є вже й інші. І в Snecma, і в PSA ми дуже зацікавлені в уроках, отриманих із реальних даних про поведінку продуктів, що експлуатуються. Який чудовий стенд для вдосконалення дизайну. Компанія Michelin Solutions, зі свого боку, створила програму Effifuel із CGI, яка, використовуючи всю інформацію, отриману від парку вантажних автомобілів, може значно зменшити споживання палива. Компанія настільки впевнена у своєму, що компенсує себе лише за фактично отримані прибутки.

Потреба в нових навичках

Тим не менш, будьте обережні! На цих прикладах хочеться зробити висновок - і багато хто не робить, щоб вас відмовити, - що достатньо зібрати колосальні обсяги даних, струсити все це маленьким Hadoop, зібрати скарби. Іншими словами, великі дані допомогли б зробити великі відкриття з абсолютно безформної калюжі необроблених даних. Критична помилка ! Великі дані - це не "магія", як наполягає Бруно Тебуль. Це навіть складна технологія, яку можна освоїти, якщо не дуже складно. До такої міри, що для отримання задовільних результатів з'явилися вчені з питань даних - вид, який досі є рідкісним і дуже бажаним. Навіщо користуватися вченим з даних? Оскільки, щоб насолоджуватися перевагами великих даних, спочатку потрібно мати чітке уявлення про те, що ви шукаєте. Тоді вам доведеться збирати феноменальні обсяги даних, але не просто будь-яких даних: тих, які найімовірніше будуть корисними в даному контексті. Потім ми повинні їх «очистити», організувати, стандартизувати ... Нарешті, ми повинні застосувати до них відповідні алгоритми, тобто як адаптовані до характеристик даних, що обробляються, так і до очікуваних результатів.

Для цього вченого з даних підтримують такі інструменти, як машинне навчання. За допомогою самонавчання ця техніка використовується для визначення типу алгоритмів, що застосовуються для вилучення сенсу з масиву даних та автоматизації процесу. Але, врешті-решт, головним актором у роботі залишається людина-оператор. Для цього він повинен бути не лише гострим фахівцем з математики та передових інформатик, але й добре знати бізнес компанії, в якій він працює, тобто знати про його потреби та виклики. Саме цей набір якостей - і не єдине машинне навчання, хоч би яким воно було вдосконаленим - дозволяє зробити наймудріший вибір на всіх етапах процесу.

В даний час великі дані знаходяться в центрі уваги. Вона досягла «піку завищених очікувань» знаменитої кривої групи Gartner, яка описує цикл «ажіотажу» всіх нових технологій. Хвилювання навколо предмета знаходиться на піку. Проте всі знають, що після цього саміту неминуче настає наступний етап: "прірва розчарування". Момент, коли порушені обіцянки та складність конкретної реалізації викликають сумніви та розчарування. Але можна впевнено передбачити, що потенціал технології такий, що незабаром великі дані продемонструють свою грізну здатність до трансформації та інновацій. Час, який потрібен користувачам у промисловості та в інших місцях, щоб виявити найуспішніші галузі застосування та з’явитись, поки що немислимі, програми-вбивці. Це вдало розпочалось, навіть якщо великі групи часто перешкоджають громіздким процесам прийняття рішень. У будь-якому випадку, нас чекають фантастичні сюрпризи.

Також відкрити - з тієї ж теми - в № 11 «Альянсу» маг наступні статті: