Похмурі дані, чому ваші старі фотографії руйнують довкілля
Після темної павутини, ось темні дані. Невикористані корпоративні дані, про які ви, у вашому масштабі, могли забути і які зберігаються в хмарі. Хоча вони і не використовуються, вони тим не менш сильно впливають на навколишнє середовище.

Ах, усі ті фотографії з вашої подорожі до Індії в 2014 році, які вони прекрасні. І ті відеоролики ваших романтичних вихідних в Амстердамі того ж року: які гарні спогади ... Але чи справді ви їх дивились, переглядали, слухали з часу вашого повернення з подорожі 6 років тому? З якого часу ваші файли заповнені мультимедійними файлами сидять на «робочому столі» вашого (віртуального) комп’ютера, не звертаючись до них ?
Ви вважали ці файли нешкідливими, оскільки вони були на вашому жорсткому диску. Ви були праві. Ви думали те саме, коли, щоб зберегти їх десь «про всяк випадок», ви відправили їх на iCloud або Google Drive. Ви, на жаль, помилились.
Забуті дані
Ви, напевно, вже знаєте: цифрові технології забруднюють і, зокрема, ШІ. Наприклад, навчання моделі глибокого навчання для обробки природної мови викидає стільки, скільки людина протягом 57 років, або як 5 автомобілів за своє життя.
Використання значної маси даних (відомі великі дані) вимагає, зокрема, використання тисяч комп’ютерних центрів та серверних ферм, центрів обробки даних, які працюють на повній швидкості і які генерують від 2 до 5% глобальних викидів парникових газів, за даними дослідження Університету Массачусетсу, проведеного минулого літа. Але ви повинні знати, що всі ці дані, які забруднюють опосередковано, навіть не всі використовуються.
У 2015 році Гартнер вже говорив про ці відомі «темні дані», або темні дані. Своєрідна інформаційна «темна матерія», яку компанії «збирають, обробляють та зберігають під час своєї повсякденної ділової діяльності, але яку вони, як правило, не використовують для будь-яких інших цілей, ні для отримання інформації, ні для прийняття рішень ". За словами фірми, організації "часто зберігають ці дані лише з метою дотримання відповідності, і їх зберігання, а також їх забезпечення, як правило, передбачає більше витрат (а іноді і більше ризику), ніж вартість".
Дуже часто, якщо темні дані не використовуються, часто це пов’язано з тим, що компанія не має інструментів для аналізу цих даних, які вона зібрала масово і які є неструктурованими (у форматах, які важко класифікувати та прочитати). Іноді вона навіть не підозрює, що ці дані збираються. За даними IBM, темні дані також надходять від датчиків та пов’язаних об’єктів; вони представляють 90% даних цих пристроїв і ніколи не використовуються. Далі Big Blue підраховує, що більшість організацій аналізує лише 1% своїх даних, які часто "зберігаються з метою дотримання нормативних вимог або в реєстрі".
Непотрібні дані
Деякі з них вважають, що ці темні дані можуть бути корисними для них у майбутньому, особливо "коли вони придбають кращу аналітику та технологію бізнес-аналітики для обробки інформації. У той же час, пояснює Гартнер, "оскільки зберігати ці дані в хмарі недорого, цим компаніям легко їх перезавантажити".
У 2014 році, згідно з дослідженням Асоціації з управління інформацією та іміджем (AIIM), 60% компаній вважали, що їхня “здатність звітувати про бізнес-аналітику недостатня” для аналізу цих похмурих даних. Здається, ситуація мало змінилася через 6 років. Згідно з нещодавньою доповіддю Veritas Technologies, американського стартапу, що спеціалізується на «управлінні багатохмарними даними», 52% всієї інформації, що зберігається компаніями в центрах обробки даних, є неясними даними. Дані, значення яких невідоме, оскільки вони "ще не визначені", або тому, що вони просто непотрібні. Зверніть увагу на це, що за даними IBM, 60% темних даних дуже швидко втрачають свою цінність, оскільки вони швидко псуються.
6,4 млн т вуглекислого газу
По суті, все це було б несуттєвим, якби ці темні дані не мали значного енергетичного та екологічного сліду. Оскільки всі ці дані, що зберігаються в центрах обробки даних (більшість з яких надзвичайно енергоємні і все ще численні, щоб працювати завдяки електроенергії, що виробляється з вугілля або атомних електростанцій), справді мобілізують значні енергетичні ресурси для подальшого впливу на навколишнє середовище. Близько 6,4 мільйона тонн вуглекислого газу буде непотрібно викинуто в атмосферу в 2020 році через ці невикористані або забуті дані, згідно з дослідженням Veritas.
Навіть якщо це означає робити кольорові порівняння (але трохи туманні?), Veritas Technologies вказує, що це рівноцінно щорічному відмові 80 країн, або що це становить подорож навколо світу на автомобілі 575 000 разів (забруднюючи повітря в його шлях). Але на цьому все не повинно закінчуватися. Дійсно, беручи підрахунки фірми IDC, вона пояснює, що Інтернет речей (IoT) незабаром призведе до "масового збільшення" виробництва даних "у всьому світі", знизивши їх з 33 цетабайт (ZB) до 2018 року до 175 ZB у 2025 році, або 175 мільярдів терабайт. У цій gloubi-boulga темні дані повинні представляти 91 ZB, або в 4 рази більше загальної суми поточних даних. "Для поглинання всього виробленого вуглекислого газу знадобиться 7 500 000 акрів лісу, що в 500 разів перевищує Манхеттен", - зазначає Veritas.
Що думати про ці цифри? У дослідницькому центрі Shift Project, присвяченому енергетичним переходам у Європі, Хьюг Ферребойф, директор проекту "тверезість", розмірковує про практики, що дозволяють обмежити вплив цифрових технологій на навколишнє середовище. За словами дослідника, темні дані насправді не забруднюють так сильно ... поки. «На зберігання даних (загалом) витрачається 30% енергоспоживання центрів обробки даних; які самі споживають 400 тераватт-годин (TWh) для роботи. Отже, це означає, що дані споживають 130 TWh. Якщо 50% з них марні, тоді ми маємо 60 твт-год спожитого ні за що, або близько 30 мільйонів тонн викидів CO2 щороку ", - підраховує він. "Слід визнати, що це в десять разів менше, ніж використання потокового передавання (близько 300 мільйонів тонн CO2, що споживається на рік), але слід пам'ятати, що обсяг даних, що зберігаються в хмарі, зростає навіть швидше, ніж трафік у мережах", додає інженер.
За словами Хьюга Ферребойфа, мережевий трафік зростає на 25 і 30% на рік, тоді як збережені дані зростають на 35-40% на рік, «зокрема через ці темні дані, які залишаються, коли вони не використовуються лише один раз; і які насправді марні, які марні ".
Побічний вплив, але колосальний
Фредерік Бордаж, засновник GreenIT.fr та фахівець у галузі цифрової тверезості, також кваліфікує важливість забруднення, прямого, спричиненого темними даними через центри обробки даних. «6,4 мільйона тонн CO2, як відсоток світового цифрового сліду в 2020 році, становить 0,38% від глобальних викидів парникових газів у 2020 році (що точно відповідає 1,671 мільйона тонн еквівалентів CO2). Це справді смішно ", - зазначає він. Але меншим є непрямий ефект зберігання всіх цих непотрібних або невикористаних даних. "Ми отримуємо неправильний кут. Проблема не в темному зберіганні даних, що є масштабною деталлю глобального цифрового екологічного сліду (1). Справжня проблема з темними даними полягає в наступному: якщо їх буде занадто багато, це може заткнути труби і викликати необхідність обробляти волокнами всю планету, а також розміщувати 5G скрізь ".
Таким чином, цей граничний ефект став би справжньою суттю проблеми. «Оскільки всі ці непотрібні дані, увесь цей жир можуть опосередковано спричинити колосальний вплив на навколишнє середовище, спричиняючи застарілість обладнання, яке було достатнім і працювало дотепер; незалежно від того, чи це сервери, мережа чи користувацькі термінали », - пояснює експерт з екодизайну програмного забезпечення. Якщо все це недостатньо зрозуміло, він веде додому суть: «Що відбувається, це те, що ми зараз переходимо на 5G для марних даних; у всьому світі ми оновлюємо глобальний комп'ютерний парк через жир, який варіюється від потокової передачі в 4K до темних даних, забутих на серверах компаній, а також окремих людей ». 100 ГБ непотрібних (але в Інтернеті) фотографій та відеозаписів на людину представляють, наприклад, 100 ГБ х 4 мільярди користувачів або 400 мільярдів ГБ темних даних. Просто серед пересічних користувачів Інтернету.
У проекті "Зміни" Хьюг Ферребойф також вважає, що проблема темних даних також стосується широкої громадськості. «Дослідження Veritas фокусується на компаніях, які зберігають багато даних через своє програмне забезпечення для управління (з ідеєю, що вони можуть їх використати колись) тощо. Але зберігання невикористаних даних - це також реальність для всіх. Ми всі робимо фотографії за допомогою своїх смартфонів, багато хто з нас використовує автоматичну систему реплікації фотографій у хмарі, а також зберігає сотні чи тисячі фотографій на своїх комп’ютерах та в Інтернеті, на які ми ніколи не дивимось, і які ми, мабуть, ніколи не подивимось ... ”, - зазначає він.
Марі Кондо з хмари
Сумна реальність. У будь-якому випадку для всіх ностальгічних людей, яким подобається, як і мені, можливо, як і вам, час від часу переглядати старі фотографії на екрані свого комп’ютера чи смартфона. І який, погодьмося, зберігає їх як у фізиці, так і в хмарах. Але цифри та дослідження поєднуються і невблаганні. Правда є. Якщо ми дбаємо про навколишнє середовище і про те, що колись передамо своїм дітям, можливо, найкраще перебрати фотографії їхніх дітей. І стати Марі Кондо з хмарних обчислень.
“Темні дані - це загроза, але в тому сенсі, що сьогодні ви не помічаєте, які дані ви зберігаєте чи споживаєте. По суті тому, що рух до хмари відбувається вже десять років, що позбавляє нас голосу повернення: раніше, коли наш жорсткий диск був майже заповнений, повідомлення нас попереджало і замість того, щоб купувати інше, ми зробили сортування даних. У хмарі все робиться, щоб не задавати собі цього питання, і тоді ми тим менш уважні до даних, які ми зберігаємо в Інтернеті », - пояснює Хьюг Ферребойф.
Тому як компанії, так і приватні особи, ми втратили звичку вимірювати вагу наших даних у нашій інфраструктурі чи наших онлайн-сервісах. Хьюг Ферребойф сподівається, що гіганти Інтернету врешті допоможуть нам привести у порядок наші віртуальні справи, нагадуючи нам, що ми повинні це зробити. У 2022 році Інтернет-провайдери та оператори зв'язку будуть змушені підраховувати, що генерує онлайн-діяльність їхніх клієнтів, та інформувати їх про їхній вплив на вуглець. Захід закону про боротьбу з відходами, прийнятий у парламенті 30 січня 2020 року.
Еко-концепція
“Це буде розміщуватися на рахунках людей щомісяця чи два, це буде перший приклад замовлення в цій галузі. Але тим часом, коли Google попереджає вас про те, що ви витратили 50% свого простору в хмарі, це не говорить вам, скільки це представляє в CO2 », - з жалем повідомляє Хьюг Ферребойф. Для дослідника Shift Project інформаційна система про вплив на мережу зберігання даних на навколишнє середовище повинна бути стандартною, "за задумом". В іншому випадку, "це, мабуть, доведеться зробити обов'язковим ... Але таким же чином, як відображення викидів CO2 від транспортних засобів було зрештою обов'язковим для виробників автомобілів".
Veritas, зокрема, працює над рішеннями «картографування даних» для організацій, які вже дають змогу візуалізувати виробництво та потік даних всередині компанії, щоб обмежити їх необхідним. Поступове впровадження GDPR в Європі, що вимагає від компаній видалення даних із клієнтів, які були неактивними протягом 3 років, також може допомогти обмежити інфляцію збережених даних.
Зелене ставлення
Тим часом, що ми можемо зробити, щоб полегшити вагу наших невикористаних даних самостійно, на індивідуальному рівні? По-перше, прийнявши "зелену позицію", яка б хотіла, щоб ми більше не розглядали хмару як нескінченний простір для зберігання та зберігання, а максимально обмежили її використання. "Ми повинні задати собі питання. Табу-питання, незалежно від того, перебуваєте ви у компанії чи вдома: для чого будуть використовуватися мої дані, чи буду я їх насправді використовувати, чи справді їх потрібно зберігати? ", зазначає Фредерік Бордаж.
Отже, ми повинні взяти на себе свої обов'язки. Перш за все, сортуючи наші електронні листи та фото/відео, що зберігаються в Інтернеті. Наприклад, такі інструменти, як Cleanfox, дозволяють автоматично скасувати підписку на численні інформаційні бюлетені та спам-листи, які захаращують наші поштові скриньки, витрачаючи на це енергію та збільшуючи виробництво вуглекислого газу. Як Адеме влучно підсумовує це у своєму практичному посібнику “цифрове приховане обличчя”, щоб зменшити вплив цифрового на навколишнє середовище, вам доступні дві дуже прості дії. “Зберігайте лише те, що вам корисно, будь то в Інтернеті чи на своїх пристроях. Нарешті, зберігайте та використовуйте якомога більше даних локально ».
Назустріч цифровій тверезості
«Ми повинні прагнути до цифрової тверезості: регулярно чистити великі файли; відео, фотографії, важкі інсталяційні файли ... Це також запобіжить необхідності купувати 2-й зовнішній жорсткий диск або більше простору для зберігання в Інтернеті », - підсумовує Фредерік Бордаж Ідея полягає, зокрема, в тому, щоб видалити фотографії, зроблені в двох примірниках або в трьох примірниках, і погодитися зберегти лише одну; щоб знову відкрити здоровий глузд економного та тверезого використання, який ми мали в часи, коли ми робили срібні фотографії, які вимагали від нас обережності. Що стосується компаній (у тому числі тих, що виробляють об’єднані об’єкти), завтра все буде питання екологічного дизайну їхніх цифрових послуг. Не генеруйте занадто багато даних, щоб не довелося їх видаляти.
(1) Проект Shift підраховує, що енергетичний слід цифрової галузі в цілому збільшується на 10% на рік. У своєму звіті під назвою "за цифрову тверезість" французька неурядова організація пояснює, що частка цифрових технологій у викидах парникових газів зросла вдвічі з 2013 року - з 2,5% до 3,7% загальних глобальних викидів, і що "цифрові викиди CO2 мають збільшився одночасно приблизно на 450 мільйонів тонн в країнах ОЕСР, глобальні викиди яких одночасно зменшились на 250 мільйонів тонн ”. Таким чином, хоча енергоємність (відношення споживання енергії до ВВП) економіки загалом має тенденцію до покращення, а цифрова погіршується - у цілому у світі вона падає на 2% на рік, але в цифровий, він збільшується на 4% на рік.