Великий збій електроенергії British Airways

ZDNet розповів вам тиждень тому про велике затемнення, яке зазнало British Airways під час вихідних на Вознесінні.

електроенергії

Одна з найбільших авіакомпаній у світі в режимі очікування протягом 3 днів

З ранку суботи, 27 травня, комп'ютерна система British Airways зазнала серйозних пошкоджень, що врешті-решт перешкодило її роботі. Відтоді британська авіакомпанія опинилася в тупику, її літаки заземлились, а 75 000 пасажирів опинились у 170 аеропортах світу. Порушення тривало до понеділка, повністю зіпсувавши вихідні пасажирам.

Алекс Круз, генеральний директор British Airways, був негайно допитаний спілкою пілотів у колонах Guardian за те, що він перемістив частину ІТ-служб до Індії, в основному з фінансових причин. Потім він хотів пояснити: " Ми вважаємо, що причиною відключення є проблема живлення, і ми не маємо доказів кібератаки. "

Я визнаю, що це пояснення здалося мені абсолютно неправдоподібним: комп’ютерна система однієї з найбільших авіакомпаній світу була вимкнена через проблему з електропостачанням. Я не повірив і був впевнений, що це пояснення мало на меті приховати ще одну причину ... але, схоже, я помилився.

Субпідрядник відключає електропостачання ... і все зупиняється !

Тепер ми знаємо більше про тонкощі і наслідки цієї промислової аварії. Дійсно, British Airways розкрила причину невдачі британській пресі: за словами компанії, в рамках планового технічного обслуговування в одному з її центрів обробки даних ІТ-субпідрядник ненавмисно мав би " відключіть джерело живлення ". Електричний генератор, про який йде мова, працював бездоганно, але його ненавмисне відключення неінформованим працівником призвело до несподіваного відключення комп'ютерних систем.

І там мої руки падають !

Слабкість в інфраструктурі ?

Справді, я десять років працював у хостингу веб-сайтів та передачі веб-платформ на аутсорсинг. Це було у Jet Multimedia, діяльність BtoB якої згодом була перенесена SFR і існує донині в рамках суб’єкта господарювання SFR.

На той час, на початку 2000-х, ми розміщували веб-сайти з дуже високим трафіком від імені TF1, Міністерства національної освіти, PriceMinister тощо. Наша інфраструктура складалася з центрів обробки даних у паризькому регіоні (Велізі та Курбевуа) та Ліоні. Кожен наш центр обробки даних був обладнаний подвійним електроживленням, забезпеченим окремими лініями EDF. Ці електричні входи були доповнені генераторами: величезними дизельними двигунами, що працюють від тисяч літрів мазуту, які регулярно запускали, щоб гарантувати, що вони зможуть взяти з електромережі в разі поломки.

Архітектура BGP та реплікація даних дозволили центру обробки даних Ліону бути резервною копією паризьких центрів обробки даних: це була умова, що не підлягає обговоренню, нав'язана нашими великими клієнтами, і TF1 хотів прийти і протестувати на місці автоматичне перемикання трафіку датацентр з іншого на випадок відключення електроенергії.

У випадку з British Airways спочатку, безумовно, були людські помилки. Але як це так, що моніторинг інфраструктури не виявив відключення основного джерела живлення для автоматичної активації аварійного електропостачання, яке повинно було негайно взяти на себе? ?

Помилка понад 100 мільйонів фунтів стерлінгів

Британські ЗМІ оцінили вартість відключення в 100 млн. Фунтів стерлінгів, або близько 115 млн. Євро, просто в рамках різних відшкодувань та компенсацій, що виплачуються пасажирам, не кажучи вже про вплив на оборот або втрату ринкової капіталізації компанії, що завдає шкоди її акціонерам. Ми пам’ятаємо, що в серпні 2016 року Delta Airlines також зазнала серйозного відключення, що коштувало близько 150 мільйонів доларів.

Тому можна собі уявити, що ця справа не залишиться без подальших заходів в рамках ISD British Airways: якщо були зроблені надмірні заощадження з точки зору електричного резервування, то, можливо, суму доведеться переглянути в бік збільшення. інфраструктура, щоб запобігти такому збою, якого цілком уникнути, не повториться ...

І якщо ви самі працюєте в ІТ-відділі компанії, ви можете скористатися нещастям, яке зазнало British Airways, і самостійно провести деякі перевірки, які можуть виявитися непотрібними:

  • чи всі ваші центри обробки даних мають подвійне електроживлення ?
  • чи є у них батареї, що гарантують достатню автономність ?
  • - це ваші автоматичні процедури відмови у випадку відключення електроенергії, які регулярно перевіряються ?
  • і перш за все, чи ваші працівники добре навчені керувати цими делікатними ситуаціями ?