Дедуплікація - це дієта для зберігання ресурсів
- Слідуй за нами
- Інформаційний бюлетень
- кремній додаток
- Сін
- RSS-канали
- Кіоск Google Play
- Інформаційні бюлетені
- Увійдіть
Стара історія каже: Замість того, щоб скаржитися на зростаючий обсяг даних, було б непогано, якби їх можна було звести до найнеобхіднішого. Дедуплікація може це зробити.

Це як дієта. Фунти повинні знизитися, маса повинна піти. Успішна дієта для схуднення характеризується додаванням важливих і зайвих компонентів в раціон. Те, що потрібно організму, воно отримує, але не більше того. Тільки так можна схуднути, а результат - менша повнота. У центрі обробки даних це в основному нічим не відрізняється. Вибухонебезпечна маса даних з різних джерел призводить до розбухання місця зберігання. Щодня додається нова їжа у вигляді шматочків і байтів. У часи менших бюджетів адміністратор повинен спочатку думати не про більші потужності, а про більш ефективні методи зберігання.
Великий обсяг інформації також підкреслює резервне копіювання. Часові рамки для щоденного або навіть щогодинного резервного копіювання даних невеликі, і все більше і більше інформації слід переносити в безпечні зони. З цим навряд чи можна помиритися. На наступному кроці адміністратор також запам'ятовує архів, який невблаганно роздувається і може також використати зменшення потоку даних.
Тож те, що має статися, в кінцевому рахунку дуже просто - теоретично: якщо обсяг даних у виробництві не може бути зменшений, принаймні кількість резервних копій та архівів має зменшитися. Як користувачів, так і додатки можуть змусити видавати менше даних. Не потрібно далі говорити про це, це не працює, тим більше, що компанії все частіше обробляють бізнес-процеси в цифровій формі з міркувань ефективності. Деякий час, і зовсім недавно, коли компанія EMC придбала спеціаліста «Dedupe» Avamar, один із методів принаймні забезпечував розслаблення: дедуплікація.
Надлишкові дані потрапляють через тріщини
Простіше кажучи, дедуплікація - це технологія, яка ніколи не зберігає дані двічі. Метод порівнює набір даних, файли або блоки даних, які потрібно зберегти, з інформацією, яка вже зберігається. Якщо виявлено надлишкові файли або блоки даних, рішення Dedupe забезпечує щойно отриманий запис даних з так званими контрольними вказівниками в точці дублювання. Вони посилаються на вже збережену послідовність і займають менше місця, ніж вихідні дані. Тому щойно доданий запис даних менший, оскільки знову потрібно зберігати менше інформації.
Приклад: Без дедуплікації наступну пісню потрібно було б зберігати знову і знову для кожного вірша:
На стіні, на сторожі, сидить маленький жучок.
Погляньте на помилку, як помилка може танцювати.
На стіні, на сторожі, сидить маленький жучок.
Як відомо, співак залишає з кожним куплетом лист зі слів «Wanze» і, Tanz «, так Wanz», Wan «, танець», «tan» тощо. При дедуплікації основна частина пісні вже зберігається, додаються лише нові, змінені терміни. Якщо програма або користувач вимагає певного набору даних, його спочатку знову складає відповідне програмне забезпечення та доставляє як повний набір.
Це звучить трохи як стиснення даних. Порівняння дозволяється, але методи стиснення не можуть конкурувати з дедуплікацією. У більшості випадків коефіцієнт стиснення становить 2: 1, що означає, що базу даних можна зменшити приблизно вдвічі. Adic - виробник, який перейшов у власність Quantum - каже, що при дедуплікації доступне до 40 разів більше місця для резервного копіювання диска. «Раніше на диску можна було зберігати лише дані за кілька днів. Зараз на це поміщаються місяці », - сказав Стів Маккі, директор з маркетингу продуктів EMEA в Quantum під час презентації асортименту Dedupe Dxi. Авамар навіть говорить про зменшення співвідношення 300: 1. За словами виробника, розрахунок базується на обсязі даних, що зберігається щодня як "повне резервне копіювання".
Виведення у джерела або в пункт призначення?
Кілька виробників, кілька підходів. Одного разу думки не розходяться щодо того, що таке дедуплікація. Однак там, де повинен відбуватися процес, виробники різних підходів мають свої аргументи, які потрібно цементувати.