ДНК як довговічне та ефективне біологічне сховище цифрових даних 169; Фонд Ассмана

Новини з науки

ДНК як довговічне та ефективне біологічне середовище зберігання цифрових даних [169]

Концепція персоналізованої медицини обіцяє максимально адаптувати рекомендації щодо профілактики та лікування захворювань для кожного пацієнта (1). Щоб це було успішним, спочатку потрібно зібрати, оцінити і, насамперед, зберегти великі обсяги даних.

довговічне

Звичайні носії даних, такі як жорсткі диски, відносно недовговічні. Щоб зберегти ці колекції даних, їх потрібно регулярно копіювати. Двоє вчених з Колумбійського університету та Нью-Йоркського центру геному (NYGC) зараз використовують потенціал ДНК-матеріалу як біологічного сховища цифрової інформації (2). За допомогою алгоритму, призначеного для потокового передавання відео на мобільний телефон, їм вдалося стиснути повну комп'ютерну операційну систему, фільм та інші файли в олігонуклеотидах ДНК і отримати їх цілими.

Наукові деталі

Генетичні носії - майже ідеальне середовище зберігання. ДНК отримує інформацію, надзвичайно стиснуту протягом тисячоліть, і технічно не застаріває.

Професор інформатики Янів Ерліх з Колумбійського інституту даних і його колега Діна Зелінський довели, у співпраці з Нью-Йоркським центром геному, що ДНК придатна для збереження цифрових даних у цілості. Вони відібрали шість репрезентативних файлів для кодування в ДНК; повна комп’ютерна операційна система, французький короткометражний фільм «Прибуття поїзда в Ла Сіота» з 1895 року, подарункова картка Amazon вартістю 50 доларів, комп’ютерний вірус, піонерський значок та публікація 1948 року теоретика інформації Клода Шеннона.

Об’єднані у головний файл, шість носіїв перетворено у короткі рядки двійкового коду, що складаються з одиниць та нулів. Алгоритм корекції Коду фонтану допоміг випадковим чином віднести ці рядки до чотирьох нуклеотидних основ в ДНК: A, G, C та T та видалити комбінації помилок. Отримані крапельки інформації отримали штрих-коди для розшифровки.

Стартап синтезу ДНК, Twist Bioscience із Сан-Франциско, перетворив 72 000 описаних таким чином ланцюгів ДНК у молекули ДНК. І останнє, але не менш важливе: цифрову інформацію можна отримати з цих біомолекул без помилок. Завдяки своїй технології кодування вченим також вдалося продублювати ланцюги ДНК і таким чином створити копії оригінальних файлів без помилок.

Ефективність стиснення також була надзвичайною. У середньому 1,6 біта були упаковані в кожен базовий нуклеотид, щонайменше на 60% більше даних, ніж при звичайних методиках. Для зберігання 215 петабайт (= 1 000 000 000 000 байт) даних потрібен лише один грам матеріалу ДНК. Тому біомолекули вважаються найщільнішим пристроєм зберігання даних, який коли-небудь використовувався. Архівування цифрових даних у біологічному сховищі все ще занадто дороге для використання у великих масштабах. Для виготовлення ниток ДНК пішло 7000 доларів, а для дешифрування - ще 2000 доларів.