Ученые из Гарварда записали 70 миллиардов книг на ДНК




Революционный носитель информации позволяет хранить миллион гигабит в одном кубическом миллиметре материала

10:00 23.08.2012   |   1752 |  Лукас Мериан |  Computerworld, США

Рубрика Технологии



Ученые из Института бионики Уисса Гарвардского университета применили технологию создания цепочек ДНК для записи 70 млрд копий не опубликованной пока книги в двоичном коде ДНК.

Процесс записи данных на препарат ДНКтребует продолжительного времени, поэтому, по мнению ученых, такой носитель сейчас пригоден только для создания архивов данных
Процесс записи данных на препарат ДНКтребует продолжительного времени, поэтому, по мнению ученых, такой носитель сейчас пригоден только для создания архивов данных

Ученые из Института бионики Уисса Гарвардского университета применили технологию создания цепочек ДНК для записи 70 млрд копий не опубликованной пока книги в двоичном коде ДНК.

Статья об этом была опубликована недавно в рецензируемом экспертами журнале Science.

«Всю информацию, так или иначе накопленную в мире до этого момента, можно записать на ДНК-носителе весом около 4 грамм», — заявил Шрирам Косури, старший исследователь института.

Ученые создали двоичный код, применяя ДНК-маркеры, и с его помощью записали текст книги Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves in DNA («Регенезис: синтетическая биология как способ заново открыть природу и нас самих через ДНК»). Книгу написал один из участников исследования Джордж Черч.

«Мы хотели, чтобы тестовая информация имела актуальный вид, поэтому использовали версию текста книги в формате HTML, — отметил Черч. — HTML, который, немного упрощая, можно назвать веб-форматом, предполагает использование цифровых изображений и Java-скриптов, что придает ему интерактивность. Полученный набор данных был закодирован в двоичном исчислении и записан с помощью ДНК».

Черч занимает должность профессора генетики в Гарвардском медицинском колледже. Он участвовал в разработке первого прямого метода создания цепочек ДНК в 1984 году. Он также входил в число ученых, ставших инициаторами Проекта генома человека. В то время он работал исследователем в компании Biogen.

Исследователи смогли записать 5,5 петабайт, что соответствует миллиону гигабит данных на кубическом миллиметре носителя — препарата ДНК. Процесс записи данных требует продолжительного времени, поэтому, по мнению ученых, такой носитель сейчас пригоден только для создания архивов данных.

«По плотности записи информации и возможным объемам хранения наш метод превосходит все другие экспериментальные методы хранения, основанные на тех или иных биологических и физических законах», — отметил Косури.

Ученые уже давно изучали ДНК как многообещающую потенциальную среду хранения данных, размеры элементов которой сравнимы с атомными, которая отличается стабильностью и имеет срок жизни, достигающий тысячи лет. В недавнем эксперименте ученым из Гарварда удалось повысить плотность хранения в 1000 раз по сравнению с показателями, достигавшимися в предшествовавших попытках.

«Большинство методов хранения данных, в которых не используется ДНК, предполагают запись данных на плоский носитель, в то время как ДНК позволяет хранить информацию в объемной среде (лабораторный стакан). Плотность исключительно высока — один бит на нуклеиновое основание, и одно нуклеиновое основание — на кубический нанометр. Объем грамма ДНК не превышает кубического миллиметра, следовательно, достаточно одного грамма, чтобы записать около сикстибайта», — пояснил Черч.

В прошлом году два японских университета сообщили, что использовали искусственную ДНК для записи более 100 бит данных в цепочке генома.

Японским ученым удалось закодировать текст «e= mc2 1905!» (основополагающая формула теории относительности Эйнштейна и год ее создания) в бактерии, которая распространена в обычной почве, — сенной палочке.

Гарвардские исследователи использовали четыре нуклеиновых основания ДНК — аденин (A), цитозин (C), гуанин (G) и тимин (T) в качестве двоичных маркеров. Как пояснил Косури, здесь A и C принимаются за ноль, T и G — за единицу,.

Если для поддержания стабильности некоторых экспериментальных носителей, например, используемых в квантовой голографии, требуются сверхнизкие температуры, приближающиеся к абсолютному нулю (-273 градуса по шкале Цельсия) и огромные энергозатраты, то ДНК стабильна при комнатной температуре. «Такой носитель можно бросить где угодно — в пустыне или в вашем заднем дворе, и найденный через 400 тысяч лет он будет хранить информацию», — отметил Черч.

В отличие от других групп, экспериментировавших с ДНК ранее, специалисты Гарвардского университета готовы использовать коммерческие ДНК-микрочипы для создания автономных ДНК.

«Мы принципиально не пользовались живыми клетками, — подчеркнул Черч. — В живом организме информация составляет крошечный фрагмент целой клетки, то есть большая часть носителя пропадает зря. Но, что более важно, практически сразу же, как только ДНК попадает в клетку, если данная ДНК не имеет возможности обеспечивать свою жизнеспособность и не имеет эволюционных преимуществ, начинается процесс мутации, и, в конечном итоге, она полностью уничтожается».

В более ранних исследованиях эта группа отказалась и от так называемого «разбиения цепочек», предполагавшего разбор цепочек ДНК путем выявления наложений в коротких цепочках.

Вместо этого ученые решили опираться на достижения информационных технологий и закодировали свою книгу 96-битными блоками. С изображениями, книга в формате HTML потребовала 54898 таких блоков, каждый из которых представлял собой уникальную цепочку ДНК.

«Мы хотели показать, что современный мир наполнен нулями и единицами, не только от а до я», — пошутил Косури.


Теги: