Изследователи от Харвардския университет са успели да закодират информацията от електронна книга с големина 5,27 мегабита в ДНК микрочипове и след това да я разчетат успешно, използвайки познатите ни от генетиката ДНК последователности. Експериментът нагледно показал, че молекулата на ДНК един ден може да бъде използвана за дълготрайно съхраняване на колосални количества дигитална информация.
Джордж Чърч, Срирам Косури и техните колеги от института Wyss по инженерни науки, вдъхновени от биологията, са успели да закодират книгата на Чърч „Регенезис“, съдържаща общо 53 400 думи, 11 снимки в JPG-формат и JavaScript програма. Тази информация е близо хиляда пъти повече от данните, които учени са успявали да запишат в ДНК молекула до момента.
От часовете по биология в училище знаем, че ДНК молекулите съдържат четири нуклеотидни бази – Аденин (А), Гуанин (Г), Цитозин (Ц) и Тимин (Т)*. На теория всеки нуклеотид може да бъде използван за закодиране на поне два бита информация. Това означава, че един ден ще могат да се записват данни с умопомрачителната информационна плътност от 1 милион гигабита на кубичен милиметър. С други думи, цялата дигитална информация, която човечеството създава средно за една година към момента, би могла да се кодира в молекули ДНК с общо тегло от 4 грама!
Освен много по-плътна от всеки дигитален носител, създаден от човека до момента, подобна технология, базирана върху ДНК, би била и много по-стабилна. Поредицата от кодирана информация ще може да бъде съхранена хиляди години след като е била кодирана.
Успехът на учените от Харвард се криел в стратегията за кодиране на информацията в къси последователности на ДНК молекулата, вместо в използваните до момента дълги. Този метод намалил техническите трудности и цената на записването и четенето на данните.
Д-р Косури обяснява, че процесът е аналогичен на записването на данни върху харддиск, където информацията се кодира върху малки блокове, наречени сектори. Учените първо конвертирали книгата, програмата и снимките във формат HTML и след това ги преобразували в поредица от 5,27 млн. нули и единици. Самите битове били подредени в секции от нуклеодити с дължина 96 бита.
В случая учените използвали А и Ц базите за кодиране на нулите, а Г и Т базите – за кодиране на единиците. Всеки блок от ДНК информация съдържал 19-битов адрес, в който се описвало точното му положение в последователността. Отделно били синтезирани множество копия на всеки елемент, които били използвани за корекция на грешки.
След като книгата и останалата информация били закодирани, ДНК молекулите били прикачени към микрочипове за съхранение. Чиповете били пазени при температура от 4°C в продължение на три месеца, след което били извадени, разградени, а вградената в ДНК информация – успешно разкодирана. Допуснатите при разчитането грешки били едва 10 за общия масив от 5,27 мегабита, отчитат авторите на проекта.
За съжаление процедурата, описана в статия на сп. Science, не може да бъде използвана за презаписване на данни, но може да намери приложение в съхраняването на данни за много дълъг период от време.
Основният недостатък на техниката за момента е, че технологията за синтезиране на ДНК молекулите е твърде скъпа, а и самите молекули все още не са достатъчно добре стабилизирани, че да издържат на напора на времето. Когато обаче тези трудности бъдат преодолени, технологията може бързо да измести традиционните CD и DVD-плейъри от различни области на индустрията и ежедневието.
*В молекулите на рибонуклеиновата киселина (РНК) Тиминът е заместен с Урацил (У)