Вие сте тук

Учени са съхранили филм, компютърна ОС, както и ваучер за подарък от Amazon в една „прашинка” ДНК

Устройството за съхраняване на данни с най-висока компактност, създавано някога.

Credit: Columbia University
Credit: Columbia University

Учените са разработили, по думите им, най-ефикасната техниката за съхранение на данни досега, с нов метод на ДНК-кодиране, доближаваща се до теоретичния максимум за информация, съхранявана чрез нуклеотиди.

Използвайки алгоритъм, наречен DNA Fountain, изследователите сместили шест файла в миниатюрна ДНК-последователност – включително кратък филм, цяла компютърна операционна система, както и ваучер за подарък от Amazon –  но това е само началото. Екипът казва, че същата техника може ефективно да компресира всички данни в света в една единствена стая.
ДНК-съхранението на данни не само пести невероятно пространство; тази техника може да ни даде възможност да съхраняваме знание с изключителна надеждност и дълготрайност – за разлика от традиционната медийна технология, за която е известно, че се поддава на всички видове грешки с времето.

“ДНК няма да се разгради с течение на времето, като аудиокасетите и компактдисковете, и няма да остарее – ако това стане, значи имаме по-големи проблеми”, казва компютърният специалист Янив Ерлих от Колумбийския университет.

Самото ДНК-съхранение не е ново, техниката е въведена през 2012 г. от изследователи в Харвардския университет, които намерили начин как да компресират книга от  53 400 думи в генетичния код на синтетични молекули ДНК и след това да прочетат данните с помощта на ДНК-последователност.

Оттогава различни екипи се опитват да оптимизират техниката, а Microsoft заяви миналата година, че методът, който са измислили, е 20 пъти по-ефективен от предишния рекорд.

На свой ред, Ерлих и колега изследовател Дина Зелински от геномния център в Ню Йорк вече твърдят, че тяхната стратегия за кодиране е 100 пъти по-ефективна от стандарта от 2012 г. и може да записва 215 петабайта данни на един грам ДНК.

За информация, само 1 петабайт е еквивалентен на 13,3 години видео с висока резолюция, така че ако в момента изпитвате пренебрежение към външния твърд диск на компютъра си, няма да ви съдим.

В основата на системата на изследователите е алгоритъм, първоначално предназначен за откриване и коригиране на грешките в приложения за поточно видео.

Според изследователите, същият вид механизъм може да бъде използван, за да се избегнат грешки при четене на двоични данни (съставени от единици и нули), които са били преведени на четирите нуклеотидни бази в ДНК: A, G, С и Т.

“Не всички ДНК молекули са създадени еднакво”, казва Ерлих пред Декстър Джонсън от IEEE Spectrum.

“Ако имате ДНК молекули, които имат по-дълъг участък от един и същ нуклеотид, като ААА, това не е много благоприятно за механизма на информатиката. Много е трудно да се разчете тази молекула без грешка. Така че ще искате да избягвате подобни участъци.”

Алгоритъмът на изследователите успява да избегне грешки при връщане на данните на ДНК чрез допълнително кодиране на серия от съвети за това как трябва да изглежда информацията, след като се декодира.

Това означава, че не само може да пресъздавате всички ДНК фрагменти, които се губят в процеса – това също е и силно оптимизирано.

“Показахме, че можем надеждно да съхраняваме информация на ДНК, както и че организацията ни на информация се доближава до “оптималното пакетиране” – казва Ерлих на Катрин Линдеман от ResearchGate, „което означава, че е почти невъзможно да се побере повече информация на едно и също количество ДНК.”

За да тества системата, екипът компресира шест файла: компютърна операционна система; френски късометражен филм от 1985 г., Arrival of a train at La Ciotat; ваучер за подарък за 50 долара от Amazon; компютърен вирус; плака „Пионер”; и академична статия от информационния теоретик Клод Шанън.

Общият размер на файла на пълния пакет е сравнително малък – едва 2MB, но важното е да се провери дали алгоритъмът DNA Fountain е в състояние да кодира двоична информация в генетични данни, без да загуби част от предоставената информация.

След като цифровите данни – представени в списък от 72 000 ДНК вериги – били конвертирани в ДНК молекули, съхранени във флакон, изследователите успели да секвенират ДНК и да възстановят файловете с нула грешки.

Въпреки че резултатът е впечатляващ, екипът казва, че ще мине известно време, преди разходите за съхраняване и четене на данни в ДНК да станат разумни за останалата част от нас. За своите 2MB информация изследователите похарчили 7000 долара за синтеза на ДНК, и още 2000 за секвенирането.

Ерлих мисли, че може да мине повече от десетилетие преди съхранението на информация върху ДНК да стане достъпно за широката общественост.

И дори тогава, технологията може да бъде използвана за неща като запис на данните на пациентите в медицинските системи, вместо да се продава на потребителите като продукт.

“Това все още са ранните етапи на съхранение на информация върху ДНК. Това е фундаментална наука”, казва Ерлих пред  Ева Боткин-Коаки от The Christian Science Monitor.

“Не е като да идете утре до Best Buy и да си купите ДНК хард диск.”

Резултатите са описани в Science.

 

Превод: Гергана Димитрова

Източник: Science Alert

Коментари

коментара

Related posts

By continuing to use the site, you agree to the use of cookies. more information

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close