Přelom! Američani umí ukládat informace do DNA! Blíží se bio-harddisky?
Připravte se na nové “harddisky”. Vědci uložili “věčnou” digitální informaci do DNA.
Již brzy se v naších počítačích možná dočkáme zcela nového typu ukládání informací. Byť jsme naučení vnímat pojem “DNA” jako identický s pojmem “genetická informace”, ve skutečnosti je deoxyribonukleová kyselina pouze nositelkou genetické informace o živé hmotě. Jinými slovy, zapsat do ní lze cokoliv jiného – třeba informaci digitální. Právě to se nyní v rekordní kvalitě podařilo vědcům z University of Washington ve spolupráci s Microsoftem. Jaké jsou vyhlídky technologie?
Lepší než pevný disk
Nukleová kyselina může na první pohled působit jako křehký konstrukt matky přírody, pravda ale nemůže být vzdálenější. Výdrž makromolekulární struktury je extrémní, jak dokládá i schopnost DNA udržet život na pochodu po miliardy let. Toho samozřejmě živé látky dosahují replikací, vědci však byli s to číst i DNA mamuta, který zemřel před 60 000 lety. Po většinu té doby bylo jeho DNA uložená v suchém, chladném a tmavém prostředí – což je zhruba vše, co DNA potřebuje, aby zachovala informace po extrémní období. Digitální DNA má tak mnohem větší přirozenou výdrž než dnešní zapisování informace na magnetická či optická média.
První nápad tohoto druhu se datuje až do 60. let, kdy s ním poprvé přišel sovětský vědec Michail Neiman. Základní myšlenka je v podstatě prostá. Vychází z faktu, že genetická informace zapsaná v DNA může ve své podstatě mít i binární charakter. Texty, obrázky či dokonce celé počítačové programy mohou být digitálně zapsány pomocí pouhých dvou znaků, které se konvenčně značí 1 a 0. Podobně i genetická informace obsažená v DNA je digitálně zapsána pomocí čtyř znaků, které se konvenčně značí A, C, G a T. Michail Neiman si uvědomil, že teoreticky není obtížné převést dvouznakovou digitální informaci na čtyřznakovou a zapsat ji tak ve formátu DNA. Uvést teorii do praxe je však věc jiná. V Neimanově době totiž byly nezbytné technologie umožňující manipulaci a čtení DNA ještě v plenkách, a lidstvo si tak muselo na další kapitolu ve výzkumu DNA jakožto paměťového média počkat přes půl století. První krůčky byly nesmělé a zvládaly jen permanentní zápis bez možnosti úpravy, v roce 2012 však tým pod vedením George Churche a Sri Kosuriho na Harvardově univerzitě dosáhl průlomu, když do DNA vepsal digitální informaci o 11 obrázcích, JavaScript programu a digitální knihu v HTML.
Namísto zápisu do magnetického formátu pevného disku je digitální informace do DNA syntetizována do binární podoby. Pro přečtení pak stačí DNA sekvencovat, jako se dělá u běžného čtení genetické informace. Právě jak vyšší rychlost počítačů, tak i pokrok v dalších multioborových odvětvích znamenal rychlý pokrok v digitálním zápisu do DNA. I zápis do uměle syntetizovaných molekul DNA má však svá omezení. Například delší řetězce lze realizovat jen do určité délky, Churchův tým se proto bál vysoké ztráty dat, a informace tak zapisoval mnohonásobněkrát, až nakonec dosáhl velikosti zápisu 700 terabitů. To sice není takový problém, protože milimetr DNA je sto pojmout až 5.5 petabitů, tedy veličiny o tři řády na terabitem, přesto šlo o oříšek pro budoucí testy.
Připravte se na čekání
Právě letošní březnový pokus na půdě University of Washington pod vedením Luise Ceze pak vyřešil řadu dalších technických otázek. V první řadě užili bezpečnějšího Huffmanova kódování pro zajištění bezztrátovosti zapsání informace. Zdigitalizovanou informaci poté zapsali do DNA pomocí jejích čtyř základních stavebních jednotek – adeninu (A), guaninu (G), cytosinu (C) a thyminu (T). Navíc mezi samotné informace vložili řadu krátkých sekvencí sloužících jako značky usnadňující orientaci. Jde o obdobu názvů kapitol v knize. Schopnost milionkrát zapsat několik obrázků je sice pěkná, pro orientaci ve skutečné množině různých dat by však šlo o noční můru. Nakonec po zápisu stačí k přečtení přečíst kombinaci sloučenin, užít Hoffmanovo kódování a zkonvertovat informaci do digitální podoby.
Cezův tým takto zapsal a přečetl 4 bezchybné fotografie a poté i video. Tým si je jistý, že postup bude snadno upravitelný pro jakékoliv digitální informace. Nejpodstatnějším přínosem experimentu Luise Ceze je ale především zvýšení orientace a přesnosti v zápisu a čtení informací. Technologie tak postupuje dále vstříc možné komerční aplikaci – nejprve zřejmě pro dlouhodobou zálohu klíčových dat například u časových schránek, poté snad i pro běžného uživatele. “Paměťová karta” pracující na principu DNA by zvládla ukládat klidně 50 petabitů dat. Oproti dnešním gigabitovým kapacitám doslova nadzemskou velikost. Vzhledem k rostoucí potřebně datových uložišť a informací zapsaných do „cloudu“ bude zápis do DNA vítaným uložištěm navíc
Své peněženky však zatím nechejte zastrčené. Dalším oříškem výzkumu digitálního zápisu do DNA totiž bude snaha, jak celý proces urychlit a zlevnit. Momentálně totiž zápis stále vyžaduje hodiny času a poměrně drahé laboratorní vybavení, jehož miniaturizace do kompaktních systémů nebude levná, zpočátku na ni možná dosáhnou právě jenom velkoúložiště. Řešení rychlosti zápisu se pak nabízí třeba i skrze hybridní využití rychlejšího zápisu do dnešních pevných disků (popřípadě jiných budoucích médií), odkud by se informace až postupně ukládala do DNA. Minimálně dekáda, popřípadě dvě, tak zřejmě uplyne do komerčního užití techniky. Nicméně se zdá, že nového prostoru pro naše data bude v budoucnu utěšeně přibývat.
Ladislav Loukota