Microsoft má syntetickou DNA. Chce do ní ukládat data

Pevné disky jsou levné, ale dlouho nevydrží. Vědci hledají nové způsoby archivace od skla po DNA. Do hry vstupuje Microsoft, který chce data ukládat do „božské kyseliny“.

Jelikož naše společnost generuje stále více a více dat, hledají se i nové a trvanlivější cesty pro jejich archivaci. Leckoho by jistě napadlo, že bychom přeci zdaleka nemuseli archivovat vše, nicméně si představte, co všechno bychom věděli třeba o společnosti našich předků v raném středověku, kdyby již tehdy existovaly moderní způsoby dokumentace a hlavně chuť tato data vytvářet. Je vlastně docela smutné, že i o počátcích přemyslovského státu víme jen z několika málo původních písemných pramenů a celé by to vydalo na pár blogových zápisků průměrného teenagera.

Klepněte pro větší obrázek
Fuldské letopisy – jeden z mála dobových pramenů, které zmiňují raný přemyslovský stát. Pokud nevymyslíme dlouhodobé archivační médium, z naší digitální éry toho může vydržet ještě méně. Foto: Alexandre Dulaunoy, CC-BY-SA

Hlad po technologiích, jejichž úkolem není uchovat digitální informaci pro příštích několik let, než dojde k výměně pevného disku, anebo archivační magnetické pásky, ale pro příští stovky let, tedy roste.

Krystal z planety Krypton

Jedním ze slibných experimentů je třeba vypalování nul a jedniček do speciálního trvanlivého skla, které by měly být teoreticky čitelné i za miliony let – pokud se tedy tou dobou na Zemi či v jejím okolí najde někdo, kdo je ještě dokáže přečíst.

Klepněte pro větší obrázek
Na podobný kus speciálního skla se podle vědců ze Southamptonu vejde 360 TB dat a čistě teoreticky vydrží až 13,8 miliard let

Hlavní kouzlo této skleněné technologie, která tak trochu připomíná fiktivní paměťové krystaly ze série o Supermanovi, však spočívá v tom, že neexistuje jen na papíře a její realizace je relativně snadná. Inženýři ze Southamptonské univerzity k vypalování vrstviček informací do skleněného hranolu totiž používají femtosekundový laser, který se dnes běžně používá třeba při operacích oční rohovky. Setkal se s ním každý, kdo si nechal laserem snížit dioptrie.

DNA jako magnetická páska

Jestli je vypalování dat do skla proveditelná archivační technologie, pak je kódování informací pomocí „božské kyseliny“ DNA naprosté sci-fi. Přestože i toto sci-fi se už v biochemických laboratořích skutečně děje.

A i když se v tomto případě jedná opravdu zatím jen o primární výzkum, který je roky vzdálený od komerčního využití, má o něj zájem i Microsoft, což ledacos signalizuje. A je to právě Microsoft, který si před pár dny koupil kvalitní syntetické DNA.

Klepněte pro větší obrázek
DNA je největší přírodní pevný disk s vlastním kódováním. Grafika: Wikipedie, CC-BY-SA

Na podobné nákupy a akvizice počítačových firem nejsme příliš zvyklí, čili podobné zprávy vzbudí přirozený zájem, v podstatě jde ale o to, že redmondská korporace uzavřela partnerství s biochemickým startupem Twist Bioscience, který se specializuje na vysoce kvalitní syntézu DNA.

Microsoft díky tomu získá obrovský oligonukleotid – syntetickou jednovláknovou molekulu DNA skládající se z deseti milionů nukleotidů, se kterými si nyní budou obě společnosti hrát a pokoušet se ji použít jako záznamové médium, kde však bude nuly a jedničky představovat chemická struktura DNA. A chemické kódování informací umí DNA naprosto skvěle, protože jako obří manuál z Ikei popisuje do nejmenšího mikroskopického detailu téměř vše živé na této planetě.

Miliarda terabajtů informací v jediném gramu

Jak píše Ars Technika, pokud by se čistě teoreticky podařilo využít efektivitu umělého ukládání dat do DNA na sto procent, pouhý gram DNA by představoval zettabajt informací – miliardu terabajtů. Suma sumárum, k uložení všech stávajících unikátních digitálních dat z celého světa počínaje zálohou kompletního internetu a konče soukromým adresářem „mami, toto neotvírej“ na vašem laptopu bychom potřebovali nanejvýše pár dekagramů DNA. Méně než co váží kelímek vlašáku a dva rohlíky k tomu.

A kdybychom teorii proměnili v praxi a efektivita kódování dat do DNA by nám kvůli režijním a opravným algoritmům, které se používají třeba v grafických kódech QR, jenž jsou pak čitelné i po částečném poničení obrázku, klesla třeba na tisícinu, stále bychom dokázali uložit kompletní digitální otisk veškerého lidského díla od hliněných destiček ze starověké Mezopotámie po zálohu PornHubu do hmoty o velikosti jedné přerostlé dýně.

Zatím hlavně slibný experiment

jestli se to jednou podaří, bude v praxi záviset na rychlosti, chybovosti a ceně zápisu a čtení z DNA. I to už dnes částečně umíme. Čtení informací z DNA – tzv. sekvencování – používáme posledních několik desítek let v medicíně, studiu lidského genomu i kriminalistice. Tomu odpovídá i rapidní pokles ceny. Zatímco projekt zmíněného studia lidského genomu trval déle než deset let a přišel vědce na tři miliardy dolarů, dnes by stejný proces stál zájemce naprostý zlomek původní ceny. Vždyť z individuální analýzy DNA se stal široce dostupný byznys.

Jenže bude trvat další dlouhé roky, než inženýři z Microsoftu a dalších společností zjistí, jestli lze podobným způsobem přečíst z DNA dostatečně rychle a hlavně levně také MP4 soubor s aktuálním hollywoodským trhákem nebo třeba ISO obraz čerstvého Ubuntu.

Z dnešního úhlu pohledu je něco takového prakticky nemyslitelné, ovšem stejně tak bylo ještě v 90. letech pro všechny z nás téměř nepředstavitelné, že se vlastně docela brzy dočkáme éry, kdy se na maličkou micro SD kartu za pár stovek vejdou desítky GB dat.

Diskuze (1) Další článek: Týden mobilně 331: Sluchátka, která umí vypnout svět

Témata článku: Microsoft, , , , , Korporace, Rohlík, Komerční využití, Dokumentace, Redmond, Mic, Přemysl, Pouhý gram, BIOS, Data, Stejný proces, Moderní způsob, Micro, Sto let, CC BY-SA, Podobný způsob, Dlouhé roky, Pokles ceny, Medicine, Vypalování