Angelika Warmuth dpa/lno Prall gefüllter Speicher: Die Doppelhelix

Geht es um das Wachstum der Menge an digitalen Daten, lassen allein die nackten Zahlen aufhorchen: Wurden im Jahr 2010 weltweit rund zwei Zettabyte (ca. zwei Milliarden Terrabyte) Daten generiert oder repliziert, hatte sich diese Menge bis 2020 schon mehr als verdreißigfacht. Für das Jahr 2027 gehen Schätzungen derzeit von einem Datenberg von 284 Zettabyte aus. Zu den größten Treibern dieser Entwicklung zählen Sensordaten, Streamingplattformen und Videotelefonie. Aber auch das Internet der Dinge (IoT), Überwachungstechnologie, die fortschreitende Digitalisierung der Produktion und weitere Bereiche des kapitalistischen Weltsystems sorgen für dieses ungeheure Datenwachstum.

Dieser enormen Datenproduktion steht eine wesentlich geringere Produktion von Datenspeichern gegenüber. Nur rund 22 Zettabyte an digitalem Speicher dürften im Zeitraum zwischen 2018 und 2025 produziert werden. Allein aus diesen Zahlen wird deutlich, dass ein Großteil der produzierten Daten nicht dauerhaft gesichert werden kann.

Bei vielen Anwendungen ist dies auch völlig egal. Millionen von Streamingkopien eines Films müssen nicht erhalten werden. Auch Aufzeichnungen der Überwachungskamera von der heimischen Katzenklappe sind absolut verzichtbar. Deutlich anders sieht es bei den Bauplänen von Verkehrsflugzeugen oder den Daten der Rentenversicherung aus. Auch Informationen zu »Endlagern«, Messungen zur Ausdehnung des antarktischen Eisschilds oder Sensordaten zu Erdbebenaktivitäten am pazifischen Feuerring sind auch in Jahrzehnten, Jahrhunderten oder Jahrtausenden noch absolut relevant.

Es klingt wie Science-Fiction, aber genau für solche Daten soll zukünftig Desoxyribonukleinsäure (DNA) als Speichermedium genutzt werden. Bereits 2013 berichtete die Zeitschrift Nature, dass es gelungen sei, einen Audiofile der prominenten Rede Martin Luther Kings (»I have a dream«) sowie Shakespeares Sonette in DNA zu speichern. Die DNA, die hierfür Verwendung findet, ist kein aus der Natur stammendes Material. Sie wird mittels biotechnologischer und gentechnischer Verfahren synthetisch im Labor hergestellt. Geht es um die Speicherung von Informationen, verfügt sie über ungeahnte Potentiale: Ein einziger Tropfen synthetischer DNA reicht aus, um eine Million Terrabyte zu speichern.

DNA ist damit im Vergleich zu den bekannten physikalischen Datenträgern wie Festplatten und Magnetbändern nicht nur sehr viel leistungsfähiger, sie verbraucht als »kalter Datenspeicher« der Dateneinspeisung auch keinen weiteren Strom. Eingeschlossen in Glas oder Kunststoff kann DNA im Extremfall mehrere hunderttausend Jahre überdauern, wie die Entschlüsselung des Erbguts von Mammuts oder des Neandertalers eindrucksvoll aufgezeigt hat. Zum Erhalt muss sie nur kühl, trocken und dunkel in einem verschlossenen Behälter gelagert werden.

Ein DNA-Strang setzt sich aus vielen hundert Molekülbausteinen zusammen, die in der charakteristischen Doppelhelix angeordnet sind. Die Organisation und Komplexität aller Lebewesen basiert dabei auf einer Codierung mit vier verschiedenen Basen im DNA-Molekül, den sogenannten Nukleotiden: Adenin (A), Cytosin (C), Guanin (G) und Thymin (T). Diese vier Nukleotiden passen hervorragend zum Binärcode von Daten, der aus Nullen und Einsen besteht und daher nur vier mögliche Paare an aufeinanderfolgenden Zahlen kennt: 00, 11, 01 und 10. Das Wort »Che« etwa entspricht in Binärcode 01000011 01101000 01100101. Um diese elektronischen Daten in chemische Basen zu verwandeln, werden die Paare des Binärcodes mittels Genome Editing in die vier Nukleotide verwandelt und anschließend in Ketten aneinandergereiht: 00 wird zu Adenin, 01 zu Cytosin, 10 zu Guanin und 11 zu Thymin. Unser Beispiel »Che« würde also in die Nukleotidkette CAAT CGGA CGAA »übersetzt«.

Die Produktion der Nukleotide erfolgt etwa durch Aufbringen von Chemikalien auf winzige Chips. Fortschrittlicher und schneller ist die Verwendung von Licht. Mittels dieser neuen Technik lässt sich ein DNA-Chip in ein bis zwei Stunden aufbauen. Da aber die DNA-Ketten nur eine begrenzte maximale Länge haben, müssen die Daten in viele kleine Häppchen zerlegt werden. Ein Megabyte Information muss in viele Millionen Teile gestückelt werden, weshalb der Speicherprozess noch stark fehleranfällig ist. Das Auslesen der Daten ist hingegen weit weniger aufwendig und teuer: Die künstliche DNA wird einfach in handelsübliche Sequenzierautomaten eingespeist, die die Abfolge der Nukleotide auslesen und analysieren.

Konsortien großer Tech- und Biotechnologiekonzerne arbeiten mit Hochdruck daran, dem neuen Speichermedium zum Durchbruch zu verhelfen. Die »DNA Storage Alliance« etwa ist eine der wichtigsten Initiativen in diesem Feld. Federführend beteiligt sind Großkonzerne wie Microsoft, Western Digital, Dell und IBM. Mittels deren Investitionen entwickelt sich die Technologie beständig voran: 2016 gelang es erstmals, 200 Megabyte an Daten in künstlicher DNA zu speichern. 2019 war bereits die Speicherung der gesamten englischsprachigen Wikipedia (16 Terrabyte) möglich. Im Coronajahr 2020 nutzte Netflix die Technologie sogar schon, um die erste Folge der hauseigenen Serie »Biohackers« zu bewerben. Rund 200 Exemplare der Folge ließ man in künstlicher DNA anfertigen, um sie für Promozwecke zu nutzen.

Schreitet die Entwicklung weiterhin so rasant voran, dürften bald noch ganz andere Anwendungen bei stark sinkenden Kosten möglich werden. Die Industrie, Rechenzentren und Archive haben großen Bedarf. Von einer Produktreife für den Massenmarkt ist die Technologie aber derzeit noch weit entfernt. Das »persönliche« Würfelchen mit künstlicher DNA zur Speicherung der wichtigsten eigenen Daten muss also noch ein paar Jahre warten. Und das ist auch ganz gut so.