データセンターに用いられる大容量データ向けのストレージは、HDDやテープドライブが主流だが、今のペースで人類がデータを生み出していけば、いずれ保存が追いつかなくなると言われており、新たな媒体の開発が求められている。
アイントホーフェン工科大学の研究者によると、データ保存の未来は、自然界が何十億年も用いてきた記憶媒体である、DNAにあるとのことだ。彼らは、ポリメラーゼ連鎖反応(PCR)技術の進歩により、DNAアーカイブストレージがいかに現実に近づいているかを実証している。
DNAは、信じられないほど高密度に情報を詰め込める。1グラムのDNAで215ペタバイト、つまり2億1500万GBものデータを保存できるのだ。つまり、インターネットの全コンテンツが、本棚程度の大きさのDNAで保存できるのだ。最近の研究では、アルファベットスープに新しい文字を追加することで、データ密度を2倍にする方法まで発見されている。
さらに、DNAは非常に長持ちする。現在のハードウェアは数十年で劣化する傾向があるが、DNAは適切な条件下で数百万年保存できる可能性がある。さらに、維持するために必要なエネルギーがはるかに少ないので、巨大なデータセンターが負担している電気代を削減することが出来る。
5年から10年以内に、最初の合成DNAデータセンターが稼動すると予測されている。ここでデータは、ハードディスクにある0と1という従来の形式ではなく、DNAを構成する塩基対の形式となる:ATとCGで表される。
DNA合成によって新しいファイルがエンコードされ、データキャプチャープロセスの形となる。そして、そのカプセルの中にファイルを詰め込んで、大空間のカプセルを組み立てる。ロボットアームがカプセルを取り出し、中身を読み取って、正しい場所に戻すことができる。
DNAは、塩基同士を特定の順序で結合させ、合成されたDNAの鎖を形成することで組み立てられるのだ。
DNAにデータを保存することは、これまでにも実証されている。しかし、これまではDNAをスケールアップして作成することが進展の妨げになっていた。
ここでカギを握るのが、PCR法だ。PCRは、新型コロナウイルス感染症の拡大により、検査で用いられることで一躍有名になった。「分子コピー」とも呼ばれるポリメラーゼ連鎖反応(PCR)は、DNAの小さな断片を「増幅」(コピー)するために用いられる高速かつ安価な技術だ。分子生物学や遺伝学的分析には大量のDNAが必要であるため、単離されたDNAの断片の研究は、PCR増幅なしではほとんど不可能である。
分子生物学における最も重要な科学的進歩のひとつと言われるPCRは、DNAの研究に革命をもたらし、その生みの親であるKary B. Mullisは1993年にノーベル化学賞を受賞している。
PCR法は、目的のDNAコードを持つプライマーを加えることで、必要なDNAの断片の何百万ものコピーを作成する。弱点は、複数のファイルを同時に読み取るために、技術者が同時に作業を行う複数のプライマーペアを必要とすることだ。現在の技術では、コピーの過程で多くのエラーが発生する。
研究者たちは、カプセルを使うことでこれを克服した。これは、タンパク質とポリマーで構成されたマイクロカプセルである。これを作ることで、1つのカプセルに1つのファイルを固定することに成功したのだ。
50℃を超えるとカプセルが密閉され、「Thermo-confined PCR」と呼ばれる新しいプロセスにより、PCRプロセスが各カプセルで別々に行われるようになる。
作成後、温度が下がるとカプセルからコピーが剥がれ、固定されたオリジナルが残るため、オリジナルファイルの品質を劣化させることがない。つまり、読み取るたびに元のファイルの品質が低下することがなく、エラーを大幅に減らすことができるのだ。研究チームによると、このシステムは最大25個のファイルを同時に読み取ることができ、既存の方法では35%だったファイルの損失が、3回の読み取りでわずか0.3%になったという。
研究グループは、データライブラリーを簡単に検索できるようにもした。各ファイルには蛍光ラベルが貼られ、各カプセルにはそれぞれの色が付けられている。そして、デバイスがその色を認識し、それぞれのファイルを分離することができる。
「あとは、DNA合成のコストがさらに下がるのを待つだけです」と、この研究の主執筆者であるTom de Greef氏は述べている。「この技術は、その後、応用の準備が整うでしょう」。
論文
- Nature Nanotechnology: DNA storage in thermoresponsive microcapsules for repeated random multiplexed data access
参考文献
- Eindhoven University of Technology: The future of data storage lies in DNA microcapsules
- via NewAtlas: DNA data storage system uses microcapsules to cut errors and losses
研究の要旨
DNAは、その耐久性と高い情報密度から、アーカイブデータ保存のための魅力的な媒体として登場した。情報へのスケーラブルな並列ランダムアクセスは、あらゆるストレージシステムにとって望ましい特性である。しかし、DNAを用いたストレージシステムにおいては、この性質はまだ強固に確立される必要がある。本論文では、熱固定ポリメラーゼ連鎖反応によって、区画されたDNAファイルへの多重化された繰り返しランダムアクセスを可能にしたことを報告する。この戦略は、ビオチン機能化オリゴヌクレオチドを熱応答性の半透過性マイクロカプセル内に局在させることに基づいている。低温では、マイクロカプセルは酵素、プライマー、増幅産物に対して透過性があり、高温では、膜の崩壊により増幅中の分子のクロストークを防ぐことが出来る。このプラットフォームは、ランダムアクセスを繰り返す場合と比較して、非区画化DNA保存を凌駕し、マルチプレックスポリメラーゼ連鎖反応における増幅バイアスを10倍低減することがデータから示された。また、蛍光ソートを用いて、マイクロカプセルのバーコードによるサンプルプールとデータ検索を実証しました。したがって、熱応答性マイクロカプセル技術は、保存用DNAファイルへの繰り返しランダムアクセスに対して、スケーラブルで配列にとらわれないアプローチを提供するものである。
コメントを残す