DNA可以存储大量信息,并且可以持续数十万年,这是明天技术的理想存储媒介。
人体中的大多数细胞都包含您建立一个存储在DNA中的完整人所需的信息,并且在过去的几十年中,科学家一直在努力工作,以开发新的DNA存储技术,这些储存技术可以利用令人难以置信的DNA密度来存储其他类型的数据。不过,到目前为止,即使现在的成功开始比以往任何时候都更厚,更快,但发展速度也很慢。But now, following on from Columbia University’s announcement that they’d managed to store a whopping 215 petabytes of data on just one gram of DNA, and Microsoft’s announcement that they plan to make DNA storage available via the Microsoft Azure cloud platform in 2020, teams from the University of Washington and Microsoft in the US have passed another major milestone, they’ve managed to create a DNA random access system, or in short, the world’s first基于DNA的文件系统,这是一个巨大的突破。
DNA的编码顺序始终由四个碱基对描述,也就是说,除非您考虑到科学家去年创建的这一新的六个碱基对DNA外星人,而这些是腺嘌呤,胞嘧啶,鸟嘌呤和胸腺氨酸,我们通常认为,在您的细胞中,这些基础在您的细胞中读取了三个碱,并且每次读取了三种含量。将氨基酸放在一起,您会得到蛋白质。要将其他内容存储为DNA,您需要提出一个不同的编码方案,尽管有几种方法可以解决真正的问题,这是您如何按正确顺序阅读和检索数据,以使其有意义。
要阅读您在DNA中编码的数据,您首先需要将其切成较短的序列,因为没有办法阅读完整的单件DNA。结果,这意味着任何未来的DNA存储系统都需要使用标记来告诉系统每个单独的文件序列启动和结束的位置,然后需要能够按正确顺序读取整个序列才能检索您刚刚存储的单个文件。这是两支球队取得的突破。
团队设法添加了对DNA存储的随机访问。研究人员通过设计可以针对特定文件而无需访问不需要文件的新序列标记来做到这一点。
但是,关键是找到足够的标记序列来标记所有文件,好消息是团队确定了数千个将有效的。这意味着您可以放大一个特定的序列,该序列可以标识所需的文件,并且只需序列或简单的英语即可阅读。如果您要保留比标记更多的文件,那么您只需将它们存储在其他单独的DNA池中即可。
在新研究中,对DNA存储的另一个创新的调整是使用称为“轻巧操作”的事物,或者奇怪地在相同基础的长字符串中奇怪地使用XOR。当重复的基础太多时,DNA测序往往会变得凌乱,因此团队使用XOR插入随机序列以分解这些长期运行,并使数据更快地读取。
结果是世界上第一个用于DNA的功能文件系统,这使我们比以往任何时候都更加接近有一天,即使DNA,不是硬盘驱动器或SSD统治存储世界的未来,即使意识到这种特定的愿景仍然存在数十年。
That said though there are still issues to contend with such as storage read write speeds but as DNA storage continues to become an increasingly viable storage medium that could let us store all the world’s information in storage device no bigger than a shoe box, and as people look for new and novel storage solutions, including Atomic scale storage, for the forth coming generation of Quantum computers, and even DNA computers, that can process billions of times more information than their current logical computer counterparts, one thing’s certain – this将是一个非常有趣的观看空间。