图为脱氧核糖核酸模型 视觉中国供图 |
超越时空
编者按 DNA是生物数据库,它的主要功能是存储包含各种指令的生物信息。但你知道DNA也能够像磁盘、光盘一样存储数据吗?让我们走近大自然最古老、迄今容量最大的存储媒介——DNA,感受其神奇之处。
============================================================
国际调研机构IDC发布的《数据时代2025》预测,全球数据总量将从2018年的33ZB增至2025年的175ZB。未来,如何存储人类活动产生的海量数据是一大难题。
DNA全称为脱氧核糖核酸,是构成生命体的基础单位,包含了生物体的遗传信息。由于DNA的信息密度极高,一小段DNA就能够存储数百万字节的数据,而且DNA的存储寿命非常长,可以达到数百年或更长时间,因此,科学家们不断探索将DNA作为一种信息存储介质的可能性。
非生命信息可存入DNA
众所周知,生命信息是靠DNA存储的。DNA绝对是地球上最古老的信息存储工具。不过,DNA能当作硬盘存储信息吗?非生命的信息可以存入DNA上吗?答案是可以的。
1988年,艺术家乔·戴维斯把一张35像素的照片编辑到大肠杆菌的DNA序列中,这是人类第一次在DNA上写入不属于自然的信息。他管这张图片叫作“小维纳斯”。
这是怎么做到的呢?其实,DNA存储信息和密码编码是一个道理。计算机可以用0和1这两个字符表示所有的信息,我们同样可以用ATCG4种碱基来表示同样的信息。
如果你想存储一张图片,可以先把图片还原成0-1的二进制数据,再把这个数据对应转换成ATCG的序列,然后用DNA合成技术把这段序列合成出来,信息也就被存在这段DNA里。想读取的时候,就对这段DNA做测序。此外,把信息存储到活细胞的DNA里,也是可行的。
2017年7月,《自然》杂志发表了哈佛医学院遗传学系教授乔治·丘奇和同事的研究,他们把一部黑白电影存在了大肠杆菌的DNA上。虽然体内有一段奇怪的DNA,但大肠杆菌正常生存,还可以正常遗传,并且每次繁衍都是一次数据复制。存储在基因组中的电影,在每一代大肠杆菌中都完整无缺地保存下来了。
1千克DNA可存储全球数据
DNA不仅可以存储海量数据,而且读写数据的速度也非常快。同时,由于DNA存储媒介不需要任何能源维持,因此它具有极高的能源效率。
DNA还有着极高的存储密度,其中一个原因是DNA有4种碱基,与计算机系统采用的二进制相比,DNA存储的信息量呈现指数级增长。在一个系统下,1克DNA可存储2.15亿千兆字节的数据,重量不到一块方糖的DNA可存储世界上所有的电影。有研究发现,1千克DNA可存储全球数据。
此外,通过DNA存储信息,也是让信息保存千万年的方法。不久前,天津大学宣布,该校合成生物学团队创新DNA存储算法,将10幅精选敦煌壁画存入DNA中,通过加速老化实验验证,壁画信息在实验室常温下可保存千年,在9.4℃下可保存两万年。该算法支持DNA分子成为世界上最可靠的数据存储介质之一,可以让面临老化、破损危机的人类文化遗产信息保存上千年甚至上万年。
但是,由于DNA的存储和读取过程比较复杂,目前的DNA存储技术还不够成熟。此外,DNA存储需要高昂的成本,并且需要先进的实验设备和技术,因此,该技术并未得到大规模应用。目前的研究过程还减少了活体细胞的使用,这是考虑到细胞会死亡,且在不断分裂复制过程中存在着出错的风险。为了保障数据安全,大多数情况下,存储信息的DNA都以DNA干粉的形式存在。
DNA既是生命的基石,也是信息传递的重要媒介,其巨大的信息存储能力和长期的稳定性,使其成为未来信息存储的极具潜力的领域之一。我们期待着人类在未来开创出更加广阔的DNA信息存储新纪元。
(作者系科幻作家)