2021年12月09日 星期四
将四字校训变成DNA序列进行存储读取
东南大学新研究为解决“数据危机”提供可行性方案
本报记者 金 凤 通讯员 唐 瑭

    当摩尔定律逐渐接近极限时,寻找新的存储介质就显得迫在眉睫。12月5日,记者从东南大学获悉,该校师生将“止于至善”的校训翻译成英文后进行四进制编码,并以DNA(脱氧核糖核酸)分子形式存储在电极表面,再最终读取出来,这引发了未来对高通量自动化DNA存储的无限想象。相关成果近日发表于国际学术期刊《科学·进展》上。

    由于生物技术的进步,特别是高通量DNA测序和合成技术的进步,以前只出现在科幻小说中的DNA数据存储技术正在兴起。DNA是大多数生物的最核心遗传物质,它记录着一个生命所有的遗传密码。在这串密码中,有4种关键的碱基,即脱氧核苷酸A(腺嘌呤脱氧核苷酸)、T(胸腺嘧啶脱氧核苷酸)、C(胞嘧啶脱氧核苷酸)、G(鸟嘌呤脱氧核苷酸)。

    “DNA本来就是活体生物用来存储生物基因数据的,以DNA分子为基础的数据存储系统,近年来被认为是解决未来‘数据危机’的一个可行方案。”论文通讯作者、东南大学生物科学与医学工程学院教授刘宏告诉科技日报记者。

    “目前的信息都存储在芯片等磁性材料上,缺点是存储密度不高,很难突破纳米级别。而DNA的分子尺度在纳米级以下,如果能实现存储,那么存储密度将比现在大1000倍,存储时间长、耗能小。”刘宏介绍,现有DNA存储系统大多基于“编码—合成—储存—测序—解码”的操作流程,需要大型仪器和专业技术人员的参与。

    为了实现DNA存储的微型化、集成化和自动化,刘宏带领团队研发了一种新的技术路径。“通俗地说,DNA的4种碱基A、T、C、G,就相当于二进制的0和1,通过它们的不同组合,就可以编码不同的信息。”刘宏解释,在论文提及的实验中,他们将东南大学“止于至善”的校训翻译成英文“Rest in the highest excellence”,而每个字母都可以进行二进制编码,研究团队把二进制数据转化为四进制数据,存储在电极上合成的一个个DNA分子中。读取信息时,团队通过算法再将四进制数据转化为二进制数据,最终获取结果。

    如何让A、T、C、G按照给定的信息排列组合,从而实现信息的传递?刘宏说,他们通过电化学脱保护技术改进了传统亚磷酰胺化学合成方法,将A、T、C、G放在一种特殊的溶液中,通过其与溶液的化学反应,让它们按照特定规则串联起来,再基于电荷振荡现象对电极表面的DNA分子进行测序,以读取存储在DNA中的信息。

    “这项技术的核心是将信息的读、写集成在一起。由于分子信号很微弱,所以如何在电极上稳定地读取微弱信号,就比较有挑战。”刘宏说。

    目前,这项技术还处于实验室阶段。刘宏坦言,DNA存储想进入商用,还亟须改进溶液的化学合成方法。

    “A、T、C、G产生化学反应要在溶液里完成,这样的条件下进行的化学反应,速度就比较慢,这导致信息转化效率低,即存储时间比较长,如果要商用,还需要解决信息转化效率的问题。”刘宏认为,但这并不影响DNA存储的未来前景,“DNA存储将有望成为下一代信息存储技术。”

京ICP备06005116