科技日报讯 (记者张佳欣)在生物学研究中,人工智能(AI)可以筛选数十万个基因组数据点,识别出潜在治疗靶点。但科学家仍不确定AI模型是如何得到这些结果的。据最新一期《自然·机器智能》杂志报道,一种名为SQUID的新系统已经出现,它能“撬开”AI模糊的内部逻辑的“黑匣子”。
SQUID全称是“深度网络替代定量可解释性”,是美国冷泉港实验室(CSHL)科学家创造的一种计算工具,旨在帮助解释AI模型如何分析基因组。与其他分析工具相比,SQUID减少了背景噪音,可以更准确地预测基因突变的影响。
研究人员解释说,SQUID能发挥作用的关键原因在于“训练”。此次科学家对SQUID所做的训练,是利用数十年的定量遗传学知识来帮助人们理解这些深度神经网络正在学习什么。
SQUID的原理是首先生成一个包含10万多个变异DNA序列的数据库,然后用一个名为MAVE-NN(变异效应神经网络多重分析)的程序来分析库中的突变及其影响。该工具让科学家能同时进行数千个虚拟实验,最终“钓出”预测最准确的AI算法。尽管计算机虚拟实验无法替代真实的实验室操作,但它们可以提供非常丰富的信息,帮助科学家理解基因组特定区域如何运作、突变会产生什么影响。
AI领域的模型数量巨大,研究人员希望SQUID能帮助科学家找到最符合他们需求的模型。例如人类基因组研究领域,SQUID可以帮助推动新发现向临床医疗应用的转化。