![]() |
| AI制图 |
一颗救命新药从实验室到药架,平均需要十年时间和数十亿元的投入。如今,这个漫长旅程的第一站——从海量化合物中找出有潜力的候选分子,中国科学家只用了几十秒。
5月30日,国家超级计算天津中心与清华大学团队联合发布了面向超大规模药物发现的人工智能虚拟筛选平台——GalaxyVS。依托新一代天河超级计算机,平台能在几十秒内从近千亿级的化合物库中完成筛选,有望彻底打破人类新药研发速度门槛。
换个思路,告别“翻书筛选”
药物研发的第一步,是找到能跟人体内某个致病蛋白“对上眼”的小分子。传统做法叫“分子对接”——把候选分子一个个放到蛋白上试,看谁结合得好。这种方法精度不错,但面对如今千亿级别的可合成化合物库,就像在图书馆里逐本翻书找答案:一轮筛选下来,动辄数月甚至数年。
GalaxyVS的颠覆性思路,是把“逐一试配”变成“并行检索”。平台以人工智能模型为基础,将蛋白口袋和小分子同时映射到同一个高维向量空间——可以理解为给每个分子和蛋白都生成一个独特的“特征指纹”。这样一来,寻找匹配的分子就变成了在向量空间里快速检索最相似的指纹,传统方法里串行计算的瓶颈被打破。
这套系统跑在天河超算上,依托国产智能计算框架,还突破了超大规模存储的瓶颈。实测结果显示,GalaxyVS的日吞吐量相当于完成约16万亿次传统分子对接——比当前国际最快的超算纪录高出整整一百万倍。
也就是说,过去需要几年才能完成的虚拟筛选,现在几十秒就能出结果。
不仅要快,还要“慧眼识珠”
有人可能会疑惑:速度这么快,筛选的结果会不会“粗制滥造”?
毕竟,超大化学空间里隐藏着一个常见陷阱:快速筛选很容易让结果集中在少数结构相似的分子上,候选库看似庞大,实际差异却很小,药用价值大打折扣。
GalaxyVS专门设计了应对方案。它在检索过程中主动引入“多样性控制”——基于分子指纹对化合物库进行结构聚类,确保筛选出来的分子覆盖不同的骨架类型,避免“近亲繁殖”。同时,系统还搭配了一套高保真的亲和力预测模型进行二次精排:先用超快速度粗筛一遍,再用更高精度的模型对候选分子重新打分排序,让速度和准确性可以兼得。
这意味着,GalaxyVS平台能为肿瘤、神经退行性疾病、新发传染病、罕见病等领域的先导化合物发现提供全新路径,在突发公共卫生事件中还可以大幅缩短药物研发的应急响应窗口。
当然,虚拟筛选只是新药研发的第一关,从候选分子到真正上市,还要闯过毒理测试、动物实验、三期临床试验等重重关卡。GalaxyVS能做的,是让这条赛道的起跑线尽可能前置,并且送上起跑线的选手质量更高。