科技日报北京11月4日电 (记者陈丹)美国非盈利机构艾伦人工智能研究所(AI2)2日发布了一款新的免费学术搜索引擎——语义学者(Semantic Scholar),它能够帮助科学家理解论文的内容。虽然目前仅限于搜索计算机科学领域的大约300万篇开放获取论文,但研究团队计划在一年之内将其搜索范围扩大到医学等其他领域。
据《自然》网站2日报道,语义学者提供了一些创新的功能,包括从文本中挑选出最重要的关键词和短语,而不依赖于作者或出版商的键入。AI2首席执行官奥伦·埃齐奥尼说,一个系统要做到这一点是相当困难的。该搜索引擎使用类似“机读”的技术来确定哪些文章是与某个主题相关的概述。
该系统还可以找出论文所引用的真正具有影响力的参考文献。同样在开发搜索引擎的专家系统软件公司研发部负责人何塞·曼纽尔·戈麦斯-佩雷斯认为,这是一个非常好的功能。此外,语义学者还会将论文中的数据呈现在搜索结果中。
目前可供使用的免费学术检索平台中,谷歌学术搜索的规模最大,涵盖了大约1亿份文档。但夏威夷大学马诺阿分校研究搜索引擎的信息科学家彼得·贾科索表示,其中有很大一部分文档在任何人看来都是非学术性的,甚至还出现了很多可笑的错误。戈麦斯-佩雷斯也说,谷歌的搜索引擎在理解文章内容方面,还有很大的进步空间。
而另一个免费平台微软学术搜索,虽有超过3000万份文档的“库存”,但早已停止更新,其数据正被整合到必应(Bing)搜索引擎中。还有一个由多名学者创建的CiteSeer搜索引擎,拥有530万条记录,其负责人、宾夕法尼亚州立大学的李·贾尔斯正与语义学者开展合作。
不过贾科索说,语义学者也有不足之处,包括很多时候不能筛选出版物的标题。埃齐奥尼说,语义学者能检索到约80%的免费获取论文,但与谷歌学术搜索相比,无法越过“付费墙”则是它的一个短板。