2020年11月20日 星期五
每次网络搜索背后 都离不开她的贡献
武夷山
克伦·施拜克·琼斯

科学史话

    克伦·施拜克·琼斯(Karen Spärck Jones)1935年8月26日生于英国哈德斯菲尔德市,一个纺织业较发达的城市。在她小时候,她的父亲在大学里担任化学讲师,晚上还要打工挣钱;母亲是挪威人,曾去伦敦为挪威流亡政府工作。由于父母都顾不上照看她,便将她托付给乡间的一户人家。在这样的生长环境中,琼斯从小便锻炼出了一定的独立性。

    从11岁到18岁这7年间,琼斯就读于一所高水平的文法女校,12岁时,她发愿要上剑桥大学,后终于如愿以偿。

    1956年,她在剑桥大学获得历史学专业的文学学士学位。由于对哲学的兴趣,琼斯又继续读了一年哲学。1957年,她加入了剑桥语言研究所,开始接触计算机在语言研究方面的应用。在此工作期间,她认识了Roger Needham(1935—2003,计算机科学家,英国皇家学会会员),两人于1958年结婚。1964年,她在剑桥大学获得哲学博士学位,但博士论文导师对她的帮助不大,她基本上是独立打拼,编程也是自学的。1968年,琼斯成为剑桥大学计算机实验室的全职工作人员,从此以后她在这里耕耘了近50载,一直从事计算语言学和信息检索研究。

    她在计算语言学和信息检索两个领域都作出了杰出贡献。在信息检索方面,早在1958年,她就与人合著了相关文章。她的最重要贡献当数1972年提出的逆文本频率指数(IDF)的概念。这个概念的意思是:如果词w在一篇文档d中出现的频率高,并且在其他文档中很少出现,则可以认为词w具有很好的区分能力,可以把文章d和其他文章较好地区分开来。IDF是互联网搜索引擎普遍采用的思路。可以说,没有琼斯的早年贡献,就没有谷歌搜索引擎日后的成就。

    在计算语言学方面,她1963年完成的博士论文至今仍有价值。该文将统计进路(或曰机器学习进路)与已有资源(做在穿孔卡片上的叙词表)结合起来,取得了领先于时代的成果。此外,她在计算机自动摘要、结构化数据库的界面、对话、语义学等多个主题上均有所建树。

    除了本人的学术研究外,她还通过学术社团的活动大大推进了本领域的进步。尤其是1994年她担任计算语言学学会(ACL)会长期间。计算语言学学会是国际性的社团,当时多数会员是美国学者,她接手学会时,学会的财务状况不佳,原来的司库又去世了,一时半会儿招聘不到新的司库,在这种情况下,琼斯又要统筹安排学会的学术活动,又要管账,忙得一塌糊涂。那一阵子是ACL苦痛挣扎的过渡期,在她的有力领导下,ACL走出了困境。除了ACL外,她还是另外好几个学会的会士。2000—2002年期间,她担任过英国科学院副院长。在英国有两所科学院:英国皇家学会相当于自然科学领域的科学院,而英国科学院是人文社会科学领域的科学院。由于语言学这个大类属于人文学科,琼斯就凭借其在计算语言学的成就当选为英国科学院的院士。

    琼斯共获得过7个重要奖项,包括2004年获得的“计算语言学学会终生成就奖”和2007年获得的“英国计算机学会勒芙蕾丝奖章”(阿达.勒芙蕾丝是英国大诗人拜伦的女儿,计算机程序的创始人)。

    她2002年办理了退休手续,但继续在实验室工作。直到2007年4月4日去世前不久,实验室里仍有她的身影。

    2001年4月10日,电气电子工程师学会(IEEE)历史研究中心的Janet Abbate女士采访了琼斯。在接受采访时她说:“人人都在谈职业生涯之类的东西。从某种意义上说,我做到了一路向前走,但其实那时并没有明显的路径。你得利用一切存在着的机会。早年的时候,对于女性,即使是在剑桥,工作机会也是极其有限的。看看现在的年轻女性,我是十分羡慕。现在没有多少女性拥有‘我能行’的心态,但她们其实拥有实现‘我能行’的机会,而我们那时根本就没有这样的机会。”

    希望我们中国的职业女性以琼斯为榜样,抓住机会,奋力前行。

    (图片来源:剑桥大学网站) 

京ICP备06005116