媒体报道,随着毕业季来临,学位论文“查重”的生意火爆起来,电商平台上“查重”价格一夜涨了近百元。而学校严把“重复率”之下,付费“降重”服务也随之滋生,据说花千把块钱就可以把论文重复率从20%降到0.2%。这样,一篇不符合学校要求的文章被打扮成了“原创性”颇高的佳作。而且,这几乎已成了一个“产业”。这些现象令人忧心。一篇论文通过重复率检测就算完成任务,已是一种60分万岁的不良心态,而用所谓技术手段降低重复率,更属投机取巧的行为。
创新是科研的生命,原创性是衡量一篇论文的重要指标。正是出于对原创性的重视,对学位论文进行“查重”不仅是当前大部分高校保证论文原创性的“标配”,而且被很多学术刊物用为评判来稿是否可用的方法之一。确实,在专业越来越细分的今天,每个学者阅读的文献越来越有限,评审者的眼力总会存在盲区。用技术手段检测论文原创性不但必要、而且高效,为衡量论文的学术水准提供了有效参考。
但是,过于依赖“查重”的弊病也是显而易见的。论文的品质本质上不是由重复率多少决定的。“重复率”与“原创性”也非简单的对应关系。现有的论文检测系统的原理基本相同,都是将论文切块分解后,与资源库中的内容进行匹配度检测,所谓“重复率”是以文字相同多寡为基础的。但是,在绝大部分论文中,同样数量的文字对学术创新的价值是不同的。比如200个字的一段话,可能是这篇文章中最精华的观点,也可能只是一段用作例证或驳斥的引文。目前的检测系统对此无法作出准确区分,更不可能进行智能化的加权处理。有的论文致力于考证重要事件的年代或重要文献的作者,必须在大量引用原始文献或前人观点的基础上,通过仔细辨析才能得到正确的结论,最终的结论可能只是寥寥数字,但在学术史上却具有突破性意义,如果把这样的论文交给“查重”系统评判,十有八九会因为“高重复率”而被误杀。相反,有的文章看似通篇“新话”,实际上可能既缺乏对本论题学术史的必要回顾,也没有和相关研究成果的合理勾连,这样的文章纵然被检测系统“绿灯”放行,对推动学术进步又有什么用处呢?
更重要的是,过于依赖“查重”的心态导致了“降重”攻略大行其道。而那些“降重”的妙计,不外乎替换同义词,更改语序,把直接引文变为间接引语,绕着弯儿说话等文字戏法,只能造成一种虚假的“原创性”,并不能真的提升论文的品质。就像用白纸糊住了墙上的破洞,表面光鲜,实则不堪一击而且掩盖了内在的问题。
当然,随着文献检测系统数据库容量的扩大、智能化程度的提升,这些问题或许能得到改善。但只要人类还是学术研究的主体,检测系统只能提供论文进入评估程序的入场券,最终的判定应由同行专家的审读来做出。因此,我们也应该正确看待论文“查重”及其结果,在改进检测系统的同时,调整过于依赖“查重”的心态,才能推动学术探索向更深邃、更高远处迈进。