文·本报记者 王 怡
■将新闻进行到底
调查显示,我国每年有1亿多名学生学外语,全世界每年有数以亿计的外国人学汉语,在大数据时代,计算机技术是否也能帮助人们学习多种语言?
用大数据来辅助英语写作
大数据是时下最流行的IT词汇,洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生。谷歌流感趋势(Google Flu Trends)利用搜索关键词预测禽流感的散布。统计学家内特·西尔弗利用大数据预测2012美国选举结果。麻省理工学院利用手机定位数据和交通数据建立城市规划……
大数据改变着社会,也改变着教育形式。只需轻松输入一行网址,点动鼠标上传写好的英语作文,系统不但可以给您的作文自动打分,而且还可以提供作文的整体评语,以及“按句点评”等重要的反馈信息……
这并不是传统的英语教学课堂,而是一款基于云计算的英语作文自动批改在线服务,通过计算学生作文和标准语料库之间的距离,即时生成学生作文的得分和语言及内容分析结果。具有“自学习、自完善”能力的“英语作文智能批改网”(以下简称批改网),体现了人工智能技术的较好应用。批改网自2011年6月上线后,吸引了包括清华大学、北京大学、复旦大学等1000多所内地和港澳台高校使用,批改作文近3000万篇次。
长期从事高校英语教学的老师介绍,近年来,我国大学生在英语听说能力方面提高进步明显,但写作能力的培养却被边缘化,各类英语考试中写作得分徘徊不前。这与长期以来我国大学英语教学的侧重点有一定关系。
师生比例严重失衡,是现实原因。一名大学公共英语教师,往往要负责几个院系的英语教学,在听力、口语、阅读、写作的教学中,写作教学互动耗时耗力,事倍功半,这客观上也导致了学生英语写训练严重不足,自然写作能力提升缓慢。
批改网提供英语作文批改服务,面向大学老师以及学生(目前也面向高中生),通过训练打分引擎,使之可以自动按照四六级考试、高考以及中考的作文评分标准,来自动批改学生的作文、给出评分,并在有语法、用词、表达不规范的地方给予反馈提示,给学生修改的建议。
学生和系统进行互动,并根据系统及时批改反馈后自主进行多次修改,有的甚至修改了上百次。同时,老师在机器反馈的基础上再增加人工批改,这种人机互动的写作教学模式,显著提高了学生自主学习能力。在整个教学过程中,系统还能积累个性化教学数据,让教师的科研工作有了强有力的数据支持。
批改网是怎么批改作文的
学生用自己的学号登录到批改网上,将老师布置的作文上传,不需要再等上几个星期,只要等上一个小时就能拿到批改结果,这是从前纸质作业所无法做到的。
针对不同的考试类型,批改网会写出不同的打分公式,每个打分公式有192个独立可测量的参照指标,最终系统会选择十几个和作文分数相关性最高的指标来打分。具体的指标包括了词汇的丰富度、词汇的难度、语法是否有使用错误的地方等等。
当理论上的打分公式建构完成之后,批改网会选择足够大的用户样本来训练打分引擎,比如选择某次考试中2000个学生的作文,计算这两千篇作文机改和老师批改结果的相似度有多高,如果差别在上下一分的区间之内,则认为机改的结果是有效的。其实这个原理和ETS的e-rater系统、McGraw-Hill的Writing Roadmap系统原理相似,不过批改网在打分之外,也同时注重评分之后的反馈,通过指出具体错误让学生可以不断对自己的作文进行修改。
根据批改网的统计数据,大学生在批改网上修改作文的平均次数是3.6次。一位北京邮电大学的学生,花了4天时间,把自己的作文整整修改了162次,从第一版的42.5分,一直提高到最后的87分,批改网完整地记录了每一次修改过程。
类似于闯关游戏一般的英文写作批改,对学生而言是自我英语写作水平的提升。目前,批改网在各大高校的布局是以班级为单位,除了给出分数之外,还能显示作文分数的班级排名。无形中给了学生提升英文写作的动力。
无论是口语、听力、阅读、写作,英文水平的提高都是靠练习得来。口语可以靠与他人对话练习,听力可依靠听英文广播来“磨耳朵”,阅读可以看英文原著来提升。只有写作,虽可以笔耕不辍的写,但终究需要有人告诉你,你的词汇是否正确,用词是否得当,句式是否准确……网络在线的批改方式解决了这一难题。
批改网用大数据技术对用户提交的英语文章作分析智能分析,几秒钟给出分数和详细点评,让用户在改正错误的过程中加强知识点记忆,并能申请老师在线指导。
清华大学的孙茂松教授就曾充分肯定语言与计算机结合的协同创新。他认为,语言是千变万化的,语言教学过程互动性极强。使用基于大数据的语言智能技术,一方面为语言研究、语言教学研究提供新的研究视角和研究工具;另一方面可以有效提升语言教学的互动性,从而增加语言教学的效率和效果。
成立写作联盟搭建共享机制
语言智能与技术应用协同创新中心在北京成立之后,为了拓展协同途径,创新协同平台,2013年11月30日,“中国高校英语写作教学协同创新联盟”(以下简称“写作联盟”)在南京大学成立。清华大学、北京大学、南京大学、复旦大学、中山大学等52所高校纷纷加入,共同搭建全国英语写作教学研究的协同共享机制。
写作联盟的使命是以协同创新开展英语写作教学、测评与研究为突破口,深化中国高校英语教学改革,提升中国高校英语教学、测评与研究的国际竞争力,提升中国学生以写作为核心的综合英语水平的国际竞争力。
首都师范大学副校长周建设表示,创建中国高校英语写作教学协同创新联盟,大家的目标就是围绕中国人学外语、外国人学汉语这两个重大公益性问题和国家文化战略问题,研究具有国际前沿水平的语言智能产品,为人才培养和文化交流提供优质服务。
以写作联盟为依托,语言智能与技术应用协同创新中心设在首都师范大学,协同单位有清华大学智能技术与系统国家重点实验室、北京大学计算语言学研究所等十多家国内外一流的研究机构,致力于开展语言理解、生成和评级的智能化研究及产品转化,破解外语教学和汉语国际推广中的瓶颈性问题。来自中科院计算技术研究所、北京大学、清华大学、中国人民大学、上海交通大学、南京大学、北京邮电大学、武汉大学、中山大学、北京语言大学等单位的技术、语言方面的顶级专家加盟这个团队。
据周校长介绍,语言智能与技术应用协同创新中心在基础理论研究、应用、产品三方面进行攻关,目前启动和运行的项目有英语作文批改系统、语言智能图书馆、语言智能写作实验室。
“未来,写作联盟将会同各高校英语教师,依据一个设定的英语作文题目,让学生写作提交到批改网,对大学英语写作现状进行一次全面的摸底,并通过教师批改和计算机批改进行多维度英语教学评估,同时也丰富批改网作文批改的数据。” 他告诉记者说。