2015年10月16日 星期五
云端上的模式识别
文·本报记者 滕继濮

    我们正经历PC互联时代向移动互联时代的过渡,这意味着,之前大家最常接触的人机交互的输入方式是点鼠标敲键盘;在移动互联时代,我们面对的则是摄像头、MIC和触摸屏。而在接下来的物联网时代,众多的智能终端上还是会有摄像头、MIC和触摸屏。有趣的是,不论是随手拍张照片,口述段感悟,还是在屏幕上信手划来,这一系列的录入最终都要转化为人类理解的文字,从这个角度来看,识别技术就是伴随着信息在穿越时代了。

    10月13日,汉王科技在“创业圣地”中关村创业大街的发布了“汉王云”。基于其自主领先的识别技术,为企业及个人用户提供云端的识别服务,标志着我国的文字识别技术进入2.0时代,从PC时代进入云计算时代。

    什么样的云时代?

    新近出版的由史蒂夫·洛尔所著的《大数据主义》一书,推崇大数据领域中的两句名言。其中一句是:“无法计量,就无法管理。”这显然是强调了通过数目字进行量化、进而进行专业化管理的重要性。

    汉王科技创始人、常务副总裁徐冬坚表示,在移动互联时代,现代人更多地是利用摄像头、MIC和触摸屏记录信息,而这一系列的录入最终都要转化为人类理解的文字。对于文字识别技术,这是一个很大的考验。

    电脑识别优势很明显,中科院计算所博士张蕊告诉记者,在一些比较大范围的数据级上,比如说几百万的数据级上,机器识别的能力已经超过了人脑识别,只是一些相对需要专家经验的特定领域,比如说人类学、动物学等,机器目前尚不占优势。

    我们有理由相信,对于大数据中有效信息的提取与整理,对图片或视频中文字或公式的识别是非常重要的一环。

    为什么要有云?

    此次汉王一直在传达一种认识:我们正经历了一种变革,进入了一个新的时代,文字识别的2.0时代。在汉王云总经理虞文明的解读里,这个时代是识别技术的引进,“原来的识别技术是在嵌入式设备上存在和发展的,现在互联网的存在已经将这些识别技术进行提升,可以进行多台计算机共同的运算,云计算和互联网让识别技术达到质的变化。”

    为什么要有云?张蕊解释说,我们都在说大数据,互联网上的数据最多,当我们把设备或者研究的这些东西接入互联网之后,用户提供了很多的数据,有了数据之后不管做什么任务,其实都是可以是“水到渠成”。另外一方面,用户在使用的时候可以提供很多的需求,这些需求研究人员和技术人员未必能想到,这就等于是用户帮我们想将来可以研究什么,也可以说是大家一起来扩大市场的规模或研究的范畴。上了云端,可以更大的拓宽各个领域的发展范围,可以更好地来帮助各个行业的发展。

    虞文明表示,大数据对算法改进有非常大的帮助,过去每一个算法的提升都是以购买或者人工采集大量样本为前提的,这是很大一笔费用,并且人工采集很多时候会打上被采访者的习惯,很多时候不如互联网的数据更完美,这个角度来说对技术的提升更加有意义的。

    模式识别技术+互联网技术+云计算技术

    汉王在手写识别、光学字符识别(OCR)、笔迹输入等领域拥有多项具有自主知识产权的核心技术。虞文明说,“OCR技术里面我们就有80多项核心技术,而且这是一整套OCR处理的技术,每一项都是我们的自主创新。”

    去年,汉王科技将孵化3年的移动互联业务植入其体系内,汉王云正是模式识别技术与互联网技术、云计算技术相结合的在线云服务产品。

    据介绍,汉王云主要服务模式分成识别云和设备云。其中,识别云由私有云和公有云两个大部分组成,并都拥有并运用了汉王的OCR云识别(文本云识别、名片云识别、票据云识别、身份证云识别)、人脸云识别(人脸特征云识别、表情云识别、年龄云识别)、手写云识别(多语种手写轨迹云识别、图形云识别、公式云识别)、语音云识别(中文语音云识别、英文语音云识别、语音翻译云识别)四大识别技术。

    “设备云相当于是toC的产品,识别云是toB的业务,API经济是大行其道,支付宝、高端地图,还有包括Face专家,他们都提供了大量的API,汉王云也采用这种方式为广大开发者,广大企业提供API。”

    API Cloud创始人刘鑫对此评价道:“以前汉王的识别技术太高大上了,只有四大银行、大央企用得起,汉王云的出现让更多的草根创业者都能用上高大上的汉王识别了。”

    业务模式的创新

    徐冬坚表示,“在移动互联网时代来临的大潮里,我们希望将自己这方面的积累释放出来,为广大开发者提供开放接口,让模式识别更简单。”

    据了解,识别云中的公有云是通过“汉王开发者中心”来对广大中小微企业和个人开发者提供API接入的。开发者中心用户可以很方便的将汉王的核心识别技术嵌入到自己开发的应用程序中。针对每种识别API汉王都提供了免费额度,同时提供了多种授权方式。每名注册用户只需创建一个应用,然后再根据此应用申请多个授权。公有云就可为每个客户提供数据隔离、访问与安全性的服务。知名职场人脉类应用脉脉等,就是汉王公有云的用户。

    识别云中的私有云主要是针对大企业级用户,为企业提供安全的私有定制化服务,在企业内部的网络环境中部署专属的、高性能、高识别率的多种模式识别服务功能。汉王私有云还可以提供基于这些服务的整体应用方案,让用户的业务系统整合私有识别网络服务,提供工作效率和安全防护。教育行业领先厂商学而思等,就是汉王私有云的用户。

    此次汉王云的亮相是汉王面向移动互联市场的有益探索。汉王成熟的识别模式可以与移动应用开发者们实现在线共享和共赢;同时,原有的线下嵌入式的技术授权开始向线上定制式的技术开发转变,这是汉王业务模式的创新。

京ICP备06005116