视觉中国 |
近日,多款在线学习类APP被曝光产品内暗藏大量“黄段子”,“学霸君”“小猿搜题”等热门在线学习软件均牵涉其中。针对这一问题,全国“扫黄打非”办公室已协调相关部门进行深入调查,并且会同宣传、网信、工信、公安、文化、工商、新闻出版广电等部门,在全国范围内开展互联网低俗色情信息专项整治行动。
近两年来,直播平台、资源共享下载平台、各类APP,以及各种图片、视频社交网站迅速发展,但是鱼龙混杂、良莠不齐,面对互联网上充斥的不健康信息,我们该怎么办?
涉黄与净化上演猫鼠游戏 人工审核“力不从心”
相信很多人还对“快播被禁”事件记忆犹新。2014年4月中旬快播科技对外宣布,快播会关闭qvod服务器,停止基于快播技术的视频点播和下载,清理低俗内容与涉盗版内容。
在此之后,国家监管政策密集颁布,一个个涉黄平台被关停。国家对淫秽色情信息的严厉监管,也使得网络行业催生了一个新工种——被网友调侃为“宅男福利职业”的人工鉴黄师。
之所以被看作“福利”,是因为他们不但需要涉猎大量黄色图片、文字、视频等,而且还能挣高额工资。很多人还记得,4年前,某互联网公司曾用20万高薪招聘“首席淫秽色情鉴定官”。
但是,看似“风光”的背后是心理和生理的双重压力。据科技日报记者了解,一个鉴黄师平均一天要看2万张图,同时需要“白加黑、五加二”不间断工作。“图普科技”运营总监、“AI鉴黄师”姜泽荣就吐槽:“说当‘鉴黄师’是件美差的人,都不了解这个职业。”
对众多平台而言,聘请鉴黄师需要巨额投入。阿里安全专家王金廷向科技日报记者表示,一个100人的审核团队,一年花费要在840万元左右。但是即使在年薪20万的诱惑下,每个平台也只有几十或者上百个人的监管队伍。当直播高峰期来临时,成千上万的主播在线,让监管队伍“力不从心”。
AI“清道夫”培训上岗 用三把尺子鉴定影像
在这样的前提下,引入“AI鉴黄师”解放一大部分审核师就显得意义非凡。利用机器替代人工进行基础的审核工作,对于以视频和图片为主的网络平台而言,成为了一种刚需。
王金廷指出,使用“AI鉴黄师”可以减少90%以上人工成本;可实现精准审核过滤,甚至可达到99%以上的准确率;相对于人工鉴黄3小时轮班轮岗的效率,AI可以24小时不间断审核,并且“无工伤、无工资”。
但是“AI鉴黄师”在上岗前还需要通过工程师的“训练”才能开始工作。首先人们会给AI输入海量数据,对它们进行标签化训练,告诉它,ABC这样的情况属于色情,DEF这样的情况属于非色情;然后AI会通过学习,提取ABCDEF的特征来判断G是不是色情。
当然,不同的“AI鉴黄师”工作的技术路线也不尽相同,但“套路”是一致的,一般会通过3方面对实时视频影像进行分析鉴定:是否有人物,如有,色情概率增加;人形轮廓的肤色比例,如果比较大,色情概率增加;姿态分析,如有性行为姿势,则色情概率增加。
在网络净化的道路上,国内多家IT巨头早已开始布局。阿里的绿网、腾讯的万象优图等纷纷下水,创业公司也积极参与净化业务,“八仙过海,各显神通”。
王金廷是负责“阿里绿网”的产品专家。据介绍,基于深度学习技术及阿里巴巴多年的海量数据支撑,“阿里绿网”可提供图片、视频、文字等多媒体的内容风险智能识别服务,在节省90%以上人力成本的同时,该应用支持秒级返回结果,达到99%以上的准确率。
腾讯优图DeepEye智能鉴黄技术,可对目标图片进行系统识别,准确率高达99.9%。它不仅可以用于静态图片的审核,还可以应用到动态的直播业务中,透过对直播流抽帧鉴定处理,让违规“色情主播”秒进“小黑屋”。
机器发力还需人工辅助 AI独立审核任重道远
无疑,人工智能介入内容识别是伟大的进步。但上述机器审核都不能独立进行,还需要人工辅助。
在采访中,关于人工智能何时能独立扛起审核大旗的疑问,科技日报记者从众多专家那里得到的比较一致的看法是,“在现有技术条件下,要实现AI完全替代人工尚需时日”。
人工智能如此发达,为何还替代不了人?王金廷向记者列举了人工智能审核时的3个瓶颈。“首先AI需要适应不同行业不同用户的审核标准,这中间的差异性会非常大,对于人工智能算法的挑战也很大;其次,针对新出现的变异风险,算法需要有强大的自我学习能力,这也是目前需要解决的问题;最后,要真正实现无人化,人工智能需要达到在没有人的参与下训练。”
此外,现阶段,人工智能还远未模拟出用户的真实体验,涉黄与否,很难作出准确的“人的判断”。以Google为例,有超过一万名员工充当着搜索结果评估者的角色。这或许也说明了人工智能“上位”还需加把劲。究其原因,机器检测到含有敏感词汇的文字内容,会将其删除或向用户发出警告。但对于图片、视频的审核,机器无法像对文字内容一样提取关键词,审核难度较大。
“人工智能虽然取得了很大进步,但远未到彻底替代人的时候。”王金廷认为,随着技术的进步,人工智能也许会彻底解放人类。不过到了那一天,人工鉴黄师恐怕就要失业了。