2017年04月11日 星期二
第四范式:来,一起玩转人工智能
本报记者 张盖伦
“我们就是想让自家工程师失业。” 第四范式创始人兼CEO戴文渊接受科技日报记者专访时说。他觉得,AI是个好东西,普通人也该能用。第四范式推出人工智能平台“先知”,将关于AI的一切傻瓜化,封装起来,交给用户。

    创业故事

    前段时间,人工智能(AI)企业第四范式在内部玩了一个“全球首个面向非专业人士的机器学习建模大赛”。“非专业”到什么程度呢,连商务、销售这些业务和建模八竿子打不着的团队也加入了。

    他们并没有被“建模”完虐,相反,有超过70%的参赛组合AUC(Area under Curve)数值超过了 0.8。在实际业务中,凡是AUC高于0.8的模型,就已经达到了相当的工业水准,妥妥算是机器学习领域老司机的手笔了。

    “我们就是想让自家工程师失业。” 第四范式创始人兼CEO戴文渊接受科技日报记者专访时说。他觉得,AI是个好东西,普通人也该能用。第四范式推出人工智能平台“先知”,将关于AI的一切傻瓜化,封装起来,交给用户。

    “我不是创业者,只是人工智能从业者”

    知乎上曾有毕业生提问:“XX公司和第四范式,如何选择?”有人回答:凭第四范式的戴文渊和陈雨强,这还用选?

    戴文渊生于1983年,足够年轻,在圈子里已颇有名气。2016年,他因成功将迁移学习技术应用到互联网领域取得突破性成果获得吴文俊人工智能科学技术创新奖一等奖。该奖项历年只授予高校、实验室和科研机构,这次给了企业,还是头一遭。

    戴文渊的履历算得上“纯粹”,他几乎一直在做人工智能。在上海交通大学念书期间,戴文渊就拿到了ACM国际大学生程序设计竞赛世界冠军。因为备赛,他回校选择实验室时,其他方向已被挑走,只剩下冷门的人工智能。“我是‘被迫’进入这个领域的。”戴文渊说。

    十几年前,人工智能还处在蛰伏期。戴文渊一脚踏入了这个乏人问津的圈子。这么多年,他一直思考的问题是,技术有没有价值,如果技术被验证是有价值的,那要怎么把价值放大。“我对自己的定位就是人工智能从业者。”

    戴文渊明白,要顺势而为。

    一开始,“能做的就是把一个不太有用的技术做到相对不太那么没用,那时,他在学术界;到了2008、2009年,互联网企业有了数据积累,戴文渊需要一个有数据的地方让AI技术落地,于是他到了百度。就是在那里,他作为总架构师,搭建了基于人工智能的百度凤巢系统,使其广告变现能力提升8倍。2013年,戴文渊离开百度去往华为,“当你验证了一种技术能给一家公司创造价值后,下一步,就是看它能否给更多公司创造价值”。

    2015年年初,戴文渊离开华为,创立第四范式。选择创业,因为“在这个时间节点,人工智能需要以创业的形式来做。”

    一切显得顺理成章。戴文渊的眼里,有条人工智能发展的时间线。他踩在这条线上。

    “我们公司整个的调调不太一样”

    第四范式见过人工智能“不火”的样子。

    那个时候,他们最大的烦恼在于教育市场和说服客户。当年,团队被问的最多的问题,是人工智能和大数据有没有关系。

    现在,市场热了,热得发烫。戴文渊保持冷静:“企业需要把自己变成一只鸟,而不是一头猪。否则,就算被风飞上天了,你不还是一头猪吗?”

    2016年的《乌镇指数:全球人工智能报告》显示,在人工智能领域,中国过去6年资本形成总额超过了之前30年的总和,过去两年中国新增加人工智能企业数超过了之前10年的总和。

    如此多人工智能创业公司,又有几家能够突出重围,成为独角兽?戴文渊说,反正第四范式的调调,跟其他人工智能创业公司不太一样。

    “绝大多数公司在比技术。当我们决定做第四范式时,就决定不局限于这条路。”戴文渊解释,“我们不是要费力气证明我家技术比别家好,而是要想办法让过去不能参与AI的人参与进来。”

    参与的工具,就是第四范式推出的“先知”平台。它是人工智能应用者开发平台,它简化了人工参与的特征工程和模型训练过程,还能提供自动或者半自动的特征工程、模型选择调参工具,降低使用者对专业数据工程师的依赖。

    先知里封装着顶尖的技术,却以简单的界面呈现。“我们这个团队,在不断研究,为什么某个人在我们这个平台上,还没法把人工智能玩起来,问题出在哪里?”本文开头的那场比赛,超过七成的队伍利用“先知”完成了具有专业水准的建模,但戴文渊想的是——怎么还有30%的人玩不起来?

    人工智能带给我的,我应该带给每一个人。第四范式强调“AI for everyone”,这应该是个大多数人的游戏。尽管绝大多数人没有脑科学和神经科学专业知识,但他们都会教自己的孩子走路说话。因此,普通人也应该能教计算机去实现他们想实现的功能。

    “用单反手动模式拍照,你要调整焦距、光圈等各种参数;现在你拿iPhone拍照,轻轻点一下就好。”戴文渊希望,“先知”能帮助用户屏蔽掉所有专业的操作,他们需要理解的仅仅是,这里有个算法的黑盒子,数据在里面跑一跑,能出一个模型。

    如果说,绝大多数人工智能公司在研究,怎么做更好的镜头和更好的感光元件,那么第四范式专注的,则是怎么样让相机的操作变得“更傻瓜”。

    “用和不用AI,效果可以相差好多倍”

    进入互联网下半场,“地”都已经被各家公司圈得差不多。再想发展,就得从别人那“抢地”。而要抢地,就要更高的效率、更精准的服务。AI,是实现这一切的助力。

    目前,第四范式的主要客户是互联网公司和金融公司。因为这两个行业的数据准备,最为完善。

    人工智能并非灵丹妙药,它不能解决所有问题。戴文渊在多个场合反复强调,现在做AI需要满足五个前提条件。

    这五个条件,前四者是必备:数据、计算资源、可被清晰定义的数学目标以及算法。第五个算是一个“有了更好、没有也无妨”的条件,即生成的模型在应用中产生新的数据,这些数据又反过来继续优化这一模型,形成闭环。

    “从我们和企业的合作效果来看,用和不用人工智能,效果差异可达好几倍。”戴文渊说。

    比如,第四范式最近和某银行合作,研究金融领域的反欺诈模型解决方案。过去,“欺诈”通常由行业专家来制定一系列规则,这样的规则通常有几百个。一旦某笔消费触发了这些规则,银行就会怀疑其为欺诈性消费。不过,几百条规则还是太过粗糙,现实世界五花八门的欺诈手段,常常从规则间的“缝隙”中溜走。“我们让专家去教机器,把欺诈的规则写了25亿条。这样一来,机器学习模型对欺诈的识别准确率,比照专家规则有极大提升。

    而且,越来越多的用户已经尝试在先知平台“自己玩”,有客户已经开发了六类业务的25个应用。戴文渊发现,一些以前离人工智能很远的人,也在平台上做起了AI。“我们的初心,就是希望有越来越多的人有能力脱离我们做开发。”

    第四范式想做AI领域的Windows。Windows大幅降低了普通人使用电脑的难度,先知也想做类似的事情,降低人工智能的使用门槛。戴文渊觉得,最好能让自家数据工程师存在感变弱。

    那,在“AI for everyone”的时代,第四范式会反过来变得可有可无吗?戴文渊轻轻笑:“微软不是还在卖Windows吗?”

京ICP备06005116