视觉中国 |
在近日结束的“黑色星期五”抢购大战中,你用信用卡在境外网站为自己买下一个心仪已久的包。
几秒后,信用卡开户银行给你打来电话。“刚刚您的信用卡有一笔××美元的消费,请问是您本人吗?”
你可能觉得贴心,也可能感到不耐烦。此时,起作用的就是银行的反欺诈监测系统。更多时候,它进行事后确认。
但在一些金融机构,你的账户安全正在由机器守护,它更加敏锐。此时,你可能会接到这样的电话:“刚刚,有人试图盗刷您的信用卡,请您注意账户安全。”
一切在你未察觉时就已被终止。
特征总结高手,兼顾效率和准确率
“欺诈和反欺诈的攻防战是长期存在的,有猫就会有老鼠。”智能金融企业腾梭智能首席风控官郭曦表示,欺诈是一个长期存在的黑色产业链,也是金融行业一直为之头疼的问题。
对业务交易阶段的欺诈风险,金融机构通常采取的方法是设置专家规则。专家规则主要针对新发生的、共性明显、风险特征突出的欺诈行为进行拦截。专家规则不依赖于长期历史数据,更多依靠专家经验指导。
无论是专家规则,还是现在人工智能企业采用的机器学习,都是要识别特征,总结规律。比如说,盗用账户的人可能会大量使用不同的账号和密码组合来尝试登录,那么,同一台设备短期内登录过多账号就会被定义为一种异常行为,这就成了金融机构反欺诈系统中的一条规则。
“如果使用传统反欺诈手段,这些规则很容易被绕过去,毕竟人能处理的信息有限。”郭曦说。
现在摆在你面前的是成堆的欺诈事件,每个事件又关联着它发生的时间、地点和用户行为。你可以手动分析,但也可以将这些数据交给机器。毕竟,人工智能是特征总结的高手,效率和准确率兼顾。
从本质上来说,这也是一个找不同和分析不同的过程——一桩交易如果看起来“骨骼清奇”,和其他本本分分的交易并不一样,机器就能将它一把揪出。
无监督还是有监督?适用最重要
人工智能做风控,目前主流的训练方法,还是有监督学习。
有监督学习,顾名思义,就是“有人盯着”。人工智能被“投喂”的,是金融机构已经标注好的“正常”和“异常”事件。
通常情况下,如果用户账号被盗用,只要他有所察觉,都会向银行反映。因此,银行能够积累起一定数量的标注好的数据集,这些也就是人工智能进行训练时的“标准答案”。要是机器判断对了,就给它奖励,让它记得更牢一点。
最近,也有科技金融领域的公司表示,无监督学习可以在没有标注的情况下,提前阻止未知欺诈。还有人指出,在安全领域的反欺诈中,无监督机器学习技术能表现得比有监督学习更好。
无监督学习真有这么神奇?
“简单来讲,无监督学习就是‘聚类’。”郭曦告诉科技日报记者,机器可以根据用户交易过程中的各类数据特征,将相似的聚集在一起,分成不同类型。但无监督学习并非完全脱离“人工”,其效果的好坏很大程度上依赖于人对业务场景的理解和数据特征衍生的经验。简单暴力的聚类,很容易出现“尴尬”——“你希望机器按照‘正常’和‘异常’来分类,但可能机器最后分出来的,是账户本身‘有钱’和‘没钱’,是用户为‘女性’还是‘男性’,那这种分类的参考价值就不高。”
第四范式反欺诈业务负责人王明向科技日报记者进一步解释,无监督学习主要是检测“异常”,但“异常”只是“和其他不一样”,它本身没有直接对应的实际业务含义。欺诈团伙相对其他人是“不一样”,某个暴发户相对其他人还是“不一样”。所以,非监督学习应用抓的是“不一样”,而不一定是“欺诈”或者某一个确定的业务目标。
无监督学习听起来有种“我们不一样”的豪情,但它在工业上的应用比较有限,主要用于行为异常检测和CRM客群划分。在郭曦看来,采用无监督学习,有时是“巧妇难为无米之炊”情况下的无奈之举。“在有些应用场景中,有标签的数据确实比较宝贵,此时就只能用无监督学习”。
以反欺诈领域为例,已有的欺诈样本就未必完全准确。有些时候,欺诈在业务开展中已不知不觉发生,被标注为“正常”的事件,其实可能就是一次欺诈事件。“数据集不够干净,好样本和坏样本分不清楚,就会影响学习的准确度。”郭曦坦言,在有些银行,确实缺少有标注的欺诈案例,因为他们用繁复的验证手段提高了欺诈门槛。这也是双刃剑——保护账户安全的同时,也牺牲了一部分用户体验。
在业务的冷启动阶段,无监督学习是一种不错的选择,可以帮助业务找出没有指向性的“不一样”的集合。当系统运行了足够长时间,积累了足够多业务标签之后,就需要基于业务标签来进行有监督学习,来进一步提高直接决策的效率。
所以,无监督学习没有那么厉害,有监督学习也并不“out”。“技术不在于好坏,关键在于适用。”王明说,合适的方案是基于无监督学习做初步筛选,基于有监督学习做整体的决策。
道高一尺,魔高一丈,一直都在较量
欺诈手段一直在“升级换代”。有文章分析,其精准化和高科技化趋势明显,欺诈行为已向产业化发展,在网络诈骗、虚假申请、钓鱼、伪卡等领域形成了上、中、下游结构完整的黑色产业链。产业链上端为“技术工程”派,窃取信息;产业链下端是“社会工程”派,购买数据信息后,利用消费者心理弱点,进行盗窃、诈骗或敲诈。
同时,想要盗用账户的人,肯定会不断尝试,来摸清并想办法绕过你的规则设置。所以,系统收集的数据越全面,维度越丰富,欺诈者留下的蛛丝马迹越多,它就能判断得越准确。“我们可以做到每天甚至更短的时间更新一遍模型;所以,即使是昨天出现的欺诈手段,人工智能都能辨别。”王明强调。
根据艾瑞咨询发布的《2018年中国人工智能+金融行业研究报告》,资本方对人工智能+金融行业的投资热度也在持续升温,从2016年起,每年的融资时间数量均超过30起,其中,智能风投和智能投顾领域最受追捧。
行业有需求,自然会有越来越多的公司进入。但有金刚钻才能揽下瓷器活。“反欺诈领域有自己的特点,金融机构交易量庞大,重视用户体验,对整个系统的响应时间以及效果要求非常高。”王明也能感到,“从真正整体落地能力上看,实际能在这一领域‘一起玩’的公司并不多。”
王明分析称,从商业角度来看,未来,反欺诈领域的人工智能公司会继续多头并进,百花齐放;但从技术角度来看,头部企业或许会“赢者通吃”,和第二梯队企业的技术差距会越拉越大。“不管是有监督学习还是无监督学习,人工智能企业肯定会继续研发新的算法,带来新的突破,帮助传统的金融机构完成反欺诈系统的升级改造。”