文|焦可
人工智能在最近的这段时间是不容忽视的一个话题,从餐馆的服务员、到出租车司机都能聊两句与人工智能相关的东西。
借用李开复老师的一句话来讲,人工智能已经从一个科学、科技变成一种科幻,我们希望它不要变得魔幻。
所以,《智能如何重新定义金融的边界》,这个标题中真正吸引我们的是什么?不是只有智能,还有智能和金融中间的化学反应。
接下来我就为大家介绍一下,我们是怎么在金融这么一个古老的行业里,用一种最新的技术Rebuild的过程。
我们真正找到金融的边界是花了很多成本的。在中国只有15%左右的人,能够被传统金融机构所服务。然而在欧美一些发达国家,有70%的人可以被传统金融机构所服务。
我们跟美国的很多信贷公司交流时得知,他们非常羡慕我们,因为觉得中国有一个巨大的市场。中国的传统供给是不够的,所以这才给了一些新技术发挥的空间。
我们在过去几年兴起的手机支付,在中国的普及程度远远超过了美国。在美国,用卡支付是一个非常普遍的手段,留给新技术的空间非常小。
我们必须要深入地想两个问题:传统金融的边界为什么在这里?为什么传统金融没有为剩下的巨大市场服务?
这在我们看来其实是一个传统金融机构的审美问题。去银行办信用卡,或者办贷款,基本上都会要求提供一些材料。
比如说,征信报告、社保、工资证明、工作证明,提供各种各样的抵押品、资产证明等。当你不符合它的审美的时候,你就会被它拒掉。
中国是一个数据建设并没有那么完善的国家,有很多年轻人实际上是没有自己的征信记录的。很多私人企业发工资的方式是用现金,很多人没有社保,也没有车、房这样的资产。这些人,就不符合传统金融机构的审美。
传统金融机构就像是使用了一个数据冰山水面上的部分。水面上的部分的好处是看得很清楚,坏处是它的覆盖范围很小。
如果能利用好水面之下的这些数据,我们就能发明一种新的审美,不同于传统金融机构的审美。传统金融机构像是,它做一个筛子,用几条规则,把这一堆苹果里面的大苹果筛出来,但漏掉的苹果里,一定还有一些好苹果。
我们在做的事情,就是发明一杆秤,去测量这个苹果是好是坏。
我们现在单月的信贷业务量已经突破了150万笔。
这个数字对于传统金融机构来讲是个天文数字,因为一个银行网点一般一个月的信贷业务量可能也只有几百笔、几千笔。
这150万笔背后还有一些更神奇的数字,我们现在做一笔信贷业务只需要8秒的时间。全程是没有任何人工介入的,我们不需要人,我们可以每天7×24小时的工作。
二、我们通过什么技术实现上述成果?
我们在做的事情是在一堆用户里找到,哪些是传统意义上会还钱的用户,哪些人的诚信可能是有问题的。
我们不是像传统金融机构一样写一个规则引擎。规则引擎是什么?就是做一堆规则,If你的工资大于多少,and你有社保,and你的征信报告是什么样,你会被接受或被拒。
这种规则引擎总是会受到人的局限,特别是在传统的人无法进行判断的业务领域里,局限就越发明显。
我们是把一大堆人的特征扔到模型里边,让模型告诉我们什么是好的用户,什么是坏。
我们最核心的一个技术就是I、C、E。
I.C.E实际上是三个英文单词首字母的缩写,就是Identification(辨识)、Calculation(计算)、Evaluation(决策、评估)。
1.辨识。找到这个事件、业务里的特征。比如说对于智能驾驶里面,就要找到识别这个路上的物体都是什么东西。
2.计算。因为要处理大量的人工无法处理的特征。
3.决策、评估。你究竟该左转、右转、踩刹车还是油门。
这是人工智能的三个环节。
在金融领域里,同样也有这样的几个环节:
第一,柯南特征工程。
从大量的数据里面找到那些真正跟客户逾期率相关的特征。对于传统金融来讲,他们看到的可能是那几项、十几项特征,但是对于我们来讲,我们看到的是一个用户1200个以上特征,而这个特征是跟逾期率相关的。
我们在特征领域可以发觉到远远比人的经验更深入的一些特征,而且绝大多数的特征都是人的计算力无法去计算的。
有了这些特征之后,为什么我们能够知道这些特征是跟逾期率相关的?是有赖于我们接下来的模块。
第二,D-AI机器学习模型。
我们单月的业务量突破150万笔意味着什么?意味着每天就有5-6万的用户在使用我们的信贷服务。这5-6万个用户下个月实际的表现就会告诉我们,用户是好用户还是坏用户。
相对而言,跟人的经验比起来,我们更相信的是实际的数据。
我们每个月机器学习的次数是上百次的,传统金融可能半年、一年会迭代一次模型,但是我们的模型每个月、每天都在发生大量的变化。
我们线上的模型也不止是一个,实际上每天线上放出这么几万笔贷款的时候,背后的模型是有几百个,这是我们跟传统金融很不一样的地方。
为了支撑这么大的计算量,我们自己搭了一个大数据计算的架构,每天处理的数据量已经超过了5T。我们对特征进行全量样本的迭代速度只需要15分钟。
三、金融和人工智能天生合适
我们发现金融天然就是跟数字打交道的,金融天然是正负样本非常清楚的业务,还或者是不还,股票的涨跌,保险赔还是不赔。这都是被实际迭代出来的样本、学习的对象。
机器会比人更擅长处理大量数据的定量计算,机器比人的学习速度要快很多,而且机器没有偏见,机器不会疲劳,机器没有道德风险。
机器通过对用户特征点的分析,很容易评价一个用户的信用。
所以我们最核心的就是在打造一个基于人工智能的,应用在金融领域的引擎。
我们把自己定义成特斯拉,特斯拉之所以不同于其他的汽车,不在于它的外形炫酷,而在于它内在的引擎是不同的,它是一个电力引擎。
在不同的行业里面,往往都会有这么一个过程,引用柳传志先生在讨论联想时的观点,他认为联想经历了一个“贸、工、技”的过程。
贸,先把这个东西拿出来卖,做渠道、流通。
工,通过一些技术的手段加强这个行业的效率。
技,要通过一种新的技术去改变一个行业内在的实质。
互联网的很多领域都会经历这样的过程。最开始我们只是把信息搬到线上,但是后来发现通过搜索技术可以加强信息搜索的速度,提高它效率。我们又发现可以提高信息产生内在的技术。
互联网金融在过去的几年集中在贸和工的领域,所以很多公司实际上是把传统的金融资产搬到线上来卖,来做销售环节,然后通过一些在线的申请、审批提高这个业务的效率。
互联网金融正在进入下半场的革命,下半场真正最核心的就是内在技术(引擎革命)。
传统的金融引擎燃烧的是专家的经验、人力,新能源下的金融模式引擎烧的是数据、算法、工程师。真正的价值来自于新的引擎。
在新的能源金融模式下,我们需要先找到人。通过技术去评估,通过I.C.E去判断一个用户具有的风险,然后为他提供一个适合他的金融产品以及金融能力。
智慧和金融的碰撞,就是一个Rebuild的过程,而这种Rebuild实际上可以给一个传统的行业带来一个崭新的空间。
来源:笔记侠(ID:Notesman)
【原文标题为《人工智能给金融业带来百万倍增长,它们是如何结合发挥作用的?》,本文已获作者授权,如需转载请自行联系作者,谢谢合作】