首页 >> 经济学 >> 滚动新闻
传统信用评分挑战者
2014年09月09日 14:02 来源:财新《新世纪》 作者: 字号

内容摘要:硅谷越来越多的科技企业开始向金融圈进军。银行刷卡交易实时获得数据,通过分析进行风险识别, FICO十几年前就发明了,现在90%以上发达市场的银行都在用FICO这套系统。

关键词:传统信用;挑战者;征信;变废为宝;信用

作者简介:

  硅谷越来越多的科技企业开始向金融圈进军。ZestFinance就是其中之一。

  这家公司打出的旗号是“将Google算法带入征信领域”,其利用机器学习和大数据技术,创立了一套和传统模式相异的信用评分方式,其中应用的数据变量是传统模式的上百倍。

  ZestFinance创立于2010年,创始人道格拉斯·梅里尔(Douglas Merrill)是Google的前信息总监兼工程副总裁,另一位来自金融圈的创始人肖恩·布德(Shawn Budde)曾在第一资本公司(Capital One)负责信贷业务。

  财新记者专访了ZestFinance的创始人梅里尔,他认为,“ZestFinance完全可以取代银行现在用的算法。”

  然而,美国个人消费信用评估公司(FICO)中国区总裁陈建表示,这不可能。在美国有1000多家当地信用局为消费者服务,基本隶属于三大征信公司。这三家征信公司分别拥有覆盖全美的数据库,包含超过1.7亿消费者的信用记录。在三大征信公司收集了海量个人征信数据后,还须经过复杂的模型计算才能形成征信产品。这三家征信公司目前使用的计算方法模型都来自同一家公司,即被称为“幕后大佬”的FICO。

  越来越多类似ZestFinance的初创公司正在觊觎传统华尔街的地盘。而其势头如同多米诺骨牌,不断推向华尔街的要害。

  数据变废为宝

  在ZestFinance的官网上有这样一句话:“所有的数据都是信用数据。”这句话恰恰浓缩了ZestFinance所做的工作——将成千上万的数据“变废为宝”,应用于信用评分。

  这家公司在短短四年时间内,就先后获得了高达1.2亿美元的融资,其背后的出资人都是著名的IT风投,包括FlyBridge、GRP、LightSpeed以及Matrix等。

  目前,美国绝大部分金融机构使用的信用评分都来自FICO的模型算法。自上世纪60年代至今,在美国的征信体系中,FICO的地位从未被撼动。

  在美国,经过三大征信公司的整理和FICO的计算评分,海量的征信数据就变成了一份份整齐美观的报告和325-900分值区间的评分,用户可以只买报告,也可以报告+评分打包购买。

  中国科学院院士、北京大学教授鄂维南对财新记者表示,FICO的评分模型的确首屈一指,但并非十全十美。FICO信用评分参考的数据变量只有不到50个,因此很多人摸清了FICO关注的变量后,就可以“模型套利”增加自己的信用评分,例如一个人可以每天反复在图书馆借书还书“刷信用”。

  “针对FICO的不足,ZestFinance重新设计了一套信用评估模型。和FICO的不到50条参考变量相比,ZestFinance参考的数据变量多达上万条,并采用非线性化的、更前沿的技术来进行分析,从而防止‘模型套利’的现象,更精准地评估消费者信用风险。”鄂维南表示。

  的确,ZestFinance远远超出了FICO 50条变量的界限。在这个位于洛杉矶的65人团队中,大多是数据科学家,他们开发了多个机器学习分析模型,而在这个模型中使用的数据变量多达上万条。上万条数据变量仅仅是原始信息数据,在这些数据基础上,模型可以得出超过7万个可以判断信贷行为的指标。而模型跑完这些指标仅需要不到3秒钟。

  所谓机器学习,是让计算机模拟或实现人类的学习行为,以获取新的知识技能,在数据积累中不断自我完善,可谓是人工智能的核心。ZestFinance的模型之一Hilbert就是成功地将机器学习进行商业应用的案例,让机器承接7万个指标的数据分析工作,寻找逻辑关系,并不断自我改善,人类只需要根据结果进行一些逻辑分析和判断。

  “多年来,美国金融机构都在用50条数据变量来决定是否给一个客户授信。问题在于,许多人并没有完整的信用记录,这导致在传统信贷中他们不断吃闭门羹,”梅里尔表示,“在ZestFinance,我们分析上万条数据变量,借助更加广泛的数据,从而对客户的风险预判更加精确。”

  数据的类型亦极其广泛:一个人的网页浏览历史、手机付费记录、超市购物清单都可成为重要的参考依据,甚至在用户填写信贷申请表时是使用大写字母还是小写字母,也可以成为数据变量。

  “很多数据都可以服务于信贷,例如申请人在我们的网站上停留的时间,就可以反映他对申请贷款的谨慎程度和还款诚意。”梅里尔说。

  鄂维南认为,信贷记录属于强变量,在强变量缺失的情况下,可参考多种弱变量,当这些弱变量组合起来,就可形成强变量,服务于信贷风控。“例如,孩子是一个家庭支出的源泉,那么如果能推测出借款人孩子的年龄,就能预测他的消费周期:婴儿有奶粉等固定开销、学生每到9月就要缴纳学费等。只要能避开他的主要支出,就可控制坏账。”

  鄂维南表示,在中国,由于征信业历史较短,缺乏足够的信贷数据,就可以用许多弱变量数据来对一个人进行还款预测。目前,学界有许多人也在进行类似的课题研究。

  对于这些“弱变量”的开发利用,陈建亦表示认同,“把数据的价值挖掘出来是不可避免的趋势,大数据发展会越来越日新月异。”但他表示,从互联网数据中挖掘价值,最早做的正是FICO。“银行刷卡交易实时获得数据,通过分析进行风险识别,FICO十几年前就发明了,现在90%以上发达市场的银行都在用FICO这套系统。”

分享到: 0 转载请注明来源:中国社会科学网 (责编:张文齐)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们