不碰数据,又要建模?中国版FICO如何驾驭无数据场景 | 算力隐私专栏

深度资讯 郭嘉 2020/11/17 11:43




算力说



FICO征信体系的强大不言而喻,身怀绝技,吸引圈内各派竞相学习。然FICO缘何成为行业标杆,国内又为什么没有自己的“FICO”?当中数据与隐私计算技术扮演什么角色?

本期算力隐私数据安全专栏特邀郭嘉,探秘行业巨头伟大背后,及国内群雄崛起之路。



   隐私数据安全专栏第 014 篇原创作品  

​作者:郭嘉

编辑:元琪


FICO是一家伟大的公司!


FICO评分系统全球分布图


美国的个人信用评分系统,主要是Fair IsaacCompany 推出的 FICO,评分系统也由此得名。一般来讲, 美国人经常谈到的你的得分 ,通常指的是你目前的FICO分数。而实际上, Fair Isaac 公司开发了三种不同的FICO 评分系统 ,三种评分系统分别由美国的三大信用管理局使用评分系统的名称也不同。


信用管理局名称

FICO 评分系统名称

Equifax

BEACON*

Experian

ExperianPFair Isaac Risk Model

TransUnion

FICO Risk Score, Classic



FICO 评分模型中所关注的主要因素有五类, 分别是客户的信用偿还历史、信用账户数、使用信用的年限、正在使用的信用类型、新开立的信用账户。




FICO之所以伟大,高明之处是FICO自己没有数据,但是掌握了征信的KNOW HOW。

为什么中国还出现不了“FICO”?所有的所谓的征信公司或者金融科技风控解决方案服务商都试图把数据“积累”、“买入”到自己的本地数据库!这会是一个滚雪球的效应,但是谁愿意真正地把数据给到你呢?这种模式发展了这么多年,形成的格局就是做征信的公司,每家都有自己能力可得的数据,但是都不能完全覆盖。


“信”与“贷”的模糊


央行征信作为银行放贷业务最强的风控,但是覆盖率不够业务下沉。因此,一批老牌的征信公司,比如腾讯征信、芝麻信用、深圳前海征信、鹏元征信、中诚信征信、中智诚征信、考拉征信、北京华道征信等都割据一方。

其中,背靠蚂蚁金服的芝麻信用和腾讯旗下的腾讯征信因其用户覆盖面广、数据规模庞大、技术实力雄厚而最具竞争力。另外,前海征信因背靠中国平安也被视为有力的竞争者。此外,考拉征信则汇集了拉卡拉平台上进行信用卡还款、转账、公共缴费等个人用户数据。华道征信的数据则主要来自其两家股东:新奥资本握有大量的居民燃气数据;银之杰旗下的亿美软通是中国三大电信运营商资深的战略合作伙伴。而另外三家机构中,中诚信征信和鹏元征信的大股东均是老牌的企业征信公司,以企业信用评级业务起家。中智诚征信是民营第三方征信公司,以“反欺诈”业务为主。

从这些征信公司的关联业务可以看出,国内的征信公司数据来源一大部分信息是来自贷款行为的采集,而非全行业大数据的挖掘。我觉得这是“信贷”界限模糊的一个产物。就像咱们谈股权,股权分离是一个进化,裁判和球员一起踢球,肯定是有一些问题的。




同盾、百融与冰鉴


相比持牌八家,我更看好这三家互联网类型的风控服务商:AI技术能力更强,风控路线更像FICO;较纯粹,中立性相对较高;团队基因好。不过,都有之前所的一个唯一可能会成为未来真正成为中国版FICO的症结(或许现阶段也是优势)。

同盾,简单来说,就是“多头黑名单滚雪球”,靠设备指纹技术起家,积累大量贷款查询用户的设备ID。现在服务数百上千家银行的多头黑名单查询等业务,这个雪球约滚越大,在这个维度上似乎已经不可替代。

冰鉴,更加纯粹,完全的“风控解决方案供应商”,自己没有数据,在市场上能估值这么高,是对风控能力的输出。但是,很干燥的是,它一定在很被动地采购第三方数据,然后做成冰鉴的分。如果哪天,数据采购的路子被卡脖子呢?

百融,有爸爸,依托联动优势的资源,资源利用的好,雪球也滚起来了,多头还是不错的。

如果非要说出哪家更想FICO,我可能会投票给冰鉴,虽然现在它最小。如果说数据价值,百融和同盾,一定已经成为国内除了央行征信之外最好的征信数据了!这一段说的比较直接,纯属个人的一些看法,而且我不喜欢绕来绕去搞的好像自己很有内涵。


国版FICO的一个难题


这个难题是未来你可能拿不到数据、或者说你很难拿到多维度的数据。我们假设有一家公司:

它已经初具风控影响力(银行觉得你牛),它有很多的科学家风控团队精英,它的公司很轻、没有任何数据,它有的是为中国大部分银行输出建模的能力。这个公司得多么Sexy!未来这样的公司可能真的是中国的FICO了。

且不谈别的,技术上可以做到吗?简单反问:又不碰数据,又要建模?答案是可以的!谁可以拍胸脯对一家银行说“我不碰数据、我不碰数据、我不碰数据,我能建模、我能建模、我能建模”,那它是有勇气去创新的!谁拍着胸脯对一百家银行进行这样的服务,它就牛逼了。最后,它通过一家家银行的建模,把KNOW HOW融会贯通。


                                   

“FICO”模式,谁会是第一家受益者



我们称这个FICO场景为“无数据的第三方建模场景 ”。银行将Y加载到本地节点,数据源A将X加载到本地节点,数据源B将X加载到本地节点。科技公司发起无第三方建模任务,部分模型分布式保存在数据源各自节点。科技公司只掌握模型的参数( Know how ),科技公司可对模型调用进行清结算。科技公司只参与输出模型参数, 不经手数据。 

这个“神奇”的技术方案,可以完美让科技公司变得中立、独特。它的核心底层支持依赖于多方安全计算技术,Gartner 2021年九大重要科技趋势之一的隐私增强计算,讲的就是这个技术!目前国内真正有这方面技术实力的公司不多,已BAT、富数科技、华控清交等为代表,「算力智库」聚焦于隐私计算领域的传播,往期公众号有对多方安全计算和联邦学习相关技术及科技公司的详细介绍。有的厂商已经在两方建模、多方建模、无数据方建模、无第三方建模等场景上进行了深入的探索,并在类FICO模式上取得了突破性的进展和应用。

风控解决方案的科技公司面对产品同质化严重、壁垒单薄的现状,如何脱颖而出?釜底抽薪、解决科技公司中立性的数据问题,隐私计算技术不失为一条光明之路。中国版的FICO花落谁家?拭目以待!

本文参考《https://blog.csdn.net/starzhou/article/details/79344345》


自诩从技术走向业务的小学生。近十年互联网大数据行业经验,先后就职于上海大智慧、平安、挖财,任职大数据架构师、资深分析师等职位,对金融科技有深入研究。

目前任职富数科技高级总监,负责隐私计算的解决方案与业务落地。

郭 嘉

如果您对数据隐私、数据安全共享技术等领域有独到观点分享,欢迎投稿!
投稿邮箱:hehaohua3h@163.com


文章所载观点仅代表作者本人

且不构成投资建议

敬请注意投资风险