三方数据公司被查,部分金融机构“断粮”的背后
近期,多家涉及爬虫技术的大数据风控平台被调查引发业内外关注。
据媒体报道,多个金融机构受此影响暂停了大数据风控业务,相关的消费贷等服务同步收紧。
数据公司被查,部分金融机构业务却受影响?逻辑有点乱,背后其实很简单。一个原因是部分金融机构过度依赖源头不清晰、合规性和稳定性没有保障的外部接入数据,输入源头一旦出现波动甚至中断,相关业务和服务就会受到影响;第二个原因是部分金融机构自身数据分析和挖掘能力不足,没有建设好自主可控的风控体系,导致命门掌握在外人手中。
部分金融机构“断粮”的背后原因
数据是金融机构的重要资产,也是金融机构信贷、审批、反欺诈等服务和决策的关键依据。除了客户、交易等海量自身数据外,金融机构还接入了两类外部数据,以增强自身的风险管理水平。
第一类是“官方征信数据”,主要是人民银行建设的第一代、第二代征信系统,以及2018年批准成立的百行征信,提供互联网金融领域的数据。这类数据包含贷款、存款、担保、贷记卡使用及公积金、社保、工商注册、法院、税务等信息。
第二类是“其他三方数据”主要来自是移动App、互联网平台、金融科技、数据公司的沉淀、收集,包含支付、社交、出行、网购、通讯等用户行为信息。这类数据的科学使用,对于金融机构有效覆盖“非征信客群”是非常重要的。而针对此类数据的使用和管理,中央网信办陆续出台了《网络安全法》、《数据安全管理办法》、《个人信息出境安全评估办法》。
“官方征信数据”和“其他三方数据”覆盖了个体的信贷、生产、生活,保障了金融机构外部接入数据的深度和广度,为金融反欺诈、智能风控等业务安全体系的开发建设提供了良好基础。
但是,部分数据公司为快速占领市场,在推广其数据服务的过程中,淡化其数据源的合规性、稳定性、局限性,大力宣扬“几天便可对接上线”的傻瓜式数据风控,或以免费赠送模型为名、快速部署一些实际上只是方便输出其数据服务的“黑盒式”模型。而部分金融机构在数据公司铺天盖地的宣传和影响下,对于数据的应用也就确实局限于简单的黑白名单、“一个阈值走天下”的冷启动规则、“知其然不知其所以然”的冷启动模型。甚至,对有效数据的研究和挖掘利用不如那些苦心钻研的诈骗团伙。
这种浅层次的数据应用表面上看确实接入方便、短期见效快,貌似能够达到立竿见影的效果,但是付出的代价其实并不低,迫使金融机构需要不断接入越来越多“剑走偏锋”的新数据以满足业务需要。更严重的是,这种饮鸩止渴的方式大大弱化了金融机构内部海量数据和官方核心征信数据的主导地位,牺牲了金融机构正确构建技术和业务竞争力的宝贵时间,无法帮助金融机构从数据沉淀和挖掘中洞见有效信息,对自主可控业务安全体系的建设缺乏深度的支撑,不利于金融机构长期的稳定发展。由此,就出现了开头的现象——三方数据公司被查,部分金融机构业务“断粮”。
提升行内数据治理能力刻不容缓
2018年5月,银保监会发布的《银行业金融机构数据治理指引》以“应通过数据治理有效实现数据价值”为主线,要求银行业金融机构将数据治理纳入公司治理范畴,并将数据治理情况与公司治理评价和监管评级挂钩,鼓励银行业金融机构开展制度性探索。
IDC最近发布的一项白皮书披露,2018年全球数据体量达到了33ZB,但其中只有2.5%的数据得到了分析和利用,97.5%的数据依旧在沉睡中。金融机构自身的数据,还有外部接入的“官方信用数据”和“其他三方数据”,如果能够能够良好挖掘出来、科学利用,必能对反欺诈、风控体系建设以及业务可持续发展提供有力的支撑。
顶象最近推出的关联网络方案,能够有效帮助金融机构进行深度的、高质量的数据治理。它通过充分挖掘金融机构内部的“数据金山”,穿透纷繁的表象,根据对金融机构具体业务场景、业务逻辑、产品流程、客群特征、风险特点的深度理解,量身定做,把与业务需求紧密相关的客群特征、业务数据、交易信息、核心征信、合规数据等海量数据,科学构建“有内涵、可外延”的复杂关联网络。再通过应用图数据挖掘、无监督算法、半监督算法、有监督算法等多角度充分挖掘,进而结合应用场景、实际操作人员的具体需求直观而智能的在运营和监测平台呈现最有效信息。顶象关联网络的图谱构建逻辑及构建全流程、基于关联图谱的图数据挖掘的算法和模型全部对客户开放,运营监测平台的设计很大程度上也参考终端客户在实际应用中的需求和习惯,利用关联网络“可视化、可解释性强、可推理性强”的特点,力求让客户知其然更知其所以然,为金融机构的反欺诈体系、风控体系等的建设提供了有力的支撑,帮助金融机构实现业务安全体系自主可控。
金融机构须建立自己的数据护城河
在数字化今天,金融机构的产品服务与市场竞争发生了巨大变化。
在产品服务层面,线上化让服务范围不再设限,场景化让业务无处不再,社交化让金融脱媒更加严重;在市场竞争方面,金融机构的客户发生了巨大变化,金融机构竞争者也在增多:不仅面临同区域的竞争者,更面临全国性竞争者,乃至拥有庞大用户规模的异业竞争者。
增量客户减少,存量客户争夺激烈,创新业务、提升服务、打造差异化是关键。这一切都离不开数据的深度治理。数据是金融机构的核心资产,也是金融机构竞争力的关键。在监管机构大力清理市场、打造干净合规的数据环境时,金融机构脚踏实地、修炼好数据管理和挖掘的内功势在必行。