公开课:金融知识图谱的应用探索
为了传播金融创新典范,推进金融供给侧结构性改革,推动金融业服务实体经济,以及促进实现经济高质量、发展的目的,由北京市地方金融监督管理局指导,清华大学五道口金融学院、清华大学金融科技研究院主办,未央网承办推出“首都金融创新与发展”公开课,邀请金融行业嘉宾分享金融项目的创新模式,以及对行业未来发展前景的深度思考。
本期嘉宾:顶象首席金融风控专家晋梅
以下整理来自嘉宾分享实录:
金融知识图谱的概念和应用
在信息爆炸时代,对客观事实的各种描述是海量的、无序的、混乱的信息,而知识被定义为是对客观规律和信息的归纳总结。基于此概念,知识图谱是一种用图的结构对知识进行表达的方式,它的基本组成要素是节点和边,节点用于表示实体,边用于呈现关系。实体代表可以区别的、独立存在的某种事物,关系即实体之间的关系。
在日常生活中,知识图谱的应用广泛渗透到C端用户生活的方方面面。比如智能搜索,实际上“知识图谱”概念最早由谷歌在2012年提出,它能够在反馈正确结果、给出全面总结、更深入广泛探索三大方面提高搜索效果。再比如电商智能推荐,阿里巴巴从2017年开始搭建的电商认知图谱,将用户需求表达成图中的节点,并将需求点和电商领域的商品、类目、电商外部的通用领域知识等关联起来,从中挖掘客户的购物偏好和潜在的感兴趣的商品,使客户与商品和场景更好地连接。此外,还有O2O领域线上线下生活场景图谱,以美团为例,美团点评在2018年开始建立基于知识图谱的美团大脑,在客户、线下店铺和商品以及不同的消费场景之间构建知识关联,从而优化客户的使用体验。
在B端,知识图谱在企业关联和企业分析方向也有很好的应用。比如企业的法人或高管、企业之间的投资关系和关联风险分析,呈现在图谱上就会显得非常直观,将海量信息以非常有效的方式在很短时间内触达使用者。
知识图谱应用于金融领域的意义和价值
聚焦零售金融领域,团伙性风险威胁业务全生命周期。具体举例,常见的团伙性风险会发生在贷款申请阶段,存在以欺诈为目的贷款中介包装机构,他们把申请人信息根据金融场景的风控要求量身定做并进行虚假包装,骗过网贷申请,最后他们经手的客户可能会在短时间内出现爆发式的不良或者逾期,这将给金融机构带来较大的经济损失。 在支付交易阶段,由于风险不同,通常,用信用卡取现比支付消费的费率更高、条件更严苛,并且额度上有限制,但存在一些商户通过欺诈手段帮持卡人做虚假交易,将取现伪装成消费交易,使金融机构以较低风险的定价为客户提供高风险服务,而团伙性操作进一步加大发卡机构要承担的风险。放眼更广泛的资金交易场景,存在洗钱资金交易和异常资金归集的风险,比如团伙性进行消费贷款后把资金归集并投入房市、经营等实际用途与申报用途相左的场景、甚至游戏、赌博等高风险违规场景。
目前团伙性风险趋于组织团伙化、攻击隐蔽化、内外勾结化、手段复杂化,因此传统的防控手段已经出现较大局限性。 其短板和盲区可以归纳为三点:首先是人工防控效率和准确率低,因为防控效率会依赖于审核人员自身经验和对场景的理解,也会受到操作风险的影响;同时基于个体的风险评分没有充分考虑个体与个体之间、个体在时间轴上的行为演变、个体在不同产品上的表现差异,因而无法应对团伙性的网状攻击;第三是静态防控无法应对快速进化的攻击手段。
突破上述局限性的关键在于对用户行为的深层解读和本质洞察,需要在特定场景下能够评估个体的特性、个体之间的交互以及个体所在群体的属性。这些可以通过知识图谱实现,将复杂的信息有机结合,把关联关系数字化,把用户行为网络化。具体地,知识图谱技术能够帮助风险评估与反欺诈; 能够丰富客户画像,了解客户的风险偏好、信用资质,以及客户对其他金融产品的喜好,从而进行交叉营销和智能营销;此外还能够提供可视化表达,加深对场景特点和客群行为的深层次理解,大大提高营销人员、风控人员、运营人员等的工作效率和准确度。
金融知识图谱在风控场景的实战案例
下图是知识图谱的风控方案概览。
首先将跨业务、跨部门的各个类型数据按照金融场景的业务架构打通,构建金融领域知识图谱的本体层框架。打通包括全业务链路的打通,以贷款为例,贷款的全生命周期包含渠道进件、贷款申请、信用风险评估和审批、交易、贷款还款,以及可能的逾期或不良和后续的催收。构建图谱要将上述业务全链路过程中沉淀的数据,以业务的思维逻辑打通。
此外,还需要跨业务和跨部门的打通,一个成熟的金融机构仅在零售板块通常有几十甚至上百种金融产品存在,每个金融产品的设计会充分考虑客群、场景和渠道等差异性,所有产品在运营中沉淀的数据也需要在图谱上围绕客户为中心纵横打通。比如围绕同一个客户,其信用卡相关的申请和交易等可形成一个子网络,其网贷相关的申请和交易又而可以构建子网络,这两个产品的子网络可以基于客户进行打通。
除此,客户之间在金融场景中通过金融产品和交易发生关系,可以产生客户关系网络,同样的,可以手机电脑等设备、交易订单、工作单位、居住地等为中心构建不同主题的网络。
构建知识图谱后,客户经理操作业务系统时,可以非常直观地看到跟客户相关的信息,比如经常发生交易的对象,或者在某笔贷款上和客户申请互为担保的对象,或者其关联企业,这些全面了解都可以在几秒内实现,而不是在电脑前花一整天去调用很多系统和权限去寻找信息。它可以提供可视化的呈现、交互式的查询,并进行关联指标和标签的输出。
面对业务矩阵复杂的机构时,更高阶的应用是引入机器学习和图挖掘算法,从图谱中的异常结构里寻找到有风险、有传播性的团伙,并挖掘其关联关系,进行定性和量化的分析,其中包括基于坏样本的研究分析和挖掘,也包括对坏样本较少的场景用半监督或者无监督学习的算法,依据风险传播理论进行挖掘。这样可以把其中的风险实体和异常子图(团伙)挖掘出来,并且把团伙中成员的风险系数以量化形式呈现出来,帮助线下人员进行有针对性的、有优先级的排查。
算法挖掘出的洞见可以通过特征、标签和指标的方式被应用到各个环节的模型中,形成上图的闭环,也可以被应用到结合金融机构的业务场景、基于关联图谱专门定制运营监测平台里。在知识图谱的赋能下,运营监控平台可以根据机构偏好把重要的、与主要业务和场景相关的的风险挑选出来,再根据各个部门人员的权限进行科学配置。这样可以把相关的风险和披露信息及时地推送到相关部门有权限的运营和风控人员账户下,帮助他们更及时、更全面地了解风险情况,并规划下一步工作,实现对金融机构海量数据资产的价值变现。
具体地,以信贷业务的进件审批为例,上述知识图谱的挖掘和监控平台在业务流程中发挥着重要作用。
首先,当有业务进件以后,机构有模型和策略可以对客户数据进行自动化审批,而这些模型和策略的原材料来自关联的图谱系统,来自从底层知识图谱中挖掘出的指标,或者直接根据图谱建设的模型,让审批能全面捕捉到团伙性风险的指标和预警。
通过自动化审批后仍然会存在一些灰色区域的客户,银行会进行人工审批,对其中比较异常客户或者申请额度较大的客户进行复核,这个环节中,图谱可以把它挖掘到的关联性信息,比如客户与其他客户、其他产品及其历史信息,通过可视化系统展示给人工审批团队。
最后的审批结果本身又可以作为有效数据回流到关联图谱中,作为训练关联图谱的新的原材料。关联图谱每天都会纳入增量数据进行更新,重新挖掘和团伙风险指标的打标。
第一是满足可视化需求;
第二是决策有依据,在寻找风险团伙时,图谱可以帮助溯源,复现团伙犯案的方式和手段,因此不是基于黑盒子模型做决策,而是有据可依的风险决策;
第三是线上线下联动,把线下业务人员多年从业的业务经验以数字化的模式沉淀到图谱之上,并及时在动态更新的图算法风险挖掘中发挥价值;
第四是风险实时防御,是更及时、有效、动态地对团伙性欺诈的防控。
金融市场快速创新,诞生了很多衍生产品,这些产品涉及的金融机构很多、涉及的人多、交易结构复杂,使得现在金融机构在各个市场中的关联程度非常高,风险的传导性也日益加剧。中长期来看,如果金融知识图谱在金融风险防控上的应用可以从单个机构内部拓展到机构之间,再拓展到不同的市场之间,对于有效防控这样的系统性风险或者复杂金融产品的风险,甚至更高层次上维护国家金融安全,都是有非常重要的意义。
*本文版权归“未央网”所有,未经授权禁止转载。如需开通白名单请在评论留言,转载时在文首注明来源及作者。