悦数图数据库

邦盛科技:关联图谱在金融反欺诈领域的应用与实践

以悦数图数据库为底座的金融反欺诈解决方案

业务背景:传统反欺诈的难点

目前金融反欺诈是一个很火热的问题,而且呈现出一种组织化、团伙化的新趋势。这里有个很重要的问题就是信息不对称,我们很难去验证信贷客户信息哪些是真实的,哪些是经过包装的,这就导致很多问题。比如银行立项申请时,因为不知道客群真实情况,可能会通过提高要求来控制通过率,虽然有效,但是一把双刃剑。

2022 年政府工作报告中也说过,普惠金融会进一步扩展,客群也会进一步下沉到一些农村地区,可能面临的都是没有往期征信记录的“白户”。还有一些比较传统的欺诈手段像信用包装、中介代办、内外勾结等,一些中介在包装信用卡或者信贷进件时,就针对某几家银行,因为他知道那几家银行的底线和红线是什么,只要不去触碰就能贷得出来;时间再久一点的话,他可能还会知道怎样做贷款额度会高一些。

传统反欺诈主要依靠专家规则,但像身份证号、银行卡流水这些东西其实伪造成本很低,对于一种群体性的、大批量的欺诈并没有一个很好的管控手段。

图谱赋能:智能反欺诈的实现路径

我们可以看一下智能反欺诈手段的发展路径:最底层的是专家规则,即风控专家通过经验设置一批规则,然后调整触发条件,在通过率和拒绝率之间找到一个业务上的平衡点。

但专家经验很难覆盖所有风险,所以通常会做一个机器学习建模去防控整体风险,然后再用专家规则去补充,即专家规则加上机器学习模型搭配互补。但就目前的经验来看,由专家过渡到机器学习模型,建模这一步会面临很多的问题,第一是样本量不足。第二是样本空间增长有限,后面也会有一个案例,因为贷款或信用卡申请大概都会有那么 6~7 种方式,落到最后都是需要人工检验的,所以说增长空间很有限。

因此,我们需要运用关联图谱去破解信息不对称的问题。因为无论是团伙还是中介欺诈,都会有一个批量进件的行为,图的可视化手段可以去抓取团伙样本,而且很可能一抓就是几十个到上百个进件——这样其实对于样本补充是个非常有效的手段。而且图谱还可以进行一致性的检验,比如说多方面的信息来源可以打破信息的不对称性,图做出来后还会从关系图的维度去展示,等于帮我们做二次校验。举个实际的例子,比如说多个申请共用相同的信息、相同的手机、相同的 IP,这就属于团伙的情况。

为了解决这种情况,我们引入图谱,并从中抽象出一些关系维度的图规则,对于原有的专家规则体系做补充。另一方面我们也在抽取图特征,对既定的机器学习模型做一个补充,提升机器学习模型识别团伙欺诈的能力,同时进一步去丰富黑样本的标签。所以说专家规则、机器学习模型、图谱这三者具备之后,就能够构造一个有效的生态闭环,可以实现反欺诈效能上的互补。

就目前关联图谱在反欺诈的具体应用,我列了大概这几个方面:

  • 申请图谱:比如如何在信贷、信用卡申请中去识别团伙欺诈性进件。组团有一个特点就是信息会被团队成员共享,那在图谱的可视化查询上,就会发现出很多关联关系。较常见的可能就是从身份证、手机号,设备指纹、邮箱地址等这些维度去做一个关联,先去看这些数据有多少个共性,再就是结合一些可视化手段去分析具体的欺诈手法。

  • 交易图谱:涉及到多层次的转账关系,主要是看资金最后的流向、受益人是谁。现在比较火热、监管也比较关注的是涉赌涉诈的问题,也是我们主抓的一个方向。我们这方面有很多客户案例,通过监管下发的名单或内部的规则模型识别出可疑交易,这个过程中可能还会结合历史流水,把一些归集的账户扩散到n层,过程中可能会使用一些图探索手段,也会基于图谱平台,去做一些存量排查,比如说增量防控。

  • 企业图谱/内控图谱: 现在企业业务会存在一些交叉,外部风险对企业的影响也越来越大,用图谱可以勾勒出一个企业风险的全貌,结合外部风险点的引入,就能尽早预判外部风险对企业的影响。内控图谱更多是涉及员工的道德或操作风险,比如误操作或没有按照规章制度做某些业务。道德风险更多发生在员工和企业的异常资金往来,比如非法集资或资金挪用。做这个防控核心是用图谱去查看员工的实际控制账户,因为就像银行员工都很熟知银行的业务,很少有员工拿自己的户头进行一些犯罪。对这些控制账户的识别可以通过图谱的一些探索手段,比如说亲属的账户。我们有个股份制银行的案例,这个案例最后定位到了员工女朋友的账户,因为我们在图探索中发现,很多资金实际都流向了女朋友的账户。如果用传统手段来看的话,是很难去发现的。

  • 洗钱图谱:这个问题比较久了,不同时期也会衍生很多手段,现在比较流行的地下钱庄还有跑单平台,它会把用户拉进来,把涉案资金隐藏在跑单用户每天正常的消费交易流水上,但这其实是有一个固定模式的。怎么在图谱上刻画和获取业务经验、制定图规则来进行实时的监控和筛查,也是邦盛作为图技术平台对业务的关键赋能方向,我们后面会说到。

  • 车险/运维图谱: 一般我们分析这些领域时会结合初始化网络,进行点边结构的设计,之后找到一个数量相对合适、联系比较紧密的子图,再结合业务专家经验,进行一些探索性分析性的工作。

应用场景1:贷后资金流向

这里也简单列举了一些具体的应用场景,第一个就是贷后资金流向问题。

我们可以通过图谱重点筛查这些经营类、消费类的贷款,追踪它是否违规流入房市、股市等。这个过程中我们会利用图谱的穿透能力去计算转出资金的金额还有比例,这些确定后就能很方便地去敲定风险和违规性质,提供排查依据。监管部门目前对于互联网信贷都遵循图上说的“三个办法一个指引”这个原则,所以通过图谱建立实时风控,关注贷后放款这些关键环节和资金流入的重点领域是我们主要做的一个事情。

接下来可以展示一下具体手法,比如放贷后直接流入黑名单账户,或者解除关联后从自己账户转移到非自己名下,但可能是实际控制的一个账户,再往楼市、股市这些敏感行业投资理财。这些都是可以通过图谱,结合资金的具体形态来分析的,因为这些行为在图谱上会展示出一个非常明显的发散或归集。

这种模式用以往的专家规则是很难进行刻画的,因为最多的情况下就只能做到一维,最多也就到二维关系,而图谱更善于进行多维度关系的筛查。在海量的交易结构里面,我们也能发现一些模式化的结构,比如上图可以看到大概 4-5 个端,里面涉及一些集中转入、分散转出,还有类似树枝、蚂蚁巢穴一样的链式交易结构,这都是贷后异常的资金模式。通过图谱的展现化手段,结合业务知识,很多情况下我们一眼就看出它是有问题的。至于具体问题在哪里则可以通过图谱提供的一些功能,比如说k度查询或重要节点的发现算法去查看。

应用场景2:涉赌涉诈场景

第二个大家比较关心的就是涉赌涉诈场景。这个场景下,我们用图谱做了很多资金量的分析,还有甄别资金转移过程中的手法。当然,我们还会结合账户自身的特征,在图谱上观察有没有分散的转出和转入,或者交易对手成批地更换。结合这些特征,就可以分析账户在整张交易网络中的作用。

以上涉赌涉诈和贷后资金流向这两个案例,都存在一种大量的转账关系图谱。其实,图谱可视化最大的价值就在于还原真实的交易场景,这些是以往在核查单观察,或者在系统上一步一步点击流水不容易观察到的。

左边那幅图其实就是涉赌涉诈资金的转移过程,最左边是赌徒的充值,一种是充到代收企业,另一种比较多的是充到跑分平台,平台拿一份佣金再把剩余的绝大部分的钱转给团长。上游这几步可能会重复多个层级,到了中游,各种空壳企业会进行各种各样的资金搬运,夹杂着一些空壳企业的分批启用,或者跨行转账行为,造成资金链路的进一步模糊;之后就是资金洗牌的最后一步,钱会转移到一些个人账户进行分散提现,或者直接就在游戏/直播平台进行一些打赏,还有买房置业,总之,下游洗白的方式也是多种多样的,但通过图谱再结合一些特征,还是能够监控到的。

应用场景3:保险团伙反欺诈

第三个应用方向是保险排查,比如车险或医保反欺诈。车险主要是串谋式的索赔欺诈,通过监测还有关联共享的身份信息等,就能比较好地跨越数据孤岛,发现他们的团伙。

再有就是医保欺诈,我们一般会更多地关注医患或供应商不正当的关系,一旦在某个药品或疾病上出现了大量的离散值,就代表是欺诈行为——这是以往判断个体欺诈的常用办法,但现在团伙欺诈问题非常严重,那它首先会有一个思路上的转变,比如几十个人都通过个别支付账户去买相同的药品;还有账户层面的聚集以及很多其他的共性。结合图分析和算法,都可以识别这些团伙案件行为。

总结:用图谱反欺诈的优势

刚才分享完三个应用场景,接下来我们总结下图谱反欺诈的优势点,主要列举了四点。

  1. 关联分析:就是指人为主动去探索发现这些可疑的特征,然后利用图谱进行一些可视化的关联。这就是我们业务人员主动去使用图谱工具进行可视化的探索,然后结合不同的业务领域,比如洗钱、信用卡申请、信贷申请等在业务图谱上展示的可疑链路去发现一些可疑点,当然,不同领域可疑点肯定是不同的,但经常使用的业务人员一定会带有行业敏感性。

  2. 图规则:这点更多是用于增量的监控。和以往专家规则不同,图规则是用图探索的手段关联知识对比后得出一些结论,这个过程就是我们从关系的维度去判定图规则,然后系统主动实时地去排查风险。

  3. 模式分析:我们近来叫做同模型,因为很多欺诈模式都有一个固化的模式,比如信用卡套现。这些固化的模式,完成分析之后就可以用图语言写到图库里进行一个遍历查询。相对于上面介绍的图规则,它是一种存量的筛查方式。

  4. 社团分析:因为之前说要想建模,很可能会缺少一些黑样本、黑标签的数据,社团分析其实是一个非常好的功能,它可以通过算法,结合样本标签,发现欺诈团伙。

关联分析、图规则、模式分析,还有社团分析,这 4 点是覆盖了实时、准实时还有事后的三个方式,既是图谱用于反欺诈的主要功能,也是我们目前的优势能力,我们大概几十家客户目前都在应用。

底层的数据层可以满足不同数据清洗、接入的需求,支持多种数据通过流式或批式接入,然后在图数据库中进行点边结构映射,继而在图谱平台中完成图构建、图分析、图挖掘、图决策等操作。这里还会集成可视化的操作组件以及各类算法,以适应顶层不同业务线的需求,如反欺诈、营销、运管、企业担保等。

我们用的是 悦数图数据库 图数据库,在业务过程中也进行了很多交流,再加上我们的专家经验,所以在点边结构挑选和精简方面经验是非常多的。

图谱平台功能1:图构建

图谱平台在应用方面还有很多核心功能,第一个核心功能是图构建。我们有三种构建方式,包括可视化建图、可视化入数,离线批式与实时流式入数。作为一个中央级的平台,肯定不只一个业务部门在用,所以权限隔离和数据共享也是我们在很长一段时间里打磨的重点功能。入数方式上支持大概7种,包含批式、流式的方式,还有数据源,比如常规的关系型数据库入数,中间件 Kafka 入数等都是支持的。

图谱平台功能2:图分析

第二个应用是图分析,包括交互式分析、智能化分析、还有性能优化。因为我们的平台集成了很多可视化的分析工具来提供简单易用的交流,比如时序分析。这里还会有很多即时算法,还有路径分析、环路查找、异常识别等等。我们在分析的基础上,还根据实际业务经验做了很多数据调优,尤其是对于演变结构的精简,因为知识图谱产生到最后还是要服务于决策,服务于业务,这才是最终目标。

图谱平台功能3:图指标

图指标就是我们经过图分析后,直接提取的一些图谱网格特征,并形成的一种计算指标。这个计算指标会和专家规则的指标联动,对上层决策进行调优。

图指标比较简单的一个用法就是用相近的关联关系去触发黑名单,但更多的时候我们习惯把图指标和专家规则类的统计指标、模型特征放一起来做融合决策。需要特别说明的是,我们说的融合,是指在编译层就做了一些融合,最后跑出来的结果是同一批,也就是说融合决策在这个阶段我们就是做在一起的。

图指标主要应用有两个,刚才也说到,第一种是事中的决策,第二种是事后的分析,分别是实时和事后,也是目前在图指标上的两个典型的用法。

图谱平台功能4:图算法

还有图算法。相比图指标来说,图算法其实就是对于关联动作进行更深的挖掘。像模式匹配,就是经过业务定义之后,去筛选资金链路闭环的一些风险模式,刚才也说了是一种一对多、多对一的模式,还有洗钱也会出现很多闭环的风险模式,在定义好之后都可以放在图谱的数据库中进行跑批,这是模式匹配。

另一个用法是社团发现,用 Louvain 算法进行社团分割,形成一个团给业务去核查分析。除此之外对担保圈还有一些风险传导的算法,这些都是我们根据金融反欺诈的特征模式总结抽象,最后融合到了系统功能中去。我们也支持一些自定义算法,比如业务员通过图语言写一些自定义算法,上传到图平台后给业务人员用,逐渐就形成一个通用化的做法。

图谱平台功能5:图服务

再进一步就是在这个图的服务能力,我们提供了三种能力,包括图分享、图查询,还有图分析集成。第一种,图分享指的是分析得到的一个子图,给没有出入平台权限的人去看。第二种是图查询,像图中展示的这样,通过看核查单上 URL 的方式去发布图谱分析的一些结果,辅助风险的判别。第三种,是我们在业务系统中嵌入图分析还有图查询的一个全部能力,来构建图谱平台,还有各个业务系统,比如说交易反诈的系统,申请反诈系统或者信贷决策的系统,他们之间数据的全面打通,这就是说服务平台和其他业务需要先进行一些联动,比较简单的是 iFrame,如果需要集成的深度的话,就是全面的数据打通。

应用架构:整体视图介绍

整个图谱的应用架构上,最左边的是给建模工程师使用的,然后右边是给业务人员用的,结合业务上的各个生产渠道,比如风控面反洗钱安全系统,再聚焦一些业务场景,比如说反欺诈、涉赌涉诈、团伙套现进行一些机器的分析,还有一些离线的分析。下面对应的是我们刚才介绍到的一些功能,然后建模工程师将左侧知识构建的数据源处理好后,定义好这个节点边属性关系,交给业务人员进行一些知识的挖掘知识的分析,这个过程中会用到我们事先定义好的一些功能算法,最后按照说图谱的能力对外进行发布。

关联图谱平台在某国有银行反欺诈的实践

项目背景

这部分来分享一个案例,看一个银行如何通过图谱,解决信用卡申请团伙欺诈的问题。案例背景是在普惠金融背景下,银行线上业务发展越来越快,信贷业务开始线上化迁移,那么风险敞口、以及客群质量都面临着难题。传统反欺诈主要依靠专家规则,但伪造这类的成本很低,对群体性、大批量的欺诈,尤其是团伙欺诈风险,并没有好的管控措施和监测方式,风险识别难度越来越大。

项目概述

这个项目实施的时候也是引入了图技术。首先,我们去给银行构建了一个可视化的分析平台,业务人员可以去看一些欺诈行为,开展分析调查工作。其次,利用图谱技术还有探索功能,可以开发了针对于团伙欺诈的图规则。再次,在整个分析过程中会产生很多的图特征,我们都融合到了机器学习模型中去,完成了原有机器模型的优化,大概是这三点事情。

项目过程

然后说这个项目实现过程。我们在这个项目中开发的,其实并不单单是一个图平台或者说一个系统平台,其实是想做出一个实际的业务效果。我们当时做了大体是四个阶段的事情,第一阶段是整体的数据探索,包括数据怎么筛选,欺诈的标签怎么定义。第二阶段是根据实际业务场景定义图谱的点边关系,我们都会根据实际业务场景进行一个设计。

第三阶段是从单维度的图规则到多维度的防伪规则,这里规则如何去设计,其实更多是由数据进行支撑的。前三个阶段所做的所有的工作、关系维度的特征我们会一同带到第四阶段——机器学习建模过程中去,同时初步发现的一些团伙也会给模型做样本学习,这样整体的反诈效果会更加精准。

如何实现

step 1:初步探索欺诈数据

这个项目中我们做了非常多金融反诈图谱的探索,以往大家总是想去定义图谱这个概念,但其实再先进的算法,都要融合业务逻辑进行一个定义。想要出实际业务效果,会涉及到一些问题。在整体数据探索中,尤其是对数据的筛选,欺诈标签的定义,这些都是我们首先要面对的过程。在这个过程中,对每个社团每个团伙的社会属性分析也非常重要。

step 2:设计关联关系

这个标准有了之后要在图谱设计出关联关系。我们会精细挑选什么样的节点可以入图,但这些节点不是越多越好。虽然图谱的数据库能力在不断增加,悦数图数据库 的数据库性能也是非常的强悍,但从邦盛科技在对银行的应用实践中发现,数据体量很大的情况下,如果增加节点,边和属性同步也会带来很大的增长,实际应用中展现过多点边以及过多的关系维度,会造成业务人员在图的可视化查询和落地方面使用不便,所以我们认为需要结合金融机构,尤其是银行的实际业务场景去定义图谱的点边关系。

step 3:建立单维度规则

这个过程中挑选其实非常考验经验的,在大量的单维度规则中,需要把团伙标签点边关系定义好。我们做了非常多的单维度图规则,主要从共性关联、重合度、集中度、资金流向等几个方面来思考。

step 4:建立多维度规则

做出单维图规则之后,我们更多要考虑的是如何建立多维度规则,并服务于我们的业务。这里面挑选合适的指标需要非常强的业务经验,才能做到。通过我们之前建立的单维度规则,结合特征重要性的程度,同时结合业务上的考量因素,我们会做交叉组合及后续的规则分析。

step 5:数据建模

与传统的反欺诈不同,传统反欺诈主要考虑统计类指标,如金额、时间等特征,我们通过引入关联图谱,增加了关系维度,这是传统反欺诈所很少考虑的因素,从效果上看,明显优于传统反欺诈效果。对银行而言,核查人员通过可视化的分析手段分析业务中的团伙欺诈手法,从而来总结出关键特征,不仅分析了最新的欺诈手法,还可以对一些专业规则做调优。

我们讲这些比较宽泛,但在银行实践过程中,我们还会使用很多模型和决策方式,这是我们整个项目做的一些事情。

项目效果

从这家银行最终的项目效果上来看,我们最终是帮助行方欺诈率显著降低,辅助业务有了创新发展,黑样本发现也在出现了几倍的效果提升。

通过这个项目我们也更多地去考量图谱怎么和专家经验结合开发图规则,继而丰富模型——这也是目前服务这个行业,考虑客户体验的同时,满足监管要求,达到行方欺诈风险监控的一种较好的办法。

邦盛公司简介

公司背景

最后简单介绍一下我们公司——邦盛是成立于 2010 年,将近 12 年间一直专注于做技术的研发和实践。当时在 2010 年到 2015 年时,国内自主研发的实时计算领域其实是一个空白,很多的银行、支付公司,包括一些大型的互联网金融公司,都会使用一种国外的风控系统。这时候我们也是通过底层的技术研发,走了一条自主创新的道路,然后像实时指标的计算引擎——流立方,也是获得过几个比较重磅的奖项,像中国电子学会的特等奖,还有教育部的科技进步一等奖;机器学习、关联图谱、智能决策平台,都是沿着这条道路展开的。

其实邦盛这个名字也是取自于国邦昌盛,为自己国内的金融风控安全贡献力量的意思。目前服务的客户群体也不局限于银行或三方支付等金融机构,也涉及智慧交通、信息通讯,还有政府服务部门,比如公积金机构和一些铁路、政务等民生平台。

荣誉&客户

公司的荣誉和资质——包括 50 多项发明、100 多项软著,还有目前在 CMMI5 国际上最高等级的认证,在项目交付和方案研发这几个方面做到了最高的等级。 今天分享的主题是关联图谱,但其实我们在中央级反诈、大数据智能案防、涉赌涉诈账户防控等领域都有解决方案,每个解决方案会有产品技术和业务规则模型来组成,关联图谱平台作为一个很关键的组件,在各套解决方案中都扮演着一个很重要的角色。

目前,包括 4 家国有行、12 家股银行中的 11 家,还有全国头部排名前 10 的城商行以及 70% 以上的三方支付风控市场都是我们的客户。一些政府机构也跟我们进行了深度合作,如中国移动、中国铁路 12306、各地公积金机构等都是我们服务的客群。

作为以技术起家的公司,目前我们各个核心组件也在不断迭代和更新,业务专家驻场过程中也会不断总结欺诈手法,迭代反欺诈策略——今天因为时间的关系就分享这么多,也欢迎各位老师跟我们进一步沟通交流。

logo

公司介绍

邦盛科技是专注数据实时智能处理领域技术研究的国家高新技术企业,基于核心技术“流立方”及“图立方”平台,研发了针对金融风控、网络安全、交通运输、电信通讯、政务安全等领域应用解决方案,已服务大中型企业400余家。