一种基于网络的欺诈团伙识别和风险传播预测方法

未命名 09-24 阅读:55 评论:0


1.本发明涉及金融反欺诈技术领域,具体为一种基于网络的欺诈团伙识别和风险传播预测方法。


背景技术:

2.随着互联网金融的高速发展,面向个人的贷款流程仅需客户通过web端上传填写简单资料通过审批流程即可放款,由于部分公司风控手段的薄弱以及在当前情形下对此类金融活动违约用户的法律追责还在完善中,部分人群通过各种非法手段获取贷款额度,使用额度后不再进行归还,成为公司中的永久逾期用户,给公司带来巨大的经济损失,而这些人群往往呈现出有组织的团伙的性质,即这部分人之间都存在着某种关联关系,并且这种欺诈风险还有传播的可能。因此为了识别欺诈团伙和预测欺诈风险传播本领域技术人员利用复杂网络科学技术,根据个体用户的相关资料,将相关数据抽象为连通网络中的节点和边,形成网络图,利用图论的原理知识进行欺诈团伙的识别和风险传播预测,可以有效地降低公司损失。
3.然而现有技术中,相关的技术方案存在以下缺陷:
4.首先,关于在实现目标中的基层数据结构设计方面,现存发明又采用n*n的邻接矩阵作为输入的数据结构,这种方式在大规模数据集的情况下会占用更多的服务器的内存。
5.其次,在大规模数据集的情况下,同时结合六度理论,可知仅仅通过形成网络连通图来刻画群体具有不准确性。此时形成的群体具有松散的特征,并不符合在风控反欺诈领域所寻找的具有高关联特征的欺诈团伙。
6.最后,在进行计算团伙识别和个体传播方面网络属性时,现存发明只考虑了部分网络节点属性,而单一的从网络节点自身属性去刻画团伙/群体的性质亦具有不准确性,这种不确定性表现在无法刻画群体的整体聚集情况。


技术实现要素:

7.针对现有技术的不足,本发明提供了一种基于网络的欺诈团伙识别和风险传播预测方法,目的是解决上述问题。
8.为实现上述目的,本发明提供如下技术方案:一种基于网络的欺诈团伙识别和风险传播预测方法,包括该方法包括以下步骤:
9.步骤一:获取个体属性,所述个体属性包括主体属性和非主体属性,并确定所述主体属性和非主体属性的属性值唯一编码;
10.步骤二:数据过滤,筛选出拥有两个或者两个以上主体属性值的非主体属性值以及其对应的主体属性值,作为输入数据;
11.步骤三:建立存储和计算的数据结构;
12.步骤四:建立连通图,所述主体属性值和非主体属性值抽象作为节点,并将主体属性值和非主体属性值的归属关系抽象为连接所述节点的边,所述节点和边组成连通图;
13.步骤五:根据所述连通图获取模型图;
14.步骤六:根据所述数据结构和所述模型图计算模型参数;
15.步骤七:根据所述模型参数进行欺诈团伙识别和欺诈风险传播预测。
16.优选的,所述主体属性为界定唯一个体的单一确定性属性;
17.所述非主体属性为归属于个体的非生理性的虚拟或者实物的财产。
18.优选的,所述存储和计算的数据结构是维度为n*2的数组结构。
19.优选的,所述连通图获取模型图还包括以下步骤:
20.建立第一模型图,对所述连通图中的节点进行排序并采用深度优先搜索和广度优先搜索算法在点集和边集中挖掘第一模型图;
21.建立第二模型图,根据所述第一模型图中抽取仅以主体属性值作为节点,个体之间共用非主体属性值作为连接边的网络图,作为第二模型图。
22.优选的,所述连通图获取模型图的步骤还包括:识别所述第二模型图中的完全子图。
23.优选的,所述模型参数还包括:节点度、节点桥点值、关联强度、非对称节点相似度、欺诈浓度;
24.所述欺诈浓度=团伙中已知欺诈人数/团伙大小。
25.优选的,所述欺诈团伙识别还包括以下步骤:
26.根据已知欺诈人群将所述模型图划分为不同层级的群组;
27.结合所述团伙大小、节点桥点值最大值、关联强度最大值、欺诈浓度确定每个群组的以上属性影响阈值;
28.根据所述属性影响阈值将不同的群组划分为不同等级的欺诈团伙。
29.优选的,所述欺诈风险传播预测还包括:
30.在所述模型图中识别节点之间的联系,其中至少有一个节点所在的群组为等级确定的欺诈团伙;
31.给定关联强度和非对称相似度阈值;
32.根据所述所在的群组为等级确定的欺诈团伙的节点对”其它节点进行风险传播标记。
33.优选的,所述模型参数还包括群体聚集系数。
34.优选的,所述该方法还包括根据所述群体聚集系数以及节点的桥点值识别所述模型图中的关键节点,结合所述关键节点所在群组的等级预测该节点个体为中介。
35.与现有技术相比,本发明具备以下有益效果:
36.本发明提供的一种基于网络的欺诈团伙识别和风险传播预测方法,将个体的主体属性和非主体属性抽象为节点,所获得的连通图能够明确的表示出个体与其虚拟或实体财产的关系以及个体之间全面的联系,适用于个体数量庞大的数据的处理;
37.本发明确定存储和计算的数据结构为n*2,该种数据结构相对于现有技术中的n*n邻接矩阵形式,在相同数据量的情况下更节省内存;
38.本发明根据图论的知识计算模型参数,并根据已知的欺诈用户对模型图进行分层级,从而达到准确地识别欺诈团伙和欺诈风险传播的预测目的;
39.本发明还进一步地根据群体聚集系数进行中介个体的识别确定。
附图说明
40.图1为本发明中实施例1提供的一种基于复杂网络的欺诈团伙识别和风险传播识别的方法的框架图;
41.图2为本发明中实施例1提供的第一模型图示意图;
42.图3为本发明中实施例1提供的第二模型图示意图;
43.图4为本发明中实施例1提供的节点桥点值计算示例示意图;
44.图5为本发明中实施例1提供的风险传播演示图;
45.图6为本发明中实施例2提供的完全子图示意图。
具体实施方式
46.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
47.实施例1
48.一种基于复杂网络的欺诈团伙识别和风险传播预测方法,包括以下步骤:
49.步骤一:获取个体属性,所述个体属性包括主体属性和非主体属性。主体属性为界定唯一个体的单一确定性属性,不可更改,例如个体的身份证号码;所述非主体属性为归属于个体的非生理性的虚拟或者实物的财产,可以是个体的手机号、邮箱、家庭住址、银行卡号等。
50.确定所述主体属性和非主体属性的属性值唯一编码。如下表1所示,给予身份证号和归属该身份证号的个体的非主体属性的属性值唯一编码。
51.表1
[0052][0053]
步骤二:数据过滤,筛选出拥有两个或者两个以上主体属性值的非主体属性值以及其对应的主体属性值,作为输入数据。
[0054]
步骤三:确定存储和计算的数据结构,根据所述模型图建立维度为n*2的存储和计算的数据结构。
[0055]
步骤四:建立连通图,将所述主体属性值和非主体属性值抽象为节点,将主体属性值和非主体属性值的归属关系抽象为连接所述节点的边,所述节点和边组成连通图。
[0056]
步骤五:根据所述连通图获取模型图:
[0057]
如图2所示,建立第一模型图,对节点进行排序并采用深度优先搜索和广度优先搜索算法在点集和边集中挖掘第一模型图。
[0058]
如图3所示,建立第二模型图,根据所述第一模型图中抽取仅以主体属性值作为节点,个体之间共用非主体属性值作为连接边的网络图,作为第二模型图。
[0059]
第一模型图用于确定将个体之间关联在一起的介质,第二模型图在第一模型图的基础上形成了以个体主体属性为主的网络图,这个网络图映射现实中的团伙或者群体。
[0060]
步骤六:根据所述数据结构和所述模型图计算模型参数所述模型参数包括:节点度、节点桥点值、关联强度、非对称节点相似度、欺诈浓度。
[0061]
其中,节点度为节点属性的度量,是依附在该节点的边的总数。
[0062]
节点桥点值为任意两个非该节点的最短路径通过该节点的比率和。例如,如图4所示,任意两个非a节点间的最短路径和必须经过a的最短路径个数如下:
[0063]
{(b,c):(1,1)},{(b,d):(1,1)},{(b,e):(1,0)},{(c,d):(1,1)},{(c,e):(1,1)},{(c,e):(1,1)}那么a的桥点值为(1/1)*5+(0/1),将其进行标准化{(1/1)*5+(0/1)]*2/(5-1)*(5-2)。
[0064]
关联强度为两个个体节点之间公用连接介质的个数。例如有两个节点:a:{phone:(t1,t2,t3),card(c1,c2,c3)},b:{phone:t1),则示例中a和b的关联强度为1。
[0065]
非对称节点相似度测量的是一对节点的亲密度。如前所述计算a和b之间的非对称相似度sim(a,b)=1/2*1/3*1/2,sim(b,a)=1*1*1/2。
[0066]
欺诈浓度=团伙中欺诈人数/团伙大小,所述团伙中欺诈人数为第二模型图中已知的欺诈个体数量;所述团伙大小根据第二模型图中拥有的节点个数确定。
[0067]
步骤七:根据所述模型参数进行欺诈团伙识别和欺诈风险传播预测。
[0068]
其中欺诈团伙识别包括以下步骤:
[0069]
根据已知欺诈人群将所述第二模型图划分为不同层级的群组。
[0070]
结合团伙大小、节点桥点值最大值、关联强度最大值、欺诈浓度确定每个群组的以上属性影响阈值。
[0071]
根据所述属性影响阈值将不同的群组划分为不同等级的欺诈团伙。
[0072]
欺诈风险传播预测包括以下步骤:
[0073]
在第二模型图中识别节点之间的联系,其中至少有一个节点所在的群组为等级确定的欺诈团伙。
[0074]
给定关联强度和非对称相似度阈值。
[0075]
如图5所示,根据所述所在的群组为等级确定的欺诈团伙的节点对其它节点进行风险传播标记。图5中箭头指向表示风险传播方向。
[0076]
实施例2
[0077]
一种基于复杂网络的欺诈团伙识别和风险传播预测方法,还包括以下步骤:
[0078]
步骤一:获取个体属性,所述个体属性包括主体属性和非主体属性。
[0079]
所述主体属性为界定唯一个体的单一确定性属性;所述非主体属性为归属于个体的非生理性的虚拟或者实物的财产。
[0080]
确定所述主体属性和非主体属性的属性值唯一编码。
[0081]
步骤二:数据过滤,筛选出拥有两个或者两个以上主体属性值的非主体属性值以及其对应的主体属性值,作为输入数据。
[0082]
步骤三:确定存储和计算的数据结构,根据所述模型图建立维度为n*2的存储和计算的数据结构。
[0083]
步骤四:建立连通图,将所述主体属性值和非主体属性值抽象为节点,将主体属性
值和非主体属性值的归属关系抽象为连接所述节点的边,所述节点和边组成连通图。
[0084]
步骤五:根据连通图获取模型图。
[0085]
建立第一模型图,对节点进行排序并采用深度优先搜索和广度优先搜索算法在点集和边集中挖掘第一模型图。
[0086]
建立第二模型图,根据所述第一模型图中抽取仅以主体属性值作为节点,个体之间共用非主体属性值作为连接边的网络图,作为第二模型图。
[0087]
识别所述第二模型图中的完全子图,如图6所示,圈中为完全子图。
[0088]
当连通图规模较大的时候,在第二模型图中寻找完全子图,采取根据完全子图进行模型参数计算。
[0089]
步骤六:根据所述数据结构和所述模型图计算模型参数,所述模型参数包括:节点度、节点桥点值、关联强度、非对称节点相似度、群体聚集系数、欺诈浓度。所述欺诈浓度=团伙中已知欺诈人数/团伙大小。所述群体聚集系数c的计算公式如下所示:
[0090][0091]
其中ci为节点的聚集系数。
[0092][0093]
其中ki为节点i的度,ei为节点i连接的边之间相互连接的边的数目。
[0094]
步骤七:根据所述模型参数进行欺诈团伙识别、欺诈风险传播预测和中介个体预测。
[0095]
所述欺诈团伙识别包括以下步骤:
[0096]
根据已知欺诈人群将所述第二模型图划分为不同层级的群组。
[0097]
结合团伙大小、节点桥点值最大值、关联强度最大值、欺诈浓度确定每个群组的以上属性影响阈值。
[0098]
根据所述属性影响阈值将不同的群组划分为不同等级的欺诈团伙。
[0099]
所述欺诈风险传播预测包括:
[0100]
在第二模型图中识别节点之间的联系,其中至少有一个节点所在的群组为等级确定的欺诈团伙。
[0101]
给定关联强度和非对称相似度阈值。
[0102]
根据所述所在的群组为等级确定的欺诈团伙的节点对其它节点进行风险传播标记。
[0103]
中介个体预测包括:根据所述群体聚集系数以及节点的桥点值识别第二模型图中的关键节点,结合所述关键节点所在群组的等级预测该节点个体为中介。群体聚集系数介于0到1之间,群体聚集系数越大表示该节点与其他节点的关联性越高,成为中介的可能性越高。
[0104]
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
[0105]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实
体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0106]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:
1.一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,该方法包括以下步骤:步骤一:获取个体属性,所述个体属性包括主体属性和非主体属性,并确定所述主体属性和非主体属性的属性值唯一编码;步骤二:数据过滤,筛选出拥有两个或者两个以上主体属性值的非主体属性值以及其对应的主体属性值,作为输入数据;步骤三:建立存储和计算的数据结构;步骤四:建立连通图,所述主体属性值和非主体属性值抽象作为节点,并将主体属性值和非主体属性值的归属关系抽象为连接所述节点的边,所述节点和边组成连通图;步骤五:根据所述连通图获取模型图;步骤六:根据所述数据结构和所述模型图计算模型参数;步骤七:根据所述模型参数进行欺诈团伙识别和欺诈风险传播预测。2.根据权利要求1所述的一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,所述主体属性为界定唯一个体的单一确定性属性;所述非主体属性为归属于个体的非生理性的虚拟或者实物的财产。3.根据权利要求1所述的一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,所述存储和计算的数据结构是维度为n*2的数组结构。4.根据权利要求1所述的一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,所述连通图获取模型图还包括以下步骤:建立第一模型图,对所述连通图中的节点进行排序并采用深度优先搜索和广度优先搜索算法在点集和边集中挖掘第一模型图;建立第二模型图,根据所述第一模型图中抽取仅以主体属性值作为节点,个体之间共用非主体属性值作为连接边的网络图,作为第二模型图。5.根据权利要求4所述的一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,所述连通图获取模型图的步骤还包括:识别所述第二模型图中的完全子图。6.根据权利要求1所述的一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,所述模型参数还包括:节点度、节点桥点值、关联强度、非对称节点相似度、欺诈浓度;所述欺诈浓度=团伙中已知欺诈人数/团伙大小。7.根据权利要求6所述的一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,所述欺诈团伙识别还包括以下步骤:根据已知欺诈人群将所述模型图划分为不同层级的群组;结合所述团伙大小、节点桥点值最大值、关联强度最大值、欺诈浓度确定每个群组的以上属性影响阈值;根据所述属性影响阈值将不同的群组划分为不同等级的欺诈团伙。8.根据权利要求1所述的一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,所述欺诈风险传播预测还包括:在所述模型图中识别节点之间的联系,其中至少有一个节点所在的群组为等级确定的欺诈团伙;给定关联强度和非对称相似度阈值;
根据所述所在的群组为等级确定的欺诈团伙的节点对”其它节点进行风险传播标记。9.根据权利要求6所述的一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,所述模型参数还包括群体聚集系数。10.根据权利要求9所述的一种基于网络的欺诈团伙识别和风险传播预测方法,其特征在于,所述该方法还包括根据所述群体聚集系数以及节点的桥点值识别所述模型图中的关键节点,结合所述关键节点所在群组的等级预测该节点个体为中介。

技术总结
本发明公开了一种基于网络的欺诈团伙识别和风险传播预测方法,包括步骤一:获取个体属性;步骤二:数据过滤,筛选出拥有两个或者两个以上主体属性值的非主体属性值以及其对应的主体属性值:步骤三:建立存储和计算的数据结构;步骤四:建立连通图;步骤五:根据所述连通图获取模型图;步骤六:根据所述数据结构和所述模型图计算模型参数;步骤七:根据所述模型参数进行欺诈团伙识别和欺诈风险传播预测。本发明提供的一种基于网络的欺诈团伙识别和风险传播预测方法,根据图论的知识计算模型参数,并根据已知的欺诈用户对模型图进行分层级,从而达到准确地识别欺诈团伙和欺诈风险传播的预测目的。播的预测目的。播的预测目的。


技术研发人员:雷雨
受保护的技术使用者:襄阳职业技术学院
技术研发日:2023.07.06
技术公布日:2023/9/22
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐