一种欺诈检测方法、系统、电子设备及介质

未命名 09-29 阅读:98 评论:0


1.本发明涉及欺诈检测领域,特别是涉及一种欺诈检测方法、系统、电子设备及介质。


背景技术:

2.随着近些年来互联网的高速发展,在贸易、社交和娱乐等领域提供了许多的便利,例如电子商务、社交网络与娱乐软件。
3.过去研究者们通过统计学来进行传统的欺诈检测,随着深度学习的发展,研究者们开始将深度学习与欺诈检测结合在一起,近些年来,图神经网络的发展使得图欺诈检测在学术界和工业界受到了广泛的关注。通过将用户视为网络中的节点,交互行为视为节点间的连边,从而反映交易行为来进行欺诈检测。
4.然而传统的gnn都是基于同质性假设而设计的模型,忽略异质性的特点,在现实复杂网络中,欺诈节点往往趋于与正常节点发生交互行为,这使得节点的表示不理想,从而导致不能准确进行欺诈检测。


技术实现要素:

5.本发明的目的是提供一种欺诈检测方法、系统、电子设备及介质,以提高欺诈检测的准确性。
6.为实现上述目的,本发明提供了如下方案:
7.一种欺诈检测方法,包括:
8.获取待检数据集;所述待检数据集包括节点组、节点组中节点对应的初始节点特征和多个连边;所述节点组包括一个待检目标节点和多个邻居节点;一个节点对应一个交易用户;所述连边为交易用户间的交互行为;
9.根据所述待检目标节点的初始节点特征和所述邻居节点的初始节点特征,利用第一多层感知机,确定所述待检目标节点和每个所述邻居节点连边的关系得分;所述第一多层感知机是利用dgraph数据集对第一初始多层感知机进行训练得到的;
10.根据所述关系得分,确定所述待检目标节点和每个所述邻居节点连边的连边属性;所述连边属性为同质连边或者异质连边;
11.基于所述连边属性,利用图变换器对所述待检目标节点的初始节点特征和所有所述邻居节点的初始节点特征进行聚合,得到待检目标节点的聚合特征;
12.根据所述聚合特征和所述待检目标节点的初始节点特征,利用第二多层感知机,确定所述待检目标节点的最终特征;第二多层感知机是利用dgraph数据集对第二初始多层感知机进行训练得到的;
13.根据所述最终特征,利用第三多层感知机,确定所述待检目标节点的类型标签;第三多层感知机是利用dgraph数据集对第三初始多层感知机进行训练得到的;
14.基于所述待检目标节点的类型标签确定所述交易用户的类型;所述类型为非欺诈
用户或者欺诈用户。
15.可选地,所述第一多层感知机、所述第二多层感知机和所述第三多层感知机的训练过程,具体包括:
16.获取所述dgraph数据集;
17.基于所述dgraph数据集,生成训练同构图;所述训练同构图包括节点集合、节点特征集合、连边集合和标签集合;所述节点集合包括欺诈节点和非欺诈节点;所述节点特征集合包括任一节点的初始节点特征;所述标签集合包括节点标签集合和连边标签集合;
18.将所述节点集合中任一节点作为目标节点,针对任一目标节点:
19.根据所述目标节点的初始节点特征和非目标节点的初始节点特征,利用第一初始多层感知机,确定所述目标节点和每个所述非目标节点连边的初始关系得分;所述非目标节点为所述节点集合中除目标节点之外的节点;
20.对所述初始关系得分进行更新,得到更新后的关系得分;
21.根据所述更新后的关系得分以及对应的连边标签,确定关系得分损失;
22.确定全局正常节点特征和全局欺诈节点特征;所述全局正常节点特征为所有非欺诈节点的初始节点特征的平均值;所述全局欺诈节点特征为所有欺诈节点的初始节点特征的平均值;
23.确定所述目标节点的最终嵌入特征分别与所述全局正常节点特征和所述全局欺诈节点特征的全局正常距离和全局欺诈距离;所述全局正常距离为所述目标节点的最终嵌入特征与所述全局正常节点特征的二范数;所述全局欺诈距离为所述目标节点的最终嵌入特征与所述全局欺诈节点特征的二范数;
24.将所述全局正常距离与所述全局欺诈距离进行拼接,得到全局节点特征;
25.将所述全局节点特征输入至第四初始多层感知机,得到第四预测节点类型;
26.根据所述第四预测节点类型与对应的节点标签,确定全局属性损失;
27.根据所述更新后的关系得分和关系得分阈值,预测所述目标节点与任一所述非目标节点的连边属性;
28.基于所述连边属性,利用图变换器对所述目标节点的初始节点特征和所有所述邻居节点的初始节点特征进行聚合,得到目标节点的聚合特征;
29.根据所述目标节点的聚合特征和所述目标节点的初始节点特征,利用第二初始多层感知机,确定所述目标节点的最终特征;
30.根据所述目标节点的最终特征,利用第三初始多层感知机,确定所述目标节点的类型标签;
31.根据所述目标节点的类型标签和对应的节点标签,确定节点分类损失;
32.根据所述关系得分损失、所述全局属性损失和所述节点分类损失,确定总损失;
33.若所述总损失满足预设条件,则训练结束,将具有当前第一模型参数的第一初始多层感知机作为所述第一多层感知机,具有当前第二模型参数的第二初始多层感知机作为所述第二多层感知机,具有当前第三模型参数的第三初始多层感知机作为所述第三多层感知机;所述预设条件为所述总损失小于预设损失阈值或者达到最大训练次数;
34.若所述总损失不满足预设条件,则根据所述总损失更新所述第一初始多层感知机的第一模型参数、所述第二初始多层感知机的第二模型参数、所述第三初始多层感知机的
第三模型参数和所述第四初始多层感知机的第四模型参数。
35.可选地,对所述初始关系得分进行更新,得到更新后的关系得分,具体包括:
36.确定所述目标节点的行为周期以及所述目标节点的邻居节点的行为周期;
37.根据所述目标节点的行为周期和所述邻居节点的行为周期,确定所述目标节点的时间密度;
38.根据所述目标节点的时间密度,确定所述目标节点的时间密度得分;
39.根据所述时间密度得分,更新所述初始关系得分,得到更新后的关系得分。
40.可选地,确定所述目标节点的行为周期,具体包括:
41.利用公式确定目标节点的行为周期;表示目标节点最后一次交互的时间戳,表示目标节点第一次交互的时间戳,表示目标节点的出度。
42.可选地,根据所述目标节点的行为周期和所述邻居节点的行为周期,确定所述目标节点的时间密度,具体包括:
43.利用公式确定所述目标节点的时间密度;其中,表示为目标节点的所有邻居节点,表示邻居节点j,表示邻居节点的行为周期。
44.可选地,根据所述目标节点的时间密度,确定所述目标节点的时间密度得分,具体包括:
45.利用公式确定所述目标节点的时间密度得分;其中,表示所述目标节点的时间密度,表示邻居节点的时间密度。
46.可选地,根据所述时间密度得分,更新所述初始关系得分,得到更新后的关系得分,具体包括:
47.利用公式利用公式确定更新后的关系得分;其中,为所述初始关系得分,为所述时间密度得分,δ为预设超参数阈值。
48.一种欺诈检测系统,包括:
49.数据获取模块,用于获取待检数据集;所述待检数据集包括节点组、节点组中节点对应的初始节点特征和多个连边;所述节点组包括一个待检目标节点和多个邻居节点;一个节点对应一个交易用户;所述连边为交易用户间的交互行为;
50.关系得分确定模块,用于根据所述待检目标节点的初始节点特征和所述邻居节点的初始节点特征,利用第一多层感知机,确定所述待检目标节点和每个所述邻居节点连边的关系得分;所述第一多层感知机是利用dgraph数据集对第一初始多层感知机进行训练得
到的;
51.连边属性确定模块,用于根据所述关系得分,确定所述待检目标节点和每个所述邻居节点连边的连边属性;所述连边属性为同质连边或者异质连边;
52.聚合模块,用于基于所述连边属性,利用图变换器对所述待检目标节点的初始节点特征和所有所述邻居节点的初始节点特征进行聚合,得到待检目标节点的聚合特征;
53.最终节点特征确定模块,用于根据所述聚合特征和所述待检目标节点的初始节点特征,利用第二多层感知机,确定所述待检目标节点的最终特征;第二多层感知机是利用dgraph数据集对第二初始多层感知机进行训练得到的;
54.分类模块,用于根据所述最终特征,利用第三多层感知机,确定所述待检目标节点的类型标签;第三多层感知机是利用dgraph数据集对第三初始多层感知机进行训练得到的;
55.欺诈用户确定模块,用于基于所述待检目标节点的类型标签确定所述交易用户的类型;所述类型为非欺诈用户或者欺诈用户。
56.一种电子设备,包括:存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行上述的欺诈检测方法。
57.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的欺诈检测方法。
58.根据本发明提供的具体实施例,本发明公开了以下技术效果:
59.本发明的欺诈检测方法、系统、电子设备及介质,首先判断有节点-边-节点三元组的关系是同质还是异质的,通过标签感知,时间密度与全局节点属性对关系得分进行计算,再由强化学习得出的关系阈值对连边进行定性。最后与graph transformer相结合,将同质性与异质性的连边分别进行正向与负向聚合,从而达到偏向同质性的正常节点与邻居节点更为相似,而偏向异质性的欺诈节点与邻居节点更为不同,来获得更准确的欺诈检测结果。
附图说明
60.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
61.图1为本发明提供的欺诈检测方法流程图;
62.图2为本发明的欺诈检测框架训练流程图;
63.图3为本发明的欺诈检测框架结构图;
64.图4为节点v1的欺诈行为判断示意图。
具体实施方式
65.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
66.本发明的目的是提供一种欺诈检测方法、系统、电子设备及介质,以提高欺诈检测的准确性。涉及欺诈检测和深度学习技术领域,可应用于金融、社交网络中的欺诈检测等具体领域。
67.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
68.如图1所示,本发明提供的欺诈检测方法,包括:
69.步骤101:获取待检数据集;所述待检数据集包括节点组、节点组中节点对应的初始节点特征和多个连边;所述节点组包括一个待检目标节点和多个邻居节点;一个节点对应一个交易用户;所述连边为交易用户间的交互行为。
70.步骤102:根据所述待检目标节点的初始节点特征和所述邻居节点的初始节点特征,利用第一多层感知机,确定所述待检目标节点和每个所述邻居节点连边的关系得分;所述第一多层感知机是利用dgraph数据集对第一初始多层感知机进行训练得到的。
71.步骤103:根据所述关系得分,确定所述待检目标节点和每个所述邻居节点连边的连边属性;所述连边属性为同质连边或者异质连边。
72.步骤104:基于所述连边属性,利用图变换器对所述待检目标节点的初始节点特征和所有所述邻居节点的初始节点特征进行聚合,得到待检目标节点的聚合特征。
73.步骤105:根据所述聚合特征和所述待检目标节点的初始节点特征,利用第二多层感知机,确定所述待检目标节点的最终特征;第二多层感知机是利用dgraph数据集对第二初始多层感知机进行训练得到的。
74.步骤106:根据所述最终特征,利用第三多层感知机,确定所述待检目标节点的类型标签;第三多层感知机是利用dgraph数据集对第三初始多层感知机进行训练得到的。
75.步骤107:基于所述待检目标节点的类型标签确定所述交易用户的类型;所述类型为非欺诈用户或者欺诈用户。
76.本发明提出了一种同质与异质感知的graph transformer欺诈检测框架,通过节点属性与领域知识为连边计算关系得分,再配合由强化学习实时更新的阈值判断连边为同质边或异质边,最后通过与graphtransformer相结合以同时聚合邻域同质与异质信息,得到最终的节点嵌入表示。
77.作为一种可选地实施方式,如图2所示,所述第一多层感知机、所述第二多层感知机和所述第三多层感知机的训练过程,具体包括:
78.步骤1:获取训练同构图结构训练集与训练集中节点特征矩阵表示。具体过程为:
79.获取所述dgraph数据集;下载信也科技公布的dgraph数据集作为训练集,训练集一共包括3700550个节点,4300999条边和1225601个标签。
80.基于所述dgraph数据集,生成训练同构图;所述训练同构图包括节点集合、节点特征集合、连边集合和标签集合;所述节点集合包括欺诈节点和非欺诈节点;所述节点特征集合包括任一节点的初始节点特征;所述标签集合包括节点标签集合和连边标签集合。
81.在实际应用中,将图定义为其中其中表示训练同构图中所有节点的集合。表示图中所有节点特征的集合。其中表示节点i的特征,且其特征的维度为d。ε为训练同构图中所有连边的集合,e
i,j

ε表示节点与节点之间存在一条连边。表示图中所有节点标签的集合。在中,每个节点的标签为0或1,0为正常用户(非欺诈用户),1为欺诈用户。
82.步骤2:通过连边两端节点属性(初始节点特征)与标签感知得分来计算连边的初始关系得分。具体过程如下:
83.将所述节点集合中任一节点作为目标节点,针对任一目标节点:
84.根据所述目标节点的初始节点特征和非目标节点的初始节点特征,利用第一初始多层感知机,确定所述目标节点和每个所述非目标节点连边的初始关系得分;所述非目标节点为所述节点集合中除目标节点之外的节点。
85.在实际应用中,采用标签感知评分计算连边的初始关系得分,通过第一初始多层感知机(多层感知机,multilayerperceptron,mlp)作为节点标签预测器,并将两个节点标签预测结果的l2距离作为相似性度量。对于第l层下节点和节点的连边e,它的初始关系得分为计算公式为:
[0086][0087]
其中,表示节点在第l层的节点嵌入表示,表示节点在第l层的节点嵌入表示。mlp
l
表示第l层的mlp。σ表示为非线性激活函数,此处为sigmoid函数。mlp1的输入为节点的原始特征(初始节点特征),此后的输入为前一层输出的节点嵌入表示。
[0088]
对所述初始关系得分进行更新,得到更新后的关系得分,具体步骤如步骤3。
[0089]
步骤3:根据节点的行为周期计算节点的时间密度,将连边两端节点的时间密度差的绝对值作为连边的时间密度得分,并更新步骤2中的初始关系得分。具体过程如下:
[0090]
(3-1)计算目标节点的行为周期:使用来表示目标节点的行为周期。定义为:
[0091][0092]
其中,表示目标节点最后一次交互的时间戳,表示目标节点第一次交互的时间戳,表示目标节点的出度。
[0093]
(3-2)计算目标节点的时间密度:
[0094]
使用来表示目标节点的时间密度。定义为:
[0095][0096]
其中,表示为目标节点的所有邻居节点,表示邻居节点j,表示邻居节点的行为周期。
[0097]
(3-3)计算时间密度得分:时间密度得分可以表述为:
[0098][0099]
(3-4)更新步骤(2)中的关系得分:利用时间密度得分来对初始的关系得分进行修正,其公式为:公式为:
[0100]
其中,δ为预定义的超参阈值。
[0101]
根据所述更新后的关系得分以及对应的连边标签,确定关系得分损失,具体如步骤4。
[0102]
步骤4:根据连边的训练集标签与关系得分计算其关系得分损失。具体过程如下:
[0103]
通过添加损失来学习关系得分的计算,为了能够更好地学习异质连边信息,将损失定义为:
[0104][0105]
其中,σ为非线性激活函数,此处为relu函数。δ为大于0的超参数,表示连边e的标签,同质边为1,异质边为-1,当连边为同质边时,它的关系得分越小,则其损失越大,当连边为异质边时,它的关系得分越大,则损失越大,同时通过δ可以更好地关注异质连边的损失。
[0106]
确定全局正常节点特征和全局欺诈节点特征;所述全局正常节点特征为所有非欺诈节点的初始节点特征的平均值;所述全局欺诈节点特征为所有欺诈节点的初始节点特征的平均值。具体如步骤5。
[0107]
步骤5:分别计算当前训练批次中的全局正常节点特征与全局欺诈节点特征。具体过程如下:
[0108]
将当前批次中的的训练集中所有正常节点的平均特征作为全局正常节点特征,所有欺诈节点的平均特征作为全局欺诈节点特征。将全局正常节点特征与全局欺诈节点特征分别定义为和
[0109]
确定所述目标节点的最终嵌入特征分别与所述全局正常节点特征和所述全局欺诈节点特征的全局正常距离和全局欺诈距离;所述全局正常距离为所述目标节点的最终嵌入特征与所述全局正常节点特征的二范数;所述全局欺诈距离为所述目标节点的最终嵌入特征与所述全局欺诈节点特征的二范数。
[0110]
将所述全局正常距离与所述全局欺诈距离进行拼接,得到全局节点特征。
[0111]
将所述全局节点特征输入至第四初始多层感知机,得到第四预测节点类型。
[0112]
根据所述第四预测节点类型与对应的节点标签,确定全局属性损失,具体如步骤6。
[0113]
步骤6:计算节点特征与全局正常和欺诈节点特征的二范数,拼接后输入到分类器(第四初始多层感知机)中,将分类结果与训练集标签对比,计算全局属性损失。具体过程如下:
[0114]
分别计算每个节点与全局正常和欺诈节点特征的l2 distance作为全局正常距离
与全局欺诈距离,将二者拼接后作为全局节点特征的嵌入结果,最后再通过最小化交叉熵损失来进行优化:
[0115][0116][0117][0118][0119]
其中,表示节点的最终嵌入特征,表示当前epoch(轮次)的第l个batch(批次)中的所有欺诈节点,表示当前epoch的第l个batch中的所有正常节点。为拼接操作。l
ga
是最终的全局属性损失。
[0120]
步骤7:基于强化学习自适应调整用于判断同质与异质边的关系得分阈值。具体过程如下:
[0121]
使用异质边占总连边数的百分比pe来作为阈值。通过设计一个二元随机奖励,根据两个连续epoch的平均预测异质边占比来使用即时奖励更新动作。将第e个epoch的平均预测异质边占比定义如下:
[0122][0123]
表示在第e个epoch,训练集中所有连边关系得分小于se的连边数量,表示在第e个epoch,训练集中所有连边关系得分大于等于se的连边数量。
[0124]
第e个epoch的奖励定义为:
[0125][0126]
其中,αe表示在pe上加减的一个超参数;当大于时,则奖励为正,此时对pe进行增加αe的操作。反之,则对pe进行减少αe的操作。最后,将终止条件定义如下:
[0127][0128]
当满足终止条件后,就将pe进行固定。
[0129]
根据所述更新后的关系得分和关系得分阈值,预测所述目标节点与任一所述非目标节点的连边属性。具体如下:
[0130]
根据pe与连边排序后的得分,可以得到关系得分阈值se,所有低于关系得分se的都视为异质连边,反之则为同质连边。预测的连边关系表示为如果为同质则为1,反之则为-1。
[0131]
基于所述连边属性,利用图变换器对所述目标节点的初始节点特征和所有所述邻居节点的初始节点特征进行聚合,得到目标节点的聚合特征。
[0132]
根据所述目标节点的聚合特征和所述目标节点的初始节点特征,利用第二初始多层感知机,确定所述目标节点的最终特征,具体如步骤8。
[0133]
步骤8:将目标节点的初始节点特征及其邻居节点的初始节点特征输入到graph transformer(图变换器)中,根据连边的关系得分与关系得分阈值分别进行同质聚合与异质聚合,获取节点的特征表示。具体过程如下:
[0134]
通过节点表示其query(查询),key(键),value(值)向量矩阵,公式如下:
[0135][0136]
其中,l表示第l层gnn,h表示多头注意力机制中注意力头的数量,w和b为可学习参数。计算节点i与节点j在第l层的第h个注意力头的注意力权重公式如下:
[0137][0138]
其中,d为注意力头的维度,目的是为了防止相似度过大导致梯度消失。接下来通过多头注意力机制与邻域对节点进行聚合表示:
[0139][0140]
其中,预测的连边关系表示为最后与目标节点的初始节点特征进行拼接并通过单层mlp(第二初始多层感知机)输出后作为最终的节点表示(最终特征):
[0141][0142]
根据所述目标节点的最终特征,利用第三初始多层感知机,确定所述目标节点的类型标签。
[0143]
根据所述目标节点的类型标签和对应的节点标签,确定节点分类损失。
[0144]
根据所述关系得分损失、所述全局属性损失和所述节点分类损失,确定总损失,具体如步骤9。
[0145]
步骤9:将节点特征表示(目标节点的最终特征)输入到分类器(第三初始多层感知机)中分类,与训练集标签对比计算总体损失函数。将关系得分损失,全局属性损失与节点分类损失之和作为总体损失。具体过程如下:
[0146]
(9-1)对节点特征表示进行分类并计算节点分类损失:将节点的最终嵌入表示(目标节点的最终特征)输入mlp分类器(第三初始多层感知机)中得到最终的分类结果,并通过最小化交叉熵损失来进行优化,将节点分类损失定义为:
[0147][0148]
其中,为mlp分类器的结果。
[0149]
(9-2)将关系得分损失,全局属性损失与节点分类损失之和作为总体损失:
[0150][0151]
其中,λ
rs
和λ
ga
为加权参数。
[0152]
若所述总损失满足预设条件,则训练结束,将具有当前第一模型参数的第一初始多层感知机作为所述第一多层感知机,具有当前第二模型参数的第二初始多层感知机作为所述第二多层感知机,具有当前第三模型参数的第三初始多层感知机作为所述第三多层感知机;所述预设条件为所述总损失小于预设损失阈值或者达到最大训练次数;
[0153]
若所述总损失不满足预设条件,则根据所述总损失更新所述第一初始多层感知机的第一模型参数、所述第二初始多层感知机的第二模型参数、所述第三初始多层感知机的第三模型参数和所述第四初始多层感知机的第四模型参数。具体如步骤10。
[0154]
步骤10:若本轮测试的准确率较上轮提高大于0.1%或者达到训练次数上限,则欺诈检测框架训练完毕;否则,根据分类结果和损失函数继续更新模型超参数并训练。具体过程如下:
[0155]
将训练次数上限设置为η。计算本轮训练结果中对于正常与欺诈节点的预测准确率,当训练次数到达上限η或者本轮训练准确率较上一轮提高小于0.1%时,该欺诈检测框架训练结束,否则根据损失函数继续更新模型超参数并训练模型。
[0156]
实验说明及结果:训练集与测试集均为信也科技公布的dgraph数据集。数据集一共包括3700550个节点,4300999条边和1225601个标签。训练集与测试集的比例为3比7。表1显示不同的训练方法在测试集上的对比结果。其中,指标auc通过排序所有正常与欺诈者的预测概率来进行计算。recall-macro表示正常与欺诈者recall的平均值。f1-macro表示正常与欺诈者f1得分的平均值。gcn,gat与graphsage作为传统的gnn,他们仅仅只对邻域节点进行聚合,gat采用了注意力机制,graphsage对邻域节点进行了随机采样。care-gnn与pc-gnn分别采用对过滤邻居节点与标签平衡采样器从而试图解决欺诈伪装问题。amnet通过注意力机制融合低频与高频信息学习节点表示。dagnn设计差异增强路径与相似增强路径,增大同质节点的相似性与异质节点的差异性来进行欺诈检测。本发明方法通过连边关系评分机制与阈值强化学习来判断连边的关系,再通过graph transformer同时聚合目标节点邻域的同质与异质信息进行节点的表示。可以看出,本发明方法在所有指标上,几乎都达到了最佳性能。
[0157]
表1测试结果统计表
[0158][0159]
如图3所示,为hhagt的整体框架(欺诈检测框架)结构图。首先通过关系评分模块计算连接的关系评分,结合阈值自适应中的关系评分和关系阈值进行连边识别。最后,利用graph transformer对同质和异质信息进行聚合,实现欺诈检测。
[0160]
如图4所示,在dgraph数据集中,为了判断目标节点是否为欺诈节点:
[0161]
对于目标节点在获得节点特征x1后,分别计算它与其邻居节点特征的关系得分ls。
[0162]
根据目标节点与其邻居节点的原始特征信息,分别计算目标节点的时间密度与其邻居节点的时间密度,将节点对的时间密度差的绝对值作为连边的时间密度得分tds,利用时间密度得分来对初始的关系得分进行修正。
[0163]
最后将节点特征x1及其邻居节点特征输入到graph transformer中,根据连边的关系得分与强化学习获得的关系得分阈值分别进行同质聚合与异质聚合,获取节点的特征表示
[0164]
最后利用输入到分类器中对节点进行欺诈分类。
[0165]
本发明所述方法通过计算连边的关系得分来判断连边性质,再通过graph transformer自适应地聚合邻近区域同质与异质信息,从而有效缓解欺诈伪装问题,提高欺诈检测的准确性。
[0166]
实施例二
[0167]
为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种欺诈检测系统,包括:
[0168]
数据获取模块,用于获取待检数据集;所述待检数据集包括节点组、节点组中节点对应的初始节点特征和多个连边;所述节点组包括一个待检目标节点和多个邻居节点;一个节点对应一个交易用户;所述连边为交易用户间的交互行为。
[0169]
关系得分确定模块,用于根据所述待检目标节点的初始节点特征和所述邻居节点
的初始节点特征,利用第一多层感知机,确定所述待检目标节点和每个所述邻居节点连边的关系得分;所述第一多层感知机是利用dgraph数据集对第一初始多层感知机进行训练得到的。
[0170]
连边属性确定模块,用于根据所述关系得分,确定所述待检目标节点和每个所述邻居节点连边的连边属性;所述连边属性为同质连边或者异质连边。
[0171]
聚合模块,用于基于所述连边属性,利用图变换器对所述待检目标节点的初始节点特征和所有所述邻居节点的初始节点特征进行聚合,得到待检目标节点的聚合特征。
[0172]
最终节点特征确定模块,用于根据所述聚合特征和所述待检目标节点的初始节点特征,利用第二多层感知机,确定所述待检目标节点的最终特征;第二多层感知机是利用dgraph数据集对第二初始多层感知机进行训练得到的。
[0173]
分类模块,用于根据所述最终特征,利用第三多层感知机,确定所述待检目标节点的类型标签;第三多层感知机是利用dgraph数据集对第三初始多层感知机进行训练得到的。
[0174]
欺诈用户确定模块,用于基于所述待检目标节点的类型标签确定所述交易用户的类型;所述类型为非欺诈用户或者欺诈用户。
[0175]
实施例三
[0176]
本发明提供了一种电子设备,包括:存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行实施例一的欺诈检测方法。
[0177]
实施例四
[0178]
本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现实施例一的欺诈检测方法。
[0179]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0180]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.一种欺诈检测方法,其特征在于,包括:获取待检数据集;所述待检数据集包括节点组、节点组中节点对应的初始节点特征和多个连边;所述节点组包括一个待检目标节点和多个邻居节点;一个节点对应一个交易用户;所述连边为交易用户间的交互行为;根据所述待检目标节点的初始节点特征和所述邻居节点的初始节点特征,利用第一多层感知机,确定所述待检目标节点和每个所述邻居节点连边的关系得分;所述第一多层感知机是利用dgraph数据集对第一初始多层感知机进行训练得到的;根据所述关系得分,确定所述待检目标节点和每个所述邻居节点连边的连边属性;所述连边属性为同质连边或者异质连边;基于所述连边属性,利用图变换器对所述待检目标节点的初始节点特征和所有所述邻居节点的初始节点特征进行聚合,得到待检目标节点的聚合特征;根据所述聚合特征和所述待检目标节点的初始节点特征,利用第二多层感知机,确定所述待检目标节点的最终特征;第二多层感知机是利用dgraph数据集对第二初始多层感知机进行训练得到的;根据所述最终特征,利用第三多层感知机,确定所述待检目标节点的类型标签;第三多层感知机是利用dgraph数据集对第三初始多层感知机进行训练得到的;基于所述待检目标节点的类型标签确定所述交易用户的类型;所述类型为非欺诈用户或者欺诈用户。2.根据权利要求1所述的欺诈检测方法,其特征在于,所述第一多层感知机、所述第二多层感知机和所述第三多层感知机的训练过程,具体包括:获取所述dgraph数据集;基于所述dgraph数据集,生成训练同构图;所述训练同构图包括节点集合、节点特征集合、连边集合和标签集合;所述节点集合包括欺诈节点和非欺诈节点;所述节点特征集合包括任一节点的初始节点特征;所述标签集合包括节点标签集合和连边标签集合;将所述节点集合中任一节点作为目标节点,针对任一目标节点:根据所述目标节点的初始节点特征和非目标节点的初始节点特征,利用第一初始多层感知机,确定所述目标节点和每个所述非目标节点连边的初始关系得分;所述非目标节点为所述节点集合中除目标节点之外的节点;对所述初始关系得分进行更新,得到更新后的关系得分;根据所述更新后的关系得分以及对应的连边标签,确定关系得分损失;确定全局正常节点特征和全局欺诈节点特征;所述全局正常节点特征为所有非欺诈节点的初始节点特征的平均值;所述全局欺诈节点特征为所有欺诈节点的初始节点特征的平均值;确定所述目标节点的最终嵌入特征分别与所述全局正常节点特征和所述全局欺诈节点特征的全局正常距离和全局欺诈距离;所述全局正常距离为所述目标节点的最终嵌入特征与所述全局正常节点特征的二范数;所述全局欺诈距离为所述目标节点的最终嵌入特征与所述全局欺诈节点特征的二范数;将所述全局正常距离与所述全局欺诈距离进行拼接,得到全局节点特征;将所述全局节点特征输入至第四初始多层感知机,得到第四预测节点类型;
根据所述第四预测节点类型与对应的节点标签,确定全局属性损失;根据所述更新后的关系得分和关系得分阈值,预测所述目标节点与任一所述非目标节点的连边属性;基于所述连边属性,利用图变换器对所述目标节点的初始节点特征和所有所述邻居节点的初始节点特征进行聚合,得到目标节点的聚合特征;根据所述目标节点的聚合特征和所述目标节点的初始节点特征,利用第二初始多层感知机,确定所述目标节点的最终特征;根据所述目标节点的最终特征,利用第三初始多层感知机,确定所述目标节点的类型标签;根据所述目标节点的类型标签和对应的节点标签,确定节点分类损失;根据所述关系得分损失、所述全局属性损失和所述节点分类损失,确定总损失;若所述总损失满足预设条件,则训练结束,将具有当前第一模型参数的第一初始多层感知机作为所述第一多层感知机,具有当前第二模型参数的第二初始多层感知机作为所述第二多层感知机,具有当前第三模型参数的第三初始多层感知机作为所述第三多层感知机;所述预设条件为所述总损失小于预设损失阈值或者达到最大训练次数;若所述总损失不满足预设条件,则根据所述总损失更新所述第一初始多层感知机的第一模型参数、所述第二初始多层感知机的第二模型参数、所述第三初始多层感知机的第三模型参数和所述第四初始多层感知机的第四模型参数。3.根据权利要求2所述的欺诈检测方法,其特征在于,对所述初始关系得分进行更新,得到更新后的关系得分,具体包括:确定所述目标节点的行为周期以及所述目标节点的邻居节点的行为周期;根据所述目标节点的行为周期和所述邻居节点的行为周期,确定所述目标节点的时间密度;根据所述目标节点的时间密度,确定所述目标节点的时间密度得分;根据所述时间密度得分,更新所述初始关系得分,得到更新后的关系得分。4.根据权利要求3所述的欺诈检测方法,其特征在于,确定所述目标节点的行为周期,具体包括:利用公式确定目标节点的行为周期;表示目标节点最后一次交互的时间戳,表示目标节点第一次交互的时间戳,表示目标节点的出度。5.根据权利要求3所述的欺诈检测方法,其特征在于,根据所述目标节点的行为周期和所述邻居节点的行为周期,确定所述目标节点的时间密度,具体包括:利用公式确定所述目标节点的时间密度;其中,表示为目标节点的所有邻居节点,表示邻居节点j,表示邻居节点的行为周期。6.根据权利要求3所述的欺诈检测方法,其特征在于,根据所述目标节点的时间密度,
确定所述目标节点的时间密度得分,具体包括:利用公式确定所述目标节点的时间密度得分;其中,表示所述目标节点的时间密度,表示邻居节点的时间密度。7.根据权利要求3所述的欺诈检测方法,其特征在于,根据所述时间密度得分,更新所述初始关系得分,得到更新后的关系得分,具体包括:利用公式利用公式确定更新后的关系得分;其中,为所述初始关系得分,为所述时间密度得分,δ为预设超参数阈值。8.一种欺诈检测系统,其特征在于,包括:数据获取模块,用于获取待检数据集;所述待检数据集包括节点组、节点组中节点对应的初始节点特征和多个连边;所述节点组包括一个待检目标节点和多个邻居节点;一个节点对应一个交易用户;所述连边为交易用户间的交互行为;关系得分确定模块,用于根据所述待检目标节点的初始节点特征和所述邻居节点的初始节点特征,利用第一多层感知机,确定所述待检目标节点和每个所述邻居节点连边的关系得分;所述第一多层感知机是利用dgraph数据集对第一初始多层感知机进行训练得到的;连边属性确定模块,用于根据所述关系得分,确定所述待检目标节点和每个所述邻居节点连边的连边属性;所述连边属性为同质连边或者异质连边;聚合模块,用于基于所述连边属性,利用图变换器对所述待检目标节点的初始节点特征和所有所述邻居节点的初始节点特征进行聚合,得到待检目标节点的聚合特征;最终节点特征确定模块,用于根据所述聚合特征和所述待检目标节点的初始节点特征,利用第二多层感知机,确定所述待检目标节点的最终特征;第二多层感知机是利用dgraph数据集对第二初始多层感知机进行训练得到的;分类模块,用于根据所述最终特征,利用第三多层感知机,确定所述待检目标节点的类型标签;第三多层感知机是利用dgraph数据集对第三初始多层感知机进行训练得到的;欺诈用户确定模块,用于基于所述待检目标节点的类型标签确定所述交易用户的类型;所述类型为非欺诈用户或者欺诈用户。9.一种电子设备,其特征在于,包括:存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行权利要求1-7任一项所述的欺诈检测方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的欺诈检测方法。

技术总结
本发明公开一种欺诈检测方法、系统、电子设备及介质,涉及欺诈检测领域,方法包括:根据待检数据集中待检目标节点的初始节点特征和邻居节点的初始节点特征,利用第一多层感知机,确定待检目标节点和每个邻居节点连边的关系得分;根据关系得分,确定待检目标节点和每个邻居节点连边的连边属性;基于连边属性,利用图变换器确定待检目标节点的聚合特征;根据聚合特征和待检目标节点的初始节点特征,利用第二多层感知机,确定所述待检目标节点的最终特征;根据最终特征,利用第三多层感知机,确定待检目标节点的类型标签;基于待检目标节点的类型标签确定交易用户的类型。本发明提供了欺诈检测的准确性。诈检测的准确性。诈检测的准确性。


技术研发人员:骆祥峰 王鑫 余航 王欣芝
受保护的技术使用者:上海大学
技术研发日:2023.06.27
技术公布日:2023/9/25
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐