基于图神经网络与解耦表示学习的欺诈检测方法及系统
未命名
09-29
阅读:84
评论:0
1.本发明涉及欺诈检测和深度学习领域,特别是涉及一种基于图神经网络与解耦表示学习的欺诈检测方法及系统。
背景技术:
2.大数据时代下线上交易变得越来越频繁,其中不乏一些恶意攻击、钓鱼等方式的违法交易,因此在交易成为违法交易前需要根据交易的特征将其检测出来,防止产生巨额损失。
3.交易数据指众多交易账户之间发生的有向交易,由于骗局、恶意软件等的存在,导致交易网络中出现部分欺诈交易。因此,我们根据账户本身的信息与账户之间的交易关系,来检测涉及欺诈交易的账户。
4.目前欺诈检测方法主要是采用专家经验规则或者机器学习方法,但是这些忽略了账户之间的关系,这些缺陷将在很大程度上影响欺诈检测的全面性以及精确性。
技术实现要素:
5.本发明的目的是提供一种基于图神经网络与解耦表示学习的欺诈检测方法及系统,用于解决欺诈检测中面临的伪装问题,削弱伪装带来的噪声干扰,扩大特征空间中的类间距离,破坏伪装造成的正常类特征与欺诈类特征的相似性。
6.为实现上述目的,本发明提供了如下方案:
7.本发明提供了一种基于图神经网络与解耦表示学习的欺诈检测方法,包括:
8.获取当前交易场景数据;所述当前交易场景数据包括多个账户实体以及每个所述账户实体的属性信息;所述属性信息包括账户实体注册时间、账户实体设定时间段内的登录次数、账户实体设定时间段内的交易信息;所述交易信息包交易频率、交易总金额以及最后一次交易金额;
9.对所述当前交易场景数据进行处理,得到所述当前交易场景数据对应的当前图结构数据;所述当前图结构数据包括图的邻接矩阵和节点特征矩阵;
10.将所述当前图结构数据输入到欺诈检测模型中,确定当前交易场景数据中的欺诈账户;
11.所述欺诈检测模型的确定过程为:
12.采用欺诈交易场景数据集对应的图结构数据、以及综合损失函数,对欺诈神经网络进行训练,得到训练好的欺诈神经网络;
13.所述欺诈交易场景数据集包括多条交易场景样本数据;所述交易场景样本数据包括多个账户实体以及每个所述账户实体的样本信息;所述样本信息包括属性信息和标签信息;所述标签信息为欺诈账户或者正常账户;
14.所述欺诈交易场景数据集对应的图结构数据包括图的邻接矩阵、节点特征矩阵和节点标签列表;
15.所述欺诈神经网络包括gcn编码模块、gcn解码模块和分类器;所述欺诈检测模型包括训练好的gcn编码模块和训练好的分类器;所述gcn编码模块至少包括gcn编码器;所述gcn解码模块至少包括gcn解码器;
16.所述综合损失函数是由重构损失子函数、分类损失子函数、最大熵损失子函数和对比学习损失子函数组成;所述重构损失子函数用于计算图结构数据中的节点特征矩阵与gcn解码器输出的重构的节点特征矩阵之间的损失;所述最大熵损失子函数用于计算内容向量的最大熵损失;所述分类损失子函数用于计算风格向量的分类损失;所述内容向量和所述风格向量是对所述gcn编码器输出的节点隐空间特征划分后得到的向量;所述对比学习损失子函数用于根据正负节点对计算对比损失;所述正负节点对包括正节点对和负节点对;所述正节点对为相似节点构成的节点对;所述负节点对为不相似节点构成的节点对。
17.本发明还提供了一种基于图神经网络与解耦表示学习的欺诈检测系统,包括:
18.数据获取模块,用于获取当前交易场景数据;所述当前交易场景数据包括多个账户实体以及每个所述账户实体的属性信息;所述属性信息包括账户实体注册时间、账户实体设定时间段内的登录次数、账户实体设定时间段内的交易信息;所述交易信息包交易频率、交易总金额以及最后一次交易金额;
19.图结构数据确定模块,用于对所述当前交易场景数据进行处理,得到所述当前交易场景数据对应的当前图结构数据;所述当前图结构数据包括图的邻接矩阵和节点特征矩阵;
20.检测模块,用于将所述当前图结构数据输入到欺诈检测模型中,确定当前交易场景数据中的欺诈账户;
21.所述欺诈检测模型的确定过程为:
22.采用欺诈交易场景数据集对应的图结构数据、以及综合损失函数,对欺诈神经网络进行训练,得到训练好的欺诈神经网络;
23.所述欺诈交易场景数据集包括多条交易场景样本数据;所述交易场景样本数据包括多个账户实体以及每个所述账户实体的样本信息;所述样本信息包括属性信息和标签信息;所述标签信息为欺诈账户或者正常账户;
24.所述欺诈交易场景数据集对应的图结构数据包括图的邻接矩阵、节点特征矩阵和节点标签列表;
25.所述欺诈神经网络包括gcn编码模块、gcn解码模块和分类器;所述欺诈检测模型包括训练好的gcn编码模块和训练好的分类器;所述gcn编码模块至少包括gcn编码器;所述gcn解码模块至少包括gcn解码器;
26.所述综合损失函数是由重构损失子函数、分类损失子函数、最大熵损失子函数和对比学习损失子函数组成;所述重构损失子函数用于计算图结构数据中的节点特征矩阵与gcn解码器输出的重构的节点特征矩阵之间的损失;所述最大熵损失子函数用于计算内容向量的最大熵损失;所述分类损失子函数用于计算风格向量的分类损失;所述内容向量和所述风格向量是对所述gcn编码器输出的节点隐空间特征划分后得到的向量;所述对比学习损失子函数用于根据正负节点对计算对比损失;所述正负节点对包括正节点对和负节点对;所述正节点对为相似节点构成的节点对;所述负节点对为不相似节点构成的节点对。
27.根据本发明提供的具体实施例,本发明公开了以下技术效果:
28.本发明通过图神经网络建模欺诈场景中的图结构数据,运用解耦表示学习以及辅助的重构模块与对比学习模块,为欺诈类与正常类学习到了可以区别的特征表示,能更加有效地应对欺诈场景中的伪装问题,提高检测准确性。
附图说明
29.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
30.图1为本发明实施例提供的基于图神经网络与解耦表示学习的欺诈检测方法的流程示意图;
31.图2为本发明实施例提供的基于图神经网络与解耦表示学习的欺诈检测模型确定方法的流程示意图;
32.图3为本发明实施例提供的基于图神经网络与解耦表示学习的欺诈检测模型确定网络结构示意图;
33.图4为本发明实施例提供的欺诈场景伪装问题示意图;
34.图5为本发明实施例提供的基于图神经网络与解耦表示学习的欺诈检测方法检测阶段示例图;
35.图6为本发明实施例提供的基于图神经网络与解耦表示学习的欺诈检测方法的结构示意图。
具体实施方式
36.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
37.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
38.欺诈检测的目的在于较为准确高效地识别欺诈者,减少社会损失。通常情况下,账户实体被定义为节点,账户实体之间的交易互动被看作边,从而使现实场景被建模为图。于是,欺诈检测可以被转化为图中节点分类问题,即将节点辨别为欺诈或正常。
39.图卷积神经网络(graph neural network,gnn)通过聚合周围邻居节点的信息来表示中心节点,在图结构数据中表现良好。然而,欺诈者的伪装行为会打破图卷积神经网络的一致性假设:邻居节点拥有相似的特征表示,并且与中心节点属于同一类。如图4所示,伪装行为的表现形式包括:与正常用户进行一些互动使得自己看上去像是正常者(环境不一致性伪装)或者与毫不相关的账户进行互动(特征不一致性伪装)来混淆视听。
40.解耦表示学习可以将特征的多个物理维度分隔开,以用于下游任务。欺诈者伪装时会产生大量不重要的邻居节点,如果能够设法将这部分噪声特征剥离,那么将有可能利于检测效果的提升。运用特征解耦的方式,可以将gcn编码器得到的节点隐空间特征一分为
二,设计损失函数,强迫一部分只含有噪声特征,不含有表征是否有欺诈的信息,另一部分作为分类器的输入。
41.综上,本发明提供的解耦表示学习与对比学习方法,可以用于解决欺诈检测中面临的伪装问题,削弱伪装带来的噪声干扰,扩大特征空间中的类间距离,破坏伪装造成的正常类特征与欺诈类特征的相似性。鉴于此,本发明提供了一种基于图神经网络与解耦表示学习的欺诈检测方法及系统,可应用于建模在图结构数据下的欺诈手法检测中,例如商品评论图中的恶意评论检测、支付交易网络中的涉赌涉诈交易等等。
42.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
43.实施例一
44.本实施例提供了一种基于图神经网络与解耦表示学习的欺诈检测方法,利用图卷积神经网络(graph neural network,gnn)中的分支(graph convolutional network,gcn)对银行中金融产品销售、信用卡申请、借贷、转账等交易场景数据进行挖掘,发现其中的欺诈行为,为银行业务开展提供安全保障,适用于完善银行业反欺诈管理平台,进一步提高欺诈防控水平。
45.本实施例首先建模获取图结构数据,然后利用解耦表示学习与其他辅助模块来训练分类器,最后对待检测样本进行分类。
46.本实施例主要有以下几个方面:
47.一是使用重构模块,学习边权重,缓解环境不一致性问题;二是使用解耦模块,特征不一致性在特征空间中造成的噪声分离;三是使用对比学习模块,通过构造的正负节点对加强节点特征的学习。
48.如图1所示,本实施例提供的一种基于图神经网络与解耦表示学习的欺诈检测方法,包括如下步骤:
49.步骤100:获取当前交易场景数据;所述当前交易场景数据包括多个账户实体以及每个所述账户实体的属性信息;所述属性信息包括账户实体注册时间、账户实体设定时间段内的登录次数、账户实体设定时间段内的交易信息;所述交易信息包交易频率、交易总金额以及最后一次交易金额。
50.步骤200:对所述当前交易场景数据进行处理,得到所述当前交易场景数据对应的当前图结构数据;所述当前图结构数据包括图的邻接矩阵和节点特征矩阵。
51.在本实施例中,步骤200具体包括:
52.对所述当前交易场景数据,采用pyg工具或者networkx工具,以账户实体为节点,以两个账户实体之间的交易互动为边,确定所述当前交易场景数据对应的当前图结构数据。
53.步骤300:将所述当前图结构数据输入到欺诈检测模型中,确定当前交易场景数据中的欺诈账户。其中,当前交易场景数据中的欺诈账户的数量为0个、1个或者多个。
54.所述欺诈检测模型的确定过程为:
55.采用欺诈交易场景数据集对应的图结构数据、以及综合损失函数,对欺诈神经网络进行训练,得到训练好的欺诈神经网络。
56.所述欺诈交易场景数据集包括多条交易场景样本数据;所述交易场景样本数据包
括多个账户实体以及每个所述账户实体的样本信息;所述样本信息包括属性信息和标签信息;所述标签信息为欺诈账户或者正常账户;所述欺诈交易场景数据集对应的图结构数据包括图的邻接矩阵、节点特征矩阵和节点标签列表。其中,节点标签列表是根据标签信息确定的;所述欺诈神经网络包括gcn编码模块、gcn解码模块和分类器;所述欺诈检测模型包括训练好的gcn编码模块和训练好的分类器;所述gcn编码模块至少包括gcn编码器;所述gcn解码模块至少包括gcn解码器。
57.所述综合损失函数是由重构损失子函数、分类损失子函数、最大熵损失子函数和对比学习损失子函数组成;所述重构损失子函数用于计算图结构数据中的节点特征矩阵与gcn解码器输出的重构的节点特征矩阵之间的损失;所述最大熵损失子函数用于计算内容向量的最大熵损失;所述分类损失子函数用于计算风格向量的分类损失;所述内容向量和所述风格向量是对所述gcn编码器输出的节点隐空间特征划分后得到的向量;所述对比学习损失子函数用于根据正负节点对计算对比损失;所述正负节点对包括正节点对和负节点对;所述正节点对为相似节点构成的节点对;所述负节点对为不相似节点构成的节点对。
58.进一步地,所述gcn编码模块还包括边学习器和特征划分器;所述边学习器用于计算任意两两节点之间的边权重;所述gcn编码器用于根据节点特征矩阵和边权重,计算节点隐空间特征;所述特征划分器用于按照特征维度,将节点隐空间特征平均切分为两部分,分别为内容向量和风格向量;其中,所述内容向量为欺诈无关特征;所述风格向量为欺诈相关特征。
59.所述gcn解码模块还包括正负节点对确定单元;所述gcn解码器用于根据边权重和所述gcn编码器输出的节点隐空间特征,确定重构的节点特征矩阵;所述正负节点对确定单元用于根据所述特征划分器输出的风格向量和相似度算法,确定正负节点对。
60.实施例二
61.本实施例提供了一种基于图神经网络与解耦表示学习的欺诈检测模型确定方法,用于进一步说明实施例一所述的欺诈检测模型的确定过程。如图2和图3所示,该方法包括以下9步:
62.步骤1:获取欺诈交易场景数据集,并使用pyg,networkx等工具将其处理为图结构数据。其中,该欺诈交易场景数据集与实施例一所述的欺诈交易场景数据集相同,在此不再过多赘述。
63.具体过程为:获取欺诈交易场景数据集后,以账户实体为节点,以两个账户实体之间的交易互动为边,利用pyg工具获取需要的欺诈图结构数据,即为实施例一所述的所述欺诈交易场景数据集对应的图结构数据。
64.步骤2:利用边学习器计算两两节点之间的边权重。具体过程为:
65.基于图结构数据中得到的节点特征,使用一个变换f(i,j)来计算两个节点之间的边权重。其中,边权重we的计算公式如下:
[0066][0067]
式中,表示第l层连接节点i和节点j的边的权重,e
ij
表示连接节点i和节点j的边的边,sigmoid表示激活函数,表示第l-1层得到的节点i特征,表示第l-1层
得到的节点j特征。
[0068]
于是,第0层的节点隐空间特征矩阵z
(0)
的计算如下:
[0069]z(0)
=σ(w
t
x+b) (2)。
[0070]
式中,σ表示激活函数,w和b表示线性变换参数,x表示图结构数据中的节点特征矩阵,有n*d维,n表示节点数量,d表示节点特征维数;通过线性变换,节点特征矩阵被转化为z(0),其维数为n*k;t表示转置。
[0071]
步骤3:利用gcn编码器,结合边权重,获得节点隐空间特征。
[0072]
具体过程为:根据步骤2计算得出的第0层节点隐空间特征,可以获得使用gcn编码器编码的第l层节点隐空间特征z
(l)
,其计算公式如下:
[0073][0074][0075][0076]
其中,d是度矩阵,是第l层边权重,并通过单位阵i,添加了自环得到的图结构数据中的图的邻接矩阵;θ是需要学习的权重参数,维数是k*k;是第l层用于拉普拉斯变换的度矩阵。
[0077]
步骤4:利用gcn解码器,结合边权重,重构节点特征矩阵,计算重构损失。具体过程为:
[0078]
为了确保学习的边权重有益于表征节点特征,将学习到的边权重加入gcn编码器与gcn解码器,重构图中节点的属性,上文得到隐空间特征矩阵的计算公式就是gcn编码器的作用流程。现将其简单表示为:
[0079]
z=encoder(x) (6)。
[0080]
类似地,gcn解码器表示为:
[0081][0082]
其中,表示重构的节点特征矩阵。
[0083]
于是,可以建立重构损失,即使用均方差损失mse,计算如下:
[0084][0085]
步骤5:将节点隐空间特征分为两部分——风格向量与内容向量,所述内容向量为欺诈无关特征;所述风格向量为欺诈相关特征。具体过程为:记节点i的节点隐空间特征为zi,按照特征维度将其平均切分为两部分——内容向量和风格向量,分别记为
[0086]
步骤6:计算内容向量的最大熵损失。具体过程为:
[0087]
需要满足的条件包括:(i)其信息确实能够表征原始图(即图结构数据)的节点特征;(ii)其不包含与表征欺诈相关的特征。经过上述重构操作,使得节点隐空间特征能够还原,已经满足条件(i)。于是为了让其能够尽可能少地包含分类相关信息,少包含表征欺诈
相关的特征,通过最大化熵h来实现,计算公式如下:
[0088][0089]
h=-∑
t∈labels
p
t
log p
t (10)。
[0090]
其中,表示使用预测得到的欺诈概率,w
class
和b
class
是分类器的权重矩阵和偏置值。熵h的计算式(10)中,p
t
表示预测标签为t的概率,t属于标签labels集合,可以是正常或欺诈。
[0091]
步骤7:计算风格向量的分类损失函数,具体过程为:使用用于判别欺诈的风格向量作用于交叉熵损失函数l
ce
,计算公式如下:
[0092][0093][0094]
其中,表示使用预测得到的欺诈概率,yi∈{0,1}表示样本标签。
[0095]
步骤8:构建正负节点对,根据正负节点对计算对比损失。具体过程为:给定一个节点vi,在其所在的样本批次中,根据余弦相似度找到与其最相似的k个节点集合与最不相似的k个节点集合已知第b个batch的风格向量矩阵那么其相似度矩阵sb可以按照如下公式计算得到:
[0096][0097][0098]
将节点vi与每个相似节点构成的节点对称作正节点对,反之,使用节点vi与构成负节点对。本实施例希望正样本对能够代表同类样本,表示更加接近;而负样本能够代表不同类样本,表示更加疏远。经过分类器后,这应该表现为正样本对的异常概率相近,负样本对的异常概率疏远。对比学习损失l
cl
计算如下:
[0099][0100][0101]
其中,表示节点j的异常分数,表示节点j属于节点i的相似节点集合和不相似节点集合的并集((16)剩下的w,z,b上文已有提过)。(k就是上面步骤8中的k)表示节点m属于节点i的相似节点集合,同理。((17)中的p由(16)算得)
[0102]
步骤9:将重构损失、最大熵损失、分类损失与对比损失相加,计算总损失。若训练达到迭代上限或者收敛时,则该欺诈检测方法训练完毕;否则,更新所有网络参数,从步骤2重新开始执行。
[0103]
具体过程为:模型的总体损失包括四项:最大熵损失h,分类损失l
ce
,重构损失l
rec
,
对比学习损失l
cl
,于是总体损失计算式如下:
[0104]
l=h+l
ce
+l
rec
+l
cl (18)。
[0105]
实验说明及结果:数据集使用的是表1所述的amazon数据集,elliptic数据集,t-finance数据集,训练集、测试集比例为2:8。三个数据集包含的异常节点比例分别为6.87%,9.76%,4.58%。表1显示不同的模型在测试集测试时的对比结果,测试使用的指标为f1,其全面衡量了检测模型的性能。gcn基于空域的聚合节点周围邻居,然后直接分类;graphsage在聚合邻居信息时,选择采样方式,固定邻居数量,以进行batch形式的训练;gat在聚合邻居的过程中,使用了注意力机制;care-gcn在聚合邻居的过程中,使用强化学习方法来调整阈值,选择节点需要聚合的邻居;fraudre对于一个节点的不同关系邻居分别聚合,该方法还应用了非均衡的损失函数以缓解分类不平衡问题;pc-gcn使用采样与选择的策略,根据节点重要性选择训练样本,聚合邻居时对正常样本降采样,对异常样本过采样;amnet使用双滤波器分别捕捉正常、异常节点频段的特征,最终使用注意力机制聚合;bwgcn基于贝塔核函数实现多种频段的滤波器来更好地处理异常的频段的特征。本实施例通过图神经网络建模欺诈场景中的图结构数据,运用解耦表示学习以及重构模块、对比学习模块,为欺诈类与正常类学习可以区别的特征表示,从而进行欺诈分类任务。可以看出,本实施例的方法在三个数据集上的f1都达到了最高,比其他表现最好的方法分别高出1.94个百分点、11.81个百分点以及3.88个百分点。
[0106]
表1测试结果表
[0107][0108]
[0109]
一个示例:以t-fiance数据集场景的测试阶段为例,如图5所示,在以账户节点1为中心的交易网络中,若干邻居账户节点2~5与之存在交易关系。节点的属性包括账户的注册时间、近期登录次数、交易频率与交易金额等等。为了判断节点1是否欺诈,本示例将图输入本发明设计的欺诈检测模型中,具体为:
[0110]
①
使用pyg,networkx等工具将数据处理为模型要求的形式,包括节点特征矩阵、邻接列表与节点标签列表。
[0111]
②
利用属性重构方法学习边权重学习器,计算两两节点之间的边权重。如图5所示,计算得到节点1与节点2~5之间的边权重0.1,0.1,0.1,0.7。
[0112]
③
利用gcn编码器,结合边权重,聚合得到节点1的节点隐空间特征。
[0113]
④
切分节点1的节点隐空间特征为内容向量与风格向量,将风格向量输入分类器,得到检测结果,即节点1是否为欺诈用户。
[0114]
实施例三
[0115]
为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种基于图神经网络与解耦表示学习的欺诈检测系统。
[0116]
如图6所示,该一种基于图神经网络与解耦表示学习的欺诈检测系统,包括:
[0117]
数据获取模块601,用于获取当前交易场景数据;所述当前交易场景数据包括多个账户实体以及每个所述账户实体的属性信息;所述属性信息包括账户实体注册时间、账户实体设定时间段内的登录次数、账户实体设定时间段内的交易信息;所述交易信息包交易频率、交易总金额以及最后一次交易金额。
[0118]
图结构数据确定模块602,用于对所述当前交易场景数据进行处理,得到所述当前交易场景数据对应的当前图结构数据;所述当前图结构数据包括图的邻接矩阵和节点特征矩阵。
[0119]
检测模块603,用于将所述当前图结构数据输入到欺诈检测模型中,确定当前交易场景数据中的欺诈账户。
[0120]
所述欺诈检测模型的确定过程为:
[0121]
采用欺诈交易场景数据集对应的图结构数据、以及综合损失函数,对欺诈神经网络进行训练,得到训练好的欺诈神经网络。
[0122]
所述欺诈交易场景数据集包括多条交易场景样本数据;所述交易场景样本数据包括多个账户实体以及每个所述账户实体的样本信息;所述样本信息包括属性信息和标签信息;所述标签信息为欺诈账户或者正常账户;所述欺诈交易场景数据集对应的图结构数据包括图的邻接矩阵、节点特征矩阵和节点标签列表;所述欺诈神经网络包括gcn编码模块、gcn解码模块和分类器;所述欺诈检测模型包括训练好的gcn编码模块和训练好的分类器;所述gcn编码模块至少包括gcn编码器;所述gcn解码模块至少包括gcn解码器;所述综合损失函数是由重构损失子函数、分类损失子函数、最大熵损失子函数和对比学习损失子函数组成;所述重构损失子函数用于计算图结构数据中的节点特征矩阵与gcn解码器输出的重构的节点特征矩阵之间的损失;所述最大熵损失子函数用于计算内容向量的最大熵损失;所述分类损失子函数用于计算风格向量的分类损失;所述内容向量和所述风格向量是对所述gcn编码器输出的节点隐空间特征划分后得到的向量;所述对比学习损失子函数用于根据正负节点对计算对比损失;所述正负节点对包括正节点对和负节点对;所述正节点对为
相似节点构成的节点对;所述负节点对为不相似节点构成的节点对。
[0123]
实施例四
[0124]
本发明实施例提供一种电子设备包括存储器及处理器,该存储器用于存储计算机程序,该处理器运行计算机程序以使电子设备执行实施例一的基于图神经网络与解耦表示学习的欺诈检测方法。
[0125]
可选地,上述电子设备可以是服务器。
[0126]
另外,本发明实施例还提供一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现实施例一的基于图神经网络与解耦表示学习的欺诈检测方法。
[0127]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0128]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
技术特征:
1.一种基于图神经网络与解耦表示学习的欺诈检测方法,其特征在于,包括:获取当前交易场景数据;所述当前交易场景数据包括多个账户实体以及每个所述账户实体的属性信息;所述属性信息包括账户实体注册时间、账户实体设定时间段内的登录次数、账户实体设定时间段内的交易信息;所述交易信息包交易频率、交易总金额以及最后一次交易金额;对所述当前交易场景数据进行处理,得到所述当前交易场景数据对应的当前图结构数据;所述当前图结构数据包括图的邻接矩阵和节点特征矩阵;将所述当前图结构数据输入到欺诈检测模型中,确定当前交易场景数据中的欺诈账户;所述欺诈检测模型的确定过程为:采用欺诈交易场景数据集对应的图结构数据、以及综合损失函数,对欺诈神经网络进行训练,得到训练好的欺诈神经网络;所述欺诈交易场景数据集包括多条交易场景样本数据;所述交易场景样本数据包括多个账户实体以及每个所述账户实体的样本信息;所述样本信息包括属性信息和标签信息;所述标签信息为欺诈账户或者正常账户;所述欺诈交易场景数据集对应的图结构数据包括图的邻接矩阵、节点特征矩阵和节点标签列表;所述欺诈神经网络包括gcn编码模块、gcn解码模块和分类器;所述欺诈检测模型包括训练好的gcn编码模块和训练好的分类器;所述gcn编码模块至少包括gcn编码器;所述gcn解码模块至少包括gcn解码器;所述综合损失函数是由重构损失子函数、分类损失子函数、最大熵损失子函数和对比学习损失子函数组成;所述重构损失子函数用于计算图结构数据中的节点特征矩阵与gcn解码器输出的重构的节点特征矩阵之间的损失;所述最大熵损失子函数用于计算内容向量的最大熵损失;所述分类损失子函数用于计算风格向量的分类损失;所述内容向量和所述风格向量是对所述gcn编码器输出的节点隐空间特征划分后得到的向量;所述对比学习损失子函数用于根据正负节点对计算对比损失;所述正负节点对包括正节点对和负节点对;所述正节点对为相似节点构成的节点对;所述负节点对为不相似节点构成的节点对。2.根据权利要求1所述的一种基于图神经网络与解耦表示学习的欺诈检测方法,其特征在于,对所述当前交易场景数据进行处理,得到所述当前交易场景数据对应的当前图结构数据,具体包括对所述当前交易场景数据,采用pyg工具或者networkx工具,以账户实体为节点,以两个账户实体之间的交易互动为边,确定所述当前交易场景数据对应的当前图结构数据。3.根据权利要求1所述的一种基于图神经网络与解耦表示学习的欺诈检测方法,其特征在于,所述gcn编码模块还包括边学习器和特征划分器;所述边学习器用于计算任意两两节点之间的边权重;所述gcn编码器用于根据节点特征矩阵和边权重,计算节点隐空间特征;所述特征划分器用于按照特征维度,将节点隐空间特征平均切分为两部分,分别为内容向量和风格向量;其中,所述内容向量为欺诈无关特征;所述风格向量为欺诈相关特征。4.根据权利要求3所述的一种基于图神经网络与解耦表示学习的欺诈检测方法,其特
征在于,所述gcn解码模块还包括正负节点对确定单元;所述gcn解码器用于根据边权重和所述gcn编码器输出的节点隐空间特征,确定重构的节点特征矩阵;所述正负节点对确定单元用于根据所述特征划分器输出的风格向量和相似度算法,确定正负节点对。5.根据权利要求1所述的一种基于图神经网络与解耦表示学习的欺诈检测方法,其特征在于,所述重构损失子函数为:其中,l
rec
表示重构损失,表示重构的节点特征矩阵,x表示节点特征矩阵。6.根据权利要求1所述的一种基于图神经网络与解耦表示学习的欺诈检测方法,其特征在于,所述分类损失子函数为:征在于,所述分类损失子函数为:其中,表示使用风格向量预测得到的欺诈概率,w
class
、b
class
分别表示分类器的权重矩阵和偏置值;y
i
∈{0,1}表示样本标签;l
ce
表示分类损失。7.根据权利要求1所述的一种基于图神经网络与解耦表示学习的欺诈检测方法,其特征在于,所述最大熵损失子函数为:h=-∑
t∈labels
p
t
logp
t
。其中,表示使用内容向量预测得到的欺诈概率,w
class
、b
class
分别表示分类器的权重矩阵和偏置值,h表示最大熵损失,p
t
表示预测标签为t的概率,t属于标签labels集合,为正常或欺诈。8.根据权利要求1所述的一种基于图神经网络与解耦表示学习的欺诈检测方法,其特征在于,所述对比学习损失子函数为:征在于,所述对比学习损失子函数为:其中,表示使用风格向量预测得到的异常分数,表示节点j属于节点i的相似节点集合和不相似节点集合的并集;w
class
、b
class
分别表示分类器的权重矩阵和偏置值;l
cl
表示对比学习损失。9.根据权利要求1所述的一种基于图神经网络与解耦表示学习的欺诈检测方法,其特征在于,所述综合损失函数为:l=h+l
ce
+l
rec
+l
cl
。
其中,h表示最大熵损失,l
ce
表示分类损失,l
rec
表示重构损失,l
cl
表示对比学习损失。10.一种基于图神经网络与解耦表示学习的欺诈检测系统,其特征在于,包括:数据获取模块,用于获取当前交易场景数据;所述当前交易场景数据包括多个账户实体以及每个所述账户实体的属性信息;所述属性信息包括账户实体注册时间、账户实体设定时间段内的登录次数、账户实体设定时间段内的交易信息;所述交易信息包交易频率、交易总金额以及最后一次交易金额;图结构数据确定模块,用于对所述当前交易场景数据进行处理,得到所述当前交易场景数据对应的当前图结构数据;所述当前图结构数据包括图的邻接矩阵和节点特征矩阵;检测模块,用于将所述当前图结构数据输入到欺诈检测模型中,确定当前交易场景数据中的欺诈账户;所述欺诈检测模型的确定过程为:采用欺诈交易场景数据集对应的图结构数据、以及综合损失函数,对欺诈神经网络进行训练,得到训练好的欺诈神经网络;所述欺诈交易场景数据集包括多条交易场景样本数据;所述交易场景样本数据包括多个账户实体以及每个所述账户实体的样本信息;所述样本信息包括属性信息和标签信息;所述标签信息为欺诈账户或者正常账户;所述欺诈交易场景数据集对应的图结构数据包括图的邻接矩阵、节点特征矩阵和节点标签列表;所述欺诈神经网络包括gcn编码模块、gcn解码模块和分类器;所述欺诈检测模型包括训练好的gcn编码模块和训练好的分类器;所述gcn编码模块至少包括gcn编码器;所述gcn解码模块至少包括gcn解码器;所述综合损失函数是由重构损失子函数、分类损失子函数、最大熵损失子函数和对比学习损失子函数组成;所述重构损失子函数用于计算图结构数据中的节点特征矩阵与gcn解码器输出的重构的节点特征矩阵之间的损失;所述最大熵损失子函数用于计算内容向量的最大熵损失;所述分类损失子函数用于计算风格向量的分类损失;所述内容向量和所述风格向量是对所述gcn编码器输出的节点隐空间特征划分后得到的向量;所述对比学习损失子函数用于根据正负节点对计算对比损失;所述正负节点对包括正节点对和负节点对;所述正节点对为相似节点构成的节点对;所述负节点对为不相似节点构成的节点对。
技术总结
本发明公开了一种基于图神经网络与解耦表示学习的欺诈检测方法及系统,涉及欺诈检测和深度学习领域,包括:将当前交易场景数据对应的图结构数据输入到欺诈检测模型中,确定当前交易场景数据中的欺诈账户;其中,采用欺诈交易场景数据集对应的图结构数据、以及综合损失函数,对欺诈神经网络进行训练,得到训练好的欺诈神经网络;欺诈神经网络包括GCN编码模块、GCN解码模块和分类器;欺诈检测模型包括训练好的GCN编码模块和训练好的分类器;综合损失函数是由重构损失子函数、分类损失子函数、最大熵损失子函数和对比学习损失子函数组成。本发明用于解决欺诈检测中面临的伪装问题,提高检测准确性。高检测准确性。高检测准确性。
技术研发人员:骆祥峰 刘正扬 余航 王欣芝
受保护的技术使用者:上海大学
技术研发日:2023.06.27
技术公布日:2023/9/25
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:热管理集成模块的制作方法 下一篇:一种原卤提锂制备氢氧化锂的方法与流程