基于异质图的医学实体关联关系鲁棒发现方法及系统
未命名
09-22
阅读:79
评论:0
1.本发明涉及生物医学技术领域,具体涉及一种基于异质图的医学实体关联关系鲁棒发现方法及系统。
背景技术:
2.医学实体关联关系发现是生物医学领域最为基础与核心的任务之一,可用于发现医学实体间的潜在关系,帮助研究者研发药物,辅助医生诊断等。如,发现药物-药物交互关系有利于探索药物间的关联性,研发新药物;发现药物-疾病交互关系,有助于提高疾病治疗效率。特别地,传统的医学实体关联关系发现主要基于大量实验来挖掘,过程相当复杂,耗时且花费巨大。因此,设计和开发基于计算的方法是非常有必要的。
3.现有方法主要基于医学异质图进行实体关联关系发现,数据往往来源于大型药物或医疗数据库,或是基于文本挖掘技术预处理得到。然而,这些方法通常具有一个潜在的假设,即所观测的医学实体及其交互关系是可靠的。事实上,由于实验误差,遗漏等,使得观测的医学数据未必是完全真实可信的,造成发现的医学实体关联关系的鲁棒性面临潜在威胁。
4.智能诊疗系统是一种基于人工智能技术的医疗辅助工具,用于帮助医生和其他医疗专业人员进行疾病诊断和治疗。该系统通过整合和分析患者的医学数据和病史,结合先进的算法和模型,生成针对个体患者的精准诊断和治疗方案,从而提高医疗效率和质量,降低误诊率和漏诊率。智能诊疗系统可以应用于多种疾病领域,如心脑血管病、肿瘤、神经科疾病等,同时也可以支持多种医学图像和信号的处理和分析,如ct、mri、超声波、电子生理信号等。另外,该系统还可以实现远程医疗服务,为医生和患者提供便捷的医疗咨询和诊疗服务。
5.由于医学领域的特殊性,要求诊疗系统必须能够稳定地输出正确结果,在相关技术中,公布号为cn114883001a的专利申请文献提出对待预测患者的当前电子病历进行数据扩充,基于扩充后的数据构建电子病历异质图;在电子病历异质图上,基于元路径的学习表示进行电子病历的嵌入表示,通过注意力机制进行元路径邻居节点的聚合;最终实现对待预测患者的疾病预测。然而,在实际应用场景下,基于异质图的智能诊疗模型的优化仍面临着巨大的挑战:(1)在图传播过程中,模型的任务表现十分容易受到节点或者边上细微扰动的影响,若数据提供方提供的低质量或者错误的原始数据或模型参数,则会导致模型质量下降;(2)对于异质图神经网络,异质图的复杂性使得相邻节点可能包含与目标节点无关的噪声信息,通过传播聚合机制,这些无关信息很容易被传播和传播到相邻的和更高阶的节点,从而干扰异质图的嵌入质量。
6.在文献“一种基于信息瓶颈的神经网络混合压缩方法,计算机应用研究,卓越等”中提出了基于信息瓶颈理论的神经网络混合压缩方案,该方案基于信息瓶颈理论(ib)的压缩方案是采用推导的损失函数缩减模型参数,主要依赖基于估计概率密度的互信息计算来实现,其目标是通过基于ib的损失函数找到模型剪枝位置,也就是压缩模型大小,降低工程
应用中的计算及存储压力。
技术实现要素:
7.本发明所要解决的技术问题在于如何解决针对医学领域的异质图模型鲁棒性低导致的系统安全问题。
8.本发明通过以下技术手段解决上述技术问题的:
9.提出了一种基于异质图的医学实体关联关系鲁棒发现方法,所述方法包括:
10.获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间;
11.基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示;
12.根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示;
13.使用希尔伯特独立性准则计算的多路径语义捕捉优化函数对每条元路径上gnn信息传递过程进行优化,捕捉多路径语义信息;
14.根据所述多路径语义信息,得到预测结果。
15.进一步地,所述获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间,包括:
16.获取医学异质图数据,并基于所述异质图数据中各实体之间的关系建立邻接矩阵,所述实体包括患者、疾病、症状及药物四种类型;
17.基于所述邻接矩阵构建多模态医学异质图网络g={v,e},v表示不同类型实体的节点集合,e为不同类型实体之间的关系集合;
18.根据所述医学异质图数据的特征及模型学习的目标,选择多条元路径聚合节点,并基于选择的多条元路径φ1,
…
,φn定义元路径空间φ={φ1,
…
,φn}。
19.进一步地,所述基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示,包括:
20.将所述输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示,公式表示为:
[0021][0022]
式中:x表示输入特征,表示变换到相应目标元路径特征空间后的特征,是元路径φi中的转换矩阵。
[0023]
进一步地,所述根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示,包括:
[0024]
使用自注意力学习由元路径连接的每个邻居的权重,并通过归一化的注意力值获得每个邻居的权重系数;
[0025]
重复k次使用节点间的注意力机制,根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示,公式表示为:
[0026]
[0027]
式中,||表示嵌入的级联操作,表示元路径φi的权重,n
φ
表示包含所有元路径的集合,表示节点间自注意力机制学习所得的元路径φi上的嵌入特征,表示重复k次节点间注意力机制并进行特征拼接所得的元路径φi上的嵌入特征。
[0028]
进一步地,所述多路径语义捕捉优化函数的公式表示为:
[0029][0030][0031][0032][0033]
式中:表示输入特征、真实值及隐层特征之间的语义捕捉损失函数,用于对每条元路径施加语义嵌入与输入和真实值之间的约束;l表示隐藏层的数量,预测标签视为最后一个隐藏层h
l+1
,表示元路径φi上的第j个隐藏层的特征,表示输入特征和隐层特征之间的hsic依赖,表示真实值和隐层特征之间的hsic依赖,λy表示权衡系数,x表示输入特征,y表示真实值;表示隐层之间的语义捕捉损失函数,用于在每个元路径上的隐藏层之间添加附加约束,捕获隐藏层之间的关系;λh表示损失函数的权衡系数,表示相邻隐层特征之间的hsic值即其依赖程度,表示元路径φi上的第j+1个隐藏层的特征。
[0034]
进一步地,对于给定变量u与v的联合概率p
uv
,采样z={(u1,v1),...,(un,vn)},所述希尔伯特独立性准则的计算公式为:
[0035][0036]
式中:hsic(u,v)表示不同空间的两个变量u与v之间的依赖程度,tr()表示矩阵的迹,n表示矩阵的行数,其中,i为单位矩阵,1所有元素为1的列向量,ku表示核矩阵,且其给定i行和j列的元素为其中σ表示核函数带宽,主要起光滑作用,ku和kv的定义类似。
[0037]
此外,本发明还提出了一种基于异质图的医学实体关联关系鲁棒发现方系统,所述系统包括:
[0038]
获取模块,用于获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间;
[0039]
特征变换模块,用于基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示;
[0040]
特征聚合模块,用于根据元路径连接的每个邻居的权重系数,聚合不同元路径上
的嵌入表示;
[0041]
语义捕捉模块,用于使用希尔伯特独立性准则计算的多路径语义捕捉优化函数对每条元路径上gnn信息传递过程进行优化,捕捉多路径语义信息;
[0042]
预测模块,用于根据所述多路径语义信息,得到预测结果。
[0043]
进一步地,所述特征聚合模块包括:
[0044]
权重系数计算单元,用于使用自注意力学习由元路径连接的每个邻居的权重,并通过归一化的注意力值获得每个邻居的权重系数;
[0045]
聚合单元,用于重复k次使用节点间的注意力机制,根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示,公式表示为:
[0046][0047]
式中,||表示嵌入的级联操作,表示元路径φi的权重,n
φ
表示包含所有元路径的集合,表示节点间自注意力机制学习所得的元路径φi上的嵌入特征,表示重复k次节点间注意力机制并进行特征拼接所得的元路径φi上的嵌入特征。
[0048]
进一步地,所述多路径语义捕捉优化函数的公式表示为:
[0049][0050][0051][0052][0053]
式中:表示输入特征、真实值及隐层特征之间的语义捕捉损失函数,用于对每条元路径施加语义嵌入与输入和真实值之间的约束;l表示隐藏层的数量,预测标签视为最后一个隐藏层h
l+1
,表示元路径φi上的第j个隐藏层的特征,表示输入特征和隐层特征之间的hsic依赖,表示真实值和隐层特征之间的hsic依赖,λy表示权衡系数,x表示输入特征,y表示真实值;表示隐层之间的语义捕捉损失函数,用于在每个元路径上的隐藏层之间添加附加约束,捕获隐藏层之间的关系;λh表示损失函数的权衡系数,表示相邻隐层特征之间的hsic值即其依赖程度,表示元路径φi上的第j+1个隐藏层的特征。
[0054]
进一步地,所述希尔伯特独立性准则的计算公式为:
[0055][0056]
[0057]
式中:hsic(u,v)表示不同空间的两个变量u与v之间的依赖程度,tr()表示矩阵的迹,n表示矩阵的行数,其中,i为单位矩阵,1所有元素为1的列向量,ku和kv表示核矩阵,且其给定i行和j列的元素为其中σ表示核函数带宽。
[0058]
本发明的优点在于:
[0059]
(1)本发明为了最大限度地提取有用的信息嵌入节点,在元路径中,基于信息瓶颈,采用希尔伯特独立性准则(hilbert-schmidt independence criterion,hsic)计算的多路径语义捕捉函数在特征聚合时对聚合信息进行约束,来限制不同传播层之间的依赖性,从而引导对目标节点有积极影响的信息传播,并用来衡量不同元路径语义空间之间的依赖关系,从而整合准确全面的节点信息,从而有效地提高异构图的嵌入质量,提高模型在实际应用中的鲁棒性。
[0060]
通过在图神经网络训练中,使用希尔伯特独立性准则(hilbert
–
schmidt independence criterion,hsic)来计算两个特征之间的依赖程度,针对不同元路径以及网络各层的语义信息,通过损失函数对模型的学习进行指导,以达到去除无用信息,捕捉关键特征的鲁棒性增强效果,并且对比互信息,hsic不需要估计概率密度,在计算中更为精准且实现简单。
[0061]
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
[0062]
图1是本发明实施例一种基于异质图的医学实体关联关系鲁棒发现方法的流程示意图;
[0063]
图2是本发明实施例中基于医学异质图的智能诊疗鲁棒性增强的原理框图;
[0064]
图3是本发明实施例中一种基于异质图的医学实体关联关系鲁棒发现方系统的结构示意图。
具体实施方式
[0065]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0066]
如图1所示,本发明第一实施例提出了一种基于异质图的医学实体关联关系鲁棒发现方法,所述方法包括以下步骤:
[0067]
s10、获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间;
[0068]
s20、基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示;
[0069]
需要说明的是,这里的输入特征指的是异质图网络中节点的原始特征。
[0070]
s30、根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示;
[0071]
s40、使用希尔伯特独立性准则计算的多路径语义捕捉优化函数对每条元路径上gnn信息传递过程进行优化,捕捉多路径语义信息;
[0072]
s50、根据所述多路径语义信息,得到预测结果。
[0073]
本实施例考虑了实际情况下,在异质图中的相邻节点聚合信息的有效性,及元路径之间语义融合时的信息损失,在这种情况下,为了最大限度地提取有用的信息嵌入节点,在元路径中,基于信息瓶颈,采用hilbert-schmidt独立性准则来限制不同传播层之间的依赖性,从而引导对目标节点有积极影响的信息传播,以及在元路径之间,采用hilbert-schmidt独立性准则来衡量不同元路径语义空间之间的依赖关系,从而整合准确全面的节点信息。通过以上两部分,异质图模型可以有效地提高异构图的嵌入质量,提高模型在实际应用中的鲁棒性。
[0074]
在一实施例中,所述不步骤s10:获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间,具体包括以下步骤:
[0075]
s11、获取医学异质图数据,并基于所述异质图数据中各实体之间的关系建立邻接矩阵,所述实体包括患者、疾病、症状及药物四种类型;
[0076]
需要说明的是,本实施例获取医学异质图数据后,对不同领域不同元数据格式的医学数据进行格式统一,然后根据各实体之间的关系建立邻接矩阵。
[0077]
s12、基于所述邻接矩阵构建多模态医学异质图网络g={v,e},v表示不同类型实体的节点集合,e为不同类型实体之间的关系集合;
[0078]
需要说明的是,本实施例基于患者,疾病,症状,药物4种类型实体,依托实体及其关系映射,可以构建多模态医学异质图g={v,e},其中v表示节点集合(患者集合,疾病集合,症状集合,药物集合),e为关系的集合(患者-疾病,疾病-症状,症状-药物,药物-药物,
……
)。
[0079]
s13、根据所述医学异质图数据的特征及模型学习的目标,选择多条元路径聚合节点,并基于选择的多条元路径φ1,
…
,φn定义元路径空间φ={φ1,
…
,φn}。
[0080]
在一实施例中,由于异构节点在不同的特征空间中具有多样性的原始特征,需要进行基于元路径的节点特征空间转换,所述步骤s20:基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示,具体包括:
[0081]
将所述输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示,公式表示为:
[0082][0083]
式中:x表示输入特征,表示变换到相应目标元路径特征空间后的特征,是元路径φi中的转换矩阵。
[0084]
在一实施例中,所述步骤s30:根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示,具体包括以下步骤:
[0085]
s31、使用自注意力学习由元路径连接的每个邻居的权重,并通过归一化的注意力值获得每个邻居的权重系数;
[0086]
具体地,通过对特征空间的变换,得到了一组不同元路径上的特殊嵌入,随后使用自注意力学习由其元路径连接的每个邻居的权重,并通过归一化的注意力值获得权重系
数。对于一个元路径上的一对节点(m,n),其注意系数计算如下:
[0087][0088]
式中:lr是激活函数leakyrelu,exp()表示e的幂次方,是元路径φi上所有节点的注意力向量,表示基于元路径φi的相邻节点,表示节点对(m,n)的注意系数,表示节点m变换到元路径φi特征空间后的特征,表示节点n变换到元路径φj特征空间后的特征,表示节点j变换到元路径φi特征空间后的特征,表示元路径φi上的权重矩阵,i表示路径数,j表示路径上的节点,表示1
×
2d维度的实数空间。
[0089]
s32、应用多头注意力,重复k次使用节点间的注意力机制,根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示,公式表示为:
[0090][0091]
式中,||表示嵌入的级联操作,表示元路径φi的权重,n
φ
表示包含所有元路径的集合,表示节点间自注意力机制学习所得的元路径φi上的嵌入特征,表示重复k次节点间注意力机制并进行特征拼接所得的元路径φi上的嵌入特征。
[0092]
在一实施例中,如图2所示,所述步骤s40中,多路径语义捕捉优化函数的公式表示为:
[0093][0094][0095][0096][0097]
式中:表示输入特征、真实值及隐层特征之间的语义捕捉损失函数,用于对每条元路径施加语义嵌入与输入和真实值之间的约束;l表示隐藏层的数量,预测标签视为最后一个隐藏层h
l+1
,表示元路径φi上的第j个隐藏层的特征,表示输入特征和隐层特征之间的hsic依赖,表示真实值和隐层特征之间的hsic依赖,λy表示权衡系数,x表示输入特征,y表示真实值;表示隐层之间的语义捕捉损失函数,用于在每个元路径上的隐藏层之间添加附加约束,捕获隐藏层之间的关系;λh表示损失函数的权衡系数,表示相邻隐层特征之间的hsic值即其依赖程度,表示元路径φi上的第j+1个隐藏层的特征。
[0098]
在一实施例中,所述希尔伯特独立性准则的计算公式为:
[0099][0100]
式中:hsic(u,v)表示不同空间的两个变量u与v之间的依赖程度,tr()表示矩阵的迹,n表示矩阵的行数,其中,i为单位矩阵,1所有元素为1的列向量,ku表示核矩阵,且其给定i行和j列的元素为其中σ表示核函数带宽,主要起光滑作用,ui和uj分别表示一组变量u的采样值。
[0101]
本实施例考虑到多层网络信息传播过程中信息损失的问题,模型可能在学习过程中受到不良节点或者边的干扰,在错误的方向偏离监督学习的目标;因此,基于信息瓶颈理论,考虑到多个元路径之间的相互关系,将每条路径上的目标函数进行融合,得到多路径的语义捕捉方法,在图传播过程中,采用希尔伯特独立性准则作为损失函数,以捕捉神经网络各层之间的依赖,并且压缩其中的噪声信息,有效约束信息聚合的纯洁性。
[0102]
此外,如图3所示,本发明第二实施例提出了一种基于异质图的医学实体关联关系鲁棒发现方系统,所述系统包括:
[0103]
获取模块10,用于获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间;
[0104]
特征变换模块20,用于基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示;
[0105]
特征聚合模块30,用于根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示;
[0106]
语义捕捉模块40,用于使用希尔伯特独立性准则计算的多路径语义捕捉优化函数对每条元路径上gnn信息传递过程进行优化,捕捉多路径语义信息;
[0107]
预测模块50,用于根据所述多路径语义信息,得到预测结果。
[0108]
本实施例在元路径中,基于信息瓶颈,采用hilbert-schmidt独立性准则来限制不同传播层之间的依赖性,从而引导对目标节点有积极影响的信息传播,以及在元路径之间来衡量不同元路径语义空间之间的依赖关系,从而整合准确全面的节点信息,使得异质图模型可以有效地提高异构图的嵌入质量,提高模型在实际应用中的鲁棒性。
[0109]
在一实施例中,所述获取模块10,包括:
[0110]
数据获取单元,用于获取医学异质图数据,并基于所述异质图数据中各实体之间的关系建立邻接矩阵,所述实体包括患者、疾病、症状及药物四种类型;
[0111]
图网络构建单元,用于基于所述邻接矩阵构建多模态医学异质图网络g={v,e},v表示不同类型实体的节点集合,e为不同类型实体之间的关系集合;
[0112]
元路径空间定义单元,用于根据所述医学异质图数据的特征及模型学习的目标,选择多条元路径聚合节点,并基于选择的多条元路径φ1,
…
,φn定义元路径空间φ={φ1,
…
,φn}。
[0113]
在一实施例中,所述特征变换模块20,具体用于:将所述输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示,公式表示为:
[0114][0115]
式中:x表示输入特征,表示变换到相应目标元路径特征空间后的特征,是元路径φi中的转换矩阵。
[0116]
在一实施例中,所述特征聚合模块30,包括:
[0117]
权重系数计算单元,用于使用自注意力学习由元路径连接的每个邻居的权重,并通过归一化的注意力值获得每个邻居的权重系数;
[0118]
聚合单元,用于重复k次使用节点间的注意力机制,根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示,公式表示为:
[0119][0120]
式中,||表示嵌入的级联操作,表示元路径φi的权重,n
φ
表示包含所有元路径的集合,表示节点间自注意力机制学习所得的元路径φi上的嵌入特征,表示重复k次节点间注意力机制并进行特征拼接所得的元路径φi上的嵌入特征。
[0121]
在一实施例中,所述语义捕捉模块40采用的多路径语义捕捉优化函数的公式表示为:
[0122][0123][0124][0125][0126]
式中:表示输入特征、真实值及隐层特征之间的语义捕捉损失函数,用于对每条元路径施加语义嵌入与输入和真实值之间的约束;l表示隐藏层的数量,预测标签视为最后一个隐藏层h
l+1
,表示元路径φi上的第j个隐藏层的特征,表示输入特征和隐层特征之间的hsic依赖,表示真实值和隐层特征之间的hsic依赖,λy表示权衡系数,x表示输入特征,y表示真实值;表示隐层之间的语义捕捉损失函数,用于在每个元路径上的隐藏层之间添加附加约束,捕获隐藏层之间的关系;λh表示损失函数的权衡系数,表示相邻隐层特征之间的hsic值即其依赖程度,表示元路径φi上的第j+1个隐藏层的特征。。
[0127]
需要说明的是,本发明所述基于异质图的医学实体关联关系鲁棒发现方系统的其他实施例或具有实现方法可参照上述各方法实施例,此处不再赘余。
[0128]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特
点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0129]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0130]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
技术特征:
1.一种基于异质图的医学实体关联关系鲁棒发现方法,其特征在于,所述方法包括:获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间;基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示;根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示;使用希尔伯特独立性准则计算的多路径语义捕捉优化函数对每条元路径上gnn信息传递过程进行优化,捕捉多路径语义信息;根据所述多路径语义信息,得到预测结果。2.如权利要求1所述的基于异质图的医学实体关联关系鲁棒发现方法,其特征在于,所述获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间,包括:获取医学异质图数据,并基于所述异质图数据中各实体之间的关系建立邻接矩阵,所述实体包括患者、疾病、症状及药物四种类型;基于所述邻接矩阵构建多模态医学异质图网络g={v,e},v表示不同类型实体的节点集合,e为不同类型实体之间的关系集合;根据所述医学异质图数据的特征及模型学习的目标,选择多条元路径聚合节点,并基于选择的多条元路径φ1,
…
,φ
n
定义元路径空间φ={φ1,
…
,φ
n
}。3.如权利要求1所述的基于异质图的医学实体关联关系鲁棒发现方法,其特征在于,所述基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示,包括:将所述输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示,公式表示为:式中:x表示输入特征,表示变换到相应目标元路径特征空间后的特征,是元路径φ
i
中的转换矩阵。4.如权利要求1所述的基于异质图的医学实体关联关系鲁棒发现方法,其特征在于,所述根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示,包括:使用自注意力学习由元路径连接的每个邻居的权重,并通过归一化的注意力值获得每个邻居的权重系数;重复k次使用节点间的注意力机制,根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示,公式表示为:式中,||表示嵌入的级联操作,表示元路径φ
i
的权重,n
φ
表示包含所有元路径的集合,表示节点间自注意力机制学习所得的元路径φ
i
上的嵌入特征,表示重复k次节点间注意力机制并进行特征拼接所得的元路径φ
i
上的嵌入特征。5.如权利要求1所述的基于异质图的医学实体关联关系鲁棒发现方法,其特征在于,所述多路径语义捕捉优化函数的公式表示为:
式中:表示输入特征、真实值及隐层特征之间的语义捕捉损失函数,用于对每条元路径施加语义嵌入与输入和真实值之间的约束;l表示隐藏层的数量,预测标签视为最后一个隐藏层h
l+1
,表示元路径φ
i
上的第j个隐藏层的特征,表示输入特征和隐层特征之间的hsic依赖,表示真实值和隐层特征之间的hsic依赖,λ
y
表示权衡系数,x表示输入特征,y表示真实值;表示隐层之间的语义捕捉损失函数,用于在每个元路径上的隐藏层之间添加附加约束,捕获隐藏层之间的关系;λ
h
表示损失函数的权衡系数,表示相邻隐层特征之间的hsic值即其依赖程度,表示元路径φ
i
上的第j+1个隐藏层的特征。6.如权利要求5所述的基于异质图的医学实体关联关系鲁棒发现方法,其特征在于,所述希尔伯特独立性准则的计算公式为:式中:hsic(u,v)表示不同空间的两个变量u与v之间的依赖程度,tr()表示矩阵的迹,n表示矩阵的行数,i为单位矩阵,1所有元素为1的列向量,k
u
和kv表示核矩阵。7.一种基于异质图的医学实体关联关系鲁棒发现方系统,其特征在于,所述系统包括:获取模块,用于获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间;特征变换模块,用于基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示;特征聚合模块,用于根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示;语义捕捉模块,用于使用希尔伯特独立性准则计算的多路径语义捕捉优化函数对每条元路径上gnn信息传递过程进行优化,捕捉多路径语义信息;预测模块,用于根据所述多路径语义信息,得到预测结果。8.如权利要求7所述的基于异质图的医学实体关联关系鲁棒发现方系统,其特征在于,所述特征聚合模块包括:权重系数计算单元,用于使用自注意力学习由元路径连接的每个邻居的权重,并通过归一化的注意力值获得每个邻居的权重系数;聚合单元,用于重复k次使用节点间的注意力机制,根据元路径连接的每个邻居的权重
系数,聚合不同元路径上的嵌入表示,公式表示为:式中,||表示嵌入的级联操作,表示元路径φ
i
的权重,n
φ
表示包含所有元路径的集合,表示节点间自注意力机制学习所得的元路径φ
i
上的嵌入特征,表示重复k次节点间注意力机制并进行特征拼接所得的元路径φ
i
上的嵌入特征。9.如权利要求7所述的基于异质图的医学实体关联关系鲁棒发现方系统,其特征在于,所述多路径语义捕捉优化函数的公式表示为:所述多路径语义捕捉优化函数的公式表示为:所述多路径语义捕捉优化函数的公式表示为:所述多路径语义捕捉优化函数的公式表示为:式中:表示输入特征、真实值及隐层特征之间的语义捕捉损失函数,用于对每条元路径施加语义嵌入与输入和真实值之间的约束;l表示隐藏层的数量,预测标签视为最后一个隐藏层h
l+1
,表示元路径φ
i
上的第j个隐藏层的特征,表示输入特征和隐层特征之间的hsic依赖,表示真实值和隐层特征之间的hsic依赖,λ
y
表示权衡系数,x表示输入特征,y表示真实值;表示隐层之间的语义捕捉损失函数,用于在每个元路径上的隐藏层之间添加附加约束,捕获隐藏层之间的关系;λ
h
表示损失函数的权衡系数,表示相邻隐层特征之间的hsic值即其依赖程度,表示元路径φ
i
上的第j+1个隐藏层的特征。10.如权利要求7所述的基于异质图的医学实体关联关系鲁棒发现方系统,其特征在于,所述希尔伯特独立性准则的计算公式为:式中:hsic(u,v)表示不同空间的两个变量u与v之间的依赖程度,tr()表示矩阵的迹,n表示矩阵的行数,i为单位矩阵,1所有元素为1的列向量,k
u
和kv表示核矩阵。
技术总结
本发明公开一种基于异质图的医学实体关联关系鲁棒发现方法及系统,方法包括获取医学异质图数据,并基于所述异质图数据和学习目标定义元路径空间;基于所述元路径空间,将输入特征变换到相应的目标元路径特征空间,得到一组不同元路径上的嵌入表示;根据元路径连接的每个邻居的权重系数,聚合不同元路径上的嵌入表示;使用希尔伯特独立性准则计算的多路径语义捕捉优化函数对每条元路径上GNN信息传递过程进行优化,捕捉多路径语义信息;根据所述多路径语义信息,得到预测结果;本发明可提高医学领域的异质图模型鲁棒性。学领域的异质图模型鲁棒性。学领域的异质图模型鲁棒性。
技术研发人员:何云飞 孟丽 杨飞 孙宸远 马剑 张志强 高埂
受保护的技术使用者:安徽医科大学
技术研发日:2023.06.29
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/