知识图谱嵌入向量确定方法、装置、电子设备及存储介质

未命名 08-02 阅读:72 评论:0


1.本发明涉及知识图谱技术领域,具体而言,涉及一种知识图谱嵌入向量确定方法、装置、电子设备及存储介质。


背景技术:

2.知识图谱作为一种特殊的图形结构,实体(entities)作为结点,关系(relations)作为有向边。在知识图谱中,每个边缘被表示为具有(头部实体,关系,尾部实体)这一形式的三元组(u,r,v),以指示两个实体u(即,头实体)和v(即,尾实体)通过关系r连接。在过去的几十年中建立了许多大型知识图谱,例如wordnet,freebase,dbpedia,yago。它们改进了各种下游应用,例如结构化搜索、问答和实体推荐等。
3.知识图谱嵌入(knowledge graph embedding,kge)是一种学习知识库中的实体和关系的embedding表示的方法,是语义检索、知识问答、推荐等众多应用的基础研究。
4.然而,在现有的知识图谱嵌入模型中,诸如transe、complex和ptranse的模型主要利用语义信息,研究单个三元组中节点和关系之间的联系,而诸如chainr和rsn的模型则更多地去利用结构信息。但是,现有的知识图谱的嵌入表示受到图谱的结构稀疏性的限制,从而导致现有的知识图谱嵌入表示的方法存在准确度较低的问题。


技术实现要素:

5.为解决上述问题,本发明提供一种知识图谱嵌入向量确定方法、装置、电子设备及存储介质。
6.根据本发明第一方面,提供一种知识图谱嵌入向量确定方法,包括:
7.根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量,其中,所述实体节点包括所述属性节点和非属性节点,所述属性节点为所述实体节点的子集,所述第一属性节点知识图谱为所述第一实体节点知识图谱的子集,所述第一属性节点知识图谱和所述第一实体节点知识图谱是经过关系增强后的;
8.根据所述属性节点关系嵌入向量更新所述属性节点的所述属性嵌入向量,确定各个所述属性节点的第一嵌入向量;
9.根据预设关系因子对所述第一实体节点知识图谱的所述实体节点关系嵌入向量进行更新,确定第一实体节点关系嵌入向量;
10.根据所述第一嵌入向量和所述第一实体节点关系嵌入向量对所述第一实体节点知识图谱进行更新,确定第二实体节点知识图谱;
11.根据所述第二实体节点知识图谱中所述第一实体节点关系嵌入向量,更新所述实体节点的所述实体嵌入向量,确定各个所述实体节点的第二嵌入向量;
12.根据所述第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量,其中,所述第二实体节点关系嵌入向量是根据所述预设关系因子和所述第一实
体节点关系嵌入向量确定的。
13.可选地,所述根据所述属性节点关系嵌入向量更新所述属性节点的所述属性嵌入向量,确定各个所述属性节点的第一嵌入向量,包括:
14.根据所述第一属性节点知识图谱,获取待更新属性节点所对应的邻接属性节点集合;
15.根据所述邻接属性节点集合,确定邻接属性关系集合;
16.根据所述邻接属性节点集合中各个邻接属性节点的邻接属性节点嵌入向量、所述邻接属性关系集合中各个邻接关系的邻接属性节点关系嵌入向量、第一嵌入因子和预设组合函数,确定所述待更新属性节点的第一嵌入向量。
17.可选地,所述根据所述邻接属性节点集合中各个邻接属性节点的邻接属性节点嵌入向量、所述邻接属性关系集合中各个邻接关系的邻接属性节点关系嵌入向量、第一嵌入因子和预设组合函数,确定所述待更新属性节点的第一嵌入向量,包括:
18.根据第一公式确定所述第一嵌入向量,所述第一公式包括:
[0019][0020]
其中,hu表示待更新属性节点的第一嵌入向量,n
attr
(u)表示待更新属性节点u对应邻接属性关系集合,v表示与待更新属性节点的邻接属性节点,r表示待更新属性节点与邻接属性节点之间的邻接属性连接关系,w
attr(r)
表示第一预设嵌入因子,φ表示组合函数,hv表示邻接属性节点嵌入向量,hr表示邻接属性节点关系嵌入向量。
[0021]
可选地,所述根据所述第二实体节点知识图谱中所述第一实体节点关系嵌入向量,确定各个所述实体节点的第二嵌入向量,包括:
[0022]
根据所述第一实体节点知识图谱,获取待更新实体节点所对应的邻接实体节点集合;
[0023]
根据所述邻接实体节点集合,确定邻接实体关系集合;
[0024]
根据所述邻接实体节点集合中各个邻接实体节点的邻接实体节点嵌入向量、所述邻接实体关系集合中各个邻接实体关系的邻接实体节点关系嵌入向量、第二预设嵌入因子和预设组合函数,确定所述待更新实体节点的第二嵌入向量。
[0025]
可选地,所述根据所述邻接实体节点集合中各个邻接实体节点的邻接实体节点嵌入向量、所述邻接实体关系集合中各个邻接实体关系的邻接实体节点关系嵌入向量、第二预设嵌入因子和预设组合函数,确定所述待更新实体节点的第二嵌入向量,包括:
[0026]
根据第二公式确定所述第二嵌入向量,所述第二公式包括:
[0027][0028]
其中,h
u'
表示待更新实体节点的第一嵌入向量,n
attr
(u')表示待更新实体节点u'对应邻接属性关系集合,v'表示与待更新实体节点的邻接实体节点,r'表示待更新实体节点与邻接实体节点之间的邻接实体连接关系,w
(r)
表示第二预设嵌入因子,φ表示组合函数,h
v'
表示邻接实体节点嵌入向量,h
r'
表示邻接实体节点关系嵌入向量。
[0029]
可选地,还包括:
[0030]
获取初始属性节点知识图谱和初始实体节点知识图谱;
[0031]
根据预设关系增强策略对所述初始属性节点知识图谱和所述初始实体节点知识图谱进行增强,确定所述第一属性节点知识图谱和所述第一实体节点知识图谱,其中,所述预设关系增强策略包括以下至少之一:为所述初始属性节点知识图谱和所述初始实体节点知识图谱的每条边引入反向边、在所述初始属性节点知识图谱和所述初始实体节点知识图谱增加自循环关系。
[0032]
可选地,还包括:
[0033]
基于激活函数层与sigmoid层,确定所述目标嵌入向量对应的概率分布分数;
[0034]
根据所述概率分布分数确定损失值,其中,所述损失值用于更新预设关系因子。
[0035]
根据本发明的第二方面,提供知识图谱嵌入向量确定装置,所述知识图谱嵌入向量确定装置,包括:
[0036]
获取模块,用于获取经过关系增强后的属性节点知识图谱和实体节点知识图谱,其中,实体节点包括属性节点和非属性节点,所述属性节点为所述实体节点的子集,所述属性节点知识图谱为所述实体节点知识图谱的子集;
[0037]
第一确定模块,用于根据所述属性节点知识图谱的属性节点关系嵌入向量,确定各个所述属性节点的第一嵌入向量;
[0038]
第一更新模块,用于根据预设关系因子对所述第一实体节点知识图谱的实体节点关系嵌入向量进行更新,确定第一实体节点关系嵌入向量;
[0039]
第二更新模块,用于根据所述第一嵌入向量和所述第一实体节点关系嵌入向量对所述实体节点知识图谱进行更新,确定第二实体节点知识图谱;
[0040]
第二确定模块,用于根据所述第二实体节点知识图谱中所述第一实体节点关系嵌入向量,确定各个所述实体节点的第二嵌入向量;
[0041]
第三确定模块,用于根据所述第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量,其中,所述第二实体节点关系嵌入向量是根据所述预设关系因子和所述第一实体节点关系嵌入向量确定的。
[0042]
根据本发明的第三方面,提供一种电子设备,所述电子设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时基于第一方面所述的知识图谱嵌入向量确定方法。
[0043]
根据本发明的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面所述的知识图谱嵌入向量确定方法。
[0044]
本发明提供的技术方案可以包括以下有益效果:
[0045]
本发明提供的知识图谱嵌入向量确定方法,通过使用图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量,可以在对知识图谱的稀疏性增强之后,准确地掌握各个属性节点的第一嵌入向量,从而实现属性知识的汇聚,进一步地,通过利用预设关系因子对实体节点知识图谱的实体节点关系嵌入向量进行更新,可以准确地掌握实体节点知识图谱中各个实体节点之间的连接关系,进一步地根据实体节点知识图谱中第一实体节点关系嵌入向量,确定各个实体节点的第二嵌入向量,最后通过第
二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量,可以使汇聚了属性知识的实体节点的目标嵌入向量在实体节点知识图谱范围内流通,从而可以准确利用实体的属性信息准确地确定目标嵌入向量,进而提高了确定实体节点的目标嵌入向量的准确性。
附图说明
[0046]
图1为本发明实施例提供的一种知识图谱嵌入向量确定方法流程图;
[0047]
图2为本发明另一实施例提供的主流价值观知识图谱构建流程图;
[0048]
图3为本发明另一实施例提供的一种知识图谱嵌入向量确定方法流程图;
[0049]
图4为本发明另一实施例提供一种知识图谱嵌入向量确定装置示意图。
具体实施方式
[0050]
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0051]
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0052]
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0053]
第一方面,本发明实施例提供一种知识图谱嵌入向量确定方法,如图1所示,该方法包括:
[0054]
s101,根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量。
[0055]
本实施例中,首先获取经过关系增强后的第一属性节点知识图谱和第一实体节点知识图谱,进一步地将第一属性节点知识图谱和第一实体节点知识图谱分别输入至图卷积神经网络(gcn)中,以利用图卷积神经网络输出第一属性节点知识图谱中各个属性节点的属性嵌入向量,与不同属性节点之间的属性节点关系嵌入向量,并利用图卷积神经网络确定第一实体节点知识图谱中实体节点的实体嵌入向量。
[0056]
在一个示例中,本实施例中的实体节点包括属性节点和非属性节点,属性节点为实体节点的子集,即属性节点为实体节点的一部分,第一属性节点知识图谱为第一实体节点知识图谱的子集,即第一属性节点知识图谱为第一实体节点图谱的子集,所述第一属性节点知识图谱和所述第一实体节点知识图谱是经过关系增强后的。
[0057]
在一个示例中,本实施例中使用预设关系增强策略对初始属性节点知识图谱和初始实体节点知识图谱进行关系增强,以增加初始属性节点知识图谱中的属性节点关系和初始实体节点知识图谱中的实体节点关系,以确定第一属性节点知识图谱和第一实体节点知识图谱。具体地,预设关系增强策略可以包括:为所述初始属性节点知识图谱和所述初始实体节点知识图谱的每条边引入反向边、在所述初始属性节点知识图谱和所述初始实体节点知识图谱增加自循环关系,其中,知识图谱中的边用于表示节点关系。
[0058]
s102,根据所述属性节点关系嵌入向量更新所述属性节点的所述属性嵌入向量,确定各个所述属性节点的第一嵌入向量。
[0059]
本实施例中,在确定第一属性节点知识图谱中各个属性节点的属性嵌入向量和属性节点关系嵌入向量,则利用确定的属性节点关系嵌入向量,对各个属性节点的属性嵌入向量进行更新,以确定各个属性节点的第一嵌入向量。
[0060]
s103,根据预设关系因子对所述第一实体节点知识图谱的实体节点关系嵌入向量进行更新,确定第一实体节点关系嵌入向量。
[0061]
本实施例中,在确定第一实体节点知识图谱之后,则利用预设关系因子,对第一实体节点知识图谱的实体节点关系嵌入向量进行更新,以确定第一实体节点关系嵌入向量,从而可以准确地确定各个实体节点之间的实体节点关系。
[0062]
在一个示例中,本实施例通过第三公式确定第一实体节点关系嵌入向量,第三公式具体如下:
[0063]hr'
=w
relhr

[0064]
其中,h
r'
为第一实体节点关系嵌入向量,w
rel
为预设关系因子,hr为第一实体节点知识图谱的实体节点关系嵌入向量。
[0065]
s104,根据所述第一嵌入向量和所述第一实体节点关系嵌入向量对所述第一实体节点知识图谱进行更新,确定第二实体节点知识图谱。
[0066]
本实施例中,在执行s102和s103之后,在确定各个属性节点的第一嵌入向量和第一实体节点关系嵌入向量之后,则利用第一嵌入向量更新第一实体节点知识图谱中的属性节点的嵌入向量进行替换,同时利用第一实体节点关系嵌入向量对第一实体节点知识图谱的实体节点关系嵌入向量进行替换,从而确定第二实体节点知识图谱,即第二实体节点关系图谱中属性节点的嵌入向量为第一嵌入向量,非属性节点的嵌入向量为第一实体节点知识图谱中的非属性节点的嵌入向量,第二实体节点关系图谱中不同实体节点之间的节点关系嵌入向量,为第一实体节点关系嵌入向量。
[0067]
s105,根据所述第二实体节点知识图谱中所述第一实体节点关系嵌入向量,确定各个所述实体节点的第二嵌入向量。
[0068]
本实施例中,在执行步骤s104之后,则利用第二实体节点知识图谱中的第一实体节点嵌入向量,对第二实体节点知识图谱中的实体节点的嵌入向量进行更新,从而确定第二实体节点知识图谱中各个实体节点的第二嵌入向量。
[0069]
s106,根据所述第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量。
[0070]
本实施例中,在执行s105之后,首先根据预设关系因子和第一实体节点关系嵌入向量,确定第二实体节点知识图谱中的第二实体节点关系嵌入向量,进一步的,利用第二嵌
入向量和第二实体节点关系嵌入向量,确定第二实体节点知识图谱中各个实体节点的目标嵌入向量。
[0071]
在一个示例中,本实施例中通过第四公式确定第二实体节点关系嵌入向量,第四公式具体如下:
[0072]hr”=w
relhr'

[0073]
其中,h
r”为第二实体节点关系嵌入向量。
[0074]
在一个示例中,本实施例通过第五公式确定目标嵌入向量,第五公式具体如下:
[0075]
x=φ(h
u'
,h
r”);
[0076]
其中,x为目标嵌入向量,φ为组合函数,h
u'
为第二嵌入向量。
[0077]
在一个示例中,本实施例中的组合函数可以包括相加、相乘和循环相关三种方式。
[0078]
本发明实施例提供的知识图谱嵌入向量确定方法,通过使用图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量,可以在对知识图谱的稀疏性增强之后,准确地掌握各个属性节点的第一嵌入向量,从而实现属性知识的汇聚,进一步的,通过利用预设关系因子对实体节点知识图谱的实体节点关系嵌入向量进行更新,可以准确地掌握实体节点知识图谱中各个实体节点之间的连接关系,进一步地根据实体节点知识图谱中第一实体节点关系嵌入向量,确定各个实体节点的第二嵌入向量,最后通过第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量,可以使汇聚了属性知识的实体节点的目标嵌入向量在实体节点知识图谱范围内流通,从而可以准确利用实体的属性信息准确地确定目标嵌入向量,进而提高了确定实体节点的目标嵌入向量的准确性。
[0079]
进一步地,在执行s102时,可以包括以下步骤:
[0080]
s1021,根据所述第一属性节点知识图谱,获取待更新属性节点所对应的邻接属性节点集合。
[0081]
本实施例中,确定第一嵌入向量时,首选获取第一属性节点知识图谱中待更新属性节点,即依次获取每个属性节点,以根据待更新属性节点在第一属性节点知识图谱中的位置,依次确定与该待更新属性节点相连接的邻接属性节点,从而确定邻接属性节点集合。
[0082]
s1022,根据所述邻接属性节点集合,确定邻接属性关系集合;
[0083]
本实施例中,在确定邻接属性节点集合之后,则统计各邻接属性节点与待更新属性节点之间的邻接属性节点关系向量,以确定邻接属性关系集合。
[0084]
s1023,根据所述邻接属性节点集合中各个邻接属性节点的邻接属性节点嵌入向量、所述邻接属性关系集合中各个邻接关系的邻接属性节点关系嵌入向量、第一嵌入因子和预设组合函数,确定所述待更新属性节点的第一嵌入向量。
[0085]
本实施例中,在确定待更新属性节点和邻接属性关系集合之后,则根据所述邻接属性节点集合中各个邻接属性节点的邻接属性节点嵌入向量、所述邻接属性关系集合中各个邻接关系的邻接属性节点关系嵌入向量、第一嵌入因子和预设组合函数,确定所述待更新属性节点的第一嵌入向量。
[0086]
在一个示例中,本实施例通过第一公式确定第一嵌入向量,所述第一公式具体如下:
[0087][0088]
其中,hu表示待更新属性节点的第一嵌入向量,n
attr
(u)表示待更新属性节点u对应邻接属性关系集合,v表示与待更新属性节点的邻接属性节点,r表示待更新属性节点与邻接属性节点之间的邻接属性连接关系,w
attr(r)
表示第一预设嵌入因子,φ表示组合函数,hv表示邻接属性节点嵌入向量,hr表示邻接属性节点关系嵌入向量。
[0089]
在一个示例中,本实施例中的w
attr(r)
是根据邻接属性连接关系的方向确定的,具体通过第六公式确定w
attr(r)
,具体公式如下:
[0090][0091]
其中,ro为邻接属性关系集合中的以待更新属性节点为起点的出边关系集合,r
invo
为邻接属性关系集合中以待更新属性节点为终点的入边关系集合,r
slef-loopo
为邻接属性关系集合中待更新属性节点的自循环关系集合。
[0092]
进一步地,本实施例在执行s105时,可以包括以下步骤:
[0093]
s1051,根据所述第一实体节点知识图谱,获取待更新实体节点所对应的邻接实体节点集合。
[0094]
本实施例中,确定第二嵌入向量时,首选获取第二实体节点知识图谱中待更新实体节点,即依次获取每个实体节点,以根据待更新实体节点在第一实体节点知识图谱中的位置,依次确定与该待更新实体节点相连接的邻接实体节点,从而确定邻接实体节点集合。
[0095]
s1052,根据所述邻接实体节点集合,确定邻接实体关系集合。
[0096]
本实施例中,在确定邻接实体节点集合之后,则统计各邻接实体节点与待更新实体节点之间的邻接实体节点关系向量,以确定邻接实体关系集合。
[0097]
s1053,根据所述邻接实体节点集合中各个邻接实体节点的邻接实体节点嵌入向量、所述邻接实体关系集合中各个邻接实体关系的邻接实体节点关系嵌入向量、第二预设嵌入因子和预设组合函数,确定所述待更新实体节点的第二嵌入向量。
[0098]
本实施例中,在确定待更新实体节点和邻接实体关系集合之后,则根据所述邻接实体节点集合中各个邻接实体节点的邻接实体节点嵌入向量、所述邻接实体关系集合中各个邻接实体关系的邻接实体节点关系嵌入向量、第二预设嵌入因子和预设组合函数,确定所述待更新实体节点的第二嵌入向量。
[0099]
在一个示例中,本实施例通过第二公式确定所述第二嵌入向量,所述第二公式具体如下:
[0100][0101]
其中,h
u'
表示待更新实体节点的第一嵌入向量,n
attr
(u')表示待更新实体节点u'对应邻接属性关系集合,v'表示与待更新实体节点的邻接实体节点,r'表示待更新实体节点与邻接实体节点之间的邻接实体连接关系,w
(r)
表示第二预设嵌入因子,φ表示组合函
数,h
v'
表示邻接实体节点嵌入向量,h
r'
表示邻接实体节点关系嵌入向量。
[0102]
进一步地,本实施例还包括以下步骤:
[0103]
s107,获取初始属性节点知识图谱和初始实体节点知识图谱。
[0104]
本实施例中,首先收集信息以构建初始实体节点知识图谱,进一步的,对初始实体节点知识图谱中各实体节点进行分类,以确定属性节点和非属性节点,进行地利用属性节点构建初始属性节点知识图谱。
[0105]
在一个示例中,以主流价值观知识图谱为例,可以通过“人机结合”的方法构建主流价值观知识图谱,如图2所示,为本发明另一实施例提供的主流价值观知识图谱构建流程图,在构建主流价值观图谱中的过程中,首先社科专家对主流价值观知识图谱顶层知识——价值观概念进行定义与层次划分。
[0106]
进一步地,表1列举了实体类别与实体对应的关系。
[0107]
表1
[0108][0109][0110]
进一步地,还可以通过下列方法对主流价值观知识图谱进行扩充,包括:
[0111]
(1)对核心词、核心主词等词汇类实体,通过百度汉语,对释义、近义词、反义词以及例句等属性信息进行爬取;
[0112]
(2)极性为“正”的实体便于大规模、自动化收集,负向实体,例如负面人物、封禁图书、封禁影视剧等,采用人工收集的方式,进行负向实体的扩充;
[0113]
(3)增强词汇类实体的语义信息,通过对近义词、反义词关系进行了扩充,规定词汇的近义词包含其自身,反义词则增加该词汇近义词的反义词,以及反义词的近义词,以增强实体间的连接关系。
[0114]
具体更新后的主流价值观知识图谱中各类别实体的规模明细数据见下表2。
[0115]
表2
[0116][0117]
其中,价值观概念、核心主词、核心词三类实体由社会专家进行收集、标注,其余类别的实体信息通过爬虫、知识库数据迁移、基于规则的知识推理等方式进行收集、扩充。
[0118]
s108,根据预设关系增强策略对所述初始属性节点知识图谱和所述初始实体节点知识图谱进行增强。
[0119]
本实施例中,在得到初始属性节点知识图谱和初始实体节点知识图谱之后,则利用预设关系增强策略对初始属性节点知识图谱中各个属性节点之间的连接关系进行增强,以增加不同属性节点之间的连接关系,并利用预设关系增强策略对初始实体节点知识图谱中各个实体节点之间的连接关系进行增强,以增加不同实体节点之间的连接关系。
[0120]
进一步地,本实施例的知识图谱嵌入向量确定方法还可以包括以下步骤:
[0121]
s109,基于激活函数层与sigmoid层,确定所述目标嵌入向量对应的概率分布分数。
[0122]
本实施例中,通过第七公式和第八公式确定概率分布分数。
[0123]
第七公式具体如下:
[0124]
x'=relu(wx+b);
[0125]
其中,x'表示第一目标嵌入向量,relu表示激活函数,w表示第一计算因子,b表示第二计算因子。
[0126]
第八公式具体如下:
[0127]
score=sigmoid(x');
[0128]
其中,score表示概率分布函数,sigmoid表示激活函数。
[0129]
s110,根据所述概率分布分数确定损失值,其中,所述损失值用于更新预设关系因子。
[0130]
本实施例中,通过第九公式确定损失值。
[0131]
第九公式具体如下:
[0132]
loss=bce loss(score,label);
[0133]
其中,loss表示损失值,bce loss表示损失函数,label表示真实标签。
[0134]
本发明另一实施例提供一种知识图谱嵌入向量确定方法,如图3所示,包括:
[0135]
在确定知识图谱嵌入向量时,首先收集构建知识图谱的信息,以构建初始实体节
点知识图谱,进一步地,对初始实体节点知识图谱中的实体节点进行分别,确定实体节点中的属性节点和非属性节点,以利用属性节点确定初始属性节点知识图谱,进而确定初始实体节点知识图谱和初始属性节点知识图谱。
[0136]
进一步地,根据预设关系增强策略分别初始实体节点知识图谱和初始属性节点知识图谱进行关系增强,以确定第一属性节点知识图谱和第一实体节点知识图谱,进一步地,根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量。
[0137]
进一步地,在第一属性节点知识图谱中获取待更新属性节点,即依次获取每个属性节点,以根据待更新属性节点在第一属性节点知识图谱中的位置,依次确定与该待更新属性节点相连接的邻接属性节点,从而确定邻接属性节点集合,并统计各邻接属性节点与待更新属性节点之间的邻接属性节点关系向量,以确定邻接属性关系集合,最后基于第一公式,根据所述邻接属性节点集合中各个邻接属性节点的邻接属性节点嵌入向量、所述邻接属性关系集合中各个邻接关系的邻接属性节点关系嵌入向量、第一嵌入因子和预设组合函数,确定所述待更新属性节点的第一嵌入向量。
[0138]
同时,根据预设关系因子,对第一实体节点知识图谱的实体节点关系嵌入向量进行更新,以确定第一实体节点关系嵌入向量,以利用第一嵌入向量和第一实体节点关系嵌入向量对第一实体节点知识图谱进行更新,确定第二实体节点知识图谱,并在第二实体节点知识图谱中获取待更新实体节点,即依次获取每个实体节点,以根据待更新实体节点在第二实体节点知识图谱中的位置,依次确定与该待更新实体节点相连接的邻接实体节点,从而确定邻接实体节点集合,进一步地统计各邻接实体节点与待更新实体节点之间的邻接实体节点关系向量,以确定邻接实体关系集合,最后基于第二公式,根据所述邻接实体节点集合中各个邻接实体节点的邻接实体节点嵌入向量、所述邻接实体关系集合中各个邻接实体关系的邻接实体节点关系嵌入向量、第二预设嵌入因子和预设组合函数,确定所述待更新实体节点的第二嵌入向量。
[0139]
进一步地,根据预设关系因子和第一实体节点关系嵌入向量确定第二实体节点关系嵌入向量,以基于第五公式,根据第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量。
[0140]
进一步地,基于激活函数层与sigmoid层,确定所述目标嵌入向量对应的概率分布分数,根据所述概率分布分数确定损失值,以根据损失值用于更新预设关系因子。
[0141]
本发明另一实施例提供知识图谱嵌入向量确定装置,如图4所示,该知识图谱嵌入向量确定装置,包括:
[0142]
第一确定模块401,用于根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量,其中,所述实体节点包括所述属性节点和非属性节点,所述属性节点为所述实体节点的子集,所述第一属性节点知识图谱为所述第一实体节点知识图谱的子集,所述第一属性节点知识图谱和所述第一实体节点知识图谱是经过关系增强后的;
[0143]
第二确定模块402,用于根据所述属性节点关系嵌入向量更新所述属性节点的所
述属性嵌入向量,确定各个所述属性节点的第一嵌入向量;
[0144]
第一更新模块403,用于根据预设关系因子对所述第一实体节点知识图谱的所述实体节点关系嵌入向量进行更新,确定第一实体节点关系嵌入向量;
[0145]
第二更新模块404,用于根据所述第一嵌入向量和所述第一实体节点关系嵌入向量对所述第一实体节点知识图谱进行更新,确定第二实体节点知识图谱;
[0146]
第三确定模块405,用于根据所述第二实体节点知识图谱中所述第一实体节点关系嵌入向量,更新所述实体节点的所述实体嵌入向量,确定各个所述实体节点的第二嵌入向量;
[0147]
第四确定模块406,用于根据所述第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量,其中,所述第二实体节点关系嵌入向量是根据所述预设关系因子和所述第一实体节点关系嵌入向量确定的。
[0148]
本发明另一实施例提供一种电子设备,所述电子设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时基于本发明实施例所述的药物副作用预测方法。
[0149]
本发明另一实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例所述的药物副作用预测方法。
[0150]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0151]
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0152]
此外,存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram),存储器包括至少一个存储芯片。
[0153]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0154]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0155]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一
个方框或多个方框中指定的功能的步骤。
[0156]
在一个典型的配置中,电子设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0157]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。
[0158]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
[0159]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

技术特征:
1.一种知识图谱嵌入向量确定方法,其特征在于,包括:根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量,其中,所述实体节点包括所述属性节点和非属性节点,所述属性节点为所述实体节点的子集,所述第一属性节点知识图谱为所述第一实体节点知识图谱的子集,所述第一属性节点知识图谱和所述第一实体节点知识图谱是经过关系增强后的;根据所述属性节点关系嵌入向量更新所述属性节点的所述属性嵌入向量,确定各个所述属性节点的第一嵌入向量;根据预设关系因子对所述第一实体节点知识图谱的所述实体节点关系嵌入向量进行更新,确定第一实体节点关系嵌入向量;根据所述第一嵌入向量和所述第一实体节点关系嵌入向量对所述第一实体节点知识图谱进行更新,确定第二实体节点知识图谱;根据所述第二实体节点知识图谱中所述第一实体节点关系嵌入向量,更新所述实体节点的所述实体嵌入向量,确定各个所述实体节点的第二嵌入向量;根据所述第二嵌入向量和第二实体节点关系嵌入向量,确定各个所述实体节点的目标嵌入向量,其中,所述第二实体节点关系嵌入向量是根据所述预设关系因子和所述第一实体节点关系嵌入向量确定的。2.根据权利要求1所述的知识图谱嵌入向量确定方法,其特征在于,所述根据所述属性节点关系嵌入向量更新所述属性节点的所述属性嵌入向量,确定各个所述属性节点的第一嵌入向量,包括:根据所述第一属性节点知识图谱,获取待更新属性节点所对应的邻接属性节点集合;根据所述邻接属性节点集合,确定邻接属性关系集合;根据所述邻接属性节点集合中各个邻接属性节点的邻接属性节点嵌入向量、所述邻接属性关系集合中各个邻接关系的邻接属性节点关系嵌入向量、第一嵌入因子和预设组合函数,确定所述待更新属性节点的第一嵌入向量。3.根据权利要求2所述的知识图谱嵌入向量确定方法,其特征在于,所述根据所述邻接属性节点集合中各个邻接属性节点的邻接属性节点嵌入向量、所述邻接属性关系集合中各个邻接关系的邻接属性节点关系嵌入向量、第一嵌入因子和预设组合函数,确定所述待更新属性节点的第一嵌入向量,包括:根据第一公式确定所述第一嵌入向量,所述第一公式包括:其中,h
u
表示待更新属性节点的第一嵌入向量,n
attr
(u)表示待更新属性节点u对应邻接属性关系集合,v表示与待更新属性节点的邻接属性节点,r表示待更新属性节点与邻接属性节点之间的邻接属性连接关系,w
attr(r)
表示第一预设嵌入因子,φ表示组合函数,h
v
表示邻接属性节点嵌入向量,h
r
表示邻接属性节点关系嵌入向量。4.根据权利要求1所述的知识图谱嵌入向量确定方法,其特征在于,所述根据所述第二实体节点知识图谱中所述第一实体节点关系嵌入向量,确定各个所述实体节点的第二嵌入
向量,包括:根据所述第一实体节点知识图谱,获取待更新实体节点所对应的邻接实体节点集合;根据所述邻接实体节点集合,确定邻接实体关系集合;根据所述邻接实体节点集合中各个邻接实体节点的邻接实体节点嵌入向量、所述邻接实体关系集合中各个邻接实体关系的邻接实体节点关系嵌入向量、第二预设嵌入因子和预设组合函数,确定所述待更新实体节点的第二嵌入向量。5.根据权利要求4所述的知识图谱嵌入向量确定方法,其特征在于,所述根据所述邻接实体节点集合中各个邻接实体节点的邻接实体节点嵌入向量、所述邻接实体关系集合中各个邻接实体关系的邻接实体节点关系嵌入向量、第二预设嵌入因子和预设组合函数,确定所述待更新实体节点的第二嵌入向量,包括:根据第二公式确定所述第二嵌入向量,所述第二公式包括:其中,h
u'
表示待更新实体节点的第一嵌入向量,n
attr
(u')表示待更新实体节点u'对应邻接属性关系集合,v'表示与待更新实体节点的邻接实体节点,r'表示待更新实体节点与邻接实体节点之间的邻接实体连接关系,w
(r)
表示第二预设嵌入因子,φ表示组合函数,h
v'
表示邻接实体节点嵌入向量,h
r'
表示邻接实体节点关系嵌入向量。6.根据权利要求1所述的知识图谱嵌入向量确定方法,其特征在于,还包括:获取初始属性节点知识图谱和初始实体节点知识图谱;根据预设关系增强策略对所述初始属性节点知识图谱和所述初始实体节点知识图谱进行增强确定所述第一属性节点知识图谱和所述第一实体节点知识图谱,其中,所述预设关系增强策略包括以下至少之一:为所述初始属性节点知识图谱和所述初始实体节点知识图谱的每条边引入反向边、在所述初始属性节点知识图谱和所述初始实体节点知识图谱增加自循环关系。7.根据权利要求1所述的知识图谱嵌入向量确定方法,其特征在于,还包括:基于激活函数层与sigmoid层,确定所述目标嵌入向量对应的概率分布分数;根据所述概率分布分数确定损失值,其中,所述损失值用于更新预设关系因子。8.一种知识图谱嵌入向量确定装置,其特征在于,所述知识图谱嵌入向量确定装置,包括:第一确定模块,用于根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量,其中,所述实体节点包括所述属性节点和非属性节点,所述属性节点为所述实体节点的子集,所述第一属性节点知识图谱为所述第一实体节点知识图谱的子集,所述第一属性节点知识图谱和所述第一实体节点知识图谱是经过关系增强后的;第二确定模块,用于根据所述属性节点关系嵌入向量更新所述属性节点的所述属性嵌入向量,确定各个所述属性节点的第一嵌入向量;第一更新模块,用于根据预设关系因子对所述第一实体节点知识图谱的所述实体节点
关系嵌入向量进行更新,确定第一实体节点关系嵌入向量;第二更新模块,用于根据所述第一嵌入向量和所述第一实体节点关系嵌入向量对所述第一实体节点知识图谱进行更新,确定第二实体节点知识图谱;第三确定模块,用于根据所述第二实体节点知识图谱中所述第一实体节点关系嵌入向量,更新所述实体节点的所述实体嵌入向量,确定各个所述实体节点的第二嵌入向量;第四确定模块,用于根据所述第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量,其中,所述第二实体节点关系嵌入向量是根据所述预设关系因子和所述第一实体节点关系嵌入向量确定的。9.一种电子设备,其特征在于,所述电子设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时基于权利要求1至7中任一项所述的知识图谱嵌入向量确定方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一项所述的知识图谱嵌入向量确定方法。

技术总结
本发明提供一种知识图谱嵌入向量确定方法、装置、电子设备及存储介质,涉及知识图谱技术领域,该方法包括:根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量;根据属性节点关系嵌入向量,确定各个属性节点的第一嵌入向量;根据预设关系因子,确定第一实体节点关系嵌入向量;根据第一嵌入向量和第一实体节点关系嵌入向量,确定第二实体节点知识图谱;根据第二实体节点知识图谱中第一实体节点关系嵌入向量,确定各个实体节点的第二嵌入向量;根据第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量。体节点的目标嵌入向量。体节点的目标嵌入向量。


技术研发人员:刘秉权 邱忠银 单丽莉 孙承杰 刘远超 林磊
受保护的技术使用者:哈尔滨工业大学
技术研发日:2023.04.28
技术公布日:2023/8/1
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐