一种实体识别方法、装置、设备及介质
未命名
08-29
阅读:108
评论:0

1.本技术涉及人工智能技术领域,特别是涉及一种实体识别方法、装置、设备及介质。
背景技术:
2.自然文本通常以非结构化的序列形式被传播与记录,这些文本中存在着大量诸如人名、地名、组织和机构等表达具体概念的实体信息。可以理解的是,快速准确的识别非结构化序列文本中的实体信息是构建问答系统和推荐系统的关键技术之一。
3.然而,在众多数据形式中,非结构化序列文本中的实体识别最为复杂,需要同时考虑句法、语义和语境等特征。传统基于规则的信息抽取方法难以满足非结构化序列文本的实体识别需求。虽然可以通过人工阅读获取非结构化序列文本中的实体信息,但海量数据的实体识别工作是非人力所能及的。
4.鉴于上述问题,如何高效准确地识别非结构化序列文本中的实体,是该领域技术人员亟待解决的问题。
技术实现要素:
5.本技术的目的是提供一种实体识别方法、装置、设备及介质,以高效准确地识别非结构化序列文本中的实体。
6.为解决上述技术问题,本技术提供一种实体识别方法,包括:
7.获取输入的文本字符序列;
8.对所述文本字符序列中的各字符执行字符嵌入,以生成所述文本字符序列对应的向量序列;
9.枚举所述向量序列中的跨度单元,以确定文本中的实体区域及上下文区域;其中,所述跨度单元为所述向量序列中任意长度的连续子序列;
10.基于图卷积网络和自注意力机制生成各所述跨度单元对应的语义特征和语境特征的联合结果;
11.根据各所述联合结果确定对应所述跨度单元的实体类别。
12.优选地,所述对所述文本字符序列中的各字符执行字符嵌入,以生成所述文本字符序列对应的向量序列包括:
13.通过随机初始化生成特征矩阵;其中,所述特征矩阵的行数为所述字符的嵌入维度,所述特征矩阵的列数为所述文本字符序列中所述字符的数量;
14.根据所述特征矩阵生成所述文本字符序列对应的所述向量序列。
15.优选地,所述基于图卷积网络和自注意力机制生成各所述跨度单元对应的语义特征和语境特征的联合结果包括:
16.基于所述图卷积网络生成各所述跨度单元的语义特征向量;
17.基于所述自注意力机制根据所述语义特征向量获取各所述跨度单元对应的所述
语义特征和所述语境特征的所述联合结果;
18.根据非线性变换层输出各所述联合结果。
19.优选地,所述基于所述图卷积网络生成各所述跨度单元的语义特征向量包括:
20.将跨度序列由链式结构重构为图结构;其中,所述跨度序列是由多个所述跨度单元构成的序列;
21.通过双向图卷积层聚合所述图结构中各所述跨度单元的节点特征;其中,所述跨度单元的字符向量作为所述跨度单元的所述节点特征;
22.对各所述节点特征进行累加并求平均值,以得到各所述跨度单元对应的所述语义特征向量。
23.优选地,所述基于所述自注意力机制根据所述语义特征向量获取各所述跨度单元对应的所述语义特征和所述语境特征的所述联合结果包括:
24.根据各所述跨度单元的所述语义特征向量构建特征重构序列;
25.通过双向长短期记忆网络获取所述特征重构序列中各所述跨度单元对应的状态特征向量,以生成状态特征向量矩阵;
26.基于所述自注意力机制和所述状态特征向量矩阵,分别将各所述跨度单元对应的所述语义特征与对应的各所述语境特征聚合,以生成各所述跨度单元对应的所述语义特征和所述语境特征的所述联合结果;
27.其中,所述跨度单元的所述语义特征位于所述状态特征向量矩阵中,所述语境特征是所述状态特征向量矩阵中除对应的所述语义特征外的向量集合。
28.优选地,所述根据非线性变换层输出各所述联合结果包括:
29.对所述语义特征和所述语境特征进行深度建模,以生成多次迭代后的各所述联合结果;
30.根据所述非线性变换层输出多次迭代后的各所述联合结果。
31.优选地,所述根据各所述联合结果确定对应所述跨度单元的实体类别包括:
32.构建线性分类器,通过归一化指数函数获取各所述跨度单元的所述实体类别的概率分布信息;
33.根据各所述概率分布信息对应确定各所述跨度单元的所述实体类别。
34.为解决上述技术问题,本技术还提供一种实体识别装置,包括:
35.字符获取模块,用于获取输入的文本字符序列;
36.字符嵌入模块,用于对所述文本字符序列中的各字符执行字符嵌入,以生成所述文本字符序列对应的向量序列;
37.枚举模块,用于枚举所述向量序列中的跨度单元,以确定文本中的实体区域及上下文区域;其中,所述跨度单元为所述向量序列中任意长度的连续子序列;
38.生成模块,用于基于图卷积网络和自注意力机制生成各所述跨度单元对应的语义特征和语境特征的联合结果;
39.确定模块,用于根据各所述联合结果确定对应所述跨度单元的实体类别。
40.为解决上述技术问题,本技术还提供一种实体识别设备,包括:
41.存储器,用于存储计算机程序;
42.处理器,用于执行所述计算机程序时实现上述的实体识别方法的步骤。
43.为解决上述技术问题,本技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的实体识别方法的步骤。
44.本技术所提供的实体识别方法,通过获取输入的文本字符序列;对文本字符序列中的各字符执行字符嵌入,以生成文本字符序列对应的向量序列;枚举向量序列中的跨度单元,以确定文本中的实体区域及上下文区域;其中,跨度单元为向量序列中任意长度的连续子序列;基于图卷积网络和自注意力机制生成各跨度单元对应的语义特征和语境特征的联合结果;根据各联合结果确定对应跨度单元的实体类别。由此可知,上述方案在进行实体识别的过程中,通过枚举的方式考虑了文本中所有字符子序列为潜在实体,能够识别文本中重叠的实体信息;同时考虑了文本序列自身的语义信息及剩余字符构成的语境信息,有效提高了实体识别的精度,提高了实体识别的准确率。
45.此外,本技术实施例还提供了一种实体识别装置、设备及介质,效果同上。
附图说明
46.为了更清楚地说明本技术实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
47.图1为本技术实施例提供的一种实体识别方法的流程图;
48.图2为本技术实施例提供的文本字符嵌入过程的示意图;
49.图3为本技术实施例提供的跨度单元枚举过程的示意图;
50.图4为本技术实施例提供的潜在实体信息和上下文信息联合建模过程的示意图;
51.图5为本技术实施例提供的双向长短期记忆网络的示意图;
52.图6为本技术实施例提供的一种实体识别装置的示意图;
53.图7为本技术实施例提供的一种实体识别设备的示意图。
具体实施方式
54.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本技术保护范围。
55.本技术的核心是提供一种实体识别方法、装置、设备及介质,以高效准确地识别非结构化序列文本中的实体。
56.为了使本技术领域的人员更好地理解本技术方案,下面结合附图和具体实施方式对本技术作进一步的详细说明。
57.目前,传统基于规则的信息抽取方法难以满足非结构化序列文本的实体识别需求。人类虽然可以通过阅读获取非结构化序列文本中的实体信息,但海量数据的实体识别工作非人力所能及。因此,本技术实施例提供了一种实体识别方法,以高效准确地识别非结构化序列文本中的实体。图1为本技术实施例提供的一种实体识别方法的流程图。如图1所示,方法包括:
58.s10:获取输入的文本字符序列。
59.首先,获取输入的文本字符序列,具体通过语料库获取输入的字符表,即文本字符序列。可以理解的是,语料库是存储大量自然语言文本的数据库,这些自然语言文本都是实体识别算法训练或服务的潜在对象。
60.s11:对文本字符序列中的各字符执行字符嵌入,以生成文本字符序列对应的向量序列。
61.由于计算机无法直接对文本字符执行计算,因此需要将输入的文本字符映射至向量空间,以便后续计算,具体地,对文本字符序列中的各字符执行字符嵌入,以生成文本字符序列对应的向量序列。
62.作为一种优选的实施例,字符嵌入过程具体包括:
63.s110:通过随机初始化生成特征矩阵;其中,特征矩阵的行数为字符的嵌入维度,特征矩阵的列数为文本字符序列中字符的数量。
64.s111:根据特征矩阵生成文本字符序列对应的向量序列。
65.在具体实施中,随机初始化一个特征矩阵ev×d作为文本字符的嵌入矩阵。其中,在特征矩阵ev×d中,v是文本字符序列中字符的数量,d代表每个字符的嵌入维度。图2为本技术实施例提供的文本字符嵌入过程的示意图。如图2所示,在字符嵌入后,输入的文本中每个字符(token)都可以根据其在字符表中的id从特征矩阵e中索引出各自的向量表示。
66.例如,假设输入的文本字符序列为d:{w1,w2,
…
,wn},n为输入的文本字符序列的字符数量。经字符嵌入后,文本字符序列对应的向量序列为d':{e1,e2,
…
,en},其中,ei是维度为d的字符向量,i∈{1,2,
…
,n}。
67.s12:枚举向量序列中的跨度单元,以确定文本中的实体区域及上下文区域。
68.进一步地,定义跨度单元为向量序列中任意长度的连续子序列,每一个跨度单元都被认为是一个待识别的潜在实体区域。例如,“武汉长江大桥”是一个实体,其中包含的“武汉”也是一个实体。具体地,假设输入的文本字符序列的字符数量为n,则可以枚举出个跨度单元。假设输入的文本字符序列对应的向量序列为d':{e1,e2,
…
,en},则经过枚举后可得到跨度集合其中,i∈{1,2,
…
,n},k∈{1,2,
…
,n}。图3为本技术实施例提供的跨度单元枚举过程的示意图。如图3所示,对于字符数为4的文本字符序列,一共可以枚举出10个跨度单元。
69.s13:基于图卷积网络和自注意力机制生成各跨度单元对应的语义特征和语境特征的联合结果。
70.在具体实施中,为了有效提高实体识别的精度,在识别文本中字符序列是否为实体时,需考虑该序列自身的语义信息且充分考虑由剩余字符构成的上下文语境信息。具体地,基于图卷积网络和自注意力机制生成各跨度单元对应的语义特征和语境特征的联合结果包括:
71.s130:基于图卷积网络生成各跨度单元的语义特征向量。
72.s131:基于自注意力机制根据语义特征向量获取各跨度单元对应的语义特征和语境特征的联合结果。
73.s132:根据非线性变换层输出各联合结果。
74.图4为本技术实施例提供的潜在实体信息和上下文信息联合建模过程的示意图。如图4所示,为了便于理解,以i=k=3的跨度单元为例,对建模过程进行详细介绍。
75.在具体实施中,作为一种优选的实施例,基于图卷积网络生成各跨度单元的语义特征向量包括:
76.将跨度序列由链式结构重构为图结构;其中,跨度序列是由多个跨度单元构成的序列;
77.通过双向图卷积层聚合图结构中各跨度单元的节点特征;其中,跨度单元的字符向量作为跨度单元的节点特征;
78.对各节点特征进行累加并求平均值,以得到各跨度单元对应的语义特征向量。
79.具体地,将链式结构的跨度序列重构为图结构。需要注意的是,跨度序列是由多个跨度单元构成的粗粒度序列。在重构过程中,跨度单元中的字符向量作为节点特征,时序靠前的节点可以指向后续节点。如图4所示,跨度单元中存在的三个节点,其中,e3可以指向e4和e5,而e4只能指向e5。
80.进一步构造双向图卷积层(bigcn),通过双向图卷积层聚合图结构中各跨度单元的节点特征。具体地,通过非线性函数relu和三组预设已知的特征参数(w1,b1)、(w2,b2)和(w3,b3)对邻域节点特征进行非线性变换,以更新每个节点的特征向量,具体过程如下:
[0081][0082][0083][0084]
其中,w1,w2分别是维度为d
×
d的参数矩阵,w3是维度为d
×
3d的参数矩阵,b1,b2,b3分别是维度为d
×
1的参数向量。relu(x)=max(0,x),是向量拼接,j=i。
[0085]
最后对各节点特征进行累加并求平均值,以得到各跨度单元对应的语义特征向量es:
[0086][0087]
其中,∑x代表累加操作。
[0088]
在得到各跨度单元对应的语义特征向量es之后,进一步基于自注意力机制根据语义特征向量获取各跨度单元对应的语义特征和语境特征的联合结果,具体包括:
[0089]
根据各跨度单元的语义特征向量构建特征重构序列;
[0090]
通过双向长短期记忆网络获取特征重构序列中各跨度单元对应的状态特征向量,以生成状态特征向量矩阵;
[0091]
基于自注意力机制和状态特征向量矩阵,分别将各跨度单元对应的语义特征与对应的各语境特征聚合,以生成各跨度单元对应的语义特征和语境特征的联合结果;
[0092]
其中,跨度单元的语义特征位于状态特征向量矩阵中,语境特征是状态特征向量矩阵中除对应的语义特征外的向量集合。
[0093]
在具体实施中,使用语义特征向量es替换最初的跨度单元的向量序列得到特征重构序列,即将d':{e1,e2,e3,
…
,en}替换为d":{e1,e2,es,
…
,en}。
[0094]
进一步构造双向长短期记忆网络(bilstm),通过双向长短期记忆网络获取特征重构序列中各跨度单元对应的状态特征向量,以生成状态特征向量矩阵。具体地,图5为本技术实施例提供的双向长短期记忆网络的示意图。如图5所示,e
t
为当前时刻的输入特征向量,是特征重构序列d"中的特征向量。h
t-1
和c
t-1
分别为前一个时刻的输出的两个特征向量。需要注意的是,在本实施例中t代表输入文本中字符的位置。图5所示的计算过程如下:
[0095][0096][0097][0098][0099]ct
=f
t
·ct-1
+i
t
·ct
';
[0100]ht
=o
t
·
tanh(c
t
);
[0101]
其中,e
t
为特征重构序列d"中t位置上的特征向量,h
t-1
和c
t-1
是由前一时刻的e
t-1
计算所得。wf,wi,wo,wc是维度为d
×
2d的参数矩阵,bf,bi,bo,bc是维度为d
×
1的参数向量。1的参数向量。是向量拼接。x
·
y代表向量中对应元素相乘。最终,通过双向长短期记忆网络在每个时刻t输出状态特征向量h
t
,并构成状态特征向量矩阵db:{h1,h2,hs,h6,
…
,hn}。
[0102]
进一步基于自注意力机制和状态特征向量矩阵db,分别将各跨度单元对应的语义特征与对应的各语境特征之间存在的依赖关系进行聚合,以生成各跨度单元对应的语义特征和语境特征的联合结果。
[0103]
需要注意的是,对于状态特征向量hs来说,hs为跨度单元的语义特征,在以hs为待预测实体的时刻,其余信息均为语境特征,即从状态特征向量矩阵db中减去hs即为hs对应的语境特征,具体为{d
b-hs}。其具体聚合过程如下:
[0104][0105]
其中,wq,wk,wv分别是维度为d
×
d的参数矩阵,softmax为归一化指数函数,hs是跨度单元的特征向量,维度为1
×
d。db是双向长短期记忆网络的状态特征向量构成的特征矩阵,维度为n
×
d。hs'作为语义特征和语境特征的联合结果,向量维度为1
×
d。t为向量转置。
[0106]
最后,作为一种优选的实施例,根据非线性变换层输出各联合结果包括:
[0107]
对语义特征和语境特征进行深度建模,以生成多次迭代后的各联合结果;
[0108]
根据非线性变换层输出多次迭代后的各联合结果。
[0109]
在具体实施中,重复执行通过双向长短期记忆网络获取特征重构序列中各跨度单元对应的状态特征向量及其后续步骤共l次,从而对语义特征和语境特征进行深度建模,最终输出的联合结果表示为将特征向量作为输入,根据非线性变换层输出多次迭代后
的各联合结果。
[0110]
其中,对于跨度单元的语义特征和语境特征的联合结果r
33
具体如下:
[0111][0112]
其中,w
r2
是维度为d
×
d的参数矩阵,b
r1
,b
r2
是维度为d
×
1的参数向量,max(x,y)的输出为x和y中较大的值。为跨度单元在文本字符序列d中的联合结果。
[0113]
以此,最终实现了语义特征和语境特征的联合结果的生成,以便后续对实体的识别。
[0114]
s14:根据各联合结果确定对应跨度单元的实体类别。
[0115]
最后,在得到了语义特征和语境特征的联合结果之后,根据各联合结果确定对应跨度单元的实体类别。
[0116]
作为一种优选的实施例,根据各联合结果确定对应跨度单元的实体类别具体包括:
[0117]
s140:构建线性分类器,通过归一化指数函数获取各跨度单元的实体类别的概率分布信息。
[0118]
s141:根据各概率分布信息对应确定各跨度单元的实体类别。
[0119]
在具体实施中,首先构造一个线性分类器,由归一化指数函数softmax计算各跨度单元的实体类别的概率分布信息,最后根据各概率分布信息对应确定各跨度单元的实体类别。
[0120][0121]
其中,w
p
是维度为d
type
×
d的参数矩阵,b
p
是维度为d
type
×
1的参数向量,d
type
的值等于语料库中实体类别的数量+1(将非实体设定为一类实体)。分类器的输出结果是维度为d
type
×
1的向量,其中每一个维度表示跨度单元所代表的字符序列属于某一类实体的概率分布信息,具体为概率值。
[0122]
以跨度单元为例,由归一化指数函数softmax计算跨度单元的实体类别的概率分布信息:
[0123][0124]
其中,w
p
是维度为d
type
×
d的参数矩阵,b
p
是维度为d
type
×
1的参数向量,等d
type
的值等于语料库中实体类别的数量+1(将非实体设定为一类实体)。分类器的输出结果是维度为d
type
×
1的向量,其中每一个维度表示跨度单元所代表的字符序列属于某一类实体的概率分布信息,具体为概率值。比如语料库中一共存在4种实体,将非实体设定为一类实体,得到概率分布信息中应包含5个概率值。若第三个维度的值最大,则跨度单元所代表的字符序列{w3,w4,w5}属于第二类实体;若第一个维度的值最大,则跨度单元所代表的字符序列{w3,w4,w5}属于非实体。
[0125]
以此,上述实体识别方法,通过获取输入的文本字符序列;对文本字符序列中的各
array,pla)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(central processing unit,cpu);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有图形处理器(graphics processing unit,gpu),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括人工智能(artificial intelligence,ai)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0139]
存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的实体识别方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括windows、unix、linux等。数据203可以包括但不限于实体识别方法涉及到的数据。
[0140]
在一些实施例中,实体识别设备还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。
[0141]
本领域技术人员可以理解,图7中示出的结构并不构成对实体识别设备的限定,可以包括比图示更多或更少的组件。
[0142]
本实施例中,实体识别设备包括存储器和处理器。存储器用于存储计算机程序。处理器用于执行计算机程序时实现如上述实施例中所提到的实体识别的方法的步骤。通过获取输入的文本字符序列;对文本字符序列中的各字符执行字符嵌入,以生成文本字符序列对应的向量序列;枚举向量序列中的跨度单元,以确定文本中的实体区域及上下文区域;其中,跨度单元为向量序列中任意长度的连续子序列;基于图卷积网络和自注意力机制生成各跨度单元对应的语义特征和语境特征的联合结果;根据各联合结果确定对应跨度单元的实体类别。由此可知,上述方案在进行实体识别的过程中,通过枚举的方式考虑了文本中所有字符子序列为潜在实体,能够识别文本中重叠的实体信息;同时考虑了文本序列自身的语义信息及剩余字符构成的语境信息,有效提高了实体识别的精度,提高了实体识别的准确率。
[0143]
最后,本技术还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
[0144]
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0145]
本实施例中,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执
行时实现如上述方法实施例中记载的步骤。通过获取输入的文本字符序列;对文本字符序列中的各字符执行字符嵌入,以生成文本字符序列对应的向量序列;枚举向量序列中的跨度单元,以确定文本中的实体区域及上下文区域;其中,跨度单元为向量序列中任意长度的连续子序列;基于图卷积网络和自注意力机制生成各跨度单元对应的语义特征和语境特征的联合结果;根据各联合结果确定对应跨度单元的实体类别。由此可知,上述方案在进行实体识别的过程中,通过枚举的方式考虑了文本中所有字符子序列为潜在实体,能够识别文本中重叠的实体信息;同时考虑了文本序列自身的语义信息及剩余字符构成的语境信息,有效提高了实体识别的精度,提高了实体识别的准确率。
[0146]
以上对本技术所提供的一种实体识别方法、装置、设备及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以对本技术进行若干改进和修饰,这些改进和修饰也落入本技术权利要求的保护范围内。
[0147]
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
技术特征:
1.一种实体识别方法,其特征在于,包括:获取输入的文本字符序列;对所述文本字符序列中的各字符执行字符嵌入,以生成所述文本字符序列对应的向量序列;枚举所述向量序列中的跨度单元,以确定文本中的实体区域及上下文区域;其中,所述跨度单元为所述向量序列中任意长度的连续子序列;基于图卷积网络和自注意力机制生成各所述跨度单元对应的语义特征和语境特征的联合结果;根据各所述联合结果确定对应所述跨度单元的实体类别。2.根据权利要求1所述的实体识别方法,其特征在于,所述对所述文本字符序列中的各字符执行字符嵌入,以生成所述文本字符序列对应的向量序列包括:通过随机初始化生成特征矩阵;其中,所述特征矩阵的行数为所述字符的嵌入维度,所述特征矩阵的列数为所述文本字符序列中所述字符的数量;根据所述特征矩阵生成所述文本字符序列对应的所述向量序列。3.根据权利要求1所述的实体识别方法,其特征在于,所述基于图卷积网络和自注意力机制生成各所述跨度单元对应的语义特征和语境特征的联合结果包括:基于所述图卷积网络生成各所述跨度单元的语义特征向量;基于所述自注意力机制根据所述语义特征向量获取各所述跨度单元对应的所述语义特征和所述语境特征的所述联合结果;根据非线性变换层输出各所述联合结果。4.根据权利要求3所述的实体识别方法,其特征在于,所述基于所述图卷积网络生成各所述跨度单元的语义特征向量包括:将跨度序列由链式结构重构为图结构;其中,所述跨度序列是由多个所述跨度单元构成的序列;通过双向图卷积层聚合所述图结构中各所述跨度单元的节点特征;其中,所述跨度单元的字符向量作为所述跨度单元的所述节点特征;对各所述节点特征进行累加并求平均值,以得到各所述跨度单元对应的所述语义特征向量。5.根据权利要求3所述的实体识别方法,其特征在于,所述基于所述自注意力机制根据所述语义特征向量获取各所述跨度单元对应的所述语义特征和所述语境特征的所述联合结果包括:根据各所述跨度单元的所述语义特征向量构建特征重构序列;通过双向长短期记忆网络获取所述特征重构序列中各所述跨度单元对应的状态特征向量,以生成状态特征向量矩阵;基于所述自注意力机制和所述状态特征向量矩阵,分别将各所述跨度单元对应的所述语义特征与对应的各所述语境特征聚合,以生成各所述跨度单元对应的所述语义特征和所述语境特征的所述联合结果;其中,所述跨度单元的所述语义特征位于所述状态特征向量矩阵中,所述语境特征是所述状态特征向量矩阵中除对应的所述语义特征外的向量集合。
6.根据权利要求5所述的实体识别方法,其特征在于,所述根据非线性变换层输出各所述联合结果包括:对所述语义特征和所述语境特征进行深度建模,以生成多次迭代后的各所述联合结果;根据所述非线性变换层输出多次迭代后的各所述联合结果。7.根据权利要求1至6任意一项所述的实体识别方法,其特征在于,所述根据各所述联合结果确定对应所述跨度单元的实体类别包括:构建线性分类器,通过归一化指数函数获取各所述跨度单元的所述实体类别的概率分布信息;根据各所述概率分布信息对应确定各所述跨度单元的所述实体类别。8.一种实体识别装置,其特征在于,包括:字符获取模块,用于获取输入的文本字符序列;字符嵌入模块,用于对所述文本字符序列中的各字符执行字符嵌入,以生成所述文本字符序列对应的向量序列;枚举模块,用于枚举所述向量序列中的跨度单元,以确定文本中的实体区域及上下文区域;其中,所述跨度单元为所述向量序列中任意长度的连续子序列;生成模块,用于基于图卷积网络和自注意力机制生成各所述跨度单元对应的语义特征和语境特征的联合结果;确定模块,用于根据各所述联合结果确定对应所述跨度单元的实体类别。9.一种实体识别设备,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的实体识别方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的实体识别方法的步骤。
技术总结
本申请公开了一种实体识别方法、装置、设备及介质,涉及人工智能技术领域。通过获取输入的文本字符序列;对文本字符序列中的各字符执行字符嵌入,以生成文本字符序列对应的向量序列;枚举向量序列中的跨度单元,以确定文本中的实体区域及上下文区域;基于图卷积网络和自注意力机制生成各跨度单元对应的语义特征和语境特征的联合结果;根据各联合结果确定对应跨度单元的实体类别。由此可知,上述方案在进行实体识别的过程中,通过枚举的方式考虑了文本中所有字符子序列为潜在实体,能够识别文本中重叠的实体信息;同时考虑了文本序列自身的语义信息及剩余字符构成的语境信息,有效提高了实体识别的精度,提高了实体识别的准确率。率。率。
技术研发人员:刘杰 万仟 魏罗娜 裴向东 陈新海 张庆阳 王庆林
受保护的技术使用者:中国人民解放军国防科技大学
技术研发日:2023.05.29
技术公布日:2023/8/28
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:具有增强效应的旋转式磁流变阻尼器的制作方法 下一篇:图像的显示补偿装置及方法与流程