一种基于图匹配神经网络的检索方法
未命名
09-29
阅读:133
评论:0
1.本发明涉及法律类案检索技术领域,具体为一种基于图匹配神经网络的检索方法。
背景技术:
2.法律类案检索是指根据输入的查询案例在法律判决文书数据库中检索与之最相关的案例。现有的法律类案检索技术方案多采用人工智能技术中的预训练语言模型进行构建。用户输入查询案例的文本内容后,现有的技术方案首先通过对案例文本内容进行数据预处理和编码处理。然后,将文本内容转化为高维向量,同时,在多维向量的基础上进行数学运算以达到理解案例文本内容的目的。最后,通过上述计算,将得到查询案例与法律判决文书数据库中各案例的相似性分数,对相似性分数进行降序排序向用户展示检索到的相关案例。
3.现有的法律类案检索技术方案多采用人工智能技术中的预训练语言模型进行搭建并应用。但是预训练语言模型通常是采用无标注语料库进行训练得到的一类模型方法。这种训练模式导致现有的技术方案只能计算得出检索案例与数据库中的候选案例的相似性分数,却不能展示计算相似性分数的过程或预训练模型的决策过程,对检索结果缺乏令人信服的解释。
4.法律判决文书是具有专业性强和内容繁杂的半结构化长文本数据,模型结果的可解释能力对法律类案检索具有重要作用,但是现有的技术方案缺乏这种能力。首先,由于使用无标注的数据进行模型训练,预训练语言模型对检索结果缺乏有效的可解释能力,即只能给用户提供相似性分数和检索结果,却不能解释检索到的案例为什么与查询案例最相似;其次,预训练语言模型通常受限于模型架构和计算资源消耗,用户难以输入完整的查询案例内容,这导致该类方法无法全面地理解查询案例和候选案例的内容,进一步造成检索结果的准确率下降。上述两类缺点不仅降低了法官或者法律从业人员使用类案检索技术的动力,而且也无法为用户提供有价值的检索信息。故此,我们提出了一种基于图匹配神经网络的检索方法和制备方法。
技术实现要素:
5.本发明的目的在于提供一种基于图匹配神经网络的检索方法,以解决上述背景技术中提出的问题。
6.为实现上述目的,本发明提供如下技术方案:一种基于图匹配神经网络的检索方法,具体包括以下步骤:
7.s1、构建法律案例要素图:根据输入的法律三元组信息,进行节点融合将法律案例文本转换为法律案例要素图;
8.s2、编码聚合图结构数据:基于构建的法律案例要素图,使用图神经网络对节点和连边信息进行编码和聚合操作,在向量空间中生成连续向量,再进行信息传递,以聚合连边
特征并获得关于查询案例和候选案例的图级表示信息;
9.s3、交互图间特征信息:对每个案例得到的图级表示进行基于注意力机制的交互运算,捕获图间的差异度,同时保留法律案例要素图谱间的匹配相关性系数(注意力系数),形成最终的图级表示向量;
10.s4、展示检索过程及结果:对图级表示向量采用余弦相似度算法,计算得到查询案例与候选案例的相似度分数,同时,利用图谱可视化技术和匹配相关性系数可视化展示法律案例要素图谱对的检索和匹配过程。
11.优选的,通过使用多层感知器(multi-layer perception,mlp)将节点和连边的语义信息映射到节点和边的初始向量。
12.优选的,通过使用多层感知器(multi-layer perception,mlp)将节点和连边的语义信息映射到节点和连边的初始向量,映射过程如下式所示:
[0013][0014][0015]
其中,是节点的初始特征向量,e
ij
是节点间连边的特征信息。
[0016]
优选的,在传播部分,gnn将一组节点表示映射到新的节点表示映射过程如下式所示:
[0017][0018][0019]
其中,f
message
是编码节点和连边特征信息的函数,f
node
是汇总节点隐藏层特征信息的求和函数;通过多层传播,每个节点的表示信息都将得到更新并累积邻居节点的信息。
[0020]
优选的,在聚合部分,聚合层将节点表示集合作为输入,并计算图级别表示聚合公式如下式所示:
[0021][0022]
通过聚合操作,将得到关于查询案例和候选案例的图级别表示信息。
[0023]
优选的,交互图间特征信息模块使用基于注意力机制的交互策略,对每个案件的图级表示信息进行细粒度的交互运算,以捕获图谱对中各关键元素间的细微差别,形成最终的图级表示向量。具体的交互过程如下:
[0024][0025][0026]
[0027][0028]
其中,f
message
和f
node
函数与上文提到的计算过程一样,f
match
是基于注意力机制的交互计算函数。
[0029]
优选的,跨图匹配策略中使用的注意力机制记录了法律案例要素图谱中节点对的匹配相关性系数,相关性系数的计算过程如下所示:
[0030][0031][0032]
其中,simh是余弦相似度计算函数,aj→i是相关性系数(注意力权重),μj→i捕获图中各个节点间的差异度。
[0033]
与现有技术相比,本发明的有益效果是:
[0034]
1、本发明采用的图匹配神经网络具有简洁的模型架构,与已有的技术方案相比,本技术方案的检索效率提高了约90%,这极大地增加了模型的检索效率和实用性。
[0035]
2、本发明将图匹配神经网络作为本技术方案的核心方法和骨干网络,利用图匹配网络具有的强大表示能力和优秀可解释能力,同时结合新的跨图匹配策略进一步增强模型理解案例文本的能力和检索性能,与现有的技术方案相比,本技术方案可有效提高约15%的检索准确率,最重要的是,它在保持最佳检索性能的同时,还可以展示法律案例要素图谱对检索和匹配过程的可视化图形,大大增强了模型的可解释能力。
[0036]
3、本发明可以可视化展示法律案例要素图谱对检索和匹配过程,通过可视化形式直观展示法律案例间的事实信息和逻辑关系,大大增强本技术方案对检索结果的可解释能力,给法官和用户提供更有价值的检索信息;同时,具有检索性能好和检索效率高的优点,精确和高效的优点会提高用户的使用效率和满意度。
附图说明
[0037]
图1为本发明一种基于图匹配神经网络的检索方法的流程图。
具体实施方式
[0038]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039]
在本发明的描述中,需要说明的是,术语“竖直”、“上”、“下”、“水平”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0040]
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一
体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0041]
请参阅图1,本发明提供一种技术方案:一种基于图匹配神经网络的检索方法,具体包括以下步骤:
[0042]
s1、构建法律案例要素图:根据输入的法律三元组信息,进行节点融合将法律案例文本转换为法律案例要素图;
[0043]
s2、编码聚合图结构数据:基于构建的法律案例要素图,使用图神经网络对节点和连边信息进行编码和聚合操作,在向量空间中生成连续向量,再进行信息传递,以聚合连边特征并获得关于查询案例和候选案例的图级表示信息;
[0044]
s3、交互图间特征信息:对每个案例得到的图级表示进行基于注意力机制的交互运算,捕获图间的差异度,同时保留法律案例要素图谱间的匹配相关性系数(注意力系数),形成最终的图级表示向量;
[0045]
s4、展示检索过程及结果:对图级表示向量采用余弦相似度算法,计算得到查询案例与候选案例的相似度分数,同时,利用图谱可视化技术和匹配相关性系数可视化展示法律案例要素图谱对的检索和匹配过程。
[0046]
通过使用多层感知器(multi-layer perception,mlp)将节点和连边的语义信息映射到节点和边的初始向量。
[0047]
通过使用多层感知器(multi-layer perception,mlp)将节点和连边的语义信息映射到节点和边的初始向量,映射过程如下式所示:
[0048][0049][0050]
其中,是节点的初始特征向量,e
ij
是节点间连边的特征信息。
[0051]
在传播部分,gnn将一组节点表示映射到新的节点表示表示映射到新的节点表示映射过程如下式所示:
[0052][0053][0054]
其中,f
message
是编码节点和连边特征信息的函数,f
node
是汇总节点隐藏层特征信息的求和函数;通过多层传播,每个节点的表示信息都将得到更新并累积邻居节点的信息。
[0055]
在聚合部分,聚合层将节点表示集合作为输入,并计算图级别表示作为输入,并计算图级别表示聚合公式如下式所示:
[0056][0057]
通过聚合操作,将得到关于查询案例和候选案例的图级别表示信息。
[0058]
交互图间特征信息模块使用基于注意力机制的交互策略,对每个案件的图级表示
信息进行细粒度的交互运算,以捕获图谱对中各关键元素间的细微差别,形成最终的图级表示向量。具体的交互过程如下:
[0059][0060][0061][0062][0063]
其中,f
message
和f
node
函数与上文提到的计算过程一样,f
match
是基于注意力机制的交互计算函数。
[0064]
跨图匹配策略中使用的注意力机制记录了法律案例要素图谱中节点对的匹配相关性系数,相关性系数的计算过程如下所示:
[0065][0066][0067]
其中,simh是余弦相似度计算函数,aj→i是相关性系数(注意力权重),μj→i捕获图中各个节点间的差异度。
[0068]
本发明未尽事宜为公知技术。
[0069]
本发明采用的图匹配神经网络具有简洁的模型架构,与已有的技术方案相比,本技术方案的检索效率提高了约90%,这极大地增加了模型的检索效率和实用性;将图匹配神经网络作为本技术方案的核心方法和骨干网络,利用图匹配网络具有强大的表示能力和优秀的可解释能力,同时结合新的跨图匹配策略进一步增强模型理解案例文本的能力和检索性能,与现有的技术方案相比,本技术方案可有效提高约15%的检索准确率,最重要的是,它在保持最佳检索性能的同时,还可以展示法律案例要素图谱对检索和匹配过程的可视化图形,大大增强了模型的可解释能力;可以可视化展示法律案例要素图谱对检索和匹配过程,通过可视化形式直观展示法律案例间的事实信息和逻辑关系,大大增强本技术方案对检索结果的可解释能力,给法官和用户提供更有价值的检索信息;同时,具有检索性能好和检索效率高的优点,精确和高效的优点会提高用户的使用效率和满意度。
[0070]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
技术特征:
1.一种基于图匹配神经网络的检索方法,其特征在于,具体包括以下步骤:s1、构建法律案例要素图:根据输入的法律三元组信息,进行节点融合将法律案例文本转换为法律案例要素图;s2、编码聚合图结构数据:基于构建的法律案例要素图,使用图神经网络对节点和连边信息进行编码和聚合操作,在向量空间中生成连续向量,再进行信息传递,以聚合连边特征并获得关于查询案例和候选案例的图级表示信息;s3、交互图间特征信息:对每个案例得到的图级表示进行基于注意力机制的交互运算,捕获图间的差异度,同时保留法律案例要素图谱间的匹配相关性系数(注意力系数),形成最终的图级表示向量;s4、展示检索过程及结果:对图级表示向量采用余弦相似度算法,计算得到查询案例与候选案例的相似度分数,同时,利用图谱可视化技术和匹配相关性系数可视化展示法律案例要素图谱对的检索和匹配过程。2.根据权利要求1所述的一种基于图匹配神经网络的检索方法,其特征在于:通过使用多层感知器(multi-layer perception,mlp)将节点和连边的语义信息映射到节点和连边的初始向量信息中。3.根据权利要求1所述的一种基于图匹配神经网络的检索方法,其特征在于:通过使用多层感知器(multi-layer perception,mlp)将节点和连边的语义信息映射到节点和连边的初始向量,映射过程如下式所示:的初始向量,映射过程如下式所示:其中,是节点的初始特征向量,e
ij
是节点间连边的特征信息。4.根据权利要求1所述的一种基于图匹配神经网络的检索方法,其特征在于:在传播部分,gnn将一组节点表示映射到新的节点表示表示映射到新的节点表示映射过程如下式所示:示:其中,f
message
是编码节点和连边特征信息的函数,f
node
是汇总节点隐藏层特征信息的求和函数;通过多层传播,每个节点的表示信息都将得到更新并累积邻居节点的信息。5.根据权利要求1所述的一种基于图匹配神经网络的检索方法,其特征在于:在聚合部分,聚合层将节点表示集合作为输入,并计算图级别表示聚合公式如下式所示:通过聚合操作,将得到关于查询案例和候选案例的图级别表示信息。6.根据权利要求1所述的一种基于图匹配神经网络的检索方法,其特征在于:交互图间
特征信息模块使用基于注意力机制的交互策略,对每个案件的图级表示信息进行细粒度的交互运算,以捕获图谱对中各关键元素间的细微差别,形成最终的图级表示向量。具体的交互过程如下:互过程如下:互过程如下:互过程如下:其中,f
message
和f
node
函数与上文提到的计算过程一样,f
match
是基于注意力机制的交互计算函数。7.根据权利要求1所述的一种基于图匹配神经网络的检索方法,其特征在于:跨图匹配策略中使用的注意力机制记录了法律案例要素图谱中节点对的匹配相关性系数,相关性系数的计算过程如下所示:数的计算过程如下所示:其中,sim
h
是余弦相似度计算函数,a
j
→
i
是相关性系数(注意力权重),μ
j
→
i
捕获图中各个节点间的差异度。
技术总结
本发明公开了一种基于图匹配神经网络的检索方法,包括构建法律案例要素图;基于构建的法律案例要素图;使用图神经网络对节点和连边信息进行编码和聚合操作,在向量空间中生成高维嵌入向量,以聚合连边特征并获得关于查询案例和候选案例的图级别表示信息;对每个案例得到的图级别表示信息进行基于注意力机制的交互运算,捕获图间的差异度,同时保留法律案例要素图谱间的匹配相关性分数(注意力系数),形成最终的图级别表示向量;展示检索过程及结果。本发明具有检索性能好和检索效率高的优点,有助于提高用户的使用效率和满意度;同时,具有优秀的可解释能力,对检索结果的决策过程公平化和透明化,极大地增强了用户对模型的信任。任。
技术研发人员:李艳玲 高尚 葛凤培
受保护的技术使用者:内蒙古师范大学
技术研发日:2023.06.27
技术公布日:2023/9/25
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/