数据模型模糊查询方法、系统及存储介质与流程

未命名 08-02 阅读:78 评论:0


1.本发明涉及数据模型领域,尤其是涉及了一种数据模型模糊查询方法、系统及存储介质。


背景技术:

2.数据模型(data model),也可称为数据资源模型,是对客观事物及其逻辑关系的描述,指表示实体以及实体之间联系的数据库的数据结构,是一组严格定义的概念的集合,能够表达数据之间的相互关系,对数据的操作,以及有关语义的定义约束规则。数据模型通常由数据结构、数据操作和完整性约束三个要素组成。
3.数据模型从多角度多层次描述和表达数据源实体的属性和关系,建立实体与数据模型之间的对应关系。良好的数据模型可提高数据资源信息的结构化水平,支撑数据资源的合理分类、高效存取、实现资源的最佳配置、信息的顺畅沟通与交流。
4.数据模型的查询功能是数据模型管理系统中必不可少的关键功能,可以实现对数据模型的查找。一些场景中,使用精确查询功能查询数据模型,可能出现无法查询到结果的情况,此时可能会进行模糊查询。然而,由于对用户的查询意图理解出现偏差,导致模糊查询所获得的结果往往并非是用户想要的结果。


技术实现要素:

5.本发明提出一种数据模型的可视化搜索方法、系统及存储介质,有利于提高查询准确率。
6.第一方面,提供一种数据模型查询方法,包括:获取查询关键词;获取语义关系图;根据所述语义关系图,对所述查询关键词进行扩展,得到词集;根据所述词集,确定查询的目标数据模型。
7.在一些实施方式中,所述的数据模型查询方法,其中,获取查询关键词,包括:获取查询文本;使用停用词表删除所述查询文本中的停用词,提取所述查询文本中的实词,得到初始查询关键词;确定所述初始查询关键词的近义词;将所述初始查询关键词和所述近义词,作为查询关键词。
8.在一些实施方式中,所述的数据模型查询方法,其中,所述获取语义关系图,包括:采用语义关系神经网络从语料库中获取多个词语,以及确定词语之间的关系权重;根据所述关系权重将所述词语连接,形成语义关系图。
9.在一些实施方式中,所述的数据模型查询方法,其中,所述根据所述语义关系图,
对所述查询关键词进行扩展,得到词集,包括:根据所述查询关键词与所述语义关系图中的词语进行匹配,得到匹配词语;根据所述匹配词语之间的相互关系,确定各个所述匹配词语的含义;根据所述各个所述匹配词语的含义进行扩展,得到多个扩展词语;基于所述匹配词语和所述扩展词语,构建词集。
10.在一些实施方式中,所述的数据模型查询方法,其中,根据所述词集,确定查询的目标数据模型,包括:根据所述词集,构造查询方案;根据所述查询方案对数据模型进行查询,得到多个数据模型;对所述多个数据模型进行排序,将排序第一的数据模型确定为目标数据模型。
11.在一些实施方式中,所述的数据模型查询方法,其中,所述根据所述匹配词语之间的相互关系,确定各个所述匹配词语的含义,包括:若当前匹配词语为多义匹配词语时,则针对所述多义匹配词语的每个含义分别产生一个语义词语群,得到多个语义词语群,其中,所述当前匹配词语为从所述多个匹配词语中选定的一个匹配词语,所述语义词语群为根据按照预设约束从所述语义关系图中选取的一个或多个词语;计算所述语义词语群与所有匹配词语之间的重合程度或相似度;将重合程度最大或相似度最大的语义词语群所对应的词语含义作为所述当前匹配词语的含义。
12.在一些实施方式中,所述的数据模型查询方法,其中,所述根据所述各个所述匹配词语的含义进行扩展,得到多个扩展词语,包括:将匹配词语作为起始节点,按照延伸条件沿着语义关系图中节点之间的连接线向周围节点延伸,形成扩展路径;获取所述扩展路径上的节点对应的词语,得到扩展词语;其中,所述延伸条件包括:每条所述扩展路径上均由一条或多条节点连接线头尾连接形成;若当前节点同时位于来自多个所述匹配词语的扩展路径上时,则分别增加各个所述扩展路径中当前节点连接线对应的关系权重值,否则当前节点连接线对应的关系权重值保持不变;所述扩展路径中每条节点连接线对应的关系权重值大于权重阈值;所述扩展路径各个节点连接线对应的各个关系权重值的倒数之和小于或等于预设阈值。
13.在一些实施方式中,所述的数据模型查询方法,其中,所述根据所述词集,构造查询方案,包括:分析所述查询文本的句式结构;获取与所述查询文本的句式结构匹配的查询式子;根据所述词集中的各个词语,填充所述查询式子,得到查询方案。
14.第二方面,提供一种数据模型查询系统,其中,包括:第一获取模块,用于获取查询关键词;第二获取模块,用于获取语义关系图;扩展模块,用于根据所述语义关系图,对所述查询关键词进行扩展,得到词集;确定模块,用于根据所述词集,确定查询的目标数据模型。
15.第三方面,提供一种存储介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时,实现如上所述的数据模型查询方法的步骤。
16.第四方面,提供一种电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其中,当所述处理器执行所述程序时,实现如上所述的数据模型查询方法的步骤。
17.本发明的数据模型查询方法,能够根据所述语义关系图,对所述查询关键词进行扩展,得到词集;再根据所述词集,确定查询的目标数据模型,可以减少由于查询关键词较少导致无法查询获得数据模型的情况,有利于提高模糊查询准确率。
附图说明
18.通过阅读下文优选的具体实施方式中的详细描述,本发明各种其他的优点和益处对于本领域普通技术人员来说将变得清楚明了。说明书附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。显而易见地,下面描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
19.下面将结合附图及实施例对本发明作进一步说明,附图中:图1是本发明一个实施例的数据模型查询方法的流程图;图2是本发明一个实施例的语义关系图的示意图;图3是本发明一个实施例的减小多义匹配词语与当前语境非最接近的语义词语群之间的权重值前的语义关系图的示意图;图4是本发明一个实施例的减小多义匹配词语与当前语境非最接近的语义词语群之间的权重值后的语义关系图的示意图;图5是本发明一个实施例的一种数据模型查询系统的结构示意图;图6是本发明一个实施例的数据模型查询系统的交互界面图;图7为本发明一个实施例的电子设备的结构示意图。
实施方式
20.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。
21.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术;本技术的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本技术的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
22.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
23.为了使本技术领域的人员更好地理解本技术方案,下面将结合附图,对本技术实施例中的技术方案进行清楚、完整地描述。
24.在一个构建数据模型集成系统的应用场景中,通过将收集的数据资源转换为数据模型的形式,可以实现数据资源的合理分类、高效存取、实现资源的最佳配置。在对数据模型进行管理过程中,为提高数据模型查询准确性和速度,本实施例提供一种数据模型查询方法。
25.图1为本实施中数据模型查询方法的流程示意图。请参阅图1,该数据模型查询方法可以实现模糊查询功能,具体包括:步骤10、步骤20、步骤30、步骤40。
26.步骤10、获取查询关键词。
27.查询关键词是从用户的查询信息(如查询文本)中提取得到的词语,能够代表用户的查询意图的词语。
28.步骤20、获取语义关系图。
29.语义关系图是用于表明词语间相互关系的图。可选地,请参阅图2,语义关系图中包括多个节点和节点之间相互连接的关系线,其中,一个节点代表一个词语,而节点之间的连接线则代表两个词语之间的联系,即连接线具有表明词语之间远近关系的关系权重。
30.可选地,在语义关系图中,关系较为紧密的词语之间的关系权重比较大。越相似的词语之间的关系权重越大。例如,具有从属关系的两个词语之间一般具有将大的关系权重。举例地,植物、猫和兰花,其中兰花属于植物,因此,兰花与植物之间的关系权重则比猫与植物之间的关系权重要大。
31.可以理解的是,语义关系图中词语的含义可以通过与该词语节点相连接的周围词语节点进行确定,也即是根据该词语节点所处的词语环境可以确定该词语节点的具体含义。
32.步骤30、根据语义关系图,对查询关键词进行扩展,得到词集。
33.将查询关键词进行扩展,获取与关键词含义相近或相关的词语,从而得到词集。可见,词集中词语的数量大于查询关键词的数量。
34.显然,基于语义关系图中具有大量的词语,并能体现词语之间的关联度,因此,可以通过对语义关系图中的词语与查询关键词之间的关联度进行评估,从而获取与查询关键词关联度较高的词语,进而实现对查询词语的扩展。
35.步骤40、根据词集,确定查询的目标数据模型。
36.由于词集中的词语的数量要多于原查询关键词的数量,在查询过程中有利查询得到更多数量的数据模型,可以减少查询不到数据模型的情况,也有利于高模糊查询准确率。
37.可以理解的是,本发明的数据模型查询方法,能够根据语义关系图,对查询关键词进行扩展,得到词集;再根据词集,确定查询的目标数据模型,可以减少由于查询关键词较少导致无法查询获得数据模型的情况,有利于提高模糊查询准确率。
38.在一些实施方式中,数据模型查询方法,其中,获取查询关键词,包括:步骤101、步骤102、步骤103、步骤104。
39.步骤101、获取查询文本。
40.查询文本可以是用户在查询时输入的文本信息,也可以与用户语音信息相对应的文本信息。
41.步骤102、使用停用词表删除查询文本中的停用词,提取查询文本中的实词,得到初始查询关键词。
42.由于查询文本可以是一种自然语言,因此,在查询文本存在一些实际含义不大的词语,需要去除这些实际含义不大的词语。
43.可选地,对查询文本进行词语切分、停用词删除等步骤,提取查询文本中的实词,得到初始查询关键词。其中,词语切分是对查询文本进行划分一个个词语,并删除标点符号。停用词删除是识别查询文本中的停用词,并删除停用词。
44.步骤103、确定初始查询关键词的近义词。
45.近义词是与初始查询关键词的含义相近的词语,具体根据实际场景判断初始查询关键词的近义词。
46.可选地,通过近义词查询表或者使用哈工大同义词词林,确定初始查询关键词的近义词。近义词查询表中记录了一些常用词语的近义词。将初始查询关键词与近义词查询表中词语进行比对,从而得到初始查询关键词的近义词,对初始查询关键词进行初步扩展。
47.步骤104、将初始查询关键词和近义词,作为查询关键词。
48.查询关键词为初始查询关键词和近义词并集。查询关键词是在初始查询关键词基础上进行的扩展。通过将初始查询关键词和近义词合并,有利于在与语义关系图中的词语进行匹配的过程中,获得更多数量的匹配词语。
49.在一些实施方式中,数据模型查询方法,其中,获取语义关系图,包括:步骤201、步骤202。
50.步骤201、采用语义关系神经网络从语料库中获取多个词语,以及确定词语之间的关系权重。
51.可以理解的是,语义关系图中相似度越大的词语,对应的关系权重值也较大。词语间关系权重值越大,说明两个词语的相关性也越大。语义关系图的准确性,对得到的扩展词语的质量有很大的影响,因此提高语义关系图的准确性成为一个技术难点。
52.可选地,基于词语之间的关联度或相似度,确定词语之间的关系权重。例如,可以根据同时出现的频率,确定词语之间的关联度。以及,可以根据词语的上下文,确定词语之间的相似度,进而确定词语之间的关联度。基于此,可以采用词语同时出现的频率和相似度,确定词语之间的关系权重。其中,语料库可以是互联网络中的文本数据或者特定领域的文本数据。
53.一般来说,可以通过人工手动根据经验设置词语之间的关系以及关系权重,构建语义关系图,但是工作量巨大,而且可能存在语义关系图的准确性不高的情况。
54.举例地,采用语义关系神经网络构建语义关系图具体是:采用语义关系神经网络计算各个词语之间的关系,进而确定关系权重,完成语义关系图的构建。语义关系神经网络是经过训练的用于确定关系权重的神经网络。其中,在对神经网络进行训练过程中,通常以人工手动根据经验或词语同时出现的频率定义的语义关系图中的关系权重,并以此关系权重为标签建立合适的训练样本,对神经网络进行训练,得到训练后的神经网络,使训练后的神经网络能够给相似度越大的词语赋予较大的关系权重值。
55.需要说明的是,由于训练样本的局限性,可能存在基于语义关系神经网构建的初始语义关系图的准确性不高的情况,可以在使用过程中建立基于神经网络检索准确性的反
馈机制,不断对语义关系图以及语义关系神经网络进行更新。为避免扩展到相关性不大的词语,可以对扩展词语的数量进行限制,以保证前期查询的准确性。
56.步骤202、根据关系权重将词语连接,形成语义关系图。
57.语义关系图是表明词语关系的图。在获得关系权重后,可以按照关系权重将词语连接,形成网状的语义关系图。
58.可选地,语义关系图中有多个词语且各个词语间存在一个关系权重,该关系权重用于表明词语间的关系。可选地,语义关系图中包括多个节点和节点之间的连接线组成,其中,节点代表词语,连接线代表词语之间的关系,连接线的长短粗细由关系权重决定,若关系权重低于预设权重值则可以不显示该连线。
59.在一些实施方式中,数据模型查询方法,其中,根据语义关系图,对查询关键词进行扩展,得到词集,包括:步骤310、步骤320、步骤330。
60.步骤310、根据查询关键词与语义关系图中的词语进行匹配,得到匹配词语。
61.将语义关系图中的词语与查询关键词进行比对,从语义关系图中找到与查询关键词相同的词语,得到匹配词语。由于对初始关键词进行了初步扩展,在匹配过程中可以得到较多数量的匹配词语。
62.步骤320、根据匹配词语之间的相互关系,确定各个匹配词语的含义。
63.同一个匹配词语可能存在不同的多种含义,因此需要确定该匹配词语的具体含义。可以理解的是,单个匹配词语的具体含义与具体的语境有关,而多个匹配词语组合在一起可以在一定程度体现语境,因此对所有匹配词语进行分析,分析匹配词语之间的相互关系,可以确定匹配词语的具体含义。
64.步骤330、根据各个匹配词语的含义进行扩展,得到多个扩展词语。
65.举例地,通过语义关系图,对匹配词语进行扩展,获取与匹配词语相关联的词语,得到多个扩展词语。也即是,在语义关系图中,扩展词语是与匹配词语相关联的词语。
66.步骤340、基于匹配词语和扩展词语,构建词集。
67.词集包括匹配词语和扩展词语。例如,词集可以由扩展词语和查询关键词组成。由于对匹配词语做了进一步扩展,提高词集中词语的数量和类型,有利于搜索更多数量的数据模型,从而获得需要的数据模型,提高查询准确性。
68.在一些实施方式中,数据模型查询方法,其中,根据词集,确定查询的目标数据模型,包括:步骤410、步骤420和步骤430。
69.步骤410、根据词集,构造查询方案。
70.在构造查询方案中,根据用户查询意图之后,将词集生成对应查询语言。可选地,查询语言为sparql语言。用户查询意图可以根据词集以及用户输入文本中各个词语顺序确定,具体可以根据用户输入文本查找对应的构建查询式子;再将查询式子、词集以及语法结合,生成查询语言。
71.步骤420、根据查询方案对数据模型进行查询,得到多个数据模型。
72.从数据模型库中进行查找符合查询方案要求的数据模型,得到满足用户查询意图的多个数据模型。
73.步骤430、对多个数据模型进行排序,将排序第一的数据模型确定为目标数据模型。
74.排序的方式可以根据数据模型与查询意图的相关性进行排序。例如,根据数据模型与词集的词语重叠度进行排序,判断数据模型与查询意图的相关性,词语重叠度越高,排序也越靠前。
75.在一些实施方式中,数据模型查询方法,其中,根据匹配词语之间的相互关系,确定各个匹配词语的含义,包括:步骤321、步骤322、步骤323。
76.步骤321、若当前匹配词语为多义匹配词语时,则针对所述多义匹配词语的每个含义分别产生一个语义词语群,得到多个语义词语群,其中,所述当前匹配词语为从所述多个匹配词语中选定的一个匹配词语,所述语义词语群为根据按照预设约束从所述语义关系图中选取的一个或多个词语。
77.经过分析可知,匹配词语的具体含义与具体的语境有关,而多个匹配词语组合在一起可以一定程度体现语境,因此根据所有匹配词语形成的匹配词语组合,分析匹配词语之间的相互关系,可以确定匹配词语的具体含义。
78.多义匹配词语具有多种含义,不同的语境含义可能不同。通过构建多个不同的语义词语群来体现多义匹配词语的多个不同的语境。基于此,针对多义匹配词语的每个含义根据语义关系图产生一个语义词语群,得到多个语义词语群,其中,语义词语群为根据按照预设约束从语义关系图中选取的一个或多个词语。
79.预设约束通常是针对每个多义词语每个语义预先设置的词语选取规则,能够从语义关系图中选取体现多义匹配词语含义的一个或多个词语。多义词语每一个含义对应一个预设约束,每一个约束能够选取相应的词语。
80.例如,针对多义词语某一含义,预设约束可以是从语义关系图中选取在该含义的预设语境中同时出现频率大于预设频率的词语,作为该语义语境对应语义词语群中的词语。同时出现频率可以是指在预设字符数内同时出现的次数与总字符数之比。
81.可见,对于一个语义词语群来说,可以确定多义匹配词语的具体含义。因此,只需要确定多义匹配词语所对应的语义词语群,即可确定该多义匹配词语的具体含义。
82.步骤322、计算所述语义词语群与所有匹配词语之间的重合程度或相似度。
83.重合程度可以是指语义词语群与匹配词语的共有词语数量与匹配词语数量之比。重合程度越高,说明语义词语群的含义与匹配词语的含义越相近。计算语义词语群与匹配词语之间的重合程度,还可以考虑语序重合度。
84.相似度可以是指语义词语群与所述匹配词语的相似度,具体是将语义词语群中词语以及匹配词语进行词向量化;分别计算语义词语群中词语与匹配词语之间的相似度,得到多个相似度值;将多个相似度值相加,得到语义词语群与所述匹配词语的相似度。
85.步骤323、将重合程度最大或相似度最大的语义词语群所对应的词语含义作为所述当前匹配词语的含义。
86.当所有匹配词语形成的匹配词语组合与语义词语群的词语重合程度较高(重合程度大于重合度阈值),则可以将语义词语群中匹配词语的含义作为当前匹配词语的含义。同理,将相似度最大的语义词语群所对应的词语含义作为所述当前匹配词语的含义。
87.在一些实现方式中,结合相似度和重合程度确定语义词语群与匹配词语之间的关联程度,进而确定多义匹配词语的含义。具体地,关联程度的计算,包括:获取共有词语与匹配词语之比,达到重合度,其中,共有词语为语义词语群与匹配词语进行交集得到的词语;
计算语义词语群与所述匹配词语的相似度;根据重合度与相似度,计算关联程度,关联程度与重合度、相似度正相关。获取关联程度最高的语义词语群,则语义词语群所对应的词语含义作为所述当前匹配词语的含义。
88.通过对多义匹配词语的含义进行分析,确定与当前语境最接近的语义词语群之后,获取增益系数和衰减系数,对进行多义匹配词语的权重进行临时调整,增加多义匹配词语与当前语境最接近的语义词语群之间的权重值,和/或减小多义匹配词语与当前语境非最接近的语义词语群之间的权重值。请参阅图3(为方便参阅,语义关系图省略了节点之间的连接线)及图4,实心圆代表语义关系图中的匹配词语,其中,图3为减小多义匹配词语与当前语境非最接近的语义词语群之间的权重值前的语义关系图的示意图,图4为减小多义匹配词语与当前语境非最接近的语义词语群之间的权重值后的语义关系图的示意图,由于减小多义匹配词语与当前语境非最接近的语义词语群之间的权重值,使得相应权重值较小且小于显示阈值,在语义关系图中非最接近的语义词语群所对应的词语不再进行显示。在确定与匹配词语组合的整体语义相似或相近的含义之后,通过减小多义匹配词语与当前语境非最接近的语义词语群之间的权重值,有利于后续对关键查询词进行扩展的计算。
89.在一些实施方式中,数据模型查询方法,其中,根据各个匹配词语的含义进行扩展,得到多个扩展词语,包括:步骤331。
90.步骤331、根据关系权重值从语义关系图中选取多个扩展词。
91.具体地,根据语义关系图的关系权重值,判断当前词语是否与匹配词语相关联,是否可以作为扩展词语。其中,判断当前词语是否与匹配词语相关联的步骤可以包括:从匹配词语开始(也即是将匹配词语作为初始节点),按照延伸条件沿着语义关系图中节点之间的连接线向周围节点延伸,形成扩展路径;获取扩展路径上的节点对应的词语,得到扩展词语。其中,延伸条件包括:每条扩展路径上均由一条或多条节点连接线头尾连接形成;若当前节点位于来自多个匹配词语的扩展路径上时则分别增加各个扩展路径中当前节点连接线对应的关系权重值,否则其中,所述延伸条件包括:每条所述扩展路径上均由一条或多条节点连接线头尾连接形成;若当前节点同时位于来自多个所述匹配词语的扩展路径上时,则分别增加各个所述扩展路径中当前节点连接线对应的关系权重值,否则当前节点连接线对应的关系权重值保持不变;所述扩展路径中每条节点连接线对应的关系权重值大于权重阈值;所述扩展路径各个节点连接线对应的各个关系权重值的倒数之和小于或等于预设阈值不变;扩展路径中每条节点连接线对应的关系权重值大于权重阈值;扩展路径各个节点连接线对应的各个关系权重值的倒数之和小于或等于预设阈值。为提高运算速度,延伸条件还包括:各条扩展路径不存在环形路径。
92.举例地,请参阅图4,实心圆代表语义关系图(为方便参阅,该语义关系图省略了节点之间的连接线)中的匹配词语,空心圆代表语义关系图中的非匹配词语,带箭头的连接线为扩展路径和延伸方向。以匹配词语作为起始节点向周围的节点延伸,形成多条扩展路径,而一些不能满足延伸条件节点的则不能形成与起始节点连接的扩展路径。
93.具体地,在延伸过程,每延伸至一个节点前,需要判断该节点是否满足延伸的条件。举例地,当通过当前连接线延伸至当前节点时,则判断当前节点是否同时被两条或两条以上的扩展路径穿过,若被两条或两条以上的扩展路径穿过则增加相应扩展路径上当前节点连接线对应的关系权重值,其中当前节点连接线是与当前节点直接相连的连接线;之后,
判断扩展路径中每条节点连接线对应的关系权重值是否大于权重阈值,以及判断扩展路径各个节点连接线对应的各个关系权重值的倒数之和是否小于或等于预设阈值,若扩展路径中每条节点连接线对应的关系权重值大于权重阈值,且扩展路径各个节点连接线对应的各个关系权重值的倒数之和是否小于或等于预设阈值,则保留该当前连接线,对扩展路径进行了延伸,否则不保留该当前连接线,扩展路径到上一个节点终止。
94.可选地,当前关系权重值倒数之和的计算步骤,包括:获取当前节点所对应的扩展路径,得到当前路径;获取当前路径上的每条节点连接线对应的关系权重值,得到多个当前关系权重值;分别计算多个当前关系权重值的倒数,得到当前关系权重值的倒数;将当前关系权重值的倒数相加,得到关系权重值的倒数之和。
95.关系权重值的倒数之和的计算公式为:d=∑w
i-1
其中,d为关系权重值的倒数之和,∑wi为所有wi的累加和,wi为当前扩展路径中第i个节点连接线对应的关系权重值,i为关系权重值的序号,由匹配词语(起始节点)开始编号。需要说明的是,若当前匹配词语为多义匹配词语时,需要在计算权重值的倒数之和前对相应的关系权重值进行调整,得到临时的关系权重值(该关系权重值仅用于本次扩展中的计算,不会改变语义关系图中的关系权重值),wi=c
×
wi´
,wi´
为对进行多义匹配词语进行临时调整前的权重值,c为调整系数,具体地,c为增益系数或衰减系数;或者当前匹配词语对应的节点位于来自两个或两个以上匹配词语的扩展路径上时,需要在计算权重值的倒数之和前对相应的关系权重值进行调整,wi=c
×
wi´
,c为调整系数,具体地,c为增益系数,可以与经过当前节点的扩展路径的数量有关,可以增加当前节点连接线对应的关系权重值。
96.举例地,在一个计算过程中,起始节点通过第一连接线与第一节点连接,再通过第二连接线与第二节点连接,则前路径关系权重值倒数之和为第一连接线对应的关系权重值的倒数加第二连接线的关系权重值的倒数,并判断是否小于或等于预设阈值,若小于或等于预设阈值则扩展路径延伸至第二节点。
97.举例地,请参阅图4,在一个计算过程中,第一起始节点801通过第一连接线与第一节点803连接,第二起始节点802通过第二连接线与第一节点803连接,则分别增加第一连接线和第二连接线所对应的关系权重值,计算第一连接线对应的关系权重值的倒数并判断是否小于或等于预设阈值,若小于或等于预设阈值则扩展路径延伸至第一节点803;或,计算第二连接线的关系权重值的倒数判断是否小于或等于预设阈值,若小于或等于预设阈值则扩展路径延伸至第一节点803。
98.在一些实施方式中,所述的数据模型查询方法,其中,所述根据所述词集,构造查询方案,包括:步骤411、步骤412和步骤413。
99.步骤411、分析所述查询文本的句式结构。
100.可以将所述查询文本与预设的句式结构进行相似度分析,完成对查询文本的句式结构的分析。具体可以从句长相似度、词序相似度、词形相似度等方面进行比较分析。
101.步骤412、获取与所述查询文本的句式结构匹配的查询式子。
102.查询式子与查询文本的句式结构具有对应关系。预先存储多套查询式子与查询文本的句式结构之间的对应关系,在获取所述查询文本的句式结构之后,即可以对应获取查询式子。
103.步骤413、根据所述词集中的各个词语,填充所述查询式子,得到查询方案。
104.根据词集中各个词语的含义和性质,将词集中各个词语填充在查询式子相应的位置,形成可以体现用户查询意图的查询式子,再将查询式子生成对应数据模型库的sparql查询语言。通过根据语法构建查询式子,生成对应的sparql查询语言进行数据模型的查询,获取查询结果。
105.此外,通常查询结果中数据模型不止一个,因此需要根据需要对查询到的数据模型进行排序,选择排序第一的数据模型通常为用户查询的目标数据模型。
106.在一些实施方式中,构造查询方案的过程中,还包括对查询方案进行检查,当符合询问条件时,则生成询问语句。询问条件可以是查询方案中缺少重要信息时,需要用户进行回答。采用预设检查模板检查查询方案的完整性,判断当前查询方案是否缺少重要信息。
107.图5是本实施例一种数据模型查询系统60的结构示意图,如图5所示,该数据模型查询系统60,包括:第一获取模块601、第二获取模块602、第一获取模块603和确定模块604。
108.第一获取模块601,用于获取查询关键词。
109.第二获取模块602,用于获取语义关系图。
110.第一获取模块603,用于根据语义关系图,对查询关键词进行扩展,得到词集。
111.确定模块604,用于根据词集,确定查询的目标数据模型。
112.本发明的数据模型查询系统,能够根据语义关系图,对查询关键词进行扩展,得到词集;再根据词集,确定查询的目标数据模型,可以减少由于查询关键词较少导致无法查询获得数据模型的情况,有利于提高查询准确率。
113.在一些实施方式中,第一获取模块601,还用于获取查询文本;使用停用词表删除查询文本中的停用词,提取查询文本中的实词,得到初始查询关键词;确定初始查询关键词的近义词;将初始查询关键词和近义词,作为查询关键词。
114.在一些实施方式中,第二获取模块602,还用于获取语义关系图,包括:采用语义关系神经网络从语料库中获取多个词语,以及确定词语之间的关系权重;根据关系权重将词语连接,形成语义关系图。
115.在一些实施方式中,第一获取模块603,还用于根据查询关键词与语义关系图中的词语进行匹配,得到匹配词语;根据匹配词语之间的相互关系,确定各个匹配词语的含义;根据各个匹配词语的含义进行扩展,得到多个扩展词语;基于匹配词语和扩展词语,构建词集。
116.在一些实施方式中,确定模块604,用于根据词集,构造查询方案;根据查询方案对数据模型进行查询,得到多个数据模型;对多个数据模型进行排序,将排序第一的数据模型确定为目标数据模型。
117.在一些实施方式中,数据模型查询方法,第一获取模块603,还用于当匹配词语为多义匹配词语时,则针对多义匹配词语的每个含义根据语义关系图产生一个语义词语群,得到多个语义词语群,其中,语义词语群为根据按照预设约束从语义关系图中选取的一个或多个词语;计算所述语义词语群与所有匹配词语之间的重合程度或相似度;将重合程度最大或相似度最大的语义词语群所对应的词语含义作为所述当前匹配词语的含义。
118.在一些实施方式中,第一获取模块603,还用于将匹配词语作为起始节点,按照延伸条件沿着语义关系图中节点之间的连接线向周围节点延伸,形成扩展路径;获取扩展路
径上的节点对应的词语,得到扩展词语;其中,延伸条件包括:每条扩展路径上均由一条或多条节点连接线头尾连接形成;每条节点连接线对应的关系权重值大于权重阈值;每条扩展路径上的各条节点连接线所对应的关系权重值倒数之和小于或等于预设阈值。
119.在一些实施方式中,确定模块604,用于分析所述查询文本的句式结构;获取与所述查询文本的句式结构匹配的查询式子;根据所述词集中的各个词语,填充所述查询式子,得到查询方案。
120.图6为数据模型查询系统的交互界面图。图6中,数据模型也称为数据资源模型。用户能够在该交互界面输入相应的查询信息,系统对查询信息进行扩展,形成扩展词语,进而完成数据模型的模糊查询,提高查询准确度,减少查询不到结果的情况。
121.本实施例的数据模型搜索系统的运行原理可以参考上述数据模型搜索方法,在此不再赘述。
122.图7是本发明一种电子设备的结构示意图。该电子设备包括存储器701和处理器702,存储器701存储有可在处理器702上运行的计算机程序,其中,当处理器702执行程序时,实现如上的数据模型查询方法的步骤。
123.电子设备包括通过系统总线703相互通信连接存储器701、处理器702。需要指出的是,图中仅示出了具有组件701-703的电子设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器 (digital signal processor,dsp)、嵌入式设备等。
124.电子设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
125.存储器701至少包括一种类型的可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器701可以是设备的内部存储模块,例如该设备的硬盘或内存。在另一些实施例中,存储器701也可以是设备的外部存储设备,例如该设备上配备的插接式硬盘,智能存储卡(smart media card, smc),安全数字(secure digital, sd)卡,闪存卡(flash card)等。当然,存储器701还可以既包括设备的内部存储模块也包括其外部存储设备。本实施例中,存储器701通常用于存储安装于设备的操作系统和各类应用软件。此外,存储器701还可以用于暂时地存储已经输出或者将要输出的各类数据。
126.处理器在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制设备的总体操作。本实施例中,处理器用于运行存储器中存储的计算机可读指令或者处理数据。
127.本发明提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如上的数据模型查询方法的步骤。
128.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方
法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁盘、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例的方法。
129.根据数据模型查询方法开发的数据集成系统,并对该系统进行测试,响应时间可以达到毫秒级别,平均响应时间为100ms,满足客户提出的响应时间不大于3s的需求。
130.显然,以上所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例,附图中给出了本技术的较佳实施例,但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本技术专利保护范围之内。

技术特征:
1.一种数据模型查询方法,其特征在于,包括:获取查询关键词;获取语义关系图;根据所述语义关系图,对所述查询关键词进行扩展,得到词集;根据所述词集,确定查询的目标数据模型。2.根据权利要求1所述的数据模型查询方法,其特征在于,所述获取查询关键词,包括:获取查询文本;使用停用词表删除所述查询文本中的停用词,提取所述查询文本中的实词,得到初始查询关键词;确定所述初始查询关键词的近义词;将所述初始查询关键词和所述近义词,作为查询关键词。3.根据权利要求1所述的数据模型查询方法,其特征在于,所述获取语义关系图,包括:采用语义关系神经网络从语料库中获取多个词语,以及确定所述多个词语之间的关系权重;根据所述关系权重将所述词语连接,形成语义关系图。4.根据权利要求1所述的数据模型查询方法,其特征在于,所述根据所述语义关系图,对所述查询关键词进行扩展,得到词集,包括:根据所述查询关键词与所述语义关系图中的词语进行匹配,得到匹配词语;根据所述匹配词语之间的相互关系,确定各个所述匹配词语的含义;根据所述各个所述匹配词语的含义进行扩展,得到多个扩展词语;基于所述匹配词语和所述扩展词语,构建词集。5.根据权利要求2所述的数据模型查询方法,其特征在于,所述根据所述词集,确定查询的目标数据模型,包括:根据所述词集,构造查询方案;根据所述查询方案对数据模型进行查询,得到多个数据模型;对所述多个数据模型进行排序,将排序第一的数据模型确定为目标数据模型。6.根据权利要求4所述的数据模型查询方法,其特征在于,所述根据所述匹配词语之间的相互关系,确定各个所述匹配词语的含义,包括:若当前匹配词语为多义匹配词语时,则针对所述多义匹配词语的每个含义分别产生一个语义词语群,得到多个语义词语群,其中,所述当前匹配词语为从多个所述匹配词语中选定的一个匹配词语,所述语义词语群为根据按照预设约束从所述语义关系图中选取的一个或多个词语;计算所述语义词语群与所有匹配词语之间的重合程度或相似度;将重合程度最大或相似度最大的语义词语群所对应的词语含义作为所述当前匹配词语的含义。7.根据权利要求4所述的数据模型查询方法,其特征在于,所述根据所述各个所述匹配词语的含义进行扩展,得到多个扩展词语,包括:将匹配词语作为起始节点,按照延伸条件沿着所述语义关系图中节点之间的连接线向周围节点延伸,形成扩展路径;
获取所述扩展路径上的节点对应的词语,得到扩展词语;其中,所述延伸条件包括:每条所述扩展路径上均由一条或多条节点连接线头尾连接形成;若当前节点同时位于来自多个所述匹配词语的扩展路径上时,则分别增加各个所述扩展路径中当前节点连接线对应的关系权重值,否则当前节点连接线对应的关系权重值保持不变;所述扩展路径中每条节点连接线对应的关系权重值大于权重阈值;所述扩展路径各个节点连接线对应的各个关系权重值的倒数之和小于或等于预设阈值。8.根据权利要求5所述的数据模型查询方法,其特征在于,所述根据所述词集,构造查询方案,包括:分析所述查询文本的句式结构;获取与所述查询文本的句式结构匹配的查询式子;根据所述词集中的各个词语,填充所述查询式子,得到查询方案。9.一种数据模型查询系统,其特征在于,包括:第一获取模块,用于获取查询关键词;第二获取模块,用于获取语义关系图;扩展模块,用于根据所述语义关系图,对所述查询关键词进行扩展,得到词集;确定模块,用于根据所述词集,确定查询的目标数据模型。10.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1至8任一项所述的数据模型查询方法的步骤。

技术总结
本发明提出一种数据模型模糊查询方法、系统及存储介质。其中,数据模型查询方法,包括:获取查询关键词;获取语义关系图;根据语义关系图,对查询关键词进行扩展,得到词集;根据词集,确定查询的目标数据模型。本发明有利于提高模糊查询的准确率。高模糊查询的准确率。高模糊查询的准确率。


技术研发人员:夏春秋
受保护的技术使用者:深圳市唯特视科技有限公司
技术研发日:2023.06.26
技术公布日:2023/8/1
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐