基于人工智能的数据查询方法、装置、设备和存储介质与流程

未命名 10-22 阅读:56 评论:0


1.本公开涉及人工智能技术领域,具体涉及自然语言理解、大数据等技术领域,可应用在智慧城市、城市治理、应急管理场景下,尤其涉及一种基于人工智能的数据查询方法、装置、设备和存储介质。


背景技术:

2.针对舆情产品,通常会使用接口等形式向外提供舆情数据。在这些接口中往往会通过一些时间范围、关键词或者其他形式的限定条件组成数据库的查询语句,然后对数据库进行查询操作获取相对应的数据。但是,由于各方面的原因,导致接口返回的数据达不到预期。
3.相关技术中,为了获得更为精准的数据,通常是对查询语句的限定条件进行改进,希望通过限定更细类别获得更为精准的数据。


技术实现要素:

4.本公开提供了一种基于人工智能的数据查询方法、装置、设备和介质。
5.根据本公开的一方面,提供了一种基于人工智能的数据查询方法,包括:基于查询语句获取候选数据,所述候选数据包括目标类别的数据;获取提示语句,所述提示语句用于表明过滤所述目标类别的数据;调用预训练语言模型,以采用所述预训练语言模型在所述候选数据中过滤所述提示语句表明的所述目标类别的数据,获取目标数据;接收所述预训练语言模块发送的所述目标数据,并展示所述目标数据。
6.根据本公开的另一方面,提供了一种基于人工智能的数据查询装置,包括:第一获取模块,用于基于查询语句获取候选数据,所述候选数据包括目标类别的数据;第二获取模块,用于获取提示语句,所述提示语句用于表明过滤所述目标类别的数据;调用模块,用于调用预训练语言模型,以采用所述预训练语言模型在所述候选数据中过滤所述提示语句表明的所述目标类别的数据,获取目标数据;展示模块,用于接收所述预训练语言模块发送的所述目标数据,并展示所述目标数据。
7.根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。
8.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。
9.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一方面的任一项所述的方法。
10.根据本公开的技术方案,可以提升数据查询精准度。
11.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
12.附图用于更好地理解本方案,不构成对本公开的限定。其中:
13.图1是根据本公开第一实施例的示意图;
14.图2是根据实施例提供的应用场景的示意图
15.图3是根据本公开实施例提供的基于人工智能的数据查询系统的整体架构的示意图;
16.图4是根据本公开第二实施例的示意图;
17.图5是根据本公开第三实施例的示意图;
18.图6是用来实现本公开实施例的基于人工智能的数据查询方法的电子设备的示意图。
具体实施方式
19.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
20.接口返回数据达不到预期的主要原因是:基于查询语句查询的数据可能包含垃圾数据。例如,查询语句限定的类别是新闻,但由于数据库所存储的数据的分类不够精准,可能返回用户不期望的娱乐数据或广告数据。
21.相关技术中,为了获得更为精准的数据,通常是对查询语句的限定条件进行改进,希望通过限定更细类别获得更为精准的数据。
22.但是,这种方式性能提升有限,并且不同用户的分类标准可能不一致,导致所获取的数据精准度仍然有待提升。
23.为了提升数据查询精准度,本公开提供如下实施例。
24.图1是根据本公开第一实施例的示意图,本实施例提供一种基于人工智能的数据查询方法,该方法包括:
25.101、基于查询语句,在数据库中获取候选数据,所述候选数据包括目标类别的数据。
26.102、获取提示语句,所述提示语句用于表明过滤所述目标类别的数据。
27.103、调用预训练语言模型,以采用所述预训练语言模型基于所述提示语句在所述候选数据中过滤所述目标类别的数据,获取目标数据。
28.104、接收所述预训练语言模块发送的所述目标数据,并展示所述目标数据。
29.其中,查询语句是指用于查询数据库的语句,例如,结构化查询语言(structuredquerylanguage,sql)语句。
30.用户在需要查询数据时,可以基于时间、地址、类别等构造sql语句,并将sql语句发送至数据库,在数据库中查询对应的数据。
31.基于查询语句在数据库内获得的数据可以称为候选数据。
32.由于数据库中数据的类别可能不够精准,因此,基于查询语句获得的候选数据可能包含用户不希望类别的数据。
33.目标类别,是指待过滤的类别,即用户不希望看到的类别。例如,用户在构造查询语句时指定的类别是新闻类别,但基于查询语句获得的候选数据中可能包含广告类别;假设用户不希望数据中包含广告类别,则目标类别包括广告。目标类别可以是一个或多个类别。
34.提示语句,用于表明过滤目标类别的数据。例如,可以是“请帮我过滤广告类别的数据”。
35.提示语句可以是预先配置的,不同的用户可以配置相同或不同的提示语句。
36.执行该数据查询方法的主体可以称为数据查询装置,提示语句可以配置在数据库中或者配置在该数据查询装置中。例如,将提示语句配置在数据库中时,数据库在返回候选数据时还可以同时返回提示语句给数据查询装置,之后数据查询装置基于该候选数据和提示语句进行处理。或者,提示语句配置在数据查询装置中时,数据查询装置可以在接收到数据库返回的候选数据后,获取自身配置的提示语句,之后基于该候选数据和提示语句进行处理。
37.另外,针对同一个用户可以预先配置一种或多种提示语句。当提示语句为一种时,数据查询装置可以采用默认的该一种提示语句对数据进行过滤处理。当提示语句为多种时,可以向用户展示多种可供选择的提示语句,用户可以根据实际需要选择一种提示语句进行数据过滤处理。或者,初始时可以采用默认的一种提示语句进行数据过滤处理,用户若发现目标数据不符合自身要求,用户可以更改提示语句重新获得新的目标数据。
38.预训练语言模型,是指用于过滤目标类别数据的模型。该模型可以是数据查询提供方自身训练的,可以称为过滤模型。过滤模型可以为多个,每个过滤模型用于过滤一种类别的数据。例如,提示语句表明的目标类别是广告,则数据查询装置可以将候选数据发送至广告类别对应的过滤模型,通过该广告类别的过滤模型对候选数据进行处理,输出为过滤后的数据,即目标数据。
39.通过设置多种类别的过滤模型可以实现数据过滤。
40.为了提高效率和准确度,预训练语言模型还可以是大模型(large languagemodel,llm),基于大模型可以过滤多种类别的数据,不需要针对每种类别分别是指一种过滤模型。
41.llm是近年来人工智能领域的热点问题,llm是一种预训练语言模型,通过在海量文本数据上进行预训练,学习到了丰富的语言知识和世界知识,从而能够在各种自然语言处理(naturallanguageprocessing,nlp)任务上取得惊人的效果。文心一言、chatgpt等都是基于llm开发的应用,它们可以生成流畅、有逻辑、有创意的文本内容,甚至可以与人类进行自然对话。具体地,大模型可以是基于transformer的通用预训练(generativepre-trainedtransformer,gpt)模型,基于知识集成实现增强型表示(enhancedrepresentationthroughknowledgeintegration,ernie)模型等。
42.数据查询装置获取候选数据和提示语句后,可以将候选数据和提示语句发送至大模型,大模型对输入的候选数据和提示语句进行处理,输出是目标数据。
43.大模型将输出的目标数据返回至数据查询装置,数据查询装置将目标数据展示给用户。
44.本实施例中,通过预训练语言模型对候选数据进行过滤,得到目标数据,可以利用预训练语言模型的优良性能,提升目标数据的精准度。
45.为了更好地理解本公开实施例,下面对本公开实施例的应用场景进行说明。
46.如图2所示,用户可以通过用户终端201与数据查询系统进行交互,通过数据查询系统获得目标数据。用户终端可以为个人电脑(personal computer)、笔记本电脑、移动设备(如手机)等。数据查询系统可以位于服务器202上,服务器可以为本地服务器或者云端服务器等,服务器可以为单个服务器或者服务器集群。
47.用户可以通过用户终端向数据查询系统发送数据查询请求,其中可以指定查询条件,如时间、地址、类别等。数据查询系统基于该数据查询请求可以获取目标数据后,通过用户终端展示给用户。
48.以通过大模型获取目标数据为例,如图3所示,数据查询系统包括:应用展示模块、数据服务模块、数据库和大模型接口。其中,应用展示模块位于数据展示层、数据服务模块位于数据接口层,数据库和大模型接口位于数据提供层。
49.数据查询系统可以向用户开放接口,用户通过该接口将数据查询请求发送至数据服务模块,数据服务模块将数据查询请求中包含的指定信息(如时间、地址、类别)作为查询参数,构造sql语句,并将sql语句发送至数据库。
50.数据库中存储大量的数据,数据中可以记录类别信息,数据库接收到sql语句后,可以进行类别比对,将与sql语句中指定类别的数据作为原始数据返回给数据服务模块。
51.数据服务模块接收到数据库返回的原始数据,可以将原始数据作为候选数据;或者,还可以基于设定信息在原始数据中筛选出部分数据作为候选数据,例如,原始数据可以包括:标题和正文,若设定基于标题进行过滤,则将原始数据中的标题作为候选数据。
52.数据服务模块还可以获取提示语句。
53.提示语句可以是预先配置在数据库中的,数据库内可以记录多个用户的提示语句。sql语句中可以携带用户信息,数据库中记录用户与提示语句之间的对应关系,数据库可以基于上述的对应关系和sql语句中的用户信息,获取当前用户的提示语句,将该提示语句和原始数据一起返回给数据服务模块。提示语句可以配置在数据服务模块本身,数据服务模块获取候选数据后,可以从自身配置信息中获取的提示语句。
54.数据服务模块与大模型之间存在接口,以通过该接口调用大模型。数据服务模块获取候选数据和提示语句后,将候选数据和提示语句提取发送至大模型,大模型对候选数据和提示语句进行处理后,得到目标数据,并将目标数据返回给数据服务模块。
55.数据服务模块将目标数据发送至应用展示模块,通过应用展示模块将目标数据展示给用户。
56.结合上述的应用场景,本公开还提供一种数据查询方法。
57.图4是根据本公开第二实施例的示意图,本实施例提供一种基于人工智能的数据查询方法,该方法包括:
58.401、基于用户设定的查询信息构造查询语句,并基于所述查询语句在数据库中获取原始数据。
59.402、基于所述原始数据获取候选数据,所述候选数据包括目标类别的数据。
60.其中,结合图3所示的架构,用户可以通过数据查询系统提供的接口向数据服务模块发送数据查询请求,数据查询请求中可以携带数据设定的查询信息,查询信息例如包括时间、地址、类别等。
61.数据服务模块接收到数据查询请求后,可以将查询信息作为sql语句的查询参数构造sql语句。
62.数据服务模块构造sql语句后,将sql语句发送至数据库。
63.数据库在预先存储的数据中查询与sql语句匹配的数据,作为原始数据,并返回给数据服务模块。
64.数据服务模块获取数据库返回的原始数据后,可以将该原始数据作为候选数据,或者,数据服务模块还可以对原始数据进行筛选,选择预设字段内容作为候选数据。
65.例如,数据查询请求中还可以携带字段信息(如标题),相应的sql语句中还可以指定字段是标题。数据库中存储的数据可以包括标题和正文,由于sql语句指定了标题,则数据库返回的原始数据是标题,此时可以将原始数据作为候选数据。
66.又例如,sql语句并未指定标题,数据库返回的原始数据包括标题和正文,此时,数据服务模块可以基于设定信息对原始数据进行筛选,将设定字段内容作为候选数据,例如,可以将原始数据的标题作为候选数据,而不包括正文。该设定信息可以是预先配置在数据服务模块中的,例如,数据服务模块可以预先配置筛选标题字段。或者,提示语句中包含设定的筛选字段,例如,数据库中记录的多个用户的提示语句中,针对不同的用户可以设置相同或不同的筛选字段,如针对第一用户筛选标题,针对第二用户筛选正文等。
67.本实施例中,基于查询语句在数据库中获取原始数据,可以利用已有的数据库资源,提升资源利用率。
68.本实施例中,将原始数据作为候选数据,或对原始数据进行筛选获得候选数据,可以提高灵活性,满足个性化需求。
69.403、获取预先配置的提示语句,所述提示语句用于表明过滤所述目标类别的数据。
70.其中,提示语句可以预先配置在数据库内,数据库在返回原始数据时还可以返回提示语句。或者,提示语句还可以配置在数据服务模块内,数据服务模块获取候选数据后可以从自身配置信息中获取提示语句。
71.针对每个用户,可以先在线下测试,将满足用户需求的提示语句作为最终配置的提示语句。由于用户的不同需求,针对不同用户最终配置的提示语句可以是不同的。
72.另外,提示语句中还可以包含格式信息,以便大模型获得具有该格式信息的目标数据。
73.候选数据和提示语句的示例可以如下:
[0074]“标题1”“标题2”“标题3”...“标题20”[0075]
以上是20条新闻的标题,请帮我过滤掉内容为娱乐、广告、销售等类别的低质数据以及不具备新闻性质的数据,然后按照原有顺序将每条数据按行展示出来,每行的展示样式为原有标题###是否被过滤###过滤原因,其中是否被过滤展示是或者否,过滤原因展示为4个字以内的原因。
[0076]
本实施例中,通过在提示语句中包含格式信息,可以获取具有相应格式信息的目标数据,并进行相应格式的展示,提高展示效果。
[0077]
本实施例中,通过预先配置提示语句,在用户查询数据时不需要用户干预,可以自动的获得效果更好的目标数据,降低用户操作复杂度,提升用户体验。
[0078]
404、通过与所述大模型之间的接口,将所述候选数据和所述提示语句发送至所述大模型,以使所述大模型基于所述提示语句在所述候选数据中过滤所述目标类别的数据,获取所述目标数据。
[0079]
其中,数据服务模块可以通过与大模型之间的接口,将候选数据和提示语句发送至大模型,大模型接收到候选数据和提示语句后,可以基于提示语句中的目标类别对候选数据进行过滤,得到目标数据,大模型将得到的目标数据返回给数据服务模块。
[0080]
本实施例中,通过大模型对候选数据和提示语句进行处理,得到目标数据,可以利用大模型的优良性能实现数据过滤,提升目标数据的精准度。
[0081]
405、接收所述大模型发送的所述目标数据,并展示所述目标数据。
[0082]
其中,上述以提示信息是预先配置的为例,提示信息还可以是用户输入的。例如,基于预先配置的提示信息获取并展示目标数据后,用户发现不符合自身需求,则用户还可以自己构造提示语句,并发送至数据服务模块,数据服务模块将用户产生的提示语句发送至大模型,大模型可以基于当前提示语句,或者基于当前提示语句和历史提示语句进行处理,获取新的目标数据,并返回给用户。上述的过程可以是一轮或多轮,即用户可以通过数据服务模块与大模型进行多轮对话交互,获得最终结果。
[0083]
图5是根据本公开第三实施例的示意图,本实施例提供一种基于人工智能的数据查询装置,该装置500包括:第一获取模块501、第二获取模块502、调用模块503和展示模块504。
[0084]
第一获取模块501用于基于查询语句获取候选数据,所述候选数据包括目标类别的数据;第二获取模块502用于获取提示语句,所述提示语句用于表明过滤所述目标类别的数据;调用模块503用于调用预训练语言模型,以采用所述预训练语言模型在所述候选数据中过滤所述提示语句表明的所述目标类别的数据,获取目标数据;展示模块504用于接收所述预训练语言模块发送的所述目标数据,并展示所述目标数据。
[0085]
本实施例中,通过预训练语言模型对候选数据进行过滤,得到目标数据,可以利用预训练语言模型的优良性能,提升目标数据的精准度。
[0086]
一些实施例中,所述预训练语言模型是大模型;所述调用模块503进一步用于:通过与所述大模型之间的接口,将所述候选数据和所述提示语句发送至所述大模型,以使所述大模型基于所述提示语句在所述候选数据中过滤所述目标类别的数据,获取所述目标数据。
[0087]
本实施例中,通过大模型对候选数据和提示语句进行处理,得到目标数据,可以利用大模型的优良性能实现数据过滤,提升目标数据的精准度。
[0088]
一些实施例中,所述提示语句中包括:所述目标数据的格式信息,所述大模型还基于所述提示语句获取具有所述格式信息的所述目标数据;所述展示模块504进一步用于:展示具有所述格式信息的所述目标数据。
[0089]
本实施例中,通过在提示语句中包含格式信息,可以获取具有相应格式信息的目
标数据,并进行相应格式的展示,提高展示效果。
[0090]
一些实施例中,所述第一获取模块501进一步用于:基于用户设定的查询信息构造查询语句,并基于所述查询语句在数据库中获取原始数据;基于所述原始数据获取所述候选数据。
[0091]
本实施例中,基于查询语句在数据库中获取原始数据,可以利用已有的数据库资源,提升资源利用率。
[0092]
一些实施例中,所述第一获取模块501进一步用于:将所述原始数据作为所述候选数据;或者,将所述原始数据中的预设字段内容,作为所述候选数据。
[0093]
本实施例中,将原始数据作为候选数据,或对原始数据进行筛选获得候选数据,可以提高灵活性,满足个性化需求。
[0094]
可以理解的是,本公开实施例中,不同实施例中的相同或相似内容可以相互参考。
[0095]
可以理解的是,本公开实施例中的“第一”、“第二”等只是用于区分,不表示重要程度高低、时序先后等。
[0096]
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0097]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0098]
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备600旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备600还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0099]
如图6所示,电子设备600包括计算单元601,其可以根据存储在只读存储器(rom)602中的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序,来执行各种适当的动作和处理。在ram603中,还可存储电子设备600操作所需的各种程序和数据。计算单元601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
[0100]
电子设备600中的多个部件连接至i/o接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许电子设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0101]
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如基于人工智能的数据查询方法。例如,在一些实施例中,基于人工智能的数据查询方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由rom602和/或通信单元609而被载入和/或
安装到电子设备600上。当计算机程序加载到ram603并由计算单元601执行时,可以执行上文描述的基于人工智能的数据查询方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于人工智能的数据查询方法。
[0102]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0103]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程负载均衡装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0104]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0105]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0106]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0107]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通
过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtualprivate server",或简称"vps")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0108]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0109]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

技术特征:
1.一种基于人工智能的数据查询方法,包括:基于查询语句获取候选数据,所述候选数据包括目标类别的数据;获取提示语句,所述提示语句用于表明过滤所述目标类别的数据;调用预训练语言模型,以采用所述预训练语言模型在所述候选数据中过滤所述提示语句表明的所述目标类别的数据,获取目标数据;接收所述预训练语言模块发送的所述目标数据,并展示所述目标数据。2.根据权利要求1所述的方法,其中,所述预训练语言模型是大模型;所述调用预训练语言模型,以采用所述预训练语言模型基于所述提示语句在所述候选数据中过滤所述目标类别的数据,获取目标数据,包括:通过与所述大模型之间的接口,将所述候选数据和所述提示语句发送至所述大模型,以使所述大模型基于所述提示语句在所述候选数据中过滤所述目标类别的数据,获取所述目标数据。3.根据权利要求2所述的方法,其中,所述提示语句中包括:所述目标数据的格式信息,所述大模型还基于所述提示语句获取具有所述格式信息的所述目标数据;所述展示所述目标数据,包括:展示具有所述格式信息的所述目标数据。4.根据权利要求1所述的方法,其中,所述基于查询语句获取候选数据,包括:基于用户设定的查询信息构造查询语句,并基于所述查询语句在数据库中获取原始数据;基于所述原始数据获取所述候选数据。5.根据权利要求4所述的方法,其中,所述基于所述原始数据获取所述候选数据,包括:将所述原始数据作为所述候选数据;或者,将所述原始数据中的预设字段内容,作为所述候选数据。6.一种基于人工智能的数据查询装置,包括:第一获取模块,用于基于查询语句获取候选数据,所述候选数据包括目标类别的数据;第二获取模块,用于获取提示语句,所述提示语句用于表明过滤所述目标类别的数据;调用模块,用于调用预训练语言模型,以采用所述预训练语言模型在所述候选数据中过滤所述提示语句表明的所述目标类别的数据,获取目标数据;展示模块,用于接收所述预训练语言模块发送的所述目标数据,并展示所述目标数据。7.根据权利要求6所述的装置,其中,所述预训练语言模型是大模型;所述调用模块进一步用于:通过与所述大模型之间的接口,将所述候选数据和所述提示语句发送至所述大模型,以使所述大模型基于所述提示语句在所述候选数据中过滤所述目标类别的数据,获取所述目标数据。8.根据权利要求7所述的装置,其中,所述提示语句中包括:所述目标数据的格式信息,所述大模型还基于所述提示语句获
取具有所述格式信息的所述目标数据;所述展示模块进一步用于:展示具有所述格式信息的所述目标数据。9.根据权利要求6所述的装置,其中,所述第一获取模块进一步用于:基于用户设定的查询信息构造查询语句,并基于所述查询语句在数据库中获取原始数据;基于所述原始数据获取所述候选数据。10.根据权利要求9所述的装置,其中,所述第一获取模块进一步用于:将所述原始数据作为所述候选数据;或者,将所述原始数据中的预设字段内容,作为所述候选数据。11.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法。13.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-5中任一项所述的方法。

技术总结
本公开提供了一种基于人工智能的数据查询方法、装置、设备和存储介质,涉及人工智能技术领域,具体涉及自然语言理解、大数据等技术领域,可应用在智慧城市、城市治理、应急管理场景下。数据查询方法包括:基于查询语句获取候选数据,所述候选数据包括目标类别的数据;获取提示语句,所述提示语句用于表明过滤所述目标类别的数据;调用预训练语言模型,以采用所述预训练语言模型在所述候选数据中过滤所述提示语句表明的所述目标类别的数据,获取目标数据;接收所述预训练语言模块发送的所述目标数据,并展示所述目标数据。本公开可以提升数据查询精准度。据查询精准度。据查询精准度。


技术研发人员:张天 张晓聪 卓泽城 龚建
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2023.06.29
技术公布日:2023/10/19
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐