一种数据存储方法、查找方法、计算设备及存储介质与流程
未命名
07-29
阅读:111
评论:0
1.本发明涉及计算机技术领域,具体涉及一种数据存储方法、查找方法、计算设备及存储介质。
背景技术:
2.multimap是一种储存键值对的抽象数据结构,其允许有多个包含相同键的键值对同时存在(即一个键对应多个值)。基于此,multimap可被用来存储相似数据。例如,在题库存储中,作为相似题目的存储结构。
3.但是,在键相同的键值对过多时,保存相同的键会浪费大量空间,并且在读取时也会浪费大量时间。例如,当需要获取包含某个键的键值对个数且不需要具体内容时,如果目标键值对数量过多,遍历过程需要浪费大量时间。
技术实现要素:
4.鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据存储方法、查找方法、计算设备以及存储介质。
5.根据本发明的一个方面,提供一种数据存储方法,在计算设备中执行,计算设备中驻留有数据库,该方法包括:从存储对象中提取至少一个特征值;分别以各特征值为键,存储对象为值,构建各特征值与存储对象的关联关系,并作为一条存储数据;将存储数据存储至数据库,并统计各特征值对应存储数据的数量。
6.可选地,在根据本发明的数据存储方法中,其中,统计各特征值对应存储数据的数量,包括:针对每一特征值,若数据库中存在至少一个目标键与该特征值相同,则将该目标值对应存储数据的数量加1;若数据库中不存在目标键与该特征值相同,则将该特征值作为新的键添加至数据库中,并记录该新的键对应存储数据的数量为1。
7.可选地,在根据本发明的数据存储方法中,其中,将存储数据存储至数据库,包括:将存储对象作为各目标键的一个从属节点添加至数据库中;或将存储对象作为新的键的一个从属节点添加至数据库中。
8.可选地,在根据本发明的数据存储方法中,其中,将该特征值作为新的键添加至数据库中,包括:确定该新的键在数据库中的存储位置;基于存储位置,将新的键添加至数据库中。
9.可选地,在根据本发明的数据存储方法中,其中,还包括:当检测到键值对对应的键值数量大于阈值时,删除键值对。
10.可选地,在根据本发明的数据存储方法中,其中,还包括:当检测到数据库的存储空间不足时,删除其存储的键值对中,键为单一字所构建的键值对。
11.可选地,在根据本发明的数据存储方法中,其中,从存储对象中提取至少一个特征值,包括:依次对存储对象进行分词处理,得到各特征值。
12.根据本发明的又一个方面,提供一种数据查找方法,适于对上述数据存储方法实
现的存储数据进行查找,在计算设备中执行,该方法包括:接收数据查找请求,查找请求至少包括用户输入的参考数据;解析参考数据,得到至少一个特征数据;针对每一特征数据,从数据库中获取与特征数据相同的键对应的存储数据数量,并确定存储数据数量不大于第一预设阈值的键对应的特征数据为匹配数据;将匹配数据作为索引,基于暴力匹配技术,从数据库中匹配出查找结果。
13.可选地,在根据本发明的数据查找方法中,其中,将匹配数据作为索引,基于暴力匹配技术,从数据库中匹配出查找结果,包括:针对每一匹配数据,获取包含该匹配数据的各候选数据,并将各候选数据中包含其他特征数据量大于第二预设阈值的候选数据,作为查找结果。
14.根据本发明的又一个方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行上述方法的指令。
15.根据本发明的又一个方面,提供一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行上述的方法。
16.根据本发明的数据存储方法,通过统计每个特征值对应存储数据的数量,使得在数据查找时,无需遍历整个数据库即可快速获取包含某个键的键值对个数,从而高效获得与某个键关联的所有值,并且可以更有效的使用数据库的存储空间。
17.根据本发明的数据查找方法,通过判断数据量中各特征数据的数量,从而对特征进行筛除,达到了减少匹配时间,提高查找效率的目的。
18.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
19.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
20.图1示出了根据本发明一个实施例的计算设备100的示意图;
21.图2示出了根据本发明一个实施例的数据存储方法200的流程图;
22.图3示出了根据本发明一个实施例的数据查找方法300的流程图。
具体实施方式
23.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
24.题目数据是教育资源中重要的组成部分,在学习和教学过程中,学生日常使用的练习题目及用于测试的考试题目均属于题目数据。
25.随着计算机和互联网技术的发展,中小学教育中的题目数据基本实现了电子化存
储。题目数据在学习过程中不仅可以帮助学生加深对知识的学习与理解,还可以帮助老师及时掌握学生对知识的掌握情况,了解学生的学习进度,帮助学生查缺补漏,提高学习效率。而且,用户还可以将不懂的题目上传到平台上,以搜索与该题目最相近的题目进行学习。
26.容易理解的是,相近题目中通常包含有相同的特征值,例如“小明吃苹果”和“小张吃苹果”,二者存在相同的特征值“吃苹果”,这使得在将题目存储至题库中时,需要数据库允许存在相同特征对应多个题目(即一个键对应多个值)。因此,常常使用multimap结构作为题库的数据结构。
27.对于multimap结构而言,随着相同键的键值对不断增加,会浪费大量的存储空间,且无法对数据库中相同键的键值对的数量进行统计。
28.为解决上述现有技术中存在的问题,提出本发明的方案。本发明的一个实施例提供了一种数据存储方法和数据查找方法,两种方法可以在计算设备中执行。图1示出了根据本发明一个实施例的计算设备100的结构图。如图1所示,在基本配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
29.取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μp)、微控制器(μc)、数字信息处理器(dsp)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(alu)、浮点数单元(fpu)、数字信号处理核心(dsp核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
30.取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如ram)、非易失性存储器(诸如rom、闪存等)或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器ram,磁盘中的数据需要加载至物理内存中才能够被处理器104读取。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。应用122实际上是多条程序指令,其用于指示处理器104执行相应的操作。在一些实施方式中,在一些实施方式中,应用122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。操作系统120例如可以是linux、windows等,其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用122包括用于实现各种用户期望的功能的程序指令,应用122例如可以是浏览器、即时通讯软件、软件开发工具(例如集成开发环境ide、编译器等)等,但不限于此。当应用122被安装到计算设备100中时,可以向操作系统120添加驱动模块。
31.在计算设备100启动运行时,处理器104会从存储器106中读取操作系统120的程序指令并执行。应用122运行在操作系统120之上,利用操作系统120以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用122时,应用122会加载至存储器106中,处理器104从存储器106中读取并执行应用122的程序指令。
32.计算设备100还包括储存设备132,储存设备132包括可移除储存器136和不可移除储存器138,可移除储存器136和不可移除储存器138均与储存接口总线134连接。
33.计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口
144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个a/v端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个i/o端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
34.网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(rf)、微波、红外(ir)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
35.计算设备100还包括与总线/接口控制器130相连的储存接口总线134。储存接口总线134与储存设备132相连,储存设备132适于进行数据存储。示例的储存设备132可以包括可移除储存器136(例如cd、dvd、u盘、可移动硬盘等)和不可移除储存器138(例如硬盘驱动器hdd等)。
36.在根据本发明的计算设备100中,应用122包括执行方法200和方法300的多条程序指令。
37.图2示出了根据本发明一个实施例的数据存储方法200的流程图。方法200适于在计算设备(例如前述计算设备100)中执行,计算设备中驻留有数据库。各数据最终以multimap结构形式存储在数据库中。
38.如图2所示,方法200的目的是实现一种通过统计每个特征值对应存储数据的数量,使得在数据查找时,无需遍历整个数据库即可快速获取包含某个键的键值对个数,从而高效获得与某个键关联的所有值,并且可以更有效的使用数据库的存储空间的方法。
39.方法200始于步骤202,在步骤202中,从存储对象中提取至少一个特征值。具体地,可依次对存储对象进行分词处理,得到各特征值。
40.示例性地,当用户将存储对象“小明吃苹果”进行存储时,用户可根据预设的字段长度对该存储对象进行分词,例如,预设字段长度为2,则得到“小明”、“明吃”、“吃苹”和“苹果”四个特征值。当然,也可以设置其他预设字段长度。本技术对此不作限定。
41.随后,在步骤204中,分别以各特征值为键,存储对象为值,构建各特征值与存储对象的关联关系,并作为一条存储数据。
42.继续上述示例,分别以“小明”、“明吃”、“吃苹”和“苹果”为键,“小明吃苹果”为值,构建键值对,每个键值对为一个存储数据,得到4条存储数据:{小明:小明吃苹果}、{明吃:小明吃苹果}、{吃苹:小明吃苹果}和{苹果:小明吃苹果}。
43.最后,在步骤206中,将存储数据存储至数据库,并统计各特征值对应存储数据的数量。
44.具体地,针对每一特征值,若数据库中存在至少一个目标键与该特征值相同,则将该存储对象作为各目标键的一个从属节点添加至数据库中,并将各目标值对应存储数据的数量加1。
45.容易理解的是,multimap底层的数据结构是红黑树实现的,红黑树中的上级节点为下级节点的索引,即上级节点为键,从属节点为值。一个键可对应多个值,例如:
46.上级节点为:“小明”>2
47.从属节点为:“小明吃西瓜”和“小明吃香蕉”。
48.说明,此时数据库中存在键值对{小明:小明吃西瓜}和{小明:小明吃香蕉},而针对键“小明”而言,其对应存储数据的数量为2。
49.随后,在将{小明:小明吃苹果}这一存储数据存储至数据库中时,需将“小明”对应的存储数据的数量加1,最终生成的键值对结构如下:
[0050]“小明”>3
[0051]“小明吃苹果”[0052]“小明吃西瓜”[0053]“小明吃香蕉”[0054]
另外,也可表示为{“小明”>3:“小明吃苹果”、“小明吃西瓜”、“小明吃香蕉”},其中,“>”前的内容表示键,“>”后的内容表示存储数据的数量,“:”后的内容表示具体的值。本技术对键值对的具体表示方式不作限定。
[0055]
若数据库中不存在目标键与该特征值相同,则将该特征值作为新的键添加至数据库中,同时,将存储对象作为新的键的一个从属节点添加至数据库中,并记录该新的键对应存储结构的数量为1。
[0056]
示例性地,针对特征值“明吃”,并未在数据库中发现有键值对的键与其相同,则先在数据库中生成“明吃”这一特征值对应的新的键,再将“小明吃苹果”这一存储对象作为该新的键的一个值添加至数据库中,得到如下结构:
[0057]“明吃”>1
[0058]“小明吃苹果”[0059]
在一些实施例中,需要先确定该新的键在数据库中的存储位置。再基于存储位置,将新的键添加至数据库中。优选地,可根据每个具体键的首个字符的语序确定该键在数据库中的存储位置。根据一些实施方式,根据首字符的首字母的排序,确定存储位置。例如,“明吃”的首个字符为“明”,其拼音为“ming”,则将“明吃”这一特征存储在均为“m”为首的各键之间。
[0060]
这样,当用户需要检索某个数据时,可以直接在数据库中获取每个特征值在数据库中出现的次数。而容易理解的是,特征出现的次数越多越不重要,之后,在进行特征匹配时,可以直接忽略出现次数过多的特征。例如,“小明”出现了100次,而“明吃”只出现了3次,在用户检索“小明吃西瓜”时,可直接忽略“小明”这一特征,只用“明吃”进行匹配。
[0061]
另外,当在内存中使用multimap面临空间不足时,已知出现次数越多的特征越不重要,但占用的空间也越多,所以,当数据库的空间不足时,可删除出现次数足够多的特征对应的键值对。
[0062]
具体地,在一些实施例中,当检测到键值对对应的键数量大于阈值时,删除该键对
应的各键值对。
[0063]
示例性地,数据库中保存有如下键值对:
[0064]“小明”>1
[0065]“小明吃苹果”[0066]“明吃”>2
[0067]“小明吃苹果”[0068]“张明吃苹果”[0069]“吃苹”>2
[0070]“小明吃苹果”[0071]“小明吃苹婆果”[0072]“苹果”>1
[0073]“小明吃苹果”[0074]“苹婆果”>1
[0075]“小明吃苹婆果”[0076]
当出现数据库存储空间不足时,可以删除上述出现两次和以上的特征,变成:
[0077]“小明”>1
[0078]“小明吃苹果”[0079]“明吃”>0
[0080]“吃苹”>0
[0081]“苹果”>1
[0082]“小明吃苹果”[0083]“苹婆果”>1
[0084]“小明吃苹婆果”[0085]
这样,当删除了一些特征对应的键值对后,即释放了数据库的内存空间,又不会对检索结果造成影响。
[0086]
进一步地,当出现多次的特征对应的键值对均被删除后,数据库的内存仍然不足,此时,可以删除其存储的键值对中,键为单一字所构建的键值对。
[0087]
例如,将以“小”为键对应的值“小明”、“小张”、“小王”等存储数据进行删除。
[0088]
根据本发明的数据存储方法,通过统计每个特征值对应存储数据的数量,使得在数据查找时,无需遍历整个数据库即可快速获取包含某个键的键值对个数,从而高效获得与某个键关联的所有值,并且可以更有效的使用数据库的存储空间。
[0089]
图3示出了根据本发明一个实施例的数据查找方法300的流程图。方法300适于在计算设备(例如前述计算设备100)中执行,计算设备中驻留有数据库。
[0090]
如图3所示,方法300的目的是对上述数据存储方法200实现的存储数据进行查找。
[0091]
方法300适于步骤302,接收数据查找请求,查找请求至少包括用户输入的参考数据。具体实施时,可提供一展示界面,展示界面至少包括有参考数据输入接口和数据查找接口,用户通过数据输入接口输入参考数据后,通过选择数据查找接口生成该数据查找请求。例如,用户想要在数据库中搜索“小明吃苹果”相关的数据,则将“小明吃苹果”作为参考数据输入数据输入接口中。
[0092]
随后,计算设备响应该数据查找请求,进入步骤304,解析参考数据,得到至少一个特征数据。具体地,可依次对参考数据进行分词处理,得到各特征数据。继续上述示例,将“小明吃苹果”进行分词,得到“小明”、“明吃”、“吃苹”和“苹果”四个特征值数据。
[0093]
之后,在步骤306中,针对每一特征数据,从数据库中获取与特征数据相同的键对应的存储数据数量,并确定存储数据数量不大于第一预设阈值的键对应的特征数据为匹配数据。通过上述说明可知,出现次数越多的特征越不重要,因此,可通过获取各特征数据在数据库中出现的次数来对特征数据进行筛除。例如,“小明”在数据库中出现了100次,“明吃”在数据库中出现了3次,“吃苹”在数据库中出现了1次,“苹果”在数据库中出现了300次。则可以将“小明”和“苹果”两个特征数据进行筛除,只保留“明吃”和“吃苹”两个特征数据为匹配数据。
[0094]
最后,在步骤308中,将匹配数据作为索引,基于暴力匹配技术,从数据库中匹配出查找结果。
[0095]
具体地,针对每一匹配数据,获取包含该匹配数据的各候选数据,并将各候选数据中包含其他特征数据量大于第二预设阈值的候选数据,作为查找结果。其中,第二预设阈值可根据特征数据的总数来确定,特征数据越多,则第二预设阈值越大,反之,第二预设阈值越小,本技术对此不作限定。例如,利用“明吃”匹配到“小明吃苹果”、“张明吃苹果”和“小明吃西瓜”;利用“吃苹”匹配到“小明吃苹果”。其中,“小明吃苹果”中包含参考数据中的所有特征数据,则将“小明吃苹果”最为最终的查找结果。
[0096]
根据本发明的数据查找方法,通过判断数据量中各特征数据的数量,从而对特征进行筛除,达到了减少匹配时间,提高查找效率的目的。
[0097]
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、u盘、软盘、cd-rom或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
[0098]
b、如b8所述的方法,其中,将所述匹配数据作为索引,基于暴力匹配技术,从所述数据库中匹配出查找结果,包括:针对每一匹配数据,获取包含该匹配数据的各候选数据,并将各候选数据中包含其他特征数据量大于第二预设阈值的候选数据,作为查找结果。
[0099]
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的方法。
[0100]
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
[0101]
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可
以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的较佳实施方式。
[0102]
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0103]
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
[0104]
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
[0105]
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0106]
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0107]
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
[0108]
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
[0109]
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限
定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。
技术特征:
1.一种数据存储方法,在计算设备中执行,所述计算设备中驻留有数据库,该方法包括:从存储对象中提取至少一个特征值;分别以各所述特征值为键,所述存储对象为值,构建各特征值与所述存储对象的关联关系,并作为一条存储数据;将所述存储数据存储至所述数据库,并统计各特征值对应存储数据的数量。2.如权利要求1所述的方法,其中,统计各特征值对应存储数据的数量,包括:针对每一特征值,若所述数据库中存在至少一个目标键与该特征值相同,则将各目标值对应存储数据的数量加1;若所述数据库中不存在目标键与该特征值相同,则将该特征值作为新的键添加至所述数据库中,并记录该新的键对应存储数据的数量为1。3.如权利要求2所述的方法,其中,将所述存储数据存储至所述数据库,包括:将所述存储对象作为各所述目标键的一个从属节点添加至所述数据库中;或将所述存储对象作为所述新的键的一个从属节点添加至所述数据库中。4.如权利要求2所述的方法,其中,将该特征值作为新的键添加至所述数据库中,包括:确定该新的键在所述数据库中的存储位置;基于所述存储位置,将所述新的键添加至所述数据库中。5.如权利要求1所述的方法,其中,还包括:当检测到键值对对应的键数量大于阈值时,删除该键对应的各键值对。6.如权利要求1所述的方法,其中,还包括:当检测到所述数据库的存储空间不足时,删除其存储的键值对中,键为单一字所构建的键值对。7.如权利要求1所述的方法,其中,所述从存储对象中提取至少一个特征值,包括:依次对所述存储对象进行分词处理,得到各所述特征值。8.一种数据查找方法,适于对如权利要求1-7任一项数据存储方法实现的存储数据进行查找,在计算设备中执行,该方法包括:接收数据查找请求,所述查找请求至少包括用户输入的参考数据;解析所述参考数据,得到至少一个特征数据;针对每一特征数据,从数据库中获取与所述特征数据相同的键对应的存储数据数量,并确定存储数据数量不大于第一预设阈值的键对应的特征数据为匹配数据;将所述匹配数据作为索引,基于暴力匹配技术,从所述数据库中匹配出查找结果。9.一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-8中任一项所述方法的指令。10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-8中任一项所述的方法。
技术总结
本发明公开了一种数据存储方法、查找方法、计算设备及存储介质,数据存储方法在计算设备中执行,计算设备中驻留有数据库,该方法包括:从存储对象中提取至少一个特征值;分别以各特征值为键,存储对象为值,构建各特征值与存储对象的关联关系,并作为一条存储数据;将存储数据存储至数据库,并统计各特征值对应存储数据的数量。该数据存储方法,通过统计每个特征值对应存储数据的数量,使得在数据查找时,无需遍历整个数据库即可快速获取包含某个键的键值对个数,从而高效获得与某个键关联的所有值,并且可以更有效的使用数据库的存储空间。间。间。
技术研发人员:郭小雷 王庆苑 殷浒 李鹏飞
受保护的技术使用者:湖北小熊图书文化传媒有限公司
技术研发日:2023.04.13
技术公布日:2023/7/28
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/