数据清理方法、装置、计算机设备及存储介质与流程

未命名 09-23 阅读:78 评论:0


1.本技术涉及大数据技术以及金融科技领域,尤其涉及一种数据清理方法、装置、计算机设备及存储介质。


背景技术:

2.数据库是业务数据的汇聚仓库,上层业务通过数据库进行数据的存储和调用。随着时间的增加,数据库中的存储数据也会大量增长,导致存储成本不断增大。例如,金融机构的业务涉及大量的客户,每天都会增加海量的存储数据,带来巨大的存储压力。
3.由于存储数据有被访问的可能,管理人员不知道哪些数据会被访问到,因此只能不停地存储,不能对数据进行准确评估,也无法对存储数据进行有效的清理。


技术实现要素:

4.本技术实施例的目的在于提出一种数据清理方法、装置、计算机设备及存储介质,以对存储的数据进行有效的清理。
5.为了解决上述技术问题,本技术实施例提供一种数据清理方法,采用了如下所述的技术方案:
6.获取各存储对象的各项存储指标,其中,存储对象中具有已存数据;
7.通过预设的权重算法对所述各存储对象的各项存储指标进行计算,得到所述各存储对象的各项存储指标分别对应的指标权重;
8.对于每个存储对象,基于所述存储对象的各项存储指标分别对应的指标权重以及指标值,计算所述存储对象中已存数据的数据保留价值;
9.根据所述数据保留价值确定所述存储对象中已存数据的数据价值等级;
10.获取与所述数据价值等级相匹配的数据清理策略,并根据所述数据清理策略对所述存储对象中的已存数据进行数据清理。
11.为了解决上述技术问题,本技术实施例还提供一种数据清理装置,采用了如下所述的技术方案:
12.指标获取模块,用于获取各存储对象的各项存储指标,其中,存储对象中具有已存数据;
13.权重计算模块,用于通过预设的权重算法对所述各存储对象的各项存储指标进行计算,得到所述各存储对象的各项存储指标分别对应的指标权重;
14.价值计算模块,用于对于每个存储对象,基于所述存储对象的各项存储指标分别对应的指标权重以及指标值,计算所述存储对象中已存数据的数据保留价值;
15.等级确定模块,用于根据所述数据保留价值确定所述存储对象中已存数据的数据价值等级;
16.数据清理模块,用于获取与所述数据价值等级相匹配的数据清理策略,并根据所述数据清理策略对所述存储对象中的已存数据进行数据清理。
17.为了解决上述技术问题,本技术实施例还提供一种计算机设备,采用了如下所述的技术方案:
18.获取各存储对象的各项存储指标,其中,存储对象中具有已存数据;
19.通过预设的权重算法对所述各存储对象的各项存储指标进行计算,得到所述各存储对象的各项存储指标分别对应的指标权重;
20.对于每个存储对象,基于所述存储对象的各项存储指标分别对应的指标权重以及指标值,计算所述存储对象中已存数据的数据保留价值;
21.根据所述数据保留价值确定所述存储对象中已存数据的数据价值等级;
22.获取与所述数据价值等级相匹配的数据清理策略,并根据所述数据清理策略对所述存储对象中的已存数据进行数据清理。
23.为了解决上述技术问题,本技术实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
24.获取各存储对象的各项存储指标,其中,存储对象中具有已存数据;
25.通过预设的权重算法对所述各存储对象的各项存储指标进行计算,得到所述各存储对象的各项存储指标分别对应的指标权重;
26.对于每个存储对象,基于所述存储对象的各项存储指标分别对应的指标权重以及指标值,计算所述存储对象中已存数据的数据保留价值;
27.根据所述数据保留价值确定所述存储对象中已存数据的数据价值等级;
28.获取与所述数据价值等级相匹配的数据清理策略,并根据所述数据清理策略对所述存储对象中的已存数据进行数据清理。
29.与现有技术相比,本技术实施例主要有以下有益效果:获取各存储对象的各项存储指标,存储对象中具有已存数据,各项存储指标从不同维度描述已存数据的特性,或者存储对象在存储上的特性;通过权重算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重,实现权重的客观计算;对于每个存储对象,根据其各项存储指标分别对应的指标权重以及指标值,计算已存数据的数据保留价值,它代表已存数据的价值以及重要性,根据数据保留价值确定数据价值等级,获取与数据价值等级相匹配的数据清理策略,数据清理策略定义了对已存数据的清理方式,从而可以根据数据清理策略实现合理有效的数据清理。
附图说明
30.为了更清楚地说明本技术中的方案,下面将对本技术实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
31.图1是本技术可以应用于其中的示例性系统架构图;
32.图2是根据本技术的数据清理方法的一个实施例的流程图;
33.图3是根据本技术的数据清理装置的一个实施例的结构示意图;
34.图4是根据本技术的计算机设备的一个实施例的结构示意图。
具体实施方式
35.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术;本技术的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本技术的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
36.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
37.为了使本技术领域的人员更好地理解本技术方案,下面将结合附图,对本技术实施例中的技术方案进行清楚、完整地描述。
38.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
39.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
40.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
41.服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
42.需要说明的是,本技术实施例所提供的数据清理方法一般由服务器执行,相应地,数据清理装置一般设置于服务器中。
43.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
44.继续参考图2,示出了根据本技术的数据清理方法的一个实施例的流程图。所述的数据清理方法,包括以下步骤:
45.步骤s201,获取各存储对象的各项存储指标,其中,存储对象中具有已存数据。
46.在本实施例中,数据清理方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式与终端设备进行通信。需要指出的是,上述无线连接方式可以包括但不限于3g/4g/5g连接、wifi连接、蓝牙连接、wimax连接、zigbee连接、uwb(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
47.具体地,服务器获取各存储对象的各项存储指标,存储对象是用于存储数据的对象,具有多维度的存储指标,不同的存储指标从不同维度描述存储对象中已存数据的特性,
或者存储对象在存储数据上的特性,例如,存储指标可以通过存储成本描述存储对象在存储数据上的特性,通过可维护性描述存储对象中已存数据的特性。
48.进一步的,在上述步骤s201之前,还可以包括:接收对象清理指令;基于对象清理指令确定待清理的多个存储对象,其中,存储对象为数据库或者数据库中的数据存储组织。
49.具体地,服务器接收对象清理指令,对象清理指令中记录了需要清理的多个存储对象,服务器需要对这些存储对象进行数据价值评估以及数据清理。
50.本技术中的存储对象可以是数据库或者数据库中的数据存储组织;数据库可以包含不同的存储部分,不同的存储部分即不同的数据存储组织,例如,数据库中同时存储a类数据和b类数据,则存储a类数据的可以视为一个数据存储组织,存储b类数据的可以视为另一个数据存储组织。
51.通常,一个对象清理指令中的存储对象通常是同一级别,即,同时为数据库,或者同时为数据库中的数据存储组织;一个对象清理指令中的存储对象也可以是不同级别,即,同时包含数据库和数据存储组织。
52.本实施例中,基于对象清理指令确定待清理的多个存储对象,存储对象为数据库或者数据库中的数据存储组织,提高了存储对象设置上的灵活性。
53.进一步的,上述步骤s201可以包括:获取各存储对象的各存储评估参数和各用户影响参数;对各存储对象的各存储评估参数和各用户影响参数进行标准化处理,得到各存储对象的各项存储评估指标和各项用户影响指标;将各存储对象的各项存储评估指标和各项用户影响指标,确定为各存储对象的各项存储指标。
54.具体地,对于每个存储对象,存储对象具有多个存储评估参数和多个用户影响参数;存储评估参数和用户影响参数是用于描述存储对象中已存数据的特性,或者存储对象在存储数据上的特性。
55.存储评估参数和用户影响参数可以具有实际物理意义,即具有量纲,例如,将存储对象中剩余存储容量作为存储评估参数,其单位是太字节(terabyte,计算机存储容量单位,也可以用tb表示),存储评估参数和用户影响参数也可以不具有量纲。
56.存储评估参数更倾向于存储对象或已存数据本身的特性,用户影响参数更倾向于管理人员给存储对象或已存数据添加的特性。例如,存储评估参数可以包括(加密)存储成本、剩余存储容量、操作次数(已存数据被操作的次数,包括读取、修改等的次数)、可维护性等;用户影响参数包括用户授权参数(使用用户的数据需要经过用户授权,通过用户授权参数表示用户对用户数据的授权许可情况,经过授权的数据可以保留较长的时间,未经授权的数据需要尽快清理)和激活参数(管理人员对数据是否需要保留、减缓清理进程的评估)等。
57.对存储对象的各存储评估参数和各用户影响参数进行标准化处理,从而将各存储评估参数和各用户影响参数映射到合适的取值区间;不管各存储评估参数和各用户影响参数有没有量纲,都可以进行标准化处理,得到存储对象的各项存储评估指标和各项用户影响指标,并将存储对象的各项存储评估指标和各项用户影响指标,确定为存储对象的各项存储指标。
58.本实施例中,获取各存储对象的各存储评估参数和各用户影响参数并进行标准化处理以便于后续的权重计算,将标准化处理后的各项存储评估指标和各项用户影响指标确
定为各存储对象的各项存储指标,提升了存储指标的丰富度,确保了可以对存储对象进行全面准确的评估。
59.步骤s202,通过预设的权重算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重。
60.具体地,服务器可以通过预设的权重算法,计算各存储对象的各项存储指标分别对应的指标权重,指标权重越大,存储指标在数据保留价值的评估中越重要。
61.进一步的,上述步骤s202可以包括:通过熵值算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重。
62.具体地,预设的权重算法可以是熵值算法,熵的概念源于热力学,是对系统状态不确定性的一种度量。在信息论中,信息是系统有序程度的一种度量,熵是系统无序程度的一种度量,两者绝对值相等,但符号相反。可以利用评价中各方案的固有信息,通过熵值算法得到各项存储指标的信息熵,信息熵越小,信息的无序度越低,信息的效用值越大,存储指标的权重越大。
63.各存储对象具有相同的若干项存储指标,但是不同的存储对象在同一存储指标下的指标值不同。熵值算法会计算出存储对象的每一项存储指标的指标权重。假设现有存储对象甲、乙、丙、丁,它们有一项存储指标为a,在计算存储对象甲的存储指标a的指标权重时,还需要结合其他存储对象(乙、丙、丁)在存储指标a下的指标值。
64.可以理解,本技术还可以使用其他权重算法,例如critic算法、层次分析法、relief算法等来计算指标权重。
65.本实施例中,通过熵值法计算各存储对象的各项存储指标分别对应的指标权重,避免了主观因素的影响,确保了得到的指标权重的合理性。
66.步骤s203,对于每个存储对象,基于存储对象的各项存储指标分别对应的指标权重以及指标值,计算存储对象中已存数据的数据保留价值。
67.具体地,存储对象中具有已存数据,本技术计算数据保留价值来评估已存数据是否值得保存。当前,对于每个存储对象,已经计算出了每项存储指标的指标权重,并具有其指标值;将各项存储指标的权重与其对应的指标值进行相乘,然后将各乘积相加,即可得到存储对象中已存数据的数据保留价值。可以理解,数据保留价值的数值越大,已存数据越具有保存的价值以及重要性。
68.步骤s204,根据数据保留价值确定存储对象中已存数据的数据价值等级。
69.具体地,本技术设置了多个数据价值等级,数据价值等级和数据保留价值相关;可以预先设置多个数据价值区间,不同的数据价值区间代表不同的数据价值等级,确定数据保留价值所对应的数据价值区间,便可得到存储对象中已存数据的数据价值等级。
70.在一个实施例中,根据数据保留价值对各存储对象进行排序得到排序队列,设置排序队列中的每一个存储对象处于一个数据价值等级。
71.步骤s205,获取与数据价值等级相匹配的数据清理策略,并根据数据清理策略对存储对象中的已存数据进行数据清理。
72.具体地,不同的数据价值等级具有不同的数据清理策略,同一个数据价值等级具有相同的数据清理策略。获取与数据价值等级相匹配的数据清理策略,数据清理策略规定了对存储对象中的已存数据的清理方式,从而根据数据清理策略对存储对象中的已存数据
进行数据清理。
73.本实施例中,获取各存储对象的各项存储指标,存储对象中具有已存数据,各项存储指标从不同维度描述已存数据的特性,或者存储对象在存储上的特性;通过权重算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重,实现权重的客观计算;对于每个存储对象,根据其各项存储指标分别对应的指标权重以及指标值,计算已存数据的数据保留价值,它代表已存数据的价值以及重要性,根据数据保留价值确定数据价值等级,获取与数据价值等级相匹配的数据清理策略,数据清理策略定义了对已存数据的清理方式,从而可以根据数据清理策略实现合理有效的数据清理。
74.进一步的,上述步骤s205可以包括:获取与数据价值等级相匹配的数据清理策略,数据清理策略包括清理时间节点及其对应的清理比例;根据数据清理策略对存储对象中的已存数据进行数据清理。
75.具体地,获取与数据价值等级相匹配的数据清理策略,数据清理策略包括清理时间节点及其对应的清理比例。清理时间节点可以有多个,代表在哪些时间节点进行清理,例如,设置一年、三年、五年三个清理时间节点,代表从当前开始,分别在第一年、第三年和第五年对已存数据进行清理,并通过三次完成对已存数据的清理(完成清理不代表将已存数据全部删除);在每个时间节点进行数据清理时,可以清理掉一部分已存数据,每次清理多少以清理比例进行表示,例如,第一年的清理比例为0%,代表第一年不对已存数据进行清理;第三年的清理比例为50%,代表第三年时清理掉50%的已存数据;第五年的清理比例为80%,代表第三年时清理掉80%的已存数据。可以理解,不同的数据价值等级的数据清理策略,具有不同的清理时间节点及其对应的清理比例。清理策略还可以进行临时配置。
76.服务器根据数据清理策略对存储对象中的已存数据进行数据清理。
77.本实施例中,获取与数据价值等级相匹配的数据清理策略,数据清理策略包括清理时间节点及其对应的清理比例,代表了需要在哪些时间节点清理掉多少已存数据,从而根据数据清理策略对存储对象中的已存数据实现有效的数据清理。
78.进一步的,存储对象以数据表的形式存储已存数据,则上述根据数据清理策略对存储对象中的已存数据进行数据清理的步骤可以包括:获取存储对象的已存数据中,各数据表的各项表评估指标;根据各数据表的各项表评估指标,确定各数据表的数据表价值;根据数据清理策略和数据表价值,对各数据表进行清理。
79.具体地,存储对象可以通过数据表的形式存储已存数据,即,将数据存储在数据表中。服务器还可以获取各数据表的各项表评估指标;各项表评估指标从不同维度表示数据表中已存数据的特性,它可以与存储对象的存储指标有内涵上的相同,例如,表评估指标可以包括(加密)存储成本、表格数据量、操作次数(数据表被操作的次数,包括读取、修改等的次数)、可维护性、用户授权参数(使用用户的数据需要经过用户授权,通过用户授权参数表示用户对用户数据的授权许可情况)和激活参数(管理人员对数据是否需要保留、减缓清理进程的评估)等。
80.服务器可以根据各数据表的各项表评估指标,确定各数据表的数据表价值,例如,同样根据权重算法计算出各数据表的各项表评估指标的指标权重,然后根据指标权重及其指标值计算出数据表价值,数据表价值反应了数据表的存储价值和重要性。或者,将各项表评估指标输入价值评估模型,价值评估模型可以是基于人工智能的模型,由价值评估模型
输出数据表价值。
81.数据清理策略中具有清理比例,在每个清理时间节点,根据各数据表的数据表价值,确定根据清理比例需要进行清理的数据表,然后对各数据表进行清理。例如,在第一年需要清理掉20%的已存数据,第二年需要清理掉50%的已存数据,则先确定数据表价值排在后20%的数据表有哪些(记为d1类数据表),数据表价值排在后20%-50%的数据表有哪些(记为d2类数据表),然后在第一年内指定的清理触发时间点将d1类数据表删除,在第二年内指定的清理触发时间点将d2类数据表删除。
82.本实施例中,计算已存数据中各数据表的数据表价值,根据数据清理策略和数据表价值,对各数据表进行有效地清理。
83.进一步的,上述步骤s205之后,还可以包括:获取存储对象的重新评估信息,重新评估信息包括存储对象的数据价值等级、访问指标、激活指标或授权指标;根据重新评估信息确定已更新清理策略;根据已更新清理策略对存储对象中的已存数据进行数据清理。
84.具体地,获取存储对象的重新评估信息,重新评估信息包括存储对象最初的数据价值等级、访问指标、激活指标或授权指标;其中,访问指标是已存数据最新的被访问情况的指标;管理人员可以对已存数据的重要性进行判断,给已存数据添加激活指标,激活指标可以减缓已存数据的清理进程;授权指标表示用户对已存数据最新的授权情况。
85.根据重新评估信息确定已更新清理策略,例如,将重新评估信息输入基于人工智能的策略模型,例如基于树模型的策略模型,得到已更新清理策略。已更新清理策略可以对以前的数据清理策略进行调整,例如,以前的数据清理策略规定了在第一年清理掉20%的已存数据,第二年清理掉80%的已存数据,第三年清理掉100%的已存数据;在第一年之后,得到已更新清理策略,已更新清理策略规定在第二年需要保留原始已存数据的80%,在第三年需要保留原始已存数据的60%。则根据已更新清理策略对存储对象中的已存数据进行数据清理。可以理解,已更新策略是在原有数据清理策略执行的基础上进行的(或者在原有数据清理策略未执行时便进行替换)。
86.本实施例中,获取存储对象的重新评估信息,根据重新评估信息确定已更新清理策略,通过已更新清理策略替换数据清理策略对存储对象中的已存数据进行数据清理,可以实现清理策略的及时调整。
87.本技术中存储对象中的已存数据可以是金融机构存储的业务数据;可以理解,已存数据也可以是其他场景领域中需要存储的数据。
88.需要强调的是,为进一步保证上述数据清理策略的私密和安全性,上述数据清理策略还可以存储于一区块链的节点中。
89.本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
90.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及
应用系统。
91.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
92.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)等非易失性存储介质,或随机存储记忆体(random access memory,ram)等。
93.应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
94.进一步参考图3,作为对上述图2所示方法的实现,本技术提供了一种数据清理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
95.如图3所示,本实施例所述的数据清理装置300包括:指标获取模块301、权重计算模块302、价值计算模块303、等级确定模块304以及数据清理模块305,其中:
96.指标获取模块301,用于获取各存储对象的各项存储指标,其中,存储对象中具有已存数据。
97.权重计算模块302,用于通过预设的权重算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重。
98.价值计算模块303,用于对于每个存储对象,基于存储对象的各项存储指标分别对应的指标权重以及指标值,计算存储对象中已存数据的数据保留价值。
99.等级确定模块304,用于根据数据保留价值确定存储对象中已存数据的数据价值等级。
100.数据清理模块305,用于获取与数据价值等级相匹配的数据清理策略,并根据数据清理策略对存储对象中的已存数据进行数据清理。
101.本实施例中,获取各存储对象的各项存储指标,存储对象中具有已存数据,各项存储指标从不同维度描述已存数据的特性,或者存储对象在存储上的特性;通过权重算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重,实现权重的客观计算;对于每个存储对象,根据其各项存储指标分别对应的指标权重以及指标值,计算已存数据的数据保留价值,它代表已存数据的价值以及重要性,根据数据保留价值确定数据价值等级,获取与数据价值等级相匹配的数据清理策略,数据清理策略定义了对已存数据的清理方式,从而可以根据数据清理策略实现合理有效的数据清理。
102.在本实施例的一些可选的实现方式中,数据清理装置300还可以包括:指令接收模
块以及对象确定模块,其中:
103.指令接收模块,用于接收对象清理指令。
104.对象确定模块,用于基于对象清理指令确定待清理的多个存储对象,其中,存储对象为数据库或者数据库中的数据存储组织。
105.本实施例中,基于对象清理指令确定待清理的多个存储对象,存储对象为数据库或者数据库中的数据存储组织,提高了存储对象设置上的灵活性。
106.在本实施例的一些可选的实现方式中,指标获取模块301可以包括:参数获取子模块、标准处理子模块以及指标确定子模块,其中:
107.参数获取子模块,用于获取各存储对象的各存储评估参数和各用户影响参数。
108.标准处理子模块,用于对各存储对象的各存储评估参数和各用户影响参数进行标准化处理,得到各存储对象的各项存储评估指标和各项用户影响指标。
109.指标确定子模块,用于将各存储对象的各项存储评估指标和各项用户影响指标,确定为各存储对象的各项存储指标。
110.本实施例中,获取各存储对象的各存储评估参数和各用户影响参数并进行标准化处理以便于后续的权重计算,将标准化处理后的各项存储评估指标和各项用户影响指标确定为各存储对象的各项存储指标,提升了存储指标的丰富度,确保了可以对存储对象进行全面准确的评估。
111.在本实施例的一些可选的实现方式中,权重计算模块302还用于通过熵值算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重。
112.本实施例中,通过熵值法计算各存储对象的各项存储指标分别对应的指标权重,避免了主观因素的影响,确保了得到的指标权重的合理性。
113.在本实施例的一些可选的实现方式中,数据清理模块305可以包括:策略获取子模块以及数据清理子模块,其中:
114.策略获取子模块,用于获取与数据价值等级相匹配的数据清理策略,数据清理策略包括清理时间节点及其对应的清理比例。
115.数据清理子模块,用于根据数据清理策略对存储对象中的已存数据进行数据清理。
116.本实施例中,获取与数据价值等级相匹配的数据清理策略,数据清理策略包括清理时间节点及其对应的清理比例,代表了需要在哪些时间节点清理掉多少已存数据,从而根据数据清理策略对存储对象中的已存数据实现有效的数据清理。
117.在本实施例的一些可选的实现方式中,存储对象以数据表的形式存储已存数据,数据清理子模块可以包括:指标获取单元、价值确定单元以及表清理单元,其中:
118.指标获取单元,用于获取存储对象的已存数据中,各数据表的各项表评估指标。
119.价值确定单元,用于根据各数据表的各项表评估指标,确定各数据表的数据表价值。
120.表清理单元,用于根据数据清理策略和数据表价值,对各数据表进行清理。
121.本实施例中,计算已存数据中各数据表的数据表价值,根据数据清理策略和数据表价值,对各数据表进行有效地清理。
122.在本实施例的一些可选的实现方式中,数据清理装置还可以包括:信息获取模块、更新确定模块以及更新清理模块,其中:
123.信息获取模块,用于获取存储对象的重新评估信息,重新评估信息包括存储对象的数据价值等级、访问指标、激活指标或授权指标。
124.更新确定模块,用于根据重新评估信息确定已更新清理策略。
125.更新清理模块,用于根据已更新清理策略对存储对象中的已存数据进行数据清理。
126.本实施例中,获取存储对象的重新评估信息,根据重新评估信息确定已更新清理策略,通过已更新清理策略替换数据清理策略对存储对象中的已存数据进行数据清理,可以实现清理策略的及时调整。
127.为解决上述技术问题,本技术实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
128.所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件41-43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器(digital signal processor,dsp)、嵌入式设备等。
129.所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
130.所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如数据清理方法的计算机可读指令等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
131.所述处理器42在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据,例如运行所述数据清理方法的计算机可读指令。
132.所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
133.本实施例中提供的计算机设备可以执行上述数据清理方法。此处数据清理方法可以是上述各个实施例的数据清理方法。
134.本实施例中,获取各存储对象的各项存储指标,存储对象中具有已存数据,各项存储指标从不同维度描述已存数据的特性,或者存储对象在存储上的特性;通过权重算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重,实现权重的客观计算;对于每个存储对象,根据其各项存储指标分别对应的指标权重以及指标值,计算已存数据的数据保留价值,它代表已存数据的价值以及重要性,根据数据保留价值确定数据价值等级,获取与数据价值等级相匹配的数据清理策略,数据清理策略定义了对已存数据的清理方式,从而可以根据数据清理策略实现合理有效的数据清理。
135.本技术还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的数据清理方法的步骤。
136.本实施例中,获取各存储对象的各项存储指标,存储对象中具有已存数据,各项存储指标从不同维度描述已存数据的特性,或者存储对象在存储上的特性;通过权重算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重,实现权重的客观计算;对于每个存储对象,根据其各项存储指标分别对应的指标权重以及指标值,计算已存数据的数据保留价值,它代表已存数据的价值以及重要性,根据数据保留价值确定数据价值等级,获取与数据价值等级相匹配的数据清理策略,数据清理策略定义了对已存数据的清理方式,从而可以根据数据清理策略实现合理有效的数据清理。
137.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所述的方法。
138.显然,以上所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例,附图中给出了本技术的较佳实施例,但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本技术专利保护范围之内。

技术特征:
1.一种数据清理方法,其特征在于,包括下述步骤:获取各存储对象的各项存储指标,其中,存储对象中具有已存数据;通过预设的权重算法对所述各存储对象的各项存储指标进行计算,得到所述各存储对象的各项存储指标分别对应的指标权重;对于每个存储对象,基于所述存储对象的各项存储指标分别对应的指标权重以及指标值,计算所述存储对象中已存数据的数据保留价值;根据所述数据保留价值确定所述存储对象中已存数据的数据价值等级;获取与所述数据价值等级相匹配的数据清理策略,并根据所述数据清理策略对所述存储对象中的已存数据进行数据清理。2.根据权利要求1所述的数据清理方法,其特征在于,在所述获取各存储对象的各项存储指标的步骤之前,还包括:接收对象清理指令;基于所述对象清理指令确定待清理的多个存储对象,其中,存储对象为数据库或者数据库中的数据存储组织。3.根据权利要求1所述的数据清理方法,其特征在于,所述获取各存储对象的各项存储指标的步骤包括:获取各存储对象的各存储评估参数和各用户影响参数;对所述各存储对象的各存储评估参数和各用户影响参数进行标准化处理,得到所述各存储对象的各项存储评估指标和各项用户影响指标;将所述各存储对象的各项存储评估指标和各项用户影响指标,确定为所述各存储对象的各项存储指标。4.根据权利要求1所述的数据清理方法,其特征在于,所述通过预设的权重算法对所述各存储对象的各项存储指标进行计算,得到所述各存储对象的各项存储指标分别对应的指标权重的步骤包括:通过熵值算法对所述各存储对象的各项存储指标进行计算,得到所述各存储对象的各项存储指标分别对应的指标权重。5.根据权利要求1所述的数据清理方法,其特征在于,所述获取与所述数据价值等级相匹配的数据清理策略,并根据所述数据清理策略对所述存储对象中的已存数据进行数据清理的步骤包括:获取与所述数据价值等级相匹配的数据清理策略,所述数据清理策略包括清理时间节点及其对应的清理比例;根据所述数据清理策略对所述存储对象中的已存数据进行数据清理。6.根据权利要求5所述的数据清理方法,其特征在于,所述存储对象以数据表的形式存储所述已存数据,所述根据所述数据清理策略对所述存储对象中的已存数据进行数据清理的步骤包括:获取所述存储对象的已存数据中,各数据表的各项表评估指标;根据所述各数据表的各项表评估指标,确定所述各数据表的数据表价值;根据所述数据清理策略和所述数据表价值,对所述各数据表进行清理。7.根据权利要求1所述的数据清理方法,其特征在于,在所述根据所述数据清理策略对
所述存储对象中的已存数据进行数据清理的步骤之后,还包括:获取所述存储对象的重新评估信息,所述重新评估信息包括所述存储对象的数据价值等级、访问指标、激活指标或授权指标;根据所述重新评估信息确定已更新清理策略;根据所述已更新清理策略对所述存储对象中的已存数据进行数据清理。8.一种数据清理装置,其特征在于,包括:指标获取模块,用于获取各存储对象的各项存储指标,其中,存储对象中具有已存数据;权重计算模块,用于通过预设的权重算法对所述各存储对象的各项存储指标进行计算,得到所述各存储对象的各项存储指标分别对应的指标权重;价值计算模块,用于对于每个存储对象,基于所述存储对象的各项存储指标分别对应的指标权重以及指标值,计算所述存储对象中已存数据的数据保留价值;等级确定模块,用于根据所述数据保留价值确定所述存储对象中已存数据的数据价值等级;数据清理模块,用于获取与所述数据价值等级相匹配的数据清理策略,并根据所述数据清理策略对所述存储对象中的已存数据进行数据清理。9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的数据清理方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的数据清理方法的步骤。

技术总结
本申请实施例属于大数据以及金融科技领域,涉及一种数据清理方法、装置、计算机设备及存储介质,方法包括:获取各存储对象的各项存储指标,存储对象中具有已存数据;通过权重算法对各存储对象的各项存储指标进行计算,得到各存储对象的各项存储指标分别对应的指标权重;对于每个存储对象,基于存储对象的各项存储指标分别对应的指标权重以及指标值,计算存储对象中已存数据的数据保留价值;根据数据保留价值确定存储对象中已存数据的数据价值等级;获取与数据价值等级相匹配的数据清理策略,并根据数据清理策略对存储对象中的已存数据进行数据清理。本申请还涉及区块链技术,数据清理策略可存储于区块链中


技术研发人员:苏媛媛
受保护的技术使用者:中国平安财产保险股份有限公司
技术研发日:2023.06.21
技术公布日:2023/9/22
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐