一种生物样本信息数据库的构建方法和装置与流程
未命名
09-29
阅读:62
评论:0
1.本发明涉及数据库领域,更具体地说,本发明涉及一种生物样本信息数据库的构建方法和装置。
背景技术:
2.为了方便对生物样本数据进行增删改查,传统方式通常将生物样本数据录入到数据库中进行存储。然而,在数据库运行过程中,可能会遇到各种问题,导致数据库发生运行故障。当数据库发生故障时,内置的自动故障恢复机制会自动尝试恢复受影响的数据和服务,但由于故障程度的不同,数据恢复往往会有一定的缺失,导致数据恢复的完整性受损。
3.为了应对这些风险,传统方法通常会定期进行数据备份作为一种保护措施。数据备份可以在定期的时间间隔内对数据库进行快照拷贝,并将备份数据存储在可靠的存储介质中。这样,即使数据库发生故障,可以通过恢复备份数据来还原数据库的状态,从而减少数据丢失的风险。
4.然而,传统的定期备份方法存在一些限制。首先,备份频率是固定的,无法根据当前数据恢复的可靠性和数据库的性能情况进行灵活调整。如果备份频率过低,可能导致数据丢失较多;而备份频率过高,则可能增加了系统资源的消耗。其次,仅依靠定期备份无法灵活保障数据存储的安全性。如果在备份周期内发生故障,可能会导致数据无法及时备份,从而增加了数据丢失的风险。
5.为了解决上述问题,现提供一种技术方案。
技术实现要素:
6.为了克服现有技术的上述缺陷,本发明的实施例提供通过评估数据库的数据恢复效果,在数据恢复效果不好的情况下获取数据库的使用性能状态,在数据库的性能满足灵活调整备份间隔时间的情况下,结合数据恢复效果对数据备份间隔时间进行灵活的调整,从而在数据恢复效果差的情况下通过调整数据备份间隔时间减少丢失,以解决上述背景技术中提出的问题。
7.为实现上述目的,本发明提供如下技术方案:步骤s100:采集数据库的故障参数和恢复参数;步骤s200:将故障参数和恢复参数经过归一化得到数据恢复效果系数,将数据恢复效果系数和数据恢复效果阈值进行比较,若数据恢复效果系数小于数据恢复效果阈值,生成可行信号;若数据恢复效果系数大于等于数据恢复效果阈值,生成难行信号;步骤s300:在获得难行信号后,采集数据库的资源参数和性能参数,将资源参数和性能参数经过归一化得到可操作系数;步骤s400:将可操作系数和可操作阈值进行比较,若可操作系数大于等于可操作阈值,生成优良信号;若可操作系数小于可操作阈值,生成干预信号;步骤s500:在获取优良信号后,获取数据备份间隔时间,将数据恢复效果系数、数
据恢复效果阈值和数据库备份时间间隔进行综合得到补偿备份间隔时间,补偿备份间隔时间用于替换数据备份间隔时间。
8.在一个优选的实施方式中,步骤s100包括以下步骤:其中,故障参数包括故障致命指数,恢复参数包括数据恢复缺失动态度、性能参数包括数据库性能指数;故障致命指数的获取逻辑为:步骤s101:记录数据库运行总时间,即数据库从启动到目前的累计运行时间;步骤s102:将数据库运行总时间除以故障发生的次数,得到所有故障发生的平均时间间隔;步骤s103:将数据库运行总时间除以致命故障发生的次数,得到致命故障发生的平均时间间隔;致命故障是指导致数据库触发数据恢复的严重故障;步骤s104:将致命故障发生的平均时间间隔除以所有故障发生的平均时间间隔,得到故障致命指数。
9.在一个优选的实施方式中,数据恢复缺失动态度的获取逻辑为:步骤s111:对于每次数据发生数据恢复事件,记录下对应的数据恢复缺失比例,即原始数据和恢复过后数据之间的缺失比例,计算公式为:缺失比例=缺失数据点数量/原始总数据点数量;步骤s112:记录在时间范围t内发生的不同数据恢复事件的数据恢复缺失比例,将不同数据恢复事件的数据恢复缺失比例标定为,i=1、2、3、4、
……
、n,n为正整数,通过的标准差获取数据恢复缺失比例波动率,将的标准差标定为x,计算公式为:,式中,为不同数据恢复事件的数据恢复缺失比例的平均值,x为不同数据恢复事件的数据恢复缺失比例的标准差,通过不同数据恢复事件的数据恢复缺失比例的标准差获得数据恢复缺失动态度。
10.在一个优选的实施方式中,步骤s300包括以下步骤:在获得难行信号后,采集数据库的资源参数和性能参数,其中资源参数包括负载空置率,性能参数包括读取稳定指数;低负载均衡指数的获取逻辑为:步骤s311:将整个运行周期划分为多个时间段;步骤s312:对于每个时间段,计算该时间段内的低负载时间,低负载时间指的是cpu利用率低于利用率阈值的时间;步骤s313:计算每个时间段内低负载时间的比例,计算公式为:低负载时间比例=低负载时间/时间段总时间;步骤s314:将不同时间段的低负载时间比例标记为,j=1、2、3、4、
……
、m,m为
正整数,通过的标准差标记为s,计算公式为:,式中,为不同时间段的低负载时间比例的平均值,s为不同时间段的低负载时间比例的标准差,通过不同时间段的低负载时间比例的标准差获得低负载均衡指数。
11.在一个优选的实施方式中,读取稳定指数的获取逻辑为:步骤s321:将数据库一个运行周期划分为多个时间段,每个时间段具有相同的时间长度;步骤s322:在每个时间段内记录读取延迟的平均值;步骤s323:对于每个时间段,判断该时间段内的读取延迟的平均值是否低于读取延迟阈值,统计低于读取延迟阈值的时间段的数量;步骤s324:计算低于读取延迟阈值的时间段占整个运行周期的比例得到读取稳定指数,计算公式为:读取稳定指数=低于预期的时间段数量/总时间段数。
12.在一个优选的实施方式中,步骤s500具体包括以下步骤:在获取优良信号后,获取数据备份间隔时间,将数据恢复效果系数、数据恢复效果阈值和数据库备份时间间隔进行综合得到补偿备份间隔时间,计算公式为:,式中,cc为补偿间隔时间,补偿间隔时间用于替换数据备份间隔时间,为数据备份间隔时间,rer、h1分别为数据恢复效果系数、数据恢复效果阈值。
13.一种生物样本信息数据库的构建装置,包括第一采集单元、第一分析单元、第二分析单元、第二判断单元、综合调节单元;第一采集单元用于采集数据库的故障参数和恢复参数,生成故障参数和恢复参数信号发送至第一分析单元;第一分析单元用于将故障参数和恢复参数经过归一化得到数据恢复效果系数,将数据恢复效果系数和数据恢复效果阈值进行比较,若数据恢复效果系数小于数据恢复效果阈值,生成可行信号;若数据恢复效果系数大于等于数据恢复效果阈值,生成难行信号,生成难行信号发送至第二分析单元;第二分析单元用于在获得难行信号后,采集数据库的资源参数和性能参数,将资源参数和性能参数经过归一化得到可操作系数,生成可操作系数发送至第二判断单元;第二判断单元用于将可操作系数和可操作阈值进行比较,若可操作系数大于等于可操作阈值,生成优良信号;若可操作系数小于可操作阈值,生成干预信号,生成优良信号发送至综合调节单元;综合调节单元用于在获取优良信号后,获取数据备份间隔时间,将数据恢复效果系数、数据恢复效果阈值和数据库备份时间间隔进行综合得到补偿备份间隔时间,补偿备份间隔时间用于替换数据备份间隔时间。
14.本发明一种生物样本信息数据库的构建方法和装置的技术效果和优点:1.通过采集数据库的故障致命指数和数据恢复缺失动态度,计算得到数据恢复效
果系数,以评估数据库在进行数据恢复时的效果。这样可以分析生物样本数据在数据库中的安全性,警示及时采取部署和安全措施。将数据恢复效果系数与数据恢复效果阈值进行比较,当数据恢复效果系数大于等于数据恢复效果阈值时,生成可行信号,表示数据库的数据恢复效果良好。反之,当数据恢复效果系数小于数据恢复效果阈值时,生成难行信号,表示数据库的数据恢复效果不佳。通过这样明确的判断结果和警示信号,可以提醒相关人员注意数据恢复的状态,警示并采取相应措施解决问题,确保数据库中生物样本数据的安全性和完整性;2.发明在获得难行信号后,通过采集数据库的低负载均衡指数和读取稳定指数,得到可操作系数,用于评估数据库的使用性能情况。将可操作系数与可操作阈值进行比较。若可操作系数大于等于可操作阈值,表示数据库性能较差,无法胜任频繁的数据备份任务,生成干预信号。若可操作系数小于可操作阈值,表示数据库性能良好,能够应对合理的数据备份间隔时间调节操作,生成优良信号;对于生成优良信号的情况,通过获取原始的数据备份间隔时间,并结合数据恢复效果系数和数据恢复效果阈值,对其进行纠偏。这样可以在数据库性能能够胜任频繁备份数据的情况下,主动调节数据库备份时间间隔的大小,以补偿数据恢复效果较差的情况,从而保障生物样本数据的存储安全性。
附图说明
15.图1为本发明一种生物样本信息数据库的构建方法的流程示意图;图2为本发明一种生物样本信息数据库的构建装置的结构示意图。
16.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
具体实施例
17.图1给出了本发明一种生物样本信息数据库的构建方法,其包括如下步骤:步骤s100:采集数据库的故障参数和恢复参数;步骤s200:将故障参数和恢复参数经过归一化得到数据恢复效果系数,将数据恢复效果系数和数据恢复效果阈值进行比较,若数据恢复效果系数小于数据恢复效果阈值,生成可行信号;若数据恢复效果系数大于等于数据恢复效果阈值,生成难行信号;步骤s300:在获得难行信号后,采集数据库的资源参数和性能参数,将资源参数和性能参数经过归一化得到可操作系数;步骤s400:将可操作系数和可操作阈值进行比较,若可操作系数大于等于可操作阈值,生成优良信号;若可操作系数小于可操作阈值,生成干预信号;步骤s500:在获取优良信号后,获取数据备份间隔时间,将数据恢复效果系数、数据恢复效果阈值和数据库备份时间间隔进行综合得到补偿备份间隔时间,补偿备份间隔时间用于替换数据备份间隔时间。
18.在构建数据库过程中,对数据库在遇到故障后的数据恢复能力进行了解是非常有必要的,评估数据库恢复能力可以帮助更好地管理风险。评估数据库数据恢复能力可以确
保在数据恢复过程中能够保持数据的完整性和准确性。通识别和评估数据库数据恢复的薄弱环节和潜在风险,有助于采取相应的措施来降低数据丢失和业务中断的风险。通过定期评估数据恢复能力,可以提前发现问题并采取预防措施,以最大程度地减少潜在的数据损失。
19.步骤s100包括以下步骤:其中,故障参数包括故障致命指数,恢复参数包括数据恢复缺失动态度、性能参数包括数据库性能指数。
20.故障致命指数的获取逻辑为:步骤s101:记录数据库运行总时间,即数据库从启动到目前的累计运行时间;步骤s102:将数据库运行总时间除以故障发生的次数,得到所有故障发生的平均时间间隔;步骤s103:将数据库运行总时间除以致命故障发生的次数,得到致命故障发生的平均时间间隔;致命故障是指导致数据库触发数据恢复的严重故障;步骤s104:将致命故障发生的平均时间间隔除以所有故障发生的平均时间间隔,得到故障致命指数。
21.故障致命指数用于衡量触发数据恢复故障和所有故障之间的相对频率,较大的故障致命指数表示所有故障中致命故障的占比较高,发生频率相对更加频繁,这会导致数据恢复任务加重,数据丢失危险性增加;反之,较小的故障致命指数表示所有故障中致命故障的占比较低,发生频率相对罕见,说明数据库相对稳定,不容易遭受严重的致命故障,从而提高了数据的安全性和可靠性。
22.数据恢复缺失动态度的获取逻辑为:步骤s111:对于每次数据发生数据恢复事件,记录下对应的数据恢复缺失比例,即原始数据和恢复过后数据之间的缺失比例,计算公式为:缺失比例=缺失数据点数量/原始总数据点数量;缺失数据点是指在原始数据和恢复后数据中存在缺失的数据点数量,原始总数据点数量是指原始总共的数据点数量;步骤s112:记录在时间范围t内发生的不同数据恢复事件的数据恢复缺失比例,将不同数据恢复事件的数据恢复缺失比例标定为,i=1、2、3、4、
……
、n,n为正整数,通过的标准差获取数据恢复缺失比例波动率,将的标准差标定为x,计算公式为:,式中,为不同数据恢复事件的数据恢复缺失比例的平均值,x为不同数据恢复事件的数据恢复缺失比例的标准差,通过不同数据恢复事件的数据恢复缺失比例的标准差获得数据恢复缺失动态度。
23.数据恢复缺失动态度反映了数据恢复过程中缺失比例的变化和波动情况。较大的数据恢复缺失动态度表示在不同数据恢复事件中数据恢复缺失比例的波动较大,即缺失比例存在较大的变化。这意味着数据恢复过程存在不稳定性,数据的完整性无法得到有效保
障。相反,较小的数据恢复缺失动态度表示在不同数据恢复事件中数据恢复缺失比例的波动较小,即缺失比例变化较为稳定。这表示数据恢复过程较为稳定,数据的完整性能够得到有效保证。
24.步骤s200包括以下步骤:将故障致命指数和数据恢复缺失动态度经过归一化得到数据恢复效果系数,例如,可以通过以下公式计算得出数据恢复效果系数:,式中,rer为数据恢复效果系数,分别为故障致命指数、数据恢复缺失动态度,分别为故障致命指数、数据恢复缺失动态度的预设比例系数,且均大于0;数据恢复效果系数用于衡量数据库在数据恢复方面的综合表现。它综合考虑了故障致命指数和数据恢复缺失动态度的指标,经过归一化处理得到一个综合评估值;越小的数据恢复效果系数表示数据库的数据恢复能力较强,数据恢复的效果较好。这意味着在数据库发生故障时,恢复过程能够有效地保护和恢复数据,减少数据丢失的风险;相反,越大的数据恢复效果系数表示数据库的数据恢复能力较弱,数据恢复的效果较差。这意味着在数据库发生故障时,恢复过程中存在较大的数据丢失风险,导致数据完整性的损失。
25.将数据恢复效果指数和数据恢复效果阈值进行比较,若数据恢复效果指数大于等于数据恢复效果阈值,表示数据恢复效果不理想,意味着数据库在数据恢复过程中存在数据的丢失、不准确或不完整的情况,缺失比例的波动较大,恢复过程中的故障致命性较高,生成难行信号,发出警示信号;反之,若数据恢复效果指数小于数据恢复效果阈值,表示数据库中的数据恢复效果良好,意味着数据库在数据恢复过程中能够保持数据的完整性和准确性,缺失比例的波动较小,恢复过程中的故障致命性较低,表明数据库的数据恢复工作得到有效执行和管理,生成可行信号。
26.本发明通过采集数据库的故障致命指数和数据恢复缺失动态度,计算得到数据恢复效果系数,以评估数据库在进行数据恢复时的效果。这样可以分析生物样本数据在数据库中的安全性,警示及时采取部署和安全措施。将数据恢复效果系数与数据恢复效果阈值进行比较,当数据恢复效果系数大于等于数据恢复效果阈值时,生成可行信号,表示数据库的数据恢复效果良好。反之,当数据恢复效果系数小于数据恢复效果阈值时,生成难行信号,表示数据库的数据恢复效果不佳。通过这样明确的判断结果和警示信号,可以提醒相关人员注意数据恢复的状态,警示并采取相应措施解决问题,确保数据库中生物样本数据的安全性和完整性。
27.数据备份是保护数据库数据安全的重要手段之一,它可以在数据库发生故障或数据丢失时提供数据恢复的能力。在进行数据备份时,对数据库的性能有一定的要求,以保证备份过程的效率和可靠性,因此在调整数据库的数据备份策略时,需要首先了解评估数据库的性能。
28.步骤s300包括以下步骤:在获得难行信号后,采集数据库的资源参数和性能参数,其中资源参数包括负载空置率,性能参数包括读取稳定指数。
29.低负载均衡指数的获取逻辑为:步骤s311:将整个运行周期划分为多个时间段;
步骤s312:对于每个时间段,计算该时间段内的低负载时间,低负载时间指的是cpu利用率低于利用率阈值的时间;步骤s313:计算每个时间段内低负载时间的比例,计算公式为:低负载时间比例=低负载时间/时间段总时间;步骤s314:将不同时间段的低负载时间比例标记为,j=1、2、3、4、
……
、m,m为正整数,通过的标准差标记为s,计算公式为:,式中,为不同时间段的低负载时间比例的平均值,s为不同时间段的低负载时间比例的标准差,通过不同时间段的低负载时间比例的标准差获得低负载均衡指数。
30.低负载均衡指数用于体现数据库运行低负载时间分散性,越小的低负载均衡指数表示不同时间段内低负载时间比例接近,分布较为均衡。这意味着在整个运行周期内,数据库的低负载时间相对均匀地分布在各个时间段,没有明显的时间段偏好或集中。这种情况下,数据库的负载较为平衡,资源利用较为合理;越大的低负载均衡指数表示不同时间段内低负载时间比例差异较大,分布不均衡。这意味着在整个运行周期内,存在一些时间段的低负载时间比例明显高于其他时间段。这种情况下,数据库的负载不均衡,部分时间段可能存在资源过剩或资源不足的情况,不利于灵活随时进行备份。
31.读取稳定指数的获取逻辑为:步骤s321:将数据库一个运行周期划分为多个时间段,每个时间段具有相同的时间长度;步骤s322:在每个时间段内记录读取延迟的平均值;步骤s323:对于每个时间段,判断该时间段内的读取延迟的平均值是否低于读取延迟阈值,统计低于读取延迟阈值的时间段的数量;步骤s324:计算低于读取延迟阈值的时间段占整个运行周期的比例得到读取稳定指数,计算公式为:读取稳定指数=低于预期的时间段数量/总时间段数。
32.读取稳定指数用于衡量数据库读取稳定的程度,较大的读取稳定指数表示数据库在较大比例的时间段内出现了读取延迟低于预期的情况,反映了数据库读取性能的不稳定性。较小的读取稳定指数表示数据库在较小比例的时间段内出现了读取延迟低于预期的情况,反映了数据库读取性能的相对稳定性。
33.将低负载均衡指数和读取稳定指数经过归一化得到可操作系数;例如,可以通过以下公式得到可操作系数:,式中,oc为可操作系数,分别为低负载均衡指数、读取稳定指数,分别为低负载均衡指数、读取稳定指数的预设比例系数,且均大于0;可操作系数用于体现数据库的可操作性和可管理性,较小的可操作系数表示数据库在低负载均衡和读取稳定性方面表现良好,可有效管理和操作,具备较高的性能和稳定性,这意味着数据库在负载均衡方面能够平衡资源利用,并在读取过程中保持稳定的延迟水平,方便进行随时随地的备份操作;相反,较大的可操作系数表示数据库在低负载均衡和
读取稳定性方面存在问题,可操作性较低,这意味着数据库在负载均衡方面存在不均衡的资源利用或在读取过程中经常出现延迟异常,不利于进行数据备份。
34.步骤s400具体包括以下步骤:将可操作系数和可操作阈值进行比较,若可操作系数小于可操作阈值,表示数据库的负载均衡和读取稳定性达到了预期水平,数据库性能良好,可以正常进行操作和管理,方便进行随时随地的备份操作,生成优良信号;若可操作系数大于等于可操作阈值,表示数据库的负载均衡或读取稳定性存在问题,数据库性能较差,需要进一步优化或调整,生成干预信号,提示需要采取措施来提升数据库的性能和稳定性,不利于进行数据备份。
35.步骤s500具体包括以下步骤:在获取优良信号后,获取数据备份间隔时间,将数据恢复效果系数、数据恢复效果阈值和数据库备份时间间隔进行综合得到补偿备份间隔时间,计算公式为:,式中,cc为补偿间隔时间,补偿间隔时间用于替换数据备份间隔时间,为数据备份间隔时间,rer、h1分别为数据恢复效果系数、数据恢复效果阈值。
36.本发明在获得难行信号后,通过采集数据库的低负载均衡指数和读取稳定指数,得到可操作系数,用于评估数据库的使用性能情况。将可操作系数与可操作阈值进行比较。若可操作系数大于等于可操作阈值,表示数据库性能较差,无法胜任频繁的数据备份任务,生成干预信号。若可操作系数小于可操作阈值,表示数据库性能良好,能够应对合理的数据备份间隔时间调节操作,生成优良信号;对于生成优良信号的情况,通过获取原始的数据备份间隔时间,并结合数据恢复效果系数和数据恢复效果阈值,对其进行纠偏。这样可以在数据库性能能够胜任频繁备份数据的情况下,主动调节数据库备份时间间隔的大小,以补偿数据恢复效果较差的情况,从而保障生物样本数据的存储安全性。
实施例
37.图2给出了本发明一种生物样本信息数据库的构建装置,包括第一采集单元、第一分析单元、第二分析单元、第二判断单元、综合调节单元;第一采集单元用于采集数据库的故障参数和恢复参数,生成故障参数和恢复参数信号发送至第一分析单元;第一分析单元用于将故障参数和恢复参数经过归一化得到数据恢复效果系数,将数据恢复效果系数和数据恢复效果阈值进行比较,若数据恢复效果系数小于数据恢复效果阈值,生成可行信号;若数据恢复效果系数大于等于数据恢复效果阈值,生成难行信号,生成难行信号发送至第二分析单元;第二分析单元用于在获得难行信号后,采集数据库的资源参数和性能参数,将资源参数和性能参数经过归一化得到可操作系数,生成可操作系数发送至第二判断单元;第二判断单元用于将可操作系数和可操作阈值进行比较,若可操作系数大于等于可操作阈值,生成优良信号;若可操作系数小于可操作阈值,生成干预信号,生成优良信号发送至综合调节单元;
综合调节单元用于在获取优良信号后,获取数据备份间隔时间,将数据恢复效果系数、数据恢复效果阈值和数据库备份时间间隔进行综合得到补偿备份间隔时间,补偿备份间隔时间用于替换数据备份间隔时间。
38.上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数以及阈值选取由本领域的技术人员根据实际情况进行设置。
39.上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络,或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,dvd),或者半导体介质。半导体介质可以是固态硬盘。
40.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件,或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
41.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
42.在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其他的形式。
43.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
44.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
45.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计
算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
46.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
47.最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种生物样本信息数据库的构建方法,其特征在于,包括如下步骤:步骤s100:采集数据库的故障参数和恢复参数;步骤s200:将故障参数和恢复参数经过归一化得到数据恢复效果系数,将数据恢复效果系数和数据恢复效果阈值进行比较,若数据恢复效果系数小于数据恢复效果阈值,生成可行信号;若数据恢复效果系数大于等于数据恢复效果阈值,生成难行信号;步骤s300:在获得难行信号后,采集数据库的资源参数和性能参数,将资源参数和性能参数经过归一化得到可操作系数;步骤s400:将可操作系数和可操作阈值进行比较,若可操作系数大于等于可操作阈值,生成优良信号;若可操作系数小于可操作阈值,生成干预信号;步骤s500:在获取优良信号后,获取数据备份间隔时间,将数据恢复效果系数、数据恢复效果阈值和数据库备份时间间隔进行综合计算得到补偿备份间隔时间,补偿备份间隔时间用于替换数据备份间隔时间。2.根据权利要求1所述的一种生物样本信息数据库的构建方法,其特征在于:步骤s100包括以下步骤:其中,故障参数包括故障致命指数,恢复参数包括数据恢复缺失动态度、性能参数包括数据库性能指数;故障致命指数的获取逻辑为:步骤s101:记录数据库运行总时间,即数据库从启动到目前的累计运行时间;步骤s102:将数据库运行总时间除以故障发生的次数,得到所有故障发生的平均时间间隔;步骤s103:将数据库运行总时间除以致命故障发生的次数,得到致命故障发生的平均时间间隔;致命故障是指导致数据库触发数据恢复的严重故障;步骤s104:将致命故障发生的平均时间间隔除以所有故障发生的平均时间间隔,得到故障致命指数。3.根据权利要求2所述的一种生物样本信息数据库的构建方法,其特征在于:数据恢复缺失动态度的获取逻辑为:步骤s111:对于每次数据发生数据恢复事件,记录下对应的数据恢复缺失比例,即原始数据和恢复过后数据之间的缺失比例,计算公式为:缺失比例=缺失数据点数量/原始总数据点数量;步骤s112:记录在时间范围t内发生的不同数据恢复事件的数据恢复缺失比例,将不同数据恢复事件的数据恢复缺失比例标定为,i=1、2、3、4、
……
、n,n为正整数,通过的标准差获取数据恢复缺失比例波动率,将的标准差标定为x,计算公式为:,式中,为不同数据恢复事件的数据恢复缺失比例的平均值,x为不同数据恢复事件的数据恢复缺失比例的标准差,通过不同数据恢复事件的数据恢复缺失比例的标准差获得数据恢复缺失动态度。
4.根据权利要求3所述的一种生物样本信息数据库的构建方法,其特征在于:步骤s300包括以下步骤:在获得难行信号后,采集数据库的资源参数和性能参数,其中资源参数包括负载空置率,性能参数包括读取稳定指数;低负载均衡指数的获取逻辑为:步骤s311:将整个运行周期划分为多个时间段;步骤s312:对于每个时间段,计算该时间段内的低负载时间,低负载时间指的是cpu利用率低于利用率阈值的时间;步骤s313:计算每个时间段内低负载时间的比例,计算公式为:低负载时间比例=低负载时间/时间段总时间;步骤s314:将不同时间段的低负载时间比例标记为,j=1、2、3、4、
……
、m,m为正整数,通过的标准差标记为s,计算公式为:,式中,为不同时间段的低负载时间比例的平均值,s为不同时间段的低负载时间比例的标准差,通过不同时间段的低负载时间比例的标准差获得低负载均衡指数。5.根据权利要求4所述的一种生物样本信息数据库的构建方法,其特征在于:读取稳定指数的获取逻辑为:步骤s321:将数据库一个运行周期划分为多个时间段,每个时间段具有相同的时间长度;步骤s322:在每个时间段内记录读取延迟的平均值;步骤s323:对于每个时间段,判断该时间段内的读取延迟的平均值是否低于读取延迟阈值,统计低于读取延迟阈值的时间段的数量;步骤s324:计算低于读取延迟阈值的时间段占整个运行周期的比例得到读取稳定指数,计算公式为:读取稳定指数=低于预期的时间段数量/总时间段数。6.根据权利要求5所述的一种生物样本信息数据库的构建方法,其特征在于:步骤s500具体包括以下步骤:在获取优良信号后,获取数据备份间隔时间,将数据恢复效果系数、数据恢复效果阈值和数据库备份时间间隔进行综合得到补偿备份间隔时间,计算公式为:,式中,cc为补偿间隔时间,补偿间隔时间用于替换数据备份间隔时间,为数据备份间隔时间,rer、h1分别为数据恢复效果系数、数据恢复效果阈值。7.一种生物样本信息数据库的构建装置,用于实现权利要求1-6任一项所述的构建方法,包括第一采集单元、第一分析单元、第二分析单元、第二判断单元、综合调节单元;第一采集单元用于采集数据库的故障参数和恢复参数,生成故障参数和恢复参数信号发送至第一分析单元;
第一分析单元用于将故障参数和恢复参数经过归一化得到数据恢复效果系数,将数据恢复效果系数和数据恢复效果阈值进行比较,若数据恢复效果系数小于数据恢复效果阈值,生成可行信号;若数据恢复效果系数大于等于数据恢复效果阈值,生成难行信号,生成难行信号发送至第二分析单元;第二分析单元用于在获得难行信号后,采集数据库的资源参数和性能参数,将资源参数和性能参数经过归一化得到可操作系数,生成可操作系数发送至第二判断单元;第二判断单元用于将可操作系数和可操作阈值进行比较,若可操作系数大于等于可操作阈值,生成优良信号;若可操作系数小于可操作阈值,生成干预信号,生成优良信号发送至综合调节单元;综合调节单元用于在获取优良信号后,获取数据备份间隔时间,将数据恢复效果系数、数据恢复效果阈值和数据库备份时间间隔进行综合得到补偿备份间隔时间,补偿备份间隔时间用于替换数据备份间隔时间。
技术总结
本发明公开了一种生物样本信息数据库的构建方法和装置,具体涉及数据库领域,是通过采集数据库的故障参数和恢复参数得到数据恢复效果系数,结合数据恢复效果阈值进行判断,对数据恢复效果进行评估,在判断生成难行信号的情况下采集数据库的资源参数和性能参数得到可操作系数,结合可操作阈值,对数据库的性能进行评估,判断数据库当前的状态,在判断生成优良信号后,获取数据库的数据备份间隔时间,通过数据恢复效果系数和数据恢复效果阈值对数据备份间隔时间进行纠偏,修改数据备份间隔时间的大小对数据恢复效果进行补偿,从而减少生物样本数据丢失的风险。少生物样本数据丢失的风险。少生物样本数据丢失的风险。
技术研发人员:刘志岩 郑青松
受保护的技术使用者:北京星云医学检验实验室有限公司
技术研发日:2023.08.17
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/