业务数据的抽取方法及装置与流程

1.本发明涉及金融科技和信息技术产业技术领域,尤其涉及一种业务数据的抽取方法及装置。
背景技术:
2.目前业务数据的抽取,仍然是由人工主观决定,存在不智能化、标准不清晰不统一、甚至有人为暗箱操作的风险,具体地,以银行的业务数据抽取为例,不同分行的人员规模和业务数据量可能存在比较大的差异,如果不做差异性地使用完全随机抽取,可能造成审核工作量的不均衡,导致工作效率低下,对业务数据的抽取,有些银行可能做了由系统自动生成抽取结果,但没有一定的业务规则,而是采用完全随机的方法,可能会出现采样的业务数据集中在同一个类型的业务产品或者同一个实体用户上的情况,造成采样数据结果不具有代表性,故亟需一种更可靠的业务数据的抽取方法。
技术实现要素:
3.本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
4.为此,本发明的第一个目的在于提出一种业务数据的抽取方法,基于对各个平台级别中的多个业务平台按照预设的业务抽取规则进行抽取,实现目标业务数据的均匀随机覆盖,提高业务数据的可靠性。
5.本发明的第二个目的在于提出一种业务数据的抽取装置。
6.本发明的第三个目的在于提出一种电子设备。
7.本发明的第四个目的在于提出一种存储有计算机指令的非瞬时计算机可读存储介质。
8.本发明的第五个目的在于提出一种计算机程序产品。
9.为达上述目的,本发明第一方面实施例提出了一种业务数据的抽取方法,包括:
10.基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,其中,每个平台级别均包括多个业务平台;
11.针对任一个包括多个业务平台的平台级别,建立所述平台级别中所述多个业务平台之间的检查抽取关系;
12.对任一所述平台级别中的多个业务平台,基于所述检查抽取关系,按照预设的业务抽取规则对各所述业务平台进行业务数据抽取,以得到目标业务数据,其中,从各所述业务平台抽取出的目标业务数据用于具有所述检查抽取关系的业务平台进行检测。
13.为达上述目的,本发明第二方面实施例提出了一种业务数据的抽取装置,包括:
14.分级模块,用于基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,其中,每个平台级别均包括多个业务平台;
15.建立模块,用于针对任一个包括多个业务平台的平台级别,建立所述平台级别中所述多个业务平台之间的检查抽取关系;
16.抽取模块,用于对任一所述平台级别中的多个业务平台,基于所述检查抽取关系,按照预设的业务抽取规则对各所述业务平台进行业务数据抽取,以得到目标业务数据,其中,从各所述业务平台抽取出的目标业务数据用于具有所述检查抽取关系的业务平台进行检测。
17.为达上述目的,本发明第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
18.为了实现上述目的,本发明第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使所述计算机执行第一方面所述的方法。
19.为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,计算机程序在被处理器执行时实现第一方面所述的方法。
20.本发明实施例提供的业务数据配置方法、装置、电子设备和存储介质,基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,每个平台级别均包括多个业务平台,针对任一个包括多个业务平台的平台级别,建立平台级别中多个业务平台之间的检查抽取关系,对任一平台级别,基于检查抽取关系,按照预设的业务抽取规则对各业务平台进行业务数据抽取,以得到目标业务数据,其中,从各业务平台抽取出的目标业务数据用于具有检查抽取关系的业务平台进行检测,由此,基于对各个平台级别中的多个业务平台按照预设的业务抽取规则进行抽取,实现目标业务数据的均匀随机覆盖,提高业务数据的可靠性。
21.本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
22.本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
23.图1为本发明实施例所提供的一种业务数据的抽取方法的流程示意图;
24.图2为本发明实施例所提供的一种检查抽取关系建立的流程示意图;
25.图3为本发明实施例所提供的一种基于业务抽取规则生成目标业务数据的流程示意图;
26.图4为本发明实施例所提供的另一种业务数据的抽取方法的流程示意图;
27.图5为本发明实施例所提供的一种业务平台的分级示例图;
28.图6为本发明实施例提供的一种业务数据的抽取装置的结构示意图。
具体实施方式
29.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
30.其中,需要说明的是,本发明技术方案中对数据的获取、存储、使用、处理等均符合
国家法律法规的相关规定。
31.下面参考附图描述本发明实施例的业务数据的抽取方法和装置。
32.图1为本发明实施例所提供的一种业务数据的抽取方法的流程示意图。
33.如图1所示,该方法包括以下步骤:
34.步骤101,基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,其中,每个平台级别均包括多个业务平台。
35.可选地,业务平台可以是银行,但不仅限于此,该实施例对此不做具体限定。
36.可选地,在各业务平台为各个银行的情况下,各业务平台在预设时间区间中产生的业务数据可以是公信贷领域的数据,具体地可以是实体用户购买的金融产品数据,但不仅限于此。
37.其中,预设时间区间可以是任一时间段,具体地,可以以一季度为一个时间区间,但不仅限于此,该实施例对此不做具体限定。
38.在一些实施例中,为保证各个平台级别的均衡性,可以基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,实现各个业务平台的均衡分级,便于后期使用。
39.步骤102,针对任一个包括多个业务平台的平台级别,建立平台级别中多个业务平台之间的检查抽取关系。
40.在一些实施例中,检查抽取关系可以采用以下方式确定:针对任一个包括多个业务平台的平台级别,对多个业务平台进行排序,以得到平台序列;确定第一业务平台与相邻的第二业务平台之间具有检查抽取关系,其中,第一业务平台作为被抽取业务平台,第二业务平台作为第一业务平台对应的抽取业务平台;确定平台序列中最后一个业务平台与首个业务平台之间具有检查抽取关系,其中,最后一个业务平台作为被抽取平台,首个业务平台作为最后一个业务平台对应的抽取业务平台。
41.具体地,可以以业务平台为银行为例,如图2所示,基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别(平台级别为4个为例),并选取任一平台级别中分行分级的二维数组level[4][],[]存的是分行的行号,对分行分级二维数组level[4][]进行数据调整,新建adjustlevel[][],遍历level数组(level数组从第一平台级别序号i=0开始,adjustlevel数组序号j=0开始),具体地,在i《4的情况下,判断level[i]平台级别中的分行个数size()《=1是否成立,若不成立则将level[i]平台级别的数据放到adjustlevel[j++]平台级别中,若成立则判断是否为最后一个平台级别(i==3),在不是最后一个平台级别的情况下,将level[i]平台级别的数据放到adjustlevel[j]平台级别中,并判断adjustlevel[j]的分行个数是否大于1(大于1将level[i]平台级别的数据放到adjustlevel[j++]平台级别中,小于1则重复上述步骤继续判断level[i]平台级别中的分行个数),在是最后一个平台级别的情况下,将level[i]平台级别的数据放到adjustlevel[j-1]平台级别中,由此,如果非最后一个平台级别,且出现平台等级内仅有1家分行的情况,将其归入下一平台级别分行进行匹配(如:第一平台级别归入第二平台级别,依次类推);如果最后一平台级别且仅有1家分行,则将其向上归到上一平台级别进行匹配;最后得到调整后的二维数组adjustlevel[][],调整后的平台级别小于等于4,且每一平台级别分行个数一定大于1;再遍历调整后的二维数组adjustlevel[][](并遍历平台级
别序号从k=0开始),判断k《adjustlevel第一平台等级大小是否成立,若成立则将第k平台级别中的分行行号序列,进行shuffle洗牌排序,比如,得到行c,行d,行b,行a这样的次序,建立匹配关系(序列位置前面的分行作为被检查行,相邻的下一位置的分行作为检查行,例如,cdba,箭头方向的是被检查行),最后一个位置的分行被第一个(首个)位置的分行检查,例如,ac,箭头方向的是被检查行)。
[0042]
步骤103,对任一平台级别中的多个业务平台,基于检查抽取关系,按照预设的业务抽取规则对各业务平台进行业务数据抽取,以得到目标业务数据,其中,从各业务平台抽取出的目标业务数据用于具有检查抽取关系的业务平台进行检测。
[0043]
在一些实施例中,预设的业务抽取规则的一种确定方式可以为:获取各业务平台在预设时间区间中产生的业务数据的总业务数据量、以及预设的业务数据抽取比率、以及业务数据的业务抽取类型,基于总业务数据量、业务数据抽取比率、以及业务抽取类型,确定业务抽取规则。
[0044]
在另一些实施例中,基于预设的业务抽取规则抽取出目标业务数据的一种实施方式可以如图3所示,具体地,可以以业务平台为银行为例,首选设置业务抽取规则,包括:通过银行的实体用户需求,设置对应业务数据的时间区间,业务数据抽取比率,总抽取笔数上限,业务抽取类型(大类或者具体的可售业务产品,其中,每个业务抽取类型也可以指定业务产品的抽取比例和抽取笔数上限),进而确定出业务抽取规则,并查询获得业务时间区间内的总业务数据量,再根据业务抽取规则,计算出总业务数据量抽取笔数的最大值=min(总抽取笔数上限,总业务数据量*业务数据抽取比率),以及各个业务产品的抽取笔数最大值=min(各业务产品的抽取笔数上限,各业务产品的总业务数据量*各业务产品的抽取比率),对抽取规则进行校验,以确保各个业务产品的抽取笔数总和《=业务数据的抽取笔数,如果不满足,需要调整抽取规则里的业务数据抽取比率和或总抽取笔数上限,直至满足校验条件;针对每个业务产品计算月平均抽取笔数(月平均抽取笔数=抽取笔数/业务时间区间的月份跨度),同时初始化一个实体用户编号哈希表clienthashmap,用于存储实体用户编号被抽取中的次数,由此,遍历每个业务产品,判断遍历序号《业务产品个数是否成立,若不成立,则退出遍历循环,返回目标业务数据,则若成立则通过实体用户编号唯一性查询获取到每个月内满足条件的抽取数据samplelistbymonth(抽取数据信息元组《实体用户编号,业务产品编号》)的情况下,如果抽取数据的数量小于月平均抽取笔数,遍历抽取数据列表samplelistbymonth,并判断每个抽取数据的实体用户编号在哈希表clienthahsmap里记录的已被选中的次数,ii.如果等于0,则对应的哈希表插入一条值为1的元组(实体用户编号,1),并将此抽取数据加入到目标列表targetlist里,如果是大于0且小于2,则将对应的哈希表里的值+1,并将此抽取数据加入到目标列表targetlist里,此外,若抽取数据的数量大于月平均抽取笔数,则随机抽取对应数量的业务数据(抽取数据的个数=《随机抽取的次数《=月平均抽取笔数)的情况下,判断选中的业务数据的实体用户编号在哈希表clienthashmap里记录的选中次数,如果等于0,则对应的哈希表插入一条值为1的元组(实体用户编号,1),并将此抽取数据加入到目标列表targetlist里,如果是大于0且小于2,则将对应的哈希表里的值+1,并将此抽取数据加入到目标列表targetlist里,此时目标列表targetlist里的数据即为目标业务数据。由此,根据设定的抽取规则,进行待查业务数据的随机抽取,确保在时间上,每个月抽取的业务数据量尽可能地均等,而不是集中在某几个
月,且抽取中的实体用户也尽可能的随机均匀分布,设定每个实体用户被抽取笔数不超过2条,以实现被抽查到的业务产品尽可能均匀到覆盖到。
[0045]
本发明实施例的业务数据的抽取方法,基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,每个平台级别均包括多个业务平台,针对任一个包括多个业务平台的平台级别,建立平台级别中多个业务平台之间的检查抽取关系,对任一平台级别,基于检查抽取关系,按照预设的业务抽取规则对各业务平台进行业务数据抽取,以得到目标业务数据,其中,从各业务平台抽取出的目标业务数据用于具有检查抽取关系的业务平台进行检测,由此,基于对各个平台级别中的多个业务平台按照预设的业务抽取规则进行抽取,实现目标业务数据的均匀随机覆盖,提高业务数据的可靠性。
[0046]
综上,为更好地查看业务数据的抽取,可以将检查抽取关系以及目标业务数据展示在业务平台对应的业务终端上,并允许对个别目标业务数据进行微调,基于完全随机方式重新抽取替换,方便后续对目标业务数据的维护和使用。
[0047]
为了清楚说明上一实施例,本实施例还提供了一种业务数据的抽取方法,图4为本发明实施例所提供的另一种业务数据的抽取方法的流程示意图。
[0048]
如图4所示,该方法可以包括以下步骤:
[0049]
步骤401,根据各业务平台在预设时间区间中产生的业务数据,确定各业务平台的平均业务量。
[0050]
在一些实施例中,在业务平台为银行的情况下,根据各业务平台在预设时间区间中产生的业务数据,确定各业务平台的平均业务量的一种计算方式可以为,平均业务量=预设时间区间内的业务量/分行业务人员数量。
[0051]
可以理解的是,为更好地理解本技术,还可以用各分行的人均业务量来表述该平均业务量。
[0052]
步骤402,基于平均业务量对产生业务数据的业务平台进行分级,以得到多个候选平台级别。
[0053]
在一些实施例中,在业务平台为银行的情况下,可以根据各个分行的平均业务量对业务平台(银行)进行分级,以得到各个银行的平台等级,如图5所示,具体地,可以将平均业务量》=800作为第一级业务平台(l1),500《平均业务量《800作为第二级业务平台(l2),200《平均业务量《=500作为第三级业务平台(l3),平均业务量《=200作为第四级业务平台(l4)。
[0054]
步骤403,在多个候选平台级别中存在仅包括一个业务平台的目标候选平台级别的情况下,则根据合并规则,将目标候选业务平台所包含的业务平台合并到其他候选平台级别,以得到合并后的多个平台级别。
[0055]
在一些实施例中,合并规则包括:若目标候选平台级别不是多个平台级别中的最后一级,则将目标候选平台级别下的业务平台合并到下一级的平台级别中;若目标候选平台级别是多个平台级别中的最后一级,则将目标候选平台级别下的业务平台合并到上一级的平台级别中。
[0056]
步骤404,针对任一个包括多个业务平台的平台级别,建立平台级别中多个业务平台之间的检查抽取关系。
[0057]
步骤405,对任一平台级别中的多个业务平台,基于检查抽取关系,按照预设的业
务抽取规则对各业务平台进行业务数据抽取,以得到目标业务数据,其中,从各业务平台抽取出的目标业务数据用于具有检查抽取关系的业务平台进行检测。
[0058]
其中,需要说明的是,关于步骤404至步骤405的具体实现方式,可参见上述实施例中的相关描述。
[0059]
本发明实施例的业务数据的抽取方法,根据各业务平台在预设时间区间中产生的业务数据,确定各业务平台的平均业务量,基于平均业务量对产生业务数据的业务平台进行分级,以得到多个候选平台级别,在多个候选平台级别中存在仅包括一个业务平台的目标候选平台级别的情况下,则根据合并规则,将目标候选业务平台所包含的业务平台合并到其他候选平台级别,以得到合并后的多个平台级别,针对任一个包括多个业务平台的平台级别,建立平台级别中多个业务平台之间的检查抽取关系,对任一平台级别,基于检查抽取关系,按照预设的业务抽取规则对各业务平台进行业务数据抽取,以得到目标业务数据,其中,从各业务平台抽取出的目标业务数据用于具有检查抽取关系的业务平台进行检测,由此,基于对各个平台级别中的多个业务平台按照预设的业务抽取规则进行抽取,保障了目标业务数据的均衡性,确保抽取的目标业务数据的代表性。
[0060]
为了实现上述实施例,本发明还提出一种业务数据的抽取装置。
[0061]
图6为本发明实施例提供的一种业务数据的抽取装置的结构示意图。
[0062]
如图6所示,该业务数据的抽取装置60包括:分级模块61,建立模块62,抽取模块63。
[0063]
分级模块61,用于基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,其中,每个平台级别均包括多个业务平台;
[0064]
建立模块62,用于针对任一个包括多个业务平台的平台级别,建立所述平台级别中所述多个业务平台之间的检查抽取关系;
[0065]
抽取模块63,用于对任一所述平台级别中的多个业务平台,基于所述检查抽取关系,按照预设的业务抽取规则对各所述业务平台进行业务数据抽取,以得到目标业务数据,其中,从各所述业务平台抽取出的目标业务数据用于具有所述检查抽取关系的业务平台进行检测。
[0066]
进一步地,在本发明实施例的一种可能的实现方式中,所述分级模块61,具体用于:
[0067]
根据各业务平台在预设时间区间中产生的业务数据,确定各所述业务平台的平均业务量;
[0068]
基于所述平均业务量对产生所述业务数据的业务平台进行分级,以得到多个候选平台级别;
[0069]
在所述多个候选平台级别中存在仅包括一个业务平台的目标候选平台级别的情况下,则根据合并规则,将所述目标候选业务平台所包含的业务平台合并到其他候选平台级别,以得到合并后的多个平台级别。
[0070]
进一步地,在本发明实施例的一种可能的实现方式中,所述合并规则包括:
[0071]
若所述目标候选平台级别不是所述多个平台级别中的最后一级,则将所述目标候选平台级别下的业务平台合并到下一级的平台级别中;
[0072]
若所述目标候选平台级别是所述多个平台级别中的最后一级,则将所述目标候选
平台级别下的业务平台合并到上一级的平台级别中。
[0073]
进一步地,在本发明实施例的一种可能的实现方式中,所述检查抽取关系采用以下方式确定:
[0074]
针对任一个包括多个业务平台的平台级别,对多个业务平台进行排序,以得到平台序列;
[0075]
确定所述第一业务平台与相邻的第二业务平台之间具有检查抽取关系,其中,所述第一业务平台作为被抽取业务平台,所述第二业务平台作为所述第一业务平台对应的抽取业务平台;
[0076]
确定所述平台序列中最后一个业务平台与首个业务平台之间具有所述检查抽取关系,其中,所述最后一个业务平台作为被抽取平台,所述首个业务平台作为所述最后一个业务平台对应的抽取业务平台。
[0077]
进一步地,在本发明实施例的一种可能的实现方式中,所述业务抽取规则包括:
[0078]
获取各业务平台在预设时间区间中产生的业务数据的总业务数据量、以及预设的业务数据抽取比率、以及业务数据的业务抽取类型;
[0079]
基于所述总业务数据量、所述业务数据抽取比率、以及所述业务抽取类型,确定所述业务抽取规则。
[0080]
基于上述实施例,本发明实施例还提供了一种业务数据的抽取装置的可能的实现方式,在上一实施例的基础上,所述装置还包括:
[0081]
展示模块,用于将所述检查抽取关系以及所述目标业务数据展示在所述业务平台对应的业务终端上。
[0082]
本发明实施例的业务数据的抽取装置,基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,每个平台级别均包括多个业务平台,针对任一个包括多个业务平台的平台级别,建立平台级别中多个业务平台之间的检查抽取关系,对任一平台级别,基于检查抽取关系,按照预设的业务抽取规则对各业务平台进行业务数据抽取,以得到目标业务数据,其中,从各业务平台抽取出的目标业务数据用于具有检查抽取关系的业务平台进行检测,由此,基于对各个平台级别中的多个业务平台按照预设的业务抽取规则进行抽取,实现目标业务数据的均匀随机覆盖,提高业务数据的可靠性。为了实现上述实施例,本发明还提出一种电子设备,包括:
[0083]
至少一个处理器;以及
[0084]
与所述至少一个处理器通信连接的存储器;其中,
[0085]
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述的方法。
[0086]
为了实现上述实施例,本发明还提出一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使所述计算机执行前述的方法。
[0087]
为了实现上述实施例,本发明还提出一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据前述的方法。
[0088]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不
必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0089]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0090]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0091]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0092]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0093]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0094]
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形似实现,也可以采用软件功能模块的形似实现。所述集成的模块如果以软件功能模块的形似实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0095]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
技术特征:
1.一种业务数据的抽取方法,其特征在于,所述方法包括:基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,其中,每个平台级别均包括多个业务平台;针对任一个包括多个业务平台的平台级别,建立所述平台级别中所述多个业务平台之间的检查抽取关系;对任一所述平台级别中的多个业务平台,基于所述检查抽取关系,按照预设的业务抽取规则对各所述业务平台进行业务数据抽取,以得到目标业务数据,其中,从各所述业务平台抽取出的目标业务数据用于具有所述检查抽取关系的业务平台进行检测。2.根据权利要求1所述的方法,其特征在于,所述基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,其中,每个平台级别均包括多个业务平台,包括:根据各业务平台在预设时间区间中产生的业务数据,确定各所述业务平台的平均业务量;基于所述平均业务量对产生所述业务数据的业务平台进行分级,以得到多个候选平台级别;在所述多个候选平台级别中存在仅包括一个业务平台的目标候选平台级别的情况下,则根据合并规则,将所述目标候选业务平台所包含的业务平台合并到其他候选平台级别,以得到合并后的多个平台级别。3.根据权利要求2所述的方法,所述合并规则包括:若所述目标候选平台级别不是所述多个平台级别中的最后一级,则将所述目标候选平台级别下的业务平台合并到下一级的平台级别中;若所述目标候选平台级别是所述多个平台级别中的最后一级,则将所述目标候选平台级别下的业务平台合并到上一级的平台级别中。4.根据权利要求1所述的方法,其特征在于,所述检查抽取关系采用以下方式确定:针对任一个包括多个业务平台的平台级别,对多个业务平台进行排序,以得到平台序列;确定所述第一业务平台与相邻的第二业务平台之间具有检查抽取关系,其中,所述第一业务平台作为被抽取业务平台,所述第二业务平台作为所述第一业务平台对应的抽取业务平台;确定所述平台序列中最后一个业务平台与首个业务平台之间具有所述检查抽取关系,其中,所述最后一个业务平台作为被抽取平台,所述首个业务平台作为所述最后一个业务平台对应的抽取业务平台。5.根据权利要求1所述的方法,其特征在于,所述业务抽取规则包括:获取各业务平台在预设时间区间中产生的业务数据的总业务数据量、以及预设的业务数据抽取比率、以及业务数据的业务抽取类型;基于所述总业务数据量、所述业务数据抽取比率、以及所述业务抽取类型,确定所述业务抽取规则。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述检查抽取关系以及所述目标业务数据展示在所述业务平台对应的业务终端上。
7.一种业务数据的抽取装置,其特征在于,所述装置包括:分级模块,用于基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,其中,每个平台级别均包括多个业务平台;建立模块,用于针对任一个包括多个业务平台的平台级别,建立所述平台级别中所述多个业务平台之间的检查抽取关系;抽取模块,用于对任一所述平台级别中的多个业务平台,基于所述检查抽取关系,按照预设的业务抽取规则对各所述业务平台进行业务数据抽取,以得到目标业务数据,其中,从各所述业务平台抽取出的目标业务数据用于具有所述检查抽取关系的业务平台进行检测。8.根据权利要求7所述的装置,其特征在于,所述分级模块,具体用于:根据各业务平台在预设时间区间中产生的业务数据,确定各所述业务平台的平均业务量;基于所述平均业务量对产生所述业务数据的业务平台进行分级,以得到多个候选平台级别;在所述多个候选平台级别中存在仅包括一个业务平台的目标候选平台级别的情况下,则根据合并规则,将所述目标候选业务平台所包含的业务平台合并到其他候选平台级别,以得到合并后的多个平台级别。9.根据权利要求8所述的装置,所述合并规则包括:若所述目标候选平台级别不是所述多个平台级别中的最后一级,则将所述目标候选平台级别下的业务平台合并到下一级的平台级别中;若所述目标候选平台级别是所述多个平台级别中的最后一级,则将所述目标候选平台级别下的业务平台合并到上一级的平台级别中。10.根据权利要求7所述的装置,其特征在于,所述检查抽取关系采用以下方式确定:针对任一个包括多个业务平台的平台级别,对多个业务平台进行排序,以得到平台序列;确定所述第一业务平台与相邻的第二业务平台之间具有检查抽取关系,其中,所述第一业务平台作为被抽取业务平台,所述第二业务平台作为所述第一业务平台对应的抽取业务平台;确定所述平台序列中最后一个业务平台与首个业务平台之间具有所述检查抽取关系,其中,所述最后一个业务平台作为被抽取平台,所述首个业务平台作为所述最后一个业务平台对应的抽取业务平台。11.根据权利要求7所述的装置,其特征在于,所述业务抽取规则包括:获取各业务平台在预设时间区间中产生的业务数据的总业务数据量、以及预设的业务数据抽取比率、以及业务数据的业务抽取类型;基于所述总业务数据量、所述业务数据抽取比率、以及所述业务抽取类型,确定所述业务抽取规则。12.根据权利要求7所述的装置,其特征在于,所述装置还包括:展示模块,用于将所述检查抽取关系以及所述目标业务数据展示在所述业务平台对应的业务终端上。13.一种电子设备,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。14.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。15.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。
技术总结
本发明提出一种业务数据的抽取方法及装置,涉及金融科技和信息技术产业技术领域,方法包括:基于各业务平台在预设时间区间中产生的业务数据的平均业务量,分级得到多个平台级别,每个平台级别均包括多个业务平台,针对任一个包括多个业务平台的平台级别,建立平台级别中多个业务平台之间的检查抽取关系,对任一平台级别,基于检查抽取关系,按照预设的业务抽取规则对各业务平台进行业务数据抽取,以得到目标业务数据,其中,从各业务平台抽取出的目标业务数据用于具有检查抽取关系的业务平台进行检测,由此,基于对各个平台级别中的多个业务平台按照预设的业务抽取规则进行抽取,实现目标业务数据的均匀随机覆盖,提高业务数据的可靠性。据的可靠性。据的可靠性。
技术研发人员:蔡莉莉 仇苇茎 吕少熊 张敦阳
受保护的技术使用者:建信金融科技有限责任公司
技术研发日:2023.04.21
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/