一种基于不完善异构关系网络图的风险预测方法及装置与流程

1.本说明书涉及风险预警以及神经网络技术领域,尤其涉及一种基于不完善异构关系网络图的风险预测方法及装置。
背景技术:
2.风险预警对于预防未来某些业务对象出现风险是极为重要的,准确的风险预警能够避免,或者降低未来出现的风险造成的损失。
3.当然,对一个业务对象进行风险预警的方式,可以是通过将该业务对象的特征数据输入到有监督学习模型中来预测其出现风险的程度。但是,通过有监督学习模型预测的方式,训练模型时往往训练样本会分布不均,正样本(存在风险的样本)很少,负样本偏多,从而可能会预测的不准确。并且,业务对象的特征数据可以是通过网络图相互关联影响的,但是现有的网络图可能会出现边权重缺失、边权重不准确的问题。
4.因此,如何提高风险预测的准确性,则是亟待解决的问题。
技术实现要素:
5.本说明书提供一种基于不完善异构关系网络图的风险预测方法,以部分地解决现有技术存在的上述问题。
6.本说明书采用下述技术方案:本说明书提供了一种基于不完善异构关系网络图的风险预测方法,包括:获取目标业务对象及相关业务对象的时间序列数据以及文本相关数据,根据所述时间序列数据以及文本相关数据,确定所述目标业务对象及相关业务对象的初始特征;获取构建出的异构关系网络图,所述异构关系网络图用于表示各种业务对象之间的若干种业务关系;将所述异构关系网络图输入到特征提取网络中,以使所述特征提取网络根据所述初始特征、预设的图结构调整参数以及所述异构关系网络图,确定所述目标业务对象的综合特征;将所述目标业务对象的综合特征输入到风险预测网络中,以使所述风险预测网络根据所述综合特征预测所述目标业务对象的风险程度;根据所述目标业务对象的风险程度,确定针对所述目标业务对象的策略,并根据执行针对所述目标业务对象的策略后得到的业务结果,确定所述策略的奖励;将所述策略和所述综合特征输入到评价网络中,得到评价值,根据所述评价值和所述奖励,对所述特征提取网络、所述风险预测网络以及所述评价网络进行训练,以调整所述图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及训练后的风险预测网络,实时对目标业务对象进行风险预测。
7.可选地,目标业务对象属于所述各种业务对象中预设类型的业务对象,所述预设
类型的业务对象至少包括:上市公司。
8.可选地,所述时间序列数据包括:所述目标业务对象及相关业务对象的基本信息和指标相关信息;所述文本相关数据包括:新闻信息、诉讼数据、公告信息中的至少一种。
9.可选地,所述各种业务对象之间的若干种业务关系包括:股权关系、任职关系、债务关系、供应商关系以及行业分布关系中的至少一种。
10.可选地,所述图结构调整参数中包括每两个节点之间的边对应的图结构调整参数;将所述异构关系网络图输入到特征提取网络中,以使所述特征提取网络根据所述初始特征、预设的图结构调整参数以及所述异构关系网络图,确定所述目标业务对象的综合特征,具体包括:将所述异构关系网络图输入到所述特征提取网络中,以使所述特征提取网络将所述初始特征作为所述目标业务对象及相关业务对象的初始节点特征,并根据所述目标业务对象的邻居节点与所述目标业务对象对应的节点之间边对应的原始权重和图结构调整参数,确定所述目标业务对象的邻居节点与所述目标业务对象对应节点之间的边权重;根据所述初始节点特征、所述目标业务对象的邻居节点、所述目标业务对象的节点与所述目标业务对象的邻居节点之间的边权重,确定所述目标业务对象的综合特征。
11.可选地,图结构调整参数包括权重补全参数以及权重调整参数。
12.可选地,根据所述图结构调整参数,得到调整后的异构关系网络图,具体包括:针对所述异构关系网络图中的每两个节点,根据训练后得到的该两个节点之间边对应的图结构调整参数,更新所述异构关系网络图中该两个节点之间的边权重,以得到所述调整后的异构关系网络图。
13.可选地,所述目标业务对象为若干个目标业务对象;根据所述目标业务对象的风险程度,确定针对所述目标业务对象的策略,并根据执行针对所述目标业务对象的策略后得到的业务结果,确定所述策略的奖励,具体包括:从所述若干个目标业务对象中选取出风险程度排在预设排位前的业务对象,作为选取出的目标业务对象;确定所述选取出的目标业务对象的组合在预设天数后的资源增益率;根据所述资源增益率,确定所述策略的奖励,其中,所述资源增益率越高,所述策略的奖励越高。
14.本说明书提供一种基于不完善异构关系网络图的风险预测装置,包括:第一获取模块,用于获取目标业务对象及相关业务对象的时间序列数据以及文本相关数据,根据所述时间序列数据以及文本相关数据,确定所述目标业务对象及相关业务对象的初始特征;第二获取模块,用于获取构建出的异构关系网络图,所述异构关系网络图用于表示各种业务对象之间的若干种业务关系;特征提取模块,用于将所述异构关系网络图输入到特征提取网络中,以使所述特征提取网络根据所述初始特征、预设的图结构调整参数以及所述异构关系网络图,确定所述目标业务对象的综合特征;预测模块,用于将所述目标业务对象的综合特征输入到风险预测网络中,以使所
述风险预测网络根据所述综合特征预测所述目标业务对象的风险程度;奖励确定模块,用于根据所述目标业务对象的风险程度,确定针对所述目标业务对象的策略,并根据执行针对所述目标业务对象的策略后得到的业务结果,确定所述策略的奖励;训练模块,用于将所述策略和所述综合特征输入到评价网络中,得到评价值,根据所述评价值和所述奖励,对所述特征提取网络、所述风险预测网络以及所述评价网络进行训练,以调整所述图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及训练后的风险预测网络,实时对目标业务对象进行风险预测。
15.可选地,目标业务对象属于所述各种业务对象中预设类型的业务对象,所述预设类型的业务对象至少包括:上市公司。
16.可选地,所述时间序列数据包括:所述目标业务对象及相关业务对象的基本信息和指标相关信息;所述文本相关数据包括:新闻信息、诉讼数据、公告信息中的至少一种。
17.可选地,所述各种业务对象之间的若干种业务关系包括:股权关系、任职关系、债务关系、供应商关系以及行业分布关系中的至少一种。
18.可选地,所述图结构调整参数中包括每两个节点之间的边对应的图结构调整参数;所述特征提取模块具体用于,用于将所述异构关系网络图输入到所述特征提取网络中,以使所述特征提取网络将所述初始特征作为所述目标业务对象及相关业务对象的初始节点特征,并根据所述目标业务对象的邻居节点与所述目标业务对象对应的节点之间边对应的原始权重和图结构调整参数,确定所述目标业务对象的邻居节点与所述目标业务对象对应节点之间的边权重;根据所述初始节点特征、所述目标业务对象的邻居节点、所述目标业务对象的节点与所述目标业务对象的邻居节点之间的边权重,确定所述目标业务对象的综合特征。
19.本说明书采用的上述至少一个技术方案能够达到以下有益效果:从上述基于不完善异构关系网络图的风险预测方法中可以看出,可以获取目标业务对象及相关业务对象的时间序列数据以及文本相关数据,根据该时间序列数据以及文本相关数据,确定该目标业务对象及相关业务对象的初始特征,而后,获取构建出的异构关系网络图,异构关系网络图用于表示各种业务对象之间的若干种业务关系,将该异构关系网络图输入到特征提取网络中,以使特征提取网络根据初始特征、预设的图结构调整参数以及异构关系网络图,确定该目标业务对象的综合特征。将该目标业务对象的综合特征输入到风险预测网络中,以使风险预测网络根据综合特征预测目标业务对象的风险程度。最后,根据目标业务对象的风险程度,确定针对目标业务对象的策略,并根据执行针对目标业务对象的策略后得到的业务结果,确定该策略的奖励,进而,将该策略和综合特征输入到评价网络中,得到评价值,根据评价值和奖励,对特征提取网络、风险预测网络以及评价网络进行训练,以调整图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及训练后的风险预测网络,实时对目标业务对象进行风险预测。
20.从上述内容中可以看出:本方法可以通过训练过程中,调整图结构调整参数,从而
优化原始的异构关系网络图,从而对异构关系网络图进行缺失边权重的补全或者进行边权重的优化,并且,在训练特征提取网络、风险预测网络和评价网络时,不是有监督训练的方式,从而避免了样本分布极为不均导致训练出的模型不准确的问题。
附图说明
21.此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:图1为本说明书提供的一种基于不完善异构关系网络图的风险预测方法的流程示意图;图2为本说明书提供的一种各个网络之间关系的示意图;图3为本说明书提供的一种风险预警系统的结构示意图;图4为本说明书提供的一种基于不完善异构关系网络图的风险预测装置的示意图;图5为本说明书提供的对应于图1的电子设备的结构示意图。
具体实施方式
22.为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
23.以下结合附图,详细说明本说明书各实施例提供的技术方案。
24.图1为本说明书提供的一种基于不完善异构关系网络图的风险预测方法的流程示意图,具体包括以下步骤:s100:获取目标业务对象及相关业务对象的时间序列数据以及文本相关数据,根据所述时间序列数据以及文本相关数据,确定所述目标业务对象及相关业务对象的初始特征。
25.在本说明书中,可以对预设类型的业务对象进行风险预警,以防止预设类型的业务对象突然出现风险,导致与出现风险的预设类型的业务对象相关联的业务出现问题。
26.基于此,服务器可以确定目标业务对象及相关业务对象的时间序列数据以及文本相关数据,并根据该时间序列数据以及文本相关数据,确定该目标业务对象及相关业务对象的初始特征。
27.这里提到的目标业务对象可以是指预设类型的业务对象,具体可以是指上市公司,也就是说,本说明书中的风险预测、风险预警的对象可以是上市公司。当上市公司突然出现股价暴跌的情况时,将影响与其相关的众多业务以及人员。因此,可以对上市公司是否会突然出现股价暴跌的风险进行预测,从而对这种上市公司进行预警,以使有关部门可以对这样的上市公司提前采取措施,以进行风险控制。相关业务对象可以是与上市公司相关的职工、产品、行业等。
28.上述提到的时间序列数据可以包括目标业务对象及相关业务对象的基本信息和
指标相关信息,文本相关数据包括:新闻信息、诉讼数据、公告信息中的至少一种。
29.针对每类业务对象,以上市公司为例,相关的特征数据包括时间序列数据和文本相关数据。可以获取以天为单位的时间序列数据,包括不限于基本信息、市场指标、基本面指标等,记为,其中为上市公司数量;为时间跨度;为特征维度。可以获取每天的文本相关数据,其中,文本相关数据包括不限于新闻舆情、法律诉讼、公司公告等,记为,其中为上市公司数量;为最长文本长度,长度不足的文本用字符<pad>填充。
30.可以利用多源异构嵌入模型对目标业务对象及相关业务对象的特征数据进行初步的特征表示,得到初始特征。具体的,针对每类业务对象,以上市公司为例,可以采用比较成熟的专门用于处理时间序列数据的循环神经网络模型(比如长短时记忆网络模型lstm)将时间序列数据嵌入为;利用专门用于处理文本数据的自然语言处理模型(比如预训练模型bert)将文本相关数据嵌入为,其中为特征表示维度。
31.针对每类业务对象,以上市公司为例,如果只包含其中一类特征则直接将或更名为;如果同时包含时间序列特征和文本特征,则利用多层感知器模型mlp将拼接后的特征表示映射为,其中代表横向拼接。
32.本说明书提供的基于不完善异构关系网络图的风险预测方法的执行主体可以是诸如台式电脑、笔记本电脑等终端设备,也可以是服务器,为了便于说明,本说明书以服务器为执行主体,对所提供的基于不完善异构关系网络图的风险预测方法进行说明。
33.s102:获取构建出的异构关系网络图,所述异构关系网络图用于表示各种业务对象之间的若干种业务关系。
34.而后,服务器可以获取构建出的异构关系网络图,该异构关系网络图用于表示各种业务对象之间的若干种业务关系,需要说明的是,由于该异构关系网络图在初始构建的时候存在一些业务对象之间关系的边权重缺失,或者业务对象之间关系的边权重不准确,因此,该异构关系网络图是不完善的,在后续过程中,可以对该异构关系网络图进行调整。
35.以与上市公司有关的异构关系网络图为例,例如,a与b之间存在持股的关系,b与c之间存在持股的关系,初始时,图中不存在a与c之间的关系,但是,图中应存在a与c之间的间接持股比例的边权重。再例如,对于任职关系来说,通过建立了公司与员工之间对应节点的边,但是很难设置合适的边权重,因此,图结构调整参数可以用于调整节点之间的边权重。
36.上述异构关系网络图可以用于表示各种业务对象之间的若干种业务关系。其中,业务对象可以存在有多种,业务对象中一定会包括目标业务对象,即,业务对象中包括上述预设类型的业务对象。
37.以目标业务对象为上市公司为例,业务对象可以存在有上市公司、职员、股东、行业、产品等类型下的业务对象,异构关系网络图可以表示出多种业务关系,并且一定包含有目标业务对象所对应的节点。
38.这里提到的多种业务关系可以包括股权关系、任职关系、债务关系、供应商关系以及行业分布关系中的至少一种。其中,每个业务关系可以对应有该业务关系下的关系网络图,即,异构关系网络图可以包含有各业务关系下的关系网络图。当然,该异构关系网络图也可以是指将不同业务关系记录在一张网络图中。
39.s104:将所述异构关系网络图输入到特征提取网络中,以使所述特征提取网络根据所述初始特征、预设的图结构调整参数以及所述异构关系网络图,确定所述目标业务对象的综合特征。
40.s106:将所述目标业务对象的综合特征输入到风险预测网络中,以使所述风险预测网络根据所述综合特征预测所述目标业务对象的风险程度。
41.s108:根据所述目标业务对象的风险程度,确定针对所述目标业务对象的策略,并根据执行针对所述目标业务对象的策略后得到的业务结果,确定所述策略的奖励。
42.s110:将所述策略和所述综合特征输入到评价网络中,得到评价值,根据所述评价值和所述奖励,对所述特征提取网络、所述风险预测网络以及所述评价网络进行训练,以调整所述图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及训练后的风险预测网络,实时对目标业务对象进行风险预测。
43.确定出异构关系网络图后,可以将该异构关系网络图输入到特征提取网络中,以使该特征提取网络根据该初始特征、预设的图结构调整参数以及该异构关系网络图,确定该目标业务对象的综合特征。
44.这里提到的目标业务对象的综合特征,可以是指通过初始特征、图结构调整参数和异构关系网络图,确定出的能够表示与该目标业务对象相关的图结构特征。
45.其中,上述提到的预设的图结构调整参数可以用于调整异构关系网络图中各节点之间的边权重,该图结构调整参数可以参与模型训练,也就是说,该图结构调整参数可以是模型训练中被调整的参数,在模型训练后通过得到的图结构调整参数来调整异构关系网络图,能够得到更加完善的异构关系网络图。
46.因此,在模型训练的过程中,会逐步地调整上述图结构调整参数,具体的,可以将目标业务对象的综合特征输入到风险预测网络中,以使该风险预测网络根据综合特征预测该目标业务对象的风险程度,进而,可以根据该目标业务对象的风险程度,确定针对该目标业务对象的策略,并根据执行针对该目标业务对象的策略后得到的业务结果,确定该策略的奖励。
47.最后,可以将确定出的策略和该综合特征输入到评价网络中,得到评价值,根据评价值和奖励,对特征提取网络、风险预测网络以及评价网络进行训练,以调整图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及训练后的风险预测网络,实时对目标业务对象进行风险预测。
48.具体的网络结构示意图可以如图2所示。
49.图2为本说明书提供的一种各个网络之间关系的示意图。
50.上述提到的风险程度可以是指目标业务对象出现风险的概率,以目标业务对象为上市公司为例,则可以是指上市公司出现股价暴跌,金融方面出现暴雷的概率。
51.从上述内容中可以看出,在模型训练时,参考了强化学习的训练方式,之所以不是
使用有监督学习,是因为在实际中训练样本的比例较为失调,出现风险的业务对象较少,不出现风险的业务对象较多,在这种情况下,通过有监督学习训练,训练样本分布不均匀,很难训练出准确的模型,因此,在本说明书中采用上述方式进行训练。
52.需要说明的是,图结构调整参数可以用于调整两个节点之间的边权重。在图结构调整参数中包含有每两个节点之间的边对应有的图结构调整参数。
53.具体的,可以将该异构关系网络图输入到特征提取网络中,以使该特征提取网络将该初始特征作为该目标业务对象及相关业务对象的初始节点特征,并根据该目标业务对象的邻居节点与该目标业务对象对应的节点之间边对应的原始权重和图结构调整参数,确定该目标业务的邻居节点与该目标业务对象对应节点之间的边权重。而后,可以根据该初始节点特征、目标业务对象的邻居节点、目标业务对象的节点与目标业务对象的邻居节点之间的边权重,确定目标业务对象的综合特征。
54.需要说明的是,在上述内容中是以目标业务对象来说明的,但在训练时,每个节点都需要参与训练,即,每个节点所对应业务对象均需要进行综合特征(可以理解为节点所对应业务对象的特征表示)的提取。
55.对于两个节点来说,这两个节点之间的边的原始权重可以是指最初构建出的异构关系网络图中这两个节点之间的边对应的权重,当两个节点之间不存在边时,则权重可以为0。由于模型训练是迭代式的,对于两个节点来说,在每一轮迭代中,可以通过图结构调整参数与原始权重确定出在该轮迭代中这两个节点之间的边权重,通过模型(指特征提取网络、风险预测网络和评价网络)不断地迭代,从而不断调整图结构调整参数。
56.因此,可以针对该异构关系网络图中的每两个节点,根据训练后得到的该两个节点之间边对应的图结构调整参数,更新该异构关系网络图中该两个节点之间的边权重,以得到调整后的异构关系网络图。
57.图结构调整参数包括权重补全参数以及权重调整参数。权重补全参数用于补全两个节点之间缺失的边权重,权重调整参数用于调整两个节点之间已有的边权重。例如,对于两个节点来说,若该两个节点之间的边的原始权重为a,权重补全参数为b,权重调整参数为c,则在每一轮迭代中,这两个节点之间的边权重为b+a*c。
58.还需说明的是,上述异构关系网络图可以包括每个业务关系下的关系网络图,即,该异构关系网络图可以是多个关系网络图,在这种情况下,每个关系网络图可以对应有该关系网络图中的图结构调整参数。
59.具体的,针对每种关系下的关系网络图引入可学习的同尺寸矩阵变量和分别来解决两类不完善问题,其中用于权重补全(即,为权重补全参数所对应的矩阵);用于权重调整(即,为权重调整参数所对应的矩阵)。最终设计成。为通过图结构调整参数调整后的关系网络图,可参与模型训练。
60.上述图结构调整参数可以进行随机初始化,或者初始化为默认值,在模型训练过程中被逐渐调整为最优的值,但是存在某些情况,需要按照关系网络图对应的关系属性,对关系网络图中的图结构调整参数进行设置。
61.例如,由于股权关系不是对称关系(比如人员持股公司,但反过来不成立),所以需要根据股权关系特点进行微调(比如公司指向人员的有向边权重补全参数设置为超参数0)。
62.需要说明的是,由于异构关系网络图可以包括每个业务关系下的关系网络图,因此,在计算综合特征时(即,计算图中目标业务对象或者其他业务对象的特征表示时),需要结合每个关系网络图。
63.具体的,可以通过多关系图卷积神经网络模型(relational graph convolutional network,rgcn)通过结合每种关系下再设计的异构关系网络图进一步迭代更新节点所对应业务对象的特征表示:
64.其中、分别表示第、次迭代后节点所对应业务对象的特征表示,同理;表示所有关系类型集合;表示关系下目标节点的邻居节点集合;用来做归一化,这里取,其中、属于;为了保持计算稳定性(默认);是目标节点自身对应的学习参数;是关系下的邻居节点对应的学习参数;为激活函数,比如softmax、relu等。
65.当目标节点为目标业务对象对应的节点时,为次迭代后得到的目标业务对象的综合特征。
66.上述提到的奖励,需要与本方法的目的相适应,具体的,可以从若干个目标业务对象中选取出风险程度排在预设排位前的业务对象,作为选取出的目标业务对象,并确定选取出的目标业务对象的组合在预设天数后的资源增益率,进而根据该资源增益率,确定策略的奖励,其中,资源增益率越高,策略的奖励越高。
67.这里提到的资源增益率可以是指按照选取出的目标业务对象的组合在未来天得到的做空虚拟组合收益率(该做空虚拟组合收益率具体可以是指假设将持有的上市公司的股票卖出并持有一段时间现金后再买入上市公司的股票得到的收益率)。在确定奖励时,可以确定出市场平均收益率,并将资源增益率与市场平均收益率之间的差值作为奖励,因此,奖励越高,则说明选取出的目标业务对象存在风险的可能越高。
68.当奖励连续次为正时则可以完成训练。
69.上述风险预测网络可以视为深度确定性策略梯度模型(deep deterministic policy gradient,ddpg)中的策略网络,评价网络为ddpg模型中的评价网络。
70.在对特征提取网络、风险预测网络和评价网络进行训练时,对于确定出的一个时
刻的策略来说,训练目标可以包括最大化评价网络输出的评价值,以及根据确定出的奖励,使得评价网络输出对该时刻策略的评价值趋近于通过该策略在长久上最终得到的全部奖励。
71.ddpg采用actor-critic(行为者-评论家)框架,其中actor通过多层感知器模型mlp构造了策略主网络和目标网络模型,输入状态,输出动作,和为参数;critic通过多层感知器模型mlp构造了评价主网络和目标网络模型,输入状态和动作,输出评价值,和为参数。初始时主网络与目标网络完全一样。
72.actor通过策略主网络将时刻状态(时刻上市公司更新后的综合特征)映射成要采取的动作(时刻预测未来天后上市公司的风险程度,选取风险程度(概率值)排前的上市公司构造做空虚拟组合并记录未来天的做空收益率),采取动作后进入时刻状态(时刻上市公司更新后的综合特征,时刻可以取做空虚拟组合天后结束时刻)并得到动作奖励(做空虚拟组合相对于沪深300指数等代表市场平均组合的超额收益率);critic通过评价主网络来评价对的价值来反馈指导actor的动作;策略主网络可以通过提升以下策略梯度来更新模型参数:
73.其中表示每次使用的样本数量。评价主网络通过最小化以下损失函数来更新参数:
74.其中表示每次使用的样本数量,为折现率,一般取0.99。策略目标网络和评价目标网络通过以下公式来更新参数和:
[0075][0076]
其中一般取0.001。在整个训练过程中,主网络通过不断学习试探来逐渐更新目标网络,直到目标网络稳定并最终进化为我们需要的网络。
[0077]
从上述内容中可以看出,本方法可以通过训练过程中,调整图结构调整参数,从而优化原始的异构关系网络图,从而对异构关系网络图进行缺失边权重的补全或者进行边权重的优化,并且,在训练特征提取网络、风险预测网络和评价网络时,不是有监督训练的方
式,而是通过计算奖励,以及通过评价网络来评价通过风险预测网络得到的策略的方式,从而避免了样本分布极为不均导致训练出的模型不准确的问题。
[0078]
需要说明的是,可以由一整套的风险预警系统来实现上述方法,如图3所示。
[0079]
图3为本说明书提供的一种风险预警系统的结构示意图。
[0080]
该风险预警具体可以包括数据管理模块、图数据库云存储模块、交互式建模模块和风险预警模块。
[0081]
所述数据管理模块包括数据采集模块和数据预处理模块,其中数据采集模块用于接入目标业务对象及相关业务对象的多源异构特征数据及业务对象间不完善的关系数据,数据源包括不限于wind、天眼查等金融终端以及国家税务总局等数据归口机构;数据预处理模块用于数据清洗、填充、转换及归一化等基础处理;图数据库云存储模块用于本例中异构关系网络图的存储,其通过构建有向图的方式来可视化节点和边,并标注节点和边的类型以及节点所对应业务对象的特征信息,选择的图数据库需支持对数据的分布式存储,能提供高吞吐、低延迟的数据访问能力,比如neo4j、tugraph等;交互式建模模块可以通过组件点击和弹窗交互的形式实现模型组合配置及超参数设置,包括多源异构嵌入模型构建模块和风险预警模型构建模块,其中多源异构嵌入模型构建模块提供循环神经网络模型组件和自然语言处理模型组件用于处理业务对象的时间序列特征和文本特征,在本例中对应于将不同类型的特征数据(如时间序列数据、文本相关数据)嵌入成维特征表示;风险预警模型构建模块包括多关系图卷积神经网络模型rgcn建模模块和深度确定性策略梯度模型ddpg建模模块,其中多关系图卷积神经网络模型rgcn建模模块用于进一步更新各业务对象的特征表示。深度确定性策略梯度模型ddpg建模模块可以用于训练寻找存在风险的目标业务对象(如上市公司),在本例中对应于结合目标业务对象的综合特征(通过图结构调整参数调整图的结构后更新后的特征表示)和actor-critic框架设计,并通过动作奖励来反馈训练模型;风险预警模块用于对目标业务对象(如上市公司)实时进行风险预警。
[0082]
以上为本说明书的一个或多个实施例提供的基于不完善异构关系网络图的风险预测方法,基于同样的思路,本说明书还提供了基于不完善异构关系网络图的风险预测装置,如图4所示。
[0083]
图4为本说明书提供的一种基于不完善异构关系网络图的风险预测装置的示意图,包括:第一获取模块401,用于获取目标业务对象及相关业务对象的时间序列数据以及文本相关数据,根据所述时间序列数据以及文本相关数据,确定所述目标业务对象及相关业务对象的初始特征;第二获取模块402,用于获取构建出的异构关系网络图,所述异构关系网络图用于表示各种业务对象之间的若干种业务关系;特征提取模块403,用于将所述异构关系网络图输入到特征提取网络中,以使所述特征提取网络根据所述初始特征、预设的图结构调整参数以及所述异构关系网络图,确定所述目标业务对象的综合特征;
预测模块404,用于将所述目标业务对象的综合特征输入到风险预测网络中,以使所述风险预测网络根据所述综合特征预测所述目标业务对象的风险程度;奖励确定模块405,用于根据所述目标业务对象的风险程度,确定针对所述目标业务对象的策略,并根据执行针对所述目标业务对象的策略后得到的业务结果,确定所述策略的奖励;训练模块406,用于将所述策略和所述综合特征输入到评价网络中,得到评价值,根据所述评价值和所述奖励,对所述特征提取网络、所述风险预测网络以及所述评价网络进行训练,以调整所述图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及训练后的风险预测网络,实时对目标业务对象进行风险预测。
[0084]
可选地,目标业务对象属于所述各种业务对象中预设类型的业务对象,所述预设类型的业务对象至少包括:上市公司。
[0085]
可选地,所述时间序列数据包括:所述目标业务对象及相关业务对象的基本信息和指标相关信息;所述文本相关数据包括:新闻信息、诉讼数据、公告信息中的至少一种。
[0086]
可选地,所述各种业务对象之间的若干种业务关系包括:股权关系、任职关系、债务关系、供应商关系以及行业分布关系中的至少一种。
[0087]
可选地,所述图结构调整参数中包括每两个节点之间的边对应的图结构调整参数;所述特征提取模块403具体用于,用于将所述异构关系网络图输入到所述特征提取网络中,以使所述特征提取网络将所述初始特征作为所述目标业务对象及相关业务对象的初始节点特征,并根据所述目标业务对象的邻居节点与所述目标业务对象对应的节点之间边对应的原始权重和图结构调整参数,确定所述目标业务对象的邻居节点与所述目标业务对象对应节点之间的边权重;根据所述初始节点特征、所述目标业务对象的邻居节点、所述目标业务对象的节点与所述目标业务对象的邻居节点之间的边权重,确定所述目标业务对象的综合特征。
[0088]
可选地,图结构调整参数包括权重补全参数以及权重调整参数。
[0089]
可选地,所述训练模块406具体用于,针对所述异构关系网络图中的每两个节点,根据训练后得到的该两个节点之间边对应的图结构调整参数,更新所述异构关系网络图中该两个节点之间的边权重,以得到所述调整后的异构关系网络图。
[0090]
可选地,所述目标业务对象为若干个目标业务对象;所述奖励确定模块405具体用于,从所述若干个目标业务对象中选取出风险程度排在预设排位前的业务对象,作为选取出的目标业务对象;确定所述选取出的目标业务对象的组合在预设天数后的资源增益率;根据所述资源增益率,确定所述策略的奖励。
[0091]
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述基于不完善异构关系网络图的风险预测装置方法。
[0092]
本说明书还提供了图5所示的电子设备的结构示意图。如图5所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述基于不完善异构关系网络图的风险预测方法。
[0093]
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
[0094]
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmable logic device, pld)(例如现场可编程门阵列(field programmable gate array,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardware description language,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advanced boolean expression language)、ahdl(altera hardware description language)、confluence、cupl(cornell university programming language)、hdcal、jhdl(java hardware description language)、lava、lola、myhdl、palasm、rhdl(ruby hardware description language)等,目前最普遍使用的是vhdl(very-high-speed integrated circuit hardware description language)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
[0095]
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc 625d、atmel at91sam、microchip pic18f26k20 以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
[0096]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0097]
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本
说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0098]
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0099]
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0100]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0101]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0102]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0103]
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
[0104]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0105]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0106]
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0107]
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0108]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0109]
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
技术特征:
1.一种基于不完善异构关系网络图的风险预测方法,其特征在于,包括:获取目标业务对象及相关业务对象的时间序列数据以及文本相关数据,根据所述时间序列数据以及文本相关数据,确定所述目标业务对象及相关业务对象的初始特征;获取构建出的异构关系网络图,所述异构关系网络图用于表示各种业务对象之间的若干种业务关系;将所述异构关系网络图输入到特征提取网络中,以使所述特征提取网络根据所述初始特征、预设的图结构调整参数以及所述异构关系网络图,确定所述目标业务对象的综合特征;将所述目标业务对象的综合特征输入到风险预测网络中,以使所述风险预测网络根据所述综合特征预测所述目标业务对象的风险程度;根据所述目标业务对象的风险程度,确定针对所述目标业务对象的策略,并根据执行针对所述目标业务对象的策略后得到的业务结果,确定所述策略的奖励;将所述策略和所述综合特征输入到评价网络中,得到评价值,根据所述评价值和所述奖励,对所述特征提取网络、所述风险预测网络以及所述评价网络进行训练,以调整所述图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及训练后的风险预测网络,实时对目标业务对象进行风险预测。2.如权利要求1所述的方法,其特征在于,目标业务对象属于所述各种业务对象中预设类型的业务对象,所述预设类型的业务对象至少包括:上市公司。3.如权利要求1所述的方法,其特征在于,所述时间序列数据包括:所述目标业务对象及相关业务对象的基本信息和指标相关信息;所述文本相关数据包括:新闻信息、诉讼数据、公告信息中的至少一种。4.如权利要求1所述的方法,其特征在于,所述各种业务对象之间的若干种业务关系包括:股权关系、任职关系、债务关系、供应商关系以及行业分布关系中的至少一种。5.如权利要求1所述的方法,其特征在于,所述图结构调整参数中包括每两个节点之间的边对应的图结构调整参数;将所述异构关系网络图输入到特征提取网络中,以使所述特征提取网络根据所述初始特征、预设的图结构调整参数以及所述异构关系网络图,确定所述目标业务对象的综合特征,具体包括:将所述异构关系网络图输入到所述特征提取网络中,以使所述特征提取网络将所述初始特征作为所述目标业务对象及相关业务对象的初始节点特征,并根据所述目标业务对象的邻居节点与所述目标业务对象对应的节点之间边对应的原始权重和图结构调整参数,确定所述目标业务对象的邻居节点与所述目标业务对象对应节点之间的边权重;根据所述初始节点特征、所述目标业务对象的邻居节点、所述目标业务对象的节点与所述目标业务对象的邻居节点之间的边权重,确定所述目标业务对象的综合特征。6.如权利要求5所述的方法,其特征在于,图结构调整参数包括权重补全参数以及权重调整参数。7.如权利要求5所述的方法,其特征在于,根据所述图结构调整参数,得到调整后的异构关系网络图,具体包括:针对所述异构关系网络图中的每两个节点,根据训练后得到的该两个节点之间边对应
的图结构调整参数,更新所述异构关系网络图中该两个节点之间的边权重,以得到所述调整后的异构关系网络图。8.如权利要求1所述的方法,其特征在于,所述目标业务对象为若干个目标业务对象;根据所述目标业务对象的风险程度,确定针对所述目标业务对象的策略,并根据执行针对所述目标业务对象的策略后得到的业务结果,确定所述策略的奖励,具体包括:从所述若干个目标业务对象中选取出风险程度排在预设排位前的业务对象,作为选取出的目标业务对象;确定所述选取出的目标业务对象的组合在预设天数后的资源增益率;根据所述资源增益率,确定所述策略的奖励。9.一种基于不完善异构关系网络图的风险预测装置,其特征在于,包括:第一获取模块,用于获取目标业务对象及相关业务对象的时间序列数据以及文本相关数据,根据所述时间序列数据以及文本相关数据,确定所述目标业务对象及相关业务对象的初始特征;第二获取模块,用于获取构建出的异构关系网络图,所述异构关系网络图用于表示各种业务对象之间的若干种业务关系;特征提取模块,用于将所述异构关系网络图输入到特征提取网络中,以使所述特征提取网络根据所述初始特征、预设的图结构调整参数以及所述异构关系网络图,确定所述目标业务对象的综合特征;预测模块,用于将所述目标业务对象的综合特征输入到风险预测网络中,以使所述风险预测网络根据所述综合特征预测所述目标业务对象的风险程度;奖励确定模块,用于根据所述目标业务对象的风险程度,确定针对所述目标业务对象的策略,并根据执行针对所述目标业务对象的策略后得到的业务结果,确定所述策略的奖励;训练模块,用于将所述策略和所述综合特征输入到评价网络中,得到评价值,根据所述评价值和所述奖励,对所述特征提取网络、所述风险预测网络以及所述评价网络进行训练,以调整所述图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及训练后的风险预测网络,实时对目标业务对象进行风险预测。10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~8任一项所述的方法。11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~8任一项所述的方法。
技术总结
本说明书公开了一种基于不完善异构关系网络图的风险预测方法及装置,可以确定该目标业务对象及相关业务对象的初始特征,而后,根据异构关系网络图、初始特征和图结构调整参数,确定目标业务对象的综合特征。将该目标业务对象的综合特征输入到风险预测网络中,预测得到目标业务对象的风险程度。最后,根据目标业务对象的风险程度,确定针对目标业务对象的策略,并确定奖励,进而根据策略评价值和奖励,对特征提取网络、风险预测网络以及评价网络进行训练,以调整图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及风险预测网络,实时进行风险预测,从而提高了风险预测的准确性。测的准确性。测的准确性。
技术研发人员:吴迪 那崇宁 胡汉一 张泷
受保护的技术使用者:之江实验室
技术研发日:2023.09.08
技术公布日:2023/10/15
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/