一种基于深度学习神经网络的金融风险预测方法与流程
未命名
08-03
阅读:111
评论:0

1.本发明涉及数据处理技术领域,具体涉及一种基于深度学习神经网络的金融风险预测方法。
背景技术:
2.金融数据往往会受各种人类活动导致金融数据出现波动,并根据时令季节呈现出周期性,进而导致由于周期性变化,通过神经网络难以学到有效的风险特征,难以实现对金融风险的准确性分析。并且对不同类型金融数据进行风险分析监管时,往往是通过对不同类型的金融数据,设定不同参数阈值,进行风险检测但是由于不同金融数据类型不同,要求阈值不一,较难预测,进而为了更准确实现金融数据风险预警,本分方案提出了一种基于深度学习神经网络的金融风险预测方法,通过表示学习,提取金融数据的风险值,用于提高神经网络对金融风险数据的学习能力。
技术实现要素:
3.本发明提供一种基于深度学习神经网络的金融风险预测方法,以解决不同金融数据类型不同,较难预测的问题,所采用的技术方案具体如下:
4.本发明一个实施例提供一种基于深度学习神经网络的金融风险预测方法,该方法包括以下步骤:
5.获取多种金融数据;
6.将每一种金融数据分成不同类型的若干数据段,根据每一类型的数据段总长度获取每一类型数据段的相似程度值,根据每一类型数据段的相似程度值的最小值作为每一种金融数据的稳态值;
7.获取新金融数据以及最佳数据段;对最佳数据段进行编号,并根据新金融数据所在最佳数据段的编号获取差值序列;根据差值序列获取高斯模型,将新金融数据带入获取高斯概率值;根据每一种金融数据的新金融数据对应的高斯概率值以及每一种金融数据的稳态值获取新金融数据的风险值;
8.根据新金融数据以及新金融数据对应的风险值使用神经网络训练,通过训练后的网络输入新金融数据完成金融数据的风险预测。
9.优选的,所述将每一种金融数据分成不同类型的若干数据段的方法为:
10.对金融数据的数据段长度设置一个上限值,给定数据段长度的上限值为,的值为金融数据总数据点的十分之一,数据段长度从2开始逐渐增大直至;根据每个数据段长度将金融数据分成若干数据段,每一类型的数据段总长度和金融数据长度相同。
11.优选的,所述将每一种金融数据分成不同类型的若干数据段的方法为:
12.对金融数据的数据段长度设置一个上限值,给定数据段长度的上限值为,的值为金融数据总数据点的十分之一,数据段长度从2开始逐渐增大直至;根据每个数据段长度将金融数据分成若干数据段。
13.优选的,所述根据每个数据段长度将金融数据分成若干数据段的方法为:
14.将金融数据的每一个时间点采集的数据记为数据点,将金融数据的起始数据点记为初始数据段的端点,由该点开始,沿着时间方向,在间隔l个数据点后将第l个数据点作为初始数据段的另一个端点,两个端点之间的所有数据点,包括两个端点构成了初始数据段;将初始数据段从该类金融数据中截去,之后对剩余的金融数据使用相同的方式得到第二个初始数据段,依次类推,直到金融数据所剩余的数据点数量不足l时,此时将剩余的所有数据点作为一段,由此得到了若干数据段。
15.优选的,所述根据每一类型的数据段总长度获取每一类型数据段的相似程度值的方法为:
16.对于同一种金融数据使用同一类型的数据段长度将金童数据分为了若干数据段,对于所有数据段,其中任意两个数据段使用dtw算法获取两个数据段之间的dtw距离,获取所有数据段两两数据段之间的dtw距离,获取所有dtw距离的平均值,将该平均值作为同类金融数据同一个数据段长度对应的相似程度值。
17.优选的,所述新金融数据为按照时间顺序对每一种金融数据采集的一个新的金融数据点。
18.优选的,所述最佳数据段为相似程度值最大时对应的数据段。
19.优选的,所述对最佳数据段进行编号,并根据新金融数据所在最佳数据段的编号获取差值序列的方法为:
20.对于每个最佳数据段,从段内起点到段内终点从1开始进行递增不重复的编号,将编号作为序列值;将金融数据中所有的最佳数据段按照时间排序最后一个最佳数据段作为最后一段,在最后一段中,将新金融数据的序列值和最后一段的起始点对应的序列值作差得到新差值,之后在每个最佳数据段中,将每个数据点与起始点的序列值作差,将每一个最佳数据段内序列值差值等于新差值的数据点提取出来,按照时间顺序排序,将新金融数据放在最后一个位置,由此得到一个新的序列,记为差值序列。
21.优选的,所述根据差值序列获取高斯模型,将新金融数据带入获取高斯概率值的方法为:
22.将差值序列中除了新金融数据以外的数据点记为差值数据点,获取所有差值数据点对应的数据值的均值和方差,并给方差值添加超参数,将与方差值相乘后得到新方差值,将新方差值使用函数进行映射,映射的新方差值带入到单高斯函数模型中,可得到所有差值数据点对应的单高斯模型,将新金融数据带入到所述单高斯模型中,得到新金融数据对应的高斯概率值。
23.优选的,所述根据每一种金融数据的新金融数据对应的高斯概率值以及每一种金融数据的稳态值获取新金融数据的风险值的方法为:
24.将金融数据的新金融数据对应的高斯概率值和金融数据的稳态值相加取负,将取负后的值使用以e为底的指数函数处理,这样得到了每一种金融数据对应的风险值,将每一种金融数据对应的风险值中取最大值,将最大值作为新金融数据的风险值。
25.本发明的有益效果是:本发明对每一种金融数据计算其自身稳定性,并根据稳定性对金融数据自适应分段,不同的分段有利于减少计算量并保证计算精度,使不同金融数据从具有最佳抗风险能力,防止出现误检,之后利用不同金融数据的自身稳定性对风险值
进行放大,以得到不同种类金融数据准确的风险值,以此实现更高效率的金融风险预测。
附图说明
26.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
27.图1为本发明一个实施例所提供的一种基于深度学习神经网络的金融风险预测方法的流程示意图。
具体实施方式
28.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
29.请参阅图1,其示出了本发明一个实施例提供的一种基于深度学习神经网络的金融风险预测方法流程图,该方法包括以下步骤:
30.步骤s001,使用金融采集平台采集金融数据。
31.使用金融采集平台获取不同类型的金融数据,所述获取的不同类型的金融数据是时间序列数据,其随着时间变化,每1s获取一次数据值,同一类型的金融数据按照时间排序,由此得到不同类型的金融数据。
32.至此,获取了多种金融数据。
33.步骤s002,将每一种金融数据根据不同数据段长度分为不同类型的数据段,根据同类型数据段获取该数据段长度对应的相似程度值,由此获取金融数据的稳态值。
34.在得到当前金融数据后,如果某一金融数据发生较大变化,则表示当前安全风险增加,并且在金融数据不稳定时,小的数据变化,也可能使得当前安全风险增加。所以本实施例先对当前金融数据进行稳定性分析,进而根据当前金融数据的稳态值,判断当前金融数据对应的风险值,以实现对金融数据的风险监测。
35.对于不同种类的金融数据具有不同的周期性,为了获得能够衡量具有周期性和不具有周期性所对应金融数据的稳态值,本实施例将不同的金融数据划分为多段,并且根据划痕后的数据段获取当前金融数据的相似性程度作为当前金融数据的稳态值。在对金融数据进行分段时,需要保证分段后的每个数据段具有完整周期性,这样对金融数据进行分段后的数据在进行相似度计算时,各个分段才可以保持最高的相似度,以获取金融数据对应的稳态值。
36.具体的,对于每一种金融数据,将金融数据的每一个时间点采集的数据记为数据点,将金融数据的起始数据点记为初始数据段的端点,由该点开始,沿着时间方向,在间隔l个数据点后将第l个数据点作为初始数据段的另一个端点,两个端点之间的所有数据点,包括两个端点构成了初始数据段,将初始数据段从该类金融数据中截去,之后对剩余的金融数据使用相同的方式得到第二个初始数据段,依次类推,直到金融数据所剩余的数据点数
量不足l时,此时将剩余的所有数据点作为一段,由此得到了若干数据段。
37.其中由于使用不同的l对同一种金融数据进行分段时,分段后的数据段也不同,导致数据段之间的匹配得到的相似度也不同,不同的相似度表示不同的稳定性,为了获取每一种金融数据的最佳稳定性,要在所有l中找到相似程度最大时所对应的l值,并根据此时的l值所对应的数据段之间的相似程度值作为该类金融数据的稳态值。
38.具体的,获取同一种金融数据的稳态值时,为了减少计算量且若是金融数据分段后的数据段太大会导致获取的稳态值精度较低,因此需要给金融数据的数据段长度设置一个上限值,在本实施例中,给定数据段长度的上限值为,的值为金融数据总数据点的十分之一。数据段长度从2开始逐渐增大直至。
39.对于同一种金融数据同一个数据段长度得到个数据段,对于所有数据段,其中任意两个数据段使用dtw算法获取两个数据段之间的dtw距离,获取所有数据段两两数据段之间的dtw距离,获取所有dtw距离的平均值,将该平均值作为同类金融数据同一个数据段长度对应的相似程度值,其中相似程度值越小,表示该类金融数据在数据段为l时所有数据段之间的近似程度最高。其中选用dtw算法可以获取两段数据的相似性并保证即使金融数据分段后最后一个数据段的长度与其余不同也可以较好的得到结果。
40.通过上述得到每一种金融数据每一个数据段长度对应的相似程度值,对于所有数据段长度得到的相似程度值,获取相似程度值最小时对应的数据段长度作为最终的数据段长度,其对应的相似程度值就是该类金融数据的稳态值,其中若存在相似程度最小值存在多个对应的数据段长度,那么将数据段长度最小的值作为最终数据段长度,稳态值也是该数据段长度对应的相似程度值。
41.至此,获取每一种金融数据的分段,并且得到每一种金融数据的稳态值。
42.步骤s003,获取新金融数据,将数据段编号得到差值序列,根据差值序列获取高斯概率值,根据高斯概率值和稳态值得到新金融数据的风险值。
43.上述获取了每一种金融数据的稳态值,获取不同类金融数据的稳态值后,对不同类型的金融数据对应的新金融数据进行不同程度的放大,以得到准确的风险值。其中在进行对新金融数据进行不同程度的放大时,其首先应当获取新金融数据对应的变化量,进而对当前新金融数据的变化量并结合对应的稳态值,以获取当前新金融数据的风险值。
44.具体的,对于每一种金融数据,按照时间顺序采集一个新的金融数据点,将采集到的心得金融数据点记为新金融数据,在每一种金融数据中完成对金融数据的分段得到最佳数据段,若此时的最后一个最佳数据段的长度和前面的最佳数据段长度相同,那么新金融数据作为独自一段放在最后,其表示最后一段的第一位,若此时的最后一段长度小于前面的最佳数据段的长度,那么此时新金融数据在最后一段。
45.对于每一类的金融数据,将其对应的最佳数据段进行编号,最佳数据段的第一位编号为1,最后一位编号为最佳数据段的长度,即从段内起点到段内终点从一开始进行递增不重复的编号,将编号作为序列值;将金融数据中所有的最佳数据段按照时间排序最后一个最佳数据段作为最后一段,在最后一段中,将新金融数据的序列值和最后一段的起始点对应的序列值作差得到新差值,之后在每个最佳数据段中,将每个数据点与起始点的序列值作差,将每一个最佳数据段内序列值差值等于新差值的数据点提取出来,按照时间顺序结合新金融数据得到一个新的序列,记为差值序列,假设每一个最佳数据段长度为5,
最后一段的序列值为1、2、3此时将新金融数据加入最后一段,最后一段的序列值变为了1、2、3、4,4与1的差值为新差值,之后在其他最佳数据段中找到序列值差值为3时对应的点,并提取出来,将所有提取出来的数据按照时间顺序排序得到差值序列。若金融数据正常稳定,那么得到的差值序列也应近似稳定。
46.获取差值序列后,为了获取新金融数据与序列中其余数据点的差异程度,本实施例采用单高斯模型对差值序列中除了新金融数据外的所有数据点进行拟合,进而将新金融数据带入拟合后的单高斯模型中,获取新金融数据在单高斯模型中的概率值,其中概率值越大,则表示与其余数据点差异不大,概率值越小,与其余数据点具有较大的差异。
47.具体的,将差值序列中除了新金融数据以外的数据点记为差值数据点,获取所有差值数据点对应的数据值的均值和方差,并给方差值添加超参数,将与方差值相乘后得到新方差值,其中用于对不同金融数据进行不同变化范围进行限制,本实施例取可由实施者根据具体实施场景进行调整。将新方差值使用函数进行映射,映射的新方差值带入到单高斯函数模型中,即可得到所有差值数据点对应的单高斯模型,进而将新金融数据带入到所述单高斯模型中,得到新金融数据对应的高斯概率值,其值越大,则表示与其余数据差异不大,概率值越小,与其余数据具有较大的差异。其中采用高斯模型是因为高斯模型能表示具有一定随机性数据分布的模型,并且根据大数定理,当数据量够大时,数据会呈现高斯分布。
48.获取每一种金融数据的新金融数据对应的高斯概率值,高斯概率值越小,则越表示新金融数据与差值数据点之间具有较大的差异,若此时稳态值偏小,表示差值数据点中的数据都是相对稳定的数据,那么此时金融数据的风险值较大,基于此得到所有新金融数据的风险值,公式如下:
[0049][0050]
式中,表示第i类金融数据中新金融数据对应的高斯概率值,表示第i类金融数据对应的稳态值,表示以自然常数为底的指数函数,表示最大值函数,f表示为所有类中新金融数据的风险值。
[0051]
越小,则新金融数据与差值数据点具有较大的差异,其对应的风险值越高,所以对其利用进行负相关映射,使得越小,exp(-)的值越大,f的值越大;越小,则表示分段后各段数据越近似,则第i类型金融数据整体数据相对稳定,如果此时新金融数据与差值数据点具有较大的差异,则其对应的风险值越高;获取到每类金融数据的风险值后,选择风险值最大的金融数据,风险值越大,越表示所有类的新金融数据具有较大的异常,存在较大的风险。
[0052]
至此,获取了新金融数据的风险值。
[0053]
步骤s004,通过新金融数据和风险值训练神经网络,通过训练后的网络输入新金融数据完成金融数据的风险预测。
[0054]
将新金融数据与对应的风险值与输入到训练完成的神经网络中,完成当前金融风险预测;在进行用于金融风险预测得神经网络训练时,本方案选择采用lstm神经网络进行训练,采集金融平台的金融数据,并按照本方案风险值计算方法,获取得到对应的风险值,将金融数据和对应风险值作为lstm神经网络的输入,网络的输出为风险值和无风险,其中
在对lstm神经网络进行训练时,本方案选择通过onehot的方式对lstm神经网络进行训练对应的风险进行编码,其中数据的标注由具有相关工作经验的人眼进行风险标注,进而利用交叉熵作为损失函数,进行lstm神经网络训练,其中lstm网络具体训练过程为公知内容不在赘述。
[0055]
进而当新金融数据在输入到训练完成的神经网络后,如果神经网络的输出结果为风险值,则表示当前金融数据存在安全风险。
[0056]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种基于深度学习神经网络的金融风险预测方法,其特征在于,该方法包括以下步骤:获取多种金融数据;将每一种金融数据分成不同类型的若干数据段,根据每一类型的数据段总长度获取每一类型数据段的相似程度值,根据每一类型数据段的相似程度值的最小值作为每一种金融数据的稳态值;获取新金融数据以及最佳数据段;对最佳数据段进行编号,并根据新金融数据所在最佳数据段的编号获取差值序列;根据差值序列获取高斯模型,将新金融数据带入获取高斯概率值;根据每一种金融数据的新金融数据对应的高斯概率值以及每一种金融数据的稳态值获取新金融数据的风险值;根据新金融数据以及新金融数据对应的风险值使用神经网络训练,通过训练后的网络输入新金融数据完成金融数据的风险预测。2.根据权利要求1所述的一种基于深度学习神经网络的金融风险预测方法,其特征在于,所述将每一种金融数据分成不同类型的若干数据段的方法为:对金融数据的数据段长度设置一个上限值,给定数据段长度的上限值为,的值为金融数据总数据点的十分之一,数据段长度从2开始逐渐增大直至;根据每个数据段长度将金融数据分成若干数据段,每一类型的数据段总长度和金融数据长度相同。3.根据权利要求2所述的一种基于深度学习神经网络的金融风险预测方法,其特征在于,所述根据每个数据段长度将金融数据分成若干数据段的方法为:将金融数据的每一个时间点采集的数据记为数据点,将金融数据的起始数据点记为初始数据段的端点,由该点开始,沿着时间方向,在间隔l个数据点后将第l个数据点作为初始数据段的另一个端点,两个端点之间的所有数据点,包括两个端点构成了初始数据段;将初始数据段从该类金融数据中截去,之后对剩余的金融数据使用相同的方式得到第二个初始数据段,依次类推,直到金融数据所剩余的数据点数量不足l时,此时将剩余的所有数据点作为一段,由此得到了若干数据段。4.根据权利要求1所述的一种基于深度学习神经网络的金融风险预测方法,其特征在于,所述根据每一类型的数据段总长度获取每一类型数据段的相似程度值的方法为:对于同一种金融数据使用同一类型的数据段长度将金童数据分为了若干数据段,对于所有数据段,其中任意两个数据段使用dtw算法获取两个数据段之间的dtw距离,获取所有数据段两两数据段之间的dtw距离,获取所有dtw距离的平均值,将该平均值作为同类金融数据同一个数据段长度对应的相似程度值。5.根据权利要求1所述的一种基于深度学习神经网络的金融风险预测方法,其特征在于,所述新金融数据为按照时间顺序对每一种金融数据采集的一个新的金融数据点。6.根据权利要求1所述的一种基于深度学习神经网络的金融风险预测方法,其特征在于,所述最佳数据段为相似程度值最大时对应的数据段。7.根据权利要求1所述的一种基于深度学习神经网络的金融风险预测方法,其特征在于,所述对最佳数据段进行编号,并根据新金融数据所在最佳数据段的编号获取差值序列的方法为:对于每个最佳数据段,从段内起点到段内终点从1开始进行递增不重复的编号,将编号
作为序列值;将金融数据中所有的最佳数据段按照时间排序最后一个最佳数据段作为最后一段,在最后一段中,将新金融数据的序列值和最后一段的起始点对应的序列值作差得到新差值,之后在每个最佳数据段中,将每个数据点与起始点的序列值作差,将每一个最佳数据段内序列值差值等于新差值的数据点提取出来,按照时间顺序排序,将新金融数据放在最后一个位置,由此得到一个新的序列,记为差值序列。8.根据权利要求1所述的一种基于深度学习神经网络的金融风险预测方法,其特征在于,所述根据差值序列获取高斯模型,将新金融数据带入获取高斯概率值的方法为:将差值序列中除了新金融数据以外的数据点记为差值数据点,获取所有差值数据点对应的数据值的均值和方差,并给方差值添加超参数,将与方差值相乘后得到新方差值,将新方差值使用函数进行映射,映射的新方差值带入到单高斯函数模型中,可得到所有差值数据点对应的单高斯模型,将新金融数据带入到所述单高斯模型中,得到新金融数据对应的高斯概率值。9.根据权利要求1所述的一种基于深度学习神经网络的金融风险预测方法,其特征在于,所述根据每一种金融数据的新金融数据对应的高斯概率值以及每一种金融数据的稳态值获取新金融数据的风险值的方法为:将金融数据的新金融数据对应的高斯概率值和金融数据的稳态值相加取负,将取负后的值使用以e为底的指数函数处理,这样得到了每一种金融数据对应的风险值,将每一种金融数据对应的风险值中取最大值,将最大值作为新金融数据的风险值。
技术总结
本发明涉及数据处理技术领域,提出了一种基于深度学习神经网络的金融风险预测方法,包括:获取多种金融数据;将金融数据分成若干数据段,根据每一类型的数据段总长度获取每一类型数据段的相似程度值,并由此得到金融数据的稳态值;获取新金融数据以及最佳数据段;根据最佳数据段进行编号,并根据新金融数据所在最佳数据段的编号获取差值序列;根据差值序列获取高斯模型,并得到高斯概率值;根据金融数据的新金融数据对应的高斯概率值以及金融数据的稳态值获取新金融数据的风险值;根据新金融数据以及新金融数据对应的风险值完成金融数据的风险预测。本发明利用不同金融数据的自身稳定性进行风险值放大,以实现更高效的金融风险预测。险预测。险预测。
技术研发人员:常京伟
受保护的技术使用者:北京裕芃科技有限公司
技术研发日:2023.06.29
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/