工业增加值增速预测方法、系统、电子设备及存储介质与流程

未命名 09-29 阅读:189 评论:0


1.本发明涉及工业增加值增速预测技术领域,尤其涉及一种工业增加值增速预测方法、系统、电子设备和存储介质。


背景技术:

2.当前关于工业增加值预测的研究相对较少,且主要基于所选择的若干传统统计指标进行,如利用社会消费品零食总额、广义货币数据对工业增加值进行预测,基于构建的民营企业信用利差指数对工业增加值进行预测。在宏观经济传导机制愈发复杂、工业增加值影响因素更加多元的情形下,恰当的预测模型应当包含大量的解释变量以充分利用有价值的信息,仅利用少数几个变量较难获得精准的预测。此外,传统统计数据的滞后性致使预测时难以利用经济活动的当前信息,而电力大数据与经济活动密切相关且实时可得,可提供经济活动的当前信息弥补传统统计数据的不足。因此,综合利用电力数据和传统统计数据可能得到更加准确的工业增加值预测结果。电力行业是国民经济的基础性能源产业,对其他产业部门的发展起着至关重要的支撑作用。电力消耗是生产环节中重要投入之一,且本身不存在库存现象,由此也可以看出电力消耗和工业产值之间必然存在一定的相关性。
3.随着短期电力负荷预测技术的发展,对短期电力负荷影响因素考虑的愈发全面,并且影响因素与负荷之间的关系并非简单的线性关系,使得传统和经典的预测方法表现很大的劣势,并且大样本数据的处理对传统和经典的预测方法也是巨大的挑战,而一些机器学习算法凭借其强大的学习能力和自适应能力表现出卓越性能。应用机器学习算法进行负荷预测的实质先假设一个模型,然后通过学习求解使损失函数最小的模型参数,常用的机器学习算法有人工神经网络法、支持向量机法、随机森林、梯度提升决策树(gbdt)、岭回归等,这些方法在电力负荷预测的精度提升上有着显著的表现。但是,上述均为单一负荷预测方法,数据分布特点会对影响算法结果,这是单一算法本身缺陷造成的,因此对于同一组测试数据也会得到差异较大的计算结果,预测精度不高。


技术实现要素:

4.本发明实施例解决其技术问题所采用的技术方案是:
5.一种工业增加值增速预测方法,包括:
6.步骤s1,获取样本数据,所述样本数据包括年度参数数据和年度工业增加值,所述年度参数数据包括年度经济数据和年度电力数据;
7.步骤s2,预处理各个所述样本数据,输入至样本集;
8.步骤s3,根据所述样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;
9.步骤s4,利用所述预测模型进行工业增加值增速预测;
10.步骤s5,使用波动性和准确度评估所述预测模型。
11.较优地,所述样本数据记为(xi,yi),其中,xi为所述年度参数数据,yi为所述年度工业增加值实际值,i为年份,特征向量xi=[xia,xib,...,xig],xia,xib,...,xig分别为年度电力数据a、年度居民收入及消费数据b、年度社会经济数据c、年度工业开发区基本信息d、年度工业产值e、年度工业产品价格指数f、年度工业原材料均价g。
[0012]
较优地,所述预测模型包括初级学习模型和次级学习模型,所述步骤s3包括:
[0013]
步骤s31,将所述样本集划分为训练集和测试集,其中,所述测试集为本年度的样本数据,所述训练集为其他年度的样本数据;
[0014]
步骤s32,建立所述初级学习模型s
x
,并将各个所初级学习模型的输出作为所述次级学习模型的输入,所述初级学习模型包括线性回归算法模型s1、决策树算法模型s2、支持向量机模型s3、k近邻算法模型s4、随机森林算法模型s5、adaboost算法模型s6、梯度回归算法模型s7和时间序列分析算法模型s8,每个所述初级学习模型通过所述训练集进行训练、并且使用所述测试集进行测试;
[0015]
步骤s33,建立所述次级学习模型,所述次级学习模型用于通过r2方法和遗传算法为所述初级学习模型的输出结果分配权重配置、以及设定所述次级学习模型的输出结果,所述次级学习模型的输出结果即为所述预测模型的输出结果。
[0016]
较优地,所述步骤s33包括:
[0017]
步骤s331,以r
x
最小为目标,用遗传算法求解出合适的个体,遗传算法的目标函数f(x)为:
[0018]
f(x)=min(r1+r2…
+r8)
[0019][0020][0021]
其中,r
x
是所述初级学习模型s
x
输出结果的修正系数,x∈[1,8],n是所述训练集中元素xi数目,r2是线性回归决定系数,p为变量的数目,为通过所述初级学习模型s
x
计算所述训练集中所述特征向量xi所得的年度工业增加值预测值,为基于所述训练集、经所述初级学习模型s
x
计算所得所有所述的均值;
[0022]
步骤s332,根据遗传算法得出的f(x)中的r
x
计算出各个所述初级学习模型s
x
的最大权重值q
x

[0023][0024]
步骤s333,所述次级学习模型的输出结果f(y)定义为:
[0025][0026]
步骤s331的计算过程包括:
[0027]
步骤s331a,种群初始化,读入原始数据,将(xi,yi)和各所述初级学习模型s
x
输出的工业增加值预测值化为种群p,遗传种群p中设置多条未进化染色体ji,ji由所述初级学习模型s
x
输出的工业增加值预测值和一组实际值(xi,yi)组成,设置种群规模n、最大遗传代数n
max
和变异率a;
[0028]
步骤s331b,计算基因适应度,以所使用算法的r
x
之和最小为目标函数,适应度函数z(x)为目标函数的倒数:
[0029][0030]
其中:
[0031][0032]
步骤s331c,遗传选择,对各所述未进化染色体ji进行计算,将结果带入所述适应度函数z(x),得到对应的适应度值;循环n次,得到n个所述适应度值,将得到的n个所述适应度值从大到小排序,用最前面的1/3代替最后面的1/3,重新形成n个子代染色体;由此,遍历遗传种群p中的任意两条染色体中的任意两个基因进行基因交叉获得进化后的子代染色体,由子代染色体构成子代遗传种群p;重复遗传选择过程,直至子代遗传种群p'中的子代染色体数量与所述子代遗传种群p中的未进化染色体的数量相同;
[0033]
步骤s331d,停止进化,当所述子代遗传种群p'中出现子代染色体适应度大于等于重组的子代染色体或高适应度染色体、或者当前进化次数达到所述最大迭代次数nmax时,停止优化,此时,f(x)达到最小,根据最小的f(x)计算出各个所述初级学习模型s
x
的所述最大权重值q
x

[0034]
本发明还提供一种基于stacking集成算法的工业增加值增速预测系统,包括:
[0035]
获取模块,用于获取样本数据,所述样本数据包括年度参数数据和年度工业增加值,所述年度参数数据包括年度经济数据和年度电力数据;
[0036]
预处理模块,用于预处理各个所述样本数据,输入至样本集;
[0037]
模型搭建模块,用于根据所述样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;
[0038]
预测模块,用于利用所述预测模型进行工业增加值增速预测;
[0039]
评估模块,用于使用波动性和准确度评估所述预测模型。
[0040]
较优地,所述样本数据记为(xi,yi),其中,xi为所述年度参数数据,yi为所述年度工业增加值实际值,i为年份,特征向量xi=[xia,xib,...,xig],xia,xib,...,xig分别为年度电力数据a、年度居民收入及消费数据b、年度社会经济数据c、年度工业开发区基本信息d、年度工业产值e、年度工业产品价格指数f、年度工业原材料均价g。
[0041]
较优地,所述预测模型包括初级学习模型和次级学习模型,所述模型搭建模块包括:
[0042]
样本集处理单元,将所述样本集划分为训练集和测试集,其中,所述测试集为本年度的样本数据,所述训练集为其他年度的样本数据;
[0043]
建立单元,建立所述初级学习模型s
x
,并将各个所初级学习模型的输出作为所述次级学习模型的输入,所述初级学习模型包括线性回归算法模型s1、决策树算法模型s2、支持向量机模型s3、k近邻算法模型s4、随机森林算法模型s5、adaboost算法模型s6、梯度回归算法模型s7和时间序列分析算法模型s8,每个所述初级学习模型通过所述训练集进行训练、
并且使用所述测试集进行测试;
[0044]
所述建立单元,建立所述次级学习模型,所述次级学习模型用于通过r2方法和遗传算法为所述初级学习模型的输出结果分配权重配置、以及设定所述次级学习模型的输出结果,所述次级学习模型的输出结果即为所述预测模型的输出结果。
[0045]
由上述技术方案可知,本发明实施例提供的基于stacking集成算法的工业增加值增速预测方法,首先获取样本数据,其中,样本数据包括年度参数数据和年度工业增加值,年度参数数据包括年度经济数据和年度电力数据;预处理各个样本数据,输入至样本集;根据样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;利用预测模型进行工业增加值增速预测;使用波动性和准确度评估预测模型。通过组合预测方法,完成预测,降低单一算法的敏感度,提高负荷预测精度。
附图说明
[0046]
图1为基于stacking集成学习算法的工业增加值增速预测方法的流程图;
[0047]
图2为系统框架图;
[0048]
图3是用来实现本实施例的基于stacking集成算法的工业增加值增速预测方法的电子设备的框图。
[0049]
图中,300、电子设备;301、计算单元;302、rom;303、ram;304、总线;305、i/o接口;306、输入单元;307、输出单元;308、存储单元;309、通信单元。
具体实施方式
[0050]
以下结合本发明的附图,对本发明的技术方案以及技术效果做进一步的详细阐述。
[0051]
本发明的目的是提供一种基于多种机器学习算法融合的工业增加值预测方法。通过收集经济数据和电力数据,并对数据进行清洗处理,之后利用线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法构建第一层模型,训练模型并对预测结果进行检验,再结合算法的预测准确度,利用改进的stacking集成学习算法构建综合预测模型。
[0052]
如图1所示,本发明提供的基于stacking集成学习算法的工业增加值增速预测方法,包括如下步骤:
[0053]
步骤s1,获取样本数据,样本数据包括年度参数数据和年度工业增加值,年度参数数据包括年度经济数据和年度电力数据;
[0054]
步骤s2,预处理各个样本数据,输入至样本集;
[0055]
步骤s3,根据样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;
[0056]
步骤s4,利用预测模型进行工业增加值增速预测;
[0057]
步骤s5,使用波动性和准确度评估预测模型。
[0058]
本发明实施例中,样本数据记为(xi,yi),其中,xi为年度参数数据,yi为年度工业
增加值实际值,i为年份,特征向量xi=[xia,xib,...,xig],xia,xib,...,xig分别为年度电力数据a、年度居民收入及消费数据b、年度社会经济数据c、年度工业开发区基本信息d、年度工业产值e、年度工业产品价格指数f、年度工业原材料均价g;样本数据是机器学习模型构建的基础,每个样本包含模型训练所需的数据。在收集样本时,为满足模型对于关联度、多维度的评价,仅收集待评价的数据是不够的,还应尽可能多的收集与之相关的数据。
[0059]
步骤s2对数据进行预处理,由于数据并非都是结构化数据,且部分数据可能存在数据的缺失或滞后,所以需要对数据进行处理。处理方法主要是删除重复值和关联填充法;对样本中重复或无效的数据,可将其剔除;对于不完整、错误或不一致的数据,因为所需数据基本都是结构化数据,可以找到和目标数据高度相关的近似数据,利用数据的关联性完成填充。例如居民收入和地区生产总值的增幅通常保持一致,居民收入数据有所缺失的情况下,可以根据地区生产总值数据的增长情况完成对居民收入数据的填充,二者可相互补充。另外,还需将数据的时间一致化。因为所需数据都和时间具有高度相关性,把所以数据按照同一时间维度进行排序。
[0060]
预测模型包括初级学习模型和次级学习模型。
[0061]
上述步骤s3分别以经济数据、发电量等作为自变量,工业增加值作为因变量,利用线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法逐一建立工业增加值模型。具体建立预测模型的过程包括:
[0062]
步骤s31,将样本集划分为训练集和测试集,其中,测试集为本年度的样本数据,训练集为其他年度的样本数据;
[0063]
步骤s32,建立初级学习模型s
x
,并将各个所初级学习模型的输出作为次级学习模型的输入,初级学习模型包括线性回归算法模型s1、决策树算法模型s2、支持向量机模型s3、k近邻算法模型s4、随机森林算法模型s5、adaboost算法模型s6、梯度回归算法模型s7和时间序列分析算法模型s8,每个初级学习模型通过训练集进行训练、并且使用测试集进行测试;
[0064]
步骤s33,建立次级学习模型,次级学习模型用于通过r2方法和遗传算法为初级学习模型的输出结果分配权重配置、以及设定次级学习模型的输出结果,次级学习模型的输出结果即为预测模型的输出结果。
[0065]
利用改进的stacking算法融合多个机器学习模型,提高整体的预测能力。传统的stacking算法通常会设计两层,第一层由多种子算法组成,第二层只有一个元模型,对第一层各种算法得出的预测值和真实值进行训练并赋予相应的权重,从而得到最终的结果。但stacking算法的缺点也很突出,很容易造成过拟合的问题。改进的stacking算法通过限定对第一层子算法权重的最大值,来避免过拟合的问题。因此,步骤s33建立次级学习模型的目的是进行算法集成,具体为:
[0066]
步骤s331,以r
x
最小为目标,用遗传算法求解出合适的个体,遗传算法的目标函数f(x)为:
[0067]
f(x)=min(r1+r2…
+r8)
[0068][0069]
[0086]
把样本集分为训练集和验证集,训练集用来训练模型,验证集用来验证模型的准确率。验证集中,预测结果和真实结果的误差范围在5%内,可视为准确,其余为不准确。
[0087]
经检验,组合预测模型的准确率高于多数单一模型预测的结果,且结果的波动性最小。可以成为预测工业增加值的方法。
[0088]
本发明通过组合预测方法扬长避短,组合预测方法通过加权把不同的算法结合起来,共同完成预测,降低单一算法的敏感度,从而提高负荷预测精度。
[0089]
本发明还提供一种基于stacking集成算法的工业增加值增速预测系统,用于实施图1所示的方法,系统包括:
[0090]
获取模块,用于获取样本数据,样本数据包括年度参数数据和年度工业增加值,年度参数数据包括年度经济数据和年度电力数据;
[0091]
预处理模块,用于预处理各个样本数据,输入至样本集;
[0092]
模型搭建模块,用于根据样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;
[0093]
预测模块,用于利用预测模型进行工业增加值增速预测;
[0094]
评估模块,用于使用波动性和准确度评估预测模型。
[0095]
其中,样本数据记为(xi,yi),其中,xi为年度参数数据,yi为年度工业增加值实际值,i为年份,特征向量xi=[xia,xib,...,xig],xia,xib,...,xig分别为年度电力数据a、年度居民收入及消费数据b、年度社会经济数据c、年度工业开发区基本信息d、年度工业产值e、年度工业产品价格指数f、年度工业原材料均价g。预测模型包括初级学习模型和次级学习模型,
[0096]
模型搭建模块包括:
[0097]
样本集处理单元,将样本集划分为训练集和测试集,其中,测试集为本年度的样本数据,训练集为其他年度的样本数据;
[0098]
建立单元,建立初级学习模型s
x
,并将各个所初级学习模型的输出作为次级学习模型的输入,初级学习模型包括线性回归算法模型s1、决策树算法模型s2、支持向量机模型s3、k近邻算法模型s4、随机森林算法模型s5、adaboost算法模型s6、梯度回归算法模型s7和时间序列分析算法模型s8,每个初级学习模型通过训练集进行训练、并且使用测试集进行测试;
[0099]
建立单元,建立次级学习模型,次级学习模型用于通过r2方法和遗传算法为初级学习模型的输出结果分配权重配置、以及设定次级学习模型的输出结果,次级学习模型的输出结果即为预测模型的输出结果。
[0100]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0101]
图3所示为可以用来实施提图1所示方法的示例电子设备300的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限
制本文中描述的和/或者要求的本公开的实现。
[0102]
如图3所示,电子设备300包括计算单元301,其可以根据存储在只读存储器(rom)302中的计算机程序或者从存储单元308加载到随机访问存储器(ram)303中的计算机程序,来执行各种适当的动作和处理。在ram303中,还可存储设备300操作所需的各种程序和数据。计算单元301、rom302以及ram303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。
[0103]
设备300中的多个部件连接至i/o接口305,包括:输入单元306,例如键盘、鼠标等;输出单元307,例如各种类型的显示器、扬声器等;存储单元308,例如磁盘、光盘等;以及通信单元309,例如网卡、调制解调器、无线通信收发机等。通信单元309允许设备300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0104]
计算单元301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元301的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元301执行上文所描述的各个方法和处理,例如机器学习模型的剪枝方法。例如,在一些实施例中,机器学习模型的剪枝方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元308。在一些实施例中,计算机程序的部分或者全部可以经由rom302和/或通信单元309而被载入和/或安装到设备300上。当计算机程序加载到ram303并由计算单元301执行时,可以执行上文描述的机器学习模型的剪枝方法的一个或多个步骤。备选地,在其他实施例中,计算单元301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行机器学习模型的剪枝方法。
[0105]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0106]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0107]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom
或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0108]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0109]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
[0110]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0111]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0112]
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

技术特征:
1.一种工业增加值增速预测方法,其特征在于,包括:步骤s1,获取样本数据,所述样本数据包括年度参数数据和年度工业增加值,所述年度参数数据包括年度经济数据和年度电力数据;步骤s2,预处理各个所述样本数据,输入至样本集;步骤s3,根据所述样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;步骤s4,利用所述预测模型进行工业增加值增速预测;步骤s5,使用波动性和准确度评估所述预测模型。2.根据权利要求1所述的工业增加值增速预测方法,其特征在于,所述样本数据记为(x
i
,y
i
),其中,x
i
为所述年度参数数据,y
i
为所述年度工业增加值实际值,i为年份,特征向量xi=[x
i
a,x
i
b,...,x
i
g],x
i
a,x
i
b,...,x
i
g分别为年度电力数据a、年度居民收入及消费数据b、年度社会经济数据c、年度工业开发区基本信息d、年度工业产值e、年度工业产品价格指数f、年度工业原材料均价g。3.根据权利要求2所述的工业增加值增速预测方法,其特征在于,所述预测模型包括初级学习模型和次级学习模型,所述步骤s3包括:步骤s31,将所述样本集划分为训练集和测试集,其中,所述测试集为本年度的样本数据,所述训练集为其他年度的样本数据;步骤s32,建立初级学习模型s
x
,并将各个所述初级学习模型的输出作为所述次级学习模型的输入,所述初级学习模型包括线性回归算法模型s1、决策树算法模型s2、支持向量机模型s3、k近邻算法模型s4、随机森林算法模型s5、adaboost算法模型s6、梯度回归算法模型s7和时间序列分析算法模型s8,每个所述初级学习模型通过所述训练集进行训练、并且使用所述测试集进行测试;步骤s33,建立所述次级学习模型,所述次级学习模型用于通过r2方法和遗传算法为所述初级学习模型的输出结果分配权重配置、以及设定所述次级学习模型的输出结果,所述次级学习模型的输出结果即为所述预测模型的输出结果。4.根据权利要求3所述的工业增加值增速预测方法,其特征在于,所述步骤s33包括:步骤s331,以r
x
最小为目标,用遗传算法求解出合适的个体,遗传算法的目标函数f(x)为:f(x)=min(r1+r2...+r8))其中,r
x
是所述初级学习模型s
x
输出结果的修正系数,x∈[1,8],n是所述训练集中元素x
i
数目,r2是线性回归决定系数,p为变量的数目,为通过所述初级学习模型s
x
计算所述训练集中所述特征向量xi所得的年度工业增加值预测值,为基于所述训练集、经所述初级学习模型s
x
计算所得所有所述的均值;
步骤s332,根据遗传算法得出的f(x)中的r
x
计算出各个所述初级学习模型s
x
的最大权重值q
x
:步骤s333,所述次级学习模型的输出结果f(y)定义为:5.根据权利要求4所述的工业增加值增速预测方法,其特征在于,所述步骤s331的计算过程包括:步骤s331a,种群初始化,读入原始数据,将(x
i
,y
i
)和各所述初级学习模型s
x
输出的工业增加值预测值化为种群p,遗传种群p中设置多条未进化染色体j
i
,j
i
由所述初级学习模型s
x
输出的工业增加值预测值和一组实际值(x
i
,y
i
)组成,设置种群规模n、最大遗传代数n
max
和变异率a;步骤s331b,计算基因适应度,以所使用算法的r
x
之和最小为目标函数,适应度函数z(x)为目标函数的倒数:其中:步骤s331c,遗传选择,对各所述未进化染色体j
i
进行计算,将结果带入所述适应度函数z(x),得到对应的适应度值;循环n次,得到n个所述适应度值,将得到的n个所述适应度值从大到小排序,用最前面的1/3代替最后面的1/3,重新形成n个子代染色体;由此,遍历遗传种群p中的任意两条染色体中的任意两个基因进行基因交叉获得进化后的子代染色体,由子代染色体构成子代遗传种群p;重复遗传选择过程,直至子代遗传种群p'中的子代染色体数量与所述子代遗传种群p中的未进化染色体的数量相同;步骤s331d,停止进化,当所述子代遗传种群p'中出现子代染色体适应度大于等于重组的子代染色体或高适应度染色体、或者当前进化次数达到所述最大迭代次数n
max
时,停止优化,此时,f(x)达到最小,根据最小的f(x)计算出各个所述初级学习模型s
x
的所述最大权重值q
x
。6.一种工业增加值增速预测系统,其特征在于,包括:获取模块,用于获取样本数据,所述样本数据包括年度参数数据和年度工业增加值,所述年度参数数据包括年度经济数据和年度电力数据;预处理模块,用于预处理各个所述样本数据,输入至样本集;模型搭建模块,用于根据所述样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;预测模块,用于利用所述预测模型进行工业增加值增速预测;
评估模块,用于使用波动性和准确度评估所述预测模型。7.根据权利要求6所述的工业增加值增速预测系统,其特征在于,所述样本数据记为(x
i
,y
i
),其中,x
i
为所述年度参数数据,y
i
为所述年度工业增加值实际值,i为年份,特征向量xi=[x
i
a,x
i
b,...,x
i
g],x
i
a,x
i
b,...,x
i
g分别为年度电力数据a、年度居民收入及消费数据b、年度社会经济数据c、年度工业开发区基本信息d、年度工业产值e、年度工业产品价格指数f、年度工业原材料均价g。8.根据权利要求7所述的工业增加值增速预测系统,其特征在于,所述预测模型包括初级学习模型和次级学习模型,所述模型搭建模块包括:样本集处理单元,将所述样本集划分为训练集和测试集,其中,所述测试集为本年度的样本数据,所述训练集为其他年度的样本数据;建立单元,建立所述初级学习模型s
x
,并将各个所初级学习模型的输出作为所述次级学习模型的输入,所述初级学习模型包括线性回归算法模型s1、决策树算法模型s2、支持向量机模型s3、k近邻算法模型s4、随机森林算法模型s5、adaboost算法模型s6、梯度回归算法模型s7和时间序列分析算法模型s8,每个所述初级学习模型通过所述训练集进行训练、并且使用所述测试集进行测试;所述建立单元,建立所述次级学习模型,所述次级学习模型用于通过r2方法和遗传算法为所述初级学习模型的输出结果分配权重配置、以及设定所述次级学习模型的输出结果,所述次级学习模型的输出结果即为所述预测模型的输出结果。9.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。10.一种存储介质,其特征在于,所述存储介质包括有存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法。

技术总结
本发明提供一种工业增加值增速预测方法、系统、电子设备和存储介质,属于工业增加值增速预测技术领域。包括:获取样本数据,所述样本数据包括年度参数数据和年度工业增加值,所述年度参数数据包括年度经济数据和年度电力数据;预处理各个所述样本数据,输入至样本集;根据所述样本集,基于Stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、AdaBoost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;利用所述预测模型进行工业增加值增速预测;使用波动性和准确度评估所述预测模型。模型。模型。


技术研发人员:马瑞 朱东歌 夏绪卫 丁茂生 沙江波 刘佳 康文妮 张爽 李兴华 闫振华 张庆平 高博 王峰 李晓龙 蔡建辉
受保护的技术使用者:国网宁夏电力有限公司电力科学研究院
技术研发日:2023.07.11
技术公布日:2023/9/26
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐