基于季节-累积气温指数的全社会用电量预测方法和系统与流程
未命名
09-22
阅读:49
评论:0
1.本发明涉及宏观经济预测技术领域,具体为一种基于“季节-累积气温指数”的全社会用电量预测方法和系统。
背景技术:
2.在用电量分析预测方面,国内外学者提出的电量预测的方法众多,大致可以划分为古典预测法、传统预测法和各种现代智能预测法。其中古典预测法包括弹性系数法、业扩报装容量推算法等;传统预测法的预测频度大多以年度和月度为主,主要方法包括时间序列法、回归分析法、灰色预测法等;随着数据处理能力的提升,现代智能模型已广泛应用于用电量预测领域,预测频度以月度和日度为主,主要方法包括神经网络预测法、支持向量机、混沌理论预测法等,其他还包括组合预测法等。
3.近年来混频预测被引入社会和经济领域,其基本原理是在官方发布相关统计数据前,尽力挖掘先行高频数据中蕴含的信息,并对未来进行预测。midas模型是目前使用比较广泛的混频预测模型,由ghysels等提出。随后,诸多学者提出了midas模型的扩展形式,例如ms-midas模型和协整midas模型。此外,还有对估计联合内生变量的混频预测模型mf-var模型。由于实际中的诸多行业都有混频预测的需求,因此混频预测已被应用到风电功率预测、轨道交通客流量预测、宏观经济预测和金融市场预测等多种领域。例如,有些学者应用多任务学习和集成分解方法对风电功率进行了混频预测。姚恩建等和包磊的交通客流量的混频预测大大提升了交通系统突发事件的应急响应能力。混频预测在宏观经济和金融市场也有广泛应用,例如张伟等和ghysel和sinko分别对宏观经济总量和金融市场波动率进行了混频预测。
4.近年来,大数据技术逐渐开始应用在用电量预测的研究中。具体来说,徐俊等(徐俊,徐文辉,曾鑫,宋乐.基于大数据挖掘电量预测方法的创新及应用[j].电力大数据,2018,21(10):57-61.)使用了气象大数据和宏观经济数据预测了湖州市某区月度用电量,预测精度达到了97.2%。santamouris等(santamouris m,cartalis c,synnefa a,et al.on the impact of urban heat island and global warming on the power demand and electricity consumption of buildings—a review[j].energy&buildings,2015,98(jul.):119-124.)的模型发现,温度每升高1度,用电量峰值将上升0.45%到4.6%。同样是应用气象大数据,魏晓川和王新刚(魏晓川,王新刚.基于气象大数据的城市电力负荷预测[j].电测与仪表,2021,58(02):90-95.)还应用了时序卷积网络和循环卷积网络等深度学习的算法预测了上海市日度用电量,将预测精度提高到了98.2%。ayub等(ayub n,irfan m,awais m,et al.big data analytics for short and medium term electricity load forecasting using ai techniques ensembler[j].energies,2020,13(19):5193.)应用了gru-cnn模型预测了iso-ne数据集的日度用电量,比sota基准模型的预测精度提升了7%。还有学者将一些新型数据源,例如夜间光照遥感数据,应用到了用电量预测的模型中,预测了云南某自治州的年度用电量。
[0005]
总体来看,现有方法在数据使用上大多以电力系统内部数据为主,使用电力价格的历史数据进行建模预测。已有应用大数据进行用电量预测的文献中,大多应用气象大数据或遥感大数据等自然环境的数据。现有文献大多选取特定季节使用气温数据进行局部样本区间的预测,仍未考虑到利用多源高频大数据等信息改进预测模型,因此预测精度有望进一步提高。
技术实现要素:
[0006]
为了提高现有模型对全社会用电量的预测精度,本发明提供一种基于“季节-累积气温指数”的全社会用电量预测方法。本发明利用高频气温数据构建了考虑季节和用电行为惯性的“季节-累积气温指数”,并提出了基于多源大数据的混频预测模型(midas-mt-dt)。
[0007]
本发明解决其技术问题所采用的技术方案:
[0008]
一种基于季节-累积气温指数的全社会用电量预测方法,包括以下步骤:
[0009]
采集历史数据中的日度气温数据、日度全社会用电量数据、月度气温数据和月度全社会用电量数据;
[0010]
将日度气温数据经过累积效应变换和季节效应变换,得到日度气温指数;
[0011]
将月度气温数据经过季节效应变换,得到月度气温指数;
[0012]
以月度气温指数和月度全社会用电量数据的滞后期作为低频预测变量,以日度气温指数和日度全社会用电量数据作为高频预测变量,利用低频预测变量和高频预测变量预测月度全社会用电量。
[0013]
进一步地,所述将日度气温数据经过累积效应变换和季节效应变换,其中累积效应变换的公式为:
[0014][0015]
其中,是经过累积效应变换的第m个月第i天的日度气温指数;t
i,m
是第m个月第i天的原始日度气温数据;j表示当日的前j日,j的取值为1,2,3,4;n为第m-1个月的总天数。
[0016]
进一步地,所述将日度气温数据经过累积效应变换和季节效应变换,其中季节效应变换的公式为:
[0017]
对于对于秦岭淮河以南的南方地区:
[0018][0019]
对于对于秦岭淮河以北的北方地区:
[0020]
[0021]
其中,sc_t
i,m
是经过累积效应变换和季节效应变换的第m个月第i天的日度气温指数,n为第m个月的总天数。
[0022]
进一步地,所述将月度气温数据经过季节效应变换,得到月度气温指数,其中季节效应变换的公式为:
[0023]
对于对于秦岭淮河以南的南方地区:
[0024][0025]
对于对于秦岭淮河以北的北方地区:
[0026][0027]
其中,s_tm是第m个月的经过季节效应变换的月度气温指数,tm是第m个月的月度气温数据。
[0028]
进一步地,所述利用低频预测变量和高频预测变量预测月度全社会用电量,包括:对midas模型进行改进,得到基于季节-累积气温指数的全社会用电量混频预测模型,利用该全社会用电量混频预测模型进行月度全社会用电量预测。
[0029]
进一步地,所述全社会用电量混频预测模型采用的公式为:
[0030][0030][0032]
其中,y
m,t
是第t月的月度全社会用电量,s_t
t
是第t月经季节效应变换的月度气温指数,y
d,n,t
是第t月第n天的日度全社会用电量,sc_t
n,t
是经累积效应变换和季节效应变换的第t月第n天的日度气温指数,wi(θ)是midas模型的高频变量滞后的权重多项式,θ是多项式的估计参数,且μ、μ
j+1
、β、β
j+1
、δ是模型需要估计的参数,py和p
x
是aic准则选出的模型最佳滞后期数,i、j是求和算子之中的整数,u
t+1
是模型的随机误差。
[0033]
一种基于季节-累积气温指数的全社会用电量预测系统,包括:
[0034]
数据采集模块,用于采集历史数据中的日度气温数据、日度全社会用电量数据、月度气温数据和月度全社会用电量数据;
[0035]
气温指数构建模块,用于将日度气温数据经过累积效应变换和季节效应变换,得到日度气温指数;将月度气温数据经过季节效应变换,得到月度气温指数;
[0036]
混频预测模块,用于以月度气温指数和月度全社会用电量数据的滞后期作为低频预测变量,以日度气温指数和日度全社会用电量数据作为高频预测变量,利用低频预测变量和高频预测变量预测月度全社会用电量。
[0037]
本发明的有益效果是,midas-mt-dt模型相比传统方法具有更高的预测精度,且季节-累积气温指数具有提高预测精度的能力。本发明利用高频气温大数据构建了考虑季节
和用电行为惯性的“季节-累积气温指数”,可以更加精准地反映受气温影响的用电行为。此外,本发明还引入了全社会用电量的高频日度数据进行预测模型的构建,作为除气温影响之外的其他模式的用电行为进行补充。为了综合应用以上两种高频大数据,本发明提出了基于“季节-累积气温指数”的全社会用电量混频预测模型(midas-mt-dt),该模型与现有模型相比具有更高的预测准确度。
附图说明
[0038]
图1是本发明的方法流程图。
具体实施方式
[0039]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面通过具体实施例和附图,对本发明做进一步详细说明。
[0040]
图1是本发明的方法流程图。本发明的方法主要包括三个步骤:数据采集与预处理、气温指数构建和混频预测模型。具体来说:
[0041]
1)数据采集与预处理部分,主要需要收集历史数据中的月度全社会用电量数据、月度气温数据、日度气温数据和日度全社会用电量数据。
[0042]
2)气温指数构建部分,月度气温数据经过季节效应变换后被构建为月度气温指数,日度气温数据经过累积效应变换和季节效应变换后,被构建为日度气温指数。
[0043]
3)混频预测模型中,月度全社会用电量数据作为模型的被预测变量,低频预测变量包括月度气温指数和月度全社会用电量数据的滞后期,高频预测变量包括日度气温指数和日度全社会用电量数据。其中,月度全社会用电量数据的滞后期是指待预测的时间点之前的变量值。例如,如果需要预测10月的全社会用电量,那么当年9月的全社会用电量为滞后1期,8月的为滞后2期
……
以此类推。
[0044]
本发明的全社会用电量混频预测模型中使用的高频大数据包括:1)日度全社会用电量;2)当地气温数据,包括日度最高气温和月平均气温取均值。其中,“取均值”是指分别收集当地邻近几个地级市的日度最高气温和月平均气温,然后分别将这些地级市的日度最高气温和月平均气温都取均值,其中日度最高气温的均值用作高频变量,月平均气温的均值用作低频变量。
[0045]
结合季节变化可以分析出用电行为具有以下两方面特点:
[0046]
(1)累积效应:用电行为具有一定的惯性,前几日使用空调的行为往往会在短时间内延续下去,因此前几日的气温对当日的用电量有一定的影响。
[0047]
(2)季节效应:当气温高于舒适温度时,工业生产、商业和居民部门都需要使用空调进行降温。同时,对于对于秦岭淮河以南的南方地区(例如福建省),冬季当气温低于舒适温度时,也需要使用空调进行采暖。综合来说,夏季气温应与用电量正相关,冬季气温与用电量负相关。
[0048]
基于上述两个思路,首先,对日度气温数据进行累积效应的变换。考虑到当日的用电行为可能受到前4日气温的影响,且影响的效应应随着时间逐渐减弱,因此设定当日的气温指数是前4日气温的加权之和,其中权重随着时间呈指数下降趋势。具体来说,日度气温数据的累积效应变换方法为:
[0049][0050]
其中,是经过累积效应变换的第m个月第i天的日度气温指数,t
i,m
是第m个月第i天的原始日度气温数据,j表示当日的前j日,j的取值为1,2,3,4。n为第m-1个月的总天数。
[0051]
然后,对月度气温数据和已进行累积效应变换的日度气温数据进行季节效应的转换。南方地区每年的5月至9月属于夏季,气温与用电量正相关,因此保持不变;每年的1月至3月以及10月至12月属于冬季,气温与用电量负相关,因此将气温原始数据取负号,再将取负号的气温指数向上平移,以保持气温指数的连续性。具体来说,对于月度气温数据,对原始气温数据进行如下季节效应的变换(适用于秦岭淮河以南的南方地区):
[0052][0053]
其中,s_tm是第m个月的经过季节效应变换的月度气温指数,tm是属于第m个月的月度气温数据。
[0054]
上述季节效应变换方法(公式(2))可根据被预测地区的季节情况,对m的取值进行调整。例如,秦岭淮河以北的北方地区的夏季为6-8月,那么公式(2)可相应调整为:
[0055][0056]
对于日度气温数据,对已经过累积效应变换的日度气温指数进行如下季节效应的变换(适用于秦岭淮河以南的南方地区):
[0057][0058]
其中,sc_t
i,m
是经过累积效应变换和季节效应变换的第m个月第i天的日度气温指数,n为第m个月的总天数。
[0059]
同样,对于对于秦岭淮河以北的北方地区,公式(3)可相应调整为:
[0060][0061]
为了综合应用高频气温数据和高频用电量数据,本发明对ghysels等(ghysels e,santa-clara p,valkanov r.the midas touch:mixed data sampling regression models[r].uc los angeles:finance.http://escholarship.org/uc/item/9mf223rs,2004.)的midas模型进行改进,提出基于“季节-累积气温指数”的全社会用电量混频预测模型(midas-mt-dt),模型的公式为:
[0062]
[0064]
其中,y
m,t
是第t月的月度全社会用电量,s_t
t
是第t月经季节效应变换的月度气温指数,y
d,n,t
是第t月第n天的日度全社会用电量,sc_t
n,t
是经累积效应变换和季节效应变换的第t月第n天的日度气温指数。wi(θ)是midas模型的高频变量滞后的权重多项式,θ是多项式的估计参数,且μ、μ
j+1
、β、β
j+1
、δ是模型需要估计的参数,py和p
x
是aic准则选出的模型最佳滞后期数(aic准则由h.akaike于1974年提出,用来衡量统计模型的拟合优良性),i、j是求和算子之中的整数,u
t+1
是模型的随机误差。
[0065]
本发明的一个实施例中,选取的滞后权重多项式是almon多项式,具体公式为:
[0066][0067]
其中,i是公式(4)中第t月的高频数据的阶数,θ1和θ2是多项式的参数。
[0068]
以下是使用福建省全社会用电量和福建省9个地级市气温大数据验证的技术效果。选取福建省月度全社会用电量作为被预测变量。预测模型中使用的高频大数据包括:1)福建省日度全社会用电量;2)气温数据收集的地区范围是福建省的厦门市、莆田市、福州市、南平市、泉州市、宁德市、龙岩市、三明市、漳州市。分别将这九个城市的日度最高气温和月平均气温取均值,作为原始的日度气温指数和月度气温指数。
[0069]
对比实验的模型说明和模型设定如表1所示:
[0070]
表1对比实验的模型设定
[0071][0072]
对比实验中使用的预测精度指标是平均绝对百分误差(mean absolute percentage error,mape),由以下公式进行计算:
[0073][0074]
其中,和x
t
分别代表预测模型的预测值和真实值。
[0075]
为了验证midas-mt-dt模型的预测能力,分别比较加入日度、月度气温指数和不加
入气温指数的midas混频模型的预测精度。经过实证数据的估计,模型的相关参数在表注中说明。模型预测结果如表2所示。其中,表格第一列代表模型的测试期,对应的训练期即为样本开始至测试期的上一期;表格中的百分比代表对应模型的预测精度指标mape。
[0076]
表2混频模型预测结果
[0077]
模型测试期midasmidas-mtmidas-dtmidas-mt-dt2020.1-2020.383.21%86.15%90.86%86.15%2020.4-2020.696.54%93.35%94.00%98.39%2020.7-2020.994.45%94.91%94.30%96.29%2020.10-2020.1194.23%95.62%89.58%94.18%
[0078]
注:表2中标粗的数字表示相比基准模型,预测精度有所改善的模型。
[0079]
midas模型高频数据的最大滞后阶数是15,月度气温指数的滞后阶数是2。
[0080]
根据表2中的结果可以看出,在所有测试样本期内,无论是加入日度气温指数还是月度气温指数,相比传统的混频模型midas模型,模型的预测精度均有明显的提升。其中,预测精度最高达到了98.39%。此外,midas-mt模型和midas-mt-dt模型在四个样本期内的其中三个都获得了相比基准模型更高的预测精度;然而,midas-dt模型仅有其中一个样本期获得了更高的预测精度。这说明相比日度气温指数,月度气温指数的预测能力更强。综合表2的结果说明,通过引入高频气温数据和高频用电量数据,本发明提出的midas-mt-dt模型显著提高了全社会用电量的预测精度,具有较好的应用价值。
[0081]
本发明的“季节-累积气温指数”中的累积效应变换方法(公式(1))可根据预测效果进行相应调整。如果该方法应用于其他数据集,可根据训练效果对j的取值进行调整。
[0082]
本发明的另一个实施例提供一种基于季节-累积气温指数的全社会用电量预测系统,其包括:
[0083]
数据采集模块,用于采集历史数据中的日度气温数据、日度全社会用电量数据、月度气温数据和月度全社会用电量数据;
[0084]
气温指数构建模块,用于将日度气温数据经过累积效应变换和季节效应变换,得到日度气温指数;将月度气温数据经过季节效应变换,得到月度气温指数;
[0085]
混频预测模块,用于以月度气温指数和月度全社会用电量数据的滞后期作为低频预测变量,以日度气温指数和日度全社会用电量数据作为高频预测变量,利用低频预测变量和高频预测变量预测月度全社会用电量。
[0086]
其中各模块的具体实施过程参见前文对本发明方法的描述。
[0087]
本发明的另一实施例提供一种计算机设备(计算机、服务器、智能手机等),其包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行本发明方法中各步骤的指令。
[0088]
本发明的另一实施例提供一种计算机可读存储介质(如rom/ram、磁盘、光盘),所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现本发明方法的各个步骤。
[0089]
以上公开的本发明的具体实施例,其目的在于帮助理解本发明的内容并据以实施,本领域的普通技术人员可以理解,在不脱离本发明的精神和范围内,各种替换、变化和修改都是可能的。本发明不应局限于本说明书的实施例所公开的内容,本发明的保护范围
以权利要求书界定的范围为准。
技术特征:
1.一种基于季节-累积气温指数的全社会用电量预测方法,其特征在于,包括以下步骤:采集历史数据中的日度气温数据、日度全社会用电量数据、月度气温数据和月度全社会用电量数据;将日度气温数据经过累积效应变换和季节效应变换,得到日度气温指数;将月度气温数据经过季节效应变换,得到月度气温指数;以月度气温指数和月度全社会用电量数据的滞后期作为低频预测变量,以日度气温指数和日度全社会用电量数据作为高频预测变量,利用低频预测变量和高频预测变量预测月度全社会用电量。2.根据权利要求1所述的方法,其特征在于,所述将日度气温数据经过累积效应变换和季节效应变换,其中累积效应变换的公式为:其中,是经过累积效应变换的第m个月第i天的日度气温指数;t
i,m
是第m个月第i天的原始日度气温数据;j表示当日的前j日,j的取值为1,2,3,4;n为第m-1个月的总天数。3.根据权利要求2所述的方法,其特征在于,所述将日度气温数据经过累积效应变换和季节效应变换,其中季节效应变换的公式为:对于对于秦岭淮河以南的南方地区:对于对于秦岭淮河以北的北方地区:其中,sc_t
i,m
是经过累积效应变换和季节效应变换的第m个月第i天的日度气温指数,n为第m个月的总天数。4.根据权利要求1所述的方法,其特征在于,所述将月度气温数据经过季节效应变换,得到月度气温指数,其中季节效应变换的公式为:对于对于秦岭淮河以南的南方地区:对于对于秦岭淮河以北的北方地区:其中,s_t
m
是第m个月的经过季节效应变换的月度气温指数,t
m
是第m个月的月度气温数据。
5.根据权利要求1所述的方法,其特征在于,所述利用低频预测变量和高频预测变量预测月度全社会用电量,包括:对midas模型进行改进,得到基于季节-累积气温指数的全社会用电量混频预测模型,利用该全社会用电量混频预测模型进行月度全社会用电量预测。6.根据权利要求5所述的方法,其特征在于,所述全社会用电量混频预测模型采用的公式为:其中,y
m,t
是第t月的月度全社会用电量,s_t
t
是第t月经季节效应变换的月度气温指数,y
d,n,t
是第t月第n天的日度全社会用电量,sc_t
n,t
是经累积效应变换和季节效应变换的第t月第n天的日度气温指数,w
i
(θ)是midas模型的高频变量滞后的权重多项式,θ是多项式的估计参数,且μ、μ
j+1
、β、β
j+1
、δ是模型需要估计的参数,p
y
和p
x
是aic准则选出的模型最佳滞后期数,i、j是求和算子之中的整数,u
t+1
是模型的随机误差。7.根据权利要求6所述的方法,其特征在于,w
i
(θ)采用almon多项式,具体公式为:其中,i是第t月的高频数据的阶数,θ1和θ2是多项式的参数。8.一种基于季节-累积气温指数的全社会用电量预测系统,其特征在于,包括:数据采集模块,用于采集历史数据中的日度气温数据、日度全社会用电量数据、月度气温数据和月度全社会用电量数据;气温指数构建模块,用于将日度气温数据经过累积效应变换和季节效应变换,得到日度气温指数;将月度气温数据经过季节效应变换,得到月度气温指数;混频预测模块,用于以月度气温指数和月度全社会用电量数据的滞后期作为低频预测变量,以日度气温指数和日度全社会用电量数据作为高频预测变量,利用低频预测变量和高频预测变量预测月度全社会用电量。9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1~7中任一项所述方法的指令。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现权利要求1~7中任一项所述的方法。
技术总结
本发明涉及一种基于季节-累积气温指数的全社会用电量预测方法和系统。该方法包括:采集历史数据中的日度气温数据、日度全社会用电量数据、月度气温数据和月度全社会用电量数据;将日度气温数据经过累积效应变换和季节效应变换,得到日度气温指数;将月度气温数据经过季节效应变换,得到月度气温指数;以月度气温指数和月度全社会用电量数据的滞后期作为低频预测变量,以日度气温指数和日度全社会用电量数据作为高频预测变量,利用低频预测变量和高频预测变量预测月度全社会用电量。本发明提出了基于“季节-累积气温指数”的全社会用电量混频预测模型(MIDAS-MT-DT),该模型与现有模型相比具有更高的预测准确度。模型相比具有更高的预测准确度。模型相比具有更高的预测准确度。
技术研发人员:李雪蓉 尚维 马国真 单葆国 王向
受保护的技术使用者:国网河北省电力有限公司经济技术研究院 国网能源研究院有限公司
技术研发日:2022.10.17
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/