一种基于PCA-SFFS-BiGRU的光伏出力预测方法与流程

未命名 09-22 阅读:68 评论:0

一种基于pca-sffs-bigru的光伏出力预测方法
技术领域
1.本发明涉及数据处理领域,特别涉及一种基于pca-sffs-bigru的光伏出力预测方法。


背景技术:

2.新能源出力的准确预测对于电力系统的高效安全运行非常重要,同时,在大多数电力市场中,更好的光伏发电预测还可以减少对储备市场平衡能源的需求,从而避免了高昂的用能成本,提高光伏电站的盈利能力。因此,准确预测光伏电站出力对使其最佳地融入电力系统和电力市场至关重要。
3.尽管近年来光伏预测方法有了显著的改进,但仍然存在较大误差,特别是在长时间范围内,现阶段的光伏出力预测方法基本上是发展统计方法,往往忽略了利用气象数据信息提高预测准确性的潜力。因此,对气象数据信息进行深度的处理有助于光伏出力预测,但由于气象数据通常维度较多,其中夹杂部分对光伏出力影响较小的成分,如一同处理将导致计算量较大而准确率偏低,如进行分割又难以确定每个分量的影响程度,无法保证预测效果。


技术实现要素:

[0004] 针对现有技术在光伏出力预测中气象数据信息维度较多,处理效率较低的同时预测准确率偏低的问题,本发明提供了一种基于pca-sffs-bigru的光伏出力预测方法,基于主成分分析(principal component analysis,pca)和序列前向特征选择算法(sequential forward feature selection,sffs)分阶段降低数据维度,保留对光伏处理影响较大的主成分,并构建双向门控神经网络(bidirectional gated recurrent unit,bigru),使用粒子群优化算法进行优化,最终得到光伏出力预测模型,既提高了处理效率,又提高了预测准确率。
[0005]
以下是本发明的技术方案。
[0006]
一种基于pca-sffs-bigru的光伏出力预测方法,包括以下步骤:s1:获取天气预报的气象数据,进行预处理后得到气象参数;s2:通过空间和时间权重的线性组合分解每一个气象参数,对各气象参数进行主成分分析,根据总方差确定每个气象参数保留的若干主成分,得到降维后的气象参数,组成第一特征集;s3:对第一特征集使用序列前向特征选择算法进一步提取主成分分量,得到第二特征集;s4:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,按照距离相关性对主成分降序排列,使用相关性值最高的若干主成分再次启动序列前向特征选择算法,得到第三特征集;s5:构建双向门控神经网络,利用第三特征集和历史功率进行训练,并使用粒子群
优化算法优化双向门控神经网络,得到光伏出力预测模型;s6:获取待预测时段的天气预报的气象数据并执行s1至s4后,输入至光伏出力预测模型,输出光伏发电功率的预测值。
[0007]
本发明中,通过主成分分析对气象参数进行第一次降维处理,在考虑光伏出力之前,先剔除气象参数中对其本身的特征表达影响较小的成分;在此基础上考虑光伏预测能力,利用序列前向特征选择算法进一步提取主成分分量,得到第二特征集;再利用保留的主成分和观测到的光伏出力之间的距离相关性进行排序筛选,进一步执行序列前向特征选择算法,得到第三特征集;最后利用优化后的双向门控神经网络进行训练,得到光伏出力预测模型,实现光伏发电功率的预测。
[0008]
作为优选,所述s1:获取天气预报的气象数据,进行预处理后得到气象参数,包括:将天气预报的气象数据中的重复、冗余数据做删除处理;根据气象数据的特点,使用拉依达准则对异常数据进行辨识,设相关气象数据集服从正态分布,设置分布区间,将所设区间外的数据标识为异常数据,并通过均值法修正原始数据集;对处理后的气象数据进行数据归一化处理,得到气象参数。
[0009]
作为优选,所述s2:通过空间和时间权重的线性组合分解每一个气象参数,对各气象参数进行主成分分析,根据总方差确定每个气象参数保留的若干主成分,得到降维后的气象参数,组成第一特征集,包括:对于每一个具有第j个空间点和时间依赖性的气象参数,通过空间和时间权重的线性组合分解:;式中,z为气象参数,为主成分的得分,为协方差矩阵的特征向量,n为空间总点数;计算总方差及每个主成分的方差解释率,根据方差解释率进行降序排序并依次相加,当总解释率达到预设标准时停止,剔除未被相加的主成分,保留已被相加的主成分,得到降维后的气象参数,组成第一特征集。
[0010]
作为优选,所述s3:对第一特征集使用序列前向特征选择算法进一步提取主成分分量,得到第二特征集,包括:创建一个空的最优特征子集;在每次迭代过程中,将第一特征集每个校准周期内的数据分割为训练数据和测试数据,采用十倍交叉验证法分别进行训练和验证,选择在校准周期内标准均方根误差检验值最小的气象参数主成分加入最优特征子集,如下式所示:
;式中,nrmse为标准均方根误差检验值,t表示预测时段数,和分别表示时刻的光伏出力预测值和观测值;每当有新的主成分加入后,基于更新的最优特征子集重新计算标准均方根误差检验值,若数值未下降则移除最新加入的主成分,否侧仍然保留;继续迭代直至遍历第一特征集,将此时的最优特征子集作为第二特征集。
[0011]
作为优选,在执行s4之前,还包括:从加入过最优特征子集但被移除的主成分中随机选择若干主成分,加入第二特征集。
[0012]
在本发明中,由于需要从不同的影响层面进行多次数据降维,虽然对于每次降维操作来说均保留了最有价值的部分,但简单的累积降维操作叠加后,每次降维的误差或影响容易被放大,因此在最后一次降维之前,将部分被剔除的主成分还原,以平衡多次降维可能出现的数据精简过度问题。而加入过最优特征子集但被移除的主成分,表示其在交叉验证过程中,通过了单个主成分的检验,未通过整体最优特征子集的校验,具有一定的预测价值,从中选取部分进行还原,可以略微提高数据维度。
[0013]
作为优选,所述s4:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,按照距离相关性对主成分降序排列,使用相关性值最高的若干主成分再次启动序列前向特征选择算法,得到第三特征集,包括:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,所述距离相关性的结果范围从0到1,结果越接近1则表示主成分和观测到的光伏出力之间的线性关系越强;按照距离相关性对主成分降序排列,选择相关性值最高的若干主成分,再次启动序列前向特征选择算法,选择最小化目标函数的若干主成分构成第三特征集。
[0014]
作为优选,所述s5:构建双向门控神经网络,利用第三特征集和历史功率进行训练,并使用粒子群优化算法优化双向门控神经网络,得到光伏出力预测模型,包括:构建由两个相反方向的门控神经网络单元组成的双向门控神经网络,其中正向门控神经网络单元从特征序列的首部开始向尾部移动,反向门控神经网络单元从特征序列的尾部开始向首部移动;输入第三特征集和历史功率进行训练,同时使用粒子群优化算法优化双向门控神经网络,得到最优参数组合;基于最优参数组合优化双向门控神经网络,并训练得到光伏出力预测模型。
[0015]
作为优选,所述s5中,使用粒子群优化算法优化双向门控神经网络,包括:设置学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数的取值范围,并设置种群规模、惯性权重、让粒子意识到局部最优解的加速因子、让粒子意识到全局最优解
的加速因子的数值;以学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数作为维度,随机生成多维种群粒子,初始化粒子的位置和速度,利用适应度函数计算每个粒子的适应度值;利用更新公式更新粒子的位置和速度,并通过比较持续更新局部最优解,将具有最小适应度值的粒子的局部最优解作为全局最优解;在一个迭代完成后,每一个粒子得到自身局部最优解,再将其与全局最优解进行比较,如果存在局部最优解优于全局最优解,就将全局最优解替换成局部最优解,最终生成的最优粒子就是最优参数组合,得到学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数。
[0016]
本发明还提供一种基于pca-sffs-bigru的光伏出力预测系统,用于执行上述的一种基于pca-sffs-bigru的光伏出力预测方法,包括:数据预处理单元,用于获取天气预报的气象数据,进行预处理后得到气象参数;主成分分析单元,用于通过空间和时间权重的线性组合分解每一个气象参数,对各气象参数进行主成分分析,根据总方差确定每个气象参数保留的若干主成分,得到降维后的气象参数,组成第一特征集;第一选择单元,用于对第一特征集使用序列前向特征选择算法进一步提取主成分分量,得到第二特征集;第二选择单元,用于计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,按照距离相关性对主成分降序排列,使用相关性值最高的若干主成分再次启动序列前向特征选择算法,得到第三特征集;训练单元,用于构建双向门控神经网络,利用第三特征集和历史功率进行训练,并使用粒子群优化算法优化双向门控神经网络,得到光伏出力预测模型;数据交互单元,用于获取待预测时段的天气预报的气象数据经过数据预处理单元、主成分分析单元、第一选择单元、第二选择单元后,输入至光伏出力预测模型,输出光伏发电功率的预测值。
[0017]
作为优选,所述数据预处理单元被配置为执行以下步骤,包括:将天气预报的气象数据中的重复、冗余数据做删除处理;根据气象数据的特点,使用拉依达准则对异常数据进行辨识,设相关气象数据集服从正态分布,设置分布区间,将所设区间外的数据标识为异常数据,并通过均值法修正原始数据集;对处理后的气象数据进行数据归一化处理,得到气象参数。
[0018]
作为优选,所述主成分分析单元被配置为执行以下步骤,包括:对于每一个具有第j个空间点和时间依赖性的气象参数,通过空间和时间权重的线性组合分解:;式中,z为气象参数,为主成分的得分,为协方差矩阵的特征向量,n为空间总点数;
计算总方差及每个主成分的方差解释率,根据方差解释率进行降序排序并依次相加,当总解释率达到预设标准时停止,剔除未被相加的主成分,保留已被相加的主成分,得到降维后的气象参数,组成第一特征集。
[0019]
作为优选,所述第一选择单元被配置为执行以下步骤,包括:创建一个空的最优特征子集;在每次迭代过程中,将第一特征集每个校准周期内的数据分割为训练数据和测试数据,采用十倍交叉验证法分别进行训练和验证,选择在校准周期内标准均方根误差检验值最小的气象参数主成分加入最优特征子集,如下式所示:;式中,nrmse为标准均方根误差检验值,t表示预测时段数,和分别表示时刻的光伏出力预测值和观测值;每当有新的主成分加入后,基于更新的最优特征子集重新计算标准均方根误差检验值,若数值未下降则移除最新加入的主成分,否侧仍然保留;继续迭代直至遍历第一特征集,将此时的最优特征子集作为第二特征集。
[0020]
作为优选,还包括数据还原单元,所述数据还原单元被配置为执行以下步骤,包括:从加入过最优特征子集但被移除的主成分中随机选择若干主成分,加入第二特征集。
[0021]
作为优选,所述第二选择单元被配置为执行以下步骤,包括:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,所述距离相关性的结果范围从0到1,结果越接近1则表示主成分和观测到的光伏出力之间的线性关系越强;按照距离相关性对主成分降序排列,选择相关性值最高的若干主成分,再次启动序列前向特征选择算法,选择最小化目标函数的若干主成分构成第三特征集。
[0022]
作为优选,所述训练单元被配置为执行以下步骤,包括:构建由两个相反方向的门控神经网络单元组成的双向门控神经网络,其中正向门控神经网络单元从特征序列的首部开始向尾部移动,反向门控神经网络单元从特征序列的尾部开始向首部移动;输入第三特征集和历史功率进行训练,同时使用粒子群优化算法优化双向门控神经网络,得到最优参数组合;基于最优参数组合优化双向门控神经网络,并训练得到光伏出力预测模型。
[0023]
作为优选,所述训练单元还被配置为执行以下步骤,包括:设置学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数的取值范围,并设置种群规模、惯性权重、让粒子意识到局部最优解的加速因子、让粒子意识到全局最优解的加速因子的数值;
以学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数作为维度,随机生成多维种群粒子,初始化粒子的位置和速度,利用适应度函数计算每个粒子的适应度值;利用更新公式更新粒子的位置和速度,并通过比较持续更新局部最优解,将具有最小适应度值的粒子的局部最优解作为全局最优解;在一个迭代完成后,每一个粒子得到自身局部最优解,再将其与全局最优解进行比较,如果存在局部最优解优于全局最优解,就将全局最优解替换成局部最优解,最终生成的最优粒子就是最优参数组合,得到学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数。
[0024]
本发明还提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述的一种基于pca-sffs-bigru的光伏出力预测方法的步骤。
[0025]
本发明还提供一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现上述的一种基于pca-sffs-bigru的光伏出力预测方法的步骤。
[0026]
本发明的实质性效果包括:本发明中,通过主成分分析对气象参数进行第一次降维处理,在考虑光伏出力之前,先剔除气象参数中对其本身的特征表达影响较小的成分,便于降低后续的计算量;在此基础上考虑光伏预测能力,利用序列前向特征选择算法进一步提取主成分分量,得到第二特征集,可以筛选出与光伏预测关联性较大的数据;再利用保留的主成分和观测到的光伏出力之间的距离相关性进行排序筛选,进一步执行序列前向特征选择算法,得到第三特征集,可以得到与光伏出力之间最相关的数据。
[0027]
同时,在上述处理的基础上,将粒子群优化算法和双向门控循环神经网络进行结合,使用算法实现模型的自动化寻优过程,得到光伏出力预测模型,实现光伏发电功率的预测,与传统的神经网络相比,双向门控神经网络可以双向结合过去的信息与未来的信息,从而使得模型可以从时间序列中提取到更高级的特征,具有精度高、速度快、可扩展性高等优点,再叠加层层筛选后的特征集,进一步提高在光伏出力预测准确性。
[0028]
另外,由于本发明需要从不同的影响层面进行多次数据降维,虽然对于每次降维操作来说均保留了当下最有价值的部分,但简单的累积降维操作叠加后,每次降维的误差或影响容易被放大,因此在最后一次降维之前,将部分被剔除的主成分还原,以平衡多次降维可能出现的数据精简过度问题。而加入过最优特征子集但被移除的主成分,表示其在交叉验证过程中,通过了单个主成分的检验,未通过整体最优特征子集的校验,具有一定的预测价值,从中选取部分进行还原,可以略微提高数据维度,进而降低前一次降维的误差对下一次降维的影响,既保证了从不同角度进行降维的效果,又保证了整体的数据质量。
附图说明
[0029]
图1是本发明实施例的流程图;图2是本发明实施例的数据流示意图;图3是本发明实施例的gru神经网络结构图;图4是本发明实施例的bigru神经网络结构图。
具体实施方式
[0030]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合实施例,对本技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0031]
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0032]
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0033]
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含a、b和c”、“包含a、b、c”是指a、b、c三者都包含,“包含a、b或c”是指包含a、b、c三者之一,“包含a、b和/或c”是指包含a、b、c三者中任1个或任2个或3个。
[0034]
下面以具体的实施例对本发明的技术方案进行详细说明。实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
[0035]
实施例一:如图1至图4所示,是一种基于pca-sffs-bigru的光伏出力预测方法,包括以下步骤s1-s6,具体地:s1:获取天气预报的气象数据,进行预处理后得到气象参数,包括:将天气预报的气象数据中的重复、冗余数据做删除处理;在本实施例中,利用排序算法将数据按照一定的顺序进行排序,然后删除相邻相等的元素,以达到去重的效果。例如,对于一个整数数组,可以按照升序或降序进行排序,然后删除相邻相等的元素。
[0036]
根据气象数据的特点,使用拉依达准则对异常数据进行辨识,设相关气象数据集服从正态分布,设置分布区间,将所设区间外的数据标识为异常数据,并通过均值法修正原始数据集;如下式所示:;;;式中,p表示概率,表示原始气象数据集数据,表示原始数据均值,表示原
始数据标准差。拉依达法则表明,如果的值超过了这个区间,那么就可以把这个数据当作异常数据进行处理,使用原始数据的平均值代替该异常值。之后,对余下的各测量值重新计算偏差和标准偏差,并继续审查,直到各个偏差均小于3为止。
[0037]
对处理后的气象数据进行数据归一化处理,得到气象参数。如下式所示:;式中,为归一化值,为原值,和分别为第个格点的均值和标准差。
[0038] s2:通过空间和时间权重的线性组合分解每一个气象参数,对各气象参数进行主成分分析(pca),根据总方差确定每个气象参数保留的若干主成分,得到降维后的气象参数,组成第一特征集,包括:对于每一个具有第j个空间点和时间依赖性的气象参数,通过空间和时间权重的线性组合分解:;式中,z为气象参数,为主成分的得分,为协方差矩阵的特征向量,n为空间总点数;pca的应用旨在检测最相关的时空天气变率模式,同时通过降低方差百分比来消除发生在主成分中的局部效应的影响,因此本方法使用主成分分析进行数据集降维。
[0039]
计算总方差及每个主成分的方差解释率,根据方差解释率进行降序排序并依次相加,当总解释率达到预设标准时停止,剔除未被相加的主成分,保留已被相加的主成分,得到降维后的气象参数,组成第一特征集。根据总方差确定每个气象参数保留的主成分数量。通常,出于预测目的,所使用的总方差范围为80%至95%,因此保留每个气象变量总方差90%以上的主成分。
[0040] s3:对第一特征集使用序列前向特征选择算法(sffs)进一步提取主成分分量,得到第二特征集,包括:创建一个空的最优特征子集;在每次迭代过程中,将第一特征集每个校准周期内的数据分割为训练数据和测试数据,采用十倍交叉验证法分别进行训练和验证,选择在校准周期内标准均方根误差检验值最小的气象参数主成分加入最优特征子集,如下式所示:
;式中,nrmse为标准均方根误差检验值,t表示预测时段数,和分别表示时刻的光伏出力预测值和观测值;每当有新的主成分加入后,基于更新的最优特征子集重新计算标准均方根误差检验值,若数值未下降则移除最新加入的主成分,否侧仍然保留;继续迭代直至遍历第一特征集,将此时的最优特征子集作为第二特征集。
[0041]
例如,将数据集分成十份,其中九份用于训练模型,一份用于测试模型。对于每个特征,依次将其作为模型的输入特征,其余特征作为模型的辅助特征,使用十倍交叉验证方法在训练集上训练模型,并在测试集上评估模型的性能,再通过上述的验证过程筛选出保留的特征。
[0042] s4:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,按照距离相关性对主成分降序排列,使用相关性值最高的若干主成分再次启动序列前向特征选择算法,得到第三特征集,包括:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,所述距离相关性的结果范围从0到1,结果越接近1则表示主成分和观测到的光伏出力之间的线性关系越强;按照距离相关性对主成分降序排列,选择相关性值最高的若干主成分,再次启动序列前向特征选择算法,选择最小化目标函数的若干主成分构成第三特征集。
[0043]
在本实施例中,距离相关性的计算可以使用不同的距离度量方法,如欧氏距离、曼哈顿距离或余弦距离等,计算其中每个参数的平均距离和标准差,再基于每个参数的平均距离和标准差,使用皮尔逊相关系数或斯皮尔曼相关系数来衡量两个数据集之间的相关性。
[0044] s5:构建双向门控神经网络(bigru),利用第三特征集和历史功率进行训练,并使用粒子群优化算法优化双向门控神经网络,得到光伏出力预测模型,如图3和图4所示,包括:构建由两个相反方向的门控神经网络(gru)单元组成的双向门控神经网络,其中正向门控神经网络单元从特征序列的首部开始向尾部移动,反向门控神经网络单元从特征序列的尾部开始向首部移动。
[0045]
在本实施例中,一个门控神经网络单元由更新门和重置门组成。
[0046]
其更新门计算公式如下:
;重置门计算公式如下:;当前记忆内容如下:;当前时间步的最终记忆如下:;式中:为哈达马运算符;、分别为更新门和重置门输入量的权重矩阵;、分别为更新门和重置门上一时间步记忆内容的权重矩阵。
[0047]
与传统的神经网络相比,bigru可以双向结合过去的信息与未来的信息,从而使得模型可以从时间序列中提取到更高级的特征。本实施例使用的bigru有两个相反方向的gru组成,正向gru从特征序列的首部开始向尾部移动,反向gru从特征序列的尾部开始向首部移动。
[0048]
正向gru当前时间步的最终记忆如下:;反向gru当前时间步的最终记忆如下:;bigru的最终输出如下:;式中:符号表示将和两个记忆状态进行连接,从而得到最终输出。
[0049] 进一步地,使用粒子群优化算法(particle swarm optimization,pso)优化bigru神经网络,将粒子群算法和双向门控循环神经网络进行结合,使用算法实现模型的自动化寻优过程,具体步骤如下:1)构建bigru模型,并且确定每个参数寻优的大小范围。学习率取值范围为[0.01,
0.6]、隐藏层神经元个数取值范围为[50,200],批处理大小取值范围为[50,200]、时间步长取值范围为[3,20]、迭代次数取值范围为[50,100]。
[0050] 2)令t=0,设置种群规模为20、惯性权重为0.5、让粒子意识到局部最优解和让粒子意识到全局最优解的加速因子均为2,借助粒子群算法寻找它们在各自区间内的最优取值。
[0051] 3)随机生成一个多维的种群粒子(g1、g2、l、b、t、n),g1表示bigru的第一个隐藏层神经元个数,g2表示bigru的第二个隐藏层神经元个数,l表示学习率,b表示批处理大小,t表示时间步长,n表示迭代次数,初始化粒子的位置和速度并且评估每个粒子得到全局最优。
[0052] 4)计算并比较每个粒子的适应度值,如下式所示:;式中,m和n分别表示训练集和测试集的长度,k表示数据的维度,和分别代表训练集中的预测值和实际值,和分别代表测试集中的预测值和实际值。
[0053] 5)判断是否满足结束条件,若是,则结束寻优;若否,计算更新粒子的最优位置和最优速度,如下式所示:;;其中,为惯性权重;为加速因子;为[0,1]之间的随机数。
[0054] 6)更新粒子的个体最优位置(pbest)和全局最优位置(gbest)。将新的解与该粒子的历史最优解进行比较,如果新的解更好,则更新该粒子的最优解,否则保留历史的最优解。在一个迭代完成后,每一个粒子得到的只是自己的局部最优解,再将其与全局最优解进行比较,如果存在局部最优解优于全局最优解,就将历史全局最优解进行更新替换操作。
[0055] 7)跳转至步骤4),并持续检验系统判定条件。如果符合判定条件,就结束寻优,返回全局最优位置(gbest)值,最终生成的最优粒子就是最优参数组合,得到神经元数量、学习率、批处理值、时间步长和迭代次数;若否,继续执行后续步骤。
[0056] s6:获取待预测时段的天气预报的气象数据并执行s1至s4后,输入至光伏出力预测模型,输出光伏发电功率的预测值。
[0057]
本实施例中,通过主成分分析对气象参数进行第一次降维处理,在考虑光伏出力之前,先剔除气象参数中对其本身的特征表达影响较小的成分;在此基础上考虑光伏预测能力,利用序列前向特征选择算法进一步提取主成分分量,得到第二特征集;再利用保留的主成分和观测到的光伏出力之间的距离相关性进行排序筛选,进一步执行序列前向特征选择算法,得到第三特征集;最后利用优化后的双向门控神经网络进行训练,得到光伏出力预
测模型,实现光伏发电功率的预测。
[0058]
实施例二:在实施例一的基础上,本实施例提供一种基于pca-sffs-bigru的光伏出力预测系统,包括:数据预处理单元,用于获取天气预报的气象数据,进行预处理后得到气象参数;主成分分析单元,用于通过空间和时间权重的线性组合分解每一个气象参数,对各气象参数进行主成分分析,根据总方差确定每个气象参数保留的若干主成分,得到降维后的气象参数,组成第一特征集;第一选择单元,用于对第一特征集使用序列前向特征选择算法进一步提取主成分分量,得到第二特征集;第二选择单元,用于计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,按照距离相关性对主成分降序排列,使用相关性值最高的若干主成分再次启动序列前向特征选择算法,得到第三特征集;训练单元,用于构建双向门控神经网络,利用第三特征集和历史功率进行训练,并使用粒子群优化算法优化双向门控神经网络,得到光伏出力预测模型;数据交互单元,用于获取待预测时段的天气预报的气象数据经过数据预处理单元、主成分分析单元、第一选择单元、第二选择单元后,输入至光伏出力预测模型,输出光伏发电功率的预测值。
[0059]
实施例三:本实施例与实施例一整体一致,区别在于,在执行s4之前,还包括:从加入过最优特征子集但被移除的主成分中随机选择若干主成分,加入第二特征集。
[0060]
其中,对于单次的序列前向特征选择算法来说,重新复原部分主成分,并没有实际意义,因为在单次的筛选过程中,被删除的主成分必然劣于保留的部分,但在实施例中,由于需要从不同的影响层面进行多次数据降维,虽然对于每次降维操作来说均保留了最有价值的部分,但简单的累积降维操作叠加后,每次降维的误差或影响容易被放大,因此在最后一次降维之前,将部分被剔除的主成分还原,以平衡多次降维可能出现的数据精简过度问题。而加入过最优特征子集但被移除的主成分,表示其在交叉验证过程中,通过了单个主成分的检验,未通过整体最优特征子集的校验,具有一定的预测价值,从中选取部分进行还原,可以略微提高数据维度。
[0061]
实施例四:本实施例与实施例二整体一致,区别在于,还包括数据还原单元,所述数据还原单元被配置为执行以下步骤,包括:从加入过最优特征子集但被移除的主成分中随机选择若干主成分,加入第二特征集。
[0062]
综上所述,上述实施例的实质性效果包括:通过主成分分析对气象参数进行第一次降维处理,在考虑光伏出力之前,先剔除气象参数中对其本身的特征表达影响较小的成分,便于降低后续的计算量;在此基础上考虑光伏预测能力,利用序列前向特征选择算法进一步提取主成分分量,得到第二特征集,可以筛选出与光伏预测关联性较大的数据;再利用保留的主成分和观测到的光伏出力之间的距离相关性进行排序筛选,进一步执行序列前向特征选择算法,得到第三特征集,可以得到与光伏出力之间最相关的数据。
[0063]
同时,在上述处理的基础上,将粒子群优化算法和双向门控循环神经网络进行结合,使用算法实现模型的自动化寻优过程,得到光伏出力预测模型,实现光伏发电功率的预
测,与传统的神经网络相比,双向门控神经网络可以双向结合过去的信息与未来的信息,从而使得模型可以从时间序列中提取到更高级的特征,具有精度高、速度快、可扩展性高等优点,再叠加层层筛选后的特征集,进一步提高在光伏出力预测准确性。
[0064]
另外,由于本实施例需要从不同的影响层面进行多次数据降维,虽然对于每次降维操作来说均保留了当下最有价值的部分,但简单的累积降维操作叠加后,每次降维的误差或影响容易被放大,因此在最后一次降维之前,将部分被剔除的主成分还原,以平衡多次降维可能出现的数据精简过度问题。而加入过最优特征子集但被移除的主成分,表示其在交叉验证过程中,通过了单个主成分的检验,未通过整体最优特征子集的校验,具有一定的预测价值,从中选取部分进行还原,可以略微提高数据维度,进而降低前一次降维的误差对下一次降维的影响,既保证了从不同角度进行降维的效果,又保证了整体的数据质量。
[0065]
通过以上实施方式的描述,所属领域的技术人员可以了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中可以根据需要而将上述功能分配由不同的功能模块完成,即将具体装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
[0066]
在本技术所提供的实施例中,应该理解到,所揭露的结构和方法,可以通过其它的方式实现。例如,以上所描述的关于结构的实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个结构,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,结构或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0067]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0068]
另外,在本技术实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0069] 集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本技术实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本技术各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0070]
以上内容,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。

技术特征:
1.一种基于pca-sffs-bigru的光伏出力预测方法,其特征在于,包括以下步骤:s1:获取天气预报的气象数据,进行预处理后得到气象参数;s2:通过空间和时间权重的线性组合分解每一个气象参数,对各气象参数进行主成分分析,根据总方差确定每个气象参数保留的若干主成分,得到降维后的气象参数,组成第一特征集;s3:对第一特征集使用序列前向特征选择算法进一步提取主成分分量,得到第二特征集;s4:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,按照距离相关性对主成分降序排列,使用相关性值最高的若干主成分再次启动序列前向特征选择算法,得到第三特征集;s5:构建双向门控神经网络,利用第三特征集和历史功率进行训练,并使用粒子群优化算法优化双向门控神经网络,得到光伏出力预测模型;s6:获取待预测时段的天气预报的气象数据并执行s1至s4后,输入至光伏出力预测模型,输出光伏发电功率的预测值。2.根据权利要求1所述的一种基于pca-sffs-bigru的光伏出力预测方法,其特征在于,所述s1:获取天气预报的气象数据,进行预处理后得到气象参数,包括:将天气预报的气象数据中的重复、冗余数据做删除处理;根据气象数据的特点,使用拉依达准则对异常数据进行辨识,设相关气象数据集服从正态分布,设置分布区间,将所设区间外的数据标识为异常数据,并通过均值法修正原始数据集;对处理后的气象数据进行数据归一化处理,得到气象参数。3.根据权利要求1所述的一种基于pca-sffs-bigru的光伏出力预测方法,其特征在于,所述s2:通过空间和时间权重的线性组合分解每一个气象参数,对各气象参数进行主成分分析,根据总方差确定每个气象参数保留的若干主成分,得到降维后的气象参数,组成第一特征集,包括:对于每一个具有第j个空间点和时间依赖性的气象参数,通过空间和时间权重的线性组合分解:;式中,z为气象参数,为主成分的得分,为协方差矩阵的特征向量,n为空间总点数;计算总方差及每个主成分的方差解释率,根据方差解释率进行降序排序并依次相加,当总解释率达到预设标准时停止,剔除未被相加的主成分,保留已被相加的主成分,得到降维后的气象参数,组成第一特征集。4.根据权利要求1所述的一种基于pca-sffs-bigru的光伏出力预测方法,其特征在于,所述s3:对第一特征集使用序列前向特征选择算法进一步提取主成分分量,得到第二特征集,包括:
创建一个空的最优特征子集;在每次迭代过程中,将第一特征集每个校准周期内的数据分割为训练数据和测试数据,采用十倍交叉验证法分别进行训练和验证,选择在校准周期内标准均方根误差检验值最小的气象参数主成分加入最优特征子集,如下式所示:;式中,nrmse为标准均方根误差检验值,t表示预测时段数,和分别表示时刻的光伏出力预测值和观测值;每当有新的主成分加入后,基于更新的最优特征子集重新计算标准均方根误差检验值,若数值未下降则移除最新加入的主成分,否侧仍然保留;继续迭代直至遍历第一特征集,将此时的最优特征子集作为第二特征集。5.根据权利要求4所述的一种基于pca-sffs-bigru的光伏出力预测方法,其特征在于,在执行s4之前,还包括:从加入过最优特征子集但被移除的主成分中随机选择若干主成分,加入第二特征集。6.根据权利要求1或5所述的一种基于pca-sffs-bigru的光伏出力预测方法,其特征在于,所述s4:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,按照距离相关性对主成分降序排列,使用相关性值最高的若干主成分再次启动序列前向特征选择算法,得到第三特征集,包括:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,所述距离相关性的结果范围从0到1,结果越接近1则表示主成分和观测到的光伏出力之间的线性关系越强;按照距离相关性对主成分降序排列,选择相关性值最高的若干主成分,再次启动序列前向特征选择算法,选择最小化目标函数的若干主成分构成第三特征集。7.根据权利要求1所述的一种基于pca-sffs-bigru的光伏出力预测方法,其特征在于,所述s5:构建双向门控神经网络,利用第三特征集和历史功率进行训练,并使用粒子群优化算法优化双向门控神经网络,得到光伏出力预测模型,包括:构建由两个相反方向的门控神经网络单元组成的双向门控神经网络,其中正向门控神经网络单元从特征序列的首部开始向尾部移动,反向门控神经网络单元从特征序列的尾部开始向首部移动;输入第三特征集和历史功率进行训练,同时使用粒子群优化算法优化双向门控神经网络,得到最优参数组合;基于最优参数组合优化双向门控神经网络,并训练得到光伏出力预测模型。8.根据权利要求7所述的一种基于pca-sffs-bigru的光伏出力预测方法,其特征在于,所述s5中,使用粒子群优化算法优化双向门控神经网络,包括:
设置学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数的取值范围,并设置种群规模、惯性权重、让粒子意识到局部最优解的加速因子、让粒子意识到全局最优解的加速因子的数值;以学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数作为维度,随机生成多维种群粒子,初始化粒子的位置和速度,利用适应度函数计算每个粒子的适应度值;利用更新公式更新粒子的位置和速度,并通过比较持续更新局部最优解,将具有最小适应度值的粒子的局部最优解作为全局最优解;在一个迭代完成后,每一个粒子得到自身局部最优解,再将其与全局最优解进行比较,如果存在局部最优解优于全局最优解,就将全局最优解替换成局部最优解,最终生成的最优粒子就是最优参数组合,得到学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数。9.一种基于pca-sffs-bigru的光伏出力预测系统,用于执行如权利要求1所述的一种基于pca-sffs-bigru的光伏出力预测方法,其特征在于,包括:数据预处理单元,用于获取天气预报的气象数据,进行预处理后得到气象参数;主成分分析单元,用于通过空间和时间权重的线性组合分解每一个气象参数,对各气象参数进行主成分分析,根据总方差确定每个气象参数保留的若干主成分,得到降维后的气象参数,组成第一特征集;第一选择单元,用于对第一特征集使用序列前向特征选择算法进一步提取主成分分量,得到第二特征集;第二选择单元,用于计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,按照距离相关性对主成分降序排列,使用相关性值最高的若干主成分再次启动序列前向特征选择算法,得到第三特征集;训练单元,用于构建双向门控神经网络,利用第三特征集和历史功率进行训练,并使用粒子群优化算法优化双向门控神经网络,得到光伏出力预测模型;数据交互单元,用于获取待预测时段的天气预报的气象数据经过数据预处理单元、主成分分析单元、第一选择单元、第二选择单元后,输入至光伏出力预测模型,输出光伏发电功率的预测值。10.根据权利要求9所述的一种基于pca-sffs-bigru的光伏出力预测系统,其特征在于,所述数据预处理单元被配置为执行以下步骤,包括:将天气预报的气象数据中的重复、冗余数据做删除处理;根据气象数据的特点,使用拉依达准则对异常数据进行辨识,设相关气象数据集服从正态分布,设置分布区间,将所设区间外的数据标识为异常数据,并通过均值法修正原始数据集;对处理后的气象数据进行数据归一化处理,得到气象参数。11.根据权利要求9所述的一种基于pca-sffs-bigru的光伏出力预测系统,其特征在于,所述主成分分析单元被配置为执行以下步骤,包括:对于每一个具有第j个空间点和时间依赖性的气象参数,通过空间和时间权重的线性组合分解:
;式中,z为气象参数,为主成分的得分,为协方差矩阵的特征向量,n为空间总点数;计算总方差及每个主成分的方差解释率,根据方差解释率进行降序排序并依次相加,当总解释率达到预设标准时停止,剔除未被相加的主成分,保留已被相加的主成分,得到降维后的气象参数,组成第一特征集。12.根据权利要求9所述的一种基于pca-sffs-bigru的光伏出力预测系统,其特征在于,所述第一选择单元被配置为执行以下步骤,包括:创建一个空的最优特征子集;在每次迭代过程中,将第一特征集每个校准周期内的数据分割为训练数据和测试数据,采用十倍交叉验证法分别进行训练和验证,选择在校准周期内标准均方根误差检验值最小的气象参数主成分加入最优特征子集,如下式所示:;式中,nrmse为标准均方根误差检验值,t表示预测时段数,和分别表示时刻的光伏出力预测值和观测值;每当有新的主成分加入后,基于更新的最优特征子集重新计算标准均方根误差检验值,若数值未下降则移除最新加入的主成分,否侧仍然保留;继续迭代直至遍历第一特征集,将此时的最优特征子集作为第二特征集。13.根据权利要求12所述的一种基于pca-sffs-bigru的光伏出力预测系统,其特征在于,还包括数据还原单元,所述数据还原单元被配置为执行以下步骤,包括:从加入过最优特征子集但被移除的主成分中随机选择若干主成分,加入第二特征集。14.根据权利要求9或13所述的一种基于pca-sffs-bigru的光伏出力预测系统,其特征在于,所述第二选择单元被配置为执行以下步骤,包括:计算第二特征集中每个保留的主成分和观测到的光伏出力之间的距离相关性,所述距离相关性的结果范围从0到1,结果越接近1则表示主成分和观测到的光伏出力之间的线性关系越强;按照距离相关性对主成分降序排列,选择相关性值最高的若干主成分,再次启动序列前向特征选择算法,选择最小化目标函数的若干主成分构成第三特征集。15.根据权利要求9所述的一种基于pca-sffs-bigru的光伏出力预测系统,其特征在于,所述训练单元被配置为执行以下步骤,包括:
构建由两个相反方向的门控神经网络单元组成的双向门控神经网络,其中正向门控神经网络单元从特征序列的首部开始向尾部移动,反向门控神经网络单元从特征序列的尾部开始向首部移动;输入第三特征集和历史功率进行训练,同时使用粒子群优化算法优化双向门控神经网络,得到最优参数组合;基于最优参数组合优化双向门控神经网络,并训练得到光伏出力预测模型。16.根据权利要求15所述的一种基于pca-sffs-bigru的光伏出力预测系统,其特征在于,所述训练单元还被配置为执行以下步骤,包括:设置学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数的取值范围,并设置种群规模、惯性权重、让粒子意识到局部最优解的加速因子、让粒子意识到全局最优解的加速因子的数值;以学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数作为维度,随机生成多维种群粒子,初始化粒子的位置和速度,利用适应度函数计算每个粒子的适应度值;利用更新公式更新粒子的位置和速度,并通过比较持续更新局部最优解,将具有最小适应度值的粒子的局部最优解作为全局最优解;在一个迭代完成后,每一个粒子得到自身局部最优解,再将其与全局最优解进行比较,如果存在局部最优解优于全局最优解,就将全局最优解替换成局部最优解,最终生成的最优粒子就是最优参数组合,得到学习率、隐藏层神经元个数、批处理大小、时间步长、迭代次数。17.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1至8中任意一项所述的一种基于pca-sffs-bigru的光伏出力预测方法的步骤。18.一种存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至8中任意一项所述的一种基于pca-sffs-bigru的光伏出力预测方法的步骤。

技术总结
本发明公开了一种基于PCA-SFFS-BiGRU的光伏出力预测方法,包括:获取天气预报的气象数据,进行预处理;对各气象参数进行主成分分析,得到降维后的气象参数,组成第一特征集;使用序列前向特征选择算法进一步提取主成分分量,得到第二特征集;计算每个保留的主成分和观测到的光伏出力之间的距离相关性,使用相关性值最高的若干主成分再次启动序列前向特征选择算法,得到第三特征集;构建双向门控神经网络,并使用粒子群优化算法优化双向门控神经网络,得到光伏出力预测模型。本发明通过多次数据降维,分别进行不同目的的筛选,保留每个阶段最具价值的数据;最后利用优化后的双向门控神经网络进行训练,得到光伏出力预测模型,实现光伏发电功率的预测。实现光伏发电功率的预测。实现光伏发电功率的预测。


技术研发人员:叶国庆 李付林 黄红辉 叶宏 李毓 王珂 徐浩华 贺燕 季克勤 侯健生 沃建栋 盛晨 张文杰 吴峰 瞿迪庆 朱君兴 王宁
受保护的技术使用者:金华八达集团有限公司
技术研发日:2023.08.16
技术公布日:2023/9/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐