基于数据隐私保护的联邦深度学习风力发电预测方法
未命名
10-08
阅读:128
评论:0

1.本发明涉及风电功率预测技术领域,具体涉及基于数据隐私保护的联邦深度学习风力发电预测方法。
背景技术:
2.随着生存环境质量的下降,世界上越来越多的国家已经意识到了化石能源带来的危机。在当前经济快速发展的形势下,水能、风能、太阳能等可再生能源成为了众多学者的研究热点。但是由于风力的波动性,这将极大的影响电网调度计划的安排,所以风电功率预测日益关键起来。当今社会中,数据的私有和隐私保护是至关重要的。
3.然而,传统的风电功率预测是基于集中数据的预测,这将引起数据隐私保护和数据孤岛问题,从而往往导致数据的安全性和预测的准确度较低。
技术实现要素:
4.本发明的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本发明的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
5.为了解决风电功率预测的准确度较低的技术问题,本发明提出了基于数据隐私保护的联邦深度学习风力发电预测方法。
6.本发明提供了基于数据隐私保护的联邦深度学习风力发电预测方法,该方法包括:
7.获取预设数量个不同风电场的风电功率数据集,对风电功率数据集进行预处理,将预处理后的风电功率数据集划分为训练数据集和测试数据集;
8.建立fed-bilstm联邦深度学习模型;
9.根据训练数据集,对建立的fed-bilstm联邦深度学习模型进行训练,得到训练后的fed-bilstm联邦深度学习模型;
10.根据测试数据集,对训练后的fed-bilstm联邦深度学习模型进行验证;
11.通过训练后的fed-bilstm联邦深度学习模型,进行风电功率预测。
12.可选地,所述根据测试数据集,对训练后的fed-bilstm联邦深度学习模型进行验证,包括:
13.根据测试数据集,采取保留子集的形式,设置第一预设数目种案例场景,验证fed-bilstm联邦深度学习模型的泛化性;
14.将训练后的fed-bilstm联邦深度学习模型与典型的反向传播网络、混合逻辑回归、支持向量机和长短时记忆网络四种模型来预测同一风电场数据集的风电功率来比较所提模型的预测准确性。
15.可选地,所述对风电功率数据集进行预处理,包括:
16.采用基于密度的聚类应用算法和变点法相结合的异常数据检测方法检测出风电
功率数据集中的异常数据;
17.基于风速-功率的强相关性,通过风速-功率区域随机填补方法进行异常数据点的修复,得到修复后的风电功率数据集;
18.对修复后的风电功率数据集进行归一化处理,得到预处理后的风电功率数据集。
19.可选地,所述基于风速-功率的强相关性,通过风速-功率区域随机填补方法进行异常数据点的修复,包括:
20.将正常风速-功率数据集划分为第二预设数目个区间,按照异常数据点所对应的风速值,将其随机落于正常风速-功率数据集相应风速区间内,获得相应的风电功率值,对于其他的异常点进行相同的操作,完成异常数据点的修补。
21.可选地,所述建立fed-bilstm联邦深度学习模型,包括:
22.确定双向长短时记忆网络为fed-bilstm联邦深度学习模型的基础模型。
23.可选地,所述根据训练数据集,对建立的fed-bilstm联邦深度学习模型进行训练,包括:
24.基于具有相同特征空间但不同样本的第三预设数目个风电场客户端,采用横向联邦学习框架,根据训练数据集,对建立的fed-bilstm联邦深度学习模型进行训练。
25.可选地,所述对建立的fed-bilstm联邦深度学习模型进行训练,包括:
26.使用bilstm模型为全局模型;
27.中央服务器将初始全局模型分配给每个风电场终端;每个终端使用本地数据来训练建立的fed-bilstm联邦深度学习模型;当本地训练完成后,终端将新的模型参数权重发送回中央服务器;中央服务器会对新的模型参数采取联邦平均算法求平均值,并用平均值来更新全局模型的参数;中央服务器将更新后的全局模型的参数传递给各个终端;这个过程会不断重复,直到全局模型满足收敛准则或达到最大迭代次数。
28.可选地,所述采取保留子集的形式,设置第一预设数目种案例场景,验证fed-bilstm联邦深度学习模型的泛化性,包括:
29.选取第四预设数目个客户端的数据集作为保留子集;
30.将保留风电场客户端的测试集测试得到的最终模型,得到mae和rmse值,比较模型的性能和泛化性。
31.本发明具有如下有益效果:
32.本发明的基于数据隐私保护的联邦深度学习风力发电预测方法,在提升预测精度的同时,保护数据的隐私性,本发明将联邦学习和深度学习结合起来,设计的fed-bilstm联邦深度学习模型可以用于短期风电功率预测。首先,本发明采用双向长短时记忆网络模型作为基本预测模型,可以更好的提升预测准确率。其次,将双向长短时记忆网络模型集成到联邦学习的框架中。这样在模型训练时,各方通过共享模型参数而不是共享数据的形式来提升模型的训练精度,极大的解决了数据隐私性问题。实验结果表明,fed-bilstm联邦深度学习模型在预测精度方面是优于传统预测模型的,更重要的是,fed-bilstm联邦深度学习模型相较于传统预测模型,可以很好的解决数据隐私保护问题和数据孤岛问题。
附图说明
33.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施
例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
34.图1为本发明的基于数据隐私保护的联邦深度学习风力发电预测方法的流程图;
35.图2为本发明的又一流程图;
36.图3为本发明的双向长短时记忆网络示意图。
具体实施方式
37.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的技术方案的具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一个实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
38.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
39.本发明提供了基于数据隐私保护的联邦深度学习风力发电预测方法,该方法包括以下步骤:
40.获取预设数量个不同风电场的风电功率数据集,对风电功率数据集进行预处理,将预处理后的风电功率数据集划分为训练数据集和测试数据集;
41.建立fed-bilstm联邦深度学习模型;
42.根据训练数据集,对建立的fed-bilstm联邦深度学习模型进行训练,得到训练后的fed-bilstm联邦深度学习模型;
43.根据测试数据集,对训练后的fed-bilstm联邦深度学习模型进行验证;
44.通过训练后的fed-bilstm联邦深度学习模型,进行风电功率预测。
45.下面对上述各个步骤进行详细展开:
46.参考图1,示出了根据本发明的基于数据隐私保护的联邦深度学习风力发电预测方法的一些实施例的流程。该基于数据隐私保护的联邦深度学习风力发电预测方法,包括以下步骤:
47.步骤s1,获取预设数量个不同风电场的风电功率数据集,对风电功率数据集进行预处理,将预处理后的风电功率数据集划分为训练数据集和测试数据集。
48.在一些实施例中,可以获取6个不同风电场的风电功率数据集,对数据集进行预处理,然后将预处理后的风电功率数据集划分为训练数据集和测试数据集。
49.其中,预设数量可以是预先设置的数量。例如,预设数量可以是6。
50.作为示例,对风电功率数据集进行预处理可以包括以下步骤:
51.第一步,采用基于密度的聚类应用算法和变点法相结合的异常数据检测方法检测出风电功率数据集中的异常数据。
52.第二步,基于风速-功率的强相关性,通过风速-功率区域随机填补方法进行异常数据点的修复,得到修复后的风电功率数据集。
53.例如,将正常风速-功率数据集划分为第二预设数目个区间,按照异常数据点所对应的风速值,将其随机落于正常风速-功率数据集相应风速区间内,获得相应的风电功率
值,对于其他的异常点进行相同的操作,完成异常数据点的修补。
54.其中,第二预设数目可以是预先设置的数目。
55.第三步,对修复后的风电功率数据集进行归一化处理,得到预处理后的风电功率数据集。
56.需要说明的是,数据集异常点可以包括:离散的异常点和聚集的异常点。离散的异常点:通常因为一些随机的因素造成的,如传感器失灵,数据传输时夹带有噪音,随机的因素造成的异常点同时是离散的、松散的。聚集的异常点:堆积的异常点通常是由于遇见长时间的无法迅速恢复的故障导致的。他们数量多且集中在一段时间内。
57.采用基于密度的聚类应用算法(density-based spatial clustering of applications with noise method,dbscan method)和变点法相结合的异常数据检测方法检测出原始风电功率数据集中的异常数据。
58.dbscan算法目的是发现那些在数据集中相对较少、与其他数据点明显不同或不类似的异常点。该算法可用于异常检测、聚类、图像处理等领域。它的算法流程可以包括如下子步骤:
59.第一子步骤,初始化参数:设定半径阈值ε和邻域内最小数据点数minpts。
60.第二子步骤,选择任意一个未被访问的点p,找到半径ε内所有与p相邻的点,若该区域内的点数不小于minpts,则以p为核心对象,将该区域内的所有点设为一个簇,并标记它们已被访问过。
61.第三子步骤,寻找以核心对象p为中心,半径为ε的圆形邻域内的所有点,对于每个点,如果它还未被访问过,就将其加入到当前簇中。
62.第四子步骤,对于刚加入簇中的点q,如果其也是核心对象,则寻找其半径ε内的所有点,并将这些点加入到当前簇中。
63.第五子步骤,重复执行该算法流程(dbscan算法)包括的第三子步骤和第四子步骤,直到当前簇内的所有点都在半径ε内无法找到其他点为止。
64.第六子步骤,寻找所有未被访问过的点中是否存在某个点q,其半径ε内包含的点数不小于minpts,将q作为新的核心对象,以同样的方式扩展新的簇。
65.第七子步骤,不断重复执行该算法流程(dbscan算法)包括的第二子步骤至第六子步骤,直到所有的点都被分类。
66.第八子步骤,最后形成的每个簇都是一组半径为ε以内彼此密集相邻的数据点组成的集合,而不在任何簇中的点被视为离群点。
67.在进行变点法进行异常数据的检测时,使用方差作为判断依据。
68.设风速区间内的数据样本集合为d,样本总数为n,数据样本集合为d为:
69.d={(v1,w1),(v2,w2),
…
,(vi,wi),
…
,(vn,wn)}
70.其中,vi为第i个数据样本点的风速大小,此时i∈(1,n)。wi为第i个数据样本点的功率大小,此时i∈(1,n)。将风电功率样本数据按照功率值降序排列,即wi》w
i+1
,此时i∈(1,n-1)。
71.那么第i个数据样本点的方差计算公式为:
72.73.其中,为第i个数据样本点的风电功率平均值。
74.由方差的公式可知,δi可以衡量第i和第i+1个数据样本点的离散程度。
75.然后计算第i个数据样本点的方差变化率,计算公式为:
76.ri=∣δ
i-δ
i-1
∣
77.其中,i=2,3,
…
,n
。
78.通过风电功率方差变化率检测风电功率值统计特性的变点位置。将风电数据按照风速分组,比较区间内数据样本点的方差变化率,如果该区间内方差变化率最大值超过设定阈值,则该最大值所对应的数据点为变点。判断变点前后的数据量,将数量较少的数据视为异常数据点。重复这个过程,对所有风速区间进行相同操作,以区分出异常数据点与正常数据点。
79.针对通过风速-功率的强相关性,通过风速-功率区域随机填补方法进行异常数据点的修复。将正常风速-功率数据集划分为多个区间,按照异常数据点所对应的风速值,将其随机落于正常风速-功率数据集相应风速区间内,获得相应的风电功率值,对于其他的异常点进行相同的操作,完成异常数据点的修补。
80.为了避免不同数据集的量纲不同对模型训练产生影响,经数据集进行归一化处理。将经过处理后的数据集按照7:3的比例划分为训练集和测试集。分别用于六个风电场客户端的模型训练以及模型测试。
81.本发明的整体流程图还可以如图2所示。
82.步骤s2,建立fed-bilstm联邦深度学习模型。
83.在一些实施例中,可以建立fed-bilstm联邦深度学习模型,确定fed-bilstm联邦深度学习模型通信算法以及评估指标。
84.作为示例,确定双向长短时记忆网络(bilstm)为fed-bilstm联邦深度学习模型的基础模型。
85.需要说明的是,长短时记忆网络(long short-term memory,lstm)是基于深度循环神经网络的记忆网络,它是传统循环神经网络的进阶版,是为了处理传统的循环神经网络不能处理长期记忆的问题。如下图所示。lstm通过门机制来控制信息流,包括遗忘门、输入门和输出门。遗忘门决定来自前一时间戳的信息是要被记住还是不相关,并且可以从单元状态中丢弃。输入门决定应该向单元状态添加什么新信息。输出门决定更新的单元状态的哪些部分应该从当前时间戳传递到下一个时间戳。这些门机制在时间戳t下所涉及的计算公式和函数为:
86.f
t
=σ(w
lf
l
t
+w
mfht-1
+bf)
87.i
t
=σ(w
li
l
t
+w
miht-1
+bi)
88.o
t
=σ(w
lo
l
t
+w
moht-1
+bo)
89.a
t
=tanh(w
la
l
t
+w
maht-1
+ba)
90.c
t
=c
t-1
*f
t
+i
t
*a
t
91.m
t
=o
t
*tanhc
t
92.其中,σ是sigmoid()激活函数,f
t
、i
t
、o
t
、c
t
和a
t
分别表示遗忘门、输入门、输出门、存储单元和隐藏向量。w
l*
=(w
lf
,w
li
,w
la
,w
lo
)和w
m*
=(w
mf
,w
mi
,w
ma
,w
mo
)表示各个门的可训练权重,而bf,bi,bo和ba是输出偏置量。
93.双向长短时记忆网络(bidirectional long short-term memory,blstm)是lstm的变体,如图3所示,其特点在于包含两个方向的lstm。一个从前向后处理输入序列,另一个从后向前处理输入序列。这种结构使得bilstm能够捕捉当前时刻前后的上下文信息,从而更好地预测下一个输出。在每个时间步,bilstm将输入向量和前一个时间步的输出向量作为前向和后向lstm的输入,并将它们的输出拼接在一起,以保留过去和未来的上下文信息,从而提高模型的准确性。所涉及公式和计算函数为:
[0094][0095]
其中,lfi和lbi表示前向和后向隐藏层的输出,xi和yi分别表示bilstm的输入和输出。
[0096]
联邦学习存在通信速率不稳定、中央服务器的容量有限,同时与服务器端通信和终端的数量受限。联邦平均算法采用增加终端计算,限制通信频率,在上传更新的梯度之前执行多次本地梯度下降迭代。联邦平均算法随机选择m个终端进行采样,对这m个终端的梯度更新进行平均以形成全局更新,同时用当前全局模型替换未采样的终端,使通讯成本极大的降低。联邦平均算法终端抽样,对应的公式为:
[0097][0098]
在每次迭代中对随机选择参与的客户端子集s
t
进行统一抽样,并下发当前全局模型参数θ
t
,在终端本地上进行训练更新梯度,并上传至服务端进行平均形成更新参数θ
t+1
。不属于抽样子集的终端的更新则由当前的全局模型参数θ
t
代替。然后服务端进行平均产生新的全局参数θ
t+1
。
[0099]
针对具有相同特征空间但不同样本的几个风电场客户端,采用横向联邦学习框架,这个系统的工作流程如下,首先,中央服务器将初始全局模型分配给每个风电场终端。然后,每个终端使用本地数据来训练初始模型bilstm。当本地训练完成后,终端将新的模型参数权重发送回中央服务器。接着,中央服务器会对新的模型参数采取联邦平均算法求平均值,并用平均值来更新全局模型的参数。最后,中央服务器将更新后的全局模型的参数传递给各个终端。这个过程会不断重复,直到全局模型满足收敛准则或达到最大迭代次数。在这种架构下,各个终端的原始数据永远不会离开本地数据所有者的控制。这种方法不仅保护了用户隐私和数据安全而且使各终端数据参与了全局模型的训练。
[0100]
预测模型的比较目前在国际上没有统一标准,常见的评估标准有:平均误差(mean error,me)、平均绝对误差(mean absolute error,mae)、均方根误差(root mean square error,rmse)。为了更好的、更充分的评估所提模型的准确性,减少风电预测模型的误差,本发明采用mae,rmse作为预测精度的评价指标。rmse的计算公式为:
[0101][0102]
其中为实际功率值,yi为预测功率。rmse值的范围为[0,+∞),当rmse值为0时,代表预测值与真实值完全相同,但是在实际的风电功率预测中,由于风电功率具有极高的不稳定性,所以,这种情况往往是达不到的。本发明通过比较rmse值的大小来判断预测的精确度,rmse值与预测精确度负相关,rmse值越小,预测误差越小。
[0103]
mae的计算公式为:
[0104][0105]
其中为实际功率值,yi为预测功率。它的值直接表示预测值与真实值的平均差异。mae来进行模型比较更具备可解释性,也更贴合实际问题的统计应用场景。
[0106]
步骤s3,根据训练数据集,对建立的fed-bilstm联邦深度学习模型进行训练,得到训练后的fed-bilstm联邦深度学习模型。
[0107]
在一些实施例中,每个风电场均参与fed-bilstm联邦深度学习模型的训练,得到训练后的fed-bilstm联邦深度学习模型。例如,基于具有相同特征空间但不同样本的第三预设数目个风电场客户端,采用横向联邦学习框架,根据训练数据集,对建立的fed-bilstm联邦深度学习模型进行训练。其中,第三预设数目可以是预先设置的数目。
[0108]
作为示例,本步骤可以包括以下步骤:
[0109]
第一步,使用bilstm模型为全局模型。
[0110]
第二步,中央服务器将初始全局模型分配给每个风电场终端;每个终端使用本地数据来训练建立的fed-bilstm联邦深度学习模型;当本地训练完成后,终端将新的模型参数权重发送回中央服务器;中央服务器会对新的模型参数采取联邦平均算法求平均值,并用平均值来更新全局模型的参数;中央服务器将更新后的全局模型的参数传递给各个终端;这个过程会不断重复,直到全局模型满足收敛准则或达到最大迭代次数。
[0111]
需要说明的是,fed-bilstm联邦深度学习模型的训练可以包括以下子步骤:
[0112]
第一子步骤,设置全局模型:使用bilstm模型为全局模型。
[0113]
第二子步骤,从所有的风电场客户端中进行随机选取4个客户端参与模型训练。
[0114]
第三子步骤,在选定的客户端上,使用本地数据对全局模型进行训练,并使用本地梯度更新模型参数。采用本地差分隐私机制等隐私保护措施,确保训练数据的隐私安全,同时保证分布式计算的收敛性质。
[0115]
第四子步骤,客户端完成本地训练后,将本地梯度上传到中央服务器,加权汇总梯度信息,进行异步或同步的模型更新。使用联邦平均聚合算法对模型进行加权平均、梯度累计和参数协调,生成新的全局模型参数。
[0116]
第五子步骤,通过监测本地客户端的训练误差变化率和全局模型的误差变化率,来判断模型是否已经收敛。如果变化率低于阈值,则可以停止训练。
[0117]
第六子步骤,重复进行上述步骤,直到全局模型收敛或达到预定的停止条件。此时,保存全局模型。
[0118]
将各个风电场客户端的测试集测试得到的最终模型,得到mae和rmse值,比较模型的性能。
[0119]
步骤s4,根据测试数据集,对训练后的fed-bilstm联邦深度学习模型进行验证。
[0120]
在一些实施例中,可以设计三种案例场景,验证模型的预测精确度。
[0121]
作为示例,本步骤可以包括以下步骤:
[0122]
第一步,根据测试数据集,采取保留子集的形式,设置第一预设数目种案例场景,验证fed-bilstm联邦深度学习模型的泛化性。
[0123]
其中,第一预设数目可以是预先设置的数目。比如,第一预设数目可以是3。也就是
说可以采取保留子集的形式,设计三种案例场景,验证fed-bilstm联邦深度学习模型的泛化性。
[0124]
例如,根据测试数据集,采取保留子集的形式,设置第一预设数目种案例场景,验证fed-bilstm联邦深度学习模型的泛化性可以包括以下子步骤:
[0125]
第一子步骤,选取第四预设数目个客户端的数据集作为保留子集,使其不参与训练。
[0126]
其中,第四预设数目可以是预先设置的数目。如,第四预设数目可以是3。
[0127]
第二子步骤,将保留风电场客户端的测试集测试得到的最终模型,得到mae和rmse值,比较模型的性能和泛化性。
[0128]
第二步,将训练后的fed-bilstm联邦深度学习模型与典型的反向传播网络(typical back propagation neural network,bpnn)、混合逻辑回归(mixed logistic regression,mlr)、支持向量机(support vector machine,svm)和长短时记忆网络lstm四种模型来预测同一风电场数据集的风电功率来比较所提模型的预测准确性。计算多个模型的mae值和rsme值,评估训练后的fed-bilstm联邦深度学习模型相比于其他模型的的预测精确度。
[0129]
需要说明的是,分别设计三种案例场景,来验证所提联邦深度学习的预测精确度。
[0130]
首先,传统的深度学习模型训练大多是集中式、非分布式的。为了与所提模型进行对比,提出了一种集中式、非分布式的模型训练方案,即将所有数据集整合到一起,并在同一个客户端上进行训练,由于需要将所有数据集整合到一起,这就丧失了数据集的隐私性,所以,此方案用来与所提模型方案进行预测精确度的对比。
[0131]
其次,设计了一种完全私有化的训练方案,所有客户端在本地进行模型训练,训练过程与其他客户端是隔离的,这种方案中,每个客户端模型学习到的是本地数据集的特征值,所训练出的模型不能在其他模型中学习特征。这也使得模型具有单一性。
[0132]
最后,中央服务器将初始全局模型分配给风电场客户端。然后,每个客户端使用本地数据来训练初始模型bilstm。当本地训练完成后,客户端将新的模型参数权重发送回中央服务器。接着,中央服务器会对新的模型参数采取联邦平均算法求平均值,并用平均值来更新全局模型的参数。最后,中央服务器将更新后的全局模型的参数传递给各个客户端。
[0133]
步骤s5,通过训练后的fed-bilstm联邦深度学习模型,进行风电功率预测。
[0134]
在一些实施例中,可以通过训练后的fed-bilstm联邦深度学习模型,进行风电功率预测。
[0135]
综上,本发明将联邦学习和深度学习结合起来,设计的fed-bilstm联邦深度学习模型可以用于短期风电功率预测。采用双向长短时记忆网络模型作为基本预测模型,可以更好的提升预测准确率。将双向长短时记忆网络模型集成到联邦学习的框架中。这样在模型训练时,各方通过共享模型参数而不是共享数据的形式来提升模型的训练精度,极大的解决了数据隐私性问题。实验结果表明,fed-bilstm联邦深度学习模型在预测精度方面是优于传统预测模型的,更重要的是,fed-bilstm联邦深度学习模型相较于传统预测模型,可以很好的解决数据隐私保护问题和数据孤岛问题。
[0136]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施
例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,均应包含在本发明的保护范围之内。
技术特征:
1.一种基于数据隐私保护的联邦深度学习风力发电预测方法,其特征在于,包括以下步骤:获取预设数量个不同风电场的风电功率数据集,对风电功率数据集进行预处理,将预处理后的风电功率数据集划分为训练数据集和测试数据集;建立fed-bilstm联邦深度学习模型;根据训练数据集,对建立的fed-bilstm联邦深度学习模型进行训练,得到训练后的fed-bilstm联邦深度学习模型;根据测试数据集,对训练后的fed-bilstm联邦深度学习模型进行验证;通过训练后的fed-bilstm联邦深度学习模型,进行风电功率预测。2.根据权利要求1所述的一种基于数据隐私保护的联邦深度学习风力发电预测方法,其特征在于,所述根据测试数据集,对训练后的fed-bilstm联邦深度学习模型进行验证,包括:根据测试数据集,采取保留子集的形式,设置第一预设数目种案例场景,验证fed-bilstm联邦深度学习模型的泛化性;将训练后的fed-bilstm联邦深度学习模型与典型的反向传播网络、混合逻辑回归、支持向量机和长短时记忆网络四种模型来预测同一风电场数据集的风电功率来比较所提模型的预测准确性。3.根据权利要求1所述的一种基于数据隐私保护的联邦深度学习风力发电预测方法,其特征在于,所述对风电功率数据集进行预处理,包括:采用基于密度的聚类应用算法和变点法相结合的异常数据检测方法检测出风电功率数据集中的异常数据;基于风速-功率的强相关性,通过风速-功率区域随机填补方法进行异常数据点的修复,得到修复后的风电功率数据集;对修复后的风电功率数据集进行归一化处理,得到预处理后的风电功率数据集。4.根据权利要求3所述的一种基于数据隐私保护的联邦深度学习风力发电预测方法,其特征在于,所述基于风速-功率的强相关性,通过风速-功率区域随机填补方法进行异常数据点的修复,包括:将正常风速-功率数据集划分为第二预设数目个区间,按照异常数据点所对应的风速值,将其随机落于正常风速-功率数据集相应风速区间内,获得相应的风电功率值,对于其他的异常点进行相同的操作,完成异常数据点的修补。5.根据权利要求1所述的一种基于数据隐私保护的联邦深度学习风力发电预测方法,其特征在于,所述建立fed-bilstm联邦深度学习模型,包括:确定双向长短时记忆网络为fed-bilstm联邦深度学习模型的基础模型。6.根据权利要求1所述的一种基于数据隐私保护的联邦深度学习风力发电预测方法,其特征在于,所述根据训练数据集,对建立的fed-bilstm联邦深度学习模型进行训练,包括:基于具有相同特征空间但不同样本的第三预设数目个风电场客户端,采用横向联邦学习框架,根据训练数据集,对建立的fed-bilstm联邦深度学习模型进行训练。7.根据权利要求6所述的一种基于数据隐私保护的联邦深度学习风力发电预测方法,
其特征在于,所述对建立的fed-bilstm联邦深度学习模型进行训练,包括:使用bilstm模型为全局模型;中央服务器将初始全局模型分配给每个风电场终端;每个终端使用本地数据来训练建立的fed-bilstm联邦深度学习模型;当本地训练完成后,终端将新的模型参数权重发送回中央服务器;中央服务器会对新的模型参数采取联邦平均算法求平均值,并用平均值来更新全局模型的参数;中央服务器将更新后的全局模型的参数传递给各个终端;这个过程会不断重复,直到全局模型满足收敛准则或达到最大迭代次数。8.根据权利要求2所述的一种基于数据隐私保护的联邦深度学习风力发电预测方法,其特征在于,所述采取保留子集的形式,设置第一预设数目种案例场景,验证fed-bilstm联邦深度学习模型的泛化性,包括:选取第四预设数目个客户端的数据集作为保留子集;将保留风电场客户端的测试集测试得到的最终模型,得到mae和rmse值,比较模型的性能和泛化性。
技术总结
本发明涉及风电功率预测技术领域,具体涉及基于数据隐私保护的联邦深度学习风力发电预测方法,该方法包括:获取预设数量个不同风电场的风电功率数据集,对风电功率数据集进行预处理,将预处理后的风电功率数据集划分为训练数据集和测试数据集;建立Fed-BILSTM联邦深度学习模型;根据训练数据集,对建立的Fed-BILSTM联邦深度学习模型进行训练,得到训练后的Fed-BILSTM联邦深度学习模型;根据测试数据集,对训练后的Fed-BILSTM联邦深度学习模型进行验证;通过训练后的Fed-BILSTM联邦深度学习模型,进行风电功率预测。本发明可以提高数据的安全性和预测的准确度。的安全性和预测的准确度。的安全性和预测的准确度。
技术研发人员:张磊 朱绍明 展桂荣 左宪禹 谢毅 赵一鸣 晋鑫鹏 李郭宇 史建宇
受保护的技术使用者:河南大学
技术研发日:2023.07.06
技术公布日:2023/10/5
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/