一种基于最优加权优化的用户用电模式画像估计方法
未命名
09-29
阅读:73
评论:0
1.本发明涉及用户用电模式画像估计,特别是涉及一种基于最优加权优化的用户用电模式画像估计方法。
背景技术:
2.智能电表在住宅区广泛部署,收集了大量用户用电数据。这部分数据有效助力了配电网经济调度和需求端的高效管理,提高了面向消费者的决策与数据分析。基于这些数据的定制化服务提高了经济效率,但大量收集用户数据引起了公众对于隐私泄露的关注与担忧。因此,电力行业采用不同方法与机制保护用户隐私,例如联邦学习,多方计算等算法。这些隐私保护机制虽然不会引起用电负荷用户画像分析的准确性,但却增加了通信,硬件和计算成本,且这些方法多数是高度定制的,转换应用场景的时候需要重新调整,甚至重新设置。
3.因此,电力行业需要引入新的隐私保护机制。原始数据加噪声是一种经典的隐私保护机制,不会增加硬件设施和通信等成本,但使用起来往往会遇到数据精度不够的问题。如何最大限度利用有噪声的数据的信息进行用户的用电模式画像估计,并且最小化用户画像的估计误差,是一个重要的研究问题。
技术实现要素:
4.本发明的目的在于克服现有技术的不足,提供一种基于最优加权优化的用户用电模式画像估计方法,能够有效利用带噪声的用户用电数据,通过计算最优时空权重来最小化估计值的方差,从而得到最优的用户画像估计结果。
5.本发明的目的是通过以下技术方案来实现的:一种基于最优加权优化的用户用电模式画像估计方法,包括以下步骤:
6.s1.对于同类型的n个用户,对每一个用户的原始用电数据进行加噪处理,得到各个用户的带噪用户用电数据;
7.s2.对于同类型下n个用户的用电模式画像进行估计,并确定估计结果的期望和均方误差;
8.s3.对于各个用户的带噪用户用电数据按照时间段分别进行加权平均估计,得到基于最优加权优化的用户用电模式画像估计结果。
9.本发明的有益效果是:本发明能够有效利用带噪声的用户用电数据,通过计算最优时空权重来最小化估计值的方差,从而得到最优的用户画像估计结果。
附图说明
10.图1为本发明的方法流程图;
11.图2为实施例中估计误差的分布示意图;
12.图3为实施例中大偏差的发生概率示意图。
具体实施方式
13.下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
14.如图1所示,一种基于最优加权优化的用户用电模式画像估计方法,包括以下步骤:
15.s1.对于同类型的n个用户,对每一个用户的原始用电数据进行加噪处理,得到各个用户的带噪用户用电数据;
16.假设一个用户的用电原始数据为d,其中d=(d1,d2,d3,
…
,d
t
)为该用户在不同时间点的用电数据,t为用户用电的时间长度。则经过高斯加噪后为其中η是服从高斯分布的t维随机变量,各个维度的元素均独立且服从无偏的高斯分布它的分布函数满足:
[0017][0018]
其中σ是高斯分布的标准差,π是圆周率常数,变量x的定义域为(-∞,+∞);
[0019]
s2.对于同类型下n个用户的用电模式画像进行估计,并确定估计结果的期望和均方误差;
[0020]
户画像指一类用户的典型用电模式,一般被认为是该类用户用电曲线的平均值。
[0021]
考虑一个决策者需要用户估计类型p的用户的用电画像。考虑这个决策者有k+1类加了不同高斯噪声的数据,这些类型分别为0,1,2,
…
,k。其中第k种类型的数据被添加了分布为的高斯噪声。决策者对任何一种类型k的数据,总共有nk条,则他所拥有的总数据量数据需求者寻求基于这些数据获得对用户画像最准确的估计。首先考虑最简单和最常用的方法来获得用户画像估计,即样本平均值:
[0022][0023]
其中,表示添加了为类型k的高斯噪声的带噪用户用电数据集合;表示第i个用户的带噪用户用电数据:
[0024][0025]
其中,η(i)表示对第i个用户注入的高斯噪声,d(i)表示第i个用户的用电数据;
[0026]
那么,样本的平均估计值的期望和均方误差(meansquared error)满足,
[0027][0028][0029]
式中,μ
t
为p类型用户精确用户画像维度t的值,,var(d
t
)表示的方差,其中表示用户i在时间t的用电量。
[0030]
这一结果直接表明,样本平均估计是无偏的,且的估计均方误差随着数据总量n的增加而减小。进一步,我们可以观察到等式中括号内的右侧项为加权平均方差,其中权重αk与噪声类型为k的对应数据量成正比。
[0031]
然而,样本平均估计不一定会产生与给定数据的最小均方误差。我们用一个简单的例子来说明这个问题:考虑有两个加入噪声的数据a和b,他们自身的方差分别为1和10。当我们只使用a进行估计时,估计均方误差直接是的1。而在加入数据b后,估计均方误差变为1/2
×
(12
×
1+12
×
10)=2.75,比以前更差。
[0032]
更具体地说,当一条新的加噪声数据的方差σ2满足以下条件时,引入这条数据参与估计后均方误差反而会增加:
[0033][0034]
我们可以发现,右侧的值是两倍的数据加权平均方差。结果表明,具有较大噪声(约为平均噪声的两倍)的数据对估计有负面影响。为了改进这个估计方法,提出了最优加权平均方法来最小化估计均方误差。
[0035]
s3.对于各个用户的带噪用户用电数据按照时间段分别进行加权平均估计,得到基于最优加权优化的用户用电模式画像估计结果。
[0036]
直观地看,噪声较小的数据比噪声较大的数据对估计的贡献更大。因此,只是简单地平均不同的数据是不够好的。相反,给它们提供不同的权重并进行加权平均可以产生更好的估计。这促使我们对不同的时间段t分别进行以下加权平均估计:
[0037][0038]
其中w
t,k
表示为t时刻具有k型噪声的数据设计的权重因子。对于所有权值w
t,k
≥0,显然是一个无偏估计。均方误差满足:
[0039][0040]
现在我们可以选择最优的权值w
t,k
来最小化均方误差
[0041]
令对变量w
t,k
求导,并令导数为0,解得最优权重w
t,k
的值,即最优权重,我们可以证明满足最小化估计均方误差的最优权值满足:
[0042][0043]
在本技术的实施例中,还可以对最优加权优化算法的性能评估
[0044]
对于最优权值,最小均方误差满足
[0045][0046]
最优权值只与var(d
t
)和注入噪声的方差有关。具有较大噪声数据的方差导致较小的权重w
t,k
。而且它们与nk的数据量无关。进一步,我们发现我们通过最优权重设计,将方差优化为了加权几何均方误差,理论上比之前样本平均得到的加权平均均方误差小。
[0047]
在本技术的实施例中,验证了最优加权估计的性能改进,在仿真过程中利用用户用电数据集进行用户画像聚类研究,我们进行了多次用户数据的随机采样和噪声注入,比较了加入噪声后最优加权估计法和样本平均估计法对聚类中心点的估计偏差。
[0048]
图2显示了最优加权聚类比样本平均聚类的改进,具体来说,图3显示了估计误差的分布,最优加权聚类可以将估计误差减少10.2%。此外,对于大估计偏差的情况,图2表明,最优加权聚类可以显著降低发生较大估计偏差的概率,这证明了最优加权方法的有效性。
[0049]
尽管为了说明的目的,已描述了本发明的示例性实施方式,但是本领域的技术人员将理解,不脱离所附权利要求中公开的发明的范围和精神的情况下,可以在形式和细节上进行各种修改、添加和替换等的改变,而所有这些改变都应属于本发明所附权利要求的保护范围,并且本发明要求保护的方法中的各个步骤,可以以任意组合的形式组合在一起。因此,对本发明中所公开的实施方式的描述并非为了限制本发明的范围,而是用于描述本发明。相应地,本发明的范围不受以上实施方式的限制,而是由权利要求或其等同物进行限定。
技术特征:
1.一种基于最优加权优化的用户用电模式画像估计方法,其特征在于:包括以下步骤:s1.对于同类型的n个用户,对每一个用户的原始用电数据进行加噪处理,得到各个用户的带噪用户用电数据;s2.对于同类型下n个用户的用电模式画像进行估计,并确定估计结果的期望和均方误差;s3.对于各个用户的带噪用户用电数据按照时间段分别进行加权平均估计,得到基于最优加权优化的用户用电模式画像估计结果。2.根据权利要求1所述的一种基于最优加权优化的用户用电模式画像估计方法,其特征在于:所述步骤s1包括:s101.设任一用户的用电原始数据为d,其中d=(d1,d2,d3,
…
,d
t
),d1,d2,d3,
…
,d
t
表示时刻1,2,
…
,t对应的用电信息,t表示用户的原始用电数据d的时间长度;对用户的原始用电数据进行高斯加噪后,得到带噪用户用电数据其中η是服从高斯分布的t维随机变量,各个维度的元素均独立且服从无偏的高斯分布它的分布函数满足:其中σ是高斯分布的标准差,π是圆周率常数,变量x的定义域为(-∞,+∞);s102.对于同类型下的n个用户,分别对其原始用电数据执行步骤s101,得到n个带噪用户用电数据。3.根据权利要求1所述的一种基于最优加权优化的用户用电模式画像估计方法,其特征在于:所述步骤s2包括:s201.设加噪过程中共加入了k+1类不同高斯噪声,类型分别为0,1,2,
…
,k,其中类型k的高斯噪声分布为添加了类型k的高斯噪声的数目为n
k
,则s202.对于当前类型下的n个用户,估计用电模式画像,其中用户用电模式画像是指高斯加噪后得到的用户用电数据平均值,即样本的平均估计值,记为:其中,表示添加了为类型k的高斯噪声的带噪用户用电数据集合;表示第i个用户的带噪用户用电数据:其中,η
(i)
表示对第i个用户注入的高斯噪声,d
(i)
表示第i个用户的用电数据;s203.设步骤s202中得到的样本的平均估计值记为则的期望和均方误差满足:
式中,μ
t
为当前类型用户精确用户画像维度t的值,var(d
t
)表示)表示的方差,其中表示用户i在时间t的用电量。4.根据权利要求1所述的一种基于最优加权优化的用户用电模式画像估计方法,其特征在于:所述步骤s3包括:s301.对不同的时间段t分别进行以下加权平均估计:其中w
t,k
表示为t时刻具有k型噪声的数据设计的权重因子,对于所有权值w
t,k
≥0,是一个无偏估计,均方误差满足:确定最优的权值w
t,k
来最小化均方误差令对变量w
t,k
求导,并令导数为0,解得最优权重w
t,k
的值,即最优权重,最小化估计均方误差的最优权值满足:基于最优权重w
t,k
,用户用电模式画像估计满足以下公式:
技术总结
本发明公开了一种基于最优加权优化的用户用电模式画像估计方法,包括以下步骤:S1.对于同类型的N个用户,对每一个用户的原始用电数据进行加噪处理,得到各个用户的带噪用户用电数据;S2.对于同类型下N个用户的用电模式画像进行估计,并确定估计结果的期望和均方误差;S3.对于各个用户的带噪用户用电数据按照时间段分别进行加权平均估计,得到基于最优加权优化的用户用电模式画像估计结果。本发明能够有效利用带噪声的用户用电数据,通过计算最优时空权重来最小化估计值的方差,从而得到最优的用户画像估计结果。优的用户画像估计结果。优的用户画像估计结果。
技术研发人员:吴辰晔 卢晨贝
受保护的技术使用者:香港中文大学(深圳)
技术研发日:2023.07.12
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/