一种基于K-Means算法预测集中控制器下空气开关状态的方法与流程
未命名
09-22
阅读:116
评论:0
一种基于k-means算法预测集中控制器下空气开关状态的方法
技术领域
1.本发明涉及计算机技术领域,具体是一种基于k-means算法预测集中控制器下空气开关状态的方法。
背景技术:
2.集中控制器是一款带边缘计算、具有云通信接口的远程智能时控开关,它不仅具有传统时控器的定时开关灯、经纬度日出日落开关灯、光照度控制开关灯等功能,同时还具有远程控制功能,用户可以通过云管理中心远程控制每个控制器的开关状态和设置开关时间,有效降低设备系统的运营维护成本,提高管理维护效率。
3.集中控制器一般装配在配电柜,配电柜下挂载不同空开的设备。目前其开关状态无法通过自身进行回传及通讯上报,仅能通过电流和负载时功耗进行判断,部分集中控制器受制于安装环境、4g网络存在信号弱的情况,导致在开灯后,无数据或者数据上报不及时,并且每台集中器设备产生的电流和负载均不一致,同时通过电流和负载时功耗判断当日是否开启容易存在误判的可能性。
技术实现要素:
4.本发明的目的在于解决背景技术中所述的不足,提供一种基于k-means算法预测集中控制器下空气开关状态的方法,实现对空气开关状态的判断。
5.实现本发明目的的技术方案是:一种基于k-means算法预测集中控制器下空气开关状态的方法,包括如下步骤:1)将集中控制器数据采集系统的历史运行数据,使用大数据分析引擎提取至离线数据仓,再获取到离线数据仓采样的历史时间窗运行时间序列状态数据中的电压、电流、功率和能耗参数;2) 首先按照设备独有的名称将设备进行分类,计算每一个配电箱的总电流、总功率、能耗差值;以va表示某一集中器设备运行的a相电压参数,v
b 表示其b相电压参数,v
c 表示其c相电压参数;以ia表示某一集中器设备运行的a相电流参数,i
b 表示其b相电流参数,i
c 表示其c相电流参数;则:p
w = |v
a * ia| + |v
b * ib| + |v
c * ic|
ꢀꢀ
(1)公式(1)中,pw表示其总有功功率;x
e = w
t
ꢀ‑ꢀwt-1
(2)公式(2)中,w
t
表示当前能耗参数,w
t-1
表示上一个时间点记录能耗参数,xe表示当前能耗参数与上一个能耗参数的差;i = i
a + i
b + ic(3)公式(3)中i表示总电流;以xa表示其电流参数,xw表示其功率参数,xe表示能耗参数,根据如上公式(1)、(2)
和(3)得出某一设备的总有功功率pw、能耗差xe、总电流i;将电压、电流、功率和能耗参数进行特征标准化,其中特征标准化的公式如下: (4)公式(4)中,分别将pw、xe、i替换式(4)中的x值,其中mean表示该设备每一列数据的平均值,σ表示每一列的标准差(考量数据的稳定性),表示每列特征归一化后的值;3)将标准化后的参数划分为训练集和测试集;其中所述的训练集和测试集的比例为8:2。
6.4)将训练集输入k-means聚类算法模型中,对模型进行训练,获取模型的最优迭代参数;步骤4)中,所述的k-means聚类算法,用于寻找数据集合中的类,将样本聚类成2个簇,具体步骤如下:4-1)随机选取2个聚类质心点(cluster centroids),则表示存在了2个簇c
(k)
,其中μ
1、
μ
2、
...、μk∈rn;4-2)对于每一个x(i),计算其与每个质心μj的距离,x(i)则属于与它距离最近质心μj的簇c
(j)
:
ꢀꢀ
(2)4-3)对于每一个簇c
(j)
,重新计算该簇质心的值,计算公式如下: (3)4-4)使用误差平方和得出最优的迭代次数,计算公式如下:
ꢀꢀ
(4)重复步骤4-2)、步骤4-3)步骤4-4)直至k-means聚类算法收敛,得出最优迭代次数;5)利用测试集对训练好k-means聚类算法模型进行测试,若测试结果与预期结果一致,则将训练好的k-means聚类算法模型参数保存;6)程序设置定时策略,每周自动加载模型参数,选择最新30天历史数据作为训练集进行训练并将模型保存到分布式文件存储系统中;同时加载需要预测的数据经过特征标准化后,输入k-means聚类算法模型中进行预测,获得预测结果。
7.与现有技术相比,本发明的有益效果是:1、本发明针对目前实际应用中集中控制器下未安装霍尔传感器的基础上,以集中
控制器与数据采集系统的电力数据为对象,提供一种准确的开关状态判断的方法。针对不同的集中控制器设备,对其电力数据进行单独的数据归一化,使用k均值聚类算法结合电流、功率、用能差值进行分类计算,克服了不同集中器设备、不同负载的情况下实现准确预判。
8.2、本发明基于k均值聚类算法模型实现对集中控制器空气开关的状态预测。随着设备累计样本数据逐渐增多,模型可自动选取最新的数据对已训练好的模型进行定期增量训练和模型优化,增强模型的泛化能力,提高模型的开关状态辨别率。方法简单易行,具有很高的工程应用价值。
附图说明
9.图1为本发明一种基于k-means算法预测集中控制器下空气开关状态的方法的流程图;图2 为某一集中控制器与数据采集系统设备运行数据信息示意图;图3 为某一集中控制器运行的电流、有功功率、能耗归一化后的数据信息示意图;图4 为某一集中控制器运行的电流、有功功率、能耗数据的3维分布点图;图5 为某一集中控制器使用k-means聚类算法预测空气开关状态结果信息示意图;图6 为某一集中控制器空气开关预测结果展示界面图;图7 为一种基于k-means算法预测集中控制器下空气开关状态的方法具体实施流程图。
实施方式
10.以下结合附图对本发明进行进一步的详细说明,所举实例只用于解释本发明,并非用于限定本发明的范围。
11.采用上述技术方案中的一种基于k-means算法预测集中控制器下空气开关状态的方法,方法流程如图1和图7所示,结合具体数据进行测试,包括如下步骤:步骤1:将如图2所示的集中控制器数据采集系统的历史运行数据,使用大数据分析引擎apache spark提取至离线数据仓,再使用spark on hive技术获取到离线数据仓采样的历史时间窗运行时间序列状态数据中的电压、电流、功率和能耗参数;步骤2:对某一设备电力参数a相电压、b相电压、c相电压、a相电流、b相电流、c相电流按式(1)进行计算获得总有功功率参数pw。对相邻两个时间点的能耗按式(2)计算获得能耗差xe。对a相电流、b相电流、c相电流按式(3)计算获得总电流i。对某一设备已计算的总有功功率参数pw、能耗差xe、总电流i作为输入信号进行数据归一化。重复步骤(2),直到提取所有设备运行参数的特征信息,数据详情可参考图3、图4。
12.步骤3:引入网格搜索对k-means进行迭代训练,使用误差平方之和来评估数据模型,统计聚类错误的样本比例,求解k-means最佳迭代次数k。下列表格为某次k-means空气开关状态预测的误差平方之和(取决于数据量),程序自动基于最小误差平方和选择最佳迭代次数。迭代数据量迭代次数误差平方和
36996326771.50100533007836996336771.50098911943836996346771.50098911943736996356771.50098911943836996366771.50098911943836996376771.500989119438步骤4:根据表中参数优化结果,定期将步骤(2)中的特征信息向量化后放入k-means模型中进行训练,将最新的模型保存到分布式文件存储系统中。获取最新的电力数据集,重复步骤(2)获取电力数据特征信息,再加载k-means模型计算预测的结果。
13.采用上述方法和数据,预测结果如图5和图6所示,通过图5和图6可以看出,采用本发明的方法,预测准确,精度高。
技术特征:
1.一种基于k-means算法预测集中控制器下空气开关状态的方法,其特征在于,包括如下步骤:1)将集中控制器数据采集系统的历史运行数据,使用大数据分析引擎提取至离线数据仓,再获取到离线数据仓采样的历史时间窗运行时间序列状态数据中的电压、电流、功率和能耗参数;2) 首先按照设备独有的名称将设备进行分类,计算每一个配电箱的总电流、总功率、能耗差值;以v
a
表示某一集中器设备运行的a相电压参数,v
b 表示其b相电压参数,v
c 表示其c相电压参数;以i
a
表示某一集中器设备运行的a相电流参数,i
b 表示其b相电流参数,i
c 表示其c相电流参数;则:p
w = |v
a *i
a
| + |v
b *i
b
| + |v
c *i
c
|
ꢀꢀ
(1)公式(1)中,p
w
表示其总有功功率;x
e = w
t
ꢀ‑ꢀ
w
t-1
(2)公式(2)中,w
t
表示当前能耗参数,w
t-1
表示上一个时间点记录能耗参数,x
e
表示当前能耗参数与上一个能耗参数的差;i = i
a + i
b + i
c
(3)公式(3)中i表示总电流;以x
a
表示其电流参数,x
w
表示其功率参数,x
e
表示能耗参数,根据如上公式(1)、(2)和(3)得出某一设备的总有功功率p
w
、能耗差x
e
、总电流i;将电压、电流、功率和能耗参数进行特征标准化,其中特征标准化的公式如下:(4)公式(4)中,分别将p
w
、x
e
、i替换式(4)中的x值,其中mean表示该设备每一列数据的平均值,σ表示每一列的标准差,表示每列特征归一化后的值;3)将标准化后的参数划分为训练集和测试集;4)将训练集输入k-means聚类算法模型中,对模型进行训练,获取模型的最优迭代参数;5)利用测试集对训练好k-means聚类算法模型进行测试,若测试结果与预期结果一致,则将训练好的k-means聚类算法模型参数保存;6)程序设置定时策略,每周自动加载模型参数,选择最新30天历史数据作为训练集进行训练并将模型保存到分布式文件存储系统中;同时加载需要预测的数据经过特征标准化后,输入k-means聚类算法模型中进行预测,获得预测结果。2.根据权利要求1所述的一种基于k-means算法预测集中控制器下空气开关状态的方法,其特征在于,步骤3)中,所述的训练集和测试集的比例为8:2。3.根据权利要求1所述的一种基于k-means算法预测集中控制器下空气开关状态的方法,其特征在于,步骤4)中,所述的k-means聚类算法,用于寻找数据集合中的类,将样本聚
类成2个簇,具体步骤如下:4-1)随机选取2个聚类质心点(cluster centroids),则表示存在了2个簇c
(k)
,其中μ
1、
μ
2、
...、μ
k
∈r
n
;4-2)对于每一个x
(i)
,计算其与每个质心μ
j
的距离,x
(i)
则属于与它距离最近质心μ
j
的簇c
(j)
: (2)4-3)对于每一个簇c
(j)
,重新计算该簇质心的值,计算公式如下:
ꢀꢀ
(3)4-4)使用误差平方和得出最优的迭代次数,计算公式如下:
ꢀꢀ
(4)重复步骤4-2)、步骤4-3)步骤4-4)直至k-means聚类算法收敛,得出最优迭代次数。
技术总结
本发明公开了一种基于K-Means算法预测集中控制器下空气开关状态的方法,该方法针对目前实际应用中集中控制器下未安装霍尔传感器的基础上,以集中控制器与数据采集系统的电力数据为对象,针对不同的集中控制器设备,对其电力数据进行单独的数据归一化,使用K均值聚类算法结合电流、功率、用能差值进行分类计算,克服了不同集中器设备、不同负载的情况下实现准确预判。基于K均值聚类算法模型实现对集中控制器空气开关的状态预测。随着设备累计样本数据逐渐增多,模型可自动选取最新的数据对已训练好的模型进行定期增量训练和模型优化,增强模型的泛化能力,提高模型的开关状态辨别率。方法简单易行,具有很高的工程应用价值。具有很高的工程应用价值。具有很高的工程应用价值。
技术研发人员:唐江华 梁勋 余金伟 唐嘉鸣 狄艾力 王建卫 周明
受保护的技术使用者:桂林海威科技股份有限公司
技术研发日:2023.03.28
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/