控制方法及控制模型的训练方法、装置、设备和存储介质与流程

未命名 08-29 阅读:236 评论:0


1.本公开涉及人工智能技术领域,具体涉及图像识别、深度学习、计算机视觉等技术领域,尤其涉及一种控制方法及控制模型的训练方法、装置、设备和存储介质。


背景技术:

2.在大型建筑体的整体能耗中,制冷系统的能耗占比很大,并且可控设备大多存在于制冷系统中,因此,制冷系统的优化控制是建筑体节能减排的关键。


技术实现要素:

3.本公开提供了一种控制方法及控制模型的训练方法、装置、设备和存储介质。
4.根据本公开的一方面,提供了一种控制方法,包括:基于目标对象的当前感知信息,确定所述目标对象的目标状态量;基于所述目标状态量,确定所述目标对象的目标控制量;基于所述目标控制量,控制所述目标对象。
5.根据本公开的另一方面,提供了一种控制模型的训练方法,包括:获取目标对象的历史数据,所述历史数据包括:历史感知信息和历史状态量;基于历史能耗值,在所述历史数据中获取训练数据;基于所述训练数据,训练所述目标对象对应的控制模型;其中,所述控制模型用于根据所述目标对象的当前感知信息确定所述目标对象的目标状态量,所述目标状态量用于确定目标控制量,所述目标控制量用于控制所述目标对象。
6.根据本公开的另一方面,提供了一种控制装置,包括:第一确定模块,用于基于目标对象的当前感知信息,确定所述目标对象的目标状态量;第二确定模块,用于基于所述目标状态量,确定所述目标对象的目标控制量;控制模块,用于基于所述目标控制量,控制所述目标对象。
7.根据本公开的另一方面,提供了一种控制模型的训练装置,包括:第一获取模块,用于获取目标对象的历史数据,所述历史数据包括:历史感知信息和历史状态量;第二获取模块,用于基于历史能耗值,在所述历史数据中获取训练数据;训练模块,用于基于所述训练数据,训练所述目标对象对应的控制模型;其中,所述控制模型用于根据所述目标对象的当前感知信息确定所述目标对象的目标状态量,所述目标状态量用于确定目标控制量,所述目标控制量用于控制所述目标对象。
8.根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。
9.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。
10.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算
机程序在被处理器执行时实现根据上述任一方面的任一项所述的方法。
11.根据本公开的技术方案,可以提高控制效果。
12.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
13.附图用于更好地理解本方案,不构成对本公开的限定。其中:
14.图1是根据本公开第一实施例的示意图;
15.图2是本公开实施例提供的应用场景的示意图;
16.图3是根据本公开实施例提供的控制方法的整体框架的示意图;
17.图4是根据本公开第二实施例的示意图;
18.图5是根据本公开第三实施例的示意图;
19.图6是根据本公开第四实施例的示意图;
20.图7是根据本公开第五实施例的示意图;
21.图8是用来实现本公开实施例的控制方法或控制模型的训练方法的电子设备的示意图。
具体实施方式
22.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
23.相关技术中,针对制冷系统,可以基于专家系统或数据驱动方式,对制冷系统进行控制。
24.专家系统,也可称之为专家规则,通常是基于自动控制逻辑设计的一套参数和目标,以“非建模”的方式去调节制冷系统的控制量,一般不受限于数据量,再基于控制量对制冷系统进行控制。
25.数据驱动方式,是一种端到端控制方式,通常是通过人工智能(artificialintelligence,ai)模型直接确定制冷系统所涉及的控制量,再基于控制量对制冷系统进行控制。
26.专家系统需要确定目标值,相关技术中,该目标值是人为设定的,例如,针对制冷系统中的冷却塔,人为设定冷却塔的出水温度的目标值。
27.由于目标值是人为设定的,在准确度以及效率等方面都存在问题。
28.数据驱动方式是基于ai模型直接确定控制量,由于控制量的数量较多,解空间巨大,数据依赖性强,在制冷系统这种数据量较少的场景下,适用性较差。
29.为此,基于上述的专家系统或数据驱动方式都存在一定问题,控制效果有待提升。
30.为了提高控制效果,本公开提供如下实施例。
31.图1是根据本公开第一实施例的示意图,本实施例提供一种控制方法,该方法包括:
32.101、基于目标对象的当前感知信息,确定所述目标对象的目标状态量。
33.102、基于所述目标状态量,确定所述目标对象的目标控制量。
34.103、基于所述目标控制量,控制所述目标对象。
35.其中,目标对象是指待控制的对象,以制冷系统为例,目标对象例如包括冷却塔、冷却水泵、冷水机组等中的一项或多项。
36.当前感知信息,是指目标对象当前情况下的相关信息,具体可以包括当前环境信息,和/或,当前工况信息。当前环境信息例如包括目标对象当前所处环境的室外温度、室外湿度、室内温度、室内湿度等中的一项或多项。当前工况信息例如包括目标对象当前运行的开关状态、风扇频率、水泵频率、进水侧水温、出水侧水温等中的一项或多项。
37.状态量,是描述目标对象状态的物理量,以冷却塔为例,状态量可以是指冷却塔的出水温度。
38.目标状态量,是指目标对象期望达到的状态量,以目标对象为上述的冷却塔为例,目标状态量可以具体是指目标出水温度。
39.控制量,是描述目标对象的控制信号的物理量,以冷却塔为例,冷却塔的出水温度可以通过调节冷却塔内风扇的频率来控制,相应的控制量可以包括风扇频率。
40.目标控制量,是指与目标状态量对应的控制量。例如,目标状态量是目标出水温度,且目标出水温度是23℃,目标控制量包括使得出水温度是23℃的目标风扇频率。
41.确定目标控制量后,可以基于该目标控制量控制目标对象,例如,控制冷却塔的风扇频率为确定出的目标风扇频率。
42.本实施例中,基于当前感知信息确定目标状态量,相对于设置固定的目标状态量的方式,可以提高控制准确度和效率;通过确定目标状态量,再基于目标状态量确定目标控制量,相对于直接确定目标控制量的方式,可以降低对数据量的依赖,在较少数据量的场景下依然适用,提高适用性。由于提高了控制准确度和效率,提高了适用性,也就提升了控制效果。
43.为了更好地理解本公开,对本公开实施例的应用场景进行说明。
44.图2是本公开实施例提供的应用场景的示意图。本实施例以制冷系统为例。如图2所示,制冷系统包括冷冻侧和冷却侧。冷冻侧包括:冷冻水一次泵201、冷冻水二次泵202、冷水机组203、板式换热器204、蓄冷罐205等制冷设备。冷却侧包括:冷却塔206、冷却水泵207等制冷设备。其中冷却侧是充当一种冷源,帮助冷水机组或者板式换热器实现降低冷冻水温的功能。冷却侧的水源可以是市政水,例如,市政水输送到冷却塔206内,经过冷却塔206的冷却处理后,得到冷却水,并通过冷却水泵207输送至冷却侧。冷冻侧通过与冷却水进行热量交换得到冷冻水,冷冻水被输送到精密空调中,通过精密空调对机房进行降温。
45.对制冷系统进行控制时,可以控制上述制冷设备中的一项或多项,待控制的制冷设备可以称为目标对象。
46.针对每个目标对象,可以采用一个专家系统,对相应的目标对象进行控制。例如,针对冷却塔采用一个专家系统进行控制,针对冷却水泵采用另一个专家系统进行控制。
47.专家系统可以具体为比例积分微分(proportional-integral-derivative,pid)控制器。pid控制器是一个在工业控制应用中的反馈回路部件,该pid控制器把收集到的数据和一个参考值进行比较,然后基于两者的差别计算系统的新的输入值,该新的输入值的
目的是可以让系统的数据达到或者保持在参考值。
48.具体到本实施例中,如图3所示,以目标对象是冷却塔301为例,pid控制器302的输入包括:冷却塔的目标状态量(如目标出水温度)和该冷却塔的当前状态量(如当前出水温度),输出为该冷却塔的目标控制量(如目标风扇频率)。
49.相关技术中,目标状态量是人为设定的,而本实施例中,如图3所示,是基于目标对象的当前感知信息确定的,具体可以将当前感知信息输入到预先训练的机器学习模型303中,机器学习模型的输出为目标状态量。
50.由于目标状态量是基于当前感知信息确定的,因此,可以得到更符合当前情况的目标状态量,相对于人为设定的固定的目标状态量,更为精准和有效率,进而可以提高控制准确度和效率。
51.另外,如图3所示,针对目标对象(如冷却塔),其目标控制量是pid控制器基于目标状态量确定的,而不是利用ai模型基于当前感知信息直接确定的目标控制量。目标状态量的数量通常是远小于目标控制量的数量的,例如,制冷系统中包括多个冷却塔,个数用n(大于1的正整数)表示,即使每个冷却塔的控制量只包括风扇频率,那n个冷却塔需要n个控制量,但是,针对这n个冷却塔可以确定一个目标出水温度,即目标状态量只有一个,因此,可以显著降低解空间的大小,降低数据依赖性,提升适用性。
52.进一步地,目标对象为多种时,机器学习模型可以为多个,每个机器学习模型对应一种目标对象,或者,机器学习模型可以为一个,通过该一个机器学习模型输出多种目标对象对应的目标状态量。例如,目标对象包括冷却塔和冷却水泵,可以预先训练两个机器学习模型,分别对应冷却塔和冷却水泵,通过冷却塔对应的机器学习模型,得到冷却塔对应的目标状态量,如目标出水温度,通过冷却水泵对应的机器学习模型,得到冷却水泵对应的目标状态量,如目标水泵频率。或者,机器学习模型为一个,该一个机器学习模型包括两种输出,分别是冷却塔对应的目标状态量和冷却水泵对应的目标状态量。
53.结合上述的应用场景,本公开还提供一种控制方法。
54.图4是根据本公开第二实施例的示意图,本实施例提供一种控制方法,该方法包括:
55.401、获取目标对象的当前感知信息。
56.其中,可以通过传感器获知目标对象的当前感知信息。
57.当前感知信息可以包括当前环境信息和/或当前工况信息,以当前感知信息包括当前环境信息,且当前环境信息为当前室外温度为例,可以通过温度传感器获知当前室外温度。
58.402、采用预先训练的机器学习模型,对所述当前感知信息进行处理,以确定所述目标对象的目标状态量。
59.其中,机器学习模型的输入是当前感知信息,输出是目标状态量。
60.目标对象为多种时,可以每种目标对象对应一个机器学习模型,采用每种目标对象对应的机器学习模型获得该目标对象的目标状态量。或者,采用同一个机器学习模型对输入的当前感知信息进行处理,输出多种目标对象对应的目标状态量。
61.以目标对象是冷却塔为例,其对应的目标状态量是目标出水温度,因此,基于机器学习模型可以获得冷却塔对应的目标出水温度。
62.机器学习模型可以具体为多项式回归模型,或者为极度梯度提升树(extremegradientboosting,xgboost)模型。
63.本实施例中,采用机器学习模型确定目标状态量,可以获得更为精准的目标状态量,从而提升控制精准度。
64.进一步地,所述机器学习模型是基于训练数据训练的,且所述训练数据是基于历史能耗值,在所述目标对象的历史数据中获取的,所述历史数据包括:历史感知信息和历史状态量。
65.其中,在目标对象运行过程中可以记录目标对象的历史数据,历史数据包括历史感知信息(如历史室外温度)和历史状态量(如历史出水温度),还可以记录历史能耗值,从而可以从记录数据中获取历史数据和历史能耗值。历史能耗值可以为目标对象自身的能耗值,或者还可以为目标对象所在系统的整体能耗值。以整体能耗值为例,例如,目标对象是冷却塔,冷却塔所在的制冷系统还包括其他设备,如冷却水泵、冷水机组等,上述的历史能耗值是该制冷系统所包含的所有设备的整体能耗值。
66.获取历史数据(历史感知信息和历史状态量)和历史能耗值后,可以根据历史能耗值从小到大的顺序选择预设数量的历史数据作为训练数据,采用该训练数据训练机器学习模型。
67.上述的机器学习模型可以称为控制模型,关于控制模型的具体训练过程可以参见后续相关实施例。
68.本实施例中,训练数据是基于历史能耗值获取的,可以选择历史能耗值较小的历史数据作为训练数据,使得机器学习模型具有节能的特性,即目标对象在机器学习模型确定的目标状态量下运行,目标对象或目标对象所在系统更为节能,从而可以降低能耗,实现节能减排效果。
69.进一步地,所述目标状态量的数量是第一数量,所述目标控制量的数量是第二数量,且所述第一数量小于所述第二数量。
70.例如,制冷系统中可以包括多个冷却塔,每个冷却塔具有一个目标风扇频率,假设多个冷却塔的数量用n表示,则目标控制量的数量是n(大于1的正整数),而目标状态量可以只是一个目标出水温度,此时的第一数量是1,第二数量是n。
71.本实施例中,通过机器学习模型确定目标状态量,且目标状态量的数量小于目标控制量的数量,由于目标状态量的数量较少,可以降低解空间大小,降低机器学习模型的学习难度,提升适用性。
72.403、采用预设的专家系统,基于所述目标状态量和所述目标对象的当前状态量,确定所述目标对象的目标控制量。
73.其中,预设的专家系统可以具体为pid控制器,pid控制器的输入包括目标状态量和当前状态量,输出为目标控制量。
74.例如,针对冷却塔,pid控制器可以基于目标出水温度和当前出水温度,确定冷却塔的目标风扇频率。
75.本实施例中,采用专家系统确定目标控制量,由于专家系统是以“非建模”的方式去调节控制量,不受限于数据量,因此在制冷系统这种数据量少的场景下依然适用,可以提高适用性。
76.404、基于所述目标控制量,控制所述目标对象。
77.例如,pid控制器向冷却塔发送控制指令,该控制指令用于控制冷却塔的风扇以目标风扇频率运行。
78.本实施例中,整体上基于专家系统基于目标状态量确定目标控制量,相对于利用ai模型直接确定目标控制量的方式,可以降低数据依赖性,提升适用性。目标状态量是通过机器学习模型确定的,相对于一般专家系统的人为设定目标状态量的方式,可以提高准确度和效果。
79.上述涉及了控制模型,下面对该模型的训练过程进行说明。
80.图5是根据本公开第三实施例的示意图,本实施例提供一种控制模型的训练方法,该方法包括:
81.501、获取目标对象的历史数据,所述历史数据包括:历史感知信息和历史状态量。
82.502、基于历史能耗值,在所述历史数据中获取训练数据。
83.503、基于所述训练数据,训练所述目标对象对应的控制模型。
84.其中,所述控制模型用于根据所述目标对象的当前感知信息确定所述目标对象的目标状态量,所述目标状态量用于确定目标控制量,所述目标控制量用于控制所述目标对象。
85.即,该训练过程所得到的控制模型可以用于上述的控制过程。
86.其中,目标对象在运行过程中可以记录相关数据,从而基于记录数据可以获取上述的历史数据和历史能耗值。
87.历史能耗值可以为目标对象自身的能耗值,或者还可以为目标对象所在系统的整体能耗值。以整体能耗值为例,例如,目标对象是冷却塔,冷却塔所在的制冷系统还包括其他设备,如冷却水泵、冷水机组等,上述的历史能耗值是该制冷系统所包含的所有设备的整体能耗值。
88.获取历史数据(历史感知信息和历史状态量)和历史能耗值后,可以根据历史能耗值从小到大的顺序选择预设数量的历史数据作为训练数据,采用该训练数据训练机器学习模型。
89.例如,第一历史感知信息和第一历史状态量对应第一历史能耗值,第二历史感知信息和第二历史状态量对应第二历史能耗值,第三历史感知信息和第三历史状态量对应第三历史能耗值,第一历史能耗值、第二历史能耗值和第三历史能耗值依次增大,若需要选择2组训练数据,则选择第一历史感知信息和第一历史状态量,以及第二历史感知信息和第二历史状态量作为训练数据。
90.训练数据包括历史感知信息和历史状态量,训练模型时,可以将历史感知信息输入到模型中,以输出预测状态量,将历史状态量作为真值,基于预测状态量和历史状态量构建损失函数,基于损失函数调整模型参数,直至满足预设条件(如达到预设迭代次数),得到最终的控制模型。
91.控制模型的结构可以根据实际需要选择,如多项式回归模型或xgboost)模型等。
92.本实施例中,通过训练数据训练控制模型,可以采用该控制模型基于当前感知信息确定目标状态量,相对于设置固定的目标状态量的方式,可以提高控制准确度和效率;通过确定目标状态量,再基于目标状态量确定目标控制量,相对于直接确定目标控制量的方
式,可以降低对数据量的依赖,在较少数据量的场景下依然适用,提高适用性。由于提高了控制准确度和效率,提高了适用性,也就提升了控制效果。另外,基于历史能耗值获取训练数据,基于训练数据训练控制模型,可以获得具有节能特性的控制模型,进而在控制过程中可以降低能耗。
93.一些实施例中,所述历史数据为多组,所述基于历史能耗值,在所述历史数据中获取训练数据,包括:基于所述历史感知信息,将所述多组历史数据划分到至少一个区间内;在同一个区间内,根据所述历史能耗值从小到大的顺序,选择预设数量的历史数据作为所述训练数据。
94.其中,每组历史数据包括历史感知信息和历史状态量。
95.以历史感知信息是历史室外温度为例,可以根据历史室外温度,将多组历史数据划分到多个区间内。
96.其中,可以设置各个区间的温度范围,如将历史室外温度为0~10℃的历史数据划分为一个区间,将历史室外温度为10℃~20℃的历史数据划分为另一个区间等。在每个区间内,可以基于历史能耗值降序选择预设数量的历史数据作为训练数据。如每个区间内可以选择m(m为正整数)组的历史数据,假设共有l(l为正整数)个区间,则获取m*l组的历史数据。
97.本实施例中,通过在同一个区间内的历史数据中根据历史能耗值选择训练数据,可以在历史感知信息相近的情况下基于历史能耗值进行选择,提升训练数据的准确度,进而提高控制模型和控制方法的精准度。
98.图6是根据本公开第四实施例的示意图,本实施例提供一种控制装置,该装置600包括:第一确定模块601、第二确定模块602和控制模块603。
99.第一确定模块601用于基于目标对象的当前感知信息,确定所述目标对象的目标状态量;第二确定模块602用于基于所述目标状态量,确定所述目标对象的目标控制量;控制模块603用于基于所述目标控制量,控制所述目标对象。
100.本实施例中,基于当前感知信息确定目标状态量,相对于设置固定的目标状态量的方式,可以提高控制准确度和效率;通过确定目标状态量,再基于目标状态量确定目标控制量,相对于直接确定目标控制量的方式,可以降低对数据量的依赖,在较少数据量的场景下依然适用,提高适用性。由于提高了控制准确度和效率,提高了适用性,也就提升了控制效果。
101.一些实施例中,所述第一确定模块601进一步用于:采用预先训练的机器学习模型,对所述当前感知信息进行处理,以确定所述目标状态量。
102.本实施例中,采用机器学习模型确定目标状态量,可以获得更为精准的目标状态量,从而提升控制精准度。
103.一些实施例中,所述机器学习模型是基于训练数据训练的,且所述训练数据是基于历史能耗值,在所述目标对象的历史数据中获取的,所述历史数据包括:历史感知信息和历史状态量。
104.本实施例中,训练数据是基于历史能耗值获取的,可以选择历史能耗值较小的历史数据作为训练数据,使得机器学习模型具有节能的特性,即目标对象在机器学习模型确定的目标状态量下运行,目标对象或目标对象所在系统更为节能,从而可以降低能耗,实现
节能减排效果。
105.一些实施例中,所述目标状态量的数量是第一数量,所述目标控制量的数量是第二数量,且所述第一数量小于所述第二数量。
106.本实施例中,通过机器学习模型确定目标状态量,由于目标状态量的数量较少,可以降低解空间大小,降低机器学习模型的学习难度,提升适用性。
107.一些实施例中,所述第二确定模块702进一步用于:采用预设的专家系统,基于所述目标状态量和所述目标对象的当前状态量,确定所述目标控制量。
108.本实施例中,采用专家系统确定目标控制量,由于专家系统是以“非建模”的方式去调节控制量,不受限于数据量,因此在制冷系统这种数据量少的场景下依然适用,可以提高适用性。
109.图7是根据本公开第五实施例的示意图,本实施例提供一种控制模型的训练装置,该装置700包括:第一获取模块701、第二获取模块702和训练模块703。
110.第一获取模块701用于获取目标对象的历史数据,所述历史数据包括:历史感知信息和历史状态量;第二获取模块702用于基于历史能耗值,在所述历史数据中获取训练数据;训练模块703用于基于所述训练数据,训练所述目标对象对应的控制模型;其中,所述控制模型用于根据所述目标对象的当前感知信息确定所述目标对象的目标状态量,所述目标状态量用于确定目标控制量,所述目标控制量用于控制所述目标对象。
111.本实施例中,通过训练数据训练控制模型,可以采用该控制模型基于当前感知信息确定目标状态量,相对于设置固定的目标状态量的方式,可以提高控制准确度和效率;通过确定目标状态量,再基于目标状态量确定目标控制量,相对于直接确定目标控制量的方式,可以降低对数据量的依赖,在较少数据量的场景下依然适用,提高适用性。由于提高了控制准确度和效率,提高了适用性,也就提升了控制效果。另外,基于历史能耗值获取训练数据,基于训练数据训练控制模型,可以获得具有节能特性的控制模型,进而在控制过程中可以降低能耗。
112.一些实施例中,所述历史数据为多组,所述第二获取模块702进一步用于:基于所述历史感知信息,将所述多组历史数据划分到至少一个区间内;在同一个区间内,根据所述历史能耗值从小到大的顺序,选择预设数量的历史数据作为所述训练数据。
113.本实施例中,通过在同一个区间内的历史数据中根据历史能耗值选择训练数据,可以在历史感知信息相近的情况下基于历史能耗值进行选择,提升训练数据的准确度,进而提高控制模型和控制方法的精准度。
114.可以理解的是,本公开实施例中,不同实施例中的相同或相似内容可以相互参考。
115.可以理解的是,本公开实施例中的“第一”、“第二”等只是用于区分,不表示重要程度高低、时序先后等。
116.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
117.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
118.图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、服务器、
刀片式服务器、大型计算机、和其它适合的计算机。电子设备800还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
119.如图8所示,电子设备800包括计算单元801,其可以根据存储在只读存储器(rom)802中的计算机程序或者从存储单元808加载到随机访问存储器(ram)803中的计算机程序,来执行各种适当的动作和处理。在ram803中,还可存储电子设备800操作所需的各种程序和数据。计算单元801、rom802以及ram803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
120.电子设备800中的多个部件连接至i/o接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许电子设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
121.计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如控制方法或控制模型的训练方法。例如,在一些实施例中,控制方法或控制模型的训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由rom802和/或通信单元809而被载入和/或安装到电子设备800上。当计算机程序加载到ram803并由计算单元801执行时,可以执行上文描述的控制方法或控制模型的训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行控制方法或控制模型的训练方法。
122.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
123.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程负载均衡装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
124.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可
读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
125.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
126.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
127.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtualprivate server",或简称"vps")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
128.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
129.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

技术特征:
1.一种控制方法,包括:基于目标对象的当前感知信息,确定所述目标对象的目标状态量;基于所述目标状态量,确定所述目标对象的目标控制量;基于所述目标控制量,控制所述目标对象。2.根据权利要求1所述的方法,其中,所述基于目标对象的当前感知信息,确定所述目标对象的目标状态量,包括:采用预先训练的机器学习模型,对所述当前感知信息进行处理,以确定所述目标状态量。3.根据权利要求2所述的方法,其中,所述机器学习模型是基于训练数据训练的,且所述训练数据是基于历史能耗值,在所述目标对象的历史数据中获取的,所述历史数据包括:历史感知信息和历史状态量。4.根据权利要求2所述的方法,其中,所述目标状态量的数量是第一数量,所述目标控制量的数量是第二数量,且所述第一数量小于所述第二数量。5.根据权利要求1-4任一项所述的方法,其中,所述基于所述目标状态量,确定所述目标对象的目标控制量,包括:采用预设的专家系统,基于所述目标状态量和所述目标对象的当前状态量,确定所述目标控制量。6.一种控制模型的训练方法,包括:获取目标对象的历史数据,所述历史数据包括:历史感知信息和历史状态量;基于历史能耗值,在所述历史数据中获取训练数据;基于所述训练数据,训练所述目标对象对应的控制模型;其中,所述控制模型用于根据所述目标对象的当前感知信息确定所述目标对象的目标状态量,所述目标状态量用于确定目标控制量,所述目标控制量用于控制所述目标对象。7.根据权利要求6所述的方法,其中,所述历史数据为多组,所述基于历史能耗值,在所述历史数据中获取训练数据,包括:基于所述历史感知信息,将所述多组历史数据划分到至少一个区间内;在同一个区间内,根据所述历史能耗值从小到大的顺序,选择预设数量的历史数据作为所述训练数据。8.一种控制装置,包括:第一确定模块,用于基于目标对象的当前感知信息,确定所述目标对象的目标状态量;第二确定模块,用于基于所述目标状态量,确定所述目标对象的目标控制量;控制模块,用于基于所述目标控制量,控制所述目标对象。9.根据权利要求8所述的装置,其中,所述第一确定模块进一步用于:采用预先训练的机器学习模型,对所述当前感知信息进行处理,以确定所述目标状态量。10.根据权利要求9所述的装置,其中,所述机器学习模型是基于训练数据训练的,且所述训练数据是基于历史能耗值,在所述目标对象的历史数据中获取的,所述历史数据包括:历史感知信息和历史状态量。11.根据权利要求9所述的装置,其中,所述目标状态量的数量是第一数量,所述目标控
制量的数量是第二数量,且所述第一数量小于所述第二数量。12.根据权利要求8-11任一项所述的装置,其中,所述第二确定模块进一步用于:采用预设的专家系统,基于所述目标状态量和所述目标对象的当前状态量,确定所述目标控制量。13.一种控制模型的训练装置,包括:第一获取模块,用于获取目标对象的历史数据,所述历史数据包括:历史感知信息和历史状态量;第二获取模块,用于基于历史能耗值,在所述历史数据中获取训练数据;训练模块,用于基于所述训练数据,训练所述目标对象对应的控制模型;其中,所述控制模型用于根据所述目标对象的当前感知信息确定所述目标对象的目标状态量,所述目标状态量用于确定目标控制量,所述目标控制量用于控制所述目标对象。14.根据权利要求13所述的装置,其中,所述历史数据为多组,所述第二获取模块进一步用于:基于所述历史感知信息,将所述多组历史数据划分到至少一个区间内;在同一个区间内,根据所述历史能耗值从小到大的顺序,选择预设数量的历史数据作为所述训练数据。15.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。

技术总结
本公开提供了一种控制方法及控制模型的训练方法、装置、设备和存储介质,涉及人工智能技术领域,具体涉及物联网、机器学习等技术领域。控制方法包括:基于目标对象的当前感知信息,确定所述目标对象的目标状态量;基于所述目标状态量,确定所述目标对象的目标控制量;基于所述目标控制量,控制所述目标对象。本公开可以提高控制效果。开可以提高控制效果。开可以提高控制效果。


技术研发人员:童厚杰
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2023.04.25
技术公布日:2023/8/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐