神经网络耦合输出调节器的异构多智能体跟踪控制方法

未命名 09-29 阅读:196 评论:0


1.本发明属于多智能体系统协同控制技术领域,具体涉及一种神经网络耦合输出调节器的异构多智能体跟踪控制方法。


背景技术:

2.多智能体系统(mas)的群体智能通常体现在集群行为中,其表现形式多种多样。收敛现象在协作中比较常见,但在自然界中,分散现象同样普遍,如鱼群在遇到障碍物时分散开,蚁群在前往食物的途中分离。同理,对于多智能体系统,如覆盖、编队、包围等行为,智能体的分散行为起到了重要的作用,相关研究在民用领域具有重要的应用价值。智能体网络的二部划分是解决智能体分散的一种有效方法。二部一致性是一种基于结构平衡符号网络的多智能体行为,在二部一致性问题中,目前研究中智能体的阶数由一阶扩展到二阶甚至高阶,其动力学模型由线性逐渐扩展到非线性。除此之外,领导者-跟随者协作结构也扩展到了对称发散行为,即二部跟踪问题,目前其在移动目标捕获和群体对抗中的潜在应用而受到广泛关注。
3.另一方面,群体智能不仅仅在同构智能体之间进行,在异构智能体也同样发生。在许多实际应用中,由于特定需要和物理限制,不同的智能体往往具有不同的动态。例如,在空地协同场景下,无人机和地面车辆表现出不同的动力学特性,前者的状态量表现为三阶模型,后者的状态表现为二阶模型。要精确地建立运动物体的模型是很困难的,同时智能体在实际任务中总是受到环境干扰。这种不可避免的不确定性导致了群体的异构性,上述这些因素很可能会影响系统的稳定性。
4.已有的许多研究尝试解决鲁棒二部跟踪控制问题,并创新性地提出了各种方法来减少或削弱不确定条件对系统稳定性和控制精度的影响。然而,以往的研究没有全面考虑异构多智能体的鲁棒二部输出一致性跟踪控制,而这类研究在移动目标捕获方面具有重要的应用价值。


技术实现要素:

5.为解决上述技术问题,本发明提供了一种神经网络耦合输出调节器的异构多智能体跟踪控制方法,能够提高系统控制的鲁棒性,扩展算法的应用场景。
6.本发明的技术方案为:一种神经网络耦合输出调节器的异构多智能体跟踪控制方法,具体步骤如下:
7.s1、建立多智能体系统中领导者智能体的三阶模型和跟随者智能体的动力学模型,构成异构多智能体系统;
8.s2、针对多智能体系统,设计神经网络耦合输出调节器的融合框架,对跟随者模型中的不确定性进行估计并且对异构多智能体系统中跟随者和领导者之间的模型不匹配问题进行了解决;
9.s3、将步骤s2中得到的估计值补偿到控制器中,进而设计鲁棒二部跟踪控制协议;
10.s4、对步骤s3中建立的控制协议设计参数自适应律,完成神经网络自适应参数的设计;
11.s5、将控制协议应用到跟随者智能体的动力学模型中,完成符号网络下的多智能体的二部划分,其中一组智能体跟踪上领导者的轨迹,另一组远离领导者的轨迹,完成对跟随者的二部划分和对领导者的二部输出一致性跟踪。
12.进一步地,所述步骤s1具体如下:
13.s11、异构多智能体系统中存在一个领导者和n个跟随者,它们之间通过符号网络g进行连接,令υn={1,

,n},υn表示所有跟随者构成的集合,建立多智能体系统中领导者的模型如下:
[0014][0015]
其中,t表示时间,x0和y0分别表示领导者的状态和输出,表示领导者状态的导数,a0、c0表示状态矩阵。
[0016]
s12、n个跟随者智能体的整数阶模型如下:
[0017][0018]
其中,xi和yi分别表示第i个跟随者的状态和输出,表示跟随者状态的导数,ui(t)表示控制输入,fi(xi,t)是一个光滑且连续的未知函数,与跟随者的状态和时间有关,表示跟随者的模型不确定性,且状态矩阵a0,c0,ai,bi和ci的维度是相容的。
[0019]
s13、为实现异构多智能体系统的二部输出一致性跟踪控制,有如下定义:
[0020][0021]
其中,di表示如果第i个智能体和领导者的输出状态最终达到收敛,则di=1,否则di=-1;满足上述条件时,即表示完成二部输出一致性跟踪控制。
[0022]
进一步地,所述步骤s2具体如下:
[0023]
s21、通过自适应控制理论中的线性参数化方法,式(2)中的fi(xi,t)可以被参数化为下面形式:
[0024]fi
(xi,t)=φi(xi,t)wi+ε
fi
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0025]
其中,φi(xi,t)表示基底函数,wi表示未知参数向量;每个智能体i对参数向量wi的估计值记为ε
fi
表示神经网络估计误差,假设ε
fi
存在一个未知常数的界限δ
fi
,即|ε
fi
|≤δ
fi
,δ
fi
的估计值写为fi(xi,t)的估计值记为假设有下面形式:
[0026][0027]
s22、引入一个如下的输出调节方程:
[0028][0029]
其中,对于i∈υn,上述方程有解(γi,ui),得到状态矩阵a0,c0,ai,bi和ci保证异构多智能体系统的二部输出一致性跟踪控制的目标。
[0030]
进一步地,所述步骤s3具体如下:
[0031]
s31、由动态补偿器构成的鲁棒自适应状态反馈协议如下:
[0032][0033]
其中,表示耦合增益,t表示矩阵的转置,初值为表示耦合增益,t表示矩阵的转置,初值为θi(t)表示第i个跟随者对领导者状态x0(t)的估计量,θj(t)表示第j个跟随者领导者状态x0(t)的估计量,表示领导者状态估计量的导数,p是大于零的矩阵,mi表示第i个跟随者对领导者状态矩阵a0的估计量,mj表示第j个跟随者对领导者状态矩阵的估计量,表示领导者状态矩阵估计量的导数,ρ表示大于零的常数,k
1i
和k
2i
表示需要被确定的控制参数,υn表示所有跟随者构成的集合,θ=[a
ij
]表示邻接矩阵,若智能体j获得智能体i的信息,则a
ij
≠0,反之,a
ij
=0。a
ij
>0和a
ij
<0分别表示智能体i和智能体j之间的合作和对抗的关系,定义s=diag(a
10
,

,a
n0
)表示一个对角矩阵,若跟随者i接收到领导者的信息,则a
i0
≥0;否则a
i0
=0。
[0034]
s32、为实现步骤s13中的二部跟踪误差收敛,鲁棒自适应控制算法,即式(7)需要满足以下两个条件,则算法式(7)就会解决系统式(1)和式(2)的二部输出一致性跟踪问题:
[0035]
条件一:对于i∈υn,ai+b
ik1i
表示赫尔维茨矩阵,同时k
2i
=u
i-k
1i
γi,(γi,ui)满足输出调节方程式(6);
[0036]
条件二:下列不等式存在一个解p>0:
[0037]a0t
p+pa
0-2p2<0.
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0038]
进一步地,所述步骤s4具体如下:
[0039]
s41、为了完成神经网络的自适应估计,设计如下的自适应律:
[0040][0041]
其中,δi(t)=xi(t)-γiθi(t),ls=l+s,表示一个正定矩阵,拉普拉斯矩阵定义为l=d-θ,d表示度矩阵,定义为φ(x,t)=diag(φ1(x1,t),φ2(x2,t),

φn(xn,t)),b=blockdiag(b1,

,bn),b1,

,bn与状态矩阵bi一致,(表示分块对角矩阵),i
mi
表示mi维单位矩阵,表示对参数wi的自适应律,表示对参数ε
fi
的更新率。
[0042]
s42、借助步骤s41设计的控制协议,完成自适应参数和的更新,将两者的更新值代入到步骤s31中的控制协议。
[0043]
本发明的有益效果:本发明的方法首先建立领导者智能体以及跟随者智能体的动力学模型,通过设计神经网络和输出调节器相结合的框架,对跟随者模型中的不确定性进
行估计并对异构多智能体系统中跟随者和领导者之间的模型不匹配问题进行解决,进而设计鲁棒二部输出一致性跟踪控制协议,再设计参数自适应更新率,完成神经网络自适应参数的设计,将控制协议应用到异构多智能体系统的动力学模型中。本发明的方法设计了一种神经网络结合输出调节器的鲁棒控制器,解决异构多智能体系统二部输出一致性跟踪问题,提高系统控制的鲁棒性,引入符号网络,将异构多智能体系统的行为拓展到二部一致性跟踪,扩展算法应用场景。
附图说明
[0044]
图1为本发明的一种神经网络耦合输出调节器的异构多智能体跟踪控制方法的流程图。
[0045]
图2为本发明实施例中异构多智能体通信拓扑图。
[0046]
图3为本发明实施例中领导者与跟随者的位置状态响应图。
[0047]
图4为本发明实施例中跟踪位置误差图。
[0048]
图5为本发明实施例中系统耦合增益图。
[0049]
图6为本发明实施例中神经网络估计误差图。
具体实施方式
[0050]
下面结合附图与实施例对本发明作进一步地说明。
[0051]
如图1所示,本发明的一种神经网络耦合输出调节器的异构多智能体跟踪控制方法流程图,具体步骤如下:
[0052]
s1、建立多智能体系统中领导者智能体的三阶模型和跟随者智能体的动力学模型,构成异构多智能体系统;
[0053]
s2、针对多智能体系统,设计神经网络耦合输出调节器的融合框架,对跟随者模型中的不确定性进行估计并且对异构多智能体系统中跟随者和领导者之间的模型不匹配问题进行了解决;
[0054]
s3、将步骤s2中得到的估计值补偿到控制器中,进而设计鲁棒二部跟踪控制协议;
[0055]
s4、对步骤s3中建立的控制协议设计参数自适应律,完成神经网络自适应参数的设计;
[0056]
s5、将控制协议应用到跟随者智能体的动力学模型中,完成符号网络下的多智能体的二部划分,其中一组智能体跟踪上领导者的轨迹,另一组远离领导者的轨迹,完成对跟随者的二部划分和对领导者的二部输出一致性跟踪。
[0057]
在本实施例中,所述步骤s1中,在民用应用场景中,集群无人车编队跟踪空中移动目标无人机的任务需求经常发生,领导者为空中无人机,跟随者为集群无人车编队,具体如下:
[0058]
s11、异构多智能体系统中存在一个领导者和n个跟随者,它们之间通过符号网络g进行连接,令υn={1,

,n},υn表示所有跟随者构成的集合,建立多智能体系统中领导者的模型如下:
[0059]
[0060]
其中,t表示时间,x0和y0分别表示领导者的状态和输出,表示领导者状态的导数,a0、c0表示状态矩阵。
[0061]
s12、n个跟随者智能体的整数阶模型如下:
[0062][0063]
其中,xi和yi分别表示第i个跟随者的状态和输出,表示跟随者状态的导数,ui(t)表示控制输入,fi(xi,t)是一个光滑且连续的未知函数,与跟随者的状态和时间有关,表示跟随者的模型不确定性,且状态矩阵a0,c0,ai,bi和ci的维度是相容的。
[0064]
s13、为实现异构多智能体系统的二部输出一致性跟踪控制,有如下定义:
[0065][0066]
其中,di表示如果第i个智能体和领导者的输出状态最终达到收敛,则di=1,否则di=-1;满足上述条件时,即表示完成二部输出一致性跟踪控制。
[0067]
在本实施例中,所述步骤s2中,利用输出调节器对多智能体系统中领导者和跟随者之间构型不同的问题进行了解决,通过神经网络实现对跟随者智能体模型中存在的不确定性进行估计,具体如下:
[0068]
s21、通过自适应控制理论中的线性参数化方法,式(2)中的fi(xi,t)可以被参数化为下面形式:
[0069]fi
(xi,t)=φi(xi,t)wi+ε
fi
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0070]
其中,φi(xi,t)表示基底函数,wi表示未知参数向量;每个智能体i对参数向量wi的估计值记为ε
fi
表示神经网络估计误差,假设ε
fi
存在一个未知常数的界限δ
fi
,即|ε
fi
|≤δ
fi
,δ
fi
的估计值写为fi(xi,t)的估计值记为假设有下面形式:
[0071][0072]
s22、引入一个如下的输出调节方程:
[0073][0074]
其中,对于i∈υn,上述方程有解(γi,ui),得到状态矩阵a0,c0,ai,bi和ci保证异构多智能体系统的二部输出一致性跟踪控制的目标。
[0075]
在本实施例中,所述步骤s3具体如下:
[0076]
s31、由动态补偿器构成的鲁棒自适应状态反馈协议如下:
[0077][0078]
其中,表示耦合增益,t表示矩阵的转置,初值为表示耦合增益,t表示矩阵的转置,初值为θi(t)表示第i个跟随者对领导者状态
x0(t)的估计量,θj(t)表示第j个跟随者领导者状态x0(t)的估计量,表示领导者状态估计量的导数,p是大于零的矩阵,mi表示第i个跟随者对领导者状态矩阵a0的估计量,mj表示第j个跟随者对领导者状态矩阵的估计量,表示领导者状态矩阵估计量的导数,ρ表示大于零的常数,k
1i
和k
2i
表示需要被确定的控制参数,υn表示所有跟随者构成的集合,θ=[a
ij
]表示邻接矩阵,若智能体j获得智能体i的信息,则a
ij
≠0,反之,a
ij
=0。a
ij
>0和a
ij
<0分别表示智能体i和智能体j之间的合作和对抗的关系,定义s=diag(a
10
,

,a
n0
)表示一个对角矩阵,若跟随者i接收到领导者的信息,则a
i0
≥0;否则a
i0
=0。
[0079]
s32、为实现步骤s13中的二部跟踪误差收敛,鲁棒自适应控制算法,即式(7)需要满足以下两个条件,那么算法式(7)就会解决系统式(1)和式(2)的二部输出一致性跟踪问题:
[0080]
条件一:对于i∈υn,ai+b
ik1i
表示赫尔维茨矩阵,同时k
2i
=u
i-k
1i
γi,(γi,ui)满足输出调节方程式(6);
[0081]
条件二:下列不等式存在一个解p>0:
[0082]a0t
p+pa
0-2p2<0.
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0083]
在本实施例中,所述步骤s4具体如下:
[0084]
s41、为了完成神经网络的自适应估计,设计如下的自适应律:
[0085][0086]
其中,δi(t)=xi(t)-γiθi(t),ls=l+s,表示一个正定矩阵,拉普拉斯矩阵定义为l=d-θ,d表示度矩阵,定义为φ(x,t)=diag(φ1(x1,t),φ2(x2,t),

φn(xn,t)),b=blockdiag(b1,

,bn),b1,

,bn与状态矩阵bi一致,(表示分块对角矩阵),i
mi
表示mi维单位矩阵,表示对参数wi的自适应律,表示对参数ε
fi
的更新率。
[0087]
s42、借助步骤s41设计的控制协议,完成自适应参数和的更新,将两者的更新值代入到步骤s31中的控制协议。
[0088]
本实施例中异构多智能体通信拓扑图如图2所示,存在6个跟随者智能体和1个领导者智能体,其中,编号为0的节点表示领导者,根据符号网络下二部划分的原理,上述多智能体系统将会分为两组v1,v2:{v0,v2,v3,v4}∈v1和{v1,v5,v6}∈v2,且只有编号为3的跟随者可以获取到领导者的位置信息。领导者的系统矩阵定义如下:
[0089]
c0=[1 1],
[0090]
跟随者的系统矩阵定义如下:
[0091][0092]
c1=c3=c5=[01],c2=c4=c6=[11 0],
[0093]
式(7)所示控制器的反馈控制增益矩阵定义如下:
[0094]k11
=k
13
=k
15
=[-20.09],k
12
=k
14
=k
16
=[-2-5.2-1.1],
[0095]k21
=k
23
=k
25
=[1.91-2.09],k
22
=k
24
=k
26
=[-1.13.2],
[0096]
控制参数设置为:ρ=2。
[0097]
式(2)所示跟随者系统中的模型不确定性设计如下:
[0098][0099][0100]
对于i∈υn,基底函数被选为φi(t)=(cos(100t),sin(100t))
t
,x0(0),xi(0),θi(0),μi(0)和mi(0)的初值设置为任意数或任意矩阵。
[0101]
图3表示了异构多智能体系统中领导者与跟随者的位置状态响应,图4表示了跟踪误差是有界的,图5耦合增益μi能够收敛到一个常数值,图6表示了对模型不确定性的估计误差是有界的。
[0102]
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

技术特征:
1.一种神经网络耦合输出调节器的异构多智能体跟踪控制方法,具体步骤如下:s1、建立多智能体系统中领导者智能体的三阶模型和跟随者智能体的动力学模型,构成异构多智能体系统;s2、针对多智能体系统,设计神经网络耦合输出调节器的融合框架,对跟随者模型中的不确定性进行估计并且对异构多智能体系统中跟随者和领导者之间的模型不匹配问题进行了解决;s3、将步骤s2中得到的估计值补偿到控制器中,进而设计鲁棒二部跟踪控制协议;s4、对步骤s3中建立的控制协议设计参数自适应律,完成神经网络自适应参数的设计;s5、将控制协议应用到跟随者智能体的动力学模型中,完成符号网络下的多智能体的二部划分,其中一组智能体跟踪上领导者的轨迹,另一组远离领导者的轨迹,完成对跟随者的二部划分和对领导者的二部输出一致性跟踪。2.根据权利要求1所述的一种神经网络耦合输出调节器的异构多智能体跟踪控制方法,其特征在于,所述步骤s1具体如下:s11、异构多智能体系统中存在一个领导者和n个跟随者,它们之间通过符号网络g进行连接,令υ
n
={1,

,n},υ
n
表示所有跟随者构成的集合,建立多智能体系统中领导者的模型如下:其中,t表示时间,x0和y0分别表示领导者的状态和输出,表示领导者状态的导数,a0、c0表示状态矩阵;s12、n个跟随者智能体的整数阶模型如下:其中,x
i
和y
i
分别表示第i个跟随者的状态和输出,表示跟随者状态的导数,u
i
(t)表示控制输入,f
i
(x
i
,t)是一个光滑且连续的未知函数,与跟随者的状态和时间有关,表示跟随者的模型不确定性,且状态矩阵a0,c0,a
i
,b
i
和c
i
的维度是相容的;s13、为实现异构多智能体系统的二部输出一致性跟踪控制,有如下定义:其中,d
i
表示如果第i个智能体和领导者的输出状态最终达到收敛,则d
i
=1,否则d
i
=-1;满足上述条件时,即表示完成二部输出一致性跟踪控制。3.根据权利要求1所述的一种神经网络耦合输出调节器的异构多智能体跟踪控制方法,其特征在于,所述步骤s2具体如下:s21、通过自适应控制理论中的线性参数化方法,式(2)中的f
i
(x
i
,t)可以被参数化为下面形式:f
i
(x
i
,t)=φ
i
(x
i
,t)w
i

fi
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,φ
i
(x
i
,t)表示基底函数,w
i
表示未知参数向量;每个智能体i对参数向量w
i
的估计值记为ε
fi
表示神经网络估计误差,假设ε
fi
存在一个未知常数的界限δ
fi
,即|ε
fi
|≤
θ,d表示度矩阵,定义为φ(x,t)=diag(φ1(x1,t),φ2(x2,t),

φ
n
(x
n
,t)),b=block diag(b1,

,b
n
),b1,

,b
n
与状态矩阵b
i
一致,表示分块对角矩阵),i
mi
表示mi维单位矩阵,表示对参数w
i
的自适应律,表示对参数ε
fi
的更新率;s42、借助步骤s41设计的控制协议,完成自适应参数和的更新,将两者的更新值代入到步骤s31中的控制协议。

技术总结
本发明公开了一种神经网络耦合输出调节器的异构多智能体跟踪控制方法,首先建立领导者智能体以及跟随者智能体的动力学模型,通过设计神经网络和输出调节器相结合的框架,对跟随者模型中的不确定性进行估计并对异构多智能体系统中跟随者和领导者之间的模型不匹配问题进行解决,进而设计鲁棒二部输出一致性跟踪控制协议,再设计参数自适应更新率,完成神经网络自适应参数的设计,将控制协议应用到异构多智能体系统的动力学模型中。本发明的方法设计了一种神经网络结合输出调节器的鲁棒控制器,解决异构多智能体系统二部输出一致性跟踪问题,提高系统控制的鲁棒性,引入符号网络,将异构多智能体系统的行为拓展到二部一致性跟踪,扩展算法应用场景。扩展算法应用场景。扩展算法应用场景。


技术研发人员:李曈 韩承霖 甘旭东 岳江枫 游龙 翟培钰
受保护的技术使用者:电子科技大学
技术研发日:2022.12.19
技术公布日:2023/9/23
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐