一种基于竞争交互的自适应弹性分布式平均跟踪控制方法

未命名 08-29 阅读：118 评论：0

1.本发明涉及信息技术领域，尤其涉及一种基于竞争交互的自适应弹性分布式平均跟踪控制方法。

背景技术：

2.智能体一般是指具有自主通信能力的个体，能够感知周围环境而做出调整。多智能体系统是由多个相互作用的智能体组成，内部的各个智能体通过网络进行传输交流信息，协同合作实现一个特定的目标。多智能体分布式平均跟踪是多智能体研究中的一个重要问题，其目标是每个智能体的状态能够跟踪上多个参考信号的平均值。然而，这些解决分布式平均跟踪问题的分布式协议容易受到网络攻击，因为每个智能体在通信通道上共享其本地信息以此跟踪上参考信号的平均值。不稳定的网络攻击会破坏智能体之间的通信通道或执行器，阻止智能体达到跟踪效果。因此，设计分布式协议解决网络攻击下的分布式平均跟踪问题具有重要意义。
3.在多智能体分布式平均跟踪领域中，现如今网络攻击下的分布式协议的设计需要利用与拉普拉斯矩阵相关的特征值信息等全局信息(特别是拉普拉斯矩阵的最小非零特征值)。在实际应用中，由于智能体的空间分布和传感器的感知能力有限，全局信息的获取难度要比局部信息大。

技术实现要素：

4.针对现有技术的不足，本发明提供了一种基于竞争交互的自适应弹性分布式平均跟踪控制方法。本发明采用自适应弹性控制技术估计耦合增益，给出的控制协议是由每个智能体以完全分布式的方式设计，即仅使用局部信息(包括自身信息和邻居信息)，从而在不知道图结构的情况下生成完全分布式协议，用于解决网络攻击下的分布式平均跟踪问题。
5.一种基于竞争交互的自适应弹性分布式平均跟踪控制方法，包括以下步骤：
6.步骤1：构造多智能体系统的网络拓扑图，其网络拓扑图是无向连通图其中，表示n个节点的集合，表示边的集合，表示邻接矩阵，a
ij
为邻接矩阵的元素，表示n
×
n维实数矩阵的集合；所述邻接矩阵中，如果节点i，j之间有边相连，则有a
ij
＝a
ji
＝1，否则有a
ij
＝0。
7.步骤2：建立多智能体系统的状态方程，用网络拓扑图中的节点表示智能体，边表示不同智能体之间的关系。考虑一组n≥2的多智能体系统模型如下所示：
[0008][0009]
其中，表示第i个智能体的状态，表示第i个智能体的控制输入，表示实数集合。
[0010]
步骤3：根据多智能体系统的状态方程和控制目标设计基于竞争交互的自适应弹
性控制算法如下：
[0011][0012][0013]
其中，i＝1，...，n，和分别为智能体i接收到的参考信号及其导数；表示隐藏网络的虚拟状态，没有实际的物理意义；αi(t)(ri(t)-xi(t))是用来保证智能体的状态能够达到跟踪效果，是保证每个智能体的状态达到一致；是交互项，用于处理攻击者存在时提高系统的抗干扰能力；表示实际网络中的恶意攻击；表示隐藏网络中的恶意攻击；参数αi(t)、βi(t)、αi′
(t)、βi′
(t)分别为智能体i的时变耦合权值。
[0014]
步骤4：根据多智能体系统的状态方程建立如下误差系统模型：步骤4：根据多智能体系统的状态方程建立如下误差系统模型：i＝1，...，n，其中，xi(t)表示第i个智能体的状态，zi(t)表示隐藏网络的虚拟状态，rj(t)表示第j个智能体接收到的参考信号。
[0015]
步骤5：根据自适应弹性控制算法和误差系统模型设计自适应参数如下：
[0016][0017][0018][0019][0020]
其中，i＝1，...，n，分别为对应自适应参数的导数，k1、k2、k3、k4为任意的正整数。
[0021]
采用上述技术方案所产生的有益效果在于：
[0022]
本发明提供了一种基于竞争交互的自适应弹性分布式平均跟踪控制方法。该方法考虑存在攻击者的情况，并且控制器的设计仅仅利用局部信息而不使用与拉普拉斯矩阵相关的特征值信息等全局信息，极大地减轻了智能体传感器获取信息的难度，能够更好地应对攻击者对通信网络和执行器的攻击，在实际应用中可行性更高。
[0023]
与现有技术相比，本发明的具体有益技术效果在于：(1)控制器的设计仅使用局部信息而不使用全局信息，具有更高的应用价值。(2)通过自适应弹性控制使多智能体系统在受到攻击的情况下也能实现控制目标，拓宽了适用范围，具有更广泛的应用价值。
附图说明
[0024]
图1为本发明实施例中提供的基于竞争交互的自适应弹性控制方法流程图；
[0025]
图2为本发明实施例中建立的网络拓扑结构示意图；
[0026]
图3为本发明实施例中多智能体系统实现分布式平均跟踪的状态轨迹图；
[0027]
图4为本发明实施例中在自适应弹性控制作用下自适应参数的变化曲线图。
具体实施方式
[0028]
以下结合附图并举实例对本发明进行详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。
[0029]
一种基于竞争交互的自适应弹性分布式平均跟踪控制算法，如图1所示，包括以下步骤：
[0030]
步骤1：构造多智能体系统的网络拓扑图，其网络拓扑图是无向连通图其中，表示n个节点的集合，表示边的集合，表示邻接矩阵，a
ij
为邻接矩阵的元素，表示n
×
n维实数矩阵的集合；所述邻接矩阵中，如果节点i，j之间有边相连，则有a
ij
＝a
ji
＝1，否则有a
ij
＝0。
[0031]
本实施例中构造一个无向连通网络拓扑图，如图2所示。其中，标号为1、2、3、4的节点代表各个智能体。
[0032]
步骤2：建立多智能体系统的状态方程，用网络拓扑图中的节点表示智能体，边表示不同智能体之间的关系。考虑一组n≥2的多智能体系统模型如下所示：
[0033][0034]
其中，表示第i个智能体的状态，表示第i个智能体的控制输入，表示实数集合。
[0035]
步骤3：根据多智能体系统的状态方程和控制目标设计基于竞争交互的自适应弹性控制算法如下：
[0036]
[0037][0038]
其中，i＝1，...，n，和分别为智能体i接收到的参考信号及其导数；表示隐藏网络的虚拟状态，没有实际的物理意义；αi(t)(ri(t)-xi(t))是用来保证智能体的状态能够达到跟踪效果，是保证每个智能体的状态达到一致；是交互项，用于处理攻击者存在时提高系统的抗干扰能力；表示实际网络中的恶意攻击；表示隐藏网络中的恶意攻击；参数αi(t)、βi(t)、αi′
(t)、βi′
(t)分别为智能体i的时变耦合权值。
[0039]
步骤4：根据多智能体系统的状态方程建立如下误差系统模型：步骤4：根据多智能体系统的状态方程建立如下误差系统模型：i＝1，...，n，其中，xi(t)表示第i个智能体的状态，zi(t)表示隐藏网络的虚拟状态，rj(t)表示第j个智能体接收到的参考信号。
[0040]
步骤5：根据自适应弹性控制算法和误差系统模型设计自适应参数如下：
[0041][0042][0043][0044][0045]
其中，i＝1，...，n，分别为对应自适应参数的导数，k1、k2、k3、k4为任意的正整数。
[0046]
本实施例采用参数如下：
[0047]
每个智能体接收到的参考信号如下：
[0048]
r1(t)＝sin(t)，r2(t)＝2cos(t)，
[0049]
r3(t)＝2sin(2t)，r4(t)＝3cos(2t).
[0050]
攻击者的策略如下：
[0051][0052][0053]
从图3和图4可以看出，在所设计的基于竞争交互的自适应弹性分布式平均跟踪控制算法作用下，多智能体系统实现了分布式平均跟踪，说明控制算法有效。
[0054]
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开的实施例中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

技术特征：
1.一种基于竞争交互的自适应弹性分布式平均跟踪控制方法，其特征在于，包括以下步骤：步骤1：构造多智能体系统的网络拓扑图，其网络拓扑图是无向连通图其中，表示n个节点的集合，表示边的集合，表示邻接矩阵，a
ij
为邻接矩阵的元素，表示n
×
n维实数矩阵的集合；所述邻接矩阵中，如果节点i,j之间有边相连，则有a
ij
＝a
ji
＝1，否则有a
ij
＝0；步骤2：建立多智能体系统的状态方程，用网络拓扑图中的节点表示智能体，边表示不同智能体之间的关系；步骤3：根据多智能体系统的状态方程和控制目标设计基于竞争交互的自适应弹性控制算法；步骤4：根据多智能体系统的状态方程建立误差系统模型：步骤4：根据多智能体系统的状态方程建立误差系统模型：其中，x
i
(t)表示第i个智能体的状态，z
i
(t)表示隐藏网络的虚拟状态，r
j
(t)表示第j个智能体接收到的参考信号；步骤5：根据自适应弹性控制算法和误差系统模型设计自适应参数，对多智能体系统实现分布式平均跟踪。2.根据权利要求1所述的一种基于竞争交互的自适应弹性分布式平均跟踪控制方法，其特征在于，所述步骤2具体包括以下步骤：步骤2.1：根据步骤1构造的无向网络拓扑图，将通信网络中的节点作为每个智能体，边表示不同智能体之间的关系，然后构建模型；步骤2.2：考虑一组n≥2的多智能体系统模型：其中，表示第i个智能体的状态，表示第i个智能体的控制输入，表示实数集合。3.根据权利要求1所述的一种基于竞争交互的自适应弹性分布式平均跟踪控制方法，其特征在于，所述步骤3具体包括以下步骤：步骤3.1：考虑攻击者的动力学模型：d
i
(t)＝μ
i
(t)δ
i
(t)；其中，δ
i
(t)表示攻击者注入第i个智能体输入的虚假信息，μ
i
(t)是一个激活函数，当μ
i
(t)＝1时，意味着攻击者注入虚假信息，智能体受到攻击；反之，μ
i
(t)＝0时，智能体不会受到攻击；步骤3.2：根据多智能体系统的状态方程和控制目标设计基于竞争交互的自适应弹性控制算法如下：控制算法如下：
其中，i＝1,...,n，和分别为智能体i接收到的参考信号及其导数；表示隐藏网络的虚拟状态，没有实际的物理意义；α
i
(t)(r
i
(t)-x
i
(t))是用来保证智能体的状态能够达到跟踪效果，是保证每个智能体的状态达到一致；是交互项，用于处理攻击者存在时提高系统的抗干扰能力；表示实际网络中的恶意攻击；表示隐藏网络中的恶意攻击；参数α
i
(t)、β
i
(t)、α
i
′
(t)、β
i
′
(t)分别为智能体i的时变耦合权值。4.根据权利要求1所述的一种基于竞争交互的自适应弹性分布式平均跟踪控制方法，其特征在于，步骤5所述根据自适应弹性控制算法和误差系统模型设计自适应参数：其特征在于，步骤5所述根据自适应弹性控制算法和误差系统模型设计自适应参数：其特征在于，步骤5所述根据自适应弹性控制算法和误差系统模型设计自适应参数：其特征在于，步骤5所述根据自适应弹性控制算法和误差系统模型设计自适应参数：其中，i＝1,...,n，分别为对应自适应参数的导数，k1、k2、k3、k4为任意的正整数。

技术总结
本发明提供了一种基于竞争交互的自适应弹性分布式平均跟踪控制方法，涉及信息技术领域。首先，构造无向网络拓扑图，建立多智能体系统的状态方程；然后，根据无向网络拓扑图和多智能体系统的状态方程设计基于竞争交互的自适应弹性控制算法；其次，根据多智能体系统的状态方程建立误差系统模型；最后，根据自适应弹性控制算法和误差系统模型设计自适应参数。本发明提供的分布式平均跟踪控制算法仅使用局部信息而不使用全局信息，使得智能体在网络攻击下也能获取信息实现控制目标。因此，此发明对于多智能体系统分布式平均跟踪控制的研究不仅有深刻的理论价值，而且还具有丰富的实践价值。践价值。践价值。

技术研发人员：陈飞季宸宇项林英
受保护的技术使用者：东北大学秦皇岛分校
技术研发日：2023.05.29
技术公布日：2023/8/28

版权声明

本文仅代表作者观点，不代表航家之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

上一篇：图像的显示补偿装置及方法与流程 下一篇：用于区块链应用的自适应一键部署方法、系统和装置与流程

一种基于竞争交互的自适应弹性分布式平均跟踪控制方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种基于竞争交互的自适应弹性分布式平均跟踪控制方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表