导频污染下智能反射面辅助无人机通信方法

未命名 10-21 阅读：113 评论：0

1.本发明涉及无线通信中的无人机通信领域，具体地说，是一种导频污染下智能反射面辅助无人机传输方法。

背景技术：

2.无人机通信延伸了无线蜂窝网络的空地传输，但其视距传输链路容易遭受导频污染，增大被窃听和干扰的风险，如何实现在空地链路被污染和干扰的情况下保证安全稳健的空地信息传输是需要解决的一个瓶颈问题。智能反射面可以智能调控无线环境，借助智能反射面的被动波束成形和发射机的主动波束成形，能够有效缓解导频污染对空地安全传输的影响。假设在完美的瞬时信道状态信息可以获得的条件下，基站可以将主动窃听者的导频污染完全去除掉，因此采用安全的广义迫零预编码处理，可以有效防止信息的泄露，得到较高的安全速率。但考虑到系统中存在的窃听者不再是传统的被动窃听者，只是被动地窃听合法用户发送的信息，而是可以在此基础上释放主动干扰，设置干扰功率，形成导频干扰，并且干扰功率动态变化，具有更大的破坏性，对导频污染下的传输造成极大威胁。因此，在产生导频污染的干扰功率可变的情况下，固定的智能反射面被动波束设计不再适用。

技术实现要素：

3.本发明的目的在于针对空地链路在信道估计阶段遭遇导频污染的情况，提出了一种导频污染下智能反射面辅助无人机通信方法，削弱主动窃听者导频干扰带来的影响，提升空地链路被污染下的安全可靠传输性能。
4.实现本发明目的的技术解决方案为：一种导频污染下智能反射面辅助无人机通信方法，包括以下步骤：
5.步骤1：初始化系统参数：设置外层循环迭代次数为i，初始值i＝0，迭代时i
′
＝i+1；设置内层循环迭代次数为t，初始值t＝0，迭代时t
′
＝t+1；假设智能反射面辅助无人机通信系统中有一个包括n个天线的基站和k个单天线的无人机用户以及一个智能反射面，系统采用时分复用的方式进行通信，即假设上下行信道具有一致性，可以通过上行(用户到基站)的信道估计确定下行(基站到用户)的信道增益。假设智能反射面有m个反射单元，每个反射单元的相位可以独立调整，可调整的相位分为有限的d个离散值，每个反射单元相位选择概率p
md
呈均匀分布，即假设主动窃听者可以动态调整其干扰功率，干扰功率的取值分为j个离散值，其选择每个干扰功率值的概率呈均匀分布，即
6.步骤2：进入外层循环迭代，主动窃听者根据其干扰功率选择概率pj(i)选择干扰功率的大小pe(i)；
7.步骤3：主动窃听者在第l个用户信道上释放干扰功率pe(i)；同时，基站分别对基站到无人机用户之间的直连链路和经过智能反射面反射的级联反射链路信道增益进行估计，具体步骤如下：
8.步骤3a：首先在符号周期τd内，关闭智能反射面，k个无人机用户向基站发射导频序列[μ1,μ2,...,μk,...,μk]
t
，基站根据收到的导频序列进行直连信道估计：假设第k个用户发射导频信号μk，基站根据接收到的信号估计第k个直连链路的信道增益为hk。当k≠l时，其估计的基站到无人机用户的直连链路信道增益而在第l个用户信道上，其估计的基站到无人机用户的直连链路信道增益是由于导频污染为
[0009][0010]
其中，p
l
是第l个用户发射的信号功率，he是主动窃听者到基站的直连链路信道增益；
[0011]
步骤3b:然后，依次打开智能反射面的每个反射单元，在符号周期τr内，估计从无人机用户经过每个反射单元到达基站的级联反射链路信道增益：假设打开第m个反射单元，第k个用户发射导频信号ω
k,m
，基站根据接收到的信号，得到直连和级联反射链路的信道增益之和的估计值。
[0012]
步骤3c:假设噪声忽略不计，用步骤3b中得到的信道增益减去步骤3a中得到的直连链路信道增益，获得用户经过每个反射单元到达基站的级联反射链路信道增益f
k,m
；当k≠l时，用户到基站级联反射链路信道增益的估计值而在第l个用户级联反射信道上，用户到基站级联反射链路信道增益的估计值由于导频污染为
[0013][0014]
其中，f
e,m
是主动窃听者经过第m个反射单元到基站的级联反射链路信道增益。
[0015]
步骤4：进入内层循环迭代，在符号周期tc内，基站向无人机用户传输信息，为了克服导频污染，合法用户联合优化智能反射面的相位矩阵和基站的波束成形来提升信息传输的安全性。首先，每个反射单元根据各自的选择概率p
md
(t)选择不同的相位φm；
[0016]
步骤5：根据安全广义迫零准则，计算基站的波束成形系数w(λ,∈)：
[0017][0018]
其中a(λ,∈)＝(hhh+∈ghg+λin)-1hh
，p
t
为发射总功率，λ,∈是可以调整的参数，h＝[h1+f1θ,
…
,hk+fkθ]是合法用户的信道矩阵，其中的每一项是包含基站和用户之间的直连链路和反射链路的等效合法用户信道增益，g＝he+feθ,是主动窃听者和基站之间的直连链路和反射链路的等效窃听信道增益，θ是智能反射面的相位矩阵，第m项为位矩阵，第m项为其中为第m个反射单元的幅度，当其打开时为1，关闭时为0，φm为第m个反射单元的相位。
[0019]
步骤6：每个智能反射单元根据随机学习算法更新相位选择概率，具体步骤如下：
[0020]
步骤6a：合法用户计算其效用函数u(t):
[0021]
[0022]
步骤6b：计算每个反射单元选择不同相位的效用反馈值；
[0023][0024]
其中u
max
和u
min
是效用函数的最大值和最小值；
[0025]
步骤6c：更新智能反射单元的相位选择概率
[0026]
p
md
(t+1)＝p
md
(t)+brm(t)(1-p
md
(t)),d＝am(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0027]
p
md
(t+1)＝p
md
(t)-brm(t)p
md
(t),d≠am(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0028]
其中，b为智能反射单元学习速率，am(t)表示每个智能反射单元在这次迭代中的选择策略，d表示智能反射单元选择的相位档值。
[0029]
重复步骤4到步骤6，直到所有智能反射单元均满足收敛条件，内层循环迭代停止，转步骤7；收敛条件：||p(t)/p(t-1)||/||p(t)||《ε，其中p(t)表示对应智能反射单元在第t次迭代的相位选择概率向量，ε为接近于0的正数；
[0030]
步骤7：主动窃听者更新其干扰功率选择概率，具体步骤如下；
[0031]
步骤7a:主动窃听者计算其效用函数
[0032][0033]
其中ce是干扰代价因子；
[0034]
步骤7b:主动窃听者更新其q值和干扰功率选择概率
[0035][0036][0037]
其中表示主动窃听者的学习速率，τ0∈(0,1)是一个常数，控制q学习中的开发和探索(exploration-exploitation.)之间的折中。
[0038]
步骤8：转向步骤2，直到主动窃听者干扰功率选择满足收敛条件，外层循环迭代停止；收敛条件：||pj(i)/pj(i-1)||/||pj(i)||《ε，其中pj(i)表示主动窃听者在第i次迭代的干扰功率选择概率向量，ε为接近于0的正数。
[0039]
本发明与现有技术相比，其显著优点：本发明考虑了导频污染对合法用户物理层安全的影响，在主动窃听者干扰功率动态变化的情况下，采用了博弈论和机器学习的方法，设计了合法用户和主动窃听者的效用函数，在斯坦伯格博弈的框架下通过发射机波束成形和智能反射面相位矩阵的联合优化，提升了合法用户的安全可达速率。
附图说明
[0040]
图1是智能反射面辅助无人机通信系统模型。
[0041]
图2是传输过程中信道估计阶段示意图。
[0042]
图3是irs某个反射单元相位调整选择概率的收敛曲线。
[0043]
图4是主动窃听者干扰功率选择概率的收敛曲线。
[0044]
图5是安全可达速率随着发射机功率变化曲线。
[0045]
图6是安全可达速率随着智能反射单元数目的变化曲线。
具体实施方式
[0046]
本发明是一种采用斯坦伯格博弈、机器学习和分层优化理论，削弱主动窃听者导频干扰带来的影响，提升空地链路被污染下的安全可靠传输的方法。
[0047]
下面结合说明书附图对本发明作进一步说明：
[0048]
结合图1、图2，本发明的系统框图如图1所示，系统仿真采用matlab仿真，参数设定不影响一般性。考虑的是一个空地链路传输系统中，存在一个发射机天线数目为8的基站，一个单天线的无人机用户和一个智能反射面，irs包含8个智能反射面单元。合法通信链路包括基站到无人机的直连链路和通过智能反射面的反射链路。系统中还存在一个主动窃听者，即在信道估计阶段可以主动干扰以影响信道估计。假设发射机的发射总功率设定为p
t
＝1w,主动窃听者的干扰功率集合为{0，0.2，0.4，0.6，0.8，1}w，主动窃听的干扰代价因子ce＝0.0001,背景的高斯加性白噪声功率水平设为n0＝10-17
w。假设基站到无人机用户之间的距离为20m，基站到主动窃听者之间的距离为50m。
[0049]
具体步骤实施如下：
[0050]
一种导频污染下智能反射面辅助无人机通信的方法，它包括以下步骤：
[0051]
步骤1：初始化系统参数：设置外层循环迭代次数为i，初始值i＝0，迭代时i
′
＝i+1；设置内层循环迭代次数为t，初始值t＝0，迭代时t
′
＝t+1；假设系统中有一个包括8个天线的基站和一个单天线的无人机用户以及一个智能反射面，系统采用时分复用的方式进行通信，即假设上下行信道具有一致性，可以通过上行(用户到基站)的信道估计确定下行(基站到用户)的信道增益。假设智能反射面有8个反射单元，每个反射单元的相位可以独立调整，可调整的相位分为有限的8个离散值，每个反射单元相位选择概率p
md
呈均匀分布，即假设主动窃听者可以动态调整其干扰功率，干扰功率的取值分为6个离散值，其选择每个干扰功率值的概率呈均匀分布，即
[0052]
步骤2：进入外层循环迭代，主动窃听者根据其干扰功率选择概率pj(i)选择干扰功率的大小pe(i)；
[0053]
步骤3：主动窃听者在第l个用户信道上释放干扰功率pe(i)；同时，基站分别对基站到无人机用户之间的直连链路和经过智能反射面反射的级联反射链路信道增益进行估计，具体步骤如下：
[0054]
步骤3a：首先在符号周期τd内，关闭智能反射面，k个无人机用户向基站发射导频序列[μ1,μ2,...,μk,...,μk]
t
，基站根据收到的导频序列进行直连信道估计：假设第k个用户发射导频信号μk，基站根据接收到的信号估计第k个直连链路的信道增益为hk。当k≠l时，其估计的基站到无人机用户的直连链路信道增益而在第l个用户信道上，其估计的基站到无人机用户的直连链路信道增益是由于导频污染为
[0055][0056]
其中，p
l
是第l个用户发射的信号功率，he是主动窃听者到基站的直连链路信道增益；
[0057]
步骤3b:然后，依次打开智能反射面的每个反射单元，在符号周期τr内，估计从无
人机用户经过每个反射单元到达基站的级联反射链路信道增益：假设打开第m个反射单元，第k个用户发射导频信号ω
k,m
，基站根据接收到的信号，得到直连和级联反射链路的信道增益之和的估计值。
[0058]
步骤3c:假设噪声忽略不计，用步骤3b中得到的信道增益减去步骤3a中得到的直连链路信道增益，获得用户经过每个反射单元到达基站的级联反射链路信道增益f
k,m
；当k≠l时，用户到基站级联反射链路信道增益的估计值而在第l个用户级联反射信道上，用户到基站级联反射链路信道增益的估计值由于导频污染为
[0059][0060]
其中，f
e,m
是主动窃听者经过第m个反射单元到基站的级联反射链路信道增益。
[0061]
步骤4：进入内层循环迭代，在符号周期tc内，基站向无人机用户传输信息，为了克服导频污染，合法用户联合优化智能反射面的相位矩阵和基站的波束成形来提升信息传输的安全性。首先，每个反射单元根据各自的选择概率p
md
(t)选择不同的相位φm；
[0062]
步骤5：根据安全广义迫零准则，计算基站的波束成形系数w(λ,∈)：
[0063][0064]
其中a(λ,∈)＝(hhh+∈ghg+λin)-1hh
，p
t
为发射总功率，λ,∈是可以调整的参数，取λ＝∈＝1，h＝[h1+f1θ,
…
,hk+fkθ]是合法用户的信道矩阵，其中的每一项是包含基站和用户之间的直连链路和反射链路的等效合法用户信道增益，g＝he+feθ,是主动窃听者和基站之间的直连链路和反射链路的等效窃听信道增益，θ是智能反射面的相位矩阵，第m项为其中为第m个反射单元的幅度，当其打开时为1，关闭时为0，φm为第m个反射单元的相位。
[0065]
步骤6：每个智能反射单元根据随机学习算法更新相位选择概率，具体步骤如下：
[0066]
步骤6a：合法用户计算其效用函数u(t):
[0067][0068]
步骤6b：计算每个反射单元选择不同相位的效用反馈值；
[0069][0070]
其中u
max
和u
min
是效用函数的最大值和最小值；
[0071]
步骤6c：更新智能反射单元的相位选择概率
[0072]
p
md
(t+1)＝p
md
(t)+brm(t)(1-p
md
(t)),d＝am(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0073]
p
md
(t+1)＝p
md
(t)-brm(t)p
md
(t),d≠am(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0074]
其中，b为智能反射单元学习速率，am(t)表示每个智能反射单元在这次迭代中的选择策略，d表示智能反射单元选择的相位档值。
[0075]
重复步骤4到步骤6，直到所有智能反射单元均满足收敛条件，内层循环迭代停止，转步骤7；收敛条件：||p(t)/p(t-1)||/||p(t)||《ε，其中p(t)表示对应智能反射单元在第t次迭代的相位选择概率向量，ε为接近于0的正数；
[0076]
步骤7：主动窃听者更新其干扰功率选择概率，具体步骤如下；
[0077]
步骤7a:主动窃听者计算其效用函数
[0078][0079]
其中ce是干扰代价因子；
[0080]
步骤7b:主动窃听者更新其q值和干扰功率选择概率
[0081][0082][0083]
其中表示主动窃听者的学习速率，τ0∈(0,1)是一个常数，控制q学习中的开发和探索(exploration-exploitation.)之间的折中。
[0084]
步骤8：转向步骤2，直到主动窃听者干扰功率选择满足收敛条件，外层循环迭代停止；收敛条件：||pj(i)/pj(i-1)||/||pj(i)||《ε，其中pj(i)表示主动窃听者在第i次迭代的干扰功率选择概率向量，ε为接近于0的正数。
[0085]
图3-图6是本发明的仿真曲线。其中图3是一次仿真中某个智能反射单元的相位选择收敛曲线。从图中可以看出，在基于所提相位选择算法下，智能反射单元选择离散相位在30次左右达到收敛，收敛速度较快。图4是主动窃听者干扰功率选择概率的收敛曲线。从图中可以看出，在基于q学习的主动窃听者干扰功率选择算法中，主动窃听者选择离散干扰功率值在40次左右达到收敛，收敛速度较快。图5和图6是仿真结果为103次独立实验的平均值，其中图5是安全可达速率随着发射机功率变化曲线。从图中我们可以看出，安全可达速率随着发射机总功率的增大而增大，这一方面是由于发射机总功率的增大，会增大合法用户的传输速率，另一方面是由于发射机总功率增大，主动窃听者发射干扰功率带来的信道误差就相对较小，从而进一步提升了合法用户的安全可达速率。同时我们发现，本发明联合发射机波束成形和智能反射面相位选择算法优于采用联合基于最大比传输(mrt)的波束成形和irs相位选择算法，并且采用irs辅助的无人机通信比没有引入irs时具有更高的安全可达速率。图6是安全可达速率随着智能反射单元数目的变化曲线。从图中可以看出，随着智能反射单元数目的增多，系统的安全可达速率增大，并且，本发明提出的算法要优于其他对比算法。

技术特征：
1.一种导频污染下智能反射面辅助无人机通信方法，其特征在于，包括以下步骤：步骤1：初始化系统参数：设置外层循环迭代次数为i，初始值i＝0，迭代时i
′
＝i+1；设置内层循环迭代次数为t，初始值t＝0，迭代时t
′
＝t+1；假设智能反射面辅助无人机通信系统中有一个包括n个天线的基站、k个单天线的无人机用户以及一个智能反射面，系统采用时分复用的方式进行通信；假设智能反射面有m个反射单元，每个反射单元的相位可以独立调整，可调整的相位分为有限的d个离散值，每个反射单元相位选择概率p
md
呈均匀分布，即假设主动窃听者可以动态调整其干扰功率，干扰功率的取值分为j个离散值，其选择每个干扰功率值的概率呈均匀分布，即步骤2：进入外层循环迭代，主动窃听者根据其干扰功率选择概率p
j
(i)，选择干扰功率的大小p
e
(i)；步骤3：主动窃听者在第l个用户信道上释放干扰功率p
e
(i)；同时，基站分别对基站到无人机用户之间的直连链路和经过智能反射面反射的级联反射链路信道增益进行估计；步骤4：进入内层循环迭代，在符号周期t
c
内，基站向无人机用户传输信息，智能反射面每个反射单元根据各自的相位选择概率p
md
(t)选择不同的相位φ
m
；步骤5：根据安全广义迫零准则，计算基站的波束成形系数w(λ,∈)：步骤6：每个智能反射单元根据随机学习算法更新相位选择概率；重复步骤4到步骤6，直到所有智能反射单元均满足收敛条件，内层循环迭代停止，转步骤7；收敛条件：||p(t)/p(t-1)||/||p(t)||<ε，其中p(t)表示对应智能反射单元在第t次迭代的相位选择概率向量，ε为接近于0的正数；步骤7：主动窃听者更新其干扰功率选择概率；步骤8：转向步骤2，直到主动窃听者干扰功率选择满足收敛条件，外层循环迭代停止；收敛条件：||p
j
(i)/p
j
(i-1)||/||p
j
(i)||<ε，其中p
j
(i)表示主动窃听者在第i次迭代的干扰功率选择概率向量，ε为接近于0的正数。2.根据权利要求1所述的导频污染下智能反射面辅助无人机通信方法，其特征在于，步骤3的具体步骤如下：步骤3a：在符号周期τ
d
内，关闭智能反射面，k个无人机用户向基站发射导频序列[μ1,μ2,...,μ
k
,...,μ
k
]
t
，基站根据收到的导频序列进行直连信道估计：假设第k个用户发射导频信号μ
k
，基站根据接收到的信号估计第k个直连链路的信道增益为h
k
；当k≠l时，其估计的基站到无人机用户的直连链路信道增益在第l个用户信道上，其估计的基站到无人机用户的直连链路信道增益是由于导频污染其为其中，p
l
是第l个用户发射的信号功率，h
e
是主动窃听者和基站之间的直连链路信道增益；步骤3b:依次打开智能反射面的每个反射单元，在符号周期τ
r
内，估计从无人机用户经过每个反射单元到达基站的级联反射链路信道增益：假设打开第m个反射单元，第k个用户
发射导频信号ω
k,m
，基站根据接收到的信号，得到直连和级联反射链路的信道增益之和的估计值；步骤3c:假设噪声忽略不计，用步骤3b中得到的信道增益减去步骤3a中得到的直连链路信道增益，获得用户经过每个反射单元到达基站的级联反射链路信道增益f
k,m
；当k≠l时，用户到基站级联反射链路信道增益的估计值表示的是估计的等效反射链路信道增益等于真实的等效反射链路信道增益；而在第l个用户级联反射信道上，用户到基站级联反射链路信道增益的估计值由于导频污染则为其中，f
e,m
是主动窃听者经过第m个反射单元到基站的级联反射链路信道增益。3.根据权利要求1所述的导频污染下智能反射面辅助无人机通信方法，其特征在于：步骤5中，其中，a(λ,∈)＝(h
h
h+∈g
h
g+λi
n
)-1
h
h
，p
t
为发射总功率，λ,∈是可以调整的参数，h＝[h1+f1θ,
…
,h
k
+f
k
θ]是合法用户的信道矩阵，其中的每一项是包含基站和用户之间的直连链路和反射链路的等效合法用户信道增益，g＝h
e
+f
e
θ,是主动窃听者和基站之间的直连链路和反射链路的等效窃听信道增益，θ是智能反射面的相位矩阵，其第m项为阵，其第m项为其中为第m个反射单元的幅度，当其打开时为1，关闭时为0，φ
m
为第m个反射单元的相位。4.根据权利要求1所述的导频污染下智能反射面辅助无人机通信方法，其特征在于，步骤6的具体实现如下：步骤6a：合法用户计算其效用函数u(t):步骤6b：计算每个反射单元选择不同相位的效用反馈值；其中u
max
和u
min
是效用函数的最大值和最小值；步骤6c：更新智能反射单元的相位选择概率p
md
(t+1)＝p
md
(t)+br
m
(t)(1-p
md
(t)),d＝a
m
(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)p
md
(t+1)＝p
md
(t)-br
m
(t)p
md
(t),d≠a
m
(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)其中，b为智能反射单元学习速率，a
m
(t)表示每个智能反射单元在这次迭代中的选择策略，d表示智能反射单元选择的相位档值。5.根据权利要求1所述的导频污染下智能反射面辅助无人机通信方法，其特征在于，步骤7的具体实现如下：步骤7a:主动窃听者计算其效用函数
其中c
e
是干扰代价因子；步骤7b:主动窃听者更新其q值和干扰功率选择概率步骤7b:主动窃听者更新其q值和干扰功率选择概率其中表示主动窃听者的学习速率，τ0∈(0,1)是一个常数，控制q学习中的开发和探索之间的折中。

技术总结
本发明公开了一种导频污染下智能反射面辅助无人机通信方法，主要是考虑空地链路在信道估计阶段遭遇导频污染的情况下，采用斯坦伯格博弈、机器学习和分层优化理论，削弱主动窃听者导频干扰带来的影响，提升空地链路被污染下的安全可靠传输性能。下的安全可靠传输性能。下的安全可靠传输性能。

技术研发人员：罗屹洁周浩马增起王润升胡宏达王嘉琦
受保护的技术使用者：中国人民解放军陆军工程大学
技术研发日：2023.08.04
技术公布日：2023/10/15

版权声明

本文仅代表作者观点，不代表航家之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

上一篇：一种快速回撤工作面液压支架的方法与流程 下一篇：一种磷酸铁锂电池回收线的制作方法

导频污染下智能反射面辅助无人机通信方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

导频污染下智能反射面辅助无人机通信方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表