一种RIS辅助多天线OFDM系统和1比特相移设计方法

未命名 09-03 阅读:137 评论:0

一种ris辅助多天线ofdm系统和1比特相移设计方法
技术领域
1.本发明涉及一种ris辅助多天线ofdm系统和1比特相移设计方法,属于一种智能超表面增强的多天线ofdm下行系统自适应传输技术领域。


背景技术:

2.近年来兴起的智能超表面是一项极具应用前景的技术,为经济高效地实现高频谱效率和覆盖范围提供了一种可能。智能超表面是一种由大量无源反射元件组成的超表面,可以实时动态调整反射信号的幅度和/或相位,从而实现智能的无线电传播环境重配置。同时,智能超表面不需要任何有源射频(rf,radio frequency)链来发送或接收信号,仅依赖于无源信号的反射,因此与传统的有源收发器/继电器相比,大大降低了硬件成本和能耗。除此以外,智能超表面可在毫米波信号被障碍物阻塞时提供反射径,维持设备间的正常通信,综上可见,智能超表面可以实现通信服务质量提升同时减少部署开销。
3.然而,实际部署的智能超表面反射单元数量一般是从几千个到几万个变化且智能超表面处存在恒模约束,因而如何在智能超表面辅助的无线通信系统中通过联合设计提高通信性能是一个多任务问题。传统设计方法有逐次凸逼近和半正定松弛算法等,这些传统算法均是针对智能超表面连续相移的假设条件下展开的,这对于通常具有大量反射单元的智能超表面是难以实现的,因为制造具有无限级高分辨率移相器的反射单元成本很高。若将这些传统数值算法应用于宽带系统,则设计复杂度进一步提高,这主要归因于宽带系统中各子载波信道不一致,单个子载波信道的最优设计对于其他子载波将不再是最优,这就需要具有低时间成本和高性能的联合设计算法来进一步解决这些问题。
4.现有针对离散智能超表面反射系数向量设计的低复杂度算法的研究主要是基于智能超表面反射系数向量码本的设计或使用深度学习方法,智能超表面反射系数向量码本的设计对智能超表面反射单元分辨率有较高的要求,深度学习方法需要提前采样大量训练数据,且对信道衰落变化很敏感,实际应用困难。


技术实现要素:

5.有鉴于此,本发明的目的在于提供一种ris辅助多天线ofdm系统和1比特相移设计方法,用以解决背景技术中提及的技术问题。本发明为基站配置多根天线,部署多个单天线用户并放置智能超表面提升通信服务质量,利用深度强化学习算法根据信道状态信息对智能超表面反射系数向量进行设计以最大化系统频谱效率;深度强化学习算法设计反射系数向量能够有效抑制干扰,降低所需时间成本且对信道衰落变化具有很好的鲁棒性。
6.为了达到上述目的,本发明采用如下技术方案:
7.一种ris辅助多天线ofdm系统,包括基站,所述基站配置p根单天线,所述ris辅助多天线ofdm系统中配置一个智能超表面辅助服务k个单天线用户;
8.所述智能超表面为均匀平面阵,该均匀平面阵包括m=a
×
b个反射单元,其中,垂直方向a行反射单元,水平方向每行b个反射单元,各反射单元仅能取0或π两种反射相移,同
时将所述智能超表面划分为若干块,每一块均包含w=c
×
d个反射单元,其中,垂直方向包含c行反射单元,水平方向每行包含d个反射单元,每一块中的反射单元采用相同的反射相移;
9.所述智能超表面的反射系数向量表示为其中,表示智能超表面的分块个数,θe表示第e块智能超表面的相移;将所有可能的智能超表面反射系数向量存放到码本中,即码本中的每一个码字对应一种可能的反射系数向量因此码本中共有2e个码字;
10.ris辅助多天线ofdm系统整体的带宽被划分为n个子载波,表示为集合第k个单天线用户占用子载波的集合表示为sk,满足并且
11.优选的,包括以下步骤:
12.步骤s1、在基站处构建智能体x的经验池及深度强化学习神经网络,深度强化学习神经网络包括评价q网络u和目标q网络
13.所述评价q网络u用于评价各动作的q值,q值表示动作执行后的累积奖励,所述目标q网络用于保证网络更新的稳定性,所述智能体以码本作为动作空间,其中的每个码字为可选的动作,以ris辅助多天线ofdm系统的总频谱效率为奖励;
14.步骤s2、在t时刻,智能体x的状态表达式为:
[0015][0016]
基站已知各单天线用户的信道状态信息包括:
[0017]
基站到单天线用户k的具有l0个抽头的直接路径时域基带等效多径信道为其中,表示其第l0个抽头的时域脉冲响应,其中p表示基站天线数;
[0018]
基站到智能超表面的具有l1个抽头的时域等效多径信道其中,表示其第l1个抽头的时域脉冲响应;
[0019]
智能超表面到单天线用户k的具有l2个抽头的时域等效多径信道其中,表示第l2个抽头的时域脉冲响应;
[0020]
智能体x的状态表达式中:
[0021]
为基站经智能超表面至第k个单天线用户在第n个子载波上的频域信道矩阵,其中,表示基站经智能超表面至第k个单天线用户在第n个子载波上的时域信道矩阵,其中,l=max{l0,l1+l
2-1}表示最大延迟抽头数;
为基站至第k个单天线用户的直射路径在第n个子载波上的频域信道系数;
[0022]
步骤s3、若t=1,则进入步骤s4;否则,进入步骤s5;
[0023]
步骤s4、根据ε-贪婪策略,获取(0,1)之间的随机数x,若x小于某一预设门限值ε,智能体x从码本中随机选择一个码字作为动作a
t
;否则,将状态s
t
输入智能体x的评价q网络u,输出为码本中每个码字的q值,从中选择q值最大的动作其中a

表示任一动作;将动作a
t
作为t时刻的智能超表面反射系数向量并计算系统频谱效率作为t时刻的奖励r
t

[0024][0025]
其中,n为子载波数量;n
cp
≥max(l0,l3)为ofdm调制的循环前缀长度;pn为分配给第n个子载波上的发送功率;γ是实际编码调制方式对ris辅助多天线ofdm系统容量的影响因子,σ2为噪声功率;为基站经智能超表面至第k个单天线用户在第n个子载波上的基于ris分块的频域信道矩阵,其中,上标(
·
)
t
表示转置,表示基站经智能超表面第e个分块至第k个单天线用户在第n个子载波上的频域信道,其中,q=ib+j+α+βbc,α=edmodb,β=ed|b;其中,mod表示取模运算,而a|b表示a/b取余,i和j分别表示第e个分块的第i行第j列;α和β分别表示以分块为单位下ris的第α列第β行分块;b和c分别表示ris的列数和分块的行数;令t=t+1,并进入步骤s2;
[0026]
步骤s5、将四元组(s
t-1
,a
t-1
,r
t-1
,s
t
)作为一个经验样本存入经验池z中,若经验池已存满,则用该经验样本覆盖经验池中最早的一个经验样本;
[0027]
步骤s6、智能体x从经验池z中以批尺寸nb进行随机采样来计算评价q网络u的目标值;然后对评价q网络u进行梯度下降更新,并对目标q网络进行软更新,如果t-1>t,则停止迭代,否则转到步骤s4;
[0028]
步骤s7、训练完成后,智能体从环境中获得当前时刻t的信道并根据步骤s2中的方法将其转化为状态s
t
,将状态s
t
输入智能体x的评价q网络u,从其输出中选出q值最大的可选动作作为最终的智能超表面反射系数向量。
[0029]
优选的,步骤s1中,
[0030]
所述评价q网络u根据来自环境的状态评价每个动作的收益,所述评价q网络u的输出包含两个分支:状态s的价值函数分支v(s)和状态s下动作a的优势函数分支a(s,a),状态s下动作a的价值函数估计值为:
[0031][0032]
所述目标q网络与评价q网络u拥有相同的结构,所述目标q网络的参数复制自评价q网络u,每隔n
t
个时隙更新一次;
[0033]
所述经验池z用于存储智能体x学习过程中产生的样本;初始化评价q网络u的参数目标q网络的参数最大步长t和候选码字的个数l,令t=1;计算基站分配给子载波n的功率其中p
t
为基站的总发送功率。
[0034]
优选的,步骤s6中,随机采样与网络的更新方法的实现过程为:
[0035]
步骤s61:若t≥nb+1并且tmodu=0,从经验池中随机采样nb个样本其中每个样本为经验池中存储的第ki个时刻的样本四元组;否则不采样,转到步骤s2继续产生并存储样本;
[0036]
步骤s62:将样本d中所有样本的状态输入评价q网络u,得到对应动作的价值函数估计值按照bellman贝尔曼方程计算得到价值函数目标值其中γ为奖励函数的折扣因子,为目标q网络的价值函数估计值;
[0037]
步骤s63:计算d中nb个样本均方误差作为评价q网络u的损失函数:
[0038][0039]
其中:表示第ki个时刻的样本四元组所求的价值函数目标值;为评价q网络u的参数;
[0040]
a4)每个时隙对目标q网络的参数进行软更新:
[0041][0042]
其中,τ1为软更新参数。
[0043]
优选的,所述评价q网络u和目标q网络均包括四个全连接层,四个全连接层分别为:输入层、两个隐藏层和输出层;其中,两个所述隐藏层之后都分别包括一个relu激活层,两个所述输出层均包含两个分支,分别为优势函数分支和价值函数分支,优势函数分支和价值函数分支共享输入层和两个隐藏层。
[0044]
优选的,所述步骤s1中的评价q网络u和目标q网络的网络参数包括全连接层的权重和偏置。
[0045]
本发明的有益效果是:
[0046]
1、本发明对信道快衰落具有很好的鲁棒性,适用于各种典型的无线通信环境;
[0047]
2、本发明中的智能超表面反射系数向量设计方法收敛速度快、易于实现,其计算效率与传统的计算方法相比提高了数倍;
[0048]
3、本发明能以较低的时间成本获得较高的系统频谱效率。
附图说明
[0049]
图1为采用深度强化学习智能体优化智能超表面相位矩阵的网络框架图。
具体实施方式
[0050]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0051]
考虑一个智能超表面辅助的多天线ofdm系统中,基于频谱效率最大化准则,设计智能超表面反射系数向量,更具体的说:
[0052]
1、基站配置p=8根天线,系统中配置一个智能超表面辅助服务k=2个单天线用户,所述智能超表面为均匀平面阵包括m=a
×
b=10
×
20个反射单元,其中,垂直方向a=10行反射单元,水平方向每行b=20个反射单元,各反射单元仅能取0或π两种反射相移,同时智能超表面划分为若干块,每一块包含w=c
×
d=10
×
2个反射单元,其中,垂直方向包含c=10行反射单元,水平方向每行包含d=2个反射单元,每块中的反射单元采用相同的反射相移;智能超表面的反射系数向量表示为其中,表示智能超表面的分块个数,θe表示第e块智能超表面的相移;将所有可能的智能超表面反射系数向量存放到码本中,即中的每一个码字对应一种可能的反射系数向量因此码本中共有2e=1024个码字;系统整体带宽被划分为n=64个子载波,表示为集合第k个用户占用子载波的集合表示为sk满足并且s1={0,1,...,31},s2={32,33,...,63}。
[0053]
2、根据权利1所述的一种ris辅助多天线ofdm系统1比特相移设计方法,其特征在于:所述相移设计方法包括以下步骤:
[0054]
步骤s1、在基站处构建智能体x的经验池及深度强化学习神经网络,包括:评价q网络u和目标q网络所述评价q网络u用于评价各动作的q值,所述目标q网络用于保证网络更新的稳定性,所述智能体以码本作为动作空间,其中的每个码字为可选的动作,以系统总频谱效率为奖励;上述各部分网络功能说明如下:
[0055]
所述评价q网络u根据来自环境的状态评价每个动作的收益,其输出包含两个分支:状态s的价值函数分支v(s)和状态s下动作a的优势函数分支a(s,a),状态s下动作a的价值函数估计值通过下式获得:
[0056][0057]
所述目标q网络与评价q网络u拥有相同的网络结构,其参数复制自评价q网络u,每隔n
t
个时隙更新一次;
[0058]
所述经验池z用于存储智能体x学习过程中产生的样本;初始化评价q网络u的参数目标q网络的参数最大步长t=500000和候选码字的个数l=4,输入层和两个隐藏层的神经元个数分别为1408,4096,4096,输出层的优势函数分支神经元个数为1024,价值函数分支神经元个数为1,令t=1;计算基站分配给子载波n的功率
其中p
t
=5dbm为基站的总发送功率。
[0059]
步骤s2、在t时刻,将智能体x的状态设置为:
[0060][0061]
基站已知各用户的信道状态信息,包括:基站到用户k,k=1,2,

,k,的具有l0=16个抽头的直接路径时域基带等效多径信道为其中,表示其第l0个抽头的时域脉冲响应;基站到智能超表面的具有l1=4个抽头的时域等效多径信道其中,表示其第l1个抽头的时域脉冲响应;智能超表面到用户k的具有l2=13个抽头的时域等效多径信道其中,表示第l2个抽头的时域脉冲响应。智能体x的状态表达式中,n∈{8v,v=0,1,...,7}表示对信道状态信息每8个进行一次采样处理;为基站经智能超表面至第k个用户在第n个子载波上的频域信道矩阵,其中,表示基站经智能超表面至第k个用户在第n个子载波上的时域信道矩阵,其中,l=max{l0,l1+l
2-1}=16表示最大延迟抽头数;为基站至第k个用户的直射路径在第n个子载波上的频域信道系数。
[0062]
步骤s3、若t=1,则进入步骤s4;否则,进入步骤s5。
[0063]
步骤s4、根据ε-贪婪策略,获取(0,1)之间的随机数x,若x小于某一预设门限值ε=0.95,ε每1000个训练时隙下降1%直到0.1,智能体x从码本中随机选择一个码字作为动作a
t
;否则,将状态s
t
输入智能体x的评价q网络u,输出为码本中每个动作码字的q值,从中选择q值最大的动作将动作a
t
作为t时刻的智能超表面反射系数向量并利用下式计算系统频谱效率作为t时刻的奖励r
t

[0064][0065]
其中,n
cp
=16为ofdm调制的循环前缀长度;γ=8.8db是实际编码调制方式对系统容量的影响因子,σ2=-75dbm为噪声功率;为基站经智能超表面至第k个用户在第n个子载波上的基于ris分块的频域信道矩阵,其中,上标(
·
)
t
表示转置,表示基站经智能超表面第e个分块至第k个用户在第n个子载波上的频域信道,其中,q=ib+j+α+βbc,α=edmodb,β=ed|b;其中,mod表示取模运算,而a|b表示a/b取余;令t=t+1,并进入步骤s2。
[0066]
步骤s5、将四元组(s
t-1
,a
t-1
,r
t-1
,s
t
)作为一个经验样本存入经验池z中,若经验池
已存满,则用该经验样本覆盖经验池中最早的一个经验样本。
[0067]
步骤s6、智能体x从经验池z中以批尺寸nb=512进行随机采样来计算评价q网络的目标值;然后对评价q网络进行梯度下降更新,并对目标q网络进行软更新,如果t-1>t,则停止迭代,否则转到步骤s4。
[0068]
步骤s7、训练完成后,智能体从环境中获得当前时刻t的信道并根据步骤s2中的方法将其转化为状态s
t
,将状态s
t
输入智能体x的评价q网络u,从其输出中选出q值最大的可选动作作为最终的智能超表面反射系数向量。
[0069]
3、根据权利要求2所述的一种ris辅助多天线ofdm系统1比特相移设计方法,其特征在于:步骤s6中,随机采样与网络更新方法按如下步骤进行:
[0070]
a1)若t≥nb+1并且tmod200=0,从经验池中随机采样nb个样本其中每个样本为经验池中存储的第ki个时刻的样本四元组;否则不采样,转到步骤s2继续产生并存储样本;
[0071]
a2)将d中所有样本的状态输入评价q网络,得到对应动作的价值函数估计值按照bellman方程计算得到价值函数目标值其中γ为奖励函数的折扣因子,为目标q网络的价值函数估计值;
[0072]
a3)计算d中nb个样本均方误差作为评价q网络的损失函数:
[0073][0074]
其中为评价q网络的参数;
[0075]
a4)每个时隙对目标q网络的参数进行软更新:
[0076][0077]
公式中,τ=0.005为软更新参数。通过软更新,让目标网络的输出缓慢变化以缓解过拟合现象,提高智能体学习稳定性。
[0078]
综上,本发明在运行时间复杂度和系统性能上均优于传统的数值迭代设计方法,利用深度神经网络强大的非线性建模能力,快速学习出最优的智能超表面反射系数向量,特别是对于快速时变信道有很强的鲁棒性,可以实现高效的系统频谱效率。
[0079]
本发明未详述之处,均为本领域技术人员的公知技术。
[0080]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

技术特征:
1.一种ris辅助多天线ofdm系统,其特征在于:包括基站,所述基站配置p根单天线,所述ris辅助多天线ofdm系统中配置一个智能超表面辅助服务k个单天线用户;所述智能超表面为均匀平面阵,该均匀平面阵包括m=a
×
b个反射单元,其中,垂直方向a行反射单元,水平方向每行b个反射单元,各反射单元仅能取0或π两种反射相移,同时将所述智能超表面划分为若干块,每一块均包含w=c
×
d个反射单元,其中,垂直方向包含c行反射单元,水平方向每行包含d个反射单元,每一块中的反射单元采用相同的反射相移;所述智能超表面的反射系数向量表示为其中,表示智能超表面的分块个数,θ
e
表示第e块智能超表面的相移;将所有可能的智能超表面反射系数向量存放到码本中,即码本中的每一个码字对应一种可能的反射系数向量因此码本中共有2
e
个码字;ris辅助多天线ofdm系统整体的带宽被划分为n个子载波,表示为集合第k个单天线用户占用子载波的集合表示为s
k
,满足并且2.根据权利要求1所述的一种ris辅助多天线ofdm系统1比特相移设计方法,其特征在于:包括以下步骤:步骤s1、在基站处构建智能体x的经验池及深度强化学习神经网络,深度强化学习神经网络包括评价q网络u和目标q网络所述评价q网络u用于评价各动作的q值,q值表示动作执行后的累积奖励,所述目标q网络用于保证网络更新的稳定性,所述智能体以码本作为动作空间,其中的每个码字为可选的动作,以ris辅助多天线ofdm系统的总频谱效率为奖励;步骤s2、在t时刻,智能体x的状态表达式为:基站已知各单天线用户的信道状态信息包括:基站到单天线用户k的具有l0个抽头的直接路径时域基带等效多径信道为其中,表示其第l0个抽头的时域脉冲响应,其中p表示基站天线数;基站到智能超表面的具有l1个抽头的时域等效多径信道其中,表示其第l1个抽头的时域脉冲响应;智能超表面到单天线用户k的具有l2个抽头的时域等效多径信道其中,表示第l2个抽头的时域脉冲响应;智能体x的状态表达式中:为基站经智能超表面至第k个单天
线用户在第n个子载波上的频域信道矩阵,其中,表示基站经智能超表面至第k个单天线用户在第n个子载波上的时域信道矩阵,其中,l=max{l0,l1+l
2-1}表示最大延迟抽头数;为基站至第k个单天线用户的直射路径在第n个子载波上的频域信道系数;步骤s3、若t=1,则进入步骤s4;否则,进入步骤s5;步骤s4、根据ε-贪婪策略,获取(0,1)之间的随机数x,若x小于某一预设门限值ε,智能体x从码本中随机选择一个码字作为动作a
t
;否则,将状态s
t
输入智能体x的评价q网络u,输出为码本中每个码字的q值,从中选择q值最大的动作其中a

表示任一动作;将动作a
t
作为t时刻的智能超表面反射系数向量并计算系统频谱效率作为t时刻的奖励r
t
:其中,n为子载波数量;n
cp
≥max(l0,l3)为ofdm调制的循环前缀长度;p
n
为分配给第n个子载波上的发送功率;γ是实际编码调制方式对ris辅助多天线ofdm系统容量的影响因子,σ2为噪声功率;为基站经智能超表面至第k个单天线用户在第n个子载波上的基于ris分块的频域信道矩阵,其中,上标(
·
)
t
表示转置,表示基站经智能超表面第e个分块至第k个单天线用户在第n个子载波上的频域信道,其中,q=ib+j+α+βbc,α=edmodb,β=ed|b;其中,mod表示取模运算,而a|b表示a/b取余,i和j分别表示第e个分块的第i行第j列;α和β分别表示以分块为单位下ris的第α列第β行分块;b和c分别表示ris的列数和分块的行数;令t=t+1,并进入步骤s2;步骤s5、将四元组(s
t-1
,a
t-1
,r
t-1
,s
t
)作为一个经验样本存入经验池z中,若经验池已存满,则用该经验样本覆盖经验池中最早的一个经验样本;步骤s6、智能体x从经验池z中以批尺寸n
b
进行随机采样来计算评价q网络u的目标值;然后对评价q网络u进行梯度下降更新,并对目标q网络进行软更新,如果t-1>t,则停止迭代,否则转到步骤s4;步骤s7、训练完成后,智能体从环境中获得当前时刻t的信道并根据步骤s2中的方法将其转化为状态s
t
,将状态s
t
输入智能体x的评价q网络u,从其输出中选出q值最大的可选动作作为最终的智能超表面反射系数向量。3.根据权利要求2所述的一种ris辅助多天线ofdm系统1比特相移设计方法,其特征在于:步骤s1中,所述评价q网络u根据来自环境的状态评价每个动作的收益,所述评价q网络u的输出包含两个分支:状态s的价值函数分支v(s)和状态s下动作a的优势函数分支a(s,a),状态s下
动作a的价值函数估计值为:所述目标q网络与评价q网络u拥有相同的结构,所述目标q网络的参数复制自评价q网络u,每隔n
t
个时隙更新一次;所述经验池z用于存储智能体x学习过程中产生的样本;初始化评价q网络u的参数目标q网络的参数最大步长t和候选码字的个数l,令t=1;计算基站分配给子载波n的功率其中p
t
为基站的总发送功率。4.根据权利要求2所述的一种ris辅助多天线ofdm系统1比特相移设计方法,其特征在于:步骤s6中,随机采样与网络的更新方法的实现过程为:步骤s61:若t≥n
b
+1并且t mod u=0,从经验池中随机采样n
b
个样本其中每个样本为经验池中存储的第k
i
个时刻的样本四元组;否则不采样,转到步骤s2继续产生并存储样本;步骤s62:将样本d中所有样本的状态输入评价q网络u,得到对应动作的价值函数估计值按照bellman贝尔曼方程计算得到价值函数目标值其中γ为奖励函数的折扣因子,为目标q网络的价值函数估计值;步骤s63:计算d中n
b
个样本均方误差作为评价q网络u的损失函数:其中:表示第k
i
个时刻的样本四元组所求的价值函数目标值;为评价q网络u的参数;a4)每个时隙对目标q网络的参数进行软更新:其中,τ1为软更新参数。5.根据权利要求2所述的一种ris辅助多天线ofdm系统1比特相移设计方法,其特征在于,所述评价q网络u和目标q网络均包括四个全连接层,四个全连接层分别为:输入层、两个隐藏层和输出层;其中,两个所述隐藏层之后都分别包括一个relu激活层,两个所述输出层均包含两个分支,分别为优势函数分支和价值函数分支,优势函数分支和价值函数分支共享输入层和两个隐藏层。6.根据权利要求2所述的一种ris辅助多天线ofdm系统1比特相移设计方法,其特征在于,所述步骤s1中的评价q网络u和目标q网络的网络参数包括全连接层的权重和偏置。

技术总结
本发明公开了一种RIS辅助多天线OFDM系统和1比特相移设计方法,该方法适用于RIS辅助的MISO-OFDM传输系统,其中RIS上的各反射单元仅能取0或π两种相移,同时RIS划分为若干块,每块包含若干反射单元,每块中的反射单元采用相同的反射相移,基站发送的信号可经RIS反射到达用户端,RIS通过改变信号相移,从而达到增强接收信号的效果。该方法中基站已知各用户信道状态信息,首先对信道状态信息预处理,进而用预处理后的信道状态信息来训练一个构建好的卷积神经网络模型。基于系统频谱效率最大化原则,从卷积神经网络输出的所有候选RIS相位矩阵中选出最佳相位矩阵用于信息传输。本发明收敛速度快,以相对传统数值方法较低的计算复杂度和时延获得较高的系统吞吐量。度和时延获得较高的系统吞吐量。度和时延获得较高的系统吞吐量。


技术研发人员:李潇 陈鹏 张华谦 金石
受保护的技术使用者:东南大学
技术研发日:2023.06.02
技术公布日:2023/8/31
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐