基于多传感器的无人机铁路巡检的定位方法及定位系统
未命名
09-24
阅读:53
评论:0
1.本发明涉及无人机铁路巡检技术领域,具体地涉及一种基于多传感器的无人机铁路巡检的定位方法及定位系统。
背景技术:
2.铁路是我国国民经济的大动脉,铁路运输长期以来在我国运输中起着举足轻重的作用。因此铁路安全作为关系到国家和人民生命财产的大事,一直受到国家和铁道部的重视。
3.目前,受大风天气等的影响,铁路上以及铁路接触网上常会出现异物,铁路以及接触网上的异物会对铁路的正常安全运行以及供电造成影响,因此需要定时清理铁路异物,以保障铁路的安全运行以及正常供电。
4.传统的铁路异物巡检方法为人工巡检和巡检车巡检,费时费力且难度极大。无人机因其便利性,很快便被应用于铁路异物的检测工作中。现有的无人机的异物巡检方法没有考虑多传感器之间的相互影响关系,进而使得无人机对异物位置等信息的预测精度的低;且在恶劣环境中,其中一个或多个传感器的数据受到瞬时干扰的情况下,无法进行正常的巡检定位。
5.本技术发明人在实现本发明的过程中发现,现有技术的上述方案具有预测精度低且易受恶劣环境影响的缺陷。
技术实现要素:
6.本发明实施例的目的是提供一种基于多传感器的无人机铁路巡检的定位方法及定位系统,该基于多传感器的无人机铁路巡检的定位方法及定位系统具体预测精度高且抗干扰能力强。
7.为了实现上述目的,本发明实施例提供一种基于多传感器的无人机铁路巡检的定位方法,包括:
8.获取多个传感器监测到的特征集合;
9.根据所述特征集合获取特征数据并形成训练数据集合;
10.构建门控降噪自编码器、bigru神经网络模型和多头自注意力机制模型;
11.预处理所述训练数据集合中的特征数据以获得正则特征数据;
12.将所述正则特征数据输入至所述门控降噪自编码器中,以获得可用特征;
13.将所述可用特征输入至所述bigru神经网络模型中进行训练,以获得信息汇聚值;
14.将所述信息汇聚值输入至所述多头自注意力机制模型中,以获得预测结果;
15.根据所述预测结果修正所有参数。
16.可选地,预处理所述训练数据集合中的特征数据以获得正则特征数据包括:
17.根据公式(1)获取每个所述特征数据对应的标准特征数据,
[0018][0019]
其中,为第i个所述标准特征数据,i为整数编号,i∈{1,2,
…
,i},i为所述训练数据集合中特征数据的数量,x为所述训练数据集合,x={x1,x2,
…
,xi},xi为所述训练数据集合中第i个特征数据,max()为取最大值操作,max()为取最小值操作;
[0020]
根据公式(2)获取每个所述标准特征数据的正则特征数据,
[0021][0022]
其中,为标准特征数据集合,x
l
为所述正则特征数据集合,s为所述传感器的序号,且s∈{1,2,
…
s},βs为第s个传感器的权重,λ为可调惩罚系数,φs为第s个传感器的学习参数,φ为s个传感器的学习参数的和,即φ=φ1+φ2+
…
+φs。
[0023]
可选地,将所述正则特征数据输入至所述门控降噪自编码器中,以获得可用特征包括:
[0024]
获得滑动窗口的大小;
[0025]
根据所述滑动窗口的大小构造二维训练样本;
[0026]
将所述二维训练样本添加高斯噪声以形成训练样本数据;
[0027]
根据公式(3)计算所述训练样本数据中每个样本数据特征的隐藏特征值,
[0028][0029]
其中,n为特征序号,n∈{1,2
…
,n},n为所述训练样本数据中样本数据特征的数量,σ为sigmoid激活函数,为第n个所述样本数据特征的编码误差系数,为第n个所述样本数据特征的编码偏置系数,t为时间步,t∈{1,2,
…
t},t为所述滑动窗口的最大值,为第t个时间步下第n个添加高斯噪声的样本数据特征,为第t个时间步下第n个样本数据特征的所述隐藏特征值;
[0030]
根据公式(4)计算每个所述样本数据特征的重构数据特征,
[0031][0032]
其中,为第t个时间步下第n个样本数据特征的所述重构数据特征,为第n个样本数据特征的解码误差系数,为样本数据特征的解码偏置系数。
[0033]
可选地,将所述正则特征数据输入至所述门控降噪自编码器中,以获得可用特征还包括:
[0034]
根据公式(5)计算损失函数,
[0035][0036]
其中,l
pre
为损失函数值,ω为惩罚项,为所述重构数据特征的集合,
为预测标签,y为真实标签;
[0037]
根据所述损失函数修正对应的所述编码误差系数、所述编码偏置系数、所述解码误差系数以及所述解码偏置系数。
[0038]
可选地,将所述正则特征数据输入至所述门控降噪自编码器中,以获得可用特征还包括:
[0039]
根据公式(6)计算门控信息,
[0040][0041]
其中,leakyrelu()为激活函数,g
t
为所述门控信息,w
gt
为预设门控权重,b
gt
为预设门控偏置;
[0042]
根据公式(7)计算待过滤信息,
[0043]vt
=tanh(w
otgt
+b
ot
),
ꢀꢀ
(7)
[0044]
其中,v
t
为所述待过滤信息,w
ot
为预设过滤权重,b
ot
为预设过滤偏置,tanh为激活函数;
[0045]
根据公式(8)计算可用特征,
[0046][0047]
其中,为所述可用特征。
[0048]
可选地,将所述可用特征输入至所述bigru神经网络模型中进行训练,以获得信息汇聚值包括:
[0049]
根据公式(9)计算更新门值,
[0050][0051]
其中,为所述更新门值,为所述更新门值的输入变换矩阵,为所述更新门值的隐藏变换矩阵,为所述更新门值的偏置,a为bigru的前向或后向,取值1或-1,a=1时为前向,a=-1时为后向,在a=1时为上一时刻的隐藏特征值,在a=1时为下一时刻隐藏特征值;
[0052]
根据公式(10)计算重置门值,
[0053][0054]
其中,为所述重置门值,为所述重置门值的输入变换矩阵,为所述重置门值的隐藏变换矩阵,为所述重置门值的偏置;
[0055]
根据公式(11)计算当前时刻的需过滤信息,
[0056]
[0057]
其中,为所述需过滤信息,为所述需过滤信息的输入变换矩阵,为所述需过滤信息的隐藏变换矩阵,为所述需过滤信息的偏置;
[0058]
根据公式(12)计算当前时刻的隐藏状态值,
[0059][0060]
其中,为所述隐藏状态值;
[0061]
根据公式(13)计算所有的所述传感器的信息汇聚值,
[0062][0063]
其中,u为所述信息汇聚值,h
t,n(1)
为当前时刻第n个特征的前向的所述隐藏状态值,h
t,n(-1)
为当前时刻第n个特征的后向的所述隐藏状态值。
[0064]
可选地,将所述信息汇聚值输入至所述多头自注意力机制模型中,以获得预测结果包括:
[0065]
根据所述信息汇聚值获取q值、k值以及v值;
[0066]
根据公式(14)计算注意力向量,
[0067][0068]
其中,ωh为所述注意力向量,softmax()为softmax函数,为所述q值,为所述q值的变换矩阵,为所述k值,为所述k值的变换矩阵,dk为输入特征的维度,h为头的标号,h={1,2,
…
,h},h为头的数量;
[0069]
根据公式(15)计算待输出向量,
[0070][0071]
其中,tah为所述待输出向量,为所述v值,为所述v值的变换矩阵;
[0072]
根据公式(16)计算输出向量,
[0073]ot
=concat(ta1,ta2,
…
tah),
ꢀꢀ
(16)
[0074]
其中,o
t
为所述输出向量,concat()为拼接操作;
[0075]
根据公式(17)计算预测结果,
[0076][0077]
其中,为所述预测结果,fully-connection()为全连接操作。
[0078]
可选地,根据所述预测结果修正所有参数包括:
[0079]
根据公式(18)修正所有参数,
[0080]
[0081]
其中,loss-mse()为loss函数,为真实结果,γ为惩罚项,θ为模型参数。
[0082]
可选地,所述定位方法还包括:
[0083]
根据所述特征集合获取测试数据并形成测试数据集合;
[0084]
根据公式(19)计算评价值,
[0085][0086]
其中,rmse为评价值,t
testing
为所述测试数据集合的测试值数量,j为整数编号,j∈{1,2,
…
,t
testing
},yj为第j个测试值的真实值,为第j个测试值的预测值;
[0087]
判断所述评价值是否大于或等于预设的评价阈值;
[0088]
在所述评价值大于或等于所述评价阈值的情况下,判定模型为最优模型;
[0089]
在所述评价值小于所述评价阈值的情况下,增加所述特征数据的训练样本。
[0090]
另一方面,本发明还提供一种基于多传感器的无人机铁路巡检的定位系统,包括:
[0091]
无人机本体;
[0092]
多个传感器,设置在所述无人机本体上,用于监测铁路异物的多个特征值;
[0093]
控制器,用于执行如上述任一所述的方法。
[0094]
通过上述技术方案,本发明提供的基于多传感器的无人机铁路巡检的定位方法及定位系统通过对多个传感器监测到的特征集合进行处理,并获得正则特征数据,将该训练数据集合依次沿着门控降噪自编码器、bigru神经网络模型以及多头自注意力机制模型中进行训练,以获得预测结果,并根据预测结果不断优化模型。采用门控降噪自编码器、bigru神经网络模型和多头自注意力机制模型配合的方式,能够自适应地判别出蕴含更多重要信息的传感器,进而大幅提升预测精度,且能够在部分传感器故障时正常工作。
[0095]
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0096]
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
[0097]
图1是根据本发明的一个实施方式的基于多传感器的无人机铁路巡检的定位方法的流程图;
[0098]
图2是根据本发明的一个实施方式的基于多传感器的无人机铁路巡检的定位方法中预处理训练数据的流程图;
[0099]
图3是根据本发明的一个实施方式的基于多传感器的无人机铁路巡检的定位方法中门控降噪自编码器预训练的流程图;
[0100]
图4是根据本发明的一个实施方式的基于多传感器的无人机铁路巡检的定位方法中bigru神经网络模型训练的流程图;
[0101]
图5是根据本发明的一个实施方式的基于多传感器的无人机铁路巡检的定位方法中多头自注意力机制模型训练的流程图;
[0102]
图6是根据本发明的一个实施方式的基于多传感器的无人机铁路巡检的定位方法
的测试数据测试评价的流程图。
具体实施方式
[0103]
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
[0104]
图1是根据本发明的一个实施方式的基于多传感器的无人机铁路巡检的定位方法的流程图。在图1中,该定位方法可以包括:
[0105]
在步骤s10中,获取多个传感器监测到的特征集合。其中,多个传感器分别监测不同的无人机姿态数据,并形成总的特征数据的集合,即特征集合,这些数据的值域和量纲各不相同。部分单个传感器可能会收集多种数据,如磁力计解算出的偏航角、俯仰角以及滚动角等。不同传感器收集数据的周期不一样,采用采样周期最长的特征作为基准,对于每个传感器来说,确保总的特征数据的集合中的每个时间步上有且只有唯一的特征值,落在两组时间步之间的特征数据直接丢弃。
[0106]
在步骤s11中,根据特征集合获取特征数据并形成训练数据集合。其中,在获取特征集合后,需要对特征集合中的数据进行等比划分,以区分出用于训练的数据和用于测试的数据,优先将用于训练的数据划分出。
[0107]
在步骤s12中,构建门控降噪自编码器、bigru神经网络模型和多头自注意力机制模型。其中,考虑到多个传感器配合的识别精度,以及应对部分恶劣情况的影响,需要构建门控降噪自编码器、bigru神经网络模型和多头自注意力机制模型。
[0108]
在步骤s13中,预处理训练数据集合中的特征数据以获得正则特征数据。其中,为了消除特征数据的量纲,加块收敛速度,还需要对训练数据集合中的特征数据进行预处理。
[0109]
在步骤s14中,将正则特征数据输入至门控降噪自编码器中,以获得可用特征。其中,为了降低正则特征数据的噪声的影响,还需要将正则特征数据输入到门控降噪自编码器gdae中进行预训练,并获取可用特征,以便于后续的训练。
[0110]
在步骤s15中,将可用特征输入至bigru神经网络模型中进行训练,以获得信息汇聚值。其中,考虑到参数量的影响,采用bigru神经网络模型,将可用特征输入至该bigru神经网络模型中进行训练,以输出信息汇聚值。
[0111]
在步骤s16中,将信息汇聚值输入至多头自注意力机制模型中,以获得预测结果,其中,考虑到多个传感器之间的相互影响的关系,以及部分传感器易恶劣环境的影响,采用多头自注意力机制模型来融合多传感器的信息,以提高预测精度,同时在部分传感器故障的情况下能够保持正常工作。将bigru神经网络模型输出的信息汇聚值自多头自注意力机制模型输入,多头自注意力输出预测结果。
[0112]
在步骤s17中,根据预测结果修正所有参数。其中,在获得预测结果后,需要对之前的所有参数进行修正,从而训练和优化模型,以达到最优模型。
[0113]
在步骤s10至步骤s17中,自多个传感器收集的特征数据划分出训练数据集合,并将该训练数据集合中的特征数据进行预处理。其次将预处理获得的正则特征数据输入至门控降噪自编码器gdae中进行预训练,再将预训练获得的可用特征输入bigru神经网络模型中进行训练,最后将bigru神经网络模型的输出输入至多头自注意力机制模型中训练,并获得预测结果。预测结果能够对bigru神经网络模型和多头自注意力机制模型中的参数进行
修正,以实现不断训练优化模型的目的。
[0114]
现有的无人机的异物巡检方法没有考虑多传感器之间的相互影响关系,进而导致无人机对异物位置等信息的预测精度低;且部分传感器在恶劣环境中会受到瞬时干扰,进而导致无法进行正常的巡检。在本发明的该实施方式中,采用门控降噪自编码器gdae、bigru神经网络模型以及多头自注意力机制模型配合的方式,门控降噪自编码器gdae预训练正则特征数据以降低噪声的影响,bigru神经网络模型用以降低参数量,多头自注意力机制模型能够融合多传感器的信息以提高预测精度,同时还能提高该无人机对恶劣环境的预测能力。
[0115]
在本发明的该实施方式中,为了加快特征数据的收敛速度,还需要对特征数据进行标准化和正则化处理。具体地,该定位方法还可以包括如图2所示的步骤。在图2中,该定位方法还可以包括:
[0116]
在步骤s20中,根据公式(1)获取每个特征数据对应的标准特征数据,
[0117][0118]
其中,为第i个标准特征数据,i为整数编号,i∈{1,2,
…
,i},i为训练数据集合中特征数据的数量,x为训练数据集合,x={x1,x2,
…
,xi},xi为训练数据集合中第i个特征数据,max()为取最大值操作,max()为取最小值操作。采用max-min标准化,消除量纲,以将特征数据统一在0-1之间,便于后续的训练操作。
[0119]
在步骤s21中,根据公式(2)获取每个标准特征数据的正则特征数据,
[0120][0121]
其中,为标准特征数据集合,x
l
为正则特征数据集合,s为传感器的序号,且s∈{1,2,
…
s},βs为第s个传感器的权重,λ为可调惩罚系数,用于限制模型的复杂性,φs为第s个传感器的学习参数,φ为s个传感器的学习参数的和,即φ=φ1+φ2+
…
+φs。采用group lasso对来自不同传感器的标准特征数据进行分组正则,以加快收敛速度,并且根据来源传感器进行分组,使得不同模式的信息在正则化过程中得以保留。
[0122]
在步骤s20至步骤s21中,先对每个特征数据进行标准化,以获得标准特征数据集合,采样该种标准化的方式能够消除特征数据的量纲。其次,再对标准特征数据集合中的每个标准特征数据进行正则化,并形成正则特征数据集合,采用该种正则化的方式能够实现对标准特征数据的快速收敛,以便于后续的训练操作。
[0123]
在本发明的该实施方式中,为了降低正则特征数据中噪声对训练操作的影响,还需要将正则特征数据输入至门控降噪自编码器中。具体地,该定位方法还可以包括如图3所示的步骤。在图3中,该定位方法还可以包括:
[0124]
在步骤s30中,获得滑动窗口的大小。其中,在本发明中,滑动窗口的大小设置为12,即该滑动窗口包含自当前时间步起算,往前12个时间步的特征。对应的标签是当前时间步的特征数据,即与异常目标的距离、倾角等。
[0125]
在步骤s31中,根据滑动窗口的大小构造二维训练样本。其中,该过程中特征数据的数值大小和顺序没有改变,指示划分出了固定大小的连续训练样本,大大增加了训练样
本数量。
[0126]
在步骤s32中,将二维训练样本添加高斯噪声以形成训练样本数据。其中,二维训练样本中的数据均为正则特征数据,对正则特征数据集合x
l
添加高斯噪声,形成训练样本数据
[0127]
在步骤s33中,根据公式(3)计算训练样本数据中每个样本数据特征的隐藏特征值,
[0128][0129]
其中,n为特征序号,n∈{1,2
…
,n},n为训练样本数据中样本数据特征的数量,σ为sigmoid激活函数,为第n个样本数据特征的编码误差系数,为第n个样本数据特征的编码偏置系数,t为时间步,t∈{1,2,
…
t},t为滑动窗口的最大值,为第t个时间步下第n个添加高斯噪声的样本数据特征,为第t个时间步下第n个样本数据特征的隐藏特征值。
[0130]
在步骤s34中,根据公式(4)计算每个样本数据特征的重构数据特征,
[0131][0132]
其中,为第t个时间步下第n个样本数据特征的重构数据特征,为第n个样本数据特征的解码误差系数,为样本数据特征的解码偏置系数。这部分特征本身没有作用,只是通过误差的反向传播,使得重构数据特征越来越接近添加高斯噪声的样本数据特征以及预测值越来越接近真实值的过程中,隐藏特征值越来越好,越来越好用。
[0133]
在步骤s35中,根据公式(5)计算损失函数,
[0134][0135]
其中,l
pre
为损失函数值,ω为惩罚项,为重构数据特征的集合,为重构数据特征的集合,为预测标签,y为真实标签。
[0136]
在步骤s36中,根据损失函数修正对应的编码误差系数、编码偏置系数、解码误差系数以及解码偏置系数。其中,损失函数为反向传播,能够不断修正编码误差系数、编码偏置系数、解码误差系数以及解码偏置系数,使得后续要使用的隐藏特征值更利于预测。
[0137]
在步骤s37中,根据公式(6)计算门控信息,
[0138]
[0139]
其中,leakyrelu()为激活函数,g
t
为门控信息,g
t
的取值为0-1,用来判断对应的传感器收集信息是否重要,以及多少对后续的预测有用,在考量传感器重要性时,门控机制的对应值也是一个很重要的标准,w
gt
为预设门控权重,b
gt
为预设门控偏置。具体地,leakyrelu激活函数的公式可以如公式(20)所示:
[0140][0141]
其中,x为自变量。该leakyrelu激活函数能够有效地防止梯度消失的问题出现,在无人机进行长时间连续飞行时很有必要。
[0142]
在步骤s38中,根据公式(7)计算待过滤信息,
[0143]vt
=tanh(w
otgt
+b
ot
),
ꢀꢀ
(7)
[0144]
其中,v
t
为待过滤信息,w
ot
为预设过滤权重,b
ot
为预设过滤偏置,tanh为激活函数。
[0145]
在步骤s39中,根据公式(8)计算可用特征,
[0146][0147]
其中,为可用特征。
[0148]
在步骤s30至步骤s39中,先调节滑动窗口的大小以构造二维训练样本,并添加高斯噪声,获得训练样本数据。对该训练样本数据进行门控降噪自编码器gdae预训练,获得隐藏特征值,并根据隐藏特征值获取可用特征,以便于后续的主训练。在门控降噪自编码器gdae预训练中,通过计算重构数据特征以及损失函数,能够不断修正对应的编码误差系数、编码偏置系数、解码误差系数以及解码偏置系数,使得计算出的该可用特征更利于后续的训练预测过程。
[0149]
在本发明的该实施方式中,为了降低神经网络模型的参数量,还需要将可用特征输入至bigru神经网络模型中进行训练。具体地,该定位方法还可以包括如图4所示的步骤。在图4中,该定位方法还可以包括:
[0150]
在步骤s40中,根据公式(9)计算更新门值,
[0151][0152]
其中,为更新门值,为更新门值的输入变换矩阵,为更新门值的隐藏变换矩阵,为更新门值的偏置,a为bigru的前向或后向,取值1或-1,a=1时为前向,a=-1时为后向,在a=1时为上一时刻的隐藏特征值,在a=1时为下一时刻隐藏特征值。
[0153]
在步骤s41中,根据公式(10)计算重置门值,
[0154][0155]
其中,为重置门值,为重置门值的输入变换矩阵,为重置门值的隐藏变换矩阵,为重置门值的偏置。
[0156]
在步骤s42中,根据公式(11)计算当前时刻的需过滤信息,
[0157][0158]
其中,为需过滤信息,为需过滤信息的输入变换矩阵,为需过滤信息的隐藏变换矩阵,为需过滤信息的偏置。
[0159]
在步骤s43中,根据公式(12)计算当前时刻的隐藏状态值,
[0160][0161]
其中,为隐藏状态值。
[0162]
在步骤s44中,根据公式(13)计算所有的传感器的信息汇聚值,
[0163][0164]
其中,u为信息汇聚值,h
t,n(1)
为当前时刻第n个特征的前向的隐藏状态值,h
t,n(-1)
为当前时刻第n个特征的后向的隐藏状态值。u是所有bigru单元隐藏层的拼接,即在这里完成所有传感器信息汇聚的过程。
[0165]
在步骤s40至步骤s44中,根据可用特征以及对应时刻的隐藏特征值依次计算bigru神经网络模型的更新门值以及重置门值,并根据重置门值计算出需过滤信息。再根据需过滤信息获取当前时刻前向和后向的隐藏状态值,最后计算出所有传感器的信息汇聚值,以完成所有bigru单元隐藏层的拼接,便于后续多头自注意力机制模型的预测。
[0166]
在本发明的该实施方式中,为了获取预测结果,还需要将信息汇聚值输入至多头自注意力机制模型中进行训练。具体地,该定位方法还可以包括如图5所示的步骤。在图5中,该定位方法还可以包括:
[0167]
在步骤s50中,根据信息汇聚值获取q值、k值以及v值。其中,由u复制三份生成了对应的q值、k值以及v值。
[0168]
在步骤s51中,根据公式(14)计算注意力向量,
[0169][0170]
其中,ωh为注意力向量,softmax()为softmax函数,为q值,为q值的变换矩阵,为k值,为k值的变换矩阵,dk为输入特征的维度,为了防止模型过度复杂。h为头的标号,h={1,2,
…
,h},h为头的数量。在本发明的该实施方式中,h=4,即有4个头。注意力向量ωh表示特定特征在无人机姿态预测任务中的重要性,实际应用过程中注意力值会根据输入自适应地变化,从而实现实时判别传感器的重要性。
[0171]
在步骤s52中,根据公式(15)计算待输出向量,
[0172][0173]
其中,tah为待输出向量,为v值,为v值的变换矩阵。
[0174]
在步骤s53中,根据公式(16)计算输出向量,
[0175]ot
=concat(ta1,ta2,
…
tah),
ꢀꢀ
(16)
[0176]
其中,o
t
为输出向量,concat()为拼接操作。
[0177]
在步骤s54中,根据公式(17)计算预测结果,
[0178][0179]
其中,为预测结果,fully-connection()为全连接操作。
[0180]
在步骤s50至步骤s54中,信息汇聚值生成对应的q值、k值以及v值,依次计算注意力向量、待输出向量以及输出向量,最后经全连接操作获得预测结果,进而完成对该多头自注意力机制模型的训练。
[0181]
在本发明的该实施方式中,该bigru神经网络模型和多头自注意力机制模型中的参数修正还包括:
[0182]
根据公式(18)修正所有参数,
[0183][0184]
其中,loss-mse()为loss函数,为真实结果,γ为惩罚项,θ为模型参数。具体地,修正的参数包括更新门值的输入变换矩阵更新门值的隐藏变换矩阵更新门值的偏置重置门值的输入变换矩阵重置门值的隐藏变换矩阵重置门值的偏置需过滤信息的输入变换矩阵需过滤信息的隐藏变换矩阵需过滤信息的偏置q值的变换矩阵k值的变换矩阵v值的变换矩阵等。
[0185]
在本发明的该实施方式中,如图6,该定位方法还可以包括:
[0186]
在步骤s60中,根据特征集合获取测试数据并形成测试数据集合。其中,在获取特征集合后,需要对特征集合中的数据进行等比划分,以区分出用于训练的数据和用于测试的数据,其次将用于测试的数据划分出。在将测试的数据划分出中后,用该测试的数据对训练好的模型进行测试,并输出预测结果。
[0187]
在步骤s61中,根据公式(19)计算评价值,
[0188][0189]
其中,rmse为评价值,t
testing
为测试数据集合的测试值数量,j为整数编号,j∈{1,2,
…
,t
testing
},yj为第j个测试值的真实值,为第j个测试值的预测值。
[0190]
在步骤s62中,判断评价值是否大于或等于预设的评价阈值。其中,需要对测试值的评价值与评价阈值进行对比,以判断该模型是否训练好,是否为最优模型。
[0191]
在步骤s63中,在评价值大于或等于评价阈值的情况下,判定该模型为最优模型。其中,若评价值大于或等于评价阈值,则说明该模型训练的很好,该模型为最优模型。
[0192]
在步骤s64中,在评价值小于评价阈值的情况下,增加特征数据的训练样本。其中,
若评价值小于评价阈值,则说明该模型训练不够,还需要增加训练样本,以将该模型训练成最优模型。
[0193]
在步骤s60至步骤s64中,从特征集合中获取测试数据,并将测试数据的集合输入至训练好的模型中,以获得预测结果。根据预测结果和真实值计算出该模型的评价值,并将该评价值与评价阈值进行比较。若该评价值大于或等于该评价阈值,则说明该训练好的模型为最优模型。若该评价值小于该评价阈值,则说明该训练好的模型不够好,还需要继续训练。
[0194]
另一方面,本发明还提供一种基于多传感器的无人机铁路巡检的定位系统。具体地,该定位系统可以包括无人机本体、多个传感器以及控制器。
[0195]
多个传感器设置在无人机本体上,用于监测铁路异物的多个特征值,控制器用于执行如上任一的方法。
[0196]
通过上述技术方案,本发明提供的基于多传感器的无人机铁路巡检的定位方法及定位系统通过对多个传感器监测到的特征集合进行处理,并获得正则特征数据,将该训练数据集合依次沿着门控降噪自编码器、bigru神经网络模型以及多头自注意力机制模型中进行训练,以获得预测结果,并根据预测结果不断优化模型。采用门控降噪自编码器、bigru神经网络模型和多头自注意力机制模型配合的方式,能够自适应地判别出蕴含更多重要信息的传感器,进而大幅提升预测精度,且能够在部分传感器故障时正常工作。
[0197]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0198]
以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
技术特征:
1.一种基于多传感器的无人机铁路巡检的定位方法,其特征在于,包括:获取多个传感器监测到的特征集合;根据所述特征集合获取特征数据并形成训练数据集合;构建门控降噪自编码器、bigru神经网络模型和多头自注意力机制模型;预处理所述训练数据集合中的特征数据以获得正则特征数据;将所述正则特征数据输入至所述门控降噪自编码器中,以获得可用特征;将所述可用特征输入至所述bigru神经网络模型中进行训练,以获得信息汇聚值;将所述信息汇聚值输入至所述多头自注意力机制模型中,以获得预测结果;根据所述预测结果修正所有参数。2.根据权利要求1所述的定位方法,其特征在于,预处理所述训练数据集合中的特征数据以获得正则特征数据包括:根据公式(1)获取每个所述特征数据对应的标准特征数据,其中,为第i个所述标准特征数据,i为整数编号,i∈{1,2,
…
,i},i为所述训练数据集合中特征数据的数量,x为所述训练数据集合,x={x1,x2,
…
,x
i
},x
i
为所述训练数据集合中第i个特征数据,max()为取最大值操作,max()为取最小值操作;根据公式(2)获取每个所述标准特征数据的正则特征数据,其中,为标准特征数据集合,x
l
为所述正则特征数据集合,s为所述传感器的序号,且s∈{1,2,
…
s},β
s
为第s个传感器的权重,λ为可调惩罚系数,φ
s
为第s个传感器的学习参数,φ为s个传感器的学习参数的和,即φ=φ1+φ2+
…
+φ
s
。3.根据权利要求2所述的定位方法,其特征在于,将所述正则特征数据输入至所述门控降噪自编码器中,以获得可用特征包括:获得滑动窗口的大小;根据所述滑动窗口的大小构造二维训练样本;将所述二维训练样本添加高斯噪声以形成训练样本数据;根据公式(3)计算所述训练样本数据中每个样本数据特征的隐藏特征值,其中,n为特征序号,n∈{1,2
…
,n},n为所述训练样本数据中样本数据特征的数量,σ为sigmoid激活函数,为第n个所述样本数据特征的编码误差系数,为第n个所述样本数据特征的编码偏置系数,t为时间步,t∈{1,2,
…
t},t为所述滑动窗口的最大值,为第t个时间步下第n个添加高斯噪声的样本数据特征,为第t个时间步下第n个样本数据特征的所述隐藏特征值;根据公式(4)计算每个所述样本数据特征的重构数据特征,
其中,为第t个时间步下第n个样本数据特征的所述重构数据特征,为第n个样本数据特征的解码误差系数,为样本数据特征的解码偏置系数。4.根据权利要求3所述的定位方法,其特征在于,将所述正则特征数据输入至所述门控降噪自编码器中,以获得可用特征还包括:根据公式(5)计算损失函数,其中,l
pre
为损失函数值,ω为惩罚项,为所述重构数据特征的集合,为所述重构数据特征的集合,为预测标签,y为真实标签;根据所述损失函数修正对应的所述编码误差系数、所述编码偏置系数、所述解码误差系数以及所述解码偏置系数。5.根据权利要求3所述的定位方法,其特征在于,将所述正则特征数据输入至所述门控降噪自编码器中,以获得可用特征还包括:根据公式(6)计算门控信息,其中,leakyrelu()为激活函数,g
t
为所述门控信息,w
gt
为预设门控权重,b
gt
为预设门控偏置;根据公式(7)计算待过滤信息,v
t
=tanh(w
ot
g
t
+b
ot
),
ꢀꢀꢀꢀ
(7)其中,v
t
为所述待过滤信息,w
ot
为预设过滤权重,b
ot
为预设过滤偏置,tanh为激活函数;根据公式(8)计算可用特征,其中,为所述可用特征。6.根据权利要求5所述的定位方法,其特征在于,将所述可用特征输入至所述bigru神经网络模型中进行训练,以获得信息汇聚值包括:根据公式(9)计算更新门值,其中,为所述更新门值,为所述更新门值的输入变换矩阵,为所述更新门值的隐藏变换矩阵,为所述更新门值的偏置,a为bigru的前向或后向,取值1或-1,a=1时为前向,a=-1时为后向,在a=1时为上一时刻的隐藏特征值,在a=1时为下一时刻隐藏特征值;根据公式(10)计算重置门值,
其中,为所述重置门值,为所述重置门值的输入变换矩阵,为所述重置门值的隐藏变换矩阵,为所述重置门值的偏置;根据公式(11)计算当前时刻的需过滤信息,其中,为所述需过滤信息,为所述需过滤信息的输入变换矩阵,为所述需过滤信息的隐藏变换矩阵,为所述需过滤信息的偏置;根据公式(12)计算当前时刻的隐藏状态值,其中,为所述隐藏状态值;根据公式(13)计算所有的所述传感器的信息汇聚值,其中,u为所述信息汇聚值,h
t,n(1)
为当前时刻第n个特征的前向的所述隐藏状态值,h
t,n(-1)
为当前时刻第n个特征的后向的所述隐藏状态值。7.根据权利要求6所述的定位方法,其特征在于,将所述信息汇聚值输入至所述多头自注意力机制模型中,以获得预测结果包括:根据所述信息汇聚值获取q值、k值以及v值;根据公式(14)计算注意力向量,其中,ω
h
为所述注意力向量,softmax()为softmax函数,为所述q值,为所述q值的变换矩阵,为所述k值,为所述k值的变换矩阵,d
k
为输入特征的维度,h为头的标号,h={1,2,
…
,h},h为头的数量;根据公式(15)计算待输出向量,其中,ta
h
为所述待输出向量,为所述v值,为所述v值的变换矩阵;根据公式(16)计算输出向量,o
t
=concat(ta1,ta2,
…
ta
h
),
ꢀꢀꢀꢀ
(16)其中,ot为所述输出向量,concat()为拼接操作;根据公式(17)计算预测结果,其中,为所述预测结果,fully_connection()为全连接操作。
8.根据权利要求7所述的定位方法,其特征在于,根据所述预测结果修正所有参数包括:根据公式(18)修正所有参数,其中,loss-mse()为loss函数,为真实结果,γ为惩罚项,θ为模型参数。9.根据权利要求8所述的定位方法,其特征在于,所述定位方法还包括:根据所述特征集合获取测试数据并形成测试数据集合;根据公式(19)计算评价值,其中,rmse为评价值,t
testing
为所述测试数据集合的测试值数量,j为整数编号,j∈{1,2,
…
,t
testing
},y
j
为第j个测试值的真实值,为第j个测试值的预测值;判断所述评价值是否大于或等于预设的评价阈值;在所述评价值大于或等于所述评价阈值的情况下,判定模型为最优模型;在所述评价值小于所述评价阈值的情况下,增加所述特征数据的训练样本。10.一种基于多传感器的无人机铁路巡检的定位系统,其特征在于,包括:无人机本体;多个传感器,设置在所述无人机本体上,用于监测铁路异物的多个特征值;控制器,用于执行如权利要求1至9任一所述的方法。
技术总结
本发明实施例提供一种基于多传感器的无人机铁路巡检的定位方法及定位系统,属于无人机铁路巡检技术领域。所述定位方法包括获取多个传感器监测到的特征集合;根据所述特征集合获取特征数据并形成训练数据集合;构建门控降噪自编码器、BiGRU神经网络模型和多头自注意力机制模型。本发明通过对多个传感器监测到的特征集合进行处理,并获得正则特征数据,将该训练数据集合依次沿着门控降噪自编码器、BiGRU神经网络模型以及多头自注意力机制模型中进行训练,以获得预测结果,并根据预测结果不断优化模型。本发明能够自适应地判别出蕴含更多重要信息的传感器,进而大幅提升预测精度,且能够在部分传感器故障时正常工作。且能够在部分传感器故障时正常工作。且能够在部分传感器故障时正常工作。
技术研发人员:姚啸宇 谈为智 邹姗邑 张雨佳 郭君 张任驰
受保护的技术使用者:合肥工业大学
技术研发日:2022.03.09
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/