面向无人机目标识别在线学习的训练参数自适应优化方法

未命名 09-24 阅读：100 评论：0

1.本发明涉及无人机目标识别技术领域，具体涉及一种面向无人机目标识别在线学习的训练参数自适应优化方法。

背景技术：

2.无人机由于其灵活性、便携性和3d移动性等特点，在民用和军用领域均发挥着重要作用。其中，利用无人机快速移动的灵活性对目标进行跟踪识别是无人机智能化的一个重要用途，能够在抢险救灾、线路巡检等任务中起到至关重要的作用。而为了实现上述应用，使用人工智能技术尤其是深度学习技术是一种不可避免的趋势。
3.深度学习是机器学习领域中一个研究方向，其目的在于使机器能够像人一样具有分析学习能力，可以识别文字，图像和声音等数据。区别于浅层学习，深度学习的模型结构层次更多，同时加强了特征学习的能力。将深度学习使用至无人机，可以有效利用无人机的机动性和灵活性，为深度学习提供大量的学习样本。并且这些样本由于无人机的三维机动性，可以来自目标的不同高度和拍摄角度，使训练出的模型准确度和泛用性更高。
4.虽然深度学习已经证明了其实现无人机智能化的能力，但传统的深度学习模型仍有以下几点不足：
5.1.难以适应多变的环境。由于无人机实际应用的环境与训练样本的环境往往存在差异，使得无人机在离线状态下训练良好的模型，在动态的环境中检测效果并不理想。
6.2.训练过程时间成本较大。在线学习能够有效提高模型的准确率，但这需要占用大量的时间进行计算。并且随着样本的增加，单次迭代的训练时间也会相应增加。这对于追求时效性的无人机来说是一致命缺陷，小型无人机的续航也难以支撑训练要求。
7.综上所述，两大问题的根本原因在于无人机在目标检测识别的过程中无法实时获得高质量样本并根据自身情况在线调整样本数量和目标检测模型。因此需要面向无人机目标识别在线学习的训练参数自适应优化方法来支持模型的实时优化。
8.专利号为cn112732960b的发明中公开了一种基于在线联邦学习的图像分类方法，针对机器学习进行图像分类的特性设置批尺寸的选择条件，通过自适应地、逐个地调整每个工作节点的批尺寸大小，有效提高了训练过程中图像数据的利用率，同时有效缓解了批尺寸的波动，进一步提高了训练过程中收敛的稳定性；此外，通过引入与批尺寸成正比的学习率，缓解了批尺寸下降对训练产生的负面影响，进一步提高了训练的收敛速度。该发明只是利用本地存储数据集的历史经验来调整批大小，无法满足无人机在动态环境中进行目标检测的需求，其采用的批调整方式也不适用于动态环境下获取的在线学习样本。

技术实现要素：

9.为了解决现有技术中无人机在目标检测识别时无法兼顾准确率和时效性的技术问题，本发明提出了一种面向无人机目标识别在线学习的训练参数自适应优化方法，通过在线学习的过程中根据模型性能以及在线样本数量动态调整批大小来满足无人机在动态
环境中进行目标检测的需求，有效提高了鲁棒性和降低了训练时延；整个训练过程中都具备较高的收敛速度以及较强的鲁棒性，能够在最短的时间实现完成在线学习。另外，本发明针对过时的样本设计了识别、抛弃机制，进一步为设备减少了计算资源，使得该算法能够更好地在无人机嵌入式平台上进行部署。
10.为实现上述技术目的，本发明采取的技术方案为：
11.一种面向无人机目标识别在线学习的训练参数自适应优化方法，所述训练参数自适应优化方法包括以下步骤：
12.基于神经网络构建无人机目标识别模型，对无人机目标识别模型进行初步训练后，采用无人机实际拍摄的图像作为后续的在线学习样本，对无人机目标识别模型进行持续训练；
13.在持续训练过程中，根据设定的批数量对在线学习样本进行划分，采用划分后的批样本对无人机目标识别模型进行迭代训练；根据每次迭代后的得到的计算时间和损失值，计算得到无人机目标识别模型的收敛速度；将计算得到的当前迭代周期的收敛速度与历史最优收敛速度进行比较，根据比较结果，更新最优收敛速度或批数量；
14.其中，如果计算得到的收敛速度大于历史最优收敛速度，在下一迭代周期中维持相同的批数量，更新历史最优收敛速度为当前迭代周期的收敛速度；如果计算得到的收敛速度小于历史最优收敛速度，增大批数量以加快下一迭代周期的收敛速度或者减小批数量以减少下一迭代周期的计算时间。
15.进一步地，基于yolov5网络构建得到无人机目标识别模型。
16.进一步地，采用若干个visdrone2021数据集图像作为初始样本对无人机目标识别模型进行初步训练。
17.进一步地，根据每次迭代后的得到的计算时间和损失值，计算得到无人机目标识别模型的收敛速度的过程包括以下步骤：
18.在每轮模型迭代开始前，重新确定训练数据集d＝(x1，y1)，(x2，y2)，
…
(xn，yn)，n∈n中在线样本的数量n，其中，xn为第n个样本的特征值，yn为第n个样本的标签；根据第t次迭代的批数量s
t
将在线样本划分为批，根据训练结果计算第t次迭代的收敛速度θ
t
：
[0019][0020][0021]
其中，l
t
表示模型第t次迭代的损失值，b
t
表示第t次迭代的批次数，t
t
表示第t次迭代的计算时间，(x
i，j
，y
i，j
)代表第j批的第i个样本，w
t
(x
i，j
)是模型参数，f(y
i，j
|w
t
(x
i，j
))为其损失函数。
[0022]
进一步地，如果计算得到的收敛速度小于历史最优收敛速度，采用下述公式增大批数量以加快下一迭代周期的收敛速度或者减小批数量以减少下一迭代周期的计算时间：
[0023]st+1
＝η
t
*s
t
[0024]
[0025][0026]
其中，σ(θ
t-1
，θ
t-2
…
θ
t-u
)表示前u次迭代的θ
t
的方差，e(θ
t-1
，θ
t-2
…
θ
t-u
)表示前u次迭代的θ
t
的均值，cov表示基于训练数据集的变异系数，s
t+1
表示第t+1次迭代的批数量，s
t
表示第t次迭代的批数量。
[0027]
进一步地，所述历史最优收敛速度的计算公式为：
[0028]
θ
*
＝θ
′
*ε；
[0029]
式中，θ
′
为实际计算得到的历史迭代周期中的最小收敛速度；ε是延迟因子，用于阻止训练过程中任意一轮的收敛速度θ
t
小于θ
*
，取值范围为[0.05，1.00]。
[0030]
进一步地，所述训练参数自适应优化方法还包括以下步骤：
[0031]
采用下述公式计算得到第j批第i个在线学习样本的样本收敛速度φ
i，j
：
[0032][0033]
其中θj是第j批的收敛速度，τ
i，j
是第j批中第i个样本的训练迭代次数，i∈1，2
…st
，j∈1，2
…bt
；是迭代因子，用于代表迭代次数的增加，取值范围为[0.05，1.00]；
[0034]
从训练集中将样本收敛速度φ
i，j
小于预设样本收敛速度阈值的样本剔除。
[0035]
与现有技术相比，本发明的有益效果如下：
[0036]
第一，本发明的面向无人机目标识别在线学习的训练参数自适应优化方法，通过动态调整batch的大小，使得目标识别模型的在线学习训练具有更快的收敛速度，在不增加额外的开销的条件下，减少了总的训练时间；
[0037]
第二，本发明的面向无人机目标识别在线学习的训练参数自适应优化方法，具有较优的鲁棒性和有效性，可应用与多种场景；
[0038]
第三，本发明的面向无人机目标识别在线学习的训练参数自适应优化方法，通过丢弃陈旧样本，节省了设备计算资源，使得该算法能够更好地在无人机嵌入式平台上进行部署。
附图说明
[0039]
图1是本发明实施例的模型训练过程中不同batch大小对单次迭代时间和准确度的影响；
[0040]
图2是本发明实施例的模型训练过程中不同自适应批量大小方法的精度；
[0041]
图3是本发明实施例的模型训练过程中不同自适应批大小方法的计算时间；
[0042]
图4是本发明实施例的面向无人机目标识别在线学习的训练参数自适应优化方法流程图。
具体实施方式
[0043]
以下结合附图对本发明的实施例作进一步详细描述。
[0044]
参见图4，本实施例公开了一种面向无人机目标识别在线学习的训练参数自适应优化方法，所述训练参数自适应优化方法包括以下步骤：
[0045]
基于神经网络构建无人机目标识别模型，对无人机目标识别模型进行初步训练后，采用无人机实际拍摄的图像作为后续的在线学习样本，对无人机目标识别模型进行持
续训练；
[0046]
在持续训练过程中，根据设定的批数量对在线学习样本进行划分，采用划分后的批样本对无人机目标识别模型进行迭代训练；根据每次迭代后的得到的计算时间和损失值，计算得到无人机目标识别模型的收敛速度；将计算得到的当前迭代周期的收敛速度与历史最优收敛速度进行比较，根据比较结果，更新最优收敛速度或批数量；
[0047]
其中，如果计算得到的收敛速度大于历史最优收敛速度，在下一迭代周期中维持相同的批数量，更新历史最优收敛速度为当前迭代周期的收敛速度；如果计算得到的收敛速度小于历史最优收敛速度，增大批数量以加快下一迭代周期的收敛速度或者减小批数量以减少下一迭代周期的计算时间。
[0048]
图1是使用visdrone2021无人机数据集来测试不同batch大小下的模型性能，所选用的比较指标分别是损失值、收敛速度以及单次迭代的平均时间。选取的batch数值为2、4、8、16。观察图像不难发现，当batch减小时，损失值曲线波动范围变大，模型梯度变换更加明显，同时模型的收敛速度也更快；而当batch增大时，由于单次计算的样本量增多，完成单次迭代的时间减少，同时模型的收敛速度减缓。除此之外，鉴于无人机嵌入式设备的计算资源受限，过大的batch反而会增加单次迭代的训练时间。以图中数据为例，当batch大小由2增至16时，整体的训练时间也随之增加，这是因为在线样本的加载和预处理需要cpu，而损失值和梯度下降的计算需要gpu。当batch过大时，cpu和gpu难以提供充足的计算资源，从而增加了排队等待的时间，反而会导致性能的下降。由于batch的大小和训练模型的收敛速度紧密相关，选取合适的batch数值是提高模型效率的直接手段。
[0049]
本发明所提出的基于在线学习的batch自适应优化算法的核心思想是计算收敛速度θ，并使其维持在期望值之上。在每轮迭代过程开始前，机器学习系统会重新确认训练数据集中的在线样本数量n，并依据当前batch的大小s
t
对样本划分批次，每轮迭代后再依据训练结果计算收敛速度θ
t
。
[0050][0051][0052]
其中l
t
表示模型第t轮迭代过程的损失值，b
t
表示batch的数值，t
t
表示第t轮迭代过程的计算时间，(x
i，j
，y
i，j
)代表第j批的第i个样本，w
t
(x
i，j
)是模型参数，f(y
i，j
|w
t
(x
i，j
))为其损失函数。本发明中，令l
t
和t
t
的比值表示收敛速度θ
t
。通过比较当前的收敛速度θ
t
和历史最优收敛速度θ
*
，本发明能够判断当前s
t
的性能是否合适，并作出优化调整。此外，随着模型训练次数增加，模型的性能也在不断得到优化。与训练前期的损失值l相比，l
t
逐渐变小，相应地θ
t
也逐渐变小。因此本发明设置了一个延迟因子ε来阻止训练过程中任意一轮的收敛速度θ
t
小于θ
*
，ε也是batch大小自适应调节的判断标准。具体判断过程如下：
[0053]
1)当θ
t
＞θ
*
时，表明当前的s
t
下的模型训练效果较好，无需调整batch大小，并在下一轮迭代中维持相同的batch，即s
t+1
＝s
t
；
[0054]
2)当θ
t
＜θ
*
时，表明当前的s
t
无法充分利用计算资源，需要在下一轮迭代前调整batch大小使模型性能提升。
[0055]
一般而言，为了适应无人机嵌入式设备中的并行加速器，batch的大小通常被设置为2m，m∈m，因此下一轮迭代的batch被调整为s
t
的两倍或减半，即：
[0056]st+1
＝η
t
*s
t
[0057][0058][0059]
其中σ(θ
t-1
，θ
t-2
…
θ
t-u
)表示前u次迭代的θ
t
的方差，e(θ
t-1
，θ
t-2
…
θ
t-u
)表示其均值，二者的比值表示变异系数，记为cov。变异系数适用于比较量纲不同或是量纲相同但集中量数相差较大的数据间的离散程度大小，具体比较结果如下：
[0060]
当cov相对较小时，表示此时数据分布集中，模型仍处于早期训练阶段，此时需考虑减小s
t
来提高收敛速度；当cov相对较大时，表示数据趋于分散，模型趋于收敛。此时模型已有较高的准确率，在局部最优解附近波动，可见此时模型的提升空间较小，减小s
t
并不能提升收敛速度，相反会使模型远离局部最优解。因此本发明会自适应得增大s
t
，减少每轮迭代的计算时间。此外，考虑到无人机嵌入式设备的计算自由受限，本发明亦设置了batch的最大值s
max
，预防资源不足拖慢训练过程。
[0061]
由于在线学习过程的实时更新性，在线样本加入存在时间差。当新的样本加入时，部分陈旧样本已经经历了多轮迭代，对于模型性能的贡献几乎趋近于0。本发明通过实验验证在训练集中筛选并淘汰陈旧样本对于提升模型性能的重要意义。测试了在不调整batch大小的前提下，不同batch值时的损失值，试验结果表明最早加入数据集的样本在15轮迭代后基本收敛，后续的迭代并没有促进模型的提升。
[0062]
依据上述实验结果，为了节省大量的计算资源和单论迭代的训练时间，本发明设计了一个样本收敛速度φ来筛选并淘汰陈旧样本。同时，陈旧样本淘汰会影响训练的收敛速度θ。对于批次j(j∈1，2
…bt
)，本发明定义的在线样本i(i∈1，2
…st
)在当前迭代中的样本收敛速度φ如下：
[0063][0064]
其中θj是第j批的收敛速度，τ
i，j
是第j批中第i个样本的训练迭代次数。与前面一小节所提的延迟因子ε类似，本发明定义来代表迭代次数的增加，取值范围在[0.05，1.00]。随着模型的不断训练，在线样本的样本收敛速度φ会相应地减少。在训练过程中，当模型的准确率达到期望值时，本发明会自动识别并淘汰部分样本收敛速度φ最低的样本。
[0065]
下面介绍实施例的实际实验操作过程。
[0066]
本实施例使用英伟达开发的jetson agx(32g gpu)作为侦查无人机上的嵌入式设备。选用基于pytorch框架的yolov5作为训练模型，其单步检测的算法构建能够在快速识别目标的同时保证较高的准确率。选用少量visdrone2021无人机数据集图像作为初始样本对模型进行初步训练，使用通过无人机实际拍摄的图像作为后续的在线学习样本。同时设置最大批大小为s
max
＝16，初始批大小为s0＝2，第一延迟因子ε＝0.95，cov的决策因子ψ＝0.15。
[0067]
为模拟无人机不断添加在线样本进行模型训练的场景，实验设置在固定迭代轮次
添加新的在线样本，并在每轮迭代后记录模型的平均精确率的平均(map)和计算时间。
[0068]
a)不同自适应批量大小方法的性能
[0069]
这部分实验中，本实施例采用不同的自适应批量大小的方法来评估模型性能，具体设置如下：
[0070]
olbf(online learning based adaptive batch size fitting，基于自适应批大小拟合的在线学习)：本实施例所提出的面向无人机目标识别在线学习的训练参数自适应优化方法；
[0071]
dbf(dynamic batch size fitting动态批大小调整)：每经过n轮迭代(设置n＝5)，利用损失值调整batch大小；
[0072]
fixup(designated batch size on empirical rules，经验规则上的指定批量大小)：根据经验在固定轮次调整batch大小；
[0073]
fixed：使用固定的批大小。
[0074]
图2所示即为上述四种不同batch自适应方法下的map随计算时间变化的曲线，并在map大于0.99时停止训练。明显来看，dbf方法在训练前期具备较高的收敛速度，但随着在线样本的加入，很难维持高性能。这是因为dbf没有考虑在线样本的影响，经过多轮历史损失值的综合评价产生了较大的时间差。且dbf方法并未考虑到随着模型不断训练，收敛速度会下降的现象，而本发明考虑了这一点。fixup根据历史经验调整batch大小，性能与dbf相近，甚至训练后期优于dbf。但是fixup需要大量的前期实验，并且只能做一个粗略的调整，这对于实际场景来说很难实现。但本实施例所提供的olbf方法在整个训练过程中保持较高的性能和鲁棒性，并能在最短的时间内完成在线学习任务。
[0075]
图3所记录的是不同自适应batch调节方法的总训练时间。直观来看，本实施例大大缩短了训练时间，与其他三种方法相比分别缩短了31.6％，34.4％，38.8％。本实施例通过提高收敛速度来减少迭代次数，进而缩短总训练时间。此外，嵌入式设备需要按照固定的批次大小输入样本，担当训练数据集的数量不是2.m，m∈m，就会造成计算冗余，降低模型性能。本实施例所设计的batch大小实时自适应可以很好的避免这种计算冗余，保持并提高效率。
[0076]
b)陈旧样本淘汰机制的性能
[0077]
本实施例分别记录了包含淘汰机制与不包含淘汰机制的自适应批次调节方法在100轮迭代中每轮迭代所需的训练时间。olbf在t-40，60，80时识别并淘汰样本。可以清晰地看出，在同一轮迭代中，相比不包含淘汰机制的方法，olbf的训练时间分别减少9％，12％，18％。随着模型训练过程的不断进行，两种方法间的时间差不断增大。
[0078]
此外，为了进一步验证本发明的精度，本实施例在不同iou阈值下测试了两个实验组的map。可以得出，本实施例所包含的淘汰机制经过100轮迭代所需的总训练时间减少了10％，map减少了约0.1％，可以忽略不计。由此得出，陈旧样本的淘汰不会影响模型的精度，但却大幅度地减少了训练时间，提升训练效率。
[0079]
c)淘汰样本机制过时
[0080]
为了测试了自适应批次大小调节方法在不同场景中的强鲁棒性，选取在非在线学习场景下使用本发明。由曲线变化情况可以直观得出，及时没有在线样本加入训练数据集，本实施例仍能提高模型的map和收敛速度。这是因为固定的批处理大小可能会限制策略空
间的探索，而自适应批处理调节有助于探索各种可能的解决方案。
[0081]
此外，实际操作中亦使用不同的yolov5模型来测试本发明的强鲁棒性。由于不同yolov5模型的神经网络结构间的差异适用于不同的场景，对输入图像大小的要求不同且导致训练速度存在差异。如表中数据所示，本实施例在yolov5n，yolov5s和yolov5m模型上显示出较优的性能，而在yolov51上性能较差。这是由于嵌入式设备间的不同所引起的。有限的计算资源使得嵌入式设备很难训练像yolov51这样的大型模型。但即使计算资源受限，本实施例在模型训练上依然提高其性能表现，由此可以证实本实施例所述方法的强鲁棒性。
[0082]
综合来看，本实施例所述方法适用于动态环境下的无人机目标检测，能够依据模型当前的表现和在线样本的数量动态的调整批的大小，在主流目标检测模型yolov上收敛速度大大提高，且在不增加任何额外开销的前提下减少了总训练时间，有着较高精度和强鲁棒性，使得无人机在嵌入式平台上发挥出更优的性能。
[0083]
本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术实施例中的方案可以采用各种计算机语言实现，例如，面向对象的程序设计语言java和直译式脚本语言javascript等。
[0084]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器运行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0085]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0086]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上运行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上运行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0087]
尽管已描述了本技术的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
[0088]
显然，本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样，倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内，则本技术也意图包含这些改动和变型在内。

技术特征：
1.一种面向无人机目标识别在线学习的训练参数自适应优化方法，其特征在于，所述训练参数自适应优化方法包括以下步骤：基于神经网络构建无人机目标识别模型，对无人机目标识别模型进行初步训练后，采用无人机实际拍摄的图像作为后续的在线学习样本，对无人机目标识别模型进行持续训练；在持续训练过程中，根据设定的批数量对在线学习样本进行划分，采用划分后的批样本对无人机目标识别模型进行迭代训练；根据每次迭代后的得到的计算时间和损失值，计算得到无人机目标识别模型的收敛速度；将计算得到的当前迭代周期的收敛速度与历史最优收敛速度进行比较，根据比较结果，更新最优收敛速度或批数量；其中，如果计算得到的收敛速度大于历史最优收敛速度，在下一迭代周期中维持相同的批数量，更新历史最优收敛速度为当前迭代周期的收敛速度；如果计算得到的收敛速度小于历史最优收敛速度，增大批数量以加快下一迭代周期的收敛速度或者减小批数量以减少下一迭代周期的计算时间。2.根据权利要求1所述的面向无人机目标识别在线学习的训练参数自适应优化方法，其特征在于，基于yolov5网络构建得到无人机目标识别模型。3.根据权利要求1所述的面向无人机目标识别在线学习的训练参数自适应优化方法，其特征在于，采用若干个visdrone2021数据集图像作为初始样本对无人机目标识别模型进行初步训练。4.根据权利要求1所述的面向无人机目标识别在线学习的训练参数自适应优化方法，其特征在于，根据每次迭代后的得到的计算时间和损失值，计算得到无人机目标识别模型的收敛速度的过程包括以下步骤：在每轮模型迭代开始前，重新确定训练数据集d＝(x1，y1)，(x2，y2)，
…
(x
n
，y
n
)，n∈n中在线样本的数量n，其中，x
n
为第n个样本的特征值，y
n
为第n个样本的标签；根据第t次迭代的批数量s
t
将在线样本划分为批，根据训练结果计算第t次迭代的收敛速度θ
t
：：其中，l
t
表示模型第t次迭代的损失值，b
t
表示第t次迭代的批次数，t
t
表示第t次迭代的计算时间，(x
i，j
，y
i，j
)代表第j批的第i个样本，w
t
(x
i，j
)是模型参数，f(y
i，j
|w
t
(x
i，j
))为其损失函数。5.根据权利要求1所述的面向无人机目标识别在线学习的训练参数自适应优化方法，其特征在于，如果计算得到的收敛速度小于历史最优收敛速度，采用下述公式增大批数量以加快下一迭代周期的收敛速度或者减小批数量以减少下一迭代周期的计算时间：s
t+1
＝η
t
*s
t
其中，σ(θ
t-1
，θ
t-2
…
θ
t-u
)表示前u次迭代的θ
t
的方差，e(θ
t-1
，θ
t-2
…
θ
t-u
)表示前u次迭代的θ
t
的均值，cov表示基于训练数据集的变异系数，s
t+1
表示第t+1次迭代的批数量，s
t
表示第t次迭代的批数量。6.根据权利要求1所述的面向无人机目标识别在线学习的训练参数自适应优化方法，其特征在于，所述历史最优收敛速度的计算公式为：θ
*
＝θ
′
*ε；式中，θ
′
为实际计算得到的历史迭代周期中的最小收敛速度；ε是延迟因子，用于阻止训练过程中任意一轮的收敛速度θ
t
小于θ
*
，取值范围为[0.05，1.00]。7.根据权利要求1所述的面向无人机目标识别在线学习的训练参数自适应优化方法，其特征在于，所述训练参数自适应优化方法还包括以下步骤：采用下述公式计算得到第j批第i个在线学习样本的样本收敛速度φ
i，j
：其中θ
j
是第j批的收敛速度，τ
i，j
是第j批中第i个样本的训练迭代次数，i∈1，2
…
s
t
，j∈1，2
…
b
t
；是迭代因子，用于代表迭代次数的增加，取值范围为[0.05，1.00]；从训练集中将样本收敛速度φ
i，j
小于预设样本收敛速度阈值的样本剔除。

技术总结
本发明公开了一种面向无人机目标识别在线学习的训练参数自适应优化方法，包括：采用无人机实际拍摄的图像作为后续的在线学习样本，对无人机目标识别模型进行持续训练；在持续训练过程中，根据设定的批数量对在线学习样本进行划分，采用划分后的批样本对无人机目标识别模型进行迭代训练；根据每次迭代后的得到的计算时间和损失值，计算得到无人机目标识别模型的收敛速度；将计算得到的当前迭代周期的收敛速度与历史最优收敛速度进行比较，根据比较结果，更新最优收敛速度或批数量。本发明有效提高了鲁棒性和降低了训练时延。效提高了鲁棒性和降低了训练时延。效提高了鲁棒性和降低了训练时延。

技术研发人员：赵卓玥张卉瑾高泽凯王思逸牛文锴董超屈毓锛吴飞宇
受保护的技术使用者：南京航空航天大学
技术研发日：2023.04.26
技术公布日：2023/9/22

版权声明

本文仅代表作者观点，不代表航家之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

上一篇：基于域对抗迁移学习的新品销售预测方法和系统与流程 下一篇：一种吡唑并吡啶类化合物及其制备方法、应用

面向无人机目标识别在线学习的训练参数自适应优化方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

面向无人机目标识别在线学习的训练参数自适应优化方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表