一种基于深度学习的厨师服装穿戴检测方法与流程
未命名
10-25
阅读:125
评论:0

1.本发明涉及人工智能领域,尤其涉及一种基于深度学习的厨师服装穿戴检测方法。
背景技术:
2.在现代社会,食品安全问题一直备受重视。在众多的食品安全环节中,食堂厨师的服装穿戴情况是一个重要的影响因素,因为厨师的服装不仅影响到食品的卫生,还直接关系到食品的安全。为了解决这个问题,现有的技术主要依赖人工方式进行厨师服装的检查。然而,人工检查方式存在着诸多问题,如无法做到24小时监控、人力资源浪费大、人为疏忽可能引发安全隐患等。
3.近年来,随着计算机视觉技术的发展,一些基于视觉的自动化检测方法开始被研究和应用。其中,对象检测是计算机视觉中的重要任务,即在给定的图像或视频中找出特定的对象,并确定其位置。通过使用对象检测技术,可以自动地识别出图像中的厨师,以及他们是否按规定穿戴了厨师服装。一种常见的对象检测方法是使用深度学习的方式。深度学习是机器学习中的一个分支,它利用人工神经网络来模拟人脑进行学习和处理数据。在深度学习的众多模型中,yolo(you only look once)是一种被广泛应用于对象检测任务的模型。它能在处理速度和检测准确性之间取得很好的平衡。
4.然而,尽管yolo模型在对象检测任务中表现优秀,但在应用于实际的厨师服装检测任务时,仍存在一些挑战。例如,厨师的服装有各种各样的颜色和样式,这可能会给模型的训练和识别带来困难。此外,由于厨师的动作快速且复杂,可能会出现模型识别错误或遗漏的情况。而且,如知识蒸馏、对抗性训练、混合精度训练等技术并未被充分利用,这些技术在其他领域的深度学习模型优化中已经显示出了显著的效果,但在厨师服装检测的应用中还比较少见。现有的厨师服装检测方法并没有将这些优化方法进行有效地结合。
技术实现要素:
5.针对上述现有技术的缺点,本发明的目的是提供一种基于深度学习的厨师服装穿戴检测方法,结合了深度学习、岭回归、知识蒸馏、对抗性训练和混合精度训练等技术,提出了一种新的厨师服装穿戴检测方法,解决厨师服装穿戴实时检测中模型效率低、性能差、鲁棒性弱等问题。
6.为实现上述目的,本发明的技术方案如下:
7.本发明提供一种基于深度学习的厨师服装穿戴检测方法,包括:
8.食堂摄像头收集rgb三通道图像数据并进行预处理;
9.对收集的图像数据进行人工标注,以标明厨师服装的具体位置和类别;
10.利用标注的数据训练基于yolo模型的对象检测模型;
11.在yolo模型网络的预测部分集成岭回归结构,通过引入正则项增强模型的预测能力;
12.采用知识蒸馏技术,通过大模型指导小模型的训练,提高模型的效率和性能;
13.进行对抗性训练,引入微小的扰动,以提高模型在对抗攻击下的鲁棒性;
14.采用混合精度训练,结合使用单精度和半精度浮点数进行训练,以加快训练速度并减少内存使用;
15.对训练好的模型进行优化和验证。
16.优选地,所述数据收集与预处理,包括:通过食堂的监控摄像头收集rgb三通道的图像数据;
17.这些图像数据来源于实际的厨师工作场景,旨在反映厨师在工作过程中服装穿戴的真实情况;
18.图像数据可以直接输入到深度学习模型进行训练,这使得模型能够直接处理原始的视觉信息;
19.获取的图像数据集为i = {i1, i2, ..., in},其中n表示图像的数量,ii(其中i = 1, 2, ..., n)表示每一张图像;
20.然后进行数据预处理,包括图像的大小调整和归一化;
21.图像的大小调整是为了让所有的图像都有相同的大小,这是深度学习模型要求的输入格式;
22.将所有的图像都调整到相同的宽度w和高度h;
23.归一化是为了消除图像数据的量纲影响和减少梯度消失的风险,可以提高模型的训练效率和性能;
24.将每个像素的值都转换到0-1的范围内;
25.每个图像ii的像素值的均值为μi,标准差为σi,那么可以将ii归一化为ii',公式如下:
[0026][0027]
其中,ii'表示预处理后的图像,μi表示原始图像ii的像素值的均值,σi表示原始图像ii的像素值的标准差;
[0028]
优选地,所述数据标注,包括:需要对收集的食堂厨师图像进行标注,标注的内容主要包括厨师的位置和他们是否穿着符合规定的服装;
[0029]
采用边界框(bounding box)来标记厨师的位置,边界框是由图像中的两个点(左上角和右下角)定义的矩形,可以完整地框选出图像中的目标对象;
[0030]
对于每一张图像ii',标注结果可以表示为bi = {b1, b2, ..., bm},其中m表示图像中的厨师数量,bi(其中i = 1, 2, ..., m)表示每一个边界框;
[0031]
每一个边界框bi是一个四元组(x, y, w, h),其中(x, y)表示边界框左上角的坐标,w和h表示边界框的宽度和高度;
[0032]
还需要标注每个厨师是否穿着符合规定的服装;
[0033]
通过一个二元标签li = {l1, l2, ..., lm}来表示,其中li表示第i个厨师是否穿着符合规定的服装,li=1表示符合规定,li=0表示不符合规定;
[0034]
对于每一张图像,标注结果可以表示为(ii', bi, li);
[0035]
优选地,所述模型训练,包括:主要使用标注过的数据集进行监督学习,训练yolo模型来执行厨师服装的检测任务,具体步骤如下:
[0036]
1. 初始化模型参数,使用小的随机数来初始化yolo模型的权重参数w和偏置参数b;
[0037]
2. 前向传播:在每一次训练迭代中,将一个批次的图像数据输入到模型中,模型会进行前向传播计算,得到预测的边界框和服装状态;
[0038]
模型对第i张图像的预测结果为(pi, qi),其中pi是预测的边界框,qi是预测的服装状态;
[0039]
3. 计算损失,比较预测结果(pi, qi)和标注结果(bi, li),计算损失函数的值;
[0040]
损失函数包括两部分,一部分是边界框预测的损失,一部分是服装状态预测的损失,损失函数定义如下:
[0041][0042]
其中,l_box是边界框预测的损失,计算公式为:
[0043][0044]
其中,l_clothes是服装状态预测的损失,计算公式为:
[0045][0046]
4. 反向传播和参数更新,计算损失函数关于模型参数的梯度,然后根据梯度下降法则来更新模型参数,参数更新的公式如下:
[0047][0048][0049]
其中,η是学习率,是一个超参数,控制了模型参数更新的步长,和分别表示损失函数关于权重参数和偏置参数的梯度;
[0050]
优选地,所述集成岭回归,包括:在模型训练的基础上进一步提出了集成岭回归的方法,以增强yolo模型在预测部分的性能,为了减小模型在预测服装状态时的误差;
[0051]
岭回归是一种改进的线性回归算法,通过引入正则项来抑制模型的过拟合现象,增强模型的泛化能力;
[0052]
在yolo模型的预测部分接上岭回归结构,通过训练数据来确定岭回归的参数;
[0053]
岭回归的损失函数定义如下:
[0054][0055]
其中,li是标注的服装状态,pi是yolo模型预测的边界框,wi和bi是岭回归的权重参数和偏置参数,λ是正则化参数,用于控制模型的复杂度;
[0056]
通过梯度下降算法来最小化上述损失函数,从而确定wi和bi的值;
[0057]
损失函数关于wi和bi的梯度计算公式如下:
[0058][0059][0060]
将损失函数的梯度反向传播到yolo模型中,更新模型的参数;
[0061]
优选地,所述知识蒸馏,包括:它是一种模型压缩技术,目的是将一个大型的模型(通常被称为教师模型)的知识迁移到一个小型的模型(通常被称为学生模型)中;
[0062]
采用知识蒸馏技术提高yolo模型的效率和性能,知识蒸馏的步骤如下:
[0063]
1. 使用食堂的图像数据训练一个大型的yolo模型,该模型有大量的参数和复杂的结构,能够在训练数据上达到很高的精度;
[0064]
将这个模型称为教师模型;
[0065]
2. 构建一个小型的yolo模型,该模型有较少的参数和简单的结构,为了达到快速和高效的目标,希望通过训练这个模型来达到与教师模型相近的精度;
[0066]
将这个模型称为学生模型;
[0067]
3. 通过知识蒸馏来训练学生模型;
[0068]
不仅要让学生模型在标注数据上的预测结果接近标注的结果,而且还要让学生模型在未标注数据上的预测结果接近教师模型的预测结果;
[0069]
知识蒸馏的损失函数定义如下:
[0070][0071]
其中,l_ce是交叉熵损失,表示学生模型在标注数据上的预测结果与标注的结果之间的差异,l_kd是知识蒸馏损失,表示学生模型在未标注数据上的预测结果与教师模型的预测结果之间的差异,α是一个介于0和1之间的超参数,用于控制l_ce和l_kd之间的权重,t是一个大于1的超参数,用于平滑教师模型的预测结果;
[0072]
优选地,所述对抗性训练,包括:它是一种增强模型鲁棒性的方法,通过引入微小的、特别设计的扰动来使模型的预测结果改变,然后使模型在被扰动的数据上也能做出准确的预测;
[0073]
在训练yolo模型时采用对抗性训练;
[0074]
对于每一个训练样本,首先计算模型在该样本上的损失,然后计算损失关于输入数据的梯度,最后根据这个梯度生成一个扰动,将扰动添加到原始样本上,得到一个对抗样本;
[0075]
对抗样本的生成公式如下:
[0076][0077]
其中,x_adv是对抗样本,x是原始样本,ε是扰动的大小,sign()是符号函数,是损失关于输入数据的梯度;
[0078]
在生成对抗样本后,将原始样本和对抗样本一起输入到模型中,计算模型在这两个样本上的损失,然后通过反向传播更新模型的参数;
[0079]
优选地,所述混合精度训练,包括:它是一种在训练神经网络时使用的策略,结合了单精度(32位浮点)和半精度(16位浮点)的计算,以加速训练并减少内存使用,同时仍保持与全精度训练相似的模型质量;
[0080]
在yolo模型训练过程中,使用了混合精度训练,具体步骤如下:
[0081]
1. 前向传播: 在模型的前向传播阶段,使用半精度浮点进行计算,因为半精度浮点数的计算速度比单精度浮点数快,同时占用的内存也少;
[0082]
2. 反向传播和权重更新: 在反向传播阶段,仍然使用半精度浮点进行计算;
[0083]
在计算梯度时,会把半精度浮点的梯度转换为单精度浮点,然后进行梯度累积和权重更新;
[0084]
因为在单精度下进行权重更新可以防止在权重更新时由于精度不足而导致的数
值不稳定问题;
[0085]
混合精度训练的公式描述如下:
[0086]
在前向传播阶段,模型输出公式为:
[0087][0088]
其中 f_half 是模型,x 是输入数据,w_half 是半精度浮点的模型参数;
[0089]
目标是最小化损失函数,其中 l_half 是损失函数,y 是目标输出;
[0090]
在反向传播阶段,首先计算损失函数关于模型输出的梯度,公式为:
[0091][0092]
然后计算模型输出关于模型参数的梯度,公式为:
[0093][0094]
最后计算损失函数关于模型参数的梯度,公式为:
[0095][0096]
在这个过程中,将所有的梯度都转换为单精度浮点;
[0097]
在权重更新阶段,使用单精度浮点的梯度来更新模型参数,公式为:
[0098][0099]
其中 η 是学习率;
[0100]
优选地,所述模型优化和验证,包括:在所有的训练步骤完成后,需要对训练得到的模型进行优化和验证;
[0101]
模型优化的过程涉及到使用不同的技术来提高模型的性能;
[0102]
主要依赖于岭回归的λ(lambda)参数的调整;
[0103]
岭回归是一个带有正则项的线性回归模型,其损失函数为:
[0104][0105]
其中,y_i表示真实的标签值,x_ij表示预测的输出值,a_j表示各特征的系数,λ是要调整的参数,用于控制模型复杂度和过拟合;
[0106]
通过多次试验和验证来找到最佳的λ值。
[0107]
与现有技术相比,本发明的有益技术效果如下:
[0108]
本发明相比现有技术具有以下显著的优点:
[0109]
使用优化技术提升模型性能:相较于仅使用传统的深度学习模型进行对象检测,本发明在模型训练过程中,结合了知识蒸馏、对抗性训练和混合精度训练三种优化技术。知识蒸馏技术能有效地减小模型规模,并在减小模型复杂性的同时保持甚至提升模型性能;对抗性训练技术通过在训练数据中加入微小扰动,增强模型的鲁棒性,使其对于各种环境下的厨师服装检测都有较高的准确度;混合精度训练技术则降低了训练过程中的内存消耗,并加快了模型的训练速度。这三种优化技术的结合,使得本发明在性能上优于现有的技术。
[0110]
结合岭回归进行精确预测:本发明在模型的预测阶段加入了岭回归结构,引入正则项,这不仅能够防止模型过拟合,提高模型的泛化能力,而且在模型预测时能够达到更高
的精度。
[0111]
适应多样化的厨师服装样式和动态环境:由于厨师服装样式多样,厨师动作频繁,现有的技术在面对这些复杂情况时,可能会出现检测不准确的情况。然而,本发明在模型训练阶段,通过大量多样化的数据训练,使模型能够适应各种样式的厨师服装和动态的厨师行为,从而在实际应用中能够达到更高的检测准确率。
附图说明
[0112]
图1示出了一种基于深度学习的厨师服装穿戴检测方法流程图。
具体实施方式
[0113]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和具体实施方式对本发明提出的方法作进一步详细说明。根据下面说明,本发明的优点和特征将更清楚。需要说明的是,附图采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施方式的目的。为了使本发明的目的、特征和优点能够更加明显易懂,请参阅附图。须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。
[0114]
本发明主要基于深度学习进行厨师服装穿戴的检测方法。
[0115]
如图1,本发明提供一种基于深度学习的厨师服装穿戴检测方法,包括:
[0116]
s1数据收集与预处理,首先从食堂摄像头收集rgb三通道的图像数据,并进行预处理;
[0117]
s2数据标注,对收集到的图像进行人工标注,确定厨师服装在图像中的位置和类别;
[0118]
s3模型训练,使用标注的数据训练yolo模型,训练过程中采用交叉熵损失函数,并采用随机梯度下降法进行优化;
[0119]
s4集成岭回归,在yolo模型网络的预测部分接岭回归结构,增强预测效果;
[0120]
s5采用知识蒸馏,使用训练好的大模型来指导小模型的训练,以提高模型的效率和性能;
[0121]
s6对抗性训练,通过引入微小的扰动来训练模型,以提高模型的鲁棒性;
[0122]
s7混合精度训练,结合使用单精度和半精度浮点数进行训练,以加快训练速度并减少内存使用;
[0123]
s8模型优化和验证,采用对比同期模型识别输出结果和食堂现场实际情况做对比,实时修正模型参数,最终得到模型的最优参数。
[0124]
本发明实施例提出了一种基于深度学习的厨师服装穿戴检测方法,该方法有效整合了深度学习、岭回归、知识蒸馏、对抗性训练和混合精度训练等技术,实现了厨师服装穿戴的实时检测,提高了检测的效率和准确性,并通过实时修正模型参数,使模型能够更好地适应实际环境,提高食堂的管理效率和食品安全。
[0125]
优选地,所述数据收集与预处理,包括:通过食堂的监控摄像头收集rgb三通道的图像数据;
[0126]
这些图像数据来源于实际的厨师工作场景,旨在反映厨师在工作过程中服装穿戴的真实情况;
[0127]
图像数据可以直接输入到深度学习模型进行训练,这使得模型能够直接处理原始的视觉信息;
[0128]
获取的图像数据集为i = {i1, i2, ..., in},其中n表示图像的数量,ii(其中i = 1, 2, ..., n)表示每一张图像;
[0129]
然后进行数据预处理,包括图像的大小调整和归一化;
[0130]
图像的大小调整是为了让所有的图像都有相同的大小,这是深度学习模型要求的输入格式;
[0131]
将所有的图像都调整到相同的宽度w和高度h;
[0132]
归一化是为了消除图像数据的量纲影响和减少梯度消失的风险,可以提高模型的训练效率和性能;
[0133]
将每个像素的值都转换到0-1的范围内;
[0134]
每个图像ii的像素值的均值为μi,标准差为σi,那么可以将ii归一化为ii',公式如下:
[0135][0136]
其中,ii'表示预处理后的图像,μi表示原始图像ii的像素值的均值,σi表示原始图像ii的像素值的标准差;
[0137]
优选地,所述数据标注,包括:需要对收集的食堂厨师图像进行标注,标注的内容主要包括厨师的位置和他们是否穿着符合规定的服装;
[0138]
采用边界框(bounding box)来标记厨师的位置,边界框是由图像中的两个点(左上角和右下角)定义的矩形,可以完整地框选出图像中的目标对象;
[0139]
对于每一张图像ii',标注结果可以表示为bi = {b1, b2, ..., bm},其中m表示图像中的厨师数量,bi(其中i = 1, 2, ..., m)表示每一个边界框;
[0140]
每一个边界框bi是一个四元组(x, y, w, h),其中(x, y)表示边界框左上角的坐标,w和h表示边界框的宽度和高度;
[0141]
还需要标注每个厨师是否穿着符合规定的服装;
[0142]
通过一个二元标签li = {l1, l2, ..., lm}来表示,其中li表示第i个厨师是否穿着符合规定的服装,li=1表示符合规定,li=0表示不符合规定;
[0143]
对于每一张图像,标注结果可以表示为(ii', bi, li);
[0144]
优选地,所述模型训练,包括:主要使用标注过的数据集进行监督学习,训练yolo模型来执行厨师服装的检测任务,具体步骤如下:
[0145]
5. 初始化模型参数,使用小的随机数来初始化yolo模型的权重参数w和偏置参数b;
[0146]
6. 前向传播:在每一次训练迭代中,将一个批次的图像数据输入到模型中,模型会进行前向传播计算,得到预测的边界框和服装状态;
[0147]
模型对第i张图像的预测结果为(pi, qi),其中pi是预测的边界框,qi是预测的服
装状态;
[0148]
7. 计算损失,比较预测结果(pi, qi)和标注结果(bi, li),计算损失函数的值;
[0149]
损失函数包括两部分,一部分是边界框预测的损失,一部分是服装状态预测的损失,损失函数定义如下:
[0150]
l = l_box + l_clothes
[0151]
其中,l_box是边界框预测的损失,计算公式为:
[0152][0153]
其中,l_clothes是服装状态预测的损失,计算公式为:
[0154][0155]
8. 反向传播和参数更新,计算损失函数关于模型参数的梯度,然后根据梯度下降法则来更新模型参数,参数更新的公式如下:
[0156][0157][0158]
其中,η是学习率,是一个超参数,控制了模型参数更新的步长,和分别表示损失函数关于权重参数和偏置参数的梯度;
[0159]
优选地,所述集成岭回归,包括:在模型训练的基础上进一步提出了集成岭回归的方法,以增强yolo模型在预测部分的性能,为了减小模型在预测服装状态时的误差;
[0160]
岭回归是一种改进的线性回归算法,通过引入正则项来抑制模型的过拟合现象,增强模型的泛化能力;
[0161]
在yolo模型的预测部分接上岭回归结构,通过训练数据来确定岭回归的参数;
[0162]
岭回归的损失函数定义如下:
[0163][0164]
其中,li是标注的服装状态,pi是yolo模型预测的边界框,wi和bi是岭回归的权重参数和偏置参数,λ是正则化参数,用于控制模型的复杂度;
[0165]
通过梯度下降算法来最小化上述损失函数,从而确定wi和bi的值;
[0166]
损失函数关于wi和bi的梯度计算公式如下:
[0167][0168][0169]
将损失函数的梯度反向传播到yolo模型中,更新模型的参数;
[0170]
优选地,所述知识蒸馏,包括:它是一种模型压缩技术,目的是将一个大型的模型(通常被称为教师模型)的知识迁移到一个小型的模型(通常被称为学生模型)中;
[0171]
采用知识蒸馏技术提高yolo模型的效率和性能,知识蒸馏的步骤如下:
[0172]
4. 使用食堂的图像数据训练一个大型的yolo模型,该模型有大量的参数和复杂的结构,能够在训练数据上达到很高的精度;
[0173]
将这个模型称为教师模型;
[0174]
5. 构建一个小型的yolo模型,该模型有较少的参数和简单的结构,为了达到快速和高效的目标,希望通过训练这个模型来达到与教师模型相近的精度;
[0175]
将这个模型称为学生模型;
[0176]
6. 通过知识蒸馏来训练学生模型;
[0177]
不仅要让学生模型在标注数据上的预测结果接近标注的结果,而且还要让学生模型在未标注数据上的预测结果接近教师模型的预测结果;
[0178]
知识蒸馏的损失函数定义如下:
[0179][0180]
其中,l_ce是交叉熵损失,表示学生模型在标注数据上的预测结果与标注的结果之间的差异,l_kd是知识蒸馏损失,表示学生模型在未标注数据上的预测结果与教师模型的预测结果之间的差异,α是一个介于0和1之间的超参数,用于控制l_ce和l_kd之间的权重,t是一个大于1的超参数,用于平滑教师模型的预测结果;
[0181]
优选地,所述对抗性训练,包括:它是一种增强模型鲁棒性的方法,通过引入微小的、特别设计的扰动来使模型的预测结果改变,然后使模型在被扰动的数据上也能做出准确的预测;
[0182]
在训练yolo模型时采用对抗性训练;
[0183]
对于每一个训练样本,首先计算模型在该样本上的损失,然后计算损失关于输入数据的梯度,最后根据这个梯度生成一个扰动,将扰动添加到原始样本上,得到一个对抗样本;
[0184]
对抗样本的生成公式如下:
[0185][0186]
其中,x_adv是对抗样本,x是原始样本,ε是扰动的大小,sign()是符号函数,是损失关于输入数据的梯度;
[0187]
在生成对抗样本后,将原始样本和对抗样本一起输入到模型中,计算模型在这两个样本上的损失,然后通过反向传播更新模型的参数;
[0188]
优选地,所述混合精度训练,包括:它是一种在训练神经网络时使用的策略,结合了单精度(32位浮点)和半精度(16位浮点)的计算,以加速训练并减少内存使用,同时仍保持与全精度训练相似的模型质量;
[0189]
在yolo模型训练过程中,使用了混合精度训练,具体步骤如下:
[0190]
3. 前向传播: 在模型的前向传播阶段,使用半精度浮点进行计算,因为半精度浮点数的计算速度比单精度浮点数快,同时占用的内存也少;
[0191]
4. 反向传播和权重更新: 在反向传播阶段,仍然使用半精度浮点进行计算;
[0192]
在计算梯度时,会把半精度浮点的梯度转换为单精度浮点,然后进行梯度累积和权重更新;
[0193]
因为在单精度下进行权重更新可以防止在权重更新时由于精度不足而导致的数值不稳定问题;
[0194]
混合精度训练的公式描述如下:
[0195]
在前向传播阶段,模型输出公式为:
[0196][0197]
其中 f_half 是模型,x 是输入数据,w_half 是半精度浮点的模型参数;
[0198]
目标是最小化损失函数 l = l_half(o, y),其中 l_half 是损失函数,y 是目标输出;
[0199]
在反向传播阶段,首先计算损失函数关于模型输出的梯度,公式为:
[0200][0201]
然后计算模型输出关于模型参数的梯度,公式为:
[0202][0203]
最后计算损失函数关于模型参数的梯度,公式为:
[0204][0205]
在这个过程中,将所有的梯度都转换为单精度浮点;
[0206]
在权重更新阶段,使用单精度浮点的梯度来更新模型参数,公式为:
[0207][0208]
其中 η 是学习率;
[0209]
优选地,所述模型优化和验证,包括:在所有的训练步骤完成后,需要对训练得到的模型进行优化和验证;
[0210]
模型优化的过程涉及到使用不同的技术来提高模型的性能;
[0211]
主要依赖于岭回归的λ(lambda)参数的调整;
[0212]
岭回归是一个带有正则项的线性回归模型,其损失函数为:
[0213][0214]
其中,y_i表示真实的标签值,x_ij表示预测的输出值,a_j表示各特征的系数,λ是要调整的参数,用于控制模型复杂度和过拟合;
[0215]
通过多次试验和验证来找到最佳的λ值。
[0216]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0217]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
技术特征:
1.一种基于深度学习的厨师服装穿戴检测方法,其特征在于,包括:食堂摄像头收集rgb三通道图像数据并进行预处理;对收集的图像数据进行人工标注,以标明厨师服装的具体位置和类别;利用标注的数据训练基于yolo模型的对象检测模型;在yolo模型网络的预测部分集成岭回归结构,通过引入正则项增强模型的预测能力;采用知识蒸馏技术,通过大模型指导小模型的训练,提高模型的效率和性能;进行对抗性训练,引入微小的扰动,以提高模型在对抗攻击下的鲁棒性;采用混合精度训练,结合使用单精度和半精度浮点数进行训练,以加快训练速度并减少内存使用;对训练好的模型进行优化和验证。2.如权利要求1所述的一种基于深度学习的厨师服装穿戴检测方法,其特征在于,所述数据收集与预处理,包括:通过食堂摄像头收集rgb三通道的图像数据,获取的图像数据集为i={i1,i2,...,in},将每个图像ii(其中i=1,2,...,n)调整到适合模型的大小,并进行归一化处理,公式如下:其中,ii'是预处理后的图像,μ是图像的均值,σ是图像的标准差。3.如权利要求2所述的一种基于深度学习的厨师服装穿戴检测方法,其特征在于,所述数据标注,包括:对于收集到的图像数据,需要对图像中的目标,即厨师的服装,进行标注,每个图像中的目标位置由一个矩形框表示,矩形框的坐标为(x,y,w,h),其中(x,y)表示矩形框的中心点坐标,w和h分别表示矩形框的宽度和高度。4.如权利要求3所述的一种基于深度学习的厨师服装穿戴检测方法,其特征在于,所述模型训练,包括:选择yolo模型作为基础模型,在训练过程中,优化目标包括两部分,目标的分类和目标的定位。对于目标的分类,使用交叉熵损失函数,公式如下:其中,p_i表示真实标签,q_i表示模型的预测结果,对于目标的定位,使用均方误差损失函数,公式如下:其中,(x, y, w, h)表示真实的目标位置,(x', y', w', h')表示模型的预测结果。5.如权利要求4所述的一种基于深度学习的厨师服装穿戴检测方法,其特征在于,所述集成岭回归,包括:在yolo模型的预测部分,使用岭回归替代原始的线性回归结构,岭回归的公式如下:其中,β是回归系数,x是特征矩阵,y是目标变量,λ是岭系数,i是单位矩阵。6.如权利要求5所述的一种基于深度学习的厨师服装穿戴检测方法,其特征在于,所述知识蒸馏,包括:在训练过程中,采用知识蒸馏技术,将一个预先训练好的大模型的知识蒸馏给目标模型,目标是最小化大模型的软标签输出和小模型的软标签输出之间的交叉熵损失,公式如下:
其中,p_i是大模型的软标签输出,q_i是小模型的软标签输出。7.如权利要求6所述的一种基于深度学习的厨师服装穿戴检测方法,其特征在于,所述对抗性训练,包括:在训练过程中,生成对抗样本,并将这些样本加入到训练数据中,对抗样本是通过添加细微的扰动,使模型的预测结果出错的样本。使用fgsm(fast gradient sign method)方法生成对抗样本,公式如下:其中,x_adv是对抗样本,x是原始输入,ε是扰动的大小,sign()是符号函数,是损失函数j关于输入x的梯度。8.如权利要求7所述的一种基于深度学习的厨师服装穿戴检测方法,其特征在于,所述混合精度训练,包括:采用混合精度训练来加快模型的训练速度,将一部分的张量转换为半精度,而保留一部分关键的张量为全精度。9.如权利要求8所述的一种基于深度学习的厨师服装穿戴检测方法,其特征在于,所述模型优化和验证,包括:在所有的训练步骤完成后,需要对训练得到的模型进行优化和验证,岭回归的λ(lambda)参数的调整。岭回归是一个带有正则项的线性回归模型,其损失函数为:其中,y_i表示真实的标签值,x_ij表示预测的输出值,a_j表示各特征的系数,λ是要调整的参数。
技术总结
本发明提供一种基于深度学习的厨师服装穿戴检测方法,包括:食堂摄像头收集RGB三通道图像数据并进行预处理;对收集的图像数据进行人工标注,以标明厨师服装的具体位置和类别;利用标注的数据训练基于YOLO模型的对象检测模型;在YOLO模型网络的预测部分集成岭回归结构,通过引入正则项增强模型的预测能力;采用知识蒸馏技术,通过大模型指导小模型的训练,提高模型的效率和性能;进行对抗性训练,引入微小的扰动,以提高模型在对抗攻击下的鲁棒性;采用混合精度训练,结合使用单精度和半精度浮点数进行训练,以加快训练速度并减少内存使用;对训练好的模型进行优化和验证。对训练好的模型进行优化和验证。对训练好的模型进行优化和验证。
技术研发人员:吴梓豪
受保护的技术使用者:吴梓豪
技术研发日:2023.07.28
技术公布日:2023/10/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/