一种深度学习算法中数据兼容的处理方法及装置与流程
未命名
10-08
阅读:78
评论:0

1.本技术涉及数据处理技术领域,尤其是涉及一种深度学习算法中数据兼容的处理方法及装置。
背景技术:
2.智驾技术通过数据采集系统为后续的算法、设计提供大量的原始数据,该系统主要包含采集车及其安装的不同传感器(相机、雷达等)。运用计算机视觉领域的先进算法能够较准确地检测到采集车附近车辆、行人、车道线、交通标识等信息。然而对于采集车采集到的数据会有大量一般的场景(比如周围无环境车或者环境车匀速形式),对于仿真系统来说这一类数据意义不大并不能有效测试自动驾驶算法的能力,因此需要利用上述的信息提取关键场景(例如切入、切出、超车、盲区遮挡、路口转弯避让等)来进行泛化仿真渲染进而测试。
3.现有技术中,所述采样的提取方法通常包括:1、基于规则,如在每一帧判断切入切出场景:通过当前帧前车所在车道和前n帧同车所在车道来判断前方车辆是否有变道行为。以此类推,通过人为设定相应标准参数对不同场景进行定义从而提取场景。2、基于机器学习/深度学习算法,根据周围障碍物、车道线等信息构建时序特征,再通过不同的算法框架以有监督/无监督的方式训练把不同场景提取分类。
4.但是,基于规则的场景提取技术,存在以下缺点:需要人为定义具体场景以及手动设定参数;参数设定泛化性不强并且难以标定,需要考虑不同情况增加不同限制条件(如上游检测算法输入出现误差需要作相应条件判断)。
5.现有基于机器学习/深度学习算法的场景提取技术,其缺点包括:一般使用固定n秒数据进行训练和测试,要求训练和测试数据维度一致(即数据的大小为(n*m)*f,其中m为数据的频率,f为特征的长度),但在实际情况中m往往不一致(由于采集硬件不同、对接不同数据源等等),影响算法精度甚至导致算法不适用。
技术实现要素:
6.有鉴于此,本技术的目的在于提供一种深度学习算法中数据兼容的处理方法及装置,可有效解决深度学习算法中数据不兼容的问题,从而提高输出结果的准确性。
7.本技术实施例提供了一种深度学习算法中数据兼容的处理方法,所述处理方法包括:
8.获取预处理后的多个待训练视频数据;所述待训练视频数据为智能驾驶领域相关数据;
9.针对每个待训练视频数据,对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据;
10.针对每个样本视频数据,对该样本视频数据进行数据增强处理,生成包括该样本视频数据的多个具有不同频率的目标样本数据;
11.使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型。
12.可选的,所述预处理包括:车道线拼接处理,主车、环境参与者、车道线、交通灯特征构建处理,重复帧删除、缺失帧线性插值补全处理,以及特征归一化处理。
13.可选的,所述对该样本视频数据进行数据增强处理,生成该样本数据的多个具有不同频率的目标样本数据,包括:
14.对该样本视频数据进行上采样处理,生成至少一个频率高于该样本视频数据的第一样本数据;
15.对该样本视频数据进行下采样处理,生成至少一个频率低于该样本视频数据的第二样本数据;
16.将所述第一样本数据、第二样本数据以及该样本视频数据确定为目标样本数据。
17.可选的,所述使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型,包括:
18.对所述多个目标样本数据中的原始数据和数据增强处理后生成的数据设置不同的权重;
19.使用设置不同的权重后的目标样本数据进行有监督模型训练或无监督模型训练,得到用于处理不同频率视频数据的目标处理模型。
20.可选的,所述对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据,包括:
21.按预设时长对该待训练视频数据进行顺序分割,获得多个具有相同时长的子视频,其中,所述多个子视频为该待训练视频数据的多个样本视频数据。
22.可选的,所述多个待训练视频数据为具有相同频率的数据。
23.本技术实施例还提供了一种深度学习算法中数据兼容的处理装置,所述处理装置包括:
24.获取模块,用于获取预处理后的多个待训练视频数据;所述待训练视频数据为智能驾驶领域相关数据;
25.样本构建模块,用于针对每个待训练视频数据,对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据;
26.数据增强模块,用于针对每个样本视频数据,对该样本视频数据进行数据增强处理,生成包括该样本视频数据的多个具有不同频率的目标样本数据;
27.训练模块,用于使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型。
28.可选的,所述处理装置还包括预处理模块,所述预处理模块用于:车道线拼接处理,主车、环境参与者、车道线、交通灯特征构建处理,重复帧删除、缺失帧线性插值补全处理,以及特征归一化处理。
29.可选的,所述数据增强模块在用于对该样本视频数据进行数据增强处理,生成该样本数据的多个具有不同频率的目标样本数据时,所述数据增强模块用于:
30.对该样本视频数据进行上采样处理,生成至少一个频率高于该样本视频数据的第一样本数据;
31.对该样本视频数据进行下采样处理,生成至少一个频率低于该样本视频数据的第二样本数据;
32.将所述第一样本数据、第二样本数据以及该样本视频数据确定为目标样本数据。
33.可选的,所述训练模块在用于使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型时,所述训练模块用于:
34.对所述多个目标样本数据中的原始数据和数据增强处理后生成的数据设置不同的权重;
35.使用设置不同的权重后的目标样本数据进行有监督模型训练或无监督模型训练,得到用于处理不同频率视频数据的目标处理模型。
36.可选的,所述样本构建模块在用于对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据时,所述样本构建模块用于:
37.按预设时长对该待训练视频数据进行顺序分割,获得多个具有相同时长的子视频,其中,所述多个子视频为该待训练视频数据的多个样本视频数据。
38.可选的,所述多个待训练视频数据为具有相同频率的数据。
39.本技术实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的处理方法的步骤。
40.本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的处理方法的步骤。
41.本技术实施例提供一种深度学习算法中数据兼容的处理方法及装置,所述处理方法包括:获取预处理后的多个待训练视频数据;所述待训练视频数据为智能驾驶领域相关数据;针对每个待训练视频数据,对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据;针对每个样本视频数据,对该样本视频数据进行数据增强处理,生成包括该样本视频数据的多个具有不同频率的目标样本数据;使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型。
42.这样,通过本技术提供的技术方案,在训练阶段和测试阶段适配不同频率的数据源,增强了训练所得到的目标处理模型的泛化性;通过数据增强进行上采样和下采样处理,灵活模拟不同频率的数据输入,能够增强后续算法的精确度。
43.为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
44.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
45.图1为本技术实施例所提供的一种深度学习算法中数据兼容的处理方法的流程图;
46.图2为本技术提供的一种处理模型的训练过程和测试过程的流程示意图;
47.图3为本技术实施例所提供的一种深度学习算法中数据兼容的处理装置的结构示意图之一;
48.图4为本技术实施例所提供的一种深度学习算法中数据兼容的处理装置的结构示意图之二;
49.图5为本技术实施例所提供的一种电子设备的结构示意图。
具体实施方式
50.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本技术保护的范围。
51.智驾技术通过数据采集系统为后续的算法、设计提供大量的原始数据,该系统主要包含采集车及其安装的不同传感器(相机、雷达等)。运用计算机视觉领域的先进算法能够较准确地检测到采集车附近车辆、行人、车道线、交通标识等信息。然而对于采集车采集到的数据会有大量一般的场景(比如周围无环境车或者环境车匀速形式),对于仿真系统来说这一类数据意义不大并不能有效测试自动驾驶算法的能力,因此需要利用上述的信息提取关键场景(例如切入、切出、超车、盲区遮挡、路口转弯避让等)来进行泛化仿真渲染进而测试。
52.现有技术中,所述采样的提取方法通常包括:1、基于规则,如在每一帧判断切入切出场景:通过当前帧前车所在车道和前n帧同车所在车道来判断前方车辆是否有变道行为。以此类推,通过人为设定相应标准参数对不同场景进行定义从而提取场景。2、基于机器学习/深度学习算法,根据周围障碍物、车道线等信息构建时序特征,再通过不同的算法框架以有监督/无监督的方式训练把不同场景提取分类。
53.但是,基于规则的场景提取技术,存在以下缺点:需要人为定义具体场景以及手动设定参数;参数设定泛化性不强并且难以标定,需要考虑不同情况增加不同限制条件(如上游检测算法输入出现误差需要作相应条件判断)。
54.现有基于机器学习/深度学习算法的场景提取技术,其缺点包括:一般使用固定n秒数据进行训练和测试,要求训练和测试数据维度一致(即数据的大小为(n*m)*f,其中m为数据的频率,f为特征的长度),但在实际情况中m往往不一致(由于采集硬件不同、对接不同数据源等等),影响算法精度甚至导致算法不适用。
55.基于此,本技术实施例提供了提供一种深度学习算法中数据兼容的处理方法及装置,可有效解决深度学习算法中数据不兼容的问题,从而提高输出结果的准确性。
56.请参阅图1,图1为本技术实施例所提供的一种深度学习算法中数据兼容的处理方法的流程图。如图1中所示,本技术实施例提供的处理方法,包括:
57.s101、获取预处理后的多个待训练视频数据。
58.这里,所述待训练视频数据为智能驾驶领域相关数据,所述多个待训练视频数据为具有相同频率的数据。
59.示例的,所述待训练视频数据可为用于进行场景识别的相关数据。其中,所述待训练视频数据的频率相同。所述待训练视频数据为(n*m)*f长度的数据,n为秒数,m为数据的频率,f为特征的长度。不同待训练视频数据的n的取值可以不同也可以相同,m和f的取值一般均相同。
60.所述待训练视频数据中至少包括以下信息:主车信息(位置、速度、航向角等)、环境车信息(位置、速度等)、车道线信息(位置或拟合的曲线)、交通表示信息(类别、位置等)。
61.所述待训练视频数据可为带标签数据,该种数据用于有监督训练;所述待训练视频数据也可为无标签数据,该种数据用于无监督训练。
62.示例的,当所述待训练视频数据为用于进行场景识别的相关数据,且该待训练视频数据为带标签数据时,该待训练视频数据所带标签可为多标签,所带的多标签包括:场景序号(eventid)、开始帧数(startframe)、结束帧数(endframe)、开始时间(starttime)、结束时间(endtime)、场景描述(description)等。
63.在一种实施方式中,对所述待训练视频数据进行预处理是对该待训练视频数据进行清洗、整合的过程,具体预处理内容至少包括以下内容:车道线拼接处理;主车、环境参与者、车道线、交通灯特征构建处理;重复帧删除、缺失帧线性插值补全处理;以及特征归一化处理。
64.s102、针对每个待训练视频数据,对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据。
65.这里,所述样本视频数据为时间相同、频率相同、特征长度相同的数据。
66.所述对待训练视频数据进行样本构建处理,是将该待训练视频数据转化为时间序列。
67.在一种实施方式中,所述对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据,包括:按预设时长对该待训练视频数据进行顺序分割,获得多个具有相同时长的子视频,其中,所述多个子视频为该待训练视频数据的多个样本视频数据。
68.示例的,通过以下内容对样本构建过程进行说明,假设待训练视频数据为10s长的视频数据,预设时长为2s,则对该待训练视频数据进行样本构建处理后,将该待训练视频数据转化为时间序列{x_1,x_2,x_3,x_4,x_5},即得到5个子视频,其中,x_i的维度大小为(a*m)*f,其中a为2秒数,m为数据的频率,f为特征的长度,x_i[u,v]表示第u帧第v个特征的数值。
[0069]
s103、针对每个样本视频数据,对该样本视频数据进行数据增强处理,生成包括该样本视频数据的多个具有不同频率的目标样本数据。
[0070]
在本技术提供的一种实施方式中,所述对该样本视频数据进行数据增强处理,生成该样本数据的多个具有不同频率的目标样本数据,包括:对该样本视频数据进行上采样处理,生成至少一个频率高于该样本视频数据的第一样本数据;对该样本视频数据进行下采样处理,生成至少一个频率低于该样本视频数据的第二样本数据;将所述第一样本数据、第二样本数据以及该样本视频数据确定为目标样本数据。
[0071]
这里,所述对样本视频数据进行数据增强处理,实际上是对样本视频数据进行上采样处理和下采样处理,所采取的方法包括线性插值以及多项式插值等,这样,通过上下采样处理模拟不同频率的数据输入至模型训练模块提高模型的泛化性。
[0072]
示例的,假设样本视频数据为2秒每秒60帧的数据,进行数据增强处理后,可得到2秒每秒10帧、20帧...100帧的多个数据,即得到多个具有不同频率的目标样本数据。
[0073]
示例的,这里给出了一种计算增强后样本数据的方式。假设,有第m*a帧(a秒)的样本视频数据x_i,将其增强为p*a帧(a秒)的数据y_i,则增强后第q帧的数据通过如下方式计算:
[0074]
对于特征v,令t1=[q*m/p],t2=q*m/p-t1,其中[.]表示取整。
[0075]
若t1=0,y_i[q,v]=x_i[1,v];
[0076]
若t2=0,y_i[q,v]=x_i[t1,v];
[0077]
其余,
[0078]
对于线性变换:y_i[q,v]=(1-t2)x_i[t1,v]+t2x_i[t1+1,v];
[0079]
对于二次变换:y_i[q,v]=x_i[t1,v]+t2*(x_i[t1,vv]/m)+t2*t2*(x_i[t1+1,v]-x_i[t1,v]-x_i[t1,vv]/m);
[0080]
其中特征vv为特征v对时间的导数,例如距离对时间的导数为速度。
[0081]
例如60*2帧(2秒)数据x_i,将其增强为100*2(帧)的数据y_i,则增强后第152帧的数据计算过程如下:
[0082]
有t1=[152*60/100]=91,t2=152*60/100-t1=0.2。
[0083]
对于特征速度我们用线性变换:y_i[152,速度]=0.8*x_i[91,速度]+0.2*x_i[92,速度]。
[0084]
对于距离特征我们用二次变换:y_i[152,距离]=x_i[91,距离]+0.2*(x_i[91,速度]/60)+0.2*0.2*(x_i[92,距离]-x_i[91,距离]-x_i[91,速度]/60)。
[0085]
其余类似,在这里我们假设2帧之间极短时间内物体作匀变速直线运动。这样,即可完成数据增强处理。
[0086]
s104、使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型。
[0087]
这里,所述目标处理模型可以为场景提取模型、场景识别模型、行车安全识别模型等可用于对视频数据进行处理的模型。
[0088]
在本技术提供的一种实施方式中,所述使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型,包括:对所述多个目标样本数据中的原始数据和数据增强处理后生成的数据设置不同的权重;使用设置不同的权重后的目标样本数据进行有监督模型训练或无监督模型训练,得到用于处理不同频率视频数据的目标处理模型。
[0089]
这里,所述原始数据为未进行数据增强处理的样本视频数据。其中,对所述多个目标样本数据中的原始数据和数据增强处理后生成的数据设置不同的权重,是为了避免对原始数据的欠拟合。
[0090]
其中,对于有监督学习,即样本已知标签,可通过lstm(长短时间记忆)框架进行训练;对于无监督学习,即样本无标签,可通过lstm-autoencoder(自编码长短时间记忆)框
架。在训练时,将相同帧率的数据并入同一批次进行训练,不同批次的数据帧率可能不同,根据编码-解码结构优化损失函数,从而得到目标处理模型。
[0091]
此外,对于无监督学习,需要额外通过k-means++(k-平均++)聚类模型对目标处理模型的输出样本点进行聚类,输出类别。
[0092]
示例的,请参阅图2,图2为本技术提供的一种处理模型的训练过程和测试过程的流程示意图。如图2所示,虚线为测试阶段,实线为训练阶段。
[0093]
本技术实施例提供一种深度学习算法中数据兼容的处理方法,所述处理方法包括:获取预处理后的多个待训练视频数据;所述待训练视频数据为智能驾驶领域相关数据;针对每个待训练视频数据,对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据;针对每个样本视频数据,对该样本视频数据进行数据增强处理,生成包括该样本视频数据的多个具有不同频率的目标样本数据;使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型。
[0094]
这样,通过本技术提供的技术方案,在训练阶段和测试阶段适配不同频率的数据源,增强了训练所得到的目标处理模型的泛化性;通过数据增强进行上采样和下采样处理,灵活模拟不同频率的数据输入,能够增强后续算法的精确度。
[0095]
请参阅图3、图4,图3为本技术实施例所提供的一种深度学习算法中数据兼容的处理装置的结构示意图之一,图4为本技术实施例所提供的一种深度学习算法中数据兼容的处理装置的结构示意图之二。如图3中所示,所述处理装置300包括:
[0096]
获取模块310,用于获取预处理后的多个待训练视频数据;所述待训练视频数据为智能驾驶领域相关数据;
[0097]
样本构建模块320,用于针对每个待训练视频数据,对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据;
[0098]
数据增强模块330,用于针对每个样本视频数据,对该样本视频数据进行数据增强处理,生成包括该样本视频数据的多个具有不同频率的目标样本数据;
[0099]
训练模块340,用于使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型。
[0100]
可选的,如图4所示,所述处理装置300还包括预处理模块350,所述预处理模块350用于:车道线拼接处理,主车、环境参与者、车道线、交通灯特征构建处理,重复帧删除、缺失帧线性插值补全处理,以及特征归一化处理。
[0101]
可选的,所述数据增强模块330在用于对该样本视频数据进行数据增强处理,生成该样本数据的多个具有不同频率的目标样本数据时,所述数据增强模块330用于:
[0102]
对该样本视频数据进行上采样处理,生成至少一个频率高于该样本视频数据的第一样本数据;
[0103]
对该样本视频数据进行下采样处理,生成至少一个频率低于该样本视频数据的第二样本数据;
[0104]
将所述第一样本数据、第二样本数据以及该样本视频数据确定为目标样本数据。
[0105]
可选的,所述训练模块340在用于使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型时,所述训练模块340用于:
[0106]
对所述多个目标样本数据中的原始数据和数据增强处理后生成的数据设置不同的权重;
[0107]
使用设置不同的权重后的目标样本数据进行有监督模型训练或无监督模型训练,得到用于处理不同频率视频数据的目标处理模型。
[0108]
可选的,所述样本构建模模块在用于对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据时,所述样本构建模块用于:
[0109]
按预设时长对该待训练视频数据进行顺序分割,获得多个具有相同时长的子视频,其中,所述多个子视频为该待训练视频数据的多个样本视频数据。
[0110]
可选的,所述多个待训练视频数据为具有相同频率的数据。
[0111]
请参阅图5,图5为本技术实施例所提供的一种电子设备的结构示意图。如图5中所示,所述电子设备500包括处理器510、存储器520和总线530。
[0112]
所述存储器520存储有所述处理器510可执行的机器可读指令,当电子设备500运行时,所述处理器510与所述存储器520之间通过总线530通信,所述机器可读指令被所述处理器510执行时,可以执行如上述图1以及图2所示方法实施例中方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
[0113]
本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
[0114]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0115]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0116]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0117]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0118]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存
储程序代码的介质。
[0119]
最后应说明的是:以上所述实施例,仅为本技术的具体实施方式,用以说明本技术的技术方案,而非对其限制,本技术的保护范围并不局限于此,尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本技术实施例技术方案的精神和范围,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
技术特征:
1.一种深度学习算法中数据兼容的处理方法,其特征在于,所述处理方法包括:获取预处理后的多个待训练视频数据;所述待训练视频数据为智能驾驶领域相关数据;针对每个待训练视频数据,对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据;针对每个样本视频数据,对该样本视频数据进行数据增强处理,生成包括该样本视频数据的多个具有不同频率的目标样本数据;使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型。2.根据权利要求1所述的处理方法,其特征在于,所述预处理包括:车道线拼接处理,主车、环境参与者、车道线、交通灯特征构建处理,重复帧删除、缺失帧线性插值补全处理,以及特征归一化处理。3.根据权利要求1所述的处理方法,其特征在于,所述对该样本视频数据进行数据增强处理,生成该样本数据的多个具有不同频率的目标样本数据,包括:对该样本视频数据进行上采样处理,生成至少一个频率高于该样本视频数据的第一样本数据;对该样本视频数据进行下采样处理,生成至少一个频率低于该样本视频数据的第二样本数据;将所述第一样本数据、第二样本数据以及该样本视频数据确定为目标样本数据。4.根据权利要求1所述的处理方法,其特征在于,所述使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型,包括:对所述多个目标样本数据中的原始数据和数据增强处理后生成的数据设置不同的权重;使用设置不同的权重后的目标样本数据进行有监督模型训练或无监督模型训练,得到用于处理不同频率视频数据的目标处理模型。5.根据权利要求1所述的处理方法,其特征在于,所述对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据,包括:按预设时长对该待训练视频数据进行顺序分割,获得多个具有相同时长的子视频,其中,所述多个子视频为该待训练视频数据的多个样本视频数据。6.根据权利要求1所述的处理方法,其特征在于,所述多个待训练视频数据为具有相同频率的数据。7.一种深度学习算法中数据兼容的处理装置,其特征在于,所述处理装置包括:获取模块,用于获取预处理后的多个待训练视频数据;所述待训练视频数据为智能驾驶领域相关数据;样本构建模块,用于针对每个待训练视频数据,对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据;数据增强模块,用于针对每个样本视频数据,对该样本视频数据进行数据增强处理,生成包括该样本视频数据的多个具有不同频率的目标样本数据;训练模块,用于使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用
于处理不同频率视频数据的目标处理模型。8.根据权利要求7所述的处理装置,其特征在于,所述数据增强模块在用于对该样本视频数据进行数据增强处理,生成该样本数据的多个具有不同频率的目标样本数据时,数据增强模块用于:对该样本视频数据进行上采样处理,生成至少一个频率高于该样本视频数据的第一样本数据;对该样本视频数据进行下采样处理,生成至少一个频率低于该样本视频数据的第二样本数据;将所述第一样本数据、第二样本数据以及该样本视频数据确定为目标样本数据。9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如权利要求1至6任一所述的处理方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6任一所述的处理方法的步骤。
技术总结
本申请提供了一种深度学习算法中数据兼容的处理方法及装置,所述处理方法包括:获取预处理后的多个待训练视频数据;所述待训练视频数据为智能驾驶领域相关数据;针对每个待训练视频数据,对该待训练视频数据进行样本构建处理,获取该待训练视频数据的多个样本视频数据;针对每个样本视频数据,对该样本视频数据进行数据增强处理,生成包括该样本视频数据的多个具有不同频率的目标样本数据;使用多个待训练视频数据的多个目标样本数据进行模型训练,得到用于处理不同频率视频数据的目标处理模型。这样,通过本申请的技术方案,可有效解决深度学习算法中数据不兼容的问题,从而提高输出结果的准确性。出结果的准确性。出结果的准确性。
技术研发人员:何丰 叶云飞 徐显涛 杨强
受保护的技术使用者:北京赛目科技股份有限公司
技术研发日:2023.06.30
技术公布日:2023/10/5
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/