一种语义识别模型的超参数调优方法与系统与流程
未命名
10-08
阅读:80
评论:0

1.本发明涉及超参数调优相关技术领域,尤其是涉及一种语义识别模型的超参数调优方法与系统。
背景技术:
2.近年来,自然语言处理领域的语义角色标注任务,使用最广泛的模型是基于bilstm的深度神经网络模型。相比较传统的机器学习模型,基于bilstm的深度神经网络模型可以较好地表示上下文和句法特征,能够有效地减少特征的设置。bilstm模型在处理语义角色标注问题时面临着模型超参数的选择问题。bilstm模型的构建比较复杂,一个好的模型架构需要考虑很多的设计选项,如bilstm层次数目、隐层单元个数、在模型的最顶层添加一个什么样的分类器。此外,bilstm模型可以实现端到端的学习,但通常需要在输入端添加一些简单的特征来为模型提供额外的信息,模型最终的性能也受到输入端的候选特征设置的影响。将模型的设计选项和输入端的特征看做模型具体的超参数配置,如何分析各超参数对语义角色识别任务的影响,对bilstm的模型超参数进行调优,是影响模型性能的一个关键问题。
3.目前,在自然语言研究领域,针对模型超参数的调优,许多方法都是将语料按照比例切分得到训练集、验证集和测试集,在训练集上训练模型,在验证集上选择模型超参数的具体配置,在测试集上进行测试,以相关任务的性能评价指标是否提高为优化准则。但是,这种方法存在对应训练结果对语料的切分较为敏感的文体。有可能会导致含有较多语义角色的一些句子切分到了训练集,而含有较少语义角色的一些句子切分到了测试集,这种语义角色个数分布不均匀的切分会导致语义角色识别模型的精确率时高时低,方差较大,意味着模型的预测结果并不稳定。而且当实验语料较小时,按比例切分得到的测试集会很小,测试集上的语义角色的个数偏少,也可能导致测试结果f1值的波动较大,模型的可复现性差。
技术实现要素:
4.本发明旨在至少解决现有技术中存在的技术问题。为此,本发明提出一种语义识别模型的超参数调优方法与系统,能够减少模型性能的波动,提高模型的准确性。
5.本发明的第一方面,提供了一种语义识别模型的超参数调优方法,包括如下步骤:
6.获取文本数据集;
7.根据多组预设超参数构建对应数目的语义识别模型,根据所述文本数据集通过交叉验证法对每一个所述语义识别模型进行训练,得到每一个所述语义识别模型的对应训练结果;
8.根据所述训练结果计算每一个所述语义识别模型的对应的望大特性信噪比;
9.根据每一个所述语义识别模型的对应的望大特性信噪比选取所述语义识别模型的最优预设超参数。
10.根据本发明实施例的控制方法,至少具有如下有益效果:
11.本方法通过根据多组预设超参数构建对应数目的语义识别模型,根据文本数据集通过交叉验证法对每一个语义识别模型进行训练,得到每一个语义识别模型的对应训练结果,根据训练结果计算每一个语义识别模型的对应的望大特性信噪比,根据每一个语义识别模型的对应的望大特性信噪比选取语义识别模型的最优预设超参数,通过在关注性能指标的均值改善的同时,也关注方差的变化,减少了模型性能的波动,提高了模型预测的准确性。
12.根据本发明的一些实施例,所述根据所述训练结果计算所述每一个所述语义识别模型的对应的望大特性信噪比,包括:
13.根据所述训练结果构建混淆矩阵,其中,所述混淆矩阵包括为每一组每一次交叉验证得到的模型预测正确的语义角色的个数、模型预测错误的语义角色的个数、模型没有预测出的语义角色的个数和模型没有被错误的预测为语义角色的个数;
14.计算每组所述混淆矩阵对应的精确率和召回率;
15.根据每组所述混淆矩阵对应的精确率和召回率计算每组所述混淆矩阵对应的f1值;
16.根据所有所述f1值计算所述语义识别模型的对应的望大特性信噪比。
17.根据本发明的一些实施例,所述根据每组所述混淆矩阵对应的精确率和召回率计算每组所述混淆矩阵对应的f1值,包括:
18.对每组所述混淆矩阵对应的精确率和召回率进行求和,得到对应的第三求和结果;
19.将每组所述混淆矩阵对应的精确率和召回率进行相乘,得到精确率和召回率的积;
20.将所述精确率和召回率的积乘以2,得到对应的求积结果;
21.将所述对应的求积结果除以所述对应的第三求和结果,得到每组所述混淆矩阵对应的f1值。
22.根据本发明的一些实施例,所述根据所有所述f1值计算所述语义识别模型的对应的望大特性信噪比的计算公式包括:
[0023][0024]
其中,η为语义识别模型的对应的望大特性信噪比,为通过3
×
2交叉验证法得到的第i组第k次交叉验证的f1值。
[0025]
根据本发明的一些实施例,通过如下方式计算每组所述混淆矩阵对应的精确率,包括:
[0026]
对每组所述混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数与对应的交叉验证得到的模型预测错误的语义角色的个数进行求和,得到对应的第一求和结果;
[0027]
将每组所述混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数除
以对应的第一求和结果,得到每组所述混淆矩阵对应的精确率。
[0028]
根据本发明的一些实施例,通过如下方式计算每组所述混淆矩阵对应的召回率,包括:
[0029]
对每组所述混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数与对应的交叉验证得到的模型没有预测出的语义角色的个数进行求和,得到对应的第二求和结果;
[0030]
将每组所述混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数除以对应的第二求和结果,得到每组所述混淆矩阵对应的召回率。
[0031]
根据本发明的一些实施例,所述根据所述文本数据集通过交叉验证法对每一个所述语义识别模型进行训练,得到每一个所述语义识别模型的对应训练结果,包括:
[0032]
将所述文本数据集分为若干组测试数据集和若干组训练数据集;
[0033]
根据若干组所述测试数据集和若干组所述训练数据集通过3
×
2交叉验证法对每一个所述语义识别模型进行训练,得到每一个所述语义识别模型的对应训练结果。
[0034]
本发明的第二方面,提供一种语义识别模型的超参数调优系统,所述语义识别模型的超参数调优系统包括:
[0035]
数据获取模块,用于获取文本数据集;
[0036]
模型训练模块,用于根据多组预设超参数构建对应数目的语义识别模型,根据所述文本数据集通过交叉验证法对每一个所述语义识别模型进行训练,得到每一个所述语义识别模型的对应训练结果;
[0037]
望大特性信噪比计算模块,用于根据所述训练结果计算每一个所述语义识别模型的对应的望大特性信噪比;
[0038]
最优超参数选取模块,用于根据每一个所述语义识别模型的对应的望大特性信噪比选取所述语义识别模型的最优预设超参数。
[0039]
本系统通过根据多组预设超参数构建对应数目的语义识别模型,根据文本数据集通过交叉验证法对每一个语义识别模型进行训练,得到每一个语义识别模型的对应训练结果,根据训练结果计算每一个语义识别模型的对应的望大特性信噪比,根据每一个语义识别模型的对应的望大特性信噪比选取语义识别模型的最优预设超参数,通过在关注性能指标的均值改善的同时,也关注方差的变化,减少了模型性能的波动,提高了模型预测的准确性。
[0040]
本发明的第三方面,提供了一种语义识别模型的超参数调优电子设备,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行上述的语义识别模型的超参数调优方法。
[0041]
本发明的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述的语义识别模型的超参数调优方法。
[0042]
需要注意的是,本发明的第二方面至第四方面与现有技术之间的有益效果与上述的一种语义识别模型的超参数调优系统与现有技术之间的有益效果相同,此处不再细述。
[0043]
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变
得明显,或通过本发明的实践了解到。
附图说明
[0044]
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0045]
图1是本发明一实施例的一种语义识别模型的超参数调优方法的流程图;
[0046]
图2是本发明一实施例的一种语义识别模型的超参数调优系统的结构示意图。
具体实施方式
[0047]
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0048]
在本发明的描述中,如果有描述到第一、第二等只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
[0049]
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0050]
本发明的描述中,需要说明的是,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
[0051]
目前,在自然语言研究领域,针对模型超参数的调优,许多方法都是将语料按照比例切分得到训练集、验证集和测试集,在训练集上训练模型,在验证集上选择模型超参数的具体配置,在测试集上进行测试,以相关任务的性能评价指标是否提高为优化准则。但是,这种方法存在对应训练结果对语料的切分较为敏感的文体。有可能会导致含有较多语义角色的一些句子切分到了训练集,而含有较少语义角色的一些句子切分到了测试集,这种语义角色个数分布不均匀的切分会导致语义角色识别模型的精确率时高时低,方差较大,意味着模型的预测结果并不稳定。而且当实验语料较小时,按比例切分得到的测试集会很小,测试集上的语义角色的个数偏少,也可能导致测试结果f1值的波动较大,模型的可复现性差。
[0052]
为了解决上述技术缺陷,参照图1,本发明提供了一种语义识别模型的超参数调优方法,包括:
[0053]
步骤s101、获取文本数据集;
[0054]
步骤s102、根据多组预设超参数构建对应数目的语义识别模型,根据文本数据集通过交叉验证法对每一个语义识别模型进行训练,得到每一个语义识别模型的对应训练结果;
[0055]
步骤s103、根据训练结果计算每一个语义识别模型的对应的望大特性信噪比;
[0056]
步骤s104、根据每一个语义识别模型的对应的望大特性信噪比选取语义识别模型
的最优预设超参数。
[0057]
本方法通过根据多组预设超参数构建对应数目的语义识别模型,根据文本数据集通过交叉验证法对每一个语义识别模型进行训练,得到每一个语义识别模型的对应训练结果,根据训练结果计算每一个语义识别模型的对应的望大特性信噪比,根据每一个语义识别模型的对应的望大特性信噪比选取语义识别模型的最优预设超参数,通过在关注性能指标的均值改善的同时,也关注方差的变化,减少了模型性能的波动,提高了模型预测的准确性。
[0058]
在一些实施例中,根据训练结果计算每一个语义识别模型的对应的望大特性信噪比,包括:
[0059]
根据训练结果构建混淆矩阵,其中,混淆矩阵包括为每一组每一次交叉验证得到的模型预测正确的语义角色的个数、模型预测错误的语义角色的个数、模型没有预测出的语义角色的个数和模型没有被错误的预测为语义角色的个数;
[0060]
计算每组混淆矩阵对应的精确率和召回率;
[0061]
根据每组混淆矩阵对应的精确率和召回率计算每组混淆矩阵对应的f1值;
[0062]
根据所有f1值计算语义识别模型的对应的望大特性信噪比。
[0063]
在一些实施例中,根据每组混淆矩阵对应的精确率和召回率计算每组混淆矩阵对应的f1值,包括:
[0064]
对每组混淆矩阵对应的精确率和召回率进行求和,得到对应的第三求和结果;
[0065]
将每组混淆矩阵对应的精确率和召回率进行相乘,得到精确率和召回率的积;
[0066]
将精确率和召回率的积乘以2,得到对应的求积结果;
[0067]
将对应的求积结果除以对应的第三求和结果,得到每组混淆矩阵对应的f1值。
[0068]
具体的,在一些实施例中,本方法采用了3
×
2交叉验证。3
×
2交叉验证的具体做法是将实验语料切分成大小相同的4份,任取其中的2份作为训练集,剩下2份作为测试集。在此情况下,不同的组合共有3组,共可以进行3组2折交叉验证。这样做的目的是可以给出评价指标的方差估计,从而可以从统计意义上判别不同结果间的差异是否具有显著性。
[0069]
使用3
×
2交叉验证,可以得到6个对应训练结果,根据所述6个对应训练结果构建6个混淆矩阵其中,为第i组第k次交叉验证得到的模型预测正确的语义角色的个数,为第i组第k次交叉验证得到的模型预测错误的语义角色的个数,为第i组第k次交叉验证得到的模型没有预测出的语义角色的个数,为第i组第k次交叉验证得到的模型没有被错误的预测为语义角色的个数,6组p(精确率)、r(召回率)和f1值的估计分别为:
[0070][0071]
[0072][0073]
其中,为第i组第k次交叉验证得到的精确率,为第i组第k次交叉验证得到的召回率,为第i组第k次交叉验证得到的f1值。
[0074]
在一些实施例中,根据所有f1值计算语义识别模型的对应的望大特性信噪比的计算公式包括:
[0075][0076]
其中,η为语义识别模型的对应的望大特性信噪比,为通过3
×
2交叉验证法得到的第i组第k次交叉验证的f1值。
[0077]
在一些实施例中,通过如下方式计算每组混淆矩阵对应的精确率,包括:
[0078]
对每组混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数与对应的交叉验证得到的模型预测错误的语义角色的个数进行求和,得到对应的第一求和结果;
[0079]
将每组混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数除以对应的第一求和结果,得到每组混淆矩阵对应的精确率。
[0080]
在一些实施例中,通过如下方式计算每组混淆矩阵对应的召回率,包括:
[0081]
对每组混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数与对应的交叉验证得到的模型没有预测出的语义角色的个数进行求和,得到对应的第二求和结果;
[0082]
将每组混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数除以对应的第二求和结果,得到每组混淆矩阵对应的召回率。
[0083]
在一些实施例中,根据文本数据集通过交叉验证法对每一个语义识别模型进行训练,得到每一个语义识别模型的对应训练结果,包括:
[0084]
将文本数据集分为若干组测试数据集和若干组训练数据集;
[0085]
根据若干组测试数据集和若干组训练数据集通过3
×
2交叉验证法对每一个语义识别模型进行训练,得到每一个语义识别模型的对应训练结果。
[0086]
另外,参照图2,本发明的一个实施例,提供一种语义识别模型的超参数调优系统,包括数据获取模块1100、模型训练模块1200、望大特性信噪比计算模块1300以及最优超参数选取模块1400,其中:
[0087]
数据获取模块1100用于获取文本数据集;
[0088]
模型训练模块1200用于根据多组预设超参数构建对应数目的语义识别模型,根据文本数据集通过交叉验证法对每一个语义识别模型进行训练,得到每一个语义识别模型的对应训练结果;
[0089]
望大特性信噪比计算模块1300用于根据训练结果计算每一个语义识别模型的对应的望大特性信噪比;
[0090]
最优超参数选取模块1400用于根据每一个语义识别模型的对应的望大特性信噪
比选取语义识别模型的最优预设超参数。
[0091]
本系统通过根据多组预设超参数构建对应数目的语义识别模型,根据文本数据集通过交叉验证法对每一个语义识别模型进行训练,得到每一个语义识别模型的对应训练结果,根据训练结果计算每一个语义识别模型的对应的望大特性信噪比,根据每一个语义识别模型的对应的望大特性信噪比选取语义识别模型的最优预设超参数,通过在关注性能指标的均值改善的同时,也关注方差的变化,减少了模型性能的波动,提高了模型预测的准确性。
[0092]
需要注意的是,本系统实施例与上述的系统实施例是基于相同的发明构思,因此上述方法实施例的相关内容同样适用于本系统实施例,这里不再赘述。
[0093]
本技术还提供一种语义识别模型的超参数调优电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现:如上述的语义识别模型的超参数调优方法。
[0094]
处理器和存储器可以通过总线或者其他方式连接。
[0095]
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0096]
实现上述实施例的语义识别模型的超参数调优方法所需的非暂态软件程序以及指令存储在存储器中,当被处理器执行时,执行上述实施例中的语义识别模型的超参数调优方法,例如,执行以上描述的图1中的方法步骤s101至步骤s104。
[0097]
本技术还提供一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行:如上述的语义识别模型的超参数调优方法。
[0098]
该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个处理器或控制器执行,例如,被上述电子设备实施例中的一个处理器执行,可使得上述处理器执行上述实施例中的语义识别模型的超参数调优方法,例如,执行以上描述的图1中的方法步骤s101至步骤s104。
[0099]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序单元或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序单元或者诸如载波
或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0100]
上面结合附图对本发明实施例作了详细说明,但本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
技术特征:
1.一种语义识别模型的超参数调优方法,其特征在于,所述语义识别模型的超参数调优方法包括:获取文本数据集;根据多组预设超参数构建对应数目的语义识别模型,根据所述文本数据集通过交叉验证法对每一个所述语义识别模型进行训练,得到每一个所述语义识别模型的对应训练结果;根据所述训练结果计算每一个所述语义识别模型的对应的望大特性信噪比;根据每一个所述语义识别模型的对应的望大特性信噪比选取所述语义识别模型的最优预设超参数。2.根据权利要求1所述的一种语义识别模型的超参数调优方法,其特征在于,所述根据所述训练结果计算所述每一个所述语义识别模型的对应的望大特性信噪比,包括:根据所述训练结果构建混淆矩阵,其中,所述混淆矩阵包括为每一组每一次交叉验证得到的模型预测正确的语义角色的个数、模型预测错误的语义角色的个数、模型没有预测出的语义角色的个数和模型没有被错误的预测为语义角色的个数;计算每组所述混淆矩阵对应的精确率和召回率;根据每组所述混淆矩阵对应的精确率和召回率计算每组所述混淆矩阵对应的f1值;根据所有所述f1值计算所述语义识别模型的对应的望大特性信噪比。3.根据权利要求2所述的一种语义识别模型的超参数调优方法,其特征在于,所述根据每组所述混淆矩阵对应的精确率和召回率计算每组所述混淆矩阵对应的f1值,包括:对每组所述混淆矩阵对应的精确率和召回率进行求和,得到对应的第三求和结果;将每组所述混淆矩阵对应的精确率和召回率进行相乘,得到精确率和召回率的积;将所述精确率和召回率的积乘以2,得到对应的求积结果;将所述对应的求积结果除以所述对应的第三求和结果,得到每组所述混淆矩阵对应的f1值。4.根据权利要求2所述的一种语义识别模型的超参数调优方法,其特征在于,所述根据所有所述f1值计算所述语义识别模型的对应的望大特性信噪比的计算公式包括:其中,η为语义识别模型的对应的望大特性信噪比,为通过3
×
2交叉验证法得到的第i组第k次交叉验证的f1值。5.根据权利要求2所述的一种语义识别模型的超参数调优方法,其特征在于,通过如下方式计算每组所述混淆矩阵对应的精确率,包括:对每组所述混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数与对应的交叉验证得到的模型预测错误的语义角色的个数进行求和,得到对应的第一求和结果;将每组所述混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数除以对应的第一求和结果,得到每组所述混淆矩阵对应的精确率。6.根据权利要求2所述的一种语义识别模型的超参数调优方法,其特征在于,通过如下
方式计算每组所述混淆矩阵对应的召回率,包括:对每组所述混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数与对应的交叉验证得到的模型没有预测出的语义角色的个数进行求和,得到对应的第二求和结果;将每组所述混淆矩阵对应的交叉验证得到的模型预测正确的语义角色的个数除以对应的第二求和结果,得到每组所述混淆矩阵对应的召回率。7.根据权利要求6所述的一种语义识别模型的超参数调优方法,其特征在于,所述根据所述文本数据集通过交叉验证法对每一个所述语义识别模型进行训练,得到每一个所述语义识别模型的对应训练结果,包括:将所述文本数据集分为若干组测试数据集和若干组训练数据集;根据若干组所述测试数据集和若干组所述训练数据集通过3
×
2交叉验证法对每一个所述语义识别模型进行训练,得到每一个所述语义识别模型的对应训练结果。8.一种语义识别模型的超参数调优系统,其特征在于,所述语义识别模型的超参数调优系统包括:数据获取模块,用于获取文本数据集;模型训练模块,用于根据多组预设超参数构建对应数目的语义识别模型,根据所述文本数据集通过交叉验证法对每一个所述语义识别模型进行训练,得到每一个所述语义识别模型的对应训练结果;望大特性信噪比计算模块,用于根据所述训练结果计算每一个所述语义识别模型的对应的望大特性信噪比;最优超参数选取模块,用于根据每一个所述语义识别模型的对应的望大特性信噪比选取所述语义识别模型的最优预设超参数。9.一种语义识别模型的超参数调优设备,其特征在于,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至7任一项所述的一种语义识别模型的超参数调优方法。10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的一种语义识别模型的超参数调优方法。
技术总结
本发明公开了一种语义识别模型的超参数调优方法与系统,包括根据多组预设超参数构建对应数目的语义识别模型,根据文本数据集通过交叉验证法对每一个语义识别模型进行训练,得到每一个语义识别模型的对应训练结果,根据训练结果计算每一个语义识别模型的对应的望大特性信噪比,根据每一个语义识别模型的对应的望大特性信噪比选取语义识别模型的最优预设超参数,通过在关注性能指标的均值改善的同时,也关注方差的变化,减少了模型性能的波动,提高了模型预测的准确性。提高了模型预测的准确性。提高了模型预测的准确性。
技术研发人员:蔡鹏清 李燕敏 杜帅 刘睿晗 张旻 张瑞
受保护的技术使用者:深圳北斗应用技术研究院有限公司
技术研发日:2023.06.25
技术公布日:2023/10/5
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/