一种基于光谱变换融合的中药制药过程质量智能检测方法
未命名
09-29
阅读:79
评论:0
1.本发明涉及中药质量分析技术领域,具体涉及一种基于光谱变换融合的中药制药过程质量智能检测方法。
背景技术:
2.中药材的质量是影响中药在临床中能够安全有效应用的关键因素,然而中药材的成分十分复杂,并且中药制药过程步骤较多,包含提取、分离、纯化、混合、制粒、压片、包衣等步骤,各步骤中所涉及的工艺参数是多样的,中药产品批间、批内的质量差别较大,影响最终产品的品质。目前,中药材质量检测的主要方法包括气相色谱法、高效液相色谱法、质谱法、色谱和质谱联用等。然而上述的检测方法耗时耗力并且无法大规模的获取所需信息,反馈中药质量的时间较慢,导致出现产品质量不稳定等情况。
3.光谱技术主要是用对光的吸收、反射和透射得到的特征光谱来反应样品的性质,具有快速、便捷和适应性广的优点,常用的光谱技术主要包括近红外光谱技术、高光谱成像技术、紫外光谱技术等。
4.中国专利cn200910195764.x中公开了一种中药六味地黄丸生产过程的近红外光谱在线检测方法,其步骤为:(1)校正集样本的选择;(2)校正集样本性质的测定;(3)校正集样本的近红外吸收光谱测定:在波长为10000-4000cm-1
范围内,采用近红外光谱仪测定六味地黄丸各工艺点样品的吸收光谱值;(4)校正模型建立:对步骤(2)获得的含量数据与步骤(3)得到的近红外光谱吸收值进行关联,建立校正模型;(5)未知样本性质的测定。该发明将近红外技术应用于六味地黄丸生产过程的在线检测,实现了指标成分的实时检测,有助于实现工艺实时监控和诊断,能够保证产品质量稳定均一和安全可控。
5.中国专利cn201210485023.7中公开了一种陈皮及广陈皮药材质量的近红外光谱监控方法,该方法包括:(1)选取陈皮及广陈皮药材,采集近红外光谱;(2)判别分析建立定性判别模型,进行陈皮与广陈皮的鉴别;(3)结合偏最小二乘法建立陈皮及广陈皮的定量模型,进行陈皮及广陈皮定量检测。该发明建立的中药分析方法可对陈皮中药进行快速分析,节约了生产成本,缩短检测时间,提高了生产的效率。
6.对于成分复杂、结构多样的中药制药过程物料,独立的传感器所捕获的信号是有限的,已有研究表明,多光谱数据融合策略可结合各独立光谱中互补信息提升模型预测精度。但目前还未有研究将数据融合策略用于中药制药过程物料质量属性的预测。
7.本发明中提供的中药制药过程质量检测方法能够对制药过程中的各个环节进行实时的监控和质量分析,能够及时的反应产品质量情况并且精准的检测多个工艺过程中物料的质量。
技术实现要素:
8.本发明的目的是提供一种基于光谱变换融合的中药制药过程质量检测方法,实现了中药提取、制粒等多个工艺过程物料质量参数快速、精确检测,保障中药制药过程按预期
运行。
9.术语解释:
10.本发明中,术语“z-score标准化”是指基于原始数据的均值和标准差来进行数据的标准化,处理后的数据符合标准的正态分布,公式如下所示:
[0011][0012]
式中,x表示原始数据,μ表示原始数据的平均值,σ表示原始数据的标准差,x
normalization
表示归一化后的数据。
[0013]
本发明中,术语“矩阵乘法运算”是指:设a为m
×
p的矩阵,b为p
×
n的矩阵,那么称m
×
n的矩阵c为矩阵a与b的乘积,记作c=ab,其中矩阵c中的第i行第j列元素可以表示为:
[0014][0015]
本发明中,术语“近红外光”是指波长范围介于可见光与中红外区之间的电磁波,波长范围为780-2526nm。nir光谱是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的。
[0016]
本发明中,术语“拉曼光谱”主要是利用光的反射和折射原理,拉曼光是散射光的一种,是一种振动光谱技术,能够与样品中的振动分子相互作用,每个分子能够产生不同的振动模式,引起拉曼光谱谱线的数目,位移及其拉曼峰强度的变化,这些能够反应分子的构象。
[0017]
本发明中,术语“高光谱数据”是一叠连续多个波段成像获得的样品的图像。
[0018]
为实现上述发明目的,本发明的技术方案如下:
[0019]
一方面,本发明提供了一种基于光谱变换融合的中药制药过程质量检测方法,包括光谱数据预处理和多光谱数据变换融合步骤,所述的光谱数据预处理的方法为z-score标准化,所述的多光谱数据变换融合的方法为将至少两种光谱数据进行矩阵乘法运算。
[0020]
优选地,所述的光谱数据选自紫外-可见光谱数据、近红外光谱数据、拉曼光谱数据、高光谱数据中的至少两种。
[0021]
优选地,所述的光谱采集的方式包括通过光纤探头在线采集、流通池旁线采集以及取样后离线采集。
[0022]
优选地,所述的中药制药过程质量检测方法还包括:样品采集、质量指标参考值测定、样品光谱采集、光谱特征提取、定量校正建模和基于定量校正模型检测中药制药过程质量。
[0023]
进一步优选地,所述的样品采集为采集中药制药工艺过程中的样品。
[0024]
再进一步优选地,所述的中药制药工艺过程选自提取过程、浓缩过程、醇沉过程、层析过程、制粒过程中的一种或多种。
[0025]
更进一步优选地,所述的样品采集方式为:从制药工艺过程起始时刻开始,固定时间间隔通过设备取样口收集物料样品。
[0026]
进一步优选地,所述的质量指标包括但不限于指标性化学成分含量、可溶性固形物含量、相对密度、颗粒粒径分布、水分含量。
[0027]
再进一步优选地,所述的指标性化学成分含量选自柚皮苷、橙皮苷、新橙皮苷、迷迭香酸、人参皂苷rg1、人参皂苷re、人参皂苷rb1、人参皂苷rd中的一种或多种。
[0028]
更进一步优选地,采用高效液相色谱法测定指标性化学成分含量;采用烘干恒重法测定固形物含量;采用粒径分布仪测定颗粒粒径分布;采用干燥失重法测定水分含量。
[0029]
进一步优选地,所述的光谱特征提取方法包括但不限于竞争自适应重加权采样(cars)、最小角回归(lars)、连续投影算法(spa)、无信息变量消除(uve)、主成分分析(pca)和自编码器(ae)。
[0030]
再进一步优选地,所述的光谱特征提取方法为主成分分析。
[0031]
进一步优选地,所述的定量校正建模方法包括但不限于偏最小二乘法(pls)、支持向量机(svm)、偏最小支持向量机(ls-svm)、卷积神经网络(cnn)、catboost、lightgbm、xgboost。
[0032]
再进一步优选地,所述的定量校正建模方法为cnn。
[0033]
更进一步优选地,所述的cnn模型单次训练的批量为32,最大epoch为500,训练时采用adam优化器进行优化,adam的学习率为0.0001,学习率每隔20个轮次下降50%,dropout和early stopping被用于防止过拟合,flatten层与输出层间随机dropout 20%神经元,当50个epoch的loss未降低时即结束训练,fatten层后将拼接融合特征进行批量归一化(batch normalization)以加速网络收敛。
[0034]
更进一步优选地,所述的cnn模型的结构包括:1个输入层,3个独立卷积层,1个flatten层以及1个全连接输出层。输入层的输入为16
×
16的光谱特征矩阵;独立卷积层conv1的卷积核数目为16,尺寸为5
×
5,步长为1,激活函数为leakyrelu;独立卷积层conv2的卷积核数目为32,尺寸为3
×
3,步长为1,激活函数为leakyrelu;独立卷积层conv3的卷积核数目为64,尺寸为1
×
1,步长为1,激活函数为leakyrelu;flatten层将conv3输出的矩阵展开为向量。
[0035]
进一步优选地,所述的模型的性能评价指标包括但不限于预测集均方根误差(rmse)和决定系数
[0036]
再进一步优选地,计算公式如下:
[0037][0038][0039]
式中,yi表示指标实测值,表示指标预测值,表示指标均值,n表示测试集样本数。
[0040]
在本发明的一些实施方式中,所述的中药制药过程质量检测方法包括:
[0041]
s1、中药制药工艺过程样品采集与质量指标参考值测定;
[0042]
s2、样品光谱采集及特征提取;
[0043]
s3、多光谱数据变换融合;
[0044]
s4、光谱数据预处理及定量校正建模;
[0045]
s5、基于定量校正模型,检测中药制药过程质量。
[0046]
根据本发明的一些实施方式,在麸炒枳壳提取过程中,采用高效液相色谱法测定
样品中柚皮苷、橙皮苷和新橙皮苷含量。
[0047]
优选地,所述的高效液相色谱条件为:色谱柱:dikma diamonsil c18色谱柱(250
×
4.6mm,5μm);流动相:0.1%乙酸水(a)-乙腈(b);线性洗脱梯度:0-8min,12% b;8-20min,12%-22% b;20-30min,22% b;30-40min,22%-60% b;40-55min,60%-95% b;55-57min,95%-12% b;57-65min,12%b;流速:1.0ml/min;检测波长:283nm;柱温:30℃。
[0048]
根据本发明的一些实施方式,在麸炒枳壳提取过程中,采用烘干恒重法测定样品中可溶性固形物含量。
[0049]
根据本发明的一些实施方式,在麸炒枳壳提取过程中,所述的拉曼光谱采集参数为:拉曼位移范围0-3300cm-1
,积分时间3000ms,扫描次数3次,激光强度100%。
[0050]
优选地,使用bwram软件(b&w tek)进行光谱采集及数据导出。
[0051]
根据本发明的一些实施方式,在麸炒枳壳提取过程中,所述的近红外光谱采集参数为:分辨率16,扫描次数64,波数4000-12000cm-1
,增益671.41。
[0052]
优选地,使用horizonmb软件(abb)进行光谱采集及数据导出。
[0053]
根据本发明的一些实施方式,在胃复春制粒过程中,高光谱采集参数为:将胃复春颗粒样品均匀铺满在35mm细胞培养皿中,移动平台速度为1.70mm/s,曝光时间为19ms。
[0054]
根据本发明的一些实施方式,在胃复春制粒过程中,近红外光谱采集参数为:颗粒样本近红外光谱的采集模式为漫反射积分球模式,扫描次数为32,分辨率为8cm-1
,波数范围为4000-10000cm-1
。
[0055]
根据本发明的一些实施方式,在胃复春制粒过程中,拉曼光谱采集参数为:积分时间300ms,积分次数8次,激光功率100%。
[0056]
根据本发明的一些实施方式,在胃复春制粒过程中,采用高效液相色谱法测定各样品中柚皮苷,迷迭香酸,新橙皮苷,人参皂苷rg1,人参皂苷re,人参皂苷rb1和人参皂苷rd的含量。
[0057]
具体地,所述的高效液相色谱条件为:色谱柱:waters cortecs c18(150
×
4.6mm,2.7μm);流动相:0.5%甲酸水(a)-乙腈(b);线性梯度洗脱程序:0-12min,5-17% b;12-19min,17% b;19-40min,17-23% b;40-65min,23-38%b;65-75min,38-70% b;75-80min,70% b;流速:0.60ml/min;柱温:35℃;进样量:10μl;紫外检测器波长:283nm、330nm;elsd参数:蒸发器温度:100℃;雾化器温度:90℃;载气流速:1.00slm。
[0058]
又一方面,本发明提供了上述的中药制药过程质量检测方法在中药制药工艺中的应用。
[0059]
优选地,所述的中药制药工艺选自中药提取过程、中药浓缩过程、中药醇沉过程、中药层析过程、中药制粒过程。
[0060]
进一步优选地,所述的中药制药工艺包括但不限于中药提取、中药制粒。
[0061]
进一步优选地,所述的中药制药工艺为中药提取时,所述的中药包括但不限于麸炒枳壳。
[0062]
进一步优选地,所述的中药制药工艺为中药制粒时,所述的中药包括但不限于胃复春。
[0063]
本发明的有益效果为:
[0064]
本发明提供的一种基于光谱变换融合的中药制药过程质量智能检测方法,该方法
具有快速、准确的优点,并首次将其应用于中药制药过程质量监测中,为智能质检技术在中药制药过程质控领域的应用提供依据和指导,有助于提高中药生产制造水平和质量控制水平。
附图说明
[0065]
图1为本发明实施例1中的麸炒枳壳提取过程药液样品原始光谱,(a)原始nir光谱,(b)原始raman光谱。
[0066]
图2为本发明实施例1中的麸炒枳壳提取过程药液质量检测结果。
[0067]
图3为本发明实施例2中的胃复春制粒过程颗粒样品原始光谱及预处理后的光谱图,(a)hsi光谱,(b)nir光谱,(c)拉曼光谱。
[0068]
图4为本发明实施例2中的胃复春制粒过程颗粒样品质量检测结果示例。
具体实施方式
[0069]
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施例,进一步阐明本发明,但下述实施例仅为本发明的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其它实施例,都属于本发明的保护范围。下述实施例中,若无特殊说明,所用的操作方法均为常规操作方法,所用设备均为常规设备,各个实施例所用设备材料均相同。
[0070]
实验材料:
[0071]
下述实施例中麸炒枳壳、胃复春颗粒样品由杭州胡庆余堂药业有限公司提供。
[0072]
下述实施例中:
[0073]
拉曼光谱为i-raman plus便携式拉曼光谱仪(b&w tek),配有激光发射器、ccd检测器、工业级光纤拉曼探头。
[0074]
近红外光谱为talys asp541型傅里叶变换近红外光谱仪(abb),主要由检测模块、光源、光谱采集软件组成。
[0075]
高光谱为五铃光学hsi-nir高光谱成像系统,主要由成像模块、光源、图像采集软件组成。
[0076]
实施例1一种基于光谱变换融合的麸炒枳壳提取过程质量智能监测方法
[0077]
实验步骤:
[0078]
s1、样品采集:称取1000g麸炒枳壳投入提取罐内,加入9l纯化水,蒸汽加热,待回流后计时提取1h,此过程为第一次提取。第一次提取完成后,排出提取液,再加入7l纯化水,蒸汽加热,待回流后计时提取1h,此过程为第二次提取。第一次提取与第二次提取均从计时开始每隔1min采集拉曼光谱和近红外光谱,每隔5min取样10ml。每批提取各获得122张拉曼光谱、122张近红外光谱以及26个样品,以相同工艺共进行10批试验。
[0079]
质量指标参考值的测定方法:
[0080]
采用高效液相色谱法测定各样品中柚皮苷,橙皮苷和新橙皮苷含量。
[0081]
采用烘干恒重法测定各样品中可溶性固形物含量。
[0082]
高效液相色谱条件为:色谱柱:dikma diamonsil c18色谱柱(250
×
4.6mm,5μm);流动相:0.1%乙酸水(a)-乙腈(b);线性洗脱梯度:0-8min,12%b;8-20min,12%-22% b;
20-30min,22% b;30-40min,22%-60% b;40-55min,60%-95% b;55-57min,95%-12% b;57-65min,12% b;流速:1.0ml/min;检测波长:283nm;柱温:30℃。
[0083]
烘干恒重法测定条件为:取各样品2500rpm离心10min后取上清液2ml,精密称定,水浴蒸干后采用105℃烘干法测定固含量。
[0084]
s2、样品光谱采集和光谱特征提取:采集s1收集样品的近红外光谱和拉曼光谱,原始光谱如图1所示,使用主成分分析(pca)提取光谱特征,保留前16个主成分。
[0085]
拉曼光谱采集参数为:拉曼位移范围0-3300cm-1
,积分时间3000ms,扫描次数3次,激光强度100%,bwram软件(b&w tek)用于光谱采集及数据导出。
[0086]
近红外光谱采集参数为:分辨率16,扫描次数64,波数4000-12000cm-1
,增益671.41,horizonmb软件(abb)用于光谱采集及数据导出。
[0087]
s3、多光谱数据变换融合:将各样品对应的近红外和拉曼光谱特征数据进行矩阵乘法运算,即为一个16
×
16的光谱特征矩阵。由于各光谱的测量值尺度具有差异,为了避免在融合时大值测量值掩盖小值测量值,在数据融合过程中对各光谱数据采用z-score标准化平衡各光谱尺度。
[0088]
s4、定量校正建模:本实施例以变换融合后的光谱特征矩阵为输入,采用cnn算法分别构建柚皮苷、橙皮苷、新橙皮苷以及可溶性固形物含量定量校正模型。按3:1将数据划分为训练集和测试集。建模时采用五折交叉验证以提升模型的泛化能力。cnn模型单次训练的批量为32,最大epoch为500,训练时采用adam优化器进行优化,adam的学习率为0.0001,学习率每隔20个轮次下降50%,dropout和early stopping被用于防止过拟合,flatten层与输出层间随机dropout 20%神经元,当50个epoch的loss未降低时即结束训练,此外,fatten层后将拼接融合特征进行批量归一化(batch normalization)以加速网络收敛。
[0089]
cnn模型结构为:包括1个输入层,3个独立卷积层,1个flatten层以及1个全连接输出层。输入层的输入为16
×
16的光谱特征矩阵;独立卷积层conv1的卷积核数目为16,尺寸为5
×
5,步长为1,激活函数为leakyrelu;独立卷积层conv2的卷积核数目为32,尺寸为3
×
3,步长为1,激活函数为leakyrelu;独立卷积层conv3的卷积核数目为64,尺寸为1
×
1,步长为1,激活函数为leakyrelu;flatten层将conv3输出的矩阵展开为向量。
[0090]
模型评价:采用预测集均方根误差(root mean square error,rmse)和决定系数(r-square,)作为模型性能评价指标,其计算公式如下:
[0091][0092][0093]
式中,yi表示指标实测值,表示指标预测值,表示指标均值,n表示测试集样本数,相同的检测指标,rmse越低表明模型的预测性能更好,越接近于1表明模型预测性能更好。各模型性能比较结果见表1。
[0094]
表1各质量指标cnn模型性能
[0095][0096]
s5、基于定量校正模型,检测麸炒枳壳提取过程质量,见图2。
[0097]
实施例2一种基于光谱变换融合的胃复春制粒过程质量智能监测方法
[0098]
实验步骤如下:
[0099]
s1、样品采集:将麸炒枳壳和香茶菜浸膏、红参粉及辅料按处方配比进行流化床制粒,其过程可分为喷雾制粒和干燥两个阶段,生产时长共4h。在喷雾制粒阶段采样6个,在干燥阶段采样4个,每批生产共收集10个颗粒样本。共进行15批生产获得150个胃复春颗粒样本。
[0100]
质量指标参考值的测定方法:
[0101]
采用干燥失重法测定各样品水分含量。
[0102]
采用粒径分布仪测定样品粒径分布。
[0103]
采用高效液相色谱法测定各样品中柚皮苷,迷迭香酸,新橙皮苷,人参皂苷rg1,人参皂苷re,人参皂苷rb1和人参皂苷rd的含量。
[0104]
进一步地,所述干燥失重测定条件为:取胃复春颗粒2g,精密称定,采用105℃烘干法测定颗粒水分。
[0105]
进一步地,所述粒径分布测定条件为:使用干法模式对每个颗粒样品测量两次,取平均获得粒径分布d10、d50和d90。
[0106]
进一步地,所述高效液相色谱条件为:色谱柱:waters cortecs c18(150
×
4.6mm,2.7μm);流动相:0.5%甲酸水(a)-乙腈(b);线性梯度洗脱程序:0-12min,5-17% b;12-19min,17% b;19-40min,17-23% b;40-65min,23-38%b;65-75min,38-70% b;75-80min,70% b;流速:0.60ml/min;柱温:35℃;进样量:10μl;紫外检测器波长:283nm、330nm;elsd参数:蒸发器温度:100℃;雾化器温度:90℃;载气流速:1.00slm。
[0107]
s2、样品光谱采集及特征提取:采集各样品高光谱、近红外光谱和拉曼光谱数据,使用主成分分析(pca)提取光谱特征,保留前16个主成分。
[0108]
高光谱采集参数为:将胃复春颗粒样品均匀铺满在35mm细胞培养皿中,移动平台速度为1.70mm/s,曝光时间为19ms以获得清晰且不失真图像,最后将每个样品的2次平均光谱取均值作为样品光谱。
[0109]
近红外光谱采集参数为:颗粒样本近红外光谱的采集模式为漫反射积分球模式,扫描次数为32,分辨率为8cm-1
,波数范围为4000-10000cm-1
,每个样品采集两次光谱。求平均后作为样品近红外光谱。
[0110]
拉曼光谱采集参数为:积分时间300ms,积分次数8次,激光功率100%。每个样品采集两次光谱,取平均作为样品拉曼光谱。各样品原始光谱的光谱见图3。
[0111]
s3、多光谱数据变换融合:将各样品对应的近红外、拉曼、高光谱特征数据两两组
合,共有3种组合方式(hsi-nir,hsi-raman,nir-raman),分别进行矩阵乘法运算,获得16
×
16的光谱特征矩阵。由于各光谱的测量值尺度具有差异,为了避免在融合时大值测量值掩盖小值测量值,在数据融合过程中对各光谱数据采用z-score标准化平衡各光谱尺度。
[0112]
s4、定量校正建模:采用同实施例1相同的cnn模型结构分别构建水分、d10、d50、d90、柚皮苷、新橙皮苷、迷迭香酸、人参皂苷rg1、人参皂苷re、人参皂苷rb1和人参皂苷rd 11个指标的定量校正模型。
[0113]
进一步地,采用预测集均方根误差(root mean square error,rmse)和决定系数(r-square,)作为模型性能评价指标,其计算公式如下:
[0114][0115][0116]
式中,yi表示指标实测值,表示指标预测值,表示指标均值,n表示测试集样本数,低rmse和高表明模型预测性能良好。各模型性能见表2。
[0117]
表2各质量指标cnn模型性能
[0118][0119]
s5、基于定量校正模型,检测胃复春制粒过程质量,见图4。
[0120]
对比例1
[0121]
对比例1与实施例1的区别仅在于多光谱数据变换融合的方法不同,对比例1中多光谱数据变换融合的方法为光谱串联融合,其余皆相同。
[0122]
对比例1与实施例1的步骤s1相同。
[0123]
s2、样品光谱采集和光谱特征提取:采集s1收集样品的近红外光谱和拉曼光谱,保留完整光谱。
[0124]
拉曼光谱采集参数和近红外光谱采集参数与实施例1相同。
[0125]
s3、多光谱数据变换融合:将各样品对应的近红外和拉曼光谱进行串联融合。由于各光谱的测量值尺度具有差异,为了避免在融合时大值测量值掩盖小值测量值,在数据融合过程中对各光谱数据采用z-score标准化平衡各光谱尺度。
[0126]
s4、定量校正建模:本对比例以串联融合后的光谱数据为输入,采用cnn算法分别构建柚皮苷、橙皮苷、新橙皮苷以及可溶性固形物含量定量校正模型。按3:1的比例将数据划分为训练集和测试集。建模时采用五折交叉验证以提升模型的泛化能力。cnn模型单次训练的批量为32,最大epoch为500,训练时采用adam优化器进行优化,adam的学习率为0.0001,学习率每隔20个轮次下降50%,dropout和early stopping被用于防止过拟合,flatten层与输出层间随机dropout 20%神经元,当50个epoch的loss未降低时即结束训练,此外,fatten层后将拼接融合特征进行批量归一化(batch normalization)以加速网络收敛。
[0127]
cnn模型结构为:包括1个输入层,3个独立卷积层,1个flatten层以及1个全连接输出层。输入层的输入为长度为2646的光谱向量;独立卷积层conv1的卷积核数目为16,尺寸为5,步长为1,激活函数为leakyrelu;独立卷积层conv2的卷积核数目为32,尺寸为3,步长为1,激活函数为leakyrelu;独立卷积层conv3的卷积核数目为64,尺寸为1,步长为1,激活函数为leakyrelu;flatten层将conv3输出的矩阵展开为向量。
[0128]
实验结果如下表3。
[0129]
表3各质量指标cnn模型性能
[0130][0131]
从上表3中可以看出,除固含量模型性能与实施例1相近外,其余指标的模型性能均有较大幅度的降低,表明本发明的方法构建的模型具有较好的预测性能,本发明所述光谱数据变换融合方法具有更强的应用能力。
[0132]
对比例2
[0133]
对比例2与实施例1的步骤s1相同。
[0134]
s2、样品光谱采集和光谱特征提取:采集s1收集样品的近红外光谱和拉曼光谱,使用主成分分析(pca)提取光谱特征,保留前32个主成分。
[0135]
拉曼光谱采集参数和近红外光谱采集参数与实施例1相同。
[0136]
s3、多光谱数据变换融合:将各样品对应的近红外和拉曼光谱特征数据进行矩阵乘法运算,即为一个32
×
32的光谱特征矩阵。由于各光谱的测量值尺度具有差异,为了避免在融合时大值测量值掩盖小值测量值,在数据融合过程中对各光谱数据采用z-score标准化平衡各光谱尺度。
[0137]
s4、定量校正建模:本对比例以变换融合后的光谱特征矩阵为输入,采用cnn算法分别构建柚皮苷、橙皮苷、新橙皮苷以及可溶性固形物含量定量校正模型。按3:1的比例将
数据划分为训练集和测试集。建模时采用五折交叉验证以提升模型的泛化能力。cnn模型单次训练的批量为32,最大epoch为500,训练时采用adam优化器进行优化,adam的学习率为0.0001,学习率每隔20个轮次下降50%,dropout和early stopping被用于防止过拟合,flatten层与输出层间随机dropout 20%神经元,当50个epoch的loss未降低时即结束训练,此外,fatten层后将拼接融合特征进行批量归一化(batch normalization)以加速网络收敛。
[0138]
cnn模型结构为:包括1个输入层,3个独立卷积层,1个flatten层以及1个全连接输出层。输入层的输入为32
×
32的光谱特征矩阵;独立卷积层conv1的卷积核数目为16,尺寸为5
×
5,步长为1,激活函数为leakyrelu;独立卷积层conv2的卷积核数目为32,尺寸为3
×
3,步长为1,激活函数为leakyrelu;独立卷积层conv3的卷积核数目为64,尺寸为1
×
1,步长为1,激活函数为leakyrelu;flatten层将conv3输出的矩阵展开为向量。
[0139]
实验结果如下表4所示。
[0140]
表4各质量指标cnn模型性能
[0141][0142][0143]
从上表4中可以看出,当保留32个主成分时,各指标定量校正模型性能并无提升,部分指标甚至出现了明显下降,表明保留过多主成分会导致光谱中的噪声特征被更多地保留,影响模型性能。
[0144]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种基于光谱变换融合的中药制药过程质量检测方法,其特征在于,包括光谱数据预处理和多光谱数据变换融合步骤,所述的光谱数据预处理的方法为z-score标准化,所述的多光谱数据变换融合的方法为将至少两种光谱数据进行矩阵乘法运算。2.根据权利要求1所述的中药制药过程质量检测方法,其特征在于,所述的光谱数据选自紫外-可见光谱数据、近红外光谱数据、拉曼光谱数据、高光谱数据中的至少两种。3.根据权利要求1所述的中药制药过程质量检测方法,其特征在于,还包括:样品采集、质量指标参考值测定、样品光谱采集、光谱特征提取、定量校正建模和基于定量校正模型检测中药制药过程质量。4.根据权利要求3所述的中药制药过程质量检测方法,其特征在于,所述的样品采集为采集中药制药工艺过程中的样品;所述的中药制药工艺过程选自提取过程、浓缩过程、醇沉过程、层析过程、制粒过程中的一种或多种。5.根据权利要求3所述的中药制药过程质量检测方法,其特征在于,所述的质量指标选自化学成分含量、可溶性固形物含量、相对密度、颗粒粒径分布、水分含量中的一种或多种。6.根据权利要求3所述的中药制药过程质量检测方法,其特征在于,所述的光谱特征提取方法选自竞争自适应重加权采样、最小角回归、连续投影算法、无信息变量消除、主成分分析、自编码器中的一种或多种。7.根据权利要求3所述的中药制药过程质量检测方法,其特征在于,所述的定量校正建模方法选自偏最小二乘法、支持向量机、偏最小支持向量机、卷积神经网络、catboost、lightgbm、xgboost中的一种或多种。8.根据权利要求7所述的中药制药过程质量检测方法,其特征在于,所述的定量校正建模方法为卷积神经网络。9.根据权利要求3所述的中药制药过程质量检测方法,其特征在于,所述的模型的性能评价指标包括均方根误差和决定系数;计算公式如下:决定系数:均方根误差:式中,y
i
表示指标实测值,表示指标预测值,表示指标均值,n表示测试集样本数。10.权利要求1-9任一项所述的中药制药过程质量检测方法在中药制药工艺中的应用。
技术总结
本发明公开了一种基于光谱变换融合的中药制药过程质量智能检测方法,涉及中药质量分析技术领域。所述的中药制药过程质量检测方法,包括光谱数据预处理和多光谱数据变换融合步骤,所述的光谱数据预处理的方法为z-score标准化,所述的多光谱数据变换融合的方法为将至少两种光谱数据进行矩阵乘法运算。本发明提供的检测方法具有快速、准确的优点,并首次将其应用于中药制药过程质量监测中,为智能质检技术在中药制药过程质控领域的应用提供依据和指导,有助于提高中药生产制造水平和质量控制水平。制水平。制水平。
技术研发人员:程宁涛 仲怿
受保护的技术使用者:浙江大学
技术研发日:2023.06.21
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/