基于极端梯度提升算法的疾病管控模糊综合评价方法

未命名 09-29 阅读:82 评论:0


1.本发明涉及疫情管理与控制技术领域,尤其涉及一种基于极端梯度提升算法的疾病管控模糊综合评价方法。


背景技术:

2.2020年初疾病在国内爆发,突如其来的疫情对各个城市的应急能力和管理体系提出巨大挑战。我国疫情防控过程中,封闭式管理模式有效控制了疫情的发展。然而疫情期间生活物资的管理是一项复杂的系统工程,交警、高速公路管理部门、商务局、邮政部门、防疫部门、民委及市场监管局等均参与其中。通常疫情发现的越早越有利于疫情的防控,然而在实际管理过程中仍会出现疫情发现较晚的特殊情况,此时全民居家隔离成为较优的选择。
3.随着封闭式管理的实行,居民的生活需求与小区的承载能力之间的供求关系被不断放大,矛盾也在日益加深,由此产生的大规模居家人群的生活物资保障问题成为社会焦点。然而,生活物资的需求量往往随居家隔离人数的变化呈暴发式增长,且生活物资投放具有需求不确定与供应滞后等问题,百姓们唯恐得不到足够数量的生活物资而恐慌,疫情期间生活物资的管理是一项复杂且困难的系统工程。通过分析2020年不同城市大规模疫情的控制方案,采用蔬菜包的方式为疫情地区的居民生活物资的有效发放起到了重要作用。蔬菜包主要以新鲜蔬菜为主,因其人人每天必需,且保质期相对较短,从而配送频率较高,导致人群密切接触较多。由于蔬菜包无论在数量、频次、影响等方面都与疫情息息相关。
4.为了聚焦效果评价,模糊综合评价方法被提出。李嘉陵以某水利枢纽工程为例,利用专家打分法和模糊综合评价法对大坝和泄洪闸进行综合评价。林淑伟等人运用层次分析法与模糊综合评价法对旅游资源进行评价。刘宇等人利用专家打分法和层次分析法进行新能源建设项目安全风险的模糊综合评价研究。但此类模糊综合评价方法下,因素集中的因素及其权重均基于专家打分法,导致评价结果的准确率较低。


技术实现要素:

5.为了解决现有技术中未考虑使用随机搜索和五折交叉验证结合的方法迭代确定极端梯度提升(xgboost)算法模型的最优超参数的技术问题,而提出了一种基于极端梯度提升算法的疾病管控模糊综合评价方法。本发明采用最优超参数下的极端梯度提升算法进行因素筛选与权重赋值,以更精准地筛选出有显著贡献的评价指标,并展开疫情期间蔬菜包发放前后的疾病管控效果模糊综合评价。
6.为了实现上述发明目的,本发明采用技术方案具体为:基于极端梯度提升算法的疾病管控模糊综合评价方法,其中,包含以下步骤:
7.s1:数据获取与预处理;
8.s2:利用极端梯度提升算法计算特征重要性,并采用随机搜索和五折交叉验证确定极端梯度提升算法模型超参数,最终分别确定发放蔬菜包前、后疾病管控效果的评价指标;
9.s3:分别构建发放蔬菜包前、后疾病管控效果的模糊综合评价模型。
10.所述步骤s1具体包含以下步骤:
11.步骤1.1:根据长春市covid-19疫情期间病例数据、生活物资数据和蔬菜包数据,从生活物资、线上线下商铺、重点民生商品、蔬菜包、粮油副食品及企业六方面,筛选j个特征项作为蔬菜包发放前后疾病管控效果的评价指标,得到原始数据集w0={x
ij
},i=1,2,

,i,j=1,2,

,j,其中i和j分别表示样本数和评价指标数,x
ij
为第i个样本中第j个评价指标的数据;
12.步骤1.2:统计j个蔬菜包发放前后疾病管控效果评价指标的数据缺失情况,计算各评价指标的数据缺失比例ηj,j=1,2,

,j;
13.步骤1.3:判断评价指标数据的缺失比例ηj是否超过50%,如果是则直接剔除该评价指标,反之利用随机森林回归模型补充缺失值;
14.步骤1.4:在原始数据集w0中,采用bootstrap采样方法有放回地随机抽取同样数量的样本,共进行n次采样;
15.步骤1.5:得到n个样本子集作为训练集,并对n个训练集分别构建n棵决策树;
16.步骤1.6:分别独立训练决策树模型,得到n棵决策树的回归预测结果;
17.步骤1.7:将n棵决策树的回归预测结果的平均值作为随机森林回归模型的预测结果,并填充对应评价指标数据的缺失值;
18.步骤1.9:得到包含m个发放蔬菜包前的疾病管控效果评价指标的数据集w1={a
yp
},y=1,2,

,y,p=1,2,

,m,及包含n个发放蔬菜包后的疾病管控效果评价指标的数据集w2={b
zq
},z=1,2,

,z,q=1,2,

,n,a
yp
为发放蔬菜包前第y个样本中第p个评价指标的数据,b
zq
为发放蔬菜包后第z个样本中第q个评价指标的数据,m为发放蔬菜包前的疾病管控效果评价指标个数,n为发放蔬菜包后的疾病管控效果评价指标个数,y为发放蔬菜包前样本数,z为发放蔬菜包后样本数。
19.所述步骤s2具体包括以下步骤:
20.步骤2.1:对xgboost回归预测模型进行初始化,在指定参数范围内确定模型的初始参数;
21.步骤2.2:将发放蔬菜包前、后的疾病管控效果评价指标数据集w1和w2分别均分为大小相同的5个样本子集w
1k
和w
2l
,k=1,2,3,4,5,l=1,2,3,4,5;
22.步骤2.3:不重复地在w
1k
中选取一个样本子集为测试集,剩下的4个子集为训练集,同时在w
2l
中也不重复地选取一个样本子集为测试集,剩下的4个子集为训练集;
23.步骤2.4:分别记录每个样本子集作为测试集时对应的均方根误差rmse
1k
和rmse
2l
,k=1,2,3,4,5,l=1,2,3,4,5;
24.步骤2.5:分别计算5个测试集对应均方根误差rmse
1k
和rmse
2l
的平均值rmse1和rmse2:
[0025][0026]
步骤2.6:利用随机搜索确定最小均方根误差对应的超参数,并将其作为xgboost回归预测模型的最优超参数;
[0027]
步骤2.7:基于最优超参数下发放蔬菜包前、后的xgboost回归预测模型,分别计算
各评价指标的重要性得分importance
p
和importance
′q,p=1,2,

,m,q=1,2,

,n,m为发放蔬菜包前的效果评价指标数,n为发放蔬菜包后的效果评价指标数;
[0028]
步骤2.8:分别对发放蔬菜包前、后的各评价指标重要性得分importance
p
和importance
′q进行大小排序;
[0029]
步骤2.9:分别在数据集w1和w2中选取重要性得分最大前9个评价指标作为蔬菜包发放前后疾病管控效果的最终评价指标,并将对应的重要性得分确定为模糊综合评价模型中的权重。
[0030]
步骤2.10:得到发放蔬菜包前疾病管控效果的9个评价指标数据集w3={c
ye
},及发放蔬菜包后疾病管控效果的9个评价指标的数据集w4={d
ze
},e=1,2,

,9,c
ye
为发放蔬菜包前第y个样本中第e个评价指标数据,d
ze
为发放蔬菜包后第z个样本中第e个评价指标数据。
[0031]
所述步骤s3具体包括以下步骤:
[0032]
步骤3.1:确定发放蔬菜包前、后疾病管控效果的模糊综合评价模型的因素集u和u

分别为:
[0033]
u={u1,u2,

,ue,

,u9},u

={u
′1,u
′2,

,u
′e,

,u
′9},
[0034]
其中,ue为第e个发放蔬菜包前的疾病管控效果评价指标,u
′e为第e个发放蔬菜包后的疾病管控效果评价指标,e=1,2,

,9;
[0035]
步骤3.2:确定发放蔬菜包前、后疾病管控效果的评语集为v:
[0036]
v={v1,v2,v3,v4},
[0037]
其中,v1为优等效果,v2为良等效果,v3为中等效果,v4为差等效果;
[0038]
步骤3.3:分析评价指标数据与评语集的隶属关系,其中数据越大疾病管控效果越好的评价指标与评语集存在相同的隶属关系,而数据越大疾病管控效果越差的评价指标与评语集存在相反的隶属关系,例如蔬菜单价越低,疾病管控效果越好;
[0039]
步骤3.4:确定发放蔬菜包前、后疾病管控效果评价指标ue和u
′e的重要性得分为各因素的权重值,得到发放蔬菜包前疾病管控效果的9个因素的权重向量和发放蔬菜包后疾病管控效果的9个因素的权重向量
[0040]
步骤3.5:根据数据集w3和w4,对与评语集存在相反隶属关系的评价指标ue的数据x进行正向化处理:
[0041][0042]
其中,为正则化处理后的评价指标数据,max为该评价指标的样本数据中的最大值,特别地当指标数据恰好等于最大值时,其正向化处理后的值为0;
[0043]
步骤3.6:将因素集中各因素分为两类,用不同的隶属度函数计算隶属度,对于蔬菜单价,基于三角隶属度函数计算隶属度,对于其他因素,基于梯形隶属度函数计算隶属度;
[0044]
步骤3.7:分别确定发放蔬菜包前、后疾病管控效果的模糊综合评价模型的隶属度矩阵r9×4和r
′9×4,其矩阵元素r
em
和re′m分别为:
[0045]rem
=μm(ue),re′m=μ
′m(u
′e),
[0046]
其中,μm(
·
)为发放蔬菜包前各因素的隶属度函数,μ
′m(
·
)为发放蔬菜包后各因
素的隶属度函数,e=1,2,

,9,m=1,2,3,4分别对应优、良、中、差评价等级;
[0047]
步骤3.8:计算发放蔬菜包前、后疾病管控效果模糊综合评价结果向量和分别为:
[0048][0049]
步骤3.9:分别选取结果向量和中数值最大的评价值,并将该值所对应的评语作为最终发放蔬菜包前、后疾病管控效果的模糊综合评价结果。
[0050]
本发明中涉及到的符号含义说明如表所示:
[0051]
[0052]
[0053][0054]
与现有技术相比,本发明的有益效果为:
[0055]
(1)本发明提供的基于极端梯度提升算法的疾病管控模糊综合评价方法,采用随机搜索和五折交叉验证结合的方法自动确定极端梯度提升(xgboost)回归模型的超参数,以使得模型在最小均方差根误差的基础上筛选出有显著贡献的评价指标,有效地避免陷入局部最小值,在一定程度上避免过拟合问题。
[0056]
(2)本发明基于最优超参数下的xgboost回归模型得到模糊综合评价模型中各因素的权重,采用三角隶属度函数计算蔬菜单价等关于价格的因素的隶属度,其他因素的隶属度则采用梯形隶属度函数计算,使得评价结果更加贴近真实的疾病管控效果,进而可以有效调整生活物资发放策略,在全面提高疫情防控效率的同时为今后的应急管理方案打下坚实的理论与实践基础。
附图说明
[0057]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
[0058]
图1为本发明提出基于极端梯度提升算法的疾病管控模糊综合评价方法的流程图;
[0059]
图2为本发明提出基于极端梯度提升算法的疾病管控模糊综合评价方法的“数据获取与预处理”流程图;
[0060]
图3为本发明提出基于极端梯度提升算法的疾病管控模糊综合评价方法的“利用极端梯度提升算法计算特征重要性,并分别确定发放蔬菜包前、后疾病管控效果的评价指标”流程图;
[0061]
图4为本发明提出基于极端梯度提升算法的疾病管控模糊综合评价方法的“分别构建发放蔬菜包前、后疾病管控效果的模糊综合评价模型”流程图;
[0062]
图5为本发明提出基于极端梯度提升算法的疾病管控模糊综合评价方法的实施例中“发放蔬菜包前重要性得分较高的前9个评价指标”;
[0063]
图6为本发明提出基于极端梯度提升算法的疾病管控模糊综合评价方法的实施例中“发放蔬菜包后疾病管控效果的重要性得分较高的前9个评价指标”。
具体实施方式
[0064]
为使本发明的目的、技术方案和优点更加清楚,以下结合具体实施例,对本发明作进一步地详细说明。
[0065]
实施例
[0066]
请参阅图1至图4,本实施例提供了一种基于极端梯度提升算法的疾病管控模糊综合评价方法,具体包括以下步骤:
[0067]
步骤1.1:长春市从2020年3月29日开始发放蔬菜包,根据长春市covid-19疫情期间病例数据、生活物资数据和蔬菜包数据,从生活物资、线上线下商铺、重点民生商品、蔬菜包、粮油副食品及企业六方面,筛选2020年3月4日至2020年5月23日期间136个特征项作为蔬菜包发放前后疾病管控效果的评价指标,得到原始数据集w0={x
ij
},i=1,2,

,80,j=1,2,

,136,其中共有80个样本及136个评价指标,x
ij
为第i个样本中第j个评价指标的数据;
[0068]
步骤1.2:统计136个蔬菜包发放前后疾病管控效果评价指标的数据缺失情况,计算各评价指标的数据缺失比例ηj,j=1,2,

,136;
[0069]
步骤1.3:判断评价指标数据的缺失比例ηj是否超过50%,如果是则直接剔除该评价指标,反之利用随机森林回归模型补充缺失值;
[0070]
步骤1.4:在原始数据集w0中,采用bootstrap采样方法有放回地随机抽取同样数量的样本,共进行n次采样;
[0071]
步骤1.5:得到n个样本子集作为训练集,并对n个训练集分别构建n棵决策树;
[0072]
步骤1.6:分别独立训练决策树模型,得到n棵决策树的回归预测结果;
[0073]
步骤1.7:将n棵决策树的回归预测结果的平均值作为随机森林回归模型的预测结果,并填充对应评价指标数据的缺失值;
[0074]
步骤1.9:得到包含38个发放蔬菜包前的疾病管控效果评价指标的数据集w1={a
yp
},y=1,2,

,25,p=1,2,

,38,及包含71个发放蔬菜包后的疾病管控效果评价指标的数据集w2={b
zq
},z=1,2,

,34,q=1,2,

,71,a
yp
为发放蔬菜包前第y个样本中第p个评价指标的数据,b
zq
为发放蔬菜包后第z个样本中第q个评价指标的数据,发放蔬菜包前的疾病管控效果评价指标共38个,发放蔬菜包后的疾病管控效果评价指标共71个,w1为发放蔬菜包前38个指标3月4日至3月28日期间的数据,即共有25个样本,w2为发放蔬菜包后38个指标3月29日至5月3日期间的数据,即共有36个样本;
[0075]
步骤2.1:对xgboost回归预测模型进行初始化,在指定参数范围内确定模型的初始参数;
[0076]
步骤2.2:将发放蔬菜包前、后的疾病管控效果评价指标数据集w1和w2分别均分为大小相同的5个样本子集w
1k
和w
2l
,k=1,2,3,4,5,l=1,2,3,4,5;
[0077]
步骤2.3:不重复地在w
1k
中选取一个样本子集为测试集,剩下的4个子集为训练集,同时在w
2l
中也不重复地选取一个样本子集为测试集,剩下的4个子集为训练集;
[0078]
步骤2.4:分别记录每个样本子集作为测试集时对应的均方根误差rmse
1k
和rmse
2l
,k=1,2,3,4,5,l=1,2,3,4,5;
[0079]
步骤2.5:分别计算5个测试集对应均方根误差rmse
1k
和rmse
2l
的平均值rmse1和rmse2:
[0080][0081]
步骤2.6:利用随机搜索确定最小均方根误差对应的超参数,并将其确定为xgboost回归预测模型的最优超参数;
[0082]
步骤2.7:基于最优超参数下发放蔬菜包前、后的xgboost回归预测模型,分别计算各评价指标的重要性得分importance
p
和importance
′q,p=1,2,

,38,q=1,2,

,71,;
[0083]
步骤2.8:分别对发放蔬菜包前、后的各评价指标重要性得分importance
p
和importance
′q进行大小排序;
[0084]
步骤2.9:分别在数据集w1和w2中选取重要性得分最大前9个评价指标作为蔬菜包发放前后疾病管控效果的最终评价指标,并将对应的重要性得分确定为模糊综合评价模型中的权重。得到数据集w1中重要性得分最大前9个评价指标分别为:大白菜单价、猪肉总储备量、超市数量、洋葱单价、粮食日进货量、生菜单价、萝卜单价、辣椒单价、粮食日出库量,数据集w2中重要性得分最大前9个评价指标分别为米目前库存量、蔬菜企业储备、面目前库存量、猪肉总储备量、蔬菜包接收量、西红柿单价、粮食总储备量、食用油总储备量、重点电商企业总订单数。
[0085]
步骤2.10:得到发放蔬菜包前疾病管控效果的9个评价指标数据集w3={c
ye
},及发放蔬菜包后疾病管控效果的9个评价指标的数据集w4={d
ze
},e=1,2,

,9,c
ye
为发放蔬菜包前第y个样本中第e个评价指标数据,d
ze
为发放蔬菜包后第z个样本中第e个评价指标数据;
[0086]
步骤3.1:确定发放蔬菜包前、后疾病管控效果的模糊综合评价模型的因素集u和u

分别为:
[0087]
u={u1,u2,

,ue,

,u9},u

={u
′1,u
′2,

,u
′e,

,u
′9},
[0088]
其中,ue为第e个发放蔬菜包前的疾病管控效果评价指标,u
′e为第e个发放蔬菜包后的疾病管控效果评价指标,e=1,2,

,9;
[0089]
步骤3.2:确定发放蔬菜包前、后疾病管控效果的评语集为v:
[0090]
v={v1,v2,v3,v4},
[0091]
其中,v1为优等效果,v2为良等效果,v3为中等效果,v4为差等效果;
[0092]
步骤3.3:分析评价指标数据与评语集的隶属关系,其中数据越大疾病管控效果越好的评价指标与评语集存在相同的隶属关系,而数据越大疾病管控效果越差的评价指标与评语集存在相反的隶属关系,例如蔬菜单价越低,疾病管控效果越好;
[0093]
步骤3.4:确定发放蔬菜包前、后疾病管控效果评价指标ue和u
′e的重要性得分为各因素的权重值,得到发放蔬菜包前疾病管控效果的9个因素的权重向量和发放蔬菜包后疾病管控效果的9个因素的权重向量
[0094]
步骤3.5:根据数据集w3和w4,对与评语集存在相反隶属关系的评价指标ue的数据x进行正向化处理:
[0095][0096]
其中,为正则化处理后的评价指标数据,max为该评价指标的样本数据中的最大值,特别地当指标数据恰好等于最大值时,其正向化处理后的值为0;
[0097]
步骤3.6:将因素集中各因素分为两类,用不同的隶属度函数计算隶属度,对于蔬菜单价,基于三角隶属度函数计算隶属度,对于其他因素,基于梯形隶属度函数计算隶属度。针对发放蔬菜包前的评价指标,对于梯形隶属度函数,以超市数量(u1)为例:
[0098][0099][0100]
针对发放蔬菜包前的评价指标,对于三角隶属度函数,以大白菜价格(u2)为例:
[0101][0102]
其中,


(u1)、μ

(u1)、μ

(u1)、μ

(u1)分别为超市数量的优、良、中、差效果对应的隶属度函数,μ

(u2)、μ

(u2)、
[0103]
μ

(u2)、μ

(u2)分别为大白菜价格的优、良、中、差效果对应的隶属度函数;
[0104]
步骤3.7:分别确定发放蔬菜包前、后疾病管控效果的模糊综合评价模型的隶属度矩阵r9×4和r
′9×4,其矩阵元素r
em
和re′m分别为:
[0105]rem
=μm(ue),re′m=μ
′m(u
′e),
[0106]
其中,μm(
·
)为发放蔬菜包前各因素的隶属度函数,μ
′m(
·
)为发放蔬菜包后各因素的隶属度函数,e=1,2,

,9,m=1,2,3,4分别对应优、良、中、差评价等级;
[0107]
步骤3.8:计算发放蔬菜包前、后疾病管控效果模糊综合评价结果向量和分别为:
[0108][0109]
步骤3.9:分别选取结果向量和中数值最大的评价值,并将该值所对应的评语作为最终发放蔬菜包前、后疾病管控效果的模糊综合评价结果。
[0110]
因此,根据发放蔬菜包前、后的模糊综合评价模型,得到3月4日至5月3日期间每日的疾病管控效果评价结果,得到发放蔬菜包后优等和良等评价结果比例均有一定程度的增加,而发放蔬菜包后中等和差等评价结果比例均有一定幅度的减少。虽然疫情封闭管理期间居民无法出门直接购买生活必需品,但长春市通过发放蔬菜包保障了居民的生活需求,加快复商复市进程,一定程度上有效遏止疾病蔓延。同时,重大疫情封闭期间,发放蔬菜包的形式能有效减少人员聚集,阻断病情传播,为国家进一步有效管理疫情提供借鉴。
[0111]
本实施例中涉及到的符号含义说明如表所示:
[0112]
[0113]
[0114][0115]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于极端梯度提升算法的疾病管控模糊综合评价方法,其特征在于,包括以下步骤:s1:数据获取与预处理;s2:利用极端梯度提升(xgboost)算法计算特征重要性,并采用随机搜索和五折交叉验证确定极端梯度提升算法模型超参数,最终分别确定发放蔬菜包前、后疾病管控效果的评价指标;s3:分别构建发放蔬菜包前、后疾病管控效果的模糊综合评价模型。2.根据权利要求1所述的基于极端梯度提升算法的疾病管控模糊综合评价方法,其特征在于:所述步骤s1具体包括以下步骤:步骤1.1:根据covid-19疫情期间病例数据、生活物资数据和蔬菜包数据,从生活物资、线上线下商铺、重点民生商品、蔬菜包、粮油副食品及企业六方面,筛选j个特征项作为蔬菜包发放前后疾病管控效果的评价指标,得到原始数据集w0={x
ij
},i=1,2,

,i,j=1,2,

,j,其中i和j分别表示样本数和评价指标数,x
ij
为第i个样本中第j个评价指标的数据;步骤1.2:统计j个蔬菜包发放前后疾病管控效果评价指标的数据缺失情况,计算各评价指标的数据缺失比例η
j
,j=1,2,

,j;步骤1.3:判断评价指标数据的缺失比例η
j
是否超过50%,如果是则直接剔除该评价指标,反之利用随机森林回归模型补充缺失值;步骤1.4:在原始数据集w0中,采用bootstrap采样方法有放回地随机抽取同样数量的样本,共进行n次采样;步骤1.5:得到n个样本子集作为训练集,并对n个训练集分别构建n棵决策树;步骤1.6:分别独立训练决策树模型,得到n棵决策树的回归预测结果;步骤1.7:将n棵决策树的回归预测结果的平均值作为随机森林回归模型的预测结果,并填充对应评价指标数据的缺失值;步骤1.9:得到包含m个发放蔬菜包前的疾病管控效果评价指标的数据集w1={a
yp
},y=1,2,

,y,p=1,2,

,m,及包含n个发放蔬菜包后的疾病管控效果评价指标的数据集w2={b
zq
},z=1,2,

,z,q=1,2,

,n,a
yp
为发放蔬菜包前第y个样本中第p个评价指标的数据,b
zq
为发放蔬菜包后第z个样本中第q个评价指标的数据,m为发放蔬菜包前的疾病管控效果评价指标个数,n为发放蔬菜包后的疾病管控效果评价指标个数,y为发放蔬菜包前样本数,z为发放蔬菜包后样本数。3.根据权利要求1所述的基于极端梯度提升算法的疾病管控模糊综合评价方法,其特征在于:所述步骤s2具体包括以下步骤:步骤2.1:对xgboost回归预测模型进行初始化,在指定参数范围内确定模型的初始参数;步骤2.2:将发放蔬菜包前、后的疾病管控效果评价指标数据集w1和w2分别均分为大小相同的5个样本子集w
1k
和w
2l
,k=1,2,3,4,5,l=1,2,3,4,5;步骤2.3:不重复地在w
1k
中选取一个样本子集为测试集,剩下的4个子集为训练集,同时在w
2l
中也不重复地选取一个样本子集为测试集,剩下的4个子集为训练集;步骤2.4:分别记录每个样本子集作为测试集时对应的均方根误差rmse
1k
和rmse
2l
,k=1,2,3,4,5,l=1,2,3,4,5;
步骤2.5:分别计算5个测试集对应均方根误差rmse
1k
和rmse
2l
的平均值rmse1和rmse2:步骤2.6:利用随机搜索确定最小均方根误差对应的超参数,并将其作为xgboost回归预测模型的最优超参数;步骤2.7:基于最优超参数下发放蔬菜包前、后的xgboost回归预测模型,分别计算各评价指标的重要性得分importance
p
和importance

q
,p=1,2,

,m,q=1,2,

,n,m为发放蔬菜包前的效果评价指标数,n为发放蔬菜包后的效果评价指标数;步骤2.8:分别对发放蔬菜包前、后的各评价指标重要性得分importance
p
和importance

q
进行大小排序;步骤2.9:分别在数据集w1和w2中选取重要性得分最大前9个评价指标作为蔬菜包发放前后疾病管控效果的最终评价指标,并将对应的重要性得分确定为模糊综合评价模型中的权重。步骤2.10:得到发放蔬菜包前疾病管控效果的9个评价指标数据集w3={c
ye
},及发放蔬菜包后疾病管控效果的9个评价指标的数据集w4={d
ze
},e=1,2,

,9,c
ye
为发放蔬菜包前第y个样本中第e个评价指标数据,d
ze
为发放蔬菜包后第z个样本中第e个评价指标数据。4.根据权利要求1所述的基于极端梯度提升算法的疾病管控模糊综合评价方法,其特征在于:所述步骤s3具体包括以下步骤:步骤3.1:确定发放蔬菜包前、后疾病管控效果的模糊综合评价模型的因素集u和u

分别为:u={u1,u2,

,u
e
,

,u9},u

={u
′1,u
′2,

,u

e
,

,u
′9},其中,u
e
为第e个发放蔬菜包前的疾病管控效果评价指标,u

e
为第e个发放蔬菜包后的疾病管控效果评价指标,e=1,2,

,9;步骤3.2:确定发放蔬菜包前、后疾病管控效果的评语集为v:v={v1,v2,v3,v4},其中,v1为优等效果,v2为良等效果,v3为中等效果,v4为差等效果;步骤3.3:分析评价指标数据与评语集的隶属关系,其中数据越大疾病管控效果越好的评价指标与评语集存在相同的隶属关系,而数据越大疾病管控效果越差的评价指标与评语集存在相反的隶属关系;步骤3.4:确定发放蔬菜包前、后疾病管控效果评价指标u
e
和u

e
的重要性得分为各因素的权重值,得到发放蔬菜包前疾病管控效果的9个因素的权重向量和发放蔬菜包后疾病管控效果的9个因素的权重向量步骤3.5:根据数据集w3和w4,对与评语集存在相反隶属关系的评价指标u
e
的数据x进行正向化处理:其中,为正则化处理后的评价指标数据,max为该评价指标的样本数据中的最大值,特别地当指标数据恰好等于最大值时,其正向化处理后的值为0;步骤3.6:将因素集中各因素分为两类,用不同的隶属度函数计算隶属度,对于蔬菜单价,基于三角隶属度函数计算隶属度,对于其他因素,基于梯形隶属度函数计算隶属度;
步骤3.7:分别确定发放蔬菜包前、后疾病管控效果的模糊综合评价模型的隶属度矩阵r9×4和r
′9×4,其矩阵元素r
em
和r
e

m
分别为:r
em
=μ
m
(u
e
),r
e

m
=μ

m
(u

e
),其中,μ
m
(
·
)为发放蔬菜包前各因素的隶属度函数,μ

m
(
·
)为发放蔬菜包后各因素的隶属度函数,e=1,2,

,9,m=1,2,3,4分别对应优、良、中、差评价等级;步骤3.8:计算发放蔬菜包前、后疾病管控效果模糊综合评价结果向量和分别为:步骤3.9:分别选取结果向量和中数值最大的评价值,并将该值所对应的评语作为最终发放蔬菜包前、后疾病管控效果的模糊综合评价结果。

技术总结
本发明提供了一种基于极端梯度提升算法的疾病管控模糊综合评价方法,属于疫情管理与控制技术领域,解决了目前未考虑使用随机搜索和五折交叉验证结合的方法迭代确定极端梯度提升(XGBoost)算法模型的最优超参数的问题,其技术方案为:包含以下步骤:S1:数据获取与预处理;S2:确定发放蔬菜包前、后疾病管控效果的评价指标;S3:分别构建发放蔬菜包前、后疾病管控效果的模糊综合评价模型。本发明的有益效果是:本发明设计的模糊分析方法会采用随机搜索和五折交叉验证结合的方法自动确定XGBoost回归模型的最优超参数,以使得模型在最小均方差根误差的基础上筛选出有显著贡献的评价指标。根误差的基础上筛选出有显著贡献的评价指标。根误差的基础上筛选出有显著贡献的评价指标。


技术研发人员:黄欣 覃文智 杨婧 梅子燕 赵敏
受保护的技术使用者:南通大学
技术研发日:2023.04.03
技术公布日:2023/9/23
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐