一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法与流程

未命名 09-24 阅读:73 评论:0


1.本发明涉及妊娠期疾病检测技术领域,具体涉及一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法。


背景技术:

2.妊娠期疾病,如妊娠期糖尿病、妊娠期高血压和子痫前期等,在影响母亲健康的同时,容易增加后代患长期代谢疾病和心血管疾病的风险,尽管其高发病率和并发症会严重影响妊娠结局,例如妊娠期糖尿病通常在妊娠24周后被诊断和检测出来,而其引起的并发症可能发生得更早,晚期诊断和检测将增加不可逆转的不良妊娠结局的风险。
3.中国专利申请号为cn111370121a公开了一种早孕期非整倍体产前筛查标志物预测妊娠期高血压疾病的风险模型建立方法,包括如下步骤:(1)、根据有无妊娠期高血压gh、子痫前期pe和重度子痫前期组spe将孕妇分为三个病例组和一个对照组,纳入三个病例组分别是指经临床确诊妊娠期高血压gh、子痫前期pe和重度子痫前期组spe的孕妇,对照组为随机抽取同时期胎儿发育正常的孕妇;(2)、检测4组孕妇血清标本papp-a、freeβ-hcg水平和胎儿nt厚度;(3)、检测孕妇血清标本papp-a、freeβ-hcg水平和胎儿nt厚度。
4.现有技术在早期妊娠阶段检测妊娠期疾病的一致诊断标准仍然缺失,现有的检测妊娠期早期疾病的方法有以下几种:双胎妊娠筛查、羊水穿刺、绒毛膜活检、心脏超声检查、葡萄糖负荷试验gct,针对妊娠期糖尿病和葡萄糖耐量试验ogtt,但是现有的检测妊娠期早期疾病的方法还存在以下缺陷或不足:
5.(1)检测时间晚,如对于妊娠期糖尿病,现有技术只能在妊娠24周后才检测出来,时间较晚;
6.(2)检测方法步骤繁琐;
7.(3)检测准确度待提高;
8.(4)通常针对胎儿,而对产妇疾病诊断效果有限,
9.综上所述,研发一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,仍是妊娠期疾病检测技术领域中急需解决的关键问题。


技术实现要素:

10.针对现有技术所存在的问题,本发明的目的在于提供一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,本发明提出了一个基于cnn的深度学习模型,用于在早期妊娠8-12周阶段,对妊娠期疾病进行分类,且检测方法步骤简化,该模型的分类准确率为88.34%,准确率为93.76%,召回率为94.62%,解决了现有技术只能在妊娠24周后才能检测出来妊娠期疾病的问题,具有早期妊娠阶段检测gdm的诊断标准,检测准确度高,且检测面向产妇,解决了现有的妊娠期疾病检测通常针对胎儿,而对产妇疾病诊断效果有限的弊端。
11.为实现上述目的,本发明提供了如下技术方案:
12.一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,包括以下步骤:
13.s1、基于cnn的深度学习模型,使用验证数据集的混淆矩阵来衡量分类模型的性能;
14.s2、样本训练及测试;
15.s3、构建神经网络;
16.s4、出具报告。
17.本发明进一步设置为:在步骤s1中,对于二元分类模型,所述混淆矩阵是具有真阳性(tp)病例、真阴性(tn)病例、假阳性(fp)病例和假阴性(fn)病例的比率的22矩阵,从混淆矩阵中进一步计算准确度、精确度、召回率和f1得分。
18.本发明进一步设置为:在步骤s1中,所述准确度是指正确预测的病例百分比,所述精确度是指正确预测的预测阳性病例百分比,所述召回率是指正确预测的实际阳性病例百分比,所述f1得分是指精确度和召回率的调和平均值。
19.本发明进一步设置为:在步骤s2中,所述样本训练及测试,包括以下步骤:
20.s21、收集18950名怀孕6-13周孕妇的血液样本,经过处理后,训练模型利用75%样本进行训练,5%样本进行验证,20%样本进行测试;
21.s22、模型性能与窗口大小相关:在分辨cnv时,较小的窗口提供较大的窗口大小;
22.s23、当窗口大小为10k时,该模型提供了大约86%的最佳验证准确度,当较小的窗口尺寸引入更多的候选窗口作为特征时,该模型倾向于与由窗口尺寸5k生成的数据集过度拟合;
23.s24、执行bootstrapping来评估模型的鲁棒性,在每个窗口大小上进行了10000次实验。
24.本发明进一步设置为:在步骤s3中,所述构建神经网络,包括以下步骤:
25.s31、构建了一个基于cnn的深度神经网络,带有一个自注意层来实现二分类,输入层将矩阵传递到两个1-d卷积层,每个卷积层后面都有一个最大池层;
26.s32、在卷积层之后,建立了一个自我关注层,一个自我关注层被加入以连接最后的卷积池层和密集层;
27.s33、然后将压差为0.4的两个完全连接的致密层连接到关注层。
28.本发明进一步设置为:在步骤s4中,所述出具报告,包括以下步骤:
29.s41、利用注意力结构在二元分类任务中处理了具有最显著辨别能力的前5000个基因组区域;
30.s42、在妊娠早期鉴定了2675个与gdm相关的基因;
31.s43、该模型的分类准确率为88.34%,准确率为93.76%,召回率为94.62%,f1值为92.38%,auc为98.07%。
32.本发明进一步设置为:在步骤s42中,所述gdm相关的基因包括defa1、defa3和defb1。
33.本发明进一步设置为:在步骤s42中,sigmoid被用作输出层的激活函数,以指示输入样本是否来自妊娠期疾病患者。
34.有益效果
35.采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:
36.(1)本发明中,提出了一个基于cnn的深度学习模型,用于在早期妊娠阶段(8-12周)对妊娠期疾病进行分类,且检测方法步骤简化,该模型的分类准确率为88.34%,准确率为93.76%,召回率为94.62%,并且能够实现在早期(12-16周)妊娠阶段检测妊娠期疾病,解决了现有技术只能在妊娠24周后才能检测出来妊娠期疾病的问题。
37.(2)本发明中,该早期妊娠阶段对妊娠期糖尿病进行分类的方法,具有早期妊娠阶段检测gdm的诊断标准,检测准确度高,且检测面向产妇,解决了现有的妊娠期疾病检测通常针对胎儿,而对产妇疾病诊断效果有限的弊端。
附图说明
38.图1为一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法的不同窗口大小下的学习绩效模型曲线图;
39.图2为一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法的根据测试数据建立性能模型曲线图;
40.图3为一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法的流程图。
具体实施方式
41.为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
42.下面结合实施例对本发明作进一步的描述。
43.请参照图1-图3所示,一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,包括以下步骤:
44.步骤一、基于cnn的深度学习模型,使用验证数据集的混淆矩阵来衡量分类模型的性能;
45.其中,对于二元分类模型,混淆矩阵是具有真阳性(tp)病例、真阴性(tn)病例、假阳性(fp)病例和假阴性(fn)病例的比率的22矩阵,从混淆矩阵中进一步计算准确度、精确度、召回率和f1得分,准确度是指正确预测的病例百分比,精确度是指正确预测的预测阳性病例百分比,召回率是指正确预测的实际阳性病例百分比,f1得分是指精确度和召回率的调和平均值。
46.步骤二、样本训练及测试:
47.21)收集18950名怀孕6-13周孕妇的血液样本,经过处理后,训练模型利用75%样本进行训练,5%样本进行验证,20%样本进行测试;
48.22)模型性能与窗口大小相关:在分辨cnv时,较小的窗口提供较大的窗口大小;
49.23)当窗口大小为10k时,该模型提供了大约86%的最佳验证准确度,当较小的窗口尺寸引入更多的候选窗口作为特征时,该模型倾向于与由窗口尺寸5k生成的数据集过度拟合;
50.24)执行bootstrapping来评估模型的鲁棒性,在每个窗口大小上进行了10000次实验。
51.步骤三、构建神经网络:
52.31)构建了一个基于cnn的深度神经网络,带有一个自注意层来实现二分类,输入层将矩阵传递到两个1-d卷积层,每个卷积层后面都有一个最大池层;
53.32)在卷积层之后,建立了一个自我关注层,一个自我关注层被加入以连接最后的卷积池层和密集层;
54.33)然后将压差为0.4的两个完全连接的致密层连接到关注层。
55.步骤四、出具报告:
56.41)利用注意力结构在二元分类任务中处理了具有最显著辨别能力的前5000个基因组区域;
57.42)在妊娠早期鉴定了2675个与gdm相关的基因,gdm相关的基因包括defa1、defa3和defb1,sigmoid被用作输出层的激活函数,以指示输入样本是否来自妊娠期疾病患者;
58.43)该模型的分类准确率为88.34%,准确率为93.76%,召回率为94.62%,f1值为92.38%,auc为98.07%。
59.本发明中,该早期妊娠阶段对妊娠期糖尿病进行分类的方法主要由以下几个部分组成:
60.(1)使用验证数据集的混淆矩阵来衡量分类模型的性能:对于二元分类模型,混淆矩阵是具有真阳性(tp)病例、真阴性(tn)病例、假阳性(fp)病例和假阴性(fn)病例的比率的22矩阵,从混淆矩阵中进一步计算准确度、精确度、召回率和f1得分;
61.(2)样本训练及测试:收集18950名怀孕6-13周孕妇的血液样本,经过处理后,训练模型利用75%样本进行训练,5%样本进行验证,20%样本进行测试;
62.图1a-d窗口大小分别为50k、20k、10k和5k的学习准确度曲线,图1e-f分别针对窗口大小50k、20k、10k和5k的学习损失曲线,不同窗口大小的学习和损失曲线如图1所示,可以观察到模型性能与窗口大小相关:在分辨cnv时,较小的窗口提供较大的窗口大小,如图1a-d所示,该模型在第10至40代左右开始收敛,当窗口大小为10k时,该模型提供了大约86%的最佳验证准确度,当较小的窗口尺寸引入更多的候选窗口作为特征时,该模型倾向于与由窗口尺寸5k生成的数据集过度拟合,图1e-h所示的训练损失与学习曲线有相似的结果,图1a-d展示了不同窗口大小生成的数据集的roc曲线,结果与通过验证数据获得的学习曲线一致,即当窗口大小为5k时,模型达到最佳性能,当窗口大小为5k时,模型的准确率为93.76%,敏感度为94.62%,召回率为90.24%,f1值为92.38%;
63.最后执行了bootstrapping来评估模型的鲁棒性,在每个窗口大小上进行了10000次实验,图2a-d窗口大小分别为50k、20k、10k和5k的roc曲线,图2e在10000次引导实验中10k窗口大小的auc分布,图2f自举实验中不同窗口大小的auc,图2e和图2f展示了模型与测试数据随机抽样的性能,图2e中的箱线图显示了不同窗口尺寸下的auc,窗口大小5k在实验中提供了最好的auc和最小的变化,图2f显示了窗口大小为10k的auc在实验中的分布,密度以[0.952,0.968]为95%置信区间形成正态分布;
[0064]
(3)构建神经网络:构建了一个基于cnn的深度神经网络,带有一个自注意层来实现二分类,输入层将矩阵传递到两个1-d卷积层,每个卷积层后面都有一个最大池层,在卷积层之后,本发明建立了一个自我关注层,一个自我关注层被加入以连接最后的卷积池层和密集层,然后将压差为0.4的两个完全连接的致密层连接到关注层;
[0065]
(4)出具报告:该模型的分类准确率为88.34%,准确率为93.76%,召回率为94.62%,f1值为92.38%,auc为98.07%,利用注意力结构在二元分类任务中处理了具有最显著辨别能力的前5000个基因组区域,在妊娠早期鉴定了2675个与gdm相关的基因,sigmoid被用作输出层的激活函数,以指示输入样本是否来自妊娠期疾病患者。
[0066]
本发明中,一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,提出了一个基于cnn的深度学习模型,用于在早期妊娠阶段(8-12周)对妊娠期疾病进行分类,且检测方法步骤简化,该模型的分类准确率为88.34%,准确率为93.76%,召回率为94.62%,并且能够实现在早期(12-16周)妊娠阶段检测妊娠期疾病,解决了现有技术只能在妊娠24周后才能检测出来妊娠期疾病的问题,同时具有早期妊娠阶段检测gdm的诊断标准,检测准确度高,检测面向产妇,解决了现有的妊娠期疾病检测通常针对胎儿,而对产妇疾病诊断效果有限的弊端。
[0067]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:
1.一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,其特征在于,包括以下步骤:s1、基于cnn的深度学习模型,使用验证数据集的混淆矩阵来衡量分类模型的性能;s2、样本训练及测试;s3、构建神经网络;s4、出具报告。2.根据权利要求1所述的一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,其特征在于,在步骤s1中,对于二元分类模型,所述混淆矩阵是具有真阳性(tp)病例、真阴性(tn)病例、假阳性(fp)病例和假阴性(fn)病例的比率的22矩阵,从混淆矩阵中进一步计算准确度、精确度、召回率和f1得分。3.根据权利要求2所述的一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,其特征在于,在步骤s1中,所述准确度是指正确预测的病例百分比,所述精确度是指正确预测的预测阳性病例百分比,所述召回率是指正确预测的实际阳性病例百分比,所述f1得分是指精确度和召回率的调和平均值。4.根据权利要求1所述的一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,其特征在于,在步骤s2中,所述样本训练及测试,包括以下步骤:s21、收集18950名怀孕6-13周孕妇的血液样本,经过处理后,训练模型利用75%样本进行训练,5%样本进行验证,20%样本进行测试;s22、模型性能与窗口大小相关:在分辨cnv时,较小的窗口提供较大的窗口大小;s23、当窗口大小为10k时,该模型提供了大约86%的最佳验证准确度,当较小的窗口尺寸引入更多的候选窗口作为特征时,该模型倾向于与由窗口尺寸5k生成的数据集过度拟合;s24、执行bootstrapping来评估模型的鲁棒性,在每个窗口大小上进行了10000次实验。5.根据权利要求1所述的一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,其特征在于,在步骤s3中,所述构建神经网络,包括以下步骤:s31、构建了一个基于cnn的深度神经网络,带有一个自注意层来实现二分类,输入层将矩阵传递到两个1-d卷积层,每个卷积层后面都有一个最大池层;s32、在卷积层之后,建立了一个自我关注层,一个自我关注层被加入以连接最后的卷积池层和密集层;s33、然后将压差为0.4的两个完全连接的致密层连接到关注层。6.根据权利要求1所述的一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,其特征在于,在步骤s4中,所述出具报告,包括以下步骤:s41、利用注意力结构在二元分类任务中处理了具有最显著辨别能力的前5000个基因组区域;s42、在妊娠早期鉴定了2675个与gdm相关的基因;s43、该模型的分类准确率为88.34%,准确率为93.76%,召回率为94.62%,f1值为92.38%,auc为98.07%。7.根据权利要求6所述的一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,其
特征在于,在步骤s42中,所述gdm相关的基因包括defa1、defa3和defb1。8.根据权利要求6所述的一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法,其特征在于,在步骤s42中,sigmoid被用作输出层的激活函数,以指示输入样本是否来自妊娠期疾病患者。

技术总结
本发明涉及妊娠期疾病检测技术领域,具体涉及一种在早期妊娠阶段对妊娠期早期疾病进行分类的方法;S1、基于CNN的深度学习模型,使用验证数据集的混淆矩阵来衡量分类模型的性能,S2、样本训练及测试,S3、构建神经网络,S4、出具报告。本发明提出了一个基于CNN的深度学习模型,用于在早期妊娠8-12周阶段,对妊娠期疾病进行分类,且检测方法步骤简化,该模型的分类准确率为88.34%,准确率为93.76%,召回率为94.62%,解决了现有技术只能在妊娠24周后才能检测出来妊娠期疾病的问题,具有早期妊娠阶段检测GDM的诊断标准,检测准确度高,且检测面向产妇,解决了现有的妊娠期疾病检测通常针对胎儿,而对产妇疾病诊断效果有限的弊端。而对产妇疾病诊断效果有限的弊端。而对产妇疾病诊断效果有限的弊端。


技术研发人员:赵梓丞
受保护的技术使用者:奥迈(深圳)科技有限公司
技术研发日:2023.07.07
技术公布日:2023/9/22
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐