一种共病模式下的潜在不适当用药检测方法
未命名
08-02
阅读:96
评论:0

1.本发明涉及医学信息处理技术领域,特别是涉及一种共病模式下的潜在不适当用药检测方法。
背景技术:
2.随着社会经济的发展和医疗水平的提高,人均寿命延长,老龄化问题加重。老年人作为一个特殊的群体,常伴有多种慢性疾病,多科就诊、多重用药现象普遍,加之衰老引起的药代动力学和药效学改变影响了药物在体内的吸收、分布和代谢过程,使得老年患者更容易发生药物治疗的相关问题,导致不良反应增多,入院率增高,相关医疗成本也增加。因此,研究潜在不适当用药(potentially inappropriate medication,pim)检测方法,对于减少和预防药物不良反应的发生具有重要意义。
3.目前,主要利用机器学习方法进行潜在不适当用药预测,然而,传统的机器学习模型对数据有较强的依赖性,在真实情况下,绝大部分潜在不适当用药情况发生率低,样本量少,数据驱动的方法缺乏可靠性。
技术实现要素:
4.针对现有技术中的上述不足,本发明提供的一种共病模式下的潜在不适当用药检测方法解决了在进行潜在不适当用药预测过程中传统机器学习模型对数据存在较强依赖性,以及传统检测方法不可靠的问题。
5.为了达到上述发明目的,本发明采用的技术方案为:一种共病模式下的潜在不适当用药检测方法,包括以下步骤:
6.s1:对原始病历数据进行处理,获得训练后的机器学习模型;
7.s2:根据药物标准中潜在不适当用药的相关因素构建知识图谱,建立基于原始特征的知识图谱路径推理模型;
8.s3:将机器学习模型的预测结果和知识图谱路径推理模型的推理结果进行结合,获得潜在不适当用药检测结果。
9.上述方案的有益效果是:本方案通过利用机器学习方法获得数据特征之间的关系,并引入知识图谱推理模型,弥补了机器学习的不足,同时增加了预测结果的准确性,减少了机器学习对数据的依赖性,有效的解决了进行潜在不适当用药预测过程中传统机器学习模型对数据存在较强依赖性,以及传统检测方法不可靠的问题。
10.进一步地,s1中包括以下分步骤:
11.s1-1:将原始病历数据预处理后形成原始特征;
12.s1-2:对原始特征进行向量化编码,获得特征向量;
13.s1-3:将特征向量输入机器学习模型进行训练,获得训练后的机器学习模型。
14.上述进一步方案的有益效果是:通过对获得的原始数据进行预处理和向量化编码,得到特征向量,用于训练机器学习模型,从而获得训练后的机器学习模型。
15.进一步地,s1-2中对原始特征进行向量化编码包括以下分步骤:
16.s1-2-1:利用正则表达式抽取诊断字段中的疾病名称;
17.s1-2-2:对诊断字段中的疾病名称和药品通用名多值类别特征进行one-hot编码。
18.上述进一步方案的有益效果是:由于诊断和药物通用名都属于多值类别特征,不同患者包括不同数量的疾病和药物,具有不定长的特点,因此采用one-hot编码实现向量化编码。
19.进一步地,s1-3中将特征向量输入机器学习模型进行训练中针对多标签情况,建立分类器链模型用于学习多个潜在不适当用药标签之间的关联性。
20.上述进一步方案的有益效果是:通过建立分类器链模型能够高效且准确的学习标签之间的关联性,解决了患者处方中存在多标签的问题。
21.进一步地,分类器链模型采用catboost模型作为基学习器。
22.上述进一步方案的有益效果是:通过上述技术方案,采用catboost模型作为基学习器,能够捕获药物、疾病等二值特征之间的高阶依赖关系。
23.进一步地,s2中构建知识图谱包括采用自顶向下的方式进行构建,包括模式层构建和实例层构建,所述模式层构建为对药物和疾病关系进行抽象和归纳,并将风险因素和潜在不适当用药进行关联,获得知识图谱本体结构。
24.上述进一步方案的有益效果是:通过上述技术方案,对风险因素和潜在不适当用药关联,得到知识图谱本体结构,完成知识图谱中模式层的构建。
25.进一步地,实例层构建为根据知识图谱本体结构抽取药物标准中的实体和关系,整理成结构化的三元组数据,并存储到neo4j图数据库中,所述潜在不适当用药使用知识图谱中的实体节点pim节点表示,同时增加知识图谱中的另一个实体节点fact节点作为中间节点,用于关联每种潜在不适当用药情况下的pim节点和风险因素节点。
26.上述进一步方案的有益效果是:通过上述技术方案,完成知识图谱中实例层的构建。
27.进一步地,s2中建立基于原始特征的知识图谱路径推理模型包括以下分步骤:
28.s2-1:将原始特征转换为特征词列表;
29.s2-2:在知识图谱中匹配特征词列表,得到起始节点集合start;
30.s2-3:找到所有能从start到达的fact节点,并加入候选集合candidate;
31.s2-4:根据start中节点到达fact节点的路径上最后一条边的关系,对candicade集合中的节点进行筛选:如果关系为排除,剔除相应的fact节点,否则记录fact节点的前驱节点集合pre;
32.s2-5:依次判断candidate中剩余fact节点的所有关系为构成的前驱节点,是否均包含于pre集合中,若满足条件,则潜在不适当用药情况的所有构成因素均存在;
33.s2-6:根据步骤s2-5中满足条件的fact节点,获取并返回对应pim节点的潜在不适当用药编号属性值,完成知识图谱路径推理模型的建立。
34.上述进一步方案的有益效果是:通过上述技术方案,根据转换的特征词列表,进行潜在不适当用药搜索,从而建立知识图谱路径推理模型。
35.进一步地,s3中获得最终决策包括将潜在不适当用药标签的预测结果和潜在不适当用药标签的推理结果进行结合,通过设定一个样本量阈值,当样本量低于阈值,输出知识
图谱路径推理模型的结果,否则输出机器学习模型的预测结果。
36.上述进一步方案的有益效果是:通过将潜在不适当用药标签的预测结果和推理结果结合,减少机器学习模型的数据依赖问题,实现了较高的整体准确率,同时对于低频潜在不适当用药的预测能力也显著提升。
附图说明
37.图1为一种共病模式下的潜在不适当用药检测方法流程图。
具体实施方式
38.下面结合附图和具体实施例对本发明做进一步说明。
39.如图1所示,一种共病模式下的潜在不适当用药检测方法,包括以下步骤:
40.s1:对原始病历数据进行处理,获得训练后的机器学习模型;
41.s2:根据药物标准中潜在不适当用药的相关因素构建知识图谱,建立基于原始特征的知识图谱路径推理模型;
42.s3:将机器学习模型的预测结果和知识图谱路径推理模型的推理结果进行结合,获得潜在不适当用药检测结果。
43.s1中包括以下分步骤:
44.s1-1:将原始病历数据预处理后形成原始特征;
45.s1-2:对原始特征进行向量化编码,获得特征向量;
46.s1-3:将特征向量输入机器学习模型进行训练,获得训练后的机器学习模型。
47.s1-2中对原始特征进行向量化编码包括以下分步骤:
48.s1-2-1:利用正则表达式抽取诊断字段中的疾病名称;
49.s1-2-2:对诊断字段中的疾病名称和药品通用名多值类别特征进行one-hot编码。
50.在本发明的一个实施例中,从医疗机构老年科获取65岁以上门诊患者处方数据,包括年龄、性别、诊断、药品通用名等,排除信息缺失或不完整的记录;在本实施例中,以2019版beers标准作为潜在不适当用药判断标准,其中包括99条药物内容,由两名专业医生对患者处方进行独立审查并标注存在的潜在不适当用药情况对应的编号,存在分歧时由第三名医生做出决定;考虑到老年患者共病现象普遍,而多重用药会显著增加药物的相互作用和药物不良反应风险,在特征中加入疾病数量和药物数量,得到原始特征;原始特征包含药物名称、疾病名称等文本内容,需要进行向量化,得到的数值特征用于训练机器学习模型。诊断和药品通用名都属于多值类别特征,不同患者包含不同数量的疾病和药物,具有不定长的特点;因此,在本实施例中采用one-hot方法实现向量化编码。
51.s1-3中将特征向量输入机器学习模型进行训练中针对多标签情况,建立分类器链模型用于学习多个潜在不适当用药标签之间的关联性。
52.分类器链模型采用catboost模型作为基学习器。
53.一个患者处方中可能存在多种潜在不适当用药情况对应的编号,同时不同的潜在不适当用药之间具有一定的相关性,在本实施例中,针对多标签问题,建立分类器链模型用于学习标签之间的关联性;为了捕获药物、疾病等二值特征之间的高阶依赖关系,采用catboost模型作为分类器链的基学习器,其在子树分裂时,将之前用于分裂的类别特征和
数据集中原有的所有类别特征进行组合,构造新的特征。
54.s2中构建知识图谱包括采用自顶向下的方式进行构建,包括模式层构建和实例层构建,所述模式层构建为对药物和疾病关系进行抽象和归纳,并将风险因素和潜在不适当用药进行关联,获得知识图谱本体结构。
55.在本实施例中,以2019版beers标准作为潜在不适当用药判断依据;通过分析beers标准中潜在不适当用药的有关因素,经过抽象和整理,确定药物、疾病、人群和潜在不适当用药四大类概念;概念属性包括药物类别、疾病类别、年龄、性别、潜在不适当用药编号;概念关系包括别名、属于类别、性别、年龄、构成、排除;其中“别名”关系存在于不同药物之间、不同药物类别之间、不同疾病之间、不同疾病类别之间;性别、年龄、药物、药物类别、疾病、疾病类别均属于风险因素,在潜在不适当用药和风险因素之间建立“构成”或“排除”关系,从而够将潜在不适当用药的判定条件加入到知识图谱中,便于进行推理。
56.实例层构建为根据知识图谱本体结构抽取药物标准中的实体和关系,整理成结构化的三元组数据,并存储到neo4j图数据库中,所述潜在不适当用药使用知识图谱中的实体节点pim节点表示,同时增加知识图谱中的另一个实体节点fact节点作为中间节点,用于关联每种潜在不适当用药情况下的pim节点和风险因素节点。
57.在本实施例中,从beers标准中整理出提及的药物和疾病以及对应的类别;在本实施例中,为了增加知识的完整性,再从医药网站中收集与这些药物和疾病相关的其他名称和分类信息;不同数据源的知识通常存在重复和冲突问题,需要对实体进行对齐;在本实施例中,对于同一种药物或疾病的不同名称,以英文名称为中心,与其他名称之间建立“别名”关系,而对于音译或拼写导致的差异则直接进行合并;最后由专业医生进行检查和校正,保证知识的准确性;将结构化的三元组数据导入neo4j图数据库中进行存储;在本实施例中,潜在不适当用药使用pim节点进行表示,同时增加fact节点作为中间节点,用于关联每种潜在不适当用药情况下的pim节点和风险因素节点。
58.s2中建立基于原始特征的知识图谱路径推理模型包括以下分步骤:
59.s2-1:将原始特征转换为特征词列表;
60.s2-2:在知识图谱中匹配特征词列表,得到起始节点集合start;
61.s2-3:找到所有能从start到达的fact节点,并加入候选集合candidate;
62.s2-4:根据start中节点到达fact节点的路径上最后一条边的关系,对candicade集合中的节点进行筛选:如果关系为排除,剔除相应的fact节点,否则记录fact节点的前驱节点集合pre;
63.s2-5:依次判断candidate中剩余fact节点的所有关系为构成的前驱节点,是否均包含于pre集合中,若满足条件,则潜在不适当用药情况的所有构成因素均存在;
64.s2-6:根据步骤s2-5中满足条件的fact节点,获取并返回对应pim节点的潜在不适当用药编号属性值,完成知识图谱路径推理模型的建立。
65.s3中获得最终决策包括将潜在不适当用药标签的预测结果和潜在不适当用药标签的推理结果进行结合,通过设定一个样本量阈值,当样本量低于阈值,输出知识图谱路径推理模型的结果,否则输出机器学习模型的预测结果。
66.在本步骤中,机器学习模型基于概率统计原理,从数据中学习特征之间的隐含关系;然而,在实际场景中,许多潜在不适当用药发生率低,使得能够获取的样本量也非常有
限,在这种情况下,基于数据的决策可能导致错误的结果;因此,在本实施例中,当样本量不足时,基于知识的推理模型依然能够得到较为可靠的结果,减少了机器学习模型存在的数据依赖问题;另一方面,知识中可能存在的缺失和错误内容,会降低推理模型的效果,而如果样本量足够,就能够充分发挥机器学习的特征学习能力;因此,在结合两者结果后,不仅可以实现较高的整体准确率,同时对于低频潜在不适当用药的预测能力也显著提升,并且增加了结果的可靠性。
67.本发明首先利用机器学习方法,从数据中挖掘特征之间的隐含关系,在此基础上,引入知识图谱推理模型,基于药物知识的显式关系进行路径推理,弥补了机器学习对于低频潜在不适当用药预测能力弱的问题,增加了预测结果的准确性和可靠性,同时减少了对样本数据的依赖,因此具有较高的临床应用价值。
68.本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在发明的保护范围内。
技术特征:
1.一种共病模式下的潜在不适当用药检测方法,其特征在于,所述方法包括以下步骤:s1:对原始病历数据进行处理,获得训练后的机器学习模型;s2:根据药物标准中潜在不适当用药的相关因素构建知识图谱,建立基于原始特征的知识图谱路径推理模型;s3:将机器学习模型的预测结果和知识图谱路径推理模型的推理结果进行结合,获得潜在不适当用药检测结果。2.根据权利要求1所述的共病模式下的潜在不适当用药检测方法,其特征在于,所述s1中包括以下分步骤:s1-1:将原始病历数据预处理后形成原始特征;s1-2:对原始特征进行向量化编码,获得特征向量;s1-3:将特征向量输入机器学习模型进行训练,获得训练后的机器学习模型。3.根据权利要求2所述的共病模式下的潜在不适当用药检测方法,其特征在于,所述s1-2中对原始特征进行向量化编码包括以下分步骤:s1-2-1:利用正则表达式抽取诊断字段中的疾病名称;s1-2-2:对诊断字段中的疾病名称和药品通用名多值类别特征进行one-hot编码。4.根据权利要求3所述的共病模式下的潜在不适当用药检测方法,其特征在于,所述s1-3中将特征向量输入机器学习模型进行训练中针对多标签情况,建立分类器链模型用于学习多个潜在不适当用药标签之间的关联性。5.根据权利要求4所述的共病模式下的潜在不适当用药检测方法,其特征在于,所述分类器链模型采用catboost模型作为基学习器。6.根据权利要求5所述的共病模式下的潜在不适当用药检测方法,其特征在于,所述s2中构建知识图谱包括采用自顶向下的方式进行构建,包括模式层构建和实例层构建,所述模式层构建为对药物和疾病关系进行抽象和归纳,并将风险因素和潜在不适当用药进行关联,获得知识图谱本体结构。7.根据权利要求6所述的共病模式下的潜在不适当用药检测方法,其特征在于,所述实例层构建为根据知识图谱本体结构抽取药物标准中的实体和关系,整理成结构化的三元组数据,并存储到neo4j图数据库中,所述潜在不适当用药使用知识图谱中的实体节点pim节点表示,同时增加知识图谱中的另一个实体节点fact节点作为中间节点,用于关联每种潜在不适当用药情况下的pim节点和风险因素节点。8.根据权利要求7所述的共病模式下的潜在不适当用药检测方法,其特征在于,所述s2中建立基于原始特征的知识图谱路径推理模型包括以下分步骤:s2-1:将原始特征转换为特征词列表;s2-2:在知识图谱中匹配特征词列表,得到起始节点集合start;s2-3:找到所有能从start到达的fact节点,并加入候选集合candidate;s2-4:根据start中节点到达fact节点的路径上最后一条边的关系,对candicade集合中的节点进行筛选:如果关系为排除,剔除相应的fact节点,否则记录fact节点的前驱节点集合pre;s2-5:依次判断candidate中剩余fact节点的所有关系为构成的前驱节点,是否均包含于pre集合中,若满足条件,则潜在不适当用药情况的所有构成因素均存在;
s2-6:根据步骤s2-5中满足条件的fact节点,获取并返回对应pim节点的潜在不适当用药编号属性值,完成知识图谱路径推理模型的建立。9.根据权利要求8所述的共病模式下的潜在不适当用药检测方法,其特征在于,所述s3中获得最终决策包括将潜在不适当用药标签的预测结果和潜在不适当用药标签的推理结果进行结合,通过设定一个样本量阈值,当样本量低于阈值,输出知识图谱路径推理模型的结果,否则输出机器学习模型的预测结果。
技术总结
本发明公开了一种共病模式下的潜在不适当用药检测方法,包括以下步骤:对原始病历数据进行处理,获得训练后的机器学习模型;根据药物标准中潜在不适当用药的相关因素构建知识图谱,建立基于原始特征的知识图谱路径推理模型;将机器学习模型的预测结果和知识图谱路径推理模型的推理结果进行结合,获得潜在不适当用药检测结果。本发明弥补了机器学习对于低频潜在不适当用药预测能力弱的问题,增加了预测结果的准确性和可靠性,同时减少了对样本数据的依赖,因此具有较高的临床应用价值。因此具有较高的临床应用价值。因此具有较高的临床应用价值。
技术研发人员:滕飞 林工钞 胡晓鹏 顾瑾 徐珽 金朝晖 姚远 武云 刘曦 王億科
受保护的技术使用者:西南交通大学
技术研发日:2023.04.27
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/