基于人工智能的医学数据处理方法、装置、设备及介质与流程

未命名 09-22 阅读:149 评论:0


1.本技术涉及人工智能技术领域与数字医疗领域,尤其涉及一种基于人工智能的医学数据处理方法、装置、设备及介质。


背景技术:

2.生物分子任务是指利用计算机模拟和分析化合物、蛋白、rna(ribonucleic acid,核糖核酸)等生物分子的结构和功能,以及它们之间的相互作用,从而为生物制药领域提供理论指导和实验依据。生物分子任务包括结构预测、性质预测、亲和力预测、药物设计、靶点发现等,这些生物分子任务对于新药研发、疾病诊断、个性化医疗等具有重要的意义和价值。
3.现有的生物分子任务通常采用基于规则或统计的方法,需要大量的人工特征工程和领域知识,且难以处理复杂的非线性关系和多模态数据,从而导致生物分子任务的处理存在成本高昂且效率低下的问题。


技术实现要素:

4.本技术提供一种人工智能的基于人工智能的医学数据处理方法、装置、计算机设备及介质,以解决现有的生物分子任务通常采用基于规则或统计的方法,需要大量的人工特征工程和领域知识,且难以处理复杂的非线性关系和多模态数据,从而导致生物分子任务的处理存在成本高昂且效率低下的技术问题。
5.第一方面,提供了一种基于人工智能的医学数据处理方法,包括:
6.从多个医学数据源中收集初始医学数据;
7.对所述初始医学数据进行预处理得到医学样本集;
8.基于自监督学习方法,使用所述医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型;其中,所述多模态基础模型为采用编码器与解码器的模型构架的模型;
9.通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型;
10.通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分析模型;
11.通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型;
12.基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果。
13.第二方面,提供了一种基于人工智能的医学数据处理装置,包括:
14.收集模块,用于从多个医学数据源中收集初始医学数据;
15.第一处理模块,用于对所述初始医学数据进行预处理得到医学样本集;
16.训练模块,用于基于自监督学习方法,使用所述医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型;其中,所述多模态基础模型为采用编码器与解码器的模型构架的模型;
17.第二处理模块,用于通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型;
18.第三处理模块,用于通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分析模型;
19.第四处理模块,用于通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型;
20.评估模块,用于基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果。
21.第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于人工智能的医学数据处理方法的步骤。
22.第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述基于人工智能的医学数据处理方法的步骤。
23.上述基于人工智能的医学数据处理方法、装置、计算机设备及存储介质所实现的方案中,可以从多个医学数据源中收集初始医学数据;对初始医学数据进行预处理得到医学样本集;基于自监督学习方法,使用医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型;通过预设的多任务学习策略对初始医学分析模型进行微调,得到第一医学分析模型;通过预设的多目标优化策略对第一医学分析模型进行优化,得到第二医学分析模型;通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型;基于目标医学分析模型对待处理的目标医学数据进行评估处理,生成与目标医学数据对应的医学评估结果。通过对从医学数据源中收集的初始医学数据进行预处理得到医学样本集,然后利用该医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型,之后使用多任务学习策略、多目标优化策略以及反馈学习方法对初始医学分析模型进行模型优化以生成目标医学分析模型,有效地提高了生成的目标医学分析模型的泛化能力、表达能力、平衡协调性、适应性以及模型效果等模型性能。后续通过使用目标医学分析模型对待处理的目标医学数据进行评估处理,以实现快速准确地生成与目标医学数据对应的医学评估结果,有效地提高了对于目标医学数据的评估处理效率,降低对于目标医学数据的评估处理成本。
附图说明
24.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
25.图1是本技术一实施例中基于人工智能的医学数据处理方法的一应用环境示意图;
26.图2是本技术一实施例中基于人工智能的医学数据处理方法的一流程示意图;
27.图3是本技术一实施例中基于人工智能的医学数据处理装置的一结构示意图;
28.图4是本技术一实施例中计算机设备的一结构示意图;
29.图5是本技术一实施例中计算机设备的另一结构示意图。
具体实施方式
30.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
31.本技术实施例提供的基于人工智能的医学数据处理方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务端进行通信。服务端可以从多个医学数据源中收集初始医学数据;对初始医学数据进行预处理得到医学样本集;基于自监督学习方法,使用医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型;通过预设的多任务学习策略对初始医学分析模型进行微调,得到第一医学分析模型;通过预设的多目标优化策略对第一医学分析模型进行优化,得到第二医学分析模型;通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型;基于目标医学分析模型对待处理的目标医学数据进行评估处理,生成与目标医学数据对应的医学评估结果。在本技术中,通过对从医学数据源中收集的初始医学数据进行预处理得到医学样本集,然后利用该医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型,之后使用多任务学习策略、多目标优化策略以及反馈学习方法对初始医学分析模型进行模型优化以生成目标医学分析模型,有效地提高了生成的目标医学分析模型的泛化能力、表达能力、平衡协调性、适应性以及模型效果等模型性能。后续通过使用目标医学分析模型对待处理的目标医学数据进行评估处理,以实现快速准确地生成与目标医学数据对应的医学评估结果,有效地提高了对于目标医学数据的评估处理效率,降低对于目标医学数据的评估处理成本。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本技术进行详细的描述。
32.请参阅图2所示,图2为本技术实施例提供的基于人工智能的医学数据处理方法的一个流程示意图,包括如下步骤:
33.步骤s10:从多个医学数据源中收集初始医学数据。
34.本技术提供的基于人工智能的医学数据处理方法,可应用于各种应用场景下的医学评估应用中,医学评估应用的数据处理通常通过服务端来实现,该服务端可以实时接收从多个医学数据源中收集得到的初始医学数据。其中,医学数据源可包括公开的医学数据源或者私有的医学数据源。上述初始医学数据可包括图像、文本、声音、分子结构、生物序列等数据。
35.步骤s20,对所述初始医学数据进行预处理得到医学样本集。
36.在本实施例中,上述预处理至少可包括清洗处理、标准化处理、编码处理等处理。
37.步骤s30,基于自监督学习方法,使用所述医学样本集对预设的多模态基础模型进
行训练,得到初始医学分析模型;其中,所述多模态基础模型为采用编码器与解码器的模型构架的模型。
38.在本实施例中,上述多模态基础模型具体为由一个编码器e和一个解码器d组成的多层次多模态多任务多目标基础模型。编码器e能够将不同层次和不同模态的数据编码为一个统一的隐向量z,解码器d能够将隐向量z解码为不同层次和不同模态的数据。多模态基础模型能够同时处理不同类型和来源的医学数据,提高了模型的泛化能力和表达能力。并且能够灵活地解释不同组合的医学模态,例如根据分子结构生成文本描述,或者根据文本描述生成分子结构,还能够产生富有表现力的输出,例如自由文本解释、口头建议或图像注释,展示高级的医学推理能力。其中,上述基于自监督学习方法,使用所述医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型的训练过程可参照现有的模型的训练过程,在此不做过多赘述。
39.步骤s40,通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型。
40.在本实施例中,通过多任务学习策略对所述初始医学分析模型进行微调,使得生成的第一医学分析模型能够同时执行多种药物发现相关的任务,例如分子生成、优化、分类、回归、聚类、对齐、匹配等,还可包括化合物、蛋白、rna等生物分子的结构预测、性质预测、亲和力预测、药物设计、靶点发现等任务。且第一医学分析模型能够在不同的药物发现任务之间共享和迁移知识,提高泛化能力和效率,以及提高模型的通用性和适应性。其中,上述通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型的具体实施过程,本技术将在后续的具体实施例中对此进行进一步的细节描述,在此不作过多阐述。
41.步骤s50,通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分析模型。
42.在本实施例中,采用多目标优化策略对所述第一医学分析模型进行优化,可以使得生成的第二医学分析模型能够在药物发现过程中考虑多个目标和约束,例如分子活性、选择性、稳定性、可制造性、可交付性等。且第二医学分析模型能够在不同目标之间平衡和协调,提高了模型的平衡性和协调性。还能够在不同层次上进行药物设计,提高了模型的精度和创新性,生成满足多个条件的候选分子。其中,上述通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分析模型的具体实施过程,本技术将在后续的具体实施例中对此进行进一步的细节描述,在此不作过多阐述。
43.步骤s60,通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型。
44.在本实施例中,通过预设的反馈学习方法对第二医学分析模型进行改进,从而实现动态调整优化目标和策略,并得到改进后的目标医学分析模型。其中,上述通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型的具体实施过程,本技术将在后续的具体实施例中对此进行进一步的细节描述,在此不作过多阐述。
45.步骤s70,基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果。
46.在本实施例中,上述待处理的目标医学数据可为待处理的生物分子任务对应的生
物分子数据。上述基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果的具体实施过程,本技术将在后续的具体实施例中对此进行进一步的细节描述,在此不作过多阐述。
47.本技术通过对从医学数据源中收集的初始医学数据进行预处理得到医学样本集,然后利用该医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型,之后使用多任务学习策略、多目标优化策略以及反馈学习方法对初始医学分析模型进行模型优化以生成目标医学分析模型,有效地提高了生成的目标医学分析模型的泛化能力、表达能力、平衡协调性、适应性以及模型效果等模型性能。后续通过使用目标医学分析模型对待处理的目标医学数据进行评估处理,以实现快速准确地生成与所述目标医学数据对应的医学评估结果,有效地提高了对于目标医学数据的评估处理效率,降低对于目标医学数据的评估处理成本。
48.在本实施例的一些可选的实现方式中,步骤s20包括以下步骤:
49.对所述初始医学数据进行清洗处理,得到第一医学数据。
50.在本实施例中,数据清洗是指对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。数据清洗可包括一致性检查与无效值和缺失值的处理。其中,一致性检查是根据每个变量的合理取值范围和相互关系,检查数据是否合乎要求,发现超出正常范围、逻辑上不合理或者相互矛盾的数据。另外,由于调查、编码和录入误差,数据中可能存在一些无效值和缺失值,需要给予适当的处理。常用的处理方法有:估算,整例删除,变量删除和成对删除。
51.对所述第一医学数据进行标准化处理,得到第二医学数据。
52.在本实施例中,标准化处理是指通过一定的数学变换方式,将原始数据按照一定的比例进行转换,使之落入到一个小的特定区间内,例如[0,1]或[-1,1]的区间内,消除不同变量之间性质、量纲、数量级等特征属性的差异,将其转化为一个无量纲的相对数值,也就是标准化数值,使各指标的数值都处于同一个数量级别上,从而便于不同单位或数量级的指标能够进行综合分析和比较。其中,可采用归一化方式、中心化方式对所述第一医学数据进行标准化处理,得到第二医学数据。
[0053]
对所述第二医学数据进行编码处理,得到第三医学数据。
[0054]
在本实施例中,通过对所述第二医学数据进行编码处理,以使得编码得到的第三医学数据为符合适用于输入至医学分析模型内的数据的格式的数据。
[0055]
将所述第三医学数据作为所述医学样本集。
[0056]
本技术通过对初始医学数据进行清洗处理,得到第一医学数据;然后对第一医学数据进行标准化处理,得到第二医学数据;后续对第二医学数据进行编码处理,得到第三医学数据,并将第三医学数据作为医学样本集。本技术通过对初始医学数据进行清洗处理、标准化处理以及编码处理,以实现快速准确地完成对于初始医学数据的预处理,以使得得到的医学样本集为符合适用于输入至医学分析模型内的数据的格式的数据,有利于后续可以使用医学样本集来顺利地进行对于医学分析模型的训练生成过程,进而提高医学分析模型的生成效率。
[0057]
在本实施例中,在一些可选的实现方式中,步骤s70包括以下步骤:
[0058]
将所述目标医学数据输入至所述目标医学分析模型的输入层内,并对所述目标医
学数据进行嵌入处理。
[0059]
在本实施例中,上述初始医学分析模型为采用gnn+transformer的模型架构的模型。图卷积网络(gnn,graph convolutional networks)是一种基于图结构的广义神经网络。transformer是一个利用注意力机制来提高模型训练速度的可适用于并行化计算的深度学习模型。其中,在具体的医学领域的分子应用场景中,上述目标医学数据可为药物分子图。
[0060]
通过所述目标医学分析模型中的编码器对所述目标医学数据进行编码处理,得到与所述目标医学数据对应的第一节点特征。
[0061]
在本实施例中,上述目标医学分析模型中的编码器由多个gnn和transformer模块交替堆叠而成,每个模块包括以下部分:(1)gnn部分:利用消息传递机制,聚合自身与邻居节点的特征,更新节点特征。具体来说,对于每个节点vi∈v,其更新后的节点特征为:
[0062]
其中,σ是激活函数,如relu((linear rectification function))、tanh(hyperbolic tangent function,双曲正切函数)等,relu是深度学习中的一种激活函数,是修正线性单元在考虑高斯噪声的基础上进行改进的变种激活函数;和u
l
∈rh×f是可学习的参数矩阵;n(vi)是节点vi的邻居节点集合。(2)transformer部分:利用自注意力机制,捕捉节点之间的全局依赖关系,更新节点特征。具体来说,对于每个节点vi∈v,其更新后的节点特征为:
[0063][0064]
其中,
[0065]
layernorm是层归一化操作;multiheadattention是多头注意力机制,
[0066]
是可学习的参数矩阵;
[0067]
是所有节点的特征矩阵,其中n=|v|是节点个数。(3)跳过连接部分:将浅层节点特征添加到深层节点特征,增强表达能力,避免过平滑。具体来说,对于每个节点vi∈v,其更新后的节点特征为:其中,layernorm是层归一化操作。
[0068]
基于所述目标医学分析模型中的潜在空间层对所述第一节点特征进行池化处理与采样处理,得到对应的第二节点特征。
[0069]
在本实施例中,在所述目标医学分析模型中的潜在空间层中,可通过将编码器得到的节点特征进行池化操作,得到整个药物分子图的特征表示,然后通过一个全连接层,输出潜在变量的均值和方差,并通过重参数化技巧,采样得到潜在变量。具体来说,对于一个药物分子图g,其潜在变量为:
[0070]
zg=g+g*g其中和分别是潜在变量的均值和方
差;和是可学习的参数矩阵和向量;是编码器得到的药物分子图的特征表示;∈g~n(0,i)是一个随机噪声向量;z是潜在变量的维度,meanpooling指均值池化,即对邻域内特征点值求平均。
[0071]
基于所述目标医学分析模型中的解码器对所述第二节点特征进行节点更新处理,得到对应的第三节点特征。
[0072]
在本实施例中,上述目标医学分析模型中的解码器由多个gnn和transformer模块交替堆叠而成,每个模块包括以下部分:(1)gnn部分:利用消息传递机制,聚合自身与邻居节点的特征,更新节点特征。具体来说,对于每个节点vi∈v,其更新后的节点特征为:∈v,其更新后的节点特征为:其中σ是激活函数,如relu、tanh等;和是可学习的参数矩阵;n(vi)是节点vi的邻居节点集合。(2)transformer部分:利用自注意力机制,捕捉节点之间的全局依赖关系,更新节点特征。具体来说,对于每个节点vi∈v,其更新后的节点特征为:
[0073]
其中layernorm是层归一化操作;multiheadattention是多头注意力机制;
[0074]
是可学习的参数矩阵;
[0075]
是所有节点的特征矩阵,其中n=|v|是节点个数。(3)跳过连接部分:将浅层节点特征添加到深层节点特征,增强表达能力,避免过平滑。具体来说,对于每个节点vi∈v,其更新后的节点特征为:其中layernorm是层归一化操作。
[0076]
基于所述目标医学分析模型中的输出层对所述第三节点特征进行评估处理,得到与所述目标医学数据对应的医学评估结果。
[0077]
在本实施例中,上述输出层可指所述目标医学分析模型中的全连接层,可通过将解码器得到的节点特征通过一个全连接层,输出节点和边的预测值,并根据预定义的规则,从而生成与所述目标医学数据对应的医学评估结果。具体来说,对于每个节点vi∈v,其预测值为:其中w
p
∈uc×h和b
p
∈uc是可学习的参数矩阵和向量;c是节点类别的个数;pi∈uc是一个概率向量,表示节点vi属于每个类别的概率。softmax是一种数学函数,通常用于将一组任意实数转换为表示概率分布的实数。其本质上是一种归一化函数,可以将一组任意的实数值转化为在[0,1]之间的概率值,因为softmax将它们转换为0到1之间的值,所以它们可以被解释为概率。如果其中一个输入很小或为负,softmax将其变为小概率,如果输入很大,则将其变为大概率,但它将始终保持在0到1之间。对于每条边(vi,vj)∈e,其预测值为:其中wq∈r和bq∈r
t
是可学习的参数矩阵和向量;t是边类型的个数;q
ij
∈u
t
是一个概率向量,表示边(vi,vj)属于每个类型的概率。上述预定义的规则可包括如最大概率、阈值、拓扑等规则,从预测值中生成对应的医学评估结果。
[0078]
本技术通过将目标医学数据输入至目标医学分析模型的输入层内,并对目标医学数据进行嵌入处理;然后通过目标医学分析模型中的编码器对目标医学数据进行编码处理,得到与目标医学数据对应的第一节点特征;之后基于目标医学分析模型中的潜在空间层对第一节点特征进行池化处理与采样处理,得到对应的第二节点特征;后续基于目标医学分析模型中的解码器对第二节点特征进行节点更新处理,得到对应的第三节点特征;最后基于目标医学分析模型中的输出层对第三节点特征进行评估处理,得到与目标医学数据对应的医学评估结果。本技术通过使用由医学样本集训练生成的目标医学分析模型来对目标医学数据进行评估处理,可以实现快速准确地生成与目标医学数据对应的医学评估结果,提高了对于目标医学数据的评估效率,保证了生成的医学评估结果的准确度。
[0079]
在一些可选的实现方式中,所述通过所述目标医学分析模型中的编码器对所述目标医学数据进行编码处理,得到与所述目标医学数据对应的第一节点特征,包括以下步骤:
[0080]
获取所述目标医学数据的目标数据类型。
[0081]
在本实施例中,上述目标数据类型可包括分子图、文本序列、图像等类型。上述文本序列可为医疗文本,医疗文本可以是医疗电子记录,电子化的个人健康记录,具体可包括病历、心电图、医学影像等一系列具备保存备查价值的电子化记录。
[0082]
确定与所述目标数据类型匹配的目标编码方式。
[0083]
在本实施例中,对于任意一个输入数据x,它可以是一个分子图g,一个文本序列t,一个图像i,或者其他任何类型的数据,编码器e可以将其编码为一个隐向量z
x
=(x)。对于不同类型的数据,编码器e可以采用不同的编码方式,例如对于分子图g,使用图神经网络(gnn)或自注意力机制(self-attention mechanism)进行编码;对于文本序列t,使用循环神经网络(rnn)或transformer进行编码;对于图像i,可以使用卷积神经网络(cnn)或vision transformer进行编码。
[0084]
通过所述目标医学分析模型中的编码器,采用所述目标编码方式对所述目标医学数据进行编码处理,得到与所述目标医学数据对应的编码数据。
[0085]
将所述编码数据作为所述第一节点特征。
[0086]
本技术通过获取目标医学数据的目标数据类型;然后确定与目标数据类型匹配的目标编码方式;后续通过目标医学分析模型中的编码器,采用目标编码方式对目标医学数据进行编码处理,得到与目标医学数据对应的编码数据,并将编码数据作为第一节点特征。本技术通过获取目标医学数据的目标数据类型,进而会智能地通过目标医学分析模型中的编码器,采用与该目标数据类型匹配的目标编码方式来对目标医学数据进行编码处理,以实现对于目标医学数据的精准编码,提高了对于目标医学数据的编码处理的智能性,保证了生成的第一节点特征的数据准确度。
[0087]
在一些可选的实现方式中,对于目标医学分析模型中的解码器,对于任意一个隐向量z
x
,它可以是由编码器e生成的,或者是由其他方式生成的,解码器d可以将其解码为任意一种类型的数据x’=d(
x
)。对于不同类型的数据,解码器d可以采用不同的解码方式,例如对于分子图g’,使用图生成网络(graph generative network)或自回归模型(autoregressive model)进行解码;对于文本序列t’,使用循环神经网络(rnn)或transformer进行解码;对于图像i’,使用反卷积神经网络(deconvolutional neural network)或gan(generative adversarial networks,生成式对抗网络)进行解码。
[0088]
在一些可选的实现方式中,步骤s40包括以下步骤:
[0089]
分别获取预设的多种药物发现任务的损失函数;
[0090]
在本实施例中,上述药物发现任务可包括分子生成、优化、分类、回归、聚类、对齐、匹配等任务。其中,预先为每种药物发现任务定义一个任务特定的损失函数li(z
x
,yi),其中z
x
=e(x)是输入数据x的隐向量,yi=d(z
x
)是模型输出的预测值。
[0091]
对所有所述损失函数进行组合处理,得到对应的总损失函数。
[0092]
在本实施例中,通过将不同药物发现任务的损失函数组合为一个总损失函数l(z
x
,y)=∑iαili(z
x
,yi),其中αi是不同任务的权重,可以根据药物发现任务的重要性或难度进行调整。
[0093]
通过梯度下降法对所述总损失函数进行优化,得到优化后的目标总损失函数。
[0094]
在本实施例中,通过使用梯度下降法优化总损失函数l(z
x
,y),以得到优化后的目标总损失函数
[0095]
基于所述目标总损失函数对所述初始医学分析模型的模型参数进行更新,得到所述第一医学分析模型。
[0096]
在本实施例中,基于所述目标总损失函数对所述初始医学分析模型的模型参数进行更新(θ=θe,θd),从而得到所述第一医学分析模型。
[0097]
本技术通过分别获取预设的多种药物发现任务的损失函数;然后对所有损失函数进行组合处理,得到对应的总损失函数;之后通过梯度下降法对总损失函数进行优化,得到优化后的目标总损失函数;后续基于目标总损失函数对初始医学分析模型的模型参数进行更新,得到第一医学分析模型。本技术通过使用多任务学习策略,在多种药物发现相关的药物发现任务上,基于对各种药物发现任务的损失函数进行组合处理得到的总损失函数来对初始医学分析模型进行微调以得到第一医学分析模型,从而实现了生成具有共享和迁移知识的能力的第一医学分析模型,提高了模型的泛化能力和表达能力。
[0098]
在本实施例的一些可选的实现方式中,步骤s50包括以下步骤:
[0099]
获取预先定义的与各种药物发现任务分别对应的任务目标。
[0100]
在本实施例中,上述药物发现任务可包括分子生成、优化、分类、回归、聚类、对齐、匹配等任务。预先定义的与各种药物发现任务分别对应的任务目标可包括如分子活性、选择性、稳定性、可制造性、可交付性等。任务目标也可称为任务的目标和约束。
[0101]
获取与各所述任务目标分别对应的目标函数。
[0102]
在本实施例中,对于药物发现任务的任务目标,根据实际的使用需求预先构建与该任务目标对应的目标函数fj(z
x
),其中,z
x
=e(x)是输入数据x的隐向量。
[0103]
对所有所述目标函数进行组合处理,得到对应的总目标函数。
[0104]
在本实施例中,可通过将所有药物发现任务的任务目标的目标函数组合为一个总目标函数f(z
x
)=∑jβ
jfj
(z
x
),其中,βj是不同目标的权重,可以根据用户的偏好或实验结果进行调整。
[0105]
基于预设的多目标进化算法对所述第一医学分析模型的输入数据、输出数据、隐向量以及所述总目标函数进行优化,得到所述第二医学分析模型。
[0106]
在本实施例中,第一医学分析模型可简称为模型。可通过使用多目标进化算法(multiobjective evolutionary algorithm,moea)寻找满足多个药物发现任务的目标和
network等算法。其中,reinforce算法是一种基于策略梯度算法的更新方式,利用未来总收益gt来代替q值;actor-critic算法是一种基于值函数和策略函数相结合的增强学习算法;q learning算法是一种value-based的强化学习算法;deep q-network(dqn)是一项实用度很高的强化学习算法。通过将模型的输出数据x

=d(z
x
)视为模型的行为(action),将实验结果或专家意见r=h(y,y

)视为环境的奖励(reward)。后续根据不同的rl算法定义模型的策略(policy)π
θ
(x

|x)或值函数(value function)v
θ
()或q
θ
(,x

),并使用梯度下降法优化相应的目标函数或或或
[0116]
本技术通过获取与预设的药物发现任务对应的实验结果与专家意见;然后对实验结果与专家意见进行编码得到对应的反馈信息;后续基于强化学习方法对第二医学分析模型的输出数据与反馈信息进行优化处理,以进行对于第二医学分析模型的模型参数更新,得到目标医学分析模型。本技术通过使用预设的反馈学习方法,根据药物发现任务对应的实验结果与专家意见对第二医学分析模型进行模型改进,从而得到改进后的目标医学分析模型,以完成动态调整优化第二医学分析模型的目标和策略,有效地提高了生成的目标医学分析模型的模型精度与创新性。
[0117]
在一实施例中,提供一种基于人工智能的医学数据处理装置,该基于人工智能的医学数据处理装置与上述实施例中基于人工智能的医学数据处理方法一一对应。如图3所示,该基于人工智能的医学数据处理装置100包括第一获取模块101、第二获取模块102、第一生成模块103、第二生成模块104、确定模块105以及处理模块106。各功能模块详细说明如下:
[0118]
收集模块101,用于从多个医学数据源中收集初始医学数据;
[0119]
第一处理模块102,用于对所述初始医学数据进行预处理得到医学样本集;
[0120]
训练模块103,用于基于自监督学习方法,使用所述医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型;其中,所述多模态基础模型为采用编码器与解码器的模型构架的模型;
[0121]
第二处理模块104,用于通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型;
[0122]
第三处理模块105,用于通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分析模型;
[0123]
第四处理模块106,用于通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型;
[0124]
评估模块107,用于基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果。
[0125]
在本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的产品推荐方法的步骤一一对应,在此不再赘述。
[0126]
在一实施例中,第一处理模块102,具体包括:
[0127]
第一处理子模块,用于对所述初始医学数据进行清洗处理,得到第一医学数据;
[0128]
第二处理子模块,用于对所述第一医学数据进行标准化处理,得到第二医学数据;
[0129]
第三处理子模块,用于对所述第二医学数据进行编码处理,得到第三医学数据;
[0130]
第一确定子模块,用于将所述第三医学数据作为所述医学样本集。
[0131]
在一实施例中,评估模块107,具体包括:
[0132]
输入子模块,用于将所述目标医学数据输入至所述目标医学分析模型的输入层内,并对所述目标医学数据进行嵌入处理;
[0133]
编码子模块,用于通过所述目标医学分析模型中的编码器对所述目标医学数据进行编码处理,得到与所述目标医学数据对应的第一节点特征;
[0134]
第四处理子模块,用于基于所述目标医学分析模型中的潜在空间层对所述第一节点特征进行池化处理与采样处理,得到对应的第二节点特征;
[0135]
第一更新子模块,用于基于所述目标医学分析模型中的解码器对所述第二节点特征进行节点更新处理,得到对应的第三节点特征;
[0136]
评估子模块,用于基于所述目标医学分析模型中的输出层对所述第三节点特征进行评估处理,得到与所述目标医学数据对应的医学评估结果。
[0137]
在一实施例中,编码子模块,具体包括:
[0138]
获取单元,用于获取所述目标医学数据的目标数据类型;
[0139]
第一确定单元,用于确定与所述目标数据类型匹配的目标编码方式;
[0140]
处理单元,用于通过所述目标医学分析模型中的编码器,采用所述目标编码方式对所述目标医学数据进行编码处理,得到与所述目标医学数据对应的编码数据;
[0141]
第二确定单元,用于将所述编码数据作为所述第一节点特征。
[0142]
在一实施例中,第二处理模块104,具体包括:
[0143]
第一获取子模块,用于分别获取预设的多种药物发现任务的损失函数;
[0144]
组合子模块,用于对所有所述损失函数进行组合处理,得到对应的总损失函数;
[0145]
第一优化子模块,用于通过梯度下降法对所述总损失函数进行优化,得到优化后的目标总损失函数;
[0146]
第二更新子模块,用于基于所述目标总损失函数对所述初始医学分析模型的模型参数进行更新,得到所述第一医学分析模型。
[0147]
在一实施例中,第三处理模块105,包括:
[0148]
第二获取子模块,用于获取预先定义的与各种药物发现任务分别对应的任务目标;
[0149]
第三获取子模块,用于获取与各所述任务目标分别对应的目标函数;
[0150]
第二组合子模块,用于对所有所述目标函数进行组合处理,得到对应的总目标函数;
[0151]
第二优化子模块,用于基于预设的多目标进化算法对所述第一医学分析模型的输入数据、输出数据、隐向量以及所述总目标函数进行优化,得到所述第二医学分析模型。
[0152]
在一实施例中,第四处理模块106,包括:
[0153]
第四获取子模块,用于获取与预设的药物发现任务对应的实验结果与专家意见;
[0154]
第五处理子模块,用于对所述实验结果与所述专家意见进行编码得到对应的反馈信息;
[0155]
第六处理子模块,用于基于强化学习方法对所述第二医学分析模型的输出数据与
所述反馈信息进行优化处理,以进行对于所述第二医学分析模型的模型参数更新,得到所述目标医学分析模型。
[0156]
本技术提供了一种基于人工智能的医学数据处理方法装置,通过对从医学数据源中收集的初始医学数据进行预处理得到医学样本集,然后利用该医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型,之后使用多任务学习策略、多目标优化策略以及反馈学习方法对初始医学分析模型进行模型优化以生成目标医学分析模型,有效地提高了生成的目标医学分析模型的泛化能力、表达能力、平衡协调性、适应性以及模型效果等模型性能。后续通过使用目标医学分析模型对待处理的目标医学数据进行评估处理,以实现快速准确地生成与所述目标医学数据对应的医学评估结果,有效地提高了对于目标医学数据的评估处理效率,降低对于目标医学数据的评估处理成本。关于基于人工智能的医学数据处理装置的具体限定可以参见上文中对于基于人工智能的医学数据处理方法的限定,在此不再赘述。上述基于人工智能的医学数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0157]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的医学数据处理方法服务端侧的功能或步骤。
[0158]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的医学数据处理方法客户端侧的功能或步骤。
[0159]
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
[0160]
从多个医学数据源中收集初始医学数据;
[0161]
对所述初始医学数据进行预处理得到医学样本集;
[0162]
基于自监督学习方法,使用所述医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型;其中,所述多模态基础模型为采用编码器与解码器的模型构架的模型;
[0163]
通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型;
[0164]
通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分
析模型;
[0165]
通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型;
[0166]
基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果。
[0167]
本技术实施例中,通过对从医学数据源中收集的初始医学数据进行预处理得到医学样本集,然后利用该医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型,之后使用多任务学习策略、多目标优化策略以及反馈学习方法对初始医学分析模型进行模型优化以生成目标医学分析模型,有效地提高了生成的目标医学分析模型的泛化能力、表达能力、平衡协调性、适应性以及模型效果等模型性能。后续通过使用目标医学分析模型对待处理的目标医学数据进行评估处理,以实现快速准确地生成与所述目标医学数据对应的医学评估结果,有效地提高了对于目标医学数据的评估处理效率,降低对于目标医学数据的评估处理成本。
[0168]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0169]
从多个医学数据源中收集初始医学数据;
[0170]
对所述初始医学数据进行预处理得到医学样本集;
[0171]
基于自监督学习方法,使用所述医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型;其中,所述多模态基础模型为采用编码器与解码器的模型构架的模型;
[0172]
通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型;
[0173]
通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分析模型;
[0174]
通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型;
[0175]
基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果。
[0176]
本技术实施例中,通过对从医学数据源中收集的初始医学数据进行预处理得到医学样本集,然后利用该医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型,之后使用多任务学习策略、多目标优化策略以及反馈学习方法对初始医学分析模型进行模型优化以生成目标医学分析模型,有效地提高了生成的目标医学分析模型的泛化能力、表达能力、平衡协调性、适应性以及模型效果等模型性能。后续通过使用目标医学分析模型对待处理的目标医学数据进行评估处理,以实现快速准确地生成与所述目标医学数据对应的医学评估结果,有效地提高了对于目标医学数据的评估处理效率,降低对于目标医学数据的评估处理成本。
[0177]
需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中,服务端侧以及客户端侧的相关描述,为避免重复,这里不再一一描述。
[0178]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0179]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
[0180]
以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。

技术特征:
1.一种基于人工智能的医学数据处理方法,其特征在于,包括:从多个医学数据源中收集初始医学数据;对所述初始医学数据进行预处理得到医学样本集;基于自监督学习方法,使用所述医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型;其中,所述多模态基础模型为采用编码器与解码器的模型构架的模型;通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型;通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分析模型;通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型;基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果。2.如权利要求1所述的基于人工智能的医学数据处理方法,其特征在于,所述对所述初始医学数据进行预处理得到医学样本集的步骤,包括:对所述初始医学数据进行清洗处理,得到第一医学数据;对所述第一医学数据进行标准化处理,得到第二医学数据;对所述第二医学数据进行编码处理,得到第三医学数据;将所述第三医学数据作为所述医学样本集。3.如权利要求1所述的基于人工智能的医学数据处理方法,其特征在于,所述基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果的步骤,包括:将所述目标医学数据输入至所述目标医学分析模型的输入层内,并对所述目标医学数据进行嵌入处理;通过所述目标医学分析模型中的编码器对所述目标医学数据进行编码处理,得到与所述目标医学数据对应的第一节点特征;基于所述目标医学分析模型中的潜在空间层对所述第一节点特征进行池化处理与采样处理,得到对应的第二节点特征;基于所述目标医学分析模型中的解码器对所述第二节点特征进行节点更新处理,得到对应的第三节点特征;基于所述目标医学分析模型中的输出层对所述第三节点特征进行评估处理,得到与所述目标医学数据对应的医学评估结果。4.如权利要求3所述的基于人工智能的医学数据处理方法,其特征在于,所述通过所述目标医学分析模型中的编码器对所述目标医学数据进行编码处理,得到与所述目标医学数据对应的第一节点特征的步骤,包括:获取所述目标医学数据的目标数据类型;确定与所述目标数据类型匹配的目标编码方式;通过所述目标医学分析模型中的编码器,采用所述目标编码方式对所述目标医学数据进行编码处理,得到与所述目标医学数据对应的编码数据;
将所述编码数据作为所述第一节点特征。5.如权利要求1所述的基于人工智能的医学数据处理方法,其特征在于,所述通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型的步骤,包括:分别获取预设的多种药物发现任务的损失函数;对所有所述损失函数进行组合处理,得到对应的总损失函数;通过梯度下降法对所述总损失函数进行优化,得到优化后的目标总损失函数;基于所述目标总损失函数对所述初始医学分析模型的模型参数进行更新,得到所述第一医学分析模型。6.如权利要求1所述的基于人工智能的医学数据处理方法,其特征在于,所述通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分析模型的步骤,包括:获取预先定义的与各种药物发现任务分别对应的任务目标;获取与各所述任务目标分别对应的目标函数;对所有所述目标函数进行组合处理,得到对应的总目标函数;基于预设的多目标进化算法对所述第一医学分析模型的输入数据、输出数据、隐向量以及所述总目标函数进行优化,得到所述第二医学分析模型。7.如权利要求1所述的基于人工智能的医学数据处理方法,其特征在于,所述通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型的步骤,包括:获取与预设的药物发现任务对应的实验结果与专家意见;对所述实验结果与所述专家意见进行编码得到对应的反馈信息;基于强化学习方法对所述第二医学分析模型的输出数据与所述反馈信息进行优化处理,以进行对于所述第二医学分析模型的模型参数更新,得到所述目标医学分析模型。8.一种基于人工智能的医学数据处理装置,其特征在于,包括:收集模块,用于从多个医学数据源中收集初始医学数据;第一处理模块,用于对所述初始医学数据进行预处理得到医学样本集;训练模块,用于基于自监督学习方法,使用所述医学样本集对预设的多模态基础模型进行训练,得到初始医学分析模型;其中,所述多模态基础模型为采用编码器与解码器的模型构架的模型;第二处理模块,用于通过预设的多任务学习策略对所述初始医学分析模型进行微调,得到第一医学分析模型;第三处理模块,用于通过预设的多目标优化策略对所述第一医学分析模型进行优化,得到第二医学分析模型;第四处理模块,用于通过预设的反馈学习方法对第二医学分析模型进行改进,得到改进后的目标医学分析模型;评估模块,用于基于所述目标医学分析模型对待处理的目标医学数据进行评估处理,生成与所述目标医学数据对应的医学评估结果。9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器
上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于人工智能的医学数据处理方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于人工智能的医学数据处理方法的步骤。

技术总结
本申请涉及人工智能技术领域与数字医疗领域,公开了一种基于人工智能的医学数据处理方法、装置、设备及介质,包括:对收集的初始医学数据进行预处理得到医学样本集;基于自监督学习方法,使用医学样本集对多模态基础模型进行训练得到初始医学分析模型;通过多任务学习策略对初始医学分析模型进行微调得到第一医学分析模型;通过多目标优化策略对第一医学分析模型进行优化,得到第二医学分析模型;通过反馈学习方法对第二医学分析模型进行改进,得到目标医学分析模型;基于目标医学分析模型对目标医学数据进行评估得到医学评估结果。本申请的医学分析模型可存储于区块链中。本申请提高了对于医学数据的评估效率,保证了医学评估结果的准确度。结果的准确度。结果的准确度。


技术研发人员:王俊
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2023.06.20
技术公布日:2023/9/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐