一种蛋白分子构象的生成方法及装置与流程

未命名 08-29 阅读:94 评论:0


1.本技术涉及蛋白分子构象生成技术领域,特别是涉及一种蛋白分子构象的生成方法及装置。


背景技术:

2.生物分子的构象变化对生物功能的解释研究至关重要。而通常瞬时短暂的中间态无法以现有的实验技术(如x射线衍射,核磁共振)获得,只能依靠分子动力学(molecular dynamics,md)模拟来对构象进行采样。
3.md的原理是基于牛顿经典物理体系建立一套分子力场,在这个分子力场下输入任意构象都能计算得到构象势能,并由此计算出每一个原子的受力和运动轨迹,不断产生新的构象。由于构象的势能有高低,在模拟的大部分时间里面,构象都被局限在局部的势能极小区域,导致构象的采样不足。samd构建了一个函数关系,这个函数关系基于sigmoid公式推算得到,自变量为分子力场势能,因变量为偏置势能,在偏置势能的作用下影响原子的受力和运动轨迹,得到不同的构象,在对构象作统计分析时再进行重加权处理,得到符合常规md的统计结果。在samd中,偏置势的引入能够减少高势能构象与低势能构象间的势能差,使得构象更容易逃离局部的极小区域,丰富了构象的采样。
4.目前已有的gamd是和samd最相近似的实现方案,两者的差别为偏置势函数关系的不同,gamd的函数具有改进的空间,其由于考虑到偏置后的重加权的误差控制,在构建偏置势函数的时候引入了一定的限制条件,不利于降低高势能构象与低势能构象间的势能差,因此在采样的效率上仍有局限。比如在500ns的情况下,gamd无法实现在丙氨酸二肽体系中对两个主二面角的遍历采样。而samd在其他模拟条件相同的条件下则能实现了遍历采样。
5.为了理解生物大分子的构象转变和分子机制所需的模拟时间尺度为毫秒乃至秒级别,而基于当前的计算能力,传统md仅能达到几百纳秒到几十微秒的时间尺度。由于md过程中时间尺度不足,从而导致生物体系构象难以遍历而采样不足。


技术实现要素:

6.本技术实施例所要解决的技术问题是提供一种蛋白分子构象的生成方法及装置,以解决md过程中时间尺度不足,生物体系构象难以遍历而采样不足的问题。
7.第一方面,本技术实施例提供了一种蛋白分子构象的生成方法,所述方法包括:
8.获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构;
9.对所述pdb晶体结构进行处理,得到所述蛋白分子在当前时刻的蛋白分子构象;
10.获取所述蛋白分子构象与配体之间的非键势能;
11.根据所述非键势能和偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能;
12.基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。
13.可选地,所述获取所述蛋白分子构象与配体之间的非键势能,包括:
14.获取所述蛋白分子构象对应的配体、蛋白和环境信息;
15.计算得到配体之间的第一非键势能、蛋白与配体之间的第二非键势能和配体与环境信息之间的第三非键势能;
16.计算得到所述第一非键势能、所述第二非键势能和所述第三非键势能之间的和值,并将该和值作为所述与配体关联的非键势能。
17.可选地,所述根据所述非键势能和偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能,包括:
18.获取统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值;
19.基于所述势能最大值、所述势能最小值、所述平均值、所述标准偏差值和所述偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能。
20.可选地,在所述对所述pdb晶体结构进行处理,得到所述蛋白分子在当前时刻的蛋白分子构象之后,还包括:
21.获取所述蛋白分子构象对应的配体、蛋白和环境信息,以及所述蛋白分子构象对应的键合势能和非键势能;
22.基于所述配体、所述蛋白、所述环境信息、所述键合势能和所述非键势能,计算得到所述蛋白分子构象对应的体系总势能;
23.基于所述体系总势能和偏置势能函数,计算得到所述蛋白分子构象对应的目标偏置势能;
24.基于所述目标偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。
25.可选地,在所述基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象之后,还包括:
26.将下一时刻作为当前时刻,迭代执行所述获取所述蛋白分子构象与配体之间的非键势能,至所述基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象的步骤,得到多个时刻的蛋白分子构象;
27.根据多个时刻的蛋白分子构象,生成所述蛋白分子的动态蛋白分子构象。
28.第二方面,本技术实施例提供了一种蛋白分子构象的生成装置,所述装置包括:
29.pdb结构获取模块,用于获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构;
30.蛋白分子构象获取模块,用于对所述pdb晶体结构进行处理,得到所述蛋白分子在当前时刻的蛋白分子构象;
31.非键势能获取模块,用于获取所述蛋白分子构象与配体之间的非键势能;
32.偏置势能计算模块,用于根据所述非键势能和偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能;
33.蛋白分子构象生成模块,用于基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。
34.可选地,所述非键势能获取模块包括:
35.蛋白构象信息获取单元,用于获取所述蛋白分子构象对应的配体、蛋白和环境信息;
36.非键势能计算单元,用于计算得到配体之间的第一非键势能、蛋白与配体之间的第二非键势能和配体与环境信息之间的第三非键势能;
37.非键势能获取单元,用于计算得到所述第一非键势能、所述第二非键势能和所述第三非键势能之间的和值,并将该和值作为所述与配体关联的非键势能。
38.可选地,所述偏置势能计算模块包括:
39.势能值获取单元,用于获取统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值;
40.偏置势能计算单元,用于基于所述势能最大值、所述势能最小值、所述平均值、所述标准偏差值和所述偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能。
41.可选地,所述装置还包括:
42.键合势能获取模块,用于获取所述蛋白分子构象对应的配体、蛋白和环境信息,以及所述蛋白分子构象对应的键合势能和非键势能;
43.体系总势能计算模块,用于基于所述配体、所述蛋白、所述环境信息、所述键合势能和所述非键势能,计算得到所述蛋白分子构象对应的体系总势能;
44.目标偏置势能计算模块,用于基于所述体系总势能和偏置势能函数,计算得到所述蛋白分子构象对应的目标偏置势能;
45.蛋白构象生成模块,用于基于所述目标偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。
46.可选地,所述装置还包括:
47.多个构象获取模块,用于将下一时刻作为当前时刻,迭代执行所述非键势能获取模块、所述偏置势能计算模块和所述蛋白分子构象生成模块,得到多个时刻的蛋白分子构象;
48.动态构象生成模块,用于根据多个时刻的蛋白分子构象,生成所述蛋白分子的动态蛋白分子构象。
49.第三方面,本技术实施例提供了一种电子设备,包括:
50.处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的蛋白分子构象的生成方法。
51.第四方面,本技术实施例提供了一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的蛋白分子构象的生成方法。
52.与现有技术相比,本技术实施例包括以下优点:
53.本技术实施例中,通过获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构,对pdb晶体结构进行处理,得到蛋白分子在当前时刻的蛋白分子构象,获取蛋白分子构象与配体之间的非键势能,根据非键势能和偏置势能函数,计算得到蛋白分子构象对应的偏置势能,基于偏置势能和蛋白分子构象,生成蛋白分子在下一时刻的蛋白分子构象。本技术实施例根据蛋白分子构象的偏置势能模拟得到结合态的蛋白分子构象,可以在0.2微秒的时间下模拟得到结合态的构象,大大的提高了模拟的采样效率。
54.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
55.图1为本技术实施例提供的一种蛋白分子构象的生成方法的步骤流程图;
56.图2为本技术实施例提供的一种非键势能获取方法的步骤流程图;
57.图3为本技术实施例提供的一种偏置势能计算方法的步骤流程图;
58.图4为本技术实施例提供的另一种蛋白分子构象的生成方法的步骤流程图;
59.图5为本技术实施例提供的一种动态蛋白分子构象生成方法的步骤流程图;
60.图6为本技术实施例提供的一种蛋白分子构象的生成装置的结构示意图;
61.图7为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
62.为使本技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本技术作进一步详细的说明。
63.在本技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。在本技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
64.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端中还存在另外的相同要素。
65.参照图1,示出了本技术实施例提供的一种蛋白分子构象的生成方法的步骤流程图,如图1所示,该蛋白分子构象的生成方法可以包括:步骤101、步骤102、步骤103、步骤104和步骤105。
66.步骤101:获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构。
67.本技术实施例可以应用于结合蛋白分子构象的偏置势能模拟得到结合态的蛋白分子构象的场景中。
68.分子动力学模拟是近年来飞速发展的一种分子模拟方法,它以经典力学、量子力学、统计力学为基础,利用计算机数值求解分子体系运动方程的方法,模拟研究分子体系在三维空间的运动状态,在生物分子发挥生理功能的作用机制,小分子与潜在靶点的识别等科学问题上提供帮助。
69.增强采样是指在分子动力学模拟中采用的一种技术,通过引入偏置的方法加速体系的模拟变化。由于配体与受体的结合/解离过程涉及很高的能垒,因此通过常规动力学模拟很难捕捉这些“缓慢”的物理过程。为了提高采样的效率,增强采样技术被开发出来,有选择的强化对应问题的采样概率,从而有效表征其各种化学热力学和化学动力学性质,如配
体-受体结合/解离过程的势能谱等。
70.在实际应用中,在模拟蛋白分子的蛋白分子构象时,可以获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构。具体地,可以下载hiv的pdb(蛋白质三维结构数据文件)晶体结构,并生成对应的拓扑文件和力场文件。
71.在获取到蛋白分子对应的pdb晶体结构之后,执行步骤102。
72.步骤102:对所述pdb晶体结构进行处理,得到所述蛋白分子在当前时刻的蛋白分子构象。
73.在获取到蛋白分子对应的pdb晶体结构之后,可以对蛋白分子的pdb晶体结构进行处理,以得到蛋白分子在当前时刻的蛋白分子构象。具体地处理过程可以为:1、添加溶剂,添加离子中和体系的总电荷。2、运行能量最小化,依次进行溶剂的能量最小化,蛋白侧链的最小化,总体系的最小化。3、升高体系温度至适合的温度,如310k等。4、依次在nvt(恒温恒容)系综,npt(恒温恒压)系综中进行弛豫(指的是在某一个渐变物理过程中,从某一个状态逐渐地恢复到平衡态的过程),使体系在设定温度下保持平衡。进而可以获取蛋白分子在当前时刻的蛋白分子构象。
74.在对pdb晶体结构进行处理得到蛋白分子在当前时刻的蛋白分子构象之后,执行步骤103。
75.步骤103:获取所述蛋白分子构象与配体之间的非键势能。
76.在对pdb晶体结构进行处理得到蛋白分子在当前时刻的蛋白分子构象之后,可以获取蛋白分子构象与配体之间的非键势能。具体地,可以计算蛋白分子构象对应的配体、蛋白和环境信息之间的非键势能,然后计算出蛋白分子构象与配体之间的非键势能。对于该实现过程可以结合图2进行如下详细描述。
77.参照图2,示出了本技术实施例提供的一种非键势能获取方法的步骤流程图。如图2所示,该非键势能获取方法可以包括:步骤201、步骤202和步骤203。
78.步骤201:获取所述蛋白分子构象对应的配体、蛋白和环境信息。
79.在本实施例中,在获取到蛋白分子在当前时刻的蛋白分子构象的同时,可以获取蛋白分子构象对应的配体、蛋白、以及所处的环境信息。
80.在获取到蛋白分子构象对应的配体、蛋白和环境信息之后,执行步骤202。
81.步骤202:计算得到配体之间的第一非键势能、蛋白与配体之间的第二非键势能和配体与环境信息之间的第三非键势能。
82.在获取到蛋白分子构象对应的配体、蛋白和环境信息之后,可以计算得到配体之间的第一非键势能,蛋白与配体之间的第二非键势能,以及配体与环境信息之间的第三非键势能。
83.在计算得到配体之间的第一非键势能、蛋白与配体之间的第二非键势能和配体与环境信息之间的第三非键势能之后,执行步骤203。
84.步骤203:计算得到所述第一非键势能、所述第二非键势能和所述第三非键势能之间的和值,并将该和值作为所述与配体关联的非键势能。
85.在计算计算得到配体之间的第一非键势能、蛋白与配体之间的第二非键势能和配体与环境信息之间的第三非键势能之后,可以计算出第一非键势能、第二非键势能和第三非键势能之间的和值,并将该和值作为与配体关联的非键势能。具体地计算公式如下:
[0086]vl,nb
(r)=v
ll,nb
(r
l
)+v
pl,nb
(r
pl
)+v
le,nb
(r
le
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0087]
上述公式(1)中,v
l,nb
(r)为蛋白分子构象与配体关联的非键势能,v
ll,nb
(r
l
)代表了配体之间的非键势能(即第一非键势能),v
pl,nb
(r
pl
)代表了配体和蛋白之间的非键势能(即第二非键势能),v
le,nb
(r
le
)代表了配体和环境之间的非键势能(即第三非键势能)。
[0088]
在获取到蛋白分子构象与配体之间的非键势能之后,执行步骤104。
[0089]
步骤104:根据所述非键势能和偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能。
[0090]
在获取到蛋白分子构象与配体之间的非键势能之后,可以根据非键势能和偏置势能函数,计算得到蛋白分子构象对应的偏置势能。具体地,可以根据统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值,共同计算出蛋白分子构象对应的偏置势能。对于该实现过程可以结合图3进行如下详细描述。
[0091]
参照图3,示出了本技术实施例提供的一种偏置势能计算方法的步骤流程图。如图3所示,该偏置势能计算方法可以包括:步骤301和步骤302。
[0092]
步骤301:获取统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值。
[0093]
在本实施例中,可以获取统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值。具体地,在获取到当前时刻的蛋白分子构象之后,可以根据蛋白分子构象当前所处的环境,获取到蛋白分子构象对应的势能最大值和势能最小值,同时,可以计算出原构象势能的平均值和标准偏差值。
[0094]
在获取统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值之后,执行步骤302。
[0095]
步骤302:基于所述势能最大值、所述势能最小值、所述平均值、所述标准偏差值和所述偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能。
[0096]
在获取统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值之后,可以基于势能最大值、势能最小值、平均值、标准偏差值和偏置势能函数,计算得到蛋白分子构象对应的偏置势能。具体地计算公式如下所示:
[0097][0098][0099]
上述公式(2)中,f(v)为偏置势能,f'(v)为偏置势能的一阶导数,v为蛋白分子构象与配体之间的非键势能,f代表了从构象势能到偏置势的映射。因此构造f(v
l,nb
)即可用于加速配体的解离。v
max
和v
min
指常规模拟中统计得到的势能最大值和最小值,c、k、σ0为自定义的参数,v
av
和σv分别为模拟中原构象势能统计的平均值和标准偏差值。
[0100]
在根据非键势能和偏置势能函数计算得到蛋白分子构象对应的偏置势能之后,执行步骤105。
[0101]
步骤105:基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻
的蛋白分子构象。
[0102]
在根据非键势能和偏置势能函数计算得到蛋白分子构象对应的偏置势能之后,可以基于偏置势能和当前时刻的蛋白分子构象,生成蛋白分子在下一时刻的蛋白分子构象。
[0103]
本技术实施例根据蛋白分子构象的偏置势能模拟得到结合态的蛋白分子构象,可以在0.2微秒的时间下模拟得到结合态的构象,大大的提高了模拟的采样效率。
[0104]
在具体实现中,还可以根据经验立场基于粒子三维坐标r得到的体系总势能v进行偏置势加速。具体地,可以结合图4进行如下详细描述。
[0105]
参照图4,示出了本技术实施例提供的另一种蛋白分子构象的生成方法的步骤流程图。如图4所示,该蛋白分子构象的生成方法可以包括:步骤401、步骤402、步骤403和步骤404。
[0106]
步骤401:获取所述蛋白分子构象对应的配体、蛋白和环境信息,以及所述蛋白分子构象对应的键合势能和非键势能。
[0107]
在本实施例中,可以获取蛋白分子构象对应的配体、蛋白和环境信息,以及蛋白分子构象对应的键合势能和非键势能。具体地,可以在获取到蛋白分子在当前时刻的蛋白分子构象之后,可以获取蛋白分子构象对应的配体、蛋白,以及蛋白分子构象当前所处的环境信息。以及蛋白分子构象对应的键合势能和非键势能。
[0108]
在获取到蛋白分子构象对应的配体、蛋白和环境信息,以及蛋白分子构象对应的键合势能和非键势能之后,执行步骤402。
[0109]
步骤402:基于所述配体、所述蛋白、所述环境信息、所述键合势能和所述非键势能,计算得到所述蛋白分子构象对应的体系总势能。
[0110]
在获取到蛋白分子构象对应的配体、蛋白和环境信息,以及蛋白分子构象对应的键合势能和非键势能之后,可以基于配体、蛋白、环境信息、键合势能和非键势能,计算得到蛋白分子构象对应的体系总势能。具体地计算公式如下所示:
[0111][0112]
上述公式(3)中,v(r)为根据经验立场基于粒子三维坐标r得到的体系总势能,p、l、e分别表示蛋白、配体和环境,b、nb分别代表键合势能和非键势能,v
ll,nb
(r
l
)代表了配体之间的非键势能,v
pl,nb
(r
pl
)代表了配体和蛋白之间的非键势能,v
le,nb
(r
le
)代表了配体和环境之间的非键势能。v
p,b
(r
p
)代表蛋白内的成键势能,v
l,b
(r
l
)代表配体内的成键势能,v
e,b
(re)代表环境内的成键势能,v
pp,nb
(r
p
)代表蛋白和蛋白之间的非键势能,v
ee,nb
(re)代表环境和环境之间的非键势能,v
pe,nb
(r
pe
)代表蛋白和环境之间的非键势能,v
le,nb
(r
le
)代表配体与环境之间的非键势能。
[0113]
在基于配体、蛋白、环境信息、键合势能和非键势能,计算得到蛋白分子构象对应的体系总势能之后,执行步骤403。
[0114]
步骤403:基于所述体系总势能和偏置势能函数,计算得到所述蛋白分子构象对应的目标偏置势能。
[0115]
在基于配体、蛋白、环境信息、键合势能和非键势能,计算得到蛋白分子构象对应的体系总势能之后,可以基于体系总势能和偏置势能函数,计算得到蛋白分子构象对应的
目标偏置势能。即将上述公式(2)中的v替换为体系总势能,即可计算得到目标偏置势能。
[0116]
在基于体系总势能和偏置势能函数计算得到蛋白分子构象对应的目标偏置势能之后,执行步骤404。
[0117]
步骤404:基于所述目标偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。
[0118]
在基于体系总势能和偏置势能函数计算得到蛋白分子构象对应的目标偏置势能之后,可以基于目标偏置势能和蛋白分子构象,生成蛋白分子在下一时刻的蛋白分子构象。
[0119]
本技术实施例中,除了基于蛋白分子构象与配体之间的非键势能进行偏置势加速,还可以基于体系总势能进行偏置势加速,从而加速配体的解离。inter-samd可的适用场景为探究配体与蛋白间的相互作用,能够解决gamd效率不足的问题。例如,hiv蛋白是重要的药物靶标,hiv蛋白由两个侧翼蛋白组成,其侧翼区域有很高的柔性。结合位点是一个中空的长孔道。与配体结合时两个侧翼处于闭合状态,探究hiv的动态结构可能有助于相关的药物设计。xk263是hiv蛋白的一个已知的配体抑制剂,然而目前尚未通过常规md得到配体和hiv蛋白结合的构象(最长运行了14微秒,以xk263距离结合口袋以上作为模拟初始体系)。通过使用inter-samd,最快可在不到200纳秒,即0.2微秒的时间下模拟得到了结合态的构象,大大的提高了模拟的采样效率。
[0120]
在本实施例中,通过迭代执行上述步骤103~步骤105即可以得到动态蛋白分子构象。对于该实现过程可以结合图5进行如下详细描述。
[0121]
参照图5,示出了本技术实施例提供的一种动态蛋白分子构象生成方法的步骤流程图。如图5所示,该动态蛋白分子构象生成方法可以包括:步骤501和步骤502。
[0122]
步骤501:将下一时刻作为当前时刻,迭代执行步骤103、步骤104和步骤105,得到多个时刻的蛋白分子构象。
[0123]
在本实施例中,在基于偏置势能和蛋白分子构象生成蛋白分子在下一时刻的蛋白分子构象之后,可以将下一时刻作为当前时刻,并迭代执行步骤103、步骤104和步骤105,以得到多个时刻的蛋白分子构象。
[0124]
在得到多个时刻的蛋白分子构象之后,执行步骤502。
[0125]
步骤502:根据多个时刻的蛋白分子构象,生成所述蛋白分子的动态蛋白分子构象。
[0126]
在得到多个时刻的蛋白分子构象之后,可以根据多个时刻的蛋白分子构象生成蛋白分子的动态蛋白分子构象。
[0127]
本技术实施例提供的蛋白分子构象的生成方法,通过获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构,对pdb晶体结构进行处理,得到蛋白分子在当前时刻的蛋白分子构象,获取蛋白分子构象与配体之间的非键势能,根据非键势能和偏置势能函数,计算得到蛋白分子构象对应的偏置势能,基于偏置势能和蛋白分子构象,生成蛋白分子在下一时刻的蛋白分子构象。本技术实施例根据蛋白分子构象的偏置势能模拟得到结合态的蛋白分子构象,可以在0.2微秒的时间下模拟得到结合态的构象,大大的提高了模拟的采样效率。
[0128]
参照图6,示出了本技术实施例提供的一种蛋白分子构象的生成装置的结构示意图,如图6所示,该蛋白分子构象的生成装置600可以包括以下模块:
[0129]
pdb结构获取模块610,用于获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构;
[0130]
蛋白分子构象获取模块620,用于对所述pdb晶体结构进行处理,得到所述蛋白分子在当前时刻的蛋白分子构象;
[0131]
非键势能获取模块630,用于获取所述蛋白分子构象与配体之间的非键势能;
[0132]
偏置势能计算模块640,用于根据所述非键势能和偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能;
[0133]
蛋白分子构象生成模块650,用于基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。
[0134]
可选地,所述非键势能获取模块包括:
[0135]
蛋白构象信息获取单元,用于获取所述蛋白分子构象对应的配体、蛋白和环境信息;
[0136]
非键势能计算单元,用于计算得到配体之间的第一非键势能、蛋白与配体之间的第二非键势能和配体与环境信息之间的第三非键势能;
[0137]
非键势能获取单元,用于计算得到所述第一非键势能、所述第二非键势能和所述第三非键势能之间的和值,并将该和值作为所述与配体关联的非键势能。
[0138]
可选地,所述偏置势能计算模块包括:
[0139]
势能值获取单元,用于获取统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值;
[0140]
偏置势能计算单元,用于基于所述势能最大值、所述势能最小值、所述平均值、所述标准偏差值和所述偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能。
[0141]
可选地,所述装置还包括:
[0142]
键合势能获取模块,用于获取所述蛋白分子构象对应的配体、蛋白和环境信息,以及所述蛋白分子构象对应的键合势能和非键势能;
[0143]
体系总势能计算模块,用于基于所述配体、所述蛋白、所述环境信息、所述键合势能和所述非键势能,计算得到所述蛋白分子构象对应的体系总势能;
[0144]
目标偏置势能计算模块,用于基于所述体系总势能和偏置势能函数,计算得到所述蛋白分子构象对应的目标偏置势能;
[0145]
蛋白构象生成模块,用于基于所述目标偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。
[0146]
可选地,所述装置还包括:
[0147]
多个构象获取模块,用于将下一时刻作为当前时刻,迭代执行所述非键势能获取模块、所述偏置势能计算模块和所述蛋白分子构象生成模块,得到多个时刻的蛋白分子构象;
[0148]
动态构象生成模块,用于根据多个时刻的蛋白分子构象,生成所述蛋白分子的动态蛋白分子构象。
[0149]
本技术实施例提供的蛋白分子构象的生成装置,通过获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构,对pdb晶体结构进行处理,得到蛋白分子在当前时刻的蛋白分子构象,获取蛋白分子构象与配体之间的非键势能,根据非键势能和偏置势能函数,
计算得到蛋白分子构象对应的偏置势能,基于偏置势能和蛋白分子构象,生成蛋白分子在下一时刻的蛋白分子构象。本技术实施例根据蛋白分子构象的偏置势能模拟得到结合态的蛋白分子构象,可以在0.2微秒的时间下模拟得到结合态的构象,大大的提高了模拟的采样效率。
[0150]
本技术实施例提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述蛋白分子构象的生成方法。
[0151]
图7示出了本发明实施例的一种电子设备700的结构示意图。如图7所示,电子设备700包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的计算机程序指令或者从存储单元708加载到随机访问存储器(ram)703中的计算机程序指令,来执行各种适当的动作和处理。在ram703中,还可存储电子设备700操作所需的各种程序和数据。cpu701、rom702以及ram703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
[0152]
电子设备700中的多个部件连接至i/o接口705,包括:输入单元706,例如键盘、鼠标、麦克风等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0153]
上文所描述的各个过程和处理,可由处理单元701执行。例如,上述任一实施例的方法可被实现为计算机软件程序,其被有形地包含于计算机可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由rom702和/或通信单元709而被载入和/或安装到电子设备700上。当计算机程序被加载到ram703并由cpu701执行时,可以执行上文描述的方法中的一个或多个动作。
[0154]
本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述蛋白分子构象的生成方法。
[0155]
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0156]
本领域内的技术人员应明白,本技术实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本技术实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0157]
本技术实施例是参照根据本技术实施例的方法、终端(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0158]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端以特
定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0159]
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端上,使得在计算机或其他可编程终端上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0160]
尽管已描述了本技术实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术实施例范围的所有变更和修改。
[0161]
以上对本技术所提供的一种蛋白分子构象的生成方法、一种蛋白分子构象的生成装置、一种电子设备和一种计算机可读存储介质,进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。

技术特征:
1.一种蛋白分子构象的生成方法,其特征在于,所述方法包括:获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构;对所述pdb晶体结构进行处理,得到所述蛋白分子在当前时刻的蛋白分子构象;获取所述蛋白分子构象与配体之间的非键势能;根据所述非键势能和偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能;基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。2.根据权利要求1所述的方法,其特征在于,所述获取所述蛋白分子构象与配体之间的非键势能,包括:获取所述蛋白分子构象对应的配体、蛋白和环境信息;计算得到配体之间的第一非键势能、蛋白与配体之间的第二非键势能和配体与环境信息之间的第三非键势能;计算得到所述第一非键势能、所述第二非键势能和所述第三非键势能之间的和值,并将该和值作为所述与配体关联的非键势能。3.根据权利要求1所述的方法,其特征在于,所述根据所述非键势能和偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能,包括:获取统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值;基于所述势能最大值、所述势能最小值、所述平均值、所述标准偏差值和所述偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能。4.根据权利要求1所述的方法,其特征在于,在所述对所述pdb晶体结构进行处理,得到所述蛋白分子在当前时刻的蛋白分子构象之后,还包括:获取所述蛋白分子构象对应的配体、蛋白和环境信息,以及所述蛋白分子构象对应的键合势能和非键势能;基于所述配体、所述蛋白、所述环境信息、所述键合势能和所述非键势能,计算得到所述蛋白分子构象对应的体系总势能;基于所述体系总势能和偏置势能函数,计算得到所述蛋白分子构象对应的目标偏置势能;基于所述目标偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。5.根据权利要求1所述的方法,其特征在于,在所述基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象之后,还包括:将下一时刻作为当前时刻,迭代执行所述获取所述蛋白分子构象与配体之间的非键势能,至所述基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象的步骤,得到多个时刻的蛋白分子构象;根据多个时刻的蛋白分子构象,生成所述蛋白分子的动态蛋白分子构象。6.一种蛋白分子构象的生成装置,其特征在于,所述装置包括:pdb结构获取模块,用于获取蛋白分子对应的pdb(蛋白质三维结构数据文件)晶体结构;
蛋白分子构象获取模块,用于对所述pdb晶体结构进行处理,得到所述蛋白分子在当前时刻的蛋白分子构象;非键势能获取模块,用于获取所述蛋白分子构象与配体之间的非键势能;偏置势能计算模块,用于根据所述非键势能和偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能;蛋白分子构象生成模块,用于基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。7.根据权利要求6所述的装置,其特征在于,所述非键势能获取模块包括:蛋白构象信息获取单元,用于获取所述蛋白分子构象对应的配体、蛋白和环境信息;非键势能计算单元,用于计算得到配体之间的第一非键势能、蛋白与配体之间的第二非键势能和配体与环境信息之间的第三非键势能;非键势能获取单元,用于计算得到所述第一非键势能、所述第二非键势能和所述第三非键势能之间的和值,并将该和值作为所述与配体关联的非键势能。8.根据权利要求6所述的装置,其特征在于,所述偏置势能计算模块包括:势能值获取单元,用于获取统计得到的势能最大值和势能最小值,以及原构象势能对应的平均值和标准偏差值;偏置势能计算单元,用于基于所述势能最大值、所述势能最小值、所述平均值、所述标准偏差值和所述偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能。9.根据权利要求6所述的装置,其特征在于,所述装置还包括:键合势能获取模块,用于获取所述蛋白分子构象对应的配体、蛋白和环境信息,以及所述蛋白分子构象对应的键合势能和非键势能;体系总势能计算模块,用于基于所述配体、所述蛋白、所述环境信息、所述键合势能和所述非键势能,计算得到所述蛋白分子构象对应的体系总势能;目标偏置势能计算模块,用于基于所述体系总势能和偏置势能函数,计算得到所述蛋白分子构象对应的目标偏置势能;蛋白构象生成模块,用于基于所述目标偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。10.根据权利要求6所述的装置,其特征在于,所述装置还包括:多个构象获取模块,用于将下一时刻作为当前时刻,迭代执行所述非键势能获取模块、所述偏置势能计算模块和所述蛋白分子构象生成模块,得到多个时刻的蛋白分子构象;动态构象生成模块,用于根据多个时刻的蛋白分子构象,生成所述蛋白分子的动态蛋白分子构象。

技术总结
本申请实施例提供了一种蛋白分子构象的生成方法及装置。所述方法包括:获取蛋白分子对应的PDB(蛋白质三维结构数据文件)晶体结构;对所述PDB晶体结构进行处理,得到所述蛋白分子在当前时刻的蛋白分子构象;获取所述蛋白分子构象与配体之间的非键势能;根据所述非键势能和偏置势能函数,计算得到所述蛋白分子构象对应的偏置势能;基于所述偏置势能和所述蛋白分子构象,生成所述蛋白分子在下一时刻的蛋白分子构象。本申请实施例可以在0.2微秒的时间下模拟得到结合态的构象,大大的提高了模拟的采样效率。的采样效率。的采样效率。


技术研发人员:赵奕淏 康玉 侯廷军 张锦途 谢昌谕 邓亚峰
受保护的技术使用者:杭州碳硅智慧科技发展有限公司
技术研发日:2023.04.19
技术公布日:2023/8/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐