基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法和装置与流程

未命名 09-03 阅读:112 评论:0


1.本技术涉及计算机及计算结构生物学技术领域,尤其涉及一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法和装置。


背景技术:

2.蛋白质是一种高效、高特异行使生理功能的大分子,可以被广泛地应用于生物医药领域与化工生产领域。然而蛋白质通常在温和的条件下工作,在极端条件下极易失活,严重制约了其应用。
3.自然界中存在少量可以在极端条件下仍具有活性的蛋白:聚合酶链式反应中所使用的dna聚合酶来自于一株生长在温泉中的噬热杆菌,较最原始的大肠杆菌dna聚合酶的热稳定性大幅提升。噬热杆菌dna聚合酶从序列与上都与大肠杆菌dna聚合酶比较接近,但两者在热稳定性上却有着天壤之别。
4.1961年,克里斯蒂安
·
安芬森完成了牛胰核糖核酸酶等一系列蛋白的变性与复性试验,发现折叠蛋白质或者变性蛋白质在生理条件下蛋白质仍可以恢复到原有的结构。例如高温或化学因素会使蛋白质发生变性,使其结构松散或解体,而当环境变回到原来状态时,松散或解体的蛋白质可以瞬间折叠回复原来的立体结构,且无论实验多少次,蛋白质都仅此一种立体结构。安芬森随即指出蛋白质的一级结构氨基酸序列包含了其二级或更高级别结构的全部信息,即蛋白的一级结构决定了高级结构。
5.因此,如何快速从蛋白质的一级结构或二级结构入手,定点精准分析蛋白质的刚性弱点,是亟需解决的问题。


技术实现要素:

6.为解决或部分解决相关技术中存在的问题,本技术提供一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法和装置,能够快速分析蛋白结构的刚性弱点,为提高蛋白稳定性的理性设计提供参考。
7.本技术第一方面提供一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法,包括:
8.获取目标蛋白分子的第一晶体结构;
9.对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化晶体结构;
10.构建所述能量极小化晶体结构的原子节点与网络约束模型;
11.对所述能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至所述能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态;
12.对处于运动平衡状态的所述能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果;
13.根据所述解析结果,找出所述目标蛋白分子中的刚性薄弱区域。
14.作为一个可选的实施例,所述获取目标蛋白分子的第一晶体结构,包括:
15.获取带有所述目标蛋白分子的第二晶体结构;
16.对所述第二晶体结构进行晶体结构进行修复,得到修复后的第二晶体结构;
17.从所述修复后的第二晶体结构中分离出所述目标蛋白分子的第一晶体结构。
18.作为一个可选的实施例,所述对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化晶体结构,包括:
19.为所述第一晶体结构添加水分子模型与力场,构建所述目标蛋白分子的拓扑结构;
20.为所述拓扑结构添加模拟盒子;
21.采用预置方法对添加模拟盒子的所述拓扑结构在真空条件下进行能量极小化模拟的预处理;
22.对添加模拟盒子的所述拓扑结构在真空条件下正式进行能量极小化模拟,得到模拟结果;
23.将所述模拟结果对应的所述拓扑结构转换为所述目标蛋白分子的能量极小化晶体结构,并输出所述能量极小化晶体结构。
24.作为一个可选的实施例,所述构建所述能量极小化晶体结构的原子节点与网络约束模型,包括:
25.将所述能量极小化晶体结构中的所有原子作为原子节点,以及将所述所有原子之间的共价键和非共价键作为连线;
26.按照所述共价键和所述非共价键的类型设定对应的所述连线的运动形式。
27.作为一个可选的实施例,所述按照所述共价键和所述非共价键的类型设定对应的所述连线的运动形式,包括:
28.若所述共价键为肽键或共价双键,则限制所述肽键或所述共价双键对应的所述连线的旋转;
29.若所述共价键为共价单键,则设定所述共价单键对应的所述连线可绕键轴旋转,且不可断裂;
30.若所述非共价键为氢键、盐键和疏水作用中的一种,则设定所述氢键或盐键对应的所述连线可断裂。
31.作为一个可选的实施例,将所述原子之间的范德华作用不作为连线。
32.作为一个可选的实施例,所述对所述能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至所述能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态,包括:
33.模拟所述能量极小化晶体结构的原子节点与网络约束模型在升温过程中所述连线断裂的过程,直至所述能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态。
34.作为一个可选的实施例,所述对处于运动平衡状态的所述能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果,包括:
35.将解析中所述连线未断裂且仍保持原有网络的所述原子节点聚为一类,并分为不
同结构簇;
36.将所述不同结构簇打上不同标记,得到具有不同标记的多个不同结构簇。
37.作为一个可选的实施例,所述根据所述解析结果,找出所述目标蛋白分子中的刚性薄弱区域,包括:
38.根据所述具有不同标记的多个不同结构簇,找到相互作用比较薄弱的结构簇,以及找到所述相互作用比较薄弱的结构簇中氨基酸残基所在的二级结构信息。
39.本技术第二方面提供一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的装置,包括:
40.获取模块,用于获取目标蛋白分子的第一晶体结构;
41.第一模拟模块,用于对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化晶体结构;
42.构建模块,用于构建所述能量极小化晶体结构的原子节点与网络约束模型;
43.第二模拟模块,用于对所述能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至所述能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态;
44.解析模块,用于对处于运动平衡状态的所述能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果;
45.确定模块,用于根据所述解析结果,找出所述目标蛋白分子中的刚性薄弱区域。
46.本技术第三方面提供一种电子设备,包括:
47.处理器;以及
48.存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
49.本技术第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
50.本技术提供的技术方案可以包括以下有益效果:
51.本技术实施例通过获取目标蛋白分子的第一晶体结构;对第一晶体结构进行自由能极小化模拟,获得能量极小化晶体结构;构建能量极小化晶体结构的原子节点与网络约束模型,将复杂的蛋白质结构变成了节点、连线与网络的简单结构;再对能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态;对处于运动平衡状态的能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果;最后根据解析结果,找出目标蛋白分子中的刚性薄弱区域。这样就能够计算出目标蛋白分子结构的刚性薄弱区域,寻找出更合适的改构位点或区域,从而能对蛋白分子进行针对性的突变,以提高蛋白分子的稳定性。
52.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
53.通过结合附图对本技术示例性实施方式进行更详细地描述,本技术的上述以及其它目的、特征和优势将变得更加明显,其中,在本技术示例性实施方式中,相同的参考标号
通常代表相同部件。
54.图1是本技术实施例示出的一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法的一种流程示意图;
55.图2是本技术实施例示出的一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法的另一种流程示意图;
56.图3是本技术实施例示出的一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法的流程框架示意图;
57.图4是本技术实施例示出的fgf10蛋白分子的刚性薄弱区域示意图;
58.图5是本技术实施例示出的基于原子节点与网络约束模型解析蛋白结构刚性弱点的装置的结构示意图;
59.图6是本技术实施例示出的电子设备的结构示意图。
具体实施方式
60.下面将参照附图更详细地描述本技术的实施方式。虽然附图中显示了本技术的实施方式,然而应该理解,可以以各种形式实现本技术而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本技术更加透彻和完整,并且能够将本技术的范围完整地传达给本领域的技术人员。
61.在本技术使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。在本技术和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
62.应当理解,尽管在本技术可能采用术语“第一”、“第二”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本技术范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
63.本技术实施例提供一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法,基于计算机及计算结构生物学技术,能够快速分析蛋白结构刚性弱点,为提高蛋白稳定性理性设计提供参考。
64.以下结合附图详细描述本技术实施例的技术方案。
65.图1是本技术实施例示出的一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法的一种流程示意图。
66.参见图1,本技术实施例一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法,包括步骤s1至步骤s6:
67.步骤s1:获取目标蛋白分子的第一晶体结构。
68.本技术实施例可以通过以下方式获得获取目标蛋白分子的第一晶体结构:获取目标蛋白分子的第二晶体结构;对第二晶体结构进行晶体结构进行修复,得到修复后的第二晶体结构;从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构。
69.其中,本技术实施例的第二晶体结构指目标蛋白分子通过生物物理学方法解析出
的晶体结构。第二晶体结构从蛋白质结构数据库(protein data bank,简称pdb)获得目标蛋白分子的晶体结构。其中,蛋白质结构数据库可以预先构建。还需说明的是,可以采用相关技术的建模方法进行建模,本技术对此不加以限定。
70.步骤s2:对第一晶体结构进行自由能极小化模拟,获得目标蛋白分子的能量极小化晶体结构。
71.本技术实施例可以通过以下方式获得能量极小化晶体结构:为第一晶体结构添加水分子模型与力场,构建目标蛋白分子的拓扑结构;为拓扑结构添加模拟盒子;采用预置方法对拓扑结构在真空条件下进行能量极小化模拟的预处理;对拓扑结构在真空条件下正式进行能量极小化模拟,得到模拟结果;将模拟结果对应的拓扑结构转换为目标蛋白分子的能量极小化晶体结构,并输出能量极小化晶体结构。
72.步骤s3:构建能量极小化晶体结构的原子节点与网络约束模型。
73.本技术实施例可以通过以下方式构建能量极小化晶体结构的原子节点与网络约束模型:将能量极小化晶体结构中的所有原子作为原子节点,以及将所有原子之间的共价键和非共价键作为连线;按照共价键和非共价键的类型设定对应的连线的运动形式。
74.其中,按照共价键和非共价键的类型设定对应的连线的运动形式,可以包括:若共价键为肽键或共价双键,则限制肽键或共价双键对应的连线的旋转;若共价键为共价单键,则设定共价单键对应的连线可绕键轴旋转,且不可断裂;若非共价键为氢键、盐键和疏水作用中的一种,则设定氢键或盐键对应的连线可断裂。
75.步骤s4:对能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态。
76.本技术实施例步骤s4可以通过以下方式进行模拟:模拟能量极小化晶体结构的原子节点与网络约束模型在升温过程中连线断裂的过程,直至能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态。
77.步骤s5:对处于运动平衡状态的能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果。
78.本技术实施例可以通过以下方式进行解析:将解析中连线未断裂且仍保持原有网络的原子节点聚为一类,并分为不同结构簇;将不同结构簇打上不同标记,得到具有不同标记的多个不同结构簇。
79.也就是说,具有相互作用的节点可理解为热解折叠过程中连线未断裂且仍然保持原有网络的一群原子节点。因此,可以将热解折叠过程中连线未断裂且仍然保持原有网络的一群原子节点聚为一类,并分为不同结构簇。
80.步骤s6:根据解析结果,找出目标蛋白分子中的刚性薄弱区域。
81.本技术实施例可以根据具有不同标记的多个不同结构簇,找到相互作用比较薄弱的结构簇,以及找到相互作用比较薄弱的结构簇中氨基酸残基所在的二级结构信息。
82.本技术实施例通过获取目标蛋白分子的第一晶体结构;对第一晶体结构进行自由能极小化模拟,获得能量极小化晶体结构;构建能量极小化晶体结构的原子节点与网络约束模型,将复杂的蛋白质结构变成了节点、连线与网络的简单结构;再对能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态;对处于运动平衡状态的能量极小化晶体结构
的原子节点与网络约束模型进行解析,并得到解析结果;最后根据解析结果,找出目标蛋白分子中的刚性薄弱区域。这样就能够计算出目标蛋白分子结构的刚性薄弱区域,寻找出更合适的改构位点或区域,从而能对蛋白分子进行针对性的突变,以提高蛋白分子的稳定性。
83.图2是本技术实施例示出的一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法的另一种流程示意图;图3是本技术实施例示出的一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法的流程框架示意图。
84.参见图2和图3,本技术实施例一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法,包括以下步骤:
85.s10:获取带有目标蛋白分子的第二晶体结构。
86.本技术实施例的第二晶体结构指目标蛋白分子通过生物物理学方法解析出的晶体结构。第二晶体结构从蛋白质结构数据库(protein data bank,简称pdb)获得目标蛋白分子的晶体结构。其中,蛋白质结构数据库可以预先构建。还需说明的是,可以采用相关技术的建模方法进行建模,本技术对此不加以限定。
87.s11:对第二晶体结构进行晶体结构进行修复,得到修复后的第二晶体结构。
88.例如第二晶体结构中谷氨酰胺残基、天冬酰胺残基侧链中的酰胺基团与组氨酸残基侧链中的咪唑基团的电子密度对称性极高,需要将这些氨基酸残基侧链翻转180
°
,再通过计算与周围原子的相互作用来判定具体位置。其它氨基酸残基则通过侧链基团或肽平面的细微旋转使得能量最优。最终得到修复后的第二晶体结构。
89.s12:从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构。
90.其中,可以采用相关技术中的分离方法,从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构,本技术对此不加以限定。
91.s20:为第一晶体结构添加水分子模型与力场,构建目标蛋白分子的拓扑结构。
92.本技术实施例可以利用分子动力学模拟,输入第一晶体结构,为第一晶体结构添加例如tip3p的水分子模型以及例如amber99sb-ildn的力场,构建目标蛋白分子的拓扑结构。
93.s21:为拓扑结构添加模拟盒子。
94.本技术实施例的模拟盒子可以为溶剂盒子,可以定义模拟盒子的形状和大小,例如可以为目标蛋白分子的拓扑结构添加与边界距离为2nm的立方体模拟盒子。
95.s22:采用预置方法对添加模拟盒子的拓扑结构在真空条件下进行能量极小化模拟的预处理。
96.本技术实施例的预置方法可以为最陡下降法,可根据实际情况设置能量极小化的步数。
97.s23:对添加模拟盒子的拓扑结构在真空条件下正式进行能量极小化模拟,得到模拟结果。
98.根据步骤s22的预处理可以获得能量极小化的最优步数,利用能量极小化的最优步数对拓扑结构在真空条件下正式进行能量极小化模拟。
99.s24:将模拟结果对应的拓扑结构转换为目标蛋白分子的能量极小化晶体结构,并输出能量极小化晶体结构。
100.由于模拟结果是目标蛋白分子的拓扑结构,因此需要将目标蛋白分子的拓扑结构
转化为晶体结构,并作为目标蛋白分子的能量极小化晶体结构。
101.s30:将能量极小化晶体结构中的所有原子作为原子节点,以及将所有原子之间的共价键和非共价键作为连线。
102.该步骤中,可以将能量极小化晶体结构中的所有原子作为节点,以及将所有原子之间的共价键和非共价键作为连线。另外,还可以将原子之间的范德华作用不作为连线。
103.通过构建能量极小化晶体结构的原子节点与网络约束模型,将复杂的蛋白质结构变成了节点、连线与网络的简单结构,极大减少了后续的计算量,提高解析蛋白分子结构刚性弱点的效率。
104.s31:按照共价键和非共价键的类型设定对应的连线的运动形式。
105.例如:若共价键为肽键或共价双键,则限制肽键或共价双键对应的连线的旋转。若共价键为共价单键,则设定共价单键对应的连线可绕键轴旋转,且不可断裂。若非共价键为氢键、盐键和疏水作用中的一种,则设定氢键或盐键对应的连线可断裂。
106.s40:模拟能量极小化晶体结构的原子节点与网络约束模型在升温过程中连线断裂的过程,直至能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态。
107.本技术实施例模拟热解折叠过程,并采集设定数量例如5000个处于运动平衡状态原子节点与网络约束模型的构象用于统计分析。
108.下面以几种非共价键为例,说明热解折叠过程:
109.氢键、盐键的连线断裂的能量模拟如下公式:
[0110][0111]
为高斯白噪声,为均值为0标准差取决于氢键的高斯分布。
[0112]
疏水作用的连线断裂的能量模拟如下公式:
[0113][0114]dij
为节点之间的距离,d
vdw
为范德华相互作用,d
cut
为高斯函数半高宽。
[0115]
s50:将解析中连线未断裂且仍保持原有网络的原子节点聚为一类,并分为不同结构簇。
[0116]
统计分析设定数量例如5000个处于运动平衡状态原子节点与网络约束模型的构象在解折叠过程中的连线断裂状况。将热解折叠过程中连线未断裂且仍保持原有网络的一群原子节点聚为一类,并分为不同结构簇。
[0117]
经过热解折叠模拟之后,连线未断裂且仍保持原有网络的原子节点之间的相互作用大,对蛋白分子的稳定性有支撑作用,将这些具有相互作用的节点聚类在一起,形成不同的结构簇。
[0118]
s51:将不同结构簇打上不同标记,得到具有不同标记的多个不同结构簇。
[0119]
本技术实施例对标记的形式不做限定,例如可以是颜色或者数字,只要能对结构簇进行区分即可。通过标记进行区分不同结构簇,可以更加清楚直观地找到符合要求的目标结构簇。
[0120]
s60:根据具有不同标记的多个不同结构簇,找到相互作用比较薄弱的结构簇,以
及找到相互作用比较薄弱的结构簇中氨基酸残基所在的二级结构信息。
[0121]
例如,蛋白分子中存在相对独立的结构簇,说明这些结构簇之间相互作用薄弱,在经过热解折叠模拟之后,连线断裂,那么可以考虑增加这些独立的结构簇之间的相互作用,来提高蛋白分子的热稳定性。
[0122]
下面本技术实施例以人fgf10蛋白分子为例,对基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法进行说明,包括以下步骤:
[0123]
1、先从pdb数据库中获得通过结晶与x射线衍射方法解析得到的带有fgf10蛋白分子的受体fgfr2b复合物的第二晶体结构1nun,再对第二晶体结构1nun进行修复,最后从第二晶体结构1nun中分离出fgf10蛋白分子的第一晶体结构。对第二晶体结构1nun进行修复包括:第二晶体结构1nun中谷氨酰胺残基、天冬酰胺残基侧链中的酰胺基团与组氨酸残基侧链中的咪唑基团的电子密度对称性极高,需要将这些氨基酸残基侧链翻转180
°
,通过计算与周围原子的相互作用来判定具体位置;其它氨基酸残基则通过侧链基团或肽平面的细微旋转使得能量最优;最终得到修复后的第二晶体结构1nun。
[0124]
2、对第一晶体结构进行自由能极小化模拟,获得能量极小化晶体结构。例如可以利用分子动力学模拟,输入fgf10蛋白分子的第一晶体结构,添加tip3p水分子模型与amber99sb-ildn力场,构建fgf10蛋白分子的拓扑结构。再添加与边界距离为2nm的立方体模拟盒子。然后先采用最陡下降法对fgf10蛋白分子的拓扑结构在真空条件下进行能量最小化预处理,再对fgf10蛋白分子的拓扑结构在真空条件下正式进行能量极小化模拟,得到模拟结果。最后将模拟结果对应的fgf10蛋白分子的拓扑结构转换为目标蛋白分子的能量极小化晶体结构,并输出能量极小化晶体结构。
[0125]
3、构建fgf10蛋白分子的能量极小化晶体结构的原子节点与网络约束模型。例如将fgf10蛋白分子的能量极小化晶体结构中的所有原子视为原子节点,以及将所有原子之间的共价键和非共价键作为连线,且将原子之间的范德华作用不作为连线。再按照共价键和非共价键的类型设定对应的连线的运动形式。其中,fgf10蛋白分子的能量极小化晶体结构中的肽键与共价双键计为6条连线,严格限制其旋转。fgf10蛋白分子的能量极小化晶体结构中的共价单键计为5条连线,可绕着健轴旋转,不可断裂。fgf10蛋白分子的能量极小化晶体结构中的氢键、盐键计为5条连线,可断裂。fgf10蛋白分子的能量极小化晶体结构中的疏水作用计为2条连线,可断裂。
[0126]
4、对fgf10蛋白分子的能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至fgf10蛋白分子的能量极小化晶体结构处于运动平衡状态。例如:模拟热解折叠过程,采样数为5000,采集5000个处于运动平衡状态原子节点与网络约束模型的构象用于统计分析。模拟fgf10蛋白分子的能量极小化晶体结构的原子节点与网络约束模型在升温过程中连线断裂的过程,直至fgf10蛋白分子的能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态。
[0127]
5、对处于运动平衡状态的fgf10蛋白分子的能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果。例如:统计分析5000个处于运动平衡状态原子节点与网络约束模型的构象在解折叠过程中的连线断裂状况。将热解折叠过程中连线未断裂且仍保持原有网络的原子节点聚为一类,并分为不同结构簇;将不同结构簇标记不同颜色,得到标记有不同颜色的多个不同结构簇。
[0128]
6、根据具有不同标记的多个不同结构簇,找到fgf10蛋白分子中相互作用比较薄弱的结构簇,以及找到相互作用比较薄弱的结构簇中氨基酸残基所在的二级结构信息。
[0129]
7、通过上述方法,将fgf10晶体结构分为6个相对独立的部分:内核区(core)、a区、b区、c区、d区以及n端。这6个部分形成了6个相对独立的结构簇。每个结构簇内部相互作用紧密,6个结构簇之间相互作用极弱。进一步寻找相互作用比较薄弱的结构簇中氨基酸残基所在的二级结构信息:fgf10的n端、β2-β3loop、β3-β4loop、肝素结合区以及c端与其他区域关联不紧密。这些结构簇与二级结构为fgf10刚性薄弱区域(图4)。针对蛋白分子结构的刚性薄弱区域,可以寻找出更合适的改构位点或区域,从而能对蛋白分子进行针对性的突变,以提高蛋白分子的稳定性。
[0130]
与前述应用功能实现方法实施例相对应,本技术还提供了一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的装置、电子设备及相应的实施例。
[0131]
图5是本技术实施例示出的基于原子节点与网络约束模型解析蛋白结构刚性弱点的装置的结构示意图。
[0132]
参见图5,一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的装置,包括:获取模块50、第一模拟模块51、构建模块52、第二模拟模块53、解析模块54和确定模块55。
[0133]
获取模块50,用于获取蛋白分子第一晶体结构。
[0134]
第一模拟模块51,用于对第一晶体结构进行自由能极小化模拟,获得目标蛋白分子的能量极小化晶体结构。
[0135]
构建模块52,用于构建能量极小化晶体结构的原子节点与网络约束模型。
[0136]
第二模拟模块53,用于对能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态。
[0137]
解析模块54,用于对处于运动平衡状态的能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果;
[0138]
确定模块55,用于根据解析结果,找出目标蛋白分子中的刚性薄弱区域。
[0139]
其中,获取模块50包括获取子模块、修复模块和分离模块。
[0140]
获取子模块用于获取带有目标蛋白分子的第二晶体结构;修复模块用于对第二晶体结构进行晶体结构进行修复,得到修复后的第二晶体结构;分离模块用于从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构。
[0141]
第一模拟模块51包括第一添加模块、第二添加模块、预处理模块、正式模拟模块和转换输出模块。
[0142]
第一添加模块用于为第一晶体结构添加水分子模型与力场,构建目标蛋白分子的拓扑结构;第二添加模块用于为拓扑结构添加模拟盒子;预处理模块用于采用预置方法对添加模拟盒子的拓扑结构在真空条件下进行能量极小化模拟的预处理;正式模拟模块用于对添加模拟盒子的拓扑结构在真空条件下正式进行能量极小化模拟,得到模拟结果;转换输出模块用于将模拟结果对应的拓扑结构转换为目标蛋白分子的能量极小化晶体结构,并输出能量极小化晶体结构。
[0143]
构建模块52包括建模模块和设定模块。
[0144]
建模模块用于将能量极小化晶体结构中的所有原子作为原子节点,以及将所有原子之间的共价键和非共价键作为连线;设定模块用于按照共价键和非共价键的类型设定对应的连线的运动形式。例如:若共价键为肽键或共价双键,则限制肽键或共价双键对应的连线的旋转。若共价键为共价单键,则设定共价单键对应的连线可绕键轴旋转,且不可断裂。若非共价键为氢键、盐键和疏水作用中的一种,则设定氢键或盐键对应的连线可断裂。
[0145]
解析模块54包括聚类模块和标记模块。
[0146]
聚类模块用于将解析中连线未断裂且仍保持原有网络的原子节点聚为一类,并分为不同结构簇;标记模块用于将不同结构簇打上不同标记,得到具有不同标记的多个不同结构簇。本技术实施例对标记的形式不做限定,例如可以是颜色或者数字,只要能对结构簇进行区分即可。通过标记进行区分不同结构簇,可以更加清楚直观地找到符合要求的目标结构簇。
[0147]
确定模块55用于根据具有不同标记的多个不同结构簇,找到相互作用比较薄弱的结构簇,以及找到相互作用比较薄弱的结构簇中氨基酸残基所在的二级结构信息。例如,蛋白分子中存在相对独立的结构簇,说明这些结构簇之间相互作用薄弱,在经过热解折叠模拟之后,连线断裂,那么可以考虑增加这些独立的结构簇之间的相互作用,来提高蛋白分子的热稳定性。
[0148]
本技术实施例通过获取目标蛋白分子的第一晶体结构;对第一晶体结构进行自由能极小化模拟,获得能量极小化晶体结构;构建能量极小化晶体结构的原子节点与网络约束模型,将复杂的蛋白质结构变成了节点、连线与网络的简单结构;再对能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态;对处于运动平衡状态的能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果;最后根据解析结果,找出目标蛋白分子中的刚性薄弱区域。这样就能够计算出目标蛋白分子结构的刚性薄弱区域,寻找出更合适的改构位点或区域,从而能对蛋白分子进行针对性的突变,以提高蛋白分子的稳定性。
[0149]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
[0150]
图6是本技术实施例示出的电子设备的结构示意图。
[0151]
参见图6,电子设备600包括存储器610和处理器620。
[0152]
处理器620可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0153]
存储器610可以包括各种类型的存储单元,例如系统内存、只读存储器(rom)和永久存储装置。其中,rom可以存储处理器620或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存
储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器610可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如dram,sram,sdram,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器610可以包括可读和/或写的可移除的存储设备,例如激光唱片(cd)、只读数字多功能光盘(例如dvd-rom,双层dvd-rom)、只读蓝光光盘、超密度光盘、闪存卡(例如sd卡、min sd卡、micro-sd卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
[0154]
其中,处理器620可以包括获取模块50、第一模拟模块51、构建模块52、第二模拟模块53、解析模块54和确定模块55,具体功能和连接关系可参见图5中的描述,此处不再赘述。
[0155]
电子设备600还可以包括显示器,显示器用于展示处理器520的执行结果。
[0156]
存储器610上存储有可执行代码,当可执行代码被处理器520处理时,可以使处理器620执行上文述及的方法中的部分或全部。
[0157]
此外,根据本技术的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本技术的上述方法中部分或全部步骤的计算机程序代码指令。
[0158]
或者,本技术还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本技术的上述方法的各个步骤的部分或全部。
[0159]
以上已经描述了本技术的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。

技术特征:
1.一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法,其特征在于,包括:获取目标蛋白分子的第一晶体结构;对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化晶体结构;构建所述能量极小化晶体结构的原子节点与网络约束模型;对所述能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至所述能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态;对处于运动平衡状态的所述能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果;根据所述解析结果,找出所述目标蛋白分子中的刚性薄弱区域。2.根据权利要求1所述的方法,其特征在于,所述获取目标蛋白分子的第一晶体结构,包括:获取带有所述目标蛋白分子的第二晶体结构;对所述第二晶体结构进行晶体结构进行修复,得到修复后的第二晶体结构;从所述修复后的第二晶体结构中分离出所述目标蛋白分子的第一晶体结构。3.根据权利要求1所述的方法,其特征在于,所述对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化晶体结构,包括:为所述第一晶体结构添加水分子模型与力场,构建所述目标蛋白分子的拓扑结构;为所述拓扑结构添加模拟盒子;采用预置方法对添加模拟盒子的所述拓扑结构在真空条件下进行能量极小化模拟的预处理;对添加模拟盒子的所述拓扑结构在真空条件下正式进行能量极小化模拟,得到模拟结果;将所述模拟结果对应的所述拓扑结构转换为所述目标蛋白分子的能量极小化晶体结构,并输出所述能量极小化晶体结构。4.根据权利要求1所述的方法,其特征在于,所述构建所述能量极小化晶体结构的原子节点与网络约束模型,包括:将所述能量极小化晶体结构中的所有原子作为原子节点,以及将所述所有原子之间的共价键和非共价键作为连线;按照所述共价键和所述非共价键的类型设定对应的所述连线的运动形式。5.根据权利要求4所述的方法,其特征在于,所述按照所述共价键和所述非共价键的类型设定对应的所述连线的运动形式,包括:若所述共价键为肽键或共价双键,则限制所述肽键或所述共价双键对应的所述连线的旋转;若所述共价键为共价单键,则设定所述共价单键对应的所述连线可绕键轴旋转,且不可断裂;若所述非共价键为氢键、盐键和疏水作用中的一种,则设定所述氢键或盐键对应的所述连线可断裂。6.根据权利要求4所述的方法,其特征在于,所述对处于运动平衡状态的所述能量极小
化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果,包括:将解析中所述连线未断裂且仍保持原有网络的所述原子节点聚为一类,并分为不同结构簇;将所述不同结构簇打上不同标记,得到具有不同标记的多个不同结构簇。7.根据权利要求6所述的方法,其特征在于,所述根据所述解析结果,找出所述目标蛋白分子中的刚性薄弱区域,包括:根据所述具有不同标记的多个不同结构簇,找到相互作用比较薄弱的结构簇,以及找到所述相互作用比较薄弱的结构簇中氨基酸残基所在的二级结构信息。8.一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的装置,其特征在于,包括:获取模块,用于获取目标蛋白分子的第一晶体结构;第一模拟模块,用于对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化晶体结构;构建模块,用于构建所述能量极小化晶体结构的原子节点与网络约束模型;第二模拟模块,用于对所述能量极小化晶体结构的原子节点与网络约束模型进行热解折叠分子动力学模拟,直至所述能量极小化晶体结构的原子节点与网络约束模型处于运动平衡状态;解析模块,用于对处于运动平衡状态的所述能量极小化晶体结构的原子节点与网络约束模型进行解析,并得到解析结果;确定模块,用于根据所述解析结果,找出所述目标蛋白分子中的刚性薄弱区域。9.一种电子设备,其特征在于,包括:处理器;以及存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。10.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。

技术总结
本申请涉及一种基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法和装置。该方法包括:获取目标蛋白分子的第一晶体结构;对第一晶体结构进行自由能极小化模拟,获得能量极小化晶体结构;构建能量极小化晶体结构的原子节点与网络约束模型;对原子节点与网络约束模型进行热解折叠分子动力学模拟,直至原子节点与网络约束模型处于运动平衡状态;对处于运动平衡状态的原子节点与网络约束模型进行解析,并得到解析结果;根据解析结果,找出目标蛋白分子中的刚性薄弱区域。本申请提供的方案,能够计算出蛋白结构的刚性弱点,寻找出更合适的改构位点或区域,从而能对蛋白进行针对性的突变,以提高蛋白质分子的稳定性。以提高蛋白质分子的稳定性。以提高蛋白质分子的稳定性。


技术研发人员:易吉辉 李铎 许春莲
受保护的技术使用者:深圳新锐基因科技有限公司
技术研发日:2023.06.14
技术公布日:2023/8/31
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐