一种结合量化构效关系和分子作用关系的降血糖化合物筛选方法
未命名
09-29
阅读:57
评论:0
1.本发明属于功能性成分开发技术领域,具体涉及一种用于降血糖的α-淀粉酶抑制剂的筛选方法。
背景技术:
2.在过去三十年中,全世界糖尿病患者的死亡率和血管并发症发生率显著降低,但ii型糖尿病患者的死亡率风险(全因和心血管死亡率)仍相对增加了两倍,经研究得知ii型糖尿病主要受胰岛素分泌不足导致的餐后高血糖的影响。糖尿病尤其影响40至59岁的中年人群,这会造成严重的经济和社会影响。传统上,血糖控制是管理2型糖尿病的主要目标,但减轻体重的生活方式干预策略试验的结果令人失望。近年来,新型降糖药物的出现给人们带来了福报,其不仅能够降低血糖水平,还可以减少并发症的发生,目前的新型降糖药主要有glp-1受体激动剂、α-淀粉酶抑制剂、α-葡萄糖苷酶抑制剂、sglt-2抑制剂、dpp-4抑制剂等。
3.目前,酶抑制剂在医学应用中引起了越来越多的关注,α-淀粉酶水解淀粉中的α-d-(1,4)-葡聚糖键,形成由葡萄糖单元组成的聚合物,由于糖苷酶广泛用于水解碳水化合物,因此α-淀粉酶抑制剂有利于治疗糖尿病、肥胖症和其他疾病等碳水化合物依赖性疾病。用于治疗的α-淀粉酶抑制剂的实例有阿卡波糖、伏格列波糖和米格列醇,然而,这些降糖药物都或多或少的存在一些副作用,比如呕吐、腹泻、肠胃疼痛等,因此,如果可以使用一种快速高效的筛选方法来从食物中筛选出天然健康的且有效的降糖物质,这对血糖的调控及ii型糖尿病的治疗是有巨大帮助的。
技术实现要素:
4.本发明的目的是,建立α-淀粉酶抑制剂分子数据库将qsar模型与分子对接相结合筛选潜在的α-淀粉酶抑制剂候选物,通过体外实验验证得到一种用于降血糖的α-淀粉酶抑制剂。
5.本发明的产品及制备方法如下:
6.一种用于降血糖的α-淀粉酶抑制剂,其特征在于,包括以下步骤:(1)建立一个药食同源的α-淀粉酶抑制剂数据库,数据库包括100种抑制α-淀粉酶的化合物;(2)四种描述符池包括moe、mordred、chemopy和rdkit,计算(1)分子的canonical smiles生成用于捕捉分子结构和性质的分子描述符并进行比较;(3)四种机器学习方法包括随机森林(rf)、支持向量机(svm)和线性判别分析(lda),根据(2)生成的描述符建立能够筛选α-淀粉酶抑制剂的定性构效(qsar)模型,比较模型的准确度选择最优模型;(4)以阿卡波糖为阳性对照,从pdb数据库(http://www.rcsb.org/)中获得α-淀粉酶的晶体结构(pdb id:1bvn),并将其作为蛋白靶标,通过moe2015进行分子对接来验证模型预测的结果,通过gromacs对α-淀粉酶和筛选出的化合物进行10ns分子动力学模拟以验证结合稳定性,进一步用酶标法测定化合
物的α-淀粉酶抑制活性;(5)通过模型筛选和实验验证发掘潜在的α-淀粉酶抑制剂。
7.所述的rdkit描述符建立模型效果最好,rdkit计算了三种分子指纹,以表征化合物的分子结构:maccs指纹(166位)、ecfp4指纹(1024位)和avalon指纹(1024位),预测更具有鲁棒性。
8.所述的最佳模型为rf模型,准确度为0.9927。
9.所述的实验条件为,取100μl化合物溶液与100μlα-淀粉酶溶液(6.67u/ml)在37℃水浴中放置15min,然后,向反应中加入100μl可溶性淀粉溶液(10mg/ml),在37℃孵育10min。然后添加200μldns试剂终止反应。之后,将混合物煮沸10分钟,然后冷却至室温。在96孔板中每孔体系为100μl,在540nm下,a是空白组在540nm处的光吸收值;b为空白对照组在540nm处的吸收值;c是抑制剂组在540nm处的吸收值;d是背景对照在540nm处的吸收值,抑制率计算公式为:
[0010][0011]
所述的一种具有α-淀粉酶抑制活性的候选物为石吊兰素,ic50为46.05
±
1.66μm。
[0012]
本发明最终产品内容物特点:石吊兰素具有α-淀粉酶抑制活性,可以作为α-淀粉酶抑制候选物,ic
50
为46.05
±
1.66μm。
附图说明
[0013]
图1是本发明的工艺流程图;
[0014]
图2是rdkit描述符的重要性图;
[0015]
图3是模型的准确度图;
[0016]
图4是石吊兰素和α-淀粉酶的分子对接图。
具体实施方式
[0017]
下面结合附图来对具体实施例来进一步描述。
[0018]
实施例1
[0019]
(1)从文献以及数据库中查阅,建立一个包含129种药食同源的α-淀粉酶抑制剂数据库,收集这些化合物的inchikey和canonical smiles。
[0020]
(2)计算步骤(1)中收集的化合物的canonical smiles来生成moe、chemopy、mordred和rdkit描述符,通过r语言的caret包对描述符进行相关系数的去除,通过调节r语言中的贡献度contrib参数对描述符进行降维,最后剩下20个描述符,有bcut_peoe_0,chi1v_c,peoe_vsa_hyd和slogp_vsa2等,然后使用r语言的factoextra包对筛选出的描述符进行pca图的绘制,pc1与pc2相加大于50%则模型有效。
[0021]
(3)根据(2)生成的描述符以3:1划分训练集和测试集,进行十折交叉验证,训练集拟合rf、svm、lda三种模型并进行训练,测试集用来用来评估模最终模型的泛化能力,比较其准确度,各个描述符最高准确度模型分别为chemopy-rf,moe-svm,mordred-svm和rdkit-rf,准确度依次为0.9891,0.983,0.9818和0.9927,最终得出rdkit的rf模型准确度最高,为0.9927。
[0022]
(4)以阿卡波糖为阳性对照,从pdb数据库(http://www.rcsb.org/)中获得α-淀粉
酶的晶体结构(pdb id:1bvn),使用moe 2015软件从检索到的晶体结构中去除所有水分子和离子,通过quickprep功能进行结构准备,然后对小分子配体进行能量最小化(参数设置为gradient:0.1,力场:amber99),根据活性位点进行分子对接。
[0023]
(5)为了了解几种化合物与α-淀粉酶结合过程中的差异,使用gromacs对阳性药物阿卡波糖和所有候选化合物进行了10ns的分子动力学模拟。为了研究模拟的动态稳定性,分析了阳性物质阿卡波糖和最佳抑制剂石吊兰素与α-淀粉酶对接后的均方根偏差(rmsd),对接后α-淀粉酶的均方根波动(rmsf)以及对接复合物的回旋半径(rg)。rmsd结果显示,两个系统在10ns内达到平衡,阿卡波糖在整个10ns的模拟时间内保持稳定。石吊兰素在5ns时达到稳定状态,两个系统的蛋白质和配体在平衡后都很稳定;rmsf计算了每个原子相对于其平均位置的波动。两种物质的rmsf曲线都不超过0.5nm;回旋半径是一个描述蛋白质紧凑程度的物理量。半径越大,密度越大,也就是说,蛋白质结构越稳定,两个对接复合物的平均rg值在模拟过程中一直保持在2.3-2.4nm之间,蛋白质结构相对稳定。
[0024]
(6)α-淀粉酶活性抑制实验采用的是dns显色法,发现一种具有α-淀粉酶抑制活性的候选物为石吊兰素,ic
50
为46.05
±
1.66μm。
[0025]
实施例2
[0026]
(1)建立一个药食同源的腺苷脱氨酶抑制剂数据库,构建的数据库包括100种抑制剂和100种非抑制剂,利用canonical smiles生成四种描述符moe,chemopy,mordred,rdkit,进行描述符池比较分析。
[0027]
(2)利用r语言对c smiles生成的四种描述符降维筛选,利用r语言的caret包删除贡献率低和重复性高的描述符,四种描述符均剩下20个描述符,利用r语言的factoextra包对筛选出的描述符进行pca图的绘制,其中pc1+pc2大于50%证明模型有效,降维后的描述符可以代表原始数据。图2为步骤(1)中moe、chemopy、morded和rdkit描述符捕获原始数据的重要性图,根据四种描述符捕获原始数据的方差找出该数据库最优描述符进行后续的建模。
[0028]
(3)根据(2)生成的最优描述符chemopy建立rf、svm、lda三种能够筛选腺苷脱氨酶抑制剂的定性构效(qsar)模型,将数据以1:3划分为训练集和测试集,对训练集进行十折交叉验证,10000次重复性训练,比较模型的敏感性与特异性绘制的曲线面积选择最优模型,其中chemopy的rf模型拟合效果最好,roc曲线面积为0.9648。
[0029]
(4)利用构建好的模型在含有24276种食源性化合物的数据库中进行预测并对其进行筛选,以公认的腺苷脱氨酶抑制剂喷司他丁为阳性对照,从pdb数据库(http://www.rcsb.org/)中获得小牛脾脏的腺苷脱氨酶的晶体结构(pdb id:1vfl),对受体进行去水加氢处理,能量最小化,使用moe-dock软件将蛋白质结构中的活性残基选中,然后与筛选后的六种化合物和阳性对照进行对接,对接的立场环境为mmff94,六种化合物均能与受体蛋白稳定结合。
[0030]
(5)腺苷可以在腺苷脱氨酶的催化下生成肌苷,通过高效液相色谱看出6种化合物均能不同程度的抑制肌苷的生成。其中体外酶抑制实验抑制效果最好的化合物为穗花杉双黄酮,利用spss软件计算ic50值为12.87μm。
[0031]
(6)利用gromacs将蛋白质结构和抑制活性最好的化合物穗花杉双黄酮进行分子动力学模拟,将受体去水加氢计算其力场创建拓扑文件,配体单独计算力场,同时构建模拟
水盒,添加溶剂,添加平衡电荷,能量最小化,nvt,npt平衡后,开始模拟。受体和配体在4ns的模拟时间后,二者稳定结合,均方根偏差(rmsd)小于0.1nm。
[0032]
实施例3
[0033]
(1)建立一个药食同源的α-葡萄糖苷酶抑制剂数据库,其中包含125种已知的α-葡萄糖苷酶抑制剂,收集这些化合物的inchikey和canonical smiles。
[0034]
(2)计算步骤(1)中收集的化合物的canonical smiles来生成moe、chemopy、mordred和rdkit描述符,通过r语言的caret包对描述符进行相关系数的去除,通过调节r语言中的贡献度contrib参数对描述符进行降维,最后剩下20个描述符,有bcut_peoe_0,kier2,peoe_vsa_hyd、vsa_pol和slogp_vsa2等,然后使用r语言的factoextra包对筛选出的描述符进行pca图的绘制,pc1与pc2相加大于50%则模型有效。
[0035]
(3)根据(2)生成的描述符以3:1划分训练集和测试集,进行十折交叉验证,训练集拟合rf、svm、lda三种模型并进行训练,测试集用来用来评估模最终模型的泛化能力,比较其准确度,各个描述符最高准确度模型分别为chemopy-rf,moe-rf,mordred-rf和rdkit-rf,准确度依次为0.985,0.9931,0.9688和0.9769,最终得出moe的rf模型准确度最高,为0.9931。
[0036]
(4)以米格列醇为阳性对照,从pdb数据库(http://www.rcsb.org/)中获得α-葡萄糖苷酶的晶体结构(pdb id:3a4a),从文献中获取其具体活性位点坐标并将其作为蛋白靶标,通过autodock4.2进行分子对接来验证模型预测的结果,通过pymol进行分子间相互作用的可视化,进一步用酶标度法测定化合物的α-葡萄糖苷酶抑制活性。
[0037]
(5)为了了解几种化合物与α-葡萄糖苷酶结合过程中的差异,使用gromacs对阳性药物米格列醇和所有候选化合物进行了10ns的分子动力学模拟。rmsd结果显示,两个系统在10ns内达到平衡,米格列醇从2ns开始一直保持稳定,穗花杉双黄酮在2ns时保持1ns的上下波动,比较稳定,迷迭香酸、曲克芦丁在稳定后8ns开始有向上浮动的趋势,其余物质均在10ns内达到稳态。
[0038]
(6)α-葡萄糖苷酶活性抑制实验采用的是p-npg显色法,发现一种具有α-葡萄糖苷酶抑制活性的候选物为穗花杉双黄酮,ic
50
为10.77
±
1.03μm。
技术特征:
1.一种结合量化构效关系、分子对接技术和分子动力学模拟的降血糖化合物筛选,其特征在于,包括以下步骤:(1)建立一个药食同源的α-淀粉酶抑制剂数据库,数据库包括100个具有抑制α-淀粉酶活性的化合物;(2)四种描述符池包括moe、mordred、chemopy和rdkit,计算步骤(1)建立的数据库中活性分子的canonical smiles,生成用于捕捉分子结构和性质的分子描述符,并进行比较;(3)四种机器学习方法包括随机森林(rf)、支持向量机(svm)和线性判别分析(lda),根据步骤(2)生成的描述符建立筛选α-淀粉酶抑制剂的量化构效关系(qsar)模型,比较模型的准确度,选择最优模型;(4)以阿卡波糖为阳性对照,从pdb数据库(http://www.rcsb.org/)中获得α-淀粉酶的晶体结构(pdb id:1bvn),并将其作为蛋白靶标,通过moe2015进行分子对接来验证模型预测的结果,通过gromacs对α-淀粉酶和筛选出的化合物进行10ns分子动力学模拟以验证结合稳定性,进一步用酶标法测定化合物的α-淀粉酶抑制活性;(5)通过模型筛选和实验验证发掘潜在的α-淀粉酶抑制剂。2.根据权利要求1所述的一种结合量化构效关系、分子对接技术和分子动力学模拟的降血糖化合物筛选,其特征在于,所述的rdkit描述符建立模型效果最好,rdkit计算了三种分子指纹,以表征化合物的分子结构:maccs指纹(166位)、ecfp4指纹(1024位)和avalon指纹(1024位),预测更具有鲁棒性。3.根据权利要求1所述的一种结合量化构效关系、分子对接技术和分子动力学模拟的降血糖化合物筛选,其特征在于,所述的最佳模型为rf模型,准确度为0.9927。4.根据权利要求1所述的一种结合量化构效关系、分子对接技术和分子动力学模拟的降血糖化合物筛选,所述的实验条件为,取100μl化合物溶液与100μlα-淀粉酶溶液(6.67u/ml),在37℃水浴中放置15min,然后,向反应中加入100μl可溶性淀粉溶液(10mg/ml),在37℃孵育10min,然后添加200μldns试剂终止反应。之后,将混合物煮沸10分钟,然后冷却至室温。在96孔板中每孔体系为100μl,在540nm下,a是空白组在540nm处的光吸收值;b为空白对照组在540nm处的吸收值;c是抑制剂组在540nm处的吸收值;d是背景对照在540nm处的吸收值,抑制率计算公式为:5.根据权利要求1所述的一种结合量化构效关系、分子对接技术和分子动力学模拟的降血糖化合物筛选,其特征在于,所述的一种具有α-淀粉酶抑制活性的候选物为石吊兰素,ic
50
为46.05
±
1.66μm。
技术总结
本发明属于功能性成分开发技术领域,具体涉及一种抑制α-淀粉酶的降血糖的药食同源的活性物质开发,可以降低餐后血糖。本发明通过建立α-淀粉酶抑制剂的数据库,应用量化构效关系和分子对接技术结合来筛选食品中潜在的降血糖化合物。通过体外试验验证以及分子动力学模拟得到了1种α-淀粉酶抑制剂,用于降血糖的候选药物,为研究与开发降血糖药物及功能性食品提供依据。食品提供依据。
技术研发人员:张英华 刘博浩 李中涵 张冰
受保护的技术使用者:东北农业大学
技术研发日:2023.06.25
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/