构建目标蛋白质组谱图库的方法和应用与流程

未命名 10-08 阅读:131 评论:0


1.本技术涉及蛋白检测技术领域,具体而言,涉及构建目标蛋白质组谱图库的方法和应用。


背景技术:

2.数据依赖采集(data dependent acquisition,dda)和数据非依赖采集(data independent acquisition,dia)是基于高分辨质谱的非靶向蛋白组学中的两种常见数据采集模式。dda中,质谱仪器进行一级扫描,然后对从一级扫描质谱中选择的母离子(强度依赖)列表进行二级扫描。而理论上,dia能够对所有一级母离子的ms2信息进行连续和无偏倚的采集,但由于其ms2质谱信息十分复杂,母离子和子离子关联不紧密,数据处理存在困难。
3.目前微量蛋白质组的质谱分析主要采用的是数据依赖采集模式,为了增加蛋白质组的鉴定深度,更多的去扫描中低丰度的蛋白,在dda模式扫描时一般会使用动态排除功能:即对于某一个肽段母离子,如果已经被扫描并碎裂过一次,在接下来指定的一段时间内即便一级质谱再次扫描到了该离子,也不进行碎裂和二级质谱扫描。
4.相比于dda模式在数据采集时的随机性,基于数据非依赖的质谱采集模式能记录样本的所有信息,在保证鉴定数目不受影响的同时提高蛋白质组分析的重现性和定量准确度,在差异蛋白质组分析、尤其是大规模临床样本差异蛋白质组分析中得到了广泛的应用。
5.目前dia模式应用于微量蛋白质组分析的技术还不多,绝大部分微量样品蛋白质组学的研究都采用传统的dda模式。一方面,可能是由于目前大部分dia数据处理软件的灵敏度有限:dia的谱图本身就很复杂,而微量蛋白组样品质谱采集的谱图信噪比也很低,对于大部分dia数据分析软件,可能很难从极复杂且离子强度低的谱图中提取出有效的信息;另一方面,目前大部分dia数据分析软件在对谱图库和dia数据进行离子匹配时都需要依赖色谱保留时间信息,在离子匹配与候选肽段打分时,只会考虑共洗脱一定时间窗口内的碎片离子,这不仅对色谱重现性提出了较高的要求,也使得短梯度dia分析难以实现:因为在建库时为了提高库的蛋白质覆盖深度,一般需要使用长梯度。
6.因此,如何提高质谱分析的准确性、灵敏度是微量蛋白质组鉴定的难点。


技术实现要素:

7.为了解决上述问题,提高微量蛋白质组质谱分析的准确性和灵敏度,本技术的第一目的在于提供一种构建目标蛋白质组谱图库的方法,方法包括:
8.通过不同扫描范围对目标蛋白质组进行多次无动态排除的数据依赖采集模式的质谱扫描,以得到目标蛋白质组的质谱数据,目标蛋白质组的质谱数据包括目标蛋白质组多个扫描范围的一级谱,以及每个扫描范围中母离子强度满足预设阈值的二级谱;
9.基于目标蛋白质组的质谱数据进行搜库以构建目标蛋白质组谱图库。
10.本技术通过无动态排除的数据依赖采集模式的质谱数据构建谱图库,提高谱图库中蛋白、肽段、谱图的数目,结合微量蛋白组质组的dia数据进行搜库分析,提高了dia数据
匹配的成功率,进而提高dia数据分析的准确性和灵敏度,提高了微量蛋白鉴定的准确性和灵敏度。
11.在其中一个实施例中,目标蛋白质组的质谱数据满足以下条件(1)~(4)中的至少一种:
12.(1)多个扫描范围包括400m/z~1250m/z范围内的若干个连续的扫描范围;
13.(2)二级谱的采集时间为30ms~45ms;
14.(3)二级谱的扫描次数为60~100;
15.(4)二级谱扫描的母离子强度满足的预设阈值为10cps~29cps;
16.可选地,多个扫描范围包括400m/z~500m/z、500m/z~600m/z、600m/z~700m/z、700m/z~800m/z、900m/z~1000m/z、1000m/z~1100m/z以及1100m/z~1250m/z。
17.在其中一个实施例中,目标蛋白质组的质谱数据满足以下条件(1)~(3)中的至少一种:
18.(1)目标蛋白质组为目标生物体的蛋白质组;
19.(2)目标蛋白质组的上样量为10ng~2000ng;
20.(3)目标蛋白质组的色谱梯度时长为90~120分钟;
21.可选地,目标生物体选自动物、植物和微生物中的任意一种;
22.可选地,所述目标生物体选自牛、马、猪、绵羊、山羊、大鼠、小鼠、狗、猫、兔、骆驼、驴、鹿、貂、鸡、鸭、鹅或人。
23.在其中一个实施例中,搜库的参数为:使用trypsin酶切,最大允许两个漏切位点,甲硫氨酸氧化、蛋白n末端乙酰化设为可变修饰,半胱氨酸烷基化设为固定修饰。
24.本技术的第二目的在于提供根据上述方法构建的目标蛋白质组谱图库。
25.本技术的第三目的在于提供上述目标蛋白质组谱图库在微量蛋白质组检测中的应用。
26.在其中一个实施例中,微量蛋白质组满足以下条件(1)~(3)中的至少一种:
27.(1)微量蛋白质组的质量为0.2ng~100ng;
28.(2)微量蛋白质组和目标蛋白质组来源于同一种生物体;
29.(3)微量蛋白质组为单细胞蛋白质组。
30.在其中一个实施例中,应用包括以下步骤:
31.获取通过数据非依赖采集模式采集的微量蛋白质组的质谱数据,利用目标蛋白质组谱图库对微量蛋白质组的质谱数据进行搜库。
32.在其中一个实施例中,数据非依赖采集模式满足以下条件(1)~(4)中的至少一种:
33.(1)数据非依赖采集模式为固定窗口的数据非依赖采集模式或可变窗口的数据非依赖采集模式;
34.(2)数据非依赖采集模式的扫描范围包括:400m/z~1250m/z;
35.(3)微量蛋白质组的一级谱的采集时间为200ms~300ms;
36.(4)微量蛋白质组的二级谱的采集时间为65ms~100ms。
37.在其中一个实施例中,微量蛋白质组的色谱梯度时长为1~240分钟。
38.在其中一个实施例中,对微量蛋白质组的质谱数据进行搜库的参数为:母离子质
量容忍度为
±
25da,二级碎片离子的质量容忍度为
±
50ppm。
附图说明
39.为了更清楚地说明本技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
40.图1为本技术实施例提供的构建目标蛋白质组谱图库的方法的流程图;
41.图2为本技术实施例2中使用动态排除的数据依赖采集模式建库和使用无动态排除的数据依赖采集模式建库对同一dia数据分析的结果;图2中a表示10ng样本dia数据分析结果(n=3);图2中b表示100ng样本dia数据分析结果(n=3);
42.图3为本技术实施例3提供的数据依赖采集模式和数据非依赖采集模式下100ng和10ng微量样本的蛋白鉴定结果;图3中a表示10ng样本蛋白鉴定数目(n=3);图3中b表示100ng样本蛋白鉴定数目(n=3);
43.图4为本技术实施例4提供的数据依赖采集模式和数据非依赖采集模式下10ng微量样本在不同色谱梯度时长下的蛋白鉴定结果。
具体实施方式
44.现将详细地提供本技术实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本技术。实际上,对本领域技术人员而言,显而易见的是,可以对本技术进行多种修改和变化而不背离本技术的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
45.因此,旨在本技术覆盖落入所附权利要求的范围及其等同范围中的此类修改和变化。本技术的其它对象、特征和方面公开于以下详细描述中或从中是显而易见的。本领域普通技术人员应理解本讨论仅是示例性实施方式的描述,而非意在限制本技术更广阔的方面。
46.如上文,如何提高质谱分析的准确性、灵敏度是微量蛋白质组鉴定的难点。此外,发明人还发现,当质谱上样量降低到单细胞级别时,谱图中离子的组成、强度等均会较常规上样量发生较大改变,而不管是基于dda模式生成谱图库的方法还是基于机器学习生成预测谱图库的方法,其使用或者学习的都是常规上样量所生成的谱图,当基于这些谱图库来提取单细胞dia分析中的蛋白质鉴定和定量结果时,即便是对于同一条肽段,由于谱图库和单细胞dia谱图中碎片离子的组成和强度的不一致,都可能导致不能对鉴定、定量信息进行有效提取或提取错误。
47.为了至少解决上述技术问题的至少一个,本技术的第一方面提供了一种构建目标蛋白质组谱图库的方法,流程图如图1所示,方法包括:
48.s10:通过不同扫描范围对目标蛋白质组进行多次无动态排除的数据依赖采集模式的质谱扫描,以得到目标蛋白质组的质谱数据,目标蛋白质组的质谱数据包括目标蛋白质组多个扫描范围的一级谱,以及每个扫描范围中母离子强度满足预设阈值的二级谱;
49.s20:基于目标蛋白质组的质谱数据进行搜库以构建目标蛋白质组谱图库。
50.本技术中,术语“目标蛋白质组”是指来源于目标生物体的蛋白质组,包括目标生物体可以表达的所有蛋白质,可以是目标生物体某一特定时间点的蛋白质组(如胚胎与成熟生物体),或指目标生物体内某一特定细胞类型或组织的蛋白质组。根据目标生物体种类的不同,目标蛋白质组可以为动物蛋白质组、植物蛋白质组或微生物蛋白质组。
51.其中,对于动物蛋白质组,根据动物种属的不同,目标生物体可以选自牛、马、猪、绵羊、山羊、大鼠、小鼠、狗、猫、兔、骆驼、驴、鹿、貂、鸡、鸭、鹅或人。
52.具体地,采集质谱数据时,将目标蛋白质组的酶解肽段作为上样样品进行质谱检测,以获取目标蛋白质组的质谱数据,其中,示例性地,酶解肽段可以是trypsin酶解肽段和lys-c酶解肽段,目标蛋白质组的酶解肽段的获取不作限制,可以通过自制或商业途径获取。
53.需要说明的是,为了提高谱图库中蛋白、肽段、谱图的数目,传统策略会使用诸如高ph反相分级等基于色谱的方法对样品进行预分级,然而,商品化的基于色谱的预分级策略都要求μg到mg级别的样品量,因此不适用于ng级别样品的预分级。
54.具体地,在本技术的谱图库建库策略中,使用质谱气相分级的方法对目标蛋白质组进行分级,即对目标蛋白质组进行多次上样,每次上样的扫描范围不同,每次采用无动态排除的数据依赖采集模式进行数据采集,以对每一条肽段采集尽可能多的二级谱图。
55.其中,无动态排除的数据依赖采集模式是指在质谱扫描时,对一级扫描范围内的母离子不做动态排除的筛选,让落在扫描范围内强度满足预设阈值的母离子进行二级碎裂,以对每一条肽段采集尽可能多的二级谱图。
56.需要说明的是,传统数据依赖采集模式中,质谱仪器进行一级扫描,然后对从一级扫描质谱中选择的母离子(强度依赖)列表进行二级扫描。区别于传统的数据依赖采集模式,无动态排除的数据依赖采集模式是对传统的数据依赖采集模式中二级碎裂的母离子不做动态排除的筛选,以对每一条肽段采集尽可能多的二级谱图。
57.一些实施方案中,使用质谱气相分级的方法对微量蛋白样品进行分级时,通过400m/z~1250m/z范围内的若干个连续的扫描范围对目标蛋白质组进行质谱扫描,每次扫描采用无动态排除的数据依赖采集模式,以获得400m/z~1250m/z范围内若干个连续扫描范围的一级谱,以及每个扫描范围内母离子强度满足预设阈值的二级谱。
58.一些实施方案中,多个扫描范围包括400m/z~500m/z、500m/z~600m/z、600m/z~700m/z、700m/z~800m/z、900m/z~1000m/z、1000m/z~1100m/z以及1100m/z~1250m/z。每次扫描的扫描范围选自上述多个扫描范围中的任意一个。
59.一些具体实施方案中,第一次质谱气相分级的扫描范围为400m/z~500m/z;第二次质谱气相分级的扫描范围为500m/z~600m/z;第三次质谱气相分级的扫描范围为600m/z~700m/z;第四次质谱气相分级的扫描范围为700m/z~800m/z;第五次质谱气相分级的扫描范围为800m/z~900m/z;第六次质谱气相分级的扫描范围为900m/z~1000m/z;第七次质谱气相分级的扫描范围为1000m/z~1100m/z;第八次质谱气相分级的扫描范围为1100m/z~1250m/z。
60.一些实施方案中,为了实现无动态排除的数据依赖采集模式的质谱扫描,提高谱图库中蛋白、肽段、谱图的数目和后续数据非依赖采集数据的匹配效率,对于每个扫描范围的一级谱,其二级谱采集时间为30ms~45ms;二级谱扫描次数为60~100;二级谱扫描的母
离子强度满足的预设阈值为10cps~29cps,以对每一条肽段采集尽可能多的二级谱图,从而提高后续微量蛋白质组数据非依赖采集数据和谱图库的匹配率。
61.一些具体实施方案中,每个扫描范围的质谱数据的采集时间设为30ms、35ms、40ms或45ms,扫描次数设为60、70、80、90或100,采集的母离子强度阈值设为10cps、15cps、20cps、25cps或29cps,以对每一条肽段采集尽可能多的二级谱图。
62.本技术通过无动态排除的数据依赖采集模式的质谱数据构建谱图库,对每一条肽段采集了尽可能多的二级谱图,提高了目标蛋白质组谱图库和后续微量蛋白质组的质谱数据的匹配率,从而实现提高微量蛋白质组鉴定的准确性。
63.一些实施方案中,建库时每次扫描的目标蛋白质组的质量为10ng~2000ng,为了实现和微量蛋白质组质谱数据的峰强度的一致性,提高微量蛋白质组和谱图库匹配的成功效率,每次扫描的目标蛋白质组的上样量进一步可以为10ng~200ng,更进一步可以为10ng~50ng。具体地,使用质谱气相分级的方法对微量样品进行分级,可以将目标蛋白质组均分为若干份从而进行相应次数不同分级范围的扫描,以获得蛋白质组多个扫描范围的质谱数据。
64.一些实施方案中,为了提高谱图库的覆盖度,目标蛋白质组的色谱梯度时长为90~120分钟。一些具体实施方案中,每次扫描时目标蛋白质组的色谱梯度时长为90分钟、95分钟、100分钟、105分钟、110分钟、115分钟、120分钟。
65.一些实施方案中,上述构建方法中搜库的目的是为了基于目标蛋白质组的质谱数据和已知的谱图库的搜库结果构建目标蛋白质组谱图库,搜库的参数和目标蛋白质组的酶切方式相对应。
66.一些具体实施方案中,目标蛋白质组上样时采用其trypsin酶切肽段,那么搜库的参数为:使用trypsin酶切,最大允许两个漏切位点,甲硫氨酸氧化、蛋白n末端乙酰化设为可变修饰,半胱氨酸烷基化设为固定修饰。
67.相应地,本技术的第二方面提供了根据上述方法构建的目标蛋白质组谱图库,以提高后续微量蛋白质组的质谱数据的匹配率。
68.相应地,本技术的第三方面提供了根据上述目标蛋白质组谱图库在微量蛋白质组检测中的应用。
69.本技术中,术语微量蛋白质组是指质量为ng级别或者低于ng级别的蛋白质组。具体地,微量蛋白质组可以来源于目标生物体的细胞或组织,示例性地,细胞可以是癌细胞或免疫细胞,组织可以是肝脏组织或血液组织等。
70.一些具体实施方案中,微量蛋白质组可以是单细胞蛋白质组。
71.具体地,采集质谱数据时,将微量蛋白质组的酶解肽段作为上样样品进行质谱检测,以获取微量蛋白质组的质谱数据,其中,微量蛋白质组的酶解肽段的获取不作限制,可以是自制的微量蛋白质组的酶解肽段,也可以是商业途径获取的。
72.一些实施方案中,为了实现微量蛋白质组的检测,微量蛋白质组和目标蛋白质组来源于同一种生物体。
73.一些实施方案中,微量蛋白质组的质量为0.2ng~100ng,具体地,可以为0.2ng、10ng、25ng、50ng、80ng或100ng。
74.本技术构建的目标蛋白质组谱图库,对于强度较低的微量蛋白质组的质谱数据,
也能够在碎片离子的组成和强度方面与之保持一致性,提高微量蛋白质组的数据非依赖采集数据的匹配率,从而实现提高微量蛋白质组鉴定的准确性和灵敏度。
75.一些实施方案中,应用包括以下步骤:
76.获取通过数据非依赖采集模式采集的微量蛋白质组的质谱数据,利用目标蛋白质组谱图库对微量蛋白质组的质谱数据进行搜库。
77.一些实施方案中,数据非依赖采集模式可以为固定窗口的数据非依赖采集模式或可变窗口的数据非依赖采集模式,固定窗口的数据非依赖采集模式是指窗口长度固定的数据非依赖采集模式,可变窗口的数据非依赖采集模式是指窗口长度可自由设置的数据非依赖采集模式。一些具体实施方案中,数据非依赖采集模式的采集参数包括:扫描范围设为400m/z~1250m/z;一级谱的采集时间的设置范围为200ms~300ms,具体地可以设为200ms、220ms、250ms、280ms或300ms;二级谱的采集时间的设置范围为65ms~100ms,具体地,可以设为65ms、75ms、85ms、95ms或100ms,以获取微量蛋白质组的数据非依赖采集数据。
78.本技术通过无动态排除的数据依赖采集的质谱数据构建谱图库,提高谱图库中蛋白、肽段、谱图的数目,结合微量蛋白样品的质谱数据对微量蛋白质组的数据非依赖采集数据进行搜库分析,提高了数据非依赖采集数据匹配的成功率,进而提高数据非依赖采集数据分析的准确性,提高了微量蛋白质组鉴定的准确性。
79.可以理解的是,为了提高谱图库的覆盖度,目标蛋白质组谱图库构建时一般会使用预分级及较长的色谱时长,如果数据非依赖采集数据的色谱时长需要与谱图库中一致,就限制了数据非依赖采集数据的采集效率。
80.一些具体实施方案中,本技术通过msplit-dia软件的使用,避免了上述问题,可以在较短的时间获取数据非依赖采集数据,提高同样时间内分析样本的数目。
81.一些实施方案中,微量蛋白质组的色谱梯度时长为1~240分钟。
82.一些具体实施方案中,微量蛋白质组的色谱梯度时长为1分钟、50分钟、100分钟、150分钟、200分钟或240分钟。
83.下面将结合实施例对本技术的实施方案进行详细描述。
84.实施例1
85.本实施例的质谱气相分级样品使用无动态排除的数据依赖采集模式建库和动态排除的数据依赖采集模式建库。
86.其中,使用无动态排除的数据依赖采集模式建库过程包括:
87.使用质谱气相分级的方法对微量样品进行分级:将200ng k562细胞酶解肽段(购买自promega)均分为8份,每份25ng,使用质谱气相分级技术对样品进行分级,即每次上样25ng,每次的扫描范围不同(第一次质谱气相分级的扫描范围为400m/z~500m/z;第二次质谱气相分级的扫描范围为500m/z~600m/z;第三次质谱气相分级的扫描范围为600~700m/z;第四次质谱气相分级的扫描范围为700m/z~800m/z;第五次质谱气相分级的扫描范围为800m/z~900m/z;第六次质谱气相分级的扫描范围为900m/z~1000m/z;第七次质谱气相分级的扫描范围为1000m/z~1100m/z;第八次质谱气相分级的扫描范围为1100~1250m/z)。质谱扫描时采用无动态排除模式进行数据采集,无动态排除的数据依赖采集模式建库的采集参数包括:二级谱采集时间设为30ms,二级谱扫描次数设为100,二级谱采集的母离子强度阈值设为10cps,每次上样的色谱梯度时长为90分钟;色谱a相为99.9%的水+0.1%的甲
酸;色谱b相为80%的乙腈+19.9%的水+0.1%的甲酸;色谱梯度为:0~5分钟为0%b~5%b;5.1~60分钟为5%b~28%b;60.1~70分钟为28%b~80%b;70.1~90分钟为80%b。采集完质谱数据后使用ms-gf+软件对所有质谱数据进行合并搜库以构建谱图库,搜库参数为:使用trypsin酶切,最大允许两个漏切位点,甲硫氨酸氧化、蛋白n末端乙酰化设为可变修饰,半胱氨酸烷基化设为固定修饰。
88.其中,使用动态排除的数据依赖采集模式建库过程包括:
89.动态排除的数据依赖采集模式建库的采集参数包括::二级谱accumulation time设为100ms,二级谱扫描次数设为10,二级谱采集的母离子强度阈值设为100cps,其余参数与上述无动态排除的数据依赖采集模式建库的参数相同。
90.本实施例使用无动态排除的数据依赖采集模式建库和动态排除的数据依赖采集模式建库后库中蛋白质、肽段、谱图数目对比结果,具体如表1所示。
91.表1
[0092][0093]
实验结果表明,使用无动态排除的数据依赖采集模式进行质谱数据采集,结合质谱气相分级技术,可以从总共200ng微量蛋白质组样本中鉴定到12万余张谱图,对应将近25000条肽段。相比于传统的使用动态排除的数据依赖采集模式建库的方法,在同样的气相分级条件下,谱图数提高了310%,肽段数目提高了105%,蛋白质数目提高了69%;平均每条肽段对应的谱图数从2.4张提高到4.8张,有助于后续dia数据的提取。
[0094]
实施例2
[0095]
本实施例分别使用实施例1的无动态排除的数据依赖采集模式和动态排除的数据依赖采集模式建库,然后使用dia模式分别采集10ng和100ng的微量蛋白质组数据。dia的扫描范围为400m/z~1250m/z;一级谱的采集为250ms,二级谱的采集时间为65ms;色谱梯度时长为90分钟,色谱a相为99.9%的水+0.1%的甲酸;色谱b相为80%的乙腈+19.9%的水+0.1%的甲酸;色谱梯度为:0~5分钟为0%b~5%b;5.1~60分钟为5%b~28%b;60.1~70分钟为28%b~80%b;70.1~90分钟为80%b。采集完dia数据后,使用msplit-dia软件导入上面建立的谱图库结果及采集的dia数据进行搜库分析,msplit~dia的搜库参数为:母离子质量容忍度为
±
25da,二级碎片离子的质量容忍度为
±
50ppm。使用msplit-dia软件对同一个dia数据分别使用不同模式建的库进行搜库,结果如图2所示。
[0096]
实验结果表明,使用无动态排除的数据依赖采集模式建库相较于使用动态排除的数据依赖采集模式建库,dia数据的蛋白质鉴定数目分别从~2208提高到~2630;从~1163提高到~1402。也就是说,使用无动态排除的数据依赖采集模式建库,相比于动态排除的数据依赖采集模式建库,10ng和100ng微量样品的蛋白质鉴定数目分别提高了21%(1402
±
50
比1163
±
5)和19%(2630
±
22比2208
±
8)。说明基于无动态排除的数据依赖采集模式建库和数据非依赖采集模式的质谱分析方法,相较于传统的基于动态排除的数据依赖采集模式建库和数据非依赖采集模式的质谱分析方法,在微量目标蛋白质组鉴定深度上具有一定的优势。
[0097]
实施例3
[0098]
本实施例使用实施例1中的无动态排除的数据依赖采集模式建库,然后分别使用数据依赖采集模式和数据非依赖采集模式分别采集10ng和100ng的微量蛋白质组的质谱数据。dia的扫描范围为400m/z~1250m/z;一级谱的采集时间为250ms,二级谱的采集时间为65ms;色谱梯度时长为90分钟,色谱a相为99.9%的水+0.1%的甲酸;色谱b相为80%的乙腈+19.9%的水+0.1%的甲酸;色谱梯度为:0~5分钟为0%b~5%b;5.1~60分钟为5%b~28%b;60.1~70分钟为28%b~80%b;70.1~90分钟为80%b。采集完dia数据后,使用msplit-dia软件导入上面建立的谱图库结果及采集的dia数据进行dia数据搜库分析,msplit~dia的搜库参数为:母离子质量容忍度为
±
25da,二级碎片离子的质量容忍度为
±
50ppm。
[0099]
通过数据依赖采集模式采集质谱数据的参数包括:二级谱采集时间设为100ms,二级谱扫描次数设为10,二级谱采集的母离子强度阈值设为100cps;色谱梯度时长为90分钟,色谱a相为99.9%的水+0.1%的甲酸;色谱b相为80%的乙腈+19.9%的水+0.1%的甲酸;色谱梯度为:0~5分钟为0%b~5%b;5.1~60分钟为5%b~28%b;60.1~70分钟为28%b~80%b;70.1~90分钟为80%b。
[0100]
使用msplit-dia软件对数据非依赖采集的质谱数据使用无动态排除的数据依赖采集模式建的库进行搜库分析;同时对数据依赖采集的质谱数据使用mascot软件和coment软件进行搜库分析,所用数据库为uniprot网址下载的人的蛋白库,包含72481条蛋白序列,搜库完成后使用trans-proteomic pipeline软件整合mascot和comet的搜库结果;最终搜库结果对比结果如图3所示。
[0101]
实验结果表明,基于无动态排除的数据依赖采集模式构建的谱图库,对微量蛋白质组使用数据非依赖采集的质谱数据进行分析,从100ng微量样品中鉴定到2600个蛋白以上,从10ng微量样品中鉴定到~1400个蛋白;而同样的样品量使用传统的数据依赖采集的质谱数据进行分析只分别鉴定到~1600个蛋白和~840个蛋白。
[0102]
也就是说,基于无动态排除的数据依赖采集模式构建的谱图库,使用数据非依赖采集的质谱数据对10ng和100ng的微量蛋白质组样本进行分析,相比于传统的数据依赖采集的质谱数据,蛋白质鉴定数目分别提高了68%(1402
±
50比836
±
4)和65%(2630
±
22比1597
±
6)。说明基于无动态排除的数据依赖采集模式建库结合数据非依赖采集模式的质谱分析方法,相较于传统的数据依赖采集模式的质谱分析方法,在微量目标蛋白质组鉴定深度上具有一定的优势。
[0103]
实施例4
[0104]
本实施例使用实施例1中的无动态排除的数据依赖采集模式建库,然后分别使用数据非依赖采集模式采集10ng微量蛋白质组样本在30min和90min色谱梯度时长下的质谱数据。dia的扫描范围为400m/z~1250m/z;一级谱的采集时间为250ms,二级谱的采集时间为65ms;色谱a相为99.9%的水+0.1%的甲酸;色谱b相为80%的乙腈+19.9%的水+0.1%的
甲酸;90分钟色谱梯度为:0~5分钟为0%b~5%b;5.1~60分钟为5%b~28%b;60.1~70分钟为28%b~80%b;70.1~90分钟为80%b;30分钟色谱梯度为:0~2分钟为0%b~5%b;2.1~20分钟为5%b~28%b;20.1~25分钟为28%b~80%b;25.1~30分钟为80%b。采集完dia数据后,使用msplit-dia软件导入上面建立的谱图库结果及采集的dia数据进行dia数据搜库分析,msplit-dia的搜库参数为:母离子质量容忍度为
±
25da,二级碎片离子的质量容忍度为
±
50ppm。
[0105]
同时,使用数据依赖模式采集10ng微量蛋白质组样本在90min色谱梯度时长下的质谱数据。数据依赖采集模式的二级谱采集时间设为100ms,二级谱扫描次数设为10,二级谱采集的母离子强度阈值设为100cps。色谱a相为99.9%的水+0.1%的甲酸;色谱b相为80%的乙腈+19.9%的水+0.1%的甲酸。90分钟色谱梯度为:0~5分钟为0%b~5%b;5.1~60分钟为5%b~28%b;60.1~70分钟为28%b~80%b;70.1~90分钟为80%b;
[0106]
使用msplit-dia软件分别对数据非依赖采集的10ng微量蛋白质组样本的质谱数据进行搜库分析,同时对数据依赖采集的10ng微量蛋白质组样本的质谱数据使用mascot软件和coment软件进行搜库分析,所用数据库为uniprot网址下载的人的蛋白库,包含72481条蛋白序列,搜库完成后使用trans-proteomic pipeline软件整合mascot和comet的搜库结果;结果如图4所示。
[0107]
实验结果表明,基于无动态排除的数据依赖采集模式构建的谱图库,对10ng微量蛋白质组样本在不同色谱梯度时长下使用数据非依赖采集的质谱数据进行分析,即便是在30分钟梯度时长下,也能鉴定到832
±
19个蛋白,与数据依赖采集的质谱数据在90分钟梯度时长下获得的蛋白质鉴定数目(836
±
4)相当。说明基于无动态排除的数据依赖采集模式建库结合数据非依赖采集模式的质谱分析方法,相较于传统的数据依赖采集模式的质谱分析方法,提高了微量目标蛋白质组的分析通量。
[0108]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0109]
以上实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。

技术特征:
1.一种构建目标蛋白质组谱图库的方法,其特征在于,所述方法包括:通过多个扫描范围对目标蛋白质组进行多次无动态排除的数据依赖采集模式的质谱扫描,以得到目标蛋白质组的质谱数据,所述目标蛋白质组的质谱数据包括目标蛋白质组多个扫描范围的一级谱以及每个扫描范围中母离子强度满足预设阈值的二级谱;基于目标蛋白质组的质谱数据进行搜库以构建目标蛋白质组谱图库。2.根据权利要求1所述的方法,其特征在于,所述目标蛋白质组的质谱数据满足以下条件(1)~(4)中的至少一种:(1)所述多个扫描范围包括400m/z~1250m/z范围内的若干个连续的扫描范围;(2)所述二级谱的采集时间为30ms~45ms;(3)所述二级谱的扫描次数为60~100;(4)所述二级谱扫描的母离子强度满足的预设阈值为10cps~29cps;可选地,所述多个扫描范围包括400m/z~500m/z、500m/z~600m/z、600m/z~700m/z、700m/z~800m/z、900m/z~1000m/z、1000m/z~1100m/z以及1100m/z~1250m/z。3.根据权利要求1所述的方法,其特征在于,所述目标蛋白质组的质谱数据满足以下条件(1)~(3)中的至少一种:(1)所述目标蛋白质组为目标生物体的蛋白质组;(2)所述目标蛋白质组的上样量为10ng~2000ng;(3)所述目标蛋白质组的色谱梯度时长为90~120分钟;可选地,所述目标生物体选自动物、植物和微生物中的任意一种;可选地,所述目标生物体选自牛、马、猪、绵羊、山羊、大鼠、小鼠、狗、猫、兔、骆驼、驴、鹿、貂、鸡、鸭、鹅或人。4.根据权利要求1所述的方法,其特征在于,所述搜库的参数为:使用trypsin酶切,最大允许两个漏切位点,甲硫氨酸氧化、蛋白n末端乙酰化设为可变修饰,半胱氨酸烷基化设为固定修饰。5.根据权利要求1~4任一项所述的方法构建的目标蛋白质组谱图库。6.根据权利要求5所述的目标蛋白质组谱图库在微量蛋白质组检测中的应用。7.根据权利要求6所述的应用,其特征在于,所述微量蛋白质组满足以下条件(1)~(3)中的至少一种:(1)所述微量蛋白质组的质量为0.2ng~100ng;(2)所述微量蛋白质组与所述目标蛋白质组来源于同一种生物体;(3)所述微量蛋白质组为单细胞蛋白质组。8.根据权利要求6或7所述的应用,其特征在于,所述应用包括以下步骤:获取通过数据非依赖采集模式采集的微量蛋白质组的质谱数据,利用所述目标蛋白质组谱图库对微量蛋白质组的质谱数据进行搜库分析。9.根据权利要求8所述的应用,其特征在于,所述数据非依赖采集模式满足以下条件(1)~(4)中的至少一种:(1)所述数据非依赖采集模式为固定窗口的数据非依赖采集模式或可变窗口的数据非依赖采集模式;(2)所述数据非依赖采集模式的扫描范围包括:400m/z~1250m/z;
(3)所述微量蛋白质组的一级谱的采集时间为200ms~300ms;(4)所述微量蛋白质组的二级谱的采集时间为65ms~100ms。10.根据权利要求8所述的应用,其特征在于,所述微量蛋白质组的质谱数据满足以下条件(1)~(2)中的至少一种:(1)所述微量蛋白质组的色谱梯度时长为1~240分钟;(2)对所述微量蛋白质组的质谱数据进行搜库的参数为:母离子质量容忍度为
±
25da,二级碎片离子的质量容忍度为
±
50ppm。

技术总结
本申请涉及一种构建目标蛋白质组谱图库的方法和在微量目标蛋白质组分析上的应用,方法包括:通过不同扫描范围对目标蛋白质组进行多次无动态排除的数据依赖采集模式的质谱扫描,以得到目标蛋白质组的质谱数据,目标蛋白质组的质谱数据包括目标蛋白质组多个扫描范围的一级谱,以及每个扫描范围中母离子强度满足预设阈值的二级谱;基于目标蛋白质组的质谱数据进行搜库以构建目标蛋白质组谱图库。本申请通过多个扫描范围无动态排除的数据依赖采集的质谱数据构建谱图库,对微量蛋白质组的DIA数据进行搜库分析,提高了DIA数据匹配的成功率,进而提高DIA数据分析的准确性和灵敏度,提高了微量蛋白鉴定的准确性和灵敏度。提高了微量蛋白鉴定的准确性和灵敏度。提高了微量蛋白鉴定的准确性和灵敏度。


技术研发人员:张珅 雷姣 汪星瑶 林戈
受保护的技术使用者:中信湘雅生殖与遗传专科医院有限公司
技术研发日:2023.07.03
技术公布日:2023/10/6
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐