DNA条形码、引物、试剂盒、方法和应用与流程

未命名 09-29 阅读:103 评论:0

dna条形码、引物、试剂盒、方法和应用
技术领域
1.本发明属于物种和菌株鉴定领域,具体涉及一种用于鉴别普洱茶发酵生产用菌株的dna条形码引物组合物、dna条形码、试剂盒、方法及应用。具体而言,所述普洱茶发酵生产用菌株为埃莫森罗萨氏菌(rasamsonia emersonii)tmcc 70008菌株。


背景技术:

2.普洱茶是一种具有云南地理标识范围内生产的后发酵茶,其采用大叶种晒青毛茶作为原料,经过一系列工艺制作而成。传统的普洱茶制作过程为:采摘的新鲜茶叶经揉捻、晒青后制成原料晒青毛茶,之后经除杂、潮水、渥堆、晾干、筛分、压制成型、包装出厂。在普洱茶的生产中,渥堆发酵过程是普洱茶品质形成的主要因素,在此过程中,茶叶中诸如茶多酚、咖啡因以及一些多糖物质等内含成分发生了巨大变化,成就了普洱茶的特殊风味、口感、品质以及各种保健功效。
3.在传统的普洱茶生产中,湿热的环境激活茶叶本身所含的酶,使得茶叶中所含的一部分内含成分转化成微生物能利用的物质;普洱茶发酵过程中微生物也大量生长,产生丰富的胞内酶和胞外酶,催化茶叶中内含成分发生一系列转变,由此形成普洱茶独特的品质。不同的产地,微生物种类及其群落结构的差异,使得普洱茶风味及品质也各具特色。
4.普洱茶除了其独特的风味和文化外,其诸如减肥、降血糖和血脂、预防和改善心血管疾病、抗衰老、抗癌、消炎、助消化以及养胃等保健功效也备受人们关注,并越来越受消费者欢迎。逐渐增加的市场需求拉动了普洱茶产业的发展,促进了云南地区经济增长。
5.随着人们生活水平的提高,消费者对食品的卫生、安全等问题日益重视。然而,近几年食品质量安全事件频发,茶叶质量及其安全问题也越来越受到关注。除了农药的残留问题之外,普洱茶渥堆发酵过程中微生物也有可能成为影响茶叶质量的重要因素,因此普洱茶产业发展也面临着一些困境。例如,产品质量不稳定,生产周期长,劳动力投入过高,微生物数量超标和螨虫滋生等。
6.目前多数生产商的普洱茶生产仍然是半自然人工渥堆的经验式发酵,虽然渥堆过程中以包括埃莫森罗萨氏菌(rasamsoniaemersonii)在内的优势共性微生物为主的群落相对稳定,但产品的稳定性还存在较大的提升空间,生产过程中也不可避免地存在着一定的安全隐患。要进一步获得消费者的青睐和市场的认可、突破外贸壁垒,提升普洱茶企业的市场竞争力,必须实现普洱茶生产的人工可控、清洁化以及高效化,并不断开发新产品、延伸产业链。要做到这些,就必须革新技术,发明一系列安全、清洁、高效、人工可控的自动化普洱茶新工艺,才能确保普洱茶产业的健康发展,给国家和人民带来长远利益。
7.人工接种和普洱茶的纯种发酵是普洱茶可控发酵的新发展方向。为保护普洱茶发酵工艺和优质微生物种质资源,开发对普洱茶发酵用菌种快速、精准鉴别方法势在必行。
8.dna条形码技术可快速、简便地鉴别、区分与其相似菌种,可为普洱茶人工可控纯种发酵工艺开发和资源保护提供理论依据和技术手段,促进普洱茶产业健康发展。


技术实现要素:

9.为克服形态学在鉴定普洱茶发酵生产菌上存在的缺陷,本发明提供了用于鉴别普洱茶发酵用菌种埃莫森罗萨氏菌(rasamsoniaemersonii)tmcc 70008的dna条形码、引物、试剂盒、方法和应用,从而可以准确地将埃莫森罗萨氏菌tmcc 70008菌株从易混淆的物种或复合种中鉴别出来,也可以准确地鉴别由该菌株发酵生产的普洱茶,实现进行快速鉴别和区分,可为普洱茶新发酵工艺提供快速鉴别、评估,防止发酵过程中其他杂菌的干扰,以及为普洱茶人工可控发酵工艺及菌种滥用提供举证方法和依据。
10.为了实现上述目的,本发明采用如下技术方案:
11.(1)一种用于鉴别埃莫森罗萨氏菌菌株或由其发酵生产的普洱茶的dna条形码,其特征在于,该dna条形码来源于埃莫森罗萨氏菌tmcc 70008菌株的基因组,并且选自如seq id no.4所示的dna序列中的至少100bp的序列。
12.(2)根据(1)所述的dna条形码,其中所述dna条形码的核苷酸序列包含如seq id no.1、seq id no.2或seq id no.7所示的序列;或者,所述dna条形码选自如seq id no.1、seq id no.2或seq id no.7所示的dna序列中的序列;优选地,所述dna条形码的核苷酸序列如seq id no.1、seq id no.2、seq id no.4或seq id no.7所示。
13.(3)一种用于扩增(1)或(2)所述的dna条形码的引物对。
14.(4)根据(3)所述的引物对,其正向引物的核苷酸序列与埃莫森罗萨氏菌tmcc 70008菌株基因组中的这样的序列相同:该序列为从所述tmcc 70008菌株基因组中如seq id no.4所示的核苷酸序列的第1位到如seq id no.4所示的核苷酸序列的第2296位的区域中的序列,并且该正向引物的长度为15-30bp;其反向引物与所述tmcc 70008菌株基因组中的这样的序列反向互补:该序列为从所述tmcc 70008菌株基因组中如seq id no.4所示的核苷酸序列的第86位到如seq id no.4所示的核苷酸序列的最后一位的区域中的序列,并且该反向引物的长度为15-30bp。
15.(5)根据(4)所述的引物对,所述正向引物和反向引物的核苷酸序列分别如下所示:
16.正向引物:5
’‑
atataaaagcctctagggtgcc-3’;
17.反向引物:5
’‑
cacaacaagcctgcctacc-3’。
18.(6)一种用于鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶的试剂盒,包含根据(3)-(5)中任一项所述的引物对。
19.(7)一种鉴别埃莫森罗萨氏菌tmcc 70008菌株的方法,包括以下步骤:
20.a)提供待测菌株的基因组dna;
21.b)以步骤a)所述的基因组dna为模板,利用根据(3)-(5)中任一项所述的引物对进行pcr扩增,得到pcr产物;
22.c)电泳检测pcr产物,如果没有目标条带,则判定待测菌株不是埃莫森罗萨氏菌tmcc 70008菌株;如果有目标条带,则进行步骤d);
23.d)对所得pcr产物进行测序,得到待测核苷酸序列;将所述待测核苷酸序列与(1)或(2)所述的dna条形码的核苷酸序列进行同源性比对,若同源性在99%以上,则判定待测菌株为埃莫森罗萨氏菌tmcc 70008菌株。
24.(8)一种鉴别由埃莫森罗萨氏菌tmcc 70008菌株发酵生产的普洱茶的方法,包括
以下步骤:
25.a)提供普洱茶样品;
26.b)从所述普洱茶样品中提取微生物菌株的基因组dna;
27.c)以步骤b)所述的基因组dna为模板,利用根据(3)-(5)中任一项所述的引物对进行pcr扩增,得到pcr产物;
28.d)电泳检测pcr产物,如果没有目标条带,则判定所述普洱茶不是由埃莫森罗萨氏菌tmcc 70008菌株发酵生产的普洱茶;如果有目标条带,则进行步骤e);
29.e)对所得pcr产物进行测序,得到待测核苷酸序列;将所述待测核苷酸序列与(1)或(2)所述的dna条形码的核苷酸序列进行同源性比对,若同源性在99%以上,则判定所述普洱茶为由埃莫森罗萨氏菌tmcc 70008菌株发酵产生的普洱茶。
30.(9)根据(1)或(2)所述的dna条形码在鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶中的应用。
31.(10)根据(3)-(5)中任一项所述的引物对在鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶中的应用。
32.(11)根据(6)所述的试剂盒在鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶中的应用。
33.本发明与现有技术相比具有以下优点和积极效果:
34.1、本发明采用蛋白质基因组学技术从埃莫森罗萨氏菌(rasamsonia emersonii)tmcc 70008菌株的基因组中发现了漏注释的肽段。基于该肽段编码序列在基因组中的位置,确定了编码该肽段可能的基因序列和蛋白序列。本发明进一步通过仔细的研究和比较分析,基于该肽段的编码基因(ost基因)开发了dna条形码,该条形码序列能实现埃莫森罗萨氏种内菌种的快速鉴别与区分,可以准确地将埃莫森罗萨氏菌tmcc 70008菌株从易混淆的物种或复合种中鉴别出来,进而还可以准确地鉴别由该菌株发酵生产的普洱茶。
35.2、本发明进一步发现,相比于其他基因,ost基因的序列(例如seq id no.1)具有通用、易扩增、易比对的特点,其在埃莫森罗萨氏种内不同菌株之间差异明显。
36.3、本发明建立了普洱茶工业发酵生产用菌株埃莫森罗萨氏菌tmcc 70008菌株的标准基因序列和样品鉴别方法。相比于传统的形态学鉴定方法,本发明的方法显著提高了目的菌种的鉴定效率。该方法对于样品的完整程度要求低,鉴别指标能够量化,这对于及时判定普洱茶发酵工艺及其种质资源提供了有效的依据。此外,本发明进一步加入了形态学混淆种,其鉴定的可靠性和准确性也大大优于常规的分子鉴定方法,弥补了基于dna条形码技术对普洱发酵茶生产用埃莫森罗萨氏菌株进行鉴定的空白。
附图说明
37.图1示出了新鉴定肽段yapidlddtmydeltsapr的质谱谱图。
38.图2示出了化学合成肽段yapidlddtmydeltsapr质谱图与原鉴定肽段质谱图对比图;所述原鉴定肽段为本发明经过质谱分析并鉴定得到的肽段;图的上方为原鉴定肽段的质谱图,下方为化学合成肽段的质谱图。
39.图3示出了seq id no.1的序列,其中灰色背景部分为内含子,起始位点为atg,终止位点为tag。
no.1)可以将埃莫森罗萨氏菌tmcc 70008菌株从易混淆的物种中鉴别出来,因此可以用于开发鉴别普洱茶工业发酵生产菌株埃莫森罗萨氏菌tmcc 70008菌株的dna条形码。与现有技术相比,本发明通过上述方法获得的dna条形码的特异性更高。
54.本发明进一步通过仔细的研究和比较分析,基于上述特有的dna序列(seq id no.1)获得了可准确、有效地鉴别埃莫森罗萨氏菌tmcc 70008菌株的dna条形码。
55.具体而言,本发明通过系统的蛋白质基因组学研究发现了一条在原有埃莫森罗萨氏菌tmcc 70008菌株的注释基因中没有包含的肽段,其序列为yapidlddtmydeltsapr,并且支持该肽段存在的肽段及相关蛋白质组学质谱数据准确可靠。基于该肽段编码序列在埃莫森罗萨氏菌tmcc 70008菌株基因组中的位置,确定了编码该蛋白可能的基因序列(seq id no.1)和蛋白序列(seq id no.3)。seq id no.1的长度为1163bp,根据比对分析,seq id no.1为埃莫森罗萨氏菌tmcc 70008菌株基因组所特有,因此该序列本身即可作为埃莫森罗萨氏菌tmcc 70008菌株的dna条形码。
56.另外,通过比较分析和实验验证,本发明证明包含该序列、长度更长的dna条码的特异性也能够得到保证。当dna条形码的长度过长时(例如大于4000bp),对于扩增操作而言较不理想。据此,基于所述基因序列,本发明在埃莫森罗萨氏菌tmcc 70008菌株基因组中寻找到了更长、特异性高的dna条形码序列(seq id no.2和seq id no.4)。另一方面,当dna条形码序列长度为100bp至200bp时,则可作为dna微型条形码(dna minibarcoding)。据此,本发明通过比对分析和实验验证,证明选自如seq id no.4所示的dna序列中的至少100bp的序列(例如seq id no.7)也具有高的特异性,能够实现埃莫森罗萨氏菌tmcc 70008菌株的快速准确鉴别与区分。
57.基于上述发现,根据本发明的一个方面,提供了一种用于鉴别埃莫森罗萨氏菌株或由其发酵生产的普洱茶的dna条形码,其特征在于,该dna条形码来源于埃莫森罗萨氏菌tmcc 70008菌株的基因组,并且选自如seq id no.4所示的dna序列中的至少100bp的序列。
58.在一些实施方案中,所述dna条形码选自如seq id no.4所示的dna序列中的至少500bp、600bp、700bp、800bp、900bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp、1600bp、1700bp、1800bp、1900bp、2000bp、2100bp、2200bp或2300bp的序列。
59.在另一些实施方案中,所述dna条形码选自如seq id no.4所示的dna序列中至少126bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp或200bp的序列,并且包含如seq id no.7所示的序列。
60.在一些优选的实施方案中,所述dna条形码选自如seq idno.1、seq id no.2或seq id no.7所示的dna序列中的序列。优选地,所述dna条形码选自如seq id no.1或seq id no.2所示的dna序列中至少500bp、600bp、700bp、800bp、900bp、1000bp、1100bp、或1200bp的序列。
61.在另一些优选的实施方案中,所述dna条形码的核苷酸序列包含如seq id no.1、seq id no.2、或seq id no.7所示的序列。
62.特别地,本发明发现在埃莫森罗萨氏菌tmcc 70008菌株基因组中,seq id no.4中所包含的如seq id no.7所示的dna序列在不同菌种间以及在埃莫森罗萨氏菌种内不同菌株之间具有特别高的特异性。由于该片段序列在ncbi数据库中未发现同源序列,因此适合作为微型条形码以鉴别埃莫森罗萨氏菌tmcc 70008菌株。
63.优选地,根据本发明的dna条形码序列如seq id no.1、seq idno.2、seq id no.4或seq id no.7所示。
64.上述dna序列可以将埃莫森罗萨氏菌tmcc 70008菌株从易混淆的物种中鉴别出来,因此可以用于开发鉴别普洱茶工业发酵生产菌株埃莫森罗萨氏菌tmcc 70008的dna条形码。与现有技术相比,本发明通过上述方法获得的dna条形码的特异性更高。
65.seq id no.1、seq id no.2、seq id no.3、seq id no.4和seq id no.7的序列如下所示:
66.seq id no.1:
67.[0068][0069]
其中,灰色背景部分为内含子,起始位点为atg,终止位点为tag。
[0070]
seq id no.2:
[0071]
[0072][0073]
其中,双下划线部分为内含子,灰色部分为seq id no.1,起始位点为atg,终止位点为tag。
[0074]
seq id no.3:
[0075]
mkflscfitllctagialsaepaidkfhkfqslsryapidlddtmydeltsaprdyyvailltalearygcilcrefqseweliakswnkanqpdgikllfgtldfsngrntfqklmlqtapivllfpptvgpsatldgapvrfdfsgpisadqlyvwmnrhlpegpkpplvrpinymrlvsaitillglitlftvsspyvlpvvqnrnlwaaisliaillftsghmfnhirkvpyvagdgrggisyfaggfsnqfgmetqiiaaickfslelklslkigigsnhllihpdgilsfatialalkvprmadakaqqlavivwgvvllgmysfllsifrmknggypfflppf
[0076]
肽段yapidlddtmydeltsapr坐落在该基因编码蛋白的n端,如seq id no.3序列中下划线所示。
[0077]
seq id no.4:
[0078]
[0079][0080]
其中,灰色部分为seq id no.1,双下划线为基因中内含子,单下划线部分为seq id no.7。
[0081]
本发明还基于所述条形码的核苷酸序列,设计了扩增引物对。通过引物扩增,并根据pcr产物的有无和扩增片段的差异和任选的系统发育树可以快速、准确地鉴别埃莫森罗萨氏菌tmcc 70008菌株。
[0082]
因此,根据本发明的另一方面,提供了用于扩增根据本发明的dna条形码的引物对。
[0083]
本领域技术人员可以理解,根据本发明提供的用于鉴别埃莫森罗萨氏菌株的dna条形码序列,可以容易地设计相应的引物对,从而扩增出所需dna条形码。
[0084]
优选地,所述引物对的正向引物的核苷酸序列与埃莫森罗萨氏菌tmcc 70008菌株基因组中的这样的序列相同:该序列为从所述tmcc 70008菌株基因组中如seq id no.4所示的核苷酸序列的第1位到如seq id no.4所示的核苷酸序列的第2296位的区域中的序列,并且该正向引物的长度一般为15-30bp;其反向引物与所述tmcc 70008菌株基因组中的这样的序列反向互补:该序列为从所述tmcc 70008菌株基因组中如seq id no.4所示的核苷酸序列的第86位到如seq id no.4所示的核苷酸序列的最后一位的区域中的序列,并且该反向引物的长度也一般为15-30bp。所述正反引物扩增出的产物即为选自seq idno.4所示的核苷酸序列中的至少100bp的序列。
[0085]
在更优选的实施方案中,所述引物对用于扩增选自seq idno.1、2、或7所示的核苷酸序列中的序列。
[0086]
在一些具体实施方案中,所述正向引物和反向引物的核苷酸序列分别如下所示:
[0087]
ost-f:5
’‑
atataaaagcctctagggtgcc-3’(seq id no.5);
[0088]
ost-r:5
’‑
cacaacaagcctgcctacc-3’(seq id no.6)。
[0089]
本发明的引物对能实现对所述dna条形码序列的特异性扩增。
[0090]
本发明还提供了一种用于鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶的试剂盒,包含根据本发明所述的引物对。
[0091]
在另一实施方案中,所述试剂盒还包含根据本发明所述的dna条形码。所述dna条形码可存在于记录介质上。该记录介质例如为光盘。所述试剂盒还可以包含用于实验操作的任何工具和试剂。
[0092]
本发明的又一方面提供了一种用于鉴别埃莫森罗萨氏菌tmcc 70008菌株的方法,包括以下步骤:
[0093]
a)提供待测菌株的基因组dna;
[0094]
b)以步骤a)所述的基因组dna为模板,利用根据本发明所述的引物对进行pcr扩增,得到pcr产物;
[0095]
c)电泳(例如琼脂糖凝胶电泳)检测pcr产物,如果没有目标条带,则判定待测菌株不是埃莫森罗萨氏菌tmcc 70008菌株,如果有目标条带,则进行步骤d);
[0096]
d)对所得pcr产物进行测序,得到待测核苷酸序列;将所述待测核苷酸序列与本发明所述的dna条形码的核苷酸序列进行同源性比对,若同源性在99%以上(优选100%),则判定待测菌株为埃莫森罗萨氏菌tmcc 70008菌株。
[0097]
在本文中所使用的术语“同一性”和“同源性”具有相同的含义,可以相互交换使用。
[0098]
本发明还提供了一种鉴别由埃莫森罗萨氏菌tmcc 70008菌株发酵生产的普洱茶的方法,包括以下步骤:
[0099]
a)提供普洱茶样品;
[0100]
b)从所述普洱茶样品中提取微生物菌株的基因组dna;
[0101]
c)以步骤b)所述的基因组dna为模板,利用本发明所述的引物对进行pcr扩增,得到pcr产物;
[0102]
d)通过电泳(例如琼脂糖凝胶电泳)检测pcr产物,如果没有目标条带,则判定所述普洱茶不是由埃莫森罗萨氏菌tmcc 70008菌株发酵生产的普洱茶;如果有目标条带,则进行步骤e);
[0103]
e)对所得pcr产物进行测序,得到待测核苷酸序列;将所述待测核苷酸序列与本发明所述的dna条形码的核苷酸序列进行同源性比对,若同源性在99%以上(优选100%),则判定所述普洱茶为由埃莫森罗萨氏菌tmcc 70008菌株的发酵产生的普洱茶。
[0104]
在步骤b)中,可以直接从所述普洱茶样品中提取微生物菌株的基因组dna,也可以先从普洱茶中分离微生物菌株,在从所分离的微生物菌株中提取基因组dna。
[0105]
在本发明的鉴别菌株或普洱茶的方法的具体实施方案中,所述pcr扩增的程序为:1)94℃预变性5分钟;2)94℃变性30秒,58℃退火30秒,72℃延伸15秒,其中该程序2)进行30个循环;3)72℃延伸10分钟。
[0106]
在本发明的又一实施方案中,所述方法还可以包括将测序结果得到的待测核苷酸序列与本发明的dna条形码进行聚类分析(例如系统发育树),如果待测序列与dna条形码聚类在一起,则确定待测菌株为埃莫森罗萨氏菌tmcc 70008菌株,或待测普洱茶为由埃莫森罗萨氏菌tmcc 70008菌株的发酵产生的普洱茶。例如,将埃莫森罗萨氏菌tmcc 70008菌株dna条形码序列和待测菌株样品序列(可以包括埃莫森罗萨氏菌种内的其他菌株序列)合并,利用mega 5软件构建nj系统发育树,根据待测菌株的序列与dna条形码序列聚类的情况来鉴定待测菌株。
[0107]
在本发明一个具体的实施方案中,利用本发明的引物对对提取自待鉴别的菌株的基因组dna进行pcr扩增,然后进行琼脂糖凝胶电泳检测。基于检测是否存在pcr产物来鉴别菌株:如果待鉴定的菌株没有扩增出相应的目标条带,则说明该菌株不是tmcc 70008;如果扩增出相应的目标条带,则证明该菌株可能是tmcc 70008。为了进一步进行鉴别,对pcr产物进行测序,将dna测序结果与dna条形码序列进行同源性比对,获得序列间的相似性(即同源性),如果序列同源性小于99%,则判定待测菌株不是埃莫森罗萨氏菌tmcc 70008菌株。如果序列同源性大于或等于99%,则判定待测菌株是埃莫森罗萨氏菌tmcc 70008菌株。
[0108]
如果进行聚类分析,例如系统发育树,则将所述dna条形码和各待鉴定菌株的dna测序结果(即待测序列)一起应用mega 5软件构建nj系统发育树。如果待鉴定菌株的待测序列与埃莫森罗萨氏菌tmcc 70008菌株的dna条形码聚类在一起,则鉴定为埃莫森罗萨氏菌tmcc 70008菌株。
[0109]
在此所使用的术语“聚类”是指经系统发育树分析后,处于同一个分支,且进化距离相同。
[0110]
本发明还提供了本发明所述的dna条形码在鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶中的应用。
[0111]
本发明还提供了本发明所述的引物对在鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶中的应用。
[0112]
本发明还提供了本发明所述的试剂盒在鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶中的应用。
[0113]
实施例
[0114]
下面结合具体的实施例对本发明做进一步说明。实施例中所用方法在未具体说明的情况下,均采用常规方法和已知工具。
[0115]
实施例1:ost基因和dna条形码的获得
[0116]
1、利用高覆盖蛋白质组技术,采用pfind和panno软件(其中,pfind软件用于蛋白质组数据库的搜索,panno软件通过将蛋白质组数据回贴到基因组中进行基因组的重注释)对埃莫森罗萨氏菌tmcc 70008(rasamsonia emersonii tmcc 70008)进行了蛋白质组的深度覆盖研究,并对其基因组进行了注释编码基因验证。为了发现新的蛋白编码区,利用系统蛋白质基因组学中的六框翻译(six frame translation)策略,获得了埃莫森罗萨氏菌tmcc 70008基因组数据的六框翻译数据库,穷举了基因组的6种编码可能(+1,+2,+3,-1,-2,-3),并且将该核酸序列称为“六框翻译核酸序列”,蛋白序列称为“六框翻译蛋白序列”。通常而言,六框翻译核酸序列是从一个终止子到下一个终止子的序列。利用这个数据库,采用pfind和panno软件对tmcc 70008菌株总细胞蛋白的高覆盖蛋白质组质谱数据进行了新肽段和新蛋白质的鉴定。
[0117]
经鉴定,发现了一条现有技术中埃莫森罗萨氏菌tmcc 70008注释基因中未发现的肽段yapidlddtmydeltsapr(seq idno.8),质谱谱图如图1所示。
[0118]
手工检查质谱谱图结果显示,检测到了肽段yapidlddtmydeltsapr二级质谱谱图(ms2)的几乎所有y离子序列,匹配好,信号强,结果可信。
[0119]
2、为进一步确证这个鉴定结果,按照新鉴定肽段yapidlddtmydeltsapr的氨基酸序列化学合成了该肽段,并对合成肽段产生的高能量碰撞ms2进行了核实,一级母离子和二级子离子均符合理论值,表明合成的肽段序列正确,参见图2。
[0120]
在此基础上,人工检查了根据大规模蛋白质组数据鉴定到的新肽段序列合成肽段的ms2和大规模鉴定新肽段谱图,两者几乎完全一致,以子离子相似性获得的cosin值高达0.97,由此证明从普洱茶工业发酵菌埃莫森罗萨氏菌tmcc 70008菌株鉴定到的新肽段正确无误。
[0121]
3、根据新肽段所在的位置,以前一个终止密码子和后一个终止密码子包括的区域为界,得到六框翻译核酸序列(orf编码框),即seq id no.2。
[0122]
4、为了进一步确定该编码基因的编码起始位点和终止位点,将上述六框翻译核酸序列向上游和下游分别扩展1000bp,采用augustus进行基因预测,参考物种选用粟酒裂殖酵母(schizosaccharomyces pombe)。在该区域预测到了蛋白编码基因(新类寡糖转移酶编码基因,ost)的存在,其编码框与上述orf编码框序列基本一致。根据预测结果,确定了其可能的编码起始位点和终止位点,其完整的从起始子到终止子的基因序列为seq id no.1所示的序列,如图3所示。
[0123]
seq id no.1及其所编码的蛋白质的氨基酸序列(即seq idno.3)的对应关系如图4所示。肽段yapidlddtmydeltsapr坐落在该蛋白的n端附近。
[0124]
如seq id no.1所示的核苷酸序列包括终止子在内共1163bp,除去内含子区域,共编码350个氨基酸,理论分子量为38.75kda。理论编码的氨基酸序列如seq id no.3所示。
[0125]
5、以该基因理论编码产物的氨基酸序列(seq id no.3)进行ncbi-blastp分析,其与ncbi nr数据库中已有序列的同源性不高(《72%),如图5所示。
[0126]
图5中查询结果下方的每条线段表示在ncbi中匹配到的与目标序列(seq id no.3)具有一定相似性的序列。可以看到,线段的左侧有明显参差,并非长度完全相同,表明这些氨基酸序列与ost蛋白(seq id no.3)的相似性不高
[0127]
表1中列出了图5中所示的氨基酸序列中与tmcc 70008ost蛋白的氨基酸序列具有最高同源性的9条序列。对于同源性比对,通常根据两方面的数据进行评估,一方面是序列的覆盖度,从表1中可以看到这9条序列的覆盖度基本》99%;另一方面需要考察匹配序列的相似性,即使排名最高的氨基酸序列(来自于解蛋白篮状菌pmi_201),其序列相似性也仅为71.76%,从而表明这些序列与tmcc 70008ost蛋白的氨基酸序列(seq id no.3)的相似性不高。
[0128]
表1与tmcc 70008ost蛋白序列具有较高同源性的序列
[0129][0130]
图5所示的blastp结果表明,检测到的漏注释基因产物有一个结构域ost3_ost6,这表明所鉴定的序列相对于ncbi nr数据库中已有序列的相似性不高。图6所示的序列比对佐证了上述结果,即同源蛋白的相似度不高。
[0131]
6、将所鉴定的ost基因的dna序列(即seq id no.1)进行ncbi-blastn分析,结果见图7。
[0132]
图7的查询结果下方左侧的线段表示埃莫森罗萨氏菌(rasamsonia emersonii)cbs 393.64寡糖转移酶亚基mrna的匹配情况,其分别匹配到seq id no.1序列的4-348位以及399-500位;右侧的线段表示假溜曲霉(aspergillus pseudotamarii)cbs 117625未知蛋白(bdv38draft_260987),mrna的匹配情况,其匹配到seq id no.1序列的558-918位。
[0133]
表2示出了上述ncbi-blastn分析中与tmcc 70008ost基因序列(seq id no.1)具有较高同源性的序列的数据。
[0134]
表2与tmcc 70008ost基因序列具有较高同源性的序列
[0135][0136]
表2的结果表明,ost基因的序列seq id no.1在ncbi数据库中只有2条同源序列,但差异较大,覆盖度不超过38%,这表明我们在埃莫森罗萨氏菌tmcc 70008菌株中发现的ost基因序列(seq id no.1)较ncbi nr数据库中的已有序列具有很高的特异性,可以作为区分tmcc 70008菌株和其他菌种或菌株的dna条形码。
[0137]
7、进一步考虑了ost基因序列(即seq id no.1)前后转录间隔区的序列,得到seq id no.4。对seq id no.4进行同源性(ncbi-blastn)比较,如图8所示。
[0138]
表3示出了上述ncbi-blastn分析中与seq id no.4具有较高同源性的序列的数据。这5条序列的覆盖度不超过18%,从而表明这些序列与seq id no.4的相似性不高。
[0139]
表3与seq id no.4具有较高同源性的序列
[0140][0141]
从图8和表3的结果可知,seq id no.4在ncbi数据库中特异性较高。说明seq id no.4可有效地区分tmcc 70008和近源菌株,因此可以作为dna条形码。
[0142]
8、进一步对seq id no.2进行同源性(ncbi-blastn)比较。如图9所示,查询结果下方左侧的线段表示埃莫森罗萨氏菌(rasamsonia emersonii)cbs 393.64寡糖转移酶亚基mrna的匹配情况;右侧的线段表示假溜曲霉(aspergillus pseudotamarii)cbs 117625未知蛋白(bdv38draft_260987)mrna的匹配情况。
[0143]
表4示出了上述ncbi-blastn分析中与seq id no.2具有较高同源性的序列的数据,其覆盖度不超过32%,从而表明这些序列与seq id no.2的相似性不高。
[0144]
表4与seq id no.2具有较高同源性的序列
[0145][0146]
图9和表4的结果表明,seq id no.2在ncbi数据库中特异性较高。说明seq id no.2可有效地区分tmcc 70008和近源菌株,因此可以作为dna条形码。
[0147]
实施例2.利用dna条形码鉴别菌株
[0148]
依据待测样品的扩增结果、埃莫森罗萨氏菌tmcc 70008菌株ost基因序列及其序列同源性,来判定待测样品是否为普洱茶工业应用菌株埃莫森罗萨氏菌tmcc 70008菌株。
[0149]
选取埃莫森罗萨氏菌tmcc 70008菌株ost基因的转录间隔区序列设计引物。
[0150]
(1)基于实施例1步骤4中基因预测的结果,采用ncbi引物设计工具在该基因两端设计pcr引物。得到正反引物序列分别为:
[0151]
ost-f:5
’‑
atataaaagcctctagggtgcc-3’(seq id no.5);
[0152]
ost-r:5
’‑
cacaacaagcctgcctacc-3’(seq id no.6)。
[0153]
所扩增的序列如下(seq id no.7,126bp):
[0154]5’‑
atataaaagcctctagggtgccaacatgaagcttccaaggatgccagcatgaagcctccagggatgccagcataaagccttataagggtgccagtgtgaagcctgtgggtaggcaggcttgttgtg-3’[0155]
其中,划线区域为引物所在位置。
[0156]
seq id no.7通过ncbi-blastn进行同源性分析,未发现同源序列。说明seq id no.7可有效地区分tmcc 70008和近源菌株,因此可以作为dna条形码。
[0157]
(2)菌株来源
[0158]
表5选用的相关菌株的信息
[0159][0160]
(3)分别提取菌株dna:采用omega e.z.n.a.
tm
的酵母dna试剂盒提取各菌株的基因组dna,用灭菌的去离子水将样品的dna浓度稀释到0.5μg/μl。
[0161]
(4)扩增dna片段,进行聚合酶链式(pcr)反应,所用引物序列分别为:
[0162]
正向引物序列ost-f:5
’‑
atataaaagcctctagggtgcc-3’;
[0163]
反向引物序列ost-r:5
’‑
cacaacaagcctgcctacc-3’。
[0164]
pcr反应体系为50μl,pcr试剂为thermo scientific
tm
的taq dna聚合酶(重组):ddh2o 37.7μl、mgcl
2 5μl,dntps 4μl,正向引物1μl,反向引物1μl,taq dna聚合酶0.3μl、
dna模板1μl,不含染料。扩增程序为:94℃预变性5分钟;接下来94℃变性30秒,58℃退火30秒,72℃延伸15秒,一共进行30个循环;最后72℃延伸10分钟。
[0165]
(5)扩增产物检测:用1.0%的琼脂糖凝胶、1
×
tbe电泳缓冲液电泳检测,使用dna分子量标识判断pcr片段大小。若待测菌株没有预期126bp大小的扩增条带,说明该菌株不是埃莫森罗萨氏菌tmcc 70008;若出现明显清晰的条带,且无杂带,送生物测序公司进行dna片段测序。
[0166]
(6)该pcr引物的理论扩增序列为126bp。结果如图10所示,该引物仅能在埃莫森罗萨氏菌tmcc 70008中实现扩增,在同物种的埃莫森罗萨氏菌cbs 355.92、cbs 395.64、cbs 396.64、cbs 397.64中扩增出的条带大小与预期大小有显著差异,而在cbs 472.92、cbs 549.92中则不能实现扩增。
[0167]
(7)对于扩增出正确条带的菌株,为了进一步验证扩增的dna的序列,进行了测序和序列比对。首先用软件chromas检查测序后得到的序列峰图质量,确定峰图质量达到数据分析的要求之后,用dnastar软件包中的seqman进行正反向序列的拼接。将测序结果进行手工校对、序列拼接,然后进行序列比对。图11示出了埃莫森罗萨氏菌tmcc 70008菌株的pcr产物测序结果与理论序列(seq id no.7)的比对结果。结果显示,埃莫森罗萨氏菌tmcc 70008菌株的pcr产物与埃莫森罗萨氏菌tmcc 70008标准dna条形码(seq idno.7)的相似性为100%。该结果表明,基于dna条形码seq id no.7序列进行的待测菌株pcr扩增结果与理论序列(seq id no.7)完全一致,且能够区分其他种内菌株。
[0168]
(8)进一步进行聚类分析,将埃莫森罗萨氏菌tmcc 70008菌株dna条形码seq id no.7序列和待测菌株的pcr产物测序结果合并,利用mega5软件构建nj系统发育树。由于埃莫森罗萨氏菌cbs 472.92和cbs 549.92中无法扩增出片段,因此将tmcc 70008以及其他四株扩增出序列的菌株cbs 355.92、cbs 395.64、cbs 396.64、cbs 397.64中的pcr片段送去测序,并将测序结果构建nj系统进化树。发现tmcc 70008可与其他平行菌株显著区分开(图12),进一步证明只有扩增出符合seq id no.7理论大小片段的菌株才可鉴定为埃莫森罗萨氏菌tmcc 70008菌株。

技术特征:
1.一种用于鉴别埃莫森罗萨氏菌株或由其发酵生产的普洱茶的dna条形码,其特征在于,该dna条形码来源于埃莫森罗萨氏菌tmcc 70008菌株的基因组,并且选自如seq id no.4所示的dna序列中的至少100bp的序列。2.根据权利要求1所述的dna条形码,其中所述dna条形码的核苷酸序列包含如seq id no.1、seq id no.2或seq id no.7所示的序列;或者,所述dna条形码选自如seq id no.1、seq id no.2或seq id no.7所示的dna序列中的序列;优选地,所述dna条形码的核苷酸序列如seq id no.1、seq id no.2、seq id no.4或seq idno.7所示。3.一种用于扩增权利要求1或2所述的dna条形码的引物对。4.根据权利要求3所述的引物对,其正向引物的核苷酸序列与埃莫森罗萨氏菌tmcc 70008菌株基因组中的这样的序列相同:该序列为从所述tmcc 70008菌株基因组中如seq id no.4所示的核苷酸序列的第1位到如seq id no.4所示的核苷酸序列的第2296位的区域中的序列,并且该正向引物的长度为15-30bp;其反向引物与所述tmcc 70008菌株基因组中的这样的序列反向互补:该序列为从所述tmcc 70008菌株基因组中如seq id no.4所示的核苷酸序列的第86位到如seq id no.4所示的核苷酸序列的最后一位的区域中的序列,并且该反向引物的长度为15-30bp。5.根据权利要求4所述的引物对,所述正向引物和反向引物的核苷酸序列分别如下所示:正向引物:5
’‑
atataaaagcctctagggtgcc-3’;反向引物:5
’‑
cacaacaagcctgcctacc-3’。6.一种用于鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶的试剂盒,包含根据权利要求3-5中任一项所述的引物对。7.一种鉴别埃莫森罗萨氏菌tmcc 70008菌株的方法,包括以下步骤:a)提供待测菌株的基因组dna;b)以步骤a)所述的基因组dna为模板,利用根据权利要求3-5中任一项所述的引物对进行pcr扩增,得到pcr产物;c)电泳检测pcr产物,如果没有目标条带,则判定待测菌株不是埃莫森罗萨氏菌tmcc 70008菌株;如果有目标条带,则进行步骤d);d)对所得pcr产物进行测序,得到待测核苷酸序列;将所述待测核苷酸序列与权利要求1或2所述的dna条形码的核苷酸序列进行同源性比对,若同源性在99%以上,则判定待测菌株为埃莫森罗萨氏菌tmcc 70008菌株。8.一种鉴别由埃莫森罗萨氏菌tmcc 70008菌株发酵生产的普洱茶的方法,包括以下步骤:a)提供普洱茶样品;b)从所述普洱茶样品中提取微生物菌株的基因组dna;c)以步骤b)所述的基因组dna为模板,利用根据权利要求3-5中任一项所述的引物对进行pcr扩增,得到pcr产物;d)电泳检测pcr产物,如果没有目标条带,则判定所述普洱茶不是由埃莫森罗萨氏菌tmcc 70008菌株发酵生产的普洱茶;如果有目标条带,则进行步骤e);e)对所得pcr产物进行测序,得到待测核苷酸序列;将所述待测核苷酸序列与权利要求
1或2所述的dna条形码的核苷酸序列进行同源性比对,若同源性在99%以上,则判定所述普洱茶为由埃莫森罗萨氏菌tmcc 70008菌株发酵产生的普洱茶。9.根据权利要求1或2所述的dna条形码在鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶中的应用。10.根据权利要求3-5中任一项所述的引物对在鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶中的应用。11.根据权利要求6所述的试剂盒在鉴别埃莫森罗萨氏菌tmcc 70008菌株或由其发酵生产的普洱茶中的应用。

技术总结
本发明提供了DNA条形码、引物、试剂盒、方法和应用。本发明利用蛋白质基因组学技术选择OST蛋白的编码基因序列作为所述DNA条形码,其能够实现埃莫森罗萨氏菌(Rasamsonia emersonii)种内菌种的快速鉴别与区分。由此,本发明建立了普洱茶工业发酵生产用埃莫森罗萨氏菌(Rasamsonia emersonii)TMCC 70008菌种的标准基因序列和样品鉴别方法。相比于传统的形态学鉴定方法,本发明的方法具有通用、易扩增、易比对的特点,显著提高了鉴定效率,从而为普洱茶发酵工业可控纯种发酵工艺保护和微生物菌种资源挖掘、保护和利用提供了有力的技术手段。术手段。


技术研发人员:徐平 施佳辉 唐蜀昆 张亚峰 高慧英 高媛 曾新生 邵爱菊 潘淑康 蒋洁琳 陈川龙 贾鳗
受保护的技术使用者:勐海茶业有限责任公司
技术研发日:2023.07.06
技术公布日:2023/9/25
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐