具有β-氨基己糖苷酶活性的多肽和编码所述多肽的多核苷酸的制作方法

具有
β-氨基己糖苷酶活性的多肽和编码所述多肽的多核苷酸
技术领域
1.本发明涉及一种产生具有β-氨基己糖苷酶活性的多肽的方法,所述方法包括以下步骤:a)提供酵母细胞,所述酵母细胞包含编码具有β-氨基己糖苷酶活性且具有与seq id no:1或16中所示的氨基酸序列至少95%相同的氨基酸序列的多肽的多核苷酸,b)在允许产生所述多肽的条件下培养所述酵母细胞,以及c)获得步骤b)中产生的多肽。本发明进一步涉及一种编码具有β-氨基己糖苷酶活性且具有与seq id no:1中所示的氨基酸序列至少95%相同的氨基酸序列的多肽的多核苷酸,以及一种由所述多核苷酸编码的多肽。此外,本发明涉及一种包含本发明的多核苷酸的酵母细胞和载体。
背景技术:
2.β-氨基己糖苷酶(ec 3.2.1.52,本文中缩写为“b-hex”)是一种催化n-乙酰基-β-氨基己糖苷(hexosaminide)中末端非还原n-乙酰基氨基己糖残基水解的酶。这种酶通常也称为n-乙酰基-β-葡糖苷酶。n-乙酰基葡糖苷和n-乙酰基半乳糖苷是底物。
3.在哺乳动物中发现了三种主要形式的β-氨基己糖苷酶:由一条α链、一条β-a链和一条β-b链组成的三聚体(a型),由两条β-a链和两条β-b链组成的四聚体(b型),以及两条α链的同二聚体(s型)。已知一些遗传障碍(如泰-萨二氏病和山德霍夫氏病(sandhoff’sdisease))是由人类b-hex基因突变引起的。
4.糖苷酶已经在糖生物学研究中用作工具数十年,并且已经研究了它们在糖蛋白成熟中的作用(如由l
é
onard r、strasser r、altmann f.plant glycosidases acting on protein-linked oligosaccharides.phytochemistry.2009年2月;70(3):318-24.doi:10.1016/j.phytochem.2009.01.006.epub 2009年2月4日.pmid:19200565综述)。
5.当前用于聚糖修饰的β-氨基己糖苷酶制剂是从其天然来源刀豆(jack beans)(直生刀豆(canavalia ensiformis))中提取的。所述酶的基本描述和当前提取方法的基础可以在li等人(j.biol.chem.1970 245:5153-5160)中找到。所述酶已经用于例如研究生物膜的酶促分离(j med microbiol.2006年8月;55(pt 8):999-1008)。
6.然而,这种当前提取方法具有几个缺点:
7.刀豆作为一种生长在田间的植物具有此类天然系统的缺点:由于天气、土壤等条件导致的高度不可再现性(参见li(1970))。作为结果,可能产生新的次级代谢物,然后其被引入生产过程中,最终可能污染原料药,并对患者健康具有不可计算的影响。使用农用化学品来保持生育力和避免对植物的损害可能导致在产品内的残留。在培养或储存期间土壤中、植物上或豆类上真菌或其他微生物污染物的存在可能导致产物被毒素(如黄曲霉毒素)污染,所述毒素即使在少量时也可以具有极毒作用。
8.由于在自然条件下植物不需要大量的这种酶,因此b-hex在刀豆中不是非常丰富的蛋白质。它仅以约1u/g豆材料的非常小的活性存在,并且因此需要从大量污染蛋白质中提取且随后分离并纯化。这种困难的程序导致对用作底物的植物材料的高需求,并且使得这种方法非常昂贵。
9.除了1970年代早期描述的关于b-hex的少量数据(参见li等人,同上)之外,对这种酶知之甚少。值得注意的是,没有公开可得的蛋白质或dna序列。没有对所述酶进行详细的结构表征。
10.gers-barlag等人描述了从大豆中分离β-氨基己糖苷酶(phytochemistry,第27卷,第12期,1988,第3739-3741页)。us 2004/0031072披露了来自大豆的β-氨基己糖苷酶的序列(如seq id no:162900)。大豆β-氨基己糖苷酶序列也可以经由uniprot(参见登录号i1ktu6或i1jds6,其对应于ncbi参考序列:xp_003518662.1)来评估。
11.cn 109 971 736描述了对来自草莓的氨基己糖苷酶的鉴定。
12.sl
á
mov
á
等人描述了真菌b-n-乙酰基氨基己糖苷酶在巴斯德毕赤酵母(pichia pastoris)中的克隆和高产表达(protein expr purif.2012年3月;82(1):212-7.doi:10.1016/j.pep.2012.01.004.epub 2012年1月11日)。
13.strasser描述了存在于拟南芥(arabidopsis)(拟南芥(arabidopsis thaliana))基因组中的三个假定b-hex序列的异源表达(strasser等人,plant physiol.2008年6月;147(2):931)。作者使用草地贪夜蛾(spodoptera frugiperda)sf21昆虫细胞系统进行表达。作者还表明这些植物酶与充分研究的人类b-hex酶hexa和hexb仅具有大约30%的非常有限的同源性。因此,不足为奇的是,在akeboshi等人中对于人类hexa描述的在甲基营养型酵母ogataea minuta中的微生物表达将不能转座到植物酶上(akeboshi等人,appl environ microbiol.2007年8月;73(15):4805-12)。这一点尤其正确,因为作者描述了来自o.minuta的重组hexa与来自人类溶酶体的天然hexa之间的两处主要差异,这对应于两种生物体之间不同的翻译后加工。
技术实现要素:
14.在作为本技术基础的研究的背景下,对从刀豆(直生刀豆)中分离的b-hex酶进行了详细分析,以便确定尽可能多的蛋白质序列。这通过应用蛋白酶消化、edman测序和lc-ms/ms分析的组合来进行,并且通向了约40%蛋白质序列覆盖率的结果(实施例2)。利用这个结果,可以通过数据库检索确认实际上没有与所发现的序列的匹配。所发现的最接近的序列属于来自大豆(soy bean)(大豆(glycine max))的b-hex蛋白。此外,还确定了编码刀豆b-hex酶的全长cdna序列(实施例3)。与数据库中可获得的序列的比对揭示没有已知序列与所测定的序列匹配,因此检测到的β-氨基己糖苷酶多肽似乎尚未为公众所知。
15.有利地,可以在微生物系统中,即在法夫驹形氏酵母(komagataella phaffii)(有时也称为巴斯德毕赤酵母)中表达β-氨基己糖苷酶多肽。含有产生的法夫驹形氏酵母菌株的培养物的上清液显示显著量的b-hex活性(实施例4)。显示出可以获得超过100u/ml培养物。另外,培养物上清液不含大量的污染蛋白质。这允许直接可再现的蛋白质纯化过程。
16.选择由swennen(2002)描述的乳酸克鲁维酵母(klyveromyces lactis)表达系统作为第二个例子。对于此酵母系统,b-hex的重组表达也是成功的,因为在各自的酵母培养物中发现了生物活性b-hex。
17.显示出来自刀豆的b-hex酶不是存在于单一多肽链中,如通过将所发现的dna序列翻译成蛋白质序列所预期的。相反,发现了存在两条彼此缔合而没有共价连接的多肽链。这两条链的解离导致活性的完全丧失。因此,出人意料的是重组微生物表达产生了活性酶,因
为没有预期到所鉴定的b-hex酶以如下方式再现,即分裂成两条链并且同时确保这两条链以正确的结构缔合。
18.因此,本发明涉及一种产生具有β-氨基己糖苷酶活性的多肽的方法,所述方法包括以下步骤:
19.a)提供宿主细胞,所述宿主细胞包含编码具有β-氨基己糖苷酶活性且具有与seq id no:1或16中所示的氨基酸序列至少85%相同的氨基酸序列的多肽的多核苷酸,
20.b)在允许产生所述多肽的条件下培养所述宿主细胞,以及
21.c)获得步骤b)中产生的多肽。
22.本发明进一步涉及一种编码具有β-氨基己糖苷酶活性且具有与seq id no:1或16中所示的氨基酸序列至少85%相同的氨基酸序列的多肽的多核苷酸。
23.本发明进一步涵盖一种由本发明的多核苷酸编码的分离的多肽。
24.此外,本发明涉及一种包含本发明的多核苷酸的载体。在一些实施方案中,所述载体是表达载体。
25.本发明进一步涉及一种包含本发明的多核苷酸、本发明的多肽和/或本发明的载体的宿主细胞。
26.在一些实施方案中,本发明的宿主细胞是酵母细胞或动物细胞。例如,所述宿主细胞可以是属于酵母科(saccharomycetaceae)的酵母细胞,如法夫驹形氏酵母细胞。
27.在一些实施方案中,本发明的多肽具有与seq id no:1或16中所示的氨基酸序列至少90%相同,如95%或98%相同的氨基酸序列。在一些实施方案中,所述多肽包含如seq id no:1或16中所示的氨基酸序列。
28.在一些实施方案中,本发明的多核苷酸包含如seq id no:2中所示的核酸序列。在一些实施方案中,本发明的多核苷酸包含如seq id no:17中所示的核酸序列。
29.在一些实施方案中,本发明的多核苷酸可操作地连接至异源启动子。
30.在一些实施方案中,本发明的多核苷酸是针对宿主细胞(如酵母细胞)进行密码子优化的。
31.具体实施方式-定义
32.如上所述,本发明涉及一种产生具有β-氨基己糖苷酶活性的多肽的方法,所述方法包括以下步骤:
33.a)提供宿主细胞,所述宿主细胞包含编码具有β-氨基己糖苷酶活性且具有与seq id no:1或16中所示的氨基酸序列至少85%相同的氨基酸序列的多肽的多核苷酸,
34.b)在允许产生所述多肽的条件下培养所述宿主细胞,以及
35.c)获得步骤b)中产生的多肽。
36.在本发明方法的步骤a)中,将提供包含编码具有β-氨基己糖苷酶活性的多肽的多核苷酸的宿主细胞。
37.如本文使用的术语“多核苷酸”是指线性或环状核酸分子。其涵盖dna分子以及rna分子。所述多核苷酸将作为分离的多核苷酸(即,从其天然环境中分离)或以遗传修饰的形式提供。如本文所述的多核苷酸的特征在于其将编码如上提及的多肽,即具有β-氨基己糖苷酶活性的多肽。
38.术语“多肽”和“蛋白质”在本文中可互换使用并且是指通过肽键连接在一起的呈
聚合形式的氨基酸。
39.通过本发明的方法产生的多肽将具有β-氨基己糖苷酶活性。
40.如本文所用,β-氨基己糖苷酶(ec 3.2.1.52)典型地是指能够催化n-乙酰基-β-氨基己糖苷中末端非还原n-乙酰基氨基己糖残基水解的酶。例如,n-乙酰基葡糖苷和n-乙酰基半乳糖苷是底物。用于评估多肽是否具有β-氨基己糖苷酶活性的测定是本领域已知的,并且描述于例如li&li(1970)j biol chem 245 5153中:它们对以下底物显示b-氨基己糖苷酶活性:对-硝基苯基β-2-乙酰氨基-2-脱氧-对-吡喃葡萄糖苷和对-硝基苯基β-2-乙酰氨基-2-脱氧-对-吡喃半乳糖苷。同义词有β-氨基己糖苷酶、β-(1-2,3,4,6)氨基己糖苷酶、β-乙酰氨基-脱氧己糖苷酶、n-乙酰基-β-d-氨基己糖苷酶、n-乙酰基-β-氨基己糖苷酶、β-乙酰基氨基己糖苷酶、β-d-n-乙酰基氨基己糖苷酶、β-n-乙酰基-d-氨基己糖苷酶、β-n-乙酰基氨基葡糖苷酶、n-乙酰基氨基己糖苷酶和β-d-氨基己糖苷酶。
41.在一些实施方案中,具有β-氨基己糖苷酶活性的多肽形成同二聚体。
42.在一些实施方案中,具有β-氨基己糖苷酶活性的多肽由异源多核苷酸表达,即由例如通过使用表达载体瞬时地或稳定地引入宿主细胞中的多核苷酸表达。如本文使用的术语“异源”意指多核苷酸不是天然存在于宿主细胞中。因此,所述术语涵盖衍生自不同生物体的修饰或未修饰的多核苷酸或衍生自宿主细胞的修饰的多核苷酸。应当理解,异源多核苷酸可以包含允许在宿主细胞中表达的表达控制序列或允许异源多核苷酸在宿主细胞的基因组中的基因座处整合的序列,其中异源多核苷酸的表达将由宿主细胞的内源表达控制序列控制。通过引入异源多核苷酸,产生转基因宿主细胞。
43.具有β-氨基己糖苷酶活性的多肽的引入可以通过将编码所述多肽的异源多核苷酸引入宿主细胞中来实现。如本文提及的术语“引入”或“转化”涵盖将如本文所述的多核苷酸转移到宿主细胞中,而不管用于转移的方法如何。这包括瞬时引入表达载体中或稳定整合到宿主细胞的基因组中。在一些实施方案中,将多核苷酸稳定地引入宿主细胞的基因组中。
44.因此,本发明方法的步骤a)可以包括以下步骤:
45.a1)将编码具有β-氨基己糖苷酶活性的多肽的多核苷酸引入宿主细胞中;以及a2)由所述多核苷酸表达所述多肽。
46.术语“表达”或“基因表达”意指一种或多种特定基因或特定基因构建体的转录。术语“表达”或“基因表达”特别意指一种或多种基因或基因构建体转录成结构mrna,随后将后者翻译成如本文提及的多肽。所述过程包括dna的转录和所得mrna产物的加工。
47.如上所述,由本发明的多核苷酸编码的多肽将具有β-氨基己糖苷酶活性。另外,它将具有与seq id no:1或16中所示的氨基酸序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。
48.在一些实施方案中,所述具有β-氨基己糖苷酶活性的多肽具有与seq id no:1或16中所示的氨基酸序列至少95%相同,如至少98%相同的氨基酸序列。
49.在一些实施方案中,所述具有β-氨基己糖苷酶活性的多肽包含如seq id no:16中所示的氨基酸序列。
50.seq id no:16是在作为本发明基础的研究中鉴定的刀豆(直生刀豆)β-氨基己糖苷酶的氨基酸序列。所述序列如下:
[0051][0052]
潜在前导序列(aa 1至30)的序列用下划线表示。在作为本发明基础的研究中,多肽以不含前导序列的方式表达。seq id no:1是刀豆(直生刀豆)β-氨基己糖苷酶的氨基酸序列,其中没有前导序列。因此,seq id no:1包含seq id no:16的aa 31至553。seq id no:1如下:
[0053]
aaapvknyya rrapsgpgsc yeq
[0054]
在一个实施方案中,seq id no:1在n末端另外包含甲硫氨酸残基(m)。
[0055]
在一个实施方案中,上述多肽由包含如seq id no:2中所示的核酸序列的多核苷酸编码:
[0056]
gctactttgaagtccatcatcgagccaactgagtccttgacttacttgtggccattgccagctgacttcacttctggtgacgaaactttgtctgttgacccagctttgactttgtccgttgctggtaatggtggtggttcctccattttgagagatgctttcgacagatacagaggtattatcttcaagcactcctccgttggattctctttgatcagaaagttgagagagagattggtttccgtttccgcttacgacattgctactttgaagatcactgttcactccgacaacgaagagttgcagttgggtgttgacgagacttacactttgttggttccaaaggctaaggactcctacgttgctggtgaggttactatcgaggctaacactgtttacggtgctttgagaggtttggagactttctcccagttgtgttccttcgactactctgacaagactatcaagatttacaaggctccttggtccatccaggacaagccaagattttcctacagaggtttgttgttggacacttccagacactacttgccaatcaacgttatcaagcagatcatcgagtccatgtcctacgctaagttgaacgttttgcactggcacatcatcgacgaagagtctttcccattggaggttccaacttacccaaacttgtggaagggttcctacactaagtgggagagatacactgttgaggacgcttacgagatcgttaacttcgctaagatgagaggtattaacgttatggctgaggttgacgttccaggtcatgctgaatcttggggtgctggttatccaaatttgtggccatctccatcctgtagagagccattggacgtttccaagaacttcactttcgacgttatctccggaatcttgactgacatcagaaagatattcccattcgagttgttccacttgggaggtgacgaggttaatactgactgttggacttccacttcccacgttaaggaatggttgtccactcagaacatgactgctaaggatgcttacgaatacttcgttttgaaggctcaa
gagatcgctgtttctaagaactggtcccctgttaactgggaagagactttcaacactttcccagctaagttgcacaagaaaactgttgttcacaactggttgggtccaggtgtttgtccaaaggttgttgctaagggtttcagatgtatcttctccaaccagggtgtttggtacttggaccacttggatgttccttgggacgaggtttacactgctgaaccattggaaggtatcgagaagtcctctgagcaagagttggttatcggtggtgaagtttgtatgtggggtgagactgctgacacttctaacgttcagcagactatctggccaagagccgcagctgctgctgaaagattgtggtcccaaagagactccactaacatcactgttactgctttgccaagattgcagaacttcagatgtttgttgaacaagagaggtgttgctgctgctccagttaagaactactacgctagaagagccccatccggtccaggttcttgttacgaacaa
[0057]
seq id no:2可以进一步包含在5'端的起始密码子(atg)和在3'端的一个或多个终止密码子。
[0058]
当多肽在宿主细胞中表达时,可以进一步加工多肽。例如,可以将多肽加工成两个亚基,其中第一亚基包含seq id no:16的氨基酸35至100,并且第二亚基包含seq id no:16的氨基酸110至553。第一亚基的起始和结束以及第二亚基的起始可以略有变化。例如,还检测到包含氨基酸34至101的亚基。
[0059]
此外,所述多肽可以是己糖基化的和/或糖基化的。例如,第一亚基可以是己糖基化的。
[0060]
在一个实施方案中,具有如seq id no:16中所示的序列的多肽由具有seq id no:17中所示的序列的多核苷酸编码。所述序列如下:
[0061][0062]
1561ttcagatgtc tattgaataa acgtggagtt gcagctgctc ctgtgaaaaa ttattatgct
[0063]
1621agaagggctc ctagtggtcc aggctcatgt tatgagcaat aa
[0064]
在一个实施方案中,编码具有β-氨基己糖苷酶活性的多肽的多核苷酸是针对宿主细胞,如针对人类细胞进行密码子优化的。例如,所述多核苷酸可以包含seq id no:18中所示的序列:
[0065][0066]
包含seq id no:18中所示的序列的多核苷酸编码具有β-氨基己糖苷酶活性的多肽,其中所述多肽具有如seq id no:1中所示的序列。
[0067]
关于参考多肽序列的“氨基酸序列同一性百分比(%)”定义为在用以实现最大序列同一性百分比而比对序列和引入空位(如果需要)后,候选序列中与所述参考多肽序列中的氨基酸残基相同的氨基酸残基的百分比。在一些实施方案中,应用标准参数来确定两个序列的序列同一性程度。例如,同一性程度将通过在比较窗口中比较两个最佳比对序列来确定,其中为了最佳比对,与参考序列(不包含添加或缺失)相比,比较窗口中的氨基酸序列的片段可以包含添加或缺失(例如,空位或突出端)。百分比是通过以下方式来计算的:确定两个序列中出现相同氨基酸残基的位置数,以得到匹配位置数;用匹配位置数除以比较窗口中的位置总数,并将结果乘以100,得到序列同一性百分比。用于比较的序列的最佳比对可以通过以下方法进行:smith和waterman add.apl.math.2:482(1981)的局部同源性算法;needleman和wunsch j.mol.biol.48:443(1970)的同源性比对算法;pearson和lipman proc.natl.acad.sci.(usa)85:2444(1988)的相似性方法的检索;这些算法的计算机化实施(在威斯康辛州麦迪逊市科学大道575号genetics computer group(gcg)的wisconsin genetics software package中的gap、bestfit、blast、pasta和tfasta);或目视检查。在一些实施方案中,在序列的整个长度上确定序列同一性程度。鉴于已经鉴定了用于比较的两个序列,优选使用gap和bestfit来确定它们的最佳比对,并因此确定同一性程度。优选地,使用空位权重的默认值5.00和空位权重长度的默认值0.30。在一个实施方案中,使用以下确定两个氨基酸序列之间的序列同一性:needleman和wunsch算法(needleman 1970,j.mol.biol.(48):444-453),所述算法已经被并入emboss软件包(emboss:欧洲分子生物学开放软件套件(the european molecular biology open software suite),rice,p.、
longden,i.和bleasby,a.,trends in genetics 16(6),276-277,2000)中的needle程序中;blosum62评分矩阵;以及空位开放罚分10和空位延伸罚分0.5。使用needle程序比对两个氨基酸序列时所用参数的非限制性例子是默认参数,包括eblosum62评分矩阵、空位开放罚分10和空位延伸罚分0.5。
[0068]
如本文提及的多核苷酸可以基本上由上述核酸序列组成或包含上述核酸序列。因此,它们也可以进一步含有另外的核酸序列。
[0069]
在一些实施方案中,编码具有β-氨基己糖苷酶活性的多肽的多核苷酸可操作地连接至启动子,如异源启动子。典型地,启动子包含调节元件,所述调节元件介导编码序列区段在宿主细胞中的表达。
[0070]
在一个实施方案中,所述启动子是组成型启动子。在一个替代性实施方案中,所述启动子是诱导型启动子。
[0071]“启动子”或“启动子序列”是与基因在同一链上且位于所述基因上游的核苷酸序列,其能够实现该基因的转录。启动子之后是基因的转录起始位点。启动子被rna聚合酶(连同任何所需的转录因子)识别,从而启动转录。启动子的功能性片段或功能性变体是可被rna聚合酶识别并能够启动转录的核苷酸序列。
[0072]“活性启动子片段”、“活性启动子变体”、“功能性启动子片段”或“功能性启动子变体”描述了启动子的核苷酸序列的片段或变体,它们仍具有启动子活性。
[0073]
启动子可以是“诱导物依赖型启动子”或“非诱导物依赖型启动子”,其包含组成型启动子或处于其他细胞调节因子的控制下的启动子。
[0074]
本领域技术人员能够选择用于表达目的多肽的合适启动子。例如,编码目的多肽的多核苷酸典型地可操作地连接至“诱导物依赖型启动子”或“非诱导物依赖型启动子”。此外,编码具有β-氨基己糖苷酶活性的多肽的多核苷酸典型地可操作地连接至“非诱导物依赖型启动子”,如组成型启动子。
[0075]“诱导物依赖型启动子”在本文中理解为这样的启动子,在将“诱导物分子”添加至发酵培养基中后增加了其用于实现所述启动子可操作地连接的基因的转录的活性。因此,对于诱导物依赖型启动子,诱导物分子的存在经由信号转导触发可操作地连接至启动子的基因的表达的增加。
[0076]
在一个实施方案中,所述启动子是cmv启动子。例如,当在哺乳动物宿主细胞(如hek-293宿主细胞)中表达具有β-氨基己糖苷酶活性的多肽时,可以使用cmv。
[0077]
在另一个实施方案中,所述启动子是tac启动子。例如,当在酵母宿主细胞(如下文公开的酵母细胞)中表达具有β-氨基己糖苷酶活性的多肽时,可以使用tac启动子。tac启动子(缩写为ptac)是合成产生的dna启动子,由来自trp和lac操纵子的启动子的组合产生。其通常用于蛋白质产生。
[0078]
在一个实施方案中,所述启动子是编码醇氧化酶的多核苷酸的启动子,如来自酵母aox1(醇氧化酶1)的启动子。
[0079]
术语“可操作地连接”典型地是指启动子序列与目的基因(即,编码具有β-氨基己糖苷酶活性的多肽的多核苷酸)之间的功能性连接,使得启动子序列能够启动目的基因的转录。
[0080]
此外,如本文提及的多核苷酸可以可操作地连接至终止子。术语“终止子”典型地
涵盖控制序列,所述控制序列是在转录单元末端的dna序列,其发出初级转录物的3'加工和聚腺苷酸化以及转录终止的信号。
[0081]
如本文提及的多核苷酸可以进一步可操作地连接至编码分泌前导序列的多核苷酸,所述分泌前导序列即允许本发明的β-氨基己糖苷酶分泌至培养基中的序列。
[0082]
本发明方法的步骤a)中提供的宿主细胞可以是任何被认为适当的宿主细胞。例如,所述宿主选自细菌细胞,如大肠杆菌细胞、酵母细胞、藻类细胞或植物细胞。术语“宿主细胞”进一步包括动物细胞,如非人动物细胞。
[0083]
在一些实施方案中,所述宿主细胞是真核宿主细胞。
[0084]
在一些实施方案中,所述宿主细胞是酵母细胞。
[0085]
在一些实施方案中,所述酵母细胞属于酵母科,其是通过芽殖而繁殖的酵母目中的酵母科。在一些实施方案中,所述酵母科包括以下属:假丝酵母属(candida)、克鲁维酵母属(kluyveromyces)、驹形氏酵母属(komagataella)、kuraishia、拉钱斯氏酵母属(lachancea)、nakaseomyces、毕赤酵母属、酵母属(saccharomyces)、spathaspora、tetrapisispora、接合酵母属(zygosaccharomyces)和接合有孢圆酵母属(zygotorulaspora)。
[0086]
在一些实施方案中,所述酵母细胞属于克鲁维酵母属。例如,所述酵母细胞可以是乳酸克鲁维酵母细胞。
[0087]
在一些实施方案中,所述酵母细胞属于毕赤酵母属。例如,所述酵母细胞可以是巴斯德毕赤酵母细胞。
[0088]
在一些实施方案中,所述酵母细胞属于驹形氏酵母属。例如,所述酵母细胞可以是法夫驹形氏酵母细胞,如法夫驹形氏酵母菌株atcc 76273的细胞。关于此菌株的更多信息可以在uniprot数据库(参见taxon标识符981350)中找到。
[0089]
在一些实施方案中,所述宿主细胞不是直生刀豆细胞。
[0090]
在一些实施方案中,所述宿主细胞是哺乳动物宿主细胞。合适的哺乳动物细胞包括但不限于例如cho(中国仓鼠卵巢)细胞、bhk细胞、hela细胞、cos细胞、hek-293等。在一个实施方案中,使用hek-293细胞。在另一个实施方案中,使用cho细胞。
[0091]
本发明方法的步骤b)包括在允许产生,即产生具有β-氨基己糖苷酶活性的多肽的条件下培养宿主细胞。此类条件在本领域中是熟知的,并且例如在实施例部分中描述。
[0092]
本发明的方法可以进一步包括获得步骤b)中产生的多肽的步骤c)。所述多肽将通过本领域已知的方法从培养基中获得。
[0093]
本发明进一步涉及如上文结合本发明的方法所定义的多核苷酸,即编码具有β-氨基己糖苷酶活性且具有与seq id no:1中所示的氨基酸序列至少85%相同的氨基酸序列的多肽的多核苷酸。
[0094]
本发明进一步涵盖一种由本发明的多核苷酸编码的分离的多肽。所述多肽已在上文中定义。所述分离的多肽可以是己糖基化和/或糖基化的。
[0095]
本发明进一步涉及一种包含本发明的多核苷酸、本发明的多肽和/或本发明的载体的宿主细胞。
[0096]
此外,本发明涉及一种包含本发明的多核苷酸的载体。在一些实施方案中,所述载体是表达载体。
[0097]
术语“载体”典型地涵盖噬菌体、质粒、病毒或逆转录病毒载体以及人工染色体,如细菌或酵母人工染色体。此外,所述术语还涉及靶向构建体,其允许将靶向构建体随机或定点整合到基因组dna中。此类靶构建体优选包含足够长度的dna以用于如下文详细描述的同源或异源重组。含有本发明的多核苷酸的载体优选进一步包含用于在宿主中繁殖和/或选择的选择标记物。可以通过本领域熟知的各种技术将所述载体并入宿主细胞中。如果引入宿主细胞中,所述载体可以存在于细胞质中,或者可以并入基因组中。在后一种情况下,所述载体可以进一步包含允许同源重组或异源插入的核酸序列。可以经由常规转化或转染技术将载体引入原核或真核细胞中。如本文所用的术语“转化”和“转染”、缀合和转导旨在包括用于将外来核酸(例如dna)引入宿主细胞中的多种现有技术方法,包括磷酸钙、氯化铷或氯化钙共沉淀、deae-葡聚糖介导的转染、脂质体转染、自然感受态、碳基簇、化学介导的转移、电穿孔或粒子轰击(例如,“基因枪”)。用于转化或转染宿主细胞(包括酵母细胞)的合适方法可以在以下文献中见到:sambrook等人(molecular cloning:a laboratory manual,第2版,cold spring harbor laboratory,cold spring harbor laboratory press,cold spring harbor,ny,1989)以及其他实验室手册,如methods in molecular biology,1995,第44卷,agrobacterium protocols,gartland和davey编辑,humana press,totowa,new jersey。可替代地,可以通过热休克或电穿孔技术引入质粒载体。
[0098]
在一些实施方案中,本文提及的载体适合作为克隆载体,即可在微生物系统中,如在大肠杆菌中或在酵母细胞中复制。
[0099]
此外,设想本发明的载体是表达载体。在这样的表达载体中,所述多核苷酸包含如上指定的允许在宿主细胞中表达的表达盒。除了本发明的多核苷酸之外,表达载体还可以包含其他调节元件,如启动子(例如,如本文别处所述的启动子)。优选地,所述表达载体也是基因转移或靶向载体。
[0100]
实施方案列表
[0101]
1.一种产生具有β-氨基己糖苷酶活性的多肽的方法,所述方法包括以下步骤:
[0102]
a)提供酵母细胞,所述酵母细胞包含编码具有β-氨基己糖苷酶活性且具有与seq id no:1或16中所示的氨基酸序列至少95%相同的氨基酸序列的多肽的多核苷酸,
[0103]
b)在允许产生所述多肽的条件下培养所述酵母细胞,以及
[0104]
c)获得步骤b)中产生的多肽。
[0105]
2.根据实施方案1所述的方法,其中所述具有β-氨基己糖苷酶活性的多肽具有与seq id no:1中所示的氨基酸序列至少98%相同的氨基酸序列。
[0106]
3.根据实施方案1和2所述的方法,其中所述具有β-氨基己糖苷酶活性的多肽包含如seq id no:1中所示的氨基酸序列。
[0107]
4.根据实施方案1至3所述的方法,其中所述酵母细胞属于酵母科。
[0108]
5.根据实施方案4所述的方法,其中所述酵母细胞是驹形氏酵母属细胞,如法夫驹形氏酵母,如法夫驹形氏酵母菌株atcc 76273的细胞。
[0109]
6.根据实施方案1至5中任一项所述的方法,其中编码具有β-氨基己糖苷酶活性的多肽的所述多核苷酸可操作地连接至异源启动子。
[0110]
7.根据实施方案1至6中任一项所述的方法,其中编码具有β-氨基己糖苷酶活性的多肽的所述多核苷酸是针对所述酵母细胞进行密码子优化的。
c)的此溶液添加到骤冷的溶液中,再次涡旋并在32℃下孵育3h。将95μl直接注入使用waters柱(x-select csh c18 2.5μm 2,1x150 mm,目录号186006727)的装备有级分收集器的agilent 1200hplc上。色谱分离产生了级分体积为100至150μl(含有约25% acn溶剂)的尖峰。收集到36个级分(未示出)。将这些直接用于maldi-ms以确定肽质量(例如,估计edman循环的次数)。
[0133]
对于一些获得的级分,可以在标准条件下使用applied biosystems procise ht或shimadzu ppsq-33a测序仪通过n末端edman测序来确定氨基酸序列。通过maldi-ms测量来估计每个级分的循环次数(=氨基酸)。
[0134]
级分的edman降解产生了大量序列,将其使用clustalw进行比对。总共鉴定出553个氨基酸中的208个。将从头测序的肽与如下文实施例3中所述鉴定的翻译的cdna序列(未示出)重叠。结果表明在直生刀豆中鉴定出正确的cdna序列。
[0135]
实施例3:来自直生刀豆的β-氨基己糖苷酶的cdna序列的确定
[0136]
将刀豆(直生刀豆)种子置于塑料托盘中的潮湿吸水薄纸之间,并且在室温下在黑暗处储存约48小时(用于萌芽)。然后,将萌芽的种子在室温下在光照下再生长5-6天。然后将小植株置于在阳光充足的窗户处在室温下的作为基底的3-6mm蛭石中(深度为2-3cm),并且如果干燥,则浇水。
[0137]
用解剖刀将来自直生刀豆的萌芽材料切成可以用于rna提取的多个部分(约200mg植物材料),将其置于50ml塑料管中并在液氮中速冻。这是用芽、子叶、胚胎和叶组织进行的。根据制造商的说明书(rneasy植物微型试剂盒(qiagen目录号74903))从上述组织中分离rna。
[0138]
对于芽、子叶、胚胎和叶,分别用两种逆转录酶合成cdna。然后,合并分别用于芽、子叶、胚胎和叶的两种逆转录酶反应的cdna。
[0139]
随后,使用phusion hot start ii dna聚合酶(thermo scientific,目录号f-549l)和以下引物通过pcr扩增每种cdna的内部片段:
[0140]
jb-01ctcacctacctctggccccttcccgc(seq id no:3)
[0141]
jb-07ttattggtcataacatgaccctggaccaacagg(seq id no:4)
[0142]
然后,使用big循环测序终止子试剂盒(applied biosystems,美国)和以下引物对扩增的片段进行dna序列分析:
[0143]
jb-01ctcacctacctctggccccttcccgc(seq id no:3)
[0144]
jb-02gaggagcttcaatttggagtggatg(seq id no:5)
[0145]
jb-06atcagctgtctcaccccacatgcaaacttctc(seq id no:6)
[0146]
jb-07ttattggtcataacatgaccctggaccaacagg(seq id no:4),
[0147]
用big循环测序终止子试剂盒扩增约100ng pcr片段(或300ng质粒dna)和10pmol引物,用dyeex 2.0spin试剂盒纯化并测序。根据制造商的说明书使用所述试剂盒和设备。
[0148]
然后,用从子叶组织获得的cdna进行3'race和5'race。
[0149]
使用了以下引物:
[0150]
对于3'race:
[0151]
jb-08aagtttgcatgtggggtgagac(seq id no:7)
[0152]
jb-09gcaaacaatatggcctagagctg(seq id no:8)
[0153]
cdsiii-短attctagaggccgaggcggccgacatgt(seq id no:9)
[0154]
进行了两次pcr,一次用jb-08+cdsiii-短,并且一次用jb-09+cdsiii-短。使用jb-09引物对pcr片段进行测序。
[0155]
对于5'race:
[0156]
jb-10aagagtccttggctttgggaac(seq id no:10)
[0157]
okib57-衔接子5'-pgtaggaattcgggttgtagggaggtcgacattgcc-3'(seq id no:11)
[0158]
jb-01ctcacctacctctggccccttcccgc(seq id no:3)
[0159]
jb-11tcaatgtcgcaatgtcataggc(seq id no:12)
[0160]
jb-12atgagactgaacccaacactgc(seq id no:13)
[0161]
okib58 5'-ggcaatgtcgacctccctacaac-3'(seq id no:14)
[0162]
okib59 5'ctccctacaacccgaattcctac-3'(seq id no:15)
[0163]
用两种子叶转录酶用特异性引物jb-10合成cdna。然后合并两种cdna。将okib57-衔接子与新鲜合成的cdna连接。用引物jb-11和okib58进行一次pcr,并且用引物jb-12和okib59进行一次pcr。将所得片段亚克隆到pcr-blunt-ii-topo中并如上所述测序。
[0164]
总之,成功地获得了来自直生刀豆的β-氨基己糖苷酶的mrna序列。可以从不同的新鲜萌芽的植物材料中分离mrna。对相应的cdna进行测序,并通过β-氨基己糖苷酶(纯化的β-氨基己糖苷酶)的蛋白质序列的部分阐明来证实发现的序列。
[0165]
实施例4:所鉴定的多肽的重组表达
[0166]
来自直生刀豆的β-氨基己糖苷酶在aox1启动子的控制下在法夫驹形氏酵母菌株atcc 76273(也称为cbs 7435)中重组表达。为了在96深孔板中重组表达β-氨基己糖苷酶,从转化板中挑取单个菌落,放入填充有优化培养基的96深孔板的单个孔中。在产生生物质的初始生长期之后,通过添加允许去阻抑表达的优化的液体混合物诱导从aox1启动子的表达。在从初始接种开始总共108小时之后,将所有深孔板离心,并且将所有孔的上清液收获到储备微量滴定板中以用于随后的分析。
[0167]
为了在发酵规模上重组表达β-氨基己糖苷酶,用生产菌株接种300ml摇瓶中的50ml酵母/蛋白胨/甘油培养基,并且在28℃下以110rpm摇动过夜(预培养物1)。从预培养物1接种预培养物2(在2l摇瓶中200ml酵母/蛋白胨/甘油培养基),使得od600nm达到大约20。将预培养物2在28℃下以220rpm摇动约8h。从预培养物2接种2l填充有400ml含有甘油作为碳源的确定成分培养基(ph=5.5)的发酵罐,使得od600nm为2.0,在初始分批期期间,培养温度为28℃。在启动生产期前一小时,温度降低至24℃,并且在整个剩余过程中保持在此水平,同时ph降至5.0并保持在此水平。在整个过程中将氧饱和度设定为30%(级联控制:搅拌器、流量、氧补充)。在700rpm与1200rpm之间进行搅拌,并且选择1.0-2.0l
·
min-1的流量范围(空气)。甘油分批补料通过在整个培养过程中以6g/l
·
h供应60%甘油溶液来进行。
技术特征:
1.一种产生具有β-氨基己糖苷酶活性的多肽的方法,所述方法包括以下步骤:a)提供酵母细胞,所述酵母细胞包含编码具有β-氨基己糖苷酶活性且具有与seq id no:1或16中所示的氨基酸序列至少95%相同的氨基酸序列的多肽的多核苷酸,b)在允许产生所述多肽的条件下培养所述酵母细胞,以及c)获得步骤b)中产生的多肽。2.根据权利要求1所述的方法,其中所述具有β-氨基己糖苷酶活性的多肽具有与seq id no:1中所示的氨基酸序列至少98%相同的氨基酸序列。3.根据权利要求1和2所述的方法,其中所述具有β-氨基己糖苷酶活性的多肽包含如seq id no:1中所示的氨基酸序列。4.根据权利要求1至3所述的方法,其中所述酵母细胞属于酵母科。5.根据权利要求4所述的方法,其中所述酵母细胞是驹形氏酵母属细胞,如法夫驹形氏酵母细胞。6.根据权利要求1至5中任一项所述的方法,其中编码具有β-氨基己糖苷酶活性的多肽的所述多核苷酸可操作地连接至异源启动子。7.根据权利要求1至6中任一项所述的方法,其中编码具有β-氨基己糖苷酶活性的多肽的所述多核苷酸是针对所述酵母细胞进行密码子优化的。8.根据权利要求1至7中任一项所述的方法,其中所述多核苷酸包含如seq id no:2或17中所示的核酸序列。9.一种多核苷酸,所述多核苷酸编码具有β-氨基己糖苷酶活性且具有与seq id no:1中所示的氨基酸序列至少95%相同的氨基酸序列的多肽。10.根据权利要求9所述的多核苷酸,其中所述具有β-氨基己糖苷酶活性的多肽包含如seq id no:1中所示的氨基酸序列。11.根据权利要求9所述的多核苷酸,其中所述多核苷酸可操作地连接至异源启动子。12.一种载体,如表达载体,所述载体包含根据权利要求9至11中任一项所述的多核苷酸。13.一种酵母细胞,所述酵母细胞包含根据权利要求9至11中任一项所述的多核苷酸或根据权利要求12所述的载体。14.根据权利要求13所述的酵母细胞,其中所述酵母细胞属于酵母科。15.一种分离的多肽,所述分离的多肽由根据权利要求9至11中任一项所述的多核苷酸编码。
技术总结
本发明涉及一种产生具有β-氨基己糖苷酶活性的多肽的方法,所述方法包括以下步骤:a)提供酵母细胞,所述酵母细胞包含编码具有β-氨基己糖苷酶活性且具有与SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列的多肽的多核苷酸,b)在允许产生所述多肽的条件下培养所述酵母细胞,以及c)获得步骤b)中产生的多肽。本发明进一步涉及一种编码具有β-氨基己糖苷酶活性且具有与SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列的多肽的多核苷酸,以及一种由所述多核苷酸编码的多肽。此外,本发明涉及一种包含本发明的多核苷酸的酵母细胞。酸的酵母细胞。
技术研发人员:S
受保护的技术使用者:建新公司
技术研发日:2021.12.02
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/