RNA靶向基因编辑工具的开发的制作方法

rna靶向基因编辑工具的开发
技术领域
1.本公开内容涉及生物技术及医学领域。更具体地,本公开内容涉及新的cas13家族蛋白、筛选新的cas13家族蛋白的方法、以及相应的rna编辑系统及其应用。本公开内容尤其涉及低分子量cas13蛋白及相关的rna编辑系统。
背景技术:
2.crispr-cas系统被称为新一代基因组工程工具的关键组件,在细菌,古细菌等微生物中起着适应性免疫机制的作用,可保护微生物免受病毒和其他外来核酸的侵害。crispr-cas免疫应答主要包括三个阶段:适应阶段、表达和加工阶段和干扰阶段。与其他防御机制类似,crispr-cas系统在与移动遗传元件不断竞争的背景下发展,这导致cas蛋白序列和crispr-cas基因座结构的极端多样化。
3.自2011年以来,依据crispr-cas系统的基因组成,基因座结构以及序列相似性聚类等方法1,目前可以将crispr-cas系统分成2大类,其中class 1类系统具有由多个cas蛋白质组成的效应器模块,其中一些形成crrna结合复合物,这些复合物通过额外cas蛋白来介导pre-crrna处理和干扰。相比之下,class 2类系统包含一个单一的具有多功能域结合区的cas效应蛋白,它能结合crrna参与干扰所需的所有活动,在某些变体中,还包括参与pre-crrna成熟过程。目前class 2类型crispr-cas系统1主要分3个亚型:type ii(如cas9),type v3(如cas12a),和type vi 4(如cas13d)。其中type ii和type v亚型主要靶向dna1。而type vi效应cas蛋白则主要靶向rna。
4.由于class 2类crispr-cas系统相较与class 1类crispr-cas系统具有显著的优势,自其被发现以来,已吸引了大批学者们对它们进行了深入的研究和改造,并开发出多种依赖crispr-cas的基因操作工具,包括crispra,crispri,单碱基编辑技术等。利用这些工具也促进一部分学者们开始从基础研究向临床应用研究发展,特别是目前已有部分基因治疗相关药物上市,这又推进了人类的健康事业的发展。由于很多时候,基因疗法依赖于递送介质,常用的包装工具是逆转录病毒,腺病毒或者腺相关病毒等,但是这类工具的承载容量有限,如腺相关病毒aav,它是目前最常使用且安全性最高的递送工具,但是它不能容纳超过4.7kb的dna,不利于大分子量的crispr-cas相关工具的包装。尽管有学者尝试采用共转多个包装不同调控原件的病毒,但是这种处理的结果远不如all-in-one模式的包装体系。
5.2020年有学者在大型细菌病毒噬菌体中找到了分子量只有cas9和cas12a基因组编辑酶的一半的casφ(也被归为cas12j亚家族)蛋白,它能在真核生物细胞上发挥切割dna的功能。近期张锋团队还找到cas9和cas12的始祖蛋白iscb(约400个氨基酸)和tnpb家族,它们也是guide rna依赖的核酸酶,只包含有单一核酸切割结构域(如ruvc)12,暗示自然界存在低分子量的单效应cas酶能够应用于真核生物的基因编辑。然而当前对于rna层面的crispr-cas13系统的始祖蛋白还未找到,已知最小的紧凑型cas13效应蛋白,如cas13bt,cas13x等13-14都超过700个氨基酸。因此需要开发新的数据挖掘算法来进一步探索紧凑型的crispr-cas13系统单效应蛋白,如cas13始祖蛋白等,以便可以更好应用于基因治疗。
6.既往研究策略主要依据cas1蛋白的序列保守型来确定临近cas蛋白10,但是这种方式会遗漏一些不存在cas1蛋白的单效应蛋白。依据crispr-array与cas蛋白的共存性,促使学者们直接从预测crispr array入手,然后寻找临近crispr-cas关联蛋白11,但是受制于当前预测crispr array的算法局限性,并没有哪种算法被大家归为金标准。此外,候选蛋白确定问题上,主要依赖dna和蛋白序列比对,这很容易忽略蛋白空间折叠的影响1。因此,亟需开发的新的寻找自然界分子量更小的class 2类crispr-cas13系统相关单效应蛋白的计算方法和实验验证方法。
技术实现要素:
7.针对现有筛选新型crispr-cas蛋白技术的不足和实际需求,本公开内容提供了一种快速寻找包含较多的拓展的hepn结构域(至少1个)的新型guide rna引导具有rnase活性的crispr-cas13蛋白的方法并从生物信息分析层面(例如,序列比对、蛋白结构预测等)和实验层面验证了候选蛋白的rnase活性。这些蛋白潜在应用于rna层面的调控、编辑、检测等方面,具有广阔的学术价值和商业应用价值。
8.本公开内容所解决的技术问题是如何快速寻找新型的rna酶切活性结构域(拓展的hepn结构域)较多的候选crispr-cas13蛋白及其系统;其次是验证候选crispr-cas13蛋白及其系统的活性;并最终获得了多种新型cas13蛋白。
9.本公开内容实现了以下技术效果:(1)开发了快速筛选新型cas13家族蛋白的分析方法,该方法可以对新更新的原核微生物dna序列和宏基因组序列进行cripsr array系统的分析和相关效应蛋白的筛选;(2)筛选的低分子量的cas13家族成员,拓展crispr-cas13的应用范围。由于候选cas13蛋白低分子量能很好的通过腺相关病毒等递送载体包装从而实现相关疾病诊疗,如神经相关退行性疾病的诊疗,在植物领域则可以开展育种,逆境胁迫等方面的研究,在微生物领域可以进行相关工程菌的改造等;(3)本方法在筛选过程中,除利用cas13蛋白的已知hepn结构域进行筛选外,还将其他种类的蛋白质中具备rna切割活性的保守型结构域包括在内,从而提供了筛选新的cas13蛋白的可能,并且由于这些新cas13蛋白中这些新的功能结构域的鉴定,为进一步改造cas13蛋白提供了新的思路和可能性。
10.在本公开内容的一个方面中,提供了cas13蛋白。
11.在一个优选的实施方案中,所述cas13蛋白包含如seq id no:1-78中任一项所述的氨基酸序列,或具有一个或更多个残基的保守氨基酸取代的seq id no:1-78中任一项所述的氨基酸序列。
12.在一个优选的实施方案中,所述cas13蛋白的rna切割活性被保留。
13.在一个优选的实施方案中,所述cas13蛋白的hepn结构域或rna切割结构域经进一步修饰或改造,而使其rna切割活性降低或消除,成为rna切割活性降低或消除的dcas13。
14.在一个优选的实施方案中,所述cas13蛋白与一个或更多个异源功能性结构域融合。
15.在一个优选的实施方案中,所述融合在所述cas13蛋白的n端、c端或者内部。
16.在一个优选的实施方案中,所述一个或更多个异源功能性结构域具有以下活性:
脱氨酶如胞苷脱氨基酶和脱氧腺苷脱氨基酶、甲基化酶、去甲基化酶、转录激活、转录抑制、核酸酶、单链rna裂解、双链rna裂解、单链dna裂解、双链dna裂解、dna或rna连接酶、报告蛋白、检测蛋白、定位信号、或其任意组合。
17.在本公开内容的另一个方面中,提供了一种核酸分子,其包含编码上述cas13蛋白的核苷酸序列。
18.在一个优选的实施方案中,所述核酸分子针对在特定宿主细胞中的表达而进行了密码子优化。
19.在一个优选的实施方案中,所述宿主细胞是原核或真核生物细胞,优选人细胞。
20.在一个优选的实施方案中,所述核酸分子包含与编码cas13的核苷酸序列有效链接的启动子,其为组成型启动子、诱导型启动子、组织特异性启动子、嵌合型启动子或发育特异性启动子。
21.在本公开内容的另一个方面中,提供了一种表达载体,其包含上述核酸分子,以dna或rna或蛋白等形式表达上述氨基酸序列或核苷酸序列。
22.在一个优选的实施方案中,所述表达载体为腺相关病毒(aav)、腺病毒、慢病毒、逆转录病毒、单纯孢疹病毒、溶瘤病毒。
23.在本公开内容的另一个方面中,提供了一种递送系统,其包含(1)上述表达载体,或上述cas13蛋白;以及(2)递送载体。
24.在一个优选的实施方案中,所述递送载体是纳米颗粒、脂质体、外泌体、微囊泡或基因枪。
25.在本公开内容的另一个方面中,提供了一种crispr-cas系统,其包含:(1)上述cas13蛋白或核酸分子,或者其衍生物或功能片段;(2)用于靶向目标rna的grna序列。
26.在一个优选的实施方案中,其中所述grna序列包含同向重复(dr)序列和靶向靶rna部分的间隔区域的序列。
27.在一个优选的实施方案中,其中所述dr序列为表1中所示序列;其中所述间隔区序列为15-60个核苷酸,优选25-50个核苷酸,更优选30个核苷酸。
28.在一个优选的实施方案中,所述dr序列可以是对应以下任一项的衍生物,其中所述衍生物(i)与表1中所示序列中的任一个相比,具有一个或多个(例如1、2、3、4、5、6、7、8、9或10)个核苷酸的添加、缺失、或取代;(ii)与表1中所示序列中任何一个具有至少20%、30%、40%、50%、60%、70%、80%、90%、95%或97%的序列同一性;(iii)在严格条件下与表1中所示序列任意一个,或与(i)和(ii)中的任意一个杂交;或(iv)是(i)-(iii)中任何一个的互补物,条件是所述衍生物非表1中所示序列中的任何一个,并且所述衍生物编码一个rna,或本身即是一个rna,所述rna与seq idno:199-397编码的任意rna基本保持相同的二级结构。
29.在一个优选的实施方案中,所述crispr-cas系统还包含:(3)靶rna。
30.在一个优选的实施方案中,所述crispr-cas系统引起靶rna序列的降解、切割或序列的改变。
31.在一个优选的实施方案中,所述靶rna是mrna或ncrna,包括选自lncrna、mirna、misc_rna、mt_rrna、mt_trna、rrna、scarna、scrna、snorna、snrna、srna的非编码rna。
32.在本公开内容的另一个方面中,提供了一种细胞,其包含上述cas13蛋白、核酸分
子、表达载体、递送系统或crispr-cas系统。
33.在一个优选的实施方案中,所述细胞为原核细胞或真核细胞,优选人细胞。
34.在本公开内容的另一个方面中,提供了一种降解或切割目的细胞中靶rna、修饰目的细胞中靶rna的序列的方法,其包括使用上述cas13蛋白、核酸分子、表达载体、递送载体或crispr-cas系统。
35.在一个优选的实施方案中,所述目的细胞为原核细胞或真核细胞,优选人细胞。
36.在一个优选的实施方案中,其中所述目的细胞为离体细胞、体外细胞或体内细胞。
附图说明
37.图1显示出了候选cas13蛋白dz4细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz4蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz4的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz4蛋白(发绿光)的对照组;其中ap459为含有靶向mcherry不同区域的其中一个sgrna的实验组。
38.图2展示出了候选cas13蛋白dz28细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz28蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz28的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz28蛋白(发绿光)的对照组;其中ap393为含有靶向mcherry不同区域的其中一个sgrna的实验组。
39.图3展示出了候选cas13蛋白dz29细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz29蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz29的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz29蛋白(发绿光)的对照组;其中ap405,ap407为含有靶向mcherry不同区域的其中2个sgrna的实验组。
40.图4展示出了候选cas13蛋白dz30细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz30蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz30的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz30蛋白(发绿光)的对照组;其中ap411,ap413为含有靶向mcherry不同区域的其中2个sgrna的实验组。
41.图5展示出了候选cas13蛋白dz31细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz31蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz31的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz31蛋白(发绿光)的对照组;其中ap417,ap419为含有靶向mcherry不同区域的其中2个sgrna的实验组。
42.图6展示出了候选cas13蛋白dz32细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz32蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz32的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz32蛋白(发绿光)的对照组;其中ap421,ap423为含有靶向mcherry不同区域的其中2个sgrna的实验组。
43.图7展示出了候选cas13蛋白dz33细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz33蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz33的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz33蛋白(发绿光)的对照组;其中ap427,ap429为含有靶向mcherry不同区域的其中2个sgrna的实验组。
44.图8展示出了候选cas13蛋白dz35细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz35蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz35的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz35蛋白(发绿光)的对照组;其中ap441,ap443为含有靶向mcherry不同区域的其中2个sgrna的实验组。
45.图9展示出了候选cas13蛋白dz36细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz36蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz36的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz36蛋白(发绿光)的对照组;其中ap25,ap27为含有靶向mcherry不同区域的其中2个sgrna的实验组。
46.图10候选cas13蛋白dz37 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz37蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz37能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz37蛋白(绿光)的对照组(不带grna);其中ap33,ap35为含有靶向mcherry不同区域的其中2个sgrna的实验组。
47.图11候选cas13蛋白dz38 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz38蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz38能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz38蛋白(绿光)的对照组(不带grna);其中ap38,ap47为含有靶向mcherry不同区域的其中2个sgrna的实验组。
48.图12候选cas13蛋白dz39 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz39蛋白的质粒(含有对应靶向
mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz39靶向mcherry rna,具有一定的rnase活性,对应红色荧光略被敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz39蛋白(绿光)的对照组(不带grna);其中ap39,ap43为含有靶向mcherry不同区域的其中2个sgrna的实验组。
49.图13候选cas13蛋白dz40 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz40蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz40能靶向mcherry rna,具有一定的rnase活性,对应红光被敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz40蛋白(绿光)的对照组(不带grna);其中ap49,ap53为含有靶向mcherry不同区域的其中2个sgrna的实验组。
50.图14候选cas13蛋白dz44 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz44蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz44能靶向mcherry rna,具有一定的rnase活性,对应红光被敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz44蛋白(绿光)的对照组(不带grna);其中ap59,ap55为含有靶向mcherry不同区域的其中2个sgrna的实验组。
51.图15候选cas13蛋白dz45 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz45蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz45能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz45蛋白(绿光)的对照组(不带grna);其中ap63,ap65为含有靶向mcherry不同区域的其中2个sgrna的实验组。
52.图16候选cas13蛋白dz46 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz46蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz46能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz46蛋白(绿光)的对照组(不带grna);其中ap69,ap71为含有靶向mcherry不同区域的其中2个sgrna的实验组。
53.图17候选cas13蛋白dz47 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz47蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz47能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz47蛋白(绿光)的对照组(不带grna);其中ap91,ap93为含有靶向mcherry不同区域的其中2个sgrna的实验组。
54.图18候选cas13蛋白dz50 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz50蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz50能靶向mcherry rna,具有一定的rnase活性,对应红光被敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz50蛋白(绿光)的对照组(不带
grna);其中ap121,ap125为含有靶向mcherry不同区域的其中2个sgrna的实验组。
55.图19候选cas13蛋白dz51 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz51蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz51能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz51蛋白(绿光)的对照组(不带grna);其中ap127,ap131为含有靶向mcherry不同区域的其中2个sgrna的实验组。
56.图20候选cas13蛋白dz52 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz52蛋白的质粒(含有对应靶向mcherry的grna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz52能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz52蛋白(绿光)的对照组(不带grna);其中ap133,ap135为含有靶向mcherry不同区域的其中2个grna的实验组。
57.图21候选cas13蛋白dz54 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz54蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz54能靶向mcherry rna,具有一定的rnase活性,对应红光被敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz54蛋白(绿光)的对照组(不带grna);其中ap153为含有靶向mcherry的grna的实验组。
58.图22候选cas13蛋白dz55 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz55蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz55能靶向mcherry rna,具有一定的rnase活性,对应红光被敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz55蛋白(绿光)的对照组(不带grna);其中ap157为含有靶向mcherry的grna的实验组。
59.图23候选cas13蛋白dz57 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz57蛋白的质粒(含有对应靶向mcherry的grna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz57能靶向mcherry rna,具有一定的rnase活性,对应红光被敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz57蛋白(绿光)的对照组(不带grna);其中ap169,ap171为含有靶向mcherry不同区域的其中2个grna的实验组。
60.图24候选cas13蛋白dz62 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz62蛋白的质粒(含有对应靶向mcherry的grna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz62能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz62蛋白(绿光)的对照组(不带grna);其中ap187,ap191为含有靶向mcherry不同区域的其中2个grna的实验组。
61.图25候选cas13蛋白dz63 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz63蛋白的质粒(含有对应靶向
mcherry的grna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz63能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz63蛋白(绿光)的对照组(不带grna);其中ap193,ap197为含有靶向mcherry不同区域的其中2个grna的实验组。
62.图26候选cas13蛋白dz65 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz65蛋白的质粒(含有对应靶向mcherry的grna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz65能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz65蛋白(绿光)的对照组(不带grna);其中ap201,ap203为含有靶向mcherry不同区域的其中2个grna的实验组。
63.图27候选cas13蛋白dz68 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz68蛋白的质粒(含有对应靶向mcherry的grna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz68能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz68蛋白(绿光)的对照组(不带grna);其中ap217,ap219为含有靶向mcherry不同区域的其中2个grna的实验组。
64.图28候选cas13蛋白dz86 rnase活性流式分析结果。在哺乳动物细胞系(hek293t)中检测候选蛋白酶切活性的流式分析实验结果,将含有dz86蛋白的质粒(含有对应靶向mcherry的grna)与含有mcherry蛋白的质粒共转染293t细胞系48h后进行流式分析。可以发现与阴性对照组相比,候选蛋白dz86能靶向mcherry rna,具有强rnase活性,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(fb132)和dz86蛋白(绿光)的对照组(不带grna);其中ap711,ap713为含有靶向mcherry不同区域的其中2个grna的实验组。
65.图29展示出了候选cas13蛋白dz90细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz90蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz90的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz90蛋白(发绿光)的对照组;其中ap313,ap317为含有靶向mcherry不同区域的其中2个sgrna的实验组。
66.图30展示出了候选cas13蛋白dz91细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz91蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz91的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz91蛋白(发绿光)的对照组;其中ap319,ap323为含有靶向mcherry不同区域的其中2个sgrna的实验组。
67.图31展示出了候选cas13蛋白dz93细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz93蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz93的具有rnase活性很强,对应红光一定程度上被敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz93蛋白(发绿光)的
对照组;其中ap151为含有靶向mcherry不同区域的其中1个sgrna的实验组。
68.图32展示出了候选cas13蛋白dz96细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz96蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz96的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz96蛋白(发绿光)的对照组;其中ap349,ap353为含有靶向mcherry不同区域的其中2个sgrna的实验组。
69.图33展示出了候选cas13蛋白dz98细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有dz98蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白dz98的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和dz98蛋白(发绿光)的对照组;其中ap361为含有靶向mcherry不同区域的其中1个sgrna的实验组。
70.图34展示的阳性对照cas13d蛋白在细胞层面验证其rnase活性的流式分析结果。在哺乳动物细胞系检测候选蛋白酶切活性的流式分析实验结果:上图为含有cas13d蛋白的质粒(含有对应靶向mcherry的sgrna)与含有mcherry蛋白的质粒共转染293t细胞系48h后,流式分析的结果图。可以发现与阴性对照组相比,候选蛋白cas13d的具有rnase活性很强,对应红光被大幅度的敲低。阴性对照为只含有表达mcherry蛋白(红光)和cas13d蛋白(发绿光)的对照组;其中px261为含有靶向mcherry不同区域的其中1个sgrna的实验组。
71.图35展示的是候选蛋白dz4敲低内源基因stat3基因的qpcr结果,可以发现随机设计靶stat3基因的sgrna跟dz4蛋白一起瞬转可以在一定程度上敲低内源基因
72.图36a和图36b展示的是候选蛋白dz29敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz29蛋白一起瞬转可以在一定程度上敲低内源基因。其中不同dr对dz29敲低内源基因有一定的影响。
73.图37展示的是候选蛋白dz32敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz32蛋白一起瞬转可以在一定程度上敲低内源基因。
74.图38展示的是候选蛋白dz47敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz47蛋白一起瞬转可以在一定程度上敲低内源基因。
75.图39展示的是候选蛋白dz51敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz51蛋白一起瞬转可以在一定程度上敲低内源基因。
76.图40展示的是候选蛋白dz54敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz54蛋白一起瞬转可以在一定程度上敲低内源基因。
77.图41展示的是候选蛋白dz68敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz68蛋白一起瞬转可以在一定程度上敲低内源基因。
78.图42a和图42b展示的是候选蛋白dz93敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz93蛋白一起瞬转可以在一定程度上敲低内源基因。其中不同dr对dz93敲低内源基因有一定的影响。
79.图43展示的是候选蛋白dz98敲低内源基因stat3基因的qpcr结果,可以发现随机设计靶向stat3基因的sgrna跟dz98蛋白一起瞬转可以在一定程度上敲低内源基因。
80.图44展示的候选蛋白敲低293t内源基因stat3的qpcr结果。其中框框部分显示部分蛋白,相对于对照组,潜在具有敲低stat3的rnase的效率。
81.图45a和图45b展示的是候选蛋白dz806敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz806蛋白一起瞬转可以在一定程度上敲低内源基因。
82.图46a和图46b展示的是候选蛋白dz821敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz821蛋白一起瞬转可以在一定程度上敲低内源基因。
83.图47a和图47b展示的是候选蛋白dz822敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz822蛋白一起瞬转可以在一定程度上敲低内源基因。
84.图48a和图48b展示的是候选蛋白dz825敲低内源基因stat3和ezh2基因的qpcr结果,可以发现随机设计靶stat3和ezh2基因的sgrna跟dz825蛋白一起瞬转可以在一定程度上敲低内源基因。
85.图49展示的是筛选dz825靶向切割rna的偏好基序分析的实验结果,可以发现它在5’和3’都有很强碱基偏好性。距离target sequence的5’段第1个碱基为c,而3’段则为g;
86.图50展示的是候选具有guide rna引导,潜在具有rnase活性的crispr-cas13与已知cas13蛋白家族成员的进化关系,可以发现我们候选的蛋白潜在分成2个新的家族。暂且即为cas13m1和cas13m2;如dz30,dz32;cas13m2家族的dz47,dz29等。
具体实施方式
87.下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于举例说明本发明,而不应视为限定本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
88.如在说明书中所使用的,没有数量词修饰的名词可意指一个/种或更多个/种。如在权利要求书中所使用的,当与词语“包含/包括”结合使用时,没有数量词修饰的名词可意指一个/种或多于一个/种。
89.权利要求书中术语“或/或者”的使用用于意指“和/或”,除非明确地指出仅指替代方案或替代方案是相互排斥的,尽管本公开内容支持仅指替代方案和“和/或”的限定。如本文中使用的“另一/另一些”可意指至少第二或更多个/种。
90.在整个本技术中,术语“约”用于表示值包括装置的误差、用于确定该值的方法的固有变化,或者存在于研究对象之间的固有变化。这样的固有变异可以是标注值的
±
10%的变异。
91.在整个申请中,除非另有说明,否则核苷酸序列以5’至3’方向列出,并且氨基酸序列以n端至c端方向列出。
92.通过以下详细描述,本发明的其他目的、特征和优点将变得明显。然而,应理解,尽管表明了本发明的一些优选实施方案,但是详细描述和具体实施例仅以举例说明的方式给出,因为根据该详细描述,在本发明的精神和范围内的多种变化和修改对于本领域技术人员而言将变得明显。定义
93.ncbi(https://www.ncbi.nlm.nih.gov/)是指美国国家生物信息中心,是一个面向全世界的公共数据库,本领域技术人员利用该数据库提供的核酸数据库进行下载原核生物的基因组,蛋白质组相关数据库等,也可以利用该数据提供的blast比对软件进行序列比对的分析。
94.img(https://img.jgi.doe.gov/)是指微生物基因组整合数据库,是新一代基因组数据库的代表,不仅能够完整收录现有数据库的内容,还提供了更完善的数据上传、注释和分析服务,将测序数据储存到img/m数据库。该数据可以下载纯培养细菌测序基因组、宏基因组、宏基因组组装基因组、单细胞测序基因组的数据。
95.crispr(cluster regularly interspaced short palindromic repeats)是原核生物,主要是指细菌和古细菌体内的一串dna序列,包括同向重复(direct repeat,dr)区域和非重复间隔区(spacer)区域。而cripsr系统除了包含crispr array外,还包括相关的cas蛋白。它们一起构成了细菌低于外来病毒入侵的免疫系统。
96.cas13家族是目前已知该能够靶向rna的cripsr酶家族,其成员包括cas13a、cas13b、cas13c、cas13d、cas13x和cas13y家族。与crispr/cas9切割dna的活性不同,crispr/cas13能够用于切割细菌细胞中特定的rna序列。
97.hepn结构域是higher eukaryotes and prokaryotes nucleotide domain的简称,是crispr-cas13酶系统中cas13蛋白发挥切割和抵御外来入侵核酸的重要结构域。
98.abe系统是adenine base editors的简称,即嘌呤碱基转换技术,能够实现a/t到g/c的单碱基改变。最常用的酶是adar酶(adenosine deaminases acting on rna,一种作用于rna的腺苷脱氨酶)。主要是通过将腺嘌呤脱氨基成肌苷,在dna或者rna中进行读码的时候会被看成g,从而实现a/t到g/c的突变。由于细胞对肌苷的切出修复不敏感,因而这种突变可以维持较高的产物纯度。
99.cbe系统是cytidine base editor的简称,即嘧啶碱基转换技术,目前有be1、be2和be3个工具,其中be3的效率最高,因而在基因治疗,动物模型制作以及功能基因筛选等领域被广泛应用。
100.真核细胞例如哺乳动物细胞,包括人类细胞(人类原代细胞或已建立的人类细胞系)。所述细胞可以是非人类哺乳动物细胞,例如来自非人类灵长类动物(例如猴子)、奶牛/公牛/家牛、绵羊、山羊、猪、马、狗、猫、啮齿动物(例如兔子、小、大鼠、仓鼠)等。所述细胞来自鱼(例如鲑鱼)、鸟(例如禽鸟,包括小鸡、鸭、鹅)、爬行动物、贝类(例如牡蛎、蛤、龙虾、虾)、昆虫、蠕虫、酵母等。所述细胞可以来自植物,例如单子叶植物或双子叶植物。所述植物可以是粮食作物,例如大麦、木薯、棉花、花生、玉米、小米、油棕果、土豆、豆类、油菜籽或低芥酸菜子、大米、黑麦、高粱、大豆、甘蔗、糖甜菜、向日葵和小麦。所述植物可以是谷物(例如
大麦、玉米、小米、大米、黑麦、高粱和小麦)。所述植物可以是块茎(例如木薯和土豆)。在一些实施方案中,所述植物可以是糖料作物(例如甜菜和甘蔗)。所述植物可以是含油作物(例如大豆、花生、油菜籽或低芥酸菜子、向日葵和油棕果)。所述植物可以是纤维作物(例如棉花)。所述植物可以是树木,例如桃树或油桃树、苹果树、梨树、杏树、核桃树、开心果树、柑橘属树(例如橙子、葡萄柚或柠檬树)、草、蔬菜、水果或藻类。所述植物可以是茄属植物;芸苔属(brassica)植物;莴苣属(lactuca)植物;菠菜属(spinacia)植物;辣椒属(capsicum)植物;棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、番茄、茄子、胡椒、生菜、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等。crispr系统
101.crispr(成簇规律间隔短回文重复序列)/cas13(crispr相关蛋白13)介导的rna编辑正在成为用于疾病诊疗、植物育种等方面的有前景的工具。
102.crispr是包含碱基序列的短重复的dna基因座。每个重复之后是来自先前暴露于病毒的“间隔区dna”的短区段。在约40%的测序的真细菌基因组和90%的测序的古细菌中发现crispr。crispr通常与编码与crispr相关的蛋白质的cas基因相关。crispr/cas系统是原核免疫系统,其赋予对外来遗传元件(例如质粒和噬菌体)的抗性并提供获得性免疫的形式。crispr间隔区识别并沉默真核生物体中的这些外源遗传元件(例如rnai)。
103.crispr重复序列的大小为24至48个碱基对。它们通常显示一些二重对称,这意味着形成二级结构例如发夹,但不是真正的回文结构。重复序列被相似长度的间隔区分开。一些crispr间隔区序列与来自质粒和噬菌体的序列准确地匹配,尽管一些间隔区与原核生物的基因组匹配。响应于噬菌体感染,可迅速添加新的间隔区。
104.指导rna(grna)。作为rna指导的蛋白,cas13需要短rna以指导rna靶标的识别。核酸酶
105.cas核酸酶。crispr相关(cas)基因通常与crispr重复-间隔区阵列相关。截至2013年,已描述了超过四十个不同的cas蛋白家族。在这些蛋白家族之中,cas1看来在不同的crispr/cas系统中是普遍存在的。cas基因和重复序列结构的特定组合已用于限定8种crispr亚型(ecoli、ypest、nmeni、dvulg、tneap、hmari、apern和mtube),其中一些与编码重复序列相关神秘蛋白(repeat-associated mysterious protein,ramp)的另外的基因模块相关。在单个基因组中可存在多于一种crispr亚型。crispr/cas亚型的散发性分布(sporadic distribution)表明该系统在微生物进化期间经历水平基因转移。
106.外源dna明显地由cas基因编码的蛋白质加工成小元件(长度为约30个碱基对),然后以某种方式将其插入到靠近前导序列的crispr基因座中。来自crispr基因座的rna是组成型表达的,并且被cas蛋白加工成由具有侧翼重复序列的单独外源来源序列元件构成的小rna。rna指导其他cas蛋白在rna或dna水平上沉默外源遗传元件。证据表明crispr亚型之间的功能多样性。cse(cas亚型ecoli)蛋白(在大肠杆菌(e.coli)中称为casa-e)形成功能性复合体cascade,其将crispr rna转录物加工成保留cascade的间隔区-重复序列单元。在另一些原核生物中,cas6加工crispr转录物。有趣的是,大肠杆菌中基于crispr的噬菌体灭活需要cascade和cas3,但不需要cas1和cas2。在激烈火球菌(pyrococcus furiosus)和另一些原核生物中发现的cmr(cas ramp模块)蛋白与小的crispr rna形成功能性复合体,其识别和切割互补靶rna。rna指导的crispr酶被分类为v型限制酶。
实施例实施例1:新型cas13蛋白从头筛选
107.我们还进行了从头寻找crispr-cas13其他家族成员。简单来说,该分析系统包括2大块,一部分crispr array区域的鉴定,我们首先下载ncbi和img截止到2021年7月份的全部细菌,古细菌基因组以及宏基因组的序列,利用crispr array鉴定软件(如pilercr)进行鉴定crispr array区域;另一部分是该区域上下游附近cas相关蛋白的搜寻,即取该区域上下游临近的6个蛋白,共计12个蛋白进行目标结构域分析。最终候选蛋白的氨基酸序列编号、拓展的hepn结构域和坐标等信息参见表2。
108.其中本筛选体系的hepn结构域除了包含过去cas13家族成员中发现的rxxxxh(r4xh)特征(我们记为早期hepn结构域)外,还进行了拓展,包括其他具有rna切割活性的结构域rxxxxxh(r5xh)和rxxxxxxh(r6xh)(我们将rxxxxxh(r5xh)和rxxxxxxh(r6xh)以及rxxxxh(r4xh)总体记为拓展的hepn结构域)。其中临近r保守氨基酸优选为n、q、h或d,例如r[ndqh]xxxh、r[ndqh]xxxxh、r[ndqh]xxxxxh等组合;其中r4xh优选r[ndqh]xxxh,而r5xh和r6xh则优选r[ndqh]xxxxh和r[nqdh]xxxxxh;其中x代表任意氨基酸,而中括号内n、d、q和h为优先考虑保守氨基酸。实施例2:新型候选cas13蛋白的功能验证
[0109]
候选蛋白筛到后将进行功能验证。简而言之,我们首先将候选蛋白的核酸序列,dr序列以及target spacer序列送公司进行合成,然后将其导入表达质粒中构建相应的质粒。然后通过质粒转化在dh-5a大肠杆菌感受态细胞进行质粒扩增培养,然后抽提质粒后进行人源293t(能表达红光)细胞系的转染试验,与此同时我们还设计了对应的阴性和阳性对照组来进一步确认候选蛋白的切割活性。共转染质粒48h后进行流式细胞分析等试验来最终确定候选蛋白的rna酶切活性。
[0110]
按照上述研究策略,我们对候选蛋白进行了验证。如图1至34中所示,从dz4,dz28,dz29,dz30,dz31,dz32,dz33,dz35,dz36,dz37,dz38,dz39,dz40,dz44,dz45,dz46,dz47,dz50,dz51,dz52,dz54,dz55,dz57,dz62,dz63,dz65,dz68,dz86,dz90,dz91,dz93,dz96,dz98以及cas13d的结果表明,我们候选的具有rnase活性的cas13蛋白在瞬转哺乳动物细胞系能够很好的敲低mcherry(红光)蛋白,而阴性对照组则不能切割,表现为红色荧光高亮;表明我们的候选蛋白可以在哺乳动物等上发挥rnase的作用。实施例3:新型候选cas13蛋白的敲低293t内源基因功能验证
[0111]
为了进一步验证候选蛋白切割内源基因的能力,我们从实施例2中进一步筛选一些切割mcherry的rnase活性比高蛋白如dz4,dz29,dz32,dz47,dz51,dz54,dz68,dz93,dz98等,进行敲低内源基因(stat3,ezh2)实验验证,我们随机对293t这两个内源基因设计sgrna。发现还有有一部分蛋白保持比较好的敲低内源基因的作用。如图35到43所示。尽管也有一部分实验组和对照组差异不明显,这可能跟蛋白的pfs有关。因为以往研究报道cas13蛋白,如cas13a,cas13b等在靶向rna序列的时候有很强的偏好性(pfs)。而此处我们紧紧随机设计靶向目标基因的sgrna并没有去筛选对应cas蛋白靶向rna的pfs偏好性。
[0112]
从qpcr的结果充分证明我们筛选候选guide rna引导的具有rase活性的crispr-cas蛋白的方法的可行性,为了进一步加快筛选潜在切割真核生物内源基因rna的crispr-cas蛋白,我们将一部分筛选的guide rna引导的潜在具有rnase活性的crispr-cas蛋白(包
cas13蛋白具有独立分支,潜在具有两个比较大的紧凑型cas13新家族,暂且记为cas13 m1家族和cas13 m2家族。其中cas13 m1家族如dz30,dz32等;cas13m2家族的dz47,dz29等。
[0119]
候选cas13蛋白的dr序列参见下表1。表1.候选cas13蛋白的dr序列
[0120]
最终候选cas13蛋白的氨基酸序列编号、拓展的hepn结构域和坐标等信息参见表2。表2.候选cas13蛋白总结表
技术特征:
1.cas13蛋白,其包含如seq id no:1至78中任一项所述的氨基酸序列,或具有一个或更多个残基的保守氨基酸取代的seq id no:1至78中任一项所述的氨基酸序列。2.根据权利要求1所述cas13蛋白,其rna切割活性被保留。3.根据权利要求1所述cas13蛋白,其hepn结构域或rna切割结构域经进一步修饰或改造,而使其rna切割活性降低或消除,成为rna切割活性降低或消除的dcas13。4.根据权利要求1至3中任一项所述的cas13蛋白,其中所述cas13蛋白与一个或更多个异源功能性结构域融合,其中所述融合在所述cas13蛋白的n端、c端或者内部。5.根据权利要求4所述的cas13蛋白,其中所述一个或更多个异源功能性结构域具有以下活性:脱氨酶如胞苷脱氨基酶和脱氧腺苷脱氨基酶、甲基化酶、去甲基化酶、转录激活、转录抑制、核酸酶、单链rna裂解、双链rna裂解、单链dna裂解、双链dna裂解、dna或rna连接酶、报告蛋白、检测蛋白、定位信号、或其任意组合。6.核酸分子,其包含编码权利要求1至5中任一项所述cas13蛋白的核苷酸序列。7.根据权利要求6所述的核酸分子,其针对在特定宿主细胞中的表达而进行了密码子优化。8.根据权利要求7所述的核酸分子,其中所述宿主细胞是原核或真核生物细胞,优选人细胞。9.根据权利要求6至8中任一项所述的核酸分子,其包含与编码cas13的核苷酸序列有效链接的启动子,其为组成型启动子、诱导型启动子、组织特异性启动子、嵌合型启动子或发育特异性启动子。10.表达载体,其包含权利要求6至9中任一项所述核酸分子,以dna或rna或蛋白等形式表达权利要求1的氨基酸序列或权利要求6至9中任一项的核苷酸序列。11.根据权利要求10所述的表达载体,其为腺相关病毒(aav)、腺病毒、慢病毒、逆转录病毒、单纯孢疹病毒、溶瘤病毒。12.递送系统,包含(1)权利要求10所述的表达载体,或权利要求6至11中任一项所述的cas13蛋白;以及(2)递送载体。13.根据权利要求12所述的递送系统,其中所述递送载体是纳米颗粒、脂质体、外泌体、微囊泡或基因枪。14.crispr-cas系统,其包含:(1)根据权利要求1至5中任一项所述的cas13蛋白或者其衍生物或功能片段,或权利要求6至9中任一项所述核酸分子;(2)用于靶向目标rna的grna序列。15.根据权利要求14所述的crispr-cas系统,cas13蛋白的功能片段应指含有一个或多个seq id no:1至78中任何一个氨基酸(例如1、2、3、4、5、6、7、8、9或10个残基)的添加、缺失和/或取代(例如保守取代)。16.根据权利要求15所述的crispr-cas系统,cas13蛋白的衍生物应指至少具有与seq id no:1至78中任意一个蛋白片段达到≥70%氨基酸序列同一性(如70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的一致性)。17.根据权利要求14所述的crispr-cas系统,其中所述grna序列包含同向重复(dr)序列和靶向靶rna部分的间隔区域的序列。18.根据权利要求17所述的crispr-cas系统,其中所述dr序列为表1中所示序列;其中
所述间隔区序列为15-60个核苷酸,优选25-50个核苷酸,更优选30个核苷酸。19.根据权利要求18所述crispr-cas系统,其中所述dr序列可以是对应以下任一项的衍生物,其中所述衍生物(i)与表1中所示序列中的任一个相比,具有一个或多个(例如1、2、3、4、5、6、7、8、9或10)个核苷酸的添加、缺失、或取代;(ii)与表1中所示序列中任何一个具有至少20%、30%、40%、50%、60%、70%、80%、90%、95%或97%的序列同一性;(iii)在严格条件下与表1中所示序列任意一个,或与(i)和(ii)中的任意一个杂交;或(iv)是(i)-(iii)中任何一个的互补物,条件是所述衍生物非表1中所示序列中的任何一个,并且所述衍生物编码一个rna,或本身即是一个rna,所述rna与seq id no:79-234编码的任意rna基本保持相同的二级结构。20.根据权利要求14所述的crispr-cas系统,其还包含:(3)靶rna。21.根据权利要求14所述的crispr-cas系统,其引起靶rna序列的降解、切割或序列的改变。22.根据权利要求20所述的crispr-cas系统,其中所述靶rna是mrna或ncrna,包括选自lncrna、mirna、misc_rna、mt_rrna、mt_trna、rrna、scarna、scrna、snorna、snrna、srna的非编码rna。23.细胞,其包含权利要求1至5中任一项所述cas13蛋白、权利要求6至9中任一项所述核酸分子、权利要求10或11所述表达载体、权利要求12或13所述递送系统、或权利要求14至22中任一项所述crispr-cas系统。24.根据权利要求23所述的细胞,其为原核细胞或真核细胞,优选人细胞。25.降解或切割目的细胞中靶rna、修饰目的细胞中靶rna的序列的方法,其包括使用权利要求1至5中任一项所述cas13蛋白、权利要求6至9中任一项所述核酸分子、权利要求10或11所述表达载体、权利要求12或13所述递送系统、或权利要求14至22中任一项所述crispr-cas系统。26.根据权利要求25所述的方法,所述目的细胞为原核细胞或真核细胞,优选人细胞。27.根据权利要求25所述的方法,其中所述目的细胞为离体细胞、体外细胞或体内细胞。
技术总结
紧凑型Cas13蛋白的筛选方法及应用。本公开内容涉及生物技术及医学领域。更具体地,本公开内容涉及新的Cas13家族蛋白、筛选新的Cas13家族蛋白的方法、以及相应的RNA编辑系统及其应用。本公开内容尤其涉及Cas13蛋白及相关的RNA编辑系统。所述新型Cas13蛋白的分子量很低,几乎将具有guide RNA引导的且具有RNase活性的CRISPR-Cas蛋白推向了极限,并且包含较多的拓展型的HEPN结构域。本公开内容首次提出快速寻找具有超低分子量,依赖guide RNA引导且具有RNase活性的CRISPR-Cas13蛋白的筛选方法,并获得了多种新的Cas13蛋白及其新的家族,具有广阔的应用前景和巨大的市场价值。具有广阔的应用前景和巨大的市场价值。
技术研发人员:周海波 许争争 蔡世成
受保护的技术使用者:上海鲸奇生物科技有限公司
技术研发日:2022.03.14
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/