用于预测脑卒中复发的甲基化标志物及其应用的制作方法
未命名
10-22
阅读:70
评论:0
1.本技术涉及生物技术领域,尤其涉及一种用于预测脑卒中复发的甲基化标志物及其应用。
背景技术:
[0002][0003]
dna甲基化是表观遗传修饰的主要机制之一,在维持正常细胞功能、遗传印记、胚胎发育以及人类肿瘤发生中起着重要作用,随着技术的发展,针对甲基化研究的方法几乎涵盖了单个基因到基因组各个层次水平。在哺乳动物细胞中,dna甲基化的特征是在dna甲基转移酶(dnmt)的作用下,胞嘧啶嘧啶环(5-甲基胞嘧啶;5mc)第5位碳原子上添加上甲基基团(-ch3),并且甲基的共价加成通常发生在cpg二核苷酸中的胞嘧啶中,该二核苷酸集中在称为cpg岛的部分中,cpg位点成簇的以预期频率出现。异常甲基化与大多数疾病有关,包括癌症、神经退行性疾病、心血管疾病和自身免疫性疾病等。分析dna甲基化模式对于理解这些疾病的潜在分子机制至关重要。此外,dna甲基化模式可作为临床管理的依据,如诊断、预后和治疗反应。
[0004]
脑卒中是重要的致死、致残原因,且发病人数逐年上升,发病年龄逐步年轻化。脑血管病已成为第一大致死和主要的致残原因,其中约80%为缺血性卒中。临床数据显示,进展性卒中(ps)在急性缺血性卒中患者中占比可达26.4%-34%,且无有效的诊疗手段,可导致更高的致残率和死亡率,为家庭及临床工作带来沉重的负担。对于卒中患者,如果可以及时预测患者是否复发,能有效减少卒中患者的死亡或者致残。目前在临床上关于卒中复发诊断主要是利用临床数据进行评估,未有明确的分子标志物。
技术实现要素:
[0005]
本技术的目的在于提供了一种用于预测脑卒中复发的甲基化标志物,所述甲基化标志物可以对脑卒中患者复发进行预测。
[0006]
本技术具体技术方案如下:
[0007]
1.一种用于预测脑卒中复发的甲基化标志物,所述甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。
[0008]
2.根据项1所述的甲基化标志物,其中,所述脑卒中选自大动脉粥样硬化性卒中、心源性脑栓塞、小动脉闭塞性脑卒中、缺血性脑卒中和脑梗死中的一种或两种以上。
[0009]
3.根据项1或2所述的甲基化标志物,其中所述脑卒中复发为三个月之内的脑卒中复发。
[0010]
4.根据项1-3中任一项所述的甲基化标志物,其中,所述甲基化标志物为如seq id nos:1~18中任一种或两种以上所示的序列或者为包含seq id nos:1~18中任一种或两种以上所示的序列。
[0011]
5.甲基化标志物在制备用于预测脑卒中复发的试剂盒中的用途,所述甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。
[0012]
6.甲基化标志物在制备预防脑卒中复发的药物中的用途,所述甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。
[0013]
7.根据项6所述的用途,其中,所述药物是基于所述甲基化标志物设计的靶向药物。
[0014]
8.根据项5-7中任一项所述的用途,其中,所述脑卒中选自大动脉粥样硬化性卒中、心源性脑栓塞、小动脉闭塞性脑卒中、缺血性脑卒中和脑梗死中的一种或两种以上。
[0015]
9.根据项5-8中任一项所述的用途,其中,所述甲基化标志物为如seq id nos:1~18中任一种或两种以上所示的序列或者为包含seq id nos:1~18中任一种或两种以上所示的序列。
[0016]
10.一种用于预测脑卒中复发的组合物,所述组合物包括:
[0017]
用于检测项1-4中任一项所述的甲基化标志物的甲基化状态的核酸,
[0018]
其中,所述甲基化标志物的甲基化状态由所述甲基化标志物的靶序列的甲基化来表征。
[0019]
11.一种试剂盒,其包含用于检测项1-4中任一项所述的甲基化标志物的试剂。
[0020]
12.根据项11所述的试剂盒,其中,所述试剂盒用于检测的样本包括:细胞系、组织学切片、组织活检/石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,或其组合。
[0021]
13.一种核酸,其中,所述核酸用于靶向项1-4中任一项所述的甲基化标志物。
[0022]
发明的效果
[0023]
本技术筛选得到包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上的甲基化标志物,所述甲基化标志物能够准确预测脑卒中患者复发的风险,并且可以通过对个体既往基本信息、流调信息、检测结果的系统性分析,对患者可能性复发时间点给予精准提示,进而为精准治疗和健康管理提供指导。
附图说明
[0024]
图1是按照5折交叉验证分组的示意图。
[0025]
图2是标志物a的roc曲线示意图。
[0026]
图3是标志物abc组合的roc曲线示意图。
[0027]
图4是5
×
5嵌套交叉验证示意图。
具体实施方式
[0028]
下面对本技术做以详细说明。虽然显示了本技术的具体实施例,然而应当理解,可
以以各种形式实现本技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本技术,并且能够将本技术的范围完整的传达给本领域的技术人员。
[0029]
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异作为区分组件的方式,而是以组件在功能上的差异作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本技术的较佳实施方式,然而所述描述乃以说明书的一般原则为目的,并非用以限定本技术的范围。本技术的保护范围当视所附权利要求所界定者为准。
[0030]
本技术提供了一种用于预测脑卒中复发的甲基化标志物,所述甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。
[0031]
在本技术中,所述甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上指的是例如,对于9号染色体的137129295至137130392位的基因组区域,其除了包含这个区间的基因组区域,还可以包含这个区间的相邻的基因组区域,只要不影响用于预测脑卒中复合的性能即可,同理,对于9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域,其除了包含这三个染色体上的区间区域,还可以包含这三个染色体上的区间的相邻的基因组区域,只要不影响用于预测脑卒中复合的性能即可。
[0032]
所述“脑卒中(cerebral stroke)”又称“中风”、“脑血管意外”(cerebralvascular accident,cva),其指的是一种急性脑血管疾病,是由于脑部血管突然破裂或因血管阻塞导致血液不能流入大脑而引起脑组织损伤的一组疾病,包括缺血性和出血性卒中。
[0033]
本技术的发明人在930例样本中筛选出了3个甲基化标志物,所述标志物与脑卒中的复发相关,通过检测患者白细胞中的上述标志物的甲基化水平,能够判定脑卒中患者的复发风险。
[0034]
所述甲基化标志物如表1所示:
[0035]
表1
[0036]
chromosomestartend标志物achr9137129295137130392标志物bchr13804585438047464标志物cchr2219331647219331832
[0037]
其中,在表1中,chromosome指的是甲基化标志物所在的染色体,start指的是甲基化标志物序列的起始位置,end指的是甲基化标志物序列的终止位置。
[0038]
在一些实施方式中,所述甲基化标志物包含所述甲基化标志物为如seq id nos:1-18中任一种或两种以上所示的序列或者为包含seq id nos:1-18中任一种或两种以上所示的序列。
[0039]
在seq id nos:1-18所示的核苷酸序列的基础上删除一个或多个核苷酸、增加一个或多个核苷酸、或者替换一个或多个核苷酸但与seq id nos:1-18所示的核苷酸序列具有90%、91%、92%、93%、94%、95%或96%或97%或98%或99%同一性、也能够作为本技术的甲基化标志物,也应当理解为是涵盖在本技术的保护范围内。
[0040]
其中,seq id nos:1-6的序列如下:
[0041]
seq id no:1的序列如下:
[0042]
ccgccccgcagaatttgggtcgctgagaccgctgcaggcgtgccgaccacggctgccccggcccggaaagcagatttgcccctttttgcggggtaagggtggagagggcggcgtcggggggagtcgagtctgcccgcccaggccccgctcggagccgcaggctgggagggcggcgggcgcagcgaccccgggcctcggtccgcccggcgcggtcctcaccctgcagcacaagagccgccggcagttcttgctgttgccgtagctctcgccaaagctctgcgtcaccgaaatgaagtcctgatgaagcagcggcggcggatgcgtggaagggggcctcgaggaaccaccggcggcatcaggagacccggtcctgtaaaagactgagagctccgcctctccgatactcgcgggcagccattgcggcgcacagaaccgtccgcgtgtgagcagcgcgcacgcgcacgcaatgcgcctcaaccccgcagcctatgcgcctgcactgagagctcacggcttgcggcgcctgcgtctaccccgcgcgcagtcgccacggcaacagggcgggccttggttctgcttcgggcgtggtcggtgcatggtcctccagcactgttcgccccgcgggtctggtcctgggttcctttcgcctcctgtcgtcggacggcaccggctttgcccacggcctcgcggggagacgcagacacccgggacccggggaggcgcccgggcgccgccgccatg
[0043]
ttgtcagggagcgcccgctcccagctcttcggttccgggacccgcggcgcggggatggggctgggccgcccttg
[0044]
gtagccgtcctgggctgggggccaccctggccgcgtggtcaccggcaagaagcccagggcctcacccgggcgcg
[0045]
gcgtcgcgggggccgagggaaggaccggaccctcccgaggtcgcggacccggccggctggggcgaggctgggg
[0046]
tggcccctaccccgagctaagctggccgcgccgcatctcaccgtcgccggggcccgagcgctgcgcctggaccg
[0047]
gcgccgagcgagggggccaagcggccggctggacccacagtccccgcgccataggcgggtcg
[0048]
seq id no:2的序列如下:
[0049]
tcgtttcgtagaatttgggtcgttgagatcgttgtaggcgtgtcgattacggttgtttcggttcggaaagtagatttgtttttttttgcggggtaagggtggagagggcggcgtcggggggagtcgagtttgttcgtttaggtttcgttcggagtcgtaggttgggagggcggcgggcgtagcgatttcgggtttcggttcgttcggcgcggtttttattttgtagtataagagtcgtcggtagtttttgttgttgtcgtagttttcgttaaagttttgcgttatcgaaatgaagttttgatgaagtagcggcggcggatgcgtggaagggggtttcgaggaattatcggcggtattaggagattcggttttgtaaaagattgagagtttcgttttttcgatattcgcgggtagttattgcggcgtatagaatcgttcgcgtgtgagtagcgcgtacgcgtacgtaatgcgttttaatttcgtagtttatgcgtttgtattgagagtttacggtttgcggcgtttgcgtttatttcgcgcgtagtcgttacggtaatagggcgggttttggttttgtttcgggcgtggtcggtgtatggttttttagtattgttcgtttcgcgggtttggttttgggtttttttcgttttttgtcgtcggacggtatcggttttgtttacggtttcgcggggagacgtagatattcgggattcggggaggcgttcgggcgtcgtcgttatgttgttagggagcgttcgtttttagtttttcggtttcgggattcgcggcgcggggatggggttgggtcgtttttggtagtcgttttgggttgggggttattttggtcgcgtggttatcggtaagaagtttagggttttattcgggcgcggcgtcgcgggggtcgagggaaggatcggattttttcgaggtcgcggattcggtcggttggggcgaggttggggtggtttttatttcgagttaagttggtcgcgt
cgtattttatcgtcgtcggggttcgagcgttgcgtttggatcggcgtcgagcgagggggttaagcggtcggttggatttatagttttcgcgttataggcgggtcg
[0050]
seq id no:3的序列如下:
[0051]
ttgttttgtagaatttgggttgttgagattgttgtaggtgtgttgattatggttgttttggtttggaaagtagattt
[0052]
gtttttttttgtggggtaagggtggagagggtggtgttggggggagttgagtttgtttgtttaggttttgtttgga
[0053]
gttgtaggttgggagggtggtgggtgtagtgattttgggttttggtttgtttggtgtggtttttattttgtagtata
[0054]
agagttgttggtagtttttgttgttgttgtagtttttgttaaagttttgtgttattgaaatgaagttttgatgaagt
[0055]
agtggtggtggatgtgtggaagggggttttgaggaattattggtggtattaggagatttggttttgtaaaagattg
[0056]
agagttttgtttttttgatatttgtgggtagttattgtggtgtatagaattgtttgtgtgtgagtagtgtgtatgtgt
[0057]
atgtaatgtgttttaattttgtagtttatgtgtttgtattgagagtttatggtttgtggtgtttgtgtttattttgtgt
[0058]
gtagttgttatggtaatagggtgggttttggttttgttttgggtgtggttggtgtatggttttttagtattgtttgtt
[0059]
ttgtgggtttggttttgggttttttttgttttttgttgttggatggtattggttttgtttatggttttgtggggagat
[0060]
gtagatatttgggatttggggaggtgtttgggtgttgttgttatgttgttagggagtgtttgtttttagttttttgg
[0061]
ttttgggatttgtggtgtggggatggggttgggttgtttttggtagttgttttgggttgggggttattttggttgtg
[0062]
tggttattggtaagaagtttagggttttatttgggtgtggtgttgtgggggttgagggaaggattggatttttttg
[0063]
aggttgtggatttggttggttggggtgaggttggggtggtttttattttgagttaagttggttgtgttgtattttat
[0064]
tgttgttggggtttgagtgttgtgtttggattggtgttgagtgagggggttaagtggttggttggatttatagtttt
[0065]
tgtgttataggtgggttg
[0066]
seq id no:4的序列如下:
[0067]
cgacccgcctatggcgcggggactgtgggtccagccggccgcttggccccctcgctcggcgccggtccaggcgc
[0068]
agcgctcgggccccggcgacggtgagatgcggcgcggccagcttagctcggggtaggggccaccccagcctcgc
[0069]
cccagccggccgggtccgcgacctcgggagggtccggtccttccctcggcccccgcgacgccgcgcccgggtga
[0070]
ggccctgggcttcttgccggtgaccacgcggccagggtggcccccagcccaggacggctaccaagggcggccca
[0071]
gccccatccccgcgccgcgggtcccggaaccgaagagctgggagcgggcgctccctgacaacatggcggcggcg
[0072]
cccgggcgcctccccgggtcccgggtgtctgcgtctccccgcgaggccgtgggcaaagccggtgccgtccgacg
[0073]
acaggaggcgaaaggaacccaggaccagacccgcggggcgaacagtgctggaggaccatgcaccgaccacgcc
[0074]
cgaagcagaaccaaggcccgccctgttgccgtggcgactgcgcgcggggtagacgcaggcgccgcaagccgtg
[0075]
agctctcagtgcaggcgcataggctgcggggttgaggcgcattgcgtgcgcgtgcgcgctgctcacacgcggac
[0076]
ggttctgtgcgccgcaatggctgcccgcgagtatcggagaggcggagctctcagtcttttacaggaccgggtctc
[0077]
ctgatgccgccggtggttcctcgaggcccccttccacgcatccgccgccgctgcttcatcaggacttcatttcggt
[0078]
gacgcagagctttggcgagagctacggcaacagcaagaactgccggcggctcttgtgctgcagggtgaggacc
[0079]
gcgccgggcggaccgaggcccggggtcgctgcgcccgccgccctcccagcctgcggctccgagcggggcctggg
[0080]
cgggcagactcgactccccccgacgccgccctctccacccttaccccgcaaaaaggggcaaatctgctttccggg
[0081]
ccggggcagccgtggtcggcacgcctgcagcggtctcagcgacccaaattctgcggggcgg
[0082]
seq id no:5的序列如下:
[0083]
cgattcgtttatggcgcggggattgtgggtttagtcggtcgtttggttttttcgttcggcgtcggtttaggcgtagc
[0084]
gttcgggtttcggcgacggtgagatgcggcgcggttagtttagttcggggtaggggttattttagtttcgttttag
[0085]
tcggtcgggttcgcgatttcgggagggttcggtttttttttcggttttcgcgacgtcgcgttcgggtgaggttttg
[0086]
ggttttttgtcggtgattacgcggttagggtggtttttagtttaggacggttattaagggcggtttagttttattttc
[0087]
gcgtcgcgggtttcggaatcgaagagttgggagcgggcgttttttgataatatggcggcggcgttcgggcgtttt
[0088]
ttcgggtttcgggtgtttgcgttttttcgcgaggtcgtgggtaaagtcggtgtcgttcgacgataggaggcgaaa
[0089]
ggaatttaggattagattcgcggggcgaatagtgttggaggattatgtatcgattacgttcgaagtagaattaaggt
[0090]
tcgttttgttgtcgtggcgattgcgcgcggggtagacgtaggcgtcgtaagtcgtgagtttttagtgta
ggcgtat
[0091]
aggttgcggggttgaggcgtattgcgtgcgcgtgcgcgttgtttatacgcggacggttttgtgcgtcgtaatggtt
[0092]
gttcgcgagtatcggagaggcggagtttttagttttttataggatcgggttttttgatgtcgtcggtggtttttcga
[0093]
ggtttttttttacgtattcgtcgtcgttgttttattaggattttatttcggtgacgtagagttttggcgagagttacg
[0094]
gtaatagtaagaattgtcggcggtttttgtgttgtagggtgaggatcgcgtcgggcggatcgaggttcggggtcg
[0095]
ttgcgttcgtcgtttttttagtttgcggtttcgagcggggtttgggcgggtagattcgatttttttcgacgtcgttt
[0096]
tttttatttttatttcgtaaaaaggggtaaatttgtttttcgggtcggggtagtcgtggtcggtacgtttgtagcgg
[0097]
ttttagcgatttaaattttgcggggcgg
[0098]
seq id no:6的序列如下:
[0099]
tgatttgtttatggtgtggggattgtgggtttagttggttgtttggtttttttgtttggtgttggtttaggtgtagtg
[0100]
tttgggttttggtgatggtgagatgtggtgtggttagtttagtttggggtaggggttattttagttttgttttagtt
[0101]
ggttgggtttgtgattttgggagggtttggttttttttttggtttttgtgatgttgtgtttgggtgaggttttgggt
[0102]
tttttgttggtgattatgtggttagggtggtttttagtttaggatggttattaagggtggtttagttttatttttgtg
[0103]
ttgtgggttttggaattgaagagttgggagtgggtgttttttgataatatggtggtggtgtttgggtgtttttttgg
[0104]
gttttgggtgtttgtgtttttttgtgaggttgtgggtaaagttggtgttgtttgatgataggaggtgaaaggaatt
[0105]
taggattagatttgtggggtgaatagtgttggaggattatgtattgattatgtttgaagtagaattaaggtttgtttt
[0106]
gttgttgtggtgattgtgtgtggggtagatgtaggtgttgtaagttgtgagtttttagtgtaggtgtataggttgtg
[0107]
gggttgaggtgtattgtgtgtgtgtgtgtgttgtttatatgtggatggttttgtgtgttgtaatggttgtttgtgag
[0108]
tattggagaggtggagtttttagttttttataggattgggttttttgatgttgttggtggttttttgaggtttttttt
[0109]
tatgtatttgttgttgttgttttattaggattttattttggtgatgtagagttttggtgagagttatggtaatagtaag
[0110]
aattgttggtggtttttgtgttgtagggtgaggattgtgttgggtggattgaggtttggggttgttgtgtttgttg
[0111]
tttttttagtttgtggttttgagtggggtttgggtgggtagatttgattttttttgatgttgttttttttatttttatt
[0112]
ttgtaaaaaggggtaaatttgttttttgggttggggtagttgtggttggtatgtttgtagtggttttagtgatttaa
[0113]
attttgtggggtgg
[0114]
其中,seq id no:2和seq id no:3分别是seq id no:1的高甲基化状态和低甲基化状态的极端情况;
[0115]
所述高甲基化状态指的是cg高甲基化的区域,其指的是靶序列发生甲基化多的区域,由于每个人的甲基化状态不同,极端的cg高甲基化的区域指的是靶序列的所有cg均发生甲基化的区域;
[0116]
所述低甲基化状态指的是cg低甲基化的区域,其指的是靶序列发生甲基化少的区域,在本技术中,极端的cg低甲基化的区域指的是靶序列中的所有cg均未发生甲基化的区域。
[0117]
所述高甲基化状态指的是靶序列经重亚硫酸盐转化后所得到的序列,该靶序列经重亚硫酸盐转化后,碱基c转化为碱基t,但是如果是碱基cg,由于5-甲基胞嘧啶残基(5mc)对其有抗性,并不会将cg中的c发生转变,因此碱基c保持不变;
[0118]
同理,对于低甲基化状态,其指的是靶序列经重亚硫酸盐转化后所得到的序列,该靶序列经重亚硫酸盐转化后,由于靶序列上的所有的或大部分碱基cg都没有发生甲基化,因此所有的或大部分的碱基c均变成碱基t。
[0119]
seq id no:4是seq id no:1的反向互补序列;seq id no:5和seq id no:6分别是seq id no:4的高甲基化状态和低甲基化状态的极端情况;
[0120]
seq id nos:7-12的序列如下:
[0121]
seq id no:7的序列如下:
[0122]
tcgaagcggcagatggtggtctgcgagaacacgttaccgtagagcgtgcccagcgccagccccacgtcggcctg
[0123]
cgtaaagcccagcttgatgcgccgctgcttgaactgcttggcgaactgctccaggtcgtccgagctgggcgcatc
[0124]
ctcgtccgagtgctcgcccaccgatgagccgccgccgcccgcgcccgggtgcaggtgcgccgccgccgcgtgca
[0125]
ggccgcccgcgtgtgcatgtccgtgtgcgtgtccgtgggcgcccagatgcggcggcggcgacggctccagctgc
[0126]
gcctcgtggccatcctcgtgcagcgcgtggtgcaggcccggccccgcgccgccaccgcccgccgccagcatcccg
[0127]
gccaggccgccgccgccgccccccgggtaggccgcctgcgcgtacagcccgagcggctggggctggtggccccc
[0128]
gctggccccgggcgagggcgacatggccgggcccaagtggtgcgctgtgctgccctgcgcccatgccgcgcccg
[0129]
cgtgggccgccccctggtgcaccaggcgcgcgtggaaacctccgccgccgccgccgtcgtcggctcggccggtg
[0130]
ccgccgccgcctgccttgccgtgttctaggtgcgggccgccggcccaatcgccgccgccgcctcctcccgtgggt
[0131]
agccactgggggtgcgctaggcccacggggtggcccgcgcccgcgcccagccactcgtggtgcatcagcttctg
[0132]
cacttcgcggtacgcggcccctgcatgcaatcgctccgcggccgccgccgccgccgccgccgccgcggcgtccgg
[0133]
gtgcataagcggcccggtgcccccggctccgccaccggggccccgcggcaggtactgcgcggtggtggccatgc
[0134]
cgccccgcgccctgcgccgcgccgccgccgccgctccgctccgtctgcgggccccgccgcctcgctccgccggct
[0135]
taaagccccgacccgctcggcgctccggagccccaccccgcccgccgcccattggctgcccgcggagctgcctcc
[0136]
cgcctcccctgcccggcccccgccccgcgcgcccgcccgccaccctgcccggccgcccagagctctccattgggc
[0137]
gtcgctcccggggtcccgcgcgccggccgtgctgattggccgctggggcttcattcacggcccccctaccgtccg
[0138]
cgtacacactcacgccccgggggcgcggccgccacgtggggagtggcgcgggggtggccctgggaccgcaccc
[0139]
cctctcgtcctggctgtgtgggccccgctttcccccagcgctggagactccgagcccggccggtcccacattcca
[0140]
cgcgagctgaattcccgcccgcatcccgcccgggcagcagggattgccggctccgggaggcgctcgggctccga
[0141]
gaagcggctcagccccgcgcccctccctcctcagtaccgctgccggcggaccaggattcccgcgggtcctggcg
[0142]
gctgcgagcgcgaggcggcgcggattcgcggctcggttccggcgcgactgctcaccgcgcccgcctcgcctccc
[0143]
gcggctgccagcgtgcactgggcgctcctcggcgcgtctgcccggcccg
[0144]
seq id no:8的序列如下:
[0145]
tcgaagcggtagatggtggtttgcgagaatacgttatcgtagagcgtgtttagcgttagttttacgtcggtttgcg
[0146]
taaagtttagtttgatgcgtcgttgtttgaattgtttggcgaattgttttaggtcgttcgagttgggcgtattttcg
[0147]
ttcgagtgttcgtttatcgatgagtcgtcgtcgttcgcgttcgggtgtaggtgcgtcgtcgtcgcgtgtaggtcgt
[0148]
tcgcgtgtgtatgttcgtgtgcgtgttcgtgggcgtttagatgcggcggcggcgacggttttagttgcgtttcgtg
[0149]
gttattttcgtgtagcgcgtggtgtaggttcggtttcgcgtcgttatcgttcgtcgttagtatttcggttaggtcgt
[0150]
cgtcgtcgtttttcgggtaggtcgtttgcgcgtatagttcgagcggttggggttggtggttttcgttgg
tttcggg
[0151]
cgagggcgatatggtcgggtttaagtggtgcgttgtgttgttttgcgtttatgtcgcgttcgcgtgggtcgtttttt
[0152]
ggtgtattaggcgcgcgtggaaattttcgtcgtcgtcgtcgtcgtcggttcggtcggtgtcgtcgtcgtttgtttt
[0153]
gtcgtgttttaggtgcgggtcgtcggtttaatcgtcgtcgtcgttttttttcgtgggtagttattgggggtgcgtta
[0154]
ggtttacggggtggttcgcgttcgcgtttagttattcgtggtgtattagtttttgtatttcgcggtacgcggtttttg
[0155]
tatgtaatcgtttcgcggtcgtcgtcgtcgtcgtcgtcgtcgcggcgttcgggtgtataagcggttcggtgttttcg
[0156]
gtttcgttatcggggtttcgcggtaggtattgcgcggtggtggttatgtcgtttcgcgttttgcgtcgcgtcgtcgt
[0157]
cgtcgtttcgtttcgtttgcgggtttcgtcgtttcgtttcgtcggtttaaagtttcgattcgttcggcgtttcggag
[0158]
ttttatttcgttcgtcgtttattggttgttcgcggagttgtttttcgttttttttgttcggttttcgtttcgcgcgttc
[0159]
gttcgttattttgttcggtcgtttagagttttttattgggcgtcgttttcggggtttcgcgcgtcggtcgtgttgat
[0160]
tggtcgttggggttttatttacggtttttttatcgttcgcgtatatatttacgtttcgggggcgcggtcgttacgtgg
[0161]
ggagtggcgcgggggtggttttgggatcgtattttttttcgttttggttgtgtgggtttcgtttttttttagcgttg
[0162]
gagatttcgagttcggtcggttttatattttacgcgagttgaattttcgttcgtatttcgttcgggtagtagggattg
[0163]
tcggtttcgggaggcgttcgggtttcgagaagcggtttagtttcgcgtttttttttttttagtatcgttgtcggcgg
[0164]
attaggattttcgcgggttttggcggttgcgagcgcgaggcggcgcggattcgcggttcggtttcggcgcgattg
[0165]
tttatcgcgttcgtttcgtttttcgcggttgttagcgtgtattgggcgtttttcggcgcgtttgttcggttcg
[0166]
seq id no:9的序列如下:
[0167]
ttgaagtggtagatggtggtttgtgagaatatgttattgtagagtgtgtttagtgttagttttatgttggttt
[0168]
gtgtaaagtttagtttgatgtgttgttgtttgaattgtttggtgaattgttttaggttgtttgagttgggtgtatt
[0169]
tttgtttgagtgtttgtttattgatgagttgttgttgtttgtgtttgggtgtaggtgtgttgttgttgtgtgtaggt
[0170]
tgtttgtgtgtgtatgtttgtgtgtgtgtttgtgggtgtttagatgtggtggtggtgatggttttagtt
gtgtttt
[0171]
gtggttatttttgtgtagtgtgtggtgtaggtttggttttgtgttgttattgtttgttgttagtattttggttaggt
[0172]
tgttgttgttgttttttgggtaggttgtttgtgtgtatagtttgagtggttggggttggtggtttttgttggttttg
[0173]
ggtgagggtgatatggttgggtttaagtggtgtgttgtgttgttttgtgtttatgttgtgtttgtgtgggttgttt
[0174]
tttggtgtattaggtgtgtgtggaaatttttgttgttgttgttgttgttggtttggttggtgttgttgttgtttgtt
[0175]
ttgttgtgttttaggtgtgggttgttggtttaattgttgttgttgtttttttttgtgggtagttattgggggtgtgt
[0176]
taggtttatggggtggtttgtgtttgtgtttagttatttgtggtgtattagtttttgtattttgtggtatgtggttt
[0177]
ttgtatgtaattgttttgtggttgttgttgttgttgttgttgttgtggtgtttgggtgtataagtggtttggtgttt
[0178]
ttggttttgttattggggttttgtggtaggtattgtgtggtggtggttatgttgttttgtgttttgtgttgtgttgt
[0179]
tgttgttgttttgttttgtttgtgggttttgttgttttgttttgttggtttaaagttttgatttgtttggtgttttgg
[0180]
agttttattttgtttgttgtttattggttgtttgtggagttgttttttgttttttttgtttggtttttgttttgtgtgt
[0181]
ttgtttgttattttgtttggttgtttagagttttttattgggtgttgtttttggggttttgtgtgttggttgtgttga
[0182]
ttggttgttggggttttatttatggtttttttattgtttgtgtatatatttatgttttgggggtgtggttgttatgt
[0183]
ggggagtggtgtgggggtggttttgggattgtatttttttttgttttggttgtgtgggttttgtttttttttagtgt
[0184]
tggagattttgagtttggttggttttatattttatgtgagttgaatttttgtttgtattttgtttgggtagtaggg
[0185]
attgttggttttgggaggtgtttgggttttgagaagtggtttagttttgtgtttttttttttttagtattgttgttg
[0186]
gtggattaggatttttgtgggttttggtggttgtgagtgtgaggtggtgtggatttgtggtttggttttggtgtga
[0187]
ttgtttattgtgtttgttttgttttttgtggttgttagtgtgtattgggtgttttttggtgtgtttgtttggtttg
[0188]
seq id no:10的序列如下:
[0189]
cgggccgggcagacgcgccgaggagcgcccagtgcacgctggcagccgcgggaggcgaggcgggcgcggtga
[0190]
gcagtcgcgccggaaccgagccgcgaatccgcgccgcctcgcgctcgcagccgccaggacccgcgggaa
tcctg
[0191]
gtccgccggcagcggtactgaggagggaggggcgcggggctgagccgcttctcggagcccgagcgcctcccgg
[0192]
agccggcaatccctgctgcccgggcgggatgcgggcgggaattcagctcgcgtggaatgtgggaccggccggg
[0193]
ctcggagtctccagcgctgggggaaagcggggcccacacagccaggacgagagggggtgcggtcccagggcca
[0194]
cccccgcgccactccccacgtggcggccgcgcccccggggcgtgagtgtgtacgcggacggtaggggggccgtg
[0195]
aatgaagccccagcggccaatcagcacggccggcgcgcgggaccccgggagcgacgcccaatggagagctctg
[0196]
ggcggccgggcagggtggcgggcgggcgcgcggggcgggggccgggcaggggaggcgggaggcagctccgcg
[0197]
ggcagccaatgggcggcgggcggggtggggctccggagcgccgagcgggtcggggctttaagccggcggagcg
[0198]
aggcggcggggcccgcagacggagcggagcggcggcggcggcgcggcgcagggcgcggggcggcatggccac
[0199]
caccgcgcagtacctgccgcggggccccggtggcggagccgggggcaccgggccgcttatgcacccggacgcc
[0200]
gcggcggcggcggcggcggcggcggccgcggagcgattgcatgcaggggccgcgtaccgcgaagtgcagaagc
[0201]
tgatgcaccacgagtggctgggcgcgggcgcgggccaccccgtgggcctagcgcacccccagtggctacccacg
[0202]
ggaggaggcggcggcggcgattgggccggcggcccgcacctagaacacggcaaggcaggcggcggcggcacc
[0203]
ggccgagccgacgacggcggcggcggcggaggtttccacgcgcgcctggtgcaccagggggcggcccacgcgg
[0204]
gcgcggcatgggcgcagggcagcacagcgcaccacttgggcccggccatgtcgccctcgcccggggccagcgg
[0205]
gggccaccagccccagccgctcgggctgtacgcgcaggcggcctacccggggggcggcggcggcggcctggcc
[0206]
gggatgctggcggcgggcggtggcggcgcggggccgggcctgcaccacgcgctgcacgaggatggccacgagg
[0207]
cgcagctggagccgtcgccgccgccgcatctgggcgcccacggacacgcacacggacatgcacacgcgggcgg
[0208]
cctgcacgcggcggcggcgcacctgcacccgggcgcgggcggcggcggctcatcggtgggcgagcactcggac
[0209]
gaggatgcgcccagctcggacgacctggagcagttcgccaagcagttcaagcagcggcgcatcaagctgggctt
[0210]
tacgcaggccgacgtggggctggcgctgggcacgctctacggtaacgtgttctcgcagaccaccatctgccgct
[0211]
tcga
[0212]
seq id no:11的序列如下:
[0213]
cgggtcgggtagacgcgtcgaggagcgtttagtgtacgttggtagtcgcgggaggcgaggcgggcgcggtgag
[0214]
tagtcgcgtcggaatcgagtcgcgaattcgcgtcgtttcgcgttcgtagtcgttaggattcgcgggaattttggt
[0215]
tcgtcggtagcggtattgaggagggaggggcgcggggttgagtcgtttttcggagttcgagcgtttttcggagt
[0216]
cggtaatttttgttgttcgggcgggatgcgggcgggaatttagttcgcgtggaatgtgggatcggtcgggttcg
[0217]
gagtttttagcgttgggggaaagcggggtttatatagttaggacgagagggggtgcggttttagggttattttc
[0218]
gcgttattttttacgtggcggtcgcgttttcggggcgtgagtgtgtacgcggacggtaggggggtcgtgaatga
[0219]
agttttagcggttaattagtacggtcggcgcgcgggatttcgggagcgacgtttaatggagagttttgggcggt
[0220]
cgggtagggtggcgggcgggcgcgcggggcgggggtcgggtaggggaggcgggaggtagtttcgcgggtagtt
[0221]
aatgggcggcgggcggggtggggtttcggagcgtcgagcgggtcggggttttaagtcggcggagcgaggcggc
[0222]
ggggttcgtagacggagcggagcggcggcggcggcgcggcgtagggcgcggggcggtatggttattatcgcgt
[0223]
agtatttgtcgcggggtttcggtggcggagtcgggggtatcgggtcgtttatgtattcggacgtcgcggcggcg
[0224]
gcggcggcggcggcggtcgcggagcgattgtatgtaggggtcgcgtatcgcgaagtgtagaagttgatgtatta
[0225]
cgagtggttgggcgcgggcgcgggttatttcgtgggtttagcgtatttttagtggttatttacgggaggaggcgg
[0226]
cggcggcgattgggtcggcggttcgtatttagaatacggtaaggtaggcggcggcggtatcggtcgagtcgacg
[0227]
acggcggcggcggcggaggtttttacgcgcgtttggtgtattagggggcggtttacgcgggcgcggtatgggcg
[0228]
tagggtagtatagcgtattatttgggttcggttatgtcgttttcgttcggggttagcgggggttattagttttagt
[0229]
cgttcgggttgtacgcgtaggcggtttattcggggggcggcggcggcggtttggtcgggatgttggcggcgggc
[0230]
ggtggcggcgcggggtcgggtttgtattacgcgttgtacgaggatggttacgaggcgtagttggagtcg
tcgtc
[0231]
gtcgtcgtatttgggcgtttacggatacgtatacggatatgtatacgcgggcggtttgtacgcggcggcggcgt
[0232]
atttgtattcgggcgcgggcggcggcggtttatcggtgggcgagtattcggacgaggatgcgtttagttcggac
[0233]
gatttggagtagttcgttaagtagtttaagtagcggcgtattaagttgggttttacgtaggtcgacgtggggttg
[0234]
gcgttgggtacgttttacggtaacgtgttttcgtagattattatttgtcgtttcga
[0235]
seq id no:12的序列如下:
[0236]
tgggttgggtagatgtgttgaggagtgtttagtgtatgttggtagttgtgggaggtgaggtgggtgtggtgagt
[0237]
agttgtgttggaattgagttgtgaatttgtgttgttttgtgtttgtagttgttaggatttgtgggaattttggttt
[0238]
gttggtagtggtattgaggagggaggggtgtggggttgagttgttttttggagtttgagtgttttttggagttgg
[0239]
taatttttgttgtttgggtgggatgtgggtgggaatttagtttgtgtggaatgtgggattggttgggtttggagt
[0240]
ttttagtgttgggggaaagtggggtttatatagttaggatgagagggggtgtggttttagggttatttttgtgtt
[0241]
attttttatgtggtggttgtgtttttggggtgtgagtgtgtatgtggatggtaggggggttgtgaatgaagtttt
[0242]
agtggttaattagtatggttggtgtgtgggattttgggagtgatgtttaatggagagttttgggtggttgggtag
[0243]
ggtggtgggtgggtgtgtggggtgggggttgggtaggggaggtgggaggtagttttgtgggtagttaatgggtg
[0244]
gtgggtggggtggggttttggagtgttgagtgggttggggttttaagttggtggagtgaggtggtggggtttgt
[0245]
agatggagtggagtggtggtggtggtgtggtgtagggtgtggggtggtatggttattattgtgtagtatttgttg
[0246]
tggggttttggtggtggagttgggggtattgggttgtttatgtatttggatgttgtggtggtggtggtggtggtg
[0247]
gtggttgtggagtgattgtatgtaggggttgtgtattgtgaagtgtagaagttgatgtattatgagtggttgggt
[0248]
gtgggtgtgggttattttgtgggtttagtgtatttttagtggttatttatgggaggaggtggtggtggtgattgg
[0249]
gttggtggtttgtatttagaatatggtaaggtaggtggtggtggtattggttgagttgatgatggtggtggtggt
[0250]
ggaggtttttatgtgtgtttggtgtattagggggtggtttatgtgggtgtggtatgggtgtagggtagtatagtg
[0251]
tattatttgggtttggttatgttgtttttgtttggggttagtgggggttattagttttagttgtttgggttgtatgt
[0252]
gtaggtggtttatttggggggtggtggtggtggtttggttgggatgttggtggtgggtggtggtggtgtggggtt
[0253]
gggtttgtattatgtgttgtatgaggatggttatgaggtgtagttggagttgttgttgttgttgtatttgggtgtt
[0254]
tatggatatgtatatggatatgtatatgtgggtggtttgtatgtggtggtggtgtatttgtatttgggtgtgggt
[0255]
ggtggtggtttattggtgggtgagtatttggatgaggatgtgtttagtttggatgatttggagtagtttgttaag
[0256]
tagtttaagtagtggtgtattaagttgggttttatgtaggttgatgtggggttggtgttgggtatgttttatggta
[0257]
atgtgtttttgtagattattatttgttgttttga
[0258]
seq id no:8和seq id no:9分别是seq id no:7的高甲基化状态和低甲基化状态的极端情况;
[0259]
seq id no:10是seq id no:7的反向互补序列;seq id no:11和seq id no:12分别是seq id no:10的高甲基化状态和低甲基化状态的极端情况。
[0260]
seq id nos:13-18的序列如下:
[0261]
seq id no:13的序列如下:
[0262]
tcgggaaggggagctgattctctgaggcagcgttcccaggactggtgggaaggagtggtgacccgctcgggctc
[0263]
ggcgtggacccggagcgcgcctggcgctgtccgtggtgctgagaggtggggaggccagcgtggcggcggcgct
[0264]
gggcggaatgtgggcgagacatctccgcaaggcttggcg
[0265]
seq id no:14的序列如下:
[0266]
tcgggaaggggagttgattttttgaggtagcgtttttaggattggtgggaaggagtggtgattcgttcgggttcg
[0267]
gcgtggattcggagcgcgtttggcgttgttcgtggtgttgagaggtggggaggttagcgtggcggcggcgttgg
[0268]
gcggaatgtgggcgagatattttcgtaaggtttggcg
[0269]
seq id no:15的序列如下:
[0270]
ttgggaaggggagttgattttttgaggtagtgtttttaggattggtgggaaggagtggtgatttgtttgggtttg
[0271]
gtgtggatttggagtgtgtttggtgttgtttgtggtgttgagaggtggggaggttagtgtggtggtggtgttggg
[0272]
tggaatgtgggtgagatatttttgtaaggtttggtg
[0273]
seq id no:16的序列如下:
[0274]
cgccaagccttgcggagatgtctcgcccacattccgcccagcgccgccgccacgctggcctccccacctctcagc
[0275]
accacggacagcgccaggcgcgctccgggtccacgccgagcccgagcgggtcaccactccttcccaccagtcct
[0276]
gggaacgctgcctcagagaatcagctccccttcccga
[0277]
seq id no:17的序列如下:
[0278]
cgttaagttttgcggagatgtttcgtttatatttcgtttagcgtcgtcgttacgttggtttttttattttttagtatta
[0279]
cggatagcgttaggcgcgtttcgggtttacgtcgagttcgagcgggttattatttttttttattagttttgggaacg
[0280]
ttgttttagagaattagttttttttttcga
[0281]
seq id no:18的序列如下:
[0282]
tgttaagttttgtggagatgttttgtttatattttgtttagtgttgttgttatgttggtttttttattttttagtattat
[0283]
ggatagtgttaggtgtgttttgggtttatgttgagtttgagtgggttattatttttttttattagttttgggaatgtt
[0284]
gttttagagaattagtttttttttttga
[0285]
seq id no:14和seq id no:15分别是seq id no:13的高甲基化状态和低甲基化状态的极端情况;
[0286]
seq id no:16是seq id no:13的反向互补序列;seq id no:17和seq id no:18分别是seq id no:16的高甲基化状态和低甲基化状态的极端情况。
[0287]
在本技术中,预测脑卒中复发是预测患有脑卒中的患者是否有复发的风险。
[0288]
在一些实施方式中,所述脑卒中选自大动脉粥样硬化性卒中、心源性脑栓塞、小动脉闭塞性脑卒中、缺血性脑卒中和脑梗死中的一种或两种以上。
[0289]
本技术通过检测患者的白细胞的所述标志物的甲基化水平,能够预测脑卒中患者复发的风险,从而有效检索脑卒中患者的死亡或者致残。
[0290]
本技术提供了标志物在制备用于预测脑卒中复发的试剂盒中的用途,所述甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。
[0291]
本技术提供了标志物在制备预防脑卒中复发的药物中的用途,包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。
[0292]
在一些实施方式中,所述药物是基于所述甲基化标志物设计的靶向药物。在一些实施方式中,所述脑卒中选自大动脉粥样硬化性卒中、心源性脑栓塞、小动脉闭塞性脑卒中、缺血性脑卒中和脑梗死中的一种或两种以上。
[0293]
在一些实施方式中,所述甲基化标志物为如seq id nos:1~18中任一种或两种以上所示的序列或者为包含seq id nos:1~18中任一种或两种以上所示的序列。例如,在一些实施方式中,所述甲基化标志物包含如下的一种或两种以上的序列或者由如下的一种或两种以上的序列组成:seq id nos:1-6中的一种、seq id nos:7-12中的一种和seq id nos:13-18中的一种。
[0294]
在一些实施方式中,所述甲基化标志物为标志物a、标志物b、标志物c或标志物a和标志物b或标志物a和标志物c或标志物b和标志物c或标志物a、标志物b和标志物c。
[0295]
其中,当甲基化标志物为标志物a时,其序列可以包含如seq id nos:1-6中任一种所示的序列或者由如seq id nos:1-6中任一种所示的序列组成。
[0296]
当甲基化标志物为标志物b时,其序列可以包含如seq id nos:7-12中任一种所示的序列或者由如seq id nos:7-12中任一种所示的序列组成。
[0297]
当甲基化标志物为标志物c时,其序列可以包含如seq id nos:13-18中任一种所示的序列或者由如seq id nos:13-18中任一种所示的序列组成。
[0298]
当甲基化标志物为标志物a和标志物b时,甲基化标志物的序列可以包含如seq id nos:1-6中任一种所示的序列或者由如seq id nos:1-6中任一种所示的序列组成,可以包含如seq id nos:7-12中任一种所示的序列或者由如seq id nos:7-12中任一种所示的序列组成。
[0299]
当甲基化标志物为标志物a和标志物c时,甲基化标志物的序列可以包含如seq id nos:1-6中任一种所示的序列或者由如seq id nos:1-6中任一种所示的序列组成,同时包含如seq id nos:13-18中任一种所示的序列或者由如seq id nos:13-18中任一种所示的序列组成。
[0300]
当甲基化标志物为标志物b和标志物c时,甲基化标志物的序列可以包含如seq id nos:7-12中任一种所示的序列或者由如seq id nos:7-12中任一种所示的序列组成,同时包含如seq id nos:13-18中任一种所示的序列或者由如seq id nos:13-18中任一种所示的序列组成。
[0301]
当甲基化标志物为标志物a、标志物b和标志物c时,甲基化标志物的序列可以包含如seq id nos:1-6中任一种所示的序列或者由如seq id nos:1-6中任一种所示的序列组成、包含如seq id nos:7-12中任一种所示的序列或者由如seq id nos:7-12中任一种所示的序列组成,同时包含如seq id nos:13-18中任一种所示的序列或者由如seq id nos:13-18中任一种所示的序列组成。
[0302]
本技术提供了一种用于预测脑卒中复发的组合物,所述组合物包括:
[0303]
用于检测上述所述的甲基化标志物的甲基化状态的核酸,
[0304]
其中,所述甲基化标志物的甲基化状态由所述甲基化标志物的靶序列的甲基化来表征。
[0305]
在本技术中,所述甲基化状态指的是发生在cpg二核苷酸中胞嘧啶上第5位碳原子的甲基化过程,作为一种相对稳定的修饰状态,在dna甲基转移酶的作用下,可随dna的复制过程遗传给新生的子代dna,是一种重要的表观遗传机制,dna甲基化时,基因启动子区的甲基化可导致抑癌基因转录沉寂,因此它与肿瘤的发生关系密切。异常甲基化包括抑癌基因和dna修复基因的高甲基化、重复序列dna的低甲基化、某些基因的印记丢失,其与多种肿瘤的发生有关。
[0306]
在本技术中当分析这样的靶序列的甲基化状态时,本领域技术人员可以使用定量测定方法来确定甲基化状态。
[0307]
本技术提供了一种试剂盒,其包含用于检测上述所述的甲基化标志物的试剂。
[0308]
对于所述的试剂,本技术不作任何限制,其可以根据需要进行选择,例如可以是引
物、探针等。
[0309]
本技术筛选得到了3个甲基化标志物,对于其中的任意一个甲基化标志物,其甲基化高低均与复发有一定的影响,此外,对上述任一个甲基化标志物进行检测,其auc均在0.6以上,说明本技术所筛选得到的甲基化标志物能够准确预测脑卒中患者复发的风险,进而为精准治疗和健康管理提供指导。
[0310]
本技术所筛选得到的甲基化标志物不仅能够实现复发风险预测,而且还可以通过对个体既往基本信息、流调信息、检测结果的系统性分析,对患者可能性复发时间点给予精准提示。
[0311]
本技术所述的甲基化标志物是通过对930例样本(脑卒中患者)进行初步筛选得到1200个标志物,又通过进一步筛选得到与脑卒中相关的3个甲基化标志物。
[0312]
实施例
[0313]
本技术对试验中所用到的材料以及试验方法进行一般性和/或具体的描述,在下面的实施例中,如果无其他特别的说明,%表示wt%,即重量百分数。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规试剂产品。
[0314]
实施例1全基因组甲基化检测
[0315]
1.dna提取与质检
[0316]
1.1dna提取
[0317]
样本裂解
[0318]
用电动连续分液器向样品储存管中加入20μl proteinase k和200μl白细胞裂解液i,充分混匀后56℃孵育30min;
[0319]
样品裂解期间,用液体工作站向96dw深孔板中加入以下试剂:
[0320]
表2
[0321][0322][0323]
然后在血浆样本中验证,其实验检测方法如下:
[0324]
上机提取
[0325]
向sample plate中加入按顺序裂解产物;(注意:为防止裂解产物加错位置,加入样品后的位置需立即用硅胶盖封闭,之后才能加入下一个样品。)
[0326]
打开ae2130仪器,将深孔板按顺序放入仪器中,之后运行程序
‘
2517-lysis’;
[0327]
约20分钟后仪器暂停,取出
‘
sample plate’,用电动连续分液器向深孔板中加入310μl充分混匀的磁珠与结合液的混合物;
[0328]
将
‘
sample plate’重新放入仪器ae2130中,继续运行程序;
[0329]
约25min后程序运行结束,将深孔板与磁套从仪器中取出,将
‘
sample plate’中的洗脱产物转移至1.5ml ep管中冷冻保存并拍照记录。
[0330]
1.2dna质检
[0331]
1.2.1浓度、纯度测定
[0332]
在nanodrop 2000上,取2μl提取产物进行浓度、纯度测定。
[0333]
1.2.2qubit浓度测定
[0334]
用可变间距移液器转移2μl提取产物至pcr板中稀释10倍,混匀后在qubit中测定浓度。
[0335]
完整度测试
[0336]
取6μl 1.2.2中的稀释产物进行琼脂糖电泳,检测基因组dna完整性。
[0337]
注:质检结束后立即进行下游建库工作
[0338]
2.wgbs文库构建
[0339]
2.1dna打断及片段筛选
[0340]
将解冻后的dna样本(包括阳性质控品)震混离心,按照原有顺序排列,可在4℃暂存;
[0341]
样本均一化:取低吸附pcr板,按照固定顺序添加样本,然后补水定容体积至130μl;
[0342]
机械打断操作:将均一化后的样本吸取130μl加到打断管中,注意打断管摆放和取用顺序,按照打断程序进行打断;打断完成后转移129μl到新的纯化板中,每个样本中添加1μl浓度为0.05ng/μl的打断后的λdna;
[0343]
打断程序:peak power 450,duty factor 30,cycle/burst 194,打断时间120s
[0344]
片段筛选:提前30min平衡磁珠,在自动化工作站上进行片段筛选工作。需要注意提前10分钟将枪头和试剂准备完成并核对使用程序。提前配置末端修复mix(具体成分见表3)到新的低吸附pcr板中,自动化将洗脱产物加入mix并混匀(如果暂停可选择直接回收洗脱产物,可暂存-20℃)。
[0345]
抽检:筛选剩余产物可暂存,后续随机抽取不同位置1~3例样本稀释10倍进行浓度和峰图质检。
[0346]
2.2文库构建
[0347]
2.2.1末端修复反应+a尾
[0348]
末端修复反应液可提前10分钟按如下体系配制反应液,震荡混匀,400g离心5s,分装到8联排pcr管中,然后使用排枪将反应液加入到新的低吸附pcr板中冰盒上备用。
[0349]
将筛选后的产物11μl加到装有末端修复mix的低吸附pcr板中,封膜震混离心上机。
[0350]
表3
[0351]
试剂单个用量(μl)酶1-22
buffer 11buffer u1.5
[0352]
反应程序:热盖66℃,25℃30min,56℃20min,4℃forever
[0353]
2.2.2加接头
[0354]
反应液可提前5分钟按如下体系配制,震荡混匀后,400g离心5s,分装到8联排pcr管,冰盒上备用。使用排枪将反应液加入到末端修复产物pcr板中,封膜后震荡离心上机反应。
[0355]
表4
[0356][0357][0358]
反应程序:关闭热盖,22℃40min,4℃forever
[0359]
2.2.3接头产物纯化
[0360]
提前准备柱子和收集管,柱子写上对应标号,也可提前准备干净的1.5ml ep管,写上对应编号;
[0361]
取140μl dna binding buffer到样本中,吹混5下后全部转移到对应的柱子中;
[0362]
13000rcf,30s(保证能完全离下去液体)离心;
[0363]
添加200μl dna wash buffer到柱子中,13000rcf,30s(保证能完全离下去液体)离心;
[0364]
重复上一步骤;
[0365]
离心完成后将柱子置于之前准备的1.5ml ep管上,加入22μl eb buffer;
[0366]
13000rcf,30s(保证能完全离下去液体)离心;
[0367]
取20μl液体,到下一步mix中进行反应。
[0368]
2.2.4灭活反应
[0369]
反应液可提前10分钟按如下体系配制,震荡混匀后,400g离心5s,分装到8联排pcr管,冰盒上备用。使用排枪将反应液加入新低吸附pcr板中,然后加入纯化产物,封膜后震荡离心上机反应。
[0370]
表5
[0371]
试剂单个用量(μl)酶40.2buffer 4.10.8buffer 4.21buffer u2.5
[0372]
反应程序:热盖84℃,74℃10min,4℃forever
[0373]
2.3转化
[0374]
灭活后的样本使用200μl排枪加入130μl lc显色试剂,吹混10次封膜后进行转化反应,反应结束后可4℃保存20小时。
[0375]
反应程序:热盖105℃。98℃8min,54℃60min,4℃forever
[0376]
反应结束后去除封口膜,按照以下步骤进行处理。
[0377]
提前准备柱子和收集管,柱子写上对应编号,也可提前准备干净的1.5mlep管,写上对应编号;
[0378]
取600μl m-binding buffer到柱子中,然后转移全部样本到柱子中,盖盖子后上下颠倒10下;
[0379]
13000rcf,30s(保证能完全离下去液体)离心;
[0380]
添加100μl m-wash buffer到柱子中,13000rcf,30s(保证能完全离下去液体)离心;
[0381]
加200μl l-desulphonation buffer,室温静置15min后13000rcf,30s(保证能完全离下去液体)离心;
[0382]
添加200μl m-wash buffer到柱子中,13000rcf,30s(保证能完全离下去液体)离心;
[0383]
重复上一步;
[0384]
离心完成后将柱子置于之前准备的1.5ml ep管上,加入10μl eb buffer,10000rcf,30s(保证能完全离下去液体)离心;
[0385]
取9μl液体,到下一步mix中进行反应。
[0386]
2.4文库扩增
[0387]
pcr反应液可提前5分钟按如下体系配制,分装到8联排pcr管,使用排枪将反应液加入新低吸附pcr板中,分别加入index,做好记录,最后加入纯化产物,封膜后震荡离心上机反应。
[0388]
表6
[0389]
试剂单个用量(μl)pcr酶0.52x pcr buffer12.5p5n引物(10pmol/μl)1.5p7引物(10pmol/μl)1.5(单加)
[0390]
反应程序:热盖105℃。94℃2min;(98℃10s,52℃30s,68℃15s,)12cycles;72℃1min;4℃forever
[0391]
2.5文库纯化
[0392]
反应结束后去除封口膜,在自动化工作站上进行纯化工作。需要注意提前10分钟将枪头和试剂准备完成并拍照记录,并核对使用程序。
[0393]
自动化工作期间,可准备出库用1.5ml低吸附ep管,并完成标签打印、粘贴以及出库信息的准备工作。等待纯化完成后,使用可调间距排枪将纯化产物转到有标签的管中,并做好记录。
[0394]
随后随机抽取3个样本进行浓度和峰图的检测,如有异常向建库负责人汇报。
[0395]
3.文库质检
[0396]
bioptic qsep100全自动核酸蛋白分析系统或者agilent 2100生物分析仪检测文库的片段分布;
[0397]
qpcr质检文库有效浓度。
[0398]
4.文库上机
[0399]
文库测序平台为illumina nova 6000测序仪,测序模式为pe150.
[0400]
5.数据技术参数要求:
[0401]
测序数据≥90g/标本,
[0402]
bs转化率≥99%,
[0403]
数据冗余度《23%(mapping中的重复的reads数除以mapping reads数),clean reads占原始数据的比例》85%
[0404]
去重后:1
×
以上的全基因组覆盖》90%,5
×
以上的全基因组覆盖》85%
[0405]5×
mcg的覆盖率(去除性染色体)》70%。
[0406]
实施例2位点的筛选过程
[0407]
本批次一共930个样本(脑卒中患者),662例脑卒中未复发患者,268例脑卒中复发患者,将样本来源于脑卒中患者提取对应的白细胞(wbc)按照实施例1所述的方法做wgbs测序,经过如下临床信息过滤,并将930例数据按8:2(图1)比例随机划分为训练集(744例样本)和测试集(186例样本),与复发相关的甲基化标志物筛选方法如下:
[0408]
质控:使用fastp等质控软件查看930例wgbs原始测序数据质量,并进行过滤、截取或去除低质量的reads,得到对应的clean data;
[0409]
比对、去重:采用bismark bowtie2比对软件将质控后的clean data数据比对到参考基因组(hg38)上;利用deduplicate_bismark对初次比对的bam文件进行去重;
[0410]
mmu目标区域构建:对全基因组进行切割,寻找cpg富集的区域,要求两个cpg位点距离不得超过lbp,得到候选区域region1。受制于测序读长,推荐设置l为一个小于100的数字,这样得到一个较短的富含cg的区域。
[0411]
与复发相关的标志物筛选:在训练数据按照5折交叉验证分为5组(如图1所示),其中,组1的训练集为595例(未复发的为422例,复发的为173例),测试集为149例(未复发的为107例,复发的为42例);组2的训练集为596例(未复发的为423例,复发的为173例),测试集为148例(未复发的为106例,复发的为42例);组3的训练集为595例(未复发的为429例,复发的为166例),测试集为149例(未复发的为100例,复发的为49例);组4的训练集为595例(未复发的为423例,复发的为172例),测试集为149例(未复发的为106例,复发的为43例);组5的训练集为595例(未复发的为419例,复发的为176例),测试集为149例(未复发的为110例,复发的为39例),在5组数据中分别进行marker筛选。针对每一组数据,将样本的每个mmu与临床信息(患者复发时间和患者复发状态)结合进行单变量cox分析得到每个mmu对应的p值,并使用false discovery rate(fdr)方法对p值进行校正,得到校正后的q值,选择q值小于0.05的标志物。如果一个标志物在5组数据中,有3组以上(包括3组)与复发显著相关(即q《0.05),那么则保留该标志物,初步筛选得到了1200个标志物。在训练集(744例样本)中,以1200个标志物作为自变量,以是否复发(复发=r,未复发=nr)为响应变量,采用弹性网络
回归(elastic net regression)的方法以10折交叉验证的方法对1200个标志物进行筛选,通过筛选得到236个标志物,最终选择对应回归系数最大的3个marker,其为表1所示。
[0412]
实施例3卒中复发判别模型构建
[0413]
首先,针对实施例2筛选得到的3个mmu(表1),按照表7的方式分别在训练集(744例样本)构建逻辑回归模型,在测试集(186例样本)中,分别对7个模型进行验证,在训练集使用glm构建逻辑回归模型,在测试集预测,会得到每个样本的预测分值,然后使用r包proc中的roc函数便可以得到auc值,结果如表7所示:
[0414]
表7
[0415] auca0.631b0.618c0.603ab0.676ac0.647bc0.637abc0.706
[0416]
从表7可以看到,结果最好的是abc三种标志物综合得到的模型效果最好,abc三种标志物综合得到的模型的auc为0.706(图3)。单个标志物效果最好的是a,auc为0.631(图2)。
[0417]
实施例4标志物筛选方策略的稳定性评估
[0418]
为了评估筛选方法的稳定性,在930例样本中,采用5
×
5的嵌套交叉验证方法(如图4所示),其中,组1的训练集为745例(未复发的为530例,复发的为215例),测试集为185例(未复发的为132,复发的为53);组2的训练集为746例(未复发的为533例,复发的为213例),测试集为184例(未复发的为129例,复发的为55例);组3的训练集为744例(未复发的为529例,复发的为215例),测试集为186例(未复发的为133例,复发的为53);组4的训练集为744例(未复发的为529例,复发的为215例),测试集为186例(未复发的为133例,复发的为53例);组5的训练集为742例(未复发的为529例,复发的为213例),测试集为188例(未复发的为133例,复发的为55例),在5组数据中分别根据实施例2筛选mmu的策略筛选特征,在5次交叉验证中,3个标志物均被保留。使用表1的三个标志物构建多元线性回归模型,在测试集进行验证,模型在测试集的结果如表8所示。
[0419]
表8
[0420]
[0421][0422]
从表8可以看出,标志物abc组合的auc平均值为0.702。从5次预测结果中可以看到,标志物筛选策略具有很强的稳定性。
[0423]
本技术所述的标志物与脑卒中复发相关,说明了甲基化在脑卒中患者和复发患者之间存在差别,通过甲基化标志物可以对卒中复发进行有效分析(标志物a的auc为0.631,标志物abc组合的auc为0.706),为卒中患者复发预测提供了新维度的标志物。
[0424]
以上所述,仅是本技术的较佳实施例而已,并非是对本技术作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本技术技术方案内容,依据本技术的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本技术技术方案的保护范围。
技术特征:
1.一种用于预测脑卒中复发的甲基化标志物,所述甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。2.根据权利要求1所述的甲基化标志物,其中,所述脑卒中选自大动脉粥样硬化性卒中、心源性脑栓塞、小动脉闭塞性脑卒中、缺血性脑卒中和脑梗死中的一种或两种以上;优选地,所述脑卒中复发为三个月之内的脑卒中复发;优选地,所述甲基化标志物为如seq id nos:1~18中任一种或两种以上所示的序列或者为包含seq id nos:1~18中任一种或两种以上所示的序列。3.甲基化标志物在制备用于预测脑卒中复发的试剂盒中的用途,所述甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。4.甲基化标志物在制备预防脑卒中复发的药物中的用途,所述甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。5.根据权利要求4所述的用途,其中,所述药物是基于所述甲基化标志物设计的靶向药物。6.根据权利要求3-5中任一项所述的用途,其中,所述脑卒中选自大动脉粥样硬化性卒中、心源性脑栓塞、小动脉闭塞性脑卒中、缺血性脑卒中和脑梗死中的一种或两种以上;优选地,所述甲基化标志物为如seq id nos:1~18中任一种或两种以上所示的序列或者为包含seq id nos:1~18中任一种或两种以上所示的序列。7.一种用于预测脑卒中复发的组合物,所述组合物包括:用于检测权利要求1-2中任一项所述的甲基化标志物的甲基化状态的核酸,其中,所述甲基化标志物的甲基化状态由所述甲基化标志物的靶序列的甲基化来表征。8.一种试剂盒,其包含用于检测权利要求1-2中任一项所述的甲基化标志物的试剂。9.根据权利要求8所述的试剂盒,其中,所述试剂盒用于检测的样本包括:细胞系、组织学切片、组织活检/石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,或其组合。10.一种核酸,其中,所述核酸用于靶向权利要求1-2中任一项所述的甲基化标志物。
技术总结
本申请公开了一种用于预测脑卒中复发的甲基化标志物及其应用,所述用于预测脑卒中复发的甲基化标志物包含9号染色体的137129295至137130392位的基因组区域、1号染色体的38045854至38047464位的基因组区域和2号染色体的219331647至219331832位的基因组区域中的一种或两种以上。本申请所得到的甲基化标志物能够准确预测卒中患者复发的风险,并且可以通过对个体既往基本信息、流调信息、检测结果的系统性分析,对患者可能性复发时间点给予精准提示,进而为精准治疗和健康管理提供指导。进而为精准治疗和健康管理提供指导。
技术研发人员:彭勇飞 户秋稳 田继超 王小奇 叶建伟 杨亚东 韩晓亮 叶志海 王建铭
受保护的技术使用者:博尔诚(北京)科技有限公司
技术研发日:2023.04.10
技术公布日:2023/10/19
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:液晶介质的制作方法 下一篇:用于域泛化的数据增强的制作方法