专利名称:一种高通量基因组甲基化dna富集方法及其所使用标签和标签接头的利记博彩app
技术领域:
本发明涉及高通量基因组甲基化DNA富集技术领域。另外,本发明还涉及标签技术,以及实现多个样品在同一反应体系中进行构建标签文库,特别是MeDIP-seq文库的方法。本发明的方法特别适用于第二代测序技术,尤其是solexa测序技术。
背景技术:
目前,基因组DNA甲基化是表观遗传学研究领域最为热点的方向之一,也正逐渐成为哺乳动物发育和癌症等多种疾病的表观遗传学标记。DNA甲基化不仅对染色质结构修饰,基因组稳定性具有重要作用,而且在真核生物中,DNA甲基化参与多种生物学过程,如胚胎发育,基因组印记,X染色体失活,基因表达的调节与沉默,逆转录转座子的沉默以及哺乳动物肿瘤等多种疾病的发生[1-2]。DNA甲基化生物标记不仅为多种疾病的早期诊断,而且对高危险个体的检测和评估提供了有利的工具。BS-seq(重亚硫酸盐处理测序),MeDIP-seq (抗体甲基化DNA免疫富集测序), MBD-seq (甲基化特异结合蛋白富集甲基化DNA测序和RRBS (全基因组代表性甲基化测序) 等是目前研究基因组甲基化较为流行的测序方法,但是它们不同程度上受到成本、通量和分辨率的限制BS-seq是CpG甲基化分析最常用的方法,可以提供单碱基分辨率的甲基化信息,但需要全基因组经重亚硫酸盐(bisulfite)处理之后结合测序研究,因此数据量庞大,测序及分析成本高[5—]。MeDIP-seq、MBD-seq和RRBS分别在不同程度上选择性的减少了测序的样本量。RRBS只能覆盖基因组约10-20%的区域,且主要是基因组的CpG岛和小部分启动子区域,很难在整体水平反应基因组甲基化特征[7_8]。MBD-seq和MeDIP-seq 分别利用甲基化特异结合蛋白(MBD2)和甲基化特异结合抗体(5mc抗体)与甲基化DNA结合起到富集的作用。MBD-seq主要富集高CpG区域的高甲基化DNA。MeDIP-seq主要富集高甲基化,适度CpG密度的区域。已知的BS-seq结果显示,大部分高甲基化的调节区域为较低的CpG密度,因此,MeDIP-seq更适合这种特征的分析[3]。此外,5mC抗体不具有CpG位点的特异性,因此对非CpG位点的胞嘧啶甲基化特征的分析具有重要的意义 ]。目前,已有MeDIP-seq技术主要缺陷是操作步骤繁琐不易对大规模样本进行研究。现有方法都是将单个样品单独进行免疫反应然后对富集得到的DNA结合高通量测序研究,这种方法使得对大样本量处理时在时间、人力和资金上的花费极其巨大,可行性大打折扣。
发明内容
本发明在已有基于高通量测序的MeDIP-seq技术的基础上创新性的开发了一种可以进行大规模MeDIP-seq文库构建和同时多样本混合高通量测序的技术。与已有方法比较主要优点是可以将多个样本混合后同时进行DNA与抗体免疫反应(IP反应)。对获得的多个样本的混合文库可以同时进行高通量测序,对测序获得的数据通过各自标签(也称为^如》序列进行区分从而分别进行高通量分析。该发明方法大大节省了样本准备时间及试剂用量,使得高效、低成本的MeDIP-seq样品准备成为现实,使得大样本量的临床样本的MeDIP-seq群体研究成为可能。在本发明一个方面,提供了大规模的甲基化MeDIP-seq文库构建和同时多样本混合高通量测序的方法,所述方法包括步骤一样品DNA片段化起始目的研究材料可以为任意物种的基因组DNA,片段化常用的方法包括雾化、超声片段化、HydroShear或酶切处理,将基因组DNA打断为大小200_400bp的片段。上述众多常用方法中优选地采用超声片段化法。步骤二 DNA片段末端修复及3,连接“A”碱基打断后的片段化DNA在T4DNA聚合酶、Klenow片段和T4多聚核苷酸激酶等酶的作用下,进行末端修复,形成平末端的DNA随机片段,然后在Klenow (3’ -5’ exo-)酶的作用下,在平末端化的DNA的3’末端连接“A”碱基。步骤三标签接头(也称为hdex adapter)的连接及实时定量PCR (也称为Q-PCR)
定量在T4DNA连接酶的作用下,将末端连接“A”碱基的DNA在末端分别连接上不同的标签接头(表1)。连接产物采用实时定量PCR(Q-PCR)进行浓度检测,确定各个样品的有效浓度。所述实时定量PCR是本领域技术人员已知的方法。步骤四样品混合,定量及免疫反应取含等量的连接有标签接头的DNA产物(样品个数可根据实验确定),进行等量混合,最终总量控制在1. 5-2μ g。如果3种样品混合,则每种样品所取的量为含有约为0. 5μ g 的基因组DNA的量,如果6种样品混合,则每种样品所取的量为含有约为0. 3μ g的基因组 DNA的量。混合后的样品中可加入外源的甲基化的阳性对照和未甲基化的阴性对照作为对照确定捕获效率。混合样品进行高温或NaOH变性后加入抗体进行免疫反应(IP)。步骤五捕获DNA进行Q-PCR检测免疫反应(IP)捕获后的DNA纯化后进行Q-PCR检测富集效率,根据原混合样品和捕获DNA的Ct值检测抗体对甲基化DNA捕获效率β]。步骤六PCR扩增和文库大小选择对IP捕获纯化后的DNA进行低循环PCR扩增,扩增后产物即MeDIP-seq多样品混合测序文库,对所述PCR扩增产物采用2%琼脂糖凝胶电泳进行切胶回收选择目的片段。回收的目的片段即为高通量测序文库。本发明还提供上述MeDIP-seq文库用于同时多样本混合高通量测序的用途,所述测序可通过任何测序方法进行,包括但不限于双脱氧链终止法,优选高通量测序方法包括但不限于第二代测序技术或者是单分子测序技术。所述第二代测序技术包括但不限于S0LEXA、S0LID和妨4测序技术;所述单分子测序技术包括但不限于True Single Molecule DNAsequencing技术,the single molecule, real-time (SMRT. TM.)技术,以及纳米孔测序技术。本发明在已有基于高通量测序的MeDIP-seq技术的基础上创新性的开发了一种可以进行大规模MeDIP-seq文库构建和同时多样本混合高通量测序的技术。我们对加了标签接头的DNA片段采用实时定量PCR检测浓度,然后根据混合浓度将多个样本混合后同时进行DNA与抗体免疫反应(IP反应)。对捕获的含有多个样本的混合文库可以同时进行高通量测序,对测序获得的数据通过各自标签序列进行区分从而分别进行高通量分析。同时该方法经过QPCR定量可以确保不同样品进行均勻混合,因不同的样品在同一 IP条件下反应,确保了 IP反应对每种样品内的甲基化DNA片段进行有效的捕获效率相同,解决了不同样本间捕获效率差异。比较已有方法该该发明方法大大节省了样本准备时间及试剂用量, 使得高效、低成本的MeDIP-seq样品准备成为现实,使得大样本量的临床样本的MeDIP-seq 群体研究成为可能。本发明一方面提供了一组标签,所述标签包括或由如下组成选自表1中标签的至少5个,或至少10个,或至少15个,或全部20个,所述标签优选地至少包括表1所示的20个标签的DNA index-l-DNA index-5, 或 DNA index-6-DNA index-10,或 DNA index-1I-DNA index-15,或 DNA index-16-DNA index-20,或者他们任何两个或多个的组合。在本发明的一个具体实施方式
中,提供了所述的标签用于构建MeDIP-seq文库的用途。在本发明的一个具体实施方式
中,提供了通过所述的标签构建的MeDIP-seq文库。本发明另一方面提供了含有上文所述的标签的一组标签接头,其中标签接头包含所述的标签,并且优选地同时用作5’和3’接头,所述一组所述标签接头包括或由如下组成选自表1中标签接头的至少5个,或至少10个,或至少15个,或全部20个;所述标签接头优选地至少包括表1所示的20个标签接头中的DNAindex-IF/ R_adapter-DNA index-5F/R_adapter,或 DNAindex-6F/R_adapter_DNA index_10F/R_ adapter,或 DNAindex-llF/R_adapter_DNA index-15F/R_adapter,或 DNAindex_16F/R_ adapter-DNA index_20F/R_adapter,或者他们任何两个或多个的组合。在本发明的一个具体实施方式
中,提供了所述的标签接头用于构建MeDIP-seq文库的用途,优选地所述标签接头同时用作MeDIP-seq文库的5’和3’接头。在本发明的一个具体实施方式
中,提供了通过上文所述的标签接头构建的 MeDIP-seq 文库。本发明另一方面提供了一种MeDIP-seq文库构建的方法,所述方法包括
步骤一样品DNA片段化起始目的研究材料可以为任意物种,包括各种植物、动物、微生物,例如人,植物, 昆虫,特别是哺乳动物包括人、小鼠的基因组DNA,片段化的方法包括雾化、超声片段化、 HydroShear或酶切处理,从而将基因组DNA打断为大小优选为200_400bp的片段;其中片段化方法中优选地采用超声片段化法;步骤二 DNA片段末端修复及3’端连接“A”碱基打断后的片段化DNA在包括但不限于T4 DNA聚合酶、Klenow片段和T4多聚核苷酸激酶等酶的作用下,进行末端修复,形成平末端的DNA随机片段,然后在包括但不限于 Klenow(3' -5’ exo-)酶的作用下,在平末端化的DNA随机片段的3’末端连接“A”碱基;步骤三标签接头的连接及定量
在包括但不限于T4DNA连接酶的作用下,将末端连接“A”碱基的DNA随机片段末端连接不同的标签接头,优选地所述DNA随机片段5’和3’端同时连接所述标签接头;然后对连接产物采用包括但不限于实时定量PCR进行浓度检测,确定各个样品的有效浓度;步骤四样品混合,定量及免疫反应取含等量的连接有不同标签接头的连接产物,进行等量混合,总量控制在1-3 μ g, 优选1. 5-2 yg ;混合后的样品中优选地加入外源的甲基化的阳性对照和未甲基化的阴性对照作为对照确定捕获效率;然后混合样品进行高温或NaOH变性后加入甲基化特异结合抗体,优选地是5mc抗体进行免疫反应(IP);外源的甲基化的阳性对照是指一段已知序列(如200_300bp的一段DNA序列),当中的含有的CG位点是确定的(如5个CG位点),阳性对照这些位点都是甲基化的(预先用甲基化转移酶处理),未甲基化的阴性对照的这些位点都是未甲基化的,所以抗体会富集甲基化的而不富集未甲基化的。因为这200-300的片段都是设计好引物的,所以可以有此根据QPCR检测富集的效果。阳性对照和阴性对照是本领域技术人员已熟知的技术;任选地,步骤五捕获DNA进行Q-PCR检测免疫反应(IP)捕获后的DNA纯化后进行Q-PCR检测富集效率,根据原混合样品和捕获DNA的Ct值检测抗体对甲基化DNA捕获效率;步骤六PCR扩增和文库大小选择对IP捕获纯化后的DNA进行优选的8_10个循环的低循环PCR扩增,扩增后产物即MeDIP-seq多样品混合测序文库,对所述PCR扩增产物优选地采用2%琼脂糖凝胶电泳进行切胶回收选择片段大小;将目的条带切下纯化后,即为待测序的MeDIP-seq文库;PCR扩增优选地使用热启动taq酶。在本发明的一个具体实施方式
中,所述的方法中所述标签接头是上文所述的标签接头。在本发明的一个具体实施方式
中,提供了通过所述的方法构建的MeDIP-seq文库。本发明另一方面进一步提供了通过本发明的方法构建的MeDIP-seq文库用于同时多样本混合高通量测序的用途,其中包括 Μ^使用所述测序文库进行高通量测序,所述测序可通过任何测序方法进行, 包括但不限于双脱氧链终止法,优选高通量测序方法包括但不限于第二代测序技术或者是单分子测序技术。在本发明的一个具体实施方式
中,所述第二代测序技术(MetzkerML. kquencing technologies—the next generation. Nat Rev Genet. 2010 Jan ;11 (1) :31-46)
限于SOLEXA、SOLID和454(焦磷酸测序)测序技术(平台);所述单分子测序技术(单分子测序平台)包括但不限于Helicos公司的True Single Molecule DNA sequencing技术,Pacific Biosciences 公司的 the single molecule,real-time (SMRT. TM.)技术,以及 Oxford Nanopore ^Technologies 公司的纳米孔测序技术等(Rusk,Nicole (2009-04-01). CheapThird-Generation Sequencing. Nature Methods 6(4) :244-245)。
图1 :MeDIP多样本大规模建库基本流程。图2 样品间富集片段的相关性分析,根据对不同区域片段的富集情况比较2个样品覆盖的区域是否一致。
具体实施例方式下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。使用此发明方法,我们以6个人外周血基因组DNA(各2yg)样品起始构建了 1个混合6个样品的混合文库。采用TA clone检测了文库的质量,然后进行了高通量测序比较分析。1、实验部分主要实验仪器列表
权利要求
1.一组标签,所述标签包括或由如下组成选自表1中标签的至少5个,或至少10个, 或至少15个,或全部20个,所述标签优选地至少包括表1所示的20个标签的DNA index-l-DNA index-5,或DNA index-6-DNA index-10,或DNA index-1I-DNA index-15,或DNA index-16-DNA index-20, 或者他们任何两个或多个的组合。
2.权利要求1所述的标签用于构建MeDIP-seq文库的用途。
3.通过权利要求1所述的标签构建的MeDIP-seq文库。
4.含有权利要求1所述的标签的一组标签接头,其中标签接头包含权利要求1所述的标签,并且优选地同时用作5’和3’接头,所述一组所述标签接头包括或由如下组成选自表1中标签接头的至少5个,或至少10个,或至少15个,或全部20个;所述标签接头优选地至少包括表1所示的20个标签接头中的DNAindeX-lF/R_ adapter-DNA index-5F/R_adapter, g DNAindex-6F/R_adapter-DNA index-10F/R_ adapter,或 DNAindex-llF/R_adapter_DNA index-15F/R_adapter,或 DNAindex_16F/R_ adapter-DNA index_20F/R_adapter,或者他们任何两个或多个的组合。
5.权利要求4所述的标签接头用于构建MeDIP-seq文库的用途,优选地所述标签接头同时用作MeDIP-seq文库的5’和3’接头。
6.通过权利要求4或5所述的标签接头构建的MeDIP-seq文库。
7.一种MeDIP-seq文库构建的方法,所述方法包括步骤一样品DNA片段化起始目的研究材料可以为任意物种,包括各种植物、动物、微生物,例如人,植物,昆虫,特别是哺乳动物包括人、小鼠的基因组DNA,片段化的方法包括雾化、超声片段化、 HydroShear或酶切处理,从而将基因组DNA打断为大小优选为200_400bp的片段;其中片段化方法中优选地采用超声片段化法;步骤二 DNA片段末端修复及3’端连接“A”碱基打断后的片段化DNA在包括但不限于T4DNA聚合酶、Klenow片段和T4多聚核苷酸激酶等酶的作用下,进行末端修复,形成平末端的DNA随机片段,然后在包括但不限于 Klenow(3' -5’ exo-)酶的作用下,在平末端化的DNA随机片段的3’末端连接“A”碱基;步骤三标签接头的连接及定量在包括但不限于T4 DNA连接酶的作用下,将末端连接“A”碱基的DNA随机片段末端连接不同的标签接头,优选地所述DNA随机片段5’和3’端同时连接所述标签接头;然后对连接产物采用包括但不限于实时定量PCR进行浓度检测,确定各个样品的有效浓度;步骤四样品混合,定量及免疫反应取含等量的连接有不同标签接头的连接产物,进行等量混合,总量控制在1-3 μ g,优选 1. 5-2 yg ;混合后的样品中优选地加入外源的甲基化的阳性对照和未甲基化的阴性对照作为对照确定捕获效率;然后混合样品进行高温或NaOH变性后加入甲基化特异结合抗体,优选地是5mc抗体进行免疫反应(IP);步骤五PCR扩增和文库大小选择对IP捕获纯化后的DNA进行优选的8-10个循环的低循环PCR扩增,扩增后产物即 MeDIP-seq多样品混合测序文库,对所述PCR扩增产物优选地采用2 %琼脂糖凝胶电泳进行切胶回收选择片段大小;将目的条带切下纯化后,即为待测序的MeDIP-seq文库;PCR扩增优选地使用热启动taq酶。
8.权利要求7所沭的方法,所沭方法在步骤五之前还讲一步包括如下步骤:捕获DNA进行Q-PCR检测免疫反应(IP)捕获后的DNA纯化后进行Q-PCR检测富集效率,根据原混合样品和捕获 DNA的Ct值检测抗体对甲基化DNA捕获效率。
9.权利要求7或8所述的方法,其中所述标签接头是权利要求4所述的标签接头。
10.通过权利要求7或8所述的方法构建的MeDIP-seq文库。
11.权利要求10所述的MeDIP-seq文库用于同时多样本混合高通量测序的用途,其中包括使用所述测序文库进行高通量测序,所述测序可通过任何测序方法进行,包括但不限于双脱氧链终止法,优选高通量测序方法包括但不限于第二代测序技术或者是单分子测序技术。
12.权利要求11所述的用途,其中所述第二代测序技术包括但不限于S0LEXA、S0LID和妨4测序技术;所述单分子测序技术包括但不限于True Single Molecule DNA sequencing 技术,the singlemolecule,real-time (SMRT. TM.)技术,以及纳米孔测序技术。
全文摘要
本发明提供一种可以进行大规模MeDIP-seq文库构建和同时多样本混合高通量测序的技术。本发明提供的方法对获得的多个样本的混合文库可以同时进行高通量测序,对测序获得的数据通过各自标签(也称为Index)序列进行区分从而分别进行高通量分析。
文档编号C12Q1/68GK102409042SQ20101029924
公开日2012年4月11日 申请日期2010年9月21日 优先权日2010年9月21日
发明者孙继华, 王君文, 章文蔚, 罗慧娟, 闫淑静 申请人:深圳华大基因研究院, 深圳华大基因科技有限公司