专利名称:一种高通量全基因组dna甲基化检测技术的利记博彩app
技术领域:
本发明属于DNA甲基化检测技术领域,具体涉及一种高通量全基因组DNA甲基化检测技术。
背景技术:
:DNA甲基化(DNA methylation)是真核生物基因组DNA的一种重要的表观遗传学修饰,即在DNA甲基化转移酶(DNA methyltransferase, DNMT)的作用下,将S-腺苷甲硫氨酸(SAM)的甲基集团共价结合到DNA分子的胞嘧啶上形成5-甲基胞嘧啶(5-mC)的过程。DNA甲基化在维持高等生物正常细胞功能、遗传印记、胚胎发育、衰老以及人类肿瘤的发生等生物学过程中起着重要作用。在无脊椎动物中,基因组DNA甲基化通过调控基因的表达模式,参与调节机体对环境的适应过程。因此,获得全基因组范围内所有胞嘧啶位点的甲基化数据,对于表观遗传学的时空特异性研究具有重要意义。随着甲基化研究的不断深入,已经有多种甲基化分析方法以满足不同甲基化研究的需要。在针对全基因范围DNA甲基化的研究中,检测的手段主要是基于芯片平台的全基因组甲基化位点的筛选和基于高通量测序平台的甲基化图谱分析。其中芯片技术在模式生物的甲基化研究中是相对完善成熟的检测工具,具有高覆盖度、方便快捷,性价比高等特点,如11 Iumina推出的人类全基因组甲基化芯片Human Methylation HD 450包含45万个CpG位点,能够覆盖所有NCBI注释的基因。操作流程简单,能够进行高通量甲基化位点的准确检测。但针对遗传信息相对匮乏的非模式生物,其芯片造价昂贵,甲基化位点选择的灵活性不高,因而难以利用现有芯片平台对非模式生物进行高通量全基因组甲基化的研究。随着新一代测序技术通量不断提高和成本的降低,目前有很多基于二代测序平台的全基因组甲基化检测方法以得到应用,包括有全基因组重亚硫酸盐测序(wholegenome bisulfite sequencing, BS-seq)和简化的表达重亚硫酸盐测序(reducedrepresentation bisulfite sequencing, RRBS)、甲基化 DNA 免疫共沉淀测序(methylated DNA immunoprecipitation sequencing, MeDIP-seq)、甲基化 DNA 富集结合高通量测序(methylated DNA binding domain sequencing, MBD-Seq)和甲基化敏感性限制酶测序(methyIation-sensitive Restriction Enzyme sequencing, MRE-seq)等。这些技术都有其优缺点和适用范围,如基于亚硫氢酸盐处理的DNA甲基化检测方法,尽管作为DNA甲基化检测的金标准,但操作复杂(重亚硫氢酸盐处理),测序所需的成本较高,不适用于贝类等基因组较大的物种。MeDIP-Seq是对特异性抗体富集的基因组上的甲基化区域进行高通量测序从而获得全基因组范围的甲基化位点。但该技术需要大量DNA,并且抗体的价格昂贵
发明内容
本发明的目的在于提供一种高通量全基因组DNA甲基化检测方法,即一种适用于非模式生物的,低成本、简单快速的高通量全基因组甲基化检测方法,以弥补现有技术的不足。本发明的全基因组DNA甲基化检测方法,包括如下的步骤:I)将基因组DNA用内切酶FspEI酶进行酶切,获得酶切片段;2)将酶切片段的两端分别连接上接头,作为扩增引物的结合点;3)将连接上接头的酶切片段用引物进行第一轮PCR扩增,从而富集接头连接正确的酶切片段;4 )将第一轮PCR扩增产物经凝胶纯化后用弓I物进行第二轮PCR扩增,引入Barcode来构建测序文库;5)测序文库进行测序;将测序数据进行分析得到全基因组甲基化信息。其中,步骤2)中的接头,为接头slxl和slx2,其中构成slxl的两个核苷酸片段,其序列分别为 5 ' -ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3 ' (SEQ ID NO:1)和3' -CGAGAAGGCTAGANNNNN-5' (SEQ ID NO: 2),其中 N 为碱基 A、T、G、C 中的任一个;构成slx2的两个核苷酸片段,其序列分别为Y -GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3' (SEQ ID NO:3)和 3' -CGAGAAGGCTAGANNNNN-5' (SEQID N0:2)。所述的步骤3)中的引物,为Slx-Primer I和Slx-Primer 2,其核苷酸序列分别为:Slx-Primerl:5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC-3,(SEQ ID N0:4);Slx-Primer 2:5’-GTGACTGGAGTTCAGACGTGT-3, (SEQ ID NO:5);所述的步骤4)中的引物为Slx-Primer I和Slx-1ndex Primer,其核苷酸序列分别为:Slx-Primerl:5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC-3,(SEQ ID N0:4);Six-1ndex Primer:5’-CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGT-3’ (SEQ IDNO:6);其中N为碱基A、T、G、C中的任一个。本方法可以实现甲基化修饰位点的准确定位,通过酶切富集基因组甲基化位点,直接对甲基化标签序列进行测序和定量,可以有效降低测序费用。实验流程仅需两天,具有通量高、操作简便、成本低廉、可靠性好等优点,是一种优良的适用于非模式生物的高通量全基因组甲基化检测方法。
图1:本发明的全基因组甲基化检测方法的流程及原理示意图。
具体实施方式
:本发明开发了基于高通量测序平台的新型全基因组甲基化检测分析技术 MethylRAD-Seq (MethyIation-dependent restriction-site associated DNAsequencing),结合甲基修饰依赖性内切酶和高通量测序的特点,在不需要基因组背景信息的前提下可以大规模发掘全基因组范围内的甲基化位点,直接精确检测发生甲基化的胞嘧啶位点。该技术的原理主要是利用甲基化修饰依赖性限制性酶FspEI对基因组DNA进行酶切,基因组中CG或CHG位点上的甲基化修饰均可以被FspEI识别,酶切后产生具有核心甲基化位点的等长标签,对标签文库进行高通量测序技术能够获得全基因组范围内的甲基化位点序列信息。建库流程简便快速,可同时对多个样本进行全基因组DNA甲基化分析。而且,本发明所用的接头和引物可以高效的对基因组DNA进行操作,提高了效率。本发明的方法对于表观遗传学背景相对较少的非模式生物是一种成本较低、操作简便的高通量全基因组甲基化分析方法。对于本发明中所涉及的名词,定义如下:1、内切酶,又称为核酸内切酶(endonuclease)在核酸水解酶中,为可水解分子链内部磷酸二酯键生成寡核苷酸的酶;本发明所用到的FspEI内切酶是一种甲基化修饰依赖性内切酶,依赖于胞嘧啶位点的甲基化修饰从而对DNA分子产生切割作用。该酶购自NEB(New England Biolabs)有限公司。2、接头:adaptor DNA,是一段短的含酶切位点并能与钝性末端或粘性末端匹配的人工合成DNA片段,接头DNA常用于一钝性末端DNA与一粘性末端DNA的连接。有时连接到粘性末端的接头DNA是为了给未知DNA片段提供一段已知的序列,根据其设计引物,扩增未知的DNA片段。3、其中N为碱基A、T、G、C中的任一个;其中A、T、G、C代表组成DNA分子的四种
脱氧核苷。4、Barcode即一 段短的特征序列,对多个样本同时进行高通量测序时,对每条reads上带有的一段特定短序列(即barcode)测序能够准确识别样本来源。本发明的方法,包括有如下的步骤:I)制备生物基因组DNA:提取生物的基因组DNA,4°C冰箱保存备用。将提取的基因组DNA利用甲基化修饰依赖性内切酶FspEI酶切基因组,获得全基因组范围内的甲基化标签,其中酶切体系为20μ1,包含300ng基因组DNA,4U的FspEI内切酶(ΝΕΒ),ΙΧΝΕ Buffer4, IXEnzyme Activator Solution, I XBSA, 37°C 保温 4 小时。2)设计有粘性末端的接头,连接标签酶切反应产生的标签5'末端都带有一个4碱基突出,设计3’端带4个兼并碱基的接头Six-Adaptor I, Slx-Adaptor 2,连接反应体系为20μ1,包含ΙΟμΙ上步的酶切产物,800U Τ4 DNA连接酶(NEB), 1ΧΤ4 Ligase Buffer, 4μΜ SIex-Adl, 4μΜ Slx_Ad2,20mM三磷酸腺苷ATP, 4°C连接16h。其中接头的序列信息见表I。3)进行第一轮PCR扩增,富集标签,其中PCR反应体系为20μ ,包含7μ1连接了接头的酶切片段作为反应模板,4μΜ Slx-Primerl引物(5,- AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC -3,),4μΜSlx-Primer2 引物(5,- GTGACTGGAGTTCAGACGTGT -3’),0.3mM dNTPs, 0.4U Phusion 超保真DNA聚合酶(NEB),1X HF buffer ;反应条件为98°C变性5 s,60°C退火20 s,72°C延伸10 S,进行14-18个循环,最后72°C延伸5min。PCR产物用8%非变性聚丙烯酰胺琼凝胶电泳检测,扩增产物大小约为120bp,切胶回收PCR产物。
4) Barcode特异性引物二轮PCR扩增为了实现多个个体混合测序进行甲基化检测,可以通过对每个个体添加不同的Barcode来区分,利用PCR反应的不同引物引入不同的Barcode。PCR反应体系为20μ ,包含 25ng—轮 PCR 扩增纯化产物,4μΜ Slx-Primerl 引物 5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC -3’ ,4MM Six-1ndex Primer 引物:5’ - CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGT-3’,其中 NNNNNN可根据不同的Barcode序列改变),0.3mM dNTPs, 0.4U Phusion超保真DNA聚合酶(ΝΕΒ),ΙΧ HF buffer ;反应条件为 98°C变性 5 s,60°C退火 20 s,72°C延伸 10 S,进行 5-7个循环,最后72°C延伸5min。平行扩增3管,PCR产物用8%非变性聚丙烯酰胺凝胶电泳检测,扩增产物大小约为150bp,利用QIAGEN PCR产物纯化试剂盒回收纯化PCR产物。利用Solexa Hiseq2000测序平台测序,此部分由测序公司完成。5)数据分析:本实施例采用的方法如下:1、Illunima/Solexa测序产生的结果文件为fastq格式,首先利用SolexaQA软件包对原始序列进行质量过滤,去除含有N的序列以及大于5个碱基的质量值小于10的reads ;2、利用CD-HIT软件对短序列进行聚类分析,获得测序文库中的甲基化标签种类以及该代表标签的丰度信息,甲基化位点的覆盖reads数目可以衡量该位点的甲基化水平; 3、利用SOAP软件将甲基化位点的序列比对基因组参考序列,可以获得该位点的基因组来源信息。表I本发明中涉及的接头及引物序列表
接头及引物名称接头及引物序列
Six-Adaptor I5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'
3 ' -CGAGAAGGCTAGANNNNN- 5 Six-Adaptor 25'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'
3'-CGAGAAGGCTAGANNNNN-5r
Slx-Priraer I5 '-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAd
Slx-Primer 25'-GTGACTGGAGTTCAGACGTGT-3,
Six-1ndex Primer 5'-CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACcT^T 3下面以虾夷扇贝为例通过实施例详细叙述本发明,对于本发明所用的试剂,本领域的技术人员可以根据本发明的技术方案,在现有试剂中进行选择,而不仅限于本发明具体实施例的限制。I)提取扇贝基因组DNA取II龄野生群体的虾夷扇贝和海大金贝各12只,每个个体闭壳肌约0.1克,加入500ulSTE 裂解缓冲液(NaCl:1OOmM ;EDTA:lmM, ρΗ=8.0 ;Tris-HCl, IOnM, pH=8.0),剪碎,再加入50μ1 10%的SDS,以及5μ1蛋白酶K (20mg/ml), 56°C水浴消化,至组织碎块完全裂解,裂解液澄清。加入等体积饱和酚(250μ1)以及氯仿/异戊醇(24:1) (250μ1),抽提3次,取上清液,加入等体积氯仿/异戊醇(24:1) (500ul)抽提I次,取上清液,加入1/10体积NaAc (3M,pH 5.2) (50μ1)和2倍体积_20°C保存无水乙醇(ΙΟΟΟμΙ ),缓慢摇匀;_20°C沉淀30min.12000rpm离心IOmin,核酸将沉淀于管底。70%乙醇(ΙΟΟΟμΙ)洗漆沉淀并干燥至乙醇全部挥发,加入ΙΟΟμΙ无菌水以及少量(l-2Pl)RNase A,4°C冰箱保存备用。扇贝基因组DNA的消化利用甲基化修饰依赖性内切酶FspEI酶切基因组,获得全基因组范围内的甲基化标签:酶切体系为20μ1,包含300ng基因组DNA,4U的FspEI内切酶(NEB) , I XNEBuffer4, I XEnzyme Activator Solution, I XBSA, 37°C保温 4 小时。2)将酶切片段的两端分别连接上接头,作为扩增引物的结合点酶切反应产生的标签5'末端都带有一个4碱基突出,设计3’端带4个兼并碱基的接头Slx-Adl,Slx-Ad2,连接反应体系为20ul,包含IOul上步的酶切产物,800U T4DNA 连接酶(NEB),I X T4 Ligase Buffer, 4uM Adaptor I, 4uM Adaptor 2,20mM 三憐酸腺苷 ATP,4°C连接 16h。3)将连接上接头的酶切片段用引物进行第一轮PCR扩增,从而富集接头连接正确的酶切片段;PCR反应体系为20μ ,包含7ul反应模板,4μΜ Slx-Primerl引物(5,- AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC -3,),4μΜ Slx-Primer2 引物(5,-GTGACTGGAGTTCAGACGTGT -3’),0.3mM dNTPs, 0.4U Phusion 超保真 DNA 聚合酶(NEB),IX HF buffer ;反应条件为98°C变性5 s,60°C退火20 s,72°C延伸10 S,进行14-18个循环,最后72°C延伸5min。PCR产物用8%非`变性聚丙烯酰胺琼凝胶电泳检测,扩增产物大小约为120bp,切胶回收PCR产物。4)将第一轮PCR扩增产物用引物进行第二轮PCR扩增,引入Barcode来构建测序文库;为了实现多个个体混合测序进行甲基化检测,可以通过对每个个体添加不同的Barcode来区分,利用PCR反应的不同引物引入不同的Barcode。PCR反应体系为20uL,包含 25ng—轮 PCR 扩增纯化产物,4μΜ Slx-Primerl 引物 5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC -3,,4μΜ Six-1ndex Primer 引物5,- CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGT-3,,其中 NNNNNN可根据不同的Barcode序列改变,24只奸夷扇贝甲基化文库使用的Six-1ndex Primer引物序列如表2所不,0.3mM dNTPs, 0.4U Phusion 超保真 DNA 聚合酶(ΝΕΒ),ΙΧ HF buffer ;反应条件为98°C变性5 s,60°C退火20 s,72°C延伸10 S,进行5_7个循环,最后72°C延伸5min。平行扩增3管,PCR产物用8%非变性聚丙烯酰胺凝胶电泳检测,扩增产物大小约为150bp,利用QIAGEN PCR产物纯化试剂盒回收纯化PCR产物。利用Solexa Hiseq2000测序平台测序,此部分由测序公司完成。表2本发明中涉及的Six-1ndex Primer引物序列表
权利要求
1.一种全基因组DNA甲基化检测方法,包括如下的步骤: 1)将基因组DNA用内切酶FspEI酶进行酶切,获得酶切片段; 2)将酶切片段的两端分别连接上接头,作为扩增引物的结合点; 3)将连接上接头的酶切片段用引物进行第一轮PCR扩增,从而富集接头连接正确的酶切片段; 4)将第一轮PCR扩增产物经凝胶纯化后用引物进行第二轮PCR扩增,引入Barcode来构建测序文库; 5)测序文库进行测序;将测序数据进行分析得到全基因组甲基化信息。
2.如权利要求1所述的方法,其特征在于所述的步骤2)中的接头,为接头slxl和slx2,其中构成slxl的两个核苷酸片段,其序列分别为SEQ ID NO:1和SEQ ID NO: 2 ; 构成slx2的两个核苷酸片段,其序列分别为SEQ ID N0:3和SEQ ID N0:2。
3.如权利要求1所述的方法,其特征在于所述的步骤3)中的引物的核苷酸序列分别为SEQ ID NO:4 和 SEQ ID NO:5。
4.如权利要求1所述的方法,其特征在于所述的步骤4)中的引物的核苷酸序列分别为SEQ ID NO:4 和 SEQ ID NO:6。
全文摘要
本发明的目的在于提供一种高通量全基因组DNA甲基化检测方法,用甲基化修饰依赖性限制性酶FspEI对基因组DNA进行酶切,基因组中CG 或 CHG 位点上的甲基化修饰均可以被 FspEI 识别,酶切后产生具有核心甲基化位点的等长标签,对标签文库进行高通量测序技术能够获得全基因组范围内的甲基化位点序列信息。本方法可以实现甲基化修饰位点的准确定位,通过酶切富集基因组甲基化位点,直接对甲基化标签序列进行测序和定量,可以有效降低测序费用。实验流程仅需两天,具有通量高、操作简便、成本低廉、可靠性好等优点,是一种优良的适用于非模式生物的高通量全基因组甲基化检测方法。
文档编号C12Q1/68GK103233072SQ20131016308
公开日2013年8月7日 申请日期2013年5月6日 优先权日2013年5月6日
发明者王师, 吕佳, 包振民, 张玲玲, 胡晓丽, 陆维 申请人:中国海洋大学