高通量低成本Fosmid文库构建的方法及其所使用标签和标签接头的利记博彩app

文档序号:586212阅读:209来源:国知局
专利名称:高通量低成本Fosmid文库构建的方法及其所使用标签和标签接头的利记博彩app
技术领域
本发明涉及核酸测序技术领域,特别是高通量低成本R)smid文库构建技术领域。 另外,本发明还涉及标签技术,以及实现多个样品在同一反应体系中进行构建标签文库的方法。本发明的方法特别适用于第二代测序技术,尤其是solexa测序技术。
背景技术
DNA测序技术自发明以来就一直在推动分子生物学发展方面起着至关重要的作用 [1]。在过去的30年中,作为最重要的生物医学研究手段之一,DNA测序技术的数据产出能力呈指数增长 。从早期Frederick Sanger的手工测序,以及基于Sanger法开发的第1代自动化测序仪,到目前的下一代测序平台,这一领域已经发生了巨大的变化[2]。这种高速的发展,如从根本上改变了人们研究所有生命蓝图的方式,并且推动了基因组学及其分支乃至其他密切相关学科的创立与发展,诸如比较基因组学、生物信息学、系统生物学以及合成生物学[3].De nove测序也叫从头测序,不需要任何基因序列信息即可对某个物种进行测序。 用生物信息学的分析方法对测读序列进行拼接、组装,从而获得该物种的基因组序列图谱。 随着新一代测序技术的飞速发展,大大降低了基因组测序的成本和时间,为研究新物种全基因组序列提供了一个崭新的研究平台。由于集中化商业性多物种测序的大规模开展,使得我们迫切的需要降低测序成本,减少测序流程,提高劳动效率。这样也能更好的将测序这种方法应用到分析、疾病诊断以及个性化(个体化)医疗等新领域。要进行De nove测序,首先要先建基因组文库(genomic library)。基因组文库是指将某种生物的总DNA与载体以重组的形式转移到宿主细胞中,然后通过细胞增殖形成多个克隆的整体,当需要某一基因或片段时,可通过标记的探针筛选所在的克隆,并借助宿主的增殖,可以从文库中得到所需的任何片段,并进一步研究。在本专利中我们使用的载体是 Fosmid载体,是现在流行的构建文库的新载体。对于R)smid载体,基因组DNA合适的片段长度大约为401Λ。近年来,R)smid文库广泛应用于基因的图位克隆、物理图谱的构建和比较基因组研究中。基于DNA Sequncing with Index技术,不同的样品在建库过程中的某个或多个步骤中加入不同的标签(也称为hdex),就可以把多个样品混合在一起当做一个样品处理。 将以前的一个一个样品测序,减少到现在的多个样品混成一管测序。目前,Illumina公司的DNA测序平台的测序主要分为以下四个步骤1、文库制备; 2、用Illumina公司提供的Cluster Station对样品进行扩增;3、对成簇后的样品进行测序;4、数据处理和拼接。从测序的片段大小来分,基于Illumina公司的DNA测序平台的文库制备分为小片段DNA的文库制备和大片段DNA的文库制备。Fosmid文库属于小片段文库中的一种,小片段DNA的文库制备主要分为以下几个步骤M :1、打断DNA到一定的片段大小;2、末端修复,利用T4DNA聚合酶和Klenow聚合酶的3’到5’端外切酶活性除去3’突出端,利用酶的5’到3’端聚合作用,补齐5’突出端,使 DNA片段全部成为平末端,并采用 ~4ΡΝΚ(也称为"Γ4 Polynucleotide Kinase)将片段5,端磷酸化;3、利用无3’到5’外切活性的Klenow聚合酶(也称为Klenow exo-)在已修复的 DNA片段的3,端加上一个“A”碱基;4、接头为一段能与flowcell上接头杂交的DNA序列, DNA片段的3’端有一个“A”碱基突出,接头的一端为3’突出端(另一端为平末端),有一个“T”碱基可与DNA片段上的“A”碱基配对,用DNA连接酶将接头有方向性地加到DNA片段的两端;5、加了接头的DNA产物用琼脂糖凝胶电泳,切胶回收一定大小的片段,除去没加到DNA片段上的接头,以及其他不符合片段大小的DNA片段,纯化回收凝胶中的目的DNA ; 6、PCR中两种引物序列可与接头的序列配对,富集所有两端都加上接头的目的片段,并使 DNA文库中所有序列都能得到扩增,PCR产物经过纯化后,经Agilent Bioanalyzer 2100和 Q-PCR检测浓度及片段大小合格后上机测序。在IIlumina公司的DNA测序平台的文库构建方法M中,每一步后面都有一步纯化的步骤。这是因为在建库的每一个酶反应体系都不一样,不同的酶需要在不同的一定的离子和PH条件才能反应,纯化可以避免上一步的酶反应体系对下一步的酶反应体系造成影响。在上述传统的DNA文库制备流程中,1、2、3、4、5、6步骤后面都需要加上纯化的步骤。 纯化的步骤费力费时,而且纯化步骤越多,损失的DNA的就越多。

发明内容
基于目前Illumina公司的测序平台,针对R)smid文库本身片段小的特点,本发明将多个文库混合在一起当做一个文库处理,并且减少了纯化步骤,确立了新的I7Osmid文库制备流程。成功的构建了 i^osmid文库,并成功用于测序,节约建库时间,降低测序成本。illumina公司的solexa测序平台,每台Genome Analyzers IIx每次运行能产生最多可达50( 的数据,而我们新引进的illumina公司的HKeq 2000,每次运行更是能产生最多可达200( 的数据,而R)smid文库的大小一般在只有40k左右,这样就造成了好多个数量级的数据的浪费。针对这个问题,就需要将多个样品混在一起当做一个样品处理,既可以节约建文库的成本,也可以节约上机测序的成本。在DNA小片段制备流程中,我们在样品准备过程中,已经将30-40个插入了不同 DNA片段的R)smid质粒混在一起了。首先是打断DNA,末端修复,加“A”碱基,再加接头,片段选择,再进行PCR,琼脂糖凝胶电泳后切胶回收后就可以检测建库是否合格了。接头是一段能与flowcell上接头杂交的DNA序列,而在PCR中运用的两种引物是可以与接头的序列配对的序列。基于DNA Sequncing with Index技术,运用自主设计的标签,我们在文库构建过程中,加接头不再加入普通接头,而是加入标签接头(也称为index adapter),并且 PCR过程中使用标签引物,这样我们就对每个样品做上了两个标记。在文库构建过程中,在加接头时,加入N种不同的标签接头,在PCR时,也加入M种不同的标签引物,我们就可以把 NxM个样品混在一起了,然后测序。具体建库流程如下图2 在文库制备流程的中,每一个步骤后面都有一个纯化步骤,耗时耗力,限制了建库通量。我们希望在优化反应体系的基础上,减少纯化步骤,在确保建库成功率的条件下减少建库时间,达到降低成本的目的。通过分析我们采取的流程优化的方法就是在可能的条件下直接省略一些可以减少的纯化步骤。 这样做是否可行呢?
我们取打断到一定片段大小的8个DNA样品按照图3建库纯化,末端修复,纯化, 3’端加“A”碱基,加标签接头,8个样品混合在一起,片段选择,胶回收,PCR扩增,胶回收后, 最后经AgilentBioanalyzer 2100和Q-PCR检测,发现该文库的片度大小符合要求,浓度大于ljng/ul,即该文库合格。结果证明3’端加“A”碱基这个步骤后面的纯化是可以省略的。本发明基于目前illumina公司提供的Solexa DNA测序平台,在R)smid小片段建库方法的建立,将多个样品混在一起当做一个样品测序,并且减少了一些建库的步骤。在样品准备的过程中,30至40个插入了不同DNA片段的R)smid质粒混在一起了当成一个样品处理,在加接头和PCR过程中,运用DNA Sequncing with Index技术,在加接头和PCR两个步骤中都加入标签,每个样品上加入了两个标签,这样就可以将很多个样品混合在一起。通常我们加完标签接头后,将会将10至40个连接产物混合在一起,然后再使用标签引物进行 PCR,再将PCR产物8-20个混合在一起,这样就有效地利用了测序数据,大大提高了建库效率。这样我们实际上就是将这么高的测序通量也能够在一定程度上降低测序成本、提高科研工作的效率。本发明一方面提供了一组标签,所述标签包括或由如下组成选自表1中标签的至少5个,或至少10个,或至少15个,至少20个,或至少25个,或至少30个,至少35个, 或至少40个,或至少45个,或全部48个,所述标签优选地至少包括表1所示的48个标签中的DNA index-l-DNA index-5, 或 DNA index-6-DNA index-10,或 DNA index-1I-DNA index-15,或 DNA index-16-DNA index-20, DNA index-2I-DNA index-25,或 DNA index-26-DNA index-30,或 DNA index-3I-DNA index-35,或 DNA index-36-DNA index-40, DNA index-41-DNA index-45, 或DNA index-44-DNA index_48,或者他们任何两个或多个的组合。本发明进一步提供了上文所述的标签用于构建R)smid文库的用途,其中所述标签包含在用于i^osmid文库的标签接头中,优选地插入标签接头3’末端“T”碱基的上游。本发明进一步还提供了通过上文所述的标签构建的R)smid文库。本发明另一方面提供了含有上文所述的标签的一组标签接头,其中标签接头包含所述的标签,优选地所述标签插入所述标签接头3’末端“T”碱基的上游,并且所述标签接头优选地同时用作5’和3’接头,所述一组所述DNA标签接头包括或由如下组成选自表1 中标签接头的至少5个,或至少10个,或至少15个,至少20个,或至少25个,或至少30个, 至少35个,或至少40个,或至少45个,或全部48个,所述标签接头优选地至少包括表1所示的48个标签接头中的DNA index-lF/ R_adapter-DNA index-5F/R_adapter,或 DNA index-6F/R_adapter-DNA index_10F/R_ adapter,或 DNA index-11F/R_adapter-DNA index_15F/R_adapter,或 DNA index_16F/ R_adapter-DNA index_20F/R_adapter, DNA index-21F/R_adapter-DNA index_25F/R_ adapter,或 DNA index-26F/R_adapter_DNA index_30F/R_adapter,或 DNA index-31F/ R_adapter-DNA index_35F/R_adapter,或 DNA index-36F/R_adapter_DNA index_40F/ R_adapter, DNAindex-41F/R_adapter_DNA index-45F/R_adapter,或 DNA index_44F/R_ adapter-DNA index_48F/R_adapter,或者他们任何两个或多个的组合。本发明进一步提供了上文所述的标签接头用于构建R)smid文库的用途,优选地所述标签接头同时用作标签文库的5’和3’接头。本发明进一步还提供了通过上文所述的标签接头构建的R)smid文库。本发明另一方面提供了一组标签引物,所述标签引物包括或由如下组成选自表 2中标签接头的至少2个,或至少4个,或至少6个,至少8个,或至少10个,或至少12个, 或至少14个,或全部16个,至所述标签接头优选地至少包括表2所示的16个标签引物中的Index Primerl-Index Primer2,或 Index Primer3_Index Primer4,或 Index Primer5_Index Primer6,或 Index Primer7_Index Primer8,或 Index Primer9_Index PrimerlO,或 Index Primerll-Index Primerl2,或 Index Primerl3-Index Primerl4,或者他们任何两个或多个的组合。本发明进一步提供了上文所述的标签引物用于构建R)smid文库的用途。本发明进一步还提供了通过上文所述的标签引物构建的R)smid文库。本发明另一方面提供了一种R)smid文库构建的方法,所述方法包括步骤一样品DNA片段化其中所述片段化方法包括但不限于超声波打断法;步骤二 DNA片段末端修复及3’端连接“A”碱基其中优选地利用T4DNA聚合酶和Klenow聚合酶进行末端修复,并采用T4PNK将片段5’端磷酸化;利用包括但不限于Klenow聚合酶在已修复的DNA片段的3’端加上一个 “A”碱基;步骤三标签接头的连接其中,对不同的样品连接上不同的标签接头;步骤四回收纯化和PCR反应在PCR反应中使用标签引物,优选地将回收纯化的DNA分组混合在一起,不同的组使用不同的标签引物。在本发明的一个具体实施方式
中,所述的方法中,步骤三中所述标签接头是上文所述的标签接头。在本发明的一个具体实施方式
中,所述的方法中,步骤四所述标签引物是上文所述的标签引物。在本发明的一个具体实施方式
中,所述的方法中,步骤四所述PCR反应还使用引物Index PCR primerl. 0 5' AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTC CGATCT0本发明进一步还提供了通过所述的方法构建的R)smid文库。


图1:DNA建库流程。图2 =Fosmid建库原理图。图3 本发明的优化后的R)smid建库流程。图 4 样品经 Agilent Bioananayzer2100 的检测峰图
具体实施例方式下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。
权利要求
1.一组标签,所述标签包括或由如下组成选自表1中标签的至少5个,或至少10个, 或至少15个,至少20个,或至少25个,或至少30个,至少35个,或至少40个,或至少45 个,或全部48个,所述标签优选地至少包括表1所示的48个标签中的DNA index-l-DNA index_5,或DNA index-6-DNA index-10,或DNA index-1I-DNA index-15,或DNA index-16-DNA index-20, DNA index-2I-DNA index-25,或 DNA index-26-DNA index-30,或 DNA index-3I-DNA index-35,或 DNA index-36-DNA index-40, DNA index-41-DNA index-45,或 DNA index-44-DNA index_48,或者他们任何两个或多个的组合。
2.权利要求1所述的标签用于构建R)smid文库的用途,其中所述标签包含在用于 Fosmid文库的标签接头中,优选地插入标签接头3’末端“T”碱基的上游。
3.通过权利要求1所述的标签构建的R)smid文库。
4.含有权利要求1所述的标签的一组标签接头,其中标签接头包含权利要求1所述的标签,优选地所述标签插入所述标签接头3’末端“T”碱基的上游,并且所述标签接头优选地同时用作5’和3’接头,所述一组所述DNA标签接头包括或由如下组成选自表1中标签接头的至少5个,或至少10个,或至少15个,至少20个,或至少25个,或至少30个,至少 35个,或至少40个,或至少45个,或全部48个,所述标签接头优选地至少包括表1所示的48个标签接头中的DNA index-lF/R_ adapter-DNA index-5F/R_adapter, g DNA index-6F/R_adapter-DNA index-10F/R_ adapter,或 DNA index-11F/R_adapter-DNA index_15F/R_adapter,或 DNA index_16F/ R_adapter-DNA index_20F/R_adapter, DNA index-21F/R_adapter-DNA index_25F/R_ adapter,或 DNA index-26F/R_adapter_DNA index-30F/R_adapter,或 DNA index_31F/ R_adapter-DNA index_35F/R_adapter,或 DNA index-36F/R_adapter_DNA index_40F/R_ adapter, DNA index-41F/R_adapter_DNA index_45F/R_adapter,或 DNA index_44F/R_ adapter-DNA index_48F/R_adapter,或者他们任何两个或多个的组合。
5.权利要求4所述的标签接头用于构建R)smid文库的用途,优选地所述标签接头同时用作标签文库的5’和3’接头。
6.通过权利要求4或5所述的标签接头构建的R)smid文库。
7.—组标签引物,所述标签引物包括或由如下组成选自表2中标签接头的至少2个, 或至少4个,或至少6个,至少8个,或至少10个,或至少12个,或至少14个,或全部16个, 至所述标签接头优选地至少包括表2所示的16个标签引物中的hdex Primerl-Index Primer2,或 Index Primer3_Index Primer4,或 Index Primer5_Index Primer6,或 Index Primer7_Index Primer8,或 Index Primer9_Index PrimerlO,或 Index Primerll-Index 1^1^1~12,或hdex Primerl3-Index Primerl4,或者他们任何两个或多个的组合。
8.权利要求7所述的标签引物用于构建R)smid文库的用途。
9.通过权利要求7所述的标签引物构建的R)smid文库。
10.一种R)smid文库构建的方法,所述方法包括步骤一样品DNA片段化其中所述片段化方法包括但不限于超声波打断法;步骤二 DNA片段末端修复及3’端连接“A”碱基其中优选地利用T4DNA聚合酶和Klenow聚合酶进行末端修复,并采用T4PNK将片段5, 端磷酸化;利用包括但不限于Klenow聚合酶在已修复的DNA片段的3’端加上一个“A”碱基;步骤三标签接头的连接其中,对不同的样品连接上不同的标签接头; 步骤四回收纯化和PCR反应在PCR反应中使用标签引物,优选地将回收纯化的DNA分组混合在一起,不同的组使用不同的标签引物。
11.权利要求10所述的方法,其中步骤三中所述标签接头是权利要求4所述的标签接头。
12.权利要求10所述的方法,其中步骤四所述标签引物是权利要求7所述的标签引物。
13.权利要求10所述的方法,其中步骤四所述PCR反应还使用引物^idexPCR primerl. 0 5' AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT。
14.通过权利要求10-13中任一项所述的方法构建的R)smid文库。
全文摘要
基于目前Illumina公司的测序平台,针对Fosmid文库本身片段小的特点,本发明将多个文库混合在一起当做一个文库处理,并且减少了纯化步骤,确立了新的Fosmid文库制备流程。成功的构建了Fosmid文库,并成功用于测序,节约建库时间,降低测序成本。
文档编号C12N15/11GK102409043SQ20101029924
公开日2012年4月11日 申请日期2010年9月21日 优先权日2010年9月21日
发明者孔淑娟, 张俊青, 樊帆, 王博, 程玲, 胡帅星 申请人:深圳华大基因研究院, 深圳华大基因科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1