专利名称:用于通过转座酶的dna片段化和标记的方法和组合物的利记博彩app
技术领域:
本发明涉及分子生物学领域。更具体地,本发明涉及使用转座酶切割DNA分子并通过用感兴趣的预选择的序列标记分子来制备用于分析的切割的DNA分子的方法和组合物。尤其,本发明涉及核酸体外扩增、核酸测序和对感兴趣的序列进行DNA文库筛选的领域。
相关技术描述基因组DNA的片段化是在用于高通量测序的DNA样品制备中的关键步骤。传统使用的方法,例如使用DNase I的DNA片段化是非常不可靠的并通常导致DNA片段化不充分或者太昂贵。在任一情况中,有用尺寸(大约200-800个碱基对(bp))的DNA片段的产率都较低。该难点已通过使用寡核苷酸-转座酶复合体(例如来自Epicentre的NEXTERA 体系)控制DNA片段化来克服。此类复合体包含经修饰的Tn5转座酶的二聚物和含有19bp的转座酶-结合序列或反向重复序列(IR)的一对Tn-5结合双链DNA(dsDNA)寡核苷酸。在NEXTERA 体系中,使用了经工程改造的、非天然的19bp转座酶结合序列,其比天然Tn5IR序列提供了更有效的DNA片段化。该结合序列被称为“嵌合体”。不同于能靠单分子在靶标DNA中产生很多断裂的DNase,转座酶复合体被认为每个复合体仅产生一个DNA切割。因此,不同于使用DNaseI,DNA片段化的程度在转座酶片段化期间容易被控制。而且,与嵌合体序列结合的特异性核苷酸标记在该转座酶-介导的DNA片段化过程中可被附着,这对于PCR中的DNA扩增和将DNA片段附着至测序芯片是有用的。典型地,Mg(II)离子(本文中也称作Mg+2或Mg2+)被用作展示DNA片段化活性的酶的辅因子。这不是令人吃惊地,因为通过测验存在不同的金属离子时双螺旋DNA的融解温度,已确定对磷酸盐缔合的偏好被发现以Mg (I I) > Co (II) > Ni (II) > Mn (II) > Zn(II)> Cd(II) > Cu(II)的顺序减小。过渡金属复合体与多核苷酸的反应通常落在以下两类中(i)包括介导核酸氧化的金属复合体的氧化还原反应的那些反应;和(ii)包括使金属中心与糖-磷酸盐骨架配位以介导聚合物水解的那些反应。虽然Mg(II)是最强的结合剂,但未必是最优的辅因子。酶促DNA切割可被许多参数影响,特别是被依赖于与DNA结合的金属离子的性质的DNA构象影响。而且,具体的金属离子与酶本身的结合可影响蛋白构象、蛋白-蛋白相互作用(例如可能影响活性的蛋白二聚作用);和蛋白-核酸相互作用,即,调节反应速度和和DNA切割特异性。迄今为止,已知适于DNA片段化和标记的仅有的转座酶是经修饰的Tn5转座酶。从一开始,Tn5转座酶在若干方面有问题。首先,天然转座酶实际上是不可能产生的,因为当从强启动子表达时,其对E. coli是有毒性的。但是,通过删除若干N-末端氨基酸来克服该难点是可能的(Weinreich et al. , J. Bacterial, 176 :5494-5504,1994)。虽然这解决了毒性问题,并且N-末端截短的转座酶被以高产率生产,但其具有非常低的活性。因此,若干其他突变被引入,以增大其活性(U.S. Patent 5, 965, 443 ;U. S. Patent 6,406,896B
I;U. S. Patent 7,608,434)。但是,这不会解决所有的问题。突变酶仅在高盐(例如0. 7MNaCl)中是稳定的(Steiniger et al. , Nucl. Acids Res.,34 :2820_2832,2006),但在转座酶反应所需的低盐条件下快速损失其活性,在反应混合物中具有仅仅2. 4min的半衰期。因而,使用该转座酶的DNA片段化反应典型地在5分钟内进行,并使用了非常大的量的酶。尽管事实上整个纯化过程保持了高盐浓度,但纯化的酶大量失活;因而,超过核苷酸9. 4倍过量的酶典型地被用来形成Tn5转座酶-寡核苷酸复合体(Na umann and Reznikoff, J. Bioi.Chem. ,277 :17623-17629,2002)。另外,转座酶容易蛋白水解降解。因此,有降解倾向的位点被突变。令人感兴趣地,这些突变导致体内活性的剧烈降低,但对体外活性几乎没有影响(Twining et al.,J. Bioi. Chem.,276 :23135-23143, 2001)。总之,Tn5 转座酶难于生产,其被大量需要并且其非常昂贵。
发明内容
本发明改进了使用转座酶的DNA片段化和标记的现有技术。在实施方式中,本发明提供新的反应条件,其包括锰离子代替镁离子,用于转座酶-介导的靶标核酸的切割和伴随的产生的DNA片段的标记。本发明因而将转座酶反应条件放宽至包括镁离子、锰离子或二者都包括。优选地,反应条件还包括相对低的碱性金属离子(例如钾离子)浓度。产生的标记的DNA片段在许多分子生物学应用领域有用,包括但不限于下一代测序、聚合酶链式反应(PCR)技术以及基因克隆和基因组分析。使用本文公开的反应条件,天然转座酶(即,具有不是不同于在自然中发现的氨基酸序列的氨基酸序列的转座酶;例如,非重组的)以及经修饰的转座酶(即,具有不同于在自然中发现的氨基酸序列的氨基酸序列的转座酶;例如,重组的)可在相对低的浓度和相对短的反应时间下用于体外DNA片段化和标记。天然转座酶可从天然或重组宿主中获得,而经修饰的转座酶仅可从重组宿主中获得。所述反应条件因而提供了优于当前技术的改进。本发明还对制备DNA底物用于下一代测序的现有技术进行改进。本发明提供制备此类DNA底物的新方法将产生的、连有用于DNA片段扩增的单独标记的引物的每一 DNA片段掺入两种不同的转座酶识别序列。所述方法允许仅使用两条引物来制备标记产物。在第一方面中,本发明提供了组合物,优选地,水性组合物,其包含转座酶和在从约ImM至约IOOmM或者甚至更高的浓度下的锰离子(Mn(II))。已令人吃惊地发现,较之使用典型地用在Tn5转座酶反应中的镁离子(Mg (I I)),使用在这些浓度下的Mn (I I)离子提供了优良的转座酶-介导的切割活性。但是,在本发明使用的条件下,镁离子可单独使用或与锰离子组合使用,以提供相对于使用含有MG(II)的反应组合物的现有技术的更优良的结果。的确,所述发现与转座酶的最佳活性在含有Mg+2的组合物中发现的本领域流行的观念相反(见,例如,www. epibio. com/item, asp id+292,其指出Tn5转座酶复合体在无Mg+2时无活性,而存在相对低的水平下的Mg+2时,有活性)。在优选的实施方式中,Mn(II)浓度、Mg(II)浓度或二者的浓度范围从约5mM至约40mM,例如从IOmM至约20mM。两种离子都存在时每种的浓度范围可从约ImM至约IOOOmM每种,例如从约5mM至约40mM,包括约IOmM至约20mM。通过发明人获得的数据显示这些浓度范围对人DNA和\噬菌体DNA 二者的片段化都同样适合。因而,看来在根据本发明的转座酶反应混合物中的Mn+2离子、Mg+2或二者的有优势的使用不限于特定类型的DNA的切割,而是相对广泛地可应用的。当然本领域技术人员会直接意识到在所公开范围内的Mn+2和Mg+2离子浓度的每个具体的值都被本发明所预见,而不需要特别列举各个值和每一值。虽然各个值被包括作为本发明的一部分,为简洁起见,省略了值的详尽列表。此概念可被应用至本文公开的所有值的所有范围令人感兴趣地和更令人感兴趣地,已发现,Mn+2和Mg+2浓度或二者的组合的相对宽的范围,例如每种或总共从约ImM至约IOOmM,降低了转座酶的序列特异性。降低的序 列特异性对用来产生用于下一代测序的DNA片段的转座酶来而言是一个重要的特征。在优选的实施方式中,不是Mn+2和Mg+2的盐,例如碱性金属盐(例如K+或Na+谷氨酸盐)的浓度是相对低的,例如在约50mM或更小的浓度下。被广泛接受的是,不是镁离子盐的盐,例如钾离子(K+),有利地被包括在转座酶反应混合物中。已令人吃惊地发现,通过限制转座酶反应混合物中钾离子的量可进一步改进转座酶活性。该结果可被应用于其他非-镁离子盐。该结果也是出人意料的,因为发明人没有发觉报道在低钾离子组合物中改进转座酶活性的任何研究。较之在Tn5反应中典型地使用的较高的钾离子浓度(为75mM至IOOmM),所述令人吃惊的发现改进了转座酶-介导的切割活性。在示例性实施方式中,组合物中的非-镁或非-锰盐(例如,钾离子)浓度为约40mM或更小,例如约35mM或更小。优选地,该离子浓度为约25mM ;然而,在某些实施方式中,其浓度小于25mM,例如25mM至ImM或小于ImM。使用本文中的其他浓度或范围的公开时,技术人员应意识到本发明包括在所陈述范围内的这些离子浓度的每个具体的值。用于本发明的组合物(和方法)的转座酶可以是具有转座酶活性的任何蛋白。其可以是天然存在的转座酶或重组转座酶。优选地,转座酶至少某种程度上从其天然环境(即,细胞核或细胞浆)中分离或纯化。对于重组产生的转座酶,优选地,重组转座酶至少某种程度上从重组宿主环境(即,细胞核或细胞浆)中分离或纯化。最优选地,在包含于本发明的组合物之前,除去其他细胞组分,转座酶被纯化至90%或更高的水平。优选地,转座酶是约95 %或更高的纯度水平,例如约98 %纯,约99 %纯,或高于99 %纯。基于用于测定纯度的常用技术,例如通过蛋白凝胶的考马斯亮蓝染色、蛋白凝胶的银染、HPLC或其他检测样品中的蛋白的灵敏技术来测定纯度。能使用天然存在的转座酶是本领域中优于可用的其他体系的一个明显的优势,因为这是下述反应条件的第一次公开,在所述反应条件下天然存在的转座酶在适于商业化的DNA片段化和标记的水平下在体外是有活性的。在示例性实施方式中,转座酶是转座酶的IS4家族的成员,例如在Vibrio种中天然发现的一种,包括但不限于 Vibrio harveyi。本发明的示例性实施方式涉及Vibrio harveyi转座酶。该酶通过搜索公用数据库发现。基于作为编码未知功能的假定蛋白的开放阅读框的潜在核酸的计算机翻译,其先前在本领域中被鉴定出。本发明人随后从DNA表达了蛋白,纯化了蛋白并鉴定其为转座酶。就发明人的知识而言,这是这种假定蛋白的酶促活性的表达、纯化和测定的第一次公开。天然存在的酶序列在NCBI/GenBank登记号YP_001446289下得到并具有如在AppendixA中指出的序列。如在本文中使用的,该酶有时被称为“Vibhar”。本发明因而在实施方式中涉及Vibhar作为转座酶的新颖用途。当天然存在的Vibhar转座酶在本文中被作为例子时,应当理解其他天然存在的转座酶被包括在本发明的范围内。此外,也包括得自天然存在的转座酶而包括一个或多个氨基酸缺失、替换或添加的工程改造的转座酶。应当理解,尽管修饰可能在某些方面改变特异性或活性,但对天然存在的转座酶所做的这些修饰不会消除酶的转座酶活性。参考基于转座酶序列比对的转座酶之间的保守序列,本领域技术人员可以意识到对本发明包括的各种转座酶的功能而言重要的残基。优选地,工程改造的转座酶与天然存在的转座酶,优选地与所述工程改造的酶来源的转座酶,共有至少50%序列同一性。其他优选的同一性水平包括至少60%、至少70%、至少80%、至少90%、至少95%、至少98%和至少99%。再者,本领域技术人员会立即意识到落在这些范围内的百分比同一性的所有具体的值都被本发明考虑,而不需要申请人在本文中特别列出所有值。例如,残基D93、D193和E327(基于GenBank登记号YP_001446289. I的氨基酸序列的氨基酸编号)是活性位点残基。本领域技术人员会立即意识到,如果制造重组蛋白的 目的是保留酶促活性,应当保留这些残基,但如果期望使酶失活或如果期望有改变活性的酶,应当以这些残基为靶标(例如,通过在一个或多个这些残基上制造保守性改变或使三维外观保守的改变)。而且,本领域技术人员会意识到,如果期望重组酶活性很少改变或没有改变,下述残基应避免作为突变位点,但如果期望改变活性,以这些残基为靶标W9、L19、D21、R23、R28、L29、A56、Y57、R58、N62、170、T78、T94、L108、G109、H124、L127、G137、Q141、R146、K165、E166、W170、R194、E195、D197、R206、R215、L229、R255、L299、L301、L302、P306、A313、Y320、R323、W324、H330、K334、G337、E341、R353、A362、R364、L386、L394、A413、L420、G422、K427、W438和G440。另外,本领域技术人员应知道,保守的“YREK”(SEQ ID NO :1)基序(GenBank登记号YP_001446289. I的残基320-334)的重要性,其参与在转座酶的IS4家族的酶促活性;保守的“DDT”基序(GenBank登记号YP_001446289. I的残基88-99)的重要性,其参与在转座酶的IS4家族中的转座酶与靶标DNA磷酸盐骨架的催化与接触;和保守的 “DREAD” (SEQ ID NO 2)基序(GenBank 登记号 YP_001446289. I 的残基 193-197)的重要性,其参与靶标和/或供体DNA结合。仍再者,本领域技术人员应知道残基W299的重要性,其牵涉酶的发夹切割机制。在制造重组转座酶中就结构-功能考虑而言的感兴趣的其他残基是被Reznikoff等人鉴定的多种残基(Reznikoff, W. S. et al. , " ComparativeSequenec Analysis of IS50/TN5Transposase" , Journal of Bacteriology, Vol. 186,No. 24,Dec. 2004,p. 8240-8247),其全部通过引用并入本文。可针对许多目的产生本发明的该方面的组合物,所述组合物不限于本文中特别讨论的那些。示例性组合物是用于存储转座酶(有或没有包含转座酶的识别序列的核酸),用于切割或片段化靶标DNA和用于切割和标记靶标DNA的那些。同样地,组合物可包含含有转座酶的识别序列的DNA分子。在特定组合物中的DNA分子可包含特定转座酶的单一识别序列。不同的ds或ss DNA序列(标记)被附着在转座酶识别序列上,以允许PCR扩增,产生的DNA片段附着在测序芯片,例如Illumina芯片(如本领域中已知的)上,并允许对靶标DNA文库的来源,例如Index序列鉴定。为可应用至下一代测序的目的,下述是优选的,大约一半的DNA片段末端用一种类型的标记来标记并且另一半用不同的标记来标记,而一种标记被附着在靶标DNA片段的一个末端,并且另一类型被附着在相反的末端,以允许DNA片段在两个方向都阅读。通过将两种不同的转座酶识别序列(即,在特定的组合物中DNA分子的一些(例如,约50%)包含转座酶的第一识别序列,剩余的DNA分子包含不同的第二识别序列)组合,实现进一步的改进。识别序列可以是转座酶的天然存在的序列,或可以是提供DNA分子的额外或备选功能的工程改造的序列。在示例性实施方式中,对于将被片段化的靶标DNA的每一末端识别序列是相同的序列。在一些实施方式中,两条序列是同一的或基本同一的,彼此具有至少90%(BP,90%-100% )序列同一性。在一些其他实施方式中,两个序列是不同的,彼此具有小于90% ( S卩,89%或更小,最小约30% )的同一性。但是,下述是优选的两种识别序列都可以被用在连接它们中的转座酶识别。在示例性实施方式中,识别序列是针对 V. harveyi 的一种,并包含序列5 ' _ctgtctcttgatcacaagt_3 1 (SEQ ID NO :3);5' -acttgtgatcaagagacag-3' (SEQ ID NO :4) ;5' -agatgtgatcaagagacag-3' (SEQIDNO 5);或5' -ctgtctcttgatcacatct-3' (SEQ ID NO :6)。在一些实施方式中,第一识别序列、第二识别序列、或二者是包含SEQ ID NO :4、SEQ ID NO :5和/或SEQ ID NO 6的一条链的序列的双链DNA序列。在一些实施方式中,第一识别序列包含一条链为SEQ ID NO: 4的序列,且第二识别序列是来自Vibrio harveyi的转座酶的经修饰的识别序列,其包含一条链为SEQ ID NO 5的序列。许多额外的物质可被包括在本发明的该方面的组合物中。通常可通过组合物的应用或为了特定转座酶最优活性的的具体需求规定多种额外的组分的同一性、数目和量。在一些实施方式中,组合物包含已与连接体(adaptor,或称“接头”)共价结合的切割的或片段化的靶标DNA。此类DNA分子从转座酶的作用中产生,所述转座酶将含有(一个或多个)转座酶识别序列的DNA分子与靶标DNA化学结合,导致初始靶标DNA切割和在它们的末端具有转座酶识别序列的DNA片段形成。在某些实施方式中,连接体/靶标DNA分子还包含一条或多条引物,其与和引物杂交的一条或两条链和/或单链的连接体/靶标DNA分子杂交。引物适于用作扩增或测序引物。在优选的实施方式中,用于PCR扩增的引物包括3'序列区域,所述3'序列区域包括(一个或多个)转座酶识别序列的一部分的序列。优选地,这些引物包括5'序列,所述5'序列不包括(一个或多个)转座酶识别序列的一部分的序列。而且,下述是优选的,一种或两种(优选地,两种)包括允许从引物(多种)扩增核酸的序列,从而包含允许扩增的产物与固体支持物杂交用于测序的序列。如本文中使用的,此类序列有时被称为“标记”序列,用于附着至在芯片上的特异性寡核苷酸。优选地,使用了两种PCR扩增引物,其在它们的5'区域中具有在两条引物之间不同的序列;这些序列可作为连接体序列。在此类实施方式中,可实现针对靶标DNA的扩增或测序的高的特异性。优选地,引物包括适于用作可检测信号(例如用于“Illumina”检测方案的标记)的序列。在非常优选的实施方式中,一条链的标记不同于另一条链的标记,导致具有独特标记符号的标记核酸。在示例性实施方式中,引物包含序列5' -aatgatacggcgaccaccgagatctacacgctgacgtcgagacttgtga-3' (SEQ ID NO 7)—caagcagaagacggcatacgagatcggtggagctgtgcgtagatgtga-3' (SEQ ID NO :8)。本发明还提供了编码本发明的转座酶的核酸。一般而言,本发明的该方面涉及天然存在或工程改造的/重组的所有核酸,所述核酸编码具有转座酶活性并在根据本发明的组合物中显示活性的蛋白。根据本发明的该方面的示例性核酸包括,如上文所讨论的编码V. harveyi转座酶的显示与天然存在的核酸至少约50%序列同一'丨生的那些序列、公众可获得的序列。优选地,核酸显示至少约60 %序列同一性、至少约70 %序列同一性、至少约80 %序列同一性、至少90%序列同一性、至少95%序列同一性、至少约96%序列同一性、至少约97%序列同一性、至少约98%序列同一性或至少约99%序列同一性。就该文档所叙述的其他范围而言,本领域技术人员立即明白本发明考虑在本段落中具体叙述的范围包括的每个和所有数值,不需要申请人分别具体叙述每个数值。优选地,在核酸用于制备本发明的转座酶之前,核酸从一种或多种其他细胞组分中分离或纯化。在本发明的一个方面中,提供了试剂盒。一般而言,根据本发明的试剂盒含有本发明的组合物的一些或所有组分,或包含对本发明的方法实施而言必须的一些或所有物质。如本领域中理解的,组分可被一起包装,以提供用于组分的递送和/或组织的单个的、可运输的和/或可储存的单元。在另一方面中,提供了转座酶-介导的靶标DNA片段化和标记的方法。在一种实 施方式中,所述方法包括=(A)使I)包含至少一个双链部分的第一 DNA分子,其中双链部分包含转座酶的识别序列并且DNA分子还包含这样的部分,所述部分不包含转座酶的识别序列的部分;2)包含至少一个双链部分的第二 DNA分子,其中双链部分包含所述转座酶的识别序列并且DNA分子还包含这样的部分,所述部分不包含所述转座酶的识别序列,其中序列的非识别部分不同于第一 DNA分子的非识别部分序列;和3)所述转座酶组合,其中三种物质的组合允许它们相互作用;和(B)使这些相互作用的物质与靶标DNA分子和Mn+2离子、Mg+2离子或两种离子在下述条件下组合使得相互作用的物质与靶标DNA缔合并通过转座酶-介导的切割来切割靶标DNA分子以提供切割的DNA产物。还在另一实施方式中,所述方法包括(A)使I)靶标DNA分子;2)包含至少一个双链部分的第一 DNA分子,其中双链部分包含转座酶的第一识别序列;3)包含至少一个双链部分的第二 DNA分子,其中双链部分包含所述转座酶的第二识别序列;和4)所述转座酶组合;和(B)使组合物经受下述条件使得第一 DNA分子、第二 DNA分子和转座酶可与靶标DNA分子缔合并通过转座酶-介导的切割来切割靶标DNA分子以提供切割的DNA产物,其中所述条件包括I-IOOmM的Mn+2、I-IOOmM的Mg+2或I-IOOmM的Mn+2和Mg+2离子的组合。在某些实施方式中,第二 DNA分子包含至少一个双链部分,并且在转座酶识别部分和非-转座酶识别部分二者中均与第一 DNA序列不同。同样地,本发明包括其中第一识别序列不同于第二识别序列的实施方式。而在一些实施方式中,将要组合的组分同时一起组合,在优选的实施方式中,使第一 DNA分子、第二 DNA分子和转座酶组合,以制得复合体,之后使复合体与靶标DNA分子组合。所述方法可用任何天然存在的(即,野生型)转座酶或用工程改造的转座酶实施。在本发明的上下文中使用野生型转座酶提供了优于现有技术的优势。更进一步地且独立地,在实施方式中,本发明的反应条件提供了较之现有技术方法的优良的结果。在示例性实施方式中,转座酶是IS4家族转座酶,例如Vibrio种中天然发现的一种,包括但不限于Vibrio harveyi。同样地,转座酶的识别序列可以是天然存在的序列。其还可以是这样的序列,所述序列经工程改造以具有天然存在的序列所展示的那些性质之外的性质,例如对天然存在的转座酶或经工程改造的转座酶的更强(或更弱)的结合性。
在实施方式中,第一识别序列、第二识别序列或二者是来自Vibrio harveyi的转座酶的识别序列。例如,第一识别序列、第二识别序列或二者可以是包含一条链为5' -acttgtgatcaagagacag-3' (SEQ ID NO :4)的序列的双链DNA序列。备选地或额外地,第一识别可包含一条链为5' -acttgtgatcaagagacag-3' (SEQ ID NO :4)的序列,且第二识别序列可以是包含一条链为:5' -agatgtgatcaagagacag-3' (SEQ ID NO :5)的序列、来自Vibrio harveyi的转座酶的经修饰的识别序列。备选地或额外地,第一识别、第二识别序列或二者可以是包含一条链为5' -agatgtgatcaagagacag-3' (SEQ ID NO :5)的序列的双链DNA序列。在实施方式中,第一识别序列、第二识别序列或二者是与天然存在的识别序列相差至少一个核苷酸、优选地少于10个核苷酸的来自Vibrio harveyi的转座酶的经修饰的识别序列。在本发明的一些实施方式中,Mn+2离子和/或Mg+2离子用来改进通过转座酶的靶标DNA的片段化/切割和/或标记。在这些实施方式中,在切割和/或标记条件中单独的或组合的Mn+2和/或Mg+2离子浓度在约ImM和约IOOmM之间,例如在约5mM和约40mM之 间,或在约IOmM和约20mM之间。在一些实施方式中,非-Mn+2和/或非-Mg+2离子盐,例如碱性金属盐,以相对低的浓度存在,例如低于50mM,例如约25mM或更低。存在钾盐时,它们优选地以约25mM的浓度存在。本发明的方法还可包括将连接体添加至片段化的和标记的DNA靶标。同样地,本发明还涉及另一方面,其是使标记的转座酶-片段化的DNA分子适于随后分析的方法。用于将连接体添加至片段化的和标记的DNA靶标的方法使本领域中已知的,并且根据本发明,可使用任何可用技术,以得出适于用在随后的分析(例如下一代测序、微阵列分析等等)中的DNA。DNA可在直接与转座酶反应后或PCR扩增后经受此类分析,这视起始材料的量和分析需求而定。在实施方式中,本发明的连接体包含I)可与片段化的和标记的DNA靶标的至少一部分杂交的3'区域;和2)不与片段化的和标记的DNA靶标杂交的5'区域。3'区域优选地包括在适于体外扩增(例如PCR)的条件下与片段化的和标记的靶标DNA的一条链杂交的核苷酸序列。在非常优选的实施方式中,3'区域包含在DNA靶标的转座酶识别位点内与片段化的和标记的DNA靶标杂交的核苷酸序列。另一方面,连接体的5'区域包括在允许3/区域杂交的条件下不与DNA靶标杂交的序列。相反,5'区域包括允许扩增产物(连接体可被认为是用于DNA靶标扩增的引物)与另一核酸,例如与固相支持物结合的核酸(例如,在芯片上的核酸)缔合的序列。此类序列的非限制性例子是用于将DNA靶标与Illumina底物或Roche454底物结合的序列。在实施方式中,两个连接体与片段化的和标记的DNA靶标结合。优选地,每个连接体的5'区域包含不同于另一连接体的核苷酸序列。但是下述是优选的两个5'序列(例如,都包括可被附着在Illumina芯片、Roche芯片等等上的序列)都适于用在用于分析的相同的格式中。当然,如本领域中已知的,连接体可包括“条形码”。附图简述并入本说明书并组成本说明书一部分的附图阐释本发明的实施方式,并和书面说明一起用来解释本发明的某些原理和特性。
图1,板A和B显示了表达多种转座酶的E. coli细胞的粗制提取物的SDS-PAGE凝胶结果。对应于转座酶的蛋白带由箭头指出。板A:在37°C下培养。泳道I——假定
蛋白 VIBHAR_03113,Vibrio harveyi ATCC BAA-1116, YP_001446289 ;泳道 2-标记 12
分子量标记物(Invitrogen);泳道3-来自 Photobacterium profundum SS9 的转座
酶,YP_133439 ;泳道 4-来自 Vibrionales 细菌 SWAT-3 的转座酶,ZP_01815141. I ;泳
道5—来自Vibrio cholerae V51的保守假定蛋白,ZP_04918286. I ;泳道6——如泳道5的相同的材料但是未经诱导的细胞(阴性对照)。板B:在25°C (泳道2、3、5、7)下和在
370C (泳道4、8)下培养的对照。泳道I—标记12分子量标记物(Invitrogen);泳道2-
假定蛋白 VIBHAR_03113.m,Vibrio harveyi ATCC BAA-1116,YP_001446289,未诱导的细 胞(阴性对照);泳道3 和 4-假定蛋白 VIBHAR_03113,Vibrioharveyi ATCC BAA-1116,
YP_001446289 ;泳道5 和 6-假定蛋白 lpg0647[Legionella pneumophila 亚种,军团
菌,嗜肺军团菌I型],YP_094683. I ;泳道7和8——IS4家族转座酶TnpA[Legionellapneumophila亚种,军团菌,嗜肺军团菌I型],YP_094196. I。图2是存在镁离子或锰离子时用天然存在的转座酶消化的\ DNA的琼脂糖凝胶电泳运行30分钟(左边板)或2. 5小时(右边板)的图片。数据显示存在锰离子时转座酶活性的显著改进和降低的特异性。将在20mMPIPES pH 7. 5、0. 25M KC1、50%甘油中的具有3mg/ml蛋白浓度的经纯化的Vibhar转座酶与在50 U M浓度下的等体积的接头78混合并在室温下孵育I小时,导致接头/转座酶复合体或“负载转座酶”的形成。将I. 2 Ul的负载的转座酶转移至含有以IOii g/ml浓度的X DNA、以3 ii M浓度的接头78、IOmM MnCl2或IOmMMgCl2,25mM Tris-乙酸盐pH 7. 5、75mM谷氨酸钾的19 的反应混合物中。反应混合物在37°C下孵育30min或2. 5小时,使用引物7在PCR中扩增,在I. 8%琼脂糖中分离并用溴化乙锭染色。图3是Epicentre的NEXTERA 技术和目前公开的技术的比较,显示了本发明相对于本领域中可用的技术的简易性。图4显示了使用示例性天然存在的转座酶和所述转座酶的任一种识别序列或两种不同的识别序列进行、DNA片段化和标记的琼脂糖凝胶电泳运行,所述运行显示了利用两个识别序列的设计的切割、标记和扩增效率是优异的。如在使用Vibhar的DNA片段化和标记的详细方案中所述的,使DNA片段化,使用PicoMaxx andPfuUltra 聚合酶进行PCR扩增,并对产生的片段进行分析。PCR后,不从寡核苷酸中纯化片段。Ikb加DNA梯度(lkb Plus DNA ladder)来自 Invitrogen Inc. , Carlsbad, CA 并被用于比较。图5显示了使用示例性天然存在的转座酶和所述转座酶的两种不同的识别序列进行\ DNA片段化和标记的琼脂糖凝胶电泳运行,显示仅当两条识别序列都被掺进靶标DNA时发生扩增。如在使用Vibhar的DNA片段化和标记的详细方案中所述的,使DNA片段化,使用PicoMaxx 聚合酶进行PCR扩增,并对产生的片段进行分析。PCR后,不从寡核苷酸中纯化片段。Ikb加DNA梯度(Invitrogen Inc. , Carlsbad, CA)被用于比较。图6显示了将改变Mn (II)浓度时的天然存在的转座酶的活性与Mg (II)对照比较的其他结果,并显示对靶标X DNA和人DNA观察的片段化、标记和PCR扩增是相当的。除了使用不同浓度的Mn++或Mg++代替Mn++外,如在使用Vibhar的DNA片段化和标记的详细方案中所述的,使DNA片段化,使用PfuUltra 聚合酶进行PCR扩增并对产生的片段进行分析。PCR后,不从寡核苷酸中纯化片段。使用了 Ikb加DNA梯度(Invitrogen Inc.,Carlsbad, CA)用于比较。本发明的多种实施方式的详细描述现详细说明本发明的多种示例性实施方式、在附图中阐释的支持此类实施方式的数据。该详细描述不应被认为是本发明的限制,而应确切地被理解为给读者提供本发明的某些方面、特性和实施方式的更详细的描述的公开。在本发明的实施方式被详细描述之前,应当理解本文中使用的术语仅为描述特 别的实施方式的目的,并不意图限制。而且,提供一个数值范围时,应理解为也具体公开了该范围上限和下限之间的每个中间值(除非上下文另有清楚说明,到下限单位的十分之一为止)。在任何陈述值或陈述范围内的中间值和任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内,和在较小范围内包括任一界限、两个界限或两个界限都不包括的每个范围也包括在本发明内,受制于所述范围内任何明确排除的界限。当所述范围包括界限之一或二者时,排除这些包括在内的界限之一或二者的范围也包括在本发明内。除非另有说明,本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。尽管在本发明的实践或测试中也可以使用与本文所述相似或等同的任何方法和材料,现描述了优选的方法和材料。本说明书中提到的所有出版物通过引用并入,用以公开和描述与所述出版物相关的方法和/或材料。在与任何并入的出版物的冲突时,本公开起决定作用。在本文和附带的权利要求中使用时,单数形式("a"," an"和"the")包括复数形式,除非上下文另行明确指出。因而,例如提及“转座酶”包括此类转座酶的复数并且提及“样品”包括提及一种或多种样品和为本领域技术人员所已知的其等同物等等。而且,使用可使用等同术语描述的术语包括使用那些等同术语。改讲的转座酶反应条件天然转座酶被认为是固有失活的。但是,必须承认不是所有可能的反应条件已被完全尝试过。这里,公开了下述事实可通过将一种或多种过渡金属离子(包括Mg(II)和Mn(II) 二者,但优选地至少Mn(II))引进转座酶反应混合物来实现在未经修饰的转座酶的天然DNA片段化活性的引人注目的改进。通过相同的途径也实现了 DNA片段化特异性的引人注目的降低。必须强调,低特异性对消除偏好并实现最优的可能的DNA文库序列覆盖度的下一代测序而言是优选的。通过示例的方式,在这些实验中鉴定并使用了 Vibrio harveyi转座酶。使用并公开了该酶的天然和经修饰的DNA识别序列。还公开了寡核苷酸设计和当DNA文库在相同的芯片上测序时的有用的索引,所述寡核苷酸设计和用于片段化DNA和用于提供特异性标记的转座酶的组合在下一代测序中是有用的。如上文讨论的,由于多种原因,Tn5转座酶是有问题的。同样地,本发明人评估了来自在NCBI网站上可得到的不同基因组的多种转座酶。它们中的一些被NCBI注释为转座酶,但其他的被它们的生物信息学专家漏掉,临时被标记为“假定蛋白”。通过分析与已知转座酶具有序列同一性的蛋白,鉴定了用于DNA片段化和标记的通过“剪切和粘贴”起作用的似乎是转座酶的实体的集合。在这些之中,基于每一基因组的拷贝的数目和在有机体之中的分布(不同于Tn5的特点,其受限于拷贝数目和宿主),对蛋白进行排序。原理是此类“普遍存在的”转座酶可能更有活性。天然存在的Vibrio harveyi转座酶被用在大多数的实验中并且本文中被称为“Vibhar”。Vibhar转座酶基因以至少21个拷贝存在于Vibrioharveyi基因组中,且高度类似的基因在其他Vibrio基因组中广泛分布,而Tn5转座酶基因在每个基因组中以一个拷贝存在,并且仅在非常少数的细菌菌株中存在。使用生物信息学手段,该转座酶的IRL序列被鉴定为 5 ' -ctgtctcttatacacaat-3 ' (SEQ ID NO :9) IRR 序列被鉴定为5 ' -acttgtgatcaagagacag-3 ' (SEQ ID NO :4)。通过实验,经修饰的 19bp IRR 序列5' -agatgtgatcaagagacag-3' (SEQ ID NO :5)证明更有效并被用在大多数实验中。下文中该序列的双链寡核苷酸被称为接头78。除了 “普遍存在”之外,关注Vibhar转座酶的其他原因是其非常易于生产,这是由于其在E. coli中作为溶解蛋白的非常高的表达水平,具有远远优于Tn5和大多数评估的转座酶的表达水平(见图1,其显示了测试的多种转座酶的表达水平的比较)。而且,不同于Tn5转座酶,事实上没有观察到Vibhar转座酶的蛋白水解降解。最初测试时,纯化的Vibhar转座酶在传统用于DNA片段化的条件中仅具有弱的活性。而且,在下一代DNA测序中最有用的约200-800bp的DNA片段的产率不令人满意。大 多数产生的片段是大得多的尺寸。而且,观察到表示相当大的序列特异性的显著的DNA片段带,这在用于DNA测序的样品中是不被期望的。使用转座酶并增加孵育时间没有缓和上述问题。。但是,通过Mn (II)离子代替Mg (I I)或通过用Mn(II)补充Mg (II),解决了这些问题,注意Mg(II)被常规用在转座酶反应中(图2)。另外,发现了涉及Mg(II)离子的先前提到的问题可通过本方法克服。通过将谷氨酸钾浓度从75-100mM(其被常规用于使用Tn5转座酶的反应)降低至25mM并通过将反应温度升高至47°C来实现进一步的改进。通过示例的方式,下述条件可用来实现令人满意的DNA片段化将在20mM PIPESpH 7.5,0. 25M KCl,50%甘油中的具有3mg/ml蛋白浓度的的纯化的转座酶与以50 ii M浓度下的等体积的接头78混合并在室温下孵育lh,导致接头/转座酶复合体的形成,或“负载的转座酶”。将I. 2 ill负载的转座酶转移至含有10 u g/ml浓度的DNA、3 ii M浓度的接头78、IOmM MnCl2,25mM Tris-乙酸盐pH 7. 5、25mM谷氨酸钾的19 的反应混合物。相等浓度的MgCl2替代MnCl2或可被添加至MnCl2 (以实现追加的摩尔浓度或共同的摩尔浓度)。在47°C下孵育反应混合物20min。使用StrataPrep PCR纯化试剂盒(Agilent, La Jolla,CA)去除寡核苷酸。使用4 ii M浓度下的具有序列5' -agatgtgatcaagagacag-3' (SEQ IDNO :5)的引物、83 单位/ml 浓度下的Pfu Ultra HF (Agilent Technologies, La Jolla,CA)、ImM浓度下的dNTPs、l X PfuUltra 缓冲液,用PCR扩增DNA片段。应用72°C下4min的一个循环;随后20个循环94°C 40秒,56°C 45秒,72°C 2分钟;随后在72°C下IOmin的一个循环。该设计允许令人满意的DNA片段化,但其不会提供将不同的多核苷酸序列附着到DNA片段的各个末端。但是,下一代DNA测序需要提供具有在各个末端上具有不同的DNA序列的每一 DNA片段(S卩,提供标记)。最初11 lumina (San Diego, CA)开发了用于下一代DNA测序的DNA片段化和标记DNA片段的技术(Nature Methods,5,p887_893,2008)。但是,用于DNA片段化和标记的Illumina 方法相当复杂且费劲。因此,Epicentre Biotechnologies, Madison, WI 开发了使用Tn5转座酶的用于DNA片段化和标记的简单得多的方法。但是,这导致了寡核苷酸设计中的一些妥协,因为Tn5转座酶识别序列不得不被添加。结果,附着到DNA片段的寡核苷酸比在Illumina设计中长的多。因此,不得不利用PCR扩增的更复杂的方案,S卩,代替如在
11Iumina设计中的两条PCR引物,在Epicentre设计中使用了四条PCR引物,所述弓I物具有对人DNA的错误引 发的可能性。图3A中列出的寡核苷酸设计与Epicentre使用的设计非常相似(并被标为E)。与Epicentre设计的不同之处在于转座酶识别序列是不同的。Epicentre设计使用19bp “嵌合体”Tn5转座酶识别序列,而本发明使用了经修饰的19bp Vibrio harveyi转座酶识别序列(标为“78”),这是由于在本文公开的实验中使用了 Vibhar转座酶的事实。现有设计的缺点是在PCR中利用4条引物,所述4条引物在图中被标为引物1*(SEQ ID NO :10)(又叫Nxpl*)、引物 2* (SEQ ID 勵14)(又叫版口2*)、接头1(5£0 ID NO : 11)(又叫 Nxal)和接头
2(SEQ ID N0:15)(又叫Nxa2)。在若干最初的PCR循环下,仅使用了接头I和接头2,因为引物I*和引物2*在这些循环期间在含有转座酶识别序列的寡核苷酸上不具有着落位点(landing sites)。这些最初的循环是较少有效的,因为接头I和接头2的浓度小于在PCR反应中典型的推荐的浓度的约20倍。稍后,引物I*和引物2*具有着落位点并参与在PCR反应中。这些引物以PCR扩增的最佳浓度存在并在循环结束时以最佳浓度存在,使用这些较短的引物,产生了压倒多数的PCR产物。但是,使用引物3程序对这些较短引物的简单分析显示了它们是亚最佳的,有高3'端稳定性和对人DNA的错误引发的高可能性(图3A)。由于此类错误引发产生的片段会错过阅读引物的着落位点(图3A)。例如,如果通过引物2*产生了错误引发,不会从阅读2引物(SEQ ID NO 16)和索引阅读引物E获得测序信息,但是“错误引发的”片段会占据Illumina芯片上有价值的位置,因为引物2*提供了附着至芯片的所有必要的DNA序列。不幸地,不能设计更好的引物I*和更好的引物2*,因为它们的着落位点在Illumina标记序列内部。这实际上没有留下调整的空间,除非芯片被重新设计。强调最初的Illumina设计不会具有此类问题是重要的。用于通过转座酶的DNA片段化和标记的改讲的体系本公开部分补充先前公开部分并提供寡核苷酸设计以实现较之现有技术设计的改进的DNA片段产率。与现有技术设计不同,根据本发明的该部分的PCR扩增的引物的3'端位于转座酶识别序列内部。这通过使用两种不同的寡核苷酸转座酶识别序列而容易实现,所述识别序列被用来附着两种不同的Illumina标记,这与其中仅一种转座酶序列被用来附着不同的标记的现有技术设计相反。而且,应当理解,在实施方式中,根据上文讨论的关于转座酶反应条件的条件,本发明包括标记条件。在一些应用中,此类条件是优选的并且在实施方式中,提供了较之现有技术的此类条件的改进的条件。结果,实现了较之在现有技术设计中较不有效的4-引物扩增的更有效的2-引物扩增。较之现有技术设计的Nextera试剂盒(Epicentre),本发明的2_引物方案导致了 DNA片段的产率更好,并较之现有技术设计,导致对人DNA文库的错误引发降低。该设计和Epicentre设计的主要不同之处在于前者设计使用了在本文的示例性实施方式被称为“78”和“34”的、每种附着至不同的Illumina标记的2种不同的转座酶识别序列,而在后者的设计,仅一种转座酶识别序列被用于两种标记(见图3)。该设计允许将PCR引物3'移进转座酶识别DNA序列中并允许使用总体上更短的寡核苷酸和实际上对人DNA没有错误引发可能性的更有效的2-引物PCR扩增。为克服现有技术的问题同时简化设计,发明人提出了这样的设计,所述设计允许将附着至DNA片段的核苷酸的组合的尺寸降至与在Illumina的“末端配对设计”中大约相同的尺寸。所述设计还避免了使用在Illumina标记内部具有着落点的短的引物的4-引物PCR0通过使用2种Vibhar转座酶识别序列(“78”和“34”)并重新设计在Illumina标记和转座酶识别序列之间的区域,对人DNA的错误引发被减至最小。任一设计允许约1-8核苷酸“索引”的插入,在图3中被标为三角形。当在相同的芯片上对若干文库测序时,此类索引被用于鉴定来自特异性DNA文库的序列阅读。为实现DNA片段化和标记,寡核苷酸3ilb (SEQ ID NO : 17)与寡核苷酸3ilt (SEQID NO 18)杂交,并且寡核苷酸8ilb (SEQ ID NO :19)与寡核苷酸8ilt (SEQ ID NO :20)杂交。除了寡核苷酸不同之外,杂交的寡核苷酸的等摩尔的混合物被用来负载Vibhar转座酶 并如上文所述使曬菌体X DNA准确片段化。从未混合的寡核苷酸的旋转柱(spin-column)纯化之后,使用AgPl (SEQ ID NO 7)和AgP2 (SEQ ID NO 8)引物(每种以2 y M) 20个循环扩增片段化的和标记的DNA。根据制造商的指导(Agilent, La Jolla, CA)使用PicoMaxx DNA聚合酶用于扩增。与Epicentre设计比较,寡核苷酸N8t (SEQ ID NO :13)或者与寡核苷酸阅读I引物(SEQ ID NO 12)杂交或者或与阅读2引物(SEQ ID NO 16)(图3B)杂交。杂交的寡核苷酸的等摩尔的混合物被用来负载Vibhar转座酶并如上文所述使噬菌体\ DNA准确片段化。从未混合的寡核苷酸的旋转柱(spin-column)纯化之后,使用引物I*、引物2* (每种以
2U M浓度)、接头I、接头2 (每种以0. I ii M浓度),20个循环扩增片段化的和标记的DNA。根据制造商的指导(Agilent, La Jolla, CA)使用PicoMaxx 或PfuUltra 热稳定聚合酶用于扩增。扩增的DNA片段在2%琼脂糖-TBE凝胶中分离并用溴化乙锭染色(图4)。从图中得出的数据可知,使用该设计的扩增显然提供更好的DNA片段产率。所述片段是用在下一代DNA测序中的尺寸范围。当存在两种PCR引物时,DNA被唯一扩增,表示每种片段在其末端被标记有不同的Illumina标记(图5)。用入DNA和人DNA获得了类似的结果,表示该设计可被用于不同的基因组,并且也证实,关于适于下一代DNA测序的该设计,使用Mn+2离子的DNA片段化比在典型浓度下的Mg+2的片段化更有效(图6)。除了在图3中列出的寡核苷酸设计,还可使用其他设计。例如,两种Illumina标记都可被掺进相同的接头中,导致“分枝的”接头。这应用于可被本领域技术人员设计的Roche或其他标记。全部或部分Ilumina、Roche或其他标记可在PCR反应中被添加至接头78或延伸的接头78或类似接头,而不是从一开始便被掺进接头,这可被应用至如图3中描绘的2种接头的混合物以及分枝的接头。而且,2种接头可与间隔物连接,以确保用不同的接头(即2种接头)负载每一转座酶二聚物,每个转座酶二聚物I个不同的接头拷贝。使用Vibhar的DNA片段化和标记的详细方案A.使寡核苷酸杂交以产生用于负载Vibhar转座酶的部分ds接头。将在图3上描绘的寡核苷酸在去离子无菌水中溶解为IOOii M浓度(每nm寡核苷酸添加10 ill水)。I.将等体积的 N8t(SEQ ID NO :13)与 N8b (SEQ ID NO : 12)、N8it (SEQ ID NO :13)与 N8ib(SEQ ID NO : 16)、3ilt(SEQ ID NO :18)与 3ilb(SEQ ID NO : 17)、8ilt (SEQ ID NO:20)与 8ilb(SEQ ID NO :19)混合。2.将1/19体积的0. 2M Tris-乙酸盐pH 7. 5,0. 5M谷氨酸添加至每一混合物。3.在500ml的烧杯中将约400ml水加热至72 °C,将混合物放进在烧杯中的漂浮物(floatie)中,在塑料袋中包裹并在试验台上在若干小时中缓慢冷却至室温。4.产生的接头被标为N8 (得自寡核苷酸N8t和N8b)、N8i (来自N8it和N8ib)、3il (来自 3ilt 和 3ilb)、8il (来自 8ilt 和 8ilt)。见图 3。5 在-20°C下存储接头。 B.制备Vibhar缓冲液(当IX时,25mM Tris-乙酸盐pH7. 5、25mM谷氨酸钾、IOmMMnCl2)。混合下述以制备Iml的4X缓冲液I. 200 ii I 的 0. 5M Tris-乙酸盐 pH 7. 52. 100 U I的IM谷氨酸钾3. 80 U I 的 0. 5M MnCl24. 620 U I的去离子水。C.用接头负载Vibhar转座酶I. IOu I的接头N8与10 ill接头N8i混合,10 U I的接头3il与10 iU的接头8il混合。2. 4 ii I 的 Vibhar 转座酶(在 20mM PIPES pH 7. 5,0. 25M KC1,50%甘油中 3mg/ml)与4iil的N8/N8i混合物混合或与4 的3il/8il接头混合物混合。3.在室温下孵育70_80min。D. DNA 片段化将I. 20 U I 的 4 X Vibhar 缓冲液2. 20 U I 入 DNA@40 U g/ml3. IOu I 的 N8/N8i 混合物或 3il/8il 混合物4. 30 U I 水混合将70 ill的混合物添加至8 U I的负载的转座酶。在47°C下孵育20_25min。E.旋转柱纯化将等体积(78 ii I)的结合缓冲液(4M盐酸胍)添加至片段化的DNA的每一样品,振荡并将混合物在 Single GFF layer Retainer Ring Versa 旋转柱(AbsolutelyRNA Nanoprep试剂盒,Agilent的一部分)上应用。将柱放进2ml无帽插座管(cap-lessreceptacle tube)。I 在 Beckman-Coulter MicrofUge 16的内环中在 14800RPM 下旋转 34 秒。2.从插座管中完全去除流经的液体,重新插入柱,应用200 ii I的洗涤缓冲液(80% Absolute Ethanol,200proof, Molecular biology grade, Fischer Scientific)。
3.如之前的旋转。4 重复步骤2和3。5.从插座管中完全去除流经的液体,重新插入柱并如之前的旋转。6.将柱移进无帽的 1.5ml Eppendorf 管中,将 30 ii I 的 IOmM pH 8. 46 的 Tris-HCl缓冲液应用至柱的顶部并在室温下孵育5min。7.如之前的旋转。8.应用30 U I水并如之前的旋转。9.将合在一起的洗脱液转移至有帽的管。
F. PCR 扩增引物混合物:将在水中的所有引物(图3)溶解为IOOii M浓度。引物混合物A(Agilent 设计)。将 100 iU 的 AgPl (SEQ ID N0:7)与 IOOyl 的AgP2 (SEQ ID NO :8)混合。引物混合物E (Epicentre 设计)。将 100 U I 的 Nxpl*、100 U I 的 Nxp2*、5 U I Nxal和65 ill的Nxa2混合。表I :反应混合物
八个20 ul的反应(过量)混合物两个20 ul反应
20 |il IOXPicoMaxxw缓冲液*5 |il IOXPicoMaxxw缓冲液
2 ^il 100 mM dNTPs5 ^il 10 mM dNTPs
8 (il的引物混合物A或引物混合物E 2 引物混合物A或引物混合物E6.7 (xl PicoMaxx(R)聚合酶*1.7 [il PicoMaxx(R)聚合酶
113.3 |il 水23.8 0 水*也可使用PfuUltra和其缓冲液。产率大约是相同的,用PfuUltra有更多的引物-二聚物(图4)。将来自步骤E的片段DNA的5 ill等分部分加入PCR板的孔中。将15 yl的上述混合物加进孔中。使用下述参数在Agilent SureCycler 8800上扩增修复72°C 2min 22sec变性95°C 3min19个循环变性93°C40sec退火59°C Imin延伸72°C3min结束循环延伸72°C IOmin冷却4°C不限时使用2%琼脂糖TBE凝胶分析。就克隆进质粒载体或在Illumina芯片上测序而言,根据制造商的指导,使用StrataPrep PCR纯化试剂盒(Agilent, La Jolla, CA)从未反应的寡核苷酸中纯化。
可在本发明的实施中做多种改进和变化而不会背离本发明的范围或精神,这对本领域技术人员而言是显而易见的。从本发明的说明书和实施考虑的本发明的其他实施方式对技术人员而言是显而易见得的。期望说明书和实施例仅是示例性的。
权利要求
1.用于靶标DNA分子的DNA片段化的体外方法,所述方法包括 使 包含至少一个双链部分的第一 DNA分子, 其中所述双链部分包含转座酶的识别序列并且该DNA分子还包含不包含该转座酶的识别序列的部分; 包含至少一个双链部分的第二 DNA分, 其中双链部分包含上述转座酶的识别序列并且该DNA分子还包含不包含该转座酶识别序列的部分,其中所述序列的非识别部分不同于第一 DNA分子的非识别部分;和上述转座酶组合; 其中上述三种物质的组合允许它们相互作用;以及 使这些相互作用的物质与靶标DNA分子和Mg+2离子、Mn+2离子、或Mg+2离子与Mn+2离子两者在使得相互作用的物质与靶标DNA缔合并通过转座酶-介导的切割来切割靶标DNA分子的条件下组合,以提供切割的DNA产物。
2.根据权利要求I的方法,其中所述第二DNA分子与所述第一 DNA分子的转座酶识别部分和非-转座酶识别部分都不相同。
3.根据权利要求I的方法,其中所述转座酶是IS4家族转座酶。
4.根据权利要求3的方法,其中所述转座酶是在Vibrio种中天然发现的。
5.根据权利要求4的方法,其中所述转座酶是来自Vibrioharveyi的转座酶。
6.根据权利要求I的方法,其中所述第一识别序列、所述第二识别序列、或二者都是来自Vibrio harveyi的转座酶的识别序列。
7.根据权利要求6的方法,其中所述第一识别序列、所述第二识别序列、或二者都、是与天然存在的识别序列相差至少一个核苷酸的来自Vibrio harveyi的经修饰的转座酶的识别序列。
8.根据权利要求I的方法,其中在切割条件中的Mn+2浓度、Mg+2浓度或相加的Mn+2浓度和Mg+2浓度在约ImM和约IOOmM之间。
9.根据权利要求I的方法,其中在切割条件中的Mn+2浓度,theMg+2浓度,或相加的Mn+2浓度和Mg+2浓度在约5mM和约40mM之间。
10.根据权利要求I的方法,其还是对靶标DNA分子进行DNA片段化和标记的组合方法。
11.对靶标DNA分子进行DNA片段化和标记的组合的体外方法,所述方法包括 使 革巴标DNA分子; 包含至少一个双链部分的第一 DNA分子, 其中所述双链部分包含转座酶的第一识别序列; 包含至少一个双链部分的第二 DNA分子, 其中所述双链部分包含上述转座酶的第二识别序列;和上述转座酶 组合;使上述组合经受使得第一 DNA分子、第二 DNA分子和上述转座酶可与靶标DNA分子缔合并通过转座酶-介导的切割来切割靶标DNA分子的条件,以提供切割的并标记的DNA产物, 其中所述条件包括I-IOOmM的Mn+2、Mg+2或二者皆有。
12.根据权利要求11的方法,其中所述第一识别序不同于所述第二识别序列。
13.根据权利要求11的方法,其中使所述第一DNA分子、所述第二DNA分子和所述转座酶组合而得到一复合体,之后使该复合体与靶标DNA分子组合。
14.根据权利要求11的方法,其中所述转座酶是IS4家族转座酶。
15.根据权利要求11的方法,其中所述转座酶是在Vibrio种中天然发现的。
16.根据权利要求15的方法,其中所述转座酶是来自Vibrioharveyi的转座酶。
17.根据权利要求11的方法,其中所述转座酶是天然存在转座酶的突变体形式。
18.根据权利要求11的方法,其中在切割条件中的钾离子浓度小于50mM。
19.根据权利要求11的方法,其中在切割条件中的所述Mn+2浓度、Mg+2浓度或相加的Mn+2浓度和Mg+2浓度在约5mM和约40mM之间。
20.根据权利要求11的方法,其中在切割条件中的所述Mn+2浓度、Mg+2浓度或相加的Mn+2浓度和Mg+2浓度在约IOmM和约20mM之间。
全文摘要
本发明涉及用于通过转座酶的DNA片段化和标记的方法和组合物。本发明提供了转座酶-介导的使DNA靶标片段化和标记的新组合物。本发明涉及在转座酶反应中使用锰离子(Mn2+)来改进转座酶反应的令人吃惊的发现。本发明还涉及Mg2+离子可以比先前预想的高很多的水平用于具有野生型和/或工程改造的转座酶的转座酶反应中的令人吃惊的发现。本发明提供了在体外反应中使用天然存在的转座酶,以及用于切割、标记和扩增靶标DNA的改进的方案。
文档编号C12N15/10GK102796728SQ20121016697
公开日2012年11月28日 申请日期2012年5月23日 优先权日2011年5月23日
发明者亚历山大·S·贝尔亚夫 申请人:安捷伦科技有限公司