一种快速构建单细胞dna测序文库的方法和试剂盒的利记博彩app

文档序号:9246381阅读:1401来源:国知局
一种快速构建单细胞dna测序文库的方法和试剂盒的利记博彩app
【技术领域】
[0001] 本发明涉及用于构建单细胞DNA测序文库的方法和试剂盒,更具体的,本发明涉 及用于构建高通量测序的单细胞DNA测序文库的方法和试剂盒。
【背景技术】
[0002] 随着人类基因组计划的完成,Sanger测序已进入广大科研人员的研究中。但是科 技的不断革新使得这种双脱氧核苷酸终止的测序模式愈发不能满足测序的需求,于是新的 高通量测序(也称第二代测序)模式应运而生。这种测序技术使得测序费用更低,测序通量 更高,测序时间更短。高通量测序技术的核心思想是边合成边测序,即通过捕捉新合成的末 端的标记来确定DNA的序列。现有的技术平台主要包括Roche/454FLX、IllUmina/Hiseq、 Miseq、NextSeq和LifeTechnologies/SOLIDsystem、PGM、Proton等。到目前为止,HiSeq 2000每个run可以达到6个人基因组30X覆盖的测序通量,约600G/run数据,在测序时间 上HiSeq2500可以达到平均每8分钟读取一个碱基的速度。而且随着第二代测序技术的成 熟,将其应用于临床的研究迅猛发展。
[0003] 随着测序技术的发展,测序成本的降低,基因组测序技术已成为一种常规技术。以 往的基因组测序或者转录组测序都是基于多细胞的水平进行的,然而这种的测序模式忽略 了细胞间的异质性,以及忽略了细胞间异质性所导致的基因表达、细胞行为、药物反应的差 异。近期针对肿瘤发病人群中循环肿瘤细胞的研究也成为一热点。肿瘤图谱的绘制,对于 研究肿瘤的进化,包括肿瘤的转移不同发病时间段肿瘤的特异性,以及肿瘤扩散都有极为 关键的意义。此外,单细胞研究在早期胚胎发育过程尤其是植入前胚胎的筛选有非常大的 临床指导意义。基于单细胞在临床研究中的迫切性,对单细胞基因组的测序也愈发重要。
[0004] 目前针对单细胞DNA测序文库构建主要是通过全基因组扩增(WholeGenome Amplificati〇n,WGA)的方式使得基因组DNA大量复制,复制后的基因组DNA能够达到微克 级量,足量的经过扩增后的基因组DNA再通过文库制备流程进行基因组DNA文库制备。目前 市场上关于WGA扩增方式主要有两种:第一种为链置换方式,该扩增方式主要是采用phi29 酶恒温扩增,从而实现对基因组DNA的链置换方式的扩增;第二种为通过聚合酶作用实现 的两部扩增法,该扩增方式通过两次PCR实现对基因组DNA的扩增。扩增后的基因组DNA 可以通过多种方式来构建测序文库(见图1)。比较经典的有两种方式:第一种为比较基础 的基因组DNA文库制备方法,此方法中基因组DNA经过超声或者酶切打断,打断后的DNA进 行末端修复,加A,加接头,最后通过PCR得到所需的上机测序文库;第二种是通过转座酶的 方式将基因组DNA打断的同时加入接头,最后通过PCR得到所需的上机测序文库。目前市 场所推出的针对单细胞测序文库构建的试剂盒也是基于以上方案设计,首先单细胞基因组 DNA经过WGA扩增的过程,扩增后的基因组DNA再进行常规的测序文库构建。以上所述单 细胞DNA测序文库构建方法和试剂盒主要存在两方面的缺陷:首先,从WGA到建库的流程复 杂,所需时间也较长,至少两天的时间才能完成整个流程,不适合大规模的生产应用;其次, WGA扩增所引入的PCR碱基偏好性较大,从而导致整个基因组的覆盖度和均一性较差。因 此,迫切需要一种新的方法和试剂盒来改善目前单细胞DNA测序文库构建的结果。

【发明内容】

[0005] 鉴于目前单细胞DNA测序文库构建过程中所遇到的问题,本发明人发现了新的更 加简化、更加快速、更加均一的单细胞DNA测序文库的构建方法,其可适用于多种第二代测 序平台,包括但不限于如R〇che/454FLX、Illumina/Hiseq、Miseq和LifeTechnologies/ SOLIDsystem、PGM、Proton等测序平台。
[0006] 本发明是基于以下的事实:本发明人发现,单细胞经过细胞裂解后,释放基因组 DNA,基因组DNA经过预扩增和二次扩增后即可得到可以上机测序的文库。本发明中只包含 细胞裂解、预扩增和二次扩增三步反应,并且三步反应完全可以在一个体系中完成,中间无 需有转管或者纯化的步骤。依据本发明,单细胞DNA测序可以得到有效的测序结果,并且可 以用于多种的信息分析。
[0007] 因此,本发明的第一个方面是提供一种用于构建单细胞DNA测序文库的方法,其 特征在于,包括:
[0008] 裂解细胞,释放基因组DNA;
[0009]将基因组DNA进行预扩增;
[0010] 将预扩增之后的基因组DNA进行二次扩增,以获得所述单细胞DNA测序文库。
[0011] 根据本发明的方法,所述将基因组DNA进行预扩增的酶为热稳定的聚合酶,可 以是一种,也可以是两种或者两种以上的组合。包含但不局限于以下的一种或者几种:LA-Taq,rTaq,Phusion,DeepVent,DeepVent(exo-),Gold360,PlatinumTaq,KAPA2G Robust.
[0012] 根据本发明的方法,所述将基因组DNA进行预扩增的引物为一段特殊设计的引 物。该引物从5'端开始有三部分主要结构:第一部分为通用区域,此区域在不同测序平台 中序列不同,长度为1至70个碱基,优选的为10-50个碱基,更优选的为10-30个碱基。本 通用区域为最终文库结构的一部分,在二次扩增时生成能直接用于测序的文库。此外,该通 用区域在一次扩增过程中使生成的产物自身形成类似发卡的结构,不再继续被扩增,使预 扩增实现线性扩增,使最终结果基因组覆盖更均匀。第二部分为简并碱基区域,该区域只包 含两种不互补的碱基,A和C,或A和G,或T和C,或T和G,长度为2-20个碱基,优选的为 5-15个碱基,更优选的为5-10个碱基。该设计避免了预扩增过程中引物的交叉杂交或自 杂交,以实现预扩增的均一性。第三部分为随机简并碱基区域,其中每个碱基可以是A、T、 C、或G,并且在最后三个随机简并碱基之间加入两个硫代修饰,长度为1-8个碱基(详见图 4),优选的,其长度为2-6个碱基;最优选的,其长度为3或4个碱基。本发明中特殊的简并 碱基区域的设计提高了产物在基因组上的覆盖度。
[0013] 根据一个特别优选的实施方式,该预扩增引物序列为
[0014] 5' GCTCTTCCGATCTRRRRRRRRRRN*N*N3'
[0015] 5'GCTCTTCCGATCTMMMMMMMMMMN*N*N3,
[0016] 5, GCTCTTCCGATCTYYYYYYYYYYN*N*N3'
[0017] 5' GCTCTTCCGATCTKKKKKKKKKKN*N*N3'
[0018] 其中R代表A或G碱基,M代表A或C碱基,Y代表C或T碱基,K代表G或T碱 基。N代表随机简并碱基A/T/C/G,*代表硫代修饰。
[0019] 硫代修饰为在寡聚核苷酸合成时将连接两个单核苷酸之间的磷酸二酯键中的一 个氧换成硫,加入硫代修饰后碱基不容易被核酸外切酶切掉,从而可以增加引物的特异性, 防止扩增过程中引物二聚体的出现。
[0020] 根据本发明的方法,所述将基因组DNA进行二次扩增的酶为热稳定的聚合酶,可 以是一种,也可以是两种或者两种以上的组合。包含但不局限于以下的一种或者几种: LA-Taq,rTaq,Phusion,DeepVent,DeepVent(exo-),Gold360,PlatinumTaq,KAPA2G Robust。
[0021] 根据本发明的方法,所述将基因组DNA进行二次扩增的引物由两部分组成。从DNA 5'端开始,第一部分为外延伸区,该区域含有可以和上机测序通用杂交引物相结合的区域, 第二部分为引物匹配区,该区域含有可以和预扩增引物杂交区域。在不同的实施方案中,外 延伸区可以含有barcode序列,用于区分不同的样本或者给样本引入特殊的特征标记。所 述barcode序列可以由ATCG四种碱基随意组合,碱基长度可以不固定。
[0022] 根据一个特别优选的实施方式,该二次扩增引物序列为:
[0023]primer1 :5 'AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGAT
[0024]indexprimer:5'CAAGCAGAAGACGGCATACGAGATATGCTTGTGACTGGAGTTCAGACGTGTGCT CTTCCGATCT3'
[0025] 其中indexprimer中下划线部分碱基代表barcode序列。
[0026] 根据本发明的方法,所述将细胞裂解的酶为ProteinaseK,或者Protease,或者二 者的组合。
[0027] 在一种实施方式中,本发明所述裂解的细胞为单细胞或者多细胞。
[0028] 在另一种实施方式中,本发明所述起始样本为DNA,包括但不限于基因组DNA,线 粒体DNA,长片段PCR产物,或者长片段染色质免疫共沉淀DNA。
[0029] 在又一种实施方式中,本发明所述起始样本为RNA反转录产物cDNA。
[0030] 本发明的第二个方面提供了一种用于构建单细胞DNA测序文库的试剂盒,该试剂 盒包含:1.将细胞进行裂解的裂解缓冲液和裂解酶;2.用于预扩增的引物、缓冲液和DNA 聚合酶;3.用于二次扩增的引物、缓冲液和DNA聚合酶。
[0031] 根据本发明的试剂盒,所述将基因组DNA进行预扩增的酶为热稳定的聚合酶,可 以是一种,也可以是两种或者两种以上的组合。包含但不局限于以下的一种或者几种: LA-Taq,rTaq,Phusion,DeepVent,DeepVent(exo-),Gold360,PlatinumTaq,KAPA2G Robust.
[0032] 根据本发明的试剂盒,所述将基因组DNA进行预扩增的引物为一段特殊设计的引 物。该引物从5'端开始有三部分主要结构:第一部分为通用区域,此区域在不同测序平台 中序列不同,其长度为1至70个碱基,优选的为10-50个碱基,更优选的为10-30个碱基。 第二部分为简并碱基区域,该区域只包含两种不互补的碱基,A和C,或A和G,或T和C,或 T和G,长度为2-20个碱基,优选的为5-15个碱基,更优选的为5-10个碱基。第三部分为 随机简并碱基区域,其中每个碱基可以是A、T、C、或G,并且在最后三个随机简并碱基之间 加入两个硫代修饰(详见图4)。其长度为1-8个碱基,优选的,其长度为2-6个碱基;最优 选的,其长度为3或4个碱基。
[0033] 根据一个特别优选的实施方式,该预扩增的引物序列为
[0034] 5' GCTCTTCCGATCTRRRRRRRRRRN*N*N3'
[0035]5'GCTCTTCCGATCTMMMMMMMMMMN*N*N3,
[0036] 5' GCTCTTCCGATCTYYYYYYYYYYN*N*N3'
[0037] 5' GCTCTTCCGATCTKKKKKKKKKKN*N*N3'
[0038] 其中R代表A或G碱基,M代表A或C碱基,Y代表C或T碱基,K代表G或T碱 基。N代表随机简并碱基A/T/C/G,*代表硫代修饰。
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1