环状小rna文库构建方法及其应用

文档序号:10621962阅读:2197来源:国知局
环状小rna文库构建方法及其应用
【专利摘要】本发明提供了一种单链环状小RNA文库构建的方法,具体地涉及单链环状小RNA文库构建,所述单链环状小RNA文库还可用cPAL测序平台进行测序。本发明具有测序通量高,准确度高和操作简便的优点。
【专利说明】
环状小RNA文库构建方法及其应用
技术领域
[0001] 本发明属于生物技术领域,具体地说,本发明涉及环状小RNA文库构建的方法及 其应用。
【背景技术】
[0002] 小RNA包括几种不同类型的非编码RNA :微型RNA (miRNA),短的干扰RNA (siRNA), 核仁小RNA(snoRNA)和细胞核小RNA(snRNA)。在这些内源性的小RNA中,miRNA在生物起 源以及功能机制方面都是研究的最全面的。miRNA是一类只有20-25个核苷酸的小RNA分 子,主要通过结合到mRNA上的靶位点进行转录后调控,然后根据互补程度的不同指导使靶 mRNA降解或者阻遏靶mRNA的翻译,在基因转录、翻译、细胞生长和个体发育过程中起到重 要作用。
[0003] 近几年来,通过高通量测序技术研究小RNA的手段越来越成熟,并且形成了相关 的建库试剂盒,最常见的就是illumina公司的Truseq small RNA-seq试剂盒,New England Biolab (NEB)公司的NEBNfeNfr81 Small RNA Library Prep Set 试剂盒和 Ion Prepare Small RNA Libraries试剂盒。前二者都是基于边合成边测序(SBS)的技术,第三个是基于半导体 测序技术。无论哪种测序技术,需要构建的都是线性的文库,文库再通过在芯片上扩增聚集 或通过油包水相扩增后平铺在芯片上,进行测序以及序列信号的捕获。由于此类文库的构 造性质,通过扩增后的样品在芯片上分布不均一,导致捕获的信号强度也分布不均匀,从而 出现测序错误。
[0004] 基于联合探针锚定连接测序技术(combinatorial probe-anchor ligation, cPAL)的高通量测序平台是一种新型的高通量测序平台,该平台测序需要的文库是一种带 有接头序列的单链环状分子,通过对这种环状分子进行滚环复制,形成缠绕折叠的线性DNA 纳米球(DNA nanoball,DNB)。控制滚环复制的时间就可以控制DNB的大小,也就是相同的 复制时间获得的DNB大小是一样的,把这些相同大小的DNB通过重力作用,就可以使之均匀 的平铺在芯片上,这样测序时获得的DNB的信号就是均一的,从而提高了测序的准确率。
[0005] 目前基于cPAL的高通量测序平台还没有相应的小RNA文库的构建方法,为解决这 一问题,本发明开发了一种针对长度只有18_30nt的小RNA,将其构建成单链环状的文库, 并使这种文库能用cPAL方法测序的技术。
[0006] 综上所述,本领域迫切需要开发可高效、全面测定样品中小RNA种类的方法。

【发明内容】

[0007] 本发明的目的是提供一种高效、全面测定样品中小RNA种类的方法。
[0008] 本发明的另一目的在于提供一种高效制备高质量的、特别适用于cPAL测序平台 的小RNA单链环状文库的方法以及用该方法制备的高质量的小RNA单链环状文库。
[0009] 在本发明的第一方面,提供了一种单链环状小RNA文库的构建方法,包括步骤:
[0010] (a)提供分离的总RNA样本;
[0011] (b)对所述的总RNA样本进行纯化处理,从而获得纯化的总RNA ;
[0012] (c)在所述的纯化的总RNA的3'端连接带有条形码(barcode)的3'接头,从而获 得3'端带有条形码(barcode)的3'接头的总RNA ;
[0013] (d)将上述步骤(c)中获得的所述的3'端带有条形码(barcode)的3'接头的总 RNA,与反转录引物在3'接头区域进行退火,从而获得退火产物;
[0014] (e)对上一步骤⑷获得的所述退火产物进行5'接头连接,从而带有5'接头的所 述退火产物;
[0015] (f)对上一步骤(e)中获得的带有5'接头的所述退火产物进行反转录,从而获得 两端带有接头的cDNA ;
[0016] (g)对上一步骤(f)中获得的cDNA产物进行PCR扩增,从而获得DNA扩增产物;
[0017] (h)对上一步骤中得到的所述DNA扩增产物,用聚丙烯酰胺凝胶电泳分离并回收 85-97bp (对应于插入片段为18-30bp)小RNA的扩增产物,获得纯化的DNA片段;
[0018] (i)将上一步骤中获得的纯化DNA片段,与标记有亲和素的磁珠通过"亲和素-生 物素"进行结合,并碱性溶液进行处理,使没有生物素标记的那条链从磁珠上分离下来,再 用酸溶液进行中和,从而获得两端带有接头序列的单链DNA溶液;
[0019] (j)在上一步骤中得到的所述的两端带有接头序列的单链DNA溶液中,加入与两 端接头序列匹配的桥式DNA引物和连接酶,进行单链环化反应,从而获得含有单链环化分 子的混合物;
[0020] (k)对上一步骤中所述的含单链环化分子的混合物,用特异性线性核酸酶消化掉 未环化的单链DNA以及桥式DNA引物;从而获得含有未消化的单链环化产物的混合物;
[0021] (1)对上一步骤中的所述含有未消化的单链环化产物的混合物进行纯化定量,分 离出所述的环化产物,从而获得小RNA测序单链环状DNA文库。
[0022] 在另一优选例中,在步骤(h)中聚丙烯酰胺凝胶电泳分离并回收的小RNA扩增产 物的长度为85-97bp (对应于插入片段为18-30bp)。
[0023] 在另一优选例中,在步骤(c)中,所述的3'接头设有用于以区分不同的样品的条 形码(barcode)区,以及与cPAL测序的锚定序列相匹配的锚定匹配区。
[0024] 在另一优选例中,所述3'接头的5'端被腺苷酰化修饰。
[0025] 在另一优选例中,所述的条形码区的长度为10bp。
[0026] 在另一优选例中,所述的条形码区的序列选自下组:SEQ ID NO: 1-8。
[0027] TGTCATAAAT (SEQ ID NO. :1),
[0028] TTAATTAAGG (SEQ ID NO. : 2),
[0029] GACTCACTGA (SEQ ID NO. : 3),
[0030] ATAAGGCAGT (SEQ ID NO. : 4),
[0031] TTGATAGATT (SEQ ID NO. : 5),
[0032] CCTTCCTGGT (SEQ ID NO. : 6),
[0033] AATATCTCTC (SEQ ID NO. : 7),
[0034] CATGTTTCCC(SEQ ID NO. :8)。
[0035] 在另一优选例中,整个3'接头的5' -3'序列为如下式I结构:
[0036] Z1-Z2-Z3 (I)
[0037] 式中,
[0038] Z1 为 GTCTCCAGTCGAAGCCCGATC(SEQ ID NO. :9);
[0039] Z2为长度为8-12bp的条形码区;较佳地为SEQ ID NO. : 1-8中任一所示的条形 码区;
[0040] Z3 为 GAGCTTGTCT(SEQ ID N0. : 10)。
[0041] 在另一优选例中,在步骤(d)中,所述的反转录引物带有与3'接头完全匹配的条 形码(barcode);
[0042] 在另一优选例中,步骤(d)中,所述的接头中包括一种或多种不同的条形码区。
[0043] 在另一优选例中,步骤(e)中所述的5'接头是一段RNA序列:5'-rUrCrCrUrArArG rArCrCrGrCrUrUrGrGrCrCrUrCrCrGrArCrUrlU'(SEQ ID NO. : 11),所述的 RNA 序列与 cPAL 测序的锚定序列相匹配,其5'端和3'未作特殊修饰;
[0044] 在另一优选例中,在步骤(g)中,在所述的PCR扩增时,下游引物使用反转录引物 5'AGACAAGCTCNNNNNNNNNNGATCGGGCTTCGACTGGAGAC-3'(SEQIDN0·:12),上游引物使用与 5'接头序列相同的 DNA 序列(SEQ ID NO. :13/5'bi〇-TCCTAAGACCGCTTGGCCTCCGACTT-3'), 并且在上游引物的5'端有一个生物素标记。
[0045] 在另一优选例中,在步骤(h)中,所述的聚丙烯酰胺凝胶浓度为4-8%,较佳的为 5-8%,更佳的为6-7%。
[0046] 在另一优选例中,所述的琼脂糖凝胶浓度为4%。
[0047] 在另一优选例中,所述的聚丙烯酰胺凝胶浓度为6%。
[0048] 在另一优选例中,步骤(i)中,所述的磁珠上固定有用于捕获DNA分子的寡核苷酸 序列。
[0049] 在另一优选例中,所述的寡核苷酸序列与所述接头序列是互补的。
[0050] 在另一优选例中,步骤(i)中,所述的磁珠通过生物素-链霉素相互作用,捕获所 述的DNA分子。
[0051] 在另一优选例中,步骤(g)中,所述的引物对包括:
[0052] 正向引物:(SEQ ID N0. :12 :5'AGACAAGCTCNNNNNNNNNNGATCGGGCTTCGACTGGAG AC-3' )和
[0053] 反向引物:/5-bicV(SEQ ID NO. :13/5-bio/TCCTAAGACCGCTTGGCCTCCGACTT-3');
[0054] 其中,/5-bio/表示5'端的生物素修饰基团。
[0055] 在另一优选例中,在步骤(h)和(i)之间,还包括:用荧光染料对纯化的DNA片段 进行含量测定,从而确定纯化DNA片段的总量。
[0056] 在另一优选例中,步骤(i)中,用于该步骤的DNA片段的总量不低于200ng,较佳地 不低于300ng,更佳地不低于400ng。
[0057] 在另一优选例中,步骤(i)中所述的亲和素的磁珠为链霉素磁珠。
[0058] 在另一优选例中,步骤(j)中,所述的桥式DNA引物的序列为(SEQ ID N0. : 14)5' -GAGCTTGTCTTCCTAAGACCGC-3'。
[0059] 在另一优选例中,步骤(k)中,所述的核酸酶为外切酶。
[0060] 在另一优选例中,步骤(k)中,所述的核酸酶为特异性切割单链和双链线性DNA的 外切酶。
[0061] 在另一优选例中,所述的外切酶包括ENo I和ENo III的混合酶。
[0062] 在另一优选例中,在步骤(1)之后,还包括步骤:
[0063] (m)对所述的小RNA测序单链环状文库进行浓度标准化处理,从而获得预定浓度 7. 5fmol/ul的小RNA测序单链环状文库;
[0064] (η)对步骤(m)中所述的预定浓度的小RNA测序单链环状文库进行滚环复 制形成纳米球(DNA nanoball,DNB),然后用联合探针锚定连接测序(combinatorial probe-anchor ligation, cPAL)方法进行测序。
[0065] 在另一优选例中,步骤(m)中,所述的预定浓度为单链分子约6-9fmol/ul,较佳地 为约 7. 5fmol/ul。
[0066] 在另一优选例中,步骤(η)中所述的单链环状小RNA长度为85_97nt(对应于 18-30nt的插入片段的长度)。
[0067] 在本发明的第二方面,提供了用于小RNA测序的单链环状文库,所述的单链环状 文库是用本发明的第一方面提供的构建方法制备的。
[0068] 在另一优选例中,所述的小RNA单链环状文库是微型RNA(miRNA)单链环状文库。
[0069] 在另一优选例中,所述的小RNA单链环状文库是短的干扰RNA (siRNA)单链环状文 库。
[0070] 在另一优选例中,所述的小RNA单链环状文库是细胞核小RNA(snRNA)单链环状文 库。
[0071] 在另一优选例中,所述的小RNA单链环状文库是包括miRNA、siRNA、核仁小 RNA(snoRNA)和(snRNA)或其组合的单链环状文库。
[0072] 在另一优选例中,所述的小RNA单链环状文库,具有选自下组的一个或多个特 征:
[0073] (1)单链环状的DNA分子;
[0074] (2)大小为 85_97bp ;
[0075] (3)浓度为约 6_9fmol/ul (较佳地约 7. 5fmol/ul)。
[0076] 在本发明的第三方面,提供了本发明第二方面所述的小RNA测序单链环状文库的 用途,该用途用作cPAL方法的文库。
[0077] 在另一优选例中,所述的测序为小RNA测序。
[0078] 在另一优选例中,所述的小RNA测序包括生物体的总小RNA测序。
[0079] 在另一优选例中,所述的生物体包括人、动物或植物。
[0080] 在另一优选例中,所述的动物包括小鼠。
[0081] 在另一优选例中,所述的植物包括水稻。
[0082] 在另一优选例中,所述的小RNA测序包括生物体细胞的总小RNA测序
[0083] 在另一优选例中,所述的小RNA测序包括人细胞的总RNA测序。
[0084] 在另一优选例中,所述的细胞至少包括体细胞、生殖细胞、胚胎细胞、干细胞、肿瘤 细胞。
[0085] 应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具 体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在 此不再一一累述。
【附图说明】
[0086] 图1显示了单链环状小RNA文库构建方法流程图。
[0087] 图2显示了 6%聚丙烯酰胺凝胶电泳(左)和4%琼脂糖凝胶电泳(右)。
【具体实施方式】
[0088] 本发明人通过广泛而深入的研究,首次开发了一种高效制备高质量的、可用于小 RNA单链环状分子文库构建的新技术。实验结果证明,用本发明所述建库方法所构建的小 RNA测序单链环状文库,其文库质量非常高,使之能用于cPAL原理测序平台,所得到的数据 准确度高、可信度佳,对信息分析没有影响。在此基础上完成了本发明。
[0089] 具体地,本发明人通过用与3'接头相同长度的反转录引物退火的方式,从而形成 双链DNA,通过PCR时引入的生物素标记,分离出单链DNA并将之环化形成单链环状分子,把 不同样品混合切胶回收的方法以提供足够的产物进行下一步的反应;开发了小RNA单链环 状分子文库的构建方法,使之能用于cPAL原理测序的平台。
[0090] 术语
[0091] 在本发明中,术语"小RNA"指包括几种小RNA分子的不同类型的非编码RNA :微型 RNA (miRNA),短的干扰 RNA (siRNA),核仁小 RNA (snoRNA)和细胞核小 RNA (snRNA)。18-30nt 主要是微型小RNA。
[0092] DNA 条形码(DNA barcode)
[0093] DNA条形码(DNA barcode)是易扩增、相对较短且具有识别性的DNA片段。
[0094] 利用DNA条形码,可以在一次测序中测定来自于多个物种、来自于多个个体、或来 自于同一个体的不同样本,并基于各自随携带的特异性DNA条形码,直接对测序的读序进 行分类,以便于汇总分析。
[0095] cPAL测序平台
[0096] 联合探针锚定序列连接方法(combinatorial probe-anchor ligation, cPAL),在 测序方面,用单个碱基读取荧光信号的连接测序,但其荧光探针来源独立的探针库,该探针 库与锚定序列发生连接反应,通过荧光颜色对应读取相应的碱基信息,利用DNA纳米球阵 列芯片技术,可运用多个普通探针,联同标准锚定序列和延伸锚定序列进行杂交和连接检 测。这多个普通探针分为两组,一组用于检测接头位点的5'端,一组检测接头位点的3'端。 每组有多型,每型有4种普通探针。标准锚定序列直接与接头的5'或3'端连接,随后普通 探针进行杂交和连接。延伸的锚定序列由兼并和标准锚定序列连接而成。这种组合的探针 锚定序列连接方法(combinatorial probe-anchor ligation, cPAL)使序列读长由5个碱 基增加到10个碱基,再通过多种随机的6碱基序列组合占位,可使读长增加到28bp。
[0097] 构建文库的方法
[0098] 本发明人通过用与3'接头相同长度的反转录引物退火的方式以减少过量的3' 接头与5'接头的连接,从而形成3'接头+插入片段+5'接头的双链DNA,通过PCR时引入 的生物素标记,分离出单链DNA并将之环化形成单链环状分子,把不同样品混合切胶回收 的方法以提供足够的产物进行滚环复制制备成DNA纳米球(DNA nanoball,DNB),然后用 cPAL测序平台对小RNA单链环状分子进行测序,获得高通量、信号均一及准确率高的小RNA 单链环状分子文库。
[0099] 单链环状文库
[0100] 在本发明中,还提供了用本发明上述文库构建方法所制备的适用于小RNA分子测 序的单链环状文库。
[0101] 在本发明的优选例中,本发明人通过用与3'接头相同长度的反转录引物退火的方 式,形成双链DNA,同时使加完3'接头后过量的接头被反转录引物所吸收,大大降低了过量 的接头再被T4 RNA ligase 1识别并连接到5'接头上的几率,在进行PCR扩增时这种接头 自连的扩增产物也很大程度减少,从而有效降低了切胶回收时靶物片段受污染的几率。此 外,选用不同样品,进行多次混合切胶回收的方法以提供足够的产物进行滚环复制制备成 DNB,形成缠绕折叠的线性DNA纳米球(DNB)。控制滚环复制的时间就可以控制DNB的大小, 也就是相同的复制时间获得的DNB大小是一样的,把这些相同大小的DNB通过重力作用,就 可以使之均匀的平铺在芯片上,这样测序时获得的DNB的信号就是均一的,从而提高了测 序的准确率。此外,特别值得一提的是,基于联合探针锚定连接测序技术(combinatorial probe-anchor ligation, cPAL)的高通量测序平台需要的文库是一种带有接头序列的单链 环状分子,实验结果证明利用本发明的小RNA单链环状文库通过cPAL测序所获得的测序数 据准确度高。
[0102] 本发明主要优点在于:
[0103] (1)首次发明了用于小RNA测序中单链环状文库的构建方法。
[0104] (2)本发明的小RNA单链环状文库可用于cPAL测序平台。
[0105] (3)本发明提供的方法具有测序通量高,准确度高和操作简便。
[0106] (4)本发明提供的方法不但具有耗材耗时少且稳定性,可重复性和可靠性高的特 点。
[0107] 下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发 明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规 条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press, 1989)或植物分子生物学-实验手册(Plant Molecular Biology-A Laboratory Mannual, Melody S. Clark编,Springer-verlag Berlin Heidelberg, 1997)中所述的条件, 或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
[0108] 材料和方法
[0109] 1.人细胞的RNA标准品(UHRR和HBRR),小鼠 RNA以及水稻RNA
[0110] 本发明实施例中所用的实验材料如无特殊说明均可从市售渠道获得,其中,UHRR 购自安捷伦公司(Agilent),HBRR购自Ambion公司,小鼠 RNA和水稻RNA分别是从小鼠肝 脏和日本晴叶片组织提取。
[0111] 实施例1小RNA单链环状文库的构建
[0112] 具体实验步骤(见图1中所示流程步骤):
[0113] 1.带有条形码(barcode)的3'接头的连接。该3'接头是一段DNA序列,与cPAL 测序的锚定序列相匹配,并且带有l〇bp的条形码(barcode)序列,以便于区分不同的样品。 在3'接头的5'端有腺苷酰化修饰,该修饰能够在没有三磷酸腺苷(ATP)的条件下被T4RNA ligase 2truncated特异性识别,将其连接到RNA的3'羟基上,这样能够避免带有5'磷酸 的RNA发生自连。具体的反应过程为:取lug总RNA,加入lul lOuM的3'接头,PCR仪中 70°C反应2分钟,以打开序列的二级结构。再加入反应混合液:2N T4 RNA ligase buffer 5ul,RNase 抑制剂(40U/ul)0.5ul,T4RNA ligase 2 truncated (200U/ul) lul,补无 RNA 酶 水至反应体积为 l〇ul。其中 2N T4 RNA ligase buffer包括:100mM Tris-HCl,20mM MgC12, 2mM DTT,25%的PEG8000,其余试剂为无 RNA酶水。把反应混合液混匀后,在PCR仪中,25°C 反应2小时。
[0114] 2.加入反转录引物与3'接头进行退火,以阻止过量的3'接头在下一步反应中与 5'接头发生连接。由于3'接头是带有条形码(barcode)的,所加入的反转录引物必须与 3'接头完全匹配,也要带有条形码(barcode),这样二者退火形成双链,过量的3'接头就不 能被RNA ligase识别并连接到5'接头上,减少了接头自连的形成。具体反应过程为:取 0.5ul 100uM的带有条形码(barcode)的反转录引物加入加完3'接头的连接反应液中混 匀,放入PCR仪中反应,反应程序为:75°C 5min,37°C 30min,25°C 15min。
[0115] 3. 5'接头的连接。5'接头是一段RNA序列,该序列同样与cPAL测序的锚定序列 相匹配,其5'端和3'端未作特殊修饰,所以两端都是羟基。在ATP的存在下,使用T4 RNA ligase 1能将RNA的5'磷酸基团与5'接头的3'羟基连接在一起。连接反应条件为:取 lul 10uM 5'接头,PCR仪中70°C反应2分钟,以打开序列的二级结构。冰上冷却2分钟 后,将其加入步骤二的反应产物中,然后加入酶反应混合液:10mM ATP lul,RNase抑制剂 (40U/ul) lul,T4 RNA ligase 1 (10U/ul) lul。混匀后在 PCR 仪中 20°C反应 1 小时。
[0116] 4.反转录合成两端带有接头的cDNA并进行PCR扩增。由于在步骤二中已经加入 了反转录引物,因此直接加入反转录的酶反应混合物进行反应即可:5N第一链缓冲液5ul, 0.1M DTT 0.5ul,10mM dNTP 0.5ul,RNase 抑制剂(40U/ul)0.5ul,superscript I I(200U/ ul)0. 5ul。反应程序为:42°C30min,70°C 15min,12°C保温。反转录后需要进行PCR扩增以 富集带有接头序列的单链cDNA模板,扩增时下游引物使用反转录引物,上游引物与5'接头 的序列相同,不过是DNA序列,并且在上游引物的5'端有一个生物素标记,以便于后续的单 链分离反应。PCR反应体系为:
[0117]
[0118]
[0119] 反应程序为:
[0120]
[0121] 5. 6%聚丙烯酰胺凝胶电泳分离并回收相应位置的小RNA片段。由于前面的酶反 应过程都是针对总RNA的,如果把他们全部拿去测序则需要测很大的数据量才能得到足够 的小RNA信息。因此需要通过电泳回收纯化来富集小RNA的PCR产物。这个产物可以通过 6%聚丙烯酰胺凝胶电泳或4%的琼脂糖凝胶进行回收,但是后者的回收效率不如前者,因 此我们选用了 6%聚丙烯酰胺凝胶电泳。一个样品回收的产量比较低,不能满足后续的实验 起始量,所以我们将8个带有不同条形码(barcode)样品的PCR产物混合在一起,再进行电 泳回收纯化,这样不仅节省了切胶的时间,而且还减少了物料消耗的成本。选择8种条形码 (barcode)进行混合则是为了在测序时使1个通道的测序文库达到碱基平衡。具体的内容 为:把8种不同barcode的样品混合起来约160ul,加32ul6X loading buffer,分6个加样 孔上样到6%聚丙烯酰胺凝胶;另取2ul 20bp DNA ladder marker加样于中间一孔。180V 电泳约25分钟,溴酚蓝跑到距下沿约1/5处,即可停止电泳。染胶4-5分钟。拍照,见图2。 切下约80-100bp的条带,将切下的主带胶块置于0. 5ml已扎孔的离心管(套在2ml离心管 上),13600rpm离心2分钟,使胶块通过小孔挤成碎胶。在碎胶中加入400ul 0. 3M NaCl, 室温下混匀器颠倒混匀2小时,洗脱DNA。将碎胶和缓冲液转入Spin-N filter,13600rpm 离心2分钟。向洗脱液中加入2ul完全融化的糖原,40ul 3M NaAC(NaAC的体积=1/10倍 的洗脱液体积),l〇〇〇ul 100%乙醇(乙醇体积按照洗脱液的体积计算)。混匀后-80°C放 置30分钟或更长,以提高回收效率,4°C 13600rpm离心30分钟。离心后会见到白色沉淀, 弃上清,再用l〇〇〇ul 70%或75%乙醇洗涤沉淀,晾干,用30ul洗脱溶液溶解白色沉淀。荧 光染料定量检测DNA浓度,取总量不低于200ng,进行后续的单链分离及环化过程。
[0122] 6.把步骤5回收的产物分离出一条单链DNA,并进行桥式环化,纯化后定量,即可 用于cPAL测序。PCR的过程中,通过引物在PCR产物的一条链上的5'端引入了生物素标 记,这个标记能够稳定结合到链霉素磁珠上,然后用碱溶液破坏DNA双链间的氢键,使没有 生物素标记的那条链从磁珠上分离下来,再用酸溶液进行中和,就得到两端带有接头序列 的单链DNA溶液。向这个单链DNA溶液中加入一段与两端接头序列匹配的桥式DNA引物以 及连接酶等,使单链DNA形成一个环状分子。最后用线性外切酶消化掉未环化的单链DNA 以及桥式DNA引物并纯化定量,即得到可用于cPAL测序的小RNA单链环状DNA文库。具 体的内容为:将步骤五获得的PCR产物补水至体积为60ul,加入20ul 4NBBB (磁珠结合缓 冲液),混匀后将其加入用1NBBB悬浮的链霉素磁珠,结合15分钟后,在磁分离器上分离磁 珠,弃掉上清,再用BWB (磁珠清洗缓冲液)清洗磁珠两次,磁分离器上分离磁珠并吸干BWB 后,用26ul 0. 1M NaOH重悬磁珠,反应15分钟后,磁分离器上分离磁珠,吸取上清到一个 新的离心管中,再加入13ul 0. 3M的丙磺酸中和碱溶液,即得到单链DNA分子。向单链DNA 分子中加入 2.5ul 的桥式 DNA 引物,6ul ΙΟΝΤΑ buffer,0.6ul lOOmM ATP 和 0.4ul DNA ligase (600U/ul),用水补总体积至60ul,混匀后37°C反应1. 5小时。反应结束后再加入外 切酶消化混合物:lul ΙΟΝΤΑ buffer,2. lul 外切酶 I (20U/ul)和 1. 4ul 外切酶 III (100U/ ul)。混匀后37°C反应30分钟,再加入2. 5ul 500mMEDTA终止反应。反应产物补水40ul, 再加入10ul NaAc,2ul糖原,300ul无水乙醇,混匀后-80°C沉淀30分钟以上,4°C 13600rpm 离心30分钟,弃上清,再用600ul 75%乙醇洗涤沉淀,离心弃去乙醇后,室温下晾干后用 27ul溶解缓冲液溶解沉淀。最后获得的溶液即为单链环状的小RNA文库。
[0123] 7.浓度标准化
[0124] 按照单链分子定量测定的浓度调整DNB制备使用的样本起始量统一调整为 7.5fmol/ul〇
[0125] 8.文库上机测序。测序使用cPAL测序平台。
[0126] 结果
[0127] 对步骤1-7中制备的小RNA单链环状文库,采用cPAL测序平台(型号为 BlackBird)进行测序。
[0128] 对测序所产生的数据,用cPAL测序平台自带的程序Teramap进行信息分析,主要 以下步骤:
[0129] (1)过滤测序序列;
[0130] 过滤不合格序列包括:序列中测序结果不确定的碱基(如cPAL测序平台测序结果 中的N)个数超过整条序列碱基个数的10%则认为是不合格序列;除样本接头序列外,与其 它实验引入的外源序列比对,如各种接头序列。若序列中存在外源序列则认为是不合格序 列。原始的序列数据经过去除不合格序列处理后得到的序列数据我们称为干净的序列片段 (clean reads),作为后续分析的基础。
[0131] (2)干净的序列片段与参考序列比对;
[0132] 将高通量测序技术得到的干净的序列片段分别比对到参考基因组和参考基因序 列上。参考基因组序列和参考基因序列可取于公共数据库GeneBank和miRBase。
[0133] 实施例2鉴定小RNA单链环状文库的构建方法的重复性和稳定性
[0134] 重复实施例1中文库的制备步骤1-8,不同点在于,采用两种人细胞的RNA标准品 (UHRR和HBRR),小鼠 RNA以及水稻RNA共4种样品,作为总RNA的来源。每个样品使用总 RNA lug起始,先加3'接头,16个样品分别连接带有不同条形码(barcode)的3'接头,用 对应的带有条形码(barcode)的反转录引物进行退火以封闭过量的3'接头,再连接5'接 头以及反转录和PCR扩增。
[0135] PCR反应完成后,把16个样品分成两组,每组各8个样品(包含4种不同RNA样品, 每种各一个重复),再把两组分别混合,分别用6%丙烯酰胺凝胶和4%琼脂糖凝胶电泳回 收(图2)。回收后用荧光染料定量(表1),前者的回收产率高于后者,获得了 390ng DNA, 全部用来进行后续的单链分离步骤,得到约34ng的单链环状文库。而琼脂糖凝胶回收的 PCR产物较少,不够后续实验,所以未继续进行。
[0136] 把获得的单链环状文库进行滚环复制制备成DNB,然后用cPAL方式进行测序,得 到了约290M reads,平均长度为28bp,过滤掉污染及接头自连后约有80%的干净的序列片 段(clean reads),接头自连比例在2%以下(表2)。
[0137] 结果如图2、表1和表2所7K。
[0138] 表 1
[0143] 对所制备的单链环状文库的鉴定和测序的结果表明:
[0144] (a)用本实施例1和2方法作制备的文库可重复性和稳定性高;
[0145] (b)测序所得到的数据具有高通量和高准确度。
[0146] 对比例1
[0147] 重复实施例1,不同点在于:建库时加完3'接头后没有加入RT primer退火,直接 加5'接头。
[0148] 测序结果如表3所示。结果表明,数据中接头自连的比例很高,为约55%或以上, 这严重浪费数据。
[0149]
[0150] 在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独 引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可 以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范 围。
【主权项】
1. 一种单链环状小RNA文库的构建方法,其特征在于,包括步骤: (a) 提供分离的总RNA样本; (b) 对所述的总RNA样本进行纯化处理,从而获得纯化的总RNA ; (c) 在所述的纯化的总RNA的3'端连接带有条形码(barcode)的3'接头,从而获得 3'端带有条形码(barcode)的3'接头的总RNA ; (d) 将上述步骤(c)中获得的所述的3'端带有条形码(barcode)的3'接头的总RNA, 与反转录引物在3'接头区域进行退火,从而获得退火产物; (e) 对上一步骤(d)获得的所述退火产物进行5'接头连接,从而带有5'接头的所述退 火产物; (f) 对上一步骤(e)中获得的带有5'接头的所述退火产物进行反转录,从而获得两端 带有接头的cDNA ; (g) 对上一步骤(f)中获得的cDNA产物进行PCR扩增,从而获得DNA扩增产物; (h) 对上一步骤中得到的所述DNA扩增产物,用聚丙烯酰胺凝胶电泳分离并回收 85-97bp小RNA的扩增产物,获得纯化的DNA片段; (i) 将上一步骤中获得的纯化DNA片段,与标记有亲和素的磁珠通过"亲和素-生物素" 进行结合,并碱性溶液进行处理,使没有生物素标记的那条链从磁珠上分离下来,再用酸溶 液进行中和,从而获得两端带有接头序列的单链DNA溶液; (j) 在上一步骤中得到的所述的两端带有接头序列的单链DNA溶液中,加入与两端接 头序列匹配的桥式DNA引物和连接酶,进行单链环化反应,从而获得含有单链环化分子的 混合物; (k) 对上一步骤中所述的含单链环化分子的混合物,用特异性线性核酸酶消化掉未环 化的单链DNA以及桥式DNA引物;从而获得含有未消化的单链环化产物的混合物; (l) 对上一步骤中的所述含有未消化的单链环化产物的混合物进行纯化定量,分离出 所述的环化产物,从而获得小RNA测序单链环状DNA文库。2. 如权利要求1所述的方法,其特征在于,在步骤(h)中聚丙烯酰胺凝胶电泳分离并回 收的小RNA扩增产物的长度为85-97bp。3. 如权利要求1所述的方法,其特征在于,在步骤(c)中,所述的3'接头设有用于以区 分不同的样品的条形码(barcode)区,以及与cPAL测序的锚定序列相匹配的锚定匹配区。4. 如权利要求1所述的方法,其特征在于,所述3'接头的5'端被腺苷酰化修饰。5. 如权利要求1所述的方法,其特征在于,所述的条形码区的序列选自下组:SEQ ID NO:1-8 : TGTCATAAAT(SEQ ID NO. :1), TTAATTAAGG(SEQ ID NO. :2), GACTCACTGA(SEQ ID NO. :3), ATAAGGCAGT(SEQ ID NO. :4), TTGATAGATT(SEQ ID NO. :5), CCTTCCTGGT(SEQ ID NO. :6), AATATCTCTC(SEQ ID NO. :7), CATGTTTCCC(SEQ ID NO. :8)。6. 如权利要求1所述的方法,其特征在于,整个3'接头的5' -3'序列为如下式I结 构: Z1-Z2-Z3 (I) 式中, Z1 为 GTCTCCAGTCGAAGCCCGATC(SEQ ID NO. :9); Z2为长度为8-12bp的条形码区;较佳地为SEQ ID NO. : 1-8中任一所示的条形码区; Z3 为 GAGCTTGTCT(SEQ ID NO. :10)。7. 如权利要求1所述的方法,其特征在于,所述方法具有选自下组的一个或多个特征: 在步骤(e)中所述的 5' 接头是一段 RNA 序列:5' -rUrCrCrUrArArGrArCrCrGrCrUrUrG rGrCrCrUrCrCrGrArCrUrU-3'(SEQ ID NO. : 11),所述的 RNA 序列与 cPAL 测序的锚定序列相 匹配,其5'端和3'未作特殊修饰; 在步骤(g)中,在所述的PCR扩增时,下游引物使用反转录引物5'AGACAAGCTCNNNNNNN NNNGATCGGGCTTCGACTGGAGAC-3'(SEQ ID NO. :12),上游引物使用与 5'接头序列相同的 DNA 序列(SEQ ID NO. :13/5'bi〇-TCCTAAGACCGCTTGGCCTCCGACTT-3'),并且在上游引物的 5'端 有一个生物素标记; 在步骤(h)中,所述的聚丙烯酰胺凝胶浓度为4-8% ; 在步骤(i)中,所述的磁珠上固定有用于捕获DNA分子的寡核苷酸序列; 在步骤(i)中,所述的磁珠通过生物素-链霉素相互作用,捕获所述的DNA分子; 在步骤(g)中,所述的引物对包括: 正向引物:(SEQ ID NO. :12 :5' AGACAAGCTCNNNNNNNNNNGATCGGGCTTCGACTGGAGAC-3') 和 反向引物:/5_bicV(SEQ ID NO. :13/5-bio/TCCTAAGACCGCTTGGCCTCCGACTT-3'); 其中,/5-bio/表示5'端的生物素修饰基团; 在步骤(h)和(i)之间,还包括:用荧光染料对纯化的DNA片段进行含量测定,从而确 定纯化DNA片段的总量; 在步骤(i)中,用于该步骤的DNA片段的总量不低于200ng,较佳地不低于300ng,更佳 地不低于400ng ; 在步骤(j)中,所述的桥式DNA引物的序列为(SEQ ID NO. :14)5'-GAGCTTGTCTTCCTAA GACCGC-3,; 在步骤(k)中,所述的核酸酶为外切酶; 在步骤(k)中,所述的核酸酶为特异性切割单链和双链线性DNA的外切酶; 在步骤(1)之后,还包括步骤: (m)对所述的小RNA测序单链环状文库进行浓度标准化处理,从而获得预定浓度 7. 5fmol/ul的小RNA测序单链环状文库; (η)对步骤(m)中所述的预定浓度的小RNA测序单链环状文库进行滚环复制形成纳米 球(DNA nanobal 1,DNB),然后用联合探针锚定连接测序(combinatorial probe-anchor 1 igation, cPAL)方法进行测序。8. -种用于小RNA测序的单链环状文库,其特征在于,所述的单链环状文库是用如权 利要求1所述的构建方法制备的。9. 如权利要求8所述的单链环状文库,其特征在于,所述的文库具有选自下组的一个 或多个特征: (1) 单链环状的DNA分子; (2) 大小为 85-97bp ; (3) 浓度为约 6-9fmol/ul (较佳地约 7. 5fmol/ul)。10. 如权利要求8所述的小RNA测序单链环状文库的用途,其特征在于,用作cPAL方法 的文库。
【文档编号】C40B50/06GK105986324SQ201510072740
【公开日】2016年10月5日
【申请日】2015年2月11日
【发明人】祝珍珍, 张春燕, 耿春雨, 章文蔚, 蒋慧
【申请人】深圳华大基因研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1