小分子rna标签的利记博彩app

文档序号:586213阅读:378来源:国知局
专利名称:小分子rna标签的利记博彩app
技术领域
本发明涉及核酸测序技术领域,特别是小分子RNA测序技术领域。另外,本发明还涉及基于通过PCR引入分子标签的技术,以及小分子RNA文库制备方法。本发明的方法特别适用于第二代测序技术,尤其是solexa测序技术。
背景技术
小分子RNA (small RNA)是生物体内一类重要的特殊分子,诱导基因沉默,参与细胞生长、发育、基因转录和翻译等诸多生命活动的调控过程。基于solexa高通量测序技术的小RNA数字化分析,采用边合成边测序(SBS-sequencing by synthesis),可减少因二级结构造成的一段区域的缺失。并具有所需样品量少,高通量,高精确性,拥有简单易操作的自动化平台和功能强大等特点,一次性获得数百万条小分子RNA序列,能够快速全面地鉴定该物种在该状态下的小分子RNA和发现新的小分子RNA,构建样品之间的小分子RNA差异表达谱,为小分子RNA功能研究提供有力工具。目前iIlumina公司的Solexa测序平台提供的小分子RNA文库制备方法有两种, 分另1J 为方法——(Preparing Samples for analysis of small RNA)禾口方法二 (Preparing Samples for Small RNA Sequencing Usingthe Alternative vl. 5Protocol)。方法一,从总RNA中首先分离长度为18 30nt的小分子RNA,然后将分离的小分子RNA分别依次与 5’接头(也称为adapter)、3’接头连接,每次连接完接头后都需要切胶回收连接的目的片段,随后将带有已知接头的目的片段进行逆转录反应,通过PCR反应扩增带有接头的目的片段,最后切胶回收带有接头的目的片段文库[1],如

图1 (a);方法二,从总RNA中首先分离长度为18 30nt的小分子RNA,然后将分离的小分子RNA依次与3’接头、5’接头连接,其中方法二的接头连接顺序与方法一不同,且3’接头与方法一的3’接头序列的5’末端位点修饰不同,此外方法二中,连接完接头后不需要切胶回收目的片段,随后将带有已知接头的目的片段进行逆转录反应,通过PCR反应扩增带有接头的目的片段,最后切胶回收含有目的片段文库[2],如图1(b)。方法一使用T4RNA连接酶1来将目的片段分别和5’接头、3’接头发生连接反应, 其中T4RNA连接酶1在含有ATP的10XT4RNA连接酶1缓冲液反应体系中,20°C连接6 小时。该方法的缺点是费时费力,每次将目的片段与接头连接反应后需要通过PAGE电泳 (Polyacrylamide Gel Electrophoresis,聚丙烯酰胺凝胶电泳)来选择纯化回收的目的片段,在操作过程中也较容易造成RNA的降解。方法二将3’接头的5’末端进行预腺苷酰化处理,使用T4RNA连接酶2截短型 (T4RNL2truncated)将目的片段与3’接头进行连接反应,该酶可特异性地将DNA或RNA的预腺苷酰化5’末端连接到RNA 3’末端。连接时不需要ATP,但需要预腺苷酰化底物。与全长的T4RNA连接酶2不同,T4RNL2截短型酶不能将底物的5’末端腺苷酰化,因此无法将 RNA或DNA的5,磷酸末端连接到RNA3,端[3_5]。综上所述,方法一与方法二的最大区别在于,方法二在连接3’接头使用的连接酶为T4RNA连接酶2截短型,而方法一使用的是T4RNA连接酶1。由于T4RNA连接酶2截短型可以特异识别预腺苷酰化的修饰位点,所以将3’接头的5’端的碱基进行预腺苷酰化修饰, 该连接酶特异识别该位点后进行正确的连接反应。此外该连接酶还大大缩短了连接反应的时间,而且连接3’接头后不需要切胶选择目的片段分子,便可直接与5’接头进行连接,连接5’接头后也不需要切胶选择目的片段分子,可直接进行RT-PCR反应,所以方法二相对方法一更省时省力。方法一和方法二这两种文库制备的方法只能对单个文库样品进行Solexa Single End测序,不能将Solexa小分子RNA文库样品混合测序。因为随着solexa测序通量的增加,1个测序泳道(lane)所产出的数据远远大于目的片段所需求的数据量,如果所构建的文库样品不能进行混合测序,将在一定程度上“浪费测序资源”和影响到测序通量。因此,现在需要一种利用Solexa测序的高通量,而能将小分子RNA文库样品混合进行测序的方法,从而提高小分子RNA测序的效率和通量。

发明内容
基于目前illumina公司的solexa测序平台提供的小分子RNA文库制备方法,本发明针对小分子RNA样品,设计了独特的标签序列,利用PCR技术,成功的建立了小分子RNA 标签文库(small RNA indexlibrary)的构建方法,并成功用于测序,增大了小分子RNA样品的测序通量,降低了小分子RNA测序成本。构建小分子RNA文库并测序,需要保证结果可靠,可重复性高。即同样的RNA样品构建不同标签的小分子RNA文库,需要保证不同标签构建的小分子RNA文库的数据产出的结果一致,保证实验结果可靠且重复性高。本发明基于目前illumina公司的solexa测序平台提供的小分子RNA文库制备方法[1,2],将一段特定长度的核苷酸序列嵌入PCR引物或接头中,同时考虑PCR引物的扩增效率和实验结果的可重复性,经过在模式植物“水稻样品”与模式动物“人血液样品”中的验证,最后筛选出合适的标签序列标签,确保数据的准确性和可重复性。在标签混合量少于12个(样品)的情况下,必须考虑到混合后的标签上的每个碱基位点的GT含量。因为solexa测序过程中,碱基G和T的激发荧光一样,碱基A和C的激发光是一样的,因此必须考虑碱基“GT”含量与碱基“AC”含量的“平衡”,最适碱基“GT”含量为50%,能保证标签识别率最高和错误率最低。因此设计并使用合适的标签引物就十分必要了,不仅能灵活应用于小分子RNA样品的测序,也能提高目前小分子RNA样品的测序通量。标签设计需要考虑标签序列之间的可识别性和识别率的问题,同时也需要考虑标签序列混合之后的每个位点的“GT”与“AC”碱基含量的“平衡”问题,最后考虑数据产出的可重复性和准确性。在设计标签的过程中,本发明充分考虑到以上因素,同时避免了标签序列出现3或3个以上连续的碱基的出现,因为3个或3个以上连续的碱基会增加序列在合成过程中或测序过程中的错误率,标签序列本身嵌入PCR引物或接头中,也要尽可能的避免出现发夹结构或与测序引物及其反向互补序列相同的现象,所以标签设计需要综合考虑以上因素,才能保证标签设计成功。构建小分子RNA标签文库可以分为以下2个方案
方案一、将特定长度的核苷酸序列(即标签)嵌入5接头的3’末端中,将带有标签的接头与目的片段进行连接反应,构建标签文库。如图-2所示,从总RNA中首先分离长度为18 30nt的小分子RNA,将分离的小分子RNA先与3’接头连接,然后与5’标签接头连接(5’接头的3’末端中嵌入标签序列),随后将带有已知接头的目的片段进行RT-PCR反应,通过PCR反应扩增带有标签接头的目的片段,最后切胶回收含有标签的目的片段文库。 这样构建的小分子RNA标签文库在测序过程中,solexa需要先对标签序列进行测序,随后针对目的片段序列进行测序。针对该方案一,分别以模式植物样品(拟南芥)和模式动物样品(人)的RNA进行测试(参见实施例4和5),使用不同的5’标签接头与目的片段进行连接反应,构建标签文库,实验结果显示由于不同的接头对目的片段的连接效率不一致,导致小RNA基因表达结果不一致,存在影响数据的稳定性与可重复性的风险。如图3(a)所示, 使用拟南芥样品分别构建不同的小分子RNA标签文库(实施例4)。由于使用同样的拟南芥样品和使用不同的标签,理想的实验结果是标签的不同不会造成实验分析结果的差异。而实验结果显示,与不同的5’标签接头连接构建的小分子RNA标签文库分析的基因表达差异 “小于等于2”的miRNAOiiicroRNA,微小RNA)较少,而大部分的miRNA表达差异大于2,多数 miRNA的基因表达差异较大,造成实验结果的可重复性差。如图3(b)所示,使用“人RNA” 样品分别构建不同的小分子RNA标签文库(实施例5)。由于使用同样的“人RNA”样品和使用不同的标签标签,理想的实验结果是标签的不同不会造成实验分析结果的差异。而实验结果(图幻显示,与不同的5’标签接头连接构建的小分子RNA标签文库分析的基因表达差异“小于等于2”的miRNA较少,而大部分的miRNA表达差异大于2,多数miRNA的基因表达差异较大,造成实验结果的可重复性差。因此将标签嵌入5’接头的3’末端中,存在造成数据结果可重复性差的缺陷,故我们采用方案二来构建小分子RNA标签文库。方案二、将特定长度的核苷酸序列(即标签)嵌入PCR引物中,这样可以通过使用不同标签PCR引物进行构建小分子RNA标签文库,标签可以嵌入PCR引物中的任意一条引物中。因此可以有两种方式将标签嵌入PCR引物中。如图4所示,由于将标签嵌入PCR引物中,在连接完5’接头和3’接头后,通过RT-PCR反应,可以使用不同的标签PCR引物构建不同的小分子RNA标签文库。我们使用了模式植物“水稻样品”与模式动物“人血液样品” 分别构建小分子RNA标签文库(参见实施例6和7),结果显示针对同样的样品,构建不同的标签文库,数据结果稳定性与可重复性均比较好,如图5(a)与图5(b)所示,不同的小分子RNA标签文库之间的多数miRNA的基因表达差异较小。目前solexa测序错误率在2%左右,为了保证数据的准确性,我们通常需要剔除在index上测序出现错误的序列,即选择与标签完全配对的序列。当标签为6个碱基长度的特定核苷酸序列时,保证标签序列之间的差异在3个或3个碱基以上,这种设计可以纠正 6个碱基的标签序列上面的任意一个碱基错误,将出现一个碱基错误的产出数据也列为有效数据,保证标签的识别率为98%以上。例如数据产出的时的标签(以标签2 (index 2)和标签11 (index 11)为例)统计信息如下所示,测序结果与预期标签完全配对的有96. 76%,而由于测序错误导致标签与预期标签序列有1个碱基差异的占2. 12%。而O错误匹配(mismatch)与1错误匹配得到的数据占总数据的98. 88%,即该数据的标签识别率在98. 88%。ID Index Omismatch Imismatch
2 ACGGCT 46. 41% 0. 72%11 CGTCAA 50. 35%1. 40%other_reads (其他读数)1. 12%CGGCCA0. 11%CGGTCA0. 07%综上所述,将标签嵌入5’接头的3’末端,在solexa测序反应过程,只需要通过一条测序引物(也称为Read 1 Seq primer),便可将标签与目的片段的序列一同测出,如图 6。如将标签嵌入PCR引物中,需要先用测序引物Readl Seq primer将目的片段先测出来, 然后通过标签测序引物(也称为hdex Seq primer)将标签测序出来,测序反应需要两条测序引物,如图7。而方案一通过实验证实,不同的标签接头在连接反应中会发生偏向性连接,导致每个不同的标签接头与目的片段的连接效率不一样,最终影响到数据的稳定性与可重复性,所以方案一较方案二差,我们选择较优的方案二进行构建小分子RNA标签文库。本发明基于目前illumina公司提供的Solexa Single End测序平台,设计一段长度为6bp的特定序列作为标签,考虑到PCR引物的扩增效率,优化并筛选出16条标签序列, 这些标签之间的差异在3个碱基,当标签的6个碱基中的任意一个碱基出现测序错误或合成错误,都不影响到标签的最终识别。分析避免出现引物发夹结构或与测序引物及其反向互补序列相同的现象及通过实验筛选出以下16条对应PCR引物。表1为我们优化筛选出来的16条标签(也称为 IndexN)序列,表2是其对应的PCR引物(也称为IndexN_PCR_2. 0)。标签对应的PCR引物实际上由3部分序列构成,分别为序列1 (也称为solexa芯片互补序列)、序列2 (也称为标签互补序列)、和序列3 (也称为接头互补序列)例如标签1 (即indexl AAGTCG)所对应的 Index 1_PCR_2. 0引物,是分别由以下3部分组成。序列1 :AATGATACGGCGACCACCGACAGC ;序列2 =AAGTCG ;序列3 :CGACAGGTTCAGAGTTCTACAGTCCGACGATC ;这些标签及其PCR引物可以应用于任何小分子RNA标签的文库构建。这种标签策略应用于小RNA样品的文库构建并用于solexa测序的方法,目前尚未有报道。表1标签序列
权利要求
1.一组标签,其中所述一组标签包括如下或由如下组成表1所示16个标签或与之相差1个碱基的标签中的至少2个,或至少3个,或至少4个,或至少5个,至少6个,或至少7 个,或至少8个,或至少9个,或10个,或至少11个,或至少12个,或至少13个,或至少14 个,或至少15个,或全部16个,所述一组标签优选地至少包括表1所示的16个标签中的hdexl和化如口,或hdex3 禾口 Index4,或 Index5 禾口 Index6,或 Index7 禾口 Index8,或 Index9 禾口 IndexlO,或 Indexll 禾口 Indexl2,或hdexl3和hdexl4,或hdexl5和hdexl6,或者他们任何两个或多个的组合。
2.权利要求1所述的标签,其中所述相差1个碱基包括标签中1个碱基的取代、添加和删除。
3.权利要求1或2所述的标签用于小分子RNA文库构建并测序的用途,其中所述标签包含在用于扩增目的序列的PCR引物中,从而构成各自相对应的标签PCR引物。
4.权利要求3所述的用途,其中所述标签嵌入用于扩增目的序列的PCR引物中,或者通过或不通过连接子与用于扩增目的序列的PCR引物的5’端或3’端相连,优选地是不通过连接子与用于扩增目的序列的PCR引物的5’端相连,从而构成各自相对应的标签PCR引物。
5.使用权利要求1或2所述的标签构建的小分子RNA文库。
6.权利要求1或2所述的标签所对应的一组标签PCR引物,其包含权利要求1或2所述的标签,所述一组标签PCR引物包括如下或由如下组成表2所示16个标签PCR引物或与其中包含的标签序列相差1个碱基的标签PCR引物中的至少2个,或至少3个,或至少4 个,或至少5个,至少6个,或至少7个,或至少8个,或至少9个,或10个,或至少11个,或至少12个,或至少13个,或至少14个,或至少15个,或全部16个,所述一组标签PCR引物优选地至少包括表2所示的16个标签中的IndeXl_PCR_2. 0和 Index2_PCR_2. 0,或 Index3_PCR_2. 0 和 Index4_PCR_2. 0,或 Index5_PCR_2. 0 和 Index6_ PCR_2. 0,或 hdex7_PCR_2. 0 和 hdex8_PCR_2. 0,或 hdex9_PCR_2. 0 和 hdexlO_PCR_2. 0, 或 Indexl1_PCR_2. 0 和 Index12_PCR_2. 0,或 Index13_PCR_2. 0 和 Indexl4_PCR_2. 0,或 Index 15_PCR_2. 0和Indexl6_PCR_2. 0或者他们任何两个或多个的组合。
7.权利要求6所述的标签PCR引物,其中所述相差1个碱基包括标签中1个碱基的取代、添加和删除。
8.使用权利要求6或7所述的标签PCR引物构建的小分子RNA文库。
9.权利要求6或7所述的标签PCR引物用于小分子RNA文库构建并测序的用途。
10.一种用于小分子RNA文库的构建并测序方法,其包括1)提供η个总RNA样品并回收18 30nt的小RNA,η为整数,且1彡η彡16,优选地 16,所述样品包括但不限于来自植物如水稻、拟南芥和动物如小鼠、人,所述的回收可以通过例如电泳,特别是变性PAGE电泳;2)添加接头在适合于连接接头的条件下,将分离的小分子RNA分别与5’接头、3’接头连接,连接顺序可以是先5’接头后3’接头,也可以是先3’接头后5’接头;3)构建文库随后将带有接头的目的片段进行逆转录反应,通过PCR反应扩增带有接头的目的片段,其中对于每一个样品,使用一个标签PCR引物,所述标签PCR引物是含有如权利要求1所述的标签的标签PCR引物,特别是如权利要求3中所述的标签PCR引物,最后切胶回收带有接头的目的片段,所述片段优选的是约IOObp ;4)混合当η> 1时,将各样品的PCR扩增产物混合在一起;当η = 1时,直接进行步骤5);5)测序将各样品的PCR扩增产物的混合物利用测序技术,优选地是Solexa测序技术进行测序,其中需要小分子RNA测序引物和小分子RNA标签测序引物分别对目的片段和标签进行测序。
11.权利要求10所述的方法,其中标签PCR引物包括如下或由如下组成表2所示16 个标签PCR引物或与其中包含的标签序列相差1个碱基的标签PCR引物中的至少2个,或至少3个,或至少4个,或至少5个,至少6个,或至少7个,或至少8个,或至少9个,或10 个,或至少11个,或至少12个,或至少13个,或至少14个,或至少15个,或全部16个,所述一组标签PCR引物优选地至少包括表2所示的16个标签中的hdexl_PCR_2. 0和 Index2_PCR_2. 0,或 Index3_PCR_2. 0 和 Index4_PCR_2. 0,或 Index5_PCR_2. 0 和 Index6_ PCR_2. 0,或 hdex7_PCR_2. 0 和 hdex8_PCR_2. 0,或 hdex9_PCR_2. 0 和 hdexlO_PCR_2. 0, 或 Indexl1_PCR_2. 0 和 Index12_PCR_2. 0,或 Index13_PCR_2. 0 和 Indexl4_PCR_2. 0,或 Index 15_PCR_2. 0和Indexl6_PCR_2. 0或者他们任何两个或多个的组合。
12.权利要求10所述的方法,其中所述相差1个碱基包括标签中1个碱基的取代、添加和删除。
13.权利要求10所述的方法,其中小分子RNA测序引物和小分子RNA标签测序引物分别为 Small RNA Sequencing Primer :5' CGACAGGTTCAGAGTTCTACAGTCCGACGATC,和 Small RNAIndex Sequencing Primer 5' ATGATACGGCGACCACCGACAGC。
14.通过权利要求10所述的方法构建的小分子RNA文库。
全文摘要
本发明基于目前illumina公司提供的Solexa Single End测序平台,针对小分子RNA样品,设计了特定序列作为标签。本发明提供了使用所设计的标签,利用PCR方法构建小分子RNA标签文库的方法。本发明的这些标签及其PCR引物可以应用于任何小分子RNA标签的文库构建。
文档编号C12N15/11GK102409046SQ20101029926
公开日2012年4月11日 申请日期2010年9月21日 优先权日2010年9月21日
发明者周妍, 张秀清, 张艳艳, 徐小红, 杨焕明, 章文蔚 申请人:深圳华大基因研究院, 深圳华大基因科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1