专利名称:一种基因合成方法、基因芯片及试剂盒的利记博彩app
技术领域:
本发明涉及生物技术领域,特别涉及基因芯片领域,具体公开了一种高通量、高保真、基因合成方法、基因芯片及试剂盒。
背景技术:
合成生物学的一个关键技术问题是低成本、高通量的基因合成和蛋白质表达的精确调控。目前,人工合成基因的主要方法是将短链的寡核苷酸进行拼接和组装得到长链的 DNA。使用化学方法人工合成短链寡核苷酸的方法成本高,每核苷酸约需人民币0.6元,且合成错误率高,100个碱基中出现一个碱基缺失,400个碱基中约有一个碱基错配和插入。 因此,利用寡核苷酸组装来合成基因或基因组的成本十分昂贵,且合成累积的错误率很高。 通过克隆测序和突变的方法来修复错误会进一步增加工作量和总成本。在微流芯片上进行大规模平行合成寡核苷酸合成可以显著的降低成本。目前, 在芯片上合成寡核苷酸的方法主要包括喷墨打印(Agilent公司)、5’端修饰光敏保护基团(Nimblegen/Affmetrix公司),光照生成酸脱保护(Atactic/Xeotron)和电化学方法 (Oxamer/Combimatrix公司)。但是,由于微流芯片的表面积非常小,寡核苷酸合成产量低, 溶液中每种序列的寡核苷酸浓度为10_12摩尔或更低,因此,在组装成基因之前还需进行大量扩增。目前可行的方法是通过化学或酶解处理将合成出的寡核苷酸从微流芯片上释放下来,经PCR扩增、限制性酶消化和纯化后,得到的寡核苷酸用来组装成基因或基因组,而合成基因的错误修复方法主要采用聚丙烯酰胺凝胶电泳、高效液相色谱分离。因此,目前基因合成和错误修复的步骤依然繁琐,迫切需要提高其集成化、微型化程度,显著降低成本,并提高合成和错误修复效率。
发明内容
本发明旨在提供一种高通量、高保真、低成本的基因合成方法,将扩增寡核苷酸库和平行组装基因步骤整合到一块微流芯片上同时进行;采用错配特异性内切酶建立高效的基因合成错误修复体系,使合成错误率由每千碱基对0Λ)约1. 9个错误碱基降至低于0. 19 个错误碱基,成本为目前报道最低成本的十分之一。本发明提供的一种基因合成方法,在一张基因芯片上采用恒温刻痕和链位移扩增及聚合酶拼接反应进行寡核苷酸扩增以及基因组装,所述基因芯片通过将寡核苷酸固定在固相载体表面形成,寡核苷酸的3’端具有长度为15-150个碱基的接头序列且通过该接头序列中的刻痕内切酶识别位点锚定在芯片表面。优选地,所合成基因的长度大于或等于200个碱基对。优选地,还包含并采用错配特异性内切酶进行基因合成错误修复步骤。优选地,寡核苷酸扩增以及组装、基因合成错误修复三种反应在同一体系中先后连续进行或分步进行。优选地,基因合成错误修复反应在芯片上或芯片外单独进行。
优选地,所述基因芯片可以划分成一个或多个区域,寡核苷酸扩增以及基因组装在一个或多个区域同时进行。优选地,所述恒温刻痕和链位移扩增及聚合酶拼接反应是采用一条通用引物与寡核苷酸3’端的接头杂交,在链移位聚合酶延伸并位移寡核苷酸链的同时,刻痕内切酶将通用引物从刚刚扩增出的寡核苷酸链上裂解下来,使通用引物的3’端重新游离,继续开始新的延伸反应。优选地,所述基因合成错误修复步骤为通过热变性,让合成的基因重新退火,使错配位点暴露,错配位点被错配特异性核酸内切酶和3’ 一 5’核酸外切酶活性识别并切除, 所得的基因片段经交叠延伸PCR反应组装成完整基因。本发明的另一个目的是提供一种基因芯片,所述基因芯片通过将寡核苷酸探针固定在固相载体表面形成,寡核苷酸的3’端具有长度为15-150个碱基的接头序列且通过该接头序列中的刻痕内切酶识别位点锚定在芯片表面。优选地,所述基因芯片采用物理区隔的办法,将微阵列分为子阵列,每一个子阵列中包含合成大于0. 2kb总长的寡核苷酸序列。本发明的基因芯片所采用的固相载体选自任何可用于制备基因芯片的材料,包括但不限于,硝酸纤维素膜、尼龙膜、玻璃片、硅片和塑料片。本发明所述基因芯片的制备,是将所述的寡核苷酸有序地点样到载体上,通过寡核苷酸的3’端接头序列中的刻痕内切酶识别位点锚定,将寡核苷酸固定于载体上,从而制成基因芯片。本发明还提供一种基因合成的试剂盒,包含上述任一项所述基因芯片、刻痕内切酶、链位移DNA聚合酶、高保真DNA聚合酶以及错配特异性内切酶。优选地,本发明所述试剂盒还包含dNTP、BSA、刻痕内切酶、链位移聚合酶、高保真 DNA聚合酶及Hiermopol II缓冲液和寡核苷酸引物,所述Thermopol II缓冲液由20mM Tris-HCl, IOmM(NH4)2SO4, IOmM KCl, 2mM MgSO4,0. 1% Triton X-100 组成,其在 25°C 的pH为
8.8 ο本发明所述方法是基于DNA微阵列的高通量基因合成技术,采用物理区隔的办法,将微阵列分为子阵列,每一个子阵列中仅仅包含合成大于0. 2kb总长的寡核苷酸序列, 从而可以避免了序列的选择性扩增,可以有效地合成所有的DNA序列,最后利用各子阵列中合成的总长DNA来组装最终的DNA,避免相似序列之间交叉杂交而实现基因的有效组装。目前大多采用化学方法对寡核苷酸序列进行处理使之脱离芯片继而进行芯片外组装反应。本发明首次采用了刻痕和链位移扩增反应从微阵列表面扩增寡核苷酸序列。也就是说,用于锚定序列于芯片表面的25-mer通用配体含有一个刻痕内切酶识别位点。寡核苷酸序列被合成后只需要加入刻痕内切酶就能催化序列的脱离从而进行序列组装。为了避免下游基因的组装反应所需要的基因收集和纯化的复杂操作,聚合酶循环组装反应能在nSDA反应后直接进行而不需要更换缓冲溶液,实现了寡核苷酸序列的合成与组装成基因片段在同一个小室中实现。通过使用一种特别的错配特异性内切酶CEL酶减少了基因合成的错误,使基因合成的错误率达到了 0. 19error/lA。本发明的一种基于微流芯片技术的高通量、高保真基因合成方法,可大幅度降低了基因合成成本,显著缩短了合成时间,极大地满足生命科学前沿领域对大规模基因合成的迫切需求。
术语与定义术语“刻痕内切酶”是指只切断DNA双链中一条链的DNA内切酶。术语“链位移扩增”是指一种可以在恒温条件下,在体外扩增DNA的方法。术语“通用引物”是指能与某类载体DNA结合,适用于由该载体建立的所有克隆 DNA的引物。术语“聚合酶拼接”是指直接利用嗜热性DNA聚合酶,通过热循环反应将两头重叠杂交的寡核苷酸片断步步延伸,最终合成全长基因的方法。术语“错配特异性内切酶”是指能够裂解含有因碱基突变、插入或缺失导致的所有类型的DNA双链错配的酶。
图1是将寡核苷酸扩增和基因组装过程整合到同一块芯片上进行的全过程示意图。图2是基因合成错误修复体系反应原理示意图。图3显示了应用本专利方法在芯片上合成出的IacZa密码子变异基因在大肠杆菌中的表达情况。a中显示了将1,296个的表达不同IacZa密码子变异基因的大肠杆菌菌落依颜色强度分类。b中柱状图显示了琼脂平板上1,468种表达不同IacZ α密码子变异基因的随机菌落颜色深度分布。图4显示了使用本发明高通量、高保真芯片基因合成技术对蛋白质表达的优化结^ ο图a中列出了其中15种蛋白的数据。每对泳道显示的均为大肠杆菌内的总蛋白, 左侧泳道为原生型(WT),右边是优化后的克隆(Op)。箭头标示的较粗的条带是高度表达的原生型转录因子-GFP融合蛋白。泳道M是蛋白质分子量标准。图b中为余下59中蛋白表达结果。
具体实施例方式本发明公开了一种高通量、高保真、基因合成芯片及其应用,本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明的芯片及应用已经通过较佳实施例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的方法和应用进行改动或适当变更与组合,来实现和应用本发明技术。本发明提供的基因合成方法全过程示意图见图1,其中寡核苷酸扩增和基因组装过程整合到同一块芯片上进行。利用喷墨打印式DNA芯片合成仪或其它类型芯片合成仪在微流芯片上各个独立的微池内合成寡核苷酸库。然后向微池中加入组合好的扩增和组装反应混合物并密封。在刻痕和链位移扩增反应(nSDA)中,链位移DNA聚合酶延伸并移位正在处理的链,同时刻痕内切酶将通用引物从合成出得寡核苷酸产物上切去,产生新的3'端并继续延伸。扩增之后,每个微池中的游离的寡核苷酸通过聚合酶链式反应(PCR)组装成基因产物。为了使本领域的技术人员更好地理解本发明的技术方案,下面结合具体实施例对本发明作进一步的详细说明,所述的实施例是对本发明的解释而不是限定。实施例1 芯片的设计和制备1" X 3"的标准环烯烃共聚物(COC)薄片表面经硅薄膜修饰,整块芯片表面被划分成30个微池,每个微池的半径为150微米,间距300微米(中心点之间的距离)以减少导致寡核苷酸合成不理想的边缘效应。图3是经二氧化硅薄膜修饰的微流芯片表面的微池阵列示意图。实施例2 寡核苷酸在芯片上的合成喷墨式合成寡核苷酸的方法是已知的。使用特制的喷墨式DNA芯片合成仪在经硅薄膜修饰的环烯烃共聚物(COC)芯片上合成寡核苷酸。寡核苷酸产物的长度设计为48 或60个碱基,其中3’端为一段长为25个碱基的接头序列。该接头中含有一个刻痕内切酶 (Nickingendonuclease)识别位点并将寡核苷酸锚定在芯片表面。芯片上每个微池内可以打印361个点,每个点上合成一种序列的寡核苷酸,每个微池内合成出的寡核苷酸将分别组装成长度为大于0. 2kb的一条基因或一个基因库。为提高产量,可于多个点上均合成同一种序列的寡核苷酸。实施例3 寡核苷酸在芯片上的扩增和基因组装寡核苷酸在合成后,向芯片上的每个微池中加入恒温刻痕和链位移扩增 (Isothermal nicking and strand displacement amplification, nSDA)、聚合酶拼接 (Polymerase chain assembly, PCA)组合反应所需的其他组分的混合物,该混合物中含有 0. 4mM dNTP、0. ang/mlBSA、刻痕内切酶(Nt. BstNBI,购自美国NEB公司)、链位移DNA聚合酶(Bst DNA聚合酶大片段,购自美国Ν^公司)、高保真DNA聚合酶(Phusion聚合酶,购自美国NEB公司)及经优化的ThermopolII buffer (购自美国NEB公司)。将芯片上各微池密封后,将芯片置于Mastercycler梯度PCR仪(购自Eppendorf公司)的芯片适配器上进行nSDA-PCA组合反应。体系中首先进行nSDA反应,于50°C恒温2hr后,升至80°C恒温 20min ;随后进行PCA反应,于98°C预变性30s后,进行40个循环的PCR反应,每个循环包括98°C变性7s,60°C退火60s,72°C以15s/kb速度延伸,最后再于72°C延伸5min。在刻痕和链位移扩增反应(nSDA)中,一条通用引物与寡核苷酸3’端的接头杂交, DNA链位移聚合酶(strand-displacing polymerase)延伸并位移正在处理的寡核苷酸链, 同时刻痕内切酶(nickingendonuclease)将通用引物从用于基因合成组装的寡核苷酸上分离开来,并产生新的3’端用于进一步的延伸反应。nSDA-PCA反应之后,各微池内1_2 μ 1反应产物利用Wiusion聚合酶和末端引物进行PCR扩增。末端引物浓度为0.5 μ M。PCR反应先于98°C预变性30s后,进行30个循环的PCR反应,每个循环包括98°C变性10s,60°C退火60s,72°C以30s/lib速度延伸,最后再于72°C延伸5min。扩增后,每个小池中的游离寡核苷酸通过聚合酶拼接(PCA)反应全部用来组装成为基因产物。实施例4 合成错误的修复系统本发明中使用植物CEL族的错配特异性内切酶,可识别并裂解由碱基取代或小插CN 102533738 A入或缺失导致的所有类型的错配。CEL酶的一个商品化的亚型是Surveyor核酸酶(购自 Transgenomic公司),在基因错误修复反应中,我们首先通过热变性,让合成的基因重新退火,使错配位点暴露,然后用Surveyor核酸酶处理这些基因,错配位点被错配特异性核酸内切酶和3’ 一5’核酸外切酶活性识别并切断。最后,所得的基因片段经交叠延伸PCR反应重新组装成完整的基因。该修复过程可以重复进行,以提高修复率。经过两轮修复,合成出的基因的错误可降低16倍以上,最终错误率约为每8700bp中有一个错误碱基。基因合成错误修复反应原理示意图见图2。在片组装的基因产物经PCR扩增并纯化后,用1 X Taq缓冲液(购自NEB公司)或 IXPhusion HF缓冲液(购自^ffiB公司)稀释至终浓度为50ng/μ 1,95°C预变性IOmin后, 逐渐降温退火,先以2V /s的速率降温至85°C,然后以0. 30C /s的速率降温至25°C,每隔 10°C保温Imin0反应产物(4 μ 1,200ng)与0· 5 μ 1 Surveyor核酸酶试剂和0. 5 μ 1增强剂(购自Transgenomic公司)混合,于42°C孵育20min。反应产物进行交叠延伸PCR将因含有错误碱基而被切断的基因片段重新组装成完整的基因。PCR反应先于98°C预变性30s 后,进行30个循环的PCR反应,每个循环包括98V变性IOs,60°C退火60s,72°C以30s/lib 速度延伸,最后再于72°C延伸5min结束反应。在第二轮错误修复中,将上一轮修复产物用IXTaq缓冲液稀释至50ng/y 1,重新退火,反应体系和条件都如前所述。反应产物进行交叠延伸PCR,所得产物即为经修复的完
整基因。实施例5 =IacZ的密码子变异基因的表达筛选在异丙基-β -D-硫代半乳糖苷(IPTG)存在下,IacZ α的表达可使宿主大肠杆菌菌落呈现蓝色。首先,参照非偏好性密码子使用表,设计出一系列IacZa密码子变异基因, 在该表中对应同一种氨基酸的各种密码子使用频率相同。之后,构建了一个IacZ α密码子变异基因库,由1,296个的表达不同IacZ α密码子变异基因组成,并将其全部转化到大肠杆菌感受态细胞中。取出一小部分涂布在琼脂糖固体平皿上,并通过自动成像分析实时测定各个单克隆菌落的蓝色深度。菌落颜色深浅的差别显示着蛋白质表达水平不同。随机挑选琼脂糖固体平皿上的单克隆菌落进行统计,得到了关于密码子变异基因表达水平的钟形分布图。大约三分之一的变异基因显示出比原生型IacZa更高的表达水平。原生型基因的表达水平稍高于所有表达量可测的克隆的中等水平。图3显示了应用本发明所述方法在芯片上合成出的IacZa密码子变异基因在大肠杆菌中的表达情况。图3a中显示了将1,296个的表达不同IacZ α密码子变异基因的大肠杆菌菌落依颜色强度分类。原始图片是使用HP Photosmart C7180平板扫描仪对琼脂平皿进行扫描获得的。图北中柱状图显示了琼脂平板上1,468种表达不同IacZ α密码子变异基因的随机菌落颜色深度分布。对几百个蓝色克隆的测序证实,由于芯片合成的密码子变异基因库很大,在一块平板上得到相同克隆的几率极低。原生型IacZ α的表达水平用虚线表示。尽管这种分布的原因尚需进一步研究,但通过该分布图已能够估计大肠杆菌中 IacZa基因的潜在翻译能力。这些实验结果显示出本专利公开的这种在芯片上合成基因的方法,实现了在给定的表达体系中筛选出具有可靠且理想的蛋白表达水平的基因序列,具有高度的可行性和可靠性。实施例6 果蝇转录因子蛋白结构域的表达筛选为了直接测定蛋白质在大肠杆菌中的表达水平,在每种目标基因上加上绿色荧光蛋白(GFP)报告基因标签。蛋白质表达水平越高,该单克隆菌落发出的荧光越强。本发明应用对74种果蝇转录因子蛋白的结构域进行了表达的优化和筛选,这些蛋白是被用于制备ENCODE工程(DNA元件的百科全书)的抗体。首先,针对15种在大肠杆菌中不表达的候选基因,并根据大肠杆菌密码子使用表,设计并应用本专利公开的芯片基因合成方法合成了密码子变异基因库。在此应用中,没有使用错配内切酶错误修复体系,因为非常相关的密码子变异基因之间可能会形成异类双链DNA。合成出的基因与GFP的N端融合,并使用非序列依赖型的聚合酶循环延伸克隆的方法(CPEC)插入到pAcGFP表达载体中。质粒转化到大肠杆菌细胞内,在琼脂平板上培养。持续监测所有菌落发出的荧光,荧光很强的部分克隆被挑选出来进行测序。所有克隆中所含有的质粒,带有不同密码子变异基因的,贯穿了候选蛋白的序列。将序列已确定的、荧光较强的克隆于液体培养基中培养,在聚丙烯酰胺凝胶上对总蛋白提取物进行电泳以确定蛋白结构域的表达情况。使用这种方法,15种候选蛋白均筛选得到具有高表达量的克隆。相比之下,克隆到相同的载体中,并在相同的条件下培养的原生型对照组检测不到蛋白表达量。这种结果表明,本专利公开的芯片基因合成方法能够可靠地从不可检测的水平将蛋白质的表达量提高到占细胞中蛋白总质量的50-60%。图4显示了使用高通量、高保真芯片基因合成技术对蛋白质表达的优化结果。图 a中列出了其中15种蛋白的数据。每对泳道显示的均为大肠杆菌内的总蛋白,左侧泳道为原生型(WT),右边是优化后的克隆(Op)。箭头标示的较粗的条带是高度表达的原生型转录因子-GFP融合蛋白。在原生型的泳道内,检测不到有原生型转录因子-GFP融合蛋白被表达。每块Ni^age 4-12%梯度胶上分离的细胞内总蛋白的量相同。用EZBlue凝胶染色试剂染色。泳道M是Novex预染蛋白质分子量标准混合物(购自hvitrogen公司)。对其余59种蛋白进行了相同的密码子优化实验。图4b中为余下59中蛋白表达结果。本实施例74种果蝇转录因子基因片段经优化后在大肠杆菌中表达,针对每种基因片段均合成了大约1,000-1, 500种密码子变异基因,与GFP基因一起克隆到表达载体的开放阅读框架中,经表达筛选出荧光最强的菌落。测序和蛋白凝胶电泳结果证实所测试的所有候选蛋白都如预期得到了高表达量的克隆。据此,可以再一次证实本发明的可行性和
可靠性。以上所述,仅为本发明的具体实施例,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
权利要求
1.一种基因合成方法,其特征在于,在一张基因芯片上采用恒温刻痕和链位移扩增及聚合酶拼接反应进行寡核苷酸扩增以及基因组装,所述基因芯片通过将寡核苷酸固定在固相载体表面形成,寡核苷酸的3’端具有长度为15-150个碱基的接头序列且通过该接头序列中的刻痕内切酶识别位点锚定在芯片表面。
2.权利要求1所述的基因合成方法,其特征在于,所合成基因的长度大于或等于200个碱基对。
3.权利要求1所述的基因合成方法,其特征在于,还包含并采用错配特异性内切酶进行基因合成错误修复步骤。
4.权利要求3所述的基因合成方法,其特征在于,寡核苷酸扩增以及组装、基因合成错误修复三种反应在同一体系中先后连续进行或分步进行。
5.权利要求3所述的基因合成方法,其特征在于,基因合成错误修复反应在芯片上或芯片外单独进行。
6.权利要求1所述的基因合成方法,其特征在于,所述基因芯片可以划分成一个或多个区域,寡核苷酸扩增以及基因组装在一个或多个区域同时进行。
7.权利要求1所述的基因合成方法,其特征在于,所述恒温刻痕和链位移扩增及聚合酶拼接反应是采用一条通用引物与寡核苷酸3’端的接头杂交,在链移位聚合酶延伸并位移寡核苷酸链的同时,刻痕内切酶将通用引物从刚刚扩增出的寡核苷酸链上裂解下来,使通用引物的3’端重新游离,继续开始新的延伸反应。
8.权利要求3所述的基因合成方法,其特征在于,所述基因合成错误修复步骤为通过热变性,让合成的基因重新退火,使错配位点暴露,错配位点被错配特异性核酸内切酶和 3’ 一5’核酸外切酶活性识别并切除,所得的基因片段经交叠延伸PCR反应组装成完整基因。
9.一种基因芯片,通过将寡核苷酸探针固定在固相载体表面形成,其特征在于,寡核苷酸的3’端具有长度为15-150个碱基的接头序列且通过该接头序列中的刻痕内切酶识别位点锚定在芯片表面。
10.根据权利要求9所述的基因芯片,其特征在于,采用物理区隔的办法,将微阵列分为子阵列,每一个子阵列中包含合成总长大于0. 2kb的寡核苷酸序列。
11.根据权利要求9或10所述的基因芯片,其特征在于,所述固相载体选自硝酸纤维素膜、尼龙膜、玻璃片、硅片和塑料片。
12.—种基因合成的试剂盒,包含权利要求9-11任一项所述基因芯片、刻痕内切酶、链位移DNA聚合酶、高保真DNA聚合酶以及错配特异性内切酶。
13.根据权利要求12所述的试剂盒,其特征在于,还包含dNTP、BSA、Thermopol II 缓冲液和寡核苷酸引物,所述Thermopol II缓冲液由20mM Tris-HCl, IOmM(NH4)2SO4, IOmM KCl, 2mM MgSO4,0. 1% Triton X-IOO 组成,其在 25°C 的 pH 为 8. 8。
全文摘要
本发明涉及生物技术领域,特别涉及基因芯片技术领域,公开了一种基因合成芯片方法,将寡核苷酸扩增和寡核苷酸平行组装成基因全过程整合到一张芯片上。本发明还使用错配特异性内切酶建立基因因合成错误修复系统,错误率降至低于~0.19错误碱基/kb。本发明提供的高通量、高保真、低成本的基因合成芯片方法,可极大地满足合成生物学、基因组学、系统生物学等生命科学前沿领域对大规模基因合成和蛋白质表达优化筛选的迫切需求。
文档编号C40B40/06GK102533738SQ20121006884
公开日2012年7月4日 申请日期2012年3月15日 优先权日2012年3月15日
发明者田敬东 申请人:田敬东