一种sgRNA分子及其应用
【技术领域】
[0001] 本发明属于基因修饰技术领域,具体涉及一种sgRNA分子及其应用。
【背景技术】
[0002] 基因编辑技术,是近年来发展起来的一项基因组修饰技术,可在基因组特定位点 进行InDel突变、敲入、多位点突变、小片段删除、以及片段替换等操作。在科学研究领域, 基因编辑技术可用于模式生物的快速构建;在农业领域,该技术可用于植物品种改造;而 在健康医疗领域,该技术还有可能通过改造人类自身基因,达到治疗疾病的目的。因此,基 因编辑技术具有极其广泛的发展前景和应用价值。
[0003] 目前,基因编辑技术主要有锌指核酸酶(ZFN)、转录激活样效应因子核酸酶 (TALEN)和成簇规律间隔短回文重复技术(CRISPR/Cas9)。技术原理上,三种主流的基因编 辑技术都是通过特异序列的靶向识别和切割,造成基因组0ΝΑ断裂,在细胞的非同源末端 连接修复(non-homologous end joining,NHEJ)和同源重组修复(HR)过程中,实现基因组 序列的编辑。
[0004] 作为第一代基因编辑技术,锌指核酸酶首次实现了基因的靶向操作,并得到了广 泛的应用。锌指核酸酶的DNA识别域是由一系列锌指蛋白模块串联组成,每个锌指蛋白模 块识别并结合DNA链上一个特异的三联体碱基,将目的基因对应的一系列锌指蛋白模块串 联在一起,即可实现对目标序列的特异性识别。锌指核酸酶是一个异源二聚体,其中每个亚 基含有一个锌指结构域和一个Fokl核酸内切酶结构域。Fokl结构域必须二聚化才有活性, 可确保必须同时存在两个相邻的DNA结合位点时才能引发DNA双链的断裂,从而增加了目 标特异性。尽管文献报道的锌指核酸酶的基因打靶效率能达到30%,并可以针对某些特定 的DNA序列设计相应的锌指核酸酶,实现基因组序列的定位修饰,但其发展也存在较大的 局限性。一方面,锌指核酸酶的识别结构域中存在上下文序列依赖性,增加了设计、筛选难 度;另一方面,锌指核酸酶的脱靶切割会导致细胞毒性,制约了其在基因治疗领域的应用。
[0005] 作为第二代主流基因编辑技术,TALEN在技术上比锌指核酸酶更加简便,使用上更 加灵活。TALEN是二聚化的转录因子/核酸酶,其核酸识别单元为间隔32个恒定氨基酸序 列的双连氨基酸,双连氨基酸序列与A、G、C、T的识别具有稳定的对应关系。通过组装这些 模块,研究人员可靶定任何目标序列。
[0006] CRISPR/Cas技术是新近发展起来的第三代基因编辑技术。与锌指核酸酶技术和 TALEN技术不同,CRISPR/Cas技术源于天然存在的原核生物适应性免疫系统。2012年8月, 美国加州大学伯克利分校和德国汉诺威医学院的研究人员在《Science》杂志上发表文章, 报道了该系统的工作原理,并提示可通过更换向导RNA序列来对该系统进行重新编程。
[0007] 对CRISPR/Cas系统的研究发现,CRISPR/Cas系统是通过RNA介导的DNA内 切酶进行基因组编辑操作,它们分别就是CRISPR RNA (crRNA)和反式作用CRISPR RNA(trans-acting CRISPR RNA,tracrRNA)。这两种 RNA 可以被"改装"成一个向导 RNA (single-guide RNA,sgRNA)。sgRNA包括一段20bp左右的DNA识别区与一段固定序 列,其DNA识别区与靶位点处碱基互补,引导Cas9蛋白在结合区随机剪切DNA双链,形成 DSB (Double Stranded Breaks)缺口,随后细胞通过非同源末端连接修复机制(NHEJ)修复 目的基因双链。在修复的过程中易形成移码突变,导致靶位点处基因失去功能。若同时转 入基因修饰过的目的基因片段,可靶向定点敲除、插入、突变、修复相应碱基位点。sgRNA切 割作用的一个重要特征是sgRNA靶位点的下游临近区域需要存在一个三碱基的PAM序列, 通常为NGG。
[0008] CRISPR/Cas技术介导的基因组编辑是由crRNA指导的,通过与DNA序列的碱基配 对,实现目标位点的识别。在技术原理上,比锌指核酸酶和TALEN技术(利用蛋白质功能 区识别DNA序列)要精确得多,降低了脱靶切割的几率,减低了细胞毒性。在实际操作中, CRISPR/Cas9的构建仅仅需要设计与靶序列互补的RNA即可,过程更为简单,大大提高了基 因编辑的操作效率。但对于所有基因编辑技术而言,高效性和特异性是技术成功的两个重 要方面,CRISPR/Cas技术野不例外。尤其是在人类疾病的基因治疗中,特异性的重要性更 显突出。
[0009] 在CRISPR/Cas技术研究中,近期发表的一些文章充分证明了 CRISPR/Cas系统 对非完全匹配靶位点的切割作用,也就是sgRNA脱靶作用的存在。这些工作包括:Nat Biotechnol. 2013,31 :822-6 ;Nat Biotechnol. 2013,31 :833-8。在人类疾病的基因治疗 中,sgRNA对非完全匹配位点的切割,可能会在意外的位点破坏基因组的完整性或关键基因 的正常表达,引起癌症或者其他的疾病。因此,sgRNA能否做到特异性、精确靶向目标基因 是其能够成功应用于基因治疗的先决条件,设计、制备出精确性和特异性靶向目标基因的 sgRNA成为该技术发展的关键。
[0010] 研究发现很多因素都能影响SgRNA的脱靶作用,如Cas9和SgRNA的浓度。除了这 些非序列依赖性的因素外,sgRNA与靶位点的匹配程度也是影响脱靶作用的另一个重要因 素。利用不同技术路线,比如突变sgRNA序列、检测一个高活性sgRNA对基因组DNA的切割 等,研究人员近来对sgRNA的脱靶作用开展了大量研究,发现影响sgRNA切割活性的重要 位点均位于靶位点的"seed"区。尽管通常认为,"seed"区域包括PAM序列上游的10-12核 苷酸,但不同的研究也报道了不同的意见。2013年的一篇研究(Nat Biotechnol. 2013,31 : 839-43)报道,sgRNA脱靶作用的敏感位点主要位于PAM上游的7-12碱基位点。2013年的 另一篇研究(Nat Biotechnol. 2013, 31 :827-32)报道,sgRNA切割敏感位点位于PAM上游 20个碱基范围内,其中最敏感的位点位于PAM上游的8-14位点。2015年的一篇研究(Nat Biotechnol. 2015, 33 :175-8)发现,在与sgRNA之间存在1-13个碱基错配的靶位点中,均 发现了显著的脱靶作用。这些研究结果表明,sgRNA的脱靶作用是一个较为普遍的现象,但 我们对其发生的规律和机制的了解还非常有限。
[0011] 由于CRISPR/Cas技术是对基因组进行编辑的,一旦产生脱靶效应,将会对基因组 产生不可逆的损伤。因此,脱靶效应限制了该技术在临床和治疗上的进一步应用。这一工 具的精确性还有待进一步提尚。
【发明内容】
[0012] 本发明要解决的技术问题是提高CRISPR技术在基因组编辑过程中的精确性,提 供一种具有降低的脱靶效应的sgRNA分子。
[0013] 本发明涉及以下按顺序编号的段落中定义的主题:
[0014] 1、一种sgRNA分子,其特征在于,所述sgRNA分子包括一段固定序列片段和一段目 的DNA识别片段,所述目的DNA识别片段可与目的DNA形成碱基互补配对,且与基因组中目 的DNA的同源序列在PAM区上游4-7位碱基位点中存在至少一个碱基的错配。
[0015] 2、段落1所述的sgRNA分子,其特征在于,所述sgRNA的目的DNA识别片段与基因 组中目的DNA的同源序列在PAM序列上游4-7位碱基位点中存在一个碱基的错配;优选为 存在二个碱基的错配;更优选为存在三个碱基的错配;更优选为存在四个碱基的错配。
[0016] 3、段落1所述的sgRNA分子,其特征在于,所述固定序列为蛋白分子结合片段,所 述蛋白分子优选为核酸酶。
[0017] 4、段落3所述的sgRNA分子,其特征在于,所述固定序列为Y -GUUUUAGAGCUAGAAA UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU-3,或具有相同功 能的同源序列。
[0018] 5、一种编码段落1所述sgRNA分子的DNA片段。
[0019] 6、段落5所述的DNA片段,其特征在于,所述DNA片段具有如下结构:5' Xy-固定 序列-3 ^,其中X代表A,T,