本申请要求2014年5月8日提交的美国临时申请第61/990,521号和2014年9月17日提交的美国临时申请第62/051,724号的权益,所述临时申请的公开内容在此通过引用整体并入。
技术领域
本公开在亨廷顿病的诊断学和治疗学的领域中。
背景
亨廷顿病(HD),也称为亨廷顿舞蹈症,是运动、认知和精神障碍的进行性障碍。该疾病的发病平均年龄是35-44岁,尽管在约10%的病例中,发病发生在21岁之前,并且该疾病的平均诊断后寿命为15-18年。患病率为100,000个具有西欧血统的人中约3至7人。
亨廷顿病是三核苷酸重复扩增病症的实例,其最早在1990年代初被表征(见Di Prospero和Fischbeck(2005)Nature Reviews Genetics6:756-765)。这些病症涉及成组的三核苷酸的不稳定重复的局部扩增,并可导致扩增的重复驻留其中的基因的功能的丧失、有毒功能的获得,或两者。三核苷酸重复序列可位于该基因的任何部分,包括非编码和编码基因区域。位于编码区之内的重复通常包括重复的谷氨酰胺编码三联体(CAG)或丙氨酸编码三联体(CGA)。非编码序列内的扩增重复区可导致基因的异常表达,而编码区内的扩增重复(也称为密码子重复病症)可引起错误折叠和蛋白质聚集。与异常蛋白质相关的病理生理学的确切原因通常是未知的。通常地,在经历三核苷酸扩增的野生型基因中,这些区域在正常群体中含有可变数目的重复序列,但在受影响的群体中,重复的数目可以从重复的数目的加倍增至对数级增加。在HD中,重复被插入在大胞质蛋白亨廷顿蛋白(Huntingtin)(Htt)的N末端编码区中。正常Htt等位基因包含15-20个CAG重复,而含有35个或更多个重复的等位基因可被认为是潜在地引起HD的等位基因并且赋予发生疾病的风险。含有36-39个重复的等位基因被认为是不完全渗透的,并且那些携带那些等位基因的个体可发生或可以不发生疾病(或可在生命的后期发生症状),而含有40个或更多个重复的等位基因被认为是完全渗透的。事实上,未曾报道过含有这么多重复的HD等位基因的无症状的人。那些年幼发作HD(<21岁)的个体经常被发现具有60个或更多个CAG重复。除了CAG重复的增加以外,还已经显示HD可涉及重复序列内的+1和+2移码,这使得该区域将编码多丝氨酸多肽(在a+1移码的情况下由AGC重复编码的)束而不是聚谷氨酰胺(Davies和Rubinsztein(2006)Journal of Medical Genetics 43:893-896)。
在HD中,突变型Htt等位基因通常作为显性性状从一个亲本遗传而来。任何HD患者出生的儿童,如果另一个亲本未患该病症,则有50%的机会发生该疾病。在一些情况下,亲本可具有中间HD等位基因并且是无症状的,而由于重复扩增,儿童表现出疾病。另外,HD等位基因还可显示称为预期的现象,其中由于在精子发生过程中重复区的不稳定性质,在几代中观察到发病的严重程度增加或发病年龄减小。
此外,Htt中的三核苷酸扩增导致纹状体中的中间棘γ-氨基丁酸(GABA)投射神经元中的神经元损失,其中神经元损失也发生在新皮质中。含有脑啡肽并且突出至外部苍白球的中间棘神经元比包含物质P的神经元更多地参与并投射至内部苍白球。在亨廷顿病患者中受影响的其它脑区包括黑质、皮质层3、5和6、海马的CA1区、顶叶角回区、小脑的浦肯野细胞、下丘脑的侧结节核和丘脑的中脑旁核复合体(Walker(2007)Lancet 369:218-228)。
正常Htt蛋白的作用了解甚少,但其可参与神经发生、凋亡细胞死亡和囊泡运输。另外,有证据表明野生型Htt刺激脑源性神经营养因子(BDNF)(纹状体神经元的促生存因子)的产生。已显示HD的进展与HD小鼠模型中BDNF表达的降低相关(Zuccato等(2005)Pharmacological Research 52(2):133-139),并且BDNF或胶质细胞源性神经营养因子(GDNF)经由腺相关病毒(AAV)载体介导的基因递送的递送可在HD小鼠模型中保护纹状体神经元(Kells等,(2004)Molecular Therapy 9(5):682-688)。
HD的诊断和治疗选择目前非常有限。在诊断方面,改变的(突变的)Htt(mHTT)水平与疾病负担评分显著相关,并且可溶性mHTT种类的浓度随着疾病进展而增加。然而,低丰度的mHTT难以在患者CNS中定量,这限制了在体内HD的神经病理生物学中的作用的研究,并且排除了通过降HTT药物进行的靶接合的证明。见,例如,Wild等(2014)J Neurol Neurosurg Psychiatry 85:e4。
关于治疗,设计用于防止与通过延长的聚谷氨酰胺段发生的蛋白质聚集相关的毒性的一些潜在方法学,诸如伴侣蛋白的过表达或用化合物格尔德霉素诱导热休克反应已显示出这些毒性在体外模型中的减小。其它治疗靶向细胞凋亡在疾病的临床表现中的作用。例如,疾病症状的减缓已经由在一对小鼠的后代中的动物模型中半胱天冬酶活性的阻断显示,其中一个亲本包含HD等位基因,另一个亲本具有半胱天冬酶1的显性负等位基因。另外,半胱天冬酶对突变型HD Htt的裂解可在疾病的致病性中起作用。已发现携带半胱天冬酶-6抗性突变型Htt的转基因小鼠,相较于携带非半胱天冬酶抗性突变型Htt等位基因的小鼠,维持正常的神经元功能并且不发生纹状体神经变性(见Graham等(2006)Cell 125:1179-1191)。靶向细胞凋亡途径成员的分子也已显示对症状学具有减慢的作用。例如,已显示化合物zVAD-fmk和米诺环素(它们均抑制半胱天冬酶活性)减缓小鼠中的疾病表现。药物瑞马西胺也已被用于小型HD人试验,因为该化合物被认为防止突变型Htt对NDMA受体的结合,以防止对神经细胞的毒性作用的产生。然而,在这些试验中没有观察到神经元功能的统计学上显著的改善。另外,亨廷顿研究小组使用辅酶Q进行了随机双盲研究。尽管观察到利用辅酶Q10治疗的患者中疾病进展较慢的趋势,但总的功能性能力的下降速率没有显著变化。(Di Prospero和Fischbeck,同上)。
包含来自锌指蛋白(“ZFP”)、TAL-效应子结构域(“TALE”)和CRISPR/Cas转录因子系统的DNA结合结构域的重组转录因子具有调节内源基因的基因表达的能力(参见,例如,美国专利第8,586,526号;第6,534,261号;第6,599,692号;第6,503,717号;第6,689,558号;第7,067,317号;第7,262,054;Perez-Pinera等(2013)Nature Methods 10:973–976;Platek等(2014)Plant Biotechnology J.doi:10.1111/pbi.12284)。使用这些含有锌指蛋白的工程化转录因子的临床试验已表明,这些新型转录因子能够治疗各种病况。(见,例如,Yu等(2006)FASEB J.20:479-481)。另外,包含来自锌指蛋白(“ZFP”)的DNA结合结构域、TAL-效应子结构域(“TALE”)、Ttago和CRISPR/Cas或Ttago核酸酶系统的DNA结合结构域的人工核酸酶具有经由基因的核酸酶介导的修饰(包括在非同源末端连接(NHEJ)后,同源性定向修复(HDR),和/或通过在非同源末端连接(NHEJ)驱动的过程期间的末端捕获)来修饰内源基因的基因表达的能力。见,例如,8,623,618;8,034,598;8,586,526;6,534,261;6,599,692;6,503,717;6,689,558;7,067,317;7,262,054;7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;美国专利公开20030232410;20050208489;20050026157;20060063231;20080159996;201000218264;20120017290;20110265198;20130137104;20130122591;20130177983;20130177960和20150056705,为了所有目的,所述专利或专利公开的公开内容通过引用其整体并入本文。因此,这些方法通常涉及使用工程化裂解系统来诱导靶DNA序列中的双链断裂(DSB)或切口,以使得通过错误产生过程诸如非同源末端连接(NHEJ)的断裂的修复,或使用修复模板的修复(同源性定向修复或HDR)可导致基因的敲除或目标序列的插入(靶向整合)。在外部提供的修复模板(例如“供体”或“转基因”)不存在的情况下引入双链断裂通常用于经由通过细胞NHEJ途径引入的突变(插入和/或缺失,称为“插入缺失”)使靶基因失活。例如,美国专利公开20110082093公开了靶向Htt的特异性锌指蛋白,美国专利公开第20130253040号涉及调节HD等位基因如Htt的表达的DNA结合蛋白。
然而,仍然需要用于诊断、研究、治疗和/或预防亨廷顿病的方法,包括检测mHTT以监测疾病进展,用于增加对HD的神经病理生物学的理解,以及评估疾病改善性HD疗法。
概述
本文中公开了用于诊断和/或治疗亨廷顿病的方法和组合物。具体地,本文提供了用于在患有HD的受试者中检测、减少和/或消除Htt聚集物、改善运动缺陷、增加细胞活性(例如,ATP活性)和/或减少细胞凋亡的方法和组合物。
因此,在一个方面,本文描述了修饰患有HD的受试者中的神经元的方法,所述方法包括向所述受试者施用突变型Htt等位基因的阻遏物,以使得神经元被修饰。在某些实施方案,所述神经元是包含突变型Htt等位基因和/或包含增加量的胞内聚集的Htt(“HD神经元”)的神经元。在某些实施方案中,所述修饰包括减少神经元(例如,HD神经元)中Htt的聚集;增加神经元(例如,HD神经元)的能量代谢,例如通过升高细胞内ATP水平;和/或降低神经元(例如,HD神经元)中对细胞凋亡的易感性。在某些实施方案中,所述受试者是哺乳动物。
因此,在其它方面,本文描述了防止和/或减少具有HD的受试者的HD神经元中Htt聚集物形成的方法,所述方法包括向所述受试者施用突变型Htt等位基因的阻遏物。
在其它方面,本文描述了增加神经元(例如,HD神经元)中的细胞活性(例如,ATP活性)的方法,所述方法包括向所述神经元施用突变型Htt等位基因的阻遏物。
在其它方面,本文描述了减少神经元(例如,HD神经元)中的细胞凋亡的方法,所述方法包括向所述神经元施用突变型Htt等位基因的阻遏物。
在另一个方面,本文描述了通过向有此需要的受试者施用突变型Htt等位基因的阻遏物来减少所述有此需要的HD受试者的运动缺陷(例如,紧握)的方法。
在另一方面,本文描述了用于检测受试者中(例如,在CSF中)的mHtt的方法,包括响应于治疗(例如,响应于如本文所述的Htt阻遏物的施用)检测mHtt。某些实施方案中,所述检测涉及定量所述受试者中的mHtt的量。本文所述的任何检测方法可用于HD的诊断和/或用于监测疾病进展,因为mHTT水平与疾病负担评分显著相关,并且mHTT水平在浓度上随着疾病进展而增加。此外,检测(例如,定量)受试者中的mHtt的任何方法可用于评价HD的神经病理生物学的方法和/或评价疾病改善性HD疗法的功效。
在本文所述的任何方法中,突变型Htt等位基因的阻遏物可以是ZFP-TF,例如包含特异性结合突变型Htt等位基因的ZFP和转录抑制结构域(例如,KOX、KRAB等)的融合蛋白。在其它实施方案中,突变型Htt等位基因的阻遏物可以是TALE-TF,例如包含特异性结合突变型Htt等位基因的TALE多肽和转录抑制结构域(例如,KOX、KRAB等)的融合蛋白。在一些实施方案中,突变型Htt型等位基因阻遏物是CRISPR/Cas-TF,其中Cas蛋白中的核酸酶结构域已被失活,以使得所述蛋白不再裂解DNA。将所得的Cas RNA引导的DNA结合结构域与转录阻遏物(例如,KOX、KRAB等)融合以抑制突变型Htt等位基因。在其它实施方案中,所述阻抑物可包含通过裂解突变型Htt等位基因并从而使其失活来抑制突变型Htt等位基因的核酸酶(例如,ZFN、TALEN和/或CRISPR/Cas系统)。在某些实施方案中,核酸酶在通过核酸酶裂解后经由非同源末端连接(NHEJ)引入插入和/或缺失(“插入缺失”)。在其它实施方案中,核酸酶引入供体序列(通过同源或非同源定向方法),其中供体整合使突变型Htt等位基因失活。
在本文所述的任何方法中,可将所述阻遏物可以作为蛋白质、多核苷酸或蛋白质和多核苷酸的任何组合递送至神经元(例如,HD神经元)。在某些实施方案中,使用表达构建体例如质粒或病毒载体(例如,慢病毒载体、腺病毒(Ad)载体、腺相关病毒(AAV)载体等)递送所述阻遏物。在其它实施方案中,将所述阻遏物作为mRNA递送。在其它实施方案中,使用本文所述的任何表达构建体的组合(例如一个表达构建体上的一个阻遏物(或其部分)和分开的表达构建体上的一个阻遏物(或其部分))递送所述阻遏物。
此外,在本文所述的任何方法中,所述阻遏物可以以提供所需作用的任何浓度(剂量)递送。在某些实施方案中,所述阻遏物使用为250至1,000(或其间任何值)的MOI的慢病毒载体来进行递送。在其它实施方案中,以150-1,500ng/100,000个细胞使用质粒载体递送所述阻遏物。在其它实施方案中,以10,000-500,000个载体基因组/细胞(或其间的任何值)使用腺相关病毒载体递送所述阻遏物。在其它实施方案中,以150-1,500ng/100,000个细胞(或其间的任何值)将阻遏物作为mRNA进行递送。
在本文所述的任何方法中,所述方法可在受试者的一个或多个HD神经元中产生约85%或更大、约90%或更大、约92%或更大或约95%或更大的的突变型Htt等位基因的表达。
在另外的方面,本文所述的本发明包含一种或多种Htt-调节转录因子,诸如包含锌指蛋白(ZFP TF)、TALE(TALE-TF)和CRISPR/Cas-TF的一种或多种的Htt-调节转录因子例如ZFP-TF、TALE-TF或CRISPR/Cas-TF。在某些实施方案中,Htt-调节转录因子可在受试者的一个或多个HD神经元中抑制突变型Htt等位基因的表达。所述抑制可以是相较于受试者的未处理的(野生型)神经元,受试者的一个或多个HD神经元中突变型Htt等位基因的约85%或更大、约90%或更大、约92%或更大或约95%或更大的抑制。在某些实施方案中,Htt-调节转录因子可用于实现本文所述的方法中的一个或多个。
还提供了包含一种或多种Htt-调节剂(例如,阻遏物)和/或包含本文所述的Htt-调节剂(或其组分)的组分和/或编码其的多核苷酸的试剂盒。所述试剂盒还可包含细胞(例如,神经元)、试剂(例如,用于检测和/或定量例如CSF中的mHtt蛋白)和/或使用说明书,包括如本文所述的方法。
根据作为整体的公开内容,这些和其它方面对于本领域技术人员将是显而易见的。
附图简述
图1是描绘在向神经元施用指定的构建体后,HD神经元(如所指示3个左侧条块)和非HD神经元(如指示的3个右侧条块)的相对细胞内ATP水平的图。“33074”是指与转录抑制结构域(KOX)以及GFP编码序列融合的包括ZFP 33074(表1A,其对突变型Htt是特异的)的ZFP-TF阻遏物;“GFP”是指仅编码GFP(无ZFP-TF)的构建体;以及“模拟物”指不含编码序列的构建体。
图2是描绘在向神经元施用指定的构建体(参见图1)后,通过TUNEL测定法测定的HD神经元(如所指示的3个左侧条块)和非HD神经元(如所指示的3个右侧条块)中的细胞凋亡细胞的百分比的图。
图3A至3K描绘了在用Htt突变型等位基因的ZFP-TF阻遏物处理后防止Q175小鼠中突变型Htt聚集。图3A-3H显示从用ZFP-TF表达构建体处理的小鼠获得的脑切片的免疫组织化学分析的代表性图像。图3A至3D显示用标记核DNA的4',6-二脒基-2-苯基吲哚(DAPI)和针对FLAG表位标签的抗体(其指示ZFP-TF的存在)染色的图像。ZFP-TF仅存在于其被施用的那侧(同侧的)。图3E至3H显示了利用针对突变型Htt聚集物的抗体(mEM48)染色后的代表性图像。在未接受注射的对侧纹状体中,相较于经由注射接受ZFP-TF表达构建体的同侧纹状体(其中观察到非常低水平的突变型Htt聚集),通过mEM48抗体容易检测到突变型Htt聚集。图3I是显示针对未用指定的构建体注射的对侧纹状体中每细胞的聚集物的数目标准化的同侧纹状体中每细胞(如针对FLAG(+)和GFP(+)细胞定量的)的核Htt聚集物的数目的图。图3J是显示针对来自对侧纹状体的神经元中对于Htt聚集物的核mEM48染色的强度标准化的接受指定的构建体的细胞中的所述染色强度的图。图3K是显示针对对侧纹状体神经元中的核周突变型Htt聚集物的密度标准化的ZFP-TF阻遏物或GFP表达细胞中的所述密度的图。在图3I至3K中,“GFP”是指编码GFP但还编码ZFP-TF Htt阻遏物的构建体;“30640”和“30645”是指在注射构建体中使用的具体ZFP设计(表1)。通过Kruskal Wallis检验和Dunn多重比较进行统计分析;*p<0.05;**p<0.01,***p<0.001;数据显示为具有平均值±SEM的条形图。
图4A至4D描绘了在用Htt突变型等位基因的ZFP-TF阻遏物处理后Q175小鼠中突变型Htt聚集的逆转。图4A显示在对侧和同侧纹状体中用DARPP-32(纹状体特异性蛋白)和抗Htt聚集物抗体mEM48染色的ZFP-TF和对照动物脑切片的代表性图像。图4B是显示针对未用指定的构建体注射的对侧纹状体中每细胞的聚集物的数目标准化的同侧纹状体中每细胞(如针对FLAG(+)和GFP(+)细胞定量的)的核Htt聚集物的数目的图。图4C是显示针对来自对侧纹状体的神经元中的Htt聚集物的核mEM48染色的强度标准化的,接受指定构建体的细胞中的所述染色强度的图。图4D是显示针对对侧纹状体神经元中的核周突变型Htt聚集物的密度标准化的,ZFP-TF阻遏物或GFP表达细胞中的所述聚集物密度的图。在图4B至4D中,“GFP”是指编码GFP但还编码ZFP-TF Htt阻遏物的构建体;“GFP-2A-30640”和“GFP-2A-30645”是指编码GFP和注射构建体中使用的特定ZFP设计的构建体(表1)。通过Kruskal Wallis检验和Dunn多重比较进行统计分析;*p<0.05;**p<0.01,***p<0.001;数据显示为具有平均值±SEM的条形图。
图5A至5C描述了注射AAV-ZFP-33074后防止Q175小鼠的纹状体中突变型Htt聚集。将AAV载体在2月龄时递送至纹状体中,在4月龄时进行分析。图5A是显示在AAV转导的(用GFP标记的)中间棘神经元(MSN,由DARPP32抗体标记的)中的核Htt聚集物的数量的图。图5B是显示AAV-转导的MSN中的上突变型Htt聚集物的密度的图。图5C是显示在AAV转导的MSN中针对htt聚集物染色的核mEM48抗体的强度的图。“对照AAV”是指表达GFP的AAV载体,“ZFP 33074”是指通过自裂解2A肽连接的表达ZFP 33074和GFP的AAV载体。数据显示为具有平均值±SEM的点图。使用Kruskal-Wallis检验和Dunn post检验(对比对照)进行统计分析;***=p<0.001。对于每个组,使用4只动物中的n只,每只动物6个切片用于定量。
图6A至6C描绘注射AAV-ZFP-33074后Q175小鼠的纹状体中突变型Htt聚集的减少。将AAV载体在6月龄时递送至纹状体中,在10月龄时进行分析。图6A是显示AAV转导的(用GFP标记的)中间棘神经元神经元(MSN,由DARPP32抗体标记的)中的核Htt聚集物的数量的图。图6B是显示AAV-转导的MSN中的核外突变型Htt聚集物的密度的图。图6C是显示在AAV转导的MSN中针对htt聚集物的核mEM48抗体染色的强度的图。“对照AAV”是指表达GFP的AAV载体,“ZFP 33074”是指通过自裂解2A肽连接的表达ZFP33074和GFP的AAV载体。“ZFPΔDBD”是指除缺少锌指DNA结合结构域(DBD)外,与“ZFP 33074”类似的对照AAV载体。数据以具有平均值±SEM的点图显示。使用Kruskal-Wallis检验和Dunn post检验(对比对照)进行统计分析;***=p<0.001;n.s.=不显著。对于每一组,使用4只动物中的n只,每只动物6个切片用于定量。
图7A和7B描绘了注射AAV-ZFP-33074后Q175小鼠的纹状体中通过免疫染色显示的增加的DARPP32表达。将AAV载体在6月龄时递送至纹状体中,在10月龄时进行分析。图7A显示相较于同龄野生型小鼠,10月龄Q175小鼠中的DARPP32表达降低。图7B显示用用于ZFP 33074的AAV载体或对照AAV载体处理的Q175纹状体中的DARPP32水平。“对照AAV”是指表达GFP的AAV载体,“ZFP 33074”是指通过自裂解2A肽连接的表达ZFP 33074和GFP的AAV载体。“ZFPΔDBD”是指除缺少锌指DNA结合结构域(DBD)外,与“ZFP 33074”相似的对照AAV载体。数据显示为具有平均值±SEM的点图。使用Kruskal-Wallis检验和Dunn post检验(对比对照)进行统计分析;*=p<0.05,***=p<0.001;n.s.=不显著。对于每一组,使用4只动物中的n只,每只动物6个切片用于定量。
详述
本文公开了用于检测、监测疾病进展,治疗和/或预防亨廷顿病(HD)的组合物和方法。具体地,本文所述方法允许在患有HD的受试者中改变脑(例如,HD神经元),从而提供HD的疗法。使用Htt-调节转录因子,诸如包含锌指蛋白(ZFP TF)、TALE(TALE-TF)或CRISPR/Cas-TF(例如抑制突变型Htt等位基因表达的ZFP-TF、TALE-TF或CRISPR/Cas-TF)的Htt-调节转录因子,可以修饰HD受试者中的HD神经元,以使得HD的效应和/或症状得以减轻或消除,例如通过在HD受试者中减少HD神经元中Htt的聚集,通过增加HD神经元能量学(例如,升高ATP水平),通过减少HD神经元中的细胞凋亡和/或通过减少HD受试者中的运动缺陷。另外,本文所述的组合物和方法允许检测患者样品(例如,CSF)中的HD。检测患者样品中的mHtt水平可允许诊断HD;基于mHtt水平监测疾病进展;以及允许评估HD疗法。
一般性
除非另有所指,否则本文公开的方法的实践以及组合物的制备和使用应用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和相关领域中的常规技术,这在本领域的技术范围内。这些技术在文献中被充分解释。见,例如Sambrook等,MOLECULAR CLONING:A LABORATORY MANUAL,第二版,Cold Spring Harbor Laboratory Press,1989和第三版,2001;Ausubel等,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,John Wiley&Sons,New York,1987和定期更新;系列METHODS IN ENZYMOLOGY,Academic Press,San Diego;Wolffe,CHROMATIN STRUCTURE AND FUNCTION,第三版,Academic Press,San Diego,1998;METHODS IN ENZYMOLOGY,第304卷,“Chromatin”(P.M.Wassarman和A.P.Wolffe,编辑),Academic Press,San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,第119卷,“Chromatin Protocols”(P.B.Becker,编辑)Humana Press,Totowa,1999.
定义
术语“核酸”、“多核苷酸”和“寡核苷酸”可互换使用,是指以线性或环状构象,以单链或双链形式存在的脱氧核糖核苷酸或核糖核苷酸聚合物。出于本公开的目的,这些术语不应被解释为对聚合物的长度的限制。该术语可包括天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸酯部分(例如,硫代磷酸酯主链)中被修饰的核苷酸。通常,特定核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物将与T碱基配对。
术语“多肽”、“肽”和“蛋白质”可互换使用,是指氨基酸残基的聚合物。术语也用于其中一个或多个氨基酸是对应的天然存在的氨基酸的化学类似物或经修饰的衍生物的氨基酸聚合物。
“结合”是指大分子之间(例如,蛋白质与核酸之间)的序列特异性非共价相互作用。并非结合相互作用的所有组分都需要是序列特异性的(例如,与DNA主链中的磷酸残基的接触),只要作为整体的相互作用是序列特异性的。此类相互作用通常特征在于10-6M-1或更低的解离常数(Kd)。“亲和力”是指结合的强度:增加的结合亲和力与较低的Kd相关。
“结合蛋白”是能够非共价地结合于另一分子的蛋白质。结合蛋白可结合于例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白分子(蛋白结合蛋白)。在蛋白质结合蛋白的情况下,其可结合其自身(以形成同源二聚体,同源三聚体等)和/或其可结合不同蛋白质或多种蛋白质的一个或多个分子。结合蛋白可具有多于一种类型的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白结合活性。
“锌指DNA结合蛋白”(或结合结构域)是以序列特异性方式通过一个或多个锌指结合DNA的蛋白质或较大蛋白质内的结构域,所述锌指是结合结构域内经由锌离子的配位来使其结构稳定化的氨基酸序列的区域。术语锌指DNA结合蛋白通常被缩写为锌指蛋白或ZFP。
“TALE DNA结合结构域”或“TALE”是包含一个或多个TALE重复结构域/单位的多肽。重复结构域参与TALE对其同源靶DNA序列的结合。单个“重复单元”(也称为“重复”)通常长度为33-35个氨基酸,并且与天然存在的TALE蛋白内的其它TALE重复序列显示至少一定的序列同源性。见,例如,美国专利第8,586,526号。
“TtAgo”是被认为参与基因沉默的原核Argonaute蛋白。TtAgo源自细菌嗜热栖热菌(Thermus thermophilus)。见,例如,Swarts等(2014)Nature 507(7491):258-261,G.Sheng等,(2013)Proc.Natl.Acad.Sci.U.S.A.111,652)。“TtAgo系统”是所有需要的组分,包括例如用于通过TtAgo酶的裂解的引导DNA。“重组”是指在两个多核苷酸之间交换遗传信息的过程,包括但不限于通过非同源末端连接(NHEJ)的供体捕获和同源重组。为了本公开的目的,“同源重组(HR)”是指例如在经由同源定向修复机制修复细胞中的双链断裂时发生的此类交换的专门形式。该过程需要核苷酸序列同源性,使用“供体”分子对“靶”分子(即,经历双链断裂的分子)进行的模板修复,并且被不同地称为“非交叉基因转换”或“短段基因转换”,因为其导致遗传信息从供体转移到靶。不希望受任何特定理论束缚,此类转移可涉及在断裂的靶与供体之间形成的异源双链DNA的错配校正和/或“合成依赖性链退火”,其中供体用于重新合成将成为靶的一部分的遗传信息,和/或相关过程。此类专门的HR通常导致靶分子序列的改变,以使得供体多核苷酸的部分或全部序列并入靶多核苷酸中。
锌指结合结构域或TALE DNA结合结构域可以被“工程化”以结合预定的核苷酸序列,例如经由工程化(改变一个或多个氨基酸)天然存在的锌指蛋白的识别螺旋区域或通过工程改造TALE蛋白的RVD。因此,工程化的锌指蛋白或TALE是非天然存在的蛋白。用于工程化锌指蛋白或TALE的方法的非限制性实例是设计和选择。“设计的”锌指蛋白或TALE是不存在于自然中的蛋白质,其设计/组成主要来自合理标准。设计的合理标准包括应用替代规则和计算机化算法处理存储现有ZFP设计和结合数据的信息的数据库中的信息。“选择的”锌指蛋白或TALE是在自然界中未发现的蛋白质,其产生主要来自经验方法,例如噬菌体展示、相互作用诱捕或杂交选择。见,例如,美国专利8,586,526;6,140,081;6,453,242;6,746,838;7,241,573;6,866,997;7,241,574和6,534,261;也见WO 03/016496。
术语“序列”是指任何长度的核苷酸序列,其可以是DNA或RNA;可以是线性的、环状的或分支的,并且可以是单链或双链的。术语“供体序列”是指被插入基因组中的核苷酸序列。供体序列可具有任何长度,例如长度为2至10,000个核苷酸(或其间或其上的任何整数值),优选长度为约100至1,000个核苷酸(或其间任何整数),更优选长度为约200至500个核苷酸。
“靶位点”或“靶序列”是限定结合分子将结合的核酸的一部分的核酸序列,只要存在足够的结合条件即可。
“外源”分子是通常不存在于细胞中但可以通过一种或多种遗传、生物化学或其它方法引入细胞的分子。相对于细胞的特定发育阶段和环境条件确定“在细胞中的正常存在”。因此,例如,仅在肌肉的胚胎发育期间存在的分子是相对于成体肌细胞的外源分子。类似地,由热休克诱导的分子是相对于非热休克细胞的外源分子。外源分子可以包含例如功能失常的内源分子的功能性形式或功能正常的内源分子的功能失常形式。
外源分子可以是,除其它以外,小分子,诸如通过组合化学方法产生的小分子,或大分子诸如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何经修饰的衍生物,或包含上述分子的一个或多个的任何复合物。核酸包括DNA和RNA,可以是单链或双链的;可以是线性的,分支的或环状的;并且可具有任何长度。核酸包括能够形成双链体的核酸,以及形成三链体的核酸。见,例如,美国专利第5,176,996号和第5,422,251号。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重塑因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰酯酶、脱乙酰酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解螺旋酶。
外源分子可以是与内源分子相同类型的分子,例如外源蛋白质或核酸。例如,外源核酸可以包含被引入细胞的感染性病毒基因组、质粒或附加体,或通常不存在于细胞中的染色体。将外源分子引入细胞的方法对于本领域技术人员是已知的,包括,但不限于脂质介导的转移(即,脂质体,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子也可以是与内源分子相同类型但源自与细胞所源自的物种不同的物种的分子。例如,可将人核酸序列引入最初源自小鼠或仓鼠的细胞系中。
相比之下,“内源”分子是在特定环境条件下在特定发育阶段通常存在于特定细胞中的分子。例如,内源核酸可以包含染色体、线粒体、叶绿体或其它细胞器的基因组或天然存在的附加体核酸。另外的内源分子可以包括蛋白质,例如,转录因子和酶。
“融合”分子是其中两个或更多个亚基分子连接,优选共价连接的分子。亚基分子可以是相同化学类型的分子,或可以是不同化学类型的分子。第一类型的融合分子的实例包括,但不限于融合蛋白(例如,ZFP或TALE DNA-结合结构域与一个或多个激活结构域之间的融合体)和融合核酸(例如,编码上文所述的融合蛋白的核酸)。第二类型的融合分子的实例包括,但不限于,形成三链体的核酸与多肽之间的融合,以及小沟结合剂与核酸之间的融合。
融合蛋白在细胞中的表达可由融合蛋白至细胞的递送或通过将编码融合蛋白的多核苷酸递送至细胞而产生,其中所述多核苷酸被转录,转录物被翻译以产生所述融合蛋白。反式剪接、多肽裂解和多肽连接也可以参与蛋白质在细胞中的表达。将多核苷酸和多肽递送至细胞的方法在本公开的其它地方提供。
“多聚化结构域”(也称为“二聚化结构域”或“蛋白质相互作用结构域”)是并入ZFP TF或TALE TF的氨基、羧基或氨基和羧基末端区域的结构域。这些结构域允许多个ZFP TF或TALE TF单位的多聚化,以使得较大片段的三核苷酸重复结构域相对于具有野生型数目的长度的较短片段,优先被多聚化的ZFP TF或TALE TF结合。多聚化结构域的实例包括亮氨酸拉链。多聚化结构域还可以通过小分子来调节,其中多聚化结构域呈现正确构象,以允许仅在小分子或外部配体存在的情况下与另一多聚化结构域相互作用。这样,外源配体可用于调节这些结构域的活性。
为了本公开的目的,“基因”包括编码基因产物(见下文)的DNA区域以及调节基因产物的产生的所有DNA区域,无论此类调控序列是否与编码序列和/或转录的序列相邻。因此,基因包括,但不必限于启动子序列、终止子、翻译调控序列诸如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起始点、基质附着位点和基因座控制区。
“基因表达”是指包含在基因中的信息至基因产物的转化。基因产物可以是基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其它类型的RNA)或通过翻译mRNA产生的蛋白质。基因产物还包括通过诸如加帽、多聚腺苷酸化、甲基化和编辑的过程修饰的RNA和通过例如甲基化、乙酰化、磷酸化、遍在蛋白化、ADP-核糖基化、肉豆蔻基化和糖基化修饰的蛋白质。
基因表达的“调节”是指基因活性的变化。表达的调节可包括,但不限于,基因激活和基因抑制。基因组编辑(例如,裂解、改变、失活、随机突变)可用于调节表达。基因失活是指相较于不包括如本文所述的ZFP或TALE蛋白的细胞,基因表达的任何减少。因此,基因失活可以是部分或完全的。
“目标区域”是其中期望结合外源分子的细胞染色质的任何区域,例如,基因或基因内或与之邻近的非编码序列。结合可以是为了靶向DNA裂解和/或靶向重组的目的。目标区域可以例如存在于染色体、附加体、细胞器基因组(例如,线粒体、叶绿体)或感染性病毒基因组中。目标区域可存在于基因的编码区内、转录的非编码区例如例如前导序列、尾部序列或内含子内,或在非转录区(编码区的上游或下游)内。目标区域可以小至单个核苷酸对或长达2,000个核苷酸对,或任何核苷酸对的整数值。
“真核”细胞包括,但不限于,真菌细胞(诸如酵母)、植物细胞、动物细胞、哺乳动物细胞和人细胞(例如,T细胞)。
术语“有效键联”和“可操作地连接”(或“有效地连接”)就两个或更多个组分(诸如序列元件)的并置而言可互换使用,其中这样排列组分以使得两个组分正常地起作用,并且使得所述组分中的至少一个有可能可以介导施加在至少一个另外的组分上的功能。作为说明,如果转录调控序列响应于一种或多种转录调节因子的存在或不存在而控制编码序列的转录水平,则所述转录调控序列(例如启动子)可操作地连接于编码序列。转录调控序列通常与编码序列以顺式可操作地连接,但不需要与其直接相邻。例如,增强子是可操作地连接于编码序列的转录调控序列,即使它们不是毗连的。
关于融合多肽,术语“可操作地连接”可指这样的事实:每个组分与另一个组分连接时执行与当其不这样连接时其可执行的功能相同的功能。例如,对于其中ZFP或TALE DNA-结合结构域融合于激活结构域的融合多肽,如果在融合多肽中ZFP或TALE DNA-结合结构域部分能够结合其靶位点和/或其结合位点,而激活结构域能够上调基因表达,则所述ZFP或TALE DNA-结合结构域与激活结构域处于有效键联中。与能够调节基因表达的结构域融合的ZFP统称为“ZFP-TF”或“锌指转录因子”,而与能够调节基因表达的结构域融合的TALE统称为“TALE-TF”或“TALE转录因子”。当为其中ZFP DNA-结合结构域融合于裂解结构域(“ZFN”或“锌指核酸酶”)的融合多肽时,如果在所述融合多肽中,ZFP DNA-结合结构域部分能够结合其靶位点和/或其结合位点,而裂解结构域能够裂解靶位点附近的DNA,则所述ZFP DNA-结合结构域和裂解结构域处于有效键联中。当为其中TALE DNA-结合结构域融合于裂解结构域(“TALEN”或“TALE核酸酶”)的融合多肽时,如果在所述融合多肽时,TALE DNA-结合结构域部分能够结合其靶位点和/或其结合位点,而裂解结构域能够裂解靶位点附近的DNA,则TALE DNA-结合结构域和裂解结构域处有效键联中。关于其中Cas DNA-结合结构域融合于激活结构域的融合多肽,如果在所述融合多肽中,Cas DNA结合结构域部分能够结合其靶位点和/或其结合位点,而激活域能够上调基因表达,则Cas DNA-结合结构域和激活结构域处于有效键联中。当为其中Cas DNA-结合结构域融合于裂解结构域的融合多肽时,如果在所述融合多肽中,Cas DNA结合结构域部分能够结合其靶位点和/或其结合位点,而裂解结构域能够裂解靶位点附近的DNA,则Cas DNA结合结构域与裂解结构域处于有效键联中。
蛋白质、多肽或核酸的“功能性片段”是其序列与全长蛋白质、多肽或核酸不同但仍保持与全长蛋白质、多肽或核酸相同的功能的蛋白质,多肽或核酸。功能性片段可具有与对应天然分子相比更多、更少或相同数目的残基,和/或可含有一个或多个氨基酸或核苷酸取代。用于测定核酸的功能(例如,编码功能,与另一核酸杂交的能力)的方法在本领域中是公知知的。类似地,用于测定蛋白质功能的方法是公知的。例如,可以例如通过过滤结合、电泳迁移率变动或免疫沉淀测定来测定多肽的DNA结合功能。DNA裂解可通过凝胶电泳来测定。见Ausubel等,同上。蛋白质与另一种蛋白质相互作用的能力可以例如通过共免疫沉淀、双杂交测定或互补(遗传和生物化学)来测定。见,例如,Fields等(1989)Nature340:245-246;美国专利第5,585,245号和PCT WO 98/44350。
“载体”能够将基因序列转移至靶细胞。通常地,“载体构建体”、“表达载体”和“基因转移载体”是指能够指导目标基因表达并且可将基因序列转移至靶细胞的任何核酸构建体。因此,术语包括克隆性和表达载体,以及整合载体。
“报告基因”或“报告序列”是指产生易于优选但不一定在常规测定中测量的蛋白质产物的任何序列。合适的报告基因包括,但不限于,编码介导抗生素抗性(例如,氨苄青霉素抗性、新霉素抗性、G418抗性、嘌呤霉素抗性)的蛋白质的序列、编码有色或荧光或发光蛋白(例如,绿色荧光蛋白、增强绿色荧光蛋白、红色荧光蛋白、荧光素酶)的序列和介导增强的细胞生长和/或基因扩增的蛋白(例如,二氢叶酸还原酶)。表位标签包括,例如,一个或多个拷贝的FLAG、His、myc、Tap、HA或任何可检测的氨基酸序列。“表达标签”包括编码报告分子的序列,所述报告子可被可操作地连接于所需的基因序列,以便监测目标基因的表达。
DNA-结合结构域
本文所述的方法利用组合物,例如Htt-调节转录因子,其包含特异性结合Htt基因中的靶序列,特别是结合突变型Htt等位基因的DNA-结合结构域,所述突变型Htt等位基因包含多个三核苷酸重复。任何DNA-结合结构域都可用于本文公开的组合物和方法中。
在某些实施方案中,Htt-调节转录因子或其中的DNA结合结构域包含锌指蛋白。靶位点的选择;用于设计和构建融合蛋白(和编码其的多核苷酸)的ZFP和方法是本领域技术人员已知的,并且详细地描述于美国专利第6,140,081号;第5,789,538号;第6,453,242号;第6,534,261号;第5,925,523号;第6,007,988号;第6,013,453号;第6,200,759号;WO 95/19431;WO 96/06166;WO 98/53057;WO98/54311;WO 00/27878;WO 01/60970;WO 01/88197;WO 02/099084;WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO03/016496中。
在某些实施方案中,ZFP可选择性地结合突变型Htt等位基因或野生型Htt序列。Htt靶位点通常包括至少一个锌指,但可包括多个锌指(例如,2个、3个、4个、5个、6个或更多个锌指)。通常,ZFP包括至少3个指。某些ZFP包括4个、5个或6个指,而一些ZFP包括8个、9个、10个、11个或12个指。包括3个指的ZFP通常识别包括9个或10个核苷酸的靶位点;包括4个指的ZFP通常识别包括12个至14个核苷酸的靶位点;而具有6个指的ZFP可识别包括18个至21个核苷酸的靶位点。ZFP还可以是包括一个或多个调节结构域的融合蛋白,所述结构域可以是转录激活或抑制结构域。在一些实施方案中,所述融合蛋白包含连接在一起的两个ZFP DNA结合结构域。因此,这些锌指蛋白可包含8个、9个、10个、11个、12个或更多个指。在一些实施方案中,两个DNA结合结构域经由可延伸的柔性接头连接,以使得一个DNA结合结构域包含4个、5个或6个锌指,并且第二DNA结合结构域包含另外的4个、5个或5个锌指。在一些实施方案中,接头是标准指间接头,以使得指阵列包含一个包含8个、9个、10个、11个或12个或更多个指的DNA结合结构域。在其它实施方案中,接头是非典型接头,例如柔性接头。DNA结合结构域融合于至少一个调节结构域并且可以被认为是‘ZFP-ZFP-TF’结构。这些实施方案的具体实例可被称为“ZFP-ZFP-KOX”,其包含与柔性接头连接并与KOX阻遏子融合的两个DNA结合结构域,和“ZFP-KOX-ZFP-KOX”,其中两个ZFP-KOX融合蛋白经由接头融合在一起。
或者,DNA-结合结构域可源自核酸酶。例如,归巢内切核酸酶和大范围核酸酶的识别序列诸如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII是已知的。也见美国专利第5,420,032号;美国专利第6,833,252号;Belfort等(1997)Nucleic Acids Res.25:3379–3388;Dujon等(1989)Gene 82:115–118;Perler等(1994)Nucleic Acids Res.22,1125–1127;Jasin(1996)Trends Genet.12:224–228;Gimble等(1996)J.Mol.Biol.263:163–180;Argast等(1998)J.Mol.Biol.280:345–353以及New England Biolabs目录。另外,归巢内切核酸酶和大范围核酸酶的DNA结合特异性可被工程化来结合非天然靶位点。见,例如,Chevalier等(2002)Molec.Cell 10:895-905;Epinat等(2003)Nucleic Acids Res.31:2952-2962;Ashworth等(2006)Nature441:656-659;Paques等(2007)Current Gene Therapy 7:49-66;美国专利公开第20070117128号。
“双手”锌指蛋白是其中两个锌指DNA结合结构域的簇通过插入氨基酸分开,以使得两个锌指结构域结合两个不连续的靶位点的那些蛋白。双手类型的锌指结合蛋白的实例是SIP1,其中4个锌指的簇位于蛋白的氨基末端,3个指的簇位于羧基末端(见Remacle等,(1999)EMBO Journal 18(18):5073-5084)。这些蛋白中的每个锌指簇能够结合独特的靶序列,并且两个靶序列之间的间隔可包含许多核苷酸。双手ZFP可以包括例如与一个或两个ZFP融合的功能结构域。因此,显而易见的是,可将功能结构域附接于一个或两个ZFP的外部(见图1C)或可位于ZFP之间(附接于两个ZFP)(见图4)。
Htt-靶向的ZFP的具体实例公开于美国专利公开第20130253040号(出于所有目的,所述美国专利公开通过引用整体并入本文)以及下表1中。该表中的第一列是用于ZFP的内部参照名称(编号),并且对应于表2的第1列中的相同名称。“F”是指指,并且“F”之后的数字是指哪个锌指(例如,“F1”是指指1)。
表1:Htt-靶向的锌指蛋白
这些蛋白的靶位点的序列和位置公开于表2中。由ZFP识别螺旋接触的靶位点中的核苷酸以大写字母标示;非接触核苷酸以小写字母标示。
表2:人和小鼠Htt上的靶位点
在某些实施方案中,所述DNA-结合结构域包含天然存在的或工程化的(非天然存在的)TAL效应子(TALE)DNA结合结构域。见,例如,美国专利第8,586,526号,通过引用整体并入本文。
已知黄单胞菌属(Xanthomonas)的植物病原细菌在重要的作物植物中引起许多疾病。黄单胞菌属的致病性取决于保守的III型分泌(T3S)系统,其将超过25种不同的效应子蛋白注射至植物细胞中。在这些注射的蛋白质中有转录激活物样效应子(TALE),其模拟植物转录激活物并操纵植物转录组(见Kay等(2007)Science 318:648-651)。这些蛋白质含有DNA结合结构域和转录激活结构域。最充分表征的TALE之一是来自野油菜黄单胞菌辣椒点病(Xanthomonas campestgris pv.Vesicatoria)的AvrBs3(见Bonas等(1989)Mol Gen Genet 218:127-136和WO2010079430)。TALE含有串联重复的集中结构域,每个重复含有大约34个氨基酸,这对于这些蛋白质的DNA结合特异性是至关重要的。此外,它们含有核定位序列和酸性转录激活结构域(关于综述,见Schornack S等(2006)J Plant Physiol 163(3):256-272)。另外,在植物病原细菌青枯雷尔氏菌(Ralstonia solanacearum)中,已经发现称为brg11和hpx17的两个基因与青枯雷尔氏菌生物变种1(R.solanacearum biovar 1)菌株GMI1000中和生物变种4菌株RS1000中的黄单胞菌属的AvrBs3家族同源(见Heuer等(2007)Appl and Envir Micro 73(13):4379-4384)。这些基因在核苷酸序列上彼此之间具有98.9%相一性,但相异在于hpx17的重复结构域中的1,575bp的缺失。然而,两种基因产物均与黄单胞菌属的AvrBs3家族蛋白具有小于40%的序列同一性。
这些TALE的特异性取决于在串联重复中发现的序列。重复序列包含约102bp,并且重复序列通常彼此具有91-100%的同源性(Bonas等,同上)。重复序列的多态性通常位于12和13位上,并且似乎在12和13位上的高可变双残基的种类与TALE的靶序列中连续核苷酸的种类之间存在一一对应(见Moscou和Bogdanove(2009)Science326:1501和Boch等(2009)Science 326:1509-1512)。在实验上已确定这些TALE的DNA识别编码,以使得12和13位上的HD序列导致结合胞嘧啶(C),NG结合T,NI结合A、C、G或T,NN结合A或G,以及NG结合T。这些DNA结合重复已被组装成具有新的重复的组合和数量的蛋白质,以制备能够与新序列相互作用的人工转录因子。另外,美国专利第8,586,526号和美国公开第20130196373号(通过引用整体并入本文)描述了具有N-帽多肽、C帽多肽(例如,+63、+231或+278)和/或新型(非典型)RVD的TALE。
示例性TALE描述于美国专利公开第20130253040号(其通过引用整体并入)和下面的表3中。
所测试的TALE TF的目标和数字标识符示于下面的表3中。数字标识符标记为“SBS#”,指示了对于有义或反义链的特异性(“S/A”),以及靶、重复单元或RVD的数目和C-末端的类型。
表3:Htt特异性TALE-TF
在某些实施方案中,DNA结合结构域包括二聚化和/或多聚化结构域,例如卷曲螺旋(CC)和二聚化锌指(DZ)。见美国专利公开第20130253040号。
最近已出现在古细菌和许多细胞中存在RNA介导的基因组防御途径的令人信服的证据,所述细菌已被假设与真核RNAi途径平行(观于综述,见Godde和Bickerton、2006.J.Mol.Evol.62:718-729;Lillestol等,2006.Archaea 2:59-72;Makarova等,2006.Biol.Direct 1:7.;Sorek等,2008.Nat.Rev.Microbiol.6:181-186)。称为CRISPR-Cas系统或原核RNAi(pRNAi)的该途径被提议从两个进化上和通常物理连接的基因座产生:CRISPR(成簇的规律间隔性短回文重复)基因座,其编码系统的RNA组分,和cas(CRISPR相关的)基因座,其编码蛋白质(Jansen等,2002.Mol.Microbiol.43:1565-1575;Makarova等,2002.Nucleic Acids Res.30:482-496;Makarova等,2006.Biol.Direct 1:7;Haft等,2005.PLoS Comput.Biol.1:e60)。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能够对CRISPR介导的核酸裂解的特异性编程的非编码RNA元件的组合。单个Cas蛋白与真核RNAi机制的蛋白质组分不共有显著的序列相似性,但具有类似的预测的功能(例如,RNA结合、核酸酶、解旋酶等)(Makarova等,2006.Biol.Direct 1:7)。CRISPR相关(cas)基因通常与CRISPR重复间隔区阵列相关联。已经描述了超过40个不同的Cas蛋白家族。在这些蛋白家族中,Cas1似乎在不同的CRISPR/Cas系统中普遍存在。已经使用cas基因和重复结构的特定组合来定义8种CRISPR亚型(Ecoli、Ypest、Nmeni、Dvulg、Tneap、Hmari、Apern和Mtube),其中一些与编码重复相关神秘蛋白(RAMP)的另外的基因模块相关。多于一种CRISPR亚型可存在于单个基因组中。CRISPR/Cas亚型的零星分布表明该系统在微生物进化过程中经历水平基因转移。
最初在化脓性链球菌(S.pyogenes)中描述的II型CRISPR是被最充分表征的系统之一,并且在四个连续步骤中进行靶向DNA双链断裂。首先,两个非编码RNA,前-crRNA阵列和tracrRNA,从CRISPR基因座转录。第二,tracrRNA与前-crRNA的重复区杂交并介导前-crRNA至含单个间隔区序列的成熟crRNA的加工,其中在Cas9蛋白存在的情况下通过双链特异性RNA酶III进行加工。第三,成熟的crRNA:tracrRNA复合物经由crRNA上的间隔区与邻近前间区序列邻近基序(PAM)的靶DNA上的前间区序列之间的沃尔森-克里克碱基配对将Cas9导向靶DNA,靶识别的另外要求。另外,tracrRNA也必须存在,因为其与crRNA在其3'末端碱基配对,并且该缔合触发Cas9活性。最后,Cas9介导靶DNA裂解以在前间区序列内产生双链断裂。CRISPR/Cas系统的活性由三个步骤组成:(i)将外来DNA序列插入CRISPR阵列以在称为“适应”的过程中防止未来攻击,(ii)相关蛋白质的表达,以及阵列的表达和加工,随后是(iii)RNA介导的对外来核酸的干扰。因此,在细菌细胞中,几种所谓的‘Cas’蛋白参与CRISPR/Cas系统的天然功能。
在许多不同的细菌中发现了II型CRISPR系统。由Fonfara等((2013)Nuc Acid Res 42(4):2377-2590)对公众可获得的基因组进行的BLAST搜索,在347种细菌中发现了Cas9的直向同源物。另外,该研究小组展示了使用来自化脓性链球菌、变形链球菌(S.mutans)、嗜热链球菌(S.therophilus)、空肠弯曲菌(C.jejuni)、脑膜炎奈瑟氏球菌(N.meningitides)、多杀巴氏杆菌(P.multocida)和新凶手弗朗西丝菌(F.novicida)的Cas9直向同源物进行的DNA靶的体外CRISPR/Cas裂解。因此,术语“Cas9”是指包含DNA结合结构域和两个核酸酶结构域的RNA引导的DNA核酸酶,其中编码Cas9的基因可以源自任何合适的细菌。
Cas9蛋白具有至少两个核酸酶结构域:一个核酸酶结构域类似于HNH内切核酸酶,而另一个类似于Ruv内切核酸酶结构域。HNH型结构域似乎负责裂解与crRNA互补的DNA链,而Ruv结构域裂解非互补链。可对Cas9核酸酶进行工程化,以使得所述核酸酶结构域中仅有一个具有功能性,产生Cas切口酶(见Jinek等,同上)。可通过在酶的催化结构域中进行特定的氨基酸突变,或通过截短所述结构域的部分或全部(以使得其不再具有功能)来产生切口酶。由于Cas 9包含两个核酸酶结构域,所以该方法可在任一结构域上进行。通过使用两种这样的Cas 9切口酶可在靶DNA中实现双链断裂。切口酶将各自裂解DNA的一条链,并且两种Cas 9切口酶的使用将产生双链断裂。
可通过使用包含通常由crRNA和tracrRNA退火形成的发夹的工程化“单引导RNA”(sgRNA)来避免对crRNA-tracrRNA复合物的需要(见Jinek等(2012)Science 337:816和Cong等(2013)Sciencexpress/10.1126/science.1231143)。在致热螺旋体(S.pyrogenes)中,当双链RNA:DNA异二聚体在Cas相关RNA与靶DNA之间形成时,工程化的tracrRNA:crRNA融合物或sgRNA引导Cas9裂解靶DNA。包含Cas9蛋白和含有PAM序列的工程化sgRNA的该系统已用于RNA引导的基因组编辑(见Ramalingam,同上),并且已经用于体内斑马鱼胚胎基因组编辑(见Hwang等(2013)Nature Biotechnology31(3):227),编码效率与ZFN和TALEN相似。
CRISPR基因座的初级产物似乎是包含入侵者靶向序列的短RNA,并且基于它们在途径中的假设作用被称为引导RNA或原核沉默RNA(psiRNA)(Makarova等,2006.Biol.Direct 1:7;Hale等,2008.RNA,14:2572-2579)。RNA分析表明,CRISPR基因座转录物在重复序列内被裂解以释放含有单个侵入物靶向序列的约60至70-nt RNA中间体,以及侧翼重复片段(Tang等2002.Proc.Natl.Acad.Sci.99:7536-7541;Tang等,2005.Mol.Microbiol.55:469-481;Lillestol等2006.Archaea 2:59-72;Brouns等2008.Science 321:960-964;Hale等,2008.RNA,14:2572-2579)。在古细菌激烈火球菌(Pyrococcus furiosus)中,这些中间体RNA被进一步加工成丰富、稳定的约35-45-nt的成熟psiRNA(Hale等2008.RNA,14:2572-2579)。
可通过使用包含通常通过crRNA与tracrRNA的退火形成的发夹的工程化“单引导RNA”(sgRNA),来避免对crRNA-tracrRNA复合物的需求(参见Jinek等(2012)Science 337:816和Cong等(2013)Sciencexpress/10.1126/science.1231143)。在致热螺旋体中,当双链RNA:DNA异二聚体在Cas相关RNA与靶DNA之间形成时,工程化的tracrRNA:crRNA融合物或sgRNA引导Cas9裂解靶DNA。包含Cas9蛋白和含有PAM序列的工程化的sgRNA的该系统已经用于RNA引导的基因组编辑(参见Ramalingam,同上),并且已经用于体内斑马鱼胚胎基因组编辑(参见Hwang等(2013)Nature Biotechnology31(3):227),其编辑效率与ZFN和TALEN相似。
嵌合或sgRNA可被工程化以包含与任何所需靶互补的序列。在一些实施方案中,引导序列长度为约或大于约5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、75个或更多个核苷酸。在一些实施方案中,引导序列的长度小于约75个、50个、45个、40个、35个、30个、25个、20个、15个、12个或更少的核苷酸。在一些实施方案中,RNA包含与靶序列互补的22个碱基,和形式G[n19]的碱基,接着用于与化脓性链球菌CRISPR/Cas系统一起使用的形式NGG或NAG的前间区序列邻近基序(PAM)。因此,在一种方法中,可通过以下步骤利用目标基因中的已知的ZFN靶来设计sgRNA:(i)将ZFN异源二聚体的识别序列与相关基因组(人、小鼠或特定植物物种的)的参照序列进行比对;(ii)鉴定ZFN半位点之间的间隔区;(iii)鉴定最接近间隔区的基序G[N20]GG的位置(当多于一个此类基序列与间隔区重叠时,选择相对于间隔区居中的基序);(iv)使用该基序作为sgRNA的核心。该方法有利地依赖于证实的核酸酶靶。或者,可设计sgRNA以简单地通过鉴定符合G[n20]GG式的合适的靶序列来靶向任何目标区域。与互补区一起,sgRNA可包含额外的核苷酸以延伸至sgRNA的tracrRNA部分的尾部区域(见Hsu等(2013)Nature Biotech doi:10.1038/nbt.2647)。尾部可具有+67至+85个核苷酸,或其间任何数目,优选长度为+85个核苷酸。也可以使用截短的sgRNA,“tru-gRNA”(见Fu等,(2014)Nature Biotech 32(3):279)。在tru-gRNA中,互补区被减少至长度为17个或18个核苷酸。
另外,还可使用可选择的PAM序列,其中PAM序列可以是作为NGG的替代物的NAG(Hsu 2014,同上),使用化脓性链球菌Cas9。另外的PAM序列还可包括缺少初始G的那些PAM序列(Sander和Joung(2014)Nature Biotech 32(4):347)。除了化脓性链球菌编码的Cas9PAM序列以外,还可使用对于来自其它细菌来源的Cas9蛋白是特异的其它PAM序列。例如,下面显示的PAM序列(改编自Sander和Joung,同上和Esvelt等(2013)Nat Meth 10(11):1116)对于这些Cas9蛋白质是特异性的:
因此,可以根据以下准则:[n17,n18,n19或n20](G/A)G选择与化脓性链球菌CRISPR/Cas系统一起使用的合适的靶序列。或者,PAM序列可遵循准则G[n17,n18,n19,n20](G/A)G。对于源自非化脓性链球菌细菌的Cas9蛋白,可使用相同的指导原则,其中替代PAM被替代为化脓性链球菌PAM序列。
最优选的是选择具有最高避免潜在脱靶序列的特异性的可能性的靶序列。这些不希望的脱靶序列可通过考虑以下属性来鉴定:i)靶序列中的相似性,所述靶序列之后是已知与正在使用的Cas9蛋白一起作用的PAM序列;ii)与所需靶序列具有少于3个错配的相似靶序列;iii)如ii)中的相似靶序列,其中所述错配均位于PAM远端区而不是PAM近端区(一些证据表明,紧邻或邻近PAM的核苷酸1-5,有时被称为“种子”区域(Wu等(2014)Nature Biotech doi:10.1038/nbt2889)是对于识别最关键的,因此具有位于种子区域中的错配的假定脱靶位点可能是最不可能被sg RNA识别的);和iv)其中错配被不连续地间隔或间隔大于4个核苷酸(Hsu 2014,同上)的相似靶序列。因此,通过使用上述这些标准,对将对其应用任何CRIPSR/Cas系统的基因组中的潜在脱靶位点的数目进行分析,可鉴定sgRNA的合适的靶序列。
在某些实施方案中,Cas蛋白可以是天然存在的Cas蛋白的“功能性衍生物”。天然序列多肽的“功能性衍生物”是具有与天然序列多肽相同的定性生物学性质的化合物。“功能性衍生物”包括但不限于天然序列的片段和天然序列多肽及其片段的衍生物,条件是它们具有与对应的天然序列多肽共同的生物活性。本文考虑的生物活性是功能性衍生物将DNA底物水解成片段的能力。术语“衍生物”涵盖多肽的氨基酸序列变体、共价修饰及其融合物。在一些方面,功能性衍生物可包含天然存在的Cas蛋白的单一生物学特性。在其他方面,功能性衍生物可包含一个亚组的天然存在的Cas蛋白的生物学性质。Cas多肽或其片段的合适衍生物包括但不限于Cas蛋白或其片段的突变体,融合物,共价修饰。Cas蛋白,其包括Cas蛋白或其片段,以及Cas蛋白或其片段的衍生物,可从细胞获得或化学合成或通过这两种方法的组合获得。细胞可以是天然产生Cas蛋白的细胞,或天然产生Cas蛋白,并且被遗传工程化以在更高的表达水平产生内源Cas蛋白,或从外源引入的核酸产生Cas蛋白的细胞,所述核酸酸编码与内源性Cas相同或不同的Cas。在一些情况下,细胞不天然产生Cas蛋白,并且被遗传工程化以产生Cas蛋白。
靶向特定基因的示例性CRISPR/Cas核酸酶系统例如在美国临时申请第61/823,689号中被公开。
因此,核酸酶包含与裂解DNA的核酸酶结构域组合的DNA结合结构域,所述DNA结合结构域特异性结合任何希望插入供体的基因(转基因)中的靶位点。
融合分子
DNA-结合结构域可与任何另外的分子(例如,多肽)融合以用于本文所述的方法中。在某些实施方案中,所述方法使用包含至少一种DNA结合分子(例如,ZFP、TALE或单引导RNA)和异源调节(功能性)结构域(或其功能性片段)的融合分子。
在某些实施方案中,功能性结构域包含转录调节结构域。共同结构域包括例如转录因子结构域(激活物、阻遏物、共激活物、共阻遏物)、沉默子、致癌基因(例如,myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mos家族成员等);DNA修复酶及其相关因子和修饰物;DNA重排酶及其相关因子和修饰物;染色质相关蛋白及其修饰物(例如激酶、乙酰酯酶和脱乙酰酶);和DNA修饰酶(例如,甲基转移酶、拓扑异构酶、解旋酶、连接酶、激酶、磷酸酶、聚合酶、内切核酸酶)及其相关因子和修饰物。见,例如,美国公开第20130253040号,将其通过引用整体并入本文。
用于实现激活的合适的结构域包括HSV VP16激活结构域(见,例如Hagmann等,J.Virol.71,5952-5962(1997))、核激素受体(见,例如,Torchia等,Curr.Opin.Cell.Biol.10:373-383(1998));核因子κB的p65亚基(Bitko&Barik,J.Virol.72:5610-5618(1998)和Doyle&Hunt,Neuroreport 8:2937-2942(1997));Liu等,Cancer Gene Ther.5:3-28(1998)),或人工嵌合功能性结构域诸如VP64(Beerli等,(1998)Proc.Natl.Acad.Sci.USA 95:14623-33)和降解单元(Molinari等,(1999)EMBO J.18,6439-6447)。另外的示例激活结构域包括Oct 1、Oct-2A、Sp1、AP-2和CTF1(Seipel等,EMBO J.11,4961-4968(1992)以及p300、CBP、PCAF、SRC1、PvALF、AtHD2A和ERF-2。见,例如,Robyr等(2000)Mol.Endocrinol.14:329-347;Collingwood等(1999)J.Mol.Endocrinol.23:255-275;Leo等(2000)Gene 245:1-11;Manteuffel-Cymborowska(1999)Acta Biochim.Pol.46:77-89;McKenna等(1999)J.Steroid Biochem.Mol.Biol.69:3-12;Malik等(2000)Trends Biochem.Sci.25:277-283;和Lemon等(1999)Curr.Opin.Genet.Dev.9:499-504。另外的示例性激活结构域包括,但不限于OsGAI、HALF-1、C1、AP1、ARF-5,-6,-7和-8、CPRF1、CPRF4、MYC-RP/GP和TRAB1。见,例如,Ogawa等(2000)Gene 245:21-29;Okanami等(1996)Genes Cells 1:87-99;Goff等(1991)Genes Dev.5:298-309;Cho等(1999)Plant Mol.Biol.40:419-429;Ulmason等(1999)Proc.Natl.Acad.Sci.USA 96:5844-5849;Sprenger-Haussels等(2000)Plant J.22:1-8;Gong等(1999)Plant Mol.Biol.41:33-44;和Hobo等(1999)Proc.Natl.Acad.Sci.USA 96:15,348-15,353。
示例性抑制结构域包括但不限于,KRAB A/B、KOX、TGF-β诱导型早期基因(TIEG)、v-erbA、SID、MBD2、MBD3、DNMT家族的成员(例如,DNMT1、DNMT3A、DNMT3B)、Rb和MeCP2。见,例如,Bird等(1999)Cell 99:451-454;Tyler等(1999)Cell 99:443-446;Knoepfler等(1999)Cell 99:447-450;和Robertson等(2000)Nature Genet.25:338-342。另外的示例性抑制结构域包括但不限于,ROM2和AtHD2A。见,例如,Chem等(1996)Plant Cell 8:305-321;和Wu等(2000)Plant J.22:19-27。
通过本领域技术人员公知的克隆和生化缀合方法构建融合分子。融合分子包含DNA结合结构域和功能结构域(例如,转录激活或抑制结构域)。融合分子还任选地包含核定位信号(诸如,例如,来自SV40培养基T-抗原的核定位信号)和表位标签(诸如,例如,FLAG和血凝素)。设计融合蛋白(和编码它们的核酸),以使得翻译阅读框架保留在融合物的组分中。
一方面功能性结构域(或其功能性片段)的多肽组分与另一方面的非蛋白质DNA结合结构域(例如,抗生素、嵌入剂、小沟结合剂、核酸)之间的融合,通过本领域技术人员已知的生物化学缀合方法构建。见,例如,the Pierce Chemical Company(Rockford、IL)目录。已经描述了用于制备小沟结合剂与多肽之间的融合物的方法和组合物。Mapp等(2000)Proc.Natl.Acad.Sci.USA 97:3930-3935。
如本领域技术人员已知的,可将融合分子与药学上可接受的载体一起配制。见,例如,Remington's Pharmaceutical Sciences,第17版,1985;和共同拥有的WO 00/42219。
融合分子的功能性组分/结构域可选自能够影响基因转录的多种不同组分中的任何一种,只要融合分子经由其DNA结合结构域结合靶序列。因此,功能性组分可包括,但不限于,各种转录因子结构域,例如激活物、阻遏物、共激活物、共阻遏物和沉默子。
在某些实施方案中,融合蛋白包含DNA结合结构域和核酸酶结构域,以产生能够通过它们的工程化的(ZFP或TALE)DNA结合结构域来识别它们的预期核酸靶的功能实体,和产生核酸酶(例如,锌指核酸酶或TALE核酸酶),以导致DNA经由核酸酶活性在DNA结合位点附近被裂解。
因此,本文所述的方法和组合物具有广泛适用性,并且可以涉及任何目标核酸酶。核酸酶的非限制性实例包括大范围核酸酶、TALEN和锌指核酸酶。核酸酶可包含异源DNA结合和裂解结构域(例如,锌指核酸酶;TALEN;具有异源裂解结构域的大范围核酸酶DNA-结合结构域)或,可选择地,可改变天然存在的核酸酶的DNA结合结构域以结合选择的靶位点(例如,已被工程化来结合不同于同源结合位点的位点的大范围核酸酶)。
核酸酶结构域可以源自任何核酸酶,例如任何内切核酸酶或外切核酸酶。可以与本文所述的Htt DNA-结合结构域融合的合适的核酸酶(裂解)结构域的非限制性实例包括来自任何限制性内切酶的结构域,例如IIS型限制性内切酶(例如,FokI)。在某些实施方案中,裂解结构域是需要二聚化来具有裂解活性的裂解半结构域。见,例如,美国专利第8,586,526号;第8,409,861号和第7,888,121号,将其通过引用整体并入本文。通常地,如果融合蛋白包含裂解半结构域,则需要两个融合蛋白用于裂解。或者,可使用包含两个裂解半结构域的单一蛋白质。两个裂解半结构域可以源自相同的内切核酸酶(或其功能性片段),或每个裂解半结构域可源自不同的内切核酸酶(或其功能性片段)。另外,优选地将两个融合蛋白的靶位点彼此相对地设置,以使得两个融合蛋白与其各自的靶位点的结合将裂解半结构域置于彼此的空间取向,这使得裂解半结构域例如通过二聚化形成功能性裂解结构域。
核酸酶结构域还可以源自具有裂解活性的任何大范围核酸酶(归巢内切核酸酶)结构域,也可与本文所述的核酸酶一起使用,所述核酸酶包括但不限于I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。
在某些实施方案中,核酸酶包含致密TALEN(cTALEN)。这些酶是将TALE DNA结合结构域连接于TevI核酸酶结构域的单链融合蛋白。取决于TALE DNA结合结构域相对于大范围核酸酶(例如,TevI)核酸酶结构域所处的位置,融合蛋白可用作由TALE区定位的切口酶,或者可以产生双链断裂(见,Beurdeley等(2013)Nat Comm:1-8DOI:10.1038/ncomms2782)。
在其它实施方案中,TALE-核酸酶是大TAL。这些大TAL核酸酶是包含TALE DNA结合结构域和大范围核酸酶裂解结构域的融合蛋白。大范围核酸酶裂解结构域作为单体是有活性的并且不需要二聚化来具有活性。(见Boissel等,(2013)Nucl Acid Res:1-13,doi:10.1093/nar/gkt1224)。
另外,大范围核酸酶的核酸酶结构域还可表现出DNA结合功能。任何TALEN可以与另外的TALEN(例如,一种或多种TALEN(cTALEN或FokI-TALEN)与一种或多个种TAL)和/或ZFN组合使用。
另外,相较于野生型,裂解结构域可包括一个或多个改变,例如用于形成减少或消除脱靶裂解效应的专性异源二聚体。参,见例,如美国专利第7,914,796号;第8,034,598号和第8,623,618号,通过引用整体并入本文。
如本文所述的核酸酶可在双链靶(例如,基因)中产生双链或单链断裂。单链断裂(“缺口”)的产生描述于例如美国专利第8,703,489号(通过引用并入本文)中,该专利描述了核酸酶结构域之一的的催化结构域的突变如何导致切口酶。
因此,核酸酶(裂解)结构域或裂解半结构域可以是保留裂解活性或保留多聚化(例如,二聚化)以形成功能性裂解结构域的能力的蛋白质的任何部分。
或者,可使用所谓的“裂解酶”技术(见,例如,美国专利公开第20090068164号)在核酸靶位点上体内组装核酸酶。此类裂解酶的组分可在单独的表达构建体上表达,或可被连接在其中单个组分例如通过自裂解2A肽或IRES序列分开的一个开放阅读框架中。组分可以是单个锌指结合结构域或大范围核酸酶核酸结合结构域的结构域。
可在使用之前例如在美国公开第20090111119号中描述的基于酵母的染色体系统中筛选核酸酶的活性。可使用本领域已知的方法容易地设计核酸酶表达构建体。
融合蛋白的表达可在组成型启动子或诱导型启动子(例如在棉子糖和/或半乳糖存在的情况下被激活(去阻遏)并且在葡萄糖存在的情况下被抑制的半乳糖激酶启动子)的控制下。在某些实施方案中,启动子自我调节融合蛋白的表达,例如经由包含高亲和力结合位点。见,例如于2014年3月18日提交的美国申请第61,955,002号。
递送
可通过任何合适的方法将蛋白质和/或多核苷酸(例如,ZFP、TALE、CRISPR/Cas)和包含本文所述的蛋白质和/或多核苷酸的组合物递送至靶细胞,所述方法包括,例如,通过注射蛋白质,经由mRNA和/或使用表达构建体(例如,质粒、慢病毒载体、AAV载体、Ad载体等)。
例如,在美国专利第6,453,242号;第6,503,717号;第6,534,261号;第6,599,692号;第6,607,882号;第6,689,558号;第6,824,978号;第6,933,113号;第6,979,539号;第7,013,219号和第7,163,824号(所有这些专利的公开内容通过引用整体并入本文)中描述了递送包含本文所述的锌指蛋白的蛋白质的方法。
可以使用任何载体系统,包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体、疱疹病毒载体和相关病毒载体等。也见,美国专利第8,586,526号;第6,534,261号;第6,607,882号;第6,824,978号;第6,933,113号;第6,979,539号;第7,013,219号和第7,163,824号(通过引用整体并入本文)。此外,显而易见的是,任何这些载体可包含一个或多个DNA结合蛋白编码序列。因此,当将一个或多个ZFP、TALE或CRISPR/Cas蛋白引入细胞时,可将编码ZFP、TALE或CRISPR/Cas蛋白的序列携带在相同载体上或不同载体上。当使用多个载体时,每个载体可包含编码一个或多个ZFP、TALE或CRISPR/Cas系统的序列。
可使用常规的基于病毒和非病毒的基因转移方法来在细胞(例如,哺乳动物细胞)和靶组织中引入编码工程化的ZFP、TALE或CRISPR/Cas系统的核酸。此类方法也可用于在体外向细胞施用编码ZFP、TALE或CRISPR/Cas系统的核酸。在某些实施方案中,对于体内或离体基因疗法用途,施用编码ZFP、TALE或CRISPR/Cas系统的核酸。非病毒载体递送系统包括DNA质粒、裸核酸和与递送载体(诸如脂质体或泊洛沙姆)复合的核酸。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞后具有附加型或被整合的基因组。关于基因疗法的综述,见Anderson,Science 256:808-813(1992);Nabel&Felgner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer&Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada等,于Current Topics in Microbiology and Immunology Doerfler and(编辑)(1995);和Yu等,Gene Therapy 1:13-26(1994)。
核酸的非病毒递送的方法包括电穿孔、脂质转染、显微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、裸RNA、人工病毒体和试剂增强的DNA摄取。使用例如Sonitron 2000系统(Rich-Mar)的声致穿孔也可用于递送核酸。在优选的实施方案中,可将一种或多种核酸作为mRNA递送。还优选的是使用加帽的mRNA来增加翻译效率和/或mRNA稳定性。特别优选的是ARCA(抗反转帽类似物)帽或其变体。见,美国专利US7074596和US8153773,通过引用并入本文。
另外的示例性核酸递送系统包括由Amaxa Biosystems(Cologne,Germany)、Maxcyte,Inc.(Rockville,Maryland)、BTX Molecular Delivery Systems(Holliston,MA)和Copernicus Therapeutics Inc提供的那些递送系统(见例如US6008336)。在例如美国专利第5,049,386号;第4,946,787号和第4,897,355号中描述脂质转染试剂,脂质转染试剂是商购可得的(例如,TransfectamTM和LipofectinTM,以及LipofectamineTM RNAiMAX)。适合用于多核苷酸的高效受体-识别脂质转染的阳离子和中性脂质包括Felgner、WO 91/17424、WO 91/16024的那些脂质。递送可以是至细胞(离体施用)或靶组织(体内施用)。
脂质:核酸复合物(包括靶向脂质体,诸如免疫脂质复合物)的制备是本领域技术人员熟知的(见,例如,Crystal,Science 270:404-410(1995);Blaese等,Cancer Gene Ther.2:291-297(1995);Behr等,Bioconjugate Chem.5:382-389(1994);Remy等,Bioconjugate Chem.5:647-654(1994);Gao等,Gene Therapy 2:710-722(1995);Ahmad等,Cancer Res.52:4817-4820(1992);美国专利第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号和第4,946,787号)。
另外的递送方法包括使用包装待递送到EnGeneIC递送载体(EDV)中的核酸。使用双特异性抗体(其中抗体的一条臂具有针对靶组织的特异性,并且另一条臂具有针对EDV的特异性)将这些EDV特异性递送到靶组织。所述抗体将EDV带至靶细胞表面,随后EDV通过胞吞作用被带入细胞。一旦进入细胞,释放内容物(见,MacDiarmid等(2009)Nature Biotechnology 27(7):643)。
基于RNA或DNA病毒的系统用于递送编码工程化ZFP、TALE或CRISPR/Cas系统的核酸的用途利用了高度进化的方法,来将病毒靶向体内特定细胞并将病毒有效载荷运输至核。病毒载体可被直接施用于患者(体内),或者它们可被用于体外处理细胞,并且将经修饰的细胞施用于患者(离体)。用于递送ZFP、TALE或CRISPR/Cas的常规的基于病毒的系统包括,但不限于,用于基因转移的逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、牛痘载体和单纯疱疹病毒载体。可能用逆转录病毒、慢病毒和腺相关病毒基因转移法进行宿主基因组中的整合,这通常导致插入的转基因的长期表达。另外,已在许多不同的细胞类型和靶组织中观察到高的转导效率。
逆转录病毒的向性可以通过掺入外源包膜蛋白,扩展靶细胞的潜在靶群体来改变。慢病毒载体是能够转导或感染非分裂细胞并通常产生高病毒滴度的逆转录病毒载体。逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,具有高达6-10kb外源序列的包装能力。最小的顺式作用LTR足以复制和包装载体,所述载体随后被用于将治疗基因整合至靶细胞中以提供永久转基因表达。广泛使用的逆转录病毒载体包括基于小鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些载体(见,例如,Buchscher等,J.Virol.66:2731-2739(1992);Johann等,J.Virol.66:1635-1640(1992);Sommerfelt等,Virol.176:58-59(1990);Wilson等,J.Virol.63:2374-2378(1989);Miller等,J.Virol.65:2220-2224(1991);PCT/US94/05700)。
在其中优选瞬时表达的应用中,可使用基于腺病毒的系统。基于腺病毒的载体在许多细胞类型中能够具有非常高的转导效率,并且不需要细胞分裂。通过使用这样的载体,已经获得了高滴度和高水平的表达。该载体可在相对简单的系统中大量产生。腺相关病毒(“AAV”)载体也用于转导具有靶核酸的细胞,例如在体外产生核酸和肽,以及用于体内和离体基因治疗方法(见,例如,West等,Virology 160:38-47(1987);美国专利第4,797,368号;WO 93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)。重组AAV载体的构建描述于许多出版物中,包括美国专利第5,173,414号;Tratschin等,Mol.Cell.Biol.5:3251-3260(1985);Tratschin等,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS81:6466-6470(1984);和Samulski等,J.Virol.63:03822-3828(1989)中。
至少6种病毒载体方法目前可用于临床试验中的基因转移,所述病毒载体法利用涉及利用插入辅助细胞系以产生转导剂的的基因互补缺陷型载体的方法。
pLASN和MFG-S是已经用于临床试验的逆转录病毒载体的实例(Dunbar等,Blood 85:3048-305(1995);Kohn等,Nat.Med.1:1017-102(1995);Malech等,PNAS 94:22 12133-12138(1997))。PA317/pLASN是用于基因疗法试验的第一种治疗载体。(Blaese等,Science 270:475-480(1995))。对于MFG-S包装载体已经观察到50%或更大的转导效率。(Ellem等,Immunol Immunother.44(1):10-20(1997);Dranoff等,Hum.Gene Ther.1:111-2(1997).
重组腺相关病毒载体(rAAV)是基于有缺陷的和非致病性细小病毒腺相关2型病毒的有希望的替代基因递送系统。所有载体源自仅保留侧连转基因表达盒的AAV 145bp反向末端重复序列的质粒。因整合至转导细胞的基因组中而产生的高效基因转移和稳定的转基因递送是该载体系统的关键特征(Wagner等,Lancet 351:9117 1702-3(1998),Kearns等,Gene Ther.9:748-55(1996))。其它AAV血清型,包括AAV1,AAV3,AAV4,AAV5,AAV6,AAV8AAV 8.2,AAV9,以及AAV rh10和假型化的AAV诸如AAV2/8,AAV2/5和AAV2/6也可以根据本发明使用。
复制缺陷型重组腺病毒载体(Ad)可以以高滴度产生并且容易感染许多不同的细胞类型。对大多数腺病毒载体进行工程化,以使得转基因替代Ad E1a、E1b和/或E3基因;随后,在反式提供缺失的基因功能的人293细胞中繁殖复制缺陷型载体。Ad载体可在体内转导多种类型的组织,包括非分裂的分化细胞,诸如在肝、肾和肌肉中发现的那些细胞。常规Ad载体具有大的载量。在临床试验中使用Ad载体的实例包括用于利用肌内注射的抗肿瘤免疫的多核苷酸疗法(Sterman等,Hum.Gene Ther.7:1083-9(1998))。腺病毒载体用于临床试验中的基因转移的用途的另外的实例包括Rosenecker等,Infection24:1 5-10(1996);Sterman等,Hum.Gene Ther.9:7 1083-1089(1998);Welsh等,Hum.Gene Ther.2:205-18(1995);Alvarez等,Hum.Gene Ther.5:597-613(1997);Topf等,Gene Ther.5:507-513(1998);Sterman等,Hum.Gene Ther.7:1083-1089(1998)。
包装细胞用于形成能够感染宿主细胞的病毒颗粒。此类细胞包括包装腺病毒的293细胞和包装逆转录病毒的Ψ2细胞或PA317细胞。用于基因疗法的病毒载体通常由将核酸载体包装至病毒颗粒中的生产者细胞系产生。载体通常含有包装和随后整合入宿主(如果适用)所需的最小病毒序列,其它病毒序列被编码待表达的蛋白质的表达盒替代。缺少的病毒功能由包装细胞系反式提供。例如,用于基因疗法的AAV载体通常仅具有来自AAV基因组的反向末端重复(ITR)序列,其是包装和整合入宿主基因组所需的。病毒DNA被包装在细胞系中,所述细胞含有编码另外的AAV基因(即rep和cap,但缺少ITR序列)的辅助质粒。所述细胞系也用腺病毒(作为辅助病毒)感染。辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因的表达。由于缺乏ITR序列,辅助质粒不以显著的量被包装。可通过例如腺病毒比AAV更敏感的热处理来减少腺病毒的污染。
在许多基因疗法应用中,期望将基因疗法载体以高度特异性递送至特定组织类型。因此,可通过将配体作为与病毒外壳蛋白的融合蛋白在病毒外表面上表达来修饰病毒载体以具有对给定细胞类型的特异性。选择配体以对已知存在于目标细胞类型上的受体具有亲和力。例如,Han等,Proc.Natl.Acad.Sci.USA 92:9747-9751(1995)报道了可以修饰莫洛尼小鼠白血病病毒以表达与gp70融合的人调蛋白(heregulin),以及重组病毒感染某些表达人表皮生长因子受体的人乳腺癌细胞。该原理可以扩展到其它病毒-靶细胞对,其中所述靶细胞表达所述受体,并且所述病毒表达包含所述细胞表面受体的配体的融合蛋白。例如,丝状噬菌体可以被工程化来显示对几乎任何选择的细胞受体具有特异性结合亲和力的抗体片段(例如,FAB或Fv)。尽管上述描述主要应用于病毒载体,但相同的原理可应用于非病毒载体。此载体可被工程化以包含有利于特定靶细胞摄取的特异性摄取序列。
如下所述,基因疗法载体可通过向个体患者施用,通常通过全身性施用(例如,静脉内、腹膜内、肌内、皮下或颅内输注)或局部应用来在体内递送。或者,可将载体离体递送至细胞,例如从个体患者移出的细胞(例如,淋巴细胞、骨髓抽出物、组织活检)或通用供体造血干细胞,随后将细胞重新植入患者体内,通常在选择已经掺入载体的细胞之后。
在某些实施方案中,在体内直接递送本文所述的组合物(例如,多核苷酸和/或蛋白质)。可将组合物(细胞、多核苷酸和/或蛋白质)直接施用至中枢神经系统(CNS)中,包括但不限于直接注射至脑或脊髓中。可靶向脑的一个或多个区域,包括但不限于海马、黑质、Meynert基底核(NBM)、纹状体和/或皮层。可选择地或除了CNS递送之外,可全身性施用(例如,静脉内、腹膜内、心内、肌内、硬膜内、皮下和/或颅内输注)所述组合物。用于将本文所述的组合物直接递送至受试者(包括直接进入CNS)的方法和组合物包括但不限于经由针组件的直接注射(例如,立体定向注射)。此类方法描述于例如美国专利第7,837,668号、第8,092,429号(其涉及将组合物(包括表达载体)递送至脑)和美国专利公开号20060239966(容通过引用整体并入本文)中。
用于诊断、研究或或用于基因疗法的离体细胞转染(例如,经由将转染的细胞重新输注至宿主生物体中)是本领域技术人员熟知的。在优选实施方案中,从受试生物分离细胞,用ZFP、TALE或CRISPR/Cas系统核酸(基因、cDNA或mRNA)转染,并重新输注回所述受试生物体(例如,患者)。在优选的实施方案中,将一种或多种核酸作为mRNA递送。还优选的是使用加帽的mRNA以增加翻译效率和/或mRNA稳定性。特别优选的是ARCA(抗反转帽类似物)帽或其变体。见美国专利7,074,596和8,153,773(通过引用整体并入本文)。适于离体转染的各种细胞类型是本领域技术人员熟知的(见,例如Freshney等,Culture of Animal Cells,A Manual of Basic Technique(第3版1994)和其中引用来讨论如何从患者中分离和培养细胞的参考文献)。
在一个实施方案中,将干细胞用于细胞转染和基因疗法的离体方法。使用干细胞的有利方面是它们可在体外分化为其它细胞类型,或者可被引入哺乳动物(诸如细胞的供体)中,在所述动物中它们将移入骨髓。使用细胞因子诸如GM-CSF、IFN-γ和TNF-α将CD34+细胞体外分化成临床上重要的免疫细胞类型的方法是已知的(见Inaba等,J.Exp.Med.176:1693-1702(1992))。
使用已知方法分离干细胞以用于转导和分化。例如,通过用结合不想要的细胞诸如CD4+和CD8+(T细胞)、CD45+(panB细胞)、GR-1(粒细胞)和Iad(分化的抗原呈递细胞)的抗体淘选骨髓细胞,从骨髓细胞分离干细胞(参见Inaba等,J.Exp.Med.176:1693-1702(1992))。
已被修饰的干细胞也可以用于一些实施方案中。例如,已被制备来对细胞凋亡具有抗性的神经元干细胞可以用作治疗组合物,其中干细胞还含有本发明的ZFP TF。例如,通过在干细胞,或在半胱天冬酶中破坏的那些干细胞中使用BAX或BAK特异性TALEN或ZFN(见美国专利第8,597,912号),或例如再使用半胱天冬酶-6特异性ZFN,来敲除BAX和/或BAK,可产生对细胞凋亡的抗性。这些细胞可以用已知调节突变型或野生型Htt的ZFP TF或TALE TF转染。
还可将含有治疗性ZFP核酸的载体(例如,逆转录病毒、腺病毒、脂质体等)直接施用至生物体以在体内转导细胞。或者,可以施用裸DNA。施用通常用于将分子引入与血液或组织细胞最终接触的任何途径,包括但不限于注射、输注、局部应用和电穿孔。施用此类核酸的合适方法是可获得的并且为本领域技术人员所公知的,并且尽管可使用多于一种途径来施用特定组合物,但特定途径通常可提供比另一途径更直接和更有效的反应。
用于将DNA引入造血干细胞的方法公开于例如美国专利第5,928,638号。可用于将转基因引入造血干细胞例如CD34+细胞的载体包括35型腺病毒。
适于将转基因导入免疫细胞(例如,T细胞)的载体包括非整合型慢病毒载体。见,例如,Ory等(1996)Proc.Natl.Acad.Sci.USA93:11382-11388;Dull等(1998)J.Virol.72:8463-8471;Zuffery等(1998)J.Virol.72:9873-9880;Follenzi等(2000)Nature Genetics25:217-222。
药学上可接受的载体部分地由待施用的特定组合物以及由用于施用组合物的特定方法来确定。因此,存在多种可用的药物组合物的合适制剂,如下所述的(见,例如,Remington’s Pharmaceutical Sciences,第17版,1989)。
如上所述,所公开的方法和组合物可用于任何类型的细胞,包括但不限于原核细胞、真菌细胞、古细菌细胞、植物细胞、昆虫细胞、动物细胞、脊椎动物细胞、哺乳动物细胞和人细胞。用于蛋白质表达的合适的细胞系是本领域技术人员已知的,包括但不限于COS、CHO(例如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)、perC6、昆虫细胞例如草地贪夜蛾(Sf),和真菌细胞诸如酵母属、Pischia和裂殖酵母属。还可使用这些细胞系的后代、变体和衍生物。
待施用的有效量将因患者和根据施用方式和施用部位而异。因此,有效量最好由施用组合物的医生决定,并且本领域普通技术人员可以容易地确定适当的剂量。在允许足够的时间用于整合和表达(例如,通常为4-15天)后,分析治疗性多肽的血清或其它组织水平并与施用前的初始水平进行比较可确定施用的量是否太低,在正确的范围内还是太高。初次和后续施用的合适方案也是可变的,但是如果必要,其代表为初始施用,随后给予后续施用。后续施用可以以可变的间隔施用,范围从每日1次至每年1次至每几年1次。在某些实施方案中,
为了使用腺相关病毒(AAV)载体将ZFP直接递送至人脑,可以应用每个纹状体1x1010-5x1012(或其间的任何值)个载体基因组的剂量范围。如上所述,对于其它脑结构和对于不同的递送方案,剂量可以变化。
应用
如本文所述的Htt结合分子(例如,ZFP、TALE、CRISPR/Cas系统,Ttago等)和编码它们的核酸可用于多种应用。这些应用包括其中将Htt结合分子(包括编码DNA结合蛋白的核酸)施用于受试者并用于调节受试者内靶基因表达的治疗方法。调节可以是抑制,例如,对引起HD疾病状态的mHtt的抑制的形式。或者,当表达的激活或内源性细胞基因的增加的表达可改善疾病状态时,调节可以是激活的形式。在另外的实施方案中,调节可以是裂解(例如,通过一种或多种核酸酶),例如,用于使突变型Htt基因失活。如上所述,对于此类应用,将Htt-结合分子或更典型地编码它们的核酸与药学上可接受的载体一起配制为药物组合物。
可将单独的或与其它合适组分(例如脂质体、纳米颗粒或本领域已知的其它组分)组合的Htt-结合分子或编码它们的载体制成气溶胶制剂(即,它们可被“雾化”)经由吸入施用。可将气溶胶制剂置于加压的可接受的推进剂诸如二氯二氟甲烷、丙烷、氮气等中。适于胃肠外施用(诸如,例如,通过静脉内、肌内、皮内和皮下途径)的制剂包括水性和非水性等渗无菌注射液,其可含有抗氧化剂、缓冲剂、抑菌剂和使制剂与预期接受者的血液等渗的溶质,以及水性和非水性无菌悬浮液,其可包括悬浮剂、增溶剂、增稠剂、稳定剂和防腐剂。组合物可以例如通过静脉内输注、口服、局部、腹膜内、膀胱内或鞘内施用。化合物的制剂可以以单位剂量或多个剂量存在于密封容器,例如安瓿和小瓶中。注射溶液和悬浮液可从前述类型的无菌粉末、颗粒和片剂制备。
向患者施用的剂量应足以在患者中随时间推移产生有益的治疗反应。剂量由所用的特定Htt结合分子的功效和Kd、靶细胞和患者的状况以及待治疗患者的体重或表面积确定。剂量的大小还由伴随特定患者的特定化合物或载体的施用的任何不良副作用的存在、性质和程度来确定。
在其它应用中,使用被设计来测量患者中(例如样品例如脑脊液(CSF)中)mHTT蛋白的量的检测方法分析本文所述分子的功效。例如,如Wild等(2014)J.Neurol Neurosurg Psychiatry 85:10中描述的超敏感免疫测定可用于检测(和/或定量)患者样品中与HD相关的突变型Htt蛋白的存在。在某些实施方案中,CSF中mHtt水平的变化的检测提供了用于响应于如本文所述的HD疗法(例如,ZFP、TALE等)确定受试者中HD的进展的诊断。
可以使用用于进行诊断测定的任何合适的形式,包括免疫测定。例如,可将捕获试剂(例如抗体,受体等)固定在ELISA板上。或者,检测试剂与芯片上的超敏感免疫检测一起使用,以通过本领域已知的方法诸如磁性粒子扫描进行定量(参见例如Cornaglia等(2014)Anal Chem 86(16):8213-23)。在其中可发生结合的条件下将检测试剂与怀疑含有突变型Htt蛋白的样品接触,并通过本领域已知的方法进行定量。
因此,由于mHTT水平与疾病负荷评分和浓度随疾病进展的水平升高相关,因此在CSF或其它患者样品中检测mHtt允许监测HD中Htt-结合分子治疗的功效以及帮助研究治疗对HD的神经病理生物学的影响,并且可用于支持如本文所述的疾病改善性HD疗法的临床试验。
以下实施例涉及本公开的示例性实施方案,其中Htt-调节剂包含锌指蛋白或CRISPR/Cas系统。应当理解的是,这仅仅是为了举例说明的目的,并且可以使用其它Htt调节剂,包括但不限于TALE-TF、另外的ZFP、ZFN、TALEN、另外的CRISPR/Cas系统、具有工程化DNA结合结构域的归巢内切核酸酶(大范围核酸酶)。
实施例
实施例1:ZFP-TF拯救培养的HD神经元的表型
各种研究已显示与HD患者来源的细胞中扩增的CAG重复相关的表型改变,诸如细胞内ATP水平降低和对生长因子撤除的易损性增加。见,例如,Jung-Il等(2012)Biochemical Journal 446(3):359-371;HD IPSC Consortium(2012)Cell Stem Cell 11(2):264-278;An等(2012)Cell Stem Cell 11(2):253-263。
因此,我们评估了Htt的等位基因特异性ZFP阻遏物的表达是否在患者来源的神经元中拯救这样的表型。简言之,如本文和美国专利公开第20130253040号中所述,产生用于Venus(GFP)和ZFP-TF33074-KOX-2A-Venus的慢病毒载体。可裂解的2A肽允许Venus(GFP)和ZFP从同一载体表达,并且可以通过GFP表达鉴定ZFP表达细胞。慢病毒表达构建体是第三代自失活的基于HIV的LV。通过在CMV启动子下游插入具有2A接头和GFP Venus的ZFP-TF来构建33074表达载体。GFP表达构建体仅含有CMV启动子下游的GFP-Venus。通过使用lipofectamine 2000(Life Technologies)瞬时转染293T细胞来制备重组LV。转染后48和72小时收获病毒上清液,通过0.45μm过滤器过滤,然后通过在4℃下以50,000×g超速离心(Optima L-80K制备超速离心机,Beckman Coulter)90分钟来浓缩300倍。然后将病毒沉淀重悬浮于Hank缓冲盐溶液(Lonza)中并在-80C下储存。通过293T细胞的感染测定病毒滴度,并通过GFP-VENUS表达的流式细胞术分析来测量。
利用accutase进行HD-ESC传代,并将其在E8培养基(Life Technologies)中培养在基质胶包被的平板上。使用StemPro神经诱导培养基(Life Technologies)衍生神经干细胞。简言之,将ESC以200,000个细胞/孔接种于geltrex涂覆的6孔皿,当10-20%汇合时,将培养基更换为StemPro神经诱导培养基。每2天更换培养基,并在第7天收获和扩增NSC。使用StemPro NSC SFM培养基(Life Technologies)培养HD-NSC和非HD NSC(HIPTMGlobalstem)。NSC在geltrex包被的板上用accutase传代。通过将培养基变成神经分化培养基来诱导神经元分化,所述神经分化培养基含有具有B-27无血清补充剂和GlutaMAXTM(Life Technologies)的神经基础培养基。每3-4天更换一次培养基。
使用用于Venus(GFP)和ZFP-TF 33074-KOX-2A-Venus的慢病毒载体以500的MOI转导分化的神经元。随后,用新鲜的神经分化培养基替换上清液,并将培养物维持长达21天。
使用CellTiter-发光测定(Promega)测量源自HD患者(CAG17/48)或正常受试者的培养的神经元的细胞内ATP水平,使用ApoLive-测定(Promega)测定每一个样品中的细胞数量。简言之,根据制造商的说明书,使用CellTiter-Glo发光测定(Promega)测量神经元中的细胞内ATP水平。30分钟后在Perkin Elmer Wallac 1420 Victor2微孔板读数器上测量发光(RLU),并且通过使用ApoLive-Glo测定(Promega)和测量荧光(A.U.)将值针对孔中的细胞数进行标准化。然后将来自不同细胞/处理的每孔ATP水平的值针对模拟感染的HD神经元的值进行标准化。
如图1所示,模拟感染的或Lenti-GFP感染的HD神经元已显著降低了相对于非HD(正常)神经元的ATP的细胞内水平。相反地,Lenti-33074-KOX-2A-GFP感染导致HD神经元中细胞内ATP水平增加约60%,表明ZFP驱动的突变型Htt等位基因的抑制使这些细胞的能量代谢受损。
使用末端脱氧核苷酸转移酶dUTP缺口末端标记(TUNEL)测定法测量由生长因子撤除诱导的HD和非HD神经元的细胞死亡。简言之,如上文对于ATP测定所述,用LV一式三份感染神经元。将细胞培养12天,然后将培养基更换为无任何添加剂(生长因子)的新鲜神经基础培养基。将细胞保持在该生长因子撤除培养基中48小时。使用ApoBrdU Red DNA fragmentation试剂盒(BioVision)进行TUNEL测定。在冰上用4%多聚甲醛固定神经元15分钟。根据制造商的推荐(ApoBrdU Red DNA fragmentation试剂盒,BioVision)通过定量TUNEL阳性细胞来评估细胞凋亡。将流式细胞计量术用于测量细胞凋亡(通过抗BrdU-Red染色)和LV转导(通过GFP)。
如图2所示,在48小时的生长因子撤除后,HD神经元(模拟感染的)显示出比非HD神经元(约20%)高的细胞死亡率(约50%)。虽然Lenti-GFP感染不影响HD神经元中的细胞死亡水平,但Lenti-33074-KOX-2A-GFP感染导致以凋亡细胞百分比表示的显著的神经元减少(从约50%至20%)。
因此,突变型Htt的ZFP驱动的抑制降低了HD神经元对生长因子撤除的易损性。
实施例2:ZFP-TF防止和逆转Q175小鼠中的突变型Htt聚集
在Q175敲入小鼠模型(Menalled等(2012)PLoS One7(12):e49838)中测试了突变型Htt ZFP-TF(ZFP-30640和30645)的等位基因特异性阻遏物的体内功效,在所述小鼠模型中小鼠Htt等位基因之一的外显子1被含有扩增的CAG重复(约179CAG)的人Htt外显子1序列替代。突变型Htt的病理聚集可开始在2月龄的Q175小鼠的纹状体中被检测到,并且随着年龄而继续增加;到6月龄时,聚集被良好地建立。
为了测试ZFP是否可防止突变型Htt在纹状体中的积累,对2月龄Q175小鼠进行AAV-ZFP或AAV-GFP(作为阴性对照)的单侧纹状体内注射(2x1010个载体基因组/纹状体);ZFP和GFP表达由人突触蛋白1启动子驱动。
注射后2个月(4月龄),收获脑,切片并进行免疫组织化学分析以评估ZFP和Htt表达。通过针对FLAG表位标签的抗体检测ZFP表达,并通过抗Htt抗体(mEM48)检测突变型Htt聚集。来自注射AAV-30645的小鼠的代表性图像显示于图3A至3H中。在没有接受注射的对侧纹状体中,容易检测到突变型Htt(mEM48)聚集;在接受AAV-30645注射的同侧纹状体中,在ZFP表达细胞中仅观察到非常低水平的突变型Htt聚集(由阳性FLAG染色指示的)。
如图3I所示,当分别对AAV-ZFP和AAV-GFP注射的小鼠的同侧纹状体中的FLAG(+)和GFP(+)细胞定量每细胞的核Htt聚集物的数量,并随后针对未注射的对侧纹状体中每个细胞的聚集物数目进行标准化时,ZFP-30640和30645都显著减少(>90%)核Htt聚集物的数目(P<0.001,Kruskal Wallis检验和Dunn多重比较)。
如图3J所示,当将表达ZFP或GFP的细胞中的核mEM48染色的强度针对来自对侧纹状体的神经元中的所述染色强度进行标准化时,在注射ZFP的纹状体中观察到核mEM48强度降低50-60%(P<0.001)。如图3K中所示,将ZFP-或GFP表达细胞中核周突变型Htt聚集物的密度针对对侧纹状体神经元中的所述密度进行标准化,在注射ZFP的纹状体中观察到核周Htt聚集物密度降低45-70%(P<0.01)。
这些结果显示,当在2月龄时注射时,ZFP-TF在4月龄时防止Q175小鼠纹状体中的突变型Htt聚集。
为了测试ZFP是否可逆转良好建立的Htt聚集,对6月龄Q175小鼠进行AAV-GFP-2A-ZFP的单侧纹状体内注射;可裂解的2A肽允许GFP和ZFP从同一载体表达,并且可通过GFP表达鉴定ZFP表达细胞。在8月龄时,收获大脑,切片并进行免疫组织化学分析以评估Htt聚集。来自AAV-GFP-2A-30645注射的小鼠的代表性图像显示于图4A中。使用针对DARPP-32的抗体(其是纹状体特异性蛋白)来标记纹状体。在未接受注射的对侧纹状体中,观察到高水平的突变型Htt聚集(通过mEM48抗体检测的);在接受AAV-GFP-2A-30645注射的同侧纹状体中,观察到突变型Htt聚集的减少。
此外,对AAV-GFP-2A-ZFP和AAV-GFP注射的小鼠的同侧纹状体中的GFP(+)细胞的每个细胞的核Htt聚集物的数目进行定量,然后将其针对未注射的对侧纹状体中每个细胞的聚集物的数目进行标准化。如图4B所示,GFP-2A-30640的递送导致Htt核聚集物数量减少约20%(P<0.001,Kruskal Wallis检验和Dunn多重比较),GFP-2A-30645的递送也导致每个细胞的Htt核聚集物的数量的少量减少。
将来自注射了AAV-GFP-2A-ZFP和AAV-GFP的小鼠的同侧纹状体的GFP(+)细胞中的核mEM48染色的强度,针对来自对侧纹状体的神经元中的所述染色强度进行标准化。如图4C所示,在注射GFP-2A-30645的纹状体中观察到核mEM48强度降低约20%(P<0.001)。在注射GFP-2A-30640的纹状体中也观察到核mEM48强度的约10%的减少。
测量注射AAV-GFP-2A-ZFP-和AAV-GFP的小鼠的同侧纹状体中的GFP(+)细胞中的核周突变型Htt聚集物的密度,并针对于对侧纹状体神经元中的密度进行标准化。如图4D所示,在注射ZFP的纹状体中观察到核周Htt聚集物密度减小30-50%(P<0.001)。
这些结果显示,当在6月龄时注射时,ZFP-TF在仅2个月后在Q175小鼠的纹状体中逆转先前存在的突变型Htt聚集。如果在分析小鼠脑之前允许ZFP的表达持续超过2个月,则预期突变型Htt聚集的更大清除。
总之,数据表明,递送至HD受试者的脑的突变型Htt等位基因阻遏物导致HD神经元中细胞内ATP浓度的水平升高,HD神经元中的细胞凋亡减少,并且防止和清除了现有的Htt聚集物。
实施例3:ZFP-TF处理的功效
对用对突变型Htt等位基因是特异的Htt结合分子(例如,ZFP-TF、TALE-TF等)处理的受试者进行诊断测试。用本文所述的Htt-结合分子治疗HD受试者。通过标准方法(例如,腰椎穿刺)从受试者抽取CSF,然后将其经历本领域已知的方法以检测和定量mHtt蛋白(参见Wild等,同上)。在如本文所述的治疗后,CSF中的mHtt蛋白水平降低。
实施例4:ZFP-TF防止和减少Q175小鼠中的突变型Htt聚集,并增加DARPP 32基因的表达
在Q175敲入小鼠模型中测试突变型Htt ZFP-TF(ZFP-33074)的另一等位基因特异性阻遏物的体内功效(Menalled等(2012)PLoS One7(12):e49838),,其中小鼠Htt等位基因之一的外显子1被含有扩增的CAG重复(约179个CAG)的人Htt外显子1序列替代。突变型Htt的病理性聚集可开始在2月龄时在Q175小鼠的纹状体中被检测到,并且随年龄继续增加;6月龄时聚集被良好地建立。
为了测试ZFP是否可以防止突变型Htt在纹状体中积累,对2月龄Q175小鼠进行AAV-ZFP-2A-GFP或AAV-GFP(作为阴性对照)的单侧纹状体内注射(2x1010个载体基因组/纹状体);ZFP和GFP表达由人类突触蛋白1启动子驱动。自身可裂解的2A肽允许GFP和ZFP从同一载体表达,并且可通过GFP表达鉴定ZFP表达细胞。
注射后两个月(4个月龄),收获脑,切片并进行免疫组织化学分析以评估Htt表达。转导的细胞用GFP标记,中间棘神经元(MSN)用DARPP32抗体标记,并且通过抗Htt抗体(mEM48)检测突变型Htt聚集。
如图5A所示,在AAV转导的MSN(用GFP和DARPP32抗体标记的)中,每个细胞的核Htt聚集物或包涵体的数目被ZFP 33074显著减少(P<0.001)。图5B显示,在AAV转导的细胞中核外突变型Htt聚集物的密度在ZFP处理的纹状体中显著减少。(P<0.0001)。图5C显示在ZFP处理的小鼠中核mEM48染色(突变型Htt)的强度显著降低(P<0.001)。
这些结果显示,当在2月龄时注射时,ZFP 33074防止Q175小鼠的纹状体中的突变型Htt型聚集。
为了测试ZFP在Htt聚集已在Q175纹状体中被良好建立后是否可减少所述Htt聚集,对6月龄Q175小鼠进行AAV-GFP-2A-ZFP或AAV-GFP的单侧纹状体内注射。在10个月龄时,收获大脑,切片并进行免疫组织化学。
图6A显示在AAV转导的MSN(由GFP和DARPP32抗体标记的)中,每个细胞的核Htt聚集物/包涵体的数目被ZFP 33074显著减少(P<0.001)。图6B显示,AAV转导的细胞中的核外突变型Htt聚集物的密度在ZFP处理的纹状体中显著减小。(P<0.0001)。图6C显示在ZFP处理的小鼠中核mEM48染色(突变型Htt)的强度显著降低(P<0.001)。
图7A显示在10月龄的Q175小鼠中,相较于年龄匹配的野生型小鼠,MSN标记DARPP32的表达减少(P<0.05),表明这些小鼠中MSN的消退。图7B显示,当Q175小鼠在6月龄时注射AAV-ZFP-2A-GFP并在10月龄时分析DARPP32表达时,相较于对照处理的小鼠,在ZFP 33074处理的小鼠中发现DARPP32表达显著增加。
这些结果一起证明,当在6月龄时注射时,ZFP 33074能够在现有聚集物存的情况下减少突变型Htt表达和聚集。此外,ZFP 33074能够拯救DARPP32的表达,表明保护MSN。由于缺少DBD(ZFPΔDBD)的对照载体对突变型Htt聚集或DARPP32表达没有影响,因此需要将ZFP招募至扩展的CAG重复的DNA结合结构域(DBD)。
实施例5:CRISPR/Cas-TF防止和减少HD神经元中的突变型Htt聚集
用于CRISPR/Cas系统的sgRNA通过本领域已知的方法来合成制备(见Hsu等(2013)Nature Biotech doi:10.1038/nbt.2647或Sternberg等,(2014)Nature 507:62)。如上所述对sgRNA进行工程化,并将其设计来靶向mHtt中的序列。例如,sgRNA可具有以下序列之一,其中PAM序列加下划线:
5’GCAGCAGCAGCAGCAGCAGCAGCAGCAG3’SEQ ID NO:122
5’GCAGCAGCAGCAGCAGCAGCAGCAG 3’SEQ ID NO:123
5’GCAGCAGCAGCAGCAGCAGCAG 3’SEQ ID NO:124
5’GCAGCAGCAGCAGCAGCAG 3’SEQ ID NO:125
根据本领域已知的方法制备CRISPR/Cas转录因子(见,例如,Perez-Pinera(2013)Nature 10(10):973以及Qi和Arkin(2014)Nature Reviews Microbiology 12:341)。简言之,使用核酸酶缺陷型Cas9蛋白并将其与抑制结构域(即KRAB)融合。
用编码Cas9(核酸酶-)-KRAB融合蛋白的mRNA(20μg/mL)和如上所述的sgRNA转染的转染培养的HD神经元,其中使用BTX ECM830通过电穿孔,经由mRNA(例如2-4μg)或DNA表达载体(例如400ng-800ng)引入sgRNA。5天后收集细胞,进行定量Taqman分析以测量mHtt表达。此外,将细胞经受上述实验以测量细胞间ATP水平和分析细胞凋亡。数据显示使用sgRNA的mHtt特异性CRISPR/Cas转录因子可抑制mHtt的表达并减少由mHtt蛋白聚集引起的表型特征。
实施例6:减少运动缺陷
向动物(例如,小鼠)施用如本文所述的Htt-阻抑物,并定期测试紧握行为,其为这些动物所表现的良好建立的运动缺陷(Mangiarini等1996 Cell 87,493–506)。简言之,将每只动物从其栖息笼中取出并放置在笼的盖上。然后动物由观察者以平滑运动轻轻地向后和向上拉动,直至动物悬挂在表面上方约12英寸。然后对动物评分,进行30秒。如果仅观察到前肢紧握,则对动物给予1分。如果仅观察到后肢紧握,则给予动物2分。如果观察到后肢和前肢紧握,但不同时,则动物被给予3分。由同时的后肢和前肢紧握限定的完全紧握被拉紧进入核心,给予4分。在30秒的悬挂后,将动物返回其栖息笼。对于每个治疗组以及年龄匹配的野生型同窝动物,测定在每周观察时表现出完全紧握(评分为4)的动物的比例。
相较于对照(无Htt-阻遏物),本文所述的Htt-阻遏物改善了紧握行为(一种良好表征的运动缺陷)。
本文提及的所有专利、专利申请和出版物出于所有目的在此通过引用整体并入。
虽然为了清楚理解的目的通过说明和实例较详细地提供了公开内容,但对于本领域技术人员显而易见的是,在不脱离本发明的精神或范围的情况下,可实施各种改变和修改。因此,前述描述和实例不应被解释为限制。