专利名称:可溶性重组流感抗原的利记博彩app
技术领域:
本发明涉及可溶性重组流感抗原的产生。更具体地,本发明涉及保持免疫原性的 可溶性重组流感抗原的产生。
背景技术:
流感是由呼吸系统病毒导致的人类死亡的首要原因。常见症状包括发烧、咽喉疼 痛、呼吸短促以及肌肉酸痛等。在流感季节,流感病毒感染世界人口的10-20%,每年导致 250-500, 000 例死亡。流感病毒根据存在的核蛋白和基质蛋白抗原分为甲、乙或丙型。甲型流感病毒可 根据存在的血凝素(hemagglutinin,HA)和神经氨酸酶(neuraminidase,ΝΑ)表面糖蛋白 的组合进一步分成亚型。HA决定着病毒结合和进入宿主细胞的能力。NA从宿主细胞和病 毒表面蛋白的多糖链上除去末端唾液酸残基,所述唾液酸残基防止病毒聚集并促进病毒运 动。目前,已确认16种ΗΑ(Η1-Η16)和9种ΝΑ(Ν1_Ν9)亚型。每种甲型流感病毒存在一种 类型的HA和一种类型的NA糖蛋白。一般来讲,每种亚型都显示物种特异性;例如,已知所 有HA和NA亚型都感染鸟类,而只有HI、Η2、Η3、Η5、Nl和N7表明感染人。认为含H5和H7 的流感病毒为甲型流感病毒的最强致病形式,并且最可能引起未来的大流行。流感大流行通常由高传播性和毒力的流感病毒引起,并且可导致全球更高水平的 疾病和死亡。新甲型流感病毒亚型的出现在20世纪引发了 4次主要大流行。1918-1919年 由Hmi病毒引起的西班牙流感在1917至1920年间导致全球超过五千万人死亡。出现新 亚型或动物特有的亚型传播到人的风险始终存在。尤其关注的是高度毒力形式的鸟类流感 (也称为“禽流感”),其爆发已在全世界几个国家中有报道。在很多情况下,该禽流感可在 48小时内导致将近100%的死亡率。已假定禽流感病毒(H5N1,其在1997年在香港首次鉴 定)在其它亚洲国家和欧洲的传播与野生鸟类的迁移模式相关。越来越得到关注的问题是,病毒可能变得对人具有高度感染性。人类健康的主要 问题在于流感病毒抗原性不稳定这一事实,即它们快速变异。如果禽流感病毒与人病毒接 触,则该鸟类病毒的遗传重排可产生高致病性的流感病毒,其可在人中引起严重的疾病或 死亡。而且,这种突变还可导致流感病毒在人中顺利地传播。抗击人中流感的现行方法为每年接种。每年世界卫生组织选择3种病毒株纳入当 年度的在受精卵中生产的流感疫苗中。然而,每年生产的疫苗剂量并不足以接种全世界人 口。例如,加拿大和美国可获得足够免疫其约三分之一人口的疫苗剂量,而在欧盟只有17 % 的人口可被接种。很显然,当面临全球流感大流行时全球的流感疫苗生产将不足。因此,政 府和私人企业等已将注意力转向有效流感疫苗的生产上。如上所述,目前获得流感病毒疫苗的方法是通过在受精卵中生产。将病毒在受精 卵中培养,而后灭活病毒并纯化病毒糖蛋白。尽管该方法保持了抗原表位和翻译后修饰,但 有几个缺点,包括由于采用全病毒而导致的污染风险,以及产量根据病毒株不同而变化。不 理想的防护水平可能由于病毒被引入卵中所导致的其遗传异质性而引起。其它缺点包括获 得卵所需的大量工作、由于在纯化中使用的化学物导致的污染风险,以及生产时间长。还有,对卵蛋白过敏的人可能不是接受疫苗的合适候选者。为了避免卵的使用,还在哺乳动物细胞培养中生产了流感病毒,例如,在MDCK或 PERC.6等细胞中。另一个方法为反向遗传学,其中通过用病毒基因转化细胞产生病毒。然 而这些方法也需要采用完整病毒,并且方法复杂,以及需要特定的培养环境。已经研究了病毒DNA作为疫苗的应用。在该技术中,通过在人细胞中表达病毒抗 原获得保护;随后抗原被识别为外来抗原,这导致特异性的抗体应答。然而,存在将DNA引 入人细胞基因组决定性部分而使癌基因激活的风险-这是重大的缺陷。Dow Agroscience也制备了包含用病毒DNA转化的昆虫或植物细胞表达的重组病 毒抗原的疫苗(例如见W02004/098530)。尽管避免了与采用活病毒相关的风险,并且缩短 了生产过程,但是蛋白构象和翻译后修饰仍受到影响。放大和纯化步骤也相对复杂,因为抗 体与细胞膜相结合。此外,有效免疫动物所需的杆状病毒重组HA的剂量比受精卵中产生的 天然HA的剂量高10倍。在两种情况下,病毒抗原表达水平都很低。为了避免与纯化膜蛋白相关的困难,Huang等(2001, Vaccine, 19 :2163-2171)用 ER驻留信号替换了麻疹HA的跨膜结构域和胞质尾区。所得的HA蛋白在烟草植物细胞中产 生用于开发口服疫苗(可食用疫苗)。表达的HA在ER中的存留没有用跨膜结构域产生的 存留强,因此简化了纯化过程。然而,在这些条件下不能形成HA的天然三聚体形式,这可影 响重组蛋白的免疫原性。Saelens 等(1999,Eur. J. Biochm, 260 :166-175)在酵母中(Pichiapastoris)表 达了缺少跨膜结构域的HA基因,导致了 HA单体的分泌。然而,该形式与三聚体HA相比免 疫原性较低。为了保护世界人口免受流感侵袭并且避开未来的大流行,将需要疫苗生产者开发 生产疫苗剂的有效快速方法。目前采用受精卵生产疫苗不能满足需要而且过程长。重组技 术提供了下生产流感病毒抗原的有希望的方法。然而,血凝素的生产受限于涉及复杂提取 过程而产量低的膜相关蛋白,或受限于低免疫原性的可溶性蛋白。发明概述本发明涉及可溶性重组流感抗原的生产。更具体来讲,本发明涉及保持三聚体组 装和免疫原性的可溶性重组流感抗原。本发明的一个目的是提供可溶性重组流感抗原。本发明提供了包含血凝素结构域和寡聚化结构域的重组血凝素(rHA)。rHA作为 可溶性同三聚体而产生。该蛋白可进一步包含信号肽和/或内质网(ER)驻留信号。本发明还提供了编码上述rHA的核苷酸序列。本发明进一步提供了核酸序列,其包含a)编码血凝素结构域的核苷酸序列;和 b)编码寡聚化结构域的核苷酸序列。该核酸编码形成同三聚体的可溶性rHA。该核酸还可 包含编码信号肽和/或内质网(ER)驻留信号的核苷酸序列。本发明还提供了包含上述核苷酸的载体。本发明进一步提供了表达上述rHA的宿主细胞,用上述核苷酸转化的宿主细胞, 或用上述载体转化的宿主细胞。本发明还提供了一种生产重组rHA蛋白的方法。所述方法包括提供带有载体的宿 主细胞,其中所述载体包含a)编码血凝素结构域的核苷酸序列,其中所述核酸编码形成同三聚体的可溶性rHA,以及b)编码寡聚化结构域的核苷酸序列;然后表达该rHA。本发明进一步提供了在植物中表达重组血凝素(rHA)的方法。在第一步中,将载 体引入植物中,所述载体包含编码血凝素结构域的核苷酸序列(其中所述核酸编码形成同 三聚体的可溶性rHA)以及编码寡聚化结构域的核苷酸序列。在所述引入步骤(步骤a)中, 所述核酸可以瞬时方式被引入植物中,或者所述核酸可以使之稳定的方式被引入植物中。本发明还提供了在植物中生产重组血凝素(rHA)的方法,包括a)将核酸序列引 入植物或其部分中,该核酸序列包含与编码血凝素结构域和寡聚化结构域之核苷酸序列有 效连接的调控区域,其中所述核酸编码形成同三聚体的可溶性rHA ;以及b)培养所述转基 因植物,从而生产rHA。在引入步骤(步骤a)中,所述核酸可以瞬时的方式被引入植物中, 或者所述核酸可以使之稳定的方式被引入植物中。对于生产而言,rHA是非常复杂的分子。当前生产系统的重组HA的表达水平和产 量低;因此生产成本高。这很大程度上是由于该蛋白质的复杂三聚体结构,其在其合成中必 须经历复杂的组装过程。而且,HA为具有跨膜结构域的大蛋白,并且高度糖基化。生产可溶 形式的HA可使得能够以更高水平生产,并降低纯化过程的复杂性。这将对生产成本产生重 要影响。已表明用可溶性的α-螺旋或其它二级结构(其适于结构性稳定HA并与HA蛋白 胞外结构域的卷曲螺旋核心相容)替代此跨膜结构域可产生稳定的可溶性HA三聚体。可 用这种重组蛋白来强化目前的流感疫苗,或制备新疫苗。本发明的此概述并不一定描述本发明的所有特征。附图简述根据以下描述并参考附图,本发明的这些和其它特征将更加显而易见,其中
图1显示了天然血凝素(HA)蛋白的结构域示意图。图2显示了 GCN4-pII肽的氨基酸序列(SEQ ID NO :1)。图3显示了 PDI的氨基酸和核苷酸序列(SEQ ID NO :6和7 ; (Genbank登记号 Ζ11499),即苜蓿信号肽。该PDI信号肽与小鼠ERp59同源。BglII限制性位点以粗体显示。图4显示了甲型流感病毒株/New Caledonia/20/99 (HlNl)的HA的氨基酸序列 (SEQ ID NO 8) (Genbank 登记号 AY289929,初始登记 UniProt KB/TrEMBL :Q6WG00) ;rHA 信 号肽以斜体显示。HAO切割位点以粗体显示,融合肽以下划线表示。跨膜结构域以灰色背景 显不。图5显示了根据本发明的多种rHA构建体的氨基酸序列。氨基酸的标号已根据HA 原始氨基酸的标号做了调整。PDI信号肽以斜体表示,HAtl切割位点以粗体表示,融合肽用 下划线表示,终止密码子用*代表。图5A为全长rHA的氨基酸序列(SEQ ID N0:9),其包含 PDI信号肽、跨膜结构域和胞质尾区(cytoplasmic tail)。跨膜结构域以灰色背景表示。图 5B为采用SEKDEL驻留信号的ER驻留rHA的氨基酸序列(SEQ IDNO 10)。驻留信号以灰色 背景显示。图5C为采用HDEL驻留信号的ER驻留rHA的氨基酸序列(SEQ ID N0:11)。驻 留信号以灰色背景显示。图5D为无跨膜结构域的可溶性rHA的氨基酸序列(SEQ ID NO 12)。图5E为采用GCM-pII三聚体肽的可溶三聚体rHA的氨基酸序列(SEQ IDNO 13)。 GCN4-pII肽以灰色背景显示。图5F为采用GCN4-pII三聚体肽并驻留于ER的可溶性三聚 体rHA的氨基酸序列(SEQ ID NO: 14)。GCN4-pII肽以灰色背景显示,SKDEL驻留信号以斜 体显示。图5G为采用PRD三聚体肽的可溶性三聚体rHA的氨基酸序列(SEQ ID N0:15)。PRD肽以灰色背景显示。图5H为采用PRD三聚体肽并驻留于ER的可溶性三聚体rHA的氨 基酸序列(SEQ ID N0:16)。PRD肽以灰色背景显示,驻留信号以斜体显示。图6显示了本发明多个片段的核苷酸序列。非编码序列用小写字母表示,可用的 限制位点用下划线表示。图6A显示了 HAO基因片段的核苷酸序列(SEQ ID N0:17)。图6B 显示了跨膜结构域和胞质尾区基因片段的核苷酸序列(SEQ ID N0:18)。图6C显示了 ER驻 留SEKDL基因片段的核苷酸序列(SEQ ID NO :19)。图6D显示了 ER驻留HDEL基因片段的 核苷酸序列(SEQ ID N0:20)。图6E显示了 GCN4-pII基因片段的核苷酸序列(SEQ ID NO 21)。图6F显示了 ER驻留GCM-pII基因片段的核苷酸序列(SEQ ID NO 22)。图6G显示 了 PRD基因片段的核苷酸序列(SEQ ID N0:23)。图6H显示了 ER驻留PRD基因片段的核 苷酸序列(SEQ ID NO 24)。图7为根据本发明一个实施方案的pCAMBIA 二元质粒中rHA转移DNA(t-DNA)的 示意图。图8 SWfestern印迹图,其显示了烟草中rHA表达的免疫检测。泳道1)纯的rHA 标准品(Ing) ;2)掺入Ing标准rHA的10 μ g植物提取物;3) IOyg植物提取物;4)来自表 达构建体#540之生物质的IOyg蛋白提取物;5)来自表达构建体#541之生物质的IOyg 蛋白提取物;6)来自表达构建体#542之生物质的IOyg蛋白提取物;7)来自表达构建体 #544之生物质的IOyg蛋白提取物;8)来自表达构建体#545之生物质的IOyg蛋白提取 物;9)来自表达构建体#546之生物质的IOyg蛋白提取物;10)来自表达构建体#547之生 物质的IOyg蛋白提取物。图9为Western印迹图,其显示了用5 μ g提取物进行的烟草中rHA表达的免疫检 测。图9A显示了从本塞姆氏烟草(N. benthamiana)获得的结果,图9B显示了从普通烟草 (N. tabacum)获得的结果。泳道1)分别为区域B、D和A、C的5 μ g植物提取物;2)分别为 区域B、D和A、C的掺入了 Ing标准rHA的2和5 μ g植物提取物;3)来自表达构建体#540 之生物质的提取物;4)来自表达构建体#541之生物质的提取物力)来自表达构建体#542 之生物质的提取物;6)来自表达构建体#544之生物质的提取物;7)来自表达构建体#545 之生物质的提取物力)来自表达构建体#546之生物质提取物;幻来自表达构建体#547之 生物质的提取物。图10为Western印迹图,其显示了用5 μ g提取物在还原条件下进行的烟草中rHA 表达的免疫检测。图IOA显示了从本塞姆氏烟草获得的结果,而图IOB显示了从普通烟草 获得的结果。泳道1) 5 μ g植物提取物;2)掺入了 Ing标准rHA的5 μ g植物提取物;3)来 自表达构建体#540之生物质的提取物;4)来自表达构建体#541之生物质的提取物;5)来 自表达构建体#542之生物质的提取物;6)来自表达构建体#544之生物质的提取物;7)来 自表达构建体#545之生物质的提取物力)来自表达构建体#546之生物质的提取物;9)来 自表达构建体#547之生物质的提取物。图11显示了有凝血反应测定结果的板。行1 :PBS(阴性对照);行2 :PBS+1000ng HA (PSC);行 3 :PBS+100ng HA (PSC);行 4 PBS+IOngHA (PSC);行 5 :PBS+lng HA (PSC);行 6 未转化植物的提取物;行7 未转化的植物提取物+IOOOng HA(PSC);行8 未转化的植物提 取物+IOOng HA(PSC);行9 未转化的植物提取物+IOng HA(PSC);行10 未转化的植物提 取物+Ing HA(PSC);行11 表达构建体MO (跨膜rHA)的植物提取物;行12 表达构建体M4 (与GCN4融合的可溶性rHA)的植物提取物。优选实施方案的描述本发明涉及可溶性重组流感抗原的生产。更具体地,本发明涉及保留有免疫原性 的可溶性重组流感抗原的生产。以下为对优选实施方案的描述。本发明提供了含血凝素结构域和寡聚化结构域的重组血凝素(rHA)。该重组蛋白 作为可溶性同三聚体而产生。所述rHA还可包含信号肽和/或内质网(ER)驻留信号。流感由流感病毒引起,流感病毒可分为甲、乙或丙型。甲型和乙型为最经常与流行 相关的类型。甲型流感病毒可根据所存在的血凝素(HA)和神经氨酸酶(NA)表面糖蛋白的 组合进一步分成亚型。目前,已确认了 16种HA(H1-H16)和9种NA(N1_N9)亚型。每种甲 型流感病毒存在一种类型的HA和一种类型的NA糖蛋白。术语重组血凝素(也称为“重组HA”或“rHA”)是指由本领域技术人员熟知的重 组技术产生的血凝素蛋白。血凝素(HA)为在甲型流感病毒上发现的病毒表面蛋白。迄今 为止,已经确定了 16个HA亚型(H1-H16)。HA负责使病毒与所感染宿主细胞表面碳水化合 物部分的唾液酸残基结合。在细胞将病毒内吞后,HA蛋白经历剧烈的构型变化,这引起病 毒与细胞膜融合并使病毒进入细胞。HA为同三聚体的I型膜糖蛋白,通常包含信号肽、HAtl结构域、C末端的跨膜锚定位 点和小胞质尾区(图1)。术语“同三聚体”指由三个HA蛋白分子形成的寡聚体。HA蛋白 以75kDa单体前体蛋白(HAtl)形式合成,后者在表面组装成伸长的三聚体蛋白。在三聚体化 之前,将前体蛋白HAtl在保守的活化切割位点(也称为融合肽)切割为通过二硫键连接的2 个多肽链,HAl (3 个氨基酸)和HA2 (221个氨基酸)。尽管该步骤对病毒感染很重要,但 其对蛋白的三聚体化并不是必要的。HA在宿主细胞内质网(ER)膜中的插入、信号肽切割和 蛋白糖基化为共翻译事件。HA的正确折叠需要蛋白的糖基化和形成6个链间二硫键。HA 三聚体在高尔基复合体顺面和反面组装,跨膜结构域在三聚化过程中起作用。经菠萝蛋白 酶处理的HA蛋白(缺少跨膜结构域)的晶体结构在流感病毒株中显示了高度保守的结构 (Russell等,2004)。还已经确认了 HA在感染过程中经历显著的构象变化,这需要前体HAtl 被切割为2个多肽链HAl和HA2。本发明的重组HA可以为任何亚型。例如,拟可为亚型!11、!12、!13、!14、!15、!16、!17、 H8、H9、H10、HlU H12、H13、H14、H15或H16。本发明的rHA可包含基于现有技术中已知任
何血凝素序列的氨基酸序列。此外,所述rHA还可以基于从新出现的流感病毒中分离出的 血凝素序列。本发明的rHA可为嵌合蛋白构建体,其包含血凝素结构域和寡聚化结构域。术语 “血凝素结构域”指含HAtl结构域或者HAl和HA2结构域的氨基酸序列。也就是说,所述rHA 蛋白可被加工(即包含HAl和HA2结构域),或者可以未被加工(即包含HAtl结构域)。血凝 素结构域不包括在天然蛋白中发现的信号肽、跨膜结构域或胞质尾区。“寡聚化结构域”(也 称为“三聚体肽”)指促进rHA蛋白寡聚化的结构域。所述寡聚化结构域可以是本领域已知 的促进三聚体形成的任何氨基酸序列。例如,所述寡聚化结构域可为异源肽,例如亮氨酸拉 链或采取卷曲螺旋结构的肽。所述寡聚化结构域可与其所替换的跨膜结构域(长度为26 个氨基酸)具有相似的长度和/或结构。或者,所述寡聚化结构域可与其所替换的跨膜结构域(26个氨基酸)和胞质尾区(10个氨基酸)具有相似的长度和/或结构。例如(但不 希望有限制),所述寡聚化结构域的长度可为约20、21、22、23、24、25、26、27、28、四、30、31、 32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49 或 50 个氨基酸。在一个具体 的非限定性实施例中,所述寡聚化结构域的长度为约25-48个氨基酸,或其间的任何量。合 适的寡聚化结构域的非限定性实例包括GCM-pII肽(Harbury et al, 1993, Science, 262 1401-7)、γ玉米醇溶蛋白的脯氨酸富含结构域(PRD)、或噬菌体T4纤维蛋白(fibritin) (Strelkov等,1996,Virology 219 :190-194),或在纤连蛋白或胶原凝集素家族中鉴定的 三聚化组件。在一个具体的非限定性实施例中,所述寡聚化结构域可为GCM-pII肽,其为GCN4 酵母亮氨酸拉链的变体。该GCN4突变体在α螺旋上每7个氨基酸出现的a和d位含IIe残 基(PlI),这导致三聚化的高发倾向。所述三聚体的熔解温度(Tm)大于100°C,使得该寡聚 体具有高度的内在稳定性(Harbour等)。图2中显示了 GCN4-pII的氨基酸序列。GCN4-pII 非常适合用作寡聚化结构域;GCM-pII的该四个氨基酸序列置于HA结构域序列的C末端, 基本上替换了沈个氨基酸的所述跨膜结构域。如需要,可在rHA的C末端放置额外的氨基 酸序列,以使重组结构不被α螺旋终止。例如(但不希望有限制),可在GCM-pII的C末 端加入Ser-Ala-Ala氨基酸残基。在另一个实施例中,所述寡聚化结构域可为Y玉米醇溶蛋白的PRD (在本文中也 称为“PRD”)。已知γ玉米醇溶蛋白一旦进入ER就大量贮存在蛋白质体中。合成的PRD 肽采取两亲性的聚脯氨酸II构象,其可将自身组装为三聚体(Kogan等,2002,Biophysical J.,83 :1194-1204)。在其天然形式中,PRD包含8个重复的肽PPPVHL (SEQ ID NO :2)。γ 玉米醇溶蛋白的PRD肽也置于HA结构域的C末端,替换跨膜锚定区。由于天然形式的PRD 相当长,因此提供不同肽长度G、6或8肽重复,即M、36或48氨基酸长度)的PRD也在本 发明的范围内。如果需要,可在HA结构域和PRD之间放置氨基酸连接子,以使PRD肽链的取 向为朝向聚脯氨酸左螺旋。可使用现有的任何合适的肽连接子。例如(但不希望有限制), 可使用诸如Gly-Gly-Ala-Gly (SEQ ID NO 3)的四肽。如果需要,还可在rHA的C末端放置 额外的氨基酸序列,以使重组结构不被α螺旋终止。例如(但不希望有限制),可在PRD的 C末端加入Ser-Ala-Ala氨基酸残基。在另一个非限制性实施例中,所述寡聚化结构域可为噬菌体Τ4纤维蛋白 (Mrelkov等,1996,Virology 219 :190-194)。该结构域包含纤维蛋白C末端的最后四个
氨基酸残基。在另一个非限制性实施例中,所述寡聚化结构域还可为在W098/56906(其通过引 用并入本文)中公开的三聚化组件,其为在四联蛋白(tetranectin)家族中鉴定的三聚 化组件。该四联蛋白三聚化组件也显示出稳定性,体现在该三聚体可在60°C下、或甚至在 700°C下存在。该三聚化组件可与rHA共价连接,并能与其它两个三聚化组件形成稳定的复 合物。寡聚化结构域的另外一个实例为在WO 95/3K40(其通过引用并入本文)中公开的 三聚化肽,其在胶原凝集素家族中确定。该肽长度为约25至40个氨基酸,其源自胶原凝集 素家族蛋白的颈部区域。本发明的rHA可进一步包含信号肽。所述信号肽可为任何现有技术中已知的任何 合适的肽,以将重组蛋白引导到目标细胞区室或膜。例如(但不希望有限制),可采用在天然HA中发现的信号肽,其将HA引导到ER。在另一个非限制性实施例中,所述信号肽可以是 PDI,即苜蓿信号肽。图3中显示了 PDI的氨基酸和核苷酸序列。有利地,所述PDI信号肽 包含bglll限制性位点,其可以对克隆有帮助。上述rHA还可包含内质网(ER)驻留信号。可以使用本领域技术人员已 知的任何合适的ER驻留信号。例如(但不希望以任何形式成为限制),可以使用 Ser-Glu-Lys-Asp-Glu-Leu(SEKDEL ;SEQ ID NO 4)或His-Asp-Glu-Leu(HDEL ;SEQ ID NO 5)ER驻留信号。所选择的ER驻留信号可在rHA蛋白序列的C末端。有利地,在几种情况下 已显示植物中重组蛋白的ER驻留可将表达水平提高2至10倍(khillberg等,2003,Cell MoI. Life Sci. 60 =443-445) 0不希望受理论局限,ER驻留信号可使蛋白在ER和高尔基复 合体之间来回运动,这允许三聚化发生。术语“可溶性”指rHA在宿主细胞中以可溶形式产生。如上所述,重组HA向可溶 形式的转化产生于以下过程将疏水性的跨膜结构域替换为可溶性的α螺旋,后者与HA结 构域在结构上相容。以可溶形式表达rHA可提高产量(更高的表达水平),并降低纯化的复 杂性,因此降低生产成本。本发明还提供了编码上述rHA的核酸。该核酸为包含编码血凝素结构域(HAtl)之 核苷酸序列和编码寡聚化结构域之核苷酸序列的嵌合构建体。编码rHA的核酸还可包含编 码信号肽的核苷酸序列和/或编码ER驻留信号的核苷酸序列。本发明进一步涉及包含编码上述rHA之核酸的嵌合基因构建体,所述核酸与调控 元件有效连接。“调控元件”或“调控区域”指一部分核酸,其通常(但不总是)为基因的上 游,并可包含DNA或RNA,或者同时包含DNA和RNA。调控元件可包括能够调节器官特异性 或控制发育或时序基因激活的元件。进一步讲,“调控元件”包括启动子元件、核心启动子 元件、对外界刺激产生响应的可诱导元件、组成性激活的元件,或者降低或升高启动子活性 的元件(分别如负向调控元件或转录增强子)。显示调控元件活性的核苷酸序列是指当与 目的编码序列有效连接时,起到启动子、核心启动子、组成型调控元件、负向元件或沉默子 (即降低启动子活性的元件)、或者转录或翻译增强子作用的核苷酸序列。“有效连接”是指特定的序列(例如调控元件和目的编码区域)直接或间接地相互 作用以执行目的功能,如介导或调解基因表达。有效连接序列的相互作用可例如由以有效 连接序列相互作用的蛋白质所介导。本文所用的调控元件还包括在转录起始或转录后有活性的元件,例如调节基因表 达的调节性元件,如翻译和转录增强子,翻译和转录抑制子,以及mRNA稳定性或不稳定性 决定子。在本发明中,术语“调控元件”还指DNA序列,其通常但不总是为结构基因编码序 列的上游(5’),其包含通过提供识别RNA多聚酶和/或其它转录所需因子的特定位点来控 制编码区域之表达的序列。为RNA多聚酶和/或其它转录因子提供识别以保证在特定位点 起始的调控元件的一个实例为启动子元件。启动子元件包含核心启动子元件(负责转录 的起始)及调节基因表达的其它调控元件(如上面列举的)。应该理解,位于内含子中或 编码区域序列3’的核苷酸序列也可能有助于调节目标编码区域的表达。调控元件还可包 括那些位于转录起始位点下游(3’ )或在转录区域中或者在以上两者中的元件。在本发明 中,转录后调节元件可包括在转录起始后有活性的元件,例如翻译和转录增强子,翻译和转 录抑制子,以及mRNA稳定性决定子。
调控元件或其片段可与异源调控元件或启动子有效关联(有效连接),以调节所 述异源调控元件的活性。该调节包括增强或抑制异源调控元件的转录活性、调节转录后事 件,或增强/抑制异源调控元件的转录活性和调节转录后事件这两者。例如,一个或多个调 控元件或其片段可与组成型、可诱导型、组织特异性启动子或其片段,或者调控元件片段有 效关联,例如但不限于,TATA或GC序列可与本发明的调控元件有效关联,以调节这些启动 子在植物、昆虫、真菌、细菌、酵母或动物细胞中的活性。有几种类型的调控元件,包括发育调控的、可诱导的和组成型的元件。受发育调控 的调控元件,或控制在其控制下基因的差异表达的调控元件,在器官或组织发育期间在特 定时间在特定器官或组织中被激活。然而,一些受发育调控的调控元件可优选地在特定发 育阶段在某些器官或组织中被激活,它们还可以发育调节方式被激活,或在植物的其它器 官或组织中为基础水平。“启动子”指在编码区域或其片段的5’端的核苷酸序列,其包含转录起始和转录速 率调节的所有必需信号。通常有两种类型的启动子,可诱导启动子和组成型启动子。如果 需要组织特异性基因表达,例如种子或叶的特异性表达,则还可采用对这些组织特异性的 启动子。可诱导启动子为能够响应于诱导物而直接或间接激活一个或多个DNA序列或基 因转录的启动子。在没有诱导物时DNA序列或基因不被转录。通常,与可诱导启动子特异 性结合以激活转录的蛋白因子以非活性形式存在,其随后被诱导物直接或间接转化为活性 形式。诱导物可为化学物质如蛋白质、代谢产物、生长调节剂、除草剂或酚类化合物,或者通 过热、冷、盐或毒性元素所直接施加的或者通过病原体或疾病物质(如病毒)的作用而间接 施加的生理胁迫。含有可诱导启动子的植物细胞可通过对所述细胞或植物外部施加诱导 物(例如通过喷洒、灌溉、加热或类似方法)来使其暴露于诱导物。可诱导启动子的实例 包括但不限于植物启动子,如光调控的苜蓿质体蓝素(plastocyanine)启动子(例如见 W001/025455);苜蓿亚硝酸还原酶启动子(NiR ;例如见W001/025454,其可通过使用硝酸盐 类施肥而诱导)C3);苜蓿脱水蛋白(dehydrine)启动子(美国申请60/757,486),其可由环 境胁迫(如寒冷)所诱导。组成型启动子在植物的各个部分以及持续地在植物发育过程中指导基因的表达。 任何合适的组成型启动子都可用于在宿主有机体的转化细胞、或者所有器官或组织、或者 所有的器官和组织中驱动rHA的表达。已知的组成型启动子的实例包括与CaMV 35S转录 本相关的那些启动子(Odell等,1985,Nature, 313 :810-812)、稻米肌动蛋白1 (Siang等, 1991,Plant Cell, 3 :1155-1165)和磷酸丙糖异构酶 1 (Xu 等,1994,Plant Physiol. 106 459-467)基因、玉米泛素 1 基因(Cornejo 等,1993,Plant MoI. Biol. 29 :637-646)、拟南芥 (Arabidopsis)泛素 1 至 6 基因(Holtorf 等 1995,PlantMoI. Biol.四637-646)以及烟草 转录起始因子 4A 基因(Mandel 等,1995Plant MoI. Biol. 29 :995-1004)。本文所用术语“组成型”不一定表示基因在所有细胞类型中都以相同的水平表达, 但是该基因在各种各样的细胞类型中表达,尽管经常可观察到在丰度方面的一些变化。本发明的嵌合基因构建体还可包含3’非翻译区。3’非翻译区指含DNA片段的基 因部分,其包含多聚腺苷酸化信号或能够实现mRNA加工或基因表达的任何其它调控信号。 多聚腺苷酸化信号通常特征在于,在mRNA前体的3Y末端添加多聚腺苷酸尾。多聚腺苷酸化信号通常通过存在典型形式5’ -AATAAA-3’的同源物而进行识别,尽管变体并非不常见。合适的3’区域的实例为包含农杆菌属(Agrobacterium)肿瘤诱导(Ti)质粒基因 之多聚腺苷酸化信号的3’转录非翻译区,所述基因例如胭脂碱合成基因(Nos基因)和植 物基因(例如大豆储存蛋白基因和)以及核酮糖-1,5-二磷酸羧化酶小亚基(ssRUBISCO) 基因。因此,本构建体结构基因的3’非翻译区可用于构建在植物中表达的嵌合基因。其它 合适的3’区域的实例为终止子,其可包括但不限于质体蓝素或亚硝酸还原酶或脱水蛋白苜 蓿基因序列的3’非编码区。如果需要,本发明的嵌合基因构建体还可进一步包含增强子、翻译或转录增强子。 本领域技术人员熟知这些增强子区域,其可包括ATG起始编码子和邻近序列。起始编码子 必须与编码序列的阅读框相同以确保全部序列的翻译。翻译控制信号和起始密码子可来自 多种天然和合成来源。可从转录起始区域或从结构基因中获取翻译起始区域。该序列还可 源自所选的用于表达基因的调控元件,并可进行特别的调节以增加mRNA的转录。包含含有编码本发明rHA之核酸序列的嵌合基因构建体的植物、植物部分或组 织、植物细胞、树木、树木部分、树木细胞、酵母、细菌、真菌、昆虫和动物细胞也被认为是本 发明的一部分。然而,应当理解,本发明的调控元件也可与目的编码区域结合以在一系列易 于转化的宿主有机体中表达。这些宿主有机体包括但不限于植物(单子叶和双子叶植物),例如,玉米、谷类植物、小麦、大麦、燕麦、烟草、芸 苔、大豆、豆、豌豆、苜蓿、马铃薯、番茄、人参、拟南芥;这些植物的部分或组织,例如,叶、根、 茎、分生组织、花结构,这些植物的细胞,以及-酵母、真菌、昆虫、动物和细菌细胞。这些有机体的转化和再生的方法已在现有技术中建立,并且为本领域技术人员所 知,获得转化和再生植物的方法对本发明而言并不关键。“转化”指在种间转移遗传信息(核苷酸序列),其可表现为基因型、表型或两者皆 有。遗传信息从嵌合构建体到宿主的种间转移可为可遗传的,并且遗传信息的转移被认为 是稳定的;或者所述转移可为瞬时的,并且遗传信息的转移不可遗传。由植物细胞再生整个植物的方法也是现有技术中已知的。一般来讲,将转化的植 物细胞在合适的培养基中培养,所述培养基可含有选择试剂(如抗生素),其中使用可选择 标记物以有助于对转化植物细胞的鉴定。一旦愈伤组织形成,就可按照已知方法采用合适 的植物激素来促进芽的形成,并将芽转移到生根培养基来进行植物的再生。然后可采用该 植物来建立来自用种子或利用营养繁殖技术的可繁殖世代。
可利用Ti质粒、Ri质粒、植物病毒载体、DNA直接转化、微注射、电穿孔等将 本发明的构建体引入植物细胞中。关于这些技术的综述可见例如Weissbach*WieiSSbaCh, Methods for Plant Molecular Biology, Academy Press, New York VIII,421-463 页 (1988) ;Geierson 和 Corey, Plant Molecular Biology,第 二版· (1988);以及 Miki 和 Iyer,Fundamentalsof Gene Transfer in Plants. Plant Metabolism,第二版· DT. Dennis, DHTurρin,DD Lefebrve,DB Layzell(编),Addison Wesly,Langmans Ltd. London,561-579 页(1997)。其它方法包括DNA直接摄取、采用脂质体、电穿孔,例如采用原生质体、微注射、 微弹(microprojectile)或颈须(whisker),以及真空渗入。参见例如Bilang等(Gene 100 :247-250(1991), Scheid 等(Mol. Gen. Genet. 228 :104-112,1991), Guerche 等(PlantScience52 :111-116,1987),Neuhause 等(Theor. Appl Genet. 75 :30-36,1987),Klein 等, Nature 327:70-73(1987) ;Howe 11 等(Science 208 1265,1980),Horsch 等,(Science 227 :1229-1231,1985), DeBlock 等,Plant Physiology 91 :694-701,1989), Methods for Plant Molecular Biology(ffeissbach 禾口 Weissbach 编,Academic Press Inc.,1988), Methods in Plant MolecularBiology (Schuler 禾口 Zielinski 编,Academic Press Inc., 1989),Liu 和 Lomonossoff (J VirolMeth, 105 :343-348,2002,),美国专利 4,945,050 ; 5,036,006和5,100,792,1995年5月10日提交的美国专利申请08/438,666以及1992年 9月25日提交的美国专利申请07/951,715(所有这些参考文献均通过引用并入本文)。如下所述,可采用瞬时表达方法来表达本发明的构建体(参见Liu和 Lomonossoff, 2002, Journal of Virological MethodsjIosdds-SdS5JiiljlSIM^1A 本文)。或者,可采用基于真空的瞬时表达方法(如Kapila等所述,1997,其通过引用并 入本文)。这些方法可包括例如但不限于农杆菌接种(Agro-inoculation)或农杆菌渗入 (Agro-infiltration)、注射浸润(synringe infiltration)的方法,但是也可使用上述其 它瞬时方法。利用农杆菌接种、农杆菌渗入或注射浸润,可使含有所需核酸的农杆菌的混合 物进入组织的细胞间空隙内,所述组织例如叶、植物的气生部分(包括茎、叶和花)、植物的 其它部分(茎、根、花)或整个植物。在通过表皮后,农杆菌感染t-DNA并将t-DNA拷贝转 移进细胞。t-DNA以附加体转录,mRNA翻译,使得在感染细胞中产生目的蛋白,但是,t-DNA 在核中的传代为瞬时的。为了帮助鉴定转化的植物细胞,可进一步处理本发明的构建体使其包含植物可选 择标记物。可用的可选择标记物包括提供对抗生素之抗性的酶,所述抗生素例如庆大霉素、 潮霉素、卡那霉素等。类似地,提供可通过颜色变化鉴定化合物之生成的酶(如GUS(i3_葡 糖苷酸酶)或荧光的酶(例如萤光素酶)也是可用的。当在本发明中涉及具体序列时,应该理解,这些序列在其范围内包括与所述具体 序列“基本同源”的序列,或与本文定义的一个或多个核苷酸序列在严格杂交条件下杂交 的互补序列。只要这些同源序列表现出本文公开的一个或多于一个调控元件的活性,当在 确定长度的核苷酸序列中有至少70%,或更优选75%的核苷酸序列匹配时,这些序列就是 “基本同源”的。可利用核苷酸序列比较程序来确定这些序列的相似度,所述程序例如在DNASIS 中提供的(采用例如但不限定于以下的参数GAP penalty 5,#0f top diagonals 5, fixed GAP penalty 10, k-tuple 2, floating gap 10 andwindow size 5)。但是,在现有技术中 还熟知其它序列比较的比对方法,例如,Smith & Waterman算法(1981,Adv. Appl. Math. 2 482) > Needleman & Wunsch (J. Mol. Biol. 48 :443,1970)、Pearson & Lipman (1988, Proc. Nat ‘ 1. Acad. Sci. USA 85 :2444),以及这些算法的计算机执行(GAP、BESTFIT、FASTA 和 BLAST,可通过NIH获得),或者通过人工比对并目检的方法(参见例如Current Protocols in Molecular Biology,Ausubel等编,1995年增刊),或在严格条件下用Southern或 Northern杂交(参见Maniatis 等,Molecular Cloning (A Laboratory Manual), ColdSpring Harbor Laboratory,1982)。优选地,基本同源的序列在确定长度的该分子中显示出至少 80%,以及最优选至少90%的序列相似性。该严格杂交条件的一个实例可为在65°C下在4X SSC中过夜杂交(约为16_20小时),而后在65°C下在0. IX SSC中清洗1小时,或在65°C下在0. IX SSC中清洗2次,每 次20或30分钟。或者,示例性的严格杂交条件可为在42°C下50%甲酰胺、4X SSC中过夜 (16-20小时),而后在65°C下在0. IX SSC中清洗1小时,或在65°C下在0. IX SSC中清洗2 次,每次20或30分钟,或过夜(16-20小时);或者对于独特的序列区域而言,在65°C下在 Church磷酸盐缓冲液(7% SDS ;0. 5M NaPO4缓冲液pH 7. 2 ;IOmM EDTA)中杂交,在50°C下 在0. IX SSC、0. SDS中清洗2次,每次20或30分钟,或在65°C下在2X SSC,0. 1% SDS 中清洗2次,每次20或30分钟。本发明的rHA可与已有的流感疫苗联合使用,以补充疫苗、使它们更有效,以及减 少所需的施用剂量。本领域技术人员已知,疫苗可靶向一种或多于一种流感病毒。合适的 疫苗的实例包括但不限于那些可从Sanofi-Pasteur、ID Biomedical、Merial、Sinovac、 Chiron>Roche>Medlmmune^GlaxoSmithKline白勺。现在将参考以下非限制性实施例对本发明进行详细描述。实施例1 :rHA策略在本发明中选择作为示例的HA获取自流感病毒株A/ NewCaledonia/20/99 (HlNl)。A/New Caledonia/20/99 HA 已被充分表征,并且可购得免疫 检测工具。由于所有HA的三维结构都相当保守,因此本表达策略可直接用于任何其它WLrHA的表达采用苜蓿PDI信号肽(SEQ ID NO 3)靶向ER和分泌途径。该信号肽 直接与成熟rHA的N末端一级序列(SEQ ID NO 8)融合。用SignalP server 3. 0验证了 有PDI信号肽的成熟rHA之信号肽的理论性切割。可使用SEKDEL (SEQ ID NO 4)或 HDEL (SEQ ID NO 5)驻留信号(两者均与 rHA 蛋 白序列的C末端融合)将rHA驻留在ER中。当采用GCM-pII肽作为寡聚化结构域时,其直接与HAO最后的Tyr残基的C末端 融合。将GCM-pII第1位的Met残基改变为Leu,因为Leu比Met更具惰性,并且其与起初 的Met相比有相似的包装体积。在GCM-pII的C末端添加氨基酸Ser-Ala-Ala。当采用γ玉米醇溶蛋白的PRD时,将含有8个重复的PPPVHL(SEQID NO 2)的 肽与HA融合,以替换HA的跨膜结构域。在融合中还引入了前4个脯氨酸残基。去除了 C末端半胱氨酸。为了适应与HA C末端聚脯氨酸螺旋的融合,在PRD的N末端添加了肽 Gly-Gly-Ala-Gly (EQ IDNO :3)。在 PRD 的 C 末端添加了 Ser-Ala-Ala 肽。总共制备了 8种不同的rHA基因构建体以检测它们在植物中的表达1.全长rHA,包括含PDI信号肽(SEQ ID NO 9)的跨膜结构域;2.从项目1的rHA中去除跨膜结构域和胞质尾区,并用驻留信号SEKDEL (SEQ ID NO 10)替换;3.从项目1的rHA中去除跨膜结构域和胞质尾区,并用驻留信号HDEL (SEQ ID NO 11)替换;4.从项目1的rHA中去除跨膜结构域和胞质尾区(SEQ ID NO 12);5.从项目1的rHA中去除跨膜结构域和胞质尾区,并用GCN4-pII (SEQID NO :13)
替换;6.从项目1的rHA中去除跨膜结构域和胞质尾区,并用在C末端有驻留信号 SEKDEL (SEQ ID NO 14)的 GCN4-pII 替换;
7.从项目1的rHA中去除跨膜结构域和胞质尾区,并用PRD结构域(SEQID NO 15) 替换;以及8.从项目1的rHA中去除跨膜结构域和胞质尾区,并用在C末端有驻留信号 SEKDEL (SEQ ID NO 16)的 PRD 结构域替换。实施例2 基因合成合成了在实施例1中表述的8种不同的基因构建体。对流感病毒株A/New Caledonia/20/99的野生型HA核苷酸序列只进行修饰以插入或去除限制性位点,以便于克 隆步骤。这些对基因序列的微小修饰不会改变所得蛋白质的氨基酸序列。合成的HAtl基因 在5’端有Apal限制位点,与PDI信号肽的ATG同相。其它7个基因在其5’端有Kpnl限制 位点。每个基因在3’端以终止密码子(TAA)终止,其后是McI和MuI限制位点。按照设 计好的克隆策略,以下限制位点在最终的质粒中被设计为唯一的ApaI、BstZ17 I, Sac I、 Kpn I,BgI 11和乂11 I。在植物生物技术研究所(Plant Biotechnology Institute)合成 了不同的基因片段,并转运克隆进PUC18中。在图6中给出了所选的核苷酸序列信息(SEQ ID NO 17-24)。^MM 3 表汰rHA融合蛋白的HH本的遗传_装采用已知的 DNA 重组技术(Sambrook 等(1989)Molecular cloning =Alaboratory Manual,第二版,Cold Spring Harbor Laboratory press,ColdSpring Harbor,NY)组装了 多种DNA构建体。除非另外说明,否则采用大肠杆菌(E. coli)DH5a菌株作为扩增二元载体 的宿主。利用bglll和McI限制位点直接将HAO基因片段连接进plastocynine盒(已经 含有Pdi信号肽)中,或者采用Kpnl、bglll和McI限制位点与其它7个C-末端共连接。 在每种情况下,都将基因插入到二元载体上的转移DNA(t-DNA)所含的plastocynine表达 盒中。t-DNA为通过转化整合入宿主植物细胞基因组(从右边缘到左边缘)的二元载体上的 一部分。在本实施例中所用的二元载体来自商品化质粒pCAMBIA 2300 (Cambia,Canberra, Au),并含以下元件(从t-DNA的右边缘到左边缘):-其中插入rHA基因的多个专有表达盒(启动子和终止子),其可获自Medicago;-多克隆位点以便于克隆;以及-编码新霉素磷酸转移酶Il(nptll)的基因,可在胭脂碱合成酶(N0Q启动子和花 椰菜35S花叶病毒(35 终止子的控制下提供对卡那霉素抗性的可选择标记物。将每个克隆进行DNA测序以测定该克隆的核苷酸序列。如果所得的氨基酸序列仍 编码完全相同的蛋白序列(SEQ ID NO :9-16),则可允许rHA基因的序列有核苷酸的变化。 在表1中列出了 8种不同的DNA构建体,并且在图7中示意性显示了所得到的rHA t-DNA 的实例。表1 :rHA的DNA构建体
权利要求
1.一种重组血凝素(rHA),其包含a)血凝素结构域;和b)寡聚化结构域其中所述rHA作为嵌合可溶性同三聚体产生。
2.权利要求1的rHA,其中所述蛋白还包含信号肽。
3.权利要求1或2的rHA,其中所述蛋白还包含内质网(ER)驻留信号。
4.编码权利要求1至3中任一项的rHA的核苷酸序列。
5.核酸序列,其包含a)编码血凝素结构域的核苷酸序列;和b)编码寡聚化结构域的核苷酸序列;其中所述核酸编码形成同三聚体的可溶性rHA。
6.权利要求5的核酸序列,还包含编码信号肽的核苷酸序列。
7.权利要求5或6的核酸,还包含编码内质网(ER)驻留信号的核苷酸序列。
8.一种载体,其包含权利要求4至7中任一项的核苷酸。
9.表达权利要求1至3中任一项的rHA的宿主细胞。
10.用权利要求4至7中任一项的核苷酸转化的宿主细胞。
11.用权利要求8的载体转化的宿主细胞。
12.—种产生重组rHA蛋白的方法,包括提供含有载体的宿主细胞,所述载体包含a)编码血凝素结构域的核苷酸序列;和b)编码寡聚化结构域的核苷酸序列;其中所述核酸编码形成同三聚体的可溶性rHA。
13.一种在植物中表达重组血凝素(rHA)的方法,包括向植物中引入载体并表达rHA, 其中所述载体包含a)编码血凝素结构域的核苷酸序列,其中所述核酸编码形成同三聚体的可溶性rHA;和b)编码寡聚化结构域的核苷酸序列。
14.权利要求13的方法,其中在引入步骤(步骤a)中,所述核酸以瞬时方式被引入所 述植物中。
15.权利要求13的方法,其中在引入步骤(步骤a)中,所述核酸以使其稳定的方式被 引入所述植物中。
16.一种在植物中产生重组血凝素(rHA)的方法,包括a)将核酸序列引入所述植物或其部分中,所述核酸序列包含与编码血凝素结构域和寡 聚化结构域之核苷酸序列有效连接的调控区域其中所述核酸编码形成同三聚体的可溶性 rHA ;以及b)培养所述转基因植物,从而产生所述rHA。
17.权利要求16的方法,其中在引入步骤(步骤a)中,所述核酸以瞬时方式被引入所 述植物中。
18.权利要求16的方法,其中在引入步骤(步骤a)中,所述核酸以使其稳定的方式被 引入所述植物中。
全文摘要
本发明提供了重组可溶性血凝素(rHA)三聚体蛋白,其包含血凝素胞外结构域和寡聚化结构域。所述rHA作为可溶性同三聚体产生,还可包含信号肽和/或内质网(ER)驻留信号。本发明还涉及编码本发明之rHA的核酸,以及包含所述核酸的载体和嵌合构建体。还提供了产生所述rHA的方法。本发明所述的rHA可用于配制流感疫苗,或者可用于强化已有疫苗。
文档编号C07K19/00GK102089432SQ200980126670
公开日2011年6月8日 申请日期2009年7月7日 优先权日2008年7月8日
发明者米凯莱·达吉斯, 纳萨莉·兰德里, 路易斯-菲利普·韦齐纳, 马农·科图雷 申请人:麦迪卡格公司