用于改良宿主细胞内蛋白质生产的信号序列和共表达的分子伴侣的利记博彩app

文档序号:570949阅读:1009来源:国知局
专利名称:用于改良宿主细胞内蛋白质生产的信号序列和共表达的分子伴侣的利记博彩app
技术领域
本发明提供了改良蛋白质生产的方法和组合物。在一些实施方案中,本文提供的 方法涉及与蛋白质有效连接的信号序列的用途。在一些实施方案中,与蛋白质有效连接的 信号序列在宿主细胞中与至少一种分子伴侣组合表达。在一些实施方案中,蛋白质在丝状 真菌细胞中表达。在其他实施方案中,本发明的方法涉及蛋白质与酶的催化结构域的融合, 所述酶例如葡糖淀粉酶或CBHl。一些实施方案提供了信号序列、一个或多个分子伴侣、陪伴 蛋白和/或折叠酶的组合,和/或蛋白质与催化蛋白质或结构域的融合。
背景技术
宿主细胞例如酵母、丝状真菌和细菌已长期用于表达盒分泌外源蛋白质。通常,这 些外源或蛋白质在酵母、丝状真菌和细菌中的生产,涉及表达蛋白质以及从宿主细胞或生 长细胞的培养基中部分或完全纯化蛋白质。尽管一些蛋白质需要从宿主细胞的胞内环境中 纯化,如果蛋白质从细胞分泌到培养基中,则可以极大的简化纯化。胞外蛋白质分泌是复杂的,也是多种细胞表达系统中蛋白质生产的重要方面。与 蛋白质分泌相关的一个因素是正确的蛋白质折叠。在体外稀释浓度下,许多蛋白质可以可 逆的解折叠和再折叠,因为指定紧密折叠结构所需要的全部信息都存在于蛋白质的氨基酸 序列中。然而,体内的蛋白质折叠发生在浓缩的大量蛋白质的环境下,其中分子内的折叠过 程与分子间的聚集反应相互竞争。这些复杂因素在真核表达系统中比在原核系统中更显著.真核分泌通路的第一步是新生多肽以伸展的形式跨内质网(ER)膜的易位。多肽 的正确折叠和装配通过分泌通路发生在ER中。然而,在多种情况下,虽然蛋白质大量过表 达,但却分泌不佳。实际上,在多种情况下,应该有利于此类表达的分泌信号没有表现出实 现所述功能。与其他蛋白质的相互作用使所需蛋白质的表达更加复杂化。当在一个物种、属 或科中尝试表达从另一物种、属或科的生物中获得的蛋白质时,上述因素甚至更加重要。例 如,担子菌(Basidiomycete)蛋白质(例如,漆酶)通常在子囊菌(Ascomycete)宿主(例 如,木霉属(Trichoderma))中表达低下。实际上,尽管在真菌表达系统领域开展了大量工 作,但仍然需要改良所需蛋白质的胞外表达。发明概述发明提供了改良蛋白质生产的方法和组合物。方法涉及使用与所需蛋白质有效连 接的信号序列,所述蛋白质在宿主细胞中与至少一种分子伴侣组合表达。在一些实施方案 中,在丝状真菌细胞中表达蛋白质。在其他实施方案中,本发明的方法涉及所需蛋白质与宿 主蛋白质,例如葡糖淀粉酶或CBHl催化结构域的融合。在一些实施方案中,本发明提供了增加丝状真菌宿主(例如,子囊菌)中的蛋白质 生产的方法和组合物,通过组合分泌信号的应用和分子伴侣蛋白的表达,所述分子伴侣蛋 白是从与蛋白质相同的生物体中获得的。在一些实施方案中,蛋白质是非子囊菌蛋白质,其 与来自子囊菌宿主蛋白质的分泌信号融合。在其他一些实施方案中,至少一种分子伴侣蛋白可用于增加与子囊菌蛋白质的催化结构域融合的蛋白质的表达。一些实施方案提供了用于在子囊菌宿主细胞中生产至少一种蛋白质的方法,通过 向宿主细胞引入多核苷酸,所述多核苷酸包括与来自和宿主相同的门、属和/或物种的信 号序列有效连接的所需蛋白质;共表达来自与蛋白质相同的门、属和/或物种的分子伴侣; 在适合蛋白质表达和生产的培养条件下培养宿主细胞;并生产蛋白质。方法任选的包括回 收所产生的蛋白质。一些实施方案包括将蛋白质与来自子囊菌的酶的催化结构域融合。其 它实施方案包括将蛋白质与来自子囊菌的全长的酶融合。在一些实施方案中,子囊菌宿主 细胞是木霉属。在一些实施方案中,分子伴侣是下列中的至少一种BIP1、ER01、PDI1、TIG1、 PRPl、PPIl、PPI2、PRP3、PRP4、钙联接蛋白和 LHSl。蛋白质的选择不限于,并可以包括来自任何属、物种和/或科的任何下列蛋白质 漆酶、葡糖淀粉酶、α淀粉酶、颗粒淀粉水解酶、纤维素酶、脂肪酶、木聚糖酶、角质酶、半纤 维素酶、蛋白酶、氧化酶、漆酶及其组合。一些实施方案包括来自NSP24或CBHl基因的信号 序列。在一些实施方案中,分子伴侣基因是bipl。方法的实施方案还可以包括子囊菌启动 子。在一些实施方案中,宿主细胞和信号序列来自相同的子囊菌宿主。在一些实施方案中, 启动子是来自木霉属的CBHl启动子。在一些实施方案中,蛋白质是担子菌蛋白质。在一些 实施方案中,宿主细胞是子囊菌宿主细胞。在一些实施方案中,宿主细胞是担子菌宿主细胞 且蛋白质是子囊菌蛋白质。其它一些实施方案提供了用于在子囊菌宿主细胞中生产至少一种蛋白质的方法, 通过向子囊菌宿主细胞引入多核苷酸,所述多核苷酸包括与来自子囊菌的酶的催化结构域 融合的所需蛋白质,其中所需蛋白质是担子菌蛋白质;共表达子囊菌的分子伴侣;在适合 蛋白质表达和生产的培养条件下培养子囊菌宿主细胞;并生产蛋白质。在一些实施方案中, 回收所产生的蛋白质。在一些实施方案中,蛋白质与子囊菌信号序列有效的连接。
附图简介

图1显示了木霉属表达质粒pTrex4-漆酶D opt的示意图。多核苷酸序列显示为 SEQ ID NO 1。图2显示了木霉属表达质粒pTreX2g-Bipl的示意图。多核苷酸序列显示为SEQ ID NO :2。图3显示了木霉属表达质粒pTrex2g-Pdil的示意图。多核苷酸序列显示为SEQ ID NO :3。图4显示了在木霉属表达质粒pTreX2g-Erol中使用的Erol序列的示意图。多核 苷酸序列显示为SEQ ID NO :4ο图5显示了木霉属表达质粒pTrGA-漆酶D opt的示意图。多核苷酸序列显示为 SEQ ID NO :5。图6显示了木霉属表达质粒PKB408的示意图。多核苷酸序列显示为SEQ ID NO 6。图7显示了木霉属表达质粒PKB410的示意图。多核苷酸序列显示为SEQ ID NO 7。图8-1至8-4显示了里氏木霉NSP24可读框(ORF)SEQ ID NO :8。信号肽是前20个氨基酸(SEQ ID NO 9)。图9-1至9-2显示了里氏木霉CBHl ORF (SEQ ID N0:10)。信号肽开始于碱基对 210,结束于碱基对260 (SEQ ID NO :11)。催化核心开始于碱基对261至碱基对1698 (SEQ ID NO: 12),包括内含子1(从碱基对671至737)和内含子2 (从碱基对1435至1497)。接 头序列始于碱基对1699,止于碱基对1770 (SEQ ID N0:13)。CBHl蛋白质序列显示为SEQID NO :14。图10示例了漆酶产量的改善,通过融合单色下皮黑孔菌(c. unicolor)漆酶的编 码基因和全长木霉属葡糖淀粉酶。菌株#8-2是CBHl漆酶融合体。菌株1066-9、1066-13 和1066-15是TrGA漆酶融合体。图11示例了在摇瓶中漆酶产量的改善,通过融合单色下皮黑孔菌(C. unicolor) 漆酶的编码基因和CBHl或NSP24信号序列。Y轴以单位/ml显示了漆酶活性。X轴显示了 菌株(仅CBH融合体,或具有信号序列)。图12示例了在发酵罐中漆酶产量的改善,通过融合单色下皮黑孔菌漆酶的编码 基因和CBHl或NSP24信号序列。Y轴以单位/ml显示了漆酶活性。X轴以小时显示了发酵 时间。图13示例了由CBHl信号序列加BIPl分子伴侣表达,所提供的漆酶产量的改善。 Y轴以单位/ml显示了漆酶活性。X轴以小时显示了发酵时间。图14示例了通过在摇瓶中共表达分子伴侣和单色下皮黑孔菌,在3、4和5天对漆 酶产量的改善。Y轴以单位/ml显示了漆酶活性。X轴显示了菌株(KB410-13,或与bip共 表达)。图15示例了漆酶产量的改善,通过融合单色下皮黑孔菌漆酶的编码基因和CBHl 信号序列、催化结构域和接头,以及与Bipl、pdil或erol分子伴侣共表达。Y轴以单位/ml 显示了漆酶活性。X轴显示了菌株。发明详述除非另外指出,本发明的实践涉及在分子生物学、蛋白质工程、重组DNA技术、微 生物学、细胞生物学、细胞培养、转基因生物学、免疫学和蛋白质纯化中普遍使用的常规技 术,属于本领域技术人员掌握的范围。此类技术是本领域技术人员已知的,在多种文本和参 考文献中都有描述。本文上下文中提及的所有专利、专利申请、文章和出版物,都通过引用 清楚地整合到本文中。^X术语“子囊菌”指一类属于子囊菌门(Ascomycota)的真菌。该门的成员的特征是 存在子囊(即,含有子囊孢子的特化的囊样细胞)。术语“担子菌”指一类属于担子菌门的真菌。该门的成员的特征是产生担孢子 (即,位于特化的棒状末端细胞外部区域的有性孢子,所述特化细胞称为担子)。“蛋白酶”意指具有在蛋白质骨架的一个或多个不同位置,催化肽键切割的能力的 蛋白质或多肽的蛋白质或多肽结构域(例如,E.C.3.4)。可以从微生物(例如,真菌或细 菌)、植物和/或动物中获得蛋白酶。“酸性蛋白酶”指具有在酸性条件下水解蛋白质的能力的蛋白酶。如本文中使用的,术语“分子伴侣”或“分子伴侣蛋白”通过保护未折叠区域免受周围蛋白质(干扰),而有利于蛋白质折叠,但不增加蛋白质折叠的速率。这可以包括帮助分 泌蛋白在内质网(ER)中折叠和糖基化的蛋白质及其同源物。分子伴侣可以定位在ER中。 示例性分子伴侣包括Bip (GRP78)、GRP94和酵母Lhslp,以及通过与未折叠状态下暴露的疏 水区域结合,防止不理想的相互作用,而帮助分泌蛋白折叠的蛋白质。分子伴侣还包括涉及 蛋白质跨ER膜易位的蛋白质。如本文中使用的,“陪伴蛋白”是利用ATP,帮助蛋白质折叠为天然状态(活性状 态)的 蛋白质。通常,蛋白质亚基装配在一起形成大环装配体(assemby)。例如,陪伴蛋白 发挥作用是通过在中央腔中与非天然蛋白质结合,然后基于结合ATP,释放底物蛋白质到目 前包封的腔,而有效折叠。“折叠酶蛋白质”意指催化蛋白质折叠中的步骤,而增加蛋白质折叠速率的蛋白 质。例如,它们可以帮助形成二硫键,以及帮助与脯氨酸残基相邻的肽链形成正确的构象。 示例性的折叠酶包括蛋白质二硫键异构酶(Pdi)及其同源物,和脯氨酰-肽基顺反异构酶 及其同源物。如本文中使用的,“NSP24家族蛋白酶,,意指在其天然的或野生型类型具有蛋白酶 活性的酶,并属于NSP24蛋白酶的家族。NSP24蛋白酶是酸性蛋白酶,例如酸性真菌蛋白 酶。NSP24蛋白酶具有与SEQ ID NO 8的氨基酸序列及其生物学活性片段,至少85%、至少 90%、至少93%、至少95%、至少96%、至少97%、至少98%和至少99%的序列同一性。如本文中使用的,术语“所需的蛋白质”意指目标蛋白质。在本申请中,所需的蛋白 质和目标蛋白质是可互换的使用的。在一些实施方案中,所需的蛋白质是可商购的重要工 业蛋白。术语意在涵盖由天然存在的基因、突变基因和/或合成的基因编码的蛋白质。所 需的蛋白质可以是宿主细胞天然的蛋白质,或者对宿主细胞非天然的(异源的)蛋白质。如本文中使用的,“衍生物”意指源自前体或亲本蛋白质(例如,天然蛋白质)的蛋 白质,通过在C-和/或N-末端添加一个或多个氨基酸,在氨基酸序列的一个或多个不同位 点取代一个或多个氨基酸,在蛋白质的一端或两端或者在氨基酸序列的一个或多个位点缺 失一个或多个氨基酸,或者在氨基酸序列的一个或多个位点插入一个或多个氨基酸。术语“重组”指不天然存在于宿主细胞中的多核苷酸或多肽。重组分子可以包括 以不天然存在的方式相互连接的两条或多条天然存在的序列。 术语“肽”、“蛋白质”和“多肽”在本文中可互换的使用的。如本文中使用的,“百分比(% )序列同一性”在涉及氨基酸或核苷酸序列时,定义 为在比对序列并且如果需要,为了获得最大百分比序列同一性而引入空位后,候选序列中 与目标序列(例如,NSP24信号肽序列)中的氨基酸残基或核苷酸相同的氨基酸残基或核 苷酸的百分比,且不考虑任何保守性取代作为序列同一性的一部分。如本文中使用的,术语“α淀粉酶(例如,E.C.3.2. 1. 1类)”指催化α_1,4_糖 苷键水解的酶。这类酶也被描述为影响含有1,4_α连接的D-葡萄糖单位的多糖中的1, 4_ α-D-糖苷键外切或内切水解的酶。用于描述这类酶的另一个术语是“糖原酶”。示例性 的酶包括α -1,4-葡聚糖4-葡聚糖水化酶葡聚糖水解酶。如本文中使用的,术语“葡糖淀粉酶”指淀粉葡糖苷酶类的酶(例如,EC. 3. 2. 1. 3、 葡糖淀粉酶、1,4-a -D-葡聚糖葡糖水解酶)。这些是外切作用的酶,从直链淀粉和支链淀 粉分子的非还原端释放葡糖基残基。酶还水解α-1,6_和α-1,3-键,尽管以远低于水解α-1,4-键的速率。

术语“启动子”意指涉及结合RNA聚合酶,起始基因转录的调控序列。如本文中使用的,“异源启动子”指这样的启动子,其与基因或纯化的核酸处于相 关联,但与所述基因或纯化的核酸不是天然相关的。如本文中使用的,多肽的“纯化制品,,和“基本纯的制品,,意指已经与其天然存在 的细胞、其它蛋白质、脂类或核酸分离的多肽。如本文中使用的,“同源”指两个或多个多肽分子之间,或两个或多个核酸分子之 间的序列相似性。当比较的序列位置被相同的碱基或氨基酸单体亚基占据(例如,如果两 条DNA分子中每一条的位置都被腺嘌呤占据),则分子在该位置是同源的。两条序列之间的 百分比同源性是两条序列共享的匹配或同源位置数除以位置数再乘以100的函数。例如, 如果两条序列中的10个位置有6个是匹配或同源的,则两条序列是60%同源。作为示例, DNA序列ATTGCC和TATGGC享有50%同源性。通常,当两条序列被比对以给出最大同源性时 进行比较。在本文中,术语“ %同源性”与术语“ %同一性”可互换的使用的,指当使用序列 比对程序进行比对时,在核酸序列或氨基酸序列之间的核酸或氨基酸序列同一性的水平。如本文中使用的,术语“载体”指设计用于将核酸引入一种或多种细胞类型中的多 核苷酸序列。载体包括克隆载体、表达载体、穿梭载体、质粒、噬菌体颗粒、盒等。如本文中使用的,“表达载体”意指包括与合适的控制序列有效连接的DNA序列的 DNA构建体,所述控制序列能够影响DNA在合适宿主中的表达。术语“表达”意指基于基因的核酸序列生产多肽的过程。术语“共表达”意指在一个细胞内表达至少2个不同的基因。其可以是外源基因 或内源基因。其可以整合到相同或不同质粒或从相同或不同的质粒中表达,并且可以从相 同或不同的启动子表达。如本文中使用的,“有效的连接的”意指调控区(例如,启动子、终止子、分泌信号或 增强子区)与结构基因是关联的或连接的,并控制所述基因的表达。如果信号序列通过宿 主细胞的分泌系统指导蛋白质,则它与蛋白质是有效连接的。如本文中使用的,“微生物”指细菌、真菌、病毒、原生动物和其他微生物或微观生 物体。术语“丝状真菌”指本领域已知的真菌亚门(Eumycotina)的所有丝状形态。这 类真菌的特征是营养菌丝体,其具有细胞壁,所述细胞壁含有壳多糖、纤维素和其他复杂多 糖。本发明的丝状真菌在形态学、生理学和遗传学上与酵母不同。丝状真菌通过菌丝延长 进行营养生长,碳代谢是专性好氧的。如本文中使用的,术语“木霉属(Trichoderma) ”和“木霉属物种(Trichoderma sp.) ”指以前或现在分类为木霉属的任何真菌属。如本文中使用的,术语“培养”指在合适条件下,在液体、半固体或固体培养基中生 长微生物细胞群体。在一些实施方案中,如本领域已知的,在容器或反应器中进行培养。在 一些实施方案中,培养导致淀粉底物(例如,包含颗粒淀粉的底物)发酵生物转化为终产 物。“发酵”指微生物对有机物质的酶促和厌氧降解,产生更简单的有机化合物。发酵 通常在厌氧条件下发生,但该术语并非意在唯一限制为严格的厌氧条件,因为在氧气存在的条件下也可以发生发酵。在将核酸序列插入到细胞内的语境中,术语“引入”意指“转染”、“转化”或“转 导”,包括指核酸序列向真核或原核细胞内的掺入,其中,核酸序列或者掺入到细胞基因组 内(例如,染色体、质粒、质体或线粒体DNA),转变成自主复制子,或者瞬时的表达(例如,转 染的mRNA)。如本文中使用的,术语“转化的”、“稳定转化的”和“转基因”用于指细胞时,意指 细胞具有非天然的核酸序列,所述序列被整合到其基因组中,或者作为附加型质粒在多代 中维持。 如本文中使用的,术语“异源的”用于指编码所需蛋白质的多肽或多核苷酸时,意 指多肽或多核苷酸不是天然存在于宿主细胞内的。术语“同源的”或“内源的”在涉及编码所需蛋白质的多肽或多核苷酸时,指多肽 或多核苷酸是天然存在于宿主细胞内的,或由宿主细胞天然表达的。术语“过表达”意指在宿主细胞中以大于野生型宿主细胞所产生的水平表达多肽 的过程。在一些实施方案中,将至少一种多核苷酸引入宿主细胞。在其他一些实施方案中, 术语指同源多肽以这样的浓度表达,所述浓度大于野生型细胞表达的相同的同源多肽的表 达。如本文中使用的,发明的一个方面的特征是“基本纯的”核酸,所述核酸包括编码 与蛋白质有效连接的NSP24信号肽或CBHl信号肽的核苷酸序列,和/或此类核酸的等价 体。在这些实施方案中,核酸分离自其它核酸和/或细胞成分。术语“等价体”指编码功能性等价的多肽的核苷酸序列。等价的核苷酸序列涵盖 了由于一个或多个核苷酸取代、添加和/或缺失而不同的序列,例如等位变体。例如,在一 些实施方案中,由于遗传密码的简并性,等价的核苷酸序列包括这样的序列,所述序列不同 于核苷酸序列SEQ ID NO :8,但导致产生与SEQ ID NO :8编码的多肽序列功能性等价的多 肽。本发明提供了生产所需蛋白质的方法。方法包括步骤(a)将第一核酸序列引入 宿主细胞,所述第一核酸序列包括与所需的蛋白质序列有效连接的信号序列;(b)表达第 一核酸序列;(c)共表达编码分子伴侣或折叠酶的第二核酸序列,所述分子伴侣或折叠酶 选自 bipl、erol、pdil、tigl、prpl、ppil、ppi2、prp3、prp4、钙联接蛋白和 Ihsl ;和(d)收 集从宿主细胞分泌的所需蛋白质。在一个实施方案中,第一核酸序列还包括在信号序列和所需的蛋白质序列之间的 酶序列。例如,酶序列获得自葡糖淀粉酶或CBHl酶。在一个实施方案中,酶序列是全长的 酶序列,所述酶序列包括催化结构域、接头和结合结构域。在另一个实施方案中,酶序列包 括催化结构域序列,其通过接头与所需的蛋白质序列相连。在一些实施方案中,酶是在其天 然宿主中高表达和/或分泌的宿主蛋白质。第一核酸序列还包括在信号序列上游的启动子。在一个实施方案中,启动子是宿 主细胞天然的,且与所需的蛋白质序列不是天然相关的。第二核酸序列与启动子有效的连接。在一个实施方案中,启动子是宿主细胞天然 的,且与第二核酸序列不是天然相关的。增加的蛋白质表达
本发明提供了用于在宿主细胞中生产所需蛋白质的方法。通过包括分泌信号(例 如,NSP24信号肽或CBHl信号肽),并结合分子伴侣、陪伴蛋白和/或折叠酶蛋白的共表达, 增加蛋白质产量。在一些实施方案中,分泌信号来自子囊菌宿主蛋白质。在一些实施方案 中,所需的蛋白质与酶的催化结构域融合。本发明提供了显著的优点,特别是考虑到这样的事实,即,在子囊菌宿主中难以生 产大量来自其它真菌家族的蛋白质。实际上,本领域技术人员已知,在真菌或细菌宿主中通 常难以生产任何异源的真菌蛋白质。本发明提供了适合在合适的真菌或细菌宿主中,生产 任何合适蛋白质的方法和组合物。在一些实施方案中,真菌宿主是子囊菌,蛋白质是担子菌 蛋白质,而在其它实施方案中,真菌宿主是担子菌,而蛋白质是子囊菌蛋白质。在一些实施方案中,本发明提供了用于在宿主中增加蛋白质表达和/或分泌的方 法,利用宿主信号肽与来自和蛋白质来源的相同生物体的一种或多种伴侣分子或折叠酶的 共表达组合。因此,在一些实施方案中,利用担子菌宿主信号肽和子囊菌分子伴侣,在担子 菌宿主中表达异源的子囊菌蛋白质。在一些备选的实施方案中,利用子囊菌信号肽和子囊 菌或担子菌分子伴侣,在子囊菌宿主中表达异源的担子菌蛋白质。在一些实施方案中,子囊 菌宿主是木霉属的成员。在一些实施方案中,木霉是里氏木霉,包括里氏木霉的多个菌株。 在一些备选的实施方案中,担子菌是下皮黑孔属(Cerrena)的成员,包括但不限于单色下 皮黑孔菌。在本发明的一些实施方案中,通过将蛋白质与宿主酶融合,并与来自与所需蛋白 质相同生物体的一种或多种分子伴侣外源共表达组合,来增加所需蛋白质的表达和/或分 泌。通过同一质粒,或通过不同的质粒来实现共表达。在其他实施方案中,通过将蛋白质与宿主酶的催化结构域连接,并组合将蛋白质 与宿主信号序列有效的连接,以及一种或多种分子伴侣、陪伴蛋白和/或折叠酶的外源共 表达,来增加所需蛋白质的表达和/或分泌,所述分子伴侣、陪伴蛋白和/或折叠酶优选的 来自与蛋白质相同的生物体。可以认为,本文提供的多个实施方案中论及的元件可以以任何合适的组合使用。 因此,并非意在将实施方案限于本文提供的特定描述,因为各实施方案的方面可以彼此组 合使用。信号肽本发明中使用的特定信号肽不是关键的,只要信号肽在宿主中是有效的。当与蛋 白质有效连接的信号肽增加了宿主细胞内的蛋白质分泌时,就提供了 “有效的信号肽”。在 一些实施方案中,信号肽是从强分泌的蛋白质中获得的,和/或是强信号肽。“强信号肽”导 致天然蛋白质被其天然宿主强分泌。在一些实施方案中,信号肽获得自与宿主细胞相同门 的生物体。实际上,在一些实施方案中,这是有利的。在一些实施方案中,信号肽和宿主细胞 来自相同的属,而在其它一些实施方案中,信号肽和宿主细胞来自(相同的)物种。例如,在 一些实施方案中,宿主细胞是子囊菌宿主细胞,信号肽获得自子囊菌。在一些实施方案中, 宿主细胞是木霉属,信号肽来自木霉属。在一些实施方案中,宿主细胞是里氏木霉,信号肽 来自里氏木霉。在一些实施方案中,信号肽是强信号肽。在一些可选的实施方案中,宿主细 胞是担子菌宿主细胞,信号肽获得自担子菌。可用于本发明的信号肽的一些实例包括但不 限于CBHl和NSP24信号肽。信号肽可以在例如子囊菌门的门的其它成员中发挥作用,但在一些实施方案中,当信号肽在获得它的属中使用时,具有最优的用途(即,提供强分泌)。如本文中使用的,“强分泌蛋白”是形成从细胞中分泌显著量的总蛋白的任何蛋白 质。从细胞中分泌的总蛋白也称为“胞外蛋白”。例如,强分泌的蛋白质包括至少约2%的 胞外蛋白,至少约3 %,至少约4 %,至少约5 %,至少约6 %,至少约7 %,至少约8 %,至少约 9%,至少约10%,至少约15%,至少约20%,至少约30%,至少约40%,至少约50%,至少 约60 %,至少约70 %,至少约75 %,至少约80 %,至少约85 %,至少约90 %,至少约95 %,或 至少约99%。在一些实施方案中,强分泌蛋白包括在培养上清液中至少约5%的胞外蛋白 质。CBHI信号肽、接头和催化结构域里氏木霉产生一些纤维素酶,包括纤维 二糖水解酶I (CBHI),其折叠成由延伸的 接头区分隔的两个分离的结构域(即,催化和结合结构域)。外源多肽已经作为具有CBHI 的催化结构域和接头区的融合体在里氏木霉中分泌(参见例如,Nyyss0nen等人,Bio/ Technol. 11 :591_595 [1993])。长枝木霉(T. Iongibrachiatem)也生产 CBHI,可用于融合体 以及分离信号肽和/或接头。接头可用于连接酶的催化结构域和所需多肽。任何合适的接 头都可用于本发明,只要它在独立折叠的结构域之间形成延伸的、半刚性的间隔区。在一些 蛋白质中发现了此类接头区域,特别是在水解酶中(例如,细菌和真菌纤维素酶和半纤维 素酶;参见例如,Libby 等人,ProteinEngineering,Design and Selection (1994)第 7 卷, 1109-1114)。如图9所示,对于CBHI (SEQ ID NO 10),信号序列始于碱基对210,止于碱基对 260 (SEQ ID NO 11)。催化核心始于碱基对261至碱基对1698 (SEQ ID N0:12),包括内含子 1 (从碱基对671至737)和内含子2 (从碱基对1435至1497)。接头序列始于碱基对1699, 止于碱基对1770(SEQID N0:13)。纤维素结合结构域始于碱基对1771至碱基对1878。可 以通过expasy组织网址发现关于CBHI的序列和结构域信息,命名为imiprot/P62694。已 经在多个其他木霉属物种和其他丝状真菌中鉴别了 CBHI同源物,合适时可用于本发明。NSP24信号肽和多核苷酸NSP24基因是从里氏木霉中分离并测序的(参见例如,美国专利号7,429,476,其 通过引用全文整合到本文中)。该基因测序鉴别了编码407个氨基酸可读框(SEQ ID NO 8)的序列,如图8所示。鉴别SEQ ID NO 8的前20个氨基酸(MQTFGAFLVSFLAASGLAAA ;SEQ ID NO 9)是信号肽。已经在多个其他木霉属物种和其他丝状真菌中鉴别了 NSP24同源物, 合适时可用于本发明。在一些实施方案中,NSP24信号序列用于子囊菌生物体。在一些实 施方案中,序列用于木霉属物种,在一些甚至更特别的实施方案中,用于里氏木霉。因此,本发明提供了可用于分泌蛋白质的NSP24家族蛋白酶信号肽。在一些实施 方案中,NSP24信号肽命名为“NSP24天冬氨酸蛋白酶信号肽”。发明的多核苷酸本发明提供了多种多核苷酸,包括但不限于编码所需蛋白质、信号肽、催化结构 域、接头、分子伴侣、陪伴蛋白和折叠酶的多核苷酸。在一些实施方案中,多核苷酸包括至少 两种上述分子。在其他实施方案中,本发明的多核苷酸包括至少三种上述分子。在一些实施方案中,多核苷酸编码蛋白质,所述蛋白质包括至少一个氨基酸取代, 例如使用L-氨基酸的“保守氨基酸取代”,其中,一个氨基酸被另一种生物学相似的氨基酸取代了。保守氨基酸取代是保留了被取代的氨基酸的一般电荷、疏水性/亲水性,和/或空 间体积(steric bulk)的取代。保守取代的实例是下列组之间的取代Gly/Ala、Val/Ile/ Leu、Lys/Arg、Asn/Gln、Glu/Asp、Ser/Cys/Thr,和 Phe/Trp/Tyr。在一些实施方案中,“衍生 蛋白质”可用于本发明。在一些这类实施方案中,衍生蛋白质与“亲本”蛋白质序列相比,低 至约1至约10个氨基酸残基不同,例如约6至约10个,少至约5个,少至约4个,约3个, 约2个,或甚至1个氨基酸残基不同。表1提供了本领域认知的示例性保守氨基酸取代。在 其他实施方案中,取代涉及一个或多个非保守氨基酸取代、缺失或插入,其不消除信号肽活 性。 表1 保守氨基酸替换 在一些实施方案中,发明的多核苷酸是天然序列。在一些实施方案中,天然序列分 离自自然界,而在其它实施方案中,它们是通过重组或合成方式生产的。术语“天然序列”特 别涵盖了天然存在的截短的或分泌的形态(例如,生物活性片段),以及天然序列的天然存 在的变体形态。由于遗传密码的简并性,特定氨基酸可以使用一个以上的密码子来编码。因此,在 一些实施方案中,不同的DNA序列用于编码任意多肽,例如信号肽、蛋白质、催化结构域和/或分子伴侣。实际上,本发明意在涵盖编码相同多肽的不同多核苷酸序列。当在合适的温度和溶液离子强度条件下,单链形态的核酸可以与其它核酸退火 时,则核酸与另一核酸序列是可杂交的。在低、中、高和非常高严格条件下用于杂交的杂交 和洗涤条件是本领域熟知的。通常,杂交涉及核苷酸探针和同源DNA序列,其通过互补多核 苷酸的广泛的碱基配对,形成稳定的双链杂交体。在一些实施方案中,在2X氯化钠/柠檬酸 钠(SSC),0· 5% SDS中,在约60°C (中等严格)、65°C (中等/高严格)、70°C (高严格)和 约75°C (非常高严格)下,洗涤具有探针和同源序列的滤膜(参见例如,Current Protocols in Molecular Biology, John Wiley &Sons,New York, 1989,6. 3. 1-6. 3. 6,通过引用整合到 本文中)。本发明涵盖了等位变体、天然突变体、诱导突变体,由这样的DNA编码的蛋白质, 所述DNA在高或低严格条件下与编码漆酶、NSP24信号序列、CBHI信号序列、催化结构域、分 子伴侣、陪伴蛋白和折叠酶的核酸杂交。本发明的核酸和多肽包括由于公开序列的测序错 误而与本文公开的序列不同的序列。"DNA序列的同源性”是通过两条DNA序列之间相同的程度来确定的。通常使用计 算机程序来确定多肽序列和/或核苷酸序列的同源性或“百分比同一性”。实施序列比对 和确定序列同一性的方法是本领域技术人员熟知的,不需要过多实验就可以实施,并且可 以确定的获得同一性值的计算。本领域技术人员可获得且已知多种算法,用于比对序列和 确定序列同一性。使用这些算法的计算机程序也是本领域可获得且已知的,包括但不限于 ALIGN 或 Megalign (DNASTAR)软件,或 WU-BLAST-2、GAP、BESTFIT、BLAST、FASTA, TFASTA 禾口 CLUSTAL。本领域技术人员已知如何确定用于测量比对的合适参数,包括在比较的序列全长 获得最大比对所需的算法。可以利用程序确定的缺省参数来确定序列同一性。在一些实 施方案中,通过MSPRCH程序(Oxford Molecular)执行的Smith-Waterman同源性检索算法 (Smith Waterman, Meth. Mol. Biol. ,70 173-187 [1997))来确定序列同一性,所述 MSPRCH 程序使用具有下列检索参数的仿射空位检索空位开发罚分为12,空位延伸罚分为1。可以 使用 Genetics Computer Group, Inc. (Madison,WI)的 GCG 序列分析软件包的 GAP 程序进 行成对的氨基酸比较,运用bloSum62氨基酸取代矩阵,具有空位权重12和长度权重2。关 于两条氨基酸序列的最优比对,变体氨基酸序列的连续区段相对于参照氨基酸序列,可以 具有额外的氨基酸残基或缺失的氨基酸残基。用于与参照氨基酸序列比较的连续区段可以 包括至少约20个连续的氨基酸残基,可以是约30个、约40个、约50个或更多个氨基酸残 基。在一些实施方案中,通过设定空位罚分对与在衍生氨基酸序列中包括空位相关的增加 的序列同一性进行校正。在一些实施方案中,本发明涵盖的蛋白质、信号肽、酶催化结构域、分子伴侣、 陪伴蛋白和/或折叠酶是源自细菌或真菌,例如丝状真菌。示例性丝状真菌包括曲霉 属物种(Aspergillus spp.)和木霉属物种(Trichodermaspp.)。一种示例性的木霉属 物种是里氏木霉。然而,在一些实施方案中,本发明提供的信号肽和/或编码信号肽的 DNA是源自真菌的另一属或物种,包括但不限于犁头霉属物种(Absidia spp);支顶孢 属物禾中(Acremoniumspp);蘑燕属物禾中(Agaricus spp) ; Anaeromyces spp;曲霉属物禾中 (Aspergillus spp),包括但不限于棘孢曲霉(A. aculeatus)、泡盛曲霉(A. awamori)、黄
(A. flavus)(A. foetidus) > A. fumaricus>(A. fumigatus)、丰勾H ffi (A. nidulans)、黑曲霄(A. niger)、米曲霄(A. oryzae)、土曲霄(A. terreus)禾口杂色曲霄 (A. versicolor) ;Aeurobasidium spp ;下皮黑孑L属物禾中(Cerrena spp) ;Cephalosporum spp ;头孢属物种(Cephalosporium);毛壳属物种(Chaetomium spp);鬼伞属物种 (Coprinus spp) ;Dactyllum spp ;指孢霉属物种(Dactylium spp);镰孢属物种(Fusarium spp),包括 F. conglomerans、多隔键刀菌(F. decemcellulare)、爪卩圭键抱(F. javanicum)、 亚麻镰孢(F. Iini)、尖镰孢(F. oxysporum)和腐皮镰孢(F. solani);粘帚霉属物种 (Gliocladiumspp);腐质霉属物种(Humicola spp),包括特异腐质霉(H. insolens)和 H. lanuginosa ;毛霉属物种(Mucor spp);脉孢菌属物种(Neurosporaspp),包括粗糙脉孢 菌(N. crassa)禾口好食脉抱霉(N. sitophila) ;Neocallimastix spp ;Orpinomyces spp ;青 β属物禾中(Penicillium spp) ;Phanerochaete ;身寸脉菌属物禾中(Phlebia spp) ;Piromyces spp ;根霉属物种(Rhizopus spp);裂褶菌属物种(Schizophyllum spp);葡萄穗霉属物种 (Stachybotrys spp);栓菌属物种(Trametes spp);木霉属物种(Trichoderma spp),包 括里氏木霉(T.reesei)、(长枝)里氏木霉(T. reesei (Iongibrachiatum))和绿色木霉 (T. viride);禾口接霄属物种(Zygorhynchus spp)。
催化结构域融合体将所需蛋白质与酶融合通常能增加所需蛋白质的表达和/或分泌。通常,在构建 体中,酶序列位于所需蛋白质序列的上游。例如,酶是从葡糖淀粉酶或从CBHl酶中获得的。 在一个实施方案中,酶序列是全长的酶序列,包括催化结构域、接头和结合结构域。在另一 个实施方案中,酶序列包括催化结构域序列,其通过接头或部分接头与所需蛋白质序列连 接。在一些实施方案中,酶是在其天然宿主中高表达和/或分泌的宿主蛋白质。例如,当宿 主细胞是木霉属宿主细胞时,酶是来自木霉属蛋白质。然而,可以理解,多种丝状真菌蛋白 可用于与蛋白质融合,并可成功用于其它的丝状真菌宿主。分子伴侣、陪伴蛋白和折叠酶可用于本发明包括的方法和多核苷酸中的特定分子伴侣、陪伴蛋白和折叠酶不是 关键的。此外,当本文中描述分子伴侣、陪伴蛋白和折叠酶的用途时,它们在方法中是可互 换使用的。例如,当描述方法使用分子伴侣时,应理解为折叠酶和/或陪伴蛋白也可以取代 所述分子伴侣或与其累加的使用。适合本发明的分子伴侣、陪伴蛋白和/或折叠酶是在宿 主细胞中有活性的,并且发挥了增加所需蛋白质表达的作用的那些。在一些实施方案中,分子伴侣、陪伴蛋白和/或折叠酶来自与蛋白质相同门的生 物体,也可以来自相同的属,还可以来自相同的属和物种。在一些实施方案中,分子伴侣、陪 伴蛋白和/或折叠酶来自担子菌,蛋白质是担子菌蛋白质。在一些实施方案中,分子伴侣、 陪伴蛋白和/或折叠酶是组合使用的。在一些实施方案中,可以使用具有与全长分子伴侣、 陪伴蛋白和/或折叠酶基本相同功能的分子伴侣、陪伴蛋白和/或折叠酶的片段。示例性的 分子伴侣、陪伴蛋白和/或折叠酶包括在美国专利申请60/919,332和W02008/115596中公 开的,其通过引用全文整合到本文中。示例性的分子伴侣、陪伴蛋白和/或折叠酶包括但不 限于BIP1、CLXl、EROl、LHSl、PRP3、PRP4、PRPl、TIGl、PDI1、PPI1、PPI2、SCJl、ERV2、EDEM 和 SILl。表2提供了多种可用于本发明的分子伴侣、陪伴蛋白和/或折叠酶的序列。表2:分泌增强蛋白质的示例性核酸和多肽序列 分子生物学一启动子和表达载体本发明利用了重组遗传性领域的常规技术,是本领域技术人员熟知的。在一些实 施方案中,本发明提供了包括基因启动子序列(例如,来自丝状真菌)的异源基因,其通常 在转化宿主细胞(例如,里氏木霉细胞)用于复制和/或表达前,克隆到中间载体中。这类 中间载体通常是原核载体(例如,质粒或穿梭载体)。通常,以任何合适的启动子实现所需蛋白质的表达。在一个实施方案中,对宿主非 天然的启动子与编码所需蛋白质的多核苷酸有效的连接,所述蛋白质对宿主是天然或非天 然的。在另一个实施方案中,对宿主天然的启动子与编码所需蛋白质的多核苷酸有效的连 接,所述蛋白质对宿主是天然或非天然的。在一些实施方案中,以异源启动子表达所需蛋白 质,所述异源启动子与所需蛋白质基因不是天然相关联的。而在其他一些实施方案中,以组 成型或诱导性启动子表达所需蛋白质。在一些实施方案中,在具有纤维素酶启动子(例如, cbhl启动子)的木霉属表达系统中表达所需蛋白质。如本文中使用的,术语“启动子”指发挥指导下游基因转录的功能的核酸序列。启 动子可以包括靠近转录起始位点附近的必需核酸序列,例如,在II型聚合酶启动子的情况下的TATA元件。启动子以及其它的转录和翻译调控核酸序列,统称为“调控序列”,控制基 因的表达。通常,调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序 列、翻译起始和终止序列,以及增强子或激活子序列。调控序列通常适合宿主并被其识别, 所述宿主中表达下游基因。在一些实施方案中,使用的启动子来自与宿主细胞相同的门,在 其他实施方案中,启动子来自与宿主细胞相同的属,在一些实施方案中,来自与宿主细胞相 同的属和种。“组成型启动子”是在大部分环境和发育条件下有活性的启动子。“可诱导的”或 “可 抑制的启动子”是在环境或发育调控下有活性的启动子。在一些实施方案中,由于环境 因素的改变,启动子是可诱导的或可抑制的,如本领域已知的,所述因素包括但不限于碳、 氮或其他营养的可利用性、温度、PH、渗透性、重金属的存在、抑制剂浓度、压力,或前述的组 合。在其他一些实施方案中,启动子是可以被代谢因素诱导或抑制的,如本领域已知的,例 如一些碳源的水平、一些能量源的水平、一些分解代谢产物的水平,或前述的组合。合适的启动子的非限制性实例包括cbhl、cbh2、egll、egl2、egl3、egl4、egl5、xynl 和xyn2,产黄青霉(P. chrysogenum)的可抑制的酸性磷酸酶基因(phoA)启动子(参见, Graessle 等人,Appl. Environ. Microbiol. ,63 :753_756 [1997]),葡萄糖抑制性 PCKl 启动 子(参见,Leuker等人,Gene 192 :235_240 [1997]),麦芽糖诱导性、葡萄糖抑制性MRPl启 动子(参见,Munro 等人,Mol. Microbiol.,391414-1426 [2001]),甲硫氨酸抑制性 MET3 启 动子(参见,Liu 等人,Eukary. Cell 5 :638_649[2006]),pKi 启动子和 cpcl 启动子。在本发明的一些实施方案中,报告基因构建体的启动子是温度敏感型启动子。在 一些实施方案中,升高的温度抑制温度敏感型启动子的活性。在一些实施方案中,启动子是 分解代谢产物抑制性启动子。在一些实施方案中,渗透性的改变抑制启动子。在一些实施 方案中,启动子可以被培养基中存在的多糖、二糖或单糖水平诱导或抑制。可用于本发明的诱导型启动子的实例是里氏木霉的cbhl启动子,其核苷酸序列 以登录号D86235储存在GenBank中。其它示例性启动子包括在编码纤维素酶的基因调控 中涉及的启动子,包括但不限于cbh2、egll、egl2、egl3、egl5、xynl和xyn2。在本发明的一些实施方案中,为了获得克隆基因的高水平表达,异源基因有利的 位于与天然存在的基因中距启动子大概相同距离的位置。然而,如本领域已知的,在不丧失 启动子功能的条件下,该距离可以进行适应的一些改变。在一些实施方案中,通过替换、取代、添加或消除一个或多个核苷酸所修饰的天然 启动子可用于本发明,只要所述修饰不改变启动子的功能。实际上,本发明意在涵盖,但并 不限于启动子的此类改变。表达载体/构建体通常含有转录单位或表达盒,所述转录单位或表达盒含有异源 序列表达所需的所有额外的元件。因此,典型的表达盒含有与异源核酸序列有效连接的启 动子,和转录物有效多聚腺苷酸化所需的信号,核糖体结合位点,以及翻译终止。盒内的其 它元件可以包括增强子,以及如果使用基因组DNA作为结构基因,可以包括具有功能性剪 接供体和受体位点的内含子、分泌前导肽、前导序列、接头和切割位点。本发明的实践不受遗传构建体中启动子的选择限制。如上文指出的,示例性的启 动子是里氏木霉的cbhl、cbh2、egll、egl2、egl3、egl5、xlnl和xln2启动子。可用于本 发明的其它启动子包括来自泡盛曲霉和黑曲霉的葡糖淀粉酶基因(glaA)的那些(参见,Nunberg等人,Mo 1. Cell Biol.,4 =2306-2315[1984])和来自构巢曲霉乙酰胺酶的启动子。 用于枯草芽孢杆菌(Bacillus subtilis)载体的示例性启动子是AprE启动子;用于大肠杆 菌的示例性启动子是Lac启动子,在酿酒酵母(Saccharomyces cerevisiae)中使用的示例 性启动子是PGK1,在黑曲霉中使用的示例性启动子是glaA,且用于里氏木霉的示例性启动 子是cbhl。然而,本发明并非意在限于这些特定的细胞或这些特定的启动子,其它细胞和启 动子也可以用多个实施方案中。在一些实施方案中,除启动子序列外,表达盒还含有位于结构基因下游的转录终 止区,以提供有效的终止。在一些实施方案中,终止区是从和启动子序列相同的基因中获得 的,而在其他实施方案中,其获得自不同的基因。虽然任何合适的功能性真菌终止子都可用于本发明,一些示例性的终止子包 括但不限于来自以下基因的终止子构巢曲霉trpC基因(参见,Yelton等人,Proc. Natl. Acad. Sci. USA 81 1470-1474(1984) ;Mullaney 等人,(Molecular Genetics and Genomics [MGG] 199 :37-45 (1985)),泡盛曲霉或黑曲霉的葡糖淀粉酶基因(参见,Nunberg 等人,Mol. Cell Biol.,4 :2306-2315(1984) ;Boel 等人,EMBO J.,3 1581-1585 (1984)),米 曲霉的TAKA淀粉酶基因,米黑毛霉(Mucor miehei)的羧基蛋白酶基因(欧洲专利
发明者王华明, 鲍锴 申请人:丹尼斯科美国公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1