不具有信号肽的天然分泌多肽的表达的利记博彩app
【专利说明】不具有信号化的天然分泌多化的表达
[0001] 对序列表的引用
[0002] 本申请包含计算机可读形式的序列表。该计算机可读形式通过引用结合在此。 发明领域
[0003] 本发明设及重组生产天然分泌多肤的多种方法,运些方法包括W下步骤:提供一 种微生物宿主细胞,该宿主细胞包括编码不具有翻译融合信号肤的天然分泌多肤的一种外 源多核巧酸;在有益于该多肤表达的条件下培养该微生物宿主细胞,并且可任选地,回收该 多肤,连同微生物、某些多核巧酸、表达构建体和蛋白酶取代变体。
[0004] 发明背景 阳0化]一种被表示为P化S的热稳定的分泌蛋白酶分离自强烈火球菌(Pyrococcus化riosus),并且先前已经使用包括分泌信号的表达DM构建体生产,但P化S蛋白酶的产率 是相当低的巧P0994191A1 ;宝生物公司(Takara),日本)。感兴趣的是为了可在工业上采 用该酶,增加来自强烈火球菌的热稳定的P化S蛋白酶的表达产率,使得它可W足够的量和 可接受的生产经济产生。
[0006] 从嗜热网团菌值ictyoglomusthermo地ilum)中鉴定并克隆了 一种被表示为 XynB的热稳定的分泌木聚糖酶,使该酶重组表达于大肠杆菌中。XynB的成熟N末端定位在 23-氨基酸前导肤的下游,如由SignalP信号肤分析软件预测的,并且受W其他细菌家族11 种木聚糖酶执行的多序列分析结果的支持。该XynB前导肤使得该酶对大肠杆菌具有毒性。 该XynB酶表达于大肠杆菌中(不具有前导肤),并且通过细胞裂解回收(莫里斯(Morris) 孤等人 1998,应用与环境微生物学(Appl.Environ.Microbiol.) 64 巧):1759-65)。 该XynB酶还重组表达于枯草芽抱杆菌宿主中,具有其天然分泌信号,但仅W非常低 的产率(张狂hang)等人;应用生物化学与生物技术(ApplBiochemBiotechnol) (2010) 160:1484-1495)。感兴趣的是为了可在工业上采用该酶,增加来自嗜热网团菌的热 稳定的XynB木聚糖酶的表达产率,使得它可W足够的量和可接受的生产经济产生。
[0007] 芽抱杆菌属宿主细胞已经被表征为工业制造各种感兴趣多肤的主力,主要是因为 它们主动分泌具有所谓信号肤的多肤。信号肤是一种小多肤,典型的是约20-30个氨基酸, 该小多肤W与待分泌多肤的N-末端的转录和翻译融合体表达。它指导该融合的多肤进入 适当配备的宿主细胞的分泌机构中,于是该融合的多肤裂解,运时不具有其信号肤的现已 成熟的感兴趣多肤被分泌进入周围培养液中,该信号肤保留在细胞中并且被降解。
[0008] 芽抱杆菌属中重组生产的感兴趣多肤的分泌能够使得不用必须进行细胞裂解步 骤而直接从培养液中比较容易地回收多肤。在芽抱杆菌属中,只有肯定会从细胞输出至生 长培养基中的多肤是天然具有信号肤的。
[0009] 细胞中大多数的多肤不是肯定会输出的,而是相反原本在细胞内、周质、膜结合的 等等。此类天然非分泌多肤通常被认为是难W产生的,因为它们需要从宿主细胞内回收,运 通常需要麻烦的细胞裂解步骤,导致回收过程具有挑战性,运进而是天然分泌酶对于工业 制造是优选的原因。
[0010] 发明概述
[0011] 为了研究该Mus蛋白酶和该XynB木聚糖酶(无天然C-末端纤维素结合结构域) 在芽抱杆菌属中的表达水平,运两种酶被表达为具有众所周知的有效的芽抱杆菌属信号肤 的翻译N-末端融合多肤。然而,无论用什么实验方法运些酶在芽抱杆菌属宿主中还是在没 有任何信号肤的情况下表达。
[0012] 与预期相反,当运些酶在没有任何分泌信号肤的情况下表达时,我们发现运两种 酶在上清液中的产率比较高,如在此的实例中证明的。运是一个高度令人惊讶的结果并 且具有经济意义,因为它证明P化S样蛋白酶和XynB样木聚糖酶可W在芽抱杆菌属中产生 (不具有信号肤),并且相比于采用了信号肤的情况具有更高的产率。运些酶可W成功地从 培养液中直接回收而不需要昂贵的细胞裂解步骤。
[0013]因此,在第一方面,本发明设及重组生产天然分泌多肤的多种方法,运些方法包括W下步骤:
[0014]a)提供一种微生物宿主细胞,该宿主细胞包括编码不具有翻译融合信号肤的天然 分泌多肤的一种外源多核巧酸;
[0015] b)在有益于该多肤表达的条件下培养该微生物宿主细胞,并且可任选地,
[0016] 回收该多肤。
[0017] 在第二方面,本发明设及一种重组微生物宿主细胞,该宿主细胞包括编码不具有 翻译融合信号肤的天然分泌多肤的一种外源多核巧酸。
[0018] 本发明的第Ξ方面设及编码不具有翻译融合信号肤的天然分泌多肤的一种分离 的合成多核巧酸,其中所述多肤是具有如下氨基酸序列的一种蛋白酶,该氨基酸序列与SEQ IDN0:8的位置1至413所示的序列至少80%相同,优选与沈QIDN0:8的位置1至413 所示的序列至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至 少96 %、至少97%、至少98 %、至少99%、或100%相同;或是具有如下氨基酸序列的一种 木聚糖酶,该氨基酸序列与SEQIDNO: 15的位置1至204所示的序列至少80%相同,优选 与沈QIDNO: 15的位置1至204所示的序列至少85%、至少90%、至少91 %、至少92%、至 少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%相同。
[0019] 在第四方面,本发明设及一种核酸构建体或表达载体,该核酸构建体或表达载体 包括如权利要求11至14中任一项所定义的多核巧酸,该多核巧酸可操作地连接至提供其 在所选择的宿主细胞中的表达的控制序列。
[0020] 本发明的第五方面设及一种分离的合成多肤,所述多肤是:
[0021] a) -种蛋白酶,该蛋白酶具有、包括如下氨基酸序列或由其组成,该氨基酸序列与 SEQIDN0:6的位置1至413所示的蛋白酶至少80%相同,优选与SEQIDN0:6的位置1 至413所示的序列至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少 95%、至少96%、至少97%、至少98%、至少99%、或100%相同,其中该蛋白酶在对应于沈Q IDNO:6的位置369的位置处包括一个氨基酸取代;优选地在对应于SEQIDNO:6的位置 369的位置处的甘氨酸被取代为天冬氨酸:G369D;或
[0022] b) -种木聚糖酶,该木聚糖酶具有、包括如下氨基酸序列或由其组成,该氨基酸序 列与沈QIDNO: 15的位置1至204所示的蛋白酶至少80%相同,优选与沈QIDNO: 15的 位置1至204所示的序列至少85 %、至少90 %、至少91 %、至少92 %、至少93 %、至少94 %、 至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %相同,并且包括一个甲硫氨 酸作为其第一N-末端氨基酸。
[0023] 本发明的第六方面设及一种分离的合成多肤,所述多肤是:
[0024] a) -种蛋白酶,该蛋白酶具有如下氨基酸序列或者包括如下氨基酸序列或由其组 成,该氨基酸序列示于SEQIDNO:8的位置1至413 ;或
[00巧]b) -种木聚糖酶,该木聚糖酶具有如下氨基酸序列或者包括如下氨基酸序列或由 其组成,该氨基酸序列示于SEQIDNO: 15的位置1至204,并且包括一个甲硫氨酸作为其第 一N-末端氨基酸。
[00%] 最终方面设及一种组合物,该组合物包括如第五或第六方面定义的一种蛋白酶多 肤。
[0027] 附图简述
[0028] 图1显示来自实例4的PJA4156质粒的质粒图。
[0029] 图2显示来自实例4的pHyGe396质粒的质粒图。 W30] 定义
[0031] 等位基因变体:术语"等位基因变体"意指占据同一染色体基因座的基因的两种或 更多种可替代形式中的任一种。等位基因变异由突变天然产生,并且可W导致群体内的多 态性。基因突变可W是沉默的(在所编码的多肤中没有改变)或可编码具有改变的氨基酸 序列的多肤。多肤的等位基因变体是由基因的等位基因变体编码的多肤。
[0032] 编码序列:术语"编码序列"意指直接指定一个多肤的氨基酸序列的多核巧酸。编 码序列的边界一般由一个开放阅读框架决定,该开放阅读框架从一个起始密码子(如ATG、 GTG或TTG)开始并且W-个终止密码子(如TAA、TAG或TGA)结束。编码序列可W是一种 基因组DNA、cDNA、合成DNA或其组合。
[0033] 控制序列:术语"控制序列"意指对于表达编码本发明的多肤的多核巧酸所必需的 核酸序列。每个控制序列对于编码该多肤的多核巧酸来说可W是天然的(即,来自相同基 因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括 但不限于前导子、聚腺巧酸化序列、前肤序列、启动子、信号肤序列、W及转录终止子。至少, 控制序列包括启动子,W及转录和翻译终止信号。出于引入有利于将运些控制序列与编码 一种多肤的多核巧酸的编码区连接的特异性限制酶切位点的目的,运些控制序列可W提供 有多个接头。
[0034] 表达:术语"表达"包括设及多肤产生的任何步骤,包括但不限于,转录、转录后修 饰、翻译、翻译后修饰、W及分泌。
[0035] 表达载体:术语"表达载体"意指线性或环状DNA分子,该分子包括编码多肤的多 核巧酸并且该多核巧酸可操作地与提供用于其表达的控制序列相连接。
[0036] 宿主细胞:术语"宿主细胞"意指易于用包含本发明的多核巧酸的核酸构建体或表 达载体转化、转染、转导等的任何细胞类型。术语"宿主细胞"涵盖由于复制期间发生的突 变而与亲本细胞不同的亲本细胞的任何后代。
[0037] 分离的:术语"分离的"意指处于自然界中不出现的形式或环境中的物质。分离的 物质的非限制性实例包括(1)任何非天然发生的物质,(2)包括但不限于任何酶、变体、核 酸、蛋白质、肤或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所 有天然发生的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通 过增加该物质相对于与其天然相关的其他组分的量而修饰的任何物质(例如,宿主细胞中 的重组体产量;编码该物质的基因的多拷贝;W及使用比编码该物质的基因天然相关的启 动子强的启动子)。 阳03引成熟多肤:术语"成熟多肤"意指在翻译和任何翻译后修饰如N-末端加工、C-末 端截短等之后处于其最终形式的多肤。本领域已知,一个宿主细胞可W产生由同一多核巧 酸表达的两种或更多种不同成熟多肤(即,具有不同C-末端和/或N-末端氨基酸)的混 合物。本领域还已知,不同的宿主细胞不同地加工多肤,并且因此一个表达一种多核巧酸的 宿主细胞当与另一个表达相同多核巧酸的宿主细胞相比时可W产生一种不同的成熟多肤 (例如,具有一个不同的C-末端和/或N-末端氨基酸)。
[0039]核酸构建体:术语"核酸构建体"意指单链或双链的一种核酸分子,该核酸分子是 从天然存在的基因中分离的,或W-种本来不存在于自然界中的方式被修饰成含有核酸的 区段,或是合成的,该核酸分子包括一个或多个控制序列。 W40] 全长多肤:术语"全长多肤"在此被定义为具有生物学活性的多肤的前体形式,其 中该前体包含信号肤,并且可替代地还包含前肤,其中在从细胞分泌时,该信号肤被裂解, 并且可替代地该前肤也被裂解,从而产生具有生物学活性的多肤。
[0041] 信号肤:术语"信号肤"在此被定义为W符合阅读框的方式连接(融合)至具有生 物学活性的多肤的氨基末端且指导该多肤进入细胞的分泌途径的肤。前肤可W存在于信号 肤与多肤氨基末端之间(参见下文前原肤定义)。
[0042] 前肤:术语"前肤"是W符合阅读框的方式连接(融合)至多肤的氨基末端的氨基 酸序列,其中生成的多肤被称为前体酶(proenzyme)或多肤原(或在一些情况下被称为酶 原(zymogen))。多肤原通常是无活性的并且可W通过催化裂解或自身催化裂解来自多肤原 的前肤而转化为成熟的活性多肤。
[0043] 前原肤:术语"前原肤"在此被定义为存在于多肤的氨基末端的信号肤和前肤,其 中前肤W符合阅读框的方式连接(或融合)至多肤的氨基末端,而信号肤区W符合阅读框 的方式连接(或融合)至前肤区的氨基末端。
[0044] 信号肤编码序列:术语"信号肤编码序列"在此被定义为编码信号肤的多核巧酸。
[0045] 前肤编码序列:术语"前肤编码序列"在此被定义为编码前肤的多核巧酸。
[0046] 前原肤编码序列:术语"前原肤编码序列"在此被定义为编码前原肤的多核巧酸。
[0047] 野生型信号肤:术语"野生型信号肤"表示由天然存在的微生物(如在自然界中发 现的酵母或丝状真菌)表达的信号肤。
[0048] 亲本信号肤:如在此使用的术语"亲本信号肤"意指将要进行修饰(例如,一处或 多处取代、一处或多处插入、一处或多处缺失和/或一处或多处截短)W产生本发明的信号 肤变体的信号肤。该术语还指变体与之进行比较和比对的信号肤。亲本可W是天然存在的 (野生型)信号肤,或者它甚至可W是其通过任何合适手段制备的变体。例如,亲本信号肤 可W是天然存在的信号肤的变体,其氨基酸序列已被修饰或改变。亲本信号肤也可W是等 位基因变体,即由占据相同染色体基因座的多核巧酸序列的两种或更多种可替代形式中的 任一种所编码的信号肤。 W例野生型前原肤:术语"野生型前原肤"表示由天然存在的微生物(如在自然界中发 现的酵母或丝状真菌)表达的前原肤。
[0050] 亲本前原肤:如在此使用的术语"亲本前原肤"意指将要进行修饰(例如,一处或 多处取代、一处或多处插入、一处或多处缺失和/或一处或多处截短)W产生本发明的前原 肤变体的前原肤。该术语还指变体与之进行比较和比对的前原肤。亲本可W是天然存在的 (野生型)前原肤,或者它甚至可W是其通过任何合适手段制备的变体。例如,亲本前原肤 可W是天然存在的前原肤的变体,其氨基酸序列已被修饰或改变。亲本前原肤也可W是等 位基因变体,即由占据相同染色体基因座的多核巧酸序列的两种或更多种可替代形式中的 任一种所编码的前原肤。
[0051] 变体:术语"变体"在此被定义为包含一处或多处(若干处)改变(如在肤或多肤 的一个或多个(若干个)特定位置处包含一个或多个(若干个)特定氨基酸残基的取代、 插入、缺失和/或截短)的肤或多肤。
[0052] 变体信号肤:术语"变体信号肤"在此被定义为亲本信号肤的如下信号肤,其中变 体信号肤包含一处或多处(若干处)改变,如在信号肤的一个或多个(若干个)特定位置 处包含一个或多个(若干个)特定氨基酸残基的取代、插入、缺失和/或截短。
[0053] 变体前原肤:术语"变体前原肤"在此被定义为亲本前原肤的如下前原肤,其中变 体前原肤包含一处或多处(若干处)改变,如在前原肤的一个或多个(若干个)特定位置 处包含一个或多个(若干个)特定氨基酸残基的取代、插入、缺失和/或截短。可操作地连 接:术语"可操作地连接"意指如下的构造,其中,控制序列相对于多核巧酸的编码序列安置 在适当位置,从而使得该控制序列指导该编码序列的表达。
[0054] 序列一致性:两个氨基酸序列之间或两个核巧酸序列之间的关联度通过参数"序 列一致性"来描述。出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开 放软件套件(TheliuropeanMolecularBiologyOpenSoftwareSuite),赖斯巧ice)等 人,2000,遗传学趋势灯rendsGenet.) 16:276-277)(优选5. 0.0版或更新版本)的尼 德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(尼德尔曼 (化edleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol. )48:443-453)来确定 两个氨基酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位延伸罚分0. 5, W及邸L0SUM62度L0SUM62的EMBOSS版本)取代矩阵。尼德尔标注的"最长的一致性"的 输出(使用-非简化选项获得)被用作百分比一致性,并且计算如下:
[0055] (一致的残基X100)/(比对长度-比对中的空位总数)
[0056] 出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件, 赖斯巧ice)等人,2000,见上文)(优选5. 0. 0版或更新版本)的尼德尔程序中所实施的尼 德尔曼-翁施算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,见上文)来确定两个 脱氧核糖核巧酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位延伸罚分 0. 5,W及邸NA即化(NCBINUC4. 4的EMBOSS版本)取代矩阵。尼德尔标注的"最长的一致 性"的输出(使用-非简化选项获得)被用作百分比一致性,并且计算如下: 阳057]( -致的脱氧核糖核酸核巧酸X100) /(比对长度-比对中的空位总数)
[0058] 变体:术语"变体"意指具有酶活性的且相比于其亲本野生型或参照的氨基酸序列 在一个或多个(例如