专利名称:具有改变的特性的变体的利记博彩app
技术领域:
本发明涉及亲代Termamyl样α-淀粉酶的变体(突变体),这些变体具有α淀粉酶的活性,并且在如下几方面的性质中,显示出至少一种与所述亲代α淀粉酶有所不同底物特异性,底物结合性,底物裂解模式,热稳定性,pH/活性特征曲线,pH/稳定性特征曲线,针对氧化的稳定性,Ca2+依赖性,比活性,和溶解度,特别是在生产与应用环境下。
背景技术:
α淀粉酶(α-1,4-葡聚糖-4-葡聚糖水解酶,E.C.3.2.1.1)组成一组催化淀粉和其它直链和支链1,4-糖苷键寡糖和多糖水解的酶。
在现代工业生物技术中,在发酵、纯化、回收过程的中和产物配制中可出现高蛋白浓度。
在发酵过程中,蛋白的浓度取决于所用的宿主细胞。在工业生产过程中,蛋白浓度一般为0.1克/升发酵液以上。而在芽孢杆菌中大量重组生产α-淀粉酶时,蛋白浓度可高达250克/升发酵液。经过纯化,蛋白浓度可以达到大约1000克/升水平。这样的高浓度导致不希望有的沉淀,而使得活性蛋白丢失。增加产物的强度是目前的趋势,这种增加的强度可使酶在更重要的溶液中得以维持。蛋白溶液浓度的升高通常导致蛋白的沉淀,而沉淀的蛋白很难溶解成活性蛋白。
所以,本发明的目标是提供具有以下改变的特性的α-淀粉酶,特别是使其溶解度增加。
发明简述本发明的目的是提供Termamyl样淀粉酶的变体,它们与相应亲代α-淀粉酶即未突变的α淀粉酶相比,具有α-淀粉酶活性,并且相对于亲代α-淀粉酶,显示如下性质中至少一种性质的改变底物特异性,底物结合性,底物裂解模式,热稳定性,pH/活性特征曲线,pH/稳定性特征曲线,针对氧化的稳定性,Ca2+依赖性,比活性和溶解度,特别是在制备条件下的溶解度。
命名法在本说明书和权利要求中,用到了常用的1个字母和3个字母的氨基酸代码。为便于参考,本发明中的α-淀粉酶变体用下面的命名法来描述原氨基酸位置取代的氨基酸依照这种命名法,举例来说,将第30位的丙氨酸取代为天冬酰胺,表示为Ala30Asn或A30N在相同位置缺失丙氨酸表示为Ala30*或A30*插入另外一个氨基酸残基,如赖氨酸,表示为Ala30AlaLys或A30AK一段连续的氨基酸残基的缺失,例如,第30-33位的氨基酸残基被缺失,表示为(30-33)*或Δ(A30-N33)。
当某一α-淀粉酶与其他α-淀粉酶相比有一个“缺失”,并在该位置上又插入了一个氨基酸则表示为*36Asp或*36D即,在第36位插入了天冬氨酸。
多突变被“+”号分隔开,如Ala30Asp+Glu34Ser或A30N+E34S代表第30位的丙氨酸和第34位的谷氨酸分别被天冬酰胺和丝氨酸取代。
当一个或多个可选择的氨基酸残基插入同一给定位点时,表示为A30N,E或A30N或A30E另外,当本文中鉴定出一个适于修饰的位点而没有提示任何特定的修饰时,应理解为任何一个氨基酸残基都可以取代这个位点上现有的氨基酸。例如,当提到在位点30的丙氨酸的修饰,而又没有特别指明进行何种修饰时,应理解为该丙氨酸可以被缺失或被下列任何一个氨基酸所取代R,N,D,A,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V。
进一步的,“A30X”代表下列任何一种取代
A30R,A30N,A30D,A30C,A30Q,A30E,A30G,A30H,A30I,A30L,A30K,A30M,A30F,A30P,A30S,A30T,A30W;A30Y,或A30V;或简写为A30R,N,D,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V。
图1是五种亲代Termamyl样α-淀粉酶氨基酸序列的比对。最左边的数字分别代表如下的氨基酸序列1SEQ ID NO4(SP722)2SEQ ID NO2(SP690)3SEQ ID NO10(BAN)4SEQ ID NO8(BLA)5SEQ ID NO6(BSG)。
图2显示由4个酶分子组成的晶格的格点视图。每个分子都有8个相互作用的区域。
图3显示由4个酶分子组成的晶格的顶视图。
发明详述本发明的目的是提供多肽(如酶,特别是α-淀粉酶),这些多肽相对于所述亲代多肽在如下性质中有至少一种性质改变底物特异性,底物结合性,底物裂解模式,热稳定性,pH/活性特征曲线,pH/稳定性特征曲线,针对氧化的稳定性,Ca2+依赖性,比活性和溶解度,特别是在制备条件下的溶解度。以下有对这些性质的进一步描述。
多肽本发明的多肽包括具有生物活性,抗微生物活性,和酶活性的蛋白质。
涉及的酶活性包括蛋白酶,淀粉酶,CGT酶(CGTase),甘露聚糖酶(mannanase),产麦芽糖淀粉酶(maltogenic amylase),葡萄糖淀粉酶,糖酶(carbohydrase),转移酶,裂解酶,氧化还原酶,脂肪酶的活性。
在一个优选实施方案中,所述酶是一种α-淀粉酶,特别是芽孢杆菌属或曲霉属α-淀粉酶。在一个优选实施方案中,芽孢杆菌属α-淀粉酶是Termamyl样淀粉酶。
具有生物活性的多肽包括红细胞生成素(EPO),TPO,生长激素,调节肽,凝血因子,抗体等。
改变了溶解度的多肽蛋白(多肽)晶体是由系统排列的相同单位在三维结构上紧密堆积而成。晶格可以包含一个或多个蛋白分子和大量的水。在三级结构中也发现有离子例如钙离子,钠离子,氯离子,硫酸根离子和较大的分子如表面活性剂和底物(在晶体生长过程中出现)。虽然单个分子和单个原子很小,但相同单位的重复排列有利于进行X-线衍射,从而为蛋白质工程提供结构信息。
相对于晶体来说,沉淀物与聚集体是较小的单位,并且单个分子比在晶体中时更加无序。然而分子间的某些作用与在非常有序的晶体中所见相同,并因此可用三级结构(三维结构)和分子间信息来设计蛋白质工程改造的、具有改变的特性的α-淀粉酶变体,所述特性特别是沉淀趋势下降,即溶解度增加。
由于蛋白分子为球形和通常有不规则的表面结构,晶格中会出现大孔,这些大孔被更加杂乱的溶剂如水占据。实际上,大多数蛋白质表面都覆盖着水层,这就是为什么通过X光晶体学方法得到的蛋白结构与溶液中的蛋白结构相同的一个原因。蛋白分子只在极少区域直接相互接触,但溶剂介导的接触可以象“胶水”一样把晶体粘在一起。
通常,蛋白的溶解度受有机溶剂,盐类如硫酸铵、氯化钠和氯化钙,和改变分子表面电荷的pH变化的影响。这些因素在将酶维持于溶液中的酶生产以及得到有效晶体的结晶学实验中都有涉及。大的对称晶体需要缓慢增加蛋白质浓度或者改变蛋白表面来加强分子间相互接触而得到。
不是所有的蛋白都结晶为有效于X光晶体学确定方法的形式,但是,如果模板分子与目的分子的同源性足够高,那么根据已有的三级结构,可以建立精确的模型。
当同源多肽(如酶,特别是以下定义的Termamyl样α-淀粉酶)在三级结构基础上相比较时,最主要差异在于分子表面。
尽管如此,本发明人发现,Termamyl样α-淀粉酶(SP722,公开于SEQ IDNO4)表面的(直接或通过水分子间接)参与晶体形成的氨基酸残基,在其它Termamyl样α淀粉酶的晶体形成中(以下描述)也起了关键作用。
以下描述了用另一种Termamyl样α淀粉酶结构(SP722结构,附录1中公开)建立一个Termamyl样α淀粉酶的三级结构模型的实例。
可以理解,本发明的概念与以下描述的建模方法可以推广到所有的多肽,蛋白,特别是酶,如α淀粉酶。
SP722的三级结构以及对另一种Termamyl样α淀粉酶三级结构的建模本发明的α淀粉酶突变体是基于附录1中SP722(SEQ ID NO4)的三级结构发现的,其它多肽的突变体通过其它的三级结构发现。碱性Termamyl样α-淀粉酶的结晶(SP722)(如SEQ ID NO4中显示,也在美国专利5,824,531中有描述)是用悬滴法(本领域已知的方法)得到的,其三级结构(三维结构)见本文附录1。
其晶格包含4个酶分子,每个分子有8个相互作用的区域(图2和图3)。其中两个区域被确定在酶的围绕活性位点的一例,在α-淀粉酶上相对于活性位点的背侧发现了一个大的区域。所述侧还有两个相互作用的区域,分子的顶部和底部各有一个相互作用的侧面,形成“顶”对“底”的相互作用。
可以从图2看出两个环绕活性位点的相互作用区域与一个反向平行的相邻分子上的两个相同区域之间相互作用。同样,背侧区域与第三个反向平行的淀粉酶分子上的背侧区域相接触,但所有这些接触都是由水分子介导。还可以从图2、图3看出相互作用的区域分散在整个分子。
另一碱性Termamyl样α-淀粉酶模型AA560是基于附录1公开的SP722的三级结构建立的。α-淀粉酶AA560与模板淀粉酶(SP722)大约有87%相同,且序列对比排列不含有插入或缺失。在蛋白的生产过程中,即从发酵到纯化的过程中,由于存在高度的同源性(同一性),相同的对称性和相同的晶体间相互作用,蛋白表面相同的相互作用区域参与蛋白浓度增加情况下的晶体形成和沉淀(参见背景章节)。
在这些相互作用区域中构建突变,表达并纯化酶,用“材料与方法”章节中描述的方法,在实施例8和实施例9描述的不同条件下,对蛋白溶解度进行检测。
本发明的发现可以应用于如下Termamyl样α-淀粉酶与SEQ ID NO12所示的Termamyl样α-淀粉酶至少60%相同,优选至少70%相同,更优选80%相同,甚至更优选85%相同,甚至更优选90%相同,甚至95%相同,甚至97%相同,甚至99%相同。这些发现优选适用于碱性Termamyl样α-淀粉酶,特别是那些与SP722(SEQ ID NO4,在图1的序列对比中显示为1号的序列)比较时,在对比的一级结构中没有添加或缺失氨基酸的,长度相同的碱性Termamyl样α-淀粉酶。这些发现尤其可以用于以下碱性Termamyl样α-淀粉酶SP690(SEQ ID NO2),SP722(SEQ ID NO4),AA560(SEQ ID NO12),#707α-淀粉酶(SEQ ID NO13),公开在KSM AP1378中的KSMAPE 1738α-淀粉酶,WO97/11324中公开的α-淀粉酶,或者它们的片段或截短形式。后面提到的这些碱性Termamyl样α淀粉酶在上述相互作用的区域周围有非常类似的晶体三级结构,而且有485个氨基酸长的相同的一级结构。
与此不同的是,例如,Termamyl(图1的对比中序列号为4的序列)与SP722对比排列时,缺少两个氨基酸残基(1位和2位);在174位和181-182位有缺口;在378-381位多了3个氨基酸残基。
BAN(图1的对比中序列号为3的序列)与SP722对比缺少5个氨基酸残基(1-4位和488位);在174位、181-182位有缺口;在378-381位多了3个氨基酸残基。
BSG(图1的对比中序列号为5的序列)与SP722对比缺少1个氨基酸残基(1位);在489-519位多了31个氨基酸残基。
KSM-K36和KSM-K38(EP1,022,334-A)与SP722对比缺少5个氨基酸残基(1位和2位),并在174位、181-182位有缺口。
AA180,AA20和Amrk385(丹麦专利申请PA2000 00347或PCT/DK01/00133)与SP722对比在261位多了一个氨基酸。
以下描述如何根据一种Termamyl样α-淀粉酶建立另一种Termamyl样α-淀粉酶的模型。在实施例4中描述了根据SP722建立AA560的模型。这种方法可以推广用于其它的多肽如以上所提到的多肽。
Termamyl样α-淀粉酶模型的建立WO96/23874提供了Termamyl样α-淀粉酶的三级结构(三维结构)和X光晶体结构数据,所述Termamyl样α-淀粉酶由解淀粉芽孢杆菌α-淀粉酶(BANTM)N末端的300个氨基酸残基和地衣芽孢杆菌α-淀粉酶(SEQ ID NO8)C末端301-483位氨基酸残基组成。WO96/23874进一步描述了,在分析亲代Termamyl样α-淀粉酶的结构的基础上,建立该亲代Termamyl样α-淀粉酶的相对于其亲代特性已改变的变体的模型的方法。
依照WO96/23874可以建立其它Termamyl样结构模型,该文献纳入本文作为参考。
至于获得本发明的变体,如实施例1所述,基于SP722的三级结构(附录1中公开)设计了AA560的三级结构(建模)。其它Termamyl样α-淀粉酶(例如本文公开的)的结构可以用类似的方法建立。
Termamyl样α淀粉酶芽孢杆菌菌株产生的多种α淀粉酶在氨基酸水平上是高度同源(相同)的。多种芽孢杆菌α-淀粉酶的同一性可从以下表1中观察到表1百分比同一性707 AP1378 BAN BSGSP690SP722 AA560 Termamyl707100.086.466.966.5 87.6 86.295.568.1AP1378 86.4 100.067.168.1 95.1 86.686.069.4BAN 66.967.1 100.065.6 67.1 68.866.980.7BSG 66.568.165.6 100.0 67.9 67.166.365.4SP690 87.695.167.167.9100.0 87.287.069.2SP722 86.286.668.867.1 87.2100.086.870.8AA560 95.586.066.966.3 87.0 86.8 100.068.3Termamyl68.169.480.765.4 69.2 70.868.3 100.0例如,地衣芽孢杆菌α淀粉酶包含SEQ ID NO8所示的氨基酸序列(可以TermamylTM商品名购买到),已发现其与包含SEQ ID NO10所示氨基酸序列的解淀粉芽孢杆菌α-淀粉酶有约81%的同源性,与包含SEQ ID NO6所示氨基酸序列的嗜热脂肪芽孢杆菌的α-淀粉酶有约65%的同源性。其它同源的α淀粉酶包括WO95/26397中公开的SP690和SP722,本文中SEQ ID NO2和SEQ ID NO4分别对它们进行了的描述。其它淀粉酶有来源于芽孢杆菌的AA560α-淀粉酶(SEQ ID NO12)和来源于芽孢杆菌的#707α-淀粉酶(显示在SEQ ID NO13),Tsukamoto et al.,Biochemical and Biophysical ResearchCommunications,151(1988),pp.25-31对此有描述。
KSM AP1378α-淀粉酶公开于WO97/00324(来自KAO公司)。另外,EP1,022,334中公开了K38和K38α-淀粉酶,对此本发明也有涉及。
其他同源的α-淀粉酶包括由EP0252666描述的地衣芽孢杆菌菌株(ATCC27811)产生的α-淀粉酶,以及WO91/00353和WO94/18314中所确定的α-淀粉酶。其它商品化的Termamyl样α-淀粉酶包括用以下商品名称出售的产品OptithermTM和TakathermTM(Solvay出品);MaxamylTM(Gist-brocades/Genencor出品),Spezym AATM和SpezymeΔAATM(Genencor出品),还有KeistaseTM(Daiwa出品),PurastarTMST 5000E,PURASTRATMHPAML(Genencor Int.出品)。
由于这些α淀粉酶的结构同源性,所以它们被认为属于同一类α-淀粉酶,即“Termamyl样α-淀粉酶”。
因此,本文术语“Termamyl样α-淀粉酶”意指那些在氨基酸水平上与TermamylTM,即具有本文SEQ ID NO8所示氨基酸序列的地衣芽孢杆菌α-淀粉酶基本相同的α-淀粉酶。
换言之,以下所有具有本文SEQ ID NO2,4,6,8,10,12,和13所示氨基酸序列的α-淀粉酶,被认为是“Termamyl样α-淀粉酶”。其它Termamyl样α-淀粉酶是如下α-淀粉酶i)与上述SEQ ID NO2,4,6,8,10,12,和13所示氨基酸序列中至少一种氨基酸序列有至少60%,如至少70%,例如至少75%,或至少80%,至少85%,至少90%,至少95%,至少97%,至少99%的同源性,和/或ii)由能与编码上述α-淀粉酶的DNA序列(本说明书中SEQ ID NO1,3,5,7,9,它们分别编码本文SEQ ID NO2,4,6,8,10,12所示氨基酸序列)杂交的DNA序列编码。
关于特性i),同源性是两个序列之间提示第一个序列从第二个序列衍生的同一性程度。同源性可通过本领域已知的计算机程序如GCG软件包提供的GAP程序适当确定(如上所述)。这时,Gap GCGv8可以用如下默认参数缺口产生罚分为5.0,缺口延伸罚分为0.3,默认得分矩阵,对核酸序列和蛋白质序列分别为3.0和0.1。GAP用Needleman/Wunsch/Sellers方法进行排列对比。
Termamyl(SEQ ID NO8)和另一种Termamyl样α-淀粉酶的结构对比可以用来确定其它Termamyl样α-淀粉酶中等效的/相应的位置。一种获得所述结构对比的方法是应用GCG软件包的Pile Up程序,采用缺口罚分默认值,即缺口产生罚分用3.0,缺口延伸罚分用0.1。其它结构对比方法包括疏水簇分析(Gaboriaud et al.,(1987),FEBS LETTERS 224,pp.149-155)和反向穿梭(reverse threading)法(Huber,T;Tord,AE,PROTEIN SCIENCE Vol.7,No.1pp.142-149(1998)。
杂交用于鉴定多肽,如具有以上ii)特性的Termamyl样α-淀粉酶的寡核苷酸探针,可以在所述α-淀粉酶的全部或部分核苷酸或氨基酸序列基础上适当制备。
杂交检测的适当条件包括在5×SSC中预浸泡,于~40℃,在含有20%甲酰胺,5×Denhardt溶液,50mM磷酸钠,pH6.8,和50mg变性的超声波处理的小牛胸腺DNA的溶液中预杂交1小时,然后于~40℃,在补充有100mM ATP的上述相同溶液中杂交18小时,再于40℃,用2×SSC,0.2% SDS洗滤膜三次,每次30分钟(低严紧度),优选在50℃(中等严紧度),更优选在65℃(高严紧度),甚至更优选在约75℃(极高严紧度)进行洗涤。杂交方法的更多细节描述于Sambrook等,Molecular_CloningA Laboratory Manual,第二版Cold SpringHarbor,1989。
本文中,“衍生”一词不仅指所述菌株产生或可诱导产生的α-淀粉酶,还指由分离自这种菌株的DNA序列编码的α-淀粉酶和在所述DNA序列转化的宿主生物中产生的α-淀粉酶。该术语还指由合成的和/或cDNA来源的DNA序列编码的α-淀粉酶,其有所述α淀粉酶的可鉴别的特征。该术语也指亲代α-淀粉酶的天然产生的变体,即天然产生的α-淀粉酶经一个或多个氨基酸残基的修饰(插入,取代,缺失)后产生的变体。
亲代Termamyl样α-淀粉酶根据本发明,如上所述的所有Termamyl样α-淀粉酶,都可以作为亲代(即,骨架(backbone))α-淀粉酶。在本发明的优选实施方案中,亲代α-淀粉酶衍生自地衣芽孢杆菌,例如,上述那些α-淀粉酶之一,如具有SEQ ID NO10所示氨基酸序列的地衣芽孢杆菌α-淀粉酶。尤其优选的亲代α-淀粉酶是SP722α-淀粉酶和AA560α-淀粉酶。在一个实施方案中,亲代α-淀粉酶有一个或多个以下突变/取代Δ(R81-G182);Δ(D183-G184);Δ(D183-G184)+N195F;RR181Q+N445Q+K446N;Δ(D183-G184)+R181Q。
亲代杂合体Termamyl样α-淀粉酶亲代α-淀粉酶(即骨架α-淀粉酶)也可以是杂合体α-淀粉酶,即包含来自至少两种α-淀粉酶的部分氨基酸序列之组合的α-淀粉酶。
亲代杂合体α-淀粉酶可以是这样一种α-淀粉酶,在氨基酸序列同源性(同一性)和/或DNA杂交(如以上所确定的)基础上,能确定其属于Termamyl样α-淀粉酶家族。在此情况下,杂合体α-淀粉酶通常由以下部分组成Termamyl样α-淀粉酶的至少一部分和从微生物(细菌或真菌)和/或哺乳动物来源的Termamyl样α-淀粉酶或非Temamyl样α-淀粉酶中选定的一种或多种其它的α-淀粉酶的部分。
所以,亲代杂合体α-淀粉酶可包含来源于至少两种Termamyl样α-淀粉酶,或来源于至少一种Termamyl样和至少一种非Termamyl样细菌α-淀粉酶,或来源于至少一种Termamyl样α-淀粉酶和至少一种真菌α-淀粉酶的部分氨基酸序列的组合。作为部分氨基酸序列的来源的Termamyl样α-淀粉酶,可以是本文所涉及的那些具体Termamyl样α-淀粉酶中的任何一种。
例如,亲代α-淀粉酶可以包含来源于地衣芽孢杆菌菌株α-淀粉酶的C末端部分和来源于解淀粉芽孢杆菌菌株或嗜热脂肪芽孢杆菌菌株α-淀粉酶的N末端部分。例如,亲代α-淀粉酶可包含地衣芽孢杆菌α-淀粉酶的C末端部分至少430个氨基酸,并且可包含a)相当于解淀粉芽孢杆菌具有SEQ ID NO10所示氨基酸序列的α-淀粉酶N末端37个氨基酸残基的氨基酸片段,和相当于地衣芽孢杆菌具有SEQ ID NO8所示氨基酸序列的α-淀粉酶C末端445个氨基酸残基的氨基酸片段,或与该Termamyl序列相同的杂合体Termamyl样α-淀粉酶,即SEQ ID NO8所示地衣芽孢杆菌α-淀粉酶,但其成熟蛋白的N末端35个氨基酸残基,已被BAN(成熟蛋白)即SEQ ID NO10所示的解淀粉芽孢杆菌α-淀粉酶N末端33个残基取代;或b)相当于嗜热脂肪芽胞杆菌具有SEQ ID NO6所示氨基酸序列的α-淀粉酶N末端68个氨基酸残基的氨基酸片段和相当于地衣芽孢杆菌具有SEQ ID NO8所示氨基酸序列的α-淀粉酶C末端415个氨基酸残基的氨基酸片段。
另一种适合的亲代杂合体α-淀粉酶是此前WO96/23874(出自NovoNordisk)中描述的,其由BAN,解淀粉芽孢杆菌α-淀粉酶的N末端(成熟蛋白的1-300位氨基酸)和Termamyl的C末端(成熟蛋白的301-483位氨基酸)构成。
改变的特性以下讨论表现为本发明变体的突变和其所导致的所需特性改变(相对于亲代Termamyl样α-淀粉酶)之间的相互关系。
如上所述,本发明涉及特性改变的,特别是在生产条件下特性改变的Termamyl样α-淀粉酶。
涉及到改变的特性时,尤其涉及的亲代Termamyl样α-淀粉酶是上述提到的亲代Termamyl样α-淀粉酶和亲代杂合体Termamyl样α-淀粉酶。以SP722α-淀粉酶作为起点,但例如Termamyl,BSG,BAN,AA560,SP690,AA180,KSM,AP1378,和#707,K38,和K36的相应位点也应理解为已公开。
在优选实施方案中,本发明的变体的溶解度已经增加,尤其是在洗涤或清洗条件下。
本发明一方面涉及上述具有特性改变的变体。
第一方面,亲代Termamyl样α-淀粉酶的变体在选自下组的一个或多个位点(用SEQ ID NO12的氨基酸编号)包含改变R28,R118,N174;R181,G182,D183,G184,G186,W189,N195,M202,Y298,N299,K302,S303,N306,R310,N314;R320,H324,E345,Y396,R400,W439,R444,N445,K446,Q449,R458,N471,N484,其中(a)所述每一改变是(i)在占据该位点的氨基酸下游插入一个氨基酸,(ii)缺失占据该位点的氨基酸,或(iii)用另一氨基酸取代占据该位点的氨基酸,(b)变体有α淀粉酶活性和(c)每一位点都对应于具有SEQ ID NO12所示AA560氨基酸序列的亲代Termamyl样α-淀粉酶的氨基酸序列位点。
在SP722(SEQ ID NO4)中,这种相应位点是R28;N94;L118;N125;Q174;R181;G182;D183;G184;A186;W189;N195,M202,Y298;N299;N302;S303;N306;A310;N314;K320;H324;Q345;F396,T400,W439,Q444;N445,K446,Q449,K458;N471;K484。
在优选实施方案中,本发明的变体有一个或多个如下突变/取代(用SEQID NO12的编号)ΔG184;Δ(R181-G182);Δ(D183-G184);R28N,K;S94K;R118K;N125A,R,K;N174D;R181Q,E,K;G186R;W189R,K;N195F;M202L;Y298H,F;N299A;K302R;S303Q;N306G,D,R,K;R310A,K,Q,E,H,D,N;N314D;R320K;H324K;E345R,D,K,N;Y396F;R400T,K;W439R;R444K;N445K,Q;K446N;Q449E;R458K;N471E;N484Q。
优选的双重,三重和多重突变(以SEQ ID NO12为编号基础)包括Δ(D183-G184)+R181Q;Δ(D183-G184)+G186R;Δ(D183-G184)+N195F;Δ(D183-G184)+M202L;Δ(D183-G184)+G186R+N195F;Δ(D183-G184)+N195F+R400T;Δ(D183-G184)+N195F+W439R;Δ(D183-G184)+N195F+Q449E;Δ(D183-G184)+N195F+N484Q;Δ(D183-G184)+N195F+K446N;Δ(D183-G184)+N195F+N445Q+K446N+N484E;Δ(D183-G184)+N195F+N445Q+K446N+Q449E;Δ(D183-G184)+N195F+N471E;Δ(D183-G184)+N195F+H324K;Δ(D183-G184)+N195F+Y396F;Δ(D183-G184)+N195F+K446D;Δ(D183-G184)+N195F+R181Q;Δ(D183-G184)+N195F+R181E;Δ(D183-G184)+N195F+N445Q+K446N;N445Q+K446N;N445Q+K446N+N484E;N445Q+K446N+Q449E;Δ(D183-G184)+N195F+R181Q+N445Q+K446N;Δ(D183-G184)+N195F+R181Q+K446N;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N484E;Δ(D183-G184)+N195F+R181E+N445Q+K446N;Δ(D183-G184)+N195F+R181E+K446N;Δ(D183-G184)+N195F+R181E+N445Q+K446N+N484E;
Δ(D183-G184)+N195F+N445Q+K446N+Y243F;Δ(D183-G184)+N195F+N445Q+K446N+V209I;Δ(D183-G184)+N195F+E212R;Δ(D183-G184)+N195F+M116R;Δ(D183-G184)+N195F+K142H+D144H+R158H;Δ(D183-G184)+N195F+K142H+D144H;Δ(D183-G184)+N195F+R158H;Δ(D183-G184)+N195F+E345R;Δ(D183-G184)+N195F+W189R;Δ(D183-G184)+N195F+Y298H;Δ(D183-G184)+N195F+N299A;Δ(D183-G184)+N195F+K302R+S303Q;Δ(D183-G184)+N195F+N306G;Δ(D183-G184)+N195F+Y298H+N299A+K302R+S303Q+N306G;Δ(D183-G184)+N195F+N125A;Δ(D183-G184)+N195F+N125R;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R310A;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R310A+Q311N;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R320K;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+Q319K+R320D;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N306A;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+K302N;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+E345N;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+Y298F;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R28N;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R28N+R310A;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N128D+N306D;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N128D;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N306D;N174D+N314D;Δ(D183-G184)+N195F+N306D+R310H+E345D;
Δ(D183-G184)+R181Q+N195F+W189R+S94K;Δ(D183-G184)+R181Q+W189R+S94K;Δ(D183-G184)+N195F+R181Q+S94K;Δ(D183-G184)+N195F+R181K+N125R;Δ(D183-G184)+N195F+R181K+N125K;Δ(D183-G184)+N195F+R118K+R320K+R458K;Δ(D183-G184)+R181Q+N195F+R118K+R320K+R458K;Δ(D183-G184)+N195F+R181Q+N306G;Δ(D183-G184)+N195F+R181Q+W189R;Δ(D183-G184)+R181Q+N195F+R118K+N125K+R444K+N445KΔ(D183-G184)+R181Q+N195F+R118K+N125K+R320K+R458K;Δ(D183-G184)+R181Q+N195F+R118K+N125R+R320K+R458K;Δ(D183-G184)+R181Q+N195F+S94K+R118K+R320K+R458K;Δ(D183-G184)+R181Q+N195F+R118K+N306R+R320K+R458K;Δ(D183-G184)+N195F+R118K+R320K+R458K+R444K+N445K;Δ(D183-G184)+N195F+S94K+R118K+N306R+R320K+R458K;考虑的变体包括在实施例中提到的具体变体和上述突变与一种或多种如下突变/取代的进一步组合Δ(D183-G184);N195F;R181Q;G186R;M202L;V206F,L,M;N193S,T,P。
增加的溶解度当把所有上述突变如下所述用于一组Termamyl样α-淀粉酶中的任何一种α-淀粉酶,都会导致产生溶解度改变的Termamyl样α-淀粉酶变体。
所以,在优选实施方案中,本发明的变体是亲代Termamyl样α-淀粉酶的变体,其与亲代Termamyl样α-淀粉酶相比,溶解度已提高(如上定义),并包含选自下组的一个或多个位点的改变(用SEQ ID NO12进行氨基酸编号)R28,R118,N174,R181,G182,D183,G184,G186,W189,N195,M202,Y298,N299,K302,S303,N306,R310,N314,R320,H324,E345,Y396,R400,W439,R444,N445,K446,Q449,R458,N471,N484,其中
(a)所述每一改变是(i)在占据该位点的氨基酸下游插入一个氨基酸,(ii)缺失占据该位点的氨基酸,或(iii)用另一氨基酸取代占据该位点的氨基酸,(b)变体有α淀粉酶活性和(c)每一位点都对应于具有SEQ ID NO12所示AA560氨基酸序列的亲代Termamyl样α-淀粉酶的氨基酸序列位点。
在优选实施方案中,本发明中溶解度增加的变体与亲代α-淀粉酶相比具有一种或多种如下取代ΔG184;Δ(R181-G182);Δ(D183-G184);R28N,K;S94K;R118K;N125A,R,K;N174D;R181Q,E,K;G186R;W189R,K;N195F;M202L;Y298H,F;N299A;K302R;S303Q;N306G,D,R,K;R310A,K,Q,E,H,D,N;N314D;R320K;H324K;E345R,D,K,N;Y396F;R400T,K;W439R;R444K;N445K,Q;K446N;Q449E;R458K;N471E;N484Q。
在更优选实施方案中,本发明溶解度增加的变体(由“材料与方法”部分描述的方法之一确定)包括(以SEQ ID NO12为基础编号)Δ(D183-G184)+R181Q;Δ(D183-G184)+G186R;Δ(D183-G184)+N195F;Δ(D183-G184)+M202L;Δ(D183-G184)+G186R+N195F;Δ(D183-G184)+N195F+R400T;Δ(D183-G184)+N195F+W439R;Δ(D183-G184)+N195F+Q449E;Δ(D183-G184)+N195F+N484Q;Δ(D183-G184)+N195F+K446N;Δ(D183-G184)+N195F+N445Q+K446N+N484E;Δ(D183-G184)+N195F+N445Q+K446N+Q449E;Δ(D183-G184)+N195F+N471E;Δ(D183-G184)+N195F+H324K;Δ(D183-G184)+N195F+Y396F;
Δ(D183-G184)+N195F+K446D;Δ(D183-G184)+N195F+R181Q;Δ(D183-G184)+N195F+R181E;Δ(D183-G184)+N195F+N445Q+K446N;N445Q+K446N;N445Q+K446N+N484E;N445Q+K446N+Q449E;Δ(D183-G184)+N195F+R181Q+N445Q+K446N;Δ(D183-G184)+N195F+R181Q+K446N;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N484E;Δ(D183-G184)+N195F+R181E+N445Q+K446N;Δ(D183-G184)+N195F+R181E+K446N;Δ(D183-G184)+N195F+R181E+N445Q+K446N+N484E;Δ(D183-G184)+N195F+N445Q+K446N+Y243F;Δ(D183-G184)+N195F+N445Q+K446N+V209I;Δ(D183-G184)+N195F+E212R;Δ(D183-G184)+N195F+M116R;Δ(D183-G184)+N195F+K142H+D144H+R158H;Δ(D183-G184)+N195F+K142H+D144H;Δ(D183-G184)+N195F+R158H;Δ(D183-G184)+N195F+E345R;Δ(D183-G184)+N195F+W189R;Δ(D183-G184)+N195F+Y298H;Δ(D183-G184)+N195F+N299A;Δ(D183-G184)+N195F+K302R+S303Q;Δ(D183-G184)+N195F+N306G;Δ(D183-G184)+N195F+Y298H+N299A+K302R+S303Q+N306G;Δ(D183-G184)+N195F+N125A;Δ(D183-G184)+N195F+N125R;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R310A;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R310A+Q311N;
Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R320K;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+Q319K+R320D;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N306A;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+K302N;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+E345N;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+Y298F;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R28N;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+R28N+R310A;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N128D+N306D;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N128D;Δ(D183-G184)+N195F+R181Q+N445Q+K446N+N306D;N174D+N314D;Δ(D183-G184)+N195F+N306D+R310H+E345D;Δ(D183-G184)+R181Q+N195F+W189R+S94K;Δ(D183-G184)+R181Q+W189R+S94K;Δ(D183-G184)+N195F+R181Q+S94K;Δ(D183-G184)+N195F+R181K+N125R;Δ(D183-G184)+N195F+R181K+N125K;Δ(D183-G184)+N195F+R118K+R320K+R458K;Δ(D183-G184)+R181Q+N195F+R118K+R320K+R458K;Δ(D183-G184)+N195F+R181Q+N306G;Δ(D183-G184)+N195F+R181Q+W189R;Δ(D183-G184)+R181Q+N195F+R118K+N125K+R444K+N445KΔ(D183-G184)+R181Q+N195F+R118K+N125K+R320K+R458K;Δ(D183-G184)+R181Q+N195F+R118K+N125R+R320K+R458K;Δ(D183-G184)+R181Q+N195F+S94K+R118K+R320K+R458K;Δ(D183-G184)+R181Q+N195F+R118K+N306R+R320K+R458K;Δ(D183-G184)+N195F+R118K+R320K+R458K+R444K+N445K;Δ(D183-G184)+N195F+S94K+R118K+N306R+R320K+R458K;本发明的其它组合包括实施例中提到的具体组合和一种或多种如下取代N195F;R181Q;G186R;M202L;V206F,L,M;N193P。
稳定性在本发明的上下文中,那些获得改变的稳定性,尤其是在特别高的pH值(即pH8-10.5)条件下,获得改进的稳定性(提高或降低)的重要突变(包括氨基酸取代和缺失),包括“改变的特性”部分所列举的任何一种突变。
Ca2+稳定性改变的Ca2+稳定性是指酶在Ca2+损耗的条件下稳定性已得到改进,即,提高或降低了稳定性。在本发明的上下文中,那些获得改变的Ca2+稳定性,尤其是在特别高的pH值(即pH8-10.5)条件下,获得改进的Ca2+稳定性(提高或降低的稳定性)的重要突变(包括氨基酸取代和缺失),包括“改变的特性”部分所列举的任何一种突变。
比活性本发明另一方面,与获得比活性改变,尤其在10-60℃温度下,优选20-50℃,尤其30-40℃温度下增强或降低比活性的变体有关的重要突变(包括氨基酸取代和缺失),包括“改变的特性”部分所列举的任何突变。
本发明变体的一般突变那些能够增加酶活性位点周围流动性(mobiliy)的突变(包括氨基酸的取代与缺失)是特别令人关注的。这可以通过破坏活性位点附近(即在优选距离构成活性位点的任何氨基酸残基10,或8,或6,或4的范围内)的稳定作用而实现。
以下是降低侧链大小的突变实例Ala突变为GlyVal突变为Ala或GlyIle突变为Leu,Val,Ala或GlyThr突变为Ser期望通过这些突变使活性位点区的柔性增加,这可用引入空腔或通过填充突变留下的空间的结构重排来实现。
本发明的变体优选除上述突变外还包含一种或多种修饰。因此,α-淀粉酶变体部分存在的一个或多个脯氨酸残基被非脯氨酸残基取代可能是有利的,所述非脯氨酸残基可以是任何可能的天然产生的非脯氨酸残基,优选是丙氨酸、甘氨酸、丝氨酸、苏氨酸、缬氨酸或亮氨酸。
同样,亲代α-淀粉酶中一个或多个半胱氨酸残基被非半胱氨酸残基,如,丝氨酸、丙氨酸、苏氨酸、甘氨酸、缬氨酸或亮氨酸取代可能是优选的。
此外,本发明的变体或者只经历一种修饰,或者以任何上述修饰的组合方式被修饰,以使对应于SEQ ID NO10的185-209位氨基酸的氨基酸片段中存在的天冬氨酸和/或谷氨酸,各自被天冬酰胺和/或谷氨酰胺取代。在这些Termamyl样α-淀粉酶中,对应于SEQ ID NO10序列185-209位氨基酸片段的氨基酸片段中存在的一个或多个赖氨酸残基被精氨酸取代,也是人们所关注的。
可以理解,本发明包含引入二种或多种上述修饰的变体。
此外,在如下一个或多个位点引入突变可能是有利的(用SEQ ID NO10(TermamylTM)来编号)M15,V128,A111,H133,W138,T149,M197,N188,A209,A210,H405,T412,尤其是如下单个,双重,三重或多重突变M15X,特别是M15T,L;V128X,特别是V128E;H133X,特别是H133Y;N188X,特别是N188S,T,P;M197X,特别是M197T,L;A209X,特别是A209V;M197T/W138F;M197T/W138Y;M15T/H133Y/N188S;M15/V128E/H133Y/N188S;E119C/S130C;D124C/R127C;H133Y/T149I;G475R,H133Y/S187D;H133Y/A209V;在AA560中所述修饰对应于L17X,特别是L17T;E130X;Y135X;W140X,特别是W140F,Y;T193X;特别是S,P;M202X,特别是M202T,L;V214X;涉及的突变组合包括
M202T/W140F;M202T/W140Y;L17T/T193S;L17T/N193P;E121C/S132C;N126C/Q129C;T151I;G480R。
制备本发明α-淀粉酶变体的方法将突变引入基因的多种方法为本领域所知。在简短讨论如何克隆α-淀粉酶编码DNA序列后,以下讨论在α-淀粉酶编码序列的特定位点产生突变的方法。
克隆编码α-淀粉酶的DNA序列编码亲代α-淀粉酶的DNA序列可以用本领域熟知的多种方法,从任何产生所需α-淀粉酶的细胞或微生物中分离出来。首先,从具有目的α-淀粉酶的生物中获得染色体DNA和/或信使RNA,建立基因组DNA和/或cDNA文库。然后,如果α-淀粉酶的氨基酸序列是已知的,可合成同源的经标记的寡核苷酸探针,用于从所述生物中制备的基因组文库中鉴定α-淀粉酶编码克隆。或者,包含已知α-淀粉酶基因同源序列的标记寡核苷酸探针用作探针,在较低严紧度的杂交和洗涤条件下,鉴定α-淀粉酶编码克隆。
鉴定α-淀粉酶编码克隆的另一种方法是将基因组DNA插入到表达载体,如质粒,用所得基因组DNA文库转化的α-淀粉酶阴性菌,然后,在含有α-淀粉酶底物的琼脂培养基上涂板培养,以获得能表达所要鉴定的α-淀粉酶的克隆。
另外,编码酶的DNA序列还可以用已建立的标准方法,例如,亚磷酰胺法(如S.L.Beaucage和M.H.Caruthers,Tetrahedron Letters22,1981,pp.1859-1869所述)或Matthes等描述的方法(Matthes et a1.,The EMBO J.3,1984,pp.801-805)得到。在亚磷酰胺法中,寡聚核苷酸是例如用DNA自动合成仪合成的,对其进行纯化,退火,连接,并克隆到合适的载体。
最后,DNA序列可以是采用标准技术制得的、基因组序列与合成的序列,合成的序列与cDNA来源的序列,或基因组序列与cDNA来源的序列的混合(适当地,这些片段对应于整个DNA序列的各部分)。DNA序列还可以用特定引物通过聚合酶链反应(PCR)得到,如US4,683,202或R.K.Saiki et al.,Science239,1988,pp.487-491所述。
α-淀粉酶变体的表达根据本发明,可使用表达载体,以酶的形式表达通过上述方法,或通过本领域已知的任何其它方法产生的编码变体的DNA序列,所述表达载体一般包括编码启动子,操纵子,核糖体结合位点,翻译起始信号的控制序列,并任选包括阻抑基因或多种激活基因。
携有编码本发明α-淀粉酶变体的DNA序列的重组表达载体可以是能对其方便地进行重组DNA操作的任何载体,载体的选择经常取决于导入该载体的宿主细胞。因此,载体可以是自我复制的载体,即作为染色体外实体存在的载体,所述载体的复制独立于染色体的复制,所述载体包括例如质粒,噬菌体或染色体外元件,微型染色体或人工染色体。或者,载体可以是当导入宿主细胞时可以整合至宿主细胞基因组,并与整合了该载体的染色体一起复制的载体。
在载体中,DNA序列应该与适当的启动子序列可操作相连。启动子可以是在选定宿主细胞中显示出转录活性的任何DNA序列,启动子可以得自编码与宿主细胞同源或异源之蛋白质的基因。介导编码本发明α-淀粉酶变体之DNA序列转录,尤其是在细菌宿主中的转录的适当启动子的例子是大肠杆菌lac操纵子的启动子,天蓝色链霉菌琼脂酶基因dagA启动子,地衣芽孢杆菌α-淀粉酶基因(amyL)启动子,嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)启动子,解淀粉芽孢杆菌α-淀粉酶(amyQ)启动子,枯草芽孢杆菌xylA和xylB基因的启动子等。为了在真菌宿主中转录,有用的启动子的例子是得自编码下列酶的基因的启动子米曲霉TAKA淀粉酶,米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶,黑曲霉中性α-淀粉酶,黑曲霉酸稳定的α-淀粉酶,黑曲霉葡糖淀粉酶,米赫根毛霉脂肪酶,米曲霉碱性蛋白酶,米曲霉丙糖磷酸异构酶或构巢曲霉乙酰胺酶。
本发明的表达载体还含有适当的转录终止子,在真核生物中,还含有与编码本发明α-淀粉酶变体的DNA序列可操作相连的聚-腺苷酸化序列。终止和聚腺苷酸化序列可适当地得自与启动子相同的来源。
载体可进一步含有能使载体在所述宿主细胞中复制的DNA序列。所述序列的例子是质粒pUC19,pACYC177,pUB110,pE194,pAMB1和pIJ702的复制起点。
载体也可含有选择标记,例如其产物可以补偿宿主细胞缺陷的基因,如枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或能赋予抗生素抗性的基因,所述抗生素抗性如氨苄青霉素,卡那霉素,氯霉素或四环素抗性。另外,载体可含有曲霉属选择标记,如amdS,argB,niaD和sC,产生潮霉素抗性的标记,或者可通过WO91/17243中所述的共-转化来完成选择。
尽管细胞内表达在某些方面(例如当使用某些细菌作为宿主细胞时)有利,但一般优选在细胞外进行表达。通常,本文所述的芽孢杆菌α-淀粉酶含有允许表达的蛋白酶分泌至培养基的前区(preregion)。必要时,该前区可被不同的前区或信号序列取代,通过取代编码各个前区的DNA序列可以方便地实现此目的。
分别连接编码α-淀粉酶变体的本发明DNA构建体,启动子,终止子和其它元件,并将它们插入含有复制所需信息的适当载体的方法是本领域技术人员众所周知的(参见例如Sambrook等,分子克隆实验室手册,第2版,冷泉港,1989)。
含有上文所定义的本发明DNA构建体或表达载体的本发明细胞可以有利地用作宿主细胞,以重组产生本发明的α-淀粉酶变体。可以方便地通过将编码变体的本发明DNA构建体(一个或多个拷贝)整合至宿主染色体,用所述DNA构建体转化细胞。一般认为整合是有利的,因为整合后DNA序列可以在细胞中更加稳定地维持。根据常规方法,例如通过同源或异源重组可以将DNA构建体整合至宿主染色体。或者,可用与不同类型的宿主细胞有关的上述表达载体转化细胞。
本发明的细胞可以是高等生物,如哺乳动物或昆虫的细胞,但优选其为微生物细胞,例如细菌或真菌(包括酵母)细胞。
适合的细菌为革兰氏阳性菌,如枯草芽孢杆菌,地衣芽孢杆菌,迟缓芽孢杆菌,短芽孢杆菌,嗜热脂肪芽孢杆菌,嗜碱芽孢杆菌(B.alkalophilus),解淀粉芽孢杆菌,凝结芽孢杆菌,环状芽孢杆菌,灿烂芽孢杆菌,巨大芽孢杆菌,苏云金芽孢杆菌,浅青紫链霉菌或鼠灰链霉菌,或革兰氏阴性菌如大肠杆菌。细菌的转化可以通过,例如原生质转化或通过已知的方式用感受态细胞实现。
酵母生物可优选糖酵母属或裂殖酵母属,例如酿酒酵母。丝状真菌优选属于曲霉属,例如,米曲霉或黑曲霉。真菌细胞可用一种方法转化,该方法涉及原生质形成、原生质转化、然后细胞壁以其本身已知的方式再生。曲霉属宿主细胞转化的适合方法如EP 238 023所述。
在另一方面,本发明涉及生产本发明α-淀粉酶变体的方法,该方法包含在有利于变体生产的条件下培养如上所述宿主细胞以及从细胞和/或培养液中回收变体。
用于培养细胞的培养基可以是适于培养所述宿主细胞,并表达本发明α-淀粉酶变体的任何常规培养基。适当的培养基可以商购,或者可根据公开的配方(例如美国典型培养物保藏中心目录中所述的配方)生产。
通过众所周知的方法,包括通过离心或过滤将培养基与细胞分开,利用盐如硫酸铵沉淀培养基中的蛋白质成分,接着利用层析法,如离子交换层析,亲和层析等,从培养基中方便地回收宿主细胞分泌的α-淀粉酶变体。
工业化应用本发明的α淀粉酶变体有许多在工业应用中有价值的特性。具体地,本发明的酶变体可以作为洗涤,清洗餐具,洗涤硬表面的洗涤剂组合物的成分。本发明的具有改变的特性的变体还可用于淀粉加工,特别是淀粉转化,特别是淀粉的液化等过程(参见,例如US3,912,590,EP专利
发明者卡斯藤·安德森, 托本·V·博彻特, 比贾尼·R·尼尔森 申请人:诺维信公司