肽酰精氨酸脱亚胺酶及其在生产瓜氨酸化的蛋白和肽中的用途的利记博彩app

文档序号:438652阅读:466来源:国知局

专利名称::肽酰精氨酸脱亚胺酶及其在生产瓜氨酸化的蛋白和肽中的用途的利记博彩app肽酰精氨酸脱亚胺酶及其在生产瓜氨酸化的蛋白和肽中的用途发明领域本发明涉及包含瓜氨酸残基的蛋白和肽。
背景技术
:精氨酸是条件必要氨基酸,其在哺乳动物中具有关键作用。精氨酸的代谢途径已被很好地描述过。在其膳食摄取(intake)中,精氨酸从肝门静脉被肝吸收,并通过精氨酸酶迅速转化为鸟氨酸。在后一过程中,形成尿素。从精氨酸产生的鸟氨酸然后转化为瓜氨酸,或者可被代谢为谷氨酸盐/酯和丙氨酸。或者,形成的鸟氨酸掺入多胺化合物,例如,腐胺。没有代谢为鸟氨酸的膳食精氨酸可被加工为例如氧化一氮或精氨酰-tRNA,用于蛋白合成的目的。此外,存在通向精氨酸的内源合成途径。后一过程主要在肾脏中发生,其中从鸟氨酸和瓜氨酸前体合成精氨酸。瓜氨酸是天然氨基酸,已有描述其在葫芦科果实(例如西瓜、南瓜和黄瓜)中作为游离氨基酸存在。游离氨基酸的其它来源是李子汁、一些葡萄品种以及在经发酵食品(例如酱油和葡萄酒)中。在自然界中,瓜氨酸很少与其它氨基酸相连。在可食用蘑菇中显示有二肽焦谷氨酸盐/酯-瓜氨酸,在爱尔兰藓(Irishmoss)中显示有二肽瓜氨酸-精氨酸。使用免疫化学技术显示,在哺乳动物中有低水平的掺有瓜氨酸的肽或蛋白。在哺乳动物中,瓜氨酸是在肠中从谷氨酰胺合成的,其被释放进血液,再在肾脏中转化回精氨酸。在健康成年个体中,通过肾脏转化的瓜氨酸足以提供身体全部的精氨酸需求。但是,在新生个体中,肾脏中的这种瓜氨酸到精氨酸的反应是不足够的,还涉及其它机制。近来的研究正阐明了瓜氨酸在多种生理学过程中作为精氨酸替代物的重要作用。因为肝对膳食精氨酸的捕获是很高效的,因此肝下游的血液中精氨酸的浓度相对较低。所以,例如在快速生长期间,作为营养不良或氨基酸代谢改变的结果,或者应答于外伤或病理攻击(insults),产生如下条件,其中,在所有器官中对精氨酸的序列可能都没有完全达到。在此类情况下,瓜氨酸可作为精氨酸的替代物发挥作用。与膳食精氨酸相反,膳食瓜氨酸不被肝从门静脉血收取。因此,瓜氨酸代表着外周组织(包括肌肉)可获得的自由循环的精氨酸的来源的更为高效的替代物(Curlsatal.,AminoAcids(2005)29:177-205)。膳食瓜氨酸还不会导致肝中的尿素形成,而对于将精氨酸转化为鸟氨酸的精氨酸酶反应有这种情况。因此,补充性精氨酸的负面副作用,例如,尿素形成导致的肾脏损伤以及免疫状态减少可被摄入瓜氨酸所避免。瓜氨酸的另一优点在于其可诱捕过量的氨,即,其可作为所谓的降血氨剂发挥作用,为遭受某些酶功能障碍的患者提供好处,为遭受癫痫的个体提供好处,以及为健康个体提供好处,以预防长期的高强度肌肉努力导致的疲劳。在很多国家,法律规定不能向食物中添加游离氨基酸。因此,游离氨基酸仅可用于临床营养品,使得上面提到的补充性精氨酸或瓜氨酸的生理学好处不能被大量的消费者获得。此外,游离精氨酸的味道非常苦,这是临床和非临床应用的重要缺点。严重病患很容易避免具有坏味道的食物或补充剂,没有医药需求的消费者(例如老年人或运动人群)也同样如是。因此,在食物中使用游离氨基酸预期将导致严重的口味问题,如果考虑到推荐的氨基酸剂量的话这必然如此。这些结论暗示有对不以游离氨基酸的形式存在并且具有改善的口味的瓜氨酸的明确需要。
发明内容本发明涉及经修饰的蛋白、肽或蛋白水解产物,其中,原本存在于所述蛋白、肽或蛋白水解产物中的精氨酸残基的至少15%,优选至少30%,更优选至少45%,还更优选至少60%,最优选至少80%转化为瓜氨酸残基。因此,本发明的蛋白、肽或蛋白水解产物的瓜氨酸与精氨酸(存在于所述蛋白、肽或蛋白水解产物中的)的摩尔比优选为至少0.15,优选至少0.30,更优选至少0.5,还更优选至少1.0,进一步还更优选至少2.0以及最优选至少4。在水解产物的情况下,作为游离氨基酸存在的精氨酸的量6不用于测定瓜氨酸的形成,也不会在瓜氨酸与精氨酸的比例中考虑。因此,本发明涉及具有高比例的结合的瓜氨酸残基的蛋白、肽或蛋白水解产物。"结合的瓜氨酸"或"肽结合的瓜氨酸"表示这样的瓜氨酸残基,其是肽或蛋白的一部分,这与作为游离氨基酸的游离瓜氨酸不同。此外,本发明涉及酶促生产下述蛋白、肽或蛋白水解产物的方法,其中,原本存在于所述蛋白、肽或蛋白水解产物中的精氨酸残基的至少15%,优选至少30%,更优选至少45%,还更优选至少60%,最优选至少80%转化为瓜氨酸残基。为获得本发明的蛋白、肽或蛋白水解产物,将起始的蛋白、肽和蛋白水解产物与蛋白精氨酸脱亚胺酶一起孵育。此外,本发明的一个目的是提供这样的蛋白、蛋白水解产物、肽或肽的混合物,它们可用作为食物、食物成分、饲料、饲料成分、营养药物(例如膳食补充剂或药品)或者营养药物(例如膳食补充剂或药品)的成分,或者可在对食物、饲料或营养药物(例如膳食补充剂或药品)的生产中用作为成分。根据本发明的另一方面,公开了蛋白精氨酸脱亚胺酶,其由生产宿主在培养基中主动分泌。本发明还涉及此类蛋白精氨酸脱亚胺酶的生产和用途。因此,本发明涉及经分离的多肽,其具有蛋白精氨酸脱亚胺酶活性,其选自由下述(a)禾P(b)构成的组(a)具有下述氨基酸序列的多肽,所述氨基酸序列与SEQIDNO:6、8、9、10、13或14的氮基酸1至640具有至少30%的氨基酸序列同一性;(b)被下述多核苷酸编码的多肽,所述多核苷酸能在低严谨条件下与(i)或(ii)杂交(i)SEQIDNO:3的核酸序列或其在超过60个(优选超过100个)核苷酸上至少80%或90%相同,更优选在超过200个核苷酸上至少90%相同的片段,或(ii)与SEQIDNO:3的核酸序列互补的核酸序列。发明详述瓜氨酸作为氨基酸并不被DNA所编码,其在蛋白合成期间并不被构建进蛋白。然而,使用免疫化学技术,己在若干种哺乳动物组织中检测到了少量的肽结合的瓜氨酸。例子是滑膜液、滑膜组织、造血细胞和活化的巨噬细胞。含有瓜氨酸残基的蛋白在对肽结合的精氨酸残基所谓的翻译后修饰中产生。这种特殊的修饰是被称为蛋白或肽酰精氨酸脱亚胺酶(EC3.5.3.15)的酶家族催化的,所述酶在被称为瓜氨酸化或脱亚胺化的过程中将肽或蛋白结合的精氨酸转化为肽或蛋白结合的瓜氨酸。术语蛋白精氨酸脱亚胺酶和肽酰精氨酸脱亚胺酶在本文中可互换使用。在从精氨酸到瓜氨酸的反应中,精氨酸侧链的末端氮原子之一被氧替换。该反应使用一个水分子,并且产生氨作为副产物(http:〃en.wikipedia.org/wiki/Citrullinatio2)。虽然精氨酸在中性pH下带正电荷,但瓜氨酸是不带电荷的。因此,瓜氨酸化增加了肽或蛋白的疏水性,这是能改变蛋白或肽的性质以及可能最终导致蛋白解折叠的过程。已知含有瓜氨酸残基的哺乳动物蛋白包括髓磷脂碱性蛋白(MBP)、丝聚蛋白(filaggrin)和若干种组氨酸蛋白,但其它蛋白,例如纤维蛋白和波形蛋白也可在细胞死亡和组织炎症期间被瓜氨酸化。应当注意,蛋白的瓜氨酸化与游离氨基酸瓜氨酸作为尿素循环的部分或者作为氧化一氮合酶家族的酶的副产物形成是不同的。与含有精氨酸的蛋白或肽不同,瓜氨酸化的蛋白或肽并不能以工业规模通过商业途径获得。令人吃惊地,我们已经鉴定出了食品级的并且可工业应用的方法,所述方法包括生产蛋白或肽结合的瓜氨酸。在该方法中,使用蛋白精氨酸脱亚胺酶或肽酰精氨酸脱亚胺酶(下文中称为PAD),它们能将蛋白或肽结合的精氨酸残基转化为蛋白或肽结合的瓜氨酸残基。虽然己知若干种类型的PAD(主要来自哺乳动物组织),但是这些酶都不适合工业应用。通过筛选很多微生物,我们相当出人意料地发现了能将PAD酶主动分泌进发酵培养液的一些微生物。自然界中可发现此类主动分泌的PAD是出人意料的,因为目前描述过的所有哺乳动物类型的PAD都不在培养基中主动分泌。主动分泌在本文中被定义为微生物在生长培养基或培养基中积累多肽的能力。多肽的主动分泌需要来自宿主生物的能量以及来自宿主生物的专门的分泌途径。通常,被主动分泌的多肽含有氨基末端前序列,这也被称为信号序列或信号肽。主动分泌并不一定伴有细胞壁的破裂以将酶转移到发酵培养液。通常,革兰氏阴性细菌已知具有主动分泌。哺乳动物PAD互相之间强烈相关,在多种不同的器官中表达了不同的异型体。事实上,PAD酶活性仅能在细胞裂解之后才能被检测到,这强烈暗示PAD在哺乳动物组织中是细胞内酶(综述见Vossenaaretal(2003)Bioessays25:1106-1118),并且,该酶不被主动分泌。此外,所有的哺乳动物PAD都缺少明显的信号序列,而这正是高效分泌通常所需的。因此看起来在微生物中筛选主动分泌的PAD酶并不合乎逻辑,虽然此类酶具有明显的工业优点。主动分泌对于经济的生产工艺来说极为重要,因为其使得可以以几乎纯的形式回收酶,而不会经历繁琐的纯化工艺。食品级的真菌宿主(例如A^ergf//^)对被主动分泌的PAD的过表达产生了食品级的酶以及通向瓜氨酸化的蛋白或肽的具成本效益的生产工艺。就我们所了解的而言,我们最早描述了被食品级的宿主生物(例如Aspergillus)高效分泌进发酵培养液的PAD,并且最早报道了通向瓜氨酸化的蛋白或肽的具成本效益的生产工艺。精氨酸脱亚胺酶(EC3.5.3.6)是公知的,其在游离精氨酸向游离瓜氨酸的转化中的用途已被广泛描述过。但是,PAD(EC3.5.3.15)构成了相对新的酶家族,所述酶家族可催化蛋白或肽结合的精氨酸残基脱亚胺,以产生蛋白或肽结合的瓜氨酸残基,并且由此释放出氨。目前已经在很多哺乳动物细胞中鉴定出了所述的酶。例如在人类中,已经鉴定了四种不同的PAD酶,它们可被发现于例如皮肤、子宫、肌肉、脑、胰腺、脾、胃、胸腺、脊髓以及造血细胞(例如巨噬细胞)中。这些Ca2+依赖性的PAD酶参与例如表皮的分化,神经轴突的髓鞘形成以及毛囊角质化。没有已知的哺乳动物PAD能被细胞主动分泌。虽然广泛存在于哺乳动物细胞中,但是对于来自微生物的活性PAD的报道非常有限。唯一例外是来自人革兰氏阴性病原体Pw^A;;mmomwg&gz'vafo的细菌酶(McGrawetal.(1999)InfectImmun.67(7):3248-3256)。该酶被转运进周质空间,并仅从该周质空间泄漏到细菌外面。成年发作的牙周炎的起始和进展已与尸o^A;vtcwow(Ug^gz'vafo的牙齿艮沟感染关联起来。i亥PorpA少ramo"osPAD在进化上与脊椎动物的PAD无关,但是它与若干种精氨酸脱亚胺酶共享序列同源性(ShiraietaL(2001)TrendsBiochemSci.;26(8):465-468)。但是该酶能将肽结合的L-精氨酸以及游离的L-精氨酸转化为瓜氨酸,并且与哺乳动物PAD相反,其并不依赖钙离子。因此,该酶不被主动分泌,高度不稳定并且已被描述成毒性因子,因此,这种源于P.gingivalis的酶非常不可能用于食品级的工业应用。因此,来自尸o^/z;;ramw^g/"p'wfo的PAD及其用途并非本发明的一部分。在本文中我们分离并鉴定了来自Fw犯n'wmgra加'we"ram的分泌的PAD,就我们所知的而言,这是第一种被描述的分泌的PAD。基于PAD检验,我们能分离并表征菌株中分泌的PAD的若干种变体。编码来自这些真菌的PAD的基因被分离并被表征(SEQIDNO:3禾口4)。该PAD在真菌j^erg///^m'ger中的过表达导致PAD高效分泌进培养基。所有这些新的变体都含有分泌的PAD的特征。此外,基于该知识,我们能鉴定和正确标注其它微生物中分泌的PAD的基因(其DNA序列存在于公众数据库中)。潜在的分泌的PAD可被发现于真菌C/^etom/wmg/ohowm、P/zaeo5//zaen'awo<ioram禾口细菌^SVeptomycesscaZZ&s禾口6Vre/tomyc^c/avw//gen^中。基于我们对这些蛋白分泌特征的知识,我们提出了SEQIDNO:8至10、13和14所示的正确的蛋白序列。所有这些序列以前都没有被描述为编码分泌的肽酰精氨酸脱亚胺酶,它们仅可被原样鉴定,因为我们知道尸w^n'wmgram/"eanwz的分泌的PAD的基因结构。在对来自不同培养物的真菌进行广泛的筛选后,我们已能将尸^m'腿的物种鉴定为主动分泌进发酵培养液的类PAD酶的来源。这种源于T^rah腦的类PAD酶显示出与哺乳动物PAD的相当高的同源性,但与尸.g&^vafoPAD则没有。通过色谱纯化从尸R^n'wm发酵培养液对PAD的分离揭示了该分泌的PAD的分子量为大约55kDa,活性最优值在大约pH8附近,温度最优在40至50摄氏度之间。虽然i^腦'訓的酶的分子量显著低于哺乳动物酶的分子量,但我们发现pH和温度最优值是相近的。从经济的角度来看,对于以高产量和相对纯的形式生产PAD的改进手段有着明显的需求。实现此的一种优选方法是通过使用重组DNA技术过量生产此类PAD来实现的。实现此的一种特别优选的方法通过过量生产源于F^"n'Mm的PAD来实现,而实现此的一种最优选的方法是通过过量生产源于gram/"em"wm的PAD来实现的。为使得后一生产途径得以实现,源于F^fln^m的肽酰精氨酸脱亚胺酶的独特序列信息是必要的。更优选地,必须获得编码基因的完整核苷酸序列。以高产量和相对纯的形式生产新鉴定出的分泌的PAD的一种改进手段通过使用重组DNA技术过量产生FM^n'Mm的编码酶来实现。实现此的一种优选方法通过在食品级宿主微生物中过量生产此类经分泌的PAD来实现。公知的食品级微生物包括Asperg/仿、7Wc/o&wza、&w/tom_yc"、5ac/肌和酵母(例如&zcc/^ramyces禾QWi^veramyces)。实现此的一种进一步更优选的方法通过在食品级真菌(例如A^wg///M)中过量生产分泌的源于F^zn'謂的PAD来实现。最优选的是在下述食品级真菌中过量生产分泌的PAD,所述真菌中,已经针对所用的食品级表达宿主对PAD编码基因的密码子使用进行了优化。通常,为使得后者优化途径得以实现,分泌的PAD的独特的序列信息是人们想要的。更优选地,必须知道PAD编码基因的完整核苷酸序列。一旦己经可以以高产量和相对纯的形式获得新的酶,就可以以食品级和经济的方式来生产含有瓜氮酸的食物蛋白或此类含瓜氨酸的食物蛋白的水解产物。优选地,此类含瓜氨酸的食物蛋白从含有高百分比的蛋白结合的精氨酸的食物蛋白或此类食物蛋白的水解产物获得。根据本发明的,用于PAD的优选底物蛋白具有至少10:1的精氨酸对瓜氨酸的比例(mol/mol),优选地,此类底物蛋白具有至少100:1的精氨酸对瓜氨酸的比例,最优选地,底物蛋白将根本不含瓜氨酸。根据本发明用于PAD的优选底物蛋白含有3mdV。的蛋白结合的精氨酸,更优选地,它们含有6moP/。的蛋白结合的精氨酸。此类底物蛋白的例子是来自动物来源的可商业获得的食物蛋白,例如(脱脂)奶蛋白、乳清蛋白、酪蛋白或卵蛋白。此类底物蛋白的其它优选例子是来自植物来源的可商业获得的食物蛋白,例如,谷物蛋白、马铃薯蛋白、大豆蛋白、豌豆蛋白、水稻蛋白、豌豆蛋白以及来自已知富含精氨酸的其它植物来源的蛋白(例如,羽扁豆、芝麻、棕榈核等)。谷物蛋白的例子是小麦或玉米或其级分,例如小麦麸质。微生物蛋白的例子是酵母提取物或用于肉类替代品的单细胞蛋白。为弥补这些富含精氨酸的蛋白或肽中特定氨基酸的相对不足,可通过加入选定的游离氨基酸或加入相对富含低于瓜氨酸化材料中所示的氨基酸的蛋白、肽或水解产物,来优化含瓜氨酸的蛋白、肽或水解产物的营养组合物。用于增强含瓜氨酸蛋白、肽或水解产物的营养价值的优选氨基酸是半胱氨酸、组氨酸、异亮氨酸、谷氨酰胺和赖氨酸。或者,含瓜氨酸的蛋白、肽或水解产物可与从相对富含这些氨基酸的蛋白源(例如酪蛋白,马铃薯、小麦或大豆蛋白)的蛋白、肽或水解产物混合。本发明的工艺可特别地用于对酶加以修饰,以产生具有经修饰的特征(例如活性或稳定性)的酶。当使用哺乳动物组织时,该组织优选是非人类组织。使用哺乳动物蛋白时,该蛋白优选不是血蛋白、神经组织、脑、气管、组织或毛发。优选地,根据本发明所使用的底物蛋白是植物蛋白、脱脂(奶)蛋白、乳清蛋白、酪蛋白、明胶蛋白、卵蛋白或微生物蛋白。另一应用将是制造此类含瓜氨酸的食物蛋白的水解产物。可按照本领域已知的方法来产生这些水解产物。或者,可首先对动物或植物来源的蛋白加以水解,以获得蛋白水解产物,随后可将该水解产物与根据本发明的PAD—起孵育。为提供更为浓縮形式的肽结合的瓜氨酸,可以用富含精氨酸的水解产物作为PAD酶的底物。在该手段中,首先通过合适的内切蛋白酶(例如枯草杆菌蛋白酶(EC3.4.21.62)或粘膜胃蛋白酶(EC3.4.23.23)或脯氨酸特异性蛋白酶(EC3.4.21.26))对富含精氨酸的蛋白源(例如,水稻蛋白或豌豆蛋白)进行水解,然后再使用色谱针对含精氨酸的肽对得到的水解产物进行富集。在此类色谱分离技术中,在一定的pH条件下使用正电荷的精氨酸残基。在肽的纯化中使用这些特征的实践背景可在例如ProteinPurificationHandbook(AmershamPharmaciaBiotech,nowadaysGEHealthcareBio-Sciences,Diegem,Belgium发表的)中找到。然后将得到的精氨酸富集的肽与PAD酶一起孵育,以获得根据本发明的包含瓜氨酸的水解产物。在导致获得精氨酸富集的水解产物的另一手段中,首先将富含精氨酸的蛋白源与精氨酸特异性内切蛋白酶胰蛋白酶(EC3.4.21.4)—起孵育。水解之后,孵育的pH被调节为蛋白底物的水溶解度最小的值,从而使得较大的未水解肽沉淀,而较小的富含精氨酸的肽留在溶液中。例如,在中性pH附近,豌豆蛋白的溶解度相当的低。通过将豌豆蛋白的悬浮液与胰蛋白酶在中性pH下一起孵育(为实现最大活性,胰蛋白酶需要中性附近的pH),豌豆蛋白中仅富含精氨酸残基的那些部分将进入溶液,随后通过倾析或过滤步骤将分别在上清液或滤液中产生富含精氨酸的肽。向该上清液或滤液中添加根据本发明的PAD将产生想要的高浓度的含瓜氨酸的肽。本发明涉及新颖的营养药物组合物,其包含本发明的蛋白或蛋白水解产物。营养药物组合物包含蛋白水解产物作为活性成分,用于,例如,预防高血压或用于从营养不良状态或肠道疾病恢复,这包括向需要此类治疗的受试者施用本发明的蛋白、肽或蛋白水解产物。本发明的包含瓜氨酸的蛋白、蛋白水解产物、肽或肽混合物可以以任何合适的形式使用,例如固体产品、半固体产品(糊状)或液体产品(例如饮料)。例如,包含升高的水平的瓜氨酸的产品被用作为膳食补充剂或者用作为食物、饮料、饲料或宠物食品的成分。包含升高的水平的瓜氨酸还可以以个人护理应用(包括以水剂、凝胶或乳液的形式局部应用)的形式使用。在所有这些应用中,蛋白、肽或水解产物可与对于维持正常代谢功能来说必要的但体内并不合成的矿物质、复合维生素制剂(包含维生素,例如维生素A或维生素C)以及与痕量元素(例如锌)一起被共配制。此外,瓜氨酸化的蛋白、肽或水解产物可与特定脂肪酸、特定氨基酸(例如谷氨酰胺)或富集特定氨基酸的蛋白或蛋白水解产物组合。此外还可与多酚类(例如白藜芦醇或EGCG)、糖苷化和去糖苷化的大豆异黄酮、益菌生(prebiotics)或益生菌(probiotics)组合。术语营养药物在本文中使用时指在营养和药物应用领域均有有用性。因此,新颖的营养药物组合物可用作为食物或饮料的补充剂以及用作为药物制剂或用于肠道或非肠道应用的药品,其可以是固体制剂,例如胶囊或片剂,或者是液体制剂,例如溶液或悬浮液。如从前文显而易见的,术语营养药物组合物还包含下述食物和饮料,其包含含本发明的肽的组合物以及任选地,碳水化合物,并且术语营养药物组合物还包含含有前述瓜氨酸化的蛋白、肽或水解产物的补充剂组合物,例如膳食补充剂。术语膳食补充剂在本文中使用时指通过嘴摄入的含有意欲用来补充膳食的"膳食成分"的产品。这些产品中的"膳食成分"可包括维生素、矿物质、草本材料或其它植物材料、氨基酸、酶等物质、器官组织、小腺体和代谢物。膳食补充剂还可以是提取物或浓縮物,其可以在很多形式中找到,例如片剂、胶囊、软胶囊、胶囊锭、液体或粉末。它们还可以是其它形式的,例如,条棒状,但是如果它们是这样的话,膳食补充剂标签上的信息通常不把产品标示为传统食物或标示为餐食或膳食的唯一部分。水解产物、蛋白水解产物或经水解的蛋白表示通过对底物蛋白进行蛋白水解形成的产物。优选地,水解是酶促水解。可溶的水解产物是蛋白水解产物的(水)可溶级分,这在本文中还被描述为含可溶肽的组合物或包含可溶肽的组合物,或蛋白水解产物和可溶水解产物的混合物。"肽"或"寡肽"在本文中被定义为通过肽键相连的至少两个氨基酸的链。术语"肽"和"寡肽"可被认为是同义的(如通常认可的那样),每个术语都根据上下文需要互换使用。"多肽"或"蛋白"在本文中被定义为包含超过30个氨基酸残基的链。本文中所有的(寡)肽和多肽式子或序列都是从左到右按照氨基末端到羧基末端的方向书写的,这符合通常的实践。本文中使用的氨基酸的单字母编码是本领域通常已知的,其可被发现于Sambrook,etal.(MolecularCloning:ALaboratoryManual,2nd,ed.ColdSpringHarborLaboratory,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY,1989)中。在蛋白合成中细胞使用二十种"标准"氨基酸,它们由通常的遗传编码所指代。在本申请中,氨基酸表示这二十种标准氨基酸和瓜氨酸。优选地,经分离的二肽瓜氨酸-精氨酸并非本发明的一部分。但是,包含该二肽的水解产物以及此类水解产物的用途也是本发明的一种实施方式。经分离的二肽瓜氨酸-精氨酸作为用于从营养不良状态或从肠道疾病恢复的活性成分的用途也是本发明的一个目的。其中使用了爱尔兰藓或提取物或从爱尔兰藓获得的其它产物的产品并非本发明的一部分。掺有大量瓜氨酸的蛋白或肽可提供显著的益处。最重要地,它们首次提供了使得肽结合的瓜氨酸可用于非医药应用(例如特定食物、婴儿营养品或用于特定消费者群体的营养补充剂)的可能性。此外,此类蛋白或肽提供了感官益处,因为包含瓜氨酸残基的蛋白和蛋白水解产物不会展现苦味。此外,根据本发明的瓜氨酸作为肽结合的瓜氨酸存在,这与游离瓜氨酸不同,根据一些国家的法律游离瓜氨酸可能是不被接受的。因此,本发明的工艺首次允许了对具有可接受的味道的含瓜氨酸的食物、补充剂以及临床产品的生产。本发明的蛋白或肽的另一重要优点在于,它们可展示出降低的变应原性。所有主要的食物蛋白,例如奶及其酪蛋白和乳清蛋白级分以及植物蛋白级分(从例如大豆分离物、水稻蛋白和小麦麸质获得的)被认为是重要的抗原性化合物。通常,通过将蛋白水解为小于8-10个氨基酸残基的肽来克服蛋白抗原性。但是,通过这种广泛性蛋白水解消化制造的水解产物展现出下述缺点其可能包括苦味、培养基异味以及增加的渗透值。下述事实阐述了蛋白抗原性的经济重要性婴儿和年幼儿童中食物变态反应和哮喘的流行性日益增加。例如,牛奶变态反应影响到3年以下儿童中的~2.5%。牛奶变态反应通常在生命的前几个月以及在引入牛奶一周之内遇到。掺有牛奶蛋白或水解至不同程度的牛奶级分的多种婴儿配方产品涉及牛奶变态反应。我们已经发现,通过将食物蛋白与根据本发明的PAD—起孵育,得到的瓜氨酸化的蛋白或蛋白水解的抗原性或变应原性就会降低。最重要地,该效果的获得并没有伴随与广泛性蛋白水解相关的负面作用,例如,受损的味道或降低了乳化能力。考虑到运动人群、高龄人群和遭受食物变态反应的人群的日益增加的数量,根据本发明的产品将具有很大的经济重要性。对于所有这些目标群体而言,改善的味道是显著生理学重要性的一个方面。迄今为止,以工业规模并且以经济的方式对此类食物或补充剂的生产仍是不可能的。因为目前工业可获得的食物蛋白和/或食物蛋白水解产物没有包括进蛋白或肽结合的瓜氨酸残基,瓜氨酸残基富集的蛋白或蛋白水解产物或肽是新的。术语"富集"意欲表示原本存在于蛋白或蛋白水解产物中的精氨酸残基的至少15%,优选至少30%,更优选至少45%,仍更优选至少60%,最优选至少80°/。被转化为瓜氨酸残基。因此,在本发明的工艺的产品(即,瓜氨酸化的蛋白、瓜氨酸化的蛋白的水解产物或瓜氨酸化的水解产物)中,存在的精氨酸残基的至少15%,优选至少30%,更优选至少45%,仍更优选至少60%,最优选至少80%已被转化为瓜氨酸残基。在本申请的材料和方法章节描述了用于建立存在的精氨酸或瓜氨酸含量的氨基酸分析方法。重要的是要指出,作为氨基酸分析期间典型地用于释放游离氨基酸的酸水解过程的人工产物(artefact),新产生的瓜氨酸残基的一部分被转化为鸟氨酸残基。为计算存在的瓜氨酸残基的量,必须将存在的瓜氨酸和鸟氨酸残基的水平加合起来。为获得含瓜氨酸的蛋白水解产物,可对含瓜氨酸的蛋白进行酶促水解。或者,可以将现有的蛋白水解产物(即,不包含肽结合的瓜氨酸的水解产物)与根据本发明的PAD—起孵育,以获得包含肽结合的瓜氨酸的蛋白水解产物。可使用本领域已知的水解方法来生产蛋白水解产物。优选地,此类水解产物的水解程度(DH)在5至50之间,更优选地,10至35之间。在本申请的材料和方法章节描述了用于建立DH值的方法。根据本发明的包含瓜氨酸的蛋白水解产物可用于婴儿和临床营养品,用于治疗性膳食以及用于消费者膳食和运动营养品。此外,掺有瓜氨酸化蛋白、蛋白水解产物或肽的食物或膳食或临床产品也是新的。此外,包含蛋白或肽结合的瓜氨酸的蛋白或蛋白水解产物可用于多种局部应用,包括个人护理应用,以及可用于动物和宠物的营养产品中。根据本发明的包含瓜氨酸的蛋白、肽或蛋白水解产物可用于很多新颖的、令人吃惊的应用中。基本上,包含瓜氨酸的蛋白、肽或蛋白水解产物可用于所有如下的应用中,所述应用中,游离精氨酸的补充已显示为是有益的。因此,在精氨酸缺陷状态的所有情况下,根据本发明的包含瓜氨酸的蛋白、肽或蛋白水解产物预计将降低这种精氨酸缺陷状态。通常,包含瓜氨酸的蛋白、肽或蛋白水解产物提供了下述好处在从营养不良或从肠道疾病(例如短肠综合征)或从衰老导致的蛋白-能量营养不良恢复的个体中维持蛋白代谢。此外,包含瓜氨酸的蛋白、肽或蛋白水解产物在保持胃肠道健康方面具有重要作用。因为精氨酸和瓜氨酸是用于氧化一氮的产生以及由此的血管舒张的前体,因此这些氨基酸的足够供应对于预防多种血管疾病的风险来说具有重要作用。在科学文献中,这已在外周动脉病、移植冠心病和哮喘中显示。因此,人们对包含瓜氨酸的蛋白、肽或蛋白水解产物作为膳食添加剂以预防这些疾病以及预防压疮(pressureulcer)或用于改善压疮康复的方面有着特别的兴趣。此外,根据本发明的蛋白、肽和蛋白水解产物还特别适用于用于例如动脉硬化、心绞痛、高血压、冠心病、II型糖尿病的治疗方案,以减少胰岛素和葡萄糖浓酥,以及用于治疗HIV感染、烧伤、外伤和癌症。包含瓜氨酸的蛋白、肽或蛋白水解产物用于治疗少肌症(sarcopenia)的用途特别值得一提。此外,包含瓜氨酸的蛋白、肽或蛋白水解产物在术前膳食中用于改善免疫状态(尤其是在胁迫条件下)以及用于减轻患者的微循环低灌注的用途。因为败血症是高死亡率的健康问题,掺有包含瓜氨酸的蛋白、肽或蛋白水解产物的膳食在预防败血症中的有益作用也是重要的。因为其降血氨作用,包含瓜氨酸的蛋白、肽或蛋白水解产物还可用于尿素循环被扰乱的情况中,例如,用于遭受遗传性酶缺陷的患者中,或者用于降低遭受肾衰竭的人肾脏脉络(glonmlar)功能的压力。根据本发明的蛋白、肽和蛋白水解产物还可用于供给给没有医药需求的消费者的产品中,所述消费者例如是运动员或运动人群。特别地,因为瓜氨酸预计能通过刺激eNOSNO生产来提高血流,因此预期,可通过改进肌肉血流来提高锻炼成绩。更近来收集到一些证据表明,对NO合成的抑制导致高脂血和脂肪增加。因此,根据本发明的具有肽结合的瓜氨酸的膳食补充可有助于在肥胖人群和动物(例如宠物)中预防和治疗代谢综合征。这一类产品包括强化果汁和运动饮料,以对抗疲劳的感觉,以及增加身体持久性和从长期高强度锻炼恢复。另一重要应用是根据本发明的蛋白、肽和蛋白水解产物在婴儿配方中的用途,例如,用于有变态反应的婴儿,用于发展出变应反应的宝宝和用于没有变态反应的婴儿,其中,瓜氨酸化的蛋白或肽能作用于延迟或预防牛奶敏感。在局部应用中,瓜氨酸化的蛋白或肽令人吃惊地能有效清除羟自由基以及控制和作用于抵抗活性氧种类。此外,根据本发明的活性PAD可用于直接局部应用,以改善表皮角质化,或者抵抗牛皮癣症状。将活性酶应用至皮肤的一种有用方法被描述于US6,117,433中。根据本发明的活性PAD的另一新应用是掺入所有种类的面团中,因为已观察到这能增加获得的烘焙产品的味道和气味。根据本发明的活性PAD还可用于降低经发酵食物和饮料(例如葡萄酒、啤酒和烈酒)中致癌的氨基甲酸乙酯,这通过降低此类经发酵食物和饮料中尿素的量来实现。本发明的具有肽酰精氨酸脱亚胺酶活性的多肽可以是经分离的形式的。如本文所定义的,经分离的多肽是内源产生的,或者是重组多肽,其基本上不含其它非肽酰精氨酸脱亚胺酶多肽,并且典型地,通过SDS-PAGE进行测定时,其至少大约20%纯,优选至少大约40%纯,更优选至少大约60%纯,进一步更优选至少大约80%纯,仍更优选大约90%纯,最优选大约95%纯。可以通过离心或色谱方法或者本领域已知用于从粗制溶液获得纯蛋白的任何其它技术对多肽加以分离。应当理解,多肽可与不干扰多肽的目标目的的载体或稀释剂混合,由此该形式的多肽仍将被认为是经分离的。其通常将包含处于制剂中的多肽,其中,制剂中蛋白(按重量计)超过20%,例如超过30%、40%、50%、80%、90%、95%或99%是本发明的多肽。优选地,本发明的多肽可从具有编码下述酶的基因的微生物获得,所述酶具有肽酰精氨酸脱亚胺酶活性。更优选地,本发明的多肽是从该微生物分泌的。进一步更优选地,所述微生物是真菌,最优是有丝真菌。优选的生物由此是Fw^n'ww属的,例如种尸w^r/ww的那些。在第一种实施方式中,本发明提供了具有下述氨基酸序列的经分离的多肽,所述氨基酸序列与SEQIDNO:6(即,所述多肽)的氨基酸1-640的氨基酸序列同一性程度为至少30%,优选至少40%,优选至少50%,优选至少60%,优选至少70%,更优选至少80%,进一步更优选至少90%,仍更优选至少95%,最优选至少97%,并且所述多肽具有肽酰精氨酸脱亚胺酶活性。就本发明的目的而言,两条或多条氨基酸序列间同一性的程度是通过BLASTP蛋白数据库搜索程序来测定的(Altschuletal.,1997,NucleicAcidsResearch25:3389-3402),其中采用矩阵Blosum62和10的预期阈值。本发明的多肽可包含SEQIDNO:6所示的氨基酸序列或其高度同源的序列,或者这两种序列中任何序列的具有肽酰精氨酸脱亚胺酶活性的片段。通常,SEQIDNO:6示出的天然存在的氨基酸序列是优选的。本发明的多肽还可包含SEQIDNO:6的多肽的天然存在的变体或物种同源体。变体是天然存在于例如真菌、细菌、酵母或植物细胞中的多肽,所述变体具有肽酰精氨酸脱亚胺酶活性以及与SEQIDNO:6的蛋白高度相似的序列。术语"变体"指与SEQIDNO:6的肽酰精氨酸脱亚胺酶具有相同的必要特征或基本生物学功能的多肽,其包括等位变体。优选地,变体多肽具有与SEQIDNO:6的多肽至少相同水平的肽酰精氨酸脱亚胺酶活性。变体包括来自与SEQIDNO:6同一菌株或来自同属或同种的不同菌株的等位变体。SEQIDNO:6的多肽的变体的例子列于SEQIDNO:7中。类似地,本发明蛋白的物种同源体是具有相似序列的等同蛋白,其是肽酰精氨酸脱亚胺酶,并且天然存在于另外的物种中。SEQIDNO:6的多肽的物种同源体的例子列于SEQIDNO:8-10、13和14中。可以使用本文描述的、用于分离SEQIDNO:6的多肽的流程,以及将这些流程用到合适的细胞来源(例如细菌、酵母、真菌或植物细胞)上,来分离变体和物种同源体。还可使用本发明的探针来探测从酵母、细菌、真菌或植物细胞制得的文库,以获得表达SEQIDNO:6的多肽的变体或物种同源体的克隆。可用于分离已知基因的变体和物种同源体的方法在文献中有广泛描述,它们是本领域技术人员己知的。可通过传统技术来操作这些基因,以产生本发明的多肽,其后可通过本身已知的重组或合成技术来对其加以生产。还可对SEQIDNO:6的多肽以及变体和物种同源体的序列加以修饰,以提供本发明的多肽。可以制造氨基酸取代,例如1、2或3至10、20或30个取代。还可制造同样数量的缺失和插入。这些改变可在多肽功能关键区域之外进行,这样经修饰的多肽将保留其肽酰精氨酸脱亚胺酶活性。本发明的多肽包括上述全长多肽及其变体的片段,包括SEQIDNO:6示出的序列的片段。此类片段典型地保留作为肽酰精氨酸脱亚胺酶的活性。片段可以至少50、100或200个氨基酸长,或者可以比SEQIDNO:6所示的全长序列短这个数量的氨基酸。如果需要的话,可通过合成手段来生产本发明的多肽,虽然通常它们都是按照下文所述重组生产的。可对合成的多肽加以修饰,例如通过添加组氨酸残基或T7标签,以协助对其的鉴定或纯化,或者通过添加信号序列以促进它们从细胞的分泌。因此,遍体序列可包含源自其它Fw^hwn的菌株(而非从中分离出SEQIDNO:6的多肽的菌株)的那些。可通过按照本文所述,寻找肽酰精氨酸脱亚胺酶活性以及克隆和测序,来从其它Ft^m'wm菌株鉴定变体。变体可包括蛋白序列中单个氨基酸或氨基酸组的缺失、修饰或添加,只要肽保留有SEQIDNO:6的肽酰精氨酸脱亚胺酶的基础生物学功能性即可。氨基酸取代例如从l、2或从3至10、20或30个取代制得。经修饰的多肽通常将保留作为肽酰精氨酸脱亚胺酶的活性。可以制造保守取代;此类取代是本领域公知的。更短的多肽序列也在本发明得范围内。例如,至少50个氨基酸或多至60、70、80、100、150或200个氨基酸长的肽被认为落在本发明的范围内,只要其展示出SEQIDNO:6的肽酰精氨酸脱亚胺酶的基础生物学功能性即可。特别地但并非排他性地,本发明得该方面包括下述情况,其中蛋白是完整蛋白序列的片段。本发明还涉及编码具有蛋白精氨酸脱亚胺酶活性的多肽的多核苷酸,并且所述多核苷酸包括(a)编码氨基酸SEQIDNO:11的多核苷酸序列(b)多核苷酸序列,其编码前蛋白信号序列,其中,所编码的前蛋白信号序列位于被编码的前多肽的的氨基末端,并且优选地为15至30个氨基酸长。对于本发明而言,含有SEQIDNO:11的PAD共有序列的多肽也在本发明的范围内。优选地,含有SEQIDNO:11的PAD共有序列并且被编码为含有信号序列的前蛋白的多肽是本发明的一部分。对于本发明而言,感兴趣的蛋白主动分泌进生长培养基是尤其相关的。分泌的蛋白正常情况下最初作为前蛋白被合成,随后在分泌过程期间前序列(信号序列)被除去。原核生物和真核生物中的分泌过程基本上相近主动分泌的前蛋白穿过膜,信号序列通过特定的信号肽被除去,成熟蛋白被(重新)折叠。此外,对于信号序列而言,一般性结构可被识别。用于分泌的信号序列位于前蛋白的氨基末端,其通常为15-30个氨基酸长。氨基末端优选含有带正电荷的氨基酸,并且优选地,不含酸性氨基酸。我们认为,该带正电荷的区域与膜磷脂带负电荷的头部基团发生相互作用。该区域后面是疏水的、在膜上扩展的核区域。该区域通常为10-20个氨基酸长,主要由疏水氨基酸构成。在该区域中通常不存在带电荷的氨基酸。在膜上扩展的区域之后是用于信号肽酶的识别位点。识别位点主要由具有对小-X-小偏好的氨基酸构成。小氨基酸可以是丙氨酸、甘氨酸、丝氨酸或半胱氮酸。X可以是任何氨基酸。使用此类规则,已经写出了能识别来自真核生物和原核生物的此类信号序列的算法(Bendtsen,Nielsen,vonHeijneandBrunak.(2004)J.Mol.Biol.,340:783-795)。用于计算和识别蛋白中信号序列的SignalP程序通常是可获得的(http:〃www.cbs.dtu.dk/services/SignalP/)。可从被测序基因的推断蛋白序列来识别信号序列,这也是本发明相关的。如果基因编码如下这样的蛋白一一其中用SignalP程序预测了信号序列,那么该蛋白分泌的机会就较高。因此,本发明的一个目的是提供一种寻找具有PAD活性的新蛋白的新方法,其中使用SEQIDNO:11的共有序列并结合使用SignalP程序监测信号序列的存在来。在第二种实施方式中,本发明提供了经分离的多肽,其具有肽酰精氨酸脱亚胺酶活性,并且由下述多核苷酸编码,所述多核苷酸在低严谨度条件下,更优选在中等严谨度条件下,最优选在高严谨度条件下,与(或能与)下述(I)或(ii)杂交(I)SEQIDNO:3的核酸序列或者至少包含SEQIDNO:3的C-末端部分但比SEQIDNO:3全部碱基要少或者具有不同于SEQIDNO:3的碱基的碱基的核酸片段,或(ii)与SEQIDNO:3互补的核酸链。术语"能与……杂交"表示,本发明的目标多核苷酸可与用作为探针的核酸(例如,SEQIDNO:3所示的核苷酸序列或其片段或者SEQIDNO:3的互补序列或其片段)以显著高于背景的水平杂交。本发明还包括编码本发明的肽酰精氨酸脱亚胺酶的多核苷酸以及与其互补的核苷酸序列。核苷酸序列可以是RNA或DNA,包括基因组DNA、合成DNA或cDNA。优选地,核苷酸序列是DNA,最优选地,基因组DNA序列。典型地,本发明的多核苷酸包含能在选择性条件下与SEQIDNO:3的编码序列或编码序列的互补序列杂交的连续的核苷酸序列。可按照本领域公知的方法来合成此类核苷酸。本发明的多核苷酸可与SEQIDNO:3的编码序列或编码序列的互补序列以显著高于背景的水平杂交。背景杂交可发生,例如,因为cDNA文库中存在的其它cDNAs。本发明的多核苷酸和SEQIDNO:3的编码序列或编码序列的互补序列之间的相互作用产生的信号水平典型地是其它多核苷酸和SEQIDNO:3的编码序列之间相互作用的至少10倍,优选至少20倍,更优选至少50倍,进一步更优选至少100倍强。相互作用的强度可例如通过对探针进行放射性标记(例如用32P)来测量。典型地,可使用低严谨度(0.3M氯化钠和0.03M柠檬酸钠,在大约40。C)、中等严谨度(例如,0.3M氯化钠和0.03M柠檬酸钠,在大约50°C)或高严谨度(0.3M氯化钠和0.03M柠檬酸钠,在大约60°C)条件来实现选择性杂、-父。本发明的多核苷酸还包括可编码SEQIDNO:6的多肽或其变体的合成基因。将基因的密码子使用改造为适应生产宿主中的优选偏好在一些情况下是优选的。用于设计和构建合成基因的技术通常是可获得的(即http:〃www.dnatwopointo.com/)。修饰本发明的多核苷酸可包含DNA或RNA。它们可以是单链或双链的。它们还可以是在其中包含了合成或经修饰核苷酸(包括肽核酸)的多核苷酸。本领域已知大量不同类型的对多核苷酸的修饰。它们包括甲基磷酸盐和硫代磷酸盐主链以及在分子的3'和/或5'端添加吖啶或多聚赖氨酸链。就本发明的目的而言,应当理解,可以用本领域可获得的任何方法对本文所述的多核苷酸加以修饰。应当理解,本领域技术人员可使用常规技术,制造不会影响本发明的多核苷酸编码的多肽序列的取代,以反映本发明的多肽将要在其中表达的任何特定宿主生物的密码子使用。可通过核苷酸取代,例如从l、2或3至10、25、50、IOO或更多取代来修饰SEQIDNO:3的编码序列。或者或额外地,还可通过一处或多处插入和/或缺失和/或在任何一端或两端的延伸,对SEQIDNO:3的多核苷酸加以修饰。经修饰的多核苷酸通常编码具有肽酰精氨酸脱亚胺酶活性的多肽。例如,按照下文对多肽的讨论,可制造简并取代和/或可制造当经修饰的序列被翻译时将导致保守氨基酸取代的取代。同源体能与SEQIDNO:3的DNA编码序列的互补序列选择性杂交的核苷酸序列被本发明所包括,其通常与SEQIDNO:3的编码序列在至少60,优选至少IOO,更优选至少200个连续核苷酸上或最优选在SEQIDNO:3的全长上有至少50%或60%,至少70%,至少80%,至少90%,至少95%,至少98%或至少99%的序列同一性。类似地,编码活性肽酰精氨酸脱亚胺酶并且能与SEQIDNO:3的DNA编码序列的互补序列的片段选择性杂交的核苷酸也被本发明所包括。在60个核苷酸上,优选在100个核苷酸上至少80%或90%相同,更优选在200个核苷酸上至少90%相同的SEQIDNO:3的核酸序列的C-末端片段也被本发明所包括。上述同一性程度和最小尺寸的任何组合可用于定义本发明的多核苷酸,更严谨的组合(即,在更长长度上的更高的同一性)是优选的。因此,例如,在60个,优选IOO个核苷酸上至少80%或90%相同的多核苷酸构成了本发明的一个方面,在200个核苷酸上至少90。/。相同的多核苷酸也如是。UWGCGPackage提供了BESTFIT程序,其可用于计算同一性(例如以其默认设置来使用)。PILEUP和BLASTN算法还可用于计算序列同一性或用于排列序列(例如,鉴定等同或相应的序列,例如,以其默认设置)。用于进行BLAST分析的软件是公众可通过NationalCenterforBiotechnologyInformation(http:〃www.ncbi.nlm.nih.gov/)获《寻白勺。i亥算f去包括通过确定被查询的序列中的长度为W的短字(shortword),首先确定出高分数序列对(highscoringsequencepair,HSP),其中所述的短字与数据库序列中同样长度的字进行比对时匹配或能达到为正值的某阈值分数T。T被称为相邻字分数阈值(neighbourhoodwordscorethreshold)。上述最初的相邻字命中(wordhit)被作为种子对搜索进行初始化,以找到含有它们的HSP。所述的字命中在每条序列的两个方向上都延伸,直到累积比对分数能够增加。当累积比对分数从其获得的最大值降低了数量X;由于一个或多个分数为负的残基比对的积累,所述累积分数到了零或以下;或到达了序列的末端之时,所述字配对在每个方向上的延伸就被中断。BLAST算法的参数W、T和X确定了所述比对的敏感性和速度。所述的BLAST程序缺省使用的字长为11,BLOSUM62分数矩阵比对(B)为50,期望值(E)为IO,M=5,N=4,缺省比较两条链。BLAST算法进行了对两条序列间相似性的统计分析。由BLAST算法提供的一种对相似性的测量是最小总和概率(smallestsumprobability(P(N))),它提供了对两段核苷酸或氨基酸序列间的匹配将偶然发生的概率的指示。例如,如果第一条序列与第二条序列进行比较时的最小总和概率小于1左右,优选小于0.1左右,更优选小于0.01左右,以及最优选小于0.001左右,则该序列就被认为与另一条相似。引物和探针本发明的多核苷酸包括引物并可被用作为引物,例如聚合酶链式反应(PCR)引物、用于备选的扩增反应的引物,或者可被用作为探针(例如,通过传统手段使用放射活性或非放射活性标记,用揭示性标记标记过),或者,所述多核苷酸可被克隆进载体。此类引物、探针和其它片段的长度将为至少15个核苷酸长,例如至少20、25、30或40个核苷酸长。典型地,它们将可多达40、50、60、70、100、150、200或300个核苷酸长,或者甚至多达仅比SEQIDNO:5的编码序列短数个核苷酸(例如5或10个核苷酸)。一般来说,将通过合成的手段来产生引物,这包括以每次一个核苷酸的方式,对期望得到的核酸序列进行逐步生产。使用自动技术来完成上述任务的技术在本领域中是容易获得的。更长的多核苷酸通常将通过重组手段来产生,例如使用PCR克隆技术。这将包括制作一对引物(典型地,大约15-30个核苷酸),来扩增想要克隆的肽酰精氨酸脱亚胺酶区域;将引物与从酵母、细菌、植物、原核或真菌细胞(优选从Fi^an'Mm菌株)获得的mRNA、cDNA或基因组DNA相接触,在适合扩增想要的区域的条件下开展聚合酶链式反应;分离扩增得到的片段(例如,通过在琼脂糖凝胶上对反应混合物进行纯化);以及回收扩增出的DNA。引物可以被设计为含有合适的限制性酶识别位点,从而使得扩增后的DNA可以被克隆到合适的克隆载体中。对SEQIDNO:3的PAD基因的变体进行的此类PCR克隆在本发明的范围内进行,这些基因的DNA序列在SEQIDNO:4中提到,推断出的蛋白序列在SEQIDNO:7中提到。或者,可构建包含分泌的肽酰精氨酸脱亚胺酶或其变体的编码区域的合成基因。可使用这些技术方便地设计并构建在很多位置有改变但仍编码同样的蛋白的多核苷酸。这具有下述优点密码子使用可被改造,以适应优选的表达宿主,由此可提高该宿主中对所述蛋白的生产能力。此外,可改变基因的多核苷酸序列,以提高mRNA稳定性或降低流转量(turnover)。这可提高想要的蛋白或其变体的表达。此外,合成基因中多核苷酸序列可被改变,使得在蛋白序列中制造出下述突变,所述突变对于分泌效率、稳定性、蛋白水解易攻击性、温度最优值、比活性或工业生产或应用所述蛋白的其它相关性质具有正面影响。为构建体合成基因以及优化密码子使用提供服务的公司通常是可获得的。此类技术可用于获得编码本文所述的肽酰精氨酸脱亚胺酶的多核苷酸的全部或部分。内含子、启动子和尾区域都在本发明的范围内,它们也可由来自真菌、酵母、细菌、植物或原核细胞的基因组DNA开始,通过类似的方式(例如通过重组手段、PCR或克隆技术)来获得。多核苷酸或引物可携带揭示性标记。合适的标记包括放射性同位素,例如^P或"S,荧光标记,酶标记或者其它蛋白标记,例如生物素。此类标记可添加至本发明的多核苷酸或引物,并且可使用本领域已知的技术来检测。经标记或未经标记的多核苷酸或引物(或其片段)可用于基于核酸的测试,以对真菌样品中肽酰精氨酸脱亚胺酶或其变体加以检测或测序。此类检测测试通常包括将怀疑含有感兴趣DNA的真菌样品与包含本发明的多核苷酸或引物的探针在杂交条件下接触,以及检测探针和样品中核酸之间的任何双链体。检测可使用PCR等技术来实现,或者可通过这样来检测将探针固定在固体支持物上,除去样品中未与探针杂交的任何核酸,然后检测与探针杂交的任何核酸。或者,可将样品核酸固定在固体支持物上,与探针杂交,在除去任何未结合的探针后检测与此类支持物结合的探针的量。本发明的探针可以以试剂盒的形式被方便地包装进合适的容器。在上述试剂盒中,所述探针可以结合到固体支持物上,试剂盒被设计用来进行的检验形式(assayformat)需要上述的结合。该试剂盒还可以含有用于处理有待检测的样品的合适试剂、用于将探针杂交到样品中的核酸上去的合适试剂、对照试剂、说明书等等。本发明的探针和多核苷酸还可用于微型检验。优选地,本发明的多核苷酸可从与多肽相同的生物获得,例如,真菌,特别是Fwran'wm属的真菌。多核苷酸的生产可以用多种方法来获得与SEQIDNO:3不具有100%的同一性但落在本发明范围内的多核苷酸。因此可以通过多种方法获得本文描述的序列的变异体,例如通过对从一系列生物中制得的基因组DNA文库进行探测来获得,所述的生物例如是作为本发明多肽的来源被加以讨论的那些。此外,也可以获得肽酰精氨酸脱亚胺酶的其它真菌、植物或原核生物同源体,此类同源体及其片段通常能与SEQIDNO:3杂交。此类序列可以通过这样获得探测来自其它物种的cDNA文库或基因组DNA文库,以及用包含SEQIDNO:3的全部或部分的探针在低、中等至高严谨度(见前述)的条件下探测上述的文库。包含SEQIDNO:3的全部或部分的核酸探针可用于探测来自其它物种的cDNA或基因组文库,例如作为本发明多肽的来源被描述的那些物种。还可使用简并PCR来获得物种同源体,其中使用被设计来靶向变体和同源体中编码保守氮基酸序列的序列的引物。所述引物可含有一处或多处简并位置,并且较之用单序列引物对已知序列进行序列克隆所使用的严谨性条件而言,所述引物被用于更低的严谨性条件下。用于获得PAD物种同源体的优选方法是设计靶向编码SEQIDNO:11描述的共有序列的序列。或者,上述的多核苷酸可以通过对所述肽酰精氨酸脱亚胺酶序列或其变体进行定点突变来获得。某些情况下这可能是有用的,例如在需要对序列进行沉默密码子改变,以优化对所述多核苷酸在其中表达的特定宿主细胞的密码子偏好的情况下。为引入限制性酶识别位点,或者为了改变由所述的多核苷酸编码的多肽的功能或性质,有可能需要其它的序列改变。本发明包括包含本发明的多核苷酸及其互补序列的双链多核苷酸。本发明还提供了编码上文所述的本发明多肽的多核苷酸。鉴于上述的多核苷酸可用作为用于重组生产本发明多肽的序列,所以与SEQIDNO:3的序列杂交的能力对它们来说并非必需,虽然通常这将是想要的。另外,如果需要的话,可按上文所述对此类多核苷酸进行标记、使用以及制备。重组多核苷酸本发明还提供了包含本发明多核苷酸的载体,包括克隆和表达载体,在另一方面,提供了将此类载体培养、转化或转染进合适的宿主细胞的方法,例如,在下述条件下进行,所述条件下本发明的多肽或本发明的序列编码的多肽能够表达。本发明还提供了包含本发明的载体或多核苷酸的宿主细胞,其中,所述多核苷酸与宿主细胞的基因组是异源的。术语"异源"通常相对于宿主细胞来使用,其表示多核苷酸并非天然存在于宿主细胞基因组中或者多肽并非该细胞天然产生的。优选地,宿主细胞是酵母细胞(例如A7wy^eraw7ces、i^'c/n'fl、i/a氾e"w/a或5VzccAflram^yces1属的酵母纟田胞)或有丝真菌细胞(例如^^er^〃t^、rn'c/o&rma或FmmWww属的)。载体本发明的表达盒插入的载体可以是可方便地用于重组DNA流程的任何载体,对载体的选择通常将依赖于其将要被引入的宿主细胞。因此,载体可以是自主复制载体,即,作为染色体外实体存在的,其复制独立于染色体复制,例如质粒。或者,载体可以是这样的,当其引入宿主细胞时,其整合进宿主细胞基因组,并且与其整合进的染色体一起复制。优选地,当本发明的多核苷酸处于载体中时,其与调控序列可操作相连,调控序列能提供宿主细胞对编码序列的表达,即,载体是表达载体。术语"可操作相连"表示这样的并置关系,其中,描述的组分处于允许它们按照它们预想的方式发挥作用的关系中。与编码序列"可操作相连"的调控序列,例如启动子、增强子或其它表达调控信号以这样的方式被放置所述方式使得编码序列的表达在生产条件下实现。载体可被提供有复制起点,任选地用于多核苷酸表达的启动子以及任选地增强子和/或启动子的调控子,例如在质粒、粘粒、病毒或噬菌体载体的情况下是这样的。终止子序列也可存在,其可以是聚腺苷化序列。载体可含有一种或多种可选择标记基因,例如,氨苄青霉素抗性基因(在细菌质粒的情况下)或新霉素抗性基因(对哺乳动物载体而言)。载体可体外使用,例如,用于生产RNA,或者可用于转染或转化宿主细胞。编码多肽的DNA序列优选作为表达构建体的一部分被引入合适的宿主,所述表达构建体中,DNA序列与能指导DNA序列在宿主细胞中的表达的表达信号可操作相连。为用表达构建体转化合适的宿主,可获得本领域技术人员已知的转化流程,表达构建体可作为携带可选择标记的载体的一部分用于转化宿主,或者表达构建体作为单独的分子与携带可选择标记的载体一起共转化。载体可含有一种或多种可选择标记基因。优选的选择性标记包括但不限于在宿主细胞中补足缺陷或赋予对药物的抗性的那些。它们包括,例如可用于对大多数有丝真菌或酵母的转化的多功能标志基因,例如乙酰胺酶基因或cDNA(来自A"zV/w/Qra、A。0;zae、Am,ger的awc^、"/"Z)、/gcj基因或cDNA),或提供对G418、潮霉素、博来霉素、卡纳霉素、腐草霉素等抗生素抗性或对苯菌灵(benomyl)抗性的基因(benA)。或者,可使用特异性选择标记,例如营养缺陷型标记,其需要相应的突变宿主菌株例如(来自Xce"v^'^的)(或来自其它酵母的类似基因)、户,G或w"(来自爿.m'(iM/fl"51或、arg^(来自爿.m'(iw/a"s或或者frpC。在一种优选的实施方式中,表达构建体引入之后,从经转化的宿主细胞中除去选择标记,以获得能产生没有选择标记基因的多肽的经转化的宿主细胞。其它标记包括ATP合成酶亚基9、乳清酸核苷-5'-磷酸脱羧酶(;nrA)、细菌的G418抗性基因(可以在酵母中使用,但不能在真菌中使用)、氨苄青霉素抗性基因(E、新霉素抗性基因(万""7/m)和编码i8-葡糖醛酸糖苷酶(i8-glucuronidase,GUS)的五.co/i的w^A基因。载体可以在体外使用,例如用于RNA的生产或用来转染或转化宿主细胞。对大多数有丝真菌和酵母而言,载体或表达构建体优选被整合进宿主细胞的基因组,以获得稳定的转化子。然而,对某些酵母来说,为了稳定及高水平的表达,其中可并入表达构建体的合适的游离型载体(episomalvectors)也可使用。其例子包括分另U源自iSaccAaramycas禾口《/1(yveram;;ces的2^m、CEN禾口pKDl质粒的载体,或含有AMA序列(例如,来自A^erp7/^的AMA1)的载体。在表达构建体被整合进宿主细胞基因组的情况下,构建体或者被整合到基因组中的随机基因座,或者运用同源重组被整合到预定的目标基因座,在此情况下目标基因座优选包含高度表达的基因。高度表达的基因是其mRNA占到细胞总mRNA中至少0.01%(w/w)的基因,例如,在诱导条件下,或者,是其基因产物占到细胞总蛋白的至少0.2%(w/w)的基因(或者,对分泌的基因产物而言,能分泌到至少0.05g/l的水平)。用于给定的宿主细胞的表达构建体通常含有如下元件(它们以相对于编码第一方面的多肽的序列的编码链而言5'端到3,端的连续顺序,互相可操作地相连)(1)启动子序列,其能指导编码所述多肽的DNA序列在给定的宿主细胞中转录,(2)优选地,5'-非翻译区域(引导序列),(3)任选地,信号序列,其能指导所述多肽从给定的宿主细胞向培养基中分泌;(4)DNA序列,其编码所述多肽的成熟以及优选活性的形式,以及,优选地还有(5)转录终止区域(终止子),其能终止编码所述多肽的DNA序列下游的转录。在编码所述多肽的DNA序列的下游,表达构建体优选含有3'非翻译区域,所述区域含有一个或多个转录终止位点,它们也被称为终止子。终止子的起点相对并不重要。终止子可以例如是编码所述多肽的DNA序列天然的。然而,优选在细菌细胞中使用细菌终止子,在酵母宿主细胞中使用酵母终止子,以及,在有丝真菌宿主细胞中使用有丝真菌终止子。更优选地,终止子是宿主细胞(其中将要表达编码所述多肽的DNA序列)内源的。还可以通过选择异源调控区域来实现编码本发明多肽的多核苷酸的增强表达,所述区域例如是启动子、信号序列和终止子区域,它们可用于增加表达,以及如果需要的话,增加感兴趣的蛋白从选用的表达宿主中分泌的水平和/或提供对本发明多肽表达的可诱导控制。除编码本发明多肽的基因天然的启动子之外,也可以用其它启动子来指导本发明多肽的表达。可以针对所述启动子在期望的表达宿主中指导本发明多肽表达的效率来对启动子进行选择。可对启动子/增强子和其它表达调控信号加以选择,以使其与宿主细胞(针对其来设计表达载体)相容。例如,可使用原核启动子,特别是那些适合用于五.co/z'菌株的。当在哺乳动物细胞中进行表达时,可以使用哺乳动物的启动子。组织特异性启动子,例如肝细胞的细胞特异性启动子也可使用。还可使用病毒启动子,例如莫洛尼鼠类白血病毒长末端重复序列(MMLVLTR)启动子、劳斯肉瘤病毒(RSV)LTR启动子、SV40启动子、人类巨细胞病毒(CMV)IE启动子、单纯疱疹病毒启动子或腺病毒启动子。合适的酵母启动子包括S.cem^'ae的GAL4禾QADH启动子、S./wm^的wnf1和启动子。哺乳动物启动子包括可以应答于镉等重金属的诱导的金属硫蛋白启动子。病毒启动子,例如SV40大T抗原启动子或腺病毒启动子也可使用。所有这些启动子都是本领域中易于获得的。可使用哺乳动物启动子,例如,/3-肌动蛋白启动子。组织特异性启动子,特别是内皮或神经元细胞的细胞特异性启动子(例如DDAffl和DDAHII启动子)是尤其优选的。还可使用病毒启动子,例如莫洛尼鼠类白血病毒长末端重复序列(MMLVLTR)启动子、劳斯肉瘤病毒(RSV)LTR启动子、SV40启动子、人类巨细胞病毒(CMV)IE启动子、腺病毒启动子、HSV启动子(例如HSVIE启动子)或HPV启动子(特别是HPV上游调控区域(URR))。病毒启动子是本领域中易于获得的。各种各样能指导在本发明宿主细胞中的转录的启动子可以被使用。优选地,启动子序列源于前面定义的高度表达的基因。优选的高度表达的基因(启动子优选来自它们,和/或它们被包含于优选的用于表达构建体整合的预定目标基因座中)的例子包括但不限于编码糖酵解酶的基因,例如丙糖磷酸异构酶(TPI)、甘油醛磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶(PGK)、丙酮酸激酶(PYK)、醇脱氢酶(ADH),以及编码淀粉酶、葡糖淀粉酶、蛋白酶、木聚糖酶、纤维二糖水解酶、/3-半乳糖苷酶、醇(甲醇)氧化酶、延伸因子和核糖体蛋白的基因。合适的高度表达的基因的特定例子包括例如来自Mi^veramFes取的^4C4基因、分别来自//a似e"w/a和乃'c/nVz的甲醇氧化酶基因C40Y和、来自Am'gw和Amv^ww/的葡糖淀粉酶(g/W)基因、J.o^y加e的TAKA-淀粉酶基因、Am'^/aw的朋W基因以及7>ee^的纤维二糖水解酶基因。优选用于真菌表达宿主的组成型强启动子和/或可诱导强启动子的例子是可以从真菌的木聚糖酶(x/"A)、肌醇六磷酸酶、ATP-合成酶亚基9(WC)、丙糖磷酸异构酶(W)、醇脱氢酶(JWA)、淀粉酶(flw》、淀粉葡糖苷酶(AG-来自g/aA基因)、乙酰胺酶"mc/S)以及甘油醛-3-磷酸脱氢酶(s^Z)的基因的启动子中获得的那些。可使用的酵母强启动子的例子是可以从醇脱氢酶、甘油醛-3-磷酸脱氢酶、乳糖酶、3-磷酸甘油酸激酶、质膜ATPase(PMA1)和丙糖磷酸异构酶的基因中获得的那些。可使用的细菌强启动子的例子是淀粉酶及6Po2的启动子,以及来自胞外蛋白酶基因的启动子。适合于植物细胞的启动子包括Napaline合酶(nos)、章鱼氨酸合酶(ocs)、甘露氨酸合酶(mas)、核酮糖小亚基(rubiscossu)、组蛋白、水稻肌动蛋白、菜豆蛋白、花椰菜花叶病毒(CMV)35S及19S和环状病毒的启动子。载体还可包括产生RNA的多核苷酸侧翼的序列,所述序列包含与来自真核基因组序列(优选地,真菌基因组序列或酵母基因组序列)的那些同源的序列。这将允许本发明的多核苷酸通过同源重组被引入到真菌或酵母基因组中。特别地,包含侧翼有真菌序列的表达盒的质粒载体可用于制备适于将本发明的多核苷酸引入真菌细胞的载体。使用上述真菌载体的转化技术是本领域技术人员已知的。载体可以含有定位于反义方向的本发明的多核苷酸,用以生产反义RNA。如果需要的话,这可以用于降低多肽的表达水平。宿主细胞和表达在另一方面,本发明提供了制备本发明的多肽的方法,所述方法包括在适于通过编码所述多肽的编码序列表达的条件下,培养用上文所述的表达载体转化或转染过的宿主细胞,以及回收表达的多肽。本发明的多核苷酸可并入到重组可复制载体,例如表达载体。该载体可用来在相容的宿主细胞中复制所述的核酸。其可能含有本发明多核苷酸的至少~个拷贝(例如多个拷贝)。因此,在另一实施方式中,本发明提供了制造本发明多核苷酸的方法,这通过向可复制载体中引入本发明的多核苷酸,向相容的宿主细胞中引入所述的载体,以及在能导致载体复制的条件下培养宿主细胞来实现。合适的宿主细胞包括细菌(例如ECO//)、酵母、哺乳动物细胞系以及其它真核细胞系,例如昆虫细胞,例如Sf9细胞和(例如有丝)真菌细胞。优选地,多肽作为分泌的蛋白来生产,在此情况下,表达构建体中编码多肽成熟形式的DNA序列与编码信号序列的DNA序列可操作地相连。当野生型菌株中编码分泌的蛋白的基因具有信号序列时,优选地,所用的信号序列对编码多肽的DNA序列来说是天然的(同源的)。或者,信号序列对编码多肽的DNA序列来说是外来的(异源的),在此情况下,该信号序列优选是表达DNA序列的宿主细胞内源的。对酵母宿主细胞而言,合适的信号序列的例子是源自酵母MFo;基因的信号序列。类似地,对有丝真菌宿主细胞而言合适的信号序列是例如,源自有丝真菌的淀粉葡糖苷酶(AG)基因(例如A的基因)的信号序列。信号序列可以与淀粉葡糖苷酶(也叫作(葡糖)淀粉酶))启动子本身组合使用,也可以与其它启动子组合。根据本发明的上下文,还可以使用杂交信号序列。优选的异源分泌引导序列是来自真菌淀粉葡糖苷酶(AG)基因(g/aA-18个和24个氨基酸的形式,例如来自A/^gz7^的)、MFa基因(酵母,例如SGCcAar0m7ca禾卩i:/M_yverom_ycM的)或a-淀粉酶基因的那些。可根据上文所述,将载体转化或转染进合适的宿主细胞,以提供本发明多肽的表达。该方法可包括在适于表达所述多肽的条件下,按上文所述培养经表达载体转化的宿主细胞,以及任选地,回收表达的多肽。本发明的另一方面因此提供了用本发明的多核苷酸或载体转化或转染的宿主细胞或包含本发明的多核苷酸或载体的宿主细胞。优选地,所述多核苷酸被携带于载体中,这允许多核苷酸复制和表达。可对细胞加以选择,以与所述载体相容,细胞可以例如是原核细胞(例如细菌)或真核的真菌、酵母或植物细胞。本发明包括通过重组表达编码多肽的DNA序列来生产本发明多肽的方法。为实现此目的,本发明的DNA序列可用于基因扩增和/或表达信号(例如启动子、分泌信号序列)的交换,以使所述多肽在合适的同源或异源宿主细胞中得以经济地生产。同源宿主细胞在本文中被定义为是所述DNA序列来源的物种相同物种的宿主细胞,或是所述DNA序列来源的物种相同物种中变体的宿主细胞。合适的宿主细胞优选是原核微生物,例如细菌,更优选是真核生物,例如真菌,例如酵母或有丝真菌,或者是植物细胞。一般来说,酵母细胞比真菌细胞更为优选,因为它们更易操作。然而,某些蛋白质或者是很少从酵母中分泌,或者在某些情况下不能被正确加工(例如,酵母中的高糖基化)。在这些情况下,应当选择有丝真菌宿主生物。来自Sac7/ws属的细菌是合适的异源宿主,因其能向培养基中分泌蛋白。用于表达编码多肽的DNA序列的优选的酵母宿主细胞是5"flcc/zaram少c&s、A7w_yverow_yc&s"、/fom"ew油、尸/cAf"、ya/ro術'a或Sc/n'zo^ccAaramj;cM属之一的。更优选地,酵母宿主细胞选自/S^cc/ar画少ce51cerev/5/ae、A7^yvero,ces/acris(也被禾尔为A7^yve厂o,cas/z》o/;^z'ca禾口5"c/n'zas"ccAaram;;cas1/om6e禾中构成的组。然而,用于表达编码多肽的DNA序列的最优选的是有丝真菌宿主细胞。优选的有丝真菌宿主细胞选自由J^e^///^、7Vz'cAo^ww、Fusarz'ww、D^porc^n.c/mm、尸em.d〃z'ww、Jcremom'wm、iVewraspc^a、T7zermooscws、_M;yce//op/ztora、5|pwoWc/jMm、T7n'e/avz.a禾口ra/aram_yces属构成的组。更优选地,有丝真菌宿主细胞是^印erg"/RSoyzae、A;erg!7/iw34或^sperg/〃wsmWwAms禾中的,或是As/erg77/"5"z'ger类(由RaperandFennell,TheGenusA/ergz7/us,TheWilliams&WilkinsCompany,Baltimore,pp293-344,1965所定义)中的种的。它们包括但不限于j印ergi7^y'a/om'd爿5^erg/〃ws禾口y^erg77/ws,w謂,以及还有7WcAofife濯afermy的:y种的那些。在本发明范围内的优选的表达宿主的例子是真菌,例如j^e^说w的禾中(特别是EP-A-184,438禾BEP-A-284,603中描述的那些)和7Wc/2^^mfl的种;细菌,例如^"7/^的种(特别是EP-A-134,048和EP-A-253,455中描述的那些),尤其是5a"7/ws、Sad//^〃cAewybrm&、5a"7/wsam_y/o//《i^/^de/w,i^ei^/omowos1的禾中;以及酵母,例如K/w_yveramyces的禾中(特别是EP-A-0%,430(例如K/砂veram;;ces/"cto)和EP-A-301,670中描述的那些)和SaccW簡戸s的种,例如根据本发明的宿主细胞包括植物细胞,因此本发明延伸至含有本发明的一个或多个细胞的转基因生物,例如植物及其部分。所述细胞可异源表达本发明的多肽或可异源含有本发明多核苷酸中的一种或多种。转基因(或经遗传修饰)的植物因此可具有插入(典型地,稳定插入)进其基因组的编码本发明多肽的序列。对植物细胞的转化可使用已知技术来进行,例如使用来自爿graZflcfen'Mm^me/fl"'e"s的Ti或Ri质粒来进行。质粒(或载体)因此可含有感染植物所必要的序列,Ti和/或Ri质粒的衍生物也可使用。宿主细胞可过表达多肽,用于工程过表达的技术是公知的,并可用于本发明。宿主因此可具有多核苷酸的两个或多个拷贝。或者,对植物的部分(例如叶、根或茎)的直接感染是可实现的。在该技术中,损伤待感染的植物,例如通过用刀片切植物,用针头扎植物或用研磨料磨植物来实现。然后用^gra^"en'wm对伤口接种。然后令植物或植物部分在合适的培养基上生长,并令其发育成成熟的植物。经转化细胞向经遗传修饰的植物中的再生可使用己知技术来实现,例如通过用抗生素对经转化的嫩芽进行选择以及通过将嫩芽培养于含有合适营养物、植物激素等的培养基上来实现。对宿主细胞的培养和重组生产本发明还包括己被修饰以表达肽酰精氨酸脱亚胺酶或其变体的细胞。此类细胞包括瞬时的(transient)或优选为经稳定修饰的高等真核细胞系,例如哺乳动物细胞或昆虫细胞,低等真核细胞,例如酵母和有丝真菌细胞,或原核细胞,例如细菌细胞。本发明的多肽还可被瞬时表达于细胞系中或表达于膜上,例如,杆状病毒表达系统中。适于表达根据本发明的蛋白的此类系统也被包括在本发明的范围内。根据本发明,对本发明多肽的生产可以通过在传统的营养发酵培养基中培养已经过一种或多种本发明多核苷酸转化的微生物表达宿主来实现。可用本领域已知的流程来培养根据本发明的重组宿主细胞。对启动子和宿主细胞的每种组合而言,有益于编码所述多肽的DNA序列的表达的培养条件是可以获得的。达到想要的细胞密度或效价之后,培养被终止,使用已知的流程来回收多肽。发酵培养基可以包含已知的培养基,其中含有碳源(例如葡萄糖、麦芽糖、糖蜜等)和氮源(例如硫酸铵、硝酸铵、氯化铵等)、有机氮源(例如酵母提取物、麦芽提取物、蛋白胨等)和无机营养源(例如磷酸盐、镁、钾、锌、铁等)。任选地,诱导物(取决于所用的表达构建体)可包括在内或随后添加。对合适培养基的选择可以基于对表达宿主的选择和/或基于所述表达构建体的调控需要。合适的培养基是本领域技术人员来说公知的。如果需要的话,培养基可以含有较之其它潜在的污染性微生物更有利于经过转化的表达宿主的其它组分。发酵可以进行0.5-30天的时间。其可以是分批的、连续的或补料分批(fed-batch)的过程,在0。C到45。C的范围内的合适温度下进行,以及例如,在2至10之间的pH下进行。优选的发酵条件包括处于20°C到37°C范围内的温度和/或3和9之间的pH。通常基于对表达宿主的选择和对待表达蛋白的选择来选择合适的条件。发酵之后,如果必要的话,可以通过离心或过滤的手段将细胞从发酵培养液中移出。在发酵停止之后或细胞被移出之后,可以回收本发明的多肽,如果需要的话,可以通过传统手段对其进行纯化和分离。可从真菌菌丝体或从培养液(肽酰精氨酸脱亚胺酶被培养的真菌细胞释放进其中)纯化本发明的肽酰精氨酸脱亚胺酶。在一种优选的实施方式中,多肽从从真菌来生,更优选从A^wg/〃M生产,最优选从爿^erg7'〃wsm'ger来生产。修饰本发明的多肽可以是经化学修饰的,例如翻译后修饰。例如,它们可以是糖基化的(一次或多次)或者包含经修饰的氨基酸残基。还可以通过添加组氨酸残基(协助对其的纯化)或通过添加信号序列(以促进从细分泌)来对其进行修饰。多肽可具有一个或多个氨基末端或羧基末端延伸,例如氨基末端的甲硫氨酸残基,多至大约20-25个残基的小接头肽或协助纯化的小的延伸,例如多聚组氨酸片断、抗原表位或结合结构域。可以用揭示性标记对本发明的多肽加以标记。揭示性标记可以是允许所述多肽能被检测到的任何合适的标记。合适的标记包括放射性同位素,例如1251、35S,酶,抗体,多核苷酸和接头,例如生物素。可以对所述的多肽进行修饰,以包括进非天然存在的氨基酸,或增加所述多肽的稳定性。当用合成手段来生产蛋白或肽时,此类氨基酸可在生产期间引入。还可以在合成或重组生产之后来对蛋白或肽进行修饰。还可以使用D-氨基酸来生产本发明的多肽。在此类情况下,氨基酸以C至N定向以反向顺序相连。这在本领域中是常规用来生产此类蛋白或肽的。大量侧链修饰都为本领域所已知,它们可以用于本发明蛋白肽的侧链。此类修饰包括,例如,通过还原性烷基化(通过与醛反应接着用NaBEU还原来实现)、使用甲基亚氨逐乙酸酯(methylacetimidate)的酰胺化以及用乙酸酐的酰基化来进行的氨基酸修饰。本发明提供的序列还可以被用作构建"第二代"酶的起始原料。"第二代"肽酰精氨酸脱亚胺酶是通过诱变技术(例如定点诱变或基因改组技术)改造得到的,其具有不同于野生型肽酰精氨酸脱亚胺酶或重组肽酰精氨酸脱亚胺酶(例如本发明所生产的那些)的性质。例如,它们的最优温度或最优pH、比活性、底物亲和性或热稳定性可被改变,以更适于在特定过程中的应用。可以根据本领域已知的流程,例如定点诱变或丙氨酸扫描诱变,来鉴定对本发明的肽酰精氨酸脱亚胺酶的活性来说必要的、并且因此优选要经历取代的氨基酸。在丙氨酸扫描诱变技术中,突变被引入分子的每一个残基,得到的突变分子被用于生物活性(例如肽酰精氨酸脱亚胺酶活性)测试,以鉴定出对所述分子的活性来说关键的氨基酸残基。酶-底物相互作用的位点也可以通过对晶体结构的分析来确定,例如通过核磁共振、结晶学或光亲和标记等技术来确定。基因改组(shuffling)技术提供了在多核苷酸序列中引入突变的随机方法。表达之后,对具有最佳性质的分离物进行再分离、汇合以及再次改组,以增加遗传多样性。通过重复该流程多次,编码迅速改善的蛋白的基因可被分离。优选地,从编码具有相似功能的蛋白的基因家族开始来进行基因改组流程。本发明提供的多核苷酸序列的家族很适合进行基因改组,以改善分泌的肽酰精氨酸脱亚胺酶的性质。或者,经典的随机诱变技术和选择,例如用NTG处理进行的诱变或UV诱变,可用于改善蛋白的性质。诱变可在经分离的DNA上直接进行,或在用感兴趣的DNA转化过的细胞上进行。或者,可通过本领域技术人员已知的大量技术,在经分离的DNA中引入突变。这些方法的例子是易错PCR、在重复缺陷型宿主细胞中扩增DNA等。酵母和有丝真菌宿主细胞的使用预计能提供翻译后修饰(例如,蛋白水解加工、十四烷基化、糖基化、截短以及酪氨酸、丝氨酸或苏氨酸的磷酸化)因为可能需要在本发明重组表达产物上赋予最优的生物学活性。制剂本发明的多肽可以是经分离的形式。应当理解,多肽可以与不千扰多肽的期望目的的载体或稀释剂混合,并且多肽仍被认为是经分离的。本发明的多肽还可以是高度纯化的形式,在这种情况下,其通常包含制剂中的多肽,其中制剂中蛋白的超过70%,例如超过80%、90%、95%、98%或99%是本发明的多肽。本发明的多肽可以以使得它们处于其天然细胞环境之外的形式提供。因此,它们可以是经高度分离或纯化的(如上文所讨论的),或者处于它们在自然界中并不存在于的细胞中,例如,其它真菌物种、动物、植物或细菌的细胞中。移除或降低肽酰精氨酸脱亚胺酶活性本发明还涉及生产亲本细胞的突变体细胞的方法,所述突变体细胞包含对编码多肽或其控制序列的内源核酸序列的破坏或缺失,这导致成熟细胞生产的所述多肽比亲本细胞要少。可通过修饰或失活肽酰精氮酸脱亚胺酶在细胞中表达所必需的核酸序列,来实现对具有降低的肽酰精氨酸脱亚胺酶活性的菌株的构建。待修饰或失活的核酸序列可以例如是编码展现肽酰精氨酸脱亚胺酶活性所必要的多肽或其部分的核酸序列,或者所述核酸序列可具有从核酸序列的编码序列表达多肽所需的调控功能。此类调控或控制序列的一个例子可以是启动子序列或其功能部分,即足以影响到多肽表达的部分。用于可能的修饰的其它控制序列包括但不限于,引导序列、聚腺苷化序列、原肽序列、信号序列和终止序列。对核酸序列的修饰和失活可通过下述方法来进行对细胞进行诱变,选出肽酰精氨酸脱亚胺酶生产能力已降低或消失的细胞。诱变可以是特异性的或随机的,可例如用合适的物理或化学诱变剂,使用合适的寡核苷酸,或者对DNA序列进行PCR诱变来实现诱变。此外,可使用这些诱变剂的任何组合来进行诱变。适合用于本发明的目的的物理或化学诱变剂的例子包括紫外照射、羟胺、N-甲基-N,-硝基-N-亚硝基胍(NTG)、O-甲基羟氨、硝酸、甲基磺酸乙酯(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用此类试剂时,典型地,通过下述方法来进行诱变在存在选用的诱变剂时、在合适的条件下培养待诱变的细胞,以及选出展示了降低的肽酰精氨酸脱亚胺酶活性表达或没有表达的细胞。可通过在编码所述多肽或其转录或翻译必需的调控元件的核酸序列中引入、取代或除去一个或多个核苷酸,来完成对本发明的多肽生产的修饰或失活。例如,可插入或除去核苷酸,以引入终止密码子、除去起始密码子或改变开放读码框。此类修饰或失活可按照本领域己知的方法通过定点诱变或PCR诱变来完成。虽然原则上修饰可在体内进行,即,直接在表达待被修饰的核酸序列的细胞上进行,但优选地,修饰按照下文所示例地体外进行。用于失活或降低所选用宿主细胞对肽酰精氨酸脱亚胺酶的生产的方便途径的一个例子基于基因置换或基因打断技术。例如,在基因打断方法中,对应于内源基因或感兴趣的基因片段的核酸序列被体外诱变,易产生缺陷核酸序列,其进而再被转化进宿主细胞,产生缺陷基因。通过同源重组,缺陷核酸序列置换掉内源基因或基因片段。优选地,缺陷基因或基因片段还编码下述标记,所述标记可用于选出其中编码多肽的基因已被修饰或破坏掉的转化子。或者,可通过建立起来的反义技术,使用与编码多肽的序列互补的核苷酸序列,来实现对编码本发明多肽的核酸序列的修饰或失活。更具体地,可通过引入与编码多肽的核酸序列互补的核苷酸序列,来降低或消除细胞对多肽的生产。然后典型地,反义多核苷酸在细胞中转录,其将能与编码肽酰精氨酸脱亚胺酶的mRNA杂交。在允许互补反义核苷酸序列与mRNA杂交的条件下,细胞中产生的肽酰精氨酸脱亚胺酶的量将降低或消失。优选地,将要根据本发明的方法修饰的细胞是微生物来源的,例如,真菌菌株,其适用于生产想要的对细胞来说同源或异源的蛋白产物。本发明还涉及亲本细胞的下述突变体细胞,其包含对编码所述多肽或其控制序列的内源核酸序列的破坏或缺失,这导致产生的突变体细胞生产的所述多肽要少于亲本细胞。由此制造的多肽缺陷性突变体细胞特别可用作宿主细胞,用于表达同源和/或异源多肽。因此,本发明还涉及生产同源或异源多肽的方法,所述方法包括(a)在有益于所述多肽产生的条件下培养所述突变体细胞;以及(b)回收所述多肽。在本发明的上下文中,术语"异源多肽"在本文中被定义为对宿主细胞来说并非天然的多肽,其中已进行了修饰从而改变了天然序列的天然蛋白,或通过重组DNA技术对宿主细胞进行操作导致其表达量有所改变的天然蛋白。在另一方面,本发明提供了生产基本不含肽酰精氨酸脱亚胺酶活性的蛋白产物的方法,这通过对既生产本发明的肽酰精氨酸脱亚胺酶多肽又生产感兴趣蛋白产物的细胞进行发酵来实现。所述方法包括在发酵期间或发酵完成后,向发酵培养液中添加有效量的、能抑制肽酰精氨酸脱亚胺酶活性的试剂,从发酵培养液回收感兴趣的产物,以及任选地,对回收的产物进行进一步纯化。或者,培养之后,可对得到的培养液进行pH或温度处理,以高度降低肽酰精氨酸脱亚胺酶活性,以及允许从培养液中回收产物。可在从培养液回收的蛋白制剂上进行组合的pH或温度处理。本发明的用于生产基本上不含肽酰精氨酸脱亚胺酶的产物的方法在生产真核多肽方面令人特别有兴趣,特别是在对真菌蛋白(例如酶)的生产中。肽酰精氨酸脱亚胺酶缺陷型细胞还可用于表达感兴趣的用于食品工业的异源蛋白或引起药物方面的兴趣的异源蛋白。肽酰精氨酸脱亚胺酶的优选来源是通过将编码肽酰精氨酸脱亚胺酶的微生物基因克隆进微生物宿主生物来获得的。肽酰精氨酸脱亚胺酶的更为优选的来源是通过将源于i^^n'Mm的编码肽酰精氨酸脱亚胺酶的基因引入属于J印^^7/m属的、能过表达肽酰精氨酸脱亚胺酶基因的宿主来获得。通常,对于过表达而言同源宿主生物是优选的。同源表示是同一物种的。序列列表SEQIDNO:1=合成DNASEQIDNO:2:合成DNASEQIDNO:3:尸wsfln'wmgramz'"earwm白勺DNASEQIDNO:4:Ftwan'Mmgramz'wearwm的DNASEQIDNO:5:/^us^n'wmgram/wearwm的DISfASEQIDNO:6:Ftwan'Mmgramz'"earw;w的氨基酸序歹llSEQIDNO:7:尸wsfl/7.wwgramz'"ean^m的氨基酸序歹'JSEQIDNO:8:CAaeto附/w附g/oZoswm的氨基酸序歹USEQIDNO:9:5Y"tom戸s5caWes的氨基酸序歹USEQIDNO:106Vre;^om;;cessca6^y的氨基酸序歹廿SEQIDNO:11PAD共有氨基酸序列SEQIDNO:12:人工氨基酸序列SEQIDNO:13iSV,画;;ce51c/avw/Zgen的氨基酸序歹USEQIDNO:14尸/^easp/zflen'""ofiforwm的氨基酸序歹ll图例图1:对FusariumPAD的克隆。图2:对分泌的PAD蛋白的比对。图3:对表达载体pGBFINPAD的构建。图4:在SDS-PAGE上比较BSA和PAD的蛋白浓度。用SimplyBlueSafeStain(CollodialCoomassieG250)进行染色。道1-6BSA,道7隱10PAD。材料和方法水解程度使用快速OPA测试(Nielsen,P.M.;Petersen,D.;Dambmann,C.Improvedmethodfordeterminingfoodproteindegreeofhydrolysis,/owma/FoodSconce2001,(56,642-646)来测量所用的多种蛋白水解混合物的水解程度(DH)。PAD检验以两种不同方式来监测类PAD(PAD-like)活性。在筛选检验中,使用Sigma-Aldrich提供的针对该酶的Sigma质量控制测试流程(pl584,来自兔骨骼肌)。该发色方法基于N-a-苯甲酰-L-精氨酸乙酯盐酸盐的使用(BAEE;Takaharaetal.(1986)JournalofBiochemistry,99,1477-1424)。在另一检验中,通过测量游离精氨酸或肽结合的精氨酸转化为瓜氨酸的转化率,通过经典氨基酸分析来测量酶的活性。该方法在"氨基酸分析"章节指明。氨基酸分析按照AminoAcidAnalysisSystemofWaters(MilfordMA,USA)的操作员手册中指明的PicoTag方法,来进行氨基酸分析。为达到此目的,干燥样品,使用异硫氰酸酯直接进行衍生化。通过测试轮次建立色谱图中瓜氨酸和鸟氨酸的位置,所述测试轮次中,纯的化合物(Sigma)被衍生化,并对其进行色谱分析。使用HPLC方法来定量存在的经衍生化的氨基酸。其中蛋白或肽被用作为PAD的底物的孵育混合物首先被酸水解,这根据AminoAcidAnalysisSystemofWaters(MilfordMA,USA)的操作员手册来进行,然后对其进行衍生物以及分离和定量。在仅含游离精氨酸的孵育混合物中,酸水解是任选进行的。如实施例6所示,酸水解将瓜氨酸部分转化为鸟氨酸。为计算从精氨酸形成的瓜氨酸的总量,瓜氨酸和鸟氨酸的水平被加起来。在酸水解期间,Trp和Cys被破坏,因此这些氨基酸在后续计算中被忽略。此外,Gln禾BAsn残基在酸水节期间转化为Glu禾口Asp,使得Glu和Gin的值以及Asp和Asn的值也要加起来,以允许与酸水解之前获得的数据加以比较。SDS-PAGE用于SDS-PAGE和染色的所有材料都购自Invitrogen(Carlsbad,CA,US)。按照厂商说明书,使用SDS缓冲液来制备样品,按照厂商说明书,使用MES-SDS缓冲液体系,在12%Bis-Tris凝胶上对样品加以分离。使用SimplyBlueSafeStain(CollodialCoomassieG250)来进行染色。LC/MS/MS分析在PAD孵育后对肽QPRPFPFPRPR的分析中,使用HPLC来进行,其中使用与P4000泵(Thermoquest,Breda,theNetherlands)偶联的离子阱质谱仪(Thermoquest,Breda,theNetherlands)。使用Inertsil3ODS3,3)Lim,150*2.1mm(VarianBelgium,Belgium)柱,组合MilliQ水(Millipore,Bedford,MA,USA)中0.1%甲酸(溶液A)和乙腈中0.1%甲酸(溶液B)的梯度用于洗脱,来分离形成的肽。梯度起始于100%的溶液A,保持5分钟,在10分钟内线性增加至5MB,接着在30分钟内线性增加至45%的溶液B,再立即回到开始条件,再保持另15分钟,用于稳定。所用的注射体积为50微升,流速为每分钟200微升,柱温保持为55°C。注射的样品的蛋白浓度为大约50毫克/毫升。使用大约30%的最优碰撞能,通过针对感兴趣的肽的专门的MS/MS,及时测量孵育后肽QPRPFPFPRPR中不同精氨酸残基的反应和反应速率。在LC/MS/MS之前,在环境温度和13000rpm对孵育混合物离心10分钟,滤经0.22的过滤器,用MilliQ水按照1:100稀释上清液。克隆技术按照Sambrooketal(Sambrook,J.,Russell,D.W.(2001):Molecularcloning;alaboratorymanual(第三版).ColdSpringHarbourlaboratorypress,ColdSpringHarbour,NewYork),或按照供应商的说明来进行标准分子克隆技术,例如,核酸的分离和纯化、核酸的电泳、酶促修饰、对核酸的切割和/或扩增、对五.co//的转化等。Invitrogen(Breda,theNetherlands)提供了合成寡核苷酸,DNA序列分析在BaseClear(Leiden,theNetherlands)处进行。实施例实施例1Fusarium菌株可分泌类PAD活性对霉菌的大集合加以筛选,以鉴定分泌的类PAD活性。为达到此目的,将菌株在PotatoDextroseBroth(PDB;Difco)上于30摄氏度预培养4-5天。然后,通过离心收获培养物,用蒸馏水洗,再转入富集有水稻蛋白水解产物的最小限度培养基中。水稻蛋白相对富含精氨酸残基,并且为了增加其水溶性,将水稻蛋白(RemyIndustries,Leuven,Belgium)与Alcalase(NOVO,Bagsvaerd,Denmark)于pH7.5预先孵育,以获得DH为大约15的水解产物。所用的最小限度培养基每升含有0.52gKCl、1.52gKH2PO4、1.3ml4MKOH、0.52gMgSO小7H20、22mgZnSO4.7H2C)、llmgH3BO3、5mgFeS04.7H20、1.7mgC0CI2.6H2O、1.6mgC11SO4.5H2O、5mgMnCl2.4H20、1.5mgNa2MoO小2H20、50mgEDTA、40g葡萄糖和5g经水解的水稻蛋白。在后一种培养基中对真菌再进行2天的培养后,对培养物进行再次离心,冷冻澄清上清液的样品。为确定是否存在分泌的类PAD活性,按照材料和方法章节所述,对上清液样品进行比色Sigma质量控制测试流程处理。在该测试中,将0.2ml未经稀释的上清液加入至0.6ml混合的试剂中。酶孵育在45摄氏度进行5小时。根据获得的结果,Fw^n'wm菌株中的一些但非全部的上清液显示了一定程度上的变色。从尸M犯hwmgram/"earam菌禾朱CBS166.57、CBS316.73、CBS11063、CBS18432和CBS792.70(从CBS,Utrecht,TheNetherlands获得)获得了导致变色的上清液。若干其它i^腊'画菌株和其它真菌,例如,尸i^an'wmgrawz'"eanw2IMI145425(CABI,Wallingford,UK)的上清液没有产生颜色。我们从获得的结果推断出,一些菌株分泌类PAD活性。据我们所知,这是关于从任何微生物分泌PAD的首次报道。实施例2鉴定Fusarium基因组序列中的PAD编码基因既然已知一些Fwahww菌株可分泌类PAD活性,因此对编码这些PAD的基因的基因组序列进行分离和分析。为实现此目的,在PDB(马铃薯右旋糖培养基,Difco)中于30摄氏度对FRan.wmgra7w'"earw附菌株CBS166.57、CBS316.73、CBS11063、CBS18432和CBS792.70进行3天的培养,并按照供应商说明书,用Q-Biogene试剂盒(目录号6540-600;OmnilaboInternationalBV,Breda,theNetherlands)分离染色体DNA。该染色体DNA被用于使用PCR扩增PAD基因的编码序列。为从i^"JYzn'wwgnww'wefl尸wm菌株GBS166.57、CBS316.73、CBS11063、CBS18432和CBS792.70的染色体DNA特异性扩增PAD基因,设计了两条PCR引物。引物序列部分从在Gz加we〃azeaePH-1的基因组DNA中发现的序列获得,该序列被标注为假设的蛋白(UNIPROTQ4IIR5一GIBZE)。我们发现,该序列与高等真核生物的PAD序列具有同源性。第一条引物含有24个核苷酸的PAD编码序列,其起始于ATG起始密码子,具有上游12bp的引导序列以及Pal限制性位点(SEQIDNO:1)。第二条序列含有与PAD编码序列互补的29个核苷酸,其具有CTA终止密码子下游紧接着的Acl限制性位点(SEQIDNO:2)。使用这些引物,我们得以用来自Fusan'wmgraw/weanwz菌株CBS166.57、CBS316.73、CBS11063、CBS18432和CBS792.70的染色体DNA作为模板扩增出2kb大小的片段。在所有这些情况下,扩增出的片段都同样大小。对由此获得的2kb大小的片段进行纯化,将其连接进pCR-Bluntll-TOPO载体(Invitrogen),导致产生pGBPAD系列的质粒(见图1)。通过序列分析来分析PCR扩增出的序列。有趣的是,我们不能从Fi^an'wmgramz'"^rwmIMI145425扩增出该大小的基因组DNA片段,这暗示2kb片段的存在与T^ran'wmgramz'weamm中分泌的PAD活性的产生相关。/^san'wwgram/"ean/m菌株CBS166.57禾PCBS316.73的PAD编码区域的基因序列分别示于SEQIDNO:3和SEQIDNO:4中。从分离自过表达i^sfln'wmgram/"earamCBS166.57的PAD的菌株(见实施例3)的mRNA来产生编码区域的cDNA序列。对该cDNA进行测序,示于SEQIDNO:5中。推断出的Fw^Wwmgm/w'"earam菌株CBS166.57和CBS316.73编码的PAD的蛋白序列分别示于SEQIDNO:6禾卩SEQIDNO:7中。i^ran'wwgram/wearwmCBS166.57的PAD的基因组DNA序列与来自i^rarz'wmCBS316.73的PAD基因组DNA序列有19个位置的不同。对于推断的蛋白序列而言,这表示有7个氨基酸不同,来自Fi^an'wwgr^m'weGrwm菌株CBS166.57和CBS316.73的两条PAD是98.0%相同的。有趣的是,推断出的两条蛋白序列都在蛋白的氨基末端含有序列信号。使用程序BIastP(Altschuletal.,1997,NucleicAcidsResearch25:3389-3402),采用矩阵Blosum62和10的期望阈值,将这些序列与蛋白和DNA数据库相比较。我们发现,Fw犯n'wmgra肌'恥arwmCBS166.57的PAD的DNA和推断出的蛋白序列与在mmPH-1的基因组DNA中发现的序列和被标注为假设的蛋白(UNIPROTQ4IIR5J3IBZE)的序列相同。来自Fwm^m的PAD还与高等真核生物的PAD具有显著的同源性,主要差异在于真菌蛋白序列含有信号序列,因此更可能从细胞主动分泌,而来自高等真核生物的PAD不具有此类信号序列,因此不主动分泌。」Fksar/wwPAD没有显示与来自尸o"/^ramomw的PAD的任何同源性。此夕卜,在Fw^zn'wmPAD和来自C/zaetom/wwg/okwwmCBS148.51[另一种子囊菌真菌(类似于Fwan'wm)但属于不同的目(Sordariales而非Hypocreales)]的基因组的序歹!j(http:〃www.broad.mitedu/annotation/genome/chaetomium—globosmn/Home.html;CHGG_01998.1)之间发现了同源性。F^an'wm和C7aetom^mPAD序列间的同源性是在660个氨基酸上的253个氨基酸(38%相同)。此外,预测的蛋白被标注为假设的蛋白(UNIPROTQ2HCQ6—CHAGB)。此外,对该真菌中PAD同源体蛋白序列的标注可能是不正确的。CAae"m/wm蛋白与已知PAD之间的同源性仅存在于蛋白的前600个氨基酸上,而C/zaetom&m蛋白被标注为1000个氨基酸的蛋白。因此我们认为,对UNIPROTQ2HCQ6—CHAGB中C7wfetom/wm蛋白的t示注是不正确的。C7zaeto附z'twzg7o6aswnPAD的正确蛋白序列如SEQIDNO:8所示,比对示于图3中。当用程序SignalP(http:〃www.cbs.dtu.dk/services/SignalP/)更细致地观察该序列时,可以在蛋白的氨基末端检测到信号序列(见图3),这表明该蛋白很可能从真菌分泌,这与我们针对来自/^^n^m菌株的PAD所发现的情形一样。Fw^n'wwPAD的另一同源体可在尸Aaeos;/^en'awc^oramSN15的基因组中发现,这也是子囊菌真菌(类似T^yarz'wm和CAaetomz'wm),但甚至属于不同的纲(D池ideomycetes而非Sordariomycetes)。该基因编码的蛋白示于SEQIDNO:14中。Fw^n'wm和尸/^eo印/^en'aPAD序列间的同源性为629个氨基酸上的231个氨基酸(36%相同)。此外,预测的蛋白被标注为假设的蛋白(假设的蛋白SNOG—13103;GenebankEAT79430),可以识别信号序列。此处显示的数据暗示,分泌的PAD可在真菌界中普遍存在,但存在的频率非常低。使用本文所述的方法,人们可以特异性地识别和分离从真菌分泌的PAD。当针对PAD的可能同源体进行进一步观察时,我们可在S^ej^omjc^scc;6z'&s(马铃薯搭痂病的致病齐U,http:〃www.sanger.ac.uk/Projects/S—scabies/)的基因组中发现两条额外的序列。这些PAD的蛋白序列示于SEQIDNO:9和SEQIDNO:10。此外在这些基因中,可能怀疑蛋白氨基末端存在信号序列,因此这些蛋白也可能被分泌。示于SEQIDNO:IO中的蛋白的羧基末端丢失,因为该基因位于片断(contig)的末端,并且对编码区域的3,-末端也没有测序。当5^eptom_yc^c/avi^'gea^ATCC27064的基因组被测序和分析时,我们可检测到PAD的另一同源体,用SignalP程序进行检测时其也含有信号序列。该氨基酸序列示于SEQIDNO:13中。蛋白在羧基末端较短,因为该基因位于测序片断的末端,因此3'-末端丢失。当对来自微生物的PAD序列和来自高等真核生物的PAD序列加以比较时,这些序列间存在可检测到的非常同源的区域。该共有序列是WLxVGHVDE,其被示于SEQIDNO:11中。使用该共有序列,本领域技术人员非常可能使用已知克隆技术从微生物鉴定和分离出编码PAD的基因。一种可能性是基于SEQIDNO:ll的序列向核苷酸序列的反向翻译(使用来自想要从中鉴定PAD基因的生物的优选密码子)来设计寡核苷酸引48物,然后用该寡核苷酸与基因文库杂交,或者在PCR引物的情况下,在反转录mRNA库上杂交。另一种可能性是使用SEQIDNO:11的序列,用Patscan(http:〃www-unix.mcs.anl.gov/compbio/PatScan/HTML/patscan.html)等程序,在来自DNA数据库的经翻译的DNA序列中进行搜索。然后可使用本领域技术人员已知的程序,将使用这些方法之一鉴定出的基因翻译成蛋白序列,针对其氨基末端信号序列的存在进行观察。为检测信号序列,可使用SignalP(http:〃www.cbs.dtu.dk/services/SignalP/)等程序。在本发明中,我们己经发现,既含共有的SEQIDNO:ll又含预测的信号序列的蛋白序列可能是分泌的PAD。寻找这些组合的性质为对此类酶的工业生产提供了大的好处。实施例3As7erg77/^ym'ggr对可能的Fusw/"mgmmfweammPAD的过表达从含有来自F"^n'wmgram&ewwmCBS166.57的基因组PAD基因的pGBPAD质粒,分离出包含PAD编码序列的尸w/Z4"I片段,将其与pGBFIN-5(WO99/32617)中的/Aclp/^A片段交换。得到的质粒是名为pGBFINPAD的PAD表达载体(见图3)。通过用MWI进行消化来线性化表达载体pGBFINPAD,这从表达载体中除去了源自五.co/z'的所有序列。使用苯酚:氯仿异戊醇(24:23:1)萃取和用乙醇沉淀,来纯化经消化的DNA。这些载体被用于转化A;ergz7/Mm'gerCBS513.88。m'ger转化流程在WO98/46772中有广泛描述。其还描述了如何在含有乙酰胺的琼脂平板上选择转化子以及如何选择被耙向的多拷贝整合子(integrant)。优选地,选择含有多个拷贝的表达盒的Am'ger转化子用于进一步产生样品材料。对于pGBFINPAD表达载体而言,纯化了30个Am'ger转化子;首先将各转化子涂布到选择性培养基平板上,接着在PDA平板上涂布单个菌落。在30摄氏度培养1周后,收集各转化子的孢子。孢子于冰箱储藏,它们被用于对液体培养基的接种。含多个拷贝的表达盒的A"/ger菌株被用于产生样品材料,这通过在摇瓶培养物中培养菌株来实现。用于培养A菌株和从培养液中分离菌丝体的一种有用方法被描述于WO98/46772中。培养基是CSM-MES(每升培养基150g麦芽糖、60gSoytone(Difco)、15g(NH4)2S04、1gNaH2P04H20、1gMgS047H20、1gL-精氨酸、80mgTween-80、20gMESpH6.2)。在发酵的第4-8天,取5ml样品,在HereauslabofugeRF中以5000rpm离心10分钟,将上清液储藏于-20。C,以备后续分析。当用SDS-PAGE进行分析时,清楚看到,含有pGBFINPAD载体的转化子产生了表观分子量大约为60kDa的蛋白。鉴于这比从蛋白序列预测的分子量略小,我们假设,当在A;^^〃us^gw中生产尸w5flhwwPAD时,在除去信号序列后没有发生广泛糖基化。当发酵和下游加工按比例增大后,选择的菌株可用于分离和纯化更大量的PAD。然后该酶可用于进一步的分析,以及用于多种工业应用。实施例4纯化过表达的、来自Am'ger上清液的可能的PAD使用生长培养基(每升包括的麦芽糖.H20:40g;Soytone(Difco):30g;(NH4)2S04:15g;NaH2P04.H20:lg;MgS04.7H20:1;L-精氨酸1g;Tween-80:0.08g;柠檬酸钠70g),以10升的规模培养具有质粒pGBFINPAD的A.niger。将pH调节至6.2。在30摄氏度培养6天后,通过加入3.5g/l的苯甲酸钠杀死细胞,延长培养6小时。然后向培养液中加入10g/l的CaCl2和45g/l的过滤助剂(DicaliteBF;Gent,Belgium)。通过最初的滤布过滤以及接着滤经Z-2000和Z-200过滤器(Pall)来除去菌丝体。最后使用0.22微米的GPExpressPLUS膜(Millipore)进行灭菌过滤。用Pellicon系统(Millipore)进行超滤。改变缓冲液条件至25mM柠檬酸钠pH5.0(缓冲液A)之后,将溶液应用到装备有同样缓冲液的SP-SepharoseXK柱(GEHealthCare;Diegem,Belgium)上。用缓冲液A到缓冲液A+1MNaCl的线性梯度来对该柱加以洗脱。对获得的级分进行SDS-PAGE,并加以染色。显示出具有60kDa的表观MW的清楚条带的级分被合并。通过加入甘油(50%w/w的终浓度)、CaCl2(0.02%w/w)和苯甲酸钠(0.1%w/w)来稳定得到的酶溶液。为评估该最终制剂中PAD蛋白的浓度,对具有不同BSA溶液(FractionV,Sigma)含量的不同量的最终制剂进行SDS-PAGE,并用SimplyBlueSafeStain迸行染色。根据获得的结果(参见图4),最终制剂中PAD的浓度为3.8mg蛋白/ml液体。实施例5过表达的和经纯化的可能的PAD可将肽结合的精氨酸转化为瓜氨酸为验证作为PAD分离的酶的本质,将合成的肽QPRPFPFPRPR(Pepscan,Almere,TheNetherlands)与经色谱纯化的酶一起孵育,使用LC/MS来分析得到的产物。LC/MS分析得目的是验证精氨酸残基向瓜氨酸残基的转化。为实现此目的,将各种量的经纯化酶与合成肽(10mM)在pH6.5和50摄氏度一起孵育。孵育0、1和4小时后,从孵育混合物中取样。在95摄氏度对所有样品进行IO分钟加热,以失活任何残留的酶活性,随后进行离心。在将肽加入孵育混合物中后,立即对参照样品(孵育0小时)进行热处理和离心。在材料和方法章节指明的条件下对澄清的上清液进行LC/MS分析。为对MS进行优化,使用5pg/mlQPRPFPFPRPR溶液。该11肽的特征在于(主)m/z697.8=[M+2H产和(次)m/z465.6=[M+3H产的ESI/pos模式。为测定QPRPFPFPRPR的驻留时间,进行LC/MS。精氨酸(R)的质子化质量是175,转化为瓜氨酸(R=0)后,质子化质量增加1Da至176。考虑到肽的特征不在于[M+H]+而在于两个电荷的[M+2H产这个事实,质量差异相对每个经转化的精氨酸而言是0.5Da,因为质量轴的定义是质量对电荷之比(m/z)。孵育0小时的样品的质谱图显示了9.72分钟时的大的峰,其代表肽QPRPFPFPRPR(m/z697.8)。然而,11.36分钟洗脱的小的峰表示,甚至在该样品中,一些精氨酸残基已经转化为瓜氨酸。在1小时孵育的样品的质谱图中,明显有3个峰。除了O小时孵育后存在的峰之外,在13.36分钟(QPRPFPFPRPR,其中2个R转化成R=0)禾卩15.94分钟(QPRPFPFPRPR,其中3个R转化成R=0)也检测到了峰。在孵育4小时的样品中,仅看到后两个峰。这些数据强烈表明,分离的酶级分确实代表具有PAD活性的酶。相当令人吃惊的是,获得的数据还令我们做出下述推断PAD起始自肽的N-末端,因为朝向肽N-末端的精氨酸残基首先被脱亚胺化。朝向肽的C-末端的精氨酸残基跟在后面。实施例6蛋白结合的精氨酸、肽结合的精氨酸和游离精氨酸构成了过表达的FusariumPAD的合适的底物大量PAD的可获得性令我们得以通过经典的氨基酸分析来研究精氨酸向瓜氨酸的转化。为达到此目的,我们必须在色谱图中建立瓜氨酸的位置,用于对存在的游离氨基酸水平加以定量。因为可以预见到,用于氨基酸分析的酸水解会将瓜氨酸降解为鸟氨酸,因此,对纯的瓜氨酸和鸟氨酸(都来自Sigma)进行衍生化,并按照PicoTag方法进行色谱。测试表明,在色谱图中,两种经衍生化的化合物可作为单独的峰在其它经衍生化的氨基酸后面出现。在对新酶的测试中,将三种不同底物(即酪蛋白酸钠、酪蛋白水解产物和游离精氨酸)的10%(w/w)溶液与0、5、50和500微升的过表达且经纯化的PAD(参见实施例4)一起孵育。孵育在pH6.5和45摄氏度进行3小时。酪蛋白酸钠从DMVInternational,Veghel,TheNetherlands获得,酪蛋白水解产物是通过用枯草杆菌蛋白酶和脯氨酸特异性内蛋白酶对酪蛋白酸钠进行消化来制备的(Edensetal,JAFC53(20),7950-7957,2005)。L-精氨酸从Sigma获得。孵育之后,通过氨基酸分析来分析多种混合物。如可从表1展示的数据推断的,在含有相当量的新鉴定出的PAD的所有孵育物中,显著量的精氨酸被转化为瓜氨酸。如所预期的一样,色谱图也表明了鸟氨酸的存在。这些发现暗示,FusariumPAD可转化蛋白结合的精氨酸和肽结合的精氨酸。相当令人吃惊地,游离精氨酸也被接受为底物。根据这些结果,底物越小,酶在将精氨酸转化为瓜氨酸的过程中就更有效。后一结果看起来与针对Porphyromonasgingivalis酶发表的数据相反,因为所述数据显示该酶对肽酰精氨酸底物的偏好要高于对游离精氨酸的(McGmwetal.,Infectionandimmunity,July1999,3248-3256)为了验证鸟氨酸的存在是瓜氨酸酸水解的结果,重复进行用游离精氨酸作为底物的实验,但这次省略掉酸水解。如表2所示,在这种情况下,形成的鸟氨酸的量可被忽略,这表明存在的鸟氨酸并非通过酶形成的产表l:结合的和游离的精氨酸向瓜氨酸的转化<table>tableseeoriginaldocumentpage53</column></row><table>实施例7过表达的PAD的pH和温度最优值在与实施例6所述相似的一组实验中,测定FusariumPAD的温度和pH最优值。根据这些结果,过表达的酶具有大约8.0的最优pH,其最优温度在40至50摄氏度之间。实施例8过表达的PAD的钙依赖性根据文献,真核肽酰精氨酸脱亚胺酶是C^+依赖性的家族。为测试FusariumPAD是否也需要Ca2+,在存在EDTA时进行孵育。为实现此目的,首先使用DesaltSpinColumn(Pierce,Rockford,IL)对酪蛋白酸钠脱盐,然后在存在和不存在10mM(终浓度)EDTA时,在45摄氏度和pH7.2下,将5%的酪蛋白酸盐溶液与PAD—起孵育4小时。根据进行的氨基酸分析,两种孵育都显示经酸水解的酪蛋白酸盐中游离精氨酸的同样的降低(大约20%),这表明FusariumPAD是Ca2+独立性的。实施例9具有30%果汁的软饮典型份量240ml活性成分酪蛋白水解产物(精氨酸的50%转化为瓜氨酸)和麦芽糊精作为碳水化合物来源并入该食物产品中酪蛋白水解产物1.5-15g/每份麦芽糊精3-30g/每份I.从下述成分来制备软饮复合物果汁浓縮物和水溶性香料l.l橙汁浓縮物[g]60.3。白利糖度(Brix),5.15%酸度657.99柠檬浓縮物43.5。白利糖度,32.7%酸度95.96水溶性橙味香料13.43水溶性杏味香料6.71水26.461.2色素iS-胡萝卜素10%CWS0.89水67.651.3酸和抗氧化剂抗坏血酸4.11无水拧檬酸0.69水43.181.4稳定剂果胶0.20苯甲酸钠2.74水65.601.5油溶性香料油溶性橙味香料0.34蒸馏得到的甜橙油0.34I.6活性成分以上文提到的浓度存在的活成组分(这指上文提到的活性成分)蛋白水解产物和麦芽糊精。果汁浓縮物和水溶性香料在没有空气掺入的条件下混合起来。色素被溶于去离子水中。抗坏血酸和柠檬酸溶于水中。苯甲酸钠溶于水中。搅拌下加入果胶,煮沸令其溶解。冷却所述溶液。油溶性香料和甜橙油预先混合起来。1.6中提到的活性成分被干燥地混合起来,然后优选搅拌添加到果汁浓縮物混合物(1.1)中。为制备所述的软饮复合物,3丄1至3丄6的所有部分都被混合到一起,然后用Turrax再用高压均质机(Pl=200bar,p2=50bar)对其进行均质。II.用下述成分来制备瓶装糖浆[g]软饮复合物74.50水50.00糖浆,60°白利糖度150.00所述瓶装糖浆的成分被混合到一起。用水将所述瓶装糖浆稀释到1L,成为即饮饮料。变化可以对所述饮料进行巴氏消毒来代替使用苯甲酸钠。所述饮料还可经过碳酸化。5权利要求1.蛋白、肽或蛋白水解产物,其中作为蛋白或肽的一部分的瓜氨酸和精氨酸残基的摩尔比为至少0.15,优选至少0.30,更优选至少0.5,还更优选至少1.0,进一步还更优选至少2.0以及最优选至少4。2.经修饰的权利要求1的蛋白、肽或蛋白水解产物,其是植物蛋白、脱脂奶蛋白、奶蛋白、乳清蛋白、酪蛋白、明胶蛋白、卵蛋白、微生物蛋白或其水解产物。3.权利要求1或2的蛋白水解产物,其中平均肽长度为3至9个氨基酸。4.前述权利要求中任意一项所述的蛋白水解产物,其具有5至50之间的DH。5.权利要求1-4中任意一项所述的蛋白、肽或蛋白水解产物在食物、饲料或营养药物,例如膳食补充剂或药品中的用途以及在制备食物、饲料或营养药物,例如膳食补充剂或药品中的用途。6.酶促产生蛋白、肽或蛋白水解产物的方法,其中,所述蛋白、肽或蛋白水解产物中原本存在的精氨酸残基的至少15%,优选至少30%,更优选至少45%,还更优选至少60%,最优选至少80%转化为瓜氨酸残基,所述方法中,所述蛋白、肽或蛋白水解产物与蛋白精氨酸脱亚胺酶一起孵育。7.食品,其包含权利要求1-4中任意一项所述或可通过权利要求6的方法获得的蛋白、肽或蛋白水解产物。8.权利要求7的食品,其是婴儿配方食品或临床食品。9.经分离的多肽,其具有蛋白精氨酸脱亚胺酶活性,其选自由下述(a)和(b)构成的组:(a)具有下述氨基酸序列的多肽,所述氨基酸序列与SEQIDNO:6、8、9、10、13或14的氨基酸1至640具有至少30%的氨基酸序列同一性;(b)被下述多核苷酸编码的多肽,所述多核苷酸能在低严谨条件下与下述(i)或(ii)杂交(i)SEQIDNO:3的核酸序列或其在超过60个(优选超过100个)核苷酸上至少80%或90%相同,更优选在超过200个核苷酸上至少90%相同的片段,(ii)与SEQIDNO:3的核酸序列互补的核酸序。10.权利要求9的多肽,其具有下述氨基酸序列,所述氨基酸序列与SEQIDNO:6的1-640的氨基酸序列的同一性为至少40%,优选至少50%,优选至少60%,优选至少70%,更优选至少80%,进一步更优选至少90%,最优选至少95%,进一步最优选至少97%。11.权利要求9的多肽,其包含SEQIDNO:6的氨基酸序列。12.权利要求9的多肽,其由下述多核苷酸编码,所述多核苷酸能在低严谨度条件,更优选在中等严谨度条件,最优选在高严谨度条件下,与(i)SEQIDNO:3的核酸序列或其片段,或(ii)与SEQIDNO:3的核酸序列互补的核酸序列杂交。13.权利要求9的多肽,其从真菌获得,优选从^^er^//^,更优选从j印erg77/ws获得。14.经分离的多核苷酸,其包含下述核酸序列,所述核酸序列编码权利要求9的多肽,或能在低严谨度条件,更优选在中等严谨度条件,最优选在高严谨度条件下,与SEQIDNO:3杂交。15.多核苷酸,其编码具有蛋白精氨酸脱亚胺酶活性的多肽,所述多核苷酸包含(c)编码氨基酸SEQIDNO:ll的多核苷酸序列,以及(d)多核苷酸序列,其编码前蛋白信号序列,其中被编码的前蛋白信号序列位于被编码的前多肽的氨基末端,并且优选为15-30个氨基酸长。16.核酸构建体,其包含权利要求14或15所述的多核苷酸,所述多核苷酸与指导在合适的表达宿主中生产多肽的一种或多种控制序列可操作地相连。17.重组表达载体,其包含权利要求16所述的核酸构建体。18.重组宿主细胞,其包含权利要求16所述的核酸构建体或权利要求所述的载体。19.生产蛋白精氨酸脱亚胺酶的方法,所述方法包括培养能分泌蛋白精氨酸脱亚胺酶的菌株或重组宿主,以及回收所述的蛋白精氨酸脱亚胺酶。'20.生产权利要求9至13中任意一项所述的多肽的方法,所述方法包括培养权利要求9所述的菌株/重组宿主细胞以产生包含所述多肽的上清液和/或细胞,以及回收所述多肽。21.通过权利要求19的方法生产的多肽。22.生产权利要求9至13的多肽的方法,所述方法包括在适于生产所述多肽的条件下,培养包含下述核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的多核苷酸;以及回收所述多肽。23.通过权利要求20的方法生产的多肽。24.编码权利要求9的蛋白精氨酸脱亚胺酶的DNA分子。全文摘要本申请关注对来自Gibberllazeae(也称为Fusariumgraminearum)的肽酰精氨酸脱亚胺酶(EC3.5.3.15)的分离。本申请还公开了使用所述精氨酸脱亚胺酶酶促生产的瓜氨酸化的蛋白和肽以及此类瓜氨酸化的蛋白和肽在食品中的用途。本发明涉及经修饰的蛋白、肽或蛋白水解产物,其中,原本存在于所述蛋白、肽或蛋白水解产物中的精氨酸残基的至少15%,优选至少30%,更优选至少45%,还更优选至少60%,最优选至少80%被转化为瓜氨酸残基。文档编号C12N9/78GK101479380SQ200780024087公开日2009年7月8日申请日期2007年6月25日优先权日2006年6月26日发明者尼古拉斯·埃米尔·保卢斯·迪乌特茨,彼得吕斯·雅各布斯·西奥多瑞斯·蒂克尔,路泊·伊登斯申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1