多氧霉素生物合成基因簇及其应用的利记博彩app

文档序号:436059阅读:706来源:国知局

专利名称::多氧霉素生物合成基因簇及其应用的利记博彩app
技术领域
:本发明涉及的是一种基因工程
技术领域
的生物合成基因,特别是一种作为核苷类抗生素的多氧霉素生物合成基因簇及其应用。
背景技术
:多氧霉素(polyoxin,POL)由于其对农作物、果蔬及一些经济植物真菌病害有良好的防治作用,加之其对环境友好,低毒易降解的特性,所以自上世纪六十年代由日本首先创制成功以来,便在农业生产上得到大规模的推广应用,迄今为止,多氧霉素仍是我国乃至世界上使用最广泛且未产生耐药性的农用抗生素之一。多氧霉素由可可链霉菌阿苏变种,为Suzuki于1965年首次发现。之后,Isono等对其进行进一步研究,分离鉴定所有组分并对其化学结构进行了阐明;研究显示多氧霉素由结构相关的十三个组分(polyoxinA-M)组成,其中多氧霉素A为主要组分。多氧霉素的化学结构由核苷骨架及两个后修饰的氨基酸组成,由于其化学结构与真菌细胞壁中几丁质的合成单元N—乙酰葡萄糖酰氨的结构相似,所以多氧霉素是几丁质合成酶的强烈竞争性抑制剂,故而展示出高效的广谱抗真菌活性。关于多氧霉素的生物合成研究一直停留在同位素前体喂养的水平,Isono等根据同位素前体喂养的结果推测多氧霉素结构中两个后修饰的氨基酸(聚后酸,氨甲酰多氧草氨酸)的合成前体分别为L-异亮氨酸与L-谷氨酸。聚肟酸(polyoximicacid)部分的合成推测如下L一异亮氨酸先经过脱氢,再经过一系列的中间催化,最后环化形成聚肟酸。关于有氨甲酰多氧草氨酸(carbamoylpolyoxamicacid)部分的合成推测如下L一谷氨酸经过催化生成谷氨酸半醛,然后经过后续的还原、氨甲酰化及氧化,最终形成氨甲酰多氧草氨酸。关于核苷骨架的生物合成,Isono等推测如下磷酸烯醇式丙酮酸(PEP)加载到尿苷(uridine)的C'-5上形成中间产物,然后氧化消除脱去末端的2个碳原子,最后通过转氨反应形成多氧霉素的核心骨架-尿嘧啶氨基己糖醛酸。尽管如此,多氧霉素生物合成的分子机理迄今仍未阐明,其菌种选育研究仍停留在传统水平。多氧霉素的生物活性与其结构密切相关,随着多氧霉素整个生物合成基因簇的克隆与功能分析,可以从分子水平上阐明多氧霉素独特的生物合成机理,进而可以实现多氧霉素结构的定向改造以及利用组合生物合成手段创制生物活性更高的多氧霉素衍生物。随着基因功能与酶学机制的深入阐明,将会实现多氧霉素产生菌理性化分子育种,发酵工艺的定向优化,从而实现多氧霉素效价的提高。
发明内容本发明的目的在于克服现有技术中的不足,提供一种源于可可链霉菌阿苏变种中作为核苷类抗生素一多氧霉素生物合成基因簇及其应用。本发明利用多氧霉素生物合成基因簇用于多氧霉素的高产菌株或有效组分高产菌株的分子育种。所提供的基因及其所编码的蛋白质,也可以用来査找和发展可用于医药,工业,农业的化合物或蛋白。本发明的目的在于克服现有技术中的不足,本发明提供的多氧霉素生物合成基因簇包含20个基因,具体为(1)负责多氧霉素生物合成的结构基因polA,polB,polC,polD,polG,polH,poll,polJ,polK,polL,po.lM,polN,po10,polP,即共13个基因;(2)负责多氧霉素生物合成的调节基因,即polR,polY,共2个基因;(3)膜蛋白相关基因polQl,polQ2,即共2个基因;(4)功能未知基因,polE,polF,polL,共3个基因;共20个基因及其DNA序列或互补序列,即序列1,并提供了这些基因所编码蛋白的氨基酸序列,即序列2-29;包括包含序列1中碱基12838-14175的基因polA,包含序列1中碱基11999-12772的基因polB,包含序列1中碱基29476-28862的基因polC,包含序列1中碱基28857-28210的基因polD,包含序列1中碱基28187-27075的基因polE,包含序列1中碱基27023-26196的基因polF,包括包含序列1中碱基26166-24874的基因polG,包含序列1中碱基24881-23472的基因polH,包含序列1中碱基23475-22333的基因poll,包含序列1中碱基22336-21515的基因polj,包含序列1中碱基21528-20887的基因polK,包含序列1中碱基20830-20099的基因polL,包含序列1中碱基20041-19274的基因polM,包含序列1中碱基19281-18775的基因polN,包含序列1中碱基18778-17057的基因po10,包含序列1中碱基17060-16218的基因polP,包含序列1中碱基11103-10537的基因polQl,包含序列1中碱基12359-11100的基因polQ2,包含序列1中碱基32787-36122的基因polR,包含序列1中碱基32569-29681的基因polY,共有负责编码多氧霉素生物合成的13个结构基因,2个调控基因,2个膜蛋白相关基因及3个功能未知的基因得到确认并提供这些基因所编码蛋白的氨基酸序列。本发明提供了一种来自于可可链霉素阿苏亚种中编码了多氧霉素生物合成的结构基因,调节基因,膜蛋白相关基因及功能未知蛋白基因并提供了这些核苷酸序列所编码多氧霉素合成酶的氨基酸序列,也就是说这些酶由序列2-21提供的氨基酸序列来定义,这些核苷酸序列是分别选自于序列1中包括polA(12838-14175),polB(11999-12772),polC(29476-28862),polDpolE(28187-27075),polH(24881-23472),polj(22336-21515)polN(19281-18775),polQl(16052-14793),(32787-36122),polY(32569-29681)。本发明还提供了编码尿苷-5'-单磷酸烯醇式丙酮酸转移酶核苷酸序列,由序列2中的氨基酸序列组成,命名为polA,其基因核苷酸序列位于序列1中第12838-14175碱基处。本发明还提供了编码胸苷酸合成酶核苷酸序列,由序列3中的氨基酸序列组成,命名为polB,其基因核苷酸序列位于序列l中第11999-12772碱基处。本发明还提供了编码羟化酶核苷酸序列,由序列4中的氨基酸序列组成,命名为polC,其基因核苷酸序列位于序列1中第29476-28862碱基处。(28857-28210),(26166-24874),(20830-20099),(20041-19274),(17060—16218)polF(27023-26196),poll(23475-22333),,polK(21528-20887),po10(18778-17057),polQ2(14796-14230),polGpolLpolMpolPpolR本发明还提供了编码另一个羟化酶的核苷酸序列,由序列5中的氨基酸序列组成,命名为polD,其基因核苷酸序列位于序列1中第28857-28210碱基处.本发明还提供了编码功能未知蛋白的核苷酸序列,由序列6中的氨基酸序列组成,命名为polE,其基因核苷酸序列位于序列l中第28187-27075碱基处.本发明还提供了编码功能未知蛋白的核苷酸序列,由序列7中的氨基酸序列组成,命名为polF,其基因核苷酸序列位于序列1中第27023-26196碱基处。本发明还提供了编码羧化酶核苷酸序列,由序列8中的氨基酸序列组成,命名为polG,其基因核苷酸序列位于序列1中第26166-24874碱基处。本发明还提供了编码典型S-腺苷酰-L-甲硫氨酸蛋白核苷酸序列,由序列9中的氨基酸序列组成,命名为polH,其基因核苷酸序列位于序列1中第24881-23472碱基处。本发明还提供了编码氨基转移酶的核苷酸序列,由序列10中的氨基酸序列组成,命名为poll,其基因核苷酸序列位于序列l中第23475-22333碱基处。本发明还提供了编码磷酸化酶的核苷酸序列,由序列11中的氨基酸序列组成,命名为polj,其基因核苷酸序列位于序列1中第22336-21515碱基处。本发明还提供了编码典型羟化酶的核苷酸序列,由序列12中的氨基酸序列组成,命名为polK,其基因核苷酸序列位于序列l中第21528-20887碱基处。本发明还提供了编码功能未知蛋白的核苷酸序列,由序列13中的氨基酸序列组成,命名为polL,其基因核苷酸序列位于序列1中第20830-20099碱基处。本发明还提供了编码短链脱氢酶的核苷酸序列,由序列14中的氨基酸序列组成,命名为polM,其基因核苷酸序列位于序列l中第20041-19274碱基处。本发明还提供了编码氨基酸N—酰基转移酶的核苷酸序列,由序列15中的氨基酸序列组成,命名为polN,其基因核苷酸序列位于序列1中第19281-18775碱基处。本发明还提供了氨甲酰转移酶的核苷酸序列,由序列16中的氨基酸序列组成,命名为po10,其基因核苷酸序列位于序列l中第18778-17057碱基处。本发明还提供了编码酰基谷氨酸激酶的核苷酸序列,由序列17中的氨基酸序列组成,命名为polP,其基因核苷酸序列位于序列1中第20830-20099碱基处。本发明还提供了编码膜蛋白的核苷酸序列,由序列18中的氨基酸序列组成,命名为polQl,其基因核苷酸序列位于序列1中第16052-14793碱基处。本发明还提供了编码腺苷酸激酶的核苷酸序列,由序列19中的氨基酸序列组成,命名为polQ2,其基因核苷酸序列位于序列1中第14796-14230碱基处。本发明还提供了编码途径专一性调控蛋白的核苷酸序列,由序列20中的氮基酸序列组成,命名为polR,其基因核苷酸序列位于序列1中第32787-36122碱基处。本发明还提供了编码调控蛋白的核苷酸序列,由序列21中的氨基酸序列组成,命名为polY,其基因核苷酸序列位于序列1中第32569-29681碱基处。序列1的互补序列可依据DNA碱基互补原则随时得到,序列1的核苷酸序列或部分核苷酸序列可以通过聚合酶链式反应(PCR)或用限制性内切酶酶切DNA得到。本发明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶链式反应(PCR)的方法或包含本发明序列的DNA作为探针进行Southern杂交的方法从其他微生物中得到多氧霉素生物合成基因的同源基因。本发明还提供了从至少携带有部分序列1重组载体中,或从微生物文库中,或从微生物基因组DNA中分离多氧霉素生物合成基因的途径。本发明还提供了在基因工程微生物体中提高多氧霉素或其衍生抗生素产量的途径。本发明还提供了简化多氧霉素的有效组分的途径。本发明还提供了得到至少包含部分序列1中DNA序列的重组DNA载体的途径。本发明还提供了产生被至少包含部分序列1中DNA序列的重组DNA载体转化进入的宿主细胞的途径,赋予此宿主细胞产生多氧霉素。本发明还提供了产生被至少包含部分序列1中DNA序列的重组DNA载体转化进入的宿主细胞的途径,此宿主细胞所产生的多氧霉素产量得到提高或所产生的抗生素或某种代谢产物产量得到提高。本发明还提供了产生在基因组中有多氧霉素生物合成基因被打断,缺失或加倍的微生物体的途径,至少其中之一的基因包含有序列l中的核苷酸序列。本发明还提供了产生在基因组中有多氧霉素生物合成基因被改造的微生物体的途径。本发明还提供了产生在基因组中有多氧霉素生物合成基因之一或至少其中之一被缺失或加倍或改造的微生物体的途径。本发明提供的核苷酸序列或多个序列可以与载体序列融合而得到重组序列和相应的DNA分子。包含本发明所提供核苷酸序列或至少部分序列的克隆基因或DNA片段可以通过打断多氧霉素生物合成的一个或几个合成步骤而得到新的多氧霉素衍生物。包含本发明所提供核苷酸序列或至少部分序列的克隆基因或DNA片段可以通过打断多氧霉素生物合成的一个或几个修饰步骤而得到新的多氧霉素衍生物。包含DNA片段或基因可以用来提高多氧霉素或其衍生物的产量。例如,转入更多拷贝的正调节基因或打断负调节基因。包含本发明所提供核苷酸序列或至少部分序列的克隆DNA可用来从链霉菌多氧霉素基因组文库中定位更多的文库粘粒。这些文库质粒至少包含有本发明中的部分序列,也包含有链霉菌多氧霉素基因组中以前邻近区域未克隆的DNA。本发明所提供的核苷酸序列可以被修饰或突变。这些途径包括插入或置换,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,或与其它来源的同源序列进行直接进化(DNAshuffling)等。包含本发明的序列或至少部分序列的克隆基因可以通过合适的表达系统在外源宿主中表达以得到修饰的酶或更高的生物活性或更高的产量。这些外源宿主包括链霉菌,大肠杆菌,芽孢杆菌,酵母,植物和动物细胞等。多氧霉素生物合成修饰基因,调节基因,膜蛋白相关基因的核苷酸序列提供了通过缺失或改造这些修饰基因,调节基因,转运基因而得到多氧霉素结构衍生物或多氧霉素及其衍生物产量提高的途径。包含本发明的氨基酸序列或至少部分序列(序列2-21)的多肽可能在去除或替代某个或某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化蛋白动力学特征或其它致力于得到的性质。本发明包含的氨基酸序列或基因序列可以通过转化、转导、接合转移等方式转入到其他与核苷类抗生素产生菌中,从而产生该抗生素的衍生物。本发明所提供的包含多氧霉素生物合成相关的所有基因和蛋白信息,有助于阐明与理解多氧霉素及相关核苷类抗生素家族生物合成的分子机理,从而为进一步利用基因工程手段改造提供理论基础与材料。本发明所提供的基因及其所编码的蛋白质,也可以用来查找和发展可用于医药,工业,农业的化合物或蛋白。图1多氧霉素(polyoxin,P0L)的化学结构。图中POL—A:polyoxinA,POL—H:polyoxinH,POL—K:polyoxinK。图2多氧霉素生物合成基因簇的结构组成与限制性内切酶谱。(A)9个重叠的粘粒代表了可可链霉菌基因组75kb的DNA区域,probel-2表示探针部分;(B)多氧霉素生物合成基因簇的结构组成。图3polA基因的中断与回补。(A)构建polA中断突变株的过程示意图。(B)polA突变株的PCR鉴定,M:DNAmarker;1:Str印tomycescacaoivar.asoensis野生型,2—4polA中断突变株。(C)polA中断突变株的生物测定,指示菌皮状丝孢酵母(Trichosporoncuta画m),(1—3):polA中断突变株,(4):Streptomyces野生型,(5):多氧霉素标准品。。(D)polA中断突变株的HPLC检测,ST:多氧霉素标准品,WT:Str印tomycescacaoivar.asoensis野生型,CY1:polA的中断突变株。(E)polA中断突变株的回补;a:polA中断突变株,b:polA中断突变株含有质粒pJTU695作为负对照,c:polA中断突变株被polA回补;polA中断突变株被polA的同源基因nik0所回补。图4PolA蛋白的SDS-PAGE的分析及PolA催化合成产物的鉴定。(A)PolA蛋白的SDS-PAGE分析;1:蛋白质分子量标准,2:纯化的NikO蛋白,3:纯化的PolA蛋白,3:含有polA基因的大肠杆菌BL21(DE3)/plysE的可溶性蛋白(IPTG诱导),4:含有polA基因的大肠杆菌BL21(DE3)/plysE的可溶性蛋白(IPTG未诱导),5:含有polA基因的大肠杆菌BL21(DE3)/plysE的总蛋白(IPTG诱导)。(B)PolA催化的反应,PEP:磷酸烯醇式丙酮酸。(C)HPLC分析PolA催化合成的化合物;I:UMP(尿苷-5,-单磷酸)为负对照;II:NikO催化合成的产物(3'-EUMP:3,-烯醇式UMP)为正对照;III:PolA催化合成的产物。(D)PolA催化产物的一级质谱与二级质谱分析。图5MkO催化产物的MS(质谱)检测。图6可可链霉菌阿苏变种发酵产物的MS(质谱)检测。图7推断的多氧霉素生物合成途径。具体实施例方式以下是结合图l一图7对本发明的实施例作详细说明本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实施例。1.多氧霉素生物合成基因簇的克隆、分析如图1所示,多氧霉素是重要的核苷类农用抗生素,多氧霉素属于核苷类抗生素,与其结构相类似的抗生素尼可霉素(nikkomycin)的生物合成基因簇已被克隆,逐步的深入研究基本阐明了尼可霉素的生物合成途径。由于尼可霉素和多氧霉素拥有相同的核心结构,所以推测二者的核心结构的合成途径相同,现研究证实nikO负责尼可霉素核心结构合成的起始步骤。根据nikO的核苷酸序列设计一对引物(5'-TCCACGGTTCGCTCTACCTG-3'和5'-AGGGCTGGCTGTCGCTGM-3'),成功从多氧霉素的产生菌Str印tomycesaureochromogenes中扩增一条预期大小的特异性产物,序列分析表明二者编码的氨基酸序列的同源性达到64%。根据从Str印tomycesaureochromgenes中扩增的DNA产物的序列出发,设计引物(5'-GTCCGGTGCGCCATGTCCT-3和'-GGTGGGCCGTGATCGAGTC-3,)成功从可可链霉菌阿苏亚种和Str印tomycesaureochromogenes同时扩增到预期大小的DNA片断,序列分析表明二者的核苷酸序列同源性达到99%。根据此引物出发,利用PCR技术从可可链霉菌阿苏变种中克隆出阳性克隆。进一步的基因中断实验表明,目标基因(polA)的中断突变株完全丧失多氧霉素的产生能力(图4)。通过染色体步移(chromosomewalking)获得了9个相互重叠的粘粒覆盖了染色体上约75kb的区域(图2A),DNA测许了染色体上46,066bp连续区域,GC含量为72.58%。生物信息学分析包含了39个开放读码框(图2B)。2.polA的中断与回补polA是本发明用作探针的基因,其同源基因为nik0,通过构建polA基因的中断载体,导入到可可链霉菌阿苏变种中对polA基因进行中断,研究发现polA突变株丧失多氧霉素产生能力,说明polA与多氧霉素的生物合成有关。分别用polA和nik0回补polA中断突变株,发现二者皆能使polA突变株恢复多氧霉素的产生能力(图3)。说明polA与nikO的功能相同,同时也说明多氧霉素与尼可霉素的核心结构具有相同的合成途径。由于aac(3)IV(阿泊拉霉素抗性基因)基因插入到polA内部,所以可可链霉菌阿苏变种给出0.76kb的PCR扩增片断,而突变株由于aac(3)IV的插入所以扩增出2.2拷贝的片断(图3B)。由于aac(3)IV基因插入到polA的内部所形成的CY1突变株丧失对指示菌的抑制作用,说明,CY1突变株丧失多氧霉素的产生能力(图3C),从而说明polA与多氧霉素的生物合成直接相关。HPLC检测说明,多氧霉素A标准品和野生型能在30分钟左右的产生多氧霉素的特征性峰,而CY1突变株则没有(图3D),从而进一步证实polA与多氧霉素的生物合成直接相关。当将polA互补到CY1突变株中,则能使其恢复对指示菌皮状丝孢酵母的生物活性,毫无疑问的证明polA与多氧霉素的生物合成直接相关。3.PolA蛋白的功能确定将nik0和polA分别克隆到大肠杆菌表达载体pET28a上,然后转化到大肠杆菌BL21(DE3)/plysE中。体外研究表明,与NikO蛋白的功能一样,PolA也能催化尿苷-5'-单磷酸(UMP)和磷酸烯醇式丙酮酸(PEP)生成3'-EUMP(3'-烯醇式UMP)(图5和图6)。从而从生化角度证实PolA和Nik0拥有同样的功能,同时从另一侧面阐明UMP不是PolA的唯一底物。4.多氧霉素生物合成基因簇边界的确定根据基因编码蛋白的功能分析,多氧霉素的生物合成基因簇被确定为从基因polB到polR,涵盖了染色体上25kb的区域,包涵20个开放读码框。通过基因中断实验进一步确认了多氧霉素生物合成基因簇的边界。中断orf-5,orf-4,发现不会影响多氧霉素的生物合成,同时中断orf-3和orf-2后,多氧霉素的生物合成也未受到影响。根据生物信息学分析orf所编码的蛋白与多氧霉素的生物合成无关,从而说明,orfl为多氧霉素生物合成基因簇的左边界。同时中断orf3和orf4对多氧霉素的生物合成丝毫没有影响,中断orfl也没有影响,而根据生物信息学分析polR多氧霉素生物合成的调节基因,所以orfl被确定为多氧霉素生物合成的右边界。5.多氧霉素的生物合成途径(A)核心结构的合成(图7),polA编码尿苷-5,-单磷酸烯醇式丙酮酸转移酶催化合成3'-烯醇式丙酮酰尿苷-5,-单磷酸(3'-enolpyruvy1-UMP,3,-EUMP),然后在polJ编码的磷酸化酶的作用下发生5,脱磷酸并且烯醇式丙酮酸基团转到5'位上,接着在polH编码的典型S—腺苷酰一L一甲硫氨酸蛋白的作用下发生环化,最后在polD、poll和polK编码的羟化酶、羟化酶及氨基转移酶的相继作用下发生氧化消除和转氨反应最终形成多氧霉素的核心结构。尿苷-5,-单磷酸(Uridine-5'-monophosphate,UMP)同时也可被polB编码的胸苷酸催化形成5'-甲基-尿苷-5,-单磷酸,接着甲基被氧化形成羟甲基和羧基。尿苷-5,-单磷酸和甲基化、羟甲基化及羧基化尿苷-5,-单磷酸皆能被相关的酶所催化形成5'位置相对应被修饰的多氧霉素核心结构。如图7所示,可以进一步推断的多氧霉素生物合成途径。(B)聚肟酸(Polyoximicacid,P0IA)的生物合成,polF编码的钼蛋白氧化还原酶的作用下,L一异亮氨酸被氧化脱氢,然后在polC编码的羟化酶的作用下3位甲基被羟化,接着在polE编码的功能未确定的蛋白的作用下发生环化生成聚肟酸。(C)氨甲酰聚多氧草氨酸(Carbamoylpolyoxamicacid,CPOAA)的生物合成,polN编码的氨基酸-N-酰基转移酶的作用下,L-谷氨酸被N—乙酰化,然后在poiP编码的N—酰基谷氨酸激酶的作用下发生C5位发生磷酸化,接着在polM编码的短链脱氢酶的作用下发生C5位去磷酸化并还原成羟基,然后再在polN编码的氨基酸-N-酰基转移酶的催化作用下去乙酰化形成a—氨基一5—羟基戊酸(a-amino-5-hydroxylvalericacid,AHV);,polO编码的氨甲酰转移酶催化此化合物生成a—氨基一S—氨甲酰戊酸(a-amino-5-carbamoylhydroxyvalericacid,ACV)。最后可能在polL编码的未知功能蛋白的作用下发生发生羟化形成氨甲酰多氧草氨酸。(4)核心结构、聚肟氨酸及氨甲酰多氧草氨酸组装,在polG编码的羧化酶的作用下核心结构、聚肟氨酸及氨甲酰多氧草氨酸最后组装合成多氧霉素。以下是进一步提供实施实例,这些实例有助于理解本发明实施例1多氧霉素产生菌可可链霉菌阿苏变种基因组DNA的提取接种20u120%甘油保存的可可链霉菌阿苏变种孢子至5ml的TSB(Oxide胰胨豆汤粉30g,蒸馏水1000ml)中,置于3(TC摇床培养36小时,离心收集菌体待用,用500u1溶菌酶溶液重新悬浮50mg菌丝体,在37'C温育约30min,或温育至细胞成为半透明状。加入500y12%SDS,混合振荡约lmin直到溶液的粘度显著下降,37。C温育20min,然后加入25n1中性苯酚/氯仿,混合振荡均匀后,12000r/min离心5min,移取上清液,弃去白色中间层。用中性苯酚/氯仿重复二次抽提直至看不见(或非常少)中间层为止,最后加入0.1倍体积的3M醋酸钠(pH自然),混合后加入1倍体积的异丙醇(或2.2倍体积的无水乙醇),再次混合后在室温下放置5min(或者在-2(TC放置30min),12000r/min离心,弃去上清液,用70%乙醇洗涤DNA沉淀两次,最后弃去所有上清液,待乙醇挥发后,溶解于一定量TE缓冲液中。实施例2多氧霉素产生菌可可链霉菌阿苏变种的接合转移系统的建立收集生长于SFM培养基(黄豆粉20g,甘露醇20g,琼脂粉20g自来水1000ml)可可链霉菌阿苏变种的新鲜孢子备用。含有oriT的目标质粒必须在辅助质粒pUZ8002的协助下,才能通过接合转移导入到受体链霉菌细胞中。先将待转移到可可链霉菌阿苏变种中的质粒转化大肠杆菌ET12567/pUZ8002,然后培养含目标质粒的大肠杆菌ET12567/pUZ8002,12h后收集菌体,用新鲜LB培养基洗涤菌体2次备用。作为受体的链霉菌孢子需经热激和预萌发处理。将链霉菌孢子重新悬浮于5ml0.05MpH8.0的TES缓冲液中,在45。C水浴中热激10min,冷却至室温后加入等体积2X孢子预萌发培养基(Difco酵母膏10%,Difco酪蛋白氨基酸1%,CaCl20.OIM(需配制5M的原液,分开灭菌后加到酵母膏酪蛋白氨基酸溶液中)预萌发2h-3h(不同链霉菌所需时间不同),离心收集孢子并重新悬浮于适量的LB中,在混合器上振荡打散孢子,按108:108与大肠杆菌细胞等量混合,16h-20h后用lml无菌水含适量抗生素和萘啶酮酸(用来抑制大肠杆菌的生长)来覆盖,置30。C培养数天后即可看到接合子。实施例3多氧霉素产生菌可可链霉菌阿苏变种基因组文库的构建与筛选含有多cos位点的大肠杆菌一链霉菌穿梭载体pOJ446被选择构建可可链霉菌阿苏变种的基因组文库。pOJ446先用Hpal彻底酶切,然后用磷酸化酶去磷酸化,再BamHI切形成两臂备用。基因组DNA被一系列稀释的SauAI部分酶切,然后选择合适的SauAI浓度梯度。利用脉冲场电泳分离部分酶切的基因组DNA(电压,6v/cm;角度120度;工作时间12小时,设置温度,14°C)(回收36—40kb大小的目标DNA,然后用热敏性的磷酸化酶进行去磷酸化,再将磷酸化酶加热失活(7(TC,5min)目标基因组DNA和载体的分子比10:1左右配制进行连接包装,然后转染感受态的E.coliEPI300-TlB细胞。利用PCR(聚合酶链式反应)来筛选基因组文库,首先将每个96孔板的克隆混合培养,提混合粘粒作为模板然后进行PCR反应,先将阳性信号定位于每个96孔板,同样的方法接着定位于排,最后定位于点。实施例4多氧霉素的发酵、分离纯化及分析鉴定将20X甘油保存的孢子接种到TSB培养基中,培养24小时,按照2%的接种量接种于发酵培养基(大豆粉20g,玉米粉20g,葡萄糖10g,酵母膏10g,CaC034g,KH2P042g,Nacl2g,水1000ml)中发酵7天。然后用草酸调pH值至2—3左右,过Dowex50WX8(H+)树脂,用0.2MNH3H20洗脱。洗脱液旋转蒸发浓縮后,过0.22ym的过滤器,用于HPLC分析或LC/MS分析。HPLC的分离条件为,流动相A:每升含有lOmM庚烷磺酸钠盐和2ml的乙酸,流动相B:每升含有lOmM庚烷磺酸钠盐和2ml的乙酸,检测波长263nm,30min内,流动相A从90%梯度降至55%,流动相B相应从10%升至45%。色谱柱为Agilent250X46mmC18SB色谱柱,流速0.5ml/min。程序设置如下<table>complextableseeoriginaldocumentpage16</column></row><table>实施例5基因中断突变株的构建将构建的中断载体通过接合转移的方式转至可可链霉菌阿苏变种中,将生长出来的接合子在添加阿泊拉霉素(apramycin)的SFM平板上抗性验证,验证正确后,在未添加阿泊拉霉素的SFM平板上扩大松弛培养,待孢子生长丰满后(约7天),收集孢子,然后在添加相应抗生素的SFM平板上梯度稀释每平板约50—100个单菌落,挑选菌落分别在含阿泊拉抗生素的SFM平板和含硫链丝菌素的SFM平板上扩大培养,选择在链丝菌素平板上未长但在阿泊拉平板上生长良好的菌落,转接到TSB培养基中提取总DNA,进行PCR验证正确后,突变株进行发酵培养。本发明涉及的序列及记号分列如下:<110>上海交通大学〈120〉多氧霉素生物合成基因簇及其应用<130>invention〈160〉21〈170>Patentlnversion3.3<210〉1〈211〉46066<212>DNA<213〉可可链霉菌阿苏变种<400>1tcgagagggaaccgggccgcgaaccggtcgccgatacggaagatggcgttgaccgtgccc60ggcccggcgatgttcctgaccggcaggctccgccactcgggaaactgctgctcc3ccaac120acgcgcaccgtctcaggggacaccgtcagctggttggcgtgcatcttcatg邓gg犯gca180tccgcaccccgatcttcggccgcaatccatttgtgccgcgcggctgcgag卿gggcsgg240gggtttcggccagtcgttctggacgggctgagcgagcatctggttcgcctcgcgccgacg300g柳gctgctctaccaggtcctttagttcaatgttcacgttttcatcacgctttcatcag360atcggccctcgaaaagttccggccatgcgtcgcgccccttacggtcgtctagcgccaact420gatctttgggggacacatgtcgtacaaccagccgccgtccgtccagccgcccttcgccgg480gcccatggccgggcagggtggcaagcccgggtgggcgcggaagcggatcgtcgttccggc540cgcgatcctcgtcttcttcgtgggsgtcgggatcggctcctccggcaacggcggccagga600g犯ggtcgctgccggcagcgacgtcaggcctcagcccacggtcaccgtcacgaagaccgc660cgaggcgcagacggcc卿gacg卿gcggcgagcaggcgagtgacagcaagcccgtcac720cgacgaggccaagaaggcggccgttcccgacttcgtccggagtccgccca780ggacaaagcgc卿aggtcggcttctEicaagctcacctcgcatgacgcgctcggccggga840ccggatgcaggcattcgaccggeiactggaetggtgtgcagccagaacgtgaaggccggcgt900cgtcaagtccacggacacggaactggacttcggcgcggtg卿ctggcggagacttgccc960ggcg犯ggacg犯gcgccgccgaaggcgcagggcggc犯gatgcctgccttcgccggcaa1020gtcggtgaaggcggcacgtgccgcgctcgactccggtacctcgatcaccgtgcaggacgc1080cctcccggacgaccgctggatcctggtggagtcgaactggaaggtgtgcacgcagagccc1140gtccgcgggtgcgtcgctgaccgggcagcccgtcgagttcaccgccgtcaagttcgagga1200gtcctgcccgtagccgttcgtacggggcgatggcccctgtcccggcaggtgcagccgccg1260cgggacggctggaccgcgtctgtcgccgtgggcgtcgtctgccgcacgatgggggcactg1320tccggtacgagacgaccgattgccctggaggggccgtgagacgtccgcacacccgcctgc1380cgatgttcaccgcggtcgtgacagcggtgctggccctgctgttcgg犯ccggtacgggcg1440ccacggccctccaggtgcccacgatccgcgggggcaccgtgctgtacgcggccacgggcg1500cgcagtgcgtcgtcggcttcaacgcggtgaacggggtcaaccactacgccgtgatgaccg1560gccactgttccggcacccacgccaccacgtggtacgcggacgcggcccgcaccgtgccgg1620tcggtgtcaccgcgggcgcttcctacccgatcgacgactacggcgtggtccgctacacca1680ccggcgcgctgatcctccccggagacatcgcgttgggcgggggtgcctaccaggacatca1740ccggggccgcg犯cccgEicgatcgggcggtccgtctgccacgtcggacggaccagcggcg1800tccactgcgggacggtgaccgcggtcaacgtcacggtcaactacgccgacggcacggtct1860acggcctgttccgctccaccgcgtgctcggaagccggtgacatcggggcgcctgcctact1920ccgggccgacggccctcgggttcgcggtgggttcgtcgggcaactgctcgtccggtggcg1980tcacctactaccagcccgtcgcggaggtcctctcggtcttcggcctgacgctgtactgac2040cgtcccgacacgaccggccgcccccgacgcgctcgcgggtggtcgtccgtggacggccac2100gccggcgggggcgacgtgagccgcgtcagggcgtgggaccggcgaggtcgacccgattgt2160gcatcacgtcgaggtggtgacggtcccggtgaggcacgtggtcgtcccgacccgggaggc2220tgaagaccgcgcagacgtcgtgctcgcagcccgccgcgtccagggccgccagcaggccct2280cgcgcagcacggcggcctcggacgattccgagtcgggcaggacg柳gaggggagtttca2340cggtcgggccgggccacfitcggggagcggggtcggacaccgcgttccctccgga犯atgg2400ccctttcgtcccgggtccgttcatgcatgatgagcggatgaaccacaatgaccagcgctt2460ccacgtcatcgtgctgtcgaacttcgcgagaggcttcgacaagtacgcctacgcctacgg2520caaggcggggattccggagagcaccttccccgaccgtttccatctgctgacccgtgccga2580actgggcataggcatcggcaaggcgcggcgactgctggaccggctggccatcgcgggcga2640ccgcctgctggtgctggaaaccaccgtggatcccgaccggctcgtgcccaacgtggcgac2700cggtctcggcacggagctgcacgaggaccgtatccggctgtcggcgatccacgaactcga2760cggggacggagacgagttcactctgcgccccctgagcctgcacacggcggcacaccgtcgggtcctgccggtcgcgtccgcctgccaggcgatctccagcgaccaggcgcccgcccgggtgcgcgcccgtgcggcgggtgccgagcgtgccataccgttcgaacagcaggtgagactggtcgtcctgatcaccaacgcgcacaccctggccctcgccgcactgagcgccgcgggactgagcgacgacgtcaacgagcggctgatgatgctctggcgcgcgg肌cgcgaccggtggccggggcacggcggcgtcgccgacgcggccggggtcggcgtcgaggaggtctgcttc犯ggagctcttcgaccgcgccgccaacgtctggagccgccgcttcgccgaggagcacggcttcgaaccctaccagggcacctgggacgggcgcccgctgctctgggagcgcgccaacggcatcgcccgttacgcctccctggaggaccgggccagcgattcgaggagttccaggcgttccggcagcgggccgccgagaccaacctgtaccgggcgctcatgaacacggtgcaccggtgcgatctcgccgaggagtggtccggccgtgcgatggtctgcttccggcaactgcacgccgaaaaggcgcggtacttcgaactggcccgcgccgcgggcctgccggtcctgcccggttcaccggcggaccacagcaggccgctgggccgctacctgtccgacgaggcatcgccgcgccgccgcctgctgatcgcccccggaacccggcgcctgctggacaccaagggatggctgtggccgcgcacgttcggctgggccgaggcgttccgggcggatccgccggaccaccgtcgaggacgcgatggcggcctc2820ctacgccgacacgacaccgcgctcggtgtc2880ccggtgctctttctgcttctcctcggcgtc2940cccgtgggacgcggtcggccactggctgga3000ggtgatcaccggcggcggggagcccacgct3060gtccgcgtgctcggcggccttcccgaaggt3120gaaaggcgagcacgccgaccgtgccgaccg3180cgtgctggccgtttcccgccaccaccagga3240gcgcacgccggtggcctccgtcgtcgacac3300actgcggatgaggctgatctgcgtgctcca3360cgccgcgtacctttcctgggccgcggccct3420ctacgtgtcgaccagcacggagtcgctcta3480ggagcaccaggtgccgctggccgtcgtcac3540ggcgagccgtctgccctggggcgcgccggt3600gcgcgtcgccgcctacaccgagcccagtct3660cagctggaacgtcatggccgacggccgctg3720gatcgtggcggaaggcgcgccggcatgaac3780csigctctgcgcctcctcggccctgctcgac3840gccgcgctgcgaccggaacaaccggccgag3900cgcgcctggctgcggcgctacgcactgcct3960cgaggggtccggcacgggctcgccgtggtg4020ttgtggctgcccggcgatgtgtacccggtc4080gagccggcgtcctaccccacgctgccggta4140cggcccgagtatctgctgctcgccaacccg4200gacgagtgcaccgcggtgatctcgtggctg4260gacagcgtctacgacctcggcgccccgttc4320ggtcgcgccgtcctgctgcactcggtcacc4380atcgttgtcctggatcctgcgcagaccgca4440acgcccgcccaactgcgcctcgccgaccgt4500ctgctgaccggacacggtgaggtgccccggcagatcgtcgacgacctggcggcacgcgcc4560gagcggctcttcgaccggttgccggacgacgtgctcacggcgatccccgcggcgagccgg4620acctgccccggcaactacttcttcccggtcgggatcccggcggagacgctccggcgcgac4680tacggcgtgctcgccatcccggtcggtgtgttcggggacagcgcctggcccggctccgtc4740ctgaccagcctcggatgacgtcaggccaggcgcaggtcgatccaggggac;ggtgtcgccg4800tcgcgcagcagataccgctcgagctccacgaagccgtgccggccggcgaagcgcagcccg4860tcctggttggaggccagcaccacggtctcgatcacctgggcgtccagcgcacgggcctgg4920cccagggcgcgttcgtacagccgggtgccgaggccgcggcggcggtgttcgggcaggacg4980cgggcgatgaccgtggccgtggcgccgttgtcctcggtgggcgggcgtacggtggtgcag5040ccgatcaggacgtcgccgaggtgggcgacctccatacggttgcggccggtgcgggcacgg5100acgtcgtcgagtgacagcacgtcgccggggatgatcaggttgtggacgtgctgccagtcg5160tggatcgaggcgtcgtcgtccacctcttggatgcg犯ggtcggtcaccggcccagccaac5220agctgcccgctgtcgtccgtcaaacgcaattgccggaggaatcggtgcagttcagcccgc5280accgggagcgtcagcggctcccgtcggggcgcggccgtcggggcgtggcgcggagtacgt5340ggggcggccggtgggggagtgctagcgtcgccccatgcctgaactgatcgcacccgcggc5400ccggcttcggtcctcgtggctcgccgcgtgcgcggagtggcctcccggtgcccatcagga5460cgggacgggtctgcgcctggctcccgagggcgatctgcgcgaccccgacgtgttccgcac5520ctgggtcgagcgactgcgccggcagtcggaccggtcggtcgccgtgggagagggccgcgt5580ccacgccacccactggtggatcgtggaggacgacagctatctcggggccatcgatgtgcg5640gcactacctgaacgccctgctgctcgacgtcggcgggcacatcggttacagcgtccgccc5700ttccgcccgcaggcggggactggcgacctgggccctcggcgcggtgcttccgcgggcccg5760tgcgctcggtctggaccgggtcctcgtcacctgcgacgacgacaacaccggttccgcacg5820cagcatcgagcgcaacggcggcgtcctggaggacgtccgcgctgccggctccggcctcaa5880gaggcggtactggatcgacctgtagg犯gggtg犯ccgccgtccccgcccgcgtcgcacc5940gcgctccgtgcgcgttccctggccagctccctgaggtaggcccgtgcgtccacctggatc6000gtgtgccggggcgaggccacgtaacggcgggccgtccgggcccggtgggcgcggatctcg6060gcgagcatcccgtcccgcccgggcagggcgcaccggccctgcaacaggtcggcgacccag6120tgggactgggcctgcgccagcggcatgatcgcaccgagcggctggacgaggccgatgaag6180tacaggccgggacggtcgggggagacgacccggtggtagagaccgggatcgttgccgctc6240acgtcgatcacctcgtcgtcgaggaacgggatcgtgtcgatgtcctccacactgccgtcgcggggcacgggtttcaccgtgatgtcgccgatcgtgggatgggcggcgaggacgcggtgtcgaccgcggctgagccgcagcagcaggtgccgggccagccaggagtgggtgaggtggtccatgtgcgcgccccggcgcatggcc鄉aacgcgatgtcgcacgccgagttgccgatgccctcggggctgcggtagtggtgcgagtggatcatctccggctcgggccaacgcggtttccaatagacccccgtctcgagggcgccggtgtcgccgtccgggacgacccgcaccacctcggtgtgctcgacgaacgcgtcgaagtagcgggcttcgtccgccatcgggaatccggcgtactccgagcggtaggccgacgactgtccgttgtcggagcccaactcgaagcagtcgtaggcgatgatcccggaagaaccggccccgatcacacaccccggtcatgtccccggtcgatcacaggctagccccgttcaacaaccatgtgcgccaagcatgaccgggcggtcacatgaccgcccggtcctgggaccggctgtcaccggcccgccg卿cggcacccacggctactccacgggcagcctcaagggctcactgttccagtacttctccgggcagacgtccctgcgcgtctacgcccacatcggcgacttccgcacctacctcgtcgacgcacagccgctcgagcgcggggtgacggccgctgacgccgtccgggcgccggtgaacgccgtgcgcgccgtcgccaccggggacctgcgcaacctcctcgtgttcctgccccacctcgcgctaacgcgatgtcgtaccccgtgcagcagatg6300tcgaacgccacctgggtggcgtcgatccgg6360tggccgagccgggagagcaggtcgtcggag6420tcgggttcgggcaggccgtagtccgccagc6480aggccgcggtcctgcacggccagcggcatt6540gtgggcctgccgaacaggtacttcggcagg6600gtttgtcgggagacgcgggagacctccacc6660aggacgaggacgcgccggtcggcgaagggt6720cgggtgcccgcg犯ccctgcgacgccgggg6780tgatggccgttggccaccaggacggcgtcg6840cggtggcgggaggtgaccgtccacctgtcc6900cggaacctgatcgaggggcgcagcccgaag6960atgtgggcgtgccccggatacaccggacag7020atgatctgacgtgaggtgttgatgtggagc7080ttgaggtagcgccagttgccgcccacctgc7140cccctgtcggcgagaacctggcaggcggct7200acgttccgcacgccggcctccttgtgacca7260ggacggcccgccgcgcgctgtcaatgcatg7320ccgttgacatcagtggacggccgctccacc7380acacggaggagcgcccatgcccacgcccac7440gcgtgtactcgtcgcggccatggacgagtt7500gaacgtcatcgcccgcgaggccggtgtcgc7560caagctcgatctcttcgcctacgtcgccga7620gcagccgtggctggacggctacgacgagtc7680gctggaggcgtggctcgactacttcgccgg7740caccaacatggagatggaccccgcggtccg7800ctacctggccggactgcggcccctgctgga7860ggacgccgacctcgacgcgctgctgtcgat7920cctgccgcacctgtccggcggcgacggccc7980<sequence>complexsequenceseeoriginaldocumentpage22</sequence>ccggccgtcccgaccaccgccccgggcgccgcgccatgaccgtctacccggatgagcccttctggctcgtgccgcgcgcggaacttcccctcggcggccgcggcctggtcgctgcggcctactacgacgagctgctgagcgccgtgctcgtcaccgacatctgggtcgacagcgaggccttccccaaggagatggccaccttcgaggtccagaccggcgaagggacactcgccaccgcccgtccgccgctggcctaccggctcgcacagttccgcagccgcgccaccctgcgaccggcgcgactcgccgcgctcgtgcgccgcgcgcccctccgcttcggcggctgaacgtcccgcgcgcgtgcgcaccgcccgcgccacgctcaccgcctcacgcagcgcccgcgccacggttgcggcgccgcgaagccgccgcaccggtcccctcgtcgcggtggggcccgtccgccccg犯ccggaccaggaatcactgctcctcctcacggaaaagccatgaccgcggtgctgctgaccgcggcagcccaccccgcctcgccgacggtccgggcgatcgcctacaccgacctgaccgtgtcggccgacccgggcacgacggccggggcgaacgcgcccttcgggcacggcttcttccaggccatcacctcctggggcgtgatcaccgtcgcccccaccgcgttcgccgacgacctcaacgcggctcgcggctcacgcttcgcggaccgggtcgacatgggcggcggcgcggccctggtcgccgccgccctcgccgccgccgagaccaacccgtcggccgtccagtacgtcggcggcagcgccgactagatgtacgacgcc犯gccgtcacacacccctgcgcctccccccacctcacggaacggac9780ggcatcttgccggacagatgtacgtgtccc9840ccgtcgcgcccggcacccgccccttccggt9900gggtcgtctacgagaacgacagcgtcctgc9960tccgcgacggcgcacgtctccgcgtctgca10020ccatggccggcggccgcgccctgtggggca10080ggcgggcgcacggcgcctccttcgtcgcga10140gcttcaccgcccggggccgcctgcccggcc10200ccctcgacggccggctcaagaccacccggg10260gagccgaatggaccgtgcccgacgacagcc10320ttctcagcctcaccctgcgcgacttcaccc10380ccccggcggacggccacggcggcccgtcga10440tctcgcaccgcccgcgccacgctcaccgcg10500ctcgcgccaccgcgccccccgaccgctcgg10560caccgccccgggctcccacgcaagcccgca10620gacgccccgcccctcacggagacgtaccac10680gtgatctcgtgttccgtacactcctgcggt10740ccgccctcaccctcgcaccgggcgccgagg10800cggacccctccaccgccggatcgttccccg10860cgggccgctcgtacagcgcgcgcgtctggt10920ccgtcgccgccggcgcccatcccggcctcg10980cccagtacgagagcctgctcaagcactacg11040agtcccagggcggcctgttccccagtcatt11100tgacctggctcaccacgcagaacaccacca11160ccgggaaactcgccctctccgggcactcga11220gccgcaacccggccgtcaagtccgtcacca11280ccgtcgccgcctccgccaccctgggcattc11340ccatcgccggtgtcgccgccaaccagcaga11400agctgcgggtcatcaccggcggcttccact11460gcgggttcgaggacagctccggcatcggctagctga犯ctgacctacggcgtcacgacctcctccctctacgaccaggtgtggggctccgccgccaagccctgaccggtcccgccgaccgacgcccagcacgcctgcgggcggccacgtgcggcgaccggctccacacccgaccccgcatcccgccgcacgccccggcccggacgaccgcgcgtggcaacagcgtgcgggc肌ggacccgcggcctcatcagcaatggtcggcttcggcagacggagttccccgcggccgctgccaccgcaccccggatcgagctgcgcagcgacatcactctcgccgtcgtcaaggcggctcgggtgtcgtacgacggcggttcgacgcgcggactgatccccttcgagcacaactccatgacgttcctcctcatgcgccaccggacctggtccttcaacgccgcgttctacgtgcccgacgccacccgctaccggtacgtcggcggcagcaccgacgaggcctacgaggtcgccttcgaggagtaccagatcgcgcgcctggtgctccccgtctcgacgcgggcgctcatgcacttcctcagcctgcgccacccccagcgggagatcgagatggtcgccatgccggtcacccacgaggcgttcaccgccgtccccttccccagggggccggacctgccctcgaagtcaacggtggcaagcggatcgcctccctggtcacgtcggcagccgccgctgtctgcccggacatcgtggagacggacgtgctcgcgcggtacgccgagggcaccctgaccctcccggccgacctcgtcagttcgatccacggccgcctgggatccgtccatctgcccgccagcgcgacagcggcaccgtcacccgcgccgtcc11520cctggctgctccacacgctcggagccgaca11580ccgcccagaacctgcccggcgtcgtgtact11640gtgacggcggcccgccgaccgccgcactcc11700aaccccgtggccgcccgcactcctttgccc11760cggatctcccacgcccgtgacctcgcacga11820accggagcctccttgcaaggtctacggcga11880gcaggaaggcggccccacactcgtcggcat11940tgcggggccggcggagagtgggtaggacat12000ggacgccggccgcgtcggggtcatgg兆tc12060cgtcgagctcgtcgacagcagcgcgagcga12120caccgccggtgaagacgccaacgacgagct12180ccgctacctcatgcgcagccgtcacggcag12240ggtacgcgctccgatcttcaccgtgcgcca12300cgaggagagcgcccggtaccgcgaggtcgg12360actgctgcgccaggagggcaagcccggcga12420ccaccagcaggtggtccggtccgccacccg12480gcggctgctggacagcggcatcgcgcggga12540ctacagcgtgctgtacgccacctgcaacgc12600cacccaccggcccgacgcggcctacgtctc12660cgaacagatggagacggcctgggcgaagct12720cttcggccgcgtcagcccgtgacgcggcct12780ggtccccgtcccctcctggaggactttgtg12840ggatcggtccgcacctccggtttcaagcac12900gcggcggacgccgacgtggtcctcgacaac12960tcacgcgtcttcacgacactcggcggccgc13020aacggctccgggatcgagcacaacgtgctc13080tccctctacctcgtgcccggtctggtggcc13140ggcggctgccgcatcggcgagggccccaag13200ggacgtccggtgcgccatgtcctggacgtcatggaacgcttcggcgcgaccggcgggacgaccgccgagggcggactgaaggtcagggccgcacggctgacgggctgtgagatcgacctgctcgactacacccgcaaccgggcgctcatgagcggtccgctctacgggggagccacc犯gaccgccctgctcaccgccgcggcggccgaaggcgtcaccaccttgcaccacctctatcccaagccggacgtcgtcgcgctcatcgacgtcaccggcccggagaccctggtcatccgcggccgctacaccctgccgccggacctgatcgaggtgggcgacgggccggtgcacatcacgggcgcacccgagttcgacgtgctgcgccggatggtcacggcccacccggccgaacggcccctgggcgtgttcagcgacagccagcccttcttcacgctcatcagcgaggccgtgtgggagcacctcggcatggacgccgtccaggacgactaccaccggacgggccaggacctcacggcgaccgccgcgctcgcggtgccgggacggaccgtgtaccgcgacatcgtgggcgacctgcggtcgccggccgccggctgagagggcccgtcagcgcacacgccgtcacgcgcgggaaccgtcgtgccagcgcctggcctgcgcggccgtccgcaggaaccaggcggcggtctcggcccgtcgcgtgtggcgggggg卿acagcagcgcgcgccagcgcagcagcacgcgcgagagcgacctgcgcaggtccagccagacgaacagctgcgtcctgtactgggcgtcgcagacccaggcctccgactccgctctgcgcgaccagtgcgggccgtggccgagccgctgtg卿gggctgcggcgaggatcaggatcctgcgcgggtctgcgggctccgcggtacgagggcggtcagcgcggccgtcaggacggcgttgcccgcggtgagcagg犯gctgcgggagctgggcaccgacatgacgtggagcggcatcggcgcgctgcgccgggacgtcgtcgtcacctggatctgcgcggccgtgacccccggcatggaccgggcggtggcggcgctgggcgtggtgaccgaccacgaggcggactcggctcccgtcgaggtcctcgccgcctcccgggcgctgatggccgggtgggccgagggggcgcgctacggctacgtcccgggtctgaccgccgcgctgagggtcgacggcgtcaggaccccggacctgcgggcggccgcggtgctgctgctgctgcgcaacacgcaccacctcgaccgcggactgggcgcggacgtcaccccggcggccgactgtgtggcaggcccgcgaacgggcctgccaggtgcggcccgcgggcggcsigcg犯cgcagacggaccacgggaacgtcgggatgccgggcgccgtgccgggaccaggcccagcgcaccggggtctcggtgttgtcgtgccacagggggcggatcacccggtgcatcaccgtgtgccggggggccgccagcaggtcgccgacgatccagtgcgcggtgaaccgggccacgtcgtcggtgaagtacagggcgtccatctcgatgtgggggatcgaggtcttcccggcgccggatatgccggcggtcatgcgggggtgtctccttcaccgcgtgccgcgccgagcgcgacgagcgtcagccacgcgcccacggcgggggcgagcacggcggcggcaccccaggccagctggaaggtcgcgctggcgttggccaggacggtcatcacgggtgcggcggctcccaggaccacgggaacggcccacagcaggaaggcgacggcgaagaccaggcagtgccctccgaagcggcgcaccgcctgcttcatgagcgcggccgcgggcagccaggacggtagcatcaccgtgaggctgtccgtcatcagc柳卿gggcggtcggcgagggtgcggcgccgggacgcggccggggcgccggtgcggcgggcggcgaggaaggtcgccccgttcagccagaggagcgcggcgctcaggacggcggccagtagcatgttctgggtggcgaggacgggcagggccggggtgttcgccgtccagaacaggcgcatgagctggcccacggacgtgatcagcggattgctgagctggacgagcgggagggcgcccccggtcagcaggccgatcaggccgcccgcgatgtgctgcgcgcgggtgaagaagatcagcgcgtcggcgaacagcgccgccaggtaccaccgctgtcccggccgggtggaggcgaggtgcccgaccggtggccggcgcggaggaggtggcgtccgttgcgagccgggcgggacgccgcgggttcttggcggtgccggtcatgggctcacctgctcgcggaccgcgtgggggatgcgtccgcgcaccgcctggctgcacgcctggaccttgagcgcgtccgcctcggccgccgtcagccgggggtagaggcccgccacgtcggtgagcagcagcgccgccgcggcgaggtcggcgttgacggcgatgctgg柳cgaccgggaccaggccgtccacgtcgacgatgtcgccgacgaggccgtagcggcccttgtactcctcgggcgccgcc15000aacagggcatccgccacggcgccggccacc15060cccggcgtcagccggccggcgggcgccagc15120gcgagccgcagcggacgcagcgccgagccg15180tgggcgagcagcagcgccacggaactggtg15240ccgtgcaggacgtcgagggccaccagcggc15300gcgaacgccagctgtgtcaggcacagcagg15360caggccggacccgtcgccttcggtgccggc15420ggcacgcgcacgcccagcatcagcagggcc15480gcgatcagatggaggcggccggggtgctgg15540ccggcgcccgtcatccagcccgcggtgcgc15600agtccgtccttgccgacgacctgttcgagg15660tcgcacgccgcgagcacggcggccagggcg15720tagaccaggaagacggcgccgcgcagcacg15780cagcggtcgaccagcgtgccggcgaggggg15840gtgagcgccgcgcccgtcacgtccagcggt15900gccaggggcgtccacaggccgttgccgacc15960cgtcgggcgtgggggcggtgtgcgggcggg16020acggtggcgtcc卿gggtcggtggtg犯g16080gtccgcggagtgcgctgtgccccgggcggg16140gtacggcgccccgtctacggtgtgtcatga16200gtggtgccggtgcgccgtccggtgagcagg16260tcggcgatccgtgccgtcgccaccccggcc16320gggatcattccgccggtcagccggggcagc16380tcgagcacctcgccccggtccggctgcccg16440agcagggtgtccgcgcgcagggccgccgcg16500ttgcggacgccgctgccgtcggcggagcgc16560gcgtccagcagcgtccgcagcagccggtcg16620aggtcgacccgctgcccgccgtggaacacc16680tgccggtcggcggccgtg犯ggtgcgggcgtcctcgccggtgaggccgacggccagccggcgctcccggttgagcaggccgaccagccggcgttgcacctggccggacaggaccatgcggacgacctccatggtgggcggggtggtgaccctgagcccgtgccggaagaccggctggatgccgagccgctccagatgggtgtcgatctgcgggccgccgccgtggacgacgacgacccgtgttccggcgtcggccagctcggcgacgtcctcggcgaaggtgcggccggcgtcgccctcgtcgaggacggagccgccgcacttgatcagcacggtccggcccgcgaggggccgtgcgggtgctgccggtgcggtgctcacccggtggccgcgccgccgcgctggtagaggacgccctcgctccagacccggtcgaccttgccccaggccatggccgaggcggcgtccgggaagaagccgctgccgttgaggttggcgctggtgttgcacagcaccgggactccgctcacacggtggtaggcggtgaggatgtcggagagcagcgcgtcgtcgtccggactcacggtctgaaggcgtgccgtgccgtccaggtgcacgaccgcggggatccgtgaggtccagccgggccgtacggcgtggtcgtacagcatgtgggggtcgggcgtgcccgggtcgaagatctccggtgcctcctcgacgaggcagatgggtgcgacggggcggtagtactcacggcccttgacctggttgagggtctccttcatggcggcgtcggtggccgcggcgaggatgctgcggccgcccagggcgcgggggcccagttcggcccgtccgtgcagcaccacgaccggctcctgcccggtgtgcagcacccgggcgagttcgtcgggcgagcaggggcgggcggtccagccctgcggtgtcccggtggtgggggtcagcgccgggcccagccgggtgtgccactccagcgcggggacggcgttccggccgccgatcgcgccgagcacggccgcgccgatcgcggatcccgcgtcgttggggaagggcgggacccacatccgccgtaccaggggcagggcgcgcagcgcgctgttccacttgatgttcagcgcgcaaccgcccgcgaagcacaggttccacgggccgtcgcccttccaggcccggatcctcgcgtccagccgttcgaggagcaggttctggaggaactcgtgcacgctggccaggacgtcctcgtcggacacggcg肌gggctgcacctgttcgcgtacggcgcgg犯gaagtcgtgcagcggcggcatggagggctcg犯gaggctgccg卿cctccgacggtccgggagtgctccgcggccgccggggacgcctcgttctcgtagtggtcgtggaagaccgaggccagtacctcgagcaccgcttcgctgggcttgcccagggcgatgtacgccatcagcttcccggcgaccgacaggtcgtcgacgttggcggactgacggtcccggcggaacgggccgaagtgatggccggcggtggcgtaggtgtgaccgatcagggggaagagggatccgccgttctccacgccggcctcggggtccacccagtacaggcgcgggaacatgccgccgtcccagacgagcacg犯ggcgggttcgccgcgccgcgcg肌ctcgctggtgcagtaggtgctcagcacgtgtcccgcggcgtgcgtgtggctggtgtacgggtaggggacgccgcgggggaggtccgcgattcgcggccgtgtccgtcctccatggtcgtcgacgcgttcagctgcgccggtacgtgctggggtggccgccaggccggcctccggtcgtccccgcaggtagtcgggcgacgaagtacgacgacggcatgatctccgtcggcgaccctggtcgccagctgacccgcgaacgccttagccgatgtttggtgtgcagccgactgcacgggggcagtgccgcceiccgccggcgcggcgcgcggccgaacgtgccccacacatggggtccaccgtcccggcggtacccggcgcgggttgcagcgcgacaccttgccgagaggtgcgatctcggtgcgggaggaagcggcatgccgagcc3gCCgggtC3ccgatccggtggctcgg卿tcctcacgcagatcatgttggtcgtccggggtcgtagcgcgacgccggtgggtcgccgcggacgatgtgacagtccgctccgggccgaaagggaagatgcgggcagcaccggcgaccgcggcccgacgacctcatgcaatgtagctcatctcgacggtgaaggtgccggacaccgacggacgcagcaggt18480cggtacgggccgacgacgagttccagcggctgtccgcggt18540ctctcgtcgccgtcccagccgtcgacgacgaaggcgtcga18600tgctcggcgaggatcgtgggcacgatgcccaggtcgccga18660ttggcgagtttctccatctccacgctcaggacgaggcgcc18720gcaccgtcgtgagtcagtttcaggccacaggtgatcatga18780gcggggtgaaggcggggggcgcggtgcgcggggcgacggg18840cgcggcccggggggagcaggtcggcccatacggcgggcat18900tgaagccgtgccggacgaaccaccggccgctgtgtttgga18960agccgcccagggcggccagggcgtccgcgcgctccaccat19020cttggcggtcggcggcgacgcagaggttgtacagcagcag19080ggccgacgcaaccgatgacgcgcgagtcgtgcacggcggt19140tgcggaactgcgtaccgctgcgggcgacgagcaggtcgtc19200gccgggcgatgccgggtgcgtccgtggccagcgccgggcg19260tggcgccgggcgaagccgagcccgaacggctggtcggtgg19320acgttgacgtgcgggggccgcgacaggcaccacaggacgg19380gacagcgggctcactccgtcgtagaggcggtcggcccgct19440acgagggcgaactcggtgcgggccatgccgggcgcgacgc19500ccctccaggtcggtgcgcatgctcaggctgagctggtgca19560tacacgttgccgcccgcgtaggggtaacgcgccgcgatgg19620ccgcgtccgccggcgatgagccgggggagcagcagcgtcg19680acgttggtgtcgaccatcctgcgccagtcgtccaccttcg19740ccgctggagaggcccgcgttgttgaccaggcccaccaccg19800tcgtcgagcgcgcgttccagcgcgtccaggtccgtcacgt19860cggcccggcccttccccgtcggcgagttccgccagccggt19920atcaccgtgtgcccttgcgcggcgagccggcgcgcggtga19980gccccggagaccacgacggtccccagttcctgactgctca20040cgtcatctgtgcgtgccctgctgccgggtgacggcatgtc20100agcagcatgtcgcgggtgccctcgcccagcgagggatcgg20160cgaccgagacgtccgcgaccccgtgccggacgcgggggtcgtcgccgaagaaggagtcga20220ggcagtcggtgaagaccttctcggtgatcagctcgtgctccggtgtgtacacgctggtcc20280tgccgccgctgatgttgtgccggttgaccatgtgcaggctgacgtaggtgcagccgtcgc20340ggtggacgccctcgggggtgggccgcccctgcgcgtcgtcgcgggcgacgatgcgcacgc20400agtgcacctgcacggcccactgctccacctcgggcagcggcaggcggccgacgttgaagt20460cgatgagcgcggtcaggaaggcgccctcgcggacctcgtcggtcagctcctcgtacttgc20520gccactgtccgccggcgaaggcgttgttctcgacggtctggaagtagcccgggttgtcgg20580cgaccagcagttcaccggtggcggggcgccaggtgtagcgggtgtgccgccggtagcggt20640agttgcccccgtccggcaggtacgggtcggccggcaggtcgtcgtaggaggccgcgaggg20700tcttgaggctgtcctggagggcggcgggtacccgcatgtcgctgccggggaccatggaga20760agccggtgcggacgaggtctccggtgatgtcggccgggctggacagggcggccgtgggtc20820gggtgagcacgggaggttcctttcttccgccgagaggcgggctgttccgtggcgggctgg20880ggtcggtcaggtgcgggcgaagtggacgagcagcgcccgccggtcgtcggggcagccctc20940ggacaccggggggacgccgtgccaggagtcgtcggagcgaaccagcaccaccgacgtgcc21000gagcagcggcaggacccgccgggcgacgtccttcatgtccggcccgcgcagcacgtgcag21060gtcgccctgccactcgctgcgccaggtgtcgttgaagtagaagagatgggtgaccgcctt21120gtcggggcggtcggtgtgcggctggatccagcagccgctggagtaccgcgtcatgcgggc21180ctcgacggt'gcagccgtccaggtcggcgccggtcagctcgacgagggcgtcccggtagtc21240gtcggaggtcacctcgtcgaccagcaggcgccaggcctcgggcagggtgtccacggcctc21300gcggtgctgccggccctcgctcacgagggtccggttgtgcatcaggtagtgcttgccccg21360gccgcttcccggccgccgttcgctgcgcacgaacccgtcggcggcgaacccgtcgttcag21420cgtgcgcgccgtgtcgtcgtcgcgg卿gagctcgggacgaccgcgtagtggtaggggtc21480cttctcgagccgcgcgtcgcgcagggcctgaaggtcaatcagcgtcatgtcgttctctcc21540tcggggcgtggtgctcgaagacccgccgcaccgcccgcagccgggtcttcggggacagcc21600cgtgctgccgctccaggtagcgggcgacgctctcgtgttcgtcctcgatgccggtgatca21660ggctgcgcatcgtccaagcgggggacgcggtacggatctggagctcctccagggaccctt21720cgtaggaccactgggggcgcgggtcctgcggccccagcgcccggtaggcgcggccggtga21780ggctgtagtcgcccgccacggccgccagccgtaccccgaggccgcgcagggtcagcgcgc21840tgaccacccccgtgcggtccttgccgaccgtgcagcagacgtagacggggtcctggtccg21900gctcggccagcaggccgatgatctccacggccaccggggcggcgagggtcagcatcgagc21960ggtagttgaacaggtaggcgctgggcggcgggcggcgcacaccgcggatgcgggacatgt22020tcccgcccacgggccggcgcaggagccgggcgcgcatgccggccggtccgtcctcgatgc22080cctgctcgaaggcggtgcgcaggtcgacgacggtgcggatgcccaggtcgtccagcgcgg22140gcgccgtgagcggggagggggccggcccccggtagagcacgccggaccgcagccgcgcgc22200cgtccgggccgggcagcccggcgctgtcgcggacgttgggcaggccgggcagcgcgacgg22260tgcgcgagccacgggtgggacgggccgccgccgcgggagttcgctcggcggggtgtcggc22320gggctccggtggtcaccgtgccaccgcctgttcgcgccgcagcagcaggtcggtgacgcg22380gtccgcggtgctccggtcggtgaccccgatgcgcaccgcggccgggctgtcgggggtgct22440gggcacggcgcgcacgacgtagccgtgcgcgtggaggtgggccgccgcgtccgccgcctc22500gcgcggcgaggcgacctgccaggtggcgaagttgccgccgcccgggagggcacgccagcc22560gggcagcgcctcttcgacaccgcgggagaagtgttccctgacctcgcggacccccgccca22620gatctcctcgaacaggggctgctcgcgcagacaggcccgcaggagggcgacggcggtgcc22680ggacaccggcccctccgggtcgaggtcgagcaggggccggacggtgtccgggtgcgagct22740gagcacggcgatgcgggcgccggacaggccgaagcacttggagaaggtgttcacccgcac22800cacatggggcgggtgggggcgcccggtcagcgtcccgatctccttctccccgccttcggt22860gaaggcgaggtaggcggtgtcgaggacgagcaggctgccgtggtcggcgacagcgcgggc22920gagagactccagctccgcccgggcgtggacctggccggtgaagctgtgcggctgggtgac22980cacgacgaaggcgggcggaccgccgcgcagccgggcggccaggtcggcgaggg柳accg23040gccggtgccggggtcgggcggcacctggtcgagccggcacccggcgatccgcgcgaattt23100ctgccagccctcgtagttcgggtggtgcaggacgatgcgccgggctcggggaaaggcccg23160caccagcagccccaggcccgggtcgctgcccgcggtcagcaccagcccgtccgggtccgc23220gtccaggtggtcggcgatctcggcgtagacgtcgcgcagcaccgggtaggtcaggacctc23280cagggggtcc卿ccggcgagcgtgcgccggtgcaggtccgcggcgcgcgcgtcgagcag23340accgctgctcttgaggttgacctcgccgggccggcgggtgcgacggctgcggtagcggcc23400gctgctctcgacccggaagggggacggcgctcccgcctgcgcgggctcctcctcgcgcgg23460cgggtacgcactcacgatgcccccagcagcaccgggtcgccgtccgcgccggccgcgcgg23520gcggggatccgctcga卿cggcggtcacgtcgggctgcgggccgaagaccacttcgtag23580gcatcccgcagctgggccgggtccaggtcgtgggtaccgggcacgaacagctgccggttg23640aaggcggccatctcctcgtccgacaggtcggggcgggccgcctcccagggcgcgtagacg23700gtgggacgggcccgcccgccgagcgcctggacggtcgcgatggtgtgccgcaccccctcc23760acgctggtgcccggcagtcccacgatcacgaagcagttcagctcgatgccggcctgcgcg23820caccagccggcgagattctccaggtcctgctgcgacttgtgcttggagcggggcagggcg23880ccgtggccgtgcgggtcgagggtctccagaccgacgctgatccggacgcagcccgcccgg23940cccatggcccgcacgaggtcctcgtccaggtggtgcatcgtcgtcgcgcacttccagggg24000aagcgtgccccgtcggcggtgagccgttcgcacaggtccatggtccagcggcggtccagg24060gtgaacgtgggcgcgtag犯ggcgacgtactcgaaggacgcggtgcggaaggactgttcg24120atgtactcgacggtccgctccacggtgagccggcgttccttgcggccgaagatggggtgg24180acctcgcagtacgagcagccgatggggcagccgcgggcggccgggacgacgagttcgcgg24240cgctgcgggatgccgcagaacttgttggcgtcgtcgtggtagagctcgtcgtagcgctgg24300taggggatctcgtccggggtcggcaggtaccactcctgcgcgggcagcacggcgcccggc24360gaggacggcgcgtgccagctgccgtcggcgtgccgc鄉tgcacgcccggcgccgtgacg24420gtctcgccgtcgaagaaccgcagggccgccaggaccgcggcctcgaagtcgccgttctcg24480gcgacggcgtcgatgtcgagctgctggaagaacagcgggttgacgccgctcaggcggccg24540aaggtgacgatcggggtcccggggctcagtgcccgggcgtagctgacgaagcgccgcagg24600ccgtcgatgccgtcgaagtcgttcatgacggcgatggcgtcgtagcgctgctggaagagg24660tcgttgccgatgtccttccaggtccggcgcagcacggtggcgtccaggacggtgacctcg24720ctgtccggcagcgcggtgcgcaggtgaccggccacctggtagagggcgaggtggtggccc24780gcgttgaagtagctgaggatctgcgggggccacacgaccaggatgcgcgaccccggtgcg24840鄉gcggccgcccggccggcgggcgtgacgtgctcagacatggagggccctttcgcgggt24900gtccgggcggacacggtggacggacttgaagcggtcgggcacgggattgcgcctgtcctg24960ccagacgacggcggattcccaccaggtctcgacggcgaggagttcggccgcggtgtcggg25020tccggtcagcgagacgacgatctcggcgacggacgagccgagggaggtggcggggtcgta25080gtggcgcccctcctcaccggtcgcggtgtacaagagggtctgcggcagggggcttcgccg25140cggcaggtggcgcagcaccccgtgggcggaagggaaacgcgcgtagccctggcgtcgtcc25200ggtcggacggatcgtcacctggtcgctgcgcccggcctggccgagcaggctcgcgccgtg25260cagatggacgccgagggtgtcctcgtgcgtctcgaccatgcgtgatccgcctgcccggca25320ggcggtctcgcagacgacgagccggtcgtccggggtgtggaagaactcgacctggaaggc25380gcagacgccgggcacggccggcatggtggccaccaccttggccgcggtgtcgcgcagccg25440ggcggacatcgggtcctcgtccggcatcatgccactcatcccgggggcgtcgtacgccac25500ggagaaccagtcggagtagggctggtaggacggttgggccaggaggatccgcccgtcccg25560catcaggccgttgatgtggtagaagtcaccctccacccaggcctcggcgaggtcgggtgc25620ggcggtgcggcccgccgcccagtcgtcggtg犯cgccgtcagcgcgtcgccgtcccacag25680caccctggtgccgttcgaaccgcctgacaggcggctcttgacgaccagcgggaatcccgc25740ctcgtccgcgaaggcgtccaggtcggcgggcgaggccagccggcgcatcggggcgaccgg25800gatgccggcctcggtgagcaggctcttcatcgtgtacttgtcgcggtacgcggtggcgca25860ggccacgtcctggccgggcagaccgaggcgctcgcgcagcgtagcggcgggcagcacctc25920gcgctccccggtggacagcacgcgccgcacgccgaagcgccggcacagggcgaccaggtc25980ctcctccagcccgggccggtcgaggctgctcacgaggtgcagatggcggaagccgcgcgc26040gagctcggggaaggcgctggtacccagtccgctgcgcgtgctgaccacgatcagctcctg26100ccgggcctgcgggaaccactccggcacgcggtgcaggatcggcttgttgttcaggaggag26160aaacacggaagttcctttcgcctgcgggggccgcttcaggcgtggccgtcgcgcagtgcc26220tgtgcgtacgtctccagggcggcggaccagtgggcggcgtactcacggaccgcggtgagg26280aactcctcggcctgctcccggtccgccaccagtcgcgtcatgccggtgtcctcgtcgctg26340acctgggccgcgtgcatggtctcggccttgatgtgggagtccacccaggcgaggtcgtcg26400cggccggcgaacagggtggtcccgggtacctcgaccttggcgtacagacgacggaagccg26460acggcgatgtccagggcgatgtcctccaccacgcgcaactgcaccgccgcgcccagcgga26520tgggtggccagccggtccatggagtccagcaggccggtgacggcgcgggggagtaccgcc26580gccgactgccggtcctcctcggcgacatgggcggcgacgggcttcaggacggtgtcctcc26640caccagacgtagtggatgccggccgggccgcgcggagccacctcgcggaaagcgggcgcc26700gcgttgtccaggtcgtcgccgatgacctggtagacggtctgg犯ggcggccagcagctcg26760tggtcgggggcgtcctggccctggaagcggcgggccatgacgccc卿ccgg卿gcgtc26820gtgaacatgaacgccttggtcatggcacgccaccggtgggcgatggcgagcgcggcttcg26880ggggtgacgctctcggccttgcgggcctcgccgaagaaggcgttgtcggcccgccgcagc26940cgtgcggcgtcgatctccttccccacgcgcgcgtcgaggtcttgttgttccgcggcggac27000agggccaaagcgttcacggtcacacactccaaaggggacggggccggggcgggccggacc27060ggcggtgccgccggtcagacgcccaggcgctccttgacgtcggcgaagaaggcgatgtgc27120<sequence>complexsequenceseeoriginaldocumentpage33</sequence>gtcagctccttctttcgggcatcgagtagcccagtgcgagggtgagcagagaaccggggg28920cgtcctgggcgacgggcgagsccgagtgccaggaggcgtccgaggggacgacggtgt卿28980ggctgcccggtaccggcagcaccgetgcgggcgggggcgtccctgtcgggcgactcccaca29040ggtcgtaggtgcctccgccgttctcgggccagtgctcgctcaggacgaggacggcgttca29100tcgcccggtcgggtttgccgcggtgcacgttccggtagtcaccggggtcgcgcagcgaca29160cgttgacctccagcgccgcgccctcgaggtccactccggtgcgggaggscagccaggtgc29220gg卿gagtcctgtacgacctcgtcgagcagttcggcccaggccgggggcagcttctcgg29280ccttcggtgtgtgacgcccgtcctgatgcaccgtcatgagccagagccggtagtgcttgt29340cg犯ctccggcgcctctttcaccgcgcggatgaactcgctcatggccggcggttcggcgt29400tgagccggcggaggtcctcggcgtcgatcaggtggsgtccggtgtggtgcacatgtggtt29460ccgcgtgggtgaccacctgggcgctggctcgtatcaaggtcgcctcgctggagtcggggc29520ccggtgcgcggtccgtgggccgcggggacggggcgccaccggcggtcgcccggtggtgat29580ccagagtctgcgccgggtgccttgccgatctctcgcccgaccgctggccgactccttgcg29640ggggtccttgcggccgcccttgcagctcgcgcccggggcgtcagcgcgggtggtgcgggg29700tgtcctccagccgcgcgcgtgcctgcttcgcctccgggtgtcccatgtcgtcgaggatcc29760ggacggcctggcgccacacgaggaccgcggtgatgtgcgctccccgggcctcgtgggtgt29820ctcccaggtgcaggagggtgtcggcctggaggtagcggtcgttcatgtgccggtacaggc29880cgagcgcccgccggtagcagtccagggcctccgga/tggtgcc亡caggtggtggtgggcga29940gcccgaggctgtcccacgcggccgcctcgccgttgacgtcgccgatggcccggtgcagcg30000agaccgcccggtcgcaccaggtgatcgcgcgttcgtggtcgccgaggaggatgtgggtcc30060agccggtctcgttg邓gscgacggcctggccgccgaggttgcggatgccccggtacagcg30120ccagggcatgctcgtagtggcgcagggcctcggtgtgccggccccgggcgttggcgsggs30180aggccatctgacggcgggtccgggcctgtcccgcggcgtcgccggcctcggtgaacaggg30240tcagggcacgccggag,cgcgtcggcccggtcgtcctcgc卿ggcgtccccaggcga30300agcccagcgcccggcaggcctgtgcctcccgcaccgggtccttcagcgagatggccgcct30360ccagggccgtccgctggacggctgtctggtcctgccatctgccctgccggtcgaggtgca30420gttccagtgcctgggccagcagccacgcgtgctgcgggaagcccctgcgctgtgcgtacg30480gcacggcggacagcaggaccggcagctcgcggtcgagccacgccatggcctcctgccgtc30540ccccgatcggttcgggtgcgacgcccggtgcggcctcgggttcgagcggggcctcgatgc30600ggttcggtatgagcgcctcggcggccgcgtgccgtacggcgagctgccgggtgtcctcgtggaccttcagcaggtcgtgg犯ggcgaacccgccgttcagggtggccagcagcgccctgaccgcggcggcggcggagatgtccgggcccgccgcctgcgggcccacactgcggcaggaccggtcctcgcccgcgaagccgtcgaggctgtaggccaggggcaggtcgggctgggtcgcggggagccgtccgcacaggtcgatgatctcgtcaccgcccacgcggccggcgaggacttcgctgatcggccgtgccccgtgggtggcgaccacgaccaggcacgaggaactgcccggcatcatgtccagcaggatcaggatccgcttgccggagtcggtgtcggggggcaggtccctggcgggcacctccgccgcgggcacggcggactcgcgctgaccgtccgggaaccggtgggcgaggctgccgacgcccggcatcccgtcgatggcgccgtcgtcgagagcgtccagcagctcggtgaacgtgcacagatcgggcggcagttgggtcggctgccggggcggcaggtcggtgccggagagtgtctgcacatcgtgcagcagacgggcgccgccgacctggacggcg卿cgggcgcgcagccggccggtggcggccagcgcctggaccagcagcgcggcggcgctctggagcagtggcacgaggtcggctccctcgcgcagcacggcgaggtggccgcgtaactcctgcgggacgcccgcctgggtgaacagctcggcggcggcctcgggctgcgcgagttcgcggaaccgcagcagatagccgccgacgcggcgcaccag犯gccggcacgcggtgtgcaggcagtggtcgagCEigcc30660cctccagttcgcggctctgttcgagggcgt30720gctggggacccg肌cgggccagcaggtggg30780cccggcgggccggcagggcggcgagactgg30840ggtgcagggcg卿agcctgagcagccgtg30900aggagaacacggtgcgcaggtcggtgtagc30960cgcggtcgtcgaggagcgcggcggctacgg31020catgggccgcgacgatggccagggccaggg31080cgacggccgcgggctccgcggcggtgcgct31140gtgactcctcgcggctgagcaggcccaggg31200ggccgcgcagctgggtgcggctggtgatga31260ggggccgcacgtgctcggagtcgagggcgt31320ccaggagactgcggtagagggcgacccgtg31380gcacgccgagggcggtcaggaacgagcgca31440tcacgtcgaacgcgcgtaagttgacgtaca31500ggtgcgccacgtgcacggccagggtcgtct31560tgatcaccaccgaggcggccgccggccggc31620ggcgggcgagttcggtgcggcgccccacga31680gccgcacagcgggggcgctctccggcgcgt31740gcggtcggccgtcgtcggtaccgtcggggg31800ggacggcgctgagttccggcccgggctcga31860tcgtgtcgtacagggcgagcgcctcggcct31920gacggacgtgcagggactcgtccagagggt31980gcatccgctcgggtgctccggtggcgagca32040ggtgttcgctgtcgaccgcgaagaacgccg32100ccgcggcctccccgcgccacaacgacagtg32160tgtcgccgccggcccgggcggcgcgggcac32220cgagggtgccggcgtcgacgtcgatggcgt32280cgggagcgcgcggcgccaggtggggttcca32340gcagcttgcgcagattgccgacatgccggtggacgatgttcgccgcgctgctgggcgccc32400cggcgggccacagggcgtccacgatcctggacaggctcacgggctgtccggcctcgagca32460ggagcagggccagcaccgcccgctgcttgggcggccccgggggcagttccgcaccgtccc32520gccagatcctgatgggtcccaggaccccgaaggcgatgtgtcgatccatgtcttcccaca32580agcccggccctgcggccgacgaaactgaaatgcgctgatcagagtgtatgtggcaggctc32640tccggcaggccgtggccgccaagtggagggagacgttccttggcttgttctcaccgtcag32700tgcaacgtcactctttccgcacaggggcatgtgtagcctgctcgccgcacgtactgagcg32760agtggaaggcatatgcaccaggcatgatgtatgcaacggaagtacaccagccccggactc32820tgacggcggacctctcactcgaagcatttggcgtgatgacggcacggcggggcagcgagc32880cggtgcacctcggacctccgaggcaccgggcggtcctcgggctgctgatgctgcgcctcg32940gacaggtggtccgcgtcgaccagctcgtcgacgagttatggggcgacaaaccgccgcgcc33000ggccccacgccaccctccagacctacatgtctcatcttcgacgggccctgacgtcgggtc33060acggcaaggacgccggggtggctcccctgcactaccgggcgcccggatacgtcctcgcgc33120tggatccgcaggccatcgacgtgtgccggttcgacg邓atggtctcccgcggacaacagc33180acgccgccgagggccggttcggtgaggcgcgcgaggcgctcgactccgcgctgcacctgt33240ggcgggccgaccccttcctggatctcacgtcctacgagccgctggccgaggagagcgcac33300gcctccagcacctgcgcacggcggccgtgacgatccgcgccgaggccctgctcgccctcg33360gcgacgcgcggaccacggtggagtccctgcggcgcgaggtgatccgcttcccctcggacg33420aacgcatcgtggccgccctgatgaccggcctgtaccggctcggccagcagaccgaggcgc33480tccgcctgtacgaacgtacgcgcacgcagctgtcggaggagctgggcgtggcaccgggcg33540acgacctgcggcgcgtccatctggccatcctgcggcacgaactgggcggcgccgcaccgg33600ccgggcagcgggccgaggtgcgggcccggccggaccgcgagccccggagcgaggagagcc33660gtccgccggccgacgccgtccacggccgcgccgccgaccccgcgacgaccggcaccggac33720ccggcgggcacaccggcgcgcggcctgtggacgacgccgccgggtccggcaggaccccgg33780cccacgcgtcgccgcttccgctcttcg犯gggcgcgaacacgccctggcctcgctgcgcc33840gctccatcacggccgccctggagggcagcggacatctcaccgcggtcgtgggtcaggccg33900gggtgggcaagaccgaactgctggcccaggccacggcgcacgccgccggatgggtcgccg33960gaacccgggtggtccgggtgagctgccggaccgcggagggcatgccggcctgctgggtgt34020ggcagcaggcgctgcggatgctcggcggccccgacgcgctgccgggcgacaatgcgcccc34080ggctctgtccggaccctacggtgacaacgctgtcagactcaccggagggagcggacgccg34140accgccgggagcagacccagcagcgcttcctggcccacgacgccctgagtgaaacgattc34200tgcgccacgcggacgacgctcccctcctgctcgtcctcgagaacgtgcacctggcggacc34260gccccacgctcgacgtcctcgcactgctcagcgacggcacacagggccgcgcggtgagcg34320tggtga/tcagcgtccgggagtccggtgtgggagccggagccgaacccgacggcccgctcc34380aggagttgctggccgactcccgcacggacgtcgtccacctcgacgacctgtccgaggaac34440aggtccagaccctcctcgcggcccagggcgggcccggcccggccacgcccgtggtgcgcg34500gactctacgaacgcagcggcgggaacccctacctgctcggccagctactggcacacgcgg34560gtggtgcccgctccctgcacgccgcgcgcgcggcacgccaggtcctcaccgagatcccca34620ccggcgtgtccagcatgctgcgccgccgtctggccggactggccccggaggtcctgcgcg34680tgctcaggggatgcgcggtactcgggaccgaggccgacctgaccctgctgaccaccgtgc34740tcggcgacaccacccccggcgtccgcgccgtggaggaggcgctgcgcaccggtctgctgc34800gccgcgaccacgatcacgcccgcaccctggtgttccgctacggcctggtacgcgacgtac34860tgctcgccgagatgagcgaccaggagcgttccgacctgcacgcctgggcggtggacgtgc34920tcggccgccaggccgacggccaccccgcggcggcctcgcgcctggcgcaccacgcctggc34980aggcctcgctgaccctgcccccggaccaggtgctgccgtacctcgtgcgggccggcgagc35040aggccgccctggagagccggtacgaccgcgcgcagacctggttccggcgcgcccacgcgc35100tgctcacctccggcccctcggcgagcggtgcggccgcgcaggcgctgcaactgcgcaagc35160gcatcctccagatcgccaccgtcacccgcggatacggcgaccgggaggtcgtggccgagt35220cccagcgggtgctgagcatgtcacccgccgcggtccaggagccggcactggtgttctccc35280agtgcatcgcccaactggtcaccggacaccgggaggagagcgcccgccgcgcccatcagc35340tgcgcgtcatggcgcagaacggcgacgcgcccgaagcccgcctgcacgaacggctcgccc35400acggcatcctgcacctgcccgaccgcaccgccgaggcgctggccgccctgacggaggccg35460agcagacggccgggaacctctccgccgcccggctccggcagctcgcgcaccacacccagc35520acgacccccgattcctggccatgaaccaccggaccctcgctctgtcgctgctcggcgccc35580aggacgacgcgctcgccctggcccaggaactcctggcgctcaccggctgcgagggcacac35640cggtcgaccgggccagcgcccactactcccacgcgctggtcgccgccctcgccgaggacg35700ccgacgccaccgcctcctccgccgccgagggcctgcgcatcgccgacgcgcacggcctgc35760tgcactgggcggccctgctcaaggtctgccgcggctgggcgcagcaccggctcgggacac35820ctggcgcactcgacgccctcaaagcggccgtgaccgacctgagcgtccgccacctgcgga35880tccgcctcccgctgcacctggggctgctggcacacgcccagtacgacgcgggcgccgtcg35940aggccgcccgggcgaccctgcggcgggcggcccgggagatcagggccgcgggcgaggacg36000cctacctcagccccgacctgcccttcaaccggctgccgcgcctccagccgccgctgccgc36060cccgcgggtgcagcgatccgacggagcatctggccggcctgcccaggcgttccggccact36120gaccggtccaggccgctgacgagtcccggctcgcgacaagccccgtcctcccacgagccc36180cgatgccggacggcttcggccgcgtcccgccggccacccccacccgtacgccgtgtcccc36240ccgcgtg犯aggcccggtccccgatgaccaccccccacccccatggccccgacgacgccg36300cgacggccgcgcccgtcgtgtccgccggaggcaccgccgcgacggccgagcccgccgtgc36360cgagcgcgcccaggagcgaaccgccgttgtgggcgctgcaccgcgaactgctcggcacca36420cgatccgcaccgacctcacccatgccttccgtcccggtcaaccgcacgccgccgccttcc36480ccgacgaacggcgcgagacgctcatggccacggcacgcggcgacgcctgcgacctgaatc36540tctacacgttcgtcggccagtggggcacccacgtcgacccgccgtcccacttcgtgaccg36600gcgcccgcacgctggacgagatccccgtcgacgagatgatccttccgctggtggtcctcg36660acatcagcgaccgggtggccgccgaccccgacgccgtaccgaccctggacgacgtacggg36720cgtgggaggcccgc肌cggccgtgtccccgcggggtcgttcgtcgcgctgcgcaccgact36780ggagccgccgctggcccgacgcggcggcgatggcgaaccgggacgccgacggcgtgagcc36840actgccccgggtggtcggccgaggtgctgcgccacctgatcgaggaggcccacgtcaccg36900cgatcggccacgagcaggccgacaccgaccccggcaccgccgcctcggcgggcgacttcg36960gcctggaacggtacgtcctggagcgcgaccgctggcagatcgagctgatggccggtctcc37020accgggtcccggaagcgggcgccctgatcgtggcgacctggccccggccgcagggcggat37080cgggcttccccgcccgggtgttcagcctgcaccgggcgccctgagcgggggacaccgccc37140cggaacgaggcggccggcggtcaccttggccggcggcggcctctgcaccggcggtcccac37200acggtcgggcggtcctggccagggaccgctcgggaccgctcggg犯ggcaggggatcgcc37260gggcgtcgctcgtgccgggatccgacgggacgtggccggcgtccgtggtcgtcctgcggc37320tcagggggccagttccgcgcggcgcgaagcctccggacccggtacggaggaggtgtcgtc37380cacccggtgccgcagctccgccgagacgtccaccaccccgtccacgccttgacacagccg37440tatgacgaccgggacgagcgacttgcgctccacacggcccttcagcgacacccgcccgtc37500gacgacccgtacggtgaccgcccccggcatgatcccgagcgtgcgcaggagcacctcacc37560cgagatctcctcccggacggcgctgtcgctccgcaggaagacccggagcagatcggccct37620gctgatcaggccgaccagtcgtccggcctcgtcgaccaccggcagccgtttgacgcggtg37680acgctccatgacctgggcggcttccaccgccgtccactgcggtccggccgtcaccgcggg37740gctgtgcatcagccccgcagctgtcgtcgcctccgccttcgcacggtcggcgggcccggg37800atgcaggacgggcaacaggcccgccggatccaactgggcggcttccttgcgcagcaggtc37860cgcctcggagaccacgcccatgacgcgttcctcgtcgttcacgaccggcacggcggtgat37920gtcgtgctcggcgagcagcttggcgatctccttgaagccggtgtcccggtgcaccttcac37980gaccgacgtggtcatgaggtcgctcacggtccggtgccgcatggctcccgcctccctggg38040tcgcgtgcgttcctgcttccactgtccgcccggtcggcgtgaaccgcatgggccgaacgg38100accccgtacggcggcgtgcgtcacgcggccga犯gagggaggctggacggagagcggacg38160gacgccggcgcgcgtccggcagtcggcagacctcctggagcccgtgatggaagccgcacg38220caaggccgggcgtaggacacggccggtggcaccggcggtgaggagcgggctgtctcacgg38280gtccgagtgatgcgcaccggtgcggaccggccggccggtgcggtgaagggcgcggcggtc38340gacgacgcctcttccgctcttgtcgctgccgccccggcacgacagctcgccgctgccgac38400gtctacgctgcgctggacacctcacggcgtggtctcgcgccggcacaggcagcgaagagg38460cttcaggagtacgggccgaacgaactgccgcggacgcgacgccgtgccgtgtggcgggac38520gtggcgacgcagttcacggatctcttcgccgtggtcctgctggtcgcctgcgcgatcacc38580ttcctggcctacggactacagcagccccgtgacgcgggcactcttcagctggcggtggcc38640atcctcgccgtcgtcgtgctgaacgccgccatcggtttcgcccaggagtactcggcggag38700cgcaccgcacaggccctggcggcgatggtgccgcacgcctgccgggtgctgcggggcggg38760gagcgactggaggtgcccgcccgggacctggtgcccggggacgtggtggtgctgg邓gcc38820ggggacgccgtgtcggcggactgccgtgtcgtcgaggcgcacgaactgaccgtcgacaac38880gcgccgttgaccggtgagagcaaccccgtggggcgcaccgccgaaccggtgcctgccggg38940cccgcgctggetggcccgcaacggcatcttcatgggtacggacgtggtcgccggctccggg39000cgggccgtggtggtggccacgggggcgtcgaccgagttcgggcggatctaccggctggcg39060gccgccgcgccacggcagaagaccccgctccagcaccaggtggccgtcatggcacgtcgg39120gtggcgggggcggcactggcgatcggcgcgctgatgttcgtcgtccggctccccaccggc39180gagtccgtcctgccctccttcgtgttcgcgctgggggtgatggtggcactggtgccggaa39240gggctgcccgccaccttgtcggtgtccctggcgatcggcgtacggcggatggcgcgccgg39300<sequence>complexsequenceseeoriginaldocumentpage40</sequence>ggtttcggtgtcgccctcatggccgcgatccacaccgccgcgctcgacgcagccgactggctgctcgcggacgagatccgcaaggcgtgggccccacggtgaaagtgatcgtcgtcgggttgctcgcctcggaaggccaccacgtcgaagggttgcccgacagcccccggatccgcttcctgcggtccgccgggatcgagcacgcggacggcaacatcgtcagcgcgcgcaccgcgaagggcatctacgatccgcggcgcgccgacatctgcgtccgctggacggtccatcagctccaccaactcagcttcggcaacggagagaccctgctcggccggcggctggccgagttcgatgtgggcgcgggccgctccctgatccccggccacgcctttgccgtcgccgccgccgcgctcggcag犯cgtg犯cgtcctcatcgccggcgcgggctccgccgcccgcaacgacgtcaccctcatcg犯ggccgcgtcccggtgcggctggtggcgcactccggcgtcctgaccgccgacctcgtcctcgtcatcagcctcctcgccaaacggcacaacgacgccgacaacgcctggctgttcgactccgccaccccgctgatctccctgatcgacctgctgcggctcagcaaggcgggcgtcgacaggacggcgggccgcgccctgggcgacgtcatcgtccgtgacggacagccgaccgtgcccgcactcctcctcgtgtcccacacggtgacagctcccggcggcctgtcgtccgggccgcccgggcacctggcctttcctgacgcgccctccctgcgtgaagtgcagccgcaggacggtgtcgagttgtccgggggccaggccgccgtgtgagctacctgcctccgttccaggccgtgttc40980gcggtcctcaccgccctcggcaccctgccc41040ctgcgtcgacgcgacgcccgtcggaaggga41100gcggacgggtgggcaccgccctcgccgccg41160tcgtcgaccggcgccccgaggccgtccggc41220acgagggcaacggcttcagccgcgccgtcc41280ccttcgtcgccgtcaccgccggcgacaaca41340agacctatcgcgtgccgatcgtcctcgccc41400accgcgacctcggcatctccaccatcgcca41460ggatgctgctgcaccgccacctcagccccg41520tcgtccgctcggaggtgcccggctatctcg41580acggtgagatccgcgtcgtcgaagtcaccc41640gcacgccggcgcgggcgggtgacctgatca41700gactgcgcggtttcctcgacaaggagctgg41760acgcctcggcacccagatcgcccaggtcct41820cgacaccgatgacgcccgccttgccgagct41880gggcgacgcctgcgaacccgccctcctgga41940catcgccaccaccggcgaggacgaggacaa42000gttcgcggtgccccgcgtagccgcccgcgt42060cgaacgatggggcgtcgacgtcgccgtccc42120ggaggccaccggtgccaccgacaccgtcgc42180ggtcgtcgaaacggtcatcacagagcagtc42240cgtgctgcctccgggcacggtcgtcgccac42300cgaaccgaccgagcgactgcgccccggcga42360cgag犯cgagatccacgcagcgttccagtg42420cgccgctttcgcacgccgtccccgtggtcc42480atggagcgagggagaagtagttctcctcct42540cgaggccgtagaggcaggatcgcaggtcgt42600cgtgggccagttcgaggtgggtggcgatgc42660<formula>complexformulaseeoriginaldocumentpage42</formula>cgggtccttgagaacggggtagccccactcgtcgagatcgatcagctcggggagcagttc44460gccgcacaggccttgcccggtgcaggcgatgcggtcgacgcgcagggtcctgtggttcgg44520ggtcatcgccaggtgtccggtgctgtggcgggcggcacggggatccgtggcggccggtgg44580gccgcgggac兆gcgccgcgggcg兆gtggcggtcgacgtcgtcggcg犯ggcgctcagg44640gcggaagcggccaagcgggcggcaccgtccgggtggcggcaggcacctcggtccggcagc44700聊ccggtccgtcggcgcaggcgggacagcagctccgggtggctctgcccggcggccagc44760gcggcg犯gtcctcggccacggccggcagcccgtaacggcacgggccgcactggcgggcg44820ctctgggcccccELggaacgcgeLgtatccgagccgtctcgaggagcccgcaggccgagcgg44880gg卿cgcgatcagcacgcccgcgcccggtgcggcgcccagcggagcgaggtcgcggcgg44940gtgaggggtgtgtgcaggtcctccgcgggcagccaggtgccggcgaagccgccgaccagg45000agggcccgcacgggttccgtggtgtccccggcacggccgagagccgtgtcgagcgggatg45060ccgagcggtacttcccccacaccgggagcggtgactgccccggagacggtgatcatcatg45120gtgccgggttcgtccggcgtgccggcccgcctg肌ccagtccggtccgtggcgggcgatg45180agggccaggtgggcgagggtctccgcgttgtggacgagggtggggcgtcgggcgacgccg45240cgttcgtggctgtgcggagggttgccccgcggtcgggccgggccgccgtcgagccagcgc45300accaatgaggtcgactcgctggagacgtagccgtgcggcagggcgtgcagtcggatccgg45360acggggtcgaggcgggcgctccgccgctcctccacggcgttgccgagacggcgctgctgg45420gcggtgcgggtccggggaaggcacacatggacggtgtccgccccgacctggaccgccgcg45480aggacggcgccgtcgaggacc柳tgaggtgccacggcgatgaggaactggtccttgcgg45540ctggcgggttcgctctccatggcgttgacgacgaccacgggccggccgcgaccggccgcc45600acgctgcgcatcttccgggccgtcgggaacccggcaccaccgcgtccggtgagaccggcc45660gcttcgacggcgtccaccagcgacccccgcgcgtcggtggtcctgcggagtgcttcccgg45720tgccgcaggtgatcgcccagggtggccggtcgcccggtggcccgccagtccgccagcagc45780cgggccgtgtacccgtccggtccgggcgtgggcggtgcgggtgtg犯ggacgcaLgtcgag45840gagttcaccgtccgcccccgatcaggagtgccgccgtggcggctcggtgggaccagccgg45900gctgaagcggcccggcggccaggaacgcggtgagcaccaccggtacggcggacgcggtca45960cggcagccgccaggcgcccggccacccgccccggaccggccttcgccaggcgccaccaca46020cggcggtcaccacgcaggccaggcacgcggcgtagagccacagctg46066<210>2<211>445<212>PRT<213>可可链霉菌阿苏变种<400>2MetLeu1SerGlyGluValPheLysHis20AlaAspAlaAspValValAsnGlyGlyLys5SerLeuValArglieAlaGlySerVal10ThrSerAlaAlaAlaAla2530AsnCysProAsplieValGluThrArgThr15ValAlaAspVal50AlaGlu65LeuProLeuAsp354045LeuSerArgValPheThrThrLeuGlyGlyArgAlaArgTyrGlyThrLeu5560LeuAsnGlySerGlylieGluHisAsnThr7075AlaAsp丄euValSerSerlieHisGlySerLeuTyrHis8590ProGlyLeuValAlaArgLeuGlySerValHisLeuProLeu95SerVal80ValGly100GlyCysArglieGlyGluLeuAsp130GlyGly145LeuLeu115ValGlyPro120Ala105110LysGlyArgProValArgHisVal125MetGluArgPheGlyAlaThrGlyGlyThrThrAlaGlu135140ArgLeuThrGlyCysGlulieLeuLysValAlaAlaArg150155AspTyrThrArgAsnArgAlaLeuMetSerGlyProLeuAsp160Tyr165170175GlyGlyAlaThrLysThrAlaLeuLeuThrAlaAlaAlaAlaGluGly180185190ValThrThrLeuHisHisLeuTyrProLysProAspValValAlaLeu195200205lieAspValLeuArgGluLeuGlyThrAspMetThrTrpThrGlyPro210215220GluThrLeuVallieArgGlySerGlylieGlyAlaLeuArgArgAsp230ProProAspLeulie225ValArgTyrThrLeu245CysAlaAlaVal260GlyMetAspArg275ArgArgMetGlyValVal290HisProAlaGlu305ArgGlyValPhe235GluValVal250ThrValGlyAspGlyProValHislie265AlaValAlaAlaLeuAlaProGlu240ThrTrplie255ThrGlyPro270AspValLeuAlaLeuAlaProGluPhe280285AspHisGluAlaAspSerValThrAlaArgThr295ProLeuAlaProVal310AspSerGinProAsp300ValLeuGlu315PheAlaLeuSerAspSerGinProPhe325330TrpAlaGluGlyAlaThrLeulieSerGluAlaValTrp340345TyrGlyTyrValProGlyLeuThrAlaLeuGlyMet355360AspAspTyrAlaLeuArgValAspGlyValArg370375GlyGinAspLeuThrAlaThrAspLeuArgAlaAlaAla385390395Thr380AlaAlaAlaSer320MetAlaGly335GluHisArg350AspAlaValGin365ProHisArgThrValLeuLeu400<sequence>complexsequenceseeoriginaldocumentpage46</sequence>GluSerAlaArgTyrArgGluValGlyAlaAlaPheTyrValProAsp115120125AlaThrArgLeuLeuArgGinGluGlyLysProGlyAspTyrArgTyr130135140ValGlyGlySerThrA印AspHisGinGinValValArgSerAlaThr145150155160ArgAlaTyrGluValAlaPheGluGluTyrGinArgLeuLeuAspSer165170175GlylieAlaArgGlulieAlaArgLeuValLeuProValSerThrTyr180185190AsnAlaArgAlaLeuMetHisPheLeu200205AspAlaAlaTyrValSerHisProGin220GluGinMetGluThrAlaTrpAlaLys235240AlaPheThrAlaPheGlyArgValSer250255SerValSerLeu210ArgGlu225LeuMetLeuTyrAlaThrCys195ArgThrHisArgPro215lieGluMetValAla230ProValThrHisGlu245Pro<210>4〈211〉204〈212>PRT<213>可可链霉菌阿苏变种<400>4MetValThrHisAlaGluProHisValHisHisThrGlyLeuHisLeu151015lieAspAlaGluAspLeuArgArgLeuAsnAlaGluProProAlaMet202530SerGluPhelieArgAlaValLysGluAlaProGluPheAspLysHis354045TyrArgLeuTrpLeuMetThrValHisGinAspGlyArgHisThrPro505560LysAlaGluLysLeuProProAlaTrpAlaGluLeuLeuAspGluVal707580ArgThrTrpLeuSerSerArgThrGlyValAsp909565ValGinAspSerLeuGluGlyAla100AspTyrArgAsnVal115ValLeuValLeuSer130AspLeuTrpGluSer145ProValProGlyHisSerValSer180LeuAlaLeuGlyTyr195Phe85AlaUuGluValAsnValAsn105LysProHisArgGly120GluHisTrpProGlu135ProAspArgAspAla150LeuTyrThrSer165ProValAlaGinSerMetPro200ValAsp185GluVal170AlaArgSerLeuArgAspProGly110AspArgAlaMetAsnAla125AsnGlyGlyGlyThrTyr140ProAlaArgSerValLeu155160ProSerAspAlaSerTip175ProGlySerLeuLeuThr190ArgSer<210>5<211>215<212>PRT<213〉可可链霉菌阿苏变种<400>5MetLeuArgLys1LeuHisLeuAla20TyrAlaThrAla35AspThrProValLeuHisValAspAlaProPheThr51015GinGlyLeuLeuThrLysAspValValSerAspLeu2530ProValAsnArgThrAlaAlalieSerArgValAsp4045HisGluLysGinTyrLysMetAsnLeuPheTyrLeuMetVal5560AlaSerGlyGluLeuProAlaValTrpProGlu50AsnAsnGinArgSerArgAlaSerGlyGluLeuProAlaValTrpArg65707580SerLeuLeuAspAspLeuAlaGlyValGluPheThrAspTrpLeuSer859095GluSerThrGlylieAspLeuHisGlyLeuSerGinAsplieGlyValGly100TyrThrHisValAspGlyGlyLeuSerGinAsplie105110lieSerValHisLysAspLysAlaHisValAspGlyAspPhelieSerValHisLys115120125AlalieThrAlalieLeuTyrLeuAsnProGluTrpProThr135GluValAspLys130AsnAlaGlyGlyGluPhe145150AspHisValPheArgLeuProProArgProGlyGinLeuLeuPro140HisPheSerGlyAspProAspAsp155160GlyGinLeuLeuAlaPheArgLeuProProArgProGlyGinLeuLeuAla165170175ProProThrAspLysSerTrpHisAlaValSerArgValAspSerGly180185190GluGlulieThrArgLeuThrValGinLeuGluTyrTrpPheGluHis195200205ValAspArgTyrSerThrAsp210215<210>6〈211〉370<212>PRT<213〉可可链霉菌阿苏变种<400>6MetAspAspMetAsnProValPhe15ArglieGlyAspArgThrSerLeu20LeuAlaAspArgLeuGluArgSer3540ThrArgAlaLeuAlaAlaAspLeuArgVal5055GluAlaThrLysGluHislieAsnSerLeu65Phe70SerLeuPheAspAlaSerTyr85LeuThrTyrGluThrLeuProThrAlaSerAsn115100ThrLeuProValAsn120AlaGluValAspArgLeuArgArg1015ArgAspProGinPheLeuLysGlu2530ProAlaLeuSerGluArgProI]e45PheArgProGlyGinVal60ArgArgAspAsnAspVal7580PheProSerLeuSerLeuAspTyr9095AspProHisLeuAlaGluArgTyr105110lieThrGlyAlaSerGluGlyPhe125<sequence>complexsequenceseeoriginaldocumentpage51</sequence>355360365GlyVal370〈210>7<211>275<212〉PRT<213>可可链霉菌阿苏变种<400〉7MetThrValAsnAla15AspAlaArgValGly20AspAsnAlaPhePhe35GluAlaAlaLeuAla50PheMetPheThrThr65GinGlyGinA印Ala85ValTyrGinVallie100ArgGluValAlaPro52LeuAlaLeuSerAlaAlaGluGinGinAspLeu1015LysGlulieAspAlaAlaArgLeuArgArgAla2530ArgLysAlaGluSerValThrProGlyGluAla40lieAlaHisArgTrp55LeuSerGlyLeuGly70ProAspHisAlaGluSer45ArgAlaMetThrLysAla60ValMetAlaArgArgPhe7580LeuAlaAlaPheGinThrGluLeuLeuAlaAlaPheGin9095GlyAspAspLeuAspAsnAlaAlaProAlaPhe105110ArgGlyProAlaGlylieHisTyrValTrpTrp115120125GluAspThrValLeuLysProValAlaAlaHisValAlaGluGluAsp130135140ArgGinSerAlaAlaValLeuProArgAlaValThrGlyLeuLeuAsp145150155160SerMetAspArgLeuAlaThrHisProLeuGlyAlaAlaValGinLeu165170175ArgValValGluAsplieAlaLeuAsplieAlaValGlyPheArgArg180185190LeuTyrAlaLysValGluValProGlyThrThrLeuPheAlaGlyArg195200205AspAspLeuAlaTrpValAspSerHislieLysAlaGluThrMetHis210215220AlaAlaGinValSerAspGluAspThrGlyMetThrArgLeuValAla225230235240AspArgGluGinAlaGluGluPheLeuThrAlaValArgGluTyrAla245250255AlaHisTrpSerAlaAlaLeuGluThrTyrAlaGinAlaLeuArgAsp260265270GlyHisAla275<210>8<211>430<212>PRT〈213〉可可链霉菌阿苏变种<400>8<formula>complexformulaseeoriginaldocumentpage54</formula>LeuAlaGinProSerTyrGinProTyrSerAspTrpPheSerValAla210215220TyrAspAlaProGlyMetSerGlyMetMetProAspGluAspProMet225230235240SerAlaArgLeuArgAspThrAlaAlaLysValValAlaThrMetPro245250255AlaValProGlyValCysAlaPheGinValGluPhePheHisThrPro260265270AspAspArgLeuValValCysGluThrAlaCysArgAlaGlyGlySer280GluThrHisGluAspThrLeuGly295LeuLeuGlyGinAlaGlyArgSerArgMet290AlaSer305275ValGin310GinGlyTyr285ValHisLeu300GinValThrHisGlyProThrGlyArgArg325ValLeuArgHisLeuProArgArg340ThrGlyGluGluAsp315PheProSerAlaTyrThrAla355SerSerValAlaGlulieValValSerLeuGly360lieGlySerSerValAlaGlu370375AlaAlaGluLeuLeuAlaValGluThrThr385ValTrpGinLeu390ArgAsnProlieArg320AlaArgPheProSerAlaHisGly330335SerProLeuProGinThrLeuLeu345350ArgHisTyrAspProAlaThrSer365LeuThrGlyProAsp380TrpGluSerAspArg405HisArgValArgProAspThrArg420ValPro410GluArg425Trp395AspArgPheLysAlaVal400SerVal415AlaLeuHisVal43055〈210>9<211〉469<212>PRT〈213>可可链霉菌阿苏变种<400>9MetSerGluHisValThrProAlaGlyArgAlaAlaAlaUuAlaPro151015GlySerArglieLeuValValTrpProProGinlieLeuSerTyrPhe202530AsnAlaGlyHisHisLeuAlaLeuTyrGinValAlaGlyHisLeuArg354045ThrAlaLeuProAspSerGluValThrValLeuAspAlaThrValLeu505560ArgArgThrTrpLysAsplieGlyAsnAspLeuPheGinGinArgTyr65707580AspAlalieAlaValMetAsnAspPheAspGlylieAspGlyLeuArg859095ArgPheValSerTyrAlaArgAlaLeuSerProGlyThrProlieVal100105110ThrPheGlyArgLeuSerGlyValAsnProLeuPhePheGinGinLeu115120125AsplieAspAlaValAlaGluAsnGlyAspPheGluAlaAlaValLeu130135140AlaAlaLeuArgPhePheAspGlyGluThrValThrAlaProGlyVal145150155160HisLeuArgHisAlaAspGlySerTrpHisAlaProSerSerProGly165170175AlaValLeuProAlaGinGluTrpTyrLeuProThrProAspGlulie180185190ProTyrGinArgTyrAspGluLeuTyrHisAspAspAlaAsnLysPhe195200205CysGlylieProGinArgArgGluLeuValValProAlaAlaArgGly210215220CysProlieGlyCysSerTyrCysGluValHisProliePhe225230LysGluArgArgLeuThrValGlu245SerPheArgThrAlaSerPheGlu260PheThrLeuAspArgArgTrpThr275280GlyAlaArgPheProTrp235ArgThrValGluTyr250AlaPheTyrlieGlyArg240GluGin255ProThrTyrValAlaPheTyrAla265270MetAspLeuCysGluArgLeuThr285LysCysAlaThrThrMetHisHisAlaAspGlyAlaArgPheProTrpLysCysAlaThr290295300LeuAspGluAspLeuValArgAlaMetGlyArgAlaGlyCys305310lieSerValGlyLeuGluThrLeuAspPro330GinAsp345LeuAsnArg315HisGlyHisGlyValGlyLeu325ProArgSerLysHisLysSerGinGinAspI>euGluAsn340TrpCysAlaGinAlaGlylieGlu355360GlyThrSerValGluGlyValArgHisValArg320AlaLeu335LeuAlaGly350CysPheVallieValGly365lieAlaThrValLeuProGlyThrSerValGlu370375GinAlaLeuGlyGlyArgAlaArgProThrValTyrAlaPro385390395Thr380TyrTrpGlu400<sequence>complexsequenceseeoriginaldocumentpage58</sequence><210>10〈211>380<212>PRT<213>可可链霉菌阿苏变种<400>10<sequence>complexsequenceseeoriginaldocumentpage58</sequence>AlaAspHisl>euAspAlaAspProAspGlyLeuValLeuThrAlaGly859095SerAspProGlyLeuGlyLeuLeuValArgAlaPheProArgAlaArg100105110ArglieValLeuHisHisProAsnTyrGluGlyTrpGinLysPheAla115120125ArglieAlaGlyCysArgLeuAspGinValProProAspProGlyThr130135GlyArgPheSerLeuAlaAsp150ValValValThrGinPro140145ProAlaPheLeuAlaAlaArgLeuArgGlyGlyPro155160SerPheThrGlyGinVal165GluLeuGluSerLeu185ThrAla200LeuThrHis170AlaArgAlaHisAlaArgAla180LeuValLeuAspThrAlaTyrLeuAlaGlySerLeu195GlyGluLysGlulieGlyThrLeuThrGly210215ValValArgValAsnThrPheSerLysCys225230ArglieAlaValLeuSer_L6U245AspLeuAspProGluGlyProSerHisProAsp250GlyArgPro220PheGly235ThrVal175ValAlaAspHis190PheThrGluGly205HisProProHisLeuPro260LeuArgGluGinProLeuPheGluGluValSer265ProLeu280PheSerSerGlyAla240ArgProLeuLeu255ThrAlaValAlaLeuLeu270TrpAlaGlyArgAlaCysLeuArgGluGinProLeuPheGluGlulie275280285ValArgGluValArgGluHisPheSerArgGlyValGluGluAlaLeu290295300ProGlyTrpArgAlaLeuProGlyGlyGlyAsnPheAlaThrTrpGin305310315320ValAlaSerProArgGluAlaAlaAspAlaAlaAlaHisLeuHisAla325330335HisGlyTyrValValArgAlaValProSerThrProAspSerProAla340345350AlaValArglieGlyValThrAspArgSerThrAlaAspArgValThr355360365AspLeuLeuLeuArgArgGluGinAlaValAlaArg370375380<210>11<211>273<212>PRT<213>可可链霉菌阿苏变种〈400〉11MetThrThrGlyAlaArgArgHisPro15AlaAlaArgProThrArgGlyPro20ArgAspSerAlaSerArg25GlyLeu40ArgGlyProAsnVal35LeuArgSerGlyValLeuTyr5055AlaProAlaLeuAspAspLeuGlylie6570ThrAlaPheGluGinGlylieGluAspAlaGluArgThrProAlaAla1015ThrValAlaLeuProGlyLeu30ProGlyProAspGlyAlaArg45ProAlaProSerProLeuThr60ArgThrValValAspLeuArg7580GlyProAlaGlyMetArgAla<sequence>complexsequenceseeoriginaldocumentpage61</sequence><212>PRT<213>可可链霉菌阿苏变种〈400>12MetThrLeulie1AspProTyrHisAsp5TyrLeuGinAlaLeuArgAspAlaArgLeu10SerSerPheArgAspAlaValValThrAlaSerGlu50AsnArg65ThrLeuAspTyr20ArgThr35ArgArgPro25LeuAsnAspGlyPheAlaAlaAspProThrLeuValProGluAla85AlaGlySer55SerGlu70TrpArg40GlyArgGlyLysGlyArgLeuLeuLeuValGluArgAsp100CysThrValGluAlaArgMet115HisThrGinHis75ValAsp90ThrGlyHis60Arg30GlyPhe45TyrLeuGluLys15AspAspValArgMetHisGluAlaValGluValThrSer95AspAsp80AspGlyGinPro130PheAsn145ArgGlyGlyThrAspArgPro135AspThrTrpArgSerGluTrp150LysAspValAlal,euThrGlyAlaAspLeu105110ThrArgTyrSerSerGlyCysTrplie120125AspLysAlaValThrHisLeuPheTyrProAspSerVal180Met165ValLeuValArgSer185GinGly155ArgArg170AspAspThr140AspLeuHisValValLeuProSerTrpHis190Leu175GlyLeu160LeuValProProValSerGluGlyCysProAspAspArgArgAlaLeuLeuVal195200205HisPheAlaArgThr210〈210〉13<211>243〈212>PRT<213>可可链霉菌阿苏变种<400>13MetLeuThrArgPro15GlyAspLeuValArg20ArgValProAlaAla35TyrAspAspLeuPro50ArgTyrArgArgHis65LeuLeuValAlaAsp85AlaPheAlaGlyGly100ValArgGluGlyAla11563ThrAlaAlaLeuSer10ThrGlyPheSerMet25LeuGinAspSerLeu40AlaAspProTyrLeu55ThrArgTyrThrTrp70AsnProGlyTyrPhe90GinTrpArgLysTyr105PheLeuThrAlaLeu120SerProAlaAsplieThr15ValProGlySerAspMet30LysThrLeuAlaAlaSer45ProAspGlyGlyAsnTyr60ArgProAlaThrGlyGlu7580GinThrValGluAsnAsn95GluGluLeuThrAspGlu110lieA印PheAsnValGly125ArgLeuProLeuProGlu130ValArglieValAlaArg145150GlyValHisArgA印Gly165ArgHisAsnlieSerGly180GluLeulieThrGluLys195GlyAspAspProArgVal210AspProSerLeuGlyGlu225230AspProMet<210>14<211>255<212>PRT<213>可可链霉菌阿苏变种<400>14MetSerSerGinGluLeuGlyThrValValValSerGlyAlaSerSer151015GlyPheGlyArgValThrAlaArgArgLeuAlaAlaGinGlyHisThr20253064ValGluGinTrpAlaValGinValHisCys135140AspAspAlaGinGlyArgProThrProGlu155160CysThrTyrValSerLeuHisMetValAsn170175GlyArgThrSerValTyrThrProGluHis185190ValPheThrAspCysLeuAspSerPhePhe200205ArgHisGlyValAlaAspValSerValAla215220GlyThrArgAspMetLeuLeuMetSerTyr235240VallieAlaValAlaArgArgAlaAspArgLeuAlaGluLeuAlaAsp354045GlyGluGlyProGlyArgValUuProAlaValAlaAspValThrAsp505560LeuAspAlaLeuGluArgAlaLeuAspGluHisLeuProHisCysPro65707580ProVelIValGlyLeuValAsnAsnAlaGlyLeuSerSerGlyPheGly859095ProValGinSerAlaLysValAspAspTrpArgArgMetValAspThr100105110AsnValSerGlyLeuLeuHisThrThrThrLeuLeuLeuProArgLeu115120125lieAlaGlyGlyArgGlyHislieValAsnlie130135TyrProTyrAlaGlyGlyArg145ValHisGinValArgValGlySerlieAlaAla140AlaThrLysLeuGlyTyrAlaGlyGlyAsnValTyrAla150155LeuSerLeuSerMetArgThrAspLeuGluGly165170SerCysValAlaProGlyMetAlaArgThrGlu180185190TyrAspGlyAspGinGluArgAlaAspArgLeuTyrAspAlaPhe160ThrGly175PheAlaValArg195ValSerProLeuSerProAspAspValAlaAspAlaValLeuTrp210LeuSerCys225ProThrAspPro215HisGin200AspValAsnValAsn235PheAlaAspArg205AspAla220MetlieArgProPro230GinProPheGlyLeuGlyPheAlaArgArgGlulieMet240HisAla245250255<210>15〈211>168〈212>PRT<213>可可链霉菌阿苏变种<400>15MetArgGluAspValValValArgProAlaLeuAlaThrAspAlaPro151015GlylieAlaArgLeuSerGluProPheValAlaAspAspSerGluArgI20AlaArgSerGlyThrGinPheArgAsnArglieGly35HisAspSerArgProPheValAlaAspAspLeuLeuVal2530ArgAsnArglieGlyAspTyrLeuThr4045lieGlyCysValGlyLeuThrArgLeuAlaValHisAspSerArgVallieGlyCysValGly505560GlyAspAspLeuLeuLeuTyrAsnLeuCysValAlaAla657075GlyLeuGlylieGlyGlyArgMetValGluArgAlaA印Gly85AlaLeuGlyGlyCysArgPhe100ArgTrpPheValArgHisGly115ValTrpAlaAspGlu90AlaAlaSerLysLeuLeu105PheThrArgThrGluPro120125LeuProProGlyArgGlySerHisLeuAspArgGin80AlaLeuAla95HisSerGly110GinHisMetProAlaValTrpAlaAspLeuLeuProProGlyArg130135140TyrArgArgProValAlaProArgThrAlaProProAlaPheThrPro145150155160ProArg'GlnGlyAlaGluArgSer165<210>16<211>573<212>PRT<213>可可链霉菌阿苏变种<400>16MetlieThrCysGlyLeuLysLeuThrHisAspGlyAlaValAlaLeu151015ValAspAspArgArgLeuValLeuSerValGluMetGluLysLeuAla202530AsnAsnProArgTyrSerAlalieGlyAspLeuGlylieValProThr354045lieLeuAlaGluHisGlyTyrArgMetGluAspValAspAlaPheVal505560ValAspGlyTrpAspGlyAspGluSerGlyThrValAspThrAlaAsp65707580ArgGlyGinProLeuGluLeuValValGlyProTyrArgGluSerArg859095ThrSerProAspLeuLeuArgProSerValSerGlyThrPheThrVal100105110AspGlyValProTyrProTyrThrSerHisThrHisAlaAlaGlyHis115120125ValLeuSerThrTyrCysThrSerGluPheAlaArgArgGlyGluPro130135AlaPheValLeuValTrpAspGlyGlyMet145150ValAspProGluAlaGlyValGluAsnGly165170lieGlyHisThrTyrAlaThrAlaGlyHis140180ArgAspArgGinSerAlaAsnVal195200LeuMetAlaTyrlieAlaLeuGlyLysPro210215ValLeuAlaSerValPheHisAspHis225230AlaAlaAlaGluHisSerArgThrVal245GluProSerMetProProLeuHis260GinValGinProPheAlaValSer275280HisGluPheLeuGinAsnLeuLeu290295ArgAlaTrpLysGlyAspGlyProTrp305310CysAlaLeuAsnlieLysTrpAsnSer325ValArgArgMetTrpValProPro340lieGlyAlaAlaValLeuGlyAla355360PheProArgLeuTyrTrp155160GlySerLeuPheProLeu175HisPheGlyProPheArg185190AspAspLeuSerValAlaGlyLys205SerGluAlaValLeuGlu220TyrGluAsnGluAlaSerPro235240GlyGlyPheGlySerLeuPhe250255PhePheArgAlaValArgGlu270GluAspValLeuAlaSerVal285GluArgLeuAspAlaArglie300AsnLeuCysPheAlaGlyGly315320AlaLeuArgAlaLeuProLeu330335ProAsnAspAlaGlySerAla350GlyGlyArgAsnAlaValPro365Asp265AspLeuPhe345lie<sequence>complexsequenceseeoriginaldocumentpage69</sequence><213>可可链霉菌阿苏变种<400>17MetSerThrAlaProAlaAlaProAlaArgProLeuAlaGlyArgThr151015ValLeulieLysCysGlyGlySerValLeuAspGluGlyAspAlaGly202530ArgThrPheAlaGluAspValAlaGluLeuAlaAspAlaGlyThrArg354045ValValValValHisGlyGlyGlyProGinlieA印ThrHisLeuGlu505560ArgLeuGlylieGinProValPheArgHisGlyLeuArgValThrThr65707580ProProThrMetGluValValArgMetValLeuSerGlyGinValGin859095ArgArgLeuValGlyLeuLeuAsnArgGluArgArgLeuAlaValGly100105110LeuThrGlyGluAspAlaArgThrPheThrAlaAlaAspArgGinVal115120125PheHisGlyGlyGinArgValAspLeuGlyLeuValGlyAsplieVal130135140AspValAspAspArgLeuLeuArgThrLeuLeuAspAlaGlyLeuVal145150155160ProValValSerSerlieAlaArgSerAlaAspGlySerGlyValArg165170175AsnValAsnAlaAspLeuAlaAlaAlaAlaLeuAlaAlaAlaLeuArg180185190AlaAspThrLeuLeuLeuLeuThrAspValAlaGlyLeuTyrProGly195200205GinProAspArgGlyGluValLeuAspArgLeuThrAlaAlaGluAla210215220AspAlaLeuLeuProArgLeuThrGlyGlyMetlieProLysValGin225230235240AlaCysSerGinAlaValArgAlaGlyValAlaThrAlaArglieAla245250255AspGlyArglieProHisAlaValArgGluHisLeuLeuThrGlyArg260265270ArgThrGlyThrThrValSerPro275280<210>18<211>419〈212〉PRT<213>可可链霉菌阿苏变种〈400〉18MetHisLeuAlaSerThr15ProHisAlaArgArgTrp20GlyAsnGlyLeuTrpThr35GinHislieProLeuAsp50ArgProGlyGinArgProProAlaHisArg1015TyrLeuAlaAlaLeuPheAlaAspAlaVal2530ProLeuAlaUuliePhePheThrArgAla4045ValThrGlyAlaAlaLeuThrAlaGlyGly5560LeulieGlyLeuLeuThrGlyPro丄euAlaGlyThrLeuValAspArg65707580TrpGlyAlaLeuProLeuValGinLeuSerAsnValLeuArgGlyAla859095ValPheLeuValTyrProLeulieThrSerValGlyGinLeulieAla100105110LeuAlaAlaValLeuAlaAlaCysGluArgLeuPheTrpThrAlaAsnThrPro130LeuAla145GlyLeu115AlaLeuGluGinThr120ValGlyLysAspVal135LeuArgThrGinAsnMet150AlaAlaValLeuSerAlaAla165LeuHisLeulieAlaTrpLeu180LeuGlyValArgValProArgArgLeuLeuMet195AlaSerArgProAlaPro210LeuAla225AlaLeuAsnGly185ValPro200AlaThrGlyPro125GlyLeuLeuProVal140AlaGlyTrpMetThrGlyAla155160LeuLeuGinHisProGlyArg170175AlaThrPheLeuAlaAlaAlaAspLys215LeuLeuLeuMetArgProPhe230ThrAspSerLeuThrVal245AspValLeuHisGlyPro260AlaLeuLeuLeuAlaGinLysGinSerTrpLeu265ValAlaLeuLeuLeuAlaGin275280GlyGlyHisGlySerAlaLeuArgProLeuArgPheLeuAla190ThrGlyAlaProAla205AlaTrpArgArgThr220CysLeuThrGinLeuAlaPhe235240MetLeuProLeuValAlaLeu250255ProAlaAlaAlaLeulieThrSerSerAlaAlaLeu270AlaValArgArgPhe285LeuAlaCysLeuVal290295PheAlaValAlaPheLeuLeuLeu305310GlyTrpAlaValProValValLeu325AlaAspAlaLeuPheAlaProVal340AlaProGluGluTyrLysGly355TrpGlyAlaAlaAlaValLeu370375ThrAlaGlyAsnAlaValLeu385390AlaThrAlaAlaLeuThrAla405ThrProAla300AlaProAlaGlyArgLeuThrPro315320GlyAlaAlaValAlaGlyAlaVal330335MetThrValLeuAlaAsnAlaAla345350TyrSerAlaThrPheGinLeuAla365ProAlaValGlyAlaPheUuLeu380LeuThrLeuValAlaLeuGlyAla395400LeuValProArgArgGlyGluGlyAsp410415Arg360AlaTrp<210>19<211>188<212〉PRT<213>可可链霉菌阿苏变种<400>19MetThrGluProAlaAspProArgArglieLeulieAlaGlylieSer151015GlyAlaGlyLysThrSerLeuAlaAlaAlaLeuSerGinArgUuGly20lieProHislie35ArgArgAlaGlu50AlaTrpValCys65AlaAlaArgThrValMetHisArgVal100ArgProLeuTrpHisAsp115SerProArgHisProVal130ArgAlaGluThrAla145ValArgLeuArg25GluMetAspAlaLeuTyrHisGly40PheThrAspAspValAlaArgPhe5560AspAlaGinTyrHisTrplieVal7075GinLeuPheValTrpLeuAspLeu85lieArgArgLeu90LeuSerArgValSer105AsnThrGluThrTrpArg120ArgTrpAlaTrpSerArg135140TrpPheAlaArgHisProAla150AlaAlaGinAlaProProAlaGly180Thr165ArgThrHisAspHis155Arg30ProHisTrpSer45ThrAlaSerGluGlyAspLeuLeu80ProArgHisThr95LeuLeuArg110AlaI>euLeuPhe125HisGlyThrArgAspGly185Arg170SerArgAlaValProVal160TrpLeuArgSerLeu175〈210>20<211>1111<212>PRT<213>可可链霉菌阿苏变种<400>20MetTyrAlaThrGluValHisGinProArgThrLeuThrAlaAspLeu151015SerLeuGluAlaPheGlyValMetThrAlaArgArgGlySerGluPro202530ValHisLeuGlyProProArgHisArgAlaValLeuGlyLeuLeuMet35LeuArgLeuGlyGinVal50TrpGlyAspLysProPro4045ValArgValAspGinLeuValAspGluLeu5560ArgArgProHisAlaThrLeu75AlaUuThrSerGlyHisGlyTyrSer90ProGlyTyrValGinThrTyr80AspAla95AlaLeuLysVal6570MetSerHisLeuArgArg85GlyValAlaPi;oLeuHis100AspProGinAlalieAsp115GlyGinGinHisAlaAla130LeuAspSerAlaLeuHisLeuTrpArgAlaAspProPheLeuAspLeu145150155160ThrSerTyrGluProLeuAlaGluGluSerAlaArgLeuGinHisLeu165170175ArgThrAlaAlaValThrlieArgAlaGluAlaLeuLeuAlaLeuGly180185190ThrThrValGluSerLeuArgArgGluVallieArgPhe200AlaAlaArgAlaProGlyTyrValLeu105110CysArgPheAspGluMetValSerArg120125GluGlyArgPheGlyGluAlaArgGluAla135140LeuTrpArgAlaAspProPheLeuAspAlaArg195ProSerAspGluArglie210Val215Val205LeuMetThrGlyLeuTyrArg220<formula>complexformulaseeoriginaldocumentpage76</formula>450455460AspAlaLeuSerGluThrlieLeuArgHisAlaAspAspAlaProLeu465470475480LeuLeuValLeuGluAsnValHisLeuAlaAspArgProThrLeuAsp485490495ValLeuAlaLeuLeuSerAspGlyThrGinGlyArgAlaValSerVal500VallieSerValArgGluSer515LeuGinGluGlyPro530LeuAspAspLeuSerGluGluGinValGin545GlyGlyProGly505510GlyValGlyAlaGlyAlaGluProAsp520525AlaAspSerArgThrAspValValHisPro565SerGlyGlyAsnProTyrLeuLeuLeuLeuAlaAspSerArgThr535540GluGluGinValGinThrLeuLeuAla550555AlaThrProValValArgGlyLeuTyrVal570GinLeuLeuAlaAlaGin560GluArg575AlaGlyAsnProTyrLeuLeuGlyGinLeuLeuAlaHis580585590GlyAlaArgSerLeuHisAlaAlaArgAlaAlaArgGinValLeuThrArg595GlulieProThrGly610LeuAlaProGluVal625ThrGluAlaAspAlaArgAlaAlaArgGin600605ValSerSerMetLeuArgArgArgLeuAlaGly615620LeuArgValLeuArgGlyCysAlaVal630635ThrLeuLeuThrThrValLeuGlyAspLeuThrLeuLeuThrThr645650ProGlyValArgAlaValGluGluAlaLeuArgThrGly660665ArgAspHisAspHisAlaArgThrLeuValPheArgHis675Thr680LeuGly640ThrThr655LeuLeuArg670TyrGlyLeuVal685ArgAspValLeuLeuAlaGluMetSerAspGinGluArgSerAspLeu690695700HisAlaTrpAlaValAspValLeuGlyArgGinAlaAspGlyHisPro705710715720AlaAlaAlaSerArgLeuAlaHisHisAlaTrpGinAlaSerLeuThr725730735LeuProProAspGinValLeuProTyrLeuValArgAlaGlyGluGin740745750AlaAlaLeuGluSerArgTyrAspArgAlaGinThrTrpPheArgArg755760765AlaHisAlaLeuLeuThrSerGlyProSerAlaSerGlyAlaAlaAla770775780GinAlaLeuGinLeuArgLysArglieLeuGinlieAlaThrValThr785790795800ArgGlyTyrGlyAspArgGluValValAlaGluSerGinArgValLeu805810815SerMetSerProAlaAlaValGinGluProAlaLeuValPheSerGin820825830CyslieAlaGinLeuValThrGlyHisArgGluGluSerAlaArgArg835840845AlaHisGinLeuArgValMetAlaGinAsnGlyAspAlaProGluAla850855860ArgLeuHisGluArgLeuAlaHisGlylieLeuHisLeuProAspArg865870875880ThrAlaGluAlaLeuAlaAlaLeuThrGluAlaGluGinThrAlaGly885890895AsnLeuSerAlaAlaArgLeuArgGinLeuAlaHisHisThrGinHisAspProArg915LeuGlyAla930LeuThrGly945SerHisAla900PheLeuAlaMet905910GinAspAspAla935CysGluGlyThr950LeuValAlaAla965SerSerAlaAlaGluGlyLeu980HisTrpAlaAlaLeuLeuLys995LeuGlyThrProGly1010AspLeuSerValArg1025Leu1040Arg1055Glu1070Arg1085ThrGluHisLeuAla1100AlaLeu1015HisLeu1030AlaGin1045ArgArg1060LeuSer1075ProLeu1090GlyLeu1105AsnHisArgThrLeuAlaLeuSerLeu920925LeuAlaLeuAlaGinGluLeuLeuAla940ProValAspArgAlaSerAlaHisTyr955960LeuAlaGluAspAlaAspAlaThrAla970975ArglieAlaAspAlaHisGlyLeuLeu985990ValCysArgGlyTrpAlaGinHisArg10001005AspAlaLeuLysAlaAlaValThr1020ArglieArgLeuProLeuHisLeu1035Ala1050lie1065Phe1080Cys1095ProArgArgSerGlyHis1110GlyLeuLeuAlaHisAlaGinTyrAspAlaGlyAlaValGluAlaAlaArgAlaThrLeuArgArgAlaAlaArgGlulieArgAlaAlaGlyGluAspAlaTyrLeuSerProAspLeuProPheAsnArgLeuProArgLeuGinProProLeuProProArgGlyCysSerAspPro79〈210〉21<211>962<212>PRT〈213>可可链霉菌阿苏变种〈柳>21MetAspArgHis1ArgAspGlyAlaLeuAlaLeu35lieVal50lieVal65LeuAlalieAlaPheGlyValLeu510GluLeuProProGlyPro2025LeuLeuLeuGluAlaGly40AspAlaLeuTrpProAlaGlyAlaPro55GlyAsnGlyProlieArgProLysGinlieTrp15AlaValArg30GinProValSerLeuSerArg45SerHisArgHisVal——7075ProArgAlaProGlyArgLeuL,euValSer60LeuArgLysLeuLeuGluAlaAlaAsnArgArgValLeu8590TyrAlalieAspValAspAlaGlyThrLeuAspLeuLeuProHis80GlyGly95PheArg100105GluLeuAlaGinArgAlaArgAlaAlaAlaAla130AlaAla145AlaVal115AlaAlaGlyValArgAla120Arg110ArgAlaGlyGlyAspThrGlu125GluLeuPheThrGinAlaLeuSerLeuTrpArgGlyGlu135140LeuArgGlyHisProAlaGinGluPro150155AspSerGluHisLeuAlaValLeuArgGluGlyAla165170PhePhe160AspLeu175ValLeuAlaThrGlyAlaProGluArgMetLeuProLeuLeuGinSer180185190AlaAlaAlaLeuHisProLeuAspGluSerLeuHisValArgLeuVal195200205GinAlaLeuAlaAlaThrGlyArgGinAlaGluAlaLeuAlaLeuTyr210215220AspThrMetArgAlaArgLeuAlaValGinValGly225230235ProGluLeuSerAlaValArgAlaArgLeuLeuHis245ValLeu250ProProAspGlyThrAspAspGlyArgProLeuSerGlyProProArg275ProProAspGlyThr260GinHisAlaProArg265SerAlaProAlaGluProGly240AspValGinThr255AspLeuThr270ArgProThrGluSerAlaProAlaVal280285ThrPheValGlyArgArgThrGluLeuGinLeuProProAspLeuCysThrPheValGlyArg290295300AlaArgLeuThrGluLeuLeuAspAlaLeuAspAspGlyArg305310AlaAlaSerValVallieSerAsp315AlalieAspGlyMetProGlyValVallieSerAlalieAsp325330LysThrThrLeuAlaValHisValAlaHisArgLeuAla340345GinLeuTyrValAsnLeuArgAlaPheProAspGly355ValProAlaProAla320ValGly335HisArgPhe350ValSerGluAlaGlu375AspLeu390LeuAlaAsnLeuArgAlaPheAsp360365ValLeuArgSerPheLeuThrAlaLeuSerAla370GlyValProAlaArgAspLeuProProAsp385LeuTyrArgSerLeuLeuAlaGlyLysArglieLeulieLeuThr395liePhe380AspSerArgValAla400LeuAsp405410415AsnAlaLeuAspSerGluHisVal420SerCysLeuValVallieThrSer435AlaThrHis450GluSerArg465AlaGluPro440GlyAlaArgProlie455GluValLeuAlaGly470ValAspGluAlaAla舰Leu500AlaSerValAlaArgProLeuMetProGlySerSer425430ArgThrGinLeuArgGlyLeuVal445ThrLeuGlyLeuLeuSerArgGlu460ArgValGlyGlyGluArgThrAla475AspLeuCysGly480lielieAspLeuCysGlyArgLeu490495ProLeuAlaLeuAlalieValAlaAlaHisAlaAlaThrGinProAsp505510AlaLeuLeuAspAspArgAspSerLeuProLeuAlaSerValAlaAla515520LeuAspGlyPheAlaGlyGluAspArgTyr530535PheSerTrpSerCysArgSerValGlyPro545550ArgLeuLeuAlaLeuHisProGlyLeu565AlaSerLeuAlaAlaLeuProAlaArgArgValArgAlaAla580GlyAlaHisLeuProAsp570ArgArg585AlaArgLeuAspAsp525ThrAspLeuArgThrVal540GinAlaAla555lieSerAlaArgAlaThrLeuAsnGlyAlaHisLeuLeu595600AlaPheHisAspLeuLeuLysValHisAla610615LeuGluAspGluAspThrArgGinLeuAla625630LeuLeu560AlaAla575LeuLeuAla590SerGlyProGinArgPhe605LeuGluGinSerArgGlu620ValArgArgLeuLeuAsp635640HisCysLeuHisThrAlaTyrAlaAlaAlaGluAlaLeulieProAsn645650655ArglieGluAlaProLeuGluProGluAlaAlaProGlyValAlaPro660665670GluProlieGlyGlyArgGinGluAlaMetAlaTrpLeuAspArgGlu675680685LeuProValLeuLeuSerAlaValProTyrAlaGinArgArgGlyPhe710GinAsp690695ProGinHisAlaTrpLeuLeu705ArgGinGlyArgTrp725GluAlaAlalieSer740ArgAlaLeuGlyPhe755AspAlaPheLeuArg770AlaAlaGlyGinAla785AlaArgGlyArgHis805AlaLeuTyrArgGlylieArgAsn820AsnGluThrGlyTrp835lieThrTrpCysAspArgAla850855ValAsnGlyGluAlaAlaAla700AlaGinAlaLeuGluLeuHis715GinThrAlaValGinArgThr730LeuLysAspProValArg745AlaTrpGlyArgLeuCys760LeuThrLeuPheLeuAsp720AlaLeu735AlaCysGluAlaGin750GluAspAspArgAla765ThrGluAlaGlyAsp780AlaPheLeuArgAla775ArgThrArgArgGinMetAlaPheLeuAlaAsn790795800ThrGluAlaLeuArgHisTyrGluHisAlaLeu810815GlyGlyGinAlaValValLeuLeu825ThrHislieLeuLeuGly840ValSerLeuHisTrpAspSerLeuGinAlaVal830AspHisGluArgAla845ArgAlalieGlyAsp860GlyLeuAlaHisHis<sequence>complexsequenceseeoriginaldocumentpage84</sequence>权利要求1.一种多氧霉素生物合成基因簇,其特征在于,编码多氧霉素生物合成所涉及的20个基因,具体为(1)负责多氧霉素生物合成的结构基因polA,polB,polC,polD,polE,polF,polG,polH,polI,polJ,polK,polL,polM,polN,polO,polP,即共13个基因polA位于基因簇的核苷酸序列第12838-14175碱基处,长度1338碱基对编尿苷-5’-单磷酸烯醇式丙酮酸转移酶,445个氨基酸;polB位于基因簇的核苷酸序列第11999-12772碱基处,长度774碱基对,编码胸苷酸合成酶,257个氨基酸;polC位于基因簇的核苷酸序列第29476-28862碱基处,长度615碱基对编码羟化酶,204个氨基酸;polD位于基因簇的核苷酸序列第28857-28210碱基处,长度648碱基对编码羟化酶,215个氨基酸;polG位于基因簇的核苷酸序列第26166-24874碱基处,长度1293碱基对编码羧化酶,430个氨基酸;polH位于基因簇的核苷酸序列第24881-23472碱基处,长度1410碱基对编码典型S-腺苷酰-L-甲硫氨酸蛋白,469个氨基酸;polI位于基因簇的核苷酸序列第23475-22333碱基处,长度1143碱基对编码氨基转移酶,380个氨基酸;polJ位于基因簇的核苷酸序列第22336-21515碱基处,长度822碱基对编码磷酸化酶,273个氨基酸;polK位于基因簇的核苷酸序列第21528-20887碱基处,长度642碱基对编码羟化酶,213个氨基酸;polM位于基因簇的核苷酸序列第20041-19274碱基处,长度732碱基对编码短链脱氢酶,243个氨基酸;polN位于基因簇的核苷酸序列第19281-18775碱基处,长度507碱基对编码氨基酸N-酰基转移酶,168个氨基酸;polO位于基因簇的核苷酸序列第18778-17057碱基处,长度1722碱基对编码氨甲酰转移酶,573个氨基酸;polP位于基因簇的核苷酸序列第17060-16218碱基处,长度843碱基对编码酰基谷氨酸激酶,280个氨基酸;(2)负责多氧霉素生物合成的调节基因,即polR,polY共3个基因polR位于基因簇的核苷酸序列第32787-36122碱基处,长度3336碱基对编码调控蛋白,1111个氨基酸;polY位于基因簇的核苷酸序列第32569-29681碱基处,长度2889碱基对编码途径专一性调控蛋白,962个氨基酸;(3)负责转运的基因polQ1,polQ2,即共2个基因polQ1位于基因簇的核苷酸序列第16052-14793碱基处,长度567碱基对编码膜蛋白;polQ2位于基因簇的核苷酸序列第14796-14230碱基处,长度1260碱基对编码腺苷酸激酶,419个氨基酸;(4)功能未知基因,polE,polL共2个基因polE位于基因簇的核苷酸序列第28187-27075碱基处,长度1113碱基对编码胆固醇氧化酶,370个氨基酸;polF位于基因簇的核苷酸序列第27023-26196碱基处,长度828碱基对编码氧化还原酶,275个氨基酸polL位于基因簇的核苷酸序列第20830-20099碱基处,长度732碱基对编码胆固醇氧化酶,243个氨基酸。2.根据权利要求1所述的多氧霉素生物合成基因簇,其特征是,利用多氧霉素生物合成基因簇用于多氧霉素的高产菌株或有效组分高产菌株的分子育种。全文摘要本发明涉及的是一种基因工程
技术领域
多氧霉素生物合成基因簇及其应用。编码多氧霉素生物合成所涉及的20个基因,具体为(1)负责多氧霉素生物合成的结构共13个基因;(2)负责多氧霉素生物合成的polR,polY共3个调节基因;(3)负责转运的基因polQ1,polQ2,即共2个基因;(4)功能未知基因,polE,polL共2个基因。利用多氧霉素生物合成基因簇用于多氧霉素的高产菌株或有效组分高产菌株的分子育种。本发明所提供的基因及其所编码的蛋白质,也可以用来查找和发展可用于医药,工业,农业的化合物或蛋白。文档编号C12N15/31GK101195828SQ20071017189公开日2008年6月11日申请日期2007年12月6日优先权日2007年12月6日发明者周秀芬,由德林,白林泉,贺新义,邓子新,陈文青申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1