抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法

文档序号:3560008阅读:682来源:国知局

专利名称::抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法抗昆虫的转基因植物以及用于改善s-内毒素抵抗目标昆虫活性的方法本申请是申请日为1998年12月17日,申请号为98813713.5,发明名称为"抗昆虫的转基因植物以及用于改善S-内毒素抵抗目标昆虫活性的方法"的发明专利申请的分案申请。1.0发明背景1.l发明领域本发明涉及的是用于生产通过基因工程方法获得的重组S-内毒素的方法,其中所述的内毒素来源于苏云金芽胞杆菌(Bacillusthuringiensis),在控制南部谷类食根昆虫(DiabroticaundecimpunctatahowardiBarber)以及西部食根昆虫(DiabroticavirgiferavirgiferaLeConte)中有用。1.2相关工艺的描述几乎所有的田间作物、植物、以及商业性耕种区域都很容易受到一种或多种有害昆虫的攻击。特别成问题的是鞘翅类和鳞翅类昆虫。例如,蔬菜和海甘蓝作物,如朝鲜蕨、大头菜、芝麻菜、韭菜、,斧、扁豆、豆子、莴苣(如头、叶子、长叶莴苣)、甜菜根、球状驱虫苋、暗绿叶黄体芋、绿花椰菜、甜瓜(如香瓜、西瓜、crenshaw、蜜瓜、哈密瓜)、牙甘蓝、巻心菜、朝鲜蕨cardoni、胡萝卜、napa、花椰菜、环秋葵、洋葱、芹菜、欧芹、鸡豌豆、荷兰防风草、菊苣、豌豆、大白菜、胡椒、羽衣甘蓝、土豆、黄瓜、南瓜、葫声、萝卜、干的球茎洋葱、芜菁甘蓝、茄子、婆罗门参、escarole、青葱、菊苣、大豆、大蒜、菠菜、绿色洋葱、南瓜、绿色食品、制糖甜菜、甜土豆、芜菁、唐莴苣、山奎、番茄、橄榄类蔬菜、芜菁、以及对一种或多种以下有害昆虫的群袭敏感的各种不同的种类紫花苜蓿尺蠖、粘虫、甜菜粘虫、朝鲜蓟羽蛾、甘蓝对虫、甘蓝尺蠖、甘蓝结网毛虫、谷类earworm、芽菜啃叶虫、交叉条紋的甘蓝蠕虫、欧洲玉米蛀虫、菱形斑紋蛾、绿cloverworm、进口甘蓝蠕虫、甜瓜蠕虫、杂食巻叶虫*(leafroller)、pickleworm、rindworm复合物、盐碱地毛虫、大豆圏环虫*、烟草坊虫、番茄果虫、番茄天蛾幼虫、番茄寸白虫、藜豆毛虫、以及黄条紋粘虫。类似地,牧草以及干草作物,如苜蓿、牧草以及青贮的饲料通常都会受到如粘虫、牛肉粘虫、苜蓿毛虫、欧洲酷蝇幼虫*(skipper)、各种不同的尺蠖和织网毛虫、以及黄条紋粘虫等害虫的攻击。水果以及爬藤类作物,如苹果、杏树、櫻桃、油桃、桃树、梨树、李树、梅子树、温柏杏树、栗子树、榛子树、大胡桃、阿月浑子树、核桃、柑橘、黑莓、越橘、杂交草莓博伊森树莓、酸果蔓、黑加仑、罗甘莓、覆盆子、草莓、drapes、垮梨、香蕉、猕猴桃、柿子、石榴、菠萝、热带水果,经常容易受到以下害虫的攻击并落叶achema天蛾、amorbia、轱虫、柑橘夜蛾、香蕉酷蝇幼虫、黑头安火虫、越橘巻叶虫、尺蠖、櫻桃果虫、柑橘夜蛾、酸果蔓girdler、东部帐篷毛虫、秋季织网毛虫、秋季织网毛虫、榛树巻叶虫、榛树织网毛虫、果树巻叶虫、葡萄果蛾、葡萄叶蝉(leaffolder)、葡萄啃叶虫(grapeleafskeletonizer)、绿色果虫、gu咖osos-batrachedracommosae、吉普赛蛀虫、山胡杉&shuckworm、天蛾幼虫、巻叶虫、navel柑橘毛虫、斜条紋巻叶虫、杂食性巻叶虫、柑橘巻叶蛾、orangedog、东方果蛾、流行性巻叶虫、桃树小枝蛀虫、大胡桃坚果鞘蛾幼虫、红条紋巻叶虫、红色隆背毛虫、粗皮夜蛾、盐碱地毛虫、尺蠖、帐篷毛虫、thecla-theciabasillides、烟草坊虫、巻叶蛾、成蔟状的苹果蚜蛾、杂色巻叶蛾、胡桃毛虫、西部帐篷毛虫、以及黄条紋粘虫.田间作物,如芸薹/油菜籽、月见草、牧场草、玉米(田地、甜的、爆米花)、棉花、蛇麻草、加州希蒙得木(jojoba)、花生、稻谷、红花、细粮(大麦、燕麦、黑麦、小麦等)、高粱、大豆、向曰葵、以及烟草通常都是以下昆虫侵染的目标,包括粘虫、亚洲以及其它的玉米蛀虫、条紋向曰葵蛾、甜菜粕虫、棉铃虫、甘蓝闺环虫、玉米食根虫(包括南部和西部的种类)、棉叶穿孔虫、菱形斑紋蛾、欧洲玉米蛀虫、绿色cloverworm、headmoth、headworm、进口的甘蓝毛虫、團环虫(包括Anaca即todes种属)、斜条紋巻叶虫、杂食性leaftier、podworm、podworm、盐碱地毛虫、西南部玉米蛀虫、大豆尺蠖、斑点夜蛾、向曰葵蛾、烟草蚜虫、烟草天蛾幼虫、藜豆毛虫。苗床植物(beddingplants)、花、观赏植物、蔬菜、以及盆栽经常是许多害虫的食物,例如粘虫、杜鹃花蛾、甜菜粘虫、菱形花紋蛾、ellomoth(天蛾幼虫),佛罗里达蕨类毛虫、caterpillar.Iomoth、尺蠖、夹竹桃蛾、杂食性叶蝉(leafroller)、杂食性尺蠖以及烟草奸虫,森林、水果、观赏植物、结坚果的树以及灌木和其它的园圃树种通常容易受到各种不同的昆虫的攻击,如结草虫、黑头蚜虫、棕尾蛾、加州橡树蛾、道格拉斯杉树蛾、榆树、尺蠖、秋季织网毛虫、果树叶蝉、绿色条紋枫树毛虫(mapleworin)、舞度蛾、短叶松芽巻蛾、含羞草结网毛虫、松树蝶、红色隆背毛虫、鞍背次蛾、鞍突"(saddleprominent)次蛾、春秋尺蠖、云杉巻叶蛾、天幕毛虫、巻叶蛾、以及西部丛蛾,同样地,草皮通常会受到诸如粘虫、草碎织网毛虫、以及热带草皮织网毛虫的攻击。因为具有商业利益的作物通常会受到昆虫的攻击,所以在许多情况中需要有对环境敏感的方法来控制或根除昆虫的侵袭。对于那些寻求通过使用生态友好的组合物来控制昆虫种群的农民、园丁、栽培者、以及商业和住宅区域而言,情况更是如此.近几年发展的使用最为广泛的rf境敏感杀虫配方是由来源于苏云金芽孢杆菌的微生物农药组成的。苏云金芽孢杆菌是一种格兰氏阳性细菌,它产生的结晶态蛋白或包含体对特定的昆虫目和种属具有特定的毒性。已经发现有许多不同的苏云金芽胞杆菌菌抹可以产生杀虫的结晶态蛋白。一些组合物,包括可以产生杀虫蛋白的苏云金芽胞杆菌,已经可以通过商业途径获得并用作环境可接受的杀虫剂,因为它们对特定的目标昆虫具有相当的毒性而对植物以及其它的非目标生物体是无害的,1.2.18-内毒素S-内毒素被用于控制范围广泛的吃叶毛虫和甲虫,以及蚊子。这些蛋白样的准孢子(parasporal)晶体(也称为杀虫晶体蛋白、晶体蛋白、Bt包含体、晶状包含体、包含体、以及Bt毒素)是由苏云金芽胞杆菌生产的杀虫蛋白的一个很大的集合,它们在被易受感染的昆虫宿主摄取之后产生毒性.在过去的十年间,对苏云金芽胞杆菌毒素的结构和功能的研究涵盖了所有的主要毒素类别.虽然这些毒素在具体的结构和功能上存在区别,但是它们被认为在结构和功能上具有普遍的类似性。基于对苏云金芽胞杆菌毒素的知识的积累,已经建立了苏云金芽胞杆菌毒素的普遍性的作用模式,包括由昆虫摄取、在中肠(包括胃和小肠)溶解、由于对于消化酶的抗性而导致的有时候部分消化实际上"激活"了毒素,结合到中肠细胞,在昆虫细胞中形成一个孢子,以及细胞动态平衡的瓦解(English和Slatin,1992)。1.2.2编码晶体蛋白的基因许多S-内毒素在它们的氨基酸序列上有不同程度的类似性.历史上,这些蛋白和编码它们的基因很大程度上是根据它们杀虫活性谱进行分类的.Hofte和Whiteley(1989)的综述讨论了1990年以前在苏云金芽胞杆菌中所鉴定的基因和蛋白,并提出了传统上所使用的针对苏云金芽胞杆菌基因和蛋白的命名法和分类方案。cryl基因编码对鳞翅类昆虫有毒的CryI蛋白。cryll基因编码对鳞翅类和双翅类昆虫均有毒的CryII蛋白.cryIII基因编码对鞘翅类昆虫有毒的CryIII蛋白,而cryIV基因编码对双翅类昆虫有毒的CryIV蛋白,基于序列相似的程度,将这些蛋白进一步分为不同的亚群;给每个亚群中更为高度关联的蛋白赋予小组性的字母如CryIA、CryIB、CryIC等.给在每小组中更为紧密关联的蛋白赋予名称,如CryICl、CrylC2等。最近发展了一种新的命名法,其依据氨基酸序列的同源性胜于依据昆虫目标的特异性来系统地划分Cry蛋白。对许多已知毒素的划分方案,不包括个体蛋白中等位基因的变化,简要地列于表l。最近发展了一种新的命名法,它把Cry蛋白根据氨基酸序列的同源性(而不是根据昆虫目标的特异性)系统地进行分类。表l概括了对许多种已知毒素(不包括对个体蛋白的等位基因变型)的分类方案.表1已知的苏云金芽胞杆菌S-内毒素、基因库编号、以及修正的命名法*<table>tableseeoriginaldocumentpage11</column></row><table>200710141972.2说明书第5/415页CrylAb3CryIA(b)M15271CrylAb4CryIA(b)D00117CrylAb5CryIA(b)X04698CrylAb6CryIA(b)M37263CrylAb7CryIA(b)X13233CrylAb8CryIA(b)M16463CrylAb9CryIA〔b)X54939CrylAblOCrvIA〔b)A29125CrylAcICryIA:c)M11068CrylAc2CryIA:c)M35524CrylAc3CryIA':c)X54159CrylAc4CryIA:c)M73249CrylAc5CryIAi:c)M73248CrylAc6CryIAl〔c)U43606CrylAc7CryIA(:c)U87793CrylAc8CryIA(:c)U87397CrylAc9CryIA:c)U89872CrylAclOCryIA:c)AJ0025HCrylAdlCrvIA'〔d)M73250CrylAelCryIA:e)M65252CrylBalCryIBX06711CrylBa-7X95704CrylBblET5L32020CrylBclCrylb(c)Z46442CrylBdlCryElU70726CrylCalCryICX07518CrylCa2CryICX13620CrylCa3CryICM73251CrylCa4CryICA27642CrylCa5CryICX96682CrylCa6CryICX96683CrylCa7CryICX96684CrylCblCryiC(b)M97880CrylDalCryIDX54160CrylDblPrtBZ22511CrylEalCryIEX53985CrylEa2CryIEX56144CrylEa3CryIEM73252CrylEa4U94323CrylEblCryIE(b)M73253CrylFalCryIFM63897CrylFa2CryIFM63897CrylFblPrtDZ22512CrylGalPrtAZ22510CrylGa2CryIMY09326CrylGblCryH2,725CrylHalPrtcZ22513CrylHblU35780CryllalCryVX62821Crylla2CryVM98544Crylla3CryVL36338Crylla4CryVL49391Crylla5CryVY08920CryllblCryV丽642CryljalET4L32019CryljblET1U31527CrylKalU28801Cry2AalCryIIAM31738Cry2Aa2CryIIAM23723Cry2Aa3D86084Cry2AblCryIIBM23724Cry2Ab2CryIIBX55416Cry2AclCryIICX57252Cry3AalCryIIIAM22472Cry3Aa2Cry3Aa3Cry3Aa4Cry3Aa5Cry3Aa6Cry3BalCry3Ba2Cry3BblCry3Bb2Cry3CalCry4AalCry4Aa2Cry4BalCry4Ba2Cry4Ba3Cry4Ba4Cry5AalCry5AblCry5BalCry6AalCry6BalCry7AalCry7AblCry8AalCry8BalCry8CalCry9AalCry9Aa2Cry9BalCry9CalCry9DalCrylOAalCryIIIACryIIIACryIIIACryIIIACryIIIACryIIIBCryIIIBCrylIIB2CrvIIIC(b)CryIIIDCryIVACryIVACryIVBCryIVBCryIVBCryIVBCryVA(a)CryVA(b)PS86Q3CryVIACryVIBCIYIIICCryIIICbCryIIIECryIIIGCryIIIFCryIGCryIGCryIXCryIHN141CryIVCJ02978Y00420M30503M37207画985X17123A07234M89794U31633X59797Y00423D00248X07423X07082M20242D00247L07025L07026U19725L07022L07024M64478函367謝364画365謝366X58120X58534X75019Z37527D85560M12662CryllAalCryIVDM31737CryllAa2CryIVDM22860CryllBalJeg80X86902Cryl2AalCryVBL07027Cryl3AalCryVCL07023Cryl4AalCryVDU13955Cryl5Aal34kDaM76442Cryl6Aalcbm71X94146Cryl7Aalcbm71X99478Cryl8AalCryBPlX99049Cryl9Aal了eg65Y08920Cry20AalU82518Cry21Aal132932Cry22Aal134547CytlAalCytAX03182CytlAa2CytAX04338CytlAa3CytAY00135CytlAa4CytAM35968CytlAblCytMX98793CytlBalU37196Cyt2AalCytBZ14147Cyt2Bal"CytB"U52043Cyt2Ba2"CytB,,AF020789Cyt2Ba3"CytB"AF022884Cyt2Ba4"CytB,,AF022885Cyt2Ba5"CytB"AF022886Cyt2BblU825198改编自http://epunix.biols.susx.ac.uk/Home/Neil-Crickmore/Bt/index,ht迈l1.2.3生物杀虫剂多肽复合物当首次分离对鞘翅类昆虫有毒的苏云金芽胞杆菌菌抹的报道出现时(Krieg等,1983;1984),作为杀虫剂的细菌结晶蛋白的用途扩展到鳞翅类和双翅类幼虫之外。据报道,被命名为苏云金芽胞杆菌tenebrionis变种的该种菌抹(如美国专利4,766,203号,作为参考结合于本说明书中)对鞘翅类昆虫Agelasticaalni(蓝色alder叶甲虫)以及Leptinotarsadecemlineata(科罗拉多薯虫)的幼虫有毒。美国专利5,024,837也描述了杂交的苏云金芽胞杆菌kurstaki变种菌抹,它们对鳞翅类昆虫有活性.美国专利4,797,279(对应于EP0221024)公开了一种杂交的苏云金芽胞杆菌,它含有一个来源于苏云金芽胞杆菌变种kurstaki的质粒(它编码一个编码对鳞翅类有毒的晶体蛋白的基因)以及一个来源于苏云金芽胞杆菌tenebrionis的质粒(它编码一个编码对鞘翅类有毒的晶体蛋白的基因)。这一杂交的苏云金芽胞杆菌菌林产生的晶体蛋白具有由苏云金芽胞杆菌kurstaki和苏云金芽胞杆菌tenebrionis所产生的晶体蛋白的特征。美国专利4,910,016(对应于EP0303379)^S开了一种苏云金芽胞杆菌的分离物,称为苏云金芽胞杆菌MT104,它对鞘翅类和鳞翅类具有活性。1.2.4分子遗传学技术促进了蛋白质工程分子遗传学在过去十年间的革命促进了可以用合理的、有序的方法对蛋白进行过程改造以使其具有改善的特性.定位以及随机突变的方法、聚合酶链式反应(PCRT")技术、以及在这一领域的相关进展使得人们拥有诸多的工具来改变氨基酸序列,以及在遗传序列背后的各种不同的具有商业、医药、以及农业利益的蛋白质.随着在过去的十年间所鉴定的晶体蛋白的数目和类型的快速增加,研究者们开始对使用这些技术来改善各种不同的晶体蛋白的杀虫活性进行理论化。理论上,使用本工艺中蛋白质工程师所具有的方法可以对S-内毒素进行改善,而且也可以合理地设想分离到现在已经分离出来的野生型晶体蛋白的改善的变体。通过增强上述的毒素作用模式*的一个或多个步骤,改进后的分子应具有增强的活性,从而代表了这一领域的突破,如果蛋白中的特定的氨基酸残基被鉴定为是形成作用模式中的一个特定步骤的原因,那么可以以这些残基为目标进行突变以改善性能.1.2.5晶体蛋白的结构分析苏云金芽胞杆菌毒素的结构分析和随后对这类结构、基元等的功能进行的研究表明晶体蛋白内毒素的特定的区域通常负责特定的功能.例如,已经发现Cry3Bb和CrylAc的结构域l是负责离子通道活性的,这是形成孢子的起始步骤(Walters等,1993;VonTersch等,1994),已经发现结构域2和3是负责受体结合和杀虫活性的(Aronson等,1995;Caramori等,1991;Chen等1993;deMaagd等,1996;Ge等,1991;Lee等,1992;Lee等,1995;Lu等,1994;Smedley和Ellar,1996;S扭ith和Ellar,1994;Rajamohan等,1995;Rajamohan等,1996;Wu和Dean,1996).结构域2和3中的一些区域也可以影响一些毒素的离子通道活性(Chen等,1993,Wolfersberger等,1996;VonTersch等,1994)。1.3已有工艺的缺陷不幸的是,虽然有许多实验室已经尝试过制造突变的晶体蛋白,但是几乎没有人已经制造出对鳞翅类的毒性改善的突变晶体蛋白。在见于文献中的几乎所有的通过基因工程获得的苏云金芽胞杆菌毒素的例子中,突变的晶体蛋白的生物活性并不比野生型的蛋白好,而且在许多情形中,活性反而减少或甚至被破坏了(Almond和Dean,1993;Aronson等,1995;Chen等,1993,Chen等,1995;Ge等,1991;Kvak等,1995;Lu等,1994;Rajamohan等,1995;Rajamohan等,19%;Smedley和Ellar,1996;Smith和Ellar,1994;Wolfersberger等,1996;Wu和Aronson,1992),对于一个在其活性毒素中含有大约650个氨基酸的晶体蛋白而言,虽然在这一序列中的每一个位置都可能存在20中不同的氨基酸,任意创造一个成功的新结构的可能性是很秒茫的,即便是一个250-300个氨基酸的链段被指定具有一个一般的功能.实际上,上述的针对晶体蛋白基因突变的已有工艺中的首要关注点是通过使用突变来扰乱作用模式下的一些步骤来研究这些晶体蛋白的结构和功能,而不是通过基因工程来改善这些毒素.总而言之,在这一工艺中发展杀虫活性提高的合成毒素所取得的有限的成功已经阻滞了这一领域的进步并挫败了对改善的内毒素或晶体蛋白的寻找。不同于遵守简单的、可预测的规则,对一种改善的晶体蛋白的成功的工程改造应该包括不同的策略,这取决于被改善的晶体蛋白以及所针对的害虫。因此,整个过程完全依赖于经验.因此,传统的重组DNA技术显然不是改善杀虫晶体蛋白的常规的实验手段.在已有的工艺中缺乏的是用于通过基因过程获得杀虫活性提高的,特别是对广谱地鳞翅类害虫的毒性提高的苏云金芽胞杆菌晶体蛋白的合理的方法.2.0本发明的综述本发明寻求通过提供由基因工程修饰的苏云金芽胞杆菌s-内毒素(Cry",特别是经过修饰的Cry3S-内毒素(称为Cry3+内毒素),来克服在已有的工艺中固有的上述的以及其它的缺点,本发明同时还提供包含一个或多个编码此类修饰蛋白的基因的核香酸序列。特别优选的基因包括cry3氺(如cry3A承、cry3B氺、cry3C氺基因),特另'J是cry3B氺基因,更为优选的是cry3Bb承基因,这些基因所编码的经过修饰的晶体蛋白对目标害虫的杀虫活性提高了。同时公开的是用于构建合成的Cry3+蛋白、经过合成的方法修饰的编码这些蛋白的核苷酸序列、以及它们的组合物的新颖的方法。同时提供的还有合成的cry3+表达栽体以及使用这些改善的基因和载体的多种不同的方法。在一个优选实施例中,本发明公开并要求保护了Cry3B+蛋白以及織码改善的杀虫多肽的cry3B氺。在一个优选实施例中公开了形成通道的毒素的设计方法,它已经被用于生产特定的一套经过设计的生物活性提高的Cry3Bb+毒素,在表2中列出了这些改进的Cry犯b+蛋白,以及它们相应的对应于野生型(WT)Cry3Bb的氨基酸变化、在编码蛋白的改变的cry3Bb+基因中存在的核普变化、相对野生型Cry3Bb的生物活性的级数增加、改变的结构位点、以及用于创造新毒素的设计方法.相应地,总体上本发明提供了经过突变的编码Cry3蛋白的基因以及制造和使用这些基因的方法,此处所用的术语"经过突变的cry3基因"指的是一种或多种核苷序列,它们已经被突变或改变成含有一个或多个在野生型中不存在的核苷序列,它们所编码的突变体Cry3晶体蛋白(Cry3+)的杀虫活性提高.这些经过突变的cry3基因在详细说明书中已经被称为cry3+基罔.cry3+基罔的例子包括cry3A+、cry3B*、以及cry3C氺基因,经过突变的编码Cry3蛋白的基因的例子包括cry3B基因.此处所用的术语"经过突变的cry3B基因"指的是一种或多种基因,它们已经被突变或改变成含有一个或多个在野生型序列中所不存在的核苷序列,它们所编码的突变体Cry3B晶体蛋白(Cry3B*)的杀虫活性提高了,这类基因已经被称为cry3B+基因。cry3B+基因的例子包括cry3Ba+、cry3Bb+基因,它们分另'编码Cry3Ba+和Cry3Bb+蛋白*相应地,本发明提供了经过突变的编码Cry3A蛋白的基因以及制造和使用这些基因的方法,此处所用的术语"经过突变的cry3A基因"指的是一种或多种核苷序列,它们已经被突变或改变成含有一个或多个在野生型中不存在的核普序列,它们所编码的突变体Cry3A晶体蛋白(Cry3A*)的杀虫活性提高。这些经过突变的基因已经被称为cry3A丰基因。相应地,本发明提供了经过突变的编码Cry3C蛋白的基因以及制造和使用这些基因的方法.此处所用的术语"经过突变的cry3C基因"指的是一种或多种核苷序列,它们已经被突变或改变成含有一个或多个在野生型中不存在的核苷序列,它们所编码的突变体Cry3C晶体蛋白(Cry3C*)的杀虫活性提高.这些经过突变的基因已经被称为cry30基因,优选地,新颖的序列包括核苷酸序列,其中至少一个,优选的一个以上,最优选的,相当数量的,野生型的cry3核苷已经被替换为一个或多个核苷,或者一个或多个核苷已经被加入到天然的核苷序列中,或者已经从该序列中删除,以便改变、增加、或删除由如此突变的核苷酸序列所编码的相应的氨基酸.因此,想得到的结果是,相比于未经修饰的晶体蛋白,改变被编码的晶体蛋白的氨基酸序列以提供具有提高或改变的活性以及/或者特异性的毒素.优选的编码Cry2Bb*的基因包括cry3Bb.60,cry3Bb.11221,cry3Bb,11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,cy3Bb.11230,cry犯b.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11032,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb,11051,cry3Bb,11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095,以及cry3Bb.11098。CRY3Bk^蛋白,显示对抗SCRW幼虫的活力改善了Cry3Bb*蛋白名称质粒名称ayMM核脊序列变化Cry3BbA变化的结构位置WT活'f生的级数增加所使用的设计方法Cry3B固-Cry3Bb.11221pEG1707Cry3Bb.11222pEG1708Cry3Bb.U223pEG1709Cry3Bb.11224Cry3Bb.11225Cry3Bb.11226Cry3Bb.11227pEG1710pEG1711pEG1712pEGl713A460T,C461T,A462T,C464A,T465C,T466C,T467A'A468T,A469T,G470C,T472C,T473G,G474T,A477T,A478T,G479CT687C,T688C,A689T,C691A,A692GT667C,T687C,T688A,A689G,C691A,A692GT687C,A692GT687C,C691AT687C,C691A,A692C,T693CC868A,G869A,G870T△1-159T154F,P15,,U56H,L158RY230L,H231SS223P,Y230S1.1231RH231N,T241SH231TR290N厶al-a3la3,4a6a6a6a6a6la7,pl3.6x6.4x4.0x5.0x3.6x1,9x1,6,81,83,7,877,83,46<image>imageseeoriginaldocumentpage21</image><table>tableseeoriginaldocumentpage22</column></row><table><table>tableseeoriginaldocumentpage23</column></row><table>质粒名称ci>,3B6*核脊序列变化表2(续)Cry3Bb*变化的结构位置WT活性的级数增加所使用的设计方法Cry3Bb.11048Cry3Bb.師lCry3Bb.U057pEG顧pEG1057pEG1062Cry3Bb.l画pEG腕Cry3Bb.11081pEG1084T309A,A310,厶311,A312A565G,A566GT309A,A310,A311,A312,G479A,A481C,A482C,A484C,G485A,A486C,A494GT309A,A310,A川,A312,A460T,C461T,A462T,C464A,T465C,T466C,T467A,A468T,A469T,G470C,T472C,T473G,G474T,A477T,A478T,G479CA494G,T931A,A933C,T942A'T945A,G9祖,T954CD103E,AA104K189GD103E,AA104'S160N,K161P,1,162H,D165GD103E,AA104,T154F,P155H,L156H,L158RD165G,S31T,E317Kla2a,2bla4,5la2a,2b:a4la2a,2b;la3,4oc4;lpl,a84.3x3.4x6-lx82,3,42,4,8,101,8,102,4,8,10200710141972.2势溢也被17/415:a;(<table>tableseeoriginaldocumentpage25</column></row><table>在许多个说明性的实施例中,本发明者已经显示了用这些方法成功地产生杀虫活性提高的毒素,具体地,本发明者已经筌定了分析和设计在体内和体外其杀虫活性都得以提高或增强的毒素的独特的方法.除了对Cry3Bb肽进行修饰以外,受益于本发明教导的人士现在可以对许多种形成通道的毒素,特别是与Cry3Bb在功能上或结构上有关联的蛋白进行突变。实际上,本发明者设想任何苏云金芽胞杆菌晶体蛋白或肽都可以用本发明所公开的方法进行研究,并可以用本发明所公开的方法进行改变以产生杀虫特异性或活性提高的晶体蛋白。或者,本发明者设想受益于本发明教导的本工艺的熟练人士不仅可以制备活性提高的Cry3毒素,还可以制备其它的晶体蛋白,包括在本文中的表l所描述的所有的那些。具体地,本发明者设想可以通过使用本发明中所公开的一种或多种方法来产生活性提高的Cry3承变体毒素,例如,本发明者注意到Cry3A、Cry3B、以及Cry3C晶体蛋白(它们都是本工艺中所熟知的)可以通过使用此处所采用的一种或多种设计策略进行修改以制备通过合成的方法进行修改的活性提高的晶体蛋白。类似地,本工艺的熟练人士甚至可以利用本发明的教导对其它的形成通道的晶体蛋白进行修饰,包括除了苏云金芽胞杆菌晶体蛋白以外的形成通道的毒素,甚至可以对尚未被介绍或定性的蛋白和通道毒素进行修饰。因为杀虫晶体蛋白的结构显示了明显的蛋白的三级结构保守性(Grochulski等,1995),而且许多晶体蛋白的氨基酸序列与Cry3Bb的氨基酸序列在结构域l中具有显著的同一性,这些蛋白包括Cryl,Cry2,Cry3,Cry4,Cry5,Cry7,Cry8,Cry9,CrylO,Cryll,Cryl2,Cryl3,Cryl4,以及Cryl6类別的蛋白(表l).。现在,在本发明者的令人吃惊的发现的指导下,受益于本发明教导的本工艺的熟练人士第一次可以把本发明的方法广泛地应用于对诸多晶体蛋白进行修饰以改善其活性或改变其特异性。这些方法不应该被局限于表l中所公开的杀虫晶体蛋白,它们可以被用亍任何其它的相关的晶体蛋白,包括未被鉴定的那些。具体地,Cry3A、Cry3B、以及Cry3C蛋白之间的高度同源性可以从这三个蛋白的一级氨基酸序列的对仗中看出(图17A、图17B、以及图17C)。照这样,采用一种或多种本说明书中所描述的突变设计方法,现在即可将所公布的方法用于制备引入了一种或多种改变的经修饰的晶体蛋白。本发明者们进一步考虑到可以在晶体蛋白或者是其它可通过位点特异性或随机突变进行类似的修饰以产生具有改良活性的毒素,或者可逸择的,具有改变的特异性毒素形成通道的一个或多个结构域,内确定区域。在具体的实施例中,制造活性增强的经改变的毒素以抵抗一种或多种昆虫是合乎需求的。可选择地,利用此处所描述的方法来制造及筌定已改变的杀虫晶体蛋白,上迷的蛋白具有较广谱的抗敏感昆虫活性,也将是合乎需求的。本发明者们进一步考虑到制造含有一个或多个突变的嵌合杀虫晶体蛋白对于预备"超级"毒素将是合乎需求的,该毒素同时具有杀虫活性增强及伴随有广谱活性这两个优点.按照所公布的内容,在毒素序列内一个或多个密码子的诱变可以导致产生一系列活性增强的相关的杀虫蛋白。虽然本发明针对包括于本发明中的每一个设计策略已经描述了一些突变实施例,但是本发明者们考虑到可以在杀虫晶体蛋白上制造突变,包括在环区域、螺旋区域、毒素的活性位点区域、参与蛋白寡聚化作用的区域等等上进行突变,由此可以形成功能性的生物杀虫晶体蛋白。所有这类突变均被认为包括在本公布的范围之内。在一个示例性的实施例中,获得了诱变的cry3Bb+基因,它所编码的Cry3Bb+变体大体上是以野生型Cry3Bb序列为基础的,但在该蛋白的氨基酸序列中同时还含有通过使用此处所描述并要求保护的一种或多种设计策略而结合进去的一种或多种变化.在这些及其它的实施例中,可以对这些编码晶体蛋白的突变基因进行修饰以便在所编码的多肽的一级序列上改变约一个、两个、三个、四个、或五个左右的氨基酸。可选择地,也可引入更多的改变(相对天然序列而言),以便使所编码的蛋白质可以有至少约1%或2%、或者可选择地约3%或约4%、或者甚至约5%至约10%、或者约10%至约15%、或者甚至约15%至约20%或者更多的密码子被改变、删除或被以其它的形式进行修饰。在特定情况下,甚至希望在本质上改变更多的一级氨基酸序列以获得理想的修饰蛋白。在这些情形中,本发明者们预期有从大约25%到大约50%、或者从大约50%到大约75%、或者更多的天然(或野生型)密码子被改变、删除、或以其它的形式进行修饰.可选择地,在氨基酸序列或编码它的DNA基因下的突变,将导致在晶体蛋白或肽类的一个或多个区域内产生一个或多个氨基酸的插入或删除。为了在编码多肽的一级序列上完成这些突变,希望从编码这些多肽的基因的核苷酸序列中突变或删除一个或多个核苷,或者可选择地,在特定的环境下,在一级核苷酸序列的一个或多个位点上加入一个或多个核苷。经常地,需改变几个核苷残基以获得所需的多肽.因此,本发明者们企图在具体的实施例中,希望在一级序列中改变仅一个、两个、三个、四个、或大约五个核苷'在需要有更多改变的另一些实施例中,诱变可以包括在基因序列上改变、删除、或插入6、7、8、9、10、11、12、13、14、15、16、17、18、19、或者甚至20个左右的核苷残基。在又一些实施例中,可能会希望在基因的序列中突变、删除、或插入21、22、23、24、25、26、27、28、29、30-40、40-50、50-60、60-70、70-80、80-90、或者甚至90-100、150、200、250、300、350、400、450个或更多的核苷,目的是制备产生具有理想特性的Cry3+多肽的cry3+基因。实际上,任何数目的突变、删除、和/或插入都可以在基因的一级序列上进行,只要所编码的蛋白具有提高的杀虫活性或此处所描述的特异性的特征。在编码内毒素基因的核苷序列上改变很多密码子可能是特别理想的,而且经常是获得理想效果所必需的,尤其是在"植物化"一段DNA序列以使非植物来源的DNA在经转化的植物细胞中表达的情形下。这些方法对于植物遗传学工艺的技术人员来说是常规的,而且经常会改变初级基因序列上的许多残基以帮助该基因在植物细胞中表达。优选的,这些基因序列上的改变没有在氨基酸序列上引入变化,或者仅在氨基酸序列上引入了保守的替换,以使在植物细胞中从"植物化"的核苷序列上所生产的多肽依然具有完全的功能,以及当在植物细胞中表达时仍具有所希望的性质.以本发明中的方式突变的基因和所编码的蛋白也可有效地与编码其它蛋白的核苷酸序列相连,或者作为融合蛋白表达.N端和C端的融合蛋白均是合乎需求的.事实上,任何编码蛋白或多肽的DNA序列、或者它们的组合,均可与突变的cry3举序列融合以编码一种融合蛋物质的DNA序列引导肽、用于重组体表达的蛋白、一种或多种引导肽所附着的蛋白、蛋白亚基、来源于一种或多种晶体蛋白的区域,等等.对初级核苷酸序列所进行的这类修饰(其目的是增强、定向、或优化在特定宿主细胞,组织,或细胞定位中的基因序列的表达)是蛋白质工程和分子生物学工艺中的技术人员所熟知的,而且对于受益于本发明详细说明的技工而言,如何便利在核苷序列中进行这些变化以生产此处所公布的多肽和多聚核苷酸也将显而易见.在一方面,本发明公开了并要求保护含有一种或多种此处所公布的经过修饰的晶体蛋白的宿主细胞,特别是以下苏云金芽胞杆菌抹系的细胞EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,以及EG11098,它们包含编码通过合成进行修饰的杀虫活性提高的Cry3Bb+晶体蛋白的重组DNA片段。同样地,本发明也公开并要求保护了以下苏云金芽胞杆菌菌抹的细胞培养物EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,以及EG11098。这类细胞培养物可以是包括单一林系的具生物学纯度的培养物,或者可选地,可以是包括一种或多种抹系的共培养的细胞.这种细胞培养物可以在一定的条件下培养,在这种条件下,一种或多种另外的苏云金芽胞杆菌或其它细菌的菌抹与一种或多种公开的培养物同时进行共培养,或者可逸地,一种或多种本发明中的细胞培养物可以与一种或多种另外的苏云全芽胞杆菌或其它细菌菌林在各自的独立培养之后再组合。当悬浮的细胞中含有两种或更多不同的所需要的晶体蛋白时,这种操作将是有用的,本发明的培养物已经被保藏在特定的条件下,这个条件确保这些培养物在本发明悬而未决期间可以提供给由CommissionerofPatentsandTrademarks17C.F.R.第1.14节以及35U.S.C.笫122节所确定的人士,并根据外国专利法的要求,这些保藏物在提交有本发明等同发现或其派生发明的国家可以获得。然而应该理解的是,可以得到保藏物并不等于被准许可以在损害由政府行为所核权的专利权的情形下实施本发明。进而,本发明的培养物保藏将根据《微生物存贮布达佩斯公约》的规定进行保藏并对公众公开,即,将根据需要对其进行足够的照顾以使其在最近一次要求完成样品保藏之后的至少5年内、以及在任何情形中,在保藏日期之后的至少30年间或者在任何可能公开该培养物的发明的有效期限之内保持其存活并不受污染。当保藏处在被要求时因为保藏条件的原因无法提供培养物时,保藏者承担替换保藏物的责任。接;之后即永久':地被消除。表3中列出的培养物根据布达佩斯公约的条款被保藏在AgriculturalResearchServiceCultureCollection,NorthernRegionalResearchLaboratory(丽L)的永久性保藏库中。表3根据布达佩斯公约的条款储存的本发明的菌林<table>tableseeoriginaldocumentpage30</column></row><table>表3(续)<table>tableseeoriginaldocumentpage31</column></row><table>同时公布的是从环境中控制或根除一种昆虫种群的方法。这种方法大致包括将所要控制或根除的昆虫种群与一种杀虫有效剂量的Cry3'晶体蛋白复合物联系起来。优选的Cry3,复合物包括Cry3A、Cry3B^和Cry30多肽复合物,其中Cry3B,复合物尤其优选。这些多肽的例子包括选自含有以下蛋白的群体Cry3Bb.60,Cry3Bb.11221Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb'11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry3Bb.11046,Cry3Bb,11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095,以及Cry3Bb.11098,在优选的实施例中,这些Cry3B+晶体蛋白复合物包括以下任一氨基酸序列序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108.2.l产生修饰的Cry丰蛋白的方法
技术领域
:本发明中经过修饰的Cry+多肽可以通过一个特定的程序进行制备,该程序通常包括以下步骤获得一段编码Cry丰多肽的核苷酸;分析该多肽的结构以筌定特定的对该基因序列进行突变的"目标"位点;在该核苷酸序列中引入一个或多个突变以改变所编码的多肽序列中的一个或多个氨基酸残基;以及在一个经过转化的宿主细胞中,在一个能够有效获得由该cry+基因编码的经过修饰的Cry举蛋白的条件下表达经过突变的核苷酸序列,用于获得本发明多肽的晶体结构的方法是公知的,在本发明的第9节中给出了几套示范性的高分辨率晶体结构,其中包括本发明所描述的Cry3A和Cry3b多肽的晶体结构,第9节中所提供的信息使得可以进行本发明中每一方法中所描述的分析,这些分析依赖这些三维晶体结构信息来把多肽的突变定位到这些s-内毒素的一级氨基酸序列的特定区域,从而获得杀虫活性提高或杀虫特异性增强的突变体。用于获得如本发明所述的杀虫活性或杀虫特异性提高的经过修饰的苏云金芽胞杆菌Cry3Bb8-内毒素的第一种方法通常包括获得该内毒素的高分辨率三维晶体结构;在该晶体结构中定位一个或多个结合水区域,其中的结合水形成了一个连续的亲水性表面,这些亲水表面分隔不超过16A;通过增加该蛋白在该区域的一个或多个氨基酸的疏水性来增加该表面上的水分子数目;获得如此生产的经过修饰的S-内毒素。示例性的S-内毒素包括Cry3Bb.11032、Cry3Bb.11227、Cry3Bb.11241、Cry3Bb.11051、Cry3Bb.11242、以及Cry3Bb.11098.用于获得杀虫活性杀虫特异性提高的经过修饰的苏云金芽胞杆菌Cry3BbS-内毒素的另一种方法通常包括在S-内毒素中确定一个loop区;对该loop区的一个或多个氨基酸进行修饰以增加氨基酸的疏水性;获得如此生产的经过修饰的5-内毒素,优选的通过这一方法生产的5-内毒素包括Cry3Bb.11241,Cry3Bb,11242,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11233,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,以及Cry犯b.11239。本发明同时还提供了一种用于增加苏云金芽胞杆菌Cry3bS-内毒素的形成通道的螺旋的运动性的方法。该方法通常包括打断在一个或多个在形成通道的螺旋中的一个氨基酸以及s-内毒素的另一个氨基酸之间所形成的氢键.氢鍵可以形成于分子间或分子内,但是氲鍵的打断应该包括用第三个氨基酸替代笫一个或第二个氨基酸,上迷第三个氨基酸的空间距离应大于3A,或者它的相对于第一个或第二个氨基酸的氢结合位点空间取向键角不等于180+/-60°,用此种方法生产的并在本发明种描述的S-内毒素包括Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry犯b.11231,Cry3Bb.11241,Cry3Bb.11242,以及Cry3Bb.11098。同时公开的还有一种增加在苏云金芽胞杆菌Cry3Bb5-内毒素的形成通道的结构域的环区的柔韧性的方法.这一方法包括获得具有一个或多个环区的Cry3BbS-内毒素的晶体结构;筌定组成环区的氨基酸;以及改变一个或多个氨基酸以减少环区的立体障碍,其中这一改变增加了5-内毒素环区的柔韧性,采用这一方法生产的5-内毒素包括Cry3Bb.11032,Cry3Bb.11051,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bk11233,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11227,Cry3Bb.11234,Cry3Bb.11241,Cry3Bb.11243,Cry3Bb.11036,以及Cry3Bb.11098,本发明的另外一个方面是一种用于增强S-内毒素活性的方法,包括减少或消除8-内毒素对目标昆虫肠道中碳水化合物的结合.这种减少和消除可以通过除去S-内毒素结构域l中的一个或多个ot螺旋来实现,例如除去ot螺旋al,a2a/b,以及a3,用这种方法生产的一种示例性的5-内毒素是Cry3Bb.60,可选地,这种减少和消除可以通过把环区pi,a8中的一个或多个氨基酸替换为一个或多个疏水性增强的氨基酸来实现,这种方法可以产生如Cry3Bb.11228,Cry3Bb.11230,Cry犯.11231,Cry3Bb.11237,以及Cry3Bb.11098等S-内毒素,这些S-内毒素在本发明中都有详细的描述o可选地,这种减少和消除可以通过把特定的一个或多个氨基酸替换为任何一种别的氨基酸来实现。这些替换描述于表2和本发明的实施例中.一个实施例是此处称为Cry3Bb.11221的5-内毒素。一种确定Cry3Bb5-内毒素中用于定点突变的区域的方法包括获得S-内毒素的一个晶体结构;从晶体结构中确定该蛋白中一个或多个暴露于表面的氨基酸;对这些暴露于表面的一个或多个氨基酸进行随机替换以获得许多突变的多肽,其中至少50%的突变多肽丧失杀虫活性;以及从这些诸多的突变多肽中筌定一个或多个Cry3Bb5-内毒素的区域用于定点突变,这一方法可以进一步包括确定这些诸多的杀虫活性丧失的突变多肽的氨基酸序列,以及鉴定杀虫活性所必需的一个或多个氨基酸。在一个实施例中,本发明提供了一个用于生产一种杀虫活性改善的Cry3BbS-内毒素的工序。这一工序通常包括以下步骤获得该蛋白的高分辨率晶体结构;确定该蛋白的静电表面分布;鉴定一个或多个静电差异大的区域;通过改变该区域的一个或多个氨基酸来改变该区域的静电差异;以及获得一个杀虫活性改善的Cry3BbS-内毒素,在一个实施例中,可以减少静电差异(相对天然的Cry3Bb5-内毒素的静电差异而言).静电差异减少的s-内毒素的例子包括Cry3Bb.11227,Cry3Bb.11241.以及Cry3Bb.1124212。可选地,可以增加静电差异(相对天然的Cry3BbS-内毒素的静电差异而言)。静电差异增加的S-内毒素的一个例子是Cry3Bb.11234,另外,本发明还提供了一种生产杀虫活性提高的Cry3Bb5-内毒素的方法,包括获得一个高分辨率的晶体结构;鉴定该蛋白中一个或多个金属结合位点的存在;改变该结合位点的一个或多个氨基酸;以及获得一个经过改变的杀虫活性改善的蛋白.这种改变可以包括去除一个或多个金属结合位点.这种s-内毒素的例子包括Cry3Bb.11222,Cry3Bb.11224,Cry3Bb.11225,以及Cry3Bb.11226.本发明的另外一个方面涉及一种鉴定一种通道活性改善的苏云金芽胞杆菌Cry3BbS-内毒素的方法。这一方法总体上包括获得一种被怀疑通道活性改善的Cry3Bb8-内毒素;确定该5-内毒素的一个或多个以下的特征;以及把这些特征与野生型的未经修饰的S-内毒素的进行比较(l)通道形成速率,(2)通道导率的生长速率,或(3)通道开启状态的持续时间.从这一比较可以选择一种通道形成速率提高(相对于野生型5-内毒素)的8-内毒素.用这一方法制备的Cry3Bb5-内毒素包括Cry3Bb.60,Cry3Bb.11035,Cry犯b.11048,Cry3Bb.11032,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11226,Cry3Bb.11221,Cry3Bb.11242,Cry3Bb.11230,以及Cry3Bb.11098。本发明同时还提供了一种用于生产一种经过修饰的、杀虫活性改善的Cry3Bb8-内毒素的方法,包括改变一个或多个定位于两个或多个Cry3BbS-内毒素环区的收敛最大的位置或其附近的非表面氨基酸以便减弱这些环区中的一个或多个的运动性。运动性可以便利地通过比较经过修饰的蛋白和野生型的Cry3Bb5-内毒素的热变性的区别来确定用这种方法产生的晶体蛋白的例子有Cry3Bb.11095,本发明的另外一个方面涉及一种用于制备一种经过修饰的、杀虫活性改善的苏云金芽胞杆菌Cry3Bb8-内毒素的方法,包括修饰环区的一个或多个氨基酸以增加上述氨基酸的疏水性;改变上述氨基酸中的一个或多个以减少环区的立体障碍,其中这种改变增加了该内毒素环区的柔韧性.由此生产的Cry3BbS-内毒素的例子有Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11231,Cry3Bb.11235,以及Cry3Bb.11098'本发明还提供了一种改善苏云金芽胞杆菌Cry3BbS-内毒素的杀虫活性的方法,通常包括在S-内毒素的结构域1中的一个或多个环区中插入一个或多个对蛋白酶敏感的位置。优选地,这一环区是a3,4,如此生产的一个5-内毒素的例子是Cry3Bb.11221,2.2多肽组合物用此处所描述的各种方法所生产的晶体蛋白也代表了本发明的一些重要的方面。这些晶体蛋白优选地包括选自以下群体的一种蛋白或肽Cry3Bb.60,Cry3Bb,11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236.Cry3Bb.11237,Cry3Bb.11238,Cry3Bb,11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb,11035,Cry3Bb.11036,Cry,3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095,以及Cry3Bb.11098,在优选的实施例中,蛋白含有选自以下群体的一种连续的氨基酸序列序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,以及序列编号108,特别优选的是那些由以下核苷酸序列编码的晶体蛋白序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号200710141972.2说明书第30/415页27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107,或者是一种在中等严格的条件下与以下的核苷酸序列杂交的核苷酸序列序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107,包括在本发明范围之内的氨基酸、肽和蛋白序列包括但不局限于以下序列编号中所述的序列序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,以及序列编号108。在氨基酸序列上所作的改变包括变更、删除、突变以及同系物。本发明提供了含有大约0.5%至大约99%(重量比)之间、或者更优逸地大约5%至75%之间、或者大约25%至50%之间的晶体蛋白的组合物,这些组合物可以通过使用技术人员所熟知的蛋白质生产和纯化技术以及本发明所描述的方法容易地进行制备。这种用来制备一种Cry3BW晶体蛋白的步骤通常包括以下步骤在能够有效地生产晶体蛋白的条件下培养一种能够表达Cry3Bb+蛋白的宿主细胞(如苏云金芽胞杆菌EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,或EG11098细胞);以及随后获得如此生产的晶体蛋白.蛋白可以存在于完整的细胞中,这样随后就不需要任何蛋白分离和纯化的步骤.可选地,可以把细胞打破、超声处理、裂解、断裂、或使其质壁分离以便从遗留的细胞碎片中释放晶体蛋白。在这种情形中,可能会希望在使用之前,如在配制杀虫组合物之前,分离、浓缩、或进一步纯化由此获得的含有蛋白的晶体.可以把蛋白纯化到最后几乎仅含有纯的蛋白,或者可选地,可以把其纯化或分离到一个程度,使得该组合物含有大约O.5%至大约99%(重量比)之间、或者在大约5%至大约95%之间、或者在大约15%至大约85%之间、或者在大约25%至大约75%之间、或者在大约40%至大约60%之间等的晶体蛋白。2.3表达cry3承基因的重组载体本发明的一个重要的实施例是一种重组栽体,它含有一个编码一个或多个此处所述的新颖的苏云金芽胞杆菌晶体蛋白的核苷酸片段.这种栽体可以被转移到一个原核或真核宿主中并在其中复制,其中特别优选的原核细胞是细菌细胞、而特别优选的真核细胞是植物细胞。在优选的实施例中,重组栽体含有一个编码以下氨基酸序列的核苷酸片段序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108.特别优选的是那些含有以下序列的核苷酸片段序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107,本发明的另外一个重要的实施例是一个经过转化的宿主细胞,它可以表达这些重组载体中的一个或多个。宿主细胞可以是真核的,也可以是原核的,而且特别优选的宿主细胞是那些表达含有重组载体载体的核苷酸片段,其中的重组栽体编码一个或多个苏云金芽胞杆菌晶体蛋白,其中的晶体蛋白在结构域l的一个或多个环区,或者在结构域l的a螺旋7和结构域2的p链l(pstrandl)之间,含有经过改变的氨基酸序列.细菌细胞是特别优逸的原核细胞,而植物细胞是特别优选的真核细胞。在一个重要的实施例中,本发明公开了一种宿主细胞并对其提出了权利要求,其中经过修饰的氨基酸序列在结构域l中的a螺旋l和2之间、a螺旋2和3之间、a螺旋3和4之间、a螺旋4和5之间、a螺旋5和6之间、a螺旋6和7之间,或者在结构域l的a螺旋7与结构域2的p线l之间,含有一个或多个环区.一个特别优选的宿主细胞是一个含有以下氨基酸序列的宿主细胞序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108,以及更为优选的,一个含有以下核苷酸序列的宿主细胞序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31.,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107。本发明描述了用编码根据本发明的经过修饰的Cry3Bb晶体蛋白的核苷酸序列转化的细菌宿主细胞并对其提出了权利要求,具体是那些被称为EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,或EG11098的一种苏云金芽胞杆菌细胞,在另一个实施例中,本发明包括了一种使用本发明的编码cry3Bb+基因的核苷酸片段的方法。这一方法总体上包括以下步骤(a)制备一个重组载体,在这个载体中cry3Bl^基因被定位成可以受到启动子的控制;(b)把重组栽体导入宿主细胞;(c)在可以有效表达由上述的cry3Bb举基因编码的Cry3Bb+晶体蛋白的条件下培养宿主细胞;以及(d)获得所表达的Cry3Bb举蛋白或肽。有许多种方法可以被用于在可以稳定保持和表达一个表达毒素的苏云金芽胞杆菌基因的条件下把这一基因导入到微生物宿主中.可以供给DNA构建物,这些DNA构建物应包括用于表达这一毒素基因的转录和翻译调控信号;受它们调控的毒素基因;以及一个与宿主生物体中的一个序列同源的DNA序列,通过这一序列来实现整合;以及/或者一个在宿主中可以发挥功能的复制系统,通过这一系统来实现整合或稳定保持。转录起始信号将包括一个启动子和一个转录起始位点.在一些情形中,为毒素提供调节性的表达是合乎需求的,其中毒素的表达只有在被放入外部环境之后才会发生。这可以用启动子、或一个结合到一个激活因子上的区域、或增强子来实现,它们可以在微生物的物理和或化学环境发生变化的时候进行诱导.例如,可以使用对温度敏感的调节区域,其中生物体可以在实验室中进行培养,但并不表达毒素,但是一旦被释放到环境中,就开始表达.其它的技术可以在实验室中应用一种特定的营养介质,这种培养基抑制毒素的表达,但是环境中的营养介质可以使毒素表达.可以用一个核糖体结合位点和一个起始位点来启动转录。可以用各种不同的操作来增强信使RNA的表达,特别是通过使用一个具有活性的启动子,以及通过使用一些增加信使RNA稳定性的序列.转录和翻译终止区域将包括一个或多个终止密码,一个终止子区域,以及一个可选的多聚腺苷化作用信号.可以在被翻译的多肽序列的氨基端采用一个疏水的"引导"序列以便增强蛋白跨内膜分泌,沿着转录的方向,即从编码或有义序列的5,端到3,端,构建物将包括转录调控区(如果有的话);启动子,其中调节区域可以是启动子的5,端或3,端;核糖体结合位点;起始密码子;含有一个开读框的结构基因,该结构基因协调地具有起始密码、终止密码、多聚腺苷酰化作用信号序列(如果有的话)、以及终止区域.双链形式的这个序列可以被自身用于微生物宿主的转化,但是通常都包含有一段含有标记物的DNA序列,其中第二个DNA序列可以在把DNA引入宿主时被连接到毒素表达构建物上,借助于一个标记物,使得结构基因能够选择已被修饰或转化的宿主。标志物通常可以提供选择性的优点,例如,提供对生物杀伤剂,例如抵抗抗生物素或重金属的抗性;互补作用,以便为营养缺陷型的宿主提供原养,等等,优选地使用互补作用,以便不仅对经过修饰的宿主进行选择,同时还可使其在田间具有竟争力。可以在建立构建物时使用一个或多个标记物,也可以用它们来修饰宿主。可以通过提供相对于田间野生型的微生物的竟争性优点来进一步对生物体进行修饰。例如,可以把表达金属螯合剂(如siderophores)的基因与表达毒素的结构基因同时导入宿主中。这样,siderophores表达的增强可以为生产毒素的宿主提供一个竟争性的优点,这样它就可以与野生型的微生物有效地进行竟争并在环境中占领一片活动范围.在没有功能性复制系统存在的情况下,构建物将同时包括一个序列,该序列至少有50碱基对(bp)的序列,优选的至少有100bp,更优选的有1000bp,而且通常不多于2000bp的序列与宿主中的一个序列是同源的,这样,正确重组的可能性就得到了增加,这样基因将被整合到宿主中并由宿主稳定地保存。合乎需要的是,毒素基因将和提供互补作用的基因以及提供竟争性优点的基因非常靠近.这样,当毒素基因丢失时,如此获得的生物体也将丢失起互补作用的基因以及/或者提供竟争性优点的基因,这样宿主将无法在环境中参与竟争,只是基因仍保留在原封不动的构建物中。从范围广泛的微生物宿主如细菌、噬菌体、蓝藻、藻类、真菌、等等中可以获得数量众多的转录调节区域。各种不同的转录调节区域包括与以下相关联的区域trp基因、lac基因、gal基因、A^和U启动子、tac启动子、与8-内毒素基因相关联的天然启动子,它们在宿主中都具有活性。参照美国专利4,332,898;4,342,832;和4,356,270,它们都被特定地作为参照结合于本发明中.终止区域可以是通常与转录起始区域相关的终止区域,或者也可以是一个不同的转录终止区域,只要这两个区域是可兼容的而且在宿主中是具有活性的。如果需要稳定的游离基因维持或整合,可以采用一种其复制系统可以在宿主中发挥功能的质粒,复制系统可以来源于染色体、通常存在于宿主或另一个宿主中的游离基因元件、或者来源于病毒的在宿主中可以稳定存在的复制系统。由许多质粒可供选择,如pBR322、pACYCI84、RSFIOIO、pR01614、等等'可参考,例如01son等(1982);Bagdasarian等(1981);Baum等(1990);以及美国专利4,356,270;4,362,817;4,371,625;以及5,441,884,以上都特定地作为参照结合于本发明中。可以在转录和翻译起始区域以及转录和翻译终止区域之间导入苏云金芽胞杆菌基因以便可以让其受到起始区域的调控。可以把这一构建物包括于一个质粒中,这个质粒应包括至少一个复制系统,但是可以包括一个以上,其中一个复制系统是用于在质粒的发育过程中进行克隆的,第二个复制系统则是它在最终的宿主中发挥功能所必需的。另外,可以由一个或多个标记物,标记物已经在上面描述了。当需要整合时,质粒包括一个与宿主基因组同源的序列是合乎需求的.可以根据传统的方法来分离转化体,通常使用的是一种可以把想要的生物体从未经修饰的生物体或转化(fransferring)生物体(如果有的话)中筛选出来的筛逸技术。然后可以试验转化体的杀虫活性。如果需要,可以通过定点重组系统选择性地把不需要的或者辅助性的DNA序列从重组细菌中除去,如在美国专利5,441,884中所描述的(该专利特定地作为参照结合于本发明中).2.4cry3DNA片段一种编码一种在其肽中的一个或多个区域含有一个或多个突变的晶体蛋白的苏云金芽胞杆菌cry3+基因构成了本发明的一个重要的方面。优选的是那些编码一个氨基酸序列的cry3+基因,其中上述的氨基酸序列中的一个或多个氨基酸已经被根据本发明中所述的方法进行了改变,特别是那些以改变晶体蛋白的杀虫活性或特异性未目的的变化。根据本发明,核苷酸序列包括但不局限于DNA,包括但不局限于cDNA和基因组DNA、基因;RNA,包括但不局限于mRNA和tRNA;反义序列、核普酸、以及如下所述的合适的核苷酸序列序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107,以及包括能够表达本发明的经过修饰的苏云金芽胞杆菌毒素的变更、删除、突变、以及同源物的核苷酸序列中的改变。因此,本发明同时还涉及DNA片段,它们独立于总的基因组DNA并编码如本发明中所述的新颖的通过合成的方法进行修饰的晶体蛋白。编码这些蛋白种类的DNA片段可能能够编码与晶体蛋白相关的或无关的基因产品的蛋白、多肽、亚基、功能性结构域,等等.另外,可能能够使用本工艺熟练人士所公知的方法完全地在体外合成这些DNA片段.如此处所述,术语"DNA片段"指的是已经被从特定物种的总基因组DNA中分离出来的DNA分子.因此,一个编码一种晶体蛋白或肽的DNA片段指的是一个DNA片段,它含有晶体蛋白编码序列而且已经被从该DNA片段所取自的物种的总基因组DNA中分离或纯化出来,在实施例中,上述的总基因组DNA指的是一种格兰氏阳性细菌种属,即杆菌,具体的是被称为苏云金芽胞杆菌的杆菌种属,的基因组.术语"DNA片段"所包括的有DNA片段以及这类DNA片段的更小的片段;以及重组栽体,包括例如质粒、粘粒、噬菌粒、噬菌体、病毒、等等.类似地,一个含有经过分离或提纯的编码晶体蛋白的基因的DNA片段指的是一个DNA片段,它除了含有编码肽的序列以外,还含有特定的其它一些的元件,如调控序列,这些序列是从其它的天然的基因或编码蛋白的序列中分离出来的.考虑到这种情况,简单地用术语"基因"来指代一个编码功能性蛋白、多肽或肽的单位。如行内人士所可以理解的,这一功能性的术语同时包括基因组序列、启动子序列以及更小的通过基因工程制备的基因片段,它们可以表达或者适合于表达蛋白、多肽或肽。"从其它的编码序列中分离出来"指的是所感兴趣的基因(在本发明中指的是编码细菌晶体蛋白的基因)构成了该DNA片段编码区域的主要部分,而且该DNA片段不含有很大部分的天然的编码DNA,如大的染色体片段或其它的功能性基因或搡纵子编码区域。当然,这一术语指的是开始时所提取的DNA片段,并不排除随后人工地加入到该片段中的基因、重组基因、合成连接物、或者编码区域。特别优选的DNA序列是那些编码以下晶体蛋白的序列Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry犯b.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb*11036,Cry3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb,11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095以及Cry3Bb.11098.特别是如以下的3Bb*基因:cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,cry3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb,11241,cry3Bb.11242,cry3Bb.11032,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb.11051,cry3Bb.11057,cry3Bb,11058,cry3Bb.11081,cry3Bb.11082,cry3Bb,11083,cry3Bb.11084,cry3Bb.11095以及cry3Bb.11098。在特別的实施例中,本发明涉及分离的DNA片段以及整合了编码Cry肽种类的重组栽体,上迷的肽种类在其氨基酸序列中包含有如以下序列编号中所述的氨基酸序列序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108。术语"一个基本如在以下序列编号中所述的序列序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108"指的是这一序列对应于以下序列的一部分序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号.12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108,而且与这些序列的氨基酸差异相对较少,或者是这些序列的氨基酸的功能性等同物,术语"生物学功能等同物"在本工艺中是众所周知的,而且在本发明中有更进一步的定义(例如,见实施例)。相应地,与以下氨基酸序列序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102或序列编号108,或这些序列的功能性等同物有大约70%至大约75%、或大约75%至大约80%、或更优选地大约81%至大约90%、或甚至更优选性的;列或功能等同^即;"基i如:下序一列中所提供的;列;列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108。"同时还应该理解的是氨基酸和核苷酸序列可以包括另加的残基,如另加的N-端或C-端的氨基酸或5,端或3,端的序列,但同时还是与如本发明中所述的其中一个序列基本相同,只要该序列符合上述的标准,包括在涉及蛋白表达时蛋白生物学活性的保持.特别地核苷酸序列的末端序列的添加可以适用于,例如,包括编码区5,端和3,端的側翼的多种非编码序列或包括各种不同的内部序列,即内含子,已知其存在于基因内部。本发明的核苷酸片段,不管其编码序列本身的长度如何,可以与其它的DM序列,如启动子、多聚腺苷酰化作用信号、另加的限制性酶切位点、多重克隆位点、其它的编码片段,等等相结合,以使其整体长度可以有很大的差别.因此设想可以使用几乎任意长度的核苷酸片段,其总长度优选地被限制以便利制备和所需要的重组DNA协议的搡作,例如,可以制备一个包括一个编码以下所述的肽序列的短的连续序列的核苷酸片段序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108,或者制备一个与编码以下序列中所公开的肽的DNA序列同一或是互补的核苷酸片段序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108,特别是那些在以下序列编号中所公开的DNA片段序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107.本发明特别优选的核苷酸序列含有一个或多个本发明的cry基因,或者含有一个或多个本发明的cry基因的一部分.在特定的应用中,相对教小的连续的核普酸序列是优选的,例如那些长度为大约14或15或16或17或18或19或20或30-50、51-80、81-100等等个核苷的核芬酸序列,可选地,在某些实施例中,特別是在涉及重组栽体制备的实施例中,对宿主细胞进行转化、制备转基因植物细胞、制备更长的核苷酸片段是优选的,特别是那些包括一个或多个cry基因的全部编码区域的核苷酸片段.因此,优选的片段包括那些长度为大约20,OOO左右个碱基对的片段,可选地,包括较短的大约为19,000,大约为18,000,大约为17,000,大约为16,000,大约为15,000,大约为14,000,大约为13,000,大约为12,000,大约为ll,OOO,大约为10,000,大约为9,000,大约为8,000,大约为7,000,大约为6,000,大约为5,000,大约为4,500,大约为4,000,大约为3,500,大约为3,000,大约为2,500,大约为2,000,大约为1,500,大约为l,OOO,大约为500,或大约为200左右个碱基对的片段。当然,这些数目并没有覆盖所有可能的介于20,000至15个核苷的中等长度的片段,所有这些中等长度的片段也被认为是有用的,同时也归属于本发明的范围之中,很容易理解"中等长度"指的是介于所述范围的任何长度,如14,15,16,17,18,19,20,等;21,22,23,24,25,26,27,28,29,等;30,31,32,33,34,35,36.....等;40,41,42,43,44等,50,51,52,53等;60,61,62,63____等,70,80,90,100,110,120,130等;200,210,220,230,240,250等,包括介于14-10,OOO之间的任何一个整数,包括那些介于200-500;500-l,OOO;1,000-2,000;2,000-3,000;3,000-5,OOO之间等的整数。在一个优选实施例中,核苷酸片段包括一个介于1800至18,OOO个碱基对之间的序列,并包括一个或多个如本发明中所述的编码经过修饰的Cry3Bb+多肽的基因,其中所述的多肽对抗鞘翅类害虫的活性增强了.同时应该理解的是,本发明并不局限于编码本发明中所述的肽的、或者编码以下氨基酸序列的特定的核苷酸序列序列编号2,序刮编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108,包括在以下序列编号中特別公开的DNA序列序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号:23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107。因此,重组栽体和经过分离的DNA片段可以以不同的方式包含有编码肽的区域本身、在基本编码区域含有选定的变更或修饰的编码区域,或者它们可以编码更大的多肽,但是这些多肽仍含有这些编码肽的区域;或者编码生物学功能等同的蛋白或肽,这些肽可以含有不同的氨基酸序列.本发明的DNA片段包括具有生物学功能的等同的肽,这种序列可以是密码子冗余度以及功能等同性的结果,已经知道这两种情况在核苷酸序列和由其编码的蛋白中是天然存在的.可选地,功能等同蛋白或肽可以通过应用重组DNA技术来产生,其中可以用基因工程根据所要交换的氨基酸的性质对蛋白进行改变。可以用定点突变技术来引入由人设计的变化,例如,引入蛋白抗原性的改善或者对突变体进行试验以检验其分子水平的活性。如果需要也可以制备融合体蛋白和肽,例如,把编码肽的区域与其它的具有所要功能的蛋白或肽连接在同一表达单位中,以用于纯化或免疫筌定目的(例如,蛋白可以分别通过亲和层析和酶标编码区域进行纯化)。重组载体构成本发明的另一个方面。特别有用的栽体被认为是那些栽体,其中DNA片段的编码部分,不管编码全长的蛋白或者是教小的肽,都被定位于启动子的控制之下。启动子可以是与编码本发明肽的基因天然地联合在一起的那种启动子,也可以通过分离位于编码片段或外显子上游的5,端的非编码序列来获得,例如,使用重组克隆技术以及/或者PCRT"技术并结合本发明种所述的组合物。2.5载体、宿主细胞以及蛋白表达在其它的实施例中,设想通过把编码DNA片段定位于接受重组或异源启动子的控制之下可以获得一些特定的长处。此处所用的重组的或异源的启动子指的是一种在其天然环境下并不于编码晶体蛋白或肽的DNA片段相关联的启动子。这类启动子可以包括正常与其它基因相关联的启动子,以及/或者从任何细菌、病毒、真核生物、或植物细胞中提取的启动子。自然地,使用一种可以有效地引导DNA片段在被选择用于表达的细胞类型、生物体、或者甚至动物中进行表达的启动子是很重要的.在蛋白表达时使用启动子和细胞类型联合对是精通分子生物学领域的人士所普遍知晓的,例如可以参照Sambrook等,1989,所使用的启动子可以是组成型的、或者是诱导型的,而且可以在合适的条件下被用于引导所引入的DNA片段的高水平表达,这在,例如重组蛋白或肽的大规模生产中是有利的,设想被用于高水平表达的合适的启动子系统包括但不局限于Pichia表达栽体系统(PharmaciaLKBBiotechnology),联系用于制备重组蛋白和肽的表达实施例,设想可以最频繁地使用较长的DNA片段,编码整条肽序列的DNA片段是最优选的。然而,应该理解的是,使用较短的DNA片段来引导晶体肽或肽核心区域的表达,例如用于产生抗晶体蛋白抗体,也同样归属于本发明的范围之内,编码以下长度的肽抗原的DNA片段被设想是特别有用的,这些长度包括大约8,9,10或11个左右氨基酸,达到并包括大约30,40或50个左右的氨基酸,或者更优选的,大约8至大约30个氨基酸,或者甚至更优选的,大约8至20个氨基酸。这些肽抗原决定簇可以是包含由以下连续的氨基酸序列的氨基酸序列序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,或序列编号108,2.6经过转化的宿主细胞以及转基罔植物在一个实施例中,本发明提供了一种转基因植物,它在其基因组中整合有一个编码选自以下集合中的连续氨基酸序列的转基因序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,序列编号102,以及序列编号108,本发明的另外一个方面是一种转基因植物,它在其基因组中整合了一个Cry3Bb+转基因,该转基因包含有一个选自以下集合的核苦酸序列序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号40,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,以及序列编号107,本发明同时还公开了这类转基因植物的子代及其种子,以及这类种子的子代,以及从这类转基因植物的第二代及以后各代的植物中长出的种子,并对其提出了权利要求.本发明还公开了天然的和通过遗传过程改造的宿主细胞并对其提出了权利要求,这些宿主细胞表达新颖的Cry3Bb丰基因,生产Cry3Bb+多肽。细菌宿主细胞的优逸实施例包括苏云金芽孢杆菌EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11338,EG11339,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,以及EG11098'本发明同时公开了用此类细胞来生产Cry3求晶体蛋白的方法.这类方法通常包括在可以有效地生产Cry3+晶体蛋白的条件下培养宿主细胞(如苏云金芽孢杆菌EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,或EG11095,或EG11098)并从上述细胞中获得Cry3+晶体蛋白.在另一方面,本发明提供了用于生产转基因植物的方法,上述的转基因植物表达一个编码本发明的新颖重组晶体蛋白的核苷酸片段.生产转基因植物的工序是在本工艺中众所周知的。总体上,该方法包括用一个或多个DNA片段来转化一个合适的宿主细胞,上述的DNA片段含有一个或多个启动子,这些启动子都以可操作的形式连接到一个编码一个或多个本发明中所公开的苏云金芽孢杆菌晶体蛋白的编码区域上.这类编码区域通常是以可操作的形式连接到一个转录终止区域,这样启动子就可以使该编码区域在细胞中进行转录,由此为细胞提供了在体内生产重组蛋白的能力.可选地,在需要控制、调节、或减少在特定的转基因细胞中所表达的特定的重组晶体蛋白的情形中,本发明也提供了晶体蛋白反义mRNA的表达方法。用反义mRNA作为一种用于控制或减少细胞中某种既定的感兴趣的蛋白的数量的手段是本工艺中众所周知的.本发明的另外一个方面包括一种转基因植物,它表达一个编码一个或多个本发明中所述的新颖的多肽组合物的基因或基因片段。此处所用的术语"转基因植物"指的是已经整合了DNA序列的植物,其中的DNA序列包括但不局限于正常情况下可能不存在的基周、正常情况下并不被转录为RNA或翻译为蛋白("表达")的DNA序列、或者任何希望被引入未经转化的植物中去的其它的基因或DNA序列,例如一些在正常情况下在未经转化的植物中并不存在的,但是又希望能够进行遗传工程改造或改变其表达的基因。设想在一些情形中,本发明的转基因植物的基因组已经通过稳定地导入一个或多个编码Cry3B—的转基因(天然的、通过合成进行修饰的、或者突变的)得到了扩充.在一些情形中,在转化的宿主植物细胞的基因组中已经整合了一个以上的转基因。例如在一种情形中,在此类植物的基因组中整合了一个以上的转基因。在一些特定的情形中,可能希望在转化的转基因植物中整合一个、两个、三个、四个、或者甚至更多的苏云金芽孢杆菌晶体蛋白(天然的或者是通过重組工程改造的)并使其稳定地表达.一个优选的导入基因包括,例如,一个来源于细菌的编码晶体蛋白的DNA序列,特别是此处所述的来源于芽孢杆菌种属的DNA序列中的一个或多个序列.极为优选的是那些来源于苏云金芽孢杆菌的核苷酸序列,或者是那些已经通过遗传工程改造的序列中的任何一种,其中这些序列被改造以便减少或增加在此类转化的宿主细胞中晶体蛋白的杀虫活性.用于转化植物细胞以及制备转基因细胞抹的方法在本工艺中是众所周知的,在本发明中也给予了描述。当然,用于转化此类细胞的栽体、质粒、粘粒、酵母人工染色体(YAC)以及DNA片段将包括操纵子、基因、或者本发明的来源于基因的序列(天然的、或者是通过合成方法获得的),特别是编码本发明中所公开的晶体蛋白的那一些序列。这些DNA构建物可以进而包括诸如启动子、增强子、多接头(polylinker)、或者甚至那些可以根据需要对感兴趣的特定的基因进行正或负调节的基因序列。DNA序列或基因可以编码一个天然的、或者经过修饰的晶体蛋白,上述蛋白将在所获得的重组细胞中得以表达,而且/或者将赋予再生的植物一个改良的表现型.这类转基因植物对于通过在这样一祙植物中整合一个编码对鞘翅类昆虫具毒性的Cry3Bb+晶体蛋白的转基因DNA片段来增加单子叶植物或双子叶植物的杀虫抗性可能是合乎需求的。特别优选的植物包括谷物,如玉米、小麦、黑麦、谷物、大麦、以及燕麦;豆类,如大豆;块茎,如土豆;纤维作物,如亚麻和棉花;草地和牧场草,观赏植物;灌木、树木、蔬菜、浆果、柑橘、水果、仙人掌、肉质植物,以及其它的具有商业重要性的作物,包括花园和家养植物.在一个相关的方面,本发明同时还包括了由这种转化植物所产生的种子,这类种子的子代,以及由原先的转基因植物的子代所产生的种子,它们都是根据上述的步骤产生的.这类子代或种子将在其基因组中整合由一个或多个晶体蛋白转基因,而且这类子代植物将以孟德尔遗传方式遗传由导入的稳定的转基因所提供的性状。所有的这类已经在其基因组中整合有转基因DNA片段(这些片段编码一个或多个的转基因植物Cry3Bb*晶体蛋白或多肽)的转基因植物构成了本发明的一些方面。用于本发明的特别优选的转基闳包括含有一个或多个Cry3Bb+基因的核普酸片段,2.7生物学功能等同物可以对本发明的肽以及编码它们的DNA片段的结构进行修饰和变化并仍然获得一个编码具有所需特征的蛋白或肽的功能性分子,以下讨论的基础是对一个蛋白的氨基酸进行改变以获得一个等同物,或者甚至获得一个改善的第二代的分子。在本发明特定的实施例中,突变的晶体蛋白被设想对于增加蛋白的杀虫活性是有用的,并由此增加了在植物细胞中的重组转基因的生产活性和/或表达.氨基酸的变化可以通过改变DNA序列的密码子(根据表4中所示的密码子)来实现。表4氨基酸密码丙氨酸AlaAGCAGCCGCGGCU半胱氨酸CysCUGC腳天冬氨酸AspDGACGAU谷氨酸GluEGAAGAG苯丙胺酸PheF匿,甘氨酸GlyGGGAGGCGGGGGU组氨酸HisHCACCAU异亮氨酸lieIAUAAUCAUU赖氨酸LysKAAAAAG亮氨酸Leu腿,CUAcue甲硫氨酸MetMAUG天冬氨酸AsnNAACAAU脯氨酸ProPCCACCCCCCecu谷氨酰胺GinQCAACAG精氨酸ArgRAGAAGGCGACGC丝氨酸SerSAGCAGUUCAUCC苏氨酸ThrTACAACCACGACU缬氨酸ValVGUAGUCGUGGUU色氨酸TrpWUGG酪氨酸TyrYUAC訓CUGCUUCGGCGUUCG腳例如,在一些结构,例如抗体的抗原结合区域或者底物分子的结合位点中,可以把这个蛋白结构中的特定的氨基酸替代为其它的氨基酸而并不明显地丧失相互作用的结合能力。由于一个蛋白的生物学活性是由其相互作用的能力以及蛋白的特性来定义的,所以可以对蛋白序列中的特定的氨基酸进行替换,而且,当然可以对与其相应的DNA编码序列进行替换,而且仍然获得一个具有类似特性的蛋白。因此,本发明者设想可以对本发明所公开的组合物,或与其相对应的编码上述肽的DNA序列进行各种不同的变化,而却并不明显地丧失它们的生物学效用和活性。在进行这类改变时,应该考虑氨基酸的亲水性指标.氨基酸的亲水性指标在赋予蛋白的相互作用功能中的重要性在本工艺中是普遍公知的(Kyte和Doolittle,1982,作为参照结合于本文中)。氨基酸的相对亲水性特征被公认对由此获得的蛋白的二级结构起作用,而二级结构则决定了蛋白与其它的分子,例如,酶、底物、受体、DNA、抗体、抗原、等等之间的相互作用。每一种氨基酸都被根据它的疏水性和带电特征分配了一个亲水性指标(Kyte和Doolittle,1982),分别为异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);笨丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(0.7):丝氨酸(-0.8);色氨酸(-0,9);酪氨酸(-1.3):脯氨酸(-1.6);组氨酸(3.2);谷氨酸(-3.5);谷氨酰胺(-3.5):天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9);以及精氨酸(-4.5)。在本工艺中公知的是可以把特定的氨基酸替换为具有相似的亲水性指标或得分的其它的氨基酸而且仍然可以获得一个具有相似生物学功能的蛋白,即,仍然获得了一个蛋白的生物学功能等同物,在进行此类变化时,对亲水性指标相差士2的氨基酸进行替换是优选的,相差士l的是特别优选的,相差土O.5的是更为优选的。同时在本工艺中也是公知的是可以根据亲水性来有效地对相似的氨基酸进行替换。美国专利4,554,101(特定地作为参照结合于本发明中)中的描述指出蛋白中的最大的局部平均亲水性,这种亲水性是由其周闺的氨基酸的亲水性所支配的,这与蛋白的生物学特性相关。如美国专利4,554,101中所详细描述的,对氨基酸已经指定了以下的亲水性值精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0土1):丝氨酸(+0.3):天冬酰胺(+0.2);谷氨酰胺(+0.2):苏氨酸(-0.4);脯氨酸(-0.5土l);丙氨酸(-0.5);组氨酸(O.5):半胱氨酸(-1.0):甲硫氨酸(-1.3):缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。应该理解的是可以把氨基酸替换为具有相似的亲水性值的其它的氨基酸而且仍然可以获得一个生物学等同物,以及特定地,获得一个免疫学等同物蛋白。在进行此类变化时,对亲水性值相差士2的氨基酸进行替换是优选的,相差土l的是特别优选的,相差土O.5的是更为优选的。如上面所概述的,因此氨基酸替换通常是以氨基酸側链的取代基团的相对相似性,例如,它们的疏水性、亲水性、带电特性、尺寸等等为基础的,以上述的各种不同的特征为根据而进行的示范性的替换是行内人士所公知的精氨酸和赖氨酸;谷氨酸和天冬氨酸;丝氨酸和苏氨酸;谷氨耽胺和天冬酰胺;以及缬氨酸、亮氨酸和异亮氨酸。3.0附图的简要描述附图构成了本发明说明书的一部分并被包括进来以进一步示范本发明的特定的一些方面.通过参照一个或多个附图并结合此处所述的具体实施例的详细描述可以更好地理解本发明,图1Cry3Bb单体结构的示意图,图2Cry3Bb单体结构的立体图,结合有水分子(以点表示)。图3ACry3Bb的结构域l的示意图.图3B组成结构域1的7个螺旋的位置示意图。图4Cry3Bb的结构域l被组织成7个如图3A(示意图)和图3B(简图)中所示的a螺旋。示出了a螺旋和氨基酸。图5ACry3Bb结构域2的示意固。图5B图示了组成结构域2的3个p片的ll个p链。图6Cry3Bb的结构域2是3个如图5所示的反平行l3片的集合.定义了这些j3片的氨基酸列于下面(a8,氨基酸322-328,同时也包括于结构域2中),图7ACry3Bb结构域3的示意图.图7B组成结构域3的P链的位置简固。图8结构域3(图7)是一个组织松散的p链和环区的集合;不存在P片.P链含有以下所列的氨基酸图9ACry3Bb二体结构的側面观。在分子的中部可以看到结构域l的螺旋束.图9BCry3Bb二体结构的顶视图。在分子的中部可以看到结构域1的螺旋束。图10由Cry3A和Cry3Bb在平面脂双层中形成的通道随着时间其导率生长的图示图。Cry3A形成的通道的导率比Cry3Bb所形成的通道的导率要快出许多。图11pEG1701图谱,它含有Cry3Bb基因和crylF终止子,图12在1B2,3区域有所改变的Cry3B蛋白对抗SCRW幼虫的重复l-剂量鉴定法的结果。图13在1B6,7区域有所改变的Cry3B蛋白对抗SCRW幼虫的重复l-剂量筌定法的结果.图14在IBIO,11区域有所改变的Cry3B蛋白对抗SCRW幼虫的重复l-剂量鉴定法的结果.图15由Cry3Bb.11230和野生型Cry3Bb在脂双层中形成的通道的单通道记录。由Cry3Bb.11230形成的通道具有界限分明的开启和关闭状态,而由Cry3Bb所形成的则很少.图16由Cry3Bb和Cry3Bb,60(Cry3Bb的一种截短的形式)所形成的通道的单通道记录.Cry3Bb.60形成通道的速度比Cry3Bb更快,而且不同于Cry3Bb的是,它所产生的通道具有界限分明的开启和关闭状态.图17ACry3A、Cry3B、和Cry3C氨基酸序列的序列对齐。图17B示出了图17A中所示的Cry3A、Cry3B、和Cry3C的氨基酸序列的对齐的继续。图17C示出了图17A中所示的Cry3A、Cry3B、和Cry3C的氨基酸序列的对齐的继续。4.0示范性实施例的描述本发明定义了新颖的苏云金芽孢杆菌(Bt)杀虫S-内毒素蛋白以及被用于设计这些新颖蛋白的生物化学和生物物理学策略.S-内毒素是一类由苏云金芽孢杆菌生产的杀虫蛋白,它们在平面脂双层上形成阳离子选择性的通道(English和Slatin,1992)。新的5-内毒素是以对鞘翅类具有活性的5-内毒素Cry3Bb的母体结构为基础的.与具有鞘翅类活性的5-内毒素种类的其它成员(包括Cry3A和Cry3B)相似,Cry3Bb显示了出色的对抗可罗拉多薯虫(Leptinotarsade-cemlineata)的杀虫活性.然而,不同于Cry3A和Cry3B的是,Cry3Bb对南部玉米食根虫或SCRW(DiabrolicaundecimpunctatahowardiBarber)西部玉米食根虫或WCRW(DiabroticavirgiferavirgiferaLeConte)同样具有活性。此处所描述的新颖的杀虫蛋白是被特定地设计用于改善其母体Cry3Bb的生物学活性的。另外,设计策略本身就是新颖的发明,它们可以被应用于一般的苏云金芽孢杆菌s-内毒素并对其进行改善,苏云金芽孢杆菌S-内毒素同时也是一个形成离子通道的更大的细菌毒素种类中的成员(见English和Slatin,1992年的综述)。因此,本发明者相信这些设计策略同样可以被用于任何具有生物学活性的形成通道的蛋白以对其生物学特性进行改善,经过设计的Cry3Bb蛋白可以用以下的策略中的一个或多个进行工程构造(l)鉴定并改变对蛋白酶敏感的位点,并进行蛋白水解;(2)对结合水进行分析和操作;(3)对运动区周闺的氢键进行操作;(4)分析具有柔性的螺旋周围的环区并对其重新进行设计;(5)p链(Strand)以及p片周围的环区的设计;(6)鉴定复合的静电表面并对其进行设计;(7)金属结合位点的鉴定和去除;(8)四级结构的改变;(9)结构性残基的鉴定和设计;以及(10)由策略l-9所定义的任何位点以及所有位点的结合.这些策略使得可以对Cry3Bb的特定的位点进行鉴定和重新设计并最终创造出杀虫活性改善的新蛋白。这些新蛋白被标识为经过设计的Cry3Bb蛋白并被命名为Cry3Bb加一个句点再加上一个后缀(例如Cry3Bb.60、Cry3Bb.11231).表2列出了新的蛋白以及分子上被修饰的特定的位点、氨基酸在这些位点的序列改变(这种改变改善了它的生物学活性)、经过改善的杀虫活性、以及被用于鉴定特定位点的设计方法.4.1本发明的一些优点对cry基因所进行的突变研究无能鉴定出显著数量的具有改善的广谱的杀虫活性(即对一个范闺的害虫的毒性改善了)的突变的晶体蛋白。由于农作物在任何时间都典型地受到不止一种的害虫的侵袭,所以合乎需求的突变晶体蛋白优选地是那些对多种害虫的毒性都得到改善的突变的晶体蛋白。先前未能鉴定出这类突变体可能是因为所选定的用以突变的位点不合适,例如,对于相关的蛋白CrylC,结构域2和结构域3中的位点是以前突变所努力的主要目标,这主要是因为这些结构域被认为在受体结合和杀虫活性的确定上具有重要的作用(Aronson等,1995;Chen等1993:deMaagd等.1996,Lee等,1992:Lee等,1995,Lu等,1994;Smedley和Ellar,1996;Smith和Ellar,1994:Rajamohan等,1995;Rajamohan等,1996)。不同的是,本发明者推论认为Cry3蛋白的毒性,特定地Cry3Bb蛋白的毒性,可以通过把定参与离子通道功能的区域,而不是分子中直接参与受体相互作用的区域(即结构域2和3)来改善,这种改善针对广泛范围的目标害虫。据此,本发明选择了Cry3Bb的结构域l中的貝标区域进行突变以便分离具有改善的广谱毒性的Cry3Bb突变体。实际上,在本发明中描述了对几种鞘翅类害虫都具有改善的毒性的Cry3Bb突变体.结构域l中的至少一个(可能是多个)a螺旋参与了离子通道和孔在昆虫中肠上皮的形成(Gazit和Shai,1993,Gazit和Shai,1995).不同于他人对准编码结构域l的a螺旋的序列进行突变的做法(Wu和Aronson,1992;Aronson等,1995,Chen等,1995),本发明者选择了专有地对准编码毗邻或者预测的位于Cry3Bb的环区(这些环区分隔了a螺旋)中的氨基酸残基的序列.位于这些环区中的氨基酸或者加盖于(cap)a螺旋末端并毗邻这些环区的氨基酸残基可能会影响这些a螺旋之间的空间相互关系。因此,这些氨基酸残基的替换可能会导致三级结构、甚至是四级结构的微妙的变化,这些变化可能正面地影响离子通道的功能,位于结构域l环区的氨基酸残基暴露于溶剂中并因此可以与各种不同的分子进行相互作用。通过消除或封闭对蛋白酶敏感的位点来改变这些氨基酸可能会使蛋白更为稳定,改变结构域l的表面电荷的氨基酸替换可以改变离子通道的效率或者改变其与刷状缘膜或者毒素分子的其它部分之间的相互作用,从而使结合或插入更为有效,根据本发明,对编码的Cry3Bb核苷酸残基进行碱基替换以便改变相应的多肽,特别是,在a螺旋之间的那些环区的特定的密码子.晶体蛋白的杀虫活性最终体现出用以有效控制昆虫所需的水平。应该尽可能地增强一种杀虫蛋白的效力以使其在田间具有经济和效率效能。可以期望在生物杀虫剂配方中的杀虫蛋白的效力的提高可以改善生物杀虫产品的田间性能.可选地,在生物杀虫剂配方中的杀虫蛋白的效力的提高可以促进在单位面积的接受处理的作物上使用较少数量的生物杀虫剂,从而使生物杀虫产品的使用更为经济。当杀虫活性提高的晶体蛋白在植物中表达时,它的生产可以被指望能够提高植物对容易侵袭的害虫的抗性.4.2培养苏云金芽孢杆菌以生产晶体蛋白的方法此处所述的苏云金芽孢杆菌菌抹可以用标准的已知的介质和发酵技术进行培养,在发酵周期结束之后,首先用本工艺中公知的方法从发酵液中分离出苏云金芽孢杆菌孢子和晶体,这样就获得细菌。可以通过加入表面活性剂、分散剂、惰性载体、以及其它的成分把回收的苏云金芽孢杆菌孢子和晶体配置成可湿性粉末、浓缩液、徵粒、或者其它的制剂,这样就方便了处理和应用于特定的目标害虫.配制和应用步骤都是本工艺中公知的,4.3用于表达cry+基因的重组宿主细胞本发明的核苷酸序列可以被导入范围广泛的各种不同的微生物宿主中。毒素基因的表达直接或间接地导致胞内生产和杀虫剂的保持。在合适的宿主,例如在假单胞菌属中,细菌可以被应用于鞘翅类昆虫的位置,在该位置,微生物将增殖并被昆虫所摄取。这样就可以对不需要的昆虫进行控制。可选地,可以在能够延长在细胞中生产的毒素的活性的条件下对拥有毒素基因的宿主微生物进行处理。然后可以把经过如此处理的细胞施用于目标害虫的环境中。如此获得的产品保留了苏云金芽孢杆菌毒素的毒性。合适的宿主细胞,其中含有杀虫剂的细胞可以被处理以延长毒素在经过如此处理的细胞被施用于目标害虫的环境中时在细胞中的活性,可以包括真核或者原核细胞,通常局限于不产生对高等生物体(如哺乳动物)具有毒性的物质的那些细胞,然而,也可以使用那些产生对高等生物体具有毒性的物质的生物体,其中这种毒素是不稳定的,或者其应用的水平足够的低,不足对哺乳动物产生任何毒性。特别感兴趣的宿主是原核生物和低等的真核生物,如真菌.示例性的原核生物(包括格兰氏阴性和格兰氏阳性)包括肠杆菌科,如埃希氏菌属、欧文菌属、志贺菌属、沙门菌属、以及变性菌属;芽孢杆菌科;根瘤菌科,如根瘤菌;螺菌科,如发光菌、Zymomonas、沙雷菌属、气单胞菌属、弧菌属、去磺弧菌属、螺菌属;乳酸菌;极毛杆菌科,如假单胞菌属和醋酸杆菌属;固氮菌属;放线菌属;以及瑪化菌属。真核宿主有真菌,如藻菌纲和子嚢菌,包括酵母菌,如酵母属和人体酵母菌;以及担子菌酵母,如红酵母菌、短梗霉菌、掷孢酵母属,等等.在筛选一个用于生产目的的宿主细胞时特别感兴趣的宿主的特征包括易于把苏云金芽孢杆菌导入到宿主中;有可用的表达系统;表达的效率;杀虫剂在宿主中的稳定性;以及存在辅助的遗传能力。用作杀虫剂微胶嚢的感兴趣的特征包括杀虫剂的保护性特质,例如具有厚的细胞壁、色素形成、以及在细胞内包装积或形成包含体;叶子亲和性;对哺乳动物不具有毒性;能够诱惑害虫摄食;容易杀灭和罔定,同时又不损害毒性,等等。其它的考虑包括易于配制和处理、经济效益、保藏的稳定性,等等。特别感兴趣的宿主生物体包括,例如红酵母菌属种类、短梗霉菌种类、酵母属种类、以及掷孢酵母属种类;植形(phylloplane)生物体,例如假单胞菌属种类、欧文菌属种类、以及产黄菌属种类;或者其它的生物体,如埃希氏杆菌、乳杆菌种类、杆菌种类、链霉菌种类、等等。特定的生物体包括Pseudo固asaeruginosa,、荧光假单孢菌(Pseudomonasfluorescens)、哞酒酵母(Saccharomycescerevisiae)、苏云金芽孢杆菌(B.Thuringiensis)、大肠軒菌(Escherichiacoli)、枯草芽孢杆菌(B.subtilis)、B.Megaterium、B.Cereus、浅青紫链霉菌(Streptomyceslividans)、等等.可以用化学的或物理的方法,或者结合化学和/或物理方法对微生物细胞,例如含有苏云金芽孢杆菌毒素基因的微生物进行处理,只要这种技术对毒素的特质不产生有害的影响,也不消除细胞对这一毒素的保护能力.化学剂的离子有卣化剂,特别是原子系数为17-80的卣化剂。更特定地,可以在温和的条件下使用碘,让其作用足够长的时间以获得预期的结果.其它合适的技术包括用醛类,例如甲醛和戊二醛;抗感染剂,如氯化节烷铵以及氯化十六烷吡啶盐;醇类,如异丙醇和乙醇;各种不同的组织固定剂,如Lugol氏碘、Bouin氏固定剂、Helly氏固定剂(见,例如Humason,1967);或者是结合使用在细胞被施用到宿主动物中时能够保存并延长在细胞中所生产的毒素的活性的物理学方法(热)和化学试剂.物理学方法的例子有短波长辐射,例如Y射线辐射以及X射线-辐射、冷冻、紫外线辐射、冻干法、等等.被处理的细胞通常可以保持完整并且在处理的过程中基本上处于增殖形态,而不是处于孢子形态,虽然在一些情形中也可以采用抱子形态。当用一个合适的载体把苏云金芽孢杆菌毒素基因导入一个微生物宿主中,而且上述的宿主是以活的形态被施用于环境中时,施用特定的宿主微生物是关键的。选择那些已知能够占领一种或多种感兴趣的作物的"植物團"(叶面(phylloplane)叶隙(phyllosphere),根际(rhizosphere),以及/或者根面(rhizoplane))的微生物宿主.对这些微生物进行筛选以便使其能够在特定的环境(作物和其它昆虫的栖息地)中与野生型的微生物进行竟争,能够为那些表达多肽杀虫剂的基因提供稳定的保持和表达,以及,可望地,为环境对杀虫剂的降解和灭活提供改善的保护.已知有数量众多的微生物可以栖息在诸多重要作物的叶面(叶子的表面)以及/或者在根围(植物根周闺的土壤)上。这些微生物包括细菌、藻类已经真菌.特别感兴趣的是微生物,例如细菌,如杆菌属(包括苏云金芽孢杆菌种属和亚种B.thuringiensiskurstakiHD-l,B.thuringiensiskurstakiHD-73,B.thuringiensissotto,B.thuringiensisberliner,B.thuringiensis'thuringiensis,B.thuringiensisfolworthi,B.thuringiensisdendrolimus,B.thuringiensisalesti,B.thuringiensisgalleriae,B.thuringiensisaizawai,B.thuringiensissubtoxicus,B.thuringiensisentomocidus,B.thuringiensistenebrionis以及B.thuringiensissandiego):假单胞菌属、欧文菌属、沙雷菌属、克雷泊氏菌属、Zanthomonas、链霉菌属、根瘤菌、红假单胞菌属、Methylophilius、农杆菌、醋酸杆菌属、乳杆菌属、节杆菌属、Azorobacter、明串珠菌属、以及产碱菌属;真菌,特别是酵母,例如Saccharomyces、隐球菌属、克鲁维酵母属、掷孢酵母属、红酵母属、以及短梗霉属.特别感兴趣的是如下的植物圈细菌种类Pseudomonassyringae,Pseudomonasfluorescens,Serratiamarcescens,Acetobacterxylinum,Agrobacteriumlumefaciens,Rhodobactersphaeroides,Xanthomonascampestris,Rhizobiummelioli,Alcaligeneseutrophus,和Azotobactervinlandii;以及植物團酵母种类,如Rhodotorularubra,R.glutinis,R.marina,R.aurantiaca,Cryptococciisalbidus,C.diffluens,C.lazirentii,Saccharontvcesrosei,S.preloriensis,S.Cerevisicie,Sporobolomycesroseus,S.Odorus,Kluyveromycesveronae,以及Aureobasidiunipollulans。4.4定义根据本发明,核苷酸序列包括但不局限于DNA(包括但不局限于基因组或非基因组DNA)、基因、RNA(包括但不局限于mRNA和tRNA)、核芬、以及来源于天然来源的、化学合成的、经过修饰的、或者以其它的方法人工制备的合适的核普酸片段。以下词语和短语的意义如下定义。一个/一种根据长效的专利法协定,当词语"一个"和"一种"用于申请(包括权利要求)中时,指的是"一个(种)或多个(种)".广谱指的是范围广泛的昆虫种类.广谱活性针对广泛范围的昆虫的毒性。表达多个胞内过程的组合,包括一个编码的DNA分子,如一个结构基因,为了生产多肽所进行的转录和翻译。杀虫活性对昆虫的毒性,杀虫特异性由晶体蛋白或蛋白、微生物或植物所表现出来的对多种昆虫种类的毒性。目内(Intraorder)特异性一种特定的晶体蛋白对一个目范围内的昆虫(例如鞘翅目)的毒性.目间(Interorder)特异性一种特定的晶体蛋白对不同目的昆虫(例如鞘翅目和双翅目)的毒性.LC5。导致被处理的昆虫的50%致死的晶体蛋白的致死浓度。LC95:导致被处理的昆虫的95%致死的晶体蛋白的致死浓度.启动子在DNA序列或一组DNA序列种的一个识别位置,它为一个结构基因提供了一个表达控制元件,而且RNA聚合酶特定地结合于其上并启动该基因的RNA合成(转录).再生从一个植物细胞(例如一个植物原生质体或外植体)生长一抹植物的过程。结构基因一个被表达以生产多肽的基因。转化把一个外源DNA序列(例如一个栽体、一个重组DNA分子)导入一个细胞或原生质体中的过程,其中外源基因被整合到染色体中或者能够自主复制.转化细胞一个其DNA已经通过在该细胞中导入一个外源DNA分子而被改变的细胞。转基因细胞任何来源于或者再生于转化细胞或来源于转基因细胞的细胞.转基因细胞的例子包括来源于转化植物细胞以及特定的细胞,如叶子、根、茎细胞的植物愈伤组织,例如体细胞,或者是来源于转基因植物的生殖细胞,转基因植物来源于转化植物细胞或原生质体的植物或其子代,其中的植物DNA含有一个被导入的外源DNA分子,这一分子并不存在于天然的非转基因的同种抹系的植物中。术语"转基因植物"以及"转化植物"有时候在本工艺中被用于同义地定义一种其DNA中含有一个外源DNA分子的植物.然而,应该认为更科学的是应该用"转基因植物"来指代一种来源于转化植物细胞或原生质体的再生的植物或愈伤組织.本文将遵从这种用法。载体一个能够在宿主细胞复制,而且/或者另一个DNA片段可以以可操作的形式与其相连以使附加的片段得以表达的DNA分子.质粒就是栽体的一个例子.此处所用的标识"CryIII"以及"Cry3"是同义的,,同样"CrylIIB2"和"Cry3Bb"也是同义的.类似地,本发明者已经用一般的术语"Cry3Bb*"来标识任何以及所有的Cry3Bb变体,这些变体在蛋白中含有被修饰的氨基酸序列.类似地,Cry3Bb+被用于标识任何以及所有的编码Cry3Bb+蛋白的核苷酸片段和/或基因,等等.4.5cry3Bb+多聚核香酸的制备一旦已经使用本发明所公开的设计策略对所要突变的肽的结构进行了分析,合乎需求的是在蛋白中,或者可选地,在编码该蛋白的DNA序列中导入一个或多个突变以便生产一个生物杀虫特质改变的突变蛋白。为此,本发明同时包含了以本发明中所述的方式对一个编码一个晶体蛋白的核苷酸片段进行定点突变和随机突变的方法.具体地,,本发明公开了用此处所述的一种或多种设计策略对编码该氨基酸序列的核苷酸片段进行突变的方法.然后可以使用此处所描述的鉴定方法来鉴定由这些步骤所获得的突变体哪一个具有改善的杀虫特质或者改变的特异性,包括目内和目间的,用于对一个编码一个晶体蛋白的DNA片段进行突变的方法是行内人士所公知的。可以用随机的或者定点的突变步骤来进行修饰.可以通过在该序列上添加或删除一个或多个核苷来改变其结构,从而对该核苷酸进行修饰。可以根据本工艺中已知的任何一项技术进行突变,例如,但不局限于合成一个在一个特定的晶体蛋白中含有一个或多个突变的低聚核苷酸。一个"合适的宿主"可以是任何表达Cry3Bb的宿主,例如,但不局限于苏云金芽孢杆菌和大肠杆菌.对杀虫活性,在Cry3Bb的情形中包括但不局限于对鞘翅类的毒性,的筛选可以用本工艺中公知的技术来进行,具体地,定点突变,通过对作为基础的DNA进行特定的突变,是一个在个体肽、或者蛋白或肽的生物学功能等同物的制备中有用的技术.进而可以用这一技术来制备和试验序列变体,例如,结合上述的一个或多个考虑,通过在该DNA上导入一个或多个核苷序列来实现.定点突变使得可以通过使用编码所需突变的特定的低聚核苷酸序列以及足够数目的毗邻的核苷来产生一个引物序列,这个引物序列所具有的尺寸和序列复杂度足以在删除接合的两端形成一个稳定的双链。典型地,优选的引物的长度是大约17至大约75个核苷,或更长,变。大体上,定点突变技术是本工艺中众所周知的,它们在各种不同的出版物中已经被例举了。应该理解的是,该技术典型地采用一种可以以单链和双链两种形式存在的噬菌体栽体.在定点突变中有用的典型的栽体包括如M13噬菌体之类的载体.这些栽体是商品化的,它们的使用方法通常是行内人士所公知的。双链质粒也是在定点突变中所常规使用的,它省略了把目标基因从质粒转移到噬菌体这一过程.大体上,根据本发明的定点突变是这样来实施的首先获得一个单链栽体或者双链栽体熔化开的两条链,上述的栽体在其序列中包含有一个编码目标肽的DNA序列。制备一个含有所需突变序列的低聚核苷酸引物,通常用合成的方法来制备。然后把引物和单链栽体一起退火,然后用DNA聚合酶,如大肠杆菌聚合酶I的Klenow片段,进行处理以便合成含有突变的链。这样就形成一个异源双链,其中一条链编码初始的未经突变的序列,另一条链含有所需的突变.然后用这种异源双链栽体对合适的细胞,例如大肠杆菌细胞,进行转化或转染。把含有具有突变序列的重组栽体的克隆筛选出来。Kunkel等(1987)设计了一个遗传选择方案,用于富集结合有突变低聚核普酸的克隆。可逸地,可以结合使用PCRT"和商业化的热稳定的酶,如Taq聚合酶来把突变的低聚核苷酸引物整合到一个经过扩增的DNA片段中,然后再克隆到一个合适的克隆或表达栽体中去.Tomic等(1990)和Upender等(1995)的PCRT"介导的突变步骤就是这类协议的两个例子.也可以使用一个采用温度稳定的连接酶和温度稳定的聚合酶的PCRT"来把一个磷酸化的突变低聚核苷酸整合到一个经过扩增的DNA片段中,然后再克隆到合适的克隆或表达栽体中,由Michael(1994)所描述的突变步骤提供了一个此类协议的例子.本发明提供了通过定点突变来制备所选定的编码肽的DNA片段的序列变体的方法,用于生产潜在有用的种类,但这并不具有局限性,因为还有许多种途径可以被用来获得肽的序列变体以及编码它们的DNA序列,例如,可以用诱变剂,例如羟胺,对编码所需肽序列的重组栽体进行处理以获得序列变体。此处所用的术语"低聚核苷酸指导的突变步骤"指的是依赖于模板的过程以及由栽体介导的增殖,例如扩增,这导致一种特定的核苷酸分子浓度提高(相对于初始浓度而言),或者使一个可检测信号的浓度提高.此处所用的术语"低聚核苷酸指导的突变步骤"指的是一个涉及一个引物分子依赖于模板进行延伸的过程,术语"依赖于模板的过程"指的是一个RNA或一个DNA分子的核脊酸合成,其中新合成的核酸链的序列是由著名的碱基互补配对原则所指挥的(参照,例如,Watson,1987).典型地,栽体介导的方法学涉及在核苷酸片段中导入一个DNA或RNA载体、栽体的克隆性扩增、以及经过扩增的核酸片段的回收.这类方法学的例子见于美国专利4,237,224,该专利的全部内容作为参照结合于本发明中。现有一些依赖于模板的步骤可以被用于对存在于样品中的感兴趣的目标序列进行扩增。最著名的扩增方法之一是聚合酶链式反应(PCRTM),描述于美国专利4,683,195、4,683,202、以及4,800,159中(上迷的每一专利的全部内容都作为参照特定地结合于本发明中).简要地说,在pcrt"中,应制备两条引物,它们与目标序列的相对的互补链上的区域是互补的。在一个反应混合物中加入过量的脱氧核糖核苷三磷酸以及DNA聚合酶(例如Taq聚合酶)。如果在样品中存在目标序列,引物将和目标结合,聚合酶将通过添加核苷来使引物沿着目标序列延伸。通过提高和降低反应混合物的温度可以使经过延伸的引物与目标解离,形成反应产物,过量的引物将结合到目标以及反应的产物之上,重复进行扩增过程。优选地,可以采用一种逆转录酶PCir扩增步骤以便对经过扩增的mRNA进行定量。聚合酶链式反应是本工艺中众所周知的。另外一种扩增方法是连接酶链式反应(称为LCR),描迷于欧洲专利申请出版No.320,308,该专利的全部内容都作为参照特定地结合于本发明中。在LCR中,制备两个互补探针对,而且当有目标序列存在时,每一对探针将结合到相对的靶互补链之上由此它们毗邻。在有连接酶存在的情况下,两个探针对将连接形成一个单一的单位。通过类似于PCIT的温度循环,结合的经过连接的单位从目标上解离下来,然后充当过量的探针对连接的"目标序列",美国专利4,883,750,该专利的全部内容都作为参照特定地结合于本发明中,描述了一种类似于LCR的替代的扩增方法,用于使探针对结合到目标序列上,在国际专利申请出版No.PC17US87/00880中所描述的QbetaR印licaseT"也可以被用为本发明的另一种扩增方法,该发明的全部内容都作为参照结合于本发明中。在这种方法中,在有rna聚合酶存在的情况下把一个可复制的并且含有与目标互补的区域的rna序列加入到样品中.这样聚合酶就可以复制上述的可复制的序列.一种等温扩增方法,其中限制性核酸内切酶以及连接酶被用于扩增在其中的一条含有限制性位点的链上含有核苷5,-[a-硫代]三磷酸的目标分子(见Walker等,1992,该文献的全部内容都作为参照结合于本发明中),在本发明的核酸的扩增中可能也是有用的.链位移扩增(StrandDisplacementAmplification,SDA)是另外一种进行等温核酸扩增的方法,它涉及多轮的链位移和合成,即缺口翻译.一种类似的方法,称为修复链反应(R印airChainReaction,RCR〉,是另外一种在本发明中可能有用的扩增方法,它涉及对遍及目标扩增区域中的几个探针进行退火,然后再进行修复反应,在上述的修复反应中只存在四种碱基中的两种碱基.为了检测的方便,可以加入另外两种碱基的生物素标记的衍生物。SDA也使用类似的方法,也可以用一种循环式探针反应(cyclicprobereaction,CPR)来检测序列,在CPR中,把一个含有非Cry特异性的DNA的3,和5,端序列以及一个Cry特异性的RNA的内在序列的探针与样品中存在的DNA进行杂交.杂交之后立即用RNaseH对反应进行处理,被探针鉴定为与众不同的那些产物在酶解之后释放一个信号。初始的模板被退火成为另一个循环探针,反应重复进行.这样,CPR涉及扩增一个由探针和一个Cry特异性表达核酸杂交所产生的信号.另外也可以根据本发明使用在英国专利申请No.2,202,328以及国际专利申请出版No,PCT/US89/01025中所述的扩增方法,这两个专利的全部内容都作为参照结合于本发明中。在前一个申请中,把"经过修饰的"引物用于类似于PCR""的依赖于模板和酶的合成中,可以通过给引物标记一个捕抓部分(如生物素)以及/或者一个检测部分(如酶)来对引物进行修饰,在后一个申请中,在一个样品中加入过量的经过标记的探针。在有目标序列存在的情况下,探针发生结合并被酶切,在酶切之后,目标序列被完整地释放以供过量的探针结合,对经过标记的探针进行酶切反映了目标序列的存在.其它的核酸扩增步骤,包括基于转录的扩增系统(transcription-basedamplificationsystems,TAS)(Kwoh等,1989;国际专利申请出版No.WO88/10315,其全部内容作为参照结合于本发明中〉,包括基于核酸序列的扩增(nucleicacidsequencebasedamplification,NASBA)以及3SR,在NASBA中,可以通过以下步骤来制备用于扩增的核酸标准的酚/氯仿提取、样品的热变性、用裂解緩冲液以及minispin来分离DNA和RNA,或者用盐酸胍来提取RNA.这些扩增技术涉及对一个具有晶体蛋白特异性的序列的引物进行退火。在聚合以后,用RNaseH对DNA/RNA杂合体进行酶解,双链DNA分子则再次进行热变性,在每一种情形中,通过加入第二个晶体蛋白特异性的引物然后再聚合来把单链DNA制备成完全的双链DM。然后用聚合酶(如T7或SP6)对双链的DNA分子进行多重转录,在一个等温循环式反应中,RNA被反转录为双链DNA,然后再用聚合酶(如T7或SP6)进行转录.如此获得的产物,不管是截短的还是完整的,都显示晶体蛋白特异性的序列。欧洲专利申请出版No.329,822(该申请的全部内容作为参照结合于本发明中)公开了一种核酸扩增工序,它涉及循环地合成单链RNA("ssRNA")、ssDNA、以及双链DNA(dsDNA),这一工序可以根据本发明进行使用.ssRNA是提供给第一个引物低聚核苷酸的第一个模板,它可以用逆转录酶(依赖于RNA的DNA聚合酶)来延长.然后用核糖核酸酶H(RNaseH,—种对与DNA或RNA形成双螺旋的RNA具特异性的RNase)作用以便从如此获得的DNA:RNA双螺旋中除去RNA。如此获得的ssDNA为第二个引物提供了第二个模板,上述的第二个引物也包括一个RNA聚合酶启动子(如T7RNA聚合酶)的序列,这个序列与模板的5'端具有同源性。然后用DNA聚合酶(如大肠杆菌DNA聚合酶I的〃Klenow"大片段)进行延伸,形成双链DNA("dsDNA")分子,这个分子所含的序列与介于引物之间的初始的RNA的序列是一样的,而且在一端含有一个另加的启动子序列.这一启动子可以被合适的RNA聚合酶用于制造许多DM的RNA拷贝。随后这些拷贝可以重新进入循环,导致扩增非常迅速地进行。只要逸择合适的酶,这一扩增可以在等温的条件下进行,不需要在每一个循环添加酶。因为这一工序具有循环的本质,所以起始的序列可以选择DNA或RNA任意一种形式.国际专利申请出版No.W089/06700,该申请的全部内容作为参照结合于本发明中,公开了一种核酸序列扩增方案,这一方案是基于启动子/引物序列与一个目标单链DNA("ssDNA"〉进行杂交,然后再由该序列转录出许多RNA拷贝这样一个基础的.这一方案不是循环式的,即,并没有从所得的RNA转录产物制造出新的模板.其它的扩增方法包括〃RACE〃(Frohman,1990),以及"羊側PCRtm"("one-sidedPCRTIA〃(Onara,1989),它们都是行内人士所公知的,以以下为基础的方法也可以被用于本发明的DNA序列的扩增在有含有所得的"二聚-低聚核苷酸"的核苷酸的存在下,两个或更多个多聚核苷酸发生连接,从而对上述的二聚-多聚核苷酸进行扩增(Wu和Dean,1996,该文献的全部内容作为参照结合于本发明中)。4.6噬菌体抗性变体在特定的实施例中,可能需要制备一种或多种用本发明方法制备的苏云金芽胞杆菌突变体的噬菌体抗性的变体,为此,在营养琼脂上涂布噬菌体裂解液的等份液体并让它干燥。然后在上述的经过干燥的裂解液上直接接种对噬菌体敏感的细菌菌抹的等份液体并让它干燥.平板在30X:温育。给平板温育2天,此时可以观察到已经有许多菌落生长在琼脂上,把其中的一些菌落挑出来并传代培养于营养琼脂平板上.通过与噬菌体裂解液交叉画平板来试验这些显然具有抗性的培养物的抗性。在平板上画一条噬菌体裂解液的线并让它干燥。然后把假定具有抗性的培养物与噬菌体的线交叉画于平板上。经过30€过夜温育,具有抗性的细菌培养物在与噬菌体线交叉的任何地方都无裂解.随后,对噬菌体的抗性通过在营养琼脂平板上接种抗性培养物的菌莒来确证.同时还以同样的方式接种敏感的菌抹以充当阳性对照,在干燥以后,在平板的中心接种一滴噬菌体的裂解液并让它干燥。经过30t:24小时温育,具有抗性的细菌培养物在接种有噬菌体裂解液的地方都没有裂解。4.7作为杀虫剂的晶体蛋白组合物及其使用方法鞘翅目昆虫含有数量众多的甲虫种类,包括土鳘虫、网状甲虫、皮蠹和红带皮蠹、长角甲虫、叶甲虫、象鼻虫、树皮甲虫、瓢虫、soldierbeetle、鹿角虫、水体食腐甲虫、以及各种各样的其它的甲虫.在以下网站有鞘翅目的简要的分类法http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html.在鞘翅目中特别重要的是农业害虫,包括Chrysomeliformia和Cucujiformia亚目下的昆虫.Chrysomeliformia亚目下的昆虫,包括叶甲虫(Chrysomelidae)和象鼻虫(Curculionidae),对于农业是特别成问题的,它们造成了作物和植物的各种各样的昆虫损害.Cu-cujiformia亚目包括以下的科Coccinellidae,Cucujidae,Lagridae,Meloidae,Rhipiphoridae,和Tenebrionidae,公知的,在这一亚目中,Chrysomelidae科的一些昆虫(包括以下种类Exema,Chrysomela,0reina,Chrysolina,Leptinotarsa,Gonioctena,0ulema,Monozia,Ophraella,Cerotoma,Diabrotica,和Lachnaia)具有毁坏农作物的潜能,由于本发明的毒素已经显示可以有效地对抗多种鞘翅目的昆虫,所以本发明者设想可以使用本发明中所述的组合物来控制或者根除许多鞘翅类昆虫.类似地,本发明中所述的用于产生经过修饰的昆虫特异性提高的多肽的方法可以被用于在把经过修饰的多肽的杀虫活性范围扩展到鞘翅目之内或之外的其它昆虫种类。因此,本发明者设想本发明中所公开的晶体蛋白组合物将在田间作物的局部和/或系统杀虫应用中发挥特定的杀虫剂用途,这些田间作物包括但不局限于稻谷、小麦、紫花苜蓿、玉米、大豆、烟草、土豆、大麦、芸薹(油菜籽)、甜菜、甘蔗、亚麻、黑麦、燕麦、棉花、向曰葵、草地(如牧场草和草地草)、果实、柑橘、坚果、树木、灌木、以及蔬菜;以及观赏植物、仙人掌、肉质植物、等等。本发明描述并要求权项的是含有一种杀虫有效数量的Cry3Bb丰晶体蛋白组合物的组合物.该组合物优选地含有以下的氨基酸序列序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,或序列编号108,或其生物学功能相当的序列,杀虫剂组合物也可以含有一种由具有以下序列的核苷酸序列编码的Cry3Bb+晶体蛋白序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号,55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,或序列编号108,或者可选地,一种在中等严格程度的条件下与以下核苷酸序列杂交的核香酸序列序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,或序列编号107.杀虫组合物可以包括一种或多种类型的苏云金芽胞杆菌细胞,或者一种或多种此类细胞的培养物,或者可选地,一种或多种表达一种或多种表达本发明的新颖的晶体蛋白的苏云金芽胞杆菌细胞与另一种杀虫组合物的混合物。在特定的方面可能需要制备含有许多晶体蛋白的组合物,其中所述的晶体蛋白可以是天然的或者是经过修饰的,用于抵抗一种或多种类型的易感昆虫.在配制之前,可以对本发明的苏云金芽胞杆菌细胞进行处理以便延长其在细胞被施用于目标昆虫的环境中时的杀虫活性。这类处理可以是化学的或物理的方法,或者是化学和/或物理方法相结合,只要这种技术不对杀虫剂的性质产生有害的影响,也不消除细胞对杀虫剂的保护能力.化学剂的例子有卤化剂,特别是原子系数为17-80的卣素.更为特定地,可以在温和的条件下用碘作用足够长的时间以达到所要的结果.其它合适的技术包括用醛类,例如甲醛和戊二醛;抗感染剂,如抗感染剂,如氯化节烷铵;醇类,如异丙醇和乙醇;各种不同的组织固定剂,如Bouin氏固定剂和Helly氏固定剂(见Humason,1967):或者是结合使用在细胞被施用到宿主动物中时能够保存并延长在细胞中所生产的S-内毒素的活性的物理学方法(热)和化学试剂.物理学方法的例子有短波长辐射,例如Y射线辐射以及X射线-辐射、冷冻、紫外线辐射、冻干法、等等。本发明者设想可以用本工艺的熟练人士所公知的任何配制方法用本发明中所述的蛋白来制备此类生物杀虫剂组合物。配制一种表达一种或多种Cry3Bb+DNA片段、产生被编码的Cry3Bb丰蛋白或肽的细胞培养物(优选的是细菌细胞培养物,如在表3中所列的苏云金芽胞杆菌细胞)的全细胞制剂、细胞提取液、细胞悬浮液、细胞勻浆液、细胞裂解液、细胞上清液、细胞过滤液(filtrates)、或者细胞沉淀物可能是合乎需求的.用于配制此类制剂的方法是本工艺的熟练人士所公知的,而且可以包括对一种或多种表达所感兴趣的Cry3Bb+肽的细菌细胞(如在表3中所列的苏云金芽胞杆菌细胞)的培养物进行干燥、冻干、匀浆、提取、过滤、离心、沉淀、或浓缩。在一个优选实施例中,生物杀虫剂组合物包括一种油可以流动(oilflowable)的悬浮液,上述的悬浮液包含含有一种或多种本发明中所述的新颖的晶体蛋白的经过裂解或未经裂解的细菌细胞、孢子、或者晶体。优选地,上述的细胞是苏云金芽胞杆菌细胞,但是,任何此类表达本发明所述的新颖的核酸片段并生产晶体蛋白的细菌宿主细胞都被认为是有用的,例如杆菌种类,例如B.megaterium、B.sublilis、B.cereus;埃希氏杆菌种类,包括大肠杆菌;以及/或者假单胞杆菌种类,包括P.cepacia、P.aeruginosa,以及P.fluorescens。可选地,油可以流动的悬浮剂可以是由一种或多种下列组合物所组成经过裂解或未经过裂解的细菌细胞、孢子、晶体、以及/或者经过纯化的晶体蛋白.在本发明的另一个优选实施例中,生物杀虫剂组合物含有一种可以在水中分散的微粒或者粉末.这一微粒或粉末可以包含经过裂解或未经过裂解的细菌细胞、孢子、或者晶体蛋白,它们含有一种或多种本发明中所述的新颖的晶体蛋白。这些组合物的优选的来源包括诸如苏云金芽胞杆菌细胞的细菌细胞,然而那些用本发明中所述的DNA片段进行转化并表达晶体蛋白的杆菌、埃希氏杆菌、以及假单胞杆菌细胞也被设想是有用的,可选地,微粒或粉末可以是以下一种或多种组合物的结合裂解或未经裂解的细菌细胞、孢子、晶体、以及/或者经过纯化的晶体蛋白.在第三个重要的实施例中,生物杀虫剂组合物含有一种可湿性粉末、喷雾剂、乳剂、胶体、水溶液或有机溶液、粉尘、小药丸、或者棉胶浓缩液.这类组合物可以含有如上所述的经过裂解的和未经裂解的细菌细胞、孢子、晶体、或者细胞提取物,它们含有一种或多种本发明中所述的新颖的晶体蛋白。优选的细菌细胞是苏云金芽胞杆菌细胞,然而,那些用本发明中所述的DNA片段进行转化并表达晶体蛋白的B.megaterium、B.subtilis、B.cereus、大肠杆菌、或者假单胞菌细胞也被设想是有用的.这类千形式的杀虫剂组合物可以被配制成在被湿润时立即溶解,或者可选地,以控释的或緩释的、或者其它的依赖于时间的形式溶解.可逸地,这类组合物可以是以下一种或多种组合物的结合裂解或未经裂解的细菌细胞、孢子、晶体、以及/或者经过纯化的晶体蛋白。在第四个重要实施例中,生物杀虫剂组合物含有一种经过裂解的和未经裂解的细菌细胞、孢子、晶体、以及/或者一种含有经过裂解的和未经裂解的细菌细胞、孢子、以及或者晶体的混合物(如上述的含有本发明中所述的新颖的晶体蛋白的那一些)的水溶液、悬浮液、或者细胞培养物.此类水溶液或悬浮液可以被制备为浓缩的保藏液,可以在施用前把它稀释,或者可选地,也可以制备为可以现用的稀释液。对于那些涉及使用细菌细胞的方法,含有晶体蛋白基因的细胞宿主可以在任何合适的营养介质中培养,其中DNA构建物提供了选择性的优点,提供了一个选择性的介质,使得几乎全部或者全部的细胞都含有苏云金芽胞杆菌基因.随后可以根据合适的方法收获这些细胞,可选地,也可以在收获之前对细胞进行处理.当杀虫剂组合物包括含有所感兴趣的经过修饰的晶体蛋白的苏云金芽胞杆菌细胞、孢子、以及/或者晶体时,这种组合物可以以各种不同的方式进行配制,可以通过把其和各种不同的惰性材料,如无机矿物质(叶状硅酸盐、碳酸盐、硫酸盐、磷酸盐、等等)或者植物材料(粉末状的玉米的穗轴、稻谷的壳、胡桃的壳、等等)混合在一起来配制成可湿性粉末、微粒或粉尘.配方可以包括spreader-sticker佐剂、稳定剂、其它的杀虫添加剂、或者表面活性剂。液体配方可以是水基的,或者是非水基的并可以采用例如泡沫、悬浮剂、可乳化的浓缩液等形式。成分中可以包括流变学药剂、表面活性剂、乳化剂、分散剂、或者聚合体。可选地,新颖的来源于Cry3Bb的突变的晶体蛋白可以用天然的或重组的细窗表达系统在体外进行制备并被分离出来供随后的田间施用.这类蛋白可以是存在于粗的细胞裂解液、悬浮液、胶体、等等中,或者可选地可以在被配制于活性生物斧虫剂配方中之前被纯化、精化、用緩冲液处理、以及/或者被进一步加工。类似地,在特定的环境中,从表达晶体蛋白的细菌培养液中分离晶体以及/或者孢子并把这类晶体以及/或者孢子的溶液、悬浮液、或者棉胶制剂用作活性生物杀虫剂组合物可能是合乎需求的。本发明的另外一个重要的方面是一种用于控制容易受本发明中所述的新颖的组合物影响的鞘翅类昆虫的方法.这类方法通常包括让昆虫或者昆虫种群、群落等接触杀虫有效数量的Cry3Bl^晶体蛋白组合物。该方法可以使用如在以下序列中所述的Cry3Bb+晶体蛋白序列编号2,序列编号4,序列编号6,序列编号8,序列编号10,序列编号12,序列编号14,序列编号16,序列编号18,序列编号20,序列编号22,序列编号24,序列编号26,序列编号28,序列编号30,序列编号32,序列编号34,序列编号36,序列编号38,序列编号40,序列编号42,序列编号44,序列编号46,序列编号48,序列编号50,序列编号52,序列编号54,序列编号56,序列编号58,序列编号60,序列编号62,序列编号64,序列编号66,序列编号68,序列编号70,序列编号100,或序列编号108,或其生物学功能相当的序列。可选地,本发明的方法可以使用一种或多种由以下核酸序列编码的Cry3Bb+晶体蛋白序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107,或者由一种或多种在中等严格或者更高严格程度下与以下序列杂交的核酸序列编码的Cry3Bl^晶体蛋白序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107.用于鉴定在中等严格程度或者更高严格程度下与本发明所述的序列杂交杂交的序列的方法是本工艺的熟练认识所公知的,而且也在本发明中进行了描述。不管使用的是哪种方法,所用的活性成分的使用数量是杀虫有效数量,这根据一些因子的情况而存在差异,这些因子包括,例如所要控制的特定的鞘翅类昆虫、所要治疗的特定的植物或作物、环境条件、以及所用的方法、比率、以及所施用的具有杀虫活性的组合物的数量o本发明中所述的杀虫组合物可以通过把细菌细胞、晶体以及/或者孢子悬浮液、或者分离的蛋白成分与所要的农业上可接受的栽体配制在一起来制造。组合物可以在施用以前被以合适的方式,例如冻干、冷冻干燥、干燥等,进行配制,也可以被配制在水性载体、介质或者合适的稀释液,如盐水或其它的緩冲液中。组合物可以被配制成粉尘或者微粒材料、或者一种油(植物或矿物油)的悬浮液、或者油/水乳剂,或者可湿性粉末、或者与任何适合农业应用的任何其它的载体材料相结合,合适的农业载体可以是固体或者液体,它们都是本工艺中公知的。术语"农业上可接受的载体"涵盖了所有的佐剂,例如惰性成分、分散剂、表面活性剂、增粘剂、粘合剂等等,它们都是在杀虫剂配制技术中通常使用的,是精通杀虫剂配制的人士所公知的,这些配方可以和一种或多种固体或液体佐剂混合在一起并用各种不同的方法,如用常规的配制技术把杀虫剂组合物与合适的佐剂进行匀浆混合、混合以及/或者研磨来制备.用常规的方法,优选地用喷雾的方法把本发明的杀虫剂组合物使用到目标鞘翅类昆虫的环境中,典型的是喷雾在所要保护的植物或作物的叶片上.可以根据所要治疗的特定的昆虫和作物的特定的情况以及特定的环境条件来设置杀虫剂施用的强度和持续时间。活性成分与载体的百分比率将依赖于杀虫剂组合物的化学性质、溶解性、以及稳定性,也依赖于所使用的特定的配方。同时也可以使用其它的施用技术,例如涂粉、撒水、浸泡、土壤注射、土壤耕种、种子涂覆、喷雾、爆气、撒雾、喷成雾状、等等,这些技术可能是在特定的状况下所需要的,例如当有昆虫对根或茎进行侵袭时,同时它们也可以被应用于精致的植物或观赏性植物.这些施用步骤也是本工艺的熟练人士所公知的。本发明的杀虫剂组合物可以被单独应用于本发明的方法中,或者它们也可以与其它的化合物,包括但不局限于其它的杀虫剂,结合使用.同时本发明的方法也可以被用于与其它的处理方式,例如表面活性剂、去污剂、聚合体或者緩释制剂结合使用。本发明的杀虫剂组合物可以被配制用于系统性或局部性的用途。用于环境的、系统性的、或者叶面施用的杀虫剂组合物的浓度将根据特定配方的本质、施用的方法、环境条件、以及生物杀虫活性的程度而大有差异。典型地,生物杀虫剂组合物在所使用的配方中的浓度至少为大约1%(重量比),而且可以达到并包括重量比的99%。组合物的干配方中组合物的组成可以达到大约1%至大约99%(重量比),而液体配方中的活性成分则通常占重量比的大约1%至大约99%或者更大的比重,含有完整的细菌细胞的配方通常含有大约104至1012个细胞/毫克.可以根据需要给特定的植物或目标地区一次或多次施用杀虫剂配方,典型的田间施用率的范围为每公项施用大约l克至大约l千克、2千克、5千克,或者甚至更多的活性成分。4.8作为杂交探针和引物的核酸片段此处所设想的核酸序列除了被用于指导本发明的晶体蛋白或肽的表达以外还具有许多其它的用途.例如,它们在核酸杂交的实施例中被用为探针或引物.因此,具有以下特征的核酸片段被设想具有特別的用途,即它们含有一个长度为至少14个核苷的连续序列,这些序列与以下的长度为14个核苷的连续的DNA序列相同,或者互补序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107.在一些特定的实施例中也可以使用更长的、连续的相同的或互补的序列,如那些长度为大约20,30,40,50,100,200,500,1000,2000,5000,IOOOO等(包括所有的中间长度直至包括全长)的序列,这类核酸探针特定地与编码晶体蛋白的序列进行杂交的能力将使它们能够被用于检测在一个给定的样品中是否存在互补序列.然而,它们也被设想具有其它的用途,包括使用其序列信息来制备突变种类的引物,或者制备用于制备其它遗传构建物的引物.特別地设想具有以下特征的核酸分子可以被用作在例如Southern和Northern印迹中使用的杂交探针,即它们含有一个序列区域,该序列区域含有长度为10-14,15-20,30,50,或者甚至100-200左右个核酸的连续的核酸序列,其中这些序列与以下的DNA序列相同或者互补序列编号1,序列编号3,序列编号5,序列编号7,序列编号9,序列编号11,序列编号13,序列编号15,序列编号17,序列编号19,序列编号21,序列编号23,序列编号25,序列编号27,序列编号29,序列编号31,序列编号33,序列编号35,序列编号37,序列编号39,序列编号41,序列编号43,序列编号45,序列编号47,序列编号49,序列编号51,序列编号53,序列编号55,序列编号57,序列编号59,序列编号61,序列编号63,序列编号65,序列编号67,序列编号69,序列编号99,序列编号101,或序列编号107.更小的片段通常可被应用于杂交实施例中,其中连续互补区域的长度可以有所差异,例如介于大约10-14以及大约100或200个核苷之间,但是也可以使用更长的连续互补片段,这可以根据所要检测的互补序列的长度来定.使用一个长度为14个核苷的探针可以形成一个既稳定又具有选择性的双链分子.但是,含有长度大于H个核苦的连续互补序列的分子通常是优选的,以便增加杂合体的稳定性和逸择性并从而改善所获得的特定的杂合体分子的质量和程度。通常优逸的是设计含有其长度为15-20个连续核苷,甚至更长的基因互补片段的核酸分子。当然,可以用其它的技术,例如使用机械剪切或者限制性酶解,来获得这些片段.更短的核酸片段可以通过,例如用化学方法直接合成该片段来容易地制备,这通常都是用自动化的低聚核苷合成仪来实现的。另外,也可以使用核酸复制技术,例如使用美国专利4,683,195和4,683,202(两个申请的全部内容作为参照结合于本发明中)的PCR顶技术,通过在重组栽体中导入逸定的序列用于重组生产来获得这些片段,也可以用通常为分子生物学工艺的熟练人士所公知的重组DNA技术来获得。相应地,本发明的核酸序列可以被用于选择性地与DNA片段的互补片段形成双链分子。根据所设想的应用,可能会想要使用各种不同的杂交条件来获得探针对目标序列的不同程度的选择性.当在应用中需要高度的选择性时,典型地需要使用相对严格的条件来形成杂合体,例如,需要选择相对低盐和/或高温条件,例如在大约50X:至大约70X:之间的温度提供大约0.02M至O.15M的NaCl.此类选择性条件仅容忍在探针和模板或目标链之间发生少量的(如果有的话)错配,特別适用于分离编码晶体蛋白的DNA片段.通过杂交来检测DNA片段是业内人士所公知的,杂交分析的的方法的例子见于美国专利4,965,188和5,176,995(作为参照结合于本发明中)。具体相关的教导见于Maloy等,1994;Segal,1976iProkop,1991;以及Kuby,1994的文献*当然,对于一些应用,例如,当需要用一个杂交到编码模板上的突变引物来制备突变体,或者探索从相关的种类、功能性等同体等等分离编码晶体蛋白的序列时,通常需要严格程度较低的杂交条件,以便形成杂交双链.在这些情形中,可能需要使用如大约O.15M至大约0.9M的盐以及介于大约20"至大约55C的温度。这样,就可以把交叉杂交的种类鉴定为阳性杂交信号(相对于对照杂交而言)。在任何情形中,通常应该理解的是通过增加甲酰胺的数量可以使条件变得更为严格,其中甲酰胺是用于稳定异型双链,其作用方式与提高温度相同,这样,可以对杂交的条件随意进行搡作,因此通常是首选的方法,这取决于所希望得到的结果.在特定的实施例中,有利的是把本发明的核酸序列与合适的方法,例如标记物,结合使用,用于确定杂交。有范围广泛的合适的指示物在本工艺中是已知的,包括焚光剂、放射性物质、酶配体或其它的配体,例如抗生物素蛋白/生物素,它们都可以提供一个可被检测的信号。在优选实施例中,可能希望使用一种菱光标记物或者一个酶标记物,如脲酶、碱性磷酸酶或者过氧化物酶,而不是使用放射性物质或其它对环境不利的试剂.在酶标记物的情形中,已知可以用比色指示底物来提供一种人眼或分光光度计可以检测到的方法,用于鉴定与含有互补核酸的样品的杂交。总体上,本发明中所述的杂交探针被设想可以被用作溶液杂交试剂,同时也可以被用于使用固相的实施例中'在设计固相的实施例中,试验的DNA(或RNA)被吸收或者以其它的方式粘附到选定的基质或表面上,然后让这一经过罔定的单链核酸与选定的探针在所要的条件下特定地进行杂交,所选定的条件将依赖于特定的环境,上述的环境是基于所需的特定的标准的,例如依赖于G+C的含量、目标核酸的类型、核酸的来源、杂交探针的尺寸等等.在清洗杂交表面以便除去非特异性结合的探针分子之后,通过标记物对特定的杂交进行检测,或者甚至进行定量。4.9经过修饰的Cry35-内毒素的特征本发明提供了新颖的多肽,这些多肽定义了由以下苏云金芽胞杆菌核酸序列编码的晶体蛋白的全部或者一部分cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry犯b.11229,cry犯b.11230,cry3Bb,11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11032,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095以及cry3Bk11098。4.10晶体蛋白命名法本发明已经任意地给本发明的新颖的蛋白指定了以下的名称Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236,Cry犯b.11237,Cry犯b.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry3Bb.11046,Cry3Bb.11048,Cry犯b.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095以及Cry3Bb.11098。类似地,本发明也给编码上述多肽的新颖的核酸序列分别随意地指定了以下的名称cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,cry3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11043,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095以及cry3Bb.11098.虽然苏云金芽胞杆菌命名法委员会可以根据经过修订的晶体蛋白内毒素命名法(表l)对这些基因和蛋白进行正式的命名,但是对本发明的组合物进行的任何重新命名同时也被设想是完全属于本发明的范闺之内的.4.11转基因宿主细胞和转基闺植物本发明也设想了用本发明的表达载体进行转化的一种细菌、酵母细胞、或者一种植物细胞或者植物.一种转基因细菌、酵母细胞、植物细胞或者来源于此类经过转化或转基因的细胞的植物也构成了本发明的一个方面.经常需要把这类经过转化的宿主细胞用于内毒素的生产以及本发明中所述的各种不同的DNA基因构建物的表达中,在本发明的一些方面,经常需要对本发明中所述的基因片段的表达进行调制、调节或者其它方式的控制,这类方法对于分子遗传学工艺的熟练人士是常规的,典型地,当需要增加或者过量表达一种特定的基罔时,可以进行各种不同的操作以便增加信使RNA的表达,特别是通过在使用序列的同时使用一种活性启动子,这种启动子增强了信使RNA在特定的经过转化的宿主细胞中的稳定性。典型地,起始和转录终止区域将含有终止密码子、一个终止区域、以及可选地一个多聚腺苷酰化作用信号.沿着转录的方向,即从编码或阅读序列的5'端到3'端的方向,构建物将包括转录调控区域(如果有的话)、以及启动子,其中调控区域可以在启动子的5,端或3'端、核糖体结合位点、起始密码子、含有与起始密码子相连的开读框的结构基因、终止密码子、多聚腺苷酰化作用信号序列(如果有的话)、以及终止子区域.这一双链形式的序列可以被自身用于转化徵生物宿主,但通常被与一个含有标记物的DNA序列包括在一起,其中第二个DNA序列可以在DNA被导入宿主中时被接合到表达S-内毒素的构建物上.为结构基因设置一个标记物是为了给这些已经被修饰或转化的宿主提供选择.标记物通常将提供选择性的优点,例如提供生物杀伤剂抗性,例如对抗生素或重金属的抗性;互补作用,以便给营养缺陷型的宿主提供原养,等等,优选地使用互补作用,这样经过修饰地宿主不仅得到了选择,而且在田间还具有竟争力.在发展构建物以及对宿主进行修饰时可以使用一个或多个标记物.可以通过提供一种相对田间其它野生型微生物的竟争性优点来对生物体进行进一步的修饰.例如,可以在把表达金属螯合剂(如含铁细胞(siderophore))的基因和表达5-内毒素的结构基因同时导入宿主中。这样,含铁细胞表达的增强可以为生产5-内毒素的宿主提供一个竟争性的优点以便使它可以有效地与野生型的微生物竟争并在环境中稳定地占领一个活动的范围..当不存在功能性复制系统时,枸建物的序列中还将包括一个至少为50碱基对(bp),优选地为100bp,通常不超过大约1000bp的序列,该序列与宿主中的序列是同源的.这样,正当重组的可能性就得以增强,使得基因可以被整合到宿主中并被宿主稳定地保持,优选地,S-内毒素基因应与提供互补作用的基因以及提供竟争性优点的基因非常接近,因此,当S-内毒素基因丢失时,由此获得的生物体很可能也丢失了互补作用基罔以及/或者提供竟争性优点的基因,这样该生物体就无法与那些基因还完整地保留在构建物中的生物体竟争了。编码晶体蛋白的基因可以被插入于转录和翻译起始区域与转录和翻译终止区域之间,以便接受起始区域的调控。这一构建物可以被包括在质粒中,上述的质粒将包括至少一个复制系统,但可以包括一个以上,其中的一个复制系统被用于在质粒发展的过程中进行克隆,另一个复制系统是在最终的宿主中发挥功能所必需的。另外,可以存在一个或多个标记物,这在以前已经被描述了.当需要进行整合时,质粒包括一个与宿主基因组同源的序列是合乎需求的。可以根据常规的方法来分离转化体,通常使用的是筛选技术,通过这一技术可以把想要的生物体与未经修饰的生物体或用于转移的生物体(如果有的话)分离筛选出来。随后可以测试转化体的杀虫活性。合适的宿主细胞,其中含有杀虫剂的细胞将被处理以便延长细胞中的S-内毒素在经过如此处理的细胞被施用于目标害虫的环境中时的活性,可以包括原核或真核细胞,通常局限于那些不产生对高等生物体(如哺乳动物)具有毒性的物质的细胞.然而,也可以使用那些可以产生对高等生物体具有毒性的物质的生物体,其中在上述生物体中的S-内毒素是不稳定的,或者其施用的水平足够的低,不足以对哺乳动物宿主产生任何毒性.对于宿主而言,特别感兴趣的是原核生物和较低等的真核生物,例如真菌,示例性的原核生物(包括格兰氏阴性和格兰氏阳性)包括肠杆菌科,例如埃希氏菌属、欧文菌属、志贺菌属、沙门菌属、以及变性菌属;芽孢杆菌科;根瘤菌科,如根瘤菌;螺菌科,如发光菌、Zymoinonas、沙雷苗属、气单胞苗属、孤菌属、去磺弧菌属、螺菌属;乳酸菌;植形(phylloplane)生物体,例如极毛杆菌科的成员(包括假单胞菌属和醋酸杆菌属);固氮菌属和硝化菌属;产黄菌属;芽孢杆菌属的一些成员,如乳杆菌种类、双歧杆菌属以及杆菌种类等等.特别优选的宿主细胞包括Pseudo旭onasaeruginosaPseudomonasfluorescens、Bacillusthuringiensis、Escherichiacoli、Bacillussubtilis等等,真核细胞中优选的是真菌,例如藻菌类植物以及子嚢菌类,这包括酵母,例如人体酵母菌以及担子菌类、圃酵母、短梗霉属、掷孢酵母属、酵母属、以及掷孢酵母属种类.在筛逸一个用于生产目的的宿主细胞时特别感兴趣的特征包括易于把S-内毒素的基因导入到宿主中;有可用的表达系统;表达的效率;杀虫剂在宿主中的稳定性;以及存在辅助的遗传能力.用作杀虫剂微胶嚢的感兴趣的特征包括杀虫剂的保护性特质,例如具有厚的细胞壁、色素形成、以及在细胞内包装或形成包含体;叶子亲和性;对哺乳动物不具有毒性;能够诱惑害虫摄食;容易杀灭和固定同时又不损害S-内毒素的毒性,等等。其它的考虑包括易于配制和处理、经济效益、保藏的稳定性,等等.在处理时,细胞通常是完整的或者处于增殖的形式,而不是处于孢子的形式,虽然在某些情形中可以使用孢子。可以用以下所述的方法对重组的微生物细胞进行处理.经过处理的细胞通常结构稳定性增强,这将增强其对环境条件的抵抗力.可以使用各种不同的技术把本发明中所迷的基因或其它的核酸片段插入到宿主细胞中,这些技术在本工艺中都是公知的.例如,有大量的含有在大肠杆菌中复制的系统以及一个允许对转化细胞进行筛选的标记物的克隆载体可以被用于把外源基因插入到高等生物体(包括植物)中。这些载体包括例如,pBR322、pUC系列、M13mp系列、PACYC184等。相应地,编码5-内毒素的序列可以被插入到栽体中合适的限制性位点上.由此获得的质粒被用于转化到大肠杆菌中.在合适的营养介质中培养大肠杆菌,然后收获并裂解。回收质粒并进行序列分析、限制性分析、电泳以及其它的生物化学、分子生物学方法分析,这些都是通常所进行的分析步骤.在每个操作之后,可以把所使用的DNA序列剪切下来并连接到下一个DNA序列上.可以把每一个质粒序列克隆到同一个或者不同的质粒中.根据把所要的基因插入到植物中时所用的方法,可能需要其它的DNA序列。用于植物细胞DNA转化的方法包括农杆菌介导的植物转化、原生质体转化、基罔转移进入花粉、注射进入生殖器官、注射进入未成熟的胚胎、以及粒子轰击法.上述的每一种方法都有其显箸的优点和缺点。因此,把基因导入一个特定的植物植抹中的特定的方法并不一定是对另一个植物植抹最有效的方法,但是已经清楚地知道对于一种特定的植物植抹哪一种方法是有用的。合适的方法被认为包括能够把DNA导入细胞中的任何方法,如农杆菌感染;DNA的直接输送,例如pEG介导的原生质体转化(Omirulleh等,1993)、干燥/抑制介导的DNA摄取、电击穿、金刚砂激动作用、涂覆有DNA的粒子的加速;等等.在特定的实施例中,加速方法是优选的,包括,例如微粒轰击等等.用于把DNA导入细胞中的技术是业内人士所公知的。已经有人描述了四种用于把基因素输送到细胞中的一般的方法(l)化学方法(Graham和vanderEb,1973,Zatloukal等,science1992);(2)物理学方法,如微粒轰击(Capecchi,1980)、电穿孔(Wong和Neumann,1982;Fromm等,1985)以及基因枪(Johnston和Tang,1994;Fynan等.1993):(3)病毒载体(Cla卯,1993;Lu等,1993:Eglitis和Anderson,1988;Eglitis等,1988);以及(4)受体介导的机制(Curiel等,1991;1992;Wagner等1992)。有大量的技术可以被用于把DNA插入到植物宿主细胞中.这些技术包括使用根癌土壤杆菌或者Agrobacteriumrhizogenes作为转化剂用T-DNA进行转化、融合、注射、或者电击穿、以及其它的可能的方法.当把农杆菌用于转化时,所要插入的DNA必须被克隆到特定的栽体中,即克隆到一个中间栽体或者二元栽体中.中间栽体可以用同源重组整合到Ti或Ri质粒中,因为它们含有与T-DNA序列同源的序列。Ti或Ri质粒同时还包含有T-DNA转移所需的vir区域。中间栽体在农杆菌中无法进行自身复制.可以通过一种帮助质粒(结合)把中间载体转移到根癌农杆菌中.二元栽体可以在大肠杆菌和农杆菌中进行自身复制.它们含有一个筛选标记基因以及一个连接物或者低聚连接物,达些连接物的左右两側连接着T-DNA的边界区域。它们可以被直接转化到农杆菌中(Holsters等,1978).被用作宿主细胞的农杆菌将含有一个含有一个vir区域的质粒。vir区域是把T-DNA转移到植物细胞中所必需的。可以含有另加的t-DNA,经过如此转化的细菌被用于植物细胞的转化。植物外植体可以被有利地与根癌农杆菌和Agrobacteriumrhizogenes—起培养,以便把DNA转移到植物细胞中.然后可以在合适的介质,该介质可能含有用于筛选的抗生素或者生物杀伤剂,中从受感染的植物材料(如叶片、茎的段、根、但也包括原生质体或者悬浮培养的细胞)再生出完整的植物。然后可以检测如此获得的植物是否存在插入的基因,当进行注射和电击穿时,对质粒没有特殊的要求.可以使用通常的质粒,例如使用pUC衍生物,如果,例如,用Ti或Ri质粒来转化植物细胞,那么Ti或Ri质粒T-DNA的至少右边界,但通常是左右两个边界必须被连接成所要插入的基因的边界区域。用T-DNA来转化植物细胞已经被详细地研究并充分地描述于欧洲专利申请No.EP120516;Hockema(1985);An等,1985;Herrera-Estrella等,(1983);Bevan等,(1983);以及Klee等,(1985〉中.用于双子叶植物转化的一个特别有用的含有增强的Ti质粒盒式栽体CaMV35S启动子(EN35S)以及含有多聚腺苷酰化作用信号的末端,上述的多聚腺苷酰化作用信号来源于一个编码p-conglycinin的a亚基的大豆基因。在上述的两个元件之间是一个多元连接物,它含有多个可以供目标基因插入的限制性位点。载体优选地含有一个pBR322的片段,它提供了在大肠杆菌中表达的复制起点以及一个用于与所要的农杆菌菌抹ACO的T-DNA进行同源重组的区域;来源于具有广泛的宿主范围的质粒PKI的oriV区域;来源于Tn7的链霉素/放线菌素抗性基因;以及一个嵌合的NPTII基因,该基因含有CaMV35S启动子以及胭脂碱合成酶(NOS)的3,端,它为经过转化的植物细胞提供了卡那霉素抗性。可选地,可以用15kb的mannopine合成酶(MAS)启动子(Velten等,1984)来替代经过增强的CaMV35S启动子。在把一个DNA构建物结合到载体中之后,把它导入一个含有解毒的(disarmed)Ti质粒的根癌农杆菌菌抹ACO中,对共整合的Ti质粒栽体进行筛选,随后可以把它用于转化双子叶植物。根癌农杆菌ACO是一种解毒的菌抹,它与Fraley等(1985)所描述的pTiB6SE类似。在构建ACO时,起始的农杆菌菌抹是菌抹A208,它含有一个胭脂碱类型的Ti质粒,上迷的Ti质粒被以与Fraley等(1985)所述的类似的方法解了毒,使得几乎所有的天然的T-DNA都被除去,除了左边界以及在左边界内的几百个碱基对T-DNA以外。延伸到右边界后的一个点的剩余的T-DNA被替换为一个新颖的DNA片段,该片段从左到右包括一个pBR322的片段、来源于质粒RK2的oriV区域、以及来源于Tn601的卡那霉素抗性基因.pBR322和oriV片段与这些片段是类似的,提供了一个用于共整合的同源区域。一旦被插入的DNA已经被整合到基因组中,它在那里将会相对稳定,而且根据经验,不会再出来了。它通常含有一个筛选标记物,这个标记物存在于经过转化的对生物杀伤剂或抗生素,如卡那霉素、G418、博来霉素、潮霉素、或者氯霉素等等具有抗性的植物细胞中.个别使用的标记物应该相应地允许对经过转化的细胞,而不是那些不含有插入的DNA的细胞进行筛选,4.11.1电穿孔把短暂的高电压电脉冲作用于各种不同的动物和植物细胞导致在质膜中形成纳米大小的孔。DNA被从这些孔直接摄入细胞质中,或者作为膜成分重新分配的结果伴随着孔的关闭被摄入细胞,电穿孔可以具有极高的效率,它可以被用于克隆基因的瞬时表达以及整合有感兴趣的基因拷贝的细胞抹的确立。电穿孔不同于磷酸钙介导的转染和原生质体融合的是,它经常产生整合有一个,或者最多少数几个,外源DNA拷贝的细胞抹.通过电穿孔导入DNA的方法是本工艺的熟练人士所公知的.在这种方法中,使用特定的细胞壁降解酶,如胶质降解酶来使目标受体细胞变得比未经处理的细胞更容易受电击穿转化的影响.可选地,也可以通过机械创伤来使受体细胞更容易受转化的影响.为了实现电击穿转化,可以使用脆弱的组织,如细胞的悬浮培养物或者胚胎发生愈伤组织,或者可选地,可以对未成熟的胚胎或者其它的组织直接进行转化.可以通过把细胞壁暴露于胶质降解酶(pectolyases)或者通过以受控的方式进行机械创伤来部分降解细胞壁.这时可以进行电击穿DNA转移并把这些细胞当作电击穿DNA转移的受体,然后根据新整合进来的DNA的性质用合适的筛选协议筌定被转化的细胞.4.11.2微粒轰击用于把转化用的DNA片段输送到植物细胞中的另外一个有利的方法是微弹轰击法。在这一方法中,可以在微粒上涂覆核酸并用一个推进力把微粒输送到细胞中.示例性的微粒包括那些包含鴒、金、钩等的徵粒,微弹轰击法作为一种能够可繁殖地、稳定地转化单子叶植物的有效的方法,它的一个优点是既不需要分离原生质体(Cristou等,1988),又不需要对农杆菌感染具有感受性.通过加速度把DNA输送到玉米细胞中的方法的一个示例性的实施例是BiolisticsParticleDeliverySystem,它可以被用于把涂覆有DNA或细胞的微粒推进通过一个屏幕,如一个不锈钢或Nytex屏幕,到达一个涂覆有培养在悬浮液中的玉米细胞的滤器表面上。屏幕分散了微粒,使它们不被以大的聚集物的形式输送给受体细胞。在微粒装置和所要轰击的细胞之间设置一个屏幕被认为可以减小微粒聚集物的尺寸并且可以通过减少太大的微粒对受体细胞的损伤来提高转化的频率。在进行轰击时,悬浮液中的细胞优选地被浓缩在滤器或者固体培养介质上.可选地,也可以把未成熟的胚胎或者其它的目标细胞准备在固体培养介质上。把所要轰击的细胞定位在微粒挡板下一个合适距离的位置.如果需要,也可以在加速装置和所要轰击的细胞之间设置一个或多个屏幕.通过使用本发明中所描述的技术可以获得1000个或更多的短暂地表达标记基因的细胞焦点(foci)。每一个在轰击后48小时表达外源基因产物的焦点的细胞数目通常介于1至10个之间,平均为1至3个.在微粒轰击转化中,可以通过优化轰击前的培养条件以及轰击参数来获得最多数目的稳定转化体。在这一技术中,轰击的物理学和生物学参数都很重要.物理学因素是那些涉及DNA/微粒沉淀物或者影响大的颗粒或微粒的飞行和速度的因素.生物学因素包括在轰击前以及紧跟其后对细胞进行搡纵的所有步骤、为了帮助减轻轰击所伴随的外伤而对目标细胞进行的渗透性调节、以及转化用的DNA(如线性化的DNA或完整的超螺旋质粒)的性质.轰击前的操纵被认为对未成熟胚胎的成功转化是特别重要的.相应地,本发明者设想有人会希望在小规模的研究中调整各种不同的轰击参数以便对条件进行充分的优化.有人可能会特别希望对一些物理学参数,如间隙的距离、飞行的距离、组织的距离以及氦气的压力,进行调整.也可以通过对影响受体细胞生理学状态并可能从而影响转化和整合效率的条件进行修饰来优化外伤减少因子(traumareductionfactors,TRFS),例如,可以对受体细胞的渗透状态、组织的水合作用以及所代培养物状态或细胞周期进行调整以实现最优转化,在本发明所公开的内容的指导下,其它的常规性调整对于本工艺的熟练人士将是以知的。4.11.3农杆菌介导的转移农杆菌介导的转化是一个可以被广泛应用的用于把基因导入到植物细胞中的系统,因为DNA可以被导入到整个植物组织中,从而无须从一个原生质体再生出完整的植抹。用农杆菌介导的植物整合栽体把DNA导入到植物细胞中的方法在本工艺中是公知的.参照,例如,已经被描述的方法(Fraley等,1985:Rogers等,1987).另外,Ti-DNA的整合是一个相对精确的过程,它所产生的重排很少.所要转移的DNA区域是由边界序列来定义的,所要插入的DNA通常如前述的方法(Spielmann等,1986;Jorgensen等,1987)被插入于植物基罔组中.现代的农杆菌转化栽体能够在大肠杆菌和农杆菌中复制,从而便利了操纵,如前述(Klee等,1985).另外,最近在用于农杆菌介导的基因转移的载体上的技术进步已经改善了栽体中基因和限制性位点的安排以便利构建能够表达各种不同多肽编码基因的载体.前述的载体(Rogers等,1987〉含有便利的多连接序列区域,这些区域两端分别连接着一个启动子和一个多聚腺苷酰化作用位点,用于直接表达插入的多肽编码基因,这些栽体适合于本发明的目的。另外,可以用同时含有毒性和非毒性Ti基因的农杆菌进行转化,在农杆菌介导的转化能够发挥效率的植物植株中,因为基因转移所具有的容易的、规定的性质,这是首选的方法。农杆菌介导的叶片以及其它组织,例如子叶和下胚轴,的转化仅局限于农杆菌天然感染的那些植物'农杆菌介导的转化在双子叶植物中是最有效率的'极少数的单子叶植物是农軒菌的夭然宿主,虽然已经用农杆菌栽体在,尹中制造了转基因植物,如前述(Bytebler等,1987).因此,具有商业重要性的谷类,如大米、玉米和小麦通常必须用替代的方法进行转化.然而,如上所述,,务仍然可以用农杆菌进行转化(见,例如,Bytebier等,1987),用农杆菌转化方法形成的转基周植物典型地在一个染色体上含有一个单一的基因。此类转基因植物可以被称为所添加的基因的杂合体。然而,因为词语"杂合体"通常意味着在一对染色体的另一条染色体的同一位点上含有一个互补的基因,但是在如此处所述的含有一个添加的基因的植物中并不存在这样一个基因,所以认为此类植物的更为准确的名称应该是"一种独立的分离系",因为所添加的外源性的基因在有丝分裂和减数分裂期间独立地分离。更为优选的是一种所添加的结构基因的纯合的转基因植物,即该转基因植物含有两个添加的基因,在一对染色体的两条染色体上的同一位点上分别含有一个基因。纯合的转基因植物可以通过以下步骤来获得交配一个含有一个单一的添加基因的独立的分离系转基因植物(自体受精);让由此获得的种子萌芽并分析如此获得的植物,该植物被生产用以增强羧肽酶活性(相对于对照(天然的、未经转基因的)或者一个独立的分离系转基因植物).应该理解的是,也可以让两种不同的转基因植物交配以产生含有两个独立分离的添加的外源基因的子代。合适子代的自体受精可以产生两个添加的编码感兴趣的肽的外源基因的纯合的植物.同时本发明还设想了与父代植物的回交以及与非转基因植物的异型杂交。植物原生质体的转化也可以通过使用基于磷酸钙沉淀、聚乙二醇处理、电穿孔、以及这些处理的结合的方法来实现(见,例如,Potrykus等,1985;Lorz等,1985;Fromm等,1985;Uchimiya等,1986;Callis等,1987;Marcotte等,1988)。这些系统在不同植物抹系的应用取决于从原生质体再生具有特定功能的植物抹系的能力。用于从原生质体再生谷类作物的示范性的方法已有描述(Fujimura等,1985;Toriyama等,1986;Yamada等,1986;Abdullah等,1986)为了对不能成功地从原生质体再生的植物抹系进行转化,可以使用其它的把DNA导入到完整的细胞或组织中的方法。例如,可以根据前述的方法(Vasil,1988)从未成熟的胚胎或者外植体再生谷类植抹。另外,也可以使用"基因枪"或者高速微粒轰击技术(Vasil,1992),当使用后一种技术时,存在于细小金属颗粒上的DNA被携带通过细胞壁进入细胞质中,如前述(Klein等,1987:Klein等,1988:McCabe等,1988)。金属颗粒穿透好几层细胞,罔而使得可以在组织外植体中的转化细胞.4.11.4植物中基因的表达虽然最近几年在表达细菌蛋白,如苏云金芽胞杆菌晶体蛋白,的转基因植物的制备上已经取得了很大的进步,但是在植物中表达天然的细菌基因通常却是令人失望的。不同于微生物遗传学的是,早期的植物遗传学家对影响外来基因在植物中异源表达的因素的了解很少.然而,在最近几年,有好几种潜在的因素已经被示明在不同的程度上负责特定编码序列的蛋白表达水平.例如,现在科学家们知道在细胞中维持一种特定的mRNA的显著水平是一个关键的因素.不幸的是,造成编码外来蛋白的mRNA的低稳定性的原因却有妤多。首先,全长RNA合成发生的频率不高。这可能是因为在转录时RNA过早地终止了,或者是因为在转录时发生意料之外的mRNA加工.第二,全长RNA可能是在植物细胞中产生的,但是随后却在核中被以某种形式加工(剪切、添加多聚A),使得所产生的mRNA不具有功能.如果RNA没有被适当地合成、终止和多聚腺苷酰化,它就无法转移到细胞质中进行翻译.类似地,在细胞质中,如果mRNA的半寿期(这是由它们的初级和二级序列所决定的)截短了,那么就无法生产足量的蛋白。另外,翻译效率对inRNA的半寿期有影响,程度未确。另外,每一个RNA分子折叠成特定的结构,或者可能会折叠成一族结构,这是由它的序列所确定的,任何RNA的特定的结构导致其在细胞质中的稳定性更强或更弱。结构本身也可能是mRNA在核中加工的一个决定因素.不幸的是,不可能预测,几乎也不可能在体外和体内确定任何RNA(tRNA除外)的结构.然而,戏剧性地改变一个RNA的序列有可能能够对它的折叠结构产生很大的影响.结构本身或者一些特定的结构特征也可能在RNA稳定性的确定中发挥作用,为了克服达些在外来基因表达上的局限性,研究者们已经鉴定出RNA中特定的序列和信号,它们具有对RNA稳定性产生特定影响的潜力。因此,在本发明的特定实施例中,需要优化植物中已打开的核酸片段的表达.这样做的一种特定方法,是通过改变细菌的基因,以除去降低在某一已转化的植物细胞中表达的序列或基序.为在植物中最优表达的编码序列,其操纵过程优选的常常是对一段DNA序列进行"植物化".尤其有疑问的是富含A+T的序列,不幸的是,由于苏云金芽胞杆菌具有富含A+T的基因组,因此为了使其在植物中达到最优表达,常常必须修饰天然晶体蛋白的基因序列.序列基序ATTTA(或者当其出现在RNA中为AUUUA)已经作为一种破坏稳定性的序列牵涉到哺乳动物细胞的mRNA中(Shaw和Kamen,1986),许多短期存在的mRNA具有富含A+T的3,端非翻译区,这些区域常常含有ATTTA序列,有时是以多拷贝或多聚体(如ATTTATTTA...)的形式存在.Shaw和Kamen指出不稳定的mRNA3'末端向稳定的RNA(球蛋白或VA1)的转移显著地降低了稳定的RNA的半衰期.他们进一步指出ATTTA的五聚体对一段稳定的信息具有深刻的破坏稳定性的作用,而且这种信号在位于3'末端或编码区内时均可发挥作用。然而,ATTTA序列的数目和/或它们所存在的序列背景在确定它们是否作为破坏稳定性的序列发挥作用时也显示出重要性.Shaw和Kamen指出ATTTA的三聚体对mRNA稳定性的影响大大低于五聚体,二聚体或单体对稳定性没有影响(Shair和Kamen,1987)。注意到ATTTA的多聚体(如五聚体)自动产生富含A+T的区域。这显示为细胞质的影响,而不是核.在其它一些不稳定的mRNA中,ATTTA序列可能以仅单拷贝的形式存在,但它经常包含在富含A+T的区域中.从迄今为止所收集的动物细胞数椐中显示,ATTTA至少在一些背景下对于稳定性是重要的,但是也不可能预测ATTTA的哪些出现是破坏稳定的因素,或者任何这些影响是否可能在植物中见到。一些关于mRNA在动物细胞中的降解的研究也显示,在某些情况下RNA的降解开始于核酸酵素对富含A+T区域的攻击,这些裂解是否发生在ATTTA序列尚不清楚.也有一些mRNA的例子,它们依赖于其所表达的细胞类型或其所表达的细胞周期的阶段而具有不同的稳定性。例如,组蛋白mRNA在DNA合成阶段稳定,但当DNA合成被打断时即不稳定.一些纽蛋白的mRNA的3,末端似乎是形成这一蛄果的原闳(Pandey和Marzluff,1987),其没有显示出受ATTTA介导,同时也不清楚是什么在控制这段mRNA的不同的稳定性,另一个例子是在B细胞成熟的93过程中,IgG的mRNA在B淋巴细胞中稳定性不同(Genovese和Milcarek,1988).最后一个例子是一种突变的P-thallesemic+球蛋白mRNA的不稳定性,在骨髓细胞中,其中这种基因正常表达,突变的mRNA不稳定,而野生型的mRNA稳定.当在体外突变基因在HeLa或L细胞中表达时,突变的mRNA不显示不稳定性(Lim等,1988)。这些例子均提供了证据,即mRNA的稳定性可以受细胞类型或细胞周期特定因素的调节。此外,这种类型的不稳定性不与特定的序列相关.假如存在这些不确定性,就不可能预测在一种特定的细胞中哪些RNA可能不稳定,另外,甚至ATTTA基序也可能依赖于RNA所表达的细胞的本性而作用不同,Shaw和Kamen(1987)已经报道蛋白激酶C的活化可以阻断由ATTTA介导的降解.多聚腺苷酸链加入到3'末端在植物和动物的绝大多数真核mRNA中都是普遍的。目前所接受的关于多聚A加入的观点是初期转录的延伸越过了成熟的3'末端。包含在这一转录中的是关于多聚腺苷酰作用和正确的3,末端信息的信号。这种在3,末端的加工包括裂解mRNA和在成熟的3'末端加入多聚A。通过寻找植物及动物mRNA中多聚A区域附近的共有序列,已经有可能确定明显参与多聚A加入及3,末端切除的共有序列。同一种共有序列似乎对这两种过程都很重要.这些信号典型是序列AATAAA的变体.在动物细胞中,这段序列的一些变体已经被确定是有功能的;在植物细胞中,似乎存在范围扩大的功能序列(Wickens和Stephenson,1984;Dean等,1986)*由于所有这些共有序列均为AATAAA的变体,因此它们都为富含A+T的序列。在成熟的mRNA中,发现这段序列代表性地是位于多聚A区域之前的15到20个碱基.对动物细胞的研究显示这段序列参与多聚A的加入以及3,端的成熟。在这段序列中的位点定向诱变可以破坏这些功能。(Conway和Wickens,1988:Wickens等,1987),然而,同时也观察到推定的多聚A信号的3'端上游一直到50到100个碱基的序列也是必需的;即,一个基因含有正常的AATAAA,但具有被取代或被破坏的下游序列,该基因没有得到正确的多聚腺苷酸(Gil和Proudfoot,1984;Sadofsky和Alwine,1984;McDevitt等,1984).简而言之,多聚A信号本身对于完整和恰当的加工不是足够的。然而尚不知道除多聚A信号之外,还有什么特殊的下游序列是必需的,或者是否存在具有这种功能的特殊序列.因此,序列分析只能鉴定潜在的多聚A信号.在正常多聚腺苷酸化的天然存在的mRNA中,已经观察到这一过程的瓦解(通过改变多聚A信号或mRNA中其它的序列)在功能mRNA水平上可以观察到深刻的影响.这一现象已经在几种天然存在的mRNA中发现,其结果到目前为止是基因特异性的,已经显示在天然的mRNA中,正确的多聚腺苷酰作用在mRNA积聚中很重要,这一过程的瓦解可以明显影响mRNA水平。然而,对于预测正常基因改变的影响的知识存在不足.在异源基因中,预测该结果甚至更为困难。然而,可能存在所筌定的推定位点是功能紊乱的.简而言之,这些位点可能无法作为正常多聚A位点发挥作用,但是可替代为引起不稳定的mRNA的变体位点发挥功能。在动物细胞系统中,AATAAA是mRNA中多聚A上游所筌定出的最为普遍的信号,但至少也已经发现了四种变体(Wickens和Stephenson,1984).在植物中,几乎没有进行如此多的分析,但清楚的是可以使用类似于AATAAA的多聚序列。表5中所称的主要或次要的植物位点仅指Dean等(1986)的研究,其仅分析了三种类型的植物基因.指定多聚腺苷跣作用位点为主要的或次要的,仅仅是指它们在天然存在并且已经分析过的基因中作为功能位点所出现的频率。对于植物而言,这是一个十分有限的数据库.很难带有任何肯定性地预测当发现其在异源基因(如编码本发明中的晶体蛋白的基因)中时,所指定为主要或次要的位点将可能或多或少地部分或完全地发挥作用。表5植物基因中多聚腺苷酰化作用位点PAAATAAA主要的共有位点PIAP2AP3AP4AP5AP6AP7AP8AP9AAATAATAACCAAATATAAAATCAAATACTAATAAAAATGAAAAAGCATATTAAT主要的植物位点次要的植物位点P10AATACAT"P11AAAAATA',P12AATTAAA次要的动物位点P13AAATTAA',P14AAATACA"P15ACATAAA"本发明提供了制备人造植物基因的方法,这些基因表达其蛋白产物的水平明显高于野生型基因,迄今为止这些基因通常包括在植物转化中,在另一方面,本发明也提供了编码非植物蛋白的异常人造植物基因,如以上所描述的,天然苏云金芽胞杆菌基因在植物中的表达是存在问题的,如同许多其它在植物中表达的异源基因一样,苏云金芽胞杆菌基因编码序列的本性将其与植物基因区别开来.特别地,苏云金芽胞杆菌基因富含很多(~62%)的腺噤呤(A)和胸腺嘧啶(T),而植物基因和大多数已经在植物中表达的其它细菌的基因含A+T大约为45-55%,由于遗传密码的退化和密码子对任何氨基酸选择的数目有限,在一些杆状菌种中,发现结构编码序列上大多数的"多余"A+T位于密码子的第三位上.简而言之,一些杆状菌种的基因在许多密码子上以A或T作为第三位的核苷.因此,A+T的含量可以部分决定密码子选择的偏好.另外,很明显,基因在它们所进化的有机体中向最大功能进化.这意味着从一种有机体的某一基因中所发现的独特的核普序列(其中它们除了编码一段独特延伸的氨基酸外可能不起作用)在另一种有机体中具有被认作基因控制元件的可能性(如转录起始子或终止子、多聚A附加位点、内含子接合位点、或特异性mRNA降解信号)。可能会令人惊奇的是这种读错的信号不是异源基因表达的一个更位普遍的特征,但是它可以部分通过"^牛多有机体中相对同源的A+T的含量(~50%)来解释.该A+T的含量以及遗传密码的本性明显限制了任何独特的低聚核苷酸序列出现的可能性.因此,来源于大肠杆菌、A+T含量为50%的基罔与来源于苏云金芽胞杆菌的基罔相比,其含有任何独特的富含A+T的片段的可能性更小.典型地,为获得S-内毒素基因在植物中高水平的表达,将编码S-内毒素的现有的结构编码序列("结构基因")进行修饰,该修饰是通过对含有结构基因的DNA进行位点定向突变以除去ATTTA序列和推定的多腺苷酸化信号.最为优选的是实质上所有的多腺苷酸化信号和ATTTA序列均被除去,虽然仅部分除去以上所确定的序列中的一种将观察到表达水平增强,可选择地,如果是制备编码主体蛋白表达的人造基因,选择密码子要避免ATTTA序列和推定的多聚腺香跣作用位点.对于本发明来说,推定的多腺苷酸化信号包括(但不是必需局限于)AATAAA、AATAAT、AACCAA、ATATAA、AATCAA、ATACTA、ATAAAA、ATGAAA、AAGCAT、ATTAAT、ATACAT、AAAATA、ATTAAA、AATTAA、AATACA和CATAAA。在取代ATTTA序列和多腺苷酸化信号时,优先选用的密码子须避免很少在植物基因组中发现的密码子,篩选所选择的DNA序列以筌定含有大于四个连续的腺噤呤(A)或胸腺嘧啶(T)核苷的区域。筛选A+T区域以寻找潜在的植物多腺苷酸化信号.虽然缺乏五个或更多的连续的A或T核苷会排除大多数的植物多腺苷酸化信号,但是如果在彼此相距十个核苷以内含有一个以上已确定的次要的多腺苷酸化信号,则优选的是改变这段区域的核苷序列以除去这些信号,同时保持最初所编码的氨基酸序列。第二步是考虑围绕在步骤一中已经确定的富含A+T的区域中的约15至约30左右的核苷残基。如果周围区域的A+T的含量低于80W,须在该区域检测多腺苷酸化信号的存在。基于多腺苷酸化信号,该区域的改变依赖于(l)存在的多腺苷酸化信号的数目以及(2)主要的植物多腺苷酸化信号的存在,检测延伸区域中植物多腺苷酸化信号的存在。通过对DNA序列的位点定向突变除去多腺苷酸化信号.也检测延伸区域中多拷贝的ATTTA序列的存在,该序列也被突变除去.同样优选的是瓦解含有许多连续的A+T碱基或G+C碱基的区域,因为预测这些区域由于自身配对而有较高的可能性形成发夹结构。因此,插入异源的碱基对将降低自身配对的二级结构形成的可能性,已知该信息在一些有机体中可以抑制转录和/或翻译。在大多数情况下,可以通过使用不含超过五个连续的A+T或G+C的序列来将不利效应降至最小。4.11.5用于突变的人造低聚核苷酸当低聚核苷酸用于突变时,理想的是维持正确的氨基酸序列和阅读框,没有在修饰过的基因中引入通常的限制酶切位点如BglII、HindIII、Sacl、Kpnl、EcoRI、Ncol、Pstl和SalI。这些限制酶切位点在许多克隆栽体的多接头插入位点中有发现.当然,应该也要避免引入新的多腺苷酸化信号(ATTTA序列或连续的超过五个的A+T或G+C伸展片段)。低聚核苷酸优选的大小是约40到50个碱基对,但已经使用的片段变化为约18到约100个碱基,在大多数情况下,维持合成片段两端最小约5到约8个碱基对与模板DNA同源,以确保引物与模板的正确杂交。低聚核苷酸需要避免长于五个碱基对A+T或G+C的序列,用于取代野生型密码子的密码子无论在何种可能性下,优选地应该避免TA或CG偶对.从一种植物优选的密码子表格(如以下表6)中选择密码子,以避免很少在植物基因组中发现的、密码子,须尽力选择密码子以优先调整其G+C含量为约50%。表6植物中优选的密码子的使用氨基酸密码子在植物中使用的百分比ARGCGA7CGC11CGG5CGU25AGA29AGG23LEUCUA8CUC20CUG10醒28画5艦30SERUCA14UCC26UCG3UCU21AGC21AGU15THRACA21ACC41ACG7ACU31PROCCA45CCC19CCG9ecu26ALAGCA23GCC32GCG3GCU41GLYGGA32GGC20GGG11GGU37ILEAUA12AUC45AUU43VALGUA9GUC20GUG28GUU43LYSAAA36AAG64ASNAAC72AAU28GLNCAA64CAG36HISCAC65CAU35GLUGAA48GAG52ASPGAC48GAU52TYRUAC68腳32CYSUGC78腳22PHEuuc56腳44METAUG100TRPUGG100含有许多连续的A+T碱基或G+C碱基的区域由于自身互补,因而预测其具有较高的可能性形成发夹结构,优选的是通过插入异源碱基对以瓦解这些区域,这些区域的瓦解将降低形成自身互补的二级结构(如发夹结构)的可能性,在一些有机体中,已知发夹结构能够阻断转录(转录终止子)和翻译(衰减子),可选择地,可以制备编码一段给定的氨基酸序列的完整的合成基因,同时避免五个或更多的连续的A+T或G+C核苷的区域,只要可能时,选择密码子以避免密码子中TA和CG的双联.根据植物优选的密码子使用表格(如表6)和优先调整到约5(^G+C含量,可以将密码子的使用标准化。须对所得到的序列进行检查以确保推定的植物多腺苷酸化信号和ATTTA序列为最小限度.在通常使用的克隆栽体中发现的限制位点也是须优选避免的.然而,在基因各处配置几个独立的限制位点对于分析基因表达或构建基因变体是有用的。4.11.6"植物化"基因的构建存在于双链DNA形式中的植物基因的表达包括信使RNA(mRNA)从DNA的一条链中通过核糖核苷聚合酶进行转录,以及后来的在核内mRNA初步转录的加工,这种加工包括一段3,端的非翻译区将多聚腺苷酸核苷加入到RNA的3'末端,从DNA到mRNA的转录受一段通常称之"启动子"的DNA区域调节'该启动子区域含有一段序列的碱基,该序列向核糖核酸聚合酶提供信号,使其与DNA结合及利用DNA的一条链作为模板起始mRNA的转录以得到相应的RNA链.在文献中已经描述出许多在植物细胞中活跃的启动子。这些包括胭脂碱合酶(nopalinesynthase,NOS)和章鱼减合酶(octopinesynthase,0CS)启动子(它们由诱导肿瘤的根癌农杆菌的质粒携带)、花椰菜花叶病毒(CauliflowerMosaicVirus,CAMV)19S和35S启动子、来源于核酮糖二磷酸盐羧基酶(ssRUBISCO,一种十分丰富的植物多肽)小亚基的启动子以及mannopine'合..酶(MAS)的启动子(Velten等,1984及Velten核Schell,1985).所有这些启动子已被用于建造已经在植物中表达的不同类型的DNA构造物(见例如,国际专利申请出版编号W084/02913).已知或已发现可以在植物细胞中引起RNA转录的启动子可以用于本发明中.这种启动子可以从植物或植物病毒中获取,其包括但不局限于CaMV35S启动子及独立于植物基因(如ssRUBISCO基因)的启动子.如以下所描述的,优选的是所选择的特定的启动子应该能够引起充分表达以导致产生有效数量的蛋白质.如果需要的话,可以对用于本发明的DNA构建物(也就是嵌合植物基因)中的启动子进行修饰,以影响它们的控制特性.例如,CaMV35S启动子可以连接到ssRUBISCO基因部分,它在缺乏光线时可抑制ssRUBISCO的表达,从而构建了一种在叶部活跃但在根部不活跃的启动子.所得到的嵌合启动子可以依据本说明书中所描述的进行使用。为了这一描迷,短语"CaMV35S"启动子因此包括CaMV35S启动子的变体,例如,通过与操纵子区域连接、随机或控制地诱变等得到的启动子.此外,可以改变启动子使其含有多个"增强子序列"以辅助提高基因表达,通过本发明中的一段DNA构建物产生的RNA也含有一段5,端非翻译前导序列。这段序列可以来源于选作表达基因的启动子,而且可以经过特定修饰以提高mRNA的翻译.该5,端非翻译区域也可以从病毒的RNA中、从合适的真核基因中、或者从一段合成的基罔序列中获得。本发明并不局限以下实施例中所出现的构造物.相反地,对于病毒的衣壳蛋白,非翻译前导序列可以是编码序列的非翻译区的5,末端的一部分、或者是启动子序列的一部分、或者可以来源于一段不相关的启动子或编码序列.在任何情况下,优选的是位于起始位点旁側的序列与Kozak(1984)所报道的增强的翻译起始的翻译共有序列规则一致。本发明中的cryDNA的构造物可能也含有一个或多个经修饰的或完全合成的结构编码序列,已经对该结构进行了修改以增强cry基因在植物中的表现。本发明中的结构基因可以选择性地编码一种含有一段氨基末端叶绿体转运肽或分泌信号序列的融合蛋白。该DNA构建物也含有一段3'端非翻译区。该3'端非翻译区含有多腺苷酸化信号,该信号在植物中发挥作用以引起多聚腺苷酸核苷加入到病毒RNA的3'末端.合适的3'区域的例子是(1)3'端已转录、非翻译区含有土壤杆菌属肿瘤诱导(Ti)质粒多腺苷酸化信号的基因,如胭脂碱合成酶(NOS)基因,以及(2)类似于大豆储存蛋白(7S)基因和RUBP碳酸酵素(E9)小亚基基因的植物基因。4.12用于生产抗虫转基因植物的方法通过用含有重组的cry+基因的片段转化一种合适的宿主细胞,如植物细胞,所编码的晶体蛋白(也就是,具有抗鞘翅类昆虫的杀虫活性的一种细菌的晶体蛋白或多肽)的表达可以导致抗虫植物的形成。作为实施例,可以利用一种含有苏云金芽胞杆菌晶体蛋白的编码区的表达栽体和一种适当的可选标记来转化胚胎植物细胞(如小麦或谷类细胞)的悬浮物,使用的方法如微粒轰击法(Maddock等,1991;Vasil等,1992),目的是将包裹在微发射粒中的DNA呈递到易感细胞内。转基因植物即从表达杀虫蛋白的已转化的胚胎愈伤组织中再生出来'转基因植物的形成也可以通过其它细胞转化的方法来完成,这些方法在诸如土壤杆菌介导的DNA转移(Fraley等,1983)的技术中已知.可选择的,将DNA引入植物中可以通过直接将DNA转入花粉中(Zhou等,1983;Hess,1987;Luo等,1988)、通过将DNA注射入一种植物的生殖器官(Pena等,1987)、或者通过直接将DNA注射到未成熟胚胎的细胞中,接着再水合干燥的胚胎(Neuhaus等,1987;Benbrook等,1986),从单一的植物原生质体转化物或者从各种已转化的外植体中再生、发育和培养植物在技术上是熟知的(Weissbach和Weissbach,1988)。这种再生和生长的过程代表性地包括的步骤为挑选已转化的细胞、培养这些个体细胞完成贯穿有根幼苗阶段的胚胎发育通常的各阶段.转基因胚胎和种子的再生类似.然后将所得到的转基因有根的幼芽种入一种合适的植物生长培养基中,如土壤.将外来的、双子叶植物中编码所感兴趣的多肽的基因从叶片外植体中通过土壤杆菌引入到植物中,含有该基因的植物的发育或再生可以通过如所描述的(Horsch等,1985)技术上熟知的方法来完成。在这一过程中,转化体的培养是在一种选择试剂的存在下,在一种诱导植抹中的芽再生的培养基中培养,该植抹已经通过所描述的方法被转化(Fraley等,1983)。这一操作代表性地是在2到4个月内即生出芽,然后将这些芽转到一种合适的根诱导的培养基中,该培养基包括一种选择性的试剂和一种抗细菌生长的抗生素,然后将在该选择性试剂的存在下已生根并将形成幼苗的芽移植到土壤或其它培养基中,以允许根的产生。这些操作依赖于所使用的特定植抹的不同而不同,这种变化在技术上是熟知的,优选地,如以前所讨论的,再生的植物是自花授粉以提供纯合的转基因植物,另外,从再生植物中得到的花粉与农业经济上重要的种子生长的植物异种交配,优选的是近交系.相反地,从那些重要抹系的植物中得到的花粉被用于对再生植物进行授粉,对于本发明中含有一种理想的多肽的转基因植物,其培养方法是在对本技术熟练的人员所熟知的。这种植物可以形成生殖细胞及将所转化的性状传给子代,同样地,转基因植物可以以正常方式生长以及与具有相同的转化遗传因子或其它遗传因子的植物异种交配.所得到的杂交个体具有相应的表型。因此本发明中的异种转基因植物含有数目增加的编码区(如一种突变的cry基因),该区域编码感兴趣的突变的Cry多肽。一种优选的转基因植物是一种独立的隔离体,可以将该基因合其活性传递给子代。一种更为优选的转基因植物是该基因的纯合子,在有性繁殖过程中将该基因传递给其所有的子代.从一种转基因植物中得到的种子可以在田地或温室中生长,所得到的性成熟的转基因植物进行自花授粉,以产生真正繁殖的植物.这些植物的子代变为真正的繁殖抹系,通过实施例,估计它们在一定范围的环境条件下的抗鞘翅目昆虫的杀虫能力增强.发明者们预计本发明在商业上感兴趣的转基因植物的发明中将发现特别的用途,包括各种草类、谷类、纤维、块茎、豆类、装饰植物、仙人掌、多汁植物、水果、草莓和蔬菜,以及许多具有坚果和水果的树木和植物.4.13用于生产重组Cry3丰变体的方法在一个或多个结构域含有取代物的晶体蛋白突变体可以通过许多技术构建.例如,使用Stem迈er(1994)所描述的基于PCR"^的技术,很容易蒙混一系列高度相关的基因。可逸择地,如果存在合适的限制位点,一种cry基因的突变体可以与第二种cry基因的突变体通过常规的亚克隆方法结合.如果不存在合适的限制位点,可以通过低聚核苷酸定向突变来产生突变体,该突变使用的是许多对于本技术熟练的人员了解的方法.可选择的,可以应用接合重叠+延伸PCR加(Horton等,1989)来连接一种晶体蛋白不同区域的突变体。在这一过程中,通过PCR"^产生并且在其单一序列内含有不同突变的重叠DNA片段可以被退火并且作为扩增的模板,扩增使用附近的引物,以产生一段杂合的基因序列.最后,cry丰突变体可以简单地通过使用一种cry突变体作为低聚核苷酸定向突变的模板来连接,该突变使用了许多如本说明书中所描述的协议.4.14分离同源基罔和基因片段依照本发明的基因和S-内毒素不仅包括本说明书中所公布的全长序列,而且包括这些序列的片段、或融合蛋白,它们保留了此处特定例证的序列的特征杀虫活性.对于本技术熟练的人员应该很明显的是杀虫的S-内毒素可以通过几种方式筌定和获得。它们的特定基因或片段可以从培养罐中获得,或者合成构建,例如,通过使用一种基因仪器.使用标准的制造点突变的技术可以很容易地构建这些基因的变体。而且,这些基因的片段可以通过使用商业上可提供的核酸外切酶或核酸内切酶,依据常规的程序制得.举例来说,可以利用如Bal31的酶或定向位点诱变从这些基因的末端有条理地切掉核苷,而且,编码活性片段的基闳可以通过使用许多种其它的限制酶来获得。可以使用蛋白酶直接获得这些S-内毒素的活性片段.使用本说明书中提供的讲授,也可以将等价的5-内毒素和/或编码这些等价5-内毒素的基因从杆菌抹系和/或DNA文库中分离出来.例如,此处所公布并要求的抗8-内毒素的抗体可以被用来从蛋白的混合物中鉴定并分离其它S-内毒素,特定的,所出现的抗体可以是抗S-内毒素中最恒定和与其它苏云金芽胞杆菌S-内毒素最不同的那一部分8-内毒素。然后通过免疫沉淀、酶联免疫吸附测定(ELISA)、或Western印迹,可以将这些抗体用于特定地鉴定具有特征杀虫活性的等价s-内毒素。鉴定本发明中的5-内毒素和基罔的的另一种方法是通过使用低聚核苷酸探针,这些探针是含有一种可测标志的核香序列.如技术上所熟知的,如果探针分子和核普酸样品通过在两个分子间形成强键而产生杂交,可以合理地假定该探针和样品本质上是等同的.探针的可测标志提供了在已知方式上确定杂交是否发生的方法.这种探针分析提供了鉴定本发明的杀蚁剂S-内毒素基因的快速方法,作为依据本发明的探针的核苷片段可以通过使用DNA合成仪,采用常规的程序合成.在使用核苷片段作为探针时,用对本技术熟练的人员已知的任何合适的标志来标记特定的探针,包括放射性的和非放射性的探针,典型的放射性探针包括32P、125I、35S、或其类似物。用放射性同位素标记的探针可以从一段与DNA样品互补的核苷序列中通过常规的切口平移反应来构建,使用了一种DNA酶和DNA聚合酶.然后可将探针和样品在杂交緩冲液中结合,并在适当的温度下保存直到退火发生。此后,在无外来物质的条件下清洗薄膜,留下样品和其接合的探针,其检测和定量代表性地是通过放射自显影术和液体闪烁计数,非放射性标记包括,例如,配基(如生物素或甲状腺素)、以及酶(如水解酶或过氧化物酶)、或者是各种化学发光素(如荧光素)、或者是类似于荧光素和其衍生物的荧光混合物.为了便于分离,也可以在探针的两端作不同类型的标记,就像,例如,在以上提及的一端使用同位素标记,在另一端用生物素标记。双螺旋形成和稳定性依赖于杂交物两条链之间的本质互补,而且,如以上所注释的,可以允许一定程度的错配.因此,本发明中的探针包括突变(单个及多个)、删除、插入所描述的序列、以及它们的组合,其中上述突变、插入和删除允许含有所感兴趣的目标多聚核普酸的稳定杂交物的形成。可以通过目前普通熟练的技工已知的方法,以及通过其他在将来可能会被了解的方法,以在许多方面在一段给定的多聚核苷酸序列上产生突变、插入和删除。所列出的探针上潜在的变体部分是由于遗传密码的冗余.由于遗传密码的冗余,也就是,不止一种的核普三联体(密码子)可以用于用作形成蛋白质的大多数氨基酸。因而不同的核普序列可以编码一种特定的氨基酸。因此,苏云金芽胞杆菌5-内毒素和多肽的氨基酸序列可以通过等价核苷序列来制备,该序列编码蛋白质或肽相同的氨基酸序列,因此,本发明包括这种等价的核苷序列。并且,反向或互补的序列是本发明的一方面,它们很容易被对本技术熟练的人员所应用。另外,已经显示已鉴定结构和功能的蛋白质可以通过改变氨基酸序列来构建,如果这种变化不改变蛋白质的二级结构(Kaiser和Kezdy,1984)。因此,本发明包括此处所描述的氨基酸序列的变体,它们不改变蛋白质的二级结构,或者如果结构被改变,其生物活性在本质上保持不变。此外,本发明也包括生物体的突变体,它们容宿有本发明中编码一种全部或部分S-内毒素的基因。这些突变体可以通过对本技术熟练的人员熟知的技术来进行制备。例如,可以利用紫外辐射来制备宿主有机体的突变体。同样地,这些突变体可以包括不产孢子的宿主细胞,该细胞也可以通过技术上熟知的程序来制备。4.15核糖酶核糖酶是具酶促活性的RNA分子,它裂解特殊种类的mRNA.在特定的实施例中,发明者们期待挑选和利用可以裂解本发明中的RNA片段的核糖酶,以及在特定的细胞类型或组织中将它们用于降低目标mRNA的活性。自然产生的核糖酶RNA的六种变体在目前是已知的,在生理条件下,每种均可催化RNA反式磷酸二醋键的水解(以及因此可以裂解其他RNA分子)。通常,核酸酶的作用首先是通过结合目标RNA。这种结合的发生是经过一种核酸酶的目标结合片段,该片段保持接近分子中作为裂解目标RNA的酶片段.闳此,核酸酶首先识别,然后通过互补的碱基对与靶RNA结合,一旦结合到正确的位点上即开始作为酶起作用切断靶RNA。在战略上裂解这种靶RNA将会破坏其直接合成编码蛋白质的能力,在核酸酶结合并裂解其目标RNA之后,它即从该RNA上释放下来以寻找另一个目标,它可以重复地结合和裂解新的目标.由于必然会影响治疗的核糖酶的浓度低于反义低聚核苷酸的浓度,故核糖酶的酶本性在许多技术上都是有利的,如反义技术(其中一种核酸酶分子简单地结合到核酸目标上以阻断其翻译).这一优点反映在核糖酶的酶作用上.因此,一个单一的核糖酶分子可以裂解目标RNA的许多分子.另外,核糖酶是一种高度特异的抑制剂,其抑制的特异性不仅依赖于碱基对结合目标RNA的机制,而且依赖于目标RNA裂解的机制.靠近裂解位点的单一错配或碱基替换可以彻底消除核糖酶的催化活性。在反义分子中的类似错配不会阻碍其作用(Woolf等,1992)。因此,一种核糖酶作用的特异性大于结合在相同的RNA位点上的翻译低聚核苷酸的作用的特异性.核酸酶分子可以在一种锤头、发夹、一种肝炎S病毒、内含子组I或RNA酶PRNA(伴随着一段RNA辅助序列)或链孢菌VSRNA基序中形成。锤头基序的例子如Rossi等(1992)所描述;发夹基序的例子如Hampel等(欧洲专禾,jEP0360257)、Hampel和Tritz(1989),Hampel等(1990)和Cech等(美国专利5,631,359)所描述;肝炎S病毒基序的例子如Perrotta和Been(1992)所描述;一种RNA酶P基序的例子如Guerrier-Takada等(1983)所描述;链孢菌VSRNA核糖酶基序如Collins(Saville和Collins,1990;Saville和Collins,1991:Collins和Olive,1993)所描迷;一种内含子组I的例子如Cech等(美国专利4,987,071)所描述.在本发明的核酸分子中,所有重要的是它具有特异的底物结合位点,该位点与一个或多个目标基因RNA区域互补,以及它在底物结合位点内部或周围有核苷序列,该序列将RNA的裂解活性传递给该分子.因此核糖酶的构建不需要局限在本说明书中所提及的特定基序中.本发明提供了产生一族酶裂解试剂的方法,这些试剂对所希望的目标呈现出高度的特异性.核酸酶分子优选的是用来瞄准靶mRNA的一段高度保守的序列区域,以至疾病或状况的特殊治疗可以配备一种或几种核酸酶.这种核酸酶分子可以如要求向外传送到特定的细胞.可选择的,核糖酶可以从被传递到特定细胞的DNA或RNA载体中表达.小核酸酶基序(如,锤头或发夹结构)可以被用于向外传递。这些分析的简单的结构增加了核酸酶侵入mRNA结构中靶区域的能力.可选择的,催化的RNA分子可以在细胞内从真核启动子中表达(如,Scanlon等;1991,Kashani-Sabet等,1992:Dropulic等,1992;Weerasinghe等,1991;Oj碰g等,1992;Chen等,1992;Sarver等,1990).对本技术熟练的人员了解任何核糖酶均可以在真核细胞内从适当的DNA栽体中表达.这种核糖酶的活性可以通过借助于另一种核糖酶使其从初级转录中释放下来以达到增强(Draper等,国际专利申请出版No.W093/23569,和Sullivan等,国际专利申请出版No.Wo94/02595,二者的全体均作为参照结合在本说明书中;Ohkawa等,1992;Taira等,1991:Ventura等,1993),核糖酶可以直接加入,或者可以与阳离子脂类、脂类复合物结合、包装在脂质体中,或者以其他的方式传递到靶细胞。该RNA或RNA复合物来自体内,或在体内可以局部施用于相关组织,或者在体内通过注射、气溶胶吸入、注入泵或支架,它们结合或不结合在生物高聚物中。核糖酶可以如Draper等(国际专利申请出版No.W093/23569)或者如Sullivan等(国际专利申请出版No.W094/02595)所述进行设计,以及如所描述的,合成以在体外和体内进行测试.这种核糖酶也可以被优化以进行传递.当提供了特定的例子时,本
技术领域
的人员将认识到如果需要可以使用其他物种中等价的目标RNA.锤头或发夹核糖酶可以通过电脑折叠单独进行分析(Jaeger等,1989),以估定核糖酶的序列是否折叠成正确的二级结构.将在结合臂和催化中心之间具有不利的分子内相互作用的核糖酶排除考虑范闺之外.可以选择不同的结合臂的长度以优化活性。通常,每条臂至少5个碱基才能够与目标RNA结合、或者相互作用。可以设计锤头或发夹基序的核糖酶在mRNA信息的不同位点退火,也可以通过化学方法进行合成.用于合成的方法遵循的是Usman等(1987)和Scaringe等(1990)所描述的常规RNA合成的程序,利用了普通的核苷酸保护和耦合组群,如在5'末端为二甲氧基三苯甲基(dimethoxytrityl),在3,末端为phosphoramidites,平均每步的耦合产量代表性地>98%。发夹核糖酶可以在两步内合成并可以退火重建一种有活性的核糖酶(Chowrira和Burke,1992).可以对核糖酶进行广泛的修饰以增强其稳定性,其修饰是通过抗核酸酶的组群,例如,2,-氨基、2'-C-埽丙基、2,-氟、2,-o-甲基、2'-H(为了回顾,见Usman和Cedergren,1992),核糖酶可以通过凝胶电泳采用普通的方法进行纯化,或者通过高压液相层析及在水中重悬.核糖酶的活性可以通过改变核糖酶结合臂的长度进行优化、或者通过化学*合成经过修饰可以阻止其被血清核糖核酸酶降解的核糖酶(见例如,国际专利申请出版No.WO92/07065;Perrault等,1990;Pieken等,1991;Usman和Cedergren,1992;国际专利申请出版No.W093/15187;国际专利申请出版No.WO91/03162;欧洲专利申请出版No.92110298.4;美国专利5,334,711:以及国际专利申请出版No.W094/13688,它们描述了在酶RNA分子的糖基部分所进行的不同的化学修饰)、增强它们在细胞内功效的修饰、以及除去茎区II的碱基以截短RNA合成的时间及降低化学要求。Sullivan等(国际专利申请出版No.WO94/02595)描述了传递酶RNA分子的常规方法。核糖酶可以通过许多对于本技术熟悉的人员所了解的方法施用到细胞中,包括但不局限于,包装在脂质体中、通过离子电渗疗法、或者通过与其它徵粒结合,如水凝胶、环糊精、生物可分解的微胶嚢和生体附着性小球体.在一些例子中,核糖酶在体外,可以在有或没有上述微粒的情况下直接传递到细胞或阻止中。可选择的,该RNA/微粒复合体可以局部传递,通过直接吸入、通过直接注射、或者通过使用一种导管、注入泵或支架。其他传递的途径包括但不局限于血管内、肌肉内、皮下或结合注射、气溶胶吸如、口服(药片或药丸形式)、局部、组织、眼部、腹膜内和/或膜内传递.关于核糖酶传递和施用更为详细的描述由Sullivan等(国际专利申请出版No.W094/02595)和Draper等(国际专利申请出版No.W09-3/23569)提供,它们已经作为参照结合在本说明书中。另一种在细胞内积累高浓度的核糖酶的方法是将编码核糖酶的序列结合到DNA表达载体上。核糖酶序列转录的驱动是从真核RNA聚合酶I(pol1)、RNA聚合酶II(pol11)、或RNA聚合酶III(polIII)的启动子开始。从polII或polIII启动子开始的转录将在所有细胞中以高水平表达;在一种给定的细胞类型中,一种给定的polII启动子的水平将依赖于位于附近的基因调控序列(增强子、沉默子等)的本性。也可以使用原核RNA聚合酶启动子,倘若该原核RNA聚合酶是在适当的细胞中表达(Elroy-Stein和Moss,1990;Gao和Huang,1993;Lieber等,1993;Zhou等,1990).从这些启动子开始表达的核糖酶可以在哺乳动物细胞中起作用(如Kashani-Saber等,1992;Ojvang等,1992:Chen等,1992;Yu等,1993;L,Huillier等,1992;Liszlewicz等,1993).为了引入到哺乳动物细胞中,可以将这种转录单元结合到许多栽体上,包括但不局限于,质粒DNA载体、病毒DNA栽体(如腺病毒或腺结合载体)、或病毒RNA载体(如逆转录酶病毒、塞姆利基森林病毒、辛德毕斯病毒栽体),本发明中的核糖酶可以用作诊断工具,检测细胞抹或细胞类型中的遗传漂变和突变.它们也可以用作估定目标RNA分子的水平,核糖酶活性与目标RNA结构之间的紧密关系使得可以在分子的任何区域检测突变,这些突变改变了目标RNA的碱基对和三级结构.通过使用本发明中所描述的多种核糖酶,人们可以绘制核苷的变化,它与在细胞和组织中一样,在体外对于RNA的结构和功能很重要,在特定的细胞或细胞类型中,用核糖酶裂解目标RNA可以被用来阻止基因表达和(本质上)限定特定基因产物的作用.5.0实施例以下包括的实施例是用来示范本发明中优选的具体例子.需要本技术的熟练人员理解是,以下实施例中所公布的技术代表了由发明者发现在本发明实践中发挥良好作用的技术,因此可以认为这些技术构成了其实践的优选模式.然而,依据当前所公布的,本技术的熟练人员需要理解在已公布的特定的具体例子中可以产生许多变化,而且没有离开本发明的精神和范闺并仍然得到相同或类似的结果。5.1实施例l一Cry3Bb的三维结构Cry3Bb的三维结构通过X-射线晶体学确定.Cry3Bb的结晶和X-射线衍射数据的收集是如Cody等(1992)所描述进行的,Cry3Bb的晶体结构使用所收集达到2.4A分辨率的数据,精确到残差R因子为18.0%.该晶体属于C222i空间群,晶胞参数为a=122.44、b=131.81、c=105.37A,不对称单位中含一个分子。Cry3Bb的原子坐标如实施例31所描述并列于第9节,Cry3Bb的结构类似于Cry3A的结构(Li等,1991),它包括来自588个残基(64-652位氨基酸)的5825个蛋白质原子,形成三个不连续的结构域(图1)。在Cry3Bb的结构中总共确定出251个水分子(图2).结构域l(64-294位残基)是由六个螺旋扭转围绕中心螺旋(a5)形成的一个七螺旋束(图5),形成每个螺旋的氨基酸列于固4.结构域2(295-502位残基)含有三个反平行的p-片层(图5A和图5B〉.片层1和2,各由4条p链组成,形成了独特的"Greekkey"基序。片层3的外表面由3条P链组成,与结构域l中的螺旋a7相互联系,困6列出了包含结构域2中每条P链的氨基酸,跟在p链l之后的一段小的a螺旋(a8)也包含在结构域2中.结构域3(503-652位残基)含有一个"冻胶辊"状的p-圆柱体,该圓柱体具有一个疏水中心并且几乎与晶格的a轴平行、与c轴垂直(图7A和闺7B).包括结构域3中每条p链的氨基酸列于图8。在晶体中Cry3Bb的单体沿着平行于a轴的二次轴形成了二聚的四维结构(图9A和图9B).螺旋a6位于结构域l和其对称相关分子的结构域1和3之间的接触面形成的裂口处,沿着该接触面有许多紧密的氢鍵相互作用,确保了该二聚体的结构稳定性。5.2实施例2—Cry3Bb.60的制备苏云金芽胞杆菌EG7231通过芽孢形成在C2培养基中生长,经氯霉素(Cml)选择.该培养物中的罔体物质通过离心和用水洗涤复原。毒素通过从4.0MNaBr中重结晶进行纯化(Cody等,1992)。将纯化过的Cry3Bb溶于10毫升50迈M的K0H/100毫克Cry3Bb,并用100mM的CAPS(pH9.O)緩冲至pH9.0,用胰乌素处理溶解的毒素,质量比为50毫克毒素比l毫克胰岛素.在胰岛素消化的20分钟以后,通过SDS-聚丙酰胺凝胶电泳(SDS-PAGE)见到的优势蛋白为60kDa,没有发现60kDa的毒素进一步被降解。闺4显示在SDS-PAGE之后经考马斯-染色的Cry3Bb和Cry3Bb.605.3实施例3—Cry3Bb.60的纯化和序列测定Cry3Bb.60通过SDS-PAGE进行电泳纯化,并在15V下持续30分钟通过半干氺传递以电印迹到Innnobilon-P(微孔过滤器)膜上。然后将薄膜用水冲洗两次并用O.025%R-250,40%的甲醇染色.,为了降低背景,将印迹用50%的甲醇再次染色,直到可以看见被染色的蛋白条带。然后将印迹风干,将已染色的Cry3Bb.60条带从薄膜上剪下来.该条带被送至theTuftsUniversitySequencingLaboratory(Boston,MA)进行N-端序列分析。实验确定的N-末端的氨基酸序列如表7所示,除了从160位氨基酸残基开始的已知的氨基酸序列。表7Cry3Bb.60N-末端的氨基酸序列及其与已知的Cry3Bb序列的比较<table>tableseeoriginaldocumentpage112</column></row><table>5.4实施例4一Cry3Bb.60的生物学活性制备Cry3Bb用于生物筌定,鉴定是通过将其溶于极微量的50mMKOH、每IOml含100mg毒素,用100mMCAPS(pH9.0)緩冲至pH9.0,如实施例l中所描述的制备Cry3Bb.60。两种制备均在生物鉴定之前、在室温下保持12到16小时,七天之后测种群的死亡率,并对其进行分析以确定每种毒素的死亡百分比.结果用数据表示在表8中.表8Cry3Bb和Cry3Bb.60抗南部玉米食根虫(Diabioticaundecimpunctata)的生物学活性_<table>tableseeoriginaldocumentpage112</column></row><table>5.5实施例5—通过Cry3Bb和CryB2.60的离子通道形成在平面脂双层中估定Cry3Bb.60和Cry3Bb形成离子通道的能力.磷脂酰胆碱的双分子层的形成是在O.7毫米孔洞之上的Teflor^支持物上,在Tefloi^的分区任一侧放置3.5ml100mMKOH、10mMCaCl、100mMCAPS(pH9.5)的浸浴溶液,在分区的一側加入毒素,跨过磷脂酰胆碱双分子层加上60mM的电压。任何通过薄膜的离子渗出均可以被扩大和记录.对由Cry3Bb或Cry3Bb.60产生的电导频率的分析的图解在图5A和图5B中。Cry3Bb.60容易形成离子通道,而Cry3Bb很少形成通道.5.6实施例6—高分子量低聚物的形成个别的Cry3Bb或Cry3Bb.60的分子与另一种相似的分子形成一个复合物.Cry3Bb形成低聚物的能力是非显见地可重复性的.在非变性的条件下,不能重复观察到该复合物的形成.Cry3Bb.60与另一种Cry3Bb.60分子形成明显较大量的较高分子量的复合物(〉120kDa).Cry3Bb的低聚物通过考马斯-染色的SDS聚丙蜂酰胺凝胶的亮度进行确证.寡聚化作用在SDS-PAGE中可以见到,在上样之前不加热样品以保留一些非变性的毒素.这些数据暗示Cry3Bb,60相对于单独的Cry3Bb,更容易形成较有序的复合物.寡聚化作用也可以通过研究由这些分子产生的电导以及依赖于时间的电导的增加来观察到,这种在电导上的变化可以归因于毒素的寡聚化作用.5.7实施例7—设计方法l:蛋白酶敏感位点的妄定和变更以及蛋白水解步骒在文献中已经有报道用胰岛素(一种在可利用的赖氨酸和精氨酸残基的羧基端裂解蛋白质的酶)处理Cry3A毒素蛋白,从67kDa的天然蛋白中获得稳定的55kDa的裂解产物(Carroll等1989).该55kDa产物的N-末端序列分析显示裂解发生在氨基酸残基R158.据发现,该截短了的Cry3A蛋白保留了与天然蛋白相同水平的杀虫活性.Cry3Bb毒素蛋白也可以用胰烏素处理,消化之后,蛋白大小从68kDa(天然Cry3Bb毒素的分子量)降至60kDa。没有发现进一步的消化.N-末端序列分析解释胰岛素对截短了的毒素(Cry3Bb.60)的裂解位点为Cry3Bb中la3,4上的氨基酸R159。出乎意料的是,发现截短了的Cry3Bb毒素的生物活性有所增加'使用该方法,即用蛋白酶消化一种苏云金芽胞杆菌毒素蛋白,在Cry3Bb上筌定了一个蛋白水解的敏感位点,以及鉴定了该蛋白(Cry3Bb.60)的一种更有活性的形式.通过引入一个附加的蛋白水解的识别位点来对该蛋白水解敏感的位点进行修饰,结果也导致一种生物学上更有活性的蛋白质的分离.也有可能去掉其他的蛋白水解敏感位点可以提高活性,蛋白水解的敏感区域一旦被确定,则可以被修饰或用于产生生物学上更有活性的毒素.5.7.1Cry3Bb.60用胰岛素处理增溶的Cry3Bb毒素蛋白,结果导致分离出一种分子量为60kDa(Cry3Bb.60)的稳定的、截短了的Cry3Bb毒素蛋白。Cry3Bb.60的N-末端序列分析显示胰島素敏感位点为天然毒素的la3,4上的R159,胰岛素消化导致了螺旋l-3从天然Cry3Bb上除去,而且约为四倍地增加了毒素抗SCRW幼虫的活性.Cry3Bb.60是一种独特的毒素,其杀虫作用强于亲代Cry3Bb.杀虫活性的提高是判别它为一种新的毒素的唯一参数,餘了其大小的减少,Cry3Bb.60也是一种更可溶的蛋白。Cry3Bb在pH6.5时从溶液中沉淀出来,而Cry3Bb.60从pH4.5到pH12都保持在溶液中,并且Cry3Bb.60形成的离子通道比Cry3Bb具有更高的频率,Cry3Bb.60的产生是通过蛋白水解除去前159位氨基酸残基,或者是通过在体内产生这种毒素,通过细菌或植物表达Cry3Bb.60的基因,简而言之,不含有前483位核香的Cry3Bb基因,总之,Cry3Bb.60在几个重要的方面与Cry3Bb不同杀虫活性增强;可溶范围增大;形成通道的能力增强;以及大小降低.5.7.2EG11221在Cry3Bb的胰岛素敏感la3,4区域上的半随机诱变导致Cry3Bb.11221的分离,Cry3Bb.U221为一种设计的Cry3Bb蛋白,它于野生型相比,表现出提高超过六倍的抗SCRW幼虫的活性.Cry3Bb.11221在la3,4区域存在4个氨基酸的变化.其中一种变化,L158R,在邻近R159(用于产生Cry3Bb.60(实施例4.1.1)的蛋白水解敏感位点)引入了一个另外的胰岛素位点.Cry3Bb.11221由苏云金芽胞杆菌作为一种全长的毒素蛋白产生,但推测其被昆虫内脏的蛋白酶消化为与Cry3Bb.60相同的大小(见由Carroll等产生的Cry3A,1989)。附加的蛋白酶识别位点可以使la3,4区域对消化更为敏感,因此活性提高.5.8实施例--设计方法2:结合水的确定和搡作水分子与蛋白质结合的途径有凡种,包括容易被除去的表面水和更难提取出来的结合水(Dunitz,1994;Zhang和Matthews,1994)。结合水的功能已经成为重要学术推断的主题,但是精确的功能很少有实验确证,一些最引起关注的结合或结构水是从蛋白质本身内部参与蛋白结构的水。某一位点被一个水分子占据,可以预示蛋白质内部的一个稳定的穴或者是由水介导的盐桥和氢结合水产生的折叠松弛.它可以降低氨基酸之间的结合程度,可能使该区域更具柔性。围绕相同位点的一种不同氨基酸序列可以导致较好的折叠、围绕极面或带电氨基酸的穴的瓦解。这可以导致柔性的提高。因此,一种蛋白某一区域的水合程度可以决定该区域的柔性或流动性,对水合的操作可以改变柔性。提高暴露于水中的区域的水合作用的方法包括沿着其表面增加疏水残基的数目。文献中指出暴露的疏水残基相对于亲水残基需要明显较多的水(CRCHandbookofChemistryandPhysics,CRCPress,Inc.)。然而没有指出通过这样做,可以达到提高蛋白质的生物学活性.结构水以前在苏云金芽胞杆菌S-内毒素(包括Cry3Bb)中没有被筌定,此外,没有报道这种结构水在5-内毒素或细菌毒素中的功能,在对Cry3Bb的分析中,据观察收集到的水分子位于la3,4(一种由本发明者定义在提高生物活性中很重要的位点)周围。环a3,4区域是暴露的表面,它限定了蛋白质内的一个枢纽,容许结构域l上前三个螺旋的去除或运动.在该区域周闺发现的水合作用可以将柔性和流动性传给该环,对la3,4上结构水的观察提供了进一步结构分析的分析工具。如果这一重要的位点被水包闺,则其它重要的位点也会完全或部分被水包围.借此观察结果,则可以鉴定围绕螺旋5和6的结构水.这些结构水形成了一个穿过蛋白质的圆柱,有效地将螺旋5和6从分子的其它部分分隔开来.Cry3A和Cry3Bb的结构暗示螺旋5和6是紧密关联的,通过范德华力的相互作用连接在一起.单独的,来自Cry3A的螺旋5,虽然不足以具有生物活性,但它已经被证实在人造的薄膜上具有形成离子通道的能力(Gazit和Shai,1993).由螺旋5形成的离子通道小于全长毒素离子通道10倍,暗示着实际大小的离子通道需要明显较大的毒素结构。在Cry3Bb中,作为a螺旋(结构域l)簇的一部分的螺旋5已经被发现可形成离子通道(VonTersch等,1994)。由本发明者们进行的未发表的实验观察证实螺旋6也穿过了该生物膜.因此,螺旋5和6是推断中的对毒性必须的通道形成螺旋。围绕这些螺旋的水合作用可以预示该区域的柔性对于毒性的必需的。因此,可以想象如果有可能提高围绕螺旋5和6的水合作用,则可以产生较好的毒素蛋白。然而,必须注意的是,要避免在螺旋5-6和蛋白的任何其它部分之间产生连续的疏水表面,它可以,通过疏水相互作用,限制可变螺旋的运动。螺旋5和6的流动性可能也依赖于依附于它们的环的柔性,以及Cry3Bb分子的其它区域,尤其在结构域l,其可能经历结构上的变化以允许两个螺旋插入到膜上。改变该蛋白中这些区域的水合作用也可以影响它的生物活性,5.8.1Cry3Bb.11032结合水残基的集中显示出la3,4区域的相对柔性.该环柔性的提高可以通过提高该区域的水合作用,水合作用的提高是通过替换相关疏水残基为暴露的亲水残基.一种经改良设计、具有这种类型替换的蛋白质的例子是Cry3Bb.11032,Cry3Bb.11032具有氨基酸改变D165G;甘氨酸比天冬氨酸更具疏水性(Kyte和Doolittle疏水得分为-O.4比天冬氨酸-3.5)。Cry3Bb.U032的活性大约成倍地高于野生型Cry3Bb。5.8.2Cry3Bb.11051为了提高Cry3Bb中la4,5的水合作用,将甘氨酸替换暴露于表面的残基K189,甘氨酸比赖氨酸的疏水性更强性(Kyte和Doolittle疏水得分为-0.4比天冬氨酸-3.9),可以导致结合水的增加。结合水的增加可以将更高的柔性传给在通道形成螺旋(a5)之前的环区域。经设计具有K189G变化的Cry3Bb蛋白,Cry3Bb.11051,相对于野生型Cry3Bb表现出活性增加三倍。5.8.3变更为La7,卩l(Cry3Bb.11241以及11242)在暴露于表面的连接a螺旋7和p-链l的环(la7,pi)上进行氨基酸改变,结果导致筌定出2种被改变的、生物活性提高的Cry3Bb蛋白质,Cry3Bb.11241和Cry3Bb.11242.对这两种蛋白质中超过20个的氨基酸序列281-300(包含la7,pi区域)进行水性索引的分析,显示在这些蛋白质中的氨基酸替换使la7,pi区域更具疏水性。对每种蛋白的水性值(GRAVY)的总平均的确定是通过使用PC\GENE(intelligenetics,Inc.,MountainView,CA,版本6.85)序列分析计算机程序、SOAP、和一段7个氨基酸的问隔,SOAP程序是基于Kyte和Doolittle(1982)的方法.对每种蛋白la7,pi区域疏水性的提高可以提高环的水合作用以及,因此,柔性.被改变的蛋白质、它们各自的氨基酸变化、相对于野生型生物活性倍数的增加、以及GRAVY值均列于表9.表9Cry3Bb以及两个设计的SCRW生物学活性提高的Cry3Bb蛋白中La7,pi区域的水性值<table>tableseeoriginaldocumentpage117</column></row><table>5.8.4变更为tpi,ct8(Cry3Bb,11228、Cry3Bb.11229、Cry3Bb.11230、Cry3Bb.11233、Cry3Bb.11236、Cry3Bb.11237、Cry3Bb.11238以及Cry3Bb.11239)暴露于表面、在p-链l和a-链8之间的环(lpl,a8)定义为Cry3Bb中结构域1和2之间的分界.在该区域引入半随机的氨基酸变化,结果导致确定出几种生物活性提高的被改变的Cry3Bb蛋白。对在这些改变的蛋白内发现的氨基酸替换的水性索引分析显示,这些变化使暴露的区域更具疏水性,其可导致水合作用和柔性的增加.表10列出了被改变的蛋白质,它们各自的氨基酸改变和相对域野生型Cry3Bb的倍数增加,以及使用P(AGENE⑧(intelligenetics,Inc.,MountainView,CA,版本6.85)序列分析计算机程序、SOAP、超过20个氨基酸的序列305-324(包括ipi,a8)确定的水性值的总平均(GRAVY),使用了一段7个氨基酸的间隔。表10Cry3Bb和八个设计的SCRW生物学活性提高的Cry犯b+蛋白Lp,a8区域的水性值<table>complextableseeoriginaldocumentpage118</column></row><table>5.8.5Cry3Bb,11227、Cry3Bb.11241以及Cry3Bb.11242位于Cry3Bb螺旋6的氨基酸Q238,已经被确定为是一个通过其大尺寸和与R290的氢鍵连接来阻断螺旋6和螺旋4之间表面完全的水合作用的残基.用另一种氨基酸替换R290(该氨基酸不形成氢键或其所具有側链不能横越与Q238形成氬键的物理距离)可以导致Q238周围水合作用.Q238,不能与R290形成氢键,才可结合水.这可以增加通道形成区域的柔性.设计的蛋白质Cry3Bb.11227(R290N)、Cry3Bb.11241(R290L)和Cry3Bb.11242.(R290V)相对于野生型,抗SCRW幼虫的活性分别提高约2倍、2.6倍和2.5倍.5.9实施例9一设计方法3:流动性区域周围的氢鍵的搡作某一蛋白质具有活性可能需要其区域的流动性。ct5,6区域(Cry3Bb的推定通道形成区域)流动性的增加可以通过减少氢鍵的数目,包括盐桥(带有相反电荷的氨基酸側链之间的氢鍵)、螺旋5-6和分子或二聚物结构中的任何其它部分之间。这些氢鍵可以阻碍这两个螺旋的运动.减少氢键和盐桥的数目可以提高生物活性.为了避免在螺旋5-6和二聚物的任何其它部分之间产生连续的疏水表面,必须用疏水残基取代氢鍵结合的氨基酸.5.9.1Cry3Bb.11222和Cry3Bb.11223Tyr230位于螺旋6并且在Cry3Bb的四元二聚结构中,该氨基酸与来自邻近分子的Tyr230并列。正是由于这个氨基酸,在两个单体中的两个螺旋6之间形成了三个氢键.为了提高螺旋5-6(理论上可以插入膜内形成离子通道的螺旋)的柔性,通过改变该氨基酸以去掉横跨二聚体的氢键,观察到生物活性有相应的增加.设计的Cry3Bb蛋白,Cry3Bb.11222和Cry3Bb.EG11223相对于野生型,其SCRW活性的增加分别为4倍和2.8倍.5.9.2Cry3Bb.11051设计的Cry3Bb蛋白Cry3Bb.11051在结构域1的la4,5上有氨基酸变化K189G,在野生型的Cry3Bb结构中,K189暴露的側链与E123(位于la2b,3中)的暴露的側链的改变很靠近,足以形成氲鍵.用甘氨酸替换K189,如同在Cry3A的该位点所发现的,排除了在该位点形成氬键的可能性,形成了一种生物活性高于野生型Cry3Bb三倍的细胞.5.9.3Cry3Bb.11227、Cry3Bb.11241、以及Cry3Bb.11242位于Cry3Bb的螺旋6中的氨基酸238,已经被鉴定为是一种通过其大尺寸和与R239的氢键连接,从而阻断螺旋6和螺旋4之间空间的完全水合的残基.用另一种氨基酸替换R290(该氨基酸不形成氢键或其所具有側链不能横越与Q238形成氢鍵的物理距离)可以增加通道形成区域的柔性'设计的蛋白质Cry3Bb.11227(R290N)、Cry3Bb.11241(R290L)和Cry3Bb.11242.(R290V)相对于野生型,抗SCRW幼虫的活性分别提高约2倍、2.6倍和2.5倍,5.10实施例10—设计方法4:螺旋周围的环的分析及其设计某一蛋白质的环区可能涉及该蛋白的许多功能,包括但不局限于,通道形成、四级结构的形成和维持、以及受体结合.Cry3Bb是一种通道形成蛋白.s-内毒素的离子通道形成螺旋进入双分子层的有效性依赖于没有阻碍该过程的力.可能限制该过程的其中一种力是闺绕关键螺旋的环区中氨基酸側链的空间阻碍.文献中指出在至少一种另外的细菌毒素中,不是一种苏云金芽胞杆菌毒素,毒素分子打开,或者用科学术语来说,失去四级结构以暴露出膜活跃的区域(Cramer等,1990)。该文献没有讲述如何提高这一事件的可能性,而且不知道苏云金芽胞杆菌毒素是否利用相同的过程插入膜内.通过降低側链大小或改变其取向从而使相应的生物活性增加,以降低氨基酸側链在这些关键区域的空间阻碍是本发明的步骤。5.10.1在螺旋3和4之间的环的分析(Cry3Bb.11032)本发明者们已经发现结构域l的前三个螺旋可以通过蛋白水解消化螺旋cx3和a4之间的环,从该毒素的剩余部分被切除(Cry3Bb.60).最初尝试截短Cry3Bb基因以产生这种截短的、但更有活性的Cry3Bb分子,结果失敗.由于未知的原因,苏云金芽胞杆菌未能合成这种60kDa的分子。后来被解释为可能是结构域l的前三个螺旋不是必须被蛋白水解除掉,或者相当的,该蛋白不是必须以这种截短了的形式合成来运用Cry3Bb.60设计.据观察,蛋白Cry3A在lot3,4附近有一个小氨基酸,它可能传递较高的柔性给环区,从而允许结构域l的前三个螺旋让开,暴露出膜活性区域。通过设计一种在该环附近有一个甘氨酸残基的Cry3Bb分子,有可能减少该环中残基的空间阻碍.重新设计的蛋白,Cry3Bb.11032,具有氨基酸变化D165G,它用最小的氨基酸,甘氨酸(平均质量57.05)取代较大的天冬氨酸残基(平均质量115.09).Cry3Bb.11032的活性大约高于野生型蛋白的三倍.以这种方式,合理地重新设计螺旋cx3和a4之间的环,在生物活性上有相应的提高'5.10.2Cry3Bb.11051在Cry3Bb中连接螺旋a4和a5的环区必须具有柔性,这样通道形成螺旋a5-a6才可以插入膜内。注意的是Cry3A在该环的中间具有一个甘氨酸残基,它可以传递更高的柔性。在Cry3Bb中制造相应的变化K189G,结果得到的设计蛋白,Cry3Bb.11051,与野生型Cry3Bb相比,其抗SCRW幼虫的活性提高三倍.5.10.3p-链1和螺旋8之间的环的分析(Cry3Bb.11228、Cry3Bb.11229、Cry3Bb.11230、Cry3Bb.11232、Cry3Bb.11233、Cry3Bb.11236、Cry犯b.11237、Cry3Bb.11238、以及Cry3Bb.11239)位于结构域2中p链l和结构域2中a螺旋8之间的环区与结构域l中a螺旋6和7之间的环十分靠近。在ipi,a8氨基酸側链显示出似乎它们会在空间上阻碍la6,7的运动。由于为使通道形成螺旋a5-a6插入到膜内,la6,7必须是柔性的,据认为,重新操作该环可以改变側链的定位,结果引起较小的空间阻碍。已经完成创造了生物活性高于野生型变化从2.2到5.4倍的蛋白。这些设计的毒素蛋白和它们的氨基酸变化作为Cry3Bb,11228、Cry3Bb,11229、Cry3Bb.11230、Cry3Bb.11232、Cry3Bb,11233、Cry3Bb-l1236、Cry3Bb.11237、Cry3Bb.11238、和Cry3Bb.11239列于表2,5.10.4螺旋7和p链1之间的环的分析(Cry3Bb.11227,Cry3Bb.11234,Cry3Bb.11241,Cry3Bb.11242,以及Cry犯b.11036)如果Cry3Bb类似于一种为发挥毒性必须打开以暴露出膜活性区域的细菌毒素,有可能除了通道形成螺旋之外还必须改变其它螺旋的位置。据推论,如果螺旋a5-a6插入膜内,则螺旋a7可能必须也改变位置。如实施例4.4.3中所示的,螺旋a6和a7之间柔性的提高可以提高活性,在螺旋a7之后的环,la7,pi较高的柔性也可以提高生物活性,改变Cry3Bb的la7,pi区导致了几种活性提高的蛋白的分离,它们高于野生型变化从1.9到4.3倍.这些设计的蛋白作为Cry3Bb.11227、Cry3Bb.11234、Cry3Bb.11241、Cry3Bb.11242、和Cry犯b.11036列于表7,5.11实施例ll—设计方法5:P链和P片层周围的环的设计某一蛋白质结构的环区可能涉及该蛋白的许多功能,包括但不局限于,通道形成、四级结构的形成和维持、以及受体结合.某一结合表面常常是由许多环限定的,如同免疫球蛋白G(IgG)的例子(为回頋,见Branden和Tooze,1991)。然而,仅仅通过看在讨论中的蛋白的结构,在这一点上不能确定的是什么环对受体的相互作用是重要的.由于没有确定一种Cry3Bb的受体,甚至没有可能将Cry3Bb与其它具有相同受体的蛋白质进行比较以确定结构上的相似性,为了确定促成受体相互作用的Cry3Bb环,在暴露于表面的环上进行随机突变。当每个环均被改变时,检测和比较所得到的蛋白的所以生物活性的轮廓。环,尤其是在结构域2(其显示出对通道活性不必要)中的,归为两类(l)可以被改变、没有引起所得到的蛋白生物活性水平大变化的环以及(2)在其上的改变引起所得到的蛋白生物活性完全丢失的环,使用这种设计方法,有可能鉴定出几种对于活性重要的环。5.11.1环P2,3的分析在P链2和3之间的环区上的半随机突变导致产生结构上稳定的毒素蛋白,其抗SCRW幼虫的活性明显降低。该1|32,3区域对氨基酸变化高度敏感,暗示着特定的氨基酸或氨基酸序列对于毒素蛋白的活性是必需的。因此,可以想象在1P2,3区域特定的变化将降低结合以及,因此降低重新设计的毒素蛋白的活性。5.11.2环P6,7的分析在P链6和7之间的环区上引入半随机突变导致产生SCRW生物活性完全丧失的结构上稳定的蛋白.该1P6,7区域对氨基酸变化高度敏感,暗示着特定的氨基酸或氨基酸序列对于毒素蛋白的活性是必需的.因此,可以想象在1P6,7区域特定的变化将降低结合以及,因此降低重新设计的毒素蛋白的活性,5.11.3环卩IO,ll的分析对P链10和11之间的环区的随机突变导致产生的蛋白SCRW生物活性完全丧失.环pi0,11与环P2,3及P6,7在结构上靠近并相互作用.对ipio,ll区中特定残基的改变也导致与昆虫膜的相互作用增加,毒素蛋白的生物活性提高,5.11.4Cry犯b.11095环P2,3、P6,7和pi0,11已经被确定为对Cry3Bb的生物活性很重要。这三个环是暴露于表面并且在结构上靠在一起.野生型结构中的氨基酸Q348,位于P-链2上并恰好在1P2,3之前,不形成任何分子内的相互联系。然而,用精氨酸取代Q348(Q348R)导致在R348和R487及R488的主链羰基之间形成两个新的氢健,二者均位于ipio,ll上.新的氢键可以稳定由三个环形成的结构。设计的带有这一变化的蛋白质,Cry3Bb.11095,比野生型Cry3Bb活跃4.6倍,5.12实施例12—设计方法6:复合静电表面的鉴定和重新设计蛋白之间的相互作用包括疏水作用(如范德华力)、亲水相互作用(包括在氨基酸側链的相反电荷之间的作用(盐桥))、以及氢鍵.关于S-内毒素和受体的相互作用知之甚少.目前,没有文献报道鉴定苏云金芽胞杆菌毒素和受体之间主要相互作用的类型.然而,在实验上,提高苏云金芽胞杆菌毒素-受体相互作用的强度是重要的,而在提高它的过程中不能够精确地确定化学相互作用.为了达到这一点,通过解决分子周围的Poisson-Boltzman分布来限定Cry3Bb的静电表面,一旦该电限制的表面被解决,就可以预见到最大差异的区域.据推论,这些静电相反的区域将有最大的可能性参与苏云金芽胞杆菌毒素蛋白和其受体之间特定的相互作用,而不是更普遍和非特异性的相互作用.因此,选择这些区域进行重新设计,继续提高区域的静电差异.另外,检查毒素中推定的通道形成区域周围的静电相互作用创造了重新设计的见解.这包括在另外带有负电荷的通道内鉴定带有正电荷的残基(见实施例4.6.1)。5.12.1R290(Cry3Bb.11227、Cry3Bb.11241、以及Cry3Bb.11242)检查沿着结构域l轴的Cry3Bb二聚物接触面,暗示在单体之间可能形成了阳离子的小孔或通道,对该轴的静电检查为这一意见增添了附加的可信性。事实上,假设的通道主要是带负电荷的,这是一项与关于阳离子逸择的、S-内毒素通道的生物物理分析一致的观测,如果某一阳离子通道是沿着二聚物的轴形成的,在该阳离子可以相对容易地在单体之间运动,只有一个明显的障碍.一个带正电的精氨酸残基(R290)位于另一个带负电的通道内.该残基可以阻碍阳离子通过该通道的运动,基于这一分析,将R290变换为不带电荷的残基。重新设计的蛋白Cry3Bb.11227(R290N)、Cry3Bb.11241(R290U和Cry3Bb.11242(R290V)的生物活性分别提高大约2倍、2.6倍和2.5倍.5.12.2Cry3Bb.60对于增溶的Cry3Bb的胰岛素消化产生了一种稳定的、截短了的蛋白,其分子量为60kDa(Cry3Bb.60).胰岛素消化发生在残基R159的羧基端,有效地将螺旋l至3从天然Cry3Bb结构中去除.前3个螺旋的切除暴露出与在天然结构中发现的不同的静电表面.这一新的表面具有疏水、极性和带电特征的组合,这些特征在膜内相互作用中可能扮演重要角色.Cry3Bb.60的生物活性高于野生型Cry3Bb3.6倍.5.13实施例13:设计方法7:金属结合位点的鉴定和去除文献中指出苏云金芽胞杆菌毒素在体外的行为可以通过从实验系统中螯合二价阳离子来达到增强(Cra"ord和Harvey1988),然而,不知道的是这些二价阳离子是如何阻碍体外活性的.Crawford和Harvey(1988)证实在EDTA(—种二价离子的螯合剂)的存在下,相对于没有该试剂的情况下,穿过中肠的短路电流更严重地被苏云金芽胞杆菌阻断,因此暗示着在苏云金芽胞杆菌的作用模式中,这一步可以通过去除二价离子而成为可能.使用黑色油脂膜进行类似观察,测定在EDTA存在以螯合二价离子的情况下,由S-内毒素产生的电流的增加。对于这些观察结果至少有三种可能的解释.第一种解释可以是二价离子太大,以至无法穿过更适于单价离子的离子通道,因此阻塞了该通道.第二种,二价离子可能十分普遍地覆盖在蛋白质上,因此阻碍了毒素膜相互作用所需要的电荷相互作用,以及限制了离子通道的活性.第三种可能性是在蛋白中存在一种特殊的金属结合位点以及,当该位点被二价离子占据时,离子通道的性能即受到损害.虽然文献无法区分一种可能性高于另一种的评估,但第三种可能性引起对Cry3Bb结构进行分析以寻找一个特定的金属结合位点,该位点可能会改变某一毒素可以形成一个离子通道的可能性.5.13.1H231(Cry3Bb.11222、Cry3Bb.11224、Cry3Bb.11225、以及Cry3Bb.11226)在Cry3Bb二聚体中,一个推定的金属结合位点是由各单体上的H231残基形成的。H231残基位于螺旋a6中,它们彼此邻近而且靠近二聚体的对称轴.通过用其它氨基酸替代组氨酸来去掉该位点,这可以通过EDTA-依赖的离子通道活性的缺乏来进行评估。设计的毒素蛋白Cry3Bb.11222、Cry3Bb.11224、Cry3Bb.U225和Cry3Bb.U226的生物活性相对于野生型,分别提高4、5、3.6和3倍,它们各自的氨基酸变化列于表2.5.14实施例14一设计方法8:四级结构的变更Cry3Bb与一种相关的蛋白Cry3A类似,能以二聚体的形式存在与溶液中(Walters等,1992).然而,二聚体对于生物活性的重要性尚不知晓,原因是没有认真地评估以单体或高度有序结构的形式存在的毒素。据猜测是特定的氨基酸残基促成四级结构的形成和稳定性.一旦鉴定出该起作用的残基,则可进行改变以减小或加大该残基的影响,从而影响单体之间的相互作用.通道活性是估定Cry3Bb及其衍生物的四级结构的一条有用的途径,但决不是唯一的途径,已经观察到Cry3Bb在膜内形成闸门控制的电导,其随时间而增大,最终导致在膜上形成大的孔径(野生型Cry犯b的通道活性的描述在12.l节中〉,也观察到Cry3A形成比Cry3Bb更稳定的二聚体,以及更快地相应形成更高水平的电导(图IO)。该发现引导本发明者们设想寡聚化和离子通道的形成(电导大小和通道形成的速度)是相关的.基于这一发现,将Cry3Bb重新设计以形成速度更快的更大、更稳定的低聚物。在这一分析中设想离子通道形成和增长的速度反映了该过程.也有可能四级结构的改变不独自影响通道活性或完全不影响.改变四级结构也可能影响受体相互作用、在昆虫内脏环境中的蛋白加工、以及生物活性的其它未知方面.5.14.1Cry3Bb.11048对Cry3A和Cry3Bb比较性的结构分析导致鉴定出两种毒素之间在离子通道形成结构域的结构上的不同点;特定地,在Cry3Bb上的螺旋2a和螺旋2b之间插入一个氨基酸.去掉在Cry3B2,A104上附加的该氨基酸以及Cry3A中的D103E替换点,导致通道闸门的丧失和对称孔径的形成.一旦这些孔径形成,它们将保持开放和允许一个稳定的电导,变化为25-130pS.该设计的蛋白,Cry3Bb.11048,抗SCRW幼虫的活性高于野生型Cry3Bb4.3倍.5.14.2Cry3Bb.60的寡聚化作用单独的Cry3Bb或Cry3Bb.60分子可以形成彼此类似的复合物,Cry3Bb的寡聚化作用是由SDS-PAGE证实的,其中上胶之前样品在样品緩冲液中不被加热,没有热处理允许了一些非变性的毒素的维持.在考马斯染色之后,通过出现一条分子量为单体的两倍的条带可以看到寡聚化作用.较高分子量条带的亮度反映了寡聚化作用的程度.Cry3Bb形成低聚物的能力不是明显可再生的,该复合物可能重复观察到它的形成。然而,Cry3Bb.60形成明显较大量的较高分子量的复合物(120kDa).这些数据暗示Cry3Bb.60比单独的Cry3Bb更容易形成高度有序的复合物.Cry3Bb.60也形成比野生型Cry3Bb具有更高频率的离子通道(见5.12.9节),5.14.3Cry3Bb.11035在Cry3Bb上制造变化以反映Cry3A在la3,4和螺旋4的起始部分的氨基酸序列,这些变化形成了设计蛋白Cry3Bb.11035,它与野生型Cry3Bb不同,形成具有高电导的自发通道,Cry3Bb.11035的抗SCRW幼虫的活性也大约高于野生型Cry3Bb三倍,Cry3Bb.11035及其氨基酸变化列于表IO.5.14.4Cry3Bb.11032改变Cry3Bb.11032在螺旋a4中165位上的残基,如Cry3A中所见的,将天冬酰胺变为甘氨酸.Cry3Bb.11032的活性高于野生型Cry3Bb三倍。Cry3Bb.11032的通道活性十分类似于Cry3Bb,除了当将该设计蛋白人为地组合到膜内时。观察到与野生型Cry3Bb相比,初始的通道电导有16倍的增加(见5.12.2节).猜想这种初始电导的增加是由于增强了的四级结构、稳定或较有序的结构.5.14.5EG11224在野生型Cry3Bb二聚物结构中,位于结构域l中231位上的组氨酸与D288(结构域1)、Y230(结构域l)产生氢鍵联系,以及,通过一个水分子网络,也与D610(结构域3)、所有相对的单体产生联系。D610和K235(结构域l)也产生联系,用精氨酸取代组氨酸,H231R,在一个方向上导致与邻近单体上的D610形成一个盐桥,在第二个方向上,如同在野生型结构中所出现的,与邻近单体上的D288保持联系。在任一方向上,R231不与相对单体上的Y230形成氢键,但的确与K235产生联系,K235保持其与K610的联系(V.Cody,研究交流researchconmmnication)。移动的氢键改变了四级结构内蛋白的不同结构域之间的相互作用.大体上,在邻近单体的结构域l之间存在的氢鍵较少,在结构域1和3之间已经形成了一个更强的键.发现通道活性已经被改变,Cry3Bb.11224类似于Cry3Bb产生小的、快速闸门控制的通道。然而,与野生型Cry3Bb不同,Cry3Bb.11224不表现出p-巯基乙醇依赖的活性.用精氨酸取代H231导致一种设计Cry3Bb蛋白Cry3Bb.11224的产生,其生物活性提高5倍.5.14.6Cry3Bb.11226如4.8.5节所讨论的,Cry3Bb.U226类似于Cry3Bb.11224,在231位的组氨酸被取代.氨基酸的变化,H231T,导致在野生型Cry3Bb中所见到的P-巯基乙醇依赖的活性的丢失(见5.12.l节)。H231(—个推定的金属结合位点)的取代改变了四级结构中区域之间的相互作用,导致产生不同类型的通道活性,Cry3Bb.11226的活性高于Cry3Bb三倍.5.14.7Cry3Bb.11221Cry3Bb,11221已经在Cry3Bb的la3,4区进行重新设计,由Cry3Bb.1122形成的通道比由野生型Cry3Bb形成的电导更好地解决(见5.12.6节).Cry3Bb.1122的生物活性比野生型Cry3Bb高出6.4倍。Cry3Bb.1122中发现的氨基酸变化列于表2。5.14.8Cry3Bb.11242设计的蛋白,Cry3Bb.11242,带有变化R290V,迅速地形成小电导,它在约3分钟内迅速及稳定地增长位大的电导(见5.12.7节)。这与野生型Cry3Bb通道是相反的,它需要30-45分钟出现,在数小时内緩慢增长成大的电导.Cry3Bb.11242与野生型Cry3Bb相比,其生物活性也增加2.5倍,5.14.9Cry3Bb.11230Cry3Bb.11130,与野生型Cry3Bb不同,形成长期处于开启状态的形成良好的通道.这些通道达到最高为3000pS的电导,但不随时间继续增大.Cry3Bb.11230已经在Cry3Bb的l卩l,a8区域进行了重新设计,表现出与野生型Cry3Bb相比,抗SCRW幼虫的活性几乎提高5倍(表9)和抗WCRW(表10)幼虫提高5.4倍。在Cry3Bb.11230中发现的氨基酸变化列于表2,5.15实施例15—设计方法9:结构残基的设计某一蛋白特定三维结构是通过被埋藏或被从蛋白的表面移开的氨基酸固定就位的.这些结构的决定物可以通过检验促成表面结构定位的力来进行鉴定。然后可以增强这些结构残基的影响以限制分子移动,或者降低其影响以增强分子柔性。5.15.1Cry3Bb.11095环P2,3、P6,7和pi0,11位于Cry3Bb的结构域2上,已经被筌定为对生物活性是重要的。这三个环是暴露于表面并且在结构上靠在一起。野生型结构中的氨基酸Q348位于P-链2上并恰好在1P2,3之前,不形成任何分子内的联系,然而,用精氨酸取代Q348(Q348R)导致在R348和R487及R488的主链羰基之间形成两个新的氢键,二者均位于ipio,ll上.新的氢鍵可以稳定由三个环形成的结构。确定地,如通过X-射线晶体学所确定的,闺绕R348的结构被更紧密地折叠.设计带有这一变化的蛋白Cry3Bb.11095,其活性高于野生型Cry3Bb4.6倍.5.16实施例16—设计方法10:组合分析以及突变形成设计的Cry3Bb分子中单独的位点可以被一起用来形成一个新的Cry3Bb分子,其活性高于任何一个位点的活性.该方法没有被精确地用于任何5-内毒素。也不明显的是在两个位点的改善可以通力合作以提高蛋白的生物活性.事实上,数据证明当将两个位点的改善合在一个单一的构建物中时,Cry3Bb的生物活性被没有必然地进一步提高。在一些情况下,该结合导致蛋白稳定性和/或活性的降低,具有位点组合、结果导致比野生型Cry3Bb活性提高但比"母体"蛋白中的一种或多种活性降低的蛋白的例子是Cry3Bb.11235、11046、11057和UO58。Cry犯b.11082,含有来自4个母体蛋白的设计区域,保持了来自最有活性的母体抹(Cry3Bb.11230)的活性水平,但没有显示出活性的增加,这些蛋白列于表7.以下是例证的实施例,其中被结合的突变具有明显提高的生物活性.5.16.1Cry3Bb.11231设计蛋白Cry3Bb.11231含有在Cry3Bb.11224(H231R)和Cry3Bb.11228(在ipi,a8发生变化)表现在Cry3Bb.11231中的氨基酸变化的组合,导致抗SCRW幼虫的生物活性提高为大约超过野生型Cry3Bb的8倍(表2)。这一增加比单独的Cry3Bb.11224(5.0x)或Cry3Bb.11228(4.1x〉所表现出来的都大,Cry3Bb.11231与野生型相比,抗WCRW幼虫的活性也表现出12.9倍的增加(表10).5.16.2Cry3Bb.11081设计的Cry3Bb蛋白Cry3Bb.11081通过结合Cry3Bb.11032和Cry3Bb.11229(除了Y318C)所表现出来的变化来构建.Cry3Bb.11081比野生型Cry3Bb的活性增加6.l倍;其活性提高超过任一单独的母体蛋白,Cry3Bb.11032(3.l-倍)以及Cry3Bb.11229(2.5-倍),5.16.3Cry3Bb.11083设计的Cry3Bb蛋白Cry3Bb.11083是通过结合Cry3Bb.11036和Cry3Bb.11095所表现的变化来构建的.Cry3Bb.11083与野生型Cry3Bb相比,表现出抗SCRW幼虫的活性增加7.4倍;比Cry3Bb.11036(4.3x)或Cry3Bb.11095(4.6x)均大,Cry3Bb.11083与野生型Cry3Bb相比,也表现出抗WCRW幼虫的活性增加5.4倍(表10)。5.16.4Cry犯b.11084i殳"H"的Cry3Bb蛋白Cry3Bb.11084是通过结合Cry3Bb.U032的变化和Cry3Bb.11228所表现的变化S311L来构建的.Cry3Bb.U084与野生型Cry3Bb相比,活性增加7.2倍;比Cry3Bb.11032(3.lx)或Cry3Bb.11228(4.lx)均大.5.16.5Cry3Bb,11098设计的Cry3Bb蛋白Cry3Bb.U098的构建是通过含有以下氨基酸变化D165G、H231R、S311L、N313T、以及E317K。核普酸序列如序列编号107中给出,所编码的氨基酸序列如序列编号108所给出.5.17实施例17—设计方案ll:对糖蛋白以及WCRW刷状缘膜的结合改变虽然不知道Cry3Bb的受体的身份,但重要的是提高毒素与其受体的相互作用,一种提高毒素、受体相互作用(受体的身份已知)的方法是降低或排除对其它生物分子非生产性的结合.本发明者们已经观察到Cry3Bb非特异性地结合已经被许多种糖糖基化的牛血清蛋白(BSA),但不结合非糖基化的BSA.Cry3A,在Diabrotica种类中不活跃,显示出对糖基化的BSA相似甚至更强的结合。类似地,Cry3A相对与野生型的Cry3Bb,显示出对固定的WCRW刷状缘膜(BBM)更强的结合,意味着许多观察到的结合是非生产性的.据推论,对WCRWBBM幼虫非特异性结合的发生是通过使蛋白糖基化,以及在产生毒性的反映过程中,对糖基化的BSA和WCRWBBM的结合均是非生产性的.因此降低或消除这种结合可以导致对多产的受体增强以及毒性增强.对准潜在的糖类群结合位点进行重新设计,以降低Cry3Bb对糖蛋白以及固定的WCRWBBM的非特异性结合.5.17.1Cry3Bb.60Cry3Bb.60,其中Cry3Bb已经在la3,4的R159被裂解,显示出对糖基化的BSA的结合降低,以及对固定的WCRWBBM的结合降低.Cry3Bb.60显示出相对于Cry3Bb的生物活性提高3.6倍.5.17.2改变为la3,4(Cry3Bb.11221)已经在结构域1的la3,4区对Cry3Bb.11221进行重新设计,Cry3Bb在结构域l被裂解以形成Cry3Bb.60。Cry3Bb.11221也显示出对糖基化的BSA和罔定的WCRWBBM的结合降低,以及其生物活性超过野生型Cry3Bb的6.4倍。与Cry3Bb.60的数据(5.17.l节)一起,这些数据暗示该环区实质上促成了毒素的非生产性结合。5.17.3改变为ipi,ot8(Cry3Bb.11228、11230、11237以及11231)Cry3Bb的ipi,a8区域已经被重新设计以提高水合作用(4.2.4节)和增加柔性(4.4.3节)。几种在该区域被改变的蛋白,Cry3Bb.11228、11230、和11237,展示出明显的对糖基化的BSA和固定的WCRWBBM较低水平的结合,同时也其生物活性相对于野生型的Cry3Bb增加4,l和4.5倍之间,5.17.4结合活性Cry3Bb和它的一些衍生物结合糖基化的BSA和WCRWBBM的倾向的确定是通过一种BIAcoreT"表面胞质团共振生物传感器来进行的,对于糖基化的BSA结合,使用标准的NHS化学作用将糖基化的蛋白罔定在CM5芯片(BIAcore)上,将溶解的毒素注入糖基化的BSA表面上。为了测定对WCRWBBM的结合,将从WCRW的中肠中纯化出来(English等,1991)的刷状缘膜小嚢泡(BBMV)固定在一个HPA芯片(BIAcore)上,然后用IOmMK0H或40mMp-辛基葡萄糖方甙清洗.然后将溶解的毒素注入所得到的混合双分子层表面以检测结合,通过用蛋白质染色试剂分析ProteinDyeReagentassay氺(BioRad)或BCA蛋白分析BCAProteinAssay*(Pierce)来确定蛋白的浓度.也可以使用其它方法以确定相同结合的形成。这些包括,但不局限于,使用标记的毒素、标记的糖基化蛋白或抗毒素抗体进行的配基印迹实验,亲和层析,以及毒素在体外与完整BBMV的结合.5.18实施例18—构建含有野生型Cry3Bb序列的质粒标准的重组DNA操作实质上如Sambrook等(1989)所描述的进行.5.18.1pEG1701pEG1701(图11),包含EG11204和EG11037,其构建是通过将含有Cry3Bb基罔的Sphl-Pstl片段和来自pEG911(Baum,1994)的ctylF终止子插入到pEG854.9(Baum等,1996)(—种高拷贝数的苏云金芽胞杆菌-大肠杆菌穿梭栽体)的SphI-PstI位点上.5.18.2pEG1028pEG1028含有来自pEG1701的Cry3Bb上的HindlII片段,该片段在HindIII被克隆到pTZ18U的多克隆位点上。5.19实施例19一含有变更的Cry3Bb基因的质粒的构建来自大肠杆菌的质粒DNA的制备是通过碱性溶解方法(Maniatis等,1982),或者是通过商品化的质粒制备试剂盒(例子PERFECTprepTMkit,5Prime-3Prime,Inc.,BoulderCO;QIAGENplasmidprepkit,QIAGENInc.),从从在脑心浸液加上O.5%甘油(BHIG)中生长达到中央对数期的培养物中通过碱性溶解方法制备苏云全芽胞杆菌的质粒.当需要纯化时,在电泳之后从琼脂糖凝胶中切除DNA片段,然后使用一种Geneclean1^试剂盒(BI0101Inc.,LaJolla,0八)通过玻璃*奶*复原。使用几种技术达到对Cry3Bb基因的改变,这些技术包括定位诱变、三重+PCRT"、拟随机的PCRT"诱变、DNA滑移和标准的重组技术,这些技术分別在6.1、6.2、6.3、6.4和6.5节中有描述.所使用引物的DNA序列列于7节.5.20实施例20—定位诱变定位诱变是由Kunkle(1985)和Kunkle等(1987)所建立的协议所指导的,在体外使用Muta-Gene"M13诱变试剂盒(Bio-Rad,Richmond,CA).通过使用Muta-GeneT"试剂盒和多个诱导突变的低聚核苷酸引物来达到结合Cry3Bb的变更.5.20.1pEG1041pEG1041,包含在EG11032中,其构建是通过使用Muta-GeneT"试剂盒、引物C、以及单链的pEG1028作为DNA模板.所得到的改变的Cry3BbDNA序列作为一段PflMlDNA片段被切除,并被用来取代pEG1701中相应的DNA片段.5.20.2pEG1046pEG1046,包含在EG11035中,其构建是通过使用Muta-GeneT"试剂盒、引物D、以及单链的pEG1028作为DNA模板.所得到的改变的Cry3BbDNA序列作为一段PflMlDNA片段被切除,并被用来取代pEG1701中相应的DNA片段.5.20.3pEG1047pEG1047,包含在EG11036中,的构建是通过使用Muta-Gene"试剂盒、引物E、以及单链的pEG1028作为DNA模板,所得到的改变的Cry3BbDNA序列作为一段PflMlDNA片段被切除,并被用来取代pEG1701中相应的DNA片段.5.20.4pEG1052pEG1052,包含在EG11046中,的构建是通过使用Muta-GeneT"试剂盒、引物D和E、以及单链的pEG1028作为DNA模板,所得到的改变的Cry3BbDNA序列作为一段Pf1M1DNA片段被切除,并被用来取代pEG1701中相应的DNA片段,5.20.5pEG1054pEG1054,包含在EG11048中,的构建是通过使用Muta-Gene""试剂盒、引物F、以及单链的pEG1028作为DNA模板.所得到的改变的Cry3BbDNA序列作为一段PflMlDNA片段被切除,并被用来取代pEG1701中相应的DNA片段,5.20.6pEG1057pEG1057,包含在EG11051中,的构建是通过使用Muta-GeneT"试剂盒、引物G、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMlDNA片段被切除,并被用来取代pEG1701中相应的DNA片段,5.21实施例21—三重PCR加三重PCR说是由Michael(1994)所描述的。该方法利用了一种热稳定连接酶,在PCR"过程中,将磷酸化的诱变引物合并到一段扩增的腿片段中,PCRT"在PerkinElmerCetusDMThermalCycler(Perkin-Elmer,Norwalk,CT)中进行,使用一种AmpliTaqT"DNA聚合酶试剂盒(Perkin-Elmer)和Sphl-线性化的pEG1701作为模板DNA,PCRT"的产物的清洗是通过使用化学试剂盒,如Wizard"1PCRTMPreps(Promega,Madison,WI)和QlAquickPCRTMPurificationkit(QIAGENInc.,Chatsworth,CA),5.21.1pEG1708和pEG1709pEG1708和pEG1709,分别包含在EG11222和EG11223中,其构建是通过用另一个片段取代pEG1701中cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRT"片段,其在cry3Bb核苷位点688-690(编码氨基酸Y230〉上发生改变.通过三重PClT在Y230密码子上引入随机突变.诱变引物MVT095被磷酸化并与外来的引物对FW001和FW006—起使用。引物MVT095在687位也包括一个沉寂突变,T变为C,其在结合之后紧接着将一个附加的EcoRI位点引入pEG1701.5.21.2pEG1710、pEG1711以及pEG1712质粒pEG1710、pEG1711以及pEG1712,分别包含在EG11224、EG11225和EG11226中,其构建是通过用另一个片段取代pEG1701中cry3Bb基因上的PflMI-PflMI片段,该片段为经Pf1MI消化并在凝胶上进行纯化的PCRT"片段,其在Cry3Bb核苷位点690-692(编码氨基酸H231)上发生改变,通过三重PCRT"在H231密码子上引入随机突变.诱变引物MVT097被磷酸化并与外来的引物对FW001和FW006—起使用。引物MVT097在687位也包括一个T变为C的序列改变,其在结合之后紧接着通过沉寂突变导致一个附加的EcoRI位点.5.21.3pEG1713和pEG1727pEG1713和pEG1727,分别包含在EG11217和EG11242中。其构建是通过用另一个片段取代pEG1701中Cry3Bb上的Pf1MI-Pf1MI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRT"片段,其在Cry3Bb核苷位点868-870(编码氨基酸R290)上发生改变.使用三重PClT在R290密码子上引入随机突变.设计诱变引物MVT091,以至核苷的替换可以导致大约3696的序列编码氨基酸D或E,MVT091被磷酸化并与外来的引物对FW001和FW006—起使用。5.22实施例22-准随机PCR^突变准随机PCR加突变结合诱变的PCRT"技术是由Val1ette等(1989)、Tomic等(1990)以及LaBean和Kauffman(1993)描述的,诱变引物,有时其长度超过70个核苷,被设计在编码一个完整的结构区域(如一个环)的核苷位置上引入变化。退化的密码子代表性地包括比率为82%的野生型核苷加上另外3种核苷,各为6%,在耙区域的每个位置上半随机地引入变化+(LaBean和Kauffman,1993).当可能时,利用天然的限制性位点;当天然位点不适宜时,使用2s酶类(Stemmer和Morris,1992,列出对本技术有用的另外的限制酶).PClT在一种PerkinElmerCetus■ThermalCycler(Perkin-Elmer,Norwalk,CT)中进行,使用一种AmpliTaqT"DNA聚合酶试剂盒(Perkin-Elmer)和SphI-线性化的pEG1701作为模板DNA,采用以下条件进行拟随机的PCRT"扩增在94。C下变性l.5分钟,在50。C下退火2分钟,以及在72。C下延伸3分钟,循环30次。最后的14个延伸循环中每个循环加25秒延伸,底物浓度为20微升,或者对于长的诱变底物为40微升,使用如WizardT"PCR"1Preps(Promega,Madison,WI)和QlAquickPCRTMPurificationkit(QIAGENInc.,Chatsworth,CA)的商品化的试剂盒来清洗PCR"的产物。在一些实例中,PCRT"的产物在限制消化之前,用KlenowFragment(Promega)依照厂家指导进行处理,填满任何单个碱基的突出部分.5.22.1pEG1707EG1707,包含在EG11221中,其构建是通过用另一个片段取代pEG1701中Cry3Bb上的PflMI-PflMI片段,前者为经Pf1MI消化并在凝胶上进行纯化的PCRT"片段,其在Cry3Bb核苷位点460-480(编码lot3,4的氨基酸154-160)上发生改变。引物MVT075,其包括2s类的限制酶Bsal的识别位点,以及引物FW006被用于通过拟随机诱变在该区域引入变化。引物MVT076,也含有一个BsaI位点,和引物FW001用于PCR"1扩增一段"连接"片段。在PCRT"扩增之后,两个产物均被清洗、末端填充、用BsaI消化并彼此连接。凝胶纯化连接的片段并使用引物对FW001和FW006将其作为PCRT"扩增的引物。将PClT产物进行清洗、末端填充、用PflMI消化、凝胶纯化及连接到经PflMI消化并纯化过的pEG1701栽体DNA上.5.22.2pEG1720和pEG1726pEG1720和pEG1726,分别包含在EG11234和EG11241中,其构建是通过用另一个片段取代pEG1701中Cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRT"片段,其在Cry3Bb核苷位点859-885(编码lot7,8的氨基酸287-295)上发生改变。使用拟随机PCRT"诱变在该区域中引入变化。诱变引物MVTlll,设计含有一个BsaI位点,以及引物FW006被用于引入变化。引物对MVT094,也含有BsaI位点,和FWOOl被用于扩增连接片段.将PCR""产物用Bsal消化、凝胶纯化及彼此连接.将连接的产物使用引物对FW001和FW006进行PCRT"扩增,用PflMI消化,5.22.3pEG1714、pEG1715、pEG1716、pEG1718、pEG1719、pEG1722、pEG1723、pEG1724以及pEG1725pEG1714、pEG1715、pEG1716、pEG1718、pEG1719、pEG1722、pEG1723、pEG1724以及pEG1725,分别包含在EG11228、EG11229、EG11230、EG11232、EG11233、EG11236、EG11237、EG11238和EG11239中,其构建是通过用另一个片段取代pEG1701中Cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRT"片段,其在Cry3Bb核香位点931-954(编码ipi,a8的氨基酸311-318)上发生改变。使用拟随机PCRT"诱变在该区域中引入变化,使用诱变引物MVT003和引物FW006'引物MVT003和FW006用来扩增一段连接片段.将PCI1"产物用Klenow和进行末端填充并用BamHI消化.将从FWOOl-FW006消化的较大片段进行凝肢纯化,然后与消化的MVT103-FW006片段连接。将连接的产物进行凝胶纯化,并通过使用引物FW001和FW006的PCR""进行扩增。将扩增的产物用PflMI消化,并在连接到经PflMI消化并纯化的pEG1701栽体DNA上之前进行凝胶纯化.5.22.4pEG1701.LP2,3带有cry3Bb野生型序列1051-1065位核苷(编码Cry3Bb的结构区域1P2,3)变体的质粒,其构建是通过用独立的MluI-和SpeI-消化的PCRT"产物取代pEG1701的Mlu1-Spel片段。该PClT产物的产生是通过拟随机PCRT"诱变,其中诱变引物MVT081与FW006配对,这些质粒作为一个群体命名为pEG1701.1&2,3.5.22.5pEG1701.Lp6,7含有cry3Bb野生型在1234-1248位核苷上的序列(编码Cry3Bb的结构区域1|36,7)变体的质粒,其构建是通过用独立的MluI-和SpeI-消化的PCRT"产物取代pEG1701的MluI-Spel片段。该PCR"产物的产生是通过拟随机PCRT"诱变,其中诱变引物MVT085与WD115配对。配对引物MVT089和WD112被用来扩增一段连接片段。两种PCR""产物均被Taql消化并相互连接.将连接的产物进行凝胶纯化,并通过使用配对引物MVT089和FW006的PCR"进行扩增。将扩增的产物用MluI和SpeI进行消化,并连接到经MluI和Spel消化并纯化的pEG1701栽体DNA上.这些质粒作为一个群体命名为pEG1701.1P6,7.5.22.6pEG1701.Lpi0,11含有突变的cry3Bb1450-1467位核苷上的序列(编码Cry3Bb的结构区域IPIO,ll)质粒,其构建是通过用分离的SpeI-和PstI消化的PCR""产物取代pEGl701的Spel-Pstl片段。该PCR"产物的产生是通过拟随机PCRT"诱变,其中诱变引物MVT105与引物MVT070配对.配对引物MVT092和MVT083被用来形成一段连接片段。(MVT083是一段为另一个区域设计的诱变低聚物.由MVT083引入的序列变化在限制消化之后被消除,不会影响cry3Bb在ipi0,ll区域的变化。)两种PCIT产物均被BsaI消化并与通过配对引物MVT083和MVT070进行的PCR"扩增的连接产物相互连接,用SpeI和PstI消化所得到的PCRT"产物,以及对其进行凝胶纯化.这些质粒作为一个群体命名为pEG1701.ipiO,11。5.23实施例23—DNA滑移DNA-滑移,如Stemmer(1994)所描述,被用于联合cry3Bb基因的个别变更.5.23.1pEG1084、pEG1085、pEG1086以及pEG1087pEG1084、pEG1085、pEG1086、以及pEG1087,分别包含在EG11081、EG11082、EG11083、以及EG11084中,从DNA滑移中恢复.简单地,PflMIDNA片段的产生是通过使用引物集合A和B以及pEG1707、pEG1714、pEG1715、pEG1716、pEG1041、pEG1046、pEG1047、和pEG1054各自的质粒作为DNA模板,将所得到的DNA片段以等质量汇聚,并用DNA酶I进行消化,通过三个成功的冻结融化循环将50-100bp的DNA片段从琼脂糖凝胶中回收出来在干冰乙醇浴池中三分钟,接着在50°C下完全溶解。回收的DNA片段通过无引物的PCR"和使用Steminer(1994)描述的引物组合A和B的PCRT"-扩增进行组合。最后的PCIT-扩增的DNA片段用Pf1MI切除并被用于取代pEGl701中相应的Cry3BbPflMIDNA片段.5.24实施例24—重组DNA技术标准的重組DNA步緣大致根据Sambrook等(1989〉的描述来进行。5.24.1pEG1717pEG1717包含于EG11231中,是通过把pEG1710中的小BglII片段替代为来源于pEG1714的小BglII片段来构建的,5.24.2pEG1721pEG1721包含于EG11235中,是通过把pEG1710中的小BglII片段替代为来源于pEG1087的小BglII片段来构建的,5.24.3pEG1063pEG1063包含于EG11057中,是通过把来源于pEG1054的含有ori43的Nco1DNA片段替代为来源于pEG1046的经过分离的含有ori43以及在Cry3Bb中的变更的Nco1DNA片段来构建的。5.24.4pEG1063pEG1063包含于EG11058中,是通过把来源于pEG1054的含有ori43的Nco1DNA片段替代为来源于pEG1707的经过分离的含有ori43以及在Cry3Bb中的变更的Nco1DNA片段来构建的.5.24.5pEG1095pEG1095包含于EG11095中,是通过把pEG1701中的MluI-SpeI難片段替代为来源于pEG1086的相应的Mlu1-SpelDNA片段来构建的。5.25实施例25--在构建Cry3Bb+变体的过程中使用的引物以下所示的是在通过定点突变、三重PCRT"(triplexPCR)以及准随机PCRT"(quasi-randomPCR)来获得cry3Bb丰变体时所用的引物.引物得自RansomHillBioscience,Inc.(Ramona,CA)以及IntegratedDNATechnologies,Inc.(Coralville,IA),在一个或多个残基上含有特定退化的引物的特定的组合物示于第5.30节,实施例30,5.25.1引物FW001(序列编号:71):5,AGACAACTCI,ACAGTAAAAGATG-3'5.25.2引物FW006(序列编号72):5,-GGTAATTGGTCAATAGAATC-3,5.25.3引物MVT095(序列编号73):5,-CAGAAGATGTTGCTGAATTC隱CATAGACAATTAAAAC-3,5.25.4引物MVT097(序列编号:74):5,-GATGTTGCTGAATTCTATNNNAGACAATTAAAAC-3,5.25.5引物MVT091(序列编号75):5,-CCCATTTTATGATATTBDNTTATACTCAAAAGG-3,5.25.6引物MVT075(序列编号:76):AAAAGAAGCCAAGATCGAAT-3'5.25.7引物MVT076(序列编号77):5'-GGTCACCTAGGTCTCTCTTCCAGGAATTTAACGCATTAAC-3'5.25.8引物MVT111(序列编号:78):5,-AGCTATGCTGGTCTCCCATTTJEHIEJEJJEIIKRRJEHEIJEENI1IGTTAAAACAGAACTAAC-3,5.25.9引物MVT094(序列编号:79):5,-ATCCAGTGGGGTCTCAAATGGGAAAAGTACAATTAG-,3'5.25.IO引物MVT103(序列编号80):5,-CATTTTTACGGATCCAATTTTTJFFFJNEEJE層J匿ILEIJE0GGACCAACTTTTTTGAG-3'5.25.ll引物MVT081(序列编号:81):5,-GAATTTCATACGCGTCTTCAACCTGGTJEHJJJIINMEEIEJTCTTTCAATTATTGGTCTGG-3,5.25.12引物MVT085(序列编号82):5,-AAAAGTTTATCGAACTATAGCTAATACAGACGTAGCGGCTJQQFFNEEJIIJEEIGTATATTTAGGTGTTACG-3'5.25.13引物A(序列编号83)犯2PFLMI:5,-GGAGTTCCATTTGCTGGGGC-3,5.25.14引物B(序列编号:84)3B2PFLM2:5,-ATCTCCATAAAATGGGG-3'5.25.15引物C(序列编号:85)3B2165DG:5,-GCGAAGTAAAAGAAGCCAAGGTCGAATAAGGG-3,5.25.16引物D(序列编号:86)3B2160SKRD:5,-CCTTTAAGTTTGCGAAATCCACACAGCCAAGGTCGAATAAGGG-3'5.25.17引物E(序列编号:87)3B2290VP:5'-CCCATTTTATGATGTTCGGTTATACCCAAAAGGGG-3'5.25.18引物F(序列编号:88)3B2EDA104:5,-GGCCAAGTGAAGACCCATGGAAGGC-3,5.25.19引物G(序列编号:89)3B2KG189:5,-GCAGTTTCCGGATTCGAAGTGC-3'5,25.20引物WD112(序列编号:90):5,-CCGCTACGTCTGTATTA-3'5.25.21引物WD115(序列编号:91):5'-ATAATGGAAGCACCTGA-3'5.25.22引物MVT105(序列编号:92):ATTTTTTACTTGG-3,5.25.23引物MVT092(序列编号93):5,-ATCCAGTTGGGTCTCTAAGAAACAAACCGCGTAATTAAGC-3'5.25.24引物MVT070(序列编号94):5,-CCTCAAGGGTTATAACATCC-3'5.25.25引物MVT083(序列编号95):TAGCTAATACAG-3,5.26实施例26--经过改变的cry3Bb基因的序列分析有时候使用大肠杆菌DH5otT"(GIBCOBRL,Gaithersburg,MD),JM110以及SureT"(Stratagene,LaJolla,CA)细胞来扩增测序用的质粒DNA,根据生产商的步骤把质粒转化到这些细胞中。DM序列是用购自U.S.BiochemicalCorporation(Cleveland,Ohio)的Sequenase2.0DNA测序试剂盒测定的.表ll列出了在第6节中所描述的质粒、它们各自与野生型cry3Bb序列的差异、所获得的氨基酸变化、以及变化的结构位置.<table>tableseeoriginaldocumentpage140</column></row><table>质粒表11(续)可場*DNA^列改变的结构位置pEG1717T687C,A692G,C932T,A938C,T942G,G949A,T954CpEG1718T931A,A933G,T935C,T936A,A938C,T939C,T942C,T945A,G951T,T954CpEG1719T931G,A933C,T936G,T942C,C943T,T945A,C946G,G948C,T954CpEG1720T861C,T866C,C868A,T871C,T872G,A875T,T877A,C878G,A882GpEG1721T687C,A692G,C932TpEG1722T931A,C932T,A933C,T936C,T942G,T945A,T954CpEG1723T931A,C932T'A933C,T936C,A937G,A938T,C941A,T942C,T945A,C946A,A947T,A950T,T954CpEG1724A933C,T936C,A937G,A938T,C941A,T942C,T945A.C946A,A947T,A950T,T954CH231R,S311L,N313T,E317KS311T,L312P,N313T,E3I7NS3UA,Q316D1289T,L291R,Y292F,S293RH231R,S311LS31IIS31,N3I3HN313V,T314N,Q316M,E317Va6,lpl,a8la7,pia6,lpl,a8巾l,a8ipi,a8200710141972.2转溢齿^134/415M表11(续)质粒c,&*DNA^列C0'3Bb*的猛醋列改变的结构位置pEG1725A933T,A938G,T939G,T942A,T944C,T945A,A947T,G94盯,A950C,T954CpEG1726A860T,T861C,G862A,C868T,G869T,T。71C,A873T,T877A,C878G,A879TpEGl727C868G,G869TpEG,A494GpEG1046G479A,A481C,A482C,A484C,G485A,A486C,A494GpEG陽A865G,T877CpEG1052G479A,A481C,A482C,A484C,G485A,A486C,A494G,A865G,T877CpEG1054T309A,A310,A3H,A3I2pEG眼A565G,A566GpEG,T309A,A310,厶3U,厶312,G479A,A481C,A482C,A484C,G485A,A486C,A494GN313R,L315P,Q316L,E317AY287F,D288N,R290LR290VD165GS160N,K161P,P162H,D165G1289V,S293PS160N,K161P,P162H,D165G,1289V,S293P脂3E,AA104K189GD103E,厶A104,S160N,K161P,P162H,D165Gipi,a8lcx7,plla7,pioc4a4Ict7,fila4,lcx7,(31la2a,2bla4,5la2a,2bot4<table>tableseeoriginaldocumentpage143</column></row><table>5.27实施例27—Cry3Bb+蛋白的表达5.27.1培养条件用标准配方制备LB琼脂(Maniatis等,1982).淀粉琼脂得自DifcoLaboratories(Detroit,MI)并另外补充有5g/l的琼脂.C2液体培养基如Donovan等人所描述的(I988)'a液体培养基有时候不含有磷酸緩冲液(C2-P).所有的培养基均在25至30。C温育,同时给液体培养基振荡(150rpm)直到形成孢子并发生裂解。5.27.2转化条件通过Macaluso以及Mettus(1991)的电穿孔方法把pEG1701及其衍生物引入一种结晶晶体的(acrystalliferious"的苏云金芽胞杆菌变种kurstakiEG7566(Baum,1994)或EG10368(美国专利5,322,687)中。在一些情形中对这种方法进行如下的修改以获得最大数量的转化体。让接受体苏云金芽胞杆菌菌抹在30。C于LB琼脂过夜生长之后把它接种到加有0.5%甘油的心脑培养液中,生长到光密度值(600min)大约为0.5,于冰上冷冻10分钟,用EB洗2次,然后重悬为1/50体积的EB.经过转化的细胞在LB琼脂或淀粉琼脂(加有5ug/ml的氯霉素)中筛选.通过视觉对菌落进行筛选以鉴定能够产生晶态蛋白的转化体;这些菌落通常都比不产生晶态蛋白的菌落更不透明.5.27.3菌抹和蛋白设计把含有一个编码经过改变的Cry3Bb+蛋白的经过改变的cry3Bb承基因用一个"EG"号码标示,如EG11231.把经过改变的Cry犯b+蛋白称为Cry3Bb再加上菌抹号码,如Cry3Bb.11231,把在某一个结构位置有改变的蛋白的集合称为Cry3Bb再加上结构位点,如Cry3Bb.lp2,3。在表12中列出与本发明相关的质粒、含有这些质粒的新的苏云金芽胞杆菌菌抹、所使用的生结晶体的苏云金芽胞杆菌接受者菌抹、以及这些新菌抹所生产的蛋白。5.28实施例28—Cry3Bb-60的产生和性质筌定5.28.1Cry3Bb-60的产生让生产Cry3Bb的菌抹EG7231(美国专利5,187,091)在加有3mg/ml的氯霉素的C2培养基中生长.在产生孢子并发生裂解之后,把培养基用水清洗,用Cody等(1992)的NaBr增溶及重结晶方法纯化Cry3Bb蛋白,用BCAProteinAssay(Pierce,Rockford,IL)确定蛋白的浓度.把重结晶的蛋白每100mg溶解在10ml50mM的K0H中,并用100mM的CAPS(3-[环己胺]-l-丙磺酸,pH9.0)把pH值緩冲在9.0。用胰蛋白酶处理可溶毒素,重量比为每50mg毒素用ling的胰蛋白酶,在室温下作用20分钟至过夜.胰蛋白酶在蛋白中存在的精氨酸和赖氨酸残基的羧基端剪切蛋白。对于8剂量生物学筌定法,稍微改变溶解的条件以增加蛋白的浓度在12.77mg/ml的经过纯化的Cry3Bb+悬浮液中逐滴加入2.7ml的50mM的KOH直到晶体溶解.然后用IOOmM的CAPS(pH9.0)把体积调节到7ml,表12带有改变的cry3Bl^基因的质粒被转化到苏云金芽胞杆菌中<table>tableseeoriginaldocumentpage145</column></row><table>表12(续)<table>tableseeoriginaldocumentpage146</column></row><table>5.28.2Cry3Bb-60的分子量的确定通过SDS-聚丙蟑酰胺凝胶电泳(SDS-PAGE)分析,使用商业性的分子量标记来确定占主要的、胰蛋白酶降解的Cry3Bb片段的分子量。把降解的片段称为Cry3Bb-60,没有观察到这个60kD降解产物有发生进一步的降解,5.28.3Cry3Bb-60的N-末端的确定为了确定Cry3Bb-60的氨基端序列,通过SDS-PAGE分步收集胰蛋白酶的降解产物并在常规的western免疫印迹步骤之后把其转移到I咖oobilonTM-P膜(MilliporeCorporation,Bedford,MA)上。转移之后,用水清洗膜2次,然后用O.025%的考马氏亮蓝1-250加40%甲醇染色5分钟.用剃须刀片切下Cry3Bb.60条带.在TuftsMedicalSchool,DepartmentofPhysiology(Boston,MA),使用标准的Edman降解步骤测定氨基端的序列.确定其氨基端的序列为SKRSQDR(序列编号96),对应于Cry3Bb的第160-166位氨基酸,胰蛋白酶在氨基酸R159的羧基端产生降解,从而除去了螺旋l-3.5.29实施例29--Cry3Bb+蛋白的生物活性5.29.1培养条件和蛋白浓度的确定用于l剂量生物学鉴定法的培养物在加有5ug/Inl氯霉素的C2-P(C2-P/cm5)中生长,然后用3倍体积的0.005%Triton叉-100@稀释.没有确定这些培养物的蛋白浓度.用于8剂量生物学筌定法的培养物在C2/cm5中生长,用1-2倍体积的无菌水清洗1-2次并重悬于1/10体积的无菌的O.005%TritonX-100t。根据Brussock以及Currier(1990)的方法确定每种浓缩液的毒素蛋白的浓度,其中省略了用3M的HEPES进行处理的步骤,用0.005%TritonX-10(^把蛋白的浓度调节到3.2mg/ml以供最高剂量化验使用.用如9.l节中所述的方法生产并定量用于8剂量生物学筌定法的Cry3Bb.60.5.29.2昆虫的生物学筌定法根据Staney等(1992)的方法培养Diabroticaundeci扭punctatahovardiBarber(南部谷物食根虫或SCRW〉以及DiabroticavirgiferavirgifieraLeConte(西部谷物食根虫或SCRW)幼虫,根据Slaney等(1992)的方法进行8剂量化验和probit+分析。每个剂量(50ul样品/食物的孔,表面积175mm2)试验32只幼虫。阳性对照是野生型的生产Cry3Bb的菌抹EG11037或EG11204.所有的生物学筌定法都是用128孔板进行的,每一孔中含有大约lml的食物,盖有穿孔的聚脂薄膜(C-DInternationalInc.,Pit迈an,NJ),l剂量的筌定法以大致相同的方法进行,只是对每一菌抹只进行一次剂量的试验.所有的试验至少重复2次。5.29.3昆虫生物学筌定法的结果对抗SCRW的单剂量化验把l-剂量化验的结果表达为试验菌抹与野生型相比的相对死亡率(RM,实验培养物的死亡率(%)/野生型培养物的死亡率(%)).通过反复的对抗SCRW幼虫的l剂量化验可以把来源于通过PCir方法构建的的Cry3Bb蛋白与其它的改变了的但是没有改善的Cry3Bb蛋白区分开来.那些与野生型Cry3Bb比较(或者对于含有多个改变位点的蛋白,与"父代"的经过改变的Cry3Bb蛋白比较)活性提高的蛋白(定义为RM21.5),则通过8剂量化验进一步进行筌定,由l-剂量化验的结果(来源于在一个单一的结构区域,如1P2,3,中含有随机或半随机改变的蛋白)产生的总体的RM"样式"可以被用于确定这些结构区域是否具有重要的生物学活性.野生型活性(RM-l)的保持表明改变在该区域得到了容忍。活性的全部丧失(RM<l)表明该区域对于生物学活性具有重要作用.5.29.4Cry3Bb.1P2,3:对抗SCRW的单剂量化验的结果Cry3Bb.l卩2,3蛋白是一个在Cry3Bb的102,3区域(见5.3.4节)改变了的蛋白的集合。这些改变的蛋白的l-剂量化验的典型的结果示于图12中.Cry3Bb.1P2,3蛋白的RM值小于1,少数几个接近l,这表明这一区域对于毒性是很重要的.5.29.5Cry3Bb.1P6,7:对抗SCRW的单剂量化验的结果Cry3Bb.lp6,7蛋白是一个在Cry3Bb的l卩6,7区域(见5.3.5节)改变了的蛋白的集合.这些改变的蛋白的l-剂量化验的典型的结果示于图13中,Cry3Bb.1P6,7蛋白的RM值除了少数几个接近1以外,其它的都小于l,这表明这一区域对于毒性是很重要的.5.29.6Cry3Bb.ipiO,11:对抗SCRW的单剂量化验的结果Cry3Bb.1卩10,ll蛋白是一个在Cry3Bb的lp10,11区域(见5.3.6节)改变了的蛋白的集合.这些改变的蛋白的l-剂量化验的典型的结果示于固14中.Cry3Bb.ipiO,ll蛋白的RM值除了少数几个接近l以外,其它的都小于l,这表明这一区域对于生物活性是很重要的。5.29.7昆虫生物学鉴定法结果对抗SCRW的8-剂量化验的结果8-剂量化验的结果表示为1^5。值(导致50%死亡率的蛋白浓度),置信区间(confidenceinterval)为95%,显示对抗SCRW幼虫的活性提高的改变的Cry3Bb蛋白的置信区间为95W的LCs。值以及同时确定的野生型Cry3Bb对照的LCs。值在表13中列出,表13还列出了每种改善的蛋白相对野生型的活性的级数增加,表13用重复的8-剂量化验对被设计的Cry3Bb蛋白对抗SCRW幼虫的能力进行试验以确定LC50值<table>tableseeoriginaldocumentpage149</column></row><table>表13(续)<table>tableseeoriginaldocumentpage150</column></row><table>5.29.8昆虫生物学筌定法的结果对抗WCRW的8-剂量化验WCRW幼虫非常细小,不容易处理.因此在8-剂量化验中,只有对一些显示对抗SCRW幼虫的活性有改善的设计的Cry3Bb试验了其对抗WCRW幼虫的活性.在表14中示出了设计的Cry3Bb蛋白的LCs。值以及同时确定的野生型Cry3Bb对照的LCs。值表14<table>tableseeoriginaldocumentpage150</column></row><table>5.30实施例30—通道的活性用Slatin等(1990)描述的方法测量了由Cry3Bb以及它的一些衍生物产生的离子通道。在一些情况中,脂双层是用磷脂酰乙醇胺(PE):磷脂酰胆碱(PC)4:1的混合物制备的.毒素蛋白是用12mMKOH从经过清洗的C2培养基中的苏云金芽胞杆菌培养物溶解的.离心除去孢子和其它的碎片,把10ug的溶解的毒素蛋白加入到膜小室的cis小室(4.5ml)中.用BCAProteinAssay(Pierce)确定蛋白的浓度.5.30.1野生型Cry3Bb的通道活性当暴露于黑脂膜时,Cry3Bb形成了导率状态各不相同的离子通道.由Cry3Bb形成的通道很少是不连续的通道,它们开启和关闭状态界限分明,通常需要把毒素与膜一起温育30-45分钟才能观察到类似于通道的事件.在形成初始的导率之后,尺寸在2小时内从大约200pS增加到大约10,000pS.只有那些小的导率(£200pS)是电压依赖性的.在200pS以上,导率是完全均衡的.Cry3Bb通道同时还表现出依赖于p-巯基乙醇的激活,在膜小室的cis小室中加入p-巯基乙醇2分钟之后从大约为200pS的小的导率生长到几千pS.5.30.2Cry3Bb.11032当增溶的毒素蛋白被加入到膜小室的cis小室中时,Cry3Bb.11032的通道活性更象野生型的Cry3Bb,然而,当通过在有Cry3Bb.11032蛋白存在的情况下形成或"绘制"膜时,把该蛋白人工地结合到膜中时,可以观察到通道的初始导率增加了16倍(-4000pS).这一现象在野生型的Cry3Bb中没有观察到,5.30.3Cry3Bb.11035当暴露于人工膜时,Cry3Bb.U035蛋白自发地形成通道,这些通道在相对较短的时间内(~5分钟)生长为大的导率,导率介于3000-6000pS之间,而且类似于野生型的Cry3Bb,在低导率值时是电压依赖性的.5.30.4Cry3Bb.11048Cry3Bb.U048蛋白并不形成通道,但却形成均匀的孢子(相对电压而言),就这一点而言,它与野生型Cry3Bb很不一样.一旦形成孢子,它仍保持开启并允许一个稳定的导率(介于25-130pS之间).5.30.5Cry3Bb.11224以及Cry3Bb.11226在Cry3Bb.11224和Cry3Bb.U226蛋白中,由H231形成的野生型Cry3Bb的金属结合位置在二体结构中被除去,由两种设计的蛋白所形成的导率与野生型Cry3Bb的是一样的,只是两种设计的蛋白都不具有依赖于P-巯基乙醇的激活.5.30.6Cry3Bb.11221已经发现Cry3Bb.11221蛋白可以迅速地形成100-200pS的小的通道,它的电压依赖性有限.在负电位观察到更高的导率.在其它研究中,活性的产生被延迟27分钟,这在野生型Cry3Bb中更为典型。然而,不同于野生型Cry3Bb的是,Cry3Bb.11221形成了高分辨的、600pS的通道,通道的开启状态很长.该蛋白最终达到7000pS的导率,5.30.7Cry3Bb.11242Cry3Bb.11242蛋白在暴露于人工膜之后立即形成小的导率,导率在大约3分钟内稳定、迅速地生长到6000pS。观察到一些电压依赖性,特别偏爱反向电位.5.30.8Cry3Bb.11230不同于野生型Cry3Bb,Cry3Bb.11230形成界限分明的通道,它的开启状态长,而且其导率不随时间生长.观测到的最大的导率达到3000pS,图15固解了由Cry3Bb和Cry3Bb.11230所形成的通道的区别。5.30.9Cry3Bb.60Cry3Bb.60在暴露于人工膜20分钟内形成界限分明的通道.这些通道的导率和频率随着时间生长。Cry3Bb.60在平面脂双层中的行为在两方面不同于Cry3Bb.Cry3Bb.60所创造的导率形成得比Cry3Bb更为迅速,而且不同于Cry3Bb的是,这个导率是稳定的,具有稳定的离子通道典型的界限分明的开启和关闭状态(图16).5.31实施例31—引物组合物<table>tableseeoriginaldocumentpage152</column></row><table>表17<table>tableseeoriginaldocumentpage153</column></row><table>表18<table>tableseeoriginaldocumentpage153</column></row><table>表19<table>tableseeoriginaldocumentpage153</column></row><table><table>tableseeoriginaldocumentpage154</column></row><table>表23序列编号92<table>tableseeoriginaldocumentpage155</column></row><table>5.32实施例32—Cry3Bb的原子坐标Cry3Bb蛋白的原子坐标在9.l节的附录中给出.5.33实施例33—Cry3A的原子坐标Cry3A蛋白的原子坐标在9.2节的附录中给出,5.34实施例34—修饰Cry基因以便在植物中表达已知野生型的cry基因(全长或截短的)在植物中表达很差。典型地,cry基因中的G+C含量少(37%)而且通常含有许多富含A+T的区域、潜在的多聚腺苷酰化作用位点和许多ATTTA序列.表25示出了潜在的腺苷酰化作用的序列清单,这些序列在制备"植物化"基因构建物时可以被避免.表25潜在的多聚腺苷酕化信号的序列清单AATAAA*AAGCATAATAAT*ATTAATAACCAAATACATATATAAAAAATAAATCAAATTAAA林ATACTAAATTAA林ATAAAAAATACA林ATGAAACATAAA林*表示一个潜在的主要植物多聚腺苷酰化作用位点。**表示一个潜在的次要的动物多聚腺苷酰化作用位点。所有其它的表示的是潜在的次要的植物多聚腺苷酰化作用位占"、、0突变区域可以如下进行选择。筌定cry基罔的DNA序列中的含有5个以上连续的A或T碱基对的所有区域,根据它们的长度和在多于20-30碱基对区域的周围序列中A+T百分最高含量情况排出次序,对DNA进行分析以确定那些可能含有多聚腺苷酰化作用位置或ATTTA序列的区域,然后设计一些低聚核苷酸,使其最大可能地消除含有多聚腺苷酰化作用位点或ATTTA序列的A+T连续区域。根据已发表的报道,有两个植物多聚腺苷酰化作用位点显示出具有更重要的作用.选择可以增加G+C含量、但是不产生适合那些对克隆和经过修饰的基因的组装有用的酶(如BamHI,BglII,Sacl,Ncol,EcoRV等)的限制性酶切位点的密码子.类似地,避免使用含有两个碱基TA或GC的密码子,据报道它们是在植物中不频繁出现的密码子.虽然CaMV35S启动子在大多数植物组织中通常是一个高度组成型的启动子,但是由CaMV35S启动子启动的基因表达的水平在花组织中比在叶组织中所观察到的要低。因为给一些昆虫损害的具有经济重要性的目标是花部分或来源于花部分;如cottonsquare和棉铃、烟草花蕾、番茄花蕾和果实,所以增加晶体蛋白在这些組织中的表达(较之于由CaMV35S启动子所获得的表达)通常是有利的.玄参花叶病毒(FMV)的35S启动子是CaMV35S启动子的类似物,这一启动子已经被分离出来并设计在一个植物转化栽体中.与CAMV启动子相比,FMV35S启动子在花组织中高度表达,同时在其它的组织,如叶子,中也提供了类似的高水平的基因表达.可以设计一个植物转化栽体,在这个栽体中全部长度的cry基因由FMV35S启动子来启动.烟草植抹可以用这一栽体进行转化,并用Western印迹或ELISA免疫测定法来比较晶体蛋白在叶和花组织中的表达情况。FMV启动子已经被用于在花组织中生产相对高水平的晶体蛋白(相对于CAMV启动子).5.35实施例35-合成的cry基因和ssRUBISC0启动子以及叶绿体转运肽的表达植物中编码RUBISCO小亚基(SSU)的基因通常是高效表达的,它是由光调控的,有时候显示组织特异性。这些表达特性很大程度上是由这些基因的启动子序列造成的。已经可以用SSU启动子在经过转化的植物中表达异源的基因.典型地,一种植物会含有多个SSU基因,而且对于不同的SSU基因,其表达的水平和组织特异性是不同的.SSU蛋白在核中编码,在细胞质中以前体的形式合成,该前体含有一个被称为叶绿体转运肽(CTP)的N末端延伸.CTP引导前体进入叶绿体并促进SSU蛋白被摄取进入叶绿体.在这个过程中,CTP被从SSU蛋白中剪切下来,这些CTP序列已经被用于引导异源代表进入经过转化的植物的叶绿体,SSU启动子由有许多在植物中表达异源基因的优点.有一些SSU启动子是高效表达的,其表达的水平与CAMV35S的一样高,甚至更高.SSU启动子表达的组织分布与CAMV35S启动子的有所不同,所以当要控制一些害虫时,可以有利地把晶体蛋白的表达指向那些SSU得到最高效表达的细胞.例如,虽然CAMV35S启动子是相对具构成性的,但是在叶子中,它在导管组织中的表达效率比在叶子的其它部位中的都要高,而大部分SSU启动子在叶子的叶肉细胞中有最高效的表达.一些SSU启动子也是更具有组织特异性。所以可以利用一个特定的SSU启动子来仅仅在一个植物组织的子集中表达本发明中的蛋白,如果例如发现这一蛋白在某种特定的细胞中的表达对这些细胞是有害的.例如,为了控制马铃薯中的科罗拉多薯虫,有利地可以使用SSU启动子来把晶体蛋白的表达指向叶子,而不是指向可以食用的块茎。使用SSUCTP序列把晶体蛋白定位到叶绿体中可能是有利的.把苏云金芽胞杆菌晶体蛋白定位到叶绿体可以可以保护这些叶绿体不受那些发现于细胞质中的蛋白水解酶的作用,这可以稳定蛋白并导致活性毒素的高水平聚集。Cry基因可以与SSU启动子或其它的启动子(如CAMV35S)结合使用.5.36实施例36-用信号肽把Cry+蛋白导向细胞外空间或液泡此处所描述的用合成基因生产的苏云金芽胞杆菌蛋白被定位到植物细胞的细胞质中,这一细胞质定位导致植物具有杀虫效力.为了某种目的,把苏云金芽胞杆菌蛋白指向植物细胞的其它隔室是有利的。把苏云金芽胞杆菌蛋白定位于细胞质以外的其它隔室将导致苏云金芽胞杆菌蛋白更少暴露于细胞质蛋白水解酶,从而使得蛋白更多地积累,使杀虫活性增强.细胞外定位会导致某些昆虫更有效地暴露于苏云金芽胞杆菌蛋白中,从而使效力更高.如果发现苏云金芽胞杆菌蛋白对植物细胞功能有害,那么把它定位到一个非细胞质隔室就可以保护这些细胞免受这些蛋白的破坏.在植物和其它的真核生物中,注定要定位于细胞外或几个特定的隔室中的蛋白典型地都被合成带有一个称为信号肽的N末端氨基酸区段,这一信号肽引导蛋白进入隔室化途径(compartmentalizationpathway),而且典型地在隔室化的一个早期步骤中即被从成熟的蛋白中剪切下来.对于一个细胞外蛋白而言,分泌途径典型地包括共转录插入到内质网中,此时信号肽被剪切.接着成熟的蛋白通过高尔基体进入与质膜融合在一起的小泡,从而把蛋白释放进入细胞外空间.定位到其它隔室的蛋白也遵从类似的途径。例如,定位于内质网或高尔基体的蛋白遵从这一方案,但是它们特定地保留在合适的隔室中。在植物中,有一些蛋白也定位到液泡中,液泡是存在于许多植物细胞的细胞质中的另外一个结合于膜上的隔室.定位于液泡的蛋白在高尔基体处与上述的途径分叉开来,在高尔基体,它们进入与液泡融合在一起的小泡中,蛋白定位的一个共同的特征是启动隔室化过程的信号肽.在许多情形中,把信号肽融合到蛋白中将导致该蛋白定位到内质网,这一步骤的效率同时也将取决于成熟蛋白本身的序列。把一个蛋白引入一个特定的隔室,而不是引入细胞外空间的信号没有很清楚的定义.看起来许多引导蛋白到达特定隔室的信号是包含于成熟蛋白的氨基酸序列中的.一些定位于液泡的蛋白就是这样的,但是仍无法精确地定义这些序列。看起来分泌到细胞外空间是那些含有一个信号序列而不是区分信号的蛋白的"缺省"途径,因此,把苏云金芽胞杆菌蛋白导出细胞质的一个策略是把合成的苏云金芽胞杆菌基因融合到编码已知植物信号肽的DNA序列中.这些融合基因将产生进入分泌途径的苏云金芽胞杆菌蛋白,并导致细胞外分泌或定位到液泡或其它的隔室.几种植物基因的信号肽已经被描迷.其中的一个序列是针对烟草致病相关蛋白PRlb,这个蛋白已经被描述(Comelissen等,1986).PRlb蛋白正常是定位于细胞外空间的'另外一种类型的信号肽包含于豆类的种子储存蛋白中。这些蛋白定位于种子的蛋白体中,蛋白体是一种存在于种子中的类似于液泡的隔室。刀豆(Phaseolitsvulgaris)7S储存蛋白的p亚基的一个信号肽DNA序列一PuvB—已经被描述(Doyle等,1986)。根据这些发表的序列可以用编码PRlb和PuvB的信号肽的低聚核苷酸来化学合成基因.在一些希望分泌或隔室化异源蛋白的情形中,必需包括在信号肽正常剪切位点之外的一些氨基酸序列.这是确保信号肽能被正确剪切所必需的。5.37实施例37-用Cry3Bb变体分离Diabrotica种类抗性的转基因玉米5.37.1植物基因构建以双链DNA的形式存在的植物基因的表达包括信使RNA(mRNA)用RNA聚合酶从一条DNA链进行转录,以及随后mRNA的初始转录产物在核中的加工。这一加工过程包括一个3,端没有被转录的区域,它给RNA的3,端添加了多聚腺苷酸,DNA转录为mRNA是由一个通常被称为"启动子"的DNA区域调控的。启动子区域含有一个碱基序列,它给RNA聚合酶发送信号让其与DNA联合并启动mRNA转录,用其中的一条DNA链作为模板制造一条相应的RNA链,已有文献报道了一些在植物细胞中有活性的启动子.这些启动子可以从植物或植物病毒中获得,包括但不局限于胭脂碱合酶(NOS)以及章鱼碱合酶(OCS)启动子(它们带有Agrobacteriumtumefaciens的诱导肿瘤的质粒)、花椰菜花叶病毒(CAMV)19S和35S启动子、来源于核嗣糖l,5-二磷酸羟化酶小亚基((ssRUBISC0,一种丰富的植物多肽)的光诱导启动子、以及玄参花叶病毒(FMV)35S启动子.所有这些启动子已经被用于创造不同类型的DM构建物,这些构建物已经在植物中表达(见,例如美国专利No.5,463,175,该专利被特定地作为参照结合于此文中).所选择的特定的启动子应是能够导致编码酶的序列充分表达以生产有效数量的蛋白.优选的一套启动子是组成型的启动子,如能够在大部分植物器官中高水平表达的CaMV35S或FMV35S启动子(美国专利No.5,378,619,该专利被特定地作为参照结合于此文中).另外一套优选的启动子是根增强的或特异的启动子,如来源于CAMV的4as-l启动子或小麦POXl启动子(美国专利No.5,023,179,该专利被特定地作为参照结合于此文中;Hertig等,1991),根增强的或特异的启动子对于控制转基因谷物中的谷物食根虫(Diabrolicus种类)是特别优选的,在本发明的DNA构建物(即嵌合植物基因)中所使用的启动子如果需要,可以被修饰以影响它们的控制特征,例如,CaMV35S启动子可以被连接到ssRUBISCO基因中在无光时抑制ssRUBISCO表达的那一部分上,以创造一个在叶子上有活性而在根上无活性的启动子.如此获得的嵌合体启动子可以被如此处所述进行使用.在本发明的描述中,短语"CaMV35S"启动子因此包括CaMV35S启动子的变体,如通过与启动子区域连接、随机或受控突变等而获得的启动子。进而,这些启动子可以被改变以含有多个"增强子序列"来协助提高基因的表达。由本发明的DNA构建物产生的RNA也含有一个5,端非翻译引导序列.这一序列可以来源于被选择来表达基因的启动子,而且可以被特定地进行修饰以便增加mRNA的翻译。5,端非翻译区域可以得自病毒RNA、合适得真核细胞基因、或者合成的基因序列。本发明并不局限于那些非翻译区域是来源于伴随着启动子序列的5,端非翻译序列的构建物。为了优化在单子叶植物(如玉米)中的表达,必需在DNA表达构建物中包括一个内含子.这一内含子必需典型地被设置于靠近mRNA5,端非翻译序列中.这一内含子可以得自(但不局限于)含有玉米hps70的一套内含子(美国专利No.5,424,412;该专利被特定地作为参照结合于此文中)或稻谷Actl内含子(McElroy等,1990).如下所示,玉米hps70内含子在本发明中是有用的.如上所注释的,本发明的嵌合植物基因中非翻译区域含有一个多聚腺苷酰化作用信号,这个信号在植物中的功能是导致在RNA的3,端添加腺苷酸.优选的3,区的例子有(l)含有致瘤农杆菌(Ti)的质粒基因(如胭脂碱合酶(NOS)基因)的多聚腺苷酰化作用信号的3,端转录、非翻译区域;以及(2)植物基因,如碗豆ssRUBISCOE9基因(Fischhoff等,1987),5.37.2植物转化和表达含有本发明结构编码序列的嵌合植物基因可以被以合适的方法插入到植物的基因组中.合适的植物转化载体包括那些来源于AgrobacteritimlumefaciensTi质粒的栽体,以及那些由,例如Herrera-Estrella(1983)、Bevan(1983)、Klee(1985)以及欧洲专利申请出版No.EP0120516所公开的载体.除了来源于农杆菌Ti或根诱导(Ri)质粒的植物转化栽体以外,可以用可选的方法把本发明的DNA构建物插入到植物细胞中.这类方法可以包括,例如使用脂质体、电穿孔、增加游离DNA摄取的化学剂、通过微粒抛射轰击游离传递DNA、以及使用病毒或花粉进行转化(Fromm等,1986;Armstrong等,1990;Fromm等,1990).5.37.3构建用于cry3Bb变体的单子叶植物表达栽体5.37.3.1设计用于植物表达的Cry3Bb基因变体为了有效地在转基因植物中表达cry3Bb变体,那些编码变体的基因必需含有合适的序列组合物(Diehn等,1996).这类序列的一个例子是vll231基因(序列编号99),它编码具有Diabrotica活性的Cry3Bb11231变体蛋白(序列编号100).这一基因是通过cry3Bb合成基因(序列编号lOl)的突变(Kunkel,1985)获得的,上述的cry3Bb合成基因所编码的蛋白与天然cry3Bb基因(GenBank访问号码m89794,序列编号102)所编码的蛋白是同源的。下列的多聚核苷酸被用于突变初始的cry3Bb合成基因(序列编号101)以创造vll231基因((序列编号99)。低聚弁l:5'-TAGGCCTCCATCCATGGCAAACCCTAACAATC-3'(序列编号103)低聚#2:5,-TCCCATCTTCCTACTTACGACCCTGCAGAAATACGGTCCAAC-3,(序列编号104)低聚#3:5,-GACCTCACCTACCAAACATTCGATCTTG-3,(序列编号105)低聚#4:5,-CGAGTTCTACCGTAGGCAGCTCAAG-3,(序列编号106)5.37.3.2构建Cry3Bb单子叶植物表达栽体为了把cry3Bb变体基因vll231放置在一个适合在单子叶植物中表达的栽体中(即接受经过增强的花椰菜花叶病毒35S启动子的控制并连接到hsp70内含子上,再接一个胭脂碱合成酶多聚腺普酰化作用位点,如美国专利No.5,424,412中所述,该专利被特定地作为参照结合于此文中),用NcoI和EcoRI酶解栽体pM0N19469。电泳分离、纯化大约为4.6kb的的较大的栽体条带并把它用T4DNA合成酶连接到含有vll231基因(序列编号99)的大约为2kb的NcoI-EcoRI片段上.把连接混合物转化到大肠杆菌中,回收具有羧千青霉素抗性的菌落并用DNAminipr印步骤回收质粒DM.用例如NcoI和EcoRI(同时)、Notl、以及Pstl对这一DNA进行限制性内切酶分析以筌定含有pMON3M08的菌落,pM0N33708是通过vll231编码序列在经过增强的CaMV35S启动子的控制下融合到hsp70内含子中获得的.为了把vll231设置在一个适于回收经过稳定转化的抗虫植物的栽体中,通过电泳和纯化把来源于pMON33708的含有赖氨酸氧化酶编码序列(后者在经过增强的CaMV35S启动子的控制下融合到hsp70内含子中)分离出来。把这一片段连接到经过NotI以及小牛肠碱性磷酸酶处理的pM0N30460中,其中pMON30460含有受控于CAMV35S启动子的新霉素磷酸转移酶编码基因。通过把这一转化混合物转化到大肠杆菌中来获得卡那霉素抗性菌落,通过对质粒miniprepDNA进行限制性内切酶酶解来鉴定含有pMON33710的菌落.可以用限制性内切酶,如NotI、EcoRV、HindIII、Arcol、EcoRI、以及BglII来筌定在pMO謂460的Notl位点含有pM0N33708的Notl片段的合适的菌落(即PM0N33710),其取向是使得两个基因是前后相连的(即vll231表达盒的3,端连接到叩tll表达盒的5,端).在谷物原生质体中pM0N33710对vll231蛋白的表达可以通过以电穿孔的方法把pMON33710DNA导入原生质体中然后再进行蛋白印迹和ELISA分析来得以验证。这一栽体可以通过基罔枪轰击导入谷物胚胎的基因组DNA中,然后再通过巴龙霉素选择来获得表达vll231基因的谷物,如美国专利No.5,424,412所述,该专利被特定地作为参照结合于此文中),在一个实施例中,通过共同轰击把载体和潮霉素抗性赋予质粒一起引入玉米未成熟的胚胎角质鳞片(immatureembryoscutella,IES)中,然后用潮霉素进行选择和再生,用ELISA分析来筌定表达v11231蛋白的转基因玉米抹系。随后测试这些事件所获得的子代种子抵抗Diabrotica喂食的效果,5.37.3,3Cry3Bb.11231在植物中的表现在幼苗和10英尺盆養定法同时测验表达Cry3Bb.11231蛋白的经过转化的谷物植抹抵抗西部谷物食根虫(WCR)幼虫的能力.经过转化的基因型是A634,其中对R0和A634杂交的子代进行了评估。观察包括对幼虫发育(体重)的影响、根损伤速率(RDR)、以及蛋白的表达。含有cry3Bb基因的转化载体是pM0N33710。处理包括积极和消极的同种群(isopopulation〉处理以及A634检查。幼苗的鉴定法包括以下步骤(i)在含有盆土的l盎司的杯子中放置单个的种子;(ii)抽穗(spiking)时,每抹幼苗用4只幼虫进行侵袭;以及(iii)在侵袭之后,幼苗在25。C、50%湿度以及14:IO(L:D)的条件下保温7天,在保温的时间内,给盆土添加足够的水分以维持幼苗的活力.IO英尺鉴定法包括以下步骤(i)把单个的种子放置在含有盆土的10英尺盆中;(ii)在栽种14天后,每一盆用800个虫卵进行侵袭,其中虫卵已经预先进行温育以便在侵袭后第5天能够掉化;以及(iii)在侵袭之后,在与幼苗鉴定法一样的条件下把植物保温4天,每天从盆顶和盆面给盆洗水。在幼苗鉴定法中,在第7天计算根的损伤速率并称量存活的幼虫的重量。与此同时,用ELISA确定根部Cry3Bb蛋白的浓度.在幼苗鉴定法中用于评估根损伤的衡量如下RDR(根损伤速率)O=没有可见的摄食;RDR1=很轻的摄食;RDR2=轻的摄食;RDR3=中等摄食;RDR4=严重摄食;RDR5=非常严重的摄食.表26示出了幼苗鉴定法的结果。表达Cry3Bb蛋白的植物可以完全地杜绝WCR的摄食,其中存活的幼虫在处理期间并没有生长.没有表达的处理中,平均幼虫的重量介于2.03-2.73mg之间,而表达cry3Bb的处理中存活的幼虫的平均重量为O.11mg。没有表达和有表达的同种群的根损伤速率分别为3.86和0.33.在消极的、对照性的处理中幼虫的存活率介于75-8596之间,而在Cry3Bb处理中幼虫只有2596存活.表26在一个幼苗化验中,表达Cry3Bb的植物对WCR幼虫的影响<table>tableseeoriginaldocumentpage164</column></row><table>对于10英尺盆筌定法,在昆虫侵袭的4周之后记录植物的高度并计算根损伤的速率(Iowa1-6scale;Hills和Peters,1971).10英尺盆筌定法的结果示于表27中,表达Cry3Bb蛋白的的植物的喂食损伤显箸减少,并且比没有表达的植物更高.在事件16中,两个表达事件的较高者几乎称为完全的对照。消极的处理导致根的损伤速率很高,表明受昆虫的侵害很严重.积极处理的平均根损伤速率在事件6和16中分别为3.4和2.2.消极处理的平均根损伤速率相应地为5.0和5.6。<table>tableseeoriginaldocumentpage165</column></row><table>总之,从幼苗化验可以看出,表达Cry3Bb蛋白的谷物对WCR幼虫的发育具有显箸的生物学影响.当面对厉害的昆虫群袭时,表达Cry3Bb蛋白的植物不受WCR幼虫喂食的损害,如10英尺盆化验所示,6.0序列编号的简要描述序列编号lcry3Bb.11221基因的DNA序列,序列编号2Cry3Bb.11221多肽的氨基酸序列。序列编号3cry3Bb.11222基因的DNA序列.序列编号4Cry3Bb.11222多肽的氨基酸序列。序列编号5cry3Bb.11223基因的DNA序列。序列编号6Cry3Bb.11223多肽的氨基酸序列.序列编号7cry3Bb.11224基因的DNA序列,序列编号8Cry3Bb.11224多肽的氨基酸序列。序列编号9cry3Bb.11225基因的DNA序列。序列编号10Cry3Bb.11225多肽的氨基酸序列.序列编号11cry3Bb.11226基因的DNA序列.序列编号12Cry3Bb.11226多肽的氨基酸序列.序列编号13cry3Bb.11227基因的DNA序列。序列编号14Cry3Bb.11227多肽的氨基酸序列'序列编号15cry3Bb.11228基因的DNA序列.序列编号16Cry3Bb.11228多肽的氨基酸序列。序列编号17cry3Bb.11229基因的DNA序列。序列编号18Cry3Bb.11229多肽的氨基酸序列.序列编号19cry3Bb.11230基因的DNA序列'序列编号20Cry3Bb.11230多肽的氨基酸序列。序列编号:21cry3Bb.11231基因的DNA序列.序列编号:22Cry3Bb.11231多肽的氨基酸序列.序列编号:23cry3Bb.11232基因的DNA序列.序列编号:24Cry3Bb,11232多肽的氨基酸序列.序列编号:25cry3Bb.11233基罔的DNA序列。序列编号:26Cry3Bb.11233多肽的氨基酸序列.序列编号:27cry3Bb,11234基因的DNA序列,序列编号:28Cry3Bb.11234多肽的氨基酸序列。序列编号29cry3Bb.11235基因的DNA序列。序列编号30Cry3Bb.11235多肽的氨基酸序列.序列编号31cry3Bb.11236基因的DNA序列。序列编号32Cry3Bb.11236多肽的氨基酸序列。序列编号'33cry3Bb,11237基因的DNA序列,序列编号:34Cry3Bb.11237多肽的氨基酸序列,序列编号:35cry3Bb.11238基因的DNA序列.序列编号:36Cry3Bb,11238多肽的氨基酸序列。序列编号:37cry3Bb.11239基因的DNA序列。序列编号:38Cry3Bb.11239多肽的氨基酸序列。序列编号:39cry3Bb.11241基因的DNA序列。序列编号:40Cry3Bb.11241多肽的氨基酸序列.序列编号:41cry3Bb,11242基因的DNA序列.序列编号'42Cry3Bb.11242多肽的氨基酸序列.序列编号.43cry3Bb.11032基因的DNA序列。序列编号'44Cry3Bb.11032多肽的氨基酸序列。序列编号'45cry3Bb,11035基因的DNA序列。序列编号46Cry3Bb.11035多肽的氨基酸序列。序列编号47cry3Bb.11036基因的DNA序列,序列编号'48Cry3Bb.11036多肽的氨基酸序列。序列编号'49cry3Bb,11046基因的DNA序列.序列编号50Cry3Bb.11046多肽的氨基酸序列.序列编号51cry3Bb.11048基因的DNA序列。序列编号52Cry3Bb.11048多肽的氨基酸序列。序列l编号:53cry3Bb.11051基罔的DNA序列.序列编号:54Cry3Bb.11051多肽的氨基酸序列。序列编号:55cry3Bb.11057基因的DNA序列,序列一,r:56Cry3Bb.11057多肽的氨基酸序列.序列编号.57cry3Bb.11058基因的DNA序列.序列编号:58Cry3Bb.11058多肽的氨基酸序列.序列编号'59cry3Bb.11081基因的DNA序列。序列编号60Cry3Bb.11081多肽的氨基酸序列。序列编号61cry3Bb.U082基因的DNA序列.序列—7—62Cry3Bb.11082多肽的氨基酸序列。序列"763cry3Bb.11083基因的DNA序列。序列编号:64Cry3Bb.11083多肽的氨基酸序列.序列编号:65cry3Bb.U084基因的DNA序列,序列编号:66Cry3Bb.11084多肽的氨基酸序列.序列编号:67cry3Bb.U095基因的DNA序列。序列编号:68Cry3Bb.U095多肽的氨基酸序列。序列""^"69cry3Bb.60基因的DNA序列.序列""^""70Cry3Bb.60多欣的氨基酸序列.序列"""^"■71引物FW001序列编号:72引物FW006序列编号:73引物MVT095序列编号:74引物MVT097序列编号'75引物MVT091序列编号:76引物MVT075序列编号:77引物MVT076序列""^78引物MVT111序列编号'79引物MVT094序列80引物MVT103序列81引物MVT081序列编号'82引物MVT085序列编号:83引物A序列编号'84引物B序列编号85引物C序列编号86引物D序列编号87引物E序列编号88引物F序列编号89引物G序列编号90引物WD112序列编号91引物WD115序列编号92引物MVT105序列编号93引物MVT092序列编号94引物MVT070序列编号95引物MVT083序列编号96Cry3Bb.多肽的N端氨基酸序列.序列编号97野生型cry3Bb.基因的DNA序列,序列编号98野生型Cry3Bb.多肽的氨基酸序列.序列编号99cry3Bb.U231基因的植物化DNA序列.序列编号100植物化Cry3Bb.11231多肽的氨基酸序列。序列编号IOI用于制备序列编号99的cry3Bb.基因的DNA序列.序列编号102野生型Cry3Bb.基因的氨基酸序列,Genbank第濯9794,序列编号103低聚物ttl的DNA序列.序列编号104低聚物ft2的DNA序列'序列编号105低聚物ft3的DNA序列。序列编号106低聚物M的DNA序列,序列编号107cry3Bb.11098基因的DNA序列.序列编号108Cry3Bb.11098多肽的氨基酸序列.7.0参考文献以下参考文献提供了对本发明中所描述的进行补充的示范性的程序或其它的细节,把它们作为参照结合于本发明中.美国专利4,237,224,出版日期12/02/1980.美国专利4,332,898,出版曰期6/01/1982.美国专利4,342,832,出版曰期8/03/1982.美国专利4,356,270,出版曰期10/26/1982.美国专利4,362,817,出版曰期12/07/1982.美国专利4,371,625,出版曰期2/01/1983.美国专利4,448,885,出版曰期5/15/1984.美国专利4,467,036,出版曰期8/21/1984.美国专利4,554,101,出版曰期11/19/1985.美国专利4,683,195,出版曰期7/28/1987.美国专利4,683,202,出版曰期7/28/1987.美国专利4,757,011,出版曰期7/12/1988.美国专利4,766,203,出版曰期8/23/1988.美国专利4,769,061,出版曰期'9/06/1988.美国专利4,797,279,出版曰期'1/10/1989.美国专利4,800,159,出版日期:1/24/1989.美国专利4,883,750,出版曰期:11/28/1989.美国专利4,910,016,出版曰期:3/20/1990美国专利4,940,835,出版日期:2/23/1990.美国专利4,965,188,出版日期:10/23/1990.美国专利4,971,908,出版曰期:11/20/1990.美国专利4,987,071,出版日期'1/22/1991.美国专利5,380,831,出版日期'1/10/1995.美国专利5,023,179,出版曰期'6/11/1991.美国专利5,024,837,出版曰期6/18/1991.美国专利5,126,133,出版曰期6/30/1992.美国专利5,176,995,出版曰期10/15/1991,美国专利5,187,091,出版曰期XXXXX,1993.美国专利5,322,687,出版曰期7/21/1994.美国专利5,334,711,出版曰期8/02/1994.美国专利5,378,619,出版曰期1/3/1995.美国专利5,424,412,出版曰期6/13/1995.美国专利5,441,884,出版曰期8/15/1995.美园专利G,463,175,出版曰期:10/01/1995.美国专利5,500,365,出版曰期:3/19/1996.美国专利5,591'616,出版曰期:1/07/1997.美国专利5,631,359,出版日期美国专利5,659,123,出版曰期欧洲专利No.EP0120516.欧洲专利No.EP0360257.欧洲专利申请No.92110298.4.欧洲专利申请No.295156AI.英国专利2202328.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.国际专利申请出版No.5/20/1997.8/19/1997.W091/03162.W092/07065.W093/15187.W093/23569.W094/02595.W094/13688.PCT/US87/00880.PCT/US89/01025.W088/09812.W088/10315.W089/06700.W093/07278.Abbott,"Amethodforcomputingtheeffectivenessofaninsecticide,"/£o>".£a/o-wo/.,8:265-267,1925.Abdullaha/.,5,'owcAwfl/ogv,4:1087,1986.AlmondandDean,说oc/ie加'j/7,32:1040-1046,1993.Ane/"/.,f"A/50J"4:277-287,1985.Angsuthanasamnbate/a/.,F£A/5"A^cro6i.o/.ie".,111:255-262,1993.Armstronge/"/.,P/a"/Ce///e/.,9:335-339,1990.Aronson,Wu.Zhang,"MutagenesisofspecificityandtoxicityregionsofaB"d〃w_y/Aw/v'W'e/w'Jprotoxingene."J5ac/c'/'o/.,177:4059-4065,1995.Bagdasariane/dGe"e,16:237,1981.Baum"。/.,一,f"v/'厂o".M"o嵐,56:3420-3428,1990.Baum,'TnJ柳,anewclassIItransposableelementfromA7c/〃w■/A3咖0/.,176:2835-2845,1994.Baum'乂5flc/e〃W.,177:4036-4042,1995.Baum,Kakefuda,Gawron-Burke,"Engineeringfloo'〃!tf/Awr,'"g/em7'sBioinsec"cideswithanIndigenousSite-SpecificRecombinationSystem,"jpp/./f打Wrow,M-—,'o/..62:XXX-XXX,1996.Benbrookwa/.,/".'尸roce"/fwgs5'o五;cpo/9S6'Butterworth,Stoneham,MA,pp.27-54,1986.Bevane//.,/Vo歐,304:184,1983.Bolivare/a/.,6'e"e,2:95,1977.BrandenandTooze,'7rt,/Wwc"o"/o/Vo/eZ"S/n/c/w/"e,"GarlandPublishing,Inc.,NewYork,NY,1991.BrussockandCurrier,"Useofsodiumdodecylsulfate-polacryamidegelelectrophcnresistoquantify5w7/wjf/mW"g/e/7-"'j5-endotoxins,""AnalyticalChemistryoffiac〃/wjMwr/rtg/e"s/j,"L.A.HickleandW丄.Fitch,(Eds),AmericanChemicalSociety,WashingtonD.C.,pp.78-87,1990.Capecchi,"HighefficiencytransformationbydirectmicroinjectionofDNAintoculturedma画ali加cells,"Ce〃,22(2):479-488,1980.Caramori,Albertini,Galizzi,v,'vc>generationofhybridsbetweentwo//u/〃'"g/'em'._finsect-toxin-encodinggenes,"Ge/je,98:3744,1991.Cashmoree/a/.,Ge".£Wg.o/ZVom/j,PlenumPress,NewYork,29-38,983.Chamberst吖a/.,柳/.£"v/ro".McrC,173:3966-3976,1991,Chaue/a/.,Sc/e"ce,244:174-181,1989.Chene/o/.,MW.f&to.,20:4581-9,1992.Chen,.Curtiss,Alcantara,Dean,"MutationsindomainIofSac,7/w//rw〃'w'ew'5'S-endotoxinCryIAbreducetheirreversiblebindingoftoxintoA/flwdw",jex/abrushbordermembranevesicles,"/CTj亂,270:6412-6419,1995.Chen,Lee,Dean."Site-directedmutationsinahighlyconservedregionof&,"'〃".、//n//7'"g''my,'i'5-endotoxinaffectinhibitionofshortcircuitcurrentacross"ow-6jx;Mtfhmidguts."/Voc.Ato/.爿cr。dSc/.WS^,卯:9041-9045,1993.ChowriraandBurke,M/c/.勿'c/jAej.,20:2835-2840,1992.Clapp,"Somaticgenetherapyintohematopoieticcells.Currentstatusandfutureimplications,"C/,'rt.戶er/"a,0/.,20(1):155-168,1993.Cody,Luft,Jensen,PangbomEnglish,"PurificationandcrystallizationofinseciicidalS-endotoxinCryHlB2from5a"'〃wj//jwrj';ig,'e肌'i',"/Vo"'>w..5/r"c/.f匿/,Ge"".,14:324,1992.CollinsandOlive,S/0c/7e加.,32:2795-2799,1993.ConwayandWiclcens,/".'ZfA04/Vocew'wg,p.40,ColdSpringHarborLaboratory,ColdSpringHarbor,NY,1988.Cornelissene/"Atobaccomosaicvirus-inducedtobaccoproteinishomologoustothesweet-tastingproteinthaumatin,"Atowre,321(6069):531-532,1986.Cramer,Cohen,Merrill,Song,"StructureanddynamicsofthecolicinElchannel,"A^fo/ec.A//ov)6'o/.,4:519-526,1990.CRCHandbookofChemistryandPhysics,58'hedition,CRCPress,Inc.,Cleveland,Ohio,p.C-769,1977.Cristoue/a/.,尸/u"//Vj>w'o/,87:671-674,1988.Curiel,Agarwal,Wagner,Cotten,"Adenovirusenhancementoftransferrin-polylysine-mediatedgenedelivery,"/Voc.A^/./iow/.5W.WS"A88(19):8850-8854,1991._Curiel,Wagner,Cotten,Birnstiel,Agarwal,Li,Loechel,Hu,"High-efficiencygenetransfermediatedbyadenoviruscoupledtoDNA-polylysinecomplexes,"//ww.Gm77w.,3(2):147-154,1992.Daum,"Revisionoftwocomputerprogramsforprobitanalysis,"5i/〃.£"/owo/.Soc.爿醇.,16:10-15,1970.DeMaagd,Kwa,vanderKlei,Yamamoto,Schipper,Vlak,Stiek加a,Bosch,"DomainIIIsubstitutioninSfl"7/"5//zw〃'"gie/rn、delta-endotoxinCryIA(b)resultsinsuperiortoxicityforS/o<5top/e^r<,f/gwaandalteredmembraneproteinrecognition,"々//.£"v//"o".M'c,o6/o/.,62:1537-1543,19%,Deane"/.,AW/./Ic'必/".,14(5):2229,1986.Dhire/g/.,Ce//及epow,10:97,1991.Diehne/a/.,G狄e/.18:83-99,1996.Donovan,Dankocsik,Gilbert,Groat,Gawron-Burke,Carlton,"TheP2proteinof£aci7/if/jw"'"giertsi\svar.AwrWafc'':nucleotidesequenceandentomocidalactivity,"乂历o/.Oew.,263:561-567,1988.Doylee/"/.,J:所o/.C/ie/'261(20):9228-9236,1986.Dropulic"aUK/ro/.,66:143241,1992.Dunit二"Theentropiccostofboundwaterincrystalsandbiotnolecules,'We"ce,264:670-68x,1994.EarpandEllar,AW.J"'rfs'紐,15:3619,1987.EgliiisandAnderson,"Retroviralvectorsforintroductionofgenesintomammaliancells,"6(7):608-614,1988.Eglitis,Kantoff,Kohn,Karson,Moen,Lothrop,Blaese,Anderson,"Retroviral-mediatedgenetransferintohemopoieticcells,"Jrfv.£xp.A/ed历o/.,241:19-27,1988.Elroy-SteinandMoss,/Voc.yVa〃.^carf5W.WSA87:6743-7,1990.EnglishandSlatin,/mecf所0c/7e/w,A/o/.5/o/.,22:1-7,1992.English,Readdy,Bastian,"Delta-endotoxin-inducedleakageofRb-KandH20fromphospholipidvesiclesiscatalyzedbyreconstitutedmidgutmembrane,"/mec/21:,77-184,1991.Fischhoffe/fl/.,_S/o/7^/7"o/ogy,5:S07-813,1987.Fraleye/g/.,5!'o/T"/iwo/o\3:629-635,1985.Fraleya/.,/Voc.M,/./Jcarf<SW.6K4,80:4803,1983.Frohman,PCRTMProtocols,aGuideloMethodsandApplicationsXVIIIEd.,AcademicPress,NewYork,l柳.Fromme"//.,说o/7edmo/ogv,8:833-839,1990.Fromme/fl/.,yV彦e,319:791-793'隨.Fromm,TayJor,Walbot,"Expressionofgenestransferredintomonocotanddicolplantcellsbyelectroporation,"/Voc.Ato/./low/.&/:t/SA82(17):5824-5828,1985.Fujimurae/a/.,尸/a"/T7咖eCW/.丄e〃.,2:74,1985.Fynan,Webster,Fuller,Haynes,Santoro,Robinson,"DNAvaccines:protectiveimmunizationsbyparenteral,mucosal,andgeneguninoculations'"/Voc.Wo//,z^cac/.固,90(24):11478-11482,1993.Galitsky,Cody,Wojtczak,Ghosh,Luft,Pangbom,Wawrzak,English,"CrystalandMolecularStructureoftheInsecticidalBacterialS-EndotoxinCrylIIB2of5a"7/"jfyiw〃'"g/em''VResearchCommunicationtoEcogenInc.,Langhome,PA,1993.GaoandHuang,MW.力c,'ck21:2867-72,1993.GazitandShai,"StructuralandFunctionalCharacterizationofthea-5segmentofSac/7/i/Aw/wgv'em^5-endotoxin,"5yoc/7eOT,'s/77.32:3429-3436,1993.GazitandShai,"Theassemblyandorganizationofthea5anda7helicesfromthepore-formingdomainoffiac"/KJfAw//7gi'ert,w'.y5-endotoxin,"/5f'o/.CTem.,270:2571-2578,1995.Ge'Rivers,Milne,Dean,"Functionaldomainsof//w/'wg/e/w/.yinsecticidalcrystalproteins:refinementof//e/,'o,tow'wce"sand7h'c/iop/脂'aw'specificitydomainsonCrylA(c)'"J.历o/.C/wm..266:17954-17958,1991.GenoveseandMilcarek,/":/t/V/l/Vocei'j/"g,p.62,ColdSpringHarborLaboratory,ColdSpringHarbor,NY,1988.GilandProudfoot'Atow,e,312:473,1984.GonzalezJr.e/a/"Ato/.Jaw/.SW79:6951-6955,982.GrahamandvanderEb,"TransformationofratcellsbyDMAofhumanadenovirus5,"歸ogv,54(2):536-539,1973.Grochulski,Masson,Borisova,-Pus加i-Carey,Schwartz,Brousseau,Cygler,"j5Ww^,/;w"'"g/w'jCryIA(a)insecticidaltoxin:crystalstructureandchannelformation,".M)/.254:447-464,1995.Guerrier-Takadae/o/.,Oj〃,35:849,1983.Hampel加dTritz,S^c/kw.,28:4929,1989.Hampela/.,//"c/./4c/(&18:299,1990.HarlowandLane,"Antibodies:ALaboratoryManual,':ColdSpringHarborLaboratory,ColdSpringHarbor,NY,1988.Herrera-Estrellae/a/.,yVaAw,e,303:209,1983.Hertele/"/.,歸./Jc'fl&20:3252,1992.Hertige/fl/.,P/fl"/Afo/.5/o/.,16:171-174,1991.Hess,/歐w及ev.C>/o/.,107:367,1987,HillsandPeters,/£/j/omo/.,64:764-765,1971.Hockema,77jc5'."07y/Vow/Kec/oz*S卢抓,Offset-durkkerij,KantersB.V.,Al-blasserd咖,Chapter5.H她eandWhitely,Mcn^/o/.及ev.,53:242-255,1诉9.Hollande,a/"历odie/w/Wr乂17:4900,1978.Holsterse/o/.,嵐Ge".Ge"".,163:181-187,簡.Honee,vanderSalm,Visser,爿cWj16:6240,1988.Horsche/,5We"ce,227:1229-1231,1985.Humason,At:jw./na/7Vwwerec/m'々"es,W.H.FreemanandCompany,1%7.Jaegere/fl/.,/Voc.M//.jcorf.Sa'.OX4,86:7706-7710.1989.JohnstonandTang,"Geneguntr咖fectionofanimalcellsandgeneticimmunization,"Ce〃.,43<A):353-365,1994.Jorgensene/tf/.,舰GmGe"".,207:471,1987.KaiserandKezdy,S"'證,223:249-255,围.Kashani-Sabere/a/.油/,'JweDev.,2:3-15.1992.Keller"a/.,£柳0/,8:1309-14,1989.Kleee/a/.,5/o/7Vc/"o/ogy,3:637-642,1985.Kleine/o/.,327:70,1987.KleinWa/"/Voc.胸/./ia^..SW.脂,85:8502-8505,1988.Kozak,Mi/w,-e,308:24卜246'隨.Krieg<,o/.,/I";re/ger/"/Sc/2ac^力g^"/5(ate尸/7""2em'c/n":t/mwe/wc/iw;57:145-150,腦.Kriege/a/..Z.£"/.,%:500-508,簡.Kuby,/w附wwo/ogy2w/'£W/"'ow,W.H.Freeman&Company,NY,1994Kunkle,"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection."尸犹麵.Jc"d82:488-492,1985.Kunkle,Roberts,Zabour,A/e/Aocfe£"gwo/.,154:367-382,1987.Kwak,Lu,Dean,"Explorationofreceptorbindingof£o"7/itoxins,"Mew.Oi'vraWo,90:75-79,1995.Kwohe/。/.,/Voc.Ato/.WS/1,86(4):1173-1177,1989.KyteandDoolittle,/A/o/.5io/.,157:105-132,1982.L'Huiliere,fl/.,£A^BO.y,11:4411-8,1992.LaBeanandKaufftnan,"Designofsyntheticgenelibrariesencodingrandomsequenceproteinswithdesiredensemblecharacteristics,"/Vo/.2:1249-1254'1993.Lambert,Buysse,Decock,Jansens,Piens,Saey,Seurinck,VanAudenhove,VanRie,VanVliet,Peferoen,"A/A"h"giem7'jinsecticidalcrystalproteinwithahighactivityagainstmembersofthefamilya^c/w/d"e,"爿//j/.£m',>o".m-<to6/'o/.,62:80-86,1996.Lee,Milne,Ge,Dean,"Locationofaifo/w6y;cmo/*ireceptorbindingregionona5c-"'〃mj//wr/"g7.eww、'5-endotoxin,"/5''o/.CAem.,267:3115-3121,1992.Lee,Young,Dean,"DomainIIIexchangesofBac〃/w//jw/"g''em&CrylAtoxinsaffectbindingtodifferentgypsymothmidgutreceptors,"B/'oc/jc/w,说。//>^.Commw".,216:306-312,1995.Li,Carroll,Ellar,"CrystalstructureofinsecticidalS-endotoxinfromBa"7/wf/"W"g/mw'jat2.5Aresolution,"W。,wre(London),353:815-821,1991.Liebere/o/.,Afe/Wf£Wz;//no/.,217:47-66,1993.Lindstrom。/.,£>eve/o/wewm/Ge"ef/cs,160,1990.Lisziewiczera/.,/Voc.Ato/./^ad(/51./4.,90:8000-4,1993.Lorze,fl/.,M)/.Ge".Gc"e/.,199:178,1985.Lu,Rajamohan,Dean,"Identificationofaminoacidresiduesof5ac〃/iw^mn'"g7erwi'sS-endotoxinCrylAaassociatedwithmembranebindingandtoxicityto5om-6少;t加or/,"</Sac,eWo/,,176:5554-5559,1994.Lu,Xiao,Clapp,Li,Broxmeyer,"Highefficiencyretroviralmediatedgenetransductionintosingleisola比dimmatureandr印latableCD34(3+)hematopoieticstem/progenitorcellsfromhumanumbilicalcordblood,"乂£x;.A/ed,178(6):2089-2096,1993.MacalusoandMettus,</Bac,eWo/.,173:1353-1356,1991.Maddockwor/.,77'n^/f7/er"a"'onfl/Co"grejjo/尸/cr"fyWo/ea//flrfi/o/ogy,Abstract372,1991.Maloye/cr/.,"MicrobialGenetics"2ndEdition.JonesandBartlettPublishers,Boston,MA'1994.Maloy,"ExperimentalTechniquesinBacterialGenetics"JonesandBartlettPublishers,Boston,MA,1990,Maniatis,Fritsch,Sjimbrook,/":Mo/ecw/arC/ow'wgv^丄。6o,加oryA/a加a/,ColdSpringHarborLaboratory,ColdSpringHarbor,NY,1982.MarcotteWa/.,W/wre,335:454,1988.McDevitte/。/.,Ce//,37:993-999,1984.McElroy".,尸/a",Ce〃,2:163-171,1990.MettusandMacaluso,力/jp/.五"W/"ow.Mc,o6/o/.,56:1128-1134,1990.Michael,"MutagenesisbyIncorporationofaPhosphorylatedOligoDuringPCRTMAmplification,"fi/o7"ecAAJ,々wd16(3):40-412,'1994.Neuhaus"o/.,77eor如/.Gene,.,75:30,1987.Odella/.,Ato"re,313:810,1985.Oharae/。/.,/Voc.Ato/.Jc。c/.C/SX86(15>:5673-5677,1989.Ohkawawa/.,AW.fc/rS拜..27:15-6,1992.Qjwange/o/.,/Voc.Sc.OSW,89:10802-6,1992.Olsone/a/.,乂5"/e/v'o/.,150:6069,1982.Omirullehwcr/.,尸/flWA/o/ecw/。r所o/ogK'21:415-428,993.PandeyandMarzluff,/""RNAProcessing,"p.133,ColdSpringHarborLaboratory.ColdSpringHarbor,NY,1987.Pena325:274'1987.Perrauke/o/,A^r/we,344:565,1990.PenottaandBeen,肠c/;亂,31:16,992.Piekene,a/.,253:314',1991.Poszkowskie/"/.,五雄CU,3:2719,1989.Potrykuse/fl/.,嵐Ge".Ge"e,.,199:183,1985.Poulsene,a/.,嵐GmGe"e,.,205:193-200,1986.ProkopandBajpai,"RecombinantDNATechnologyI,"MK」cad646:xxx-xxx,1991.Rajamohan,Alcantara,Lee'Chen,Curtiss,Dean,"SingleaminoacidchangesindomainIIof5fl"'〃jtf//w〃'w'4t7jCrylAbS-endotoxinaffectirreversiblebindingtoA/"wdwoj!jex/amidgutmembranevesicles,"/fia"en'o/.,177:2276-2282,訓.Rajamohan,Cotrill,Gould,Dean,"RoleofdomainII,loop2residuesofBa"'〃uy^iwn.ng7'e"j^CrylAb5-endotoxininreversibleandirreversible'bindingtoMa/w/wc。wxtoand//e"o/Wi'vi'rescera,"/5,'o/.C/jew.,271:23卯-2397,隨.Rogersa/"j^w/jocfefor尸/a"/A/o/ecw/ar5io/og^,A.WeissbachandH.Weiss-bach,eds.,AcademicPressInc.,SanDiego,CA1988.Rogerse/a/.,A/e//oA£"2y;wo/.'153:253-277,1987.Rossie,a/.,爿i'cfe/Jej./Je/广ov&,,8:183,1992.SadofskyandAlwine,腺ec.Ce〃.5,'o/.,4(8):1460-1468,1984.Sambrooke/a/.,"MolecularCloning:ALaboratoryManual,"ColdSpringHarborLaboratory,ColdSpringHarbor.NY.1989.Sanchis,Lereclus,Menou,Chaufaux,Guo,Lecadet,A/o/./Wic,'06/0/.,3:229-238,.Sanchis,Lereclus,Menou,Chaufaux,Lecadet,iWb/.A/,.croWo/.,2:393-404,1卯8.Sarvere/。/.,Sde"ce,247:1222-1225,19卯.SavilleandCollins,Ce〃,61:685-696,1990.SavilleandCollins,/Voc,歸.4c。rf&/.腦,88:8826-8830,1991.Scanlone/。/.,iVoc歸.爿c。rf.SW.,,88:10591-5,1991.Scaringeefa/.,AW,.zlc〖必ies.,18:5433-5441,1990.SchnepfandWhitely,/Voc.W。//.Jcarf.Sc/.,,78:2893-2897,1981.Schn印fOjen.,260:6264-6272,1985.Segal,"BiochemicalCalculations"2ndEdition,JohnWiley&Sons,NewYork,1976,ShawandKamen,CW/,46:659-667,1986.ShawandKamen,/".■"RNAProcessing",p.220,ColdSpringHarborLaboratory,ColdSpringHarbor,NY,1987.Simpson,Wew",233:34,1986.Slaney,Robbins,English,"Modeofactionoffiaa7/s//ju"'"g''e"s/stoxinCryIHA:Ananalysisoftoxicityiniep/i'wo/。rjarfece/w/i'"ewa(Say)andD/aZvo〃cowj-deci'w/n/ncfawAomywyWBarber,"/"secf■Wo/ec.肌o/.,22:9-18,992,Slatin,Abrams,English,"Delta-endotoxinsformcation-selectivechannelsinplanarlipidbilayers'"丑focAem.£/op/>^./es.Co加饥,169(2>:765-772,1990.SmedleyandEllar,"Mutagenesisofthreesurface-exposedloopsofaBfl"7/wy//lu"'/ig!'e肌iinsecticidaltoxin'revealsresiduesimportantfortoxicity,receptorrecognitionandpossiblymembraneinsertion,"緒cro6油",142:1617-1624,1996.SmithandEllar,"Mutagenesisoftwosurface>exposedloopsoftheB。c"/iwfAw!>jgi'efw&CrylC5-endotoxinaffectsinsecticidalspecificity,"B!'ocfte饥302:611-616,簡.Smith,Merrick,Bone,Ellar,jp/)/.五nvi'ro".A/i.cro6fo/.,62:680-684,1996.Spielmanne/a/.,A/o/,GeM.Ge"e/.,205:34,1986.<formula>formulaseeoriginaldocumentpage180</formula>mediatedgenedeliveryandexpressionoftransfectedgenes,"/Voc.AV"/.爿c。c/.SW.OSA89(13):6099-6103,1992.Walke〖e/o/.,尸wc.Ato/.4cW.L/l89(1):392-396,1992.Waherse/"/.,历》cAe/w.Aop/^.A"'.Co/wm"/j.,196:921-926,1993.Watsone〖Wo,ecu/flrBZo/o;o/z/eGewe,她Ed.,W.A.Benjamin,Inc.,MenloPark,CA,1987.WeerasingheWa/.,乂.,65:5531-4,19^91.WeissbachandWeissbach,iVfe/Ziorfx》/尸/o"/A^o/ecz//<7r5/oZo^,(eds.)'AcademicPress,Inc.,SanDiego,CA,1988.Wenziere/fl/.,尸/""/Mo/.5/o/.,12:41-50,1989.WickensandStephenson,&/e"ce,226:1045、1984.Wickense/"RNAProcessing,"p.9,ColdSpringHarborLaboratory,ColdSpringHarbor,NY,1987.Wolfersbergerwa/.,i4ppA£"vi'ro".MicroWo/.,62:279-282,1996.WongandNeumann,"Electricfieldmediatedgenetransfer,"5''o/>/z>^.及w.Co/wnw".,l07(2):584-587,1982,Woolfe/fl/.,尸z"oc.嵐/4ok/.Sci.固,89:7305-7309,1992.Wu幼dAronson,"LocalizedmutagenesisdefinesregionsoftheSac〃/tw//wr/"g/ew-j/j5-endotoxininvolvedintoxicityandspecificity,"/祝o/.CTj柳.,267:231卜2317,1992.WuandDean,"FunctionalsignificanceofloopsinthereceptorbindingdomainofSoc/〃"";wr/"g/e/w,;yCryIHA5-endotoxin,"/M/.255:628-640,隨.Yamadae/a/.'尸/aw/CW/及印.,4:85,1986.Yange/a/.,A^//.Jc。dSd.L^4,87:4144-48,1990.Yuo/.,/Vw.Ato/.5W.90:6340-4,993.Zailoukal,Wagner,Cotten,Phillips,Plank,Steinlein,Curiel,Birnstiel,"Transferrinfection:ahighlyefficientwaytoexpressgeneconstructsineu-karyoticcells,"/i肌K爿cW.660:136-153,1992.ZhangandMatthews,"Conservationsofsolvent-bindingsitesin10crystalformsofT4lysozyme,"尸ro/.3:1031-1039'1994.Zhouc,a/.,AMCe//Bfo/.,10:4529-37,1990.在本发明的指导下,本发明中所公开和要求权限的所有的组合物可以被正确地制造和执行,虽然已经通过优选实施例对本发明的组合物和方法进行了描述,但是显而易见,本工艺的熟练人士可以对本发明的组合物和方法按照本发明中所迷的步骤或步骤的顺序作各种变更而不脱离本发明的概念、精神和范围.更具体地,显然本发明中所述的试剂可以用它们的化学和物理相关的试剂代替而能够获得相同或相似的结果。本工艺的熟练人士所熟知的所有的这些类似的替代和修改被认为是属于如增补的权利要求所定义的本发明的精神、范闺和概念之内的.序列清皁(1)一般信息(iJ申请者尔ECOGEN,INC./MONSANTOCOMPANY2005CABOTBLVDW/7O0CHESTERFIELDVILLAGEPKYN伊LANGHORNE/ST.LOUISPA/MO家美国玫编码813047/S3198:A:BCDEFABCDE,F:a:b:c:d:e:f:a:c:DEFABCdEFaB,CD:eLEIGHH.ENGLISH120CHAPEL*DRCHRUCHVIUiEPA国家美国邮政编码183"SUSANM.BRUSSOCK7H工liliSIDEMEWHOPEpa国家美闺邮政编码'.18THOMASM,MAIiVAR12046CHARTERHOUSELNST.LOUISMO闺家美a邮政编码63146JAMESW.BRYSON67WOODSTREAMDRPA闺家美国邮政编码CAROLiINEA,KULESZA301OU)liYNCHBURGRDCHARLOTTESVILLEVA国家美国邮政编码22903FREDERICKS.WALTERS34136THAVEBEAVERFAL!jSPA国家美闺邮政编码'-15010ABcDEcr称道#&名街城w称道,k名街ww银^,+名街城J-称汰ti名街威脉%-城^名街%*STEPHENLSLATIN3823LESLIEPLFAIRLAWNNJ(E>国家美国(F>邮政编码07410(A)名称MICHAELA.VONTERSCH<B)街道14RUTLEDGEAVE<C)"市TRENTON(D)州NOT(E>闺家美闺(F)邮政编码0861SCHARLESROMANO2402MAPLECROSSINGDRWILDWOODMO(A>名称(B)街道(C>城市(D)州(E)阖家美国(F)由p政编码S3011发明的题目INSECT-RESISTANTTRANSGENICPLANTSANDMETHODSFORIMPROVINGDELTA-ENDOTOXINACTIVITYAGAINSTTARGETINSECTS(iii)(iv)序列的数目:113(v)(vi)(vi)计算机可读形式(A>介质形式软盘(B>计算机旧MPC兼容机(C>操如系统PC-DOS/MS-DOS(D>软件PatentlnRelease#1.0,Version#1,30(EPO)此次申请的数据申请号码未知上次申请曰期(A>申请号码US08/993,170(B>^f当曰^:18-DEC-1997上次申请曰期(A>申请号码(B>存当曰期:US08/993,722IB-DEC-1997(vi)上次申请曰期(A)申请号码(B>存当曰期(vi>上次申请曰期(A)申请号码(B)存当日期US08/993,77518-DEC-1937US08/336,4"IB—DEC-1997(2)序列编号1的信息(i>序列特征(A)长度1的9碱基对珈愤:名街城wAgcD(B)类型核苷酸(C)链的性质单链(D》拓朴学线性(ix)特性(A)名称/关键词CDS(B)定位1,,1956序列描述序列编号1:ATGAATCCAAACAATCGAAGTGAACATMetAsnProAsnAsnArgSerGluHisGATACGAspThr10丸TAlieAAGLysGTTACACCTValThrPro48AACAGTAsnSerGAAGluTTGLeu20CAAACTAACGinTJirAsnCATHisAATAsn25CAATATGinTyrCCTProTTAGCTAla30GACAATAspAsnCCAAATProAsnTCASer35ACACTAGAAGAALeuGluGluTTA40AATAsnTATAAATyrLysGAAGlu4STTALeuAGAATGArgMet144ACTGAAThrGlu50GACAspAGTSerTCTACGGAASex*ThrGlu55GTGValCTALieuGACAACAspAsnTCT60ACAThrGTAValAAAGATLysAsp192GCAOTTAlaVal55GGGGlyACAThrGGAATTTCTGlylieSer70GTTvalGTAValGGGCAGGlyGin75ATTlieTTALeuGlyGTTGTAValVal80240GGAGTTGiyValCCAProTTTPheGCTGGGGCAAlaGlyAla85CTCLeuACTThrTCATTTSerPhe90TATTyrOVAGinTCASerTTTCTTPheLeu95288AACACTAsnThrATAlieTGGTrp100CCAAGTGATProSerAspGCTAlaGACAsp10SCCATGGProTrpLysGCTAlaTTT110MetAla336CAAGTTGinValGlu115GTAValCTGATAGATLeulieAspAAGLys120AAAATAGAGlieGluGAGGluTATTyr125GCTAlaAAAAGTLysSer384AAAGCTbysAla130CTTLeuGCAAlaGAGTTACAGGluLieuGin135GGTGlyCTTLeuCAAAATGinAsnAATAsn140PheGAAGluGATTATAspTyr432GTTAATValAsnGCGAlaTTALeuAATTCCTGGAsnSerTrpISOAAGLysAAALysTTTCACPheHis1S5CATHisTCTCGTArgCGTTCTArgSerISO4B0AAAAGAAGCCAAGATCGAATAAGOGAACTTTTTTCTCAAGCAGAAAGTLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer165170175526CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal180185190576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu195200205TTAAAAGATGCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAALeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220672GATGTTGCTGAAAspValAlaGlu225TTTTATCATAGACAATTAPheTyrHisArgGinLeu230AAACTTACALysLeuThr235CAACAATACGinGinTyx240720ACTGACThrAspCATHisTGTCysGTTAATTGGValAsnTrp245TATTyrAATGTTAsnVal250GGAGlyTTALeuAATAsnGGTGlyTTAAGAL*euArg255768GGTTCAGlySerACTThrTATTyr260GATGCATGGAspAlaTrpGTCValAAATTTLysPhe265AACAsnCGTArgTTTCGCPheArg270AGAGAAArgGlu816ATGACTMetThrTTALeu275ACTThrGTATTAGATValleuAspCTALeu280ATTGTAlieValCTTLeuTTCPheCCATTTProPhe28STATGATTyxAsp864ATTCGGlieArg290TTALeuTACTyirTCAAAAGGGSerLysGly.295GTTValAAAACALysThrGAAGluCTALeu300ACAAGAThrArgGACATTAsplie912TTTACGPheThr305GATAspCCAProATTTTTTCAliePheSer310CTTLeuAATACTAsnThrCTTlieu315CAGGinGAGTATGluTyrGGACCAGlyPro320960ACTTTTThrPheTTGAGTSerATAGAAAAClieGluAsn325TCTSerATTCGAlieArg330AAALysCCTProCATTTAHisLeuTTTGATPheAsp3351008TATTTATyr!>euGinGGGGly340ATTGAATTTlieGluPheCATHisACGCGTThrArg345CTTLeuCAAGinCCTGGTProGly350TACTTTTyxPheGGC5AAAGlyLysGATAsp355TCTSerTTCAATTATPheAsnTyxTGGTrp3S0TCTGGTSerGlyAATAsnTATTyrGTAGAAValGlu365ACTAGAThrArg1104CCTAGTProSer370ATAlieGGAGlyTCTAGTAAGSerSerLys37SACAATTACT工leThr*TCCCCAPro380TTTTATPheTyrGGAGATGlyAsp1152AAATCTACTGAACCTGTACAAAAC3CTAAGCT丁TGATLysSerThrGluProValGinLysLeuSerPheAsp3B5390395GGACAAAAAGTTGlyGinLysVal4001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyxArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys4054104151248GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATAT。ATGATCAAValTyrLeuGlyValThr*LysValAspPheSerGinTyrAspAspGin4204254301296AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly4354404451344CATGTAAGTGCACAGGATTCTATTHisValSerAlaGinAspSerlie450455GACCAATTACCGCCAGAAACAACAAspGinLeuProProGluThrThr4601392GATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAAAspGluProLeuGluLysAlaTyrSerHisGinLeuAsnTyrAlaGlu46S4704754B01440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGCysPheLeuMetGinAspArgArgGlyThrlieProPhePheThrTrp48S49049S1488ACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSer*ValAspPhePheAsnThrlieAspAlaGluLys工le500505510153SACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCThrGinLeuProValValLysAlaTyrAlaLeuSerSer<31yAlaSerS15S205251584ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys5305355401632GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaIysPheLysValThrLeuAsa3erAlaS45S50SSSSSO1S80GCCTTCTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACTAlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThr56S5705751728AACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie5805855901776TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr595S006051824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys6106156201872AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATC1920AsnGliiLeulielieGlyAlaGluSerPheValSerAsnGluLyslie62S630S35640TATATAGATAAGATAGAAT丁TATCCCAGTACAATTGTAA1959TyrlieAspLys工leGluPhelieProValGinLeu645650(2)序列编号2的信息(i)序列特征(A)长度652个氨基酸(B>类型氨基酸(D)拓朴学线性<ii>分子类型蛋白质(xi)序列描迷序列编号2ThrlieLysValThrProTyrProLeuAlaAspAsn30MetAsnProAsnAsnArgSer*GluHisAsp1510AsnSerGlul*euGinThrAsnHisAsnGin2025ProAsnSerThrLeuGluC31uLeu3S40ThrGluAspSerSerThrGluVal5055AlaValGlyThrGlylieSerVa!i.6570GlyValProPheAlaGlyAlaLeu85AsnThr工leTrpProSerAspAla100AsnTyrLysGluPheLeuArgMet45LeuAspAsnSerThr*ValLysAsp60JalGlyGinlieLeuGlyValVal7580ThrSerPheTyrGinSerPheUeu9035AspProTrpLysAlaPheMetAla105110GinValGlutValLeulieAspLysLyslieGluGluTyrAlaLysSer115120125LysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135"0ValAsnAlaLeuAsnserTrpLyslysPheHisHisSerArgArgSer1451501SS160LysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer1SS17017SHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal180185"0LeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu195200205LeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220AspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyr225230235240ThrAspHisCysValAsnTrpTyrAsnValGly丄euAsnGlyLeuArg24S250255GlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu2602SS270MetThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsp27SlieArgLeuTyr290PheThrAsp305ProThrPhel^uSerTyrI>euGinGly!>ysAsp3SSProSerlie370LysSerThrTyrArgThrValTyrLeuLysAsnGlu43SHisValSer450AspGluPro4€S280285SerLysGlyValLysThrGluLeuThrArgAsplie29S300Gly340SerGlyGlulieGly420ThrAlaCysPheLeuMetliePheSerLeuAsnThrlieuGinGluTyrGlyPro31031S320lieGluAsnSerlieArgLysProHisLeuPheAsp32S33033SlieGluPheHisThrArgLeuGinProGlyTyrPhe34S3S0PheAsnTyrTrpSerGlyAsnTyrvalGluThrArg3603S5SerSerLysThrlieThrSerProPheTyrGlyAsp3753B0ProValGinLysLeuSerPheAspGlyGinLysVal390395400AlaAsnThrAspValAlaAlaTrpProAsnGlyLys405410415ValThrLysValAspPheSerGinTyrAspAspGin425430SerThrGinThrTyrAspSer*LysArgAsnAsnGlyGinAspSerlieAspGinLeuProProGluThrThr455450GluLysAlaTyrSerHisGinLeuAsnTyrAlaGlu47047S480GinAspArgArgGlyThrlieProPhePheThrTrp48S490495ThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslie50050SSIOThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSer515520525工lelieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys530S35540GluSerSea:AsnSerlieAlaLysPheLysValThrLeuAsnSerAla5455505555S0AlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThr565570575AsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie580585590TyxneAsnLysThrMetAsnLysAspAspAspL^uThrTyrGinThr595600605PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610615620AsnGluLeu工lelieGlyAlaGluSerPheValSerAsnGluLyslie625630635640TyrlieAspLyslieGluPhelieProValGinLieu645650(2)序列编号3的信息(i>序列特征(A)长度1959Afe对(B)类型核苷酸(C)链的性质单链<D)拓朴学线性(ix)特征(A)名称/关键词CDS(B)定位1"1956(xi)序列描述序列编号3:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCT48MetAsnProAsnAsnArgSerGluHisAspThr工leLysValThrPro151015AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAAT96AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202530CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrLeuGiuGluLeuAsnTyrLysGluPheLeuArgMet354045144ACTGAAGACAGTTCTACGGAAGTGCTAGACAAC丁CTACAGTAAAAGATThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp505560192GCAGTTGGGACAGGAATTTCTGTTGTAGGGCAGATTTTAGGTGTTGTAAlaValGlyThrGlylieSerValValGlyGinUeLeuGlyValVal65707580240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATCAATCATTTCTTGlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu853095288AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCAAsnThr工leTrpProserAspAla100AspProTrpLysAlaPheMet10S110Ala336CAAGTTGAAGTACTGATAGATAAGAAAATAGAGGinValGluValLeu工leAspLysLyslieGlu3L15120GAGTATGCTAAAAGTGluTyrAlaLysSer125384AAAGCTLysAla130CTTLeuGCAAlaGAGGluTTACAGL*euGin135GGTGlyCTTCAAAATLeuGinAsnAATTTCGAAGATTATAsnPheGluAspTyr140432GTTVal145AATAsnGCGAlaTTALeuAATAsnTCCTGGSer*TrpISOAAGLysAAAACACCTLysThrPro155TTAAGTTTGCGALeuSerLeuArgISO480AAAAGAArgAGCSerCAAGillGATAsp165CGAATAArglieAGGArgGAACTTTTTGluLieuPhe170TCTCAAGCAGAAAGTSerGinAlaGluSer175528CATHisTTTPheAAT1B0TCCSerATGCCGMetProTCASerTTTGCAGTTPheAlaVal185TCCAAATTCGAAGTC3SerLysPheGluVal190576CTGTTTPheCTAL<eu195CCAProACAThrTATGCATyrAlaCAAGin200GCTGCAAATAlaAlaAsnACACATTTATTGCTAThrHisLeuIjeuLeu205624TTALeuAAALys210GATAspGCTAlaCAAGinGTTTTTValPhe215GGAGlyGAAGAATGGGluGluTrpGGATATTCTTCAGAAGlyTyrSerSer*Glu220672GATAsp225GTTValAlaGAAGluTTCPheCTTAGTLeuSer230ArgCAATTAAAAGinLeuLys235CTTACACAACAALeuThrGinGinTACTyr240720ACTThrGACAspCATHisTGTCysGTTVal245AATTGGAsnTrpTATAATGTTGGAAsnValGly250TTAAATGGTTTAAGA乙exiAsnGlyLeuArg2557"GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu260270ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsp275280285B64ATTCGGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTlieArgLeuTyrSerLysGlyValLys230295ThrGluLeuThrArgAsplie300912TTTACGGATCCAATTTTTTCACTTAATPheThrAspProliePheSerLeuAsn305310ACTCTTCAGGAGTATGGACCAThrLeuGinGluTyrGlyPro315320960ACTTTTTTGAGTATAGAAAACTCTATTCGAThrPheLeuSerlieGluAsnSerlieArg325330AAACCTCATTTATTTGATLysProHisLeuPheAsp3351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTTTyrLeu<3lnGly工leGluPheHisThrArgI*euGinProGlyTyirPhe34034S3S01056GGGAAAGATTCTTTCAATTATTGGTCTGGTAATTATGTAGAAACTAGAGlyLysAspSerPheAsnTyrTrpSerGlyAsnTyxValGluThrArg3553S03S51104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGATProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp3703753B01152AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGTTLysSerThrGluProValGinLysLeuSerPheAspGlyGinL*ysVal3853903954001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGSTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys40541041S1248GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin42042S4301296AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThrTyrAspSer*LysArgAsnAsnGly4354404451344CATGTAAGTGCACAC3GATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr4S04SS4601392GATGAAAspGlu465CCACTTProLeuGAAGluAAAGCALysAla470TATAGTCATTyrSerHisCAGCTTAATTACGCGGAAGinLeuAsnTyxAlaGlu4754801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGCysPheLeuMetGinAspArgArgGlyThrlieProPhePheThrTrp4SS49049S1488ACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslie500SOS510ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCThrGinLeuProValValI^sAlaTyrAlaLeuSerSerGlyAlaSer51S520S251584ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys53053S5401632GAATCTAGTAATTCAATTGCTAAAGluSerSerAsnSerlieAlaLys545550TTTAAAGTTACATTAAATTCAGCAPheLysValThrLeuAsnSerAla5555601680GCCTTGTTACAACGATATCGTGTAAGAATACGCAlaLeuLeuGinArgTyrArgValArglieArg570TATGCTTCTACCACTTyrAlaSerThrThr57S1728AACAsnTTACGACTTLeuArgLeu580TTTPheGTGValCAAGinAATAsnTCAAACAATSet1AsnAsn58SGATTTTCTTGTCATCAspPheLeuVallie590177STyrATTAATAAAlieAsnLys595ACTThrATGMetAATAAALys600GATGATGATAspAspAspTTAACATATCAAACAIjeuThrTyrGinThrS051824TTTPheGATCTCGCAAspLeuAla510ACTThrACTThrAATAsn615TCTSerAATATGGGGAsnMetGlyTTCTCGGGTGATAAGPheSerGlyAspLys6201872AAT625GAACTTATAGluLeulieATAlieGGAGly630GCAAlaGAAGlUTCTTTCGTTSerPheVal635TCTAATGAAAAAATCSerAsnGluLyslie"01320TATTyrATAGATAAGlieAspLysATAlie645GAAGluTTTPheATClieCCAGTACAAProValGin650TTGTAAIjeu(2)序列编号4的信息(i)序列特征(A》长度652个氛基酸(B)类型氨基酸(D)拓朴学线性(i"分子类型蛋白质(xi>序列描迷序列编亏4:MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro<formula>formulaseeoriginaldocumentpage194</formula>PheThrAspPro工lePheSerLeuAsnThrLeuGinGluTyrGlyPro305310315320ThrPheLeuSerlieGluAsnSerlieArgLysProHisLeuPheAsp325330335TyrLeuGinGlylieGluPheHis340ThrArgLeuGinProGlyTyrPhe34S3S0GlyLysAspSerPheAsnTyrTrp355360SerGlyAsnTyrValOluThrArgProSerlieGlySerSerLysThr370375lieThrSerProPheTyrGlyAsp380LysSerThrGluProVal39S390Ginl#ysLeuSerPhe395AspGlyGinLysVal400TyrArgThrlieAlaAsn405ThrAspValAlaAla410TrpProAsnGlyI*ys415ValTyrLeuGlyValThrLysVal420AspPheSerGinTyrAspAspGin425430LysAsnGluThrSerThrGinThr43S"0TyxAspSerLysArgAsnAsnGly44SHisValSerAlaGinAspSerlie450455AspGinLeuProProGluThrThr4G0AspGluPro!>euGluLysAlaTyx465470SerHisGinLeuAsnTyrAlaGlu475480CysPheLeuMetGinAspArgArg485GlyThrlieProPhePheThrTrp49049SThrHisArgSerValAspPhePhe500AsnThrlieAspAlaGluLyslie505510ThrGinLeuProValValLysAla515520TyrAlaLeuSerSerGlyAlaSerS25lielieGluGlyProGlyPheThr530535GlyGlyAsnLeuLeuPheLeuLys540GluSer*SerAsnSerlieAlaLys545550PheLysValThrLeuAsnSerAla555560AlaLeuLeuGinArgTyrArgValS65ArglieArgTyrAlaSerThrThr570575Asn!>euArgl^uPheValGinAsnSerAsnAsnAspPheLeuVallie580S8SS90TyxlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr595600605PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLysS10615620AsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslieS35640TyrlieAspLyslieGluPhelieProValGinLeu645S50(2》序列编号5的信息(i>序列特征(A)长度1959碱基对(B>类型核苷酸(C》链的性质单链(D>拓朴学线性(ix)特征(A)名称/关键词CDS(B)定位1..19S6(xi)序列描迷序列编号5:ATGAATMetAsnCCAProAsnAAT5CGAArgAGTSerGAACATGluHisGATAsp10ACGThrATAAAGGTTLysValThrISCCTPro48AACAGTAsnSerGAAGluTTGLeu20CAAGinACTThrAACCA,AATHisAsn25CAAGinTATTyrCCTProTTAGCTLeuAla30GACAspAATAsn36CCAAATProAsnTCASer35ThrCTAlieuGAAGluGAAGluTTAAAT乙euAsn40TATAAALysGAAGluTTTTTAPheLeu45ArgMet144ACTGAAThrGlu50GACAspAGTSerTCTSerACSThrGAA5SGTGCTAValLeuGACAspAACAsnTCTSer60ACAGTAThrValAAAGATASp132GCAGTTAlaval65GGGGly.ThrGlyATTlie70TCTGTTGTAValvalGGGGlyCAGGin75ATTlieTTAGGTlieuGlyGTTValGTAval80240GGAGTTGlyValCCAProTTTGCTAla8SGGGGlyGCAAlaCTCACTLeuTharTCASer90TTTPheTATTyrCAATCAGinSerTTTPhe35CTTLeu288AACACTATAlieTGGTrp100CCAProAGTSerGATAspGCTGACAlaAsp105CCAProTGGAAGLysGCTTTTAlaPhe110MetGCAAla33SCAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGT384GinValGluValLeulieAspLysLyslieGluGluTyxAlaLysSer115120125AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATLysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135140432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer145150155ISO480AAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTCAAGCAGAAAGTLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer16S170175528CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPhe180185AlavalSerLysPhe130GluVal576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu195200205丁TAAAALeuLys210GATAspGCTCAAAlaGinGTTValTTTGGAPheGly21SGAAGluGAAGluTGGGGATATTrpGlyTyr220TCTSerCCAProGAAGlU672GATGTTAspVal225GCTAlaGAATTCGluPheAGTSer230CATAGAHisArgrCAAGinTTAAAACTTACALysL*euThr235CAAGinCAAGinTACTyr240720ACTGACThrAspCATHisTGTGTTCysVal245AATAsnTGGTATTrpTyrAATAsnGTTVal250GGATTAAATGlyLeuAsnGGTGlyTTALeu255Arg768GGTTCAGlySerACTThrTATGATTyrAsp260GCAAlaTGGGTCTrpValAAALys26STTTAACCGTTTTAsnArgPheCGC270GAAGlu816ATGACTMetThrTTALeu275ACTGTAThrValTTAGATCTAAspLeu280ATT工leGTAValCTTTTCCCAljeuPhePro285TTTPheTATTyrGATAsp864ATTCGGlieArg230TTALeuTACTCATyrSerAAAGGGGTTGlyVal235AAAACAThrGAACTAACAGluLeuThr300ArgGACAspATTlie912TTTACGPheThr305GATAspCCAATTProlieTTTPhe310TCACTTSerLeuAATACTThrCTTCMGAGLeuGinGlu315,TATTyrGGAGlyCCAPro320960ACTTTTThrPheTTGLieuAGTATASerlie325GAA(51uAACTCTATTlieCGA330AAACCTCAT*ysProHisTTATTTPhe335GATAsp1008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTT1056TyrLeuGinGlylieGluPheHisThrArgLeuGinProGlyTyrPhe340345350GGGAAAGATTCTTTCAATTATTGGTCTGGTAATTATGTAGAAACTAGAGlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg3S53651104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGATProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp37037538011S2AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGT丁LysSerThrGluProValGinLysLeuSerPheAspGlyGinLysVal3853903954001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys4054104151248GTATATTTAGGTValTyrLeuGly420GTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValThrLysValAspPheSerGinTyrAspAspGin4254301296AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly43S44044S1344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGlrxLeuProProGluThrThr4504554601392GATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAAAspGluProLeuGluLysAlaTyrSerHisGint>euAsnTyrAlaGlu4654704754801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGCysPheLeuMetGinAspArgArgGlyThrlieProPhePheThrTrp4854904951488ACACATAGAAGTGTA(SACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslie500SOSS10ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCThrGinLeuProValValLysAlaTyrAlaLeuSerSerGl_yAlaSer5155205251S84ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAA工lelieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLysS30S35"01632GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAla5455505555601680GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACT1728AlaLeu!>euGinArgTyrArgValArglieArgTyrAlaSerThrThr5S5570575AACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie580585590TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr595600605TTTGATCTCGCAACTPheAspLeuAlaThrS10AATGAACTTATAATAAsnGluI*eulielieTATATAGATAAGATATyrlieAspLyslie"5ACTAATTCTAATATGGGGTTCTCGGGTGATAAGThrAsnSerAsnMetGlyPheSerGlyAspLys615620GGAGCAGAATCTTTCGTTTCTAATGAAAAAATCGlyAlaGluSerPheValSerAsnGluLys工le63S"0GAATTTATCCCAGTACAATTGTAAGluPhelieProValGinLeu650(2)序列编号6的信息(i)序列特征(A)长度652个氨基酸(B)类型氨基酸(D)拓朴学线性(ii)l分子类型蛋白质(xi)序列描迷序列编号6:MetAsnProAsnAsnArgAsnSerGluLeu20GinThrProAsnSer3SThrGluSOThrLeuGluSerSerThrAspGlyThr*GlyGlyValProPheAlaValAla8Slie70GlyAsnThr*lieTrp100ProSer*SerGluHisAspThrlieAsnHisAsnGinTyrPro25GluLeuAsnTyrL*ysGlu40GluValLeuAspAsnSerSSSOSerValValGlyGinlie75AlaLeuThrSerPheTyr30AspAlaAspProTrpLys105LysValThrPro15LeuAlaAspAsn30PheLeuArgMet45ThrValLysAspLeuGlyvalVaL80GinSerPheLeu9SAlaPheMetAla11017761824187219201959GinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSer<formula>formulaseeoriginaldocumentpage200</formula>ValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin420425430XiysAsnGluThrSerThrGinThrTyrAspSerLysArgAsiaAsiaGly435"0445.HisValSerAlaGinAspSer工leAspGinLeuProProGluThrThr4S04S54S0AspGluProLeuGluLysAlaTyrSerHisGinLeuAsnTyrAlaGlu"5470475480CysPheLeuMetGinAspArgArgGlyThr*lieProPhePheThrTrp48S490495ThrHisArgSerValAspPhePheAsnThr*工leAspAlaGluLyslieS00SO;S10ThrGinlieuProValValLysAla515520lielieGluGlyProGlyPheThrS30S35GluSerSerAsnSerlieAlaLys545550AlaLeuLeuGinArgTyrArgVal565TyrAlaLeuSerSerGlyAlaSer525GlyGlyAsnLeuLeuPheLeuLys540PheLysVeQThrLeuAsnSerAlaArglieArgTyrAlaSerThrThr570575AsnlieuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallieS80S8SS90TyrlieAsnLysThrM色tAsnLysAspAspAspLeuThrTyrGinThr595G00S05PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610"5620AsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie625S30635640TyrlieAspLyslieGluPhelieProValClnLeu"S650(2)序列编号7的信息(i)序列特征(A》长度1959碱基对《B)类型核苷酸(C)链的性质单链(D)拓朴学线性(ix)特征:(A)名称/关键词CDS(B)定位1..1956(xi)序列描迷:序列编号ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCTMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro1S101548AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn20253096CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrLeuGluGluLeuAsnTyrl#ysGluPheLeuArgMet3S4045144ACTGAAGACAGTTCTACGGAA(3TGCTAGACAACTCTACAGTAAAAGATThrGluAspSerSerThrGluVal5055LieuAspAsnSerThrSOValLysAsp192GCAGTTGGGACAGGAATTTCTGTTAlaValGlyThrGlylieSerVal6S70GTAGGGCAGATTTTAGGTGTTGTAValGlyGinlieLeuGlyValVal7S80240GGA<51yGTTValCCAProTTTPheGCTAla85GGGGlyGCAAlaCTCLeuACTTCATTTTATSerPheTyr90CAAGinTCASerTTTCTTPheLeu95288AACAsnACTThrATAlieTGGTrp100CCAProAGT*<2ev"GATAspGCTAlaGACAsp10SCCATGGAAGProTrpLysGCTAlaTTTPhe110ATGGCAMetAlaCAAGinGTTValGAAGlu115GTAValCTGLeuATAlieGATAspAAGLiys120AAALysATAGAGGAGlieGluGluTATTyr125GCTAlaAAAAGTLysSer384AAALysGCTAla130CTTLeuGCAAlaGAGGluTTALeuCAGGin135GGTGlyCTT匸euCAAAATAATGinAsnAsn140TTCPheGAAGluGATTATAspTyr432GTTVal145AATAsnGCGAlaTTALeuAATAsnTCCSer150TGGTrpAAGLysAAALysACACCTTTAThrProLeu155AGTSerTTGLeuCGAAGTArgSer160480AAAAGALysArgAGCSerCAAGinGATAsp16SCGAArgATAlieAGSArgGluCTTTTTTCTLeuPheSer170CAAGinGCAAlaGAAAGTGluSer17S528CATTTTHisPheCGTArgAATAsn180TCCSerATGMetCCGProTCASerTTTPhe185GCAGTTTCCAlaValSerAAALysTTCPhe190GAAGTGGluVal576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu195200205TTAAAAGATGCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAALeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220672GATGTTGCTGAATTCTATCGTAGACAATTAAAACTTACACAACAATACAspValAlaGluPheTyrArgArgGinLeuLysLeuThrGinGinTyr225230235240720ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGtGTTTAAGAThrAspHisCysvalAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg245250255768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySer丁hrTyrAspAla丁rpValLysPheAsnArgPheArgArgGlu2S0265270816ATGACTTTAACTGTATTAGATCTAATTGTACTTMetThrIeuThrVal275LeuAspLeu280UeValLeuTTCCCATTTTATGATPheProPheTyrAsp285864ATTCGGlieArg290TTATACTCATyrSerAAAGGGGTTLysGlyVal235AAAACAIjysThrGAAGlUCTALeu300ACAThrAGAArgGACAspATT工le312TTTPhe305ThrGATAspCCAATTProlieTTTTCACTTPheSerLeu310AATACTAsnThr*CTT315CAGGinGAGGluTATTyrGGAGlyCCAPro320960ACTThrTTTPheTTGAGTATASerlie325GAAAACTCTGluAsnSerATTCGAlieArg330AAACCTProCATHisTTALeuTTTPhe335GATAsp1008TATTyrTTAIjeuCAGGinGGGATTGly工le340GAATTTCATGluPheHisACGCGTThrArg345CTTLeuCAAG3LnCCTProGGTGly350TACTyrTTTPheGGGGlyAAALysGATAsp355TCTTTCSerPheAATTATTGGAsnTyrTzp360TCTGGTSerGlyAATTATTyrGTAVal365GluACTThrAGAA巧CCT370ATAlieGGATCTGlySerAGTAAGACASerIjysThr37SATTACTlieThrTCCCCAPro380TTTPheTATTyrGGAGlyGATAsp11S2335TCTSerACTThrGAACCTGluProGTACAAAAGValGinIjys390CTAAGCTTTPhe335GATAspGlyCAAGinAAAGTTVal4001200TATTyrCGAACTThrATAGCTlieAla405AATACA<3ACAsnThrAspGTAGCGValAla410GCTAlaTGGTrpCCGProAATAsnGGTGly415AAG1248OTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin420425430AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCliysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly4354404451344CATGTAAG丁GCACAGGATTCTATTGACCAATTACCGHisValSerAlaGinAspSerlieAspGinLeuPro4S0455CCAGAAACAACAProGluThrThr4S01392GATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAspGluProLeuGluLysAlaTyrSerHisGinLeu465470475AATTACGCGGAAAsnTyrAlaGlu4801440TGTTTCTTAATC3CAGGACCGTCGTGGAACAATTCCACysPheLeuMetGinAspArgArgGlyThr工lePro485490TTTTTTACTTGGPhePheThrTrp4351488ACACATAGAAGTGTAGACTTTTTTThrHisArgSei*ValAspphePhe500AATACAATTGATGCTGAAAAGATTAsnThrlieAspAlaGluLysI丄e5055101536ACTCAACTTCCAGTACTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSer51SS205251564ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys5305355401632GAAGluS45TCTAGTAATTCASerSerAsnSerATTlie5S0GCTAlaAAATTTAAAGTTValSSSACATTAThrleuAATTCAAsnS<erGCAAlaGCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACTAlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThr5655705751728AACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie580585S901776TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr5956006051824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspX>ys610SISS201B72AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCAsnGluLeu工lelieGlyAlaGluSerPheValSerAsnGluLyslieS25630S3S"01920TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAATyrlieAspLyslieGluPhelieProValGinLeu1959645S50(2>序列编号8的信息(i)序列特征(A)长度652个氨基酸(B》类型氨基酸(D》拓朴学线性(ii)分子类型蛋白质(xi)序列描述序列编号8:MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro151015AsnSerGlul>euGlxiThrAsnHis20ProAsnSerThrLeuGluGluLeu3540ThrGluAspSerSerThrGluValSO55AsnGinTyrProLeuAlaAspAsn2530AsnTyrLysLeuAspAsnAlaValGlyThrGlylieSerValValGlyGin657075GluPhe!>euArgMet45SerThrValLysAsp60lieLeuGlyValVal80GlyValProPheAlaGlyAlaLeuThrSearPheTyrGinSer*8S90AsnThr*lieTrpProSer100GinValGluValLeulie115LysAla130ValAsn145LeuAlaGluLeuAlaLysArgSerHisPheArgL>euAsnSer150GinAspArgAsnSerMet180LeuPheLeuProThrTyr195AspAlaAspLys120GinGly135TrpLyslieArgProSerAlaGin200AspPro105TrpLyslieGluLeuGinAsnLysAlaPhe110GluTyrAla12SAsnPheGlu140LysThrProlieuSerLeu155GluLeu170PheAla185PheSerGinAlaAlaAlaAsnSerLysPheISOThrHislieu205LeuLys210PheGly215GluGluTrpGlyTyrSer220PheLeu95MetAlaAspTyrArgSer160GluSer175GluValLeuLeuSerGluAspAlaGinValAspValAlaGluPheTyrArgArgGinLeuLysLeuThrGinGinTyr22S230235240ThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyleuArg2452502S5GlySerThrTyrAspAlaTxpvalLysPheAsnArgPheArgArg<51u260265270MetThrLeuThrValLeuAspLeu工leVal275280LeuPheProPheTyrAsp285lieArgLeuTyrSerLysGlyValLysThr290295GluLeuThrArgAsplie300PheThr"AspProliePheSerLeuAsnThr305310LsuGinGluTyrGlyPro315320ThrPheLeuSerlieGluAsnSerlieArg32S330LysProHisLeuPheAsp335TyrLeuGinGlylieGluPheHisGlyLysAspSerPheAsnTyxTrp355360ThrArgLeuGinProGlyTyrPhe345350SerGlyAsnTyrValGluThi:Arg3S5ProSerlieGlySerSerLysThr370375lieThr*SerLysSer*385ThrGluProValGinLys390TyrArgThrlieAla405AsnThrAspValTyrLeuGlyValThrLysVa!L420LeuSer"ValAlaAspPhe425PheAlaSerProPheTyrGlyAsp380AspGlyGinLysVal400TrpProAsnGlyLysGinTyrAspAspGin430LysAsnGluThrSer"5HisVal450AspGlu"5SerAlaGinProUeuGluThrGinThr440AspSer工le455LysAlaTyr470CysPheLeuMetGin48SAspArgArgThrHisArgSerValAspPhePhe500ThrGinLeuProValSISTyrAspA3pGin5erHisGlyThrAsnThr505ValLysAla520SerLeuGin《75lieTyrAlaLeuLysArgAsnAsnGly"5ProProGluThrThr460L*euAsnTyrAlaGluProPhePheThrTrp435AspAlaGluLyslie510SerSerGlyAlaSer52SlielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys530535540GluSerSerAsnSerlieAlaLysPheLysVaiThrLeuAsnSerAla5455505SSS60AlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThrSS5570575AsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheUeuVallie580585530TyrlieAsn乙ysThrMetAsnLysAspAspAspLeuThrTyrGinThrS9S600605PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610620AsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslieS2S"0S3SS40Tyr*工leAsplieGluPhelieProValGinlieu(2)序列编号9的信息(i)序列特征(A》长度1的9碱基对(B)类型核苷酸<C)链的性质单链(D)拓朴学线性(ix>特征(A>名称/关鍵词CDS(B)定位1.(xi》SEQUENCEDSSCRIPTIOM:SEQIDNO:9'ATGAATCCAMetAsnProAACAsnAATAsnCGAAGTGluCATHisGATAsp10ACGATAAAGGTTThrlieLysValACACCTThrProIS48AACAC5TGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn2025309SCCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet3S40,4S144ACTGAAGACAGTTCTACGGA\GTGCTAGACAACTCTACAGTAAAAGATThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp505560192<formula>formulaseeoriginaldocumentpage208</formula>ATTCGGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATT912lieArgLeuTyrSerLysGlyValLysThrGluLeuThrArgAsplie29029S300TTTACGGAT'.CCAATTTTTTCACTTAATACTCTTCAGGAGTATGGACCA9S0PheThrAspProliePheSerLeuAsnThrLeuGinGluTyrGlyPro30S310315320ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGAT1008ThrPheLeuSerlieGluAsnSer*lieArgLysProHisLeuPheAsp32533033STATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTT10SSTyr*LeuGinGlylieGluPheHisThrArgLeuGinProGlyTyr*Phe3403453S0GGGAAAGATTCTTTCAATGlyLysAspSerPheAsn3SSCCTAGTATAGGATCTAGTProSerlieGlySerSer370AAATCTACTCAACCTGTALysSerThrGluProVal385390TATTGGTCTGGTAATTATTyrTrpSer*GJLyAsnTyrAAGACAATTACTTCCCCALysThrlieThr*Sei:.Pro37S380CAAAAGCTAAGCTTTGATGinLysLeuSerPheAsp395GTAGAAACTAGAU04ValGluThrArg3S5TTTTATGGAGAT11S2PheTyrGlyAspGGACAAAAAGTT1200GlyGinLysVal400TATC3AACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAG124BTyrArgThr工leAlaAsnThrAspValAlaAlaTrpProAsnGlyLys405410415GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAA129SValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspG丄n42042S430AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGC1344LysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly435440445CATGTAAGTGCACAGGATTCTATTGACHisValSerAlaGinAspSerlieAsp4S0455GATGAACCACTTGAAAAAGCATATAGTAspGluProLeuGluLysAlaTyrSer470TGTTTCTTAATGCAGGACCGTCGTGGACysPheLeuMetGinAspArgArgGly48SACACATAGAAGTGTAGACTTTTTTAATThrHisArgSerValAspPhePheAsnS00SOSCAATTACCGCCAGAAACAACA1392GinLeuProProGluThrThr4S0CATCAGCTTAATTACGCGGAA1440HisGinLeuAsnTyrAlaGlu475480ACAATTCCATTTTTTACTTGG1488Thr*lieProPhePheThrTrp490495ACAATTGATGCTGAAAAGATT1536ThrlieAspAlaGluLyslie510ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSerSISS20S2S1584ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheTht:GlyGlyAsnLeuLeuPheLeuLys5305355401632GAAGlu545TCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCASerSerAsnSerlieAlaLysPheLysVal550S55ThrLeuAsnSerAla5601680GCCTTGTTACAACGATATCGTGTAAGAATACGCAlaUeuLeuGinArgTyxArgValArglieArg56S570TATGCTTCTACCACTTyrAlaSerThrThrS7S1728AACTTACGACTTTTTGTGAsnLeuArgLeuPheVal580CAAAATTCAAACAATGinAsnSerAsnAsn585GATTTTCTTGTCATCAspPheLeuVallie590177S丁ACATTTyrlieAATAAAACTAsnLysThr595ATGAATAAAGATGATMetAsnLysAspAsp600GATTTAACATATCAAACAAspLeuThrTyrGinThr6051824TTTGATPheAsp"0CTCGCAACTlieuAlaThrACTAATTCTAATATGThrAsnSerAsnMet615GGGTTCTCGGGTGATAAGGlyPheSerGlyAspLys6201872AATGAAS25CTTATAATALeulielieGGAGlyGCAGAATCTTTCAlaGluSerPheGTTTCTAATGAAAAAATCValSerAsnGluLyslie635"01920TATATATyrlieGATAAGATAAspLyslieGAATTTATCCCAGTAGluPhelieProVal"0CAATTGTAAGinLeu1959(2>序列编号10的信息(i>序列特征(A)长度652个氨基酸(B)类型氨基酸(D)拓朴学线性(ii)分子类型蛋白质(xi)序列描述序列编号10MetAsnProAsnAsnArgSerGluHisAspIS10Thr工leLysValThrPro15AsnSerGlul^uGinThrAsnHisAsnGin2025TyrProLeuAlaAspAsn30ProAsnSerThrLeuGluGluLeuAsnTyi3S40LysGluPheLeuArgMet45ThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp505560'AlaValGlyThrGlylieSerValVal6570G〗yValProPheAlaGlyAlaLeuThr85AsnThrlieTrpProSerAspAlaAsp100105GluValLeulieAspLysLys115120GinValGlyGinlieLeuGlyValVal7580SerPheTyrGinSerPheIjeu9035ProTrpLysAlaPheMetAla110lieGluGluTyrAlaLysSer125LysAla130LeuAlaGluLeuGinGlyLeuGinAsn135ValAsnAlaLeuAsnSerTrpLysLysTtu'Pro145150155LysArgSerGinAspArglieArgGluLeuPhe165170AsnPheGluAspTyr140LeuSerlieuArgSer160SerGinAlaGluSer175HisPheArgAsnSerMetProSerPheAla180185LeuPheLeuProThrTyrAlaGinAlaAla195200LeuLysAspAlaGinValPheGlyGluGlu210215AspValAla<31uPheTyxAsnArgGinLeu225230SerAspHisCysV,lAsnTrpTyrAsnVal245250GlySerThrTyrAspAlaTx:pValLysPhe260MetThrLeuThrValLeuAspLeulieVal27S280lieArgLeuTyrSerLysGlyValLysThrPheThrAspPro工lePheSerLeuAsnThr305310ThrPheLeuSer*工leGluAsnSear工leArg325330ValSerLysAsnThrHis205TrpGlyTyx220LysLeuThr235GlyLeuAsnAsnArgPheLeuPhePro285GluLeuThr300LeuGinGlu315LysProHisPheGluValLeuLeuX>euSerSerGluGinGinTyr240GlyLeuArg255ArgArgGlu270PheTyrAspArgAsplieTyrGlyPro320LeuPheAsp335TyrLeuGinGlylieGluPheHisThrArgLeuGinProGlyTyrPhe340345350GlyLysAspSerPheAsnTyrTrpserGlyAsnTyrValGluThrArg3553S0365ProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp37037S380LysSer38SThrGluProValGinLysLeuSerPheAspGlyGinLysVal390395400TyrArgThr工leAlaAsnThr*AspvalAlaAlaTrpProAsnGlyLys405410415ValTyrLeuGlyValThrLysValAspPhe420425LysAsnGluThrSerThrGinThrTyrAsp440HisVal45043SSerAlaGinAspSerlieAspGin4S5SerGinTyrAspAspGin430SerLysArgAsnAsnGly445LeuProProGluThrThr4S0AspGluProLeuGluLysAlaTyrSerHis470GinLeuAsnTyrAlaGlu480475CysPheLeuMetGinAspArgArgGlyThrlieProPhePhe485430ThrTrpThr*HisArgSerValAspPhePheAsnThr*500505lieAspAlaGluLyslie510ThrGinLeuProValValLysAlaIyrAlaLeuSerSerGlyAlaSer515520525lielieGluGlyProS30GlyPheThrGlyGlyAsnJJeuLeuPheLeuLys535540GluSerSerAsnSer54SlieAlaliysPhe550LysValThrLeu555AsnSerAla560AlaLeuLeuGinArg565T'yxArgValArglieArgTyrAla570SerThrThr575AsnLeuArgLeuPhe580TyrlieAsnLysThr595PheAspLeuAlaThrS10AsnGluLeulielie625ValGinAsnSer585MetAsnLysAsp600ThrAsnSerAsn615GlyAlaGluSer630AsnAsnAspPheLeuVallie530AspAspLeuThr605MetGlyPheSer620PheValSerAsn。5TyrGinThrGlyAspLysGluLyGlieS40TyrlieAspLyslieGluPhelieProValGinLeu"SS50(2》序列编号11的信息(i>序列特征<A)长度1959錄对(B)类型核普酸(C)链的性质单链(D)拓朴学线性(ix)特征:(A)名称/关键词CDS定位1…1956(xi)序列描述序列编号11:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACAMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThr1015CCTPro48AACAGTGAATTGCAAACTAACCATAsnSerGluLeuGinThrAsnHis20AATCAATATCCTTTAGCTGACAATAsnGinTyrProLeuAlaAspAsn253096CCAAATTCAACACTAGAAGAATTAAATTATProAsnSerThrLeuGluGluLeuAsnTyr*3540AAAGAATTTTTAAGAATGLysGluPheLeuArgMet45144ACTGAAGlu50GACAspAGTTCTACGSerSerThrGAAGTGGluVal55CTAGACLeuAspAACAsnTCTSer60ACAGTAThrValAAALysGATAsp132GCAAlaGTTValGlyACAGGAATTThrGly工le70TCTGTTSerValGTAGCGValGlyCAGGin75ATTlieTTAGGTlieuGlyGTTValGTAVal80240GGAGlyGTTValCCAProTTTGCTGGGPheAlaGly85GCACTCAlaLeuACTTCAThrSer90TTTPheTATTyrCAATCAGinSerTTTPhe95CTTLeu28BAACACTAsnThrlieTGGCCAAGTTrpProSer100GATGCTAspAlaGACCCAAspPro105TrpAAGLysGCTTTTAlaPhe110ATGMetGCAAla336CAAGTTGinValGAAGlu115GTACTGATAValLeulieGATAAGAspLys120AAAATALyslieGAGGluGAGGluTATGCTTyrAla125AAALysAGTSer384AAAGCTL*ysAla130CTTLeuGCAGAGTTAAlaGlu!>euCAGGGTGinGly135CTTCAAL*euGinAATAsnAATASH140TTCGAAPheGluGATAspTATTyr432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer145150155480AAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTCAAGCAGAAAGTLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer16S170175S28CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCHisPheArgAsnSer1MetProSerPheAla180185ValSerLysPhe190GAAGTGGluV3lS7SCTGTTTCTACCAACATAT!>euPheLeuProThrTyr1S5GCACAAGCTGCAAATAlaOlnAlaAlaAsn200ACACATTTAThrHisLeu20STTGCTALeuLeu624TTAAAAGATGCTCAAGTTLeuLysAspAlaGinVal210TTTGGAGAAGAATGGPheGlyGluGluTrp21SGGATATTCTGlyTyrSer220TCAGAASerGlu672GATGTTGCTGAATTCAspValAlaGluPhe225TATACCAGACAATTATyrThrArgGinLeu230AAACTTACACAACAATACI*ysLeuThrGinGinTyr235240720ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysiValAsnTrpTyrA迈nValGlyLeuAsnGlyLeuArg24S250255768GGTTCAGlySerACTTATGATThrTyrAsp2S0GCATGGGTCAlaTrpValAAATTTLysPhe2SSAACAsnCGTTTTCGCArgPheArg270AGAGAAArgGlu816ATGACTMetThrTTAACTGTALeuThrVal275TTALeuGATCTAAspLeu280ATTGTAlieValCTTLeuTTCCCATTTPheProPhe28STATTyrGATAsp8"ATTCGGlieArg290TTATACTCALjeuTyrSerAAA乙ysGGGGTTGlyVal295AAAACALysThrGAAGluCTAACAAGALeuThrAxg300GACAspATTlie912TTTACGPheThr30SGATCCAATTAspProlieTTTPhe310TCACTTSerLeuAATACTAsnThrCTT315CAGGAGTATGinGluTyrGlyCCAPro320960ACTTTTThrPheTTGAGTATALeuSerlie325GAAGluAACTCTAsnSerATTCGAlieArg330AAALysCCTCATTTAProHisLeuTTTPhe335GATAsp1008TATTTATyrL*euCAGGGGATTGinGlylie340GAAGluTTTCATPheHisACGCGTThrArg345CTTbeuCAACCTGGTGinProGly350TACTyrTTTPhe1056GGGAAAGlyLysGATTCTTTCAspSerPhe355AATAsnTATTGGTyrTrp360TCTGGTSerGlyAATAsnTATGTAGAATyrValGlu365ACTThrArg1104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGATProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp370375380U52AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGA丁GGACAAAAAGTTLysSerThrGluProValGinLysLeuSerPheAspGlyGinLysVal3853303354001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyxArgThrlieAlaAsnThrAspVaiAla405410AlaTrpProAsn4151248GTATATTTAGGTGTTValTyrLeuGlyVal420ACGAAAGTTGATTTTAGTCAATATGATGATCAAThrLysValAspPheSerGinTyrAspAspGin425"01236AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThr*TyrAspSerLysArgAsnAsnGly4354404451344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr4504554601332GATGAACCACTTGAAAAAGCAAspGluProLeuGluLysAla465470TATAGTCATCAGTyrSerHisGin475CTTAATTACGCGGAALeuAsnTyrAlaGlu480"40TGTTTCTTACysPheLeuATGCAGGACMetGinAsp485CGTCGTGGAACAATTArgArgGlyThr工le490CCATTTTTTACTTGGProPhePheThrTrp49S1488ACAThrCATAGAHisArgAGTGTAGACSerValAspS00TTTAATPheAsn505ACAATTGATGCTThrlieAspAlaGAAAAGATTGluLyslieS10ACTThrCAACTTGinLeu515CCAGTAGTGProValValAAAGCATATLysAlaTyr520GCCAlaTTGTCTTCAI*euSerSer525GOTGCTTCCGlyAlaSer1584ATTlieATTGAAlieGluS30GCTCCAGGAGlyProGlyTTCACAGGAPheThrGly535GGAGlyAATTTACTAAsnLeuLeu540TTCCTAAAAPheLeuIiys1632GAAGlu5"TCTAGTSerSerAATTCAATTAsnSerlieS50GCTAAATTTAlaLysPheAAAGTTACATTAValThrLeu555AATTCAGCAAsnSerAla5S016B0GCCTTGTTAAlaLeuLeuCAACGATATGinArgTyrC3TGTAAGAArgValArgATAlieS70CGCTATGCTArgTyr*AlaTCTACCACTSerThrThrS751728AACTTACGAAsnLeuArgCTTTTTGTGLeuPheVal580CAAAATTCAGinAsnSer585AACAsnAATGATTTTAsnAspPheCTTGTCATCLeuVallie5901776<formula>formulaseeoriginaldocumentpage216</formula>LysArgSerGinAspArg工leArgGluLeuPheSerGinAlaGluSer165170HisPheArgAsnSerMetProSerPheAlaVal'180185LeuPheL*euProThrTyrAlaGinAlaAlaAsn"5LeuLysAspAlaGinVeil210AspVal225ThrAspGlySerMetThrAlaGiuPheTyr230HisCysValAsn245ThrTyrAspAla260200PheGlyGluGluTrp215ThrArgGinLieuLys235SerLysThrHis205GlyTyr220175PheGluValLieuLeulieuSerSerGluLeuThrGinGinTyr240TrpTyrAsnvalGlyLeuAsnGlyLeuArg250255TrpVallieArg230LeuThrValLeuAspLeu2752B0LeuTyrSerLysGlyVal235265lieLysPheThrAsp305ThirPheLeuTyrLeuGinGlyL*ysAspProSerlie370LysSerThr385Tyr*ArgThrValTyz*LeuLysAsnGlu43SProliePhe310SerlieGlu32SGlylieGluSerPheAsnSerLeuAsnAsnSerlieGlySerSerGluProVal390lieAlaAsnGlyValThr420ThrSearThrPheHisTyrTrpI*ysThr375GinIiysThrAspLysValGinThar440Thr345SerlieLeuValAsp42STyrPheAsnArgPheArgArgGlu270ValLeuPheProPheTyrAsp285ThrGluLeuThrArgAsplie300ThrLeuGinGluTyrGlyPro315320ArgLysProHisI>euPheAsp330335ArgLeuGinProGlyTyrPhe3S0GlyAsnTyrValGluThrArg36SThrSerProPheTyrGlyAsp380SerPheAspGlyGinLysVal395400AlaAlaTrpProAsnGlyLys410415PheSerGinTyrAspAspGin430AspSerLysArgAsnAsnGly44SHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr2450AspGluProLeuGluLys4S5470CysPheLeuMetGinAsp485ThrHisArgSerVailAsp500455460AlaTyxSerHisGinI*euAsnTyrAlaGlu475480ArgArgGlyThrlieProPhePheThrTrp490495PhePheAsnThrlieAspAla505Glu51CThrGinLeuProValValLys515工lelieGluGlyProGlyPhe530S35GluSerSerAsnSerlieAlaAlaTyrAlaS20ThrGlyGlyIiysPheLiysLeuSerSer525AsnLeuLieu540UyslieGlyAlaSerPheLeuLys545AlaLeuLeuSSOGinArgTyrArgValArglie570AsnLeuArgLeuPheValS80GinAsnSer1AsnS85ValThrLeuAsnSerAla555560ArgTyrAlaSerThrThr57SAsnAspPheLeuVallie590TyrlieAsnS9SPheAspLeuAsnGluLeuS25L*ysThrMetAsnLysAspAspAspS00LeuThrTyrGinThrSOSAlaThrThrAsnSer*AsnMetGlyPheSerGlyAspLysSIS工lelieGlyAla630Tyr工leAspLyslieGluPhe(2)序列编号13的信息(丄)序列特征(A)长度1959#对(B>类型核苷酸(C>链的性质单链(D)拓朴学线性GluSerPheVal635lieProValGlix650S20SerAsnGluLyslieLeu特征:(A)(B)名称/关键词CDS定位1,.1356<xi)SEQUENCEDESCRIPTION:SEQIDNO:13:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCT4BMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrProIS1015AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHisAsnGin2025TyrProLeuAlaAspAsn30CCAAATTCAACACTAGAAGAATTAAATTATProAsnSerThrLeuGluGluLeuAsnTyr3540AAAGAATTTTTAAGAATGLysGluPheLeuAz:gMet45144ACTGAAGACAGTTCTACGGAAGTGCTAGACThrGluAspSerSerThrGluvalLe\iAsp5055AACTCTACAGTAAAAGATAsnSerThrValLysAsp60192GCAGTTGGGACAGGAATTTCTGTTGTAGGGAlaValGlyThrGlylieSerValValGly6570CAGATTTTAGGTGTTGTAGinlieLieu<3lyValVal7580240GGAGTTCCATTTGCTGGGGCACTCACTGlyValProPheAlaGlyAlaLeuThr85TCATTTTATCAATCATTTCTTSerPheTyrGinSerPheLeu9095288AACACTATATGGCCAAGTGATGCTGACAsnThrlieTrpProSerAspAlaAsp100105CCATGGAAGGCTTTTATOGCAProTrpLysAlaPheMetAla110336CAAGTTGAAGTAGinValGluVal11SCTGATAGATJLeulieAspAAGLys120AAAATALyslieGAGGluGAGGluTATTyr12SGCTAlaAAAAGTLysSsr384AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATLysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyrUO13S140432GTT145GCGTTAAlaLeuAATAsnTCCSer150TGGTrpAAGLysAAAACACCTPro155TTAAGTSerTTGLeuCGAArgSer160480AAAAGAAGCCAASerGinGATAsp165ArgATAlieAGGArgGAAGluCTTL>eu170TTTTCTSerCAAGill<3CAAlaGAAGlu175AGTSer528CATHisTTTPheCGTAATArgAsn180TCCSerATGMetCCGProTCASerTTTPhe185GCAAlaGTTvalTCCAAALysTTCPhe190GAAGluGTGVal576CTGLeuTTTCTACCALeuPro195ThrTATGCAAlaCAAGin200GCTAlaGCAAlaAATAsnACAThrCATHis20STTALeuTTC3CTALeuTTA!>euAAA210GATGCTAspAlaCAA3lnGTTTTT215GGAGAAGluGAATGGGGA220TATTyrTCTTCASea:GAA672GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAATAC720AspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinG工nTyr22523023S240ACTGACCATTOTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsmValGlyLeuAsnGlyLeuArg24S2502SSGGT丁CAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySet*ThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu2602S5270816ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsji2752802858"ATTAATTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTlieAsnLeuTyrSerLysGlyValLysTtu:GluLeuThrArgAsp工le290295300912TTTACGGATCCAATTTTTTCACTTAATACTCTTCAGGAGTATGGACCAPheThrAspProliePheSerLeuAsnThrLeuGinGluTyrGlyPro30S310315320950ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATThrPheLeuSerlieGluAsnSerlieArgLysProHisLeuPheAsp3253303351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAATyrLeuGinGly工leGluPheHisThrArgLeuGin34034SCCTGGTProGly350TACTyrTTTPhe1056GGGAAAGATTCTTTCGlyUysAspSerPhe355AATTATTGGAsnTyrTrp360TCTGGTSerGlyAATTATGTAGAAValGUiACTThr1104CCTAGTProSer*370ATAG<3ATCTlieGlySerAGTAAGACASerLysThr375ATTACTlieThrTCCSerCCAPro380TTTPheTATTyrGGAGlyGATAsp1152AAATCTLysSer385ACTGAACCTThrGluProGTACAAAAGValGinLys390CTAAGCLeuSerTTTGATAspGGAGlyCAAGinAAAGTTVal4001200TATTyrCGAACTATAGCTThtieAla405AATACAGACAsnThrAspGTAGCGValAla410GCTAlaTGGTrpCCGProAATGGTGly41SAAG1248GTAValTyrTTAGGTGTTLeuGlyVal420ACGAAAGTTThrLysValGATTTTAspPhe425AGTCAAGinTATTyrGATAsp"0GATAspCAAGin12%AAAAATGAAACTAGTGluThrSer435ACACAAACAThrGinThr440TATGATTyrAspTCASerAAAAGA445AACAATGGC1344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACA1332HisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr4504S54S0GATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAAAspGluProLeuGluLysAlaTyrSerHisGinLeuAsn.TyrAlaGlu"5—47047S4801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTT丁TTACTTGGCysPheLeuMetGinAspArgArgGlyThz*lieProPhePheThrTrp485490435"88ACACATAGAAGTGTAGACTTTTTTAATThrHisArgSerValAspPhePheAsnSO0505ACAATTGATGCTGAAAAGATTTharlieAspAlaGluLyslieS101536ACTCAACTTCCAGTAGTGWUlGCATATThrGinLeuProValValLysAlaTyr515S20GCCTTGTCTTCAGGTGCTTCCAlaLeuSerSerGlyAlaSer52515B4lielie530GAAGGTCCAGluGlyProGGATTCACAGGAGlyPheThrGlyS35GGAAATTTACTATTCCTAAAAGlyAsnLeuLeuPhelieuLys5401632GAATCTAGTAATTCAGluSerSer1AsnSer545ATTGCTAAATTTlieAlaL<ysPhe550AAAGTTACALysValThr555TTAlieuAATGCAAla560GCCTTGAlaLeuTTACAACGALeuGinArg565TATCGTGTATyrArgValAGAArgATACGClieArg570TATTyrGCTAlaTCTSerACCThr575ACTThr1728AACTTAAsnLeuCGACTTTTTArgLeuPhe580GTGCAAAATValGinAsnTCAAAC585AATGATAspTTTCTTLeu530GTCValATClie1776TACATTTyrlieAATAsn595AAAACTLysThrATGAATAAAMetAsnLys600GATGATAspAspGATAspTTALeuACAThrSOSTATTyrCAAACAGinThr1824TTTGATPheAsp610l>euGCAACTAlaTharACTAATTCTThrAsnSer615AATATGAsnMetGGGGlyTTC620TCGSerGGTGlyGATAAGAspLys1872AATGAAAsnGluS25CTTATAATAlielieGGAGCAGAAGlyAlaGlUS30TCTTTCSerPheGTTTCTAATAsnGluAAAATCLyslie6401920TATATATyxlieGATAspTAGATALyslie6"GAATTTATCGluPhelieCCAGTAProVal650CAAGinTTGLeuTAA1959U)序列编号14的信息:(i)序列特征<A)长度652个氨基酸(B》类型氨基酸(D>拓朴学线性(ii)分子类型蛋白质(xi>序列描述序列编号14:MetAsnProAsnAsnArgSerGluHisAspThrlieLysVal1510AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAla202S30ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeu354045ThrGluAspSerSerThrGluValLeuAspAsnSer*ThrVal505560ThfPro15AspAsnArgMetLysAspAlaValGlyThrGly工leSerValValGlyGinlieLeuGlyValVal707580GlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu8S9095Me仁AlaLysSerAspTyrAsnThrlieTrpProSerAspAlaAspPro100105GinValGluValL>eulieAspLysLyslie115120LysJUaLeuAlaGluLeuGinGlyLeuGinTrpLysAlaPhe110GluGluTyrAla125130ValAsnAla145LysArgSerHisPheArgLeuPheLeuLeuLysAsp210AspValAla225ThrAspHisGlySerThr135LeuAsnSerTrpLtys150GinAspArglieArgAsnSerMetProSer180ProThrTyrAlaGin200AlaGinValPhe<31y215GluPheTyrHisArg230CysValAsnTipTyrTyrAspAlaTrpVal260LysThrAsnAsnPheProLeuSer*155GlULeuGluLeu170PheSerGinAlaPheAlaValSerLys185AlaAlaAsnThrHis205GluGluTrpGlyTyr220GinLeuLysLeuThr235AsnValGlyLeuAsn250LysPheAsnArgPhe265Phe190160GluSer175GluValLeuLeuLeuSerSerGluGinGlyArg270GinTyr240LieuArg255ArgGluMetThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsp27528028SlieAsnLeuTyrSerLysGlyValLysThrGluLeuThrArgAsplie290295300PheThrAspProliePheSerLeuAsnThr305310ThrPhelieuSerGlyLysProSer370GinGly340AspSer355lieGluAsnSerlie325lieGluPheHisThr345PheAsnTyxTrpSer360工leGlySerSerThrlie375Arg330ArgGlyThr"LeuGinGluTyr315LysProHisLeuGlyPro320PheAsp33SI*euGinProAsnTyrValSerProPhe380GlyTyrPhe350GluThrArgTyrGlyAspGinLysVal385390395400TyrArgThr工leAlaAsnThrAspValAlaAlaTrpProAsnGlyLys405410415ValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin42042S430LysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly440445LysSerThrGluProValGinLysLeuSerPheAspGlyHisVal450AspGlu46S43SSer*AlaProLeuCysPheLeuMetThrHisThrGinlielie530GluSerS4SArgSer.500L<euProSISGluGlyGinAspSerlieAspGinLeuProProGluThrThrGluLysAlaTyxSerHisGinLeuAsnTyrAlaGlu470475480G丄nAspArgArgGlyThrlieProPhePheThrTrp48S490495ValAspPhePheAsnThrlieAspAlaGluLyslieSOS510ValValLysAlaTyrAlaLeuSerSerGlyAlaSer52052SProGlyPheThrGlyGlyAsnLeuLeuPheLeuLysS3S540SerlieAlaLysPheLysValThrLeuAsnSerAlaSS0SS5560AlaLeuLeuGinArgTyxArgValArglieArgTyrAlaSerTiirThr565570S75AsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVa丄lieS8058S590Tyr工leAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr595600605PheAspLeuAlaThrThrAsnSerAsnMe仁GlyPheSerGlyAspLys610615620AsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslieS25630635640Tyr工leAspLyslieGluPhelieProValGinLeu"S650(2)序列编号15的信息:(i)序列特征(A>长度1959碱基对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性特征:<A)(B)名称/关鍵词CDS定位1..13S6(Xi)SEQUENCEDESCRIPTION:SEQIDNO:15:ATGAATMetAsnCCAProAACAsnAATAsnCGAArgAGTSerGAACATGATGluHisAsp10ACGThrATAAAGGTTlieI*ysValACAThrISPro48AACAGTGAAGluTTGLeu20CAAGinACTThrAACAsnCATAATCAAHisAsnGin25TATTyrCCTTTAGCTProLeuAls30GACAspAATAsn96CCAAATProAsnTCASer35ACAThrCTALeuGAAGluGAAGluTTAAATTATLeuAsnTyr40AAAGAATTTTTAGluPh'eLeu4SAGAArgATGMet144ACTGAAThrGlu50GACAspSerTCTSerACGThrGAAGlu55GTGCTAGACValLeuAspAACAsnTCTACAGTASerThrVal60AAALysGATAsp192GCAGTTAlaValGGGGlyACAThrGGAGlyATTlie70TCTSerGTTGTAGGGValValGlyCAGGin75ATTTTAGGTlieLeuGlyGTTValGTAVal80240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATCAATCATTTCTTGlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu2B8859095AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCAAsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla100105110336CAAOTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTGinValGluValLeulieAspLysLys115120工leGluGluTyrAlaLysser125384AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAA丁LysAlaLeuMaGluLeuGinGlyLeuGinAsn130USAATTTCGAAGA丁TATAsnPheGluAspTyr140"2GTTAATGCGTTAValAsnAlaLeu145AATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTAsnSerTrpLysLysThrProLeuSerLeuArgSer150155160480AAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTCAAGCAGAAAGTLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer165170175528CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal180185190576CTGTTTCTALeuPheLeu19SCCAACATATGCACAAGCTGCAAA丁ACACATTTATTGCTAProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu200205624TTAAAAGATGCTLeuLysAspAla210CAAGTTTTTGGAGAAGinValPheGlyGlu215GAATGGGGATATTCTTCAGAAGluTrpGlyTyrSerSerGlu220S72GATGTTGCTGAATTTAspValAlaGluPhe22STATCATAGACAATTAAAACTTACACAACAATACTyrHisArgGinLeuLys工euThrGinGinTyx230235240720ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg2452502S57S8GGTTCAGlySerACTTATThrTyr260GATAspGCATGGGTCAlaTrpValAAALys2S5TTTAACCGTTTTPheAsnArgPhe270AGAGAAArgGlu816ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuA印LeulieValLeuPheProPheTyfAsp275280285864ATTCGGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTlieArgLeuTyrSerLysGlyValLysThr*GluLeuThrArgAsplie290255300912TTTACGGATCCAATTTTTTTACTTACTACGCTTCAGAAGTACGGACCAPheThrAspProliePheLeuLeuThrThrLeuGinLysTyrGlyPro56030S31031S320ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATThrPheLeuSerlieGluAsnSerlieArgLysProHisLeuPheAsp3253303351008TATTTACAGGGGATTGAATTTCATACGCGTCTTTyrLeuGinGlylieGluPheHisThrArgLeu340345CAACCTGGTTACTTTGinProGlyTyrPhe3S01056GGGAAAGATTCTTTCAATTATTGGTCTGGTAATGlyLysAspSerPheAsnTyrTrpSerGlyAsn355360TATGTAGAAACTAGATyrValGluThrArg3651104CCTAGTATAGGATCTAGTAAGACAATTACTTCCProSer工leGlySerSerLysThrlieThrSer37037SCCATTTTATGGAGATProPheTyrGlyAsp3801152AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGTTLysSerThrGluProValGinLysLeuSer*PheAspGlyGinLysVal3853S03954001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys40541041S1248GTATATTTAValTyrLeuGGTGTT.ACGGlyValThr420AAAGTTGA丁LysvalAsp425TTTAGTCAATATPheSerGinTyrGATGATAspAsp430CAAGill1236AAAAATGAALysAsnGlu435ACTAGTACAThrSerThrCAAACATATGinThrTyx440GATTCAAAAAGAAspSerLysArg445AACAATAsnAsnGGCGly1344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr4S04554S01392GATAsp465GAAGluCCACTTProLeuGAAAAAGiuLys470AlaTATAGTTyrSerCATHisCAGCTTGinLeu475AATAsnTACGCGTyrAlaGAAGlu4801440TGTCysTTCPheTTAATGLeuMetCAGGACGinAsp485CGTCGTGGAArgGlyACA"0ATTCCAlieProTTTPheTTTACTPheThr49STGGTrp14B8ACAThrCATHisAGAAGTArgSer500GTAGACValAspTTTPheTTTAATPheAsn505ACAThrATTGATlieAspGCTAlaGluLysS10ATTlie1536ACTThr*CAAGinCTTCCALeuPro515GTAGTGValValAAAGCATATAlaTyr520GCCAlaTTGTCTLeuSerTCASer525GGTGCTGlyAla丁CCSer1584ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys1S32530535540GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAla545S50SS5560■1680GCCTTGTTACAACGATATCGTGTAA(5AATACGCTATGCTTCTACCACTAlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThrSS5S705751728AACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCAsnLeuAxgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie5805855901776TACATTAATTyrlieAsn595AAAACTATGAATLysThrMetAsnAAAGATGATGATTTAACATATCAAACALysAspAspAspLeuThrTyrGinThr6006051824TTTGATPheAspCTCGCAAlaACTACTThrThrAATTCTAATSerAsnATGMetGGGTTCGlyPhe620TCGGGTGATAAGSerGlyAspLys1872AATGAAAsnGlu625CTTLeuATAlieATAlieGGAGly630GCAAlaGAATCTGluSerTTCGTTTCTPheValSer635AA丁GAAAAAATCAsnGluLyslie6401320TATATAGATAAGATAGAATTTATCCCAGTACAATTGTyrlieAspLyslieGluPhe工leProValGin!>eu645650TAA(2)序列编号16的信息(i)序列特征(A)长度652个氨基酸(B》类型氨基酸(D)拓朴学线性<ii)分子类型蛋白质(xi)序列描述序列编号16MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrProS1015AsnSerGluLeu20GinThrAsnHisAsnGinTyrProLeuAlaAspAsn2530ProAsnSerThr35LeuGluGluLeuAsnTyrLysGluPheLeuArgMet4045ThrGluAspSerSerThfGluSO55ValLeuAspAsnSerThrValLysAsp60AlavalGlyThar65GlylieSerValValGlyOlnlieLeuGlyValVal707580GlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLieu853095AsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla100105110GinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSerIISLysAlaLeuAla130ValAsnAla145LysArgSerHisPheArgLeuPheLeu135Leu120125GluLeuGinGlyLeuGinAsnAsnPheGluAspTyr135140AsnSerTrpLysLysThrProLeuSerLeuArgSer150155160GinAspArg工leArgGluLeuPheSerGinAlaGluSerAsn180165SerMetProSerPhe185ProThrTyrAlaGinAla200LeuLysAspAlaGinValPheGlyG工u210215AspValAlaGluPheTyrHisArgGin225230ThrAspHisCysValAsnTrpTyrAsnVal24S250GlyleuAsnGlyLeu255GlySerMetThrThrTyrLeuThr27SAspAlaTrpValliePhe30SArg290LeuTyxThrAspValLeuSerLysAspLeu280GlyVal295IjysPhe工leValLysThrAsnArgPheProliePheLeuLeuThrThr310ThrPheLeuSerlie<31uAsnSer325TyrGlyProLeuGinGlylieGluPheHis340LysAspSerlie370SerPheAsnGlySerSerTyrTrp37SlieArg330ThrArgSerGlylieThr170175AlaValSerLysPheGluVal190AlaAsnThrHisLeuLeuLeu205GluTrpGlyTyrSerSerGlu220LeuLysLeuThrGinGinTyr235240ArgGluAsplieProAspPheAspLeuPhePro28SGluLeuThr300lieuGinLys31SLysProHisArgArg270PheTyrArgAspTyrGlyLeuGinProAsnTyrValSerProPhe380LeuPhe335GlyTyr350GluThrTyrGly<formula>formulaseeoriginaldocumentpage229</formula>(B>类型核苷酸(C)链的性质单链(D)拓朴学线性(ix)特征(A〉名称/关键词CDS(B》定位1..1956(xi)序列描述序列编号17:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCTMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrProIS101548AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn20253036CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAProAsnSerThrLeuGluGluLeuAsnTyrLysGluPhe35404SLeuAGAATGMet144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACTCTACAGTAAAAGATThrGluAspSerSer*ThrGluValLeuAspAsnSerThrValLysAsp5055SO192GCAGTTGGGACAGGAATTTCTGTTGTAGGGCAGATTTTAGGTGTTGTAAlaValGlyThrGlylieSerValValGlyGinlieLeuGlyValVal65707S80240GGAGTTCCATTTGlyValProPheGCTGGGAlaGly85GCACTCAlaLeuACTTCASer30TTTPheTATCAATyrGinTCATTTCTTPhelieu3528BAACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGOCAAsnThr工leTrpProSerAspAlaAspProTrpLysAlaPheMetAla10010511033SCAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTGinValGluValLeulieAspLysLys工leGluGluTyrAla.LysSer1151201253B4AAAGCTLysAla130CTTGCAI^euAlaGAGTTAGluLeuCAGGGTGinGly135CTTLeuCAAGinAATAATTTCAsnPhe140GAAGATTATGluAspTyr432GTTAATValAsn145GCGTTAAlaLeuAATTCCAsnSer150TGGAAGTrpLysAAALysACAThrCCTPro1S5TTAAGTLeuSerTTGCGAAGTLeuArgSer160480AAAAGAAGCCAASerGinGATCGAAspArg165ATAAGGlieArgGAAGluCTT170TTTPheTCTCAASerGinGCAGAAAGTAlaGluSer175S28CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal180185190576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHis"5200205LeuLeuLeu624TTAAAAGATGCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAALeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu21021S220672GATGTTAspVal22SGCTAlaGAATTTGluPheTATTyr230CATAGACAATTAHisArgGin丄euAAACTTACALysLeuThr235CAACAATACGinGinTyr240720ACTGACThrAspCATHisTGTGTTCysVal245AATAsnTGGTATAATTrpTyrAsnGTTVal250GGATTAAATGlyLeuAsnGGTTTAAGAGlyLeuArg25576BGGTTCAACTTATGATGCATGGGTCAAATTTAACGlySerThrTyrAspAlaTrpValLysPheAsn2602S5CGTTTTCGCAGAGAAArgPheAr:gArgGlu270ATGACTTTAACTGTATTAGATCTAATTMetThrLeuThrValLeuAspLeulie275280GTACTTTTCCCATTTTATGATValLeuPheProPheTyrAsp2B5864ATTCGGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTlieArgLeuTyrSerLysGlyValLysThrGluLeuThrArgAsplie29029S300912TTTACGPheThr305GATAspCCAATTPro工leTT丁ACCPheThr310LeuAATACAThrCTALeu315CAGAAGTGCGGAGinl>ysCysGlyCCAPro320360ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATThrPheLeuSerlieGluAsnSerlieArgLysProHisLeuPheAsp3253303351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTTTyrLeuGinGlylieGluPheHisThrArgLeuGinProGlyTyrPhe3403453501056GGGAAAGATTCTTTCAATTATTGGTCTGGTAATTATGTAGAAACTAGAGlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg3553S03651104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGATProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp370375330U52AAATCTLysSer*385ACTThrGAACCTGluProGTACAAValGin390AAGLysCTAAGCSerTTTPhe395GATGGACAAAAAAspGlyGinLysGTTVal4001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGTyrAfgThrlieAlaAsnThrAspValAlaAlaTrp405410CCGAATGGTAAGProAsnGlyLys4151248GTATATTTA—GGTGTTACGAAAGTTGATTTTAGTCAAValTyrLeuGlyValThrLysValAspPheSerGin420425TATGATGATCAATyrAspAspGin4301296AAAAATGAAACTAGTACACAAI>ysAsnGluThrSerThrGin435ACATATGATTCAAAAThrTyrAspSerLys440AGAMCAATGGCArgAsnAsnGly4451344CATGTAAGTC3CACAGGATTCTHisValSerAlaGinAspSer4S0455ATTGACCAATTACCGCCAlieAspGinL*euProPro460GAAACAACAGluThrThr1392GATGAACCACTTGAAAAAGCAAsp<3luProLeuGluLysAla465470TATAGTCATCAGCTTAATTyxSerHisGinLeuAsn475TACGCGGAATyrAlaGlu4801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGCysPheLeuMetGinAspArgArgGlyThrlieProPhePheThrTrp4854904951488ACACATAGAAGTGTAThrHisArgSerVal500GACTTTTTTAATAspPhePheAsn505ACAATT<5ATGCTGAAAAGATTThrneAspAlaGluLyslieS10ACTCAAThr<UnCTTCCAGTAProValS15GTGAAAGCATATGCCTTGValLysAlaTyrAlal#euS20TCTTCAGGTGCTTCCSerSerGlyAlaSer5251584ATTATTGAAGGTCCAGGATTCACAGGAGGAAATlielieGluGlyProGlyPheThrGlyGlyAsn530535TTACTATTCCTAAAALeuLeuPheLeuLysS401632GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAla5455505555601680GCCTTGAlaLeuTTACAAliSUGinCGAS65TATCGTGTAAGATyrArgValArgATACGClieArg570TA丁GCTTCTTyrAlaSerACCACTThrThr5751728AACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie58058S5901*776TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr5356006051824TTTGATCTCGCAACTACTAATTCTRATATGGGGTTCTCGGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMe仁GlyPheSerGlyAspLys6106156201872AATAsn625TATTyrGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATC1920GluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie"0635"0ATAGATAAGATAGMTTTATCCCAGTACAATTGTAAlieAspLyslieGluPhelieProValGinLeu"5650(2)序列编号18的信息(i)序列特征(A)长度652个氨基酸(B)类型氩基酸(D)拓朴学线性(ii)分子类型蛋白质序列描迷序列编号18:MetAsnProAsnSerGluAsnAsnArgSerGluHisAspThrlieLysValThr*Pro51015LeuGinThrAsnHis20ProAsnSer3SThrGluAsp50ThrLeuSerSerAlaValGlyThrGly65GlyValProAsnThrlieGinValGlu115LysAlaLeuValAsnAla145LysArgSerHisPheArgPheAla85TrpPro100ValLeuAlaGluI>suAsnGinAsp165AsnSer180GluGluLeu40ThrGluVal55lieSerVal70GlyAlaLeuSerAspAlalieAspLys120LeuGltiGly135SerTrpLysArglieArgMetProSer2SAsnTyrLysGluPhe4SLeuAspAsnSerThr60AsnGinTyrProLeuAlaAspAsn30L>euArgMetValLysAspGlyValVal80SerPheLeuPheMetAla110AlaLysSerGluAspTyrValThrAsp105LysLieuGlyGinlieLeu75SerPheTyrGin90ProTrpLysAlaLyslieGluGluTyr125GinAsnAsnPhe140ThrProLeuSer155GluLeuPheSer*Gin170PheAlaValSerLys1B5LieuArgSer160AlaGluSer175PheGluVal1901959LeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu"5LeuLysAspAlaGinVal210AspValAlaGluPheTyr22523020020SPheGlyGluGluTrpGlyTyrSerSerGlu21S220HisArgGinLeuLysLeuThrGinGinTyr23S240ThrAspHisGlySerThrCysValAsn245TrpTyrAsnVal250GlyLeuAsnGlyLeuArg255MetThrlieArg290PheThr30SLeu27SLieuAspTyrAspAlaTrpVal260ThrValLeuAspLeu280TyrSer*LysGlyVal295ProliePheThrLeu310lieValAsnArgPheLeuPhePro285LysThr*GluLeuThrAsnThrLeuGinLys315270PheArgArgGluTyrAspAsplieGlyPro320ThrPheLeuSerlie325TyrLeuGinGlylie340GluAsnSet*GlyLysProSer370LysSer*385TyrArgValTyrLysAsnHisVal450AspGlu465AspSerPhe3S5GluPheHisAsnTyrTrp360lieArg330ThrArg345SerGlyLysProHisLeuPheAsp335LeuGinProGlyTyrPhe350lieGlySerSerLysThrlieThr37SThrGluProValGinLysLeuSer390AsnTyrVal365SerProPhe380PheAsp395GlyGluThrArgTyrGlyGinLysAspThrlieAlaAsnThr405lieuGly420GluThr435AspValThrLysValSerThrGinThr440SerAlaGinAspSerlie455ValAlaAspPhe425TyrAspAspGinAlaTrpProSerGinTyrAsnGly415AspAsp430Val400LysGinProLeuGluLysAlaTyrSerHis470CysPheLeuMetGinAspArgArgGlyThr485430SerLysArg445UeuProPro460GinL*euAsn47SlieProPheAsnAsnGlyGluThrThrTyrAlaPheThr435Glu480Trp<formula>formulaseeoriginaldocumentpage235</formula>CCAAATTCAACACTAGAAGAATTAAA丁TA丁AAAGAATTTTTAAGAATGProAsnSerThr!>euGluGluLeuAsnTyrLysGluPheLeuArgMe仁354045144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACTCTACi[VGTAAAAGATThrGluAspSerSerThrGluVal50SSLeuAspAsnSerThrValLysAsp50192GCAGTTGGGACAGGAATTTCTGTTGTAGGGCAGAlaValGlyThrGlylieSerValValGlyGin707SATTTTAGGTGTTGTAlieLeuGlyValVal80240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATGlyValProPheAlaGlyAlaLeuThrSea:PheTyr8590CAATCATTTCTTGJLnSerPheLeu95288AACACTATATGGCCAAsnThr工leTrpPro100AGTGATGCTGACCCATGGAAGGCTTTTATGGCASerAspAlaAspProTrpLysAlaPheMetAla10S110336CAAGTTGAAGTACTGGinValGluValLeu115ATAGATAAGAAAATAGAGGAGTATGCTAAAAGT工leAspLysLyslieGluGluTyrAlaLysSer120125384AAAGCTCTTGCAGAGTTACAGGGTCTTLysAlaLeuAlaGluLeuGinGlyLeu130135CAAAATAATTTCGAAGATTATG工nAsnAsnPheGluAspTyr140432GTTAATValAsn145GCGA二aTTAAATTCCLeuAsnSer150TGGAAGTrpiLysAAALysACAThrCCTTTAAGTProLeuSer155TTGCGALeuArgAGTSer160480AAAIjy5AGCCAAGATCGAGinAspArg165ATAAGGlieArgGAAGluCTTLeu170TTTTC::CAAPheSerGinGCAGAAAlaGlu175S28CATHisTTTPheCGTArgAATTCCATGAsnSerMet180CCGTCAProSerTTTPhe185GCAAlaGTTTCCAAAValSerLysTTCGAAPheGlu150GTGVal576CTGLeuTTTPheCTALeu135CCAACATATProThrTyrGCACAAAlaGin200GCTAlaGCAAlaAATACACATAsnThr*His205TTATTGLeuLeuCTALeu624TTALeuAAA210GATAspGCTCAAGTTAlaGinValTTTGGAPheGly215GAAGluGAAGluTGGGGATATTrpGlyTyr220TCTTCAGAA672GATAsp225GTTValGCTAlaGAATTTTATGluPheTyr230CATAGAHisArgCAAGinTTAAAACTTACAIjysLeuThr235CAACAAGinGinTACTyr240720ACTThrGACAspCATHisTGTGTTAATCysValAsn245TGGTATTrpTyrAATAsnGTTVal250GGATTAAATGlyLeuAsnGGTTTA255AGA768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySer*ThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu2S02^5270ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsp275280285B64ATTCGGTTATACTCAlieArgLeuTyrSer*230AAAGGGGTTAAAACAGAACTAACAAOAGACATTLysGlyValJbysThrGluI*euThrArgAsp工le235300912TTT305AC<3GATCCAATTThrAspProlieTTTGCCGTTAATACTCTGTOGGAATACGGACCAPheAlaValAsnThr*LeuTrpGluTyrGlyPro310315320柳ACTTTTTTGAGTATAThrPheLeuSerlie325GAAAACTCTATTCGAAAACCTCATTTATTTGATGluAsnSerlieArgLysProHisLeuPheAsp3303351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAATyrLeuGinGlylieGluPheHisThrArgLeuGin340345CCTGGTProGly350TACTyr1056GGGAAAGATTCTTTCGlyLysAspSerPhe35SAATTATTGGTCTGGTAATTATGTAGAAACTAGAAsnTyrTrpSerGlyAsnTyrValGluThrArg3603S51104CCTPro370ATAGGAlieGlyTCTAGTAAGSerLys375ACAThrATTACTlieThrTCCSerCCATTTTATProPheTyr380GGAGATGlyAsp11S2AAATCTACTGAACCT"ACAAAAGCTAAGCTTTGATGGACAAAAAGTTLysSerThrGluPro"1GinLysLeuSerpheAspGlyGinLysVal3853903954001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys4054104151248GTATATTTAGGTGTTACGAAAGTTGATTTTACTCAATATGATGATCAAValTyrLeuGlyValThrLysValAspPheserGinTyrAspAspGin420425"01296AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThrTyrAspSer*I>ysArgAsnAsnGly"54404451344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr4504554601392GATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAAAspGluProLeuGluLysAlaTyrSerHisGinLeuAsnTyrAlaGlu4€S4704754801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGCysPhelieuMetGinAspArgArgGlyThrlieProPhePheThrTrp4854904951488ACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSerValAspPhePheAsnTharlieAspAlaGluLyslieS0050S510ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCThrGinLeviProValValLysAlaTyrAlaL*euSerSerGlyAlaSer51SS20S2S1584ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLysS30S3S5401632GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCA1680Gl\iSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAla545550555560GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTJVCCACT1728AlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThrSSS570575AACTTACGACTTTTTGTGCAAAATT仁AAACAATGATTTTCTTGTCATCAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie580S8S5901776TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyxGinThr5956006051824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAG1872PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610615620AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATC1920AsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslieS2S630635"0TATATAGATTyrlieAspMAlie645GAAGluTTTATCPhelieCCAGTAProVal650CAAGinTTGTAALeu(2)序列编号20的信息(i>序列特征长度652个氨基酸(B)类型氨基酸(D)拓朴学线性(ii)分子类型蛋白质(xi>序列描述序列编号2MetAsnProAsnAsnArgSer*GluHisAspThrlieLysValThrPro151015AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202S30ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet35ThrGluAspSer50AlaValGlyThr65GlyValProPhe4045SerThrGluValLeuAspAsnSerThrValLysAsp55GlylieSerValValGlyGin75Ala8570GlyAlaGinValLysAla130lieTrp100ProSerAspLeuThrSerPhe90AlaAspProTrp105GluValLeu115LeuAlaGlulieAspLbuGin13SValAsnA3LaLeuAsnSerTrp145150Lys二rgSer*GinAspArglieArg155LysLyslie120GlyLeuGinLysLysThrGlu60lieLeuGlyValVal80TyrGinSerPheLeuLysAlaPheMetAla110GluTyrAlaLysSer12SAsnAsmPheGluAspTyr140GluLeu170ProLeuPheSerSerLeuArgSerISOGinMaGluSer175HisPheArglieuPheLeuLeuLysAsp210AspValAla225ThrAspHisGlySerThrMetThrLeu275lieArgfteu290AsnSer180MetProScPheAlaValSer185LysPheGluVal190ProThrTyrAlaGinValAlaGin200PheGly215AlaAlaAsnThrHisLeuLeuL*eu205GluPheTyrHisArg230CysVal245TyrAsp260AlaThrValLeuTyrSerLysTrpTyrTrpValAspLeu280GlyVal295GluGluTrpGly220GinLeuLysLeu235AsnValGlyLeu250LysPheAsnArg2SSlieValLeuPheLysTharGluLeu300TyrSerSerGluThrAsnPhePro285GinGinTyrGlyLeuArg255ArgArgGlu270PheTyrAspArgAspliePheThrAspProliePheAlaVal305310ThrPheLeuSerlieGluAsnSer325TyrLeuGinGlylieGluPheHis340GlyLysProSer370LysSer385AspSer*PheAsnTyrTrp355360AsnThrLeuTrpGluTyxGlyPro315320lieArgLysProHisLeuPheAsp330335ThrArgL>euGinProGlyTyrPhe3453S0SerGlyAsnTyxValGluThrArg3SSlieGlySerSerLysThr375lieThrTyrArgThrGluProVal390lieAlaAsn405GinLysl*euThrAspValValTyrLeuGlyValThrLysValAsp420425ThrSerProPheTyrGlyAsp380SerPheAspGlyGinLysVal395400AlaA〗aTrpProAsnGlyLys41041SPheSerGinTyrAspAspGin430LysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly"044SGinAspSerlieAspGinLeuProProGluThrThr460435HisValSerAla450AspGluProCysPheLeuMetGluJjys470GinAsp485455AlaThrHisArgSerValAspPhe500ThrGinLeuProValValLys51STyrSerHisGin475ArgGlyThrliePheAsnThrlieAlaTyrAlaLeu520LeuAsnTyrAlalielie530GluSerS4SGluGlyProGlyPheThrGlyGlyAsnS3SProPheAspAlaSerSer525LeuLeuS40PheThr435GluUys510Glu480TrplieGlyAlaSerPheLeuLysSerAsnAlaLeuLeuGinSerlieArgTyx56SAlaArgAsnLeuArgLeuPheValGin580TyrlieAsnLysThrMetAsnS9SLysPheLysVal555ValArglieArgS70AsnSerAsnAsn585乙ysAspAspAspS00ThrLeuAsnSerTyrAlaAspPheLeuThr60S57SLeuVal590AlaThrlieTyxGinThrPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610615620Asn<31uLeulielieGlyAlaGluSerPheValSerAsnGluLyslie625630"5S40Tyr工leAspLys工leGluPhe工leProValGinLeu(2)序列编号21的信息(i)序列特征(A)长度1959絲对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性(ix>特征(A)名称/关键词CDS(B)定位l.,195G(xi)序列描述序列编号21ATGAATCCAAACAATCGAAGTMetAsnProAsnAsnArgSerGAACATGATACGATAAAGGTTACACCTGluHisAspThrlieLysValThrPro101548AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn20253096CCAAATProAsnTCAACASerThr35CTALeuGAAGluGAAGluLeu40AATTATAsnTyrAAALysGAAGluTTTTTAPheIjeu45AGAATGArgMet144ACTGAAThrGlu50GACAGTAspSerTCTSerACGThrGAAGlU5SGTGCTAGACI^uAspAACAsnTCTSer60ACAGTAThrValAAAGATLysAsp1S2GCAGTTAlaVal65GGGACAGlyThrGGAGlyATTlie70TCTSerGTTValGTAGGGValGlyCAGGin75ATTlieTTAGG丁]jeuGlyGTTGTAValVal80240GGAGTTGlyValCCATTTProPheGCTAla85GGG(31yGCAAlaCTClieuACTTCAThrSer90TTTPheTATTyrCAATCAGinSerTTTCTTPhe匸eu95288AACACTAsnThrATATGGlieTrp100CCAProAGTSerGATAspGCTAlaGACCCAAspPro105TGGTrpAAGGCTTTTAlaPhe110ATGGCAMetAla336CAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGT384GinValGluValLeulieAspLysI/yslie115120GluGluTyrAlaLysSer125AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATLysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135140432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAA<3TTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer145150155160480AAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTCAAGCAGAAAGTLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer16517017SS28CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerI*ysPheGluVal180185190576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu195200205TTAAAAGATGCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAALeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220672GATGTTGCTGAATTCTATCGTAspValAlaGluPheTyrArg225230AGACAATTAAAACTTACAArgGinLeuLysLeuThr235CAACAATACGinGinTyr240720ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnVaiGlyLeuAsnGlyLeuArg2452502557S8GGTTCAACTTATGATGCATGGGlySerThrTyrAspAlaTrp260GTCAAATTTAACCGTTTTCGCAGAGAAValLysPheAsnArgPheAargArgGlu2S5270816ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThr*ValLeuAspLeu工leValLeuPheProPheTyrAsp27S280285864ATTCG(3TTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTlieArgLeuTyrSerLysGlyValLysThrGluLeuThrArgAsplie230295300912TTTACGGATCCAATT丁TTTTACTTACTACGCTTCAGAAGTACGGACCAPheThrAspPro工lePheLeuLeuThrThrLeuGinTLysTyrGlyPro30S31031S3209S0ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATThrPheLeuSer*lieGluAsnserlieArgLysProHisLeuPheAsp3253303351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTT1056TyrLeuGinGlylieGluPheHisThrArgLeuGinProGlyTyrPhe340345350GGGAAAGATTCTTTCAATTATTOGGlyLysAspSerPheAsnTyrTrp3553"TCTGOTAATTATGTAGAAACTAGASerGlyAsnTyrValGluThrArg1104CCTAGTATA<3GATCTAGTAAGACAProSerlieGlySerSerLysThr370375ATTACTTCCCCATTTTATGGAGATlieThrSerProPheTyrGlyAsp3801152AAATCTACTGAACCTGTACAAAAGLysSerThrGluProValGinLys385390CTAAGCTTTGATGGACAAAAAGTTLeuSerPheAspGlyGinLysVal39S4001200TATCGATyrArgACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGThrlieAlaAsnThrAspVal405AlaAlaTrpProAsnGlyLys4104151248GTATATTTAGGTGTTACGAAAGTTGATValTyrLeuGlyValThrLysValAsp420425TTTAGTCAATATGATGATCAAPheSerGinTyrAspAspGin4301296AAAAATLysASHGAAACTAGTGluThrSer43SACACAAACATATGATThrGinThrTyrAsp440TCAAAAAGAAACAATGGCSerLysArgAsnAsnGly4451344CATGTAAGTGCACAGHisValSerAlaGin二SOGATTCTATTGACCAATTACCGCCAGAAACAACAAspSer工leAspGinLeuProProGluThrThr4SS"01392GATAsp465GAAGluCCACTTProLeuGAAGlUAAAGCATATLysAlaTyr470AGTSerCATHisCAGGin475CTTJJeuAATAsnTACGCGTyrAlaGAAGlU4801440TGTCysTTCPheTTAATGLeuMetCAGGin48SGACAspCGTArgCGTArgGGAGlyACA490ATTlieCCAProTTTPheTTTACTPheThr495TGGTrp1488ACAThrCATHisAGAAGTArgSer500GTAvalGACAspTTTPheTTTPheAAT505ACAThrATTlieGATAspGCTAlaGAAAAGGluJjys510ATT工le1S36ACTThrCAAGinCTTCCAI*euProSISGTAValGTGvalAAAliysGCAAla520丁ATTyrGCCAlaTTGLeuTCTSerTCASer52SGGTGCTGlyAlaTCCSer1584ATTlieATT工le530GAAGGTGluGlyCCAProGGAGlyTTCPhe535ACAThrGGAGlyGGAGlyAATLeu540CTALeuTTCPheCTALeuAAALys1632GAAGlu545TCTAGTAATSerAsnTCASec1ATTlie550GCTAlaAAALiysTTTPheAAAGTTVal555ACATTAAATAsnTCASeirGCAAla5S01680GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACT1728AlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThrSSS570575AACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCAsnLeuArglieuPheVal■5B0GinAsnSerAsnAsnAspPhe,LeuValS85590lie1776TACATTAATAAAACTATGTyrlieAsnLysThrMet595AATAAAGATGATGATTTAACATATCAAACAAsnI/ysAspAspAspLeuThrTyrGinThr6006051824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys€10S15S201872AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAsnGluLeulielieGlyAlaGluSerPheValSer625630635TATATAGATAAGATAGAATTTATCCCAGTACAATTGTyrlieAspLys工leGluPhelieProValGinLeu645650AATGAAAAAATC1920AsnGluLyslieTAA1959(2)序列编号22的信息("序列特征(A)长度652个氨基酸(B)类型氨基酸拓朴学线性(ii)分子类型蛋白质(xi)序列描迷序列编号22:MetAsnProAsnAsn5ArgSerAsnSerGluLeu20GinThrAsnProAsnThrGlu50AlaVal6535ThrlieuGluGluSerSerThrAspGlyThrGlylie70Glu55SerGlyValProPheAlaB5GlyAlaGluHisAsp10HisAsnGin2SLeuAsnTyr40ValLeuAspValValGlyLeuThrSer$0ThrlieLysValThrPro15AsnThrlieTrp100ProSerAlaAspPro105TyrProLysGluAsnSer60Ginlie7SPheTyrTrpLysLeuAlaAspAsn30PheLeuArgMet45ThrValLysAspLeuGiyValVal80GinSer*PheLeu9SAlaPheMetAla110AspGinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSer115120125LysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135140ValAsnAlaLeuAsnSer*TrpLysLysThr*ProIeuSerLeuArgSer145150155"0LysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer175HisPheArgAsn180"5SerMe仁LeuPheLeuProThrTyr195l^euLys210AspVal225AspAlaGinValAlaGluPheTyr230ProSerPhe185AlaGinAla200PheGlyGlu215ArgArgGin170AlaValSerLysPheGluVal190AlaAsnThrHisLeuLeuLeu205GluTrpGlyTyrSerSerGlu220lieuLys235ThrAspHisCysVal24SGlySerThrTyrAsp2S0AsnTrpTyxAsnVal250AlaTrpValLysPhe2S5LeuThrLeuAsnMetThrlieu275I.:eArgLeu290ThrValLeuTyrSer,sAspLeu280GlyVal295lieValPheThrAspProIJLePheLeuLeuThrThr305310GlyAsnArgPheLeuPhePro285Glul*euThr300LeuGin!>ys315GinGinTyr240GlyLeuArg2SSArgArgGlu270PheTyrAspArgAsplieTyrGlyPro320ThrPheLeuTyrLeuGlyLysProSer370LysSer38SGinAsp355Serlie325Glylie340GluAsnSerlieArgLysProHisLeuPheAsp330335GluPheHisSerPheAsn工leGlySerSerThrGluProTyrArgThr工leAla405Val390AsnTyrTrp360LysThr375GinLysThrAspThr345SerArgGlylieThi:LeuSerLeuGinProAsnTyrVal365SerProPhe380PheAspGly39SGly350ValAlaAlaTrpPro410TyrPheGluThrArgTyrGlyAspGinLysVal400AsnGlyI^ys415VaiTyrLeuGlyValThrLysValAspPhe42042SLysAsnGluThrSerThrGinThrTyrAsp43S"0HisValSerAlaGinAspSerlieAspGin450455SerGinTyrAspAspGin430SerLysArgAsnAsnGly44SLeuProProGluThrThr460AspGluPro;LeuGluI^sAlaTyrSerHisGinLeuAsn"547047SCysPheLeuMetGinAspArgArgGlyThr*lieProPhe485490ThrHisArgSer500ValAspPhePheAsnThrlieAspAla505TyrAlaPheThrGluLys510Glu480TrplieThrGinLeu515lielieGlu530GluSerSer545AlaIjeuLeuAsnlieuArgTyrlieAsn535ProValValLysAlaTyrAlaS20LeuSerSer*525GlyAlaSerGlyProGlyPhe535AsnSerlie550GinArgTyrS65LeuPheVal580ThrGlyGlyAlaLysPheLysAsnLeu540Val555ThrArgValArglie570ArgTyrGinAsnSerAsnAsnAsp585LysThrMetAsnLysAspAspAspLeu600Asn615PheAspLeuAlaThrThr610AsnGluLeulielieGly625"0Tyr工leAspLyslieGlu"5<2)序列编号23的信息(i)序歹J]特征:(A)长度1959碱基对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性SerAsnMetAlaGluSerPheGlyVal635Phe620IjeuPheLeuLysLieuAsnSerAla5S0AlaSerThrThr575PheLeuVal工le590ThrTyrGinThrSOSSerGlyAspLysSerAsnGluLyslie"0PherieProValGinLeuS50(ix)特征:<formula>formulaseeoriginaldocumentpage247</formula>195200205TTAAAAGATGCTLeuLysAspAla210CAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAAGinValPheGlyGluGluTrpGlyTyrSerSerGlu215220672GATGTTGCTGAAAspValAlaGlu225TTTTATCATAGACAATTAAAACTTACACAACAATACPheTyrHisArgGinLeuLysLeuThrGinGinTyr230235240720ACTGACCATTGTGTTAATTGGThrAspHisCysValAsnTrp245TATAATGTTGGATTAAATGGTTTAAGATyrAsnValGlyLeuAsnGlyLeuArg2502557S8GOTTCAACTTATGATGCATGGGTCAAATTTGlySerThrTyrAspAlaTrpValLysPhe26D265AACCGTTTTCGCAGAGAAAsnArgPheArgArgGlu270816ATGACTTTAACTGfTATTAGATCTAATTGTAMetThrLeuThrValLeuAspLeu工leVal275280CTTTTCCCATTTTATGATLeuPheProPheTyrAsp2B5864ATT.CGGTTATACTCAAAAGGGGTTAAAACAGAAlieArgLeuTyrSerLysGlyVal!>ysThrGlu230235CTAACAAGALeuThrArg300GACATTAsplie912TTTACGGATCCAATTTTTACGCCAACCACCCTACA(SGATTACGGACCAPheThrAspProliePheThrProThrThrLeuGinAspTyrGlyPro3053103153209S0ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATThrPheLeuSerlieGluAsnSerlieArgLysProHisLeuPheAsp3253303351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTTTyrLeuGinGlylieGluPheHisThrArgLeuGinPfoGlyTyrPhe34034535010SSGGGGlyAAALysGATAsp35STCTTTCAATTATSerPheAsnTyrTGGTrpTCTSerGGTGlyAATAsaTATTyrGTAGAAValGlu3"ACTAGAThrArg1104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGATProSerlieGlySerSerLysThrlieThr*SerProPheTyrGlyAsp3703753801152AAATCTACTGAACCTCTACAAAAGCTAAGCTTTGATGGACAAAAAGTTLysSerThrGluProValGinLysl*euSerSheAspGlyGinLysVal3853304001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys40S410"51248GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyrle\iGlyValThrLysValAspPheSea:GinTyrAspAspGin129S420425430AAAAATGMACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly4354404451344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr450455"01392GATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAAAspGluProLeuGluLysAlaTyrSerHisGinIeuAsnTyrAlaG工u4554704754801440TGTTTCTTAATGCAGGACCGTCGTD3AACAATTCCATTTTTTACTTGGCysPheLeuMetGinAspArgArgGlyTtirlieProPhePheThrTrp48549043SACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSerValAsp.PhePheAsnThrlieAspAlaGluLyslie500SOSS101536ACTCAACTTCCAGTAGTC3ThrGinLeuProValVal51SAAAGCATATGCCTTGTCTTCAGGTGCTTCCLysAlaTyrAlaLeuSerSerGlyAlaSer520S251584ATTATTGAAGGTCCAGGATTClielieGluGlyProGlyPhe530S35ACAGGAGGAAATThrGlyGlyAsnTTACTAlieuLeu540TTCPheCTAAAALsuLysGAA丁CTAGTAATTCAATTGCTGluSerSerAsnSerlieAla54SS50AAATTTAAAGTTLysPheLysValSS5ACATTAAATThrLeuAsnTCAGCASerAla1680GCCTTGTTACAAAlaLeuLeuGinCGATJVTArgTyr565ArgGTAAGAATAValArg工le570CGCArgTATGCTTCTTyrAlaSerACCACTThrThr57S1728AACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCTAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie5B058S5901776TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr5956006051824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610S156201872AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCAsnGluLeulie工leGlyAlaGluSerPheValSerAsnGluLyslie62SS30S35"01320TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAATyrlieAspLys工leGluPhe工leProValGinJLeu19S9S45650《2)序列编号24的信息(丄>序列特征长度652个氨基酸(B)类型氛基酸(D)拓朴学线性(ii)分子类型蛋白质序列描述序列编号24:Me仁AsnProAsnAsnArgSerGluHisAspThrlieLysValISioAsnSerGluI>euGinThrAsnHisAsnGinTyrProl^uAla202530ProAsnSerThrJOeuGluGluIjeuAsnTyrI>ysGluPheLeu354045ThrGluAspSerSerThrGluValLeuAspAsnSerThrVal50SS60ThrProAspAsnArgMetLysAspAlaVal65GlyvalAsnThrGinVallaysAla130ValAsnLysArgHisPheLeuPheGlyThrGlylieSerValValGlyGinlieLeuGlyValVal707580ProPheAla85工leTrpPro100GluValLeu115LeuAlaGluLeuAlaLeuAsnSer*GinAspArgAsnSer180GlyAlaLeuThrSearPheTyrGinSerPheLeu909SSerAspAlaAspProTrpLysAlaPheMetAla105110工leAspLysLyslieGluGluTyrAlaLysSer120125GinGlyLeuGinAsnAsnPheGluAspTyr135140SerTrpLysLysThrProIjeuSerLeuArgSer150155160ArglieArgGluLeuPheSerGinAlaGluSer17017SMetProSerPheAlaValSerlysPheGluVal185190LeuProThr195AlaGinAlaAlaAsnThrHisLeuLeuLeu200205TyrAspAlaGinValAspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyrLeuLys210PheGlyGluGluTrpGlyTy匸SerSerGlu215220225ThrAspHisCysVal245GlySerThrTyrAsp260"0235240AsnTrpTyrAsnValGlyLeuAsnGlyLeuArg250255AlaTrpValMetThrIjeuThrVaJLeuAspLeu275280lieArgLeuTyrSerLysGlyVal29023SLysPheAsnArgPheArgArgGlu2S5270lieValLysThrPheThrAspProliePheThrProThrThr310GluAsnSerlieArg330GluPheHisThrArg345305ThrPhe'LeuSerlie325TyrLeuGinGly工leGlyLysAspSerPhe3SSProSer工leGlySer370LeuPheProPheTyrAsp285GluLeuThr*ArgAsplieLeuGinAspTyrGlyPro315320LysProHisLeuPheAsp335LeuGinProGlyTyrPhe350AsnTyrTrpSerGlyAsnTyrValSerLysThrlieThrSerProPhe380GluThrArgTyrGlyAspLys二erThrGluProVal3S5390TyrArgTharlieAlaAsnValTyrLeuGlyValThrLysAsnGluThrSerThr1435HisValSerAlaGinAspAspGluProIjeuGluLys465470CysPheLeuMetGinAsp485ThrHisArgServalAsp500ThrGinLeuPro—ValVal51537SGinLysThrAspLysValLeuSet*PheAspGly395GinValAla410AspPhe425GinThr440TyrAspAspGinAlaTyrSerHisSerlie455AlaTrpPr"oSerGinTyrSer!>ysArgLeuProProGinLeuAsn475Asp430AsnGluTyrArgArgPhePheLysAla520GlyThr430AsnThr505TyrAlalieProPhePheLysVal400GlyLys415AspGinAsnGlyThrThrAlaGlu480ThrTrp495工leAspAlaGluLyslie510LeuSerSer525GlyAlaSerlielieGluGlyProGlyPheThrGlyGlyAsnLeu乙euPheLeuLysS30S3&540GluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAla545SSO555560AlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThr5"S70575AsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie580S8S590Tyr工leAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr59SS0OSOSPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610615620AsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie"0S35"0TyrlieAspLyslieGluPhelieProValG工nLeu"SSSO(2)序列编号25的信息(i>序列特征(A)长度1959碱基对(B)类型核苷酸lC)链的性质单链(D)拓朴学线性(ix)特征:(A)(B)名称/关键词:定位CDSl,-1956《xi)序列描述序列编号25:ATGAATCCAAACAATCGAAGTGAACATGATACGATAMetAsnProAsnAsnArgSerGluHisAspThrlie1510AAGGTTACACCTLysValThrPro1548AACAGTGAATTGCAAACTAACCATAATCAATATCCTAsnSerGluLeuGinThrAsnHisAsnGinTyrPro2025TTAGCTGACAATLeuAlaAspAsn30CCAAATTCAACACTAGAAGAA丁TAAATTATAAAGAAProAsnSerThrLeuGluGluLeuAsnTyr*LysGlu3540TTTTTAAGAATGPheLeuArgMet45144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACTCTThrGluAspSerSerThrGluValLeuAspAsnSer505560ACAGTAAAAGATThxValLysAsp192GCAGTTGGGACA<5GAATTTCTGTTGTAGGGCAGATTTTAGGTGTTGTAAlaValGlyThrGlylieSerValValGlyGinlieLeuGlyValValS5707S80240GGAG丁TCCATTTGCTGGGGCACTCACTTCATTTTATCAATCATTTCTTGlyValProPheAlaGlyAla85LeuThrSerPheTyrGinSerPhe909SLeu288AACACTATATGGCCAAGTGATAsnThrlieTrpProSer*Asp100GCTGACCCATGGAlaAspProTrp10SAAGGCTTTTATGGCALysAlaPheMetAla110"6CAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTGinValGluValLeu工leAspLysLyslieGluGluTyrAlaLysSer115120125384AAAGCTCTTLysAlaLeu130AlaGAGTTAGluI>euCAGGin13SGGTGlyCTTCAAAATLeuGinAsnAATTTCGAAAsnPheGlu140GATAspTATTyr432GTTAATGCGValAsnAla14STTALeuAATTCCAsnSsr150TGGAAGAAAACATrpLysThrCCTTTAAGTTTGCGAAGTProL*euSerLeuArgSer155ISO480AAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTLysArgSerGinAspArglieArgGluLeuPheSer1S5170CAAGCAGAAGinAlaGlu175AGTSer528CATTTTCGTHisPheArgAATAsn180TCCATGCCGSerMetProTCATTTGCASer*PheAla185GTTTCCValSerAAATTCLysPhe130GAAGluGTGVal576CTGTTTLeuPheCTAUeu195CCAACATATGCAProThrTyrAlaCAAGin200GCTGCAAlaAlaAATACAAsnThrCATTTAHisLeu205TTGUeuCTALeu624TTAAAAGATGCTCAAOTTTTTGGAGAAGAATGGGGATATTCTTCAGAALeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220672GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAATACAspValAlaGluPheTyrHisArgGinLeul*ysLeuThrGinGinTyr225230235240720ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg245250255768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu26026527081SATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuTharValLeuAspI>eu工leValIeuPheProPheTyrAsp2752802BS8S4ATTCGGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTlieArgLeuTyrSerL*ysGlyvalLysThrGlulieuThrArgAsplie290235300912TTTACGGATCCAATTTTTGCCCTGAATACCPheThrAspProliePheAlaLeuAsnThr305310TTAGACGAGTACGGACCALeuAspGluTyrGlyPro315320960ACTTTTTTGAGTATAGAAAACTCTATTCGAThrPheLeuSerlieGluAsnSerlieArg325330AAACCTCATTTATTTGATLysProHisLeuPheAsp3351008TATTTACAGGC3GATTGAATTTCATACGCGTCTTCAACCTGGTTACTTTTyrIjeuGinGlylieGluPheHisThrArgl*euGinProGlyTyrPhe340345350GGGAAAGATGlyLysAsp355TCTTTCAATSerPheAsnTATTyrTGGTCTTrpSer360GGTAATTATGlyAsnTyrGTAGAAACTAGAValGluThrArg3"1104CCTAGTATAProSerlie370GGATCTAGTGlySerSerAAGACAATTI*ysThrlie375ACTTCCSerCCAPro380TTTTATGGAGATPheTyrGlyAsp1152AAATCTACTGAACCTGTALysSerThrGluProVal3853"CAAAAGCTAAOCGinLysi/euSerTTTGATGGACMAAAGTTPheAspGlyGinLysVal3954001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTyrArgThrlieAlaAsnThrAspValAlaAla405410TGGCCGAATGGTAAGTrpProAsnGlyLys4151248GTATATTTAGGTOTTACGAAAGTTGATTTTAGTValTyrLeuGlyValThrLysValAspPheSer420425CAATATGATGATCAAGinTyrAspAspGin430123SAAAAATGAAACTAGTACACAAACATATGATTCALysAsnGluThrSerThrGinThrTyrAspSer*43S440AAAAGAAACAATGGCLysArgAsnAsnGly44S1344CATGTAAGTGCACAGGATTCTATTGACCAATTAHisValSerAlaGinAspSerlieAspGinLeu450"5CCGCCAGAAACAACAProProGluThrThr4601392GATGAACCACTTGAAAAAGCATATAGTCATCAGAspGluProLeuGluLysAlaTyrSerHisGin47047SCTTAATTACGCGGAALeuAsnTyrAlaGlu4801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCysPheleuMetGinAspArgArgGlyThrlie485"0CCATTTTTTACTTGGProPhePheThrTrp495148BACACATAGAAGTGTAGACTTTTTTAATACAATTThrHisArgSerValAspPhePheAsnThrlieS00505GATGCTGAAAAGATTAspAlaGluLyslie5101536ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSer5155205251584ATTATTGMGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheThr530S35GlyGlyAsnI*euLeuPheLeuLys"01S32GAATCTAGTAATTCAATTGCTAAAGluSerSerAsnSer工leAlaLys545550TTTAAAGTTACATTAPheLysValThrLeu555AATTCAGCAAsnSerAla5S01680GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACTAlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThrS70S75172BAsnLeuCTTLeu580TTTGTGCAAAATPheValGinAsnTCAAACAATSerAsnAsn585GATTTTAspPheCTTLeu590GTCATCVallie1775TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyxGinThrS9560060S1824TTTGATPheAsp"0CTCLeuGCAAlaACTThrACTThrAATTCTAsnSer615AATATGGGGAsnMetGlyTTCTCGGGTPheSerGly620GATAAGAspLys1872AATdAAAsnGlu625CTTLeuATA工leATAlieGGAGly630GCAGAAAlaGluTCTTTCGTTSerPheVal535TCTAATGAASerAsnGluAAAATCLyslie6401320TATATAGATAAGTyr工leAspLysATAGAATTTATCCCAGTACAATTGTAAlieGluPhelieProValGinLeu6456501953(2)序列编号26的信息(i)序列特征(A>长度652个氨基酸(B)类型氨基酸(D)拓朴学线性分子类型蛋白质(xi)序列描述序列编号26:MetAsnProAsnAsnArgSer*GluHisAspThr*lieLysvalThrPro151015AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202530ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet35404S<formula>formulaseeoriginaldocumentpage256</formula>340345350GlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg35S3S03S5ProSerlieGlySerSerLysThrlieThrSerProPheTyr37037S380LysSerThrGluProValGinLysLeuSerPheAspGlyGin385390395TyrArgThrlieValTyrL*euGly420LysAsnGluThrHisValSerAla450AlaAsnThrAspValAlaAlaTrpProAsn40S410ValThrLysValGlyAspLysVal400GlyJUys41SSerGinAspPheSerGinTyrAspAspGin42S430ThrGinThrTyrAspSerLysArgAsnAsnGly"044SAspSerlieAspGinLeuProProGluThrThr45S"0AspGluProLeuGlu465LysAlaTyrSerHisGinLeuAsnTyx470475CysPheLeuMetGinAspArgArgGlyThrlieProPhePhe485490AlaGluThrTrp495Thz:HisArgSerValAspPhePheAsnThrlieAspAlaGluLyslieThrGinlielie530GluSer545500LeuPro51SGluGlyAla560AlaLeuLeuGinTyrliePheAsp610AsnGlu625ArgLieu580AsnLys595LeuAlaLeulie505510ValValLysAlaTyrAlaL^uSerSerGlyAlaSer520525ProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys535540SerlieAlaLysPheLysValThrLeuAsnSer5505"ArgTyrArgValArglieArgTyrAlaSerThrThr5S557057SPheValGinAsnSerAsnAsnAspPheL*eu585590ThrMetAsnLysAspAspAspLeuThrTyrGinThr600605ThrThrAsnSerAsnMetGlyPheSerGlyAspLys615620lieGlyAlaGluSerPheValSerAsnGluLyslie630S35S40VallieTyrlieAspLyslieGluPhelieProValGinLeu"5650(2)序列编号27的信息(i)序列特征(A)长度1的9碱基对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性(ix)特征(A)名称/关键词CDS(B》定位1,."56(xi)序列描述序列编号27:ATGAATCCAAACAATCGAASTGAACATGATACGATAAAGGTTACACCTMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro15101548AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn20253096CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrL>euGluGluLeuAsnTyrLysGluPheLeuArgMet35404S144ACTGAAGACThrGluAsp50SerTCTACGSerThrGAAGluSSGTOValCTAGACLeuAspAACAsnTCTSerSOACAGTAThrValAAALysGATAsp192GCAGTTGGGAlaValGly65ACAThrGGAATTGlylie70TCTSerGTTValGTAGGGValGlyGin7SATT工leTTAGGTLeuGlyGTTValGTAVal80240GGAGTTCCAGlyValProTTTPheGCTGGGAlaGly85GCAAlaCTCLeuACTTCAThrSer30TTTPheTATTyrCAATCAGinSerTTTPhe95CTTLeu288AACACTATAAsnThrlieTGGTrp100CCAAGTProSerGATGCTAspAlaGACCCAAspPro10STGGTrpLysGCTTTTAlaPhe110ATGMetGCAAla336CAAGTTGAAGinValGluGTACTGATALeulieGATAAGAspLys120AAAATALyslieGAGGluGAGGluTATGCTTyrAla125AAALysAGTSer384AAAGCTCTTEysAlaLeu130GCAAlaGAGTTAGlULeuCAGGGTGinGly135CTTCAALeuGinAATAsnAATAsn140TTCGAAGATAspTATTyr432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer145150155160480AAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTCAAGCAGAAAGTLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer1S517017SS28CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal180165190576CTGTTTCTACCAACATATGCACAAGCTLeuPheLeuProThrTyrAlaGinAla195200GCAAATACACATAlaAsnThrHis205TTATTGCTALeuLeuLeu624TTAAAAGATGCTCAAGTTTTTGGAGAALeuLysAspAlaGinValPheGlyGlu210215GAATGGGGATATTCTTCAGAAGluTrpGlyTyrSerSerGlu220672GATGTTGCTGAATTTTATCATAGACAAAspValAlaGluPheTyrHisArgGin22S230TTAAAACTTACACAACAATACLeuLyslieuThrGinGinTyr235240720ACTGACCATTGTGTTAATTGGTATAATGTTGGAThrAspHisCysValAsnTrpTyrAsnValGly2452S0TTAAATGGTTTAAGALeuAsnGlyLeuArg255768GGTTCAACTTATGATGCATGGGTCAAATTTAACGly^erThrTyrAspAlaTrpValLysPheAsn260265CGTTTTCGCAGAGAAArgPheArgArgGlu27081SATGACTMetThrTTA275ACTGTAThrValTTAGATAspCTAATTGTAlieulieVal280CTTLeuTTCCCAPhePro285TTTTACPheTyrGATAsp864ACTAGGThrArg290CGAArgTTCAGAPheArgLysGGGGly235GTTAAAACAValLysThrGAAGluCTAACAUeuThr300AGAGACArgAspATTlie312TTTACGPheThr305GATAspCCAATTProlieTTTPhe310TCASerCTTAATLeuAsnACTThrCTT315CAGGAGGinGluTATGGACCAPro320960ACTTTTThrPheTTG!>euAGTATASerlie325GAAGluAACAsnTCTATTSerlieCGAArg330AAALysCCTCATProHisTTATTTLeuPhe335GATAsp1008TATTTATyrLeuGinGGGATTGlylie340GAAGluTTTPheCATACGHisThr345CGTArgCTTLeuCAACCTGinProGGTTACGlyTyr350TTT1056GGGAAAGlyLysGATAsp355TCTTTCSerPheAATAsnTATTyrTGGTCTTrpSer360GGTGlyAATAsnTATGTATyrVal365GAAACTGluThrAGA.1104CCTAGTATAGGATCTACTAAGACAATTProSerlieGlySerSerLysThrlie370375ACTTCCCCATTTTATGGAGATThrSerProPheTyrGlyAsp3801152AAATCTACTGAACCTG丁ACAAAAGCTALysSerThrGluProValGinLysL<eu3B5390AGCTTTGATGG凡CAAAAAGTTSerPheAspGlyGinLysVal3$54001200TATCGAACTATAGCTAATTyrArgThrlieAlaAsn40SACAGACGTAGCG<3CTTGGCOSAATGGTAAGThrAspValAlaAlaTrpProAsmGlyLys4104151248GTATATValTyrTTAGGTLeuGly420GTTACGValThrAAAGTTLysValGATAsp425TTTAGTCAATATPheSerGinTyrGATAsp430GATCAAAspGin12%AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAIiysAsnGluThrSerThrGinThrTyrAspSerLysArg43544044SAACAATGGCAsnAsnGly1344CATGTAHisVal450AGTGCASerAlaCAGGinGATTCTATTAspSerlie455GACCAATTACCGCCAAspGinLeuProPro"0GAAACAACAGluThrThr1332GATGAACCACTTGAAAAAGCATATAGTAspGluProLeuGluLysAlaTyrSer"5470CATCAGCTTAATTACGCGGAAHisGinLeuAsnTyrAlaGlu47S4801440TGTTTCCysPheTTAATGCAGGACLeuMetGinAsp485CGTCOTGGAACAATTCCATTTTTTACTTGGArgArgGlyThrlieProPhepheThrTrp43049S1488ACAThrCATAGAHisArgAGTGTAGACSerValAsp500TTTTTTAATPhePheAsn505ACAATTThrlieGATGCTGAAAspAlaGlu510AAGATTLyslie1536ACTThr*CAACTTGinLeu515CCAGTAGTGProValvalAAAGCATATL*ysAlaTyr520GCCTTGAlaL*euTCTTCAGGTSerSerqiy525TCCAla5er1584ATTlieATTGAAlieGlu530GGTCCAGGAGlyProGlyTTCACAGGAPheThrGly535GGAAATGlyAsnTTACTATTCLeuLeuPhe540CTAAAALeuIiys1S32GAAGlu54STCTAGTSerSerAATTCAATTAsnSerlie550GCTAAATTTAlaLysPheAAAGTTLysVal555ACATTAAATThrLieuAsnTCAGCASerAla56016B0GCCAlaTTGTTAlieuLeuCAACGATATGinArgTyr565CGTGTAAGAArgValArgATACGClieArg570TATGCTTCTTyrAlaSerACCACTThrThr*5751728AACTTACGALeuArgCTTTTTGTGLeuPheVal580CAAAATTCAGinAsnSer585GATTTTCTTAspPheLieu590GTCATCVallie1776TACMTAATAAAACTATGAATAAATyr工leAsnLysThrMetAsnLys595SO0TTTGATCTCGCAACTACTAATTCTPheAspLeuAlaThrThrAsnSerAATGAACTTATAATAGGAGCAGAAAsnGluLeulielieGlyAlaGlu625GA丁GA丁GATTTAACATATCAAACA1024AspAspAspLeuThrTyrGinThr605TCGGGTGATAAG18*72SerG工yAspLysAATATGAsnNle仁TCTTTCSeirPhe630TATATAGATAAGATATyrlieAspLyslieS45(2)序列编号28的信息:GAAT丁TATCCCAGTAGluPhelieProval650GGGTTCGlyPheGTTTCTValSer635CAATTGGinLeuAATGAAAAAATC1320AsnGluLyslieTAA1959(i)序列特征(A)长度652个氨基酸(B)类型_|^酸(D>拓朴学线性(ii>分子类型蛋白质(xi)序列描迷序列编号28:MetAsnProAsnAsnArgAsnSerGluLeuGinThr20SerGluHisAspThrlieLy曰ValThrPro1015AsnHisAsnGinTyrProLeuAlaAspAsn2S30ProAsnSer3SThrGluAsp50AlaValGlyGlyValProAsnThrlieGinVal14SValGlu115AlsLeu130AsnAlaThrLeuGluGluAsnTyrLysGluPheLeuArgMet4045SerSerThrGluValLeuAspAsnSerThrValLysAspS560ThrGlylieSerVal/alGlyGinlieLeuGlyValVal707S80PheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu85909STrpProSerAspAlaAspProTrpLysAlaPheMetAla100105110ValLeulieAspLysLyslieGluGluTyrAlaLysSer120125AlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr13S"0LeuAsnSerTrpLysLysThrProl*euSerLeuArgSer150155160LysArgSerGinAspArglieArgHisPheArgAsnSerMet180LeuPheLeuProThrTyrLeuIiysAspAlaGinVal210AspV/alAlaGluPheTyr22S230ThrAspHisCysValAsnTrpTyr24SGlySerThrTyrAspAlaTrpVal260MetThrLeuThrValLeuAspLeu275280ThrArgArgPheArgLysGlyVal290235GluLeuPheSerGinAlaGluSei:170175ValSerLysPheGluVal190AsnThrHisL^u乙eul*eu205TfpGlyTyrSer*SerGlu220LysLeuThrGinGinTyr23S240AsnValGlyLeuAsnGlyLeuArg2502SSLysPheAsnArgPheArgArgGlu265270lieValLeuPheProPheTyrAsp285LysThrGluUeuThrArgAsplie300ProSerPheAla18SAlaGinAlaAla200PheGlyGluGlu215HisArgGinLeuPheThrAspProliePheSerLeuAsnThrLeuGinGluTyrGlyPro305310315320ThrPheLeuSerlieGluAsnSerlieArgLysProHisLeuPheAsp325330335TyrLeuGinGlylieGluPheHisThrArgLieuGinProGlyTyrPhe340350GlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg355360365ProSerlieGlySerSerLysThr工leThrSerProPheTyrGlyAsp370375380LysSerThrGluProValGinLysl>euSerPheAspGlyGinLysVal385390335400TyrAxgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys405410415ValTyrLeuGlyValThrLysValAspIPheSerGinTyrAspAspGin420425430LysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly43544044SHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr450AspGluProLeuGluLys"5470CysPheLeuMetGinAsp485455AlaTyrSerHisArgArgGlyThr490460GinLeuAsnTyrAlaGlu475480lieProPhePheThrTrp495ThrHisArgSer500ThrGinLeuPro515ValAspValValLysAlaS20Ala!>ulielieGlu530GluSerSerS45AlaLeuLeuGlyAsnProGlyPheS3SSerlieAla550PhePheAsnThr*lieAspAlaGluLys50S510Sex*SerGlyAla525LeuLeuPheLeu540ThrLeuAsnSerTyrThrGlyGlyAsnGinArgTyrArgr565LysPheValArgLysVal555lieArgTyrAlaSerThr570575AsnLeuArgI*euPheValGinAsn580SerAsnAsnAspPheLeuVal585590lieSerLysAla560ThrlieTyrlieAsn59SLysThrMetPheAspLeuAla610AsnGluI>eulie625TyrlieAspLysThrThrlieGlyS30工leGlu645AsnLysAspAspAspLeuThrTyrGinThr600605AsnSerAsnMetGlyPheSerGlyAspLys615620AlaGl'SerPheValSerAsnGluLyslie635640Phe工leProValGinLeu650(2)序列编号29的信息:(i>序列特征(A)长度1959碱基对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性(i幻特征(A)(B)名称/关鍵词CDS定位L…195S(xi)序列描迷序列编号29:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCT48MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro151015AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHis'20AsnGinTyrProLeuAlaAspAsn25'3096CCAAATTCAACACTAGAAGAATTAProAsnSer*ThrLeuGluGluI>eu3540AATTATAAAGAATTTTTAAGAATGAsnTyrI*ysGluPheLeuArgMet45144ACTGAAGACAGTTCTACGGAAGTGThrGluAspSerSerThrGluVal5055CTAGACAACTCTACAGTAAAAGATLeuAspAsnSerThrValLysAsp60192GCAGTTGGGACAGGAATTTCTGTTGTAAlaValGlyThr<31ylieSerValVal6570GGGCAGATTTTAGGTGTTGTAGlyC31nlieLeuGlyValVal7580240GGAGTTCCATTTGCTGGGGCACTCACTTCAGlyValProPheAlaGlyAlaLeuThr*Ser8590TTTTATCAATCATTTCTTPheTyrGinSerPheLeu9S288AACACTATATGGCCAAGTGATGCTGACCCATGGAsnThrlieTrpProSerAspAlaAspProTrp100105AAGGCTTTTATGGCALysA3LaPheMetAla11033GCAA<3TTGAAGTACTGATAGATAAGAAAATAGAGGinValGluValLeulieAspLysLyslieGluil5120GAGTATGCTAAAAGTGluTyrAlaLysSer12S384AAAGCTCTTGCAL<ysAlaI*euAla130GAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATGluLeuGinGlyI^uGinAsnAsnPheGluAspTyr13S"0432GTTAATGCGTTAValAsnAlaLeu145AATTCCAsnSerISOTGGAAGAAATrpIiysI>ysACAThrCCTPro155TTAAGTTTGCGALeuSerLeuArgAGTSer160480AAAAGAAGCCAALysArgSerGinGATCGAATAAGGGAACTTTTTTCTCAAGCAGAAAGTAspArglieArgGluLeuPheSerGinAlaGluSer1SS170175528CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal18018S"0576CTGTTTJTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu135200205624TTAAAAGATGCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAALuLysAspAlaGinValPheGlyGluGluTrpGlyTyr*SerSerGlu21021S220672GATGTTGCTGAATTCTATCGTAGACAATTAAAACTTACACAACAATAC720AspValAlaGluPheTyrArgArgGinLeuLysLeuThrGinGinTyr22S230235240ACTGACCATTGTGTTAATTGGThrAspHisCysValAsnTrp245TATAATGTTGGA丁TAAATTyrAsnValGlyLeuAsn250GGTTTAAGAGlyLeuArg255768GGTTCAACTTATGATGCATGGGlySerThrTyrAspAlaTrp260GTCAAATTTAACCGTTTTValLysPheAsnArgPhe2S5CGCAGAGAAArgArgGlu270ATGACTTTAMetThr*Leu275ACTOTAThrValTTAGATLeuAspCTALeu280ATTlieGTAValCTTTTCCCALeuPhePro285TTTTATGATPheTyrAsp8"ATTCGGTTATACTCAAAAGGGGTTAAAACAC3AACTAACAAGAGACATTlieArgLeuTyrSerLysGlyValLysThrGiuLeuThrArgAsplie2302"300312TTTACGGATCCAATTTTTTTACTTAATACTPheThrAspProliePheLeuLeuAsnThr30S310CTTCAGGAGTATGGACCALeuGinGluTyrGlyPro3153209S0ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATThrPheLeuSerlieGluAsnSerlieArgLysProHisI#euPheAsp3253303351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTTTyrLeuGinGlylieGluPheHisThrArg34034SLeuGinProGlyTyrPhe3S0105S(3GGAAAGATGlyI*ysAsp355TCTSerTTCPheAATTATTyrTGGTCTGGTTrpSerGly360AATTATAsnTyrGTAVal365GAAGluACTAC3AThrArgr1104CCTAGTATAProSerlie370GGAGlyTCTSerAGTAAGIiys37SACAATTACTThr*lieThrTCCCCASerPro380TTTPheTATTyrGGAGATGlyAsp1152AAATCTACTLysSer*Thr385GAAGluCCTProGTA330CAAGinAAG乙ysCTAAGCLieuSerTTTGATPheAsp395GGAGlyCAAGinAAAGTTLysVal4001200TATCGAACTArgThrATAlieAla40SAATAsnThrGACAspGTAGCGValAla410GCTTGGAlaTrpCCGProAATGCTAAGGlyLys4151248GTAValTATTTATyrLeuGGTGly420GTTValACGThrAAALysGTTValGATTTTAspPhe42SAGTCAASerGinTATTyrGATAsp430GATCAAAspGinAAALyaAATGAA43SACTAGTSetTheCAAACAThr440TATGATTyrAspTCAAAAAGA445AACAATGGC1344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACA1392HisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr4504SS"0GATGAACCACTTGAAAAAGCAAspGluProLeuGluLysAla"5470TATAGTCATCAGCTTAATTACGCGGAATyj:SerHisGinLeuAsnTyrAlaGlu47S4801440TGTTTCTTAATGCAGGACCGTCysPheLeuMetGinAspArg485CGTGGAACAATTCCATTTTTTACTTGGArgGlyThrlieProPhePheThrTrp4304351488ACACATAGAAGTGTAGACTTTThrHisArgSerValAspPhe500TTTAATACAATTPheAsnThrlie505GATGCTGAAAAGATTAspAlaGluLyslie510ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGThrGinLeuProValValLysAlaTyrAlaLeu51SS20TCTTCAGGTGCTTCCSerSer*GlyAlaSerS2S1S84ATTATTGAAGGTCCAGGATTCACAGGAGGAAAT工lelieGluGlyProGlyPheThrGlyGlyAsn530535TTACTATTCCTAAAALeuIjeuPheLeuLys5401632GAATCTAOTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSer工leAlaLysPheLysValThrLeuAsnSerAla545S505S5560GCCTTGTTACAACGATATCGTGTAAGAATACGCTATAlaLeuLeuGinArgTyrArgValArglieArgTyr56SS70GCTTCTACCACTAlaSerThrThrS7SAACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCAsnLeuArgLeuPheValGinAsnSesrAsnAsnAspPheLeuVallieS90S8S5901776TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr5956006051824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610SIS6201872AATS2SGAACTTATAATAGluLeulie工leGGAGly630GCAGAAAlaGluTCTTTCSerPheGTTVal635TCTAATGAAAAASerAsnGluLysATClie"0TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAATyrlieAspLyslieGluPhelieProVaJLGinLeu6456501959(2)序列编号30的4言息<i)序列特征(A)长度652个氩基酸(B)类型氨基酸<D)拓朴学线性(ii)分子类型蛋白质(xi)序列描述序列编号30:MetAsnProAsnAsnArgSerG丄uHisAspThrlieLysValThrPro151015AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202530ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet354045ThrGluAspSerSer50AiaValGlyThrGly65GlyValProPheAla85AsnThrlieTxpPro100ThrGluValLeuAspAsnSerThrValIiysAsp5560lieSerValValGlyGinlieLeuGlyValVal707580GlyAlaLeuThrSer*PheTyrGinSerPheLeu9095SerAspAlaAspProTrpL*ysAlaPheMetAla105110GinValGluValI>eulieAspLysLyslieGluGluTyrAlaLysSer115120125LysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130ValAsnAlaLeuAsnLysArgSerGinAspHisPheArgAsnSer180LeuPhe!>euProThr195Leul>ysAspAlaGin210AspValAlaGluPhe22SThrAspHisCysVal245GlySerThrTyxAsp135SerTrpLysLysThr150ArglieArgGluMetProSerPhe18STyrAlaGinAla200ValPheGlyGlu21&TyrArgArgGin230LeuAlaAlaGluLeuAsnTrpTyrAsnValAlaTrpValLys265Phe140ProLeuSerLeuArgSer1S5ISOPheSerGinAlaGluSer17SValSerLysPheGluValAsnThrHisLeuLieu!Leu205TrpGlyTyrSerSerGlu220LysLeuThrGinGinTyr235240GlyLeuAsnGlyLeuArg2SSAsnArgPheArgArgGlu270MetThrLeuThrValL白uAspLeulieVal27S280lieArgLeuTyrSerLys290PheThrAspProliePhe305310ThrPheLeuSerlieGluTyrLeuGinGlylieGlu340GlyValLysThrLeuLeuAsnThrAsnSerlieArg330LeuPheProPhe285GluLeuThr_Arg300LeuGinGluTyr315LysProHisLeuTyrAspAsp工leGlyProPheAsp335PheHisThrArg345LeuGinGlyLysAspSerPheAsnTyrTrpProSerlieGlySerSerLysThr37037SlysSerThrGluProValGinIys385390SerGlyAsnTyrlieThrLeuSerTyrArgThrlieAlaAsnThrAspValAla405410SerPro380PheAsp395AlaTrpProGlyTyrPhe350ValGluThrArgPheTyrGlyAspGlyGinLysVal400ProAsnGlyLys415ValTyrLeuGlyValThrLysAsnGluThrSerThr43SLysValAspPhe42SSerGinTyrAspAspGin430HisVal450AspGlu4SSCysPheTlirHisThrGinlielieGluSer545SerAlaGinAspProLeuGluLys470LeuMetGinAsp485Arg5erValAsp500LeuProValValGluGlyProGlySerAsnSerlie550GinThr440Serlie4S5AlaTyxArgAxgTyrAspSerLysAspGinArgAsnAsn445GlySerHisLeuPro460Ginlieu475ProGluThrThrGlyThr工iePro430PhePheAsnThrleAspSOSAlaLeuLeuGinArgTyrLysAlaS20PheThr535AlaLysTyrGlyAlaLeuSerAsnTyrAlaPhePheThrAlaGluLys510SerGlyAla525Glu480TrplieSerGlyAsnLeu540LeuPhelieuLysValThi:555IjeuAsnSerAla560ArglieArgTyrAlaSerThrThr<formula>formulaseeoriginaldocumentpage269</formula>859095AACACTATATGGCCAAGTGATGCTGACCCATGGAAGAsnThrlieTrpProSerAspAlaAspProTrpLys100105GCTTTTATGGCAAlaPheMetAla11033SCAAGTTGAAGTACTGATAGATAAGGinValGluValI*eulieAspLys115120AAAATAGAGGAGL*ys工leGluGluTATGCTAAAAGTTyrAlaLysSer工2S384AAAGCTCTTGCAGAGTTACAGGGTLysAlaLeuAlaGluLeuGinGly130135CTTCAAAATAATLeuGinAsnAsn"0TTCGAAGATTATPheGluAspTyr432GTTAATGCGTTAAATTCCTCGAAGValAsnAlaLeuAsnSerTrpLys"5ISOAAAACACCTTTAAGTTTGCGAAGTI*y5ThrProLeuSerLeuArgSer155160480AAAAGAAGCCAAGATCGAAGGGAACTTTTTTCTLysArgSerGinAspArglieArgGluLeuPheSer1"170CAAGCAGAAAGTGinAlaGluSer175S29CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal1B018S190CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu19520020STTAAAALsuLys210GATAspGCTCAAGTTAlaGinValTTT215GGAGlyGAAGluGAATGGGGAGluTrpGly220TATTyrTCTTCAGAASerGlu672GATGTTAspVal225GCTAlaGAATTTTATGluPheTyr230CATHisAGAArgCAAGinTTAAAACTTl*euLysI^u235ACAThrCAAGinCAATACGinTyr240720ACTGACThrAspCATHisTGTGTTAATCysValAsn24STGGTrpTATTyrAATAsnGTTGGATTAValGlyLeu2S0AATAsnGGTGlyLeuArg2SS768GGTTCAGlySerACTThrTATGATGCATyrAspAla260TGGTrpGTCValAAALys265TTTAACCGTPheAsnArgTTTPheCGCArg270ArgGlu816ATGACTMetThrTTALeu275ACTGTATTAThrValLeuGATAspCTALeu280ATTlieGTACTTTTCVall*euPheCCAPro285TTTPheTATGATTyrAsp864ATTCGGlieArg290TTALeuTACTCAAAATyrSsrLysGGG29SGTTAAALysACAGAACTAThrGlul*eu300ACAThrAGAArgGACATTAsplie912TTTACGGATCCAATTTTTATCCTCAATACGCTACAGGAGTACGGACCAPheThrAspProliePhe工leLeuAsnThrLeuGinGluTyrG3_yPro960305310315320ACTTTTTTGAGTATAGAAAAC丁CTATTCGAAAACCTCATTTATTTGATThrPheLeuSerlieGluAsnSerlieArgLys32S330ProHisLeuPheAsp33S1008TATTTACAGGGGATTGAATTTCATACGCGTCTTTyrLeuGluGlylieGluPheHisThrArgI#eu340345CAACCTGGTTACTTTGinProGlyTyrPhe3501056GGG.AAAGATTCTTTCAATTATT<3<3TCTGGTAATGlyIjysAspSerPheAsnTyrTrpSerGlyAsn355360TATGTAGAAACTAGATyrValGluThrArg3S51104CCTAGTATAGGATCTAGTAAGACAATTACTTCCProSer工leGlySerSerLysThrlieThrSer370375CCATTTTATGGAGATProPheTyrGlyAsp3801152AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAG丁TLysSerTtirGluProvalGinLys385330LeuserPheAspGlyGinLysVal3954001200TATCGAACTATAGCTAATACAGACC5TAGCGTyrArgThrlieAlaAsnThrAspValAla405410GCTTGGCCGAATGGTAAGAlaTrpProAsnGlyLys4151248GTATATTTAGGTGTTACGAAAGTTGATTTTValTyrLeuGlyValThrLysValAspPhe420425AGTCAATATGATGATCAASerGinTyrAspAspGin4301236AAAAATGAAACTAGTACACAAACATATOVTTCAAAAAOAAACAATGGCLysAsn<5luThrSerThrGinThrTyrAspSerLysArgAsnAsnGly43S440445U44CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr450455"01392OATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAAAspGluProLeuOliiLysAlaTyrSerHisGinLeuAsnTyrAlaGlu4SS4704754801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGCysPheLeuMetGinAspArgArgGlyThrlieProPhePheThrTrp4354901488ACACATAGAAGT<3TAGACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslieS00S055101S3SACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCThrGinLeuProValValLysAlaTyrAlaLeuSerSer<31yAlaSerS15S205251584ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyPro<5lyPheThrGlyGlyAsnLeuLeuPheLeuLys530535540GAATCTAGTAATTCAATTGCTAAATT丁AAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAla54555055SS601680GCCTTGAlaLeuTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACTLeuGinArgTyrArgValArglieS70ArgTyrAlaSerThrThr5751728AACTTAlieuCGACTTArgIjeu580TTTGTGCAAPheValGinAATTCAAACAsnSerAsti585AATGATT丁TAsnAspPheCTTGTCATCLeuVallie5301776TyrATTlieAATAAAAsnLysS9SACTThrATGMetAATAsnAAAGATGATliysAspAspGOOGATTTAACAAspLeuThr605TATCAAACATyirGinThr1824TTTGATAsp610CTCGCALeuAlaACTThrACTThrAATAsn615TCTAATATGSerAsnMetGGGTTCTCGGlyPheser620GGTGATAAGGlyAspLiys1872AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCAsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie6256306356401320TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAATyrlieAspLyslieGluPhelieProValGinLeu6456501953<2)序列编号32的信息(i>序列特征(A)长度652个氮基酸(B)类型氨基酸(D)拓朴学线性《ii)分子类型蛋白质序列描迷序列编号32:LysValThrPro15LeuAlaAspAsii30E>heLeuArgMet45MetAsnProAsnAsnArgSerGluHisAspThrlieIS10AsnSerGluLeuGinThrAsnHisAsnGlr\TyrPro2025ProAsnserThrLeuGluGluLeuAsnTyrLysGlu3S40ThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp505560AlaValGlyThrGlylieSerValValGlyGinLeuGlyValVal6S707S80GlyValProPheAlaGlyAlaLeuThrSerPhe8590AsnThrlieTrpProSerAspAlaAspProTrp100105.GinValGluValLeulie115LysAlaLeuAlaGluLeu130AspLysLyslieGlu120TyrGinSerPheLeu35LysAlaPheMetAla110GluTyrAlaLysSer125ValAsnAla145LysArgserHisPheArgGinGlyLeuGinAsnAsnPheGluAspTyr135140LeuAsnSerTrpLysLysThrProLeuSerLeuArgser150155160GinAspArglieArgGluLeuPheSerGinAlaGluSer165170175LeuPheLeu195AsnSerMetProSerPheAlaValSerLysPheGluVal1801B5190ProThrTyrAlaGinAlaAlaAsnThrHisLeuLeul*eu200205LeuLysAspAlaGinValPhe210AspValAla225ThrAspHisGlySer215CfluPheTyrHis230GlyGluGluTrpGlyTyrSer220ArgGinl^uLysLeuThrGin235SerGluThrCysVal245TyrAsp2€0MetThirLeuThrVal275lieArg230PheThr*30SI>euTyrSerAspProlieAsnTrpAlaTrpLeuAspLysGlyPhelie310TyrAsnVal250GlyLeuAsnGlyValLeu280LysPhe2"lieVaiLeuPhePheArg270ProPhe285ValLysThrLeuAsnThrGluL>eu300ThrPheLeuTyrLeuGinSerlie325Glylie340GluAsnSerGluPheHisGlyLysAspSerPheAsnTyr355ProSer370lieGlySerSerLys37SThrlieArg330ThrArg345SerGlylieThrGluTyrLysProHisLeu乙euGin31SLeuGinAsnTyrSerPro380ProGly3S0ValGlUPheTyrGinTyr2402SSAxgGluTyrAspAsplieGlyPro320PheAsp335TyxPheThrArgGlyAspLysSerThrGluproValGinLys38539DTyrArgThrlieAlaAsnThr*Asp405ValTyrLeuGlyValThrLysVal420LysAsnGluThrSerThrGinThr435440HisValSerAlaGinAspGluProLeuGiu465CysPheLeuweeGin485ThrHisArgSerValS00AspSerlieAspGinLeu455LeuSerPheAspGlyGinLysVal395400ValAlaAlaTrpProAsnGlyLys410"5AspPheSerGinTyr*AspAspGin425430AsnAsnGlyGluThrThrTyrAspSerLysArgProPro460!>ysAla470AspArgTyrSerHisGinLeuAsn475AspPheThrGinLeuProValValLys515lielieGluGiyProGlyPhe530535GluSerSerAsnSearlieMa545ArgGlyThr430PheAsnThr50SAlaTyrAla520ThrGlyGlyIiysPheLyslieProPheTyrAlaGluPheThrTrp495lieAspAlaGluLyslie510LeuSer5erGlyAlaSer525AlaLeuLeuGinArg565AsnLeuArgLeuPheS30SS0TyrArgValValGinAsnAsnLeul*euPheS40ValThr丄euAsn555LeuLysTyrliePheAsp610AsnGluTyrlieAsnLysThrLeuAlaThrLeulie工leAspLys工leS45MetAsnLysThrAsnSerS15CUyAlaGluGluPhelieArglieArgTyxAlaSer570SerAsnAsnAspPheLeu585590AspAspAspLeuThrTyr605AsnMetGlyPheSerGlySerPheValSerAsnGluS35ProValGinLeu650SerThrS75Ala560ThrVallieGinThrAspLysLyslie"0(2)序列编号33的信息(i)序列特征(A)长度1959碱基对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性(i幻特征(A〉名称/关鍵词CDS(B)定位序列描述序列编号33ATGAATCCAAACAATCGAAG丁GAACATGATACGMetAsnProAsnAsnArgSerGluHisAspThr1510ATAAAGGTTACACCTlieLysValThrPro1548AACAGTGAATTGCAAACTAACCATAATCAATATAsnSerGluLeuGinThrAsnHisAsnGinTyr2025CCTTTAGCTGACAATProLeuAlaAspAsn30CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet354045144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACTCTACAGTAAAAGATThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp5055SO192GCAGTTGGGACAGGAATTTCTGTTGTAGGGCAGATTTTAGGTGTTGTAAlaValGlyThrGlylieSerValValGlyGinUeLeuGlyValVal65707S90240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATCAATCATTTCTTGlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu9S9095288AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCAAsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla10010511033SCAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAG丁GinValGluValLeulieAspLysLyslieGluGluTyrAlaL*ysSer115120125384AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATLysAlaLeuAlaGluLeuGinGlyLeuGLnAsnAsnPheGIaiAspTyr130135140432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer14SISO1S5160480AAAAGAAGCCAAGATCGAATAAGOGAACTTTTTTCTCAAGCAGAAAGTSer<31tiAspArg工leArgGluLeuPheSerGinALaGluSer165170175528CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal18018S190576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu195200205624TTAAAAGATGCTCAAGTTT丁TGGAGAAGAATGGGGATATTCTTCAGAALeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220672GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAATACAspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyr22S230235240720ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThr*AspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg2452502557SBGGTTCAACTTATGATGlySerThrTyrAsp260GCATGGGTCAAATTTAACAlaTrpValLysPheAsn265CGTTTTCGCAGAGAAArgPheArgArgGlu27081SATGACTTTAACTGTAMet:ThrLeuThrVal275TTAGATCTAA丁TGTACTTLeuAsp乙eulieValLeu280TTCCCATTTTATGATPheProPheTyrAsp2858"ATTCGGlieArg230TTATACLeuTyrTCAAAAGGGGly295GTTValAAALysACAGAAThrGluCTA300ACAAGAThrArgGACAspATTlie912TTTACGPheThr305GATAspCCAProATTlieTTTPhe310ATClieCTALeuCATHisACGCTGThrLeu315CAGGAGTACGluTyrGGACCAPro320960ACTTTTThrPheTTGLeuAGTSerATAlie325GAAGluAACAsnTCTSerATTlieCGAAAA330CCTProCATTTAHisLeuTTTPhe335GATAsp100BTATTTATyrLeuCAGGinGGGGly340ATTlieGAAGluTTTPheCATHisACGThr345CG丁CTTArgLeuCAAGinCCTGGTProGly350TACTyr:TTTPheGG<3AAAGlyLysGATAsp3SSTCTTTCPheAATAsnTATTyrTGGTrp360TCTGGTAATGlyAsnTATTyrGTAGAAValGiu365ACTThrArg1104CCTAGTProSer370JVTAGGAGlyTCTAGTAAGL*ys37SACAThrATTlieACTTCCThrSerCCAPro300TTTTATPheTyrGGAGlyGATAsp1152AAATCTLysSer1385ACTGAAGluCCTProGTAVal390CAAGinAAGLysLeuAGCTTTSerPhe395GATAspGGACAAGlyGinAAAGTTVal4001200TATCGAACTATAGCTAATACAGACGTAGCGTyrArgThr工leAlaAsnThrAspValAla405410GCTTGGCCGAATGG了AAGAlaTrpProAsnGlyLys4151248GTATATTTAGGTGTTACGAAAGTTGATTTTValTyrLeuGlyValThrLysValAspPhe42042SAGTCAATATGATGATCAASerGinTyrAspAspGin"01296AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGJLuThrSerThrGinThrTyrAspSerLysArgAsnAsnGly4354404451344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThr*Thr4504554601392GATGAACCACTTGAAAAAGCATATAspGluProLeuGluLysAlaTyr465470AGTCATCAGCTTAATTACGCGGAASerHisGinLeuAsnTyrAlaGlu4754801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCACysPheLeuMetGinAspArgArgGlyThrliePro435490TTTTTTACTTGGPhePheThr"Trp4951488ACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslie5005055101536ACTCAACTTCCAGTAThrGinLeuProVal515(5TGAAAGCATATGCCTTGTCTTCAGGTGCTTCCValLysAlaTyrAlaLeuSerSerGlyAlaSer5205251S84ATTATTGAAGGTCCAlie工leGluGlyPro530GGATTCACAGGAGGAAATTTACTATTCCTAAAAGlyPheThrGlyGlyAsnLeuLeuPheLeuLys53S5401632GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSer*Ala545550S555601680GCCTTGTTACAACGATATCGTOTAAGAATACGCTATGCTTCTACCACTAlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThrS70S751728AACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVal工le5805855901776TACMTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyr工leAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr59560060S1824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAA<5PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610615620AATGAACTTATAATAAsnGluI*eulielieTATATAGATAAGATATyrlieAsp乙ys工leS45(2)序列编号34的信息:GGAGCAGAATCTTTCGTTTCTAATGAAAAAATC1320GlyAlaGluSerPheValSerAsnGluLyslieS30635S40GAATTTATCCCAGTACAATTGTAA"59GluPhelieProValGinLeuU)序列特征(A)长度652个氨基酸(B)类型氨基酸(D>拓朴学线性(ii)分子类型蛋白质(Xi)序列描迷序列编号34:MetAsnProAsnAsnArgSerGluHisAspThr工leLysValThrProIS1015AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202530ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArg3S4045MetThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp60AlaVal655055GlyThrGlyValProPheAsnThrGinValLysAla130ValAsn145UeTrp100GluVal115LieuAlaGly工leSer70AlaGlyAla85ProSerAspIjeulieAspValValGlyGinlieLeuGlyval75LeuThrSerPheTyrGinSer90Phe9S80LeuAlaLteuLysArgSerGinGluLeuGin135AsnSerTrpISOAspArglie165Ala120GlyLiysArgHisPheArgAsn180SerMetProserAspProTrpLysAlaPhe105110LyslieGluGluTyrAla125LeuGinAsnAsnPheGluLysThrproLeuSerl*eu155GluLeuPheSerGinAla170PheAlaValSerLysPhe185190MetAlaAspTyrArgGlu17SSerISOSerLeuPheLeuProThrTyrAlaGinAla195200AlaAsnLeuLysAspAla210AspValAlaGlu225ThrAspHisCysGluTrpGinValPheGlyGluPheTyrHisArgGinLeuLys230235ValAsnTrpTyr*AsnValGly2452S0ThrHis205GlyTyx220bsuThrLeuLeuLeuSerSerGluIjSUAsnGinGinTyr240GlyLeuArg255GlySerThr1Tyr2S0AspAlaTrpValLysPheAsnArgPheArg265270MetThrLeuThrValLeuAspLeu275280lieArgLeuTyrSerLysGlyVal295PhelieLeu310GluAsnSer290PheThrAspProlieThrPheLeuSerlie325TyxLeuGinGlylie340lieValLeuPheProPhe285LysThrGluLeuThrArg300HisThrLeuGinGluTyr315ArgGluTyrAspAsplieGlyPro320ProSer370Iiy5Ser385TyrArgValTyrLysAsnAspSer355GluPheHisAsnTyrTrp360lieArgLysProHis330ThrArglieuGlr;Pro345SerGlyAsnTyrval365I*euPheAsp335lieGlySerThrGluProSerLysThrlieThrSerProPhe375380ValGinLysLeuSerPheAsp,Gly390395ThrneAlaAsnThrAspValAlaAlaTrpPro405410GlyTyr350GluTharTyjrGlyGinLysAsnGly415HisVal450AspGlu465LeuGly420GluThr435SerAlaProLeuCysPheLeuMetValThrLysValAspPheSerGinTyrAspAsp425430SerThrGinThrTyrAspSerLysArgAsnAsnGinAspSerlieAspGinLeuProProGluThr455"0GluLysAlaTyrSerHisGinLeuAsnTyrAla47047SGinAspArgArgGlyThrlieProPhePheThr485490495PheAspval400LysGinGlyThrGlu480TrpThrHisArgSerValAspPhePhe500ThrGinLeuProValValLysAla515'520工lelieGluGlyProGlyPheThr530535GluSerSerAsnSer*lieAlaLys545550AsnThr工leAspAla505TyrAlaGlyGlyPheLysLeuSerSer525AsnLeuLeu540GluLyslie510.GlyAlaSerPheLeuLysAlaLeuLeuGinArgTyrArgValArglie565570ValThrLeuAsnSerAla555560ArgTyrAlaSerThrThrS7SAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie580TyrlieAsnLys535PheAspLeuAlaAsnGluLeulieS25TyrlieAspLys585ThrMetAsnLysAspAsp600Thrlielie"5Thr*AsnSerAsnMetGlyAlaGluSerPheGluPhelieProValS50AspGlyValLeuPheSer530丁hrTyrGinSerGlyAspAsnGluLysThrI^yslie"0GinLeu(2)序列编号35的信息(i)序列特征(A)长度1959碱基对(B)(C)(D)'链拓朴学线性(ix)特征:(A)(B)名称/关键词CDS定位1,.195S(xi)序列描迷序列编号35:ATGAATCCAAACMetAsnProAsnAATCGAAGTGAACATGATACGATAAAGGTTACACCTAsnArgSerGluHisAspThrlieLysValThrPro5101548AACAGTGAATTGAsnSerGluLeu20CAAACTAACCATAATCAATATCCTTTAOCTGACAATGinThrAsnHisAsnGinTyrProLeuAlaAspAsn25309SCCAAATTCAACACTAGAAGAATTAAATTATProAsnSerThrLeuGluGluLeuAsnTyr3540AAAGAATTTTTAAGAATGLysGluPheLeuArgMet144ACTGAAGACAGTTCTACGGAAGTGCTAGACThrGluAspSerSerThrGluValLeuAsp5055AACTCTACAGTAAAAGATAsnSerThrValLysAsp60192GCAGTTGGGACAGGAATTTCTGTTGTAGGGAlaValGlyThrGlylieSerValValGly6570CAGATTTTAGGTGTTGTAC51n工leLeuGlyValVal7S80240GGAGTTCCATTTGCTGGGGCACTCACTTCAG工yValProPheAlaGlyAlaLeuThfSer8590TTTTATCAATCAPheTyrGinSerPhe35CTTLeu288AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCAAsnThr工leTrpProSerAspAlaAspProTrpLysAlaPheMetAla100105110336CAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGinValGluVal11SLeulieAspLysLys120工leGluGluTyr1"GCTAlaAAAAGTLysSer384AAAGCTIjysAla130CTTGCALeuAlaGAGGluTTALeuGin13SGGTCTTGlyLeuCAAGinAATAATTTCAsnAsnPhe140GAAGluGATAspTATTyr4321"AATAsnGCGTTAAlaLeuAATTCCSerISOTGGTrpAAGAAAACAThrCCTTTAAGTProLeuSer155TTGCGALeuArgAGTSer160480AAALysAGAArgAGCCAASerGinGATAsp165CGAArgATAlieAGGGAAArgGluCTTLeu170TTTTCTCAAPheSerGinGCAGAAAlaGlu175AGTSer528CATHisTTTPheCGTAATAi:gAsn180TCCSerCCGProTCATTTSerPhe185GCAAlaG丁TTCCAAAValSerLiysTTCGAAPheGlu130GTG576CTGLeuTTTPheCTACCALeuPro135ACAThrTATTyrGCAAlaCAAGCTGinAla200GCAAlaAATACACATAsnThrHis205TTATTGLeuLeuCTA624LeuAAA210GATGCTAspAlaCAAGinGTTTTTPhe215GGAGAAGlyGluTGGGGATATTrpGlyTyr220SerSerGlu672GATAsp22SGTTValGCTGAAAlaGluTTTPheTATTyr230CATHisAGACAAArgGinTTALeuAAACTTACA]JysL*euThr235GAACAAGinGinTyr240720ACT<3ACAspCATTGTHisCysGTTVal2"AATAsnTGGTATAATGTT2S0GGATTAAATGlyLeuAsnGGTTTAGlyLeu255Arg7S8<formula>formulaseeoriginaldocumentpage282</formula>TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGG1488CysPheLeuMetGinAspArgArgGlyThrlieProPhePheThrTrp485490495ACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATT1536ThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslie500505510ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCC1584ThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSer515520525ATTATTGAAGOTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys5305355401632GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCA1680GluSerSerAsnSer工leAlal*ysPheLysValThrLeuAsnSerAla545550S55560GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGC丁TCTACCACT1728AlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThr565570575AACTTACGAAsnLeuArgCTTIjeuS80PheGTGValCAAGinAATTCAAACAsnSerAsnS8SAATGATTTTAsnAspPheCTTOTCATCLeuVallie590TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspl>euThrTyrGinThr59S60060S1824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610SISS201872AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATC1920AsnGluLeu工lelieGlyAlaGluSerPheValSerAsnGluLyslie625630。5"0TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAATyrlieAspLyslieGluPhe工leProValGinLeuS45"01959(2)序列编号36的信息(i)序列特征(A)长度652个氨基酸(B)类型氨基酸(D)拓朴学线性(ii)务子类型妄白质(xi)序列描述序列编号36:MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro1015AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202530ProAsnSer一ThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet354045ThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp505S60AlaValGlyThrGlylieSerVai70ValGlyGinneLeuGlyValVal7S80GlyValProPheAlaGlyAlaLeu85ThrSerPheTyrGinSerPheLeu3035AsnThrlieTrpProSerAspAlaAsp10010SProTrpLysAlaPheMetAla110GinValGluValLeulieAspLysLyslie115120GluGluTyrAlaLysSer125LysAlaLeuAlaGlu乙euGinGlyI>euGin130135AsnAsnPheGluAspTyr140ValAsnAla145LeuAsnSerTrpLysLys150ThrProLeuSerLeuArgSer15SISOLysArgSerHisPheArgGinAspArglieArgGluLeu165170PheSerGinAlaGluSer175Asn5erMetProSerPheAlaValSerLysPheGluVal180185190lieuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu195200205LeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220AspValAlaGluPheTyrHisArgGinLeuI.ysLeuThrGinGinTyr225230235240ThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg2452502S5GlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu260265270MetThrLeuThrValLeuAspLeu工leValLeuPheProPhe丁yrAsp2752B028SlieArgLeuTyrSerLysGlyValLysThrGluLeuThrArgAsplie290235300PheThrAspProliePheSerLeuVal305310ThrpheLeuSerlieGluAsnSerlieTyrLeuGinGlylieGluPheHisThr340345AsnLeuMetValTyrGlyPro315320ArgLysProHisLeuPheAsp330335ArgLeuGinProGlyTyrPhe350GlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGlu.Thr*Arg3553S0365ProSerlieGlySerSerLysThrlieThr370375LysSerThrGluProValGinLysLeuSer385390TyrArgThrlieAlaAsnThrAspValAla405410ValTyrLeuGlyValThrLysValAspPhe420425IjysAsnGluThrSerThrGinThrTyrAsp440HisVal450AspGlu465435SerSerProPheTyrGlyAsp380PheAspGlyGinLysVal395400AlaTrpProAsnGlyLys415SerGinTyrAspAspGin430Serl*ysArgAsnAsnGly445AlaGinAspSerlie45SProL*euGluCysPheLeuMetGin48S470AspAlaTyrThrHisArgSerValAspPhePhe500ThrGinLeuProValVal515lieUe530GluSer545GluGlyProGlySerAsnSerlie550AlaLeuLeuGinArgTyr565LysAla520PheThr535AlaIiysArgValAsnLeuArgLeuPheValGinAsnTyrlieAsnL>ysThrMetAsnLys595600AspGinJbeuProProGluThrThrSerHisGinlieuAsnTyrAlaGlu475480GlyThrlieProPhePheThrTrp49049SAsn丁hr工leAspAlaGluLyslie505510TyrAlaLeuSerSerGlyAlaSerS2SGlyGlyAsnLeuLeuPheLeuLys540PheLysValThrLeuAsnSerAla555560ArglieArgTyrAlaSerThrThr570575SerAsnAsnAspPheLeuVallie58S530AspAspAspLeuThrTyrGinThrSOSPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610"5AsnGluLeulie工leGlyAlaGluSerPheValSerAsnGluLyslieS25630"5"0TyrlieAspLyslieGluPhelieProValGinLeuS45650(2)序列编号37的信息(i>序列特征(A)长度1959碱基对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性特征(A)<B)名称/关键词CDS定位(xi)序列描述序列编号37:ATGAATMetAsnCCAAACProAsnAATCGAAGTArgSerGAACATGluHisGATAsp10ACGThrATAAAGGTT工leLysValACACCTThrPro154BAACAGTGAAGluTTGlieu20CAAGinACTThrAACAsnCATHisAATAsn25CAAGinTATTyrCCTProTTAGCTLeuAla30GACAATAspAsn96CCAAATProAsnTCASer35ACAThrCTALeuGAAGluGAAGluTTALeu40AATAsnTATTyrAAAGAAGluTTTTTAPheLeu45AGAATGArgMet144ACTGAAThrGlu50GACAspAGTSerTCTSerACGThrGAAGlu55GTGValLeuGACAspAACTCTSer50ACAGTAThrValAAAGATLysAsp132GCAOTTAlaValGGGGlyACAThrG<3AGlyATT70TCTSerGTTValGTAValGGGGlyGin7SATTlieTTA加TLeuGlyGTTOTAValVal80240GGAGTTGlyValCCAProTTTPheGCTAla85GGGGlyGCAAlaCTCLeuACTThrTCASer90TTTTATTyrCAATCAGinSea:TTTCTTPheL>eu952BBAACACTATAlieTG<3Trp100CCAProAGTSerGATAspGCTAlaGACAsp105CCAProTGGTrpAAGGCTTTTAlaPhe110ATGGCAMecAla336CAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGT384GinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSer115120125AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATl.ysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135140432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer145150155160480AAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTCAAGCAGAAAGTLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer165170175S28CATTTTCGTHisPheArgAATTCCATGAsnSerMet180CCGTCATTTGCAGTTTCCAAATTCGAAGTGProSer*PheAlaValSerLysPheGluVal185190576CTGTTTCTALieuPheLeu195CCAACATATProThrTyrGCACAAGCTGCAAATAlaGinAlaAlaAsn200ACACATTTATTGCTAThrHisl*eulieuLeu205S24TTAAAAGATGCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAALeuIjysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220672GATGTTAspVal225GCTGAATTTAlaGluPheTATCATTyrHis230AGACAAArgGinTTALeuAAALys23SCTTACACAACAAIjeuThrGin<3lnTACTyr240720ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnVal.GlyLeuAsnGlyLeuArg2452SO2SS768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpVall>ysPheAsnArgPheArgArgGlu2S02SS27081SATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsp27528028S864ATTCGGlieArg290TTATACTCALeuTyxSerAAAGGGGTTAAAACAGAACTAACAAGAGACATTLysGlyValLysThrGluLeuThrArgAsplie29S300912TTTACGPheThr305GATCCAATTAspProlieTTTTCTPheSer310CTTAGGLeuArgACAThrCCAPro315CTTGCGTACGGALeuAlaTyrGlyCCAPro320960ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATThrPheLeuSerlieGluAs"SerlieArgLyeProHisLeuPheAsp3253303351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTT1056TyrLreuGinGlylieGluPheHisThrArgLeuGinProGlyTyrPhe340345350GGGAAAGAT丁CTTTCAATTATTGGTCTGGTAATTATGTAGAAACTAGA1104GlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrVaiGluThrArg355"360365CCTACTATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGAT1152ProSerlieGlySerSerLysThrlieThr*serProPheTyrGlyAsp370375380AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGTT1200IiysSerThrGluProValGinIiysLeuSerPheAspGlyGinLy3Val385390395400TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAG1248TyrArgThrlieAlaAsnThrAspValAlaAlaTipProAsnGlyLys405410415GTATATTTAGGTGTTACGAAAGTTGATValTyrLeuGlyValThrLysValAsp420425TTTAGTCAATATGATGATCAAPheSerGinTyrAspAspGin430125)6AAAAATGMACTAGTLysAsnGluThrSer435ACACAAACATATGATThrGinThrTyrAsp440TCAAAAAGAAACSerLysArgAsn445AATGGCAsnGly1344CATGTAAGTHasValSer450GCACAGAlaGinGATAspTCTSer4S5ATTlieGACAspCAAGinTTACCG!>euPro"0CCAGAAProGluACAACAThrThr1392GATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAA1440AspGluProLeuGluLys.AlaTyrSerHisGinLeuAsnTyrAlaGlu4S5470475480TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGG14B8CysPheLeuMetGinAspArgArgGlyThr工leProPhePheThrTrp48S49049SACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSerValAspPhePheAsnThrliesAspAlaGluLys工leS00505510ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCC1584ThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSer515520525ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAA1632lielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys53053S540GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCA1680GluSerSerAsnSer工leAlaLysPheLysValThrLeuAsnSerAlaSSOS555€0GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACT1728AlaLeuLeuGinArgTyrArgrValArg工leArgTyrAlaSerThrThr565570575AACTTACGACTTTTTGTGCAAAATAsnlieuArgLeuPheValGinAsnS80TCAAACAATGATTTTCTTGTCATCSerAsnAsnAspPheLeuVallie58SS90177STACATTAATAAAACTATGAATAAATyxlieAsnLysThrMetAsnl>ys595600GATGATGATTTAACATATCAAACAAspAspAspLeuThrTyarGinThr6051824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys6106156201872AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCAsn<31uLeulie工leGlyAlaGluSerPheValSerAsnGluLyslie635"01920TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAATyrlieAspLyslieGluPhelieProValGinLeu64S6501959(2>序列编号38的信息(i)序列特征(A)长度652个氨基酸(B)类型氨基酸(D)拓朴学线性"i)分子类型蛋白质"i》序列描述序列编号38:MetAsnProAsnAsnArgSerGluHisAspThrlie10LysValThrPro15AsnSerGluLeuGinThrAsnHisAsnGinTyrPro2025LeuAlaAspAsn30ProAsnSerThrLeuGluGluLeuAsnTyrLysGlu3540PheLeuArgMet45ThrGlu50AlaVal65SerSerThrGluValLeuAspAsnSerThrValLysAsp5560AspGlyThrGly工leSerValValGlyGinlie7075LeuGlyValVal80GlyValProPheAlaGlyAlaL^uThrSerPheTyr8590GinSerPheL*eu95AsnThrlieTrpProSerAspAlaAspProTrpLysiooiosAlaPheMetAla110GinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSer115JLysAlaLeuAlaGluLeu130ValAsnAlaLeuAsnSer145150LysArgSerGinAspArg1"12012SGinGlyL*euGinAsnAsnPheGluAspTyr135140TrpLysLysThrProLeuSer*LeuArgSer155160lieArgGluLeuPheSerGinAlaGluSer170175HisPheArgAsn180LeuPheLeuPro195SerMetProSerPheAlaVaSerLys185ThtrTyrAlaGinAlaAlaAsnThrHis200205PheGluValLeuLeuLeuLeuLysAspAlaGinVal210AspValAlaGluPheTyr22S230ThrAspHisCysValAsn24SGlySerThrTyrAspAlaMetThrLeuThrValLeu275lieArgLeuTyrSerl*ysPheThrAspProliePhe305310SerSerGluThrPheleuSerlieGluAsnSer325TyrGinGlylieGluPheHis340GlyLysAspSerPheAsnTyrTrp3SS3"ProSerlieGlySerSerl*ysThr370375LysSerThrGluProValGinLys385390TyrArgThrlieAlaAsnThrAsp405PheGlyGluGluTrpGlyTyx215220HisArgGinLeuLysLeuThrGinGinTyr235240TrpTyrAsnValGlylieuAsnGlyLeuArg25025STrpValLysPheAsnArgPheArgArgGlu2"270AspLeulieValLeuPheProPheTyrAsp280285G丄yvall*ysThrGluLeuThrAxgAsplie2"300SerLeuArgThrProLeuAlaTyxGlyPro315320lieArgLysProHisIjeuPheAsp33033SThrArgLeuGinProGlyTyrPhe3453S0SerGlyAsnTyrValGluThrArg365工leThrSerProPheTyarGlyAsp380LeuSerPheAspGlyGinLysVal395400ValAlaAlaTrpProAsnGlyLys41041SValTyrLeuGlyValThrLysVal420LysAsnGluThrSerThrGinThr435440HisValSerAlaGinAspSerlie450455AspGluProLeuGluLysAlaTyr470AspPheSerGinTyrAspAspGin425430TyrAspSerLysArgAsnAsnGly445AspGinLeuProProGluThrThr460SerHis"5CysPheLeuMe仁ThrHisArgSer500ThrGinI^uPro515lielieGluGlyGinAsp485ValAspArgArgGlyThr490PhePheAsnThr"50SGinLeuAsnTyrAlaGlu475480lieProPhePheThrTrplieAspAlaGluLyslie510ValValLysAlaTyrAlaLeuSerSerGlyAlaSer520525ProGlyPheThrGlyGlyAsnL^uLeuPheLeuLys530535GluSerSerAsnSerlieAlaLysPheLysVal545550555AlaLeuLeuGinArgTyrArgValArglieArg565AsnLeuArgLeuPheVal580TyrlieAsnLysThrMet595PheAspLeuAlarhrThr*610AsnGluLeulielieGlyTyrlieAspLyslieGlu"5(2)序列编号39的信息U>序列特征(A>长度1959碱基对(B>类型核苷酸(C>链的性质单链(D》拓朴学线性540ThrLeuAsnSerAla560570GluAsnSerAsnAsn505AsnLysAspAspAsp600AsnSerAsnMetGlyAlaGluSerPheValTyrAlaAspPheLeuThr605PheSer620Serleu590TyrGlySerAsnGluThrThr575VallieGinThrAspLysLyslie640PhelieProValGinLeu6S0(ix)特征:<formula>formulaseeoriginaldocumentpage292</formula>19520020STTAAAAGATGCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAALeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220GATGTTGCTGAATTTTATCATAGACAATTAAAAAspValAlaGluPheTyrHisArgGinLeuLys225230235CTTACACAACAATACLeuThrGinGinTyr240720ACTGACCATTGTGTTAATTGGTATAATGTTGGAThrAspHisCysValAsnTrpTyrAsnValGly245250TTAAATGGTTTAAGALeuAsnGlyl*euArg255768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu2S02S5270816ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTTCAATMetThrLeuThrVal27SLieuAspLeulieVal280LeuPheProPhePheAsn285ATTTTGCTTTACAGTlieLeuLeuTyr*Ser290AAAGGGGTTAAAACALysGlyValLysThr295GAACTAACAAGAGACATTGluLeuThrArgAsplie3009;l2TTTACGGATCCAATTPheThrAspProlie305TTTTCACTTPheSerLeu310AATACTCTTCAGGAGTATGGACCAAsnThrLeuGinGluTyrGlyPro315320960ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTThrPheUeuSerlieGluAsnSerlieArgLysPro325330CATTTATTTGATHisLeuPheAsp3351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAATyrLeuGinGlylieGluPheHisThrArgLeuGin34034SCCTGGTTACTTTProGlyTyrPhe3501056GGGAAAGATTCTTTCAATTATTGGTCTGGTAATTATGlyLysAspSerPheAsnTyrTrpSerGlyAsnTyr355360GTAGAAACTAGAValGluThrArg3551104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCAProSerlieGlySerSerLysThrlieThr"SerPro370375380TTTTATGGAGATPheTyrGlyAsp1152AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATLysSerThrGluProValGinLysLeuSerPheAsp3853903"GGACAAAAAGTTGlyGinLysVal4001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGTyrArgThrlieAlaAsnThrAspValAlaAlaTrp405410CCGAATGGTAAGProAsnGlyLys4151248GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin1296420425430AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly435440"51344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr4504554601392GATGAACCACTTGAAAAAGCAAspGluProLeuGluLysAla465470TATAGTCATCAGCTTAATTyrSerHisGinLeuAsn47STACGCGGAATyrAlaGlu4801440TGTTTCTTAATGCAGGACCGTCysPheLeuMetGinAspArg485CGTGGAACAATTCCATTTTTTACTTGGArgGlyThrlieProPhePheThrTrp490495ACACATAGAAGTGTAGACTTTThrHisArgSerValAspPhe500TTTAATACAATTGATGCTPheAsnThrlieAspAla505GAAAAGATTGluLyslie5101536ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGThr<31nLeuProValValLysAlaTyrAlaLeu515520TCTTCAGGTSerSerGly52SAlaTCCSer1584ATTlieATT工le530GAAGluGGTCCAGGA(SlyProGlyTTCPhe535ACAThrGGAGGAAATGlyGlyAsnTTACTALeuL<euS40TTCPheLeuAAAGAAGlu545TCTSerAGTAATTCAATTlie5S0GCTAlaAAALysTTTAAAGTTPheLysValS55ACATTAThrLeuAATAsnTCASerGCAAla560GCCTTGAla!>euTTALeuCAACGAGinArg5S5TATCGTGTAAGAATACGCArglieArg570TATGCTTyxAlaTCTACC575ACTThr1728AACTTAAsnLeuCGACTTTTTLeuPheS80GTGValCAAGinAATAsnTCAAACAATSerAsnAsn585GATTTTAspPheCTTLeu530GTCVallie1776TACATTTyr*lieAATAsn595AAAACTLysThrATGMetAATAsnAAALys600GATGATGATAspAspAspTTAACALeuThrS05TATTyrCAAGinACAThr1824TTTGATPheAspS10CTCLeuGCAACTAlaThrACTAAT61STCTSerAATATGGGGAsnMetGlyTTCTCGPheSer620GGTGlyGATAspAAGl*ys1872AATGAAAsnGlu62SCTTLeuATAATAlielieGGAGly630GCAAlaGluTCTTTCGTTSerPheVal635TCTAATSerAsnGAAGluAAALysATClie6401920TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAATyrlieAspLyslieGluPhelieProValGinLeu"0(2)序列编号40的信息(i)序列特征(A)长度652个氨基酸(B)类型氨基酸(D〉拓朴学线性(ii)分子类型蛋白质序列描迷序列编号40MetAsnProAsnAsnArgSerGluHisAsp10ThrlieIysValThrPro15AsnSer<51uLeuGinThr20AsnHisAsnGin2STyrProLeuAlaAspAsn30ProAsnSerThrLeuGlu35ThrGluAspSerSerThr50GluLeuAsnTyr40GluValLieuAsp55LysGluPhe4SAsnSer60LeuArgMetThrValLysAspAlaValGlyThrGlylieSerValValGly70GinlieLeuGlyValVal75B0GlyVaiProPheAla8SGlyAlaLeuThrSer*90PheTyrGinSerPheLeu95AsnThrlieTrpPro100SerAspAlaAspPro105TrpLysAlaPheMetAla110GinValGluValLeulieAspLysU5120LysAlaLeuAlaGluLeuGinGly13013SLyslieGluGlu12SAlaLysSerLeuGlxiAsnAsnPheGluAspTyr140Val145AsnAlaLeuAsnLysArgSerGinAsp165Ser150ArgTrpLysLysThrProXjeuSer155lieArgGluLeuPheSerGin170LeuArgSer160AlaGluSer175HisPheArg180MetProSerPheAlaIBSValser乙ysPheGluVal190LeuPheLeuProThrTyrAlaGin195200LeuLysAspAlaGinValPheGly210215AlaAlaAsnThrHisLeuLeuLeu205GluGluTrpGlyTyxSerSerGlu220AspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyr225230235240ThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg2452SO255GlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu260MetThrLeuThrVal275lieLeuTyrSer290PheThrAspProlie305ThrPheLeuSerlie32S26S270LeuAspLeulieValLeuPheProPhePheAsnPhe310GluTyrLeuGinGlylieGlu280GlyValLysThrGluLeu295300SerLeuAsnThrLeuGin315AsnSerlieArgLysPro330PheHisThrArgLeuGin340345285ThrArgAsplieGluTyrGlyPro320HisLieuPheAsp335ProGlyTyrPhe350GlyIjysAsp355ProSerlie370UysSerThr385SerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg360GlySerSer*LysThrlieThrSerPro37S380GluProValGinLysLeuSerPheAsp395365PheTyrGlyAspTyrArgThrlieValTyrLeuGly420LysAsnGiuThr435HisVaiSerAlaAspGluPrpLeuCysPheLeuMe仁Ala405390AsnThrValThrLysSerThrGinGinAsp4SSGlu!>ysAla470Gin48SThrHisArgSerS00ThrGinLeuPro515AspArgValAspPheValValLysAspValValAsp425ThrTyr440工leAspArgGlyPheAsnSOSA!LaTyr520AlaAlaTrp410PheSerGinAspSerLysGinLeuProHisGinLeu475ThrlieProThrlieAspAlaLeuSer*GlyGinLysVal400ProAsnGlyLys515TyrAspAspGin430ArgAsnAsnGly445ProGluThrThrAsnTyrAlaGlu480PhePheThrTrpAlaGluLyslieSer*GlyAlaSer525lielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys53053S540GluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAla5"S50SSSSSOAlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThr5S5S70575AsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie580S8S590TyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThrS9S600605PheAspLeuAJaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610615620AsnGluLeulie工leGlyAlaGluSerPheValSerAsnGluLyslie625630S35640TyrlieAspLys工leGluPhelieProValGinLeu"SS50(2)序列编号41的信息(i)序列特征(A)长度1959碱基对(B)类型核苷酸(C)链的性质单链(D>拓朴学线性(ix特征(A>名称/关键词CDS(B定位1.(xi)序列描述序列编号41:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCT48MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro151015AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202530CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet354045144ACTGAAThrGlu50GACAspAGTTCTSerACGThrGAAGlu55GTGCTAGACValI*euAspAACTCTAsnSer60ACAGTAAAAGATThrValLysAsp192GCAGTTGGGACAGGAATTTCTGTTGTAGGGCAGATTTTAGGTG丁TGTAAlaValGlyThrGly工leSerValValGlyGinlieLeuGlyValVal65707S80240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATCAATCATTTCTTGlyValProPheAlaGlyAla85LeuThrSerPheTyrGinSerPheLeu9095288AACACTATATGGCCAAGTGATGCTGACAsnThrlieTrpProSerAspAlaAsp100105CCATGGAAGGCTTTTATGGCAProTrpLysAlaPheMetAla110336CAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGGinvalGluvalLeulieAspLysL>yslieGluGlu11S120TATGCTAAAAGTTyrAlaLysSer125384AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATLysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsn130135140TTCGAAGATTATPheGluAspTyr432GTTAATGCC3TTAAATTCCValAsnAlaLeuAsnSer145150TGGAAGAAAACATrpLysL*ysThrCCTTTAAGTTTGCGAAGTProJbeuSerI>euArgSer155160480AAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTLysArgSerGinAspArglieArgGluLeuPheSer165170CAAGCAGAAAGTGinAlaGluSer17S528CATTTTCGTAATTCCATCH丄sPheArgAsnSerMet180CCG丁CATTT'GCAGTTTCCAAATTCGAAGTGProSerPheAlaValSerLysPheGluVal185130576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheI*euProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu19520020SS24TTAAAAGATGCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAALeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220S72GATAsp225GTTGCTGAATTTValAlaGluPheTATTyr230CATAGACAAHisArgGinTTAAAALeuLys235CTTACAlieuThrCAAGluCAATACGinTyr240720ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsn(UyLeuArg2452502S5768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu2S026527081SAT<3ACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuAspLeulieValPheProPheTyrAsp'27S2802858"ATTGTGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTlieValLeuTyrSerLysGlyValLysThrGluLeuThrArgAsplie290295300912TTTACGGATCCAATTTTTTCACTTAATACTCTTCAGGAGTATGGACCAPheThrAspProliePheSerLeuAsnThrLeuGinGluTyrGlyPro305310315320960ACTTTTTTGAGTATAGAAAACTCTATTCGAThrPheLeuSerlieGluAsnSerlieArg325330AAACCTCATTTATTTGATLysProHisLeuPheAsp33510D8TA丁TTATyrLeuCAGGGGGinGly340ATTGAATTTCATlieGluPheHisACGCGTCTTCAACCTGG了TACTTTThr*ArgLeuGinProGlyTyrPhe3453501056GGGAAAGATTCTTTCAATTATTGGTCTGlyLysAspSerPheAsnTyrTrpSer355360GGTAATTATGTAGAAACTAGAGlyAsnTyxValGluThr;Arg355U04CCTAGTATAGGATCTAGTAAGACAATTACTProSerlieGlySerSerLysThr工leThr370375TCCCCATTTTATSerProPheTyr380GGAGATGly*AspU52AAATCTACTGAAIjysSerThrGlu385CCTGTACAAAAGCTAAGCProValGinLysLeuSer390TTTGATGGACAAAAA<3TTPheAspGlyGinIysVal39S4001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGly*Lys40S4104151248GTATATValTyxTTAGC5TLeuGly420GTTACGValThrAAAGTTIiysValGATAsp42STTTPheAGTCAATATSerGinTyrGATAsp430GATAspCAAGinAAAAATLysAsnGAAACTGluThr435AGTACASerThrCAAGinACAThr440TATTyrGATAspTCAAAAAGASerLysArg445AACAsnAATAsnGGCGly1344CATGTAHisVal4S0AGTGCASerAlaCAGGATGinAspTCTSer45SATTlieGACAspCAAGinTTACCGCCAUeuProPro"0GAAGlUACAThrACAThr1392GATGAAAspGlU465CCACTTProLeuGAAAAAGluLys470GCAAlaTATTyrAGTSerCATHisCAGCTTAATGinLeuAsn475TACTyxGCGAlaGAAGlu4801440TGTTTCCysPheTTAATGLeuMetCAGGACGinAsp48SCGTArgCGTGGAGlyACAThr490ATTCCATTTlieProPheTTTPheACTThr*49STGGTrp1488ACACATThrHisAGAAGTArgSer500GTAGACValAspTTTPhe丁TTPheAATASH505ACAThJTATTGATGCTlieAspAlaGAAGluS10I^ysATTlie1536ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCC1584ThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSer515520S25ATTATTGAA'GGTCCAGGAT丁CACAGGAGGAAATTTACTATTCCTAAAA1"2lielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys530535540GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAla545S5055SGCCTTGTTACAACGATATCGTGTAAlaLeuLeuGinArgTyrArgVal5"AGAATACGCTATArglieArgTyr570GCTTCTACCAlaSerThr57SACTThr1728AACTTACGACTTTTTGTGCAAAATAsnLeuArgLeuPheValGinAsn580TCAAACAATGATSerAsnAsiaAspS8STTTCTTGTCPheLeuValS90ATClie1776TACATTAATAAAACTATGAATAAAGATGATGATTTAACATAT.CAAACA1824TyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr595600605TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAG1872PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLysG10"5G2DAATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATC1920AsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslieS2SS30635640TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAATyr工leAspLyslieGluPhelieProValGinLeu645S501353(2)序列编号42的信息(i)序列特征<A)长度652个氨基酸(B)类型氨基酸(D)拓朴学线性(ii)分子类型蛋白质Ui>序列描述序列编号42:MetAsnProAsnAsnArgSerGluHisAspThrlieLysVaiThrPro151015AsnSerGluGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202S30ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet35'404SThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp505560AlaValGlyThrGlylieSerValValGly(SinlieLeuGlyValVal€5GlyValAsnThrGinValLysAla13070ProPheAlaGlyAlaLeuThrser85307580PheTyrGinSerPheLeu95lieTrpProSerAspAJLa100GluValLeulieAspLys115120LeuAlaGlulieuGinGly135ValAsnAlaieuAsnSerTrpLys145150LysArgSerGinAspArglieArg165HisPheArgAsnSerMetProSer180AspProTrpLysAlaPhe105110LyslieGluGluTyrAla125LeuGinAsnAsnPheGlu140LysThrProLeuSerLeu155MetAlaLysSerAspTyrArgSer160GluLeuPheSerGinAlaG工uSer170175PheAlaValSerLys185LeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHis"5200205PheGluValLeuIjeuLeuLeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210AspValAlaGluPhe225ThrAspHisCysVal24SGlySet*ThrTyrAsp260MetThrLeuThrVal275.lieValLeuTyrSerPheThrAspProlie305215220TyrHisArgGinLeuLysIeuThrGinGinTyr230235240AsnTrpTyrAsnValGly!LeuAsnGlyl*euArgAlaTrpValLysPheAsnArgPheArgArgGlu265270LeuAspLeulieValLeuPheProPheTyrAsp280285LysGlyValLysThrGluLeuThrArgAsplie295300PheSerLeuAsnThrEeuGinGluTyrGlyPro310315320ThrPheLeuSex*lie325GluAsnSerlieArgLysProHis330I-euPheAspTyrLeuGinGlylieGluPheHisThrArglieuGinProGlyTyrPhe340345350GlyLysAspSerPheAsnTyrTrpSer*GlyAsnTyrValGluThrArg3553603SSProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp370LysSerThrGiuProVal385TyrArgThrlie3S0AlaAsn40SValTyrLeuGlyValThr42037SGinLysThrAspl>ysVal380LeuSerPheAspGly395LysAsnGlu"5ThrSerThrGinThr440ValAla410AspPheTyrAspAlaTrpProGinLysVal400;isnGlyLys415SerGinTyrAspAspGinSerLysArgAsnAsnGly445HisValSerAlaGinAspSerlie450AspGluProLeuGluLys"5470CysPheLeuMetGinAsp485ThrHisArgSerValAsp5004S5Ala丁yrSerHisAspGinLeuProProGluThrThr450ArgArgThrGinLeu515lielieGlu530GluSerS色r545AlaLieuLeuProValValGlyProGlyAsnSerlie550PhePheLysAla520PheThrS35AlaLysGlyThrAsnThr505TyrAlaGlyGlyPheLysGinLeuAsnTyrAlaGlu47S480lieProPhePheThrTrp495工leAspAlaGluLyslie510LeuSerValThr555AsnlieuArgTyrlieAsn535PheAspLeu610GinArgTyrArgVal565LeuPheValGinAsn580LysThrMetAsnLys600AlaThrThrAsnSerS15Arglie570ArgTyrAsnAspAspAspAspI*euSerAsnS85AsnGluLeulielieGlyAlaGluS2SS30AsnMetSerPheGlyPheValSer635SerGlyAlaSer525LeuPheLeuLysLeuAsnSerAlaS60AlaSerThrThr575PheLeuVallie590ThrTyrGinThr605SerGlyAspLysAsnGluLyslie640TyrlieAspLyslieGluPhelieProValGinLeu(2)序列编号43的信息(i)序列特征(A)长度1959碱基对(B》类型核苷酸(C)链的性质单链(D)拓朴学线性(ix)特征(A>名称/关键词CDS(B>定位1..;i^S6(xi)序列描迷序列编号43:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCTMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrProIS101548AACAGTGAATTGCAAACTAACCATAsnSerGLuLeuGinThrAsnHis20AATCAATATCCTTTAGCTGACAATAsnGinTyrProUeuAlaAspAsn2530CCAAATTCAACACTAGAAGAATTAProAsnSerThrLeuGluGluLeu3540AATTATAAAGAATTTTTAAGAATGAsnTyrLysGluPheLeuArgMet45144ACTGAAThrGlu50GACAspAGTSerTCTSerACGThrGAAGTGGluVal55CTAGACLeuAspAACTCTSer60ACAGTAThrValAAAGATLysAsp192GCAGTTAlaVal65GGGGlyACAThrGGAGlyATTlie70TCTGTTSerValGTAGGGValGlyCAGGin75ATTlieTTAGGTLeuGlyGTTGTAValVal80240GGAGTTGlyValCCAProTTTPheGCTAla85GGGGlyGCACTCAlaI*euACTTCAThrSer30TTTPheTATTyrCAATCAGinSerTTTCTTPheLieu35288AACACTATAlieTGGTrp100CCAProAGTSerGATGCTAspAlaGACCCAAspPro105TGGTrpAAGGCTTTTAlaPhe110ATGGCAMetAla336CAAGTTGinV3lGAAGlu11SValCTGLeuATAlieGATAAGAspL*ys120AAAATAIiyslieGAGGluGAGGluTATGCTTyrAla125AAAAGTLysSer384AAAGCTLysAla130CTTGCAAlaGAGGluTTALieuCAGGGTGinGly135CTTCAALeuGinAATAATAsn140TTCGAAPheGluGATTATAspTyx432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer145ISO155160楊AAAAGAAGCCAAGGTCGAATAAGGGAACTTLysArgSerGinGlyArglieArgGluLeu16517DTTTTCTCAAGCAGAAAGTPheSerGinAlaGluSer175528CATTTTCGTAATTCCATGHisPheArgAsnSerMet180CCGTCATTTGCAProSerPheAla18SGTTTCCAAATTCGAAGTGValSerLysPheGluVal190576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu195200205624TTAAAAGATGCTCAAGTTTTTGGAGAAGAATOGGGATATTCTTCAGAALeuLysAspAlaGinVaiPheGlyGluGluTrpGlyTyrSerSerGlu21021S220。2GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAATACAspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyr22S230235240720ACTGACCATTGTGTTAATTGGTATAATGTTThrAspHisCysValAsnTrpTyrAsnVal24S2S0GGATTAAATGGTTTAAGAGlyLeuAsnGlyLeuArg25S768GGTTCAACTTATGATGCATGGGTCAAATTTGlySerThrTyrAspAlaTrpValLysPhe260265AACCGTTTTCGCAGAGAAAsnArgPheArgArgGlu270816ATGACTTTAACTGTATTAGATCTAATTGTAMetThrLeuThrValLeuAspLeulieVal27S2B0CTTTTCCCATTTTATGATLeuPheProPheTyrAsp285864ATTCGGlieArg290TTATACTCAOeuTyrSerAAAGGGGTTAAAACALysGlyValLysThr2S5GAACTAACAAGAGACATTGluLeuThr*ArgAsplie300912TTTACGGATCCAATTTTTTCACTTAATACTCTTPheThrAspProliePheSerLeuAsnThrIeu305310315CAGGAGTATGGACCAGinGluTyrGlyPro320360ACTTTTTTGAGTATAGAAAACTCTATTCGAAAAThrPheLeuSerlieGluAsnSerlieArgLys325330CCTCATTTATTTGATProHisLeuPheAsp3351008TATTTACAGGGGATTGAATTTCATACGCGTCTTTyrLeuGinGlylieGluPheHisThrArgLeu340345CAACCTGGTTACTTTGinProGlyTyrPhe350GGGAAAGATTCTTTCAATTATTGGTCTGGTAATGlyLysAspSerPheAsnTyxTrpSerGlyAsn3553S0TATGTAGAAACTAGATyi"ValGluThr36511D4CCTAGTATAGGATCTAGTAA<3ACAATTACTTCCCCATTTTATGGAGATProSearlieG〗ySerSerLysThrlieThrSerProPheTyrGlyAsp3703753801152AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGTTLysSearThrGluProValGinLysLeuSerPheAspGlyGinLysVal3853903954001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTfpProAsnGlyLys4054104151248GTATATTTAGOTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyrLeuGlyValThr*LysValAspPheSerGinTyrAspAspGin42042S4301296AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly43544044S1344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr450455"0GATGAACCAAspGluPro465CTTGAAAAAGCATATLeuGluLysAlaTyr470AGTCATCAGCTTAATTACGCGGAASerHisGinLeuAsnTyrAlaGlu4754801440TGTTTCCysPheTTAATGCAGGACLeuMetGinAsp485CGTCGTArgArgGGAACAATTGlyThrlie490CCATTTTTTProPhePheACTThr495TGG14&8ACACATThrHisAGAAGTArgser500GTAGACValAspTTTTTTPhePheAATACAATTAsnThrlie505GATGCTGAAAspAlaGlu510AAGLysATTlie1536ACTCAAThrGinCTT515CCAProGTAGTGValValAAAGCALysAla520TATGCCTyrAlaLeuTCTTCAGGTSerSerGly525GCTAlaSer1584ATTATT工lelie530GAAGluGlyCCAGGAProGlyPheThrS35GGAGGAGlyGlyAATTTACTATTCLieuLieuPhe540CTALeuAAAljys1632GAATCTGluSer545AGTSerAATAsilTCAATTSerlieS50GCTAAAAlaLysTTTAAAPheLysGTTValS55ACATTAAATThr!LeuAsnTCASerGCAAla5S01680GCCTTGAlaLeuTTALeuCAAGinCGATATArgTyr565CGTGTAArgValAGAATAArglie570CGCTATGCTTCTTyrAlaSerACCThr575ACTThr1728AACTTAAsnLeuCGACTTLeu580TTTGTGPheValCAAAATGinAsnTCAAACSerAsn585AATGATTTTCTTAspPheLeu590GTCVal工le177S<formula>formulaseeoriginaldocumentpage306</formula>LysArgSerGinGlyArglieArgGluLeuPheSet*GinAlaGluSer165170175HisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVai180185190LeuPheLeuProThrTyr*AlaGinAlaAlaAsnThrHisLeuLeuLeu19S200205LeuLysAspAlaGinVal210AspValAla225ThrAspHisGlySerThrPheGlyGlu215GluTrpGlyTyr220GluPheTyr230CysValAsn245TyrAspAla260Lys23SHisArgGinLeuLysLeuThrTrpTyrAsnTrpValLys265Val2S0PheGlyLeuAsnSerSerGluGinGin*Tyr240GlyLeuArg2S5AsnArgPheArgArgGlu270Met:ThrLeuThrValLeuAspLeulieVal275280LeuPheProPheTyrAsp285lieArgLeuTyrSerLysGlyValJLys290295ThrGluLeuThrArgAsplie300PheThrAspProliePheSerLeuAsn305310ThrLeuGinGluTyrGlyPro315320丁hrPheLeuSer工leGluAsnSer工leArgLysPro32S330TyrLeuGinGly工leGluPheHisThrArgLeuGin340345HisLeuPhe335ProGlyTyr350AspPheGlyLysAspSerPheAsnTyrTrpSerGlyAsnTyr35S360ProSerlieGlySerSerLysThrlieThrSerPro370375380LysSerThrGluProValGinLysLieuSex*PheAsp385390355TyrArgThrlieAlaAsnThrAspValAlaAlaTrp405410ValGluThrPheTyrGlyGlyGinLysProAsnGly41SArgAsp400ValTyrLeuGlyValThrLysValAspPhe420425SerGinTyrAspAsp430GinLysAsnGluThrSerThrGinThrHisValSerAlaGinAspSerlieArgAsnAsn445GlyTyrAspSerLysAspGinLeuProProGluThrThr450AspGluProLeuGluLys"5470CysPheLeuMetGinAsp485ThrHisArgSerValAsp455460AlaTyxSerHisGinLeuAsnTyrAlaGlu475480ArgArgGlyThrlieProPhePheThrTrpLyslie490PhePheAsnThr工leAspAla500505ThrGinLeuProValValLysAlaTyr515520lielieGluGlyProGlyPheThrGly530535GluSer5erAsnSerlieAlaLysPhe545550AlaLeuLeuGinArgTyrArgValArg5SSGlu510AlaLeuSerSerS25GlyAsnLeuLeu540GlyAlaSerPheLeuLysLyslie570AsnLeuArgLeuPheVal580GinAsnSerAsn585valThrLeuAsn555ArgTyrAlaSerAsnAspPheLeu530SerAlaThrThr575VallieTyrlieAsnS9SPheAspLeuAsnGluLeu625LysThxMetAlaThrThrlieTyrlieAspLyslieGly630lieGluAsnLysAspAspAspLeuThrTyrS0060SAsnSerAsnMetGlyPheSerGly"5620AlaGluserPheValSerAsnGlu635Phe工leProValGinLeuG3_nThrAspLysLyslie"0(2)序列编号45的信息:U)'序列特征(A>长度1959碱基对(B类型核苷酸(Cl链的性质单链(D)拓朴学线性特征(A)(B)名称/关键词CDS定位1.(xi>序列描述序列编号45:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGG丁TACACCT48MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrProIS1015AACAGTGAATTGCAAACTAACCATAATCAATATAsnSerGluLeuGinThrAsnHisAsnGinTyr2025CCTTTAGCTGACAATProLeuAlaAspAsn3096CCAAA丁TCAACACTAGAAGAATTAAATTATAAAProAsnSerThrLeuGluGluLeuAsnTyrLys3540GAATTTTTAAGAATGGluPheLeuArgMet45144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACTCTACAGTAAAAGATThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp505560192GCAGTTGGGACAGGAATTTCTGTTGTAGGGAlaValGlyThrGlyUeSerValValGly6570CAGATTTTAGGTGTTGTAGinlielieuGlyValVal7580240GGAGTTCCATTTGCTGGGGCACTCACTTCAGlyValProPheAlaGlyAlaLeuThrSer8590TTTTATCAATCAPheTyrGinSerTTTPhe95CTTLeu288AACACTAsnThrATAlieTGGTrp100CCAAGTProSerGATAspGCTAlaGACAsp105CCATGGProTrpAAGGCTAlaTTTATCGCAPheMetAla110336CAAGTTGinValGAAGlu11SGTAvalCTGATAlieGATAspLys120AAALysATAlieGAGGluGAGGluTATTyr125GCTAlaAAAAGTLysSer384AAAGCTLysAla130CTTLeuGCAAlaGAGGluTTALeuCAGGin13SGGTCTTCAAGinAATAsiiAATAsn"0TTCPheGAAGluGATAspTAT432GTT14SAATAsnGCGAlaTTALieuAATAsnTCCSer150TGGTrpAAGLysAAALysACAThrCCTPro155TTALeuAGTS白rTTGCGAArgAATAsn160480CCAProCACHisAGCSerCAAGinGGTGly1SSCGAArgATAlieAGGArgGAAGluCTTlieu170TttPheTCTSerCAAGinGCAAlaGAAGlu17SAGTSer528CATHisTTTPheCGTAAT180TCCSerMetProTCASerTTTPhe185GCAAlaGTTValTCCSerAAALysTTCPhe190GAAGluGTGVal57SCTGLeuTTTPheCTALeu195CCAACAProThrTATGCATyrAlaCAAGin200GCTGCAAlaAlaAATAsnACAThrCATHis20STTAlieuTTGLeuCTAL>eu624TTAAAA210GATAspGCTCAAAlaGinGTTTTTVslPhe215GGAGlyGAAGAAGluGluTGGTrpGGAGly220TATTyrTCTSerTCASerGAA672GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAATAC720AspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyr225230235240ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg245250'255768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu2S026527081SATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsp275280285864ATTCGGTTATACTCAAAAGGGG丁TAAAACAGAACTAACAAGAGACATTlieArgLeuTyrSerLysGlyValLysThrGluLeuThrArgAsplie2S0295300912TTTACGGATCCAATTTTTTCACTTAATACTCTTCAGGAGTATGGACCAPheThrAspProliePheSerLeuAsnThrLeuGinGluTyrGlyPro305310315320960ACTTTTTTGAGTATAGAAAACTCTATTThrPheLeuSerlieGluAsnSerlie325CGAAAACCTCATTTATTTGATArgLysProHislieuPheAsp3303351006TATTTACAGGGGATTGAATTTCATACGTyrLeuGinGlylieGluPheHisTh;r340345CGTCTTCAACCTGGTTACTTTArgLeuGinProGlyTyrPhe3501056GGGAAAGATTCTTTCAATTATTGGTCTGlyLysAspSerPheAsnTyrTrpSer3553S0GGTAATTATGTAGAAACTAGAGlyAsnTyxValGluThr*Arg3551104CCTAGTATAGGATCTAGTAAGACAATTProSerlieGlySerSerLysThrlie370375ACTTCCCCATTTTATGGAGATThrSerPr6PheTyrGlyAsp3801152AAATCTACTGAACCTGTACAAAAGCTAI*ysSerThrGluProVal<51nLysLeu38S390AGCTTTGATGGACAAAAAGTTSerPheAspGlyGinLysVal39S4001200TATCGAACTATAGCTAATACAGACGTATyrArgThrlieAlaAsnThrAspVal405GCGGCTTGGCCGAATGGTAAGAlaAlaTrpProAsnGlyLys4104151248OTATATTTAGGTGTTACGAAAGTTGATValTyrLeuGlyValThrLysValAsp420425TTTAGTCAATATGATGATCAAPheSerGinTyrAspAspGin4301296AAAAATGAAACTAGTACACAAACATATLysAsnGluThrSerThrGinThrTyr05"0GATTCAAAAAGAAACAATGGCAspLysArgAsnAsnGly4451344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACA1332HissValSerAlaGinAspSerlieAspGinLeuProProGluThrThr4S04S5"0GATGAACCACT丁GAAAAAGCATATAGTCATCAGCTTAATTACGCGGAAAspGluProLeuGluLysAlaTyrSerHisGinLeuAsnTyrAlaGlu4654704754801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGCysPheLeuMetGinAspArgArgGlyThrlieProPhePheThrTrp48S49049S1488ACACATAGAAGTGTAGACTTTTTTAATThrHisArgSerValAspPhePheAsn500505ACAATTGATGCTGAAAAGATTThrlieAspAlaGluLyslie5101536ACTCAACTTCCAGTAGTGAAAGCATATThrGinLeuProValValLysAlaTyrS15520GCCTTGTCTTCAGGTGCTTCCAlaLeuSerSer*GlyAlaSer5251584ATTATTGAAGGTCCAGGATTCACAGGAlielieGluGlyProGlyPheThrGlyS3053SGGAAATTTACTATTCCTAAAAGlyAsnLeuLeuPheLeuLys5401632GAATCTAGTAATGluSerSerAsn545TCAATTGCTAAATTTAAAGTTACATTAAATTCAGCASerlieAlaLysPheLysValThrLeuAsnSerAlaS505555S01680GCCTTGTTACAAAlaI^uLeuGinCGATATCGTGTAAGAATACGCTATArgTyrArgValArglieArgTyr565570GCTTCTACCAlaSerThr575ACTThr1728AACTTACGACTTAsnLeuArglieu580TTTGTGCAAAATPheValGinAsnTCAAACSerAsn585AATGATAsnAspTTTCTTGTCPheLeuVal530ATClieTACTyrATTlieAATAAAAsnLys595ACTATGThrMe仁AATAAA600GATGATAspAspGATTTAAspLeuACATATCAAThrTyrGin605ACAThr1824TTTPheGATAspS10CTCGCALeuAlaACTACTThrThrAATSISTCTAATATGAsnMetGG<3TTCGlyPheS20TCGGGTGATSerGlyAspAAG1B72AATAsn625GAAGluCTTATALeu工leATAGGAlieGly630GCAAlaGAAGluTCTTTCOTTTCTValSer635AATGAAAAAAsnGluLysATClie6401920TATTyrATAlieGATAAGAspLysATAGAAlieGluS4STTTATClieCCAGTAProVal"0CAATTGGinLeuTAA1959(2)序列编号46的信息(i)序列特征(A〉长度652个氨基酸<formula>formulaseeoriginaldocumentpage312</formula>Met丁hrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsp275280285lieArgLeuTyrSerLysGlyValLysThrGluLeuThrArgAsplie230295300PheThrAspProliePheSerLeuAsnThrLeuGinGluTyrGlyPro31S320ArgLysProHisLeuPheAsp330335ArgLeuGinProGlyTyrPhe350305ThrPhelieuSerlie325310GluAsnSerlieTyrlieuGinGlylie340GluPheHisThr345GlyLysAsp355ProSerlie370LysSerThr365TyrArgThrSerPheAsnTyrTrpSerGlyAsnTyr360GlySerSerLys375ThrlieThrSerPro380GluProValGin390LysLeuSerlieAlaAsnThrAspValAla405410PheAsp395AlaTrpValGluThrArgPheTyrGlyAspGlyGinLysVal400ProAsnGlyLys415ValTyrLieuGlyValThrLysValAspPhe420LysAsnGluThr43SHisValSerAla450AspGluProLeu"5CysPheLeuMet425SerThrGinThrTyrAsp440ThrHisArgSer500ThrGinLeuPro51SlielieGluGlyS30GluSerSerAsn545GinAspSerlie455GluLysAlaTyr470GinAspArgArg485ValAspPhePheValValLysAla520ProGlyPheThrS3SSerlieAlaL<ys550AspGinSerHisGlyThr490AsnThr505TyrAlaSerGinTyrAsp430SerLysArgAsn445LeuProProGluGinLeuAsnTyr47SAspGinAsnGlyThrTharAlaGlu480lieProPhePheThrTrp495lieAspAlaGlu510LeuSerSerGlyS25GlyGlyAsnLeuLeuPheS40Phet*ysValThrLeuAsn555Lys工leAlaSerLeuLysAla560AlaLeuLeuGinAxgTyrArgValArglieArgTyrAlaSerThrThr565570575AsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallie580585530Tyr*PheAsn625Tyr(2)lieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr59S60060SAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610615620GluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie630S35lieAspLyslieGluPhelieProValGinLeu"5650序列编号47的信息(i>序列特征(A)长度1959^i^对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性640特征(A>名称/关键词CDS(B)定位1..1956(xi)序列描迷序列编号47:ATGAATMetAsnCCAProAACAATAsnCGASerGAAGluCATGATACGHisAspThr10ATAAAGGTTlieLysValACAThr15CCTPro48AACAGTAsnSerGAAGluTTGLeu20CAAGinACTThrAACCATHisAATCAATATAsnGinTyr25CCTTTAGCTProLeuAla30GACAspAAT96CCAAATProAsnSet135ThrCTALeuGAAGluGAAGluTTAlieu40AATTATAAAAsnTyrLysGAATTTTTAGluPheI>euAGAATG144ACTGAAThrGlu50GACAspSer*TCTSerACGThrGlu55GTGCTAGACAACLeuAspAsnTCTACAGTASerTharVal60AAAL*ysGATAsp192GCAGTTAlaVal65GGGGlyACAGGAGlyATTlie70TCTGTTValGTAGGGCAGValGlyGin7SATTTTAGGTlieLeuGlyGTTValGTAVal80240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATCAATCATTTCTTGlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu2889095AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCAAsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla100105110336CAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTGinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSer115120125384AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCljysAlaLeuAlaGluLeu130GinGlyLeuGin135AsnAsnPhe140GAAGATGluAspTATTyr432GTTAATGCGTTAAATTCCValAsnAlaLeuAsnSer"5150TGGAAGAAAACATrpI*ysLysThrCCTTTAAGTProLeuSer1S5TTGLeuCGAArgAGTSer160480AAAAGAAGCCAALysArgSerGinGATCGAATAAGGGAACTTAspArglieArgGluLeu165170TTTTCTCAAGCAPheSerGinAlaGAAAGTGluSer175528CATTTTCGTAATTCCATGHisPheArgAsnSerMet180CCGTCATTTGCAProSerPhe185AlaGTTTCCAAATTCValSerLysPhe130GAAGTGGluVal576CTGTTTCTACCAACATATGCACAAGCTLeuPheLeuProThrTyrAlaGinAla195200GCAAATACACATTTATTGCTAAlaAsnThrHisLeuLeuLeu205S24TTAAAAGATGCTCAAGTTTTTGGAGAALeuLysAspAlaGinValPheGlyGlu210215<3AATGGGGATATGluTrpGlyTyr220TCTTCAGAASerSer*GluS72GATGTTAspVal225GCTGMAlaGluTTTTATPheTyr230CATHisAGACAAGinTTALeuAAACTTACALysI>euThr235CAAGinCAATACGinTyr240720ACTGACThrAspCATTGTHisCysGTTAATValAsn245TGGTrpTATTyrAATAsnGTTVal250GGATTAAATGlyLeuAsnGGTGlyTTAAGALeuArg255768GGTGlyTCASerACTThrTATTyr260GATGCAAspAlaTGGTrpValAAALys265TTTPheAACCGTTTTAsnArgPheCGC270AGAGAAArgGlu816ATGMetACTThrTTAlieu275ACTThrGTATTAValLeuGATAspCTALieu280ATTlieGTAValCTTTTCCCAI*euPhePro285TTTPheTATGATTyrAsp8S4GTTCGG290TTATACTyrCCAAAAProLysGGGGly235GTTValAAALysACAThrGAACTAACAGluLeuThr300AGAGACATTAsplie912TTTACGGATCCAATTTTTTCACTTAATACTCTTCAGGAGTATGGACCAPheThrAspPro工lePheSerLeuAsnThrLeuGinGluTyrGlyPro305310315320ACTTTTTTGAGTATAGAAAACTCTATTCGAAAAThrPheLeuSer工leGluAsnSerlieArgLys32S330CCTCATTTATTTGATProHisLeuPheAsp3351008TATTTACAGGGGATTGAATTTCATACGCGTCTTTyrLeuGinGly工leGluPheHisThrArgLeu340345CAACCTGGTTACTTTGinProGlyTyrPhe3501056GGGAAAGATTCTTTCAATTATTGGTCTGGTAATGlyLysAspSerPheAsnTyrTrpSerGlyAsn3SS3S0TATGTAGAAACTAGATyrValGluThrArg3S51104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCAProSerlieGlySerSerLysThrlieThtrSet"Pro370375380TTTTATGGAGATPheTyrGlyAsp1152AAATCTACTGAACCTGTACAAAAGLysSerThrGluProValGinLys385390CTAAGCTTTGATGGACAAAAAGTTLeuSer*PheAspGlyGinLysVal3954001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys4054104151248GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyrLeuGlyValThrLysVa丄AspPhe42042SSerGinTyrAspAspGin430AAAAATGAALysAsnGlU435ACTAGTThrSerACACAAThrGinACATATGATThrTyrAsp440TCAAAAAGAAACAATGGCSerLysArgAsnAsnGly4451344CATHisVal450SerAlaGinGATTCTAspSer455ATTlieGACCAAAspGinTTACCGLeuPro4S0CCAGAAACAProGluThrACAThr1392GATAsp465GAAGlUCCAProCTTGAALeuGluAAAGCALrysAla470TATTyxAGTCATSerHisCAGCTTGinLeu47SAATTACGCGAsnTyrAlaGAAGlu4801440TGTCysTTCPheTTALeuATGCAGMetGlxi48SAspCGTCGTArgGGAACAGlyThr490ATTCCAlieProTTTTTTACTPhePheThr495TGGTrp1488ACAThrCATHisAGAAGTGTASerVal500GACAspTTTPheTTTPheAATACAAsnThr505ATTGATlieAspGCTGAAAAGAlaGluI*ys510ATTlie1536ACTThrCAAGinCTTLeuSISCCAGTAProValOTGValAAAL<ysGCAAla520TATGCCTyrAlaTTCiTCTLeuSerTCAGGTGCTSerGlyAla525TCCSer1584ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys530S35S40GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAla5455505555601680GCCTTCTTACAACGATATCGTGTAAGAATACGCTATAlaLeuLeuGinArgTyrArgValArglieArgTyx565570GCTTCTACCACTAlaSerThrThr5751728AACTTACGACTTTTTGTGCAAAATTCAAACAATGATAsnLeuArgLeuPheValGinAsnSerAsnAsnAsp58058STTTCTTGTCATCPheLeuVal工le590177STACATTAATAAAACTATGAATAMGATGATGATTyrlieAsn1^ThrMetAsnLysAspAspAsp595600TTAACATATCAAACALeuThrTyrGinThr6051824TTTGATPheAsp610CTCGCAACTACTAATTCTAATATGGGGLeuAlaThrThrAsnSerAsnMetGlySISTTCTCGGGTGATAAGPheSerGlyAsplysS201872AATGAACTTATAATAGGAGCAGAATCTTTCGTTAsnGluLeulielieGlyAlaGluSerPheVal625630635TCTAATGAAAAAATCSerAsnGluLyslie1920TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAATyrlieAspLyslieGluPhelieProValGinLeu64S£SO"S3(2序列编号48的信息《i)序列特征(A)长度652个氨基酸(B>类型氨基酸(D)拓朴学线性Ui)分子类型蛋白质(xi>序列描迷序列编号48:MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro1015AsnSerGluLeu20GinThrAsnHisAsnGinTyrProLeuAlaAspAsn2530ProAsnSerThr35LeuGluGluLeuAsnTyrl*ysGluPheLeuArgMet4045ThrGluAspSerSerThrGluSO55ValLeuAspAsnSerThrValLysAsp60AlaValGlyThrGlylie6570ServalValGlyGinlieGlyvalVal7580GlyValProPheAlaGlyAlaLeu85AsnThrjle丁rpProSerAspAla100GinValGluValLeulieAspLys115120LysAlaLeuAlaGluLeuGinGiy130135ValAsnAlaLeuAsnSerTrpLys145150LysArgSerGinAspArglieArg165ThrSerPheTyrGinSerPheLeu'9095AspProTrpLysAlaPheMetAla105110LyslieGluGluTyrAlaLysSer125I>euGinAsnAsnPheGluAspTyr140laysThrProLjeuSerLeuArgSer155160GluLeuPheSerGinAlaGluSer170175HisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal180185190LeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu155200205LeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSet"Glu210215220AspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyr22S230235240ThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg2452502S5GlySerThrTya:AspAlaTrpValLysPheAsnAxgPheArgArgGlu2"265270MetThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsp2*75280285ValArgLeuTyrProLysGlyValLysThrGluLeuThrArgAsp工le230295300PheThrAspProliePheSerLeuAsnThrLeuGinGluTyrSlyPro305310315320Thr*PheLeuSerlieGluAsnSerlieArgLysProHisLeuPheAsp325330335TyxLeuGinGlylieGluPheHisThrAxgLeuGinProGlyTyrPhe340345350GlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg3S5..3S03S5ProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp"037S380LysSerThrGluProValGinLysLeuSerPheAspGlyGinLysVal385390TyrArgThrlieAlaAsnThr405ValTyrLeuGlyValThrLys420LysAsnGluThrSerThrGin435HisValSerAlaGinAspSer45045S"5秦AspValAlsAlaTrpProAsnGlyLysValAspPheSerGinTyrAspAspGin425430ThrTyrAspSerLys440lieAspGinLeuPro460AspGluProLeuGluLysAlaTyrSerHisGinlieu465470475ArgAsnAsnGlyProGluThrThrAsnTyrAlaGlu480CysPheLeuMetGinAspArgArgGlyThrlieProPhePheThrTrp485490495ThrHisArgSerValAspPhePheAsnThr工leAspAlaGluLyslie500505S10ThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSer515520525lielieGluGlyPro<31yPheThrGlyGlyAsnXjcuLeuPheLeuLys530GluSer*SerAsn54SSerlie550AlaLeuLeuGinArgTyr565AsnUeuArgTyrL>euS30PheValPhe625工leAsn59SAspLeu610LysThrMetAlaThrThr535AlaLysPheLysArgValArglieS70GinAsnSei:AsnAsnLysAspAsp600AsnSerAsnMetS15540ValThrLeuAsnSerAla555560ArgTyrAlaSerThrThr575AsnAspPheLeuVallieS90AspLeuTharTyrGinThr605GlyPheSerGlyAspL*ys620GluLeulielieGly"0TyrlieAspLyslieGlu645《2)序列编号49的信息AlaGluSerPheValSerAsnGluLysIl色S35640PhelieProValGinLeu650(i>序列特征(A)长度19594对(B)类型核苷酸<C)链的性质单链(D)拓朴学线性(ix)特征:(A)(B)名称/关键词CDS定位1,(x丄)序列描迷序列编号49:ATGAATCCAMCAATCGAAGTGAACATGATACGATAAAGGTTACACCTMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro1510IS48AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTAsnSerGluLeuGin20ThrAsnHisAsnGin25TyrProLeuAla30GACAspAATAsn96CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet354045144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACTCTACAGTAAAAGATThrGluAspSerSer*ThrGluValLeuAspAsnSerThrValI>ysAspSO5560192GCAGTTGGGACAGGAATTTCTGTTGTAGGGCAGATTTTAGG'AGTTGTAAlaValGlyThrGlylieSerValValGlyGinlieLieuGlyValVal65707580240GGAGTTGlyValCCAProTTTGCTPheAla85GGGGCACTCACTGlyAlaLeuThr:TCASer90TTTTATCAAPheTyrGlxiSerTTTPhe95Lieu288AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCAAsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla10010511033SCAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTGinVaiGluValLeulieA印LysLyslieGluGluTyrAlaLysSer115120125384AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATLysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135"0432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAATValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgAsn1"ISO15S160480CCACACProHisAGCSerCAAGGTGinGly165CGAATAAGGGAAArglieAxgGluCTTLeu170TTTTCTCAAPheSerGinGCAGluSer17S528<formula>formulaseeoriginaldocumentpage321</formula>TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys40S4104151248GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin420425001296AAAAATGAAACTAGTACACAAACATATGATLysAsnGluThrSerThrGinThrTyrAsp435440TCAAAAAGAAACAATGGCSerLysArgAsnAsnGly4451344CATGTAAGTGCACAGGATTCTATTGACCAAHisValSerAlaGinAspSer工leAspGin4S0455TTACCGCCAGAAACAACALeuProProGluThrThr4601332GATGAACCACTTGAAAAAGCATATAGTCATAspGluProLeuGluLysAlaTyrSerHis4S5470CAGCTTAATTACGCGGAAGinLeuAsnTyrAlaGlu4754801440TGTTTCTTAATGCAGGACCysPheLeuMetGinAsp485CGTCGTGGAACAATTArgArgGlyThrlie490CCATTTTTTACTTGGProPhePheThrTrp4351488ACACATAGAW5TGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslie500505510ACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSer51552052S1534ATTATTlielie530GAAGGTCCAGGAGluGlyProGlyTTC535ACAGGAThrGlyGGAGlyAATTTACTALeuLeu540TTCPheCTAAAAGAATCTGluSer545AGTAATTCASerAsnSerATTlie5S0GCTAlaAAATTTUysPheAAAGTTVal555ACATTAThrLeuAATA3nTCAGCASerAlaSS01680GCCTTGAlaLeuTTACAACGALeuGinArgSS5TATTyrCGTArgGTAA(3AValArgATA570CGCArgTATGCTTyrAlaTCTSerACCACTThrThr5751723AACTTAAsnLeuCGACTTTTTArgLeuPhe580GTGValCAAGinAATTCAAsnSer585AACAsnAATAsnGATTTTAspPheCTTLeu590GTCATCVallie177STACATTTyrlieAATAAAACTAsnLysThr59SMetAATAAAGATL*ysAsp600GATAspGATAspTTAACALeuThr60STATTyrCAAACAGinThr1824TTTGATPheA曰p610CTCGCAACTLeuAlaThrACTThrAATSISTCTAATSerAsnATGMetGlyTTCTCGPheSerS20GlyGATAAGAspLys1372AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCAsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie625630S35S401920TATATAGATAAGATATyrlieAspI*yslieGAATTTATCCCAGTACAATTGTAAGluPhelieProValGinLeu1959(2)序列编号50的信息(i)序列特征(A)长度652个氨基酸(B>类型氨基酸(D》拓朴学线性(ii)分子类型蛋白质(xi>序列描迷序列编号50:MetAsnJProAsnAsnArgSerGluHisAspThrlieLysValThrProTyrProLeuAlaAspAsn3010AsnSerGluLeu20GinThrAsnHisAsnGin25ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet3540"ThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAspSOSS60AlaValGlyThrGlylieSerValValGlyGin工leLeuGlyValValS5707580GlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu859095AsnThrlieTrpProSerAspAla100GinValGluVallieulieAspLys115120LysAlaLeyAlaGluLeuGinGly130135ValAsnAlaLeuAsnSerTrpLys14SISOProHisSerGinGlyArglieArg165HisPheArgAsnSerMetProSer180AspProTrpl*ysAlaPheMetAla105110LyslieGluGluTyrAlaLysSer125LeuGinAsnAsnPheGluAspTyr140LysThrProLeuSerLeuArgAsn155160GluLeuPheSerGinAlaGluSer170175PheAlaValSerLysPheGluVal185190LeuPheLeuProThrTyrAlaGinAlaAla"5200LeuLysAspAlaGinValPheGiyGluGlu210215AspValAlaGluPheTyrHisAxgGinLeu22SThrAspHisCysVal245GlySerThrTyrAsp260MetThrLeuThrVal275ValArgLeuTyrPro290230AsnTrpTyrAsnThrHisLeuLeuLeu205.Trp<31yTyrSerSerGlu220LysLeuThrGinGinTyr23S240AsnVal250AlaTrpValL<ysPhe265GlyLeuAsnAsnArgPheGlyLeuArg25SArgArgGlu270lieuAsplieu280LysGlyVal295工leValLeuPhePro285LysThrGluLeu300PheTyrAspThrArgAsplie310LeuSer工leGluAsnSerlieArgLysProHis325GinGly工leGluPheHis340AspSerlieGlyThr*GluThrliePheAsnTyxTrpSerSerLysThr*375ProValGinLys390330ThrArg345SerGlyPheThrAspProliePheSerLeuAsnThr30SThrPheTyrLeu<3lyLysProSerLysSer3B5TyrArgValTyrLysAsnLeuGin315GluTyrGlyPro320LeuGly420GluThr43SAla405ValSerAsnThrAspThrLysValHisVal450AspGlu465SerAlaGinProLeuGluThrGinThr440AspSerlie455LysAlaTyr470CysPheLeuMetGinAspArgArg485UeThrlieuSerValAla410AspPhe425TyfAspAspGinSerHisGlyThr490lieuGinProAsnTyxVal365SerProPhe380PheAspGly395AlaTrpProSerGinTyxUeuPhe33SGlyTyr3S0AspPheGluThrArgTyrGlyAspGinLysAsnGly415AspAsp430400LysGinSerLysArg445LeuProPro4S0GinLeuAsn475lieProPheAsnAsnGlyGluThrThrTyrAlaPheThr"5Glu480TrpThrHisArgSerVal500ThrGinLeuProVal51SlielieGluGlyPro530GluSerSerAsnser545AspPhePheAsnThrlieAspAlaS05ValLysAlaTyrAlaLeuSerSerS20525ljeuGlyPhe535ThrGlyGlyAsnLeu540GluLyslie510GlyAlaSerPheLeuLys工leAlaLysPheLysValThr*550555AlaLeuLeuGinArgTyrArgValArglieArgTyr570AsnLeuArgLeuS80565PheValLeuAsnSerAla560AlaSerThrThr575GinAsnSerAsnAsnAsp585TyrlieAsnPheAspLeu510AsnGluLeu625LysThrMetAlaThrThrlieTyrlieAspLyslieGly630lieGlu"5AsnLysAspAspAspLeuThr600605AsnSerAsnMetGlyPheSer61SS20AlaGluSerPheValSerAsn635PhelieProValGinLeu650l^uVallie590TyrGinThrGlyAspLiysGluLyslie640(2>序列编号51的信息(i)序列特征(A)长度1956碱基对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性(i幻特征(A)名称/关鍵词CDS(B)定位1…1953(xi)序列描迷序列编号51:ATGAATCCAAACAATCGAAGTMetAsnProAsnAsnArgSerGAACATGATACGATAAAGGTTACACCTGluHisAspThrlieLysValThrPro101548AACAGTGAATTGCAAACTAACAsnSearGluLeuGinThr*Asn20CATAATCAATATCCTTTAGCTGACAATHisAsnGinTyrProLeuAlaAspAsn2S3096CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrLeuGluGluLeuAsnTyr*LysGluPheLeuArgMet354045144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACTCTACAGTAAAAGATThrGluAspSerSerThrGluVal5055LeuAspAsnSerThrValLysAsp60192GCAGTTGGGAlaValGlyACAGGAATTTCTGTTThrGlylieSerVal70GTAGGGCAGATTTTAGGTGTTGTAValGlyGinlieLeuGlyValVal7580240GGAGTTCCAGlyValProTTTGCTGGGGCACTCPheAlaGlyAlaLeu85ACTTCATTTTATCAATCATTTCTTThrSerPheTyrGinSerPheLeu3095288AACACTATAAsnThrlieTGGCCAAGTGAAGACTrpProSerGluAsp100CCATGGAA(3GCTTTTATGGCACAAProTrpLysAlaPheMetAlaGin105110336GTTGAAGTACTGATAValGluVal乙eulie115GATAAGAAAATAGAGAspLysLyslieGlu120GAGTATGCTAAAAGTAAAGluTyrAlaLysSerLys125384GCTCTTGCAGAGTTACAGGGTCTTCAAAATAlaLeuAlaGluLeuGinGlyLeuGinAsn130135AATTTCGAAGATTATGTTAsnPheGluAspTyrVal140432AATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTAAAAsnAlaLeuAsnSerTrpLysI*ysThrProLeuSer*LeuArgSerLys145150155ISO480AGAAGCCAAArgSerGinGATCGAATAAGGAspArglieArg165GAACTTTTTGluLeuPhe170TCTCAAGCAGAASerGinAlaGluAGTCATSerHis175528TTTCGTAATPheArgAsnTCCATGCCGTCASerMetProSer180TTTGCAGTTTCCAAATTCGAAGTGCTGPheAlaValSerLysPheGluValLeu18S190S7STTTCTACCAPheLeuPro195ACATATGCACAAThrTyrAlaGinGCTGCAAATACACATTTATTGCTATTAAlaAlaAsnThrHisLeuLeuLeuLeu200205624AAAGATGCTLysAspAla210CAAGTTTTTGGAGinValPheGly21SGAAGAATGGGluGluTrpGGATAT.TCTTCAGlyTyr*SerSer220GAAGATGluAsp672GTTGCTGAAValAlaGlu22STTTTATCATAGAPheTyrHisArg230CAATTAAAAGin!>euLysCTTACACAACAALeuThrGinGin235TACACTTyrThr240720GACCATTGTAspHisCysGTTAATTGGTATValAsnTrpTyr245AATGTTGGAAsnValGly250TTAAATGGTTTALeuAsnGlyLeuAGAGGTArgGly255768TCAACTTATGATGCATGGG*TCAAATTTAACCGTTTTCGCAGAGAAATGSerThrTyxAspAlaTrpValLysPheAsnArgPheArgArgGluMet2S026S270816ACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATATTThrLeuThrVall>euAspLeulieValLeuPheProPheTyrAsplie275280285864CGG丁TATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTTTTArgLeuTyrSerLysGlyValiysThrGluLeuThr*ArgAspliePhe290295300312ACGGATCCAATTTTTTCACTTAATACTCTTCAGGAGTATGGACCAACTThrAspProliePheSerLeuAsnThrLeuGinGluTyrGlyProThr305310315320960TTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATTATPheLeuSerlieGluAsnSer*lie325ArgLysProHisLeuPheAspTyr3303351008TTACAGGGGATTGAATTTCATACGLeuGinGlylieGluPheHisThr340CGTCTTCAACCTGGTTACTTTGGGArgLeuGinProGlyTyrPheGly3453501056AAAGATTCTLysAspSer355TTCPheAATTATAsnTyrTCT3€0GGTAATTATGlyAsnTyrGTAValGAAACTGluThr3"AGAArgCCTPro1104AGTSerATAGGAlieGly370TCTSet"AGTAAGSerLysACAThr375ATT工leACTTCCThrSerCCAProTTTPhe3B0TATTyrGGAGlyGATAspAAALys1152TCTSer385ACTThrGAAGluCCTProGTACAAValGin390AAGLysCTALieuAGCTTTSerPheGATAsp395GGACAAGinAAAGTTValTATTyr4001200CGAACTThrATAlieGCTAlaAATACAAsnThr405GACAspGTAValGCGGCTAlaAla410TGGTipCCGProAATGlyAAGLys415GTAVal1248TATTyrTTAGGTGlyGTTVal420ACGAAAGTTValGATAspTTTAGTPheSer*425CAAGinTATTyrGATAspGATAsp430CAAGinAAALys1296AATAsnGAAGluACTThr435SerACACAATheGinACAThrTATTyr440GATTCAAspSerAAAAGAAACAsn445AATAsilGGCGlyCATHis1344GTAValAGTSer450GCAAlaCAGGinGATTCTAspSerATTlie45SGACAspCAATTAGinLeuCCGProCCAPro4S0GluACAThrACAThrGATAsp1392GAAGlu4SSCCAProCTTGAAGluAAAGCALysMa470TATTyrAGTCATCAGHisGinerrLeu475AATAsnTACTyrGCGAlaGAAGluTGTCys480TTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGACA"88PheLeuMetGinAspArgArgGlyThrlieProPhePheThrTrpThr48S490495CATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTACT1536HisArgSerValAspPhePheAsnThrlieAspAlaGluLyslieThrS0050S510CAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCATTGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlsSerlieSISS2052SATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAGAAlieGluGlyProGlyPheThrGlyGlyAsnI*euLeuPheLeuLysGlu5305355401632TCTAOTAATTCAATT<3CTAAATTTAAAGTTACATTAAATTCAGCAGCC1680SerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAlaAla5455S0S55560TTGTTACAACGATATCGTGTAAGAATACGCTATGCTLeuLeuGinArgTyrArgValArglieArgrTyrAlaSS5570TCTACCACTAACSerThr*ThrAsn5751728TTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCTACLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallieTyrS80SBS5901776ATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATTTlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGl:.ThrPhe5356006051824GATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGAAT1872AspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLysAsn610615620GAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCTAT1920GluLeulielieGlyAlaGluSerPheValSerAsnGluLyslieTyr625630635640ATAGATAAGATAlieAspLyslieGAAGluTTTPheATCCCAlieProGTACAAValGin"0TTGLeu1356(2)序列编号52的信息(i)序列特征长度651个氨基酸(B)类型氣基酸(D)拓朴学线性(i"分子类型蛋白质(xi序列描迷序列编号52:MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro<formula>formulaseeoriginaldocumentpage329</formula>ThrAspProliePheSerIjeuAsnThrLeuGinGluTyrGlyProThr305310315320PheLeuSerlieGluAsnSerlieArgLysProHisLeuPheAspTyr32S330335LeuGinGly工leGluPheHisThrArgLeuGinProGlyTyrPheGly34034S350LysAspSerPheAsnTyrTrpSerGlyAsiiTyrValGluThrArgProSerlie370SerThr385ArgThr355GlySerSerLysGluProValTyrIeulieAlaAsn405GlyValThr420Gin390Thr360ThrlieThr375LysLeuSerAspValAlaSerProPheAsp39S365PheTyrGlyAspLys380GlyGinLysValTyr400LysValAspPhe425AlaTrpProAsnGlyLysVal410415SerGinTyrAspAspGinLys430AsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGlyHis435440445ValSerAlaGinAspSerlieAspGinIjeuProProGluThrThrAsp455460TyrSerHisGinLeuAsnTyrAlaGluCys475480ArgGlyThrlieProPhePheThrTrpThrPheAsnThrlieAspAlaGluLyslieThrSOS510AlaTyrAlaLeuSerSerGlyAlaSerlie520S25ThrGlyGlyAsnLeuLeuPheLeuI*ysGlu535540LysPheLysValThrLeuAsnSerAlaAla555560ValArglieArgTyxAlaSerThrThrAsn570S75AsnSerAsnAsnAspPheLeuVal工leTyr585S90LysAspAspAspI>euThrTyrGinThrPhe6D0605450GluProLeuGluLysAla4SS47一PheLeuMetGinAspArgHisArgSerValAspPhe500GinLeuProValValLysS15lieGluGlyProGlyPheSerSerAsnSerlieAlaS4SSS0LeuLeuGinArgTyrArgLeuArgLeuPheValGin580工leAsnL*ysThrMetAsn595Asp乙euAlaThrThrGluLeulielieGlylieA曰pLyslieGlu"5(2>序列编号53的信息(i)AsnSerAsnMetGlyPheSerGlyAspLysAsn"5620AlaGluSerPheValSerAsnGluLyslieTyr630S35"0PhelieProValGinLeu6S0序列特征(A)长度1的9碱基对(B)类型核苷酸(C>链的性质单链(D)拓朴学线性(ix)特征:(A>(B)名称/关键词CDS定位1…19"(5Ci).序列描述:序列编号53:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCTMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro15101548AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHisAsnGinTyxProLeuAlaAspAsn202S3096CCAAATProAsnTCASer35ACAThrCTALeuGAAGluGAAGluTTAAATTATlieuAsnTyr40AAAGAATTTGluPhe45TTALeuAGAATGArgMet144ACTGAAThrGlu50GACAspAGTSerTCTSerACGGAAGlU55GTGCTAGACValLeuAspAACTC丁ACASerThr60GTAValAAAGATLysAsp192GCAGTTAlaVal65GGGGlyACAThrG(3AGlyATTlie70TCTSerGTTGTAGGGValValGlyGin75ATTTTAlieLeuGGTGlyGTTGTAValValBO240GGAGTTGlyValCCAProTTTPheGCTAla85GGGGlyGCAAlaCTCACTTCALieuThrSer90TTTPheTATCAATyrGinTCASerTTTCTTPheLeu35238AACACTAsnThrATAlieTrp100CCAProAGTGATAspGCTGACCCAAlaAspPro105TGGTrpAAGGCTLysAlaTTTPhe110ATGGCAMe仁Ala336CAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGT384GinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSerUS12012SAAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATIiysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr*130135140432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArg14SISO1SSAGTSerISO480AAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTCAAGCAGAAAGTLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer165170175528CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCGGATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerGlyPheGluVal180185190576CTGTTTCTACCAACATATGCACAAGCTGCALeuPheLeuProThrTyrAlaGinAlaAla195200AATACACATTTATTGCTAAsnThrHisLeuLeuLeu205S24TTAAAAGATGCTLeuLysAspAla210CAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAAGinValPheGlyGluGluTrpGlyTyrSerSerGlu21S220672GATGTTGCTGAAAspValAlaGlu225TTTTATCATAGACAATTAAAACTTACACAACAATACPheTyrHisArgGinljeuLysLeuThrGinGinTyr230235240720ACTGACCATTCTGTTAATTGGT广AATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg245250255768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu260265270816ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuAspLeulieValLeuPheProPheTyxAsp27523028S864ATTCGGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTlieArgLeuTyrSerLysGlyValLysThr*GluLeuThrArgAsplie290235300912TTTACGPheThr305GATAspCCAProATTlieTTTPhe310TCAerrAATACTThrCTTX*eu315CAGGAGTATGGAGinGluTyrGlyCCAPro320960ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATThrPheLeuserlieGluAsnSerlieArgLysProHisLeuPheAsp3253303351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGOTT7VCTTTTyrLeuGinGlylieGluPheHisThrArgLeuGinProGlyTyrPhe3403453S0GGGAAAGATTCTTTCAATTATTGGTCTGGTAATTATGTAGAAACTAGAGlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg3553603651104CCTAGTATAGGATCTProSer工leGlySer370AGTAAGACAATTACTTCCCCATTTTATGGAGATSerLysThrlieThrSerProPheTyrGlyAsp3753801152AAATCTACTGAACCTLysSer*ThrGluPro3B5GTACAAAAGCTAAGCTTTGATGGACAAAAAGTTVal<31nLysLieuSesrPheAspGlyGinlysVal3903954001200TATCGAACTATAGCTTyrArgThrlieAla405AATACAGACGTAGCGGCTTGGCCGAATGGTAAGAsnThrAspValAlaAlaTrpProAsnGlyLys4104151248GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATValTyrLeuGlyVal420ThrLysValAspPhe42SSerGinTyrGATGATCAAAspAspGin4301296AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly4354404451344CATGTAAGTHisValSer450GCAAlaCAGGinGATTCTAspSer4S5ATTlieGACCAAAspGinTTACCGLeuPro460CCAGAAACAACAProGluThrThr1392GATAsp465GAACCAGluProCTTIjeuGAAGluAAAGCALysAla470TATTyrAG丁CATSerHisCAGCTTGinLeu475AATTACGCGGAATyr*AlaGlu4801440TGTCysTTCTTAPheLeuATGMetCAGGin485GACCGTAspArgCGTGGAACAGlyThr490ATTCCAlieProTTTPheTTTACTTGGPheThrTrp435148BACAThrCATAGAHisArgAGTSer500GTAGACTTTAspPheTTTPheAATACAAsnThr505ATTGATlieAspGCTAlaGAAAAGATT<3luLyslie510ACTThrCAACTTGinLeuS15CCAProGTAValGTGAAAValLysGCAAla520TATGCCTyrAlaTTGTCTLeuSerTCASer525GGTGCTTCCGlyAlaSer1584ATT工leATTGAAGGTlieGluGly530CCAProGGATTCGlyPhe535ACAThrGGAGGAGlyGlyAATTTAAsnLeu540CTALeuTTCCTAAftAPheLeuLysGlu545TCTAGTAATserSerAsnTCASerATTGCTlieAlaS50AAALysTTTAAApheLysGTTACAValThrS55TTAAATTCAGCAAsnSerAla560GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACT1728<formula>formulaseeoriginaldocumentpage334</formula>115120125LysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135140ValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer"5150155"0LysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer165HisPheArgAsnSerMetProSerPhe180185lieuPhelieuLys210AspVsl225ThrAspGlySerMetThrlieArg290LeuProThrTyrAlaGinAla195200AspAlaGinValPheGlyGlu215AlaGluPheTyrHisArgGin230170175AlaValSerGlyPheGluValAlaAsnThrHisLeuLeuLeu205GluTrpGlyTyrSerSerGlu220LeuLysLeuThrGinGinTyr235240HisCysValAsnTrpTyrAsnVal245250GlyLeuAsnGlyLeuArg2S5Thr*TyrAspAlaTrplieuThrValLeuAsp27SLeuTyrSerLysGly29SValLysPhe2SSLeulieVal280ValLysThrAsnArgLeuPhePheThrAspProliePheSer305310ThrPheLeuSer*lieGluAsn325TyrLeuGinGlylieGluPhe340GlyLysAspSerPheAsnTyr355ProSerlieGlySer*SerLys37037SLysSerThrGluProValGin385390LeuAsnThrSerlieArg330HisThrArg345TrpSerGlyThrlieThr*LysLeuSerTyrArgThrlieAlaAsnThrAspValAla40S410GluLeu300LeuGin31SLysProL<euGinAsnTyrSerProPheAspAlaTrpPheArgArg270ProPheTyr28SThrArgAspGluTyrGlyHisLeuPhe335ProGlyTyr350ValGluThr365PheTyrGlyGlyGinLysProAsnGly415GluAspliePro320AspPheArgAspVal400LysValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin42042SLysAsnGluThrSerThrGinThrTyrAspSerLys435440HisValSerAlaGinAspSer工leAspGinLeuPro450455"0AspGluProLeuGluLysAlaTyrSerHisGinLeu470475CysPheUeuMet430ArgAsnAsnGly445.PiroGluThrThrAsnTyrAlaGlu一480GinAspArgArgGlyThrlieProPheThrHisArgSer500ThrGinLeuPro515lielieGluGly530485ValAspPhePheAsn50SValValLys'AlaTyr520ProGlyPheThrGly535430ThflieAspAlaAlaIjeuSerSer525GlyAsnLeuLeu540PheThrTrpGluLyslieGlyAlaSerPheLeuIjysGluSerSerAsnSerlie545550AlaLeuLeuGinArgTyr565AsnLeuArgLeuPheVal580TyrlieAsnLysThrMet535PheAspLeuAlaThrThr610AsnGluLeulielieGly625630AlaLysPheArgValArgLysVal555lieArg570ThrLeuAsnSerAla560GinAsnSer*AsnAsn585AsnLysAspAspAspAsnSerAsnMetGlyAlaGluSerPheValS35TyrAlaAspPheTyrlieAspLyslieGluPhelieProValGin"5550(2)序列编号55的信息(幻序列特征<A>长度1956碱基对(B)类型核苷酸(C》链的性质单链(D)拓朴学线性LeuThr60SPheSerSerAsnLeuSerThr*Thr575LeuVallie590'TyrGinThrGlyAspLysGluLyslie"0(ix)特征:(A>名称/关鍵词CDS(B>定位1..19S3(xi)序列描述序列编号55:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCTMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro101548AACAGTGAATTGCAAACTAsnSerGluLeuGinThr*20AACCATAATCAATATCCTTTAGCTGACAATAsnHisAsnGinTyrProLeuAlaAspAsn253096CCAAATTCAProAsnSer*3SACACTAGAAThrLeuGluGAATTAAATTATAAAGluLeuAsnTyrLys40GAATTTTTAGluPheI*eu45AGAATGArgMet1"ACT<3AAGACAGTTCTACGGAAGTGCTAGACAACTCTACAGTAAAAGATThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp50S5SO192GCAGTTGGGAlaValGlyACAGGAATTTCTGTTGTAGGGCAGATTTTAGGTGTTThrGlylieSerValValGlyGinlieLeuGlyVal707SGTAVal80240GGAGTTCCAGlyValProTTTGCTGGGPheAlaGly85GCACTCACTAlaLeuThrTCATTTTATSerPheTyr90CAAGinTCASerTTTPhe95C'TTLeu288AACACTATAAsnThrlieTGGCCAAGTTrpProSet:100GAAGACCCAGluAspPro105TGGAAGGCTTrpLysAlaTTTATGMet110GCAAlaCAAGin336GTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTAAAValGluValLeulieAspLysLyslieGluGluTyrAlaLysSerLys;U5120125384GCTCTTGCAAlaUeuAla130GAGTTACAGGluLeuGinGGTCTTCAAGly!LeuGin135AATAATTTCAsnAsnPhe140GAAGluGATAspTATGTTVal"2AATGCGTTAAsnAlaLeu145AATTCCTGGAsnSer*Trp150AAGAAAACAl*ysLysThrCCTTTAAGTProLeuSer155TTGLeuCGAAATCCAPro160480CACAGCCAAHisSerGinGGTCGAATAGlyArglie165AGGGAACTTArgGluLeuTTTTCTCAAPheSerGin170GCAAlaGAAGluAGTSer175CATHis528TTTCGTAATPheArgAsnTCCATGCCGSerMetPro180TCATTTGCASerPheAla185GTTTCCAAAValSerLysTTCPheGAAGlu130GTGValCTGLieuS7G丁TTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTATTAPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeuLeu624195200205AAAGATGCTCAAGTTLysAspAlaGinVal210TTTGGAGAAGAATGGGGATATTCTTCAGAAGATPheGlyGluGluTrpGlyTyrSerSerGluAsp215220672GTTGCTGAATTTTATValAlaGluPheTyr225CATAGACAATTAAAACTTACACAACAATACACTHisArgGinLeuLysLeuThrGinGinTyrThr23023S240720GACCATTGTGTTAATTGGAspHisCysValAsnTrp245TATAATGTTGGATTAAATGGTTTAAGAGGTTyrAsnValGlyLeuAsnGlyLeuArgGly25025S768TCAACTTATGATGCATGGGTCAAATTTAACSerThrTyrAspAlaTrpValLysPheAsn2S02"CGTTTTCGCAGAGAAATGArgPheArgArgGluMet270816ACTTTAACTGTATTAGA丁CTAATTGTACTTTTCCCATTTTATGATATTThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsplie275280285864CGGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTTTTArgLeuTyrSerLysGlyValLysThrGluLeuThrArgAspliePhe2902.95300912ACGGATCCAATTTTTTCACTTAATACTCTTCAGGAGTATGGACCAACTThrAspProliePheSerLeuAsnThrLeuGinGluTyrGlyProThr305310315320960TTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATTATPheI^euSer工leGluAr:SerlieArgLysProHislreuPheAspTyr32S3303351008TTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGOTTACTTTGGGLeuGinGlylieGluPheHisThrArgLeuGinProGlyTyrPheGly3403453501056AAAGATTCTTTCAATTATTGGTCTGGTAATTATGTAGAAACTAGACCTLysAspSerPheAsnTyrTrpSer*GlyAsnTyrValGluThrArgPro3S53603S51104AGTATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGATAAASer工leGlySerSerLysThrlieThrSerProPheTyrGlyAspLiys3703753801152TCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGTTTATSex*ThrGluProValGinLysLeuSerPheAspGlyGinIysValTyr3853903954001200CGAACTATAGCTAATACAGACGTAGCGGCTTGGCCOAATGGTAAGGTAArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLysVal4054104151248TATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAAAATyrL*euGlyValThrLysValAspPheSerGinTyrAspAspGinLys1296420425430AATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCCATAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGlyHis43S440"51344GTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAGATValSerAlaGinAspSerlieAspGinLeuProProGluThrThrAsp4504S5"01392GAACCAC丁TGAAAAAGCATATAGTCATCAGGluProLeuGluLysAlaTyrSerHisGin4SS470CTTAATTACGCGGAATGTLeuAsnTyrAlaGluCys475480"40TTCTTAATGCAGGACCGTCGTGGAACAATTPheLeuMetGinAspArgArgGlyThrlie485490CCATTTTTTACTTGGACAProPhePheThrTrpThr43S1488CATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTACTHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslieThrS00SOS510CAACTTCCAGTAGTGAAAGCATATGCCTTGGinLeuProValvalLysAlaTyrAlaLeu515520TCTTCAGGTGCTTCCATTSerSerGlyAlaSerlieS251584ATTGAAGGTCCAGGATTClieGluGlyProGlyPhe530ACAGGAGGAAATThrGlyGlyAsn535TTACTATTCCTAAAAGAALeuLeuPheLeuLysGlu540TCTAGTAATTCAATTGCTSerSerAsnSerlieAla545550AAATTTAAAGTTLysPhel*ysValACATTAAATTCAGCAGCCThrLeuAsnSerAlaAla5555601680TTGLeuTTALeuCAACGATATGinArgTyr565CGTGTAValAGAATAArglieArg570TATTyrGCTTCTAlaSerACCACTAACThrThrAsn5751728TTALeuCGAArgCTTTTTGTGLeuPheVal580CAAGinAATAsnTCAAACSerAsn585AATAsnGATAspTTTCTTPheL*euGTCATCTACVallieTyr5301776ATTlieAATAsnAAAACTATGLysThrMet595AATAsnAAAGATGATAspAsp"0GATAspTTALeuACATATThrTyrSOSCAAACATTTGinThrPhe1824GATAspCTCLeu610GCAACTACTAlaThrThrAsnTCTSer615AATATGAsnMetGGGGlyTTCPheTCGGGTSerGly620GATAAGAATAspLysAsn1872GAAGlu625CTTLeuATAATAGGA工lelieGlyGCAMa630GAAGluTCTTTCSerPheGTTValTCTSer635AATGAAAsnGluAAAATCTATLyslieTyr6401920ATAGATAAGATAGAATITATCCCAGTACAATTG.TAAlieAspLys工leGluPhelieProValGinLeu195S"56SO(2)序列编号56的信息(i)序列特征(A〉长度651个氛基酸(B>类型氨基酸(D)拓朴学线性(i幻分子类型蛋白质(xi)序列描迷:序列编号56:MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrProIS1015AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202S30ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet3S4045ThrGluAspSerSerThrGluValLeuAsp5055AlaValGlyThrGlylieSerValValGly6SGlyValProPheAla85AsnThrlieTrpPro100ValGluValLeulie11570GlyAlaLeuThrSer90SerGluProTrp105AsnSerThrValLysAspGOGinlieLeuGlyValVal7S80PheTyrGinSerPheI^u95LysAlaPheMetAlaGin110AspLysLys工leGluGluTyrAlaltysSerLys120125AlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr*Val130135140AsnAlaLeuAsnSerTrpLysLysThrProL*euSerLeuArgAsnPro145150155160HisSerGinGlyArglieArgGluLeuPheSerGinAlaGluSerHis165170175PheArgAsnSerMetProSerPheAlaValSerLysPheGluValLeu180185"0AlaGinAlaAlaAsnThrHisLeuLeuLeuLeu200205LysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGluAsp210215220ValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyrThrPheLeuProTheTyr135225230AspHisCysValAsnTrpTyrAsnVal24SSerThrTyrAspAlaTrpValLysPheThrLeuThrValLeuAspUeulieval275280235240GlyLeuAsnGlyLeuArgGly250255AsnArgPheArgArgGluMet270LeuPheProPheTyrAsplie28SArgLeuTyrSerLysGlyVal230295ThrAspProliePheSerLeu305310PheLeuSerlieGluAsnSer325LysThrGluLeuThrArgAsp300AsnThrLeuGinGluTyrGlylieArgLysProHisLeuPhe330LeuGinGlylieGluPheHisThr*ArgLeuGinProGlyTyr340345350UePheProThr320AspTyr33SPheGlyLeuSerPheProPhe380AspGly395LysAspSerPheAsnTyrTrpSerGlyAsnTyrVal355360Ser工leGlySerSerLysThrlieThrSer370375SerThrGluProValGinLys385390ArgThrlieAlaAsnThrAspTyrLeuGlyValThrLysValAspPhe420425AsnGluThrSerThfGinThrTyrAsp435440ValSerAlaGinAsp'Ser450GluThrArgPro3S5TyrGinGlyAspLysValAlaAlaTrpProAsnGly410SerGinTyr*AspAsp430SerLysArgAsrxAsn"5GluProLeuGluLysAla465470lie455TyrAspGinLieuSerHisGinProPro460LeuAsn475GluThrTyrAlaPheLeuMetGinAsp485ArgArgGlyThrlieProPhePheThr*430v.lTyr400LysVal415GinIiysGlyHisThrAspGluCys480TrpThr435HisAxgSerValAspPhePhe500GinLeuProValvalLysAlaSISAsnThrlieAspAlaGluLyslieThr505510TyrAlaLeuSerSerGlyAlaserlie520525lieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLysGluS3053SS40SerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAlaAla545550555560LeuLeuGinArgTyrArgValArg工leArgTyrAlaSerThrThrAsn565S70575lieTyrThrPheI*ysAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVal530lieAsnLys595AspLeuAlaGluLeulie625lieAspIjys580ThrMetAsnThrThrAsnLysAsp600SsrAsnS15585AspAspLeuThrlieGlyAlaGluSer630MetGlyPhePheValSer635Ser620Tyr*Gin605GlyAspGluLyslieTyr640lieGlu"5PhelieProValGinLeu650(2)序列编号57的信息(i)序列特征(A〉长度1956碱基对(B)类型核苷酸(C)链的性质单链(D》拓朴学线性(ix)特征(A>名称/关键词CDS(B定位1…"53(xi)序列描迷序列编号57:ATGAATCCAAACAATCGAAGTGAACATGATACGATAAAGGTTACACCTMetAsnProAsnAsnArgSerGluHisAspThrlieLysValThr*Pro1510IS48AACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATAsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn20253096CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet35404S144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACTCTACAGTAAAAGATThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAsp5055SO15>2GCAGTTGGGACAGGAATTTCTGTTGTAGGGCAGATTTTAGOTGTTGTAAlaValGlyThrGlylieSerValValGlyGinlieLeuGlyValVal"707S80240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATGlyValProPheAlaGlyAlaLeuThrSerPheTyr90CAATCATTTCTTGinSerPheLeu9S288AACACTATATGGCCAAGTGAAGACCCATGGAAGGCTAsnThrlieTrpProSerGluAspProTrpLysAla100105TTTATGPheMet110GCACAAAlaGinGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTAAAValGluValLeulieAspLysJLyslieGluGluTyrAlaLysSerLysUS12012S384GCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATGTTAlaLeuAlaGlviLeuGinGlyLeuGinAsnAsnPheGluAspTyrVal13013S140432AATGCGTTAAATTCCTGGAsnAlaLeuAsnSerTrp14S150AAGAAATTTCACCATTCTCGTCGTTCTAAALysLysPheHisHisSerArgA巧SerLys155ISO480AGAAGCCAAGATCGAATAArgSet:GinAspArglie1S5AGGGAACTTTTTTCTCAAGCAGAAAGTCATArgGluLeuPheSerGinAlaGluSerHis170175528TTTCGTAATTCCATGCCGPheArgAsnSerMetPro180TCATTTGCAGTTSerPheAlaVal185TCCAAATTCSerLysPheGAAGTGGluVal190CTGLeu576TTTCTACCAACATATGCAPheLieuProThrTyrAla135CAAGCTGCAAATGinAlaAlaAsn200ACACATTTAThrHisLeu205CTATTALeu624AAAGATGCTCAAGTTTTTLysAspAla<31nValPhe210GGAGAAGAATGGGlyGluGluTrp215GGATATTCTGlyTyrSer220TCAGAAGluGATAsp672GTTGCTGAATTTTATCATValAlaGluPheTyrHis225230AGACAATTAAAAArgGinL*euLysCTTACACAALeuThrGin235CAAGinTACTyrACTThr240720GACCATTGTGTTAATTGGAspHisCysValAsnTrp245TATAATGTTGGATyrAsnValGly250TTAAATGGTLeuAsnGlyTTALeuAGAArg255GGTGly768TCAACTTATGATGCATGGSerThrTyrAspAlaTrp260GTCAAATTTAACValLysPheAsn265CGTTTTCGCArgPheArgAGAArg270GAAGluATGMet816ACTTTAACTGTATTAGATThrI>euThrValLeuAsp275CTAATTGTACTTLeu工leVal!>eu280TTCCCATTTPheProPhe285TATTyrGATAspATTlie864<formula>formulaseeoriginaldocumentpage344</formula>CAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCATTGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAlaSerlieS155205251584ATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTAlieGluGlyProGlyPheThrGlyGlyAnnLsul^u530、535540TTCCTAAAAGAAPhelieuIiysGlu1632TCTAGTAATTCAATTGCTAAATTTAAAGTTACATTASerSerAsnSer工leAlaLysPheLysValThrLeu545550555AAT丁CAGCAGCCAsnSerAlaAla5601680TTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACTAACLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThrAsn5S55705751728TTACGACTTLeuArgLeuTTTGTCCAAAATTCAPheValGinAsnSer580AACAATGATTT丁CTTGTCATCTACAsnAsnAspPheLeuVallieTyr5B5S901776ATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATTTlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThrPhe59S6006051824GATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGAATAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLysAsn6106156201872GAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCTATGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslieTyr625630635640"20ATAGATAAGATAGAATTTATCCCAGTACAATTGTAAlieAspLyslieGluPhelieProValG工nLeu64S650(2)序列编号58的信息(i>序列特征:(A>长度:(B)类型651个氨基酸氨基酸(D)拓扑学线性(ii)tt类弯f白质(xi)^列描迷萍列编号58:MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro151015AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202S30ProAsnSerThrL>euGluGluLeuAsnTyrLysGluPheLeuArgMet3S4045ThrGluAspSerSerThrGluVal5055AlaValGlyThr65GlyValProPheAsnThrlieTrp100GlyUeSerValAlaGlyAlaLeu85ProSerGinAspLeuAspAsnSerThrVal!>ysAspValGlyGinlieLeuGlyValVal7580ThrSerPheTyrGinSerPheLeuAlaGinValGluValLeulieAspLysLys115120ProTrpLys105lieGluGluAlaLeuAlaGluLeuGinGlyLeuGinAsnAsn130135AsnAlaLeuAsnSer*TrpLysLysPheHisHis1"150155AlaPheMet110TyrAlaLys125PheGluAsp140SerArgArgTyrVal160ArgSerGinAspArglieArgGlubeuPheSerGinAlaGluSerHis16517017SPheArgAsnSerMetProSerPheAlaValSerLysPheGluValLeu180IBS190PheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeuLeu195200205LysAspAlaGinVal210ValAla225GluPheTyrAspHisCysValSerThrThrLeuThrAsp305TyrAspThrVal275AlaLeuTyrSerLysProliePheGlyGluGluTrpGlyTyrSerSer,'-215220HisArgGinLysLeuThrGinGinTrpTyrAsnValGlyLeuAsnGlyLeuTrpValLysPheAsnArgPheArgArg2S5270AspLeu工leValLeuPheProPheTyx2802B5GlyValLysThrGluLeuThrArgAsp29S300SerLeuAsnThrLeuGinGluTyrGly310315PheIteuSerlieGluAsnSerlieArgLysProHisLeuPhe325330GluAspTyrThr240ArgGly255GluMetAsplie工lePheProThr320AspTyr33SLeuGinGlylieGluPheHisThrArgLeuGinProGlyTyxPheGly"03S0LysAspSerPheAsnTyrTrpSerGlyAsnTyrVal355360GluThrArgPro3SSSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAspLys370375380SerThrGluProVal385ArgThrlieAlaAsn40STyrLeuGlyVal420ThrGinLysLeuSerPheAspGly330335ThrAspValAlaGinLysValTyr400LysValAspPhe425AlaTrpProAsnGlyLysVal410415SerGinTyxAspAspGinLys430AsnGluThrSer435ValSerAlaGin450ThrGinThrTyrAsp440SerLysArgAsn44SAspSerlieAspGinLeuProProGlu4SS460AsnGlyHisThrThrAspGluProL*euGlu465LysAlaTyrSerHisGinLeuAsnTyxAlaGluCys470475480PheLeuMetGinAspArgArgGlyThrlieProPhe490HisArgSerValS0048SAspPhePheAsnPheThrTrpThr495ThrlieAspAla505GluLysS10lieThrGinLeuProVal515lieGluS30ValLysGlyProGlyPheAlaTyr520ThrGlyS3SAlaLeuSerSerGlyAsnIjsuIjeu540GlyAla525SerliePheLeuLysGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAlaAla545550555560!>euLeuGinArgTyrArgValArglieArgTyrAlaSerThrThrAsn565570575LeuArgLieu.Phe580ValGinAsnSerAsnAsnAspPhe585LeuVal530工leTyrlieAsnLysThr595MetAsnLysAsp600AspAspLeuThrTyrGin605ThrPheAspLeu610GluLeu625AlaThrThrAsnlieneGlyAla63CSerAsnMetGlyPheSerGluSerPheValSerAsn635GlyAspUysAsnGlui^yslieTyr640lieAspLys工leGluPhelieProvalGinLeu645650(2)序列编号59的信息;(i)序列特征(A)长度1959威基对(B)类型核苷酸(。链的性质单链(D)拓朴学线性〖ix)特征(A)名称/关键词CDS(B〉定位(xi)辟列描迷序列编号59:ATCAA丁CCAAACAATCGAAG丁GAACATGATACGATAAAGGTTACACCTMetAsnProAsnAsnArgSerGluHis15AspThrUe£>ysValThr1015Pro48AACAGTGAATTGCAAACTAACCATAATAsnSerGluLeuGinThrAsnHisAsn2025CAATATCCTTTAGinTyrProLeuGCTGACAlaAsp30AATAsn96CCAAATTCAACACTAGAAGAATTAAATTATProAsnSer1ThrLeuGluGluLeuAsnTyr3540AAAGAATTTLysGl\xPheTTAAGALeuAxgATGMet144ACTGAAGACAGTTCTACGGAAGTGThrGluAspSex"SerThrGluVal5055AspAACTCTSOACAThrGTAAAAGATAsp192GCAGTTGGGACAGGAATTTCTGTTGTAGGGCAGATTTTAGGTGTTGTAAlaValGlyThrGlylieSerValValGlyGinlieLeuGlyValVal65707580240GGAGTTCCATTTGlyValProPheGCTAla85GGGGlyGCAAlaCTCLeuACTThrTCASer90TTTPheTATTyrCAAGinTCASerTTTPhe95CTT288AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCAAsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla10010511033SCAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTGinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSer115120125384AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATLysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135140432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer"5ISO工S5160480AAAAGAAGCCAAGGTCGAATAAGGGAACTTTTTTCTCAAGCAGAAAGTJLysArgSerGinGlyArglie1S5ArgGluLeuPheSerGinAlaGluSer170175S28CATTTTCOTAATTCCATGCCGHisPheAxgAsnSerMe仁Pro180TCATTTGCAGTTTCCAAATTCGAAOTGSerPheAlaValSerLysPheGluVal185190S76CTGTTTCTACCAACATATGCALeuPheL*euProThrTyrAla19SCAAGCTGCAAATGinAlaAlaAsn200ACACATTTATTGCTAThrHisLeuLeuLeu205624TTAAAAGATGCTCAAGTTTTTGGALeuLysAspAlaGinValPheGly210215GAAGAATGGGluGluTrpGGATATTCTTCAGAAGlyTyr220SerSer*Glu"2GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACMCAATACAspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyr225230235240720ACTGACThrAspCATTGTHisCysGTTAATValAsn245TGGTrpTATTyrAATAsnGTTVal250GGATTAAATGlyLeuAsnGGTTTAGlyLeu255AGAArg7S8GGTTCAGlySerACTTATThrTyr260GATGCAAspAlaTGGGTCValAAA265TTTAACCGTAsnArgTTTPheCGCArg270AGAGAAGlu816ATGACTMetThi:TTAACTLeuThr275GTATTAValLeuGATAspCTALeu280ATTlieGTACTTTTCLeuPheCCAPro2B5TTTTATTyrGATAsp8S4ATTCGGlieArg230TTATACLeuTyrTCAAAAGGGGly295GTTAAALysACAThrGAACTAGluLeu300ACAThrGACAspATTlie912TTTACGPheThr*305GATCCAAspProATTTTT工lePhe310ACCThrCTTLeuAATAsnACAThrCTACAGLeuGin315AAGTACTyrGGAGlyCCAPro320960ACTTTTThrPheTTGAGTLieuSerATAGAAlieGlu325TCTSerATT工leCGAArg330AAACCTIjysProCATHisTTATTT335GATAsp1008TATTTATyrLeuCAGGGGGinGly340ATTGAAlieGluTTTPheCATHisACGThr34SCGTArgCTTCAALeuGLnCCTProGGTGly350TACTyrTTTPhe1056GGGAAAGlyLysGATTCTAspSer355TTCAATPheAsnTATTyrTGGTrp360TCTSerGGTGlyAATTAT36SGAAACTThrArg1104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGATProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp3703753801152AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGTTLysSerThrGluProValGinLysLeuSerPheAspGlyGinLysVal3853903954001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAs"GlyLys405410415124BGTATATTTAGGTGTTValTyrLeuGlyVal420ACGAAAGTTGATTTTAGTCAATATGATGATCAAThrLysValAspPheSerGinTyrAspAspGin425430AAAAATGAAACTAGTL>ysAsnGluThrSer435ACACAAACATATGATTCAAAAAGAAACAATGGCThrGinThrTyrAspSerLysArgAsnAsnGly44044513"CATGTAAGTGCACAGHisValSerAlaGin450GATTCTATTAspser工le45SGACCAATTAAspGinLeuCCGCCAProPro"0GAAGluACAACAThrThr1392GATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAAAspGluProLeuGluLysAlaTyrSerHisGinLeuAsnTyrAlaGlu4"47047S4801440TGTTTGCysPheTTAATGLeuMetCAGGACGinAsp485CGTCGTArgArgGGAACAGlyThr490ATTlieCCATTTTTTProPhePheACTTGGThrTrp4351488ACACATThrHisAGAAGTArgSer500GTAGACValAspPhePheAATACAAsnThr505ATTGATlieAspGCTGAAAlaGlu510AAGATTLyslie1536ACTCAAThrGinCTTCCALeuPro515GTAValGTGValAAAGCAl<ysAla520TATGCCTyr*AlaTTGTCTLeuSerTCAGOTSerGly525GCTTCCAlaSer1584ATTATTHielie530GAAGGTGluGlyCCAProGGAGlyTTCACAPheThr535GGAGGAGlyGlyAATTTAAsnLi6u540CTATTCLeuPheCTAAAALeuLysGAATCTGluSer545AGT*AATSerAsnSerATTlie5S0GCTAAAAlaLysTTTAAAPheIjysG丁TACAValThr555TTAAATlieuAsnTCAGCASerAla5601680GCCTTGAlaLeuTTACAAL<euGinCGAArg5S5TATTyrCGTGTAArgValAGAATAArglie570CGCTATArgTyrGCTTCTAlaSerACCACTThrThr5751728AACTTAAsnLeuCGACTTArgLeu580TTTPheGTGValCAAAATGinAsnTCAAAC5B5AATGATAsnAspTTTC丁TPheLeu590GTCA丁CVal工le1776丁ACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACA1824TyrlieAsnL*ysThr*MetAsnLysAspAspAspLeuThrTyrGinThr595600605TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAG1872PheAspI*euAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610615"0AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCAsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie625630S356401920丁ATATAGATAAGATAGAATTTATCCCAGTACAATTGTAA1959TyrlieAspLyslieGluPhe工leProValGinLeu645SSO(2)序列编号60的信息(i)序列特征(A)长度652个M酸(B>类型氨基酸(D)拓朴学线性(ii)分子类型蛋白质(xi)序列描述序列编号60:Me仁AsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro151015AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202530ProAsnSerThrLeuGiuGluIeuAsnTyrL<y3GluPheLeuArgMet3S4045ThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAspSO5560AlaValGlyThrGlylieSerValValGlyGinlieLeuGlyValVal707S80GlyValProPheAlaGlyAlaLeuThrSerPheTyrGLnSerPheLeu859095AsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla100105110GinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSer11S120125LysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135"0ValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer14S150155160LysArgSerGinGlyArglieArgGluLeuPheSerGinAlaGluSer16517017SHisPheArgAsnSerMetProSerPheAlaValSerLys.PheGluVal1801B5190LeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu195200205LeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220AspValAJLa<31uPheTyrHisArgGinLeuLysLeuThrGinGinTyr225230235240ThrAspHisCysValAsnTrpTyrAsnValGly*LeuAsnGlyLeuArg24S250255GlySerThrTyrAspAlaTrpVal260MetThrLeuThrValLeuAspLieu275280lieArgLeuTyrSerLysGlyVal290LysPheAsnArgPheArgArgGlu265270lieValLeuPheProPheTyrAsp28SLysThrGluL^uThrArgAsplie300PheThrAspProliePheThrLeuAsnThrLeuGinLysTyrGlyPro305310315320ThrPheLeuSerlieGluAsnSerlieArgLysProHisLeuPheAsp325330335TyirLeuGinGlylieGluPheHisThr*ArgLeuGinProGlyTyrPhe34034S350GlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg3553S0365ProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp370375380LysSerThrGluProVaiGinLysLeuSerPheAspGly<3inLysVal385390395400TyrArgThrlieTUaAsnThrAspValAlaAlaTrpProAsnGlyLys405410415ValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin420425430LysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly"S440445HisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr<formula>formulaseeoriginaldocumentpage353</formula>MetAsnProAsnAsnArgSer*GluHisAspThrlieLysValThrPro151015AACAGTGAATTGCAAACTAACCATAATCAATATCCTAsnSerGluLeuGinThrAsnHisAsnGinTyrPro2025TTAGCTGACAATLeuAlaAspAsn3036CCAAATTCAACACTAGAAGAATTAAATTATAAAGAAProAsnSerThr*LeuGluGluLeuAsnTyrLysGlu3540TTTTTAAGAATGPheLeuArgMet45144ACTGAAGACAGTTCTACGThrGluAspSerSerThr50GAAGTGCTAGACAACTCTGluValLeuAspAsnSer5560ACAOTAAAAGATThrValLysAsp132GCAGTTGGGAlaValGly65ACAGGA丁hrGlyATTlie70TCTGTTGTAGGGSerValValGlyCAGATTTTAGGTGTTGTAGin工工eLeuGlyValVal7580240GGAGTTCCATTTGCTGGGGCACTCACTTCAGlyV/alProPheAlaGlyAlaLeuThrSer8590TTTTATCAATCAPheTyrGinSerTTTCTTPheLeu95288AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATCGCAAsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla100105110336CAAGTTGAAGTACTGGinValGluValL*eu115ATAGATAAGAAAATAGAGGAGTATGCTAAAAGTlieAspLysLyslieGluGluTyrAlaLysSer120125384AAAGCTLysAa130CTTGCAGAGLeuAlaGluTTALeuCAGGGTCTTGlyLeuCAAAATGinAsilAATTTCAsnPhe140GAAGluGATAspTATTyx432GTTAATValAsn145GCGAlaTTALeuAATTCC150TGGTrpAAGAAALysIiysACACCTThrPro155TTAAGTI^uSerTTGLeuCGAAGTSer160480AAAAGALysArgSerCAAGinGGTGly1SSCGAATAlieAGGGAAArgGluCTTTTTL*euPhe170TCTCAASerGinGCAAlaGAAGlu175AGTSerS28CATTTTHisPheCGTArgAATAsn180TCCSerATGMetCCGProTCATTTSerPhe185GCAGTTAlaValTCCAAATTCPhe"0GAAGluGTG576CTGTTTLeuPheCTALeu195CCAProACAThrTATTyrGCAAlaCAAGCTGinAla200GCAAATAlaAsnACACATThrHis205TTALeuTTGLeuCTALeuTTAAAALeuLys210GATAspGCTAlaCAAGinGTTValTTTPhe215GGAGAAGlyGluGAATGGGluTrpGGATATGlyTyr220TCTSerTCASerGAA672GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAATAC720AspValAlaGluPheTyrHisArgGinLeuLysI>eu'ThrGinGinTyr225230235240ACTGACCATTGTGTTAATTGGTATAAT<3TTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg245250255768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu260265270'81SATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuAspLeulieValLeuPheProPheTyrAsp275280285B64GTTCGGTTATACCCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTValArgLeuTyrProLysGlyValLysThrGluLeuThrArgAsplie290295300912TCTSer305ACGGATThrAspCCAATTTTTProliePhe310GCCGTTAATAlaValAsnACTCTGTGGThrLeuTrp315GAAGluTACTyrGlyCCAPro3209S0ACTThrTTTTTGPheLeuAGTATAGAASerlieGlu325AACAsnTCTATTSerlieCGAAAACCTArgLysPro330CATHisTTAL*euTTTGATPheAsp3351008TATTyrTTACAGLeuGinGGGATTGAAGlylieGlu340TTTPheCATACGHisThr34SCGTCTTCGAArgLeuArgCCTProGGTGly3S0TACTTTTyrPheGGGAAAGATTCTTTCAATTATTGGTCTGGTAATTATGCAGAAACTAGAG].yLysAspSerPheAsnTyr*TrpSerGlyAsnTyrAlaGluThrArg35S3S03651104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGATProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp"03753801152AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGTTLysSerThr*GluProValGinLysLeuSerPheAspGlyGinLysVal38S3903354001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTG(3CCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys405'41041S1248GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin42042S4301236AAAAATGAAACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSer*ThrGinThrTyrAspSerLysArgAsnAsnGly43S4404451344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACA1392HisValSerAlaGinAspSerUeAspGinLeuProProG〗uThrThr45045S"0GATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAAAspGluProLeuGluL*ysAlaTyrSerHisGinLeuAsn,rAlaGlu4SS47047S4801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGCysPhel>euMetGinAspArgArgGlyThrlieProPhePheThrTrp4B54901488ACACATAGAAGTG丁AGACTTTTTTAATACAATTGATGCTGAAAAGATTThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslieS00SOSS101536ACTCAACTTCCAGTA<3TGAAAGCATAT.ThrGinLeuProValValLysAlaTyr51S520GCCTTGTCTTCAGGTGCTTCCAlaLeuSerSerG]yAlaSer5251584ATTATTGAAGGTCCAGGAlie工leGluGlyProGly530TTCACAGGAPheThrGly535GGAAATTTAGlyAsnlieuS40CTALieuTTCPheCTAAAA乙euLys1632GAATCTAGTGluSerSer545AATTCAAsnSerATTlie550GCTAlaAAATTTLysPheAAAGTTACALysValThr555TTALeuAATTCAGCASerAla5601S80GCCTTGTTAAlaLeuLeuCAACGAGinArg565TATTyrCGTGTAAGAVaiArgATACGCTATlieArgTyr570GCTAlaTCTACCACTSerThrThr5751728AACTTACGAAsnLeuArgCTTTTTLeuPhe580GTGCAAGinAATAsnTCAAACSerAsn58、AATGATAST!AspTTTPheCT丁GTCATCX/euVallie5901776TACATTAATTyrlieAsn5"AAAACTUysThr*MetAATAsnAAA600GATGATAspAspGATTTAAspLeuACAThr605TATCAAACATyrGinThr1824TTTGATCTCPheAspLeu610GCAACTAlaThrACTThrAATS15TCTSerAATATGAsnMetGGGTTCGlyPhe620TCGSerGGTGATAAGGlyAspLys1872AATGAACTTAsnGluJJeu625ATAATAlie工leGGAGlyS30GCAAlaGAAGluTCTTTCSerPheGTTTCTValSerS3SAATAsnGAAAAAATCGluLyslie"01520TATATAGATTyrlieAspAAGATALyslie645GluTTTPheATClieCCAGTAProVal650CAATTGGinUeu1359(2)序列编号62的信息:(i)序列特征(A>长度652个狄酸(B)类型氣基酸(D)拓朴学线性<ii分子类型蛋白质序列描述序列编号62:MetAsnProAsnAsnArgSerGluHisAspThr工leLysVal1510AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAla202530ProAsnSerThrLeuGluGluLeuAsnTyrLys3540ThrGluSOAlaValGlyValAspSerSerGlyThrGlyAsnThrProPheAlaSSlieTrpPro100丁hrGluVallieSerVal70GlyAlaLeuSerAspAlaLeuAspAsnGlyGluPheLeu45SerThr*Val60ThrPro15AspAsnArgMetLysAspValGin75ThrSerPhe90lieLeuGlyValVal80TyrGinSerPheLeu95GinValLysAls130GluValLeulieAspLys115120LeuAlaGluLeuGinGly135AspProTrpLysAlaPhe10S110LyslieGluGluTyrAla12SLeuGinAsnAsnPheGlu140ValAsnAlaLeuAsnSerTrpLys145ISOLysLysArgSerGinGlyArglieArgGlu165HisPheArgAsnSerMetProSex*Phe180185LeuPheLeuProThrTyrAlaGinAla135200LeuLysAspAlaGinValPheGlyGlu210AspValAlaGluPhe225ThrAspHisCysVal245GlySerThrTyrAsp260215TyrHisArgGin230AsnTrp丁yrAsnAlaTrpValLys265ThrProLeuSerLeu155LeuPheSerGinAla170AlaValSerLysPhe190AlaAsnThrHisLeu205GluTrpGlyTyrSer220LeuLysLeuThrGin235ValGlyLeuAsnGly250PheAsnArgPheArg270MetAlaLysSerAspTyrArgSerISOGluSer175GluValLeu!>euSerGluGinTyr240L,euArg255ArgGluMetThrLeuThrValLeuAspLeulieValLeuPheProPhe275280285ValArgLeuTyrProLysGlyValLysThrGluLeuThrArg29029S300SerThrAspProliePheAlaValAsnThrLeuTrpGluTyr305310315ThrPheLeuSerlieGluAsnSer工le325ArgLysPro330ArgLeuArgGlyAsnTyrHisLeuTyrAspAsplieGlyPro320PheAsp335TyxLieuGinGlylieGluPheHisThr340345GlyLysAspSerPheAsnTyrTrpSer*355360ProSerlieGlySerSerLysThr工le370375LysSerThrGluProValGinLysLeuSerPhe38S390395TyrArgThrlieAlaAsnThrAspValAlaAla405410ThrSerPro380ProGlyTyrPhe350AlaGluThrArg3S5PheTyrGlyAspAspGlyGinLysVal400AspGluProLeuGlu!>ys465470CysPheLeuMetGinAsp485ValTyrLeuGlyValThrLysValLysAsnGluThrSerThrGinThr435440HisValSerAlaGinAspSerlie4504SSAlaTyrArgArgPhePheLysAla520PheThrS35AlaLysArgValAspPheSerTyrAspSerAspGinLeuSerHisGin47SGlyThrlie430TrpProAsnGinTyrAsp430LysArgAsnAsn445GlyLys415AspGinGlyPro4S0ProGluThrThrLeuAsnTyrAlaGlu480ProPhePheThrTrp"5ThrHisThr*GinlieUe530GluSerS4SArgSerValAsp500LeuProValVal51SGluGlyProGlySerAsnSerlieSS0AsnThrlieAspSOSAlaGluLyslie510TyrAlaLeuSerSerGlyAlaser525GlyGlyAsnLeu540PheLysValThr555LeuPheLieuLysLeuAsnSerAla560AlaLeuLeuGinArgTyrArg工leArgTyrAlaSerThrThr565570575AsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheleuVallieS80S85590丁yrlieAsnLysThr*MetAsnLysAspAspAspLeuThrTyrGinThr535600S05PheAspLeuAlaThr61DAsnGluLeulielie625TyrlieAspLyslie(2)序列编号63的信息;(i〉Thr*AsnSerAsnMetGlyPheSerGlyAspLys615620GlyAlaGluSerPheValSerAsnGluLyslie630635"0GluPhe工leProValGinLeu6S0序列特征(A》长度1959碱基对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性(ix)特征(A》名称/关鍵词CDS(B)定位Ui)序列描述序列编号63:ATGAATMetAsnCCAProAACAsnAATAsn5CGAAGTSerGAAGluCATGATACGHisAspThr10ATAlieAAGLysGTTACACCTThrProISAACAGTAsnSerGAAGluTTGLeu20CAAGinACTThrAACAsnCATHisAATCAATATAsnGinTyr*25CCTProTTALeuGCTAla30GACAATAspAsn36CCAAATProAsnTCASer35ACAThrCTAGAAGiuGAAGluTTALeu40AATTATAAAAsnTyrLysGAAGluTTTPhe45TTALeuAGAATGArgMeti44ACTGAAThrGlu50GACAspSerSerThrGAAGlu55GTGValCTAGACAACLeuAspAsnSerSOACAThrGTAValAAAGATLysAsp192GCAGTTAlaVal65GGGGlyACAThrGlyATTlie70TCTSerGTTValGTAGGGCAGValGlyGill75ATTlieTTALeuGGTGlyGTTGTAValValSO240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATCAATCATTTCTTGlyValProPheAlaGlyA上aLeuThrSerPheTyrGinSerPheLeu2889095AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCAAsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla100105_11033SCAAGTTGMGTACTGATAGATAAGAAAATAGAGGinValGluValLeulieAspLysUyslieGlu115120GAGTATGCTAAAAGTGluTyrAlaL<ysSer125384AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATLysAlaLeuAlaGluLeuGinGlyL*euGinAsn130135AAT"0TTCGAAGATPheGluAspTATTyr432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer145150155160480AAAAGAAGCCAALysArgSerGinGATCGAAspArg165ATAAGGlieArgGAAGluCTTlieu170TTTPheTCTSerCAAGCAGAAGinAlaGlu175AGTSer528CATTTTCGTAATTCCATGCCGTCATTT<3CAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal180185"0576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheUeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu135200205624TTAAAAGATGCTCAAGTTTTTGGAGAAGAA丁GOGGATATTCTTCAGAALeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu210215220672GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAATACAspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyr225230235240720ACTGACCATTGT<3TTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg2452502557S8GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu260265270816ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMe仁ThrLeuThrValLeuAspLeulieValLeuPheProPheTyxAsp2752802858"GTTCGGTTATACCCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTValArgLeuTyrProLiysGlyValI*ysThrGluLeuThrArgAsplie23023530O312TTTACGGATCCAATTTTTTCACTTAATACTCTTCAGGAGTATGGACCAPheThrAspProliePheSerLeuAsnThrLeuGinGluTyrGlyPro9S0<formula>formulaseeoriginaldocumentpage361</formula>530535540GAATCTAGTAATTCAATTGCTAMTTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAlaS4SSSO55S5601680GCCTTGTTACAACGATATCGTGTAAGAATACGCAlaLeuLeuGinArgTyrArgValArglieArg5S5570TATGCTTCTACCACTTyrAlaSerThrThrS7S1728AACTTACGACTTTTTGTGCAAAATTCAAACAATAsnLeuArgLeuPheValGinAsnSerAsnAsn5G0GATTTTCTTGTCATCAspPheLeuVallieS90177STACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThrS9SGOO60S1824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGJGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610S156201872AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCAsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie625S30S35"01920TATATAGATAAGATAGAATTTTyrlieAspLyslieGluPheATCCCAGTACAATTGTMlieProValGinLeu6S01959(2)序列编号64的信息(i)序列特征(A>长度652个氨基酸(B)类型氣基酸(D)拓朴学线性(ii)分子类型蛋白质(xi)序列描迷序列编号64:MetAsnProAsnAsnArgSerGluHisAspThrlie510LysValThr*Pro15AsnSerGluLeu-20GinThrAsnHisAsnGinTyrPro25LeuAlaAspAsn30ProAsnSer3SThrLeuGluGluLeuAsnTyrLysGlu40PheLeuArgMet45ThrGlu50AlaVal65AspSerSerThrGlyThrGlylie70GluValLeuAspAsnSer5560SerValValGlyGinlie75ThrValLysAspLeuGlyValVal80GlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeuB59095AsnThr工leTrpProSerAspAla100AspProTrpLys105AlaPhe110MetAlaGinValGluValLeu工leAspLysLyslieGluGlu120LysAla130ValAsn145115LeuAlaGluL^uAlaLeuAsnSerISOTyrAla125LysSerGinGlyLeuGinAsnAsn135140TrpLysLysThrProX*eu1S5PheGluAspTyrSerLeuArgSer160LysArgSerHisPheArgGinAspArg1SSlieAsnSer*MetPro180ArgGluLeuPheSerGinAlaGluSer170175SerPheAlaValSerLysPheGluVal185190LeuPheLeuProThrTyrAlaGinAlaAlaAsnThr195200LeuLysAspAlaGinVal210AspValAla22SGluPheTyr230PheGlyGluGluTrpGly215220HisArgGinLeuLysLeu235HisLeuLeuLeu205TyrSerSerGluThrGinGinTyr240ThrAspHisGlySerThrCysVal245TyrAsp260AsnTrpTyrAsnValGlyLeu250AsnAlaTrpValLysPheAsnArgPhe265GlyLeu255270ArgGluMetPhe305ThrLeu275Argl*eu290ThrValLeuAspLeulieValLeuPhe280TyrProLysGlyValLys29SThrAspProliePheSerLeuAsn310ThrPheLeuSer工le325GluAsnSer*lieThrGluLeu300ThrlieuGin315ArgLysPro330Pro285ThrGluHisPheTyrArgAspLeuPhe335AspliePro320AspTyrGlyProL>euGinLysAspSerlie370Glylie340GluPheHisThrArgLeuArgSerPheAsnTyrTrpSerGlyAsnTyr3^0GlySerSerLysThrlieThrSerPro375380ProValPheGlyTyr350PheGluThrArgTyxGlyAsp200710141972.2说明书第357/415页LysSerThrGluProValGinLysLeuSerPheAspGlyGinLysVal3BS390395400TyrArgThrlieAlaAsnThrAspValAlaAlaTrpPro_AsnGlyLys—40S"0."SValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin42042S430LysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly"5440445HisValSerAlaGinAspSerlieAspGinl*euProPr*oGluThrThr*450"5460AspGluProLeuGluLysAlaTyrSerHisC31nLeuAsnTyrAlaGlu465470475480CysPheLeuMetGinAspArgrArgGlyThrHeProPhePheThrTrp485490495ThrHisArgSerValAspPhePhe500ThrGinLeuProValValLysAla515520lielieGluGlyProGlyPheThr530535AsnThrlieAspAlaGluLyslie505510TyrAlaLeuSerSerGlyAlaSerS2SGlyGlyAsnLeuLeuPheLeuLys540GluSerSerAsnSerlieAlaLysE>heLysValThsrLeuAsnSerAla5"SS0".555560AlaLeuLeuGinArgTyrArgValAarglieArgTyrAlaSerThrThrS65570575AsnLeuArgL>euPheValGinAsnSerAsnAsnAspPheLeuVal工leS80585590TyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr95600605PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLysS10SISS20AsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie625S30"5"0Tyr工leAspLyslieGluPhelieProValGinLeu"5650")序列编号65的信息(i)序列特征(A)长度1959碱基对(B>类型核苷酸((>链的性质单链(D拓朴学线性Ux)特征(A>名称/关键词CDS(B>定位L,.195SUi)序列描述序列编号65:ATGAATCCAAACAATCGAAGTGAACATGATACGMetAsnProAsnAsnArgSerGluHisAspThr1510ATAAAGGTTACACCTlieLysValThrPro1548AACAGTGAATTGCAAACTAACCATAATCAATATAsnSerGluLeuGinThr*AsnHisAsnGlraTyr202SCCTTTAGCTGACAATProLeuAlaAspAsn3096CCAAATTCAACACTAGAAGAATTAAATTATAAAProAsnSerThrLeuGluGluLeuAsnTyr*Lys3S40GAATTTTTAAGAATGGluPheLeuArgMet45144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACThrGluAspSerSerThrGluVal!>euAspAsnSO55TCTACAGTAAAAGATSerThrValLysAspSO"2GCAGTTGGGACAGGAATTTCTGTTGTAGGGCAGATTTTAGGTGTTGTAAlaValGlyThrGlylieSerValValGlyGinlieLeuGlyValVal707580240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATCAATCATTTCTTGlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu8S909528BAACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTA丁GGCAAsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla10010511033SCAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTGinValGluValLeulieAspLysLyslipGluGluTyrAlaLysSer115120125384AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATLysAlaLeuAlaGl\iLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135140432GTTAATGCGTTAAATTCCTGGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer14515015SISO480AAAAGALysArgAGCCAAGGTCGAATAAGOGAACTTTTTTCTCAAGCAGAAAGTSerGinGlyArglieArgGluLeuPheSerGinAlaGluSer16S170175S28CATTTTCGTAATTCt!ATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal18018S190S76CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAl_aAla19S200AsnThrHisLeuLeuIjeu205624TTAAAAGATGCTCAAGTTTTTGGAGAAGAALeuLysAspAlaGinValPheGlyGluGlu210215TGGGGATATTCTTrpGlyTyrSer220TCAGAASerGluGATGTTGCTGAATTTTATCATAGACAATTAA印ValAlaGluPheTyrHisAxrgGinLeu225230AAACTTACACAALysI*euThrGin235CAATACGinTyr240720ACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAATGGTTTAAGAThrAspHisCysValAsnTrpTyrAsnValGlyI*euAsnGlyLeuArg245250255768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTGlySerThrTyrAspAlaTrpValLysPheAsnArg2602"TTTCGCAGAGAAPheArgArgGlu270ATGACTTTAACTGTATTAGATCTAMetThrIjeuThr*ValLeuAspLieu275280ATTGTACTTTTClieValLeuPheCCATTTTATGATProPheTyrAsp2858G4ATTCGGTTATACTCAAAAGGGGTTlieArgTyrSerLysGlyVal290295AAAACAGAACTAACAAGAGACATTLysThrGluLeuThrArgAsplie300912TTTACGGATCCAATTTTTTTACTTAmiACTCTTCAGGAGTATGGACCAPheThrAspPro工lePheLeuLeuAsnThrLeuGinGluTyrGlyPro305310315320960ACTTTTTTGThrPhel^euAGTATAGAAlieGlu325AACTCTATTAenSerlieCGAArg330AAACCTCATTTALysProHisLeuTTTGATPheAsp3351008TATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTTTyrlieuGinGlylieGluPheHisThrAxgLeuGinProGlyTyrPhe3403453501056GGGAAAGATTCTTTCAATTATTGGTCTGGTAATTATGTAGAAACTAGAGlyLysAspSer*PheAsnTyrTrpserGlyAsnTyrVsQGluThrArg3603"1104CCTAG丁ATAGGATCTAGTAAGACAATTACTTCCCCATTTTATGGAGATProSer工leGlySerSerLysThrlieThrSerProPheTyrGlyAsp37037S38011S2AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGTTLysSerThrGluProValGinLysLeuSerPheAspGiyGinLysVal3853903分54001200TATCGAACTJVTAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGlyLys40541041SGTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyirLeuGlyValThrLysValAspPheSerGinTyrAspAspGin42042S4301296AAAAATGAAACTAGTACACAAACATATGATLysAsnGluThrSerThrGinThrTyrAsp435440TCAAAAAGAAACAATGGCSerLysArgAsnAsnGly4451344CATGTAAGTGCACAGGATTCTATTGACCAAHisValSerAlaGinAspSer工leAspGin4504S5TTACCGCCAGAAACAACALeuProProGluThrThr4601392GATGAACCACTTGAAAAAAspGluProL^uGluLysGCATATAGTCATAlaTyrSerHis470CAGCTTAATTACGCGGAAGinLeuAsnTyrAlaGlu47S480"40TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCACysPheLeuMetGinAspArgArgGlyThr工lePro48S490TTTTTTACTTGGPhePheThr*Trp495"88ACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTThr*HisArgSerValAspPhePheAsnThrlieAspAlaGluLyslie500505510153SACTCAAThrGluCTTLeu51SCCAProGTAGTGAAAValLysGCAAla520TATGCCTyrAlaTTGLeuTCTSerTCASer525GGTGlyGCTTCCAlaser1584ATTATTlielie530GAAGluGGTGlyCCAProGGATTCGlyPhe535ACAThrGGAGGAGlyGlyAATAsnTTALeu540CTALeuTTCPheCTAAAALeuLys1632GAATCTGluSer545SerAATTCASerATTGCTlieA13550AAATTTAAAPheLysGTTVal555ACAThrLeuAATAsnTCAGCASerAl35601S80GCCTTGAlaLeuTTALeuCAAGinCGAArg565TATCG丁TyrArgGTAValAGAATAArglie570CGCArgTATTyrGCTAlaTCTserACCACTThrThr5751728AACTTACGAArgCTTLeu580TTTGTGCAAValGinAATAsnTCAAAC58SAATAsnGATAspTTTCTTLeuS90VaJlie1776TACATTTyrlieAATAsn595AAALysACTThrATGAATMetAsnAAALys600GATGATAspAspGATAspTTAL*euACA605TATTyrCAAACAGinThr1824TTTGATPheAspS10CTClieuGCAAlaACTThrACTAATThrAsnTCTSerAATATGAsnMetGGGGlyTTCPhe620TCGSerGGTGlyGATAAGAspLys1872AATGAAC丁TATAATAAsnGluLeulielieS2STATATAGAT;iAGATATyirlieAspLyslie"5(2)序列编号66的信息GGAGCAGAATCTTTCGTTTCTAATGAAAAAATC"20GlyAlaGluSerPheValSerAsnGluLyslie630"0GAATTTJVTCCCAGTACAATTGTAA"53GluPhelieProValGinLeu(i)序列特征(A长度652个氨基酸(B>类型礼基酸(D>拓朴学线性(i幻分子类型蛋白质(xi)序列描述序列编号66:MetAsnProAsnAsnArgSerGluHisAspThrlieLysValTharPro151015AsnSerGiuLeuGinThrAsnHisAsnGinTyrProl,euAlaAspAsn202530ProAsnSerThrL>euGlu35ThrGluAspSerSerThr50GluLeuAsnTyxLysGluPheLeuArgMet4045AlaVal65GlyValAsnThrGinValI>ysAla130ValAsn14SLysArgGlyThrGlylie70ProPheAla85lieTrpPro100GluValLeu115GlySerlieGluValLeuAspAsnSerThrValLys5560SerVaiValGlyGinlieLeuGlyval75AlaLeuTharSerPheTyxGinSerPhe9095AspVal80IjeuLeuAiaGluLeuAlaLeuAsnHisPheSerGinGlyAr*gAsnSer1B0SerMetAspAlaAspProTrpLysAlaPheMetAla10S110AspLysLyslieGluGluTyrAlaLysSer120125GinGlyLeuGinAsnAsnPheGluAspTyx13S140TrpLysLysThrProLeuSeirLeuArgSer155ISOlieArgGluLeuPheSerGinAlaGluSer170175ProSerPheAlaValSerIysPheGluVal185"0368LeuPheLeuProThr丁yrAlaGinAlaAla200LeuLys21019SAspAlaGinValPheGlyGluGlu215AsnThrHisL>euL*euLeu205TrpGlyTyrSerSerGlu220AspVal225AlaGluPheTyr230HisArgGinLeuI-ysI,euThrGinGinTyr235240ThrAspGlySerHisCysValAsn24SThrTyrAspAla2S0TrpTyr*AsnValGly250LeuAsnGlyTrpValLysPheAsnArgPhe265Metlie丁hrLeuThrValLeuAspLeulieVal280Leu290275乙euTyrSerLysPhePro285Arg270PheLeuArg255ArgGluTyrAspGlyValLysThrGluLeuThrArgAsplie295300PheThrAspPi:oliePhe305310LeuLeuAsnThrLeuGinGluTyrGlyPro315320ThrPheLeuSer工leGi\iAsnSerlieArg325330LysProHisLeuPheR_sp335TyrLeuGinGly工leGluPheHis340GlyLysAspSerPheAsnTyi:Trp355360ThrArgLeuGinProGlyTyrPhe345350SerGlyAsnTyrValGluThrArg365ProSer370LysSerTyrArgValTyrHisVal450lieGlySerSerThrGluProVal390ThrlieAlaAsn40SLeuGlyValThr420GluThrSerThr1435SerAlaGinAspLysThrlieThrSerProPheTyrGlyAsp375330GinLysLeuSerPheAspGlyGinLysVal335400ThrAspValAlaAlaTrpProAsnGlyLys410"5LysValAspPheSerGinTyrAspAspGin425430GinThrTyrAspSerLysArgAsnAsnGly"0"SSerlieAspGinLeuProProGluThrThr4554S0AspGluProLeuGluLysAlaTyrCysPheLeuMetGinAspArgArg485SerHisGinLeuAsnTyrAlaGluGlyThrlieProPhePheThrTrp490495<formula>formulaseeoriginaldocumentpage370</formula>CCAAATTCAACACTAGAAGAATTAAATTATAAAGAATTTTTAAGAATGProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet354045144ACTGAAGACAGTTCTACGGAAGTGCTAGACAACTCTACAGTAAAAGATThrGluAspSer50SerThrGluValLeuAspAsnSerThr"1LysS550Asp132GCAGTTGGGACAAlaValGlyThr65GGAATTTCTGTTGTAGGGCAOATTTTAGGTGTTGTAGlylieSer*ValValGlyGinlieLeuGlyValVal707580240GGAGTTCCATTTGlyValProPheGCTGGGGCACTCACTTCAAlaGlyAlaLeuThrSer*8590TTTTATCAATCATTTCTTPheTyrGinSerPheLeu35288,AACACTATATGGCCAAGTGATGCTGACCCAAsnThrlieTrpProSerAspAlaAspPro100105TGGAAGGCTTTTATGGCATrpLysAlaPheMetAla110336CAAGTTGAAGTACTGATAGinValGluvalLeulie115GATAAGAAAATAGAGGAGTATGCTAAAAGTAspLysLyslieGluGlu丁yrAlaLysSer120125334AAAGCTCTTGCAGAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATLysAlaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135140432GTTAATGCGTTAAATTCCTOGAAGAAAACACCTTTAAGTTTGCGAAGTValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer145ISO155160460AAAL#ysAGAAGCArgSer*CAAGinGATCGAAspArg165ATAlieArgGAAGluCTTLeu170TTTTCTCAAGCAPheSerGinAlaGAAGlU175AGTSerS28CATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGHisPheArgAsnSerMetProSerPheAlaValSerLysPheGluValL80185190576CTGTTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTALeuPheLeuProThrTyrAlaGinAlaAlaAsnThrHisLeuLeuLeu135200205624TTALeuAAAGATLysAsp210GCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCAGAAAlaGinValPheGlyGluGluTrpGlyTyrSerSerGlu215220G72GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAATACAspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGinTyr22S23023S240720ACTThrGACCATAspHisTGTCysCTTAATValAsn245TGGTrpTATTyrAATAsn<3TTVal250GGATTAAATGGTGlyL*euAsnGlyTTALeu255AGAA;rg768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu260265270816ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCA.TTTTATGATMetThrLeuThrValLeuAspLeulie275280ValLeuPheProPheTyrAsp235864ATTCGGTTATACTCAAAAGGGGTTAAAACAlieArgLeuTyrSerLysGlyValLysThr290295GAACTAACAAGAGACATTGluLeuThrArgAsplie300912TTTACGGATCCAATTTTTTCACTTAATACTPheThrAspProliePheSerLeuAsnThr305310CTTCAGGAGTATGGACCALeuGinGluTyrGlyPro31S320960ACTTTTTTGAGTATAGAAAACTCTATTCGAThrPheLeuSerlieGluAsnSerlieArg325330AAACCTCATTTATTTGATLysProHisLeuPheAsp3351008TATTTACAGGGGATTGAATTTCATACGCGTCTTTyrLeuGinGly工leG丄uPheHisThrArgLeu340345CGACCTGGTTACTTTArgProGlyTyrPhe3501056GGGAAAGATTCTTTCAATTATTGGTCTGGTAATTATGTAGAAACTAGAGlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg3553603651104CCTProAGTSer370ATAlieGGATCTGlySerSerAAGLys375ThrATTlieACTThrTCCSerCCATTTProPhe380TATTyrGGAGlyGATAsp1152AAALys385TCTACTThrGAACCTGluProGTAVal390GinAAGLysCTALeuAGCSerTTTGATPheAsp39SGGAGlyCAAGinAAALysGTTVal4001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCCGAATGGTAAGTyrArgThr工leAlaAsnThrAspValAlaAlaTrpProAsnGlyLys40S41041S1248GTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAspGin420425430AAAAATGAA,ACTAGTACACAAACATATGATTCAAAAAGAAACAATGGCLysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGly4354404451344CATGTAAGTGCACAGGATTCTATTGACCAATTACCGCCAGAAACAACAHisValSerAlaGinAspSerlieAspGinLeuProProGluThrThr4504SS4S01392GATGAACCACT丁GAAAAAOCATATAGTCATCA。CTTAATTACGCGGAAAspGluProLeuGluLysAlaTyrSerHisGinLeuAsnTyrAlaGlu4704754801440TGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGCysPheLeuMe仁GinAspArgArgGlyThrlieProPhePheThrTrp4854904951488ACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTThrHisArgSerValAspPhePheAsnThrlieAspAlaS0050SGAAAAGATTGluLyslieS101536ACTCAACTTCCAThrGinLeuPro515GTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCVaJLValLysAlaTyrAlaLeuSerSerGlyAlaSer520525ATTATTGAAGGTCCAlielieGluGlyPro530GGATTCACAGGAGOAAATTTACTATTCCTAAAAGlyPheThrGlyGlyAsnLeuLeuPheLeuLysS355401632GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCAGluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAlaS455S0S555601680GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACTAlaLeuLeuGinArgTyrArgValArglieArgTyr*AlaSerThrThr5S5570S7S1728AACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVallieS8058SS901776TACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATyr工leAsnLysThrMetAsnLysAspAspAspLeuThrTyxGinThr5"6006051B24TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGPheAspl>euAlaThrThrAsnSerAsnMetGlyPheSeirGlyAspLys6106156201872AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATCAsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslieS256306356401320TATATATyrlieGATAAGAspLysATAGAAlieGlu645TTTPheATClieCCAGTAProVal650CAATTGTAAGinLeu19S9(2>序列编号68的信息U)序列特征(A>长度652个氨基酸(B)类型氨基酸(D)拓朴学线性(ii)分子类型蛋白质《xi)序列描述序列编号68:MetAsnProAsnAsnArgSerGluHisAspThrlieLysValThrPro151015AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAlaAspAsn202530ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPheLeuArgMet354045ThrGluAspSerSerThrGluValLeuAspAsnSerThrValLysAspSO5SSOAlaValGlyThrGlyGlyValAsnThrGinValLysAla130ProPheAla85lieTrpProiooGluValLeu115lieSerValValGly<31nlieLeuGlyValVal707S80GlyAlaLeuThrSerPheTyrGinSerPheLeu9095SerAspAlaAspProTrpLysAlaPheMetAla10S110lieLeuAlaGluLeuValAsnAlaLeuAsnSer145150ArgLysArgHisPheLeuPheLeuliys210AspVal225ThrAspGlySerMetThrSerGinAsp165ArgAsnSer180LeuProThr135AspAlaGinAspLysLyslieGluGluTyrAlaLysSer12012SGinGlyLeuGinAsnAsnPheGluAspTyr135140TrpLyslieArgLysThrProLeuSerLeuArgSer155160GinMetProSerGluLeuPheSer170PhfAlaValSer185LysAlaGluSer175PheGluVal190TyrAlaGinAlaAlaAsnThrHisLeuLeuLeu205AlaGiuPhelieArg290His.CysVal24SThrTyrAsp260LeuThrValLeuTyrSerValPhe215TyrHis230AsnTrpAlaTipLeuAsp29S200GlyTyrValLeu280valGluGluTrpGly220GinLeuLysUeu235AsnValGlyLeu250LysPheAsnArg265lieValLeuPheLiysThrGluLieu300TyrSerSerGJLuThrAsnPhePro2B5ThrGinGinTyr240GlyLeuArg255ArgArgGlu270PheTyrAspArgAspliePheThrAspProThrPheLeuSerTyrLeuGinGly340GlyLysAspSer35SliePheSerLeuAsn310lieGluAsnSer工le325lieGluPheHisThr34SThrLeuGinGluTyrGlyPro315320ArgLysProHisLeuPheAsp33033SArgLsuArgProGlyTyrPhe350PheAsnTyrTrpSerGlyAsnTyr3"ValGluThrArg365ProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp370LysSerThrGluProVal385390Tyr*ArgThrlieAlaAsn405ValTyr3>uIiysAsnGlu435HisValSerAspGluPro465CysPheUeuThrHisArgThrGinLeu515lieUeGlu530GluSerSerS45AlaLeulieuAsnLeuArgGlyVa.].Thr420ThrSerThrAlaGinAspLeuGluLiysMetGinAsp485SerValAsp500ProValValGlyProGlyAsnSerlie550<3lnArgTyr565LeuPheVal580375380GinLysLeuSerPheAspThrAspValAlaAlaTrp410LysValAspPheSerGin425GlyGinLysVal400ProAsnGlyLys41STyrAspAspGin430TyrlieAsnLysThrMet595GinThrTyrAspSerLysArgAsnAsnGly440445SerlieAspGinLeuProProGluThrThr455460AlaTyrSerHisGinLeuAsnTyrAlaGlu475480ArgArgGlyThrlieProPhePheThrTrp430PhePheAsnThrlieAspMaGluLyslie505510LysAlaTyrAlaLeuSerSerGlyAlaSer520525PheThrGlyGlyAsnLeuLeuPheLeuLysS35540AlaLysPheLysV殘lThrLeuAsnSerAlaSS5560ArgValArg工leArgTyrAlaSerThrThr570575GlrxAsnSerAsnAsnAspPheLeuVallie585530AsnLysAspAspAspLeuThrTyrGinThr600605PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610615620AsnGluLeulielieGlyAlaGluSerPheValSerAsnGluLyslie625630635"0TyrlieAspLyslieGluPhelieProValGinLeu645650(2)序列编号69的信息(i)序列特征(A)长度1482碱基对(B>类型核苷酸(C)链的性质单链(D)拓朴学线性(ix)特征《A)名称/关鍵词CDS(B)定位l..1473(xi)序列描述序列编号69:AGTAAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTCAAGCAGAASerLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluIS101548AGTCATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAASerHisPheArgAsnSerMetProSerPheAlaValSerLysPheGlu2025309SGTGValCTGLeuTTTPhe35CTALeuCCAProThrTATTyrGCAAla40CAAGCTGCAAATGinAlaAlaAsnACAThr4SCATHisTTALeuTTGLeu144CTATTAAAAGATGCTCAAGTTTTTGGAGAAGAATGGGGATATTCTTCALeuLeuLysAspAlaGinValPheGlyGluGluTrpGlyTyrSerSer505560192GAAGATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAAGluAspValAlaGluPheTyrHisArgGinLeuLysLeuThrGinGin65707S80240TACACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAAT(3GTTTATyrThrAspHisCysValAsnTrpTyrAsnValGlyIeuAsnGlyLeu859095288M3AGGT丁CAACTTATGATGCATGCGTCAAATTTAACCGTTTTCGCAGAArgGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArg10010S110GAAATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGluMetThrLeuThrValLeuAspl^ulieValLeuPheProPheTyr115120125384GATATTCGGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACAsplieArgLeuTyrSerLysGlyValLysThrGluLeuThrArgAsp130135140432atttttacggatccaattttttcacttaatactcttcaggagtatggaliePheThrAspProliePheSerLeuAsnThrLeuGinGluTyrGly1451501S5160480CCAACTTTTTTGProThrPheLeuAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTSerlieGluAsnSerlieArgLysProHisLeuPhe1SS17017SS28GATTATTTACAGAspTyrLeuGin180GGGATTGAAGlylieGluTT丁CATPheHis18SACGCGTCTTCAAThrArgLeuGinCCTPro190GCTGlyTACTyr576TTTGGGAAAGATTCTTTCAATTATTCGPheGlyLysAspSex*PheAsnTyarTrp19S200TCTGGTAATTATGTAGAAACTSerGlyAsnTyrValGluThr205624AGACCTAGTArgProSer210ATAGGATCTlieGlySerAGTSer21SAAGACALysThrATTACTTCClieThrSer*220CCATTTProPheTATGGATyrGly672GATAAATCTAspLysSer225ACTThrGAACCTGluPro230GTAValcaaaagGinLiysCTAAGCTTTLeuSerPhe235GATGGAAspGlyCAAAAAGinUys240720GTTTATCGAValTyrArgACTThrATAGCTlieAla245AATAsnacagacThrAspGTAGCGGCTValAlaAla250TGGCCGAATGGTTrpProAsnGly255768AAGGTATATLysValTyrTTA260GGTGlyGTTValacgThrAAAGTTLysVal265GATTTTAGTAspPheSerCAATATGATGATGinTyrAspAsp270816CAAAAAAATGinLy3Asn275GAAGluACTThrAGTThrCAAACAGinThr280TATGATTCATyrAspSerAAAAGAAACAATLysArgAsnAsn2858"GGCCATGTAGlyHisVal290AGTSergcaAlaCAGGinGATAsp235TCTATTSerUeGACCAATTAAspGinLeu300CCGCCAGAAACAProProGluThf912ACAGATGAAThrAspGlu305CCAProCTTLeugaaGlu310AAALysGCATATAlaTyrAGTCATCAGSerHisGin315CTTAATTACGCGLeuAsnTyrAla320360GAATGTTTCGluCysE*heTTALeuATGMet32SCAGGinAspCGTCGTArgArgGGAACAATTGlyThrlie330CCATTTTTTACTProPhePheThr33S1008377TGGACACATAGAAGTGTAGACTTTTTTAATACAAT丁GATGCTGAAAAGTrpThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLys3403453501056ATTACTCAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTlieThrGinLeuProValValLysAlaTyrA'laLeu355360SerSerGlyAla3SSTCCATTATTGAAGC3TCCAGGATTCSerlielieGluGlyProGlyPhe370375ACAGGAGGAAATThrGlyGlyAsn380TTACTATTCCTAlieulieuPheLeu1152AAAGAATCTAGTAATLysGluSerSerAsn385TCAATTGCTserlieAla390AAATTTAAAGTTLysPheLysValACATTAAATTCAThrLeuAsnSer4001200GCAGCCTTGTTACAAAlaAlaLeuLeuGin405CGATATCGTArgTyrArgGTAAGAATACGCValArglieArg410TATGCTTCTACCTyrAlaSerThr415124(JACTAACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTGTCThrAsnLeuArgLeuPheValGinAsnSerAsnAsnAspPheLeuVal4204254301296ATCTACATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAlieTyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGin"044S1344ACATTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGOTGATThrPheAsp'LeuAlaThrThrAsnSe:rAsnMetGlyPheSerGlyAsp4504554601392AAGAATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAALysAsnGluLeulielieGlyAlaGluSex*PheValSerAsnGiuLys4654704754801440ATCTATATAGATAAGATAlieTyrlieAspLyslie485GAATTTATCCCAOTACAATTGTMGluPhelieProValGinLeu"01432(2>序列编号70的信息493个氨基酸氨基酸学线性<ii)分子类型蛋白质《xi)序列描述序列编号70:SerLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGlu1sioisSerHisPheArgAsnSerMetProSerPheAlaValSet*LysPheGlu202530征度型朴俯长类拓序H55<formula>formulaseeoriginaldocumentpage379</formula>325TrpThrHisA1:3SerValAspPhe340lieThrGinLeuProValValLysSerlielieClluGlyProGlyPhe370375PheAlaThr330335AsnThrlieAspAlaGluLys350TyrAlaLeuSerSerGlyAlaGlyGlyAsnLeuLeuPheLeu380LysGluSerSerAsnSerlieAlaLysPhe385390AlaAlaLeuLeuGinArgTyrArgValArg405410LysValThrLeuAsnSer395400lieArgTyrAlaSerThr415ThrAsnLeuArgLeuPheVailGinAsnSerlieTyrThrPhe4S0LysAsn465lieTyr420lieAsnLys43SAspLeuAlaGluLeulie工leAspLys485425ThrMetAsnLysAsp440ThrThrAsnSerAsn455lieGlyAlaGluSer470lieGluPheliePro490AsnAsnAspPheLeu430AspAspLeuThrTyrMetGlyPheSerGly460PheValSearAsnGlu475ValGinL>euValGinAspL*ys480(2)序列编号71的信息:序列特征(A》长度23碱基对(B)类型核苷酸(C)链的性质单链<D)拓朴学线性(xi)序列描述序列编号71:AGACAACTCTACAGTAAAAGATG23(2)序列编号72的信息序列特征长度20J*^(B>类型核苷酸(C链的性质单链(D)拓朴学线性(xi)序列描述序列编号72:GGTAATTGGTCAATAGAATC20(2)序列编号73的信息(i>序列特征<A)长度39碱基对(B>类型核苷酸(C>链的性质单链(D)拓朴学线性(ix>特征(A>名称/关键词经过修饰的碱基(B>定位21..23(D>其它的信息/注释-"N-A,T,G,或C"(xi>序列描迷序列编号73:CAGAAGATGTTGCTGAATTCNNNCATAGACAATTAAAAC"(2)序列编号74的信息(i>序列特征(A)长度34威基对(B>类型核脊酸<C>链的性质单链(D)拓朴学线性Ux)特征(A)名称/关键词经过修饰的碱基(B>定位19..21(D)其它的信息/注释=,A,T,G,或C"(xi)序列描述序列編号74:GATGTTGCTGAATTCTATNNNAGACAATTAAAAC34(2)序列编号75的信息(i)序列特征(A)长度33碱基对(B>类型核苷酸(C)链的性质;羊链(D>拓朴学线性(ix)特征(A>名称/关键词经过修饰的碱基(B)定位:17(D>其它的信息/注释-"N-A,T,C,或G"(ix)特征(A)名称/关键词经过修饰的碱基(B>定位18(D>其它的信息/注释。"N-T,G,C,或A"(ix)特征(A)名称/关鍵词经过修饰的碱基(B)定位19(D)其它的信息/注释="N-A,T,G,或C"(xi)序列描述序列编号75:CCCATTTTATGATATTNNNTTATACTCAAAAGG33(2>序列编号76的信息(i>序列特征<A)长度64*4对(B)类型核苷酸<C>链的性质单链<D)拓朴学线性(ix)特征(A)名称/关键词:(B)定位24(D>其它的信息:经过修饰的M/注释"N-T,G,C,或A"特征(A>名称/关键词经过修饰的g(B>定位:(25,27,28,30,34,36,33,43>的其中之-(D>其它的信息/注幹"N-A,T,G,或C"<ix)特征(A>名称/关鍵词经过修饰的碱基(B>定位(31,33,35,37,42,")的其中之一(D)其它的信息/注释"N-A,G,C,或T"<ix)特征(A)名称/关鍵词经过修饰的碱基(B>定位40(D>其它的信息/注释"N-A,T,C,或G"(ix)特征(W名称/矢链詞经il修饰的械產(B>定位(26,23,32,38,41>的其中之一(D)其它的信息/注释"N-A,T,G,或C"(xi>序列描迷序列编号76:AGCTATGCTGGTCTCGGAAGAAANNNNNNNNNNNNMNNNNNNNNAAAAGAAGCCAAGATC60GAAT64(2>序列编号77的信息(i)序列特征(A)长度40碱基对(B)类型核脊酸(C)链的性质单链(D)拓朴学线性(xi)序列描述序列编号77:GGTCACCTAGGTCTCTCTTCCAGGAATTTAACGCATTAAC40(2>序列编号78的信息(i>序列特征(A>长度65碱基对(B)类型核苷酸(C>链的性质单链(D)拓朴学线性(ix>特征(A>名称/关鍵词经过修饰的A^(B>定位(22,27,23,30,37,42)的其中之一(D)其它的信息/注释="N-A,G,C或T"(ix)特征(A>名称/关键词经过J务饰的M(B)定位(23,26,28,31,3B,40,43,44)的其中之一(D)其它的信息/注释》"N-T,G,C或A"(ix)特征(A)名称/关键词经过修饰的碱基(B)定位<24,33)的其中之一(D)其它的信息/注释="N-A,T,G或C"(ix>特征(A)名称/关鍵词经过修饰的碱基(B>定位(25,32,33,41,46,47,48>的其中之一(D)其它的信息/注释="N-A,T,C或G"(ix)特征(J\>名称/关键词经过修饰的碱基(B)定位34(D>其它的信息/注释="N:A,T,G或C''(ix>特征<A>名称/关键词经过修饰的#(B>定位45(D>其它的信息/注释》"N-A,T,G或C"<ix)特征(A>名称/关键词经过修饰的M(B>定位35..36(D>其它的信息/注释-"N:A,G,C或T"(xi)序列描述序列编号78:AGCTATGCTGGTCTCCCATTTNNNNNNNNNNNNNNNNNNNNNNNNNNNGTTAAAACAGAA60CTAAC65(2)序列编号79的信息(i)序列特征(A)长度36碱^(B>类型核脊酸(C>链的性质单链(D)拓朴学线性Ui>序列描迷序列编号79:ATCCAGTGGGGTCTCAAATGGGAAAAGTACAATTAG36(2)序列编号80的信息(i>序列特征<A>长度63碱基对(B)类型核苷酸(C)链的性质单链(D>拓朴学线性(ix>特征(A>名称/关键词经过修改的磁基(B>定位(23,27,31,36,44>的其中之一(D>其它的信息/注释="N-A.G,C或T"(ix>'特征(A>名称/关键词经过^"改的碱基(B>定位<24,2S,25,33,35,38)的其中之一(D)'其它的信息/注释。"N-A,T,G或C"(ix)特征(A)名称/关键词经过修改的碱基(B)定位:(28,34,37>的其中之一(D)其它的信息/注释。"N-A,T,G或C"(ix)特征(A)名称/关键词经过修改的碱基(B)定位(29,30,32,39,42,45)的其中之一(D)其它的信息:/注释="N-T,G,C或A"(ix)特征(A>名称/关键词经过修改的碱基(B>定位(40,43)的其中之一<D)其它的信息:/注释》"N-A,T,C或G"Ux)特征(A>名称/关健词经过修改的碱基(B)定位41(D)其它的信息/注释》"N-A,C,T或G"特征(A)名称/关键词经过修改的碱基<B)定位46(D)其它的信息/注释-"N-A,T,G或C"<xi)序列描迷序列编号80:CATTTTTACGGATCCAATTTTTNNNNNNNNNNNNNNNNNNNNNNNNGGACCAACTTTTTT60GAG63(2)序列编号81的信息(i>序列特征(A)长度62城基对(B>类型核苷酸<C)链的性质单链(D)拓朴学链状(ix)特征(A>名称/关键词经过修改的碱基(B>定位(28,31,32,33,42)的其中之一(D>其它的信息/注释-"N-A,G,C或T"(ix>'特征(A>名称/关健词经过修改的碱基(B>定位(29,38,39,41)的其中之一<D>其它的信息/注释="N-T,G,C或A"(ix)特征(A)名称/关徙词经过修改的碱基(B>定位30(D)其它的信息/注释="N-A,T,G或C"(ix)特征(A)名称/关键词经过修改的M(B)定位(34,35,40)的其中之一(D)其它的信息/注释="N-A,T,C或G"(ix)特征(A>名称/关键词经过修改的磁<基(B)定位36(D)其它的信息/注释="N-A,T,G或C"(ix)特征(A)名称/关键词经过修改的磁基(B)定位37(D)其它的信息:/注释="N:A,T,G或C"(xi>序列描迷序列编号81:GAATTTCATACGCGTCTTCAACCTGGTNNNNNNNNNNNNNNNTCTTTCAATTATTGGTCT60GGS2(2)序列编号82的信息(i>序列特征(A)长度73碱基对(B>类型核苷酸(C>链的性质单链(D)拓朴学链状(ix)特征:(A)名称/关键词经过修改的M(B)定位(41,49,52)的其中之一(D>其它的信息/注释-"N-A,G,C或T(ix>特征(A)名称/关键词经过修改的磁基(B>定位42..43(D)其它的信息/注释="N-A,T.C或G"(ix)特征(A)名称/关键词经过修改的碱基<B>定位44..4S(D)其它的信息/注释="N-A,T,G或C"tix)特征(A)名称/关健词经过"(I"改的A4(B)定位46(D)其它的信息/注释="N-A,T,G或C"(ix)特征(A>名称/关键词经过修改的碱基(B>定位(47,4B,53,54>的其中之一(D)其它的信息/注释="N-T,G,C或A"特征(A)名称/关健词经过修改的碱基(B)定位(50,51,55)的其中之一(D)淇它的信息/注释""N-A,T,C或G"(xi)序列描迷序列编号82:AAAAGTTTATCGAACTATAGCTAATACAGACGTAGCGGCTNNNNNNNNNNNNNNNGTATA60TTTAGGTGTTACG73(2)序列编号83的信息(i)序列特征(A)长度20威基对(B)类型核苷酸(C)链的性质单链《D)拓朴学链状(xi)序列描迷序列编号83:GGAGTTCCATTTGCTGGGGC20(2)序列编号84的信息(i)序列特征(A>长度17威基对(B>类型核脊酸(C)链的性质单链(D)拓朴学链状(xi>序列描迷序列编号84:ATCTCCATAAAATGGGG17(2)序列编号85的信息(i>序列特征(A)长度32碱基对(B)类型核苷酸(C)链的性质羊链(D>拓朴学链状(xi>序列描述序列编号85:GCGAAGTAAAAGAAGCCAAGGTCGAATAAGGG32(2>序列编号86的信息序列特征(A)长度43威基对(B)类型核苷酸(C)链的性质单链(D)拓朴学链状(xi)序列描述序列编号86:CCTTTAAGTTTGCGAAATCCACACAGCCAAGGTCGAATAAGGG43<2>序列编号87的信息(i>序列特征(A>长度35J成基对(B>类型核苷酸<C>链的性质单链(Dl拓朴学链状Ui>序列描述序列编号87:CCCATTTTATGA丁GTTCGGTTATACCCAAAAGGGG35(2)序列编号88的信息(i>序列特征(A)长度25减基对(B)类型核普酸(C)链的性质单链(D)拓朴学链状(xi>序列描述序列编号88:GGCCAAGTGAAGACCCATGGAAGGC25(2>序列编号89的信息(i)序列特征(A>长度22;大&对(B>类型核苷酸(C)链的性质单链(D)拓朴学链状(xi)序列描述序列编号89:GCAGTTTCCGGATTCGAAGTGC(2)序列编号90的信息(i>序列特征(A>长度17碱基对(8>类型核苷酸(C)链的性质单链(D)拓朴学链状(xi)序列描迷:序列编号90:CCGCTACGTCTGTATTA17(2>序列编号91的信息<i)序列特征(A>长度17城基对(B)类型核苷酸(C)链的性质单链(D)拓朴学链状序列描述序列编号91:ATAATGGAAGCACCTGAL7(2)序列编号92的信息(i)序列特征(A>长度60碱基对(B)类型核苷酸(C)链的性质羊链(D啦朴学:链状208(ix)特征(A)名称/关键词经过修改的碱基(B)定位(22,2S,29)的其中之一(D)其它的信息/注释-"N-T,G,C或A"(ix)特征(A)名称/关键词经过修改的碱基(B)定位(23,33,36)的其中之一(D)其它的信息/注释="N-A,G,C或T"(ix)特征(A)名称/关键词经过修改的碱基(B)定位(24,27,28,32,35,37,38)的其中之一(D>其它的信息/注释="N-A,T,C或G"(ix>特征(A>名称/关键词经过修改的碱基(B>定位(2S,30,31,34)的其中之一(D)其它的信息/注释="N-A,T,G或C"(ix)特征(A)名称/关键词经过修改的*(B)定位39(D)其它的信息/注释="N-A,T,G或C"(xi)序列描迷序列编号92:AGCTATGCTGGTCTCTTCTTANNNNNNNNNNNNNNNNNNACAATTCCATTTTTTACTTGG60(2)序列编号93的信息(i)序列特征<A)长度40碱基对(B)类型核苷酸(C)链的性质单链(D)拓朴学链状Ui)序列描迷序列编号93:ATCCAGTTGGGTCTCTAAGAAACAAACCGCGTAATTAAGC40(2)序列编号94的信息(i>序列特征(A>长度20絲对(B)类型核芬酸(C>链的性质单链(D>拓朴学链状(xi)序列描迷序列编号94:CCTCAAGGGTTATAACATCC20(2>序列编号95的信息(i)序列特征(A)长度55碱基对(B>类型核苷酸(C)链的性质单链(D)拓朴学链状(ix)特征(A)名称/关键词经过^"改的磁l(B>定位(13,22,23,31)的其中之一<D)其它的信息/注释-"N-A,T,C或G"(ix)特征(A)名称/关键词经过修改的44*(B)定位(20,26,27,23,30,35)的其中之一(D)其它的信息/注释-"N-T,G,C或A"(ix)特征(A)名称/关键词经过修改的碱基(B)定位(21,32,34>的其中之一(D>其它的信息/注释="N-A,G,C或T"(ix)特征(A)名称/关键词经过修改的碱基(B)定位:(24,33>的其中之一(D)其它的信息/注释="N:A,T,G或C"<ix>特征(A)名称/关键词经过修改的#(B)定位25(D)其它的信息:/注释'"N-A,G,T或C"Ux)特征(A)名称/关键词经过修改的4(B)定位28(D)其它的信息/注释="N-A,T,G或C"(ix)特征(A)名称/关键词经过修改的碱基<B>定位3S(D)其它的信息/注释="N-A,G,C或T"(xi)序列描迷序列编号95:GTACAAAAGCTAAGCTTTNNNNNNNNNNNNNNNNNNCGAACTATAGCTAATACAG55(2》序列编号96的信息(i)序列特征(A)长度7个氨基酸(B)类型氨基酸(C)链的性质单链<D)拓朴学链状(xi)序列描述序列编号96:SerLysArgSerGinAspArg(2)序列编号97的信息(i)序列特征(A)长度1959个氨基酸(B)类型氨基酸(C》链的性质单链(D>拓朴学链状《ix)特征(A)名称/关键词CDS(B)定位1..1956(xi》序列描述序列编号97:ATGAATMetAsnCCAProAACAsnAATAsn5CGAArgAGTSerGAAGluCATHisGATAsp10ACGThrATAlieAAGGTTValACAThr15CCTPro48AACAGTAsnSerGAAGluTTGLeu20CAAGinACTAACCATHisAATAsn25CAAGinTATCCTProTTALeuGCTAla30GACAspAATAsn96CCAAATProAsnTCA35ACAThrCTALeuGAAGluGAAGluTTA40AATAsnTATTyrAAAIiysGAAGluTTTPhe45TTAATGMet144ACTGAAThrGlu50GACAspAGTSerTCTSerACGThrGAAGlu55GTGValCTAGACAspAACAsnTCTSerGOACAThrGTAValAAALiysGATAsp192GCAGTTAlaValGGGACAThr*GGAATTlie70TCTGTTValGGGCAGGin75ATTlieTTAGGTGTTGTAVal80240GGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATCAATCATTTCTT288GlyValProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu859095AACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCAAsnThrlieTrpProSerAspAlaAspProTrpLysAla-PheMetAla100105110336CAAGTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTGinValGluValLeulieAspLysLyslieGluGluTyrAlaLysSer*115120125384AAAGCTCTTGCALysAlaLeuAla130OAGTTACAGGGTCTTCAAAATAATTTCGAAGATTATGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr135140432GTTAATGCGTTAValAsnAlaLeu145AATTCCTGGAA<3AAAACACCTTTAAGTTTGCGAAGTAsnSerTrpLysLysThrProLeuSerLeuArgSerISO155160480AAAAGAAGCCAAGATCGAATAAGGLysArgSerGinAspArglieArg165GAACTTTTTTCTCAAGluLeuPheSerGin170GCAGAAAGTAlaGluSer175S28CATTTTCGTAATTCCATGCCGTCATTTHisPheArgAstiSerMetProSerPhe180185GCAGTTTCCAAATTCGAAGTGAlaValSerLysPheGluVal190576CTGTTTCTACCAACATATLeuPheLeuProThrTyr195GCACAAAlaGin200GCTCCAAATACACATTTATTGCTAAlaAlaAsnThrHisLeuLeuLeu205624TTAAAALeuLys210GATGCTAspAlaCAAGinGTTValTTTPhe215GGAGlyGluGAAGluTGGGGATATTrpGlyTyr220TCTTCAGAASerSerGlu672GATGTTGCTGAATTTTATCATAGACAATTAAAACTTACACAACAATACAspValAlaGluPheTyrHisArgGinLeuLysI^uThrGinGinTyr225230235240720ACTGACCATTGTThrAspHiscysGTTVal245AATAsnTGGTrpTATTyrAATAsnGTTVal2S0GGATTAAATGlyLeuAsnGGTTTAAGAGlyI*euArg25S768GGTTCAACTTATGATGCATGGGTCAAATTTAACCGTTTTCGCAGAGAAGlySerThrTyrAspAlaTrpValLysPheAsnArgPheArgArgGlu2602652708"ATGACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATGATMetThrLeuThrValLeuAspLeu工leValLeuPheProPheTyrAsp275280285864ATTCGGTTATACTCAAAAGGGGTTAAAACAGAACTAACAAGAGACATTrieArgLeuTyrSerLysGlyValLysThrGluLeuThrArgAsplie290295300912TTTACGGATCCAATTTTTTCACTTAATACTCTTCAGGAGTATGGACCA9S0PheThrAspPro工lePheSerLeuAsnThrLeuGinGluTyrGlyPro30S310315320ACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCATTTATTTGATThrPheLeuSerlieGluAsnSer工leA巧LysProHisLeuPheAsp32533033S1008TATTTACAGGGGATTGAATTTCATACGCGTCTTTyrLeuGinGiylieGluPheHisThrArgLeu34034SCAACCTGGTTACTTTGinProGlyTyrPhe3501056GGGAAAGATTCTTTCAATTATTGGTCTGGTAATTATGlyLysAspSerPheAsnTyrTrpSerGlyAsnTyr35S360GTAGAAACTAGAValGluThrArg1104CCTAGTATAGGATCTAGTAAGACAATTACTTCCCCAProSerlieGlySerSerLysThrlieThrSerPro37037S380TTTTATGGAGATPheTyrGlyAsp11S2AAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATLysSerThrGluProValGinLysLeuSerPheAsp385390395GGACAAAAAGTTGlyGinLysVal4001200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGTyrArgThrlieAlaAsnThrAspValAlaAlaTrp405410CCGAATGGTAAGProAsnGlyLys41S1248GTATATTTAGGTGTTACGAAAGTTGATTTTACTValTyrLeuGlyValThrLysValAspPheSer420425CAATATGATGATCAAGinTyrAspAspGin4301296AAAAATI*ysAsnGAAACTAGTGluThrSer435ACACAAThrGinACAThr440TATGATTyrAspTCASerAAAAGAAACAATArgAsnAsn445GGCGly1344CATGTAHisVal450AGTGCACAGSerAlaGinGATTCTAspSer455ATTlieGACCAAAspGinTTAlieuCCGPro460CCAGAAACAProGluThrACAThr1332GATAsp465GAAGluCCACTTProLeuGAAGluAAAGCALysAla470TATTyrAGTCATSerHisCAGGin475CTTLeuAATTACGCGAsnTyrAlaGAAGlu4801440TGTCysTTCPheTTAATGLeu.MetCAGGin485GACAspCGTArgCGTArgGGAACAGlyThr430ATTlieCCAProTTTTTTACTPhePheThr435TGGTrp1488ACAThrCATHisAGAAGTArgSer500GTAValGACAspTTTPheTTTPheAsnThr505ATT工leGATAspGCTC3AAAAGAlaGluLys510ATTlie1536ACTThrCAAGinCTTCCALeuPro5i5GTAGTGvalAAAGCAAla520TATGCCTyrAlaTTGLeuTCT5erTCAGGTGCTSer*GlyAla525TCCSer1584ATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTACTATTCCTAAAAlielieGluGlyProGlyPheThrGlyGlyAsnLeuLeuPheLeuLys530535540GAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCA1680GluSerSerAsnSerlieAlaLysPheLysValThrLeuAsnSerAlaS45550555560GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACT1728AlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThr565570575AACTTACGACTTTTTGTGCAAAATAsnleuArgLeuPheValGinAsn580TCAAACAATGATTTTCTTGTCATCSerAsnAsnAspPheLeuVallie5855901776TACTyrATTAATlieAsnS95AAAACTATGAATAAAGATGATGATTTAACATATCAAACAI*ysThrMetAsnLysAspAspAspLeuThj:TyrGinThr6006051824TTTGATCTCGCAACTACTAATTCTAATATGGGGTTCTCGGGTGATAAGPheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys6106156201872AATGAACTTATAATAGGAGCAGAATCTTTCGTTTCTAATGAAAAAATC1920AsnGluLeulielieGlyAlaGluserPheValSerAsnGluLyslie62S630"0TATATAGATAAGATAGAATTTATCTyrlieAspLyslieGluPhelie645CCAGTACAATTGTAAProValGinLeu65019S9(2》序列编号98的信息(i)序列特征(A>长度652个g酸(B>类型氨基酸(D)拓朴学线性(ii>分子类型蛋白质序列描述序列编号98:GluHisAspThrlieLysValThrPro1015HisAsnGinTyrProLeuAlaAspAsn2530MetAsnProAsnAsnArgSerAsnSerGluLeuGinThrAsn20proAsnSerThrLeuGluGluLeuAsnTyrLysGluPhelieuArgMet3S4045ThrGluAspSerSerThrGluValLeuAspAsrvSerThrValLysAsp505560AlaValGlyThrGlylieSerValValGlyGinlieLeuGlyValVal6S707580G],yValProPheAlaGlyAlaLeuThr85AsnThrlieTrpProSerAspAlaAsp100105GinValGluValLeulieAspLysLysIIS120SerPheTyrGinSerPhelieu3095ProTrpLysAlaPheMetAla110lieGluGluTyr*AlaLysSer125LysAiaLeuAlaGluLeuGinGlyLeuGinAsnAsnPheGluAspTyr130135140ValAsnAlaLeuAsnSerTrpLysLysThrProLeuSerLeuArgSer145150155ISOLysArgSerGinAspArglieArgGluLeuPheSerGinAlaGluSer1"170175HisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal185190ThrTyrAlaGinAlaAlaAsnThrHisLeuUeu200205AlaGinValPheGlyGluGluTrpGlyTyr*SerSerGlu215220GluPheTyrHisArgG丄nLeuLysLeuThrGinGinTyr230235240CysValAsnTrpTyrAsnValGlyLeuAsnGlyLeuArg2452S0255TyrAspAlaTrpVaLLysPheAsnArgPheArgArgGlu260265270ThrValLeuAspIjeulieValLeuPheProPheTyrAsp28028STyrSerLysGlyValLysThrGluLeuThrArgAsplie295300Pro工lePheSerAsnThrL<euGinGluTyrGlyPro310315320lieGluAsnSerlieAargLysProHisLeuPheAsp325330335GlylieGluPheHisThrArgLeuGinProGlyTyrPhe340345350Ser*PheAsnTyrTrpSerGlyAsnTyrValGluThrArg360180LeuPheLeuPro135LeuLysAsp210AspValAlaThrAspHisGlySex*ThrMetThr*Leu275工leArgLeu290PheThrAsp305ThrPhel*euSer:TyrLeuGinGlyLysAsp355ProSerlieGlySerSerLysThrlieThrSerProPheTyrGlyAsp370375380LysSerThrGluProValGLriLysLeuSerPheAspGlyGinLysVal385390395400TyrArgThr工leAlaAsnThrAspValAlaAlaTrpProAsnGlyLys"0415ValTyrLeuGlyVal42040SThrLysValLysAsnGluThrSerThrGinThr435440AspPheSerGinTyrAspAspGin425430TyrAspSerLysArgAsnAsnGly44SHisValSerAUGin450AspSerlieAsp455AspGluProLeuGluLys465470CysPheL>euMetGinAsp485MaTyr*SerArgAxgGlyGinL^uProProGluTharThr460HisGinLeuAsnTyrAlaGlu475480ThrlieProPhePheThrTrp490495ThrHisArgSerVal500ThrGinLeuProValS15lieGluGlyProS30GluSerSerAsnSer545AlaLeuLeuGinArg56SAsnLieuAr*gl*euPhe580TyrlieAsnLysThr595PheAspLeuAlaThr610AsnGluLeutieS2STyrlieA印Lyslie(2>序列编号的的信息(i)序列特征AspPhePheAsn505ThrlieAspAlaGluLys510lieValLysAlaTyrAlaLeuSerSerGlyAlaSer520GlyPheThr*GlyGlyAsnLeu540lieAlaLysPheLysValThr550555TyrArgValArglieArgTyr570ValGinAsnSerAsnAsnAsp585MetAsnL/ysAspAspAspLeu600ThrAsnSerAsnMetGlyPhe615620GlyAlaGluSerPheValSer630635GluPhelieProValGinLeu650525LeuPheIj三uLeuAsnSerAlaSerThr575Phelieuval530ThrTyr<3lriSer*GlyAspAsnGluLysLysAlaThrlieThrLyslie"0(A)长度20004对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性(xi)序列描迷序列编号99:CCATCCATGGCMACCCTAACAATCGTTCCGAACACGACACCATCAAGGTTACTCCAAAC60TCTGAGTTGCAAACTAATCACAACCAGTACCCATTGGCTGACAATCCTAACAGTACTCTT120GAGGAACTTAACTACAAGGAGTTTCTCCGGATGACCGAAGATAGCTCCACTGAGGTTCTC180GATAACTCTACAGTGAAGGACGCTGTTGGAACTGGCATTAGCGTTGTGGGACAGATTCTT240GGAGTGGTTGGTGTTCCATTCGCTGGAGCTTTGACCAGCTTCTACCAGTCCTTTCTCAAC300ACCATCTGGCCTTCAGATGCTGATCCCTGGAAGGCTTTCATGGCCCAAGTGGAAGTCTTG3SOATCGATAAGAAGATCGAAGAGTATGCCAAGTCTAAAGCCTTGGCTGAGTTGCAAGGTTTG420CAGAACAACTTCGAGGATTACGTCAACGCACTCAACAGCTGGAAGAAAACTCCCTTGAGT480CTCAGGTCTAAGCGTTCCCAGGACCGTATTCGTGAACTTTTCAGCCAAGCCGAATCCCAC540TTCAGAAAC丁CCATGCCTAGCTTTGCCGTTTCTAAGTTCGAGGTGCTCTTCTT(3CCAACAS00TACGCACAAGCTCCCAACACTCiXTCTCTTGCTTCTCAAAGACGCTCAGGTGTTTGGTGAG660GAATGGGGTTACTCCAGTGAAGATGTTGCCGAGTTCTACCGTAGGCAGCTCAAGTTGACT720CAACAGTACACAGACCACTGCGTCAACTGGTACAACGTTGGGCTCAATGGTCTTAGAGGA780TCTACCTACGACGCATGGGTGAAGTTCAACAGGTTTCGTAGAGAGATGACCTTGACTGTG840CTCOATCTTATCGTTCTCTTTCCATTCTACGACATTCGTCTTTACTCCAAAGGCGTTAAG300ACAGAGCTGACCAGAGACATCTTCACCGATCCCATCTTCCTACTTACGACCCTGCAGAAA960TACGGTCCAACTTTTCTCTCCATTGAGAACAGCATCAGGAAGCCTCACCTCTTCGACTAT1020CTGCAAGGCATTGAGTTTCACACCAGGTTGCAACCTGGTTACTTCGGTAAGGATTCCTTC1080AACTACTGGAGCGGAAACTACGTTGAAACCAGACCATCCATCGGATCTAGCAAGACCATC1140ACTTCTCCATTCTACGGTGACAAGAGCACTGAGCCAGTGCAGAAGTTGAGCTTCGATCGG1200CAGAAGGTGTATW3AACCATCGCCAATACCGATGTTGCAGCTTGGCCTAATGGCAAGGTC1260TACCTTGGAGTTACTAAAGTOGACTTCTCCCAATACGACGATCAGAAGAACGAGACATCT1320ACTCAAACCTACGATAGTAAGAGGAACAATGGCCATC5TTTCCGCACAAGACTCCATTC3ACUB0TTGGAGAAGGCTTACAGTCACCAACTTAAC1440TACGCCGAATGCTTTCTCATGCAAGACAGGCGTGGCACCATTCCGTTCTTTACATGGACT1500CACAGGTCTGTCGACTTCTTTAACACTATCGACGCTGAGAAGATTACCCAACTTCCCGTG1560GTCAAGGCTTATGCCTTGTCCAGCGGAGCTTCCATCATTGAAGGTCCAGGCTTCACCGGTGGCAACTTGCTCTTCCTTAAGGAGTCCAGCAACTCCATCGCCAAGTTCAAAGTGACACTTIS80AACTCAGCAGCCTTGCTCCAACGTTACAGGGTTCGTATCAGATACGCAAGCACTACCAAT1740CTTCGCCTCTTTGTCCAGAACAGCAACAATGATTTCCTTGTCATCTACATCAACAAGACT1800ATGAACAAAGACGATGACCTCACCTACCAAACATTCGATCTTGCCACTACCAATAGTAAC1.860ATCGGATTCTCTGGTGACAAGAACGAGCTGATCATAGGTGCTGAGAGCTTTGTCTCTAAT1920GAGAAGATTTACATAGACAAGATCGAGTTCATTCCAGTTCAACTCTAATAGATCCCCCGG1300GCTGCAGGAATTCGATATCA2000(2)序列编号100的信息(i)序列特征(A)长度653个氨基酸《B)类型氨基酸(C)链的性质(D)拓朴学线性(xi)序列描迷序列编号:MetAlaAsnProAsnProAsnSerGluLeu20AsnProAsnSerThr.35MetThrGlu50Asp65AlaValAspSerGlyThr100:AsnArgSerGluHisAspThrlieLysValThr1015GinThrAsnHisAsnGinTyrProLeuAlaAsp2S30LeuGluGluLeuAsnTyrLysGluPheLeuArg4045SerThrGluValLeuAspAsnSerThrValLys55'SOGlylieSerValValGlyGinlieLeuGlyVal707S80ProPhe85AlaGlyAlaLeuThrSerPheTyrGinSerPhe9095ValGlyValLeuAsnThrlieTrpProSerAspAlaAspProTrpLysAlaPheMet100105110AlaGinValGluvalLeulie115AspLysLyslie120GluGluTyrAlaLys125SerLysAlaLeuAlaGluLeu130135GinGlyLeuGinAsnAsnPheGluAsp140TyrValAsnAlaLeuAsnSer145150SerLysArgSerGinAspArg165TrpLysLysThr155ProLeuSerLeuArg160lieArgGluLeuPheSerGinAlaGlu170175SerHisPheArgAsnSer180MetProSerPheAlaValSerLysPheGlu185190ValLeuPheLeuProThr195TyrAlaGinAlaAlaAsnThrHisLeuLeu200205LeuIjeu210LysAspAlaGinValPheGlyGluGlu215TrpGlyTyrSerSer220GluAspValAlaGluPhe225230TyrArgArgGinLeu235LysLeuThrGinGin240TyrThrAspHisCysValAsnTrpTyrAsnVal245ArgrGlySerThr*TyrAspAla260GluMetThfThrVal275TrpVal2SS280250LysPheAsnlieValLeuGlyLeuAsnGlyLeu255270PhePro28SArgPheTyrAsplieliePhe305ArgLeuTyrSerLysGlyValLys295ThrAspProlie310PheLeuLeuThrProThrPheLeuSerlieGluAsnSer32SAspTyrLeuGinGlylieGluPheHis340345PheGlyLysAspSerPheAsnTyrTrp3553S0lie330ThrThrGluThrLeu315ArgLysArgLeuGlyAsnLeuThrArgAspTyrGinLysProHisGinPro350TyrVal365Lieu335Gly320PheGlyTyrGluThrArgPro370AspLys385SerlieGlySerSerThrGluPro390Ser375ValLysThrGinLyslieLeuThrSer380SerPhe395ProPheTyrGlyAspGlyGinLys400ValTyrArgThrlieAlaAsnThrAspValAlaAlaTrpProAsnGly40S410415LysValTyrLeuGlyValThrLysValAspPheSerGinTyrAspAsp420425430GinLysAsnGluThrSerThrGinThrTyrAspSerLysArgAsnAsnGlyHis4S0TharAsp4S5GluCys435440ValSerAlaGinAspSerlieAspGin4SSGluProLeuGluLysAlaTyrSerHis470475PheLeuMetGinAspArgArgGlyThr485490445LeuProProGluThr""0OlnLeuAsnTyrAla480lieProPhePheThr495TrpThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLys500SOSS10lieThrGinLeuProValValLysAlaTyrAlaLeuSerSerGlyAla520525GlyProGlyPheThrGlyGlyAsnLeuLeuPhet^u535540AsnSerlieAlaLysPheLysValThrLeuAsnSer550555560GinArgTyrArgValArglieArgTyxAlaSerThr565570575S15SerUelieGlu530LysGluSerSerS4SAlaAlaLeuLeuThrAsnlieuArg580lieTyrlieAsnThrPheAspLeu610LysAsnGluLeulieTyrlieAsp(2)序列编号101的信息LeuPheValLysThrMetAlaThrThf615GinAsnSerAsnAsnAspPheLieuVal585590AsnLysAspAspAspLeuThrTyrGin600605AsnSerAsnMetGlyPheSerGlyAsp620lielieGlyAlaGluSerPheValSerAsnGluLys"0635640LyslieGluPheliePi:oValGinLeu645650(i》序列特征(A)长度2050#对(B)类型核苷酸(C)链的性质单链(D)拓朴学线性(xi)序列描述序列编号10TGGAGCTCCACCGCGGTGGCGGCCGCTCTAGAACTAGTGGATCTAGGCCTCCATATGAAC60CCTAACAATCGTTCCGAACACGACACCATCAAGGTTACTCCAAACTCTGAGTTGCAAACT120AATCACAACCAGTACCCATTGGCTGACAATCCTAACAGTACTCTTGAGGAACTTAACTAC180AAGGAGTTTCTCCGGATGACCGAAGATAGCTCCACTGAGGTTCTCGATAACTCTACAGTG240AAGGACGCTGTTGGAACTGGCATTAGCGTTGTGGGACAGATTCTTGGAGTGGTTGGTGTT300CCATTCGCTGGAGCTTTGACCAGCTTCTACCAGTCCTTTCTCAACACCATCTGGCCTTCA360GATGCTGATCCCTGGAAGGCTTTCATGGCCCAAGTGGAAGTCTTGATCGATAAGAAGATC420GAAGAGTATGCCAAGTCTAAAGCCTTGGCTGAGTTGCAAGGTTTGCAGAACAACTTCGAG480GATTACGTCAACGCACTCAACAGCTGGAAGAAAACTCCCTTGAGTCTCAGGTCTAAGCGT540TCCCAGGACCGTATTCGTGAACTTTTCAGCCAAGCCGAATCCCACTTCAGAAACTCCATG600CCTAGCTTTGCCGTTTCTAAGTTCGAGGTGCTCTTCTTGCCAACATACGCACAAGCTGCC660AACACTCATCTCTTGCTTCTCAAAGACGCTCAGGTGTTTGGTGAGGAATGGGGTTACTCC720AGTOAAGATGTTGCCGAGTTCTACCATAGGCAGCTCAAGTTGACTCAACAGTACACAGAC780CACTGCGTCAACTGGTACAA.CGTTGGGCTCAATGGTCTTAGAGGATCTACCTACGACGCA840TGGGTGAAGTTCAACAGGTTTCGTAGAGAGATGACCTTGACTGTGCTCGATCTTATCGTT900CTCTTTCCATTCTACGACATTCGTCTTTACTCCAAAGGCGTTAAGACAGAGCTGACCAGA960GACATCTTCACCGATCCCfiTCTTCTCACTTAACACCCTGCAGGAATACGGTCCAACTTTT1020CTCTCCATTGAGAACAGCATCAGGAAGCCTCACCTCTTCGACTATCTGCAAGGCATTGAG1080TTTCACACCAGGTTGCAACCTGGTTACTTCGGTAAGGATTCCTTCAACTACTGGAGCGGA1140AACTACGTTGAAACCAGACCATCCATCGGATCTAGCAAGACCATCACTTCTCCATTCTAC1200GGTGACAAGAGCACTGAGCCAGTGCAGAAGTTGAGCTTCGATGGGCAGAAGGTGTATAGAU€0ACCATCGCCAATACCGATGT丁GCAGCTTGGCCTAATGGCAAGGTCTACCTTGGAGTTACT1320AAAGTGGACTTCTCCCAATACGACGATCAGAAGAACGAGACATCTACTCAAACCTACGAT1380AGTAAGAGGAACAATGGCCATGTTTCCGCACAAGACTCCATTGACCAACTTCCACCTGAAl"OACCACTGATGAACCATTGGAGAAGGCTTACAGTCACCAACTTAACTACGCCGAATGCTTT1500CTCATGCAAGACAGGCGTGGCACCATTCCGTTCTTTMCAC丁ATCGACGCTGAGAAGATTTTGTCCAGCC3GAGCTTCCATCATTGAAGGTCTTAAGGAGTCCAGCAACTCCATCGCCAAGCTCCAACGTTACAGGGTTCGTATCAGATACCAGAACAGCAACAATCATTTCCTTGTCATCC5ACCTCACCTACAACACATTCGATCTTGCCGACAAGAACGAGCTGATCATAGGTGCTGAGGACAAGATCGAGTTCATTCCAGTTCAACTCTATCAAGCTT(2)序列编号102的信息U)序列特征(A)长度2280碱基对(B>类型核苷酸(C)链的性质单链(D)拓朴学线性TTCTTTACATGGACTCACAGGTCTGTCGAC1560ACCCAACTTCCCGTGGTCAAGGCTTATGCC1620CCAGGCTTCACCGGTGGCAACTTGCTCTTCIS80TTCAAAGTGACACTTAACTCAGCAGCCTTG1740GCAAGCACTACCAATCTTCGCCTCTTTGTC1800TACATCAACAAGACTATGAACAAAGACGAT1860ACTACCAATAGTAACATGGGATTCTCTGGT1920AGCTTTGTCTCTAATGAGAAGATTTACATA1980TAATAGATCCCCCGGGCTGCAGGAATTCGA20402050(xi)序列描述序列编号102:TTAAAATTAATTTTGTATACTTTTCATTGTAATAATATGATTTTAAAAACGAAAAAGTGC60ATATACAACTTATCAGGAGGGGGGGGATGCACAAAGAAGAAAAGAATAAGAAGTGAATGT120TTATAATGTTCAATAGTTTTATGGGAAGGCATTTTATCAGGTAGAAAGTTATGTATTATG1B0ATAAGAATGGGAGGAAGAMAATGAATCCAAACAATCGAAGTGAACATOATACGATAAAG240GTTACACCTAACAGTGAATTGCAAACTAACCATAATCAATATCCTTTAGCTGACAATCCA300AATTCAACACTJ^GAAGAATTAAATTATAAAGAATTTTTAAGAATGACTGAAGACAGTTCT350ACGGAAC3TGCTAGACAACTCTACAGTAAAAGATGCAGTTGGGACAGGAATTTCTGTTGTA420GOGCAGATTTTAGGTGTTGTAGGAGTTCCATTTGCTGGGGCACTCACTTCATTTTATCAA480TCATTTCTTAACACTATATGGCCAAGTGATGCTGACCCATGGAAGGCTTTTATGGCACAA540GTTGAAGTACTGATAGATAAGAAAATAGAGGAGTATGCTAAAAGTAAAGCTCTTGCAGAGSOOTTACAGGGTCTTCAAAATAATTTCGAAGATTATC3TTAATGCGTTAAATTCCTGGAAGAAA660ACACCTTTAAGTTTGCGAAGTAAAAGAAGCCAAGATCGAATAAGGGAACTTTTTTCTCAA720GCAGAAAGTCATTTTCGTAATTCCATGCCGTCATTTGCAGTTTCCAAATTCGAAGTGCTG780TTTCTACCAACATATGCACAAGCTGCAAATACACATTTATTGCTATTAAAAGATGCTCAA840GTTTTTGGAGAAGAATGGGGATATTCTTCAGAAGATGTTGCTGAATTTTATCATAGACAA900TTAAAACTTACACAACAATACACTGACCATTGTGTTAATTGGTATAATGTTGGATTAAAT960GGTTTAAGAGGTTCAACTTATGATGCATGGGTCAAATTTAACCOTTTTCGCAGA(3AAATG1020ACTTTAACTGTATTAGATCTAATTGTACTTTTCCCATTTTATCATATTCGGTTATACTCA1080AAAGGGGTTAAAACAGAACTAACAAGAGACATTTTTACGGATCCAATTTTTTCACTTAAT1140'ACTCTTCAGGAGTATGGACCAACTTTTTTGAGTATAGAAAACTCTATTCGAAAACCTCAT1200TTATTTGMTATTTACAGGGGATTGAATTTCATACGCGTCTTCAACCTGGTTACTTTGGG1260AAAGATTCTTTCAATTATTGGTCTGGTAATTATGTAGAAACTAGACCTAGTATAGGATCT1320AGTAAGACAATTACTTCCCCATTTTATGGAGATAAATCTACTGAACCTGTACAAAAGCTA13BOAGCTTTGATGGACAAAAAGTTTATCGAACTATAGCTAATACAGACGTTVGCGGCTTGGCCG1440AATGGTAAGGTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAAAA1500AATGAAACTAGTACACAAACATATGATTCAAAAAC-AAACAATGGCCATGTAAGTGCACAG1560GATTCTATTGACCAMTACCGCCAGAAACAACAGATGAACCACTTGAAAAAGCATATAGT1620CATCAGCTTAATTACGCGGAATGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTT1680TTTACTTGGACACATAGAAGTGTAGACTTTTTTAATACAATTGATGCTGAAAAGATTACT1740CAACTTCCAGTAGTGAAAGCATATGCCTTGTCTTCAGGTGCTTCCATTATTGAAGGTCCA1800GGATTCACAGGAGGAAATTTACTATTCCTAAAAGAATCTAGTAATTCAATTGCTAAATTT1860AAAGTTACATTAAATTCAGCAGCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCT1320TCTACCACTAACTTACGACTTTTTGTGCAAAATTCAAACAATGATTTTCTTG丁CATCTAC1980ATTAATAAAACTATGAATAAAGATGATGATTTAACATATCAAACATTTGATCTCGCAACT2040ACTAATTCTAATATGGGGTTCTCGGGTGATAAGAATGAACTTATAATAGC3AGCAGAATCT2100TTCGTTTCTAATGAAAAAATCTATATAGATAAGATAGAATTTATCCCAGTACAATTGTAA2160GGAGATTTTAAAATGTTGGGTGATGGTCAAAATGAAAGAATAGGAAGGTGAATTTTGATG2220GTTAGGAAAGATTCTTTTAACAAAAGCAACATGGAAAAGTATACAOTACAAATATTAACC2280(2》序列编号103的信息:U>序列特征(A)长度32碱基对(B)类型核苷酸(C>链的性质单链(D)拓朴学线性(xi>序列描述序列编号103:TAGGCCTCCATCCATGGCAAACCCTAACAATC32(2>序列编号104的信息(i>序列特征(A)长度42威基对(B)类型核脊酸(C)链的性质单链<D)拓朴学线性(xi)序列描述序列编号104:TCCCATCTTCCTACTTACGACCCTGCAGAAATACGGTCCAAC42U)序列编号105的信息(i)序列特征(A)长度28碱基对(B)类型核苷酸(C)链的性质单链(D>拓朴学线性(xi)序列描迷序列编号105:GACCTCACCTACCAAACATTCGATCTTG28(2>序列编号106的信息(i)序列特征(A)长度25碱基对<B)类型核苷酸(C)链的性质单链(D)拓朴学线性(xi)序列描迷序列编号106:CGAGTTCTACCGTAGGCAGCTCAAG25(2)序列编号107的信息:("序列特征(A)长度1959减基对(B)类型核苷酸(C)链的性质单链(D>拓朴学线性序列描述序列编号107:ATGAATCCAAACAATCGAAGTGAACATGATCAAACTAACCATAATCAATATCCTTTAGCTAATTATAAAGAATTTTTAAGAATGACTGAAACAGTAAAAGATGCAGTTGGGACAGGAATTGGAGTTCCATTTGCTGGGGCACTCACTTCACCAAGTGATGCTGACCCATGGA^GGCTTTTAAAATAGAGGAGTATGCTAAAAGTAAAGCTTTCGAAGATTATGTTAATGCGTTAAATTCCAAAAGAAGCCAAGGTCGAATAAGGGAACTTTCCATGCCGTCATTTGCAGTTTCCAAATTCGCTGCAAATACACATTTATTGCTATTAAAATATTCTTCAGAAGATGTTGCTGAATTCTATACTGACCATTGTGTTAATTGGTATAATGTTGATGCATGGGTCAAATTTAACCGTTTTCGCATTGTACTTTTCCCATTTTATGATATTCGGACAAGAGACATTTTTACGGATCCAATTTTTACTTTTTTGAGTATAGAAAACTCTATTCGAATTGAATTTCATACGCGTCTTCAACCTGGTACGATAAAGGTTACACCTAACAGTGAATTG60GACAATCCAAATTCAACACTAGAAGAATTA120GACAGTTCTACGGAAGTGCTAGACAACTCT180TCTGTTGTAGGGCAGATTTTAGGTGTTGTA240TTTTATCAATCATTTCTTAACACTATATGG300ATGGCACAAGTTGAAGTACTGATAGATAAG3SOCTTGCAGAGTTACAGGGTCTTCAAAATAAT420TGGAAGAAAACACCTTTAAGTTTGCGAAGT480TTTTCTCAAGCAGAAAGTCATTTTCGTAAT540GAAGTGCTGTTTCTACCAACATATGCACAA600GATGCTCAAGTTTTTGGAGAAGAATGGGGA660COTAGACAATTAAAACTTACACAACAATAC720GGATTAAATGGTTTAAGAGGTTCAACTTAT780AGAGAAATGACTTTAACTGTATTAGATCTA840TTATACTCAAAAGGGGTTAAAACAGAACTA900TTACTTACTACGCTTCAGAAGTACGGACCA960AAACCTCATTTATTTGATTATTTACAGGGG1020TACTTTGGGAAAGATTCTTTCAATTATTGG1080TCTGGTAATTATGTAGAAACTAGACCTAGTATAGGATCTAGTAAGACAATTACTTCCCCA1140TTTTATGGAGATAAATCTACTGAACCTGTACAAAAGCTAAGCTTTGATGGACAAAAAGTT1200TATCGAACTATAGCTAATACAGACGTAGCGGCTTGGCC3AATGGTAAGGTATATTTAGGTGTTACGAAAGTTGATTTTAGTCAATATGATGATCAAAAAAATGAAACTAGTACACAAACA1320TATGATTCAAAAAGAAACAATGGCCATGTAAGTGCACAGGATTCTATTGACCAATTACCG1380CCAGAAACAACAGATGAACCACTTGAAAAAGCATATAGTCATCAGCTTAATTACGCGGAATGTTTCTTAATGCAGGACCGTCGTGGAACAATTCCATTTTTTACTTGGACACATAGAAGT1500GTAGACTTTTTTAATACAATTGATGCTGAAAAGATTACTCAACTTCCAGTAGTGAAAGCA1560TATGCCTTGTCTTCAGGTGCTTCCATTATTGAAGGTCCAGGATTCACAGGAGGAAATTTA1620CTATTCCTAAAAGAATCTAGTAATTCAATTGCTAAATTTAAAGTTACATTAAATTCAGCA1680GCCTTGTTACAACGATATCGTGTAAGAATACGCTATGCTTCTACCACTAACTTACGACTT1740TTTGTGCAAAATTCAAACAATGATTTTCTTGTCATCTACATTAATAAAACTATGAATAAA1800GATGATGATTTAACATATCAAACATTTGATCTCGCAACTACTAATTCTAATATGGGGTTC1860TCGGGTGATAAGAATGAACTTATAATAOGAOCAGAATCTTTCGTTTCTAATGAAAAAATC"20TATATAGATAAGATAGAATTTATCCCAGTACAATTGTAA"53(2)序列编号108的信息(i)序列特征(A)长度652个氨基酸(B)类型氨基酸(C)链的性质(D)拓朴学线性(xi)序列描迷序列编号108:MetAsnProAsnAsnArgSerGlu15AsnSerGluLeuGinThrAsnHis20ProAsnSerThrLeuGluGluLeu3S40ThrGluAspSerSerThrGluVal5055HisAspThr工leLysValThrPro1015AsnGinTyrProLeuAlaAspAsn2S30AsnTyrLysGluPheLeuArgMetLeuAspAsnSerThrValLysAspSOAlaValGlyThrGly工leSerValValGlyGinlieLeuGlyValVaJL657075、80AsnThrGinValLysAla130ProPheAlaGlyAlaLeuThrSerPheTyrGinSerPheLeu8530lieTrpProSerAspAlaA印ProTrpLysAlaPheMetAla100105110GluValLeulieAspLysLyslie115120LeuAlaGluLeuGinGlyLeuGin13SValAsnAlaLeuAsnSerTrpLysLysThr145150LysArgSerGinGlyAirglieArgGluLeu1"170GluGluTyrAlaLysSer125AsnAsnPheGluAspTyr140ProLeuSer*LeuArgSer1SS160PheSerGinAlaGluSer175HisPheArgAsnSerMetProSerPheAlaValSerLysPheGluVal180185"0LeuPheLeuProThrTyrAla135GinAlaAlaAsnThrHisLeuLeuLeu200205LeuLysAspAlaGinVal210AspValAlaGluPhe225ThrAspHisCysVal245GlySerThrTyrAsp260MetThrLeuThrVal2*75lieArgLeuTyrSerPheThrAspProlie30SThrPheLeuSerlie325TyrLeuGinGlylie340Tyr230215ArgGlyGluGluTrpGlyTyrSerSer220ArgTyrAlaTrpValGLnLeuLysLeu23SAsnTrpAsnValLysPhe265GlyLeuAsnArgIeuAspLeulieVall>euPhe280LysGlyValLysThr29SPhe310LeuLeuThrThrGluAsnSerGluPheHislieArg330ThrArg345Glu!>eu300LieuGin315LysProLeuGinThrGinGinAsnGlyLeu255PheArgArg270ProPheTyr*285ThrArgAspLysTyrGlyHisLeuPhe33SProGlyTyr3SOTyr240ArgGluAspPro320AspPheGlyLysAspSerPheAsnTyrTrpSerGlyAsnTyrValGluThrArg355360365ProSerlieGlySerSer*LysThrlieThrSerProPheTyrGlyAsp370375380LysSerThrGluProValGinLysLeuSerPheAspGlyGinLysVal385390395400TyrArgVaLTyrLysAsnHisVal450ThrlieAlaAsnThrAspValAlaAlaTrpLeuGlyValThrLysValAspPheSerGin420425GluThrSerThrGinThr*TyrAspSerLys435440SerAlaGinAspSer工leAspGinLeuPro455460ProAsn(SlyLysTyrAspAspGin430ArgAsnAsnGly445ProGluThrThrAspGluProLeuGlu465CysPheLeuMetThrHisArgSer500Thr(31nI*euPro51SlielieGluGly530GluSerSerAsnS45AlaI^uLeuGinGin485ValProLysAlaTyrserHisGinLeuAsnTyrAlaGlu470475AspArgArgGlyThrlieAspPhePheAsnThrlie505ValLysAlaTyrAlaI*eu520GlyPheThrGlyGlyAsn535lieAla!>ysPheLysValSSOS5S480ProPhePheThrTrp435AspAlaGluLyslieSerSerGlyAlaSerS25LeuLeuPheLeuLys540ThrLeuAsnSerAlaAsnLeuArgIjeu580TyrlieAsnI^ysPheAspLeuAla610AsnGluLeu工le625TyrlieAsp!>ysArgPheThxrlielie"5TyrValArglieArgTyrAlaSerThrThrS70575ValGinAsnSerAsnAsnAspPheLeuVallie585530MetAsnLysAspAspAspLeuThrTyrGinThrS0060SThrAsnSerAsnMetGlyPheSerGlyAspLys615620GlyAlaGLuSerPheValSerAsnGluLyslie630635640GluPhelieProValGinLeu650(2)序列编号109的信息(i)序列特征(A)长度649个氨基酸(B》类型氨基酸(C)链的性质(D)拓朴学线性序列描迷序列编号109:MetAsnProAsnAsnArgSerGluHisAspThrlieLysAlaThrGlu151015AsnAsnGluValSerAsnAsnHisAlaGinTyrProLeuAlaAspThrProThrLeu352025GluGluLeuAsnTyrLys40AspAsnAsnVal50GinLysGlylie65ProTyrGllyGlylieTrpProAlaL>eulie115AlaGluLeu130LeuAspSer145GinGlyArgArgSerMetProThrTyr195AlaGinlie210Gly100AspGinTrplieAlaLeuV"slGluAspProGinLys工lePro1B0GlyLeuLys135AspLysThr*150ArgGluLeuSerPheAlaLeuLys105AlaAsp120AsnValAlaGinAlaAlaProLeuPheSerValSer185AsnThr20030GiuPheLeuArgArgThrThr4SGluAlaLeuAspSer55Ser*lielieGlyAsp70SerThrThrLys60LeuLeuGlyVal75AspAlalieValTyrThr90AsnLeuLeuGlyPhe80AsnThr95AlaPheMetGinGinValGlu110TyxAlaPheLysLysAsp12SAspTyr140LysAlaThrValSerAlaThrLeu155GinAla170ArgAspGlyGluSerHisArgSer"0PheArg175GlyTyrGluValLeuPheLeu190HisLeuTyrGlyThrAsp21STrpGlyTyrSerLeuLeu20SThrAsp220LeuLysAspAspLeuAsnGluPheHis22SCysAlaLysTyrGluGluThrLysTrpTyr245TrpVal260GinLysAspLeuThrlieGluTyrThrAsnHis23023S240LysAlaGlyLeuAspLysLeuArgGlySerThr250255ThrLeuA巧ThrThrAspLiysPheAsnArgTyrArgArgGluMet265270ThrValLeuAspLeulieThrLeuPheProLeuTyr275280TyrThrLysGlyValLysThrGluLeuThrArg29029SProIileValAlaValAsnAsnMetAsnGlyTyr305310315AsnlieGluAsnTyrlieArgLysProHisLeu325330AlalieGinPheHisSerArgLeuGinPro<31y34034SSerPheAsnTyrTrpSerGlyAsnTyrValSer355360GlySerAspGlulielieArgSerProPheTyrAsp300AspValValLeuGlyThrThrPheSer*320PheAspTyrLeuHis335TyrPheGlyThrAsp3S0Thi-ArgSerSerlie36S370LeuAspVal38SValAlaAsn37SGinAsnLeuGluPheAsnGlyGlu390GlyAsnLys380LysValPheLyslieHisArgLysAsp435GlyGlylie450AspGluSer*CysPheLeuThrHisLysThrGinlie515GlyAsnIjeu40SSerGlyVal420GluvalArgValPheAspLeuGluLys470LeuGinGly485SerValAspsooProPheValAlaValTrpThrLysVal425ThrGinThrSerlieAsp455AlaTyrSerGlyArgGlyPheTyrAsn50SLysAlaPhe520Pro410395ValGlyThr"GlySsrThrArgAla400GlyThr415GinPheSerGinTyrAsnAsp430TyrGinHislie490AspSerLys445LeuProPro460GinLeuAsn475ArgAsnVallieThrThrTyrlieProValPhevalArg480ThrTrp435ThrLeuAspSerGluLyslie510lieLeuValAsn52SSerThrSerValValAlaGlyProGlyPheThrGlyGlyAsplielieLysCysThr530535540AsnGlySerGlyLjeuThrLeuTyrValThrProAlaProAspLeuThr545550555560TyrSerLysThrTyrLyslieArglieArgTyrAlaSerThrSerGin565570S75ValArgPheGlylieAspLeuGlySerTyrThrHisSerlieSerTyrS80S85S90PheAspLysThr*MetAspLysGlyAsnThrLeuThrTyrAsnSerPhe595600605AsnLeuSerSerValSerArgProlieGlulieSerGlyGlyAsnLys610615620lieGlyValSer*ValGlyGlylieGlySerGlyAspGluValTyrlie"0S3S"0AspLyslieGluPhelieProMetAsp645("序列编号110的信息(i)序列特征(A)长度652个M酸(B)类型氨基酸(C)链的性质(D)拓朴学线性Met序列描述:AsnProAsnSerGlu序列编号110:AsnAsnArgSerGluHisLeuProThrAsnHisAsn2025ProAsnSerThr35ThrAlaGlU50LeuGluGluLeuAsn40serSerAspValGlyThrGlyThrGluValLeu55lieSerValVal70GlyValProPheAlaGlyAlaLeuThr85AspThrlieLys10GinTyrProLeuTyrUysGluPhe45AspAsnSerThr60GlyGinlieLeu7SSerPheTyr*Gin30ValThrPro15AlaAspAsn30LeuArgMetValLysAspGlyValVal90SerPheLeu95AspThrlieTrpProSerAspAlaAspProTrpLysAlaPheMetAla10010S110GinValGluValLeulie115LysAlaLeuAlaGluLeu130ValAsnAlaLeuAsnSer14SISOLysArgSerGinAspArg165AspLysLyslieGluGluTyrAlaL>ysSer120125GinGlyLeuGinAsnAsnPheCUuAspTyr135140TrpLysLyslieArgGluHisPheArgAsnSerMetProSerPhe180185ThrProLeuSerLeuArgSer1SS160LeuPheSer*GinAlaGluSer170175AlaValSerLysPheGluVal190LeyPheI*euProThrTyrAlaGinAlaAlaAsnThr*HisLeuJLeuLeu19520020SLeuLysAspAlaGinVal210AspValAlaGluPheTyr225230ThrAspHisCysValAsn245PheGlyGluGluTrpGlyTyrSerSerGlu215220HisArgGinLieuLysLeuThrLieuLysLeu235GlySerThrTyr260MetValPhe305ThrLeuThr275ArgLeuTyr290AspAlaValLeuTrpTyxTrpValAsnValGlyLeuAsn250Lys265PheAsnArgPheAspL*eu280GlyVal295lieValLeuPheLysThi:ThrAspProliePheSerLeuAsnThr31001uLi"u300LeuGin315Pro28SThrGluThrPheLeuSerlieOluAsnSer*lieArgLysProHis325330TyrGlyProLeuGinGly340LysAspSer355Serlie<3ly370lieGluPheHisThrArgLeuGinPro345PheAsnTyxTrp375SerGlyAsnTyrlieThrSer*Pro3B0Val365LysSerThrGluProValGinLysLeuSerPheAspGlyGinGinTyr240GlyLeuArg255ArgArgGlu270PheTyrAspArgAsplieTyrGlyPro320LeuPheAspGlyTyrSer350GluThrArgTyirGlyAspGinLysVal385390TyrArgThrlieAlaAsnThr405AspVal395AlaAla410lieTyrPheGlyVal420ThrLysValAspPheSer425400TrpProAsnGlyLys415GinTyrAspAspGin430LysAsnGinThrser435HisValGlyAlaGin450ThrGinAspSer455Thr440TyrAspSerLysArgAsrxAsnGly445lieAspGinLeuProProGluThrThr460Asp465CysGluProLeuGluLysAlaTyrSerHisGinLeu470475AsnTyrAlaGlu480PheLeuMetGinAspArgArgGlyThrliePro485430PhePhe435ThrHisArgSerValAspPhePheAsnThrlieAspAlaGluLyslie500ThrGinLeuProVal515工le工le530Glu3er545GluGlyProSerAsnSer*505ValLysAlaTyr*520GlyPheThrGly53S510AidLeuSerSerGlyS2SAlaSex*lie550AlaLeuLeuGinArgTyrAsnLeuArgLeuPheValSB0TyrlieAsnLysThrMet595PheAsp610AsnGlu625LeuAlaThrThr*AlaLysPheArgValArgGinAsnSer585AsnlieAsp600AsnSerAsn615GlyAsnLeu540I^sValThrS55lieArgTyrS70AsnAsnAspLeuPheLeuLysl^u》snSerAla560AspAspLeuLieulielieGlyAlaGluSer630TyrlieAspLys工leGluPheliePro(2>序列编号111的信息(A)长度652个氨基酸(B)类型氨基酸(C)链的性质MetGlyPhe620PheVslSer635ValGinlieu650AlaSerThr57SPhelieValThrTyrGLn60SSerGlyAspAsnGluLysThrlieThrThrlie"0(D)拓朴学线性(xi)SEQUENCEDESCRIPTION:SEQIDNO:111:MetAsnProAsnAsnArgSerGluHisAspThrlieLysVal1510AsnSerGluLeuGinThrAsnHisAsnGinTyrProLeuAla202530ProAsnSerThrLeuGluGluLeuAsnTyrLysGluPhe354045ThrGluAspSerSerThrGluValLeuAspAsnSerThr5055GOAlaValGlyThrGlylieSerValValGlyGinlieLeuSS707SThrProISAspAsnLeuArgMetValLysAspGlyValProPheAlaGlyAlaLeuThrSerPheTyrGin8590GlyValVal80SerPheLeu95AsnThrlieTrpProSerAspAlaAsp100105ProTrpLysAlaPheMetAla110I*yslieGluLeuGinAsnGinValGluValLeulieAspLysIIS120LysAlaLeuAlaGluLeuGinGly130135ValAsnAlaI>euAsnSerTrpLysLysThrPro14S150155LysArgSerGinAspArglieArgGluLeuPhe165170HisPheArgAsnSerMetProSerPheAlaVal180185LeuPheLeuProThrTyrAlaGin19S200LeuLysAspAlaGinValPheGly210215AspValAlaGluPheTyrHisArgGinLeuL*ys22523023SThrAspHisCysValAsnTrpTyrAsnValGly245250MaAlaAsnGluGluTrpGluTyrAlaI/ysSer125AsnPheGluAspTyr140LeuSerLeuArgSer160SerGinAlaGluSer175SerLysPheGluVal190ThrHisLeuLeuLeu205GlyTyrSerSerGlu220LeuThrGluGinTyr240LeuAsnGlyL,euArg255GlySerThrTyxAspAla260TrpValLysPheAsmArgPheArgArgGlu265270MetThrLeuThrValLeu275工leArgLeuTyrSerLys290AspLeulieValLeuPheProPheTyrAsp28028SThrArgAsplieGlyVal29SLysThrGluLeu300PheThrAspProliePhe305310SerLeuAsnThrLeuGin315ThrPheLeuSerlieGluAsnSerlieArgLysPro325330GluTyrGlyPro320HisLeuPheAsp335TyrLeuGinGlylieGluPheHisThrArgLeuGin340345ProGlyTyrPhe350GlyLysAspSerPhe355ProSer370工leGlySerAsnTyrTrpSer360SerLysThrlie375GlyAsnTyxValGluThrArg365ThrSerProPheTyrGlyAsp380LysSer385TyrArgValTyrThrGluProVal390lieAla405LeuGlyVslI420AsnGinlysThrAspLysValLeuValAsp42SSerPheAspGlyGinLysVal395400ALaAlaTrpProAsnGlyLys410415PheSerGinTyrAspAepGin430LysAsnGluThrSer435Thr*GinThrTyrAspSerLysAxgAsnAsnGly440"5HisValSerAla(31n450AspserlieAspGinLeuProProGluThrThr45S"0AspGluPr*oLeuGluLys"5470AlaTyrSerHisGinLeuAsnTyrAlaGlu475480CysPheLieuMetGin485ThrHisAxgSerVal500ArgArgGlyThrlieProPhePheThrTrp490"5AspAspPhePheAsnThrlieAspAlaGluLyslieSOS510ThrGinLeuProVa!L515ValLysAlaTyrAlaLeuSerSerGlyAlaserS20S25lie工leGlu<3lyProGlyPheThrGlyGlyAsnLeuPheLys540GluSerSerAsnSerlie545550AlaLysPheLysValThrLeuAsnSerAla555S60AlaLeuLeuGinArgTyrArgValArglieArgTyrAlaSerThrThfSS5S70575AsnLeuArg!>euPheValGinAsnSerAsnAsnAspPheLeuVallieS805S5590TyrlieAsnLysThrMetAsnLysAspAspAspLeuThrTyrGinThr595SOO605PheAspLeuAlaThrThrAsnSerAsnMetGlyPheSerGlyAspLys610"5S20AsnGluLeu工lelieGlyAlaGluSerPheValSerAsnGluLyslie"5630635"0TyrlieAsp!>yslieGluPhelieProValGinLeu645650(2》序列编号112的信息(i>序列特征(A)长度659个狄酸(B)类型氨基酸(C)链的性质(D)拓朴学线性Met序列描迷序列编号112:lieArgMetGlyGlyArgLysMetAsnProAsnAsnArg1510TyrAspThrlieLysValThrProAsnSerGluLeuProThr202530AsnGinTyrProLeuAlaAspAsnProAsnSerThrIeuGlu354045TyrLysGluPheLeuArgMetThrAlaAspAsn505S60AspSerSerThrValLysAspAlaValGlyThrGlylie7075GlyGinlieLeuGlyValValGlyValProPheAlaGly8530ThrSerPheTyrGinSerPheLeuAsnAlalieTrpProSer100105110AspProTrpLysAlaPheMetAlaGinValGluValLeulie11512012SSerGlu15AsnHisGluLeuAsnXj6U65ValSerThrGluValSerVal80AlaLeuAspAlaAspI*ysLyslieGluGiuTyrAlaLysSerLysAlaLeuAlaGiuLeuGinGly130135140LeuGinAsnAsnPheGluAspTyrValAsnAlaLeuAspSejrTrpLys145150155ISOLysAlaProValAsnLeuArgSerArgArgSerGinAspAxglieAi、g"517017SGluLeuPheSerGinAlaGluSerHisPheArgAsnSerMetProSer180185190PheAlaValSerLysPhe<31uVa工LeuPheLeuProThr*TyrAlaGin195200205AlaAlaAsnThr*HisLeuLeuLeuLeul^sAspAlaGinValPheGly210215220GluGluTrpGlyTyrSerSerGluAsplieAlaGluPheTyrGinArg225230235240GinLeuLysLeuThrGinGinTyrThrAspHisCysValAsnTrpTyr24S2502SSGlyLeuAsnSerLeuArgGlySerThrTyrAspAlaTrpVa工270LeuAspLeu260265LysPheAsnArgPheArgAr^GluMet275280lieValLeuPheProPheTyrAspVal290295LysThrGluLeuTtu:ArgAspliePhe305310Asn;QaLeuGinGluTyrG丄yProThr325工leArgLysProHisLeuPheAspTyx340345ThrArgLeuArgProGlyTyrSerGly3553S0SerGlyAsnTyrValGluThrArgPro370375lieThrSerProPheTyrGlyAspLys335390LeuSerAspGlyGinLysVal"IVir405ThrLeuThrVal285ArgLeuTyrSer300ThrAspProlie315PheSerSerlie330IjeuArgGlyliel*ysAspSerPheSerlieGlySer3B0SerlieGluProArgThrlieAla410LysGlyvalPheThrLeu320GluAsnSer*335GluPheHis350AsnTyrTrpAsnAspThrlieGinLys400AsnThrAsp415lieAlaAlaPheProAspGlyLyslieTyrPheGlyValThrLysValAspPheSerTyrAspSer450AspGinLeu4SS420425"0GinTyrAspAspGinLysAsnGluThrSerThrGinThr440445LysArgTyr1AsnGlyTyr*LeuGlyAlaGinAspSer工le4S5"0ProProGluthrThrAspGluProLeuGluLysAlaTyr470475SerHasGlyThrAsnThr545Phe480AspArgArg49SAspPhePhe510ValLysAla(SlyPheThrlieAlaLys5S0555560LysV3lGflnLeuAsnTyrAlaGluCysPheLeuMet485490工leProPhePheThrTip了hrHisArgSerS00SOSlieAspAlaGluLyslieThrGinLeuPro515520TyrAlaLeuSerSej:GlyAlaSerlielieGluGly53053S540GinValValS25ProGlyGlyAsnLieuL<euPheLeuLysGluSerSerAsnSerThrLeuAsnSerAlaAlaLeuLeuGinArgTyrArgVal5655*70ArglieArgTyrAlaSerThrThrAsnLeuArgLeuPliVal580585590SerAsnAsnAspPhe::-iiVallieTyr工leAsnLysThrMet595600605GlyAspLeuThrTyrGinThrPheAspPheAlaThrSer610"5620MetGlyPheSerGlyAspThrAsnAspPhelielieGlySerPheValSerAsnGluLyslieTyrlieAspLyslie<31u645650ProV"Gin575GinAspAsn625AsnlieAsnSerAlaPheS5SGlulie(2>序列编号113的信息(il序列特征<A)长度652个氛基酸(Bl类型氨基酸(C)链的性质(D)拓朴学线性419(xi)序列描述序列编号113:MetlieArgI*ysGlyGlyArgLysMetAsnProAsnAsnArgSerGlu15HisAspValGinThrlieLys20TyrProLeu35ThrThrGluAsnAsnGlu2510ValProAsnTyrLysGluPhe50L6U65AspValGlyAspSerSerThrAlaGluLeuArg55ThrLys70ljeuLeuGlyVal85ThrProAsnPro40MetThrAlaAspAspVallieGin75ValGlyPheProSOThrLeu45AsnAsn60LysGlyThrAsnHis30GluAspLeuThrGluAlalieSerVal80PheGlyGlyAlaLeu35ValSerPheTyrThrAsnPhe100LeuAsnThrlieTrpProSer105110AsplieAla130GinAsn145ProTrpLysAlaPheMetGluGinValGluAlaLeuMet11S120125AspTyrAlaLy曰AsnLysAlaI^euAla(UuLeu135"0AsnValGluAspTyrValSerAlaLeuSerSerISO1SSAsnProValSerSerArgAsnProHisSerGinGlyArg"5170LeuPheSerGinAlaGluSerHisPheArgAsnSerMetValLeuPheLeuThrThrTyr200205LeuLeuLysAspAlaGinlie215220TyrGluLysGluAsplieAlaGluPheTyr230ThrGinGluTyrThrAspHisCysValLys24S2S0Ginlie190GluAspGinLysGlyGinIjys160ArgGlu175SerPheAlalieSerGlyTyrGlu195AlaAsn210GluTrp225LeuLysValGlyThrHisLeuPheGlyLeuAlaGinAlaTyrGlyGlulieuAspLysI^uArgGlySerSerTyrGluSqi:2602SStiysTrp270ArgGin240TyrAsn2S5ValAsnPheAsnArgTyrArgArgGluMetThrLeuThrValLeuAspLeulie275280285Aia^etiPheProLeuTyrAspVaiArgLeuTyrProLysGluValLys290-295300-ThrGluLeuThrArgAspValLeuThrAspProlieValGlyValAsn305no315320AsnLeuArgGlyTyrGlyThrThrPheSerAsnlieGlUAsnTyrlie32S330335ArgLysProHisl*euPheAspTyrLeuHisArglieGinPheHisThr340345350ArgPheGinProGlyTyrTyrGlyAsnAspSerPheAsnTyrTrpSer355360365GlyAsnTyrValSerThrAxgProSerlieGlySerAsnAsplielie370375380ThrSerProPheTyrGlyAsnLysSerSerGluProValGinAsnLeu385330335400GluPheAsnGlyGluLysValTyxArgAlaValA丄aAsnThrAsnLeu40S410415AlaValTrpProSerAlaValTyrSerGlyValThrLysVaJLGJLuPhe420425"0SerGinTyrAsnAspGinThrAspGluAlaSerThrGinThrTyrAsp435"044SSerLysArgAsnValGlyAlaValSerTrpAspSerlieAspGinLeu4504SS460ProProGluThrThrAspGluProleuGluLysGlyTyrSerHisGin4SS470475480LeuAsnTyrValMetCysPheLeuMetGinGlySerArgGlyThrlie4B5490495ProValLeuThrTrpThrHisLysSerValAspPhePheAsnMetlieS00505510AspSerLysLyslieThrGinLeuProLeuValLysAlaTyrLysLeu515520525GinSex:GlyAlaSerValValAlaGlyProArgPheThrGlyGlyAsp530535S40lielieGinCysThrGluAsnGlySerAlaAlaThrlieTyrValThr545550555560ProAspValSerTyrSer*GinLysTyrArgAlaArglieHisTyrAla565S70575SerThrSerGinlieThrPheThrLeuSerLeuAspGlyAlaProPhe580585590AsnGinTyrTyrPheAspl*ysThrlieAsnLysGlyAspThrLeuThr595600605TyirAsnSerPheAsnLeuAlaSerPheSerThrProPheGluLeuSer"0SIS620GlyAsnAsnLeuGinlieGlyValThrGlyLeuSerAlaGlyAspLys62S630635640ValTyrlieAspLyslieGluPhelieProValAsn645650权利要求1.一种修饰的苏云金芽胞杆菌Cry3Bb*多肽,其在序列编号98的Cry3Bb多肽的一级序列的环区β1、α8中包含被一个或多个疏水性更强的氨基酸替代的一个或多个氨基酸,其中一个或多个氨基酸替代选自Ser311被丙氨酸、异亮氨酸、亮氨酸或苏氨酸替代,Asn313被精氨酸、组氨酸、苏氨酸或缬氨酸替代,以及Glu317被丙氨酸、天冬酰胺、赖氨酸或缬氨酸替代。2.权利要求1的Cry3Bb多肽,其包含选自序列编号60、序列编号62、序列编号66、序列编号108、序列编号16、序列编号18、序列编号20、序列编号22、序列编号IOO、序列编号24、序列编号26、序列编号30、序列编号32、序列编号34、序列编号36和序列编号38的氨基酸序列。3.权利要求2的Cry3Bt^多肽,其被选自序列编号59、序列编号61、序列编号65、序列编号107、序列编号15、序列编号17、序列编号19、序列编号21、序列编号99、序列编号23、序列编号25、序列编号29、序列编号31、序列编号33、序列编号35和序列编号37的核酸序列编码。4.权利要求1的Cry3B^多肽,其中一个或多个氨基酸替代选自Ser311被亮氨酸替代,Asn313被苏氨酸替代,以及Glu317被赖氨酸替代。5.权利要求4的Cry3Bh多肽,其包含选自序列编号60、序列编号66、序列编号108、序列编号16、序列编号18、序列编号22、序列编号100、序列编号24和序列编号30的氨基酸序列。6.权利要求5的Cry3B"多肽,其被选自序列编号59、序列编号65、序列编号107、序列编号15、序列编号17、序列编号21、序列编号99、序列编号23和序列编号29的核酸序列编码。7.权利要求4的Cry3B^多肽,其进一步包含其中His231被精氨酸替代的氨基酸替代。8.权利要求7的Cry3BM多肽,其包含选自序列编号108、序列编号22、序列编号IOO和序列编号30的氨基酸序列。9.权利要求8的Cry3Bb多肽,其被选自序列编号107、序列编号21、序列编号99和序列编号29的核酸序列编码。10.权利要求8的Cry3B"多肽,其包含序列编号100的氨基酸序列。11.权利要求10的Cry3Bt^多肽,其被序列编号99的核酸序列编码。12.权利要求1-11中任一项的Cry3Bl^多肽,其进一步包含其中Gln348被精氨酸替代的氨基酸替代。13.权利要求12的Cry3Bb多肽,其包含序列编号62的氨基酸序列。14.权利要求13的Cry3Bt^多肽,其被序列编号61的核酸序列编码。15.—种包含杀虫有效量的权利要求l-14中任一项的Cry3BM多肽的组合物。16.权利要求15的组合物,其包含O.5。/。至99重量M的Cry3Bbt多肽。17.权利要求15的组合物,其可通过包括以下步骤的方法进行制备:(a)在能够有效产生杀虫多肽的条件下培养苏云金芽胞杆菌NRRLB-21753、NRRLB-21754、NRRLB-21756、NRRLB-21766、NRRLB-21767、NRRLB-21768、NRRLB-21769、NRRLB-21770、NRRLB-21771、NRRLB-21773、NRRLB-21774、NRRLB-21775、NRRLB-21776、NRRLB-21777或EG11098细胞,以及(b)从所述细胞中获得所述杀虫多肽。18.权利要求15的组合物,其包含苏云金芽胞杆菌MRLB-21753、NRRLB-21754、NRRLB-21756、NRRLB-21766、NRRLB-21767、MRLB-21768、NRRLB-21769、NRRLB-21770、NRRLB-21771、NRRLB-21773、NRRLB-21774、NRRLB-21775、NRRLB-21776、NRRLB-21777或EG11098细胞。19.权利要求18的组合物,其中所述组合物含有苏云金芽胞杆菌NRRLB-21753、鍾LB-21754、NRRLB-21756、NRRLB-21766、證LB-21767、NRRLB-21768、NRRLB-21769、NRRLB-21770、NRRLB-21771、NRRLB-21773、NRRLB-21774、MRLB-21775、NRRLB-21776、NRRLB-21777或EG11098细胞的细胞提取物、细胞悬浮液、蛋白部分、晶体部分、细胞培养物、细胞匀浆物、细胞裂解物、细胞上清液、细胞过滤物或细J!包沉淀物。20.权利要求19的组合物,其被配制成粉末、颗粒、喷雾剂、乳剂、胶体或溶液。21.权利要求20的组合物,其中所述组合物是通过干燥、冻干、匀浆、冷冻干燥、乳化作用、蒸发、分离、提取、过滤、离心、沉降、稀释、结晶或浓缩制备的。22.—种多聚核苷酸,其含有编码权利要求1-14中任一项的Cry3BM多肽的核酸序列。23.权利要求22的多聚核苷酸,其特征是DNA、cDNA、rRNA、或mRNA.24.权利要求22的多聚核苷酸,其中所述核酸序列选自序列编号59、序列编号61、序列编号65、序列编号107、序列编号15、序列编号17、序列编号19、序列编号21、序列编号99、序列编号23、序列编号25、序列编号29、序列编号31、序列编号33、序列编号35和序列编号37。25.权利要求24的多聚核苷酸,其中所述核酸序列以可操作的形式与启动子相连接。26.权利要求25的多聚核苷酸,其中所述核酸序列以可操作的形式与异源启动子相连接。27.权利要求26的多聚核苷酸,其中所述核酸序列以可操作的形式与可以在植物中表达的启动子相连接。28.权利要求27的多聚核苷酸,其中所述核酸序列以可操作的形式与组成型、诱导型或组织特异性的启动子相连接。29.—种载体,其含有权利要求22-28中任一项的多聚核苷酸、或编码权利要求l-14中任一项的Cry3Bb多肽的多聚核普酸。30.权利要求29的载体,其被定义为质粒、粘粒、噬粒、噬菌体、病毒或杆状病毒,31.权利要求29的载体,其在原核或真核宿主中转化和复制。32.—种病毒,其含有权利要求l-14中任一项的Cry3Bt^多肽,或者权利要求22-28中任一项的多聚核苷酸。33.—种经过转化的宿主细胞,其含有权利要求1-14中任一项的Cry3B^多肽、权利要求22-28中任一项的多核苷酸、权利要求29-31中任一项的载体或者权利要求32的病毒。34.权利要求33的经过转化的宿主细胞,其进一步被定义为原核或真核细胞。35.权利要求34的经过转化的宿主细胞,其中所述原核细胞是真细菌类的、古细菌类的或蓝细菌类的细胞,或者其中所述真核细胞是动物、真菌或植物细胞。36.权利要求35的经过转化的宿主细胞,其中所述细胞是大肠杆菌、苏云金芽胞杆菌、A.Tumefaciens、B.Subtilis、B.Megaterium、B.Cereus、沙门氏菌属或假单胞扦菌属细胞。37.权利要求36的经过转化的宿主细胞,其中所述细胞选自苏云金芽胞杆菌NRRLB-21753、NRRLB-21754、NRRLB-21756、NRRLB-21766、NRRLB-21767、NRRLB-21768、NRRLB-21769、MRLB-21770、NRRLB-21771、NRRLB-21773、NRRLB-21774、NRRLB-21775、NRRLB-21776、NRRLB-21777或EG11098。38.权利要求35的经过转化的宿主细胞,其中所述植物细胞是谷物、树木、豆类、纤维、蔬菜、水果、坚果、草、肉质植物或者观赏植物的细胞。39.权利要求38的经过转化的宿主细胞,其中所述植物细胞是玉米、稻谷、烟草、苜蓿、大豆、高粱、土豆、番茄、亚麻、芸薹、向曰葵、棉花、木棉花、小麦、燕麦、大麦或黑麦细胞。40.权利要求33-39中任一项的经过转化的宿主细胞,其中所述多聚核苷酸是通过载体、病毒、粘粒、噬菌粒、噬菌体、质粒或通过电穿孔、转化、接合、微粒轰击、直接DNA注射、棵DNA转移、转化或转染引入所述细胞中的。41.权利要求l-n中任一项的Cry3Bt^多肽、权利要求22-28中任一项的多聚核苷酸、权利要求29-31中任一项的载体、权利要求32的病毒或者权利要求33—0中任一项的宿主细胞在制备转基因植物中的用途。42.权利要求"的用途,其中在所述转基因植物的基因组中结合有选定的编码权利要求1-14中任一项的多肽的多聚核普酸。43.权利要求42的用途,其中所述植物是谷物、树木、豆类、纤维、蔬菜、水果、坚果、草、肉质植物或者观赏植物。44.权利要求43的用途,其中所述植物是玉米、稻谷、烟草、苜蓿、大豆、高粱、土豆、番茄、亚麻、芸薹、向日葵、棉花、木棉、小麦、燕麦、大麦或黑麦。45.权利要求42的用途,其中转基因植物是转基因植物的任何一代的子代。46.权利要求42的用途,其中转基因植物是转基因植物的任何一代的种子.47.权利要求45的用途,其中转基因植物是任何一代子代的种子。48.权利要求46的用途,其中转基因植物是从种子生长出来的植物。49.一种用于杀死鞘翅类昆虫的方法,其包括以下步骤使所述昆虫接触杀虫有效数量的权利要求l-14中任一项的Cry3Bt^多肽。50.—种用于控制鞘翅类昆虫种群的方法,其包括以下步骤给所述昆虫种群的环境提供杀虫有效数量的权利要求1-14中任一项的Cry3Bt^多肽。51.权利要求49或50的方法,其中所述Cry3Bbt多肽得自苏云金芽胞杆菌MRLB-21753、NRRLB—21754、NRRLB-21756、NRRLB-21766、NRRLB-21767、NRRLB-21768、NRRLB-21769、NRRLB-21770、NRRLB-21771、NRRLB-21773、NRRLB-21774、NRRLB-21775、NRRLB-21776、NRRLB-21777或EG11098细胞的细胞提取物、细胞悬浮液、蛋白部分、晶体部分、细胞培养物、细胞匀浆物、细胞裂解物、细胞上清液、细胞过滤物或细胞沉淀物。52.权利要求51的方法,其中所述Cry3Bt^多肽是通过喷雾、沾尘、喷洒、浸泡、充气、撒雾、雾化、土壤注射、土壤耕种、种子涂覆或幼苗涂覆来提供给所述环境的。53.权利要求52的方法,其中所述多肽被配制成粉末、颗粒、喷剂、乳剂、胶体或溶液。54.权利要求53的方法,其中所述多肽是通过干燥、冻干、匀浆、冷冻干燥、乳化作用、蒸发、分离、提取、过滤、离心、沉淀、稀释、结晶或浓缩制备的。55.—种制备能够抵抗鞘翅类的转基因植物的方法,其包括以下步骤(a)用编码权利要求l-14中任一项的Cry3Bb多肽的核酸序列转化植物细胞;以及(b)从所述植物细胞再生含有所述核酸序列并表达所述Cry3Bt^多肽的转基因植物,其中与未转化的植物相比,所述转基因植物能够抵抗鞘翅类昆虫。56.权利要求55的方法,其中与未转化的植物相比,所述转基因植物能够抵抗玉米食根虫。57.权利要求55的方法,其中步骤a)包括(1)以可操作的形式将核酸序列与启动子相连接;(2)将所述核酸序列引入载体;(3)用所述载体转化植物细胞。58.—种用于杀死鞘翅类昆虫的方法,其包括给所述昆虫喂食用编码权利要求l-14中任一项的Cry3B"多肽的多聚核苷酸转化的植物细胞。59.权利要求58的方法,其中所述昆虫是通过摄取包含经过转化的细胞的转基因植物的一部分而被杀死的。60.—种制备能够抵抗鞘翅类昆虫攻击的植物种子的方法,其包括以下步骤(a)用编码权利要求l-14中任一项的Cry3Bt^多肽的核酸序列转化植物细胞,以产生经过转化的植物细胞;及(b)在能够有效地从所述细胞产生转基因植物的条件下使经过转化的植物细胞生长;及(c)从所述转基因植物获得能够抵抗鞘翅类昆虫攻击的种子。61.权利要求60的方法,其中所述植物种子能够抵抗玉米根虫。62.权利要求60的方法,其中步骤(a)包括通过电穿孔、转染、棵DM摄入、原生质体产生、DNA直接转移进入花粉、胚或多能植物细胞、土壤杆菌介导的转化、粒子轰击或微粒轰击来转化所述植物细胞。63.权利要求60的方法,其中步骤(b)包括从所述经过转化的植物细胞生成多能植物细胞。全文摘要公开了一种增加苏云金杆菌δ-内毒素抗鞘翅目昆虫的活力的方法,同时还公开了突变编码该多肽的核酸以及在表达该基因的转基因植物中提高昆虫抗性的方法。文档编号C07K14/195GK101172999SQ20071014197公开日2008年5月7日申请日期1998年12月17日优先权日1997年12月18日发明者C·A·库勒斯扎,C·罗马诺,F·S·瓦尔特斯,J·W·布赖森,L·恩格利斯,M·A·冯特尔施,S·L·斯拉廷,S·M·布鲁索克,T·M·马尔瓦申请人:孟山都技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1