专利名称:脱氧-d-木酮糖磷酸生物合成途径的基因在改变类异戊二烯浓度中的应用的利记博彩app
技术领域:
本发明涉及来自于细菌或寄生虫的DNA序列(SEQ1,3,5,7)的应用,该基因编码gcpE或yfgB蛋白质,当将该基因掺入到病毒,真核细胞和原核细胞的基因组时所述的DNA序列改变类异戊二烯的含量,并且涉及测量类异戊二烯合成中gcpE基因的活性的方法。此外本发明还涉及鉴定在植物中具有除草剂,抗寄生虫,抗病毒,杀真菌的作用和在人和动物中具有抗真菌,抗寄生虫,抗病毒的作用的物质的方法。
已经知道借助于经典的乙酸/甲羟戊酸途径和一种可替代的甲羟戊酸-依赖性生物合成途径,脱氧-D-木酮糖磷酸途径形成类异戊二烯的生物合成途径(Rohmer,M.,Knani,M.,Simonin,p.,Sutter,B.和Sahm,H.(1993)生物化学杂志295517-524)。
在美国专利US5858367中描述了aarC-寡聚核苷酸在识别抗细菌物质中的应用。
令人惊奇的是,已经发现gcpE蛋白质在类异戊二烯生物合成的另一种代谢途径中还具有激酶功能和催化类异戊二烯生物合成的糖或前体的磷酸化作用,特别是2-C-甲基-D-赤藓糖醇,2-C-甲基-D-赤藓糖醇磷酸的磷酸化,特别是2-C-甲基-D-赤藓糖醇-4-磷酸的磷酸化,2-C-甲基-D-赤藓糖,2-C-甲基-D-赤藓糖磷酸的磷酸化,特别是2-C-甲基-D-赤藓糖-4-磷酸,CH2(OH)-C(CH3)=C(OH)-CH2-O-PO(OH)2,
CH2(OH)-C(CH3)=C(OH)-CH2-OH,CH2(OH)-C(CH3)-CO-CH2-O-PO(OH)2,CH2(OH)-C(CH3)-CO-CH2OH,CH2=C(CH3)-CO-CH2-O-PO(OH)2,CH2=C(CH3)-CO-CH2-OH,CH2=C(CH3)-CH(OH)-CH2-O-PO(OH)2,CH2=C(CH3)-CH(OH)-CH2-OH,CH2(OH)-C(=CH2)-C(OH)-CH2-O-PO(OH)2,CH2(OH)-C(=CH2)-C(OH)-CH2-OH,CHO-CH(CH3)-CH(OH)-CH2-O-PO(OH)2,CHO-CH(CH3)-CH(OH)-CH2-OH,CH2(OH)-C(OH)(CH3)-CH=CH-O-PO(OH)2,CH2(OH)-C(OH)CH3-CH=CH-OH,CH(OH)=C(CH3)-CH(OH)-CH2-O-PO(OH)2,CH(OH)=C(CH3)-CH(OH)-CH2-OH,CH3-C(CH3)=CH-CH2-O-PO(OH)2,CH3-C(CH3)=CH-CH2-OH,CH2=C(CH3)-CH2-CH2-O-PO(OH)2,CH2=C(CH3)-CH2-CH2-OH的磷酸化。
因此本发明涉及来自于细菌或寄生虫的DNA序列的应用,所述DNA序列编码gcpE或yfgB的蛋白质[来自于细菌或来自寄生虫的gcpE或yfgB]或所述的DNA序列编码该蛋白质的类似物或衍生物,其中该蛋白质的一个或多个氨基酸被缺失,叠加或被其它氨基酸替代,并且基本上没有降低该多肽的酶促活性。特别是本发明涉及SEQ1,3,5,7的DNA序列的应用。列举的SEQ 1和5序列以及蛋白质2和6的起始来源是微生物大肠杆菌K12菌株。SEQ 3和7列举的序列以及蛋白质4和8的原始来源是微生物恶性疟原虫株3D7。
这样的DNA序列描述于US5858367并且也可以通过下面的国际互联网地址和登记号找到http//www3.ncbi.nlm.nih.gov/Entrez/protein.html AAD07695,AAD18517,AAC75568,AAC67648,AAC65433,P36979,CAA15530,CAA98356,CAA98355,AAC24056,AAC07467,P54482,P44667,P27434,P27433,BAA17717,BAA20919,BAA16402,S23058,AAB51469,1819264A,CAA45783,CAA45782,AAA21360,AAA21359,BAA02549,I39486,2113330A。
本发明的序列适用于在病毒、真核生物和原核生物中表达基因,他们负责1-脱氧-D-木酮糖途径的类异戊二烯的合成。
根据本发明真核生物或真核生物细胞包括动物细胞,植物细胞,藻类,酵母,真菌,而原核生物或原核生物细胞包括细菌,古细菌和真细菌。
当将DNA序列插入到定位了上面所述DNA序列的基因组时,上面所说的基因能够在病毒、真核生物和原核生物中表达。以本领域内技术人员已知的方式培养本发明转化的病毒、真核生物和原核生物并且分离在这样的培养期间形成的类异戊二烯,非强制性地进行纯化。不是所有的类异戊二烯都需要分离,在一些情况下,类异戊二烯可以直接释放到室温。
借助于下面的步骤可以进行所使用的转基因病毒、真核生物和原核生物的制备以便修饰类异戊二烯的含量a)生产具有下面亚序列的DNA序列i)在病毒、真核生物和原核生物中具有活性并且在预定的靶组织或靶细胞中确保形成RNA,ii)编码具有来自于细菌或寄生虫的gcpe或yfgB蛋白质的氨基酸序列的多肽或者该多肽的类似物或者衍生物的DNA序列,iii)导致将聚-A残基加到病毒、真核生物和原核生物的RNA的3’末端的未翻译的序列,
b)利用或不利用载体(例如质粒,病毒DNA)将该DNA序列转移到和掺入到病毒细胞,原核生物细胞或真核生物细胞的基因组。
从这种方式转化的植物细胞再生完整的整个植株。
给编码gcpE或yfgB蛋白质或者其类似物或者衍生物的序列提供确保在一定的器官或细胞中转录的启动子,该启动子以有义方向偶合(启动子的3’末端到编码序列的5’末端)到编码待形成的蛋白质的序列。将决定mRNA合成的终止的终止信号结合到编码序列的3’末端。以便指导将表达的蛋白质到一定的亚细胞室,例如叶绿体,淀粉体,线粒体,液泡,胞液或者细胞间隔,将编码所谓的信号序列或转移肽的其他的序列插入到启动子和该编码序列之间。该序列必须是在与该蛋白质的编码序列相同的阅读框架中。为了将本发明的DNA序列导入到高等植物中需要获得大量的克隆载体,所述的载体含有大肠杆菌中的复制信号和用以选择转化细胞的标记物。载体的例子是pBR322,pUC-系列,M13mp-系列,pACYC184,EMBL3等等。根据将需要的基因导入到植物中的方法,需要其他的DNA序列。例如如果将Ti或Ri质粒用于转化植物细胞,必须插入Ti和Ri质粒T-DNA的至少一个右边界,但是通常是右边界和左边界,作为待导入基因的侧面区域。在欧洲专利120516;Hoekama在“双性植物载体系统”,Offset-drukkerij KantersB.V.Alblasserdam(1985),第5章;Fraley等人,植物科学的关键和综述4,1-46和An等人(1985)EMBO J.4,277-287广泛地调查和描述的T-DNA在转化植物细胞中的应用。一旦将导入的DNA掺入到基因组,通常是稳定的并且还保留在原始转化的细胞的子代中。通常它含有选择性标记,该标记授予转化植物细胞对杀生剂或抗生素,例如卡那霉素,G418,bleomycin,潮霉素或磷苏菌素和其他的抗性。所使用的特定的标记物允许选择出失去插入的DNA的转化细胞。
许多技术可用于将DNA导入到植物。这些技术包括用农杆菌的辅助转化,原生质体的融合,DNA的微注射,电击穿,以及微弹轰击方法和病毒注射。然后将转化植物材料在合适的培养基上再生为完整植株,所述的培养基含有用于选择目的的抗生素或杀生剂。对于用于注射和电击穿的质粒没有特别的需求。但是,如果完整植株从这样的转化细胞再生,必须存在选择性标记物。以常规的方式在植物中生长转化细胞(McCormick等人(1986),植物细胞报告5,81-84)。通常可以培养该植物并且与具有相同的转化基因组或其他基因组的植物进行杂交。获得的个体具有相应的表现型特性。
本发明还提供了表达载体,它含有一个或多个本发明的DNA序列。可以通过给本发明的DNA提供合适的功能调节信号获得这样的表达载体。这样的复制信号是负责表达的DNA序列,例如启动子,加强子,核糖体结合位点,并且由宿主生物体识别。
非强制性地其他的调节信号例如控制重组DNA在宿主生物体中复制或重组的,也可以是表达载体的组成部份。
用于表达本发明的酶的合适的宿主细胞和生物体是那些不包括具有DOXP合成酶功能的固有酶,DOXP还原异构酶或gcpE激酶的微生物。这样的例子是古细菌,动物,真菌,丝状毛霉和一些真细菌。这样的固有酶活性的缺失本质上促进了重组酶的检测和纯化。因此,也可能是利用各种化学品和药物第一次直接从宿主细胞的粗提物中检测到本发明的重组酶的活性和特别是活性的抑制。
如果想要获得多肽链的翻译后修饰和天然折叠本发明的酶优选地在真核细胞中表达。但是根据表达系统,当表达通过DNA拼接去除内含子的基因组DNA序列时,确保产生的酶的多肽序列对寄生虫具抗性。利用重组DNA技术,将编码内含子的序列去除或为了试验的目的将该序列插入到待表达的DNA序列。
利用本领域内技术人员已知的方法从宿主细胞或宿主细胞的上清液可以分离蛋白质。也可以需要酶的体外重新活化。
为了有助于纯化,以具有不同肽链的融合蛋白的形式表达本发明的酶活该酶的亚序列。寡聚一组氨酸序列和来源于谷胱甘肽S-转移酶,硫氧还蛋白或钙调素结合肽的序列特别适用于该目的。
进一步以具有本领域内技术人员已知的这样的肽链的融合蛋白的形式表达本发明的酶或该酶的亚序列,该重组酶被运输到细胞外或运输到宿主细胞的腔室。因此有助于该酶的思维活性的纯化和调查。
当表达本发明的酶时,证明修饰个体密码子是方便的。如果在寄生虫中使用的密码子不同于在异源表达系统中的密码子的使用,该编码序列中碱基的有目的替代是可取的,以便确保蛋白质的最佳合成。此外非翻译5’和3’区域的分别缺失经常可调节,例如如果存在DNA的3’序列的几个脱稳定的序列基序ATTTA。然后在真核生物中优选表达中应该缺失这些。碱基的缺失,叠加或替代时这类变异并且是本发明的主题。
进一步可以在标准条件下,采用本领域内技术人员已知的方法进行体外翻译获得本发明的酶。适用于本发明的目的的系统是兔子网织红血球和小麦胚提取物和细菌裂解液。也可以将体外转录的mRNA翻译到Xenopus卵子。
其序列来源于本发明的酶的肽序列的寡聚-和多肽的序列可以通过化学合成方法获得。如果合适选择该序列,这样的肽具有本发明特征的特性。这样的肽可以大量地产生并且特别适合于酶活性动力学,酶活性的调节,酶的三维空间结构,各种化学剂和药物对酶活性的抑制,各种配体的结合几何形状和结合亲和性的调查。
本发明也提供了用于测定gcpE蛋白质的酶促活性的方法。利用已知的方法可以测定所述的活性。通过测定糖或磷糖类或类异戊二烯生物合成的前体的磷酸化,特别是2-C-甲基-D-赤藓糖醇,2-C-甲基-D-赤藓糖醇磷酸,特别是2-C-甲基-D-赤藓糖醇4-磷酸的磷酸化,2-C-甲基-D-赤藓糖,2-C-甲基-D-赤藓糖磷酸的磷酸化,特别是2-C-甲基-D-赤藓糖4-磷酸,CH2(OH)-C(CH3)=C(OH)-CH2-O-PO(OH)2,CH2(OH)-C(CH3)=C(OH)-CH2-OH,CH2(OH)-C(CH3)-CO-CH2-O-PO(OH)2,CH2(OH)-C(CH3)-CO-CH2OH,CH2=C(CH3)-CO-CH2-O-PO(OH)2,CH2=C(CH3)-CO-CH2-OH,CH2=C(CH3)-CH(OH)-CH2-O-PO(OH)2,CH2=C(CH3)-CH(OH)-CH2-OH,CH2(OH)-C(=CH2)-C(OH)-CH2-O-PO(OH)2,CH2(OH)-C(=CH2)-C(OH)-CH2-OH,CHO-CH(CH3)-CH(OH)-CH2-O-PO(OH)2,CHO-CH(CH3)-CH(OH)-CH2-OH,CH2(OH)-C(OH)(CH3)-CH=CH-O-PO(OH)2,CH2(OH)-C(OH)CH3-CH=CH-OH,CH(OH)=C(CH3)-CH(OH)-CH2-O-PO(OH)2,CH(OH)=C(CH3)-CH(OH)-CH2-OH,CH3-C(CH3)=CH-CH2-O-PO(OH)2,CH3-C(CH3)=CH-CH2-OH,CH2=C(CH3)-CH2-CH2-O-PO(OH)2,CH2=C(CH3)-CH2-CH2-OH的磷酸化进行测定。本发明还提供了将该测定方法用于识别抑制特定的酶的活性的物质。
已经发现脱氧-1-木酮糖磷酸代谢途径也存在于许多寄生虫,病毒和真菌。
因此本发明还涉及用于筛选抑制脱氧-D-木酮糖磷酸代谢途径的化合物的方法。根据本发明,提供了含有重组表达载体的宿主生物体,其中载体包括至少SEQ ID NO1,SEQ ID NO3或SEQID NO5的寡聚核苷酸序列的一部分或其变异体或其同系物,和提供了被怀疑对人和动物具有抗微生物,抗寄生虫,抗细菌,抗病毒和抗真菌的作用或对植物具有抗微生物,抗病毒,杀菌剂,除草剂或杀真菌剂的作用的化合物。然后将宿主生物体与该化合物和待测定的化合物接触。
序列表<110>哈桑·朱马<120>脱氧-D-木酮糖磷酸生物合成途径的基因在改变异戊二烯类的浓度中的应用<130>15904<140><141><150>19923567.8<151>1999-05-21<150>19923568.6<151>1999-05-21<160>8<170>PatentIn Ver.2.1<210>1<211>1119<212>DNA<213>大肠杆菌<220><221>CDS<222>(1)..(1119)<400>1atg cat aac cag gct cca att caa cgt aga aaa tca aca cgt att tac 48Met His Asn Gln Ala Pro Ile Gln Arg Arg Lys Ser Thr Arg Ile Tyr1 5 10 15gtt ggg aat gtg ccg att ggc gat ggt gct ccc atc gcc gta cag tcc 96Val Gly Asn Val Pro Ile Gly Asp Gly Ala Pro Ile Ala Val Gln Ser20 25 30atg acc aat acg cgt acg aca gac gtc gaa gca acg gtc aat caa atc 144Met Thr Asn Thr Arg Thr Thr Asp Val Glu Ala Thr Val Asn Gln Ile35 40 45aag gcg ctg gaa cgc gtt ggc gct gat atc gtc cgt gta tcc gta ccg 192Lys Ala Leu Glu Arg Val Gly Ala Asp Ile Val Arg Val Ser Val Pro50 55 60acg atg gac gcg gca gaa gcg ttc aaa ctc atc aaa cag cag gtt aac 240Thr Met Asp Ala Ala Glu Ala Phe Lys Leu Ile Lys Gln Gln Val Asn65 70 75 80gtg ccg ctg gtg gct gac atc cac ttc gac tat cgc att gcg ctg aaa288Val Pro Leu Val Ala Asp Ile His Phe Asp Tyr Arg Ile Ala Leu Lys85 90 95gta gcg gaa tac ggc gtc gat tgt ctg cgt att aac cct ggc aat atc 336Val Ala Glu Tyr Gly Val Asp Cys Leu Arg Ile Asn Pro Gly Asn Ile100 105 110ggt aat gaa gag cgt att cgc atg gtg gtt gac tgt gcg cgc gat aaa 384Gly Asn Glu Glu Arg Ile Arg Met Val Val Asp Cys Ala Arg Asp Lys115 120 125aac att ccg atc cgt att ggc gtt aac gcc gga tcg ctg gaa aaa gat 432Asn Ile Pro Ile Arg Ile Gly Val Asn Ala Gly Ser Leu Glu Lys Asp130 135 140ctg caa gaa aag tat ggc gaa ccg acg ccg cag gcg ttg ctg gaa tct 480Leu Gln Glu Lys Tyr Gly Glu Pro Thr Pro Gln Ala Leu Leu Glu Ser145 150 155 160gcc atg cgt cat gtt gat cat ctc gat cgc ctg aac ttc gat cag ttc 528Ala Met Arg His Val Asp His Leu Asp Arg Leu Asn Phe Asp Gln Phe165 170 175aaa gtc agc gtg aaa gcg tct gac gtc ttc ctc gct gtt gag tct tat 576Lys Val Ser Val Lys Ala Ser Asp Val Phe Leu Ala Val Glu Ser Tyr180 185 190cgt ttg ctg gca aaa cag atc gat cag ccg ttg cat ctg ggg atc acc 624Arg Leu Leu Ala Lys Gln Ile Asp Gln Pro Leu His Leu Gly Ile Thr195 200 205gaa gcc ggt ggt gcg cgc agc ggg gca gta aaa tcc gcc att ggt tta 672Glu Ala Gly Gly Ala Arg Ser Gly Ala Val Lys Ser Ala Ile Gly Leu210 215 220ggt ctg ctg ctg tct gaa ggc atc ggc gac acg ctg cgc gta tcg ctg 720Gly Leu Leu Leu Ser Glu Gly Ile Gly Asp Thr Leu Arg Val Ser Leu225 230 235 240gcg gcc gat ccg gtc gaa gag atc aaa gtc ggt ttc gat att ttg aaa 768Ala Ala Asp Pro Val Glu Glu Ile Lys Val Gly Phe Asp Ile Leu Lys245 250 255tcg ctg cgt atc cgt tcg cga ggg atc aac ttc atc gcc tgc ccg acc 816Ser Leu Arg Ile Arg Ser Arg Gly Ile Asn Phe Ile Ala Cys Pro Thr260 265 270tgt tcg cgt cag gaa ttt gat gtt atc ggt acg gtt aac gcg ctg gag 864Cys Ser Arg Gln Glu Phe Asp Val Ile Gly Thr Val Asn Ala Leu Glu275 280 285caa cgc ctg gaa gat atc atc act ccg atg gac gtt tcg att atc ggc 912Gln Arg Leu Glu Asp Ile Ile Thr Pro Met Asp Val Ser Ile Ile Gly290 295 300tgc gtg gtg aat ggc cca ggt gag gcg ctg gtt tct aca ctc ggc gtc 960Cys Val Val Asn Gly Pro Gly Glu Ala Leu Val Ser Thr Leu Gly Val305 310 315 320acc ggc ggc aac aag aaa agc ggc ctc tat gaa gat ggc gtg cgc aaa 1008Thr Gly Gly Asn Lys Lys Ser Gly Leu Tyr Glu Asp Gly Val Arg Lys325 330 335gac cgt ctg gac aac aac gat atg atc gac cag ctg gaa gca cgc att 1056Asp Arg Leu Asp Asn Asn Asp Met Ile Asp Gln Leu Glu Ala Arg Ile340 345 350cgt gcg aaa gcc agt cag ctg gac gaa gcg cgt cga att gac gtt cag 1104Arg Ala Lys Ala Ser Gln Leu Asp Glu Ala Arg Arg Ile Asp Val Gln355 360 365cag gtt gaa aaa taa 1119Gln Val Glu Lys370<210>2<211>372<212>PRT<213>大肠杆菌<400>2Met His Asn Gln Ala Pro Ile Gln Arg Arg Lys Ser Thr Arg Ile Tyr1 5 10 15Val Gly Asn Val Pro Ile Gly Asp Gly Ala Pro Ile Ala Val Gln Ser20 25 30Met Thr Asn Thr Arg Thr Thr Asp Val Glu Ala Thr Val Asn Gln Ile35 40 45Lys Ala Leu Glu Arg Val Gly Ala Asp Ile Val Arg Val Ser Val Pro50 55 60Thr Met Asp Ala Ala Glu Ala Phe Lys Leu Ile Lys Gln Gln Val Asn65 70 75 80Val Pro Leu Val Ala Asp Ile His Phe Asp Tyr Arg Ile Ala Leu Lys85 90 95Val Ala Glu Tyr Gly Val Asp Cys Leu Arg Ile Asn Pro Gly Asn Ile100 105 110Gly Asn Glu Glu Arg Ile Arg Met Val Val Asp Cys Ala Arg Asp Lys115 120 125Asn Ile Pro Ile Arg Ile Gly Val Asn Ala Gly Ser Leu Glu Lys Asp130 135 140Leu Gln Glu Lys Tyr Gly Glu Pro Thr Pro Gln Ala Leu Leu Glu Ser145 150 155 160Ala Met Arg His Val Asp His Leu Asp Arg Leu Asn Phe Asp Gln Phe165 170 175Lys Val Ser Val Lys Ala Ser Asp Val Phe Leu Ala Val Glu Ser Tyr180 185 190Arg Leu Leu Ala Lys Gln Ile Asp Gln Pro Leu His Leu Gly Ile Thr195 200 205Glu Ala Gly Gly Ala Arg Ser Gly Ala Val Lys Ser Ala Ile Gly Leu210 215 220Gly Leu Leu Leu Ser Glu Gly Ile Gly Asp Thr Leu Arg Val Ser Leu225 230 235 240Ala Ala Asp Pro Val Glu Glu Ile Lys Val Gly Phe Asp Ile Leu Lys245 250 255Ser Leu Arg Ile Arg Ser Arg Gly Ile Asn Phe Ile Ala Cys Pro Thr260 265 270Cys Ser Arg Gln Glu Phe Asp Val Ile Gly Thr Val Asn Ala Leu Glu275 280 285Gln Arg Leu Glu Asp Ile Ile Thr Pro Met Asp Val Ser Ile Ile Gly290 295 300Cys Val Val Asn Gly Pro Gly Glu Ala Leu Val Ser Thr Leu Gly Val305 310 315 320Thr Gly Gly Asn Lys Lys Ser Gly Leu Tyr Glu Asp Gly Val Arg Lys325 330 335Asp Arg Leu Asp Asn Asn Asp Met Ile Asp Gln Leu Glu Ala Arg Ile340 345 350Arg Ala Lys Ala Ser Gln Leu Asp Glu Ala Arg Arg Ile Asp Val Gln355 360 365Gln Val Glu Lys370<210>3<211>2109<212>DNA<213>Plasmodium falciparum<220><221>CDS<222>(70)..(2109)<400>3cagcctataa atattattat ttattattat tttttttttt ttttttcata atgcctgaat 60aaccacaaa atg agt tat ata aaa aga ctg att ctt ttt atg tta ctg ttt 111Met Ser Tyr Ile Lys Arg Leu Ile Leu Phe Met Leu Leu Phe1 5 10tat tct cat gta aaa att aaa aaa tta ttt att aaa att tct aat gta 159Tyr Ser His Val Lys Ile Lys Lys Leu Phe Ile Lys Ile Ser Asn Val15 20 25 30aac ata ttt ttt gca gaa gca aag aaa aat gga aaa aag gaa ttc ttt 207Asn Ile Phe Phe Ala Glu Ala Lys Lys Asn Gly Lys Lys Glu Phe Phe35 40 45ctt ttt tta cta aat ata aaa aaa aat agc caa cag aaa aaa act tat 255Leu Phe Leu Leu Asn Ile Lys Lys Asn Ser Gln Gln Lys Lys Thr Tyr50 55 60cat att acc aaa agg aat acc ata aat aaa agt gat ttt tta tat tct 303His Ile Thr Lys Arg Asn Thr Ile Asn Lys Ser Asp Phe Leu Tyr Ser65 70 75tta cta aat gaa gaa ggg aat tct tca aaa aag gaa tat aaa aat tta 351Leu Leu Asn Glu Glu Gly Asn Ser Ser Lys Lys Glu Tyr Lys Asn Leu80 85 90aaa gat gaa gaa aaa tat aat atc ata caa aat ata aaa aaa tat tgt 399Lys Asp Glu Glu Lys Tyr Asn Ile Ile Gln Asn Ile Lys Lys Tyr Cys95 100 105 110gaa tgt act aaa aaa tat aaa agg ctc cca aca cga gaa gta gtt att 447Glu Cys Thr Lys Lys Tyr Lys Arg Leu Pro Thr Arg Glu Val Val Ile115 120 125gga aat gtt aaa att gga gga aat aat aaa ata gct att caa act atg 495Gly Asn Val Lys Ile Gly Gly Asn Asn Lys Ile Ala Ile Gln Thr Met130 135 140gct agc tgt gat aca aga aat gta gaa gaa tgt gta tat caa att aga 543Ala Ser Cys Asp Thr Arg Asn Val Glu Glu Cys Val Tyr Gln Ile Arg145 150 155aaa tgt aaa gat ttg ggt gct gac att gta agg ttg act gtt caa gga 591Lys Cys Lys Asp Leu Gly Ala Asp Ile Val Arg Leu Thr Val Gln Gly160 165 170gtt caa gaa gca caa gct agt tat cat att aaa gaa aaa tta tta tct 639Val Gln Glu Ala Gln Ala Ser Tyr His Ile Lys Glu Lys Leu Leu Ser175 180 185 190gaa aat gta aat atc cca tta gta aca gat att cat ttt aat cct aaa 687Glu Asn Val Asn Ile Pro Leu Val Thr Asp Ile His Phe Asn Pro Lys195 200 205ata gct tta atg gca gct gat gtg ttt gaa aaa att cga gtg aat cca 735Ile Ala Leu Met Ala Ala Asp Val Phe Glu Lys Ile Arg Val Asn Pro210 215 220gga aat tat gtt gat gga aga aaa aaa tgg ata gat aaa gtt tat aaa 783Gly Asn Tyr Val Asp Gly Arg Lys Lys Trp Ile Asp Lys Val Tyr Lys225 230 235act aaa gaa gaa ttt gat gaa ggg aaa tta ttt ata aaa gaa aaa ttt 831Thr Lys Glu Glu Phe Asp Glu Gly Lys Leu Phe Ile Lys Glu Lys Phe240 245 250gta cca tta att gaa aaa tgt aaa aga tta aat aga gca ata aga att 879Val Pro Leu Ile Glu Lys Cys Lys Arg Leu Asn Arg Ala Ile Arg Ile255 260 265 270ggt aca aat cat gga ttc ctt tca tct cga gta tta tca tat tat gga 927Gly Thr Asn His Gly Phe Leu Ser Ser Arg Val Leu Ser Tyr Tyr Gly275 280 285gat aca cea tta gca tta gta gaa agt gct atg aga ttt tct gat tta 975Asp Thr Pro Leu Ala Leu Val Glu Ser Ala Met Arg Phe Ser Asp Leu290 295 300tgt aat gaa aac aat ttt aac aat ctt gtt ttt tct atg aaa gct tct 1023Cys Asn Glu Asn Asn Phe Asn Asn Leu Val Phe Ser Met Lys Ala Ser305 310 315aat gct tat gtt atg ata caa tct tat aga tta tta gta tct aaa caa 1071Asn Ala Tyr Val Met Ile Gln Ser Tyr Arg Leu Leu Val Ser Lys Gln320 325 330tat gaa aga aat atg atg ttc cct ata cat tta gga gtt aca gaa gca 1119Tyr Glu Arg Asn Met Met Phe Pro Ile His Leu Gly Val Thr Glu Ala335 340 345 350gga ttt ggt gat aat gga aga ata aaa tct tat tta ggt ata gga tct 1167Gly Phe Gly Asp Asn Gly Arg Ile Lys Ser Tyr Leu Gly Ile Gly Ser355 360 365tta tta tat gat ggt ata gga gat acc att cgt ata tcc tta aca gaa 1215Leu Leu Tyr Asp Gly Ile Gly Asp Thr Ile Arg Ile Ser Leu Thr Glu370 375 380gat cct tgg gaa gag tta act cct tgt aaa aaa tta gtt gaa aat tta 1263Asp Pro Trp Glu Glu Leu Thr Pro Cys Lys Lys Leu Val Glu Asn Leu385 390 395aag aaa aga ata ttt tat aat gaa aat ttt aaa gaa gat aat gaa tta 1311Lys Lys Arg Ile Phe Tyr Asn Glu Asn Phe Lys Glu Asp Asn Glu Leu400 405 410aaa aat aat gaa atg gat acc aaa aat cta tta aat ttt gaa gaa aat 1359Lys Asn Asn Glu Met Asp Thr Lys Asn Leu Leu Asn Phe Glu Glu Asn415 420 425 430tat cga aat ttt aat aat ata aaa aaa aga aat gta gaa aaa aat aat 1407Tyr Arg Asn Phe Asn Asn Ile Lys Lys Arg Asn Val Glu Lys Asn Asn435 440 445aat gta tta cat gaa gag tgc act ata ggt aat gta gta acc ata aaa 1455Asn Val Leu His Glu Glu Cys Thr Ile Gly Asn Val Val Thr Ile Lys450 455 460gag tta gaa gat tct ctg caa att ttt aaa gat tta aat tta gaa gta 1503Glu Leu Glu Asp Ser Leu Gln Ile Phe Lys Asp Leu Asn Leu Glu Val465 470 475gat tca aat gga aat ttg aaa aag gga gcc aaa aca act gat atg gtt 1551Asp Ser Asn Gly Asn Leu Lys Lys Gly Ala Lys Thr Thr Asp Met Val480 485 490att ata aat gat ttt cat aat ata aca aat tta gga aaa aaa act gtg 1599Ile Ile Asn Asp Phe His Asn Ile Thr Asn Leu Gly Lys Lys Thr Val495 500 505 510gat aaa tta atg caa gtg gga att aat ata gta gtt caa tat gaa cca 1647Asp Lys Leu Met Gln Val Gly Ile Asn Ile Val Val Gln Tyr Glu Pro515 520 525cat aat ata gaa ttt ata gaa aaa atg gaa cca aat aat gat aat aat 1695His Asn Ile Glu Phe Ile Glu Lys Met Glu Pro Asn Asn Asp Asn Asn530 535 540aat aat aat aat aat aat aat ata tta ttt tat gtg gat ata aaa aat 1743Asn Asn Asn Asn Asn Asn Asn Ile Leu Phe Tyr Val Asp Ile Lys Asn545 550 555att atg aac agt tca gaa aaa aat att aaa tta agt aat tct aaa gga 1791Ile Met Asn Ser Ser Glu Lys Asn Ile Lys Leu Ser Asn Ser Lys Gly560 565 570tat gga tta att tta aac gga aaa gaa gat ata caa acc ata aaa aaa 1839Tyr Gly Leu Ile Leu Asn Gly Lys Glu Asp Ile Gln Thr Ile Lys Lys575 580 585 590ata aaa gaa tta aat cgt cgt cct tta ttc att cta tta aaa tca gat 1887Ile Lys Glu Leu Asn Arg Arg Pro Leu Phe Ile Leu Leu Lys Ser Asp595 600 605aac ata tat gaa cat gta tta ata acc aga aga att aat gaa ctt tta 1935Asn Ile Tyr Glu His Val Leu Ile Thr Arg Arg Ile Asn Glu Leu Leu610 615 620caa tcc tta aat ata aat ata cct tat ata cat tat gtt gat att aat 1983Gln Ser Leu Asn Ile Asn Ile Pro Tyr Ile His Tyr Val Asp Ile Asn625 630 635tca aat aat tat gat gat ata tta gtt aat tca aca tta tat gca gga 2031Ser Asn Asn Tyr Asp Asp Ile Leu Val Asn Ser Thr Leu Tyr Ala Gly640 645 650agt tgt ttg atg gat tta atg ggg gat ggt ctt att gtt aac gta act 2079Ser Cys Leu Met Asp Leu Met Gly Asp Gly Leu Ile Val Asn Val Thr655 660 665 670aat gat gtt ctt aca aat aaa aaa ggg tag 2109Asn Asp Val Leu Thr Asn Lys Lys Gly675 680<210>4<211>679<212>PRT<213>Plasmodium falciparum<400>4Met Ser Tyr Ile Lys Arg Leu Ile Leu Phe Met Leu Leu Phe Tyr Ser1 5 10 15His Val Lys Ile Lys Lys Leu Phe Ile Lys Ile Ser Asn Val Asn Ile20 25 30Phe Phe Ala Glu Ala Lys Lys Asn Gly Lys Lys Glu Phe Phe Leu Phe35 40 45Leu Leu Asn Ile Lys Lys Asn Ser Gln Gln Lys Lys Thr Tyr His Ile50 55 60Thr Lys Arg Asn Thr Ile Asn Lys Ser Asp Phe Leu Tyr Ser Leu Leu65 70 75 80Asn Glu Glu Gly Asn Ser Ser Lys Lys Glu Tyr Lys Asn Leu Lys Asp85 90 95Glu Glu Lys Tyr Asn Ile Ile Gln Asn Ile Lys Lys Tyr Cys Glu Cys100 105 110Thr Lys Lys Tyr Lys Arg Leu Pro Thr Arg Glu Val Val Ile Gly Asn115 120 125Val Lys Ile Gly Gly Asn Asn Lys Ile Ala Ile Gln Thr Met Ala Ser130 135 140Cys Asp Thr Arg Asn Val Glu Glu Cys Val Tyr Gln Ile Arg Lys Cys145 150 155 160Lys Asp Leu Gly Ala Asp Ile Val Arg Leu Thr Val Gln Gly Val Gln165 170 175Glu Ala Gln Ala Ser Tyr His Ile Lys Glu Lys Leu Leu Ser Glu Asn180 185 190Val Asn Ile Pro Leu Val Thr Asp Ile His Phe Asn Pro Lys Ile Ala
195 200 205Leu Met Ala Ala Asp Val Phe Glu Lys Ile Arg Val Asn Pro Gly Asn210 215 220Tyr Val Asp Gly Arg Lys Lys Trp Ile Asp Lys Val Tyr Lys Thr Lys225 230 235 240Glu Glu Phe Asp Glu Gly Lys Leu Phe Ile Lys Glu Lys Phe Val Pro245 250 255Leu Ile Glu Lys Cys Lys Arg Leu Asn Arg Ala Ile Arg Ile Gly Thr260 265 270Asn His Gly Phe Leu Ser Ser Arg Val Leu Ser Tyr Tyr Gly Asp Thr275 280 285Pro Leu Ala Leu Val Glu Ser Ala Met Arg Phe Ser Asp Leu Cys Asn290 295 300Glu Asn Asn Phe Asn Asn Leu Val Phe Ser Met Lys Ala Ser Asn Ala305 310 315 320Tyr Val Met Ile Gln Ser Tyr Arg Leu Leu Val Ser Lys Gln Tyr Glu325 330 335Arg Asn Met Met Phe Pro Ile His Leu Gly Val Thr Glu Ala Gly Phe340 345 350Gly Asp Asn Gly Arg Ile Lys Ser Tyr Leu Gly Ile Gly Ser Leu Leu355 360 365Tyr Asp Gly Ile Gly Asp Thr Ile Arg Ile Ser Leu Thr Glu Asp Pro370 375 380Trp Glu Glu Leu Thr Pro Cys Lys Lys Leu Val Glu Asn Leu Lys Lys385 390 395 400Arg Ile Phe Tyr Asn Glu Asn Phe Lys Glu Asp Asn Glu Leu Lys Asn405 410 415Asn Glu Met Asp Thr Lys Asn Leu Leu Asn Phe Glu Glu Asn Tyr Arg420 425 430Asn Phe Asn Asn Ile Lys Lys Arg Asn Val Glu Lys Asn Asn Asn Val435 440 445Leu His Glu Glu Cys Thr Ile Gly Asn Val Val Thr Ile Lys Glu Leu450 455 460Glu Asp Ser Leu Gln Ile Phe Lys Asp Leu Asn Leu Glu Val Asp Ser465 470 475 480Asn Gly Asn Leu Lys Lys Gly Ala Lys Thr Thr Asp Met Val Ile Ile485 490 495Asn Asp Phe His Asn Ile Thr Asn Leu Gly Lys Lys Thr Val Asp Lys500 505 510Leu Met Gln Val Gly Ile Asn Ile Val Val Gln Tyr Glu Pro His Asn515 520 525Ile Glu Phe Ile Glu Lys Met Glu Pro Asn Asn Asp Asn Asn Asn Asn530 535 540Asn Asn Asn Asn Asn Ile Leu Phe Tyr Val Asp Ile Lys Asn Ile Met545 550 555 560Asn Ser Ser Glu Lys Asn Ile Lys Leu Ser Asn Ser Lys Gly Tyr Gly565 570 575Leu Ile Leu Asn Gly Lys Glu Asp Ile Gln Thr Ile Lys Lys Ile Lys580 585 590Glu Leu Asn Arg Arg Pro Leu Phe Ile Leu Leu Lys Ser Asp Asn Ile595 600 605Tyr Glu His Val Leu Ile Thr Arg Arg Ile Asn Glu Leu Leu Gln Ser610 615 620Leu Asn Ile Asn Ile Pro Tyr Ile His Tyr Val Asp Ile Asn Ser Asn625 630 635 640Asn Tyr Asp Asp Ile Leu Val Asn Ser Thr Leu Tyr Ala Gly Ser Cys645 650 655Leu Met Asp Leu Met Gly Asp Gly Leu Ile Val Asn Val Thr Asn Asp660 665 670Val Leu Thr Asn Lys Lys Gly675<210>5<211>1200<212>DNA<213>大肠杆菌<400>5aatggctatc agaccgcttt aatgtcgatg gcttcaccct gcatccgttt acgcagggta 60cgtttcgtac ggtcgataac atcgcccgcc aactgaccac aggcagcatc gatatcatca 120ccacgagttt tacgcacaat agtggtgaaa ccgtagctca tcagcacttt tgagaaacgg 180tcgatacggc tgttcgagct gcgtccatac ggcgcacccg ggaacgggtt ccacgggatc 240aggttgatct tacacggcgt atctttcagc agttccgcca gttggtgcgc gtgttcagtg 300ccgtcgttaa cgtggtcaag catcacgtat tcaatagtga ctcggccctg attggcgttg 360gatttctcca gataacggcg caccgcagca aggaacgttt cgatattgta ctttttgttg 420atcggcacaa tttcgtcacg aatttcgtcg ttcggcgcgt gcagggaaat tgccagtgca 480acgtcgatca tatcgcccag tttatccagc gccggaacta caccggaagt ggaaagcgtg 540acgcgacgtt tagacaggcc aaaaccgaaa tcatcaagca tgatttccat cgccggaacg 600acgttgttca ggttgagcag cggctcgccc atgcccatca tcactacgtt agtgatcgga 660cgctgaccgg tgacttttgc tgcgccgacg attttcgccg cacgccacac ctggccgata 720atttccgaca cccgcaggtt gcggttaaag ccctgctggg cggtggaaca gaatttacac 780tccagcgcac accccacctg cgaagagacg cagagcgtgg cacggtcgtc ttccgggata 840tacaccgttt cgacgcgctg atcgccaacg gcgatcgccc atttaatggt gccgtcagat 900gaacgctgtt cttcaaccac ttccggtgcg cggatttccg ccacctcttt cagtttgccg 960cgcaacactt tgttgatgtc ggtcatctca tcaaagttgt cgcagcaata gtgatacatc 1020cacttcatca cctgatcggc gcggaagggt ttttcaccta aatctttaaa aaactcccgc 1080atctgctgac ggttgagatc cagcaggttg atttttccat ctttcgtggt gacgttttca 1140ggtgtgacta attgttcaga catatgctat tccggcctcg ttattacacg ttatggcccc 1200<210>6<211>384<212>PRT<213>大肠杆菌<400>6Met Ser Glu Gln Leu Val Thr Pro Glu Asn Val Thr Thr Lys Asp Gly1 5 10 15Lys Ile Asn Leu Leu Asp Leu Asn Arg Gln Gln Met Arg Glu Phe Phe
20 25 30Lys Asp Leu Gly Glu Lys Pro Phe Arg Ala Asp Gln Val Met Lys Trp35 40 45Met Tyr His Tyr Cys Cys Asp Asn Phe Asp Glu Met Thr Asp Ile Asn50 55 60Lys Val Leu Arg Gly Lys Leu Lys Glu Val Ala Glu Ile Arg Ala Pro65 70 75 80Glu Val Val Glu Glu Gln Arg Ser Ser Asp Gly Thr Ile Lys Trp Ala85 90 95Ile Ala Val Gly Asp Gln Arg Val Glu Thr Val Tyr Ile Pro Glu Asp100 105 110Asp Arg Ala Thr Leu Cys Val Ser Ser Gln Val Gly Cys Ala Leu Glu115 120 125Cys Lys Phe Cys Ser Thr Ala Gln Gln Gly Phe Asn Arg Asn Leu Arg130 135 140Val Ser Glu Ile Ile Gly Gln Val Trp Arg Ala Ala Lys Ile Val Gly145 150 155 160Ala Ala Lys Val Thr Gly Gln Arg Pro Ile Thr Asn Val Val Met Met165 170 175Gly Met Gly Glu Pro Leu Leu Asn Leu Asn Asn Val Val Pro Ala Met180 185 190Glu Ile Met Leu Asp Asp Phe Gly Phe Gly Leu Ser Lys Arg Arg Val195 200 205Thr Leu Ser Thr Ser Gly Val Val Pro Ala Leu Asp Lys Leu Gly Asp210 215 220Met Ile Asp Val Ala Leu Ala Ile Ser Leu His Ala Pro Asn Asp Glu225 230 235 240Ile Arg Asp Glu Ile Val Pro Ile Asn Lys Lys Tyr Asn Ile Glu Thr245 250 255Phe Leu Ala Ala Val Arg Arg Tyr Leu Glu Lys Ser Asn Ala Asn Gln260 265 270Gly Arg Val Thr Ile Glu Tyr Val Met Leu Asp His Val Asn Asp Gly275 280 285Thr Glu His Ala His Gln Leu Ala Glu Leu Leu Lys Asp Thr Pro Cys290 295 300Lys Ile Asn Leu Ile Pro Trp Asn Pro Phe Pro Gly Ala Pro Tyr Gly305 310 315 320Arg Ser Ser Asn Ser Arg Ile Asp Arg Phe Ser Lys Val Leu Met Ser325 330 335Tyr Gly Phe Thr Thr Ile Val Arg Lys Thr Arg Gly Asp Asp Ile Asp340 345 350Ala Ala Cys Gly Gln Leu Ala Gly Asp Val Ile Asp Arg Thr Lys Arg355 360 365Thr Leu Arg Lys Arg Met Gln Gly Glu Ala Ile Asp Ile Lys Ala Val370 375 380<210>7<211>1320<212>DNA<213>Plasmodium falciparum<220><221>CDS<222>(163)..(1173)<400>7taaataaata aattataaat ctttcaagaa tatatttttt ataaaaacat aaaatataaa 60atatacatat atatatatat atatatttta tattactttt aaaattattt atttatacaa 120atggaaattt aatgtgaaga atagaaaaaa cattttgtca at atg gaa aag tca174
Met Glu Lys Ser1aaa agg tac ata age ctg att aag atg atg gaa agg aaa aaa ttt gag 222Lys Arg Tyr Ile Ser Leu Ile Lys Met Met Glu Arg Lys Lys Phe Glu5 10 15 20aag tat aga tta aaa caa ata atg gat aat ata tat aaa gga aaa ata 270Lys Tyr Arg Leu Lys Gln Ile Met Asp Asn Ile Tyr Lys Gly Lys Ile25 30 35att gaa ata aat aaa atg aaa aat att cca act gaa ata aga aga gaa 318Ile Glu Ile Asn Lys Met Lys Asn Ile Pro Thr Glu Ile Arg Arg Glu40 45 50tta aaa aat ata ttt cat aat aat att tta agt ata aaa ccg atc aaa 366Leu Lys Asn Ile Phe His Asn Asn Ile Leu Ser Ile Lys Pro Ile Lys55 60 65gaa tta aaa tat gat aga gca tat aaa gta tta ttt cag tgt aaa gat 414Glu Leu Lys Tyr Asp Arg Ala Tyr Lys Val Leu Phe Gln Cys Lys Asp70 75 80aat gaa aag att gaa gca aca tca tta gat ttt ggt tcg cat aaa tct 462Asn Glu Lys Ile Glu Ala Thr Ser Leu Asp Phe Gly Ser His Lys Ser85 90 95 100tta tgt ata tct agc caa ata ggt tgt tct ttt gga tgt aag ttt tgt 510Leu Cys Ile Ser Ser Gln Ile Gly Cys Ser Phe Gly Cys Lys Phe Cys105 110 115gct act ggt caa att ggt ata aaa aga caa tta gat ata gat gaa ata 558Ala Thr Gly Gln Ile Gly Ile Lys Arg Gln Leu Asp Ile Asp Glu Ile120 125 130act gat caa ctt tta tat ttt caa tca aaa gga gtt gat ata aaa aat 606Thr Asp Gln Leu Leu Tyr Phe Gln Ser Lys Gly Val Asp Ile Lys Asn135 140 145ata tct ttt atg ggt atg gga gaa cct tta gct aat cca tat gtt ttt 654Ile Ser Phe Met Gly Met Gly Glu Pro Leu Ala Asn Pro Tyr Val Phe150 155 160gat tct ata caa ttt ttt aat gat aat aat tta ttt tct ata tct aat 702Asp Ser Ile Gln Phe Phe Asn Asp Asn Asn Leu Phe Ser Ile Ser Asn165 170 175 180aga cgt att aat ata tct act gtt ggt ctt tta cca gga att aaa aaa 750Arg Arg Ile Asn Ile Ser Thr Val Gly Leu Leu Pro Gly Ile Lys Lys185 190 195tta aat aac atc ttt cct caa gtt aat tta gct ttc tca tta cat tct 798Leu Asn Asn Ile Phe Pro Gln Val Asn Leu Ala Phe Ser Leu His Ser200 205 210cca ttt act gaa gaa agg gat caa ctt gta cca att aat aaa ttg ttt 846Pro Phe Thr Glu Glu Arg Asp Gln Leu Val Pro Ile Asn Lys Leu Phe215 220 225ccg ttt aat gaa gtt ttt gat tta tta gat gaa aga ata gca aaa act 894Pro Phe Asn Glu Val Phe Asp Leu Leu Asp Glu Arg Ile Ala Lys Thr230 235 240ggt aga aga gtt tgg ata agt tat att tta att aaa aat ctt aat gac 942Gly Arg Arg Val Trp Ile Ser Tyr Ile Leu Ile Lys Asn Leu Asn Asp245 250 255 260tcc aaa gat cat gca gaa gct ttg tct gat cat ata tgt aaa aga cca 990Ser Lys Asp His Ala Glu Ala Leu Ser Asp His Ile Cys Lys Arg Pro265 270 275aat aac ata aga tac tta tat aat gta tgt tta ata cct tat aat aaa 1038Asn Asn Ile Arg Tyr Leu Tyr Asn Val Cys Leu Ile Pro Tyr Asn Lys280 285 290ggt aat aga att tat aat ata tca ttt gaa tat ata tat ata tat ata 1086Gly Asn Arg Ile Tyr Asn Ile Ser Phe Glu Tyr Ile Tyr Ile Tyr Ile295 300 305tat tta cta ata ata aaa aaa aag ata tta tgt aaa tat att atg ttt 1134Tyr Leu Leu Ile Ile Lys Lys Lys Ile Leu Cys Lys Tyr Ile Met Phe310 315 320cac aca tta tat aaa tat ata ggc ata gag gac atg tta taaaaaagtg1183His Thr Leu Tyr Lys Tyr Ile Gly Ile Glu Asp Met Leu325 330 335caacatatat atatatatat atatatatat atatatatat acattttttt tatatttata 1243ttatcttttt aatacattta ttccattaca ttgcagccaa aaatgttgac gaaaattttc 1303atcgtttgga cgatgct1320<210>8<211>337<212>PRT<213>Plasmodium falciparum<400>8Met Glu Lys Ser Lys Arg Tyr Ile Ser Leu Ile Lys Met Met Glu Arg1 5 10 15Lys Lys Phe Glu Lys Tyr Arg Leu Lys Gln Ile Met Asp Asn Ile Tyr20 25 30Lys Gly Lys Ile Ile Glu Ile Asn Lys Met Lys Asn Ile Pro Thr Glu35 40 45Ile Arg Arg Glu Leu Lys Asn Ile Phe His Asn Asn Ile Leu Ser Ile50 55 60Lys Pro Ile Lys Glu Leu Lys Tyr Asp Arg Ala Tyr Lys Val Leu Phe65 70 75 80Gln Cys Lys Asp Asn Glu Lys Ile Glu Ala Thr Ser Leu Asp Phe Gly85 90 95Ser His Lys Ser Leu Cys Ile Ser Ser Gln Ile Gly Cys Ser Phe Gly100 105 110Cys Lys Phe Cys Ala Thr Gly Gln Ile Gly Ile Lys Arg Gln Leu Asp115 120 125Ile Asp Glu Ile Thr Asp Gln Leu Leu Tyr Phe Gln Ser Lys Gly Val130 135 140Asp Ile Lys Asn Ile Ser Phe Met Gly Met Gly Glu Pro Leu Ala Asn145 150 155 160Pro Tyr Val Phe Asp Ser Ile Gln Phe Phe Asn Asp Asn Asn Leu Phe165 170 175Ser Ile Ser Asn Arg Arg Ile Asn Ile Ser Thr Val Gly Leu Leu Pro180 185 190Gly Ile Lys Lys Leu Asn Asn Ile Phe Pro Gln Val Asn Leu Ala Phe195 200 205Ser Leu His Ser Pro Phe Thr Glu Glu Arg Asp Gln Leu Val Pro Ile210 215 220Asn Lys Leu Phe Pro Phe Asn Glu Val Phe Asp Leu Leu Asp Glu Arg225 230 235 240Ile Ala Lys Thr Gly Arg Arg Val Trp Ile Ser Tyr Ile Leu Ile Lys245 250 255Asn Leu Asn Asp Ser Lys Asp His Ala Glu Ala Leu Ser Asp His Ile260 265 270Cys Lys Arg Pro Asn Asn Ile Arg Tyr Leu Tyr Asn Val Cys Leu Ile275 280 285Pro Tyr Asn Lys Gly Asn Arg Ile Tyr Asn Ile Ser Phe Glu Tyr Ile290 295 300Tyr Ile Tyr Ile Tyr Leu Leu Ile Ile Lys Lys Lys Ile Leu Cys Lys305 310 315 320Tyr Ile Met Phe His Thr Leu Tyr Lys Tyr Ile Gly Ile Glu Asp Met325 330 335Leu
权利要求
1.细菌或寄生虫的gcpE或yfgB基因的DNA序列用于掺入到病毒、真核生物和原核生物细胞的基因组中的应用。
2.DNA序列用于掺入到病毒、真核生物和原核生物细胞的基因组中的应用,所述DNA序列与细菌或寄生虫的gcpE或yfgB的蛋白质的DNA序列或来源于通过插入、缺失或替代的序列的其类似物或衍生物杂交,并且所述的DNA序列编码具有gcpE或yfgB基因的生物学活性的质体蛋白质。
3.根据权利要求1或2之一的DNA序列SEQ 1,3,5或7的应用。
4.根据权利要求1,2或3的应用,其特征在于将这些序列与控制元件连接,该原件确保在细胞中的转录和翻译的元件并且导致可翻译的mRNA的表达,引起gcpE或yfgB基因的合成。
5.植物细胞,其包括DNA序列,所述DNA序列与细菌或寄生虫的gcpE或yfgB基因的DNA序列或来源于通过插入、缺失或替代的序列的其类似物或衍生物杂交,并且所述的DNA序列编码具有gcpE或yfgB蛋白质的生物学活性的质体蛋白质。
6.转化的植物细胞和来自于所述的植物细胞的转基因植物,包括DNA序列或与细菌或寄生虫的gcpE或yfgB基因的DNA序列或来源于通过插入、缺失或替代的序列的其类似物或衍生物杂交的DNA序列,并且所述的DNA序列编码具有gcpE或yfgB蛋白质的生物学活性的质体蛋白质。
7.根据权利要求1-4任一项所述的应用,特别是用于增加病毒,真核生物或原核生物细胞中类异戊二烯的含量。
8.根据权利要求1-4任一项所述的应用,用于测定gcpE或yfgB蛋白质的酶促活性。
9.根据权利要求1-4任一项所述的应用,用于识别对gcpE蛋白质的酶促活性具有抑制作用的物质。
10.用于测定来自于细菌或寄生虫的gcpE蛋白质的酶促活性的方法,其特征在于缺失了类异戊二烯的生物合成的糖或磷糖或前体的磷酸化,特别是2-D-甲基-D-赤藓糖醇,2-C-甲基-D-磷酸赤藓糖醇,特别是2-C-甲基-D-赤藓糖醇-4-磷酸的磷酸化,2-C-甲基-D-赤藓糖,2-C-D-赤藓糖磷酸,特别是2-C-甲基-赤藓糖-4-磷酸,CH2(OH)-C(CH3)=C(OH)-CH2-O-PO(OH)2,CH2(OH)-C(CH3)=C(OH)-CH2-OH,CH2(OH)-C(CH3)-CO-CH2-O-PO(OH)2,CH2(OH)-C(CH3)-CO-CH2OH,CH2=C(CH3)-CO-CH2-O-PO(OH)2,CH2=C(CH3)-CO-CH2-OH,CH2=C(CH3)-CH(OH)-CH2-O-PO(OH)2,CH2=C(CH3)-CH(OH)-CH2-OH,CH2(OH)-C(=CH2)-C(OH)-CH2-O-PO(OH)2,CH2(OH)-C(=CH2)-C(OH)-CH2-OH,CHO-CH(CH3)-CH(OH)-CH2-O-PO(OH)2,CHO-CH(CH3)-CH(OH)-CH2-OH,CH2(OH)-C(OH)(CH3)-CH=CH-O-PO(OH)2,CH2(OH)-C(OH)(CH3)-CH=CH-OHCH(OH)=C(CH3)-CH(OH)-CH2-O-PO(OH)2,CH(OH)=C(CH3)-CH(OH)-CH2-OHCH3-C(CH3)=CH-CH2-O-PO(OH)2,CH3-C(CH3)=CH-CH2-OH,CH2=C(CH3)-CH2-CH2-O-PO(OH)2,CH2=C(CH3)-CH2-CH2-OH的磷酸化。
11.筛选化合物的方法,该方法包括a)提供了含有重组表达载体的宿主细胞,其中载体包括编码来自于细菌或寄生虫的gcpE或yfgB蛋白质或该多肽的类似物或衍生物的DNA序列的至少一个片段,其中一个或多个氨基酸被缺失,叠加或被另一个氨基酸替代,并且基本上没有降低该多肽的酶促活性,而且提供了被怀疑对人和动物具有抗真菌、抗寄生虫,或抗病毒作用的化合物,b)将宿主细胞与该化合物接触和c)测定该化合物的抗真菌,抗寄生虫或抗病毒作用。
12.筛选化合物的方法,该方法包括a)提供了含有重组表达载体的宿主细胞,其中载体包括编码来自于细菌或寄生虫的gcpE或yfgB蛋白质或该多肽的类似物或衍生物的DNA序列的至少一个片段,其中多肽一个或多个氨基酸被缺失,叠加或被其它氨基酸替代,并且基本上没有降低该多肽的酶促活性,而且提供了被怀疑对植物具有抗病毒,抗寄生虫,杀真菌或除草剂作用的化合物,b)将宿主细胞与该化合物接触和c)测定该化合物的抗病毒,抗寄生虫,杀真菌或除草剂作用。
全文摘要
本发明涉及来自于细菌或寄生虫的命名为gcpE和yfgB基因的DNA序列用于掺入到病毒,真核细胞和原核细胞的基因组,从而改变类异戊二烯的浓度。本发明还涉及识别在植物中具有除草剂,抗寄生虫,抗病毒剂,杀真菌剂作用和在人体和动物中具有抗真菌,抗寄生虫,抗病毒剂作用的物质的方法。
文档编号G01NGK1351715SQ00807856
公开日2002年5月29日 申请日期2000年5月20日 优先权日1999年5月21日
发明者哈桑·朱马 申请人:朱马制药有限公司