专利名称:转化破囊壶菌目微生物的产物和方法
技术领域:
本发明主要涉及编码破囊壶菌目乙酰乳酸合酶的分离的核酸分子,包括赋予破囊壶菌目微生物对磺酰脲化合物,咪唑啉酮类抑制剂和/或嘧啶基羟苯甲酸盐降低的敏感性的乙酰乳酸合酶;涉及包含破囊壶菌目微生物转化的选择性标记物的重组核酸分子,并涉及用本发明重组核酸分子转化这类微生物的方法。本发明也涉及破囊壶菌表达系统可用的基因启动子。本发明的重组核酸分子可用于外源核酸在破囊壶菌目微生物中的表达及用于在破囊壶菌目微生物中去除,突变或灭活基因。
背景技术:
开发导致对破囊壶菌纲的分类学进行了修正。分类学家将破囊壶菌放在藻类或藻类状原生生物中。然而,由于分类不确定,对于本发明最好认为本发明所述该菌株是破囊壶菌(目破囊壶菌目;科破囊壶菌科;属破囊壶菌属,Schizochytrium,Labyrinthuloides,或Japonochytrium)。分类学改变在下文中概括。
本文公开的某些单细胞微生物菌株是破囊壶菌目的成员。破囊壶菌是分类史进化的海洋真核生物。Moss(1986),Bahnweb和Jackle(1986),以及Chamberlain和Moss(1988)对破囊壶菌的分类地位问题进行了综述。
为了方便,分类学家首先将破囊壶菌纲与藻菌纲(藻类状真菌)的其它无色游动孢子真核生物放在一起。然而,藻菌纲这一名称最后从分类学地位中去掉,破囊壶菌被保留在卵菌纲(双鞭毛游动孢子真菌)中。最初假定卵菌纲与异鞭毛藻类相关,Barr(Barr,1983)总结的广泛超微结构和生化研究最终支持了这一假定。事实上卵菌纲被Leedale(1974)和其他藻类学家作为异鞭毛藻类的一部分接受。但由于其异养特性带来的方便,卵菌纲和破囊壶菌纲被真菌学家(研究真菌的科学家)而不是藻类学家(研究藻类的科学家)大量研究。
从另一分类学角度来看,进化生物学家对于真核生物如何进化的问题形成了两个系统学派。一个学说认为膜结合细胞器通过一系列的内共生的外生起源(Margulis,1970);例如线粒体起源于细菌的细胞内共生生物,叶绿体起源于蓝藻类,鞭毛起源于螺旋体。另一学说提出膜结合的细胞器从原核祖先的无膜结合的系统通过自生加工逐渐进化(Cavalier-Smith,1975)。然而两组进化生物学家都将卵菌纲和破囊壶菌纲从真菌中取出并与产色植物藻类一起放在产色植物界中(Cavalier-Smith,1981)(该界最近扩展到包括其它原生生物且该界的成员现在称为Stramenopiles)或与所有藻类一起放在Protoctista界中(Margulis和Sagen,1985)。
随着电子显微镜的发展,对破囊壶菌纲的两个属,即,破囊壶菌属和Schizochytrium的游动孢子超微结构的研究(Perkins,1976;Kazama,1980;Barr,1981)提供了破囊壶菌纲与卵菌纲仅具有较远的亲缘关系的良好证据。另外,对5S核糖体RNA序列的对应分析(多变量统计)得到的遗传数据表明破囊壶菌明显是一类独特的真核生物,完全区别于真菌,且与红藻和褐藻,以及与卵菌纲的成员有最近的亲缘关系(Mannella,等,1987)。大多数分类学家同意将破囊壶菌从卵菌纲中取出(Bartnicki-Garcia,1988)。
总之,采用Cavalier-Smith的分类系统(1981,1983),将破囊壶菌与产色植物藻类一起分类进产色植物界(Stramenopiles)中。该分类将它们放在与真菌完全不同的一个界中,而真菌都放在Eufungi界中。因此破囊壶菌的分类地位总结如下界产色植物界(Stramenopiles)门异鞭毛门目破囊壶菌目科破囊壶菌科属破囊壶菌属,Schizochytrium,Labyrinthuloides或Japonochytrium。
一些早期的分类学家将破囊壶菌属的一些原始的成员(具有变形虫状生活阶段的成员)分入一个称为Ulkenia的独立属中。然而,现在知道大多数(如果不是全部的话)破囊壶菌(包括破囊壶菌属和Schizochytrium)表现出变形虫状阶段且有人认为Ulkenia本身不是一个正确的属。本文使用的破囊壶菌属将包括Ulkenia。
尽管门和界的高级分类中的分类学地位不确定,但是破囊壶菌保持特有的和特征性的分类,其成员可分类在破囊壶菌目内。
Schizochytrium属和其它破囊壶菌目微生物,由于能产生大量脂类化合物,包括高度不饱和脂肪酸(HUFAs)和多种类胡萝卜素(例如,虾青素),因此具有相当的现有和潜在商业价值。ω-3高度不饱和脂肪酸极有经济价值,因为它们近来已被认定为重要的饮食化合物,可避免动脉硬化和冠心病,可减轻感染病症并延迟肿瘤细胞生长。这些有益作用是ω-3HUFA导致对ω-6脂肪酸所生成的化合物,以及从ω-3HUFA本身直接生成的有益化合物进行竞争性抑制的结果(Simopoulos等,1986)。ω-6脂肪酸是发现于植物和动物中的主要HUFA。因而,破囊壶菌目微生物作为商业生产生物的进一步发展,将显著受益于经由重组DNA技术对生物进行具体遗传变化的能力,包括增强极有价值的HUFA和类胡萝卜素的生产。另外,更好地理解这种不甚了解的生物群体的生化和分子生物学的能力会提供有价值的信息来用于指导对未来菌株的开发。然而,本发明之前没有适合转化破囊壶菌,包括Schizochytrium属和破囊壶菌属成员的方法和重组构建体。重要的是,具体用于转化破囊壶菌目微生物和鉴定破囊壶菌目-特异性启动子序列的选择性标记物的开发在本发明之前是没有的。
以前的研究者已描述了用于多种微生物,包括在并非破囊壶菌目成员的微藻中进行转化的方法和试剂。授予Allnutt等的美国专利6,027,900公开了用于真核生物藻类,特别是Phaeodactylum tricornutum的遗传工程的遗传融合体,它用光合藻类集光基因的启动子和来自印度斯坦链异壁菌的Sh ble基因作为选择性标记物。该细胞在高盐浓度(例如,10-35g/L)下生长,用ZeocinTM选择转化子。适于用此种方法转化的微藻细胞为光合微藻,它可在高盐浓度下生长。授予Dunahay等的美国专利5,661,017公开了转化含叶绿素C的藻类(例如硅藻)的方法,它使用含选择性标记物的重组构建体,该选择性标记物与适于嘎标记物在含叶绿素C的藻类中表达的调控序列可操作性连接。该文中称,该选择性标记物可以是任何适合的标记物,包括从细菌和真菌来源分离的标记物,并优选为新霉素磷酸转移酶。该调控序列可包括任何来自含叶绿素C的藻类的调控序列,并优选来自Cyclotella cryptica(例如,C.cryptica乙酰-CoA羧化酶调控序列)。
然而,此方法不能通过简单转换而用于破囊壶菌目微生物的转化,因为本发明之前,微生物如破囊壶菌目(例如,微藻)的转化还远远不到常规水平。成熟的细菌和酵母标记物及转化系统不一定能轻易适用于其它微生物。事实上,美国专利5,661,017指出“在发展真核生物微藻的转化系统上成功很少”(col.1,lines 49-51),一部分原因是很难向此种微生物引入外源DNA,还有一部分原因是缺乏适用于此类转化的标记物和载体。美国专利5,661,017所述系统特别用于含叶绿素C的藻类,因为那些发明者认为它们适宜转化,特别在与其它藻类比较后。类似地,美国专利6,027,900教授了特异用于光合微藻的转化方法,它认为大多藻类对任何遗传操作都是难操纵的(col.1,lines39-47)。适合细菌,酵母,昆虫和动物细胞的系统不容易适合微藻。因而本发明之前,本领域存在对微藻特异的有效转化系统和方法的需要。
另外,尽管破囊壶菌目现与产色植物藻类被分组到Stramenopiles,仍有本领域人员持意见认为这些微生物与大多微藻截然不同,而且本领域技术人员认为破囊壶菌目成员被分类为微藻根本不适合。被认为是微藻的微生物在进化中至少有四次不同的变革,导致″微藻″型微生物被置于不同的界(例如红藻,绿藻和金藻(产色植物界)都在不同的界)。结果,在其它微藻中有用的转化系统不指望对破囊壶菌有用。因而,尽管破囊壶菌目微生物具有商业价值,通过遗传工程利用此种微生物的全部潜力的能力在迄今还未被意识到。本发明之前,本发明人未见到任何对破囊壶菌目微生物转化有用的启动子,选择性标记物或载体,任何关于适合破囊壶菌所用的选择系统的知识。
总而言之,本领域有开发转化破囊壶菌目微生物的方法的需要,并从而提供了创造具有增强的商业价值的菌株的工具。另外,本领域有开发通过破囊壶菌目微生物的同源或非同源重组而突变或灭活特定基因的方法的需要,它提供一条改变细胞代谢并鉴定特定基因在破囊壶菌的功能的道路。
发明内容
本发明一实施方案涉及分离的核酸分子,它包含选自如下的核酸序列(a)编码蛋白的核酸序列,该蛋白具有选自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列,其中所述蛋白为乙酰乳酸合酶;(b)编码蛋白的核酸序列,该蛋白具有与氨基酸序列(a)至少约75%相同的氨基酸序列,其中所述蛋白为乙酰乳酸合酶;或(c)与核酸序列(a)或(b)完全互补的核酸序列。一方面,此核酸序列编码具有与氨基酸序列(a)至少约85%相同的氨基酸序列的蛋白,并且其中所述蛋白为乙酰乳酸合酶。另一方面,此核酸序列编码具有与氨基酸序列(a)至少约95%相同的氨基酸序列的蛋白,并且其中所述蛋白为乙酰乳酸合酶。另一方面,此核酸序列编码具有与SEQ ID NO15不同的氨基酸序列的蛋白,该不同是由于在选自116G,117A,192P,200A,251K,358M,383D,592V,595W和599F的氨基酸位置的氨基酸缺失,插入或取代。一方面,此核酸序列编码具有选自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列的蛋白,并且其中所述蛋白为乙酰乳酸合酶。另一方面,所述核酸序列选自SEQ ID NO14的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。
优选,上面鉴定的核酸序列所编码的蛋白的表达赋予用此核酸分子转化的破囊壶菌目微生物对选自磺酰脲化合物,咪唑啉酮类抑制剂,和嘧啶基羟苯甲酸盐的化合物降低的敏感性。在此实施方案的一方面中,该核酸序列编码具有氨基酸序列选自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的蛋白。在此实施方案的另一方面,所述核酸序列选自SEQ ID NO14的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。
本发明一实施方案中,上述核酸序列编码Schizochytrium乙酰乳酸合酶。一方面,Schizochytrium乙酰乳酸合酶的表达赋予用此核酸分子转化的破囊壶菌目微生物对选自磺酰脲化合物,咪唑啉酮类抑制剂,和嘧啶基羟苯甲酸盐的化合物降低的敏感性。
本发明另一实施方案涉及包含可操作性连接到转录控制序列的上述任一种分离的核酸分子的重组核酸分子。本发明另一实施方案涉及用此重组核酸分子转化的破囊壶菌目的重组微生物。
本发明另一实施方案涉及用于破囊壶菌目微生物转化的重组载体。所述载体包括编码乙酰乳酸合酶的核酸序列,所述乙酰乳酸合酶可赋予用此核酸分子转化的破囊壶菌目微生物对选自磺酰脲化合物,咪唑啉酮类抑制剂,和嘧啶基羟苯甲酸盐的化合物降低的敏感性。所述乙酰乳酸合酶具有选自如下的氨基酸序列(a)选自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列;和(b)与氨基酸序列(a)至少约75%相同的氨基酸序列。编码乙酰乳酸合酶的核酸序列是可操作性连接到转录控制序列。一方面,所述重组载体为表达载体。另一方面,所述重组载体为靶向载体。其它方面,载体内的核酸序列编码具有与氨基酸序列(a)至少约85%相同的,并且另一方面,至少约95%相同的氨基酸序列的乙酰乳酸合酶。一方面,此核酸序列编码具有与SEQ ID NO15不同的氨基酸序列的蛋白,该不同是由于在选自116G,117A,192P,200A,251K,358M,383D,592V,595W和599F的氨基酸位置的氨基酸缺失,插入或取代。在优选方面,所述乙酰乳酸合酶具有选自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列。另一方面,所述核酸序列选自SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。在重组载体内的转录控制序列可包括但不限于破囊壶菌目α-微管蛋白启动子,破囊壶菌目乙酰乳酸合酶启动子,来自破囊壶菌目聚酮化合物合酶(PKS)系统的启动子,或破囊壶菌目脂肪酸脱氢酶启动子。一方面,所述载体包含选自SEQ ID NO18,SEQ ID NO21和SEQ ID NO23的核酸序列。
本发明另一实施方案涉及破囊壶菌目微生物的细胞的转化方法。所述方法包括第一步骤(a)向破囊壶菌目微生物的细胞引入含有编码乙酰乳酸合酶的核酸序列的重组核酸分子,所述乙酰乳酸合酶赋予细胞对选自磺酰脲化合物,咪唑啉酮类抑制剂,和嘧啶基羟苯甲酸盐的化合物降低的敏感性,其中此乙酰乳酸合酶具有选自如下的氨基酸序列(i)选自SEQ ID NO19,SEQID NO22和SEQ ID NO24的氨基酸序列;和(ii)与氨基酸序列(i)至少约75%相同的氨基酸序列。所述方法包括第二步骤(b)选择被重组核酸分子成功转化了的细胞,方法是在含至少一种抑制未转化细胞的化合物的培养基中培养(a)的细胞,该化合物选自磺酰脲化合物,咪唑啉酮类抑制剂,和嘧啶基羟苯甲酸盐。一方面,此核酸序列编码具有与氨基酸序列(i)至少约85%相同的,更优选至少约95%相同的氨基酸序列的乙酰乳酸合酶。一方面此核酸序列编码与SEQ ID NO15不同的氨基酸序列的蛋白,该不同是由于在选自116G,117A,192P,200A,251K,358M,383D,592V,595W和599F的氨基酸位置的氨基酸缺失,插入或取代。另一方面,所述乙酰乳酸合酶具有选自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列。优选,所述核酸序列选自SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。另一方面,所述核酸序列与转录控制序列可操作地连接,所述转录控制序列选自破囊壶菌目α-微管蛋白启动子,破囊壶菌目乙酰乳酸合酶启动子,来自破囊壶菌目聚酮化合物合酶(PKS)系统的启动子,和破囊壶菌目脂肪酸脱氢酶启动子。
一方面,所述重组核酸分子还包含编码细胞产生的蛋白的核酸序列,其中此核酸序列编码可操作性连接到转录控制序列的蛋白。本实施方案一方面,所述蛋白与选自二十二碳六烯酸(DHA),二十二碳五烯酸(DPA),二十碳五烯酸(EPA)和二十碳四烯酸(ARA)的脂肪酸的合成相关。本实施方案另一方面,所述蛋白选自脂肪酸合酶,脂肪酸脱氢酶,脂肪酸延伸酶(elongase),与聚酮化合物合酶复合体相关的蛋白和与将脂肪酸掺入磷脂或三甘油酯分子相关的蛋白。一方面,所述蛋白为被核酸序列SEQ ID NO29编码的ω-3脂肪酸脱氢酶。另一方面,该蛋白为多烯脂肪酸异构酶。另一方面,此类蛋白选自HMG-CoA合酶,HMG-CoA还原酶,角鲨烯合酶,八氢番茄红素合酶,八氢番茄红素脱氢酶,类胡萝卜素环化酶,类胡萝卜素羟化酶,类胡萝卜素酮酶,维生素E和硫辛酸。
本方法另一方面,步骤(a)中的所述重组核酸分子还包含与微生物内靶核酸序列杂交的核酸序列,从而包含靶核酸序列的基因通过与第二种核酸序列同源重组而被突变或灭活。这方面,该靶核酸序列可编码选自下组的蛋白脂肪酶,脂肪酸氧化酶,参与糖类合成的蛋白,参与类异戊二烯途径产物合成的蛋白,参与细胞壁组分合成的蛋白,参与饱和脂肪酸合成途径的蛋白,参与多聚不饱和脂肪酸合成途径的蛋白,与聚酮化合物合酶复合体相关的蛋白和与将脂肪酸掺入磷脂或三甘油酯分子相关的蛋白。
本方法还可包括向细胞引入至少一种附加的重组核酸分子的步骤,此重组核酸分子包含编码要表达的蛋白的核酸序列,此核酸序列与转录控制序列可操作性连接。在另一方面,此方法还可包括向细胞引入至少一种附加的重组核酸分子的步骤,此重组核酸分子包含与微生物内的靶核酸序列杂交的第二种核酸序列,导致包含靶核酸序列的基因通过与第二种核酸序列同源重组而被突变或灭活。另一方面,此方法还包括向细胞引入重组核酸分子的步骤,此重组核酸分子包含编码博来霉素-结合蛋白的核酸序列。这方面,所述包含编码博来霉素-结合蛋白的核酸序列的重组核酸分子还包含编码细胞表达的第二种蛋白的核酸序列,其中所述编码第二种蛋白的核酸序列为可操作性连接到转录控制序列。所述转录控制序列可包括但不限于破囊壶菌目α-微管蛋白启动子,破囊壶菌目乙酰乳酸合酶启动子,来自破囊壶菌目聚酮化合物合酶(PKS)系统的启动子,和破囊壶菌目脂肪酸脱氢酶启动子。本实施方案的另外的方面,所述包含编码博来霉素-结合蛋白的核酸序列的重组核酸分子还包含与微生物内靶核酸序列杂交的第二种核酸序列,从而包含靶核酸序列的基因通过与第二种核酸序列同源重组而被突变或灭活。一实施方案中,所述重组核酸分子包含核酸序列SEQ ID NO9。
本发明方法中所述微生物可来自下列属,包括但不限于破囊壶菌属,Labyrinthuloides属,Japonochytrium属,和Schizochytriun属。一方面,此微生物来自下列种,包括但不限于Schizochytrium sp.,Schizochytriumaggregatum,Schizochytrium limacinum,Thraustochytrium sp.,Thraustochytrium striatum,Thraustochytrium aureum,Thraustochytriumroseum,和Japonochytrium sp.
本方法一实施方案中,所述引入步骤是用选自粒子轰击,电穿孔,显微射,脂转染,吸附,感染和原生质体融合的方法完成的。
本发明另一实施方案涉及用重组核酸分子转化的破囊壶菌目的重组微生物,该重组核酸分子包含了编码乙酰乳酸合酶的核酸序列,乙酰乳酸合酶赋予此微生物对选自磺酰脲化合物,咪唑啉酮类抑制剂和/或嘧啶基羟苯甲酸盐的化合物降低的敏感性。所述乙酰乳酸合酶具有选自下述的氨基酸序列(a)选自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列;和(b)与氨基酸序列(a)至少约75%相同的氨基酸序列。一方面,该编码乙酰乳酸合酶的核酸序列具有与氨基酸序列(a)至少约85%相同的氨基酸序列。另一方面,该编码乙酰乳酸合酶的核酸序列具有与氨基酸序列(a)至少约95%相同的氨基酸序列。另一方面,所述乙酰乳酸合酶具有选自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列。另一方面,该核酸序列选自下述SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。另一方面,所述重组核酸分子包含选自SEQ ID NO18,SEQ ID NO21和SEQ ID NO23的核酸序列。优选,此编码乙酰乳酸合酶的核酸序列与在破囊壶菌目微生物中有功能的启动子可操作性连接。一方面,此编码乙酰乳酸合酶的核酸序列可操作性连接到选自破囊壶菌目α-微管蛋白启动子,破囊壶菌目乙酰乳酸合酶启动子,来自破囊壶菌目聚酮化合物合酶(PKS)系统的启动子,和破囊壶菌目脂肪酸脱氢酶启动子的转录控制序列。一实施方案中,所述重组核酸分子还包含编码该微生物产生的第一种蛋白的核酸序列,其中此编码第一种蛋白的核酸序列可操作性连接到转录控制序列。另一实施方案中,所述重组细胞还用含有编码博来霉素-结合蛋白的核酸序列的重组核酸分子转化。优选,所述重组核酸分子包含核酸序列SEQ ID NO9。一实施方案中,所述包含编码博来霉素-结合蛋白的核酸序列的重组核酸分子还包含编码所述细胞产生的第二种蛋白的核酸序列,其中编码第二种蛋白的核酸序列可操作性连接到转录控制序列。一实施方案中,此微生物也包括至少一种附加的重组核酸分子,它包含编码所述细胞产生的蛋白的核酸序列。
本发明另一实施方案涉及分离的核酸分子,它包含选自如下的核酸序列(a)SEQ ID NO9的核苷酸441-894;(b)与SEQ ID NO9的核苷酸441-894的全长至少约95%相同的核酸序列,其中所述核酸序列具有至少基本的α-微管蛋白启动子转录活性,和(c)分离的多核苷酸,它包含与多核苷酸(a)或(b)完全互补的核酸序列。优选,所述分离的核酸分子包含SEQ ID NO4的核酸序列或包含SEQ ID NO9的核苷酸441-894。
本发明另一实施方案涉及用于转化破囊壶菌目微生物的重组载体,它包含编码博来霉素-结合蛋白的核酸序列,该核酸序列与启动子可操作性连接,所述启动子选自破囊壶菌目α-微管蛋白启动子,破囊壶菌目乙酰乳酸合酶启动子,来自破囊壶菌目聚酮化合物合酶(PKS)系统的启动子,和破囊壶菌目脂肪酸脱氢酶启动子。一方面,所述破囊壶菌目乙酰乳酸合酶启动子包含SEQ ID NO14的核苷酸1-1259。一方面,所述α-微管蛋白启动子包含选自SEQ ID NO9的核苷酸441-894,以及与SEQ ID NO9的核苷酸441-894的全长至少约95%相同的核酸序列的核酸序列,其中所述核酸序列具有至少基本的α-微管蛋白启动子转录活性。另一方面,来自破囊壶菌目PKS系统的启动子包含SEQ ID NO34或包含SEQ ID NO34所含有的核酸序列,其中所述启动子具有至少基本的PKS启动子转录活性。另一方面,所述重组载体包含选自SEQ ID NO8和SEQ ID NO9的核酸序列。
附图简述
图1阐述了重组质粒pTUBZEO-11的构建。
图2阐述了重组质粒pTUBZEO11-2的构建。
图3A阐述了重组质粒pMON50200。
图3B阐述了重组质粒pMON50201。
图3C阐述了重组质粒pMON50202。
图3D阐述了重组质粒pMON50203。
发明详述本发明包含遗传转化破囊壶菌目微生物的方法和相关的物质。所有本文公开用作本发明重组构建体的重组子的单细胞微生物菌株,也可统称为破囊壶菌,是破囊壶菌目的成员。根据本发明术语″破囊壶菌″,″破囊壶菌目微生物″和″破囊壶菌目微生物″可互换使用。本发明人未见到任何以前的报告描述用于Schizochytrium属或其它破囊壶菌目微生物的转化系统。本文所述的转化系统可用于向破囊壶菌目微生物引入外源基因,因而提供了创造具有增强的商业价值的菌株的工具。另外,本发明通过同源或非同源重组使特定的基因突变或灭活,提供了一种改变细胞代谢并鉴定特定基因在破囊壶菌目微生物中的功能的新方法。
更具体地,本发明人用两类转化载体证实了破囊壶菌目Schizochytrium属微生物(目破囊壶菌目;科破囊壶菌科;属Schizochytrium属)的遗传转化。这些载体可用标准方法引入细胞,随后基于它们在选择性化合物存在时生长的能力来鉴定并分离重组细胞。本发明人通过粒子轰击引入这些载体,从而证实了它们的有效性,但其它引入载体的工具也可用(例如,电穿孔)并在本领域已知,而且应为本发明所包括。
针对一种转化载体,例如,本文命名为pTUBZEO11-2的重组载体,制备嵌合基因,其中来自印度斯坦链异壁菌的ble基因(其编码″博来霉素-结合蛋白″)被置于来自Schizochytrium微管蛋白基因启动子的下游。SV40终止子被置于此构建体中ble基因的下游。此载体能保证ble基因在Schizochytrium中表达,从而赋予对ZeocinTM和相关化合物的抗性,所述化合物当以适当水平被包括在生长培养基内时,对野生型细胞是有毒的。此构建体中ble基因和SV40终止子的来源是商业化的载体,叫做pSV40/Zeo,它得自InvitrogenCorporation(Carlsbad,CA)(技术手册180202,Version B,″ZeoCassetteVectors″;Invitrogen Corporation,1600 Faraday Ave.,Carlsbad,CA 92008)。该微管蛋白基因启动子经聚合酶链式反应分离;用于该反应的引物之一是基于通过随机Schizochytrium cDNA测序项目得到的序列数据。pTUBZEO11-2的图谱见图2所示,pTUBZEO11-2的核苷酸序列用SEQ ID NO9表示。用这种载体进行的Schizochytrium转化用聚合酶链式反应来确认并用DNA印迹分析来检测整合入Schizochytrium基因组的载体序列的存在。
ble基因已被以前的研究者作为各种生物的遗传转化的选择性标记物,包括细菌,非破囊壶菌微藻,真菌,原生动物,植物,和动物细胞(见,例如,美国专利6,027,900;Lumbreras等,1998,Plant J.14441-447;Rohe等,1996,Curr.Genet.29587-590;Messina等,1995,Gene 165213-217;Guerrero等,1992,ppl.Microbiol.Biotechnol.36759-762;Perez等,1989,Plant Mol.Biol.13365-373;Gatigno等,1990 Gene 9135-41)。ble基因编码″博来霉素-结合蛋白″,它赋予对多种抗生素,包括博来霉素,腐草霉素和ZeocinTM的抗性(Drocourt等,1990,Nucleic Acids Res.184009)。此类基因可购自Invitrogen Corporation,这是本发明人用于制备Schizochytrium转化载体pTUBZEO11-2的基因来源。然而,相信本发明人是产生下述转化载体的第一种人,所述载体中ble基因与破囊壶菌启动子相连,使得该基因在破囊壶菌表达。
第二套转化载体用乙酰乳酸合酶基因(als)的体外定点诱变来创造,该基因是本发明人从Schizochytrium基因组文库中分离的。这些突变改变了所编码的酶(ALS)的氨基酸序列,使它对sulfometuron methyl和其它磺酰脲化合物,咪唑啉酮类抑制剂和嘧啶基羟苯甲酸盐的敏感性大大降低,而这些化合物原本是破囊壶菌目微生物所敏感的。磺酰脲化合物,如sulfometuron methyl(SMM)通常对细胞有毒,因为它们能结合并灭活各种生物的乙酰乳酸合酶(ALS)。ALS催化缬氨酸,亮氨酸,和异亮氨酸生物合成的第一步骤。咪唑啉酮,三唑并嘧啶(triazolopyrimidines),和其它化合物已示可结合并灭活来自某些生物的ALS。来自其他生物的,编码乙酰乳酸合酶(也叫乙酰羟酸合酶)的基因的突变形式以前被用作酵母和植物转化的选择性标记物(Annu.Rev.PlantPhysiol.Plant Mol.Biol.40441-470,1989)。然而,本发明之前没有一篇报道描述来自Schizochytrium属或其它破囊壶菌目成员的als基因的序列或性质,或描述破囊壶菌目als基因突变体赋予对磺酰脲类,咪唑啉酮或嘧啶基羟苯甲酸盐化合物的抗性的用途。事实上,就本发明人所知,无任何关于破囊壶菌目微生物对这些选择试剂(包括sulfometuron methyl)的敏感性的报道,因而,本发明之前并不知道这种选择性标记物是否适用于破囊壶菌转化系统。值得注意的是,与已知als基因具有较高同源性的基因出现在各种生物中,但它们不编码能催化乙酰乳酸合成的酶(Biochimica et BiophysicaActa 1385401-419,1998)。因而并不清楚,克隆的als同系物(homologue)事实上编码ALS。为明确确定是否克隆的Schizochytrium基因真是als基因,本发明人通过转化试验证实,sulfometuron methyl-抗性与突变的假定Schizochytrium als基因的表达阳性相关。
本发明人制备了三种不同的含als基因突变体的转化载体其中一种als基因突变体编码的酶在595位是缬氨酸而不是色氨酸(质粒pMON50201,或ALSmut1-7),另一在192位为谷氨酰胺而不是脯氨酸(质粒pMON50202,或ALSmut2-2),第三种形式同时含有这两种突变(质粒pMON50203,或ALSmut3-5)。在这些载体中,所述重组als基因突变体的表达受天然als基因启动子和终止子的控制。这些载体,以及含有野生型Schizochytrium als基因的载体(质粒pMON50200,或AE-5)的图谱见图3A-3D所示。用这些ALS突变体-编码载体进行的Schizochytrium转化用聚合酶链式反应来确认,并用DNA印迹分析来检测整合入Schizochytrium基因组的载体序列的存在。如下具体所述,既然本发明人已经鉴定了als基因的完整序列,因而也可以制备其它突变,特别是如下的突变。因而,所述als基因突变体意在举例,并非唯一可能的突变。
本发明的转化系统已被用来经共转化向破囊壶菌目细胞引入外源基因。这些情况中,所述外源基因被置于多种Schizochytrium启动子和适宜终止子(例如,SV40或Schizochytrium基因终止子区)之间。例如,本发明人已产生并引入了编码线虫秀丽新杆线虫(Caenorhabditis elegans)的ω-3脂肪酸脱氢酶的合成基因(本文为SEQ ID NO29),以增加二十二碳六烯酸在Schizochytrium中的水平。SEQ ID NO30代表SEQ ID NO29编码的脱氢酶的氨基酸序列。含有外源基因的表达盒也可通过直接包括在含有选择性标记物的转化载体中而被引入破囊壶菌目细胞。
而且,本发明人也用ALS突变体-编码载体证实,同源重组出现在Schizochytrium中,这表明用重组工具灭活或突变具体的天然Schizochytrium基因的可行性。
关于本文所述的破囊壶菌目启动子序列,对已经报道的破囊壶菌目成员的所有核苷酸和蛋白序列进行了序列数据库(GenBank)检索,结果表明截止本发明时,没有Schizochytrium属或任何其它破囊壶菌目成员的启动子序列的报道。唯一被报道来自任何Schizochytrium种的基因是S.aggregatum的5S核糖体RNA(GenBank序列号X06104和M13616)。破囊壶菌目成员(尤其Ulkefaia种),Labyrinthuloides属和破囊壶菌属的5S和18S核糖体RNA序列已有报道,但这与本发明没有关系。来自Thraustochytrium aureuin的“公认T3/T7-样RNA聚合酶”基因的部分编码区已有报道(NucleicAcids Research15648-654,1996),但此类基因的启动子序列未被报道。
本发明可用于将任何目的基因或其它核苷酸序列引入破囊壶菌目微生物。此类核苷酸序列包括,但不限于编码与脂肪酸(例如,脂肪酸二十二碳六烯酸(DHA),二十二碳五烯酸(DPA),二十碳五烯酸(EPA)和二十碳四烯酸(ARA))合成相关的蛋白(例如,酶)的核酸。所述蛋白包括,但不限于脂肪酸合酶,脂肪酸脱氢酶,脂肪酸延伸酶,与聚酮化合物合酶复合体相关的蛋白,和/或与将这类脂肪酸掺入磷脂或三甘油酯分子相关的蛋白。例如,本发明已用于将编码各种ω-3脂肪酸脱氢酶的基因引入Schizochytrium中,以尝试经过二十二碳五烯酸(DPA)的ω-3去饱和作用增加二十二碳六烯酸(DHA)在细胞中的水平。在另一例中,已证实红藻Pilota的公认多烯脂肪酸异构酶在Schizochytrium中的表达。编码破囊壶菌聚酮化合物合酶复合体的基因(即,聚酮化合物合酶系统)已用GenBank序列号AF378329(ORFA),F378328(ORFB)和AF378329(ORFC)登记。
本发明也用于向破囊壶菌目微生物引入其它编码与类异戊二烯生物合成途径相关的蛋白的基因和核苷酸序列。此类蛋白包括,但不限于HMG-CoA合酶和HMG-CoA还原酶。其它适合的蛋白包括与来自类异戊二烯亚单位的分子的合成相关的蛋白,所述分子包括,但不限于各种类固醇化合物和各种类胡萝卜素化合物。与各种类胡萝卜素化合物的合成相关的蛋白包括,但不限于角鲨烯合酶,八氢番茄红素合酶,八氢番茄红素脱氢酶,和各种类胡萝卜素环化酶,羟化酶和酮酶。
本发明也用于向破囊壶菌中引入一或多种编码与抗氧化化合物合成相关的蛋白的核酸序列,所述化合物包括,但不限于维生素E和硫辛酸。
另外,本发明可用于向破囊壶菌目微生物引入任何基因或其它核苷酸序列载体,以灭活或去除基因(即,″剔除″或″定向基因破坏″)。基因的灭活或去除通常用于增强微生物的商业价值。例如,可能希望去除编码饱和和多聚不饱和脂肪酸合成途径的酶的基因(或调节此类基因表达的核酸)。另一方面,可能希望抑制或剔除编码下述蛋白的基因,所述蛋白参与其它为破囊壶菌目微生物所产生的有价值化合物的降解,或者减少所需的化合物的价值。例如,编码脂肪酶,脂肪酸氧化酶,和具有讨厌的滋味或气味的蛋白的基因可能是本发明希望剔除的目标。另一方面,可能希望剔除编码与化合物合成相关的蛋白的基因,其合成与其它目的分子有竞争。例如,此类基因包括,但不限于编码参与糖类生物合成的蛋白的基因,编码参与类异戊二烯途径各种产物(例如,固醇或特定类胡萝卜素化合物)的合成的蛋白的基因,和编码参与细胞壁组分的合成的蛋白的基因。例如,已利用本发明将基因引入Schizochytrium细胞中,以尝试灭活与来自Shewanella的聚酮化合物合酶基因同源的基因,从而评估他们在高度不饱和脂肪酸(HUFA)的生产中的作用。
如实施例6所举例,本发明也可用来灭活,去除或突变天然的参与脂肪酸,类胡萝卜素,固醇,维生素或其它化合物的产生的基因,从而提高与这些化合物相关的产物的商业价值或可接受性。在一些实施方案中,如上讨论,可能需要促进给定蛋白的产生,而在其他实施方案中,可能需要抑制同种蛋白的产生。此类决定是基于具体微生物的指定用途和生产目的。本发明也用于确定在Schizochytrium中进行遗传重组的过程。
其它用于引入破囊壶菌目的基因和核酸分子对那些本领域技术人员将是显而易见的,并且所有此类基因和分子都应为本发明所包括。
下文中主要就本发明的破囊壶菌目als基因和/或ALS蛋白描述了本发明的各种实施方案。然而,应理解对术语和方法的一般定义可应用于其它下述基因,核酸和蛋白的讨论。
本发明是部分基于编码选择性标记物的核酸序列的鉴定,分离和产生,所述选择性标记物适于在破囊壶菌目微生物转化的重组构建体中应用。这样的选择性标记物允许对本发明重组构建体所成功转化的微生物进行筛选。可用于本发明破囊壶菌目转化的一种选择性标记物为破囊壶菌乙酰乳酸合酶(即ALS)。优选,所述乙酰乳酸合酶已经过修饰,突变,或者选择,能抵抗磺酰脲化合物,咪唑啉酮类抑制剂和/或嘧啶基羟苯甲酸盐的抑制(即这种ALS为天然乙酰乳酸合酶的同系物)。
根据本发明,乙酰乳酸合酶为具有乙酰乳酸合酶生物活性的蛋白,包括全长蛋白,融合蛋白,或天然乙酰乳酸合酶的任何同系物。乙酰乳酸合酶的同系物包括与天然乙酰乳酸合酶不同的蛋白,该不同是由于至少一或几个,但不限于一或几个氨基酸被去除(例如,所述蛋白的截短型,如肽或片段),插入,倒位,替代和/或衍生(例如,通过糖基化,磷酸化,乙酰化,十四酰化,异戊二烯化,十六酰化,酰胺化和/或加入糖基磷脂酰肌醇)。天然乙酰乳酸合酶的优选同系物见下详述。
根据本发明分离的蛋白,如分离的乙酰乳酸合酶,为从其天然环境取出(即经过了人工处理)的蛋白,也可包括例如,纯化的蛋白,部分纯化的蛋白,重组产生的蛋白,和合成产生的蛋白。类似地,“分离的”不必反映该核酸分子被纯化的程度。优选,本发明分离的乙酰乳酸合酶是重组产生的。“破囊壶菌乙酰乳酸合酶”指乙酰乳酸合酶(包括天然乙酰乳酸合酶的同系物),它来自破囊壶菌目微生物或根据对破囊壶菌目微生物的天然乙酰乳酸合酶的结构(例如,序列)的了解而制备。换言之,破囊壶菌目乙酰乳酸合酶包括任何下述乙酰乳酸合酶,它具有破囊壶菌目微生物的天然乙酰乳酸合酶的结构和功能或为破囊壶菌目微生物的天然乙酰乳酸合酶的生物活性(即具有生物活性)同系物,如本文详述。因此,破囊壶菌目乙酰乳酸合酶可包括纯化蛋白,部分纯化蛋白,重组蛋白,突变/修饰蛋白和合成蛋白。
一般,蛋白的生物活性或生物作用指该蛋白表现或实施的任何功能,所述功能是该蛋白的天然形式在体内(即在该蛋白的天然生理环境)或体外(即在实验室条件下)测量或观察到的。例如,乙酰乳酸合酶的生物活性包括乙酰乳酸合酶的酶活性。对蛋白的修饰,例如在同系物或模拟物(mimetic)中的修饰(见下讨论),可导致蛋白具有与天然蛋白相同的生物活性,或导致蛋白具有与天然蛋白相比降低或升高的生物活性。造成蛋白表达降低或蛋白活性降低的修饰,可被称为蛋白的灭活(完全或部分),下调,或作用减弱。类似地,造成蛋白表达升高或蛋白活性升高的修饰,可被称为蛋白的扩增,过量表达,活化,增强,上调,或作用增强。
本发明乙酰乳酸合酶优选在乙酰乳酸合酶同系物中出现的修饰,与天然乙酰乳酸合酶相比基本不变,或与天然蛋白相比至少基本不降低合酶的基本生物活性。然而,与天然形态相比,所述同系物在除蛋白的功能或酶活性外的性质上有不同,如与天然蛋白相比,对某些化合物的抑制作用的敏感性降低。优选,与衍生出同系物的天然乙酰乳酸合酶相比,天然乙酰乳酸合酶的同系物对结合并灭活天然乙酰乳酸合酶的化合物具有降低的(即减少的,减弱的)敏感性。例如,磺酰脲化合物,如sulfometttron methyl(SMM),通常对细胞有毒,因为它们能结合并灭活乙酰乳酸合酶(ALS)。咪唑啉酮,三唑并嘧啶,和其它类似化合物(本文统称咪唑啉酮类抑制剂)也显示可结合并灭活ALS。因而,天然乙酰乳酸合酶的同系物优选在保持乙酰乳酸合酶酶活性的同时,具有对磺酰脲化合物,和咪唑啉酮类抑制剂(例如,具有已遭破坏的此抑制剂的结合位点或具有对此抑制剂降低的亲和力的结合位点),及对嘧啶基羟苯甲酸盐,降低的敏感性。
如本文所用,具有″乙酰乳酸合酶生物活性″或被称为″乙酰乳酸合酶″的蛋白指催化缬氨酸,亮氨酸,和异亮氨酸生物合成第一步骤的蛋白。更具体地,本发明的分离的乙酰乳酸合酶,包括全长蛋白,截短蛋白,融合蛋白和同系物,可通过蛋白催化从丙酮酸合成乙酰乳酸的能力来被直接鉴定。乙酰乳酸合酶生物活性可被本领域技术人员用适合的体外或体内酶活性试验来评价。
一实施方案中,本发明乙酰乳酸合酶具有下述氨基酸序列,该序列与选自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22,SEQ ID NO24的氨基酸序列,或上述任何序列的至少约600个氨基酸有至少约65%相同,其中所述蛋白为乙酰乳酸合酶(即具有乙酰乳酸合酶生物活性)。更优选,本发明的乙酰乳酸合酶具有,与SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一,或者与SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少约600个氨基酸有至少约70%相同,再更优选至少约75%相同,再更优选至少约80%相同,再更优选至少约85%相同,再更优选至少约90%相同,再更优选至少约95%相同,再更优选至少约96%相同,再更优选至少约97%相同,再更优选至少约98%相同,再更优选至少约99%相同的氨基酸序列,其中所述蛋白具有乙酰乳酸合酶生物活性。
在另一实施方案中,本发明的乙酰乳酸合酶具有,与选自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22,SEQ ID NO24的氨基酸序列,或所述任何序列的至少95个氨基酸,有至少约75%相同的氨基酸序列,其中所述蛋白为乙酰乳酸合酶(即具有乙酰乳酸合酶生物活性)。更优选,本发明的乙酰乳酸合酶具有,与SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQID NO24,或SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ IDNO24任一的至少95个氨基酸,至少约80%相同,再更优选至少约85%相同,再更优选至少约90%相同,再更优选至少约95%相同,再更优选至少约96%相同,再更优选至少约97%相同,再更优选至少约98%相同,再更优选至少约99%相同的氨基酸序列,其中所述蛋白具有乙酰乳酸合酶生物活性。再更优选,本发明的乙酰乳酸合酶具有下述氨基酸序列,该序列与SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24,或与SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少100个氨基酸,再更优选125,再更优选150,再更优选175,再更优选200,再更优选225,再更优选250,再更优选275,再更优选300,再更优选325,再更优选350,再更优选375,再更优选400,再更优选425,再更优选450,再更优选475,再更优选500,再更优选525,再更优选550,再更优选575个氨基酸,具有上述任一相同性百分比,其中所述蛋白具有乙酰乳酸合酶生物活性。
如本文所用,除非另有说明,对于相同性百分数(%)是指使用(1)用标准默认参数进行BLAST 2.0 Basic BLAST同源性检索,使用blastp进行氨基酸检索,blastn用于核酸检索,通过默认筛选查询序列的低复杂性区域(在Altschul,S.F.,Madden,T.L.,Schaaffer,A.A.,Zhang,J.,Zhang,Z.,Miller,W.& Lipman,D.J.(1997),“Gapped BLAST and PSI-BLASTa new generation ofprotein database search programs.”。Nucleic Acids Res.253389-3402中描述,本文引用以其整体作为参考);(2)BLAST 2序列对比(使用下述参数);(3)和/或使用标准默认参数的PSI-BLAST(位置特异性重复BLAST)进行的同源性评估。应注意由于BLAST 2.0 Basic BLAST和BLAST 2之间在标准参数上的一些区别,两个特定序列使用BLAST 2程序可能认为具有明显的同源性,而使用其中一个序列作为查询序列以BLAST 2.0 Basic BLAST进行检索时在最匹配的序列中可能没有鉴定出第二种个序列。另外,PSI-BLAST提供了一个“提问档(profile)”检索的自动的,容易使用的版本,它是寻找序列同源性的一个敏感途径。该程序首先进行有间隔的BLAST数据库检索。PSI-BLAST程序使用来自任何有效序列对比的信息返回构建位置特异性记分矩阵,它代替查询序列用于下一轮数据库检索。因此,应明白可使用这些程序中的任一种测定相同性百分数。
使用Tatusova和Madden,(1999),“Blast 2sequences-a new toolforcomparing protein and nucleotide sequences”,FEMS Microbiol Lett.174247-250所述的BLAST 2序列可互相对比两个具体序列,本文引用该文献以其整体作为参考。使用BLAST 2.0算法以blastp或blastn进行BLAST 2序列对比,在两个序列之间进行有间隔的BLAST检索(BLAST 2.0)允许在所得的序列对比中引入间隔(缺失和插入)。为了本文清楚的目的,使用如下标准默认参数进行BLAST 2序列对比。
对于blastn,使用0BLOSUM62矩阵匹配得分=1错配罚分=-2空出间隔(5)和延伸间隔(2)罚分间隔_x下降(dropoff)(50)期望(expect)(10)序列大小(word size)(11)筛选(上)对于blastp,使用0 BLOSUM62矩阵空出间隔(11)和延伸间隔(1)罚分间隔_x下降(50)期望(10)序列大小(3)筛选(上)。
本发明的乙酰乳酸合酶也能包括具有下述氨基酸序列的蛋白,所述氨基酸序列包含SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少30个邻接氨基酸残基(即与SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的30个邻接氨基酸具有100%相同性的30个邻接氨基酸残基)。在优选实施方案中,本发明的乙酰乳酸合酶包括具有下述氨基酸序列的蛋白,所述氨基酸序列包含SEQ ID NO15,SEQID NO19,SEQ ID NO22或SEQ ID NO24任一的至少50,再更优选至少75,再更优选至少100,再更优选至少115,再更优选至少130,再更优选至少150,再更优选至少200,再更优选,至少250,再更优选,至少300,再更优选,至少350,再更优选,至少400,再更优选,至少450,再更优选,至少500,再更优选,至少550,再更优选,至少600,再更优选,至少650,个邻接氨基酸残基。所述蛋白具有乙酰乳酸合酶生物活性。
根据本发明,术语“邻接的”或“连续的”对于本文所述核酸或氨基酸序列是指以不中断的序列相连。例如,对于第一个序列含有第二个序列的30个邻接(或连续)的氨基酸,是指第一个序列包含与第二个序列中30个氨基酸残基的不中断的序列具有100%相同性的30个氨基酸残基的不中断的序列。类似地,对于第一个序列与第二个序列具有“100%相同性”是指第一个序列与第二个序列完全匹配,在核苷酸或氨基酸之间没有间隔。
在另一实施方案中,本发明的乙酰乳酸合酶(包括乙酰乳酸合酶同系物),包括具有下述氨基酸序列的蛋白,所述氨基酸序列与天然乙酰乳酸合酶氨基酸序列足够相似,以致于编码该同系物的核酸序列在中等,高度,或极高严格条件(下文描述)下能够杂交到(即,与其杂交)编码天然乙酰乳酸合酶氨基酸序列的核酸分子(即,编码天然乙酰乳酸合酶氨基酸序列的核酸链的互补链)上。优选,乙酰乳酸合酶由这样一种核酸序列编码,该核酸序列在中等,高度或极高严格条件下与编码下述蛋白质的核酸序列杂交,所述蛋白质含有由SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24中任一个代表的氨基酸序列。甚至更优选,本发明的乙酰乳酸合酶由下述核酸序列编码,该核酸序列在中等,高度或极高严格条件下与SEQ ID NO15的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,或SEQ ID NO23的核苷酸1260-3314互补。该杂交条件见下详述。编码本发明的乙酰乳酸合酶的核酸序列的核酸序列互补指与编码乙酰乳酸合酶的链互补的核酸链的核酸序列。理想的是,编码给定氨基酸序列的双链DNA,包含单链DNA并且它的互补链具有与单链DNA互补的序列。类似地,本发明的核酸分子可为双链或单链,并且包括那些核酸分子,它们在严格杂交条件下与编码氨基酸序列SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24的核酸序列,和/或与编码任一此氨基酸序列的核酸序列互补,构成稳定杂交体。推定互补序列的方法对于本领域的技术人员是已知的。应注意由于氨基酸测序和核酸测序技术不是完全无误差的,因此本文提供的序列最多代表本发明的乙酰乳酸合酶的表观序列。
乙酰乳酸合酶同系物可以是天然等位基因变异或天然突变所致。本发明的乙酰乳酸合酶同系物也能用本领域已知技术产生,该技术包括,但不限于直接修饰所述蛋白,或者用,例如,经典或重组DNA技术修饰编码所述蛋白的基因,来造成随机诱变或定点诱变。编码乙酰乳酸合酶的核酸的一种天然等位基因变体是,与编码氨基酸序列SEQ ID NO15的基因在基因组中基本相同的一或多个位点出现的基因,但其由于例如突变或重组造成的天然变异而具有相近但不相同的序列。天然等位基因变体通常编码与相应基因编码的蛋白具有类似活性的蛋白。一类等位基因变体可编码具有不同核酸序列(由于遗传密码简并性)的相同蛋白。等位基因变体也可在该基因的5′或3′非翻译区(例如,调控区)包含变更。等位基因变体是本领域技术人员已知的。
本发明的乙酰乳酸合酶蛋白也包括基因融合体(例如,用于过度表达可溶性活性重组蛋白),诱变基因(如带有密码子修饰以增强基因转录和翻译的基因),和截短基因(如去除了膜结合结构域以产生可溶性膜蛋白的基因,或去除了在特定重组宿主中耐受差的信号序列的基因)的表达产物。
本发明蛋白和/或同系物的最小大小为足够具有乙酰乳酸合酶生物活性的大小。优选,本发明的蛋白为至少30个氨基酸长,再更优选,至少约50,再更优选至少75,再更优选至少100,再更优选至少115,再更优选至少130,再更优选至少150,再更优选至少200,再更优选,至少250,再更优选,至少300,再更优选,至少350,再更优选,至少400,再更优选,至少450,再更优选,至少500,再更优选,至少550,再更优选,至少600,再更优选,至少650,再更优选,至少684个氨基酸长。对该蛋白的最大大小除了操作限制,没有限制,因为所述蛋白可包括乙酰乳酸合酶蛋白的一部分或全长乙酰乳酸合酶,如果需要还可加上附加序列(例如,融合蛋白序列)。
本发明也包括融合蛋白,它包括与一或多个融合节段结合的含有乙酰乳酸合酶的结构域(即,根据本发明乙酰乳酸合酶的氨基酸序列)。本发明所用的适宜融合节段包括,但不限于具有下述功能的节段增强蛋白的稳定性;提供其它所需生物活性;和/或辅助乙酰乳酸合酶的纯化(例如,通过亲和层析)。适宜的融合节段可以是具有所需功能的任何大小的结构域(例如,赋予增加的稳定性,溶解度,作用或生物活性;和/或简化蛋白的纯化)。融合节段可与所述蛋白上含乙酰乳酸合酶的结构域的氨基和/或羧基末端相连,并易于剪切,以便直接回收乙酰乳酸合酶。融合蛋白优选通过培养融合核酸分子转染的重组细胞来产生,该融合核酸分子编码的蛋白包括与含乙酰乳酸合酶的结构域的氨基和/或羧基末端结合的融合节段。
本发明也包括乙酰乳酸合酶的模拟物。本文中术语″模拟物″用于指能模拟天然肽的生物学作用的任何肽或非-肽化合物,通常是由于模拟物具有模拟天然肽基本结构的基本结构和/或具有天然肽的特征性生物学性质。模拟物可包括,但不限于相对于原型具有实质性(substantial)修饰的肽,如与天然肽无侧链相似性(这样的修饰可以,例如,降低它对降解作用的易感性);抗独特型和/或催化抗体,或其片段;分离的蛋白的非蛋白部分(例如,糖类结构);或合成或天然的有机分子,包括,例如通过综合(combinatorial)化学鉴定的核酸和药物。
此模拟物可用各种本领域已知方法设计,筛选和/或鉴定。可用于设计本发明所用的模拟物或其它治疗性化合物的各种药物设计方法,见Maulik等,1997,Molecular BiotechnologyTherapeutic Applications and Strategies,Wiley-Liss,Inc.,全文引入本文作为参考。乙酰乳酸合酶模拟物可从,例如,分子多样性策略(相关策略的结合使得迅速构建大的化学多样分子文库)获得,从天然或合成化合物的文库,特别是来自化学文库或综合文库(即序列或大小不同但具有相似构架的化合物文库)的天然或合成化合物的文库获得,或者通过合理的,直接的(directed)或随机的药物设计获得。见例如,Maulik等,见上文。
在分子多样性策略中,采用生物学,酶学和/或化学方法从,例如,肽,寡核苷酸,糖类和/或合成的有机分子合成大化合物文库。发展分子多样性策略的严格参数包括亚单位多样性,分子大小,和文库多样性。筛选此类文库的一般目的是,连续应用综合筛选来获得对所需靶的高亲和力配体,然后通过随机设计或定向设计策略使所得分子最优化。分子多样性的方法见Maulik,等,如上详述。
Maulik等还公开了,例如,定向设计方法,随机设计方法,以及基于网格坐标的方法。在定向设计中,使用者直接从适当选择的片段的片段文库创建新分子;在随机设计中,使用者使用遗传或其他算法来随机突变片段和它们的组合,同时应用选择标准来评估候选配体的吻合性;在基于网格坐标的方法中,使用者计算三维受体结构与小片段探针之间的相互作用能量,之后将所需的探针位置连接起来。
根据本发明,乙酰乳酸合酶可来自任何破囊壶菌目微生物,尤其Schizochytrium属任何微生物。在一实施方案中,优选本发明的乙酰乳酸合酶具有选自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22,或SEQ ID NO24的氨基酸序列。具有氨基酸序列SEQ ID NO15的蛋白是破囊壶菌目微生物的天然(即野生型)乙酰乳酸合酶,具体是Schizochytrium乙酰乳酸合酶。氨基酸序列SEQ ID NO19,SEQ ID NO22,SEQ ID NO24为修饰的序列,导致得到的酶,与氨基酸序列SEQ ID NO15所代表的天然蛋白相比,对磺酰脲化合物,咪唑啉酮类抑制剂和嘧啶基羟苯甲酸盐的敏感性降低。应注意,SEQ ID NO19,SEQ ID NO22和SEQ ID NO24所代表的蛋白具有乙酰乳酸合酶生物活性。对磺酰脲化合物,咪唑啉酮类抑制剂和嘧啶基羟苯甲酸盐的敏感性降低的乙酰乳酸合酶是本发明优选的乙酰乳酸合酶,因为编码这类合酶的核酸序列可作为选择性标记物用于本发明的重组载体中。
因而,本发明一实施方案涉及修饰的乙酰乳酸合酶,包括SEQ ID NO15,SEQ ID NO19,SEQ ID NO22和SEQ ID NO24任一的任何同系物,其中所述同系物具有乙酰乳酸合酶生物活性,尤其是,其中所述同系物与氨基酸序列SEQ ID NO15所代表的天然蛋白相比,对磺酰脲化合物,咪唑啉酮类抑制剂和嘧啶基羟苯甲酸盐的敏感性降低。一方面,所述乙酰乳酸合酶同系物包括下述蛋白,它具有与SEQ ID NO15不同的氨基酸序列,该不同是由于在一或多个下述位置116G,117A,192P,200A,251K,358M,383D,592V,595W,或599F发生氨基酸缺失,插入或取代。这些位置对应于酵母乙酰乳酸合酶中的已知ALS突变位点(即分别是116G,117A,192P,200A,251K,354M,379D,583V,586W,和590F)(见Mazur和Falco,1989,Annu.Rev.Plant Physiol.Plant Mol.Biol.40441-470,全文引入本文作为参考)。其它可能的突变位点对于本领域技术人员而言,可根据其它生物的ALS中的成功氨基酸突变而知晓。将这些位点应用于破囊壶菌目ALS中的对应位点,也是本发明所包括的范围。
如上述,本发明部分基于转化破囊壶菌微生物的重组构建体的发现和产生。因而,本发明一实施方案涉及分离的核酸分子,它包含编码破囊壶菌目乙酰乳酸合酶的核酸序列,和与其完全互补的核酸序列。编码本发明乙酰乳酸合酶的核酸分子包括编码上述任何乙酰乳酸合酶蛋白(包括同系物)的核酸分子。更具体的是,本发明一实施方案涉及分离的核酸分子,它包含的核酸序列编码的蛋白具有与选自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22,SEQ ID NO24的氨基酸序列,所述任一序列的至少约600个氨基酸,至少约65%相同的氨基酸序列,其中所述蛋白为乙酰乳酸合酶(即具有乙酰乳酸合酶生物活性)。更优选,本发明分离的核酸分子具有编码氨基酸序列的核酸序列,该氨基酸序列与SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24,或SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少约600个氨基酸,有至少约70%相同,再更优选,至少约75%相同,再更优选至少约80%相同,再更优选至少约85%相同,再更优选至少约90%相同,再更优选至少约95%相同,再更优选至少约96%相同,再更优选至少约97%相同,再更优选至少约98%相同,再更优选至少约99%相同,其中所述蛋白具有乙酰乳酸合酶生物活性。
在另一实施方案中,本发明的分离的核酸分子具有编码氨基酸序列的核酸序列,该氨基酸序列与选自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22,SEQ ID NO24的氨基酸序列,任一所述序列的超过至少95个氨基酸,至少约75%相同,其中所述蛋白为乙酰乳酸合酶(即具有乙酰乳酸合酶生物活性)。更优选,本发明的分离的核酸分子具有编码氨基酸序列核酸序列,该氨基酸序列与SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ IDNO24任一,或与SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQID NO24任一的至少95个氨基酸,有至少约80%相同,再更优选至少约85%相同,再更优选至少约90%相同,再更优选至少约95%相同,再更优选至少约96%相同,再更优选至少约97%相同,再更优选至少约98%相同,再更优选至少约99%相同,其中所述蛋白具有乙酰乳酸合酶生物活性。
在另一实施方案中,本发明的分离的核酸分子具有编码下述氨基酸序列的核酸序列,所述氨基酸序列具有SEQ ID NO15,SEQ ID NO19,SEQ IDNO22或SEQ ID NO24,或SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少100个氨基酸,再更优选125,再更优选150,再更优选175,再更优选200,再更优选225,再更优选250,再更优选275,再更优选300,再更优选325,再更优选350,再更优选375,再更优选400,再更优选425,再更优选450,再更优选475,再更优选500,再更优选525,再更优选550,再更优选575个氨基酸,其中所述蛋白具有乙酰乳酸合酶生物活性。相同性百分比如上述用BLAST 2.0 Basic BLAST默认参数来确定。
一实施方案中,编码本发明的乙酰乳酸合酶的核酸分子包括分离的核酸分子,它在中等严格条件,再更优选在高度严格条件,再更优选在极高严格条件与编码天然乙酰乳酸合酶的核酸序列的互补链杂交。优选,编码本发明的乙酰乳酸合酶的分离的核酸分子包含核酸序列,它在中等或高度严格条件与编码包含氨基酸序列SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24的蛋白的核酸序列的互补链杂交。在一实施方案中,分离的核酸分子包含下述核酸序列,它在中等,高度或极高严格条件下与SEQ IDNO14的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ IDNO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314所示核酸序列的互补序列杂交。
本文使用的杂交条件是指标准杂交条件,在该条件下使用核酸分子鉴定相似的核酸分子。该标准条件在例如,Sambrook等,Molecular CloningALaboratory Manual,Cold Spring Harbor Labs Press,1989中公开。Sambrook等,出处同上,在本文中引用以其整体作为参考(具体参见,第9.31-9.62页)。另外,计算合适的杂交和洗涤条件以完成允许各种程度的核苷酸错配的杂交的公式在例如,Meinkoth等,1984,Anal.Biochem.138,267-284中公开;Meinkoth等,出处同上,在本文中引用以其整体作为参考。
更具体地说,本文提及的中等严格的杂交和洗涤条件是指在杂交反应中允许分离与用于探测的核酸分子具有至少约70%的核酸序列相同性的核酸分子的条件(即,允许约30%或更少的核苷酸错配的条件)。本文提及的高度严格的杂交和洗涤条件是指在杂交反应中允许分离与用于探测的核酸分子具有至少约80%的核酸序列相同性的核酸分子的条件(即,允许约20%或更少的核苷酸错配的条件)。本文提及的极高严格的杂交和洗涤条件是指在杂交反应中允许分离与用于探测的核酸分子具有至少约90%的核酸序列相同性的核酸分子的条件(即,允许约10%或更少的核苷酸错配的条件)。如上所述,本领域技术人员可使用Meinkoth等,出处同上中的公式计算合适的杂交和洗涤条件以达到这些特定的核苷酸错配水平。该条件可依赖于形成的是DNA:RNA还是DNA:DNA杂交体而变化。计算的DNA:DNA杂交体的解链温度比DNA:RNA杂交体低10℃。在具体实施方案中,DNA:DNA杂交体的严格杂交条件包括在6X SSC(0.9M Na+)的离子强度下在约20℃和约35℃之间(低度严格),更优选的是,在约28℃和约40℃之间(更严格),且甚至更优选的是,在约35℃和约45℃之间(甚至更严格)的温度下,在合适的洗涤条件下的杂交。在具体实施方案中,DNA:RNA杂交体的严格杂交条件包括在6X SSC(0.9M Na+)的离子强度下在约30℃和约45℃之间,更优选的是,在约38℃和约50℃之间,且甚至更优选的是,在约45℃和约55℃之间的温度下,以同样严格的洗涤条件的杂交。这些值根据大于约100个核苷酸,0%甲酰胺和约40%的G+C含量的分子的解链温度计算。另外,可按Sambrook等,出处同上,第9.31至9.62页提供的经验计算Tm值。一般来说,洗涤条件应当尽可能严格,且对于选定的杂交条件应是合适的。例如,杂交条件可包括盐和温度条件的组合,该温度比计算的特定杂交体的Tm低约20-25℃,且洗涤条件一般包括盐和温度条件的组合,该温度比计算的特定杂交体的Tm低约12-20℃。适用于DNA:DNA杂交体的杂交条件的一个例子包括在6X SSC(50%甲酰胺)中在约42℃下杂交2-24小时,接着进行洗涤步骤,包括在室温下在约2X SSC中的一次或多次洗涤,接着在更高温度和更低离子强度下进一步洗涤(例如,在约37℃下在约0.1X-0.5X SSC中洗涤至少一次,接着在约68℃下在约0.1X-0.5X SSC中洗涤至少一次)。
在另一实施方案中,编码本发明乙酰乳酸合酶的核酸分子包括含下述核酸序列的分离的核酸分子,该核酸序列编码的氨基酸序列具有包含SEQ IDNO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少30个邻接氨基酸残基的蛋白,(即与SEQ ID NO15,SEQ ID NO19,SEQ IDNO22或SEQ ID NO24任一的30个邻接氨基酸具有100%相同性的30个邻接氨基酸残基)。在优选实施方案中,分离的核酸分子包含编码下述蛋白的核酸序列,该蛋白具有的氨基酸序列包含SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少50个,再更优选至少75,再更优选至少100,再更优选至少115,再更优选至少130,再更优选至少150,再更优选至少200,再更优选,至少250,再更优选,至少300,再更优选,至少350,再更优选,至少400,再更优选,至少450,再更优选,至少500,再更优选,至少550,再更优选,至少600,再更优选,至少650,个邻接氨基酸残基。所述蛋白具有乙酰乳酸合酶生物活性。在一实施方案中,编码乙酰乳酸合酶的分离的核酸分子包含一种核酸序列,该核酸序列具有SEQ ID NO15的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314的至少60个邻接的核苷酸,再更优选至少150,再更优选至少225,再更优选至少300,再更优选至少345,再更优选至少390,再更优选至少450,再更优选至少525,再更优选至少600,再更优选至少750,再更优选至少900,再更优选至少1050,再更优选至少1200,再更优选至少1350,再更优选至少1500,再更优选至少1650,再更优选至少1800,再更优选至少1950,个邻接的核苷酸。
本发明特别优选的核酸分子包括SEQ ID NO14的核苷酸1260-3314(编码SEQ ID NO15),SEQ ID NO18的核苷酸1260-3314(编码SEQ ID NO19),SEQ ID NO21的核苷酸1260-3314(编码SEQ ID NO22),或SEQ IDNO23的核苷酸1260-3314(编码SEQ ID NO24),SEQ ID NO14,SEQ IDNO18,SEQ ID NO21或SEQ ID NO23。
根据本发明,分离的核酸分子是从其天然环境中取出(即,对其进行了人工操作)的核酸分子,其天然环境是天然状态下发现该核酸分子的基因组或染色体。因此,“分离的”不必反映该核酸分子被纯化的程度,但是表明该核酸分子不包括天然状况下发现该核酸分子的完整基因组或完整染色体。分离的核酸分子可包括基因。包括基因的分离的核酸分子不是包括该基因的染色体的一个片段,而是包括编码区和与该基因相关的调控区,但是没有在同一染色体中天然发现的其它基因。分离的核酸分子也可包括一种特定的核酸序列,其侧翼(即,在该序列的5’和/或3’端)为天然状况下一般不是该特定核酸序列侧翼的其它核酸(即,异源序列)。分离的核酸分子可包括DNA,RNA(即,mRNA),或DNA或RNA之一的衍生物(例如,cDNA)。尽管短语“核酸分子”主要是指物理学核酸分子且短语“核酸序列”主要是指核酸分子上的核苷酸序列,但是两个短语可交换使用,特别是对于能编码蛋白质或蛋白质的结构域的核酸分子或核酸序列。
优选,本发明的分离的核酸分子用重组DNA技术(例如,聚合酶链式反应(PCR)扩增,克隆)或化学合成来产生。分离的核酸分子包括天然的核酸分子及其同系物,包括,但不限于,天然等位基因变异体和修饰的核酸分子,其中的核苷酸以这样的方式插入,缺失,取代,和/或颠倒,即该修饰对蛋白的生物学活性产生了所需的影响。蛋白质同系物(例如,由核酸同系物编码的蛋白质)在上文中已有详细讨论。
可使用本领域的技术人员已知的许多方法来产生核酸分子同源物(参见,例如,Sambrook等,Molecular CloningA Laboratory Manual,Cold SpringHarbor Labs Press,1989)。例如,可使用各种技术修饰核酸分子,该技术包括,但不限于,传统诱变技术和重组DNA技术,例如定点诱变,化学处理核酸分子以诱导突变,限制性酶裂解核酸片段,连接核酸片段,核酸序列选定区域的PCR扩增和/或诱变,合成寡核苷酸混合物并连接混合物组以“构建”核酸分子的混合体及其组合。通过筛选核酸编码的蛋白质的功能和/或通过与野生型基因杂交可从修饰的核酸混合物中选择核酸分子同源物。
类似地,本发明核酸分子大小的最小值是足够编码具有所需生物活性的蛋白,或足够构成能与编码天然蛋白的核酸分子的互补序列(例如,在中等,高度或极高严格条件下)构成稳定杂交体的探针或寡核苷酸引物的大小。因此,编码所述蛋白的核酸分子的大小取决于核酸组成、该核酸分子与互补序列间的同源性或相同性百分比,以及杂交条件本身(例如,温度,盐浓度,和甲酰胺浓度)。用作寡核苷酸引物或探针的核酸分子大小的最小值一般是如果该核酸分子富含GC则为至少约12个到约15个核苷酸的长度且如果它们富含AT则为至少约15到约18个碱基的长度。对本发明的核酸分子大小的最大值没有限制,实际的限制是该核酸分子可包括蛋白-编码序列(例如,乙酰乳酸合酶-编码序列)的部分或编码全长蛋白的核酸序列。
本发明一实施方案包括用于转化破囊壶菌目微生物的重组载体。根据本发明,重组载体是一种改造的(即,人工产生的)核酸分子,它用作处理选定核酸序列并将该核酸序列导入宿主细胞的工具。因此重组载体适用于克隆,测序,和/或处理选定的核酸序列,例如通过表达和/或传递选定的核酸序列到宿主细胞中以形成重组细胞。该载体一般含有异源核酸序列,异源核酸序列是天然状况下未发现与需要克隆或传递的核酸序列相连的核酸序列,尽管该载体也可含有天然状况下发现与本发明的核酸分子相连的或者用于表达本发明的核酸分子的调控核酸序列(例如,启动子,非翻译区)(下面详细讨论)。该载体可以是RNA或者是DNA,是原核的或者真核的,且一般是一种质粒。该载体可作为染色体外因子(例如,质粒)维持或者可整合进重组生物(例如,微生物或植物)的染色体中。该完整载体可在宿主细胞内适当保留,或者在某些情况下,可删除质粒DNA,留下本发明的核酸分子。整合的核酸分子可受染色体的启动子的控制,受天然或质粒启动子控制,或受数个启动子的结合的控制。所述核酸分子的单或多拷贝可整合到染色体。本发明的重组载体包含根据本发明的破囊壶菌目微生物的至少一个选择性标记物,如编码破囊壶菌目乙酰乳酸合酶(天然蛋白或同系物)的核酸序列或编码ble基因的核酸序列(下述)。如本文所用,术语″重组核酸分子″主要用于指连接到重组载体中,需要经过克隆、操作、转化而进入宿主细胞的核酸序列(即插入子)。
一般来说,重组核酸分子包括与一个或多个转录调控序列可操作地相连的至少一个本发明的核酸分子。本文所用的短语“重组分子”或“重组核酸分子”主要是指与转录调控序列可操作地相连的核酸分子或核酸序列,但是当核酸分子是本文讨论的重组分子时,上述短语可与短语“核酸分子”交换使用。根据本发明,短语“可操作地相连”是指核酸分子与转录调控序列以这样的方式相连,即该连接使得该分子转染(即,转化,转导,转染,接合或导入)进宿主细胞时能够表达。转录调控序列是控制转录开始,延长,或终止的序列。特别重要的转录调控序列是那些控制转录开始的序列,例如启动子,增强子,操纵子和阻抑序列。合适的转录调控序列包括在该重组核酸分子导入的宿主细胞或生物体中能起作用的任何转录调控序列。相信本发明人是分离并鉴定了至少三种这样的启动子的第一个,如本文其它处所详述。
优选启动子包括,但不限于,破囊壶菌目乙酰乳酸合酶启动子(本文用SEQ ID NO14的核苷酸1-1259表示),破囊壶菌目α-微管蛋白启动子(本文用SEQ ID NO9的核苷酸441-894来表示),来自破囊壶菌目聚酮化合物合酶(PKS)系统的启动子(包含在SEQ ID NO34中),和破囊壶菌目脂肪酸脱氢酶启动子(包含在SEQ ID NO31中;应注意,脂肪酸脱氢酶启动子指美国临时专利申请60/284,116的脱氢酶启动子,见上文)。α-微管蛋白启动子,乙酰乳酸合酶启动子,和脂肪酸脱氢酶启动子的克隆和测序在实施例部分叙述。在优选实施方案中,α-微管蛋白启动子包含天然破囊壶菌α-微管蛋白启动子序列(SEQ ID NO9的核苷酸441-894),或与SEQ ID NO9的核苷酸441-894至少95%相同的核酸序列,其中该启动子具有至少基本的α-微管蛋白启动子转录活性。类似地,优选乙酰乳酸合酶启动子包含天然破囊壶菌乙酰乳酸合酶启动子的核酸序列(在SEQ ID NO14核苷酸1-1259中表示),或与SEQ ID NO14核苷酸1-1259至少75%,再更优选80%,再更优选85%,再更优选90%,再更优选95%相同的核酸序列,其中所述启动子具有至少基本的乙酰乳酸合酶启动子转录活性。优选PKS启动子包含天然破囊壶菌目PKS启动子的核酸序列(在SEQ ID NO34中表示),或与SEQID NO34至少75%,再更优选80%,再更优选85%,再更优选90%,再更优选95%相同的核酸序列,其中所述启动子具有至少基本的PKS启动子转录活性。最后,优选脂肪酸脱氢酶启动子包含天然破囊壶菌目脂肪酸脱氢酶启动子的核酸序列(在SEQ ID NO31中表示),或被包含在与SEQ ID NO31至少75%,再更优选80%,再更优选85%,再更优选90%,再更优选95%相同的核酸序列中,其中所述启动子具有至少基本的脂肪酸脱氢酶启动子转录活性。确定百分比相同性的方法已在前面针对本文乙酰乳酸合酶序列叙述,并为本文所包括。
在一实施方案中,本发明的重组载体为表达载体。本文所用的短语“表达载体”用于指适合于产生编码产物(例如,目的蛋白)的载体。在该实施方案中,将编码需要产生的蛋白的核酸序列插入重组载体中以产生重组核酸分子。编码需要产生的蛋白的核酸序列以这样的方式插入载体中,即将该核酸序列与载体中的调控序列(例如,本发明的破囊壶菌目启动子)可操作地连接使得能够在重组宿主细胞内转录和翻译该核酸序列。本发明的选择性标记物确保能选出成功引入了本发明重组核酸分子的重组微生物。
在另一实施方案中,用于本发明的重组核酸分子的重组载体是一种定向载体。本文所用的短语“定向载体”用于指这样一种载体,即它用于将特定核酸分子传递进重组宿主细胞,其中该核酸分子用于删除或灭活宿主细胞或微生物内的内源性基因(即,用于定向基因破坏或敲除技术)。该载体本领域也称为“敲除”载体。在该实施方案的一个方面,该载体的一部分,但更典型的是插入载体中的核酸分子(即,插入片段)具有与宿主细胞中靶基因(即,删除或失活针对的基因)的核酸序列同源的核酸序列。载体插入片段的核酸序列设计成与靶基因结合以便靶基因与插入片段进行同源重组,从而删除,灭活或减弱该内源性靶基因(即,通过突变或删除至少一部分内源性靶基因)。
在一实施方案中,本发明优选的重组载体为适宜用在破囊壶菌目微生物中,并包括编码本发明乙酰乳酸合酶分子的核酸序列的重组载体。优选,所述乙酰乳酸合酶相对于天然形式(SEQ ID NO15)已被修饰,致使所述合酶赋予该重组载体所转染的破囊壶菌目微生物对磺酰脲化合物,咪唑啉酮类抑制剂和/或嘧啶基羟苯甲酸盐降低的敏感性。优选,该重组载体包含编码乙酰乳酸合酶蛋白的核酸序列,该蛋白包含与SEQ ID NO15不同的氨基酸序列,该不同是由于在一或多个下述位置116G,117A,192P,200A,251K,358M,383D,592V,595W,或599F发生氨基酸缺失,插入或取代。一实施方案中,所述乙酰乳酸合酶蛋白具有包括,但不限于SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列。优选,所述重组载体包含选自下列的核酸序列SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。在特别优选的实施方案中,包含赋予所需抗性的ALS-编码核酸序列的重组载体包括SEQ ID NO18,SEQ ID NO21和SEQ ID NO23。
在一实施方案中,适宜赋予用所述重组载体转染的破囊壶菌目微生物对磺酰脲化合物,咪唑啉酮类抑制剂和/或嘧啶基羟苯甲酸盐降低的敏感性的重组载体,包含SEQ ID NO15,这是天然Schizochytrium乙酰乳酸合酶序列。在本实施方案中,所述重组载体被设计成过度表达天然合酶,而此过度表达具有赋予微生物对特定的化合物的抗性的效应。在本实施方案中,本领域的技术人员将预料到使用重组DNA技术通过操纵例如,宿主细胞内核酸分子的拷贝数,转录这些核酸分子的效率,翻译所得转录子的效率,和翻译后修饰的效率可改进转染的核酸分子的表达调控。另外,可遗传改造启动子序列以便与天然启动子相比表达水平提高。用于控制核酸分子表达的重组技术包括,但不限于,将该核酸分子整合进一个或多个宿主细胞染色体中,给质粒添加载体稳定性序列,取代或修饰转录控制信号(例如,启动子,操纵子,增强子),取代或修饰翻译控制信号(例如,核糖体结合位点,Shine-Dalgarno序列),修饰核酸分子以符合该宿主细胞的密码子用法,和除去使转录子不稳定的序列。
本发明一实施方案中,适于转化破囊壶菌目微生物的重组载体,包含来自印度斯坦链异壁菌的Sh ble基因作为选择性标记物(它编码″博来霉素-结合蛋白),以及如本文上述的破囊壶菌目启动子。优选的重组载体包含ble基因和破囊壶菌目启动子,包括,例如,SEQ ID NO8或9所示载体序列。印度斯坦链异壁菌博来霉素-结合蛋白的氨基酸序列在本文为SEQ ID NO10。
本发明的重组核酸分子也可含有其它调控序列,例如翻译调控序列,复制起点,和与该重组细胞相适应的其它调控序列。在一个实施方案中,包括整合进宿主细胞染色体中的那些分子的本发明的重组分子还含有分泌信号(即,信号片段核酸序列)以便使得表达的蛋白质从产生该蛋白质的细胞中分泌出来。合适的信号片段包括天然状况下与表达该蛋白质相关的信号片段或者能够指导根据本发明的蛋白质分泌的任何异源性信号片段。在另一实施方案中,本发明的重组分子包含使得表达蛋白能够传递到宿主细胞膜上并插入膜中的前导序列。合适的前导序列包括天然状况下与该蛋白质相关的前导序列,或者能够指导该蛋白质传递并插入细胞膜中的任何异源性前导序列。
在描述了各种可用于转化破囊壶菌目微生物的工具以后,本发明一实施方案涉及破囊壶菌目微生物细胞的转化方法。所述方法包括第一步骤(a)将本文上述重组核酸分子引入破囊壶菌目微生物细胞。所述重组核酸分子包含编码乙酰乳酸合酶的核酸序列,所述乙酰乳酸合酶赋予该细胞对选自如下的化合物降低的敏感性磺酰脲化合物,咪唑啉酮类抑制剂,和嘧啶基羟苯甲酸盐。所述乙酰乳酸合酶已在上文中详述,它包括具有氨基酸序列SEQ IDNO19,SEQ ID NO22或SEQ ID NO24,及任一所述序列或上述SEQ IDNO15的同系物的乙酰乳酸合酶。此方法包括第二步骤(b)选择已用所述重组核酸分子成功转化的细胞,方法是在包含至少一抑制未转化细胞的化合物的培养基中培养(a)的细胞,所述化合物选自下述磺酰脲化合物,咪唑啉酮类抑制剂,和嘧啶基羟苯甲酸盐。在此类化合物存在时能够生长的细胞已被成功转化。
本方法所用重组核酸分子包含本文上述任一种本发明重组载体,并通常包括至少一种编码重组细胞(即包含重组表达载体)产生的蛋白的核酸序列,或用于在重组细胞(即包含重组靶向载体)中定点去除或灭活内源基因的核酸序列。
一实施方案中,所述重组核酸分子还包含编码由所述细胞产生的蛋白的核酸序列,其中编码所述蛋白的所述核酸序列与转录控制序列可操作性连接。希望在破囊壶菌目中产生的蛋白对本领域技术人员是已知的,并且全部为本发明所包括。特别优选的蛋白包括,但不限于与选自二十二碳六烯酸(DHA),二十二碳五烯酸(DPA),二十碳五烯酸(EPA)和二十碳四烯酸(ARA)的脂肪酸的合成相关的蛋白。此类蛋白包括,例如,脂肪酸合酶,脂肪酸脱氢酶,脂肪酸延伸酶,与聚酮化合物合酶复合体相关的蛋白,以及与将脂肪酸掺入磷脂或三甘油酯分子相关的蛋白。一方面,所述蛋白为核酸序列SEQID NO29编码的ω-3脂肪酸脱氢酶。SEQ ID NO30表示该脱氢酶的氨基酸序列。另一方面,所述蛋白为多烯脂肪酸异构酶。一实施方案中,可用本方法在破囊壶菌目微生物中产生的蛋白,包括与类异戊二烯生物合成途径相关的蛋白。所述蛋白包括,但不限于HMG-CoA合酶,HMG-CoA还原酶,角鲨烯合酶,八氢番茄红素合酶,八氢番茄红素脱氢酶,类胡萝卜素环化酶,类胡萝卜素羟化酶,类胡萝卜素酮酶。在另一实施方案中,可用本方法在破囊壶菌目微生物中产生的蛋白包括,但不限于维生素E和硫辛酸。
一实施方案中,本发明方法所用重组核酸分子包括与微生物内靶核酸序列杂交的核酸序列,从而包含该靶核酸序列的基因通过与所述第二种核酸序列同源重组而突变或灭活。此类核酸序列可与下述基因同源编码饱和和多聚不饱和的脂肪酸合成途径的酶的基因(或调控所述基因表达的核酸),编码参与破囊壶菌目微生物产生的其它有价值的化合物的降解或者减低所需化合物的价值的蛋白的基因,或编码与化合物合成相关的蛋白的基因,该化合物合成与其它目的分子有竞争。例如,靶核酸序列包括,但不限于编码下述蛋白的序列脂肪酶,脂肪酸氧化酶,参与糖类合成的蛋白,参与类异戊二烯途径产物合成的蛋白,参与细胞壁组分合成的蛋白,参与饱和脂肪酸合成途径的蛋白,参与多聚不饱和脂肪酸合成途径的蛋白,与聚酮化合物合酶复合体相关的蛋白和与将脂肪酸掺入磷脂或三甘油酯分子相关的蛋白。
本发明一实施方案中,转化破囊壶菌目微生物的方法包括向细胞引入至少一种附加的重组核酸分子的步骤,所述分子包含编码要表达蛋白的核酸序列,该核酸序列与转录控制序列可操作性连接。或者,所述附加的重组核酸分子可包括与所述微生物中靶核酸序列杂交的第二种核酸序列,从而包含该靶核酸序列的基因通过与第二种核酸序列同源重组而突变或灭活。这样一来,有可能将多个蛋白引入细胞,和/或灭活多个基因。所述附加的重组核酸分子可与第一种重组核酸分子同时引入破囊壶菌目微生物(即共转化),或作为后来的转化(例如,为″堆积″性状的目的)。
一实施方案中,所述方法还包括向细胞引入至少一种附加的包含编码博来霉素-结合蛋白的核酸序列的重组核酸分子的步骤。在本实施方案中,该附加的重组核酸分子优选在后续步骤中引入,而不是进行共转化。优选,所述包含编码博来霉素-结合蛋白的核酸序列的重组核酸分子还包含编码第二种被细胞表达的蛋白的核酸序列,其中所述编码第二种蛋白的核酸序列可操作性连接到转录控制序列。或者,或另外,所述包含编码博来霉素-结合蛋白的核酸序列的重组核酸分子还包含与该微生物中靶核酸序列杂交的第二种核酸序列,从而包含该靶核酸序列的基因通过与第二种核酸序列同源重组而突变或灭活。一实施方案中,此重组核酸分子包含核酸序列SEQ ID NO9。
适宜用本发明方法转化的宿主细胞包括,但不限于任何破囊壶菌目微生物。宿主细胞可为未转化细胞或已转染了至少一种核酸分子的细胞。本发明所用优选宿主细胞包括来自下列属的微生物包括,但不限于破囊壶菌属,Labyrinthuloides属,Japonochytrium属,和Schizochytrium属。这些属中优选的种的包括,但不限于任何Schizochytrium种,包括Schizochytriumaggregatum,Schizochytrium limacinum,Schizochytrium zninutum;任何破囊壶菌种(包括前Ulkenia种如U.visurgensis,U.amoeboida,U.sarkariana,U.profunda,U.radiata,U.分钟uta和Ulkenia sp.BP-5601),并包括Thraustochytrium striatum,Thraustochytrium aureum,Thraustochytrium roseum;和任何Japonochytrium种。特别优选破囊壶菌目菌株包括,但不限于Schizochytrium sp.(S31)(ATCC 20888);Schizochytrium sp.(S8)(ATCC20889);Schizochytrium sp.(LC-RM)(ATCC 18915);Schizochytrium sp.(SR21);Schizochytrium aggregatum(Goldstein et Belsky)(ATCC 28209);Schizochytrium limacinum(Honda et Yokochi)(IFO 32693);Thraustochytriumsp.(23B)(ATCC 20891);Thraustochytrium striatum(Schneider)(ATCC 24473);Thraustochytrium aureum(Goldstein)(ATCC 34304);Thraustochytrium roseum(Goldstein)(ATCC 28210);和Japonochytrium sp.(L1)(ATCC 28207)。
根据本发明,术语“转化”用于指将异源核酸分子(即,重组核酸分子)插入微生物细胞,如破囊壶菌目微生物细胞的任何方法。在微生物系统中,术语“转化”用于描述由于微生物获得异源核酸所致的遗传变化,它与术语“转染”基本同义。适宜的转化技术包括,但不限于粒子轰击,电穿孔,显微注射,脂转染,吸附,感染和原生质体融合。
一实施方案中,用本发明方法产生的蛋白通过在有效产生所述蛋白的条件下培养表达所述蛋白的细胞(即重组破囊壶菌目微生物)来产生。在一些例中,所述蛋白可被回收,并在其他例中,该微生物可被完整收获或为裂解物形式并用作″生物量(biomass)″。在另一实施方案中,去除或灭活靶基因的方法是,在能发生细胞内重组的有效条件下,培养已用包含本发明靶向载体的重组分子转化的细胞,从而使靶基因被去除或灭活。优选培养细胞为本发明的重组细胞。有效培养条件包括,但不限于允许蛋白产生和/或重组的有效培养基,生物反应器,温度,pH和氧气条件。有效培养基指通常用于培养破囊壶菌目细胞的任何培养基。所述培养基一般包括含水培养基,它具有可同化的碳,氮和磷酸盐来源,及适合的盐,矿物质,金属离子和其它营养物,如维生素。适宜的培养基和培养条件的实施例见实施例部分的具体讨论。适于破囊壶菌目微生物的培养条件也见August 23,1994授予Barclay的美国专利5,340,742;全文引入本文作为参考。本发明的细胞可在常规发酵生物反应器,摇瓶,试管,微滴皿,和培养皿中培养。培养可在适于重组细胞的温度,pH和氧含量下进行。所述培养条件在本领域技术人员的专门技术之内。
基于用于产生的载体和宿主系统,本发明所得蛋白可保留在重组细胞内;被分泌到发酵培养基中;被分泌到两个细胞的膜间空间中;或被保留在细胞膜的外表面。术语″回收所述蛋白″指收集全部包含所述蛋白的完整发酵培养基并且不需要暗示附加的分离或纯化步骤。用本发明方法产生的蛋白可用各种标准蛋白纯化技术纯化,如,但不限于,亲和层析,离子交换层析,过滤,电泳,疏水作用层析,凝胶过滤层析反相层析,伴刀豆球蛋白A层析,层析聚焦和差异溶解。用本发明方法产生的蛋白优选以″实质纯的″形式回收。本文中“实质纯”指保证所述蛋白作为商业产品有效应用的纯度。
而本发明的另一实施方案涉及破囊壶菌目的重组微生物,它已用包含编码本发明乙酰乳酸合酶的核酸序列的重组核酸分子转化。优选,所述乙酰乳酸合酶赋予该微生物对选自下述的化合物降低的敏感性磺酰脲化合物,咪唑啉酮类抑制剂,和嘧啶基羟苯甲酸盐。用于转化此类微生物的适宜重组核酸分子和序列已在上面详述。此类微生物还可用其它重组核酸分子转化,包括包含ble基因选择性标记物和破囊壶菌目转录控制序列的重组核酸分子,如本文上述。本发明重组破囊壶菌目微生物见实施例部分叙述。根据本发明,本发明的重组破囊壶菌目微生物用本文所述的重组载体遗传工程化,以便表达目的蛋白(此类蛋白实例见上述),和/或用本文所述的重组载体遗传工程化以便定点去除或灭活靶基因。
如本文所用,重组微生物具有用重组技术从其正常(即野生型或天然)形式经过修饰(即突变或改变)的基因组。本发明的重组微生物可包括下述微生物,该微生物中已插入,去除或修饰(即突变;例如,通过核苷酸的插入,去除,取代,和/或倒位)核酸分子,导致所述修饰在该微生物中提供所需效应。如本文所用,导致基因表达,基因功能,或基因产物(即,由该基因编码的蛋白)功能降低的遗传修饰可指基因的失活(完全或部分),缺失,中断,阻断或下调。例如,导致该基因编码的蛋白质的功能下降的基因遗传修饰可由该基因的完全缺失(即,该基因不存在,且因此该蛋白质不存在),导致蛋白质不完全翻译或不翻译(例如,蛋白质不表达)的基因突变,或降低或消除该蛋白的天然功能(即表达降低或无酶活性或作用的蛋白质)的基因突变引起。导致基因表达或功能增强的遗传修饰可指基因的扩增,过度表达,激活,增强,增加,或上调。
根据本发明,重组破囊壶菌目微生物可用任何破囊壶菌目微生物产生。优选破囊壶菌目的属包括,但不限于破囊壶菌属,Labyrinthuloides属,Japonochytrium属,和Schizochytrium属。优选这些属内的种包括,但不限于任何Schizochytrium种,包括Schizochytrium aggregatum,Schizochytriumlimacinum;任何破囊壶菌种(包括前Ulkenia种如U.visurgensis,U.amoeboida,U.sarkariana,U.profunda,U.radiata,U.分钟uta和Ulkenia sp.BP-5601),Thraustochytrium striatum,Thraustochytrium aureum,Thraustochytrium roseum;和任何Japonochytrium种。特别优选破囊壶菌目的菌株包括,但不限于Schizochytrium sp.(S31)(ATCC 20888);Schizochytriumsp.(S8)(ATCC 20889);Schizochytrium sp.(LC-RM)(ATCC 18915);Schizochytrium sp.(SR21);Schizochytrium aggregatum(Goldstein et Belsky)(ATCC 28209);Schizochytrium limacinum(Honda et Yokochi)(IFO 32693);Thraustochytrium sp.(23B)(ATCC 20891);Thraustochytrium striatum(Schneider)(ATCC 24473);Thraustochytrium aureum(Goldstein)(ATCC34304);Thraustochytrium roseum(Goldstein)(ATCC 28210);和Japonochytrium sp.(L1)(ATCC 28207)。
下述实施例旨在阐述本发明,而非限制本发明的范围。
实施例实施例1此实施例描述了重组质粒pTUBZEO11-2的产生。
重组质粒pTUBZEO11-2的构建见图1和2阐述。
该质粒包含来自印度斯坦链异壁菌的ble基因,该基因与从Schizochytrium sp.分离的α-微管蛋白基因启动子功能性偶联。此质粒如下产生。从Schizochytrium sp.cDNA文库分离cDNA克隆(CGNE0002-001-B6)并作为大规模Schizochytrium cDNA测序项目的一部分进行部分测序(SEQID NO1)。该核苷酸序列通过BLASTX同源性搜索确定能编码α-微管蛋白(Gish,W.and D.States.1993.Nat.Genet.3266-272)。从碱基116到550推断出的氨基酸序列与来自Pelvetica fastigiata的α-微管蛋白(GenBank序列号U58642)的开始145个氨基酸93%相同。
为分离与此类基因相关的启动子,从Schizochytrium sp细胞分离基因组DNA,并用″GenomeWalkerTM″试剂盒(Clontech Laboratories,Inc.,Palo Alto,CA)处理,包括限制性内切酶酶学消化基因组DNA来生成平端,之后将消化的DNA与试剂盒里提供的特异的双链DNA衔接分子连接。然后用试剂盒里提供的外部衔接引物(AP1)及α-微管蛋白特异性引物PGR20(SEQ IDNO2),用聚合酶链式反应(PCR)扩增此α-微管蛋白编码序列的上游DNA。此类基因的进一步扩增用试剂盒里提供的嵌套衔接引物(AP2)和嵌套α-微管蛋白特异性引物PGR19(SEQ ID NO3)来进行。所得PCR产物被亚克隆到质粒pCR2.1-TOPO(Invitrogen Corp.,Carlsbad,CA)。测序亚克隆片段之一;紧接在α-微管蛋白基因起始密码子前的725bp的序列被命名为SEQ ID NO4。
用基于这种方式获得的DNA序列的寡核苷酸引物,用Taq DNA聚合酶(Perkin-Elmer Corp.,Norwalk,CT)进行PCR,产生修饰的α-微管蛋白启动子区,其中NcoI限制性位点被掺入DNA片段的3′未端;该NcoI位点包含与α-微管蛋白编码区在同一位置的起始密码子。用于此反应的引物为PGR33(SEQ ID NO5)和PGR34(SEQ ID NO6),模板为从Schizochytrium sp.细胞分离的基因组DNA。应用下述反应条件94℃4分钟;(94℃1分钟,54℃45秒,72℃2分钟)×30;72℃7分钟。此片段被克隆入质粒pCR2.1-TOPO来构成质粒p7TUB(SEQ ID NO7)。质粒p7TUB用NcoI消化,所得包含Schizochytrium α-微管蛋白启动子区的463-bp片段通过琼脂糖凝胶纯化来分离。质粒pSV40/Zeo(Invitrogen Corp.,Carlsbad,CA)包含来自印度斯坦链异壁菌的ble基因,该基因侧翼有SV40启动子和终止子,该质粒也用NcoI消化来产生3201-bp和314-bp片段。所述3201-bp片段经琼脂糖凝胶纯化并连接到来自p7TUB的463-bp的NcoI片段,产生pTUBZEO-11(SEQ ID NO8),如图1所示。
之后,质粒pTUBZEO-11用SphI消化,所得的包含ble基因,且侧翼有Schizochytrium α-微管蛋白启动子和SV40终止子的1122-bp片段经琼脂糖凝胶纯化,连接到已用SphI消化而线性化的质粒pUC19(Messing,J.1983.Meth.Eiizyniol.10120)。所得质粒被命名为pTUBZEO11-2(SEQ ID NO9)并如图2和4所示。质粒pTUBZE011-2也称pMON50000。SEQ ID NO9中,Schizochytrium α-微管蛋白启动子被包含在核苷酸441-894中;ble基因编码区被包含在核苷酸核苷酸895-1269中;而SV40终止子被包含在核苷酸核苷酸1270-1524中。
实施例2此实施例描述了重组质粒pMON50200,pMON50201,pMON50202,和pMON50203的产生。
以下述方式分离Schizochytrium sp.的天然乙酰乳酸合酶-编码基因(als)。从Schizochytrium cDNA文库分离cDNA克隆(LIB81-028-Q1-E1-D9)并作为大规模Schizochytrium sp.cDNA测序项目的一部分进行部分测序(SEQID NO11)。该核苷酸序列通过BLASTX同源性确定编码乙酰乳酸合酶(Gish,W.and D.States.1993.Nat.Genet.3266-272);例如,从碱基154到378推断出的氨基酸序列与来自栗酒裂殖酵母(GenBank Accession No.P36620)的ALS的氨基酸313到387有68%相同。然后获得此克隆化cDNA的全长序列,它证明该cDNA克隆不包含完整的als编码区。为获得全长als基因,Schizochytrium基因组λ文库按照标准流程(见例如Sambrook等,MolecularCloneA Laboratory Manual.Cold Spring Harbor Laboratory Press,1989)用372-bp地高辛配基(DIG)-标记的DNA探针(指ALS2探针)来探察。所述ALS2探针用包括DIG-11-UTP(Boehringer Mannheim Biochemicals GmbH,Germany)的核苷酸混合物经PCR来产生,其中所用正向引物为PGR38(SEQ ID NO12)和反向引物为PGR39(SEQ ID NO13),它们都基于cDNA克隆LIB81-028-Q1-E1-D9的序列。分离出用ALS2探针鉴定的基因组克隆之一,ALS-4A,进一步用DIG-标记的ALS2探针通过DNA印迹杂交试验来鉴定。结果发现来自AhdI-消化的ALS-4AλDNA的4.9-kbp片段可与ALS2探针杂交。将此片段通过琼脂糖凝胶纯化分离,用T4DNA聚合酶处理来产生平端,然后连接到SmaI-消化的pBluescriptII KS+(Stratagene Corp.,La Jolla,CA)构成质粒pMON50200(如图3-A所示)。pMON50200的序列被命名为SEQ IDNO14。Schizochytrium als基因编码的乙酰乳酸合酶的序列被命名为SEQ IDNO15。
质粒pMON50201,pMON50202和pMON50203(如图3-B,3-C,和3-D分别所示)用通过定点诱变从质粒pMON50200产生,从而编码的乙酰乳酸合酶不再被某些化合物,包括sulfometuron methyl(SMM)抑制。这些质粒被如下构建。用所述″Transformer″定点诱变试剂盒(Clontech Laboratories,Inc.,Palo Alto,CA)根据产生者的说明书将下述突变引入质粒pMON50200。在所有三种构建体中使用寡核苷酸选择引物DM19(SEQ ID NO16);此引物导致pMON50200多克隆位点中唯一的EcoRV位点被转变为AatII位点。用引物DM14(SEQ ID NO17)将编码的ALS酶的氨基酸残基595从色氨酸改变为缬氨酸,而同时将AclI位点引入该基因序列;所得质粒被称为pMON50201(SEQ ID NO18)。类似的,用引物DM 15(SEQ ID NO20)将所编码的ALS酶中的氨基酸残基192从脯氨酸改变为谷氨酰胺并将BsgI位点引入als基因,得到质粒pMON50202(SEQ ID NO21)。为构建质粒pMON50203(SEQ ID NO23),一并使用DM 14和DM 15引物,编码得到包含上述两种氨基酸残基置换的ALS酶。质粒pMON50201,pMON50202,和pMON50203编码的乙酰乳酸合酶突变体的序列被分别命名为SEQ IDNO19,SEQ ID NO22,和SEQ ID NO24。
实施例3此实施例描述了用实施例1和2所述的重组分子对Schizochytrium sp.进行遗传转化。
此实施例所用的菌株是Schizochytrium sp.N230D,美国典型培养物保藏中心菌株20888(ATCC,Manassas,VA)的衍生物。为进行液体培养,细胞在M50-3培养基中在30℃以200-300rpm振摇无菌生长。M50-3培养基包含下列组分NaCl,12.5g;MgSO4-7H2O,2.5g;KCl,0.5g;CaCl2,0.05g;葡萄糖,30g;谷氨酸钠,3g;KH2PO4,0.4g;酵母提取物,1g;NaHCO3,0.4g;Na2EDTA,30mg;FeCl3-6H2O,1.2mg;H3BO3,34.2mg;ZnSO4-7H2O,0.67mg;CoCl2-6H2O,0.13mg;NaMoO4-2H2O,25μg;CuSO4-5H2O,10μg;NiSO4-6H2O,0.26mg;盐酸硫胺素,100μg;生物素,0.5μg;氰钴胺素,0.5μg,和去离子水(加至1升);终pH调整到7.0。在固体培养基上生长时,细胞在30℃的M50-3培养基或M1E-3培养基中生长,所述培养基中加入1.5%(w/v)琼脂进行固化。M1E-3培养基包含下列组分葡萄糖,4g;(NH4)2SO4,0.75g;Na2SO4,5g;MgSO4-7H2O,2g;KH2PO4,0.5g;KCl,0.5g;CaCl2-2H2O,0.1g;MOPS缓冲液,20.9g;FeSO4-4H2O,0.3mg;MnCl2-4H2O,0.1mg;ZnSO4-7H2O,80μg;CoCl2-6H2O,2μg;NaMoO4-2H2O,1μg;CuSO4-5H2O,60μg;NiSO4-6H2O,80μg;盐酸硫胺素,320μg;CA-泛酸盐,320μg;氰钴胺素,8μg,和去离子水(加至1升);终pH调整到7.0。
Schizochytrium sp.对ZeocinTM和SMM的敏感性如下确定在固化的M1E-3培养基中包括各种浓度的这些抑制剂,将细胞铺板,铺板密度类似于它们在筛选重组细胞的步骤中出现的密度。
Schizochytrium细胞的遗传转化通过用Bio-Rad Biolistic PDS-1000/氦粒子传送系统(Bio-Rad Laboratories,Hercules,CA)通过粒子轰击(Sanford,J.C.,F.D.Smith,和J.A.Russell.1993.Meth.Enzymol.217483509)来完成。Schizochytrium sp.N230D细胞在液体M50-3培养基中生长直到680nm(OD680)的光密度为0.4-0.8(光路长度10mm)。对应于OD6801.0的等分细胞被短暂离心,去除上清液,沉淀的细胞重悬在100μl无菌水中。所述重悬细胞然后在含有经琼脂固化的培养基(例如,M50-3或M1E-3培养基)的Petri皿上涂布4-6cm的环。并放置30-60分钟,从而过度的水可被吸收进入固体培养基;这称为是靶平板。
1.5mg等分的金微载体(0.6μ标称直径,来自Bio Rad Laboratories,Inc.,Hercules,CA)用2.5μg转化质粒DNA(即质粒pTUBZEO11-2,pMON50201,pMON50202,或pMON50203)按产生者的说明书(BiolisticPDS-1000/氦粒子传送系统说明书手册;Bio-Rad Laboratories,Hercules,CA)包被。所述细胞用DNA包被的金微载体用下列条件轰击1100psi爆发圆盘(burst disk),室真空25″Hg,微载体发射装配(assembly)置于顶层架而靶平板置于中层架,爆发圆盘到停止屏(stopping screen)的距离1.5-2cm而且停止屏到靶的距离约7cm。轰击后,使细胞在30℃重新覆盖到靶平板4-6小时。然后细胞用1.5ml无菌水从靶平板漂洗下来,集中在微离心(microfuge)管中,短暂离心,重悬在400μl无菌水中。100μl重悬液被涂布在四个包含150-200μg/ml ZeocinTM(Invitrogen Corp.,Carlbad,CA)或25μg/mL SMM的M1E-3平板上。用含ZeocinTM的平板选择经质粒pTUBZEO11-2转化的细胞,用含SMM的平板选择经质粒pMON50201,pMON50202,或pMON50203转化的细胞。然后在30℃孵育平板7-10天。然后将耐受选择性介质的菌落敷贴至包含同种选择试剂的新鲜MlE-3平板上,以便确认抗性。此方法通常导致每轮轰击生成100-1000个ZeocinTM-抗性株或SMM-抗性株。
实施例4下列实施例阐述了经转化的Schizochytrium细胞的PCR分析。
用PCR确认质粒序列在耐受选择试剂ZeocinTM或SMM的假定转化菌株中的存在。是用一次性1μl塑料接种环从敷贴到琼脂平板(如实施例3所述)上的抗性菌落取出小量细胞(1-2mm3)上样,获得来自假定的转化子和非-重组Schizochytrium N230D细胞的模板DNA。然后将所述细胞重悬在微离心管中15-20μl的1%Triton X-100,置于沸水浴中10分钟,然后在14,000xg离心5分钟。用部分提取物(1-3μl)制备模板DNA,以便用25μl TaqDNA聚合酶进行PCR反应。为检测pTUBZE011-2序列在Schizochytrium DNA中存在,使用引物DM20(SEQ ID NO25)和DM21(SEQ ID NO26);这些引物与质粒pTUBZEO11-2中的ble基因退火并扩增出346-bp的DNA片段。温度变化如下94℃4分钟;(94℃45秒,52℃45秒,72℃2分钟)×30;72℃7分钟。为检测pMON50201,pMON50202,或pMON50203序列在SchizochytriumDNA中存在,使用引物BLA1(SEQ ID NO27)和BLA2(SEQ ID NO28);这些引物发现与载体骨架中的bla(氨苄青霉素-抗性)基因退火并扩增出1229-bp的DNA片段。温度变化如下94℃4分钟;(94℃45秒,55℃45秒,72℃2分钟)×30;72℃7分钟。PCR产物通过标准琼脂糖凝胶电泳,之后用溴化乙锭染色分析。
这些分析的结果确认,绝大部分在这些条件下选择的菌株为真正包含质粒DNA的转化子。当使用来自没有被转化质粒轰击的对照Schizochytrium spN230D细胞的模板DNA时,没有产生正确大小的PCR产物。
实施例5下列实施例描述了经转化的Schizochytrium细胞的DNA印迹分析。
用从亲代Schizochytrium N230D细胞和多个假定的转化子分离的DNA进行DNA杂交印迹,来确认转化载体DNA序列在转化细胞中的存在。DNA印迹法用本领域技术人员已知技术(见例如Sambrook等,Molecular CloningA Laboratory Manual.Cold Spring Harbor Laboratory Press.1989)来进行。DNA用″QIAamp″DNA纯化试剂盒(Qiagen Inc.,Valencia,CA)分离,用各种限制性酶消化,通过琼脂糖凝胶(0.8%-1.2%w/v)电泳分离,然后通过碱性毛细管转移法转移到尼龙膜上。
经pTUBZEO11-2转化的细胞中的载体DNA用″Genius″DIG-为基础的系统(Boehringer Mannheim Biochemicals GmbH,Germany)和包括DIG-11-UTP的核苷酸混合物来进行检测,用346-bp DIG-标记的ble基因片段作杂交探针,该探针是通过用引物DM20(SEQ ID NO25)和DM21(SEQ ID NO26)进行PCR来产生。膜的预杂交在68℃在Genius试剂盒提供的杂交缓冲液中进行1小时。杂交在68℃,在包含94℃热变性5分钟的ble基因探针的杂交缓冲液中进行18小时。然后用50ml 2×SSC/0.1%SDS洗膜5分钟两次并在50ml 0.1×SSC/0.1%SDS中洗膜15分钟两次。按照Genius试剂盒说明书对杂交DNA进行化学发光法检测。
来自未经-转化的Schizochytrium N230D细胞的DNA不与ble基因探针杂交。相反,来自转化细胞的DNA与如下探针杂交SphI来自转化的Schizochytrium细胞的DNA经SphI-消化后包含与ble基因探针杂交的约1100-bp DNA片段;此片段也见于SphI-消化的pTUBZEO11-2 DNA,它表示完整的ble基因表达盒(包括微管蛋白基因启动子和SV40终止子)。
XhoI对被试的每个转化子,DNA经XhoI消化产生大于15-20kbp的杂交片段。XhoI不在pTUBZEO11-2内切割,因而这些结果证明pTUBZEO11-2不作为转化细胞中的染色体外元件存在,而是整合入Schizochytrium染色体。
NcoI或HindIII这些酶都在pTUBZEO11-2中发生一次切割。用这些酶中的任一种消化转化子DNA通常导致显著性杂交片段,此片段与线性化pTUBZEO11-2载体(即约3.8kbp)共迁移。这提示所述载体可以以串联重复形式整合入染色体。
实施例6此实施例阐述了Schizochytrium中的同源重组。
下述试验是为阐述同源重组可出现在Schizochytrium中,内源天然DNA序列与引入细胞的重组DNA分子中的同源DNA序列之间。此种同源重组对于产生具有所需性质的重组菌株很有益。例如,同源重组可用于通过定点插入外源遗传序列而灭活内源基因。另外,同源重组可用于将内源基因或其部分置换为此类基因的变更形式,从而使该重组细胞表现新的性质。
实验表明,同源重组出现在用pMON50202转化的Schizochytrium细胞,所述质粒在Schizochytrium als基因中包含突变。此突变在als编码区的bp位置571引入BsgI位点。在als编码区bp位置1324有天然BsgI位点。因而可用,经BsgI-消化的Schizochytrium DNA的DNA印迹法辨别天然als基因与重组突变体als基因。为进行这些试验,经PCR制备als-特异的杂交探针,其中用到包括DIG-11-UTP(Boehringer Mannheim BiochemicalsGmbH,Germany)的核苷酸混合物,正向引物PGR28(SEQ ID NO32),反向引物PGR30(SEQ ID NO33),以小量pMON50200作为模板。所得323-bp DIG-标记的杂交探针被称为ALS1。
来自非-重组Schizochytrium N230D细胞的DNA用BsgI和AhdI分别消化,经过琼脂糖凝胶电泳,转移到尼龙膜上,然后用ALS1探针探测,步骤基本与实施例5所述步骤相同。所述ALS1探针标记BsgI-消化的DNA的1.76-kbp片段和AhdI-消化的DNA的4.9-kbp片段。
来自各种经pMON50202转化的重组菌株的DNA经BsgI-和AhdI-消化后进行DNA印迹,然后也用ALS1探针探测。一些例中,未出现1.76-kbp的BsgI片段,而0.75-kbp的片段被标记,它对应于pMON50202中的753-bp的BsgI片段。但是,在这些重组菌株中,4.9-kbp的AhdI片段被标记,表明重组子的突变体als基因已通过双-交换同源重组与天然als基因发生了重组。
还观察到单-交换同源重组出现在用pMON50202转化的重组菌株中。在这些例中,1.76-kbp和0.75-kbp的BsgI片段在来自重组菌株的DNA的DNA印迹中都被标记,但4.9-kbp AhdI片段被较大的标记片段代替,这证明完整的pMON50202载体已插入天然als基因,其形式有单拷贝也有串联重复。
在Schizochytrium中发生同源重组的另一证据是,引入包含截短的als基因突变体的重组DNA分子,使该截短的基因编码的不完整ALS酶无功能。此截短的基因如下制备用ClaI和HindIII消化pMON50202,产生2.8-kbp片段,从而一并去除als编码序列的最后388bp连同als终止子区。将此2.8-kbp片段连接入已用ClaI和HindIII消化的pBluescriptII KS+(Stratagene Corp.,LaJolla,CA),产生质粒pAR2。如果通过天然als基因和pAR2的截短型als基因突变体之间发生同源重组,而使有功能的als基因突变体在转化菌株中被挽救,仅可预计质粒pAR2在经转化的Schizochytrium细胞中赋予对SMM的抗性。将该构建体通过粒子轰击引入Schizochytrium N230D细胞,如实施例3所述分离SMM-抗性菌株。来自转化子的DNA经BsgI-消化后按本实施例中前文所述进行DNA印迹分析,结果证明在这些菌株发生同源重组;即,1.76-kbp BsgI片段与所述ALS1探针在非重组细胞中杂交,但在pAR2转化的细胞中却是0.75-kbp的杂交片段。
实施例7此实施例描述了应用转化载体pTUBZEO11-2或pMON50202来经共转化产生包含不与选择性标记物基因连接的附加的外源DNA分子的菌株。
共转化可通过同时引入pTUBZEO11-2和附加的包含所述任一种基因的质粒来完成。如实施例3所述,使2.5μg每种质粒与金粒子共沉淀。在用质粒-包被的金粒子轰击靶细胞后,在包含ZeocinTM的琼脂平板上如实施例1所述选出重组菌株。第二种非选择性质粒的存在然后通过PCR分析或DNA印迹杂交确认。通常可获得很高的共转化频率(例如,50-90%)。例如,将包含秀丽新杆线虫fat-1基因的质粒pTR202(Spychalla等,1997.Proc.Natl.Acad.Sci.U.S.A.94,1142-1147)与Schizochytrium微管蛋白基因启动子和终止子连接,按照本实施例提供的方法引入,PCR表明约68%的所得ZeocinTM抗性菌株包含fat-1基因(见表1)。当引入pMON50202与附加的质粒之后,在包含SMM的固体培养基上选择转化细胞时可观察到类似结果。此共转化方法可用于引入任何所需的外源DNA。
表1.用选择性标记物质粒pTubZeo 11-2和包含各种fad基因的质粒共转化的有效性。用PCR筛选ZeocinR抗性转化子的fad DNA序列。
这些实施例叙述的转化系统代表了遗传操纵Schizochytrium的能力的显著性进步,这种菌种是已知用于发酵产生脂质-为基础的化合物的最有产生力的生物。两种独立的转化系统的出现,以及较高的共转化有效性可在工程菌株中堆积(stacking)多种性质。而且,同源重组在此藻类的明显存在可开发基因剔除方法,以便鉴定未知基因的功能并去除产生菌株中的不需要的性质。本发明人现用这些系统改变Schizochytrium的脂肪酸代谢,并在探索利用此物种和相关微藻(例如,破囊壶菌)产生类胡萝卜素,固醇,和其它脂类化合物的可能性。
尽管本发明的各种实施方案已被详述,但对于本领域技术人员而言,针对那些实施方案进行修饰和改编是显而易见的。然而可清楚理解的是,所述修饰和改编如下面权利要求书所提出的那样,都是在本发明的范围内。
序列表<110>马泰克生物科学公司(Martek Biosciences Corporation)<120>转化破囊壶菌目微生物的产物和方法<130>2997-23-PCT<150>60/284,116<151>2001-04-16<160>35<170>PatentIn version 3.1<210>1<211>551<212>DNA<213>Schizochytrium sp.
<220>
<221>misc_feature<222>(520)..(520)<223>n=a,c,g,or t<220>
<221>misc_feature<222>(541)..(541)<223>n=a,c,g,or t<400>1gtcgtgccta acaacacgcc gttctacccc gccttcttcg cgccccttcg cgtccaagca 60tccttcaagt ttatctctct agttcaactt caagaagaac aacaccacca acaagatgcg120tgaggtcatc tccatccaca tcggccaggc cggtgttcag gtcggtaacg cctgctggga180gctctactgc ctcgagcatg gcatccagcc ggacggccag atgccctcgg acaagaccat240tggcggcggc gatgatgcct tcaacacctt cttctccgag actggcgccg gcaagcacgt300gccccgcgcc gtgctcgtcg atctcgagcc caccgtctgt gacgaggtcc gcaccggcac360ctaccgcgct ctttaccacc ccgagcagat catcaccggc aaggaggacg ctgccaacaa420ctacgctcgt ggccactaca ccatcggcaa ggagatcgtc gacctcgtcc tcgaccgcat480ccgcaagctc gccgacaact gcactggtct tcagggcttn ctctgcttca acgccgtcgg540nggtggtacc g 551<210>2<211>27<212>DNA<213>Schizochytrium sp.
<400>2gcgccagtct cggagaagaa ggtgttg27<210>3<211>27<212>DNA<213>Schizochytrium sp.
<400>3agctcccagc aggcgttacc gacctga27<210>4<211>725
<212>DNA<213>Schizochytrium sp.
<400>4gagacgtgct tcgcaagacc gctgtgctcg cgccgcacgc tctgtgtgtt acattaattt 60ttttgtagat gaagtttctc tattctctcg aaattctgta gaatgttata gtctcttcac120tcccgtgatt ggagaggatt cttgcttgtt ccctcccgcc cgggtagcgc ttggagcaac180gcttgagcgc gcgctcgaaa gcggacggcg caacgagccg tttcacgccg cgctgtccaa240gtcccatttt tctccttacc ccatggccgt tgcatgccaa ttttaggccc cccactgacc300gaggtctgtc gataatccac ttttccattg atcttccagg tttcgttaac tcatgccact360gagcaaaact tcggtctttc ctaacaaaag ctctcctcac aaagcatggc gcggcaacgg420acgtgtcctc atactccact gccacacaag gtcgataaac taagctcctc acaaatagag480gagaattcca ctgacaactg aaaacaatgt atgagagacg atcaccactg gagcggcgcg540gcggttgggc gcggaggtcg gcagcaaaaa caagcgactc gccgagcaaa cccgaatcag600ccttcagacg gtcgtgccta acaacacgcc gttctacccc gccttcttcg cgccccttcg660cgtccaagca tccttcaagt ttatctctct agttcaactt caagaagaac aacaccacca720acaag725<210>5<211>24<212>DNA<213>Schizochytrium sp.
<400>5cacccatggt gttggtggtg ttgt 24<210>6<211>24<212>DNA<213>Schizochytrium sp.
<400>6aaactcgaga cgtgcttcgc aaga 24<210>7<211>4646<212>DNA<213>Schizochytrium sp.
<400>7aaactcgaga cgtgcttcgc aagaccgctg tgctcgcgcc gcacgctctg tgtgttacat 60taattttttt gtagatgaag tttctctatt ctctcgaaat tctgtagaat gttatagtct 120cttcactccc gtgattggag aggattcttg cttgttccct cccgcccggg tagcgcttgg 180agcaacgctt gagcgcgcgc tcgaaagcgg acggcgcaac gagccgtttc acgccgcgct 240gtccaagtcc catttttctc cttaccccat ggccgttgca tgccaatttt aggcccccca 300ctgaccgagg tctgtcgata atccactttt ccattgatct tccaggtttc gttaactcat 360gccactgagc aaaacttcgg tctttcctaa caaaagctct cctcacaaag catggcgcgg 420caacggacgt gtcctcatac tccactgcca cacaaggtcg ataaactaag ctcctcacaa 480atagaggaga attccactga caactgaaaa caatgtatga gagacgatca ccactggagc 540ggcgcggcgg ttgggcgcgg aggtcggcag caaaaacaag cgactcgccg agcaaacccg 600aatcagcctt cagacggtcg tgcctaacaa cacgccgttc taccccgcct tcttcgcgcc 660ccttcgcgtc caagcatcct tcaagtttat ctctctagtt caacttcaag aagaacaaca 720ccaccaacac catgggtgaa gggcgaattc tgcagatatc catcacactg gcggccgctc 780gagcatgcat ctagagggcc caattcgccc tatagtgagt cgtattacaa ttcactggcc 840gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 900gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 960caacagttgc gcagcctgaa tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg1020gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct1080cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta1140aatcgggggc tccctttagg gttccgattt agagctttac ggcacctcga ccgcaaaaaa1200
cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct1260ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc1320aaccctatcg cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg1380ttaaaaaatg agctgattta acaaattcag ggcgcaaggg ctgctaaagg aaccggaaca1440cgtagaaagc cagtccgcag aaacggtgct gaccccggat gaatgtcagc tactgggcta1500tctggacaag ggaaaacgca agcgcaaaga gaaagcaggt agcttgcagt gggcttacat1560ggcgatagct agactgggcg gttttatgga cagcaagcga accggaattg ccagctgggg1620cgccctctgg taaggttggg aagccctgca aagtaaactg gatggctttc ttgccgccaa1680ggatctgatg gcgcagggga tcaagatctg atcaagagac aggatgagga tcgtttcgca1740tgattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg1800gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag1860cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc1920aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc1980tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg2040atctcctgtc atctcgcctt gctcctgccg agaaagtatc catcatggct gatgcaatgc2100ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca2160tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag2220agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc atgcccgacg2280gcgaggatct cgtcgtgatc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg2340gccgcttttc tggattcaac gactgtggcc ggctgggtgt ggcggaccgc tatcaggaca2400tagcgttgga tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc2460tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg2520acgagttctt ctgaattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct2580tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa2640agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa2700cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt2760taaagttctg ctatgtcata cactattatc ccgtattgac gccgggcaag agcaactcgg2820tcgccgggcg cggtattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca2880tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa2940cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt3000gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc3060cataccaaac gacgagagtg acaccacgat gcctgtagca atgccaacaa cgttgcgcaa3120actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga3180ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc3240tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga3300tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga3360acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga3420ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat3480ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt3540ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct3600gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc3660ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc3720aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc3780gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc3840gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg3900aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata3960cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta4020tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc4080ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg4140atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt4200cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt4260ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga4320gcgcagcgag tcagtgagcg aggaagcgga agagcgccca atacgcaaac cgcctctccc4380cgcgcgttgg ccgattcatt aatgcagctg gcacgacagg tttcccgact ggaaagcggg4440cagtgagcgc aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca4500ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg4560aaacagctat gaccatgatt acgccaagct tggtaccgag ctcggatcca ctagtaacgg4620ccgccagtgt gctggaattc gccctt 4646<210>8
<211>3664<212>DNA<213>Schizochytrium sp.
<400>8ccatggccgt tgcatgccaa ttttaggccc cccactgacc gaggtctgtc gataatccac 60ttttccattg atcttccagg tttcgttaac tcatgccact gagcaaaact tcggtctttc 120ctaacaaaag ctctcctcac aaagcatggc gcggcaacgg acgtgtcctc atactccact 180gccacacaag gtcgataaac taagctcctc acaaatagag gagaattcca ctgacaactg 240aaaacaatgt atgagagacg atcaccactg gagcggcgcg gcggttgggc gcggaggtcg 300gcagcaaaaa caagcgactc gccgagcaaa cccgaatcag ccttcagacg gtcgtgccta 360acaacacgcc gttctacccc gccttcttcg cgccccttcg cgtccaagca tccttcaagt 420ttatctctct agttcaactt caagaagaac aacaccacca acaccatggc caagttgacc 480agtgccgttc cggtgctcac cgcgcgcgac gtcgccggag cggtcgagtt ctggaccgac 540cggctcgggt tctcccggga cttcgtggag gacgacttcg ccggtgtggt ccgggacgac 600gtgaccctgt tcatcagcgc ggtccaggac caggtggtgc cggacaacac cctggcctgg 660gtgtgggtgc gcggcctgga cgagctgtac gccgagtggt cggaggtcgt gtccacgaac 720ttccgggacg cctccgggcc ggccatgacc gagatcggcg agcagccgtg ggggcgggag 780ttcgccctgc gcgacccggc cggcaactgc gtgcacttcg tggccgagga gcaggactga 840cacgtgctac gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc 900gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc 960gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca1020aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc1080aatgtatctt atcatgtctg aattcccggg gatcctctag agtcgacctg caggcatgca1140agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa1200cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc1260accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct gatgcggtat1320tttctcctta cgcatctgtg cggtatttca caccgcatat atggtgcact ctcagtacaa1380tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc1440cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga1500gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg1560tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg1620gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa1680atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga1740agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc1800ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg1860gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc1920gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat1980tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg2040acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag2100aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa2160cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc2220gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca2280cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc2340tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc2400tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg2460ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta2520tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag2580gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga2640ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc2700tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa2760agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa2820aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc2880cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt2940agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc3000tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac3060gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca3120gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcat tgagaaagcg3180ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag3240gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt3300
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 3360ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 3420acatgtgtgc tgggcccagc cggccagatc tgagctcgcg gccgcgatat cgctagctcg 3480aggcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt 3540ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 3600tagtcccgcc cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc 3660cgcc 3664<210>9<211>3808<212>DNA<213>人工序列<220>
<223>Schizochytrium sp.和印度斯坦链异壁菌(Streptoalloteichus hindustanus)<220>
<221>启动子<222>(441)..(894)<223>
<220>
<221>CDS<222>(895)..(1269)<223>
<220>
<221>终止子<222>(1270)..(1524)<223>
<400>9tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg120ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc180accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc240attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat300tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt360tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccggggat420cctctagagt cgacctgcag gcatgccaat tttaggcccc ccactgaccg aggtctgtcg480ataatccact tttccattga ttttccaggt ttcgttaact catgccactg agcaaaactt540cggtctttcc taacaaaagc tctcctcaca aagcatggcg cggcaacgga cgtgtcctca600tactccactg ccacacaagg tcgataaact aagctcctca caaatagagg agaattccac660tgacaactga aaacaatgta tgagagacga tcaccactgg agcggcgcgg cggttgggcg720cggaggtcgg cagcaaaaac aagcgactcg ccgagcaaac ccgaatcagc cttcagacgg780tcgtgcctaa caacacgccg ttctaccccg ccttcttcgc gccccttcgc gtccaagcat840ccttcaagtt tatctctcta gttcaacttc aagaagaaca acaccaccaa cacc atg 897Met1gcc aag ttg acc agt gcc gtt ccg gtg ctc acc gcg cgc gac gtc gcc 945Ala Lys Leu Thr Ser Ala Val Pro Val Leu Thr Ala Arg Asp Val Ala5 10 15gga gcg gtc gag ttc tgg acc gac cgg ctc ggg ttc tcc cgg gac ttc 993Gly Ala Val Glu Phe Trp Thr Asp Arg Leu Gly Phe Ser Arg Asp Phe20 25 30gtg gag gac gac ttc gcc ggt gtg gtc cgg gac gac gtg acc ctg ttc 1041Val Glu Asp Asp Phe Ala Gly Val Val Arg Asp Asp Val Thr Leu Phe35 40 45atc agc gcg gtc cag gac cag gtg gtg ccg gac aac acc ctg gcc tgg 1089Ile Ser Ala Val Gln Asp Gln Val Val Pro Asp Asn Thr Leu Ala Trp
50 55 60 65gtg tgg gtg cgc ggc ctg gac gag ctg tac gcc gag tgg tcg gag gtc 1137Val Trp Val Arg Gly Leu Asp Glu Leu Tyr Ala Glu Trp Ser Glu Val70 75 80gtg tcc acg aac ttc cgg gac gcc tcc ggg ccg gcc atg acc gag atc 1185Val Ser Thr Asn Phe Arg Asp Ala Ser Gly Pro Ala Met Thr Glu Ile85 90 95ggc gag cag ccg tgg ggg cgg gag ttc gcc ctg cgc gac ccg gcc ggc 1233Gly Glu Gln Pro Trp Gly Arg Glu Phe Ala Leu Arg Asp Pro Ala Gly100105 110aac tgc gtg cac ttc gtg gcc gag gag cag gac tga cacgtgctac 1279Asn Cys Val His Phe Val Ala Glu Glu Gln Asp115 120gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg1339acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca1399acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa1459ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt1519atcatgtctg aattcccggg gatcctctag agtcgacctg caggcatgca agcttggcgt1579aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca1639tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat1699taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt1759aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct1819cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa1879aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa1939aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc1999tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga2059caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc2119cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt2179ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct2239gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg2299agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta2359gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct2419acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa2479gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt2539gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta2599cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat2659caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa2719gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct2779cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta2839cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct2899caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg2959gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa3019gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt3079cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta3139catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca3199gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta3259ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct3319gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg3379cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac3439tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact3499gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa3559atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt3619ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat3679gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg3739acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc3799cctttcgtc3808<210>10<211>124<212>PRT
<213>人工序列<220>
<223>Schizochytrium sp.和印度斯坦链异壁菌(Streptoalloteichus hindustanus)<400>10Met Ala Lys Leu Thr Ser Ala Val Pro Val Leu Thr Ala Arg Asp Val1 5 10 15Ala Gly Ala Val Glu Phe Trp Thr Asp Arg Leu Gly Phe Ser Arg Asp20 25 30Phe Val Glu Asp Asp Phe Ala Gly Val Val Arg Asp Asp Val Thr Leu35 40 45Phe Ile Ser Ala Val Gln Asp Gln Val Val Pro Asp Asn Thr Leu Ala50 55 60Trp Val Trp Val Arg Gly Leu Asp Glu Leu Tyr Ala Glu Trp Ser Glu65 70 75 80Val Val Ser Thr Asn Phe Arg Asp Ala Ser Gly Pro Ala Met Thr Glu85 90 95Ile Gly Glu Gln Pro Trp Gly Arg Glu Phe Ala Leu Arg Asp Pro Ala100 105 110Gly Asn Cys Val His Phe Val Ala Glu Glu Gln Asp115 120<210>11<211>1416<212>DNA<213>Schizochytrium sp.
<400>11gcaaaaggtc gagcttttcc acaaggagcg cattggcgct cctggcacgg ccgacttcaa 60gctcattgcc gagatgatca accgtgcgga gcgacccgtc atctatgctg gccagggtgt 120catgcagagc ccgttgaatg gcccggctgt gctcaaggag ttcgcggaga aggccaacat 180tcccgtgacc accaccatgc agggtctcgg cggctttgac gagcgtagtc ccctctccct 240caagatgctc ggcatgcacg gctctgccta cgccaactac tcgatgcaga acgccgatct 300tatcctggcg ctcggtgccc gctttgatga tcgtgtgacg ggccgcgttg acgcctttgc 360tccggaggct cgccgtgccg agcgcgaggg ccgcggtggc atcgttcact ttgagatttc 420ccccaagaac ctccacaagg tcgtccagcc caccgtcgcg gtcctcggcg acgtggtcga 480gaacctcgcc aacgtcacgc cccacgtgca gcgccaggag cgcgagccgt ggtttgcgca 540gatcgccgat tggaaggaga agcacccttt tctgctcgag tctgttgatt cggacgacaa 600ggttctcaag ccgcagcagg tcctcacgga gcttaacaag cagattctcg agattcagga 660gaaggacgcc gaccaggagg tctacatcac cacgggcgtc ggaagccacc agatgcaggc 720agcgcagttc cttacctgga ccaagccgcg ccagtggatc tcctcgggtg gcgccggcac 780tatgggctac ggccttccct cggccattgg cgccaagatt gccaagcccg atgctattgt 840tattgacatc gatggtgatg cttcttattc gatgaccggt atggaattga tcacagcagc 900cgaattcaag gttggcgtga agattcttct tttgcagaac aactttcagg gcatggtcaa 960gaactggcag gatctctttt acgacaagcg ctactcgggc accgccatgt tcaacccgcg1020cttcgacaag gtcgccgatg cgatgcgtgc caagggtctc tactgcgcga aacagtcgga1080gctcaaggac aagatcaagg agtttctcga gtacgatgag ggtcccgtcc tcctcgaggt1140tttcgtggac aaggacacgc tcgtcttgcc catggtcccc gctggctttc cgctccacga1200
gatggtcctc gagcctccta agcccaagga cgcctaagtt cttttttcca tggcgggcga1260gcgagcgagc gcgcgagcgc gcaagtgcgc aagcgccttg ccttgctttg cttcgcttcg1320ctttgctttg cttcacacaa cctaagtatg aattcaagtt ttcttgcttg tcggcgaaaa1380aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1416<210>12<211>20<212>DNA<213>Schizochytrium sp.
<400>12ggatctcttt tacgacaagc20<210>13<211>18<212>DNA<213>Schizochytrium sp.
<400>13ggttgtgtga agcaaagc 18<210>14<211>7847<212>DNA<213>Schizochytrium sp.
<220>
<221>prim_transcript<222>(1)..(1259)<223>
<220>
<221>CDS<222>(1260)..(3314)<223>
<220>
<221>prim_transcript<222>(3315)..(4887)<223>
<400>14ttgtcgacag caacttgcaa gttatacgcg accaccaggc aatctcagca cgcccagcga 60gcacggagct tgcgaagagg gtttacaagt cgtcgttcat tcgctctcaa gctttgcctc 120aacgcaacta ggcccaggcc tactttcact gtgtcttgtc ttgcctttca caccgaccga 180gtgtgcacaa ccgtgttttg cacaaagcgc aagatgctca ctcgactgtg aagaaaggtt 240gcgcgcaagc gactgcgact gcgaggatga ggatgactgg cagcctgttc aaaaactgaa 300aatccgcgat gggtcagtgc cattcgcgca tgacgcctgc gagagacaag ttaactcgtg 360tcactggcat gtcctagcat ctttacgcga gcaaaattca atcgctttat tttttcagtt 420tcgtaacctt ctcgcaaccg cgaatcgccg tttcagcctg actaatctgc agctgcgtgg 480cactgtcagt cagtcagtca gtcgtgcgcg ctgttccagc accgaggtcg cgcgtcgccg 540cgcctggacc gctgctgcta ctgctagtgg cacggcaggt aggagcttgt tgccggaaca 600ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg cgtcgaaggg agaggaaggc 660ggcgtgtgca aactaacgtt gaccactggc gcccgccgac acgagcagga agcaggcagc 720tgcagagcgc agcgcgcaag tgcagaatgc gcgaaagatc cacttgcgcg cggcgggcgc 780gcacttgcgg gcgcggcgcg gaacagtgcg gaaaggagcg gtgcagacgg cgcgcagtga 840cagtgggcgc aaagccgcgc agtaagcagc ggcggggaac ggtatacgca gtgccgcggg 900ccgccgcaca cagaagtata cgcgggccga agtggggcgt cgcgcgcggg aagtgcggaa 960tggcgggcaa ggaaaggagg agacggaaag agggcgggaa agagagagag agagagtgaa1020aaaagaaaga aagaaagaaa gaaagaaaga aagctcggag ccacgccgcg gggagagaga1080
gaaatgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg1140gaggagcgcg cgcaggaccc gcgcggcgag cgagcgagca cggcgcgcga gcgagcgagc1200gagcgagcgc gcgagcgagc aaggcttgct gcgagcgatc gagcgagcga gcgggaagg 1259atg agc gcg acc cgc gcg gcg acg agg aca gcg gcg gcg ctg tcc tcg 1307Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15gcg ctg acg acg cct gta aag cag cag cag cag cag cag ctg cgc gta 1355Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30ggc gcg gcg tcg gca cgg ctg gcg gcc gcg gcg ttc tcg tcc ggc acg 1403Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45ggc gga gac gcg gcc aag aag gcg gcc gcg gcg agg gcg ttc tcc acg 1451Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60gga cgc ggc ccc aac gcg aca cgc gag aag agc tcg ctg gcc acg gtc 1499Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80cag gcg gcg acg gac gat gcg cgc ttc gtc ggc ctg acc ggc gcc caa 1547Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95atc ttt cat gag ctc atg cgc gag cac cag gtg gac acc atc ttt ggc 1595Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110tac cct ggc ggc gcc att ctg ccc gtt ttt gat gcc att ttt gag agt 1643Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125gac gcc ttc aag ttc att ctc gct cgc cac gag cag ggc gcc ggc cac 1691Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140atg gcc gag ggc tac gcg cgc gcc acg ggc aag ccc ggc gtt gtc ctc 1739Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160gtc acc tcg ggc cct gga gcc acc aac acc atc acc ccg atc atg gat 1787Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175gct tac atg gac ggt acg ccg ctg ctc gtg ttc acc ggc cag gtg ccc 1835Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro180 185 190acc tct gct gtc ggc acg gac gct ttc cag gag tgt gac att gtt ggc 1883Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205atc agc cgc gcg tgc acc aag tgg aac gtc atg gtc aag gac gtg aag 1931Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220gag ctc ccg cgc cgc atc aat gag gcc ttt gag att gcc atg agc ggc 1979Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240cgc ccg ggt ccc gtg ctc gtc gat ctt cct aag gat gtg acc gcc gtt 2027Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255gag ctc aag gaa atg ccc gac agc tcc ccc cag gtt gct gtg cgc cag 2075Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270aag caa aag gtc gag ctt ttc cac aag gag cgc att ggc gct cct ggc 2123Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285acg gcc gac ttc aag ctc att gcc gag atg atc aac cgt gcg gag cga 2171Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300
ccc gtc atc tat gct ggc cag ggt gtc atg cag agc ccg ttg aat ggc 2219Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320ccg gct gtg ctc aag gag ttc gcg gag aag gcc aac att ccc gtg acc 2267Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335acc acc atg cag ggt ctc ggc ggc ttt gac gag cgt agt ccc ctc tcc 2315Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350ctc aag atg ctc ggc atg cac ggc tct gcc tac gcc aac tac tcg atg 2363Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365cag aac gcc gat ctt atc ctg gcg ctc ggt gcc cgc ttt gat gat cgt 2411Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380gtg acg ggc cgc gtt gac gcc ttt gct ccg gag gct cgc cgt gcc gag 2459Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400cgc gag ggc cgc ggt ggc atc gtt cac ttt gag att tcc ccc aag aac 2507Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415ctc cac aag gtc gtc cag ccc acc gtc gcg gtc ctc ggc gac gtg gtc 2555Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430gag aac ctc gcc aac gtc acg ccc cac gtg cag cgc cag gag cgc gag 2603Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445ccg tgg ttt gcg cag atc gcc gat tgg aag gag aag cac cct ttt ctg 2651Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460ctc gag tct gtt gat tcg gac gac aag gtt ctc aag ccg cag cag gtc 2699Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480ctc acg gag ctt aac aag cag att ctc gag att cag gag aag gac gcc 2747Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495gac cag gag gtc tac atc acc acg ggc gtc gga agc cac cag atg cag 2795Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510gca gcg cag ttc ctt acc tgg acc aag ccg cgc cag tgg atc tcc tcg 2843Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525ggt ggc gcc ggc act atg ggc tac ggc ctt ccc tcg gcc att ggc gcc 2891Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540aag att gcc aag ccc gat gct att gtt att gac atc gat ggt gat gct 2939Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560tct tat tcg atg acc ggt atg gaa ttg atc aca gca gcc gaa ttc aag 2987Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575gtt ggc gtg aag att ctt ctt ttg cag aac aac ttt cag ggc atg gtc 3035Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590aag aac tgg cag gat ctc ttt tac gac aag cgc tac tcg ggc acc gcc 3083Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605atg ttc aac ccg cgc ttc gac aag gtc gcc gat gcg atg cgt gcc aag 3131Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620
ggt ctc tac tgc gcg aaa cag tcg gag ctc aag gac aag atc aag gag 3179Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640ttt ctc gag tac gat gag ggt ccc gtc ctc ctc gag gtt ttc gtg gac 3227Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655aag gac acg ctc gtc ttg ccc atg gtc ccc gct ggc ttt ccg ctc cac 3275Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670gag atg gtc ctc gag cct cct aag ccc aag gac gcc taa gttctttttt 3324Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680ccatggcggg cgagcgagcg agcgcgcgag cgcgcaagtg cgcaagcgcc ttgccttgct3384ttgcttcgct tcgctttgct ttgcttcaca caacctaagt atgaattcaa gttttcttgc3444ttgtcggcga tgcctgcctg ccaaccagcc agccatccgg ccggccgtcc ttgacgcctt3504cgcttccggc gcggccatcg attcaattca cccatccgat acgttccgcc ccctcacgtc3564cgtctgcgca cgacccctgc acgaccacgc caaggccaac gcgccgctca gctcagcttg3624tcgacgagtc gcacgtcaca tatctcagat gcatttggac tgtgagtgtt attatgccac3684tagcacgcaa cgatcttcgg ggtcctcgct cattgcatcc gttcgggccc tgcaggcgtg3744gacgcgagtc gccgccgaga cgctgcagca ggccgctccg acgcgagggc tcgagctcgc3804cgcgcccgcg cgatgtctgc ctggcgccga ctgatctctg gagcgcaagg aagacacggc3864gacgcgagga ggaccgaaga gagacgctgg ggtatgcagg atatacccgg ggcgggacat3924tcgttccgca tacactcccc cattcgagct tgctcgtcct tggcagagcc gagcgcgaac3984ggttccgaac gcggcaagga ttttggctct ggtgggtgga ctccgatcga ggcgcaggtt4044ctccgcaggt tctcgcaggc cggcagtggt cgttagaaat agggagtgcc ggagtcttga4104cgcgccttag ctcactctcc gcccacgcgc gcatcgccgc catgccgccg tcccgtctgt4164cgctgcgctg gccgcgaccg gctgcgccag agtacgacag tgggacagag ctcgaggcga4224cgcgaatcgc tcgggttgta agggtttcaa gggtcgggcg tcgtcgcgtg ccaaagtgaa4284aatagtaggg gggggggggg gtacccaccc cgggcaggtt ctcctcgcca gcctaagtgc4344ctaagggagc gtaggggttt cgttgaccag agaagcggag aacctgccgc ggcgcggaga4404acctatcggc ggagaacttg ccaggcgcga ggcagttctc caatttgcgg acagcggcgc4464gcccacgcga ggcggccgcg tggcgataca gcgaggcgac cgcgcggggc cgcgtggcga4524cacagctgcg cgcggagtcg gctgcgagaa ggcttctcgc tggcttggtt ggggtcgcgg4584gtggcagggg atggatgccc aggtacgtcg gcgtgcgcgc gcccagggag aaaaggacag4644acgcgcgggc ctgcgatgcg agcacgcgat gcgagcacgc gatgcgagca cgcgatgcga4704gcacgcgagc gagcgcccga gcaaatgcca cggaacacgc gttttttgtt tggtgatttc4764tatgtatgcg gggagacttc gatggccgaa aggggtgcaa ggccaaaaga tgctgacagc4824ttcgatcggt ctacggcgcg agcaggaaag ggagcaaggg gcggaattct tctgccttga4884cccgggggat ccactagttc tagagcggcc gccaccgcgg tggagctcca attcgcccta4944tagtgagtcg tattacgcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa5004ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa5064tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg5124ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac5184cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc5244cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt5304tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg5364gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag5424tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt5484ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt5544taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt tcggggaaat5604gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg5664agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa5724catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac5784ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac5844atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt5904ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc5964gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca6024ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc6084ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag6144gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa6204
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg6264gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa6324ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg6384gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt6444gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt6504caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag6564cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat6624ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct6684taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct6744tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca6804gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc6864agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc6924aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct6984gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag7044gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc7104tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg7164agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag7224cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt7284gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac7344gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg7404ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc7464cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata7524cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt7584cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag7644gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga7704taacaatttc acacaggaaa cagctatgac catgattacg ccaagcgcgc aattaaccct7764cactaaaggg aacaaaagct gggtaccggg ccccccctcg aggtcgacgg tatcgataag7824cttgatatcg aattcctgca gcc7847<210>15<211>684<212>PRT<213>Schizochytrium sp.
<400>15Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His
130 135 140Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro180 185 190Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu
450 455 460Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680<210>16<211>30<212>DNA<213>Schizochytrium sp.
<400>16tatcgataag cttgacgtcg aattcctgca 30<210>17<211>32<212>DNA<213>Schizochytrium sp.
<400>17catggtcaag aacgttcagg atctctttta cg 32
<210>18<211>7847<212>DNA<213>Schizochytrium sp.
<220>
<221>prim_transcript<222>(1)..(1259)<223>
<220>
<221>CDS<222>(1260)..(3314)<223>
<220>
<221>prim_transcript<222>(3315)..(4887)<223>
<220>
<221>突变<222>(3042)..(3044)<223>
<400>18ttgtcgacag caacttgcaa gttatacgcg accaccaggc aatctcagca cgcccagcga 60gcacggagct tgcgaagagg gtttacaagt cgtcgttcat tcgctctcaa gctttgcctc 120aacgcaacta ggcccaggcc tactttcact gtgtcttgtc ttgcctttca caccgaccga 180gtgtgcacaa ccgtgttttg cacaaagcgc aagatgctca ctcgactgtg aagaaaggtt 240gcgcgcaagc gactgcgact gcgaggatga ggatgactgg cagcctgttc aaaaactgaa 300aatccgcgat gggtcagtgc cattcgcgca tgacgcctgc gagagacaag ttaactcgtg 360tcactggcat gtcctagcat ctttacgcga gcaaaattca atcgctttat tttttcagtt 420tcgtaacctt ctcgcaaccg cgaatcgccg tttcagcctg actaatctgc agctgcgtgg 480cactgtcagt cagtcagtca gtcgtgcgcg ctgttccagc accgaggtcg cgcgtcgccg 540cgcctggacc gctgctgcta ctgctagtgg cacggcaggt aggagcttgt tgccggaaca 600ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg cgtcgaaggg agaggaaggc 660ggcgtgtgca aactaacgtt gaccactggc gcccgccgac acgagcagga agcaggcagc 720tgcagagcgc agcgcgcaag tgcagaatgc gcgaaagatc cacttgcgcg cggcgggcgc 780gcacttgcgg gcgcggcgcg gaacagtgcg gaaaggagcg gtgcagacgg cgcgcagtga 840cagtgggcgc aaagccgcgc agtaagcagc ggcggggaac ggtatacgca gtgccgcggg 900ccgccgcaca cagaagtata cgcgggccga agtggggcgt cgcgcgcggg aagtgcggaa 960tggcgggcaa ggaaaggagg agacggaaag agggcgggaa agagagagag agagagtgaa1020aaaagaaaga aagaaagaaa gaaagaaaga aagctcggag ccacgccgcg gggagagaga1080gaaatgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg1140gaggagcgcg cgcaggaccc gcgcggcgag cgagcgagca cggcgcgcga gcgagcgagc1200gagcgagcgc gcgagcgagc aaggcttgct gcgagcgatc gagcgagcga gcgggaagg 1259atg agc gcg acc cgc gcg gcg acg agg aca gcg gcg gcg ctg tcc tcg 1307Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15gcg ctg acg acg cct gta aag cag cag cag cag cag cag ctg cgc gta 1355Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30ggc gcg gcg tcg gca cgg ctg gcg gcc gcg gcg ttc tcg tcc ggc acg 1403Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45ggc gga gac gcg gcc aag aag gcg gcc gcg gcg agg gcg ttc tcc acg 1451Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60
gga cgc ggc ccc aac gcg aca cgc gag aag agc tcg ctg gcc acg gtc1499Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80cag gcg gcg acg gac gat gcg cgc ttc gtc ggc ctg acc ggc gcc caa1547Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95atc ttt cat gag ctc atg cgc gag cac cag gtg gac acc atc ttt ggc1595Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110tac cct ggc ggc gcc att ctg ccc gtt ttt gat gcc att ttt gag agt1643Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125gac gcc ttc aag ttc att ctc gct cgc cac gag cag ggc gcc ggc cac1691Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140atg gcc gag ggc tac gcg cgc gcc acg ggc aag ccc ggc gtt gtc ctc1739Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160gtc acc tcg ggc cct gga gcc acc aac acc atc acc ccg atc atg gat1787Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175gct tac atg gac ggt acg ccg ctg ctc gtg ttc acc ggc cag gtg ccc1835Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro180 185 190acc tct gct gtc ggc acg gac gct ttc cag gag tgt gac att gtt ggc1883Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205atc agc cgc gcg tgc acc aag tgg aac gtc atg gtc aag gac gtg aag1931Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220gag ctc ccg cgc cgc atc aat gag gcc ttt gag att gcc atg agc ggc1979Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240cgc ccg ggt ccc gtg ctc gtc gat ctt cct aag gat gtg acc gcc gtt2027Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255gag ctc aag gaa atg ccc gac agc tcc ccc cag gtt gct gtg cgc cag2075Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270aag caa aag gtc gag ctt ttc cac aag gag cgc att ggc gct cct ggc2123Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285acg gcc gac ttc aag ctc att gcc gag atg atc aac cgt gcg gag cga2171Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300ccc gtc atc tat gct ggc cag ggt gtc atg cag agc ccg ttg aat ggc2219Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320ccg gct gtg ctc aag gag ttc gcg gag aag gcc aac att ccc gtg acc2267Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335acc acc atg cag ggt ctc ggc ggc ttt gac gag cgt agt ccc ctc tcc2315Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350ctc aag atg ctc ggc atg cac ggc tct gcc tac gcc aac tac tcg atg2363Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365cag aac gcc gat ctt atc ctg gcg ctc ggt gcc cgc ttt gat gat cgt2411Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380
gtg acg ggc cgc gtt gac gcc ttt gct ccg gag gct cgc cgt gcc gag2459Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400cgc gag ggc cgc ggt ggc atc gtt cac ttt gag att tcc ccc aag aac2507Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415ctc cac aag gtc gtc cag ccc acc gtc gcg gtc ctc ggc gac gtg gtc2555Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430gag aac ctc gcc aac gtc acg ccc cac gtg cag cgc cag gag cgc gag2603Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445ccg tgg ttt gcg cag atc gcc gat tgg aag gag aag cac cct ttt ctg2651Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460ctc gag tct gtt gat tcg gac gac aag gtt ctc aag ccg cag cag gtc2699Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480ctc acg gag ctt aac aag cag att ctc gag att cag gag aag gac gcc2747Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495gac cag gag gtc tac atc acc acg ggc gtc gga agc cac cag atg cag2795Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510gca gcg cag ttc ctt acc tgg acc aag ccg cgc cag tgg atc tcc tcg2843Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525ggt ggc gcc ggc act atg ggc tac ggc ctt ccc tcg gcc att ggc gcc2891Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540aag att gcc aag ccc gat gct att gtt att gac atc gat ggt gat gct2939Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560tct tat tcg atg acc ggt atg gaa ttg atc aca gca gcc gaa ttc aag2987Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575gtt ggc gtg aag att ctt ctt ttg cag aac aac ttt cag ggc atg gtc3035Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590aag aac gtt cag gat ctc ttt tac gac aag cgc tac tcg ggc acc gcc3083Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605atg ttc aac ccg cgc ttc gac aag gtc gcc gat gcg atg cgt gcc aag3131Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620ggt ctc tac tgc gcg aaa cag tcg gag ctc aag gac aag atc aag gag3179Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640ttt ctc gag tac gat gag ggt ccc gtc ctc ctc gag gtt ttc gtg gac3227Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655aag gac acg ctc gtc ttg ccc atg gtc ccc gct ggc ttt ccg ctc cac3275Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670gag atg gtc ctc gag cct cct aag ccc aag gac gcc taa gttctttttt 3324Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680ccatggcggg cgagcgagcg agcgcgcgag cgcgcaagtg cgcaagcgcc ttgccttgct 3384ttgcttcgct tcgctttgct ttgcttcaca caacctaagt atgaattcaa gttttcttgc 3444ttgtcggcga tgcctgcctg ccaaccagcc agccatccgg ccggccgtcc ttgacgcctt 3504
cgcttccggc gcggccatcg attcaattca cccatccgat acgttccgcc ccctcacgtc3564cgtctgcgca cgacccctgc acgaccacgc caaggccaac gcgccgctca gctcagcttg3624tcgacgagtc gcacgtcaca tatctcagat gcatttggac tgtgagtgtt attatgccac3684tagcacgcaa cgatcttcgg ggtcctcgct cattgcatcc gttcgggccc tgcaggcgtg3744gacgcgagtc gccgccgaga cgctgcagca ggccgctccg acgcgagggc tcgagctcgc3804cgcgcccgcg cgatgtctgc ctggcgccga ctgatctctg gagcgcaagg aagacacggc3864gacgcgagga ggaccgaaga gagacgctgg ggtatgcagg atatacccgg ggcgggacat3924tcgttccgca tacactcccc cattcgagct tgctcgtcct tggcagagcc gagcgcgaac3984ggttccgaac gcggcaagga ttttggctct ggtgggtgga ctccgatcga ggcgcaggtt4044ctccgcaggt tctcgcaggc cggcagtggt cgttagaaat agggagtgcc ggagtcttga4104cgcgccttag ctcactctcc gcccacgcgc gcatcgccgc catgccgccg tcccgtctgt4164cgctgcgctg gccgcgaccg gctgcgccag agtacgacag tgggacagag ctcgaggcga4224cgcgaatcgc tcgggttgta agggtttcaa gggtcgggcg tcgtcgcgtg ccaaagtgaa4284aatagtaggg gggggggggg gtacccaccc cgggcaggtt ctcctcgcca gcctaagtgc4344ctaagggagc gtaggggttt cgttgaccag agaagcggag aacctgccgc ggcgcggaga4404acctatcggc ggagaacttg ccaggcgcga ggcagttctc caatttgcgg acagcggcgc4464gcccacgcga ggcggccgcg tggcgataca gcgaggcgac cgcgcggggc cgcgtggcga4524cacagctgcg cgcggagtcg gctgcgagaa ggcttctcgc tggcttggtt ggggtcgcgg4584gtggcagggg atggatgccc aggtacgtcg gcgtgcgcgc gcccagggag aaaaggacag4644acgcgcgggc ctgcgatgcg agcacgcgat gcgagcacgc gatgcgagca cgcgatgcga4704gcacgcgagc gagcgcccga gcaaatgcca cggaacacgc gttttttgtt tggtgatttc4764tatgtatgcg gggagacttc gatggccgaa aggggtgcaa ggccaaaaga tgctgacagc4824ttcgatcggt ctacggcgcg agcaggaaag ggagcaaggg gcggaattct tctgccttga4884cccgggggat ccactagttc tagagcggcc gccaccgcgg tggagctcca attcgcccta4944tagtgagtcg tattacgcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa5004ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa5064tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg5124ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac5184cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc5244cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt5304tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg5364gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag5424tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt5484ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt5544taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt tcggggaaat5604gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg5664agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa5724catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac5784ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac5844atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt5904ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc5964gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca6024ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc6084ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag6144gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa6204ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg6264gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa6324ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg6384gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt6444gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt6504caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag6564cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat6624ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct6684taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct6744tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca6804gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc6864agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc6924aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct6984gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag7044gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc7104
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg7164agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag7224cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt7284gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac7344gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg7404ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc7464cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata7524cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt7584cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag7644gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga7704taacaatttc acacaggaaa cagctatgac catgattacg ccaagcgcgc aattaaccct7764cactaaaggg aacaaaagct gggtaccggg ccccccctcg aggtcgacgg tatcgataag7824cttgacgtcg aattcctgca gcc7847<210>19<211>684<212>PRT<213>Schizochytrium sp.
<400>19Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro180 185 190Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys
210 215 220Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 3l0 315 320Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala
530 535 540Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680<210>20<211>26<212>DNA<213>Schizochytrium sp.
<400>20ccggccaggt gcagacctct gctgtc 26<210>21<211>7847<212>DNA<213>Schizochytrium sp.
<220>
<221>prim_transcript<222>(1)..(1259)<223>
<220>
<221>突变<222>(1834)..(1835)<223>
<220>
<221>CDS<222>(1260)..(3314)<223>
<220>
<221>prim_transcript<222>(3315)..(4887)
<223>
<400>21ttgtcgacag caacttgcaa gttatacgcg accaccaggc aatctcagca cgcccagcga 60gcacggagct tgcgaagagg gtttacaagt cgtcgttcat tcgctctcaa gctttgcctc 120aacgcaacta ggcccaggcc tactttcact gtgtcttgtc ttgcctttca caccgaccga 180gtgtgcacaa ccgtgttttg cacaaagcgc aagatgctca ctcgactgtg aagaaaggtt 240gcgcgcaagc gactgcgact gcgaggatga ggatgactgg cagcctgttc aaaaactgaa 300aatccgcgat gggtcagtgc cattcgcgca tgacgcctgc gagagacaag ttaactcgtg 360tcactggcat gtcctagcat ctttacgcga gcaaaattca atcgctttat tttttcagtt 420tcgtaacctt ctcgcaaccg cgaatcgccg tttcagcctg actaatctgc agctgcgtgg 480cactgtcagt cagtcagtca gtcgtgcgcg ctgttccagc accgaggtcg cgcgtcgccg 540cgcctggacc gctgctgcta ctgctagtgg cacggcaggt aggagcttgt tgccggaaca 600ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg cgtcgaaggg agaggaaggc 660ggcgtgtgca aactaacgtt gaccactggc gcccgccgac acgagcagga agcaggcagc 720tgcagagcgc agcgcgcaag tgcagaatgc gcgaaagatc cacttgcgcg cggcgggcgc 780gcacttgcgg gcgcggcgcg gaacagtgcg gaaaggagcg gtgcagacgg cgcgcagtga 840cagtgggcgc aaagccgcgc agtaagcagc ggcggggaac ggtatacgca gtgccgcggg 900ccgccgcaca cagaagtata cgcgggccga agtggggcgt cgcgcgcggg aagtgcggaa 960tggcgggcaa ggaaaggagg agacggaaag agggcgggaa agagagagag agagagtgaa1020aaaagaaaga aagaaagaaa gaaagaaaga aagctcggag ccacgccgcg gggagagaga1080gaaatgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg1140gaggagcgcg cgcaggaccc gcgcggcgag cgagcgagca cggcgcgcga gcgagcgagc1200gagcgagcgc gcgagcgagc aaggcttgct gcgagcgatc gagcgagcga gcgggaagg 1259atg agc gcg acc cgc gcg gcg acg agg aca gcg gcg gcg ctg tcc tcg 1307Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15gcg ctg acg acg cct gta aag cag cag cag cag cag cag ctg cgc gta 1355Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30ggc gcg gcg tcg gca cgg ctg gcg gcc gcg gcg ttc tcg tcc ggc acg 1403Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45ggc gga gac gcg gcc aag aag gcg gcc gcg gcg agg gcg ttc tcc acg 1451Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60gga cgc ggc ccc aac gcg aca cgc gag aag agc tcg ctg gcc acg gtc 1499Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80cag gcg gcg acg gac gat gcg cgc ttc gtc ggc ctg acc ggc gcc caa 1547Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95atc ttt cat gag ctc atg cgc gag cac cag gtg gac acc atc ttt ggc 1595Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110tac cct ggc ggc gcc att ctg ccc gtt ttt gat gcc att ttt gag agt 1643Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125gac gcc ttc aag ttc att ctc gct cgc cac gag cag ggc gcc ggc cac 1691Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140atg gcc gag ggc tac gcg cgc gcc acg ggc aag ccc ggc gtt gtc ctc 1739Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160gtc acc tcg ggc cct gga gcc acc aac acc atc acc ccg atc atg gat 1787Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175gct tac atg gac ggt acg ccg ctg ctc gtg ttc acc ggc cag gtg cag 1835Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln180 185 190
acc tct gct gtc ggc acg gac gct ttc cag gag tgt gac att gtt ggc1883Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205atc agc cgc gcg tgc acc aag tgg aac gtc atg gtc aag gac gtg aag1931Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220gag ctc ccg cgc cgc atc aat gag gcc ttt gag att gcc atg agc ggc1979Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240cgc ccg ggt ccc gtg ctc gtc gat ctt cct aag gat gtg acc gcc gtt2027Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255gag ctc aag gaa atg ccc gac agc tcc ccc cag gtt gct gtg cgc cag2075Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270aag caa aag gtc gag ctt ttc cac aag gag cgc att ggc gct cct ggc2123Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285acg gcc gac ttc aag ctc att gcc gag atg atc aac cgt gcg gag cga2171Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300ccc gtc atc tat gct ggc cag ggt gtc atg cag agc ccg ttg aat ggc2219Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320ccg gct gtg ctc aag gag ttc gcg gag aag gcc aac att ccc gtg acc2267Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335acc acc atg cag ggt ctc ggc ggc ttt gac gag cgt agt ccc ctc tcc2315Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350ctc aag atg ctc ggc atg cac ggc tct gcc tac gcc aac tac tcg atg2363Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365cag aac gcc gat ctt atc ctg gcg ctc ggt gcc cgc ttt gat gat cgt2411Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380gtg acg ggc cgc gtt gac gcc ttt gct ccg gag gct cgc cgt gcc gag2459Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400cgc gag ggc cgc ggt ggc atc gtt cac ttt gag att tcc ccc aag aac2507Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415ctc cac aag gtc gtc cag ccc acc gtc gcg gtc ctc ggc gac gtg gtc2555Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430gag aac ctc gcc aac gtc acg ccc cac gtg cag cgc cag gag cgc gag2603Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445ccg tgg ttt gcg cag atc gcc gat tgg aag gag aag cac cct ttt ctg2651Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460ctc gag tct gtt gat tcg gac gac aag gtt ctc aag ccg cag cag gtc2699Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480ctc acg gag ctt aac aag cag att ctc gag att cag gag aag gac gcc2747Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495gac cag gag gtc tac atc acc acg ggc gtc gga agc cac cag atg cag2795Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510
gca gcg cag ttc ctt acc tgg acc aag ccg cgc cag tgg atc tcc tcg 2843Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525ggt ggc gcc ggc act atg ggc tac ggc ctt ccc tcg gcc att ggc gcc 2891Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540aag att gcc aag ccc gat gct att gtt att gac atc gat ggt gat gct 2939Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560tct tat tcg atg acc ggt atg gaa ttg atc aca gca gcc gaa ttc aag 2987Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575gtt ggc gtg aag att ctt ctt ttg cag aac aac ttt cag ggc atg gtc 3035Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590aag aac tgg cag gat ctc ttt tac gac aag cgc tac tcg ggc acc gcc 3083Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605atg ttc aac ccg cgc ttc gac aag gtc gcc gat gcg atg cgt gcc aag 3131Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620ggt ctc tac tgc gcg aaa cag tcg gag ctc aag gac aag atc aag gag 3179Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640ttt ctc gag tac gat gag ggt ccc gtc ctc ctc gag gtt ttc gtg gac 3227Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655aag gac acg ctc gtc ttg ccc atg gtc ccc gct ggc ttt ccg ctc cac 3275Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670gag atg gtc ctc gag cct cct aag ccc aag gac gcc taa gttctttttt 3324Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680ccatggcggg cgagcgagcg agcgcgcgag cgcgcaagtg cgcaagcgcc ttgccttgct3384ttgcttcgct tcgctttgct ttgcttcaca caacctaagt atgaattcaa gttttcttgc3444ttgtcggcga tgcctgcctg ccaaccagcc agccatccgg ccggccgtcc ttgacgcctt3504cgcttccggc gcggccatcg attcaattca cccatccgat acgttccgcc ccctcacgtc3564cgtctgcgca cgacccctgc acgaccacgc caaggccaac gcgccgctca gctcagcttg3624tcgacgagtc gcacgtcaca tatctcagat gcatttggac tgtgagtgtt attatgccac3684tagcacgcaa cgatcttcgg ggtcctcgct cattgcatcc gttcgggccc tgcaggcgtg3744gacgcgagtc gccgccgaga cgctgcagca ggccgctccg acgcgagggc tcgagctcgc3804cgcgcccgcg cgatgtctgc ctggcgccga ctgatctctg gagcgcaagg aagacacggc3864gacgcgagga ggaccgaaga gagacgctgg ggtatgcagg atatacccgg ggcgggacat3924tcgttccgca tacactcccc cattcgagct tgctcgtcct tggcagagcc gagcgcgaac3984ggttccgaac gcggcaagga ttttggctct ggtgggtgga ctccgatcga ggcgcaggtt4044ctccgcaggt tctcgcaggc cggcagtggt cgttagaaat agggagtgcc ggagtcttga4104cgcgccttag ctcactctcc gcccacgcgc gcatcgccgc catgccgccg tcccgtctgt4164cgctgcgctg gccgcgaccg gctgcgccag agtacgacag tgggacagag ctcgaggcga4224cgcgaatcgc tcgggttgta agggtttcaa gggtcgggcg tcgtcgcgtg ccaaagtgaa4284aatagtaggg gggggggggg gtacccaccc cgggcaggtt ctcctcgcca gcctaagtgc4344ctaagggagc gtaggggttt cgttgaccag agaagcggag aacctgccgc ggcgcggaga4404acctatcggc ggagaacttg ccaggcgcga ggcagttctc caatttgcgg acagcggcgc4464gcccacgcga ggcggccgcg tggcgataca gcgaggcgac cgcgcggggc cgcgtggcga4524cacagctgcg cgcggagtcg gctgcgagaa ggcttctcgc tggcttggtt ggggtcgcgg4584gtggcagggg atggatgccc aggtacgtcg gcgtgcgcgc gcccagggag aaaaggacag4644acgcgcgggc ctgcgatgcg agcacgcgat gcgagcacgc gatgcgagca cgcgatgcga4704gcacgcgagc gagcgcccga gcaaatgcca cggaacacgc gttttttgtt tggtgatttc4764tatgtatgcg gggagacttc gatggccgaa aggggtgcaa ggccaaaaga tgctgacagc4824ttcgatcggt ctacggcgcg agcaggaaag ggagcaaggg gcggaattct tctgccttga4884cccgggggat ccactagttc tagagcggcc gccaccgcgg tggagctcca attcgcccta4944
tagtgagtcg tattacgcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa5004ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa5064tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg5124ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac5184cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc5244cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt5304tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg5364gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag5424tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt5484ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt5544taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt tcggggaaat5604gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg5664agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa5724catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac5784ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac5844atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt5904ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc5964gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca6024ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc6084ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag6144gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa6204ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg6264gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa6324ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg6384gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt6444gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt6504caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag6564cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat6624ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct6684taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct6744tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca6804gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc6864agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc6924aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct6984gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag7044gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc7104tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg1164agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag7224cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt7284gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac7344gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg7404ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc7464cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata7524cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt7584cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag7644gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga7704taacaatttc acacaggaaa cagctatgac catgattacg ccaagcgcgc aattaaccct7764cactaaaggg aacaaaagct gggtaccggg ccccccctcg aggtcgacgg tatcgataag7824cttgacgtcg aattcctgca gcc7847<210>22<211>684<212>PRT<213>Schizochytrium sp.
<400>22Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val
20 25 30Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln180 185 190Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser
340 345 350Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His
660 665 670Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680<210>23<211>7847<212>DNA<213>Schizochytrium sp.
<220>
<221>prim_transcript<222>(1)..(1259)<223>
<220>
<221>CDS<222>(1260)..(3314)<223>
<220>
<221>prim_transcript<222>(3315)..(4887)<223>
<220>
<221>突变<222>(1834)..(1835)<223>
<220>
<221>突变<222>(3042)..(3044)<223>
<400>23ttgtcgacag caacttgcaa gttatacgcg accaccaggc aatctcagca cgcccagcga 60gcacggagct tgcgaagagg gtttacaagt cgtcgttcat tcgctctcaa gctttgcctc 120aacgcaacta ggcccaggcc tactttcact gtgtcttgtc ttgcctttca caccgaccga 180gtgtgcacaa ccgtgttttg cacaaagcgc aagatgctca ctcgactgtg aagaaaggtt 240gcgcgcaagc gactgcgact gcgaggatga ggatgactgg cagcctgttc aaaaactgaa 300aatccgcgat gggtcagtgc cattcgcgca tgacgcctgc gagagacaag ttaactcgtg 360tcactggcat gtcctagcat ctttacgcga gcaaaattca atcgctttat tttttcagtt 420tcgtaacctt ctcgcaaccg cgaatcgccg tttcagcctg actaatctgc agctgcgtgg 480cactgtcagt cagtcagtca gtcgtgcgcg ctgttccagc accgaggtcg cgcgtcgccg 540cgcctggacc gctgctgcta ctgctagtgg cacggcaggt aggagcttgt tgccggaaca 600ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg cgtcgaaggg agaggaaggc 660ggcgtgtgca aactaacgtt gaccactggc gcccgccgac acgagcagga agcaggcagc 720tgcagagcgc agcgcgcaag tgcagaatgc gcgaaagatc cacttgcgcg cggcgggcgc 780gcacttgcgg gcgcggcgcg gaacagtgcg gaaaggagcg gtgcagacgg cgcgcagtga 840cagtgggcgc aaagccgcgc agtaagcagc ggcggggaac ggtatacgca gtgccgcggg 900ccgccgcaca cagaagtata cgcgggccga agtggggcgt cgcgcgcggg aagtgcggaa 960tggcgggcaa ggaaaggagg agacggaaag agggcgggaa agagagagag agagagtgaa1020aaaagaaaga aagaaagaaa gaaagaaaga aagctcggag ccacgccgcg gggagagaga1080gaaatgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg1140gaggagcgcg cgcaggaccc gcgcggcgag cgagcgagca cggcgcgcga gcgagcgagc1200gagcgagcgc gcgagcgagc aaggcttgct gcgagcgatc gagcgagcga gcgggaagg 1259atg agc gcg acc cgc gcg gcg acg agg aca gcg gcg gcg ctg tcc tcg 1307Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15
gcg ctg acg acg cct gta aag cag cag cag cag cag cag ctg cgc gta1355Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30ggc gcg gcg tcg gca cgg ctg gcg gcc gcg gcg ttc tcg tcc ggc acg1403Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45ggc gga gac gcg gcc aag aag gcg gcc gcg gcg agg gcg ttc tcc acg1451Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60gga cgc ggc ccc aac gcg aca cgc gag aag agc tcg ctg gcc acg gtc1499Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80cag gcg gcg acg gac gat gcg cgc ttc gtc ggc ctg acc ggc gcc caa1547Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95atc ttt cat gag ctc atg cgc gag cac cag gtg gac acc atc ttt ggc1595Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110tac cct ggc ggc gcc att ctg ccc gtt ttt gat gcc att ttt gag agt1643Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125gac gcc ttc aag ttc att ctc gct cgc cac gag cag ggc gcc ggc cac1691Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140atg gcc gag ggc tac gcg cgc gcc acg ggc aag ccc ggc gtt gtc ctc1739Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160gtc acc tcg ggc cct gga gcc acc aac acc atc acc ccg atc atg gat1787Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175gct tac atg gac ggt acg ccg ctg ctc gtg ttc acc ggc cag gtg cag1835Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln180 185 190acc tct gct gtc ggc acg gac gct ttc cag gag tgt gac att gtt ggc1883Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205atc agc cgc gcg tgc acc aag tgg aac gtc atg gtc aag gac gtg aag1931Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220gag ctc ccg cgc cgc atc aat gag gcc ttt gag att gcc atg agc ggc1979Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240cgc ccg ggt ccc gtg ctc gtc gat ctt cct aag gat gtg acc gcc gtt2027Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255gag ctc aag gaa atg ccc gac agc tcc ccc cag gtt gct gtg cgc cag2075Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270aag caa aag gtc gag ctt ttc cac aag gag cgc att ggc gct cct ggc2123Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285acg gcc gac ttc aag ctc att gcc gag atg atc aac cgt gcg gag cga2171Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300ccc gtc atc tat gct ggc cag ggt gtc atg cag agc ccg ttg aat ggc2219Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320ccg gct gtg ctc aag gag ttc gcg gag aag gcc aac att ccc gtg acc2267Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335
acc acc atg cag ggt ctc ggc ggc ttt gac gag cgt agt ccc ctc tcc2315Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350ctc aag atg ctc ggc atg cac ggc tct gcc tac gcc aac tac tcg atg2363Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365cag aac gcc gat ctt atc ctg gcg ctc ggt gcc cgc ttt gat gat cgt2411Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380gtg acg ggc cgc gtt gac gcc ttt gct ccg gag gct cgc cgt gcc gag2459Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400cgc gag ggc cgc ggt ggc atc gtt cac ttt gag att tcc ccc aag aac2507Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415ctc cac aag gtc gtc cag ccc acc gtc gcg gtc ctc ggc gac gtg gtc2555Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430gag aac ctc gcc aac gtc acg ccc cac gtg cag cgc cag gag cgc gag2603Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445ccg tgg ttt gcg cag atc gcc gat tgg aag gag aag cac cct ttt ctg2651Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460ctc gag tct gtt gat tcg gac gac aag gtt ctc aag ccg cag cag gtc2699Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480ctc acg gag ctt aac aag cag att ctc gag att cag gag aag gac gcc2747Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495gac cag gag gtc tac atc acc acg ggc gtc gga agc cac cag atg cag2795Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510gca gcg cag ttc ctt acc tgg acc aag ccg cgc cag tgg atc tcc tcg2843Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525ggt ggc gcc ggc act atg ggc tac ggc ctt ccc tcg gcc att ggc gcc2891Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540aag att gcc aag ccc gat gct att gtt att gac atc gat ggt gat gct2939Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560tct tat tcg atg acc ggt atg gaa ttg atc aca gca gcc gaa ttc aag2987Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575gtt ggc gtg aag att ctt ctt ttg cag aac aac ttt cag ggc atg gtc3035Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590aag aac gtt cag gat ctc ttt tac gac aag cgc tac tcg ggc acc gcc3083Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605atg ttc aac ccg cgc ttc gac aag gtc gcc gat gcg atg cgt gcc aag3131Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620ggt ctc tac tgc gcg aaa cag tcg gag ctc aag gac aag atc aag gag3179Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640ttt ctc gag tac gat gag ggt ccc gtc ctc ctc gag gtt ttc gtg gac3227Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655
aag gac acg ctc gtc ttg ccc atg gtc ccc gct ggc ttt ccg ctc cac 3275Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670gag atg gtc ctc gag cct cct aag ccc aag gac gcc taa gttctttttt 3324Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680ccatggcggg cgagcgagcg agcgcgcgag cgcgcaagtg cgcaagcgcc ttgccttgct3384ttgcttcgct tcgctttgct ttgcttcaca caacctaagt atgaattcaa gttttcttgc3444ttgtcggcga tgcctgcctg ccaaccagcc agccatccgg ccggccgtcc ttgacgcctt3504cgcttccggc gcggccatcg attcaattca cccatccgat acgttccgcc ccctcacgtc3564cgtctgcgca cgacccctgc acgaccacgc caaggccaac gcgccgctca gctcagcttg3624tcgacgagtc gcacgtcaca tatctcagat gcatttggac tgtgagtgtt attatgccac3684tagcacgcaa cgatcttcgg ggtcctcgct cattgcatcc gttcgggccc tgcaggcgtg3744gacgcgagtc gccgccgaga cgctgcagca ggccgctccg acgcgagggc tcgagctcgc3804cgcgcccgcg cgatgtctgc ctggcgccga ctgatctctg gagcgcaagg aagacacggc3864gacgcgagga ggaccgaaga gagacgctgg ggtatgcagg atatacccgg ggcgggacat3924tcgttccgca tacactcccc cattcgagct tgctcgtcct tggcagagcc gagcgcgaac3984ggttccgaac gcggcaagga ttttggctct ggtgggtgga ctccgatcga ggcgcaggtt4044ctccgcaggt tctcgcaggc cggcagtggt cgttagaaat agggagtgcc ggagtcttga4104cgcgccttag ctcactctcc gcccacgcgc gcatcgccgc catgccgccg tcccgtctgt4164cgctgcgctg gccgcgaccg gctgcgccag agtacgacag tgggacagag ctcgaggcga4224cgcgaatcgc tcgggttgta agggtttcaa gggtcgggcg tcgtcgcgtg ccaaagtgaa4284aatagtaggg gggggggggg gtacccaccc cgggcaggtt ctcctcgcca gcctaagtgc4344ctaagggagc gtaggggttt cgttgaccag agaagcggag aacctgccgc ggcgcggaga4404acctatcggc ggagaacttg ccaggcgcga ggcagttctc caatttgcgg acagcggcgc4464gcccacgcga ggcggccgcg tggcgataca gcgaggcgac cgcgcggggc cgcgtggcga4524cacagctgcg cgcggagtcg gctgcgagaa ggcttctcgc tggcttggtt ggggtcgcgg4584gtggcagggg atggatgccc aggtacgtcg gcgtgcgcgc gcccagggag aaaaggacag4644acgcgcgggc ctgcgatgcg agcacgcgat gcgagcacgc gatgcgagca cgcgatgcga4704gcacgcgagc gagcgcccga gcaaatgcca cggaacacgc gttttttgtt tggtgatttc4764tatgtatgcg gggagacttc gatggccgaa aggggtgcaa ggccaaaaga tgctgacagc4824ttcgatcggt ctacggcgcg agcaggaaag ggagcaaggg gcggaattct tctgccttga4884cccgggggat ccactagttc tagagcggcc gccaccgcgg tggagctcca attcgcccta4944tagtgagtcg tattacgcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa5004ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa5064tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg5124ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac5184cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc5244cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt5304tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg5364gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag5424tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt5484ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt5544taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt tcggggaaat5604gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg5664agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa5724catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac5784ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac5844atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt5904ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc5964gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca6024ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc6084ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag6144gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa6204ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg6264gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa6324ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg6384gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt6444gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt6504caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag6564
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat6624ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct6684taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct6744tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca6804gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc6864agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc6924aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct6984gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag7044gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc7104tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg7164agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag7224cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt7284gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac7344gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg7404ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc7464cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata7524cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt7584cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag7644gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga7704taacaatttc acacaggaaa cagctatgac catgattacg ccaagcgcgc aattaaccct7764cactaaaggg aacaaaagct gggtaccggg ccccccctcg aggtcgacgg tatcgataag7824cttgacgtcg aattcctgca gcc7847<210>24<211>684<212>PRT<213>Schizochytrium sp.
<400>24Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp
165 170 175Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln180 185 190Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala
485 490 495Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680<210>25<211>18<212>DNA<213>Schizochytrium sp.
<400>25gttgaccagt gccgttcc 18<210>26<211>18<212>DNA<213>Schizochytrium sp.
<400>26cgaagtgcac gcagttgc 18<210>27<211>31<212>DNA<213>Schizochytrium sp.
<400>27
gcgcccatgg gacgtcaggt ggcacttttc g 31<210>28<211>36<212>DNA<213>Schizochytrium sp.
<400>28gcgcccatgg ccgcggcaag cagcagatta cgcgca 36<210>29<211>1263<212>DNA<213>秀丽新杆线虫(Caenorhabditis elegans)<220>
<221>CDS<222>(23)..(1228)<223>
<400>29gcggccgcga attcagatct cc atg gtc gct cac tcg tcg gag ggt ctc tcg 52Met Val Ala His Ser Ser Glu Gly Leu Ser1 5 10gcc acc gcc ccg gtc acc ggc ggc gac gtc ctc gtc gac gcc cgc gcc 100Ala Thr Ala Pro Val Thr Gly Gly Asp Val Leu Val Asp Ala Arg Ala15 20 25tcg ctc gag gag aag gag gcc ccg cgc gac gtc aac gcc aac acc aag 148Ser Leu Glu Glu Lys Glu Ala Pro Arg Asp Val Asn Ala Asn Thr Lys30 35 40cag gcc acc acc gag gag ccc cgc atc cag ctg ccc acc gtc gac gcc 196Gln Ala Thr Thr Glu Glu Pro Arg Ile Gln Leu Pro Thr Val Asp Ala45 50 55ttc cgc cgc gcc atc ccc gcc cac tgc ttc gag cgc gac ctc gtc aag 244Phe Arg Arg Ala Ile Pro Ala His Cys Phe Glu Arg Asp Leu Val Lys60 65 70tcg atc cgc tac ctc gtc cag gac ttc gcc gcc ctc acc atc ctc tac 292Ser Ile Arg Tyr Leu Val Gln Asp Phe Ala Ala Leu Thr Ile Leu Tyr75 80 85 90ttc gcc ctc ccc gcc ttc gag tac ttc ggc ctc ttc ggc tac ctc gtc 340Phe Ala Leu Pro Ala Phe Glu Tyr Phe Gly Leu Phe Gly Tyr Leu Val95 100 105tgg aac atc ttc atg ggc gtc ttc ggc ttc gcc ctc ttc gtc gtc ggc 388Trp Asn Ile Phe Met Gly Val Phe Gly Phe Ala Leu Phe Val Val Gly110 115 120cac gac tgc ctc cac gga agc ttc tcg gac aac cag aac ctc aac gac 436His Asp Cys Leu His Gly Ser Phe Ser Asp Asn Gln Asn Leu Asn Asp125 130 135ttc atc ggc cac atc gcc ttc tcg ccc ctc ttc tcg ccc tac ttc ccc 484Phe Ile Gly His Ile Ala Phe Ser Pro Leu Phe Ser Pro Tyr Phe Pro140 145 150tgg cag aag tcg cac aag ctc cac cac gcc ttc acc aac cac atc gac 532Trp Gln Lys Ser His Lys Leu His His Ala Phe Thr Asn His Ile Asp155 160 165 170aag gac cac ggc cac gtc tgg atc cag gac aag gac tgg gag gcc atg 580Lys Asp His Gly His Val Trp Ile Gln Asp Lys Asp Trp Glu Ala Met175 180 185ccc tcg tgg aag cgc tgg ttc aac ccc atc ccc ttc tcg ggc tgg ctc 628Pro Ser Trp Lys Arg Trp Phe Asn Pro Ile Pro Phe Ser Gly Trp Leu190 195 200
aag tgg ttc ccc gtc tac acc ctc ttc ggc ttc tgc gac ggc tcg cac 676Lys Trp Phe Pro Val Tyr Thr Leu Phe Gly Phe Cys Asp Gly Ser His205 210 215ttc tgg ccc tac tcg tcg ctc ttc gtc cgc aac tcg gac cgc gtc cag 724Phe Trp Pro Tyr Ser Ser Leu Phe Val Arg Asn Ser Asp Arg Val Gln220 225 230tgc gtg atc agc ggc atc tgc tgc tgc gtc tgc gcc tac atc gcc ctc 772Cys Val Ile Ser Gly Ile Cys Cys Cys Val Cys Ala Tyr Ile Ala Leu235 240 245 250acc atc gcc ggc tcg tac tcg aac tgg ttc tgg tac tac tgg gtc ccg 820Thr Ile Ala Gly Ser Tyr Ser Asn Trp Phe Trp Tyr Tyr Trp Val Pro255 260 265ctc tcg ttc ttc ggc ctc atg ctc gtc atc gtc acc tac ctg cag cac 868Leu Ser Phe Phe Gly Leu Met Leu Val Ile Val Thr Tyr Leu Gln His270 275 280gtc gac gac gtc gcc gag gtc tac gag gcc gac gag tgg tcg ttc gtc 916Val Asp Asp Val Ala Glu Val Tyr Glu Ala Asp Glu Trp Ser Phe Val285 290 295cgc ggc cag acc cag acc atc gac cgc tac tac ggc ctc ggc ctc gac 964Arg Gly Gln Thr Gln Thr Ile Asp Arg Tyr Tyr Gly Leu Gly Leu Asp300 305 310acc acc atg cac cac atc acc gac ggc cac gtg gcc cac cac ttc ttc1012Thr Thr Met His His Ile Thr Asp Gly His Val Ala His His Phe Phe315 320 325 330aac aag atc ccg cac tac cac ctc atc gag gcc acc gag ggc gtc aag1060Asn Lys Ile Pro His Tyr His Leu Ile Glu Ala Thr Glu Gly Val Lys335 340 345aag gtc ctc gag ccc ctc tcg gac acc cag tac ggc tac aag tcg cag1108Lys Val Leu Glu Pro Leu Ser Asp Thr Gln Tyr Gly Tyr Lys Ser Gln350 355 360gtc aac tac gac ttc ttc gcc cgc ttc ctc tgg ttc aac tac aag ctc1156Val Asn Tyr Asp Phe Phe Ala Arg Phe Leu Trp Phe Asn Tyr Lys Leu365 370 375gac tac ctc gtg cac aag acc gcc ggc atc atg cag ttc cgc acc acc1204Asp Tyr Leu Val His Lys Thr Ala Gly Ile Met Gln Phe Arg Thr Thr380 385 390ctc gag gag aag gcc aag gcc aag taacccgggg gtacccttaa ggcatgcgcg 1258Leu Glu Glu Lys Ala Lys Ala Lys395 400gccgc 1263<210>30<211>402<212>PRT<213>秀丽新杆线虫(Caenorhabditis elegans)<400>30Met Val Ala His Ser Ser Glu Gly Leu Ser Ala Thr Ala Pro Val Thr1 5 10 15Gly Gly Asp Val Leu Val Asp Ala Arg Ala Ser Leu Glu Glu Lys Glu20 25 30Ala Pro Arg Asp Val Asn Ala Asn Thr Lys Gln Ala Thr Thr Glu Glu35 40 45Pro Arg Ile Gln Leu Pro Thr Val Asp Ala Phe Arg Arg Ala Ile Pro50 55 60Ala His Cys Phe Glu Arg Asp Leu Val Lys Ser Ile Arg Tyr Leu Val
65 70 75 80Gln Asp Phe Ala Ala Leu Thr Ile Leu Tyr Phe Ala Leu Pro Ala Phe85 90 95Glu Tyr Phe Gly Leu Phe Gly Tyr Leu Val Trp Asn Ile Phe Met Gly100 105 110Val Phe Gly Phe Ala Leu Phe Val Val Gly His Asp Cys Leu His Gly115 120 125Ser Phe Ser Asp Asn Gln Asn Leu Asn Asp Phe Ile Gly His Ile Ala130 135 140Phe Ser Pro Leu Phe Ser Pro Tyr Phe Pro Trp Gln Lys Ser His Lys145 150 155 160Leu His His Ala Phe Thr Asn His Ile Asp Lys Asp His Gly His Val165 170 175Trp Ile Gln Asp Lys Asp Trp Glu Ala Met Pro Ser Trp Lys Arg Trp180 185 190Phe Asn Pro Ile Pro Phe Ser Gly Trp Leu Lys Trp Phe Pro Val Tyr195 200 205Thr Leu Phe Gly Phe Cys Asp Gly Ser His Phe Trp Pro Tyr Ser Ser210 215 220Leu Phe Val Arg Asn Ser Asp Arg Val Gln Cys Val Ile Ser Gly Ile225 230 235 240Cys Cys Cys Val Cys Ala Tyr Ile Ala Leu Thr Ile Ala Gly Ser Tyr245 250 255Ser Asn Trp Phe Trp Tyr Tyr Trp Val Pro Leu Ser Phe Phe Gly Leu260 265 270Met Leu Val Ile Val Thr Tyr Leu Gln His Val Asp Asp Val Ala Glu275 280 285Val Tyr Glu Ala Asp Glu Trp Ser Phe Val Arg Gly Gln Thr Gln Thr290 295 300Ile Asp Arg Tyr Tyr Gly Leu Gly Leu Asp Thr Thr Met His His Ile305 310 315 320Thr Asp Gly His Val Ala His His Phe Phe Asn Lys Ile Pro His Tyr325 330 335His Leu Ile Glu Ala Thr Glu Gly Val Lys Lys Val Leu Glu Pro Leu340 345 350Ser Asp Thr Gln Tyr Gly Tyr Lys Ser Gln Val Asn Tyr Asp Phe Phe355 360 365Ala Arg Phe Leu Trp Phe Asn Tyr Lys Leu Asp Tyr Leu Val His Lys370 375 380Thr Ala Gly Ile Met Gln Phe Arg Thr Thr Leu Glu Glu Lys Ala Lys
385 390 395 400Ala Lys<210>31<211>570<212>DNA<213>秀丽新杆线虫(Caenorhabditis elegans)<400>31agcagcagat tgcccgaggc cggcggaagg gacgaggccc aggcggctcg tgaaagcgca 60tttccgaagg cgggctcggc gacgacgccg gcgcggcgac gacggccctg ccggaccggg120cctggggtgg acggcgaggc taactaggac ttggggaagc cgagctgagc gacttgagcg180ggttgagggg acgaactgtt taggcgcggc cgagtcgtca gagccagcct gtggagaaag240aggcgccgcc gagtgcgacg gggaacgctg cgccgacctc gcattgcacc gcatcgcawt300cgcaccgcaw tcgcaccgca ccgcatcgca ccgcatcgca tcgagacccg acgcagcgag360acgcgacgct gggccttccc ggcgaaaaaa agtgatctgg cttacaaatc ccgagacgag420acagacgtcg gcagcagaaa cgaatcagtc gagcagcagc tgcagcagca gcagcagcag480cagcagccca tcgcgagcaa gggctcagcc agcagaacac caatcaggcc aagaatcgca540cggaagcaag ccttgacatc ctttgccaac 570<210>32<211>18<212>DNA<213>Schizochytrium sp.
<400>32gacccgtcat ctatgctg 18<210>33<211>18<212>DNA<213>Schizochytrium sp.
<400>33ctcaaagtga acgatgcc 18<210>34<211>4244<212>DNA<213>Schizochytrium sp.
<400>34tttctctctc tcgagctgtt gctgctgctg ctgctgctgc tgcttccttg ctggttctca 60cgtccgttcg atcaagcgct cgctcgctcg accgatcggt gcgtgcgtgc gtgcgtgagt 120cttgttgcca ggcagccgca ggctgtctgt ctgtttgtgt agttttaccc tcggggttcg 180gggtctgcct gcctcccgct cccgcccgcc gccgcccgta tccaccccgc tcgcctccgc 240ccatcgggcc tcgcctcctc gcgccgcacg catcgcgcgc atcgcatgca tcatgctgcc 300acgcacgggg ggacgcgcgc cccgcgtccc ccgccgccgc cgtcgtcgtc tggcgatgcc 360gtcgccgccc tccttccttc cctcgcctcc tcttcctccc gagcccccct gtcttccttc 420gcccccgcag cggcgcgcag gaagcgagga gagcggggag gagagaagaa aagaaaagaa 480aagaaaagaa aataacagcg ccgtctcgcg cagacgcgcg cggccgcgtg cgaggcggcg 540tgatggggct tctcgtggcg cggctgcggc ctggcccggc ctcgcctttg aggtgcaggc 600tttgggagag aagagtggga cgcggagaag ataagatggt gccatggcgc aggacggaga 660ggttgctgaa acttcttcga gcggcacagg cgatggcgag agaccgacag ctgccggcgc 720ggaggggatg gatacctccc gaggctggca tggacgagct ggccgcgcgg atctggctgg 780ccgcgcggcg gtgggtccgg aggcgcgagg ttggttttct tcatacctga taccatacgg 840tattcattct tcctctccag gaaggaagca agtcacatag agtatcacta gcctaatgat 900ggactctatg ttttagggca cgtcggagca gaaggcgcga gcgattcgaa tgcgagcgat 960
agatacagca cagagacctt gccggcgacg cggatgcagg cgagcacgca cgcaccgcac1020gcacggcagc ggtgcacgcg ctcctcggca gatgcacggt tctgcgccgc gcctttacat1080tttttgattt taggtggtgt gcctgccact ttgaacatca tccacaagtc aacgcagcat1140caagaggcaa gcaagtacat acatccattc gaattcaagt tcaagagacg cagcaacagc1200cgccgctccg ctcaagctgc agctagctgg ctgacagggc tcgctggctg tagtggaaaa1260ttccattcac ttttctgcat ccgcggccag caggcccgta cgcacgttct ctcgtttgtt1320tgttcgttcg tgcgtgcgtg cgtgcgtccc agctgcctgt ctaatctgcc gcgcgatcca1380acgaccctcg gtcgtcgccg caagcgaaac ccgacgccga cctggccaat gccgcaagaa1440tgctaagcgc gcagcaatgc tgagagtaat cttcagccca ccaagtcatt atcgctgccc1500aagtctccat cgcagccaca ttcaggcttt ctctctctct ccctccctct ctttctgccg1560ggagagaagg aaagacccgc cgccgccgcc tctgcgcctg tgacgggctg tccgttgtaa1620gccctcttag acagttccta ggtgccgggc gccgccgcgc ctccgtcgca ggcacacgta1680ggcggccacg ggttcccccc gcaccttcca caccttcttc ccccgcagcc ggaccgcgcg1740ccgtctgctt acgcacttcg cgcggccgcc gcccgcgaac ccgagcgcgt gctgtgggcg1800ccgtcttccg gccgcgtcgg aggtcgtccc cgcgccgcgc tactccgggt cctgtgcggt1860acgtacttaa tattaacagt gggacctcgc acaggacctg acggcagcac agacgtcgcc1920gcctcgcatc gctggggacg caggcgaggc atcccggcgc ggccccgcac cggggaggct1980gcggggcggc ctcttccggc cggcggccgc atcaggcgga tgacgcaaga gccctcgcag2040tcgctcgctc gcgggagcgc agcgcggcgc cagcgtggcc aagctcccgc cccttctggc2100tggctgcatg cctgcctgcc tgcctgcctg cgtgcgtgcg tgcgtgcgtg ccttcgtgcg2160tgcctgcctt cgtgcgtgcg tgcgtgagtg cggcggaaga gggatcatgc gaggatcaat2220cacccgccgc acctcgactt ttgaagaagc cgcgatgcga tgcgatgcga tgcgatgcga2280cgcgataccg tgcgaggcta cgaagcgagt ctggccggcc gtcatacaac gcacgttttc2340gagaaggagg gctggcggag gcgtgcatgc cggcgaccat tgcgaacgcg gcgtctcgtg2400gctggcgaag gtgcctggag gatctaacga tcgctgctat gatgctatag ctgtgctgat2460ccccggtcca ttccaccacg tctgtgcctg ccgcctgacc tgcgcttggc tttccttcaa2520gttctcctcc gccgggcctt caggaccgag acgagacctg cagctgcagc tagactcgcg2580ctcgctcgcg gaggattcgc cggccgccgg gccggacggg actcgcgagg tcacacggcc2640gccggcgatc gcgatggctg tgctgacgta ctcgtgcgtg gcagccgtac gtcagcgacg2700ccgcctccgt attgtggatt cgttagttgg ttgttggttg atttgttgat taattttttt2760gttcgtaggc ttggttatag ctaatagttt agtttatact ggtgctcttc ggtgctgatt2820tagctcgact tgggtccaca ccactgcccc tctactgtga atggatcaat ggacgcacga2880cgggccgacg aaagtgcgcg agtgaggtaa cctaagcaac ggcggtcttc agaggggacg2940cacgccctcc gtcgcagtca gtccagacag gcagaaaagc gtcttaggga ccacgcacgc3000acgcacgcac gcacgcacgc ccgcacgcac gctccctccc tcgcgtgcct atttttttag3060gcttccttcc gcacgggcct acctctcgct ccctcgcctc gccgcaccag gcggcagcag3120cgatacctgc cggtgccgcc tccgtcacgc gctcagccgc agctcagccc agccgcgagc3180tagggtttgt tcgtcctgaa ttgtttgatt tgatttgatt tgatttgatc cgatccgatc3240cgatctgatc tgatttgctt tgctttgctt tgtctccctc ccggcgcgga ccaagcgtcc3300gtctgcgcgc cgcagcttcc cttcttctcc cagccctcct tctgctcccg cctctcgcgc3360aagcacgcag cttcgccgcc gcatccggtc ggtcggtcgg tcgatcgacc cgcctgccgc3420tgctgctgtg gccgggcttt tctccatcgg cgactctttc ttctccatac gtcctactac3480gtacatacat actgccggct tcctcctctt ccagcgcggc gacggcggca ggctgcgacg3540tcgtcgccgc cgcgggcgcc gcgcgcgccg ccgccgccgc ccgcgtcgca gggcctcgtc3600gccgccgccg ctccgctccg ctccgaggcc gcgagagggc cgcggcggcg cgatggatgg3660atggatggat ggatggatgg atggattttg ttgatcgatg gcggcgcatg ggcggagatg3720agcgaggacg agcgcgcgag cgcggcagcc ggattcgcag ggcctcgctc gcctcgcgcc3780cgctgccgcg cccgccttgc gagcctgcgc cgcgagcgag cgagcgagcg agcggggctt3840tctttgtctc gcgcgccgct tggcctcgtg tgtcttgtgc ttgcgtagcg ggcgccgcgg3900tggaagatgg ctcattcaat cgacccattc acgcacgcac tccggcgcgc agagaaggcc3960gaggaggagc agcaagcaaa ccaaaagctc tcgcgctcgc ggtctcgggc tcgagcggtc4020tcggagagag agtcttgcgg cgaccaccgg cagcagcagc agcagcagca gcgctgtcga4080gcacgagcac gagcacgagc acgagcacga gcattcgagc aagaggacag acacggttgt4140cagcgcctag ctcgctcgat acagaaagag gcgggttggg cgtaaaaaaa aaggagcacg4200caagccgcca gccagccagc tagctagcca gcctgcctgc caaa 4244<210>35<211>4244<212>DNA<213>Schizochytrium sp.
<400>35tttctctctc tcgagctgtt gctgctgctg ctgctgctgc tgcttccttg ctggttctca 60cgtccgttcg atcaagcgct cgctcgctcg accgatcggt gcgtgcgtgc gtgcgtgagt 120cttgttgcca ggcagccgca ggctgtctgt ctgtttgtgt agttttaccc tcggggttcg 180gggtctgcct gcctcccgct cccgcccgcc gccgcccgta tccaccccgc tcgcctccgc 240ccatcgggcc tcgcctcctc gcgccgcacg catcgcgcgc atcgcatgca tcatgctgcc 300acgcacgggg ggacgcgcgc cccgcgtccc ccgccgccgc cgtcgtcgtc tggcgatgcc 360gtcgccgccc tccttccttc cctcgcctcc tcttcctccc gagcccccct gtcttccttc 420gcccccgcag cggcgcgcag gaagcgagga gagcggggag gagagaagaa aagaaaagaa 480aagaaaagaa aataacagcg ccgtctcgcg cagacgcgcg cggccgcgtg cgaggcggcg 540tgatggggct tctcgtggcg cggctgcggc ctggcccggc ctcgcctttg aggtgcaggc 600tttgggagag aagagtggga cgcggagaag ataagatggt gccatggcgc aggacggaga 660ggttgctgaa acttcttcga gcggcacagg cgatggcgag agaccgacag ctgccggcgc 720ggaggggatg gatacctccc gaggctggca tggacgagct ggccgcgcgg atctggctgg 780ccgcgcggcg gtgggtccgg aggcgcgagg ttggttttct tcatacctga taccatacgg 840tattcattct tcctctccag gaaggaagca agtcacatag agtatcacta gcctaatgat 900ggactctatg ttttagggca cgtcggagca gaaggcgcga gcgattcgaa tgcgagcgat 960agatacagca cagagacctt gccggcgacg cggatgcagg cgagcacgca cgcaccgcac1020gcacggcagc ggtgcacgcg ctcctcggca gatgcacggt tctgcgccgc gcctttacat1080tttttgattt taggtggtgt gcctgccact ttgaacatca tccacaagtc aacgcagcat1140caagaggcaa gcaagtacat acatccattc gaattcaagt tcaagagacg cagcaacagc1200cgccgctccg ctcaagctgc agctagctgg ctgacagggc tcgctggctg tagtggaaaa1260ttccattcac ttttctgcat ccgcggccag caggcccgta cgcacgttct ctcgtttgtt1320tgttcgttcg tgcgtgcgtg cgtgcgtccc agctgcctgt ctaatctgcc gcgcgatcca1380acgaccctcg gtcgtcgccg caagcgaaac ccgacgccga cctggccaat gccgcaagaa1440tgctaagcgc gcagcaatgc tgagagtaat cttcagccca ccaagtcatt atcgctgccc1500aagtctccat cgcagccaca ttcaggcttt ctctctctct ccctccctct ctttctgccg1560ggagagaagg aaagacccgc cgccgccgcc tctgcgcctg tgacgggctg tccgttgtaa1620gccctcttag acagttccta ggtgccgggc gccgccgcgc ctccgtcgca ggcacacgtal680ggcggccacg ggttcccccc gcaccttcca caccttcttc ccccgcagcc ggaccgcgcg1740ccgtctgctt acgcacttcg cgcggccgcc gcccgcgaac ccgagcgcgt gctgtgggcg1800ccgtcttccg gccgcgtcgg aggtcgtccc cgcgccgcgc tactccgggt cctgtgcggt1860acgtacttaa tattaacagt gggacctcgc acaggacctg acggcagcac agacgtcgcc1920gcctcgcatc gctggggacg caggcgaggc atcccggcgc ggccccgcac cggggaggct1980gcggggcggc ctcttccggc cggcggccgc atcaggcgga tgacgcaaga gccctcgcag2040tcgctcgctc gcgggagcgc agcgcggcgc cagcgtggcc aagctcccgc cccttctggc2100tggctgcatg cctgcctgcc tgcctgcctg cgtgcgtgcg tgcgtgcgtg ccttcgtgcg2160tgcctgcctt cgtgcgtgcg tgcgtgagtg cggcggaaga gggatcatgc gaggatcaat2220cacccgccgc acctcgactt ttgaagaagc cgcgatgcga tgcgatgcga tgcgatgcga2280cgcgataccg tgcgaggcta cgaagcgagt ctggccggcc gtcatacaac gcacgttttc2340gagaaggagg gctggcggag gcgtgcatgc cggcgaccat tgcgaacgcg gcgtctcgtg2400gctggcgaag gtgcctggag gatctaacga tcgctgctat gatgctatag ctgtgctgat2460ccccggtcca ttccaccacg tctgtgcctg ccgcctgacc tgcgcttggc tttccttcaa2520gttctcctcc gccgggcctt caggaccgag acgagacctg cagctgcagc tagactcgcg2580ctcgctcgcg gaggattcgc cggccgccgg gccggacggg actcgcgagg tcacacggcc2640gccggcgatc gcgatggctg tgctgacgta ctcgtgcgtg gcagccgtac gtcagcgacg2700ccgcctccgt attgtggatt cgttagttgg ttgttggttg atttgttgat taattttttt2760gttcgtaggc ttggttatag ctaatagttt agtttatact ggtgctcttc ggtgctgatt2820tagctcgact tgggtccaca ccactgcccc tctactgtga atggatcaat ggacgcacga2880cgggccgacg aaagtgcgcg agtgaggtaa cctaagcaac ggcggtcttc agaggggacg2940cacgccctcc gtcgcagtca gtccagacag gcagaaaagc gtcttaggga ccacgcacgc3000acgcacgcac gcacgcacgc ccgcacgcac gctccctccc tcgcgtgcct atttttttag3060gcttccttcc gcacgggcct acctctcgct ccctcgcctc gccgcaccag gcggcagcag3120cgatacctgc cggtgccgcc tccgtcacgc gctcagccgc agctcagccc agccgcgagc3180tagggtttgt tcgtcctgaa ttgtttgatt tgatttgatt tgatttgatc cgatccgatc3240cgatctgatc tgatttgctt tgctttgctt tgtctccctc ccggcgcgga ccaagcgtcc3300gtctgcgcgc cgcagcttcc cttcttctcc cagccctcct tctgctcccg cctctcgcgc3360aagcacgcag cttcgccgcc gcatccggtc ggtcggtcgg tcgatcgacc cgcctgccgc3420tgctgctgtg gccgggcttt tctccatcgg cgactctttc ttctccatac gtcctactac3480
gtacatacat actgccggct tcctcctctt ccagcgcggc gacggcggca ggctgcgacg3540tcgtcgccgc cgcgggcgcc gcgcgcgccg ccgccgccgc ccgcgtcgca gggcctcgtc3600gccgccgccg ctccgctccg ctccgaggcc gcgagagggc cgcggcggcg cgatggatgg3660atggatggat ggatggatgg atggattttg ttgatcgatg gcggcgcatg ggcggagatg3720agcgaggacg agcgcgcgag cgcggcagcc ggattcgcag ggcctcgctc gcctcgcgcc3780cgctgccgcg cccgccttgc gagcctgcgc cgcgagcgag cgagcgagcg agcggggctt3840tctttgtctc gcgcgccgct tggcctcgtg tgtcttgtgc ttgcgtagcg ggcgccgcgg3900tggaagatgg ctcattcaat cgacccattc acgcacgcac tccggcgcgc agagaaggcc3960gaggaggagc agcaagcaaa ccaaaagctc tcgcgctcgc ggtctcgggc tcgagcggtc4020tcggagagag agtcttgcgg cgaccaccgg cagcagcagc agcagcagca gcgctgtcga4080gcacgagcac gagcacgagc acgagcacga gcattcgagc aagaggacag acacggttgt4140cagcgcctag ctcgctcgat acagaaagag gcgggttggg cgtaaaaaaa aaggagcacg4200caagccgcca gccagccagc tagctagcca gcctgcctgc caaa 424权利要求
1.分离的核酸分子,包含选自如下的核酸序列a.SEQ ID NO9的核苷酸441-894;b.与SEQ ID NO9的核苷酸441-894全长有至少约95%相同的核酸序列,其中所述核酸序列具有至少基本的α-微管蛋白启动子转录活性;和c.分离的多核苷酸,包含与所述多核苷酸(a)或(b)完全互补的核酸序列。
2.权利要求1的分离的核酸分子,其中所述分离的核酸分子包含SEQID NO4的核酸序列或包含SEQ ID NO9的核苷酸441-894。
3.用于转化破囊壶菌目微生物的重组载体,包含可操作性连接到如下启动子的编码博来霉素结合蛋白的核酸序列破囊壶菌目α-微管蛋白启动子,破囊壶菌目乙酰乳酸合酶启动子,来自破囊壶菌目聚酮化合物合酶(PKS)系统的启动子,或破囊壶菌目脂肪酸脱氢酶启动子。
4.权利要求3的重组载体,其中所述破囊壶菌目乙酰乳酸合酶启动子包含SEQ ID NO14的核苷酸1-1259。
5.权利要求3的重组载体,其中所述α-微管蛋白启动子包含SEQ IDNO9的核苷酸441-894,或包含与SEQ ID NO9的核苷酸441-894全长有至少约95%相同的核酸序列,其中所述核酸序列具有至少基本的α-微管蛋白启动子转录活性。
6.权利要求3的重组载体,其中所述重组载体包含选自SEQ ID NO8或SEQ ID NO9的核酸序列。
7.权利要求3的重组载体,其中所述来自破囊壶菌目聚酮化合物合酶(PKS)系统的启动子包含SEQ ID NO34或其至少具有基本的PKS启动子转录活性的片段。
全文摘要
本发明公开了均来自破囊壶菌目微生物的乙酰乳酸合酶,乙酰乳酸合酶调控区,α-微管蛋白启动子,来自破囊壶菌目聚酮化合物合酶(PKS)系统的启动子,和脂肪酸脱氢酶启动子的核酸和氨基酸序列。本发明也公开了用于破囊壶菌目微生物转化的重组载体,和转化破囊壶菌目微生物的方法。所述本发明的重组核酸分子可被用于外源核酸在破囊壶菌目微生物的表达,和基因在破囊壶菌目微生物的去除,突变,或灭活。
文档编号C12N1/21GK1861795SQ200610084268
公开日2006年11月15日 申请日期2002年4月16日 优先权日2001年4月16日
发明者保罗·G·罗斯勒, T·戴夫·马修斯, 汤姆·M·拉姆西尔, 詹姆斯·G·梅茨 申请人:马泰克生物科学公司