专利名称:台勾霉素的生物合成基因簇及其应用的利记博彩app
技术领域:
本发明属于微生物基因工程领域,具体涉及抗生素台勾霉素的生物合成基因簇的 克隆、分析、功能研究及其应用。
背景技术:
近年来,抗生素的滥用导致了各种耐药菌的出现,直接威胁人类的生命和健康。艰 难梭菌(Clostridium difficile)就是其中的一种。艰难梭菌引起的腹泻(Clostridium difficile-associateddiarrhoea, CDAD)已经成为困挠人类健康的一个严重的问题 (Johnson,2007),另外,部分抗生素腹泻(antibiotic-associated diarrhea, AAD)和大部 分抗生素性结膜炎(antibiotic associatedcolitis,AAC)也是由艰难梭菌引起的(Gerber & Ackermann,2008 ;Y-K ·舒;C-K ·王;Y-H 邱;A ·罗梅罗;F ·巴巴卡尼;P ·西尔斯; F·奥库姆,200 。这些疾病成为卫生保健体系的主要经济负担,据保守估计,美国医院每 年都为此花费30-60亿美元(Kyne et al.,2002 ;Y-K ·舒;C-K ·王;Y-H 邱;A ·罗梅罗; F ·巴巴卡尼;P ·西尔斯;F ·奥库姆,2005)。大环内酯类抗生素台勾霉素(tiacumicins, 又称lipiarmycins),具有抗各种细菌病原体的活性,特别是针对艰难梭菌有明显的抗菌 活性(Ackermann et al. ,2004 ;Karlowsky et al.,2008)。台勾霉素是一系列 18 元环 大环内酯类抗生素的总称,由放线菌指孢囊菌Dactylosporangium aurantiacum subsp. hamdenensis NRRL 18085,游动放线菌 Actinoplanes deccanensis ATCC 21983 和小孢链 菌 Catellatospora sp. Bp3323_81 等产生(Coronelli et al. , 1975 ;Hochlowski et al., 1987 ;Kurabachew et al. ,2008) 研究发现台勾霉素中台勾霉素B (Tiacumicin B)是最 好的活性组分,其拥有两个脱氧糖基和一个芳香环支链,C-18为R-羟基(见图1),对艰难 梭菌具有较低的最小抑制浓度(MIC)值,体外对艰难梭菌的抗菌活性为万古霉素的8-10倍 (Y-K ·舒;C-K ·王;Y-H 邱;A ·罗梅罗;F ·巴巴卡尼;P ·西尔斯;F ·奥库姆,2005)。目 前该药物已经进入到三期临床试验阶段(Louie et al. ,2009 ;Shue et al.,2008)。最近 有报道表明,台勾霉素B也具有很好的抗结核分枝杆菌(Mycobacteriumtuberculosis)活 性(Kurabachew et al.,2008)和体外抗癌活性(Wu et al. ,2009) 因此,这种针对革兰氏 阳性细菌的高效新型抗生素具有很大的潜力开发成新药(Gerber & Ackermarm,2008)。近年来蓬勃发展起来的组合生物合成技术,为改造台勾霉素的生产菌指孢囊菌 NRRL18085带来了新的机遇。在阐明了自然界的生物合成途径、理解自然界聚酮化合物天然 组合生物合成机理的基础上,人们可以采用组合生物合成技术对抗生素的生物合成基因、 调控基因进行体内敲除、突变、置换和重组等操作,不但能够生产“非天然”的天然产物结构 类似物,而且还可以提高天然产物的产量,或定向积累所需要的天然产物,为天然产物的发 现和药物开发提供分子和活性多样性。
发明内容
本发明的第一个目的在于提供一种台勾霉素的生物合成基因簇。
本发明的台勾霉素的生物合成基因簇,其特征在于,该生物合成基因簇的核苷酸 序列如SEQ ID NO. 1所示,包含31个基因,具体为1)聚酮合成酶基因,即tiaAl、tiaA2、tiaA3、tiaA4共4个基因tiaAl位于基因簇核苷酸序列第41491-57180个碱基处,长度为15690个碱基对, 编码聚酮合成酶,5229个氨基酸;tiaA2位于基因簇核苷酸序列第57186-66803个碱基处,长度为9618个碱基对,编 码聚酮合成酶,3205个氨基酸;tiaA3位于基因簇核苷酸序列第66拟9_71337个碱基处,长度为4509个碱基对,编 码聚酮合成酶,1502个氨基酸;tiaA4位于基因簇核苷酸序列第71361-81746个碱基处,长度为10386个碱基对, 编码聚酮合成酶,3461个氨基酸;2)脱氧糖基的生物合成基因,即 tiaSl、tiaS2、tiaS3、tiaS4、tiaS5、tiaS6、 tiaGl、tiaG2 共 8 个基因tiaSl位于基因簇核苷酸序列第8508-7492个碱基处,长度为1017个碱基对,编码 ⑶P-D-甘露糖4,6-脱水酶,338个氨基酸;tiaS2位于基因簇核苷酸序列第9742-8534个碱基处,长度为1209个碱基对,编码 C-甲基转移酶,402个氨基酸;tiaS3位于基因簇核苷酸序列第10785-9787个碱基处,长度为999个碱基对,编码 ⑶P-甘露糖4,6-脱水酶,332个氨基酸;tiaS4位于基因簇核苷酸序列第21789-22820个碱基处,长度为1032个碱基对,编 码⑶P-甘露糖4,6-脱水酶,343个氨基酸;tiaS5位于基因簇核苷酸序列第33022-34347个碱基处,长度为13 个碱基对,编 码糖0-甲基转移酶,441个氨基酸;tiaS6位于基因簇核苷酸序列第38882-40021个碱基处,长度为1140个碱基对,编 码0-酰基转移酶,379个氨基酸;tiaGl位于基因簇核苷酸序列第7441-6044个碱基处,长度为1398个碱基对,编码 糖基转移酶,465个氨基酸;tiaG2位于基因簇核苷酸序列第20351-21772个碱基处,长度为1422个碱基对,编 码糖基转移酶,473个氨基酸;3) 2,4-二羟基-3,5-二氯-6-乙基苯甲酸合成酶基因,即tiaE、tiaF、tiaB、tiaM 共4个基因tiaE位于基因簇核苷酸序列第14006-13260个碱基处,长度为747个碱基对,编码 II型硫酯酶,248个氨基酸;tiaF位于基因簇核苷酸序列第14189-15220个碱基处,长度为1032个碱基对,编
码酰基载体蛋白合成酶/缩合酶,343个氨基酸;tiaB位于基因簇核苷酸序列第15220-20349个碱基处,长度为5130个碱基对,编 码可重复利用的聚酮合成酶,1709个氨基酸;tiaM位于基因簇核苷酸序列第37305-38789个碱基处,长度为1485个碱基对,编 码卤化酶,494个氨基酸;
4)异丁酰基合成基因,即tiaC、tiaD共2个基因tiaC位于基因簇核苷酸序列第11219-12280个碱基处,长度为1062个碱基对,编 码支链α酮酸脱氢酶的El α亚单元,353个氨基酸;tiaD位于基因簇核苷酸序列第12277-132M个碱基处,长度为978个碱基对,编码 支链α酮酸脱氢酶的El β亚单元,325个氨基酸;5)甲基丙二酰辅酶A和乙基丙二酰辅酶A合成基因,即tiaJ、tiaK、tiaL、tiaN共 4个基因tiaj位于基因簇核苷酸序列第27166-28398个碱基处,长度为1233个碱基对,编 码3-羟乙酰基-辅酶A脱氢酶,410个氨基酸;tiaK位于基因簇核苷酸序列第28395-29759个碱基处,长度为1368个碱基对,编 码巴豆酰基-辅酶A还原酶/羧化酶,454个氨基酸;tiaL位于基因簇核苷酸序列第29770-31200个碱基处,长度为1431个碱基对,编 码丙酰-辅酶A羧化酶,476个氨基酸;tiaN位于基因簇核苷酸序列第82097-83296个碱基处,长度为1200个碱基对,编 码烯酰-辅酶A水合酶/异构酶,399个氨基酸;6)环骨架后修饰基因,即tiaPl、tiaP2,共2个基因tiaPl位于基因簇核苷酸序列第32479-31301个碱基处,长度为1179个碱基对,编 码细胞色素P-450氧化酶,392个氨基酸;tiaP2位于基因簇核苷酸序列第41304-40105个碱基处,长度为1200个碱基对,编 码细胞色素P-450氧化酶,399个氨基酸;7)调节、抗性和未知功能基因,即 tiaI、tiaRl、tiaR2、tiaTl、tiaT2、tiaT3、tiaT4 共7个基因tial位于基因簇核苷酸序列第26853-24502个碱基处,长度为2352个碱基对,编 码ATP-依赖的DNA解螺旋酶,783个氨基酸;tiaRl位于基因簇核苷酸序列第34415-37186个碱基处,长度为2772个碱基对,编 码LuxR家族转录调节因子,923个氨基酸;tiaR2位于基因簇核苷酸序列第88114-88527个碱基处,长度为414个碱基对,编 码TetR家族转录调节因子,137个氨基酸;tiaTl位于基因簇核苷酸序列第24505-2^80个碱基处,长度为16 个碱基对,编 码膜转运蛋白,541个氨基酸;tiaT2位于基因簇核苷酸序列第83304-84590个碱基处,长度为1287个碱基对,编 码膜转运蛋白,4 个氨基酸;tiaT3位于基因簇核苷酸序列第85955-84642个碱基处,长度为1314个碱基对,编 码NitT/TauT家族ABC转运蛋白,437个氨基酸;tial^位于基因簇核苷酸序列第87757-86003个碱基处,长度为1755个碱基对,编 码NitT/TauT家族ABC转运蛋白,584个氨基酸。SEQ ID NO. 1的互补序列可根据DNA碱基互补原则随时得到。SEQ ID NO. 1的核 苷酸序列或部分核苷酸序列可以通过聚合酶链式反应(PCR)或用合适的限制性内切酶酶 切相应的DNA或DNA体外合成技术或使用其他合适的技术得到。本发明提供了得到至少包含部分SEQ ID NO. 1中DNA序列的重组DNA载体的途径。本发明还提供了产生台勾霉素生物合成基因被中断或其他基因改造的途径,至少 其中之一的基因包含有SEQ ID NO. 1中的核苷酸序列。本发明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶链式反应(PCR)的 方法或包含本发明序列SEQ ID NO. 1的DNA作为探针以Southern杂交等方法从其他生物 体中得到与台勾霉素生物合成基因相似的基因。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从指 孢囊菌NRRL 18085基因组文库中定位更多的文库质粒。这些文库质粒至少包含本发明中 的部分序列,也包含有指孢囊菌NRRL 18085基因组中邻近区域未克隆的DNA。包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以被体内体外修饰或 进行突变,包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性 突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化,或通 过紫外线或化学试剂诱变等。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合 适的表达体系在外源宿主中表达以得到相应的酶或其他更高的生物活性物质或产量。这些 外源宿主包括大肠杆菌、链霉菌、小单孢菌、假单孢菌、芽孢杆菌、酵母、植物和动物等。本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备。包含本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些 氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特 征或其他致力于得到的性质。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在 异源宿主中表达并了解它们在宿主代谢中的功能。包含本发明所提供的核苷酸序列编码的蛋白可以催化合成2,4- 二羟基-3,5- 二 氯-6-乙基苯甲酸、脱氧糖及台勾霉素聚酮大环骨架,进一步催化合成抗生素台勾霉素B。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通 过遗传重组来构建重组载体以获得新型生物合成途径,也可以通过插入、置换、缺失或失活 进而获得其他新型生物合成途径或者产生新的化合物。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因DNA片段可 以通过中断台勾霉素生物合成的一个或几个步骤而得到新的台勾霉素结构类似物或前体。 包含DNA片段或基因可以用来提高台勾霉素或其衍生物的产量,本发明提供了在基因工程 微生物中提高产量的途径。包含本发明所提供的聚酮合成酶可以通过缺失、插入或失活来自于相同或不同的 聚酮合成酶系统的一个或多个聚酮合成酶结构域、模块或基因而产生新的聚酮化合物。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的片段或基因可以用来 构建聚酮合成酶库或聚酮合成酶衍生库或组合库。本发明所提供的催化合成2,4- 二羟基-3,5- 二氯_6_乙基苯甲酸的合成基因可 用于合成台勾霉素衍生物。本发明所提供的台勾霉素大环骨架的后修饰基因或糖基转移酶或其他酶提供了 通过遗传修饰得到类似物的途径,所包含的催化大环内酯生成或后修饰的其他应用。
本发明所提供的卤化酶TiaM可以应用于台勾霉素的2,4_ 二羟基-6-乙基苯甲酸 的结构域卤素基团的改变。总之,本发明所提供的包含台勾霉素生物合成相关的所有基因和蛋白信息可以帮 助人们理解台勾霉素家族天然产物的生物合成机制,为进一步遗传改造提供了材料和知 识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化 合物或基因、蛋白。用于本发明的指抱囊菌 Dactylosporangium aurantiacum subsp. hamdenensis NRRL 18085,已在本申请以前公开记载于美国专利,其专利号为US4,918,174的专利中。 根据该专禾1J文献的记载,指抱囊菌 Dactylosporangium aurantiacum subsp. hamdenensis NRRL 18085保藏于美国农业研究菌种保藏中心(Agricultural Research Service Culture Collection,简写NRRL),其登录号为 NRRL 18085。
图1是台勾霉素B的化学结构;图2是阳性克隆的限制性酶切图谱及其相互重叠区示意图,包括了阳性克隆 pCSGl,pCSG4-7,pCSG9,pCSGlO, pCSG12,pCSG15_18,黑色部分表明了序列测定区域,E EcoRKB =BglII ;图3是台勾霉素生物合成基因簇的组织结构示意图;图4是推测的台勾霉素B的生物合成途径,(A)台勾霉素大环内酯骨架的形成及 其关键后修饰过程;(B)芳香环的生物合成;(C)脱氧糖基的生物合成及其修饰;(D)乙基 丙二酰辅酶A的生物合成;图5是基因遗传改造指囊孢菌NRRL 18085中台勾霉素的生物合成基因得到台勾 霉素结构类似物的高压液相分析图(0)野生型菌株指孢囊菌NRRL18085经发酵获得了台 勾霉素B ;⑴敲除了 tiaM-卤化酶基因,获得的突变株发酵TCM50产生了化合物1 ; (2)敲 除了 tiaSl-GDP甘露糖4,6_脱水酶基因,获得的突变株TCM51发酵产生了化合物2,3,4, 5; (3)敲除了 tiaS6-0乙酰转移酶基因,获得的突变株TCM53发酵产生了化合物4,5,6,7 ; (4)敲除了 tiaP2-P450基因,获得的突变株TCMM发酵产生了化合物8,9,10,11 ;(5)敲 除了 tiaS2-C甲基转移酶基因,获得的突变株发酵TCM55产生了化合物2,3,4;(6)敲除了 tiaRl-Lux家族的调控基因,获得的突变株TCM56失去了产生tiacumicinB的能力;(7)敲 除了 tiaGl-糖基转移酶基因,获得的突变株TCM57发酵产生了化合物3,4,5,6,12 ; (8)敲 除了 tiaG2-糖基转移酶基因,获得的突变株TCM64发酵产生了化合物13,14,15,16 ; (9)敲 除了 tiaF-ACP合成酶基因,获得的突变株TCM62发酵产生了化合物13,14,15,16 ; (10)敲 除了 tiaPl-P450基因,获得的突变株TCM69发酵产生了化合物17 ;(11)敲除了 tiaB-可重 复利用聚酮合成酶基因,获得的突变株TCM63发酵产生了化合物4,13,14,15,16 ; (12)敲除 了 tiaS3-GDP甘露糖4,6-脱水酶基因,获得的突变株TCM52发酵仍旧生产台勾霉素B ; (13) 敲除了 tiaS4-GDP甘露糖4,6-脱水酶基因,获得的突变株TCM65发酵生产台勾霉素B和化 合物4 ; (14)敲除了 ORF(-l)-转座酶基因,获得的突变株TCM58发酵仍旧生产台勾霉素B ; (15)敲除了 tiaC-Alpha支链酮酸脱氢酶基因,获得的突变株TCM59发酵仍旧生产台勾霉 素B ; (16)敲除了 tiaD-Alpha支链酮酸脱氢酶基因,获得的突变株TCM60发酵仍旧生产台
9勾霉素B; (17)敲除了 tiaE-硫酯合成酶基因,获得的突变株TCM61发酵仍旧生产台勾霉素 B,同时产生了化合物13,14,15,16 ; (18)敲除了 tiaJ-3-羟酰辅酶A脱氢酶基因,获得的突 变株TCM66发酵仍旧生产台勾霉素B ; (19)敲除了 tiaK-Crotonyl辅酶A脱羧酶/还原酶 基因,获得的突变株TCM67发酵仍旧生产台勾霉素B; 00)敲除了 tiaL-丙酰辅酶A脱羧酶 基因,获得的突变株TCM68发酵仍旧生产台勾霉素B; 敲除了 tiaS5-氧甲基转移酶基 因,获得的突变株TCM70发酵产生了化合物18-29 ; (22)敲除了 tiaN-烯醇酰辅酶A脱水酶 /异构酶基因,获得的突变株TCM71发酵仍旧生产台勾霉素B ; (23)敲除了 tiaR2-ArS家族 转录调控子编码基因,获得的突变株TCM72发酵仍旧生产台勾霉素B,产量略有提高;04) 敲除了 orfl-短链脱氢辅基因,获得的突变株TCM73发酵仍旧生产台勾霉素B; 05)敲除了 tiaT2-Na/H膜转运蛋白编码基因,获得的突变株TCM74发酵仍旧生产台勾霉素B ; (26)敲 除了 tiaT4-ABC膜转运蛋白编码基因,获得的突变株TCM76发酵仍旧生产台勾霉素B ; (27) 敲除了 tiaAl-聚酮合成酶编码基因,获得的突变株TCM77失去生产台勾霉素B及其类似物 的能力;图6是基因遗传改造台勾霉素的生物合成基因得到的台勾霉素结构类似物的化 学结构式;图7是卤化酶TiaM的体外生化鉴定,(A)TiaM催化反应的示意图;⑶纯化蛋白 TiaM和WuE的蛋白电泳分析;(C) TiaM反应产物的高压液相分析图(i) TiaM的标准反应 体系包括26 μ M化合物1,0. ImM黄素腺嘌呤二核苷酸(FAD),4mM NADH, IOOmM NaCl, 2. 9 μ M TiaM和0. 22 μ M SsuE ; (ii)标准反应体系缺少SsuE ; (iii)标准反应体系缺少TiaM ; (iv) 标准反应体系缺少FAD ; (ν)标准反应体系缺少NADH ; (vi)标准反应体系缺少NaCl ; (vii) 标准反应体系中用化合物30替代化合物1 ; (viii)台勾霉素B标准品;(ix)标准反应体系 中用NaBr替代NaCl ; (χ)标准反应体系中用化合物30替代化合物1,用NaBr替代NaCl。
具体实施例方式以下是对本发明的进一步说明,而不是对本发明的限制。1.台勾霉素的生物合成基因簇克隆、序列分析及功能分析台勾霉素B(图1)中有一个大环内脂的骨架,是由聚酮合成酶PKS催化产生的, 因此设计 PKS 的兼并引物 TCM-PKS4F :5' -CTff CGT SGA GGC SCA YGG CAC SGG-3 ‘和 TCM-PKS5R 5' -CCR TGM CCS GAG AAS ACC CAS AC-3',通过 PCR 扩增从指孢囊菌 NRRL 18085基因组中获得一个约700bp的PCR片段,连入到T载体中,测序后将序列进行blast 比对,结果表明,该序列与已知的PKS具有高度同源性。同样台勾霉素B中的芳香环支链上 有两个氯原子,这暗示有卤化酶参与了台勾霉素B的生物合成。我们采用文献报道的次级 代谢产物卤化酶的兼并引物引物Halo-B4-FW :5' -TTC CCS CGS TAC CAS ATC GGS GAG-3 ‘ 和 Halo-B7-RV 5' -GSG GGA TSff MCC AGff ACC ASC C_3' (Hornung et al.,2007),从指 孢囊菌NRRL 18085的基因组DNA中扩增获得了约550bp的DNA片段。序列测定(GenBank 序列号为GU^^IO)和Blast结果显示该DNA片段所对应的蛋白多肽序列跟一系列的次级 代谢产物的卤化酶有高度相似性。于是将这两个片段用地高辛标记为探针,从指囊孢菌NRRL 18085的基因组文库 1920个克隆中筛选,用PKS探针获得了 16个阳性克隆,其中的8个用卤化酶探针能够同时筛选获得,但用卤化酶探针未能筛选到其他阳性克隆。这些阳性克隆经酶切分析表明涵盖 了染色体约1001Λ的区域(图幻。在此基础上,再经过染色体步移获得了 2个交叠的质粒 PCSG17和pCSG18。这18个涵盖了染色体约130kb的区域。DNA序列测定了 110,633bp的 染色体区域,通过生物信息学分析包含了 50个开放读码框(图3),其中31个可能与台勾 霉素B的生物合成有关(表1)。根据基因编码蛋白的功能分析,台勾霉素的生物合成基因 簇被初步确定为从基因tiaGl到tiaR2(图3)涵盖染色体82. 5kb的区域,包含31个开放 读码框。整个台勾霉素的生物合成基因簇共31个基因,其中4个聚酮合成酶基因tiaAl、 tiaA2、tiaA3、tiaA4用于编码I型聚酮合成酶((PKS),共包含9个模块,40个功能域,负责 催化台勾霉素大环骨架部分聚酮链的生物合成;8个脱氧糖基生物合成基因tiaSl、tiaS2、 tiaS3、tiaS4、tiaS5、tiaS6、tiaGl、tiaG2编码的蛋白负责脱氧甘露糖的生物合成,并进一 步与大环骨架缩合;4个2,4- 二羟基-3,5- 二氯-6-乙基苯甲酸合成酶基因tiaE、tiaF、 tiaB、tiaM用于编码重复使用的PKS及氯化修饰酶,负责催化2,4_ 二羟基-3,5- 二氯-6-乙 基苯甲酸的生物合成;2个异丁酰基合成基因tiaC、tiaD用于编码支链α酮酸脱氢酶的α 和β组分,负责异丁酰基合成;4个甲基丙二酰辅酶A和乙基丙二酰辅酶A合成基因tiaj、 tiaK、tiaL、tiaN用于编码甲基丙二酰辅酶A和乙基丙二酰辅酶A合成;2个环骨架后修饰 基因tiaPl、tiaP2编码氧化酶,催化台勾霉素大环骨架的后修饰;7个调节、抗性和未知功 能基因tiaI、tiaRl、tiaR2、tiaTl、tiaT2、tiaT3、tiaT4负责还编码2个调节基因产物和4 个抗性基因产物和一个未知功能的蛋白。表1 台勾霉素的生物合成基因簇的基因及其功能分析
权利要求
1. 一种台勾霉素的生物合成基因簇,其特征在于,该生物合成基因簇的核苷酸序列如 SEQ IDN0. 1所示,包含31个基因,具体为1)聚酮合成酶基因,即tiaAl、tiaA2、tiaA3、tiaA4共4个基因tiaAl位于基因簇核苷酸序列第41491-57180个碱基处,长度为15690个碱基对,编码 聚酮合成酶,52 个氨基酸;tiaA2位于基因簇核苷酸序列第57186-66803个碱基处,长度为9618个碱基对,编码聚 酮合成酶,3205个氨基酸;tiaA3位于基因簇核苷酸序列第66拟9-71337个碱基处,长度为4509个碱基对,编码聚 酮合成酶,1502个氨基酸;tiaA4位于基因簇核苷酸序列第71361-81746个碱基处,长度为10386个碱基对,编码 聚酮合成酶,3461个氨基酸;2)脱氧糖基的生物合成基因,即tiaSl、tiaS2、tiaS3、tiaS4、tiaS5、tiaS6、tiaGl、 tiaG2共8个基因tiaSl位于基因簇核苷酸序列第8508-7492个碱基处,长度为1017个碱基对,编码 ⑶P-D-甘露糖4,6-脱水酶,338个氨基酸;tiaS2位于基因簇核苷酸序列第9742-8534个碱基处,长度为1209个碱基对,编码 C-甲基转移酶,402个氨基酸;tiaS3位于基因簇核苷酸序列第10785-9787个碱基处,长度为999个碱基对,编码 ⑶P-甘露糖4,6-脱水酶,332个氨基酸;tiaS4位于基因簇核苷酸序列第21789-2^20个碱基处,长度为1032个碱基对,编码 ⑶P-甘露糖4,6-脱水酶,343个氨基酸;tiaS5位于基因簇核苷酸序列第33022-34347个碱基处,长度为13 个碱基对,编码糖 0-甲基转移酶,441个氨基酸;tiaS6位于基因簇核苷酸序列第38882-40021个碱基处,长度为1140个碱基对,编码 0-酰基转移酶,379个氨基酸;tiaGl位于基因簇核苷酸序列第7441-6044个碱基处,长度为1398个碱基对,编码糖基 转移酶,465个氨基酸;tiaG2位于基因簇核苷酸序列第20351-21772个碱基处,长度为1422个碱基对,编码糖 基转移酶,473个氨基酸;3)2,4-二羟基-3,5- 二氯-6-乙基苯甲酸合成酶基因,即tiaE、tiaF、tiaB、tiaM共4 个基因tiaE位于基因簇核苷酸序列第14006-13260个碱基处,长度为747个碱基对,编码II 型硫酯酶,248个氨基酸;tiaF位于基因簇核苷酸序列第14189-15220个碱基处,长度为1032个碱基对,编码酰 基载体蛋白合成酶/缩合酶,343个氨基酸;tiaB位于基因簇核苷酸序列第15220-20349个碱基处,长度为5130个碱基对,编码可 重复利用的聚酮合成酶,1709个氨基酸;tiaM位于基因簇核苷酸序列第37305-38789个碱基处,长度为1485个碱基对,编码卤 化酶,494个氨基酸;4)异丁酰基合成基因,即tiaC、tiaD共2个基因tiaC位于基因簇核苷酸序列第11219-12280个碱基处,长度为1062个碱基对,编码支 链α酮酸脱氢酶的El α亚单元,353个氨基酸;tiaD位于基因簇核苷酸序列第12277-132Μ个碱基处,长度为978个碱基对,编码支链 α酮酸脱氢酶的El β亚单元,325个氨基酸;5)甲基丙二酰辅酶A和乙基丙二酰辅酶A合成基因,即tiaJ、tiaK、tiaL、tiaN共4个 基因tiaj位于基因簇核苷酸序列第2716648398个碱基处,长度为1233个碱基对,编码 3-羟乙酰基-辅酶A脱氢酶,410个氨基酸;tiaK位于基因簇核苷酸序列第28395-29759个碱基处,长度为1368个碱基对,编码巴 豆酰基-辅酶A还原酶/羧化酶,454个氨基酸;tiaL位于基因簇核苷酸序列第29770-31200个碱基处,长度为1431个碱基对,编码丙 酰-辅酶A羧化酶,476个氨基酸;tiaN位于基因簇核苷酸序列第82097-83296个碱基处,长度为1200个碱基对,编码烯 酰-辅酶A水合酶/异构酶,399个氨基酸;6)环骨架后修饰基因,即tiaPl、tiaP2,共2个基因tiaPl位于基因簇核苷酸序列第3M79-31301个碱基处,长度为1179个碱基对,编码细 胞色素P-450氧化酶,392个氨基酸;tiaP2位于基因簇核苷酸序列第41304-40105个碱基处,长度为1200个碱基对,编码细 胞色素P-450氧化酶,399个氨基酸;7)调节、抗性和未知功能基因,即tial、tiaRl、tiaR2、tiaTl、tiaT2、tiaT3、tiaT4 共 7个基因tial位于基因簇核苷酸序列第26853-24502个碱基处,长度为2352个碱基对,编码 ATP-依赖的DNA解螺旋酶,783个氨基酸;tiaRl位于基因簇核苷酸序列第34415-37186个碱基处,长度为2772个碱基对,编码 LuxR家族转录调节因子,923个氨基酸;tiaR2位于基因簇核苷酸序列第88114-88527个碱基处,长度为414个碱基对,编码 TetR家族转录调节因子,137个氨基酸;tiaTl位于基因簇核苷酸序列第24505-2^80个碱基处,长度为16 个碱基对,编码膜 转运蛋白,541个氨基酸;tiaT2位于基因簇核苷酸序列第83304-84590个碱基处,长度为1287个碱基对,编码膜 转运蛋白,4 个氨基酸;tiaT3位于基因簇核苷酸序列第85955-84642个碱基处,长度为1314个碱基对,编码 NitT/TauT家族ABC转运蛋白,437个氨基酸;tiaT4位于基因簇核苷酸序列第87757-86003个碱基处,长度为1755个碱基对,编码 NitT/TauT家族ABC转运蛋白,584个氨基酸。
2.权利要求1所述的台勾霉素的生物合成基因簇在制备台勾霉素及其类似物中的应用。
3.权利要求1所述的台勾霉素的生物合成基因簇在制备2,4_二羟基-3,5-二氯-6-乙基苯甲酸及其类似物中的应用。
4.权利要求1所述的台勾霉素的生物合成基因簇在制备脱氧甘露糖及其类似物中的 应用。
5.权利要求1所述的台勾霉素的生物合成基因簇在制备台勾霉素聚酮大环骨架及其 类似物中的应用。
全文摘要
本发明公开了一种台勾霉素的生物合成基因簇及其应用。整个基因簇饱含31个基因聚酮合成酶基因,即tiaA1、tiaA2、tiaA3、tiaA4脱氧糖基的生物合成基因,即tiaS1、tiaS2、tiaS3、tiaS4、tiaS5、tiaS6、tiaG1、tiaG22,4-二羟基-3,5-二氯-6-乙基苯甲酸合成酶基因,即tiaE、tiaF、tiaB、tiaM异丁酰基合成基因,即tiaC、tiaD甲基丙二酰辅酶A和乙基丙二酰辅酶A合成基因,即tiaJ、tiaK、tiaL、tiaN环骨架后修饰基因,即tiaP1、tiaP2,共2个基因调节、抗性和未知功能基因,即tiaI、tiaR1、tiaR2、tiaT1、tiaT2、tiaT3、tiaT4。通过对上述生物合成基因进行遗传改造可以得到台勾霉素的结构类似物。本发明提供的基因及其蛋白可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
文档编号C12P7/42GK102115757SQ20101059241
公开日2011年7月6日 申请日期2010年12月16日 优先权日2010年12月14日
发明者张光涛, 张海波, 张长生, 李苏梅, 牛四文, 肖毅, 胡涛, 鞠建华 申请人:中国科学院南海海洋研究所