专利名称:谷田霉素的生物合成基因簇的利记博彩app
技术领域:
本发明属于微生物基因资源和基因工程领域,具体涉及抗真菌、抗肿瘤抗生素谷田霉素的生物合成基因簇的克隆、分析、功能研究及其应用。
背景技术:
谷田霉素(Yatakemycin)是日本Toyama大学的科学家Igarashi等于2003年在进行新型抗真菌化合物筛选时由链霉菌(Sti^ptomyces sp. TP-A0365)发酵培养基中分离出的微生物次级代谢产物[J Antibiot (2003) 56,107-113]。经NMR和CID-MS/MS实验最初分析结构证明其属于一类新型的抗生素家族。此家族中的化合物被认为是DNA烷基化试剂,包括CC-1065,多卡霉素A(duocarmycinA),多卡霉素SA (duocarmycinSA),他们最明显的特征是吡咯吲哚环上的环丙基结构。2004年美国Scripps研究所的Dale L. Boger小组首次发表了对(+)_谷田霉素的全合成工作并确定了其结构[J Am Chem Soc (2004) 126, 8396-8398]。实验显示,谷田霉素可以抑制致病真菌如曲霉,烟曲霉,黄曲霉,白色念珠球菌,新型隐球菌的生长。其最小抑菌浓度(MIC)值为0.01 0.03 μ g/mL,是两性霉素 (amphotericinB/MIC :0. 1 0. 5 μ g/mL)禾口伊曲康唾(itraconazole/MIC :0. 03 0. 2 μ g/ mL)的10 100倍。另外,它表现出对肿瘤细胞极强的毒性,比另一种烷基化抗肿瘤药物丝裂霉素对肿瘤细胞的毒性高1000倍[J Am Chem Soc (2003) 125,10971-10976]。最近的研究表明该家族化合物不仅可以对游离DNA双螺旋发生烷基化修饰,还可以高效地对核小体颗粒(nucleosome core particles)中的DNA进行烷基化修饰,甚至是几乎全部组蛋白包围的DNA,因此这类化合物为研究真核细胞染色体中DNA-组蛋白的动力学识别及DNA损伤导致的生物效应提供了有力的工具[Nature Chem Biol Q006) 2,64-66]。谷田霉素与DNA烷基化作用的机制是腺嘌呤中3位的N亲核进攻谷田霉素环丙基上取代最少的碳原子,形成对DNA的烷基化物。其对DNA的烷基化位点都是腺嘌呤,没有检测到鸟嘌呤的参与。经试验发现DNA链中所有N-3位被烷基化的腺嘌呤旁侧碱基都是A 或 T[J Am Chem Soc (2006) 128,7136-7137 JAm Chem Soc (2006) 128,15683-15696] 谷田霉素的抗真菌和细胞毒性活性来自于其独特的化学结构。其骨架部分是由一个吲哚与两个吡咯吲哚环通过两个酰胺键连接构成,与家族系列化合物相比,除共有的中间吡咯吲哚环上的环丙基外,其分子左侧吡咯吲哚环上独特的硫酯键也是谷田霉素引人关注的重点。由于结构上的特点,谷田霉素及其家族化合物被形象的称作“三明治”结构系列化合物。我们以微生物来源的谷田霉素为目标分子,从克隆其在链霉菌Mi^ptomyces sp. TP-A2060生物合成基因簇出发,采用微生物学、分子生物学、生物化学及有机化学相结合的方法研究其生物合成,通过体内基因操作的方法初步对其生物合成机制的研究揭示包括环丙基在内的独特化学结构形成的酶学机理,在此基础上运用代谢工程的原理,合理修饰谷田霉素的生物合成途径,探索结构稳定、活性更好、并能通过微生物发酵大量生产的新型药物。
发明内容
本发明涉及一种由链霉菌Mi^ptomyces sp. TP-A2060产生的具有抗真菌、抗肿瘤活性的DNA烷基化抗生素一谷田霉素的生物合成基因簇的克隆、测序、分析、功能研究及其应用。本发明中整个基因簇共包含31个基因的核苷酸序列或互补序列(序列1),其中8 个基因(ytkD,ytkF,ytkG,ytkJ,ytkL,ytkN,ytkQ,ytkV)用于编码骨架合成相关蛋白;2个基因(ytkU,ytkff)用于编码甲基转移酶;10 个基因(ytkA,ytkB, ytkC, ytkH,ytkl, ytkK, ytkM, ytkO, ytkS,ytkT)用于编码氧化还原酶及辅因子;3个基因(ytkE,ytkP,ytkX)用于编码未知功能酶;3个基因(ytkRl,ytkR7,ytkR8)用于编码调节蛋白;5个基因(ytkR2, ytkR3, ytkR4,ytkR5,ytkR6)用于编码抗性相关蛋白。本发明还提供了一个编码黄嘌呤脱氢酶含钼蛋白的核苷酸序列,其编码的氨基酸序列位于序列2中,命名为ytkA,其基因的核苷酸序列位于序列1中第4567-6774个碱基处。本发明还提供了一个编码含钼脱氢酶黄素腺嘌呤二核苷酸(FAD)结合蛋白的核苷酸序列,其编码的氨基酸序列位于序列3中,命名为ytkB,其基因的核苷酸序列位于序列 1中第6771-7760个碱基处。本发明还提供了一个编码氧化还原酶铁硫簇结合亚基的核苷酸序列,其编码的氨基酸序列位于序列4中,命名为ytkC,其基因的核苷酸序列位于序列1中第7747-8265个碱基处。本发明还提供了一个编码酰基转移酶的核苷酸序列,其编码的氨基酸序列位于序列5中,命名为ytkD,其基因的核苷酸序列位于序列1中第8468-9049个碱基处。本发明还提供了一个编码未知蛋白的核苷酸序列,其编码的氨基酸序列位于序列 6中,命名为ytkE,其基因的核苷酸序列位于序列1中第9238-10188个碱基处。本发明还提供了一个编码乙酰辅酶A(CoA)转移酶的核苷酸序列,其编码的氨基酸序列位于序列7中,命名为ytkF,其基因的核苷酸序列位于序列1中第10525-12384个碱基处。本发明还提供了一个编码转录调节因子的核苷酸序列,其编码的氨基酸序列位于序列8中,命名为ytkRl,其基因的核苷酸序列位于序列1中第1M57-13095个碱基处。本发明还提供了一个编码腺嘌呤单磷酸(AMP)-连接酶的核苷酸序列,其编码的氨基酸序列位于序列9中,命名为ytkG,其基因的核苷酸序列位于序列1中第13055-14686 个碱基处。本发明还提供了一个编码DNA烷基化修复蛋白的核苷酸序列,其编码的氨基酸序列位于序列10中,命名为ytkR2,其基因的核苷酸序列位于序列1中第14719-1M74个碱基处。本发明还提供了一个编码依赖烟酰胺腺嘌呤二核苷酸磷酸(NADPH)的黄素单核苷酸(FMN)还原酶的核苷酸序列,其编码的氨基酸序列位于序列11中,命名为ytkH,其基因的核苷酸序列位于序列1中第1M97-16093个碱基处。本发明还提供了一个编码铁氧化还原蛋白的核苷酸序列,其编码的氨基酸序列位
4于序列12中,命名为ytkl,其基因的核苷酸序列位于序列1中第16093-16320个碱基处。本发明还提供了一个编码水解酶/磷酸转移酶的核苷酸序列,其编码的氨基酸序列位于序列13中,命名为ytkR3,其基因的核苷酸序列位于序列1中第16320-16961个碱基处。本发明还提供了一个编码脱氧核糖核酸酶的核苷酸序列,其编码的氨基酸序列位于序列14中,命名为ytkR4,其基因的核苷酸序列位于序列1中第16969-17865个碱基处。本发明还提供了一个编码核酸内切酶的核苷酸序列,其编码的氨基酸序列位于序列15中,命名为ytkR5,其基因的核苷酸序列位于序列1中第17846-18682个碱基处。本发明还提供了一个编码色氨酸合成酶-β亚基的核苷酸序列,其编码的氨基酸序列位于序列16中,命名为ytkj,其基因的核苷酸序列位于序列1中第18769-20151个碱基处。本发明还提供了一个编码钼蛋白氧化还原酶的核苷酸序列,其编码的氨基酸序列位于序列17中,命名为ytkK,其基因的核苷酸序列位于序列1中第20412-22505个碱基处。本发明还提供了一个编码L-酪氨酸脱羧酶的核苷酸序列,其编码的氨基酸序列位于序列18中,命名为ytkL,其基因的核苷酸序列位于序列1中第22505-23842个碱基处。本发明还提供了一个编码氧化还原酶/脱氢酶的核苷酸序列,其编码的氨基酸序列位于序列19中,命名为ytkM,其基因的核苷酸序列位于序列1中第23839-24963个碱基处。本发明还提供了一个编码辅酶A(CoA)连接酶的核苷酸序列,其编码的氨基酸序列位于序列20中,命名为ytkN,其基因的核苷酸序列位于序列1中第24960-26183个碱基处。本发明还提供了一个编码二氢吡咯-5-羧酸还原酶的核苷酸序列,其编码的氨基酸序列位于序列21中,命名为ytkO,其基因的核苷酸序列位于序列1中第沈180-27133个碱基处。本发明还提供了一个编码3-脱氢奎尼酸合酶的核苷酸序列,其编码的氨基酸序列位于序列22中,命名为ytkP,其基因的核苷酸序列位于序列1中第2718948295个碱基处。本发明还提供了一个编码辅酶A(CoA)连接酶的核苷酸序列,其编码的氨基酸序列位于序列23中,命名为ytkQ,其基因的核苷酸序列位于序列1中第28302-29681个碱基处。本发明还提供了一个编码钼蛋白氧化还原酶的核苷酸序列,其编码的氨基酸序列位于序列M中,命名为ytkS,其基因的核苷酸序列位于序列1中第四678-30853个碱基处。本发明还提供了一个编码独立于氧的粪卟啉原III-氧化酶的核苷酸序列,其编码的氨基酸序列位于序列25中,命名为ytkT,其基因的核苷酸序列位于序列1中第 30926-32446个碱基处。本发明还提供了一个编码甲基转移酶的核苷酸序列,其编码的氨基酸序列位于序列沈中,命名为ytkU,其基因的核苷酸序列位于序列1中第3M39-33185个碱基处。本发明还提供了一个编码睛基水解酶的核苷酸序列,其编码的氨基酸序列位于序列27中,命名为ytkV,其基因的核苷酸序列位于序列1中第33286-34239个碱基处。
本发明还提供了一个编码硫甲基转移酶的核苷酸序列,其编码的氨基酸序列位于序列观中,命名为ytkW,其基因的核苷酸序列位于序列1中第34258-34887个碱基处。本发明还提供了一个编码抗性蛋白的核苷酸序列,其编码的氨基酸序列位于序列四中,命名为ytkR6,其基因的核苷酸序列位于序列1中第34884-37235个碱基处。本发明还提供了一个编码转录调节因子的核苷酸序列,其编码的氨基酸序列位于序列30中,命名为ytkR7,其基因的核苷酸序列位于序列1中第37392-37997个碱基处。本发明还提供了一个编码转录调节因子的核苷酸序列,其编码的氨基酸序列位于序列31中,命名为ytkR8,其基因的核苷酸序列位于序列1中第37972-38889个碱基处。本发明还提供了一个编码酯酶的核苷酸序列,其编码的氨基酸序列位于序列32 中,命名为ytkX,其基因的核苷酸序列位于序列1中第39274-40371个碱基处。序列1的互补序列可根据DNA碱基互补原则随时得到。序列1的核苷酸序列或部分核苷酸序列可以通过聚合酶链式反应(PCR)或用合适的限制性内切酶酶切相应的DNA或使用其他合适的技术得到。本发明提供了得到至少包含部分序列1中DNA序列的重组DNA 质粒的途径。本发明还提供了产生谷田霉素生物合成基因被中断或加倍的微生物体的途径,至少其中之一的基因包含有序列1中的核苷酸序列。本发明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶链式反应(PCR)的方法或包含本发明序列的DNA作为探针以核酸杂交等方法从其他生物体中得到与谷田霉素生物合成基因相似的基因。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从链霉菌Mi^ptomyces sp.TP-A2060基因组文库中定位更多的文库质粒。这些文库质粒至少包含本发明中的部分序列,也包含有MMptomyces sp. TP-A2060基因组中以前邻近区域未克隆的DNA。包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些途径包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化(DNA shuffling),或通过紫外线或化学试剂诱变等。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达体系在外源宿主中表达以得到相应的酶或得到其他致力于得到的产物。这些外源宿主包括链霉菌、小单孢菌、糖多饱菌、假单孢菌、大肠杆菌、芽孢杆菌、酵母、植物和动物寸。本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备。包含本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其他致力于得到的性质。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。包含本发明所提供的核苷酸序列编码的蛋白YtkJ,YtkK等可以催化合成吡咯吲哚,吲哚骨架,进一步催化合成抗生素谷田霉素。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组质粒以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过中断谷田霉素生物合成的一个或几个步骤而得到新的谷田霉素结构类似物或前体。包含DNA片段或基因可以用来提高谷田霉素或其衍生物的产量。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的片段或基因可以用来克隆其家族类化合物的生物合成基因簇。本发明所提供的谷田霉素骨架的后修饰基因可用于通过遗传修饰得到谷田霉素类似物。本发明所提供的谷田霉素ytkT基因中断突变株发酵产物分离得到谷田霉素类似物 Yatakemycin-morfTο本发明所提供的谷田霉素ytkj基因和ytkK基因可在大肠杆菌中表达得到相应可溶性蛋白质。总之,本发明所提供的包含谷田霉素生物合成相关的所有基因和蛋白信息可以帮助人们理解谷田霉素类天然产物的生物合成机制,为进一步遗传改造提供材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
图1 谷田霉素aatakemycin)的化学结构。图2 谷田霉素生物合成基因簇的基因结构。图3 谷田霉素在链霉菌Sti^ptomyces sp. TP-A2060中的生物合成途径。图4 =Streptomyces sp. TP-A2060野生型菌株发酵产物的液相色谱-质谱(LC-MS) 分析。图5 =Streptomyces sp. TP-A2060野生型菌株及谷田霉素生物合成全部基因簇置换突变菌株发酵产物的高效液相色谱(HPLC)分析(A)野生型菌株;⑶谷田霉素生物合成基因簇置换突变体(m-HW-Y-qiaochu)。图6 =Streptomyces sp. TP-A2060野生型菌株及ytkE基因置换突变菌株发酵产物的HPLC分析(A)野生型菌株;⑶ytkE基因置换突变体(Δ ytkE)。图7 =Streptomyces sp. TP-A2060野生型菌株及ytkj和ytkL基因置换突变菌株发酵产物的HPLC分析(A)野生型菌株;(B)ytkJ基因置换突变体(AytkJ) ; (C)ytkL基因置换突变体 (ΔytkL)。图8 =Streptomyces sp. TP-A2060野生型菌株及ytkU和ytkW基因置换突变菌株发酵产物的HPLC分析(A)野生型菌株;(B)ytkU基因置换突变体(AytkU) ; (C)ytkW基因置换突变体 (Δ ytkff)。
图9 =Streptomyces sp. TP-A2060野生型菌株及ytkT基因置换突变菌株发酵产物的HPLC分析(A)野生型菌株;⑶ytkT基因置换突变体(Δ ytkT)。图10 :Yatakemycin-morfT的分子结构和核磁数据。图11 ㈧蛋白质YtkJ的催化途径(B)YtkJ, YtkK蛋白电泳图。图12 :Yatakemycin-morfT对酵母菌Y-190的生物活性测试符号说明图 IYatakemycin 谷田霉素。图3^kA/B/C 钼蛋白氧化酶JtkJ 色氨酸合成酶JtkM 氧化还原酶JtkO 脱氢酶JtkH:还原酶JtkQorN:辅酶A连接酶JtkU 甲基转移酶JtkI 铁氧还原蛋白; YtkL 脱羧酶JtkG 腺嘌呤单磷酸连接酶JtkT 氧化还原酶JtkK 氧化还原酶JtkW 甲基转移酶JtkF 辅酶A转移酶JtkX 酯酶。图 4Yatakemycin 谷田霉素。图5WT 野生型;m-HW-Y-qiaochu 谷田霉素基因敲除突变株。图6WT 野生型;Δ ytkE :ytkE基因置换突变株。图7WT 野生型;Δ ytkj :ytkj基因置换突变株;Δ ytkL :ytkL基因置换突变株。图8WT 野生型;Δ ytkU :ytkU基因置换突变株;Δ ytkff :ytkW基因置换突变株。图9WT 野生型;AytkT :ytkT基因置换突变株。图 lOYatakemycin-morfT 突变株△ ytkT 中间产物;1H (500MHz) and13C (125MHz) NMR data for Yatakemycin-morfT in pyridine-d5a 化合物Yatakemycin—morfT在気带口比啶中500兆赫兹氢谱和125兆赫兹碳谱数据。图IlYtkJ 基因ytkj表达的蛋白质JtkK 基因ytkK表达的蛋白质泳道1 ^kJ纯化到的蛋白;泳道2 JtkJ包涵体蛋白;泳道3 AtkJ可溶性蛋白;泳道4:表达 YtkJ(49. 5kD)的全蛋白;泳道6 AtkK(76kD)的全蛋白;泳道7 JtkK可溶性蛋白;泳道8 YtkK包涵体蛋白;泳道9 =YtkK纯化后的蛋白图12A :50 μ 1甲醇;B 谷田霉素50 μ 1 (溶于甲醇中浓度为IOnM) ;C Yatakemycin-morfT50 μ 1 (溶于甲醇中浓度为 IOnM)
具体实施例方式以下结合图1-图12对本发明进一步详细说明。1.谷田霉素的生物合成基因簇的克隆,序列分析及功能分析本发明人通过全基因组测序的方法得到了谷田霉素(图1)产生菌(Sti^ptomyces sp. TP-A2060)的基因组序列8Mb,通过基因组搜索以及BLAST比对、功能分析的方法定位了目标基因簇并用体内同源重组的方法将其敲除得到突变株m-HW-Y-qiaochu,然后将其发酵,发酵产物HPLC(高效液相色谱法)检测谷田霉素的产生被中断(图…,从体内证明此基因簇为谷田霉素的生物合成基因簇。将得到的基因组序列信息与数据库比对分析,初步确定谷田霉素的生物合成基因簇为35,8(^bp,其中31个开放阅读框(open reading frame, 0RF)与谷田霉素的生物合成相关。各基因功能的分析结果见表1表1谷田霉素生物合成基因簇功能分析
权利要求
1.一种谷田霉素的生物合成基因簇,该基因簇核苷酸序列如SEQ ID NO. 1所示,其中编码谷田霉素生物合成所涉及的31个基因,包括ytkD,ytkF,ytkG,ytkj, ytkL, ytkN, ytkQ, ytkV8个骨架合成相关基因;ytkU,ytkW共2个甲基转移酶基因;ytkA,ytkB, ytkC, ytkH, ytkl, ytkK,ytkM,ytkO, ytkS,ytkT 共 10 个氧化还原酶及辅基蛋白基因;ytkE, ytkP,ytkX 共3个未知功能酶基因;ytkRl,ytkR7,ytkR8共3个调节基因;ytkR2,ytkR3,ytkR4,ytkR5, ytkR6共5个抗性基因。
2.一种根据权利要求1所述的谷田霉素的生物合成基因簇的用途,其编码蛋白用于催化合成抗生素谷田霉素及其类似物。
3.根据权利要求2所述的谷田霉素的生物合成基因簇的用途,其编码蛋白催化合成硫酯键结构。
4.根据权利要求2所述的谷田霉素的生物合成基因簇的用途,其编码蛋白催化合成酰胺键结构。
5.根据权利要求2所述的谷田霉素的生物合成基因簇的用途,其编码蛋白催化合成环丙基结构。
6.根据权利要求2所述的谷田霉素的生物合成基因簇的用途,其编码蛋白催化合成吲哚结构。
7.根据权利要求2所述的谷田霉素的生物合成基因簇的用途,其编码蛋白催化合成吡咯吲哚结构。
8.根据权利要求2所述的谷田霉素的生物合成基因簇的用途,其氧化还原酶基因敲除后可以得到谷田霉素类似物或生物合成中间体,其中的氧化还原酶基因经回补到该基因敲除突变株中可以恢复谷田霉素的合成。
全文摘要
本发明公开了一种由链霉菌Streptomyces sp.TP-A2060产生的谷田霉素的生物合成基因簇。整个基因簇共包含31个基因8个骨架合成相关基因;2个甲基转移酶基因;10个氧化还原酶及辅基蛋白基因;3个未知功能酶基因;3个调节基因;5个抗性基因。通过对上述生物合成基因簇的遗传操作可阻断谷田霉素的合成,一个氧化还原酶基因ytkT的替换可以产生中间体化合物,两个基因ytkJ和ytkK表达的蛋白经分离纯化可以得到可溶蛋白。本发明所提供的基因也可用于寻找和发现用于医药、工业或农业的化合物或基因。
文档编号C12N15/31GK102174531SQ20111002460
公开日2011年9月7日 申请日期2011年1月21日 优先权日2011年1月21日
发明者唐功利, 张凤, 徐慧, 李燕, 黄伟 申请人:中国科学院上海有机化学研究所