专利名称:一种手霉素类抗生素生物合成基因簇的利记博彩app
技术领域:
本发明涉及微生物的基因工程领域,具体的说是一种手霉素A和中尼霉素的生物合成基因簇。
背景技术:
手霉素类化合物是非常特殊的一类聚酮类天然产物,大多数是由链霉菌产生的抗生素,具有良好的生物活性。第一个手霉素化合物手霉素A是从链霉菌Sti^ptomyces parvulus TU64分离得到的(Buzzetti et al.,1963),然后在1973年发表了其结构 (Schroder et al.,1973),后来Zeeck等人给出了手霉素A的立体化学结构,进一步修正了其结构Geeck et al. ,1987 ;Sattler et al.,1998),手霉素化合物被认为是一族新的抗生素,随后又分离得到了有类似结构的化合物如aSukamyCin(0mura et al.,1976 ; Kakinuma et al.,1979),U—62162 (Slechta et al.,1982)禾口 U—56407 (Brodasky et al., 1983),丰富了此族抗生素,以上这些手霉素类化合物的中心核心结构是Hi-C7N结构。而2005 年Li等从海洋链霉菌中分离得到了手霉素A和中尼霉素A、B(Li et al.,2005),中尼霉素中心芳香环结构是P-C7N结构单元,且有氯的取代,是第一个来自天然的Para-C7N结构。
一些临床上使用的利福霉素、丝裂霉素C等氨莎类抗生素,其结构通常是脂肪族安莎链通过酰胺键连接在Hi-C7N芳香环结构上,而Hi-C7N结构单元是由特殊的3-氨基-5-羟基苯甲酸(AHBA)作为起始单元合成的(Floss 2006)。
手霉素类化合物看上去核心结构具有类似Hi-C7N的结构单元,但是Floss课题组通过前体喂养实验发现,手霉素A和asukamycin等核心结构的前体物并不是AHBA,而是其异构物 3-氨基-4 羟基苯甲酸(3,4-AHBA) (Hu et al.,1997 and 2004)。在 2010 年 Rui 等人解析了 asukamycin的生物合成基因簇(Rui et al.,2010),进一步证实了前体物是3, 4-AHBA。
几乎所有手霉素类化合物的侧链上都存在C5N结构2-氨基-3-羟基-2-环戊烯酮(2-amino-3-hydroxycyclopent-2-enone),C5N结构单元的前体物是5-氨基酮戊酸(5-aminolevulinic acid,ALA),也是四吡咯的重要前体物,可以合成亚铁血红素、叶绿素、类咕啉等化合物。ALA在生物体内通常有两种合成途径,C5途径和Siemin(C4)途径 (Petricek et al.,2006)。在(5途径中,完整的谷氨酸碳骨架在谷氨酸tRNA连接酶、还原酶及一个氨基变位酶的作用下生成ALA,这个过程常存在于植物和大多数细菌中。而Siemin 途径,则是甘氨酸和琥珀酰辅酶A在5-氨乙酰丙酸合成酶作用下直接生成ALA,这个途径常被认为存在于动物、真菌及许多光合细菌中(Avissar et al.,1989)。而最近的研究发现 Shemin途径也常存在于链霉菌的ALA合成过程中Oiang et al.,2010),还发现有的链霉菌同时具有C5和Shemin(C4)两种途径(Petricek et al. ,2006) ALA可以在5_氨乙酰丙酸辅酶A连接酶的作用下环化生成C5N结构单元,然后在酰胺合成酶的作用下,进入到手霉素类化合物的代谢过程。
手霉素化合物一般具有良好的生物活性,手霉素A是Ras蛋白法呢基转移酶抑制剂(Hara et al.,1993)和白细胞介素_1 β转换酶抑制剂(Tanaka et al.,1996);抗生素 U-62162和U-56407选择性地抑制革兰氏阳性细菌,而对革兰氏阴性菌没有抑制效果冲尼霉素A对乳腺癌及黑色素瘤具有显著的抑制活性(IC5tl = 2. 41 μ g/mL);以商品农药作为对照,中尼霉素对农作物病原真菌的抗菌效果明显,优于武夷菌素水剂、克菌康、宝丽安及百菌清等商品农药(李富超等,2009),具有很好的开发前景。
手霉素类化合物的生物活性与其结构密切相关,随着手霉素A和中尼霉素整个生物合成基因簇的解析,可以从基因和酶催化两个层次理解链霉菌进行抗生素生物合成的机制,进而可以实现手霉素A和中尼霉素结构的定向改造以及利用组合生物合成手段创制生物活性更高的手霉素类化合物,并且实现手霉素类化合物产生菌的分子育种、发酵工艺优化,高效积累手霉素类目标化合物。发明内容
本发明目的在于提供一种手霉素类抗生素生物合成基因簇。
为实现上述目的,本发明采用的技术方案为
一种手霉素生物合成基因簇所述手霉素生物合成基因簇碱基序列如SEQ ID NO. 1所示,其中手霉素生物合成基因簇为手霉素A和中尼霉素的生物合成基因簇,
1)手霉素A和中尼霉素的生物合成的结构基因编码3-氨基-4-羟基-苯甲酸 (3,4-AHBA)合成酶的chiAl ;编码3-氨基-4-羟基-苯甲酸(3,4_AHBA)羧基腺苷酰蛋白的chiA2 ;编码醛裂合酶的chiA3 ;编码3-羟丁酰辅酶A脱氢酶的chiBl ;编码芳香胺N乙酰转移酶的chiB2 ;编码3-氧乙酰基载体蛋白合成酶III的chiB3 ;编码3-氧乙酰基载体蛋白合成酶III的chiB4 ;编码酰基载体蛋白的chiB5 ;编码硫酯酶的chiB6 ;编码3-氧乙酰基载体蛋白还原酶的chiB7 ;编码酰基脱水酶的chiB8 ;编码酰基脱水酶的chiB9 ;编码 I/II型酮合成酶相关的酰基载体蛋白的chiCl ;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA) 载体蛋白的chiC2 ;编码3-氧乙酰基载体蛋白合成酶II的chiC3 ;编码酮合成酶的chiC4 ; 编码甲基丙二酰辅酶A变位酶的chiC5 ;编码硫酯酶的chiC6 ;编码酰胺合成酶的chiDl ;编码5-氨乙酰丙酸合成酶的chiD2 ;编码5-氨乙酰丙酸辅酶A连接酶的chiD3 ;编码氧化酶的chiEl ;编码黄素还原酶的chiE2 ;编码黄素依赖的单加氧酶的chiE3 ;编码黄素依赖的氧化还原酶的chiE4 ;共25个基因;
2)手霉素A和中尼霉素的生物合成的调节基因编码LuxR家族转录调节子的 chiRl ;编码TetR家族转录调节子的chiR2 ;编码调节蛋白的chiR3 ;共3个基因;
3)手霉素A和中尼霉素的生物合成的转运基因编码抗药性转运蛋白的chiMl ; 编码分泌蛋白酶的chiM2 ;共2个基因。
所述手霉素A生物合成基因簇用于培育手霉素A的菌株及其突变菌株。所述中尼霉素生物合成基因簇用于培育中尼霉素的菌株及其突变菌株。
所述手霉素A生物合成基因簇用于其编码蛋白催化合成手霉素A及其类似物。对所述手霉素A生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到手霉素A 的结构类似物。
所述中尼霉素生物合成基因簇用于其编码蛋白催化合成中尼霉素及其类似物。对中尼霉素生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到中尼霉素的结构类似物。
本发明提供了产生手霉素A和中尼霉素生物合成基因被阻断或加倍的微生物体内的途径。
本发明提供的核苷酸序列或部分核苷酸序列,可以利用聚合酶链式反应(PCR)的方法或包括本发明序列的DNA作为探针以Southern杂交等方法从其他生物体中得到与手霉素A或中尼霉素生物合成同源的基因。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从海洋链霉菌Mi^ptomyces griseoaurantiacus M045的基因组文库中定位更多的文库质粒, 这些文库质粒至少包含本发明中的部分序列,也包含链霉菌M045基因组中邻近区域以前未克隆的DNA。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。途径包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化,或通过紫外或化学试剂进行诱变等。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达系统,包括链霉菌、芽孢杆菌、假单胞菌、大肠杆菌、酵母、植物和动物等,进行异源表达获得相应的酶或高活性的代谢产物。
手霉素A和中尼霉素生物合成的修饰基因、调节基因、膜蛋白相关基因的核苷酸序列提供了通过缺失或改造这些修饰基因、调节基因、转运基因而得到手霉素A和中尼霉素结构类似物,或者使手霉素A和中尼霉素类似物产量提高的途径。
本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备。
本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或提高了产量或优化了蛋白动力学特征或其他致力于得到的性质。
本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。
本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组载体以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。
本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过中断手霉素A或中尼霉素生物合成的一个或几个步骤而得到新的手霉素或中尼霉素结构类似物或前体。包含DNA片段或基因可以用来提高手霉素、中尼霉素或其衍生物的产量,本发明提供了在基因工程微生物中提高产量的途径。
本发明所提供的聚酮合成酶可以通过缺失、插入或失活来自于相同或不同的聚酮合成酶系统的一个或多个聚酮合成酶结构域、模块或基因而产生新的聚酮化合物。本发明所提供的核苷酸序列或至少部分核苷酸序列的片段或基因可以用来构建聚酮合成酶库或聚酮合成酶衍生库或组合库。
本发明所提供的手霉素A骨架的后修饰基因提供了通过遗传修饰得到类似物的途径,所包含的催化从手霉素A到中尼霉素的氧化反应可有其他应用,包括进行卤素的取代。综上,本发明所提供的包含手霉素A和中尼霉素生物合成相关的所有基因和蛋白信息可以帮助人们理解手霉素类天然产物的生物合成机制,为进一步遗传改造提供了材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
图1为本发明实施例提供的手霉素A、中尼霉素A、中尼霉素Kasukamycin的化学结构。
图2为本发明实施例提供的手霉素A和中尼霉素基因簇的结构组成图。
图3为本发明实施例提供的构建的基因敲除载体PHZ132D2。
图4为本发明实施例提供的从链霉菌M045野生菌株及突变株基因组上扩增硫链丝菌素的抗性基因tsr电泳图(图中M :Trans2K Plus II DNA Marker(TransGen Biotech) ;1 空白对照;w 野生菌株;a-e 转化子;ρ :ρΗΖ132质粒阳性对照。)。
图5为本发明实施例提供的以tsr为探针,进行总基因组DNA的酶切Southern Blot 分析图(其中m ADNA/EcoR I+Hind III marker ;w 野生菌株;a_e 转化子;ρ ρΗΖ 132质粒阳性对照。)。
图6为本发明实施例提供的HPLC分析链霉菌Μ045野生菌株(w)和突变菌株(a, b,c)代谢产物的变化图(其中化合物1 中尼霉素A ;化合物2 中尼霉素B ;化合物3 手霉素A ;化合物4 中尼霉素Al ;化合物6 手霉素Al。)。
图7为本发明实施例提供的中尼霉素A、中尼霉素B、手霉素A、中尼霉素Al、中尼霉素Bi、手霉素Al的化学结构。
图8为本发明实施例提供的5-氨乙酰丙酸合成酶(chiD2)和连接酶(chiD3)参与的C5N结构单元合成的Siemin途径。
具体实施方式
本发明中所述的手霉素A和中尼霉素的生物合成基因簇包含30个基因的核苷酸序列或互补序列(序列1),具体为(1)负责手霉素A和中尼霉素的生物合成的结构基因共25个基因:chiAl, chiA2,chiA3,编码蛋白负责中心结构C7N的生物合成;chiBl, chiB2, chiB3, chiB4, chiB5, chiB6, chiB7, chiB8, chiB9, chiCl, chiC2, chiC3, chiC4, chiC5, chiC6,编码蛋白负责两个聚酮侧链的生物合成;chiDl,chiD2, chiD3,编码蛋白负责C5N结构的生物合成;chiEl,chiE2,chiE3, chiE4,编码氧化酶,负责手霉素A环氧结构形成,以及氯的取代和基团重排;( 负责手霉素A和中尼霉素的生物合成的调节基因chiRl,chiR2, chiR3,共3个基因;C3)负责手霉素A和中尼霉素的生物合成的转运基因chiMl,chiM2,共 2个基因。
chiAl位于基因簇的核苷酸序列第23831-M949碱基处,长度1119碱基对,编码 3-氨基-4-羟基-苯甲酸(3,4-AHBA)合成酶,372个氨基酸;
chiA2位于基因簇的核苷酸序列第2507546493碱基处,长度1419碱基对,编码 3-氨基-4-羟基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白,472个氨基酸;
chiA3位于基因簇的核苷酸序列第14395-15195碱基处,长度801碱基对,编码醛裂合酶,266个氨基酸;
chiBl位于基因簇的核苷酸序列第2^41-23734碱基处,长度894碱基对,编码 3-羟丁酰辅酶A脱氢酶,297个氨基酸;
chiB2位于基因簇的核苷酸序列第21942-2^08碱基处,长度867碱基对,编码芳香胺N乙酰转移酶,288个氨基酸;
chiB3位于基因簇的核苷酸序列第20308-21357碱基处,长度1050碱基对,编码 3-氧乙酰基载体蛋白合成酶III,349个氨基酸;
chiB4位于基因簇的核苷酸序列第18314-19336碱基处,长度1023碱基对,编码 3-氧乙酰基载体蛋白合成酶III,340个氨基酸;
chiB5位于基因簇的核苷酸序列第19409-19639碱基处,长度231碱基对,编码酰基载体蛋白,76个氨基酸;
chiB6位于基因簇的核苷酸序列第21378-21935碱基处,长度558碱基对,编码硫酯酶,185个氨基酸;
chiB7位于基因簇的核苷酸序列第2743848142碱基处,长度705碱基对,编码 3-氧乙酰基载体蛋白还原酶,234个氨基酸;
chiB8位于基因簇的核苷酸序列第沈490力6966碱基处,长度477碱基对,编码酰基脱水酶,158个氨基酸;
chiB9位于基因簇的核苷酸序列第26969-27421碱基处,长度453碱基对,编码酰基脱水酶,150个氨基酸;
chiCl位于基因簇的核苷酸序列第15248-155 碱基处,长度279碱基对,编码I/ II型酮合成酶相关的酰基载体蛋白,92个氨基酸;
chiC2位于基因簇的核苷酸序列第15523-15789碱基处,长度267碱基对,编码 3-氨基-4-羟基-苯甲酸(3,4-AHBA)载体蛋白,88个氨基酸;
chiC3位于基因簇的核苷酸序列第15779-16969碱基处,长度1191碱基对,编码 3-氧乙酰基载体蛋白合成酶II,396个氨基酸;
chiC4位于基因簇的核苷酸序列第16966-17853碱基处,长度888碱基对,编码酮合成酶,295个氨基酸;
chiC5位于基因簇的核苷酸序列第85-222碱基处,长度138碱基对,编码甲基丙二酰辅酶A变位酶,45个氨基酸;
chiC6位于基因簇的核苷酸序列第17850-18317碱基处,长度468碱基对,编码硫酯酶,155个氨基酸;
chiDl位于基因簇的核苷酸序列第65四_8109碱基处,长度1581碱基对,编码酰胺合成酶,5 个氨基酸;
chiD2位于基因簇的核苷酸序列第8114-9340碱基处,长度1227碱基对,编码 5-氨乙酰丙酸合成酶,408个氨基酸;
chiD3位于基因簇的核苷酸序列第9452-10990碱基处,长度1539碱基对,编码 5-氨乙酰丙酸辅酶A连接酶,512个氨基酸;
chiEl位于基因簇的核苷酸序列第5239-6423碱基处,长度1185碱基对,编码氧化酶,394个氨基酸;
chiE2位于基因簇的核苷酸序列第19639-20196碱基处,长度558碱基对,编码黄素还原酶,185个氨基酸;
chiE3位于基因簇的核苷酸序列第12173-11064碱基处,长度1110碱基对,编码黄素依赖的单加氧酶,369个氨基酸;
chiE4位于基因簇的核苷酸序列第观209力拟67碱基处,长度1059碱基对,编码黄素依赖的氧化还原酶,352个氨基酸;
chiRl位于基因簇的核苷酸序列第3639-4331碱基处,长度693碱基对,编码LuxR 家族转录调节子,230个氨基酸;
chiR2位于基因簇的核苷酸序列第4964-4377碱基处,长度588碱基对,编码TetR 家族转录调节子,195个氨基酸;
chiR3位于基因簇的核苷酸序列第644-3439碱基处,长度2796碱基对,编码调节蛋白,931个氨基酸;
chiMl位于基因簇的核苷酸序列第12510-14039碱基处,长度1530碱基对,编码抗药性转运蛋白,509个氨基酸;
chiM2位于基因簇的核苷酸序列第四514_30914碱基处,长度1401碱基对,编码分泌蛋白酶,466个氨基酸;
序列表SEQID No. 1 为
atgcggaaggccgccgagggcgaggacaacgtcctctatcccatgaaggaggcgctcgcc60
gcaggtgccacgatcggggaagtgtgtgacacattgcgggaagtgtggggaacgtaccgt120
ccaaacgatgtcttttgacgaggaaaatttctcgtaatgtcgcccgacgcacgggctcgg180
ggctcccgttgtgagaaacggcacggtccgagcccgtttagggccctcacgggaaccctt240
tccacggccttcgcggtcggccggcgggcacacctccggacgtcccggaatactccgcca300
CgCgCCgCCCggcgaaaggtagactcggccgaaaagttcgaacagttcgactccagggaa360
tggggaattgccgagtaatgcccactgccggaatgaccgcctcaaacgaccgaattcagc420
cattgtttatccctgaattggttcatctttcaagagtctctcgctgtcgtccctgacgcg480
cggccgtccaggccgctccctgccaccgcgcgctccctctccccacagtccatgtcgtcg540
cgccatgccaggagtactcatgctcagccaggaccagcgttccggggtcgcagtgccgcg600
cccggacgatccgcagcccgtacggttccgggtactggggccgctcgccgtccagggcag660
ggacggccgggccatcccggtgcccgggacgaagcagcgggcggtgctcggttatctgct720
gctgcaccccaaccaggtcgtcgccaccagCCggCtggtCgacgccctgtggccgggcag780
aaagcccgtcaccgcccggaagatggtgcagaacgccgtctccgcgctccgtaccgcact840
CgCCCggggCaacgggccggacgacgaggtggtcctgctgacccacgcgcccggctatct900
gctgcgcgtcgaccccgagctgatcgacctgcaccgctccCggCggCtggccgagcaggg960
acggcgcgaaCtggCCgCCggctcgccggcCgCCgCggCCgagtccttccgccaggcgct1020
ggcgcagtggaacggcgcggtcctcgcggatctcgtggaggccggggcctcctggccgga1080
actcgccgcgatgtccgaggagcgccaggcgatccgtgaggaccgcgccgacgccgaact1140
gcgctgcggccggcaccagacggtgctcggcgagttacgtctcctcgccgaggctgaccc1200
gctgaacgagCggCtgtgCgcactcctcatgctcgcgctgcaccgcaacggcaaacccgt1260
cgaggccctggagctctaccggcgccaacgggacctgatcgccgagaggttcgacagcga1320
gcccacccgggaactgcgggacctcgagcgggcggtgcgcacccgggacccggccatcga1380
cccgcccgcaccggcgcagacggtcccgcccctcgccccgcccgaggaggtcgccgcgga1440
cctcgcggcggaccggtcggCgCCCCCggCggcgacccgcgccgtgttccgcccgccgcc1500
CggtgCgCCCccctcggcgctggtcaccgaggccctcccgtcggcccccgtgctcgccac1560
gcccaccggggaggacgccccgccggggcaCgCggCgggggaacgcaaacggctgagcgc1620
cgtcctggtgcgggtcgagcCgCCggCCgCCgtCgggggCgacgacgcggaggccttcga1680
catccgcttccgcgaggtgtCggCCgtggtcgcggaggaggccgcgcggtacggcggaac1740
CgtggCCggCcggatcggctccacgctgctgatgctcttcggggtgttccgcagccgggt1800
ggacgacgcgctgcgcgccgtgcgcgccgggcacgcggtgcacgaccggctgctgcggct1860
cgccctgcccctcggcgtcgtacccggggcgggacgggtgcgggtggcggtgtcgaccgg1920
ggacgcgctggtccggttcaccgaggcgggccaggacgccgcgcccatggtcgtcggcgc1980
cctgctcgaccagtgcctgcgccagctggagtccgccgagccgggccacatcaaactgtg2040
cgacgccaccCgCCgggCCgCCCggCtggtcaccgccgggctcggcgacccgctggacag2100
cggctcggcctccgccgccgtggcggccctcggccggtccCCggCCgCgCcgggtgcgag2160
ggccccgctggtggaacgcgaggccgaactggacgtgctgaccgccctgttcaaccaggc2220
ggtgcgcaccggcaggccgcaccagatcagcgtgctcggcgaacccggcgtgggcaagac2280
caggctggtccaggagttcgCCCggCtggtgggtgcgcgcgcggaggacgcgcacctgct2340
gcggctgcggatgcccgtcctcggccgccccaccggccggaccgcgctcggggaactggt2400
cggcctgtgcgcgggtctgcac ccggcggacccgccgcacaccgtcgacgacaagctctc2460
ggcggcgctgcggcgctggctcggcccgcgggtggtggaccgcgagacggtcctcggcca2520
tctgcgcgccctggtcgccccggcgcacacCggCggCgtCctcgacggcgaggcggtcgc2580
cgcctgccggcggatgctggaggcgctcgcggcggagcggcccctggtgctcgtcctgga2640
ggacctgcacctcgcggacgacggggtgctggacttcgtcgacggcctggccgagtcctc2700
ggcccggatcccgctgctggtcgtcaccaccgcgcgtcccgacctgatcgaacgccggcc2760
cacctggggcggcgggggctaccgcacgacgagcaccatgcacctggaacccctgagcca2820
ggacgcctcggcgcgcctggtgagccggttgtgggaacagtggggcgtgcggcgcaccct2880
cgaccggtccgacctcacctcggtgacgggcggcattccgctcttcgtcgtggagtacgc2940
cgccctgttcgggcggccctcgccggcggagcgggcggaggtctgcggcgcgtggccgga3000
gcatctgcccgagcgggtcagggcggtggtgaccgagcacatcgacgccctgcgcccgca3060
ggccaaggcggtgctgcgggacgcctcggtccaggggccccggttctggtcggaggccgt3120
CgCggCCgtgggcgggcgggaggtggccgagtgcgagcggtggctcgcccatctcgaacg3180
ccgccacttcctggtccgggccgaccgcagctccatcccgggctcggacgagtacgtctt3240
ccgcagcgcctgggtgcgcgaggtgacccggctgtcggtgctgcagcccgcccgccggga3300
ggggcggcggcgggcggacgcctggctcgcggagcgggcggcggggatccggtgactgtc3360
cagtggaccgggagtggaactgtgcctctaCggtCCgggCcgggtcgctgacatgcttct3420
CCCggggCCggagagagcactggtccccggggagacccgagggcacgcgcgtgacacggc3480
gcaccgccaccggctccgggacagatccgcaacgcaccaccagatgggtccagttcgtat3540
tagggggatgaccgatgtcgtacgttcagacgcaacccgcctcacccaccgcgcccaccg3600
ctctgacggcCgCCCggCCggtgctcacggtcctgccgaacgaggtcgcgCgCCgggggg3660
tccgcagcctgctcgacggtcccggccacggacgcgccgtggtggcctgccccgctcccg3720
aggaggccgcggccctgctgcgcgccgagcggttcggcctgctgatcgtctcggccgcct3780
acggcgaggcgcgcctggccgaactggtcggggagagttcccggtcggacgtgaagtcgc3840
tgctgctgctggacagcgcggagcccgagtacattccgtggatcgccgccatcccgttcg3900
acggctatgtgatgcaggaggacctgacgccggattcgatggcggaggcactgcggcgtc3960
tggagcggggcaagctgccgatacccgacacgctcgcccggctcttcatccggcacgccg4020
gccgcagccggggcacgcaccgcagcccccgggtccagctcacgccgagggagcaggcgg4080
tcctcgggctcatcgcggaggggctgagcaaccggatgatcgcgcaccggttcggcatct4140
cggagcacggggtgaagcgccacgtggccaacctgctggccaagttcaactgctccaacc4200
gtgcccaggcggtctcggtggcactgcagcagggactgctggcctgacgtCCCCgCgCCg4260
gcgcccctccCCCgggCCgttcccggtggggatcagtccgtcgaggacagggcgtgccac4320
gcgccctcggccatggcggcggcctcgaccggttccggtgccagcagccagtggcgcagg4380
acgccgatgaaggcgccggccgcgcagtgcgcccgcagcgCggtgCCggCgccgttccgc4440
ggcccggccggggaggcggtgagetgccgcgccacctcctcggcgaccagttgctgcagc4500
cggttcaggaaccgggcggagccgcaggggcccagcatgcgccggtagagcacgagttgg4560
gactccacgtgccggaagacgtcggcgaaggccggcggtgtcctgaccgggccgtccacc4620
agggggcagcgggcgagcaccgccaccagcgcggtcagctcgtcctccatggcgtccagc4680
agcagcgcgtcccggtcgctgtagtgctggtagacggtggcgcggttcaccgtcgcccgt4740
tcggccacgtgggccacggtgatgcccgacagctcgcgctcggcggccagttcgagtgcc4800
gccgaccgcagcagcgcccgggtccgcagcacccgcggatcgacgcgcttggcgccgtgg4860
tctgtcgtcgtgtcgggcattcgcccagattacacctgtacccaacaggtgtcgcagagt4920
gatccggccgggccgaggggCggtgCCCggCCggCCgCgCCCgCCCggtggtccggggcg4980
gccggacgggCgCCgCCgggCgggCgCCCCgaacggcccgcccggacgggtctgggcgcc5040
cggcgggggcttcgtgaggatggccgaccagtgacggccacacaacggaggaacccgatg5100
accgcaagcgatcggaacccagtcggcggcCCCggggCCgaggtggacgtgtgcgtgacc5160
ggcggcggctcgaccgcgctcctcgcggcgctgctctgcgCgCgggCCggccgctcggtg5220
ctgctcgtggcccccgaggcggagttcgagCCggCCggCgcgggcatctcccccctggtg5280
gccccgccgaccctcggcctgctcgccggggagggcgtcgaggaggaactgctgggggcc5340
ggtcagcgcatcctcggcgccgacgaccacgggcgggacgggctcctctcCCgCtggCgg5400
tactacgacctccccggcatcgcccgcccctacgggctgacggtgccgaccggcacgctg5460
gtgcaggcgctgctcgcccggctgcgcgccgaaccgtccgcgaccgtgcgcaccggccgt5520
cgggtgaccgccctcggccaggacgaggacggtgtcctcctcaccttcgccgacaccacc5580
gcaggcaccaccggtgacggtgccgggggcggggccgaggaacgggtgagggcacggtac5640
gcggtcgccgcggacggccggcactccccgctgcgcgacctgagcggcatcaccgtccgc5700
gacacaccgttcgggcgtccgggctggctggtggccgcgccggtcgtgccgaggcgcgag5760
cccgtgctgctcgtgcggcaCCCggCCCCgcaggcgctgttcaccgtgcccacgccgggc5820
gactcgatggccgtcgtgtggtgccccgaccgggagcagggcgaggctctcgggcaggcg5880
gacccggaggtgttcgccgggcagatcaagacggtcgaccccgagctcgccgactggctc5940
ggcgaggtccgcgaccgcacctccccggtgttccggatcgacttcgcgatgtggcaggcc600010
gcgtcctggcgccggggccgggtgctgctgctcggcgagtccgcgcacgggatgcacacg6060
ctcggcgggcagggactcaaccagtccctgcacagcgccgcctcgctggcCCgCgCggtg6120
gacgaggcgctcgcgcacaaggaccccacgcgggtggaggcgtacgagcggatccgccgg6180
ccgcacgtggagcggctgcaggaactgcagtggaacacccCggCgCtgCgctcctacgag6240
gccgagccgcctcggcgcggcgcccaccaggacttcgtcgaggtgatgacgacgctgcag6300
ccggagctcgccgagcagctCggtgCCggCgcccgctgaggacgccgtcaccccacgcac6360
ccgcaccgccgaggcgaccggctcgcccggctcgtccacgcccccgcaccactcaccgca6420
gcacgcatcgaatcgaggtcgaccatggctctaccggacggctggtgggcaccgcacgac6480
ggttatgtcgcgcgggtactgtccgcgctgaccgcccagccggatcgcatcgccgtgcac6540
tggcggcaacaggccctgaccggaggcgagttcgccgcctCggtCgCCgtgacggccgcg6600
cgactgcgggagctgggcgcCgggCCgggCgccgtggtgggcgtcctgaccgcgtccaac6660
agtcccgacatgctgcgggtccgctacgcggcccacctgctgggcgcggccgtctgccac6720
gtgcggtccaccaaccccggcacctccgggccggcactgcccgtcggggaacagctccgc6780
atcctcctcgacacccgggtCCgggtgCtgttcaccgacgcggagaacgcCggCCgCgCC6840
cgggaactcgccgagcgcgcCCggggCCgtgtcgccctcgccgaggccggtgccccgggg6900
gacgtgcgggagccggccgcCgtgCCgtggcgaccgcgcgCCCtggCggtgatcgggttc6960
accagcggcagcaccggccgtcccaaggggatcaggctgtCggCggCggCctgggacaac7020
ctcgtggaggtgaccgggcaggccttcaccggcgaggcggggacggccgcccggctgctg7080
gtgacgaccccgctgagccataccgtggccaccatggcggacgccgtgctggccggcggt7140
ggcaccgtcgtcctgcacgaggagttcgcgccggagcccgtcctgcgggcactgaccggg7200
caccggatcagccacaccttcatggccaccgcgcagctgtaccagctgctcgaccacgcg7260
ccgctgcgggaggccgacctgtccgcgctgcgccagctcatctacaccggcagcgccgcc7320
gcgcccgcccgtgtcgccgaggccgtccgtctgctcgggcCggtgCtggtgcagggctac7380
gggaccagcgagagcggccggatcaccctgctgcaccccggcgaccaccaggatcccggg7440
ctgcactccaCCgtgggCCgcccgttccccgagaacgagatcgccgtccacgaccccgag7500
accgaggaggagctccccccgggcgcgacgggcgaggtgtgggtgcgctccccgcacctg7560
atggacggctactgggccgacccggcgctgagcatgcgcacgctgcgccggggctggtac7620
cggaccggcgacctcggccggatcgacgagCggggCtgCCtgtccctgctcggccggatc7680
gcggacgtggtcaagacggacggggtgctggtccatccggcggtcgtcgagcggcggatc7740
ctcacgctccccggcatcgcgcaggccgccgtcttcgcggtgcgcgacccggatctcgtc7800
gagcacctcaaggccgccgtCgtgCCCCggCCgggtgCgCggatcgaggccgaggacgtg7860
cgggcgcacctcgccgcgggcctcggcgccgggcacgtgcccgaggaggtcctgatcctc7920
gacgcgctgccgctgaacgccgggggcaagccggacaagcgccggctccgtctcgcctgg7980
cacggcaccacccattcgaacacccccgtacgagaggtgagttgacgccatgaaccgact8040
cctggaccacttcgccggtgaactggaggccctcggcgggcagcgcagggacttcctgga8100
gatcggccgcCgCgCCggCCgcttccccagtgctctcgcccggctgcaggacgccccctc8160
cgacgtggagatcagcgtctggtgcagcaacgactacctcggcatgggccagcacccctc8220
ggtgctggaggcggccaagaacgccgtcgacgccttcggcgccggctcgggcggctcccg8280
caacatcggcggcacgaacttctaccacgtgctgctcgaacaggaactggccgagctgca8340
cggcaaggag gcggcgctggtcttctcctccggttacacggccaacgacggggcgctgac8400
ggtgctcgcg ggccgggcgccgggcacgctggtcttctccgacgcgctgaaccacgcctc8460
gatcatcgac ggactgcggcacagcggcgccgagaagcgcatcttccgccacaacgacgt8520
cgcccacctg cgggagctgctggccgccgccgatcccgagcggcccaagctgatcgtgct8580
ggagtcggtg tactcgatgtccggggacgtggcgccgctcgccgagttcgcggacctggc8640
ggaggagttc cacgcggccacgttcgtcgacgaggtgcacgcggtgggcatgtacggccc8700
gcagggcgcc ggcatcgccgcccgggagggcatcgccgaccggttcaccgtgttcatggg8760
cacgctcgcg aagggattcggcacggcgggcgggtacatcgccggtccggccgacctggt8820
ggacgcggtg cgcgccctgtCCCggCCgttcatcttcaccacctcgctcccgccggccac8880
cgcggccagc gcgctggcggcggtgcagcacctgcgctcctcggaggcggagcgggaccg8940
gctcgcggcc aacgccgggctgctgcaccggctgctgggcgagcggcggatcccgttcgt9000
ctcggacgag tcgcacatcgtgtcggtgttcgtcggggacgacgcgcagtgccgccgggc9060
ctcggcgatcctgctggagcggcacggcatctacgtgcagccgatcaacgcgcccagcgt9120
CCgggCgggCgaggagatcctgcgggtggcgccctccgcgacgcacaccctcggtgacgt9180
ggagaagttcgccgaggctctggacggcatctggcaggaactgggcatccCgCgCggCgg9240
ggtccgcggcgcctgaccccCggCgggCCCgcgcgtccgtgccgggcgcgCggCgCCCgC9300
CCCgtCCCgtcccggcaccctcgcccggaggcgcatgaccggccgggcggaacggagttg9360
atgacccatgtccctctcgctggccgccgtgctcgccgagCCggCCgCCCgacgcccgga9420
ccacccggcgatcgtcttcgacgggcaggaggtgtcgtacgcccggctgtggcaccgggc9480
gcggagctacgcggccgtgctcggtgagcggggggtccggcccggtgaccgggtggccct9540
cctgctgtccaacacaccgcacttcgccatggcctacttcggtgccctcgCggCCggtgC9600
CgtCgtggtgccggtgcacgcgctgctgaaggcggaggagatcgcctacgtgctgcgcga9660
cagcggggccCgCCtgCtggtctgcgggggcgccttcctcggcgagggcgccaaggcggc9720
cgagatggcgggcgtcgaggtgctgaccgtcctcgccccgggggagccggCggCgCgCCg9780
cctcgacctcctggccgagcggtccgcgccggtggagacgtacctgccgcgcgcccccgc9840
cgacgcggccgtcgtcctgtacacctccggtaccacgggccggcccaagggcgcggtgct9900
cacgcatctgaacctcacgatgaacatcggcgtcacgatgctctcccccttcgacttcca9960
cgccggggacgtgctgctctgcccgctgccgctgttccacaccttcgggcagatctgcgg10020
catgggggtgtgcttccgggcgggggcgacgatggtgctgatgccctccttcgacgcgga10080
ggaggccctcgagctgatgtgccgtcacccCCgCgCggtgttcatgggcgtccccaccat10140
gtacctggcgctgctcgacgCCgCCCgCgCgcggcgggcgCCCggCCggCcgctcctcgc10200
ccgcgcctactccggggggtCCgCgCtgCCggtgaaggtgctggaggaggtcgaggaggt10260
cttcgactgcccggtgtacgagggttacggcctgacggagacctcgccggtggtcgccta10320
caaccagccgggcctgccccggcgtcccggcaccgtgggcCtgCCggtgtggggcgtccg10380
ggtggccgtcaccgcggccgacacggcggaggtcgtcccgCtgCCgCCCggcgaggtggg10440
cgaggtcgtcgtgcgcgggcacaacgtgatggccgggtacCtgggCCgCCccgaggccac10500
cgccgaggtgctggtggacggctggttccgcaccggcgacCtgggCgtCCtggacgagga10560
gggccggctgaccctggtggaccgcaagaaggacatggtggtgcggggcgggtacaacgt10620
gtatccgcgcgagatcgaggaggtgctgtcccggcatccggcgatcgcgcaggtcgcggt10680
gatcggcgtgccccacccccgttacggcgaggaggtgtgcgcggtggtgcgcaccccgcc10740
cggcacggacggcaccgcgcggctcggtgccgagatcgtggcgtggagcagggaacggct10800
ggccggccacaagtacccgcggcgcgtggagttcgtggactccttcccgctgggtccgag10860
cgggaaggtgctcaagcgggagctcgcggcCCggttCgCggcgtagggcgtacggcggcg10920
ggcgctgcccggcatccctcggggtgccgggcagcgcccgtcgtggtgtggtccgcgggt10980
cacctgccggagagggcgcgggcgaggtccgccgtccaggtgtaggagtcggtgacgccc11040
ttgagggagccgttgaaccggggggcgacgaagcgggcgaggagttcgaggctgcgatgg11100
gtggcctcgcggtccgcccagtccatcacgttgaccagcaggcgcccgaagccgccggtc11160
tcctgctgcacgtcccggatggcctcggtgacctcgtcgacggagccgacgagggtgccg11220
cgctgctcgatcagttcctccagcagcgcgCgggCCtCggcgcgtgaggcgacgggcggg11280
gtgccgagcagggcccagtaCtCgttgCggtaccgggtccagccgtcgacgatctcgtcc11340
agggcccggtcccggctctccgacacgtgcacggtcagcgcgacccgccactcggcccgg11400
tccagtttgtggccgtgctcggcggcggactcctcggcgtgctgccactggccgacgagg11460
tcgccgatccggctgcccggCttCggCgggatgccgaaggacagcggggcgatgccgtac11520
tggccggccagccgcatgccgaacggggagacggcgctggagaccgccatcggcagtccg11580
gccggggtgctcggccgcaggtgcagccgcgcgtcgcgcagccggaaccagtcggtctcc11640
cgggtgacggggccctccccggcgaccagttggcggatgacgtccagggaCtCggCggtg11700
CggCgCCgggtgtccgccgggtcgatgccgaggaagtgcatgtcggtggggatggagccg11760
gccccgacgccgagggtgaaCCggCCgCgggtgaggtggtcgagctggagggcgcgcgtg11820
gccaccatgaaggggtggtggtagggcaggctcaccacgccggtgccgaggcggatgtgc11880
CgggtgCgCtCggCggCggtggcgaggaacagctcgggcgaaccgacggtcccccagccg11940
gccgagtggtgttcacccacccacagttcctcgtagccgagccggtcgagccactcggcg12000
agttccagatcccgccacaggctcagggcggggtcctcgcccagcgggtgcaggggcgac12060
aagaaggctccgaagctcatccggtccatggggctcctcactcacggaagtcgtggcgct12120
cgtgacggtcgtgccgagtctgtcgccgggggcccgggctttcgccccccgaacggaccg12180
gtccttccacggccccgaacaccgtggccgaacgcggtggccggacgcggcccgccgtac12240
gggcaccccggccgggcaccCCggCCgggCaccctccggcggccctacccgacacatgtt12300
gccaatccaacatatgttgtggaacgctgagcgtcatcgttcgtgacccactgcacaccg12360
gcaaccccgtgcgcggccggctcacgcgcccctgtccgtacccgcgacaagagaaagaga12420
ccgacgtgacgacccagcaggaacggaccccggcggaggagtccgaacgcatcggtcccg12480
atctgtggtggctcgccgccatcatggccttcggcagcttcgccgggctcctcgacgcca12540
ccatcaccaatgtcgccatcggtccgctggcctcggccttcgacgccgagatcgccaccg12600
tgcagtgggtggtgacgggctatctgctggccatcaccgccacgctcccgctcggcgcct12660
gggcgatggcCCggttCggggcccgcgagacactgctcttctcccaggcggtgttcctcc12720
tcggttccctgctctcggggCtggCCtgggacgcccccagcctgatcggcttccgggtgc12780
tccagggcatCggCggCggCctcgccctccccgtcggccaggccctcatcgcccaggcgg12840
CCgggCCCCgccgcctcaccaagctgatgtccctggtcacCgtgCCCgCCctgttcgccc12900
CgCtggtCggcccctcgctcggcggtgtgctggtcgaccacgcgagctggcggtggatct12960
tcctgatcaaCgtgCCgttCtgcctggccaccatcggcctgatcctgtggcgggtgcgca13020
acgtcatcgccccgacgaaggacgccgtcctggacaccctCggCCtggtgctgctcgttc13080
ccgccctcgccgggctgatctacgggttctccgaggccggCgCggCCggCgggttcaccg13140
ggacgcgcgccctcgcgggcCtgggCgCCggggtcgtgctcggcaccgccttcgtcgcgc13200
acgccctgcgccggcgcagcgaggccgtcctcgacctgcggctgttccgcgtacgggact13260
tcgcggccgggaacctggccagcatggtcatggccgtcgcgatgtacggcgtcctcatcc13320
cgctcccgctgtacttccaggtcgtccagggcaccagcgtgctggagtccgccctgatgc13380
tgctcccccagagcctcggctacctcgtcgcggtgtccctgctgcagcggctgaccgtgg13440
ccctcggcgtgcgcaccgtcaccctggccggtgtcgtcctCgtCggCgtgggcacgctgc13500
cctacgtcgtcatcgacgccgatccgagccgcttcctgctgggcgcggcgctggtggtgc13560
ggggtctggggctcggcgcctcgatgatgccgacgatgacggccgccttcagcagcgtgc13620
ccaaggaggtggtgccccgcgccaccagtgccttccacgtcttccagcgcatcggtgcct13680
cgctgggcacggccgtgctcacggtggtgctccagaacgaggccctgcgtcatctgcccg13740
aggaggtgccgggcctggccgccgtcgcgcccggcagtgccgtcgcccacgggctggcct13800
cgtccttccgggcgccgttctggtgggcgctggccttcacggcgctcgcgCtggtgCCgg13860
ccttcttcctgccgggccgcCgCCCggCCtccgctgccgacgaggccgacggggccgcgg13920
CgCgtCCggggacggcacccgtgctgtccgagtagccgccggtcccgtcgcacccgtcgg13980
ctccggctccgcggagccccgggccacggcaacccccgcggttcctccgcatcacccctc14040
acgcgccccgcgcggacgacgcagcacgcgtcctccgcgcggggcgcctcgcgtgcacgc14100
ccggcaccggaccgcctcacggctccgcctcccccaccgccctgcccgacCgggCCCCCt14160
cgcgctgcctgtccggccacctcctcgggcgtgctcccgttgcccctgccggagggccac14220
cccgttcgaggattccgcgcCCggCCCgCCcgccacagactcggatcaccaacagccgac14280
gcctgtgcgggcggacagggggaatggacgatggtggcactcgacaccggggcggcggtc14340
CgCCtggCCCggttgtcacggcaccgggacggacgcttcctcttcgtgcccatggaccac14400
tcggtggccgacgggccgatCgttCCggCCtcgcgcttcaacgacctggtcgcctccgtg14460
gtcgcgggcggcgccgacgcgatcgtggtgcacaagggccgggcccgcacggtcgacccg14520
gccctgctgcgcgactgcgcgctgatcgtgcacctgagcgccagtaccccgcactccccc14580
gacgccgacgccaaggtgctggtcggcgcggtggaggaggcggtgcgtctcggcgccgac14640
gcggtcagcgtgcacgtgaacatgggctccgacaccgaggcccgccagctcgccgacctc14700
ggcacggtggccgaggcctgccagcagtggtcggtgccgctgctggccatggtctacccg14760
cgcgggccccggatcgccgacccgcacgacccggcgctcctcgcccacgcggtcaacgtg14820
gcggccgacctgggcgccacgctggtgaagaccacctcaccgctgcccctgtcggagctg14880
tccgcggtcaccgcgagctgcccgatcccggtcctggtggCCggCggCggcgaccaggac14940
ggtgacctcaccgccttcgccaccgccgccgtggagtcggggtgcgcgggactggccgtc15000
ggccgccgggtgtttctcagcccctccccgaccgccgccctcaaggccctggcctccgtg15060
gtgcacgccgacccgccggtggggccactcggcgtcgacgccgccgtctgacgtcccgtc15120
tcccggcggaaaccgcagcccacccgcgtcggaaggaagacacatgcgcgacgagatccg15180
cgagttcgtcctcaccaccatccgtgaggtgatgaacctgccgctgtccgagaacgtcac15240
ggacgacaccccgctcggcgagaacggcctcggcctggaatcgctgtcccggctggaact15300
catgatccagctcgagagcgcctacggcatcgaggtccccgaggcggacagcgacgccca15360
gcaggacgcgaccctcggcgagttcgtggaCgCCgtggtggccctgcgcggcacggcggt15420
cgccgacggagccggccggtgacggacgacaccgccctcggcgcgctgctgcgcgactgc15480
gggctgctgaccaccgactccttcgacgacgacaccgaactcgtcctcgactcgctcacc15540
ctcgtctggctcgcccacctcctcgaggaacagcacggcatcaccgtgtccgtcgaggac15600
gagaacggcctggcctcctgCgCCtCggtgcgggacctgcgccggttcctcgccgaggcg15660
gcggagggcacccacacctctgcggagatccttcatggctcatgacgtcgcgatcaccgg15720
ccacggggtcctcaccgcgttcggcttcggtgaacaggccctgctggacggggtgttcgg15780
gggccggcccggcttcaccccggtcacccgcttcgaccccacgccctaccgggccgggca15840
tgccgccacctacgagggcgagggccccgagatccccggggtgccggtcaaacccggggt15900
gacaccgggacagttcgaggtcctggtcgcCtgCgCCgCCgccgcgctggagatggccgg15960
cacggacggcgccggcgcccCggtgCtgCtcggcaccaacggcgaccactccgccgcccc16020
ggacttctggtcgggcaccggcgcgcgcaccgccgccgacccccgcaccctcgacagcct16080
ccccgcccgcctgcccgagctgctcgcccgcgaactgggtctgggggcgccccggacggc16140
cttcgtgaacgcctgcgtggccggcaccaacgccctcgccCggggCgCggaactgatccg16200
ccgcggcctcgccgacacggtggtgtgcgggggcgcctacctggtcaccgaggacgtgtt16260
cgccaagttcgactccgggcgtgcgctgtcccccgaggacgccgtgcgccccttcgacgc16320
cggccgccaggggctgctgcacggcgacggggtcgccgtcCtggtgCtggaggccgccga16380
ccgggcacgggcccgcggcgcccgcgtcctcgccgggctcaccggctggggcatggcggc16440
cgacgcccaccacgtcatccagccgcatccgcggggggacggactggcccgggcggcccg16500
CgCCgCgCtgCgCCgggCgggcgcggagcccgggcggatcggctacgtcaacgcgcacgg16560
caccggcaccccgctcaacgacgtggcggagaccgcggcgctgcaccaggtgttcggcga16620
gggcgtccacggcgttccggtgagctccaccaagagcagcaccggtcacatgctcgaggc16680
caccggggcggtggaggccgtcatcacgatgctcgccctgcgcgagggcctgttgccgcc16740
caccctcggcaccctggagcccgaccccgcgtgcgacctggaccacgtgcgggacaccgc16800
CCggCCggCCcggatcacccacgcgctgtccctgaacgccgccttcggcggggtggacgc16860
cgcactcgtactggaggcgccgtgaccgtcccggacacccacccgcgcacccatcggacg16920
gcaggcccgtCCgCCCCggCgcgcgccctcctctcggcggcctgccgcacCCCCtggggC16980
ggcgcggcgaCCgggCtgCCcggcgcggcaccggtcgaactgccccgcgtcaccggcttc17040
gtgacctcccgcttcagccccctcgtgcacagcgtggccaccgagtgcctgggcgcgccc17100
ggctccgcggacgacctcgtCggCgCggCCgggccgcgtaccgggacggtcctggccacg17160
atgttcggggacacggtgacgctggacacggccacccggcggctgaccgagggccaggtg17220
cacagcccgctgctgttcttccagtccgtcaccacctcgatcctcggccggctgggccag17280
tcgtacggcatcaccggccccgtcgagtgcctctcggtcgcccgcgacggagccggcgag17340
gccctctcggccgccgatctgatgctggagcaggaggacatcgaccgcgtgctgctggtc17400
ggcgtcgagctcgccgccaatgagcgggccacctggatccaccggcgcatcaccgggccg17460
gacggtccggacccgctgcccgacggggactgcgccgtcgccctgctgctcgcccgcacg17520
gacgagggcaCCgggCgggtgctcctgcgcgccggcgcggggagcggttccccggcggac17580
CgggCCCCggcggacgcccgccactcccgcttcggctggctggcgcccctggtggcggcc17640
gccgaggccgtgcgcccgccggagggcgggCCCgtgCCgCgcccggtccgtgtgccgggc17700
cggtacggctacgtggtcgccccggcggacCgggCCgCggCgCCCgCCgCtccgggaggt17760
ccggcatgacggccgccgaatccgcccccggcacgctggtggcgcgcatgggcatcgaga17820
tcgtcgaggaggacccccggCggCtCgtCgcccggatgcccctgacggggaaccgccaga17880
tgtacggcttcctgcacggaggggccagcgcggccttcgcgcaggcgctcgccacgcacg17940
CCgCCgCCCtggaggccggcCCCggCggCCgggtcaccggccaggagctgtcctgcaccc18000
accaccgggcggcccgcggcgagggctgggtggaaggggtgtgcaccccgctgtacctcg18060
gcgacgcgttcggcacctacgacgtggccgtccacgaccggcgcggcaaccggatcgcct18120
CggCCCggCtcacctgccggCtgCggCgggCCgCCggCCCgtccgctcgccccgcgccca18180
ccggggagtccgcactttccagggagcccgcactttccgaggagtccgcatgagcacgac18240
cgagcccgtggaggacagggccgcggtactggccggcgtcgggggctgggtgcccccgca18300
cgtcgtcaccaacgacgacctctccgcccatctcgacacctccgacgaatggatccgcac18360
ccgcaccggcatccggaccaggcaccgggtctcccccggcatggccacctccgacctcgc18420
ggtggaggccggacggcgggcgctggactcctccggcgacgaccgggccggggccgtcgt18480
cctggccaccacgacacccgaccggatctgcccggccaccgcccccgacgtggccgcccg18540
gctcggcctggccggggtccccgccttcgacgtctccgccgtgtgcaccggcttcctgta18600
CgggCtggCgaccgcggcggggctgatcgccaccggcgtcgccgaacgcgtcctgctcat18660
cggggcggacgcgttcaccaccatcgtcgacccgacggaccgctcgaccgccgtcatctt18720
cgccgacggcgcgggggccgtcgtcctgcgggccggccggccggaggagcCCggCgCgCt18780
CggCCCggtggtgctgggcaccgacgggaccctcagccatctgatccgggtaccggcggg18840
CggCtCgCggcagcgctcgctggcccccacgcacgcgccgggcgagcagttcttccagat18900
ggagggccgggacacgttccggcacgccgtggaccggatggcgaccgcctcgcgccaggc18960
CgtCgCggCCgcgggctggtcgatggggggcgtcgaccggCtggCCgCgCaccaggccaa19020
cgcgcggatcctgcacgcggtggccgaccggctcggcatccccgccgagcaccagctctc19080
caacatcgccgaggtcggcaacacgggcgccgcctccatcccgctgctgctggcccagtc19140
cgccgcggacggcggcctggaggccgggcaccgcaccctgctcaccgccttcggcggcgg19200
tctcgcctggggcgcgaccacgctcacctggcccaagctgtcggccggctgagagcgccg19260
gccgccccgcgccacgccatccacctcccccacggagactcgtacccaaggagacgaccc19320
gaccatgttcacagcactgcgtgacatcctCgtCggCCCgttcaaggtcgatccggagaa19380
ggtcacccccgaggcgaccctggagcagctcggcctcgactcgctgtccgtcgtcgaact19440
ctcgctgatcctggagaaggacctcggagtgagcgtcaccgacgacgagttgctgcagac19500
cccgacgatcggcgccatggccgagctgatcggcgagcgcggcgccccggtctgatgccc19560
acctcgacgagcccgagcggccatgcccccgcggtccggcgggaggcgagcgacggcgag19620
gcctaccgccgcgcgatgggacggttccccaccggggtcgccatcctgacgcaggggtgc19680
ggaccgctgaCCCgggCggtgaccgtcaactcggtcacctccgtgtccctggacccgcaa19740
CtgCtgtCggtctgcctcggcgaggacagcacggtcctcgaaccgctgctgcgggccggg19800
cacttcaccgtgaacctgctgtccagcgcgcaacgcgagtCCtgCgCgCgcttcgccggc19860
cggagccggccgaccggggccgacgcccacgaggaactcggcgggagccggggggacaac19920
ggctgcctggtcgtcgagggCgCgCtggCCgccctggagtgccgggtcgacggcacggta19980
CgggCCggCgaccacgtcatCgtCCtgggCcgggtcgagacgctgcaccaCggtCCggCC20040
gaggcggagccgctggtcttctacggcggcggctaccgctggctggccccgcccgccccc20100
ggcccgcgctgacccggacactcccgcccgtcccccaccacgccaccaggcacggcgccc20160
cccgcacaccggcacacctgCCCgtgCgCCgcacggcacgccgcccgacacgaaggagcc20220
atcatgtccgaccacccgaggaccgccgaggcacagccgtgcggcgtgggcatcagggcc20280
atcggccagtacctgcccgagcgggtcgtcaccaacgccgacctggagcggatgatcgac20340
accagcgccgagtggatcaccgagaagatcggcatccactCCCggCggttcgcggcggag20400
agcgacaccaccgccacgatgggcgcgagcgcgctcctcgacgcgtgcacccgctccggc20460
gtcgacccggactctatcgacctggtgatetgcggcaccgtcacccccgacctcatggcg20520
ccggccaccgCggtgtCCgtcatgcggcacgcggggctgacccaggccgtggccttcgac20580
gtgaacagcggcggctgcgccggttccgtcttcgcgctcgacgtggccgccaagtacgtg20640
cgctccggcgcctaccgcagggtcgccgtggtgctcgccgacaccgtcaccaagctgctg20700
gacccgaccgaccggatgaccgcggtcatcttcggcgacgccgcggcctgctatctcgtc20760
gagccggtggtgcccggcagcggcgtcaccaccaccgtgctgagcaacgacccgagcggc20820
taccactcggcgctggtctcccgggacccggtcaccgacgccgagggcaaggaggtccac20880
tccgccttcgggcagaacttcatccgcatcgtcgggcgcgacatccgcaacttcgccctg20940
gagaacatcccgggcttcgtccgcaagctggcggaggaggagaacctcactccggaggac21000
ctcgacatggtggtgctccaccaggccaaccggcgcatcgtcgaggggatcatggacgcc21060
ctgcgcctgccgtacgagcggacgtccatcaacgtggaccgcttcggcaacacctcggcc21120
gccggttccgtgctcgccctgcgcgaggcggtggacgacggccggatcaccgccggcgac21180
cgggtggtgctggtc tccttCggggCCgggctgagcgtgggcggcgcgctgatgcgctgg21240
aacgccccgcaggacttcctCgCCgCCCCgtgaggaacagcgcgaggaatcccgtgcgga21300
gccaggagccgaccgtcgcggagacacccgcgcggacccgtgccggggccCCggtCgtgC21360
CgCCCgggCtgccgatccggctcggttcgctggacccggccgaactggtcaccagcaccc21420
tcggcgtgcggatcaccgagtggcgcaccggccggctcgtcggcaccctgcccctcgcgg21480
gcaaccgcgaccggtacgggcggctcgacggggccgccctggccgtcctggccgagacgc21540
tcggctcggtCgCCgCCgCgctcgacctcggggagggcggcatcgtgctgggccaggaac21600
tgtccctggcgcaccacgaggaggtcaccggggaggggagcgtcaccggggtctgcaccc21660
ctctgcaccgcggcgaggacgtcgccacctacgaggtccacgtcaccgacacgcacgccc21720
gccgggtgtgcacggcccgcctcacctgcaccctgcgccgcaccgcgcgccccccggccc21780
gccccgccggcccgcctggaCCggCCggCCccgtcaccgaaacccccgcgcccaccggca21840
ggaaggtctgaaccgccatgcagtctcaccggccgccacgggacccgtactgggaccgga21900
tcggctatcaCggCCCgCtggagccgaccctcgacgtgctgcgcgagatctgccgcaagc21960
acgtcctggaggtgcccttcgaggccctggaggggcccgagggcatccgtccggtcatcg22020
accgggcgggcgtctacgacaagatcgtgacccggcacggCggcggcttctgcctccagg22080
ccaacgggctgctctctcaccacctgcgggagatcggcttcgacgtgaccgtgctggccg22140
cgcacatctgggtcccgcaccgcgagtacttcagcaagggcggcgaccacctgatcatgc22200
tggtccggctggacggcagggagtggctggtggacgccagctacacccacctcgtctacg22260
tcgaccccatcgagctggtccccggcgagcagcgccaggaCggCtgggtgtaccgcgtgc22320
gggccgaggacggctggtacgtggtccagcgccggggcgagcgggagtggctgccgctct22380
accggttcgtgccggaggcgcacacggtggaggacttcgaggagtcggtcgccttccacc22440
tcgacggggagaccgtctcggagaccacccgcacgctgatgtgctcgcgtggcatccgcg22500
gcggcaaggtctccctggtcaacaacgtgctcacgatcgccgagcacggcacggtgacca22560
cccgtcaggtgcgcgacgcgcgggactgcgcgcagatcatggcgcgcatcttccgcggtc22620
accggggtctcgccgagcggggcctgcgcatctgggagcggatgcgggaggaacgcgagg22680
CCgCCgggtCggcgccgcggcccacggccgcgcagggcgcctgactcccgcaccggacaa22740
cgacggaggacgtctgatgacgatcgacagcagcacacccgtcgccgtggtgggggcggg22800
cgtcatgggcgcggggctggcccaggtcgcCgCCgCCgCgggacacgaggtggtgctcca22860
cagccggcgggaggccaccctgcgccgggccctcgccggcatcggcgcctccctggaacg22920
ggcggccgcgCgCggCgggggcgcgcgggcggaggatcccggcacgacgctcgcccggat22980
ccgcaccacgacggacctgggggacgtcgcCggCtgCgCggtcgccgtggagtcggtcgc23040
cgaggacgtcgacctgaagcggcgcgtcttcgccgagctggaccggctctgcccgccggg23100
cgccctgctggccaccaacacctccggcattcccgtcaccgagatcgccgcggccaccgg23160
CCggCCgggCtccgtcgtgggcacgcacttcttctcacccgtgccgcgcatggagctgtg23220
cgagatcgtgCggggCCgggagaccaccgacgccaccgtcgccgcggcgcgctccttcgc23280
cgaggggatcggcaagagctgcgtggtggtggagaaggacCtgCCCggtttcgtcaccac23340
ccgtctgatcatcgccttcgtcctggaggcggtccgcctggtggagacgggcatctgccg23400
ggccgaggacgtggaccgtgcctgccgtctCgCCttCgggcacgcgatgggaccgctggc23460
caccgccgaccaggccgggctcgacgtgctgcgcgaggtcgccgccgggctggccaagga23520
gtacacccacccggtcttcgccacccccggcctgctggacCggCtggtCgcggagggccg23580
gcacggccgcaagaccgggcgcggcttccacgtctacgacgacaccacccccgcgcccac23640
ccgcccctgaccccgatcccccagctcccgactcccgactcccgactcccatttttcagc23700
tttcagttttcagctccgcttcacaccaccaccggaaggttctcccgtgaagttcgcctg23760
gatcgacctgcgttccacccacgacgacctgcgtgccggcgtggtcgacgccgccgtcca23820
cgcccgcctcgaaggagtgctcgacgaccggctcgaggttctgcgcaccctgccgcccac23880
cgtcaccaaggtcctgctccCCgCgCCCggcgacccgctgcccgccgaggccgccgacgt23940
cgccgacatcgtgctgacccgggtcggcaccgccgccgagctcgacaagctcaagctgga24000
gagcgagagcgacccggcccgcacggccgcgttcgtggaggtcgtcgacgacgccaccct24060
caaggtcgcctgcgaggcggCCCgggCgCtgcccaacacgctcgtgaagttccgcgaccc24120
gaccaagatcccgctggagatcgtgatcgccgccgccgaccacagcccgggccggctcat24180
ctgcgaggccggcgacctggaggaggcgggcatcgtcgtcgacgtcctggagaagggctc24240
cgacgggctgctcctggcgcccaaggacgccaatgacgtgttcggtctgaCCgggCtgCt24300
ccgcggcagcagccccgatctgtcgctcaccaccctcaccgtgcggtccatcgagcacaa24360
CggCCtgggCgaccgggtgtgcgtcgacacctgctcgcacttcgggcaggacgagggcat24420
cctcgtcggctcgtacgcgcacgggttcgtcctgtgcgtcagcgagacccacccgctgcc24480
gtacatgcccacgcgtcccttccgggtcaaCgCCggCgCCctgcactcctacgtcctggg24540
cgaggacaaccgcaccaactacctcagcgagctccaggcgggcagcacggtgctcggtgt24600
caccacggagggcaagacccgccggatcgtggtgggccgggtcaagctggagtcccgccc24660
catgctgaccatccgggcggtgtcggagtccggtacggaggtcagcctcaccgtccagga2472018
cgactggcac gtacgggtgc tgggcccggg ggccgccgtc ctgaacgtca ccgaactgaa24780
ggccggggac cagctcctcg gctacctggc cgacgacaag cgccatgtgg gctggccggt24840
cggcgagttc tgcatcgaga agtagcccgg agaacggtcg cggcggagac gggtccgccc24900
cgtctccgccggcccggcccggccccgcccggccccgcgcccggcacacgcgcgctcgcg24960
cacttcgcgcacacggaaggaaaggatgcgatggctgtggactcggccgccccggacttc25020
gggcgatggctcgacacggcgctcaccggcgacgacctggacgaggaggtctgggggcat25080
gccggacgggcgatgtccttcggccggatgcggaaggagacggcccgcacgcgggaggtc25140
CtggCggCCCacggcatcggccccgacagcaccgtcgccgtccagctcctgcccagcttc25200
accctgctgtggacggtgttCgCCgCCtggtcggcgggcgcccaggtgatgctgatggac25260
ccccggctcacccccgcggagaccacccggctgctggacctgtgcgaaccgcagttccac25320
ctcgccgtcgagggaccggtgccgctgtcggcgccgttccgcgaggagtgcgagatcgtg25380
gtcctgccccgccgctcgggCCggCCCgCgcagagtgcccaccgcctggtgcagttcagc25440
tcgggctccaCCggCCtgCCcaaggtcatcgggcgcaccgggcggtcgctgctcgacgaa25500
ctggagcgtttcgcccggctgcccgacatgccccggcacggtgaacgcctgctcctgctc25560
agctcgatggcgtactccttcgggctcatcgggggcgtgctgcacagcctgcggaccggc25620
gtctcgctgcacttcagcggcagtacccagccgcgcgagctgctgcggctgctcgcggag25680
cgggagatccacgcgctgttcggggtgccggtccacttcgacctgctgagCCgggtCggC25740
CgCCCCggCggcctgccgtccctgcggctcgcggtgtccggcggggaaccgctgcggccc25800
gaggtcttcacgcgcttcgaggaggccttcggtgtacggatcgggcaggcctacggcatg25860
acggaggcgggcatcatcgccaccgacctgaccggccgggCCgCgCCgCCggccgtgggc25920
acccccgcccccggcatgcggaccgaggtggcggacggcaCCCtgCgggtgcggctcccc25980
gaggatccgtatctgcacgcggaccggtccgggcgctacgcggacggctggctcgacacc26040
cacgaccgctgccgggtccggccggaggacggggtcctggagatcctcggccggaacgac26100
tcgacggtgatgatcggcggcctcaacgtcgacctcaccgaggtcgagtcggtggtgctg26160
gcacatccgtcggtgacggaCgCggtggtggtgtacggcgaggcgatcgaggcccatctc26220
gtcgccgaaccgacgctggccaagggtgagttgctggcctggtgccgagagcggctgagc26280
ccgcacaagctgcccaaggcgctgcacttcgtgcggaagctgccgcgcaccgcgaacggg26340
aagacggtccgcaaccgcgagctgctgcacgcgagccgggagcgggaacggcaggtgatc26400
atccggtgatcgacccctcgtacgcgggcacccgccatccgcgcttcgacgccgaggtcg26460
agcgcggccggctgcgatccttcgccgccgcggtgggtctggacgaggccgtcttccacg26520
acgtcgacgcggcgcgtgcggccggccatccggacctgccCgtCCCgCCCaccttcctgt26580
tcggcctggaactggagcattcgcaggacacactcgccgcgatgggagtcgagatggcgc26640
gggtcctcca catcgagcag ggcttcgtct accactcgac ggcgcacgcc ggtgaccggc26700
tcaccttcgcgccggtcctcgtgtccgtccgcgctcaccggggagcacgtctgcagctcc26760
tcgccacggagacggccgtcacccggcgggacggcaccccggtggccgacctccgccagg26820
tcctcgcggtccgcgaggacCCCgCCgCgCgggatgcgcggagcacgggggctgcctcgt26880
gagggtggacCCggCCggCCtcgccgtcggcaccgaactgcccgagctggtgccaccgcc26940
cgtgacccgggcgatgctcgccctgtacgcCggggCCtCgggcgaccacaacccgatcca27000
catcgactcggacgcggcggtggccgccgggctcgaggacgtcatcgcccacggcatgct27060
ctcgatggcgttcctgggccgcatgctcacCgCCCgggtgcccgtggaggacctggtgtc27120
CttCCgggtgaccttccgcgcgccgaccccggtgcacgccaggccgcgctgcaccgcccg27180
ggtcgtctccgtcgatccgcccgccgacgggagcgacggtccccgcacggcacggctcga27240
cctcaccgtacggctggaggacggccccgtgaccgtgcgcggcgaagcggtcgtacgcct27300
gcgggacaccggtgcggtccccgctccgccccactgatcgaggaggctcgacgatggcac27360
gatccgtgctggtcacgggaggcaaccgcggcatcggccgCgCCgtCgCCcaggcgttcg27420
cccgccagggcgaccgggtggcggtcacccaccggggttcCggggCgCCCcccgggatgc27480
tgggcgtcaagtgcgacgtcaccgacgccgcccaggtggaCgCCgCgttCgcggaggccg27540
aggccgcccaCggCCCggtggaggtgctggtgtccaacgccggcatcaccgacgacgcgc27600
tgctgctgcggatgccggaggagcggttcgCCCgggtgCtggacaccaacctcgccggcg27660
cctaccgggtggtgcggcgcgcggtgcccggcatgctgcggatgcggcgcggccggatcg27720
tgctgatgtcctcggtgtccgggctgtccggtgccgtcggccaggccaactacgcggcga27780
gcaaggcgggcatggtgggcatggcgaggtCgCtggCCCgggagctgggcgggcgcggga27840
tcaccgtgaaCgtggtCgCCCCggggCtggtcctgacggacatggccgagaccgtctccg27900
ccgcccgcaaggagcagatgCtCgCCggggtgccgctcgggcggcacgccgagcccgagg27960
acgtggcggggccggtgcgctggctcgcctcggaggaggccgggtacatcaccggggccg28020
tgctgcccgtcgacggcggcctgggcatggggcactgacgtggtcggcgaCgCgCggCgC28080
gcggcggacacggagcgggcCggCgggCCgggaggggagcactgatgcggatcgcgatgg28140
cactgccgtacgcggggagcggcttccgggagacggcggcCCggCtggtggactacgagc28200
gggccgggctggaccgggtcaccgtccgggaggcctacggctgggacgcggtcagtcagt28260
tggggtatctggcggcggtcaccgtacgtgtggagctcgcctccggcgtcctgccgctgc28320
ccacccgcacgcccgcgctgctggcgatgaCggCggCCggcctcgaccacgtgtccggcg28380
gccggttcgtgctcgggctgggtgtgtcgggaccgcaggtggtcgagggtttccacgggg28440
tgccggccgaCgCgCCgCtggcccggacccgcgcggtggtcggcatctgccggaccgtgt28500
ggcggcgcgagccgttgacgtaccgggaccggcactatcgcatcccgctgaccgccgagg28560
acggcggaacggggctgggcaagccgctgaagctgatcaaccggcccgagcgcgaccgga28620
tcccgatcgtgctggccgcgatggggccgcgcagcgtcgcCCtggCCgCCgagatcgccg28680
agggctgggagccgatctggttccaccccgagcgggccgggcaggtgtggggcggggcgc28740
tggccgagggcgccgcgcgacgcgctcccgCgCtgggCgCgctcgacgtcgtcgccccgg28800
tgcacctggcgatcggcgcggccgaggagtCgCgtgCCCtggcggcggtccgcgccgaca28860
tggccctgtaCgCgggCggCatgggcgcccgcggccgcaacttctaccacgacctcatgt28920
gccgcttcggatacccggaggaggccgggcgcgtgcaggagctgtatctcgccggacgtc28980
ggcaggaggccgccgaggccgtcccggaggaactggcgcgggcggtctccctggtgggca29040
ccgaggacgtggtgcgcaagcgggtggccgcgttccgcgaggccggcgtcaccacactga29100
gcgtcgtccccacggccgccacccatgccgcccgggtggaCgCggtggggcggctgaggg29160
atctggccggccccttcggctgacggaggcggaagcggacggcgaacgcggaagcggaag29220
CgggCtCgggCgCCCggCCgccgacggcggggagcccagcctcctgcccggccgcccccg29280
gccccgtccgccgcgcacctgccccacccggcccgcgcggtactgaacgcgggcgtacgg29340
gcgcacgtatggagggacggcgcccgacgaCCggggCgCtccgtacggtggtggcccgcc29400
ggcggtgttc agcggttcgg gagccctgca tgaggcacgt acgacgacgg atcgtccgac29460gcgggatacg gctgtcggcc gtcggcggga ttctcctggg gggcctgatg gtcacccagg29520ccatggccac cgagccggcc ggcggcacac cggcgcccgg cgcgcacgcc gccggttcct29580ccgtcgagtc ggccgccgcg cggggcgccg ggctcgtctc ccggctcggc accgggcgca29640ccgccggcac ctggatcggc gccgacggcc gccccgtggt cgccgtgacc gacgcggggg29700cggccgggac ggtgcgggag gccggggccc gcgccgaggt ggtgcggcac agcatggacg29760agttgaggtc cgccacgaag agcctgcgca cggcgccccg ggtcacgggc accgcctggt29820ccgtggacta cacccgcaac gaggtcgtgg tacgggcgga ccccaccgtc tccgccggtg29880actggtcgcg gctgacgcga ctcgccgatt ccctgggcgg cagggtgcgg atggagcgca29940cgaagaccga gttcaccacc aggctgaacg gggcgcagcc catgttctcc accggcggcc30000gctgttcggc cgggtacaac gtgaccgacg ggcagggttc cttcatcctc accgccggtc30060actgcgggcc caagggcgcg gtgtggttcg ccgaccaggg gggcgcgacc gagctcggcc30120agacggtgtc ctcccgcttc cccggcaacg acttctcgct catccggtac ggcaacgggc30180agtcggccgg ggcggacacc aacgtgatcg cgatcggcgg cggcaagggc gtgcgcatcg30240cgggggcggg agacgcggcg gtgggccagc gggtgttccg cagcggcagc acgagcgggc30300tgcgcgacgg caaggtgacc gggctggacg cgacggtcaa ctaccccgag gggacggtga30360ccgggctcat cgagacggac gtgtgcgccg aaccgggtga cagcgggggg ccgttgttct30420ccgacgggct cgcgctgggg gtcacctcgg gcggcagcgg ggactgcgag agcgggggga30480cgacgttctt ccagccgctc cggacggcga tgagcgcgct gggcgtgcgg ctggcggggg30540acggctcggg cgggaaaccg tcctcggcgg cggccggtgc gccggagccc tcggcctccg30600cctcccaggg agcggtgatc gcccccgggt cggcgaaccc cggcgcggtc gagcaggtcg30660gtgcgggggc ggccccctcg ctcgccgccc ggctcaccga tccggggacg gtgggcccgg30720ggctgctggt cctcgcgggg agcatggtgg cgtgggtggc ggcgcggtac atccgctcgg30780agcgggaccg ggaggcctac cgcaggcagt acgcccgcag ctggagctga30830(a)序列特征參长度30830參类型碱基序列參链型单链參拓扑结构线性(b)分子类型双链DNA(c)假设否(d)反义否(e)最初来源海洋链霉菌 Streptomyces griseoaurantiacus M045(f)特异性名称DNA以下结合具体实施例,对本发明作进一步说明。1、海洋链霉菌M045基因组DNA的提取从斜面保存的链霉菌M045菌落上,用接种环刮下孢子,划线接种于M2+固体培养 基上,28°C恒温培养3-4天,待长出丰富的灰白色孢子,用接种铲切割下0. 5cm2琼脂块,接 种于250mL液体M2+培养基中,恒温振荡培养3_4天。收获培养液,8000rpm、4°C离心lOmin,弃去上清液,沉淀用50mL灭菌的双蒸水重悬。
进行海洋链霉菌M045基因组DNA抽提取20mL混悬的菌液,分装于10个2mL的离心管,12000rpm、4°C离心IOmin ;弃去上清,沉淀用ImL灭菌双蒸水重悬,12000rpm、4°C离心IOmin ;弃去上清,沉淀用ImLTE缓冲液重悬,12000rpm、4°C离心IOmin ;重复洗涤一次; 沉淀的菌体用1. 5mL的TE重悬,制成菌体混悬液,加入50mg/mL的溶菌酶200 μ L,37°C水浴过夜;加入lOmg/mL的蛋白酶K 20μ L,37°C水浴;然后加入20%的SDS至浓度为2%, 60°C水浴30min ; 12000rpm、4°C离心15min,取上清,每一管上清分装于两个1. 5mL离心管中,分别加入每管上清液体积的1/2体积的Tri s饱和酚,每管上清液体积的1/2体积的氯仿异戊醇(其中氯仿和异戊醇按体积比为M 1混合),缓慢摇动5min,12000rpm、4°C 离心15min ;取上清,加入与上清液等体积的氯仿异戊醇(其中氯仿和异戊醇按体积比为M 1混合),缓慢摇动5min, 12000rpm、4°C离心15min ;重复抽提一次;取上清,加入上清液1/10体积的5mol/L醋酸钾,缓慢混勻,然后加入上清液2倍体积的无水乙醇(_20°C 预冷),缓慢摇动,至出现大量絮状沉淀;用枪头把絮状沉淀挑出,置于新的1.5mL离心管中,加入70 %乙醇洗涤,12000rpm、4°C离心15min,弃去上清,并使沉淀中的乙醇挥干;将所获得的DNA沉淀用50 μ L ddH20溶解,取5 μ L,用1 %琼脂糖凝胶电泳检测,剩余样品置于-20°C保存。
上述海洋链霉菌M045,于2009年7月3日保藏于“中国生物菌种保藏管理委员会普通微生物中心”,其保藏登记号为=CGMCC 3161。
M2+固体培养基为麦芽提取物lg,葡萄糖0. 4g,酵母提取物0. 4g,琼脂粉1. Sg,人工海水50mL,去离子水50mL。
M2+液体培养基为麦芽提取物lg,葡萄糖0. 4g,酵母提取物0. 4g,人工海水50mL, 去离子水50mLo
2.海洋链霉菌M045全基因组shotgun测序
利用Roche 454 GS FLX第二代测序技术进行规模测序,获得的数据利用GS de novo Assembler Software进行拼接,最后获得海洋链霉菌M045的基因组草图。其为线性基因组,7,712,377bp,GC含量72. 73%。该基因组中,预测得到6839个开放阅读框(ORFs), 614个预测蛋白是其特有的,发现660个paralog蛋白家族,4416个预测蛋白可以归到COG 数据库,预测234个蛋白属于分泌蛋白,1352个蛋白属于跨膜蛋白,106个蛋白是脂蛋白。
3.海洋链霉菌M045基因组fosmid文库构建和筛选
取链霉菌M045的大片段基因组DNA溶液200 μ L,按照每管10 μ L分别置于20 个200 μ L的离心管中。然后用10 μ L的微量进样器(Agilent,IOyL Syringe)反复吹打 40次,以剪切DNA,获得40kb左右的DNA片段,然后按照EPICENTRE公司的CopyControl Fosmid Library Production Kit构建fosmid文库,库容为6万左右克隆。
中尼霉素和手霉素A具有2-氨基-3-羟基-2-环戊烯酮 (2-amino-3-hydroxycyclo pent-2-enone)的C5N结构,它是由5-氨乙酰丙酸合成酶和 5-氨乙酰丙酸辅酶A连接酶催化生成的,其中5-氨乙酰丙酸合成酶催化最关键的第一步反应。根据链霉菌M045基因组的序列,设计5-氨乙酰丙酸合成酶基因(chiD》的引物 ALASlF (5,ATGAACCGACTCCTGGAC3,)和 ALAS839R(5,AGCGAGGTGGTGAAGATGAAC3,)。以链霉菌M045的基因组DNA为模板,进行PCR扩增,反应程序为94°C,5min ; (94°C,50sec, 55°C,50sec,72°C,lmin) X30cycles ;72°C, IOmin0扩增产物经测序,与基因组上的chiD2序列完全一致,ALAS1F/ALAS839R可以作为筛选引物进行fosmid文库的菌落PCR筛选。于是完成了 192个fosmid克隆的菌液PCR筛选,获得2个有阳性扩增片段的克隆R)s0036Bl和 Fos0036E8o通过fosmid末端序列分析,对Fos0036E8进行完整fosmid的测序。
4、手霉素A和中尼霉素的生物合成基因簇分析
如图1所示,手霉素A和中尼霉素属于手霉素类化合物。手霉素A最早是从链霉菌 Streptomyces parvulus TU64分离得到的(Buzzetti et al.,1963),手霉素化合物被认为是一族新的抗生素,随后又分离得到有类似结构的化合物如asukamyCin(0mura et al., 1976 ;Kakinuma et al.,1979),U—62162(Slechta et al. ,1982)禾口 U—56407(Brodasky et al.,1983),丰富了此族抗生素,以上这些手霉素类化合物的核心结构是Hi-C7N结构。而中尼霉素是从海洋链霉菌中分离得到的(Li et al.,2005),中尼霉素中心芳香环结构是P-C7N 结构单元,且有氯的取代,是第一个来自天然的Para-C7N结构,同时在该海洋链霉菌中分离得到手霉素A。经序列分析,获得了海洋链霉菌M045染色体上30,830bp的连续区域,GC含量为74. 48%,生物信息学分析包含了 32个开放读码框(如图2)其中有两个序列很短, 为未定功能蛋白chiUl/U2 ;chiAl/A2/A3三个功能基因编码的蛋白参与了核心C7N结构的合成和转运;chiBl/B2/B3/B4/B5/B6/B7/B8/B9参与了 upper聚酮链的合成和延伸;chiCl/ C2/C3/C4/C5C6/B7/B8/B9 参与了 lower 聚酮链的合成和延伸;chiDl/D2/D3 参与了 C5N 结构单元的合成和连接;chiEl/E2/E3/E4是合成过程中的氧化还原酶,其中chiE4可能催化了氯的取代和lower聚酮链的重排,从而使手霉素A转化为中尼霉素A ;chiMl/M2是转运和分泌蛋白,用于药物的转运;chiRl/R2/R3是转录调控因子。
5、5_氨乙酰丙酸合成酶基因(chiD》基因敲除载体的构建
目前在放线菌中已经建立了非常成熟的基因克隆和功能分析系统,其中最为常用的是基于同源交换的基因敲除和基因置换技术。质粒PHZ132具有硫链丝菌素抗性标记,携带链霉菌质粒PSG5的复制子,该复制子是一个温敏型复制子。PHZ132在30°C 培养时具有良好的遗传及结构稳定性,而在37°C培养时质粒会丢失,因此pHZ132可以用来在放线菌中用于基因敲除实验研究。而载体PHZ132具有单一的BamH I酶切位点,因此把BamH I的酶切位点引入5-氨乙酰丙酸合成酶基因的扩增引物中(ChiD2F 5' ATCGGATCCATGAACCGACTCCTGGAC 3’ ;ChiD2R :5’ CTA GGATCCAGCGAGGTGGTGAAGATGAAC 3’)。将带有BamH I酶切位点的chiD2基因和经过BamHI酶切的pHZ132线性载体,用 T4Ligase (TaKaRa)进行连接,16°C连接过夜,然后利用氯化钙法转化Ε. Coli ToplO感受态菌株,37°C培养过夜,获得大肠杆菌-链霉菌穿梭质粒PHZ132D2,如图3。
6、大肠杆菌-链霉菌间的接合转移
链霉菌M045单孢子悬液的制备加2mL无菌水于链霉菌M045孢子生长丰富的 M2+固体培养基,用接种环轻轻刮下琼脂表面的孢子,并用无菌水清洗几次;将菌悬液用无菌吸管转入装有无菌玻璃珠的三角瓶内,在摇床上或手动摇动30min,尽可能用力破坏孢子链;然后将此孢子悬液倒在装有脱脂棉花的漏斗中进行过滤,以除去菌丝和不小心刮下的琼脂;5000rpm,4°C离心lOmin,去上清;用2XYT培养基(胰蛋白胨lg,酵母粉lg,氯化钠 lg, dd H2O IOOmL, ρΗ7· 0)洗涤两次,每次 10mL,5000rpm,4°C离心 IOmin ;最后加入 2. 5mL 2 X YT培养基重悬孢子液,制成101(lCfU/mL的孢子悬液,立即用于接合转移或悬浮于20 %的甘油溶液中,贮于_80°C冰箱中。
供体菌感受态细胞制备将含有oriT的大肠杆菌-链霉菌穿梭质粒PHZ132D2转入大肠杆菌ET12567(pUZ80(^)中,得到供体菌株ET12567 (pUZ8002,pHZ132D2);挑单菌落接种于5mL LB培养基(加入作用浓度为25 μ g/mL卡那霉素和氯霉素以及50 μ g/mL氨苄青霉素)中,37°C培养过夜;将过夜培养的菌液按0. 的比例接种到20mL新鲜的LB培养基(含有25 μ g/mL卡那霉素和氯霉素以及50 μ g/mL氨苄青霉素)中,37°C培养至0D_ = 0. 4-0. 6 ;5000rpm,4°C离心lOmin,沉淀菌体,用新鲜的LB培养基(不含抗生素)洗涤两次,目的是把原来培养液里的抗生素充分洗掉。最后将菌体悬浮于5mL LB培养基中,分装 0. 5mL于10个1. 5mL离心管中,_80°C备用。
接合转移将制备好的链霉菌M045单孢子悬液,50°C水浴热激活30min,37°C预萌发2. 5hr,冷却至室温;将供体菌ET12567 (pUZ8002, pHZ132D2)与链霉菌M045单孢子悬液各0. 5mL于1.5mL离心管中混合,IOOOOrpm离心lOsec,弃去大部分上清;用管底残留的少量液体进行重悬,然后把悬浮液涂布于含有lOmmol/L氯化镁的MS培养基(甘露醇2g,大豆蛋白胨2g,琼脂粉2g,dd H2O 50mL,海水50mL,天然pH值)上培养Mhr,然后用 ImL含硫链丝菌素(作用浓度25 μ g/mL)和萘啶酮酸(作用浓度50 μ g/mL)的水溶液覆盖。继续培养大约20天至平板上长出链霉菌的灰白色孢子。
7、链霉菌M045突变株的分子检测
因为pHZ132D2是温敏性质粒,转入链霉菌M045后,通过添加抗生素,并在37°C培养,可以提高阳性转化子的筛选效率。在高温下培养,可以使游离质粒PHZ132D2上的链霉菌复制子失活不能自主复制,而只能通过与染色体上的同源片段进行交换,随着宿主基因组的复制而复制,由此就发生了基因中断。通过硫链丝菌素抗性基因(tsr)的PCR检测,野生菌株w完全没有扩增信号,转化株a,b,c有很强的扩增信号,同阳性对照的扩增片段大小一致(如图4),载体pHZ132D2已经成功导入a,b,c转化菌株内。用DIG DNA Labeling Kit(Roche)标记抗性基因tsr作为探针,进行突变株的Southern blot检测,突变株a,b, c具有阳性的杂交信号,野生菌株w没有阳性信号(如图5),可以认为载体pHZ132D2已经整合在链霉菌突变株的基因组上。
8、链霉菌M045突变株代谢产物的化学分析
从链霉菌M045及其突变株固体平板上,用接种环刮下孢子,划线接种于礼+固体培养基上,37°C恒温培养3-4天,待长出丰富的灰白色孢子,用接种铲切割下0. 5cm2琼脂块, 接种于250mL液体M2+培养基中,37°C恒温振荡培养3_4天,将发酵液冷冻干燥,得到固体粉末。
用乙酸乙酯浸泡干燥后的固体粉末3-4次,在乙酸乙酯浸泡的过程中,用超声波清洗仪破碎,以利于代谢产物的溶出。把乙酸乙酯相用旋转蒸发仪浓缩蒸干,得到粗提物, 称重,分别用氯仿甲醇(3 2)溶液溶解,使浓度为10mg/mL,转移到小玻璃瓶中,4°C保存。
使用Agilent-1200液相色谱系统,检测代谢产物的变化,并利用岛津公司的 LCMS-IT-T0F系统分析代谢产物的分子组成。色谱柱选择安捷伦Eclipse XDB-C18柱, 250 X 4. 6mm, 5 μ m。检测波长为2Mnm,柱温25°C,流速lmL/min,流动相洗脱条件是
时间(miη)溶剂Α:水溶剂B:乙腈2 6 O O 112 3% % % % %石束 5 2 2 2 22 士-P 9 7 6 4 2 2/fO /O / /O /^u / ο ft/ ft/ ft/ ft/08 8 8 8 812 3 5 7 9
通过HPLC和LC-MS分析,链霉菌M045野生株代谢产物中,中尼霉素A、中尼霉素B 和手霉素A的流出峰分别出现在18. 4、19. 5和21分钟,如图6所示。中尼霉素A的C7N上的两个羟基,很容易氧化为羰基形成中尼霉素B,这也是图6-w中尼霉素A的峰面积要小于中尼霉素B的原因。
链霉菌M045突变株a、b和c的代谢产物中,中尼霉素A和B的流出峰消失,手霉素A有很弱的峰,说明通过chiD2基因的失活,突变株不能再合成目的产物。突变株在6. 3 分钟出现新的流出峰,通过质谱分析,分子量为472. 1889,其为中尼霉素Al (化合物4)的分子量,中尼霉素A结构上的C5N结构被羟基所替换形成中尼霉素Al,分子式为C26H31ClNO515 在10. 7分钟的流出峰,通过质谱分析分子量为454. 2439,是手霉素Al (化合物6)的分子量,同样C5N结构被羟基所替换,分子式为C26H32N06。如图7所示化学结构。
通过分子检测分析,载体PHZ132D2已经整合到链霉菌M045基因组,5_氨乙酰丙酸合成酶(chiD》基因被阻断,通关对代谢产物的化学分析,链霉菌M045突变株不能再合成 C5N结构,而是进行中间产物中尼霉素Al和手霉素Al的积累。进一步证实了,中尼霉素和手霉素A结构中的C5N结构是通过5-氨乙酰丙酸合成酶(chiD2)和连接酶(chiD3)参与的Siemin途径合成的,如图8。
9、手霉素类化合物的异源表达
从海洋链霉菌 Sti^ptomyces griseoaurantiacus M045 的基因组 fosmid 文库中, 筛选到含有完整的手霉素A或中尼霉素生物合成基因簇的fosmid,利用OMEGA Bio-Tek公司的E.Z.N.A. BAC/PAC DNA Kit提取含有完整的手霉素A或中尼霉素生物合成基因簇的 fosmid,将该fosmid转化到天蓝色链霉菌、变铅青链霉菌(Sti^ptomyces lividans) TK24、 或含有Red重组系统的大肠杆菌中,从而可以使链霉菌或大肠杆菌产生手霉素A或中尼霉素;在转化后的宿主菌中,对基因簇的相关基因进行插入、置换或缺失,从而使宿主菌可以合成手霉素类化合物的结构类似物。
权利要求
1.一种手霉素生物合成基因簇,其特征在于所述手霉素生物合成基因簇碱基序列如 SEQ ID NO. 1所示,其中手霉素生物合成基因簇为手霉素A和中尼霉素的生物合成基因簇, 1)手霉素A和中尼霉素的生物合成的结构基因编码3-氨基-4-羟基-苯甲酸(3,4-AHBA) 合成酶的chiAl ;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白的chiA2 ;编码醛裂合酶的chiA3 ;编码3-羟丁酰辅酶A脱氢酶的chiBl ;编码芳香胺N乙酰转移酶的 chiB2 ;编码3-氧乙酰基载体蛋白合成酶III的chiB3 ;编码3-氧乙酰基载体蛋白合成酶 III的chiB4;编码酰基载体蛋白的chiB5 ;编码硫酯酶的chiB6 ;编码3-氧乙酰基载体蛋白还原酶的chiB7 ;编码酰基脱水酶的chiB8 ;编码酰基脱水酶的chiB9 ;编码I/II型酮合成酶相关的酰基载体蛋白的chiCl ;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)载体蛋白的 chiC2 ;编码3-氧乙酰基载体蛋白合成酶II的chiC3 ;编码酮合成酶的chiC4 ;编码甲基丙二酰辅酶A变位酶的chiC5 ;编码硫酯酶的chiC6 ;编码酰胺合成酶的chiDl ;编码5-氨乙酰丙酸合成酶的chiD2 ;编码5-氨乙酰丙酸辅酶A连接酶的chiD3 ;编码氧化酶的chiEl ; 编码黄素还原酶的chiE2 ;编码黄素依赖的单加氧酶的chiE3 ;编码黄素依赖的氧化还原酶的chiE4 ;共25个基因;2)手霉素A和中尼霉素的生物合成的调节基因编码LuxR家族转录调节子的chiRl ;编码TetR家族转录调节子的chiR2 ;编码调节蛋白的chiR3 ;共3个基因;3)手霉素A和中尼霉素的生物合成的转运基因编码抗药性转运蛋白的chiMl ;编码分泌蛋白酶的chiM2 ;共2个基因。
2.按权利要求1所述的手霉素生物合成基因簇,其特征在于所述手霉素A生物合成基因簇用于培育手霉素A的菌株及其突变菌株。
3.按权利要求1所述的手霉素生物合成基因簇,其特征在于所述中尼霉素生物合成基因簇用于培育中尼霉素的菌株及其突变菌株。
4.按权利要求1所述的手霉素生物合成基因簇,其特征在于所述手霉素A生物合成基因簇用于其编码蛋白催化合成手霉素A及其类似物。
5.按权利要求4所述的手霉素生物合成基因簇,其特征在于对所述手霉素A生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到手霉素A的结构类似物。
6.按权利要求1所述的手霉素生物合成基因簇,其特征在于所述中尼霉素生物合成基因簇用于其编码蛋白催化合中尼霉素及其类似物。
7.根据权利要求6所述的手霉素生物合成基因簇,其特征在于对中尼霉素生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到中尼霉素的结构类似物。
全文摘要
本发明涉及微生物的基因工程领域,具体的说是一种手霉素A和中尼霉素的生物合成基因簇。所述手霉素生物合成基因簇碱基序列如SEQ ID NO.1所示,其中手霉素生物合成基因簇为手霉素A和中尼霉素的生物合成基因簇,(1)负责手霉素A和中尼霉素生物合成的结构基因25个;(2)负责手霉素A和中尼霉素生物合成的调节基因3个;(3)负责手霉素A和中尼霉素生物合成的转运基因2个。通过对上述生物合成基因的遗传改造可以得到手霉素A和中尼霉素的结构类似物,本发明所提供的基因及其所编码的蛋白质,可以用来寻找和发现可用于医药、工业和农业的化合物、基因和蛋白。
文档编号C12N15/54GK102517309SQ20111032863
公开日2012年6月27日 申请日期2011年10月19日 优先权日2011年10月19日
发明者刘兆普, 姜鹏, 李富超, 秦松, 陈华新 申请人:中国科学院海洋研究所