一组糖基转移酶及其应用_3

文档序号：8959580阅读：来源：国知局

类化合物的C-3位或C-6的第一个糖基上以延伸糖链。特别是能够将人参Rh2转化为具有抗癌活性的稀有人参皂苷Rg3,将人参皂苷F2转化为人参皂苷Rd，将人参皂苷Rhl转化为抗肿瘤，抗疲劳功效的稀有人参皂苷Rf，将人参皂苷Rhl转化具有神经保护作用和紫外线保护作用的稀有人参皂苷Rg2。本发明还提供了转化和催化方法。本发明的糖基转移酶还可与达玛烯二醇和/或原人参二醇或原人参三醇合成代谢途径中的关键酶以及四环三萜C-3或者C-6位的糖基转移酶在宿主细胞中共表达，或者应用于制备人参皂苷Rh2和人参皂苷Rhl的遗传工程细胞中，应用于构建人工合成稀有人参皂苷Rg3和Rf。此外，本发明的糖基转移酶还可与达玛烯二醇和/或原人参二醇或原人参三醇合成代谢途径中的关键酶以及C-6位的糖基转移酶以及合成UDP-鼠李糖的关键酶在宿主细胞中共表达，应用于构建人工合成稀有人参皂苷Rg2的菌株。在此基础上完成了本发明。
[0149] 定义
[0150] 如本文所用，术语"活性多肽"、"本发明的多肽及其衍生多肽"、"本发明的酶"、 "糖基转移酶"、"本发明的gGT29或其衍生多肽"或"本发明的糖基转移酶"，均指糖基转移酶gGT29-7(SEQ ID Ν0·:61)或其衍生多肽。其中优选的衍生多肽包括gGT29(SEQ ID N0.:26)、gGT29-3(SEQ ID N0.:28)、gGT29-4(SEQ ID N0.:55)、gGT29-5(SEQ ID NO. :57)、gGT29-6(SEQ ID NO. :59)、gGT29-8(SEQ ID NO. :72)、gGT29-9(SEQ ID NO. :74)， gGT29-10(SEQ ID NO. :76), gGT29-ll(SEQ ID NO. :78), gGT29-12(SEQ ID NO. :80), gGT29-13(SEQ ID N0.:82)gGT29-14(SEQ ID N0.:84)、gGT29-15(SEQ ID N0.:86)、 gGT29-16(SEQ ID N0.:88)、gGT29-17(SEQ ID N0.:90)、gGT29-18(SEQ ID N0.:92)、 gGT29-7-N343G(SEQ ID N0.:93)、gGT29-7-A359P(SEQ ID N0.:94)、gGT29-7-N343G/ A359P(SEQ ID NO. :95) 〇
[0151] 如非特别说明，本文所说的人参皂苷和皂苷元，是的C20位S和/或R构型的人参皂苷和皂苷元。
[0152] 如本文所用，"分离的多肽"是指所述多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化所述多肽。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。所述多肽的纯度还可以用氨基酸序列进行进一步分析。
[0153] 本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物，或是化学合成的产物，或使用重组技术从原核或真核宿主（例如，细菌、酵母、植物）中产生。根据重组生产方案所用的宿主，本发明的多肽可以是糖基化的，或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
[0154] 本发明还包括所述多肽的片段、衍生物和类似物。如本文所用，术语"片段"、"衍生物"和"类似物"是指基本上保持所述多肽相同的生物学功能或活性的多肽。
[0155] 本发明的多肽片段、衍生物或类似物可以是（i)有一个或多个保守或非保守性氨基酸残基（优选保守性氨基酸残基）被取代的多肽，而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的，或（i i)在一个或多个氨基酸残基中具有取代基团的多肽，或 (i i i)成熟多肽与另一个化合物（比如延长多肽半衰期的化合物，例如聚乙二醇）融合所形成的多肽，或（iv)附加的氨基酸序列融合到此多肽序列而形成的多肽（如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列，或与抗原IgG片段的形成的融合蛋白）。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
[0156] 在本发明的活性多肽具有糖基转移酶活性，并且能够催化以下一种或多种反应：
[0158] 其中，Rl为糖基；R2和R3为OH或者H ;R4为糖基或者H ;R5为糖基，所述的多肽选自 SEQ ID NO. :26、28、55、57、59、61、72、74、76、78、80、82、84、86、88、90、92、93、94或95 或其衍生多肽。
[0159] R1-R4经取代后的化合物如下表所示：
CN 105177100 A 说明书 13/32 页
[0161] 即当Rl为葡萄糖基；R2为H，R3为0H，R4为H，式⑴化合物为Rh2。
[0162] Rl为葡萄糖基；R2为H，R3为0H，R4为葡萄糖基，式⑴化合物为F2。
[0163] 当以UDP-葡糖糖作为糖基供体时，底物（I)化合物为Rh2,则产物式（II)化合物为Rg3 ;底物（I)化合物为F2,则产物式（II)化合物为Rd ;
[0164] 当以UDP-木糖作为糖基供体时，底物（I)化合物为Rh2,则产物式（II)化合物为 S-O-P-(D-Xylopyranosyl)-P-(D-Slucopyranosyl)-PFlD ;底物（I)化合物为 F2,则产物式（Π )化合物为 3-〇-0-(D_xylopyranosyl)-0-(D-glucopyranosyl)-CK〇
[0167] 其中，Rl和R2为H或者糖基，R3和R4为糖基。R3-R4-0为C6第一个糖基衍生的糖基，所述的多肽选自SEQ ID NO. :55,57,59,61，78,82,92,94或者95或其衍生多肽。
[0168] 当Rl和R2为H，R3为葡萄糖基时，式（III)化合物为Rhl。
[0169] 当以UDP-葡糖糖作为糖基供体时，底物（IIII)化合物为Rhl，则产物式（IV)化合物为Rf ;
[0170] 当以UDP-鼠李糖作为糖基供体时，底物（IIII)化合物为Rhl，则产物式（IV)化合物为Rg2 ;
[0172] 其中，Rl为糖基；R2和R3为OH或者H;R4为糖基或者H;R5为糖基，R5-R1-0为 C3第一个糖基衍生的糖基；R6为糖基，R6-R1-0为C3第一个糖基衍生的糖基，所述的多肽选自SEQ ID NO. :26、28、59、76、84、86或88或其衍生多肽。1?1为两个葡萄糖基，1?2为!1， R3为0H，R4为H，式（V)化合物为Rg3。Rl为两个葡萄糖基，R2为H，R3为0H，R4为葡萄糖基，式（V)化合物为Rd当以UDP-木糖作为糖基供体时，底物（V)化合物为Rg3,则产物式 (VI)化合物为 3-〇-β - (D-xylopyranosyl)-P - (D-glucopyranosylJ-PFO ;底物（V)化合物为 Rd，则产物式（VI)化合物为 3-〇-0-(D_xylopyranosyl)-0-(D-glucopyranosyl)-CK。
[0173] 所述的多肽序列为SEQ ID NO. :61或其衍生多肽，其优选的衍生多肽26、28、55、 57、59、72、74、76、78、80、82、84、86、88、90、92、93、94 或 95 所示的多肽，该术语还包括具有与所示多肽具有相同功能的 SEQ ID NO. :26、28、55、57、59、61、72、74、76、78、80、82、84、86、 88、90、92、93、94或者95序列的变异形式。这些变异形式包括（但并不限于）：一个或多个（通常为1-50个，较佳地1-30个，更佳地1-20个，最佳地1-10个）氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加一个或数个（通常为20个以内，较佳地为10 个以内，更佳地为5个以内）氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括本发明蛋白的活性片段和活性衍生物。本发明还提供所述多肽的类似物。这些类似物与天然多肽的差别可以是氨基酸序列上的差异，也可以是不影响序列的修饰形式上的差异，或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到，如通过辐射或暴露于诱变剂而产生随机诱变，还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然 L-氨基酸的残基（如D-氨基酸）的类似物，以及具有非天然存在的或合成的氨基酸（如 β、γ-氨基酸）的类似物。应理解，本发明的多肽并不限于上述例举的代表性的多肽。
[0174] 修饰（通常不改变一级结构）形式包括：体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化，如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶（如哺乳动物的糖基化酶或去糖基化酶）而完成。修饰形式还包括具有磷酸化氨基酸残基（如磷酸酪氨酸，磷酸丝氨酸，磷酸苏氨酸）的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
[0175] 本发明的gGT29-7多肽或其衍生多肽，例如优选为gGT29、gGT29-3、gGT29-4、 gGT29-5、 gGT29-6、 gGT29-8、 gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、gGT29-15、gGT29-16、gGT29-17、gGT29-18、gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P蛋白的氨基端或羧基端还可含有一个或多个多肽片段，作为蛋白标签。任何合适的标签都可以用于本发明。例如，所述的标签可以是FLAG、HA、HA1、C-Myc、 Poly-His、Poly-Arg、Str印-TagII、AUl、EE、T7、4A6、ε、B、gE、以及Tyl。这些标签可用于对蛋白进行纯化。表1列出了其中的一些标签及其序列。
[0176] 表 1
[0177] CN 105177100 A 说明书 15/32 页
[0178] 为了使翻译的蛋白分泌表达（如分泌到细胞外），还可在所述gGT29_7多肽或其衍生多肽，优选为 gGT29、gGT29-3、gGT29-4、gGT29-5、gGT29-6、gGT29-8、gGT29-9、gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、 gGT29-15、 gGT29-16、 gGT29-17、 gGT29-18、 gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P 的氨基酸氨基末端添加上信号肽序列，如PelB信号肽等。信号肽在多肽从细胞内分泌出来的过程中可被切去。
[0179] 本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA 或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与SEQ ID NO. :60所示的编码区序列相同或者是简并的变异体。如本文所用，"简并的变异体"在本发明中是指编码具有SEQ ID NO. :61或其衍生多肽，优选为 SEQ ID NO. :26、28、55、57、59、72、74、76、78、80、82、84、86、88、90、92、93、94或者95的蛋白质，但与SEQ ID NO. :60或其衍生蛋白的编码序列，优选为SEQ ID NO. :25、27、54、56、 58、 60、71、73、75、77、79、81、83、85、87、89、或91所示的序列有差别的核酸序列。
[0180] 编码SEQ ID NO. :61所示多肽或其衍生多肽，优选为SEQ ID NO. :26、28、55、57、 59、 72、74、76、78、80、82、84、86、88、90、92、93,94或95的成熟多肽的多核苷酸包括：只编码成熟多肽的编码序列；成熟多肽的编码序列和各种附加编码序列；成熟多肽的编码序列 (和任选的附加编码序列）以及非编码序列。
[0181] 术语"编码多肽的多核苷酸"可以是包括编码此多肽的多核苷酸，也可以是还包括附加编码和/或非编码序列的多核苷酸。
[0182] 本发明还涉及上述多核苷酸的变异体，其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的，等位变异体是一个多核苷酸的替换形式，它可能是一个或多个核苷酸的取代、缺失或插入，但不会从实质上改变其编码的多肽的功能。
[0183] 本发明还涉及与上述的序列杂交且两个序列之间具有至少50%，较佳地至少 70%，更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件（或严紧条件）下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中，"严格条件"是指：（1)在较低离子强度和较高温度下的杂交和洗脱，如〇. 2XSSC，0. 1% SDS，60°C;或（2)杂交时加有变性剂，如50%&八）甲酰胺，0.1%小牛血清/0.1%?。〇11，42°(：等；或（3)仅在两条序列之间的相同性至少在90%以上，更好是95%以上时才发生杂交。并且，可杂交的多核苷酸编码的多肽与 SEQ ID NO. :26、28、55、57、59、61、72、74、76、78、80、82、84、86、88、90、92、93、94或者 95所示的成熟多肽有相同的生物学功能和活性。
[0184] 本发明还涉及与上述的序列杂交的核酸片段。如本文所用，"核酸片段"的长度至少含15个核苷酸，较好是至少30个核苷酸，更好是至少50个核苷酸，最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术（如PCR)以确定和/或分离编码gGT29-7多肽或其衍生多肽，优选为 gGT29、gGT29-3、gGT29-4、gGT29-5、gGT29-6、gGT29-8、gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、 gGT29-15、 gGT29-16、 gGT29-17、 gGT29-18、gGT29-7-N343G、gGT29-7-A359P、或 gGT29-7-N343G/A359P 蛋白的多聚核苷酸。
[0185] 本发明中的多肽和多核苷酸优选以分离的形式提供，更佳地被纯化至均质。
[0186] 本发明的gGT29-7多肽或其衍生多肽，优选为gGT29、gGT29-3、gGT29-4、 gGT29-5、 gGT29-6、 gGT29-8、 gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、gGT29-15、gGT29-16、gGT29-17、gGT29-18、gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法，可根据本发明所公开的有关核苷酸序列，尤其是开放阅读框序列来设计引物，并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的 cDNA库作为模板，扩增而得有关序列。当序列较长时，常常需要进行两次或多次PCR扩增，然后再将各次扩增出的片段按正确次序拼接在一起。
[0187] 一旦获得了有关的序列，就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体，再转入细胞，然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
[0188] 此外，还可用人工合成的方法来合成有关序列，尤其是片段长度较短时。通常，通过先合成多个小片段，然后再进行连接可获得序列很长的片段。
[0189] 目前，已经可以完全通过化学合成来得到编码本发明蛋白（或其片段，或其衍生物）的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子（或如载体）和细胞中。此外，还可通过化学合成将突变引入本发明蛋白序列中。
[0190] 应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时，可优选使用RACE法（RACE-cDNA末端快速扩增法），用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择，并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
[0191] 本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或gGT29_7多肽或其衍生多肽，优选为 gGT29、gGT29-3、gGT29-4、gGT29-5、gGT29-6、gGT29-8、gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、 gGT29-15、 gGT29-16、 gGT29-17、 gGT29-18、gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P 蛋白编码序列经基因工程产生的宿主细胞，以及经重组技术产生本发明所述多肽的方法。
[0192] 通过常规的重组DNA技术，可利用本发明的多聚核苷酸序列可用来表达或生产重组的 gGT29-7 多肽或其衍生多肽，优选为 gGT29、gGT29-3、gGT29-4、gGT29-5、gGT29-6、 gGT29-8、 gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、 gGT29-15、 gGT29-16、gGT29-17、gGT29-18、gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P 多肽。一般来说有以下步骤：
[0193] (1).用本发明的编码gGT29

完整全部详细技术资料下载

当前第3页1 2 3 4 5 6