一组糖基转移酶及其应用_3

文档序号:8959580阅读:来源:国知局
类化合物的C-3位或C-6的第一个糖基上以延伸 糖链。特别是能够将人参Rh2转化为具有抗癌活性的稀有人参皂苷Rg3,将人参皂苷F2转 化为人参皂苷Rd,将人参皂苷Rhl转化为抗肿瘤,抗疲劳功效的稀有人参皂苷Rf,将人参 皂苷Rhl转化具有神经保护作用和紫外线保护作用的稀有人参皂苷Rg2。本发明还提供了 转化和催化方法。本发明的糖基转移酶还可与达玛烯二醇和/或原人参二醇或原人参三醇 合成代谢途径中的关键酶以及四环三萜C-3或者C-6位的糖基转移酶在宿主细胞中共表 达,或者应用于制备人参皂苷Rh2和人参皂苷Rhl的遗传工程细胞中,应用于构建人工合成 稀有人参皂苷Rg3和Rf。此外,本发明的糖基转移酶还可与达玛烯二醇和/或原人参二醇 或原人参三醇合成代谢途径中的关键酶以及C-6位的糖基转移酶以及合成UDP-鼠李糖的 关键酶在宿主细胞中共表达,应用于构建人工合成稀有人参皂苷Rg2的菌株。在此基础上 完成了本发明。
[0149] 定义
[0150] 如本文所用,术语"活性多肽"、"本发明的多肽及其衍生多肽"、"本发明的酶"、 "糖基转移酶"、"本发明的gGT29或其衍生多肽"或"本发明的糖基转移酶",均指糖基 转移酶gGT29-7(SEQ ID Ν0·:61)或其衍生多肽。其中优选的衍生多肽包括gGT29(SEQ ID N0.:26)、gGT29-3(SEQ ID N0.:28)、gGT29-4(SEQ ID N0.:55)、gGT29-5(SEQ ID NO. :57)、gGT29-6(SEQ ID NO. :59)、gGT29-8(SEQ ID NO. :72)、gGT29-9(SEQ ID NO. :74), gGT29-10(SEQ ID NO. :76), gGT29-ll(SEQ ID NO. :78), gGT29-12(SEQ ID NO. :80), gGT29-13(SEQ ID N0.:82)gGT29-14(SEQ ID N0.:84)、gGT29-15(SEQ ID N0.:86)、 gGT29-16(SEQ ID N0.:88)、gGT29-17(SEQ ID N0.:90)、gGT29-18(SEQ ID N0.:92)、 gGT29-7-N343G(SEQ ID N0.:93)、gGT29-7-A359P(SEQ ID N0.:94)、gGT29-7-N343G/ A359P(SEQ ID NO. :95) 〇
[0151] 如非特别说明,本文所说的人参皂苷和皂苷元,是的C20位S和/或R构型的人参 皂苷和皂苷元。
[0152] 如本文所用,"分离的多肽"是指所述多肽基本上不含天然与其相关的其它蛋白、 脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化所述多肽。基 本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。所述多肽的纯度还可以用氨 基酸序列进行进一步分析。
[0153] 本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天 然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵 母、植物)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以 是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
[0154] 本发明还包括所述多肽的片段、衍生物和类似物。如本文所用,术语"片段"、"衍生 物"和"类似物"是指基本上保持所述多肽相同的生物学功能或活性的多肽。
[0155] 本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨 基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也 可以不是由遗传密码编码的,或(i i)在一个或多个氨基酸残基中具有取代基团的多肽,或 (i i i)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合 所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或 分泌序列或用来纯化此多肽的序列或蛋白原序列,或与抗原IgG片段的形成的融合蛋白)。 根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
[0156] 在本发明的活性多肽具有糖基转移酶活性,并且能够催化以下一种或多种反应:
[0158] 其中,Rl为糖基;R2和R3为OH或者H ;R4为糖基或者H ;R5为糖基,所述的多肽 选自 SEQ ID NO. :26、28、55、57、59、61、72、74、76、78、80、82、84、86、88、90、92、93、94或95 或其衍生多肽。
[0159] R1-R4经取代后的化合物如下表所示:
CN 105177100 A 说明书 13/32 页
[0161] 即当Rl为葡萄糖基;R2为H,R3为0H,R4为H,式⑴化合物为Rh2。
[0162] Rl为葡萄糖基;R2为H,R3为0H,R4为葡萄糖基,式⑴化合物为F2。
[0163] 当以UDP-葡糖糖作为糖基供体时,底物(I)化合物为Rh2,则产物式(II)化合物 为Rg3 ;底物(I)化合物为F2,则产物式(II)化合物为Rd ;
[0164] 当以UDP-木糖作为糖基供体时,底物(I)化合物为Rh2,则产物式(II)化合物为 S-O-P-(D-Xylopyranosyl)-P-(D-Slucopyranosyl)-PFlD ;底物(I)化合物为 F2,则产物 式(Π )化合物为 3-〇-0-(D_xylopyranosyl)-0-(D-glucopyranosyl)-CK〇
[0167] 其中,Rl和R2为H或者糖基,R3和R4为糖基。R3-R4-0为C6第一个糖基衍生的 糖基,所述的多肽选自SEQ ID NO. :55,57,59,61,78,82,92,94或者95或其衍生多肽。
[0168] 当Rl和R2为H,R3为葡萄糖基时,式(III)化合物为Rhl。
[0169] 当以UDP-葡糖糖作为糖基供体时,底物(IIII)化合物为Rhl,则产物式(IV)化合 物为Rf ;
[0170] 当以UDP-鼠李糖作为糖基供体时,底物(IIII)化合物为Rhl,则产物式(IV)化合 物为Rg2 ;
[0172] 其中,Rl为糖基;R2和R3为OH或者H;R4为糖基或者H;R5为糖基,R5-R1-0为 C3第一个糖基衍生的糖基;R6为糖基,R6-R1-0为C3第一个糖基衍生的糖基,所述的多肽 选自SEQ ID NO. :26、28、59、76、84、86或88或其衍生多肽。1?1为两个葡萄糖基,1?2为!1, R3为0H,R4为H,式(V)化合物为Rg3。Rl为两个葡萄糖基,R2为H,R3为0H,R4为葡萄糖 基,式(V)化合物为Rd当以UDP-木糖作为糖基供体时,底物(V)化合物为Rg3,则产物式 (VI)化合物为 3-〇-β - (D-xylopyranosyl)-P - (D-glucopyranosylJ-PFO ;底物(V)化合物 为 Rd,则产物式(VI)化合物为 3-〇-0-(D_xylopyranosyl)-0-(D-glucopyranosyl)-CK。
[0173] 所述的多肽序列为SEQ ID NO. :61或其衍生多肽,其优选的衍生多肽26、28、55、 57、59、72、74、76、78、80、82、84、86、88、90、92、93、94 或 95 所示的多肽,该术语还包括具有 与所示多肽具有相同功能的 SEQ ID NO. :26、28、55、57、59、61、72、74、76、78、80、82、84、86、 88、90、92、93、94或者95序列的变异形式。这些变异形式包括(但并不限于):一个或多 个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入 和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10 个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行 取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基 酸通常也不会改变蛋白质的功能。该术语还包括本发明蛋白的活性片段和活性衍生物。本 发明还提供所述多肽的类似物。这些类似物与天然多肽的差别可以是氨基酸序列上的差 异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的 遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机 诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然 L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如 β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
[0174] 修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙 酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进 行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动 物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪 氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优 化了溶解性能的多肽。
[0175] 本发明的gGT29-7多肽或其衍生多肽,例如优选为gGT29、gGT29-3、gGT29-4、 gGT29-5、 gGT29-6、 gGT29-8、 gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、gGT29-15、gGT29-16、gGT29-17、gGT29-18、gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P蛋白的氨基端或羧基端还可含有一个或多个多肽片段,作为蛋白标 签。任何合适的标签都可以用于本发明。例如,所述的标签可以是FLAG、HA、HA1、C-Myc、 Poly-His、Poly-Arg、Str印-TagII、AUl、EE、T7、4A6、ε、B、gE、以及Tyl。这些标签可用于 对蛋白进行纯化。表1列出了其中的一些标签及其序列。
[0176] 表 1
[0177] CN 105177100 A 说明书 15/32 页
[0178] 为了使翻译的蛋白分泌表达(如分泌到细胞外),还可在所述gGT29_7多肽或其衍 生多肽,优选为 gGT29、gGT29-3、gGT29-4、gGT29-5、gGT29-6、gGT29-8、gGT29-9、gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、 gGT29-15、 gGT29-16、 gGT29-17、 gGT29-18、 gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P 的氨基酸氨基末端添加上信号肽 序列,如PelB信号肽等。信号肽在多肽从细胞内分泌出来的过程中可被切去。
[0179] 本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA 或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成 熟多肽的编码区序列可以与SEQ ID NO. :60所示的编码区序列相同或者是简并的变异体。 如本文所用,"简并的变异体"在本发明中是指编码具有SEQ ID NO. :61或其衍生多肽,优 选为 SEQ ID NO. :26、28、55、57、59、72、74、76、78、80、82、84、86、88、90、92、93、94或者95的 蛋白质,但与SEQ ID NO. :60或其衍生蛋白的编码序列,优选为SEQ ID NO. :25、27、54、56、 58、 60、71、73、75、77、79、81、83、85、87、89、或91所示的序列有差别的核酸序列。
[0180] 编码SEQ ID NO. :61所示多肽或其衍生多肽,优选为SEQ ID NO. :26、28、55、57、 59、 72、74、76、78、80、82、84、86、88、90、92、93,94或95的成熟多肽的多核苷酸包括:只编 码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列 (和任选的附加编码序列)以及非编码序列。
[0181] 术语"编码多肽的多核苷酸"可以是包括编码此多肽的多核苷酸,也可以是还包括 附加编码和/或非编码序列的多核苷酸。
[0182] 本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多 肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或 非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本 领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、 缺失或插入,但不会从实质上改变其编码的多肽的功能。
[0183] 本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少 70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件(或严紧条件)下 与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,"严格条件"是指:(1)在较低离子 强度和较高温度下的杂交和洗脱,如〇. 2XSSC,0. 1% SDS,60°C;或(2)杂交时加有变性剂, 如50%&八)甲酰胺,0.1%小牛血清/0.1%?。〇11,42°(:等;或(3)仅在两条序列之间的 相同性至少在90%以上,更好是95%以上时才发生杂交。并且,可杂交的多核苷酸编码的 多肽与 SEQ ID NO. :26、28、55、57、59、61、72、74、76、78、80、82、84、86、88、90、92、93、94或者 95所示的成熟多肽有相同的生物学功能和活性。
[0184] 本发明还涉及与上述的序列杂交的核酸片段。如本文所用,"核酸片段"的长度至 少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核 苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码gGT29-7多 肽或其衍生多肽,优选为 gGT29、gGT29-3、gGT29-4、gGT29-5、gGT29-6、gGT29-8、gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、 gGT29-15、 gGT29-16、 gGT29-17、 gGT29-18、gGT29-7-N343G、gGT29-7-A359P、或 gGT29-7-N343G/A359P 蛋白的多聚核苷酸。
[0185] 本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
[0186] 本发明的gGT29-7多肽或其衍生多肽,优选为gGT29、gGT29-3、gGT29-4、 gGT29-5、 gGT29-6、 gGT29-8、 gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、gGT29-15、gGT29-16、gGT29-17、gGT29-18、gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合 成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅 读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的 cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增, 然后再将各次扩增出的片段按正确次序拼接在一起。
[0187] 一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将 其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
[0188] 此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通 过先合成多个小片段,然后再进行连接可获得序列很长的片段。
[0189] 目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生 物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载 体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
[0190] 应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。特别是很难从 文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的 引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规 方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
[0191] 本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或gGT29_7多 肽或其衍生多肽,优选为 gGT29、gGT29-3、gGT29-4、gGT29-5、gGT29-6、gGT29-8、gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、 gGT29-15、 gGT29-16、 gGT29-17、 gGT29-18、gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P 蛋白编码序列经基因 工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
[0192] 通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产 重组的 gGT29-7 多肽或其衍生多肽,优选为 gGT29、gGT29-3、gGT29-4、gGT29-5、gGT29-6、 gGT29-8、 gGT29-9、 gGT29-10、 gGT29-ll、 gGT29-12、 gGT29-13、 gGT29-14、 gGT29-15、 gGT29-16、gGT29-17、gGT29-18、gGT29-7-N343G、gGT29-7-A359P 或 gGT29-7-N343G/A359P 多肽。一般来说有以下步骤:
[0193] (1).用本发明的编码gGT29
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1