一种水稻粒型相关蛋白glw2及其编码基因与应用
【技术领域】
[0001] 本发明属于植物基因工程和植物育种,尤其涉及一种水稻粒型相关蛋白GLW2及其 编码基因与应用。
【背景技术】
[0002] 水稻作为重要的粮食作物,在我国的粮食安全保障中具有重要的作用,不断提高 稻谷单位面积产量是关系国计民生的大事。粒型对胚乳结构、米粒外观、千粒重、结实率、穗 粒数等性状均有巨大的影响,不仅是水稻品质的重要指标,同时也是产量增加的关键因素。 伴随基因定位群体的不断发展,以及新型分子标记的进一步开发,陆续有更多的水稻关键 性状基因被定位以及克隆。关于这些新基因的研究大大的加强了人们对水稻籽粒性状遗传 特性和分子机理的认知,同时这些基因的合理利用指导并促进了水稻单产的增加和品质的 提尚。
[0003] 至今,Gramene QTL(http : //www · gramene · org/QTL)数据库已收录栽培稻QTL 8646个,其中产量相关性状QTL 2064个,粒型相关QTL 219个,包含控制粒长位点26个,控制 粒宽、粒厚、长宽比位点分别31、3、9个,控制粒重位点22个。粒重性状QTL较少可能由于粒重 基因与环境互作较强,遗传特性相对复杂,及性状鉴定相对困难造成的。粒型相关QTL主要 分布在第1、第2、第3及第5染色体上。在不同定位结果中,不同性状的QTL汇集可能在同一染 色体区段,这可能代表了基因连锁或一因多效的情况,解释了群体中粒型多个性状同步出 现的现象。另一方面,同一性状的QTL也可能定位到不同染色体上,这则从染色体水平上解 释了粒型数量性状的来源。
[0004] 近年来,在全世界特别是中国科学家的积极努力下,水稻粒型和产量性状相关基 因的克隆取得了长足的进展,但是由于数量性状QTL克隆的复杂性,导致了现在已克隆的水 稻粒型和产量性状相关基因还很少,水稻中调控粒型的机理任然不清楚,不完善。因此,水 稻籽粒粒型相关基因 GLW2的克隆和功能研究,对于明确水稻中调控籽粒粒型的分子机制和 其在杂交育种中的应用具有重要的意义。。
【发明内容】
[0005] 本发明的首要目的在于提供一种水稻粒型相关蛋白GLW2。
[0006] 本发明的再一目的在于提供上述水稻粒型相关蛋白GLW2的编码基因。
[0007] 本发明的另一目的在于提供上述水稻粒型相关蛋白GLW2或编码基因在控制水稻 籽粒粒型(长、宽)、提高水稻粒重及产量方面的应用。
[0008] 本发明是这样实现的,应用图位克隆技术从水稻材料307R中获得一籽粒粒型相关 的基因,该基因的突变导致水稻籽粒粒长、粒宽显著增加,从而导致籽粒粒重增加,命名为2 号染色体籽粒长宽基因 (GLW2)。
[0009] 由此,本发明提供了一种水稻粒型相关蛋白GLW2,具有如SEQ ID N0.2所示的氨基 酸序列。
[0010] 此外,本发明还包括多肽,可以是重组多肽、天然多肽、合成多肽,优选的是重组多 肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或是使用重组技术从原核 或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案 所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括 或不包括起始的甲硫氨酸残基。
[0011] 本发明还包括GLW2蛋白的片段、衍生物和类似物。本文中,术语"片段"、"衍生物" 和"类似物"是指基本上保持本发明的GLW2蛋白相同的生物学功能或活性的多肽。本发明的 多肽片段、衍生物或类似物可以是(1)有一个或多个保守或非保守性氨基酸残基(优选保守 型氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码 编码的,或(2)在一个或多个氨基酸残基中具有取代基团的多肽,或(3)成熟多肽与另一个 化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(4)附加的氨 基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序 列或蛋白序列,或融合蛋白)。根据本文的定义,这些片段、衍生物和类似物属于本领域技术 人员公知的范围。
[0012] 在本发明中,GLW2蛋白指具有SEQIDN0.2序列的多肽。本发明还包括与SEQID N0.2序列的蛋白相同功能的、SEQ ID N0.2序列的变异形式。这些变异形式包括(但并不限 于):若干个(通常为1~50个,较佳地1~30个,更佳地1~20个,最佳地1~10个或更少1~8 个或1~5个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通 常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域内,用性能相 似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一 个或数个统称也不会改变蛋白质的功能。还包括GLW2蛋白的活性片段和活性衍生物。
[0013] 多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突 变体、在高或低的严谨度条件下能与GLW2蛋白编码DNA杂交的DNA所编码的蛋白、以及利用 GLW2蛋白的抗血清获得的多肽或蛋白。所述的同源序列是指具有与SEQ ID N0.2序列有至 少50%,较佳地至少60%,70%,80%,更佳地至少85%,90%,95%相同性的多肽。本发明还 提供了其他的多肽,如包含GLW2蛋白或其片段的融合蛋白。除了几乎全长的多肽外,本发明 还包括了 GLW2蛋白的可溶性片段。通常,该片段具有GLW2蛋白的至少约20个连续的氨基酸, 通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约100个连续的氨 基酸,最佳地至少约150个连续氨基酸。
[0014] 本发明还提供GLW2蛋白或多肽的类似物。这些类似物与天然的GLW2蛋白的差异可 以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些 多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴 露于诱变剂而产生的随机诱变,还可以通过定点诱变法或其他的已知的分子生物学的技 术。类似物还包括具有不同于天然L-氨基酸残基(如D-氨基酸)的类似物,以及具有非天然 存在的或合成的氨基酸(如氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举 的代表性多肽。
[0015] 修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰 化或羧基化。修饰还包括糖基化。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸, 磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶 解性能的多肽。
[0016] 在本发明中还包括GLW2蛋白保守性变异蛋白(多肽),与SEQ ID N0.2的氨基酸序 列相比,有至多20个,较佳地至多10个,更佳地至多5个,最佳地至多3个氨基酸被性质相似 或相近的氨基酸所替代而形成的多肽,且保留与SEQ ID N0.2序列的蛋白相同的功能。
[0017] 进一步的,本发明提供了上述水稻粒型相关蛋白GLW2的编码基因,该编码基因为 具有如SEQ ID NO. 1所示的核苷酸序列;或,在严格条件下与SEQ ID NO. 1所示的核苷酸序 列杂交的核苷酸序列。即,本发明还提供了编码本发明GLW2蛋白或其保守性变异多肽的多 核苷酸序列。
[0018] 本发明的多聚核苷酸(基因)可以是DNA形式或RNA形式。DNA形式包括CDNA、基因组 DNA或人工合成的DNAANA可以是单链或是双链的。DNA可以是编码链或非编码链。编码成熟 多肽的编码区序列可以与SEQ ID N0.2所示的编码区序列相同或者是简并的变异体。如本 文所用,"简并的变异体"在本发明中是指编码具有SEQ ID N0.2的蛋白质,但与SEQ ID NO.2所示的编码区序列有差别的核苷酸序列。
[0019] 编码SEQ ID N0.2的成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟 多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及 非编码序列。
[0020] 本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多 肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或 非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本 领域所知的,等位变异体是一个多核苷酸的替换形式,他可能是一个或多个核苷酸的取代、 缺失或插入,但不会从实质上改变其编码的多肽的功能。
[0021] 本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少 70%,进一步较佳地至少80%,更佳地至少90%相同性的多核苷酸。本发明特别涉及在严格 条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,"严格条件"是指:(1)在较 低的离子强度和较高温度下的杂交和洗脱,如〇. 2 X SSC,0.1 %SDS,60°C ;或(2)杂交时加有 变性剂,如50 % (V/V)甲酰胺,0.1 %小牛血清/0.1 Fico 11,42 °C等;或(3)仅在两条序列之间 的相同性至少在70 %以上,较佳地至少80 %以上,更佳地90 %以上,更好是95 %以上时才发 生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID N0.2所示的成熟多肽有相同的生物 学功能和活性。
[0022] 本发明还涉及与上述的序列杂交的核酸片段。如本文所用,"核酸片段"的长