专利名称:控制水稻中贮藏蛋白的表达的bZIP转录因子的利记博彩app
技术领域:
本发明涉及一种新的转录因子,以及其与水稻(rice)植物种子中贮藏蛋白的胚乳特异性表达有关的用途。
背景技术:
种子贮藏蛋白只在种子的成熟阶段表达,对编码此类蛋白基因的分析可作为研究植物基因转录调控机理的合适模型(Goldberg,R.B.等,Science 266605-614,1994)。已知编码种子贮藏蛋白的基因的表达受到启动子中多个顺式因子协同作用的调控。在转录的引发以及组织和时间特异性表达中,转录因子与特异性顺式调控因子的结合是重要的。这可以解释为当识别特异性顺式调控因子的转录因子结合并凝聚时,种子贮藏蛋白的表达受到几种类型的顺式调控因子的诱导,所述调控因子与种子特异性表达的调控有关。为了阐明种子贮藏蛋白表达的分子机理,对农作物贮藏蛋白基因的顺式调控因子和转录因子进行功能性分析(Thomas,T.L.,Plant Cell 51401-1410,1993;Morton,R.L.等,in Seed Development and Germination,pp.103-138,MarcelDekker,Inc.,1995)。
但是,尽管进行了大量的研究,采用转化植物的分析没有能鉴定在几乎所有研究过的农作物的基因表达调控中必须的顺式调控因子,所述基因表达调控的机理至今未能阐明。特别对于单子叶植物,只对水稻植物的种子贮藏蛋白和谷蛋白,采用稳定的转化植物进行了启动子分析。另一方面,对玉米,小麦和大麦进行基因枪或烟草转化体的分析实验(Muller,M.和Knudsen,S.,Plant J.6343-355,1993;Albani,D.等,Plant Cell 9171-184,1997;Marzabal,P.M.等,Plant J.1641-52,1998)。
已表明谷物种子贮藏蛋白基因的胚乳特异性表达受到几种类型顺式调控因子协同作用的调控。通过减益(loss-of-function)和增益(gain-of-function)分析,确定在多种谷物的种子贮藏蛋白基因的启动子中保守的谷醇溶蛋白盒(TGTAAAG),GCN4基元(TGA(G/C)TCA),AACA基元(AACAAAA),和ACGT基元是参与胚乳特异性表达的顺式调控因子(Morton,R.L.等,InSeedDevelopment and Germination,pp.103-138,Marcel Dekker Inc.,1995)。
所述GCN4基元不但在种子贮藏蛋白基因中,还在涉及代谢的基因的启动子中经常发现(Muller,M.和Knudsen,S.,Plant J.6343-355,1993)。最近,发现水稻植物谷蛋白基因的GCN4基元的聚合体在转化水稻植物中再现(reproduce)胚乳特异性表达,并发现由于GCN4基元上核苷酸的取代或缺失,启动子活性显著降低并且其表达方式改变。这些事实证明GCN4基元在胚乳特异性表达中起重要作用(Wu,C.Y.等,Plant J.14673-683,1998)。许多情况下所述GCN4基元通过多个碱基与谷醇溶蛋白盒(TGTAAAG)偶联,是在几乎所有谷物的谷醇溶蛋白基因启动子中发现的双因子胚乳盒的组成之一,包括小麦麦谷蛋白,大麦的大麦醇溶蛋白,黑麦的黑麦碱,高粱cafulin,薏苡corxin。AACA基元参与几乎所有水稻谷蛋白基因的表达。尽管基因表达需要两个基元的结合(GCN4基元和谷醇溶蛋白盒或GCN4基元和AACA基元),为了足够地发挥胚乳特异性启动子的作用,还需要一个额外的基元(Takaiwa,F.等,Plant Mol.Biol.301207-1221,1996;Yoshihara,T.等,FEBSLetts.383213-218,1996;Wu,C.Y.等,Plant J.(在印))。最近,已经阐明,为了作为能在水稻植物谷蛋白基因(GluB1)中再现胚乳特异性表达的最小启动子起作用,至少需要三种组成,即存在于197bp启动子区内的GCN4基元,AACA基元和ACGT基元(Wu,C.Y.等,Plant J.14673-683,1998;Wu,C.Y.等,Plant J.23415-421,2000)。
玉米的Opaque2(O2)是bZIP型的胚乳特异性转录因子,此O2与玉米的22kDaα-玉米醇溶蛋白基因启动子的ACGT基元结合以激活转录(Schmidt,R.J.等,Plant Cell 4689-700,1992)。已有报道O2通过与(Ga/tTGAPyPuTGPu)序列结合,参与b-32核糖体失活蛋白基因的胚乳特异性转录(Lohmer,S.等,EMBO J.10617-624,1991)。因此认为O2具有广泛的结合能力。据报道,GCN4基元被O2识别,通过O2与GCN4基元的结合激活转录(Wu,C.Y.等,Plant J.14673-683,1998;Holdsworth,M.J.等,Plant Mol.Biol.29711-720,1995)。在种子的成熟阶段,体内足迹实验显示核蛋白结合GCN4基元和谷醇溶蛋白盒,所述GCN4基元存在于小麦低分子量麦谷蛋白基因启动子(Vicente-Carbajos,J.等,Plant J.13629-640,1998)和玉米γ-玉米醇溶蛋白基因启动子(Marzabal,P.M.等,Plant J.1641-52,1998)中。此外,体内DNaseI足迹实验表明成熟水稻植物种子的核蛋白以及GST-O2融合蛋白特异性识别水稻谷蛋白基因启动子的GCN4基元(Wu,C.Y.等,Plant J.14673-683,1998;Kim,S.Y.和Wu,R.,Nucl.Acids Res.186845-6852,1990)。这些发现暗示O2样转录因子存在于谷物种子中,控制由GCN4基元介导的多种种子贮藏蛋白基因的胚乳特异性表达。
最近,从小麦(Albani,D.等,Plant Cell 9171-184,1997)和大麦(Vicente-Carbajos,J.等,Plant J.13629-640,1998;Onate,L.等,J.Biol.Chem.2749175-9182,1999)中分离了识别GCN4基元的转录因子的cDNA克隆,已命名为SPA,BLZ1和BLZ2。已确定这些转录因子激活在小麦低分子量谷蛋白和大麦的大麦醇溶蛋白B1基因启动子中GCN4基元介导的种子贮藏蛋白基因的转录。有趣地是,这些转录因子是种子特异性表达。尽管已从水稻植物分离了与O2的bZIP区高度同源的编码转录因子的cDNA,仍需要证实它是否激活GCN4基元介导的种子贮藏蛋白基因的转录(Izawa,T.等,PlantCell 61277-1287,1994;Nakase,M.等,Plant Mol.Biol.33513-522,1997)。
发明内容
本发明的一个目标是提供一种新的通过结合GCN4基元而调控水稻种子贮藏蛋白表达的转录因子,编码所述因子的基因,已导入所述基因的植物细胞和植物体,以及生产方法及其用途。
本发明人进行研究以解决上述问题。如上所述,GCN4基元是在谷物种子贮藏蛋白基因中高度保守的序列,在所述基因的胚乳特异性表达中起核心作用。GCN4基元被与玉米蛋白的Opaque2密切相关的bZIP转录因子家族识别。因此,本发明人认为通过从水稻种子中分离bZIP转录因子,可能鉴定结合GCN4基元的转录因子,所述转录因子通过与GCN4基元的结合控制水稻种子贮藏蛋白的表达。
首先,本发明人筛选了源自水稻种子的cDNA文库并分离了编码五种类型bZIP转录因子(RISBZ1,RISBZ2,RISBZ3,RISBZ4,和RISBZ5)的cDNA。基于推定的氨基酸序列的同源性,RISBZ2和RISBZ3分别相同于RITAI(Izawa,T.等,Plant Cell 61277-1287,1994)和REB(Nakase,M.等,PlantMol.Biol.33513-522,1997),剩下的RISBZ1,RISBZ4和RISBZ5都显示编码新的蛋白。在研究RISBZ1,RISBZ2,RISBZ3,RISBZ4和RISBZ5与GCN4基元的结合能力时,它们都表现出对GCN4基元的结合活性。而且,测定了所述五种蛋白通过结合GCN4基元的转录活化能力。结果,只有RISBZ1通过结合GCN4基元活化转录100倍或更高。此外,采用酵母的GAL4 DNA结合区的分析显示RISBZ1 N末端富含脯氨酸的27个氨基酸残基起转录活化区的作用。RISBZ1和其它RISBZ蛋白间转录活化能力的差异主要是由于转录活化区的7个氨基酸残基的突变(对于RISBZ2)或缺失(对于RISBZ3,RISBZ4,和RISBZ5)。此发现提示RISBZ1和其它RISBZ蛋白间的转录活化能力的差异是由于转录活性区的结构突变。此外,发现RISBZ1不止形成同二聚体(homodimer),还与其它RISBZ蛋白形成异二聚体。由于RISBZ1的表达先于种子贮藏蛋白基因的表达并且只在成熟种子中表达,因此RISBZ1可能控制种子贮藏蛋白的表达。为研究RISBZ1基因的表达,将RISBZ1基因的启动子与GUS报道基因相偶联,将此构建体引入水稻植物。在此水稻植物中,GUS基因在糊粉层显著表达。
如上所述,本发明人阐明了新的蛋白RISBZ1,RISBZ4和RISBZ5确实结合GCN4基元,并澄清了RISBZ1是参与水稻种子贮藏蛋白基因胚乳特异性表达的转录活化因子。
本发明人还制备了转化植物,其包含一种DNA构建体(其中本发明的RISBZ1连接到启动子的下游)和另一种DNA构建体(其中报道基因连接到包含RISBZ1的靶序列的启动子的下游)。然后通过采用报道基因的表达作为指示,本发明人成功地测定了转化的植物中RISBZ1的转录活性。这些发现使有用的,高附加值的外源基因在转化植物细胞中高水平表达,在所述植物细胞中,外源基因,而非上述的报道基因,连接到包含RISBZ1靶序列的启动子的下游。
本发明涉及新的转录因子,其通过与GCN4基元结合调节水稻种子贮藏蛋白的表达,编码所述因子的基因,已引入该基因的植物细胞和植物,其生产方法和用途。更具体地,本发明提供了[1]一种选自下组的DNA
(a)一种DNA,所述DNA编码包含SEQ ID NO2,5和7中任一项所示氨基酸序列的蛋白;(b)一种DNA,所述DNA编码包含SEQ ID NO1,3,4和6中任一项所示核苷酸序列的编码区;(c)一种DNA,所述DNA包含SEQ ID NO2,5和7中任一项所示氨基酸序列,所述序列中有一或多个氨基酸被取代,缺失,添加,和/或插入,并且所述DNA编码的蛋白在功能上等价于包含SEQ ID NO2,5和7中任一项所示氨基酸序列的蛋白;和(d)一种DNA,所述DNA在严谨条件下与包含SEQ ID NO1,3,4和6中任一项所示核苷酸序列的DNA杂交,并且所述DNA编码的蛋白在功能上等价于包含SEQ ID NO2,5,和7中任一项所示氨基酸序列的蛋白;[2][1]的DNA,所述DNA编码与GCN4基元结合并活化水稻种子贮藏蛋白的蛋白;[3][1]或[2]的DNA,所述DNA得自水稻植物;[4]一种编码反义RNA的DNA,所述反义RNA与[1]到[3]任一项DNA的转录产物互补;[5]一种编码RNA的DNA,所述RNA具有特异性裂解[1]到[3]任一项DNA的转录产物的核酶活性;[6]一种编码RNA的DNA,所述RNA具有通过共抑制作用抑制[1]到[3]任一项DNA在植物细胞中表达的活性,并且与[1]到[3]任一项的DNA具有90%或更多的同源性;[7]一种编码蛋白的DNA,所述蛋白具有[1]到[3]任一项的DNA编码的蛋白的显性阴性表型,其在植物细胞中是内源的;[8]一种载体,所述载体包含[1]到[3]任一项的DNA;[9]一种转化细胞,所述细胞含有[1]到[3]任一项的DNA或[8]的载体;[10]一种由[1]到[3]任一项的DNA编码的蛋白;[11]一种产生[10]的蛋白的方法,所述方法包含如下步骤培养[9]的转化细胞,从该转化细胞或其细胞培养上清中收集表达的蛋白;[12]一种包含[4]到[7]任一项的DNA的载体;[13]一种转化的植物细胞,所述细胞含有[1]到[7]任一项的DNA或[8]或[12]中任一项的载体;[14]一种转化植物,所述植物包含[13]的转化的植物细胞;[15]一种转化植物,所述植物是[14]的转化植物的子代或克隆;[16][14]或[15]的转化植物的再生材料;[17]一种与[10]的蛋白结合的抗体;[18]一种植物,在其基因组上具有两种DNA构建体,其中第一种构建体中[1]的DNA可操纵地连接到表达调控区的下游,第二种DNA构建体中一种外源基因可操纵地连接到表达调控区的下游,该调控区具有[10]的蛋白的靶序列;[19][18]的植物,其中所述靶序列是包含GCN4基元的序列;[20][19]的植物,其中所述GCN4基元具有选自SEQ ID NO8,13,和14中任一项的序列;[21][18]的植物,其中所述靶序列是包含G/C盒的序列;[22]一种生产[18]到[21]任一项的植物的方法,所述方法包括将在其基因组上具有第一种DNA构建体的植物与在其基因组上具有第二种DNA构建体的植物杂交,所述第一种构建体中[1]的DNA可操纵地连接到表达调控区的下游,所述第二种构建体中一种外源基因可操纵连地接到包含[10]的蛋白的靶序列的表达调控区的下游。
本发明提供了编码源于水稻植物的RISBZ1,RISBZ4,和RISBZ5蛋白的DNA。RISBZ1 cDNA的核苷酸序列表示为SEQ ID NO1,该cDNA编码的蛋白的氨基酸序列表示为SEQ ID NO2,其基因组DNA的核苷酸序列表示为SEQ ID NO3(以SEQ ID NO3表示的基因组DNA包含内含子并由六个外显子组成)。RISBZ4和RISBZ5蛋白cDNA的核苷酸序列分别表示为SEQ ID NO4和SEQ ID NO6,而RISBZ4和RISBZ5蛋白cDNA编码的蛋白的氨基酸序列分别表示为SEQ ID NO5和7。在本说明书中,本发明的RISBZ1,RISBZ4,和RISBZ5统称为RISBZ。
本发明的RISBZ蛋白被认为是可结合GCN4基元活性的bZIP转录因子。在它们中,RISBZ1通过结合GCN4基元显著激活转录。由于RISBZ1基因的启动子在水稻种子的糊粉层中被激活,因此认为RISBZ1是控制水稻种子贮藏蛋白表达的转录-激活因子。
此外,有报道通过属于bZIP转录因子家族的各种因子的组合,bZIP转录因子可形成各种同/异二聚体。结果,形成了具有各种功能的控制因子,所述控制因子控制基因的转录。在下述的实施例中,RISBZ2和RISBZ3表现出与RISBZ1形成异二聚体。此外,RISBZ4和RISBZ5分别与RISBZ3的bZIP区具有极高的同源性(分别是96%和82.7%),这些因子也可与RISBZ1形成异二聚体。这些事实提示本发明的RISBZ4和RISBZ5会与本发明的RISBZ1和其它RISBZ成员形成异二聚体,所述二聚体基于成熟阶段和组织的不同,具有各种转录活化能力和DNA结合特性,从而控制种子贮藏蛋白的表达。
因此,本发明编码RISBZ蛋白的DNA,或控制所述DNA表达的分子可用于,例如,调节种子贮藏蛋白的表达。调节种子贮藏蛋白的表达具有各种工业益处。例如,可以通过在胚乳中缺失种子贮藏蛋白而积聚丰富的外源基因产物。另一方面,通过在胚乳中高度地积聚种子贮藏蛋白,可以生产更有营养价值的种子(例如水稻)。
本发明编码RISBZ蛋白的DNA包括基因组DNA,cDNA和化学合成的DNA。基因组DNA和cDNA可通过本领域技术人员所知的一般方法制备。更具体地,可如下制备基因组DNA,例如(1)从植物细胞或组织中提取基因组DNA;(2)构建基因组文库(使用载体,如质粒,噬菌体,粘粒,BAC,PAC等);(3)将文库铺平板;(4)采用基于编码本发明蛋白的DNA(例如SEQ IDNO1,3,4或6)制备的探针进行集落杂交或噬菌斑杂交。或者,可通过PCR制备基因组DNA,使用特异于编码本发明蛋白的DNA(例如SEQ IDNO1,3,4或6)的引物。另一方面,可如下制备cDNA(1)基于提取自植物细胞或组织中的mRNA合成cDNA;(2)通过将合成的cDNA插入到载体,如λZAP中,制备cDNA文库;(3)将cDNA文库铺平板;(4)如上进行集落杂交或噬菌斑杂交。或者,cDNA可通过PCR制备。
本发明包括DNA,所述DNA编码的蛋白功能上等价于SEQ ID NO2,5或7的RISBZ蛋白。此处,术语“功能上等价于RISBZ蛋白”是指目标蛋白具有相当于SEQ ID NO2,5,或7的RISBZ蛋白的生物功能,例如结合GCN4基元和/或调节水稻种子贮藏蛋白表达的功能。水稻种子贮藏蛋白包括,例如水稻谷蛋白。
这样的DNA还包括如编码包含SEQ IDNO2,5或7的氨基酸序列的突变体,衍生物,等位基因,变体和同系物的DNA,其中一个或多个氨基酸残基被取代、缺失、添加和/或插入。
本领域已知制备编码包含改变的氨基酸的蛋白的DNA的方法包括定点诱变法(Kramer,W.和Fritz,H.-J.,Oligonucleotide-directed construction ofmutagenesis via gapped duplex DNA.Methods in Enzymology,154350-367,1987)。蛋白的氨基酸序列也可由于核苷酸序列的突变而自发突变。本发明的DNA也包括这种DNA,所述DNA编码具有天然RISBZ蛋白(SEQ ID NO2,5或7)的氨基酸序列的蛋白,但其中具有一或多个氨基酸的取代,缺失,和/或添加,只要其编码的蛋白功能上等价于天然RISBZ蛋白。此外,不在蛋白中产生氨基酸序列改变的核苷酸序列突变体(兼并突变体)也包括在本发明的DNA中。目标DNA的核苷酸突变数量在氨基酸水平上典型是100个氨基酸或更少,优选50个氨基酸或更少,更优选20个氨基酸或更少,最优选10个氨基酸或更少(例如5个氨基酸或更少,或3个氨基酸或更少)。
可通过例如本领域所熟知的凝胶滞后实验来测定编码蛋白的某DNA是否具有与GCN4基元结合的功能。更具体地,此分析可如下进行将待测定DNA整合入载体以使其基因产物与GST形成融合蛋白,此载体可使该融合蛋白表达。采用GST为指示剂纯化该表达产物,然后与含有GCN4基元的标记的DNA探针混合。此混合溶液进行非变性丙烯酰胺凝胶电泳。可基于凝胶中可检测条带的位置评价结合活性。
此外,可通过,例如报道基因分析(reporter assay)来确定编码蛋白的某DNA是否具有激活水稻种子贮藏蛋白表达的功能。更具体地,此分析可如下进行首先构建一种载体,使报道基因连接并位于水稻种子贮藏蛋白启动子的下游。此载体和表达检测DNA基因产物的载体被引入到用于报道基因分析的细胞中,通过测定报道基因产物的活性评价检测DNA基因产物的转录活性。可用于此报道基因分析的水稻种子贮藏蛋白启动子的例如有水稻谷蛋白基因启动子。只要其表达可被检测到,对所述报道基因没有具体的限制,可以采用本领域技术人员在各种分析系统中所用的任何报道基因。报道基因的优选例子是β-葡糖醛酸糖甘酶(GUS)基因。
其编码的蛋白与SEQ ID NO2,5或7所示RISBZ蛋白功能上等价的DNA可通过,例如本领域所熟知的方法产生,包括采用杂交技术的方法(Southem,E.M.,Jounal jof Molecular Biology,Vol.98,503,1975);和聚合酶链式反应(PCR)技术(Saiki,R.K.等,Science,230,1350-1354,1985;Saiki,R.K.等,Science,239,487-491,1988)。本领域技术人员可常规地分离与水稻RISBZ基因高度同源的DNA,以及使用RISBZ基因(SEQ ID NO1,3,4,或6)或其部分作探针,特异地与该基因杂交的寡核苷酸为引物。这样编码的蛋白在功能上等价于RISBZ蛋白的DNA(通过杂交技术或PCR技术分离)包含在本发明的DNA内。
分离这样的DNA的杂交反应优选在严谨条件下进行。本发明的严谨杂交条件包括如下条件6M尿素,0.4%SDS,0.5×SSC;以及产生与这些条件具有相似严谨度的条件。在更高严谨度条件下进行杂交时,例如6M尿素,0.4%SDS,0.1×SSC,预期对于具有较高同源性的DNA能有效分离。在这样的条件下分离的DNA预计编码与RISBZ蛋白(SEQ ID NO2,5或7)在氨基酸水平高度同源的蛋白。这里,高度同源指全部氨基酸序列同一性为至少50%或更多,更优选指70%或更多,最优选指90%或更多(例如95%或更多)。序列同一性的程度可通过FASTA检索(Pearson W.R.和D.J.LipmanProc.Natl.Acad.Sci.USA.852444-2448,1988)或BLAST检索来确定。
本发明的DNA可用于,例如制备如上所述的重组蛋白及产生转基因植物。
通常重组蛋白的制备如下进行将编码本发明蛋白的DNA插入合适的表达载体,将载体引入到适合的细胞,培养转化的细胞,纯化表达的蛋白。重组蛋白可与其它蛋白一起作为融合蛋白表达以利于纯化,例如作为与大肠杆菌中的麦芽糖结合蛋白(New England Biolabs,USA,载体pMAL系列)的融合蛋白,作为与谷胱甘肽-S-转移酶(GST)(Amersham Pharmacia Biotech,载体pGEX系列)的融合蛋白,或用组氨酸(Novagen,pET系列)标记。宿主细胞并无限制,只要该细胞适于表达重组蛋白。除上述大肠杆菌外还可能利用如,酵母,植物,昆虫细胞或各种其它动物细胞。可通过各种本领域所熟知的方法将载体引入宿主细胞。例如,采用钙离子的转化方法(Mandel,M.和Higa,A.Journal of Molecular Biology,53,158-162,1970;Hanahan,D.Journal of Molecular Biology,166,557-580,1983)可用于将载体引入大肠杆菌。可通过本领域已知方法从宿主细胞或其培养上清中纯化和回收宿主细胞所表达的重组蛋白。当重组蛋白作为与麦芽糖结合蛋白或其它配偶体的融合蛋白表达时,该重组蛋白易于通过亲和层析纯化。
所得蛋白可用于制备结合该蛋白的抗体。例如,通过用本发明的纯化蛋白或其部分免疫动物,如兔,然后在一定时期后收集血液,除去凝块,来制备多克隆抗体。单克隆抗体可如下制备将骨髓瘤细胞与用上述蛋白或其部分免疫的动物的抗体形成细胞相融合,分离表达所需抗体的单克隆细胞(杂交瘤),从该细胞中回收抗体。如此得到的抗体可用于纯化或检测本发明的蛋白。因此,本发明包括结合本发明蛋白的抗体。
表达本发明DNA的植物转化体可如下构建将编码本发明蛋白的DNA插入到合适的载体,将此载体引入植物细胞,然后使获得的转化植物细胞再生。
另一方面,利用抑制编码本发明的蛋白的DNA表达的DNA,可创建植物转化体,所述植物转化体中本发明DNA的表达受到抑制,方法是将DNA插入合适的载体中,将该载体引入植物细胞,再生所得的转化植物细胞。所述“抑制编码本发明的蛋白的DNA表达”包括基因转录的抑制以及对翻译为蛋白的抑制。此外,它也包括DNA表达的完全失活(inability)以及表达的降低。
植物中特异性内源基因的表达可通过利用本领域传统的反义技术抑制。Ecker等借助瞬时基因表达(transient gene expression)方法首先证明将反义RNA通过电穿孔引入植物细胞的反义影响(J.R.Ecker和R.W.Davis Proc.Natl.Acad.Sci.USA 835372,1986)。此后报道了通过表达反义RNA使目标基因在烟草和牵牛花中的表达降低(A.R.van der Krol等,Nature 333866,1988)。目前反义技术已确立为抑制植物中靶基因表达的方法。
多种因素引起反义核酸抑制靶基因的表达。这些包括通过形成三链抑制转录的引发;通过在RNA聚合酶形成局部开环结构的位点形成杂化物(hybrid)抑制转录;通过与正被合成的RNA形成杂化物抑制转录;通过在内含子和外显子之间的结合处形成杂化物抑制剪接;通过在剪接子形成位点形成杂化物抑制剪接;通过与mRNA形成杂化物抑制mRNA从细胞核到细胞质的转移;通过在加帽位点(capping site)或ploy(A)添加位点形成杂化物抑制剪接;通过在翻译起始因子的结合位点形成杂化物来抑制翻译的引发;通过在起始密码子附近的核糖体结合位点形成杂化物抑制翻译;通过在mRNA的翻译区或多核糖体结合位点形成杂化物抑制肽链的延长;通过在核酸和蛋白的相互作用位点形成杂化物抑制基因的表达。这些因子通过抑制转录,剪接,或翻译过程来抑制靶基因的表达(Hirashima和Imoue,“Shin seikagakuJikken Koza(New Biochemistry Experimentation Lectures)2,Kakusan(NucleicAcids)IV,Idenshi No Fukusei To Hatsugen(Replication and expression ofGenes),”Nihon Seikagakukai Hen(The Japanese Biochemical Society),TokyoKagaku Dozin,319-347,(1993))。
本发明的反义序列可通过上述任一机制抑制靶基因的表达。在一种实施方案中,如果设计的反义序列与所述基因mRNA5’末端的非翻译区互补,就可以有效地抑制基因翻译。也可使用与编码区或3’侧非翻译区互补的序列。因此,本发明所用反义DNA包括具有所述基因的非翻译区和翻译区的反义序列的DNA。所用反义DNA连接到合适启动子的下游,并优选其3’端连接包含转录终止信号的序列。如此制备的DNA可通过已知方法转染到所需植物中。反义DNA的序列优选是待转化植物的内源基因或其部分的互补序列,但它不必是完全互补的,只要可以有效抑制所述基因表达。转录的RNA优选与所述靶基因的转录产物有90%或更多,最优选95%或更多的互补性。可通过上述检索的方法确定序列的互补。为通过反义序列的方法有效抑制靶基因的表达,反义DNA应该至少15个核苷酸长或更多,优选100个核苷酸和更多,还优选500个核苷酸或更多。所用反义DNA通常短于5kb,优选短于2.5kb。
编码核酶的DNA可用于抑制内源基因的表达。核酶是指具有催化活性的RNA分子。有许多具有各种活性的核酶。对作为RNA裂解酶的核酶的研究使得能够设计位点特异性裂解RNA的核酶。组I内含子型的一些核酶或包含在RNaseP中的M1RNA由400个或更多个核苷酸组成,其它属于锤头型或发夹型的核酶具有约40个核苷酸的活性区(Makoto Koizumi和EikoOhtsuka Tanpakushitsu Kakusan Kohso(Nucleic acid,Protein,and Enzyme)352191,1990)。
锤头性核酶的自裂解区在序列G13U14C15的C15的3’侧裂解。在U14和第九位置的A之间形成的核苷酸对对于核酶活性是重要的。已表明当第15位置的核苷酸是A或U而不是C时也发生裂解(M.Koizumi等,FEBS Lett.228225,1988)。如果设计核酶的底物结合位点互补于邻近靶位点的RNA序列时,就可以创造出限制性酶样RNA裂解核酶,其识别靶RNA内的序列UC,UU或UA(M.Koizumi等,FEBS Lett.239285,1988;Makoto Koizumi和Eiko Ohtsuka Tanpakushitsu Kakusan Kohso(Protein,Nucleic Acids andEnzyme),352191,1990M.Koizumi等,Nucleic Acids Res.177059,1989)。例如,在RISBZ基因的编码区(SEQ ID NO1,3,4,或6)中有多个位点可用作核酶的靶。
发夹型核酶也可用于本发明中。可以在例如,烟草环斑病毒的卫星RNA的负链上分析发夹型核酶(J.M.Buzayan,Nature 323349,1986)。也已发现此酶靶特异性地切割RNA(Y.Kikuchi和N.Sasaki(1992)Nucleic Acids Res.196751;Yo Kikuchi(1992)Kagaku to Seibutsu(Chemistry and Biology)30112)。
设计切割所述靶的核酶与启动子,如花椰菜花叶病毒35s启动子,和一个转录终止序列融合以使其可以在植物细胞中转录。如果在转录的RNA的5’端或3’端添加额外的序列,该核酶的活性可能丧失。在这种情况下,可以放置一个附加的修剪(trimming)核酶,它顺式作用在核酶部分的5’或3’端进行修剪,以准确地从包含该核酶的转录RNA切下所述核酶部分(K.Taira等,(1990)Protein Eng.3733;A.M.Dzaianott and J.J.Bujarski(1989)Proc.Natl.Acad.Sci.USA 864823;C.A.Grosshands and R.T.Cech(1991)Nucleic AcidsRes.193875;K.Taira等(1991)Nucleic Acid Res.195125)。通过将这些结构单位串联排列,从而达到更大的效果,可切割靶基因内的多个位点,(N.Yuyama等,Biochem.Biophys.Res.Commun.1861271(1992))。通过使用这些核酶,可能特异性地切割本发明靶基因的转录产物,从而抑制所述基因的表达。
也可通过采用具有相同或相似于靶基因序列的DNA转化的共抑制来抑制内源基因表达。“共抑制”是指这样一种现象,其中当具有相同或相似于靶内源基因序列的基因通过转化引入植物中时,引入的外源基因和靶内源基因的表达都被抑制。虽然共抑制的详细机制尚不清楚,其经常可以在植物中观察到(Curr.Biol.7R793,1997,Curr.Biol.6810,1996)。例如,如果希望得到其中RISBZ基因被共抑制的植物体,可通过载体DNA转化目的植物,所述DNA被设计以表达RISBZ基因或具有相似序列的DNA,从而挑选具有RISBZ突变体特征的植物,例如所得植物中种子贮藏蛋白的表达水平改变的植物。用于共抑制的基因不必完全与靶基因相同,但是它至少具有70%或更多的序列同一性,优选80%或更多,更优选90%或更多(例如95%或更多)。可通过如上所述检索来确定序列同一性。
此外,本发明的内源基因表达可通过用基因转化植物来抑制,所述基因编码具有所述靶基因表达产物的显性阴性表型(dominant negative phenotype)的蛋白。这里“编码具有显性阴性表型的蛋白的DNA”是指编码蛋白的DNA,其一旦表达,可以消除或降低植物天然内源基因编码的蛋白的活性。这样的一个例子是编码一种肽的DNA,所述肽具有GCN4结合活性但不具有本发明蛋白的转录活性区(例如缺失了SEQ ID NO2氨基酸序列中第1-40位氨基酸的肽或与其相应的蛋白的肽)。
用于转化植物细胞的载体并无具体限制,只要其能在细胞中表达插入的基因。例如可使用具有在植物细胞中进行组成型基因表达的启动子的载体(例如,花椰菜花叶病毒的35s启动子),或被外部刺激物诱导活化的启动子的载体。此外,可以合适地使用能确保组织特异性表达的启动子。组织特异性启动子例如包括用于在水稻植物种子中表达的谷蛋白基因的启动子(Takaiwa,F.等,Plant Mol.Biol.17875-885,1991)或本发明的RISBZ1的启动子,用于在荚豆类作物,如菜豆,蚕豆,青豌豆或含油种子作物,如花生,芝麻种子,油菜籽,棉籽,向日葵种子和红花种子中表达的谷蛋白基因的启动子,或上述作物中每一种的主要贮藏蛋白的启动子如在菜豆的情况下是菜豆蛋白基因的启动子(Murai,N.等,Science 222476-482,1993)或在油菜籽的情况下是gluciferrin基因的启动子(Rodin,J.等,Plant Mol.Biol.20559-563,1992),或是用于在马铃薯块根中表达的patatin基因的启动子(Rocha-Sosa,M.等,EMBO J。823-29,1989),在甜马铃薯块根中表达的sporamin基因的启动子(Hattori,T.和Nakamura,K.,Plant Mol.Biol.11417-426,1988),和用于在菠菜和其它蔬菜的叶中表达的核酮糖-1,5-二磷酸脱羧酶基因(Orozco,B.M.和Ogren,W.L.,Plant Mol.Biol.231129-1138,1993)。
本文所用引入了载体的植物细胞包括各种形式的植物细胞,例如培养的细胞悬浮液,原生质体,叶切片和愈伤组织。
可通过已知方法将载体引入植物细胞,例如聚乙二醇方法,电穿孔,农杆菌属介导的传递,粒子轰击。可根据植物细胞类型通过已知方法从转化的植物细胞再生植物(Toki等,(1995)Plant Physiol.1001503-1507)。例如,水稻植物的转化和再生方法包括(1)采用聚乙二醇将基因导入原生质体和再生植物体(适于indica水稻栽培变种)(Datta,S.K.(1995)in“Gene Transfer toPlants”,Potrykus I和Spangenberg编,66-74页);(2)采用电脉冲将基因导入原生质体,然后再生植物体(Christou等,(1994)Plant J.6271-282);等。本领域已知这些方法,并已在本发明的技术领域广泛使用。这样的方法也可适于本发明。
一旦获得转化植物(所述植物的基因组中整合有本发明的DNA),则可能通过有性或营养繁殖得到该植物体的后代。或者,从得自植物的繁殖材料(例如种子,果实,穗,块茎,小块茎(tubercle),茬(tubs),愈伤组织,原生质体等)中大规模产生植物,以及其后代或克隆。用本发明的DNA转化的植物细胞,包括这些细胞的植物体,所述植物的子代和克隆,以及得自所述植物的繁殖材料,其子代和克隆都包括在本发明中。本发明的植物体优选是单子叶植物,更优选是禾本科(Poaceae)植物,最优选是水稻植物。
此外,本发明提供了植物体,其中采用本发明的RISBZ基因高度表达外源基因产物。本发明的植物体在其基因组中具有两种DNA构建体,所述第一种DNA构建体中,本发明的DNA可操纵地连接到表达控制区的下游,第二种DNA构建体中,外源基因可操纵地连接到具有靶序列的表达控制区的下游。。
本发明的DNA或外源基因“可操纵地连接”到表达控制区的下游指本发明的DNA或外源基因与表达控制区结合,以通过将转录因子结合到表达控制区诱导本发明的DNA或外源基因表达。
靶序列指本发明的RISBZ蛋白(其是转录因子)结合的DNA序列,其优选是包含GCN4基元或G/C盒的DNA序列。GCN4基元例如包括以下所示的各种基因中的序列*GCN4基元(包含GCN4基元的基因的名称)GCTGAGTCATGA/SEQ ID NO8(GluB-1)
CATGAGTCACTT/SEQ ID NO9(GluA-1)AGTGAGTCACTT/SEQ ID NO10(GluA-3)GGTGAGTCATAT/SEQ ID NO11(LMWG)GGTGAGTCATGT/SEQ ID NO12(大麦醇溶蛋白)GATGAGTCATGC/SEQ ID NO13(麦醇溶蛋白)AATGAGTCATCA/SEQ ID NO14(黑麦碱)优选用作靶序列的GCN4基元序列包括“GCTGAGTCATGA/SEQ IDNO8”,“GATGAGTCATGC/SEQ ID NO13”和“AATGAGTCATCA/SEQID NO14”。具体的G/C盒的例子包括序列“AGCCACGTCACA/SEQ ID NO15”。其中上述GCN4基元或G/C盒串联重复的序列也包括在本发明的靶序列中,优选例子是其中GCN4基元或G/C盒串联重复4次的序列。
外源基因的例子包括编码抗体,酶和生理活性肽的基因。
而且,本发明提供了产生植物体的方法,所述植物体利用本发明的RISBZ基因,高度表达外源基因产物。产生所述植物体的方法包括如将“在其基因组中具有DNA构建体的植物体,所述DNA构建体中本发明的DNA可操纵地连接到表达控制区的下游”,和“在其基因组中具有DNA构建体的植物体,其中所述DNA构建体中外源基因可操纵地连接到具有本发明蛋白的靶序列的表达控制区下游”的两种植物体杂交。
可通过本领域常用方法将上述“本发明的DNA可操纵地连接到表达控制区下游的DNA构建体”和“外源基因可操纵地连接到具有本发明蛋白靶序列的表达控制区下游的所述DNA构建体”导入植物基因组,例如采用上述的农杆菌属(Agrobacterium)方法。
此外可采用本领域传统方法进行植物体的杂交。例如,为阻止自体繁殖,在杂交当天采用tip shearing方法或采用热水通过demasculating只使花粉丧失繁殖能力,以通过振动授粉pollen mother的穗。
图1表示基于RISBZ蛋白和O2-样bZIP蛋白的氨基酸序列同源性的系统树(genealogical tree)。这些蛋白的全部氨基酸序列进行了对比以了解这些蛋白间的相似性和进化关系。
图2对比了RISBZ蛋白和O2-样bZIP蛋白的氨基酸序列。具有黑色背景的字母表示50%保守或更高水平保守的氨基酸。推定的核迁移信号(NLSASV40-样基元)(Varagona,M.J.等,Plant cell 41213-1227,1992)和富含丝氨酸的磷酸化位点分别以双线和虚线标出。粗线表示碱性结构域,其具有二因子胞核转移信号(NLSB)结构。向下的箭头表示亮氨酸重复部分。用于产生水稻bZIP探针的引物是基于向右和向左箭头所示的氨基酸序列设计。BLZ1(Vicente-Carbojos,J.等,13629-640,1998)和BLZ2(Onate,L.等,J.Biol.Chem.2749175-9182,1999)代表分离自大麦的O2-样bZIP蛋白,分离自玉米的O2(Hartings,H.等,EMBO J.82795-2801,1989)和OHP1(Pysh,L.D.等,Plant Cell 5227-236,1993),来自小麦的SPA(Albani D.等,Plant Cell9171-184,1997),来自高粱属(sorghum)的O2-sorg(Pirovano,L.等,Plant Mol.Biol.24515-523,1994),和来自薏苡的O2-coix(Vettore,A.L.等,Plant Mol.Bilo.36249-263,1998)。
图3接图2。
图4表示了编码O2-样bZIP蛋白的基因的结构。图中表示了大麦BLZ1基因和玉米Opaque2基因(O2)(Hartings,H.等,EMBO J.82795-2801,1989),高粱Opaque2基因(O2-sorg)和薏苡Opaque2基因(O2-coix)的内含子/外显子区的结构。粗条和细条分别代表外显子和内含子。数字表示外显子和内含子的核苷酸数量。
图5表示Northern印迹分析结果,其显示RISBZ基因的转录模式。对来自根,幼苗,和成熟种子(5,10,15,20,和30 DAF)的总RNA进行了Northern印迹分析,采用了bZIP结构域下游区的特有核苷酸序列作为探针。为对比转录模式,采用GluB-1基因-编码区作探针进行分析。采用溴化乙锭染色得到的25S rRNA的染色图作对照。
图6表示已转化的水稻植物中RISBZ1启动子/GUS报道基因的组织分析结果。
(A)RISBZ1启动子/GUS报道基因的示意图。(a)和(b)分别表示从RISBZ1基因的转录起始点开始计数的-1674th到+4th位的核苷酸,和包含uORF的从-1674th到+213th位的基因序列,两者在二元(binary)载体上都与GUS报道基因连接。(c)表示GluB1启动子(-245到+18)结合到质粒载体的GUS报道基因上的序列。
(B)的照片显示了种子在成熟阶段GUS报道基因的表达。在纵向切开水稻植物的种子(10DAF)(报道基因已引入其中)后,将其浸入X-gluc溶液中37℃下孵育。EN表示胚乳,而EM表示胚。
(C)图示了转化的水稻植物的种子提取物的GUS活性。用15DAF种子进行分析。导入基因的启动子结构分别如(A)的(a)和(b)所示。竖线代表平均值。MU代表4-甲基伞形酮。
图7图示用于鉴定GluB1启动子上RISBZ1蛋白结合位点的甲基化干扰实验的凝胶电泳图。对GluB1基因的启动子片段(-245到+18)的每一条链进行标记(top和down)。每一条链被部分甲基化后,将它们与GST-RISBZ1蛋白一起孵育,分别收集不与该蛋白结合和与该蛋白结合的片段,并在哌啶化学裂解后进行电泳。只在GCN4基元中发现未被哌啶裂解的位点(以星号标出)。
图8表示了凝胶移位分析以测试RISBZ1蛋白对GCN4基元的结合能力时电泳的结果。
(A)表示21bp的DNA片段,其包含用作探针和竞争剂的寡核苷酸的野生型GluB-1启动子序列(-175到-155)的GCN4基元。M1到M7是一系列的21bp DNA片段,它们具有3bp突变。GCN4基元以下划线标出。
(B)到(F)表示GST-RISBZ融合蛋白的凝胶移位分析结果。加入21bpDNA片段(野生型)作探针。(B)GST-RISBZ1的结果,(C)是GST-RISBZ2的结果,(D)是GST-RISBZ3的结果,(E)是GST-RISBZ4的结果,(F)是GST-RISBZ5的结果。加入竞争剂,使其化学计量比例是探针的100倍或更多。泳道1没有蛋白;泳道2没有竞争剂;泳道3到10有竞争剂(野生型(W)和M1到M7)。
图9表示RISBZ1与其它RISBZ蛋白形成异二聚体的能力。
(A)表示用作体外转录/翻译反应模板的载体结构。所述载体包括编码全长RISBZ1蛋白,短RISBZ2蛋白(sRISBZ2218到329),或短RISBZ3蛋白(sRISBZ3126到237)的DNA。
(B)的凝胶电泳图表示了DNA结合试验的结果。在泳道2,4,6和8中,检测到与全长或短形式的蛋白结合的DNA复合物。在泳道3和7中,检测到与全长RISBZ1蛋白和短形式蛋白所形成的异二聚体结合的DNA复合物。
图10表示了由瞬时分析确定的转录-活化结构域的鉴定结果。
(A)表示了报道质粒和效应质粒的结构。将GUS基因用作报道子,其中GAL4-DNA结合位点的9个拷贝与CaMV35s核心启动子序列连接。效应质粒包含编码蛋白的DNA(其中GAL4 DNA结合结构域与截短型RISBZ1蛋白的N-末端连接)。
(B)图示了采用报道质粒和效应质粒时的GUS活性。
图11表示了RISBZ1(WT)和突变型RISBZ1(M1-8)蛋白的N-末端区的亲水性模式,由Kyte和Doolittle公式确定(Kyte,J.和Doolittle,R.F.J.,Mol.Biol.157105-132,1982)。正值表示亲水。
图12图示了以GUS活性为指标的RIZBZ1的转录活性测定系统,Northem印迹分析照片,和GUS活性测定结果图。该图的纵座标代表GUS活性,它是每种转录因子的转录活性的强度指标。
图13图示了转录因子RISBZ1,Opaque2,SPA和RISBZ3(RITA1)的识别序列。图的纵坐标表示GUS活性,它是每一转录因子转录活性的强度指标。实验所用序列列于图下。
图14图示了本发明RISBZ1相对于源于各种基因的GCN4基元的转录活化能力。图上纵坐标代表GUS活性,它是每一转录因子转录活性的强度指标。实验所用GCN4基元的核苷酸序列列于图下。
实施本发明的最佳方式下面参考实施例对本发明更进一步描述,但它们并非对本发明的限制。
从种子cDNA文库分离编码bZIP转录因子的cDNA克隆水培培养14天的水稻植物(Oryza sativa L.c.v.Mangetumochi)的叶和根在液氮中冷冻,-80℃保藏备用。从田间培养的水稻植物收集成熟水稻种子。
根据Opaque2(O2)-样蛋白的bZIP区内的高度保守氨基酸序列(SNRESA和KVKMAED)设计寡核苷酸引物,以水稻种子中提取的poly(A)+mRNA作模板进行RT-PCR。从开花后6到16天(DAF)的种子提取聚腺苷酸RNA(Takaiwa F.等,Mol.Gen.Genet.20815-22,1987),采用Superscript逆转录酶(Gibco BRL,Paisly,UK)通过逆转录合成单链cDNA,以oligo(dT)20为引物。接着扩增cDNA,采用以下引物对5’-TCC AAC/T A/CGI GAA/G A/TCIGC-2’;SEQ ID NO16,和5’-GTC CTC C/TGC CAT CTT CAC CTT-3’;SEQID NO17。这些引物是基于在谷类种子中表达的位于bZIP-型转录因子内的高度保守氨基酸序列而设计。将所述单链cDNA溶解在PCR反应混合物中(其中含有10mM Tris-HCl pH8.3,1.5mM MgCl2,50mM KCl,0.01%(w/v)谷蛋白,200μM dNTPs,1μM寡核苷酸引物),再将TaqI聚合酶加入混合物中,所得混合物在热循环仪中94℃孵育5分钟。然后通过三个循环的PCR合成并扩增cDNA(94℃1分钟,40℃1分钟,然后72℃2分钟),然后进行30个循环的PCR(94℃1分钟,55℃1分钟,然后72℃2分钟)。将扩增的DNA片段克隆到TA克隆载体(pCR2.1;Invitrogen),并通过ABI PRISM染料终止序列系统进行测序。通过ABI PRISM 310 Genetic Analyzer(Perkin Elmer-AppliedBiosystems)分析反应产物以测定至少50个克隆的核苷酸序列。分析所得核苷酸序列数据,并采用GENETYX和BLAST算法对数据库检索。结果发现五个不同的213bp的片段。其中的两个与REB(Izawa T.等,Plant Cell 61277-1287,1994)和RITA1(Nakase M.等,Plant Mol.Biol.33513-522,1997)的bZIP区序列相同。采用这五个213bp的DNA片段作引物,从成熟(6-16DAF)种子(ZAPII;STRATAGENE)的mRNA中制备cDNA文库。然后在高度严谨条件下对每一片段筛选得到它们的全长cDNA。通过随机引发(randompriming)将[α-32P]-dCTP引入所述DNA片段(Amersham Pharmacia Biotech),所得片段用作探针。采用的预杂交溶液包含5×SSC,5×Denhard溶液,0.1%SDS,50%甲酰胺,100μg/ml鲑精DNA。杂交后,在55℃用2×SSC和0.1%SDS组成的混合液冲洗滤膜一次,然后用0.1×SSC和0.1%SDS组成的混合液冲洗滤膜两次。
基于每一核苷酸序列的同源性,将所得cDNA克隆命名为RISBZ1(水稻种子b-Zipper1)(SEQ ID NO1),RISBZ2,RISBZ3,RISBZ4(SEQ ID NO4)和RIDBZ5(SEQ ID NO6)。其中,RISBZ2和RISBZ3分别与REB(Izawa T.等,Plant Cell 61277-1287,1994)和RITA1(Nakase M.等,Plant Mol.Biol.33513-522,1997)相同,它们在先已从种子和叶的cDNA文库分离得到。
鉴定RISBZ cDNA
新证实的RISBZ cDNA(RISBZ1,RISBZ4,RISBZ5)如下进行详细鉴定。RISBZ1 cDNA最长,不包括聚腺苷酸的长度为1742bp,包含一个编码436个氨基酸(估计分子量为46,491Dal)的读码框。RISBZ4和RISBZ5具有编码278和295个氨基酸的读码框;它们预计的分子量分别为29383和31925Dal。
RISBZ1 mRNA具有的前导序列(245碱基长)长于平均的前导序列。有趣地是,在RISBZ1蛋白的实际起始密码子上游的前导序列内发现了编码31个氨基酸残基的一个小开放读码框。先前在玉米Opaque2(O2)(Hartings H.等,EMBO J.82795-2801,1989),小麦SPA(Albani D.等,Plant Cell 9171-184,1997),大麦BLZ1和BLZ2(Vincente-Carbojos J.等,Plant J.13629-640,1998;Onate L.等,J.Biol.Chem.2749175-9182,1999)中发现了类似的小的上游开放读码框(uORF),但是这些uORF相互间同源性很小。以前有报道玉米O2mRNA的uORF涉及翻译控制。uORF只在RISBZ1 mRNA中发现,而在其它RISBZ mRNA中没有发现。
起始密码子的侧翼序列是GCAATGG。此序列与得自单子叶植物的真核细胞翻译起始序列c(a/c)(A/G)(A/C)cAUGGCG相符。在起始密码子和uORF之间有100bp。编码RISBZ1的开放读码框具有两个相同的终止密码子(TAG)。在终止密码子和聚腺苷酸序列间有229bp。在添加聚腺苷酸位点的-19到-24区发现了多腺苷酸化信号序列(AATATA)。
RISBZ1密切相关于水稻REB(Nakase,M.等,Plant Mol.Biol.33513-522,1997),玉米OHP-1和OHP-2(Pysh L.D.等,Plant Cell 5227-236,1993)和大麦BLZ1(Vincente-Carbojos J.等,Plant J.13629-640,1998)(图1),在氨基酸水平表现出的同源性分别为48.2%(水稻REB),45.7%(大麦BLZ1),46.6%(玉米OHP1)。此外,这些bZIP区是高度保守的(73.7%到76.3%)。在氨基酸水平,RITA1(RISBZ3)与RISBZ4和RISBZ5的同源性分别为88.8%和47.6%。相比而言,RISBZ4与RISBZ5的同源性是48.2%。RISBZ3,RISBZ4和RISBZ5在先前报道的O2样转录因子中组成一个特有的组(unique group)。此外,从种子cDNA文库中分离的5种RISBZ cDNA能基于氨基酸同源性被分为两组(图1)。RISBZ3,RISBZ4和RISBZ5缺少RISBZ1和RISBZ2中具有的N-和C-末端区,它们的大小与RISBZ1和RISBZ2相比缺少100到150个氨基酸残基(图2和3)。
RISBZ1和RISBZ2在它们的N-末端区富含脯氨酸残基,在其它RISBZ蛋白中则不具有(图2和3)。RISBZ1和RISBZ2在距它们N-端的60th氨基酸的外周区(peripheral region)和位于其bZIP结构域上游的中间区也富含酸性氨基酸。在其它O2-样转录因子中发现了这些富脯氨酸或富酸性氨基酸的区。
由于在RISBZ1的207th到210th位残基的区域内发现了富丝氨酸序列(SGSS),认为所述蛋白是酪蛋白激酶II的靶序列(Hunter T.和Karin M.Cell 70375-387,1992)(图2和3)。在RISBZ2中也发现了类似的序列(SSSS)。但是所述序列在其它RISBZ蛋白中则缺失(图2和3)。
至今,已证实了两种核转换信号(NLSASV40-样基元和NLSB2-因子基元),它们涉及玉米Opaque2(O2)蛋白从细胞质到核的运输(Varagona M.J.等,Plant Cell 41213-1227,1992)。在RISBZ1中搜索这些基元,在与O2同样的位点发现了与NLSA和NLSB同源的序列(101到135和232到264)。
RISBZ1基因的基因组结构采用设计自RISBZ1 cDNA的核苷酸序列的引物,分离了编码启动子和RISBZ1蛋白的基因组区。进行PCR反应,以水稻基因组DNA作模板,两对寡核苷酸作引物(RIS1f5’-ATGGGTTGCGTAGCCGTAGCT-3’/SEQ ID NO18和RELr55’-TTGCTTGGCATGAGCATCTGT-3’/SEQ ID NO19)和(RELf25’-GAGGATCAGGCCCATAT-3’/SEQ ID NO20)和RIS1r5’-TCGCTATATTAAGGGAGACCA-3’/SEQ ID NO21)。采用TAKARALA Taq聚合酶(TAKARA)在热循环仪中扩增DNA片段,采用30个循环反应,98℃10秒,56℃30秒,68℃5分钟。基于Liu等方法采用热不对称交错(TAIL)PCR也对RISBZ1基因的启动子区进行扩增,其中三个寡核苷酸被用作特异性引物,tail15’-TGCTCCATTGCGCTCTCGGACGAG-3’/SEQ IDNO22,tail25’-ATGAATTCGCGAGGGGTTTTCGA-3’/SEQ ID NO23,tail35’-GTTTGGGAGAAATTCGATCAAATGC-3’/SEQ ID NO24。
结果显示RISBZ1基因包含六个外显子和5个内含子(图4)。此RISBZ1基因中的外显子/内含子构造与玉米O2(Hartings H.等,EMBO J.82795-2801,1989),高粱O2(Pirovano L.等,Plant Mol.Biol.24515-523,1994),薏苡O2(Vettore A.L.等,Plant Mol.Biol. 36249-263,1998),和大麦BLZ1(Vicente-Carbojos J.等,Plant J.13629-640,1998)基因的相同(图4)。
按照Sambrook等方法(Sambrook J.等,Molecular CloningA LaboratoryManual,2ndEd.,pp.7.79-7.83,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY)通过引物延伸分析确定RISBZ1基因的转录起始位点。具体地,通过用T4激酶标记包含30个核苷酸的寡核苷酸的5’末端(其互补于紧接所要区下游的序列),产生引物5’-ATGGTATGGTGTTCCTAGCACAGGTGTAGC-3’(SEQ ID NO25)。以5μg mRNA为模板,采用Superscript逆转录酶试剂盒(Gibco BRL,Paisly,UK),采用此引物进行逆转录反应,42℃下50min。
结果,将转录起始位点作图于距RISBZ1基因的翻译起始密码子245-nt上游区。‘TATA’盒定位于距转录起始位点-30到-35-nt处。在距转录起始位点63-,123-和198-bp上游区发现了三个‘ACGT’基元,但是没有发现负责种子特异性基因表达的基元,如GCN4和‘AAAG’。相反,发现了多个Dof区蛋白的识别序列,‘AAAG’。这些基元可能涉及RISBZ1基因的阶段-和/或组织特异性表达。例如,如果‘ACGT’基元是RISBZ1蛋白的靶序列,所述RISBZ1基因可以通过自身进行自调节。但是,当RISBZ1启动子/GUS报道基因和35s CaMV启动子/RISBZ1基因被导入原生质体细胞时,报道基因没有观察到转录活性。这些数据表明RISBZ1启动子不具有RISBZ1蛋白的靶序列;即在RISBZ1启动子中发现的‘ACGT’基元不是所述蛋白的靶序列。因此,RISBZ1基因可能不是自调节。相对照,如果水稻醇溶谷蛋白结合因子(RPBF)基因(其识别Dof区)过表达,RISBZ1启动子/GUS报道基因的转录被激活。这提示Dof区蛋白的识别序列涉及RISBZ1基因的特异性表达。
RISBZ mRNA的组织特异性进行Northern印迹分析RIABZ基因的表达。按照Takaiwa等(Varagona M.J.等,Plant Cell 41213-1227,1992)的方法,从5到30 DAF种子,根和幼苗(5-,10-,15-,20-和30-DAF)提取全总RNA,在通过琼脂糖凝胶电泳分级后分离转移到滤膜上。以下RISBZ cDNA中从bZIP区域-编码区的下游序列到3’非编码区的DNA片段被用做探针RISBZ1,354-bp,从1388th到1742nd位核苷酸;RISBZ2,346-bp,从1351st到1696th位核苷酸;RISBZ3,486-bp,从741st到1226th位核苷酸;
RISBZ5,621-bp,从742nd到1362nd位核苷酸。
在含有5×SSC,5×Denhard溶液,0.1%SDS,和50%甲酰胺的溶液中,45℃下进行杂交。杂交后,用含有2×SSC和0.1%SDS的混合溶液冲洗滤膜2次30分钟,然后用含有0.1×SSC和0.1%SDS的混合液冲洗滤膜2次30分钟。
如图5所示,RISBZ1基因只在种子中表达,没有在其它分析的组织中表达。最大量的RISBZ1 mRNA积聚在5 DAF到10 DAF收获的种子中。这样的mRNA大量积累保持到15 DAF,随着成熟而逐渐减少。RISBZ1基因表达峰值的出现阶段比谷蛋白基因的早。在5 DAF可检测到谷蛋白mRNA表达,在15 DAF出现峰值,然后逐渐降低(图5)。此结果表明RISBZ1功能是谷蛋白基因的活化剂。相似的表达方式在玉米O2(Hartings H.等EMBO J.82795-2801,1989),小麦SPA(Albani D.等,Plant Cell 9171-184,1997),和大麦BLZ2基因(Onate L.等,J.Biol.Chem.2749175-9182,1999)中也有报道。
在所有分析的组织中都有RISBZ2表达。RISBZ3和RISBZ4特异性表达于成熟后期的种子中(图5)。RISBZ3和RISBZ4 mRNA水平逐渐提高直到20 DAF,然后降低。与其它RISBZ基因相比,RISBZ5的表达水平极低,其mRNA峰值出现在10 DAF。
RISBZ1启动子/GUS报道基因构建体在转化体中的表达为检测RISBZ1基因的表达方式,将从转录起始位点计算的-1674到+213nt的序列片段连接到GUS基因的上游。通过利用农杆菌属将该报道基因导入水稻植物(图6A)。如下构建转化的水稻植物(Oryza sativa L.c.v.kitaake)。两个在其5’端具有RstI或BamHI限制性位点的寡核苷酸引物,5’-AAAACTGCAGTTTTCTGA-3’(SEQ ID NO26)和5’-AATGGATCCGCGAGGGGTTTTCGAA-3’(SEQ ID NO27),用于通过PCR扩增RISBZ1基因的5’-末端区域(从-1674th到+4th和从-1674th到+213rd)。PCR反应在反应混合物中进行(10mM Tris-HCl pH8.3,1.5mM MgCl2,50mM KCl,0.01%(w/v)明胶,200μM dNTPs,1μM引物,0.5μg模板DNA,2.5单位的TaqI聚合酶),孵育的30个循环,94℃1分钟,50℃1分钟,72℃2分钟。用限制性酶PstI和BamHI消化后,所述PCR产物克隆到质粒载体pBI201中,用限制酶PstI和SacI裂解。所得包含RISBZ1启动子/GUS基因的DNA片段插入到二元载体p8cHm(其包含CaMV35s启动子/潮霉素磷酸转移酶(HPT)基因)的Sse8387I和SacI位点之间。按照Goto F.等,NatureBiotech.17282-286所述方法进行转化。
如下构建报道质粒。如Wu等(Wu C.Y.等,Plant J.14673-683,1998)构建的1×21bp,3×21bp,和5×21bp的GCN4基元/GUS基因用作报道基因。将一对具有悬垂的(overhanged)(ACGT)5’端的48bp寡核苷酸(它们相互互补)与之相连以构建四聚体,所述四聚体包含12-bp野生型GCN4基元(GCTGAGTCATGA/SEQ ID NO8)和突变体GCN4基元(GCTTCCTCATGA/SEQ ID NO28)。将这些双链寡核苷酸插入到所述-46CaMV/GUS报道基因的SalI和StuI位点。
按照Wu等所述方法进行对水稻愈伤组织原生质体的瞬时分析。依照Jefferson(Jefferson R.A.Plant Mol.Biol.Rep.5387-405,1987)所述方法,通过测定得自葡糖苷酸前体的4-甲基-伞形酮的荧光强度来测定GUS活性。采用Bio Rad Kit,测定所述蛋白浓度。使用牛血清白蛋白作为标准蛋白。
如图6B所示,在成熟种子的aleulon和sub aleulon层观察到高GUS活性,但在胚芽中没有观察到。即使采用高灵敏度荧光检测也没有在根,叶和茎中发现GUS活性。这些结果表明RISBZ1只在aleulon和sub aleulon层表达。为观察5’-端非翻译区和uORF的作用,将该GUS活性与植物的GUS活性相对比,所述植物缺失了从转录起始点计数的-1674th到+4th的uORF(图6A)。结果由于uORF缺失,在表达位点观察不到变化(图6B),但是观察到弱5到10倍的启动子活性(图6C)。与在玉米O2中的结果(其中uORF作为翻译抑制因子)相比,这些数据提示5’-非翻译区在翻译的正调节中可能起作用(Lohmer S.等,Plant Cell 565-73)。
五种RISBZ蛋白通过与GCN4基元结合的转录激活能力通过瞬时分析(transient assay)测定五种RISBZ蛋白通过与GCN4基元结合的转录激活能力。制备质粒,其中每一RISBZ1蛋白的编码序列连接到CaMV35s启动子的下游作为效应子。效应质粒的制备如下通过PCR制备编码缺失其N-末端区的RISBZ1的质粒。为扩增编码区的cDNA,所述区范围为从RISBZ1的N-末端的41st,81st,121st,161st位氨基酸到其C-末端,设计如下引物
正向引物RIS1-15’-AACCATGGTGCTGGAGCGGTGCCCGT-3’(SEQ IDNO29)RIS1-25’-AACCATGGCGGCGGAGGCGGCGGCG-3’(SEQ IDNO30)RIS1-35’-CCCCATGGAGTACAACGCGATGC-3’(SEQ ID NO31)RIS1-45’-AACCATGGTTGGTTCCATCCTGAGT-3’(SEQ ID NO32)RIS1-55’-AACCATGGCTCATGCCAAGCAAGCT-3’(SEQ ID NO33)RIS1-65’-AACCATGGATGAAGAAGATAAAGTGAAG-3’(SEQ IDNO34)反向引物BRIS1R5’-TAGGATCCGCTCCTACTACTGAAGCT-3’(SEQ ID NO35)设计引物在它们的5’端具有NcoI或BamHI限制性位点。由于通过去除N-末端区缺失了一个翻译起始密码子,利用NcoI限制性位点的ATG。通过PCR扩增cDNA,在94℃温育2分钟,然后是94℃1分钟,50℃1分钟,72℃2分钟的30个循环,然后在72℃温育5分钟。用限制酶NcoI或BamHI消化PCR产物,然后通过琼脂糖凝胶电泳纯化。所述纯化的cDNA片段最终插入到pRT100载体(Topfer R.等,Nucl.Acids Res.155890,1987)。
也构建编码包括GAL4 DNA结合结构域(从1st到147th的氨基酸残基)和RISBZ1或RISBZ2基因的融合蛋白的质粒。为采用Pfu Taq聚合酶(STRATAGENE)通过PCR扩增编码RISBZ1或RISBZ2各N-末端区的cDNA区,制备如下的反向引物,其中在其5’-端添加了一个BamHI位点,终止密码子,SstI位点,以及如下的正向引物正向引物RISBZ1-F15′-AAGGATCCAATGGAGCACGTGTTCGCC-3′(SEQ ID NO36)RISBZ1-F25′-AAGGATCCGGCGGCGGAGGCGGCGCG-3′(SEQ ID NO37)RISBZ1-F35′-GCCGGATCCAGTTGGTTCCATCCTGAG-3′(SEQ ID NO38)RISBZ1-F45′-AAGGATCCTGATGAAGAAGATAAAGT-3′(SEQ ID NO39)RISBZ1 F1-25′-AAGGATCCAGGAGTAGATGACGTCGGC-3′(SEQ ID NO40)RISBZ1 F1-35′-AAGGATCCAGACGAGATCCCCGACCCGCT-3′(SEQ ID NO41)
反向引物RISBZ1-R15′-TAGAGCTCTACGCCGCCGGCATCGGGCT-3′(SEQ ID NO42)RISBZ1-R25′-TAGAGCTCTAAAGGATCATATTTCCCAT-3′(SEQ ID NO43)RISBZ1 R1-15′-TAGAGCTCTAGGCGGCCGCCGCCGGCTG-3′(SEQ ID NO44)RISBZ1 R1-25′-TAGAGCTCTACGGCGGCGGCGGAGCCCA-3′(SEQ ID NO45).
利用所述引物,通过PCR扩增编码RISBZ1或RISBZ2的各N-末端区的cDNA,所述PCR包括在94℃温育2分钟,然后是94℃1分钟,50℃1分钟,72℃1分钟的30个循环,然后在72℃温育5分钟。PCR产物用限制酶BamHI和SacI消化,然后通过2%琼脂糖凝胶电泳纯化。所述纯化的cDNA片段连接到用同样的限制酶消化的35s-564载体的GAL4 DNA域编码区的下游,以便其读码框相匹配。也通过PCR诱变将突变引入RISBZ1的N末端区。确认cDNA序列,通过PCR扩增其从1st到57th位氨基酸残基的部分序列。所述产物连接到处于相同读码框中的GAL4 DNA结构域编码区的下游。
此外,构建报道质粒,其中插入了GUS基因,21bp GCN4基元的1或5个重复(repeat)或12bp GCN4基元的1或3个重复。对于阴性对照实验,采用包含突变型12-bp GCN4基元的4个重复和GUS报道基因的质粒。所述突变型12-bp GCN4基元在被RISBZ1和O2识别的靶序列中具有一个突变。将这些质粒构建体单独或与其它报道质粒或效应质粒一起导入制备自愈伤组织培养物的水稻原生质体细胞,分析其GUS活性。当报道质粒或效应质粒单独引入到原生质体时,检测GUS活性处于低水平。但是如表1所示,在作为效应质粒引入的35s/RISBZ1或35s/O2存在下,报道基因的转录被激活。即使在这些效应质粒存在下,突变型12-bp GCN4基元下游的GUS基因的转录活性与背景活性处于同一水平。这些结果表明RISBZ1基因产物激活GCN4基元介导的报道基因。由RISBZ1基因产物诱导的报道基因转录活性略高于由O2基因产物诱导的。如表2所示,由RISBZ1诱导的活性基于GCN4基元的拷贝数得以增强。分析21-bp GCN4基元的1到12个拷贝,所示转录活性对多达9个拷贝成比例地增强。但是,即使其它RISBZ基因在35s CaMV启动子控制下表达,所示表达基因的转录活性小于或等于由RISBZ1或O2基因产物诱导的转录活性的1.4%。因此,揭示只有RISBZ1蛋白能通过与GCN4基元的结合而活化转录。表1效应子 GUS活性(pM 4-MU/min/mg蛋白)35s/Opaque2 2658±31835s/RISBZ1 2994±15735s/RISBZ2 44±735s/RISBZ3 1.3±1.235s/RISBZ4 17.3±0.935s/RISBZ5 31±8.8将4×12-bp GCN4基元/GUS报道基因和效应质粒一起导入原生质体细胞,测定GUS活性。进行三次独立测定得到数据。
表2效应子GUS活性(pM 4-MU/min/mg蛋白)报道子 (-) (+)RISBZ1(+)Opaque21×12-bp GCN4 32±1.5 295±4.5 182±6(9.2*) (5.6*)4×12-bp GCN4 21 604±24.5452±7.5(28.7*) (21.5*)1×21-bp GCN4 30±3 1318±55.5 1139±22.5(43.9*) (37.9*)5×21-bp GCN4 104 13222±1094 11932±22.5(127.1*)(114.7*)1×12-bp,4×12-bp,1×21-bp或5×21-bp GCN4基元/GUS基因作为报道子使用。此表表示了通过RISBZ1(+RISBZ1)基因或通过Opaque2(+Opaque2)基因表达诱导的GUS活性。
RISBZ1蛋白的结合位点本发明人先前发现O2蛋白识别存在于一种谷蛋白基因,GluB-1的-165th到-160th位的启动子区的所述GCN4基元(TGAGTCA)(Wu C.Y.等,Plant J.14673-683,1998)。通过甲基化干扰实验,本发明人也确定了GluB-1基因启动子区中RISBZ1蛋白的结合位点。
如下进行GST-RISBZ1融合蛋白的生产和纯化。通过PCR扩增RISBZ1cDNA的5个编码区,在所用寡核苷酸引物的5’-端已加入下述的适当的限制酶切位点;对RISBZ1加入BamHI-平端,RISBZ2加入BamHI-XhoI,RISBZ3加入BamHI-SalI,RISBZ4加入BamHI-SalI,RISBZ5加入BamHI-XhoI。在用限制酶消化后,所述PCR产物连接到pGEX-4T-3载体(AmershamPharmacia Biotech)的克隆位点。按照Suzuki等方法表达所述GST-RISBZ融合蛋白(Suzuki A.等,Plant Cell Physiol,39555-559,1998)。在亲和纯化后,所示GST融合蛋白在结合缓冲液(包含20mM HEPES-KOH pH7.9,50mMKCl,1mM EDTA,10%甘油)中透析4小时,然后立刻-80℃保存。
如Weinberger等所述进行甲基化干扰分析实验(Weinberger J.等,Nature322846-849,1986)。用限制酶SalI和BamHI消化GluB1基因的5’-侧翼区(从-245th到+18th位核苷酸),用[α-32P]dCTP通过“fill-in”反应标记所述片段的末端。将标记的片段用二甲基硫酸盐处理进行甲基化,与GST-RISBZ1混合,然后再温育。借助非变性丙烯酰胺凝胶(5%,0.25×TBE)电泳,将混有GST-RISBZ1和游离DNA片段的混合DNA片段彼此分离。通过DEAE琼脂糖凝胶柱层析进一步纯化这些DNA片段,用哌啶处理,再借助6%的变性丙烯酰胺凝胶电泳分离。
如图7所示,GST-RISBZ1融合蛋白保护位于GluB-1启动子的-165th到-160th区的鸟嘌呤残基。所述被保护的鸟嘌呤残基与O2启动子中被保护的残基相同(Albani D.等,Plant Cell 9171-184,1997)。范围为-197th到+18th的启动子区的-79th到-76th位残基上的‘ACGT’基元(也称为A/G杂交盒)中存在的鸟嘌呤残基没有保护。
此外,如下进行凝胶移位分析以测定RISBZ1蛋白是否能识别GCN4基元。
一对相互互补的寡核苷酸(通过加入TCGA序列制备)加入到GluB1启动子区(从-175th到-155th)的21-nt片段,该片段的末端用[α-32P]dCTP通过“fill-in”反应标记用作探针。还合成7对互补的寡核苷酸,它们具有连续的三个核苷酸的突变(图8A),以用作突变型竞争剂片段,并进行退火。通过Wu等(WuC.Y.等,Plant J.14673-683,1998)和Suzuki等(Suzuki A.等,Plant Cell Physiol,39555-559,1998)所述方法进行采用GST融合蛋白的凝胶移位分析。标记的寡核苷酸探针与0.5μg GST-RISBZ融合蛋白混合,室温下温育20分钟。在竞争性实验中,将竞争剂片段以100倍或更高的分子量比加入到混合物中。通过非变性丙烯酰胺凝胶(5%,0.25×TBE)电泳分析反应混合物。
对迁移的条带的检测表明GST-RISBZ1蛋白能与包含GCN4基元的21bp DNA片段结合(图8B)。此外,如图8A所示,具有连续三个核苷酸突变的21-bpDNA片段用作竞争剂并测定。当在GCF基元中具有突变的DNA片段作为竞争剂加入时,作为探针加入的DNA片段的结合几乎不或根本不被抑制(图8B到F)。相反,当在GCN4基元的侧翼序列具有突变的DNA片段作为竞争剂加入时,迁移的条带消失(图8B到F)。由于GCN4基元突变显著影响RISBZ1蛋白对所述基元的结合,显示RISBZ1蛋白特异性识别GCN4基元序列。采用其它RISBZ蛋白进行的类似实验揭示所有的RISBZ蛋白都能特异性识别该GCN4基元。如图8B到F所示,每一RISBZ蛋白对该GCN4基元的亲和力略有不同。如果是RISBZ2和RISBZ5,当在GCN基元的侧翼序列具有突变的DNA片段用作竞争剂时,移位的条带没有完全消失(图8C和F)。
这些结果显示所述RISBZ蛋白特异性识别GCN4基元,亲和性略有不同。
RISZ1蛋白形成异二聚体的能力认为RISBZ1蛋白(一种bZIP型转录因子)当与其它RISBZ蛋白形成异二聚体时可结合GCN4-样基元。因此,检测了RISBZ1与RISBZ2或RISBZ3形成异二聚体的能力。采用小麦胚芽提取物制备全长RISBZ1蛋白和短形式的RISBZ2蛋白(sRISBZ2)和短形式的RISBZ3蛋白(sRISBZ3)(图9A),并用于DNA结合分析。如下进行体外翻译。扩增RISBZ1 cDNA编码区和RISBZ2cDNA和RISBZ3 cDNA的bZIP结构域编码区,采用如下在5’端具有NcoI位点的正向引物以及编码终止密码子和BamHI位点的反向引物;扩增RISBZ1采用R1F5’-AAACCATGGAGCACGTGTTCGCCGT-3’(SEQ ID NO46)和BRIS1r5’-TAGGATCCGCICCTACTACTGAAGCT-3’(SEQ ID NO47);扩增sRISBZ2采用dR2-15’-AAACCATGGAGGGAGAAGCTGAGACC-3’(SEQ ID NO48)R2ral5’-AAAGGATCCTACATATCAGAAGCGGCGGGA-3’(SEQ IDNO49);扩增sRISBZ3采用dR3-15’-AAACCATGGATATAGAGGGCGGTCCA-3’(SEQ ID NO50)和R3ral5’-AAAGGATCCTACAGCCCGCCCAGGTGGCCG-3’(SEQ IDNO51)。
进行PCR扩增,反应混合物包含10mM Tris-HCl pH8.3,1.5mM MgCl2,50mM KCl,0.01%(w/v)明胶,200μM dNTPs,1μM引物,0.5mg模板DNA,2.5单位的TaqI聚合酶,进行的30个循环是94℃温育1分钟,50℃1分钟,72℃2分钟。
用限制性酶NcoI和BamHI消化所述PCR产物,然后连接到pET8c克隆载体(Novagen)以构建质粒。采用这些质粒作模板,进行体外转录/翻译(TNT耦合小麦胚芽提取系统;Promega)以产生全长RISBZ1蛋白和短形式的RISBZ2(RISBZ2s)和RISBZ3(RISBZ3s)。上述反应中所用的4μL小麦胚芽提取物可以用于凝胶移位分析。
利用凝胶移位分析以分离与21bp GCN4基元结合的同二聚体和异二聚体。在同sRISBZ2和sRISBZ3预温育RISBZ1后,将所述含有GCN4基元的DNA探针加入到温育混合物中。所述结果指示RISBZ同二聚体以及异二聚体可与GCN4基元结合。因此证实RISBZ蛋白与RISBZ家族其它成员形成异二聚体。
转录活化中RISBZ1蛋白的N-末端区的作用进行瞬时分析以识别转录活化中涉及的RISBZ1蛋白的结构域。作为报道基因制备所述GUS基因,其上已连接了21bp GCN4基元的三个拷贝和CaMV35s的核心启动子序列。采用CaMV35s启动子表达RISBZ1蛋白的各个结构域以确定这些结构域是否激活所述报道基因。
构建一系列编码RISBZ1蛋白的效应质粒,其中缺失从N-末端到碱性结构域(basic domain)的每40个氨基酸(SEQ ID NO2的氨基酸序列中的编码氨基酸区范围从41st到436th,81st到436th,121st到436th,161st到436th,201st到436th,235th到436th)。当将编码全长RISBZ1蛋白的效应质粒和报道质粒(GUS基因与12-bp GCN基元的4个拷贝和CaMV35s的核心启动子序列连接)导入原生质体时,检测到的GUS活性相对于只导入了报道质粒的原生质体的高约30倍。当此报道基因的转录活性设定为100%时,缺失了前40个氨基酸的基因活性下降到20%。此外,每缺失40个氨基酸报道基因的活性逐步降低到10%。这样,提示RISBZ1的N-末端40个氨基酸主要涉及转录活化。
为进一步分析RISBZ1的N-末端40个氨基酸与其转录活化能力的关系,构建酵母转录活化因子GAL4 DNA结合结构域和RISBZ1蛋白各部分之间的各种融合蛋白并表达用于增益(gain-of-function)分析。如图10所示,构建质粒并用作效应基因,所述质粒包含GAL4-DNA结合结构域和RISBZ1各区的融合蛋白的编码序列连接到CaMV35s启动子的下游。将这些效应质粒与报道基因构建体(所述GUS基因,连接有GAL4-DNA结合位点的九个拷贝与CaMV35s核心启动子)一起引入原生质体中。
包含GAL4-DNA结合结构域和RISBZ1的1st到235th位氨基酸的部分O氨基酸序列的融合蛋白的转录活化能力与一系列融合蛋白对比没有显著差别,所述一系列融合蛋白中缺失从RISBZ1的C-末端残基到27th位残基的氨基酸(图10)。具有前20个氨基酸残基的融合蛋白的转录活化能力显著降低(图10)。缺失了N-末端8个RISBZ1残基的融合蛋白失去了转录活性。相对照,包含GAL4-DNA结合域和RISBZ1的其它区(SEQ ID NO2中的从27th到57th,81st到234th,161st到234th,或235th到436th)的融合蛋白对报道基因的转录活性没有影响。这些结果提示RISBZ1蛋白的N-末端27个氨基酸残基内的富脯氨酸域涉及转录活化,与酸性域无关。
通过结构域交换(domain swapping)分析的RISBZ1和其它RISBZ蛋白间转录活化活性的差别尽管RISBZ蛋白家族的所有成员对GCN4基元序列有相似的亲和性,但只有RISBZ1具有转录活化活性。为找到这种差别的原因,进行RISBZ1-,和RISBZ2-或RISBZ3-蛋白间的结构域交换(domain swapping)。RISBZ1的位于bZIP结构域上游的1st到299th的N-末端区被RISBZ2的1st到299th位或RISBZ2的1st到137th位的N-末端区所取代。
与全长RISBZ1相比,具有RISBZ1的N-末端区和RISBZ2或RISBZ3的DNA结合域的融合蛋白分别表现出约15%或38%的转录活化能力。相对照地,具有RISBZ2或RISBZ3的N-末端区和RISBZ1 DNA结合域的融合蛋白表现出的转录活性略高于单独由RISBZ1 DNA结合域诱导的。
这些结果指示所述N-末端区主要与转录活化有关。RISBZ2或RISBZ3转录活化能力低可能是由于进化过程中缺失或突变了对应RISBZ1转录活化域的区。或者可能是由于转录活化域的形成过程中所导致。RISBZ3的较低活性很可能是由于缺少RISBZ1上的富含脯氨酸域。这也适用于RISBZ4和RISBZ5。凝胶移位分析的结果可能排除了与GCN4基元的亲和力的差异导致转录活化能力的差异的可能性。
RISBZ1的富含脯氨酸域在RISBZ2这是高度保守的,但与RISBZ1的相比RISBZ2的转录活化能力极低。当编码包含RISBZ2的N-末端27个氨基酸的融合蛋白(包含富含脯氨酸域和GAL4-DNA结合域)的效应质粒与编码与GUS基因相连接的GCN4基元的报道质粒一起导入原生质体时,没有观察到GUS活性的提高。
由于在RISBZ1和RISBZ2之间观察到N-末端27个残基中只有8个残基不同,本发明人已经测定了此8个残基中哪一个导致了转录活化能力的差异。RISBZ1与RISBZ2不同的8个氨基酸残基被RISBZ2的残基逐一取代,所得包含40个氨基酸的嵌合N-末端序列与GAL4-DNA结合域融合以构建编码融合蛋白的效应质粒。将这些效应质粒与报道质粒一起导入原生质体中,所述报道质粒中GCN4基元与GUS基因融合。在8个效应质粒中,除编码具有从RISBZ1的N-末端计算的第7位残基取代的蛋白的那些外,所有的效应基因构建体都没有活化报道基因的转录。采用Kyte和Doolittle公式假定所有这些7个取代的氨基酸,其丧失了转录活化能力,会诱导hydropacy方式的改变(图11)。
转录因子RISBZ1对作物育种的用途本发明人检测了将具有转录活化能力的转录因子RISBZ1用于作物育种的可能性。为了在种子中特异性过表达转录因子,用编码RISBZ1基因的质粒构建体转化水稻植物,所述基因处于水稻谷醇溶蛋白基因启动子(其编码种子贮藏蛋白,分子量13kDa)的控制下。将RISBZ1基因的位于-29th位的EcoRI位点到聚腺苷酸添加位点的DNA片段连接到包含从所述基因的翻译起始位点ATG计算的-652nd到-13th位的谷醇溶蛋白启动子。将所述构建体插入到二元载体pGTV-Bar,借助农杆菌属(Agrobacterium)将所得载体导入水稻植物。通过此方法建立28个独立的转化株。以RISBZ1的cDNA作探针,通过提取自成熟种子的RNA的Northem杂交进行过表达RISBZ1 mRNA的水稻植物的筛选(图12)。这些过表达RISBZ1的品系与转化的水稻植物杂交,在所述水稻植物中引入了编码21-bp GCN4基元(5’-GTTTGTCATGGCTGAGTCATG-3’/SEQ ID NO52)的5个串联重复的质粒构建体,RISBZ1蛋白的靶,其连接到minimum启动子/GUS报道基因。
结果显示由于RISBZ1的过表达,GUS报道基因的表达水平比对照的,5×GCN4细胞株(11到14 nmol/min/mg蛋白)增强了400倍或更多(450到750nmol/min/mg蛋白)(图12)。这些结果提示可通过连接具有转录活化能力的转录因子RISBZ1的靶序列的外源基因下游并过表达RISBZ1来高度活化外源基因的转录。
所述RISBZ1蛋白不仅能活化谷蛋白基因而且能活化其它贮藏蛋白基因。采用电穿孔方法将35s CaMV启动子/RISBZ1融合构建体同谷蛋白/GUS,谷蛋白启动子(-980th到ATG)/GUS,或13-Kd谷醇溶蛋白启动子(从-652nd到-29th)/GUS一起引入水稻原生质体,观察到它们的瞬时表达。
实验结果指示RISBZ1蛋白结合这些启动子中的包含GCN4基元的靶序列并激活外源基因的转录。揭示了在13Kd谷醇溶蛋白启动子情况下活化比背景高5到10倍,如果是球蛋白启动子则高20到30倍。因此使用甲基化干扰反应确定RISBZ1如何识别这些基因的核苷酸序列。
结果表明谷醇溶蛋白基因的三个GCN4基元(TGACACA,GATGACTCA,TGACTCAC)和球蛋白的不同于GCN4基元的三个基元(GGTGACAC,GTATGTFFSC,和GATCCATGTCAC)被RISBZ1蛋白所识别。为测定被RISBZ1所识别的启动子中的具体序列,通过采用嵌合启动子序列观察GUS基因的瞬时表达,所述嵌合启动子序列中,G,A,C,G/C,A/G,或C/A盒,GCN4,22Kd玉米醇溶蛋白结合位点和包括b-32结合位点的12-bp序列的4个重复串联插入到-46 CaMV 35s核心启动子/GUS报道基因。实验结果指示RISBZ1蛋白优先识别G/C盒和GCN4基元(图13)。
此外,研究了RISBZ1蛋白是否识别贮藏蛋白基因启动子上各种不同的GCN4基元。此结果指示GCN4基元的核心序列“TGAGTCA”的侧翼序列影响转录活化能力,并且小麦麦醇溶蛋白基因和黑麦黑麦碱基因的GCN4基元具有高转录活化能力(图14)。
工业应用性本发明提供了调控水稻种子贮藏蛋白表达的新的转录因子,以及编码所述转录因子的基因。预计由本发明具有转录活化能力的RISBZ1蛋白调控的许多种子贮藏蛋白的表达,可通过将编码RISBZ1蛋白的基因导入细胞并超表达而增强。本发明还提供了新的基因表达系统,其中一种有用的外源基因,编码如抗体和酶,可利用本发明的转录因子高表达,方法是通过将所述转录因子的识别序列和GCN4基元串联连接并将其引入编码种子贮藏蛋白的基因启动子中以利于其与转录因子的结合。这样,在所述修饰的启动子控制下可以大大增强编码贮藏蛋白的基因和有用的外源基因的表达。这使胚乳中种子贮藏蛋白大量积累,种子(例如水稻)更富营养以及产生有用蛋白高度积累的种子。
序列表序列表<110>独立行政法人农业生物资源研究所(National Institute of Agrobiological Sciences)生物系特定产业技术研究所推进机构(Bio-or iented Technology Research Advancement Institution)<120>控制水稻中贮藏蛋白的表达的bZIP转录因子<130><140>PCT/JP01/08936<141>2001-10-11<150>JP 2000-311295<151>2000-10-11<160>52<170>PatentIn Ver.2.0<210>1<211>1735<212>DNA<213>稻(Oryza sativa)<220><221>CDS<222>(211)..(1518)<400>1ggcacgagaa aaaacccatg ggttgcgtag ccgtagcttt cccaccattt ccttctctcc 60gaagcctcct cctctccgct tcctcccgcg aaaccaaatt ccaaagcatt tgatcgaatt 120tctcccaaac ttttccagcg ttttcaattt cgccccgatt tcggttcgaa aacccctcgc 180gaattcattt caaactcgtc cgagagcgca atg gag cac gtg ttc gcc gtc gac 234Met Glu His Val Phe Ala Val Asp1 5gag atc ccc gac ccg ctg tgg gct ccg ccg ccg ccg gtg cag ccg gcg 282Glu Ile Pro Asp Pro Leu Trp Ala Pro Pro Pro Pro Val Gln Pro Ala10 15 20gcg gcc gcc gga gta gat gac gtc ggc gcg gtg agc ggc ggc ggg ttg 330Ala Ala Ala Gly Val Asp Asp Val Gly Ala Val Ser Gly Gly Gly Leu25 30 35 40ctg gag cgg tgc ccg tcg ggg tgg aac ctc gag agg ttt ctg gag gag 378Leu Glu Arg Cys Pro Ser Gly Trp Asn Leu Glu Arg Phe Leu Glu Glu45 50 55ctc gac ggc gtc cct gca ccg gcg gcg agc ccg gac ggc gcg gcg att 426Leu Asp Gly Val Pro Ala Pro Ala Ala Ser Pro Asp Gly Ala Ala Ile60 65 70tac cct agc ccg atg ccg gcg gcg gcg gcg gag gcg gcg gcg cgc tgg 474Tyr Pro Ser Pro Met Pro Ala Ala Ala Ala Glu Ala Ala Ala Arg Trp75 80 85agt agg ggc tac ggc gat cgt gag gcg gtg ggg gtg atg ccc atg ccc 522Ser Arg Gly Tyr Gly Asp Arg Glu Ala Val Gly Val Met Pro Met Pro90 95 100gcg gcc gcg ctt ccg gcg gcg ccg gcg agc gcg gcg atg gac ccc gtg 570Ala Ala Ala Leu Pro Ala Ala Pro Ala Ser Ala Ala Met Asp Pro Val105 110 115 120gag tac aac gcg atg ctg aag cgg aag ctg gac gag gac ctc gcc acc 618Glu Tyr Asn Ala Met Leu Lys Arg Lys Leu Asp Glu Asp Leu Ala Thr125 130 135gtc gcc atg tgg agg gcc tct ggt gca ata cat tct gag agt cct cta 666Val Ala Met Trp Arg Ala Ser Gly Ala Ile His Ser Glu Ser Pro Leu140 145 150ggc aat aaa aca tca ctg agt ata gtt ggt tcc atc ctg agt tca cag 714Gly Asn Lys Thr Ser Leu Ser Ile Val Gly Ser Ile Leu Ser Ser Gln155 160 165aag tgc att gaa ggt aac ggg ata cta gtg cag acc aag tta agt cct 762Lys Cys Ile Glu Gly Asn Gly Ile Leu Val Gln Thr Lys Leu Ser Pro170 175 180ggc cca aat gga gga tca ggc cca tat gta aat caa aat aca gat gct 810Gly Pro Asn Gly Gly Ser Gly Pro Tyr Val Asn Gln Asn Thr Asp Ala185 190 195 200cat gcc aag caa gct acg agt ggt tcc tca agg gag cca tca cca tca 858His Ala Lys Gln Ala Thr Ser Gly Ser Ser Arg Glu Pro Ser Pro Ser205 210 215gag gat gat gat atg gaa gga gat gca gag gca atg gga aat atg atc 906Glu Asp Asp Asp Met Glu Gly Asp Ala Glu Ala Met Gly Asn Met Ile220 225 230ctt gat gaa gaa gat aaa gtg aag aaa agg aag gaa tcc aac cgg gag 954Leu Asp Glu Glu Asp Lys Val Lys Lys Arg Lys Glu Ser Asn Arg Glu235 240 245tca gct aga cgc tca aga agc aga aag gca gct cgc cta aaa gac ctg 1002Ser Ala Arg Arg Ser Arg Ser Arg Lys Ala Ala Arg Leu Lys Asp Leu250 255 260gag gag cag gta tca cta tta agg gtt gaa aac tct tct ctg ttg agg 1050Glu Glu Gln Val Ser Leu Leu Arg Val Glu Asn Ser Ser Leu Leu Arg265 270 275 280cgt ctt gct gat gca aat cag aag tac agt gct gct gct att gac aat 1098Arg Leu Ala Asp Ala Asn Gln Lys Tyr Ser Ala Ala Ala Ile Asp Asn285 290 295agg gta cta atg gca gac att gaa gcc cta aga gca aag gtg agg atg 1146Arg Val Leu Met Ala Asp Ile Glu Ala Leu Arg Ala Lys Val Arg Met300 305 310gca gag gag agt gtg aag atg gtt aca ggg gct aga caa ctt cac cag 1194Ala Glu Glu Ser Val Lys Met Val Thr Gly Ala Arg Gln Leu His Gln315 320 325gcc att cct gac atg caa tct ccc ctc aat gtc aac tct gat gct tct 1242Ala Ile Pro Asp Met Gln Ser Pro Leu Asn Val Asn Ser Asp Ala Ser330 335 340gtg ccg atc cag aac aac aac cca atg aac tac ttc tcc aac gct aac 1290Val Pro Ile Gln Asn Asn Asn Pro Met Asn Tyr Phe Ser Asn Ala Asn345 350 355 360aat gcc ggt gtt aac agc ttc atg cac cag gtt tct cca gcg ttc cag 1338Asn Ala Gly Val Asn Ser Phe Met His Gln Val Ser Pro Ala Phe Gln365 370 375att gtg gat tct gtc gag aag att gac cca aca gat cca gtg cag ctg 1386Ile Val Asp Ser Val Glu Lys Ile Asp Pro Thr Asp Pro Val Gln Leu380 385 390cag cag caa cag atg gcg agc ttg cag cat ctt cag aat aga gct tgt 1434Gln Gln Gln Gln Met Ala Ser Leu Gln His Leu Gln Asn Arg Ala Cys395 400 405ggt ggc ggc gca agt tcg aat gaa tat aca gca tgg gga tcg tct ctg 1482Gly Gly Gly Ala Ser Ser Asn Glu Tyr Thr Ala Trp Gly Ser Ser Leu410 415 420atg gat gca aat gag ctt gtc aac atg gag ctt cag tagtaggagc1528Met Asp Ala Asn Glu Leu Val Asn Met Glu Leu Gln425 430 435atatcctaac aacatgatga gagcatttgg aggtgcaaat ttgcaacctg caaatgctgt 1588tttgtagtag tagttgttgt cgctgttttt gtctgaaact gtagtttcta tggattttgg 1648acttgctgag gaacatctgc ggctgttgtt gtttcaaatt gagaaaatga gggacaatgg 1708gacatggtgg tctcccttaa tatagcgaaa aaatggttgg ata 1742<210>2<211>436<212>PRT<213>稻(Oryza sativa)<400>2Met Glu His Val Phe Ala Val Asp Glu Ile Pro Asp Pro Leu Trp Ala1 5 10 15Pro Pro Pro Pro Val Gln Pro Ala Ala Ala Ala Gly Val Asp Asp Val20 25 30Gly Ala Val Ser Gly Gly Gly Leu Leu Glu Arg Cys Pro Ser Gly Trp35 40 45Asn Leu Glu Arg Phe Leu Glu Glu Leu Asp Gly Val Pro Ala Pro Ala50 55 60Ala Ser Pro Asp Gly Ala Ala Ile Tyr Pro Ser Pro Met Pro Ala Ala65 70 75 80Ala Ala Glu Ala Ala Ala Arg Trp Ser Arg Gly Tyr Gly Asp Arg Glu85 90 95Ala Val Gly Val Met Pro Met Pro Ala Ala Ala Leu Pro Ala Ala Pro100 105 110Ala Ser Ala Ala Met Asp Pro Val Glu Tyr Asn Ala Met Leu Lys Arg115 120 125Lys Leu Asp Glu Asp Leu Ala Thr Val Ala Met Trp Arg Ala Ser Gly130 135 140Ala Ile His Ser Glu Ser Pro Leu Gly Asn Lys Thr Ser Leu Ser Ile145 150 155 160Val Gly Ser Ile Leu Ser Ser Gln Lys Cys Ile Glu Gly Asn Gly Ile165 170 175Leu Val Gln Thr Lys Leu Ser Pro Gly Pro Asn Gly Gly Ser Gly Pro180 185 190Tyr Val Asn Gln Asn Thr Asp Ala His Ala Lys Gln Ala Thr Ser Gly195 200 205Ser Ser Arg Glu Pro Ser Pro Ser Glu Asp Asp Asp Met Glu Gly Asp210 215 220Ala Glu Ala Met Gly Asn Met Ile Leu Asp Glu Glu Asp Lys Val Lys225 230 235 240Lys Arg Lys Glu Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Ser Arg245 250 255Lys Ala Ala Arg Leu Lys Asp Leu Glu Glu Gln Val Ser Leu Leu Arg260 265 270Val Glu Asn Ser Ser Leu Leu Arg Arg Leu Ala Asp Ala Asn Gln Lys275 280 285Tyr Ser Ala Ala Ala Ile Asp Asn Arg Val Leu Met Ala Asp Ile Glu290 295 300Ala Leu Arg Ala Lys Val Arg Met Ala Glu Glu Ser Val Lys Met Val305 310 315 320Thr Gly Ala Arg Gln Leu His Gln Ala Ile Pro Asp Met Gln Ser Pro325 330 335Leu Asn Val Asn Ser Asp Ala Ser Val Pro Ile Gln Asn Asn Asn Pro340 345 350Met Asn Tyr Phe Ser Asn Ala Asn Asn Ala Gly Val Asn Ser Phe Met355 360 365His Gln Val Ser Pro Ala Phe Gln Ile Val Asp Ser Val Glu Lys Ile370 375 380Asp Pro Thr Asp Pro Val Gln Leu Gln Gln Gln Gln Met Ala Ser Leu385 390 395 400Gln His Leu Gln Asn Arg Ala Cys Gly Gly Gly Ala Ser Ser Asn Glu405 410 415Tyr Thr Ala Trp Gly Ser Ser Leu Met Asp Ala Asn Glu Leu Val Asn420 425 430Met Glu Leu Gln435<210>3<211>6335<212>DNA<213>稻(Oryza sativa)<400>3tgctccattg cgctctcgga cgagcatata tgtatgacat gtgggcccgg aatgtcagta 60acagggaatc ctgaaaaaaa tgcagctatg tgataatttt caacgctaat gttgcagttt 120tctgaaaagt gtcgcaaagg ttgcagcaaa gtgatagttt agtcaataaa actgcagttt 180tctgaaattt actctagttt ttttacctat ctagttggtt ttatgtgtaa ctaaacctta 240catcagatca aaacaagttt ataaattcac cacgtatttc cctcagctca catctttctg 300agaacatgat aaattcatta cattgtgcta caccatatgg ggactttaga acatgttcgt 360cttctttttt tttctttttt cttttttaca ttttaccttc tcagtttaca aatacttgtt 420agctttgcct ggatatgtaa cccaacacta tgatacaaat tttgtcaatt ctctaaaatt 480tttcaagttt gaaacaaatt aagatgtatg gttgtgggtg aattaatcta cattgatagg 540aaatgcgtta aagtacatgc aaagcttatg aaattattgc aagtagtcat catgcctcag 600tgagtcagtg tgcatacttg tagtgcataa ccaaattctt tttcatatac tagaaagatt 660caaagctgca aatgtgcatg tgaggttgat gaatggaata cacaataata catgacaata 720aacacatatt aaagaattta gtgcaaaaaa attgtattgt catggtacac attttaacaa 780ttttctttac tttttataca ttgtaaatat taattaatat ctaaaacaaa atataaagta 840cgggaataaa atttaattgg ctaatgtgga aatggcatgg agctaaatgt tctatatatg 900gtcctaacgt ttaaagataa aatacatatg tgcttgtgtt actaataata tctaaaagac 960taagtagtat gtattaaata tgctagagaa cataagaaac ttaaaaactt gacgtggcaa 1020aatgggcgct taagcgacac atattgcact ttcagctgat cttattcccc cttttaaatt 1080tcatgtcccc attttgatta tcacatggaa tcaaccacat tatacctatg catccttgtg 1140atttctgaaa ttaaactcga aagcaaccaa gtaaagagga gggggagaaa aagttagcag 1200aaaacatgga tgatacatgt caataagctg ctagcataac cataagtgta gggcacgttt 1260cttaggacaa tggtataaag ttacaaactg aaatatcatt gttaggtcag tttgatataa 1320tcagtttgga ttactataga cacttgtcat agtaaataga gatggatcat ttcttaagta 1380gcatcactac tcttattcac gaatgtcttt gctacccttt ctgttatact tttcctcttt 1440ttctgtagaa agccatttgt ccttatatta tcattgtcaa attaaggatg cgtaatctac 1500accctcactc aaaaactttg ataagataaa aacaaataaa tccatgcctt tatagaacct 1560tgtcaaaatt atgctacacc tgtgctagga acaccatacc atcgtagctt acttgcacgc 1620tttctgttag ccctttttcc taataaaaac gtattcgtcc gtatcgttgt tatcgctttg 1680atcgtgtggg tttcacttta tatccgttga aacctctgtt aacacgtcca aattatttat 1740atcggtatta tcactcaaga tcgtgcgggt tgttttgctt tttacgtttc ttgaagcttc 1800taaagagggg acaaacctat ataaatagga gaggagagca ccctctcaac tcagttcaaa 1860attgaaaaaa aaaagaaaaa aaaagagaag aaaaaaaaac ccatgggttg cgtagccgta 1920gctttcccac catttccttc tctccgaagc ctcctcctct ccgcttcctc ccgcgaaacc 1980aaattccaaa gcatttgatc gaatttctcc caaacttttc cagcgttttc aatttcgccc 2040cgatttcggt tcgaaaaccc ctcgcgaatt catttcaaac tcgtccgaga gcgcaatgga 2100gcacgtgttc gccgtcgacg agatccccga cccgctgtgg gctccgccgc cgccggtgca 2160gccggcggcg gccgccggag tagatgacgt cggcgcggtg agcggcggcg ggttgctgga 2220gcggtgcccg tcggggtgga acctcgagag gtttctggag gagctcgacg gcgtccctgc 2280accggcggcg agcccggacg gcgcggcgat ttaccctagc ccgatgccgg cggcggcggc 2340ggaggcggcg gcgcgctgga gtaggggcta cggcgatcgt gaggcggtgg gggtgatgcc 2400catgcccgcg gccgcgcttc cggcggcgcc ggcgagcgcg gcgatggacc ccgtggagta 2460caacgcgatg ctgaagcgga agctggacga ggacctcgcc accgtcgcca tgtggagggt 2520actctctctc atctcgatcg ctgcttgctt tgcttgcttc atggcttgta cagttgtact 2580ggtgggttca ccatttgggg tggtggtgat gggatggctg tggcgtaatt aagtgcaatt 2640tttagggcat ttcctgtgat taactgtggc tagatggtcg caatttagca tagatgtgac 2700atatcctagc tgttactatg aatctggacc ggctctctgt ccagattcat agtactagat 2760gtgtcacatc cctctaaatc tcttatatta taaggaggga gtataaatta attttataag 2820agcacgcgtt gatgtcgata tccgcatcgt aagcccaggc actactcacg tgtgtgcttt 2880cttatccata ctttaatatt gtcagagtgg gatgagacaa actttaatat tgtcggggtg 2940tggtataata tttatattat ttccgtgtat agatttagga gtaatatgga ttaggattgc 3000atggaggtgc agagacttta tgtgacttct tggagccgtg cattgcttga gtgcaaagtt 3060aacaatttgg ttacatgttg caaaaatgat gtatagatca taggtcattg cacttatttt 3120gggtggtcct aggcggtatg attcatggaa tattttttgg aaattctgta ttttaccata 3180tttgcattac ttttcttatt attgttgttt gaaggaatta ttaggtcaca tacccttgga 3240agatgaaatt attttagtag aaaaaaagaa actgttatat tggaatctgg taaatttgga 3300cctagaaatt ctcaccagtc gattgtagat ggggaagcag agctttcttt ttagagattt 3360gctccgctcc aacaaaaagt acctcgaggt actggtacct catggtacca aatcgtttcc 3420gatcgttgga tctaacaatg cacatcctgc ctaattagat ccaacgatcg aaaatgattt 3480ggtaccgtga ggtaccggta cctcgaggta ctttttgttg gaccggagaa aatatcttct 3540ttttatgtta gttttctaag tggggtatat aatttttgca attggatatc atactttgaa 3600ctcattatgt gggttcagtt tacaaatgac tacagaacat gttgatctga gcttttgcta 3660gttgatttca gtttacaatg tgaaacggtt ccctatataa gattataatg ccattagaac 3720taattaacta tgagagtgtg tgtttagctc cgatagttat taagtccctt tgcattctga 3780cttcaatttt tggcatgtcc atccatccac aggcctctgg tgcaatacat tctgagagtc 3840ctctaggcaa taaaacatca ctgagtatag ttggttccat cctgagttca cagaagtgca 3900ttgaaggtat tctattatgc atatgtgctt agttaaatct tctcagtacc tatgagttat 3960gacttatgag taatctctaa tgttgtaagc aaatctaatt tttgcgtaat gtagttttca 4020tattatatat atctgattgg attttccccc tatttcgaca cattcaggta acgggatact 4080agtgcagacc aagttaagtc ctggcccaaa tggaggatca ggcccatatg taaatcaaaa 4140tacagatgct catgccaagc aagctacgag tggttcctca agggagccat caccatcaga 4200ggatgatgat atggaaggag atgcagaggc aatgggaaat atgatccttg atgaagaaga 4260taaagtgaag aaaaggtaat atgtattctt ttgcttgtgt atttttattt ttcaattcaa 4320cacatacaaa gagtaaacac tgagcattag cattagaaat taggggactt ttacatctat 4380tgatttcctt ttttcttaga aatagctttt aagtaatatg ctttagatta tcaagataat 4440ggatccttag tttctttcta ggtgtttcat gtttgtactg gatgtatttg attatataca 4500acattctcac ttttttctta gaaatgcttg agctaatgct tgctaggtgt ttcaatgctt 4560tatatacctg actgaatttt ggtaatgctt gttacaagct ggtgcattaa ggataattat 4620tgtttccgtg caagcagcta ttcatgcaaa aaaggaaaaa tgcaacgtgt atgattagaa 4680caatttagga ggcatttgct tcttgctttt cataacatgc tgggaatatc atgtcctgtt 4740gtgtctagtt gctttttcta catatgaaaa attgagttta tctactgtgg tctttttttc 4800cgcagcagtc agacattcat gtcgcctttt tttgtgtaat aaatacagcc ggatatttga 4860gatttgagct tgtgttcttg tccaatttca ggaaggaatc caaccgggag tcagctagac 4920gctcaagaag cagaaaggca gctcgcctaa aagacctgga ggagcaggtt ttgtgtttta 4980cactattcca tttgactgca caacaaagtt ttggaatatg taagtaacaa gtgtaattgt 5040tgctaaatca ttgcaggtat cactattaag ggttgaaaac tcttctctgt tgaggcgtct 5100tgctgatgca aatcagaagt acagtgctgc tgctattgac aatagggtac taatggcaga 5160cattgaagcc ctaagagcaa aggtatgcaa ctgtttaagt gccttttagt cctctgtatg 5220aactgaacct ctctttcaaa taggtatcca attatccatg tgcattgatt ctggtcagta 5280ttgtgcatct ttcatggtgt agaaaaccgg aatattctac atatcaaaca tataccaaat 5340tttcttggaa tgaaacgaac ttctagcatt tgttcttaaa atttggtaca ggagatattg 5400caaatgttgt cctcttgctc cattcgaagg attaagttgt ttgccatcta ttataacctg 5460caacaattag actcacttgt tttgtcttga aacaaccggg tgtaactact tttctttttc 5520ctgcaacgta ccaggtgtaa ataatcgctt gccgaatggt gataaccaat tcacacaatg 5580gatcacaatc aattttaaca aagaacctga gctacactac actactgcgg tgtcgtatct 5640tatagccata tgcttctaga ccacaactga aaattcatga accatgcgat gtgggttagc 5700taacatcttg acatgattgc aggtgaggat ggcagaggag agtgtgaaga tggttacagg 5760ggctagacaa cttcaccagg ccattcctga catgcaatct cccctcaatg tcaactctga 5820tgcttctgtg ccgatccaga acaacaaccc aatgaactac ttctccaacg ctaacaatgc 5880cggtgttaac agcttcatgc accaggtttc tccagcgttc cagattgtgg attctgtcga 5940gaagattgac ccaacagatc cagtgcagct gcagcagcaa cagatggcga gcttgcagca 6000tcttcagaat agagcttgtg gtggcggcgc aagttcgaat gaatatacag catggggatc 6060gtctctgatg gatgcaaatg agcttgtcaa catggagctt cagtagtagg agcatatcct 6120aacaacatga tgagagcatt tggaggtgca aatttgcaac ctgcaaatgc tgttttgtag 6180tagtagttgt tgtcgctgtt tttgtctgaa actgtagttt ctatggattt tggacttgct 6240gaggaacatc tgcggctgtt gttgtttcaa attgagaaaa tgagggacaa tgggacatgg 6300tggtctccct taatatagcg aaaaatggtt ggaat6335<210>4<211>1199<212>DNA<213>稻(Oryza sativa)<220><221>CDS<222>(171)..(1004)<400>4ggcacgaggc gatcaacaca aaaagcttct ctttcccttc tcctcctcgg tgatctgtct 60cgccggggca tctcgaaaag catccgactc cgacgccgcc gcgcgccacc acccggccga 120tcgccgacgc cgcagccgct ggaagcagca gggacgacgg agaatcggag atg gac176Met Aspatc gag gcg ttc atc cac ggc gga agc ggg ggc ggc gac gcc gac gcc 224Ile Glu Ala Phe Ile His Gly Gly Ser Gly Gly Gly Asp Ala Asp Ala5 10 15gac cac ccg ctc ggc atc ttc tcc gcc gcc gac ctc tcc ggc ttc ggc 272Asp His Pro Leu Gly Ile Phe Ser Ala Ala Asp Leu Ser Gly Phe Gly20 25 30ttc gcg gac tcg agc acc atc aca ggg ggc att ccc aat cac ata tgg 320Phe Ala Asp Ser Ser Thr Ile Thr Gly Gly Ile Pro Asn His Ile Trp35 40 45 50ccc cag tcc cag aac ctg aac gca cgg cat cct gcg gtc tcc acg aca 368Pro Gln Ser Gln Asn Leu Asn Ala Arg His Pro Ala Val Ser Thr Thr55 60 65att gag tcg cag tca tca atc tgt gca gca gca agt ccc aca tca gct 416Ile Glu Ser Gln Ser Ser Ile Cys Ala Ala Ala Ser Pro Thr Ser Ala70 75 80acc aat ctg aac atg aag gag agc caa act ctg gga ggc aca agt ggt 464Thr Asn Leu Asn Met Lys Glu Ser Gln Thr Leu Gly Gly Thr Ser Gly85 90 95tcg gat tct gaa agt gaa tcg ctg ttg gat ata gag ggt ggt cca tgc 512Ser Asp Ser Glu Ser Glu Ser Leu Leu Asp Ile Glu Gly Gly Pro Cys100 105 110gaa caa agc acg aac ccg ttg gac gtg aag aga gtg aga agg atg gtg 560Glu Gln Ser Thr Asn Pro Leu Asp Val Lys Arg Val Arg Arg Met Val115 120 125 130tcc aat cgg gag tct gct cgg cga tcg agg aag aga aag caa gct cac 608Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Lys Arg Lys Gln Ala His135 140 145tta gct gat ctc gag tca cag gtt gac cag ctc cgg ggc gaa aac gca 656Leu Ala Asp Leu Glu Ser Gln Val Asp Gln Leu Arg Gly Glu Asn Ala150 155 160tcg ctt ttc aag cag ttg acg gat gcc aac cag caa ttc aca act tct 704Ser Leu Phe Lys Gln Leu Thr Asp Ala Asn Gln Gln Phe Thr Thr Ser
165 170 175gtc acg gac aac aga atc ctc aaa tca gac gtt gag gcc ctc cgg gtc 752Val Thr Asp Asn Arg Ile Leu Lys Ser Asp Val Glu Ala Leu Arg Val180 185 190aag gtg aag atg gcg gag gac atg gtg gcg cgg ggg gcg ctg tcg tgc 800Lys Val Lys Met Ala Glu Asp Met Val Ala Arg Gly Ala Leu Ser Cys195 200 205 210ggg ctc ggc cac ctg ggc ggg ctg tcg ccg gcg ctg aac ccc cgg cag 848Gly Leu Gly His Leu Gly Gly Leu Ser Pro Ala Leu Asn Pro Arg Gln215 220 225gcg tgc cgc gtc ccc gac gtg ctc gcc ggc ctg gac tac gcc ggc gac 896Ala Cys Arg Val Pro Asp Val Leu Ala Gly Leu Asp Tyr Ala Gly Asp230 235 240gac ccc ttc acg gcc ggg ctg tcc cag ccg gag cag ttg cag atg ccc 944Asp Pro Phe Thr Ala Gly Leu Ser Gln Pro Glu Gln Leu Gln Met Pro245 250 255ggc ggc gag gtg gtt gac gcc tgg ggc tgg gac aac cac ccc aac ggc 992Gly Gly Glu Val Val Asp Ala Trp Gly Trp Asp Asn His Pro Asn Gly260 265 270ggc atg tcc aag tgaaactact ggtcctactt ctatgtcagc tcagctacgt 1044Gly Met Ser Lys275ttgaaacgtg atgtgtccaa gtgaacggac ttgagttttt cagagtcctc gtgtcgaagt 1104gtcatgcact cttccctatt cctgtaatag aactgactag ctaagagact gaaagtctga 1164aactacgaag tataaatgtg gtggaatttg gaact1199<210>5<211>278<212>PRT<213>稻(Oryza sativa)<400>5Met Asp Ile Glu Ala Phe Ile His Gly Gly Ser Gly Gly Gly Asp Ala1 5 10 15Asp Ala Asp His Pro Leu Gly Ile Phe Ser Ala Ala Asp Leu Ser Gly20 25 30Phe Gly Phe Ala Asp Ser Ser Thr Ile Thr Gly Gly Ile Pro Asn His35 40 45Ile Trp Pro Gln Ser Gln Asn Leu Asn Ala Arg His Pro Ala Val Ser50 55 60Thr Thr Ile Glu Ser Gln Ser Ser Ile Cys Ala Ala Ala Ser Pro Thr65 70 75 80Ser Ala Thr Asn Leu Asn Met Lys Glu Ser Gln Thr Leu Gly Gly Thr85 90 95Ser Gly Ser Asp Ser Glu Ser Glu Ser Leu Leu Asp Ile Glu Gly Gly100 105 110Pro Cys Glu Gln Ser Thr Asn Pro Leu Asp Val Lys Arg Val Arg Arg115 120 125Met Val Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Lys Arg Lys Gln130 135 140Ala His Leu Ala Asp Leu Glu Ser Gln Val Asp Gln Leu Arg Gly Glu145 150 155 160Asn Ala Ser Leu Phe Lys Gln Leu Thr Asp Ala Asn Gln Gln Phe Thr165 170 175Thr Ser Val Thr Asp Asn Arg Ile Leu Lys Ser Asp Val Glu Ala Leu180 185 190Arg Val Lys Val Lys Met Ala Glu Asp Met Val Ala Arg Gly Ala Leu195 200 205Ser Cys Gly Leu Gly His Leu Gly Gly Leu Ser Pro Ala Leu Asn Pro210 215 220Arg Gln Ala Cys Arg Val Pro Asp Val Leu Ala Gly Leu Asp Tyr Ala225 230 235 240Gly Asp Asp Pro Phe Thr Ala Gly Leu Ser Gln Pro Glu Gln Leu Gln245 250 255Met Pro Gly Gly Glu Val Val Asp Ala Trp Gly Trp Asp Asn His Pro260 265 270Asn Gly Gly Met Ser Lys275<210>6<211>1362<212>DNA<213>稻(Oryza sativa)<220><221>CDS<222>(23)..(907)<400>6ggcacgaggt cggaggaagg cg atg atg aag aag tgc ccg tcg gag ctg cag 52Met Met Lys Lys Cys Pro Ser Glu Leu Gln1 5 10ctg gag gcg ttc atc cgg gag gag gcc ggc gcc ggc gac cgc aag ccc 100Leu Glu Ala Phe Ile Arg Glu Glu Ala Gly Ala Gly Asp Arg Lys Pro15 20 25ggc gtg tta tct ccc ggc gac ggc gcg cgt aag tcc ggc ctg ttc tct 148Gly Val Leu Ser Pro Gly Asp Gly Ala Arg Lys Ser Gly Leu Phe Ser30 35 40ccc ggc gac ggc gag atg tcc gtg ttg gat cag agt aca ctg gac gga 196Pro Gly Asp Gly Glu Met Ser Val Leu Asp Gln Ser Thr Leu Asp Gly45 50 55agc ggc ggc ggc cac cag ctg tgg tgg ccg gag agc gtc cgt acg ccg 244Ser Gly Gly Gly His Gln Leu Trp Trp Pro Glu Ser Val Arg Thr Pro60 65 70ccg cgc gcc gcc gcc gcc ttc tcg gcc acg gcc gac gag cgg acg ccg 292Pro Arg Ala Ala Ala Ala Phe Ser Ala Thr Ala Asp Glu Arg Thr Pro75 80 85 90gcg tcc atc tcc gat gac ccc aaa cca acc acc tca gcg aac cac gcg 340Ala Ser Ile Ser Asp Asp Pro Lys Pro Thr Thr Ser Ala Asn His Ala95 100 105cct gaa agc gac tcg gac tcc gat tgc gat tcg ctg tta gaa gca gag 388Pro Glu Ser Asp Ser Asp Ser Asp Cys Asp Ser Leu Leu Glu Ala Glu110 115 120agg agt cca cgc ctg cgt ggc acg aaa tcc aca gaa aca aag cga ata 436Arg Ser Pro Arg Leu Arg Gly Thr Lys Ser Thr Glu Thr Lys Arg Ile125 130 135aga agg atg gtg tcc aac agg gag tcc gct cga cga tcc agg agg aga 484Arg Arg Met Val Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Arg Arg140 145 150aag cag gca cag tta tct gaa ctc gaa tca cag gtc gag caa ctc aaa 532Lys Gln Ala Gln Leu Ser Glu Leu Glu Ser Gln Val Glu Gln Leu Lys155 160 165 170ggc gaa aac tca tcc ctc ttc aag cag ctc aca gag tcc agc cag cag 580Gly Glu Asn Ser Ser Leu Phe Lys Gln Leu Thr Glu Ser Ser Gln Gln175 180 185ttc aat aca gcg gtc acg gac aac agg atc ctc aaa tcg gat gta gag 628Phe Asn Thr Ala Val Thr Asp Asn Arg Ile Leu Lys Ser Asp Val Glu190 195 200gcc tta aga gtc aag gtc aag atg gct gaa gac atg gtc gcg agg gcc 676Ala Leu Arg Val Lys Val Lys Met Ala Glu Asp Met Val Ala Arg Ala205 210 215gcg atg tcg tgt ggc ctg ggc cag ctc ggg ctg gcg cca ttg ctc agc 724Ala Met Ser Cys Gly Leu Gly Gln Leu Gly Leu Ala Pro Leu Leu Ser220 225 230tcc agg aag atg tgc caa gct ttg gat atg ctc agt tta cca cgg aac 772Ser Arg Lys Met Cys Gln Ala Leu Asp Met Leu Ser Leu Pro Arg Asn235 240 245 250gat gcc tgt ggt ttc aaa ggc ttg aac ctg ggt cga cag gtt cag aac 820Asp Ala Cys Gly Phe Lys Gly Leu Asn Leu Gly Arg Gln Val Gln Asn255 260 265tca ccg gtt caa agc gct gca agc cta gag agc ctg gac aac cgg ata 868Ser Pro Val Gln Ser Ala Ala Ser Leu Glu Ser Leu Asp Asn Arg Ile270 275 280tcc agc gag gtg acc agc tgc tcg gct gat gtg tgg cct taagacactt917Ser Ser Glu Val Thr Ser Cys Ser Ala Asp Val Trp Pro285 290 295catccgtgtt cgagagagct tgagattcta agaagcagcc ggtgagaatc tgaaaaggct 977agttgttcag tttcctattt ttagtttatg tttgaattct ctggctacta atgctcaaaa 1037tctgggagag aatctaaatc gtttgggaca gataaaaaat tatgcgagaa ggtgtagctg 1097acagaaacct tcccaaacaa atctccatca gaacctatat gtaaagtaat acggtatcct 1157ctgttactag gtgcatgtgc ataactgaca agctgctaag tactaggtac tacagtctga 1217ggcaagtatt tctggtgttt tggtgctgaa gaactatgtt ttagtgcgtt tgatctgcgg 1277caatcaaggc catctgatcg aaatttgatt ggtataaatc tgatcgaaat ttgattggta 1337taagtataat agtttgattt tgatc 1362<210>7<211>295<212>PRT<213>稻(Oryza sativa)<400>7Met Met Lys Lys Cys Pro Ser Glu Leu Gln Leu Glu Ala Phe Ile Arg1 5 10 15Glu Glu Ala Gly Ala Gly Asp Arg Lys Pro Gly Val Leu Ser Pro Gly20 25 30Asp Gly Ala Arg Lys Ser Gly Leu Phe Ser Pro Gly Asp Gly Glu Met35 40 45Ser Val Leu Asp Gln Ser Thr Leu Asp Gly Ser Gly Gly Gly His Gln50 55 60Leu Trp Trp Pro Glu Ser Val Arg Thr Pro Pro Arg Ala Ala Ala Ala65 70 75 80Phe Ser Ala Thr Ala Asp Glu Arg Thr Pro Ala Ser Ile Ser Asp Asp85 90 95Pro Lys Pro Thr Thr Ser Ala Asn His Ala Pro Glu Ser Asp Ser Asp100 105 110Ser Asp Cys Asp Ser Leu Leu Glu Ala Glu Arg Ser Pro Arg Leu Arg115 120 125Gly Thr Lys Ser Thr Glu Thr Lys Arg Ile Arg Arg Met Val Ser Asn130 135 140Arg Glu Ser Ala Arg Arg Ser Arg Arg Arg Lys Gln Ala Gln Leu Ser145 150 155 160Glu Leu Glu Ser Gln Val Glu Gln Leu Lys Gly Glu Asn Ser Ser Leu165 170 175Phe Lys Gln Leu Thr Glu Ser Ser Gln Gln Phe Asn Thr Ala Val Thr180 185 190Asp Asn Arg Ile Leu Lys Ser Asp Val Glu Ala Leu Arg Val Lys Val195 200 205Lys Met Ala Glu Asp Met Val Ala Arg Ala Ala Met Ser Cys Gly Leu210 215 220Gly Gln Leu Gly Leu Ala Pro Leu Leu Ser Ser Arg Lys Met Cys Gln225 230 235 240Ala Leu Asp Met Leu Ser Leu Pro Arg Asn Asp Ala Cys Gly Phe Lys245 250 255Gly Leu Asn Leu Gly Arg Gln Val Gln Asn Ser Pro Val Gln Ser Ala260 265 270Ala Ser Leu Glu Ser Leu Asp Asn Arg Ile Ser Ser Glu Val Thr Ser275 280 285Cys Ser Ala Asp Val Trp Pro290 295<210>8<211>12<212>DNA<213>稻(Oryza sativa)<400>8gctgagtcat ga12<210>9<211>12<212>DNA<213>稻(Oryza sativa)<400>9catgagtcac tt12<210>10<211>12<212>DNA<213>稻(Oryza sativa)<400>10agtgagtcac tt12<210>11<211>12<212>DNA<213>稻(Oryza sativa)<400>11ggtgagtcat at12<210>12<211>12<212>DNA<213>稻(Oryza sativa)<400>12ggtgagtcat gt12<210>13<211>12<212>DNA<213>稻(Oryza sativa)<400>13gatgagtcat gc12<210>14<211>12<212>DNA<213>稻(Oryza sativa)<400>14aatgagtcat ca12<210>15<211>12<212>DNA<213>稻(Oryza sativa)<400>15agccacgtca ca12<210>16<211>17<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<220><223>The 9th and 15th nucleotide residues are inosines.<400>16tccaaymgng arwcngc 17<210>17<211>21<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>17gtcctcygcc atcttcacct t 21<210>18<211>21<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>18atgggttgcg tagccgtagc t 21<210>19<211>21<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>19ttgcttggca tgagcatctg t 21<210>20<211>17<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>20gaggatcagg cecatat17<210>21<211>21<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>21tcgctatatt aagggagacc a 21<210>22<211>24<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>22tgctccattg cgctctcgga cgag24<210>23<211>23<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>23atgaattcgc gaggggtttt cga 23<210>24<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>24gtttgggaga aattcgatca aatgc 25<210>25<211>30<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>25atggtatggt gttcctagca caggtgtagc 30<210>26<211>18<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>26aaaactgcag ttttctga 18<210>27<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>27aatggatccg cgaggggttt tcgaa 25<210>28<211>12<212>DNA<213>稻(Oryza sativa)<400>28gcttcctcat ga12<210>29<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>29aaccatggtg ctggagcggt gcccgt 26<210>30<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>30aaccatggcg gcggaggcgg cggcg 25<210>31<211>23<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>31ccccatggag tacaacgcga tgc23<210>32<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>32aaccatggtt ggttccatcc tgagt 25<210>33<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>33aaccatggct catgccaagc aagct 25<210>34<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>34aaccatggat gaagaagata aagtgaag 28<210>35<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>35taggatccgc tcctactact gaagct 26<210>36<211>27<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>36aaggatccaa tggagcacgt gttcgcc27<210>37<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>37aaggatccgg cggcggaggc ggcgcg 26<210>38<211>27<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>38gccggatcca gttggttcca tcctgag27<210>39<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>39aaggatcctg atgaagaaga taaagt 26<210>40<211>27<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>40aaggatccag gagtagatga cgtcggc27<210>41<211>29<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>41aaggatccag acgagatccc cgacccgct 29<210>42<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>42tagagctcta cgccgccggc atcgggct 28<210>43<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>43tagagctcta aaggatcata tttcccat 28<210>44<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>44tagagctcta ggcggccgcc gccggctg 28<210>45<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>45tagagctcta cggcggcggc ggagccca 28<210>46<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>46aaaccatgga gcacgtgttc gccgt 25<210>47<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>47taggatccgc tcctactact gaagct 26<210>48<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>48aaaccatgga gggagaagct gagacc 26<210>49<211>30<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>49aaaggatcct acatatcaga agcggcggga 30<210>50<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>50aaaccatgga tatagagggc ggtcca 26<210>51<211>30<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>51aaaggatcct acagcccgcc caggtggccg 30<210>52<211>21<212>DNA<213>稻(Oryza sativa)<400>52gtttgtcatg gctgagtcat g 2权利要求
1.一种选自下组的DNA(a)一种DNA,所述DNA编码包含SEQ ID NO2,5和7中任一项所示氨基酸序列的蛋白;(b)一种DNA,所述DNA包含SEQ ID NO1,3,4和6中任一项所示核苷酸序列的编码区;(c)一种DNA,所述DNA包含SEQ ID NO2,5和7中任一项所示氨基酸序列,所述氨基酸序列中有一或多个氨基酸的取代,缺失,添加,和/或插入,并且所述DNA编码的蛋白在功能上等价于包含SEQ ID NO2,5和7中任一项所示氨基酸序列的蛋白;(d)一种DNA,所述DNA在严谨条件下与包含SEQ ID NO1,3,4和6中任一项所示核苷酸序列的DNA杂交,并且所述DNA编码的蛋白在功能上等价于包含SEQ ID NO2,5和7中任一项所示氨基酸序列的蛋白。
2.权利要求1的DNA,所述DNA编码与GCN4基元结合的蛋白或所述DNA激活水稻种子贮藏蛋白的表达。
3.权利要求1或2的DNA,所述DNA得自水稻植物。
4.一种编码反义RNA的DNA,所述RNA与权利要求1到3中任一项的DNA的转录产物互补。
5.一种编码RNA的DNA,所述RNA具有特异性裂解权利要求1到3中任一项的DNA的转录产物的核酶活性。
6.一种编码RNA的DNA,所述RNA具有通过共抑制作用抑制权利要求1到3中任一项的DNA在植物细胞中表达的活性,并且所述RNA与权利要求1到3中任一项的DNA具有90%或更高的同源性。
7.一种编码蛋白的DNA,所述蛋白具有权利要求1到3中任一项的DNA编码的蛋白的显性阴性表型,其在植物细胞中是内源的。
8.一种载体,所述载体包含权利要求1到3中任一项的DNA。
9.一种转化细胞,所述转化细胞含有权利要求1到3中任一项的DNA或权利要求8的载体。
10.一种由权利要求1到3中任一项的DNA编码的蛋白。
11.一种产生权利要求10的蛋白的方法,所述方法包含如下步骤培养权利要求9的转化细胞,从所述转化细胞或细胞培养上清中收集表达的蛋白。
12.一种包含权利要求4到7中任一项的DNA的载体。
13.一种转化的植物细胞,所述植物细胞含有权利要求1到7中任一项的DNA或权利要求8或12中任一项的载体。
14.一种转化植物,所述植物包含权利要求13的转化的植物细胞。
15.一种转化植物,所述植物是权利要求14的转化植物的子代或克隆。
16.权利要求14或15的转化植物的繁殖材料。
17.一种与权利要求10的蛋白结合的抗体。
18.一种植物,所述植物的基因组上具有两种DNA构建体,第一种DNA构建体中权利要求1的DNA可操纵地连接到表达调控区的下游,第二种DNA构建体中一种外源基因可操纵地连接到表达调控区的下游,所述调控区具有权利要求10的蛋白的靶序列。
19.权利要求18的植物,其中所述靶序列是包含GCN4基元的序列。
20.权利要求19的植物,其中所述GCN4基元具有的序列选自SEQ IDNO8,13和14中的任一个。
21.权利要求18的植物,其中所述靶序列是包含G/C盒的序列。
22.一种生产权利要求18到21中任一项的植物的方法,所述方法包括将在其基因组上具有一种DNA构建体的植物与在其基因组上具有另一种DNA构建体的植物杂交,在所述第一种DNA构建体中权利要求1的DNA可操纵地连接到表达调控区的下游,在所述第二种DNA构建体中一种外源基因可操纵地连接到包含权利要求10的蛋白的靶序列的表达调控区的下游。
全文摘要
从水稻种子来源的cDNA文库中分离编码bZIP型转录因子的cDNA(RISBZ1,RISBZ4,和RISBZ5)。所述cDNA编码新的蛋白并具有与GCN4基元结合的活性。RISBZ1通过GCN4基元活化转录至100倍或更高。RISBZ1的表达先于种子贮藏蛋白基因的表达,并只在成熟阶段的种子中观察到,这暗示RISBZ1可调控水稻种子贮藏蛋白的表达。为利于与RISBZ1转录因子相连,将转录因子的识别序列(GCN4基元)串联连接,并将其引入特定贮藏蛋白的启动子中。这样可提高如此修饰的启动子调控下的外源基因表达。
文档编号C07K14/415GK1398299SQ01804789
公开日2003年2月19日 申请日期2001年10月11日 优先权日2000年10月11日
发明者高岩文雄, 小野寺康之 申请人:独立行政法人农业生物资源研究所, 生物系特定产业技术研究推进机构