专利名称:棉花抗厌氧烯醇酶蛋白编码序列的利记博彩app
技术领域:
本发明涉及用于生物及基因工程技术领域。具体地,本发明涉及一种在棉花(Gossypium barbadense)中表达的烯醇酶(Enolase)蛋白编码序列及其核酸序列。
背景技术:
糖酵解(glycolysis)是细胞能力代谢的一个组成部分,它几乎存在于所有类型的细胞中,无论是原核细胞还是真核细胞。在厌氧胁迫条件下,许多植物的碳水化合物代谢途径从氧化模式转为糖酵解途径,以满足植物缺氧条件下的能量代谢。胁迫条件诱导了几个蛋白的合成参与到糖酵解途径中,如烯醇酶、醛羧酶、丙酮酸脱羧酶等。烯醇酶是糖酵解过程中唯一的一个脱水步骤,主要催化2-磷酸甘油酸形成磷酸烯醇式丙酮酸,随后在丙酮酸激酶的催化作用下形成烯醇式丙酮酸,丙酮酸进入线粒体开始三羧酸循环。
经对现有技术文献检索中发现杂志《Plant Science(植物科学)》在1999,14641-51发表了文章“Transcript levels of genes encoding variousglycolytic and fermentation enzymes change in response to abiotic stresses(编码糖酵解酶基因在厌氧胁迫条件下的转录水平变化)”,该文献虽然对糖酵解途径中的关键酶烯醇酶基因Enolase在耐盐、干旱、高温胁迫处理下的表达做了充分肯定,但截止目前的报道显示该基因的转基因烟草植株的耐盐、抗旱和温度胁迫方面的效果没有明显提高,此外至今尚未发现与本发明主题有密切联系文献的报道。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种棉花烯醇酶蛋白编码序列。使其在植物细胞抗厌氧胁迫上具有明显的作用,能够明显提高植物细胞在缺氧条件下的抗性,降低厌氧胁迫对植物的损害。
本发明是通过以下技术方案实现的,本发明所分离出的DNA分子包括编码具有棉花烯醇酶蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能与SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列杂交。
所述的编码序列具有SEQ ID NO.3所示的氨基酸序列的多肽,或其保守性变异多肽、或其活性片段,或其活性衍生物。
所述的编码序列具有SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列。
本发明分离出的棉花抗厌氧胁迫类相关蛋白质多肽烯醇酶,它包括具有SEQID NO.3氨基酸序列的多肽。
该多肽是具有SEQ ID NO.3序列的多肽,该多肽能够在盐、低温、水淹和脱落酸(ABA)处理下均能发挥作用,而这些逆境胁迫均可引起植物体氧化代谢途径的转换。
所述的DNA分子,包含在所提供的载体中,是一种核酸分子,它包含所述的DNA分子中8-100个连续核苷酸。
本发明用上述DNA分子转化的宿主细胞,它是真核细胞。
在本发明中,“分离的”、“纯化的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组分分开,而且已经与在细胞中伴随其蛋白质分开。
在本发明中,术语“棉花抗厌氧胁迫蛋白(或多肽)编码序列”指编码具有棉花Enolase蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中第20-1357位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.3序列的编码框第20-1357位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.3中第20-1357位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.3所述的序列。该术语还包括能在中度严紧条件下(70%-85%一致性),更佳的在高度严紧条件下(85%以上一致性)与SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与天然的棉花Enolase相同功能的蛋白的SEQ ID NO.3中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,术语“棉花抗厌氧胁迫蛋白或多肽”指具有棉花Enolase蛋白活性的SEQ ID NO.3序列的多肽。该术语还包括具有与天然棉花Enolase相关相同功能的、SEQ ID NO.3序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括棉花Enolase蛋白的活性片段和活性衍生物。
本发明的棉花Enolase多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严谨条件下能与棉花Enolase相关DNA杂交的DNA所编码的蛋白、以及利用棉花Enolase多肽的抗血清获得的多肽或蛋白。
在本发明中,“棉花Enolase保守性变异多肽”指与SEQ ID NO.3的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1
表291% identity in 1338nt overlapQuery1 tctagatctactcgaaaccatggccactatcaccgtcgttaaggctaggcagatcttcga 60|||||||||||||| | ||||| ||||||||||| ||||||||||| |||||||||||Sbjct65 tctagatctactcg---ctatggctactatcaccgttgttaaggctagacagatcttcga 121Query61 cagtcgtggcaatcccacggttgaggttgatgtccacacatcaagtggtgtcaaggtcac 120||||||||| ||||||| |||||||||||| ||||||| |||| |||| | ||||| ||Sbjct122 cagtcgtggtaatcccaccgttgaggttgatatccacacgtcaaatggtattaaggttac 181Query121 tgctgctgttccgagtggagcttccactggtatctacgaggctcttgggcttagggatgg 180|| |||||||| |||||||||||||||||||||| |||||||||| ||| ||||||||Sbjct182 agcagctgttccaagtggagcttccactggtatctatgaggctcttgagctgagggatgg 241Query181 tggatctgattatctcggaaagggtgcttctaaggctgttggtaatgtgaacaacatcat 240|||||||| || || |||||||||| |||||||||||||| |||||||||||||||||Sbjct242 aggatctgactaccttggaaagggtgtatctaaggctgttggcaatgtgaacaacatcat 301Query241 cggcccagcgttgattggaaaggacccgactcagcagactgctattgacaacttcatggt 300||| ||||| | |||||||||||||| ||||||||||||||||||||||||||||||||Sbjct302 cgggccagcacttattggaaaggacccaactcagcagactgctattgacaacttcatggt 361Query301 ccatgaacttgatggaacccagaacgagtggggttggtgcaagcaaaagcttggagccaa 360|||||||||||| |||||||| ||||||||||| ||||||||||||||||||||||||||Sbjct362 ccatgaacttgacggaacccaaaacgagtgggggtggtgcaagcaaaagcttggagccaa 421Query361 tgccatccttgctgtgtcccttgctgtttgcaaagctggggccgttgtcagtggcattcc 420
||| || ||||||||||| |||||||| |||||||||||||| |||||||| ||||||||Sbjct422 tgcgattcttgctgtgtctcttgctgtctgcaaagctggggctgttgtcagcggcattcc 481Query421 tctctacaagcacattgccaaccttgctggtaaccctaaaattgtgctaccagttcccgc 480||| ||||||||||||||||||||||||||||||| || ||||||||||||||||| ||Sbjct482 tctatacaagcacattgccaaccttgctggtaaccccaagattgtgctaccagttcctgc 541Query481 tttcaacgtcatcaatggtggattacatgcaggaaacaagctcgctatgcaggagtttat 540|||||||||||||||||||||| |||||| ||||||||||| |||||||||||||||||Sbjct542 cttcaacgtcatcaatggtggatcccatgccggaaacaagcttgctatgcaggagtttat 601Query541 gattctccctgttggagcttcatctttcaaagaagccatgaaaatgggtgttgaagttta 600||| ||||||||||||||| | |||||||| |||||||||||| ||||||| ||||||||Sbjct602 gatcctccctgttggagctgcttctttcaaggaagccatgaagatgggtgtggaagttta 661Query601 ccacaacttgaagtctgtgatcaagaagaagtatggccaggatgctaccaacgttggtga 660|||| |||||||||||||||| ||||||||||| ||||||||||| || || ||||||||Sbjct662 ccaccacttgaagtctgtgattaagaagaagtacggccaggatgccacaaatgttggtga 721Query661 tgaaggtggctttgcaccaaacattcaggagaacaaggaaggtcttgaattgcttaagac 720||||||||| ||||||||||||||||||||||||||||| |||||||||||||| |||||Sbjct722 tgaaggtggtttgcaccaaacattcaggagaacaaggagggtcttgaattgctcaagac 781Query721 tgccattgaaaaggctggctacactggcaaggttgtcattggaatggatgttgccgcttc 780||| || || |||||||| |||||||| ||||||||||||||||||||||||||||||||Sbjct782 tgctatcgagaaggctggatacactggaaaggttgtcattggaatggatgttgccgcttc 841Query781 agagttctactcatcagacaagacctacgacttgaactccaaagaagagaacaacaatgg 840||||||||||||| |||||||||||||||||||||||| |||||||||||||||||||||Sbjct842 agagttctactcagaagacaagacctacgacttgaacttcaaagaagagaacaacaatgg 901Query841 ctctcagaagatttctggtgatgcactaaagggcctctacaagtcctttgtctctgagta 900|||||||||||||||||||||||| ||||||| ||| ||||||||||||||| |||||||Sbjct902 ctctcagaagatttctggtgatgctctaaaggacctgtacaagtcctttgtcgctgagta 961Query901 cccaattgtgtccattgaggacccatttgaccaagatgactgggagcactatgctaagat 960|||||| |||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct962 cccaatc tgtccattgaggacccatttgaccaagatgactgggagcactatgctaagat 1021Query961 gaccgccgagtgtggagacaatgttcagattgtcggtgatgatttgttggtcaccaaccc 1020|||| | ||||||||| | | |||||||||||||||||||||||||||||||| |||||Sbjct1022 gaccactgagtgtggaaccgaggttcagattgtcggtgatgatttgttggtcactaaccc 1081Query1021 caagagagttgccaaggcaatcgcagaaaagtcttgcaatgctcttctcttgaaggttaa 1080|||||||||||| |||||||||||||| |||||||||||||||||||| |||||||||||Sbjct1082 caagagagttgctaaggcaatcgcagagaagtcttgcaatgctcttcttttgaaggttaa 1141Query1081 tcaaatcgggtcagtaacagagagtattgaggcagtgaagatgtcaaagagagcaggatg 1140|||||||| || ||||| |||||||| |||||||| |||||||| |||| |||||| ||Sbjct1142 ccaaatcggatctgtaaccgagagtatcgagcagttaagatgtcgaagaaagcaggttg 1201Query1141 gggagtgatggctagccaccgaagtggtgaaaccgaggacaccttcatcgctgacttatc 1200|||||||||| | |||||| |||||||||||||||||||||| ||||| ||||||||| |
Sbjct1202 gggagtgatgaccagccacagaagtggtgaaaccgaggacacattcattgctgacttagc 1261Query1201 cgttggcttgtctactggacaaatcaagactggagctccttgcagatccgagcgtcttgc 1260|||||||||||| |||||||||||||| || || ||||||||||||||||||||||||||Sbjct1262 cgttggcttgtccactggacaaatcaaaaccggtgctccttgcagatccgagcgtcttgc 1321Query1261 caagtacaaccagcttttgcgtattgaagaggagttgggatcagaggcagtttacgctgg 1320||||||||||||||||||||||||||| ||||||||||||||||||||| ||||||||||Sbjct1322 caagtacaaccagcttttgcgtattgaggaggagttgggatcagaggcaatttacgctgg 1381Query1321 agctaacttccgcaagcctgtggagccgtacta 1353|| ||||||||||| |||||||| || |||||Sbjct1382 agtcaacttccgcaaacctgtggaaccctacta 1414Query棉花Enolase的核酸序列Sbjct拟南芥Enolase的核酸序列(NM_129209)表2为本发明的棉花Enolase蛋白与拟南芥Enolase蛋白的核苷酸序列的同源比较(GAP)表。
表390% identity in 445aa overlap,94% similarity in 445aa overlapQuery7ATIVSVKARQIFDSRGNPTVEVDVETSNGIKARAAVPSGASTGIYEALELRDGGSDYLGK 186ATI VKARQIFDSRGNPTVEVD+ TSNGIK AAVPSGASTGIYEALELRDGGSDYLGKSbjct2ATITVVKARQIFDSRGNPTVEVDIHTSNGIKVTAAVPSGASTGIYEALELRDGGSDYLGK 61Query187 GVSKAVANVNTIIGPALIGKDPTEQTAIDNFMVQQLDGTQNEWGWCKQKLGANAILAVSL 366GVSKAV NVN IIGPALIGKDPT+QTAIDNFMV+ LDGTQNEWGWCKQKLGANAILAVSLSbjct62 GVSKAVGNVNNIIGPALIGKDPTQQTAIDNFMVHELDGTQNEWGWCKQKLGANAILAVSL 121Query367 AVCKAGAEVKKLPLYKHIANLAGNSKLVLPVPAFNVINGGSHAGNKLAMQEFMILPVGAS 546AVCKAGA V +PLYKHIANLAGN K+VLPVPAFNVINGGSHAGNKLAMQEFMILPVGA+Sbjct122 AVCKAGAVVSGIPLYKHIANLAGNPKIVLPVPAFNVINGGSHAGNKLAMQEFMILPVGAA 181Query547 SFKEAMKMGVEVYHHLKSVIKKKYGQDATNVGDEGGFAPNIQENKEGLELLNTAIAKAGY 726SFKEAMKMGVEVYHHLKSVIKKKYGQDATNVGDEGGFAPNIQENKEGLELL TAI KAGYSbjct182 SFKEAMKMGVEVYHHLKSVIKKKYGQDATNVGDEGGFAPNIQENKEGLELLKTAIEKAGY 241Query727 TGKVVIGMDVAASEFYGTDKTYDLNFKEENNDGKQKISGDALKDLYKSFVAEYPIVSIED 906TGKVVIGMDVAASEFY DKTYDLNFKEENN+G QKISGDALKDLYKSFVAEYPIVSIEDSbjct242 TGKVVIGMDVAASEFYSEDKTYDLNFKEENNNGSQKISGDALKDLYKSFVAEYPIVSIED 301Query907 PFDQDDWEHYSKLTKEIGEKVQIVGDDLLVTNPKRVAKAIAEKTCNALLLKVNQIGSVTE 1086PFDQDDWEHY+K+T E G +VQIVGDDLLVTNPKRVAKAIAEK+CNALLLKVNQIGSVTESbjct302 PFDQDDWEHYAKMTTECGTEVQIVGDDLLVTNPKRVAKAIAEKSCNALLLKVNQIGSVTE 361Query1087 SIEAVKMSKQAGWGVMASHRSGETEDTFIADLSVGLATGQIKTGAPRRSERLAKYNQLLR 1266SIEAVKMSK+AGWGVM SHRSGETEDTFIADL+VGL+TGQIKTGAP RSERLAKYNQLLRSbjct362 SIEAVKMSKKAGWGVMTSHRSGETEDTFIADLAVGLSTGQIKTGAPCRSERLAKYNQLLR 421
Query1267 IEEELGAKAVYAGASFRAPVAPY 1335IEEELG++A+YAG +FR PV PYSbjct422 IEEELGSEAIYAGVNFRKPVEPY 444Query棉花Enolase的氨基酸序列Sbjct拟南芥Enolase的氨基酸序列(NP_181192)表3为本发明的棉花Enolase蛋白与拟南芥Enolase蛋白的氨基酸序列的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出。
发明棉花Enolase蛋白或多肽的类似物。这些类似物与天然棉花Enolase相关多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的棉花Enolase多肽时,可以将棉花Enolase编码序列可操作地连于表达调控序列,从而形成棉花Enolase蛋白表达载体。
如本发明所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”为真核细胞。常用的真核宿主细胞包括酵母细胞、烟草细胞和其它植物细胞。
还可用Northern印迹法技术分析棉花Enolase基因产物的表达,即分析棉花Enolase的RNA转录物在细胞中的存在与否和数量。
此外,本发明提供的可用作探针的核酸分子,该分子通常具有棉花Enolase核苷酸编码序列的8-100个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码棉花Enolase相关的核酸分子。
本发明的检测样品中是否存在棉花Enolase相关核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于棉花Enolase相关核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
此外,根据本发明的棉花Enolase核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选棉花Enolase相关同源基因或同源蛋白。
为了得到与棉花Enolase相关基因相关的棉花cDNAs的点阵,可以用DNA探针筛选棉花cDNA文库,这些探针是在低严谨条件下,用32P对棉花Enolase相关的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自棉花的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Stratagene,Palo Alto,Cal.。这种筛选方法可以识别与棉花Enolase相关相关的基因家族的核苷酸序列。
本发明的棉花Enolase相关核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可通过化学合成将突变引入本发明蛋白序列中。
除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WHFreeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 852149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用AppliedBiosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。
利用本发明的棉花Enolase蛋白,通过各种常规筛选方法,可筛选出与棉花Enolase相关发生相互作用的物质,或者受体、抑制剂或拮抗剂等。
本发明的目的在于克服现有技术中的不足,提供一种棉花烯醇酶(Enolase)蛋白编码序列,使其在植物细胞抗厌氧胁迫上具有明显的作用,本发明具有实质性特点和显著进步,本发明在植物细胞抗厌氧胁迫上具有明显的作用,能够明显提高植物细胞缺氧条件下的抗性,降低厌氧胁迫对植物的损害。因此,本发明具有很大的应用价值。
具体实施例方式
下面结合实验室试验具体数据,以具体实施例来进一步阐述本发明下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆实验室手册(New YorkCold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。这些实施例仅用于说明本发明而不用于限制本发明的范围。
实施例1棉花Enolase基因的克隆1.组织分离(isolation)将棉花种子置于37℃发芽24小时,然后播种于温室中,待棉花叶片为3-5片时,准备抽取DNA或RNA。
2.RNA的分离(RNA isolation)取部分组织,用研钵研碎,加入盛有裂解液的1.5mL EP管,充分振荡后,再移入玻璃匀浆器内。匀浆后移至1.5mL EP管中,抽提总RNA(CTAB法)。用甲醛变性胶电泳鉴定总RNA质量,然后在分光光度计上测定RNA含量。
3.基因的全长克隆(Cloning of Full-length cDNA)根据拟南芥Enolase基因的氨基酸保守序列,利用同源性基因克隆原理,采用RACE方法(GibcoBRL试剂盒)进行cDNA全长克隆,分三个阶段进行(1)RT-PCRPCR[MA001(SEQ ID NO.1)+MA002(SEQ ID NO.2)]得到560bp的片段,回收,连接到pGEMT-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(Wisconsin group,USA)中的BLAST和FASTA软件搜索已有的数据库(GeneBank+EMBL),知其核酸序列及编码蛋白与已知十字花科植物如拟南芥(Arabidopsis assulta)Enolase基因的同源性很高,故初步认为它是一个Enolase基因。
(2)3’-RACEPCR[AP+MA301(5’-TGACTGGGAGCACTATGCTA-3’)]得到MA3’(702bp),回收,连接到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(Wisconsin group,USA)中的BLAST和FASTA软件搜索已有的数据库(GeneBank+EMBL),知其核酸序列及编码蛋白与已知十字花科植物如拟南芥(Arabidopsis assulta)Enolase基因的同源性很高,故初步认为它是一个与烯醇酶Enolase相关的基因。
(3)5’-RACE第一轮PCR[AAP+MA501(5’-ACGGCAAGAATGGCATTTGC-3’)]第二轮PCR[(AUAP+MA502(5’-CCATCCAGTTGTTGAACCAT-3’))得到MA5’(约377bp)(过程同(1))将测序结果的重叠区拼接,发现过程(1)得到的片段既是该基因的完整编码区。
BLAST的结果证明从棉花中新得到的基因确为一个与拟南芥Enolase相关的基因。
通过组合使用上述3种方法,获得了候选的棉花Enolase蛋白的全长编码序列(SEQ ID NO.3)。
实施例2棉花Enolase基因的序列信息与同源性分析本发明新的棉花Enolase全长cDNA的长度为1640bp,详细序列见SEQ ID NO.3,其中开放读框位于79-1416位核苷酸(1338个核苷酸)。根据全长cDNA推导出棉花Enolase的氨基酸序列,共445个氨基酸残基,分子量为47730.35道尔顿,等电点(pI)为6.16。详细序列见SEQ ID NO.3。
将棉花Enolase的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundant GenBank+EMBL+DDBJ+PDB和Non-redundant GenBank CDStranslations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与拟南芥基因Enolase(NM_129209)在核苷酸水平上具有91%的相同性,(附表2);在氨基酸水平上,它与拟南芥Enolase基因(NP_181192)也有94%的相同性(附表3)。由此可见,棉花基因Enolase与拟南芥基因Enolase无论从核酸还是蛋白水平上都存在较高的同源性。拟南芥基因Enolase(NM_129209)已经被证明在厌氧胁迫条件下明显增强表达,并发挥着重要的作用,可以认为棉花基因Enolase在抗厌氧胁迫方面也具有相似的作用。
实施例3棉花基因Enolase蛋白或多肽在烟草中进行真核细胞表达及转基因植株的抗厌氧性鉴定含目的基因(棉花基因Enolase)的表达载体的构建根据棉花基因Enolase的全长序列(SEQ ID NO.3),设计扩增出完整编码阅读框的引物,并在上游和下游引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将棉花基因Enolase eDNA克隆至中间载体(如pBluescript),进一步克隆到双元表达载体(如pBI121和改进的pCAMBIA2300),在保证阅读框架正确的前提下鉴定好的表达载体,再将其转入农杆菌中,利用叶盘法技术转化模式植物烟草。
1.发苗种子用无菌水漂洗15-20分钟,再用70%的乙醇消毒1分钟,然后用0.1%升汞消毒10-12分钟。最后再用无菌水冲洗5遍。将洗好的种子用吸水纸吸干,放入MS培养基。光照培养5天,待苗长到4-5厘米便可以剪苗。
2.剪苗剪取0.5-1厘米的下胚轴小片段放入预培养基,培养2天。
预培养基MS+6BA(0.2mg/l)+2.4D(1.2mg/l)3.转化共培养将预培养2天的下胚轴放入事先培养好的菌液中(OD值0.4-0.6)侵染3-5分钟。接着取出放入预培养基暗培养2天。
4.筛选培养共培养结束后,将外植体放入筛选培养基。2周继代一次。2-4周有愈伤组织形成和芽的分化。待绿芽长到2厘米后,切下生根。
筛选培养基MS+6BA(4.5mg/l)+NAA(0.1mg/l)+AgNO3(6mg/l)+cb(250mg/l)+Kan(20mg/l)生根培养基MS+NAA(0.5mg/l)+cb(250mg/l)+Kan(5mg/l)5.转化植株培养;待根系发达后,将植株取出,用无菌水洗净附着的固体培养基,移入土壤中,刚开始用玻璃罩罩几天,待植株健壮后再取下玻璃罩,温室中培养。
含棉花基因Enolase的转基因烟草植株的抗厌氧性鉴定鉴于编码Enolase,如拟南芥的Enolase基因已被证明在抗厌氧胁迫方面发挥作用,而棉花基因Enolase转录水平与拟南芥的Enolase具有较高的同源性,可进一步对含棉花基因Enolase的转基因烟草植株进行抗厌氧鉴定。用水淹、ABA和高温(45℃)处理转基因植株和转基因植株的种子(3小时、7小时、12小时、24小时、48小时、72小时)后研究Enolase基因在转基因植株中的表达情况以及各种处理对植株的生长情况。Northern blot分析结果证明,转基因植株Enolase转录水平在水淹、ABA和高温处理后其表达量均有明显变化,而对照非转基因植株虽表达量也有变化,但明显低于转基因植株。此外非转基因植株生长缓慢,最后在水淹、ABA和高温处理下枯萎而死,转基因植物依然能正常生长,只是比未经处理的植株生长稍慢。这证明棉花基因Enolase比拟南芥的Enolase基因具有更有效的和更广泛的抗逆境的功能,将可用于利用转基因技术改良植物抗厌氧的研究和产业化生产中。
实施例4棉花基因Enolase在棉花中的拷贝数分析采用常规方法从棉花叶片中提取DNA(参考《分子克隆》,Sambrook等,1989),分别用BamH和EcoRI酶切DNA[20μg(微克)/样品]后,将DNA转至杂交膜(尼龙膜)上后。使用Amersham Pharmacia公司Gene ImagesTMContents CDP-StarTMlabelling module(PRN3540),我们将Enolase基因编码区标记为探针,然后进行杂交(于60℃杂交16小时)。取出膜,置于洗膜液I(1*SSC,1%SDS)中,于60℃漂洗3次,每次15分钟。转入洗膜液II(0.1*SSC,1%SDS)中于60℃漂洗3次,每次同样15分钟。用X光片压片60-90分钟,然后显影、定影(方法参照Roche DIG labeled试剂盒说明书)。结果(Southern blot)发现在杂交膜上不同酶切泳道上各出现一条杂交条带,说明Enolase基因在棉花中是单拷贝基因。
实施例5棉花基因Enolase在水淹、ABA和高温胁迫条件下的不同时间处理的表达谱分析1.RNA的提取将生长了3-5片叶的棉花幼苗经水淹、ABA和高温(45℃)处理(3小时、7小时、12小时、24小时、48小时、72小时),然后用TRIzol试剂盒(GIBCOBRL,USA)提取并参考《分子克隆》有关RNA的制备章节(Sambrook等,1989)。
2.RNA的定量参考《分子克隆》(Sambrook等,1989),分光光度计测OD260;RNA含量计算1 OD260=40μg/ml。
3总RNA琼脂糖凝胶电泳分离1)取6ml 25*(倍)电泳缓冲液,加入117ml无菌水,混匀。2)称取1.5g琼脂糖,加入到上述溶液中,于微波炉里加热融化,转入55℃水浴中。3)于通风橱中取26.8ml甲醛,加入到55℃的凝胶溶液中,混匀。4)迅速倒入制胶板中,室温水平放置30分钟,待胶凝固。5)将提取的RNA(20μg)溶解于RNA变性溶液中,在65℃下加热10分钟,然后立即放在冰上。6)在样品中加入2ul 10*上样缓冲液,混匀。7)在电泳液未盖过胶的条件下点样,5V/cm电压电泳5小时左右。
4.RNA尼龙膜上转移1)转移之前,将尼龙膜用10*SSC浸泡。2)将湿润的膜准确地盖在膜上,将两张与膜大小相同的滤纸置2*SSC溶液中湿润,盖在膜上,排除气泡。3)滤纸上放一叠与膜大小相同的吸水纸,在吸水纸上放一玻璃板和一重物,水平放置,转移12-20小时。4)转移后,将膜于80℃烘烤2小时。
5.膜上杂交信号的检出1)将膜浸在5×Dendart’s,0.1%SDS,0.1mg/ml鲑鱼精DNA],65℃下预杂交2小时。2)将用Gene ImagesTMContents CDP-StarTMlabelling module标记的探针在沸水中变性5分钟,直接加入1)的杂交液中,于65℃杂交16-24小时。3)取出膜,置于洗膜液I(1*SSC,1%SDS)中,于65℃漂洗3次,每次15分钟。转入洗膜液II(O.1*SSC,1%SDS)中于65℃漂洗3次,每次15分钟。4)用X光片压片60-90分钟,然后显影、定影(方法参照Roche DIGlabeled试剂盒说明书)。Northern杂交表明随着水淹、ABA和高温处理时间的延长,Enolase的表达均有明显变化,说明Enolase是逆境信号如水淹、ABA和高温诱导表达的,在棉花抗厌氧胁迫中扮演重要的角色。
本发明涉及的序列及记号分列如下(1)SEQ ID NO.1的信息(i)序列特征(A)长度20bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQ ID NO.1TGG TGC AA (A/G) CAA AAG CT(C/T)GG(2)SEQ ID NO.2的信息(i)序列特征(A)长度20bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQ ID NO.2TAG CAT AGT GCT CCC AGT CA(3)SEQ ID NO.3的信息(i)序列特征(A)长度1575bp
(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii)分子类型核苷酸(iii)序列描述SEQ ID NO.3<110>上海交通大学<120>棉花烯醇酶蛋白编码序列<160>2<170>PatentIn version 3.1<210>1<211>1575<212>DNA<213>棉花(Gossypium barbadense)<220>
<221>CDS<222>(20)..(1357)<223>
<400>1aagctctctt tttcatctc atg gct gct act atc gtc tcc gtc aaa gct agg52Met Ala Ala Thr Ile Val Ser Val Lys Ala Arg1 5 10
cag atc ttc gac agc cgt gga aat ccc act gtt gag gtt gat gtg gaa 100Gln Ile Phe Asp Ser Arg Gly Asn Pro Thr Val Glu Val Asp Val Glu15 20 25aca tcg aac ggt ata aag gct agg gcc gca gtt cct agc ggt gca tcc 148Thr Ser Ash Gly Ile Lys Ala Arg Ala Ala Val Pro Ser Gly Ala Ser30 35 40act gga att tac gag gct ctt gag ttg aga gat gga ggt tcc gat tac 196Thr Gly Ile Tyr Glu Ala Leu Glu Leu Arg Asp Gly Gly Ser Asp Tyr45 50 55ctc ggt aaa ggt gta tcg aag gct gtt get aat gtt aac aca atc atc 244Leu Gly Lys Gly Val Ser Lys Ala Val Ala Asn Val Asn Thr Ile Ile60 65 70 75ggc cct gca ttg att gga aag gac cca acc gag cag act gca att gac 292Gly Pro Ala Leu Ile Gly Lys Asp Pro Thr Glu Gln Thr Ala Ile Asp80 85 90aat ttc atg gtt caa caa ctg gat gga acc caa aat gag tgg ggt tgg 340Asn Phe Met Val Gln Gln Leu Asp Gly Thr Gln Asn Glu Trp Gly Trp95 100 105tgc aaa caa aag ctc ggt gca aat gcc att ctt gcc gtg tcc ctt gct 388Cys Lys Gln Lys Leu Gly Ala Asn Ala Ile Leu Ala Val Ser Leu Ala110 115 120gtt tgc aaa gct gga gct gaa gtc aag aaa ctt ccc ctt tac aag cac 436
Val Cys Lys Ala Gly Ala Glu Val Lys Lys Leu Pro Leu Tyr Lys His125 130 135att gct aac ctt gct ggt aac agc aag ttg gtt ctt cct gtc cct gct 484Ile Ala Asn Leu Ala Gly Asn Ser Lys Leu Val Leu Pro Val Pro Ala140 145 150 155ttc aat gtc atc aac ggt ggt tca cat gca gga aac aaa ttg gct atg 532Phe Asn Val Ile Asn Gly Gly Ser His Ala Gly Asn Lys Leu Ala Met160 165 170cag gag ttc atg att ctt cct gta gga gca tca tcc ttt aag gag gcc 580Gln Glu Phe Met Ile Leu Pro Val Gly Ala Ser Ser Phe Lys Glu Ala175 180 185atg aaa atg ggt gtt gaa gtc tat cac cat ttg aag tct gtg att aag 628Met Lys Met Gly Val Glu Val Tyr His His Leu Lys Ser Val Ile Lys190 19 200aag aag tat ggt caa gat gca acc aat gtc ggt gat gaa ggt ggc ttt 676Lys Lys Tyr Gly Gln Asp Ala Thr Asn Val Gly Asp Glu Gly Gly Phe205 210 215gct cct aat atc cag gag aac aag gaa gga ctt gaa ttg ttg aat aca 724Ala Pro Asn Ile Gln Glu Asn Lys Glu Gly Leu Glu Leu Leu Asn Thr220 225 230 235gcc att gct aaa gct ggt tac act ggc aaa gtt gtt att gga atg gat 772Ala Ile Ala Lys Ala Gly Tyr Thr Gly Lys Val Val Ile Gly Met Asp
240 245 250gtt gcc gcg tct gaa ttt tat gga aca gat aaa act tac gac ctg aac 820Val Ala Ala Ser Glu Phe Tyr Gly Thr Asp Lys Thr Tyr Asp Leu Asn255 260 265ttc aaa gaa gag aac aat gac ggt aaa caa aag atc tca gga gat gct 868Phe Lys Glu Glu Asn Asn Asp Gly Lys Gln Lys Ile Ser Gly Asp Ala270 275 280ttg aaa gat tta tac aag tca ttc gta gcc gag tat cca att gtg tca 916Leu Lys Asp Leu Tyr Lys Ser Phe Val Ala Glu Tyr Pro Ile Val Ser285 290 295atc gaa gat cca ttt gac caa gat gat tgg gag cac tac tcc aaa cta 964Ile Glu Asp Pro Phe Asp Gln Asp Asp Trp Glu His Tyr Ser Lys Leu300 305 310 315acc aag gaa atc gga gaa aaa gtt cag att gta gga gat gat ctt ttg 1012Thr Lys Glu Ile Gly Glu Lys Val Gln Ile Val Gly Asp Asp Leu Leu320 325 330gtc acc aac cca aag agg gtt gcg aag gct att gcc gaa aaa act tgt 1060Val Thr Asn Pro Lys Arg Val Ala Lys Ala Ile Ala Glu Lys Thr Cys335 340 345aat gcc ctt ctt ctc aag gtc aat caa att gga tct gtt acc gaa agt 1108Asn Ala Leu Leu Leu Lys Val Asn Gln Ile Gly Ser Val Thr Glu Ser350 355 360
att gaa gct gtg aaa atg tcc aag caa gct gga tgg ggt gtg atg gcc 1156Ile Glu Ala Val Lys Met Ser Lys Gln Ala Gly Trp Gly Val Met Ala365 370 375agc cac cgc agt ggt gaa acg gag gat act ttt att gct gat ctt tca 1204Ser His Arg Ser Gly Glu Thr Glu Asp Thr Phe Ile Ala Asp Leu Ser380 385 390 395gtc ggt ttg gcc acg ggc caa att aag acc gga gct cca cgc agg tct 1252Val Gly Leu Ala Thr Gly Gln Ile Lys Thr Gly Ala Pro Arg Arg Ser400 405 410gag cgt tta gcc aag tac aac cag ctt ctg cga att gag gag gag ctt 1300Glu Arg Leu Ala Lys Tyr Asn Gln Leu Leu Arg Ile Glu Glu Glu Leu415 420 425ggt gcg aaa gcc gtc tat gcc gga gct agc ttc cgt gct cca gtt gca 1348Gly Ala Lys Ala Val Tyr Ala Gly Ala Ser Phe Arg Ala Pro Val Ala430 435 440ccc tat taa gatgcttgtt tagatgataa tgtgctgaga ctggatgcgt 1397Pro Tyr445gcggcagagc ttcagtggtt tgttgagacc ctaaaacata tttcaataat tttgatagca 1457attttggact tgtgttcaaa ataaatcgat ctccgtgtta tttttgttgg actttgcctg 1517
catatatgct cgctatattc ataaatacat gatgcttgaa aaaaaaaaaa aaaaaaaa1575<210>2<211>445<212>PRT<213>棉花(Gossypium barbadense)<400>2Met Ala Ala Thr Ile Val Ser Val Lys Ala Arg Gln Ile Phe Asp Ser1 5 10 15Arg Gly Asn Pro Thr Val Glu Val Asp Val Glu Thr Ser Asn Gly Ile20 25 30Lys Ala Arg Ala Ala Val Pro Ser Gly Ala Ser Thr Gly Ile Tyr Glu35 40 45Ala Leu Glu Leu Arg Asp Gly Gly Ser Asp Tyr Leu Gly Lys Gly Val50 55 60Ser Lys Ala Val Ala Asn Val Asn Thr Ile Ile Gly Pro Ala Leu Ile65 70 75 80
Gly Lys Asp Pro Thr Glu Gln Thr Ala Ile Asp Asn Phe Met Val Gln85 90 95Gln Leu Asp Gly Thr Gln Asn Glu Trp Gly Trp Cys Lys Gln Lys Leu100 105 110Gly Ala Asn Ala Ile Leu Ala Val Ser Leu Ala Val Cys Lys Ala Gly115 120 125Ala Glu Val Lys Lys Leu Pro Leu Tyr Lys His Ile Ala Asn Leu Ala130 135 140Gly Asn Ser Lys Leu Val Leu Pro Val Pro Ala Phe Asn Val Ile Asn145 150 155 160Gly Gly Ser His Ala Gly Asn Lys Leu Ala Met Gln Glu Phe Met Ile165 170 175Leu Pro Val Gly Ala Ser Ser Phe Lys Glu Ala Met Lys Met Gly Val180 185 190Glu Val Tyr His His Leu Lys Ser Val Ile Lys Lys Lys Tyr Gly Gln
195 200 205Asp Ala Thr Asn Val Gly Asp Glu Gly Gly Phe Ala Pro Asn Ile Gln210 215 220Glu Asn Lys Glu Gly Leu Glu Leu Leu Asn Thr Ala Ile Ala Lys Ala225 230 235 240Gly Tyr Thr Gly Lys Val Val Ile Gly Met Asp Val Ala Ala Ser Glu245 250 255Phe Tyr Gly Thr Asp Lys Thr Tyr Asp Leu Asn Phe Lys Glu Glu Asn260 265 270Asn Asp Gly Lys Gln Lys Ile Ser Gly Asp Ala Leu Lys Asp Leu Tyr275 280 285Lys Ser Phe Val Ala Glu Tyr Pro Ile Val Ser Ile Glu Asp Pro Phe290 295 300Asp Gln Asp Asp Trp Glu His Tyr Ser Lys Leu Thr Lys Glu Ile Gly305 310 315 320
Glu Lys Val Gln Ile Val Gly Asp Asp Leu Leu Val Thr Asn Pro Lys325 330 335Arg Val Ala Lys Ala Ile Ala Glu Lys Thr Cys Asn Ala Leu Leu Leu340 345 350Lys Val Asn Gln Ile Gly Ser Val Thr Glu Ser Ile Glu Ala Val Lys355 360 365Met Ser Lys Gln Ala Gly Trp Gly Val Met Ala Ser His Arg Ser Gly370 375 380Glu Thr Glu Asp Thr Phe Ile Ala Asp Leu Ser Val Gly Leu Ala Thr385 390 395 400Gly Gln Ile Lys Thr Gly Ala Pro Arg Arg Ser Glu Arg Leu Ala Lys405 410 415Tyr Asn Gln Leu Leu Arg Ile Glu Glu Glu Leu Gly Ala Lys Ala Val420 425 430
Tyr Ala Gly Ala Ser Phe Arg Ala Pro Val Ala Pro Tyr435 440 44权利要求
1.一种棉花抗厌氧烯醇酶蛋白编码序列,其特征在于,所分离出的DNA分子,包括编码具有棉花烯醇酶蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能与SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列杂交。
2.根据权利要求1所述的棉花抗厌氧烯醇酶蛋白编码序列,其特征是,所述的编码序列具有SEQ ID NO.3所示的氨基酸序列的多肽,或其保守性变异多肽、或其活性片段,或其活性衍生物。
3.根据权利要求1或2所述的棉花抗厌氧烯醇酶蛋白编码序列,其特征是,所述的编码序列具有SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列。
4.根据权利要求1所述的棉花抗厌氧烯醇酶蛋白编码序列,其特征是,所述的DNA分子,包含在所提供的载体中,是一种核酸分子,它包含所述的DNA分子中8-100个连续核苷酸。
5.根据权利要求1或4所述的棉花抗厌氧烯醇酶蛋白编码序列,其特征是,用所述的DNA分子转化的宿主细胞,它是真核细胞。
全文摘要
一种棉花抗厌氧烯醇酶蛋白编码序列,属于基因工程领域。所分离出的DNA分子,包括编码具有棉花烯醇酶蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能与SEQ ID NO.3中从核苷酸第20-1357位的核苷酸序列杂交。本发明在植物抗厌氧方面具有明显的作用,具有很大的应用价值,能够明显减少农作物在干旱、盐碱、低温和病菌感染等环境胁迫条件下生物产量的损失。
文档编号C12N15/52GK1603413SQ20041006733
公开日2005年4月6日 申请日期2004年10月21日 优先权日2004年10月21日
发明者赵静雅, 左开井, 唐克轩 申请人:上海交通大学