醛缩酶和编码醛缩酶的核酸以及它们的制备和使用方法

文档序号:438427阅读:285来源:国知局

专利名称::醛缩酶和编码醛缩酶的核酸以及它们的制备和使用方法
技术领域
:本发明涉及分子和细胞生物学和生物化学。更具体地,本发明涉及具有醛縮酶活性的多肽、编码这些多肽的多核苷酸、以及制备和使用这些多核苷酸和多肽的方法。
背景技术
:莫那亭(Monatin)是一种具有如下化学式的高强度甜味剂<formula>formulaseeoriginaldocumentpage21</formula>(I)莫那亭包括两个手性中心,从而具有四种可能的立体异构构型R,R构型("R,R立体异构体"或"R,R莫那亭,,);S,S构型("S,S立体异构体,,或"S,S莫那亭");R,S构型("R,S立体异构体"或"R,S莫那亭")和S,R构型("S,R立体异构体"或"S,R莫那亭")。除非另有说明,此处所用的术语"莫那亭"指的是含有莫那亭的全部四种立体异构体的组合物;含有任意组合的莫那亭立体异构体的组合物(例如,只含有R,R和S,S立体异构体的莫那亭的组合物);以及单一异构形式的莫那亭。为了公开,对莫那亭的碳主链进行如上所示的编号,将直接与羟基共价相连的碳编为2-位碳,将直接与氨基共价相连的碳编为4-位碳。因此,除非另有说明,此处分别涉及到R,R莫那亭、S,S莫那亭、R,S莫那亭、S,R莫那亭、2R,4R莫那亭、2S,4S莫那亭、2R,4S莫那亭和2S,4R莫那亭。需要注意的是,在文献中,也使用可选择的常规方式对莫那亭碳主链编号,将直接与羟基共价相连的碳编为4-位碳,将直接与氨基共价相连的碳编为2-位碳。因此,例如,在此公开的2S,4R莫那亭所表示的与使用文献中可选择的常规方式编号的2R,4S莫那亭相同。此外,由于有多种不同的命名习惯,莫那亭有多种可选择的化学名称,包括2-羟基-2-(卩引哚-3-基甲基)-4-谷氨酸;4-氨基-2-羟基-2-(lH-吲哚-3-基甲基)戊二酸;4-羟基-4-(3』引哚基甲基)谷氨酸;禾口,3-(l-氨基-l,3-双羧基-3-羟基-丁-4-基)卩引哚。可以在位于南非的德兰士瓦区的&/2/eracMow植物的根皮中找到莫那亭的某些异构体形式。此处被一并引用作为参考的美国专利申请10/422336("366申请,,)和10/979821("821申请,,)公开了特别是用于在体内和体外制备莫那亭的多肽、途径和微生物。
发明内容本发明提供了具有醛縮酶活性(以下称为"醛縮酶")的多肽、编码所述多肽的多核苷酸、以及制备和使用这些多核苷酸和多肽的方法,所述醛縮酶活性包括丙酮酸醛縮酶活性,例如(而非限定),HMG和KHG醛缩酶活性。在一些实施方式中,本发明还提供了含有本发明的多肽或多核苷酸的组合物(例如,药物组合物、燃料和燃料添加剂组合物、食品和食品添加剂、饮料和饮料添加剂、饲料和词料添加剂、药物和药物添加剂、膳食补充剂)。这些组合物可以配制成各种形式,例如,片剂、凝胶、丸剂、填埋剂(implants)、液剂、喷雾剂、薄膜、微粒(micdles)、粉末、食品、饲料颗粒、或者各种胶囊化的形式。在一些实施方式中,醛縮酶和/或它们的组合物可以用于制药、工业和/或农业领域。在一些实施方式中,醛縮酶和/或它们的组合物可以用于形成或断开碳-碳键。在一些实施方式中,提供的醛縮酶能够催化oc-酮酸受体和丙酮酸或丙酮酸衍生物供体之间形成碳-碳键的反应(见以下反应进程图)。在一些实施方式中,受体也可以是酮或醛。在一些实施方式中,提供的醛縮酶具有4-羟基-2-酮戊二酸醛縮酶(例如,2-酮基-4-羟基戊二酸醛縮酶、2-氧基-羟基戊二酸醛縮酶、KHG-醛縮酶,EC4丄3.16)活性,并且能够催化如下反应4-羟基-2-酮戊二酸<=>丙酮酸+乙醛酸。在一些实施方式中,提供的醛縮酶具有HMG-醛缩酶(例如,4-羟基-4-甲基-2-酮戊二酸醛縮酶、丙酮酸醛縮酶、y-甲基-Y-羟基-a-酮戊二酸醛縮酶、4-羟基-4-甲基-2-酮戊二酸醛縮酶、EC4丄3.17)活性,并且能够催化如下反应4-羟基-4-甲基-2-酮戊二酸<=>2丙酮酸。HMG醛縮酶也可以作用于4-羟基-4-甲基-2-氧代乙二酸(oxoadipate)和4-羧基-4-羟基-2-酮己二酸(oxohexadioate)。ct-酉鹏、酉f丙酮酸或丙酮或醛受体酸衍牛物生物<formula>formulaseeoriginaldocumentpage23</formula>R=H、烷基、取代的烷基、芳基、取代的芳基、苯甲基、取代的苯甲R2=H、烷基、取代的烷基、芳基、取代的芳基、苯甲基、取代的苯甲R3=H、垸基、取代的烷基、芳基、取代的芳基、苯甲基、取代的苯甲基、羧酸基。在一些实施方式中,提供了醛缩酶(如丙酮酸醛縮酶,例如,而不限于,HMG和/或KHG醛缩酶),以促进3,4-取代的2-酮戊二酸的生产。在一个实施方式中,本发明提供了一种制备3,4-取代的2-酮戊二酸的方法,该方法包括(a)提供具有醛縮酶活性的多肽,所述醛縮酶活性例如丙酮酸醛缩酶活性,例如而不限于HMG醛縮酶和/或KMG醛縮酶活性;(b)提供供体化合物和受体化合物;和(c)在醛縮酶催化3,4-取代的2-酮戊二酸合成的条件下,使步骤(a)的多肽与步骤(b)的化合物接触,其中,所述供体和受体可以为丙酮酸或丙酮酸供体和a-酮酸受体,酮和/或醛。在一些实施方式中,提供的醛縮酶用于促进R-2-羟基-2-(吲哚-3基甲基)-4-酮戊二酸(R-MP,一种莫那亭的前体)的生产。在一些实施方式中,丙酮酸醛縮酶(例如,HMG和/或KHG醛缩酶)可以用于与D-转氨酶连接,以制备4-取代的D-谷氨酸或它的衍生物。4-取代的D-谷氨酸和/或它的衍生物可以用作抗生素,因为这些化合物能够抑制细菌的谷氨酸消旋酶(WO0214261A3)。在一种实施方式中,本发明提供了一种制备4-取代的D-谷氨酸的方法,该方法包括(a)提供具有醛縮酶活性的多肽,如丙酮酸醛缩酶活性,例如而不限于HMG醛缩酶和/或KMG醛縮酶活性;(b)提供a-酮酸受体和丙酮酸或丙酮酸供体;和(c)在醛縮酶催化4-取代的D-谷氨酸合成的条件下,使步骤(a)的多肽与步骤(b)的化合物接触,其中,所述多肽可以具有丙酮酸醛縮酶活性、HMG醛縮酶活性和/或KHG醛縮酶活性,其中,该方法还可以包括使用4-取代的D-谷氨酸。本发明提供了分离的、合成的或重组的核酸,该核酸含有的核酸序列在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500、或更高位的残基区域上与本发明的核酸具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的、或全部(100%)的同一性,本发明的核酸包括SEQIDNO:l、SEQIDNO:3、SEQIDN0:5、SEQIDN0:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQEDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDN0:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDN0.231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDN0:311、SEQIDN0:313、SEQIDN0:315、SEQIDN0:317、SEQIDN0:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338。在一些实施方式中,一个或多个核酸编码至少一种具有醛缩酶活性(例如,丙酮酸醛缩酶活性,例如而不限于HMG醛縮酶和/或KMG醛縮酶活性)的多肽。在一些实施方式中,通过序列比对法分析或视觉检验来确定序列的同一性。在可选择的实施方式中,一个或多个核酸编码至少一种能够产生可以与本发明的多肽进行特异性键合的抗体的多肽,或者这些核酸可以用作识别或分离醛縮酶的编码核酸的探针,或者用于抑制表达醛縮酶的核酸的表达。本发明的核酸还包括编码本发明的酶的分离的、合成的或重组的核酸,例如,包括具有如下序列和它们的子序列的一种或多种多肽、多肽的变体、和它们的酶活性片段的酶SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:湧、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334。在一些实施方式中,所述多肽具有醛縮酶活性,包括丙酮酸活性,例如而不限于HMG和/或KHG醛縮酶活性。在一些实施方式中,本发明提供了醛缩酶的编码核酸,例如,丙酮酸醛縮酶(如HMG和/或KHG醛縮酶)的编码核酸,所述编码核酸优选来自混合培养物。在一些实施方式中,本发明提供了从含有本发明的多核苷酸的混合培养物中分离出来的用于编码形成或断开碳-碳键的酶的核酸,例如,与本发明的核酸至少在约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、或更高位的残基区域上具有至少约10%、15%、20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高、或全部(100%)的同一性的序列,例如,本发明的核酸可以为SEQIDN0:1、SEQIDN0:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:793SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:IB、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDN0:211、SEQIDNO:213、SEQEDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQEDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338。在一些实施方式中,本发明提供了醛縮酶的编码核酸,例如,丙酮酸醛縮酶(如HMG和/或KHG酶)的编码核酸,包括本发明的多核苷酸序列;并提供了由它们编码的多肽,包括本发明的酶,例如,本发明的多肽及其酶活性片段,优选来自于同源,例如环境源,例如,本发明的多肽可以为SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:26Q、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334。在一些实施方式中,本发明还提供了醛縮酶的编码核酸,例如,优选来自环境源(例如混合的环境源)的丙酮酸醛縮酶的编码核酸,HMG和/或KHG酶的编码核酸。在一些实施方式中,所述序列比对法为BLAST2.2.2版比对法,其中,筛选设置(filteringsetting)设定为blastall-pblastp—d"nrpataa"-FF,其它选项都设置为默认。本发明的其它实施方式为分离的、合成的或重组的核酸,该核酸含有至少10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500、或更多个本发明的核酸的连续碱基;与其基本一致的序列;和与其互补的序列。在一些实施方式中,分离的、合成的或重组的本发明的核酸编码具有醛縮酶活性(包括丙酮酸活性,例如但不限于HMG和/或KHG醛縮酶活性)的热稳定性多肽。在下述温度范围的条件下,本发明的热稳定性多肽能够保持醛縮酶活性(如丙酮酸醛縮酶活性,例如,HMG和/或KHG醛縮酶活性)约-10(TC至约-8(TC、约-8(TC至约-4(TC、约-40。C至约-2(TC、约-20"C至约0°C、约0。C至约37。C、约(TC至约5。C、约5。C至约15。C、约15。C至约25。C、约25。C至约37。C、约37。C至约45t:、约45。C至约55。C、约55。C至约70。C、约70。C至约75°C、约75。C至约85°C、约85。C至约90°C、约90。C至约95°C、约95。C至约IO(TC、约IO(TC至约105°C、约105。C至约110。C、约110。C至约120°C、或者95。C、96°C、97°C、98°C、99°C、100°C、101°C、102°C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、110°C、111°C、112°C、113°C、114°C、115°C、或更高的温度。本发明的热稳定性的多肽在下述温度范围的条件下能够保持醛縮酶活性(如,丙酮酸醛縮酶活性,例如HMG和/或KHG醛縮酶活性)约-100。C至约-80。C、约-80。C至约-40。C、约-40。C至约-20。C、约-20。C至约0。C、约0。C至约5。C、约5。C至约15。C、约15。C至约25。C、约25。C至约37。C、约37"至约45。C、约45t:至约55。C、约55°C至约70°C、约70。C至约75°C、约75。C至约85°C、约85。C至约90°C、约90°C至约95。C、约95。C至约100°C、约IO(TC至约105°C、约105。C至约110°C、约ll(TC至约120°C,或者95。C、96°C、97°C、98°C、99°C、100°C、101。C、102。C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、110°C、111°C、112°C、113°C、114°C、115°C、或更高的温度。在一些实施方式中,在上述温度范围和下述pH下,本发明的热稳定性多肽能够保持醛縮酶活性约pH3.0、约pH3.5、约pH4.0、约pH4.5、约pH5.0、约pH5.5、约pH6.0、约pH6.5、约pH7.0、约pH7.5、约pH8.0、约pH8.5、约pH9.0、约pH9.5、约pH10.0、约pH10.5、约pHll.O、约pH11.5、约pH12.0、或更高的pH。在其它实施方式中,所述分离的、合成的或重组的核酸编码具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如但不限于HMG和/或KHG醛縮酶活性)的热稳定性多肽。本发明的热稳定性的多肽暴露在下述温度范围的环境下能够保持醛縮酶活性(如,丙酮酸醛缩酶活性,例如HMG和/或KHG醛縮酶活性)约-100。C至约-80。C、约-80。C至约-40。C、约-40。C至约-20。C、约-20。C至约(TC、约(TC至约5。C、约5。C至约15。C、约15。C至约25。C、约25。C至约37。C、约37。C至约45。C、约45。C至约55。C、约55。C至约7(TC、约70°C至约75。C、约75。C至约85。C、约85。C至约90°C、约90°C至约95°C、约95。C至约IO(TC、约IO(TC至约105°C、约105。C至约110°C、约ll(TC至约120°C,或者95。C、96°C、97°C、98°C、99°C、100°C、101°C、102°C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、110。C、111°C、112°C、113°C、114°C、115°C、或更高的温度。本发明的热稳定性多肽暴露在下述温度范围下能够保持醛縮酶活性(如,丙酮酸醛縮酶活性,例如HMG和/或KHG醛缩酶活性)约-10(TC至约-8(TC、约-8(TC至约-4(TC、约-40。C至约-20。C、约-2(TC至约(TC、约(TC至约5°C、约5"C至约15°C、约15。C至约25°C、约25"至约37。C、约37。C至约45。C、约45。C至约55。C、约55。C至约70。C、约70。C至约75。C、约75。C至约85。C、约85。C至约90。C、约90。C至约95。C、约95。C至约100°C、约IO(TC至约105°C、约105。C至约110。C、约ll(TC至约120°C,或者95°C、96°C、97°C、98°C、99°C、IO(TC、101°C、102°C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、110°C、111°C、112°C、113°C、114°C、115°C、或更高的温度。在一些实施方式中,本发明的热稳定性多肽暴露在上述温度范围和下述pH下,能够保持醛縮酶活性约pH3.0、约pH3.5、约pH4.0、约pH4.5、约pH5.0、约pH5.5、约pH6.0、约pH6.5、约pH7.0、约pH7.5、约pH8.0、约pH8.5、约pH9.0、约pH9.5、约pH10.0、约pH10.5、约pHll.O、约pH11.5、约pH12.0、或更高的pH。本发明提供了含有在严格的条件下能与本发明的核酸杂交的序列的分离的、合成的或重组的核酸,该核酸含有如下序列及其片段或子序列SEQIDN0:1、SEQIDN0:3、SEQIDN0:5、SEQIDN0:7、SEQIDN0:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQEDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337、或SEQIDNO:338。在一些实施方式中,所述核酸编码具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如,而不限于,HMG和/或KHG醛縮酶活性)的多肽。所述核酸在长度上可以为至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、或更多个残基,或者为基因或转录产物的全长。在一些实施方式中,所述严格的条件包括洗涤步骤,该洗涤步骤包括在65T下在0.2xSSC中洗涤15分钟。本发明提供了用于对编码具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如,而不限于,HMG和/或KHG醛縮酶活性)的多肽的核酸进行识别或分离的核酸探针,其中,该核酸探针含有约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、或更多个本发明的序列的连续碱基,其中,所述探针通过成键或杂交来识别所述核酸。所述探针包括寡核苷酸,该寡核苷酸含有约10-100个之间的本发明的序列或者它们片段或子序列的连续碱基,例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、或100,或者更多个碱基,或者上述范围之间任意期望的长度。本发明提供了用于对编码具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如,而不限于,HMG和/或KHG醛缩酶活性)的多肽的核酸进行识别或分离的核酸探针,其中,该核酸探针包括约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、或更多个本发明的核酸的残基的序列,例如与本发明的核酸具有至少约50%、51%、52%、53°/。、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的、或完全(100%)的同一性的多核苷酸。在一些实施方式中,通过用序列比对法进行分析或用视觉检验法来确定序列的同一性。在其它实施方式中,所述探针包括寡核苷酸,该寡核苷酸含有约10-100个之间的本发明的核酸序列或者其子序列的连续碱基,例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、或100、或者更多个碱基,或者上述范围之间的任意期望的长度。本发明提供了用于扩增(例如,通过聚合酶链反应(PCR))编码具有醛縮酶活性(包括丙酮酸醛缩酶活性,例如,而不限于,HMG和/或KHG醛缩酶活性)的多肽的核酸的扩增引物对,其中,每个引物对能够对含有本发明的序列的、或它们的片段或子序列(见序列表)的核酸进行扩增。所述扩增引物序列对中的一个或每一个成员均可以包括寡核苷酸,该寡核苷酸含有约10-50个、或者更多个所述序列的连续碱基,或者包括10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36个、或者更多个所述序列的连续碱基。在一些实施方式中,本发明提供了扩增引物对,其中,每个引物对包括具有前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36个、或更多个本发明的核酸的残基的序列的第一成员,以及前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36个、或更多个第一成员的互补链的残基的序列的第二成员。使用本发明的扩增引物对,本发明提供了通过扩增(例如,聚合酶链反应(PCR))产生的醛縮酶的编码核酸,例如,丙酮酸醛缩酶的编码核酸,HMG和/或KHG醛縮酶的编码核酸。在一些实施方式中,使用本发明的扩增引物对,本发明提供了通过扩增(例如,聚合酶链反应(PCR))产生的醛縮酶的编码核酸,例如,丙酮酸醛缩酶的编码核酸,HMG和/或KHG醛縮酶的编码核酸。在一些实施方式中,使用本发明的扩增引物对,本发明提供了通过扩增(例如聚合酶链反应(PCR))来制备醛縮酶(例如丙酮酸醛縮酶,HMG和/或KHG醛縮酶)的方法。在一些实施方式中,所述扩增引物对使来自库(例如基因库、例如环境库)的核酸扩增。本发明提供了用于对编码具有醛縮酶活性(包括丙酮酸醛縮酶活性,例如,而不限于,HMG和/或KHG醛缩酶活性)的多肽的核酸进行扩增的方法,该方法包括用能够扩增本发明的核酸序列、或它们的片段或子序列的扩增引物序列对,扩增模板核酸。本发明提供了一种表达盒,该表达盒含有本发明的核酸或它们的子序列。在一些实施方式中,所述表达盒可以含有与启动子可操作地连接的核酸。所述启动子可以是病毒、细菌、哺乳动物、真菌、酵母、或植物的启动子。在一些实施方式中,所述植物启动子可以是马铃薯、大米、玉米、小麦、烟草、或大麦的启动子。所述启动子可以为组成型启动子。所述组成型启动子可以包括CaMV35S。在其它的实施方式中,所述启动子可以为诱导型启动子。在一些实施方式中,所述启动子可以为组织特异型启动子或环境调节型或发育调节型启动子。因此,例如,所述启动子可以为种子特异型、叶子特异型、根特异型、茎特异型或脱离诱导型启动子。在一些实施方式中,所诉表达盒还可以含有植物或植物病毒表达载体。本发明提供了一种克隆载体,该克隆载体包括本发明的表达盒(例如病毒载体)或者本发明的核酸。所述克隆载体可以为病毒载体、质粒、噬菌体(phage)、噬菌粒、粘粒、福斯质粒(fosmid)、细菌噬菌体(bacteriophage)或人工染色体。所述病毒载体可以包括腺病毒载体、逆转录病毒载体或腺相关病毒载体。所述克隆载体可以包括细菌人工染色体(BAC)、质粒、源自细菌噬菌体Pl的载体(PAC)、酵母人工染色体(YAC)、或哺乳动物人工染色体(MAC)。本发明提供了一种转化细胞,该转化细胞含有本发明的核酸、或本发明的表达盒(例如载体)、或本发明的克隆载体。在一些实施方式中,所述转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。在一些实施方式中,所述植物细胞可以为大豆、油菜籽、油籽、蕃茄、蔗糖、谷物、马铃薯、小麦、大米、烟草或大麦的细胞。本发明提供了一种转基因非人类动物,该转基因非人类动物含有本发明的核酸或本发明的表达盒(例如载体)。在一些实施方式中,所述动物为小鼠、大鼠、猪、山羊或绵羊。本发明提供了一种转基因植物,该转基因植物含有本发明的核酸或本发明的表达盒(例如载体)。所述转基因植物可以为谷类植物、玉米植物、马铃薯植物、蕃茄植物、小麦植物、油籽植物、油菜籽植物、大豆植物、大米植物、大麦植物或烟草植物。本发明提供了一种转基因种子,该转基因种子含有本发明的核酸或本发明的表达盒(例如载体)。所述转基因种子可以为谷类种子、玉米种子、小麦种子、油籽、油菜籽、大豆种子、棕榈仁、向日葵种子、芝麻种子、花生或烟草植物种子。本发明提供了一种反义寡核苷酸,该反义寡核苷酸含有与本发明的核酸互补的核酸序列或者能够在严格的条件下与本发明的核酸杂交的核酸序列。在一些实施方式中,本发明提供了在细胞中对醛縮酶(例如,丙酮酸醛縮酶,HMG和/或KHG醛縮酶)信息的转译进行抑制的方法,该方法包括对细胞施用反义寡核苷酸或者在细胞中使该反义寡核苷酸表达,所述反义寡核苷酸含有与本发明的核酸互补的核酸序列或者能够在严格的条件下与本发明的核酸杂交的核酸序列。在一些实施方式中,所述反义寡核苷酸的长度为约10至约50个、约20至约60个、约30至约70个、约40至约8个0、约50至约IOO个碱基,例如,所述长度为10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100个、或更多个碱基。本发明提供了一种在细胞中对醛缩酶(例如,丙酮酸醛縮酶,HMG和/或KHG醛縮酶)的信息的转译进行抑制的方法,该方法包括对细胞施用反义寡核苷酸或者在细胞中使该反义寡核苷酸表达,所述反义寡核苷酸含有与本发明的核酸互补的核酸序列或者能够在严格的条件下与本发明的核酸杂交的核酸序列。本发明提供了一种含有本发明的序列的子序列的双链抑制性RNA(RNAi或RNA干扰)分子(包括用于抑制转录的小干扰RNA,或者siRNA,或者用于抑制转译的微RNA(microRNA)或小RNA(miRNA))。在一些实施方式中,所述siRNA为长度为约21-24个残基的双链核苷酸,或者长度至少为5、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、45、50、55、60、65、70、75、80、85、卯、95、100个、或更多个残基的双链核苷酸。在一些实施方式中,本发明提供了在细胞中对醛缩酶的(例如,丙酮酸醛縮酶,HMG和/或KHG醛縮酶的酶)表达进行抑制的方法,该方法包括对细胞施用双链抑制性RNA(siRNA或miRNA)或者在细胞中使该双链抑制性RNA表达,其中,所述RNA含有本发明的序列的子序列。本发明提供了一种分离的、合成的或重组的多肽,该多肽包括至少在约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350位、或更高位的残基区域上,或者在所述多肽的全长上与本发明的多肽或肽具有至少约50o/0、510/。、52。/()、53%、54%、55。/o、56%、57%、58。/o、59。/o、6()0/o、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的、或全部(100%)的同一性的氨基酸序列。在一些实施方式中,通过用序列比对法分析或通过视觉检验,来确定所述序列的同一性。本发明的多肽或肽序列包括以下序列和它们的子序列、它们的变体、和它们的酶活性片段SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334。本发明的多肽还含有长度至少为约10、15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600个、或更多个残基的片段,或者所述酶的全长。本发明的多肽或肽序列含有由本发明的核酸所编码的序列。本发明的多肽或肽序列包括与本发明的抗体特异性结合的多肽或肽(例如抗原决定簇),或者能够产生本发明的抗体的多肽或肽(例如免疫原)。在一些实施方式中,本发明的多肽具有至少一种醛縮酶的活性,例如,丙酮酸醛縮酶(如,HMG和/或KHG醛缩酶)的活性。在其它的实施方式中,本发明的多核苷酸编码具有至少一种醛縮酶的活性(例如,丙酮酸醛缩酶的活性,例如,HMG和/或KHG醛縮酶的活性)的多肽。本发明的另一种实施方式提供了一种分离的、合成的或重组的多肽,该多肽含有至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150个、或更多个本发明的多肽或肽的序列的连续碱基、与所述多肽或肽的序列基本一致的序列的连续碱基、和与所述多肽或肽的序列互补的序列的连续碱基。所述肽可以为,例如,免疫原的片段、基序(例如结合位点)、信号序列、前序列(pr印rosequence)或活性位点。本发明提供了一种分离的、合成的或重组的核酸,该核酸含有编码具有醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的活性和信号序列的多肽的序列,其中,所述核酸含有本发明的序列。"信号序列"的意思是指用于促进宿主细胞分泌本发明的醛縮酶的分泌信号或其它功能域。所述信号序列可以源自于另一个醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)或非醛縮酶(如非丙酮酸醛缩酶,例如,非HMG和/或非KHG醛缩酶)(异源的)。在一些实施方式中,本发明提供了一种分离的、合成的或重组的核酸,该核酸含有编码具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的活性的多肽的序列,其中,所述序列不含有信号序列,且所述核酸含有本发明的序列。在一些实施方式中,本发明提供了一种分离的、合成的或重组的多肽,该多肽含有缺少了全部或部分信号序列的本发明多肽。在一些实施方式中,所述分离的、合成的或重组的多肽可以包括本发明的含有异源信号序列(如异源醛縮酶,例如,异源丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶的酶信号序列)的多肽或非醛缩酶的信号序列(如非丙酮酸醛缩酶,例如,非HMG和/或非KHG醛縮酶的酶信号序列)。在一些实施方式中,本发明提供了一种嵌合蛋白,该嵌合蛋白包括含有本发明的信号序列的第一区域和至少一个第二区域。所述蛋白可以为融合蛋白。所述第二区域可以含有酶。所述蛋白可以为非酶蛋白。本发明提供了一种嵌合多肽,该嵌合多肽包括至少一个第一区域和至少一个第二区域,所述第一区域含有本发明的信号肽(SP)、前序列(preprosequence)和/或催化功能域(CD),所述第二区域含有异源的多肽或肽,其中,所述异源的多肽或肽不必然地与所述信号肽(SP)、前序列(preprosequence)和/或催化功能域(CD)相关。在一些实施方式中,所述异源的多肽或肽不是醛缩酶(例如,丙酮酸醛縮酶,HMG和/或KHG醛缩酶)。所述异源的多肽或肽可以为所述信号肽(SP)、前序列(preprosequence)禾口/或催化功能域(CD)的氨基末端、羧基末端或两端。本发明提供了编码嵌合多肽的分离的、合成的或重组的核酸,其中,所述嵌合多肽包括至少一个第一区域和至少一个第二区域,所述第一区域含有本发明的信号肽(SP)、前序列(preprosequence)和/或催化功能域(CD),所述第二区域含有异源的多肽或肽,其中,所述异源的多肽或肽不必然地与所述信号肽(SP)、前序列(preprosequence)和/或催化功能域(CD)相关。本发明提供了分离的、合成的或重组的信号序列(例如,信号肽),该信号序列含有具有以下残基的序列或者由该序列所组成1至14、1至15、1至16、1至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至28、1至30、1至31、l至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至4K1至42、1至43、1至44、1至45、1至46、或1至47个本发明的多肽的残基,例如,本发明的多肽可以为SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:243SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDN0:403SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:l卯、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334。在一些实施例中,本发明提供了含有本发明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27328、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70个、或更多个氨基末端的信号序列。在一些实施方式中,所述醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)的酶活性包括每亳克蛋白质约10至约12000个单位的比活性。在其它的实施方式中,所述醛縮酶(如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白质约1000至约10000个单位的比活性,或者每毫克蛋白质约5000至约7500个单位。可选择地,所述醛縮酶(如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白质约10至约7500个单位的比活性,或者每毫克蛋白质约5000至约12000个单位。在一些实施方式中,所述醛縮酶(如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白质约10至约5000个单位的比活性,或每毫克蛋白质约7500至约10000个单位。在其它的实施方式中,所述醛缩酶(如,丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白质约10至约2500个单位的比活性。可选择地,所述醛缩酶(如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性包括每毫克蛋白质约10至约1000个单位的比活性。测量不同醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的典型的方法使用常规的基质,4-羧基-4-羟基-2-氧代己二酸("CHA")。典型的分析包括pH为7.5的50mM的磷酸钠、lmM的MgCb、lmM的CHA、10吗/ml的来自赖氏乳杆菌(丄ac,o6ac/〃M/e/c/zwam'z',Sigma-Aldrich,St.Louis,MO)的D-乳酸脫氢酶("LDH")、0.5mM的NADH。该测定通过加入待测量的酶开始。在340nm的分光光度计中连续地进行丙酮酸的释放、耦合形成NAD+。酶活性单位定义为释放出的丙酮酸足以使340nm的吸光度以每分钟IOD降低的量。在其它的实施方式中,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的耐热性包括加热到高温后保持醛缩酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶)的比活性的至少一半,例如在约0。C至约20°C、约20。C至约37。C、约37。C至约5(TC、约5(TC至约70。C、约7(TC至约75。C、约75。C至约80。C、约80。C至约85。C、约85。C至约90。C、约90°C至约95。C、约95。C至约IO(TC、约IO(TC至约ll(TC,或更高的温度。可选择地,所述耐热性可以包括在如上所述的高温加热后,比活性保持为每毫克蛋白质约10至约12000个单位,或每毫克蛋白质约5000至约10000个单位。在其它的实施方式中,所述耐热性可以包括在如上所述的高温加热后,比活性保持为每毫克蛋白质约10至约5000个单位。本发明提供了分离的、合成的或重组的本发明的多肽,其中,该多肽包括至少一个糖基化位点。在一些实施方式中,糖基化可以为N-连接型糖基化。在一些实施方式中,所述多肽可以在毕赤酵母(Ppwto/^)或粟酒裂殖酵母(S.戶m&)宿主中或在哺乳动物宿主细胞中表达后被糖基化。在一些实施方式中,所述多肽可以在具有约pH6.5、pH6、pH5.5、pH5、pH4.5、pH4.0、pH3.5、pH3.0或更低的pH值的(更酸的)条件下保持醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在其它的实施方式中,所述多肽可以在具有约pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5、pH11.0、pH11.5、pH12、pH12.5、或更高的pH值的(更碱的)条件下保持醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在一些实施方式中,所述多肽可以在暴露在具有约pH6.5、pH6、pH5.5、pH5、pH4.5、pH4.0、pH3.5、pH3.0或更低的pH值的(更酸的)条件下后保持醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在其它的实施方式中,所述多肽可以在暴露在具有约pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5、pHll.O、pH11.5、pH12、pH12.5、或更高的pH值的(更碱的)条件下后保持醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)的酶活性。在一些实施方式中,本发明的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)在碱性条件下具有活性,例如,肠(例如小肠)的碱性环境。在一些实施方式中,所述多肽可以在暴露在胃的酸性pH后保持活性。本发明提供了含有本发明的多肽(包括肽)的蛋白质制剂,其中,该蛋白质制剂包括液体、固体或凝胶。在一些实施方式中,本发明提供了一种异源二聚体,该异源二聚体含有本发明的多肽和第二成员(例如多肽或其它(第二)区域)。所述异源二聚体的第二成员可以为不同的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)、不同的酶或其它蛋白质。在一些实施方式中,所述第二区域可以为多肽,所述异源二聚体可以为融合蛋白。在一些实施方式中,所述第二区域可以为抗原决定簇或标记。在一些实施方式中,本发明提供了含有本发明的多肽的同型多聚体,该同型多聚体包括,但不限于,同型二聚体、同型三聚体、同型四聚体、同型五聚体和同型六聚体。本发明提供了具有醛縮酶(例如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的固定化多肽(包括肽),其中,该固定化多肽包括本发明的多肽、由本发明的核酸编码的多肽、或含有本发明的多肽和第二区域的多肽。在一些实施方式中,所述多肽可以被固定化在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、板、阵列或毛细管上。本发明还提供了含有本发明的固定化核酸(包括,例如本发明的探针)的阵列。在一些实施方式中,本发明还提供了含有本发明的抗体的阵列。本发明提供了分离的、合成的或重组的抗体,该抗体能够与本发明的多肽或者能够与由本发明的核酸编码的多肽特异性结合。本发明的这些抗体可以为单克隆抗体或多克隆抗体。在一些实施方式中,本发明提供了含有本发明的抗体的杂种细胞,例如能够与本发明的多肽或者与由本发明的核酸编码的多肽特异性结合的抗体。在一些实施方式中,本发明提供了编码这些抗体的核酸。本发明提供了具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的分离或识别方法,该方法包括(a)提供本发明的抗体;(b)提供含有多肽的样品;和(c)在能够使所述抗体与所述多肽特异性结合的条件下,使步骤(b)的样品与步骤(a)的抗体接触,从而对具有醛缩酶(如丙酮酸醛缩酶,例如,HMG禾口/或KHG醛縮酶)的酶活性的多肽进行分离或识别。本发明提供了制备抗醛縮酶的抗体(如抗丙酮酸醛縮酶的抗体,例如,抗HMG和/或抗KHG醛縮酶的抗体)的方法,该方法包括以足以产生体液免疫响应的量,对非人类动物给药本发明的核酸或本发明的多肽或它们的子序列,从而制备抗醛縮酶的酶的抗体(如抗丙酮酸醛縮酶的抗体,例如,抗HMG和/或抗KHG醛縮酶的抗体)。在一些实施方式中,本发明提供了制备抗醛缩酶的抗体(如抗丙酮酸醛縮酶的抗体,例如,抗HMG和/或抗KHG醛缩酶的抗体)的方法,该方法包括以足以产生免疫响应(细胞的或体液的)的量,对非人类动物给药本发明的核酸或本发明的多肽或它们的子序列。本发明提供了生产重组多肽的方法,该方法包括以下步骤(a)提供能够与启动子可操作地连接的本发明的核酸;和(b)在允许该多肽表达的条件下使步骤(a)的核酸表达。在一些实施方式中,所述方法还可以包括用步骤(a)的核酸来转化縮主细胞,然后使步骤(a)的核酸表达,从而在转化细胞中生产重组多肽。本发明提供了对具有醛縮酶(如丙酮酸醛縮酶,例如,HMG禾口/或KHG醛縮酶)的酶活性的多肽进行识别的方法,该方法包括如下步骤(a)提供本发明的多肽、或由本发明的核酸编码的多肽;(b)提供醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)的底物;和(c)将步骤(a)的多肽或它们的片段或变体与步骤(b)的底物接触,检测底物量的减少或者反应产物量的增多,其中,通过所述底物量的减少或者反应产物量的增多,来检测具有醛縮酶(例如,丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在一些实施方式中,所述底物为碳水化合物、含有碳水化合物的混合物和/或碳水化合物模拟物。本发明提供了用于对醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的底物进行识别的方法,该方法包括如下步骤(a)提供本发明的多肽或由本发明的核酸编码的多肽;(b)提供测试底物;和(c)将步骤(a)的多肽与步骤(b)的测试底物接触,检测底物量的减少或者反应产物量的增多,其中,通过底物量的减少或者反应产物量的增多来确定所述测试底物为醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的底物。本发明提供了用于确定测试化合物是否与多肽特异性结合的方法,该方法包括(a)在允许核酸转译为多肽的条件下,使核酸或含有核酸的载体表达,其中,该核酸包括本发明的核酸,或者,提供本发明的多肽;(b)提供测试化合物;(c)将所述多肽与测试化合物接触;(d)检测步骤(b)的测试化合物是否与所述多肽特异性地结合。本发明提供了用于对醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)的酶活性调节剂进行识别的方法,该方法包括如下步骤(a)提供本发明的多肽或由本发明的核酸编码的多肽;(b)提供测试化合物;(c)将步骤(a)的多肽与步骤(b)的测试化合物接触,测量醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性,其中,在测试化合物的存在下测量的醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)的酶活性与测试化合物不存在下测量的酶活性相比发生改变,则说明测试化合物调节醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。在一些实施方式中,可以通过提供醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶),并检测底物量的减少或反应产物量的增多,或者,底物量的增多或反应产物量的减少,来检测所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性。与不存在测试化合物的条件下的底物的量和反应产物的量相比,存在测试化合物的条件下底物的量减少或反应产物的量增多,则确定所述测试化合物为醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性活化剂。与不存在测试化合物的条件下的底物的量和反应产物的量相比,存在测试化合物的条件下底物的量增多或反应产物的量减少,则确定所述测试化合物为醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性抑制剂。本发明提供了包括处理器和数据存储装置的计算机系统,其中,所述数据存储装置中存储有本发明的多肽序列或核酸序列(例如,由本发明的核酸编码的多肽或肽)。在一些实施方式中,所述计算机系统还可以包括数据比对系统和其中存储有至少一个参考序列的数据存储装置。在其它的实施方式中,所述序列比对系统包括表现多态现象的计算机程序。在一些实施方式中,所述计算机系统还可以包括用于识别所述序列中的一个或多个特征的识别器。在一些实施方式中,本发明提供了其中存储有本发明的多肽序列或核酸序列的计算机可读的存储材料。在一些实施方式中,本发明提供了用于鉴定序列中的特征的方法,该方法包括如下步骤(a)通过用于鉴定序列中的一个或多个特征的计算机程序来读取序列,其中,该序列包括本发明提供的多肽序列或核酸序列;和(b)通过所述计算机程序来鉴定所述序列中的一个或多个特征。在一些实施方式中,本发明提供了用于将第一序列与第二序列进行比较的方法,该方法包括如下步骤(a)通过使用比较序列的计算机程序来读取第一序列和第二序列,其中,所述第一序列包括本发明提供的多肽序列或核酸序列;和(b)通过所述计算机程序来确定第一序列和第二序列之间的差异。该确定第一序列和第二序列之间的差异的步骤还可以包括对多态现象进行识别的步骤。在一些实施方式中,所述方法还可以包括能够识别序列中的一个或多个特征的识别器。在其它实施方式中,该方法还包括用计算机程序来读取所述第一序列并对序列中的一个或多个特征进行识别。本发明提供了用于从样品(例如环境样品)中分离或回收编码具有醛缩酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶)的酶活性的多肽的核酸的方法,该方法包括如下步骤(a)提供用于对编码具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸进行扩增的扩增引物序列对,其中,该引物对能够扩增本发明的核酸;(b)从样品中分离核酸或处理该样品使样品中的核酸可以与所述扩增引物对杂交;和(c)使步骤(b)的核酸与步骤(a)的扩增引物对结合,并从样品中扩增核酸,从而从样品中分离或回收到编码具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸。所述扩增引物序列对的一个或各个成员可以含有寡核苷酸,该寡核苷酸包括本发明的扩增引物序列对,例如,具有至少约10至50个本发明序列的连续碱基。在本发明的一种实施方式中,所述样品为环境样品。本发明提供了用于从样品(例如环境样品)中分离或回收编码具有醛缩酶(例如,丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)的酶活性的多肽的核酸的方法,该方法包括如下步骤(a)提供含有本发明的核酸或其子序列的多核苷酸探针;(b)从样品中分离核酸或处理该样品使样品中的核酸可以与步骤(a)的多核苷酸探针杂交;(c)使步骤(b)的核酸或处理后的样品与步骤(a)的多核苷酸探针结合;和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸,从而从样品中分离或回收到编码具有醛缩酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸。所述样品可以包括含水样品、液态样品、固态样品、气态样品或生物样品。在一些实施方式中,所述生物样品可以来自细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。在本发明的一种实施方式中,所述样品为环境样品。本发明提供了产生编码具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸的变体的方法,该方法包括如下步骤(a)提供含有本发明的核酸的模板核酸;和(b)在所述模板的序列中改变、缺失或添加一个或多个核苷酸,或者这些方式的组合,以产生所述模板核酸的变体。在一些实施方式中,所述方法还可以包括使变体核酸表达,以产生变体醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)的多肽。所述改变、添加或缺失可以通过包括错配PCR、滑移、寡核苷酸定向突变、拼装PCR、有性PCR突变、体内突变、盒式突变、递归整体突变(recursiveensemblemutagenesis)、指类女整体突变(exponentialensemblemutagenesis)、位点特异性突变、基因重组、基因位点饱和诱变(GSSM)、合成连接重组(syntheticligationreassembly,SLR)、染色体饱和突变(CSM)或它们的组合的方法进行。在其它的实施方式中,所述改变、添加或缺失可以通过包括重组、递归序列重组、磷代修饰的DNA突变、含尿嘧啶的模板突变、缺口二倍体突变(gappedduplexmutagenesis)、点错配修复突变、缺失突变、限定选择突变、限定纯化突变、人工基因合成、整体突变、嵌合核酸多聚体形成和它们的组合的方法进行。在一些实施方式中,所述方法可以循环重复直到产生出与由模板核酸编码的多肽相比,具有改变的或不同的活性或改变的或不同的稳定性的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)。在一些实施方式中,变体醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶)的多肽为热稳定性的,在暴露在高温下之后保持一些活性。在其它的实施方式中,所述变体醛缩酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)与由模板核酸编码的醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)相比,具有增强的糖基化作用。可选择地,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)多肽在高温下具有醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性,其中,由模板核酸编码的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)在所述高温下没有活性。在一些实施方式中,所述方法可以循环重复直到产生出与模板核酸相比具有改变的密码子用法的编码序列的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)。在其它的实施方式中,所述方法可以循环重复直到产生出具有比模板核酸更高或更低水平的信息表达或稳定性的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的基因。本发明提供了用于对编码具有醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸中的密码子进行改变以增强它在宿主细胞中的表达的方法,该方法包括如下步骤(a)提供本发明的编码具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸;和(b)识别步骤(a)的核酸中的非优选的或较少优选的密码子,并将编码相同氨基酸的优选的或折中使用的密码子作为替代密码子,来代替非优选的或较少优选的密码子,其中,所述优选的密码子为宿主细胞的基因的编码序列中的过表达的密码子,所述非优选的或较少优选的密码子为宿主细胞的基因的编码序列中的未充分表达的密码子,因此,对核酸进行改变能增强它在宿主细胞中的表达。本发明提供了用于对编码具有醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)的酶活性的多肽的核酸中的密码子进行改变的方法,该方法包括如下步骤(a)提供本发明的核酸;(b)识别步骤(a)的核酸中的密码子,并使用编码相同氨基酸的不同的密码子作为替代密码子来代替核酸中的密码子,从而改变编码醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的核酸中的密码子。本发明提供了用于对编码具有醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶)的酶活性的多肽的核酸中的密码子进行改变以减少它在宿主细胞中的表达的方法,该方法包括如下步骤(a)提供本发明的编码醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)多肽的核酸;和(b)识别步骤(a)的核酸中的非优选的或较少优选的密码子,并使用编码相同氨基酸的优选的或折中使用的密码子作为替代密码子来代替核酸中的非优选的或较少优选的密码子,其中,所述优选的密码子为宿主细胞的基因的编码序列中的过表达的密码子,所述非优选的或较少优选的密码子为宿主细胞的基因的编码序列中的未充分表达的密码子,因此,对所述核酸进行改变能够减少它在宿主细胞中的表达。本发明提供了用于对编码具有醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性的多肽的核酸中的密码子进行改变以降低它在宿主细胞中的表达的方法,该方法包括如下步骤(a)提供本发明的核酸;(b)识别步骤(a)的核酸中的至少一个优选的密码子,并将编码相同氨基酸的非优选的或较少优选的密码子作为替代密码子来代替它,其中,所述优选的密码子为宿主细胞的基因的编码序列中的过表达的密码子,所述非优选的或较少优选的密码子为宿主细胞的基因的编码序列中的未充分表达的密码子,因此,所述核酸的改变能降低它们在宿主细胞中的表达。在一些实施方式中,所述宿主细胞可以为细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺乳动物细胞。本发明提供了产生编码多个改良的醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶)的酶活性位点或底物结合位点的核酸库的方法,其中,改良的活性位点或底物结合位点来自于含有编码第一活性位点或第一底物结合位点的序列的第一核酸,该方法包括如下步骤(a)提供编码第一活性位点或第一底物结合位点的第一核酸,其中,所述第一核酸的序列包括在严格条件下能够与本发明的核酸杂交的序列,且所述核酸能够编码醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性位点,或者能够编码醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的底物结合位点;(b)在第一核酸中的多个耙向密码子中提供一系列用于编码天然氨基酸变体的诱变寡核苷酸;(c)通过一系列的诱变寡核苷酸,在每个经诱变处理的氨基酸密码子上产生一系列由编码多个氨基酸变体的变体核酸编码的活性位点或底物结合位点,从而产生编码多个改良的醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)的活性位点或底物结合位点的核酸库。在一些实施方式中,该方法包括用如下方法诱变步骤(a)的第一核酸最佳定向进化系统、基因位点饱和诱变(GSSM)、合成连接重组(syntheticligationreassembly,SLR)、错酉己PCR、滑移、寡核苷酸定向突变、拼装PCR、有性PCR突变、体内突变、盒式突变、递归整体突变(recursiveensemblemutagenesis)、指数整体突变(exponentialensemblemutagenesis)、位点特异性突变、基因重组、和它们的组合。在其它的实施方式中,该方法包括用如下方法诱变步骤(a)的第一核酸或变体重组、递归序列重组、磷代修饰的DNA突变、含尿嘧啶的模板突变、缺口二倍体突变、点错配修复突变、缺失突变、限定选择突变、限定纯化突变、人工基因合成、整体突变、嵌合核酸多聚体形成、和它们的组合。本发明提供了用于制备小分子的方法,该方法包括如下步骤(a)提供多种能够合成或修饰小分子的生物合成酶,其中,这些酶中的一种包括由本发明的核酸编码的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶);(b)提供用于步骤(a)中的至少一种酶的底物;和(c)在易于进行多个生物催化反应以生产小分子的条件下,通过一系列的生物催化反应使步骤(b)的底物与所述酶反应。在一些实施方式中,本发明提供了用于修饰小分子的方法,该方法包括如下步骤(a)提醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶),其中,该酶含有本发明的多肽、或者由本发明的核酸编码的多肽、或者它们的子序列;(b)提供小分子;和(c)在易于进行由醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)催化的酶促反应的条件下,使步骤(a)的酶与步骤(b)的小分子反应,从而通过醛缩酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶)的酶促反应对小分子进行修饰。在一些实施方式中,该方法包括多种用于步骤(a)的酶的小分子底物,从而产生通过至少一个由醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)催化的酶促反应生成的修饰的小分子的库。在一些实施方式中,所述方法可以包括在易于进行由所述酶催化的多个生物催化反应的条件下的多种额外的酶,以形成由多个酶促反应产生的修饰的小分子的库。在其它的实施方式中,所述方法还可以包括检测所述库的步骤,以确定所述库中是否存在表现出所需活性的特定的修饰小分子。所述检测步骤还可以包括通过对修饰小分子的部分中存在或不存在具有所需活性的特定的修饰小分子进行检测,并识别至少一种能够生成具有所需活性的特定的修饰小分子的特定的生物催化反应,来系统地消除几乎每一个的用于生成所述库中的大量的修饰小分子的的部分的生物催化反应。本发明提供了用于确定醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的功能性片段的方法,该方法包括(a)提供醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶),其中所述醛縮酶含有本发明的多肽、或者由本发明的核酸编码的多肽、或它们的子序列;和(b)从步骤(a)的序列中除去大量的氨基酸残基,并检测剩余序列的醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶)的酶活性,从而确定醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)的功能性片段。在一些实施方式中,通过提供醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的底物,并检测所述底物的量的减少或反应产物的量的增多来测定所述醛缩酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶)的活性。本发明提供了通过使用实时代谢流量分析的新的或改变的表型的全细胞工程方法,该方法包括如下步骤(a)通过改变细胞的遗传成分来制备改变的细胞,其中,通过向细胞中加入本发明的核酸来改变所述遗传成分;(b)培养所述改变的细胞以生成大量的改变的细胞;(c)通过实时监测步骤(b)培养的细胞,来测量该细胞的至少一个代谢参数;禾B(d)分析步骤(C)的参数以确定该测量参数是否与在相似条件下的未改变的细胞的比较测量的不同,从而通过使用实时代谢流量分析来识别细胞的工程化表型。在一些实施方式中,可以通过包括对细胞中的序列进行消除或修改,或者敲除表达的基因的方法来改变所述细胞的遗传组合物。在一些实施方式中,所述方法还可以包括选择出含有新的工程化表型的细胞。在其它的实施方式中,所述方法可以包括对选择的细胞进行培养,从而生成含有新的工程化表型的新的细胞株。本发明提供了增强醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的耐热性或热稳定性的方法,该方法包括使醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的多肽糖基化,其中,所述多肽包括至少30个本发明的多肽或者由本发明的核酸序列编码的多肽的连续的氨基酸,从而增强醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶)的耐热性或热稳定性。在一些实施方式中,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的比活性可以在高于约37"C至约95。C的范围内的温度下是热稳定的或耐热的。本发明提供了用于在细胞中使重组体醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)过表达的方法,该方法包括表达包括含有本发明的核酸或者本发明的核酸序列的核酸的载体,其中,序列的同一性是通过序列比对分析或者通过视觉检验来确定的,其中,通过使用高活性的启动子、双顺反子(dicistronic)载体或通过载体的基因扩增来实现过表达。本发明提供了制备转基因植物的方法,该方法包括如下步骤(a)向细胞中引入异源的核酸序列,其中,所述异源的核酸序列包括本发明的核酸序列,从而制备转基因的植物细胞;和(b)由所述转基因细胞生产转基因植物。在一些实施方式中,步骤(a)还可以包括通过对植物细胞原生质体进行电穿孔或显微注射而引入异源的核酸序列。在其它的实施方式中,步骤(a)还可以包括通过DNA颗粒轰击,直接向植物组织中引入异源的核酸序列。可选择地,步骤(a)还可以包括使用根癌农杆菌"graZacfen'MW/wme/ac/my)宿主向植物细胞DNA中引入异源的核酸序列。在一些实施例中,所述植物细胞可以为甘蔗、甜菜、大豆、蕃茄、马铃薯、玉米、稻、小麦、烟草或大麦的细胞。本发明提供了在植物细胞中表达异源核酸序列的方法,该方法包括如下步骤(a)使用能够与启动子可操作地连接的异源的核酸序列来转化植物细胞,其中,所述异源核酸序列包括本发明的核酸;(b)在所述异源的核酸序列能够在所述植物细胞中表达的条件下培育所述植物。在一些实施方式中,本发明提供了在植物细胞中表达异源核酸序列的方法,该方法包括如下步骤(a)使用能够与启动子可操作地连接的异源核酸序列来转化植物细胞,其中,所述异源核酸序列包括本发明的序列;(b)在所述异源的核酸序列能够在所述植物细胞中表达的条件下培育所述植物。本发明提供了饲料或食物,其中,该饲料或食物含有本发明的多肽或由本发明的核酸编码的多肽。在一些实施方式中,本发明提供了含有本发明的多肽的食物、词料、液体(例如,饮料,例如果汁或啤酒)、面包或面团或面包产品、或饮料前体(例如麦芽汁)。在其它的实施方式中,本发明提供了含有本发明的多肽的食物、饲料或饮料添加剂。在一些实施方式中,本发明提供了例如用于人类或动物的含有本发明的多肽(例如,由本发明的核酸编码的多肽)的食物或营养补品。在一些实施方式中,所述食物或营养补品中的多肽可以为糖基化的。在一些实施方式中,本发明提供了可食用的酶转运基质(enzymedeliverymatrices),其中,所述酶转运基质含有本发明的多肽,例如由本发明的核酸编码的多肽。在一些实施方式中,所述转运基质包括小丸。在一些实施方式中,所述多肽可以为糖基化的。在一些实施方式中,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)的酶活性为耐热性的。在其它的实施方式中,所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的酶活性为热稳定性的。本发明提供了含有本发明的多肽的食物、饲料或营养补品。在一些实施方式中,本发明提供了用于将醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)用作动物饮食的营养补品的方法,该方法包括制备含有包括至少30个本发明的多肽的连续氨基酸的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)的营养补品;并将所述营养补品给食于动物。该动物可以为人类、反刍动物或单胃动物。所述醛缩酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)可以通过在有机体内使编码该醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)多核苷酸表达来制备得到,所述有机体可以选自由杆菌、酵母、植物、昆虫、真菌和动物所组成的组中。所述有机体可以选自由粟酒裂殖酵母(&pom6e)、酿酒酵母(5*.cwev/w'ae)、毕赤酵母(P/c/H'apaytonW大肠埃希氏菌(五.co//)、链霉菌(&^to/^c^sp.)、芽孢杆菌(5腦'〃Mssp)、假单胞菌(尸5e"(i画owassp)、曲霉菌(爿,rg/〃wsp)禾口乳杆菌(Z^cto6a"7/附sp)。本发明提供了可食用的酶转运基质,该酶转运基质含有热稳定性的重组的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶),例如本发明的多肽。在一些实施方式中,本发明提供了用于向动物转运醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)补品的方法,该方法包括制备小丸形式的可食用的酶转运基质,该转运基质含有粒状的载体和热稳定性的重组醛縮酶(如丙酮酸醛縮酶,例如,HMG禾B/或KHG醛縮酶),其中,所述小丸易于将其中含有的醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)分散在水性介质中;以及将所述可食用的酶转运基质给食于动物。所述重组的醛缩酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)可以包括本发明的多肽。所述醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛縮酶)可以被糖基化,以在成丸的条件下提供热稳定性。所述转运基质可以通过将含有胚颗粒和醛縮酶(如丙酮酸醛縮酶,例如,HMG和/或KHG醛缩酶)的混合物制成小丸而形成。所述成丸的条件可以包括施用蒸气。所述成丸的条件可以包括在超过约8(TC的温度施用约5分钟,所述酶保持每毫克酶至少350至约900个单位的比活性。在一些实施方式中,本发明提供了含有本发明的醛縮酶(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶)或由本发明的核酸编码的多肽的药物组合物。在一些实施方式中,所述药物组合物用作助消化药。在一些实施方式中,在pH值为约3.0至约9.0、约3.0至约10.0、约3.0至约11.0或更多的pH值范围内,使含有碳-碳键的化合物与具有醛縮酶活性(如丙酮酸醛缩酶,例如,HMG和/或KHG醛縮酶的酶活性)的本发明的多肽接触。在其它的实施方式中,在至少约55。C、60°C、65°C、70°C、75°C、80°C、85°C、9(TC或更多的温度下,使含有碳-碳键的化合物与具有醛縮酶活性(如丙酮酸醛缩酶,例如,HMG和/或KHG醛缩酶的酶活性)的本发明的多肽接触。在其它产品中,本发明提供了用于促进制备莫那亭、莫那亭衍生物、和它们的盐的反应过程的多肽,例如,在11-2-羟基-2-(吲哚-3基甲基)-4-酮戊二酸(也被称作R-a酮酸莫那亭、R-莫那亭前驱体、R-MP和a酮酸形式的莫那亭,是一种特定的莫那亭立体异构体(例如,R,R和S,R莫那亭)的前驱体)的制备过程中。本发明还提供了使用一种或多种本发明的多肽来制备莫那亭、莫那亭衍生物和盐、以及它们的内縮合产物的方法。合成R-MP、莫那亭的立体异构体和/或莫那亭衍生物的立体异构体的方法包括使用下述具有醛缩酶活性的多肽中的一种或多种SEQIDN0:2、SEQIDNO:4、SEQIDN0:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQI關0:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO龍SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDN〇:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDN0:312、SEQIDN0:314、SEQIDN0:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、禾BSEQIDNO:334、和它们的酶活性片段。所述合成R-MP、莫那亭的立体异构体和/或莫那亭衍生物的立体异构体的方法还可以包括使用由与本发明的核酸至少在约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500、或更多个残基的区域上具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91。/。、92%、93。/o、94%、95。/()、96%、97%、98%、99%、或更多、或全部(100%)的同一性的核酸序列编码的具有醛縮酶特性的多肽,本发明的核酸包括SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDN0:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337禾卩SEQIDNO:338。此外,所述合成R-MP、莫那亭的立体异构体和/或莫那亭衍生物的立体异构体的方法还可以包括使用由在严格的条件下能够与下列核酸杂交的核酸所编码的具有醛縮酶活性的多肽SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338。本发明提供了一种方法,该方法包括通过多步式途径来制备选自莫那亭、莫那亭衍生物、它们的其盐、以及它们的组合中的产物,其中,通过选自分离的或重组的多肽、或者所述多肽的具有醛縮酶活性的片段或子序列中的一种或多种多肽来促进所述途径中的反应,所述分离的或重组的多肽含有如下氨基酸序列SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:卯、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334。在一些实施方式中,所述它们的片段或子序列的醛縮酶活性至少为0.2mgMP/毫克蛋白质/小时。在其它的实施方式中,所述它们的片段或子序列的醛縮酶活性至少为O.lmgMP/毫克蛋白质/小时。在一些实施方式中,由本发明的一种或多种多肽所促进的反应在约1.0至约10.0mM的MgCl2中进行。在其它实施方式中,由本发明的一种或多种多肽所促进的反应在约pH7.0至约pH11.5下进行。在其它的实施方式中,由本发明的一种或多种多肽所促进的反应在约0.005%至约1%的聚山梨醇酯去污剂中进行。在一些实施方式中,所述反应为吲哚-3-丙酮酸和C3碳源之间的反应。在一些实施方式中,相对于S-2-羟基-2-(吲哚-3-甲基)-4-谷氨酸,所述反应优先生成尺-2-羟基-2-(吲哚-3-甲基)-4-谷氨酸。在一些实施方式中,所述多步式途径制得的产物为莫那亭、它的盐、以及它们的组合。在其它的实施方式中,在所述多步式途径中,R,R-莫那亭、R,S-莫那亭、或它们的组合中的至少一种的生成量既多于S,S-莫那亭,又多于S,R-莫那亭。在一些实施方式中,在该多步式途径中,R,R-莫那亭的生成量多于R,S-莫那亭、S,S-莫那亭和S,R-莫那亭。本发明提供了一种方法,该方法包括通过多步式途径来制备选自莫那亭、莫那亭衍生物、它们的其盐、以及它们的组合中的产物,其中,通过由包括与以下核酸序列具有至少50%的序列同一性的序列的核酸序列所编码的至少一种多肽来促进所述途径中的反应SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338。在一些实施方式中,所述序列同一性的百分比为至少95。/。。在其它的实施方式中,所述序列同一性的百分比为100%。本发明提供了一种方法,该方法包括这样的反应相对于S-2-羟基-2-(吲哚-3-甲基)-4-谷氨酸,优先生成R-2-羟基-2-(吲哚-3-甲基)-4-谷氮酸,其中,使用至少一种多肽来促进所述多步式途径中的反应,所述多肽由含有与如下序列具有至少95%的序列同一性的序列的核酸序列所编码SEQIDNO:28、SEQIDNO:116、SEQIDNO:298、SEQIDNO:44、SEQIDNO:54、SEQIDNO:148、SEQIDNO:46、SEQIDNO:134、SEQIDNO:142、SEQIDNO:122、SEQIDNO:74、SEQIDNO:64、SEQIDNO:108、SEQIDNO:96、SEQIDNO:126、SEQIDNO:80、SEQIDNO:36、SEQIDNO:62、SEQIDNO:112、SEQIDNO:130、SEQIDNO:94、SEQIDNO:58、SEQIDNO:50、SEQIDNO:106、SEQIDNO:42、SEQIDNO:278、SEQIDNO:162、SEQIDNO:276、SEQIDNO:178、SEQIDNO:166、SEQIDNO:218、SEQIDNO:224、SEQIDNO:226、SEQIDNO:244、SEQIDNO:250、SEQIDNO:252、SEQIDNO:264、SEQIDNO:268、SEQIDNO:272、SEQIDNO:184、SEQIDNO:282、SEQIDNO:186、SEQIDNO:192、SEQIDNO:200、SEQIDNO:284、SEQIDNO:172、SEQIDNO:180、SEQIDNO:168、SEQIDNO:228、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240和SEQIDNO:156。本发明提供了一种方法,该方法包括通过多步式途径来制备选自莫那亭、莫那亭衍生物、它们的盐、以及它们的组合中的产物,其中,通过由包括在严格条件下与以下核酸序列杂交的序列的核酸序列所编码的至少一种多肽来促进所述途径中的反应SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337、或SEQIDNO:338。本发明还提供了一种方法,该方法包括通过多步式途径来制备选自莫那亭、莫那亭衍生物、它们的盐、以及它们的组合中的产物,其中,通过选自分离的或重组的多肽、或者所述多肽的具有醛縮酶活性的片段或子序列的一种或多种多肽,来促进所述途径中的反应,所述分离的或重组的多肽含有以下氨基酸序列SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:IOO、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334,其中,所述莫那亭前驱体、它的盐、以及它们的组合是甜的。本发明另外提供了一种方法,该方法包括通过多步式途径来制备选自莫那亭、莫那亭衍生物、它们的盐、以及它们的组合中的产物,其中,所述途径中的反应被至少一种多肽所促进,该多肽由含有与如下序列具有至少50%的序列同一性的序列的核酸序列所编码SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338,其中,所述莫那亭前驱体、它的盐、以及它们的组合是甜的。本发明还提供了一种方法,该方法包括通过多步式途径来制备选自莫那亭、莫那亭衍生物、它们的盐、以及它们的组合中的产物,其中,所述途径中的反应被至少一种多肽所促进,该多肽由含有在严格的条件下与如下的核酸序列杂交的序列的核酸序列所编码SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDN0:311、SEQIDN0:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338,其中,所述莫那亭前驱体、它的盐、以及它们的组合是甜的。为了简明,凡是在说明书和权利要求中鉴定了生成的中间物/产物(例如莫那亭、莫那亭前驱体或莫那亭衍生物)时,术语"和/或其盐"应该理解为在适用的情况下被包括在内。换句话说,例如,短语"将吲哚-3-丙酮酸转化为MP"应该理解为"将吲哚-3-丙酮酸转化为MP和/或其盐"。事实上,常规技术人员会得知在反应条件下实际上会生成所述中间物/产物的盐。根据一些实施方式,所述方法生成了莫那亭或莫那亭衍生物组合物,其中,该组合物中的莫那亭或莫那亭衍生物成分仅包括R,R和R,S形式的莫那亭或莫那亭衍生物。当使用术语"仅"时用于表明只形成该种异构体,意思是如果不发生消旋作用,该途径将只生成确定的异构体。因此,术语"仅"不能理解为不存在其它的异构体,而本领域技术人员可以理解,由于可能发生消旋作用,其它异构体形式可以以相对少的量存在。根据一些实施方式,所述方法制备了一种组合物,其中,该组合物的莫那亭或莫那亭衍生物成分只包括R,R形式的莫那亭或莫那亭衍生物(除非一定程度的消旋化作用产生其它异构体形式)。此处所用的术语"莫那亭组合物"的意思是包括莫那亭的一种或几种异构体的组合物,该术语还可以表示只是莫那亭的一种异构体形式,而没有其它的。此处所用的术语"莫那亭衍生物组合物"的意思是包括莫那亭衍生物的一种或几种异构体的组合物,该术语还可以表示只是莫那亭衍生物的一种异构体形式,而没有其它的。此处所用的术语"莫那亭衍生物"具有如下结构:其中,Ra、Rb、Re、Rd和Re各自独立地表示选自氢原子、羟基、Cl-C3烷基、Cl-C3烷氧基、氨基或卤原子(例如,碘原子、溴原子、氯原子或氟原子)中的取代基。但是,Ra、Rb、Rc、Rd和Re不同时全部为氢。可选择地,Rb与Re禾口/或Rd与Re可以分别同时选自Cl-C4的烯基。此处所用的"取代的吲哚-3-丙酮酸"指的是吲哚-3-丙酮酸的吲哚环上的一个或几个碳原子独立地被以上定义的Ra、Rb、Rc、Rd和Re取代基中的一种或几种取代。但是,Ra、Rb、Rc、Rd和Re不同时全部为氢。可选择地,Rb与Rc禾口/或Rd与Re可以分别同时选自C1-C4的烯基。此处所用的"取代的色氨酸"指的是色氨酸的吲哚环上的一个或几个碳原子独立地被以上定义的Ra、Rb、Rc、Rd和Re取代基中的一种或几种取代。但是,Ra、Rb、Re、Rd和Re不同时全部为氢。可选择地,Rb与Re和/或Rd与Re可以分别同时选自Cl-C4的烯基。在一种实施方式中,所述取代的色氨酸含有与最终的莫那亭衍生物的吲哚环上相同的取代基。此外,此处所描述的用于制备莫那亭的生物合成途径,可以应用取代的色氨酸来生成可能有甜味的莫那亭衍生物。在一些实施方式中,此处所描述的用于所述生物合成途径的取代的色氨酸包括氯化色氨酸和5-羟基色氨酸。例如,与R,R莫那亭具有相似结构的氯化D-色氨酸已经被确认为没有营养的甜味剂(特别是6-氯-D-色氨酸)。同样地,发现卤代的和羟基取代的莫那亭也是甜的。美国公开专利申请No.2005/0118317。卤素或羟基可以被氢取代,特别是在色氨酸的吲哚的苯环的1-4位上,而不影响随后转化为D-或L-色氨酸、B引噪-3-丙酮酸、MP或莫那亭。文献表明,取代的吲哚适于用作PLP-酶的底物,并且生产出了取代的色氨酸。Fukuda、D.S.等的"通过发酵制备取代的L-色氨酸(ProductionofSubstitutedL-TryptophansbyFermentation)",智/.£腦'證M.c油b/"21:841-43(1971)。所述卣原子没有表现出对色氨酸合酶P取代催化机制具有空间位阻,并且不影响对映特异性。在本发明的一些实施方式中,提供了一种用于制备莫那亭组合物的方法,该方法包括由L-色氨酸制备吲哚-3-丙酮酸、由吲哚-3-丙酮酸制备2-羟基2-(吲哚-3基甲基)-4-酮戊二酸("莫那亭前驱体"或"MP")和由MP制备莫那亭。由L-色氨酸制备吲哚-3-丙酮酸的反应,被对L-色氨酸比对R-MP、R,R莫那亭或全部具有更强特异性的、更强活性的酶所促进。根据该实施方式,吲哚-3-丙酮酸的反应被具有R-特异性的醛縮酶活性的酶所促进,从而生成R-MP。根据该实施方式,提供了一种消旋酶,该消旋酶能够促进所述色氨酸反应的氨基酸副产物从一种异构体形式变为另一种异构体形式的差向异构化。在本发明的一些实施方式中,提供了一种制备莫那亭组合物的方法,该方法包括由L-色氨酸制备吲哚-3-丙酮酸、由吲哚-3-丙酮酸制备2-羟基2-(吲哚-3基甲基)-4-酮戊二酸("莫那亭前驱体"或"MP")和由MP制备莫那亭。由L-色氨酸制备吲哚-3-丙酮酸的反应,被对L-色氨酸比对R-MP、R,R莫那亭或全部具有更强特异性的和更强活性的酶所促进。由MP生成莫那亭的反应被一种酶所促进,该酶对R-MP具有立体选择性。术语"立体选择性"指的是一种酶对一种异构体比对另一种异构体具有更强的特异性和更强的活性——此处指R-MP相对于S-MP。在优选的实施方式中,立体选择性的酶对一种异构体与另一种异构体相比具有限定的活性。"限定的"活性指的是最低程度的或表现不出来的活性,例如,和此处提供的实施方式的定义一样。需要注意的是,在涉及一系列反应时(例如前述的段落),本发明不需要每个步骤都明确地进行,这些步骤可以暗含地进行就足够了。换句话说,例如,包括由L-色氨酸制备吲哚-3-丙酮酸、由刚哚-3-丙酮酸制备2-羟基2-(吲哚-3基甲基)-4-酮戊二酸("莫那亭前驱体"或"MP")和由MP制备莫那亭的制备莫那亭的过程,其中,各个反应被适当的酶所促进,可以通过在设定条件下将L-色氨酸与酶结合,这样列举的反应就可以发生。在这样的例子中,L-色氨酸可以反应生成吲哚-3-丙酮酸,由L-色氨酸反应生成的吲哚-3-丙酮酸可以反应生成MP,由B引哚-3-丙酮酸反应生成的MP可以反应生成莫那亭。例如,所述方法还可以通过下述方法进行提供能够制备L-色氨酸的化合物,在适于L-色氨酸生成反应发生的条件下将所述化合物与促进这一系列反应发生的酶混合。另一个例子,所述方法可以通过下述方法进行提供在基因水平上设计的微生物,以根据所述途径生成莫那亭,提供适宜发生发酵过程的条件。例如,可以在基因水平上设计易于生成大量L-色氨酸的微生物,以制备或过量地制备一种或多种用于促进制备莫那亭的途径的酶,并且提供适当的条件,这样所述微生物将生成莫那亭。在本发明的其它实施方式中,提供了制备莫那亭的方法,其中,在L-色氨酸转化为吲哚-3-丙酮酸时,底物生成L-氨基酸,吲哚-3-丙酮酸反应形成MP(可以包括R-MP和S-MP,优选只包括R-MP或主要为R-MP),在R-MP转化为R,R莫那亭时,所述L-氨基酸反应再生成(也称为"循环")底物。由R-MP生成R,R莫那亭的反应,被立体转化转氨酶(例如D-蛋氨酸转氨酶,EC2.6丄41)或者具有D-苯基甘氨酸转氨酶活性的酶所促进。在本发明的其它实施方式中,提供了制备莫那亭的方法,其中,包括由L-色氨酸制备D-色氨酸、由D-色氨酸制备吲哚-3-丙酮酸、由吲哚-3-丙酮酸制备R-MP和由R-MP制备R,R莫那亭。由L-色氨酸制备D-色氨酸的反应被色氨酸消旋酶及其功能等价物所促进。在该实施方式中,由D-色氨酸生成B引哚-3-丙酮酸的反应和由MP生成莫那亭的反应被同样的酶所促进。在其它的实施方式中,吲哚-3-丙酮酸的反应被具有R-特异性醛縮酶活性的酶所促进,从而形成R-MP,由D-色氨酸生成吲哚-3-丙酮酸的反应和由R-MP生成R,R莫那亭的反应被同样的酶所促进。在本发明的一些实施方式中,提供了用于制备莫那亭衍生物的方法,该方法包括由取代的吲哚-3-丙酮酸和丙酮酸制备莫那亭衍生物,使用具有R-特异性醛缩酶活性的酶来催化该反应。在下面的附图中列出了本发明的一种或几种实施方式的详细情况。通过说明书、附图和权利要求,可以看出本发明的其它特征、目的和优点。从此处的描述中应该意识到,本发明可以有各种改变的实施方式,而不偏离本发明的精神范围。因此,所述附图和具体说明应被视为说明性的,而不是限制性的。在所有情况下,在此引用的所有出版物、专利、专利申请、GenBank序列和ATCC保藏一并被引用作为参考。下面的附图用于说明本发明的实施方式,而不是限定本发明的范围,本发明的范围由权利要求限定。图1是表示本发明的用于由L-色氨酸制备R,R莫那亭的酶化方法的实施例的流程图。在这个实施例中,该方法包括在L-色氨酸反应中使用对作为底物的L-色氨酸比对R-MP具有更强的特异性和/或选择性的L-转氨酶(例子包括L-色氨酸转氨酶、L-芳香族转氨酶、L-天冬氨酸转氨酶和L-丙氨酸转氨酶),和/或该方法包括使用对作为底物的R,R莫那亭具有限定的活性和/或特异性的L-氨基酸氧化酶。在图1表示的特定的实施例中,L-转氨酶或L-氨基酸氧化酶将L-色氨酸转化为吲哚-3-丙酮酸,吲哚-3-丙酮酸与R-特异性醛缩酶和丙酮酸反应生成R-a-酮酸莫那亭(R-MP),然后用D-转氨酶或D-氨基酸脱氢酶将R-MP转化为R,R莫那亭。如图1所示,反应是可逆的,但是为了本发明的目的,不需要反应向反方向进行。图2是表示本发明的用于制备R,R莫那亭的另一个方法的实施例的流程图。在这个实施例中,该方法包括使用对R-MP有立体选择性的酶,将R-MP转化为莫那亭。在图2所示的特定的实施例中,在一个可逆反应中将色氨酸转化为吲哚-3-丙酮酸。吲哚-3-丙酮酸可以与非立体特异性的醛縮酶可逆地反应生成ot-酮酸莫那亭(R-和S-MP都有)。用立体选择性的D-转氨酶或立体选择性的D-氨基酸脱氢酶,将R-MP转化为R,R莫那亭。如果使用立体选择性的D-转氨酶或立体选择性的D-氨基酸脱氢酶,则用非立体特异性醛縮酶生成的任何S-MP均可以转化变回吲哚-3-丙酮酸。为了本发明的目的,不需要表示为可逆的反应向反方向进行。图3是表示本发明的用于制备R,R莫那亭的另一个方法的实施例的流程图。在这个实施例中,该方法包括使用色氨酸消旋酶,并使用与形成吲哚-3-丙酮酸的反应相偶合的反应中的D-氨基酸产物,使L-色氨酸转化为D-色氨酸,所述吲哚-3-丙酮酸在与生成R,R莫那亭的反应相偶合的反应中作为底物。在图3所示的特定的实施例中,在一个可逆反应中用色氨酸消旋酶将L-色氨酸转化为D-色氨酸。使D-色氨酸与ot-酮戊二酸(a-KG)和广泛特异性的D-转氨酶反应,以生成吲哚-3-丙酮酸和D-谷氨酸。B引哚-3-丙酮酸与丙酮酸和R-特异性醛缩酶反应并被转化为R-ot-酮酸莫那亭(R-MP);R-MP与广泛特异性的D-转氨酶和D-谷氨酸反应,以生成R,R莫那亭和ot-酮戊二酸(a-KG)。如图3所示,各个反应都是可逆的,但是为了本发明的目的,不需要反应向反方向进行。图4是表示本发明的用于由L-色氨酸制备R,R莫那亭的另一个方法的实施例的流程图。在这个实施例中,该方法包括在与L-色氨酸的反应相偶合的反应中将L-氨基酸转化为D-氨基酸,这个D-氨基酸用作将R-MP转化为R,R莫那亭的反应的氨基供体。在图4所示的特定的实施例中,L-色氨酸与L-转氨酶和(x-酮戊二酸反应,以生成吲哚-3-丙酮酸和L-谷氨酸。吲哚-3-丙酮酸与丙酮酸和R-特异性醛缩酶反应并转化为R-ct-酮酸莫那亭(R-MP);R-MP与广泛特异性的D-转氨酶和D-谷氨酸反应,以生成R,R莫那亭和a-酮戊二酸。如图4所示,各个反应都是可逆的,但是为了本发明的目的,不需要反应向反方向进行。图5是表示本发明的用于由L-色氨酸制备R,R莫那亭的另一个方法的实施例的流程图。在这个实施例中,该方法包括用立体转化酶来促进由R-MP向R,R莫那亭的转化,这样在与L-色氨酸的反应相偶合的反应中生成的L-氨基酸可以用作与由R-MP到R,R莫那亭的反应相匹配的反应的底物。在图5所示的特定的实施例中,L-色氨酸与L-转氨酶和草酰乙酸、丙酮酸或(X-酮戊二酸((x-KG)反应,生成吲哚-3-丙酮酸和L-天冬氨酸(如果使用草酰乙酸)、L-丙氨酸(如果使用丙酮酸)或L-谷氨酸(如果使用a-KG)。吲哚-3-丙酮酸与丙酮酸和R-特异性醛縮酶反应并转化为R-a-酮酸莫那亭(R-MP),R-MP与立体转化转氨酶和L-天冬氨酸、L-丙氨酸或L-谷氨酸反应,以生成R,R莫那亭和草酰乙酸(如果使用L-天冬氨酸)、丙酮酸(如果使用L-丙氨酸)或cc-酮戊二酸((x-KG,如果使用L-谷氨酸)。如图5所示,各个反应都是可逆的,但是为了本发明的目的,不需要反应向反方向进行。图6是表示本发明的用于制备R,R莫那亭的另一个方法的实施例的流程图。在这个实施例中,该方法包括通过在R-MP经过一系列转化反应生成R,R莫那亭的反应中用作反应物的D-氨基酸,回收在生成吲哚-3-丙酮酸的反应中生成的L-氨基酸。在图6所示的特定的实施例中,L-色氨酸与L-转氨酶和草酰乙酸可逆地反应,生成吲哚-3-丙酮酸和L-天冬氨酸。fl引哚-3-丙酮酸与丙酮酸和R-特异性醛缩酶以可逆的形式反应并转化为R-a-酮酸莫那亭(R-MP),R-MP与D-转氨酶和D-丙氨酸可逆地反应,以生成R,R莫那亭和丙酮酸。用天冬氨酸-4-脱羧酶将L-天冬氨酸转化为L-丙氨酸和C02。用丙氨酸消旋酶将L-丙氨酸转化为D-丙氨酸。为了本发明的目的,不需要表示为可逆的反应向反方向进行。图7是表示本发明的用于制备R,R莫那亭的另一个方法的实施例的流程图。在这个实施例中,该方法包括通过将该反应的L-氨基酸副产物转化为另一种产品,来促进L-色氨酸反应的进行(例如,将反应控制为向生成吲哚-3-丙酮酸的方向进行)。在这个实施例中,使用脱羧酶在可逆反应中将L-氨基酸和L-天冬氨酸副产物转化为L-丙氨酸。在图7所示的特定的实施例中,L-色氨酸与L-转氨酶和ct-酮戊二酸(a-KG)或草酰乙酸可逆地反应,生成口引哚-3-丙酮酸和L-谷氨酸(如果使用a-KG)或L-天冬氨酸(如果使用草酰乙酸)。吲哚-3-丙酮酸与丙酮酸和R-特异性醛縮酶可逆地反应并被转化为R一a-酮酸莫那亭(R-MP)。R-MP与D-转氨酶和D-氨基酸以可逆的形式反应而生成R,R莫那亭和草酰乙酸、丙酮酸或a-KG中的一种。用谷氨酸脱羧酶或天冬氨酸-4-脱羧酶将L-氨基转移反应的产物L-谷氨酸或L-天冬氨酸转化为4-氨基丁酸和C02(如果底物为L-谷氨酸),或者转化为(3-丙氨酸和C02(如果底物为L-天冬氨酸)。为了本发明的目的,不需要表示为可逆的反应向反方向进行。图8是表示本发明的用于制备R,R莫那亭的另一个方法的实施例的流程图。在这个实施例中,该方法包括通过将氨基酸用作通过一系列转化反应的R-MP反应的反应物,来回收L-色氨酸反应的氨基酸副产物。在图8所示的特定的实施例中,L-色氨酸与L-转氨酶和oc-酮戊二酸(a-KG)可逆地反应,生成吲哚-3-丙酮酸和L-谷氨酸。吲哚-3-丙酮酸与丙酮酸和R-特异性醛縮酶可逆地反应并转化为R-a-酮酸莫那亭(R-MP)。R-MP与D-转氨酶和D-丙氨酸可逆地反应,以生成R,R莫那亭和丙酮酸。使用L-丙氮酸转氨酶和丙酮酸将L-氨基转移反应的产物L-谷氨酸可逆地转化回oc-KG,L-丙氨酸为副产物。用丙氨酸消旋酶将L-丙氨酸可逆地转化为用于第三个反应(D-氨基转移反应)的D-氨基酸。为了本发明的目的,不需要表示为可逆的反应向反方向进行。图9为计算机系统的结构图。图10是表示用于对新的核苷酸或蛋白质序列与序列数据库进行比较以确定所述新的序列与数据库中的数据的同源性水平的方法的一种实施方式的流程图。图11是表示计算机中的用于确定两个序列是否同源的方法的一种实施方式的流程图。图12是表示用于检测序列中存在特征的识别方法300的一种实施方式的流程图。图13和14一同表示用LC/MS/MS测量的在莫那亭前驱体(MP)的形成中58种不同的醛缩酶(各自由其SEQID号码确定)的活性。图15表示二硫苏糖醇在通过SEQIDNO:88的具有醛縮酶活性的多肽生成莫那中的作用。不同图中的相同的附图标记表示相同的元素。具体实施例方式上文己描述了大量的实施方式,将在下文详细地描述这些实施方式。本发明的实施方式包括一种或多种所述的方面。縮写和术语下文对术语和方法进行解释是为了更好地描述本发明的公开内容,并为本领域的技术人员提供实施本发明的公开内容的指导。本文中使用的"包括"意指"包含"。此外,除非上下文明确指明,单数形式的"一个"或"所述"包括所提及物的复数。例如,提及的"包括蛋白"意指包括所述蛋白的一种或多种;提及的"包括所述细胞"意指包括一种或多种细胞以及本领域公知的它们的等效物等等。术语"约"包括存在任何测量中的实验误差范围。除非另有说明,即使没有明确地使用"约"一词,所有的检测数值应当认为在检测数值前具有"约"一词的意义。保守取代在多肽中用一种氨基酸取代另一种氨基酸,并且这种取代对所述多肽的活性几乎没有影响。所述取代是保守的而不依赖于交换的氨基酸在结构上或在功能上是否为相似的。例如,理想状态下,包括一种或多种保守取代的色氨酸转氨酶多肽保持色氨酸转氨酶的活性。可以通过使用例如标准的方法(如点突变或者PCR或者本领域技术人员公知的方法)操作编码所述肽的核苷酸序列,以制备含有一种或多种保守取代的多肽。可以取代蛋白质中的原始氨基酸,并且如果这种取代对所述多肽的活性几乎没有影响时,则可以认为是保守取代,能够用于取代蛋白质中的原始氨基酸的氨基酸的非限制性实例包括用丝氨酸或者苏氨酸取代丙氨酸;用谷氨酰胺、组氨酸或者赖氨酸取代精氨酸;用谷氨酸、谷氨酰胺、赖氨酸、组氨酸、天冬氨酸取代天冬酰胺;用天冬酰胺、谷氨酸或谷氨酰胺取代天冬氨酸;用丝氨酸或丙氨酸取代半胱氨酸;用天冬酰胺、谷氨酸、赖氨酸、组氨酸、天冬氨酸或精氨酸取代谷氨酰胺;用天冬酰胺、谷氨酰胺、赖氨酸或者天冬氨酸取代谷氨酸;用脯氨酸取代甘氨酸;用天冬酰胺、赖氨酸、谷氨酰胺、精氨酸、酪氨酸取代组氨酸;用亮氨酸、蛋氨酸、缬氨酸、苯丙氨酸取代异亮氨酸;用异亮氨酸、蛋氨酸、缬氨酸、苯丙氨酸取代亮氨酸;用天冬酰胺、谷氨酸、谷氨酰胺、组氨酸、精氨酸取代赖氨酸;用异亮氨酸、亮氨酸、缬氨酸、苯丙氨酸取代蛋氨酸;用色氨酸、酪氨酸、蛋氨酸、异亮氨酸或亮氨酸取代苯丙氨酸;用苏氨酸、丙氨酸取代丝氨酸;用丝氨酸或者丙氨酸取代苏氨酸;用苯丙氨酸、酪氨酸取代色氨酸;用组氨酸、苯丙氨酸或色氨酸取代酪氨酸;和用蛋氨酸、异亮氨酸、亮氨酸取代缬氨酸。在其它地方还可以找到关于保守取代的信息,如Ben-Bassat等(J.Bacteriol.169:751-7,1987)、O'Regan等(Gene77:237-51,1989)、Sahin-Toth等(ProteinSci3:240-7,1994)、Hochuli等(Bio/Technology6:1321-5,1988)、WO00/67796(Curd等)遗传学和分子生物学的标准教科书中。衍生的对于说明书和权利要求,如果下述条件中的一种或多种成立的话,一种物质是从生物体或来源中衍生的1)所述物质存在于所述生物体/来源中;2)所述物质从天然的宿主中分离出;或者3)所述物质从天然的宿主中分离出并且通过例如诱变而被发展。分离的本文中使用的术语"分离的"是指从天然宿主中分离的任何物质;所述物质不需要纯化。例如"分离的核酸"是指天然存在的核酸,该天然存在的核酸不直接地与在它们所源自生物体的天然存在的基因组中与它们直接连接的两条序列相连(一条在5'末端,另一条在3'末端)。例如,分离的核酸可以是,但不限于,任何长度的重组DNA分子,条件是通常直接连接于在天然存在的基因组中的重组DNA分子的核酸序列中的一条被去除掉或者缺失。因此,分离的核酸包括但不限于不依赖于其它序列的以单独的分子(如通过PCR或者限制性核酸内且酶处理制备的cDNA或者基因组DNA片段)形式存在的重组DNA以及插入到载体中的重组DNA、能自主复制的质粒、病毒(例如,逆转录病毒、腺病毒或者疱疹病毒)、或者整合到原核生物或者真核生物的基因组DNA中的DNA。此外,分离的核酸可以包括作为杂交的或者融合的核酸序列的一部分的重组DNA分子。本文所使用的术语"分离的"意指从最初环境中(如果是天然存在的话就是天然环境)分离的材料(如本发明的蛋白质或者核酸)。例如,存在于活体动物中的天然存在的多核苷酸或者多肽不是分离的,但是所述多核苷酸或者多肽从一部分或者全部的天然体系中的共存材料中分离后则是分离的。这种多核苷酸可以是载体的一部分,和/或这种多核苷酸或者多肽可以是组分的部分并且还是分离的,因为所述载体或组分不是其天然环境中的部分。本文中涉及核酸时所使用的术语"分离的"还包括任何天然存在的核酸,因为在天然环境中不能找到非天然存在的核酸,并且非天然存在的核酸不具有在天然存在的基因组中直接连接的序列。例如,非天然存在的核酸如工程核酸被认为是分离的核酸。可以采用普通的分子克隆技术或者核酸的化学合成技术制备工程。分离的非天然存在的核酸可以是不依赖于其它序列的核酸,或者插入到载体中的核酸、能自主复制的质粒、病毒(例如,逆转录病毒、腺病毒或者疱疹病毒)、或者整合到原核生物或者真核生物的基因组中的DNA。此外,分离的核酸可以包括杂交的或者融合的核酸序列的一部分的重组DNA分子。纯化本文中所术语的术语"纯化"不需要绝对的纯度,是相对的术语。因此,例如,纯化的多肽或者核酸制品可以是所述多肽或者核酸的浓度比存在于生物体内的天然环境中的所述多肽或者核酸的浓度高,或者比所述多肽或者核酸在分离的环境中的浓度高。从文库中获得的单独的核酸通常纯化到电泳纯(dectrophoretichomogeneity)。从克隆中获得的序列不能直接从文库或者总的人DNA中获得。本发明中的纯化的核酸是从生物体的基因组DNA的剩余物中纯化的,其纯度提高至少10^1(^倍。在一些实施方式中,术语"纯化"是从基因组DNA的剩余物中或者从文库的其它序列中或者其它环境中纯化的核酸,核酸的纯度提高至少一个数量级,例如,在一些实施方式中,为两个或者三个数量级或者四个或者五个数量级。氨基酸本文中所使用的"氨基酸"或者"氨基酸序列"是指寡肽、肽、多肽或者蛋白质序列,或者指前述的任何一种的片段、部分或者亚单位,以及天然存在的或者合成的分子。"氨基酸"或者"氨基酸序列"包括寡肽、肽、多肽或者蛋白质序列,或者指前述的任何一种的片段、部分或者亚单位,以及天然存在的或者合成的分子。本文中所使用的术语"多肽"是指通过肽键或者修饰的肽键相互连接的氨基酸,即,肽的等排物(petedeisoteres);多肽可以包括除编码基因的20种氨基酸外的修饰的氨基酸。所述多肽可以通过天然的过程(如翻译后的过程)或者通过本领域公知的化学修饰技术来进行修饰。所述修饰可以存在于多肽的任何部位,包括主链、氨基酸侧链和氨基或羧基的末端。可以理解的是,在给定的肽中的不同位点可以存在相同程度的或者不同程度的同类型的修饰。而且,给定的多肽中可以具有多种不同的修饰。所述修饰包括乙酰化、酰化、ADP-核糖基化、氨基化、共价连接黄素、共价连接血红素、共价连接核苷或者核苷衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交叉链接环化、形成二硫键、去甲基化、形成共价交叉链接、形成半胱氨酸、形成焦谷氨酸(pyroglutamate)、甲酸化、y-羧基化、糖基化、糖基磷脂酰肌醇锚着点的形成(GPIanchorformation)、羟基化、碘化、甲基化、豆蔻酰化(myristolyation)、氧化、聚乙二醇化(pegylation)、葡聚糖水解过程、异戊二烯化、外消旋化、硒化(selenoylation)、硫酸化和转移RNA介导的在蛋白质上添加氨基酸如精氨酸化(见Creighton,T.E.,Proteins—StructureandMolecularProperties2ndEd.,W.H.FreemanandCompany,NewYork(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed.,AcademicPress,NewYork,pp.1-12(1983))。本发明的肽和多肽还包括所有下文将详细描述的"模拟的"和"拟肽"形式。具有醛縮酶活性的多肽所谓"具有醛縮酶活性的多肽"是指多肽本身或者该多肽与一种或多种附加的多肽(具有相同或者不同的序列)构成的具有醛縮酶的酶活性的多肽,是一种具有醛縮酶活性的蛋白质。重组"重组"多肽或者蛋白质是指通过重组DNA技术制备的多肽或者蛋白质;S口,从用编码所需的多肽或者蛋白质的外源DNA构建体转化的细胞中制备的。"合成的"多肽或者蛋白质是通过化学合成制备的多肽或者蛋白质。可以采用固相化学肽合成方法来合成本发明的多肽或者片段。这种方法从十九世纪六十年代早期就为本领域的技术人员所公知(Merrifidd,R.B.,J.Am.Chem.Soc,85:2149-2154,1963)(还可以参见Stewart,J.M.andYoung,J.D.,SolidPhasePeptideSynthesis,2ndEd.,PierceChemicalCo.,Rockford,HI"pp.11-12)),并且最近可以用于可商购获得实验室肽的设计和合成试剂盒中(CambridgeResearchBiochemicals)。这种可以商购的实验室试剂盒通常利用H.M.Geysen等在Proc.Natl.Acad.ScL,USA,81:3998(1984)中的教导,并提供了根据许多"棒(rods)"或者"针(pins)"来合成多肽。所述的"棒"或者"针"与单个盘(plate)相连接。基本一致当使用公知的比对法或者通过肉眼检査来比对最大的一致性时,在本文中的描述两种核酸或多肽"基本一致"的术语是指两种或者多种序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核苷酸或者氨基酸残基(序列)的同一性。在另一些实施方式中,所述基本一致是指在至少约ioo个或者更多个残基的区域具有同一性,并且更通常是在所述序列的至少约150-200个或者更多个残基上基本一致。在一些实施方式中,编码区的整个序列基本一致。此外,"基本一致的"氨基酸序列是指以一种或多种保守氨基酸或者非保守氨基酸的取代、删除或插入的方式与参考序列具有区别的序列。在一些实施方式中,所述取代存在于分子中的非活性位点,或者所述取代存在于分子中的活性位点,其条件是所述多肽能够基本上保持它的功能(酶的)特性。保守的氨基酸取代,例如,用一种氨基酸取代同类的另一种氨基酸的取代(例如疏水氨基酸的取代,例如异亮氨酸、缬氨酸、亮氨酸或蛋氨酸,或者一种极性氨基酸取代另一种极性氨基酸的取代,例如用精氨酸取代赖氨酸、用谷氨酸取代天冬氨酸、或者用谷氨酰胺取代天冬酰胺)。例如,可以从醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)的多肽中删除一种或多种氨基酸,以产生所述多肽的修饰的结构而没有改变其生物活性。例如,对于醛缩酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)不是必需的氨基或羧基末端的氨基酸与生物活性无关。可以通过多种方法检测本发明的修饰的多肽序列的醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛缩酶)的生物活性,所述方法包括用底物与修饰的多肽序列接触,并确定修饰的肽是否减少了试验中特异底物的量或者增加了具有功能的醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)与底物的酶促反应的生物产物的量。片段本文中在描述蛋白质或者多肽或者核酸时所使用的"片段"分别是所述蛋白质或者多肽或者核酸的一部分。片段具有与产生该片段的更长的蛋白质或者多肽或者核酸序列相同或者基本上相同的氨基酸或者核酸序列。所述片段还包括具有与更长的蛋白质、多肽或者核酸不同的三维结构的片段。这种片段的实例是"前体型"分子,如具有低活性的前体蛋白,该前体蛋白可以通过切开修饰,以产生具有很高活性的成熟酶。蛋白质或者多肽的片段可以是该蛋白质或者多肽的具有酶活性的部分。立体转化的转氨酶"立体转化的转氨酶"是在使用具有相反手性的底物作为氨基供体时,能够选择地产生手性氨基酸产物(如莫那亭(monatin))的多肽。例如,立体转化的转氨酶可以是D-苯基甘氨酸转氮酶(也称为D-4-羟基苯基甘氨酸转氨酶),该酶选择地使用L-谷氨酰胺作为底物以产生R,R莫那亭。立体转化的转氨酶的非限制的实例包括D-蛋氮酸转氨酶(EC2.6丄41)和具有D-苯基甘氨酸转氨酶活性或者D-4-羟基苯基甘氨酸转氨酶活性的酶。本发明提供了具有醛縮酶活性的肽,所述醛縮酶包括丙酮酸醛縮酶,例如但不限于HMG和/或KHG醛縮酶;本发明还提供了编码所述肽的多核苷酸以及制备和使用这些多核苷酸和多肽的方法。在一些实施方式中,本发明还提供了醛縮酶,例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶;编码这些酶的多核苷酸以及制备和使用这些多核苷酸和多肽的方法。在一些实施方式中,本发明提供了修饰的或者改进的醛縮酶(如丙酮酸醛縮酶、HMG和/或KHG醛縮酶),这些酶分别具有比未修饰或者未改进的醛縮酶更高的比活性。在一些实施方式中,提供了醛縮酶,如丙酮酸醛縮酶,例如但不限于HMG和/或KHG醛缩酶,这些酶有助于制备3,4-取代的2-酮-戊二酸。在一些实施方式中,本发明提供了制备3,4-取代的2-酮-戊二酸的方法,该方法包括(a)提供具有醛缩酶活性的多肽,如丙酮酸醛縮酶活性,例如但不限于HMG和/或KHG醛縮酶活性;(b)提供供体或者受体化合物;和(c)将步骤(a)中的多肽与步骤(b)的化合物在能够使所述醛縮酶催化合成3,4-取代的2-酮-戊二酸的条件下进行接触,其中,任选地,所述供体和受体为丙酮酸或者丙酮酸供体和a-酮酸受体、酮和/或醛。在本发明的另一些实施方式中,可以结合使用丙酮酸醛縮酶(如HMG和/或KHG醛縮酶)与D-转氨酶,以制备4-取代的D-谷氨酸或其衍生物。由于4-取代的D-谷氨酸或其衍生物被发现能用于抑制细菌谷氨酰胺消旋酶的活性,因此,这些化合物可以用作抗生素。在一种实施方式中,本发明提供了一种制备4-取代的D-谷氨酸的方法,该方法包括(a)提供具有醛縮酶活性的多肽,如丙酮酸醛縮酶活性,例如但不限于HMG和/或KHG醛縮酶活性;(b)提供a酮酸受体和丙酮酸或丙酮酸供体;和(c)将步骤(a)中的多肽与步骤(b)的化合物在能够使所述醛縮酶催化合成4-取代的D-谷氨酸的条件下进行接触,其中,任选地,所述多肽具有丙酮酸醛縮酶活性、HMG醛縮酶活性和/或KHG醛縮酶活性,并且,其中,所述方法还任选地包括使用D-转氨酶。在一些实施方式中,本发明提供了含有本发明的酶、多肽或多核苷酸的组合物(例如,酶制剂、食品和食品添加剂、饲料和饲料添加剂、饮料和饮料添加剂、药品和药品添加剂、和膳食补充剂)。这些组合物可以制成多种形式,如液体、凝胶体、丸剂、片剂、喷剂、薄膜、胶束、粉体、食物、饲料球、或者包括纳米包封形式在内的包封的形式。检测醛縮酶(包括丙酮酸醛縮酶,例如但不限于HMG和/或KHG醛縮酶)的活性的方法,例如确定多肽是否具有醛缩酶(包括丙酮酸醛缩酶,例如但不限于HMG和/或KHG醛縮酶)的活性的方法是本领域所公知的,并且属于本发明的范围内;具体参见E.E.Dekker&R.P.Kitson,J.Biol.Chem.267,10507-10514,1992;TahaTS,DeitsTL1Purificationandcharacterizationof2-keto-3-deoxy-6-phosphogluconatealdolasefromAzotobactervinelandii:evidencethattheenzymeisbiflmctionaltowards2-keto-4-hydroxyglutaratecleavage,BiochemBiophysResCommun.1994Apr15;200(l):459-66;DekkerEE,KobesRD,GradySR,2-keto-4-hydroxyglutaratealdolasefrombovineliver,MethodsEnzymol.1975;42:280-5;DekkerEE,NisbiharaH,GradySR,MethodsEnzymol.1975;42:285-90,2-keto-4-hydroxyglutaratealdolasefromEscherichiacoli;NishiharaH,DekkerEE,BiochimBiophysActa.1969Jul8;185(l):255-7,Astereospecific2-keto-4-hydroxyglutaratealdolasefromEscherichiacoli。石角定多肽是否具有醛縮酶(包括丙酮酸,例如但不限于HMG和/或KHG醛縮酶)的活性的合适的方法的一种实例在实施例3中有描述。在一些实施方式中,本发明的醛缩酶可以在不同的pH条件下有效地使用,所述pH条件包括例如约3.0-12.0。在另一些实施方式中,本发明的醛縮酶可以在pH为约3.0、4,0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5、10.0、10.5、11.0、11.5或约12.0的条件下使用。在酸性或者碱性条件下进行反应是有利的,例如,本发明的酶可以应用在一些工业或者药物的应用中。本发明提供了醛缩酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽的多种形式和制剂。在本发明的方法中,本发明的醛缩酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽以多种形式和制剂使用。例如,纯化的醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽以酶制剂的形式应用于制备R-2-羟基-2-(B引哚-3基-甲基)-4-酮戊二酸(R-MP)和莫那亭的某些立体异构体(例如R,R和S,R莫那亭、和它们的盐)的方法中,以及制备莫那亭衍生物的某些立体异构体(如R,R和S,R莫那亭衍生物构型,和它们的盐)的方法中,或者在药物或者膳食辅助应用中。可供选择地,本发明的酶可以直接地应用于制备R-2-羟基-2-(吲哚-3基-甲基)-4-酮戊二酸(R-MP)和莫那亭的某些立体异构体(例如R,R和S,R莫那亭、和它们的盐)的方法中,以及制备莫那亭衍生物的某些立体异构体(如R,R和S,R莫那亭衍生物构型、和它们的盐)的方法中,以及制备食物、液体或者饲料等的方法中。在一些实施方式中,可以使用本领域公知的方法在微生物中表达本发明的醛缩酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽。在一些实施方式中,可在将本发明的醛缩酶(例如丙酮酸醛缩酶,如HMG和/或KHG醛縮酶)多肽用于本发明的方法中之前,将其固定到固体支持物上。将酶固定到固体支持物上的方法是本领域通常公知的,例如,J.Mol.Cat.B:Enzymatic6(1999)29-39;Chivataetal.Biocatalysis:Immobilizedcellsandenzymes,JMol.Cat.37(1986)1-24:Sharmaetal.,ImmobilizedBiomaterialsTechniquesandApplications,Angew.Chem.Int.Ed.Engl.21(1982)837-54:Laskin(Ed.),EnzymesandImmobilizedCellsinBiotechnology。核酸、探针和抑制分子本发明提供了分离的、重组的核酸,参见序列表;提供了编码多肽的核酸,包括本发明的多核苷酸序列,参见序列表;提供了包括本发明的核酸的表达盒,如表达载体和各种克隆载体。在一些实施方式中,本发明还包括使用本发明的核酸来发现、鉴定或分离新的醛缩酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)多肽序列的方法。在一些实施方式中,本发明还包括使用本发明的核酸来抑制醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的编码基因的表达和转录的方法。还提供了用于修饰本发明的核酸的方法,该方法包括通过例如人工连接再装酉己(syntheticligationreassembly)、优化的指导进化体系(optimizeddirectedevolutionsystem)和/或饱和诱变(如基因位点饱和诱变(GSSM))来制备本发明的核酸的各种变体。术语"饱和诱变"、基因位点饱和诱变或者"GSSM"包括使用简并寡核苷酸引物在多核苷酸中引入点突变的方法,这将在下文详细描述。术语"优化的指导进化体系"或者"优化的指导进化"包括将相关的核酸序列(如相关的基因)的片段重新装配的方法,这将在下文详细解释。术语"人工连接再装配"或者"SLR"包括以非随机的方式连接寡核苷酸片段的方法,这将在下文详细解释。术语"变体"是指本发明的多核苷酸或者多肽在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基(分别地)修饰后仍然保持本发明的醛縮酶(例如丙酮酸醛縮酶,HMG和/或KHG醛縮酶)的生物活性。可以通过各种方式来制备变体,所述方式包括如易错PCR、改组(shuffling)、寡核苷酸定向变异、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归总体诱变(recursiveensemblemutagenesis)、指数总体诱变(exponentialensemblemutagenesis)、^立点年寺异性诱变、基因装酉己、GSSM及它们的任意组合。可以通过如cDNA文库的克隆和表达、用PCR扩增信息或基因组DNA等方法,制备、分离和/或操作本发明的核酸。例如,本发明的序列最初来源于环境源。因此,在一些实施方式中,本发明提供了编码醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的核酸,和由这些核酸编码的多肽,这些物质优选来自于普通的来源,例如环境源、混合培养物或细菌源。在实施本发明的方法时,可以通过按照本文所述的方法来操作模板核酸以修饰相似的基因。在一些实施方式中,可以结合本领域任何的方法或方案或设备来实施本发明,在科学文献和专利文献中详细地描述了本领域任何的方法或方案或设备。本文中所使用的短语"核酸"或者"核酸序列"是指寡核苷酸、核苷酸、多核苷酸,或者是指它们的任何片段、基因组或者合成的DNA或RNA,它们可以是单链或者双链的,并且可以是正义链或者反义(互补)链,肽核酸(PNA)、或者任何DNA类似的或者RNA类似的物质、天然或者合成的来源。短语"核酸"或者"核酸序列"包括寡核苷酸、核苷酸、多核苷酸、或者是指它们的任何片段、基因组或者合成的DNA或RNA(如mRNA、rRNA、tRNA、iRNA),它们可以是单链或者双链的,并且可以是正义链或者反义(互补)链,肽核酸(PNA)、或者任何DNA类似的或者RNA类似的物质、天然或者合成的来源,包括如iRNA、核蛋白(如双链iRNAs,如iRNPs)。所述术语包括核酸,即含有天然核苷酸的已知相似物的寡核苷酸。所述术语还包括具有合成骨架结构的核酸类似物,参见如Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。"寡核苷酸"包括单链聚脱氧核苷酸链或者两个互补的聚脱氧核苷酸链,它们可以由化学合成得到。这种合成的寡核苷酸不具有5'磷酸,因而在激酶的存在下如果不加入ATP来引入磷酸,则不会连接至另一个寡核苷酸。合成的寡核苷酸可以连接至未去磷酸化的片段。一种具体多肽或蛋白质的"编码序列"或者"编码一种具体多肽或蛋白质的核苷酸序列"是一种核酸序列,当置于适当的调节序列的控制下时该核酸序列可以被转录和翻译成多肽或蛋白质。术语"基因"是指涉及制备多肽链的DNA片段;它包括编码区前后的区域(前导区和尾区),以及适当的话,在单个编码片段(外显子)之间的插入序列(内含子)。启动子序列"可操作地连接到"编码序列上,能引发转录的RNA聚合酶在启动子的作用下将编码序列转录成mRNA。本文中所使用的"可操作地连接"是指两个和多个核酸(如DNA)片段之间的功能连接。它可以为转录调节序列和转录序列之间的功能关系。例如,如果启动子能刺激和调节编码序列在适当的宿主细胞或者其它表达系统中转录,则启动子被操作地连接到编码序列(如本发明的核酸)上。通常,能够可操作地连接到转录序列的启动子转录调节序列与转录序列的位置接近,即它们是顺式作用。然而,一些转录调节序列(如增强子),则不需要与由该增强子增强转录的编码序列在位置上接近。本文使用的术语"表达盒"是指能影响结构基因(即,编码蛋白的序列,所述蛋白如本发明的醛縮酶,例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)在能兼容该序列的宿主中的表达的核苷酸序列。所述表达盒包括至少一个可操作地连接到编码所述多肽的序列的启动子;和任选的其它序列(例如转录终止信号)。还可以使用对影响表达必需的或者有用的因子,如增强子、oc-因子。因此,所述表达盒还可以包括质粒、表达载体、重组病毒、重组"裸露DNA"载体的任何形式等。"载体"包括能传染、感染、短暂地或永久地转化细胞的核酸。应该认识到,所述载体可以是裸露的核酸、或者与蛋白质或者脂质复合的核酸。所述载体任选地包括病毒或者细菌核酸和/或蛋白质、和/或膜(如细胞膜、病毒脂质膜等)。所述载体包括但不限于复制子(如RNA复制子、噬菌体),DNA片段可以连接到复制子上并被复制。因此,所述载体包括但不限于RNA、自主复制的环状或线性的DNA或RNA(如质粒、病毒等,参见美国专利No.5,217,879),并且包括表达或非表达的质粒。当重组微生物或者细胞培养物作为"表达载体"的宿主时,所述表达载体包括染色体外的环状或者线性DNA和整合到宿主细胞染色体中的DNA。当所述载体由宿主细胞维持时,所述载体可以由细胞在有丝分裂时作为自主结构而稳定地进行复制,或者被整合到宿主基因组中进行复制。本文中所使用的术语"重组"包括连接到"骨架"核酸上的核酸,而这些"骨架"核酸在天然环境中没有被连接。在一些实施方式中,待"富集的"核酸的存在量为核酸骨架分子群体中的核酸插入物数量的约5%或者更多。本发明的骨架分子为包括表达载体、自主复制的核酸、病毒、整合核酸和其它用于维持或操作感兴趣的核酸插入物的核酸在内的核酸。在一些实施方式中,富集的核酸的存在量为重组骨架分子群体中的核酸插入物数量的约15%或者更多。在一些实施方式中,富集的核酸的存在量为重组骨架分子群体中的核酸插入物数量的约50%或者更多。在一些实施方式中,富集的核酸的存在量为重组骨架分子群体中的核酸插入物数量的约90%或者更多。本发明的一个实施方式提供了一种分离的、合成的或者重组的核酸,该核酸包括一种本发明的序列,或者包括本发明的核酸的片段,该片段含有本发明的核酸的至少IO、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多个的连续的碱基。所述分离的、合成的或者重组的核酸可以包括DNA,该DNA包括cDNA、基因组DNA和合成的DNA。DNA可以是双链的或者单链的,并且如果是单链,该单链可以是编码链或者非编码(反义)链。或者,所述分离的、合成的或者重组的核酸包括RNA。本发明的分离的、合成的或者重组的核酸可以用于制备一种本发明的多肽,或者片段,该片段含有本发明的一种多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或更多个的连续的氨基酸。因此,本发明的另一种实施方式提供了分离的、合成的或者重组的核酸,该核酸编码本发明的一种多肽,或者片段,该片段含有本发明的一种多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或更多个的连续的氨基酸。这些核酸的编码序列可以与本发明的一种核酸的编码序列相同,或者与编码具有本发明的一种多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或更多个的连续的氨基酸的本发明的一种序列的编码序列不同,这是由于遗传密码子的冗余或者简并所导致的。遗传密码子是本领域的技术人员所公知的,并且可以获得,如在B.Lewin编写的GenesVI,OxfordUniversityPress,1997的第214页。编码本发明的一种多肽的分离的核酸和与该核酸序列基本一致的核酸可以包括但不限于本发明核酸的编码序列和附加编码序列(如前导序列或者前体蛋白序列);和非编码序列(如内含子或编码序列的5'和/或3'端的非编码序列)。因此,本文所使用的术语"编码多肽的多核苷酸"包括含有多肽的编码序列的多核苷酸以及含有附加编码序列和/或非编码序列的多核苷酸。或者,本发明的核酸序列和与该核酸序列基本一致序列可以通过常规的技术(如定点诱变)或者本领域技术人员熟知的其它技术,将沉默变化引入本发明的多核苷酸中。本文中所使用的"沉默变化"包括,例如,不改变由该多核苷酸编码的氨基酸序列的变化。为了增加通过引入经常存在于宿主生物体中的密码子或者密码子对而由含有编码所述多肽的载体的宿主所产生的多肽的水平,这种变化是符合需要的。本发明还涉及具有改变的核苷酸的多核苷酸,所述改变导致了本发明的多肽中的氨基酸取代、增加、删除、融合和转位。可以使用包括位点指导诱变、随机的化学诱变、核酸外切酶III的删除和其它重组DNA技术在内的技术来产生这种核苷酸的变化。或者,这种核苷酸的改变可以是天然存在的等位基因的变体;可以通过识别核酸来分离这种等位基因的变体;在本文提供的很高的、中等的、或低等的严格条件下,识别出的核酸能够与含有本发明的一种序列(或者与它互补的序列)的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续的碱基的探针专一地杂交。普通技术用于实施本发明的核酸,不管是RNA、siRNA、miRNA、反义核酸、cDNA、基因组DNA载体、病毒还是它们的混合物,都可以从不同的来源中分离出、被遗传工程化、被扩增、和/或被表达/重组地产生。从这些核酸中产生的重组多肽(如醛縮酶,例如丙酮酸醛縮酶,如HMG禾B/或KHG醛縮酶)可以单独地分离或克隆并检测所需要的活性。可以使用任何重组表达系统,这种系统包括细菌的、哺乳动物的、酵母的、昆虫的或者植物细胞的表达系统。或者,可以通过众所周知的化学合成技术在体外合成这些核酸,所述的化学合成技术描述在例如Adams(1983)J.Am.Chem.Soc.105:661;Belousov(1997)NucleicAcidsRes.25:3440-3444;Frenkel(1995)FreeRadic.Biol.Med.19:373-380;Blommers(1994)Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol.68:卯;Brown(1979)Meth.Enzymol.68:109;Bea腦ge(1981)Tetra.Lett.22:1859;美国专利No.4,458,066。操作核酸的技术,如亚克隆、标记探针(如使用克列偌(Klenow)酶、缺口翻译、扩增的随机引物标记)、测序、杂交等,在科学和专利文献中有详细的描述,参见Sambrook,ed.,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),Vols.1-3,ColdSpringHarborLaboratory,(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY,A画bel,ed.JohnWiley&Sons,Inc.,NewYork(1997);LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)。获得并操作用于实施本发明的方法的核酸的另一种有用的方式是从基因组样品中进行克隆,并且,如果需要,对例如从基因组克隆中或者cDNA克隆中分离的或扩增的插入物进行筛选并再次进行克隆。用于本发明方法的核酸的来源包括基因组或者cDNA文库,这些基因组或者cDNA文库包含在哺乳动物人造染色体(MAC)中,参见Rosenfeld(1997)Nat.Genet.15:333-335;酵母人造染色体(YAC)中;细菌人造染色体(BAC)中;PI人造染色体中,参见Woon(1998)Genomics50:306-316;来源于PI的载体(PACs),参见Kern(1997)Biotechniques23:120-124;粘粒、重组病毒、噬菌体或者质粒中。在一些实施方式中,编码本发明多肽的核酸能够以适当的方式与能够定向分泌翻译的多肽或其片段的前导序列进行组装。本发明提供了融合蛋白和编码该融合蛋白的核酸。本发明的多肽可以融合到异源的肽或者多肽上,如N-末端识别肽,这种N-末端识别肽被赋予了所需要的特性,例如增强的稳定性或者简化的纯化性能。本发明的肽或者多肽还可以被合成,并作为具有连接在其上的一个或多个附加结构域的融合蛋白而被表达,例如产生免疫原性更强的肽,从而更易于分离出重组合成的肽,以对抗体和表达抗体的B细胞等进行识别和分离。能够促进检测和纯化的结构域包括,例如金属螯和肽,如能在固定的金属上纯化的聚组氨酸段和组氨酸-色氨酸模型、能在固定的免疫球蛋白上纯化的蛋白A结构域、和在FLAGS延伸/亲和纯化系统(ImmunexCorp,SeattleWA)中使用的结构域。位于纯化结构域和含有肽或者多肽的基序之间的可切割的接头序列的包含物(如Xa因子或者肠激酶(Invitrogen,Carlsbad,CA))有助于纯化。例如,表达载体可以包括连接于六个组氨酸残基的编码抗原决定簇的核酸序列,所述六个组氨酸残基之后为硫氧还蛋白和肠激酶的酶切位点(参见,例如Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif.12:404-414)。所述组氨酸残基有助于检测和纯化,而肠激酶的酶切位点提供了从融合蛋白的剩余部分中提纯抗原决定簇的方法。编码融合蛋白和使用融合的固有技术详细描述在科学和专利文献中,参见,如Kroll(1993)DNACell.Biol.,12:441-53。转录和翻译控制序列本发明提供了可操作地连接到表达(如转录或翻译)控制序列(如启动子或增强子)的本发明的核酸(如DNA)序列,以控制或调节RNA的合成/表达。所述表达控制序列可以位于表达载体中。细菌启动子的实例包括lacl、lacZ、T3、T7、gpt、XPR、PL和trp。真核生物启动子的实例包括早早期CMV、HSV胸腺嘧啶激酶、早期和晚期SV40、来自逆转录病毒的LTRs和小鼠金属硫蛋白I。本文中所使用的术语"启动子"包括所有能推动编码序列在细胞(如植物或动物细胞)中转录的序列。因此,本发明的构建体中所使用的启动子包括顺式作用转录控制元件和涉及调节或操纵基因转录的时间和/或速度的调节序列,例如,启动子可以是顺式作用转录控制元件,该顺式作用转录控制元件包括涉及转录调控的增强子、启动子、转录终止子、复制起始(originofreplication^染色体整合序列、5,和3'非翻译区、或者内含子序列。这些顺式作用元件与蛋白质或者其它生物分子相互作用以实现(启动/终止、调节、调制等)转录。"组成型"启动子是在大多数环境条件下以及发育状态中或者细胞分化中能够驱动连续表达的那些启动子。"可诱导的"或者"可调节的"启动子在环境条件和发育条件的影响下指导本发明的核酸的表达。能够影响由可诱导启动子驱动的转录的环境调节的实例包括厌氧条件、增加的温度、干旱或者光的存在。"组织特异性的"启动子是指仅在某些特定的细胞或器官(例如动物或者植物的)中具有活性的转录控制元件。组织特异性调节可以通过某些内部因子而获得,所述内部因子确保对给定的组织具有特异性的蛋白的编码基因能够表达。已知这些因子存在于哺乳动物和植物中,以使特定组织发育。适合在细菌中表达多肽的启动子包括大肠杆菌lac或者trp启动子、lacl启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、人PR启动子、人PL启动子、来自编码糖酵解酶(如3-磷酸甘油酯激酶(PGK))的操纵子的启动子、和酸性磷脂酶启动子。真核启动子包括早早期CMV、HSV胸腺嘧啶激酶、热休克启动子、早期和晚期SV40、来自逆转录病毒的LTRs和小鼠金属硫蛋白I启动子。还可以使用其它已知的能够控制基因在原核细胞或者真核细胞或者它们的病毒中表达的启动子。适合在细菌中表达多肽或它们的片段的启动子包括大肠杆菌lac或者trp启动子、lacl启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、人PR启动子、XPL启动子、来自编码糖酵解酶(如3-磷酸甘油酯激酶(PGK))的操纵子的启动子、和酸性磷脂酶启动子。真菌启动子包括oc-因子启动子。真核启动子包括早早期CMV、HSV胸腺嘧啶激酶、热休克启动子、早期和晚期SV40、来自逆转录病毒的LTRs和小鼠金属硫蛋白I启动子。还可以使用其它已知的能够控制基因在原核细胞或者真核细胞或者它们的病毒中表达的启动子。组织特异性植物启动子本发明提供了表达盒,该表达盒以组织特异性的方式表达,如以组织特异性的方式表达醛縮酶(例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)。在一些实施方式中,本发明还提供了能以组织特异性的方式表达本发明的醛缩酶(例如丙酮酸醛縮酶、HMG和/或KHG醛縮酶)的植物或种子。所述组织特异性可以是种子特异性的、茎特异性的、叶特异性的、根特异性的、果实特异性的等。术语"植物"包括整个植物、植物部分(比如叶、茎、花、根等)、植物原生质体、种子和植物细胞及其子代。可用于本发明方法的植物类别一般与适合于转化技术的更高级植物一样宽泛,包括被子植物(单子叶植物和双子叶植物)以及裸子植物。它包括各种倍性水平的植物,包括多倍体、二倍体、单倍体和半合子态。如本文所使用的,术语"转基因植物"包括其中插入有异源核酸序列的植物或植物细胞,如本发明的核酸和各种重组构建体(比如表达盒)。.在一些实施方式中,组成型启动子(如CaMV35S启动子)可以用于在植物和种子或整个植株的特定部位表达。例如,为了过表达,可以使用植物启动子片段,该植物启动子片段能够引导核酸在植株(如再生植株)的一些组织或者所有组织中表达。在本文中这种启动子被称为"组成型"启动子,并且在大多数环境条件下以及发育状态中或细胞分化中是具有活性的。组成型启动子的实例包括花椰菜花叶病毒(cauliflowermosaicvims)(CaMV)35S转录引发区域(transcriptioninitationregion)、来源于根癌土壤杆菌(Agrobacteriumtumefaciens)的T-DNA的l'-或者2'-启动子、和来源于本领域技术人员公知的各种植物基因的其它转录引发区域。这种基因包括,如来源于拟南芥的ACTll(Huang(1996)PlantMot.Biol.33:125-139);来源于拟南芥的Cat3(基因库No.U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);来源于油菜的编码硬脂酰-酰基载体蛋白脱氢酶的基因(基因库No.X74782,Solocombe(1994)PlantPhysiol.104:1167-1176);来自玉米的GPc1(基因库No.X15596;Martinez(1989)J.Mol.Biol208:551-565);来自玉米的Gpc2(基因库No.U45855,Manjunath(1997)PlantMol.Biol.33:97-112);在美国专利No.4,962,028、No.5,633,440中描述的植物启动子。本发明使用来自病毒的组织特异性启动子或者组成型启动子,该启动子包括烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl.Acad.Sci.USA92:1679-1683;仅在感染的水稻植株的韧皮细胞中复制的东格鲁杆状病毒(thericetungrobacilliformvirus,RTBV)的启动子,该启动子推动强的韧皮部分特异性的报告基因的表达;木薯茎花叶病毒(CVMV)启动子,该启动子在管状组织、叶肉细胞、和根端(roottips)具有很高的活性(Verdaguer(1996)PlantMol.Biol.31:1129-1139)。在一些实施方式中,植物启动子控制表达醛縮酶(如丙酮酸醛缩酶,例如HMG和/或KHG醛縮酶)的核酸在特定的组织、器官或细胞型(即组织特异性启动子)中的表达,或者在精确的环境的或者发育控制下,或者在可诱导型启动子的控制下可以是以其它方式起作用。能影响转录的环境条件的实例包括厌氧条件、增加的温度、光的存在、或者用化学物质/激素的喷雾。例如,本发明结合使用了玉米的干旱诱导型启动子(Busk(1997)supra);和番茄的冷、干旱和高盐诱导型启动子(Kirch(1997)PlantMol.Biol.33:897909)。在一些实施方式中,组织特异性启动子仅在特定的组织中在发育的特定时间阶段推动转录。参见Blazquez(1998)PlantCell10:791-800,该文献描述了拟南芥LEAFY基因启动子的特点。还可以参见Cardon(1997)PlantJ12:367-77,该文献描述了转录因子SPL3,该转录因子识别拟南芥的花分生组织识别基因API的启动子区域的保守序列基序;以及在Mandel(1995)PlantMolecularBiology,Vol.29,pp995-1004中描述了分生组织启动子eIF4。可以使用在特定组织的整个生命周期中都具有活性的组织特异性启动子。在一些实施方式中,本发明的核酸被可操作地连接到仅在棉花纤维细胞中具有活性的启动子上。在一些实施方式中,本发明的核酸被可操作地连接到主要在棉花纤维细胞伸长阶段时具有活性的启动子上,如Rinehart(1996)supra的描述。可以将核酸可操作地连接到Fbl2A基因启动子上,以在棉花纤维细胞(Ibid)中优先表达。还可以参见John(1997)Proc.Natl.Acad.Sci.USA89:5769-5773;John等,美国专利No.5,608,148禾f]No.5,602,321,这些专利描述了棉花纤维特异性启动子以及构建转基因棉花植株的方法。还可以使用根特异性启动子,以表达本发明的核酸。根特异性启动子的实例包括来自醇脱氢酶基因的启动子(DeLisle(1990)Int.Rev.Cytol.123:39-60)。可以用于表达本发明的核酸的其它启动子包括例如卵特异性的启动子、胚胎特异性的启动子、胚乳特异性的启动子、珠被特异性的启动子、种子表皮特异性的启动子、或者它们的一些组合;叶特异性的启动子(见Busk(1997)PlantJ.11:12851295,该文献描述了玉米中的叶特异性的启动子);来自毛根农杆菌(Agrobacteriumrhizogenes)的ORF13启动子(该启动子在根中具有高活性,参见Hansen(1997)supra);玉米花粉特异性的启动子(见Guerrero(1990)Mol.Gen.Genet.224:161168);可以使用在水果成熟、叶子衰老和切断时具有活性的番茄启动子,和在花衰老和切断时具有较低活性的番茄启动子(见Blume(1997)PlantJ.12:731746);来自番茄SK2基因的雌蕊特异性的启动子(见Ficker(1997)PlantMol.Biol.35:425431);来自豌豆的Blec4基因,该基因在转基因紫花苜蓿的植物顶端和花柄顶端的表皮组织中具有活性,这使得该基因成为将外源基因靶向到生长活跃的顶端或者纤维的表皮层中表达的有用工具;卵特异性BEL1基因(见Reiser(1995)Cell83:735-742,GenBankNo.U39944);和/或在由Klee在美国专利No.5,589,583中描述的启动子,该文献描述了植物启动子区域能赋予在分生组织和/或快速分裂的细胞中高水平地转录的活性。在一些实施方式中,使用暴露于植物激素(如生长素)时可被诱导的植物启动子来表达本发明的核酸。例如,本发明可以使用在大豆中响应生长素的元件E1启动子片段(AuxREs)(GlycinemaxL.)(Liu(1997)PlantPhysiol.115:397-407);响应生长素的拟南芥GST6启动子(该启动子还响应水杨酸和过氧化氢)(Chen(1996)PlantJ.10:955-966);来自烟草中的生物素诱导的parC启动子(Sakai(1996)PlantCellPhysiol.37:906-913);植物生物素响应元件(Streit(1997)Mol.PlantMicrobeInteract.10:933-937);和响应应急激素脱落酸的启动子(Sheen(1996)Science274:1卯0-1902)。还可以将本发明的核酸可操作地连接到暴露于可以施用于植物的化学试剂如除草剂或抗生素时可被诱导的启动子上。例如,可以使用受苯磺酰氨除草剂安全剂激活的玉米ln2-2启动子(DeVeylder(1997)PlantCellPhysiol.38:568-577);使用不同的除草剂安全剂来诱导不同的基因表达模式,该表达模式包括在根部、排水器(hydathodes)和柄顶端的分生组织中表达。编码序列可以在例如可由四环素诱导的启动子的控制下表达,如描述的含有饮用燕麦(AvenasativaL.)精氨酸脱羧酶基因的转基因烟草植物(Masgrau(1997)PlantJ.11:465-473);或者响应水杨酸的元件(Stange(1997)PlantJ.11:1315-1324)。使用化学(如激素或者杀虫剂)诱导的启动子,即响应于能施用于本领域的转基因植物的启动子,可以使本发明的多肽在植物发育的特定阶段被诱导表达。因此,本发明还提供了含有可诱导的编码本发明多肽的基因的转基因植物,所述可诱导的编码本发明多肽的基因在农作物的任何发育阶段都是可诱导的,并且所述可诱导的编码本发明多肽的基因的宿主限制于靶植物种类,如玉米、水稻、大麦、大豆、番茄或其它农作物。本领域的技术人员将会认识到,所述组织特异性的植物启动子可以驱动可操作连接的除靶组织外的其它组织中的序列的表达。因此,在一些实施方式中,所述组织特异性的启动子是能够驱动优先在靶组织或细胞型中表达的启动子,但也可以在其它组织中导致一定水平的表达。本发明的核酸还可以可操作地连接到在暴露于化学试剂时可被诱导的植物启动子上。这些化学试剂包括,例如除草剂、合成的生长素、或者可以施用(例如喷雾)到转基因植物上的抗生素。本发明的产生醛縮酶(如丙酮酸醛缩酶,如HMG和/或KHG醛缩酶)的核酸的可诱导表达使栽培者可以选择具有最佳的醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的表达和/或活性的植物。因此,可以控制植物部分的发育。本发明以这种方式提供了能够促进收获植物或者植物的部分的方法。例如,在各种实施方式中,使用被苯磺酰氨除草剂安全剂激活的玉米In2-2启动子(DeVeylder(1997)PlantCellPhysiol.38:568-577);使用不同的除草剂安全剂诱导不同的基因表达模式,该表达模式包括在根部、排水器和柄顶端分生组织中表达。本发明的编码序列还可以在如可由四环素诱导的启动子的控制下表达,如描述的含有饮用燕麦精氨酸脱羧酶基因的转基因烟草植物(Masgrau(1997)PlantJ.11:465-473);或者响应水杨酸的元件(Stange(1997)PlantJ.11:1315-1324)。在一些实施方式中,适当的多肽的表达可能需要位于编码区的3'末端的多腺苷化区域。这种多腺苷化区域可以来源于天然的基因、来源于其它植物的(或者动物的或者其它的)基因、或者来源于农杆菌(Agrobacterial)T-DNA中的基因。表达载体和克隆载体本发明提供了表达载体和含有本发明的核酸的克隆载体,例如编码本发明的醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛缩酶)的序列。所述表达载体和含有本发明的核酸的克隆载体包括病毒颗粒、烟草花叶病毒、噬菌体、质粒、噬菌粒、粘粒、福斯质粒、细菌人造染色体、病毒DNA(如牛痘、腺病毒、畜痘病毒(foulpoxvirus)、狂犬病毒和SV40的衍生物)、基于Pl的人造染色体、酵母质粒、酵母人造染色体和对感兴趣的特异性宿主(如细菌、曲霉菌和酵母)具有特异性的任何其它载体。本发明的载体可以包括染色体、非染色体和合成的DNA序列。大量的合适的载体是本领域技术人员所公知的,并且是可以商购的。所述载体的实例包括细菌的pQEtm载体(Qiagen,Valencia,CA)、pBLUESCRIPT质粒、pNH载体、人-ZAP载体(Stratagene,LaJolla,CA);ptrc99a、pKK223-3、pDR540、pRIT2T(GEHealthcare,Piscataway,NJ)、pET载体(Novagen,Madison,WI);真核的pXTl、pSG5(Stratagene,LaJolla,CA)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,可以使用任何其它的质粒或其它的载体,只要它们在宿主中能够复制并存活即可。在本发明中可以使用低拷贝或者高拷贝的的载体。"质粒"可以通过商购获得、无任何限制地公开获得,或者根据公开的方法从可以获得的质粒中构建得到。与本文中描述的质粒相当的质粒是本领域公知的,并对于本领域的普通技术人员来说是显而易见的。所述表达载体可以包括启动子、用于引发翻译的核糖体结合位点和转录终止子。所述载体还可以包括用于扩增表达的适当的序列。哺乳动物的表达载体可以包括复制起始部分、任何必需的核糖体结合位点、多腺苷化位点、剪接供体和受体位点、转录终止序列和5'端非转录序列。在一些实施方式中。可以使用来自SV40剪接的DNA序列和多腺苷化位点,以提供所需要的非转录基因元件。在一些实施方式中,所述表达载体含有一种或多种选择性标记基因,以允许对含有载体的宿主细胞进行选择。这种选择性标记包括编码二氢叶酸还原酶的基因或者能赋予培养的真核细胞以新霉素抗性的基因、能赋予大肠杆菌以四环素或者氨苄青霉素抗性的基因、和酿酒酵母(S.cerevisiae)TRP1基因。使用氯霉素转移酶(CAT)载体或者具有选择标记的其它载体从所需要的基因中选择启动子区域。在一些实施方式中,用于在真核细胞中表达所述多肽或它们的片段的载体包括增强子,以提高表达的水平。增强子是顺式作用的DNA元件,所述增强子的长度可以为约10-300bp。它们可以对启动子起作用,以提高启动子的转录作用。所述增强子的实例包括位于复制起点后侧的100-270bp的SV40增强子、细胞巨化病毒的早期启动子的增强子、位于复制起点后侧的多瘤病毒增强子、和腺病毒增强子。可以通过各种方法将核酸序列插入到载体中。通常,在消化插入物和具有适当限制性核酸内切酶位点的载体后,将所述序列连接到载体中的所期望的位点。或者,可以将插入物和载体的平末端连接。各种克隆技术是本领域公知的,例如由Ausubel等在CurrentProtocolsinMolecularBiologyJohnWiley&Sons,Inc.1997中描述的技术,禾卩Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。这些方法和其它的方法属于本领域技术人员所了解的范围。所述载体的形式可以是质粒、病毒颗粒或者噬菌体。其它载体包括染色体的、非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒、噬菌体DNA、烟草花叶病毒、酵母质粒、来自质粒和噬菌体DNA的组合载体、病毒DNA(如牛痘、腺病毒、畜痘病毒和狂犬病毒)。例如Sambrook描述了多种用于原核和真核宿主的克隆载体和表达载体。可以使用的特殊的细菌载体包括可以商购的含有公知的克隆载体的遗传元件的质粒,所述公知的克隆载体包括pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)pQE70、pQE60、pQE-9(Qiagen,Valencia,CA)、pD10、psiX174pBLUESCRIPTIIKS、pNH8A、pNH64a、pNH18A、pNH46A(Stratagene,LaJolla,CA)、ptrc99a、pKK223-3、pKK233陽3、DR540、pRIT5(Pharmacia)、pKK232-8、pET(Novagen,Madison,WI)和pCM7。特殊的真核细胞载体包括pSV2CAT、pOG44、pXTl、pSG(Stratagene,LaJolla,CA)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何其它的载体,只要它在宿主细胞中可以复制并存活即可。本发明的核酸可以在表达盒、载体或者病毒中表达,并且可以瞬时地或者稳定地在植物细胞和种子中表达。一种示例性的瞬时表达系统使用游离表达系统,如在核中由含有超螺旋DNA的游离小染色体的转录而产生的花椰菜花叶病毒(CaMV)病毒RNA,参见Covey(1990)Proc.Natl.Acad.Sci.USA87:1633-1637。或者将编码序列,即本发明的序列的所有或者亚片段插入到植物宿主细胞基因组中成为宿主细胞染色体整合的一部分。正义或者反义转录物可以以这种方式表达。含有来自本发明核酸的序列(如启动子或者编码区)的载体可以包括标记基因,该标记基因赋予植物细胞或者种子以可选择的表型。例如,所述标记可以编码生物杀灭剂耐性的物质,如抗生素耐性、卡那霉素耐性、G418耐性、增光霉素耐性、潮霉素耐性,或者除草剂耐性(如氯磺隆(chlorosulfUron)或者巴斯达(Basta)耐性)。能够在植物中表达核酸和蛋白质的表达载体是本领域公知的,它们可以包括,例如,以下来源的载体农杆菌属、番茄病毒X(见Angell(1997)EMBOJ.16:3675-3684)、烟草花叶病毒(见Casper(1996)Gene173:69-73)、番茄从矮病毒(见Hillman(1989)Virology169:42-50)、烟草蚀纹病毒(见Dolja(1997)Virology234:243-252)、豆金色花叶病毒(见Morinaga(1993)MicrobiolImmunol.37:471-476)、花椰菜花叶病毒(见Cecchini(1997)Mol.PlantMicrobeInteract10:1094-1101)、玉米Ac/Ds转座子(见Rubin(1997)Mol.Cell.Biol.17:6294-6302;Kunze(1996)Curr.Top.Microbiol.Immunol.204:161-194)、禾口玉米抑制基因-增变基因(Spm)转座子(见Schlappi(1996)PlantMol.Biol.32:717-725)、和它们的衍生物。在一些实施方式中,所述表达载体具有两种复制系统以使该表达载体能在两种生物体中起作用,例如,在用于表达的哺乳动物或者昆虫细胞中以及在用于克隆可扩增的原核生物的宿主中。此外,为了整合表达载体,该表达载体可以含有至少一种与宿主基因组同源的序列。所述表达载体可以含有两种同源的序列,该同源序列可以在侧面与表达构建体连接。可以通过在所述载体中选择适当的同源序列,以使整合载体定向到宿主细胞中的特定的位点。用于整合载体中的构建体(construct)是本领域公知的。本发明的表达载体还可以包括选择性标记基因,以对已转化的细菌菌株进行筛选,例如,能赋予细菌对氨苄青霉素、氯霉素、红霉素、卡那霉素、新霉素、和四环素的耐药性的基因。所述选择性标记还可以包括生物合成的基因,如在组氨酸、色氨酸和亮氨酸的生物合成途径中参与生物合成的基因。所述表达载体中的DNA序列被可操作地连接到适当表达控制序列(启动子)上,以控制RNA的合成。特别指定的细菌启动子包括lacl、lacZ、T3、T7、gpt、入PR、PL和trp。真核启动子包括早早期CMV、HSV胸腺嘧啶激酶、早期和晚期SV40、来自逆转录病毒和小鼠金属硫蛋白-I的LTRs。合适的载体和启动子的选择是本领域普通技术人员公知的。所述表达载体还包括用于转录起始的核糖体结合位点和转录终止子。所述载体还可以包括用于扩增表达的适当的序列。启动子区域可以选自使用氯霉素转移酶(CAT)载体或其它具有选择性标记的任何感兴趣的基因中。此外,在一些实施方式中的表达载体含有一种或多种选择性标记基因以提供对转化的宿主细胞进行选择的表型特性,所述选择性标记基因如编码二氢叶酸还原酶的基因、赋予培养的真核细胞对新霉素的耐药性的基因,或者赋予大肠杆菌对四环素或者氨节霉素的耐药性的基因。哺乳动物表达载体还可以包括复制起点、任何必要的核糖体结合位点、多腺苷酸化位点、剪接供体和受体位点、转录终止序列和5'侧翼非转录序列。在一些实施方式中,来自SV40剪接和多腺苷酸化的DNA可以用于提供所需要的非转录基因元件。用于在真核细胞中表达多肽或者多肽片段的载体可以含有能够提高表达水平的增强子。所述增强子是DNA的顺式作用元件,长度通常为约10-300bp,所述增强子作用于启动子以增强启动子的转录能力,所述增强子的实例包括位于复制起点后侧的100-270bp的SV40增强子、细胞巨化病毒的早期启动子增强子、位于复制起点后侧的多瘤病毒增强子、和腺病毒增强子。此外,所述表达载体可以含有一种或多种选择性标记基因以对含有所述载体的宿主细胞进行筛选。所述选择性标记基因包括编码二氢叶酸还原酶的基因或者编码赋予培养的真核细胞对新霉素的耐药性的基因,赋予大肠杆菌对四环素的耐药性的基因和酿酒酵母TRP1基因。在一些实施方式中,编码本发明的一种多肽、与该多肽基本上相似的序列、或者含有该多肽的至少约5、10、15、20、25、30、35、40、50、75、100或者150或者更多个的组成型氨基酸的片段的核酸以适当的方式进行组装,并具有能够控制翻译后多肽或者它们的片段的分泌的前导序列。在一些实施方式中,所述核酸能编码融合多肽,在该融合多肽中,本发明的一种多肽、或者含有该多肽至少约5、10、15、20、25、30、35、40、50、75、100或者150或者更多个组成型氨基酸的片段被融合到异源的肽或者多肽上,如能赋予所需要的特性(如增强的稳定性或者简化纯化)的N-末端相同的肽。可以通过各种方法将合适的DNA序列插入到载体中。通常,用适当的限制性内切酶将插入物和载体消化后,将DNA序列连接到所述载体上。或者,可以将插入物和载体的平末端连接。各种克隆技术是本领域公知的,例如由Ausubel等在CurrentProtocolsinMolecularBiologyJohnWiley&Sons,Inc.1997中描述的技术和Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。这些方法和其它的方法属于本领域技术人员所了解的范围。所述载体的形式可以是质粒、病毒颗粒或者噬菌体。其它载体包括染色体的、非染色体的和合成的DNA序列、SV40的衍生物;细菌质粒、噬菌体DNA、烟草花叶病毒、酵母质粒、来自质粒和噬菌体DNA的组合载体、病毒DNA(如牛痘、腺病毒、家畜痘病毒和狂犬病毒)。例如Sambrook等在MolecularCloning:ALaboratoryManual,2ndEd.,ColdSpringHarbor,N.Y"(1989)中描述了多种用于原核和真核宿主的克隆载体和表达载体。宿主细胞和转化细胞本发明还提供了含有本发明的核酸序列的转化细胞或者本发明的载体,所述核酸序列包括编码本发明的醛缩酶(如丙酮酸醛缩酶、HMG和/或KHG醛縮酶)的序列。所述宿主细胞可以是本领域的技术人员所熟悉的任何宿主细胞,包括原核细胞、真核细胞,例如,细菌细胞、真菌细胞、酵母细胞、哺乳细胞、昆虫细胞或者植物细胞。细菌细胞的实例包括任何种类的链霉菌、葡萄状球菌、假单胞菌或杆菌,其中包括大肠杆菌、枯草芽孢杆菌、荧光假单胞杆菌(Pseudomonasfluorescens)、蜡状芽孢杆菌(Bacilluscereus)或鼠伤寒沙门氏菌(Salmonellatyphimurium)。真菌细胞的实例包括曲霉菌的任何种类。酵母细胞的实例包括任何种类的毕赤酵母(Pichia)、酿酒酵母(saccharomyces)、裂殖酵母、或者西方许旺酵母(Schwanniomyces),包括毕赤酵母、混浊酿酒酵母(Saccharomycescerevisiae)或者裂殖酵母(Schizosaccharomycespombe)。昆虫细胞的实例包括任何种类的秋粘虫(Spodoptera)或者果蝇,其中包括果蝇S2和秋粘虫Sf9。动物细胞的实例包括CHO、COS或者人黑素瘤或者任何小鼠或者人的细胞系。本领域的技术人员能够选择适当的宿主。转化大量的不同的高等植物种类的技术是公知的并在技术和科学文献中有描述。参见Weising(1988)Ann.Rev.Genet.22:421-477;美国专利No.5,750,870。可以使用各种技术将载体导入到宿主细胞中,所述技术包括转化、转染、转导、病毒感染、基因枪或者Ti-介导的基因转移。具体的方法包括磷酸钙转染、二乙氨(基)乙基葡聚糖(DEAE-Dextran)介导的转染、脂质转染或者电转染(Davis,L.,Dibner,M.,Battey,L,BasicMethodsinMolecularBiology,(1986))。在一些实施方式中,将本发明的核酸或者载体导入到细胞质以进行筛选,因此,所述核酸以适于核酸随后的表达的方式进入细胞。导入的方法很大程度上由靶细胞的类型决定。这些方法的实例包括CaP04沉淀、脂质体融合、脂质转染(例如LIPOFECTINtm)、电穿孔、表达转染等。这些候选的核酸可以被稳定地整合到宿主基因组中(例如,用逆转录病毒导入)或者可以瞬时或者稳定地存在于细胞质中(S卩,通过使用传统的质粒、利用标准的调节序列、选择标记等)。由于在药物上的许多重要的筛选需要以人的细胞或者模型哺乳的细胞作为标靶,因此,可以使用能够转化这种标靶的逆转录病毒载体。可以将工程宿主细胞适当地培养在改良的常规营养培养基中,该培养基适于激活启动子、对转化株进行筛选、或者对本发明的基因进行扩增。在适当的宿主株中转化并生长到一定的细胞密度后,可以通过适当的方法(如改变温度或者化学诱导)来诱导选择性的启动子,并将细胞在培养一段时间以使细胞产生期望的肽或者该肽的片段。可以通过离心收集细胞,通过物理的方法或者化学的方法破碎细胞,并保留得到的粗提取物以进一步纯化。用于表达蛋白的微生物细胞可以通过任何常规的方法进行破碎,所述常规的方法包括反复冻溶法、超声波方法、机械破碎或者使用裂解剂破碎细胞的方法。这些方法是本领域技术人员所公知的。可以通过各种方法从重组的细胞培养物中回收到表达的多肽或者该多肽片段,所述方法包括硫酸铵或者乙醇沉淀、酸提取、阴离子或/阳离子交换色谱、磷酸纤维素色谱、疏水相互作用色谱、亲和层析、羟磷灰石色谱和外源凝集素色谱。如果必要的话,可以使用蛋白的再折叠步骤以完善多肽的构象。如果需要,可以使用高效液相色谱(HPLC)作为最后的纯化步骤。可以按照常规的方法使用宿主中的构建体,以产生由重组序列编码的基因产品。由含有载体的宿主细胞产生的多肽可以是糖基化的或者可以是非糖基化的,这取决于在重组产物的步骤中所使用的宿主。本发明的多肽可以包括或不包括起始的蛋氨酸氨基酸残基。还可以使用无细胞的翻译体系,以产生本发明的多肽。无细胞的翻译体系可以从使用由DNA构建体转录来的mRNA,所述DNA构建体含有可操作地连接到编码所述多肽或者该多肽的片段的核酸的启动子。在一些实施方式中,所述DNA构建体在进行体外转录反应前可以被线性化。然后将转录的mRNA与适当的无细胞翻译提取物(如兔网状细胞提取物)进行孵育,以产生所期望的多肽或者该多肽的片段。所述表达载体可以含有一种或多种选择性标记基因,以提供用于选择转化宿主细胞的表型特性,所述选择性标记基因如二氢叶酸还原酶基因或者能赋予培养的真核细胞对新霉素的耐药性的基因、赋予大肠杆菌对四环素或者氨苄青霉素的耐药性的基因。可以将含有感兴趣的多核苷酸(如本发明的核酸)的宿主细胞培养在常规的改进的营养培养基中,所述改进是为了适于激活启动子、选择转化株或者扩增基因。所述表达条件(如温度和pH等)是以前用于表达所选择的培养宿主细胞的条件,这对于本领域的技术人员来说是显而易见的。然后对确定的具有特定酶活性的克隆进行测序,以确定编码具有增强活性的酶的多核苷酸序列。本发明提供了在包括含有本发明的核酸的表达载体的细胞中过表达重组的醛缩酶(如丙酮酸醛缩酶,例如HMG和/或KHG醛縮酶)的方法,所述核酸例如至少在约100个残基的区域与本发明的序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核酸序列,其中,所述序列同一性是通过序列比对或者肉眼观察确定的;或者在严格条件下与本发明的核酸序列杂交的核酸;或者它们的子序列。所述过表达可以通过任何方法来实现,如使用高活性的启动子、顺反子载体或者通过载体的基因扩增。本发明的核酸可以在体外或者体内的表达载体中表达或者过表达。可以使用任何细胞培养体系以表达或者过表达重组蛋白,如包括细菌培养物、昆虫培养物、酵母培养物、真菌培养物或者哺乳动物培养物。可以通过选择适当的启动子、增强子、载体(如使用复制子载体、顺反子载体(见Gurtu(1996)Biochem.Biophys.Res.Commun.229:295-8))、培养基和培养系统等来实现过表达。在一些实施方式中,在细胞体系中使用选择性标记基因(如谷氨酸合成酶扩增的基因(见Sanders(1987)Dev.Biol.Stand.66:55-63))使本发明的多肽过表达。关于这种方法更详细的信息描述在公众文献中和/或是本领域技术人员所公知的。在具体的非限制性示例说明中,所述公众能获得的文献包括EP0659215(WO9403612Al)(Nevalai羅etal);Lapidot,A.,Mechaly,A.,Shoham:Y""Overexpressionandsingle-steppurificationofathermostablexylanasefromBacillusstearothermophilusT-6,"J.Biotechnol.Nov51:259-64(1996);LUthi,E.,Jasmat,N.B,,Bergquist,RL.,"XylanasefromtheextremelythermophilicbacteriumCaldocellumsaccharolyticum:overexpressionofthegeneinEscherichiacoliandcharacterizationofthegeneproduct,"Appl.Environ.Microbiol.Sep56:2677-83(1990);和Sung,W.L.,Luk,C.K.,Zahab,D.M.,Wakarchuk,W.,"OverexpressionoftheBacillussubtilisandcirculansxylanasesinEscherichiacoli,"ProteinExpr.Purif.Jun4:200-6(1993);尽管这些参考文献没有给出关于本发明的酶的教导。所述宿主细胞可以是本领域技术人员所熟知的任何宿主细胞,包括原核细胞、真核细胞、哺乳细胞、昆虫细胞或者植物细胞。作为适当宿主的代表性实例,可以提及的是细菌细胞,如大肠杆菌、链霉菌、枯草芽孢杆菌、蜡状芽孢杆菌、鼠伤寒沙门氏菌(Salmonellatyphimurium)和属于假单胞菌、链霉菌和葡萄状球菌属中的任何种;真菌细胞,如曲霉菌;酵母,如任何种类的毕赤酵母、酿酒酵母、裂殖酵母、西方许旺酵母,其中包括毕赤酵母、混浊酿酒酵母、或者粟酒裂殖酵母;昆虫细胞,例如,果蝇S2和秋粘虫Sf9;动物细胞,如CHO、COS或者人黑素瘤;和腺病毒。本领域的技术人员能够选择适当的宿主。可以使用各种技术将所述载体导入到宿主细胞中,所述方法包括转化、转染、病毒感染、基因枪或者Ti-介导的基因转移。特定的方法包括磷酸钙转染、二乙氨(基)乙基葡聚糖(DEAE-Dextran)介导的转染、脂质转染或者电穿孑L(Davis,L.,Dibner,M,,Battey,L,BasicMethodsinMolecularBiology,(1986》。可以将工程宿主细胞适当地培养在改良的常规营养培养基中,该培养基适于激活启动子、选择转化株或者扩增本发明的基因。在适当的宿主株转化并生长到一定的细胞密度后,可以通过适当的方法(如改变温度或者化学诱导)来诱导选择性的启动子,并将细胞再培养一段时间以使细胞产生所需要的肽或者该肽的片段。可以通过离心收集细胞,通过物理的方法或者化学的方法破碎细胞,并保留得到的粗提取物以进一步纯化。用于表达蛋白的微生物细胞可以通过任何常规的方法进行破碎,所述常规的方法包括反复冻溶法、超声波方法、机械破碎或者使用裂解剂破碎细胞的方法。这些方法是本领域技术人员所公知的。可以通过各种方法从重组的细胞培养物中回收表达的多肽或者该多肽的片段,所述方法包括硫酸铵或者乙醇沉淀、酸提取、阴离子或/阳离子交换色谱、磷酸纤维素色谱、疏水相互作用色谱、亲和层析、羟磷灰石色谱和外源凝集素色谱。如果必要的话,可以使用蛋白的再折叠步骤以完善多肽的构象。如果需要,可以使用高效液相色谱(HPLC)作为最后的纯化步骤。可以使用各种哺乳细胞培养体系来表达重组的蛋白。哺乳表达体系的实例包括猴肾成纤维细胞C0S-7细胞系(由Gluzman描述的Ce11,23:175,1981)和能从相容载体(compatiblevector)中表达蛋白质的其它细胞系,如C127、3T3、CHO、海拉(HeLa)和BHK细胞系。可以按照常规的方法使用宿主中的构建体以产生由重组序列编码的基因产物。由含有载体的宿主细胞产生的多肽可以是糖基化的或者可以是非糖基化的,这取决于在重组产物步骤所使用的宿主。本发明的多肽可以包括或不包括起始的蛋氨酸氨基酸残基。或者,本发明的多肽或者含有所述多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或者更多个组成型氨基酸的片段,可以通过常规的肽合成方法(如下文中讨论的方法)合成。在另一些实施方式中,所述多肽的片段或者部分可以通过肽合成而用于产生相应的全长多肽;因此,所述片段可以用作制备全长肽的中间体。通过使用由含有可操作地连接到编码所述多肽或者该多肽的片段的核酸的启动子的DNA构建体转录的mRNAs,还可以使用无细胞翻译体系以产生本发明的一种多肽或者含有所述多肽的至少5、10、15、20、25、30、35、40、50、75、100或150或者更多个组成型氨基酸的片段。在一些实施方式中,所述DNA构建体在进行体外转录反应前可以被线性化。然后将转录的mRNA与适当的无细胞翻译提取物(如兔网状细胞提取物)进行孵育,以产生所需要的多肽或者多肽片段。核酸的扩增在实施本发明时,可以通过扩增方法(如PCR)使本发明的核酸和编码本发明的醛縮酶(例如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的核酸或者本发明的修饰的核酸扩增。可以使用扩增来克隆或者修饰本发明的核酸。因此,本发明提供了用于扩增本发明核酸的扩增引物序列对。本领域的技术人员可以设计用于这些序列的部分或者全长的扩增引物序列对。在一些实施方式中,本发明提供了由本发明的扩增引物对扩增的核酸,所述引物对是本发明核酸序列的初始的(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个或者更多个的核酸残基,和互补链的初始约(5'端)的15、16、17、18、19、20、21、22、23、24或者25个或更多个残基而设计的。在优选实施方式中,本发明提供用于扩增编码具有醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)活性的多肽的核酸的引物对序列,其中,所述引物对能使含有本发明序列的核酸、或者该核酸的片段或者部分扩增。所述扩增引物序列对的一条链或每条链可以包括含有所述序列的至少约10-50个或者更多个组成型碱基的寡核苷酸,或者含有所述序列的至少约12、13、14、15、16、17、18、19、20、21、22、23、24或者25个或者更多个组成型碱基的寡核苷酸。在一些实施方式中,本发明提供了扩增引物对,其中,所述引物对包括第一链和第二链,所述第一链具有本发明核酸序列的初始的(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个或者更多个核酸残基设计的序列,所述第二链具有本发明链的互补链的初始(5')的15、16、17、18、19、20、21、22、23、24或者25或更多的残基设计的序列。本发明通过本发明的扩增引物对并使用扩增方法(如聚合酶链式反应(PCR))提供了醛縮酶(如丙酮酸醛縮酶,例如HMG和/或KHG醛縮酶)。在一些实施方式中,本发明提供了使用本发明的扩增引物对并通过扩增方法(如聚合酶链式反应(PCR))来制备醛縮酶(如丙酮酸醛縮酶,例如HMG和/或KHG醛縮酶)的方法。在一些实施方式中,所述扩增引物对来自文库(如基因文库、环境文库)的核酸进行扩增。可以使用扩增反应,以对样品中的核酸的量(如细胞样品中信息量)进行定量、对核酸进行标记(如标记一个阵列或者一个点)、对核酸进行检测,或者对样品中特定核酸的量进行定量。在本发明的一些实施方式中,对从细胞或者CDNA文库中分离出的信息进行扩增。本领域的技术人员可以选择和设计适当的寡核苷酸扩增引物。所述扩增的方法是本领域公知的,包括,如聚合酶链式反应(PCR)(见PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS,ed.Innis,AcademicPress,N.Y.(1990)和PCR技术(PCRSTRATEGIES)(1995),ed.Innis,AcademicPress,Inc.,N.Y.;连接酶链式反应(LCR)(见Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene89:117);转录扩增(见Kwoh(1989)Proc.Natl.Acad.Sci.USA86:1173);禾口自持序列复制(见Guatelli(1990)Proc.Natl.Acad.Sci.USA87:1874);Q-(3复制酶扩增(见Smith(1997)J.Clin.Microbiol.35:1477-1491)、自动的Q-卩复制酶扩增方法(见Burg(1996)Mol.Cell.Probes10:257-271)和其它RNA聚合酶介导的技术(suchasNASBA,Cangene,Mississauga,Ontario);还可以参见Berger(1987)MethodsEnzymol.152:307-316;A飄bel等CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.1997andSambrooketal.,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。美国专利No.4,683,195和No.4,683,202;Sooknanan(1995)Biotechnology13:563-564。核酸和多肽的序列同一性的确定本发明提供了具有以下序列的核酸,所述序列与本发明核酸在至少约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多个残基的区域内的序列同一性至少为约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或者100%。在一些实施方式中,本发明提供的多肽含有与本发明的多肽的核酸序列(见序列表)的序列同一性至少为约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和更高或者100%的序列。所述序列同一性(同源)的程度可以使用任何的计算机程序和相关的参数来确定,所述计算机程序包括本文所描述的,如具有默认参数的BLAST2.2.2.或者FASTA3.0t78版。本发明的核酸序列可以包括本发明的序列的和基本上与本发明的序列相同的序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个或者更多个组成型核苷酸。本发明核酸的同源序列和片段是指与本发明的序列的序列同一性(同源性)至少为约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更高的序列。可以使用任何的计算机程序和本文中描述的参数来确定同源性(序列同一性),所述的计算机程序包括具有默认参数的FASTA3.0t78版。特异性序列还可以包括RNA序列,在该RNA序列中,尿嘧啶代替本发明核酸序列中的胸腺嘧啶。所述同源性序列可以通过使用本文中描述的任何方法获得,或者通过纠正序列的错误而获得。应当理解的是,本发明的核酸序列可以用传统的字母格式表示(见theinsidebackcoverofStryer,Lubert.Biochemistry,3rdEd.,W.HFreeman&Co.,NewYork.)或者用其它记录序歹U中的核苷酸同一性的任何其它格式来表示。在一些实施方式中,将本发明所确定的序列比对程序用于本发明的这一方面,即确定核酸或者多肽序列是否属于本发明的范围。可以使用任何的比对法或者本领域的公知的程序来评价所述蛋白质和/或核酸序列的同一性。这种比对法和程序包括但不限于TBLASTN、BLASTP、FASTA、TFASTA禾口CLUSTALW(见PearsonandLipman,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等,J.Mol.Biol.2—i5(3):403-410,1990;ThompsonNucleicAcidsRes.22(2):4673-4680,1994;Higgins等,MethodsEnzymol.266:383-402,1996;Altschul等,J.Mol.Biol.215(3):403-410,1990;Altschul等,NatureGenetics3:266-272,1993)。在一些实施方式中,使用序列分析软件(如由GeneticsComputerGroup开发的序列分析软件包,烕斯康星大学生物技术中心,1710UniversityAvenue,Madison,WI53705)来检测同源性或者同一性。这些软件通过确定不同的删除、替换和其它修饰的同源性程度来匹配相似的序列。在一些实施方式中,上下文中提到的两个或者多个核酸或者多肽序列所使用的术语"同源性"和"同一性"是指,使用任何序列比对方法或者通过人工比对的方法和肉眼观察检测来比较和计算一个比较窗口或者指定区域中的最大的相应程度时,两种或者多种序列或者子序列是相同的;或者是指具有相同的氨基酸残基或者核苷酸的特定百分比。在一些实施方式中,为了进行序列比较,一种序列作为另一种被检测的测试序列的参考序列。当进行序列比对时,将测试序列和参考序列输入到计算机中,随后指定坐标;如果必要还指定序列比对程序的参数。可以使用默认程序参数或者可以指定可供选择的参数。然后根据程序参数使用序列比对法,计算测试序列与参考序列的序列同一性百分比。本文中所使用的"比较窗口"包括选自由以下序列所组成的组中的任何一序列的片段,所述序列含有20-600个,通常约50-200个,更通常约100-150个氨基酸残基或者核苷酸,将这些序列中的一条序列与该序列具有相同数量的连续位置的参考序列最佳比对后,将这两条序列进行比对。用于比较序列的计算方法是本领域所公知的。用于序列比较的最佳计算方法可以通过如下方法进行,如Smith&Waterman的局部同源计算(thelocalhomologyalgorithmofSmith&Waterman),Adv.Appl.Math.2:482,1981;Needleman&Wunsch的同源比对计算(thehomologyalignmentalgorithmofNeedleman&Wunsch),J.Mol.Biol48:443,1970,bythesearchforsimilaritymethodofperson&Lipman,Proc.Natl.Acad.Sci.USA85:2444,1988;这些计算的计算机执行方法(GAP,BESTFIT,FASTAandTFASTAintheWisconsinGeneticsSoftwarePackage,GeneticsComputerGroup,575ScienceDr.,Madison,WI);或者通过人工计算和肉眼观察。用于确定同源性或者同一性的其它计算方法包括,例如BLAST程序(国家生物信息中心的基本的局部的比对搜索工具)、ALIGN、AMAS(多比对序列分析)、AMPS(蛋白质多序列比对)、ASSET(比对的片段统计评估工具)、BANDS、BESTSCOR、BIOSCAN(生物学序列比较分析节点(BiologicalSequenceComparativeAnalysisNode))、BLIMPS(块极值优化搜索工具(BLocksEVIProvedSearcher))、FASTA、Intervals&Points、BMB、CLUSTALV、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、斯密斯-沃特曼算法(Smith-Watermanalgorithm)、DARWIN、韦加斯算法(LasVegasalgorithm)、FNAT(加强的核苷酸比对根据)、框架比对(Framealign)、框架搜索(Framesearch)、DYNAMIC、FILTER、FSAP(富日斯特斯克序列分析包(FristenskySequenceAnalysisPackage))、GAP(球形比对程序(GlobalAlignmentProgram))、GENAL、GIBBS、GenQuest、ISSC(灵敏的序列比较)、LALIGN(局部序列比对)、LCP(局部内容程序(LocalContentProgram))、MACAW(多比对构建体&分析工作台(MultipleAlignmentConstruction&AnalysisWorkbench))、MAP(对比X寸程序(MultipleAlignmentProgram))、MBLKP、MBLKN、PIMA(模型导致的多系列比对(Pattern-InducedMulti-s叫uenceAlignment))、SAGA(通过遗传运送的序列比对)和WHAT-IF。还可以使用这些比对程序对基因组数据库进行筛选,以确定基本上相似的多核苷酸序列。可以得到大量的基因组数据库,例如,人类基因组的重要部分可以作为人类基因组计划的一部分而获得。(Gibbs,1995)。至少有21种其它的基因组已被测序,它们包括,例如生殖器支原体(M.genitalium)(Fraseretal,Science270:397-403(1995))、甲烷球菌(M.jannaschii)(Bultetal,Science23:1058-73(1996))、H流行感冒(H.influenzae)(Fleischmannetal"Science269:496-512(1995))、大肠杆菌(Blattneretal,Science277:1453-74(1997))和酵母(酿酒酵母)(Mewesetal"Nature387:7-65(1997))和黑腹果蝇(D.melanogaster)(Adamsetal,Science257:2185-95(2000))。在模型生物如小鼠、线虫和拟南芥(Arabadopsissp)的基因组测序方面也取得了显著的进步。一些含有标注有一些功能信息的基因组信息的数据库,可以由不同的机构维持并可以通过互联网获得。在一些实施方式中,使用BLAST和2.0算法。这些算法由Altschul等分别描述在Nuc.AcidsRes.25:3389-3402,1977和J.Mol.Biol.215:403-410,1990中。公众可以通过国家生物信中心获得用于实施BLAST分析的软件。这些算法包括首先通过确定查询序列的较短字串长度W来确定高分序列配对(HSPs),当与数据库中相同长度的字串比对时,所述高分序列配对能匹配或者满足一些正值阈值T。T是指邻近字串的得分阈值(Altschuletal.,supm)。这些最初的临近字串采样数作为引发搜索找到含有它们的更长的HSPs的种子。只要积累的比对得分增加,所述字串釆样数就在每一序列的两个方向延伸。对于核苷酸序列,使用参数M(—对匹配残基获得的分数;总是〉0)以计算累积得分。对于氨基酸序列,使用得分矩阵以计算累积得分。当出现以下情况时终止所述字串两端的延长通过从获得的最大值定量X时,累积比对得分降低;由于出现一个或多个负分值的残基比对使所述累积得分为零或者低于零;或者达到任一序列的终点。BLAST比对参数W、T和X用于确定比对的灵敏性和比对的时间。BLASTN程序(对于核苷酸序列)使用字串的长度(W)的默认值为11,期望值(E)的默认值为10,M=5,N=-4并比较两条链。对于氨基酸序列,BLASTP程序使用字串的长度的默认值为3,期望值(E)的默认值为10,BLOSUM62得分矩阵(见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915,1989)的比对(B)的默认值为50,M=5,N:4并比较两条链。BLAST算法也是实现两条序列之间同一性的统计学分析的方法(见Karlin&Altschul,Proc.Natl.Acad.Sci.USA90:5873,1993)。用BLAST算法提供同一性检测的一个量度标准(measure)是最小总和的概率(P(N)),该最小总和的概率表示了两条核苷酸或者氨基酸序列之间偶然匹配的概率。例如,在比较测试核酸和参照核酸的过程中,如果最小总和的概率小于约0.2,在一些实施方式中小于约0.01,在另一些实施方式中小于约0.001,则测试核酸被认为与参照序列相似。在一些实施方式中,使用基本点局部比对搜索工具("BLAST")来评价蛋白质和核酸的序列同源性。尤其使用五个特定的BLAST程序实现以下任(1)用BLASTP和BLAST3对氨基酸查询序列与蛋白质序列库进行比较;(2)用BLASTN对核苷酸査询序列与核苷酸序列数据库进行比较;(3)用BLASTX对核苷酸查询序歹ij(两条链)的六框架概念翻译(six-frameconceptualtranslation)产物与蛋白质数据库进行比较;(4)用TBLASTN对査询的蛋白质序列与所有的六个阅读框架(两条链)的核苷酸序列数据库进行比较;和(5)用TBLASTX对核苷酸查询序列的六框架翻译产物与核苷酸序列数据库的六框架翻译产物进行比较。BLAST程序通过鉴定位于査询氨基酸或者核酸序列与测试序列之间的相似片段来鉴定同源序列,所述相似片段在本文被称为"高分片段对",所述测试序列在一些实施方式中来自于蛋白质或者核酸序列数据库。在一些实施方式中,所述高分片段对通过得分矩阵方法进行鉴定(即比对),所述得分矩阵方法中的许多方法是本领域所公知的。在一些实施方式中,所使用的得分矩阵是BLOSUM62矩阵(Gonnet(1992)Science256:1443-1445;HenikoffandHenikoff(1993)Proteins17:49-61)。在一些实施方式中,偶尔还使用PAM或者PAM250矩阵(见SchwartzandDayhoff,eds.,1978,MatricesforDetectingDistanceRelationships:AtlasofProteinSequenceandStructure,Washington:NationalBiomedicalResearchFoundation)。BLAST程序可以通过美国国家医药实验室获得。上述算法中使用的参数可以根据研究的序列长度和同源性的程度而改变。在一些实施方式中,在缺乏来自使用者的指导时,可以使用算法中默认的参数。计算机系统和计算机程序产品本发明提供了计算机、计算机系统、计算机可读介质、计算机程序产品和类似的记录和储存本发明核酸和多肽的产品。因此,在实施本发明的方法时,如用计算机来确定并鉴定序列同一性(确定核酸是否属于本发明的范围)、结构同源性、图形等,则可以将本发明的核酸或者多肽序列储存、记录并操作在能够被计算机阅读和存取的任何介质上。本文所使用的词语"记录"和"存储"是指在计算机介质上存储信息的过程。本领域的技术人员易于采用任何己知的方法在计算机可读介质上记录信息,以产生含有一种或多种本发明的核酸和/或多肽序列的产品。本文中所使用的术语"计算机"、"计算机程序"和"处理器"为它们的最广泛的通常的含义,并且将所有下文中详细描述的设备组合在一起。特定的多肽或者蛋白质的"编码序列的"或者"序列编码"是指,当置于适当的调节序列的控制下时能被转录和翻译成多肽或者蛋白质的核酸序列。本发明的多肽包括本发明的序列和基本上与该序列相似的序列,以及任何前述序列的子序列和具有酶活性的片段。在一些实施方式中,基本上相似的或者同源的多肽序列是指与本发明的序列的序列同一性(同源性)至少为50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和更高和100%的多肽序列。可以使用本文中描述的任何的计算机程序和参数来确定同源性(序列同一性)。本发明的核酸和多肽可以保存、记录和操作在任何可以用计算机阅读和存取的介质上。本文所使用的词语"记录"和"存储"是指在计算机介质上存储信息的过程。本领域的技术人员易于采用任何已知的方法在计算机可读介质上记录信息以产生含有一种或多种本发明的核酸序列,一种或多种本发明的多肽序列的产品。在本发明的另一种实施方式中,本发明提供了一种计算机可阅读的介质,在该介质上记录了至少2、5、10、15或20个或更多个本发明的核酸或者多肽序列。本发明的另一个实施方式中,本发明提供了一种计算机可阅读的介质,在该介质上记录了一种或多种本发明的核酸序列。本发明的另一个实施方式中,本发明提供了一种计算机可阅读的介质,在该介质上记录了一种或多种本发明的多肽序列。在本发明的另一种实施方式中,本发明提供了一种计算机可阅读的介质,在该介质上记录了至少2、5、10、15或20个或更多个本发明上述的核酸或者多肽序列。所述计算机可阅读的介质包括磁性可阅读的介质、可用眼睛阅读的介质、电子可阅读的介质、和磁性/可用眼睛阅读的介质。例如,计算机可阅读介质可以是硬盘、软盘、磁带、光盘驱动器(CD-ROM)、数字化视频光盘(DVD)、随机存取存储器(RAM)或只读存贮器(ROM)以及本领域技术人员公知的其它类型的其它介质。在本发明的一些实施方式中,本发明包括如计算机系统在内的系统(如基于互联网的系统),所述计算机系统储存并操作本文所描述的序列信息。在图9中,计算机系统100的一个实例以结构图形式进行了说明。本文中所使用的"计算机系统"是指硬件部分、软件部分和用于分析本发明的核酸的核苷酸序列或者多肽序列的数据储存部分。在一些实施方式中,所述计算机系统100包括用于处理、存取和操作所述序列数据的处理器。所述处理器可以是任何己知类型的中央处理单元,如英特公司的奔腾III或者美国太阳公司、摩托罗拉公司、美国康柏公司、美国AMD公司或者国际商业机械公司(InternationalBusinessMachines)的类4以处理器。在一些实施方式中,所述计算机系统100是实现普通目的的系统,该系统包括处理器105和一个或多个用于储存的内部数据储存部分以及一个或多个用于恢复储存在数据储存元件上的数据的数据恢复的设备。本领域的技术人员能容易地理解到目前可以得到的任何计算机系统都是合适的。在一个实施方式中,所述计算机系统100包括连接到母线(bus)的处理器105,所述母线连接于主要的储存器115(在一种实施方式中实施的为RAM)以及一个或多个内部数据储存设备110(如硬驱动器和/或能在其上记录数据的其它计算机可读介质)。在一些实施方式中,所述计算机系统100还包括一种或多种数据恢复设备118,以阅读储存在内部数据储存设备110上的数据。所述数据恢复设备118可以表示为,例如,软盘驱动器、光盘驱动器、磁带驱动器或者能连接到远端数据储存系统的调制解调器(如通过互联网)等。在一些实施方式中,所述内部数据储存设备110为含有控制逻辑和/或记载控制逻辑的数据的可移动的计算机可阅读的介质,如软盘、光盘、磁带等。所述计算机系统IOO可以方便地包括或者设计为适当的软件,当数据储存部分被插入到数据储存设备时,所述软件能从数据储存部分中阅读出控制逻辑的和/或数据。所述计算机系统100包括显示器120,该显示器用于对计算机用户进行显示输出。应当指出的是,所述计算机系统100可以连接到网络或者更广的网络上的另一个计算机系统125a-c,以提供进入所述计算机系统100的重要的途径。在进行操作时,软件可以保存在主要储存器115中,所述软件用于提取和处理本发明的核酸序列的核苷酸的序列和与它们基本上相似的序列,或者用于提取和处理本发明的多肽序列和与该多肽序列基本上相似的多肽序列(如搜索工具,比较工具和建模工具等)。在一些实施方式中,所述计算机系统IOO还可以包括序列比对算法,以对储存在计算机可读介质上的本发明的核酸序列和与该核酸序列基本上相似的序列、或者本发明的多肽序列和与该多肽序列基本上相似的序列与储存在计算机可读介质上的参照核苷酸或者多肽序列进行比较。"序列比对算法"是指一种或多种能在(本地或者远程)计算机100上进行实施以对储存在数据储存器上一种核苷酸序列和另一种核苷酸序列和/或化合物进行比较的程序。例如,所述序列比对算法可以对储存在计算机可读介质上的本发明的核酸序列和与该核酸序列基本上相似的序列、或者本发明的多肽序列和与该多肽序列基本上相似的序列,与储存在计算机可读介质上的参照序列进行比对,以确定同源性或者结构基序。图10是说明用于对一种新的核苷酸或者蛋白质序列与序列数据库进行比对,以确定新的序列和数据库中的序列的同源性水平的程序200的一种实施方式的流程图。所述序列数据库可以是储存在计算机系统100中的私人数据,或者可以为从互联网上获得的如GENBANEC公共数据库。所述程序200在起始状态201开始并转换到状态202,此时,待比较的新序列储存在计算机系统100的储存器中。如上所述,所述储存器可以是任何类型的储存器,包括RAM或者内部储存设备。然后,将所述程序200转换到状态204。此时,打开序列数据库以进行分析和比对。然后将所述程序200转换到状态206,此时,将储存在所述数据库中的第一序列读取到计算机的储存器中。然后在状态210下进行比较,以确定第一序列与第二序列是否相同。值得注意的是这一步不限于对新序列和所述数据库中的第一序列进行精确的比较。用于比较两条核苷酸或者蛋白质序列的公知的方法是本领域的技术人员知道的,即使比较的序列不同。例如,可以在一条序列中引入缺口,以提高两条测试序列之间的同源性。通常计算机系统的使用者在进行比较时,将控制缺口或者其它特征的参数引入到序列中。一旦在状态210进行两条序列的比较,必须在决策状态(decisionstate)210下,作出两条序列是否相同的决定。当然,术语"相同"不限于两条序列绝对相同。在程序200中,位于使用者所设定的同源参数范围内的序列被标记为"相同"。如果作出两条序列相同的决定,则将程序200转化到状态214,此时,数据库中序列的名称被显示在使用者的面前。这种状态告知使用者显示名称的序列满足输入的同源性约束条件。被储存序列的名称一旦显示在使用者的面前,则程序200转换到决策状态218,此时,作出在数据库中是否存在多种序列的决定。如果在数据库中不存在多种序列,则程序200终止在终止状态220。然而,如果在数据库存在多种序列,则将程序200转化到状态224,此时,指示器转化到另一序列以比较新的序列。将新的序列以这种方式与数据库中每一条序列进行比对。应当指出的是,如果在决策状态212下作出序列不是同源的决定,则程序220立即转换到决策状态218,以确定数据库中是否存在其它的数据可以进行比较。因此,本发明的一种实施方式提供了一种计算机系统,该计算机系统包括处理器;数据储存装置,该数据储存装置储存有本发明的核酸序列和基本上与该核酸序列相似的序列,或者本发明的多肽序列和与该多肽序列基本上相似的序列;数据储存装置,该数据储存装置可读取地储存有用于与本发明的核酸序列和基本上与该核酸序列相似的序列、或者本发明的多肽序列和与该多肽序列基本上相似的序列进行比较的参照核苷酸序列或者多肽序列;和用于进行对比的序列比较器。所述序列比较器可以指出比较的序列或者相似结构的基序之间的同源性水平,这些相似结构的基序存在于本发明的核酸序列和与该序列基本上相似的序列的上述核酸密码中,或者这些相似结构的基序存在于本发明的多肽序列和与该多肽序列基本上相似的序列的多肽密码中;或者,所述序列比较器可以确定与这些核酸密码和多肽密码比较的序列中的结构基序。在一些实施方式中,所述数据储存装置可以储存本发明的核酸序列和与本发明的核酸序列基本上相似的序列、或者本发明的多肽序列和与本发明的多肽序列基本相似的序列中的至少2、5、10、15、20、25、30或者40个或者更多个序列。本发明的另一种实施方式提供了用于确定同源性水平的方法,所述同源性水平为本发明的核酸序列和基本上与该核酸序列相似的序列,或者本发明的多肽序列和与该多肽序列基本上相似的序列与参照核苷酸序列之间的同源性水平。所述方法包括通过使用能确定同源性水平的计算机程序来阅读核酸密码或者多肽密码以及参照核苷酸或者多肽序列,并且能通过所述的计算机程序确定核酸密码或者多肽密码和参照核苷酸或者多肽序列的同源性。所述计算机程序可以是用于确定同源性水平的任何计算机程序,包括本文中特别列举的那些(如具有默认参数的或者具有任何修饰的参数的BLAST2N)。所述方法可以使用上述的计算机系统以进行实施。所述方法还可以通过以下方法进行实施,即通过计算机程序阅读上述的本发明的核酸序列和与本发明的核酸序列基本上相似的序列、或者本发明的多肽序列和与该多肽序列基本上相似的序列中的至少2、5、10、15、20、25、30或者40个或者更多个核酸序列,并且确定核酸密码或者多肽密码和参照核苷酸或者多肽序列的同源性。图11是说明用于确定两个序列是否相同的计算机中的程序250的一个实施方式的流程图。所述程序250从起始态252开始,然后转化到状态254,此时,待比较的第一序列被储存在内存中。待比较的第二序列然后储存在状态256的内存中。然后,将程序转换到260,此时,读出第一序列的第一个特征,并转换到状态262,此时,读出第二系列的第一个特征。应当理解的是,如果所述序列为核苷酸系列,则所述特征为A、T、C、G或U。如果所述序列为蛋白质序列,则在一些实施方式中,所述特征为单字母的氨基酸密码以便容易地对第一和第二序列进行比较。然后在决策状态264作出两个特征是否相同的决定。如果它们相同,则所述程序250继续循环直到两个特征不同为止。如果作出另两个特征不同的决定,程序250转换到决策状态274以决定每一条序列中是否存在其它的特征可以读出。如果没有其它的特征可以读出,则将程序250转换到状态276,此时,第一序列和第二序列的同源性水平被显示在使用者的眼前。同源性水平通过计算序列间相同的特征的比例来确定,所述特征是与第一条序列中所有特征中相同的部分。因此,如果在第一条序列的ioo个核苷酸中的每一个特征与第二条序列中的特征相匹配,贝U,同源性水平为100%。或者,所述计算机程序可以是能够对本发明提供的核酸序列的核苷酸序列与一种或多种参照序列进行比较以确定本发明的核酸密码、以及与本发明核酸序列基本上相同的序列是否与参照核酸序列在一处或者多处存在不同的计算机程序。这种程序任选地记载有关于参照多核苷酸或者本发明的核酸序列或者与本发明的核酸序列基本上相同的序列的长度和插入、删除或者取代核苷酸的特征。在一些实施方式中,所述计算机程序可以是能够确定本发明的核酸序列和与本发明的核酸序列基本上相同的序列是否含有参照核苷酸序列中的单核苷酸多态性的程序。因此,本发明的另一个实施方式提供了一种用于确定本发明的核酸序列和与本发明基核酸序列本上相同的序列与参照序列是否在一处或者多处存在不同的方法,该方法包括通过使用计算机程序来阅读核酸密码和参照核苷酸序列的步骤,该方法通过所述计算机程序能识别核酸序列间的差异并能识别核酸密码和参照核苷酸序列之间的差异。在一些实施方式中,所述计算机程序能识别单核苷酸的多态性。所述方法可以通过上述的计算机系统来实施,该方法阐述在图11中。所述方法还可以通过以下方式实施,即通过所述计算机程序来阅读本发明核酸序列和与本发明核酸序列基本上相同的序列以及参照核苷酸序列中的至少2、5、10、15、20、25、30或40个或更多个序列,并用所述计算机程序来识别核酸密码和参照核苷酸序列之间的差巳幵。在另一些实施方式中,所述基于计算机的系统还可以包括用于识别本发明的核酸序列或者本发明的多肽序列和基本上与它们相同的序列中的特征的识别器。"识别器"是指一种或多种能识别本发明的核酸序列或者本发明的多肽序列中的某些特征的程序。在一些实施方式中,所述识别器可以包括能识别本发明的核酸序列和与本发明核酸序列基本上相同的序列中可读框的程序。图12是说明用于检测序列中存在特征的识别器程序300的一个实施方式的流程图。所述程序300在起始状态302开始,并然后转化到状态304,此时,待检测特征的第一序列被存储在计算机系统100的内存115中。然后将程序300转化到状态306,此时,开放序列特征的数据库。这种数据库包括每一种特征的属性以及该特征的名称的列表。例如,所述特征的名称可以是"起始密码子",其属性为"ATG"。又例如,特征名称为'TAATAA盒",其特征属性为"TAATAA"。这种数据库的一个实例是由威斯康星大学遗传学计算机组(theUniversityofWisconsinGeneticsComputerGroup)仓键的。或者所述特征可以是如a螺旋、P折叠的结构多肽的基序,或者是如酶活性位点、螺旋-转角-螺旋基序或者本领域技术人员公知的其它基序的结构多肽基序。一旦特征数据库在状态306被打开,则将程序300转化到状态308,此时,从所述数据库中读出第一特征。然后在状态310对第一特征的属性与第一序列进行比较。然后在决策状态316作出所述特征的属性是否在第一序列中找到的决定。如果找到所述属性,然后将所述程序转换到状态318,此时,找到的特征的属性显示在使用者面前。然后将所述程序300转换到决策状态320,此时,作出在所述数据库中是否存在更多的特征的决定。如果不存在更多的特征,然后,将所述程序300终止在终止状态324。然而,如果在所述数据库中存在更多的特征,则所述程序300在状态326下阅读下一个序列特征,并循环到状态310,此时,对下一个特征的属性与第一序列进行比较。应当指出的是如果在决策状态316下,在第一序列中没有发现所述特征的属性,则所述程序300将直接转换到决策状态320以确定在所述数据库中是否存在更多的特征。因此,本发明的另一个实施方式提供了一种识别方法,该方法用于识别本发明的核酸序列和与本发明的核酸序列基本上相同的序列中的特征,或者本发明的多肽序列和与本发明多肽序列基本上相同序列中的特征,该方法包括通过使用计算机程序阅读所述核酸密码或者多肽密码,并通过所述计算机程序识别所述核酸密码中的特征,所述计算机程序能够识别这些序列中的特征。在一些实施方式中,所述计算机程序包括能够识别可读框的计算机程序。所述方法还可以通过以下方式实施,即,通过所述计算机程序阅读本发明核酸序列和与本发明核酸序列基本上相同的序列中的单一序列或者至少2、5、10、15、20、25、30或40个或更多个序列,并用该计算机程序识别核酸密码或者多肽密码中的特征。可以以多种数据处理程序并以多种格式来储存和操纵本发明的核酸序列和与本发明核酸序列基本上相同的序列,或者本发明的多肽序列和与本发明多肽序列基本上相同序列。例如,本发明的核酸序列和与本发明核酸序列基本上相同的序列,或者本发明的多肽序列和与本发明多肽序列基本上相同序列可以储存为WORD处理文件的文本,例如MicrosoftWORDtm或WORDPERFECTTM或者储存为本领域的技术人员熟知的各种数据库程序中的ASCII文件,如DB2tm、SYBASEtm或者ORACLE。此外,可以使用许多的计算机程序和数据库以对序列和识别序列进行比对,或者作为待与本发明的核酸序列和与本发明核酸序列基本上相同的序列,或者本发明的多肽序列和与本发明多肽序列基本上相同序列进行比较的参照核苷酸序列或者多肽序列的数据源。下述的列表不是为了限制本发明,而是为了提供能用于本发明的核酸序列和与本发明核酸序列基本上相同的序列,或者本发明的多肽序列和与本发明多肽序列基本上相同序列的程序和数据库的指导。可以使用的程序和数据库包括但不限于MACPATTERNtm(EMBL)5DISCOVERYBASE(MolecularApplicationsGroup)、GENEMINETM(MolecularApplicationsGroup)、LOOK(MolecularApplicationsGroup)、MACLOOK(MolecularApplicationsGroup)、BLASTandBLAST2(NCBI)、BLASTNandBLASTX(Altschuletal,J.Mol.Biol.2JL5:403,1990)、FASTA(PearsonandLipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlagetal.Comp.App.Biosci.6:237-245,1990)、CATALYST(MolecularSimulationsInc.)、Catalyst/SHAPETM(MolecularSimulationsInc,)、Cerius2.DBAccess(MolecularSimulationsInc.)、HYPOGENTM(MolecularSimulationsInc.)、INSIGHTIITM、(MolecularSimulationsInc.)、DISCOVER(MolecularSimulationsInc.)、CHARMmTM(MolecularSimulationsInc.)、FELIX(MolecularSimulationsInc.)、DELPHI,(MolecularSimulationsInc.)、QuanteMMTM(MolecularSimulationsInc.)、HOMOLOGY(MolecularSimulationsInc.)、MODELER(MolecularSimulationsInc.)、ISIS(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulationsInc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDL可获得的化学物质发现数据库(MDLAvailableChemicalsDirectorydatabase)、MDL药物数据报道数据库(theMDLDrugDataReportdatabase)、综合的药物化学数据库(theComprehensiveMedicinalChemistrydatabase)、Derwents'sWorldDrugIndexdatabase、theBioByteMasterFiledatabase、基因库数据库和基因序列数据库(Genseqndatabase)。根据本发明公开的内容,许多其它程序和数据库对于本领域的技术人员也是显而易见的。使用上述程序可以检测的基序包括编码亮氨酸拉链结构、螺旋-转角-螺旋基序、糖基化位点、泛素化位点、ot螺旋和卩折叠的序列;编码能指导编码蛋白质分泌的信号肽的信号序列;涉及转录调节的序列,如同源框、酸性序列片段(acidicstretches)、酶活性位点、底物结合位点和酶切割位点。核酸的杂交本发明提供了分离的、合成的或者重组的核酸,该核酸能够在严格条件下与本发明的序列杂交,本发明的序列为SEQIDN0:1、SEQIDN0:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQ][DNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO,51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQEDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDN0:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDN0.255、SEQIDN0.257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338。所述严格条件可以是高度严格条件、中度严格条件、或低度严格条件,包括本文所述的高度的或者降低的严格的条件。在一些实施方式中,洗涤条件的严格性是决定核酸是否属于本发明的范围的条件,这将在下文中将进行讨论。"杂交"是指核酸链与互补链通过碱基配对结合的过程。杂交反应是灵敏性的和选择性的,从而使研究的特定的序列在样品中以低浓度存在时,就可以被确定。适当的严格条件可以通过,例如,盐或者甲酰胺在预杂交和杂交溶液中的浓度进行定义,或者通过杂交温度进行定义,这些是本领域的技术人员所公知的。在另一些实施方式中,可以通过降低盐的浓度、增加甲酰胺的浓度或者提高杂交温度来提高严格性。在另一些实施方式中,本发明的核酸可以通过它们在本文所述的各种严格条件下(如高、中和低)的杂交能力来限定。在一些实施方式中,在高度严格条件下的杂交包括在约37"C-42'C下甲酰胺的浓度为约50%。在一些实施方式中,所述杂交的条件包括降低严格性的条件,如在3(TC-35。C下甲酰胺的浓度为约35%-25%。在一些实施方式中,所述杂交的条件包括高严格性的条件,如在约42"C下甲酰胺的浓度为约50%、5xSSPE、0.3%SDS和200吗/ml的剪切的和变性的鲑鱼精子DNA。在一些实施方式中,所述杂交的条件包括降低严格性的条件,如在降低的温度为35。C下甲酰胺的浓度为约35%。可以通过计算所研究的核酸中的嘌呤与嘧啶的比例,来进一步縮小对应于特定严格性水平的温度范围,并相应地调节温度。上述范围和条件的变化是本领域技术人员所公知的。在另一些实施方式中,通过在严格条件下的杂交能力限定的本发明的核酸的长度,可以在本发明核酸的约五个残基至全长之间;例如,它们的长度可以是至少为5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多个残基。长度小于全长的核酸也包括在内。这些核酸可以用作,例如杂交探针、标记探针、PCR寡核苷酸探针、siRNA或miRNA(单链或者双链)、反义链或者编码抗体结合肽(抗原决定簇)的序列、基序和活性位点等。在一些实施方式中,本发明的核酸可以通过在高度严格条件下杂交的能力来限定,所述高度严格条件包括在约37"C-42t:下甲酰胺的浓度为约50%。在一些实施方式中,本发明的核酸可以通过在降低严格性条件下杂交的能力来限定,所述降低严格性条件包括在约3(TC-35。C下甲酰胺的浓度为约35%-25%。或者,在一些实施方式中,本发明的核酸可以通过在高度严格条件下杂交的能力来限定,所述高度严格条件包括在42"C下、甲酰胺的浓度为约50%、5xSSPE、0.3%SDS和封闭核酸的重复序列,如cot-l或者鲑鱼精子DNA(如200pg/ml的剪切的变性的鲑鱼精子DNA)。在一些实施方式中,本发明的核酸可以通过在降低严格性条件下杂交的能力来限定,所述降低严格性条件包括在约35。C或者42"C下,甲酰胺的浓度为约35%或者40%。在核酸杂交反应中,用于获得特定严格性水平的条件根据被杂交的核酸的性质变化。例如,在选择杂交的条件时,可以考虑核酸杂交区域的长度、互补的程度、核苷酸的组成(如GC与AT的含量)和核酸的类型(如RNA和DNA)。另一个考虑的因素是核酸中是否有一个核酸分子被固定在如过滤器上。所述杂交可以在低度严格条件、中度严格条件或者高度严格条件下进行。作为核酸杂交的一个实例,含有固定的变性的核酸的聚合物膜首先在45。C下于溶液(溶液含有0.9MNaCl、50mMNaH2PO4、pH7.0、5.0mM乙二胺四乙酸二钠(Na2EDTA)、0.5%SDS(十二垸基硫酸钠)、10xDenhardt's和0.5mg/ml的多核糖腺苷酸)中预杂交30分钟。然后向溶液中加入约2X107cpm(专一性活性为4-9x108cpm/Vg)的32P末端标记的寡核苷酸探针。在孵育12-16小时后,在室温下用含有0.5。/。SDS的lxSET(150mMNaC1、20mMTris盐酸、pH7.8、1mMNa2EDTA)洗涤30分钟,随后用新配制的lxSET在温度为Tm-l(TC下,洗涤寡核苷酸探针30分钟。然后将膜暴露在自动放射薄膜上,以检测杂交信号。以上杂交都可以认为是在高度严格条件下进行的。在杂交后,洗涤过滤器,以除去任何非特异性结合的可检测的探针。用于洗涤所述过滤器的严格条件也可以根据被杂交的核酸的性质变化,例如,被杂交核酸的长度、互补的程度、核苷酸序列的组成(如GC与AT的含量)和核酸的类型(如RNA和DNA)。逐渐提高洗涤的严格性条件的实例为在窒温下用2xSSC、0.1。/。SDS洗涤15分钟(低度严格条件);在室温下用0.1xSSC、0.5%SDS洗涤30分钟到1小时(中度严格条件);在杂交温度到68。C之间用O.lxSSC、0.5%SDS洗涤15-30分钟(高度严格条件);和在72。C下用0.15MNaCl洗涤15分钟(极高严格性条件)。最终在低度严格条件下(在室温下用O.lxSSC洗涤)进行洗涤。上述实施例仅仅说明了可以用于洗涤过滤器的一组条件。本领域的技术人员知道存在许多方法进行不同严格性条件下的洗涤。下文给出了一些其它的实例。在一些实施方式中,所述杂交的条件包括洗涤步骤,该洗涤步骤包括在室温下在溶液(lx150mMNaCl、20mMTris盐酸、pH7.8、1mMNa2EDTA、0.5%SDS)中洗涤30分钟,随后用新制备的溶液洗涤30分钟。与探针杂交的核酸通过射线自显影方法或者其它常规的方法来确定。可以对上述方法进行改进,以检测与所述探针具有降低的序列同一性(同源性)水平的核酸。例如,为了获得与检测的探针具有降低的同一性(特异性)的核酸,可以使用降低的严格性条件。例如,在含有约lM的Na+缓冲液中,所述杂交的温度可以以5的变化程度从68。C降低到42t:。在杂交后,可以在杂交温度下用2xSSC、0.5%SDS洗涤过滤器。在上述条件中,如果温度高于50°C,就认为是中等严格性的杂交条件,温度低于5(TC就认为是低的严格性杂交条件。"中等严格性的"杂交条件的特定的实例为上述的杂交在55。C进行。"低的严格性的,,杂交条件的特定的实例为上述的杂交在45。C进行。或者,杂交可以在42。C下如含有甲酰胺的6xSSC的缓冲液中进行。在这种情况下,甲酰胺在杂交缓冲液中的浓度可以以5%的变化程度从50%降低到0%,以检测与探针具有降低的特异性水平的克隆。在杂交后,可以在5(TC下用6xSSC、0.5%SDS洗涤滤器。在上述的条件中,如果甲酰胺的浓度高于25%,则被认为是"中度严格"条件;如果甲酰胺的浓度低于25%,则被认为是"低的严格性"条件。"中度严格"杂交条件的特定的实例为上述的杂交在30%的甲酰胺中进行。"低度严格"杂交条件的特定的实例为上述的杂交在10%的甲酰胺进行。然而,杂交方式的选择可以是不重要的因素一洗涤条件的严格性是决定核酸是否属于本发明的范围内的条件。用于鉴定核酸是否属于本发明范围内的洗涤条件包括,例如盐的浓度为约0.02摩尔,pH为7和温度为至少约50°C、或者为约55。C到约60°C;或者盐浓度为约0.15MNaCl,72°C,洗涤约15分钟;或者,盐浓度为约0.2xSSC,温度至少为约5(TC、或者为约55"C到约6(TC,洗涤约15到约20分钟;或者,杂交复合物在室温下用含有0.1。/。SDS的盐浓度为约2xSSC的溶液洗涤两次,洗涤15分钟,然后在68°C,用含有0.1%SDS的O.lxSSC洗涤15分钟;或者为等效的条件。参见Sambrook等,MOLECULARCLONING:ALABORATORYMANUAL(2nded.),vols.1-3,ColdSpringHarborLaboratory(1989),LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)andAusubel,ed.JohnWiley&Sons,Inc.,NewYork(1997)foradescriptionofSSCbufferandequivalentconditions。这些方法可以用于分离或者鉴定本发明的核酸和与本发明的核酸基本上相似的序列。例如,上述方法可以用于分离或者鉴定以下核酸与选自以下序列组成的组中的核酸序列的序列同一性(特异性)至少为约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、61%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸,所述以下序列为本发明的一种序列和与本发明序列基本上相似的序列,或者含有本发明的序列中的至少约10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个组成型碱基的片段和与该片段互补的序列。可以使用对比的方法来检测序列同一性(同源性)。例如,所述同源的多核苷酸可以具有本文所述的编码序列的天然存在的等位基因变体的编码序列。与本发明核酸进行比较时,所述等位基因变体可以具有取代的、删除的或者插入的一个或者多个核苷酸。因此,当采用序列比对的方法(如具有默认参数的FASTA版本3.0t78算法)进行检测时,上述方法可以用于分离下述核酸编码与本发明多肽或者含有本发明多肽中的至少5、10、15、20、25、30、35、40、50、75、100或者150个组成型氨基酸的片段同一性(同源性)至少为约99%、至少为约95%、至少为约90%、至少为约85%、至少为约80%、至少为约75%、至少为约70%、至少为约65%、至少为约60%、至少为约55%、或者至少为约50%的多肽的核酸。寡核苷酸探针和使用这些探针的方法
技术领域
:本发明还提供了核酸探针,例如,所述核酸探针可以用于识别、扩增、或者分离编码具有醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛缩酶)的活性的多肽或者它们的片段;或者所述核酸探针可以用于识别醛缩酶(如丙酮酸醛縮酶,如HMG和/或KHG醛缩酶)的基因。在一些实施方式中,所述探针包括本发明的核酸的至少约10个组成型碱基。或者,本发明的探针可以是本发明核酸的序列中的至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150个组成型碱基,或者约10-50、约20-60、约30-70个组成型碱基。所述探针通过结合和/或杂交来识别核酸。所述探针可以用于本发明的包括毛细管阵列在内的阵列中,参见下文的讨论。本发明的探针还可以用于分离其它的核酸或者多肽。本发明的分离的、合成的、或者重组的核酸,与该核酸互补的序列,或者含有本发明的序列中的一种序列中的至少约10、15、20、25、30、35、40、50、75、100、150、200、300、400或者500个组成型碱基的片段,或者与所述片段互补的序列,可以被用作检测生物样品(如污染的样品)中是否含有具有本发明的核酸的生物或者是否含有能获得所述核酸的生物的探针。在这种方法中,对潜在含有可以从中分离出所述核酸的生物的生物样品进行分离,并从该样品中获得核酸。在能够使上所述探针专一性地杂交到本文中所阐述的任何互补序列的条件下,使核酸与所述探针接触。如果必要的话,使所述探针专一性地杂交到互补序列上的条件可以通过以下方法确定将探针与源自已知含有互补序列的样品中的互补序列接触,并与不含有互补序列的对照序列接触。杂交条件(如杂交缓冲液的盐浓度、杂交缓冲液的甲酰胺浓度、或者杂交温度)可以根据识别的条件变化,所述识别的条件是使探针专一性地杂交到互补核酸上的条件。如果样品中含有能分离出所述核酸的生物体,则能够检测到专一性杂交的探针。所述杂交还可以通过用可以检测的试剂,对标记探针进行检测,所述可以检测的试剂为,如放射性同位素、荧光染料或者能够催化形成可检测的产物的酶。使用标记的探针对样品中存在互补核酸进行检测的许多方法为本领域的技术人员所熟知。这些方法包括DNA印迹方法、蛋白质印迹方法、集落杂交方法和斑点印迹。用于所有这些方法的方案被描述在Ausubel等,CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.(1997)禾口Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)中。或者,在扩增反应中可以使用多于一个探针(至少一种探针能专一性地杂交到存在所述核酸的样品中的任何互补序列),以检测样品中是否存在含有本发明核酸序列的生物体(如可以从中分离得到所述核酸的生物体)。在一些实施方式中,所述探针包括寡核苷酸。在一些实施方式中,所述扩增反应包括PCR反应。所述PCR方法描述在上述的AusubelandSambrook中。或者,所述扩增可以包括连接酶链式反应、3SR(自维持序列复制)、或者链置换反应(见Barany,F.,"TheLigaseChainReactioninaPCRWorld",PCRMethodsandApplications1:5-16,1991;E.Fahy等,"Self-sustainedSequenceReplication(3SR):AnIsothermalTranscription-basedAmplificationSystemAlternativetoPCR",PCRMethodsandApplications1:25-33,1991;禾口WalkerG.T.等,"StrandDisplacementAmplification-anIsothermalinvitroDNAAmplificationTechnique",NucleicAcidResearch20:1691-1696,1992)。在这些方法中,将样品中的核酸与所述探针接触,进行扩增反应,并对任何得到的扩增产物进行检测。可以通过对反应产物进行凝胶电泳,并用溴化乙锭对所述凝胶进行染色来检测扩增产物。或者,可以用放射性同位素对一种或多种探针进行标记,然后在凝胶电泳后,通过射线自显影方法对放射性扩增产物的存在进行检测。源自临近本发明序列末端的序列的探针还可以用于染色体步移方法,以检测含有位于临近本发明序列的基因组序列的克隆。这种方法可以从宿主生物体中分离出编码其它蛋白质的基因。在一些实施方式中,本发明的分离的、合成的或者重组的核酸、与该核酸互补的序列、或者含有本发明的序列中的一种序列中的至少约10、15、20、25、30、35、40、50、75、100、150、200、300、400或者500个组成型碱基的片段、或者与所述片段互补的序列,可以用于对有关的核酸进行识别和分离。在一些实施方式中,所述有关的核酸可以是来自除了能分离出所述核酸的生物体之外的生物的cDNAs或者基因组DNAs。例如,其它的生物可以是相关的生物。在这种方法中,在能够使探针专一性地杂交到相关序列上的条件下,将核酸样品与所述探针接触。然后采用上述的任何方法对探针与来自相关生物中的核酸的杂交进行检测。通过改变能够用于对可检测探针上的杂交进行鉴定的核酸,如cDNAs或者基因组DNAs的杂交条件的严格性可以对具有与探针不同水平的同源性的核酸进行鉴定和分离。所述严格性可以通过使杂交在低于所述探针的熔点温度的不同的温度下进行而改变。所述熔点温度,即Tm,是50%的靶序列杂交到与之完全互补的探针上时的温度(在确定的离子强度和pH下)。对于特定的探针,非常严格的条件是等于或者Tm低于约5"C。可以使用以下的公式来计算熔点温度。对于长度处于14和70个核苷酸之间的探针,其熔点温度(Tm)通过以下公式计算Tm=81.5+16.6(log[Na+])+0.41(片段G+C)-(600/N),其中N是探针的长度。如果杂交在含有甲酰胺的溶液中进行,所述熔点温度可以使用以下方程计算Tm=81.5+16.6(log[Na+])+0.41(片段G+C)-(0.63%甲酰胺)-(600/N),其中,N是探针的长度。可以在含有以下成分的溶液中进行预杂交6xSSC、5xDenhardt's试齐U、0.5%SDS、100|ag/ml变性鲑鱼精子DNA片段,或者含有6xSSC、5xDenhardt's试剂、0.5%SDS、100昭/ml变性鲑鱼精子DNA片段、50%甲酰胺。SSC和Denhardt's溶液的配方列在如上所述的Sambrook等中。在一些实施方式中,通过将可检测的探针加入上述的预杂交溶液中进行杂交。其中,所述探针含有双链DNA,在将所述双链DNA加入到所述杂交溶液之前,所述双链DNA已经被变性。在一些实施方式中,所述过滤器与杂交溶液接触足够的时间,以使所述探针杂交到含有与该探针互补的序列或者与该探针同源的序列的cDNAs或者基因组DNAs。对于长度超过200个核苷酸的探针,所述杂交可以在比Tm低15-25。C的温度下进行。对于较短的探针,如寡核苷酸探针,所述杂交可以在比Tm低5-l(TC的温度下进行。在一些实施方式中,对于在6xSSC中进行的杂交,所述杂交在约68"C下进行。通常,对于在含有50%的甲酰胺的溶液中进行的杂交,所述杂交在约42r下进行。醛縮酶表达的抑制本发明提供了与本发明核酸互补(如与它们反义的序列)的核酸,如编码醛縮酶的核酸,所述核酸包括反义链、siRNA、miRNA、核酶。本发明的包括反义序列的核酸能够抑制编码醛縮酶的基因的运输、剪接或者转录。所述抑制可以通过耙向到基因组DNA或者信使RNA上而起作用。可以通过如杂交和/或切除,来抑制被靶向的核酸的转录或者功能。本发明的一组实例组包括寡核苷酸,所述寡核苷酸能够结合到醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶),或者信使上;在上述任何情况下都能阻止或者抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛缩酶)的产生或者功能。所述连接可以通过序列特异性的杂交来实现。另一类有用的抑制剂包括能导致醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)信息失活或者切割的寡核苷酸。所述寡核苷酸具有能够引起所述切割的酶的活性,如核酶。所述寡核苷酸可以通过化学修饰或者连接到能够切割所述互补核酸的酶或者组成上。可以对许多不同的所述寡核苷酸进行筛选,以得到具有所需活性的寡核苷酸。因此,本发明提供了用于在核酸水平和/或蛋白质水平来抑制醛缩酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的表达的多种组成,如含有本发明的醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的序列,和本发明的抗醛缩酶(如抗丙酮酸醛縮酶,如抗HMG和/或KHG醛縮酶)的抗体的反义链、siRNA、miRNA和核酶。醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛缩酶)的表达的抑制可以具有多种工业应用。例如,抑制醛缩酶(如丙酮酸醛縮酶,如HMG和/或KHG醛缩酶)的表达可以减缓或者抑制腐败。在一些实施方式中,使用抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛缩酶)表达和/或活性的成分以减缓或者抑制腐败(spoilage),例如,所述成分可以为抗体、反义寡核苷酸、核酶、siRNA和miRNA。因此,在一些实施方式中,本发明提供了方法和成分,所述方法包括将本发明的抗体、反义寡核苷酸、核酶、siRNA和miRNA施用到植物或者植物产物(如,谷物、水果、种子、根、叶等)上,以减缓或者抑制腐败。所述成分还可以由所述植物(如转基因植物)或者由另一些生物体(如用本发明的醛縮酶(如,丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)转化的细菌或者其它微生物)表达得到。用于抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的表达的成分(如,反义链、iRNA、核酶和抗体)可以用作药物组合物,如抗病原体药或者其它的治疗剂,如抗微生物(如沙门氏菌)的治疗剂。反义寡核苷酸本发明提供了能够结合醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛缩酶)信息的反义寡聚核苷酸,在一些实施方式中,所述反义寡聚核苷酸能通过靶向mRNA来抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的活性。设计反义寡核苷酸的策略被描述在科学和专利文献中,并且本领域的技术人员根据本发明并通过使用新的试剂,能够设计醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的寡核苷酸。例如,用于筛选有效的反义寡核苷酸基因的步移/RNA定位方法是本领域公知的,见Ho(2000)MethodsEnzymol.314:168-183,该文献描述了RNA定位分析的方法,该方法基于标准的分子技术以提供用于选择潜在的反义序列的容易的可靠的方法;还可以参见Smith(2000)Eur.J.Pharm.Sci,11:191-198。天然存在的核酸可以用作反义寡核苷酸。所述反义寡核苷酸可以是任何长度,例如,在另一些实施方式中,所述反义寡核苷酸的长度为约5-100、约10-80、约15-60、约18-40。最佳的长度可以通过常规的筛选来确定。所述反义寡核苷酸可以以任何的浓度存在。最佳的浓度可以通过常规的筛选来确定。已知存在有大量的合成的、非天然的核苷酸和核酸类似物,可以解决潜在的问题。例如,可以使用含有非离子骨架(如N-(2-氨基乙基)甘氨酸单元)的肽核酸(PNAs)。还可以使用连接有硫代磷酸酯的反义寡核苷酸,关于这方面的内容描述在WO97/03211;WO96/39154;Mata(1997)ToxicolApplPharmacol144:189-197;AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N.J.,1996)。本发明提供的具有合成DNA骨架类似物的反义寡核苷酸还可以包括二硫代磷酸酯、甲基磷酸酯、磷酰氨(phosphoramidate)、烷基磷酸三酯、氨基磺酸盐、3'-硫缩醛、亚甲基(甲基亚氨基)、3'-N-氨基甲酸盐和上述的吗啉代氨基甲酸盐核酸。可以使用组合的化学方法以产生大量的寡核苷酸,可以从这些寡核苷酸中快速地筛选出对任何的靶具有适当的结合亲和力和特异性的寡核苷酸,例如,所述耙可以为本发明的醛缩酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的正义和反义链序列(见Gold(1995)J.ofBiol.Chem.270:13581-13584)。抑制性核酶本发明提供了能够结合醛缩酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)信息的核酶。这些核酶可以通过靶向mRNA来抑制醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛縮酶)的活性。设计核酶和选择醛縮酶(如丙酮酸醛縮酶,如HMG和/或KHG醛缩酶)作为靶的专一性反义序列的策略在科学和专利文献中有描述,并且本领域的技术人员根据本发明并通过使用新的试剂能够设计出这些核酶。所述核酶通过核酶的靶RNA结合部分结合到靶RNA而起作用,所述核酶的靶RNA结合部分以与切割靶RNA的RNA酶性部分非常相似的方式被结合。因此,所述核酶通过互补碱基对来识别和结合靶RNA,并且一旦结合到正确的识别位点后,所述核酶发挥酶的作用切割并钝化靶RNA。如果切割位于编码序列中,靶RNA以这种方式切割将破坏直接合成编码蛋白的能力。在核酶结合并切割靶RNA后,它将从该RNA上释放下来并反复结合以切割新的靶。在一些情况下,所述核酶的酶的性质比其它的技术更有益,如反义技术(核酸分子简单地结合到靶核酸上,以抑制核酸的转录、翻译或者与其它分子的结合),因为,发挥治疗作用所必需的有效核酶的浓度比反义寡核苷酸的浓度低。这种潜在的优点反映了所述核酶作为酶而起作用。因此,单个的核酶分子能够切割多个靶RNA分子。在一些实施方式中,所述核酶是高度专一的抑制剂,且抑制的专一性不仅取决于结合的碱基成对的机制,而且取决于哪些分子抑制所述的分子结合的RNA的表达机制。也就是说,所述抑制是通过切割RNA靶导致的,并且所述专一性被定义为被切割的靶RNA与被切割的非靶RNA的比例。所述切割的机制还取决于除了涉及碱基成对之外的其它因素。因此,所述核酶作用的专一性作用高于能结合相同RNA位点的反义寡核苷酸作用的专一性。本发明的核酶(如具有酶活性的核酶RNA分子)可以以锤头基序、发夹基序、5肝炎病毒基序,I类内含子基序和/或与RNA前导序列相关的RNaseP-类似的RNA基序形成。锤头基序的实例描述在Rossi(1992)AidsResearchandHumanRetroviruses8:183中;发夹基序的实例描述在Hampel(1989)Biochemistry28:4929,andHampel(19卯)Nuc.AcidsRes.18:299中;5肝炎病毒基序的实例描述在Perrotta(1992)Biochemistry31:16中;RNaseP基序描述在Guerrier-Takada(1983)Cell35:849中;和I类内含子基序描述在Cech的美国专利No.4,987,071中。本发明不限于上述的这些特殊的基序。本领域的技术人员将会认识到本发明的核酶(如本发明的具有酶活性的RNA分子)可以具有与一种或多种靶基因RNA区域互补的专一性的底物结合位点。本发明的核酶可以在底物结合位点中或者其周围具有核苷酸序列,所述底物结合位点赋予核酶分子切割RNA的活性。RNA干扰(RNAi)在一些实施方式中,本发明提供了RNA抑制性分子,也称为"RNAi"分子,该分子包括本发明的醛縮酶(如丙酮酸醛缩酶、HMG和/或KHG醛缩酶)的序列。所述RNAi分子包括双链RNA(dsRNA)分子,如siRNA、miRNA和/或短发夹RNA(shRNA)分子。RNAi分子,如siRNA(小的抑制性RNA)和/或miRNA(微小RNA),可以抑制醛縮酶(如丙酮酸醛缩酶、HMG和/或KHG醛縮酶)基因的表达。在一些实施方式中,RNAi分子,如siRNA禾口/或miRNA的长度为约11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或更长的双螺旋的核苷酸。然而,本发明不限于任何特定的作用机制,RNAi可以进入细胞并导致类似的或者相同的序列的单链RNA(ssRNA)(包括内源性的mRNAs)降解。当细胞暴露于双链RNA(dsRNA)的情况下,同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi作用的基本机制可能是与特定基因相匹配的双链(dsRNA)断裂成被称为干扰RNA的短的片段,这种短片段能引发与该短片段相匹配的mRNA降解。在一些实施方式中,本发明的RNAi's被用于基因沉默治疗中,见Shuey(2002)DrugDiscov.Today7:1040-1046。在一些实施方式中,本发明提供了一种使用RNAi's分子选择性降解RNA,根据本发明,所述RNAi's分子为如siRNA禾卩/或miRNA。所述过程可以在体外、离体(exvivo)或者体内实施。在一些实施方式中,本发明的RNAi分子用于可以在细胞、器官或者动物中产生功能缺失变异。在一方面,通过内化结合到含有待吸附的RNAi(如微小RNA)的RNA结合蛋白上的靶细胞的专一性配体,将RNAi导入到细胞内。所述配体对于特定的靶细胞表面抗原是专一性的。所述配体在结合到所述细胞表面抗原上后可以自动地内化。如果所述独特的细胞表面的抗原在结合到其配体后不能自动地内化,那么可以通过将富含精氨酸的肽或者其它能透过膜的肽而掺入到所述配体或者RNA结合蛋白的结构中,或者将所述的肽附加到所述配体或者RNA结合蛋白上,以促进内化。参见美国专利申请发明者C·索尔海特,D·韦纳,E·伯克,P·M·希克斯,P·卢京比尔,S·C·麦克法伦,S·J·戈特,T·理查森,赵立山申请人:嘉吉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1