专利名称:具有抑制癌细胞生长功能的新的人蛋白及其编码序列的利记博彩app
技术领域:
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ IDNO:14、SEQ ID NO:17、SEQ ID NO:20。更佳地,该多核苷酸的序列选自下组SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续的10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有抑癌功能的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(ⅰ)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ⅱ)在一个或多个氨基酸残基中具有取代基团的多肽,或(ⅲ)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(ⅳ)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以SP329蛋白为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID NO:2所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,ALaboratory Manual,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于)(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽(Science,1984;224:1431)。一般来说有以下步骤(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;(2).在合适的培养基中培养的宿主细胞;(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a Laboratory Manual,cold Spring HarborLaboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
上述方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。其例子包括但并不限于常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于)直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有抑癌功能的蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有抑癌功能的蛋白,以抑制内源性的具有抑癌功能的蛋白活性。例如,一种变异的具有抑癌功能的蛋白可以是缩短的、缺失了信号传导功能域的具有抑癌功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于)多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭具有抑癌功能的人蛋白阳性的细胞。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与具有抑癌功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可与其杂交。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,MendelianInheritancein Man(可通过与JohnsHopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1cDNA基因的获得及对癌细胞克隆形成的抑制作用SP329来自于从GIBCO BRL公司购得肝cDNA文库(cat,No.10422-012),PP203,PP238,PP856,PP1065,PP1221,PP2250来自于按常规方法构建的人胎盘cDNA文库。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Seratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript Ⅱ(GIBCO BRL),反转录反应在42℃进行。转化XL10-Gold感受细胞,获得了1×106cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24~48小时,边观察,边换G418浓度不等的培液。约2~3次后,直到镜检细胞有克隆形成,计数。发现SP329,PP203,PP238,PP856,PP1065,PP1221,PP2250和PP3898有抑制细胞克隆形成作用(抑制率在50%或50%以上),结果如下表1所示。
cDNA克隆转染细胞(7721)克隆形成情况
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列。
对SP329、PP203、PP238、PP856、PP1065、PP1221、PP2250、PP3898 cDNA克隆序列分析后发现基因尚不完整,采用Clontech公司SMARTRACE cDNA扩增试剂盒(Cat.No.K1811-1),设计基因特异引物(如下表2所示),按说明书进行操作,获得全长克隆。
表2
具体而言,对各克隆使用如下引物PP203克隆通用引物mix(uPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′巢式通用引物(NUP)5′AAGCAGTGGTAACAACGCAGAGT 3′pp203-NB 5′ACCCCTGGGATCCAACTCTTTGGTG 3′pp203-B 5′CTGGGTATAGGCCACAGCGATCCAA 3′PP238克隆通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3"巢式通用引物(NUP)5′AAGCAGTGGTAACAACGCAGAGT 3′
pp238-NB 5′TGTTCTGCCGGGAGGAGAAGCAGTA 3′pp238-B 5′CCGTTCTTCTTCTCCACCTGCTCCC 3′PP856克隆通用引物mix(UPM) Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′pp856-NB 5′CCAGGGTGACTCAGCTGTCACTCCA 3′pp856-B 5′CCAGAACTTTCCGCAGACCTTGTGC 3′PP1065克隆通用引物mix(UPM) Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′PP1065-B: 5′GGAAAGGGGCTAGCATGAAGGTCCA 3′PP1065-NB 5′TATGTTGGGGTGGGAGGAGCTCTGA 3′PP1221克隆衔接引物1(AP1) 5′CCATCCTAATACGACTCACTATAGGGC 3′27衔接引物2(AP2) 5′ACTCACTATAGGGCTCGAGCGGC 3′23pp1221-C 5′TATGGCTTTCTTGCCAGGAGGGGTC 3′25pp1221-NC 5′CCCTGGGTAGAACGGGTGAAGGGAT 3′25pp2250-C 5′ACAAGGAGAGAGTGCGGCTGCTGAG 3′pp2250-D 5′TGCATGCCACTTTCAGTCAACAGGA 3′PP329克隆衔接引物1(AP1) 5′CCATCCTAATACGACTCACTATAGGGC 3′27衔接引物2(AP2) 5′ACTCACTATAGGGCTCGAGCGGC 3′23sp329-B 5′gcttcgctcaagaagaaaaaggcac 3′ 25sp329-NB 5′aggacctcccaactgcatgcctc 3′ 23其中,对使用通用引物的克隆,获得全长基因按如下操作。用人胎盘组织mRNA为起始材料,按Clontech公司SM ART RACE cDNA扩增试剂盒(cat#1811-1)说明书获得cDNA.然后分别次UPM引物和基因特异的X-B进行第一软PCR,再以NUP引物和基因特异的X-NB进行第二轮PCR,获得基因片段(注X为基因克隆号码)。
反应条件为94℃3′一个循环(第一轮)94℃1′58℃1′72℃2′35个循环72℃10′一个循环(第二轮)同上,但退火温度为60℃对使用衔接引物的克隆,以Clonteoh公司Marathon-Ready人肝cDNA(cat#7407-1)为样板,分别以Apl和X-C引物进行第一轮PCR,再以Apl和X-NC进行第二轮PCR获得基因片段(注X为基因克隆号码)。反应条件同上。
PP2250以人胎盘cDNA为样板,PP2250-C,PP2250-D为引物按94℃3′1个循环,94℃1′60℃1′1 70℃2′35个循环,72℃10′一个循环进行PCR,获得基因片段。
实施例2cDNA克隆序列分析
1.SP329A核苷酸序列(SEQ ID NO:1)长度2360TGTCAGTAAG TGGAAAAGGC AAGACTCCAC TTCGAAAGAG GTACAACTCC CATCAGATGG 60GCCAGTCGAA GCAGTTTCCC CTCGAGGAAA GCAGCTGTGA GAAAGGCTGT CAGGTCACCA 120GTGAGCAGAT CAAAGCCGAT ATGAAAGCAG CTAGGGATAT TCCTGAAAAG AAAAAAAACA 180AGGATGTTTA TCCCAGCTGC AGCAGCACCA CCGCCAGCAC AGTGGGAAAC TCCAGCTCAC 240ACAACACTGC TTCTCAAAGC CCCGACTTTG TAAGGACGGT GAACAGCGGC GGCTCTTCCG 300AGCCTAGCCC TACAGAAGTG GATGTGTCCA GGCAGTGTGC CTGCTCCCCC GGTGGGTCAG 360AGGACTCTGA GGCCATGGAG GAGGGAGATG CAGAGAGTTC TGTCTGCCCA GATGCTTGCT 420GTCACAGGCC CCAGGAATTC CCAAAGGAGA ACTAGCAGGT GTTCTGATGA GGAACGTCCT 480TCAACCAGCC GAGCCTGTGT TGTGAATGGC CCGGATGGTA CGAGATCCGC CTTTTCCTTT 540AGGACTCTGC CACAAGGGGG GTCTTCAGGC CCAGCACATG ATGAGAGGAC TAATGGGAGT 600GGCTCTGGGG CTACAGGTGA GGACAGGAGG GGGAGCTCCC AGCCTGAGAG TTGTGACGTG 660CAGTCTAATG AAGACTACCC TCGGAGGCCC CTAACCAGGG CCAGGAGCAG ACTGTCCCAT 720GTACTGCTGG TATCTGAGTC AGAAGTAGCC AAAACAAAGC CACGTCACGC CATGAAACGG 780AAGCGGACAG CAGATAAATC CACTAGTACA AGTGATCCTG TGATCGAGGA TGACCATGTG 840CAGGTTCTTG TATTAAAATC CAAGAATCTT GTTGGAGTCA CTATGACCAA TTGTGGAATC 900ACAGATCTAG TGCTAAAAGA CTGTCCAAAG ATGATGTTCA TCCATGCTAC CAGGTGCAGG 960GTACTAAAAC ATTTAAAGGT AGAAAATGCA CCAATTGTAA ACCGATTTGA CTATGCACAG 1020TGCAAGAAAC TGAACATGGA TCAGGTACTA GACCAGATAC TAAGAATGCC ACCCGAGAGA 1080AACCGCATCA TATACCTACG CCCAATGCAG CAGGTGGACA CTCTAACTTT GGAGCAGAAG 1140CTATTTAGTG GTCCCTACCC CTATCACATC TGTATTATCC ATGAATTCAG TAACCCTCCC 1200AATGTCCGGA ATAAGGTGCG CATTCGCAGC TGGATGGACA CTATAGCAAA CATCAATCAA 1260GAGCTCATTA AATATGAATT CTTCCCTGAA GCCACTCGAA GTGAAGAAGA CTTAAAGAAA 1320TACCCCAAGT ACCCCTGGGG GAGAGAAATC TATACTTTAG AAGGTGTTGT GGATGGAGCT 1380CCATATTCCA TGATTTCTGA CTTCCCTTGG CTGAGGTCAT TACGAGCTGC AGAGCCCAAC 1440AGCTTCGCTC GATACGACTT TGAAGACGAT GAAGAAAGCA CTATCTATGC TCCTAGAAGG 1500AAAGGACAGC TGTCTGCAGA CATCTGTATG GAAACAATAG GAGAGGAAAT TTCAGAGATG 1560CGTCAGATGA AGAAGGGTGT ATTTCAGCGA GTAGTGGCAA TTTTTATCCA CTATTGTGAT 1620GTCAATGGAG AGCCAGTTGA AGATGACTAC ATTTAATTGG TCCCTCCTCC TTTCCAGCTA 1680TTTTGTCAGA AAGCAAGTAG GGCCATCCAG CTGCCAGAGT GCTCCACAGG GACTTGAGGC 1740ATGCAGTTGG GAGGTCCTGG CTCGGTTTGC TATATAGGGA ATATATAAGG AACATCGAAA 1800TTGTATACAA AGATTTGTAC ATAAAAAATA TACAAAGACG CTTCCTAAAG TACCAACTTT 1860ATATCATATG TTTATACAAT TTAATTTAAA AATTCATTTT AAGGAAGACA GATAATTTGA 1920AAGACTTTTG TTTTTCTTGA CTTAATTCAT GAAGTATCAT TTTTTGACTG AGTCTCCATT 1980TACTTCATTC TTAATGATTA TTGTCATCCC TTTAAATCTG TGCCTTTTTC TTCTTGAGCG 2040AAGCTGTTTG AGTAAACCTG TTGAAGAGTG TTTGTGTCTT GTGTGCTTTT TTGTTGTTAT 2100TAAAACACCA ACTAAACCTT ATAGTCAAGA CAAGGCTCTA TGTTTCTGTA CAAAGCTGTA 2160GTTCTTTCTT AGTATTATAG TTGCCATGTT TCTTAAAATC AAGTAAAAAG ACTTATGAGC 2220TTAAAAAAAA GTGAGTTTGA GAGGGAAATG GAAAAGTTTC CAGAGTATTT CTAGTAATTA 2280TTTCCACATT GAATTGTGTA TATGCTTTAT CTTGAATATA AAATAAAAGT TTATTAAAAA 2340CTTTAAAAAA AAAAAAAAAA 2360B氨基酸序列(SEQ ID NO:2)长度4441 MCPGSVPAPP VGQRTLRPWR REMQRVLSAQ MLAVTGPRNS QRRTSRCSDE51 ERPSTSRACV VNGPDGTRSA FSFRTLPQGG SSGPAHDERT NGSGSGATGE101 DRRGSSQPES CDVQSNEDYP RRPLTRARSR LSHVLLVSES EVAKTKPRHA151 MKRKRTADKS TSTSDPVIED DHVQVLVLKS KNLVGVTMTN CGITDLVLKD201 CPKMMFIHAT RCRVLKHLKV ENAPIVNRFD YAQCKKLNMD QVLDQILRMP251 PERNRIIYLR PMQQVDTLTL EQKLFSGPYP YHICIIHEFS NPPNVRNKVR301 IRSWMDTIAN INQELIKYEF FPEATRSEED LKKYPKYPWG REIYTLEGVV351 DGAPYSMISD FPWLRSLRAA EPNSFARYDF EDDEESTIYA PRRKGQLSAD401 ICMETIGEEI SEMRQMKKGV FQRVVAIFIH YCDVNGEPVE DDYI克隆号 SP329(SEQ ID NO:3)起始编码子 322 ATG 终止编码子1656TAA蛋白质分子量50647.031 TGT CAG TAA GTG GAA AAG GCA AGA CTC CAC TTC GAA AGA GGT ACA ACT 4849 CCC ATC AGA TGG GCC AGT CGA AGC AGT TTC CCC TCG AGG AAA GCA GCT 9697 GTG AGA AAG GCT GTC AGG TCA CCA GTG AGC AGA TCA AAG CCG ATA TGA 144145 AAG CAG CTA GGG ATA TTC CTG AAA AGA AAA AAA ACA AGG ATG TTT ATC 192193 CCA GCT GCA GCA GCA CCA CCG CCA GCA CAG TGG GAA ACT CCA GCT CAC 240241 ACA ACA CTG CTT CTC AAA GCC CCG ACT TTG TAA GGA CGG TGA ACA GCG 288289 GCG GCT CTT CCG AGC CTA GCC CTA CAG AAG TGG ATG TGT CCA GGC AGT 3361 Met Cys Pro Gly Ser 5337 GTG CCT GCT CCC CCG GTG GGT CAG AGG ACT CTG AGG CCA TGG AGG AGG 3846 Val Pro Ala Pro Pro Val Gly Gln Arg Thr Leu Arg Pro Trp Arg Arg 21385 GAG ATG CAG AGA GTT CTG TCT GCC CAG ATG CTT GCT GTC ACA GGC CCC 43222 Glu Met Gln Arg Val Leu Ser Ala Gln Met Leu Ala Val Thr Gly Pro 37433 AGG AAT TCC CAA AGG AGA ACT AGC AGG TGT TCT GAT GAG GAA CGT CCT 48038 Arg Asn Ser Gln Arg Arg Thr Ser Arg Cys Ser Asp Glu Glu Arg Pro 53481 TCA ACC AGC CGA GCC TGT GTT GTG AAT GGC CCG GAT GGT ACG AGA TCC 52854 Ser Thr Ser Arg Ala Cys Val Val Asn Gly Pro Asp Gly Thr Arg Ser 69529 GCC TTT TCC TTT AGG ACT CTG CCA CAA GGG GGG TCT TCA GGC CCA GCA 57670 Ala Phe Ser Phe Arg Thr Leu Pro Gln Gly Gly Ser Ser Gly Pro Ala 85577 CAT GAT GAG AGG ACT AAT GGG AGT GGC TCT GGG GCT ACA GGT GAG GAC 62486 His Asp Glu Arg Thr Asn Gly Ser Gly Ser Gly Ala Thr Gly Glu Asp 101625 AGG AGG GGG AGC TCC CAG CCT GAG AGT TGT GAC GTG CAG TCT AAT GAA 672102 Arg Arg Gly Ser Ser Gln Pro Glu Ser Cys Asp Val Gln Ser Asn Glu 117673 GAC TAC CCT CGG AGG CCC CTA ACC AGG GCC AGG AGC AGA CTG TCC CAT 720118 Asp Tyr Pro Arg Arg Pro Leu Thr Arg Ala Arg Ser Arg Leu Ser His 133721 GTA CTG CTG GTA TCT GAG TCA GAA GTA GCC AAA ACA AAG CCA CGT CAC 768134 Val Leu Leu Val Ser Glu Ser Glu Val Ala Lys Thr Lys Pro Arg His 149769 GCC ATG AAA CGG AAG CGG ACA GCA GAT AAA TCC ACT AGT ACA AGT GAT 816150 Ala Met Lys Arg Lys Arg Thr Ala Asp Lys Ser Thr Ser Thr Ser Asp 165817 CCT GTG ATC GAG GAT GAC CAT GTG CAG GTT CTT GTA TTA AAA TCC AAG 864166 Pro Val Ile Glu Asp Asp His Val Gln Val Leu Val Leu Lys Ser Lys 181865 AAT CTT GTT GGA GTC ACT ATG ACC AAT TGT GGA ATC ACA GAT CTA GTG 912182 Asn Leu Val Gly Val Thr Met Thr Asn Cys Gly Ile Thr Asp Leu Val 197913 CTA AAA GAC TGT CCA AAG ATG ATG TTC ATC CAT GCT ACC AGG TGC AGG 960198 Leu Lys Asp Cys Pro Lys Met Met Phe Ile His Ala Thr Arg Cys Arg 213961 GTA CTA AAA CAT TTA AAG GTA GAA AAT GCA CCA ATT GTA AAC CGA TTT1008214 Val Leu Lys His Leu Lys Val Glu Asn Ala Pro Ile Val Asn Arg Phe 2291009 GAC TAT GCA CAG TGC AAG AAA CTG AAC ATG GAT CAG GTA CTA GAC CAG1056230 Asp Tyr Ala Gln Cys Lys Lys Leu Asn Met Asp Gln Val Leu Asp Gln 2451057 ATA CTA AGA ATG CCA CCC GAG AGA AAC CGC ATC ATA TAC CTA CGC CCA1104246 Ile Leu Arg Met Pro Pro Glu Arg Asn Arg Ile Ile Tyr Leu Arg Pro 2611105 ATG CAG CAG GTG GAC ACT CTA ACT TTG GAG CAG AAG CTA TTT AGT GGT1152262 Met Gln Gln Val Asp Thr Leu Thr Leu Glu Gln Lys Leu Phe Ser Gly 2771153 CCC TAC CCC TAT CAC ATC TGT ATT ATC CAT GAA TTC AGT AAC CCT CCC1200278 Pro Tyr Pro Tyr His Ile Cys Ile Ile His Glu Phe Ser Asn Pro Pro 2931201 AAT GTC CGG AAT AAG GTG CGC ATT CGC AGC TGG ATG GAC ACT ATA GCA1248294 Asn Val Arg Asn Lys Val Arg Ile Arg Ser Trp Met Asp Thr Ile Ala 3091249 AAC ATC AAT CAA GAG CTC ATT AAA TAT GAA TTC TTC CCT GAA GCC ACT1296310 Asn Ile Asn Gln Glu Leu Ile Lys Tyr Glu Phe Phe Pro Glu Ala Thr 3251297 CGA AGT GAA GAA GAC TTA AAG AAA TAC CCC AAG TAC CCC TGG GGG AGA1344326 Arg Ser Glu Glu Asp Leu Lys Lys Tyr Pro Lys Tyr Pro Trp Gly Arg 3411345 GAA ATC TAT ACT TTA GAA GGT GTT GTG GAT GGA GCT CCA TAT TCC ATG1392342 Glu Ile Tyr Thr Leu Glu Gly Val Val Asp Gly Ala Pro Tyr Ser Met 3571393 ATT TCT GAC TTC CCT TGG CTG AGG TCA TTA CGA GCT GCA GAG CCC AAC1440358 Ile Ser Asp Phe Pro Trp Leu Arg Ser Leu Arg Ala Ala Glu Pro Asn 3731441 AGC TTC GCT CGA TAC GAC TTT GAA GAC GAT GAA GAA AGC ACT ATC TAT1488374 Ser Phe Ala Arg Tyr Asp Phe Glu Asp Asp Glu Glu Ser Thr Ile Tyr 3891489 GCT CCT AGA AGG AAA GGA CAG CTG TCT GCA GAC ATC TGT ATG GAA ACA1536390 Ala Pro Arg Arg Lys Gly Gln Leu Ser Ala Asp Ile Cys Met Glu Thr 4051537 ATA GGA GAG GAA ATT TCA GAG ATG CGT CAG ATG AAG AAG GGT GTA TTT1584406 Ile Gly Glu Glu Ile Ser Glu Met Arg Gln Met Lys Lys Gly Val Phe 4211585 CAG CGA GTA GTG GCA ATT TTT ATC CAC TAT TGT GAT GTC AAT GGA GAG1632422 Gln Arg Val Val Ala Ile Phe Ile His Tyr Cys Asp Val Asn Gly Glu 4371633 CCA GTT GAA GAT GAC TAC ATT TAA TTG GTC CCT CCT CCT TTC CAG CTA1680438 Pro Val Glu Asp Asp Tyr Ile *** 4451681 TTT TGT CAG AAA GCA AGT AGG GCC ATC CAG CTG CCA GAG TGC TCC ACA17281729 GGG ACT TGA GGC ATG CAG TTG GGA GGT CCT GGC TCG GTT TGC TAT ATA17761777 GGG AAT ATA TAA GGA ACA TCG AAA TTG TAT ACA AAG ATT TGT ACA TAA18241825 AAA ATA TAC AAA GAC GCT TCC TAA AGT ACC AAC TTT ATA TCA TAT GTT18721873 TAT ACA ATT TAA TTT AAA AAT TCA TTT TAA GGA AGA CAG ATA ATT TGA19201921 AAG ACT TTT GTT TTT CTT GAC TTA ATT CAT GAA GTA TCA TTT TTT GAC19681969 TGA GTC TCC ATT TAC TTC ATT CTT AAT GAT TAT TGT CAT CCC TTT AAA20162017 TCT GTG CCT TTT TCT TCT TGA GCG AAG CTG TTT GAG TAA ACC TGT TGA20642065 AGA GTG TTT GTG TCT TGT GTG CTT TTT TGT TGT TAT TAA AAC ACC AAC21122113 TAA ACC TTA TAG TCA AGA CAA GGC TCT ATG TTT CTG TAC AAA GCT GTA21602161 GTT CTT TCT TAG TAT TAT AGT TGC CAT GTT TCT TAA AAT CAA GTA AAA22082209 AGA CTT ATG AGC TTA AAA AAA AGT GAG TTT GAG AGG GAA ATG GAA AAG22562257 TTT CCA GAG TAT TTC TAG TAA TTA TTT CCA CAT TGA ATT GTG TAT ATG23042305 CTT TAT CTT GAA TAT AAA ATA AAA GTT TAT TAA AAA CTT TAA AAA AAA23522353 AAA AAA AA 23602.PP203A核苷酸序列(SEQ ID NO:4)长度2379GGTGCACACC CGGAAGTGGG TGCGGGCCAG CCGGCTCGCC CGGGGGCCAT GGCAGCAGCG 60GCTACTGCAG CCGAGGGGGT CCCCAGTCGG GGGCCTCCCG GGGAAGTCAT TCATCTGAAT 120GTGGGAGGCA AGAGATTCAG TACCTCTCGC CAGACTCTCA CCTGGATCCC AGACTCCTTC 180TTCTCCAGTC TTCTGAGCGG ACGCATCTCG ACGCTGAAAG ATGAGACCGG AGCAATCTTC 240ATCGACAGGG ACCCTACAGT CTTCGCCCCC ATCCTCAACT TCCTGCGCAC CAAAGAGTTG 300GATCCCAGGG GTGTCCACGG TTCCAGCCTC CTCCATGAAG CCCAGTTCTA TGGGCTCACT 360CCTCTGGTTC GTCGCCTGCA GCTTCGAGAG GAGTTGGATC GATCTTCTTG TGGAAACGTC 420CTCTTCAATG GTTACCTGCC GCCACCAGTG TTCCCAGTGA AGCGGCGGAA CCGGCACAGC 480CTAGTGGGGC CTCAGCAGCT AGGAGGACGG CCAGCCCCTG TCCGACGGAG CAACACGATG 540CCCCCCAACC TTGGCAATGC AGGGCTGCTG GGCCGAATGC TGGATGAGAA AACCCCTCCC 600TCACCCTCAG GACAACCTGA GGAGCCGGGG ATGGTGCGCC TGGTGTGTGG ACACCATAAT 660TGGATCGCTG TGGCCTATAC CCAGTTTCTA GTCTGCTACA GGTTGAAGGA AGCCTCTGGC 720TGGCAGCTGG TGTTTTCCAG CCCCCGCCTG GACTGGCCCA TCGAACGACT GGCGCTCACA 780GCCCGGGTGC ATGGTGGGGC TTTGGGTGAA CATGACAAGA TGGTGGCAGC AGCCACCGGC 840AGCGAGATCC TGCTATGGGC TCTGCAGGCG GAAGGCGGTG GCTCCGAGAT AGGGGTCTTT 900CATCTGGGGG TGCCTGTGGA GGCCTTGTTC TTCGTCGGGA ACCAGCTCAT TGCTACAAGC 960CACACAGGGC GCATCGGGGT GTGGAATGCC GTCACCAAGC ACTGGCAGGT CCAGGAGGTG 1020CAGCCCATCA CCAGTTATGA CGCGGCAGGC TCCTTCCTCC TCCTGGGCTG CAACAACGGC 1080TCCATTTACT ACGTGGATGT GCAGAAGTTC CCCTTGCGCA TGAAAGACAA CGACCTCCTT 1140GTCAGCGAGC TCTATCGGGA CCCAGCGGAG GATGGGGTCA CCGCCCTCAG TGTCTACCTC 1200ACCCCCAAGA CCAGTGACAG TGGGAACTGG ATCGAGATCG CCTATGGCAC CAGCTCAGGG 1260GGCGTGCGGG TCATCGTGCA GCACCCGGAG ACTGTGGGCT CGGGGCCTCA GCTCTTCCAG 1320ACCTTCACTG TGCACCGCAG CCCTGTCACC AAGATCATGC TGTCGGAGAA GCACCTCATC 1380TCAGTCTGTG CCGACAACAA CCACGTGCGG ACATGGTCTG TGACTCGCTT CCGCGGCATG 1440ATTTCCACCC AGCCCGGCTC CACCCCACTC GCTTCCTTTA AGATCCTGGC TCTGGAGTCG 1500GCAGATGGGC ATGGCGGCTG CAGTGCTGGC AATGACATTG GCCCCTACGG TGAGCGGGAC 1560GACCAGCAAG TGTTCATCCA GAAGGTGGTG CCCAGTGCCA GCCAGCTCTT CGTGCGTCTC 1620TCATCTACTG GGCAGCGGGT GTGCTCCGTG CGCTCCGTGG ACGGCTCACC CACGACGGCC 1680TTCACAGTGC TGGAGTGCGA GGGCTCCCGG CGGCTCGGCT CTCGGCCCCG GCGCTACCTG 1740CTCACTGGCC AGGCCAACGG CAGCTTGGCC ATGTGGGACC TAACCACCGC CATGGACGGC 1800CTCGGCCAGG CCCCTGCAGG TGGCCTGACG GAGCAAGAGC TGATGGAACA GCTGGAACAC 1860TGTGAGCTGG CCCCGCCGGC TCCTTCAGCT CCCTCATGGG GCTGTCTCCC CAGCCCCTCA 1920CCCCGCATCT CCCTCACCAG CCTCCACTCA GCCTCCAGCA ACACCTCCTT GTCTGGCCAC 1980CGTGGGAGCC CAAGCCCCCC GCAGGCTGAG GCCCGGCGCC GTGGTGGGGG CAGCTTTGTG 2040GAACGCTGCC AGGAACTGGT GCGGAGTGGG CCAGACCTCC GACGGCCACC CACACCAGCC 2100CCGTGGCCCT CCAGCGGTCT CGGCACTCCC CTCACACCTC CCAAGATGAA GCTCAATGAA 2160ACTTCCTTTT GAACAACGCA GCTGCCATGA TGCCTTGGGA TGCCCTGGTC CTGGGGGACT 2220CAGGTGCCTC CCTGATTCCT GTGGGAACCC CGGGTTCAGG GCCAGGGCCT CCTTGGAATA 2280AATGGTTATT GTTACTAGGT CCCCACCTTC CCTCTTTTCT GGAAGCCAAA GTCAGCCTCC 2340CCAATAAAGT CCTCACTGCC AAAAAAAAAA AAAAAAAAA 2379B氨基酸序列(SEQ ID NO:5)长度7071 MAAAATAAEG VPSRGPPGEV IHLNVGGKRF STSRQTLTWI PDSFFSSLLS51 GRISTLKDET GAIFIDRDPT VFAPILNFLR TKELDPRGVH GSSLLHEAQF101 YGLTPLVRRL QLREELDRSS CGNVLFNGYL PPPVFPVKRR NRHSLVGPQQ151 LGGRPAPVRR SNTMPPNLGN AGLLGRMLDE KTPPSPSGQP EEPGMVRLVC201 GHHNWIAVAY TQFLVCYRLK EASGWQLVFS SPRLDWPIER LALTARVHGG251 ALGEHDKMVA AATGSEILLW ALQAEGGGSE IGVFHLGVPV EALFFVGNQL301 IATSHTGRIG VWNAVTKHWQ VQEVQPITSY DAAGSFLLLG CNNGSIYYVD351 VQKFPLRMKD NDLLVSELYR DPAEDGVTAL SVYLTPKTSD SGNWIEIAYG401 TSSGGVRVIV QHPETVGSGP QLFQTFTVHR SPVTKIMLSE KHLISVCADN451 NHVRTWSVTR FRGMISTQPG STPLASFKIL ALESADGHGG CSAGNDIGPY501 GERDDQQVFI QKVVPSASQL FVRLSSTGQR VCSVRSVDGS PTTAFTVLEC551 EGSRRLGSRP RRYLLTGQAN GSLAMWDLTT AMDGLGQAPA GGLTEQELME601 QLEHCELAPP APSAPSWGCL PSPSPRISLT SLHSASSNTS LSGHRGSPSP651 PQAEARRRGG GSFVERCQEL VRSGPDLRRP PTPAPWPSSG LGTPLTPPKM701 KLNETSF克隆号PP203(SEQ ID NO:6)起始编码子49 ATG 终止编码子2172TGA蛋白质分子量76339.521 GGT GCA CAC CCG GAA GTG GGT GCG GGC CAG CCG GCT CGC CCG GGG GCC 4849 ATG GCA GCA GCG GCT ACT GCA GCC GAG GGG GTC CCC AGT CGG GGG CCT 961 Met Ala Ala Ala Ala Thr Ala Ala Glu Gly Val Pro Ser Arg Gly Pro 1697 CCC GGG GAA GTC ATT CAT CTG AAT GTG GGA GGC AAG AGA TTC AGT ACC 14417 Pro Gly Glu Val Ile His Leu Asn Val Gly Gly Lys Arg Phe Ser Thr 32145 TCT CGC CAG ACT CTC ACC TGG ATC CCA GAC TCC TTC TTC TCC AGT CTT 19233 Ser Arg Gln Thr Leu Thr Trp Ile Pro Asp Ser Phe Phe Ser Ser Leu 48193 CTG AGC GGA CGC ATC TCG ACG CTG AAA GAT GAG ACC GGA GCA ATC TTC 24049 Leu Ser Gly Arg Ile Ser Thr Leu Lys Asp Glu Thr Gly Ala Ile Phe 64241 ATC GAC AGG GAC CCT ACA GTC TTC GCC CCC ATC CTC AAC TTC CTG CGC 28865 Ile Asp Arg Asp Pro Thr Val Phe Ala Pro Ile Leu Ash Phe Leu Arg 80289 ACC AAA GAG TTG GAT CCC AGG GGT GTC CAC GGT TCC AGC CTC CTC CAT 33681 Thr Lys Glu Leu Asp Pro Arg Gly Val His Gly Ser Ser Leu Leu His 96337 GAA GCC CAG TTC TAT GGG CTC ACT CCT CTG GTT CGT CGC CTG CAG CTT 38497 Glu Ala Gln Phe Tyr Gly Leu Thr Pro Leu Val Arg Arg Leu Gln Leu 112385 CGA GAG GAG TTG GAT CGA TCT TCT TGT GGA AAC GTC CTC TTC AAT GGT 432113 Arg Glu Glu Leu Asp Arg Ser Ser Cys Gly Asn Val Leu Phe Asn Gly 128433 TAC CTG CCG CCA CCA GTG TTC CCA GTG AAG CGG CGG AAC CGG CAC AGC 480129 Tyr Leu Pro Pro Pro Val Phe Pro Val Lys Arg Arg Asn Arg His Ser 144481 CTA GTG GGG CCT CAG CAG CTA GGA GGA CGG CCA GCC CCT GTC CGA CGG 528145 Leu Val Gly Pro Gln Gln Leu Gly Gly Arg Pro Ala Pro Val Arg Arg 160529 AGC AAC ACG ATG CCC CCC AAC CTT GGC AAT GCA GGG CTG CTG GGC CGA 576161 Ser Asn Thr Met Pro Pro Asn Leu Gly Asn Ala Gly Leu Leu Gly Arg 176577 ATG CTG GAT GAG AAA ACC CCT CCC TCA CCC TCA GGA CAA CCT GAG GAG 624177 Met Leu Asp Glu Lys Thr Pro Pro Ser Pro Ser Gly Gln Pro Glu Glu 192625 CCG GGG ATG GTG CGC CTG GTG TGT GGA CAC CAT AAT TGG ATC GCT GTG 672193 Pro Gly Met Val Arg Leu Val Cys Gly His His Asn Trp Ile Ala Val 208673 GCC TAT ACC CAG TTT CTA GTC TGC TAC AGG TTG AAG GAA GCC TCT GGC 720209 Ala Tyr Thr Gln Phe Leu Val Cys Tyr Arg Leu Lys Glu Ala Ser Gly 224721 TGG CAG CTG GTG TTT TCC AGC CCC CGC CTG GAC TGG CCC ATC GAA CGA 768225 Trp Gln Leu Val Phe Ser Ser Pro Arg Leu Asp Trp Pro Ile Glu Arg 240769 CTG GCG CTC ACA GCC CGG GTG CAT GGT GGG GCT TTG GGT GAA CAT GAC 816241 Leu Ala Leu Thr Ala Arg Val His Gly Gly Ala Leu Gly Glu His Asp 256817 AAG ATG GTG GCA GCA GCC ACC GGC AGC GAG ATC CTG CTA TGG GCT CTG 864257 Lys Met Val Ala Ala Ala Thr Gly Ser Glu Ile Leu Leu Trp Ala Leu 272865 CAG GCG GAA GGC GGT GGC TCC GAG ATA GGG GTC TTT CAT CTG GGG GTG 912273 Gln Ala Glu Gly Gly Gly Ser Glu Ile Gly Val Phe His Leu Gly Val 288913 CCT GTG GAG GCC TTG TTC TTC GTC GGG AAC CAG CTC ATT GCT ACA AGC 960289 Pro Val Glu Ala Leu Phe Phe Val Gly Asn Gln Leu Ile Ala Thr Ser 304961 CAC ACA GGG CGC ATC GGG GTG TGG AAT GCC GTC ACC AAG CAC TGG CAG1008305 His Thr Gly Arg Ile Gly Val Trp Asn Ala Val Thr Lys His Trp Gln 3201009 GTC CAG GAG GTG CAG CCC ATC ACC AGT TAT GAC GCG GCA GGC TCC TTC1056321 Val Gln Glu Val Gln Pro Ile Thr Ser Tyr Asp Ala Ala Gly Ser Phe 3361057 CTC CTC CTG GGC TGC AAC AAC GGC TCC ATT TAC TAC GTG GAT GTG CAG1104337 Leu Leu Leu Gly Cys Asn Asn Gly Ser Ile Tyr Tyr Val Asp Val Gln 3521105 AAG TTC CCC TTG CGC ATG AAA GAC AAC GAC CTC CTT GTC AGC GAG CTC1152353 Lys Phe Pro Leu Arg Met Lys Asp ASn Asp Leu Leu Val Ser Glu Leu 3681153 TAT CGG GAC CCA GCG GAG GAT GGG GTC ACC GCC CTC AGT GTC TAC CTC1200369 Tyr Arg Asp Pro Ala Glu Asp Gly Val Thr Ala Leu Ser Val Tyr Leu 3841201 ACC CCC AAG ACC AGT GAC AGT GGG AAC TGG ATC GAG ATC GCC TAT GGC1248385 Thr Pro Lys Thr Ser Asp Ser Gly Asn Trp Ile Glu Ile Ala Tyr Gly 4001249 ACC AGC TCA GGG GGC GTG CGG GTC ATC GTG CAG CAC CCG GAG ACT GTG1296401 Thr Ser Ser Gly Gly Val Arg Val Ile Val Gln His Pro Glu Thr Val 4161297 GGC TCG GGG CCT CAG CTC TTC CAG ACC TTC ACT GTG CAC CGC AGC CCT1344417 Gly Ser Gly Pro Gln Leu Phe Gln Thr Phe Thr Val His Arg Ser Pro 4321345 GTC ACC AAG ATC ATG CTG TCG GAG AAG CAC CTC ATC TCA GTC TGT GCC1392433 Val Thr Lys Ile Met Leu Ser Glu Lys His Leu Ile Ser Val Cys Ala 4481393 GAC AAC AAC CAC GTG CGG ACA TGG TCT GTG ACT CGC TTC CGC GGC ATG1440449 Asp Asn Asn His Val Arg Thr Trp Ser Val Thr Arg Phe Arg Gly Met 4641441 ATT TCC ACC CAG CCC GGC TCC ACC CCA CTC GCT TCC TTT AAG ATC CTG1488465 Ile Ser Thr Gln Pro Gly Ser Thr Pro Leu Ala Ser Phe Lys Ile Leu 4801489 GCT CTG GAG TCG GCA GAT GGG CAT GGC GGC TGC AGT GCT GGC AAT GAC1536481 Ala Leu Glu Ser Ala Asp Gly His Gly Gly Cys Ser Ala Gly Asn Asp 4961537 ATT GGC CCC TAC GGT GAG CGG GAC GAC CAG CAA GTG TTC ATC CAG AAG1584497 Ile Gly Pro Tyr Gly Glu Arg Asp Asp Gln Gln Val Phe Ile Gln Lys 5121585 GTG GTG CCC AGT GCC AGC CAG CTC TTC GTG CGT CTC TCA TCT ACT GGG1632513 Val Val Pro Ser Ala Ser Gln Leu Phe Val Arg Leu Ser Ser Thr Gly 5281633 CAG CGG GTG TGC TCC GTG CGC TCC GTG GAC GGC TCA CCC ACG ACG GCC1680529 Gln Arg Val Cys Ser Val Arg Ser Val Asp Gly Ser Pro Thr Thr Ala 5441681 TTC ACA GTG CTG GAG TGC GAG GGC TCC CGG CGG CTC GGC TCT CGG CCC1728545 Phe Thr Val Leu Glu Cys Glu Gly Ser Arg Arg Leu Gly Ser Arg Pro 5601729 CGG CGC TAC CTG CTC ACT GGC CAG GCC AAC GGC AGC TTG GCC ATG TGG1776561 Arg Arg Tyr Leu Leu Thr Gly Gln Ala Asn Gly Ser Leu Ala Met Trp 5761777 GAC CTA ACC ACC GCC ATG GAC GGC CTC GGC CAG GCC CCT GCA GGT GGC1824577 Asp Leu Thr Thr Ala Met Asp Gly Leu Gly Gln Ala Pro Ala Gly Gly 5921825 CTG ACG GAG CAA GAG CTG ATG GAA CAG CTG GAA CAC TGT GAG CTG GCC1872593 Leu Thr Glu Gln Glu Leu Met Glu Gln Leu Glu His Cys Glu Leu Ala 6081873 CCG CCG GCT CCT TCA GCT CCC TCA TGG GGC TGT CTC CCC AGC CCC TCA1920609 Pro Pro Ala Pro Ser Ala Pro Ser Trp Gly Cys Leu Pro Ser Pro Ser 6241921 CCC CGC ATC TCC CTC ACC AGC CTC CAC TCA GCC TCC AGC AAC ACC TCC1968625 Pro Arg Ile Ser Leu Thr Ser Leu His Ser Ala Ser Ser Asn Thr Ser 6401969 TTG TCT GGC CAC CGT GGG AGC CCA AGC CCC CCG CAG GCT GAG GCC CGG2016641 Leu Ser Gly His Arg Gly Ser Pro Ser Pro Pro G1n Ala Glu Ala Arg 6562017 CGC CGT GGT GGG GGC AGC TTT GTG GAA CGC TGC CAG GAA CTG GTG CGG2064657 Arg Arg Gly Gly Gly Ser Phe Val Glu Arg Cys Gln Glu Leu Val Arg 6722065 AGT GGG CCA GAC CTC CGA CGG CCA CCC ACA CCA GCC CCG TGG CCC TCC2112673 Ser Gly Pro Asp Leu Arg Arg Pro Pro Thr Pro Ala Pro Trp Pro Ser 6882113 AGC GGT CTC GGC ACT CCC CTC ACA CCT CCC AAG ATG AAG CTC AAT GAA2160689 Ser Gly Leu Gly Thr Pro Leu Thr Pro Pro Lys Met Lys Leu ASn Glu 7042161 ACT TCC TTT TGA ACA ACG CAG CTG CCA TGA TGC CTT GGG ATG CCC TGG2208705 Thr Ser Phe *** 7082209 TCC TGG GGG ACT CAG GTG CCT CCC TGA TTC CTG TGG GAA CCC CGG GTT22562257 CAG GGC CAG GGC CTC CTT GGA ATA AAT GGT TAT TGT TAC TAG GTC CCC23042305 ACC TTC CCT CTT TTC TGG AAG CCA AAG TCA GCC TCC CCA ATA AAG TCC23522353 TCA CTG CCA AAA AAA AAA AAA AAA AAA23793.PP238A核苷酸序列(SEQ ID NO:7)长度2023GGGCTAGGGC CGGGGCCTGG CTGCGCGGCT GGGCCAAGGC CCGCGATGGT GATCTGCTGT 60GCGGCCGTGA ACTGCTCCAA CCGGCAGGGA AAGGGCGAGA AGCGCGCCGT CTCCTTCCAC 120AGGTTCCCCC TAAAGGACTC AAAACGTCTA ATCCAATGGT TAAAAGCTGT TCAGAGGGAT 180AACTGGACTC CCACTAAGTA TTCATTTCTC TGTAGTGAGC ATTTCACCAA AGACAGCTTC 240TCCAAGAGGC TGGAGGACCA GCATCGCCTG CTGAAGCCCA CGGCCGTGCC ATCCATCTTC 300CACCTGACCG AGAAGAAGAG GGGGGCTGGA GGCCATGGCC GCACCCGGAG AAAAGATGCC 360AGCAAGGCCA CAGGGGGTGT GAGGGGACAC TCGAGTGCCG CCACCGGCAG AGGAGCTGCA 420GGTTGGTCAC CGTCCTCGAG TGGAAACCCG ATGGCCAAGC CAGAGTCCCG CAGGTTGAAG 480CAAGCTGCTC TGCAAGGTGA AGCCACACCC AGGGCGGCCC AGGAGGCCGC CAGCCAGGAG 540CAGGCCCAGC AAGCTCTGGA ACGGACTCCA GGAGATGGAC TGGCCACCAT GGTGGCAGGC 600AGTCAGGGAA AAGCAGAAGC GTCTGCCACA GATGCTGGCG ATGAGAGCGC CACTTCCTCC 660ATCGAAGGGG GCGTGACAGA TAAGAGTGGC ATTTCTATGG ATGACTTTAC GCCCCCAGGA 720TCTGGGGCGT GCAAATTTAT CGGCTCACTT CATTCGTACA GTTTCTCCTC TAAGCACACC 780CGAGAAAGGC CATCTGTCCC CCGAGAGCCC ATTGACCGCA AGAGGCTGAA GAAAGATGTG 840GAACCAAGCT GCAGTGGGAG CAGCCTGGGA CCCGACAAGG GCCTGGCCCA GAGCCCTCCC 900AGCTCATCAC TTACCGCGAC ACCGCAGAAG CCTTCCCAGA GCCCCTCTGC CCCTCCTGCC 960GACGTCACCC CAAAGCCAGC CACGGAAGCC GTGCAGAGCG AGCACAGCGA CGCCAGCCCC 1020ATGTCCATCA ACGAGGTCAT CCTGTCGGCG TCAGGGGCCT GCAAGCTCAT CGACTCACTG 1080CACTCCTACT GCTTCTCCTC CCGGCAGAAC AAGAGCCAGG TGTGCTGCCT GCGGGAGCAG 1140GTGGAGAAGA AGAACGGCGA GCTGAAGAGC CTGCGGCAGA GGGTCAGCCG CTCCGACAGC 1200CAGGTGCGGA AGCTACAGGA GAAGCTGGAT GAGCTGAGGA GAGTGAGCGT CCCCTATCCA 1260AGTAGCCTGC TGTCGCCCAG CCGCGAGCCC CCCAAGATGA ACCCAGTGGT GGAGCCACTG 1320TCCTGGATGC TGGGCACCTG GCTGTCGGAC CCACCTGGAG CCGGGACCTA CCCCACACTG 1380CAGCCCTTCC AGTACCTGGA GGAGGTTCAC ATCTCCCACG TGGGCCAGCC CATGCTGAAC 1440TTCTCGTTCA ACTCCTTCCA CCCGGACACG CGCAAGCCGA TGCACAGAGA GTGTGGCTTC 1500ATTCGCCTCA AGCCCGACAC CAACAAGGTG GCCTTTGTCA GCGCCCAGAA CACAGGCGTG 1560GTGGAAGTGG AGGAGGGCGA GGTGAACGGG CAGGAGCTGT GCATCGCATC CCACTCCATC 1620GCCAGGATCT CCTTCGCCAA GGAGCCCCAC GTAGAGCAGA TCACCCGGAA GTTCAGGCTG 1680AATTCTGAAG GCAAACTTGA GCAGACGGTC TCCATGGCAA CCACGACACA GCCAATGACT 1740CAGCATCTTC ACGTCACCTA CAAGAAGGTG ACCCCGTAAA CCTAGAGCTT CTGGAGCCCT 1800CGGGAGGGCC TGGCTACTGT GCCTCAACGG TTCGGCTCCT CAACAGACAG TCCCTGCGGC 1860AAAAGTGGGT GTGGCCGTGA GCCTCTGCAG GCTCAAGAGT GTTGTCCAGA TGTTTCTGTA 1920CTGGCATAGA AAAACCAAAT AAAAGGCCTT TATTTTTATG GCTGAGGATT TTGAATATTA 1980AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAA2023B氨基酸序列(SEQ ID NO:8)长度5771 MVICCAAVNC SNRQGKGEKR AVSFHRFPLK DSKRLIQWLK AVQRDNWTPT51 KYSFLCSEHF TKDSFSKRLE DQHRLLKPTA VPSIFHLTEK KRGAGGHGRT101 RRKDASKATG GVRGHSSAAT GRGAAGWSPS SSGNPMAKPE SRRLKQAALQ151 GEATPRAAQE AASQEQAQQA LERTPGDGLA TMVAGSQGKA EASATDAGDE201 SATSSIEGGV TDKSGISMDD FTPPGSGACK FIGSLHSYSF SSKHTRERPS251 VPREPIDRKR LKKDVEPSCS GSSLGPDKGL AQSPPSSSLT ATPQKPSQSP301 SAPPADVTPK PATEAVQSEH SDASPMSINE VILSASGACK LIDSLHSYCF351 SSRQNKSQVC CLREQVEKKN GELKSLRQRV SRSDSQVRKL QEKLDELRRV401 SVPYPSSLLS PSREPPKMNP VVEPLSWMLG TWLSDPPGAG TYPTLQPFQY451 LEEVHISHVG QPMLNFSFNS FHPDTRKPMH RECGFIRLKP DTNKVAFVSA501 QNTGVVEVEE GEVNGQELCI ASHSIARISF AKEPHVEQIT RKFRLNSEGK551 LEQTVSMATT TQPMTQHLHV TYKKVTP克隆号PP238(SEQ ID NO:9)起始编码子46 ATG终止编码子1779TAA蛋白质分子量62856.511 GGG CTA GGG CCG GGG CCT GGC TGC GCG GCT GGG CCA AGG CCC GCG ATG 481 Met 149 GTG ATC TGC TGT GCG GCC GTG AAC TGC TCC AAC CGG CAG GGA AAG GGC 962 Val Ile Cys Cys Ala Ala Val Asn Cys Ser Asn Arg Gln Gly Lys Gly 1797 GAG AAG CGC GCC GTC TCC TTC CAC AGG TTC CCC CTA AAG GAC TCA AAA 14418 Glu Lys Arg Ala Val Ser Phe His Arg Phe Pro Leu Lys Asp Ser Lys 33145 CGT CTA ATC CAA TGG TTA AAA GCT GTT CAG AGG GAT AAC TGG ACT CCC 19234 Arg Leu Ile Gln Trp Leu Lys Ala Val Gln Arg Asp Asn Trp Thr Pro 49193 ACT AAG TAT TCA TTT CTC TGT AGT GAG CAT TTC ACC AAA GAC AGC TTC 24050 Thr Lys Tyr Ser Phe Leu Cys Ser Glu His Phe Thr Lys Asp Ser Phe 65241 TCC AAG AGG CTG GAG GAC CAG CAT CGC CTG CTG AAG CCC ACG GCC GTG 28866 Ser Lys Arg Leu Glu Asp Gln His Arg Leu Leu Lys Pro Thr Ala Val 81289 CCA TCC ATC TTC CAC CTG ACC GAG AAG AAG AGG GGG GCT GGA GGC CAT 33682 Pro Ser Ile Phe His Leu Thr Glu Lys Lys Arg Gly Ala Gly Gly His 97337 GGC CGC ACC CGG AGA AAA GAT GCC AGC AAG GCC ACA GGG GGT GTG AGG 38498 Gly Arg Thr Arg Arg Lys Asp Ala Ser Lys Ala Thr Gly Gly Val Arg 113385 GGA CAC TCG AGT GCC GCC ACC GGC AGA GGA GCT GCA GGT TGG TCA CCG 432114 Gly His Ser Ser Ala Ala Thr Gly Arg Gly Ala Ala Gly Trp Ser Pro 129433 TCC TCG AGT GGA AAC CCG ATG GCC AAG CCA GAG TCC CGC AGG TTG AAG 480130 Ser Ser Ser Gly Asn Pro Met Ala Lys Pro Glu Ser Arg Arg Leu Lys 146481 CAA GCT GCT CTG CAA GGT GAA GCC ACA CCC AGG GCG GCC CAG GAG GCC 528146 Gln Ala Ala Leu Gln Gly Glu Ala Thr Pro Arg Ala Ala Gln Glu Ala 161529 GCC AGC CAG GAG CAG GCC CAG CAA GCT CTG GAA CGG ACT CCA GGA GAT 576162 Ala Ser Gln Glu Gln Ala Gln Gln Ala Leu Glu Arg Thr Pro Gly Asp177577 GGA CTG GCC ACC ATG GTG GCA GGC AGT CAG GGA AAA GCA GAA GCG TCT624178 Gly Leu Ala Thr Met Val Ala Gly Ser Gln Gly Lys Ala Glu Ala Ser193625 GCC ACA GAT GCT GGC GAT GAG AGC GCC ACT TCC TCC ATC GAA GGG GGC672194 Ala Thr Asp Ala Gly Asp Glu Ser Ala Thr Ser Ser Ile Glu Gly Gly209673 GTG ACA GAT AAG AGT GGC ATT TCT ATG GAT GAC TTT ACG CCC CCA GGA720210 Val Thr Asp Lys Ser Gly Ile Ser Met Asp Asp Phe Thr Pro Pro Gly225721 TCT GGG GCG TGC AAA TTT ATC GGC TCA CTT CAT TCG TAC AGT TTC TCC768226 Ser Gly Ala Cys Lys Phe Ile Gly Ser Leu His Ser Tyr Ser Phe Ser241769 TCT AAG CAC ACC CGA GAA AGG CCA TCT GTC CCC CGA GAG CCC ATT GAC816242 Ser Lys His Thr Arg Glu Arg Pro Ser Val Pro Arg Glu Pro Ile Asp257817 CGC AAG AGG CTG AAG AAA GAT GTG GAA CCA AGC TGC AGT GGG AGC AGC864258 Arg Lys Arg Leu Lys Lys Asp Val Glu Pro Ser Cys Ser Gly Ser Ser273865 CTG GGA CCC GAC AAG GGC CTG GCC CAG AGC CCT CCC AGC TCA TCA CTT912274 Leu Gly Pro Asp Lys Gly Leu Ala Gln Ser Pro Pro Ser Ser Ser Leu289913 ACC GCG ACA CCG CAG AAG CCT TCC CAG AGC CCC TCT GCC CCT CCT GCC960290 Thr Ala Thr Pro Gln Lys Pro Ser Gln Ser Pro Ser Ala Pro Pro Ala305961 GAC GTC ACC CCA AAG CCA GCC ACG GAA GCC GTG CAG AGC GAG CAC AGC 1008306 Asp Val Thr Pro Lys Pro Ala Thr Glu Ala Val Gln Ser Glu His Ser3211009 GAC GCC AGC CCC ATG TCC ATC AAC GAG GTC ATC CTG TCG GCG TCA GGG 1056322 Asp Ala Ser Pro Met Ser Ile Asn Glu Val Ile Leu Ser Ala Ser Gly3371057 GCC TGC AAG CTC ATC GAC TCA CTG CAC TCC TAC TGC TTC TCC TCC CGG 1104338 Ala Cys Lys Leu Ile Asp Ser Leu His Ser Tyr Cys Phe Ser Ser Arg3531105 CAG AAC AAG AGC CAG GTG TGC TGC CTG CGG GAG CAG GTG GAG AAG AAG 1152354 Gln Asn Lys Ser Gln Val Cys Cys Leu Arg Glu Gln Val Glu Lys Lys3691153 AAC GGC GAG CTG AAG AGC CTG CGG CAG AGG GTC AGC CGC TCC GAC AGC 1200370 Asn Gly Glu Leu Lys Ser Leu Arg Gln Arg Val Ser Arg Ser Asp Ser3851201 CAG GTG CGG AAG CTA CAG GAG AAG CTG GAT GAG CTG AGG AGA GTG AGC 1248386 Gln Val Arg Lys Leu Gln Glu Lys Leu Asp Glu Leu Arg Arg Val Ser4011249 GTC CCC TAT CCA AGT AGC CTG CTG TCG CCC AGC CGC GAG CCC CCC AAG 1296402 Val Pro Tyr Pro Ser Ser Leu Leu Ser Pro Ser Arg Glu Pro Pro Lys4171297 ATG AAC CCA GTG GTG GAG CCA CTG TCC TGG ATG CTG GGC ACC TGG CTG 1344418 Met Asn Pro Val Val Glu Pro Leu Ser Trp Met Leu Gly Thr Trp Leu4331345 TCG GAC CCA CCT GGA GCC GGG ACC TAC CCC ACA CTG CAG CCC TTC CAG 1392434 Ser Asp Pro Pro Gly Ala Gly Thr Tyr Pro Thr Leu Gln Pro Phe Gln4491393 TAC CTG GAG GAG GTT CAC ATC TCC CAC GTG GGC CAG CCC ATG CTG AAC 1440450 Tyr Leu Glu Glu Val His Ile Ser His Val Gly Gln Pro Met Leu Asn4651441 TTC TCG TTC AAC TCC TTC CAC CCG GAC ACG CGC AAG CCG ATG CAC AGA 1488466 Phe Ser Phe Asn Ser Phe His Pro Asp Thr Arg Lys Pro Met His Arg4811489 GAG TGT GGC TTC ATT CGC CTC AAG CCC GAC ACC AAC AAG GTG GCC TTT 1536482 Glu Cys Gly Phe Ile Arg Leu Lys Pro Asp Thr Asn Lys Val Ala Phe4971537 GTC AGC GCC CAG AAC ACA GGC GTG GTG GAA GTG GAG GAG GGC GAG GTG 1584498 Val Ser Ala Gln Asn Thr Gly Val Val Glu Val Glu Glu Gly Glu Val5131585 AAC GGG CAG GAG CTG TGC ATC GCA TCC CAC TCC ATC GCC AGG ATC TCC 1632514 Asn Gly Gln Glu Leu Cys Ile Ala Ser His Ser Ile Ala Arg Ile Ser5291633 TTC GCC AAG GAG CCC CAC GTA GAG CAG ATC ACC CGG AAG TTC AGG CTG 1680530 Phe Ala Lys Glu Pro His Val Glu Gln Ile Thr Arg Lys Phe Arg Leu5451681 AAT TCT GAA GGC AAA CTT GAG CAG ACG GTC TCC ATG GCA ACC ACG ACA 1728546 Asn Ser Glu Gly Lys Leu Glu Gln Thr Val Ser Met Ala Thr Thr Thr5611729 CAG CCA ATG ACT CAG CAT CTT CAC GTC ACC TAC AAG AAG GTG ACC CCG 1776562 Gln Pro Met Thr Gln His Leu His Val Thr Tyr Lys Lys Val Thr Pro5771777 TAA ACC TAG AGC TTC TGG AGC CCT CGG GAG GGC CTG GCT ACT GTG CCT 1824578 ***5781825 CAA CGG TTC GGC TCC TCA ACA GAC AGT CCC TGC GGC AAA AGT GGG TGT 18721873 GGC CGT GAG CCT CTG CAG GCT CAA GAG TGT TGT CCA GAT GTT TCT GTA 19201921 CTG GCA TAG AAA AAC CAA ATA AAA GGC CTT TAT TTT TAT GGC TGA GGA19681969 TTT TGA ATA TTA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA20162017 AAA AAA A 20234.PP856A核苷酸序列(SEQ ID NO:10)长度2364GGAACACGTG CTTTCTGGGC AGGTCGCCCC TCAGTCTCCA CTAGAGACAG GACTGACCAG60TTGCTCTTCC TTCCAAGAAC CTTCGAGATC TGCGGTCTGG GGTCTGGTTG AAAGATGGCG120GCCCTCACTA CCCTGTTTAA GTACATAGAT GAAAATCAGG ATCGCTACAT TAAGAAACTC180GCAAAATGGG TGGCTATCCA GAGTGTGTCT GCGTGGCCGG AGAAGAGAGG CGAAATCAGG240AGGATGATGG AAGTTGCTGC TGCAGATGTT AAGCAGTTGG GGGGCTCTGT GGAACTGGTG300GATATCGGAA AACAAAAGGA GATTCCTGTC AACGTCCGAT TCTGCCTCGA AGGCATGGAG360GAGTCAGGCT CTGAGGGCCT AGACGAGCTG ATTTTTGCCC GGAAAGACAC ATTCTTTAAG420GATGTGGACT ATGTCTGCAT TTCTGACAAT TACTGGCTGG GAAAGAAGAA GCCCTGCATC480ACCTACGGCC TCAGGGGCAT TTGCTACTTT TTCATCGAGG TGGAGTGCAG CAACAAAGAC540CTCCATTCTG GGGTGTACGG GGGCTCGGTG CATGAGGCCA TGACTGATCT CATTTTGCTG600ATGGGCTCTT TGGTGGACAA GAGGGGGAAC ATCCTGATCC CCGGCATTAA CGAGGCCGTG660GCCGCCGTCA CGGAAGAGGA GCACAAGCTG TACGACGACA TCGACTTTGA CATAGAGGAG720TTTGCCAAGG ATGTGGGGGC GCAGATCCTC CTGCACAGCC ACAAGAAAGA CATCCTCATG780CACCGATGGC GGTACCCGTC TCTGTCCCTC CATGGCATCG AAGGCGCCTT CTCTGGGTCT840GGGGCCAAGA CCGTGATTCC CAGGAAGGTG GTTGGCAAGT TCTCCATCAG GCTCGTGCCG900AACATGACTC CTGAAGTCGT CGGCGAGCAG GTCACAAGCT ACCTAACTAA GAAGTTTGCT960GAACTACGCA GCCCCAATGA GTTCAAGGTG TACATGGGCC ACGGTGGGAA GCCCTGGGTC1020TCCGACTTCA GTCACCCTCA TTACCTGGCT GGGAGAAGAG CCATGAAGAC AGTTTTTGGT1080GTTGAGCCAG ACTTGACCAG GGAAGGCGGC AGTATTCCCG TGACCTTGAC CTTTCAGGAG1140GCCACGGGCA AGAACGTCAT GCTGCTGCCT GTGGGGTCAG CGGATGACGG AGCCCACTCC1200CAGAATGAAA AGCTCAACAG GTATAACTAC ATAGAGGGAA CCAAGATGCT GGCCGCGTAC1260CTGTATGAGG TCTCCCAGCT GAAGGACTAG GCCAAGCCCT CTGTGTGCCA TCTCCAATGA1320GAAGGAATCC TGCCCTCACC TCACCCTTTT CCAACTTGCC CAGGGAAGTG GAGGTTCCCT1380CTTTCCTTTC CCTCTTGTCA GGTCATCCAT GACTTTAGAG AACAGACACA AGTGTATCCA1440GCTGTCCACG GGTGGAGCTA CCCGTTGGGC TTATGAGTGA CCTGGAGTGA CAGCTGAGTC1500ACCCTGGGTA AGTTCTCAGA GTGGTCAGGA TGGCTTGACC TGCAGAAGAT ACCCAAGGTC1560CAAAAGCACA AGGTCTGCGG AAAGTTCTGG TTGTCGGCTG GGCACCACGG CTCACACCTA1620TAATCGAGCA CTTTGGGAGG CCAAGACAGG AGGATCACTT GAGGCCAGGA GTCTGAGACA1680AGCCTAGGCA ACAAAACAAG ACTCTGTCTC TACAAAAAGT TTAAGAAATG AGCCAGACAT1740GGTGGTGTAT GCCTGTAGTC CCAGCCACTC AGAAGGCTGA GGCAGGAGGA TCGCTTGAGA1800CCAAGAGTTT GAGCCTGCGG TGAGCTGTGA ATGCACCACG GCACTCAAGC CTGGGCAATG1860TAGCAAGATC CTGTCTCTAC AAGAAATTTT TTAAAAATGA GCCAAGTGTG GTGGTGCATG1920CCTGTAGTTC CAGCTACTCA GGACACTGAC GTAGGAGGGT TGCTTGAGAC TGAGAGTTGG1980AGGCTGCGAT GAGCCATGAA TGCCCCACTG CACTCCAGCC TGGGCGACAG AACGAGACCC2040CATCTCAAAA AAAATAAGTT CTGGTTGTCA TTGAATTGGG ATAAACAGAG AGCTTGATGC2100TTTCTGCCTT CTGTCTCAGG TGATGCATTG CACATTTGGG ATATTTGGAA AGGAAATGAG2160GAAAGAAATT AGGGCCTCCT CTGATCTCTC GCTATCTGCG GGTCCTGTCC TTTTCTCAAG2220ACCTTCACCA TTACTGGTGT TTTCCTGTCT TCTCTTTAGT ATGATCCCTC AAAACCTCAC2280TAACTGGAAG GATGATTTTG TCTCAGTTTG TACTCCTAAA TAAAAAGTAA ACATGACACC2340TCTAAAAAAA AAAAAAAAAA AAAA 2364B氨基酸序列(SEQ ID NO:11)长度3911 MAALTTLFKY IDENQDRYIK KLAKWVAIQS VSAWPEKRGE IRRMMEVAAA51 DVKQLGGSVE LVDIGKQKEI PVNVRFCLEG MEESGSEGLD ELIFARKDTF101 FKDVDYVCIS DNYWLGKKKP CITYGLRGIC YFFIEVECSN KDLHSGVYGG151 SVHEAMTDLI LLMGSLVDKR GNILIPGINE AVAAVTEEEH KLYDDIDFDI201 EEFAKDVGAQ ILLHSHKKDI LMHRWRYPSL SLHGIEGAFS GSGAKTVIPR251 KVVGKFSIRL VPNMTPEVVG EQVTSYLTKK FAELRSPNEF KVYMGHGGKP301 WVSDFSHPHY LAGRRAMKTV PGVEPDLTRE GGSIPVTLTF QEATGKNVML351 LPVGSADDGA HSQNEKLNRY NYIEGTKMLA AYLYEVSQLK D克隆号PP856(SEQ ID NO:12)起始编码子115 ATG终止编码子1290TAG蛋白质分子量43831.061 GGA ACA CGT GCT TTC TGG GCA GGT CGC CCC TCA GTC TCC ACT AGA GAC 4849 AGG ACT GAC CAG TTG CTC TTC CTT CCA AGA ACC TTC GAG ATC TGC GGT 9697 CTG GGG TCT GGT TGA AAG ATG GCG GCC CTC ACT ACC CTG TTT AAG TAC 1441 Met Ala Ala Leu Thr Thr Leu Phe Lys Tyr 10145 ATA GAT GAA AAT CAG GAT CGC TAC ATT AAG AAA CTC GCA AAA TGG GTG 19211 Ile Asp Glu Asn Gln Asp Arg Tyr Ile Lys Lys Leu Ala Lys Trp Val 26193 GCT ATC CAG AGT GTG TCT GCG TGG CCG GAG AAG AGA GGC GAA ATC AGG 24027 Ala Ile Gln Ser Val Ser Ala Trp Pro Glu Lys Arg Gly Glu Ile Arg 42241 AGG ATG ATG GAA GTT GCT GCT GCA GAT GTT AAG CAG TTG GGG GGC TCT 28843 Arg Met Met Glu Val Ala Ala Ala Asp Val Lys Gln Leu Gly Gly Ser 58289 GTG GAA CTG GTG GAT ATC GGA AAA CAA AAG GAG ATT CCT GTC AAC GTC 33659 Val Glu Leu Val Asp Ile Gly Lys Gln Lys Glu Ile Pro Val Asn Val 74337 CGA TTC TGC CTC GAA GGC ATG GAG GAG TCA GGC TCT GAG GGC CTA GAC 38475 Arg Phe Cys Leu Glu Gly Met Qlu Glu Ser Gly Ser Glu Gly Leu Asp 90385 GAG CTG ATT TTT GCC CGG AAA GAC ACA TTC TTT AAG GAT GTG GAC TAT 43291 Glu Leu Ile Phe Ala Arg Lys Asp Thr Phe Phe Lys Asp Val Asp Tyr 106433 GTC TGC ATT TCT GAC AAT TAC TGG CTG GGA AAG AAG AAG CCC TGC ATC 480107 Val Cys Ile Ser Asp Asn Tyr Trp Leu Gly Lys Lys Lys Pro Cys Ile 122481 ACC TAC GGC CTC AGG GGC ATT TGC TAC TTT TTC ATC GAG GTG GAG TGC 528123 Thr Tyr Gly Leu Arg Gly Ile Cys Tyr Phe Phe Ile Glu Val Glu Cys 138529 AGC AAC AAA GAC CTC CAT TCT GGG GTG TAC GGG GGC TCG GTG CAT GAG 576139 Ser Asn Lys Asp Leu His Ser Gly Val Tyr Gly Gly Ser Val His Glu 154577 GCC ATG ACT GAT CTC ATT TTG CTG ATG GGC TCT TTG GTG GAC AAG AGG 624155 Ala Met Thr Asp Leu Ile Leu Leu Met Gly Ser Leu Val Asp Lys Arg 170625 GGG AAC ATC CTG ATC CCC GGC ATT AAC GAG GCC GTG GCC GCC GTC ACG 672171 Gly Asn Ile Leu Ile Pro Gly Ile Asn Glu Ala Val Ala Ala Val Thr 186673 GAA GAG GAG CAC AAG CTG TAC GAC GAC ATC GAC TTT GAC ATA GAG GAG 720187 Glu Glu Glu His Lys Leu Tyr Asp Asp Ile Asp Phe Asp Ile Glu Glu 202721 TTT GCC AAG GAT GTG GGG GCG CAG ATC CTC CTG CAC AGC CAC AAG AAA 768203 Phe Ala Lys Asp Val Gly Ala Gln Ile Leu Leu His Ser His Lys Lys 218769 GAC ATC CTC ATG CAC CGA TGG CGG TAC CCG TCT CTG TCC CTC CAT GGC 816219 Asp Ile Leu Met His Arg Trp Arg Tyr Pro Ser Leu Ser Leu His Gly 234817 ATC GAA GGC GCC TTC TCT GGG TCT GGG GCC AAG ACC GTG ATT CCC AGG 864235 Ile Glu Gly Ala Phe Ser Gly Ser Gly Ala Lys Thr Val Ile Pro Arg 250865 AAG GTG GTT GGC AAG TTC TCC ATC AGG CTC GTG CCG AAC ATG ACT CCT 912251 Lys Val Val Gly Lys Phe Ser Ile Arg Leu Val Pro Asn Met Thr Pro 266913 GAA GTC GTC GGC GAG CAG GTC ACA AGC TAC CTA ACT AAG AAG TTT GCT 960267 Glu Val Val Gly Glu Gln Val Thr Ser Tyr Leu Thr Lys Lys Phe Ala 282961 GAA CTA CGC AGC CCC AAT GAG TTC AAG GTG TAC ATG GGC CAC GGT GGG1008283 Glu Leu Arg Ser Pro Asn Glu Phe Lys Val Tyr Met Gly His Gly Gly 2981009 AAG CCC TGG GTC TCC GAC TTC AGT CAC CCT CAT TAC CTG GCT GGG AGA1056299 Lys Pro Trp Val Ser Asp Phe Ser His Pro His Tyr Leu Ala Gly Arg 3141057 AGA GCC ATG AAG ACA GTT TTT GGT GTT GAG CCA GAC TTG ACC AGG GAA1104315 Arg Ala Met Lys Thr Val Phe Gly Val Glu Pro Asp Leu Thr Arg Glu 3301105 GGC GGC AGT ATT CCC GTG ACC TTG ACC TTT CAG GAG GCC ACG GGC AAG1152331 Gly Gly Ser Ile Pro Val Thr Leu Thr Phe Gln Glu Ala Thr Gly Lys 3461153 AAC GTC ATG CTG CTG CCT GTG GGG TCA GCG GAT GAC GGA GCC CAC TCC1200347 Asn Val Met Leu Leu Pro Val Gly Ser Ala Asp Asp Gly Ala His Ser 3621201 CAG AAT GAA AAG CTC AAC AGG TAT AAC TAC ATA GAG GGA ACC AAG ATG1248363 Gln Asn Glu Lys Leu Asn Arg Tyr Asn Tyr Ile Glu Gly Thr Lys Met 3781249 CTG GCC GCG TAC CTG TAT GAG GTC TCC CAG CTG AAG GAC TAG GCC AAG1296379 Leu Ala Ala Tyr Leu Tyr Glu Val Ser Gln Leu Lys Asp *** 3921297 CCC TCT GTG TGC CAT CTC CAA TGA GAA GGA ATC CTG CCC TCA CCT CAC13441345 CCT TTT CCA ACT TGC CCA GGG AAG TGG AGG TTC CCT CTT TCC TTT CCC13921393 TCT TGT CAG GTC ATC CAT GAC TTT AGA GAA CAG ACA CAA GTG TAT CCA14401441 GCT GTC CAC GGG TGG AGC TAC CCG TTG GGC TTA TGA GTG ACC TGG AGT14881489 GAC AGC TGA GTC ACC CTG GGT AAG TTC TCA GAG TGG TCA GGA TGG CTT15361537 GAC CTG CAG AAG ATA CCC AAG GTC CAA AAG CAC AAG GTC TGC GGA AAG15841585 TTC TGG TTG TCG GCT GGG CAC CAC GGC TCA CAC CTA TAA TCG AGC ACT16321633 TTG GGA GGC CAA GAC AGG AGG ATC ACT TGA GGC CAG GAG TCT GAG ACA16801681 AGC CTA GGC AAC AAA ACA AGA CTC TGT CTC TAC AAA AAG TTT AAG AAA17281729 TGA GCC AGA CAT GGT GGT GTA TGC CTG TAG TCC CAG CCA CTC AGA AGG17761777 CTG AGG CAG GAG GAT CGC TTG AGA CCA AGA GTT TGA GCC TGC GGT GAG18241825 CTG TGA ATG CAC CAC GGC ACT CAA GCC TGG GCA ATG TAG CAA GAT CCT18721873 GTC TCT ACA AGA AAT TTT TTA AAA ATG AGC CAA GTG TGG TGG TGC ATG19201921 CCT GTA GTT CCA GCT ACT CAG GAC ACT GAC GTA GGA GGG TTG CTT GAG19681969 ACT GAG AGT TGG AGG CTG CGA TGA GCC ATG AAT GCC CCA CTG CAC TCC20162017 AGC CTG GGC GAC AGA ACG AGA CCC CAT CTC AAA AAA AAT AAG TTC TGG20642065 TTG TCA TTG AAT TGG GAT AAA CAG AGA GCT TGA TGC TTT CTG CCT TCT21122113 GTC TCA GGT GAT GCA TTG CAC ATT TGG GAT ATT TGG AAA GGA AAT GAG21602161 GAA AGA AAT TAG GGC CTC CTC TGA TCT CTC GCT ATC TGC GGG TCC TGT22082209 CCT TTT CTC AAG ACC TTC ACC ATT ACT GGT GTT TTC CTG TCT TCT CTT22562257 TAG TAT GAT CCC TCA AAA CCT CAC TAA CTG GAA GGA TGA TTT TGT CTC23042305 AGT TTG TAC TCC TAA ATA AAA AGT AAA CAT GAC ACC TCT AAA AAA AAA23522353 AAA AAA AAA AAA23645.PP1065A核苷酸序列(SEQ ID NO:13)长度1910GGGAAGTAGA AGACAGCGGC GTTGCCATGG CGGCGTCTCT GGGGCAGGTG TTGGCTCTGG 60TGCTGGTGGC CGCTCTGTGG GGTGGCACGC AGCCGCTGCT GAAGCGGGCC TCCGCCGGCC 120TGCAGCGGGT TCATGAGCCG ACCTGGGCCC AGCAGTTGCT ACAGGAGATG AAGACCCTCT 180TCTTGAATAC TGAGTACCTG ATGCCCTTTC TCCTCAACCA GTGTGGATCC CTTCTCTATT 240ACCTCACCTT GGCATCGACA GATCTGACCC TGGCTGTGCC CATCTGTAAC TCTCTGGCTA 300TCATCTTCAC ACTGATTGTT GGGAAGGCCC TTGGAGAAGA TATTGGTGGA AAACGAGCAG 360TTGCTGGCAT GGTGCTCACC GTGATAGGAA TTTCACTCTG CATCACAAGC TCAGTTCCAT 420GGACTGCAGA ACTCCAGCTG CATGGAAAGG GCCAGCTGCA GACTTTGAGC CAGAAATGCA 480AACGGGAGGC CTCTGGGACT CAGTCAGAGC GCTTTGGCTG AATGAGGGGT GGAACCGAGG 540GAAGAAGGTA GAGAGCTGTG AGCCCCAGCC CCACCTGACT CCAGCACACC TGGCGAGTAG 600TAGCTGTCAA TAAATCTATG GTAAACAGAC AAGAGGAGGT GGAAGGCCAT ACAGAATGGA 660GCCGTGAGTA TGGCCAGCCT CCAGCTCTCA GCCAGGAGGT CCCCAACCCC AAGGAAGGAA 720GAAACTGGAA ATTAGGAACT GCTTCCTCAT TTAACAAGGT AGGAAGTTAG GAGATCATTT 780ACTTTCAATC ACAAGGGAGG AGAACTGTTC CTGGGGCCCA AGGCTGCCAG TTTCCAGCTC 840AGAGCTCCTC CCACCCCAAC ATACTGTTTC CTGATCCAAC AGCTTACCTG ATCCAAGGGC 900TCCTCTGTCT GAGTGTCTTC ATCATCTGCT ACTTCCAGGG CCCCCGCTGT CTCCTTCCTT 960CGGTGGGGAG CTCCATATAC TCCTATAACT CCTAAAGAGG GGAGGCAGCA CTGGGTGATG 1020CCCAGGCTGA AGAGCCCTCA GCATTCCTGC CCTGGACCTT CATGCTAGCC CCTTTCCCTC 1080CCCTGAACCT GGTTCTGCAT TCCCCACCAC CTCCCAGGAT GGCAAGGAAG TGAGAGGTGG 1140GCCTTTGGTC CCACCCCCAT CCCCTCTATA TCCCACCCCT GAAGTCTTAT CGCTTTAAGC 1200ACTGCCCTTT CCAGGTGCTT CTTTTCATGT GATGAGGCCC TGTGAAGAAG GGACAGGATA 1260TACAGACGGG GGCAGCTGGA GACAGTTATG ATGAGTGCCG GCTTTGTGTC TGAGCATTCT 1320GCTCCCATGG ACATCCCCAA CAACAGCAGG GACCAACCTA TGTCACTGTC AAAGGGCAGC 1380TGAGAAGGGC CTGAGCCCCA GGGACCCCTC ACCTGATGGG AATGAGAGTG TGGGGAGCTT 1440GCTTCTTGGC TGAATGGTCT GCTGGGGTCT GGCATAGAAA GCAGATGGCT TAATTCGGTC 1500TGGTTCCTTT GGAGAGGGCT GGGTTACCTG GGCCCTGTGG CCTTGGGCCT AGAGAAGGGA 1560CACTGGGCTT GGACCCTGAT TGCTGGCCAT TCTTACCTTT CCTACTCCCC AGTTCAGGCT 1620TCAGAGAGCC CCTGACGCCT GCAGGAACAT GGCAGAGGAG ACACCGTCTG TCTTCACAAA 1680GTACGTCCTC CCTCCTTGCT GCCTCTTCCC ACCAGCCTGA CTTATCCAGG GACAGAGCAG 1740TAGATGCCTG GCACTCCTCG ATGCCCAGTG AAACCAGACT GTGCTTCCCC ACCCCCACCA 1800CCATGCCCCA TGCTCACTGG CTCATTTCTT GGGAGGGCTT AGAGCTGGAT AATATAAGTT 1860CCCTTGGGAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA1910B氨基酸序列(SEQ ID NO:14)长度1641 MAASLGQVLA LVLVAALWGG TQPLLKRASA GLQRVHEPTW AQQLLQEMKT51 LFLNTEYLMP FLLNQCGSLL YYLTLASTDL TLAVPICNSL AIIFTLIVGK101 ALGEDIGGKR AVAGMVLTVI GISLCITSSV PWTAELQLHG KGQLQTLSQK151 CKREASGTQS ERFG克隆号PP1065(SEQ ID NO:15)起始编码子27 ATG终止编码子521TGA蛋白质分子量17599.781 GG GAA GTA GAA GAC AGC GGC GTT GCC ATG GCG GCG TCT CTG GGG CAG 471 Met Ala Ala Ser Leu Gly Gln 748 GTG TTG GCT CTG GTG CTG GTG GCC GCT CTG TGG GGT GGC ACG CAG CCG 958 Val Leu Ala Leu Val Leu Val Ala Ala Leu Trp Gly Gly Thr Gln Pro 2396 CTG CTG AAG CGG GCC TCC GCC GGC CTG CAG CGG GTT CAT GAG CCG ACC 14324 Leu Leu Lys Arg Ala Ser Ala Gly Leu Gln Arg Val His Glu Pro Thr 39144 TGG GCC CAG CAG TTG CTA CAG GAG ATG AAG ACC CTC TTC TTG AAT ACT 19140 Trp Ala Gln Gln Leu Leu Gln Glu Met Lys Thr Leu Phe Leu Asn Thr 55192 GAG TAC CTG ATG CCC TTT CTC CTC AAC CAG TGT GGA TCC CTT CTC TAT 23956 Glu Tyr Leu Met Pro Phe Leu Leu Asn Gln Cys Gly Ser Leu Leu Tyr 71240 TAC CTC ACC TTG GCA TCG ACA GAT CTG ACC CTG GCT GTG CCC ATC TGT 28772 Tyr Leu Thr Leu Ala Ser Thr Asp Leu Thr Leu Ala Val Pro Ile Cys 87288 AAC TCT CTG GCT ATC ATC TTC ACA CTG ATT GTT GGG AAG GCC CTT GGA 33588 Asn Ser Leu Ala Ile Ile Phe Thr Leu Ile Val Gly Lys Ala Leu Gly 103336 GAA GAT ATT GGT GGA AAA CGA GCA GTT GCT GGC ATG GTG CTC ACC GTG 383104 Glu Asp Ile Gly Gly Lys Arg Ala Val Ala Gly Met Val Leu Thr Val 119384 ATA GGA ATT TCA CTC TGC ATC ACA AGC TCA GTT CCA TGG ACT GCA GAA 431120 Ile Gly Ile Ser Leu Cys Ile Thr Ser Ser Val Pro Trp Thr Ala Glu 135432 CTC CAG CTG CAT GGA AAG GGC CAG CTG CAG ACT TTG AGC CAG AAA TGC 479136 Leu Gln Leu His Gly Lys Gly Gln Leu Gln Thr Leu Ser Gln Lys Cys 151480 AAA CGG GAG GCC TCT GGG ACT CAG TCA GAG CGC TTT GGC TGA ATG AGG 527152 Lys Arg Glu Ala Ser Gly Thr Gln Ser Glu Arg Phe Gly *** 165528 GGT GGA ACC GAG GGA AGA AGG TAG AGA GCT GTG AGC CCC AGC CCC ACC 575576 TGA CTC CAG CAC ACC TGG CGA GTA GTA GCT GTC AAT AAA TCT ATG GTA 623624 AAC AGA CAA GAG GAG GTG GAA GGC CAT ACA GAA TGG AGC CGT GAG TAT 671672 GGC CAG CCT CCA GCT CTC AGC CAG GAG GTC CCC AAC CCC AAG GAA GGA 719720 AGA AAC TGG AAA TTA GGA ACT GCT TCC TCA TTT AAC AAG GTA GGA AGT 767768 TAG GAG ATC ATT TAC TTT CAA TCA CAA GGG AGG AGA ACT GTT CCT GGG 815816 GCC CAA GGC TGC CAG TTT CCA GCT CAG AGC TCC TCC CAC CCC AAC ATA 863864 CTG TTT CCT GAT CCA ACA GCT TAC CTG ATC CAA GGG CTC CTC TGT CTG 911912 AGT GTC TTC ATC ATC TGC TAC TTC CAG GGC CCC CGC TGT CTC CTT CCT 959960 TCG GTG GGG AGC TCC ATA TAC TCC TAT AAC TCC TAA AGA GGG GAG GCA10071008 GCA CTG GGT GAT GCC CAG GCT GAA GAG CCC TCA GCA TTC CTG CCC TGG10551056 ACC TTC ATG CTA GCC CCT TTC CCT CCC CTG AAC CTG GTT CTG CAT TCC 11031104 CCA CCA CCT CCC AGG ATG GCA AGG AAG TGA GAG GTG GGC CTT TGG TCC 11511152 CAC CCC CAT CCC CTC TAT ATC CCA CCC CTG AAG TCT TAT CGC TTT AAG 11991200 CAC TGC CCT TTC CAG GTG CTT CTT TTC ATG TGA TGA GGC CCT GTG AAG 12471248 AAG GGA CAG GAT ATA CAG ACG GGG GCA GCT GGA GAC AGT TAT GAT GAG 12951296 TGC CGG CTT TGT GTC TGA GCA TTC TGC TCC CAT GGA CAT CCC CAA CAA 13431344 CAG CAG GGA CCA ACC TAT GTC ACT GTC AAA GGG CAG CTG AGA AGG GCC 13911392 TGA GCC CCA GGG ACC CCT CAC CTG ATG GGA ATG AGA GTG TGG GGA GCT 14391440 TGC TTC TTG GCT GAA TGG TCT GCT GGG GTC TGG CAT AGA AAG CAG ATG 14871488 GCT TAA TTC GGT CTG GTT CCT TTG GAG AGG GCT GGG TTA CCT GGG CCC 15351536 TGT GGC CTT GGG CCT AGA GAA GGG ACA CTG GGC TTG GAC CCT GAT TGC 15831584 TGG CCA TTC TTA CCT TTC CTA CTC CCC AGT TCA GGC TTC AGA GAG CCC 16311632 CTG ACG CCT GCA GGA ACA TGG CAG AGG AGA CAC CGT CTG TCT TCA CAA 16791680 AGT ACG TCC TCC CTC CTT GCT GCC TCT TCC CAC CAG CCT GAC TTA TCC 17271728 AGG GAC AGA GCA GTA GAT GCC TGG CAC TCC TCG ATG CCC AGT GAA ACC 17751776 AGA CTG TGC TTC CCC ACC CCC ACC ACC ATG CCC CAT GCT CAC TGG CTC 18231824 ATT TCT TGG GAG GGC TTA GAG CTG GAT AAT ATA AGT TCC CTT GGG AAA 18711872 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 19106.PP1221A核苷酸序列(SEQ ID NO:16)长度3657GGCTGCCAAC GGTTTTGAGC GTAGGGGGAG GCGTGAGAGG GGGATCTCAG GGGAGGAGGT 60CAATCGCTTG CCCCCCACTT TGGCAAATTG GGGACTGAGG ACTGGAAGGG TGGAGAGTAG 120GCGGAACCAG GTGGTCGTCG GGGCAGAGGA TCTCGGGCTA GGCTTGAGGG CGGCGTGCTT 180CTTAGGGACG ACTTAGGGCG TGACTGAGGG TTCACAAGGT TTCTTTTGGG GTGGTCGGGA 240GGGAGAGATT CTAGGGAACA AGGAAGCTCG CTATGGCTTT CTTGCCAGGA GGGGTCGAAG 300GGAAAGTACA AGGGAGCTGA CCCTGGGTAG AACGGGTGAA GGGATGGGGG AGCGTGAGGT 360TCCGCCCTCT CTTGAGACTG GAACCAATTG GAGGGACTAG TAGGGCAGGG GGACAGAAAT 420TGGGCTCCTA GTGGATTTGG GTCCGTTTCC GTTGGGACGT TTTGGGTGTG AGAACTTAAG 480AGCTCAGTTG ACCGGGGATA GCCTGTGCCG GAGTTGATCT GCAGCTTCCA GCACTCGTAG 540TCGGGAAGAG GAGCTTCAGC AGCGCTGTTG TCCCACAGTA GGTCTTCTGT CCGCACCCGC 600TCTGCGCTGC ACCCTCTTAA CGCTGTTCCC AGGAGCTGGG GAAAGGGATG CTTTTGCCCA 660CTCCCATGGC CCCTGGAACT GGTGGAAACC TTTCCTCTAA CCAGAAAGCC TCGATATCCT 720TAATTCACCA AGGATCCTTG GCGTGGAGTC TTCCTCCCTT CTCCCAAGTC TTTCTCCGTG 780AACTTTTCCT CCTGGACTTT GCTAAAGCAG AACCTCCCAG CTCTTTGCTG TCTCCGGTTG 840TCTCTTCCCT GTATTCATGG CAACATCAGC TGACAGCCCC AGTTCACCCC TCGGGGCGGA 900GGATCTCCTG AGTGATTCAT CAGAACCCCC TGGGCTCAAC CAAGTGTCGT CTGAAGTGAC 960CTCCCAGCTC TATGCTTCTT TGCGCCTCAG CCGGCAGGCG GAGGCCACGG CCCGAGCCCA 1020GCTGTATTTA CCCTCCACCT CCCCGCCTCA TGAAGGGTTA GACGGCTTCG CCCAAGAATT 1080GAGTCGAAGC TTGTCAGTCG GATTGGAAAA GAACTTGAAG AAAAAGGATG GTTCTAAGCA 1140TATCTTTGAG ATGGAAAGTG TTCGGGGTCA GCTCCAGACC ATGCTCCAAA CCTCACGTGA 1200TACAGCCTAT CGGGATCCTC TCATTCCTGG CGCTGGCTCA GAGAGACGGG AAGAGGACTC 1260CTTTGACAGT GATAGCACAG CCACCTTGCT CAACACCCGG CCCCTGCAAG ACTTGTCTCC 1320ATCTAGCTCA GCCCAAGCCC TGGAGGAGCT GTTTCCCCGC TACACCAGCC TTCGGCCAGG 1380GCCTCCACTC AATCCCCCAG ATTTTCAGGG GCTGAGAGAT GCATTGGATT CAGAGCATAC 1440CCGCCGCAAG CATTGTGAGC GCCATATTCA GAGCCTGCAG ACCCGAGTGT TAGAGCTACA 1500GCAACAATTA GCCGTGGCTG TGGCTGCCGA CCGCAAGAAA GATACCATGA TTGAACAACT 1560GGACAAGACC CTGGCCCGTG TGGTGGAGGG CTGGAACCGG CATGAGGCTG AGCGGACAGA 1620GGTTCTCAGG GGACTTCAAG AGGAACACCA GGCAGCAGAG CTCACCAGAA GCAAGCAGCA 1680GGAGACAGTA ACCCGCCTGG AACAAAGCCT TTCTGAGGCC ATGGAGGCCC TGAATCGTGA 1740GCAGGAAAGT GCCAGACTGC AGCAACGGGA AAGAGAGACA CTGGAGGAGG AAAGGCAAGC 1800TCTGACTCTG AGGTTGGAGG CAGAACAGCA GCGGTGCTGT GTCCTGCAGG AAGAGCGGGA 1860TGCAGCTCGG GCTGGGCAAC TGAGTGAGCA TCGAGAGTTG GAGACTCTTC GGGCTGCCCT 1920AGAAGAAGAA CGGCAGACCT GGGCCCAGCA AGAGCACCAG CTTAAGGAAC ACTACCAGGC 1980GCTGCAGGAG GAGAGCCAGG CTCAGCTGGA AAGGGAGAAG GAGAAGAGCC AGAGGGAAGC 2040CCAGGCCGCC TGGGAGACCC AGCACCAGTT GGCATTGGTG CAGTCTGAGG TGCGGCGGCT 2100GGAAGGAGAG CTGGATACAG CTCGGAGAGA GAGAGATGCC CTGCAGCTGG AAATGAGCTT 2160GGTGCAGGCC CGGTATGAAA GCCAGCGGAT CCAGCTGGAG TCGGAGCTGG CTGTGCAGCT 2220GGAGCAGCGG GTGACAGAGC GGCTGGCGCA GGCTCAGGAG AGCAGCCTAC GGCAAGCAGC 2280CTCCCTCAGG GAACATCACA GGAAGCAGCT GCAGGACCTG AGTGGACAGC ACCAGCAGGA 2340GCTGGCCAGT CAGCTAGCTC AGTTCAAGGT GGAAATGGCA GAACGAGAGG AACGGCAACA 2400GCAGGTGGCT GAGGACTACG AGCTCAGACT GGCCCGGGAG CAAGCGCAAG TGTGCGAACT 2460GCAGAGTGGG AACCAGCAGC TGGAGGAGCA GCGGGTGGAG CTGGTGGAAA GACTGCAGGC 2520CATGCTGCAG GCCCACTGGG ATGAGGCCAA CCAGCTGCTC AGCACCACTC TCCCGCCGCC 2580CAACCCTCCA GCTCCTCCTG CTGGACCCTC CAGCCCCGGG CCTCAGGAGC CCGAGAAGGA 2640GGAGAGGAGG GTCTGGACTA TGCCTCCCAT GGCCGTGGCC CTGAAGCCTG TATTGCAGCA 2700GAGCCGGGAA GCAAGGGACG AGCTACCTGG AGCGCCTCCT GTTCTTTGCA GTTCCTCCTC 2760AGATCTTAGC CTCCTGTTGG GCCCCTCTTT TCAGAGCCAG CATTCTTTCC AGCCCCTGGA 2820GCCCAAACCA GACCTCACTT CATCCACAGC TGGGGCCTTC TCTGCACTTG GGGCCTTCCA 2880TCCCGATCAT AGGGCAGAAA GGCCATTCCC TGAGGAAGAT CCTGGACCTG ACGGGGAGGG 2940CCTCCTAAAG CAAGGGCTGC CGCCTGCTCA GCTGGAGGGC CTCAAGAATT TTTTGCACCA 3000GTTGCTGGAG ACAGTGCCCC AGAACAATGA GAACCCTTCT GTCGACCTGT TGCCCCCTAA 3060GTCTGGTCCT CTGACTGTCC CATCTTGGGA GGAAGCCCCT CAAGTGCCAC GTATTCCACC 3120GCCTGTCCAC AAAACCAAAG TTCCCTTAGC CATGGCATCC AGTCTTTTCC GGGTCCCTGA 3180GCCTCCCTCC TCCCATTCAC AAGGCAGTGG TCCCAGCAGT GGTTCCCCAG AGAGAGGTGG 3240AGATGGGCTT ACATTCCCAA GGCAGCTGAT GGAGGTGTCT CAACTGTTGC GACTCTACCA 3300GGCTCGGGGC TGGGGGGCTC TGCCTGCTGA GGATCTCCTG CTCTACCTGA AGAGGCTGGA 3360ACACAGCGGG ACTGATGGCC GAGGGGATAA TGTCCCCAGA AGGAACACAG ACTCCCGCTT 3420GGGTGAGATC CCCCGGAAAG AGATTCCCTC CCAGGCTGTC CCTCGCCGCC TTGCTACAGC 3480CCCCAAGACT GAAAAACCTC CCGCACGGAA GAAAAGTGGG CACCCTGCCC CGAGTAGCAT 3540GAGGAGCCGG GGGGGAGTCT GGAGATGAGC CCCCCTACCC TCTCTCCTCT TTGTTCTCTC 3600ATTGTTGTTA TTTTAATAAA TGCTCAGTAG TCTGTAAAAA AAAAAAAAAA AAAAAAA 3657B氨基酸序列(SEQ ID NO:17)长度9031 MATSADSPSS PLGAEDLLSD SSEPPGLNQV SSEVTSQLYA SLRLSRQAEA51 TARAQLYLPS TSPPHEGLDG FAQELSRSLS VGLEKNLKKK DGSKHIFEME101 SVRGQLQTML QTSRDTAYRD PLIPGAGSER REEDSFDSDS TATLLNTRPL151 QDLSPSSSAQ ALEELFPRYT SLRPGPPLNP PDFQGLRDAL DSEHTRRKHC201 ERHIQSLQTR VLELQQQLAV AVAADRKKDT MIEQLDKTLA RVVEGWNRHE251 AERTEVLRGL QEEHQAAELT RSKQQETVTR LEQSLSEAME ALNREQESAR301 LQQRERETLE EERQALTLRL EAEQQRCCVL QEERDAARAG QLSEHRELET351 LRAALEEERQ TWAQQEHQLK EHYQALQEES QAQLEREKEK SQREAQAAWE401 TQHQLALVQS EVRRLEGELD TARRERDALQ LEMSLVQARY ESQRIQLESE451 LAVQLEQRVT ERLAQAQESS LRQAASLREH HRKQLQDLSG QHQQELASQL501 AQFKVEMAER EERQQQVAED YELRLAREQA QVCELQSGNQ QLEEQRVELV551 ERLQAMLQAH WDEANQLLST TLPPPNPPAP PAGPSSPGPQ EPEKEERRVW601 TMPPMAVALK PVLQQSREAR DELPGAPPVL CSSSSDLSLL LGPSFQSQHS651 FQPLEPKPDL TSSTAGAFSA LGAFHPDHRA ERPFPEEDPG PDGEGLLKQG701 LPPAQLEGLK NFLHQLLETV PQNNENPSVD LLPPKSGPLT VPSWEEAPQV751 PRIPPPVHKT KVPLAMASSL FRVPEPPSSH SQGSGPSSGS PERGGDGLTF801 PRQLMEVSQL LRLYQARGWG ALPAEDLLLY LKRLEHSGTD GRGDNVPRRN851 TDSRLGEIPR KEIPSQAVPR RLATAPKTEK PPARKKSGHP APSSMRSRGG901 VWR克隆号PP1221(SEQ ID NO:18)起始编码子857 ATG终止编码子3568TGA蛋白质分子量101219.361G GCT GCC AAC GGT TTT GAG CGT AGG GGG AGG CGT GAG AGG GGG ATC 4647 TCA GGG GAG GAG GTC AAT CGC TTG CCC CCC ACT TTG GCA AAT TGG GGA 9495 CTG AGG ACT GGA AGG GTG GAG AGT AGG CGG AAC CAG GTG GTC GTC GGG 142143 GCA GAG GAT CTC GGG CTA GGC TTG AGG GCG GCG TGC TTC TTA GGG ACG 190191 ACT TAG GGC GTG ACT GAG GGT TCA CAA GGT TTC TTT TGG GGT GGT CGG 238239 GAG GGA GAG ATT CTA GGG AAC AAG GAA GCT CGC TAT GGC TTT CTT GCC 286287 AGG AGG GGT CGA AGG GAA AGT ACA AGG GAG CTG ACC CTG GGT AGA ACG 334335 GGT GAA GGG ATG GGG GAG CGT GAG GTT CCG CCC TCT CTT GAG ACT GGA 382383 ACC AAT TGG AGG GAC TAG TAG GGC AGG GGG ACA GAA ATT GGG CTC CTA 430431 GTG GAT TTG GGT CCG TTT CCG TTG GGA CGT TTT GGG TGT GAG AAC TTA 478479 AGA GCT GAG TTG ACC GGG GAT AGC CTG TGC CGG AGT TGA TCT GCA GCT 526527 TCC AGC ACT CGT AGT CGG GAA GAG GAG CTT CAG CAG CGC TGT TGT CCC 574575 ACA GTA GGT CTT CTG TCC GCA CCC GCT CTG CGC TGC ACC CTC TTA ACG 622623 CTG TTC CCA GGA GCT GGG GAA AGG GAT GCT TTT GCC CAC TCC CAT GGC 670671 CCC TGG AAC TGG TGG AAA CCT TTC CTC TAA CCA GAA AGC CTC GAT ATC 718719 CTT AAT TCA CCA AGG ATC CTT GGC GTG GAG TCT TCC TCC CTT CTC CCA 766767 AGT CTT TCT CCG TGA ACT TTT CCT CCT GGA CTT TGC TAA AGC AGA ACC 814815 TCC CAG CTC TTT GCT GTC TCC GGT TGT CTC TTC CCT GTA TTC ATG GCA 8621 Met Ala 2863 ACA TCA GCT GAC AGC CCC AGT TCA CCC CTC GGG GCG GAG GAT CTC CTG 9103 Thr Ser Ala Asp Ser Pro Ser Ser Pro Leu Gly Ala Glu Asp Leu Leu 18911 AGT GAT TCA TCA GAA CCC CCT GGG CTC AAC CAA GTG TCG TCT GAA GTG 95819 Ser Asp Ser Ser Glu Pro Pro Gly Leu Asn Gln Val Ser Ser Glu Val 34959 ACC TCC CAG CTC TAT GCT TCT TTG CGC CTC AGC CGG CAG GCG GAG GCC100635 Thr Ser Gln Leu Tyr Ala Ser Leu Arg Leu Ser Arg Gln Ala Glu Ala 501007 ACG GCC CGA GCC CAG CTG TAT TTA CCC TCC ACC TCC CCG CCT CAT GAA105451 Thr Ala Arg Ala Gln Leu Tyr Leu Pro Ser Thr Ser Pro Pro His Glu 661055 GGG TTA GAC GGC TTC GCC CAA GAA TTG AGT CGA AGC TTG TCA GTC GGA110267 Gly Leu Asp Gly Phe Ala Gln Glu Leu Ser Arg Ser Leu Ser Val Gly 821103 TTG GAA AAG AAC TTG AAG AAA AAG GAT GGT TCT AAG CAT ATC TTT GAG115083 Leu Glu Lys Asn Leu Lys Lys Lys Asp Gly Ser Lys His Ile Phe Glu 981151 ATG GAA AGT GTT CGG GGT CAG CTC CAG ACC ATG CTC CAA ACC TCA CGT119899 Met Glu Ser Val Arg Gly Gln Leu Gln Thr Met Leu Gln Thr Ser Arg 1141199 GAT ACA GCC TAT CGG GAT CCT CTC ATT CCT GGC GCT GGC TCA GAG AGA1246115 Asp Thr Ala Tyr Arg Asp Pro Leu Ile Pro Gly Ala Gly Ser Glu Arg 1301247 CGG GAA GAG GAC TCC TTT GAC AGT GAT AGC ACA GCC ACC TTG CTC AAC1294131 Arg Glu Glu Asp Ser Phe Asp Ser Asp Ser Thr Ala Thr Leu Leu Asn 1461295 ACC CGG CCC CTG CAA GAC TTG TCT CCA TCT AGC TCA GCC CAA GCC CTG1342147 Thr Arg Pro Leu Gln Asp Leu Ser Pro Ser Ser Ser Ala Gln Ala Leu 1621343 GAG GAG CTG TTT CCC CGC TAC ACC AGC CTT CGG CCA GGG CCT CCA CTC1390163 Glu Glu Leu Phe Pro Arg Tyr Thr Ser Leu Arg Pro Gly Pro Pro Leu 1781391 AAT CCC CCA GAT TTT CAG GGG CTG AGA GAT GCA TTG GAT TCA GAG CAT1438179 Asn Pro Pro Asp Phe Gln Gly Leu Arg Asp Ala Leu Asp Ser Glu His 1941439 ACC CGC CGC AAG CAT TGT GAG CGC CAT ATT CAG AGC CTG CAG ACC CGA1486195 Thr Arg Arg Lys His Cys Glu Arg His Ile Gln Ser Leu Gln Thr Arg 2101487 GTG TTA GAG CTA CAG CAA CAA TTA GCC GTG GCT GTG GCT GCC GAC CGC1534211 Val Leu Glu Leu Gln Gln Gln Leu Ala Val Ala Val Ala Ala Asp Arg 2261535 AAG AAA GAT ACC ATG ATT GAA CAA CTG GAC AAG ACC CTG GCC CGT GTG1582227 Lys Lys Asp Thr Met Ile Glu Gln Leu Asp Lys Thr Leu Ala Arg Val 2421583 GTG GAG GGC TGG AAC CGG CAT GAG GCT GAG CGG ACA GAG GTT CTC AGG1630243 Val Glu Gly Trp Asn Arg His Glu Ala Glu Arg Thr Glu Val Leu Arg 2581631 GGA CTT CAA GAG GAA CAC CAG GCA GCA GAG CTC ACC AGA AGC AAG CAG1678259 Gly Leu Gln Glu Glu His Gln Ala Ala Glu Leu Thr Arg Ser Lys Gln 2741679 CAG GAG ACA GTA ACC CGC CTG GAA CAA AGC CTT TCT GAG GCC ATG GAG1726275 Gln Glu Thr Val Thr Arg Leu Glu Gln Ser Leu Ser Glu Ala Met Glu 2901727 GCC CTG AAT CGT GAG CAG GAA AGT GCC AGA CTG CAG CAA CGG GAA AGA1774291 Ala Leu Asn Arg Glu Gln Glu Ser Ala Arg Leu Gln Gln Arg Glu Arg 3061775 GAG ACA CTG GAG GAG GAA AGG CAA GCT CTG ACT CTG AGG TTG GAG GCA1822307 Glu Thr Leu Glu Glu Glu Arg Gln Ala Leu Thr Leu Arg Leu Glu Ala 3221823 GAA CAG CAG CGG TGC TGT GTC CTG CAG GAA GAG CGG GAT GCA GCT CGG1870323 Glu Gln Gln Arg Cys Cys Val Leu Gln Glu Glu Arg Asp Ala Ala Arg 3381871 GCT GGG CAA CTG AGT GAG CAT CGA GAG TTG GAG ACT CTT CGG GCT GCC1918339 Ala Gly Gln Leu Ser Glu His Arg Glu Leu Glu Thr Leu Arg Ala Ala 3541919 CTA GAA GAA GAA CGG CAG ACC TGG GCC CAG CAA GAG CAC CAG CTT AAG1966355 Leu Glu Glu Glu Arg Gln Thr Trp Ala Gln Gln Glu His Gln Leu Lys 3701967 GAA CAC TAC CAG GCG CTG CAG GAG GAG AGC CAG GCT CAG CTG GAA AGG2014371 Glu His Tyr Gln Ala Leu Gln Glu Glu Ser Gln Ala Gln Leu Glu Arg 3862015 GAG AAG GAG AAG AGC CAG AGG GAA GCC CAG GCC GCC TGG GAG ACC CAG2062387 Glu Lys Glu Lys Ser Gln Arg Glu Ala Gln Ala Ala Trp Glu Thr Gln 4022063 CAC CAG TTG GCA TTG GTG CAG TCT GAG GTG CGG CGG CTG GAA GGA GAG2110403 His Gln Leu Ala Leu Val Gln Ser Glu Val Arg Arg Leu Glu Gly Glu 4182111 CTG GAT ACA GCT CGG AGA GAG AGA GAT GCC CTG CAG CTG GAA ATG AGC2158419 Leu Asp Thr Ala Arg Arg Glu Arg Asp Ala Leu Gln Leu Glu Met Ser 4342159 TTG GTG CAG GCC CGG TAT GAA AGC CAG CGG ATC CAG CTG GAG TCG GAG2206435 Leu Val Gln Ala Arg Tyr Glu Ser Gln Arg Ile Gln Leu Glu Ser Glu 4502207 CTG GCT GTG CAG CTG GAG CAG CGG GTG ACA GAG CGG CTG GCG CAG GCT2254451 Leu Ala Val Gln Leu Glu Gln Arg Val Thr Glu Arg Leu Ala Gln Ala 4662255 CAG GAG AGC AGC CTA CGG CAA GCA GCC TCC CTC AGG GAA CAT CAC AGG2302467 Gln Glu Ser Ser Leu Arg Gln Ala Ala Ser Leu Arg Glu His His Arg 4822303 AAG CAG CTG CAG GAC CTG AGT GGA CAG CAC CAG CAG GAG CTG GCC AGT2350483 Lys Gln Leu Gln Asp Leu Ser Gly Gln His Gln Gln Glu Leu Ala Ser 4982351 CAG CTA GCT CAG TTC AAG GTG GAA ATG GCA GAA CGA GAG GAA CGG CAA2398499 Gln Leu Ala Gln Phe Lys Val Glu Met Ala Glu Arg Glu Glu Arg Gln 5142399 CAG CAG GTG GCT GAG GAC TAC GAG CTC AGA CTG GCC CGG GAG CAA GCG2446515 Gln Gln Val Ala Glu Asp Tyr Glu Leu Arg Leu Ala Arg Glu Gln Ala 5302447 CAA GTG TGC GAA CTG CAG AGT GGG AAC CAG CAG CTG GAG GAG CAG CGG2494531 Gln Val Cys Glu Leu Gln Ser Gly Asn Gln Gln Leu Glu Glu Gln Arg 5462495 GTG GAG CTG GTG GAA AGA CTG CAG GCC ATG CTG CAG GCC CAC TGG GAT2542547 Val Glu Leu Val Glu Arg Leu Gln Ala Met Leu Gln Ala His Trp Asp 5622543 GAG GCC AAC CAG CTG CTC AGC ACC ACT CTC CCG CCG CCC AAC CCT CCA2590563 Glu Ala Asn Gln Leu Leu Ser Thr Thr Leu Pro Pro Pro Asn Pro Pro 5782591 GCT CCT CCT GCT GGA CCC TCC AGC CCC GGG CCT CAG GAG CCC GAG AAG2638579 Ala Pro Pro Ala Gly Pro Ser Ser Pro Gly Pro Gln Glu Pro Glu Lys 5942639 GAG GAG AGG AGG GTC TGG ACT ATG CCT CCC ATG GCC GTG GCC CTG AAG2686595 Glu Glu Arg Arg Val Trp Thr Met Pro Pro Met Ala Val Ala Leu Lys 6102687 CCT GTA TTG CAG CAG AGC CGG GAA GCA AGG GAC GAG CTA CCT GGA GCG2734611 Pro Val Leu Gln Gln Ser Arg Glu Ala Arg Asp Glu Leu Pro Gly Ala 6262735 CCT CCT GTT CTT TGC AGT TCC TCC TCA GAT CTT AGC CTC CTG TTG GGC2782627 Pro Pro Val Leu Cys Ser Ser Ser Ser Asp Leu Ser Leu Leu Leu Gly 6422783 CCC TCT TTT CAG AGC CAG CAT TCT TTC CAG CCC CTG GAG CCC AAA CCA2830643 Pro Ser Phe Gln Ser Gln His Ser Phe Gln Pro Leu Glu Pro Lys Pro 6582831 GAC CTC ACT TCA TCC ACA GCT GGG GCC TTC TCT GCA CTT GGG GCC TTC2878659 Asp Leu Thr Ser Ser Thr Ala Gly Ala Phe Ser Ala Leu Gly Ala Phe 6742879 CAT CCC GAT CAT AGG GCA GAA AGG CCA TTC CCT GAG GAA GAT CCT GGA2926675 His Pro Asp His Arg Ala Glu Arg Pro Phe Pro Glu Glu Asp Pro Gly 6902927 CCT GAC GGG GAG GGC CTC CTA AAG CAA GGG CTG CCG CCT GCT CAG CTG2974691 Pro Asp Gly Glu Gly Leu Leu Lys Gln Gly Leu Pro Pro Ala Gln Leu 7062975 GAG GGC CTC AAG AAT TTT TTG CAC CAG TTG CTG GAG ACA GTG CCC CAG3022707 Glu Gly Leu Lys Asn Phe Leu His Gln Leu Leu Glu Thr Val Pro Gln 7223023 AAC AAT GAG AAC CCT TCT GTC GAC CTG TTG CCC CCT AAG TCT GGT CCT3070723 ASn Asn Glu Asn Pro Ser Val Asp Leu Leu Pro Pro Lys Ser Gly Pro 7383071 CTG ACT GTC CCA TCT TGG GAG GAA GCC CCT CAA GTG CCA CGT ATT CCA3118739 Leu Thr Val Pro Ser Trp Glu Glu Ala Pro Gln Val Pro Arg Ile Pro 7543119 CCG CCT GTC CAC AAA ACC AAA GTT CCC TTA GCC ATG GCA TCC AGT CTT3166755 Pro Pro Val His Lys Thr Lys Val Pro Leu Ala Met Ala Ser Ser Leu 7703167 TTC CGG GTC CCT GAG CCT CCC TCC TCC CAT TCA CAA GGC AGT GGT CCC3214771 Phe Arg Val Pro Glu Pro Pro Ser Ser His Ser Gln Gly Ser Gly Pro 7863215 AGC AGT GGT TCC CCA GAG AGA GGT GGA GAT GGG CTT ACA TTC CCA AGG3262787 Ser Ser Gly Ser Pro Glu Arg Gly Gly Asp Gly Leu Thr Phe Pro Arg 8023263 CAG CTG ATG GAG GTG TCT CAA CTG TTG CGA CTC TAC CAG GCT CGG GGC3310803 Gln Leu Met Glu Val Ser Gln Leu Leu Arg Leu Tyr Gln Ala Arg Gly 8183311 TGG GGG GCT CTG CCT GCT GAG GAT CTC CTG CTC TAC CTG AAG AGG CTG3358819 Trp Gly Ala Leu Pro Ala Glu Asp Leu Leu Leu Tyr Leu Lys Arg Leu 8343359 GAA CAC AGC GGG ACT GAT GGC CGA GGG GAT AAT GTC CCC AGA AGG AAC3406835 Glu His Ser Gly Thr Asp Gly Arg Gly Asp Asn Val Pro Arg Arg Asn 8503407 ACA GAC TCC CGC TTG GGT GAG ATC CCC CGG AAA GAG ATT CCC TCC CAG3454851 Thr Asp Ser Arg Leu Gly Glu Ile Pro Arg Lys Glu Ile Pro Ser Gln 8663455 GCT GTC CCT CGC CGC CTT GCT ACA GCC CCC AAG ACT GAA AAA CCT CCC3502867 Ala Val Pro Arg Arg Leu Ala Thr Ala Pro Lys Thr Glu Lys Pro Pro 8823503 GCA CGG AAG AAA AGT GGG CAC CCT GCC CCG AGT AGC ATG AGG AGC CGG3550883 Ala Arg Lys Lys Ser Gly His Pro Ala Pro Ser Ser Met Arg Ser Arg 8983551 GGG GGA GTC TGG AGA TGA GCC CCC CTA CCC TCT CTC CTC TTT GTT CTC3598899 Gly Gly Val Trp Arg *** 9043599 TCA TTG TTG TTA TTT TAA TAA ATG CTC AGT AGT CTG TAA AAA AAA AAA 36463647 AAA AAA AAA AA 36577.PP2250A核苷酸序列(SEQ ID NO:19)长度2745GCCGCGCTGG CATTTTCTCC TGGACAAGGA GAGAGTGCGG CTGCTGAGAG CCGAGCCCAG 60CAATCCCGAT CCTCTGAGTC GTGAAGAAGG GAGGCAGCGA GGGGGTTGGG GTTGGGGCCT 120GAGGCAAGCC CCCAGGCTCC GCTCTTGCCA GAGGGACAGG AGCCATGGCT CAGAAAATGG 180ACTGTGGTGC GGGCCTCCTC GGCTTCCAGG CTGAGGCCTC CGTAGAAGAC AGCGCCTTGC 240TTATGCAGAC CTTGATGGAG GCCATCCAGA TCTCAGAGGC TCCACCTACT AACCAGGCCA 300CCGCAGCTGC TAGTCCCCAG AGTTCACAGC CCCCAACTGC CAATGAGATG GCTGACATTC 360AGGTTTCAGC AGCTGCCGCT AGGCCTAAGT CAGCCTTTAA AGTCCAGAAT GCCACCACAA 420AAGGCCCAAA TGGTGTCTAT GATTTCTCTC AGGCTCATAA TGCCAAGGAT GTGCCCAACA 480CGCAGCCCAA GGCAGCCTTT AAGTCCCAAA ATGCTACCCC AAAGGGTCCA AATGCTGCCT 540ATGATTTTTC CCAGGCAGCA ACCACTGGTG AGTTAGCTGC TAACAAGTCT GAGATGGCCT 600TCAAGGCCCA GAATGCCACT ACTAAAGTGG GCCCAAATGC CACCTACAAT TTCTCTCAGT 660CTCTCAATGC CAATGACCTG GCCAACAGCA GGCCTAAGAC CCCTTTCAAG GCTTGGAATG 720ATACCACTAA GGCCCCAACA GCTGATACCC AGACCCAGAA TGTAAATCAG GCCAAAATGG 780CCACTTCCCA GGCTGACATA GAGACCGACC CAGGTATCTC TGAACCTGAC GGTGCAACTG 840CACAGACATC AGCAGATGGT TCCCAGGCTC AGAATCTGGA GTCCCGGACA ATAATTCGGG 900GCAAGAGGAC CCGCAAGATT AATAACTTGA ATGTTGAAGA GAACAGCAGT GGGGATCAGA 960GGCGGGCCCC ACTGGCTGCA GGGACCTGGA GGTCTGCACC AGTTCCAGTG ACCACTCAGA 1020ACCCACCTGG CGCACCCCCC AATGTGCTCT GGCAGACGCC ATTGGCTTGG CAGAACCCCT 1080CAGGCTGGCA AAACCAGACA GCCAGGCAGA CCCCACCAGC ACGTCAGAGC CCTCCAGCTA 1140GGCAGACCCC ACCAGCCTGG CAGAACCCAG TCGCTTGGCA GAACCCAGTG ATTTGGCCAA 1200ACCCAGTAAT CTGGCAGAAC CCAGTGATCT GGCCAAACCC CATTGTCTGG CCCGGCCCTG 1260TTGTCTGGCC GAATCCACTG GCCTGGCAGA ATCCACCTGG ATGGCAGACT CCACCTGGAT 1320GGCAGACCCC ACCGGGCTGG CAGGGTCCTC CAGACTGGCA AGGTCCTCCT GACTGGCCGC 1380TACCACCCGA CTGGCCACTG CCACCTGATT GGCCACTTCC CACTGACTGG CCACTACCAC 1440CTGACTGGAT CCCCGCTGAT TGGCCAATTC CACCTGACTG GCAGAACCTG CGCCCCTCGC 1500CTAACCTGCG CCCTTCTCCC AACTCGCGTG CCTCACAGAA CCCAGGTGCT GCACAGCCCC 1560GAGATGTGGC CCTTCTTCAG GAAAGAGCAA ATAAGTTGGT CAAGTACTTG ATGCTTAAGG 1620ACTACACAAA GGTGCCCATC AAGCGCTCAG AAATGCTGAG AGATATCATC CGTGAATACA 1680CTGATGTTTA TCCAGAAATC ATTGAACGTG CATGCTTTGT CCTAGAGAAG AAATTTGGGA 1740TTCAACTGAA AGAAATTGAC AAAGAAGAAC ACCTGTATAT TCTCATCAGT ACCCCCGAGT 1800CCCTGGCTGG CATACTGGGA ACGACCAAAG ACACACCCAA GCTCGGTCTC CTCTTGGTGA 1860TTCTGGGTGT CATCTTCATG AATGGCAACC GTGCCAGTGA GGCTGTCCTC TGGGAGGCAC 1920TACGCAAGAT GGGACTGCGT CCTGGGGTGA GACATCCCCT CCTTGGAGAT CTAAGGAAAC 1980TTCTCACCTA TGAGTTTGTA AAGCAGAAAT ACCTGGACTA CAGACGAGTG CCCAACAGCA 2040ACCCCCCGGA GTATGAGTTC CTCTGGGGCC TCCGTTCCTA CCATGAGACT AGCAAGATGA 2100AAGTGCTGAG ATTCATTGCA GAGGTTCAGA AAAGAGACCC TCGTGACTGG ACTGCACAGT 2160TCATGGAGGC TGCAGATGAG GCCTTGGATG CTCTGGATGC TGCTGCAGCT GAGGCCGAAG 2220CCAGGGCTGA AGCAAGAACC CGCATGGGAA TTGGAGATGA GGCTGTGTCT GGGCCCTGGA 2280GCTGGGATGA CATTGAGTTT GAGCTGCTGA CCTGGGATGA GGAAGGAGAT TTTGGAGATC 2340CCTGGTCCAG AATTCCATTT ACCTTCTGGG CCAGATACCA CCAGAATGCC CGCTCCAGAT 2400TCCCTCAGAC C1TTGCCGGT CCCATTATTG GTCCTGGTGG TACAGCCAGT GCCAACTTCG 2460CTGCCAACTT TGGTGCCATT GGTTTCTTCT GGGTTGAGTG AGATGTTGGA TATTGCTATC 2520AATCGCAGTA GTCTTTCCCC TGTGTGAGGC TGAAGCCTCA GATTCCTTCT AAACACAGCT 2580ATCTAGAGAG CCACATCCTG TTGACTGAAA GTGGCATGCA AGATAAATTT ATTTGCTGTT 2640CCTTGTCTAC TGCTTTTTTT CCCCTTGTGT GCTGTCAAGT TTTGGTATCA GAAATAAACA 2700TTGAAATTGC AAAGTGAAAA AAAAAAAAAA AAAAAAAAAA AAAAA 2745B氨基酸序列(SEQ ID NO:20)长度7791 MAQKMDCGAG LLGFQAEASV EDSALLMQTL MEAIQISEAP PTNQATAAAS51 PQSSQPPTAN EMADIQVSAA AARPKSAFKV QNATTKGPNG VYDFSQAHNA101 KDVPNTQPKA AFKSQNATPK GPNAAYDFSQ AATTGELAAN KSEMAFKAQN151 ATTKVGPNAT YNFSQSLNAN DLANSRPKTP FKAWNDTTKA PTADTQTQNV201 NQAKMATSQA DIETDPGISE PDGATAQTSA DGSQAQNLES RTIIRGKRTR251 KINNLNVEEN SSGDQRRAPL AAGTWRSAPV PVTTQNPPGA PPNVLWQTPL301 AWQNPSGWQN QTARQTPPAR QSPPARQTPP AWQNPVAWQN PVIWPNPVIW351 QNPVIWPNPI VWPGPVVWPN PLAWQNPPGW QTPPGWQTPP GWQGPPDWQG401 PPDWPLPPDW PLPPDWPLPT DWPLPPDWIP ADWPIPPDWQ NLRPSPNLRP451 SPNSRASQNP GAAQPRDVAL LQERANKLVK YLMLKDYTKV PIKRSEMLRD501 IIREYTDVYP EIIERACFVL EKKFGIQLKE IDKEEHLYIL ISTPESLAGI551 LGTTKDTPKL GLLLVILGVI FMNGNRASEA VLWEALRKMG LRPGVRHPLL601 GDLRKLLTYE FVKQKYLDYR RVPNSNPPEY EFLWGLRSYH ETSKMKVLRF651 IAEVQKRDPR DWTAQFMEAA DEALDALDAA AAEAEARAEA RTRMGIGDEA701 VSGPWSWDDI EFELLTWDEE GDFGDPWSRI PFTFWARYHQ NARSRFPQTF751 AGPIIGPGGT ASANFAANFG AIGFFWVE*克隆号PP2250 (SEQ ID NO:21)起始编码子165 ATG终止编码子2501TGA蛋白质分子量86156.011 GC CGC GCT GGC ATT TTC TCC TGG ACA AGG AGA GAG TGC GGC TGC TGA 4748 GAG CCG AGC CCA GCA ATC CCG ATC CTC TGA GTC GTG AAG AAG GGA GGC 9596 AGC GAG GGG GTT GGG GTT GGG GCC TGA GGC AAG CCC CCA GGC TCC GCT 143144 CTT GCC AGA GGG ACA GGA GCC ATG GCT CAG AAA ATG GAC TGT GGT GCG 1911 Met Aia Gln Lys Met Asp Cys Gly Ala 9192 GGC CTC CTC GGC TTC CAG GCT GAG GCC TCC GTA GAA GAC AGC GCC TTG 23910 Gly Leu Leu Gly Phe Gln Ala Glu Ala Ser Val Glu Asp Ser Ala Leu 25240 CTT ATG CAG ACC TTG ATG GAG GCC ATC CAG ATC TCA GAG GCT CCA CCT 28726 Leu Met Gln Thr Leu Met Glu Ala Ile Gln Ile Ser Glu Ala Pro Pro 41288 ACT AAC CAG GCC ACC GCA GCT GCT AGT CCC CAG AGT TCA CAG CCC CCA 33542 Thr Asn Gln Ala Thr Ala Ala Ala Ser Pro Gln Ser Ser Gln Pro Pro 57336 ACT GCC AAT GAG ATG GCT GAC ATT CAG GTT TCA GCA GCT GCC GCT AGG 38358 Thr Ala Asn Glu Met Ala Asp Ile Gln Val Ser Ala Ala Ala Ala Arg 73384 CCT AAG TCA GCC TTT AAA GTC CAG AAT GCC ACC ACA AAA GGC CCA AAT 43174 Pro Lys Ser Ala Phe Lys Val Gln Asn Ala Thr Thr Lys Gly Pro Asn 89432 GGT GTC TAT GAT TTC TCT CAG GCT CAT AAT GCC AAG GAT GTG CCC AAC 47990 Gly Val Tyr Asp Phe Ser Gln Ala His Asn Ala Lys Asp Val Pro Asn 105480 ACG CAG CCC AAG GCA GCC TTT AAG TCC CAA AAT GCT ACC CCA AAG GGT 527106 Thr Gln Pro Lys Ala Ala Phe Lys Ser Gln Asn Ala Thr Pro Lys Gly 121528 CCA AAT GCT GCC TAT GAT TTT TCC CAG GCA GCA ACC ACT GGT GAG TTA 575122 Pro Asn Ala Ala Tyr Asp Phe Ser Gln Ala Ala Thr Thr Gly Glu Leu 137576 GCT GCT AAC AAG TCT GAG ATG GCC TTC AAG GCC CAG AAT GCC ACT ACT 623138 Ala Ala Asn Lys Ser Glu Met Ala Phe Lys Ala Gln Asn Ala Thr Thr 153624 AAA GTG GGC CCA AAT GCC ACC TAC AAT TTC TCT CAG TCT CTC AAT GCC 671154 Lys Val Gly Pro Asn Ala Thr Tyr Asn Phe Ser Gln Ser Leu Asn Ala 169672 AAT GAC CTG GCC AAC AGC AGG CCT AAG ACC CCT TTC AAG GCT TGG AAT 719170 Asn Asp Leu Ala Asn Ser Arg Pro Lys Thr Pro Phe Lys Ala Trp Asn 185720 GAT ACC ACT AAG GCC CCA ACA GCT GAT ACC CAG ACC CAG AAT GTA AAT 767186 Asp Thr Thr Lys Ala Pro Thr Ala Asp Thr Gln Thr Gln Asn Val Asn 201768 CAG GCC AAA ATG GCC ACT TCC CAG GCT GAC ATA GAG ACC GAC CCA GGT 815202 Gln Ala Lys Met Ala Thr Ser Gln Ala Asp Ile Glu Thr Asp Pro Gly 217816 ATC TCT GAA CCT GAC GGT GCA ACT GCA CAG ACA TCA GCA GAT GGT TCC 863218 Ile Ser Glu Pro Asp Gly Ala Thr Ala Gln Thr Ser Ala Asp Gly Ser 233864 CAG GCT CAG AAT CTG GAG TCC CGG ACA ATA ATT CGG GGC AAG AGG ACC 911234 Gln Ala Gln Asn Leu Glu Ser Arg Thr Ile Ile Arg Gly Lys Arg Thr 249912 CGC AAG ATT AAT AAC TTG AAT GTT GAA GAG AAC AGC AGT GGG GAT CAG 959250 Arg Lys Ile Asn Asn Leu Asn Val Glu Glu Asn Ser Ser Gly Asp Gln 265960 AGG CGG GCC CCA CTG GCT GCA GGG ACC TGG AGG TCT GCA CCA GTT CCA1007266 Arg Arg Ala Pro Leu Ala Ala Gly Thr Trp Arg Ser Ala Pro Val Pro 2811008 GTG ACC ACT CAG AAC CCA CCT GGC GCA CCC CCC AAT GTG CTC TGG CAG1055282 Val Thr Thr Gln Asn Pro Pro Gly Ala Pro Pro Asn Val Leu Trp Gln 2971056 ACG CCA TTG GCT TGG CAG AAC CCC TCA GGC TGG CAA AAC CAG ACA GCC1103298 Thr Pro Leu Ala Trp Gln Asn Pro Ser Gly Trp Gln Asn Gln Thr Ala 3131104 AGG CAG ACC CCA CCA GCA CGT CAG AGC CCT CCA GCT AGG CAG ACC CCA1151314 Arg Gln Thr Pro Pro Ala Arg Gln Ser Pro Pro Ala Arg Gln Thr Pro 3291152 CCA GCC TGG CAG AAC CCA GTC GCT TGG CAG AAC CCA GTG ATT TGG CCA1199330 Pro Ala Trp Gln Asn Pro Val Ala Trp Gln Asn Pro Val Ile Trp Pro 3451200 AAC CCA GTA ATC TGG CAG AAC CCA GTG ATC TGG CCA AAC CCC ATT GTC1247346 Asn Pro Val Ile Trp Gln Asn Pro Val Ile Trp Pro Asn Pro Ile Val 3611248 TGG CCC GGC CCT GTT GTC TGG CCG AAT CCA CTG GCC TGG CAG AAT CCA1295362 Trp Pro Gly Pro Val Val Trp Pro Asn Pro Leu Ala Trp Gln Asn Pro 3771296 CCT GGA TGG CAG ACT CCA CCT GGA TGG CAG ACC CCA CCG GGC TGG CAG1343378 Pro Gly Trp Gln Thr Pro Pro Gly Trp Gln Thr Pro Pro Gly Trp Gln 3931344 GGT CCT CCA GAC TGG CAA GGT CCT CCT GAC TGG CCG CTA CCA CCC GAC1391394 Gly Pro Pro Asp Trp Gln Gly Pro Pro Asp Trp Pro Leu Pro Pro Asp 4091392 TGG CCA CTG CCA CCT GAT TGG CCA CTT CCC ACT GAC TGG CCA CTA CCA1439410 Trp Pro Leu Pro Pro Asp Trp Pro Leu Pro Thr Asp Trp Pro Leu Pro 4251440 CCT GAC TGG ATC CCC GCT GAT TGG CCA ATT CCA CCT GAC TGG CAG AAC1487426 Pro Asp Trp Ile Pro Ala Asp Trp Pro Ile Pro Pro Asp Trp Gln Asn 4411488 CTG CGC CCC TCG CCT AAC CTG CGC CCT TCT CCC AAC TCG CGT GCC TCA1535442 Leu Arg Pro Ser Pro Asn Leu Arg Pro Ser Pro Asn Ser Arg Ala Ser 4571536 CAG AAC CCA GGT GCT GCA CAG CCC CGA GAT GTG GCC CTT CTT CAG GAA1583458 Gln Asn Pro Gly Ala Ala Gln Pro Arg Asp Val Ala Leu Leu Gln Glu 4731584 AGA GCA AAT AAG TTG GTC AAG TAC TTG ATG CTT AAG GAC TAC ACA AAG1631474 Arg Ala Asn Lys Leu Val Lys Tyr Leu Met Leu Lys Asp Tyr Thr Lys 4891632 GTG CCC ATC AAG CGC TCA GAA ATG CTG AGA GAT ATC ATC CGT GAA TAC1679490 Val Pro Ile Lys Arg Ser Glu Met Leu Arg Asp Ile Ile Arg Glu Tyr 5051680 ACT GAT GTT TAT CCA GAA ATC ATT GAA CGT GCA TGC TTT GTC CTA GAG1727506 Thr Asp Val Tyr Pro Glu Ile Ile Glu Arg Ala Cys Phe Val Leu Glu 5211728 AAG AAA TTT GGG ATT CAA CTG AAA GAA ATT GAC AAA GAA GAA CAC CTG1775522 Lys Lys Phe Gly Ile Gln Leu Lys Glu Ile Asp Lys Glu Glu His Leu 5371776 TAT ATT CTC ATC AGT ACC CCC GAG TCC CTG GCT GGC ATA CTG GGA ACG1823538 Tyr Ile Leu Ile Ser Thr Pro Glu Ser Leu Ala Gly Ile Leu Gly Thr 5531824 ACC AAA GAC ACA CCC AAG CTC GGT CTC CTC TTG GTG ATT CTG GGT GTC1871554 Thr Lys Asp Thr Pro Lys Leu Gly Leu Leu Leu Val Ile Leu Gly Val 5691872 ATC TTC ATG AAT GGC AAC CGT GCC AGT GAG GCT GTC CTC TGG GAG GCA1919570 Ile Phe Met Asn Gly Asn Arg Ala Ser Glu Ala Val Leu Trp Glu Ala 5851920 CTA CGC AAG ATG GGA CTG CGT CCT GGG GTG AGA CAT CCC CTC CTT GGA1967586 Leu Arg Lys Met Gly Leu Arg Pro Gly Val Arg His Pro Leu Leu Gly 6011968 GAT CTA AGG AAA CTT CTC ACC TAT GAG TTT GTA AAG CAG AAA TAC CTG2015602 Asp Leu Arg Lys Leu Leu Thr Tyr Glu Phe Val Lys Gln Lys Tyr Leu 6172016 GAC TAC AGA CGA GTG CCC AAC AGC AAC CCC CCG GAG TAT GAG TTC CTC2063618 Asp Tyr Arg Arg Val Pro Asn Ser Asn Pro Pro Glu Tyr Glu Phe Leu 6332064 TGG GGC CTC CGT TCC TAC CAT GAG ACT AGC AAG ATG AAA GTG CTG AGA2111634 Trp Gly Leu Arg Ser Tyr His Glu Thr Ser Lys Met Lys Val Leu Arg 6492112 TTC ATT GCA GAG GTT CAG AAA AGA GAC CCT CGT GAC TGG ACT GCA CAG 2159650 Phe Ile Ala Glu Val Gln Lys Arg Asp Pro Arg Asp Trp Thr Ala Gln 6652160 TTC ATG GAG GCT GCA GAT GAG GCC TTG GAT GCT CTG GAT GCT GCT GCA2207666 Phe Met Glu Ala Ala Asp Glu Ala Leu Asp Ala Leu Asp Ala Ala Ala 6812208 GCT GAG GCC GAA GCC AGG GCT GAA GCA AGA ACC CGC ATG GGA ATT GGA2255682 Ala Glu Ala Glu Ala Arg Ala Glu Ala Arg Thr Arg Met Gly Ile Gly 6972256 GAT GAG GCT GTG TCT GGG CCC TGG AGC TGG GAT GAC ATT GAG TTT GAG2303698 Asp Glu Ala Val Ser Gly Pro Trp Ser Trp Asp Asp Ile Glu Phe Glu 7132304 CTG CTG ACC TGG GAT GAG GAA GGA GAT TTT GGA GAT CCC TGG TCC AGA2351714 Leu Leu Thr Trp Asp Glu Glu Gly Asp Phe Gly Asp Pro Trp Ser Arg 7292352 ATT CCA TTT ACC TTC TGG GCC AGA TAC CAC CAG AAT GCC CGC TCC AGA2399730 Ile Pro Phe Thr Phe Trp Ala Arg Tyr His Gln Asn Ala Arg Ser Arg 7452400 TTC CCT CAG ACC TTT GCC GGT CCC ATT ATT GGT CCT GGT GGT ACA GCC2447746 Phe Pro Gln Thr Phe Ala Gly Pro Ile Ile Gly Pro Gly Gly Thr Ala 7612448 AGT GCC AAC TTC GCT GCC AAC TTT GGT GCC ATT GGT TTC TTC TGG GTT2495762 Ser Ala Asn Phe Ala Ala Asn Phe Gly Ala Ile Gly Phe Phe Trp Val 7772496 GAG TGA GAT GTT GGA TAT TGC TAT CAA TCG CAG TAG TCT TTC CCC TGT2543778 Glu *** 7792544 GTG AGG CTG AAG CCT CAG ATT CCT TCT AAA CAC AGC TAT CTA GAG AGC25912592 CAC ATC CTG TTG ACT GAA AGT GGC ATG CAA GAT AAA TTT ATT TGC TGT26392640 TCC TTG TCT ACT GCT TTT TTT CCC CTT GTG TGC TGT CAA GTT TTG GTA26872688 TCA GAA ATA AAC ATT GAA ATT GCA AAG TGA AAA AAA AAA AAA AAA AAA27352736 AAA AAA AAA A 274权利要求
1.一种分离的具有抑癌功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20;或其保守性变异多肽、或其活性片段、或其活性衍生物。
2.如权利要求1所述的多肽,其特征在于,该多肽是具有选自下组的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQID NO:20。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性(a)编码如权利要求1和2所述多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ IDNO:17、SEQ ID NO:20。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞(a)用权利要求6所述的载体转化或转导的宿主细胞;(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有抑癌功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含(a)在适合表达具有抑癌功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;(b)从培养物中分离出具有抑癌功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有抑癌功能的人蛋白特异性结合的抗体。
10.一种核酸分子,它含有权利要求3所述的多核苷酸中连续的10-800个核苷酸。
11.一种药物组合物,其特征在于,它含有安全有效量的权利要求1所述的多肽以及药学上可接受的载体。
全文摘要
本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。
文档编号C07K14/47GK1309135SQ0110454
公开日2001年8月22日 申请日期2001年2月13日 优先权日2000年2月17日
发明者顾健人, 杨胜利 申请人:上海市肿瘤研究所