单外显子基因编码的新型生物活性肽的利记博彩app

文档序号:3561903阅读:591来源:国知局

专利名称::单外显子基因编码的新型生物活性肽的利记博彩app
技术领域
:本发明涉及新型生物活性肽激素,生产该生物活性肽激素的方法及该生物活性肽激素的应用。本发明鉴定出了新型生物活性肽前体及其盐,它们能够用作药物(例如治疗性多肽)、用来发现相关靶点(如GPCR)的配体或药物干预的靶点。本发明涉及新型生物活性肽激素,生产该生物活性肽激素的方法及其应用。更具体地,本发明涉及鉴别源自前体蛋白的生物活性肽激素的方法,该前体蛋白能够用作治疗性多肽、药物干预的靶点、用来发现相关靶点的配体(例如GPCR去孤儿化(deorphaning))或监测疾病的生物标记。
背景技术
:许多生物活性肽对健康和疾病都呈现出深远的影响,这些影响或者是通过生长刺激、生长抑制,或者是通过调节关键代谢通路来达成。肽激素在诸如腺体、神经元、肠、大脑等不同细胞类型和器官中作为前体产生。肽激素最初作为较大的前体或激素原合成出来,在通过内质网和高尔基体叠层转运的过程中可进行大量的翻译后修饰。它们被加工并转运至它们的最终目的地,以作为活性成分(第一信使)发挥作用通过结合到细胞表面受体亂良细胞反应。在与许多生物医学研究领域相关的生理过程中,它们都起着关键作用,例如,糖尿病(胰岛素)、血压调节(血管紧张素)、贫血(促红细胞生成素-a)、多发性硬化症(干扰素-p)及其他。近来人类基因组测序揭示了大约30,000个基因,远远小于从人类生物过程的复杂性所预测的基因数量。这些基因翻译之前的可选剪接大致会产生至多200,000个初级转录物。现在广泛接受的论断是,这些基因所编码蛋白质产物的翻译后修饰构成了所需要的复杂性增加的水平,这用来解释其功能的多样性。通常基因的发现涉及计算生物学领域,其与基于算法鉴定有生物功能的序列片段有关,这些序列通常是基因组DNA。具体而言,这包括编码蛋白质的基因,但是也可以包括其他功能元件,例如RNA基因和调节区域。基因的发现是一旦对一个物种的基因组测序之后,了解这个基因组的第一步,也是最重要的一步。在外在基因发现系统(extrinsicgenefindingsystems)中,检索把基因组以查找与外在证据相似的序列,这些外在证据的形式是信使RNA(mRNA)或蛋白质产物的已知序列。如果已知RNA序列,关键是导出唯一的应转录该mRNA的基因组DNA。如果已知一个蛋白质序列,可以通过遗传密码的反向翻译导出一族可能的DNA编码序列。一旦候选DNA序列确定之后,有效检索靶基因组的完全或部分、精确或不精确匹配就是一个算法问题了。BLAST是为此目的设计的广泛应用的系统。在许多情况下,与已知信使RNA或蛋白质产物的高度相似性是耙基因组的一个区域为编码蛋白质的基因的强有力证据。但是,要系统应用这种方法需要大量的mRNA和蛋白质产物测序。不仅耗费巨大,而且在复杂的有机体中,其基因组所有基因中仅仅一部分是在任何给定时间都表达的,这意味着对于许多基因来说,其外在证据在任何单一细胞培养物中都不容易得到。所以,为了收集复杂有机体的大部分或全部基因的外在证据,必须研究成百上千的细胞类型,这种研究本身就存在更进一步的困难。例如,一些人类基因可能仅仅在胚胎或胎儿发育时期表达。尽管有这些困难,在人类和其他一些生物学中重要的^f莫型生物(例如小鼠和酵母)中,还是建立了广泛的转录物和蛋白质序列数据库。例如RefSeq数据库含有来自许多不同物种的转录物和蛋白质序列,而且Ensembl系统将这些证据对人类和几个其他基因组进行了全面作图。因为获得许多基因外在证据的固有费用和困难性,借助从头开始的基因探测法也是有必要的,其中仅系统检索基因组DNA序列来寻找蛋白质6编码基因的某些能说明问题的迹象。这些迹象可以大致分类为信号,表明附近有基因存在的特殊序列;或内容,蛋白质编码序列本身的统计学性质。从头开始的基因探测法可以更精确地表述为基因预测,因为通常需要外在证据才能决定性地确认一个推定的基因有功能。出于几个原因,在真核生物,特别是在像人类这样的复杂生物中,从头开始的基因探测相当的具有挑战性。首先,在这些基因组中,启动子和其他调节信号比原核生物中的更加复杂并且了解的更少,这使其更加难以可靠识别。真核生物基因探测器鉴定出来的信号的两个经典例子是CpG岛和多聚A尾巴的结合位点。其次,真核细胞使用的剪接机制意味着基因组中的特定蛋白质编码序列被分成了几个部分(外显子),由非编码序列(内含子)所分隔开。剪接位点本身是真核基因探测器经常要设计来鉴别的另一个信号。人类典型的蛋白质编码基因可能会被分成多个外显子,每个的长度小于200个^对,有些会短到20或30个4^对。所以,在真核生物中检测蛋白质编码DNA的周期性和其他已知的内容性质非常困难。原核和真核基因组的高级基因探测器通常使用复杂的概率模型,例如隐马尔可夫模型来组合来自各种不同信号和内叙企测的信息。对于原核生物,Glimmer系统是一种广泛使用并高度精确的基因探测器。相较之下,真核生物的从头开始的基因探测器仅仅获得了有限的成功,一个值得注意的例子是GENSCAN程序。
发明内容通过鉴定编码肽激素前体序列的新型单个外显子基因,本发明鉴定出了新型生物活性肽激素前体。为了找到新型单个外显子基因,用标准遗传密码把人类基因组(NCBI33assembly,2003年7月1日)和小鼠基因组(NCBI30assembly,2003年7月1日)都翻译成6个阅读框。仅仅选择以甲硫氨酸开始并且长度在50-200个氨基酸间的序列片段。用BLAST程序比较人类组和小鼠组相互间的序列,以找到在两种生物间密切相关的序列。只选择在两种生物(人和小鼠)中都存在的序列。为了篩出分泌型蛋白质,用程序signalP预测潜在的信号序列,并用程序TMHMM确i人不存在潜在的跨膜区域。此外,在选择出的序列中进行InterPro检索,以排除已描述过的蛋白质结构域的存在(例如激酶结构域等)。剩下的序列通过与/〉共可知的数据库如UNIPROT进行序列比较来证实其新颖性。这些通过电脑模拟(insilico)的分析表明发现了不含任何以前描述过的蛋白质结构域的新型分泌型蛋白质。一般可以理解,肽激素的特征在于它们的高度特异性和它们在很低浓度下的有效性。肽激素的另一个特征是它们相应mRNA在少数的特殊组织中表达。在哺乳动物系统中很少发现肽激素的普遍表ii^式。在一套人体組织上进行了常用的体外转录检测(见图1-6),以测定这8个新型基因在人体中的组织转录。使用特定的探针/引物对,可以检测并定量目的基因编码的mRNA。但是,必须注意的是,基因表达数据可以受基因组中定位于相同基因座中的基因的转录的影响。另外,本发明中使用的这一套组织并不全面。生物活性肽激素在生物医学研究领域中具有巨大的价值,所以引起了制药工业的兴趣。多种肽激素被用于治疗疾病。考虑到WO2004039956(题为"治疗免疫相关疾病的組合物和方法")公开了几种生物活性多肽序列,但是这里没有参考其鉴别方法和这些序列的用途。本发明鉴定出编码生物活性肽激素前体的新基因。肽激素的特征在于它们的高度特异性和它们在很低的浓度下的有效性。生物活性肽激素在生物医学领域具有巨大的价值。多种肽激素用于疾病的治疗或监测疾病的状态。这样的多肽序列可以作为药物和用于免疫相关疾病的药剂以治疗有效量使用。如由可获得的最接近现有技术(WO2004039956)所列出来的问题可以定义为鉴别可用于治疗人类疾病的新型激素多肽序列。本发明通过提供8个能够用于干扰生理因素的新型肽激素前体和其片段解决了这个问题,该生理因素增加了动乐j^更化、炎症或不受控制的细胞分裂的风险。根据本发明,提供了在生物医学研究领域中能够用于治疗人类疾病的激素多肽的新的库。所以,本发明涉及由SEQIDNO.1-8的^J^酸序列或通过缺失、置换或插入至少一个氨基酸残基而由其衍生来的氨基酸序列、其酰胺或酯、或所述肽的盐组成的多肽链。本发明的一个实施方式涉及由下列氨基酸序列组成的多肽链MYWMALRRISTLGSRWLGLSRVLLFRASKASFTFLSLRFSLSVAARRS。本发明的另一个实施方式涉及由下列氨基酸序列组成的多肽MGSGCARARLGLLSWLAASSGSEDALASSISVKLALELAEVAWSEGLSPTAPKWLEEAEERLTLRSIPL。本发明的另一个实施方式涉及由下列氨基酸序列组成的多肽MLLAMSSISIFSSLFSFSSFCFTRCRLSICSPSSATLSACFFLRVAAVASCFSILALSVCSASISSSSSSMRA。本发明的另一个实施方式涉及由下列氨基酸序列组成的多肽MATSWAGSAAPPASAAKSWGTRPSRPGGPRSAWRRRRATLAAWTGPARAATATTTRAAARRPVAARTPARLAATSRATHARTWPMASPRASVTTCTCAFRAARASPALSS。本发明的另一个实施方式涉及由下列氨基酸序列组成的多肽RAPARPGAPRRI。本发明的另一个实施方式涉及由下列氨基酸序列组成的多肽:TRHTR。本发明的另一个实施方式涉及由下列氨基酸序列组成的多肽PPGVAAVRSASTVPEENCSGSKLYVCVAKSMNSPSMLLDSEMTWPLARFPQ。本发明的另一个实施方式涉及由下列氨基酸序列组成的多肽MASAAGEPFSMYLASAAAALCTPTASARKARGLRTEPLDEVLARGGPAASTLWCRCRLWPKASLYPGARKPCLAASGSDSSTSGGSATDTGRPSSQSLRSGGSPVRTSM。本发明的一个实施方式还提供了一种包括SEQIDNO.916的核苷酸碱基序列的DNA,上述核苷酸^序列编码包括SEQIDNO.1-8所代表的M,列或其酰胺、酯或它们的盐的多肽链。本发明涉及由SEQIDNO.9的核苷酸碱基序列组成的DNA,上述核苷酸碱基序列编码由SEQIDNO.1的M酸序列或其酰胺、酯或其盐组成的多肽链。本发明涉及一种由SEQIDNO.10的核苷酸碱基序列组成的DNA,上述核苷酸碱基序列编码第一段中所述的多肽链,该多肽链由SEQIDNO.2的^J^酸序列或其酰胺、酯或其盐组成。本发明的另一个实施方式涉及由SEQIDNO.11的核苷酸碱基序列组成的DNA,上述核苷酸^序列编码由SEQIDNO.3的M酸序列或其酰胺、酯或其盐组成的多肽链。本发明的另一个实施方式涉及由SEQIDNO.12的核苷酸4^序列组成的DNA,上述核苷酸^序列编码由SEQIDNO.4的M酸序列或其酰胺、酯或其盐組成的多肽链。本发明的另一个实施方式涉及由SEQIDNO.13的核苷酸^J^序列组成的DNA,上述核苷酸^l^序列编码由SEQIDNO.5的^J^酸序列或其酰胺、酯或其盐组成的多肽链。本发明的另一个实施方式涉及由SEQIDNO.14的核苷酸碱基序列组成的DNA,上述核苷酸>^&序列编码由SEQIDNO.6的^J^酸序列或其酰胺、酯或其盐组成的多肽链。本发明的另一个实施方式涉及由SEQIDNO.15的核苷酸碱基序列组成的DNA,上述核苷酸^J^序列编码由SEQIDNO.7的^J^酸序列或其酰胺、酯或其盐组成的多肽链。本发明的另一个实施方式涉及由SEQIDNO.16的核苷酸碱基序列组成的DNA,上述核普酸^^序列编码由SEQIDNO.8的^J^酸序列或其酰胺、酯或其盐组成的多肽链。本发明涉及制备多肽的方法,其中所述方法包括如下步骤提供M酸、固相或液相合成所述氨基酸、抽提多肽和纯化上述多肽。本发明还提供了制备肽、前体或其盐的方法,包括将构成氨基末端的氨基酸或肽与构成氣基末端的氨基酸或肽缩聚,随后任选地形成分子内二硫键。本发明的一个实施方式提供药物组合物,其包含作为活性剂的多肽链或前体、或其可药用的酰胺、酯或盐,其中,所述多肽链由根据SEQIDNO.18的M酸序列组成。本发明还涉及药物组合物的用途,该药物組合物包含作为活性剂的多肽链或前体、或其可药用的酰胺、酯或盐,其中所述多肽链由SEQIDNO.18的M酸序列组成,并且可以用作治疗性多肽、药物干预的靶点、用来发现相关靶点的配体、检测疾病的生物标记。42本发明还涉及本发明的肽、前体或盐在制备用于治疗或预防心血管疾病、激素产生的肿瘤的制剂、激素分泌抑制剂、肿瘤生长抑制剂中的用途,其包括SEQIDNO.18限定的M酸序列中的至少一个。此处使用的术语"多肽"是指由通过共价键连接的氨基酸组成的任何聚合物,并且该术语包括在其范围内的全长蛋白质的部分或片段,例如,肽、寡肽和由至少2个氩基酸组成的较短的肽序列,更具体至少约5个氛基酸残基或更多组成的肽序列。术语"多肽"包括含有一个或更多个通过肽键连接的氨基酸的所有部分。并且,该术语在其范围内包括修饰过的氨基酸的聚合物,这些聚合物包括已经过翻译后修饰的氨基酸,例如通过包括但不限于有效改变基本肽骨架的糖基化、磷酸化、乙酰化和/或硫酸化反应的化学修饰。所以,多肽可来自天然产生的蛋白质,尤其可以产生自通过化学或酶裂解的全长蛋白质,使用诸如CNBr等试剂或诸如胰蛋白酶或糜蛋白酶等蛋白酶来裂解。或者,这样的多肽可以用已知的肽合成的方法用化学合成法制备。还包括在"多肽,,范围内的是M酸序列变体(此处称为多肽变体)。这可包含在天然产生的氨基酸序列中进行不会改变所述肽的至少一种基本性质(例如其生物活性)的一个或多个优选的保守氨基酸的置换、缺失或插入。这种多肽可通过化学多肽合成法合成。保守氨基酸置换在本领域中已知。例如,天然蛋白质的一个或多个氨基酸残基可以用具有相似的电荷、大小或极性的氨基酸残基保守置换,如此处所述,得到的多肽保持了功能。进行这种置换的规则是公知的。更具体地说,保守氨基酸置换是那些一M生在其侧链相关的氨基酸家族中。遗传编码的M酸通常分为四组(l)酸性氨基酸天冬氨酸、谷氨酸;("碱性M酸赖氨酸、精氨酸和组氨酸;(3)非极性氨基酸丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸和色氨酸;和(4)不带电荷的极性氨基酸甘氨酸、天门冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸和酪氨酸。苯丙氨酸、酪氨酸和色氨酸也统称为芳香族M酸。在任何一个特定的组内的一个或多个替换是可选的,例如,用亮氨酸置换异亮氨酸或缬氨酸;用天冬氨酸置换谷氨酸或用苏氨酸置换丝氨酸,或任何其他氨基酸残基与结构相关的氨基酸残基间的置换对所得到的多肽的功能的影响一般无关紧要。"多肽"的定义范围包括经过人工修饰的氨基酸序列变体,这种修饰诸如但不限于保护、M化和由酰胺或非酰胺键以及共价和非共价键修饰产生的衍生化。"多肽"的定义范围包括根据其氨基酸序列按照功能性结构域能够预测其生物活性的肽。还包括通过其^酸序列分析不能预测其生物活性的肽。氨基酸是既含有氨基又含有羧基官能团的任何分子。氨基酸残基是在肽键形成中失去1分子水(H+来自含氮侧链、OH—来自羧基侧链)之后氨基酸剩下的部分,肽键是在蛋白质链中连接氨基酸单体的化学键。每种蛋白质都具有其独特的M酸序列,被成为一级结构。就像可以将字母表中的字母以不同方式组合形成无穷变化的词汇一样,可以将氨基酸以不同的序列连接起来形成大量的蛋白质。每种蛋白质的独特形状决定了它在体内的功能。前体是另一种通常更具活性或成熟的物质从中形成的物质。蛋白质前体是无活性蛋白(或肽),能够通过翻译后修饰转变成活性形式。蛋白质前体的名称经常加以前缀"前(pro)"或"前……原(prepro)"。当其后续的蛋白质可能有毒但是需要临时和/或大量可使用时,生物经常使用前体。本发明的多肽、前体或它们的盐具有激素的活性。所以,本发明的多肽、前体或盐用作药物(例如治疗性多肽)、用来发现相关靶点(例如GPCR)的配体、药物干预的靶点(例如单抗等的靶标、受体片段)、监测疾病的生物标记(结合工具抗体来检测体液中的肽片段)、蛋白激酶抑制剂和底物、T细胞表位、受体结合位点的肽模拟位、测量表达水平的生物标记。编码本发明的肽或前体的DNA用作例如基因治疗制剂、或治疗或预防心血管疾病、激素产生的肿瘤、糖尿病、胃溃疡等的制剂、激素分泌抑制剂、肿瘤生长抑制剂、神经活性剂等等。并且,本发明的DNA还用作诸如心血管疾病、激素产生的肺瘤、糖尿病、胃溃疡等疾病的基因诊断制剂。载体是将诸如DNA等遗传材料输送至细胞的传递媒介。DNA本身可以被认为是一种载体,例如特别是当其用于细胞转化时。在此意义上的载体是DNA构建体,例如,含有复制起点的质粒或细菌人工染色体。适当的复制起点使细胞在随同细胞本身的染色体复制时一起复制该构建体,并将其传递给后代。转化有载体的单细胞会长成完整的细胞培养物,其中所有的细胞都含有该载体,以及在该载体中携带的任何基因。因为构建体可以从细胞中通过纯化技术抽提出来,用载体转化是使少量的DNA分子变大的一种方式。载体可以是大肠杆菌来源的质粒(如pBR322、pBR325、pUC12、pUC13)、枯草芽孢杆菌来源的质粒(如pUB110、pTP5、pC194)、酵母菌来源的质粒(如pSH19、pSH15)、诸如入噬菌体等的噬菌体,以及诸如反转录病毒、痘苗病毒、杆状病毒等动物病毒。针对本发明的肽、前体或盐的抗体可特异性识别本发明的肽、前体或盐。还可以将其用于制备纯化本发明的多肽的抗体柱、在纯化过程中的各个馏分中检测本发明的多肽、或分析本发明的新型多肽在所检测细胞中的行为。因此,上述抗体可以用于检测实验溶液中本发明的肽或等同物。结果1.0计算^M呈序的说明1.1SignalP2.0版目的这个程序用来检测潜在的信号序列,使用的截止分值(cutoffscore)为0.98。2.0版SignalP预测来自不同生物的M酸序列中信号肽切割位点的存在和其定位。基于几个人工神经网络和隐马尔可夫^f莫型的结合,该方法合并了切割位点的预测和信号肽/非信号肽预测。1.2TMHMM2.0版目的该程序用来确定蛋白质序列其可能的跨膜区域。TMHMM2.0版用来预测蛋白质中的跨膜螺旋。N末端区域中预测的TM段有时候会是信号肽。1.3ProP1.0版目的该程序用来检测蛋白质序列中潜在的切割位点。所用分值为0.09。该程序用一组神经网络来预测真核蛋白序列中精氨酸和赖氨酸前肽切割位点。缺省为Furin-特异性预测。还可能进行总的前蛋白转化酶(PC)预测。该程序与预测信号肽切割位点的存在和定位的SignalP程序整合。1.4InterPro12版与InterProScan联合使用InterPro是蛋白质家族、结构域和功能位点的数据库,其中已知蛋白质中已经发现的可识别特征可用于未知蛋白质序列中。1.5InterProScan是用来将Jl&酸序列与InterPro数据库比对的程序。1.6BLAST2.2.9版基本局部比对检索工具(BLAST)发现序列间的局部相似性区域。该程序将核苷酸或蛋白质序列与序列数据库比对,并计算匹配的统计学意义。BLAST可用于推断序列间的功能和进化关系,并协助鉴别基因家族的成员。BLAST用Karlin-Altschul统计学来确定其产生的比对的统计学意义。基本算法可以以许多种方式实施,并用于各种情况中,包括直接DNA和蛋白质序列数据库检索、基序检索、基因鉴别检索和长DNA序列中相似性多重区域的分析。除了其数学分析的灵活性和易处理性,与具有相当的敏感性的现有序列比较工具相比,BLAST的计算速度快一个数量级。上述所有程序都可以通过公共互联网得到。用表达谙研究检测了本发明的激素肽的生物学作用(图16)。结果表明,取决于具体的序列,激素肽在几个组织中的存在情况不同。我们认为本发明的激素肽在不同組织中的差异表达是它们的重要生物学作用的有力指征。通过增加或减少本发明激素肽的量,调节这些激素肽中一个或几个15的浓度可能对需要减少或提高一个或几个此类激素肽浓度的疾病(例如心血管疾病,代谢疾病,精神疾病,癌症,病毒、细菌或酵母引发的感染和其他疾病)的治疗有强烈影响。2.0表达谱2.1)进行组织表达分析用T叫Man基因表达分析进行组织表达分析PCR(聚合酶链式反应)是医学和生物研究实验室中完成多种任务的基本技术,例如检测遗传疾病、鉴定遗传指紋图谱、传染病的诊断、基因的克隆、亲子关系检测和DNA计算。用定量PCR来快速测定PCR产物的量(优选实时PCR),这是定量观寸定DNA、cDNA或RNA的起始量的间接方法。通常,这种方法用于确定一个序列是否存在,以及如果存在的话,它在样品中的拷贝数。[62在本发明中用于基因表达研究的实验方案描述样品的准备受试组织的RNA样品从不同的供货商处购得。DNA酶消化所有的产品均购自Ambion:无DNA的DNA酶处理和去除试剂(1906)。根据说明书用50將RNA进行DNA酶消化。cDNA合成cDNA所用产品为购自Applera的反转录酶试剂盒(N8080234),RNA酶抑制剂(N8080119)。用10照RNA进行cDNA的合成。建立TaqMan反应用于PCR的产品购自Applera:在每个反应中使用TaqMan通用PCR标准混合物(TaqManUniversalPCRMasterMix,4305719)。分别用于每个基因的耙正向引物、耙反向引物和FAM标记的乾探针(见引物序列表)。在下列PCR反应条件下用ABIPrism7卯0(Applera)进行PCR反应50。C持续2分钟,95。C持续10分钟,然后进行40个循环的95。C持续15秒和60。C持续1分钟。用B2M做内参来标准化进行多重PCR。2.3)可得到编码SEQIDNO.l(图7)的肽序列的基因的下列表达镨。这些结果还在图1中以另一种格式表示<table>tableseeoriginaldocumentpage17</column></row><table><table>tableseeoriginaldocumentpage18</column></row><table><table>tableseeoriginaldocumentpage19</column></row><table>2.4)可得到编码SEQIDNO.2(图8)的肽序列的基因的下列表达镨。这些结果还以另一种格式示于图2中。<table>tableseeoriginaldocumentpage19</column></row><table>大脑海马33,1221,9111,210,42小脑40,0022,8417,160,00颞颥大脑皮层33,2823,619,661,23大脑皮层额叶34,8123,2011,610,32黑质40,0021,3918,610,00背根神经节39,8321,3518,470,00脊髓39,5521,5717,970,00下丘脑35,6521,8313,820,00杏仁核35,8221,5214,30O,OO肾上腺40,0021,0918,910,00唾液腺40,0021,5618,44O,OO甲状腺40,0020,5219,48O,OO心脏34,9620,6914,260,05主动脉35,5520,8914,650,00胎儿主动脉>35,8022,8612,94O,OOAoSMC29,2319,259,980,99HUVEC40,0021,2818,72O,OO脂肪39,4019,7719,63O,OO胎肝39,9822,0917,89O,OO肝40,0020,6619,34o,oo正常脾脏32,1619,0513,11O,ll扁桃体35,1219,1215,99o,oo骨髓39,7521,5718,18o,oo胸腺38,1620,0118,15o,ooPBMC对照39,8618,2921,570,00PBMC,PHA处理39,8318,1121,72o,ooTHP-1单核细胞39,6220,5919,030,0020<table>tableseeoriginaldocumentpage21</column></row><table>卵巢39,9421,1218,810,00印巢肿瘤对照39,5020,6518,85O,OO卵巢肿瘤(腺癌)36,0619,5016,560,00卵巢肿瘤(瘤癌)39,6718,9520,72O,OO前列腺39,5920,3719,220,00前列腺肿瘤对照40,0020,5419,46o,oo前列腺肿瘤(腺癌)37,5120,2717,23o,ooHeLa细胞40,0019,3420,66O,OO子宫32,3920,4611,930,26胎盘35,7422,0113,73O,OO睾丸32,4222,539,891,06阳性对照(HIPCO)33,1520,4812,670,12.5)可得到编码SEQIDNO.3(图9)的肽序列的基因的下列表达i普。这些结果还以另一种格式示于图3中。组织类型平均值RPL37a平均值MCt表达胎脑27,6123,883,7375,43大脑27,5821,825,7518,56大脑海马26,9521,095,8617,23小脑26,9821,835,1528,14颞颥大脑皮层27,8722,745,1328,48大脑皮层额叶27,9222,365,5721,10黑质26,0320,485,5521,34背才M中经节24,9320,794,1456,74脊髓25,9020,675,2226,80下丘脑26,4420,975,4622,6822<table>tableseeoriginaldocumentpage23</column></row><table><table>tableseeoriginaldocumentpage24</column></row><table>子宫23,7720,273,5088,49胎盘27,7322,135,5920,74睾丸25,4422,283,16111,93阳性对照(HIPCO)26,5720,506,0714,882.6)可得到编码SEQIDNO,4(图IO)的肽序列的基因的下列表达语。这些结果还以另一种格式示于图4中。组织类型平均值RPL37a平均值WCt表达胎脑26,6524,422,23213,09大脑25,8122,653,16111,58大脑海马25,4621,683,7872,68小脑24,2122,631,58333,75颞颥大脑皮层26,2223,252,97127,57大脑皮层额叶25,8523,022,84139,77黑质25,0921,413,6877,94背根神经节26,3121,404,9133,21脊髓25,5421,214,3249,99下丘脑25,3421,693,6579,80杏仁核25,5921,414,1855,15肾上腺26,4320,925,5121,96唾液腺27,0921,265,8317,58甲状腺25,1020,544,5642,30心脏25,5320,644,8933,68主动脉23,4820,642,84140,12胎儿主动脉>25,7622,812,95129,46AoSMC24,7420,224,5143,8425<table>tableseeoriginaldocumentpage26</column></row><table>乳腺肺瘤(腺癌)25,0619,915,1528,22乳腺25,4520,474,9931,54结肠25,6719,895,7818,14结肠IBD对照24,9819,185,8017,95结肠IBD26,4519,466,987,91结肠肿瘤对照24,9319,695,2526,32结肠肿瘤(腺癌)25,2119,415,8017,93食道27,8522,075,7818,21胃26,3320,905,4323,22小肠26,5221,215,3125,24胰腺28,5423,505,0330,53卵巢26,2721,125,1528,07卵巢肿瘤对照24,9620,854,1157,84卵巢肺瘤(腺癌)25,2919,545,7618,51卵巢肿瘤(瘤癌)25,5819,236,3512,28前列腺25,8320,295,5521,42前列腺肿瘤对照25,9720,735,2526,31前列腺肿瘤(腺癌)25,3020,364,9432,52HeLa细胞24,1619,704,4645,58子宫25,4420,464,9831,72胎盘24,6522,122,53172,96睾丸27,3522,275,0829,60阳性对照(HIPCO)24,9720,424,5542,652.7)可得到编码SEQIDN0.5(图ll)的肽序列的基因的下列表达语。这些结果还以另一种格式示于图5中。组织类型平均值RPL37a平均值MCt表达27胎脑38,3623,8714,490,00大脑30,3922,288,123,60大脑海马32,3521,4710,880,53小脑33,4422,3211,120,45颞颥大脑皮层30,4822,877,615,12大脑皮层额叶29,5422,876,679,85黑质29,0020,878,133,57背才M中经节33,5721,0912,480,18脊髓34,8321,1813,650,08下丘脑33,3021,1512,140,22杏仁核29,8121,108,712,39肾上腺35,8820,6315,250,00唾液腺32,1120,8611,250,41甲状腺30,0220,0110,010,97心脏22,9220,242,68155,99主动脉32,0120,3511,660,31胎儿主动脉^32,2522,2010,050,95AoSMC36,6920,1016,59O,OOHUVEC37,9620,8117,15O,OO脂肪31,8819,2412,640,16胎肝35,0421,6613,380,00肝35,5820,2315,350,00正常脾脏39,9018,5921,31O,OO扁桃体36,1918,6317,56o,oo骨髓37,4021,0716,33O,OO胸腺39,6319,2920,340,00PBMC对照39,2817,9021,390,0028<table>tableseeoriginaldocumentpage29</column></row><table>说明书第26/32页小肠38,1321,1117,02O,OO胰腺40,0023,7116,29o,oo卵巢34,5121,0713,430,09卵巢肿瘤对照32,3320,6111,720,30卵巢肿瘤(腺癌)39,2519,6219,630,00卵巢肿瘤(瘤癌)37,4519,1118,340,00前列腺32,1220,3411,790,28前列腺肿瘤对照39,6220,7118,920,00前列腺肿瘤(腺癌)38,2120,3817,830,00HeLa细胞40,0019,3820,62O,OO子宫33,2220,1913,030,12胎盘39,9222,3217,59o,oo睾丸33,4322,2511,180,43阳性对照(HIPCO)33,1020,6912,420,182.8)可得到编码SEQIDN0.6(图12)的肽序列的基因的下列表达镨。这些结果还以另一种格式示于图6中。组织类型平均值RPL37a平均值MCt表达胎脑27,3425,411,93263,22大脑29,1923,305,8816,95大脑海马28,8022,546,2613,07小脑32,1623,378,792,26颞颥大脑皮层29,7924,095,7119,12大脑皮层额叶29,2824,025,2725,99黑质28,0322,165,8717,05背才M申经节29,5122,027,505,5330<table>tableseeoriginaldocumentpage31</column></row><table><table>tableseeoriginaldocumentpage32</column></row><table>前列腺肺瘤(腺癌)31,5321,4310,110,91HeLa细胞31,3420,4310,910,52子宫29,0721,577,495,55胎盘32,1923,288,922,07睾丸29,0423,445,6020,60阳性对照,HIPCO27,7821,546,2413,27参考文献(1)HenrikNielsen,JacobEngelbrecht,S0renBrunakandGunnarvonHeijne"Identificationofprokaryoticandeukaryoticsignalpeptidesandpredictionoftheircleavagesites"ProteinEngineering,10:1-6,1997,(2)A.Krogh,B.Larsson,G.vonHeijneandE.L.L.Sonnhammer."PredictingtransmembraneproteintopologywithahiddenMarkovmodel:Applicationtocompletegenomes"JournalofMolecularBiology,305(3):567-580,January2001.(3)PeterDuckert,S0renBrunakandNikolajBlom,"Predictionofproproteinconvertasecleavagesites"ProteinEngineering,DesignandSelection:17:107-112,2004.(4)Strand,F丄.Neuropeptides:Regulatorsofphysiologicalprocesses.(1999)MITPress.(5)Anderson,N.L.&Anderson,N.G.Thehumanplasmaproteome:history,character,anddiagnosticprospects.Mol.Cell.Proteomics,2002Nov;l(ll):845-67.(6)MulderNJ,ApweilerR,AttwoodTK,BairochA,BatemanA,BinnsD,BradleyP,BorkP,BucherP,CeruttiL,CopleyR,CourcelleE,DasU,DurbinR,FleischmannW,GoughJ,HaftD,HarteN,HuloN,KahnD,33KanapinA,KrestyaninovaM,LonsdaleD,LopezR,LetunicI,MaderaM,MaslenJ,McDowallJ,MitchellA,NikolskayaAN,OrchardS,PagniM,PontingCP,QuevillonE,SelengutJ,SigristCJ,SilventoinenV,StudholmeDJ,VaughanR,WuCH.InterPro,progressandstatusin2005.NucleicAcidsRes,2005Janl;33(Databaseissue):D201-5.图1为在ATAQ1上针对SEQIDNO.1的AC105940的mRNA表达谱;图2为在ATAQ1上针对SEQIDNO.3的AC005291的mRNA表达谱;图3为在ATAQ1上针对SEQIDNO.4的AC090617的mRNA表达镨;图4为在ATAQ1上针对SEQIDNO.5的AC114684的mRNA表达镨;图5为在ATAQ1上针对SEQIDNO.7的AC063920的mRNA表达谱;图6为在ATAQ1上针对SEQIDNO.8的AC074389的mRNA表达谱;图7为SEQIDNO.1的^J^財列表;图8为SEQIDNO.2的#^#列;图9为SEQIDNO.3的^J^^列;图10为SEQIDNO.4的^J^i^列;图11为SEQIDNO.5的^J^^列;图12为SEQIDNO.6的^J^^列;图13为SEQIDNO.7的^J^,列;图14为SEQIDNO.8的^J^^列;图15为SEQIDNO.9的核苷酸序列;图16为SEQIDNO.10的核苷酸序列;图17为SEQIDNO.11的核苷酸序列;图18为SEQIDNO.12的核苷酸序列;图19为SEQIDNO.13的核苷#列;图20为SEQIDNO.14的核苷^列;图21为SEQIDNO.15的核苷酸序列;图22为SEQIDNO.16的核苷酸序列;图23为SEQIDNO.1的核苦酸探针序列;图24为SEQIDNO.1的核苷酸正向引物序列;图25为SEQIDNO.1的核苷l向引物序列;图26为SEQIDNO.2的核普酸探针序列;图27为SEQIDNO.2的核苷酸正向引物序列;图28为SEQIDNO.2的核苷l向引物序列;图29为SEQIDNO.3的核苷酸探针序列;图30为SEQIDNO.3的核苷酸正向引物序列;图31为SEQIDNO.3的核苷l向引物序列;图32为SEQIDNO.4的核苷酸探针序列;图33为SEQIDNO.4的核普酸正向引物序列;图34为SEQIDNO.4的核苦H向引物序列;图35为SEQIDNO.5的核苷酸探针序列;图36为SEQIDNO.5的核苷酸正向引物序列;图37为SEQIDNO.5的核苷l向引物序列;图38为SEQIDNO.6的核苷酸探针序列;图39为SEQIDNO.6的核苷酸正向引物序列;图40为SEQIDNO.6的核苷H向引物序列;图41为SEQIDNO.7的核普酸探针序列;图42为SEQIDNO.7的核苷酸正向引物序列;图43为SEQIDNO.7图44为SEQIDNO.8图45为SEQIDNO.8图46为SEQIDNO.8的核普^向引物序歹'J;的核苷酸探针序列;的核普酸正向引物序列;的核苷晚良向引物序列。权利要求1、一种多肽链,所述多肽链包含根据SEQIDNO.1~8的氨基酸序列或通过缺失、置换或插入至少一个氨基酸残基而从所述氨基酸序列衍生来的氨基酸序列,或其酰胺或酯或所述肽的盐。2、根据权利要求1的多肽链,其由下列氨基酸序列组成MYWMALRRISTLGSRWLGLSRVLLFRASKASFTFLSLRFSLSVAARRS。3、根据权利要求1的多肽链,其由下列氨基酸序列组成MGSGCARARLGLLSWLAASSGSEDALASSISVKLALELAEVAWSEGLSPTAPKWLEEAEERUIXRSIPL。4、根据权利要求1的多肽链,其由下列氨基酸序列组成MLLAMSSISIFSSLFSFSSFCFTRCRLSICSPSSATLSACFFLRVAAVASCCRVASSRSLRIFWNSASLFLFISIWAEVAPLASSSLSLISSSSLARSERCFSILALSVCSASISSSSSSMRA。5、根据权利要求1的多肽链,其由下列氨基酸序列组成MATSWAGSAAPPASAAKSWGTRPSRPGGPRSAWRRRRATLAAWTGPARAATATTTRAAARRPVAARTPARLAATSRATHARTWPMASPRASVTTCTCAFRAARASPALSS。6、根据权利要求1的多肽链,其由下列氨基酸序列組成MPRSAPRAAAAPARAPAAAAVACACCPNSAPDFFMVCGGHVRSLARAPARPGAPRRI。7、根据权利要求1的多肽链,其由下列氨基酸序列组成TRHTR。8、根据权利要求1的多肽链,其由下列氨基酸序列组成PPGVAAVRSASTVPEENCSGSKLYVCVAKSMNSPSMLLDSEMTWPLARFP(J。9、根据权利要求1的多肽链,其由下列氨基酸序列組成MASAAGEPFSMYLASAAAALCTPTASARKARGLRTEPLDEVLARGGPAASTLWCRCRLWPKASLYPGARKPCLAASGSDSSTSGGSATDTGPDLTPWKEVDSDLSASMQLLMIWLTLSTSLAMVEISATELWLSGPGRPSSQSLRSGGSPVRTSM。10、一种DNA,所述DNA包含编码权利要求l的多肽链的根据SEQIDNO.9~16的核苷酸^5^序列,所述多肽链包含SEQIDNO.1~8所代表的M酸序列,或其酰胺、酯或它们的盐。11、根据权利要求10的DNA,其由根据SEQIDNO.9的核苷酸碱基序列组成,编码根据权利要求1或2的多肽链。12、根据权利要求10的DNA,其由根据SEQIDNO.IO的核苷酸碱基序列组成,编码才艮据权利要求1或3的多肽链。13、根据权利要求10的DNA,其由根据SEQIDNO.11的核苷酸碱基序列組成,编码根据权利要求1或4的多肽链。14、根据权利要求10的DNA,其由根据SEQIDNO.12的核苷酸碱基序列組成,编码根据权利要求1或5的多肽链。15、根据权利要求10的DNA,其由根椐SEQIDNO.13的核苷酸碱基序列组成,编码根据权利要求1或6的多肽链。16、根据权利要求10的DNA,其由根据SEQIDNO.14的核苷酸碱基序列组成,编码根据权利要求1或7的多肽链。17、根据权利要求10的DNA,其由根据SEQIDNO.15的核苷酸碱基序列組成,编码根据权利要求1或8的多肽链。18、根据权利要求10的DNA,其由根据SEQIDNO.16的核苷酸碱基序列组成,编码根据权利要求1或9的多肽链。19、根据权利要求1018的DNA在制备重组栽体中的用途,其中所述重组载体包括1.根据权利要求1018的DNA;2.将权利要求19(a)的重組载体引入宿主细胞中。20、一种制备根据权利要求l的多肽的方法,其中所述方法包括步骤i.提供氨基酸;ii.用固相或液相合成法合成所述氨基酸;1.抽提多肽;iii.纯化所述多肽。21、一种制备权利要求1所述的多肽、前体或它们的盐的方法,包括将构成氨基末端的氛基酸或肽与构成氣基末端的氨基酸或肽缩聚,随后任选地进行分子内二石克键的形成。22、一种药物组合物,包含作为活性剂的多肽链或前体、或其可药用的酰胺、酯或盐,其中所述多肽链由根据SEQIDNO.l-8的氨基酸序列组成。23、根据权利要求21的药物组合物的用途,所述药物组合物包含作为活性剂的多肽链或前体、或其可药用的酰胺、酯或盐,其中所述多肽链由根据SEQIDNO.1~8的氨基酸序列组成,用来改变那些增加动脉石更化、炎症或不可控制的细胞分裂的风险的生理因素。24、一种针对根据权利要求1的多肽链的抗体,所述多肽链包括根据SEQIDNO.18的^絲列、或其酰胺、酯或它们的盐。全文摘要本发明涉及新型生物活性肽激素、生产该生物活性肽激素的方法及该生物活性肽激素的应用。本发明鉴定了新型生物活性肽前体及它们的盐,它们可用作药物(例如治疗性多肽)、用来发现相关靶点(如GPCR)的配体或药物干预的靶点。文档编号C07K14/435GK101600734SQ200780047288公开日2009年12月9日申请日期2007年12月12日优先权日2006年12月19日发明者E·容,S·沙伊德勒,W·迪特里希申请人:塞诺菲-安万特股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1