专利名称:结合有工业意义的小分子的肽结构域的利记博彩app
结合有工业意义的小分子的肽结构域相关申请的交叉引用
本申请要求于2010年I月29日提交的美国专利申请序列号61/299,449的申请日权益,其公开内容通过引用并入本文中。背景
一直在将能够结合特异性靶标分子的肽用于生物学、医学、制药领域的各类研究和产品开发工作中。在这些领域中,靶标分子通常是具有生物学意义的分子,例如病变细胞或致病细胞的肽表位、表面受体蛋白、信号转导蛋白、在生物学应答例如免疫T细胞和B细胞应答的病因学中涉及的蛋白质和用于生物学研究的靶标,例如与核酸结合的蛋白质或为鉴定和筛选目的需要特异性结合配体的生物学感兴趣的其它蛋白质。为获得具有特定靶标结合活性的肽而最长期使用的工具来自对免疫反应的开发,·最初是通过获得多克隆抗体,例如通过注射靶标分子攻击动物以获得B细胞应答来诱导IgG和IgM,并从血液中分离抗体。随后,从杂交瘤细胞克隆中获得单克隆抗体,所述杂交瘤细胞克隆产生结合靶标分子的特定表位的单一种类的抗体。有用的抗体具有以通常为10_7M或更小、更通常为10_8 M-10_9M的摩尔解离常数(Kd)结合靶标分子的能力。这些技术完全依靠开发天然生物免疫系统,所述系统能够重组抗体高可变结构域的编码序列以产生极为多样化的抗体,并具有天然刺激与目的靶标分子结合的少量抗体增殖的能力。就单克隆抗体而言,天然诱导的增殖被人为的选择和培养表达特异性抗体的克隆的能力所取代。尽管已经证明使用抗体成为用于获得结合特定靶标分子的肽的强大工具,但抗体的工业应用的效用受到限制。首先,抗体必须由全血、鸡蛋或杂交瘤组织培养物制备,与结合靶标分子的工业规模需求相比,所有这些都是昂贵而低产量的生产系统。其次,它们依赖在抗体分子高可变区形成的结合结构域的三维结构,这需要生产相当大的蛋白质(即使是单链可变片段情况下),以获得结合每一摩尔靶标分子所需的相对较小的肽结构域的I摩尔结合当量。最近,用于鉴定靶标结合结构域的抗体的较新的备选品是开发细菌蛋白展示系统,最值得注意的是噬菌体展示系统。这些系统以与表面蛋白的融合蛋白的形式来展示肽或整个蛋白的序列,例如对于噬菌体展示,将肽表达为与噬菌体颗粒蛋白的融合蛋白。噬菌体展示是用于探索组合随机肽文库的序列空间的最强大和完善的技术之一。通常外源蛋白/肽作为与次要外壳蛋白PlII或主要外壳蛋白PVIII的融合蛋白表达于M13噬菌体表面上。可针对靶标分子(固定在珠粒上或吸附于微量滴定板孔中)筛选具IO7-IO11多样性肽(具有5-40个残基)的文库,经过结合和感染的反复轮次富集特定的结合物。通过ELISA检测富集池中单个克隆的结合,通过测定噬菌体颗粒中的DNA序列来解码结合肽的氨基酸序列。然后可将肽配体的氨基酸序列与蛋白质数据库比较,以计算机鉴定潜在的内源互作蛋白。噬菌体展示技术主要用于鉴定蛋白质-蛋白质、蛋白质-肽和蛋白质-DNA的相互作用,因此,尤其用作鉴定靶标肽的研究工具,所述靶标肽与生理学重要的蛋白例如抗体和受体相互作用,或与特定DNA序列结合,或与潜在候选药物结合以便发现用于药物应用的潜在生理学靶标蛋白。然而,很少将噬菌体展示用于鉴定与有工业意义的小分子结合的肽,所述有工业意义的小分子例如在工业生产液流中的污染物或金属离子。尽管作为研究工具有用,但一直未显示噬菌体展示作为实际生产用于在任何工业加工或产品方面的商业部署的肽结构域的工具的实用性。然而,业已阐述少数金属结合肽。在金属结合肽中发现的一种金属结合基序为6个组氨酸(“多组氨酸”)的序列,已知其能够结合镍。可获得含有其中启动子与编码含多组氨酸的肽的区域连接的核酸序列的表达载体,以制备所谓的“组氨酸-标签”融合蛋白,所述融合蛋白可通过依靠多组氨酸结构域结合固定在柱上的镍的能力自细胞提取物中快速分离。用过量咪唑从柱中洗脱结合的蛋白。如果克隆载体在融合蛋白框架内另外编码蛋白酶底物位点,则可用蛋白酶将多组氨酸结合结构域自洗脱蛋白裂解。最为人知晓的多组氨酸结合结构域是包含6个组氨酸核心序列的肽,如以序列YSHHHHHHLAGTA (SEQ ID NO 1)为例所示,其对镍的摩尔解离常数为2. 3 χ 1(Γη Μ。另外一种已知多组氨酸结合结构域为组氨酸-谷氨酰胺二肽的6聚体重复的12个氨基酸的肽,即(HQ)6 (SEQ ID NO :2),精氨酸也表明是在镍结合中起重要作用的氨基酸残基,因为亦显 示共有序列RHXHHR (SEQ ID NO 3)(其中X最常为组氨酸)以高亲和力结合镍(Jie等,Chemical Biology & Drug Design (2006) 68 .-107-112) 0 Jie 等人通过筛选形成经工程改造以在鞭毛上展示蛋白的细菌文库的肽鉴定了该序列,并提示展示所述序列的细菌可能用作生物衍生的废水修复剂(remediation agent)。Behnaz 等人(Zra/ ia/ /otfraaJ of Biotechnology (2005) J ..7洲-765)用相似的系统揭示结合金属的肽的极为不同的基序,其显示经由纤毛(fibrinea)融合蛋白展示于大肠杆菌(疋co7i)表面上的富半胱氨酸肽GCGCPCGCG (SEQ ID NO :4),能够以相对次序铅〉镉〉镍结合金属。关于半胱氨酸,显示通过与OmpX膜蛋白融合在其表面展示含半胱氨酸肽LCCYWSYSRMCKN(SEQ ID NO :5)(选自随机产生的11-聚体文库,11-聚体中,2个半胱氨酸被7个氨基酸分开且每一个侧翼有2个氨基酸)的大肠杆菌,与悬浮液中的金颗粒结
(Kaviani, Biological Applications NNIN REU (2006) Research Accomplishments,第12-13页)。通过噬菌体展示用M13鉴定了序列LKAHLPPSRLPS (SEQ ID NO 6)的含脯氨酸/羟基金结合肽(Nam等,Science (2006)312:885-888)。同样地但在不相关的工作中显示,通过噬菌体表面展示鉴定的几个富含羟基但没有特定共有序列的肽结合铝,其中肽VPSSGPQDTRTT(SEQ ID NO 7)显示特别强的结合(Zao 等,Appl. Microb. and Biotech.(2005) CU防-见功。业已提议金结合肽可能用于微电子纳米结构的组装。其他人证明在M13噬菌体文库上展示的金属结合肽可用作改进催化活性的生物模板催化剂(Nelner等,ACS Nano (2010) 4 :3227-3235、。尽管有这些建议,但是单独的噬菌体展示或其它细菌展示系统还不适于在实际工业规模处理中部署,所述实际工业规模处理例如水修复、回收贵重金属或从工业生产液流中去除污染物。这是因为结合工业规模工业生产液流中的靶标分子所需的结合位点的量非常大。举例而言,经由细菌细胞培养物产生的典型噬菌体滴度大约为IO12颗粒/mL。即使假定每个颗粒展示IO3个结合蛋白,每个蛋白结合一当量靶标分子,这需要6. 02 χ IO8 mL或602,000升细胞培养物以产生足够多的颗粒仅仅结合I摩尔靶标分子。I摩尔镍是60g的材料,典型的水密集型工业生产加工例如在湿磨设备中每天加工250,000蒲式耳的谷物,每小时使用数百上千升的水,在仅3小时内能提取多至6磅(2700克)的镍。因此,为了利用在噬菌体颗粒上表达的镍结合结构域,来结合从谷物湿磨设备或是产生含有提取的金属例如镍的大量废水的其它农业加工(例如大豆加工)一天产生的所有镍,可能使用约218百万升的噬菌体培养物来生产足够多的颗粒。如此大规模生产在商业上是不实际的。细菌表面上展示甚至更加不实际,因为每个细菌的展示分子总数量约和噬菌体一样,但是细菌的最大滴度约为IO9个细胞/mL。因此,需要与噬菌体颗粒上展示的结合位点一样多时,需要至少1000倍量的细菌培养物在鞭毛或纤毛上展示足够的结合位点。 存在特异性结合工业生产液流中的小分子的实际工业需求,所述需求可用于水修复、从食品中去除污染物和大规模纯化天然存在的小分子。发明简述
本说明书阐述以高亲和力结合有工业意义的分子的肽。在一个实施方案中,鉴定了具有很多组氨酸残基的肽,所述肽结合金属离子,例如Ni、Cu和Zn,尤其是以比例如SEQ IDNO :1还要高的亲和力(较低Kd)结合Ni。在另一实施方案中,鉴定了结合不利地影响食物的颜色、稳定性或气味的污染物(例如胡萝卜素)的肽。当加工棕榈油时通常同时萃取胡萝卜素,因此胡萝卜素结合肽使得可从棕榈油中除去胡萝卜素。在又一实施方案中,鉴定了结合来自农业来源的天然产物(例如大豆来源的异黄酮)的肽,所述天然产物可用作营养制品,例如异黄酮染料木黄酮。已鉴定的肽可以以高特异性与所述多种类的有工业意义的分子结合这一事实,证明诸如肽展示系统等方法可用于鉴定用于多种多样工业加工的肽。可采用已鉴定的结合肽来去除、分离(纯化)或检测(鉴定)复杂混合物中的靶标分子或结构相关分子。因此,本发明提供分离的金属结合肽和一种或多种这类肽的融合体,并任选与其它肽的融合体,所述其它肽例如用于结合其它分子的肽和/或为蛋白酶底物的肽,藉此形成嵌合多肽。在一个实施方案中,金属结合肽或其融合体亦包括适用于纯化或分离的肽序列,例如谷胱甘肽S-转移酶(GST)或几丁质结合肽序列。在一个实施方案中,融合体包括金属结合肽的串联体(concatemer),例如融合体具有至少两个独特的金属结合肽序列或至少两个相同的金属结合肽序列。在一个实施方案中,接头序列分开相邻的金属结合肽序列,以例如允许金属无障碍地结合邻近的结合位点。在一个实施方案中,金属结合肽长度为至少5-约30个氨基酸,例如长度为约10-约30个氨基酸(或5-30之间的任意整数),例如长度为10-15个氨基酸。多个金属结合肽的融合体可以为任何长度,所述融合体包括具相同肽序列或不同肽序列的融合体。在一个实施方案中,融合体长度不多于1000个氨基酸。在另一个实施方案中,融合体长度不多于500个氨基酸。在又一实施方案中,融合体的长度不多于100个氨基酸。在再一实施方案中,融合体的长度不多于50个氨基酸。嵌合多肽可具有至少2个金属结合肽结构域,所述结构域在更大的多肽序列(例如天然存在的多肽)中可取代一个或多个结构域或序列,或可将所述结构域插入更大的多肽序列(例如天然存在的多肽)中或其一端或两端或其任意组合。本发明同样提供分离的聚类萜(例如类胡萝卜素或叶黄素)结合肽和这些肽中一种或多种的融合体,并任选与其它肽的融合体,所述其它肽例如用于与其它分子结合的肽和/或为蛋白酶底物的肽,藉此形成嵌合多肽。在一个实施方案中,本发明提供分离的胡萝
卜素结合肽和这些肽中一种或多种的融合体,并任选与其它肽的融合体,所述其它肽例如用于与其它分子结合的肽和/或为蛋白酶底物的肽,藉此形成嵌合多肽。在一个实施方案中,聚类萜或类胡萝卜素结合肽,例如胡萝卜素结合肽或其融合体,还包括适用于纯化或分离的肽序列,例如GST或几丁质结合结构域。在一个实施方案中,融合体包括胡萝卜素结合肽的串联体,例如融合体具有至少两个独特的胡萝卜素结合肽序列。在一个实施方案中,接头序列分开相邻的胡萝卜素结合肽序列。在一个实施方案中,胡萝卜素结合肽长度为至少
9-约30个氨基酸,例如长度为约10-约30个氨基酸(或9-30之间的任意整数)。多个胡萝卜素结合肽的融合体可以为任何长度,所述融合体包括具相同肽序列或不同肽序列的融合体。在一个实施方案中,融合体长度不多于1000个氨基酸。在另一个实施方案中,融合体长度不多于500个氨基酸。在又一实施方案中,融合体的长度不多于100个氨基酸。在再一实施方案中,融合体的长度不多于50个氨基酸。嵌合多肽可具有至少2个胡萝卜素结合肽结构域,所述结构域在更大的多肽序列(例如天然存在的多肽)中可取代一个或多个结构域或序列,或可将所述结构域插入更大的多肽序列(例如天然存在的多肽)中或其一端或两端或其任意组合。
本发明同样提供分离的异黄酮结合肽和这些肽中一种或多种的融合体,并任选与其它肽的融合体,所述其它肽例如用于与其它分子结合的肽和/或为蛋白酶底物的肽,藉此形成嵌合多肽。在一个实施方案中,异黄酮结合肽或其融合体包括适用于纯化或分离的肽序列,例如GST或几丁质结合结构域。在一个实施方案中,融合体包括异黄酮结合肽的串联体,例如融合体具有至少两个独特的异黄酮结合肽序列。在一个实施方案中,接头序列分开相邻的异黄酮结合肽序列。在一个实施方案中,异黄酮结合肽长度为至少10-约40个氨基酸,例如长度为约15-约35个氨基酸(或10-40之间的任意整数)。多个异黄酮结合肽的融合体可以为任何长度,所述融合体包括具相同肽序列或不同肽序列的融合体。在一个实施方案中,融合体长度不多于1000个氨基酸。在另一个实施方案中,融合体长度不多于500个氨基酸。在又一实施方案中,融合体的长度不多于100个氨基酸。在再一实施方案中,融合体的长度不多于50个氨基酸。嵌合多肽可具有至少2个异黄酮结合肽结构域,所述结构域在更大的多肽序列(例如天然存在的多肽)中可取代一个或多个结构域或序列,或可将所述结构域插入更大的多肽序列(例如天然存在的多肽)中或其一端或两端或其任意组合。本文亦阐述编码具一种或多种肽结合结构域的融合蛋白的重组核酸(表达盒),其中至少一种为本发明结合肽。在一个实施方案中,以串联体形式表达肽结合结构域作为含一种肽结合结构域的多个拷贝或不同的肽结合结构域的多个拷贝的人工重组融合蛋白(嵌合多肽)。不象抗体,每分子嵌合多肽可含有多种结合结构域。同样,可将细菌菌株改造成以使其易于从细菌培养物或细菌提取物中分离的方式过表达串联体融合蛋白。例如,将融合体遗传改造用于分泌到培养基中,或改造为纳入到细菌蛋白体内(例如包涵体)。在另一实施方案中,融合蛋白可包括使其易于从混合物中分开(分离)的额外的肽结构域。所述结构域实例为以下结构域赋予在溶剂例如乙醇中的差异溶解度的结构域;引起融合蛋白絮凝的结构域;或赋予第二配偶体靶标结合能力的第二结合结构域,使得可通过与含有所述第二结合配偶体的底物结合来分离融合蛋白。用本文公开的方法使制备足够摩尔的结合结构域以部署用于工业应用(例如水修复和产品/污染物分离)变得在经济上实际起来。因此,所述方法提供用本发明结合肽从复杂混合物中分离或分开分子。在一个实施方案中,所述方法提供从农作物的农业加工中分离污染物,例如包括镍在内的金属。在一个实施方案中,采用本发明结合肽来分离对映体分子。例如,本发明提供分离对映体的方法,所述方法包括提供怀疑具有化合物的外消旋混合物的样品;提供具有固定在其上的有13个或更少氨基酸的结合结构域的肽的基质,所述肽以至少10_9 M或更小的解离常数优先结合化合物的一种对映体;使样品与基质接触;洗涤基质以除去包括对映体之一在内的未结合物质。在一个实施方案中,从基质洗脱结合的对映体。该方法亦提供在样品例如环境样品中检测和任选定量分子。例如,可使土壤样品与具有本发明结合肽的传感器接触,可在样品中检测金属的存在与否或金属的量。亦阐述广泛用于遗传工程改造呈串联体形式的多拷贝结合结构域的通用技术。该 技术包括以使在离体合成和体内重组中折返(snap-back)形成最小化的方式有目的地选择不同DNA序列来编码相同的肽结构域。本文所述肽全部结合小分子,最初用肽展示技术鉴定,例如用噬菌体展示。因此,一种方法阐述用肽展示系统来鉴定结合非肽、非-核酸靶标分子的肽,所述靶标分子的分子量小于约1600Da,例如小于约lOOODa。该法包括获得不是抗体分子的展示肽结合结构域的分子文库,从文库中挑选具有结合靶标分子的肽结构域的分子亚组,和鉴定所述亚组的肽序列。在一个实施方案中,本发明提供从样品中分离靶标分子的方法。所述方法包括提供包含在生物颗粒表面上展示的多种肽结构域的肽文库,筛选肽文库以鉴定结合靶标分子的肽,和测定编码结合肽的核酸序列。在一个实施方案中,所述方法包括提供分离的融合蛋白,所述融合蛋白具有包含至少一个靶标结合肽的靶标结合结构域和包含结合配体、能够与基质发生交联或从溶液中形成絮凝的氨基酸残基的分离结构域;使融合蛋白与含有靶标分子的样品接触,以使靶标分子与靶标结合结构域结合;和用分离结构域来分离结合有靶标分子的融合蛋白,藉此分离靶标分子。在一个实施方案中,分离结构域与选自CBD、MBD和GST的配体结合。在一个实施方案中,通过固定在包含配体的基质上来分离融合蛋白。在一个实施方案中,分离结构域具有可与基质发生交联的氨基酸残基,分离融合蛋白包括在使融合蛋白与含有靶标分子的样品接触之前,使分离结构域与基质发生交联。在一个实施方案中,分离结构域包含絮凝结构域,分离融合蛋白包括在与含有靶标分子的样品接触后使融合蛋白发生絮凝,并分离出絮凝融合蛋白。絮凝结构域包括但不限于Suarez等所公开的那些(Biochim Biophys Acta (1995)必7),其公开内容并入本文。在一个实施方案中,本发明提供检测样品中小于1600Da的靶标分子的存在的方法。在一个实施方案中,所述方法包括将以至少10-9 M或更小的解离常数结合靶标分子的具有13个或更少氨基酸的结合结构域的肽固定在基质上;使固定的肽与样品接触;洗涤基质以除去未结合的物质;和检测靶标分子是否结合肽。可通过任何方法来检测结合,所述方法包括但不限于表面等离振子共振检测仪、荧光检测仪、放射性同位素检测仪或分光光度计。在一个实施方案中,结合结构域包含较大融合蛋白中的至少一种结构域,例如,所述融合蛋白由多种结合结构域组成。在一个实施方案中,靶标分子选自金属、类胡萝卜素和异黄酮。同样提供包含固定化肽的传感装置,所述肽具有13个或更少氨基酸的结合结构域,其以至少10—9 M或更小的解离常数结合所选出的靶标分子。
附图简述
图I显示凝胶照片,其证明金属离子对通常结合镍的具含His的肽的蛋白质的相对特异性。从树脂中洗脱的蛋白量越少,在预孵育步骤中金属初始与肽的结合越好。图2阐明金属Ni、Cu和Zn与融合蛋白的相对结合,所述融合蛋白含有本发明的金属结合含His肽(GST-A15; A15, YTRTPHVHWHAHG, SEQ ID NO :9)。图中描述的是与经由GST固定在柱上的蛋白结合的金属的咪唑洗脱概况。图3阐明金属Ni、Cu和Zn与融合蛋白的相对结合,所述融合蛋白含有本发明的金属结合含 His 肽(GST-B16; B16, WGGffRHVHGHRHP, SEQ ID N0:11)。 图4阐明金属Ni、Cu和Zn与融合蛋白的相对结合,所述融合蛋白含有金属结合His6 肽(GST-C26; C26, YEHHHHHHLAGTA, SEQ ID NO: 13)。图5描述融合蛋白的核酸序列(SEQ ID NO 14)和蛋白序列(SEQ ID NO 15)实例,所述融合蛋白含有第二结合结构域(几丁质结合结构域)和由两个不同金属结合肽序列A15(SEQ ID NO 9)和B16 (SEQ ID NO 11)组成的5个金属结合结构域的串联体。图6描述了表现出胡萝卜素结合的一组肽序列(SEQ ID NO 16-48)以及因此的共有序列(SEQ ID NO 49)。图7描述了来自第二次筛选的一组核心肽结合结构域(SEQ ID NO :50_71),所述结合结构域使得可结合胡萝卜素,并具有核心基序X1X2GWX3HyX4X5X6 (SEQ ID NO :72)。在一个实施方案中,X2为丙氨酸。在一个实施方案中,Hy为芳香族氨基酸,例如色氨酸。在一个实施方案中,X4为色氨酸。图8描述表现出结合异黄酮、染料木黄酮的一组肽序列(SEQ ID NO :73-94)。图9描述具有赋予结合Ni和其它金属的核心的一组肽序列(SEQ ID NO :9、SEQ IDNO 1U SEQ ID NO :13 和 SEQ ID NO :95-111)。
图10描述图9中描述的一组肽序列的亲水性(hydropathy)比较和氨基酸数量。图11显示含β-胡萝卜素结合结构域(SEQ ID NO 55)的融合蛋白的示意图(A),和用胡萝卜素包被然后接触含胡萝卜素结合结构域的融合蛋白的微量离心管中样品的吸光谱(B)。样品I和2无β-胡萝卜素,而样品3-7含β-胡萝卜素。样品3与麦芽糖结合蛋白(MBP)接触,样品4与MBP-CRKl融合蛋白接触,样品5和6与MBP -胡萝卜素结合肽融合蛋白接触,样品7与MBP-CBD -胡萝卜素结合肽融合蛋白接触。图12显示例示性载体(A-E)和因此的序列(F-I) (SEQ ID NO 55和143-150)。(F)载体具有以下元件核苷酸1-303,SUMO ;核苷酸313-333,TEV蛋白酶位点;核苷酸352-486,几丁质结合结构域;核苷酸523-546,PreScission蛋白酶位点;核苷酸562-786,5χ镍结合肽和接头(通过下划线和双下划线来显示编码不同肽的核苷酸);和核苷酸796-819,FLAG表位。(G)载体具有以下元件核苷酸7_24,His标签;核苷酸25-324,SUMO ;核苷酸334-354,TEV蛋白酶位点;核苷酸373-507,几丁质结合结构域;核苷酸544-567,PreScission蛋白酶位点;核苷酸577-654,2x胡萝卜素结合肽和接头(通过下划线显示编码每个胡萝卜素肽的核苷酸);和核苷酸655-678, FLAG表位。(H)载体具有以下兀件核苷酸1-1164,麦芽糖结合蛋白和肠激酶位点;核苷酸1189-1252,2x胡萝卜素结合肽和接头(通过下划线显示编码每个胡萝卜素肽的核苷酸);和核苷酸1261-1284,FLAG表位。(I)载体具有以下元件核苷酸1-1164,麦芽糖结合蛋白和肠激酶位点;核苷酸1198-1332,几丁质结合结构域;核苷酸1369-1392,PreScission蛋白酶位点;核苷酸1408-1470,2x胡萝卜素结合肽和接头(通过下划线显示编码每个胡萝卜素肽的核苷酸);和核苷酸1480-1503,FLAG表位。详述 定义
当关于多肽时使用的术语“分离的”(如在“分离的蛋白”或“分离的多肽”中),指经鉴定并与通常在其来源中与其缔合的至少一种污染物分离的多肽。因此,分离的多肽(I)不与自然存在的蛋白缔合,(2)不含同一来源的其它蛋白,(3)由来自不同物种的细胞表达,或(4)在自然界不存在。因此,分离的多肽以不同于自然界发现的形式或设置存在。相反,发现非-分离的多肽(例如蛋白质和酶)呈其天然存在的状态。术语“分离的多肽”、“分离的肽”或“分离的蛋白”包括由cDNA或重组RNA (包括合成来源的)或其一些组合编码的 多肽、肽或蛋白。术语“基因”指包含编码序列和任选为自DNA序列产生多肽所需的调控序列的DNA序列。本文所用术语“野生型”指具有自天然存在来源分离出的基因或基因产物特征的基因或基因产物。野生型基因是在群体中最常观察到的基因,因此被随意地命名为基因的野生型形式。相反,术语“突变体”指当与野生型的基因或基因产物比较时,在序列和/或功能性质上展现更改(即改变的特征)的基因或基因产物。要注意的是可分离出天然存在的突变体;通过与野生型的基因或基因产物比较时其业已改变特征这一事实来鉴定它们。术语“重组DNA分子”意即包含至少两个在自然界通常不会一起发现的核苷酸序列的杂合DNA序列。关于可将DNA片段插入或克隆至其中的核酸分子使用术语“载体”,可使用载体将DNA区段转入细胞并能够在细胞内复制。载体可来源于质粒、噬菌体、病毒、粘粒等等。本文所用术语“重组载体”、“表达载体”或“构建体”,指含有所期望的编码序列和为在特定宿主生物中表达有效连接的编码序列所需的合适DNA或RNA序列的DNA或RNA序列。原核表达载体包括启动子、核糖体结合位点、用于在宿主细胞中自主复制的复制起点和可能的其它序列,例如任选的操纵子序列、任选的限制酶位点。将启动子定义为指导RNA聚合酶结合DNA并启动RNA合成的DNA序列。真核表达载体包括启动子、任选的聚腺苷酸化信号和任选的增强子序列。具有“编码肽、蛋白质或多肽”的核苷酸序列的多核苷酸,意即包含肽、蛋白质或多肽的编码区的核酸序列。编码区可能以cDNA、基因组DNA或RNA形式存在。当以DNA形式存在时,寡核苷酸可为单链(即有义链)或双链。如果为允许恰当地启动转录和/或正确加工最初的RNA转录物所需,可将诸如增强子/启动子、剪接点、聚腺苷酸化信号等合适的控制元件放置在接近基因编码区。或者,在本发明表达载体中使用的编码区可含有内源性增强子/启动子、剪接点、间插序列、聚腺苷酸化信号等。在更多实施方案中,编码区可含有内源性和外源性两种控制元件的组合。术语“转录调控元件”或“转录调控序列”,指控制核酸序列表达的一些方面的遗传元件或序列。例如,启动子是促进有效连接的编码区转录起始的调控元件。其它调控元件包括但不限于转录因子结合位点、剪接信号、聚腺苷酸化信号、终止信号和增强子元件,包括增加或降低连接序列转录的元件(例如在反式作用元件的存在下)。启动子和增强子由与转录中参与的细胞内蛋白质特异性相互作用的DNA序列的短阵列组成。启动子和增强子元件已从包括酵母、昆虫和哺乳动物细胞基因在内的多种真核来源分离出。启动子和增强子元件也已自病毒分离出,类似的控制元件例如启动子亦在原核生物中发现。特定启动子和增强子的选择取决于用来表达目的蛋白的细胞类型。增强子/启动子可能是“内源的”、“外源的”或“异源的”。“内源的”增强子/启动子与基因组中特定基因天然相连。“外源的”或“异源的”增强子/启动子借助基因操控(即分子生物学技术)与基因并列放置,以便所述基因的转录受相连的增强子/启动子指导。表达载体上存在的“剪接信号”通常导致在真核宿主细胞中较高水平表达重组转录物。剪接信号介导自初始RNA转录物中去除内含子,由剪接供体和受体位点组成。通常使用的剪接供体和受体位点是来自SV40的16S RNA的剪接点。真核细胞中重组DNA序列的有效表达需要指导所得到的转录物有效终止和聚腺 苷酸化的信号表达。转录终止信号通常发现在聚腺苷酸化信号下游,长为几百个核苷酸。本文所用术语“聚㈧位点”或“聚㈧序列”,表示指导新生RNA转录物终止和聚腺苷酸化的DNA序列。期需重组转录物的有效聚腺苷酸化,因为缺少聚(A)尾巴的转录物不稳定并快速降解。表达载体中使用的聚(A)信号可为“异源的”或“内源的”。内源的聚(A)信号在基因组中特定基因编码区的3’末端天然发现。异源的聚(A)信号从一个基因中分离出来并放到另一个基因的3’端。术语“表达系统”指用于测定(例如检测)目的基因表达的任何测定或系统。分子生物学领域的技术人员应明白可使用多种多样的表达系统。本文所用术语“重组蛋白”或“重组多肽”,指自重组DNA分子表达的蛋白质分子。相反,本文所用术语“天然蛋白”表明自天然存在(即非重组)来源分离的蛋白质。可将分子生物学技术用于产生与天然蛋白质形式比较具相同特征的重组蛋白质形式。本文所用术语“细胞”、“细胞系”、“宿主细胞”可互换使用,所有这些名称包括它们的后代或可能的后代。“转化细胞”意即该细胞(或该细胞的祖先)中导入了本发明的核酸分子。任选可将本发明的核酸分子导入合适的细胞系,以创造能够产生由所述核酸分子编码的蛋白或多肽的稳定转染的细胞系。用于构建所述细胞系的载体、细胞和方法在本领域众所周知。措辞“转化体”或“转化细胞”包括来源于最初转化细胞的原代转化细胞,而不考虑传代次数。由于有意或无意突变,所有后代的DNA含量可能不会完全相同。但是,转化体定义中包括具有相同的功能的突变体后代,其如在初始转化细胞中所筛选。本文所用术语“有效连接”指核酸序列的连接方式使得产生能够指导特定基因转录和/或期需的蛋白质分子合成的核酸分子。该术语同样指编码氨基酸的序列的连接方式使得产生有功能的(例如酶活性、能够结合结合配体、能够抑制等)蛋白或多肽或其前体,例如蛋白或多肽的前体-或前体原-形式。肽“接头”可含2个或更多个氨基酸残基,例如多达50个氨基酸残基,或2-50之间的任何整数,接头序列可包括蛋白酶识别位点。肽接头基本上不改变相邻(连接的)结合肽的结合特性。例示件实施方案
图6-9中显示的肽序列是多种多样的,它们一些结合胡萝卜素,一些结合染料木黄酮,一些结合金属。胡萝卜素结合肽可用于以下除去食品工业生产液流中的胡萝卜素和结构相似的分子,著名的例证是棕榈油工业生产液流,其往往比其它植物油具有更高的胡萝卜素含量;以及纯化胡萝卜素。染料木黄酮是通常从大豆加工生产液流中分离的异黄酮,其作为天然营养品使用,例如用于治疗更年期症状。因此,染料木黄酮结合肽用于例如从大豆中分离染料木黄酮和结构相似的异黄酮。镍是所有农产品中存在的常见的金属,但在当将农产品例如玉米大量加工成食品时,其在工业环境所用的水流中以高于天然水平富集。本文公开的镍结合肽可用于除去所述水流中的镍(或其它金属)。通过使融合蛋白与含镍树脂结合,这些肽同样可用于纯化微生物中表达的融合蛋白。尽管以上三种靶标的结构不同,肽的用途不同,但本文所述的每种肽都通过通用方法鉴定,可将其用于鉴定结合有工业意义的独特小分子的其它肽。本文所用“有工业意义的小分子”,意即非肽、非核酸分子或原子或离子,其通常具有IOOODa或更低分子量,通过用于生产产品的工业生产液流产生,或可自其提取。通用方法是选择目的靶标,例如有工业意义的小分子;获得肽展示文库,例如在M13噬菌体颗粒表面上展示随机肽序列的噬菌体展示文库;筛选或淘选所述文库来鉴定结·合所述目的靶标的噬菌体颗粒群;扩增和分离结合的颗粒的克隆;然后测定编码肽文库的噬菌体DNA的序列以确定结合目的靶标的肽序列。任选可通过许多适用于靶标和感兴趣目的的性能标准来进一步表征肽。不同的淘选方法适合于不同的靶标分子。在本发明实施例中,淘选的通用方法是将靶标分子固定在基质上;使固定的靶标与噬菌体文库接触;洗去未结合的噬菌体颗粒;用去污剂或其它蛋白变性剂洗脱结合的颗粒;通过感染宿主细菌来扩增颗粒以得到所选择的群体;和对所选择的群体重复一次或多次同样的淘选过程,如果期需选择更强的结合肽,任选在随后的淘选中使用更加严格的条件。在典型的实践例如鉴定金属结合肽的实践中,使用四轮淘选。最终自淘选群选择单独的噬斑或克隆,并测定噬菌体DNA的序列。一旦完成DNA测序,可将肽结合结构域表达为融合蛋白,选择所述融合蛋白以具有适合计划用途或适合进一步表征靶标结合特性的一种或多种特性。在本发明案例中,使结合结构域与结合不同配体的多肽融合是有用的,如此可将靶标结合结构域固定在与结合融合多肽的配体相连的基质上。本领域中已知有多种配体-多肽结合对可用于制作所述融合蛋白而不改变配体结合特性。链霉亲和素因其紧密结合生物素而可能是最常使用的,然而,为了最佳结合链霉亲和素需要形成四聚体。在一个实施例中,因为其结合谷胱甘肽的能力及在胞质溶胶中的高溶解性,并考虑到其在细胞中的高表达,选择谷胱甘肽S-转移酶(GST)作为另外一种常见融合蛋白。在下文更详细阐述的另一实施例中,因其相对小的大小(45个残基)并易于将几丁质固定于基质,将来自于环状芽孢杆菌(Bacillus circulans)的几丁质酶Al的几丁质结合结构域(CBD)用于制备融合蛋白。本领域已知用来制作融合体例如GST或CBD融合体的试剂盒及融合体结合的柱。噬菌体文库和淘选在爱荷华州立大学生物化学、生物物理、分子生物学系的Rao博士实验室中,构建了具约I XlO9种随机21-氨基酸肽文库的噬菌体文库。如厂商所述将镇固定在 NTA-Sepharose (IMAC Sepharose, GE-Health Care)上。用 I. OmL 憐酸缓冲盐水(PBS)+2. 0%牛血清白蛋白(BSA)在室温封闭置于I. 5mL的聚丙烯微量离心管中的20 μ Ni-NTA-Sepharose达3小时,以减少非特异结合。然后使该基质与含21个氨基酸的线性噬菌体pill肽文库在PBS (+ 0.2% BSA + O. 05% Tween 20)中于室温孵育3小时。阴性对照为不装填镍的NTA-琼脂糖。典型的噬菌体淘选包括3个步骤一结合、洗涤和扩增。在靶标与文库孵育后,通过用含有0-0. 15% Tween 20的PBS洗涤来除去未结合的噬菌体,用100mM HCl洗脱结合的噬菌体。洗脱出的噬菌体立即用I M Tris/HCl pH 8.0中和。完全中和的噬菌体用来感染宿主大肠杆菌(£ coli)菌株XLl-Blue。扩增的噬菌体用于下一轮噬菌体淘选。噬菌体淘选重复4次后,挑选出多个克隆以产生噬菌体颗粒来通过ELISA的方法检测特异性结合物。特别地,将噬菌体与固定的靶标孵育,通过抗-M13噬菌体抗体HRP缀合物来检测结合的噬菌体。然后测定相应的噬菌粒的序列来鉴定肽序列的性质。表I显示来自第4轮筛选的例示性序列。表I
权利要求
1.一种分离的多肽或分离的肽,其包含具有下式核心序列的金属结合肽H-X-H-(Z,)-H-(Z")-H (SEQ ID NO: 116) 其中 H为组氨酸; X为选自以下的单个氨基酸天冬酰胺、酪氨酸、赖氨酸、精氨酸、缬氨酸、苯丙氨酸、丙氨酸、甘氨酸、苏氨酸和异亮氨酸; Z’为I或2个氨基酸,其中至少一个选自亮氨酸、甲硫氨酸、谷氨酰胺、精氨酸、缬氨酸、苯丙氨酸、丙氨酸、甘氨酸、异亮氨酸、苏氨酸、色氨酸、酪氨酸或组氨酸; Z"为1-4个氨基酸,其中至少一个选自精氨酸、缬氨酸、苯丙氨酸、丙氨酸、甘氨酸、异亮氨酸、苏氨酸、色氨酸或组氨酸; 前提为不多于5个组氨酸残基出现在SEQ ID NO: 116中; 其中所述肽以至少9. O X 10—11 M或更小的解离常数结合金属。
2.权利要求I的分离的多肽或肽,其中Z"不含有谷氨酰胺。
3.权利要求I或2的分离的多肽或肽,其中至少一个脯氨酸、酪氨酸或色氨酸在所述核心序列的1-5个残基里面。
4.权利要求1-3中任一项的分离的多肽或肽,其中在所述核心序列的1-5个残基里面存在不多于两者的以下残基天冬氨酸、谷氨酸、天冬氨酸和谷氨酸二者、赖氨酸、精氨酸或者赖氨酸和精氨酸二者。
5.一种分离的多肽或分离的肽,其包含具有下式核心序列的金属结合肽 H-X-H-X-H-X-H (SEQ ID NO: 117) 其中H为组氨酸,每个X独立为选自以下的任何单个氨基酸精氨酸、缬氨酸、苯丙氨酸、丙氨酸、甘氨酸、苏氨酸和异亮氨酸;和 所述肽以至少2. O X 10_12 M或更小的解离常数结合金属。
6.一种分离的多肽或分离的肽,其包含具有下式核心序列的金属结合肽Z-H-H-H (SEQ ID NO: 118) 其中H为组氨酸,Z为3-5个氨基酸的序列,至少I个选自精氨酸、苯丙氨酸、脯氨酸、丙氨酸、甘氨酸和组氨酸,前提为不多于5个组氨酸残基出现在包括所述核心序列的20个氨基酸的较大肽序列中;和 所述肽以至少2. O X 10_12 M或更小的解离常数结合金属。
7.权利要求I到6中任一项的分离的多肽或肽,其中所述肽结合选自镍、锌和铜的金属,并以1.0 X 10—11或更小的解离常数结合至少一种所选金属。
8.权利要求1-7中任一项的分离的多肽或肽,其中包括所述核心序列的12个氨基酸的序列具有-O. 215到-2. 215之间的亲水性测量值。
9.一种分离的多肽或分离的肽,其包含含有下式序列的类胡萝卜素结合肽 X1X2GffX3HyX4X5X6 (SEQ ID NO: 120) 其中Hy为芳香族氨基酸A1为丙氨酸、缬氨酸、亮氨酸、谷氨酰胺、色氨酸、酪氨酸、丝氨酸、脯氨酸、苏氨酸或异亮氨酸;X2为丙氨酸、甘氨酸、异亮氨酸或缬氨酸;X3为色氨酸、甲硫氨酸、甘氨酸、脯氨酸、亮氨酸或丝氨酸;X4为色氨酸、苯丙氨酸、甲硫氨酸、甘氨酸、苏氨酸或组氨酸;X5为甘氨酸、色氨酸、丝氨酸、苯丙氨酸、亮氨酸、谷氨酰胺或丙氨酸;χ6为苏氨酸、甘氨酸、色氨酸、丙氨酸、甲硫氨酸、天冬酰胺或缬氨酸。
10.权利要求9的分离的多肽或肽,其中X2为丙氨酸。
11.权利要求9或10的分离的多肽或肽,其中Hy为色氨酸。
12.权利要求9-11中任一项的分离的多肽或肽,其中X4为色氨酸。
13.一种分离的多肽或肽,其包含含有下述序列的类胡萝卜素结合肽X1WX2Hy (SEQ ID NO: 121) 其中Hy为芳香族氨基酸;X2为任何氨基酸A1为选自甘氨酸、脯氨酸或亮氨酸的单个氨基酸。
14.权利要求13的分离的多肽或肽,其中X1为甘氨酸。
15.一种分离的肽或多肽,其包含含有下式的结合染料木黄酮的肽结构域L-X-L 或 L-X-X-X-L (SEQ ID NO :122) 其中L为亮氨酸,每个X独立为甘氨酸、组氨酸、苯丙氨酸、丝氨酸、赖氨酸、天冬氨酸、谷氨酸或丙氨酸。
16.权利要求15的分离的肽或多肽,其包含染料木黄酮结合结构域 SLGLffHSQRHFDVHREHSRHQT (SEQ ID NO: 123)。
17.一种融合蛋白,其包含与超过12个氨基酸的多肽序列融合的权利要求1-16中任一项的金属结合肽、类胡萝卜素结合肽或染料木黄酮结合肽。
18.权利要求17的融合蛋白,其中所述多肽序列进一步含有配体结合结构域,所述配体结合结构域结合不是金属、类胡萝卜素或染料木黄酮的配体。
19.权利要求18的融合蛋白,其中所述配体结合结构域结合谷胱甘肽。
20.权利要求17的融合蛋白,其中所述多肽序列为丝蛋白。
21.权利要求17的融合蛋白,其中所述融合蛋白在第一溶剂混合物中可溶,但在第二溶剂混合物中不可溶,所述第一溶剂混合物包含用于金属结合结构域的金属。
22.一种表达盒,其包含编码至少6个氨基酸长的N个相同肽结构域的串联重复的核酸序列,其中N为至少5,不多于两个相同肽被同一核酸序列编码。
23.权利要求22的盒,其中在编码相同结合结构域的任何两个序列之间没有9个连续核苷酸的序列是相同的。
24.权利要求22的盒,其中通过比较,与编码相同结构域的彼此相距较近的任何两个序列相比,编码同一个相同肽结构域的彼此相距较远的两个序列之间的同一性较低。
25.—种具有权利要求17-21中任一项的融合蛋白的支持体。
26.—种检测样品中小于1600 Da的靶标分子的存在情况的方法,所述方法包括 在基质上固定具有13个或更少氨基酸的结合结构域的肽,所述肽以至少10_9 M或更小的解离常数结合所述靶标分子; 使所述固定化肽与所述样品接触; 洗涤所述基质以除去未结合的材料;和 检测所述靶标分子是否与所述肽结合。
27.权利要求26的方法,其中通过表面等离振子共振检测仪检测所述结合。
28.权利要求26的方法,其中用荧光检测仪检测所述结合。
29.权利要求26的方法,其中用放射性同位素检测仪检测所述结合。
30.权利要求26的方法,其中用分光光度计检测所述结合。
31.权利要求26-30中任一项的方法,其中所述结合结构域在较大融合蛋白中包含至少一个结构域。
32.权利要求30的方法,其中所述融合蛋白由多个结合结构域组成。
33.权利要求26-32中任一项的方法,其中所述祀标分子选自金属、类胡萝卜素和异黄酮。
34.一种包含固定化肽的传感装置,所述固定化肽具有13个或更少氨基酸的结合结构域,其以至少10_9 M或更小的解离常数结合所选择的靶标分子。
35.权利要求34的装置,其中所述靶标分子选自金属、类胡萝卜素和异黄酮。
36.权利要求35的装置,其中所述肽1)具有下式核心序列 H-X-H-(Z,)-H-(Z")-H (SEQ ID NO: 116) 其中 H为组氨酸; X为选自以下的单个氨基酸天冬酰胺、酪氨酸、赖氨酸、精氨酸、缬氨酸、苯丙氨酸、丙氨酸、甘氨酸、苏氨酸和异亮氨酸; Z’为I或2个氨基酸,其中至少I个选自亮氨酸、甲硫氨酸、谷氨酰胺、精氨酸、缬氨酸、苯丙氨酸、丙氨酸、甘氨酸、异亮氨酸、苏氨酸、色氨酸、酪氨酸或组氨酸; Z"为1-4个氨基酸,其中至少一个选自精氨酸、缬氨酸、苯丙氨酸、丙氨酸、甘氨酸、异亮氨酸、苏氨酸、色氨酸或组氨酸; )具有下式核心序列Z-H-H-H(SEQ ID NO: 118) 其中H为组氨酸,Z为3-5个氨基酸的序列,至少I个选自精氨酸、苯丙氨酸、脯氨酸、丙氨酸、甘氨酸和组氨酸,前提为不多于5个组氨酸残基出现在包括所述核心序列的20个氨基酸的较大肽序列里; iii)具有下式序列 X1X2GffX3HyX4X5X6(SEQ ID NO: 120) 其中Hy为芳香族氨基酸A1为丙氨酸、缬氨酸、亮氨酸、谷氨酰胺、色氨酸、酪氨酸、丝氨酸、脯氨酸、苏氨酸或异亮氨酸;X2为丙氨酸、甘氨酸、异亮氨酸或缬氨酸;X3为色氨酸、甲硫氨酸、甘氨酸、脯氨酸、亮氨酸或丝氨酸;X4为色氨酸、苯丙氨酸、甲硫氨酸、甘氨酸、苏氨酸或组氨酸;X5为甘氨酸、色氨酸、丝氨酸、苯丙氨酸、亮氨酸、谷氨酰胺或丙氨酸;χ6为苏氨酸、甘氨酸、色氨酸、丙氨酸、甲硫氨酸、天冬酰胺或缬氨酸;或者 iv)具有含下式的序列L-X-L 或 L-X-X-X-L(SEQ ID NO :122) 其中L为亮氨酸,每个X独立为甘氨酸、组氨酸、苯丙氨酸、丝氨酸、赖氨酸、天冬氨酸、谷氨酸或丙氨酸。
37.一种分离对映体的方法,所述方法包括 提供怀疑具有化合物的外消旋混合物的样品; 提供具有固定在其上的肽的基质,所述肽具有13个或更少氨基酸的结合结构域,其优先以至少Kr9 M或更小的解离常数结合所述化合物的对映体之一;使所述样品与所述基质接触;和 洗涤所述基质以除去包括对映体之一的未结合材料。
38.权利要求37的方法,所述方法进一步包括从所述基质洗脱所述结合的对映体。
39.一种从样品中分离靶标分子的方法,所述方法包括 获得在生物颗粒表面上展示的包含多个肽结构域的肽文库; 通过使所述肽文库与所述靶标分子接触来筛选所述肽文库以鉴定结合所述靶标分子的肽,选择展示结合所述靶标分子的结合肽的生物颗粒,并确定编码所述结合肽的核酸序 列; 获得编码融合蛋白的重组核酸序列,所述融合蛋白具有含至少一个结合肽的靶标结合结构域和分离结构域,所述分离结构域包含可用于分离所述融合蛋白的氨基酸残基,所述分离融合蛋白通过与配体结合、与基质交联及从溶液中絮凝中的至少一种来实现; 分离所述融合蛋白; 使所述融合蛋白与含有所述靶标分子的样品接触,以便使所述靶标分子与所述靶标结构域结合;和 用分离结构域分离与所述靶标分子结合的融合蛋白,藉此分离所述靶标分子。
40.权利要求39的方法,其中所述分离结构域结合选自CBD、MBD和GST的配体。
41.权利要求39或40的方法,其中通过固定在包含所述配体的基质上来分离所述融合蛋白。
42.权利要求39-41中任一项的方法,其中所述分离结构域具有可与所述基质交联的氨基酸残基,所述分离融合蛋白包括使所述分离结构域与所述基质交联,然后使所述融合蛋白与含有所述靶标分子的样品接触。
43.权利要求39-42中任一项的方法,其中所述分离结构域包含絮凝结构域,分离所述融合蛋白包括在与含有所述靶标分子的样品接触后使所述融合蛋白絮凝,和分离所述絮凝的融合蛋白。
44.权利要求39-43中任一项的方法,其中所述融合蛋白由多个结合结构域组成。
45.权利要求39-44中任一项的方法,其中所述祀标分子选自金属、类胡萝卜素和异黄酮。
46.一种从样品中分离靶标分子的方法,所述方法包括 提供具有靶标结合结构域和分离结构域的融合蛋白,所述靶标结合结构域包含至少一个靶标分子结合肽,所述分离结构域包含可用于分离所述融合蛋白的氨基酸残基,所述分离融合蛋白通过与配体结合、与基质交联及从溶液中絮凝中的至少一种来实现; 使所述融合蛋白与怀疑含有所述靶标分子的样品接触,以便使所述靶标分子与所述靶标结构域结合;和 用所述分离结构域分离与所述靶标分子结合的融合蛋白,藉此分离所述靶标分子。
全文摘要
本文阐述结合有工业意义的小靶标分子的小肽结构域和共有序列,所述有工业意义的小靶标分子例如金属例如镍、β胡萝卜素和异黄酮例如染料木黄酮。同样阐述含有所述结合结构域的融合蛋白,所述结合结构域与蛋白质或与肽结构域例如GST或CBD融合,所述蛋白质或肽结构域结合其它配体,可用于将所述靶标结合结构域固定在支持体上。可用于工业环境的融合蛋白中的一类是含有靶标结合结构域串联体的融合体,所述融合体增加每分子的结合当量。
文档编号C07K17/02GK102947324SQ201180016922
公开日2013年2月27日 申请日期2011年1月28日 优先权日2010年1月29日
发明者T.P.宾德, A.G.劳, 山本康文, P.汉克 申请人:阿切尔丹尼尔斯密德兰公司, 衣阿华州立大学研究基金公司