专利名称:使用拉曼光谱法获取生物样品的蛋白质图谱的方法
技术领域:
本发明一般涉及用于鉴定样品中分析物的存在的方法和设备,更具体而言,本发明涉及使用拉曼光谱法获取复杂生物样品的蛋白质或肽图谱(profile)的方法和设备。
背景技术:
基因组水平DNA测序的巨大成功使得我们可以开始获得在25年前不可想象的的知识。为了使这些具有分水岭意义的数据能够转化为对诊断人类疾病、确定人类疾病病期(staging)、了解和治疗人类疾病有帮助的知识,要求我们不仅应当知道据估计>30,000的人类蛋白质的序列,而且要求我们鉴定出预示疾病的即将发作的蛋白质表达中的关键变化。我们也需要在分子水平精确地划分疾病亚型,并了解在疾病过程中密切涉及的蛋白质的功能、相互作用以及如何调节它们的活性。一种了解蛋白质功能的最基本方法是将表达水平变化作为生长条件、细胞周期阶段、疾病状态、外部刺激、其它蛋白质的表达水平或其它变量的函数而建立起联系。尽管DNA微阵列分析为基因组范围的(genome-wide)mRNA表达分析提供了强有力的平行方法,然而mRNA的体内浓度与其编码的蛋白质之间常常没有直接的关系。mRNA翻译为蛋白质的差异速率和蛋白质体内降解的差异速率是限制由mRNA外推到蛋白质表达图谱的两个因素。
另外,这样的微阵列分析不能检测、鉴定或量化翻译后蛋白质修饰——其经常在调节蛋白质功能上起着关键的作用。蛋白质表达分析提供了潜在巨大的优势,因为它测量生物效应物蛋白质分子的水平,而不仅仅是其信息的水平。目前,没有一种蛋白质作图(profiling)技术能够接近微阵列分析的能力,同时描绘25,000或更多基因的mRNA表达的相对水平。
因此,对各种生物样品中的低浓度分析物的检测和分析正在给以不断增长的关注。对这样的分析物的定性分析一般限于较高的浓度水平,而定量分析通常要求用放射性同位素或荧光剂进行标记。此类方法一般耗时而且不方便。例如各种模式的质谱法被广泛用于蛋白质作图(参见图1)。
另外,近来由于它们在化学、生物和药物研究以及疾病诊断学中日益增长的应用,固态传感器,特别是生物传感器已经得到相当多的关注。一般而言,生物传感器由两个元件组成高度特异性的识别元件和将分子识别事件转化为可定量信号的转换结构。生物传感器已经被发展为检测多种生物分子复合物,包括寡核苷酸对、抗体-抗原、激素-受体、酶-底物和凝集素-糖蛋白相互作用。一般用电化学、场效应晶体管、光学吸收、荧光或干涉测量设备完成信号转换。
拉曼光谱法或表面等离子共振(surface plasmon resonance)也已经被用于寻求达到灵敏及准确地检测或鉴定来自生物样品的单独分子的目标。当光经过感兴趣的介质时,一定量的光在被称为散射的现象中从其最初的方向发生转向。一些散射光也与最初的激发光的频率不同,原因在于光被吸收和电子被激发到较高的能态,随之在不同波长下产生光发射。吸收光的能量和发射光的能量的差异与介质的振动能匹配。这种现象被称为拉曼散射,用拉曼散射光表征并分析感兴趣的介质或分子的方法被称为拉曼光谱法。拉曼发射光谱的波长是样品中的拉曼散射分子的化学组成和结构的表征,而拉曼散射光的强度取决于样品中的分子的浓度。
拉曼光谱类似于红外光谱,是由波长分布带组成的,其对应于被分析的样品(分析物)的特定的分子振动。在拉曼光谱法的实践中,来自一般为激光的光源的光束聚焦在样品上,从而产生了非弹性散射辐射,其被光学收集并被导入波长色散光谱仪中,在其中检测器将碰撞光子的能量转化为电信号强度。
在历史上,入射辐射向非弹性散射辐射的非常低的转化率限制了拉曼光谱法应用于通过红外光谱法难于进行的应用上,例如分析水溶液。然而,已经发现,当非常靠近粗糙银电极的分子接受拉曼激发源作用时,所产生的信号的强度增加了多至6个数量级。
尽管造成该散射效率出现很大增加的机理目前是相当多的研究的主题,但普遍认为如果满足下面三个条件,则该现象发生(1)金属的自由电子吸收可以被250与2500纳米(nm)之间的波长的光激发,优选以激光束的形式激发;(2)所使用的金属尺寸合适(一般为5至1000nm的直径的粒子,或者具有等价形态学的表面),并且具有产生表面等离子体场必需的光学性质;和(3)分析物分子具有有效匹配的光学性质(吸收),以偶联到等离子体场。
具体而言,金、银、铜和某些其它金属的纳米颗粒可以起着增强电磁辐射的局部效应(localized effect)的作用。位于此类颗粒附近的分子对拉曼光谱分析表现出大得多的灵敏度。SERS是利用这种表面增强拉曼散射效应来表征和分析感兴趣的生物分子的技术。
在引入感兴趣的分子之前或之后,当氯化钠和氯化锂被应用于金属纳米颗粒或金属涂敷表面时,它们已被鉴定为可增强SERS信号的化学品。然而,使用这些化学增强剂的技术并没有证明对于可靠检测低浓度分析物分子例如单个核苷酸或蛋白质是足够灵敏的。在单分子水平,仅检测了一种类型的核苷酸,脱氧腺苷单磷酸,和仅仅一种类型的蛋白质,血红蛋白。结果,SERS不被认为是适合分析复杂生物样品例如血浆的蛋白质内容物(protein content)。
因此,在本领域,对使用拉曼光谱分析技术,分析复杂生物样品例如血清的蛋白质组成的方法存在需求,该方法可提供更多关于蛋白质的特征的信息,并且对可靠地检测和/或鉴定单独的蛋白质存在需求。另外,在本领域,对定性和定量检测在复杂样品中低浓度水平的蛋白质的高通量方法存在需求。
图1是框图,显示了在用于提供复杂生物样品的蛋白质图谱的质谱分析中所使用的一般过程。
图2是框图,显示了在使用SERS光谱提供复杂生物样品的蛋白质图谱的本发明方法中所使用的一般过程。
图3显示了使用电喷雾(electro-spray)的本发明方法中的样品沉积装置。蛋白质片段经HPLC分离,离子化,并沉积到衬底上,该衬底由位于平面上的经绝缘体隔离的金属岛(metal islands)组成。穿过聚焦管(focusing tube)之后离子化分子被集中在金属岛上。聚焦管的内表面具有与离子化粒子相同的电荷,并且聚焦管的收集孔比沉积孔大。
图4显示了使用湿式电喷雾的本发明方法中的另一种样品沉积装置。在亲水溶剂中的分离的蛋白质被电喷雾为离子,并被吸附或共价连接到修饰或未修饰的衬底岛(substrate island),衬底岛在用于固定化的平面上通过掩模(mask)或屏蔽物(screen)隔离。
图5是对从小牛血清肽链的多个级分获得的SERS信号的编辑(compilation),所述肽链已经通过高压液相层析(HPLC)被分离。
图6是框图,显示了分析由血样的拉曼光谱所获得的蛋白质作图结果的本发明方法。各样品的结果被并入蛋白质文库中,该蛋白质文库又被用于进一步分析(例如诊断)由各受试样品获得的拉曼图谱结果。
图7是SERS光谱图,显示了从表1的标准肽收集的SERS光谱,未使用拉曼标签。
图8显示了在图7的拉曼光谱上进行的主成分分析(PCA)的结果。
图9A和9B是分别由未使用拉曼标签的BSA和小牛血清获得的SERS光谱图。
图10是SERS光谱图,显示了由未使用拉曼标记的小牛血清浓缩HPLC分离级分获得的SERS光谱。
图11A是HPLC分离的胰蛋白酶消化的小牛血清级分的色谱图。
图11B是其HPLC色谱图显示在图11A中的胰蛋白酶消化的小牛血清级分的紫外吸收(215nm)图。
图11C是其HPLC色谱图显示在图11A中的胰蛋白酶消化的小牛血清级分的SERS光谱图。
发明详述 本发明各种实施方案涉及使用拉曼光谱法以获得并分析复杂生物样品的蛋白质图谱的方法。下面详细的描述含有很多具体细节,目的是对本发明的公开实施方案提供更详尽的理解。然而,所述实施方案在没有这些具体细节的情况下可以被实践,这对本领域技术人员而言将是显而易见的。在其它情况下,在本领域内熟知的设备、方法、程序以及各个组分在此未予以详细的描述。
本发明提供了用于分析生物样品的蛋白质内容物的方法,通过如下步骤基于蛋白质的化学和/或物理性质,分离样品中的蛋白质和蛋白片段,以及在固体衬底上或在流动的流体流内的不连续位置上,维持分离的蛋白质处于分离的状态。然后检测由不连续位置上的分离的蛋白质产生的拉曼光谱,其中来自不连续位置的光谱提供了关于在不连续位置上的一种或多种具体蛋白质的结构的信息。
在另一个实施方案中,本发明提供了用于分析蛋白质的复杂混合物中的蛋白质组成的试剂盒,这样的试剂盒包括衬底(substrate),其具有众多不连续的位置,所述位置被涂覆有带正电或带负电的化合物,或者涂覆有中性或疏水聚合物,以便将蛋白质和蛋白质片段固定在所述不连续位置上;和容器(container),其含有银、金、铜或铝的离子。
在又一个实施方案中,本发明提供了用于分析蛋白质的复杂混合物的蛋白质组成的系统。本发明系统包括如衬底这样的组件,所述衬底具有众多不连续的位置,所述位置具有选自金属层、带正电或带负电化合物、或者中性或疏水聚合物的涂层,用于固定蛋白质和蛋白质片段。本发明系统进一步包括含有至少一种含蛋白化合物的样品、拉曼光谱仪和包括用于分析样品的算法的计算机。
下面的段落讨论了各个概念和词语。其对了解本发明的各种实施方案是有帮助的。
如此处所用的词语“复杂生物样品(complex biological sample)”意指含有数百个含蛋白分析物的样品,例如来自宿主的体液。样品可以被直接检验,或者可以进行预处理,以使样品中的含蛋白分子变性或成为碎片,以使它们更易于检测。此外,通过检测感兴趣分析物的证明试剂,例如与感兴趣分析物互补的特异结合对成员——只有当感兴趣的分析物存在于样品中时才可检测到其存在,可以测定感兴趣的分析物。因此,分析物的证明试剂成为在检验分析中被检测的分析物。体液可以是例如尿、血液、血浆、血清、唾液、精液、粪便、痰、脑脊髓液、眼泪、粘液以及类似物。
如此处所用,词语“蛋白(protein)”包括肽、多肽和蛋白质以及这样的含蛋白分析物,例如抗原、糖蛋白、脂蛋白以及类似物。
在本发明的一个实施方案中,提供了用于从复杂生物混合物例如患者样品获取蛋白质组成信息的方法。将生物样品中的蛋白质溶解在水溶液或亲水溶剂中。可选地,使用选自还原剂、表面活性剂、离液盐以及类似物的试剂,可以使样品中的蛋白质变性。可以被用于还原二硫键的常用化学品包括而不限于DTT、DTE、2-巯基乙醇以及类似物。可以被用于使蛋白质变性的代表性表面活性剂包括而不限于十二烷基硫酸钠(SDS)、十二烷基硫酸锂(LDS)、Triton X 100、Tween-20以及类似物。可以被用于使蛋白质变性的典型的离液盐包括但不限于GuSCN、NaSCN、GuClO4、NaClO4和脲。蛋白质片段化是使蛋白质变性的另一种途径,可以使用用于消化蛋白质的化学切割剂(chemical cleavage agent)或丝氨酸蛋白酶例如胰蛋白酶来实现。蛋白质也可以被保持为天然结构(非变性),用于拉曼光谱或SERS分析。
为了增加精确性和分辨率,根据蛋白质或蛋白片段的化学和物理性质,使用大量已知方法中的任何一种,将它们从被分析的样品分离。例如,大小分离是基于物理尺寸或分子量(质量)。电荷分离是基于表面电荷或等电点。亲水性分离是基于蛋白质或片段与疏水介质的相互作用。亲和分离是基于序列结构和构象。蛋白质分离的常用模式是液相层析。蛋白质和肽分离的非限制性方法包括尺寸排阻、反相、离子交换、亲和(使用FPLC、常规层析(regular chromatography)或微流体设备(microfluidic devices))和电泳(例如毛细管电泳或芯片电泳(chip electrophoresis))。可以单独或结合使用这些技术中的任何技术以及本领域中其它已知的技术进行蛋白质分离。
一旦分离,样品中的蛋白质或片段被保持在分隔的状态。在本发明方法的一个实施方案中,通过沉积和固定在固体表面上的不连续的间隔位置上,将分离的蛋白质或片段保持在分隔的状态。样品沉积和固定的方法包括接触写入(contactwriting)、接触点印(contact spotting)、液体喷雾(liquid spraying)、干粒子喷雾(dryparticle spraying)(即电喷雾)以及类似方法。在电喷雾应用中,蛋白质或蛋白片段接受电场作用,从而导致蛋白质或粒子的离子化,帮助引导分析物到达衬底的具体的不连续位置。
纳米电喷雾技术被广泛用于质谱法中,并且纳米电喷雾离子源在本领域中是已知的。这些微型电喷雾源由具有内径为大约1μm的尖端的金属化玻璃毛细管针组成,从所述尖端喷射出分析物溶液。由纳米电喷雾产生的小滴在体积上比常规电喷雾源中的那些小滴小大约100倍,这使得可有效地使用样品而不会因为大液滴而损失材料,来自大液滴的肽不能被离子化。即使通过毛细管针的流速非常低(20-40nl min-1),离子流也被增加。因为非常小量(1-2μl)的含蛋白混合物可以被用于纳米电喷雾质谱法,所以被考虑的是,对纳米喷雾沉积设备的进料流可以从纳米电喷雾质谱仪获得,它被用于分离蛋白质。电喷雾与纳米电喷雾技术以及它们的应用总结在Covey,T.R.and Devan,P.Nanospray Electrospray IonizationDevelopmentLC/MS,CE/MS Application.Practical Spectroscopy Series,Volume 32Applied Electrospray Mass Spectrometry;Pramanik,B.N.;Ganguly,A.K.;Gross,M.L.,Eds.;Marcel DekkerNew York,NY,2002中。
衬底阵列(substrate array)的尺寸将取决于该阵列的最终用途。可以制造含有大约10至数百万不同的不连续的衬底位点的阵列。一般而言,该阵列将包括10或更多至多达十亿或更多这样的位点,这取决于表面的大小。因此,可以制造极高密度、高密度、中等密度、低密度或极低密度阵列。极高密度阵列的一些范围为每阵列大约10,000,000至大约2,000,000,000个位点。高密度阵列在大约100,000至大约10,000,000个位点的范围内。中等密度阵列在大约10,000至大约50,000个位点的范围内。低密度阵列通常是小于10,000个位点。极低密度阵列小于1,000个位点。
所述位点可以构成图案,即规则的图样或构型,或者可以被随机分布。例如,可以使用规则图案的位点,这样,所述位点可以被定址在X-Y坐标平面中。可以修饰衬底的表面,以使分析物可以附着在各个位点上。因此,可以修饰衬底的表面,由此形成不连续的位点。在一个实施方案中,衬底的表面可以被修饰为含有孔,即在衬底的表面上具有凹陷(depression)。这可以使用多种已知技术来完成,包括但不限于光刻、冲压技术(stamping technique)、模压技术(moldingtechniques)和微蚀技术(microetching techniques)。如本领域技术人员将意识到的,所使用的技术取决于衬底的组成和形状。可选择地,衬底的表面可以被修饰为含有化学衍生化的位点,所述位点可以被用于将分析物或探针附着到衬底上的不连续位置。各种形式的化学官能团例如氨基、羧基、桥氧基和硫醇基团的加入可以被用于共价连接含有对应的活性官能团的分子或连接物分子(linker molecules)。
不连续位置的大小一般在大约0.1μm至10mm的范围内,例如1μm至1mm,或5μm至500μm。
图3显示了通过湿式电喷雾100的样品沉积的实例。已经通过HPLC 110分离的蛋白质片段(点划线)通过由电源180提供的电场被离子化,并被沉积到衬底上,所述衬底是由金属岛120组成,金属岛由平表面140上的绝缘体130分离。在经过聚焦管150之后,离子化分子被集中到金属岛上。聚焦管的内表面具有与离子化粒子相同的电荷,并且聚焦管的收集孔160比沉积孔170大。在电喷雾过程中,水分子被除去,这在本领域是已知的。可选地,在衬底例如铝上使用湿式电喷雾沉积,可以在没有变性的情况下,沉积和固定样品,如在Anal.Chem.,2001,736047中所述。在该湿式电喷雾技术中,制造了功能活性蛋白质膜,其保留了蛋白质的天然性质。
在电喷雾设备200中,如在图4中所示,在亲水溶剂210中的蛋白质由毛细管230进行电喷雾,并被吸附或共价连接到通过掩模240形成的用于固定的修饰或未修饰的衬底岛220上。当使用该技术以隔离状态被固定时,功能活性蛋白质往往保留了更多特异/独特的分子特征(molecular signatures),用于扫描分析例如拉曼扫描,原因在于它们的完整的三维构象和在分子间化学键中的完整的空间关系。还可以在固定之前或之后使用浓缩蛋白质或肽的机构(衬底或设备)。
用于直接的分析物接触的材料在此被称为衬底,包括金属,例如金、银、铜和铝,或诸如硅、玻璃和陶瓷的材料。衬底也可以是平的和/或多孔表面,并且为了增加蛋白质与固体衬底的相互作用,衬底可以被涂覆以带正电或带负电化合物,或者涂覆以中性或疏水聚合物。沉积后,可以在衬底上加热或烘烤分离的分析物,充分进一步地使分析物固定在表面上,例如在100℃进行大约2小时。
为了制备SERS活性纳米颗粒,使固定在衬底上的固定蛋白质和/或片段与银胶体颗粒接触,这在本领域中是已知的,并如本文所述,以单独或聚集的形式,在化学增强剂盐(chemical enhancer salts)例如LiCl或NaCl存在下进行。使用拉曼光谱仪收集来自样品区的光谱信号。对于具有高浓度蛋白质的样品而言,可以使用普通拉曼光谱法精确地确定蛋白质的量。记录并关联光谱与样品位置之间的关系。
可选地,来自样品的蛋白质也可以以分离的状态被维持在微流体系统内的液体流中。可选地,在液体中的分离的蛋白质样品可以与另一流体流中的金属胶体流混合,以便在不固定分析物的情况下进行蛋白质片段的SERS检测。在微流体环境中的很多混合策略在文献中是可得的(Stroock et al.,Science 295,647(2002);Johnson et.al.,Anal.Chem.,(2001))。可选地,使用来自Upchurch Scientific Inc.的简易微混合三通(micromixing tee),金属胶体流可以与蛋白质片段样品出口流混合,以用于随后的SERS检测。
使用本领域已知的技术,进行拉曼光谱和/或SERS扫描,以分析固定在衬底的不连续位置上或在流动液体中的蛋白质和/或蛋白片段,并如在此所述,获得关于被分析的样品的蛋白质组成的信息。
数据分析
基于常规的光谱分析,对所收集的样品的光谱图(或分子特征)进行分析,该分析一般包括峰和基线分析、系统噪声、量化、方案误差分析以及类似分析。分析来自特定衬底位置的光谱中的峰位置、线形状和相对峰强度,根据该信息估计不同蛋白质的相对浓度。也可以使用多元统计分析技术例如主成分分析(principalcomponents analysis,PCA)来分析拉曼光谱。例如,来自蛋白质主架例如酰胺基团的光谱特征的强度可以被用于确定在具体衬底位置上的蛋白质的总量。具有不同化学带(chemical bands)的蛋白质将显示不同的可鉴定的光谱特征,并且某些蛋白质的存在可以通过它们的光谱特征进行检测。除了通过这些方法获得的样品蛋白质图谱之外,某些另外的样品信息(例如患者信息、对照鉴定或试验条件)可以与作图信息关联起来。例如,光谱信息可以与这样的信息发生关联,如样品是否来自患有具体疾病或服用具有具体期望结果的具体药物的患者。这样的信息可以由大量的平行样品(足够多以致于在统计学上是有意义的)进行汇编,以便形成针对具体类型样品例如血清的蛋白文库,从而构建医学关联的拉曼信号信息的数据库。另外,可以将来自各样品的图谱与现有蛋白文库进行比较,以确定在文库图谱的规范与患者样品之间的异常或差异。图6是表示该过程的框图。这样的技术对诸如药物开发、临床诊断或生物医学研究这样的目的是有帮助的。
在又一个实施方案中,本发明提供了用于分析蛋白质的复杂混合物中的蛋白质组成的试剂盒,这样的试剂盒包括衬底,其具有众多不连续位置,这些位置涂覆有带正电或负电的化合物,或者中性或疏水聚合物,用于将蛋白质和蛋白片段固定在所述不连续位置上;和容器,其含有银、金、铜或铝的离子。本发明试剂盒可以可选地进一步包括蛋白变性试剂。
在本发明的又一个实施方案中,提供了用于分析蛋白质的复杂混合物中的蛋白质组成的系统,其包括如衬底这样的组件,所述衬底具有众多不连续的位置,所述位置具有选自金属层、带正电或带负电化合物,或者中性或疏水聚合物的涂层,用于固定蛋白质和蛋白片段。本发明系统进一步包括含有至少一种含蛋白化合物的样品、拉曼光谱仪以及包括用于分析样品的算法的计算机。在一个实施方案中,拉曼光谱仪是连续接收自众多不连续位置的SERS信号的扫描仪,这对高通量筛选固定在不连续位置上的样品内容物是有帮助的。在本发明方法的一个方面中,掺入到本发明的凝胶基质中并且用在在此所述的某些其它分析物分离技术中的SERS活性纳米颗粒是复合有机-无机纳米颗粒(″COINs″)。这些SERS活性探针构建物包括核和表面,其中所述核包括金属胶体和拉曼活性有机化合物,所述金属胶体包括第一金属。COINs可以进一步包括不同于第一金属的第二金属,其中所述第二金属形成覆在纳米颗粒表面上的层。COINS可以进一步包括覆在金属层上的有机层,该有机层包括探针。附着于SERS活性纳米颗粒表面的合适的探针包括而不限于抗体、抗原、多核苷酸、寡核苷酸、受体、配体以及类似物。
用于获得合适的SERS信号所需的金属是COIN中固有的,并且各种拉曼活性有机化合物可以被并入到粒子中。事实上,通过使用含有不同结构、混合物和比例的拉曼活性有机化合物的纳米颗粒,可以产生大量独特的拉曼特征(Ramansignature)。因此,在此所述的使用COINs的方法对同时检测样品中的很多分析物是有用的,从而导致可快速定性分析体液的“图谱(profile)”的内容。另外,因为许多COINs可以被掺入到单个纳米颗粒中,来自单个COIN颗粒的SERS信号相对于从不含有在此所述的纳米颗粒的拉曼活性材料获得的SERS信号要强。相比起没有使用COINs的拉曼技术,这种情况导致灵敏度增加。
如此处所用,词语“胶体(colloid)”指的是悬浮在液体通常为水中的纳米尺寸的金属颗粒。考虑用在本发明纳米颗粒中的典型金属包括造币金属(coinagemetal),例如银、金、铂、铝以及类似物。
如此处所用,词语“拉曼活性有机化合物(Raman-active organic compound)”指的是响应于激光激发而产生独特SERS信号的有机分子。各种拉曼活性有机化合物被考虑用作COINs中的成分。在某些实施方案中,拉曼活性有机化合物是多环芳香或芳香杂环化合物。一般地,拉曼活性化合物具有小于大约300道尔顿的分子量。
另外,拉曼活性有机化合物的非限制性例子包括TRIT(四甲基罗丹明异硫醇(tetramethyl rhodamine isothiol))、NBD(7-硝基苯-2-氧杂-1,3-二唑)、德克萨斯红染料(Texas Red dye)、邻苯二甲酸、对苯二甲酸、间苯二甲酸、甲酚固紫、甲酚蓝紫、亮甲酚蓝、对氨基苯甲酸、藻红、生物素、地高辛、5-羧基-4′,5′-二氯-2′,7′-二甲氧基荧光素、5-羧基-2′,4′,5′,7′-四氯荧光素、5-羧基荧光素、5-羧基罗丹明、6-羧基罗丹明、6-羧基四甲基氨基酞菁、偶氮甲碱、花菁、黄嘌呤、琥珀酰荧光素、氨基吖啶以及类似物。这些以及其它拉曼活性有机化合物可以从商业来源获得(例如Molecular Probes,Eugene,OR.)。
在某些实施方案中,拉曼活性化合物是腺嘌呤、腺嘌呤、4-氨基-吡唑并(3,4-d)嘧啶、2-氟腺嘌呤、N6-苯甲酰腺嘌呤、激动素、二甲基-烯丙基-氨基-腺嘌呤、玉米素、溴-腺嘌呤、8-氮杂-腺嘌呤、8-氮杂鸟嘌呤、6-巯基嘌呤、4-氨基-6-巯基吡唑并(3,4-d)嘧啶、8-巯基腺嘌呤或9-氨基-吖啶、4-氨基-吡唑并(3,4-d)嘧啶或2-氟腺嘌呤。在一个实施方案中,拉曼活性化合物是腺嘌呤。
当荧光化合物被掺入到COINs和在此所述的其它拉曼活性探针构建物时,所述荧光化合物可以包括但不限于染料、固有荧光蛋白质、镧系磷光体(lanthanidephosphors)以及类似物。用于掺入到COINs和其它拉曼活性探针构建物或者提供光学信号的构建物中的染料包括例如罗丹明和衍生物,例如德克萨斯红、ROX(6-羧基-X-罗丹明)、罗丹明-NHS和TAMRA(5/6-羧基四甲基罗丹明NHS);荧光素和衍生物,例如5-溴甲基荧光素和FAM(5′-羧基荧光素NHS)、Lucifer Yellow、IAEDANS、7-Me2、N-香豆素-4-乙酸、7-OH-4-CH3-香豆素-3-乙酸、7-NH2-4CH3-香豆素-3-乙酸(AMCA)、monobromobimane、三磺酸芘(pyrene trisulfonate),例如Cascade Blue和monobromotrimethyl-ammoniobimane。
使用标准的金属胶体化学方法,容易制备用于本发明方法的COINs。COINs的制备也利用了金属吸附有机化合物的能力。事实上,因为拉曼活性有机化合物在金属胶体形成期间被吸附到金属上,许多拉曼活性有机化合物可以被掺入到COIN,无需特殊的连接化学方法(attachment chemistry)。
一般地,用于本发明方法的COINs按如下方法制备。制备含有下述物质的含水溶液合适的金属阳离子、还原试剂和至少一种合适的拉曼活性有机化合物。然后将溶液的组分置于将金属阳离子还原形成中性胶体金属颗粒的条件中。因为金属胶体的形成在合适的拉曼活性有机化合物存在下发生,在胶体形成期间,拉曼活性有机化合物容易被吸附到金属上。该简单类型的COIN被称为类型ICOIN。类型I COIN通常可以用膜过滤分离。此外,具有不同尺寸的COIN可以通过离心富集。
在可选择的实施方案中,COINs可以包括不同于第一金属的第二金属,其中所述第二金属形成覆盖于纳米颗粒表面的层。为了制备该类型的SERS活性纳米颗粒,将类型I COINs置于含有合适的第二金属阳离子和还原剂的含水溶液中。然后将该溶液的组分置于还原第二金属阳离子的条件中,以形成覆盖于纳米颗粒表面的金属层。在某些实施方案中,第二金属层包括金属,诸如银、金、铂、铝和类似物。该类型的COIN称为类型II COINs。类型II COINs可以用与类型I COINs相同的方式分离和/或富集。典型地,类型I和类型II COINs基本上是球形的,尺寸在约20nm至60nm范围内。相对于在检测期间被用于照射COINs的光的波长,所选择的纳米颗粒尺寸非常小。
典型地,通过将有机化合物共价连接到金属层的表面,将有机化合物连接到类型II COINs中第二金属的层上。将有机层共价连接到金属层上可以用本领域技术人员熟知的许多方法完成,诸如例如通过硫醇-金属键。在可选择的实施方案中,被连接到金属层的有机分子可以被交联,以形成分子网络。
用于本发明方法的COIN(s)可以包括含有磁性物质的核心,磁性物质诸如铁氧化物和类似物。磁性COINs可用常用的磁性颗粒处理系统处理,无需离心。事实上,磁性可以用作分离连接到磁性COIN颗粒的生物目标的手段,所述磁性COIN颗粒用特定的生物探针标记。
在本发明系统和本发明方法的实践中,拉曼光谱仪可以是检测单元的一部分,该检测单元被设计为检测和量化通过本发明方法由拉曼光谱法获得的拉曼信号。使用拉曼光谱法检测例如来自与金属纳米颗粒相联系的蛋白质的拉曼信号的方法在本领域是已知的(参见美国专利5,306,403;6,002,471;6,174,677)。已经公开了关于表面增强拉曼光谱法(SERS)、表面增强共振拉曼光谱法(SERS)和相干反斯托克斯拉曼光谱法(CARS)的变化。
拉曼检测单元的非限制性例子公开在美国专利6,002,471中。通过倍频Nd:YAG激光器在532nm波长,或倍频Ti:蓝宝石激光器在365nm波长处产生激发光束。可以使用脉冲激光束或连续激光束。激发光束经过共聚焦光学元件和显微物镜,聚焦到流路和/或流通池上。来自分离的蛋白质的拉曼发射光由显微物镜和共聚焦光学元件收集,并被耦合到单色仪,进行光谱分解(spectral dissociation)。共焦光学元件包括二色性滤色器、二次滤片、共聚焦孔、透镜和平面镜的组合,用于降低背景信号。可以使用标准全视场光学元件(full field optics)以及共焦光学元件(confocal optics)。通过拉曼检测仪来检测拉曼发射信号,拉曼检测仪包括与用于信号计数和数字化的计算机相连接的雪崩光电二极管或CCD阵列。
拉曼检测单元的另一个例子公开在美国专利5,306,403中,其包括SpexModel 1403双栅分光光度计,并配有砷化镓光电倍增管(RCA Model C31034或Burle Industries Model C3103402),它以单光子计数模式运作。激发源包括来自SpectraPhysics的514.5nm线氩离子激光器,Model 166和氪离子激光器(Innova 70,Coherent)的647.1nm线。
可选的激发源包括337nm处的氮激光器(Laser Science Inc.)和325nm处的氦-镉激光器(Liconox)(美国专利6,174,677)、发光二极管、Nd:YLF激光器和/或各种离子激光器和/或染料激光器。激发光束可以用带通滤光器(Corion)进行光谱纯化,并且可以使用6X物镜(Newport,Model L6X),聚焦到流动载流中的不连续位置的流路上,或者固体衬底上的不同位置上。可以用物镜来激发与金属纳米颗粒相关联的拉曼活性蛋白质和收集拉曼信号,其中使用全息光束分离器(KaiserOptical Systems,Inc.,Model HB 647-26N18),以产生激发光束和发射的拉曼信号的直角几何关系。全息陷波滤波器(Kaiser Optical Systems,Inc.)可以被用于减少瑞利散射辐射。可选的拉曼检测器包括包括ISA HR-320摄谱仪,其装配有红增强放大电荷耦合器件(RE-ICCD)检测系统(Princeton Instruments)。可以使用其它类型的检测器,例如傅里叶变换摄谱仪(基于麦克尔逊干涉仪)、电荷注入器件、光电二极管阵列、InGaAs检测器、电子倍增CCD、增强式CCD和/或光电晶体管阵列。
任何合适形式或构造的拉曼光谱法或本领域中已知的相关技术都可以被用于检测来自本发明方法的实践中的蛋白质的拉曼信号(例如SERS信号),包括但不限于常规拉曼散射、共振拉曼散射、表面增强拉曼散射、表面增强共振拉曼散射、相干反斯托克斯拉曼光谱术(CARS)、受激拉曼散射、反拉曼光谱术(inverseRaman spectroscopy)、受激增益拉曼光谱术(stimulated gain Raman spectroscopy)、超拉曼散射(hyper-Raman scattering)、分子光学激光检测器(molecular optical laserexaminer,MOLE)或拉曼显微探针(Raman microprobe)或拉曼显微镜(Ramanmicroscopy)或共聚焦拉曼微光谱测定法(confocal Raman microspectrometry)、三维或扫描拉曼(three-dimensional or scanning Raman)、拉曼饱和光谱术(Ramansaturation spectroscopy)、时间分辨共振拉曼(time resolved resonance Raman)、拉曼退耦光谱术(Raman decoupling spectroscopy)或紫外-拉曼显微术。
在本发明的某些方面中,在本发明方法的实践中,用于检测由特定蛋白质产生的拉曼信号的系统包括信息处理系统。示例性的信息处理系统可以包括计算机,其包括用于传送信息的总线和用于处理信息的处理器。在本发明的一个实施方案中,处理器选自Pentium系列处理器,包括但不限于PentiumII系列、PentiumIII系列和Pentium4系列处理器,它们供应自Intel Corp.(Santa Clara,Calif)。在本发明的可选实施方案中,处理器可以是Celeron、Itanium、Pentium Xeom处理器(Intel Corp.,Santa Clara,Calif)。在本发明的各种其它实施方案中,处理器可以基于基于Intel结构,如IntelIA-32或IntelIA-64结构。可选地,可以使用其它处理器。信息处理和控制系统可以进一步包括任何本领域中已知的外围设备,例如存储器、显示器、键盘和/或其它设备。
在具体实施例中,检测单元可以可操作地连接于信息处理系统。来自检测单元的数据可以由处理器处理,并且数据被存储在存储器中。也可以将各种患者样品的发射图谱的数据存储在存储器中。处理器可以将来自衬底上的不连续“点”的发射光谱与从众多相似患者样品的分析获得的汇编数据进行比较,以鉴定样品中的具体蛋白质或片段,或者鉴定被分析的样品中的蛋白质与蛋白质文库中的相应蛋白质之间的差异。处理器可以分析来自检测单元的数据,以确定例如在特定蛋白质中翻译后修饰的存在,而该翻译后修饰在健康个体的相应蛋白质中不存在。信息处理系统也可以执行标准程序,例如扣除背景信号。
虽然本发明的某些方法可以在程控处理器的控制下执行,然而,在本发明可选的实施方案中,方法可以完全或部分通过任何可编程的或硬编码的逻辑来实现,例如现场可编程门阵列(FPGAs)、TTL逻辑或专用集成电路(ASICs)。另外,可以通过程控的通用计算机组件和/或定制硬件组件的任何组合来实施本公开的方法。
在数据收集操作之后,一般将数据报告给数据分析操作。为了方便分析操作,由检测单元获得的数据一般使用数字计算机例如上面所述的计算机进行分析。一般地,所述计算机被合适地编程,用于接收和存储来自检测单元的数据,以及用于分析和报告所收集的数据。
在本发明的某些实施方案中,可以使用专门设计的软件包来分析从检测单元获得的数据。在本发明的可选实施方案中,可以使用信息处理系统和公共可得的软件包来执行数据分析。
本发明通过下列非限制性实施例可以被进一步阐明。
实施例1关于标准肽的试验
合成如下面表1中所示的标准肽,并将10μl标准肽的储液(100ng/μl)沉积到铝衬底的不连续位置上,并留置干燥。用80μl的1∶2胶体银/水和20nl的0.5MLiCl的SERS胶体溶液进行拉曼光谱术。对于每一个肽,收集了总共1500个光谱5次试验,每次试验3次扫描,每次扫描100帧。为了了解在光谱标准化之后是否可以辨别肽的拉曼信号,进行了主成分分析(PCA)。图7显示了所收集的每一个肽的拉曼光谱。PCA分析的结果显示在图8中。
表1肽标准
实施例2
本试验的目的是确定用于获得模型复杂蛋白质的蛋白质图谱的最佳样品检测条件,其中蛋白质目标没有加以拉曼标签或标记。使用试剂级小牛细胞培养血清作为样品源。在第一个试验中,制备了三组小牛全血清样品,其被沉积到铝衬底上,应用胶体银(含有160μl Ag,其以1∶2用水稀释)+BSA(20μl 1%BSA)+LiCl(40μl 0.5M LiCl)覆盖,在每一个步骤之后,或者风干,或者在湿润状态下进行测试。下面的表2显示了每一个样品的样品检测条件的组合。样品在820至900范围内的波长下被激发,收集1sec测试的SERS信号。仅有样品5(湿-干-湿)和8(湿-湿-湿)产生了SERS光谱,表明在这些条件下湿样品是优选于干样品的。
表2
为了确定小牛全血清的SERS检出限,使用小牛血清在水中逐步更加稀释的制剂重复上面的试验。通过该方法,已确定小牛全血清的SERS检出限是在水中的0.1%小牛血清(使用785nm激发波长,1sec收集时间)。
收集(1sec收集时间)并比较1%BSA和1%小牛血清(在铝衬底上风干)的SERS光谱。如分别在图9A和9B中所示,BSA和小牛血清具有相似的SERS光谱。为了了解相似性以及差异,使用来自两个不同商家的BSA收集SERS光谱New England Biolabs(3.33mg/ml BSA在1×PBS中)和Roche Chemicals(2.5mg/mlBSA在1×PBS中)。New England Biolabs BSA样品产生了比Roche Chemicals样品更强的SERS信号(使用从820至900nm的光谱采集,1sec)。猜测在商家之间BSA的纯度或乙酰化修饰的可能差异会导致SERS光谱中的差异。
实施例3
本试验的目的是确定用于从含有完整蛋白质的复杂蛋白质样品的HPLC分离的蛋白质级分获得SERS数据的最佳条件,使用小牛血清作为模型样品(modelsample)。为了准备本试验,通过HPLC分级分离低分子量蛋白质标准。每一个所使用的浓度为1.33μg/μl,在1×PBS中,注入体积为10μl。使用的标准是磷酸化酶(97kDa);BSA(66kDa);卵清蛋白(45kDa);碳酸酐酶(30kDa);胰蛋白酶抑制剂(20.1kDa);和α-乳清蛋白(14.4kDa)。
通过用0.45μm的离心过滤器(spin filter)以14000rpm离心10分钟进行过滤之后,以1∶30稀释于水中的小牛血清通过HPLC进行分离,使用ZorbaxGF-220柱,注入体积为10μl。在12.5min的洗脱时间内收集级分1-11,在大约20min后再收集一次级分。发现,蛋白质的浓度非常低以致于难以获得紫外-可见光测量值。因此,使用蛋白分析校准试剂盒(protein assay calibration kit)(Micro BCA)将蛋白质染色为紫色,并在A562处对级分读数。然而,浓度仍然低,除了可能是BSA的级分10外。白蛋白耗尽试剂盒(albumin depletion kit)不能充分降低BSA在小牛血清中的优势。下面的表3显示了在感兴趣的HPLC级分中的估计蛋白质浓度。
表3
为了准备获得来自级分的SERS信号,将10μl的每一个级分连同1×PBS和1∶10稀释的小牛血清点到铝衬底上,并留置风干约2小时。从1×PBS没有SERS信号被观察到,尽管从10%小牛血清(含有404.8μg/mL小牛血清级分9)获得强SERS信号。从其它低浓度小牛血清级分没有观察到SERS信号。
为了获得SERS信号,通过冻干低浓度级分大约5小时并重溶在水中,获得较高浓度的级分。然后通过将10μl的每一个级分连同2.5mg/ml BSA(Roche)、3.33mg/ml BAS(NEW)和1∶10稀释的小牛血清点到铝衬底上,获得SERS样品。将点留在衬底上风干大约2小时。下面的表4显示了浓缩级分中的浓度。
表4
然后从浓缩的样品获得拉曼信号,如在图10中所示。
基于这些试验,已确定在HPLC分离中应当使用高度浓缩的蛋白质样品,以便在级分中产生高浓度蛋白质,所述级分被期望在没有使用拉曼标签或拉曼标记的情况下进行SERS信号采集。白蛋白耗尽试剂盒也被发现对高浓度小牛血清是无效的。
实施例4
猜测肽将产生比蛋白强的SERS信号,因为在较小的分子中,SERS活性化学结构更容易接近。也猜测具有不同序列的肽可以产生独特的SERS信号特征,其可以被用于蛋白质作图。为检验此猜测,小牛血清样品首先在Zorbax GF-250柱(二醇,尺寸排阻)上进行HPLC分离,使用1×PBS作流动相,样品体积为20μl,使用恒定溶剂成分方法,操作时间为20min。通过标准注射,色谱图(紫外测量)上主要的白蛋白峰被确认为白蛋白。白蛋白的主要吸收峰是205nm和225nm。然而,小牛血清的主要HPLC峰(BSA)的紫外吸收图谱显示,吸收峰是不一致的,这表明在该峰中存在多种蛋白质。
为了确定用肽代替完整蛋白质工作对SERS信号的影响,对小牛血清样品进行胰蛋白酶消化,并且在酸性介质下,在C18柱上,用HPLC分离肽混合物。在C18柱中,脂族链包被的硅石结合肽,TFA-CH3CN流动相根据肽的疏水性将它们洗脱下来。在流动相中的酸是必需的,以使肽中的酸基团质子化,这使它们在柱上停留更长时间。HPLC分离使用50μl的样品体积,消化前的样品浓度为1.4μg/μl(≈21μM)。每一种级分具有≈80pmol的肽。对于HPLC,使用Zorbax SB-C18柱,其中流动相缓冲液含有0.1%TFA作为缓冲液A和乙腈作为缓冲液B。程序为0至≤5分钟,100%A;5至≤40分钟,100%A梯度变化至100%B。胰蛋白酶消化的小牛血清的HPLC分离的色谱显示在图11A中。也测量了HPLC肽级分的紫外吸收(215nm)(图11B)和SERS光谱(图11C)。
这些试验的结果显示,适当的蛋白质样品制备是重要的,并且蛋白质碎片化或变性有助于使拉曼活性结构域或氨基酸残基暴露于银表面。
尽管已经参考上述实施例描述了本发明,应当理解,修改和变化被包括在本发明的精神和范围内。因此,本发明仅仅通过权利要求来限定。
权利要求
1.用于分析生物样品的蛋白质内容物的方法,包括a)基于蛋白质的化学和/或物理性质,分离所述样品中的蛋白质和蛋白质片段;b)使被分离的蛋白质以隔离状态保持在固体衬底上的或流动液体流中的不连续位置上;c)检测由在所述不连续位置上的所述隔离蛋白质产生的拉曼光谱,其中来自所述不连续位置的所述光谱提供了关于在该不连续位置上的一种或多种具体蛋白质的结构的信息;c)在适合于在一个或多个所述不连续位置上形成捕获探针/蛋白质复合物的条件下,使所述隔离蛋白质与所述捕获探针接触;d)将所述复合物与结合所述蛋白质或所述复合物的拉曼活性探针构建物接触;和e)检测由在所述不连续位置的探针构建物/蛋白质复合物产生的拉曼光谱,其中来自不连续位置的光谱提供了关于在该不连续位置上的一种或多种具体蛋白质的结构的信息。
2.权利要求1所述的方法,进一步包括将所述信息与关于所述样品的来源的信息关联起来。
3.权利要求2所述的方法,其中所述捕获探针是与所述复合物中的所述蛋白质特异性结合的一抗。
4.权利要求1所述的方法,其中所述拉曼活性探针构建物包括作为探针的二抗和一个或多个拉曼标签。
5.权利要求4所述的方法,其中所述拉曼活性探针构建物是具有独特的SERS特征的COIN,并且被检测的拉曼光谱是SERS光谱。
6.权利要求1所述的方法,其中所述蛋白质在分离之前被溶解在水溶液或亲水溶剂中。
7.权利要求1所述的方法,进一步包括在分离之前使所述样品中的蛋白质变性。
8.权利要求7所述的方法,其中被用于使所述蛋白质变性的变性试剂选自还原剂、表面活性剂、离液盐以及它们的组合物。
9.权利要求8所述的方法,其中变性的蛋白质在信号检测之前在衬底上被干燥。
10.权利要求1所述的方法,其中在所述蛋白质被固定在衬底上之前,所述衬底被涂覆以一种或多种有机或无机材料。
11.权利要求10所述的方法,其中分离的蛋白质被沉积到固体衬底上的不连续位置上,这是通过选自接触写入、接触点印、液体喷雾和干粒子喷雾的方法被沉积的。
12.权利要求1所述的方法,其中分离的蛋白质在未变性的情况下使用湿式电喷雾沉积被沉积。
13.权利要求1所述的方法,其中所述衬底是铝。
14.权利要求1所述的方法,其中所述衬底由在平板上的众多不连续位置组成。
15.权利要求1或14所述的方法,其中检测被自动化以完成在有序的不连续位置处的高通量扫描。
16.权利要求1所述的方法,其中所述衬底上的所述不连续位置包括选自金、银、铜和铝金属、玻璃、硅和陶瓷材料的材料。
17.权利要求1所述的方法,进一步包括使在所述不连续位置上的所述蛋白质与以单独或聚集形式存在的银纳米颗粒接触。
18.权利要求17所述的方法,进一步包括使所述纳米颗粒与至少一种化学增强剂盐接触。
19.权利要求18所述的方法,其中所述化学增强剂盐是LiCl。
20.权利要求17或18所述的方法,其中所述拉曼光谱是SERS光谱。
21.权利要求1或17所述的方法,进一步包括从所述不连续位置采集拉曼光谱或SERS光谱,以编辑所述样品的蛋白质图谱。
22.权利要求21所述的方法,其中所述采集被自动化以完成对所述不连续位置的高通量SERS光谱筛选。
23.权利要求1所述的方法,其中在SERS光谱与样品位置之间的关系被记录并被关联。
24.权利要求1或22所述的方法,其中所述光谱含有关于蛋白质特征的信息,所述蛋白质特征选自化学键、残基组成、残基结构、残基的相对位置、蛋白质的身份和它们的组合。
25.权利要求1所述的方法,其中通过将所述分离的蛋白质或片段有顺序地引入到所述流动流中以形成所述不连续位置,使所述分离的蛋白质被保持在隔离的状态。
26.权利要求25所述的方法,进一步包括在适合于形成SERS活性纳米颗粒的条件下,混合所述隔离蛋白质流与金属胶体流,并且所述检测是SERS检测。
27.权利要求1所述的方法,进一步包括通过质谱法分析所述分离的蛋白质,以鉴定包含在所述分离的蛋白质或其片段内的一种或多种官能团。
28.权利要求27所述的方法,进一步包括汇编从所述拉曼光谱或SERS光谱获得的数据和从所述质谱法获得的数据。
29.权利要求1或28所述的方法,其中所述样品是患者样品。
30.权利要求29所述的方法,其中所述患者样品是体液,所述体液选自尿、血液、血浆、血清、唾液、精液、粪便、痰、脑脊髓液、眼泪和粘液。
31.权利要求1所述的方法,进一步包括基于从所述拉曼光谱和/或SERS光谱获得的所述数据,产生所述样品的蛋白质图谱。
32.权利要求31所述的方法,进一步包括使用各种不同患者样品,重复所述方法,以产生含有众多不同蛋白质图谱的蛋白质文库。
33.权利要求32所述的方法,进一步包括将样品的蛋白质图谱与所述文库的一个或多个蛋白质图谱进行比较,以检测差异,其中所述差异指示了患者的疾病。
34.用于分析蛋白质的复杂混合物的蛋白质组成的试剂盒,包括a)衬底,所述衬底具有众多不连续的位置,所述位置被涂覆以带正电或带负电的化合物,或中性或疏水聚合物,用于将蛋白质和蛋白质片段固定在所述不连续位置上;和b)容器,所述容器含有银、金、铜或铝的纳米颗粒。
35.权利要求34所述的试剂盒,进一步包括蛋白质变性剂。
36.用于分析蛋白质的复杂混合物的蛋白质组成的系统,包括a)衬底,所述衬底具有众多不连续的位置,所述位置具有选自金属层、带正电或带负电的化合物、和中性或疏水聚合物的涂层,用于将蛋白质和蛋白质片段进行固定;b)样品,其含有至少一种含蛋白化合物;c)拉曼光谱仪;和d)计算机,其包括用于分析样品的算法。
37.权利要求36所述的系统,其中所述拉曼光谱仪是从所述众多不连续位置连续接收到的SERS信号的扫描仪。
全文摘要
本发明提供了用于分析生物样品的蛋白质内容物的方法,例如以获得由具体个体所提供的样品的蛋白质图谱。基于化学和/或物理性质,分离样品中的蛋白质和蛋白质片段,并使它们以分离的状态保持在固体衬底上或流动液体流内的不连续的位置上。然后检测由不连续位置上的分离的蛋白质或片段所生产的拉曼光谱,这样来自不连续位置的光谱提供了关于在不连续位置上的一种或多种具体蛋白质或片段的结构或身份的信息。位于不连续位置的蛋白质或片段可以被涂覆以金属,例如金或银,和/或可以使所述分离的蛋白质与化学增强剂接触而提供SERS光谱。也提供了实践本发明的方法和试剂盒。
文档编号G01N21/63GK1902495SQ200480039435
公开日2007年1月24日 申请日期2004年12月29日 优先权日2003年12月30日
发明者A·伯林, X·苏, S·陈, T-W·丘, L·孙, N·桑达拉赞, M·山川 申请人:英特尔公司