植物组学涉及草药组合物的基于基因组的方法

文档序号:584603阅读:3985来源:国知局
专利名称:植物组学涉及草药组合物的基于基因组的方法
技术领域
本发明涉及草药组合物。更具体地说,本发明提供了改善草药组合物的选择、测试、质量控制和制造的工具和方法学,以帮助指导开发新颖的草药组合物和鉴别现有草药组合物的新用途。
背景技术
本文中的所有出版物和专利申请都结合在此作为参考,就好象每一篇独立的出版物或专利申请都具体而独立地被指示结合在此作为参考一样。
草药已被亚洲和欧洲人民使用了数百年。在美国(US),草药已在食品强化剂工业以及整体医学中取得商业上的价值。大约有三分之一的美国人至少尝试过一次某些形式的替代医学(Eisenberg等.,1993,新英格兰医学杂志.328246-252).
植物性药材,包括草药,已成为用于鉴别新颖的治疗疾病的活性药剂的焦点。从植物提取物得到的活性化合物一直是制药业的兴趣所在。例如,紫杉醇是从西方紫杉树的树皮得到的一种抗肿瘤药。据估计,在当今所常用和指定的数千种药物中,大约有50%是从植物来源得到的,或者含有植物化合物的化学仿制品(Mindell,E.R.,1992,Earl Mindell草药圣经,家庭生活图书).
目前,有许多医药制剂、食物添加剂、食品强化剂等等都含有来自草药的药草成分或提取物。很长时期以来,草药已在许多不同国家用于治疗各种人类和动物的疾病(参见,例如I.A.Ross,1999,世界药用植物,化学构成,传统与现代医药应用,Humana Press;D.Molony,1998,美国东方医学协会对中草药的完全指南,BerkleyBooks;Kessle等,1996,恢复医学的医生完全指南,BerkleyHealth/Reference Books);Mindell,同上).
草药医学。世界上有许多草药医学的分支,诸如印度草医学、Unani、Sida和中医(TCM)。现代西方医学一般由给药能够干预特定生化途径的单一化学物质组成,而每种TCM制剂通常含有来自若干种草药的上百种化学物质,它们经过调配在体内以协同方式与多个目标相互作用。虽然实践经验有效地促进了这些古老的草药医学的草药组合物和处方的发展,但它们也在不同程度上得到一套理论的支持,这套理论在解剖学、药理学、病理学、诊断处理等方面全然不同于现代西方医学。在不同的草药医学领域中,TCM已经过数个世纪发展了一套更为完整的理论,它们有充分的文字记载,并且在大中华和东亚地区包括韩国和日本由当地医师对广大人群(>13亿人)加以实践应用。
西方医学通常使用天然或合成的纯化合物,大部分指向单一的生理学目标。然而,TCM中所用的组合物常常由多种草药和化合物组成,它们基于独特而完整的概念,针对的是体内的多个目标。TCM主要使用炮制过的粗天然产物,经过各种组合和制剂,用于治疗不同的病态,同时使产生的副作用较小。TCM的巨大潜力已为世界上大多数人所认识。
草药在典型的TCM处方中可按作用分为主药和从药,包括辅药、佐药和使药。主药在对病因或疾病的主要症状的治疗中起主导作用。辅药帮助加强主药的作用并在对兼证的治疗中起主要作用。佐药有三种类型1)增强主药和辅药的治疗作用或治疗次要症状的佐药,2)减小或消除主药和辅药的毒性和其他副作用的佐药和3)作用于不明确受到君药影响的补充目标组织的佐药。使药引其他诸药的作用直达病所和/或调和处方或制剂中其他草药的作用。与由一份或多份单一植物组成的大多数草药或强化剂相比,TCM的预定作用针对的是多个组织。
例如,广为人知的用于治疗哮喘的TCM方剂“麻黄汤”由麻黄、桂枝、苦杏仁和甘草组成。麻黄是主药,散寒、发汗并开宣肺气而平喘,针对的是主证。桂枝作为辅药,增强麻黄的发汗功能并温经通脉以确保肺气通畅而除疼痛之症。苦杏仁为佐药,能宣降肺气,佐助麻黄平喘。甘草为使药,调和麻黄与桂枝的作用,以确保生气的体内平衡。尽管这四味药各自清楚地显示出各自的活性,但它们合用时彼此功效互补。实践中,根据患者显露出的症状,主药可以伴有一味或多味从药(中医方剂学,第1章,10-16页,E.Zhang,editor in Chief,Publishing House,上海中医药大学,1998)。
指导用草药和其他方式如针灸治疗疾病的主要TCM理论是1)阴阳学说,2)五行学说,3)脏腑学说,4)气、血和津液学说,和5)经络学说。
在TCM中,作出正确诊断的首要方面是确定疾病的阴阳。例如,发烧的病人,若有口渴、便秘或脉急等症状,就是阳症。畏寒的病人,若不渴、腹泻且脉缓,就是阴症。草药的性、味和功能也可以按照阴阳理论加以分类。例如,寒性和凉性的草药属阴,而温性和热性的草药属阳。酸、苦和咸味的草药属阴,而辛、甜和淡味的草药属阳。收敛、沉降功能的草药属阴,而发散、升浮功能的草药属阳。在TCM中,治疗原则是基于阴阳的胜衰。草药按照它们的阴阳特性和功能组方,以恢复阴阳平衡,如此达到治疗目的。
按照五行学说,有五种基本物质构成物质世界(即木、火、土、金和水)。在TCM中,该学说用于解释人体的生理和病理并指导临床诊断和治疗。草药医师已应用五行的生、克、相乘和反克规则制定出了许多有效而特定的治疗方案,诸如培土生金(加强脾的功能以利肺),滋水涵木(滋肾养肝),扶土抑木(补充脾的功能以治疗肝机能亢进),和补水泻火(滋养肾精而治疗心机能亢进)。具体地说,有些草药的性与五行相对应,目的是指导TCM的方剂配伍。
在TCM中,将人体的内部器官分为三组五脏(心、肝、脾、肺、肾),六腑(胆、胃、大肠、小肠、膀胱、三焦),奇恒之府(脑、髓、骨、脉、胆、女子胞)。在TCM中,脏腑不仅是解剖单位,而且是关于不同器官之间相互作用的生理和病理学概念。例如,心也指某些精神活动,并影响血、发、舌和皮肤的功能。阴阳五行会影响这些脏、腑和器官之间的相互作用。理论学说的互相影响的复杂性被用于解释草药所针对的疾病的病理,如下文中所讨论的。
TCM中开药方是从诊断开始的,诊断主要包括四项问诊、望诊、听诊和闻诊、切诊。问诊过程中,搜集大量信息,包括主证的特征。例如,如果主证的特征是上腹部钝痛,并可通过热、压减轻,就提示为脾阳不足。腰膝酸软、怕冷且手脚凉,显示为肾阳虚。望诊过程中,对活力、皮肤的颜色和全身的外观以及舌象进行观察。例如,面色苍白在内部与秋天的肺对应,其气躁。这可出现在阳气不足且气血阻滞的时候,或者出现在经络受寒而收缩的时候。
在TCM中,正是从气血津液生成脏腑、经络、组织和其他器官完成它们的生理学功能所需的能量;且取决于气血津液的形成与代谢。TCM处方考虑草药对气血的作用而进行治疗。
TCM认为,经脉、络脉以及它们的辅助部分遍布全身。正是通过它们,草药得以发挥对病理学目标的影响,达到改善疾病的效果。例如,麻黄作用于肺和膀胱经,故能发汗平喘和利尿。如上所述,针灸的临床应用也受经络学说的指导。
总之,在TCM中每种草药的性质可指定阴阳并与五行之一相配,它们通过经络发挥作用并经由气血津液介导而对目标诸如脏腑产生治疗作用。致病因子可能通过完全相同的经络系统而被佯装为圈套,从而对脏腑功能产生不利影响,并由此导致疾病。
从前面的讨论可以清楚地看出TCM术语既是解剖学上的概念,也是哲学上的概念。例如,心代表体内组织、器官或系统的主体,发挥TCM中所述的功能。因此,心的概念需要一个多维的数据集来描述TCM的每个概念。一旦实现这点,就可发展分子整体医学。
美国的管理方法。在美国,食品强化剂(诸如植物产物、维生素和矿物质、氨基酸和组织提取物)由1994年的《食品强化剂卫生与教育条例》(DSHE条例)管理。该条例将食品强化剂成分与受《联邦食品、药物和化妆品条例》管理的食品添加剂区别开来。此外,DSHE条例要求,若上市销售的食品强化剂在标签上显示的或通常的使用条件下出现严重或不合理的危险时,食品和药物管理局(FDA)负责检验。因此,目前没有确立食品强化剂的纯度、鉴别和制备规程的具体标准的联邦规章。另外,1992年经国会替代医学办公室制定,公布了有关草药质量的不多的几个文件(Angell等,1998,新英格兰医学杂志339839-841)。
目前,FDA必须批准药物组合物或合剂中的每一种化学物质,然后必须进行临床试验,以便获得有关销售药物的分开的FDA批准。该过程极其冗长而昂贵。由于前述的使用特定草药组合物作为植物性药物允许一开始就用多个化学物质进行临床试验(即使用草药组合物或草药组合物的特定成分进行临床试验),因此分子整体医学需要进行的评估较为容易。最近,FDA已批准一些草药作为植物性药物进行临床测试(FDA关于植物性药物的指导,1997年4月)。尽管这些事件表明了全身保健的积极发展,但也提出了有关草药和食品强化剂包括中药的制剂、制备和质量控制等重要问题。
由草药中多种化学物质诱导的大量相关生物应答目前是无法获得的,为了支持FDA的上市批准,这将逐渐变得重要。
在不断增加的提高草药的实际应用的压力下,出现了以草药为基础的产业(参见例如Angell等,同上)。将科学测试应用于草药和食品强化剂的制备和给药的需要已非常突出,因为有一些摄取了基于草药的制剂后出现毒性的最新报道。例如,有一名患者吃了以草药为基础的食品强化剂后出现了洋地黄毒性(Slifman等,1998,新英格兰医学杂志339806-811)。后来经过测定,在该强化剂中标记为车前草的草药成分实际上受到了毛地黄的污染,而毛地黄是一种已知含有至少60种强心甙的草药。在另一个例子中,草药制剂被发现引起了患者的慢性铅中毒(Beigel等,1998,新英格兰医学杂志339827-830)。由于传统的亚洲草药被铅和其他重金属污染已有充分的记载,因此出现这种情况并不完全是意外(Woolf等,1994,内科学纪事121729-735)。
植物性药材的特性描述。众所周知,遗传特性(例如属、种、栽培、变种、克隆)、草药的生长年限、收获时间、所用的特定植物部位、加工方法、地理起源、土壤类型、气候模式、肥料的类型和比率、以及其他生长因素都对从任何特定区域“收获”的任何特定草药的特定化学组成具有重要影响。
已制定了越来越多数量的各种类型的试验以确保在药品中所用的和作为食品强化剂的草药有恒定的质量;包括在宏观和微观水平进行检验以及用各种各样的化学分析进行检验。最近,草药提取物中标志分子的高效液相色谱(HPLC)图形已成为一个参照标准。但是,这种方法存在一些问题,包括有一些生物活性分子可能不吸收用于HPLC检测的紫外线或可见光,和化学物质的量不必然与其生物学效能成比例。出于这些原因,草药制造商采取将不同来源的原料混合的手段来减小化学变异。
质谱法(MS)是一种测定从高真空中的样品产生的一束电离分子或分子片段的各成分的相对质量和相对丰度的分析方法。MS与HPLC不同,它不依赖于光密度。实践中,其与HPLC或毛细管电泳(CE)联合使用HPLC将化学物质分离开,然后可以用MS鉴别它们是什么。将MS和HPLC结合成整体用于生物学用途的系统可以从商业上获得。质谱限于在低压下为气态或挥发性的样品,或者可以通过衍生达到这一点的样品。
这些步骤已经不够了。最近的一些出版物报道了某些特定供应商提供的草药质量方面的更多的变化,要提供草药提取物的生物等价化学是困难的。此外,安全与功效和草药中化学物质之间的相互关系在大多数情况下是不太确定的。最近,为响应来自消费者和管理机构的意见(联邦登记簿,1997年2月6日,62卷,25号,摘要No.96M-0417,制造、包装或保持食品强化剂中的cGMP,建议规则),有些草药制造商已开始执行在各个方面要求严格的药品生产和质量管理规范(GMP)。
化学和光谱学方法已用于描绘草药和食品强化剂各组分的特性。例如,使用这两种方法从墨西哥丁香(Gliricidia sepium)的果实中分离出了三种新的基于常春藤皂甙元的乙酰化皂甙(Kojima等,1998,植物化学48(5)885-888)。大量商品样本中的中草药的植物学来源是通过对比用高效液相色谱(HPLC)或毛细管电泳(CE)分析出的某些特征组分推断出的(Shuenn-Jyi Sheu,1997,食品和药物分析杂志5(4)285-294)。例如,麻黄碱/伪麻黄碱的比例被用作区别中麻黄(Ephedra intermedia)与其他种麻黄的标志;总生物碱含量可用于区分各种黄柏;而人参甙的含量可用于区别各种人参。但是,这些方法没有直接测量各种草药对病人用这些草药进行了治疗后的分子、生理学或形态学应答的作用。
加利福尼亚卫生学部门的食品和药物分部最近使用气相色谱-质谱和原子吸收方法对从草药库房得到的亚洲药品的污染物进行了测试(R.J.Ko,1998,新英格兰医学杂志339847)。在他们所检测的260种产品中,至少有83种(32%)含有未申报的药物或重金属,23种有一种以上的掺杂物。使用高效液相色谱法、气相色谱法和质谱法,对从商业上购得的8种草药的组合物(PC-SPES)进行了测定,发现含有雌激素类有机化合物(DiPaola等,1998,新英格兰医学杂志339785-791)。研究人员得出结论,PC-SPES有强雌激素活性,且服用PC-SPES的前列腺癌患者可能混淆标准治疗的结果并可能出现临床上显著的副作用。还收集了中药“威灵仙”不同样品的气相色谱数据以及与样品抗炎活性的关系(Wei等,用于中药“威灵仙”质量评定的化学图谱识别的研究,药学通报26(10)772-772(1991))。该研究没有提供相关的HBR阵列数据,诸如时间过程、剂量依赖性应答、控制样品以证实生物标志的不同强度,也没有利用重复类型的数据构造方法以建立用于描绘该草药组合物作用的特征的综合数据库。
蛋白质浓度的变化也已用于表征草药组合物或草药的特定组分的作用。例如,来自外周血单核细胞的粒细胞集落刺激因子(G-CSF)的产生据发现根据加入到培养物中的特定中药而发生变化(Yamashiki等,1992,临床实验免疫学杂志37(2)83-90)。白介素-1α受体的表达在用日本最常用的中药小柴胡汤(Sho-saiko-to)处理过的培养的人表皮角质细胞中被显著上调(Matsumoto等,1997,日本药理学杂志73(4)333-336)。Fcγ11/111受体和巨噬细胞的补体受体3的表达通过用当归芍药散(Toki-shakuyakusan)(TSS)处理而增加(J.C.Cyong,1997,日本药理学杂志110(Suppl.1)87-92)。从天然中药中分离得到的生物碱-汉防己甲素可抑制大鼠肺泡巨噬细胞中信号诱导的NF-κB的活化(Chen等,1997,生物化学与生物物理学研究通讯231(1)99-102)。草药Sairei-to、泽泻(日本名为“Takusha”)和茯苓(日本名为“Bukuryou”)在患抗肾小球基底膜性肾炎的大鼠体内抑制内皮肽-1的合成和表达(Hattori等,1997,日本心脏学会志39(2)121-128)。
mRNA浓度的增加或减少也被用作各种草药和草药组分作用的指示剂。腹膜内注射具有抗癫痫性能的中药青阳参(QYS)和苯妥因钠减少了大鼠红藻氨酸诱导的慢性癫痫发作期间α-和β-微管蛋白(tublin)mRNA和海马c-fos mRNA的产生(Guo等,1993,中药杂志13(4)281-286;Guo等,1995,中药杂志15(4)292-296;Guo等,1996,中药杂志16(1)48-51)。用从黄芪(Astragalus membranaceus)纯化得到的成分-黄芪皂甙IV处理培养的人脐静脉内皮细胞(HUVEC),结果减少了I型纤溶酶原活化剂抑制剂(PAI-1)特异性mRNA的表达,并增加了组织型纤溶酶原活化剂(t-PA)特异性mRNA(Zhang等,1997,血管研究杂志34(4)273-280)。从人参(Panax ginseng)的根分离出的一种成分据发现是由人单核细胞和人单核细胞系THP-1生成的白介素-8(IL-8)的强诱导剂,这种诱导伴随有增加的IL-8mRNA的表达(Sonoda等,1998,免疫药理学38287-294)。
核酸微阵列技术的最新进展使得能够大规模地平行采集有关基因表达的信息。这种方法已用于研究细胞循环、生化路径、酵母中基因组范围的表达、细胞生长、细胞分化、细胞对单一化合物的应答、以及遗传疾病,包括疾病的发生和进展(M.Schena等,1998,TIBTECH16301)。因为细胞通过改变特定基因的表达水平来响应微环境的变化,所以对细胞中表达的基因的鉴定可确定细胞来自何处和牵涉到哪些生化与调节系统,等等(Brown等,1999,自然遗传学,21(1)增刊33)。因此,细胞的基因表达图形描绘了细胞的起源、现在的分化以及细胞对外部刺激物的应答。迄今没有研究人员,若有的话,曾尝试将这些新技术用于研究全部草药治疗和强化剂的分子作用。
有一些研究人员曾尝试表征从选定的草药分离出的主要活性成分的作用。例如,用从三七(Panax notoginseng)纯化得到的三七皂甙R1(NR1)处理HUVEC,导致了TPA合成的剂量和时间依赖性的增加(Zhang等,1994,动脉硬化与血栓形成14(7)1040-1046)。用NR1处理没有改变尿激酶型纤溶酶原活化剂和PAI-1抗原的合成,也没有影响PAI-1在胞外基质中的沉积。当HUVEC用NR1处理时,TPA mRNA增加了两倍,而PAI-1特异性mRNA的表达没有受到NR1的显著影响。由于关于三七的大多数研究都涉及到其与其他草药的混合物,因此研究人员注意到,当用于治疗人时,很难评定它们的体内情况会是怎样(同上,1045页,第2列,第1段)。此外,由于研究人员仅研究了草药的一种主要成分,因此从该研究不可能确定整个草药的分子作用或草药的各成分之间的相互作用。
Dobashi等(1995,神经科学快报197235-238)研究了用于治疗肾病综合征、支气管哮喘和慢性类风湿性关节炎的中药柴胡剂的两种主要成分。给药SS-d以剂量依赖方式增加了血浆促肾上腺皮质激素(ACTH)的浓度、垂体前叶中阿黑皮素原mRNA的浓度和大鼠下丘脑中CRF mRNA的浓度。相反,用SS-a治疗没有对这些分子标志的浓度产生影响。尽管该研究指示给药SS-d可能在柴胡剂诱导的CRF释放和大鼠下丘脑中CRF基因的表达中具有重要作用,但没有针对草药治疗总体上的分子作用。
Kojima等(1998,生物药理学通报4426-428)描述了利用mRNA差别显示来分离和鉴别在小鼠肝脏中由在日本用于治疗各种炎性疾病的草药小柴胡汤进行转录调节的基因。这些研究人员将他们的研究限于在调查研究草药的分子机理中使用mRNA差别显示技术。该研究同样没有针对受治疗的动物的多个器官的作用,也没有提供任何有关质量控制、新用途和作用标准化的指导。另外,该研究没有对草药的单个成分进行分析并将独立的结果与使用整个草药混合物得到的结果进行比较。
Ma Ji等(1998,中医杂志111(1)17-23)研究了草药黄芪(Astragali membranaceus)对大鼠主动脉瘘引起的实验性充血性心力衰竭的钠水潴留的治疗作用。对比用黄芪治疗和不用黄芪治疗的慢性心力衰竭的大鼠在各种形态学特征方面的变化(例如体重、血钠浓度);生理学特征方面的变化(例如平均动脉压、心率、血细胞比容和血浆同渗重量摩尔浓度);mRNA表达水平的变化(例如下丘脑精氨酸后叶加压素(AVP)、AVP V1a受体、肾AVP V2受体、水通道蛋白-2(AXP2))和蛋白质分泌的变化(例如血浆心房肽(ANP)和尿环鸟苷酸(cGMP))。研究人员发现,用黄芪治疗改善了心脏和肾的功能,部分地纠正了AVP系统和AQP2的异常的mRNA表达,和改善了肾对ANP的反应。该研究没有解决使用收集的数据来指导开发新制剂或用于阐明制剂中各种草药之间的协同或其他相互作用、或出于质量控制的目的验证各种作用的力量差异的问题。
如上文中所述的相关科学文献显示,基于分子的技术尚没有用于研究和证实同时用多种化学物质诸如草药和TCM治疗或刺激的生物系统中的细胞和分子应答。而且,这些最新进展尚没有与其他技术和方法统一起来而得到一种用于系统研究草药和TCM的生物作用的方法。
发明概述本发明提供了用于生成、保持、改善和利用草药生物应答阵列(HBR阵列)的工具和方法学,其中HBR阵列构成了与特定草药组合物相联的数据集。本发明的HBR阵列可包括关于草药组分的与植物相关的参数信息、生物系统与草药组合物接触后收集的标志信息以及生物系统与草药组合物接触后收集的生物应答信息。
本发明提供了为建立特定草药组合物的标准化HBR阵列所需的工具和方法学,其中标准化HBR阵列用作基准,通过它来评估成批的类似或不同草药组合物。本发明还提供了更新和维持标准化HBR阵列所必需的工具和方法学。本发明的特定实施方案涉及迭代过程,由此将另外的草药组合物的批量数据、另外的与植物相关的数据、另外的标志信息、和/或另外的生物应答信息定期加入到标准化HBR阵列中。于是,本发明提供了在不断前进的基础上用于生成、保持、更新和使用HBR阵列的工具和方法学。
本发明提供了指导草药组合物的标准化所需的工具和方法学;以确定草药组合物的哪些具体成分引起了特定的生物活性;以预测草药组合物的生物活性;用于开发改进的草药治疗剂;用于调节或修饰草药组合物;用于测定不同草药组合物的关系;用于鉴别保留了所需生物活性的批量草药组合物中的特定分子;用于确定已知草药组合物的哪些草药成分可以从该已知草药组合物中去除但仍保持或改善了该已知草药组合物的所需生物活性;用于鉴别批量草药组合物的新用途和以前未知的生物活性;和用于使用批量草药组合物的预测生物活性来帮助设计包括草药成分和合成化学药物的治疗剂,包括使用组合化学的方法设计治疗剂。
更具体地说,本发明提供了建立草药组合物的标准化草药生物应答阵列(HBR阵列)的方法,其中该方法包括a)选出特征化的草药组合物;b)使生物系统与一批特征化的草药组合物接触并收集关于两种或多种标志的数据,其中标志之一是通过使用核酸微阵列确定的基因表达的变化,是通过下列步骤产生的i)生成一个细胞库系统;ii)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;iii)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;c)将步骤b)的标志数据储存起来作为标准化HBR阵列。
本发明还提供了这样一些方法,其进一步包括使生物系统与一批或多批草药组合物接触、收集关于一个或多个生物应答的数据和将所收集的生物应答数据加入到该草药组合物的标准化HBR阵列中。
本发明提供了评估草药组合物的方法,其中该方法包括使生物系统与一批草药组合物接触并收集关于两种或多种标志的数据;和将所收集的标志数据与标准化HBR阵列加以比较,选出与成批草药组合物中的组分相同或基本相同的草药组分。
本发明提供了用于预测草药组合物的生物活性的系统,它包括1).包含一种或多种不同类型的细胞、组织、器官或体外测定的生物系统;2).一批草药组合物;3).两种或多种分子标志;4).用于使生物系统与该批草药组合物接触并测量分子标志的不同应答的工具;5).一个计算机处理器,包括用于分析和储存分子标志的不同应答量度的存储器,以便生成该批草药组合物的草药生物应答阵列(HBR阵列)数据集;6).一个计算机处理器,包括用于对比该批草药组合物的HBR阵列和一个或多个先前储存的HBR阵列的存储器,以便预测该批草药组合物的生物活性,其中用于产生一个或多个先前储存的HBR阵列的草药组合物的生物活性是已知的。
附图的简要描述

图1。图1提供了用于构造任何选定的草药组合物的标准化草药生物应答阵列(HBR阵列)的基本方法步骤的图表。为了容易理解,该图显示的是其最基本的形式。如本文中所讨论的,该图中的每条途径都可迭代进行。而且,一个框中包含的任何信息都可用于指导有关采集任何其他框中信息的决定。以这种方式,在整个方案中也可能有很多反馈回路。
图2。图2提供了用于构造任何批量草药组合物的草药生物应答阵列(HBR阵列)和用于对比该批HBR阵列与选定的来自标准化HBR阵列的信息子集的基本方法步骤的图表。为了容易理解,该图显示的是其最基本的形式。如本文中所讨论的,该图中的每条途径都可迭代进行。而且,一个框中包含的任何信息都可用于指导有关采集任何其他框中信息的决定。以这种方式,在整个方案中也可能有很多反馈回路。
图3。图3提供了用于建立和使用主要数据集的基本方法步骤的图表。为了容易理解,该图显示的是其最基本的形式。如本文中所讨论的,该图中的每条途径都可迭代进行。而且,一个框中包含的任何信息都可用于指导有关采集任何其他框中信息的决定。以这种方式,在整个方案中也可能有很多反馈回路。
图4。各种草药组合物的蛋白质印迹。
A.没有草药组合物。
B.黄连汤A(HQT A)(0.2mg/ml)。
C.HQT A(4mg/ml)。
D.HQT B(0.2mg/ml)。
E.HQT B(4mg/ml)。
F.黄芩(0.2mg/ml)。
G.黄芩(4mg/ml)。
图5。芍药(Paeonie lactiflora pallus)的HPLC。
图6。大枣(Ziziphi fructus)的HPLC。
图7。图7提供了建立草药组合物的生物应答数据集的图解。该数据集是基于在哺乳动物的细胞培养物中用三种以上不同浓度的草药诱导的差别表达的基因。
图8。图8提供了建立草药或复方草药制剂的特征表达图形数据库或HBR阵列的图解。
图9。图9提供了鉴别未知草药组合物的图解。将由未知草药诱导的表达图形与表达图形数据库相对应,并利用统计学方法对数据库中存档的草药的可能一致性打分。
图10。图10提供了提取草药组合物或复方草药制剂的标记基因的图解。
图11。图11提供了提取草药或复方草药制剂中单个化学成分的标记基因的图解。
图12。用高和低浓度(分别用H和L指示)的三种类型的单一组分草药提取物(冬虫夏草菌丝体(CSM),ST024,ST117)处理的细胞的基因表达数据的聚簇显示。
(A)簇分析利用带有492种选定基因(参见正文)的程序“聚簇”进行(Eisen等,1999)。
(B)用ST117处理而上调但用其他草药提取物处理却下调的基因的放大图。指示了克隆ID和推定的基因名。
(C)簇算法将CSM、ST024和ST117分到3个不同的聚簇中。按照分级树状图的显示,各聚簇之间的距离可以看作是三种草药提取物处理过的细胞的表达图之间的差异。
图13。
(A)在选定的492种基因的基础上计算出的聚簇结果的假颜色编码的显示。(A)中的方框指示了上述三种基因聚簇的位置。
(B)被CSM下调但被其他物质上调的基因的放大图。
(C)被各种草药处理上调的基因。
(D)被CSM下调和被其他物质上调的基因。指示了IMAGE克隆ID和推定的基因名。
图14。用高和低浓度(分别指示为H和L)的2批多成分草药制剂黄芩汤(PHY906-303503(#11)和PHY906-284003(#12))处理的细胞的表达数据的聚簇显示。数据是在三个不同日期的三次重复实验基础上的平均值。簇分析在选定的500种基因(参见正文)的基础上进行。(B)簇算法将#11-L、#11H和(#12-H和#12-L)分到3个不同的聚簇中。聚簇间的距离或相似系数由分级聚簇树状图指示。
图15。利用三个独立的实验测量的(A)平均的和(B)单个的基因表达水平的放大图。方框1中包括在#11-L处理的细胞中被下调但在其他细胞中被上调的基因,方框2中包括被所有的草药处理上调的基因。方框3中包括对#11-L处理显示没有应答但被其他物质下调的基因。方框4中包括被低浓度的草药处理大大下调但在高浓度的草药处理下只显示轻微应答的基因。各基因旁指示了克隆ID和推定的基因名。
图16。用草药处理的细胞中的基因表达图形的分类。(A)用未经处理的对照细胞的表达数据正常化的数据集和(B)标准化为具有0均值和单位变数的数据集的分级聚簇。(C)用自组织图型算法得到的非分级聚簇的结果。
图17。用于在由草药诱导的基因表达图形的基础上对草药分类的候选种类预测物。该图中显示了带有它们的对差别#11和#12草药制剂的表达图形的50类预测物。各基因旁指示了IMAGE克隆ID和推定的基因名。
图18。由一批5种不同浓度的复方草药制剂诱导的基因表达图。(A)中显示了表达图形的6×4聚簇,(B)中显示了选定聚簇的基因表达图形的详细情况。
图19。图19说明了图18中的表达图形怎样归类到用于随后的汉明间距计算的三个不同组中。
图20。图20显示了对由5批复方草药制剂诱导的基因表达图形的分析结果。表中的数字是汉明间距。间距越小,表达图形越相似。
图21。(A)中显示的是5批复方草药制剂的HPLC分析中4种化学成分的综合最大强度的列表。将另外两种参数BG+B和BG/B加入到该表中,并在(B)中显示了6种参数的放射状图,以说明通过HPLC分析,与和其他各批的相似性比较,一批更类似于第2批#18。
图22。在Jurkat T细胞中,由复方草药制剂黄芩汤诱导的标记基因的显示。
图23。图23说明了鉴别由草药混合物中的单个化学成分诱导的标记基因的原理。标记基因是表达水平与草药中的化学成分的量相关且相关系数大于0.99或小于-0.99的那些基因。(A)显示了基因和甘草甜素之间的R值为0.998,(B)显示表达水平随着汉黄芩素的减少而增加的基因的R值为-0.997。
图24。Jurkat T细胞中,由复方草药制剂黄芩汤中的化学成分白花素诱导的标记基因。(A)显示了与白花素正相关的基因,(B)显示了与白花素负相关的基因。
图25。基因表达图形与对照组的相互关系。(A)是对照组的基因表达图,(B)是样品组的基因表达图。(C)显示了随草药处理浓度而变化的具有增加2倍以上的差别表达率的基因数。
图26。利用非分级分析程序分类归并的表达图形的聚簇,其中该程序是基于自组织图型(SOM)原理。X轴表示从低到高的草药浓度,Y轴是基因表达率。
图27。图27显示了在2批黄芩汤中常见的诱导和受抑基因。
图28。有关2批黄芩汤的SOM聚簇结果。(A)显示了有关2批黄芩汤的表达图形的SOM聚簇结果。(B)显示10种基因对这两批黄芩汤具有类似应答,(C)显示了当聚簇I和聚簇j变得更加不同时称量因子怎样减少。
图29。簇分析中成对草药制剂间的S得分的计算。(A)是分值的列表,(B)示范了5批类似的草药制剂的关联情况。
发明详述除非另有定义,否则本文中使用的所有科技术语都具有本发明所属领域内的普通技术人员通常理解的含义。虽然在实施或检验本发明中可以使用与本文中描述的那些类似或等价的任何方法和材料,但下面描述了优选的方法和材料。
发明概述如上所述,本发明涉及用于预测草药组合物的生物应答的工具和方法。更具体地说,本发明提供了生成草药生物应答阵列(HBR阵列)数据库的方法以及使用这类数据库来提高有效的以草药为基础的治疗剂的设计应用的方法。本发明的目标是对用于草药组合物的制备、测试和给药的HBR阵列的全面设计、生成、改善和使用,并用于指导开发新的草药组合物和现有采用组合物的新用途。
植物组学(Phytomics)。根据其使用的上下文,在本文中所用的“植物组学”是指使用生物信息学和统计学方法来解决草药组合物各成分的定性和定量问题,或者是指为解决这些问题而开发的实际数据库。
草药生物应答阵列。本文中所用的HBR阵列构成了与草药组合物有关的两个或多个观测或测量结果的数据集。HBR阵列可包括有关组合物中各植物的定性和定量数据(与植物有关的数据),生物系统与草药组合物接触后得到的标志信息包括剂量依赖性研究,和生物系统与草药组合物接触后得到的生物应答数据的数据库。任何特定HBR阵列中的数据都可在二维或三维空间中进行统计学分析。
HBR阵列可以指定为批量HBR阵列和标准化HBR阵列。批量HBR阵列是与具体某批草药组合物有关的数据的阵列。标准化HBR阵列是与标准化草药组合物有关的数据的阵列。
主数据集。本文中所用的术语“主数据集”是指用作基准数据集的数据集,其他各种数据集与它进行比较,或者用它分析是否为相同或不同的草药组合物。一般说来,主数据集使用生物工程技术建立,以确定草药组合物的某些遗传或蛋白质情况。因此,主数据集将通常但并不总是以基因组或蛋白组(proteomic)数据集为基础。例如,核酸微阵列结果可以是用于比较其他相关或次要数据集的主数据集。
次要或相关数据集。本文中所用的“次要数据集”或“相关数据集”指的是用于比较主数据集的一个或多个数据集。通常,但并不总是,次要数据集将由利用更传统的方法收集的草药组合物的信息组成。例如,次要或相关数据集可由利用更常规的方法得到的与植物有关的数据集合组成。与植物有关的数据的实例包括但不限于草药组合物中各草药的属/种,组合物中各草药的特定植物部分和草药所种植的地理位置。次要数据集的另一个例子可由用一种或多种不同量的草药组合物治疗后的细胞、组织、器官或生物体的一组生物应答组成。这种生物学数据或整个生物体的实例可包括但不限于细胞毒性研究,酶处理研究,生长速率,重量的增或减,运动技能的变化和心智能力的变化。
草药。从技术上来说,草药是小的、非木质(即肉质茎)的、一年生或多年生的种子植物,其中在空气中的所有部分在每个生长季末期死亡再复生。草药的价值在于它们的药用、风味可口或芳香特性。这个词的使用更为普遍,在本文中使用的这个词“草药”是指具有食物补充剂、医学、药物、治疗或强身用途的任何植物或植物部分。因此,本文中使用的草药不限于对草药的植物学定义,而是包括用于这类目的的任何植物性药材、植物或植物部分,包括后生植物王国的任何植物种或亚种的任何植物或植物部分,包括草、灌木、半灌木和乔木。用于草药组合物中的植物部分包括但不限于种子、叶、茎、小枝、分支、芽、花、鳞茎、球茎、块茎、根茎、长匐茎、根、果实、球果、浆果、形成层和树皮。
草药组合物。本文中所用的“草药组合物”指的是包括药草、草药植物或草药植物部分的任何组合物。因此,正如本文中所用的,草药组合物是任何草药制剂,包括草药食物补充剂、草药药品、草药和药用食品。草药组合物的实例包括但不限于以下组分单植物种的全植物或植物部分;多植物种的全植物或植物部分;从单植物种得到的多种成分;从多植物种得到的多种成分;或这些不同成分的任意组合。为了充分回顾各种草药组合物,参见例如Kee Chang Huang,中草药药理学,CRC Press(1993),其完整地结合在此作为参考。各种草药组合物的代表性实例见以下段落。
英国从十八世纪中期开始就已使用包括柳树皮的草药组合物来治疗热病。柳树皮中的活性成分是一种叫做水杨苷的苦味苷,它水解后得到葡萄糖和水杨醇。常统称为非类固醇性抗炎药(NSAID)的阿斯匹林(乙酰水杨酸)和阿斯匹林样药物(例如布洛芬)经常用于治疗疼痛、发热和炎症。绣线菊属植物是另一类含有水杨酸盐的草药。用柳树皮或绣线菊属植物治疗关节炎和关节炎样症状需要消耗由这些植物制成的大量草药茶剂。整个杨种植物(即杨属乔木和灌木)还含有水杨酸盐前体,杨树芽已用于抗炎、退热和镇痛药物治疗。
美国已批准了一些关于用于治疗各种疾病和处理影响人和动物的其他与健康相关的问题的草药组合物的专利。例如,美国专利No.5,417,979公开了一种组合物,它包含包括千金藤和甘草种属植物的草药以及它们的提取物的混合物,可用作食欲刺激剂并用于治疗疼痛。包括甘草(Glycyrrhiza uralensis)的草药组合物已发现可用于治疗皮肤湿疹、牛皮癣、瘙痒和炎症反应(美国专利No.5,466,452)。美国专利No.5,595,743公开了多种草药组合物,它包括甘草提取物(甘草属)和豨莶属、槐属、百部属和四雄蕊植物(tetrandra)草药,可用于治疗各种哺乳动物疾病,包括炎症和类风湿性关节炎。眼炎可以用含有植物生物碱汉防己甲素的药物组合物治疗(美国专利No.5,627,195)。
美国专利No.5,683,697公开了一种具有抗炎、退热、祛痰或止咳作用的药物组合物,其中该组合物包括来自楝属、Angepica、石斛属、凤仙花属、柑橘属、桑寄生属、青葙属、白前属和珊瑚菜属的各种植物部分。包括良姜(Alphinia)、菝葜、心叶青牛胆茎、刺蒺藜、睡茄和姜的根、根茎和/或植物的提取物的草药组合物已发现可减少或减轻与类风湿性关节炎、骨关节炎、反应性关节炎有关的症状和用于减少促炎细胞因子的产生(美国专利No.5,683,698)。
草药组合物可制成多种形式,包括胶囊、片剂或包衣片剂;颗粒剂;浸膏剂或酊剂;散剂;新鲜或干燥的植物或植物部分;特制茶剂;汁液;膏霜和软膏;挥发油;或制成这些形式的任意组合。草药可利用任何一种方法给药,包括口服、直肠、胃肠外、肠内、经皮、静脉内、经由饲管和局部途径。
本发明所包含的草药组合物包括还含有非草药成分的草药组合物。这类非草药成分的实例包括但不限于全虫和昆虫的某部分,蠕虫,动物或昆虫的粪便,天然油或石油,氨的碳酸盐,酒石酸盐,酒,水,甘油,类固醇,药物,维生素,营养液,乳清,盐和明胶。
关于口服给药,所公开的草药组合物可以采用例如片剂或胶囊剂的形式,利用常规方法与常用的赋形剂混合制备,所述赋形剂是诸如粘合剂(例如预凝胶化玉米淀粉、聚乙烯吡咯烷酮或羟丙基甲基纤维素);填充剂(例如乳糖、微晶纤维素或磷酸钙);润滑剂(例如硬脂酸镁、滑石或二氧化硅);崩解剂(例如马铃薯淀粉或淀粉羟乙酸钠);或润湿剂(例如月桂基硫酸钠);滑动剂;人工和天然调味剂和甜味剂;人工或天然着色剂和染料;以及加溶剂。草药组合物还可配制成以缓释方式释放活性成分,如本领域中公知的,和如美国专利Nos.4,690,825和5,055,300中所讨论的。片剂可以用本领域中熟知的方法包衣。
用于口服给药的液体制剂可以采用例如溶液、糖浆、悬浮液或浆液等形式(诸如Mulchandani等1992的美国专利No.5,108,767中描述的液体营养补充剂),或者它们可以制成干燥产物,使用前用水或其他适宜赋形剂重新构成。叶酸以及其他维生素和矿物质的液体制剂可以加入到专为ESRD病人设计的液体营养补充剂型中。这类液体制剂可以用常规方法制备,使用药学上可接受的添加剂诸如悬浮剂(例如山梨糖醇糖浆、甲基纤维素或氢化食用脂肪);乳化剂(例如卵磷脂或阿拉伯胶);非含水赋形剂(例如杏仁油、油性酯或乙醇);防腐剂(例如对羟基苯甲酸甲酯或丙酯或山梨酸);以及人工或天然着色剂和/或甜味剂。
关于局部给药,草药成分可以与构成可接受的载体、稀释剂或赋形剂的至少一种其他成分混合在一起而制成组合物,诸如最适于局部应用的膏霜、凝胶、固体、糊剂、油膏、粉末、洗剂、液体、气溶胶或类似形式。单独的无菌蒸馏水和简单的膏霜、油膏和凝胶基质可以用作草药成分的载体。也可以加入防腐剂和缓冲剂。该制剂可以用于无菌敷料、可生物降解的、可吸收的局部用贴片或敷料,或用于一开始快速释放、逐渐降至缓慢释放的缓释植入系统。
为了更全面地回顾和讨论以草药为基础的组合物,参见EarlMindell,Earl Mindel草药圣经,Simon & Schuster(1992);Culpeper草药大全,W.Foulsham & Co.,Ltd.(十七世纪中期首次出版);和Rodale草药图解百科全书,Rodale Press(1987)。
标准化草药组合物。本文中所用的“标准化草药组合物”或“特征化草药组合物”是指选定作为用于评估与标准化草药组合物的成分具有相同、相似或不同成分的批量草药组合物的标准草药组合物的特定草药组合物。有时在本文中也称作“主要草药组合物”。标准化草药组合物通常是已充分表征并在特定生物系统中显示所需生物应答的草药组合物。标准化草药组合物一般利用本领域技术人员熟知的化学试验加以标准化并适当地储存用于长期使用和参照。用标准化草药组合物在有关植物(即与植物相关的数据)、标志和生物应答的观测和测量结果的基础上建立标准化HBR阵列,以便描绘草药组合物的特性。
批量草药组合物。本文中所用的“批量草药组合物”是指用于在有关植物和标志的观测和测量结果的基础上建立HBR阵列以便描绘草药组合物的特性的任何测试草药组合物。有时在本文中也称作“测试”或“批量”草药组合物。可以包括或不包括生物应答的观测和测量数据。用于确定标准化草药组合物的那些草药组合物也可以称作“批量草药组合物”直到其被指定为“标准化草药组合物”为止。
批量。本文中所用的“批量”是指可以鉴别出具有一些特定属性的特定数量的草药组合物,以便将其与其他任何特定数量的相同草药组合物区别开。例如,一批草药组合物与另一批相同草药组合物的差别可能在于这两批草药组合物的收获时间不同或地理位置不同。将特定批次区别开的其他差异可包括但不限于以下这些1)所用的特定植物部分(例如在一批中用的是草药的根,而在不同的另一批中用的是相同草药的叶子);2)对单个草药或草药组合物在采集后的处理情况(例如一批可以用蒸馏水加工,而不同的另一批可以用氯化氢加工以模拟人胃中的酸度;和3)草药组合物中当草药的相对比例(例如一批的三种不同草药可以具有相等的重量份或体积份,而另一批中的一种草药具有比另两种草药更高的比例)。
生物系统。本文中所用的“生物系统”是指可以观察或测量生物应答的任何生物学实体。因此,生物系统包括但不限于任何细胞、组织、器官、全生物体或体外测定。
生物活性。本文中所用的草药的“生物活性”是指草药组合物所特有的对所给生物系统的特定生物学作用。
与植物有关的数据。本文中所用的“与植物有关的数据”是指所收集的关于草药组合物的数据,包括但不限于有关植物的数据,它们的生长条件以及采集过程中和采集后对植物的处理。与植物有关的数据还包括草药组合物中各组分的相对比例,其中各组分可以是不同的植物部分,不同的植物种,其他非植物成分(例如昆虫部分。化学药物)或这些变数的任意组合。
可以搜集的有关草药组合物的与植物相关的数据包括但不限于以下这些1)植物种属情况(以及可能时,特定的植物变种、栽培、克隆、家系等情况)和在组合物中所用的特定植物部分;2)草药的地理来源,包括经度/纬度和海拔;3)草药的生长条件,包括肥料类型和用量,降雨量和灌溉量和次数,每天所接受的平均微爱因斯坦,农药用法,包括除草剂、杀虫剂、杀螨药和杀真菌剂,以及耕种方法;4)用于加工草药的方法和条件,包括草药的年龄/成熟期,浸泡时间,干燥时间,提取方法和研磨方法;和5)草药组分和最终的草药组合物的储存方法和条件。
另外,标准化草药组合物可以进行化学分析。化学特性描述可以利用本领域技术人员公知的任何化学分析方法完成。可以采用的化学分析的实例包括但不限于HPLC、TLC、化学指纹法、质量分光光度计分析和气相色谱法。
细胞库系统。本文中所用的“细胞库系统”包括细胞的主细胞库(MCB)和工作细胞库(WCB)。使用细胞库系统可以将草药测试的细胞变异性减至最小,并可用于核酸微阵列研究中的所有细胞类型。
生物信息学。本文中所用的“生物信息学”指的是生物学方面的信息的使用和组织。除了别的以外,生物信息学还包括以下这些内容(1)数据的获得和分析;(2)数据库的发展;(3)综合与联系;和(4)对所得数据库作进一步分析。到二十世纪九十年代早期几乎所有生物信息学资源都被开发成公共域自由软件,且大多数仍可自由地从因特网上获得。有些公司已开发了专有数据库或分析软件。
基因组或基因组学。本文中所用的术语“基因组学”指的是对基因及其功能的研究。基因组学强调比较基因定位、分子克隆、大规模限制酶切作图以及DNA测序和计算分析中的基础和应用研究的综合。遗传信息使用基础技术诸如DNA测序、蛋白质测序和PCR加以提取。
基因功能(1)通过分析基因中DNA突变对细胞、组织、器官或生物体的正常发育和健康的作用来确定;(2)通过分析DNA序列中编码的各种信号来确定;和(3)通过研究利用基因或相关基因系统产生的蛋白质来确定。
蛋白组或蛋白组学(Proteomic或Proteomics)。本文中所用的术语“蛋白组学”也叫做“蛋白组研究”或“非增殖部”,指的是在规定条件下基因组的定量蛋白质表达模式。普遍使用的蛋白组学是指使用蛋白质生物化学的高流通量、自动分析方法。
除了进行基因组研究外,还必需进行蛋白组研究的原因有很多。首先,基因表达水平不必然表示细胞中活性蛋白质的量。其次,基因序列不描述蛋白质功能与活性所必需的翻译后修饰。再次,基因组本身不描述上下改变蛋白质浓度的动态细胞过程。
蛋白组程序寻求的是表征细胞中的所有蛋白质,鉴别分离蛋白质的至少部分氨基酸序列。一般而言,蛋白质首先使用2D凝胶或HPLC分离,然后使用高流通量质谱法对肽或蛋白质测序。使用计算机可以对质谱的输出加以分析,以便将基因和其编码的特定蛋白质联系起来。这整个过程有时称作“功能基因组学”。现在有许多商业风险提供蛋白组服务(例如Pharmaceutical ProteomicsTM,TheProteinChipTM系统,来自Ciphergen Biosystem;PerSeptiveBiosystems)。
有关蛋白组研究的一般信息,参见例如J.S.Fruton,1999,蛋白质、酶、基因化学与生物学的互相影响,Yale Univ.Pr.;Wilkins等,1997,蛋白组研究功能基因组学中的新边界(原理与实践),Springer Verlag;A.J.Link,1999,2-D蛋白组分析方案(分子生物学方法,112,Humana Pr.;Kamp等,1999,蛋白组和蛋白质分析,Springer Verlag。
信号转导。本文中所用的“信号转导”,也称作细胞信号转导,是指细胞通过它接受外部信号并在内部传递、放大和指导它们的途径。信号途径需要以分步方式传递信号的蛋白质的内部通信链。蛋白激酶常常参与这种反应级联,因为许多信号转导涉及接受细胞外化学信号,由此引发胞质蛋白的磷酸化作用而放大信号。
翻译后修饰。本文中所用的“翻译后修饰”是一个笼统的术语,它包括了蛋白质已作为初级多肽合成后所发生的各种改变。这类翻译后修饰包括但不限于糖基化,N末端甲硫氨酸(或N-甲酰基甲硫氨酸)的除去,信号肽的去除,乙酰化,甲酰化,氨基酸修饰,肽链内部裂解而释放出更小的蛋白质或肽,磷酸化和甲硫氨酸的修饰。
阵列或微阵列。本文中所用的“阵列”或“微阵列”是指一种网格系统,它具有由规定核酸片段占据的各个位置或探针细胞。阵列本身有时称作“晶片”、“生物晶片”、“DNA晶片”或“基因晶片”。高密度核酸微阵列常常有在各种各样的网格中的上千个探针细胞。
一旦制成了阵列,就加入从生物系统得到的DNA或蛋白质分子,且在DNA或蛋白质分子与阵列间发生某些形式的化学作用而产生一些该阵列和生物系统所特有的识别图型。放射性标记的批次的自体放射照相术是一种传统检测策略,但也可选择其他方法,包括荧光、比色法和电子信号转导。
标志。本文中所用的术语“标志”是指为与特定某批草药组合物接触的特定生物系统所特有的特定草药组合物的任何基于生物学的测量或观测结果。术语“标志”包括生物系统的定性和定量测量和观测结果。标志数据库构成了表征响应草药治疗的基因表达模式的数据集,其中这些模式显示了哪些基因响应特定草药组合物而兴奋、转变、上升或下降。因此,“标志”指的是任何基于生物学的测量或观测结果,其在生物系统中的表达水平的向上和向下或暂时调整、或定性或定量变化可用于表征生物系统对草药组合物的不同生物应答。
生物系统所接触的特定批次的草药组合物可以是未知的草药组合物、已知的草药组合物或标准化草药组合物。可用于完成本发明的标志的实例包括但不限于分子标志、细胞遗传标志、生化标志或大分子标志。大分子标志包括但不限于酶、多肽、肽、糖、抗体、DNA、RNA、蛋白质(翻译蛋白质和翻译后蛋白质)、核酸、多糖。
满足本文“标志”定义的任何标志都可适当地用于实施本发明。术语“标志”包括相关的可替代选择的术语,诸如“生物标志”或“遗传标志”或“基因标志”。为达到增加HBR阵列的区别力的目的,可能有一种或多种主要标志以及次要标志,或一套分级结构的标志。因此,选定的分子标志可以与各种其他分子、细胞遗传、生化或大分子标志结合,以得到甚至更精确、扩大的HBR阵列。
分子标志包含来自一类或多类分子化合物的一种或多种微观分子,诸如DNA、RNA、cDNA、核酸片段、蛋白质、蛋白质片段、脂质、脂肪酸、糖类和糖蛋白。
适宜分子标志的建立、产生和使用是本领域技术人员熟知的。特别有用的表征分子标志的技术的实例包括差别显示、逆转录酶聚合酶链式反应(RT-PCR)、表达的序列标记物(EST)的大规模测序、基因表达的系列分析(SAGE)、蛋白质的蛋白质免疫印迹或2D、3D研究、以及微阵列技术。分子标志技术领域的技术人员熟悉这些技术的方法和应用(参见,例如Bernard R.Glick和Jack J.Pasternak,重组DNA的分子生物技术、原理与应用,第二版,ASM Press(1998);MathewR.Walker和Ralph Rapley,基因技术中的路线图,BlackwellScience(1997);Roe等,DNA的分离与测序,John Wiley & Sons(1996);James D.Watson等,重组DNA,第二版,ScientificAmerican Books(1992))。
DNA、RNA和蛋白质的分离与测序方法是本领域技术人员熟知的。这类公知技术的实例可以见分子克隆实验室指南,第二版,Sambrook等,Cold Spring Harbor,N.Y.(1989);Hanspeter Saluz和J.P.Jost,基因组测序的实验室指南天然非克隆DNA的同向测序(生物方法第1卷),Birkhauser(1988);和B.Roe等,DNA的分离和测序,Wiley(1996)。常规分子生物学技术的实例包括但不限于体外连接,限制内切酶消化,PCR,细胞转化,杂交,电泳,DNA测序,细胞培养,等等。可从商业上购得的用于本发明的特定试剂盒和工具包括但不限于用于RNA分离、PCR cDNA文库构建、逆转录病毒表达文库、载体、基因表达分析、蛋白质抗体纯化、细胞毒性测定、蛋白质表达和纯化以及高流通量质粒纯化的那些(参见,例如CLONTECHniques产品目录,XIII(3),1-32(1998)或www.clontech.com;AtlasTMcDNA表达测定产品目录(1998);SIGMA_产品目录(1997))。
有关寡核苷酸阵列、微阵列、DNA晶片或生物晶片的讨论、方法学和应用,参见例如美国专利5,445,934、5,605,662、5,631,134、5,736,257、5,741,644、5,744,305、5,795,714;Schena等,人基因组平行分析对1000个基因的基于微阵列的表达监测,美国国家科学院院报93,10614-10619(1996);DeRisi等,研究在基因组规模上对基因表达的代谢和遗传控制,科学278,680-686(1997);Wodicka等,酿酒酵母中基因组范围的表达监测,自然生物技术15,1359-1367(1997);Pardee,完全基因组表达监测人种,自然生物技术15,1343-1344(1997);Schafer等,DNA变异与人类遗传学的未来,自然生物技术16,33-39(1998);DeRisi等,使用cDNA微阵列分析人类癌症中基因表达模式,自然遗传学14,457-460(1996);Heller等,使用cDNA微阵列发现和分析与炎性疾病有关的基因,美国国家科学院院报94,2150-2155(1997);Marshall等,DNA晶片可能性的阵列,自然生物技术16,27-31(1998);Schena等,微阵列用于功能基因组学的生物技术的发现平台,Tibtech16,301-306(1998);Ramsay,DNA晶片最新技术,自然生物技术16,40-44(1998);Chee等,用高密度DNA阵列获得遗传信息,科学274,610-614(1996);和Chen等,利用带有比色法检测的cDNA微阵列系统描绘表达图型和分离不同表达的基因,基因组学50,1-12(1998);P.AndrewOutinen等,高半胱氨酸的应力诱导的作用的特性描绘,生物化学杂志332,213-221(1998);和Gelbert等,遗传学将真正变革药物发现过程,生物技术流行观点8(6),669-674(1997)。
适用于本发明的其他更具体的参考文献包括但不限于针对表达技术的那些,诸如EST(参见,例如Michael R.Fannon,正常和疾病状态下的基因表达-治疗目标的鉴别,TIBTECH14,294-298(1996));蛋白质图的产生(参见,例如Robinson等,前列腺癌的酪氨酸激酶图,美国国家科学院院报93,5958-5962(1996));用于草药组合物成分鉴定的化学和光谱学方法(Kojima等,墨西哥丁香的皂甙,植物化学48(5),885-888(1998));功能抗原的测定(参见,例如Aris Persidis,功能抗原,自然生物技术16,305-307(1998));HPLC(参见,例如Milton T.W.Hearn(编辑),蛋白质、肽和多核苷酸的HPLC现代话题与应用(临化化学分析技术与实验室指南),VCH Pub.(1991);电泳(参见,例如Westermeier等,电泳实践DNA和蛋白质分离的方法与应用指南,John Wiley &Sons(1997));和交叉反应性标志测定(参见,例如Irving Millman等,土拨鼠肝炎病毒实验感染与自然发生,肝脏学4(5)817-823(1984))。解决完全基因组中被编码的所有蛋白质的结构问题的结构基因组学的使用,其中方法包括高流通量同向结构测定和计算方法,由Terry Gaasterland在结构基因组学驾驶员座位中的生物信息学,自然生物技术16,625-627中作了论述。关于生物信息学方法,参见,例如Andreas Baxevanis(编辑),生物信息学基因和蛋白质分析实践指南,John Wiley & Sons(1998)和Luke Alphey,DNA测序从实验方法到生物信息学(生物技术介绍丛书),SpringerVerlag(1997)。
细胞遗传学参数包括但不限于染色质组型分析(例如,相对染色体长度,着丝点位置,有没有次生狭窄),表意文字(例如,有机体染色质组型的图解表示),有丝分裂和减数分裂期间的染色体行为,染色体染色和带型,DNA-蛋白质相互作用(也称作核酸酶保护测定),中子散射研究,滚环(A.M.Diegelman和E.T.Kool,核酸研究26(13)3235-3241(1998);Backert等,分子细胞生物学16(11)6285-6294(1996);Skaliter等,病毒学杂志70(2)1132-1136(1996);A.Fire和S.Q.Xu,美国国家科学院院报92(10)4641-4645(1995)),和用放射性标记的核糖核苷酸培养后整个核的放射自显影。
生化参数包括但不限于具体路径分析,诸如信号转导,蛋白质合成和转运,RNA转录,胆固醇合成与降解,糖生成以及糖酵解。
指纹法。本文中所用的术语“指纹法”是指为了鉴别物质、特别是草药而制作它的特征图形的方法。本文中所用的术语“指纹”指的是指纹法所采用的特定方法的结果显示。
各种类型的指纹法的实例包括但不限于DNA指纹法、蛋白质指纹法、化学指纹法和足迹法。
DNA指纹法,或图,是指从特定生物学来源(例如特定植物、植物种、植物属、植物部分或植物组织)的DNA制作独特的图型的方式。DNA指纹,或图,可以用于将该特定生物学来源与不同的生物学来源区别开来。使用微阵列、寡核苷酸阵列、DNA晶片或生物晶片分析某批草药所得到的图型也称作“指纹”。
蛋白质指纹法是指产生细胞、组织、器官或生物体诸如植物中的蛋白质的图型,这提供了该细胞、组织、器官或生物体在那时的完全特有的“指纹”。
化学指纹法是指对细胞中低分子量化学物质的分析,所得图型用于鉴别细胞、组织、器官或生物体,诸如植物。分析通常使用气相色谱法(GC)、HPLC或质谱法进行。
足迹法指的是找到两种分子怎样粘着在一起的方法。在DNA的情况下,蛋白质与DNA的标记部分结合,然后该DNA利用酶或化学刺激使分解。该方法产生了各种大小的片段的“梯”。DNA被结合蛋白保护时,它降解得少,于是“梯”显得较模糊。足迹法是针对调节基因活性的蛋白质真正结合DNA时的一种常用技术。
本文中的其他地方详细地描述了用于完成各种类型的指纹法的方式,或方法。
生物应答。本文中所用的“生物应答”是指生物系统与草药组合物接触后的生物应答的任何观测或测量结果。有时在本文中也称作“生物作用”。生物应答是特定草药组合物的生物活性的定性或定量数据点。生物应答数据包括剂量信息和暂时信息,其中这类信息是测量生物系统对各种处理的应答领域中的技术人员熟知的。因此,生物应答数据包括有关特定生物系统对以特定方式给药特定时间的特定剂量的草药组合物的特定生物应答的信息。
生物应答包括但不限于生理学应答、形态学应答、认知应答、激发性应答、自主应答和翻译后修饰,诸如信号转导测量。许多草药组合物显示了不止一种生物应答(参见例如Kee Chang Huang,中草药药理学,CRC Press(1993))。有些特定生物应答可能包含在不止一个所描绘的组中,或者具有包括不止一个组的应答的多个方面或组分。适用于本发明的生物应答是本领域技术人员熟知的。以下参考文献是该领域中技术状况的代表Kee Chang Huang,中草药药理学,CRC Press(1993);Earl Mindell,Earl Mindell草药圣经,Simon& Schuster(1992);Goodman & Gilman’s治疗学的药理学基础,第九版,Joel G.Hardman等(编),McGraw Hill,卫生职业处(1996);P.J.Bentley,药理学基础,药物作用入门,Cambridge UniversityPress(1981);P.T.Marshall和G.M.Hughes,哺乳动物与其他脊椎动物的生理学,第二版,Cambridge University Press(1980);委员会关于传染病的报告,American Academy of Pediatrics(1991);Knut Schmidt-Nielsen,动物生理学适应与环境,第五版,Cambridge University Press(1997);Elain N.Marieb,人类解剖生理学,Addison-Wessley Pub.Co.(1997);William F.Ganong,医学生理学评论(第18版),Appleton & Lange(1997);Arthur C.Guyton and John E.Hall,医学生理学课本,W.B.Saunders Co.(1995)。
“生理学应答”是指与生物系统的生理学、或功能有关的任何特征。细胞、组织或器官水平上的生理学应答包括但不限于温度、血流速度、脉搏率、氧浓度、生物电势、pH值、胆固醇浓度、感染状况(例如病毒、细菌)和离子通量。整个生物体基础上的生理学应答包括胃肠功能(例如溃疡、肚子痛、消化不良、胃灼热)、生殖道功能(例如基于生理学的阳痿、子宫痉挛、痛经)、排泄功能(例如泌尿道问题、肾病、腹泻、便秘)、血液循环(例如高血压、心脏病)、氧消耗量、骨胳健康情况(例如骨质疏松)、软骨和结缔组织病况(例如关节痛和炎症)、运动、视力(例如近视、失明)、肌肉紧张(例如消耗综合征、肌肉劳损)、有没有疼痛、表皮和皮肤健康状况(例如皮肤刺激、瘙痒、皮肤创伤)、内分泌系统的功能、心功能、神经协调、与头有关的健康状况(例如头痛、头晕)、年龄(例如生命跨度、寿命)和呼吸(例如充血、呼吸疾病)。
“形态学应答”是指涉及生物系统与草药组合物接触后的形态学、或形式和结构的任何特征。不管生物系统的类型如何,形态学应答包括但不限于大小、重量、高度、宽度、颜色、炎症程度、一般性外观表现(例如不透明性、透明性、淡薄)、湿润或干燥程度、有没有癌生长、以及有没有寄生虫或瘟疫(例如鼠、虱、跳蚤)。整个生物体基础上的形态学应答包括但不限于毛发生长的量和位置(例如多毛症、秃发)、有没有皱纹、指甲和皮肤生长的类型与程度、印迹凝固的程度、有没有溃疡或伤口、以及有没有痔疮。
“认知应答”是指与生物系统接触草药组合物后的认知或精神状态有关的任何特征。认知应答包括但不限于理解、识别、构思、判断、记忆、推理和想像。
“激发性应答”是指与生物系统接触草药组合物的促动或诱导作用有关的任何特征。激发性应答包括但不限于情绪(例如高兴)、欲望、需要学习的动力、特定生理学需要(例如食欲、性欲)或起行为刺激剂作用的类似冲动(例如精力、性冲动)。
“自主应答”是指与生物系统接触草药组合物后的自主应答有关的任何特征。自主应答涉及生物系统的自主神经系统。自主应答的实例包括但不限于不随意功能(例如神经过敏、恐慌发作),或生理学需要(例如呼吸、心律、激素释放、免疫应答、失眠、发作性睡眠)。
用各种草药组合物或草药成分治疗的细胞、组织、器官和整个生物体的生物应答是草药领域中众所周知的。例如,草药组合物Sairei-to(TJ-114)、泽泻(日本名为“Takusha”)和茯苓(日本名为“Bukuryou”)各自发现能抑制大鼠体内内皮肽-1的合成与表达(Hattori等,Sairei-to可抑制内皮肽-1在肾小球中的合成,日本心脏学会志39(2),121-128(1997))。白介素(IL)-1α的产生通过用草药小柴胡汤处理培养的人表皮角质细胞而得以显著促进(Matsumoto等,小柴胡汤对培养的人角质细胞的白介素-1α介导的自泌生长的增强,日本药理学杂志73(4),333-336(1997)。向从健康志愿者得到的外周血单核细胞的培养物中加入小柴胡汤导致粒细胞集落刺激因子(G-CSF)的产生出现剂量依赖性的增加(Yamashiki等,草药“小柴胡汤”在体外诱导外周血单核细胞中粒细胞集落刺激因子产生,临床实验免疫学杂志37(2),83-90(1992))。这些研究人员得出结论给药小柴胡汤可用于治疗慢性肝病、恶性疾病和其中G-CSF有效的急性传染病。用从中药黄芪(Astragalus membranaceus)纯化得到的黄芪皂甙IV(AS-IV)处理人脐静脉内皮细胞(HUVEC)后,减少了I型纤溶酶原活化剂抑制剂(PAI-1)特异性mRNA的表达,并增加了组织型纤溶酶原活化剂(t-PA)特异性mRNA(Zhang等,培养的人脐静脉内皮细胞的纤维蛋白分解潜力的调节黄芪皂甙IV向下调节纤溶酶原活化剂抑制剂-1并向上调节组织型纤溶酶原活化剂的表达,血管研究杂志34(4)273-280(1997))。从人参(Panax ginseng)的根分离出的四种成分中的一种成分据发现是由人单核细胞和THP-1细胞生成的IL-8的强诱导剂,这种诱导伴随有增加的IL-8 mRNA的表达(Sonoda等,从人参的根得到的酸性多糖对白介素-8产生的刺激,免疫药理学38287-294(1998))。利用流动血细胞计数分析,Fcγ 11/111受体和巨噬细胞上的补体受体3(CR3)的表达据发现通过用Kampo-草药当归芍药散(Toki-shakuyakusan)(TSS)处理而增加(Cyong,来自kampo-草药的新BRM,日本药理学杂志110(增刊1)87P-92P(1997))。使用计算机图像分析,Chen等(MRI/lpr小鼠体内细胞间粘着分子-1表达的图像分析中草药的作用,中华医学杂志75(4),204-206(1995))发现,用中药stragalin处理后,MRL/lpr小鼠体内细胞间粘着分子-1(ICAM-1)、免疫球蛋白和C3的分布强度显著减小。蛋白质印迹分析显示从天然中药分离得到的汉防己甲素可抑制大鼠肺泡巨噬细胞中信号诱导的NF-κB的活化(Chen等,汉防己甲素抑制大鼠肺泡巨噬细胞中信号诱导的NF-κB的活化,生物化学与生物物理学研究通讯231(1)99-102(1997))。
算法。本文中所用的“算法”是指分步解决问题的步骤,尤其是步骤数有限的确定的递归计算步骤。对与植物有关的标志和生物应答数据集的二维和三维分析的适宜算法是计算领域内的技术人员熟知的。这些算法在构建本发明的草药生物应答阵列中是有用的。关于算法的一般信息参见例如Jerrod H.Zar,生物统计学分析,第二版,Prentice Hall(1984);Robert A.Schowengerdt,远程测定中的影像加工和分类技术,Academic Press(1983);Steven Gold等,2D和3D点匹配的新算法姿态估计与对应,图型识别31(8)1019-1031(1998);Berc Rustem,用于非线性编程与多目标判定的算法,Wiley-Interscience Series in Systems and Optimization,JohnWiley & Sons(1998);Jeffrey H.Kingston,算法与数据结构设计、正确性、分析、国际计算机科学丛书,Addison-Wesley Pub.Co.(1997);Steven S.Skiena,算法设计指南,Springer Verlag(1997);和Marcel F.Neuts,算法概率问题的收集(随机建模),Chapman & Hall(1995)。关于将算法用于基于遗传的数据的更具体的信息参见例如Dan Gusfield,关于附带条件、树和序列的算法电子计算机科学与计算生物学,Cambridge University Press(1997);Melanie Mitchell,遗传算法简介(复杂适应系统),MITPress(1996);David E.Goldberg,研究、优化和机器学习中的遗传学算法,Addison-Wessley Pub.Co.(1989);ZbigniewMichalewicz,遗传学算法+数据结构=进化程序,SpringerVerlag(1996);Andre G.Uitterlinden和Jan Vijg,二维DNA分型平行基因组分析方法,Ellis Horwood分子生物学丛书,EllisHorwood Ltd.(1994);和Pierre Baldi和Soren Brunak,生物信息学机器学习方法(适应计算和机器学习),MIT Press(1998)。
组合化学。本文中所用的“组合化学”是指用于创造数百或数千个化合物的许多技术,其中每个化合物有一个或多个特征彼此不同,诸如它们的形状、电荷和/或疏水特性。组合化学可以用于产生草药或草药成分的化学变种化合物。这些化合物可以用本发明的方法加以评估。
基本组合化学概念是化学领域中的普通技术人员熟知的,也可见于Nicholas K.Terrett,组合化学(牛津化学,硕士),Oxford Univ.Press(1998);Anthony W.Czarnik和Sheila Hobbs Dewitt(Editors),组合化学实践指南,Amer.Chemical society(1997);Stephen R.Wilson(编辑)和Anthony W.Czarnik(投搞人),组合化学合成与应用,John Wiley & Sons(1997);Eric M.Gordon和James F.Kerwin(编辑),药物发现中的组合化学与分子多样性,Wiley-Liss(1998);Shmuel Cabilly(编辑),组合肽文库方案(分子生物学方法),Human Press(1997);John P.Devlin,高流通量筛选,Marcel Dekker(1998);Larry Gold和Joseph Alper,通过组合物化学与基因组学并驾齐驱,自然生物技术15,297(1997);Aris Persidis,组合化学,自然生物技术16,691-693(1998)。
实施例实施例1.建立选定草药组合物的标准化HBR阵列图1中给出了建立标准化HBR阵列的基本方案。图表中各部分的定义如上所述。
选择了感兴趣的草药组合物后,收集与草药组合物有关的各种特征的数据,包括但不限于与植物有关的特征和标志与生物应答信息。
与植物有关的数据包括但不限于植物种、特定植物部分、草药组合物中植物的地理来源、植物的生长条件、用于制备草药成分的加工方法、储存方法和条件、以及对草药组合物的各种化学分析。标志信息包括生物系统与草药组合物接触后收集的标志的定性和定量数据。适宜的标志包括但不限于分子标志、细胞遗传标志、生化标志和大分子标志。生物应答信息包括生物系统与草药组合物接触后收集的生物应答的定性和定量数据。
使用一种或多种测定法可以得到相同、类似、基本类似或不同批次的感兴趣的草药组合物的各种类型的数据(例如化学、标志、生物应答数据)。这些不同的测定可以同时或不同时进行。另外,可以同时或不同时收集相同或不同标志的数据。与此类似,可以同时或不同时收集相同或不同生物应答的生物应答数据。因此,HBR阵列的数据的收集可以是同时收集的,也可以是逐渐收集的。当生物系统与草药组合物接触以便收集数据时,记录有关草药组合物的给药剂量以及处理次数的信息。生物应答数据还可由翻译后修饰组成,诸如信号转导的测量。
收集了两种或多种类型的数据后(例如,有关两种或多种标志和生物应答的数据;有关与植物相关的特征的数据和生物应答数据),使用算法分析数据以便制作2-和/或3-维草药生物应答阵列。
计算HBR阵列的各种统计学参数并可成为HBR阵列数据集的一部分。这些统计学参数可包括但不限于均值、标准偏差、相关或匹配(或不匹配)矩阵、比率、回归系数和转换值(例如原始数据的反正弦百分比变换)。于是,HBR阵列可以由原始数据以及某些计算结果、分布、图解表示和与原始数据有关的其他数据处理结果组成。这类信息的特定实例包括但不限于数字影像、散射图、簇分析和标志数据的大规模基因表达图。
所积累的所有数据和所得分析结果构成了用于建立HBR阵列数据集的特定草药组合物的标准化HBR阵列。由于用于建立和保持草药组合物的HBR阵列的方法的反复特性,使得这类阵列可以视为在任何一个时间点是静止的,或者是随时间而动态变化的。
所得分析结果可以鉴别与任何特定草药组合物的一个或多个特定生物活性相关(正或负相关)或相联系(即显示总的趋势)的标准化HBR阵列的子集。
实施例2.建立批量草药组合物的批量HBR阵列图2中给出了建立一批草药组合物的HBR阵列的基本方案。图表中各部分的定义如上所述。建立这种阵列的步骤与上文中刚刚述及的建立标准化HBR阵列的步骤相同。
通常,所收集的用于批量HBR阵列的数据的量将小于所收集的用于建立标准化HBR阵列的数据量。不过,所收集的批量草药组合物的数据可以加入到确定的HBR阵列中或者用于建立新的标准化HBR阵列。
一般说来,所收集的批量草药组合物的数据只是据发现与所测试的草药组合物的所需生物活性高度相关或相联的数据。例如,如果(根据上文中所讨论的标准化HBR阵列数据和分析)已确定与植物有关的数据和标志数据的特定子集与特定草药组合物的所需生物活性高度相关的话,就只需要测试该批草药组合物的该特征子集即可,以确定该批草药是否具有所需生物活性。通过对比从某批草药组合物得到的该特征子集的数据(即批量HBR阵列)与该特定草药组合物的标准化HBR阵列,本领域技术人员可以确定该批特定草药组合物是否具有所需生物活性。
实施例3.建立和使用主数据集图3中给出了建立和使用草药组合物的主数据集的基本方案。图表中各部分的定义如上所述。
第一步是建立选定的草药组合物或批量草药组合物的主数据集。这通过使生物系统与草药组合物接触并收集将构成主数据集的所得标志信息而完成。在大多数但不是所有情况下,主数据集将由阵列形式的基因组和/或蛋白组数据构成,诸如用DNA生物晶片得到的阵列。
接着,对主数据集进行分析,看是否已得到了所测试草药组合物的不同的表达/结果。不同的表达/结果是必需的,以在下一个步骤中产生有意义的算法。这类不同的表达/结果的实例包括但不限于其中某些基因为响应与草药组合物的接触而被上调或下调或者某些蛋白质的浓度为响应这种接触而增加或减少的适应症。
若没有获得有意义或有用的不同表达/结果,则需要重复接触和标志收集步骤。若据信第一次是由实验误差导致了缺乏足够的结果,则可以用与第一次相同的所有变量(例如相同的生物系统、相同的标志集、相同的实验方案等)来重复接触/数据收集步骤。但是,有可能需要改变生物系统的取样(例如所利用的细胞的类型、细胞生长阶段)、使用不同的标志集和/或改变实验方案以便得到不同的表达/结果。
实施例4.使用HBR阵列信息本文中所讨论的HBR阵列信息可以用于许多不同目的,包括但不限于以下这些1)评估草药组合物的成分;2)预测草药组合物的生物应答;3)确定哪个标志信息是与草药组合物的特定生物应答最高度相关的;3)确定什么信息数据集(即与植物有关的数据、标志数据和生物应答数据)是与草药组合物的特定生物应答最相关的;4)确定哪种类型的生物系统最适用于评估草药组合物的生物活性;5)调节或改变草药组合物的成分,使该草药组合物的HBR阵列与相同或基本相同的草药组合物的标准化HBR阵列相一致;6)调节或改变草药组合物的成分,使该草药组合物具有所需的生物活性;7)测定不同草药组合物的关系;8)生成和更新标准化HBR阵列;9)鉴别保持草药组合物的所需生物活性的具体成分(例如植物部分、蛋白质、分子);10)确定可以将草药组合物的哪些成分消除但同时仍保持或改善了草药组合物的所需生物活性;11)鉴定草药组合物的一种或多种先前未知的生物活性;12)帮助设计包括草药和非草药成分如化学合成药物或药剂的治疗剂,和13)利用HBR阵列信息来补充设计治疗剂的组合化学方法。本发明的这些实施方案中的每一个都可以由适当领域内的技术人员用本文中提供的方法和工具完成。
实施例5.质量控制使用本发明的HBR阵列技术来使得或确定具体某批草药组合物(单一草药或多种草药的配方)与相同或基本类似的某批标准化或主要草药组合物实质等价。该方法中所用的HBR阵列包括每种生物作用(即生物应答)的数量差异的可接受的范围,以及由赋予每种生物作用的称量值组成的可能的综合得分,所述生物作用可由从生物系统的多个生化途径得到的标志组成。
“数据迷你化”是指用于确定或选择在任何特定HBR阵列中哪个生物作用子集是所需最小数目的生物作用的方法。用于数据迷你化的信息是通过使生物系统(例如细胞系)以剂量依赖性方式与标准化草药组合物接触来建立标准化HBR阵列而得到的。这种标准化HBR阵列然后可以与建立的测试草药组合物的各种HBR阵列进行比较。这些测试草药组合物包括但不限于在不同日期制备的不同批次;用在不同时间收集的原药材制备的不同批次;以及用在不同地点收集的原药材制备的不同批次。
实施例6.改善草药组合物或鉴定草药组合物的新用途使生物系统与配方中单个草药的提取物接触或者与整个配方的提取物接触,并检验提取物的生物作用,从而生成HBR阵列。观察到的生物作用可以来自生物系统的多个生化途径和/或来自动物的多个组织,其中对各种标志相应的定性和/或定量变化加以评估。所得HBR阵列可以与从不同草药组合物或用不同方法制备的草药组合物得到的新的HBR阵列或类似HBR阵列比较。该步骤可用于选出给定的一组生物作用和要预测给定的某批草药组合物具有给定的该组生物作用所需的最小数量的标志。
为了构建HBR阵列,本领域技术人员利用了各种数据迷你化工具,包括但不限于统计学分析、人工智能和对神经活动的数据库研究。所选择的统计学方法包括但不限于基本探索性数据分析(EDA)、图形EDA(诸如管衬)和多元探查技术(例如簇分析、识别因素分析、非线性回归上的阶梯线型、分类树)(参见例如STATISTICATM软件包,来自StatSoft,Tulsa,OK 74104;Tel918-749-1119;Fax918-749-2217;www.statsoft.com)。
在构建HBR阵列的研究中使用数据迷你化工具来探查大量HBR阵列数据和各种HBR阵列其中、之间或当中的一致图形。步骤包括探查、构建HBR阵列以及证实。该步骤一般进行迭代重复,直到鉴别了稳健HBR阵列或标准化HBR阵列。
实施例7.建立人参配方的标准化HBR阵列为进行该实施例,选择的标准人参是在东北或韩国生长的PanaxGinseng C.A.Meyer G115。生长的气候是-10-+10℃,年降雨量50-100cm(参见Huang,中药药理学(1993)pp21-45,CRC Press,BocaRaton,FL,完整结合在此作为参考)。对人参批次将首先确定以下特征地理来源、种类、植物部分(例如根茎、根、叶片、种子、芽和花);生长条件,加工方法和加工前后的储存条件。对这些批次的化学内容的检验将通过测定人参皂甙(例如Ro,Ra1,Ra2,Rb1,Rb2,Rb3,Rc,Rg1,Rg2,Rd,Re,Rf,Rh1,Rh2,NG-R2和Z-R1)的定性HPLC分析进行,包括对亲脂性成分的TLC定性分析(参见Elkin等,中国药理学报(1993)1497-100和Yoshikawa等,药学杂志(1993)113460-467)。根据不同的种类,不同草药的皂甙含量应当在2.1和20.6%(重量)之间(参见表1)。然后将这些数据优选存储在计算机处理器的存储器中,用于进一步处理。
表1.不同人参的皂甙含量*
标准人参(即G115)的表达生物标志包括以下这些IL-8、IL-2、GM-CSF、NfκB、ICAM-1、干扰素γ、胆碱乙酰转移酶、、trk A、神经生长因子(Kim等,植物医学(1998)64110-115;Sonoda等,免疫药理学(1998)38287-294;Baum等,欧洲应用生理学杂志(1997)76165-169;Iwangawa等,自由基生物医学(1998)241256-1268;Rhind等,欧洲应用生理学杂志(1996)74348-360)。另一方面,对于更广的批次大小,可使用400,000寡核苷酸组/1.6cm2Affymetrix晶片(美国专利No.5,556,752)。标准人参的表达生物标志将用光刻法、机械微斑点试验或喷墨应用程序通过核酸微阵列技术制备(参见Schena等,TIBTECH(1998)16301-306)。选定的几组细胞将在不同条件下与标准人参接触不同时间以生成多个微阵列集。这些微阵列集然后将通过对生化提取物的基于杂交的表达监控经由来自微阵列上的各个位置的荧光强度的稳态mRNA浓度的减除来进行分析(Schena等,科学(1995)270467-470;Schena等,美国国家科学院院报(1996)9310614-10619;Lockhart等,自然生物技术(1996)141675-1680;DeRisi等,自然遗传学(1996)14457-460;Heller等,美国国家科学院院报(1997)942150-2155)。然后将阵列数据集输入到算法中产生标准人参的表达生物标志统计值。标准人参的生化生物标志包括对与蛋白质合成按比例加入的放线菌酮敏感性[3H]-亮氨酸和有丝分裂的[3H]-胸苷结合反射的增加的定量分析。(参见Yamamoto等,Arzneimittelforschung(1977)271169-1173)。对于生化生物标志,将使骨髓细胞与标准人参在[3H]-胸苷的存在下(对于DNA合成)或在放线菌酮和[3H]-亮氨酸的存在和不存在下(对于蛋白质合成)在不同条件下接触不同时间,以进行对生化生物标志(即BBM集)的多个定量分析。然后将BBM集输入到算法中产生标准人参的生化生物标志统计值。然后将统计数据优选存储在计算机处理器的存储器中用于进一步操作。
生物系统的生物应答(即生物应答)将用细胞和完整动物测定。对于细胞,使人参批次在0.5mg/ml至100mg/m1的浓度下与特定细胞类型接触,所述细胞类型包括但不限于成纤维细胞、巨噬细胞、单核细胞、PMNL、LAK细胞、B16-F10黑瘤细胞、THP-1细胞和海马神经元。对于动物处理,将0.5-100mg/kg的人参提取物对动物口服给药、通过腹膜内注射或皮下注射给药。
为了测定生物系统对标准化人参的生物应答,将人卵巢癌细胞接种到裸鼠体内,使得形成可触知的肿瘤。肿瘤形成后,小鼠同时给药顺式二氯·二氨合铂和标准人参进行治疗。检验小鼠的肿瘤生长抑制、存活时间的增加以及降低的有关血细胞比容值和体重的副作用等情况(Nakata等,日本癌症研究杂志(1998)89733-740)。用各种浓度的标准人参重复进行测定,生成各变量的集中趋势、分散和变异性的测量结果。
然后对收集的数据进行多维分析,以产生多变体正常分布集,作为测定生物活性与标准人参之间的相互关系基准的方式(参见Zar,J.H,载于生物统计分析,第二版(1984),328-360页,Prentice Hall,Englewood Cliffs,NJ)。生物系统对标准人参的生物应答的第二次独立测定将是标准人参对运动期间生理表现的作用。大鼠用不同浓度的标准人参处理4天(0.5-100mg/kg/天),检验动物的增加的血浆游离脂肪酸浓度和在大约70% VO2max下运动期间葡萄糖浓度的维持(参见Wang等,植物医学(1998)64130-133)。收集所产生的数据,然后进行多维分析以产生多变体正常分布集,作为测定生物活性与标准人参之间的相互关系基准的方式(参见Zar,J.H,载于生物统计分析,第二版(1984),328-360页,Prentice Hall,Englewood Cliffs,NJ,完整结合在此作为参考)。然后将各生物应答的分布集输入到算法中得到标准人参的统计值。然后将统计数据优选存储在计算机处理器的存储器中用于进一步操作。
反复地进行这些步骤(即化学分析、产生生物标志信息和测定生物系统的应答),以生成统计值大数据库。将这些值进行编辑并输入到算法中以生成标准化人参的2-和3-维草药应答阵列(HBR阵列)。通过反复操作,所得阵列(即标准化阵列)显示出标准化人参的成分(包括生长条件)、生物标志信息和生物应答之间最密切的相互关系。通过测定两个或多个成分和生物标志信息值的已知相关变量,经由在测试批次的HBR阵列上的显示,通过比较测试值和标准化人参的标准化HBR阵列值,可以预测测试批次的生物应答变量的值。所得预测结果将用于评估所给人参批次的质量,而不需要使用生物系统的观测的生物应答(参见实施例2)。
实施例8.使用与特定生物应答相关的变量子集评估选定的人参草药组合物为了评估测试批量草药组合物的质量,首先收集选定的草药组合物中的草药的与植物有关的参数数据(例如植物种类、植物部分、地理来源、生长条件、加工方法和储存条件)。然后对选定的草药组合物进行处理,使其可以进行化学分析以确定草药的化学含量(参见Elkin等,中国药理学报(1993)1497-100和Yoshikawa等,药学杂志(1993)113460-467)。以前得到的人参数据已显示需氧运动过程中的耗氧量与存在皂甙成分、尤其是Rg1和Rb1之间关系非常密切(Wang等,植物医学(1998)64130-133)。
然后使测试批次与试验细胞接触,试验细胞包括但不限于浓度为0.5mg/ml至100mg/ml的成纤维细胞、巨噬细胞、单核细胞、PMNL、LAK细胞、B16-F10黑瘤细胞、THP-1细胞和海马神经元,以测定表达生物标志值。从接触后的细胞分离得到mRNA,随后进行处理以用作使用包含IL-8、IL-2和干扰素γcDNA的微阵列进行的对生化提取物的基于杂交的表达监控的底物(Schena等,科学(1995)270467-470;Schena等,美国国家科学院院报(1996)9310614-10619;Lockhart等,自然生物技术(1996)141675-1680;DeRisi等,自然遗传学(1996)14457-460;Heller等,美国国家科学院院报(1997)942150-2155)。以前得到的人参数据已证明在需氧运动过程中的耗氧量和试验细胞中表达生物标志IL-8、IL-2和干扰素γ的诱导之间有密切关系(Venkatraman等,医药科学体育运动(1997)29333-344和Wang等,植物医学(1998)64130-133)。对于生化生物标志,使大鼠骨髓细胞与测试批次接触并测定有丝分裂的[3H]-胸苷结合反射。以前得到的人参数据已证明了Rb1和Rg1显示出与大鼠骨髓细胞中的DNA合成有密切关系(Yamamoto等,Arzneimittelforschung(1978)282238-2241)。
反复分析后,将从各个测定得到的数据输入到算法中,以在列举的与植物有关的数据包括化学分析和与某些生物标志有关的数据的基础上产生选定草药组合物的试验HBR阵列。通过比较试验HBR和指向上述观测结果和子集的分析的标准人参的标准化HBR阵列变量来确定测试批次的质量,其中IL-2、IL-8和INFγmRNA在体外的诱导和大鼠骨髓细胞中[3H]-胸苷结合的增加的证明表现(包括收集的有关生长条件、来源和皂甙Rg1和Rb1的检验的数据)是测试批次对耗氧量的等价生物应答作用的预兆,正如标准人参所显示的那样。在该操作的基础上,可以确定测试批次与标准物质在所给生物应答或所感兴趣的生物应答方面是否有类似或不同的质量。
实施例9.建立黄连(HL)配方的标准化HBR阵列为了进行该实施例,选择的标准黄连(HL)是来自西南亚的Coptis chinesis France,其中生长条件是本领域技术人员熟知的(参见Huang,中草药药理学(1993),69和287-288页,CRC Press,Boca Raton,FL)。通过定量化学分析检验干燥黄连根茎的化学含量,测定砷、小檗碱、暗酸(caeruleic acid)、非洲防己碱、copsine、黄连次碱、黄连甙I(coptiside-I)、黄连甙-II、黄连碱、考雷明、表小檗碱、阿魏酸、greenlandicine、异黄连碱、光暗酸、木兰花碱、氧化小檗碱、唐松草分定、伞花碱、urbenine、甲基黄连碱、巴马汀、药根碱和非洲防己碱(还参见Zhu M.,中药通报(1984)963-64)。不同草药的生物碱小檗碱的含量应当在7-9%(重量)之间。这些数据将优选储存在计算机处理器的存储器中,以用于进一步操作。
标准HL的表达生物标志包括以下这些NfκB;bc1-2类似物,A1;锌指蛋白,A20;IL-2受体;细胞周期探针;c-Ki-ras2;生长调节剂探针和糖皮质激素受体依赖性细胞凋亡探针(参见Chi等,生命科学(1994)542099-2107;Yang等,瑙约-施密特贝尔格药物学文献(1996)354102-108;Miura等,生化药理学(1997)53;ChangK.S.,J Formos Med Assoc(1991)9010-14)。另一方面,对于更广的批次大小,可使用400,000寡核苷酸组/1.6cm2Affymetrix晶片(美国专利No.5,556,752)。标准HL的表达生物标志如实施例1中所述利用微阵列技术制备,包括分析和统计数据产生。标准HL的生化生物标志包括糖皮质激素受体的增加和与HL接触的HepG2细胞中甲种胎儿球蛋白分泌的抑制(参见Chi等,生命科学(1994)542099-2107)。如实施例1所述产生BBM集并进行分析。然后将统计数据优选储存在计算机处理器的存储器中,以用于进一步操作。
生物系统的生物应答将用细胞和完整动物进行测定。各批选定的草药组合物将与特定细胞类型接触,包括但不限于人HepG2肝细胞瘤细胞、人胚胎癌细胞和胸腺细胞,浓度为0.1-100mg/ml。对于动物处理,将0.1mg-2g/kg的黄连草药组合物(即HL)口服给药、通过腹膜内注射或皮下注射给药。为了确定生物系统对标准化HL的生物应答,使人胚胎癌克隆NT2/D1与各种浓度的标准HL接触,并检验其分化到细胞中的情况,此时有神经元样细胞形态(Chang K.S.,JFormos Med Assoc(1991)9010-14)。测定反复进行以产生测量值并如实施例1中对人参所述进行分析。生物系统对标准HL的生物应答的第二个独立测定将是标准HL对因肠毒素大肠杆菌(Escherichiacoli(ETEC))引起的腹泻的作用。因ETEC而出现腹泻的病人用不同浓度的HL(例如2g/kg)进行治疗,并测定大便体积(参见例如Rabbani G.H.,Dan Med Bull(1996)43173-185)。测定反复进行以产生测量值并如实施例1中对人参所述进行分析。然后将每个生物系统的分布集输入到算法中以产生标准HL的统计值。然后将统计数据优选储存在计算机处理器的存储器中,以用于进一步操作。
最后,如实施例1中所述,重复各步骤以得到标准化HL的HBR阵列,其中所得HBR阵列将随后用于预测生物活性和评估批次质量。用这种方法,可以产生并定期更新标准化HBR阵列。
实施例10.用与特定生物应答相关的变量子集评估选定的黄连草药组合物为了评估选定的测试批次的黄连草药组合物的质量,首先收集关于与植物有关的特征的数据(例如植物种类、植物部分、地理来源、生长条件、加工方法和储存条件)。然后处理草药组合物使其可进行化学分析以确定组合物的化学含量(也参见Zhu M.,中药通报(1984)963-64)。
以前得到的HL数据已证明人胚胎癌克隆向神经元样细胞中的终末分化与小檗碱的存在密切相关(参见Chang K.S.,J Formos MedAssoc(1991)9010-14)。然后使测试批次与试验细胞接触,试验细胞包括人胚胎癌克隆NT2/D1,起始浓度为无毒浓度(其确定在普通技术人员的技能范围内)。从接触后的细胞分离得到mRNA,随后对其进行处理以用作使用包含IL-2受体和NfκB的微阵列进行的对生化提取物的基于杂交的表达监控的底物(参见Chi等,生命科学(1994)542099-2107;Yang等,瑙约-施密特贝尔格药物学文献(1996)354102-108;Miura等,生化药理学(1997)53;Chang K.S.,J FormosMed Assoc(1991)9010-14;美国专利No.5,556,752),这可用于测定所述细胞中c-Ki-ras2基因表达的向下调节。以前得到的HL数据已证明人胚胎癌克隆向神经元样细胞中的终末分化与促细胞分裂原探针的诱导以及c-Ki-ras2基因表达的下调密切相关(参见ChangK.S.,J Formos Med Assoc(1991)9010-14)。
对于生化标志,使HepG2细胞与测试组合物接触,并测定细胞的糖皮质激素受体增加和甲种胎儿球蛋白分泌抑制的情况(参见Chi等,生命科学(1994)542099-2107)。以前得到的HL数据已显示糖皮质激素诱导的细胞凋亡的抑制与小檗碱型生物碱密切关联(参见Miura等,生化药理学(1997)531315-1322)。反复分析后,将从各个测定得到的数据输入到算法中,以在列举的观测数据、化学数据和关于某些生物标志的数据的基础上产生试验HBR阵列。
通过比较试验HBR和指向上述观测结果和子集的分析的标准HL的HBR阵列变量来确定测试批次的质量,其中HepG2细胞的IL-2受体和NfκB的诱导、c-Ki-ras2基因表达的下调、糖皮质激素受体的增加以及甲种胎儿球蛋白分泌的抑制的证明表现(包括收集的有关生长条件、来源和小檗碱生物碱的检验的数据)是测试批次对人胚胎癌克隆向神经元样细胞中的终末分化和地塞米松诱导的细胞凋亡的抑制的等价生物应答作用的预兆,正如标准HL所显示的那样。在该操作的基础上,可以确定测试批次与标准物质是否有类似或不同的质量。
实施例11.用两个生物测定评估小柴胡汤(sho-saiko-to)为了评估三种来源的小柴胡汤的质量,使用两个生物测定1)细胞生长抑制和2)乙型肝炎病毒从受感染细胞的分泌。小柴胡汤组合物由6-7种草药植物的混合物制成(柴胡(Radix Bupeuri),半夏(Rhizoma Pinelliae),生姜(Rhizoma Zingiberis),黄芩(RadixScutellariae),大枣(Fructus Ziziphi),党参(CodonopsisPilosula),人参(Radix Ginseng)和甘草(Radix Glycyrrhizae),参见表2的相对量,以重量计)。
表2.小柴胡汤的组成
三个“配方”来源于新加坡、韩国或台湾。评估各批次的毒性和抑制乙型肝炎病毒的能力,利用DNA定量或对乙型肝炎表面抗原(HbsAg)的检测来测定(参见Dong等,美国国家科学院院报(1991)888495-8499)。
简言之,1克制剂加10ml水。将该混合物煮沸30分钟。离心后收集上清液并通过0.22μm滤器过滤。使用两种细胞类型a)分泌乙型肝炎病毒的2.2.15细胞(由G.Ace教授好心提供;参见Ace等,美国国家科学院院报(1987)841005-1009)和b)HepG2细胞(ATCCcat # HB-8065)。1比50倍稀释后用于各项测定。细胞生长抑制测定进行72小时。其他所有操作如Dong等在美国国家科学院院报(1991)888495-8499中所述进行。用三个批次得到的测定结果显示在表3中。根据这些数据,选定台湾来源的那份作为标准草药组合物,因为其毒性低,且其有效地将HbsAG分泌(这与病毒的释放成比例)减少了一半以上。
表3.小柴胡汤(Sho-saiko-to)的生物测定
表2和3中显示的有关台湾草药组合物的数据构成了这种草药组合物的标准化HBR阵列的原始数据。因此,该数据集一开始将包括草药组合物的来源、植物种类以及草药组合物中各种草药的相对用量,和两种生物应答(即细胞生长抑制和乙型肝炎病毒从受感染细胞的分泌)。
用图1以及实施例1和3中列出的步骤,可以收集标准草药组合物的与植物有关的数据、标志和生物应答等其他数据。将这些进一步数据加入到原始的标准化HBR阵列中,产生扩展的标准化HBR阵列。如详细的说明部分和实施例中所述的那样,可以对所得数据库进行适当的分析,以确定与所感兴趣的生物应答最密切相关或相联的变量子集。用图2以及实施例2和4的操作中说明的方法可以确定批量HBR阵列。
所得批量HBR阵列可以与标准化HBR阵列对比,以便预测该批量草药组合物的生物应答。
实施例12.草药制剂草药提取物制剂的标准化方案如下将适当比例的原药材组分置于夹套反应锅中,在抬高的恒定温度下边混合边用水提取。用120目筛将固体与液体分离。收集所得滤液,通过在减压下将水蒸发而浓缩。浓缩液在抬高的温度下喷雾干燥得到颗粒状粉末剂。然后将该散装物质配制成所需剂型。
实施例13.评估黄连汤黄连汤(HQT)是一个中药古方,由四种不同草药组成黄芩(scute),甘草(licorice),芍药(白芍)和大枣(椰枣)。(表4)。这个草药配方从300AD.起就在亚洲长期用于治疗各种胃肠疾病。
表4.TCM配方HQT的草药组分
生物和酶测定表5.批量性能(HQT)
简单地说,每批黄连汤(HQT)1克加10ml水(1mg/ml)。该混合物如表5中所述进行处理。离心后收集上清液并通过0.22μm滤器过滤。用两种细胞类型来测试每批HQT的生物作用a)Jurkat T细胞(ATCC cat #TIB-152)和b)HepG2细胞(ATCC cat #HB-8065)。1比50倍稀释后用于每项测定。将冷冻的细胞(107/ml)在37℃水浴中快速融解。然后细胞用10ml预热的培养基稀释(参见LifeTechnologies,Inc.,商品目录与索引,1998-1999,细胞培养物部分),接着以1500rpm离心5分钟。丢弃上清液,细胞在100ml培养基中在37°、5% CO2下培养。2天后,对细胞计数(大约8×105/ml,总共100ml)。
利用DNA定量进行检测,对各批次的抑制乙型肝炎病毒的能力进行评估(参见Dong等,美国国家科学院院报(1991)888495-8499)。简言之,1克制剂加10ml水。将该混合物煮沸30分钟。离心后收集上清液并通过0.22μm滤器过滤。在该测定中使用分泌乙型肝炎病毒的HepG2.2.15细胞(由G.Ace教授好心提供;参见Ace等,美国国家科学院院报(1987)841005-1009)。1比50倍稀释后用于每项测定。细胞生长抑制测定进行72小时。其他所有操作如Dong等在美国国家科学院院报(1991)888495-8499中所述进行。
测定β-葡萄糖醛酸酶,因为HQT因其抗腹泻性能而众所周知。将不同HQT提取物一式三份地加入到96孔平板的各孔中,其中各孔中含有0.1mM葡萄糖醛酸酚酞、70mM Tris-HCl(pH6.8)和0.8ng透析β-葡萄糖醛酸酶(来自大肠杆菌,购自SigmaTM),使终体积为80μl。37℃下培养2小时后,用含有0.2M甘氨酸和0.2M NaCl(pH10.4)的200μl终止溶液使反应终止,并用动力学微量平板读数器在540nm下监测OD。
用三个批次得到的测定结果显示在表6中。在这些数据的基础上,HQT来源A和B具有相对批次HQT C来说较低的毒性以及更高的抑制活性(即,与HQT A或B相比,对HepG2细胞的毒性约大5倍,而对β-葡萄糖醛酸酶的抑制活性小3.3倍,参见表6)。
表6.三种HQT制剂的生物测定*大肠杆菌 HepG2 Jurkatβ-葡萄糖 DNA醛酸酶HQT A 0.6 1.50 0.76 无HQT B 0.7 1.60.81 NDHQT C 2.2 0.32 ND ND*数值表示 %对照IC50值.
ND,未测定.
HQT对蛋白质表达的作用的评估药物加入前24小时,将HepG2细胞(1×106)种植于25cm2烧瓶中的3.0ml RPMI-1640培养基中(参见Life Technologies,Inc.,商品目录与索引指南,1998-1999,细胞培养物部分)。细胞用或不同草药处理,用草药处理时分别以两种终浓度0.2mg/ml或4mg/ml加入,并在37℃下培养24小时。去除培养基,细胞用冷的PBS洗涤两次。将细胞收获到1ml PBS中并以10,000rpm离心2分钟,在冰上用含有50mM Tris-Cl(pH7.5)、0.2mM PMSF和10%甘油的缓冲液提取,接着进行三个冷冻-融解循环。以终浓度0.15M向细胞溶解产物中加入氯化钾,之后离心。测定蛋白质浓度,细胞提取物按照Laemmli的方法(自然(1970)227680-685)进行电泳。蛋白质印迹利用本领域公知的标准技术进行,参见例如Sambrook等(1989)。所用抗体指向以下蛋白质Topo I;Stat(20707);细胞周期蛋白B1;MAPK(Ab2)和Nm 23 H1。
图4显示了较高浓度的HQT A或HQT B对细胞周期蛋白B1多肽表达的差别作用。
HPLC分析用Beckman ODS UltrasphereTM柱(5微米颗粒,4.6mm×25cm)通过HPLC对草药批次进行分析并用UV分光光度计(Perkin Elmer)进行检测。UV检测波长在280nm和340nm下监控。流动相以1ml/分钟倾注,并由以下梯度的溶剂AH2O和溶剂B20%MeOH组成1)头5分钟溶剂为100%溶剂A;2)接下来的10分钟溶剂组合物变为10%溶剂A/90%溶剂B;和3)接下来的40分钟里溶剂变为10%溶剂A/90%溶剂B。在这之后加入100%溶液A持续5分钟。HPLC标志是黄芩甙和黄芩甙元。
质谱草药提取物用从PE Biosystems购得的MarinerTMESI-TOF质谱(MS)进行分析。对照示踪物用HQT中的两种已知活性成分黄芩甙元和黄芩甙产生。
用水和酸处理过的HQT批次样品通过HPLC和质谱法进行分析。水处理的HQT批次A和B具有不同的HPLC和MS示踪物,但酸处理的批次得到了几乎相同的图形(数据未显示)。
算法用从所用的多维分析部分收集的数据生成多变体正常分布集,作为测定生物活性与标准HQT化学(HPLC和质谱)以及来源/生长特征之间的相互关系基准的方式。
实施例14.单个成分A.甘草对甘草(Glycrrhizae Radix)的评估甘草可用于润肺止咳,帮助解除痉挛和疼痛。该实施例中所用的甘草批次的性能显示在表7中。
表7.批次性能(甘草)
生物和酶测定为测定草药来源的质量,对每个草药提取物上清液进行测定并重复分析三次。对于给出的要测定的样品,将1克草药粉末溶于聚丙烯试管中的10ml 80℃去离子水中(中性pH)。然后试管如表7中所述进行温育,之后离心得到上清液。测试各批甘草对抗HepG2细胞(ATCCcat #HB-8065)或Jurkat T细胞(ATCC cat #TIB-152)或二者的情况。细胞如上所述培养24小时。
利用DNA定量进行检测,对各批次的抑制乙型肝炎病毒的能力进行评估(参见Dong等,美国国家科学院院报(1991)888495-8499)。简言之,1克制剂加10ml水。将该混合物煮沸30分钟。离心后收集上清液并通过0.22μm滤器过滤。在该测定中使用分泌乙型肝炎病毒的2.2.15细胞(由G.Ace教授好心提供;参见Ace等,美国国家科学院院报(1987)841005-1009)。1比50倍稀释后用于每项测定。细胞生长抑制测定进行72小时。其他所有操作如Dong等在美国国家科学院院报(1991)888495-8499中所述进行。
另外,测定β-葡萄糖醛酸酶。将不同甘草提取物一式三份地加入到96孔平板的各孔中,其中各孔中含有0.1mM葡萄糖醛酸酚酞、70mMTris-HCl(pH6.8)和0.8ng透析β-葡萄糖醛酸酶(来自大肠杆菌,购自Sigma),使终体积为80μl,并如上文所述进行测定。
用两个批次得到的测定结果显示在表8中。在这些数据的基础上,甘草批次A比批次B对Jurkat细胞有大得多的毒性(约9倍)且是更有效的β-葡萄糖醛酸酶抑制剂(参见表8)。
表8.四个甘草制剂的生物测定*大肠杆菌 HepG2Jurkat β-葡萄糖醛 DNA酸酶甘草A 1.1 1.070.41 无甘草B NDND 3.6ND甘草C 2.1 ND ND ND甘草D NDND >2.0 53.8*数值表示 %对照IC50值.
ND,未测定.
表达测定为了测定基因表达,Jurkat T细胞如下所述用草药提取物处理使Jurkat细胞(107/ml)在37℃水浴中快速融解。然后细胞用10ml预热的培养基稀释(参见Life Technologies,Inc.,商品目录与索引指南,1998-1999,细胞培养物部分),接着以1500rpm离心5分钟。丢弃上清液,细胞在100ml培养基中在37°、5% CO2下培养。2天后,对细胞计数(大约8×105/ml,总共100ml)。
如上所述制备草药提取溶液(例如,用2g草药粉末制得20ml无菌溶液(0.1g/ml)。将细胞以2.5×105/ml的密度分到3个烧瓶中,每个烧瓶100ml。测定用对照(没有提取物)以及10ml 10mg/ml和1mg/ml提取物进行。另外,用毒性结果来确定所给任何提取物的“高”和“低”浓度。加入提取物后,细胞培养物在如上所述的条件下培养24小时。对细胞计数,随后收集到50ml离心管中。所得细胞颗粒用RNA分离方法处理以提取mRNA(参见例如Sambrook等,1989,7.3-7.39页)。
微陈列微阵列印刷如下进行通过其销售者从IMAGE协会文库得到人基因克隆,包括来自不同组织的基因。大多数克隆已部分定序,序列可作为GenBank的dbEST数据库中的表达序列标记得到。对克隆进行培养并用商业上可获得的引物进行扩增,之后加到尼龙膜上(Chen等,基因组学(1998)51313-324)。用PC(个人电脑)控制阵列系统将约10ng每种扩增后的目标物应用于带正电荷的尼龙膜上。阵列系统允许高密度斑点并能用24针排阵列工具在一片18-27mm的尼龙膜上沉积31,000个斑点。
CDNA探针和膜杂交各2微克mRNA样品(mRNA如上所述分离得到)用无规则引物逆转录用生物素和/或地高辛配基标记。标记后的样品用碱处理,所得标记核酸沉淀后用于杂交。膜杂交和洗涤操作如Chen等(1998)公开的用标记探针进行。为了以双色模式(即生物素和地高辛配基)检测膜上的斑点,使用β-半乳糖苷酶-缀合链霉抗生物素蛋白(Strept-Gal)和碱性磷酸酶-缀合地高辛配基抗体(抗-Dig-AP)。显色后,采用成像方法进行图象数字化(例如,平板扫描仪或数字照相机)。定量量度通过使用测量每个斑点的主要颜色成分的积分密度的程序的计算机分析进行测定,进行积分密度数据的回归分析并找出统计异常值作为差别表达基因。
样品1、2和甘草(ST117)的基因表达数据分别与冬虫夏草提取物、茯苓(ST 027)和甘草相对应的提取物1、2和6利用以下方法进行测定用Jurkat T细胞评估各批次的毒性。
提取物如实施例6中所述加以制备。通过以5×105/ml的密度加入1ml Jurkat细胞而将细胞分到24孔培养板中。测定用对照(没有提取物)以及所述5个浓度的提取物(参见表9)进行。用于细胞培养物测定的高和低浓度根据提取物对细胞的毒性在10mg/ml和0.05mg/ml之间变化(即,mg草药提取物干重/ml)。对于某些样品,10mg/ml的毒性是这样的将“高”和“低”浓度向下调节,但最大最小值之间至少保持一个数量级。例如,对于甘草(ST117),“高”浓度是0.5mg/ml,“低”浓度是0.05mg/ml(参见表9)。加入提取物后,细胞培养物在如实施例6中所述的条件下培养24小时。对细胞计数,将所得数据制表以显示提取物毒性。所得数据显示在表9中。
表9.不同浓度的草药提取溶液下的存活细胞数
注意初始细胞数是5×105/ml,培养24小时后变为10×105/ml。″-″表示所有细胞死亡。方案1.将1ml 5×105/ml Jurkat细胞加入到24孔培养板中。2.制备12种草药提取溶液并灭菌。3.测试5种浓度的每个样品。10mg/ml,5mg/ml,2mg/ml,1mg/ml,0.5mg/ml4.将细胞在37℃下用5% CO2恒温箱培养24小时。
在每个分析中,对144×96个基因(即13,824个基因)进行分析(数据未显示),与对照相比有约100个基因显示出显著差异(表10)。有些基因被上调,而有些被下调。与对照差异的大小有时会根据与特定细胞接触的草药组合物的相对量而变化。C1栏下的数值(对照处理)和H或L(草药)代表减去背景后的mRNA表达的强度(表10)。基因指示编码在阵列AD中,其可追踪到特定GenBank克隆。表达水平通过用H或L除以C来确定。在每种草药处理过的样品中13,824个基因中只有部分显示出明显变化,即上调、下调或无变化(参见表10)。rem K、L、M、N、O、P列中显示的数值表示#1、#2、#6草药处理的mRNA表达水平的比例名称 C1 1H 1L 2h 2L陈列AD 转导素样增强子蛋白1Sg-Bk Sg-BkSg-BkSg-BkSg-Bk<94,030>腺苷琥珀酸裂解酶 55.29 8.55 7.15 46.7438.07<91,097>神经营养酪氨酸激酶,受体,1型 89.55 98.2970.2684.8393.83<89,083>MHC类I蛋白 HLA-A(HLA-A28,-B40,-Cw3) 80.68 61.9146.1359.8629.64<87,083> 85.33 50.9637.7553.2525.54<86,131>ESTs,高度类似于HELIX-LOOP-HELIX PROTEIN 99.48 109.46 105.62 56.6867.54<85,129>膜内在蛋白质E1690.64 72.1292.7537.9770.08<85,112> 35.23 60.8248.8744.0429.71<84,075> 89.56 77.5477.9 66.1 59.44<83,129> 118.83 108.15 118.05 75.8464.09<82,082>人类雄激素受体伴随蛋白24(AI60.23 47.8734.9637.419.84<82,027> 65.11 90.0166.7466.3 64.44<80,129> 96.27 99.96109.381.8887.66<80,035>人小GTP结合蛋白Rab7 mRNA,完全 44.91 46.2325.1978.2140.75<74,108> 65.277.2568.0960.2 66.21<74,012> 34.68 60.9257.7324.6148.93<73,132>人KIAA0078基因的mRNA,完全编码 109.86 103.38 82.3585.9769.15<72,101>人反-Golgi p230 mRNA,完全编码 46.96 25.7618.3510.5417.87<72,014>开蓬还原酶 4.3715.0813.3142.8722.76<70,101> 60.86 13.5535.2333.3940.65<69,107> 37.92 31.4126.1282.8228.64<68,064>人KIAA0034基因的mRNA,完全编码 2.241.27 5.31 0.21 2.5(H,L表示高浓度和低浓度)与未经处理细胞(C1)对比
<62,117>106.71 94.6783.9881.3961.45<62,084>NA 1.13 0013.550.58<62,001>不均一核核糖核蛋白A197.1171.9273.1642.0178.94<61,118>NA 89.5259.9754.1166.8643.05<59,142>ATPase,Na+/K+转运,α1多肽 13.0315.4847.7527.7127.86<59,135>60.8590.2339.8393.0138.17<58,087>ESTs,不太类似于KIAA0062[人类] 77.7246.8676.3364.4322.52<57,016>成神经细胞瘤RAS病毒(v-ras)致癌基团相同物71.7116.4744.6139.5166.89<56,088>3-羟基-3-甲基戊二酰-辅酶A 56.7752.6659.5359.6 16.89<56,060>翻译延伸因子1-α-1 81.2692.2892.0836.8679.09<55,040>043.5839.4753.6746.42<54,134>碳酸酐酶III 004.38 43.478.23<53,048>人类干扰素调节因子3的mRNA 0.25 0033.470<53,023>人蛋白酶体亚单位HsC7-I的mRNA,完全c 67.7614.9842.3338.4866.52<52,135>49.2646.8144.4 72.9555.5<51,131>ATP柠檬酸裂合酶 2.02 052.0639.336.03<51,101>多腺苷酸结合蛋白8.65 0.17 0.45 38.9914.31<50,035>血清白蛋白前体 0.88 010.2144.140<47,055>ESTs38.5331.6919.4543.8 56.1<46,097>34.2635.9532.4939.8163.19<45,100>核糖体蛋白L526.1533.6 26.3 55.8648.59<44,103>NA 72.0154.3670.2775.4391.53<43,039>55.8618.0220.8311.6817.8<43,035>14-3-3 PROTEIN TAU 86.8623.1836.2318.1412.76<43,019>72.4810.4 23.3827.5912.83
<42,099> 30.25 33.73 36.8361 51.56<40,100>ESTs 0 0 0.2 38.3712.78<39,118>硫氧还蛋白4.260.342.83 37.288.03<39,007>前α(球蛋白)抑制剂,H3多肽9.4624.06 15.8226.0825.48<38,097>NA11.81 6.9423.8280.1416.65<38,081>人GP36b糖蛋白mRNA,完全编码 101.51 82.61 89.8622.8871.4<35,096> 47.35 24.52 023.2 32.88<34,143> 61.23 2.9925.0530.6116.93<32,118>ESTs,微类似于酪蛋白激酶1相同物 21.98 8.9114.1153.5424.01<32,034>丙酮酸激酶,肌肉 78.41 54.15 79.3629.5640.5<30,102>成视网膜细胞瘤结合蛋白P48 27.323.116.0662.3534.39<30,033> 70.49 30.32 65.1317.1833.65<29,058>NA25.77 16.66 059.8533.24<29,035> 60.19 57.12 86.6646.4756.59<28,104>核糖体蛋白S13 0 0 037.191.37<28,035> 71.46 35.93 51.8611.2730.75<27,119> 0 0 048.271.66<27,097>ESTs,中等类似于Etr-3[人类] 16.06 24.53 9.26 76.0124.34<25,126>ESTs 42.93 22.03 29.8867.7640.39<25,106> 61.948.38 43.4191.2658.89<24,098>人剪接体蛋白(SAP61)mRNA,完全编码 24.26 25.43 21.8 56.1837.28<24,071>热激70KD蛋白1 63.92 58.19 61.1 50.8666.27<23,126> 5.181.1 10.0854.7112.11<23,099>核糖体蛋白S3A 5.131.931.25 38.9914.35<22,013>真核起始因子4B61.849.95 41.5222.9949.11
<22,006>3-羟基-3-甲基戊二酰-辅酶A 83.1757.8439.8 40.0444.33<20,126>线粒体压力-70蛋白前体 27.0222.1933.8656.8732.97<20,104>人真核翻译起始因子(elF3)mRNA 22.0915.1717.3374.9819.17<20,103>层粘连蛋白受体(2H 5表位) 1.45 1.26 039.668.67<19,098>人 semaphorin(CD100)mRNA,完全编码17.7914.3810.7952.9428.97<18,103>核糖体蛋白L5 31.4721.1330.0778.6 27.18<18,084>ESTs 54.6175.1746.1679.5 60.01<17,103>NA00033.962.87<17,097>NA1.52 2.1 1.21 37.7711.59<17,062> 92.7273.27103.64 69.7969.35<16,103>整联蛋白,β1(纤连蛋白受体,β多肽, 00.92 041.3 1.84<16,100>人类E1B 19K/Bcl-2-结合蛋白Nip3 mRN0.79 00.7 38.068.28<15,112> 16.4711.6511.8746.5222.98<14,103>NA27.6134.2630.1855.6738.45<14,011>NA47.4234.8768.2838.7153.6<13,114>人类克隆24689 mRNA序列20.6413.8719.2 51.2632.34<12,144>人类NADH泛醌氧化还原酶NDUFS 76.7867.2 76.1164.5 50.04<12,111> 40.0455.0446.3477.7846.07<11,135> 90.34114.29 87.8880.4987.22<11,105>核糖体蛋白质L38.27 14.4115.5936.8225.87<11,053>需钙蛋白酶,大多肽L2 10.4823.5814.8 15.698.87<10,136>苹果酸酶2,线粒体 74.3481.6390.9483.1874.85<10,101>ESTs 13.6516.3413.9747.5726.68<09,136>NA59.8295 87.1677.3483.51<09,110>ER腔蛋白质维持受体1 17.3 41.7348.9255.3235.56
<09,085>人磷脂转移蛋白mRNA,完全编码80.1488.8396.2280.477.44<08,138>41.5760.4 69.5373.27 81.26<08,132>67.22102.84 103.65 90.56 88.43<08,122>人类DRAK1的mRNA,完全编码 32.0123.2147.7463.02 35.64<08,105>69.5858.7 84.4990.568.91<08,055>19.5 20.0122.8327.87 34.66<07,111>30.8 44.6748.7573.84 51.31<07,107>ESTs4.57 3.23 9.01 41.32 8.83<06,135>71.42112.68 128.81 102.8 101.48<06,102>ESTs39.8236.0332.5767.74 46.04<06,101>胞间粘着分子2 4.43 2.95 4.21 38.95 16.6<06,034>核糖体蛋白L50000 33.93<06,006>人脆性X精神发育迟缓综合征相关蛋白 031.7100 0<04,134>39.0354.6246.6171.858.82<04,106>铁蛋白,轻多肽 15.7423.8121.9446.74 21.94<03,140>56.0888.3361.2993.174.04<03,099>ESTs22.9718.5712.1 52.83 23.48<02,111>ESTs,高度类似于HYPOTHETICAL 64.5 KD PRO34.8923.6325 77.41 28.84<01,136>人类5-氨基咪唑-4-甲酰胺的mRNA 21.3634.8423.9553.14 45.66<01,058>酰基辅酶A脱氢酶,C-4至C-12直链 60.6853.3573.2662.56 56.58总计116
以这种方式,我们能将特定基因表达与细胞和无、低(L)或高(L)用量的草药组合物的接触联系起来。以这种方式鉴定的许多基因编码已知的代谢或生化途径中的重要蛋白质。这些蛋白质中有许多对某些生理、形态和心理参数有直接和间接作用。因此,该方法可以将草药组合物的特定遗传指纹与其阵列生物作用关联起来。这种关联可以用于描绘或表征草药组合物,目的是用于质量控制和质量保证,和评估药理学或毒理学性能。草药配方中的主要和次要草药的作用也可以利用该方法加以评定。
HPLC分用Beckman ODS UltrasphereTM柱(5微米颗粒,4.6mm×25cm)通过HPLC对草药批次进行分析并用UV分光光度计(Perkin Elmer)进行检测。UV检测波长在280nm和340nm下监控。流动相以1ml/分钟倾注,并由以下梯度的溶剂AH2O和溶剂B20%MeOH组成1)头5分钟溶剂为100%溶剂A;2)接下来的10分钟溶剂组合物变为10%溶剂A/90%溶剂B;和3)接下来的40分钟里溶剂变为10%溶剂A/90%溶剂B。在这之后加入100%溶液A持续5分钟。HPLC标志是甘草甜素。
算法用从所用的多维分析部分收集的数据生成多变体正常分布集,作为确定生物活性与标准甘草分子、化学(HPLC和质谱)以及来源/生长特征之间的相互关系基准的方式。
B.黄芩黄芩(Radix Scutellariae)的评估黄芩已发现可用于降低毛细管渗透性和炎症。它也可用于治疗肠炎和痢疾,增加胆汁的分泌以治疗黄疸;减轻肌肉痉挛;治疗咳嗽和驱虫。该实施例中所用的黄芩批次的性能显示在表11中。
表11.批次性能(黄芩)
生物和酶测定简言之,每种黄芩提取物制剂1克加10ml水(1mg/ml)。该混合物如表11中所述进行处理。离心后收集上清液并通过0.22μm滤器过滤。测试各批黄芩对抗HepG2细胞(ATCC cat #HB-8065)或JurkatT细胞(ATCC cat #TIB-152)或二者的情况。1比50倍稀释后用于各项测定。细胞如上所述培养24小时。
利用DNA定量进行检测,对各批次的抑制乙型肝炎病毒的能力进行评估(参见Dong等,美国国家科学院院报(1991)888495-8499)。简言之,1克制剂加10ml水。该混合物如表11中所述进行处理。离心后收集上清液并通过0.22μm滤器过滤。在该测定中使用分泌乙型肝炎病毒的2.2.15细胞(由G.Ace教授好心提供;参见Ace等,美国国家科学院院报(1987)841005-1009)。1比50倍稀释后用于每项测定。细胞生长抑制测定进行72小时。其他所有操作如Dong等在美国国家科学院院报(1991)888495-8499中所述进行。
至于β-葡萄糖醛酸酶,将不同的黄芩提取物一式三份地加入到96孔平板的各孔中,其中各孔中含有0.1mM葡萄糖醛酸酚酞、70mMTris-HCl(pH6.8)和0.8ng透析β-葡萄糖醛酸酶(来自大肠杆菌,购自Sigma),使终体积为80μl。37℃下培养2小时后,用含有0.2M甘氨酸和0.2M NaCl(pH10.4)的200μl终止溶液使反应终止,并用动力学微量平板读数器在540nm下监测OD。
用三个批次得到的测定结果显示在表12中。
表12.四个黄芩制剂的生物测定*大肠杆菌 HepG2 Jurkat β-葡萄糖醛酸酶DNA黄芩A1.5 0.33 0.45 无黄芩B1.8 NDNDND黄芩C0.3 NDNDND黄芩DND0.65 ND27.5*数值表示 %对照IC50值。
ND,未测定.
评估黄芩对蛋白质表达的作用提取物加入前24小时,将HepG2细胞(1×106)种植于25cm2烧瓶中的3.0ml RPMI-1640培养基中(参见Life Technologies,Inc.,商品目录与索引指南,1998-1999,细胞培养物部分)。细胞用或不同草药处理,用草药处理时分别以两种终浓度0.2mg/ml或4mg/ml加入,并在37℃下培养24小时。去除培养基,细胞用冷的PBS洗涤两次。将细胞收获到1ml PBS中并以10,000rpm离心2分钟,在冰上用含有50mM Tris-Cl(pH7.5)、0.2mM PMSF和10%甘油的缓冲液提取,接着进行三个冷冻-融解循环。以终浓度0.15M向细胞溶解产物中加入氯化钾,之后离心。测定蛋白质浓度,细胞提取物按照Laemmli U.K.的方法(自然(1970)227680-685)进行电泳。蛋白质印迹利用本领域公知的标准技术进行,参见例如Sambrook等(1989)。所用抗体指向以下蛋白质Topo I;Stat(20707);细胞周期蛋白B1;MAPK(Ab2)和Nm 23 H1。
图4显示黄芩批次A和B对蛋白质印迹上分解的多肽的表达没有不同影响。
HPLC分用Beckman ODS UltrasphereTM柱(5微米颗粒,4.6mm×25cm)通过HPLC对草药批次进行分析并用UV分光光度计(Perkin Elmer)进行检测。UV检测波长在280nm和340nm下监控。流动相以1ml/分钟倾注,并由以下梯度的溶剂AH2O和溶剂B20%MeOH组成1)头5分钟溶剂为100%溶剂A;2)接下来的10分钟溶剂组合物变为10%溶剂A/90%溶剂B;和3)接下来的40分钟里溶剂变为10%溶剂A/90%溶剂B。在这之后加入100%溶液A持续5分钟。HPLC标志是黄芩甙和黄芩甙元。
用水和酸处理过的黄芩批次样品通过HPLC进行分析。水和酸处理批次事实上无法区别开。
算法用从所用的多维分析部分收集的数据生成多变体正常分布集,作为确定生物活性与标准黄芩化学(HPLC)以及来源/生长特征之间的相互关系基准的方式。
C.白芍芍药(Paeonie lactiflora pallus radix)的评估芍药可用于缓急止痛。还已知它能缓和韧带和纯化血液。该实施例中所用的芍药批次的性能显示在表13中。
表13.批次性能(芍药)
生物和酶测定简言之,每种芍药提取物制剂1克加10ml水(1mg/ml)。该混合物如表13中所述进行处理。离心后收集上清液并通过0.22μm滤器过滤。测试各批芍药对抗HepG2细胞(ATCC cat #HB-8065)或JurkatT细胞(ATCC cat #TIB-152)或二者的情况。1比50倍稀释后用于各项测定。细胞如上所述培养24小时。
利用DNA定量进行检测,对各批次的抑制乙型肝炎病毒的能力进行评估(参见Dong等,美国国家科学院院报(1991)888495-8499)。
简言之,1克制剂加10ml水。该混合物如表13中所述进行处理。离心后收集上清液并通过0.22μm滤器过滤。在该测定中使用分泌乙型肝炎病毒的2.2.15细胞(由G.Ace教授好心提供;参见Ace等,美国国家科学院院报(1987)841005-1009)。1比50倍稀释后用于每项测定。细胞生长抑制测定进行72小时。其他所有操作如Dong等在美国国家科学院院报(1991)888495-8499中所述进行。
将不同的芍药提取物一式三份地加入到96孔平板的各孔中,其中各孔中含有0.1mM葡萄糖醛酸酚酞、70mM Tris-HCl(pH6.8)和0.8ng透析β-葡萄糖醛酸酶(来自大肠杆菌,购自Sigma),使终体积为80μl。37℃下培养2小时后,用含有0.2M甘氨酸和0.2MNaCl(pH10.4)的200μl终止溶液使反应终止,并用动力学微量平板读数器在540nm下监测OD。结果显示在表14中。
表14.两个芍药制剂的生物测定*大肠杆菌HepG2Jurkat β-葡萄糖醛酸酶芍药A 2.8 >1.51.1 无芍药B >2.5ND NDND*数值表示 % of控制IC50值。
ND,未测定HPLC分析用Beckman ODS Ultrasphere柱(5微米颗粒,4.6mm×25cm)通过HPLC对草药批次进行分析并用UV分光光度计(Perkin Elmer)进行检测。UV检测波长在280nm和340nm下监控。流动相以1ml/分钟倾注,并由以下梯度的溶剂AH2O和溶剂B20%MeOH组成1)头5分钟溶剂为100%溶剂A;2)接下来的10分钟溶剂组合物变为10%溶剂A/90%溶剂B;和3)接下来的40分钟里溶剂变为10%溶剂A/90%溶剂B。在这之后加入100%溶液A持续5分钟。HPLC标志是芍药甙。
芍药批次如图5中所示利用HPLC进行分析。
算法用从所用的多维分析部分收集的数据生成多变体正常分布集,作为确定生物活性与标准芍药化学(HPLC)以及来源/生长特征之间的相互关系基准的方式。
D.大枣大枣(Ziziphi Fructus)的评估大枣可用于利尿和强身。该实施例中所用的大枣批次的特性显示在表15中。
表15.批次性能(大枣)
生物和酶测定简言之,每批大枣提取物1克加10ml水(1mg/ml)。该混合物如表15中所述进行处理。离心后收集上清液并通过0.22μm滤器过滤。测试各批大枣对抗HepG2细胞(ATCC cat #HB-8065)或Jurkat T细胞(ATCC cat #TIB-152)或二者的情况。1比50倍稀释后用于各项测定。细胞如上所述培养24小时。
利用DNA定量进行检测,对各批次的抑制乙型肝炎病毒的能力进行评估(参见Dong等,美国国家科学院院报(1991)888495-8499)。简言之,1克制剂加10ml水。该混合物如表15中所述进行处理。离心后收集上清液并通过0.22μm滤器过滤。在该测定中使用分泌乙型肝炎病毒的HepG2.2.15细胞(由G.Ace教授好心提供;参见Ace等,美国国家科学院院报(1987)841005-1009)。1比50倍稀释后用于每项测定。细胞生长抑制测定进行72小时。其他所有操作如Dong等在美国国家科学院院报(1991)888495-8499中所述进行。
将不同的大枣提取物一式三份地加入到96孔平板的各孔中,其中各孔中含有0.1mM葡萄糖醛酸酚酞、70mM Tris-HCl(pH6.8)和0.8ng透析β-葡萄糖醛酸酶(来自大肠杆菌,购自Sigma),使终体积为80μl。37℃下培养2小时后,用含有0.2M甘氨酸和0.2MNaCl(pH10.4)的200μl终止溶液使反应终止,并用动力学微量平板读数器在540nm下监测OD。结果显示在表16中。
表16.三个大枣制剂的生物测定*大肠杆菌 HepG2Jurkat DNAβ-葡萄糖醛酸酶大枣A1.2 1.5 5.1 无大枣BND>2.0 ND 52.3大枣C2.5 NDND ND*数值代表%对照IC50值。
ND,未测定HPLC分析用Beckman ODS Ultrasphere柱(5微米颗粒,4.6 mm×25cm)通过HPLC对草药批次进行分析并用UV分光光度计(Perkin Elmer)进行检测。UV检测波长在280nm和340nm下监控。流动相以1ml/分钟倾注,并由以下梯度的溶剂AH2O和溶剂B20%MeOH组成1)头5分钟溶剂为100%溶剂A;2)接下来的10分钟溶剂组合物变为10%溶剂A/90%溶剂B;和3)接下来的40分钟里溶剂变为10%溶剂A/90%溶剂B。在这之后加入100%溶液A持续5分钟。大枣的HPLC标志是白屈菜酸和cAMP。
大枣批次样品如图6中所示利用HPLC进行分析。
算法用从所用的多维分析部分收集的数据生成多变体正常分布集,作为确定生物活性与标准大枣化学(HPLC)以及来源/生长特征之间的相互关系基准的方式。
实施例15.通过核酸微阵列分析来表征草药介绍核酸微阵列技术的迅速发展已导致基因表达数据的激增(Lander,1999,Duggan等,1999)。基因表达的四个特征可解释使用核酸微阵列来研究基因表达图形的巨大价值。(i)核酸微阵列使得更容易立刻测量数千个基因的转录物。(ii)基因产物的功能与其表达型之间的紧密联系使得基因的功能可以预测。(iii)通过改变特定基因的表达水平使得细胞对微环境变化有良好反应。(iv)在细胞中表达的各组基因可确定细胞的起源是什么、涉及哪些生化和调节系统,等等(Brown和Botstein,1999)。通过使用微阵列系统,上述特征可以整体方式加以研究。
使用核酸微阵列技术可以检测任何所需数量的基因的表达。例如,可以将最多约20,000个基因置于一个阵列上。我们已研制了一种带有比色检测系统的核酸微阵列(微阵列/CD)(Chen等,1998)。使用带有呈现约10,000个不同人转录物的约10,000个cDNA的微阵列滤膜(2.7cm×1.8cm)来研究不同细胞系的基因表达图形。已对微阵列/CD系统的灵敏度和检出限作为表征,它比得上带有放射性检测的系统或带有激光诱导的荧光检测的系统(Bertucci等,1999)。
如前所述,细胞基因表达图形描绘了细胞的来源、现时的分化以及对外部刺激物的细胞应答。换句话说,基因表达图形揭示了细胞的状态,微阵列是实现这一目的的理想工具。在本研究中,我们使用微阵列/CD系统来表征细胞对外部刺激物的应答,在这种情况下,外部刺激物是中药。反过来,我们还在所激发的基因表达图形的基础上将不同的草药分类。
图7是一个流程图,描述了可用于建立用草药组合物处理的细胞的表达应答数据集的通用方法。该方法包含以下步骤(a)通过在哺乳动物细胞培养物中培养各种浓度的草药来确定草药组合物的IC50浓度,并鉴定在预定时间后留下了50%存活细胞的浓度。
(b)对加有不同IC50浓度部分的草药提取物的哺乳动物细胞培养物进行培养。
(c)在预定培养时间后收获所培养的细胞并计数。
(d)将细胞从孵化箱中取出后立即溶解细胞并从细胞溶解产物提取mRNA。
(e)通过逆转录反应标记mRNA,使mRNA变成标记的cDNA。
(f)将标记的cDNA与植物来源的对照cDNA混合,与哺乳动物基因探针的微阵列进行杂交。
(g)通过分析微阵列杂交结果的数字化图象来测量基因的表达水平。
(h)进行数据预处理,选出用于统计学分析的数据。
(i)获得利用不同浓度的草药组合物的微阵列实验产生的表达数据。
(j)对数据进行预处理,选出在用不同浓度的草药处理的细胞中具有统计学显著性的基因。
(k)利用统计学方法诸如自组织图型算法将表达图形分到各聚簇中。
(l)在表达图形聚簇的基础上推断草药的特征表达图形。
图8是一个流程图,显示了不同批次的草药组合物的表达数据的数据集怎样综合后制作特定草药组合物的表达图形数据库。然后使表达图形数据库成为HBR阵列的一部分。
含有表达图形的HBR阵列还可用于鉴别未知的草药组合物。图9是一个流程图,描述了用于鉴别未知草药组合物的通用方法,该方法包括以下步骤(a)通过上述步骤构建含有草药的特征表达图形或各种草药的表达图形的集合的HBR阵列。
(b)得到未知草药组合物的特征表达图形数据集。
(c)对比含有用所述未知草药组合物产生的特征表达图形的HBR阵列与含有用诸如Hamming间距算法等算法得到的表达数据的标准化HBR阵列。
(d)对可能的对准计分以鉴别出其特征表达图形在所述HBR阵列中已存档的最可能的草药组合物。
对含有表达图形的HBR阵列的可能的对准计分这一步骤可以用Hamming距离矩阵的分级簇分析进行。Hamming距离矩阵的分级簇分析的使用是本领域中众所周知的。
基因表达图形也可加入到标准化HBR阵列中。正如已讨论过的那样,含有由草药组合物产生的这种基因表达图形的标准化HBR阵列可以用于研究草药组合物的药理学机理、用于发现草药组合物的新应用和用于设计复方草药制剂的优化配方。从图10的流程图可以看出,该方法一般可包括以下步骤(a)构建含有草药组合物的特征基因表达图形的数据集。
(b)使用已知的统计学参数诸如变异系数,利用基因在数据集中的表达图形的一致性对各个基因打分。
(c)在统计学计分的基础上,对草药的基因表达图形进行选择并加入到标准化HBR阵列中。
含有基因表达图形的HBR阵列还可用于鉴别由复合化学成分组成的草药组合物中单个化学成分导致的标记基因表达图形,如图11的流程图所示。该方法包含以下步骤(a)通过上述步骤构建含有草药组合物的特征基因表达图形的HBR阵列。
(b)利用高效液相色谱(HPLC)或液相色谱-质谱联用(LC-MASS)确定草药中化学成分的组成。
(c)对不同批次的草药制剂重复步骤(b)。
(d)对各个基因的表达水平与草药制剂中单个化学成分的量之间的相关系数打分。
(e)用超过0.99或小于-0.99的Pearson相关系数选择单个化学成分的标记基因表达图形。
使用核酸微阵列产生基因表达图形,任何草药组合物然后可通过使用该基因表达图形加以表征。另外,我们可以选择不同表达的任何数量的基因包括在描绘基因表达图形的数据集中。例如,可以选择约10个基因、约100个基因、约500个基因、约1000个基因、约1500个基因、约2000个基因、约2500个基因或更多,或这之间的任何数目。
中药黄芩和甘草组合的配方(黄芩汤)可止泻、解痉和清热。黄芩汤的组分是黄芩、芍药、甘草和大枣。这个方子已用了1000多年,但对它的化学和生物医学研究直到最近几十年才开始。在该研究中,我们使用核酸微阵列技术来研究草药处理过的细胞的基因表达图形。我们的目标是证明使用微阵列/CD系统对不同草药组合物或不同制剂分类的可行性,和找到黄芩汤处方的预示基因(标志基因)。长期目标是找到各草药组合物中的生化成分与不同处理过的细胞的基因表达图形的关系,和以合理的方式解释中药的分子药理学机理。
材料与方法1.细胞库系统的开发目的微阵列系统是一种灵敏的检测方法,可监测细胞的基因表达型。有必要建立一个具有主细胞库(MCB)和工作细胞库(WCB)的细胞库系统,以将草药测试中的细胞变异性减至最小。
范围该细胞库系统可用于微阵列研究中的所有类型的细胞。
仪器CO2气体夹套恒温箱(NUAIRETMDH autoflow)离心机(KUBOTA 2100)冰冻瓶(Corning Costar,Cat.#430659)组织培养烧瓶750ml(Falcon,Cat.#3045)组织培养皿150×25mm(Falcon,Cat.#3025)细胞Jurkat T细胞,购自Dr.Alexandra Ho试剂RPMI培养基1640(GIBCO BRL,Cat.#31800-014)二甲亚砜(DMSO)(Sigma,Cat.#D-2650)胎牛血清(HyClone,Cat.#SH30070.03,Lot#AGL7258)2-巯基乙醇(GIBCO BRL,Cat.#21985-023,5×10-2M)培养基I.培养用培养基90% RPMI+10%肽牛血清+2-巯基乙醇(5×10-5M)II.冷冻培养基90% RPMI 1640+10% DMSO步骤A.主细胞库1.进行标准无菌细胞培养操作。
2.将Jurkat T细胞种植在37℃、5% CO2恒温箱中的烧瓶中的培养基中。
3.培养2天后,对细胞计数并将细胞展开到两个烧瓶中。注意细胞密度保持约5×104-2×106/ml。
4.细胞培养并计数,直到细胞数达到2×107。
5.将细胞收集到50ml离心管中并以1300rpm(300×g)旋转5分钟。
6.弃去上清液,细胞颗粒再悬浮于冷冻培养基。每瓶中的细胞数约为1×106/ml。
7.按照以下温度变化方式将细胞缓慢冷冻-20℃持续2小时,-80℃持续24小时,然后将细胞置于液氮贮运器中。MCB中储存共20个冷冻瓶。
B.工作细胞库1.从在液氮箱中的MCB中取出一瓶细胞并在37℃水浴中快速融解。
2.将细胞转移到10ml温培养基中。
3.细胞以1300rpm(300×g)旋转5分钟。弃去上清液。细胞在烧瓶中用20ml培养基培养。
4.将细胞传代培养到2个烧瓶中。
5.将在500ml培养基中的5×107个细胞种植到每个烧瓶中,同时搅拌,共2个烧瓶。细胞培养2天。
6.培养直到细胞密度达到1×106/ml,总体积为1L。
7.加入100ml胎牛血清和10ml DMSO制备冷冻培养基。
8.离心,弃去上清液,将细胞再悬浮于110ml冷冻培养基。
9.向每个冷冻瓶中分配1ml(1千万个细胞/瓶),共100瓶。按照上述温度变化方式将细胞缓慢冷冻。
2.测定细胞培养物中草药提取物的生长抑制浓度目的大多数药物对细胞是有毒的。设计该实验来检验草药提取物在Jurkat T细胞中的毒性,并测定保持细胞存活的草药提取物的生长抑制浓度。
范围该测定可用于各种草药提取物来检验毒性。
仪器CO2气体夹套恒温箱(NUAIRETMDH autoflow)计数室(Hemacytometer,Reichert,USA)显微镜(Zeiss,Axiovert 100)细胞Jurkat T细胞试剂RPMI培养基1640(GIBCO BRL,Cat.#31800-014)胎牛血清(HyClone,Cat.#SH30070.03,Lot #AGL7258)
2-巯基乙醇(GIBCO BRL,Cat.#21985-023,5×10-2M)培养基90% RPMI+10%胎牛血清+2-巯基乙醇(5×10-5M)一次性无菌注射滤器(0.2μm,Corning,Cat.#21052-25)草药提取物1.冬虫夏草菌丝体2.ST 0243.ST 0444.ST 0515.ST 0936.ST 1177.ST 1238.ST 1289.ST 13410.ST 23711.PHY906-303503由4,6,7,10组成的复杂混合物12.PHY906-284003由4,6,7,10组成的复杂混合物步骤A.草药提取物制剂1.将1克草药粉末溶于聚丙烯试管中的10ml 80℃去离子水(中性pH)中。
2.试管在80℃水浴中培养30分钟,同时轻微振摇,然后以4000rpm(1500×g)离心5分钟,得到上清液。
3.以11000rpm(14000×g)离心10分钟,收集上清液。
4.使用一次性无菌注射滤器过滤上清液。
B.细胞存活试验t1.如上所述培养Jurkat T细胞。
2.以每孔1ml 5×105/ml细胞将细胞分配到24孔培养板中。
3.制备12种草药提取溶液。这些提取溶液必须是新制备的且立即使用。
4.将100,50,20,10,5μl各草药提取溶液加入到24孔培养板中,得到5种不同浓度10,5,2,1,0.5mg/ml。
5.细胞在充满5% CO2的恒温箱中在37℃下培养24小时。
6.对每孔中的细胞计数。将10μl细胞溶液与10μl台盼蓝染料混合并装载到细胞计数室中。
7.对四个主要正方面积计数,以计算细胞数。(4个面积中的细胞数)/4×104×稀释因子=每ml中的细胞数3.描绘用草药提取物处理的Jurkat T细胞的基因表达型目的描绘用草药提取物处理的Jurkat T细胞的基因表达型。使用带有比色检测系统的高密度核酸微阵列。
仪器热滑块(Boekel,Model 110002)分光光度计(Beckman,DV640)离心机(KUBOTA 1910)水浴(SLM AMINCO,Model 800)杂交恒温箱(YIH DER OH-800)热封机(TISH-300,TEW)试剂RNAzolTMB(Tel-Test,Cat.#CS-104)Oligotex mRNA Midi试剂盒(Qiagen,Hilden,Germany)杂交袋(GIBCO BRL,Cat.#18278-010)EasiSeal(Hybaid,Cat.#HBOSSSEZ1E)玻璃载物片(Matsunami,S2214,Japan)气溶胶抗性吸头(ART吸头)(分子BIO-Products,Cat.
#2139)无规则六聚体引物(GIBCO BRL,Cat.#48190-011)逆转录酶和5×缓冲液(GIBC0 BRL,Cat.#18064-014)核糖核酸酶抑制剂(GIBCO BRL,Cat.#10777-019)生物素-16-dUTP(Boehringer Mannheim,Cat.#1093070)Dig-11-dUTP(Boehringer Mannheim,Cat.#1558706,)用于杂交的封闭粉末(Boehringer Mannheim,Cat.
#1096176)牛血清白蛋白(Sigma,Cat.#A2153)20X SSC(Amresco,Cat.#0918S-2-20XPTM5L)SDS(Merck,Cat.#113760)硫酸葡聚糖(Sigma,Cat.#D6001)
链霉抗生物素蛋白-β-半乳糖苷酶(GIBCO BRL,Cat.
#19536-010)抗-地高辛配基-AP Fab片段(Boehringer Mannheim,Cat.#1093274,)X-gal(GIBCO BRL,Cat.#15520-018)马来酸(Sigma,Cat.#M1125)N-月桂酰肌氨酸(Sigma,Cat.#L5777)坚牢红TR/AS-MX底物试剂盒(PIERCE,Cat.#34034)聚乙二醇(Sigma,Cat.#P2139)试剂制备1×杂交缓冲液(4X SSC,0.1% N-月桂酰肌氨酸,0.02% SDS,1%BM封闭试剂)20×SSC 16m1% N-月桂酰肌氨酸8ml10% SDS 160μlBM封闭粉末0.8gH2O 51ml共计 80ml加热至65℃使粉末溶解,然后储存在-20℃下。
50% PEG-8000(聚乙二醇)PEG-8000 10gH2O加至 20ml加热至65℃使溶解,然后高压灭菌。等分试样并储存在-20℃下。
10×TBS(100mM Tris,1.5M NaCl,pH7.4)Tris碱 12.1gNaCl 87.6gH2O 加至 1000ml
120mM X-galX-gal 100mgDMF2ml-20℃下储存。
X-gal底物缓冲液(1mM MgCl2,3mM K3Fe(CN)6,3mM K4Fe(CN)6溶于1X TBS缓冲液中)500ml10X TBS/pH7.4 50ml亚铁氰化钾 633.5mg高铁氰化钾 493.9mgMgCl2101.6mg过滤并在-20℃下储存。
BM封闭稀释缓冲液/pH7.5(0.1M马来酸,0.15M NaCl)1M马来酸 100ml5M NaCl30ml固体NaOH 7.5gH2O 加至 1000ml10%封闭试剂 10ml封闭粉末 10g封闭稀释缓冲液(没有吐温20) 100ml加热至70℃后高压灭菌。4℃下储存。
20%硫酸葡聚糖硫酸葡聚糖 2gH2O加至 8ml高压灭菌后储存在-20℃下。
DEPC-处理过的水800ml二碳酸二乙酯(4℃下储存)400μlH2O 800ml
置于37℃摇动水浴中4小时,然后在37℃温室中过夜。溶液高压灭菌两次,各45分钟或25分钟。
步骤A.Jurkat T细胞的制备1.融解1瓶Jurkat T细胞。转移到10ml生长培养基中。融解的瓶数取决于要进行的试验数。一般说来,2个草药提取物试验需要1瓶细胞。
2.将细胞再悬浮于50ml培养基中。
3.细胞培养1天。加入150ml培养基并分到两个烧瓶中,每瓶100ml。
4.细胞培养3天。
5.更换培养基并分到4个烧瓶中,每瓶100ml培养基。
6.细胞培养2天。
7.对细胞计数。收集细胞并旋转沉淀。将带有培养基的细胞颗粒再悬浮至5×105细胞/ml,每瓶100ml。
8.细胞培养3小时,然后加入草药提取物。
B.草药提取物处理1.制备草药提取物(参见草药提取物的制备)。
2.按照利用细胞存活实验确定的草药提取物的生长抑制浓度,计算每个草药提取物的50%生长抑制浓度。
3.定义50%生长抑制浓度为H。用以下浓度的草药提取物的系列稀释液处理细胞H,H/2.5,H/5,H/10,H/20。
4.细胞培养24小时。
5.收集细胞并对细胞计数。离心得到细胞颗粒。
6.细胞颗粒用1×PBS洗涤一次。
7.弃去上清液。细胞颗粒准备用于总RNA分离。
C.总RNA的分离1.每107个细胞加入1ml RNAzolTMB。将细胞颗粒匀化但不涡旋。
2.每毫升匀浆加入0.1ml氯仿,紧紧地盖住样品,用力摇动1分钟(不涡旋)。置于冰上15分钟。
3.在4℃下以12000rpm(13500×g)离心15分钟。
4.离心后,匀浆分成两相下层是蓝色苯酚-氯仿相,上层是无色水相。DNA和蛋白质在中间相和有机相中。将水相转移到新的试管中,加入等体积的异丙醇,该样品在-80℃下储存。注意。加入的异丙醇的范围是0.7至1体积的水相溶液。
5.样品保持在-80℃下直至使用。离心前使样品完全融解,并通过反转试管混合2-3次。样品以13000rpm(15000×g)离心15分钟。
6.除去上清液,RNA颗粒用1ml 75%乙醇洗涤1次。以13000rpm(15000×g)在4℃下离心3分钟。
7.弃去上清液。颗粒在真空下干燥1分钟。注意。不要让RNA颗粒完全干燥。这将大大降低其溶解度。
8.通过移液管将RNA颗粒溶于50-100μl二碳酸二乙酯(DEPC)-处理过的水。注意。如果颗粒难以溶解,将这些颗粒在60℃下温育10-15分钟会有帮助。
9.用分光光度计测量260nm(A260)和280nm(A280)下的吸光度。浓度分析OD260×40ng/μl×稀释因子=总RNA(ng/μl)。
D.从总RNA分离聚腺苷酸+mRNA1.按照表17确定起始RNA的量以及缓冲液OBB和要加入到RNA溶液中的Oligotex悬浮溶液的适宜体积。
表17.用于Oligotex mRNA旋转-柱方案的缓冲液量
以下步骤是基于使用500μg总RNA为例。
2.向总RNA样品中加入500μl 2×结合缓冲液和30μl Oligotex悬液。通过翻转试管使内容物充分混合。
3.样品在70℃下培养10分钟。
4.室温下培养20分钟。
5.以最大速度(14000-18000×g)离心2分钟并吸出上清液。
6.将颗粒再悬浮于400μl洗涤缓冲液OW2并转移到旋转柱上,该旋转柱离心1分钟。
7.用400μl OW2洗涤并如上所述离心。
8.将20μl预热(70℃)的洗脱缓冲液加到柱上并将树脂再悬浮。盖上微量离心管。
9.带有1.5ml微量离心管的旋转柱在70℃下放置3分钟。
10.柱子在室温下以最大速度离心2分钟。
11.再次洗脱。(重复步骤8-10以获得更好的收率)E. cDNA标记1. 将2μg mRNA、1μl用于单色标记的对照植物mRNA(Hat221×109,Rbcl5×108,Ga41×108,Rca5×107,Asal1×107,Atps5×106个分子/μl)、6μl 50mM无规则六聚体和DEPC-H2O混合至28.88μl终体积。对于双色模式,在生物素或Dig标记中各自使用2μg mRNA并单独加入对照植物mRNA1.生物素标记Hat221×108,Rbcl5×107,Ga42×107,Rca1×107,Asal1×107,Atps1×107,Hat41×107/μl。2.Dig标记Hat221×107,Rbcl1×107,Ga41×107,Rca1×107,Asal1×108,Atps5×107,Hat42×107/μl。
2. 70℃下改性10分钟,然后在冰中快速冷冻5分钟。
3. 加入10μl 5×第一链缓冲液、5μl 0.1M DTT、1μl 25mMdATP、dCTP、dGTP混合物、1μl 2mM dTTP、2μl 1mM生物素-16-dUTP、或Dig-11-dUTP(1mM)、0.63μl 40U/μl RNAsin和1.5μl Superscript II(逆转录酶,GIBCO BRL)(200U/μl)。
4. 充分混合并在25℃下培养10分钟,然后在42℃下培养90分钟。
5. 94℃下停止反应5分钟。
6. 50℃下加入5.5μl 3M NaOH持续30分钟。
7. 50℃下加入5.5μl 3M CH3COOH保持30分钟。
8. 通过加入34μl水、50μl 7.5M醋酸铵、10μg线性聚丙烯酰胺载体和380μl无水乙醇使标记的cDNA沉淀。
9. 样品在-80℃下培养30分钟。以13000rpm离心15分钟。
10. 颗粒用1ml 70%乙醇洗涤并以13000rpm离心5分钟。
11. 将颗粒溶于36μl高压灭菌过的水中。对于双色,将两种标记的cDNA结合在一起。
F.阵列杂交1. 带有9600 EST PCR产物的滤膜在5ml 1×杂交缓冲液(4XSSC,0.1% N-月桂酰肌氨酸,0.02% SDS,1% BM封闭试剂(Boehringer Mannheim))和50μg/ml鲑精DNA(GIBCO BRL)中在63℃下预杂交1.5小时。注意。可以制备80ml 1×杂交缓冲液并将其储存在-20℃下。使用前在60℃下将缓冲液融解。
2. 将粘着的EasiSeal_方块的一面粘在干净的玻片上,并将预杂交的膜置于该方块的中心,斑点朝上。
3. 将探针与2μl聚-d(A)10(10μg/μl)和2μl人Cot-1 DNA(10μg/μl)(GIBCO BRL)和40μl 2×杂交缓冲液混合至终体积80μl。
4. 探针混合物在95℃下变性5分钟,然后在冰上冷却。
5. 滤膜在杂交袋中用探针溶液封闭。
6. 在95℃下培养5分钟,然后在63℃下培养12-16小时(过夜)。
7. 滤膜在室温下用5ml 2×SSC,0.1% SDS洗涤2次,持续5分钟。
8. 63℃下用5ml 0.1×SSC,0.1% SDS洗涤三次,每次15分钟。
9. 滤膜在室温下用含有2%硫酸葡聚糖的5ml 1%BM封闭试剂封闭1小时。
10. 用5ml含有700×稀释链霉抗生物素蛋白-β-半乳糖苷酶(1.38U/ml,酶活性)(GIBCO BRL)、10000×稀释抗-地高辛配基-碱性磷酸酶(0.075U/ml,酶活性)(Boehringer Mannheim)、4%聚乙二醇8000(Sigma)和在1×TBS缓冲液中的0.3% BSA的混合物在室温下培养2小时。注意。该配方是用于双色模式。对于单色模式,不需要抗-Dig-AP,且培养时间可减至1小时。
11. 用1×TBS缓冲液洗涤3次,每次5分钟。
12. 通过将50μl 120mM X-Gal和5ml X-Gal底物缓冲液混合来制备新鲜的X-gal底物溶液(1.2mM X-gal,1mM MgCl2,3mMK3Fe(CN)6,3mM K4Fe(CN)6在1×TBS缓冲液中)。将滤膜在37℃下浸入X-gal底物溶液中45分钟,同时轻微摇动。
13. 用1×TBS洗涤。
14. 双色显色膜用5ml坚牢红TR/萘酚AS-MX底物(Pierce,Rockford,IL)在室温下着色30分钟,同时轻微摇动。
15. 用去离子水洗涤。用含有20mM EDTA的1×PBS终止反应20分钟。
16. 将滤膜空气干燥。
结果1.测定细胞培养物中的草药提取物的生长抑制浓度。
每种草药提取物具有不同的细胞毒性,因此需要在用每种草药处理细胞之前先测定它的生长抑制浓度。将草药提取物的5个系列稀释液(10,5,2,1,0.5mg/ml)加入到5×105/ml培养细胞中,并在37℃、5% CO2下在恒温箱中培养24小时。表18中显示了不同浓度的草药提取物下存活细胞的数目。
表18.不同浓度的草药提取物下的存活细胞数
注意起始细胞数是5×105/ml。培养24小时后数量增加至10×105/ml。“-”指示所有细胞死亡。
没有加入草药提取物时的细胞数在培养24小时后加倍。另一方面,用不同的草药处理,存活的细胞数也不同。我们选择50%生长抑制浓度(IC50)作为高浓度,其十分之一作为低浓度。为了保持JurkatT细胞系的一致性,建立细胞库系统。在细胞库中,共将100瓶细胞(1千万个细胞/瓶)冷冻在-150°冷冻库中。
2.通过核酸微阵列分析对草药进行分子分类对3种单一组分草药的分析。将三种单一组分草药冬虫夏草(CSM)、ST024和ST117用于如方法部分中所述处理细胞培养物。基因表达测量通过使用各自呈现不同人转录物的13824个cDNA片段的微阵列进行。至于数据分析,选择高数据质量的基因斑点。选择是在信号与背景的比值大于2.5或斑点面积的变异系数(CV)小于10%的基础上进行。所有数据集用没有接受草药处理的对照细胞规格化。对于那些小于10的斑点强度都四舍五入到最多为10。在选择标准的基础上,共选择了492个具有大于1.5的差别表达率的基因用于簇分析。这些数据的预处理操作利用内部开发的程序“DataExtract”和“Ratio2”进行。
这492个基因利用平均连接法进行簇分析。基因间的距离用作线性相关系数或相似系数。簇分析程序Cluster和TreeView是基于分级聚簇法,是由斯坦福大学的Dr.Michael Eisen编写的(Eisen,1999,Eisen等,1998)。结果显示在图12中。从图12C可以清楚地看出高和低浓度的三种不同草药各自聚集在一起。例如,在聚簇树中CSM-L更接近CSM-H而与ST024或ST117不怎么类似。基于非分级法的另一种不同的簇算法-自组织图型算法得到的结果相同(数据未显示)。从图12A和13A中显示的聚簇结果来看,有些特征是显著的。(1)4个基因被ST117处理上调,但却被其他草药处理下调(图12B)。(2)34个基因被CSM处理下调,但却被其他草药处理上调(图13B)。(3)2个基因被所有三种草药处理上调,一个是苹果酸酶2,另一个是无名基因(克隆ID328351)(图13C)。(4)12个基因大大受到所有三种草药的高浓度处理的诱导,但几乎未受低浓度处理的诱导(图13D)。
对2种多组分草药制剂的分析。将各自有低浓度和高浓度的两批黄芩汤PHY906-303503(#11)和PHY906-284003(#12)用于三个独立的实验中来处理细胞培养物。用9600个非丰余cDNA的微阵列获得基因表达图形。如上所述完成了数据的预处理步骤后,选出了约5000个基因用于随后的数据分析。每种草药处理重复3次。对于数据分析,我们使用在Slonim等报道的一种方法(Slonim,1999)上的改进方法。以下算法就是设计用来寻找在三次重复实验中具有高的差别表达率但偏差小的候选标志基因。我们指定P(i)值来说明具有上述特征的基因i。
P(i)=(∑(μm-μc)2)/(σc+∑σm)的平方根μ草药处理的细胞(μm)或未经处理的对照细胞(μc)在三次重复实验中的平均表达水平。
σ草药处理的细胞(σm)或未经处理的对照细胞(σc)在三次重复实验中的表达水平的标准偏差。
我们计算了每种基因的P(i)值并选出500个得分最高的基因作为用于簇分析的候选基因(图14)。每个基因的值都是三次重复实验的平均值。如图14B中所示,两个不同浓度的#12聚集在一起(12-H和12-L)。较高浓度的#11制剂比较低浓度的#11制剂更接近#12制剂聚簇。但是,与图12中显示的树相比,所有这些聚簇都有类似的相似系数(聚簇间的距离)。这些结果提示#11和#12黄芩汤制剂的基因表达图形是类似的。这两种制剂是基于相同的草药混合物,因此结果是合乎情理的。
在图14A和图15所示的表达图形中有一些特征是显著的。图15A中显示了平均基因表达水平。方框1中包括在#11-L处理的细胞中被下调但在其他细胞中被上调的基因,这些基因包括2个tRNA合成酶(异亮氨酸和甲硫氨酸(methion))、RNA聚合酶II多肽B(克隆ID42020)、KIAA0212基因(克隆ID 310497,含有ATP/GTP-结合位点基元A)和KIAA0577(克隆ID 29263,ATP-依赖性RNA解旋酶)。我们感兴趣地注意到6个基因中有3个涉及RNA复制。方框2中包括被所有的草药处理上调的基因。方框3中包括对#11-L处理显示没有应答但被其他物质下调的基因。方框4中包括被低浓度的草药处理大大抑制但在高浓度的草药处理下只显示轻微抑制的基因。最后,在方框1和方框3中,#11处理细胞的表达图形不同于用其他3种处理产生的图形。该结果与图14B中显示的一致。
将3种单组分草药和2种多组分草药制剂的基因表达图形的数据集结合在一起,根据显示有数个特征是显著的。KIAA0212基因(克隆ID 310497,含有ATP/GTP-结合位点基元A)受到所有高浓度草药处理的高度诱导,只除了受到#11-L和CSM处理的中度诱导。有两个基因,无名基因(克隆ID 510908)和蛋白酶体链7前体(克隆ID70088),被所有的处理高度上调,但被CSM处理下调。
接下来我们的关键是对5种不同类型的草药处理的基因表达图形进行簇分析。数据的预处理步骤如上所述进行,并选择了500个基因用于簇分析。分级聚簇利用上述程序“Cluster”进行。从聚簇间的距离范围最大处将分级树切开(Romesburg,1989),结果显示在图16A中。三种单一组分草药CSM、ST024和ST117聚集在一起。2批不同的多组分草药中,#12-H、#12-L和#11H聚集在一起,而#11-L独立。结果提示与CSM、ST024和ST117之间的类似性相比,#11和#12之间存在更高的类似性。为了更好地将不同草药分类,将所有数据集标准化,使不同数据集中每种基因的表达水平具有零-均值和单位-变异,由此改进数据分析算法(Tavazoie等,1999;Chen等,1999)。这得到了转换变量χi=(xI-μx)/σxμx数据集中的平均表达水平σx数据集中表达水平的标准偏差xi未转换的基因表达水平χi已转换的基因表达水平将数据集标准化后,如图16B中所示,#11和#12聚集在一起。ST024和ST117聚集在一起,而CSM在一个独立的聚簇中。另外,聚簇还提示CSM与#11和#12的类似性大于与ST024和ST117的类似性。用相同的标准化数据集进行另一种簇算法-自组织图型算法,得到了与分级簇算法相同的结果。(图16C)。
用于区别#11和#12草药处理表达图形的类别预示变量。对#11和#12的上述簇分析显示它们是类似的,用含有500个最高P(i)值的基因的数据集进行的分级聚簇或自组织图型方法难以作进一步的分类。于是我们对算法作了改进,选出#11和#12草药处理细胞之间的表达率差别较大、但在这两种草药处理细胞中具有较小的变异的基因。定义T(i)值来对这种特征计分,如下所示T(i)=log(μ11)-log(μ12)/(σ11+σ12)μ#11处理细胞(μ11)或#12处理细胞(μ12)在三次实验中的平均表达率σ#11处理细胞(σ11)或#12处理细胞(σ11)的表达率的标准偏差我们计算了每种基因的T(i)值,并选出50个具有最高得分的基因作为类别预示变量(图17)。18个基因受#11处理而上调,但受#12处理却下调。其余基因受#12处理而上调,但受#11处理而下调。于是我们使用这些类别预示变量在Golub等,1999所述的改进方法的基础上对这两种测试草药制剂进行分类。
不同的两批黄芩汤制剂PHY010401(#16)和PHY010402(#17)从Sun Ten制药公司获得,并用于类别预测试验。#16和#17制剂的基因表达图形用未经处理的对照细胞的表达图形规格化并用类别预示变量标准化。每个预示变量gi根据其表达水平xi是否更接近#11或#12而赞成#11或#12草药制剂。赞成每种基因由vi=|xI-(μm+μc)/2|给出,其中μ#11(μ11)或#12草药处理细胞(μ12)在三次重复实验中的平均表达率分别从与关于#11和#12的预示变量相关的预示变量基因收集平均得票数V11和V12。预测强度(PS)反映了胜利的界限,它定义为PS=(V11-V12)/(V11+V12)。如果PS大于0,指示草药制剂更类似于#11而与#12不太类似。从对#16和#17进行的分析得到的结果指示#16-H与#11(PS=0.1)类似,而#16-L、#17-H和#17-L与#12类似(分别是PS=-0.29、-0.21和-0.2)。在#16和#17制剂的信息的基础上,该试验未能准确地鉴别出#16-L更类似于#11。
讨论草药处理细胞的特征基因表达图形。从两种草药处理细胞中的不同表达的基因选择预示变量基因。这些基因呈现了对草药处理的细胞应答。在该研究中,我们已在它们对不同草药处理的应答的基础上鉴别了一些令人感兴趣的基因(图13、15和17)。这些基因在研究细胞响应草药刺激的信号路径和在解释草药的分子药理学机理方面是有价值的。
利用核酸微阵列分析对草药分类。概括地说,我们提出了一种两步分类方法。一开始进行的是在标准化数据集和簇算法基础上的分类步骤,接着是用类别预示变量进行的最终分类步骤。所有步骤都可综合在计算机程序中。在这些初步研究中,所有基因对分类都有相同的贡献。当数据集足够大时,可以从线性相关系数获得每种基因(或预示变量)的重量(Golub等,1999,Chen等,1999)。
#11-L未能通过显著关联与#11-H聚集在一起。#11的类似制剂#16制剂产生了相同的结果。令人感兴趣的是,我们发现无论使用的簇算法是什么,#11和#16制剂都没有产生预期的结果。即使用独立的实验,结果仍然相同。失败的原因将用#11和#16制剂的详细信息进行研究。
微阵列系统中的质量控制和分析。所获得的微阵列数据的质量和统计学分析方法的选择都是得到有意义的结果的重要因素。我们已认识到阵列中的变异会引起基因表达水平的测量中的误差。在该报告中的资料的基础上,我们已发现对于每种草药制剂,高浓度处理的表达图形总是与其较低浓度的相应物聚簇在一起(图16B和16C),我们可以用两种不同的聚簇方法将ST117、ST024、CSM和黄芩汤分类。在过去的三个月里,阵列质量已提高到小于7% CV。我们还设定了用于评定在实验室中建立的每批阵列的质量的标准方法。所有这些实验结果和微阵列技术的改善都提示利用微阵列系统分类和表征中药是可行的。
实施例15的参考文献Bertucci-F;Bernard-K;Loriod-B;Chang-YC;Granjeaud-S;Birnbaum-D;Nguyen-C;Peck-K;Jordan-BR(1999)基于DNA阵列的表达测量和实施小样品的尼龙微阵列中的灵敏度问题,人类分子遗传学8(9)1715-1722。
Bittner-L,Trent-J,Meltzer-P(1999)间距和箭头的数据分析与综合。自然遗传学22,213-215。
Brown-PO;Botstein-D(1999)利用DNA微阵列探查基因组的新世界。自然遗传学21(1)增刊,33-37。
Chen-JJ;Wu-R;Yang-PC;Huang-JY;Sher-YP;Han-MH;Kao-WC;Lee-PJ;Chiu-TF;Chang-F;Chu-YW;Wu-CW;Peck-K(1998)表达图型和利用带有比色法检测的cDNA微阵列系统分离不同表达的基因。基因组学51313-24。
Chen-Y,Bittner-M,Dougherty-ER(1999)与微阵列数据分析和综合有关的问题。Michael Bittner,Jeffrey Trent和PaulMeltzer对条款的补充信息(自然遗传学22,213-215)。
Duggan-DJ;Bittner-M;Chen-Y;Meltzer-P Trent-JM(1999)使用cDNA微阵列描绘表达图形。自然遗传学21(1)增刊,10-14。
Eisen-M(1999)聚簇和树状图手册(rana.stanford.edu/软件)Eisen-M,Spellman-PT,Brown-PO,Botstein-D.(1998)簇分析和基因宽度的表达图型的显示。美国国家科学院院报9914863-14868Golub-TR,Slonim-DK,Tamayo-P,Huard-C,Gaasenbeek-M,Mesirov-JP,Coller-H,Loh-ML,Downing-JR,Caligiuri-MA,Bloomfield-CD和Lander-ES(1999)癌症的分子分类利用基因表达监控实现类别的发现和类别的预测。科学,10月15日531-537
Lander-ES(1999)希望的阵列。自然遗传学21(1)增刊,3-4.
Romesburg-HC(1989)研究人员的簇分析。第16章怎样进行分类。203-216页,Krieger Publishing Co.Malabar,Florida,USASlonim-DK,Tamayo-P,Mesirov-JP,Golub-TR,Lander-ES(1999)使用基因表达数据实现类别的预测和发现。(www.genome.wi.mit.edu/MPR)Tavazole-S,Hughes-JD,Campbell-MJ,Cho-RJ,Church-GM.(1999)遗传学网络结构的系统测定。自然遗传学22281-285实施例16.鉴别由草药诱导的特征基因表达图形如实施例15中所述,中药黄芩和甘草组合的配方(黄芩汤)可止泻、解痉和清热。黄芩汤的组分是黄芩、芍药、甘草和大枣。在该研究中,我们使用核酸微阵列技术来研究哺乳动物细胞中由草药诱导的基因表达图形。为了研究由黄芩汤诱导的特征表达图形,Jurkat T细胞用5批黄芩汤处理(PHY01040;#16,PHY010402;#17,PHY03061;#18,PHY03062;#19和PHY02231;#20,从Sun Ten制药公司购得),采用5种浓度(IC50的1/2,1/2.5,1/5,1/10和1/20)。
采用带有双色检测法的核酸微阵列来测量表达图形。从草药处理细胞提取的mRNA用地高辛配基标记,而从未经处理的细胞提取的mRNA用生物素标记。采用9600个特征的阵列,并将Chen等描述的方法(基因组学51,313-324,1998)用于这些实验。对于数据的预处理,只选择高数据质量的阵列斑点。选择是基于信号与背景的比大于2.5和1.5X的差别表达率。利用这些标准,选出了1081个基因用于进一步的统计学分析。用非分级簇分析程序诸如在麻省理工学院开发的Genecluster程序(Tamayo等,1999)来将表达图形分类。Genecluster程序是基于自组织图型(SOM)原理。图18A中显示了表达图形的6X4 SOM聚簇。图18B中显示了选定的聚簇的基因表达图形的详细情况。在这些聚簇中,聚簇3和20(标记的c3和c20)被选出来,因为它们的基因表达水平在较高的草药浓度下增加。类似地,聚簇5和9被选出来,因为它们的基因表达水平在较高的草药浓度下降低。聚簇23收集了表达水平与在未经处理的细胞中的相比被上调的基因,聚簇0收集了被下调的基因。这些表达图形聚簇进一步集中成主要两组,A和B。A组收集了被草药处理上调的基因,而B组收集了被草药处理下调的基因。A组和B组中的表达图形构成了草药制剂的特征表达数据集的基础。对于不同的5批黄芩汤重复相同的步骤,选出了952个基因来建立黄芩汤的特征表达图形数据库。
如图19中所示,利用前述方法,可以将基因分为A组、B组或无(非A和非B),且其表达图形分别可由1、-1和0表示。A组中批次#1和批次#2之间的不同基因表达图形数是3(基因6、7和8),B组中是2(基因15和16)。利用同一原理,A和B组中批次#1和#3之间的不同表达图形数是10,批次#2和批次#3之间是11。这些数指示批次#1和#2比批次#3更相似。用该原理将5批不同的草药制剂分类。用以下算法来计算一对草药制剂批次I和j之间的距离。
dij=∑δ(Xi,Xj)(Hamming间距)i批制剂中的基因X被分配到A、B或“无”组若Xi<>Xj,δ(Xi,Xj)=1若Xi=Xj,δ(Xi,Xj)=0.
我们计算了每对草药制剂之间的所有dij值用于簇分析。分析程序KitschCluster是基于分级聚簇原理,由华盛顿大学的Dr.Joseph Felsenstein编写(http//evolution.genetics.washington.edu/phylip.html)。从Hamming间距表(图20),可以清楚地鉴别出最短的间距位于批次#17和批次#18之间,批次#17与#18类似。批次#16也与批次#17和#18类似,但批次#19与其余批次不同。结果得到了如下所述的HPLC分析的证实。
利用HPLC分析了5批草药制剂的化学组成。选择了色谱图中的四个主峰(BG,B,Gly和Pf)用于统计学分析。在标绘图21中所示的6-坐标雷达图时包括另两个参数BG+B和BG/B。每个坐标上的距离是该特定化学成分在色谱图中的综合强度。总的来说,#16、#17和#18在它们的黄芩的成分含量(黄芩甙和黄芩甙元)方面是类似的,均在33.55-36.08之间;而在#19和#20中相同成分的量更高(分别是42.49和44.96)。#16、#17和#18的类似可以从图21B中的一致性雷达图中看出。
为了在如上所述建立的特征表达图形数据库的基础上鉴别未知的草药,Jurkat T细胞用5种浓度的试验样品#17处理,以建立试验品的特征表达数据集。计算试验品和特征表达数据库中的每个数据集(#16,#17,#18,#19和#20)之间的Hamming间距,得分为#16502,#17405,#18402,#19699和#20531。这些数据显示试验品与#17最相似,具有最低的Hamming间距得分405。该实施例证明,本发明提出了一种在利用哺乳动物细胞中由草药诱导的基因表达图形的基础上鉴别未知草药的方法。未知草药的鉴别可通过将特征表达图形与HBR阵列中草药的特征表达图形集对准来推断。
在特征表达数据库的基础上,可以推出草药的标志基因和标记表达图形,以用于研究其药理学机理和用于优化复方草药制剂的配制。对于这种实例,从Sun Ten制药公司购得5批不同的黄芩汤制剂(#16,#17,#18,#19和#20),在上述方法的基础上构建特征表达图形数据库。对于每个基因,利用变异系数(CV值)对数据库中的表达图形的一致性打分CV=σ/(∑μi/n)μi#I处理细胞的平均表达率n数据集的数目,在本例中n=5σ#16,#17,#18,#19和#20的表达率的标准偏差由于CV反映数据的变异,因此草药的标志基因在CV得分的基础上进行选择。选出具有最小CV得分的头50个基因。图22显示了黄芩汤的具有上调的标记图形的25个标志基因,和具有下调的标记图形的25个标志基因。
特征表达图形数据库可以用于推断与草药同样复杂的混合物中的单个化学成分的表达图形,只要化学成分的量能被半定量地确定。在这样的例子中,草药的化学组成利用高效液相色谱法测定。5批黄芩汤制剂中4种化学成分的综合强度通过HPLC分析定量测定。每批草药制剂的基因表达率通过取由5种浓度的草药制剂诱导的表达率的中值来计算。成分与基因表达图形之间的相互关系利用Pearson相关系数来定量。基因x和成分y的Pearson相关系数是R=(1/n)∑(xi-μx)(yi-μy)/σxσy,i=1-nn草药制剂的数,本例中n=5μx5批草药制剂中基因x的平均表达率μy5批草药制剂中成分y的平均综合强度xi#I草药制剂中基因x的基因表达率
yi#I草药制剂中成分y的综合强度σ5批草药制剂的表达率(σx)或综合强度(σy)的标准偏差对于每种成分,鉴定了表达水平与黄芩汤中的化学成分的量高度相关(|R|>0.99)的若干基因。例如,基因(克隆ID67185)和甘草甜素之间的R值为0.998(图23A)。另一方面,表达水平随汉黄芩黄素(WG)的减少而增加的基因(克隆ID344720)具有-0.997的R值(图23B)。除了上面两个例子以外,191和170基因与单个成分高度相关,R值分别>0.9和<-0.9。例如,17和18基因分别与白花素(Af)正相关和负相关(图24)。这个实施例教导了不将混合物分离而描绘其中的单个成分的基因表达的方法,从而对每个成分进行表达分析。
实施例16的参考文献美国专利文件Stoughton-Roland和Friend-SH.USP# 5965352鉴别药物作用路径的方法Brown-PO和Shalon-TD USP#5807522建造生物样品微阵列的方法Lockhart-DJ,Brown-EL,Wong-GG,Chee-MS和Gingeras-TR.USP#6040138利用与高密度寡核苷酸阵列的杂交进行表达监控Ladunga-I.USP#5987390用于蛋白质类别鉴定的方法和系统Mahant-S,Shivaling-S,Vivek-G.USP#5951711用于测定两个多比特数字字之间的hamming间距的方法和设备外国专利文件Brown-PO和Shalon-TD EP#913485A1用于制造生物样品微阵列的方法和装置其他出版物Bertucci-F;Bernard-K;Loriod-B;Chang-YC;Granjeaud-S;Birnbaum-D;Nguyen-C;Peck-K;Jordan-BR(1999)基于DNA阵列的表达测量和实施小样品的尼龙微阵列中的灵敏度问题,人类分子遗传学8(9)1715-1722。
Bittner-L,Trent-J,Meltzer-P(1999)间距和箭头的数据分析与综合。自然遗传学22,213-215。
Brown-PO;Botstein-D(1999)利用DNA微阵列探查基因组的新世界。自然遗传学21(1)增刊,33-37。
Chen-JJ;Wu-R;Yang-PC;Huang-JY;Sher-YP;Han-MH;Kao-WC;Lee-PJ;Chiu-TF;Chang-F;Chu-YW;Wu-CW;Peck-K(1998)表达图型和利用带有比色法检测的cDNA微阵列系统分离不同表达的基因。基因组学51313-24。
Chen-Y,Bittner-M,Dougherty-ER(1999)与微阵列数据分析和综合有关的问题。Michael Bittner,Jeffrey Trent和PaulMeltzer对条款的补充信息。自然遗传学22,213-215。
Duggan-DJ;Bittner-M;Chen-Y;Meltzer-P Trent-JM(1999)使用cDNA微阵列描绘表达图形。自然遗传学21(1)增刊,10-14。
Eisen-M(1999)聚簇和树状图手册(rana.stanford.edu/软件)Eisen-M,Spellman-PT,Brown-PO,Botstein-D.(1998)簇分析和基因宽度的表达图型的显示。美国国家科学院院报9914863-14868Golub-TR,Slonim-DK,Tamayo-P,Huard-C,Gaasenbeek-M,Mesirov-JP,Coller-H,Loh-ML,Downing-JR,Caligiuri-MA,Bloomfield-CD和Lander-ES(1999)癌症的分子分类利用基因表达监控实现类别的发现和类别的预测。科学,10月15日531-537Lander-ES(1999)希望的阵列。自然遗传学21(1)增刊,3-4.
Tamayo-P,Slonim-D,Merirov-J,Zhu-Q,Kitareewan-S,Dmitrovsky-E,Lander-ES和Golub-TR(1999)用自组织图解释基因表达的图型方法和对造血差异的应用。美国国家科学院院报992907-2912Romesburg-HC(1989)研究人员的簇分析。第16章怎样进行分类。203-216页,Krieger Publishing Co.Malabar,Florida,USAScherf-U,Ross-DT,Waltham-M,Smith-LH,Lee-JK,Tanabe-L,Kohn-KW,Reinhold-WC,Myers-TG,Andrews-DT,Scudiero-DA,Eisen-MB,Sausville-EA,Pommier-Y,Botstein-D,Brown-PO,Weinstein-JN(2000)用于癌症的分子药理学的基因表达数据库。自然遗传学24236-44Slonim-DK,Tamayo-P,Mesirov-JP,Golub-TR,Lander-ES(1999)使用基因表达数据实现类别的预测和发现。(www.genome.wi.mit.edu/MPR)Tavazole-S,Hughes-JD,Campbell-MJ,Cho-RJ,Church-GM.(1999)遗传学网络结构的系统测定。自然遗传学22281-285实施例17.草药组合物的生物应答和标记基因的鉴定为了进一步研究黄芩汤诱导的表达图形,Jurkat T细胞用5种浓度(IC50的1/20,1/10,1/5,1/2.5,和1)的黄芩汤处理(PHY906#2从台湾Sun Ten制药公司得到)。用带有双色检测的核酸微阵列来测量表达图形。从草药处理细胞和未经处理的细胞提取的mRNA分别用生物素-16-dUTP和Dig-11-dUTP标记。对照组使用从未经处理的细胞提取的mRNA和分别以等比例的生物素和地高辛配基标记的mRNA建立。利用Chen等(1998)描述的方法,稍作修改后,对用不同浓度的草药处理的5个样品组和1个对照组进行研究。对于数据的预处理,只选择高数据质量的阵列斑点。选择标准是信号与背景比大于2.5倍和差别表达率在1.5倍以上的斑点。利用这些标准,选出了1044个基因用于进一步的统计学分析。对照组的基因表达图形只与位于超过2倍差异表达范围的48个列为统计异常值的基因密切相关(图25A)。对于样品组,如图25B中所示,许多不同表达的基因是明显的。差别表达率大于2倍的基因数随草药处理的浓度增加,如图25C中所示。这些结果证明所鉴定的不同表达的基因确实是由黄芩汤的处理导致的。
为了鉴别由PHY906特异性诱导的基因(PHY906的标记基因),利用Tamayo等1999开发的非分级簇分析程序“GeneCluster”将表达图形分类。该计算机程序是基于自组织图(SOM)原理,表达图形的聚簇显示在图26中。X轴表示从低到高的草药浓度,Y轴是基因表达率。从显示对PHY906#2的剂量应答的表达图形中选出标记基因。分别从聚簇3和4以及聚簇18和19中选出诱导和抑制的基因。为了鉴别PHY906的标记基因,具有相同配方和制造方法的另一批黄芩汤PHY906#3进行如对PHY906#2所述的相同操作。这两批中常见的诱导和抑制基因显示在图27中。
利用自组织图(SOM)对生物应答的类似性打分为了区分类似组成的草药,开发了一种计分方法,得分S表示生物系统对两种不同的草药组合物的生物应答的差异。
S=∑PijWij,其中Pij均是由聚簇i和聚簇j中的草药制剂A和草药制剂B诱导的常见基因的数目。例如,对两批PHY906的表达图形的SOM簇分析结果显示在图28A中。在聚簇C13和C14中,17和25基因分别享有两批PHY906的相同表达图形。此外,表达图形由PHY906#2诱导的10个基因聚集在C13中,但由PHY906#3诱导的聚集在C14中。因此,P1313=17,P1414=25和P1314=10。称量因子Wij描述了聚簇i和j之间的距离,以指示两个表达图形聚簇的类似性。在C13和C14的情况下,这10个基因对PHY906#2和PHY906#3有类似的应答(图28B)。称量因子定义为Wij=1-Eij/Max(Eij),其中Eij是聚簇i和聚簇j之间的欧几里距离,该值通过Eij/Max(Eij)规格化。当i=j时,Wij为1。当聚簇i和聚簇j变得更不同时,该数值减小(图28C)。
对5批草药的分类为了测试如何很好地在将5批类似的草药制剂分类时运用上述方法,Jurkat T细胞用5种浓度(IC50的1,1/2.5,1/5,1/10和1/20)的5批黄芩汤处理(PHY01040;#16,PHY010402;#17,PHY03061;#18,PHY03062;#19和PHY02231;#20,从Sun Ten制药公司获得)。在簇分析中计算每对草药制剂之间的Sij分数(图29)。分析程序Kitsch Cluster是基于分级聚簇原理,由华盛顿大学的Dr.Joseph Felsenstein编写(http//evolution.genetics.washington.edu/phylip.html)。将S得分(距离)制表(图29A),从中可清楚地鉴别出最短的距离位于批次#17和#18之间,批次#17与#18类似。批次#16也与批次#17和#18类似,但批次#19与其余批次都不同。结果利用HPLC分析证实。
在表达图形的基础上表征未知草药为了在如上所述建立的特征表达图形数据库的基础上鉴别未知的草药,Jurkat T细胞用5种浓度的试验样品#17处理,以建立试验品的特征表达数据集。计算试验品和特征表达数据库中的每个数据集(#16,#17,#18,#19和#20)之间的S分数,S得分是#160.78,#170.85,#180.84,#190.77和#200.79。这些数据显示试验品与#17最相似,具有较高的S得分0.84。该实施例证明,可以采用该方法在利用哺乳动物细胞中由草药诱导的基因表达图形的基础上鉴别未知草药。未知草药的鉴别可通过将特征表达图形与HBR阵列中草药的特征表达图形集对准来推断。
草药的性能可以用四性五味来描述(见中药学,颜正华主编,人民卫生出版社,北京,中国,1997;本草纲目,李时珍,明朝,中国)。PHY906中的四种草药各自可涉及具有类似性能的另一组草药(参见表19)。或者具有类似性能的草药可显示相似的生物应答。HBR阵列可用于测定或测量草药性能的关联。这些信息可以用于创制新的草药配方。
表19具有PHY906性能的草药
性能四气-寒、热、温、凉五味-辛、苦、甘、酸、淡实施例18.利用HBR阵列评估草药如实施例16中所述,黄芩汤的药物组成是黄芩、芍药、甘草和大枣。表征了哺乳动物细胞中由5批黄芩汤诱导的基因表达图形。黄芩汤的标准制剂可以用动物研究或临床研究来定义和表征。例如,在质量控制和由Sun Ten制药公司建立的其他标准的基础上,将#17用作黄芩汤标准制剂。用#17的生物应答来建立黄芩汤的HBR阵列。选择HBR阵列中的标志基因来评估其他黄芩汤组合物制剂。黄芩汤试验品可含有相同的草药组合物,但草药组分可以是在不同的环境特征下生长的。对于试验品与标准化HBR阵列中的标志基因的生物应答,评估试验品的生物活性。
另外,选出表达水平与黄芩汤中的草药组分的剂量高度相关(|R|>0.99)的标志基因(如实施例16和图25中所述)用于评估目的。黄芩汤试验品可以通过对比选定的那组标志基因的特定生物应答或表达水平与HBR阵列来进行评估。如果选定的标志基因的表达水平或生物应答超过了可接受的变异区,就调节或修饰草药组分的量或特性,以便满足可接受的变异要求。重复该过程,直到由校正后的草药组合物诱导的生物应答通过与标准HBR阵列对比在可接受的变异范围内。
实施例19.预测草药组合物的生物活性和治疗应用按照已鉴别出的PHY 906的标志基因(图27),这些基因可用于预测草药组合物的生物活性。例如,据报道下列加下划线的PHY906的标志基因涉及以下生物活性和治疗作用。唯一有效的对抗ALL的药物该能抑制因细胞凋亡增加而导致的天冬酰胺合成酶(Nandy等,1998)。长效药物促生长素抑制素类似物因有肿瘤生长抑制作用而被用于治疗神经纤维瘤,因为它们可诱导由G6PD、转酮醇酶、或二者的抑制介导的抗增殖作用(Boros等,1998)。Ephrin-A1是一种新的黑瘤生长因子,在黑瘤进展过程中高度表达(Easty等,1999)。促分裂原活化蛋白邀酶(MAPK)家族成员最近报道对细胞凋亡有相反作用(Dabrowski等,2000)。天冬酰胺合成酶、转酮醇酶、ephrin-A1和MAPK的表达受到较高浓度的PHY906处理的抑制。这些基因的下调牵涉到细胞凋亡。精氨基琥珀酸合成酶、组织蛋白酶G和趋化因子RANTES的表达在炎症历程中被高度诱导。通过用PHY906处理,与炎症相关的基因被抑制了。这些文献报道为预测草药组合物的生物活性或治疗作用提供了基础。
实施例19的参考文献Nandy-P;Periclou-AP;Avramis-VI(1998)在人白血病细胞系(CCRF/CEM/O和CCRF/CEM/ara-C/7A)中6-巯基嘌呤加上阿糖胞苷再加上PEG-天冬酰胺酶的协同是由细胞凋亡增加引起的。抗癌剂研究18727-737Boros-LG;Brandes-JL;Yusuf-FI;Cascante-M;Williams-RD;Schirmer-WJ(1998)促生长素抑制素对氧化和非氧化戊糖磷酸途径的抑制可能的抗肿瘤作用机理。医学假说50501-506Easty-DJ;Hill-SP;Hsu-MY;Fallowfield-ME;Florenes-VA;Herlyn-M;Benett-DC(1999)黑瘤进展过程中ephrin-A1的上调。国际癌杂志84494-501Dabrowski-A;Tribillo-I;Dabrowska MI;Wereszczynska-SU;Gabryelewicz-A(2000)促分裂原活化蛋白激酶在不同胰腺腺泡细胞损害模型中的活化。Z-Gastroenterol.38469-481给出上面详细的描述只是为了使理解清楚,而没有不必要的限制,从这些描述,进行一些修饰对本领域技术人员来说将是显而易见的。
虽然本发明已结合具体实施方案进行了描述,但应当理解它能作进一步的修饰,且按照总的本发明的原理,这种应用打算覆盖本发明的任何变种、使用或适应性应用,包括虽背离了本文的公开,但仍是本发明所涉及的领域内的已知或惯常实践,并且可以用于上文中列出的和如下所述在所附的权利要求书的范围内的本质特征。
权利要求
1.一种建立草药组合物的标准化草药生物应答阵列(HBR阵列)的方法,该方法包括d)选出特征化的草药组合物;e)使生物系统与一批特征化的草药组合物接触并收集关于两种或多种标志的数据,其中标志之一是通过使用核酸微阵列确定的基因表达的变化,是通过下列步骤产生的iv)生成一个细胞库系统;v)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;vi)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;f)将步骤b)的标志数据储存起来作为标准化HBR阵列。
2.权利要求1的方法,它进一步包括g)使用两种或多种与在步骤b)中用的相同或不同的标志对更多批次的草药组合物重复步骤b)和c);h)将在步骤c)和d)中得到的HBR阵列结合在一起;和i)分析步骤e)的合并后的HBR阵列,生成特征化草药组合物的标准化HBR阵列。
3.权利要求1或2的方法,其中特征化草药组合物具有至少一种已知的生物应答。
4.权利要求1或2的方法,其中对于特征化草药组合物已知下列一项或多项化学测试、所用的植物部分、该特征化草药组合物中的一种或多种单个草药的生长条件、该特征化草药组合物中的一种或多种单个草药的收获前处理情况、该特征化草药组合物中的一种或多种单个草药的收获后处理情况、该特征化草药组合物的收获后处理情况、以及该草药组合物中单个草药的相对比例。
5.权利要求1或2的方法,其中细胞库系统包括一个主细胞库和一个工作细胞库。
6.权利要求5的方法,其中工作细胞库的细胞从主细胞库得到。
7.权利要求5的方法,其中使用来自工作细胞库的细胞对来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形加以描绘。
8.权利要求1或2的方法,其中基因表达的变化用核酸微阵列测定。
9.权利要求8的方法,其中所述表达水平因与草药组合物接触而发生变化的基因在以下标准的基础上进行选择在核酸微阵列中的信噪比约为2.5或更高,和差别表达率的变化约为1.5或更高。
10.权利要求8的方法,其中储存有关表达水平发生了变化的约10至约20000个基因的数据作为HBR阵列的一部分。
11.权利要求10的方法,其中储存有关表达水平发生了变化的约10至约1500个基因的数据作为HBR阵列的一部分。
12.一种评估草药组合物的方法,该方法包括a)使生物系统与一批草药组合物接触并收集关于两种或多种标志的数据,其中标志之一是通过使用核酸微阵列确定的基因表达的变化,是通过下列步骤产生的i)生成一个细胞库系统;ii)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;iii)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;b)将收集的标志数据与标准化HBR阵列对比,比较与批量草药组合物相同或基本相同的草药组合物,其中标准化HBR阵列含有关于基因表达的标志数据之一。
13.确定草药组合物是否满足标准规范的方法,该方法包括a)使生物系统与一批草药组合物接触并收集关于两种或多种标志的数据,其中标志之一是通过使用核酸微阵列确定的基因表达的变化,是通过下列步骤产生的i)生成一个细胞库系统;ii)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;iii)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;b)将收集的标志数据与标准化HBR阵列对比,比较与批量草药组合物相同或基本相同的草药组合物,其中标准化HBR阵列含有关于基因表达的标志数据之一;和c)确定在可接受的水平内具有与标准化HBR阵列类似的标志数据的草药组合物。
14.权利要求13的方法,其中所述确定在可接受的水平内具有与标准化HBR阵列类似的标志数据的草药组合物的步骤是定量或定性的测定。
15.权利要求13或14的方法,其中标准化HBR阵列包括每种标志的可接受的变异范围。
16.调节草药组合物的组分使其符合相同或基本相同的草药组合物的标准规范的方法,该方法包括a)使生物系统与一批草药组合物接触并收集关于两种或多种标志的数据,其中标志之一是通过使用核酸微阵列确定的基因表达的变化,是通过下列步骤产生的i)生成一个细胞库系统;ii)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;iii)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;b)将收集的标志数据与标准化HBR阵列对比,比较与批量草药组合物相同或基本相同的草药组合物,其中标准化HBR阵列含有关于基因表达的标志数据之一,且其中标准化HBR阵列还包括每种标志的可接受的变异范围;c)确定该草药组合物是否具有在标准化HBR阵列的可接受的变异水平内的标志数据;和d)如果标志数据不在标准化HBR阵列的可接受的变异水平内,则调节该草药组合物的组分。
17.权利要求16的方法,其中重复步骤(a)-(d),直到草药组合物的标志数据在标准化HBR阵列的可接受的变异水平内。
18.改变草药组合物的组分使其满足另一种草药组合物的标准规范的方法,该方法包括a)使生物系统与一批草药组合物接触并收集关于两种或多种标志的数据,其中标志之一是通过使用核酸微阵列确定的基因表达的变化,是通过下列步骤产生的i)生成一个细胞库系统;ii)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;iii)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;b)将收集的标志数据与标准化HBR阵列对比,比较另一种草药组合物与批量草药组合物,其中标准化HBR阵列含有关于基因表达的标志数据之一,且其中标准化HBR阵列还包括每种标志的可接受的变异范围;c)确定该草药组合物是否具有在标准化HBR阵列的可接受的变异水平内的标志数据;和d)如果标志数据不在标准化HBR阵列的可接受的变异水平内,则改变该草药组合物的组分。
19.权利要求18的方法,其中重复步骤(a)-(d),直到草药组合物的标志数据在标准化HBR阵列的可接受的变异水平内。
20.预测草药组合物的生物活性的方法,该方法包括a)使生物系统与一批草药组合物接触并测量两种或多种标志的不同应答,其中标志之一是通过使用核酸微阵列确定的基因表达的变化,是通过下列步骤产生的i)生成一个细胞库系统;ii)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;iii)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;其中那组不同应答的测量结果构成草药生物应答阵列(HBR阵列)数据集;b)将批量草药组合物的HBR阵列与特征化草药组合物的至少一种先前得到的HBR阵列对比,其中先前得到的HBR阵列含有关于基因表达的标志数据之一;和c)在步骤b)中进行的HBR阵列比较的基础上预测批量草药组合物的生物活性。
21.测量草药组合物与特征化草药组合物的关联性的方法,该方法包括a)使生物系统与一批草药组合物接触并测量两种或多种标志的不同应答,其中标志之一是通过使用核酸微阵列确定的基因表达的变化,是通过下列步骤产生的i)生成一个细胞库系统;ii)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;iii)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;其中那组不同应答的测量结果构成草药生物应答阵列(HBR阵列)数据集;b)将批量草药组合物的HBR阵列与特征化草药组合物的至少一种先前得到的HBR阵列对比,其中先前得到的HBR阵列含有关于基因表达的标志数据之一;和c)在步骤b)中进行的HBR阵列比较的基础上确定草药组合物与特征化草药组合物的关联性。
22.预测草药的新的治疗应用的方法,该方法包括a)使生物系统与一批草药组合物接触并测量两种或多种标志的不同应答,其中标志之一是通过使用核酸微阵列确定的基因表达的变化,是通过下列步骤产生的i)生成一个细胞库系统;ii)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;iii)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;其中那组不同应答的测量结果构成草药生物应答阵列(HBR阵列)数据集;b)在预测的HBR阵列中的标志的生物活性的基础上预测新的治疗应用。
23.确定由草药组合物中的单个化学物质诱导的基因表达图形的方法,该方法包括a)生成一个细胞库系统;b)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;c)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志并将它们放到HBR阵列中;d)比较在步骤(c)中生成的HBR阵列与标准化HBR阵列,找出类似或改进的草药组合物;e)确定草药组合物的单个化学物质的相对量;和f)比较单个化学物质的量与步骤(b)的结果,以鉴别表达水平因草药组合物中单个化学物质的量改变而发生变化的那些基因。
24.不从复杂混合物诸如草药组合物中提取化学物质而确定由复杂混合物中的单个化学物质诱导的基因表达图形的方法,该方法包括a)生成一个细胞库系统;b)描绘来自与草药组合物接触前后的细胞库系统的细胞的基因表达图形;c)选出表达水平因与草药组合物接触而发生变化的那些基因作为标志;d)比较所收集的标志数据与标准化HBR阵列,找出基本相同或改进的草药组合物;e)表征所述草药组合物的化学成分;f)比较鉴别出的化学组成,以鉴定草药组合物中单个化学成分的不同浓度;g)将不同的化学成分量与HBR阵列中的不同生物应答联系起来,以确定每种化学物质的特征生物应答。
全文摘要
本发明提供了指导草药组合物的标准化所必需的工具和方法,以确定草药组合物的引起任何特定生物活性的具体组分,预测特定草药组合物的生物活性,确定各草药组合物的关联性,以及开发改善的草药疗法。本发明提供了用于生成、保持、改善和利用草药生物应答阵列(HBR阵列)的工具和方法,其中HBR阵列构成了与特定草药组合物相联的数据集。本发明的HBR阵列含有基因表达图形,还可包括有关草药构成物的与植物相关的参数的信息、生物系统接触草药组合物后所收集到的标志信息、以及生物系统接触草药组合物后所收集到的生物应答信息。
文档编号C12N15/09GK1386135SQ01802006
公开日2002年12月18日 申请日期2001年3月9日 优先权日2000年3月9日
发明者龚忠恕, 白果能, 李御贤, 佘玉萍, 郑永齐 申请人:耶鲁大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1