用于比对大分子中的结合位点容积的系统和方法

文档序号:6465227阅读:215来源:国知局

专利名称::用于比对大分子中的结合位点容积的系统和方法用于比对大分子中的结合位点容积的系统和方法有关申请的交叉引用本申请要求于2007年6月27日提交的美国专利申请号11/823,697的优先权,通过引用将其全部内容纳入本申请。
背景技术
:1.发明领域本发明涉及用于比对大分子例如蛋白质和核酸分子中的结合口袋容积的方法、设备、媒介和信号。2.相关领域描述随着保藏在Brookhaven蛋白质数据银行l(BrookhavenProteinDatabankl,PDB)中的高解析大分子结构的出现,基于结构的药物设计变的更加可行。基于结构的设计技术的一个应用实例是开发新的人类免疫缺陷病毒l(HIV-l)蛋白酶抑制剂。见Rutenber等人,1993,J.Biol.Chem.268:15343-15346;Ghosh等人,1994,J.Med.Chem.37:2506-2508;和Lam等人,1994,Science263:380-384。小分子配体对接的先决条件是确定该配体与蛋白质相互作用的位点。这种小分子的结合位点是口袋(或者和可交替换地称作槽、沟、活性位点),其通常位于大分子例如蛋白质和核酸的分子表面附近。在本说明书中,术语"结合位点"是指大分子中任何可以与配体结合或者潜在结合的这种口袋。确定结合位点是合理设计和开发新配体的重要步骤。对已知大分子表面的结合位点的深入分析和分类也可能有利于理解配体的结合和选择过程。因为多种原因,很难对结合位点进行人工定义。在大多数情况下,很难对结合位点在哪里终止和自由空间从哪里开始进行定义。大分子可以具有各种大小的表面凹陷,人工检测可能不能够发现所有相关的结合位点而只能发现最大的结合位点。当必须处理大量大分子结构时(例如为了对口袋特征进行统计学研究),人工定义也是不切实际的。这些年来,对结合位点的自动化识别进行了若干尝试。例如,参见Levitt等人,1992,J.Mol.Graphics10:229-234;Voorinthold等人,1989,J.Mol.Graphics7,243-245;Delaney等人,1992,J.Mol.Graphics10:174-177;DelCa卬io等人,1993,J.Mol.Graphics11:2329;Kisljuk等人,1994,J.Mol.Graphics12:305-307;Masuya等人,1995,J.Mol.Graphics13:331-336;Laskowski等人,1995,J.Mol.Graphics13:323-330;以及Hendlich等人,1998,J.Mol.Graphics15:359-363。基于结构设计药物的一个重要方面是配体特异性和配体选择性。配体特异性结合耙大分子的结合位点是理想的。典型地,配体与耙大分子的结合位点的特异性结合可以以需要的方式改变该大分子的特性。例如,该大分子可以是酶,其酶活性可以通过配体特异性结合该酶的结合位点而被抑制或增强。但是,虽然配体可以特异性结合靶大分子的结合位点,但该配体还选择性地结合该结合位点是理想的。例如,假如该耙大分子是把标激酶(例如P38A激酶),且该耙标激酶与天然配体三磷酸腺普结合的活性位点是所述结合位点。在这个实例中,抑制该耙标激酶(例如抑制P38A的酶活性)是理想的。因此,需要能够特异性结合该耙标激酶活性位点(结合位点)的配体。但是,如果该配体还特异性地结合除该靶标激酶之外的许多其它类型激酶(例如激酶CDK2)的活性位点,则该配体就可能是毒性的,因为它可能会干扰细胞中由这些其它激酶调控的许多分子通路。以这种方式特异性结合许多不同大分子的配体不具有所需的选择性。另一方面,如果该配体只是特异性地结合耙标激酶的结合位点而不与其它激酶结合,则该配体就具有所需的选择性。识别和分析大分子结合位点的现有程序具有重要用途。但是,这些已知程序的一个缺点是它们不能方便地分析配体的选择性。此外,需要改进对大分子结合位点的分析,以使得潜在配体应具有的性质(例如,酸性、碱性、极性、非极性等)可视化而与该大分子结合位点所表现出的性质互补。因此,本领域需要改进识别和分析大分子口袋的系统和方法。发明概述本发明提供了具有多种有益用途的方法、设备、媒介和信号,所述用途包括但不限于识别用于配体设计的载体、快速生成配体选择性^f艮设和鉴定不同大分子的结合口袋的共同容积以处理多个靶标。在一个实施方案中,用a球快速鉴定大分子结合位点,随后对该结合位点容积进行绘图比对和数字比对。该绘制的容积图定义形成在该大分子结合位点中潜在配体可使用的容积。该容积图可以通过以下方式被强化,例如用颜色编码形成相互作用图,该相互作用图定义了配体原子为了实现与该大分子的结合位点的互补性所采用的预期的作用类型(例如疏水、静电等)。相关大分子容积图的交集可以用来识别能够用来实现选择性的独特区域。具体地,本发明的一个方面提供了评价大分子结合位点的改进方法、设备、媒介和信号,其中该结合位点由多个残基排列形成,并且优选该结合位点没有配体。首先,识别该大分子的结合位点,然后确定该结合位点的结合位点容积图。该结合位点容积图包括具有多个区域的表面。相互作用图如下形成将该结合位点容积图的表面的多个区域的各个单独区域基于第一特征进行分类,该第一特征与该大分子的与该单独区域最接近的部分的第二特征互补,从而形成相互作用图。将该相互作用图输送到使用者界面装置、显示器、计算机可读存储介质、计算机可读存储器、或者本地或远程计算机系统。或者,该结合位点容积图也可以被显示出来。在一些实施方案中,所述大分子是蛋白质,而在其它实施方案中,该大分子是核酸。在一些实施方案中,所述识别步骤包括用能量函数、基于网格的算法、几何算法、分类法、或直接方法来搜索所述大分子的模型中的所述结合位点。当然,该大分子可以具有多个结合位点,其每个结合位点可以用本发明的系统和方法单独分析。在一些实施方案中,所述识别步骤包括用a球(一种识别结合位点的几何方法)来搜索该大分子的模型中的结合位点。在一些实施方案中,所述大分子中与所述结合位点容积图的表面的多个区域中的单独区域最接近的单独部分的第二特征是最接近所述大分子的所述单独部分的多个残基中残基的一个或多个原子的疏水性。在一些实施方案中,所述大分子中与所述结合位点容积图的表面的多个区域中的单独区域最接近的单独部分的第二特征是最接近所述大分子的所述单独部分的多个残基中残基的一个或多个原子的溶剂暴露的量。在一些实施方案中,所述大分子中与所述结合位点容积图的表面的多个区域中的单独区域最接近的单独部分14的第二特征是最接近所述大分子的单独部分的残基的一个或多个原子中的每个是酸性的、^喊性的、疏水性的、或溶剂暴露的分类。在一些实施方案中,所述将所述结合位点(口袋)容积图的表面的多个区域的单独区域进行分类包括基于与该单独区域最接近的一个或多个原子的特征对该单独区域进行着色。在一些实施方案中,所述识别步骤包括生成a球的以下步骤。在步骤(i)中,确定所述大分子的每个原子的Voronoi区,从而确定多个Voronoi区。在步骤(ii)中,确定所述多个Voronoi区中的每个Voronoi顶点,从而确定多个Voronoi顶点。在步骤(iii)中,给所述多个Voronoi顶点中的每个Voronoi顶点分配a球,从而确定多个a球。在任选步骤(iv)中,去除第一多个a球中直径小于第一阈值的a球和该多个a球中直径大于第二阈值的a球,从而识别出过滤的第二多个a球。在步骤(v)中,基于每个单独球与所述大分子的原子形成氢键的能力,将所述第二多个a球中的所述单独球分类成亲水球或疏水球。在步骤(vi)中,将所述第二多个a球中的a球聚集起来,从而形成多个候选结合位点,其中该多个候选结合位点中的每个单独候选结合位点包含所述第二多个o^求中的三个或更多个a^求,且其中在该三个或更多个a球中的至少一个a球是疏水性的。在步骤(vii)中,根据单独候选结合位点与所述大分子形成的疏水性接触数量,对所述多个候选结合位点中的所述每个单独候选结合卩立点进行分级,从而形成一组分级的候选结合^立点。在步骤(viii)中,从所述一组分级的候选结合位点中确定所述结合位点。在一些实施方案中,本发明方法还包括在聚集步骤(vi)之前去除所述第二多个a球中的几乎完全相同的a球。在一些实施方案中,所述确定步骤(viii)中包括接受使用者在所述多个候选结合位点中选择候选结合位点,其中该使用者选择的候选结合位点被认为是所述结合位点。在一些实施方案中,所述确定步骤(viii)中包括将所述分级的候选结合位点组中与所述大分子具有最大数量的疏水接触的候选结合位点视为所述结合位点。在一些实施方案中,所述聚集步骤(vi)中包括单一联结聚集所述第二多个a球中的多个。在一些实施方案中,通过将网^f各置于所述结合位点的a球上来确定该结合位点的结合位点容积图,其中该网格包括多个网格点。将所述结合位点容积图识别为所述网格中的所有网格点,该所有网格点同时满足(a)落入所述结合位点图的a球内和(b)位于所述大分子的至少一个原子的预定距离内。在一些实施方案中,该预定距离是1.2埃-2.0埃之间。在一些实施方案中,该预定距离是1.35埃-1.85埃之间。在一些实施方案中,该结合位点容积图的表面的多个区域的每个单独区域是一个上述识別的网格点,且该大分子与该单独网格点最4^近的部分的第二特征是最接近该网格点的氨基酸残基的一种或多种分子性质(例如,下表1中列出的氨基酸分子性质)。本发明的另一方面提供了比较第一大分子的第一结合位点与第二大分子的第二结合位点的方法,其中该第一和第二结合位点优选没有配体。该方法包括识别该第一大分子的第一结合位点以及该第二大分子的第二结合位点。该方法还包括基于该第一结合位点确定第一结合位点容积图,以及基于该第二结合位点确定第二结合位点容积图。然后生成包括该第一结合位点容积图和该第二结合位点容积图的容积组合的第三结合位点容积图。将该第三结合位点容积图输出到用户界面装置、显视器、计算机可读存储介质、计算机可读存储器、或者本地或远程计算机系统,或者显示该第三结合位点容积图。在一些实施方案中,该第一大分子是第一蛋白质,该第二大分子是第二蛋白质。在一些实施方案中,该第一大分子是第一核酸,该第二大分子是第二核酸。在一些实施方案中,所述对第一大分子的第一结合位点的识别包括用能量函数、基于网格的算法、几何算法、分类法、或直接方法来搜索该第一大分子的第一模型的该第一结合位点。在一些实施方案中,该对第一大分子的第一结合位点的识别包括用a球(一种识别结合位点的几何方法)来搜索该第一大分子的第一模型的该第一结合位点。在一些实施方案中,所述对第二大分子的第二结合位点的识别包括用能量函数、基于网格的算法、几何算法、分类法、或直接方法来搜索该第二大分子的第二模型的该第二结合位点。在一些实施方案中,该对第二大分子的第二结合位点的识别包括用a球来搜索该第二大分子的第二模型的该第二结合位点。在一些实施方案中,所述容积组合是所述第一结合位点容积图和所述第二结合位点容积图的合并。在一些实施方案中,该容积組合是所述第一结合位点容积图和所述第二结合位点容积图的差别。在一些实施方案中,该容积組合是所述第一结合位点容积图和所述第二结合位点容积图的交集。在一些实施方案中,该容积组合是所述第一结合位点容积图和所述第二结合位点容积图的平均。在一些实施方案中,该容积组合是独特性函数,且所述第三结合位点容积图由(i)所述第一结合位点容积图中不与所述第二结合位点容积图共有的那些部分和(ii)所述第二结合位点容积图中不与所述第一结合位点容积图共有的那些部分組成。在一些实施方案中,所述第一结合位点的识别包括以下步骤。在步骤(i)中,确定所述第一大分子的每个原子的所述Voronoi区,从而确定多个Voronoi区。在步骤(ii)中,确定所述多个Voronoi区中的每个Voronoi顶点,从而确定多个Voronoi顶点。在步骤(iii)中,给所述多个Voronoi顶点中的每个Voronoi顶点分配a球,从而确定第一多个a球。在任选步骤(iv)中,去除所述第一多个a球中直径小于第一阈值的a球和该多个a球中直径大于第二阈值的a球,从而识别出筛选的第二多个a球。在步骤(v)中,基于每个单独球与所述大分子的原子形成氢键的能力,将所述第二多个a球中的所述单独球分类成亲水球或疏水球。在步骤(vi)中,将所述第二多个a球中的a球聚集起来,从而形成多个候选结合位点,其中该多个候选结合位点中的每个单独候选结合4立点包含所述第二多个a球中的三个或更多个a球,其中在该三个或更多个a球中的至少一个a球是疏水性的。在步骤(vii)中,根据单独候选结合位点与所述大分子形成的疏水性接触的数量,对所述多个候选结合位点中的所述每个单独候选结合4立点进行分级,从而形成一组分级的候选结合位点。在步骤(viii)中,从所述一组分级的候选结合4立点中确定所述结合4立点。在一些实施方案中,本发明的方法还包括在所述聚集步骤(vi)之前去除所述第二多个a球中的几乎完全相同的a球。在一些实施方案中,所述确定步骤(viii)中包括接受使用者在所述多个候选结合位点中选择候选结合位点,其中该使用者选择的候选结合位点被认为是所述第一结合位点。在一些实施方案中,所述确定步骤(viii)中包括将所述分级的候选结合位点组中与所述大分子具有最大数量的疏K接触的候选结合位点视为所述所述结合位点。在一些实施方案中,所述聚集步骤(vi)包括单一联结聚集所述第二多个a球中的多个。在一些实施方案中,所述对第一结合位点容积图的确定包括将网格置于该第一结合位点的(X球上,其中该网格包括多个网格点。然后,将所述第一结合位点容积图识别为所述网格中的所有网格点,该所有网格点同时满足(a)落入所述结合位点图的a球内和(b)位于所述第一大分子的至少一个原子的预定距离内(即,该网格点必须同时满足标准(i)和(ii》。在一些实施方案中,该预定距离是1.2埃-2.0埃之间。在一些实施方案中,该预定距离是1.35埃-1.85埃之间。在一些实施方案中,由所述第三结合位点容积图(复合结合位点容积图)生成相互作用图,其中该结合位点容积图中的每个网格点被分配有第一特征,该第一特征与所述大分子中与该单独网格点最接近的部分的第二特征互补。在一些实施方案中,所述大分子中与该单独网格点最接近的部分是残基且该第二特征是该残基的一种或多种分子性质(如,下表l列出的氨基酸的分子性质)。本发明另一方面^是供了存储计算机程序产品的计算机可读介质,该计算机程序产品可用计算机执行以评价大分子的结合位点。该计算机程序产品包括用于识別所述大分子的结合位点的指令,其中该结合位点由多个残基排列形成并且该结合位点任选但优选没有配体。该计算机程序产品还包括确定所述第一结合位点的结合位点容积图的指令,其中该结合位点容积图包括具有多个区域的表面。该计算机程序产品还包括将所述结合位点容积图的表面的多个区域的各个单独区域(如该结合位点容积图中的网^"点)基于第一特征进行分类从而产生相互作用图的指令,该第一特征与该大分子的与该单独区域最接近的部分的第二特征互补。在一些实施方案中,该计算机程序产品还包括将相互作用图输出到用户界面装置、显示器、计算机可读存储介质、计算机可读存储器、或者本地或远程计算机系统。或者或另外,在一些实施方案中,该计算机产品包括显示所述结合位点容积图的指令。本发明的另一个方面包括评价大分子结合位点的设备,该设备包括处理器和与处理器相连的存储器。该存储器存储包括用于识别所述大分子的结合位点的指令的模块,其中该结合位点由多个残基排列而成且该结合位点任选但优选没有配体。该模块还包括用于确定所述第一结合位点的结合位点容积图的指令,其中该结合位点容积图包括具有多个区域(例如,网格点)的表面。该模块还包括将所述结合位点容积图的表面的多个区域的各个单独区域基于第一特征进行分类从而产生相互作用图的指令,该第一特征与该大分子的与该单独区域最接近的部分(如与所述大分子最接近的残基)的第二特征互补。在一些任选的实施方案中,该模块还包括将所述相互作用图输出到用户界面装置、显视器、计算机可读存储介质、计算机可读存储器、或者本地或远程计算机系统的指令。在一些任选实施方案中,该模块包括显示所述结合位点容积图的指令。本发明的另一个方面包括存储计算机程序产品的计算机可读介质,该产品可由计算机执行以比较第一大分子的第一结合位点与第二大分子的第二结合位点,其中该第一结合位点和该第二结合位点任选但优选没有配体。该计算机程序产品包括用于识别该第一大分子的第一结合位点以及该第二大分子的第二结合位点的指令。该计算机程序产品还包括基于该第一结合位点确定第一结合位点容积图以及基于该第二结合位点确定第二结合位点容积图的指令。该计算机程序产品还包括生产第三结合位点容积图的指令,该第三结合位点容积图是该第一结合位点容积图和该第二结合位点容积图的容积组合。20该计算机程序产品任选地包括将将第三结合位点容积图输出到用户界面装置、显视器、计算机可读存储介质、计算机可读存储器、或者本地或远程计算机系统的指令。该计算机程序产品任选地包括显示该第三结合位点容积图的指令。本发明的另一方面提供了对第一大分子的第一结合位点与第二大分子的第二结合位点进行比较的设备,其中该第一和第二结合位点任选但优选没有配体。该设备包括处理器和与处理器相连的存储器。该存储器存储包括识别该第一大分子的第一结合位点以及该第二大分子的第二结合位点的指令的模块。该存储器还存储基于该第一结合位点确定第一结合位点容积图以及基于该第二结合位点确定第二结合位点容积图的指令。该存储器还存储生成第三结合位点容积图的指令,该第三结合位点容积图是该第一结合位点容积图和该第二结合位点容积图的容积组合。该存储器还任选地存储将第三结合位点容积图输出到用户界面装置、显视器、计算机可读存储介质、计算机可读存储器、或者本地或远程计算机系统的指令。该存储器还任选地存储显示第三结合位点容积图的指令。附图简述图1显示了用于比对大分子例如蛋白质和核酸中的结合位点并根据本发明的各个方面比较大分子结合位点的装置;图2显示了根据本发明的实施方案对大分子的结合位点容积进行比对的方法;图3显示了在二维中对一组零半径原子的Vorinoi解构,其中原子以较大实心圆表示,Voronoi区fe戈边界以线表示;图4显示了根据本发明的一个实施方案比较大分子结合位点的方法;图5A显示了大分子P38A和JNK之间的复合结合位点容积,该复合结合位点容积是根据本发明的一个实施方案的交叉容积;图5B显示被叠加在结合位点容积图上的抑制剂R1487,该结合位点容积图是根据本发明的一个实施方案的P38A和JNK结合位点容积图的交集;图5C显示R1487的分子结构;图6A显示被叠加在容积图上的抑制剂R07125,该容积图是P38AA激酶的结合位点容积图与JNK3激酶的结合位点容积图的容积组合,其中在该容积组合中只保留了P38AA结合位点容积图所独有的那些区域。在本发明中,可以根据P38AA结合位点容积图的特征对该独特容积的表面进行颜色编码;图6B显示R07125的分子结构。图7A显示被叠加在容积图上的抑制剂R09552,该容积图是P38AA激酶的结合位点容积图与JNK激酶的结合位点容积图的容积组合,其中在该容积组合中只保留了P38AA结合位点容积图所独有的那些区域;图7B显示R09552的分子结构;图8显示根据本发明的一个实施方案结合P38AA激酶结合位点的抑制剂R06257和绘制的该结合位点的相互作用图。发明详述排列形成大分子折叠内的结合位点的残基定义形成配体结合位点的独特容积。对蛋白质结合位点进行比对本身提供了潜在抑制剂的预期性质和预期相互作用的"大分子角度"。然后可以研究相关分子结合位点的变化,以识别把选择性的区域。因此,本发明提供了评价大分子结合位点的系统和方法。该系统和方法在配体i殳计领域具有有益的应用。例如,本发明的系统和方法可以用于生成相互作用图,使得结合位点处的可用空间和预期的配体-大分子分子间作用可视化。此外,本发明的系统和方法才是供了分析配体交叉反应的新功能。这可通过对两个或多个大分子的结合位点容积图执行分组操作(交叉的、独有的操作)来实现的。这种分組操作使得两个或多个大分子的结合位点之间的相同和不同变得可视。^#我,秀鍵。图1详细示出了执行在此所述的任何方法的示例性系统。该系统优选是计算机IO,具有中央处理单元22;主非易失性存储单元14,例如硬盘驱动器,用于存储软件和数据,存储控制器12控制该存储单元14;系统存储器36,优选高速随机存储器(RAM),用于存储系统控制程序、数据和应用程序,包括从非易失性存储单元14中下载的程序和数据;系统存储器还可以包括只读存储器(ROM);用户界面32,包括一个或多个输入装置(例如,键盘28)和显示装置26或其它输出装置;网络接口卡或其它通信电路系统20,用于将任何有线或无线的通信网络34(例如广域网如因特网)连接起来;内部总线30,用于将系统的上述各元件内部连接起来;和电源线24,用于为上述元件i^共能源。计算机10的操作基本上由操作系统40来控制,该操作系统40由中央处理单元22来执行。操作系统40可以被存储在系统存储器36中。除了操作系统40外,在典型的执行中,系统存储器36包括文件系统42,用于控制对所述系统和方法所使用的各种文件和数据结构的访问;模型库44,包括多个大分子46的模型(例如,通过X线晶体测量、核磁共振、同源模型、或者其它光谱方法或模型方法确定的模型),其中每个模型包括大分子的多个原子坐标;结合位点识别模块48,用于确定大分子的一个或多个候选结合位点,以及任选地将大分子的一个结合位点识別为结合位点50j结合位点容积图确定模块54,用于确定大分子模型46的结合4立点50的结合^立点容积图56;相互作用图构建模模块58,用于将大分子模型46的结合位点容积图56的表面的多个区域的各个单独区域基于该大分子中与该区域最接近的多个残基中的一个或多个残基的特征进行分类,从而产生大分子46的结合^[立点50的相互作用图60;和容积组合模块62,用于生成复合结合位点容积图64,该图64是至少第一结合位点容积图56和第二结合位点容积图56的容积组合。24如图1中所示,计算机io包含软件程序模块和数据结构。储存在计算机10中的该数据结构包括模型库44、模型46、结合位点50、结合位点容积图56、相互作用图60和复合结合位点容积图64。这些数据结构中的每一个均可包含任何形式的数据结构,包括但不限于ASCII或二进制文件、Excel表格、关系数据库(SQL)、或在线分析处理(OLAP)数据库(MDX和/或其变型)。此外,当采用ASCII或二进制文件的形式时,该数据结构可以是本领域通常已知的任何文件形式或其它形式。在一些实施例中,前述的各数据结构是单个的数据结构。在其它实施例中,这些数据结构实际上包含了可以或不完全可以由同一计算机IO运行的多个数据结构(例如数据库、文件、文档)。例如,在一些实施例中,模型库44和库中的模型46存储在计算机10上和/或计算机10通过广域网或因特网34可寻址的一或多台计算机上。因此,在一些实施例中,任何前述的数据结构可以(i)存储在计算机10上;(ii)存储在计算机10和计算机10通过例如广域网34可寻址的其它计算机(图1中未显示)的組合中;或(iii)全部远程存储在计算机IO通过例如广域网或因特网34可寻址的一或多台计算机中(图1中未显示)。和数据结构一样,应当理解图1所示的很多模块也可以处于一或多个远程计算机中。例如,在一些实施方案中,所公开的方法作为网络服务执行。在这些实施方案中,结合口袋识别模块48、结合位点容积图确定模块54、相互作用图构建模块58和/或容积组合模块62可以驻留在通过网络34与计算机10通讯的客户计算机上。在一些实施方案中,例如,结合口袋识别模块48、结合位点容积图确定模块54、相互作用图构建模块58和容积组合模块62的任意组合可以是交互的网页。鉴于前述内容,只要这些数据结构和软件模块通过网络34或通过其它电子手段可以彼此寻址,图1所示的数据结构和软件模块在一或多台计算机上的任何设置均在本发明的范围内。因此,本发明完全涵盖一组宽泛的计算机系统。芈,义^f潜合在^。目前已经公开了示例性计算机系统。参考图2,公开了评价大分子46(例如蛋白或核酸)的结合位点50的方法。,_|f202。在该方法中,在步骤202识别大分子46的结合位点50。在此使用的术语"大分子"和"大分子的模型"可互换使用。该结合位点由多个残基排列而成且在结合位点识别阶段通常是没有配体的。该大分子46可以是例如蛋白质、肽、蛋白质-蛋白质复合体、蛋白质-核酸复合体或核酸。大分子46的结合位点是与底物或配体特异性结合以完成生物学功能的大分子表面的位点。例如,在蛋白质的例子中,该生物学功能可以是蛋白活性,例如酶活性。识别排列形成结合位点的蛋白质的多个残基有助于合理化药物设计,其中抑制剂经设计与这些残基相互作用。与排列組成结合位点的残基发生紧密相互作用的抑制剂(抑制剂与大分子结合位点特异性结合)预期将抑制蛋白质的某些特征,包括但不限于与蛋白质相关的酶活性。因此,预测蛋白质和其它大分子的结合位点是计算分子生物学中的重要挑战。见Irving等,2001,Protein42,378-382,其被引入本文作为参考。在一些实施例中,使用结合位点识别模块48识别大分子46的结合位点50。可以使用任何空腔探测法(cavityfinderprotocol)在步骤202中找到大分子上的结合位点。因此,任何这样的空腔探测法可作为结合位点识别模块48。用于寻找结合位点的示例性方法在以下题为"识别大分子中的结合位点的示例性方法"的章节中说明。在一实施例中,使用a球来识别所述大分子的结合位点,a球是寻找结合口袋的几何(非基于能量的)方法的一种形式。使用a球对蛋白质结构中的结合4立点比-于已经由ChemicalComputingGroup(Montreal,QuebecCanadaH3A2R7)的Labute和Santavy"i兌明且在ChemicalComputingGroup的程序SiteFinder中执行。a球(也见Edelsbr腿er等,1995,Pro"Ofthe28thAnnualHawaiiIntl.Conf.onSystemScience25-264,其被引入本文作为参考)是半径变化的球,其必须与受体边界上的四个原子接触且不包括任何内部的原子。注意与四个原子接触的球是独特的没有其它球接触相同的四个原子。a球的特别例子是接触三个原子的空的半空间(half-space)(通过平面与另一半分隔的一半空间)。这样的半空间在此被认为是具有无穷半径的a球,其具有与第四个接触点一样的无穷性。使用以下方法识别a球。首先,确定蛋白中每个原子的Voronoi区域。这^皮称作空间的Voronoi解构。在三维中,四个Voronoi区域相交的点被称为Voronoi顶点。这些Voronoi顶点形成a球的中心。因此,》会定组成大分子的一组原子,寻找a球的问题可;f皮转化为寻找空间的Voronoi解构的问题。MolecularOperatingEnvironment(MOE)使用快速法,该方法允许在若干秒/蛋白而非若干分钟/蛋白内将这些a球收集进Vorinoi顶点。在SiteFinder中执行的MOE法中,使用"垂直"距离定义,其将与表示原子的球的距离定义为沿切线到表示原子的球和切线的相交点的距离距离(点A,球B)二距离(点A,球心B)-半径B这导致了具有线性边界的计算机易处理的Vorinoi区域,而不显著影响生成的a球的位置。图3显示了在二维中对一组零半径原子的Vorinoi解构。原子显示为实心的较大的圆。Voronoi区域的边界显示为线。Voronoi顶点是这些线的顶点。在二维中,Voronoi顶点l叉是三个而非四个Voronoi区域的交点。大的细圈显示了一个a球。优选地,根据大小对a球进行过滤。将表示无法进入的紧密结合位点的较小的球和表示溶剂暴露区域的非常大的球去除,而保留表示可被配体占据的区域的中间大小的球。在MOESiteFinder程序中,产生在四面体内的a球。四面体的中心是a球的球心,且由四面体的中心画出的线是a球的"轴"。将满足以下各条件的a球保留(i)球半径小于5A,没有四面体轴超过40A,且仅有一个四面体轴超过6A。在一些实施方案中,使用额外的条件以确保位于深口袋中的a口袋被保留。因此,为了保留紧密的亚口袋(sub-pocket)而不过度增加大(x球区域内的口袋大小,仅对具有1.1埃或更小的半径的a球增加緩冲,该緩冲将a球半径增大1埃。将各a球分为亲水的或疏水的。经排列可与大分子的原子形成氢键的a球^L归为亲水的。因此位于氢键供体(例如连接在电负性原子例如氧或氮上的氢)或氢键受体(例如氟、氧或氮)的氢键距离内的a球被归为亲水的。经排列不能与大分子的原子形成氢键的a球被归为疏水的。在一些实施例中,亲水的a球的探测半径被设为1.3埃,疏水的a球的探测半径被设为1.7埃。28随后,去除几乎完全相同的a球。例如,将半径彼此重叠的a球去除。此外,在一些实施方案中,将不靠近疏水球的亲水球去除,因为这些位点通常对应于7jc位点。随后通过^吏用单一联结聚类算法(single-linkageclusteringalgorithm)将a球聚类来识别大分子结合位点。各候选结合位点由三个或更多个球组成,其中至少一个球是疏水的。在一些实施方案中,通过与受体的疏水接触的数量将候选结合位点分级,最高级位点具有最多的疏水接触。在一些实施方案中,多个候选结合位点被显示并可供选择。候选结合位点也可以由用户基于对大分子结合口袋的了解而结合起来。最终,在典型实施方案中,尽管大分子可具有若干候选结合位点,但选择单个候选结合位点进行分析。2似.^4'潜^^t《容我^。在步骤204中,确定大分子46的结合位点容积图56。在一些实施方案中,由结合位点容积图确定模块54确定结合位点容积图56。在一些实施方案中,容积图确定模块54包含与MolecularOperatingEnvironment(MOE)—同使用以计算结合位点容积图56的用户Sv1脚本(customSvlscript)。在一些实施方案中,通过将三维盒拟合到通过结合位点识别模块48识别的结合位点50上确定结合位点容积图56。例如,考虑使用a球识别大分子结合位点50的情况,三维盒被拟合在a球上。三维盒的各维由a球或选定的虚拟原子限定。例如,在一些实施方案中,三维盒的最小x-维定义为在x-维上组成结合位点的任意一个a球的任何部分占据的最小值,三维盒的最大x-维定义为在x-维上組成结合位点的任意一个a球的任何部分占据的最大值,三维盒的最小y-维定义为在y-维上组成结合位点的任意一个a球的任何部分占据的最小值,三维盒的最大y-维定义为在y-维上组成结合位点的任意一个a球的任何部分占据的最大值,三维盒的最小z-维定义为在z-维上組成结合位点的任意一个a球的任何部分占据的最小值,三维盒的最大z-维定义为在z-维上组成结合位点的任意一个a球的任何部分占据的最大值。应当理解三维网格盒不是必需的。其仅提供用于确保各a球内的网格点以均一的方式分布的计算上便捷的方法。用于确保所有网格点在组成结合位点50的多个a球中均一分布的其它方法也已被使用。在一些实施方案中,用于填充a球的网格点间隔l.OA。可选地,可使用小于或大于1.0A的均一间隔。例如,在笛卡尔三维的各维中,网格点可均一地间隔0.5A。在另一实施例中,在笛卡尔三维的各维中,网格点可均一地间隔1.5A。可被用于间隔三维中的网格点的其它可能的均一间隔值包括但不限于0.lA、0.2A、0.3A、0.4A、0.5A、0.6A、0.7A、0.8A、0.9A、l.OA、l.lA、1.2A、1.3A、1.4A和1.5A,或0.lA和3.0A之间的任意值。一旦将三维盒拟合在网格点上,落入a球内且在大分子46的任意原子的预定距离内的所有网格点被保留。在一些实施方案中,该预定距离在1.2埃到2.0埃之间。在一些实施方案中,该预定距离在1.35埃至1.85埃之间。在一些实施方案中,该预定距离是1.4A。在一些实施方案中,该预定距离是1.8A。满足这些条件的网格点形成了大分子46的结合位点容积图50。在一些实施方案中,将虛拟原子置于被保留的各网格点上且在网格点上绘出三维表面(例如Connolly表面、范德华表面或溶剂可及表面)。关于这些表面的计算,参见例如,Connolly,1983,J.Appl.Cryst.16:548-558,其被引入本文作为30参考。在一些实施方案中,结合位点容积图的表面被计算并显示为Pymol(DeLano,"ThePyMOLMolecularCraphicsSystem",DeLanoScientificLLC,PaloAlto,California)高斯表面。在本文中,填充结合口袋的网格点和在这些网格点上绘出的任何三维表面可互换地被称为结合容积图56。此外,结合位点50的任何其它三维表示形式被视为结合位点容积图56。在一具体实施方案中,结合容积图56包含网4各点,这些网4各点可作为MolecularOperatingEnvironment的输出的常规网才各的一組点被读入诸如PyMOL(DeLano,2007,DeLanoScientificLLC,PaloAlto,California)的程序。在该具体实施方案中,使用由PyMOL1.0版("map—new"命令)提供的电子密度图预测进程通过高斯求和将点随后转化成容积势。该进程通过三个步骤发生首先,将各网格点与具有单位占有空间和均一的各向同性温度因子的氢原子匹配。随后,根据Cromer和Mann的公式计算的原子散射因子从氢原子位置计算假电子密度势能图,并使用从X-PLOR(Bmnger,1993,X-PLOR3.1版ASystemforX-rayCrystallographyandNMR,YaleUniversityPress,NewHaven,(Wilson,1992,InternationalTablesforCiystallography,C巻Mathematical,Physical,andChemicalTables,KluwerAcademicPublishers,London)。第三,在计算的图中在恒定势能水平处画出等值面等高线。以上说明的如上识别的假电子密度计算是将网格上的一组点重新计算成可在分子建模例如PyMOL中容易地显示和处理的形式的一种方法。因此,使用的原子散射因子、温度因子和等值面势能水平没有物理意义,仅是为了显示目的而调试的参数。因此,通过试错法,可以确定使用30平方埃的温度因子计算的l.O埃网格上的1.75势能单位的等高线生成具有与输入的网格点的形状最适配的形状的光滑容积套(envelop)。但是,在一些实施方案中,用户可以根据需要调节显示的等高线以在一定的限度内延展或收缩容积。步4f206。在步骤206中,通过为大分子的结合位点生成相互作用图60来进一步改进结合容积图。相互作用图60使结合位点内的可用空间以及在配体和结合位点之间可能发生的相互作用能够容易地可视化。在典型实施方案中,通过相互作用图构建模块38构建相互作用图。根据相互作用类型对结合容积图56的区域进行表征来建立相互作用图60,所述相互作用类型是配体为实现与大分子的互补性而预期将采用的相互作用类型。这可被认为是结合位点在结合容积图上的"映射",其中该结合位点的性质以其互补的形式映射到结合容积图上。结合位点容积图56包含具有多个区域的表面。因此,在步骤206中,对结合位点容积图表面的多个区域中的每一单独区域根据与该大分子的相应部分的特征互补的特征进行分类,由此产生相互作用图。在一些实施方案中,这种分配(assignment)通过取结合容积图表面上的每个单独网格点并将属性分配给该单独网格点来实现,该属性分配基于(i)与该网格点最接近的a球的特征(例如,在a球如上所述被分配到疏水的或亲水的类型时),(ii)和结合位点内与该单独网格点最接近的残基的性质(例如,酸性、碱性、疏水性、亲水性或暴露的)的互补性,或(iii)与该单独网格位点最接近的表面的性质(例如静电势、疏水性、酸性等)。在一个例子中,如果大分子的对应部分是碱性的,则结合位点容积图表面的对应区域被分类为酸性的,因为这样的性质与大分子的对应部分的i威性互补。在另一个例子中,如果大分子的对应部分是酸性的,则结合位点容积图表面的对应区域被分类为碱性的,因为这样的性质与大分子的对应部分的酸性互补。在另一个例子中,如果大分子的对应部分是疏水的,则结合位点容积图表面的对应区域被分类为亲水的,因为这样的性质与大分子的对应部分的疏水性互补。在另一个例子中,如果大分子的对应部分是亲水的,则结合位点容积图表面的对应区域被分类为疏水的,因为这样的性质与大分子的对应部分的亲水性互补。在一些实施方案中,所述氨基酸组氨酸、赖氨酸和精氨酸被认为是^5威性的。因此,在一些实施方案中,当这些氨基酸的残基与在相互作用图中的网格点最接近时,该网格点被分配为酸性的以与碱性残基互补。在一些实施方案中,所述氨基酸天冬氨酸和谷氨酸被认为是酸性的。因此,当这些氨基酸的残基与在相互作用图中的网格点最接近时,该网格点被分配为碱性的以与酸性残基互补。以下表1列出了20种天然存在的氨基酸的性质。在一些实施方案中,结合容积图表面上的各网格点被分配一种性质,该性质与大分子中的最接近的氨基酸残基的一或多个性质互补。表1-20种天然存在氨基酸的性质<table>tableseeoriginaldocumentpage33</column></row><table><table>tableseeoriginaldocumentpage34</column></row><table>此外,在本发明中不要求基于严格的分类标准对结合位点容积图表面的各单独区域进行分类(例如,亲水的与疏水的,碱性的与酸性的)。在一些实施方案中,结合位点容积图表面的各单独区域根据程度(例如,酸性程度、疏水性程度等)进行表征。例如,由于最靠近给定区域的大分子区域是碱性的,因此所述表面上的给定区域可被分配为酸性的。此外,基于大分子中与所给定区域最接近的区域碱性程度,给该给定区域分配一个是酸性的酸性程度(pH)。此外,这样的程度(例如,酸性程度)可以通过颜色标记且使各区域的颜色显示在相互作用图上。在一些实施方案中,大分子中与结合位点容积图表面的单独区域对应的部分(且因此对分配给该单独区域的特征是决定性的)是该大分子中与该给定区域最接近的残基中的一或多个原子。在一些实施方案中,大分子中与结合位点容积图表面的单独区域对应的部分是该大分子中与该给定区域最接近的残基中的一个原子。已经提供了可被分配给结合位点容积图的表面的区域以生成相互作用图的特征的一些例子。有利地,基于与大分子中最接近于所述单独区域的部分的性质互补的性质对相互作用图的各单独区域进行表征。在该方法中,相互作用图从大分子结合口袋的理想化配体的角度提供了独特视图。在一些实施方案中,大分子中对应于结合位点容积图表面的单独区域的区域最接近的残基中的一或多个原子。在一些实施方案中,大分子中对应于结合位点容积图表面的单独区域的部分是该大分子中与所述给定区域最接近的残基中的一个原子。在一些实施方案中,基于任何与大分子的对应部分的性质互补的理化、分子、或结构性质对结合位点容积图的单独区域进行表征。这些理化、分子、或结构性质的例子包括但不限于静电势、亲水性、酸性和溶剂可及性,以及曲率校正的溶剂可及性。这些性质中的一些性质的计算方法在例如Honig等,2003,MethodsEnzymol374,492-509中说明,该文献被完整引入本文作为参考。在一些实施方案中,基于任何与大分子的对应部分的对应性质互补的理化、分子、或结构性质给结合位点容积图的单独区域分配多个特征。例如,结合位点容积图的单独区域可^皮分配给以下特征的组合表示该单独区域的疏水性的疏水性值、静电势值、酸性(例如,以pH度量)、以及表示结合位点容积图的该单独区域的溶剂可进入性的溶剂可及性值,由此产生相互作用图。随后,为了更好地理解相互作用图(以及与相互作用图的性质近似或匹配35的任何配体)与大分子的结合口袋之间的互补性,用户可以在相互作用图的各种类型的特征之间进行转换。在一些实施方案中,当使用以上结合步骤204说明的基于网格的方法构建结合位点容积图时,为形成相互作用图而被表征的结合位点容积图的各单独部分是结合位点容积图表面上或表面附近的网4^点。此外,在一些实施方案中,在结合位点容积图上覆盖三维表面且基于与该单独区域最接近的网格点的基本性质对该三维表面的各相应区域进行着色。该三维表面可以是例如以上步骤204中所述的表面。,f2朋。在步骤208中,例如,将相互作用图输出给用户界面设备、显示器、计算机可读存储介质、计算机可读存储器、或当地的或远程计算机系统。可选地或额外的,显示结合位点容积图。^:衮义分f潜合扭^。参考图4,公开了比较第一大分子的第一结合位点和第二大分子的第二结合位点的示例性方法。为了便于介绍本发明,描述了比较第一大分子和第二大分子的方法。然而,在实践中,使用本发明所公开的技术并不限制同时比较的大分子的数量。在步骤402和404中,使用以上结合图2的步骤2公开的任何技术和/或在以下题为"识別大分子中的结合位点的示例性方法"章节中公开的技术识别第一大分子中的第一结合位点和第二大分子中的第二结合位点。如果需比较额外的大分子,同样识别这些大分子的结合位点。在步骤404和406中,使用以上结合图2的步骤4公开的任何技术确定基于第一结合位点的第一结合位点容积图和基于第二结合位点的第二结合位36点容积图。如果需比较额外的大分子,同样识别这些大分子的结合位点容积图。在步骤408中,生成第三结合位点容积图,该第三结合位点容积图包含第一结合位点容积图和第二结合位点容积图的容积组合。在一些实施方案中,这样的容积组合通过复合结合位点容积图64进行。如果需要比较额外的大分子,第三结合位点容积图是待比较的大分子的各个结合位点容积图的容积组合。在该方法中,可以比较不同大分子的结合位点容积图以识别例如结合口袋的合并、交叉、差别、独特的和平均的区域。通过这些操作或这些操作的组合形成的结合位点容积图在本文中被称为复合结合位点图。即使在使用多于两个的结合位点容积图来生成这样的结合位点容积图时,在本文中这样的结合位点容积图也可被互换地成为"第三结合位点容积图"。在一些实施方案中,可使用所述合并容积来确定落入任一所选的大分子的容积图中的所有网格点。在一些实施方案中,合并操作符给出势能图,其中每个点包含在任意所述输入结合位点容积图中在相同位置处发现的最大势能值。因此,对任何固定的等高线水平,这种图会产生等值面容积,该等值面容积包括在所述输入结合位点容积图中等高的容积的合并。该合并操作符可以以这样的方式将多个图结合在一起。在一些实施方案中,所述交叉容积由所选择的大分子的容积图中共有的网格点定义形成。在一些实施方案中,交集操作符给出复合结合位点容积图,其中每个点包含在任意所述输入结合位点容积图中在相同位置处发现的最小值。同样,对于任何固定的等高线水平,这种交集图会产生等值面容积,该等值面容积包括在所述输入结合位点容积图中等高的容积的交叉。在一些实施方案中,所述差别容积是复合结合位点图,其中通过比较第一大分子和其它大分子的每个所述结合位点容积图的相同位置处发现的势能值,第一大分子的结合容积位点图中的每个位置的势能降低。当显示这种"差别"结合位点容积图时,同时显示有正等值线和负等值线。在一些实施方案中,所述"独特的"操作符给出相同的图作为如上所述的"差别"操作符,不同仅在于该独特的复合结合位点容积图中的所有负值均被截短为零,并只显示正等值面等值线。在一些实施方案中,平均的结合位点容积图给出了其中每个点的势能值代表所有所述输入结合位点容积图的平均值的图。通常地,在进行容积组合之前,所述结合位点容积图必须被彼此互相叠加。为了确保正确的叠加(superposition),在一些实施方案中,将第一和第二大分子彼此叠加的叠加基质通常还用于互相叠加第一和第二容积图。在一些实施方案中,将第一和第二结合位点周围的区域叠加的叠加基质用于叠加第一和第二结合位点容积图。在一些实施方案中,当比较两个以上大分子的结合位点时,;波此叠加所有大分子的基质也用于相应的结合位点容积图,从而寸吏它们可以正确地;波此叠加。存在许多使所述第一和第二大分子可以互相叠加的方法,以提供用于第一和第二结合位点容积图的叠加基质,且所有的这些方法均包含在本发明的范围内。这些原则同样可用于两个以上分子的比对,但为了讨论,这些技术在此是针对仅两个分子被叠加的情况进行描述的。在一些实施方案中,至少排列形成所述第一和第二大分子的第一和第二结合位点的残基的骨架分子被彼此叠加,且来源于该叠加的叠加基质还用于第一和第二位点容积图,从而使它们彼此互相叠加。这种叠加通常需要将第一大分子中的残基与第二大分子中的残基进行比对。这种比对可以通过人工检查或已经在许多公众可获得的软件程序中执行的自动方法,如局部比对(如Smith-Watermanalgorithm,Smith和Waterman,1981,JournalofMolecularBiology.147:195-197,其在此引入本文4乍为参考)或全局比^j"(4口Needleman-Wunschalgorithm,Needleman禾口Wunsch,1930,JournalofMolecularBiology.48:443-53,其在此引入本文作为参考)来进行。在对多个大分子进行叠加的情况下也存在多种序列比对程序。例i口,参见Lassmann牙口Sonnhammer,2005,BMCBioinformatics6,298禾口Higgins等,1994,NucleicAcidsRes.22:4673-4680,其每一个在此均全文引入本文作为参考。一旦每个所述大分在初级序列水平得到比对,则使该大分子模型中相应原子间的距离最小化。一种这种最小化技术是使用kabsch最小方差方法(kabsch1978,ActaCrystallogrA34,827-828,其在此引入本文作为参考)使相应原子(如,形成排列形成所述第一和第二结合位点的残基的相应原子)的均方根差(RMSD)最小。在所述比对中,第一和第二大分子的哪些相应原子可以使用存在许多选择。例如,第一和第二大分子的所有骨架原子都可以用于该比对中,具有第二大分子中的相应原子的第一大分子的所有原子可以用于该比对中,等等。在优选的方法中,在所述结合位点的周围提取10埃的框架进行比对,且在每个该IO埃的框架中的每个大分子的残基(如,在两分子模型中具有对等物的这些残基的骨架原子或所有原子)被用作比对的基础。在其它实施方案中,框架的范围是5埃-40埃,基于被分析的结合口袋的大小来选择,且在该框架中的所有相应原子或所有原子均被用作所述叠加的基础。另外,存在许多比对算法可以用于所选組的相应原子的叠加,例如使用Damm等,2006,BiophysicalJournal90,4558-4573(其在此引入本文作为参考)的方法的高斯权重RMSF拟合法(Gaussian-weightedRMSFfit)。用于叠加多个大分子的软件也是可获得的。例如,参见Petrey和Honig,2003,MethodsinEnzymology374:492-509,其在此引入本文作为参考。一旦所述结合位点容积图被叠加,则可以进行所述图的容积组合。在一些实施方案中,该容积组合是每个所述结合位点容积图的合并。在这些实施方案中,在所述第三结合位点容积图是第一和第二结合图的组合的情况下,该复合结合位点容积图构成该第一和第二结合位点容积图中的各个空间等效点系列的最大值。因此,这些网格点形成的表面反应了该第一和第二结合位点容积图的组合。在一些实施方案中,在所述第三结合位点容积图示第一、第二和第三结合图的组合且这些图包含网格点的情况下,则该复合结合位点容积图构成该第一、第二和第三结合位点容积图中的各个空间等效点系列的最大值。因此,这些网格点形成的表面反应了该第一、第二和第三结合位点容积图的组合。本领域的普通技术人员能理解,这种容积组合图可以延伸到许多结合位点容积图(如3个或更多个、4个或更多个、IO个或更多个、2-100个等)的组合。这种复合结合位点图是有用的,例如用于定义在耙结合位点处由于氨基酸侧链的易变性而可用的区域,包括可用容积。在一些实施方案中,所述容积组合是第一结合位点容积图和第二结合位点容积图之间的差别。在这种实施方案的例子中,所述第三结合位点容积图(复合结合位点容积图)中的各个位置将具有第一结合位点容积图中相同位置的值,该值相对于每个其它结合位点容积图中的相同位置处的势能值降低。40有利的是,检查第三结合位点容积图(复合结合位点容积图)将会暴露第一结合位点容积图中的对应于第一大分子的、在其它大分子的结合位点容积图中没有发现的那些部分。这种视觉检查可以,例如通过在第三结合位点容积图上画出半透明或不透明的表面来进行。例如,这种图可以用如上讨论的方法结合步骤204画出。这种图在许多应用中都是非常有利的,如在了解酶底物选择性和基于结构的药物设计方面。第一大分子可以是被特异性结合所述第一结合口袋的抑制剂抑制的酶,而第二大分子(后来的大分子)可以是不希望抑制剂特异性结合的酶。第三结合位点容积图可以用于确定第一结合口袋中不与第二结合口袋(和后来的结合口袋)共有的区域。在一些实施方案中,所述容积組合是第一结合位点容积图和第二结合位点容积图的交集。在这种实施方案的例子中,所述复合结合位点容积图中的各个位置将具有在被組合形成该复合结合位点容积图的任何结合位点容积图中的等同位置处发现的最小值。有利的是,检查第三结合位点容积图将会暴露第一结合位点容积图中的在第二结合位点容积图中也发现有的那些部分。这种视觉检查可以,例如通过在第三结合位点容积图上画出半透明或不透明的表面来进行。这种图可以用如上讨论的方法在步骤204中画出。这种交叉的复合结合位点容积图在许多应用中都是非常有利的,如在了解结合口袋的哪些区域并不产生选择性方面。例如,第一大分子可以是被特异性结合所述第一结合口袋的抑制剂抑制的酶,而第二大分子可以是不希望抑制剂特异性结合的酶。该复合结合位点容积图可以用于确定第一结合口袋中不与第二结合口袋(和后来的结合口袋)共有,因而不提供产生酶选择性潜能的区域。41所述第一结合位点容积图的其它容积组合也是可能的。例如,所述容积組合是两个或多个结合位点容积图的平均。在另一例子中,该容积组合是一种独特性函数,其中所述第三结合位点容积图包括(i)第一结合位点容积图中不与第二结合位点容积图共有的那些部分;和(ii)第二结合位点容积图中不与第一结合位点容积图共有的那些部分。在一些实施方案中,第一和第二结合位点容积图构成网格点,且前述部分通过为各个单独的结合位点容积图中的每个网格点确定在其它结合位点容积图中的网格步长中是否存在等同网格点来识别。在这种情况下,所述复合结合位点容积图高亮显示第一结合位点所特有的区域。预期这个区域的配体占据部分或整个这个区域是该第一结合位点选择性的。其它的容积组合仍是可能的。例如,在一些实施方案中,所述容积组合是(i)第一和第二结合位点容积图的合并和(ii)第一和第二结合位点容积图之间的差别。在一些实施方案的另一例子中,该容积组合是(i)第一和第二结合位点容积图的交集和(ii)第一和第二结合位点容积图之间的差别。根据本说明书的公开,本领域的普通技术人员会理解,通过容积组合模块612产生的复合结合4立点容积图可以是两个或多个结合位点容积图的任何逻辑組合。而且,这种复合结合位点容积图可以通过使用,如合并操作符、交集操作符、差别操作符等而自身逻辑地组合。此外,该结合位点容积图可以存储在计算机10或计算机IO可寻址的计算机中,以备以后使用或分析。在步骤412中,所述第三结合位点容积图(复合结合位点容积图)表面的多个区域中的各个单独区域(如单独的网格点)任选地基于第一特征进行分类,该第一特征与所述第一大分子的与该单独区域最接近的部分(如第一大分子中与所述单独的网格点最靠近的残基)的第二特征互补,从而产生第三结合位点容积图的相互作用图。如上所述的任何分类技术结合图2的步骤206均可用于这种分类。在一些实施方案中,有利的是,这种相互作用图不仅高亮显示两大分子共有或独有的结合口袋的部分,还才是供了使配体应有的分子属性可视化的方便方法,以使用这种独特性。例如,在该相互作用图高亮显示第一和第二大分子间的差别的情况下,该相互作用图不仅高亮图示了配体选择性使用的区域,还显示了配体应该具有什么属性。在步骤414中,所述第三结合位点容积图(复合结合位点容积图)和/或相互作用图被输出到使用者界面装置、显示器、计算机可读存储介质、计算机可读存储器、或本地或远程计算机系统中。可选择地,该第三结合位点容积图和/或相互作用图4皮显示。本发明的所述结合位点容积图和相互作用图可以用许多商业可用的方法或公众可获得的软件程序来可视化,包括但不限于Gaussian92(Frisch,Gaussian,Inc.,匹兹堡,宾西法尼亚州),AMBER(Kollman,UniversityofCaliforniaatSanFrancisco);QUANTA/CHARMM(MoleularSimulations,Inc.,Burlington,Massachusetts),Insight11/Discover(BiosymTechnologiesInc.,SanDiego,California),MOE等值面或pymol(Delano,"ThePyMOLMolecularGraphicsSystem,"DelanoScientificLLC,PaloAlto,California)高斯表面。在此是指填充所述结合口袋的网格点和在该网格点上画出的任何三维表面,可替换地称作结合位点容积图56。另外,将结合位点50的任何其它三维表现形式都看作是结合位点容积图56。在此是指填充所述结合口袋的表征过的网格点和在该网格点上画出的任何三维表面,可替换地称作相互作用图60。识别大分子中的结合位点的示例性方法识别大分子中的结合位点的方法包括但不限于以下方法基于能量的方法基于网才各的方法、几何方法、分类方法和直4妻方法以及其組合。如下描述这些方法的非限制性例子處量才法。在方法如Goodford,1985,J.Med.Chem.28,849-857和Miranker,1991,Proteins:Structure,Function,andGenetics11,29-34(其每一个均在此引入作为参考)中,计算耙蛋白质和不同探针之间的相互作用能量,以试图定位能量偏好位点(energeticallyfavorablesites)。这些能量相关性程序通常需要将质子位置和部分电荷转移到受体原子。差f辨搭W才法。基于网格的方法的一个例子是Ligsite(Hendlich等,1997,JournalofMolecularGraphicsandModeling15,359-363,其在此引为参考)。在晶格上通过一系列操作识别结合口袋。儿/丁才法。识别大分子结合位点的另一方法是使用几何方法。几何方法需要靶大分子的三维坐标。这种方法探索靶大分子的表面而不需要使用能量模型。有许多不同类型的几何方法。几何方法包4舌但不限于MolecularOperatingEnvironment(MOE)中的工具(如2005.06版及以后的版本),其由ChemicalComputingGroup(Montreal,QuebecCanadaH3A2R7)销售;Proshape(Edelsbrunner和Koehl,2003,Proc.Natl.Acad.Sci.USA100:2203-2208,其在此引入本文作为参考);CAST(Prompanas等,2000,Bioinformatics16:915-922,其在此引入本文作为参考)和DelCarpio等,1992,J.Mol.44Graphics11,23-29(其在此引入本文作为参考)中的分析几何算法。其它的几何方法包括Kuntz等,1982,J.Mol.Biol.161,269-288;Ho和Marshall,1990,J.Comput,AidedMol,Design4,337-354和Bardford等,1988,Biochemistry27,6733-6741中公开的方法,这些文献各自在此引入本文作为参考。在另一确定大分子的结合位点的方法中,使用基于神经网络的方案来识别把序列表面的空穴。这些空穴认为是潜在的结合位点(Stahl&Schneider,2002,ProteinEngineering,13,83-99,其在此引入本文作为参考)。该神经网络方法已用于176种锌金属蛋白质酶系列。在大多数,但并不是所有情况下,耙大分子实际的结合位点是该分子表面上的5个最大空穴中的一个。在用于从耙序列相对应的三维表现形式中预测活性位点残基的相似方法中,已经定义了蛋白质活性位点的术语,也称"模糊的功能形式(fozzyfunctionalforms,FFF)"(Fetrow&Skolnick,1998,JournalofMolecularBiology281,949-968,其在此引入本文作为参考)。FFF来源于蛋白质的已知X射线晶体结构中的几何学、残基身份和对蛋白质活性位点的确认。FFF用于识别大分子自始的结合位点或各种大分子的线性模型。在一种方法中,对于蛋白质,已经将算法发展到使用靶分子的结构以预测该耙序列的酶类别。例如,称作TESS的算法已经发展到在蛋白质数据库(ProteinDataBank,PDB)中搜索用户定义的原子的空间组合(Wallace等,1997,ProteinScience6,2308-2323,其在此引入本文作为参考)。PDB是公众可获得的蛋白质的三维表现形式的数据库,其已用技术,如二维和三维核磁共振及X射线结晶学衍生化。TESS从PDB中保存的三维表现形式衍生出三维模板。使用TESS,针对这些三维目标扫描与所述靶序列相对应的新结构,从而确定出新结构的结合位点。45》类才法。分类方法的例子包括但不限于SURFNET(Laskowski,1995,JournalofMolecularGraphics13,323-330),PocketPicker(Weisel等,2007,ChemistryCentralJournal1:7),POCKET(Levitt,1992,J.Mol.Graphics.10,229-234)和Delaney的细胞逻辑操作(CellularLogicOperations)(Delaney,1992,J.Mol.Graphics10,174-177)。其它分类方法是称作PASS的计算工具(Lagunin等,1999,Bioinformatics16:747-748)。PASS表;^正輩巴序列包埋的体积的区域,然后执行Stahl&Schneider的神经网络方法相似的方法(Brady&Stouten,2000,JournalofComputer-AidedMolecularDesign14,383)。确定輩巴大分子的结合位点的其它方法有三维聚类分析(Landgraf等,2001,JournalofMolecularBiology307,1487)。三维聚类分析通过考虑粑序列中空间定义的残基簇相对于该整个耙序列的保守性来识别活性位点残基。i蕃i法。确定大分子结合位点的直接方法是解析与复合有结合所述蛋白质的结合位点的配体的序列相对应的蛋白质的三维结构。许多蛋白质用X射线结晶学或核磁共振技术以这种复合物的形式得到了确定。在用这种技术得到解析的具体蛋白质中形成结合位点的残基的身份提供了信息源以用于预测哪些残基会形成另一蛋白质的结合位点。为了使用这种信息源,Stuart等(Stuart,2001,Ligbase:adatabaseoffamiliesofalignedligandbindingsitesinknownproteinsequencesandstrutures,Bioinformatics17,l-2)开发了饱含所有已知结构的结合位点的数据库。而且,对于每个已知结构的蛋白质,该数据库提供了与所有相关蛋白质序列和结构的比对。该LigBase序列比对可用于预测与具有已知复合结构的蛋白质相似的蛋白质的结合位点残基。示例性序列比对程序在处理步骤410(图4)的一些具体实施方案中使用的现有序列比较方法可以分成两个主要类别全局比较方法和局部比较方法。在全局比较方法中,对整个序列进行比对并在单次操作中计分(Needleman和Wunsch,1970,MolecularBiology48,443)。在局部比较方法中,仅对两序列的高度像素的片断进行比对和计分,而且通过组合各个片断得分计算出组合得分,如FASTA方法(Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA85:2444-2448),BLAST方法(Altschul等,1990,JournalofMolecularBiology215,403-410;Altschul等,1997,NucleicAcidsResearch25,3389-3402)和BLAZE方法(Brutlag等,1993,ComputationalChemistry17,203-207)。在一些实施方案中,大分子的序列比对使用算法如基本的局部比对搜索工具(BLAST)、PSI-BLAST、PHI-BLAST、WU-BLAST-2和/或MEGABLAST来进行。参见Altschul等,1990,J.Mol.Biol.215,403-410;Altschul等,1996,MethodinEnzymology266,460-480和Karlin等,1993,PNASUSA90,5873-5878。其它可以用于比对大分子的算法包括FASTA(Pearson,1995,ProteinScience4,1145-1160)、ClustalW(Higgin等,1996,MethodsEnzymol.266,383-402)、DbClustal(Thompson等,2000,Nucl.AcidsRes.28,2910-2926)和MolecularOperatingEnvironment(Che'micalComputingGroup,Montreal,QuebecCanadaH3A2R7)。不同的多序列比对程序包括但不限于FASTA(Pearson,1995,ProteinScience4,1145-1160)、ClustalW(Higgin等,1996,MethodsEnzymol.266,383-402)、MSF(EuropeanMolecularBiologyLaboratory,Meyerhofstr.1,69117Heidelberg,Germany),以及Modeler'sPIR才各式(Sali和Sanchez,2000,MethodsMol.Biol.143,97-129)。在一些具体实施方案中,如果净皮比对的序列是蛋白质,那么这种序列比对包括用氨基酸替换矩阵(如比对得分表)进行成对比对。氨基酸替换矩阵为在比对中的各个残基位置发现的每个可能配对或替换提供数字得分。可以理解,在一个实施方案中,该氨基酸替换矩阵是20x20矩阵,其中该矩阵的要素代表一个天然发生的氨基酸用另一个天然发生的氨基酸替换的得分。在一些实施方案中,BLOSUM62矩阵是所述比对模块算法所使用的氨基酸替换矩阵。该BLOSUM62矩阵衍生自Dayhoff得分矩阵。该Dayhoff矩阵为20个天然发生的氨基酸替换成另一氨基酸4是供数字值。(参见Henikoff&Henikoff,1993,Proteins17,49-61,1993)。尽管可以使用任何氨基酸替换矩阵,但是在此才是供了其它示例性矩阵。例如,可以使用WAC矩阵(Pac.Symp.Biocomput,465-76,1997)。该WAC矩阵是广泛分析20个天然发生的氨基酸周围的微环境的结果。该分析包括比较氨基酸环境和任意的对照环境及每个其它的氨基酸环境。这些环境用一组概述原子特征、化学基团特征、残基特征和二级结构特;[正的21个特征来描述。该特征^皮分成1埃厚的径向框(radialshells)以表示所述特征与氨基酸Ca原子间的距离。又一氨基酸替换矩阵是Risler矩阵(Risler等,1988,J.Mol.Biol.204,1019-29)。在使用Risler矩阵时,认为蛋白质PI中的氨基酸被结构相似的蛋白质P2中的氨基酸a2替代,这样在将所述两结构叠加后,a,和a2Ca间的距离小于1.2埃。使用这个标准,不同结构的氨基酸配对(替换)可以通过统计学方法来分析,以产生Risler矩阵。Miller的算法(Myers&Miller,CABIOS4,11-17,1988)。这种算法被整合到下,当使用ALIGN程序来比较氨基酸序列时,可以使用PAM120比对得分表(Henikoff&Henikoff,1992,Proc.Natl.Acad.Sci.USA,89,10915),间隙长度罚值为12,间隙罚值为4。其它序列分析算法是本领域公知的,包括但不限于ADVANCE和ADAM(Torellis&Robotti,1994,Comput.Appl.Biosci.,10:3-5)。许可其它氨基酸替换矩阵可以使用。这种表包括但不限于PAM250矩阵(Henikoff&Henikoff,1992,Proc.Natl.Acad.Sci.USA,89,10915)。计算机和计算机程序产品工具本发明可以作为计算机程序产品来执行,该计算机程序产品包含嵌入在计算机可读存贮介质中的计算机程序机制。而且,本发明的任何方法可以在一个或多个计算机中执行。而且,本发明的任何方法可以在一个或多个计算机程序产品中执行。本发明的一些实施方案提供了编码本说明书所公开的任何或所有方法的计算机程序产品。这些方法可以存储在CD-ROM、DVD、磁盘存储产品或任何其它计算机可读数据或程序存储产品上。这些方法也可以嵌入到永久存储器如ROM、一种或多种可编程芯片、一种或多种专用集成电路(ASIC)中。这种永久存贮器可以位于服务器、802.11接入点、802.11无线桥/站、中继器、路由器、移动电话或其它电子设备中。嵌入在所述计算机程中嵌入了软件模块)的数字发送或在载波上发送,而电子地发送。本发明的一些实施方案提供了含有图1所示的任何或所有程序模块的计算机程序产品。这些程序模块可以存储在CD-ROM、DVD、磁盘存储产品或任何其它计算机可读数据或程序存储产品上。该程序模块还可以嵌入到永久存储器如ROM、一种或多种可编程芯片、一种或多种专用集成电路(ASIC)中。这种永久存贮器可以位于服务器、802.11接入点、802.11无线桥/站、中继器、路由器、移动电话或其它电子设备中。在所述计算机程序产品中的这些软件模块还可以通过网络或以其它方式,通过计算机数据信号(其中嵌入了软件模块)的数字发送或在载波上发送,而电子地发送。实施例参考图5A,将P38A激酶(参见Trejo等,2003,J.Med.Chem46,4702-4713,其在此引入本文作为参考)的结合位点与JNK3激酶(Weston和Davis,2002,Curr.Opin.Genet.Dev.12,14-21,其在此引入本文作为参考)的结合位点进行比较。用修饰的MOEAlphaSiteFinder来识别P38A和JNK3的活性位点(三磷酸腺苷结合位点)。然后,用如上所述的系统和方法来构建P38A和JNK3的结合位点容积图。接着,生成P38A的结合位点容积图和JNK3的结合位点容积图的容积組合。具体地,生成P38A的结合位点容积图和JNK3的结合位点容积图的交集,其如图5A所示。该图5A所示的交叉容积定义形成了耙向P38A和JNK3结合位点的共同容许容积。图5B显示了在这个交叉容积中的抑制剂R1487(图5B的部分502)。图5C提供了R1487的分子结构。如图5B所示,该抑制剂完全包含在所述交叉容积中。因此,预期这个抑制50剂会特异性结合P38A和JNK3,并在这两种酶间表现出特异性。实际上,这是事实。R1487对P38A和JNK3的ICso分别为0.010和0.200^M。参考图6A,将P38A激酶的结合位点与JNK激酶的结合位点进行比较。然而,在此将P38A和JNK3的结合位点容积图的容积组合生成为差别图。如图6所示的该差别图定义形成了在P38A结合位点容积图中存在而在JNK结合位点容积图中不存在的区域。如图6A所示,抑制剂R07125将氯苯基置于P38A结合口袋所特有的区域602中。因此,预期R07125会特异性结合P38A但不特异性结合JNK,因而相对于JNK对P38A表现出特异性。实际上,这是事实。R07125对P38A和JNK2的IC5o分别为0.006pM和〉20pM。R07125的分子结构如图6B所示。参考图7A,将P38A激酶的结合位点与JNK激酶的结合位点进行比较。然而,在此将P38A和JNK的结合位点容积图的容积组合生成为差別图。如图7所示的该差别图定义形成了在P38A结合位点容积图中存在而在JNK结合位点容积图中不存在的区域。如图7A所示,抑制剂R09552将氯苯基置于P38A结合口袋所特有的区域702中。因此,预期R09552会特异性结合P38A但不特异性结合JNK,因而相对于JNK对P38A表现出特异性。实际上,这是事实。R09552对P38A和JNK2的IC50分别为0.0009pM和0.05^M。图7B显示了R09552的结构。在图7B中,该分子结构中占据P38A的区域702的部分如部件702类似地识别。参考图8,P38A激酶的结合位点通过识別该激酶的结合位点,然后用如上所述的方法和系统确定该结合位点的结合位点容积图来评价。部件804是排列形成P38A结合口袋的P38A残基部分。然后,用如上所述的系统和方51法,将所述结合位点容积图的表面的多个区域的各个单独区域基于第一特征进行分类,该第一特征与所述大分子的与该单独区域最接近的部分的第二特征互补,从而产生相互作用图802。在P38A结合位点,赖氨酸808靠近该相互作用图的区域,且因而最接近该赖氨酸808的该相互作用图802的该区域810是酸性的。将抑制剂R06257(图8中的部件806)叠加到该相互反应图802上。该抑制剂RO6257并不具有合适的极性原子与赖氨酸808相互反应。因此,R06257对P38A表现出的IC5o仅为0.25(iM。根据相互作用图802,预期该抑制剂的特异性可以通过定位一个或多个可以与碱性赖氨酸808相互作用的极性原子来提高。引用的参考文献开或专利或专利申请特定地且分别地通过引用而全文并入本文一样。修改在不偏离本发明的精神和范围的情况下可以对其作许多修改和改变,这是本领域的普通技术人员公知的。在此描述的具体实施方案仅是举例,本发明仅受限于所附的权利要求和这些权利要求所等同的整个范围。5权利要求1.评价大分子结合位点的方法,该方法包括(A).识别所述大分子的结合位点,其中该结合位点由多个残基排列形成,且其中该结合位点没有结合配体;(B).确定所述结合位点的结合位点容积图,其中该结合位点容积图包含具有多个区域的表面;和(C).将所述结合位点容积图的所述表面的多个区域的各个单独区域基于第一特征进行分类,该第一特征与该大分子的与该单独区域最接近的部分的第二特征互补,从而产生相互作用图。2.如权利要求l所述的方法,其中所述大分子是蛋白质。3.如权利要求l所述的方法,其中所述大分子是核酸、肽、蛋白质-蛋白质复合物或蛋白质-核酸复合物。4.如权利要求l所述的方法,其中所述识别步骤(A)包括用能量函数、基于网格的算法、几何算法、分类法、或直接方法搜索所述大分子的模型中的结合位点。5.如权利要求l所述的方法,其中所述大分子中与所述结合位点容积图的表面的所述多个区域中的单独区域最接近的单独部分的所述第二特征是最接近所述大分子的所述单独部分的多个残基中残基的一个或多个原子的疏水性;最接近所述大分子的所述单独部分的多个残基中残基的一个或多个原子的溶剂暴露的量;或最接近所述大分子的所述单独部分的多个残基中残基的一个或多个原子中的各原子是酸性的、碱性的、疏水性的、或溶剂暴露的分类。6.如权利要求l所述的方法,其中所述将单独区域进行分类包括基于分配给该单独区域的第一特征对该单独区域进行着色。7.如权利要求1所述的方法,其中所述第一特征是碱性的且所述第二特征是酸性的。8.如权利要求l所述的方法,其中所述第一特征是酸性的且所述第二特征是碱性的。9.如权利要求l所述的方法,其中所述第一特征是亲水性的且所述第二特征是疏水性的。10.如权利要求l所述的方法,其中所述第一特征是疏水性的且所述第二特征是亲水性的。11.如权利要求l所述的方法,其中所述识别步骤(A)包括(i).确定所述大分子的每个原子的Voronoi区,从而确定多个Voronoi区;(ii).确定所述多个Voronoi区中的每个Voronoi顶点,从而确定多个Voronoi顶点;(iii).给所述多个Voronoi顶点中的每个Voronoi顶点分配a球,从而确定多个a球;(iv).基于每个单独球与所述大分子的原子形成氢键的能力,将所述多个a球中的所述单独球分类成亲水J求或疏水球;(vi).将所述多个a球聚集起来,从而形成多个候选结合位点,其中该多个候选结合位点中的每个单独候选结合位点包含所述多个a球中的三个或更多个a球,其中在该三个或更多个a球中的至少一个a球是疏水性的;(vi).根据单独候选结合位点与所述大分子形成的疏水性接触数量,对所述多个候选结合4立点中的所述每个单独候选结合4立点进行分级,从而形成一组分级的候选结合位点;和(vii).从所述一组分级的候选结合位点中确定所述结合4立点。12.如权利要求11所述的方法,该方法还包括在所述聚集步骤(v)之前去除所述多个a球中的几乎完全相同的a球。13.如权利要求11所述的方法,其中所述确定步骤(vii)包括接受使用者在所述多个候选结合位点中选择候选结合位点,其中该使用者选择的候选结合位点被认为是所述结合位点;或将所述分级的候选结合位点組中与所述大分子具有最大数量的疏水接触的候选结合位点纟见为所述结合位点。14.如权利要求ll所述的方法,其中所述聚集步骤(V)包括单一联结聚集所述多个a球。15.如权利要求l所述的方法,其中所述确定步骤(B)包括将网格置于所述结合位点的所述a球上,其中该网格包括多个网格点;和将所述结合位点容积图识别为所述网格中的所有网格点,该所有网格点同时满足(a)落入所述结合位点图的a球内和(b)位于所述大分子的至少一个原子的预定距离内。16.如权利要求15所述的方法,其中所述预定距离是1.2埃-2.0埃。17.如权利要求15所述的方法,其中所述预定距离是1.35埃-1.85埃。18.比较第一大分子的第一结合位点与第二大分子的第二结合位点的方法,该方法包4舌(A).识别所述第一大分子的所述第一结合位点,其中该第一结合位点没有结合配体;(B).识别所述第二大分子的所述第二结合位点,其中该第二结合位点没有结合配体;(C).基于所述第一结合位点确定第一结合位点容积图;(D).基于所述第二结合位点确定第二结合位点容积图;(E).生成包括所述第一结合位点容积图和所述第二结合位点容积图的容积組合的第三结合^立点容积图。19.如权利要求18所述的方法,其中所述第一大分子是第一蛋白质,且所述第二大分子是第二蛋白质。20.如权利要求18所述的方法,其中所述第一大分子是核酸、肽、蛋白质-蛋白质复合物或蛋白质-核酸复合物,且所述第二大分子是核酸、肽、蛋白质-蛋白质复合物或蛋白质-核酸复合物。21.如权利要求18所述的方法,其中所述识别步骤(A)包括用能量函数、基于网格的算法、几何算法、分类法、或直接方法搜索所述第一大分子的第一模型中的所述第一结合位点。22.如权利要求18所述的方法,其中所述识别步骤(B)包括用能量函数、基于网格的算法、几何算法、分类法、或直接方法搜索所述第二大分子的第二模型中的所述第二结合位点。23.如权利要求18所述的方法,其中所述容积组合是(a)所述第一结合位点容积图和所述第二结合位点容积图的合并;(b)所述第一结合位点容积图和所述第二结合位点容积图的差別;(C)所述第一结合位点容积图和所述第二结合位点容积图的交集;或(d)所述第一结合位点容积图和所述第二结合位点容积图的平均。24.如权利要求18所述的方法,其中所述容积组合是独特性函数,且其中所述第三结合位点容积图由(i)所述第一结合位点容积图中不与所述第二结合位点容积图共有的那些部分和(ii)所述第二结合位点容积图中不与所述第一结合位点容积图共有的那些部分组成。25.如权利要求18所述的方法,其中所述识别步骤(A)包括(i)确定所述第一大分子的每个原子的所述Voronoi区,从而确定多个Voronoi区j(ii)确定所述多个Voronoi区中的每个Voronoi顶点,从而确定多个Voronoi丁贞点;(iii)给所述多个Voronoi顶点中的每个Voronoi顶点分配a球,从而确定多个a球;(iv)基于每个单独球与所述大分子的原子形成氢键的能力,将所述多个a球中的所述单独球分类成亲水球或疏水球;(vi).将所述多个a球聚集起来,从而形成多个候选结合位点,其中该多个候选结合位点中的每个单独候选结合位点包含所述多个a球中的三个或更多个a球,其中在该三个或更多个a球中的至少一个a球是疏水性的;(vi).根据单独候选结合位点与所述大分子形成的疏水性接触的数量,对所述多个候选结合位点中的所述每个单独候选结合位点进行分级,从而形成一組分级的候选结合位点;和(vii).从所述一组分级的候选结合位点中确定所述结合位点。26.如权利要求25所述的方法,该方法还包括在所述聚集步骤(v)之前去除所述多个a球中的几乎完全相同的a球。27.如权利要求25所述的方法,其中所述确定步骤(vii)包括接受使用者在所述多个候选结合位点中选择候选结合位点,其中该使用者选择的候选结合位点被认为是所述第一结合位点;或将所述分级的候选结合位点组中与所述大分子具有最大数量的疏水接触的候选结合位点视为所述第一结合位点。28.如权利要求25所述的方法,其中所述聚集步骤(v)包括单一联结聚集所述多个a球。29.如权利要求18所述的方法,其中所述确定步骤(C)包括(i)将网格置于所述第一结合位点的所述a球上,其中该网格包括多个网格点;和(ii)将所述第一结合位点容积图识别为所述网格中的所有网格点,该所有网点同时满足(a)落入所述结合位点图的a球内和(b)位于所述第一大分子的至少一个原子的预定距离内。30.如权利要求29所述的方法,其中所述预定距离是1.2埃-2.0埃。31.如权利要求29所述的方法,其中所述预定距离是1.35埃-1.85埃。32.如权利要求18所述的方法,其中所述方法还包括将所述第三结合位点容积图的所述表面的多个区域的各个单独区域基于第一特征进行分类,该第一特征与所述第一大分子的与该单独区域最接近的部分的第二特征互补,从而产生相互作用图。33.如权利要求18所述的方法,其中所述第三结合位点容积图包括两个以上大分子的所述结合位点容积图的容积组合。34.如权利要求18所述的方法,其中所述第三结合位点容积图包括五个以上大分子的所述结合位点容积图的容积组合。35.如权利要求18所述的方法,其中所述第三结合位点容积图包括十五个以上大分子的所述结合位点容积图的容积组合。36.如权利要求l所述的方法,该方法还包括(D)将所述相互作用图输出到用户界面装置、显示器、计算机可读存储介质、计算机可读存储器、或者本地或远程计算机系统;或显示该结合位点容积图。37.如权利要求18所述的方法,该方法还包括(F)将所述第三结合位点容积图输出到用户界面装置、显示器、计算机可读存储介质、计算机可读存储器、或者本地或远程计算机系统;或显示该第三结合位点容积图。38.存储计算机程序产品的计算机可读介质,该计算机程序产品可用计算机执行以评价大分子的结合位点,该计算机程序产品包括用于执行权利要求l-37任一项所述的方法的指令。39.用于评价大分子结合位点的设备,该设备包括处理器;和存储器,其与该处理器相连,该存储器存储包含执行权利要求l-37任一项所述的方法的指令的模块。全文摘要本发明提供了用于评价大分子的结合位点的系统、方法和设备,其中该结合位点被识别且该结合位点的结合位点容积图被构建。该结合位点容积图具有含多个区域的表面。将该表面的多个区域中的每个单独区域基于第一特征进行分类,该第一特征与该大分子的与该单独区域最接近的部分的第二特征互补,从而产生相互作用图。本发明还提供了比较大分子的方法、系统和设备,其中为每个所述大分子构建结合位点容积图。然后,构建包含每个所述结合位点容积图的容积组合的复合结合位点容积图。从该复合结合位点容积图可以构建相互作用图。文档编号G06F19/00GK101470776SQ20081012615公开日2009年7月1日申请日期2008年6月27日优先权日2007年6月27日发明者克里斯·威廉斯,尼迪·阿洛拉申请人:弗·哈夫曼-拉罗切有限公司;化学计算集团公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1