一种处理小分子和蛋白质相互作用的计算方法

文档序号:6568307阅读:1069来源:国知局
专利名称:一种处理小分子和蛋白质相互作用的计算方法
技术领域
本发明涉及一种计算毒理学领域,尤其是涉及一种处理小分子和蛋白质相互作用的计算方法。
背景技术
随着人类社会的日益发展,人类所面对的环境问题愈发严重。各种各样的工、农业废水、废气、废渣排放入人类所居住的公共环境,这些“三废”中往往含有许多对人体有害的化合物。目前,世界上已经有许多国家和地区对“三废”的排放进行了限制和禁止,对环境中污染物的含量做出了严格的限定,制定出相关的法律规范以保护人体免受其伤害。污染物对人体造成损害的过程,是污染物进入体内,与人体中某些重要蛋白结合的过程。这些被结合的蛋白,往往是在人的生命过程中占有重要地位的蛋白。污染物分子与蛋白结合后,有两种行为,其一,使蛋白质的结构发生改变,结构的改变往往引起蛋白质功能改变,使其丧失或改变原有的功能。在通常情况下,污染物的存在会影响蛋白质的二级结构含量的变化;其二,蛋白质的活性位点被污染物占据,一些功能性的分子无法结合,从而导致一些对人体健康有关键作用的物质无法被合成或转化,人体最终将因缺乏这些应该被合成的重要物质而受到损害。污染物与蛋白质相互作用研究的重要性尤为突出。研究的重点在于首先从宏观的层面,污染物对蛋白质造成了何种影响,这种影响如何损害人体的健康。其次从微观层面,污染物与蛋白质造成影响的机理是如何的。微观层面与宏观层面相结合,将使我们获得污染物毒理的全面彻底的视角,使人们规避污染物,并增强人们的环保意识,促使社会各界重视环境污染的问题,加大环境整治和杜绝污染的力度,最终使地球环境更加健康。计算化学,是指通过计算方法解决化学领域中的问题。计算化学中的计算方法涵盖了各种方法。根据科学家研究的体系不同,可采用多种不同的计算方法。最常用的计算方法为分子力学和量子化学计算。计算化学的目的更明确的来说是为了获得研究对象的宏观物理或化学性质。这种宏观性质可分成两类其一,对象的静态平衡性质,例如两个物质作用的结合常数,一个体系的平均势能或是对象在液体中的径向分布函数;其二是动态、非平衡性质,例如对象的相变,大分子的构象变化,小分子在细胞膜或纳米管中的运动。事实上,一个大分子体系的各种性质,是组成该大分子的许许多多微粒表现出的量子态的平均,而获得微粒量子态的唯一途径便是解出薛定谔方程。这是因为薛定谔方程,暗含了微粒的全部性质。在一个有限时间、有限能力的情况下,用薛定谔方程对体系每一个微粒进行从头计算是不可能的,更是没有必要的,所以有必要提出一种更为简单有效地方法,获得体系较为可靠的性质。为了解决上述问题,提出了蒙特卡罗模拟法和分子动力学方法运用到计算化学的领域中。综上,计算方法能够很好地预测对象的静态平衡性质。进而获得可靠的污染物毒性数据
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种处理小分子和蛋白质相互作用的计算方法。本发明的目的可以通过以下技术方案来实现一种处理小分子和蛋白质相互作用的计算方法,其特征在于,包括以下步骤(I)读入蛋白质和小分子配体文件数据;(2)判断蛋白质和小分子配体中的原子类型;(3)随机初始化小分子配体的位置和角度;(4)运行SearchProtein算法,优化小分子配体的坐标和角度,Chemscore公式作为评价函数;ChemScore评价函数是Eldridge等人在1997年提出的。在本文的程序中,就使用了 ChemScore函数作为能量评价的函数。ChemScore能量函数通过以下公式对配体与蛋白质的能量进行评分Δ Gbinding — Δ G0+ Δ GhbondShbond+ Δ GmetalSmetal+ Δ GlipoSlipo+ Δ GrotHrot(5)达到最大迭代次数后终止计算;(6)分析结果,RMSD (根均方偏移量)、对接自由能Λ G和对接位点的坐标,输出结
果O所述的配体文件包括原子的类型、坐标以及键的类型信息。

所述的随机初始化小分子配体的位置和角度具体为小分子配体的位置和角度在活性中心周围ιοΑχιοΑχ IOA的范围内随机产生,并通过Presearch算法进行搜索和对接计算。所述的Presearch算法为将蛋白质的原配体与蛋白质对接,找到活性位点并得到原始对接自由能,读入蛋白质和原分子配体文件数据,判断蛋白质和原配体分子中的原子类型,随机初始化小分子配体的位置和角度;在蛋白质分子上加上极性氢,并计算库尔曼电荷,将其保存后缀名为pdbqs的文件,小分子经过加氢,计算电荷,并确定可旋转键后保存为Pdbq文件;利用mkdpf4命令生成对接所需要的格点参数文件,后缀名为.gpf,打开该文件,将网格中心修改为活性位点中心的坐标;用mkdpf4命令生成dpf文件。所述的SearchProtein算法为进行污染物小分子与蛋白质的分子对接,并得到对接自由能AG,读入蛋白质和原分子配体文件数据,判断蛋白质和原配体分子中的原子类型,随机初始化小分子配体的位置和角度;在蛋白质分子上加上极性氢,并计算库尔曼电荷,将其保存后缀名为pdbqs的文件,小分子经过加氢,计算电荷,确定可旋转键后保存为Pdbq文件;利用mkdpf4命令生成对接所需要的格点参数文件,后缀名为.gpf,打开该文件,将网格中心修改为活性位点中心的坐标;用mkdpf4命令生成dpf文件。与现有技术相比,本发明具有可以做到对污染物与生物大分子之间时候有作用做出迅速判断,有利于提升生产效率。该技术关键原理简单,操作建议,容易学习,可以在各个方面得到广泛应用。
具体实施例方式下面结合具体实施例对本发明进行详细说明。实施例1本发明分为Presearch和SearchProtein两个功能模块。主要利用ANSI C++语言编写,可以运行在Windows和Linux操作系统下。程序包中有源程序和头文件18个,主要流程为受体和配体分子的读入,主要为mol2文件格式;受体和配体分子预处理,主要是原子类型,单轴可旋转键的指定等等。PreSearch程序在运行前需要准备presearch, txt文件;然后对小分子进行随机初始化,小分子初始化位置在活性中心周围IOAX IOAX IOA的范围内随机产生;然后利用Presearch进行搜索和对接计算。计算得到对接的RMSD(根均方偏移量)、对接自由能AG和对接位点的坐标。建立蛋白质数据库,利用SearchProtein模块对小分子和大分子进行逆向对接实验。当SearchProtein程序计算完毕后,会生成文件。文件包含了每次对接的能量以及对接位点的坐标。还另有文件分别给出AG与AGO以及原始配体对接评价值与小分子污染物的对接评价值。程序定义了输入文件,主要是定义受体分子文件名、配体分子文件名、初始化中心坐标、初始化参数、搜索算法种类、搜索算法参数等等。除了受体分子文件名、配体分子文件名必须指定外,其他参数可以指定,也可以使用默认值,程序的使用比较简便易用。程序的运行=ToxicitySearch程序里,主要优化的变量主要是小分子配体的中心的三维坐标x,y和z,配体分子的三个笛卡尔角度d,β和Y,其主要运算步骤为(1)读入蛋白质和小分子配体文件,主要是SYBYL mol2文件格式,文件里含有原子的类型、坐标以及键的类型;(2)判断蛋白质和小分子配体中的原子类型;(3)随机初始化小分子配体的位置和角度;(4)运行SearchProtein算法,优化小分子配体的坐标和角度,Chemscore公式作为评价函数;(5)达到最大迭代次数,终止计算;(6)分析结果,计算RMSD,输出结果。实施例2一种查找PFOS可能干扰的蛋白质受体的方法,利用逆向对接程序PreSearch和逆向对接程序SearchProtein, 从自建的蛋白质受体库中找到了 4种蛋白可能与PFOS结合,这些蛋白是磷酸二酯酶4D催化域、尿激酶催化域、II型碳酸酐酶和IV型二肽酰肽酶,并简单分析了 PFOS在这些蛋白质活性位点的情况。其具体过程如下PreSearch程序在运行前需要准备presearch, txt文件。. /PreSearch-p presearch. txt_l result, log-o energy, txt在工作中计算了 10次,使能量的评价更平均。la2c.mol2和la2c_l. mol2分别代表蛋白质的mo 12文件和配体的mo 12文件。每完成I个蛋白质的计算后,程序会生成result,log文件和energy, txt文件。result, log文件详细地记录了对接的RMSD (根均方偏移量)、对接自由能和对接位点的坐标。总结了每次对接的自由能AG(最后一列代表加上因柔性损失的能量)和对接位点中心的坐标,并且该文件还作为SearchProtein程序的输入文件。SearchProtein的输入文件即为上述的energy, txt文件,不过需要在文件开头加上一行“ligand PF0S.mol2”。运行时需要输入以下的命令. /SearchProtein-p energy. txt_l result, log-o finalenergy. txt当SearchProtein 程序计算完毕后,会生成 result, log 文件和 finalenergy. txt文件。result, log文件包含了每次对接的能量以及对接位点的坐标。而finalenergy. txt则分别给出AG与AGO以及原始配体对接评价值与PFOS的对接评价值。实施例3一种研究污染物2,4_d与人血清蛋白HAS相互作用机理的方法,如实施例1中所提到的,利用对接程序PreSearch,找出2,4_D可能取代雄激素和雌激素在HSA上的位置,干扰这两种激素在人体内的运输,影响其发挥正常功能,可能使体内性激素平衡失调,而2,4-D对甲状腺素在血清蛋白上的运输产生影响的可能性很小。我们用Presearch对接的结果分析了结果相近的三个分子2,4-D,雌激素,雄激素和HSA对接后的作用情况,对接选取的活性中心为IIA活性位点,值得一提的是,在反复多次计算2,4-D和HSA的结合自由能时,发现一个与其他分子对接时特殊的现象,2,
4-D和HSA相互对接时计算的对接自由能值收敛与两个值而不是一个值,这两个值分别为-34. OkJ/mol和-37. 4kJ/mol。而包括雌激素,雄激素在内的绝大部分分子都只收敛于一个值。我们将四种分子,五种情况放在图上表示,为HSA活性位点附近的二级结构示意图,四种小分子对接最稳定时在活性位点中的位置,绿色和青色为2,4-D两种状态下的位置,蓝色和紫色为雌二醇和睾酮的位置,粉红色为甲状腺素。可以看出,两种性激素的位置都在活性中心的下面,2,4-D的位置偏上,而甲状腺素分子较长,贯穿上下,所以结合最稳定。上述的对实施例的描述是为了便于该技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于这里的实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。
权利要求
1.一种处理小分子和蛋白质相互作用的计算方法,其特征在于,包括以下步骤(1)读入蛋白质和小分子配体文件数据;(2)判断蛋白质和小分子配体中的原子类型;(3)随机初始化小分子配体的位置和角度;(4)运行SearchProtein算法,优化小分子配体的坐标和角度,Chemscore公式作为评价函数;(5)达到最大迭代次数后终止计算;(6)分析结果,RMSD、对接自由能AG和对接位点的坐标,输出结果。
2.根据权利要求1所述的一种处理小分子和蛋白质相互作用的计算方法,其特征在于,所述的配体文件包括原子的类型、坐标以及键的类型信息。
3.根据权利要求1所述的一种处理小分子和蛋白质相互作用的计算方法,其特征在于,所述的随机初始化小分子配体的位置和角度具体为小分子配体的位置和角度在活性中心周围ιοΑχ ιοΑχ ιοΑ的范围内随机产生,并通过 Presearch算法进行搜索和对接计算。
4.根据权利要求3所述的一种处理小分子和蛋白质相互作用的计算方法,其特征在于,所述的Presearch算法为将蛋白质的原配体与蛋白质对接,找到活性位点并得到原始对接自由能,读入蛋白质和原分子配体文件数据,判断蛋白质和原配体分子中的原子类型,随机初始化小分子配体的位置和角度;在蛋白质分子上加上极性氢,并计算库尔曼电荷,将其保存后缀名为pdbqs的文件,小分子经过加氢,计算电荷,并确定可旋转键后保存为pdbq文件;利用mkdpf4命令生成对接所需要的格点参数文件,后缀名为.gpf,打开该文件,将网格中心修改为活性位点中心的坐标;用mkdpf4命令生成dpf文件。
5.根据权利要求1所述的一种处理小分子和蛋白质相互作用的计算方法,其特征在于,所述的SearchProtein算法为进行污染物小分子与蛋白质的分子对接,并得到对接自由能AG,读入蛋白质和原分子配体文件数据,判断蛋白质和原配体分子中的原子类型,随机初始化小分子配体的位置和角度;在蛋白质分子上加上极性氢,并计算库尔曼电荷,将其保存后缀名为pdbqs的文件,小分子经过加氢,计算电荷,确定可旋转键后保存为pdbq文件;利用mkdpf4命令生成对接所需要的格点参数文件,后缀名为.gpf,打开该文件,将网格中心修改为活性位点中心的坐标;用mkdpf4命令生成dpf文件。
全文摘要
本发明涉及一种处理小分子和蛋白质相互作用的计算方法,包括以下步骤(1)读入蛋白质和小分子配体文件数据;(2)判断蛋白质和小分子配体中的原子类型;(3)随机初始化小分子配体的位置和角度;(4)运行SearchProtein算法,优化小分子配体的坐标和角度,Chemscore公式作为评价函数;(5)达到最大迭代次数后终止计算;(6)分析结果,RMSD、对接自由能ΔG和对接位点的坐标,输出结果。与现有技术相比,本发明具有做到对污染物与生物大分子之间时候有作用作出迅速判断等优点。
文档编号G06F19/12GK103049677SQ20111031529
公开日2013年4月17日 申请日期2011年10月17日 优先权日2011年10月17日
发明者管翀, 赵国华, 曹同成, 黄晓峰, 张莹莹 申请人:同济大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1