专利名称:蛋白质三维结构的预测方法及预测装置的利记博彩app
技术领域:
本发明涉及蛋白质结构预测技术领域,尤其涉及一种蛋白质三维结构的预测方法及预测装置。
背景技术:
生物学研究表明,蛋白质是由特定的氨基酸序列构成的。正常情况下,蛋白质并不是以完全伸展的多肽链结构存在,而是以紧密折叠的三维结构存在,并且一个特定蛋白质行使其功能的能力通常由其三维结构决定。因此,确定蛋白质的三维结构,或称其构象,是生物领域的一项重要课题。目前,采用X射线衍射和核磁共振等分析化学的方法已经实现了对部分蛋白质三维结构的分析,但是,这些分析技术需要花费大量的时间和费用,不能满足蛋白质结构分析的需要,而结合信息技术发展起来的蛋白质结构预测方法由于具有快速的优点成为研究热
;ο现有预测蛋白质结构的方法主要有两种比较建模法和从头预测法。比较建模法是通过比较目标蛋白质与另外一种已知结构、其氨基酸序列与目标蛋白质联系密切的蛋白质进行预测,比较建模法需要以结构已知、且其氨基酸序列与目标蛋白质相似的蛋白质为基础,如果不存在与目标蛋白质氨基酸序列相似的蛋白质,则无法进行预测。而从头预测是假设折叠后的蛋白质取能量最低的构象,通过计算得到蛋白质每一部分不同的卷曲状态对应的结构,直到发现最低能量状态。从头预测蛋白结构有两个关键问题一是找到一个能严格区分蛋白质的天然构象和非天然构象的能量函数;二是选择适当的搜索算法,即选择有效的优化算法。现有技术公开了使用遗传算法、模拟退火算法等算法对蛋白质三维结构进行预测,但是,使用这些算法进行预测的精度较低。
发明内容
有鉴于此,本发明所要解决的技术问题在于提供一种蛋白质三维结构的预测方法及预测装置,本发明提供的预测方法能够实现对蛋白质三维结构的从头预测,预测精度较
尚ο本发明提供了一种蛋白质三维结构的预测方法,包括a、选择目标蚁群,初始化蚁群算法参数;b、初始化蛋白质构象,建立蛋白质构象与片段库的映射关系;C、以所述蛋白质构象上的任一位置为起点,所述目标蚁群在信息素的指引下对所述蛋白质构象进行优化,利用能量函数对优化后的蛋白质构象进行能量计算,选择能量最小的蛋白质构象;d、对所述能量最小的蛋白质构象进行局部优化,利用能量函数对局部优化后的蛋白质构象进行能量计算,根据所述计算结果更新信息素矩阵,并将所述局部优化后的蛋白质构象的能量与所述能量最小的蛋白质构象的能量进行比较,选择能量小的蛋白质构象;
e、重复步骤c d,直至满足终止条件,得到较优蛋白质构象;f、对所述较优蛋白质构象进行Loop重建,得到最优蛋白质构象。优选的,选择ρ个目标蚁群,初始化蚁群算法参数时,使P个目标蚁群共享同一个信息素矩阵。优选的,所述ρ个目标蚁群在信息素的指引下并行对所述蛋白质构象进行优化, 利用η个能量函数对优化后的蛋白质构象进行能量计算,所述1 < η < ρ。优选的,还包括g、将所述最优蛋白质构象进行交叉,得到交叉蛋白质构象,所述交叉蛋白质构象和所述最优蛋白质构象共同构成蛋白质构象decoys集。优选的,所述步骤c包括Cl、随机选择片段库F;c2、随机选择片段位置i,从所述片段库F中确定第i组片段集合Fi ;c3、目标蚁群在信息素的指引下从片段集合Fi中选择片段。,并根据蛋白质构象与片段库的映射关系,用&替换所述初始蛋白质构象中对应位置的片段;c4、重复步骤Cl c3,使所述初始蛋白质构象上的所有片段至少被替换一次,得到优化的蛋白质构象;c5、重复步骤Cl c4,直至满足预定次数w,得到w个优化的蛋白质构象;c6、利用能量函数分别对所述w个优化的蛋白质构象进行能量计算,选择能量最小的蛋白质构象。优选的,所述步骤d包括dl、随机选择片段库F;d2、随机选择位置i,从所述片段库F中确定第i组片段集合Fi ;(13、从&中选择p-pt个启发值η υ最高的片段{fj};d4、根据蛋白质构象与片段库的映射关系,用{fj中的片段替换步骤c中得到的能量最小蛋白质构象中对应位置的片段,计算替换后的蛋白质构象与替换前的蛋白质构象的能量差Δ E,并判断是否接受替换如果ΔΕ<0,则接受替换,如果ΔΕ>0,则根据 Metropolis规则判断是否接受替换;d5、重复步骤d4,直至{fj}中的p-pt个片段均至少经过一次替换;d6、重复步骤dl d5,直至满足预定次数Q,得到局部优化的蛋白质构象;d7、利用能量函数对所述局部优化的蛋白质构象进行能量计算,根据所述计算结果更新所述信息素矩阵,并将所述局部优化后的蛋白质构象的能量与所述能量最小的蛋白质构象的能量进行比较,选择能量小的蛋白质构象。本发明还提供可一种蛋白质三维结构的预测装置,包括蚁群选择单元,用于选择目标蚁群;初始化单元,用于初始化蚁群算法参数和蛋白质构象,并建立蛋白质构象和片段库的映射关系;片段选择单元,用于选择蛋白质构象片段;蚁群控制单元,用于控制所述目标蚁群在信息素的指引下对所述初始蛋白质构象进行优化;
第一能量计算单元,用于对优化后的蛋白质构象进行能量计算,并选择能量最小的蛋白质构象;蛋白质构象局部优化单元,用于对所述能量最小的蛋白质构象进行局部优化;第二能量计算单元,用于对所述局部优化后的蛋白质构象进行能量计算;信息素矩阵更新单元,用于根据第二能量计算单元的计算结果更新信息素矩阵;比较单元,用于对所述局部优化后的蛋白质构象的能量与所述能量最小的蛋白质构象的能量进行比较,并选择能量小的蛋白质构象;循环控制单元,用于控制对蛋白质构象进行优化和局部优化操作的循环;判断单元,用于判断循环是否满足终止条件,如果否,则通知所述蚁群控制单元继续进行控制所述目标蚁群在信息素的指引下对所述蛋白质构象进行优化;如果是,则确定较优蛋白质构象;Loop重建单元,用于对所述较优蛋白质构象进行Loop重建,得到最优蛋白质构象。优选的,还包括交叉控制单元,用于将所述最优蛋白质构象进行交叉。与现有技术相比,本发明采用并行蚁群算法对蛋白质三维结构进行从头预测,主要采用并行蚁群算法对蛋白质构象进行优化,并采用贪婪模拟退火相结合的方法对所述优化后的蛋白质构象进行局部优化,在局部优化的过程中选择迭代最好解更新并行蚁群共享的信息素矩阵,从而使随机搜索成为在信息素指引下进行的搜索,提高了搜索的质量,从而提高了预测的精度。另外,本发明融合了不同的能量函数对优化和局部优化后的蛋白质构象进行评价,使预测得到的蛋白质结构能够融合不同能量函数的评价标准,减少单一能量函数的偏好,从而更接近于蛋白质的实际结构。实验表明,采用本发明提供的预测方法对第8届关于蛋白质结构预测技术评估(the 8th Critical Assessment of Techniques for Protein Structure Prediction, CASP8)的全社会实验所公布的13个从头预测类案例进行预测,将得到的结果与CASP8比赛结果的实际排名进行对照,其中有2个案例的预测结果超过CASP8中最好的结果,7个位列前10名,取得了较好的预测效果。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本发明实施例一提供的蛋白质三维结构的预测方法的流程图;图2为本发明实施例一利用蚁群算法对蛋白质构象进行优化的流程图;图3为本发明实施例一对蛋白质构象进行局部优化的流程图;图4为本发明实施例二提供的蛋白质三维结构的预测方法的流程图;图5为本发明实施例三提供的蛋白质三维结构的预测方法的流程图;图6为本发明实施例提供的蛋白质三维结构的预测装置的结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明公开了一种蛋白质三维结构的预测方法和预测装置,通过共享信息素矩阵的并行蚁群算法对所述蛋白质构象进行优化,然后采用贪婪模拟退火相结合的方法对所述优化后的蛋白质构象进行局部优化,并在局部优化的过程中选择迭代最好解更新并行蚁群共享的信息素矩阵,最后对局部优化后的蛋白质构象进行Loop重建,得到最优蛋白质构象。本发明在并行预测过程中,融合不同的能量函数对优化、局部优化和Loop重建后的蛋白质构象进行评价,从而使预测得到的蛋白质构象能够融合不同能量函数的评价标准,减少单一能量函数的偏好,从而更接近于蛋白质的实际结构。下面结合实施例对本发明提供的蛋白质三维结构的预测方法和预测装置进行详细描述。实施例一参见图1,图1为本发明实施例一提供的蛋白质三维结构的预测方法的流程图。步骤S101,选择目标蚁群,并初始化蚁群算法参数。执行步骤S101,选择目标蚁群,即确定目标蚁群的数目,本实施例中确定蚁群数目为1,即进行基于单蚁群算法的预测。初始化蚁群算法参数,所述蚁群算法参数包括概率参数^ ;在本发明中,概率参数Cil的取值范围为W,1],本实施例中将其设置为 0.8 ;信息素τ,本实施例中将其初值设置为10 ;信息素挥发系数P,在本发明中,信息素挥发系数P的取值范围为W,l),本实施例中将其设置为0. 001 ;用于确定循环次数的比例因子p-ac,本实施例中将其设置为0.6 ;用于确定循环次数的比例因子p-cc,本实施例中将其设置为6 ;蚂蚁个数m,本发明实施例中将其设置为50。步骤S102、初始化蛋白质构象,并建立蛋白质构象与片段库的映射关系。由于蛋白质构象具有丰富的自由度而且各自由度基于连续的变化空间,为便于处理,采用片段库对搜索空间进行离散化。在本发明提供的预测方法中,是以任意一个初始的蛋白质构象为起点,通过在信息素指导下从片段库中选择片段来装配蛋白质结构,从而得到蛋白质构象。因此,需要对蛋白质构象进行初始化,确定片段库,并建立蛋白质构象与片段库的映射关系。在本实施例中,将各残基的Φ、少和ω分别赋值-150、150和180即可得到近似直链的蛋白质构象。对于片段库来说,本发明同时采用3残基片段库和9残基片段库两个片段库,因此,需要对3残基片段库和9残基片段库分别建立映射关系,即使各片段库和蛋白质构象具有对应的位置,以便实现后续优化和局部优化。
步骤S103、以所述蛋白质构象上的任一位置为起点,所述目标蚁群在信息素的指引下对所述蛋白质构象进行优化,利用能量函数对优化后的蛋白质构象进行能量计算,选择能量最小的蛋白质构象。将蚁群和蛋白质构象初始化后,开始利用蚁群算法对蛋白质构象进行优化,参见图2,图2为本发明实施例一利用蚁群算法对蛋白质构象进行优化的流程图。步骤S1031、随机选择片段库F。本发明同时采用3残基片段库和9残基片段库两个片段库,因此,在进行优化时, 需要在两个片段库之间进行选择。本实施例中按照公式I进行选择
权利要求
1.一种蛋白质三维结构的预测方法,包括a、选择目标蚁群,初始化蚁群算法参数;b、初始化蛋白质构象,建立蛋白质构象与片段库的映射关系;c、以所述蛋白质构象上的任一位置为起点,所述目标蚁群在信息素的指引下对所述蛋白质构象进行优化,利用能量函数对优化后的蛋白质构象进行能量计算,选择能量最小的蛋白质构象;d、对所述能量最小的蛋白质构象进行局部优化,利用能量函数对局部优化后的蛋白质构象进行能量计算,根据所述计算结果更新信息素矩阵,并将所述局部优化后的蛋白质构象的能量与所述能量最小的蛋白质构象的能量进行比较,选择能量小的蛋白质构象;e、重复步骤c d,直至满足终止条件,得到较优蛋白质构象;f、对所述较优蛋白质构象进行Loop重建,得到最优蛋白质构象。
2.根据权利要求1所述的预测方法,其特征在于,选择P个目标蚁群,初始化蚁群算法参数时,使P个目标蚁群共享同一个信息素矩阵。
3.根据权利要求2所述的预测方法,其特征在于,所述ρ个目标蚁群在信息素的指引下并行对所述蛋白质构象进行优化,利用η个能量函数对优化后的蛋白质构象进行能量计算,所述1< η彡ρ。
4.根据权利要求3所述的预测方法,其特征在于,还包括g、将所述最优蛋白质构象进行交叉,得到交叉蛋白质构象,所述交叉蛋白质构象和所述最优蛋白质构象共同构成蛋白质构象decoys集。
5.根据权利要求1 4任意一项所述的预测方法,其特征在于,所述步骤c包括 Cl、随机选择片段库F;c2、随机选择片段位置i,从所述片段库F中确定第i组片段集合Fi ; c3、目标蚁群在信息素的指引下从片段集合Fi中选择片段。,并根据蛋白质构象与片段库的映射关系,用A替换所述初始蛋白质构象中对应位置的片段;c4、重复步骤cl c3,使所述初始蛋白质构象上的所有片段至少被替换一次,得到优化的蛋白质构象;c5、重复步骤cl c4,直至满足预定次数w,得到w个优化的蛋白质构象; c6、利用能量函数分别对所述w个优化的蛋白质构象进行能量计算,选择能量最小的蛋白质构象。
6.根据权利要求1 4任意一项所述的预测方法,其特征在于,所述步骤d包括 dl、选择片段库F;d2、随机选择位置i,从所述片段库F中确定第i组片段集合Fi ; (13、从Fi中选择p-pt个启发值最高的片段{fj};d4、根据蛋白质构象与片段库的映射关系,用{fj中的片段替换步骤c中得到的能量最小蛋白质构象中对应位置的片段,计算替换后的蛋白质构象与替换前的蛋白质构象的能量差ΔΕ,并判断是否接受替换如果ΔΕ<0,则接受替换,如果ΔΕ>0,则根据 Metropolis规则判断是否接受替换;d5、重复步骤d4,直至{。}中的p-pt个片段均至少经过一次替换; d6、重复步骤dl d5,直至满足预定次数Q,得到局部优化的蛋白质构象;d7、利用能量函数对所述局部优化的蛋白质构象进行能量计算,根据所述计算结果更新所述信息素矩阵,并将所述局部优化后的蛋白质构象的能量与所述能量最小的蛋白质构象的能量进行比较,选择能量小的蛋白质构象。
7.一种蛋白质三维结构的预测装置,其特征在于,包括 蚁群选择单元,用于选择目标蚁群;初始化单元,用于初始化蚁群算法参数和蛋白质构象,并建立蛋白质构象和片段库的映射关系;片段选择单元,用于选择蛋白质构象片段;蚁群控制单元,用于控制所述目标蚁群在信息素的指引下对所述初始蛋白质构象进行优化;第一能量计算单元,用于对优化后的蛋白质构象进行能量计算,并选择能量最小的蛋白质构象;蛋白质构象局部优化单元,用于对所述能量最小的蛋白质构象进行局部优化; 第二能量计算单元,用于对所述局部优化后的蛋白质构象进行能量计算; 信息素矩阵更新单元,用于根据第二能量计算单元的计算结果更新信息素矩阵; 比较单元,用于对所述局部优化后的蛋白质构象的能量与所述能量最小的蛋白质构象的能量进行比较,并选择能量小的蛋白质构象;循环控制单元,用于控制对蛋白质构象进行优化和局部优化操作的循环; 判断单元,用于判断循环是否满足终止条件,如果否,则通知所述蚁群控制单元继续进行控制所述目标蚁群在信息素的指引下对所述蛋白质构象进行优化;如果是,则确定较优蛋白质构象;Loop重建单元,用于对所述较优蛋白质构象进行Loop重建,得到最优蛋白质构象。
8.根据权利要求7所述的预测装置,其特征在于,还包括 交叉控制单元,用于将所述最优蛋白质构象进行交叉。
全文摘要
本发明提供了一种蛋白质三维结构的预测方法,包括a、选择目标蚁群,初始化蚁群算法参数;b、初始化蛋白质构象,建立蛋白质构象与片段库的映射关系;c、以蛋白质构象上的任一位置为起点,目标蚁群在信息素的指引下进行优化,对优化后的蛋白质构象进行能量计算,选择能量最小的蛋白质构象;d、对能量最小的蛋白质构象进行局部优化,并进行能量计算,根据计算结果更新信息素矩阵,并将局部优化后的蛋白质构象的能量与能量最小的蛋白质构象的能量进行比较,选择能量小的蛋白质构象;e、重复步骤c~d,得到较优蛋白质构象;f、对较优蛋白质构象进行Loop重建,得到最优蛋白质构象。本发明还提供了一种蛋白质三维结构的预测装置。
文档编号G06F19/14GK102402649SQ20101028770
公开日2012年4月4日 申请日期2010年9月17日 优先权日2010年9月17日
发明者吕强 申请人:苏州大学