本发明涉及一种模型解析方法,具体涉及一种基于saxs的蛋白质与表面活性剂复合物模型解析方法,属于生物化学、生物物理、物理化学的技术领域。
背景技术:
sds对蛋白质的α-螺旋结构及聚集作用或纤维化所呈现的双重调控行为,可作为分子伴侣辅助蛋白质复性,对于更好理解蛋白质去折叠与重折叠过程及其机理、发展表面活性剂辅助蛋白质复性技术具有重要意义,因此表面活性剂诱导蛋白质折叠、去折叠及重折叠的机理与复合物模型的研究已成为人们越来越重视的课题。然而,sds调控蛋白质α-螺旋结构以及聚集/纤维化行为机制目前还没有统一和完善;溶液组分、环境因素及热动力学对复合物形貌尺寸影响极其显著,致使电镜技术直观观测复合物形态难度较大,很难精确获得全部结构信息,需要准确的理论模型加以辅助支撑。
小角x射线散射(smallanglex-rayscattering,saxs)技术在研究表面活性剂与蛋白质的亚微观结构(数纳米至数百纳米)方面具有独特的优势,是原位、动态监控溶液中蛋白质复合物结构变化的一种重要手段。具体应用主要包括以下几个方面:
1.通过guinier散射测定复合物胶团、胶粒的形状、粒度以及粒度分布等;
2.复合物体系中的分子运动和相变;
3.通过porod-debye相关函数法研究复合物多相体系的相关长度、界面层厚度和总表面积等;
4.通过绝对强度的测量,测定蛋白质的分子量;
5.根据不同形状(球形、椭球形、棒状、盘型等)粒子的形状因子及散射强度克通过相关公式计算,通过采用具有一定普适性的受限自动化散射曲线拟合方法,获得动态模型参数,构建模型结构;最后可原位、无损、无需纯化和单分散蛋白样品来表征复合物结构。
目前较为常用的蛋白质结构分析算法和软件包括,crysol,ornl-sas,fast-saxs,foxs,saxs3d等。无论是通过saxs实验获得的散射强度曲线的结构和解析,还是通过模拟结构计算拟合实验散射强度曲线来解析蛋白质复合物结构,都是蛋白质或复合物的不同结构对散射强度曲线对具有不同“特征指纹”。
虽然利用从头计算法和不同软件通过对实验散射强度数据曲线的拟合来构建高分辨率三维结构模型,可以进一步确立蛋白质主体结构,另外在从头计算法的基础上,利用球形刚体建模方法将不同结构片段进行重组,对每个组合结构计算散射强度曲线,并与实验获得曲线进行比对,重复结构片段组装与曲线拟合过程,直到获得满意的匹配度,最终获得完整的蛋白结构。在蛋白质与表面活性剂相互作用过程中,由于蛋白溶液浓度与x射线光散射密度较低,而表面活性剂的极性亲水基团和非极性的疏水基团的散射强度较大,表面活性剂的散射强度会覆盖蛋白质的散射强度,在计算和拟合散射曲线获得复合物模型过程中,表面活性剂的散射强度会对结果引入较大干扰和误差,获得的理论结构模型与实际复合物结构差异非常大。
另外,蛋白在某些表面活性剂(如sds)胶团存在条件下,蛋白呈折叠态,α-螺旋结构增加;但sds在临界胶束浓度(cmc)以下,蛋白质α-螺旋含量降低、β-折叠结构升高,蛋白呈去折叠态,伴随小球状淀粉质β-多肽聚集体产生。在sds诱导β-多肽淀粉样纤维化或调控蛋白及多肽聚集作用同样具有双重行为。而且尽管sds诱导蛋白质或多肽呈现增加的α-螺旋结构折叠态,但长时间的培育作用(几天到几个星期)促进生成纤维体或聚集体,可能复合物通过暴露在外的脂肪酸链的疏水作用而发生聚集作用。sds诱导球状蛋白质失活及复性过程不同阶段单体复合物和聚集体结构特征。而因为表面活性剂与蛋白质散射强度的较大差异,现有软件及计算方法无法对表面活性剂诱导的蛋白质聚集作用和聚集体复合物模型进行解析。
在蛋白质复合物通用理论模型仍然确实的情况下,基于saxs建立具有普适性的适用于表面活性剂与蛋白质单体和聚集体复合物结构的理论模型的计算解析方法,具有十分重要的科学意义和应用价值。
技术实现要素:
本发明的目的在于,提供一种基于saxs的蛋白质与表面活性剂复合物模型及解析方法,以克服现有技术所存在的上述缺点和不足。
本发明所需要解决的技术问题,可以通过以下技术方案来实现:
作为本发明的第一方面,一种基于saxs的蛋白质与表面活性剂复合物模型,其特征在于,模型的散射强度表达式为:
i(q)=sc·nmic·[p(q)+<a(q)>2(s(q)-1)]+back(23)
sc为整体尺度因子,用于校正表面活性剂较小幅度的浓度变化,如表面活性剂浓度1mm-15mm,sc为1;
其中涉及计算参数有:溶剂电荷强度ρwt
可以选择不同形状因子,通过调整体系蛋白质和表面活性剂类型的物理化学参数,采用具有普适性的受限自动化saxs曲线拟合方法,在绝对尺度和体系真实浓度下,解析蛋白质与表面活性剂单体与聚集体复合物结构参数;
根据saxs的球形、椭球形、棒状、盘型等粒子的形状因子及散射强度通过本发明中公式计算,利用受限自动化saxs曲线拟合实验散射强度曲线,在绝对尺度和体系真实浓度下,解析蛋白质与表面活性剂单体与聚集体复合物结构参数,例如复合物外层半径、内核截面半径、复合物体积、含水量,长轴与短轴半径比、复合物中蛋白质分子量等动态模型参数,
同时加入通过在计算公式中加入胶团数量和胶团间的距离等参数,能轻松灵活的计算和分析聚集态复合物结构参数和理论模型特征。
寻找并优化与实验散射曲线最吻合方案,通过调整体系表面活性剂物理化学参数及浓度、蛋白质浓度等逆向对散射曲线拟合调整误差,获得最佳理论曲线拟合数值,最终获得可靠并完整蛋白质与不同类型表面活性剂单体复合物结构理论模型。
作为本发明的第二方面,一种基于saxs的蛋白质与表面活性剂复合物模型的解析方法,其特征在于,包括以下步骤:
(1)蛋白质与表面活性剂saxs数据的采集;
(2)saxs数据预处理与预分析;
(3)选择不同形状因子;
(4)选择表面活性剂碳链长度、亲水基体积等物理化学参数;
(5)输入体系表面活性剂浓度、蛋白质浓度;
(6)采用受限自动化saxs曲线拟合方法获得最佳拟合结果,具体计算方法见下文;
(7)获得单体态复合物结构模型参数,同时加入胶团数量和胶团间的距离参数,以此获得聚集态复合物结构模型参数;
(8)判断服复合物结构合理性,调整参数,重新迭代计算;
(9)获得结构参数与理论模型,结束。
其中,步骤(3)中,所述选择不同形状因子为球形、椭球形、棒状、核壳型。
参见图3。
本发明的有益效果:
1、与现有计算方法和模拟软件相比,本方法可以获得蛋白质与表面活性剂结合作用过程不同阶段单体态和聚集态复合物结构理论模型。
2、同时在绝对尺度下(即体系中蛋白质与表面活性剂的真实浓度)可以解析蛋白质与表面活性剂单体与聚集体复合物结构特点并获得结构参数,例如复合物半径、截面半径、蛋白质分子量、体积、含水量,长轴与短轴半径比、聚集体中胶束数量、聚集体中胶束的距离等,用以描述复合物结构特点。
以表1和2为例说明该模拟方法获得复合物单体态和聚集态结构模型参数。
表1不同浓度ctab与乳清蛋白复合物saxs模型计算结果
在saxs测试中蛋白质浓度为0.1mm,ctab与蛋白质摩尔比以c:b表示.
actab分子结合数/每复合物;
b壳的厚度;
c核半径;
d长轴与短轴半径比.ε=roverall/rin;
e壳外含水量;
f蛋白分子量/每复合物;
g复合物体积;
#未固定参数;
##计算值;
*固定参数;
表2ctab与乳清蛋白不同结合时间的聚集态复合物结构模型参数,nmic:聚集体中胶束数量;dmic:聚集体中胶束间直线距离;其他参数与表1中相同。
附图说明
图1a为sds胶团与蛋白质复合物不同结构理论模型。
图1b为核壳结构模型拟合sds-溶菌酶聚集体散射曲线结果。
图2a为核壳结构模型拟合sds-溶菌酶复合物单体结构参数结果。
图2b为核壳结构模型拟合sds-溶菌酶复合物单体曲线结果。
图3为本发明的流程图。
具体实施方式
以下结合具体实施例,对本发明作进一步说明。应理解,以下实施例仅用于说明本发明而非用于限定本发明的范围。
实施例1
该计算和模拟方法基于绝对尺度,增加了结果的准确性。假设复合物颗粒具有较小的宽高比,散射强度i(q)为:
i(q)=<a(q)2〉+<a(q)>2[s(q)-1],(1)
其中a(q)为颗粒散射幅度,s(q)为结构因子,描述粒子间的相互作用、聚集和聚集体结构等信息,<>表示所有取向的平均值,对于蛋白质-表面活性剂复合物采用胶团修饰的核壳模型,其中表面活性剂疏水链构成内核,蛋白质与表面活性剂极性基团构成壳,蛋白质分布在整个壳上,因此对于颗粒的散射幅度为:
a(q)=δρshell·vtot·φ(qrout)+(δρcore-δρshell)·vcore·φ(qrin).(2)
散射界面为散射幅度与因子
假设复合物具有椭圆形形状,那么形状因子p(q)=<a(q)2>:
其中
对于链珠型复合物具体来说,需要结构因子加以描述,nmic为聚集体中胶团的数量,dmic为连续胶团间的距离,聚集体的结构因子为:
基于绝对尺度下的散射强度计算方法,对于不同表面活性剂和蛋白质具有不同的电荷参数,例如sds的疏水链和极性基团的电荷数分别为nel(t)=97e,nel(h)=59e,疏水链和极性基团的基团分别为
溶剂,如水的电荷强度
δρt=ρt-ρwt,(8)
δρh=ρh-ρwt.(9)
内核体积
复合物中聚集体的数量为
构成胶团的浓度为表面活性剂总浓度与未结合蛋白表面活性剂浓度差:
c=c-cfree,(12)
每立方厘米中胶团所含有表面活性剂的分子数为(分子数/cm3):
n=(c-cfree)·10-6·na,(13)
其中“na”为阿伏伽德罗常数(6.02×1023),因此每立方厘米中胶束数量为(胶束/cm3):
假设体系中所以蛋白与表面活性剂胶束构成复合物,没有结合的为游离蛋白,因此每胶团中蛋白质的分子质量(g/胶束)为:
每克蛋白质的平均对比散射强度差为
假设蛋白质位于复合物外壳,那么,复合物外壳总电荷为:
nel(shell)=naggvhδρh+nel(prot).(17)
总体积为:
外壳体积为:
vshell=vtot-vcore.(19)
外壳含水量由下式计算:
其中
δρcore=δρt·rt,(22)
其中scshell为尺度因子,用于校正外壳理论电荷强度差与实际系统中外壳理论电荷强度差,可作为外壳中基团水合作用微小变化的标志:
模型散射强度最终表达式为:
i(q)=sc·nmic·[p(q)+<a(q)>2(s(q)-1)]+back(23)
sc为整体尺度因子,用于校正表面活性剂较小幅度的浓度变化。如果表面活性剂浓度变化不大,例如1mm-15mm,sc可以为1。溶剂电荷强度ρwt位
以上对本发明的具体实施方式进行了说明,但本发明并不以此为限,只要不脱离本发明的宗旨,本发明还可以有各种变化。