基于模型预测的生物毒性预测方法
【技术领域】
[0001] 本发明涉及环境中有毒物质预测领域,具体为基于模型预测的生物毒性预测方 法。
【背景技术】
[0002] 污染物生物毒性数据一般通过实验获得,但是在很多情况下,生物毒性数据很难 获取。一方面,有些污染物的毒性效应终点很难判断,尤其对于一些新型污染物,因此毒性 实验很难开展,无法获取其生物毒性数据;另一方面,考虑到对动物保护的需求,一些稀有 生物已经禁止开展其毒性实验,如稀有生物和濒危生物等,因此也很难获取其生物毒性数 据。而这些稀缺的生物毒性数据在水质基准和风险评估的研究中是必不可少的,如何在数 据缺乏的情况下开展这方面的相关研究,是一个极具挑战的问题。因此模型预测的方法获 得污染物的生物毒性数据就显得尤为重要。
[0003] 关于生物毒性预测的模型,比较传统的模型预测方法是定量结构活性相关 (quantitativestructureactivityrelationship,QSAR)模型,QSAR模型主要是根据物 质的物理化学性质跟其毒性的定量关系获得的,这种模型在有机物的毒性预测中已经广泛 应用。但是QSAR的方法也有它的局限性,当物质的物理化学参数很难获得时,这种预测的 准确性值得商榷。另外,QSAR模型在预测污染物对高等生物毒性方面,也存在很多不确定 性。种间关系预测(interspeciescorrelationestimation,ICE)模型是一种基于物种之 间毒性的相关关系而构建的,ICE模型是用已知的生物毒性数据来预测物质对未知物种毒 性的一种方法。种间关系预测可以用简单低等生物毒性试验来代替高等生物毒性测试,用 简单毒性测试体系代替复杂的毒性测试体系。
[0004]ICE模型最初是由美国环保局(USEPA)开发出来的一种用已知物种的毒性数据 来预测未知物种毒性的方法。但由于模型的内置的数据均为北美地区的生物毒性数据,并 不包括中国的本地特有物种,因此在应用上有很大的局限性。
[0005] 本发明涉及到的一些相关名词解释:
[0006] ICE :Interspecies Correlation Estimation(种间关系预测);
[0007] LC5Q:Lethal Concentration to50%of Test Organisms(半数致死浓度);
[0008] EC5Q:Effective Concentration to5〇%of Test Organisms(半数致死效应);
[0009]LD5Q:Lethal dose to5〇%of Test Organisms(半数致死剂量);
[0010]SSD :Species Sensitivity Distribution(物种敏感度分布)。
【发明内容】
[0011] 本发明的目的在于提供一种基于模型预测的生物毒性预测方法,针对ICE模型仅 仅局限于北美地区的生物毒性预测的缺陷,本发明通过对模型参数进行优化,将中国的本 地物种生物毒性数据添加到模型中,进一步验证了模型在中国的可应用性,扩大了模型的 应用范围。
[0012] 为了解决以上问题,本发明采用的技术方案如下,一种基于模型预测的生物毒性 预测方法,包括以下步骤:
[0013] 步骤一,替代物种的选择:
[0014] 针对某一种物质,收集整理该物质已有的的生物毒性数据,在所有的物种毒性数 据中,选择当地代表性的物种作为替代物种,将物种对应的所有毒性数据进行处理,取几何 均值,作为模型预测输入数据备用;
[0015] 步骤二,用替代物种进行毒性预测,获得未知物种的毒性数据:
[0016] 根据步骤一筛选出的物种,在模型里输入数据,选择预测物种,获得预测物种的毒 性数据;
[0017] 步骤三,预测数据的筛选。
[0018] 作为优选,替代物种需要满足以下两个条件:(1)同一物种的毒性数据至少5个; (2)物种有代表性,能够代表某一个营养级,共选择2-3个物种。
[0019] 作为优选,步骤一,数据的筛选标准如下:(1)对于化学性质较为稳定的物质,使 用流水实验得出的数据,当数据缺乏时,使用半静态和静态实验得出的数据;(2)实验中必 须设置对照实验,对照组和实验组的实验条件完全一样,如果对照组中的物种大量死亡或 表现出胁迫和疾病症状,不能使用该实验得出的结果;(3)在实验开始和结束时必须测定 实验目标物的浓度,在整个实验过程中实验目标物的浓度应保持不变;(4)实验过程中应 严格控制各个理化参数,包括实验温度应尽量维持在受试物种的最适生长温度范围之内, 溶解氧浓度应是其饱和浓度的60 %~105 %,颗粒物浓度应< 20mg?L\总有机碳浓度 彡5mg?L% (5)不能使用以蒸馏水或去离子水作为实验用水的实验所得出的数据;(6)使 用同一物种所做的急性/慢性毒性实验,如果得出的急性/慢性值相差10倍以上,需要将 边界外的值剔除,如果针对同一受体且暴露终点相同的数据则选用这些数据的几何均值。
[0020] 作为优选,步骤三,具体的筛选原则如下:(1)均方差〈0. 22 ; (2)替代物种和预测 物种的分类学距离< 3,即必须是至少属于同一目;(3)交叉验证率大于85%;(4)置信区 间95% -99% ; (5)自由度df> 8,毒性数据的个数N> 10,即构建模型的数据量必需大于 10 ; (6)相关系数R2 > 0. 6 ; (7)显著性水平p< 0. 01。
[0021] 作为优选,几何均值的具体公式如下:n个数al,a2,...,an的几何平均数为 ,即n个值连乘积的n次方根。
[0022] 本发明将生物毒性预测的方法应用于物种的毒性研究,锌的水质基准推导案例研 究从侧面证明了ICE模型对物种的毒性进行预测的可行性,这也就解决了部分污染物的毒 性数据不足导致水质基准无法准确推导的难题。并避免了对实验生物的损害,减轻环境污 染,从而提供了一种快速的、简单且境友好的生物毒性研究方法。在面临水质基准和风险评 估等需要大量生物毒性数据进行分析的情况下,面对部分污染物数据不足的情况,毒性预 测的方法则成为一种更经济、更便捷的方法。
【附图说明】
[0023] 图1为本发明的预测方法的流程示意图;
[0024] 图2为ICE概念模型示意图;
[0025] 图3为实测和预测的SSD分布比较。
【具体实施方式】
[0026] 以下结合附图,对本发明上述的和另外的技术特征和优点作更详细的说明。
[0027] 步骤一,替代物种(surrogatespecies)的选择:
[0028] 针对某一种物质,收集整理该物质已有的的生物毒性数据,在所有包含的毒性数 据中,水生动物毒性数据主要包括48或96h的EC50/LC50,毒性终点主要是致死或者运动 抑制效应;藻类的毒性数据主要是72或96h的EC50 ;野生生物(主要是鸟类和哺乳类)的 毒性数据主要是96h的LD50。数据的筛选标准如下:(1)对于化学性质较为稳定的物质,使 用流水实验得出的数据。当数据缺乏时,也可使用半静态和静态实验得出的数据;(2)实验 中必须设置对照实验,对照组和实验组的实验条件完全一样,如果对照组中的物种大量死 亡或表现出胁迫和疾病症状,不能使用该实验得出的结果;(3)在实验开始和结束时必须 测定实验目标物的浓度,在整个实验过程中实验目标物的浓度应保持不变;(4)实验过程 中应严格控制各个理化参数,包括实验温度应尽量维持在受试物种的最适生长温度范围之 内,溶解氧浓度应是其饱和浓度的60%~105%,颗粒物浓度应< 20mg?L\总有机碳浓度 彡5mg?L% (5)不能使用以蒸馏水或去离子水作为实验用水的实验所得出的数据;(6)使 用同一物种所做的急性/慢性毒性实验,如果得出的急性/慢性值相差10倍以上,需要将 边界外的值剔除。如果针对同一受体且暴露终点相同的数据则选用这些数据的几何均值。
[0029] 在所有的物种毒性数据中,选择中国代表性的物种作为替代物种,替代物种需要 满足以下两个条件:(1)已有的毒性数据相对较多;(2)物种有代表性,能够代表某一个营 养级,比如鱼类、无脊椎类等。共选择2-3个物种,作为替代物种,将物种对应的所有毒性数 据进行处理,取几何均值,作为模型预测输入数据备用。
[0030] 步骤二,用替代物种进行毒性预测,获得未知物种的毒性数据:
[0031] 根据步骤一筛选出的物种,在模型里输入数据,选择预测物种,获得预测物种的毒 性数据。
[0032] 在ICE模型中,替代物种的毒性值和预测物种的毒性值存在最小二乘法线性回归 的关系。目前的在线预测平台中,包含了 5000多个急性毒性值,其中涵盖了接近200个物 种、1000多种化学品的毒性数据