一种储层油气预测的方法
【技术领域】
[0001] 本发明属于石油地球物理勘探地震储层预测技术,具体是利用基于属性聚类的自 适应增强算法进行储层油气预测的方法。 技术背景
[0002] 模式识别技术在石油地球物理勘探领域被广泛的应用到储层预测方面,利用模式 识别技术可进行油气预测、岩性预测和储层参数估算等等。根据分类器生成的训练阶段是 否用到已知样本,现有的地震属性模式识别方法可分为两大类:无监督方法和有监督方法。 无监督方法不需要已知样本信息而将数据分为不同的类,而有监督方法利用已知样本(例 如井信息)来构建分类器,通过利用先验信息,有监督方法可以提供更高的精度。
[0003] 目前在石油地震勘探储层油气预测中常用的有监督模式识别方法有k_近邻法和 BP神经网络算法等。其中k_近邻法是对一个新样本,找离它最近的k个学习样本,这k个 学习样本中属于哪一类的样本最多,就判断新样本属于那一类。k_近邻法虽然简便,但是一 个样本是一个点,是一个随机变量或向量,因此,稳定性不够好。而BP法一般只用于两类分 类,专利200410013772公开了这种方法。尽管BP神经网络是石油地震勘探储层和油气预 测方法中应用的比较广泛,但在复杂岩性油气储层油气预测中,因储层及围岩的厚度和岩 性在横向上的变化,其地震响应特征也变化加大,使得BP神经网络对复杂样本集的训练难 以收敛且BP网络隐层个数及隐层节点数难以确定。所以,目前的有监督模式识别方法对储 层油气预测效果并不理想,精度低。
[0004] 目前有用堆近邻法代替点近邻法克服k-近邻稳定性不好的缺点,堆近邻就是把 学习样本分成若干个小堆的,用一堆的均值中心代表这一堆。首先需要把学习样本分堆,生 成得到堆分类器,可以用聚类方法。直接用学习样本数据进行聚类的方法是k均值算法和 模糊C均值算法,这两种算法都是建立在最小平方准则基础上的。最小平方准则对噪声比 较敏感,会使结果不稳定。为了改进k均值算法和模糊C均值算法,程乾生在1998年9月 刊的《系统工程理论与实践》提出了属性聚类方法。属性聚类方法是一种新的聚类方法,由 于它引进了稳态函数,因此它比常规的k均值算法和模糊C均值算法更加稳定,抗干扰能力 更强。
[0005] 其次是需要把多个堆分类器合成为一个更好的分类器。多个分类器合成有多种方 法,但是近年来基于统计学习的Adaboost算法引人注目,效果良好,成为应用较多的一种 有监督模式识别方法。Adaboost算法主要针对分类器在学习阶段的调节,可以将任何弱分 类器经过组合成一个可达到很高精度的强分类器。此算法计算简单,运算速度快,同时也 可与其他方法结合以实现快速分类算法。目前对AdaBoost研究及应用的专利有很多,专利 201010280835公开了一种改进的AdaBoost分类器构造方法,专利201110200287公开了一 种基于AdaBoost算法的人脸检测方法。
[0006] 属性聚类抗干扰能力强,但它属于无监督方法,不能利用已知信息(已知油气分布 情况)进行分类。AdaBoost算法能将任何弱分类器经过组合成一个可达到很高精度的强分 类器,但是其抗干扰能力不强。本发明吸取属性聚类和AdaBoost的优势,把这两种方法结 合起来,形成一种提高储层油气预测精度的方法。
【发明内容】
[0007] 本发明目地在于提供一种提高精度的储层油气预测的方法。
[0008] 本发明通过以下具体步骤实现:
[0009] 1)在目的层段提取的对储层油气敏感的地震属性,根据已知钻井信息确定训练样 本数据、测试样本数据和待分类样本数据;
[0010] 步骤1)中的训练样本数据是根据已知钻井信息确定的,是已知目标层段含油气情 况的地震属性数据。
[0011] 步骤1)中的测试样本数据是根据已知钻井信息确定的,是已知目标层段含油气情 况的地震属性数据,用来验证本发明对油气预测的正确性。
[0012] 步骤1)中的待分类样本数据是没有钻井地方,不知道分类情况的地震属性数据, 用于本发明进行油气预测的数据。
[0013] 2)计算训练样本数据的平均值,对训练样本数据、测试样本数据和待分类样本数 据进行标准化;
[0014] 标准化过程如下所述:
[0015] 步骤2)所述的计算训练样本数据的平均值是:
[0016]
【主权项】
1. 一种储层油气预测的方法,特点是通过以下具体步骤实现: 1) 在目的层段提取对储层油气敏感的地震属性,根据已知钻井信息确定训练样本数 据、测试样本数据和待分类样本数据; 2) 计算训练样本数据的平均值,对训练样本数据、测试样本数据和待分类样本数据进 行标准化; 3) 利用属性均值聚类结合AdaBoost方法对标准化后的训练样本数据进行训练,构建 分类器; 4) 利用步骤3)构建的分类器对标准化后的测试样本数据进行分类,计算标准化后的测 试样本数据的分类正确性; 若标准换后的测试样本的分类正确性大于90%,则认为由步骤3)得到的分类器是合适 的,否则调整最大弱分类器个数,重新进行步骤3); 5) 通过步骤3)分类器的构建,得到在不同弱分类器个数下的各个堆类中心m,各个堆 类所属的类别及组合分类器系数a;利用步骤3)构建的分类器对标准化后的每个标准化 后的待分类样本数据进行分类; 分类步骤如下: (1) 在不同弱分类器个数下,求取标准化后的待分类样本x与各个堆类中心m的欧式距 离,寻找两者距离最近的堆类; (2) 对所属的类别相同的最近的堆类,弱分类器的组合分类器系数相加; (3) 比较各个类别下的组合分类数系数大小,标准化后的待分类样本属于组合分类系 数最大所对应的类别; 6) 根据标准化后待分类样本所属类别预测储层的油气分布。
2. 根据权利要求1的方法,特点是步骤1)中的训练样本数据是根据已知钻井信息确定 的,是已知目标层段含油气情况的地震属性数据。
3. 根据权利要求1的方法,特点是步骤1)中的测试样本数据是根据