本发明涉及大脑功能连接网络构建、模式分类及机器学习,属于信号处理与模式识别技术领域。
背景技术:
阿尔茨海默症是一种常见的神经系统退行性疾病,临床上以记忆障碍、执行功能障碍、视空间技能损害、失语等为特征,至今没有有效的治疗措施,严重危害着人们尤其是老年人的身心健康。轻度认知障碍(Mild Cognitive Impairment,MCI)作为介于正常衰老和痴呆之间的一种中间状态,是发展为痴呆的高危人群,且仅有少部分人最终能够转化为正常;因此,如果能在轻度认知障碍阶段进行早期干预并给与治疗,将大大减少痴呆的发病率,并减缓轻度认知障碍患者认知功能的减退。然而,轻度认知障碍的精确诊断一直是一项具有挑战性的世界难题,主要原因在于其认知功能损害的症状并不明显,很难做定性分析,而构建脑网络功能连接模型,并从功能连接模型中寻找轻度认知障碍与正常人的差异连接成为辅助诊断轻度认知障碍的有效措施。过去几年,功能磁共振成像技术因其非侵入性、高空间分辨率等优点,已被广泛应用于探究大脑神经元之间的结构及其功能连接问题,而如何从fMRI数据中构建有效的脑网络功能连接模型已成为热门研究领域,并逐渐受到了研究者们的重视。
目前,绝大部分脑网络构建研究主要集中在基于相关性的方法,即通过估计相关性(如Pearson相关性,偏相关性)来定义节点间的关联。Pearson方法计算每两个脑区之间的相关系数,以此来构建功能连接脑网络模型,偏相关分析计算两个脑区之间的相关性,并且剔除其他脑区的影响来构建脑网络。已有研究表明,与其他方法相比,基于相关性的方法能较好地刻画两个脑区或神经元之间的交互,但真实脑网络往往是多个脑区或神经元集群之间相互连接,因此,基于相关性的方法并不能真实地描述脑区之间的连接模式;另外基于相关性所构建的脑网络一般是全连接网络,而真实脑网络具有稀疏特性,因此基于相关性所构建的脑网络其中必定包含一些冗余和不重要的连接,这给脑网络分析带来一定的困难。
针对上述构建脑网络方法的不足,本发明使用高斯图模型来构建稀疏化的脑网络,并通过训练正确率来确定网络的稀疏程度,从而使构建的网络更加真实地还原脑网络内部连接情况。
基于高斯图模型构建的功能连接网络在表征大脑内部不同脑区之间的相互连接方面表现优异,但往往病人与正常人之间存在大量的相同连接,所提特征在表征轻度认知障碍与正常人差异方面存在冗余或不相关。因此,如何找到具有最大区分能力的差异连接和特征成为关键,为此提出了各种不同的特征选择方法,其中典型的方法有t检验、方差分析法、特征加权算法(ReliefF)、支持向量机递归特征消除法(Support Vector Machine-Recursive Feature Elimination,SVM-RFE)等。t检验和方差分析法基于统计的思想检验特征统计量在两类样本上的差异。ReliefF可以检验出与类别相关性较大的特征,且这种相关性并不局限于线性相关。上述t检验法、方差分析法、ReliefF方法都是一种过滤式的特征选择算法,特征选择与具体的分类算法无关,具有计算简单、速度快等特点,但缺乏考虑特征间的相关性及冗余性。SVM-RFE作为典型的封装式特征选择方法,考虑到多个特征间对表征样本差异和模式分类的影响,引用模式分类的指标如准确率来反映特征的重要性,选择的特征能取得较好的模式分类效果。基于过滤式和封装式特征选择方法,能有效结合两类特征选择方法的优势,首先能基于过滤式特征选择方法选取一定程度上表征样本差异的特征,再基于封装式特征选择方法选取使得模式分类效果最优的特征子集。
本发明将高斯图模型应用于轻度认知障碍功能磁共振数据中,并基于一种组合式特征选择方法,实现脑网络的精确构建、轻度认知障碍的自动识别,对辅助轻度认知障碍临床诊断,减轻医生负担提高诊断效率具有重要实际意义。
技术实现要素:
根据本发明的一个方面,本发明将高斯图模型方法应用于轻度认知障碍(MCI)功能磁共振图像数据(fMRI)中,提供了一种构建轻度认知障碍功能连接网络及特征提取的方法,所提特征在轻度认知障碍患者与正常对照之间的模式分类中取得了优良的分类效果,并且分类模型具有良好的泛化性能。
为实现上述目的,本发明提供了基于高斯图模型的脑网络建模与模式分类方法,包括如下步骤:
1.脑网络构建:应用高斯图模型估计功能磁共振数据的稀疏逆协方差矩阵,构建脑网络功能连接模型;
2.特征构建:取脑网络中边的权重,即稀疏逆协方差矩阵的下三角矩阵,作为备选特征集S0;
3.特征选择:从备选特征集S0中选取具有良好区分能力的最优特征子集S1;
4.分类模型:基于最优特征子集S1训练分类器非线性支持向量机;
5.模式分类:使用分类器对功能磁共振数据进行分类,验证特征子集S1的有效性。
其中,所属步骤1中,以训练集上具有最大训练正确率的参数值最终确定测试样本和训练样本的功能连接脑网络。
所述步骤2中,取稀疏化的逆协方差矩阵的下三角矩阵拉直构成行向量,作为特征。
所述步骤3中,使用一种过滤式和封装式相组合的特征选择方法从特征集S0中选择最优特征子集S1。
所述步骤4中,选用径向基函数(Radial Basis Function,RBF)核函数的非线性支持向量机(Support Vector Machine,SVM)作为分类器,并应用一种兼顾全局和局部的网格搜索方法确定分类器的最优参数。
本发明所提供的基于高斯图模型的脑网络建模与模式分类方法的优点包括:
1.所构建网络为稀疏网络,能更加真实表征脑部连接;
2.组合式特征选择方法,方便快捷,能快速选择最优特征子集;
3.基于本方法所找到的差异连接能够准确反映轻度认知障碍与正常人之间的差异,为轻度认知障碍的辅助诊断提供定量的技术指导。
附图说明
图1为根据本发明实施例的脑网络构建并进行模式分类的流程示意图。
图2为基于本发明实施例的两层留一法交叉验证详细分类流程图。
图3为不同稀疏程度情况下轻度认知障碍功能连接脑网络图。
图4为本发明中组合式二次过滤特征选择流程示意图。
图5为根据不同脑网络构建方法所提特征在轻度认知障碍模式分类中的受试者工作特性曲线。
图6为每次留一交叉验证中,所最终用于构建脑网络的参数λ的大小。
图7(a)和图7(b)为基于本发明所提的两个最优特征的分布图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步的详细说明。
根据本发明的一个实施例,将高斯图模型应用于功能磁共振数据中构建脑网络,已有研究表明,人类大脑具有稀疏特性,高斯图模型通过稀疏逆协方差矩阵的方式,使得逆协方差矩阵中的一些元素收缩至零,来模拟大脑的稀疏特性,并从稀疏逆协方差矩阵中提取和识别表征轻度认知障碍的连接,进行模式分类。图1展示了根据本发明的一个实施例的方法流程图,包括:
首先,对功能磁共振数据应用高斯图模型得到稀疏化逆协方差矩阵,构建功能连接网络(步骤1);然后,取稀疏逆协方差矩阵的下三角矩阵作为特征(步骤2);接着,使用t检验和SVM-RFE相组合的二次过滤特征选择方法对特征集进行筛选,得到最优特征子集(步骤3);然后,使用最优特征子集训练模式分类器支持向量机(步骤4);最后,采用所训练的非线性支持向量机分类器进行模式分类,并验证所选特征的有效性和模型的泛化性能(步骤5)。
图2进一步详细展示了基于本发明的分类流程图。如图2所示,本发明使用两层交叉验证进行模型训练和模式分类。内层留一法交叉验证用于寻找最佳脑网络模型,即参数λ的值,并将其赋给外层循环用于构建脑网络模型;外层留一法交叉验证基于内层最佳参数构建的脑网络模型寻找最优特征子集S1,并训练模式分类器SVM,进行模式分类。
下面具体介绍根据本发明所提供的基于高斯图模型的脑网络建模与模式分类方法的具体步骤:
1.脑网络构建:应用高斯图模型对功能磁共振数据构建脑网络功能连接模型;
高斯图模型通过对最大似然估计添加L1范数约束项,使得逆协方差矩阵中一些元素收缩至零,其表达式如下:
式中:θ为逆协方差矩阵,为逆协方差矩阵的估计,S为样本协方差矩阵,λ为正则化参数,用于调节稀疏程度。λ取不同的值,即可得到不同稀疏程度的脑网络,λ越大所构建网络越稀疏。图3显示了不同稀疏程度时,轻度认知障碍患者的功能连接脑网络。对于最终用于分类的脑网络,即参数λ值将由步骤4确定。
2.特征构建:取脑网络中的边作为备选特征集S0;
稀疏化逆协方差矩阵为对称矩阵,其中的每一非零项均可看成一条边,作为两个脑区之间的一个连接,而每一非零元素的大小,可看成这条边的“权重”。本发明中将边作为特征,取的下三角矩阵构成特征向量,作为备选特征集合S0。
3.特征选择:选择能最大程度表征轻度认知障碍与正常人差异的特征子集S1。
本发明使用二次过滤的方式来选择最优特征子集S1,第一次过滤使用t检验对特征集合进行筛选,选出均值差异最大的特征子集;然后,基于第一次过滤选择的特征子集,再应用SVM-RFE特征选择算法进行第二次过滤,选出最能表征轻度认知障碍与正常人差异的特征集S1。图4显示了t检验和SVM-RFE组合式特征选择方法的流程。
其中,SVM-RFE特征选择算法,具体包含如下步骤:
a)初始化特征排序向量U为空;
b)如果特征子集S为空,转至步骤f);
c)否则,用特征子集S训练SVM分类模型;
d)计算每个特征的得分;
e)将得分最低的特征从S移入到排序向量U的首部,返回至步骤b)
f)输出向量U中前k个向量作为最优特征子集S1,结束。
4.分类模型:基于最优特征子集和训练数据,训练模式分类器SVM
本发明使用基于RBF核函数的支持向量机作为最终的分类模型,并使用网格搜索方法来确定惩罚因子c和核函数宽度g的最佳组合。即先以较大步长log(step)=0.5在一个较大的范围(log(c):-8~0,log(g):-8~1)内搜索一个粗略的最优组合(c0,g0),再以较小的步长log(step)=0.1在(c0,g0)的领域范围内(log(c0)-2~log(c0)+2,log(g0)-2~log(g0)+2)搜索精细的最优组合(c1,g1)。
对于步骤1中每一个参数λ值所构建的脑网络,均可训练出一个SVM分类器,本发明中使用在训练集上拥有最大训练正确率的SVM分类器作为最终的分类模型,并以此时的参数λ值为测试样本构建功能连接脑网络。
5.模式分类:基于最优特征子集训练的分类器进行分类,并分析模型的泛化性能
所提特征在表征轻度认知障碍与正常人差异程度方面,可由分类效果间接体现,而分类效果可通过正确率(Accuracy)、敏感度(Sensitivity)、特异度(Specificity)、平衡正确率(Balanced Accuracy)和表征模型泛化性能的ROC曲线下面积(Area Under Curve,AUC)等指标体现,以上各指标越大,表明分类效果越好,所提特征差异更明显。本发明使用留一法交叉验证获得上述各指标,原始fMRI数据来自美国北卡罗莱罗纳州达勒姆市杜克大学脑成像和分析中心,包括12名MCI患者和25名正常人。
1).正确率
正确率作为反映一个分类器分类效果的最基本量,分类器分类效果越好,必然有着越高的分类正确率。在分类问题中,正确率计算公式如下:
其中,ACC表示正确率,TP表示被正确分类的正样本数,TN表示被正确分类的负样本数,FP表示被错误分类的负样本数,FN表示被错误分类的正样本数。
2).敏感度
敏感度又称真阳性率,在医学上表示实际患病(阳性)被诊断出来的百分比。其计算公式如下:
其中,SEN表示敏感度。
3).特异度
特异度,又称真阴性率,即实际无病按诊断标准被正确判为无病的百分比,反映了筛检实验确定非病人的能力。其计算公式如下:
其中,SPE表示特异度。
4).平衡正确率
平衡正确率,考虑了信号集中正负样本数存在偏态情况对正确率的影响,其计算公式如下:
其中,BAC表示平衡正确率。
5).ROC线下面积
ROC曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳率为纵坐标,假阳率为横坐标绘制的曲线。可以通过ROC曲线,比较不同的诊断实验对疾病的自动识别能力。越靠近左上角的ROC曲线所代表的受试者工作越准确,也可以通过计算AUC的值进行比较,AUC越大,实验的诊断价值越高。图5展示了基于高斯图模型脑网络以及偏相关和皮尔逊脑网络进行分类诊断的ROC曲线,从图中可以看出基于高斯图模型脑网络所训练的SVM分类器对轻度认知障碍具有良好的诊断能力。
针对来自美国北卡罗莱罗纳州杜克大学脑成像和分析中心的功能磁共振数据,表1列出了基于本发明所构建的脑网络与皮尔逊脑网络以及偏相关脑网络的分类结果对比。从表中可以看出基于本发明所构建的脑网络,准确率达到91.89%,同时还具有良好的SEN、SPE、BAC、AUC等指标,表现出良好的泛化性能,其分类效果明显优于皮尔逊及偏相关脑网络。
表1不同脑网络建模方法的模式分类结果对比
针对来自美国北卡罗莱罗纳州杜克大学脑成像和分析中心的功能磁共振数据,图6展式了本发明37次留一分类中最终用于构建脑网络模型的参数λ值大小,可以看出λ=0.03和0.04出现的频率最高,说明此时基于高斯图模型构建的脑网络在表征轻度认知障碍与正常人之间的差异方面表现更加优异。图7(a)和图7(b)分别展示了λ=0.03时两个最优的特征,从图中可以看出轻度认知障碍与正常人之间存在明显的差异。
本发明所提供的基于高斯图模型的脑网络建模与模式分类方法,主要是为准确构建脑网络,辅助轻度认知障碍脑疾病的诊断提出的。但显然,本说明书中所描述的脑网络建模分类分析方法也适用于其他脑疾病的诊断分析。
以上对本发明所提供的基于高斯图模型的脑网络建模与模式分类方法进行了详细的说明,但显然本发明的范围并不局限于此。在不脱离所附权利要求书所限定的保护范围的情况下,对上述实施例的各种改变都在本发明的范围之内。