专利名称:基于稀疏表示分类器的分布式压缩感知数据分类方法
技术领域:
本发明涉及无线网络领域,尤其涉及传感器网络的数据分类机制。
背景技术:
传感器网络(Wireless Sensing Networks, WSNs)是一种由大量传感器节点构成的自组织网络。随着硬件和软件技术的发展,其应用范围得到了极大发展。然而,传感器节点在存储空间、处理能力和能量等方面存在一定的局限性,使得数据融合技术成为大规模传感器网络的研究方向之一。
数据融合技术是指对若干观测信息,在一定准则下加以分析、综合,以完成所需的决策和评估任务而进行的信息处理技术,能够有效地均衡并降低传感器网络中的节点能量消耗。压缩感知(Compressive Sensing, CS)方法是新兴的数据融合技术之一,通过对原始数据进行测量编码与重构译码,达到降低其维数的目的,同时保留数据重要信息,其融合效果已得到大量验证。分布式压缩感知理论(Distribution Compressive Sensing, DCS)提出了相应的联合稀疏模型(Joint Sparsity Models, JSMs)将数据表示为共有和特有两部分,合理地表示多个相关联的数据,打破了分布式网络中的数据采样和传输的发展瓶颈。实际传感器网络中任务目标存在多样性,导致网络中的数据呈现出多样化和复杂化,同时传感器网络的节点随机分布于应用场景中,相邻节点的感知数据之间存在一定关联性,其冗余数据加重了节点的处理负担。考虑到传感器网络的多应用场景以及数据之间的相关性, 通过分析任务目标数据,数据分类机制可根据一定的准则将以上数据分为若干个类别,有效处理节点的感知数据。精准的分类可以大大降低节点的处理效率和能耗,并适应传感网能量受限的特性。
目前传感器网络中的数据分类技术主要包括支持向量机(Support Vector Machine, SVM), K 最邻近(K-NN),贝叶斯回归等算法。K. Flouri, B. BeferullLozano, P. Tsakalides 在“Training a SVM-basd classifier in distributed sensor networks,, [Proceedings of the 14th European Signal Conference (EUSIPC0 2006), Florence, Italy, 2006利用稀疏表示的边界性原理,提出了一种基于SVM的分布式分类算法。Liu Chun Ting, HUO Hong, FANG Tao 等在“Classification Fusion in Wireless Sensor Networks” [Acta Automatica Sinica, vol. 32, no. 6, pp. 947 - 955, 2006中提出在传感节点处,利用K-NN算法分别对获取的任务数据独立分类后,再将分类结果传送至汇聚节点。Shihao Ji, David Dunson, Lawrence Carin 在“Multitask Compressive Sensing,, [IEEE Transactions on Signal Processing, vol. 57, no. I, JAN, 2009中构造了一种基于多任务的压缩感知分类模型,在压缩感知模型中结合了贝叶斯的后验参数估计方法。
以上分类方法都包括训练样本学习和测试样本分类两个阶段,但是,计算复杂度过高,且未充分考虑传感网络数据的稀疏性和相关性特点。基于表示的分类器SRCXSparse Representation-based Classifier)是一种非参数的学习方法,可在不经过训练样本学习阶段,且不需要假设函数和参数的情况下,直接给测试样本分配一个类别标签。为了有效地提高传感器网络数据的分类性能,本发明提出一种基于稀疏表示分类器的分布式压缩感知数据分类方法,通过将训练数据分为共有和特有部分,准确地获取类别数据的特征,作为分类的重要依据,能够有效提高算法效率和数据处理性能等。发明内容
本发明所要解决的技术问题是当传感器网络规模增大或应用增多时,对于能量受限的传感节点来说,数据传输和处理负担过重,此外,网络中所传输的数据具有稀疏性和相关性特点,传统分类方法难以精准地对该类数据进行分类。针对此问题,本发明依据传感器网络的数据特点,将同类数据分为共有与特有两个部分,设计了一种适用于相关稀疏数据的分类方法,避免了传统分类方法学习阶段的额外开销,更有利于传感器网络的数据处理。
本发明解决其技术问题所采用的技术方案是利用压缩感知技术,将压缩变换所得的稀疏系数作为分类过程中的重要参数。由于稀疏系数的非零值的数值和位置与原始数据存在一一对应的关系,则数据在固定稀疏基下的稀疏系数具有惟一性,且稀疏系数的维数远低于原始数据,可见,在分类算法过程中,将稀疏系数作为主要参数可以有效地节省计算开销。因此,在相同稀疏基下,利用不同类别数据的稀疏系数作为数据分类依据。显然, 属于同一类别的数据在稀疏系数的表示下属于相关数据,则该类别任意数据的稀疏系数可由其它数据的稀疏系数集合以线性方式进 行描述。因此,本发明将同一类别数据的共同特点以共有部分来表示,而同一类别数据的共有稀疏系数部分在相同稀疏基的情况下,也同样表示了该类别数据的共同特点。
同时,本发明将感知数据分为两部分,一部分数据作为训练样本,一部分数据作为分类用的测试样本,以检验分类算法的准确性。将所有训练样本都按照上述方法表示,按照所属类别将共有和特有部分分别依次排列成两个新的矩阵。在相同稀疏基的条件下,若测试样本稀疏系数的共有和特有部分,能够被训练样本相对应的部分线性表示,同时满足线性表示时的非零系数所对应的类别相同,则可以确定该测试样本的类别。具体为
一种基于稀疏表示分类器的分布式压缩感知的传感器网络数据分类方法,汇聚节点将传感器节点的感知数据作为训练样本数据,不同的监测任务样本数据均在同一稀疏基Ψ下进行系数变换,将每个训练样本数据表示为公共部分和特有部分;采用与训练样本相同的稀疏基ψ,根据公式χ=Ψ α ,给定一个属于C个类别的测试样本χ的类别标签; 根据训练样本的公共部分和特有部分的稀疏系数,构造所有训练样本的特有稀疏系数矩阵 a s和公共稀疏系数矩阵a Cffl ;用训练样本的稀疏基矩阵将测试样本的稀疏基矩阵表示为方程α=α J^asIi2,求解上述方程为测试样本的数据χ寻找类别标签y,其中,a为测试样本的稀疏基矩阵。将训练样本中的每个数据根据公式χ^ζ^+ζ^Ψ α εηι ^Ψ a s;J 表示为两个部分,其中,分别表示j类别训练样本\q(q=l,2,…,np的共有部分和特有部分Uj为j类别训练样本的数据数目),且ζ ,」=Ψ a em j,ζ^=Ψ a s j,Ψ是稀疏基,CIc^jP a U分别表示公共部分和特有部分维数为m的稀疏系数。根据公式a,=[ .,,%.2,…,as,c ] e ,确定所有训练样本的特有稀疏系数矩阵a s,」,根据公式ae Μ’确定所有训练样本的公共稀疏系数矩阵a cfflD利用I1范数下的优化问题求解方程a=a a sk2, Ii1和k2需满足以下条件A1关O且 , 获得的J1或者j2即为测试样本数据χ的类别标签,其中,Ii1 =
本发明的有益效果是本发明提出了一种基于稀疏表示分类器的分布式压缩感知数据分类方法,充分考虑了传感器网络数据的稀疏性和相关性,利用稀疏表示以及在固定稀疏基下的稀疏系数的唯一确定性,设计了分类矩阵和分类过程,从而准确地判断了测试样本的类别标签。同时将同一类别数据的共有和特有部分作为分类过程中的重要参数。 与现有的传感器网络数据分类方法相比较,本专利提出的方法能够有效地将高维数据表示为低维的稀疏系数,能够有效地降低网络能耗,提高算法效率和数据处理性能,利于用户管理,便于网络应用及规模的拓展。
图I传感器网络数据分类流程图2 j类别训练数据的表示图3所有训练数据的分类参数Qen^Pas的表示图4基于稀疏系数的数据分类方法流程图。
具体实施方式
在实际的传感器网络中,由于应用范围的扩展,节点数量众多,并且同一场景中可能存在多种监测传感器节点和监测任务,合理地分析和处理这些数据将有效地提高传感器网络的扩展性。数据分类方法利用数据相关的特性,能够有效地降低数据处理量,减少节点能耗,实现高效处理网络数据的目的。
在传感器网络中,节点大体上分为两类大量的传感节点和少数的汇聚节点。传感节点负责收集周边的任务数据,汇聚节点负责收集传感节点的数据。并且,汇聚节点的能量比较充沛,因此把汇聚节点看作是能量不受限的节点。
本发明的网络数据分类流程如图I所示传感节点压缩处理收集的原始数据,获取特征数据,汇聚节点再根据以下分类方法对上述数据进行分类,以便管理者的分析与处理。
汇聚节点将传感器节点的感知数据作为训练样本数据,不同的监测任务样本数据均在同一稀疏基Ψ下进行系数变换,将每个训练样本数据表示为公共部分和特有部分;采用与训练样本相同的稀疏基Ψ,根据公式χ=Ψ α,给定一个属于c个类别的测试样本χ的类别标签;根据训练样本的公共部分和特有部分的稀疏系数,构造所有训练样本的特有稀疏系数矩阵as和公共稀疏系数矩阵α ;用训练样本的稀疏基矩阵将测试样本的稀疏基矩阵表示为方程α = α sk2,求解上述方程为测试样本的数据χ寻找类别标签y,其中,α为测试样本的稀疏基矩阵。
如图2所示为j类别训练数据的表示图。
汇聚节点将传感器节点的感知数据作为训练样本数据,不同的监测任务样本数据,均在同一稀疏基Ψ下进行系数变换,将每个训练样本数据表示为公共部分和特有部分。采用与训练样本相同的稀疏基Ψ,基于压缩感知模型,根据公式Χ=Ψ α,判断属于c个类别的测试样本jce % G Mi7的类别标签。
一、训练数据表示
本发明根据监测任务将数据Xi (其中i表示数据序号)进行分类,把一种监测任务的数据归为同一类别的数据。假设网络中有c个类别,共η个训练数据,数据维数为M,其集合表示为
权利要求
1.一种基于稀疏表示分类器的分布式压缩感知的传感器网络数据分类方法,汇聚节点将传感器节点的感知数据作为训练样本数据,不同的监测任务样本数据均在同一稀疏基Ψ下进行系数变换,将每个训练样本数据表示为公共部分和特有部分;采用与训练样本相同的稀疏基Ψ,根据公式Χ=Ψ α,给定一个属于c个类别的测试样本X的类别标签;根据训练样本的公共部分和特有部分的稀疏系数,构造所有训练样本的特有稀疏系数矩阵a s和公共稀疏系数矩阵a Cffl ;用训练样本的稀疏基矩阵将测试样本的稀疏基矩阵表示为方程α = α οΑ+α sk2,求解上述方程为测试样本的数据X寻找类别标签y,其中,α为测试样本的稀疏基矩阵,kl5k2 e Rm是系数向量。
2.根据权利要求I所述的数据分类方法,其特征在于,将训练样本中的每个数据根据公式α ^.+ Ψ a s;J(j=l, 2,- ,c)表示为共有部分和特有部分,其中,Ψ是稀疏基,a Cffl,j和a SiJ分别表示公共部分和特有部分维数为m的稀疏系数。
3.根据权利要求I所述的数据分类方法,其特征在于,根据公式t=[a I,…,] e股”xn,确定所有训练样本的特有稀疏系数矩阵a s,根据公式a =[ac,d.2,···,(*■] e股’确定所有训练样本的公共稀疏系数矩阵a ,m为稀疏系数的维数,η为训练数据个数。
4.根据权利要求I所述的数据分类方法,其特征在于,利用I1范数下的优化问题求解方程α = α上+α太山和匕满足条件:1^古0且 2,获得的L或者j2即为测试样本数据X 的类别标签,其中,It1= 0,---,0,kh ,0,---,0 ,k2 = 0,---,0,/:.;/,O,··-,0,M是训练样本的j类别数据对应的共有稀疏系数,是对应训练样本数据Xj, q的特有稀疏系数。
全文摘要
本发明请求保护一种基于稀疏表示分类器的分布式压缩感知数据分类方法,涉及无线网络领域。针对传统分类方法应用于规模较大或应用较多的传感器网络时,未充分考虑传感节点数据传输和处理负担过重以及数据稀疏相关的特点,设计了一种适用于相关稀疏数据的分类方法,将数据稀疏系数的共有部分和特有部分作为分类依据,合理地对传感器数据进行处理。本发明提出的数据分类方法对于传感器网络数据分类结果比较准确,同时利用稀疏系数的策略能够有效地降低网络能耗,提高算法效率和数据处理性能,利于用户管理,便于网络应用及规模的拓展。
文档编号H04W28/08GK102932847SQ20121041798
公开日2013年2月13日 申请日期2012年10月26日 优先权日2012年10月26日
发明者吴大鹏, 孙青文, 王汝言, 刘乔寿, 熊余, 唐季超 申请人:重庆邮电大学