一种用于挖掘rfid数据孤立点的方法

文档序号:6366239阅读:231来源:国知局
专利名称:一种用于挖掘rfid数据孤立点的方法
技术领域
本发明涉及射频识别技术和数字处理技术,尤其涉及一种用于挖掘RFID数据孤立点的方法。
背景技术
在RFID应用领域中RFID数据孤立点的检测具有很深远的意义,因为挖掘出孤立点所隐藏的信息,有助于找到提高标签识别率的方法以及改善作业流程。而目前主要有基于统计学分布、基于距离、基于密度、基于特征等方法用于RFID数据孤立点的挖掘,但是采用这些方法对海量的RFID数据进行孤立点的挖掘,其效果差,处理效率低以及对边界点难以判别,而且由于RFID是通过无线电磁进行传输,因此在标签的读取过程中容易读取到噪声,或者漏读、冗余读、错读等等,这样更加增大挖掘孤立点的难度。

发明内容
为了解决上述技术问题,本发明的目的是提供一种准确度高以及数据处理效率高的用于挖掘RFID数据孤立点的方法。本发明所采用的技术方案是一种用于挖掘RFID数据孤立点的方法,该方法步骤包括A、从中间件获取原始RFID数据;B、对获取的原始RFID数据进行聚类后压缩;C、通过RFID读取特征,使压缩后的原始RFID数据以三元组方式作为RFID数据点在读取特征向量空间进行RFID数据孤立点的挖掘;D、采用基于权值的反向最近邻算法对RFID数据点进行数据处理,进而输出RFID数据孤立点。进一步,所述步骤B中采用哈希表对获取的原始RFID数据进行聚类。进一步,所述步骤B包括BI、对获取的原始RFID数据利用哈希表进行聚类;B2、根据原始RFID数据判断该标签是否已存在哈希表,若存在,则增加该标签的读写次数,更新最近读取时间,并计算当前的读取信号强度;若不存在,则将该标签插入哈希表中,并记录读取记录以及该标签的读取信号强度和首次读取时间。进一步,所述步骤C中所述的RFID读取特征包括标签的读取时间间隔、标签在读取时间间隔内的读取次数以及标签的平均信号读取强度。进一步,所述步骤D包括D1、计算两两RFID数据点之间的距离,进而生成距离矩阵;D2、根据距离矩阵以及预设的K值,采用K最近邻分类计算每个RFID数据点的K最近邻居集合;D3、计算每个RFID数据点的平均距离;、
D4、选取平均距离最大的RFID数据点后根据平均距离最大的RFID数据点进而计算RFID数据点的密度权值;D5、采用反向K最近邻分类计算每个RFID数据点的反向K最近邻居集合,每个RFID数据点的反向K最近邻居集合由包含该RFID数据点的K最近邻居集合组成;D6、计算每个RFID数据点的孤立系数后对每个RFID数据点的孤立系数进行排序,进而按照预设的百分比输出RFID数据孤立点。进一步,所述步骤D2,根据距离矩阵以及预设的K值,采用K最近邻分类计算每个RFID数据点的K最近邻居集合,其具体为,根据距离矩阵以及预设的K值,分别计算每个RFID数据点的与其本身距离最近的K个RFID数据点,而计算出的K个RFID数据点则组成K最近邻居集合。
进一步,所述步骤D3,计算每个RFID数据点的平均距离,其具体为,分别计算每个 RFID数据点与其K最近邻居集合中的所有RFID数据点的距离的平均值。进一步,所述步骤D4中计算RFID数据点的密度权值的公式如下,

权利要求
1.ー种用于挖掘RFID数据孤立点的方法,其特征在于该方法步骤包括 A、从中间件获取原始RFID数据; B、对获取的原始RFID数据进行聚类后压缩; C、通过RFID读取特征,使压缩后的原始RFID数据以三元组方式作为RFID数据点在读取特征向量空间进行RFID数据孤立点的挖掘; D、采用基于权值的反向最近邻算法对RFID数据点进行数据处理,进而输出RFID数据孤立点。
2.根据权利要求I所述ー种用于挖掘RFID数据孤立点的方法,其特征在于所述步骤B中采用哈希表对获取的原始RFID数据进行聚类。
3.根据权利要求I或2所述ー种用于挖掘RFID数据孤立点的方法,其特征在于所述步骤B包括 BI、对获取的原始RFID数据利用哈希表进行聚类; B2、根据原始RFID数据判断该标签是否已存在哈希表,若存在,则增加该标签的读写次数,更新最近读取时间,并计算当前的读取信号強度;若不存在,则将该标签插入哈希表中,并记录读取记录以及该标签的读取信号強度和首次读取时间。
4.根据权利要求I所述ー种用于挖掘RFID数据孤立点的方法,其特征在于所述步骤C中所述的RFID读取特征包括标签的读取时间间隔、标签在读取时间间隔内的读取次数以及标签的平均信号读取强度。
5.根据权利要求I所述ー种用于挖掘RFID数据孤立点的方法,其特征在于所述步骤D包括 D1、计算两两RFID数据点之间的距离,进而生成距离矩阵; D2、根据距离矩阵以及预设的K值,采用K最近邻分类计算每个RFID数据点的K最近邻居集合; D3、计算每个RFID数据点的平均距离; D4、选取平均距离最大的RFID数据点后根据平均距离最大的RFID数据点进而计算RFID数据点的密度权值; D5、采用反向K最近邻分类计算每个RFID数据点的反向K最近邻居集合,每个RFID数据点的反向K最近邻居集合由包含该RFID数据点的K最近邻居集合组成; D6、计算每个RFID数据点的孤立系数后对每个RFID数据点的孤立系数进行排序,进而按照预设的百分比输出RFID数据孤立点。
6.根据权利要求5所述ー种用于挖掘RFID数据孤立点的方法,其特征在于所述步骤D2,根据距离矩阵以及预设的K值,采用K最近邻分类计算每个RFID数据点的K最近邻居集合,其具体为, 根据距离矩阵以及预设的K值,分别计算每个RFID数据点的与其本身距离最近的K个RFID数据点,而计算出的K个RFID数据点则组成K最近邻居集合。
7.根据权利要求5所述ー种用于挖掘RFID数据孤立点的方法,其特征在于所述步骤D3,计算每个RFID数据点的平均距离,其具体为,分别计算每个RFID数据点与其K最近邻居集合中的所有RFID数据点的距离的平均值。
8.根据权利要求5所述ー种用于挖掘RFID数据孤立点的方法,其特征在于所述步骤D4中计算RFID数据点的密度权值的公式如下,
9.根据权利要求8所述ー种用于挖掘RFID数据孤立点的方法,其特征在于所述步骤D6中计算每个RFID数据点的孤立系数的公式如下,
10.根据权利要求9所述ー种用于挖掘RFID数据孤立点的方法,其特征在于所述步骤D6中输出孤立点的个数为孤立系数最高的前n*pct%个,所述η表示RFID数据点的总个数,pct%表示预设的百分比。
全文摘要
本发明公开了一种用于挖掘RFID数据孤立点的方法,该方法步骤包括首先从中间件获取原始RFID数据,然后对获取的原始RFID数据进行聚类后压缩,还有通过RFID读取特征,使压缩后的原始RFID数据以三元组方式作为RFID数据点在读取特征向量空间进行RFID数据孤立点的挖掘,最后采用基于权值的反向最近邻算法对RFID数据点进行数据处理,进而输出RFID数据孤立点。通过使用本发明能够大大减少数据的规模以及提高数据处理的效率,而且大大提高识别RIFD数据孤立点的精确度,特别对边界点有着良好的检测效果。本发明作为一种用于挖掘RFID数据孤立点的方法广泛应用在射频识别领域中。
文档编号G06F17/30GK102708172SQ20121013491
公开日2012年10月3日 申请日期2012年5月2日 优先权日2012年5月2日
发明者丁一, 周志超, 江炼鑫, 温加兴, 谭洪舟 申请人:广州中大微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1