一种用于挖掘rfid数据孤立点的方法

文档序号：6366239阅读：231来源：国知局

专利名称：一种用于挖掘rfid数据孤立点的方法
技术领域：
本发明涉及射频识别技术和数字处理技术，尤其涉及一种用于挖掘RFID数据孤立点的方法。
背景技术：
在RFID应用领域中RFID数据孤立点的检测具有很深远的意义，因为挖掘出孤立点所隐藏的信息，有助于找到提高标签识别率的方法以及改善作业流程。而目前主要有基于统计学分布、基于距离、基于密度、基于特征等方法用于RFID数据孤立点的挖掘，但是采用这些方法对海量的RFID数据进行孤立点的挖掘，其效果差，处理效率低以及对边界点难以判别，而且由于RFID是通过无线电磁进行传输，因此在标签的读取过程中容易读取到噪声，或者漏读、冗余读、错读等等，这样更加增大挖掘孤立点的难度。

发明内容
为了解决上述技术问题，本发明的目的是提供一种准确度高以及数据处理效率高的用于挖掘RFID数据孤立点的方法。本发明所采用的技术方案是一种用于挖掘RFID数据孤立点的方法，该方法步骤包括A、从中间件获取原始RFID数据；B、对获取的原始RFID数据进行聚类后压缩；C、通过RFID读取特征，使压缩后的原始RFID数据以三元组方式作为RFID数据点在读取特征向量空间进行RFID数据孤立点的挖掘；D、采用基于权值的反向最近邻算法对RFID数据点进行数据处理，进而输出RFID数据孤立点。进一步，所述步骤B中采用哈希表对获取的原始RFID数据进行聚类。进一步,所述步骤B包括BI、对获取的原始RFID数据利用哈希表进行聚类；B2、根据原始RFID数据判断该标签是否已存在哈希表，若存在，则增加该标签的读写次数，更新最近读取时间，并计算当前的读取信号强度；若不存在，则将该标签插入哈希表中，并记录读取记录以及该标签的读取信号强度和首次读取时间。进一步，所述步骤C中所述的RFID读取特征包括标签的读取时间间隔、标签在读取时间间隔内的读取次数以及标签的平均信号读取强度。进一步,所述步骤D包括D1、计算两两RFID数据点之间的距离，进而生成距离矩阵；D2、根据距离矩阵以及预设的K值，采用K最近邻分类计算每个RFID数据点的K最近邻居集合；D3、计算每个RFID数据点的平均距离；、
D4、选取平均距离最大的RFID数据点后根据平均距离最大的RFID数据点进而计算RFID数据点的密度权值；D5、采用反向K最近邻分类计算每个RFID数据点的反向K最近邻居集合，每个RFID数据点的反向K最近邻居集合由包含该RFID数据点的K最近邻居集合组成；D6、计算每个RFID数据点的孤立系数后对每个RFID数据点的孤立系数进行排序，进而按照预设的百分比输出RFID数据孤立点。进一步，所述步骤D2，根据距离矩阵以及预设的K值，采用K最近邻分类计算每个RFID数据点的K最近邻居集合，其具体为，根据距离矩阵以及预设的K值，分别计算每个RFID数据点的与其本身距离最近的K个RFID数据点，而计算出的K个RFID数据点则组成K最近邻居集合。
进一步，所述步骤D3，计算每个RFID数据点的平均距离，其具体为，分别计算每个 RFID数据点与其K最近邻居集合中的所有RFID数据点的距离的平均值。进一步,所述步骤D4中计算RFID数据点的密度权值的公式如下，

权利要求
1.ー种用于挖掘RFID数据孤立点的方法，其特征在于该方法步骤包括 A、从中间件获取原始RFID数据； B、对获取的原始RFID数据进行聚类后压缩； C、通过RFID读取特征，使压缩后的原始RFID数据以三元组方式作为RFID数据点在读取特征向量空间进行RFID数据孤立点的挖掘； D、采用基于权值的反向最近邻算法对RFID数据点进行数据处理，进而输出RFID数据孤立点。
2.根据权利要求I所述ー种用于挖掘RFID数据孤立点的方法，其特征在于所述步骤B中采用哈希表对获取的原始RFID数据进行聚类。
3.根据权利要求I或2所述ー种用于挖掘RFID数据孤立点的方法，其特征在于所述步骤B包括 BI、对获取的原始RFID数据利用哈希表进行聚类； B2、根据原始RFID数据判断该标签是否已存在哈希表，若存在，则增加该标签的读写次数，更新最近读取时间，并计算当前的读取信号強度；若不存在，则将该标签插入哈希表中，并记录读取记录以及该标签的读取信号強度和首次读取时间。
4.根据权利要求I所述ー种用于挖掘RFID数据孤立点的方法，其特征在于所述步骤C中所述的RFID读取特征包括标签的读取时间间隔、标签在读取时间间隔内的读取次数以及标签的平均信号读取强度。
5.根据权利要求I所述ー种用于挖掘RFID数据孤立点的方法，其特征在于所述步骤D包括 D1、计算两两RFID数据点之间的距离，进而生成距离矩阵； D2、根据距离矩阵以及预设的K值，采用K最近邻分类计算每个RFID数据点的K最近邻居集合； D3、计算每个RFID数据点的平均距离； D4、选取平均距离最大的RFID数据点后根据平均距离最大的RFID数据点进而计算RFID数据点的密度权值； D5、采用反向K最近邻分类计算每个RFID数据点的反向K最近邻居集合，每个RFID数据点的反向K最近邻居集合由包含该RFID数据点的K最近邻居集合组成； D6、计算每个RFID数据点的孤立系数后对每个RFID数据点的孤立系数进行排序，进而按照预设的百分比输出RFID数据孤立点。
6.根据权利要求5所述ー种用于挖掘RFID数据孤立点的方法，其特征在于所述步骤D2，根据距离矩阵以及预设的K值，采用K最近邻分类计算每个RFID数据点的K最近邻居集合，其具体为，根据距离矩阵以及预设的K值，分别计算每个RFID数据点的与其本身距离最近的K个RFID数据点，而计算出的K个RFID数据点则组成K最近邻居集合。
7.根据权利要求5所述ー种用于挖掘RFID数据孤立点的方法，其特征在于所述步骤D3，计算每个RFID数据点的平均距离，其具体为，分别计算每个RFID数据点与其K最近邻居集合中的所有RFID数据点的距离的平均值。
8.根据权利要求5所述ー种用于挖掘RFID数据孤立点的方法，其特征在于所述步骤D4中计算RFID数据点的密度权值的公式如下，
9.根据权利要求8所述ー种用于挖掘RFID数据孤立点的方法，其特征在于所述步骤D6中计算每个RFID数据点的孤立系数的公式如下，
10.根据权利要求9所述ー种用于挖掘RFID数据孤立点的方法，其特征在于所述步骤D6中输出孤立点的个数为孤立系数最高的前n*pct%个,所述η表示RFID数据点的总个数，pct%表示预设的百分比。
全文摘要
本发明公开了一种用于挖掘RFID数据孤立点的方法，该方法步骤包括首先从中间件获取原始RFID数据，然后对获取的原始RFID数据进行聚类后压缩，还有通过RFID读取特征，使压缩后的原始RFID数据以三元组方式作为RFID数据点在读取特征向量空间进行RFID数据孤立点的挖掘，最后采用基于权值的反向最近邻算法对RFID数据点进行数据处理，进而输出RFID数据孤立点。通过使用本发明能够大大减少数据的规模以及提高数据处理的效率，而且大大提高识别RIFD数据孤立点的精确度，特别对边界点有着良好的检测效果。本发明作为一种用于挖掘RFID数据孤立点的方法广泛应用在射频识别领域中。
文档编号G06F17/30GK102708172SQ20121013491
公开日2012年10月3日申请日期2012年5月2日优先权日2012年5月2日
发明者丁一, 周志超, 江炼鑫, 温加兴, 谭洪舟申请人:广州中大微电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：江炼鑫;温加兴;周志超;丁一;谭洪舟
技术所有人：广州中大微电子有限公司
我是此专利的发明人

上一篇：一种城乡生态规划的生态适宜性分析方法
上一篇：基于第二代条带波变换和极速学习机的人体运动跟踪方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。