一种基于子形式背景属性相似度的概念格合并方法及系统的利记博彩app
【技术领域】
[0001] 本发明涉及人工智能和本体知识库领域,尤其涉及一种基于子形式背景属性相似 度的概念格合并方法及系统。
【背景技术】
[0002] 1982年,Rudolf Wille教授提出一种数学理论,它就是为后来人奉为经典的概念 格理论。概念格是形式概念分析理论(FCA)中的核心数据结构,概念格中的节点体现了概念 内涵和外延的统一,故而概念格结构非常适合规则的发现和推理。
[0003] 概念格理论的相关研究可以列举出如下几个方面:(1)概念格基础理论的研究; (2)概念格的构建和约简;(3)模糊环境下概念格的生成和规则获取以及模糊推理;(4)粗糙 概念分析:部分学者将概念格理论与粗糙集联系起来,粗糙概念分析应运而生;(5)概念格 的可视化研究:主要研究如何合理美观地呈现概念格Hasse图,使得边的交叉数最少,整个 图更美观;(6)多粒度概念格:部分学者将粒计算同概念格理论结合起来,提出多粒度概念 格的概念;(7)基于概念格的关联规则获取算法:这是因为概念格的每一个节点代表一个由 内涵和外延组成的形式概念,在后期的规则推理和规则挖掘过程中,概念格结构由于其清 晰的is-A关系/层次关系,有利于挖掘知识中隐藏的概念和关系,故而一些学者将概念格当 做一个关联规则挖掘的有效模型,研究并提出基于概念格的关联规则获取算法。
[0004] 综上所述,概念格--这种根据形式背景中对象和属性之间的二元偏序关系建立 的层次结构,是一种有效的数据分析和知识提取工具。概念格理论被诸多前沿学者应用于 不同方向的领域中,例如,机器学习、数据挖掘、语义Web、知识发现、信息检索等。
[0005] 现有的概念格合并算法分为两种模式:第一种先合并子形式背景,再生成概念格, 第二种先分别根据子形式背景生成子概念格,再合并子概念格。其中,以第一种模式居多, 其根本思想就是将概念格合并转换成概念格生成,这种模式并非不可,在一些特定情况下, 还会表现出一定的优越性。但当形式背景变得极为复杂时,亦或数据量变得极为庞大时,此 种统一生成的方法不可取,会造成大量现有概念格资源的浪费,从而导致时间和成本上的 浪费。
[0006] 就第二种模式来说,部分方法在完成两个子概念格合并的过程中丢失了边的信 息,也有部分方法可以直接完成两个子概念格合并也能保证不丢失Hasse图边的信息(即 is-A关系),但其并不是在合并过程中同时生成边的信息,而是完成所有概念节点的合并之 后,再一层层的检索并添加边的关系,这种做法无疑浪费了计算资源,导致效率较低。
[0007] 因此,现有技术还有待于改进和发展。
【发明内容】
[0008] 鉴于上述现有技术的不足,本发明的目的在于提供一种基于子形式背景属性相似 度的概念格合并方法及系统,旨在解决现有的合并方法其计算过程复杂、效率低等问题。
[0009] 本发明的技术方案如下:
[0010] -种基于子形式背景属性相似度的概念格合并方法,其中,包括步骤:
[0011] A、输入两个需要合并的子形式背景,先计算这两个子形式背景内涵中各属性之间 的相似度;
[0012] B、将相似度高于阈值的属性视为共同属性,取出共同属性并记录;
[0013] C、针对两个子形式背景,分别使用Godin算法生成子概念格;
[0014] D、最后根据之前记录的共同属性完成子概念格的合并。
[0015] 所述的基于子形式背景属性相似度的概念格合并方法,其中,所述步骤C中,使用 一个类型[G,M,S]来存储某一个节点或概念的信息,其中G表示实例集,Μ表示属性集,S表示 子节点集。
[0016] 所述的基于子形式背景属性相似度的概念格合并方法,其中,所述步骤C具体包 括:
[0017] C1、在概念格L中节点依次和对象({>*}3({#}))作运算时,如果节点_勺内涵包 含于f({x*}),记录节点Ν到集合gnLackOfE中;
[0018] C2、在每次对象(lx*},f({x*}))对概念格L的运算结束之后、下一个对象运算开始 之前,根据所述集合gnLackOfE生成子概念格。
[0019] 所述的基于子形式背景属性相似度的概念格合并方法,其中,所述步骤D中,合并 的过程包括:
[0020] 将子概念格L2中的每个节点依次和子概念格L1进行运算,更新的节点和新产生的 节点皆存入子概念格L1中,最后将子概念格L1赋值给合并后的概念格L12;
[0021] 子概念格L2中的节点X和子概念格L1中节点依次进行运算,如果在子概念格L1的m 层发现了节点X的真子节点,则对于子概念格L1的η层的节点皆不用再进行任何运算,n>m。
[0022] 所述的基于子形式背景属性相似度的概念格合并方法,其中,所述共同属性提供 领域专家接口。
[0023] 所述的基于子形式背景属性相似度的概念格合并方法,其中,所述阈值为95%。
[0024] -种基于子形式背景属性相似度的概念格合并系统,其中,包括:
[0025] 相似度计算模块,用于输入两个需要合并的子形式背景,先计算这两个子形式背 景内涵中各属性之间的相似度;
[0026] 共同属性记录模块,用于将相似度高于阈值的属性视为共同属性,取出共同属性 并记录;
[0027]子概念格生成模块,用于针对两个子形式背景,分别使用Godin算法生成子概念 格;
[0028]子概念格合并模块,用于最后根据之前记录的共同属性完成子概念格的合并。 [0029]所述的基于子形式背景属性相似度的概念格合并系统,其中,所述子概念格生成 模块中,使用一个类型[G,M,S]来存储某一个节点或概念的信息,其中G表示实例集,Μ表示 属性集,S表示子节点集。
[0030] 所述的基于子形式背景属性相似度的概念格合并系统,其中,所述子概念格生成 模块具体包括:
[0031] 记录单元,用于在概念格L中节点依次和对象({x*},f({x*}))作运算时,如果节点 N的内涵包含于f ({x*}),记录节点N到集合gnLackOfE中;
[0032] 生成单元,用于在每次对象({林},汽{林}))对概念格1^的运算结束之后、下一个对 象运算开始之前,根据所述集合gnLackOfE生成子概念格。
[0033] 所述的基于子形式背景属性相似度的概念格合并系统,其中,所述共同属性提供 领域专家接口。
[0034] 有益效果:本发明根据基于子形式背景属性相似度的原理,使得本发明的方法在 初期多出一段计算共同属性的时间,却可以为后期子概念格合并工作节省很多时间,并且 随着形式背景数据量的提升而展现出明显的效率优势,尤其是共同属性小的情况下,本发 明的方法将表现出特别地优势。从合并的概念格质量上来说,本发明的方法可以保证生成 无边信息丢失的概念格图,避免信息衰减。
【附图说明】
[0035] 图1为本发明一种基于子形式背景属性相似度的概念格合并方法较佳实施例的流 程图。
[0036 ]图2为米用God i η算法得到的概念格。
[0037] 图3为采用本发明的方法与现有技术的所消耗时间的一实例的对比图。
[0038] 图4为采用本发明的方法与现有技术的所消耗时间的另一实例的对比图。
[0039] 图5为本发明一种基于子形式背景属性相似度的概念格合并系统较佳实施例的结 构框图。
【具体实施方式】
[0040] 本发明提供一种基于子形式背景属性相似度的概念格合并方法及系统,为使本发 明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处 所描述的具体实施例仅仅用