根据文件特征码为文件自动添加文件标签的方法及系统的利记博彩app

文档序号:6386368阅读:203来源:国知局
专利名称:根据文件特征码为文件自动添加文件标签的方法及系统的利记博彩app
技术领域
本发明属于文件存储管理技术领域,具体涉及一种根据文件特征码为文件自动添加文件标签的方法及系统。
背景技术
文件管理是操作系统的五大职能之一,主要涉及文件的逻辑组织和物理组织,目录的结构和管理。所谓文件管理,就是操作系统中实现文件统一管理的一组软件、被管理的文件以及为实施文件管理所需要的一些数据结构的总称(是操作系统中负责存取和管理文件信息的机构)从系统角度来看,文件系统是对文件存储器的存储空间进行组织,分配和回收,负责文件的存储,检索,共享和保护。现有的文件存储管理技术是以文件路径和文件名作为条件去判断文件的唯一性,进而实现文件的存储,同时需要手动为文件添加标签,未能实现文件多重信息的标签归类,不利于文件的分类管理和查找。比如A文件夹中存储有第一季度的财务报告、第一季度的生产报告、第一季度的安全报告等等,在B文件夹中存储有第二季度的财务报告、第二季度的生产报告、第二季度的安全报告等等,如果用户要查看财务报告,就需要到每个文件夹去查找出来再集合到一块供用户使用。这种依靠文件路径和文件名的方式,使得文件查找和管理效率低下,尤其是数据庞大的时候,比如调取十年的财务报告。

发明内容
为了解决上述问题,本发明的目的在于提供一种根据文件特征码为文件自动添加文件标签的方法及系统,以优化文件分类管理和查找。为了实现上述发明目的,本发明所采取的技术方案如下一种根据文件特征码为文件自动添加文件标签的方法,包括以下步骤根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息;根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息,所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系;若已存在,则根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;
若不存在,则将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。进一步的,所述根据第一文件的内容信息获得与所述第一文件内容--对应的文
件特征码信息,具体是根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息。进一步的,所述散列算法为MD5算法或者SHAl算法。进一步的,所述文件特征码数据存储系统为数组与链表的集合、或者数据库。一种根据文件特征码为文件自动添加文件标签的系统,包括以下模块文件特征码信息生成模块,用于根据第一文件的内容信息获得与所述第一文件内 容一一对应的文件特征码信息;文件标签集合生成模块,用于根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;相同文件特征码查询模块,用于在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息;若已存在,则执行文件标签集合更新模块;若不存在,则执行文件添加模块;所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有对应绑定关系;文件标签集合更新模块,用于根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;文件添加模块,用于将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。进一步的,所述文件特征码信息生成模块根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,具体是根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息。进一步的,所述散列算法为MD5算法或者SHAl算法。进一步的,所述文件特征码数据存储系统为数组与链表的集合、或者数据库。本发明利用文件特征码算法为每一文件根据文件内容计算特征码,确定文件的唯一性,在此基础上为文件自动添加文件标签,实现文件、文件特征码、文件标签的绑定存储。进而利用同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系,实现文件的多重信息存储管理,可让使用者根据自己对文档文件已知的文件标签信息快速查找目标文件。因此,采用本发明方法和系统,可实现文件的多重信息存储管理,提高文件的分类管理和查找效率。




所提供的图片用来辅助对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的不当限定,在附图中图1是本发明方法的流程图;图2是本发明系统对应的框图。
具体实施例方式如图1所示,本实施例公开了一种根据文件特征码为文件自动添加文件标签的方法,包括以下步骤(I)根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息;本步骤的目的在于获取与文件内容唯一对应的文件特征码,文件特征码的计算方法可以采用现有散列算法,如MD5算法或者SHAl算法,两种算法都是根据文件内容计算获得所述文件特征码;本步骤所述的第一文件即是需要添加文件标签的文件,所述第一文件的内容信息是指存储在外部介质上的数据的集合,比如一个word文件,其中记录I万字的故事,那么这一万字就是文件内容信息;因为文件特征码具有唯一性,可以通过本步骤获得文件特征码唯一标识和查找文件,比如两个不同名称的文件,其文件内容是完全相同的,如果采用了文件特征码来标识它,就不会混乱,在管理时也可以避免同一文件放在不同目录或者应用不同名称重复存储占用存储空间,进而有利于优化文件存储管理;(2)根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;所述第一文件的属性信息包括文件名、文件大小、文件创建时间、查看时间、文字数量、全文摘要等等,包括文件固有的属性信息和用户自定义的属性信息两部分,固有属性信息如页数、作者、标题、文件大小、文字数量、可自动总结的全文摘要等,自定义属性信息主要是指外界为文件添加的其他属性信息如操作系统记录的文件创建时间、操作系统记录的文件修改时间、操作系统记录的文件查看时间、操作系统记录的文件名、手动添加的作者名、手动添加的摘要、手动指定的关键词、手动标明的用途等;文件标签,就是与某个文件属性相对应的、用以表针文件特性的标签,比如文件页码数为A、文件作者为B的属性信息就对应生成“A”与“B”的文件标签;需要说明的是,文件标签与文件属性不是完全一一对应的关系,一个文件属性可以对应多个关联的标签项,例如一个文件于三个不同的时间段进行查阅,则文件查看时间这个属性即可对应三个关于文件查看时间的标签;所谓的文件标签集合,就是所有与文件属性对应的标签的集合;(3)在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息,所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系;本步骤实际是向文件特征码数据存储系统中添加第一文件前,看看文件特征码数据存储系统中是否已经存在第一文件,因为文件特征码是唯一标识文件的信息,所以通过判断文件特征码信息是否已经存在,就可以判断该文件是否存在;所述文件特征码数据存储系统为数组与链表的集合、或者数据库,就是用于存放数据的数据结构,可以是现有的关系数据库或其他非关系数据库,也可以是任何一种可以存储信息的数据结构的软件实现,比如一个多维数组、链表,都算数据存储系统;若已存在,则执行第(41)步;若不存在,则执行第(42)
I K
少;(41)根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;本步骤是在文件特征码数据存储系统中已经存储有该文件的情况下,检测其文件标签是不是有更新,如果有新的标签内容产生就把新产生的文件标签添加到原来的标签集合中去,以更加丰富的记载文件属性信息,以便于分类管理;(42)将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中;本步骤就是将文件特征码数据存储系统中不存在的文件的相关信息都存储在其中,以便于管理查找。本实施例还公开了一种与前述方法完全对应的根据文件特征码为文件自动添加文件标签的系统,包括以下模块文件特征码信息生成模块1,用于根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,具体可是根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息,所述散列算法为MD5算法或者SHAl算法。文件标签集合生成模块2,用于根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;相同文件特征码查询模块3,用于在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息;若已存在,则执行文件标签集合更新模块4 ;若不存在,则执行文件添加模块5 ;所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系;所述文件特征码数据存储系统为数组与链表的集合、或者数据库;文件标签集合更新模块4,用于根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;文件添加模块5,用于将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。本发明提出一种根据文件特征码为文件自动添加文件标签的方法,通过文件特征码算法为每一个文件的内容计算特定的文件特征码,以此作为条件判断文件的唯一性,并根据文件属性信息自动为文件生成文件标签,在数据存储系统中实现文件、文件特征码与文件标签的绑定存储,此外,保持文件标签信息的更新存储,从而实现文件多重信息类别的
存储管理。
比如A文件夹中存储有第一季度的财务报告、第一季度的生产报告、第一季度的安全报告等等,在B文件夹中存储有第二季度的财务报告、第二季度的生产报告、第二季度的安全报告等等。通过以上实施例公开的方法或系统可以为A文件夹中的第一季度的财务报告、第一季度的生产报告、第一季度的安全报告分别生成一个标签集合,包括多个文件标签存储路径、名称、创建时间等等;为B文件夹中的第二季度的财务报告、第二季度的生产报告、第二季度的安全报告分别生成一个标签集合,包括多个文件标签存储路径、名称、创建时间等等。那么在查找和管理文件时,就不再单纯的利用文件存储路径和文件名来管理文件,可以利用文件的所有属性来管理文件;比如用户要查找财务报告,就可以快速地在各个文件标签集合中查找出具有文件标签为财务报告的文件出来,从而提高其分类管理效率。以上详细描述了本发明的较佳具体实施例,应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明构思在现有技术基础上通过逻辑分析、推理或者根据有限的实验可以得到的技术方案,均应该在由本权利要求书所确定的保护范围之中。
权利要求
1.一种根据文件特征码为文件自动添加文件标签的方法,其特征在于包括以下步骤 根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息; 根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签; 在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息,所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系; 若已存在,则根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中; 若不存在,则将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。
2.根据权利要求1所述的根据文件特征码为文件自动添加文件标签的方法,其特征在于 所述根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,具体是根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息。
3.根据权利要求2所述的根据文件特征码为文件自动添加文件标签的方法,其特征在于 所述散列算法为MD5算法或者SHAl算法。
4.根据权利要求1-3任一项所述的根据文件特征码为文件自动添加文件标签的方法,其特征在于 所述文件特征码数据存储系统为数组与链表的集合、或者数据库。
5.一种根据文件特征码为文件自动添加文件标签的系统,其特征在于包括以下模块 文件特征码信息生成模块,用于根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息; 文件标签集合生成模块,用于根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签; 相同文件特征码查询模块,用于在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息;若已存在,则执行文件标签集合更新模块;若不存在,则执行文件添加模块;所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系; 文件标签集合更新模块,用于根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中; 文件添加模块,用于将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。
6.根据权利要求5所述的根据文件特征码为文件自动添加文件标签的系统,其特征在于 所述文件特征码信息生成模块根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,具体是根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息。
7.根据权利要求6所述的根据文件特征码为文件自动添加文件标签的系统,其特征在于 所述散列算法为MD5算法或者SHAl算法。
8.根据权利要求5-7任一项所述的根据文件特征码为文件自动添加文件标签的系统,其特征在于 所述文件特征码数据存储系统为数组与链表的集合、或者数据库。
全文摘要
本发明属于文件存储管理技术领域,具体公开了一种根据文件特征码为文件自动添加文件标签的方法及系统。本发明方法是根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,再根据第一文件的属性信息生成第一文件标签集合,在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息,若已存在,则将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;若不存在,则将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统中。本发明方法和系统可实现文件的多重信息存储管理,提高文件的分类管理和查找效率。
文档编号G06F17/30GK102999637SQ20121059051
公开日2013年3月27日 申请日期2012年12月29日 优先权日2012年12月29日
发明者王晖, 黄祖莹 申请人:珠海金山办公软件有限公司, 北京金山办公软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1