一种静态数据文件的存储方法

文档序号:9750499阅读:1069来源:国知局
一种静态数据文件的存储方法
【技术领域】
[0001]本发明涉及文件存储领域,特别是涉及一种静态数据文件的存储方法。
【背景技术】
[0002]随着计算机的不断发展,数据保护也逐步在加强。然而随着数据的迅速增加,数据保护变得越来越难。磁盘1瓶颈、网络带宽瓶颈、数据保护窗口时间均制约着大数据量数据的保护。
[0003]在很多场景下的大数据量数据均是静态数据文件,这些数据文件在产生后便不再发生数据的修改。这些数据在进行数据保护时会多次被存储到数据保护中心,从而造成了数据存储空间的浪费,同时也造成了网络带宽的占用,延长了数据保护窗口时间。

【发明内容】

[0004]鉴于以上所述现有技术的缺点,本发明的目的在于提供一种静态数据文件的存储方法,用于解决现有技术中数据存储空间的浪费,同时也造成了网络带宽的占用,延长了数据保护窗口时间的问题。
[0005]为实现上述目的及其他相关目的,本发明提供一种静态数据文件的存储方法,包括步骤:S1、获取待存储文件的元数据信息;S2、通过所述元数据信息计算所述待存储文件的指纹;S3、将所述待存储文件的指纹与已保存文件的指纹进行匹配,判断所述待存储文件的指纹是否存在;若存在,则返回所述已保存文件的指纹缓存并结束存储;若不存在,则缓存所述待存储的指纹缓存并结束存储。
[0006]于本发明的一实施例中,所述元数据信息包括:创建时间、修改时间、文件基本属性、文件自定义元数据、文件绝对路径和文件名称。
[0007]于本发明的一实施例中,所述返回已保存文件的指纹缓存的步骤还包括步骤:S31、获取所述已保存文件的指纹缓存的唯一的第一存储ID; S32、通过所述第一存储ID获取所述已保存文件的指纹缓存;S33、返回所述已保存文件的指纹缓存。
[0008]于本发明的一实施例中,所述缓存所述待存储的指纹缓存的步骤还包括步骤:S31’、存储所述待存储文件的指纹;S32’、生成所述待存储文件的指纹缓存唯一的第二存储ID; S33’、根据所述第二存储ID存储所述待存储文件的指纹缓存。
[0009]于本发明的一实施例中,所述指纹为对应文件元数据信息的哈希值;通过哈希算法计算得出。
[0010]如上所述,本发明的静态数据文件的存储方法,具有以下有益效果:能在进行静态数据文件存储时,仅读取文件的元数据信息,判断是否需要进行存储,从而缩减用户的数据保护窗口时间、网络带宽占用、磁盘存储空间占用、磁盘1占用等。能积极有效的帮助用户更快、更及时的完成数据保护,从而节省更多的物力成本和人力成本。
【附图说明】
[0011]图1显示为本发明静态数据文件的存储方法的一实施例中的流程方框示意图。
[0012]图2显示为本发明静态数据文件的存储方法的另一实施例中的流程方框示意图。
【具体实施方式】
[0013]以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的【具体实施方式】加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0014]需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
[0015]请参阅图1至2。如图1所示,图1显示为本发明静态数据文件的存储方法的一实施例中的流程方框示意图。本发明的一实施例中提供了一种静态数据文件的存储方法,包括步骤:S1、获取待存储文件的元数据信息;S2、通过所述元数据信息计算所述待存储文件的指纹;S3、将所述待存储文件的指纹与已保存文件的指纹进行匹配,判断所述待存储文件的指纹是否存在;若存在,则返回所述已保存文件的指纹缓存并结束存储;若不存在,则缓存所述待存储的指纹缓存并结束存储。能在进行静态数据文件存储时,仅读取文件的元数据信息,判断是否需要进行存储,从而缩减用户的数据保护窗口时间、网络带宽占用、磁盘存储空间占用、磁盘1占用等。能积极有效的帮助用户更快、更及时的完成数据保护,从而节省更多的物力成本和人力成本。
[0016]如图2所示,图2显示为本发明静态数据文件的存储方法的另一实施例中的流程方框示意图。在本发明的另一实施例中,本发明静态数据文件的存储方法包括步骤:
[0017]S1、获取待存储文件的元数据信息;通常所述元数据信息包括:创建时间、修改时间、文件基本属性、文件自定义元数据、文件绝对路径和文件名称等。也可以根据需要选择相关元数据信息的内容,只要满足后续处理需要,均在本发明的保护范围之内。
[0018]S2、通过所述元数据信息计算所述待存储文件的指纹;进一步地,所述指纹为对应文件元数据信息的哈希值;哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上来说基本上是不可能的。哈希值是根据文件的内容的数据通过逻辑运算得到的数值,不同的文件(即使是相同的文件名)得到的哈希值是不同的,所以哈希值值就成了每一个文件的身份证。不同哈希值的文件被认为是不同的文件,相同的哈希值的文件的内容肯定是完全相同(即使文件名不同)WASH值还有文件校验的功能,相当于文件的校验码。因此通过哈希值判断文件信息是否一致具有明显的可行性。
[0019]本实施例中,通过哈希算法计算得出对应文件元数据信息的哈希值。哈希算法将任意长度的二进制值映射为较短的固定长度的二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希值可以检验数据的完整性。一般用于快速查找和加密算法。哈希表是根据设定的哈希函数
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1