一種靜態數據文件的存儲方法
【技術領域】
[0001]本發明涉及文件存儲領域,特別是涉及一種靜態數據文件的存儲方法。
【背景技術】
[0002]隨著計算機的不斷發展,數據保護也逐步在加強。然而隨著數據的迅速增加,數據保護變得越來越難。磁盤1瓶頸、網絡帶寬瓶頸、數據保護窗口時間均制約著大數據量數據的保護。
[0003]在很多場景下的大數據量數據均是靜態數據文件,這些數據文件在產生后便不再發生數據的修改。這些數據在進行數據保護時會多次被存儲到數據保護中心,從而造成了數據存儲空間的浪費,同時也造成了網絡帶寬的占用,延長了數據保護窗口時間。
【發明內容】
[0004]鑒于以上所述現有技術的缺點,本發明的目的在于提供一種靜態數據文件的存儲方法,用于解決現有技術中數據存儲空間的浪費,同時也造成了網絡帶寬的占用,延長了數據保護窗口時間的問題。
[0005]為實現上述目的及其他相關目的,本發明提供一種靜態數據文件的存儲方法,包括步驟:S1、獲取待存儲文件的元數據信息;S2、通過所述元數據信息計算所述待存儲文件的指紋;S3、將所述待存儲文件的指紋與已保存文件的指紋進行匹配,判斷所述待存儲文件的指紋是否存在;若存在,則返回所述已保存文件的指紋緩存并結束存儲;若不存在,則緩存所述待存儲的指紋緩存并結束存儲。
[0006]于本發明的一實施例中,所述元數據信息包括:創建時間、修改時間、文件基本屬性、文件自定義元數據、文件絕對路徑和文件名稱。
[0007]于本發明的一實施例中,所述返回已保存文件的指紋緩存的步驟還包括步驟:S31、獲取所述已保存文件的指紋緩存的唯一的第一存儲ID; S32、通過所述第一存儲ID獲取所述已保存文件的指紋緩存;S33、返回所述已保存文件的指紋緩存。
[0008]于本發明的一實施例中,所述緩存所述待存儲的指紋緩存的步驟還包括步驟:S31’、存儲所述待存儲文件的指紋;S32’、生成所述待存儲文件的指紋緩存唯一的第二存儲ID; S33’、根據所述第二存儲ID存儲所述待存儲文件的指紋緩存。
[0009]于本發明的一實施例中,所述指紋為對應文件元數據信息的哈希值;通過哈希算法計算得出。
[0010]如上所述,本發明的靜態數據文件的存儲方法,具有以下有益效果:能在進行靜態數據文件存儲時,僅讀取文件的元數據信息,判斷是否需要進行存儲,從而縮減用戶的數據保護窗口時間、網絡帶寬占用、磁盤存儲空間占用、磁盤1占用等。能積極有效的幫助用戶更快、更及時的完成數據保護,從而節省更多的物力成本和人力成本。
【附圖說明】
[0011]圖1顯示為本發明靜態數據文件的存儲方法的一實施例中的流程方框示意圖。
[0012]圖2顯示為本發明靜態數據文件的存儲方法的另一實施例中的流程方框示意圖。
【具體實施方式】
[0013]以下通過特定的具體實例說明本發明的實施方式,本領域技術人員可由本說明書所揭露的內容輕易地了解本發明的其他優點與功效。本發明還可以通過另外不同的【具體實施方式】加以實施或應用,本說明書中的各項細節也可以基于不同觀點與應用,在沒有背離本發明的精神下進行各種修飾或改變。需說明的是,在不沖突的情況下,以下實施例及實施例中的特征可以相互組合。
[0014]需要說明的是,以下實施例中所提供的圖示僅以示意方式說明本發明的基本構想,遂圖式中僅顯示與本發明中有關的組件而非按照實際實施時的組件數目、形狀及尺寸繪制,其實際實施時各組件的型態、數量及比例可為一種隨意的改變,且其組件布局型態也可能更為復雜。
[0015]請參閱圖1至2。如圖1所示,圖1顯示為本發明靜態數據文件的存儲方法的一實施例中的流程方框示意圖。本發明的一實施例中提供了一種靜態數據文件的存儲方法,包括步驟:S1、獲取待存儲文件的元數據信息;S2、通過所述元數據信息計算所述待存儲文件的指紋;S3、將所述待存儲文件的指紋與已保存文件的指紋進行匹配,判斷所述待存儲文件的指紋是否存在;若存在,則返回所述已保存文件的指紋緩存并結束存儲;若不存在,則緩存所述待存儲的指紋緩存并結束存儲。能在進行靜態數據文件存儲時,僅讀取文件的元數據信息,判斷是否需要進行存儲,從而縮減用戶的數據保護窗口時間、網絡帶寬占用、磁盤存儲空間占用、磁盤1占用等。能積極有效的幫助用戶更快、更及時的完成數據保護,從而節省更多的物力成本和人力成本。
[0016]如圖2所示,圖2顯示為本發明靜態數據文件的存儲方法的另一實施例中的流程方框示意圖。在本發明的另一實施例中,本發明靜態數據文件的存儲方法包括步驟:
[0017]S1、獲取待存儲文件的元數據信息;通常所述元數據信息包括:創建時間、修改時間、文件基本屬性、文件自定義元數據、文件絕對路徑和文件名稱等。也可以根據需要選擇相關元數據信息的內容,只要滿足后續處理需要,均在本發明的保護范圍之內。
[0018]S2、通過所述元數據信息計算所述待存儲文件的指紋;進一步地,所述指紋為對應文件元數據信息的哈希值;哈希值是一段數據唯一且極其緊湊的數值表示形式。如果散列一段明文而且哪怕只更改該段落的一個字母,隨后的哈希都將產生不同的值。要找到散列為同一個值的兩個不同的輸入,在計算上來說基本上是不可能的。哈希值是根據文件的內容的數據通過邏輯運算得到的數值,不同的文件(即使是相同的文件名)得到的哈希值是不同的,所以哈希值值就成了每一個文件的身份證。不同哈希值的文件被認為是不同的文件,相同的哈希值的文件的內容肯定是完全相同(即使文件名不同)WASH值還有文件校驗的功能,相當于文件的校驗碼。因此通過哈希值判斷文件信息是否一致具有明顯的可行性。
[0019]本實施例中,通過哈希算法計算得出對應文件元數據信息的哈希值。哈希算法將任意長度的二進制值映射為較短的固定長度的二進制值,這個小的二進制值稱為哈希值。哈希值是一段數據唯一且極其緊湊的數值表示形式。如果散列一段明文而且哪怕只更改該段落的一個字母,隨后的哈希都將產生不同的值。要找到散列為同一個值的兩個不同的輸入,在計算上是不可能的,所以數據的哈希值可以檢驗數據的完整性。一般用于快速查找和加密算法。哈希表是根據設定的哈希函數