一種小文件的存儲、查詢及刪除方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及文件處理領(lǐng)域,具體涉及一種小文件的存儲、查詢及刪除方法和系統(tǒng)。
【背景技術(shù)】
[0002] 隨著信息化的發(fā)展,文件越來越多,尤其是對于金融等行業(yè),小文件(小文件一般 指文件大小較小的文件,如幾百KB,幾十KB)數(shù)量增長很快,由于金融需要這些小文件不能 刪除,但小文件管理和備份的難度越來越大。
[0003]目前對于小文件管理與備份一般的解決方案是合并為一個大文件(大文件一般指 文件大小較大的文件,如幾GB,幾十GB),將多個小文件合并為一個大文件存放,可以有效 緩解這個壓力,但這種簡單的合并對于文件的查詢檢索很不方便。在將多個小文件合并為 一個大文件時,建立一個文件索引表,在這個表中包含對于每個小文件多個維度的描述信 息,在查找小文件時,先查詢文件索引表再定位文件,這樣既可以解決小文件的管理和備份 問題,也可以解決合并為一個大文件之后的檢索問題。但是在將多個小文件合并為一個大 文件之后,對于小文件的檢索效率很低,如果想查看小文件的一些屬性和內(nèi)容需要將小文 件從大文件中取出來,甚至有的方式會將大文件再分離為多個小文件。
【發(fā)明內(nèi)容】
[0004] 針對現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的在于提供一種小文件的存儲、查詢及 刪除方法和系統(tǒng),提高小文件的檢索效率。
[0005] 為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
[0006] -種小文件的存儲方法,包括以下步驟:
[0007] (1)創(chuàng)建一個大文件;所述的大文件包括索引區(qū)偏移量存儲區(qū)域、小文件存儲區(qū)域 和小文件索引信息存儲區(qū)域;索引區(qū)偏移量是指小文件索引信息存儲區(qū)域的起始位置在整 個大文件中的相對偏移量;
[0008] (2)將小文件合并入大文件的小文件存儲區(qū)域。
[0009] 進(jìn)一步,如上所述的一種小文件的存儲方法,步驟(1)中,小文件索引信息包括小 文件的文件名稱、文件大小、文件元數(shù)據(jù)信息和小文件在整個大文件中的相對偏移量。
[0010] 進(jìn)一步,如上所述的一種小文件的存儲方法,所述的文件元數(shù)據(jù)信息是指小文件 中所存儲的業(yè)務(wù)類型的信息。
[0011] 進(jìn)一步,如上所述的一種小文件的存儲方法,步驟(2)中,將小文件合并入大文件 的小文件存儲區(qū)域的具體方式包括:
[0012] a.獲取小文件的大小;
[0013]b.將小文件索引信息存儲區(qū)域向后偏移小文件大小,并更新索引區(qū)偏移量;
[0014]c.將小文件存儲在小文件存儲區(qū)域;
[0015]d.在小文件索引信息存儲區(qū)域中添加小文件的索引信息。
[0016] 一種小文件的查詢方法,包括以下步驟:
[0017] (1)根據(jù)索引區(qū)偏移量和小文件的文件元數(shù)據(jù)信息查詢小文件的索引信息;
[0018] (2)根據(jù)小文件索引信息中的小文件在大文件中的相對偏移量和文件大小獲取存 儲在大文件中的小文件。
[0019] 進(jìn)一步,如上所述的一種小文件的查詢方法,步驟(1)中,通過正則表達(dá)式的方式 查詢小文件的索引信息。
[0020] 一種小文件的刪除方法,包括以下步驟:
[0021] (1)根據(jù)小文件的文件元數(shù)據(jù)信息查詢小文件的索引信息;
[0022] (2)根據(jù)小文件索引信息中的小文件在大文件中的相對偏移量和文件大小查詢存 儲在大文件中的小文件;
[0023] (3)刪除小文件和小文件的索引信息。
[0024] -種小文件的存儲系統(tǒng),包括:
[0025] 大文件創(chuàng)建模塊,用于創(chuàng)建一個大文件;所述的大文件包括索引區(qū)偏移量存儲區(qū) 域、小文件存儲區(qū)域和小文件索引信息存儲區(qū)域;索引區(qū)偏移量是指小文件索引信息的起 始位置在整個大文件中的相對偏移量;
[0026] 小文件存儲模塊,用于將小文件合并入大文件的小文件存儲區(qū)域。
[0027] 進(jìn)一步,如上所述的一種小文件存儲系統(tǒng),所述的小文件存儲模塊包括:
[0028] 文件大小獲取單元,用于獲取小文件的大??;
[0029] 索引區(qū)域移動單元,用于小文件索引信息存儲區(qū)域向后偏移小文件大小,并更新 索引區(qū)偏移量;
[0030] 小文件存儲單元,用于將小文件存儲在小文件存儲區(qū)域;
[0031] 索引信息添加單元,用于在小文件索引信息存儲區(qū)域中添加小文件的索引信息。
[0032] -種小文件的查詢系統(tǒng),包括:
[0033] 索引信息獲取模塊,用于根據(jù)索引區(qū)偏移量和小文件的文件元數(shù)據(jù)信息查詢小文 件的索引信息;
[0034] 小文件獲取模塊,用于根據(jù)小文件索引信息中的小文件在大文件中的相對偏移量 和文件大小獲取存儲在大文件中的小文件。
[0035] 一種小文件的刪除系統(tǒng),包括:
[0036] 索引信息獲取模塊,用于根據(jù)小文件的文件元數(shù)據(jù)信息查詢小文件的索引信息;
[0037] 小文件獲取模塊,用于根據(jù)小文件索引信息中的小文件在大文件中的相對偏移量 和文件大小獲取存儲在大文件中的小文件;
[0038] 小文件刪除模塊,用于刪除小文件和小文件的索引信息。
[0039] 本發(fā)明的有益效果在于:本發(fā)明所述的方法及系統(tǒng),可以依據(jù)元數(shù)據(jù)信息快速定 位大文件中的小文件,有效提高了小文件的檢索效率。
【附圖說明】
[0040] 圖1為【具體實(shí)施方式】中一種小文件的存儲系統(tǒng)的結(jié)構(gòu)框圖;
[0041] 圖2為【具體實(shí)施方式】中一種小文件的查詢系統(tǒng)的結(jié)構(gòu)框圖;
[0042] 圖3為【具體實(shí)施方式】中一種小文件的存儲方法的流程圖;
[0043] 圖4為【具體實(shí)施方式】中一種小文件的查詢方法的流程圖;
[0044] 圖5為【具體實(shí)施方式】中的大文件的文件格式示意圖;
[0045] 圖6為在圖3中所示大文件中添加小文件后的示意圖。
【具體實(shí)施方式】
[0046] 下面結(jié)合說明書附圖與【具體實(shí)施方式】對本發(fā)明做進(jìn)一步的詳細(xì)說明。
[0047] 圖1示出了本發(fā)明【具體實(shí)施方式】中一種小文件的存儲系統(tǒng)的結(jié)構(gòu)框圖,該存儲系 統(tǒng)主要包括大文件創(chuàng)建模塊11和小文件存儲模塊12,其中:
[0048] 大文件創(chuàng)建模塊11用于創(chuàng)建一個大文件;所述的大文件包括索引區(qū)偏移量存儲 區(qū)域、小文件存儲區(qū)域和小文件索引信息存儲區(qū)域;索引區(qū)偏移量是指小文件索引信息的 起始位置在整個大文件中的相對偏移量;小文件索引信息包括小文件的文件名稱、文件大 小、文件元數(shù)據(jù)信息和小文件在大文件中的相對偏移量等信息。
[0049] 小文件存儲模塊12用于將小文件合并入大文件的小文件存儲區(qū)域;該模塊包括 以下單元:
[0050] 文件大小獲取單元,用于獲取小文件的大?。?br>[0051] 索引區(qū)域移動單元,用于小文件索引信息存儲區(qū)域向后偏移小文件大小,并更新 索引區(qū)偏移量;
[0052] 小文件存儲單元,用于將小文件存儲在小文件存儲區(qū)域;
[0053] 索引信息添加單元,用于在小文件索引信息存儲區(qū)域中添加小文件的索引信息。
[0054] 本【具體實(shí)施方式】中所述的大文件指的是文件大小較大的文件,如幾GB或者幾十 GB,具體的大文件的大小可以根據(jù)需要進(jìn)行自行設(shè)定。小文件指的是文件大小較小的文件, 小文件大小的具體設(shè)置范圍也可以由用戶自行設(shè)定。通過上述小文件存儲系統(tǒng)完成多個大 文件向小文件存儲時,當(dāng)大文件存儲了合適數(shù)量的小文件后,如存儲的小文件的大小大于 大文件的存儲閾值,可再建立新的大文件存儲其它的小文件。
[0055] 圖2示出了本發(fā)明【具體實(shí)施方式】中基于圖1中小文件的存儲系統(tǒng)的一種小文件的 查詢系統(tǒng)的結(jié)構(gòu)框圖,該系統(tǒng)出來應(yīng)當(dāng)包括圖1中的大文件創(chuàng)建模塊11和小文件存儲模塊 12夕卜,還包括索引信息獲取模塊13和小文件獲取模塊14,其中:<