專利名稱:云端資料儲存系統的制作方法
技術領域:
本發明是關于一種資料儲存系統,尤指一種適用于云端運算的資料儲存系統。
背景技術:
云端運算是一種基于網際網絡的運算方式,通過網際網絡為使用者提供實時的服務。未來,使用者僅需使用一臺能連接至網際網絡的終端裝置,即可于網絡中執行程序、軟件,并儲存檔案資料。是故,檔案資料的傳輸效率與重復資料識別與儲存,病毒的識別與消滅,資料的隱私保護將是云端運算相當重要的課題之一。隨著上網人數增加與彼此的互動頻繁,相同的資料與相同的操作大量的在網際網絡中復制與流竄(包含病毒),嚴重地耗損網絡的資源與使用效能。例如,熱門的影音資料通過電子郵件、網絡硬盤等傳送工具,可能在網絡上形成數百萬或數千萬的副本與數億次的資料傳輸。又例如,某些熱門的關鍵詞查詢可能被數百萬或數千萬的人使用。當這些重復的動作不斷地發生時,大量浪費網絡資源將可能使得網絡面臨崩潰。因此,確實有必要針對此一課題進行改善。發明人緣因于此,本于積極創作的精神,亟思一種可解決上述問題的云端資料儲存系統,以有效提高檔案資料傳輸的效能。
發明內容
有鑒于此,本發明的主要目的是在提供一種云端資料儲存系統,以便能降低重復資料的儲存、減少網絡間的重復傳輸,以發揮聯網的真正效益。為達成上述目的,本發明所提供的云端資料儲存系統,包括多個儲存單元;多個處理單元,其是經由網際網絡連接至所述多個儲存單元;以及多個使用端,其是連接至所述多個處理單元之一;其中,任一使用端所欲儲存的上傳檔案是分割為多個檔案區塊,所述多個檔案區塊是經由一算法分別計算出對應的特征值,所述特征值是經由另一算法決定所述多個檔案區塊可存入的儲存單元。所述多個特征值是組成一特征值集合以對應該檔案。本發明所提供的第一種上傳方法為該使用端向所對應的儲存單元詢問是否有相同的特征值,若有,則不傳送所對應的檔案區塊,若無,則傳送所對應的檔案區塊至該儲存單元。另外,每一處理單元還包含有一特征值表格、及一暫存區。該特征值表格是用以比對一上傳檔案,該暫存區是用以儲存多個檔案區塊做為資料快取使用。本發明所提供的第二種上傳方法為該使用端將該特征值集合傳送至所述多個處理單元的一處理單元,并由該處理單元的特征值表格進行資料比對。若該特征值表格包含有相同的特征值,該使用端不傳送所對應的檔案區塊。若該特征值表格未包含相同的特征值,則該處理單元將未包含的特征值傳送至其所對應的儲存單元進行資料比對。該儲存單元將同樣未包含相同的特征值回傳至該處理單元,該處理單元是致使該使用端傳送未包含相同的特征值所對應的檔案區塊至該處理單元的暫存區。該處理單元將儲存于該暫存區的未包含相同的特征值所對應的檔案區塊傳送至所對應的儲存單元。本發明所提供的第一種下載方法為當所述多個使用端的一使用端下載該檔案時,其是依據該檔案相對的多個特征值集合內容計算所對應的儲存單元位置以下載所對應的檔案區塊。該使用端依據該檔案的特征值集合將所述檔案區塊組合。本發明所提供的第二種下載方法為當所述多個使用端的一使用端下載該檔案時,其是將該特征值集合傳送至所述多個處理單元的一處理單元,并根據該處理單元的特征值表格進行資料比對。若該處理單元的特征值表格包含有相同的特征值,該處理單元是將其所對應的檔案區塊由該暫存區取出以回傳至該使用端。若該處理單元的特征值表格未包含相同的特征值,則該處理單元根據所述特征值計算以取得對應的所述儲存單元位置, 并傳送所述特征值至所對應的所述儲存單元。所述儲存單元將所對應的所述檔案區塊傳送至該處理單元,該處理單元接收所述檔案區塊而儲存至該暫存區,并將所述檔案區塊傳送至該使用端。該使用端依據該檔案的特征值集合將所述檔案區塊組合。
本發明將更具體做一詳細的說明,以下結合實施例及
如后,其中圖1是本發明一較佳實施例的系統架構圖。圖2是本發明一較佳實施例的第一檔案上傳處理示意圖。圖3是本發明一較佳實施例的第二檔案上傳處理示意圖。圖4(a)是本發明一較佳實施例的第三檔案上傳處理示意圖。圖4(b)是本發明一較佳實施例的處理單元特征值表格示意圖。圖5是本發明一較佳實施例的第四檔案上傳處理示意圖。圖6是本發明一較佳實施例的第一檔案下載處理示意圖。圖7是本發明一較佳實施例的第二檔案下載處理示意圖。
具體實施例方式請先參考圖1,圖1是本發明一較佳實施例的系統架構圖。如圖所示,本發明包含有多個使用端、多個處理單元、及多個儲存單元。為方便說明,本實施例所提供的云端資料儲存系統包含八組使用端A1-A8、三組處理單元B1-B3、及十組儲存單元IP1-IP10。其中,使用端A1-A8是經由網際網絡或局域網絡連接至處理單元B1-B3的至少其中之一,儲存單元 IPl-IPlO經由網際網絡或局域網絡連接至處理單元B1-B3。處理單元B1-B3各包含有暫存區(圖未示)以存放快取用的區塊資料,使用端A1-A8、及儲存單位IPl-IPlO各包含有硬盤 (圖未示)以存放永久資料。接著,請參考圖2,圖2是本發明一較佳實施例的第一檔案上傳處理示意圖。首先, 使用者通過使用端Al上傳一檔案X,檔案X是先進行分割,例如本實施例將檔案X分割成八個區塊,分別為BlockO至Block7。所述八個區塊的檔案資料是通過一算法,如MD5算法分別計算其所對應的特征值。以本實施例為例,BlockO經計算后所得的特征值為135496, Blockl 為 23187,Block2 為 2245681,Block3 為 3347654,Block4 為 86721,Block5 為 3341, Blodi6為1357892,Block7為123456。所述特征值是組成一特征值集合而記錄于使用端Al 的一特征值表格Y中,使用端Al再將該特征值集合傳送至處理單元Bi。
接著,請參考圖3,其是本發明一較佳實施例的第二檔案上傳處理示意圖。如圖所示,處理單元Bl收到該特征值集合后與自己的特征值表格W作比對,并根據特征值表格W 將與該特征值集合內相同特征值(86721、135789 刪去。剩下的特征值(135496、23187、 2245681,3347654,3341,123456)是經由另一雜湊算法得出一組數字以對應至儲存單元。 例如,將雜湊算法是將特征值13M96、23187、2M5681、33476M、3341、123456除以一固定值取余數,若此固定值除數為10,則可得一數列6、7、1、4、1、6,該數列是可對應至儲存單元 IP6、IP7、IPU IP4、IPU IP6。其中,儲存單元IPl所對應的特征值為2245681、3341,儲存單元IP4所對應的特征值為3347654,儲存單元IP6所對應的特征值為13M96、123456,儲存單元IP7所對應的特征值為23187。處理單元Bl根據此一對應關系將特征值2245681、3341傳送給儲存單元IP1,將特征值33476M傳送給儲存單元IP4,將特征值135496、123456傳送給儲存單元IP6,將特征值23187傳送給儲存單元IP7。接著,請參考圖4(a),其是本發明一較佳實施例的第三檔案上傳處理示意圖。儲存單元IPl于接收到處理單元Bl傳來的特征值2245681、3341后,是與自己的特征值表格 IPl,做比對,發現已包含有特征值2245681,但未包含特征值3341,因此將特征值3341回傳給處理單元Bi。儲存單元IP4于接收到處理單元Bl傳來的特征值33476M后,是與自己的特征值表格IP4,比對,發現未包含特征值3347654,因此將特征值3347654回傳至處理單元Bi。儲存單元IP6于接收到處理單元Bl傳來的特征值135496、123456后,是與自己的特征值表格IP6,做比對,發現未包含特征值13M96、123456,因此將特征值135496,123456 回傳至處理單元Bi。儲存單元IP7于接收到處理單元Bl傳來的特征值(23187),與自己的特征值表格 IP7’比對,發現未包含特征值23187,所以將特征值23187回傳給處理單元Bi。處理單元Bl接收到儲存單元IP1、IP4、IP6、IP7所回傳的特征值3341、33476M、 135496、123456、23187后,是將上述特征值傳至使用端Al。使用端Al接收到處理單元Bl回傳的特征值3341、3;3476討、1;35496、12;3456、23187 后,是將其所對應的檔案區塊Block5、Block3、BlockO、Block7、Blockl傳送至處理單元Bi。 處理單元Bl于接收到使用端Al傳來的檔案區塊(Block5、Block3、BlockO、Block7、Blockl) 后,將所述檔案區塊存入暫存區,并將特征值3341、3;3476討、135496、12;3456、23187加入特征值表格W(如圖4(b)所示)。而后,處理單元Bl再將特征值3341及檔案區塊Block5傳送至儲存單元IPlJf 特征值33476M及檔案區塊Block3傳送至儲存單元IP4,將特征值13M96及檔案區塊 BlockO、特征值12;3456及檔案區塊Block7傳送至儲存單元IP6,將特征值23187及檔案區塊Blockl傳送至儲存單元IP7。接著,請參考圖5,其是本發明一較佳實施例的第四檔案上傳處理示意圖。儲存單元IPl于接收到處理單元Bl所傳來的特征值3341及檔案區塊Block5后,是將檔案區塊 Bloak5存入其硬盤,將特征值3341加入其特征值表格IP1’。儲存單元IP4于接收到處理單元Bl所傳來的特征值33476M及檔案區塊Block3后,是將檔案區塊Bloak3存入其硬盤,將特征值33476M加入其特征值表格IP4’。儲存單元IP6于接收到處理單元Bl所傳來的特征值13M96及檔案區塊BlockO、特征值123456及檔案區塊Block7后,是將檔案區塊BlOak0、BlOCk7存入其硬盤,將特征值135496、123456加入其特征值表格IP6,。儲存單元IP7于接收到處理單元Bl所傳來的特征值23187及檔案區塊Blockl后,是將檔案區塊 Bloakl存入其硬盤,將特征值23187加入其特征值表格IP7’。使用端Al完成上傳動作后,所述檔案區塊BlOCk0-BlOCk7所對應的特征值所組成的特征值集合(135496,23187,2245681,3347654,86721,3341,1357892,123456)是存入于
其硬盤中,以完成資料寫入的程序。日后,該特征值集合將成為讀取該檔案X的鑰匙,由使用者保管與復制,任何處理單元與儲存單元皆因沒有該特征值集合,故無法重建該檔案X。 因此,使用者的資料有絕對的安全保障,沒有外泄的疑慮。另外,若使用端Al將該特征值集合傳送至處理單元Bl時,發現該處理單元Bl的暫存區已包含有檔案X所對應的特征值集合,則處理單元Bl便不再向儲存單元IPl-IPlO 進行詢問的動作,而直接回復使用端Al其已包含有對應的檔案區塊資料。本發明的云端資料儲存系統亦包含云端資料下載,本實施例試舉兩種下載方式以說明的。請參考圖6,其是本發明一較佳實施例的第一檔案下載處理示意圖,處理單元Bl 的特征值表格Wl是包含有使用端Al的特征值。首先,使用端Al由其硬盤取出檔案X的特征值集合Y,并將特征值集合(135496、 23187、2245681、3347654、86721、3341、1357892、123456)傳送至處理單元 Bi,處理單元 Bl 于接收到特征值集合后與特征值表格Wl做比對,由圖6可知是全部比對成功,處理單元Bl 由其暫存區讀出對應所述特征值的檔案區塊Block0-Block7,并回傳給使用端Al。使用端 Al接收處理單元Bl所回傳的檔案區塊Block0-Block7后是按照特征值集合的排列順序將檔案區塊Block0-Block7重新組合成完整的檔案X,以完成資料下載。于本方法中,資料完全來自處理單元Bi,不需向遠程的儲存單元讀取,可提高網絡使用效率,并減少資源浪費。另一種下載方法請參考圖7,其是本發明一較佳實施例的第二檔案下載處理示意圖,處理單元B2的特征值表格W2并未包含使用端Al特征值表格Y的全部特征值。首先,使用端Al由其硬盤取出檔案X的特征值集合Y,并將特征值集合(135496、 23187、2245681、3347654、86721、3341、1357892、123456)傳送至處理單元 B2。處理單元 B2接收到特征值集合后是與特征值表格W2作比對,結果部份比對成功。處理單元B2由其暫存區讀取比對成功特征值(1357892、3341、135496、23187)所對應的檔案區塊(Block6、 Block5、BlockO、Blockl),并回傳至使用端Al。比對不成功的特征值(2245681、3347654、 86721,123456)是根據上傳檔案時所使用的算法,除以固定數10得一數列1、4、1、6,根據該數列而取出對應的儲存單元,分別為儲存單元IP1、IP4、IP1、IP6。其中,儲存單元IPl對應的特征值為2245681、86721,儲存單元IP4對應的特征值為3347654,儲存單元IP6對應的特征值為123456。接著,處理單元B2將特征值2245681、86721傳送至儲存單元IP1,將特征值33476M傳送至儲存單元IP4,將特征值123456傳送至儲存單元IP6。儲存單元IPl于接收到處理單元B2所傳來的特征值2M5681、86721后,與自己的特征值表格ΙΡΓ (如圖5所示)做比對,發現2245681,86721已存在,因此,將兩個對應的檔案區塊BlOCk2、BlOCk4回傳給處理單元B2。儲存單元IP4接收到處理單元B2傳來的特征值33476M后,與自己的特征值表格IP4,比對,發現特征值3347654已存在,所以將對應的檔案區塊Block3回傳給處理單元B2。儲存單元IP6接收到處理單元B2傳來的特征值 123456后,與自己的特征值表格IP6’比對,發現特征值123456已存在,所以將對應的檔案區塊Block7回傳給處理單元B2。處理單元B2接收到儲存單元IP1、IP4、IP6回傳特征值2245681、86721、3347654、 123456所對應的檔案區塊Block2、Block4、Block3、Block7后,將上述的資料存入暫存區, 并將上述特征值加入其特征值表格W2,同時將上述的檔案區塊回傳給使用端Al。使用端Al 接收到處理單元B2回傳的檔案區塊Block2、Block4、Block3、Block7后,是根據特征值表格Y中特征值集合的排列順序將檔案區塊Block0-Block7重新組合成完整的檔案。本下載方法的資料部份來自處理單元B2,部份來自遠程的儲存單元IP1、IP4、 IP6,可使網絡使用效率稍微提高。由于檔案資料已在處理單元B2完成快取準備,當使用者下次讀取相同檔案時,網絡使用效率又會達到最高。基于資料的安全與保密,使用端在傳送特征值集合給處理單元時,應將特征值集合的順序做混亂處理后再傳送,讓處理單元就算取得完整的特征值集合也無法得知排列順序來自行重組資料。最后,本發明的云端資料儲存系統同時可提供一種病毒消滅的方法。其中,儲存單元IPl-IPlO可負責對所儲存的檔案區塊進行掃描,若發現有病毒的資料區塊時,可將中毒資料區塊所對應的特征值于使用端Al詢問時通知使用端Al ;或可主動通知所有的處理單元B1-B3以建立一病毒特征值表格于使用端Al詢問時通知使用端Al。如此,當病毒一被發現時,本發明的云端資料儲存系統可實時對病毒進行處理,而不會讓病毒蔓延。偵測病毒、 消滅病毒的速度,是大幅提升。然而,上述實施例僅是為了方便說明而舉例而已,本發明所主張的權利范圍自應以權利要求范圍所述為準,而非僅限于上述實施例。
權利要求
1.一種云端資料儲存系統,包括多個儲存單元;多個處理單元,其經由網際網絡或局域網絡連接至所述多個儲存單元;以及多個使用端,其經由網際網絡或局域網絡連接至所述多個處理單元之一;其中,任一使用端所欲儲存的上傳檔案分割為多個檔案區塊,所述多個檔案區塊經由一算法分別計算出對應的特征值,所述特征值是經由另一算法決定所述多個檔案區塊可存入的儲存單元。
2.如權利要求1所述的云端資料儲存系統,其中,所述多個特征值組成一特征值集合以對應該檔案。
3.如權利要求2所述的云端資料儲存系統,其中,該使用端向所對應的儲存單元詢問是否有相同的特征值,若有,則不傳送所對應的檔案區塊,若無,則傳送所對應的檔案區塊至該儲存單元。
4.如權利要求2所述的云端資料儲存系統,其中,每一處理單元還包含有一特征值表格、及一區塊資料暫存區。
5.如權利要求4所述的云端資料儲存系統,其中,該使用端將該特征值集合傳送至所述多個處理單元的一處理單元,并由該處理單元的特征值表格進行資料比對。
6.如權利要求5所述的云端資料儲存系統,其中,若該特征值表格包含有相同的特征值,該使用端不傳送所對應的檔案區塊。
7.如權利要求6所述的云端資料儲存系統,其中,若該特征值表格未包含相同的特征值,則該處理單元將未包含的特征值傳送至其所對應的儲存單元進行資料比對。
8.如權利要求7所述的云端資料儲存系統,其中,該儲存單元將同樣未包含相同的特征值回傳至該處理單元,該處理單元致使該使用端傳送未包含相同的特征值所對應的檔案區塊至該處理單元的區塊資料暫存區。
9.如權利要求8所述的云端資料儲存系統,其中,該處理單元將儲存于該區塊資料暫存區的未包含相同的特征值所對應的檔案區塊傳送至所對應的儲存單元作資料區塊的儲存。
10.如權利要求2所述的云端資料儲存系統,其中,當所述多個使用端的一使用端下載該檔案時,其依據該檔案的多個特征值集合所對應的儲存單元位置以下載所對應的檔案區塊。
11.如權利要求10所述的云端資料儲存系統,其中,該使用端依據該檔案的特征值集合將所述檔案區塊組合。
12.如權利要求4所述的云端資料儲存系統,其中,當所述多個使用端的一使用端下載該檔案時,其將該特征值集合傳送至所述多個處理單元的一處理單元,并根據該處理單元的特征值表格進行資料比對。
13.如權利要求12所述的云端資料儲存系統,其中,若該處理單元的特征值表格包含有相同的特征值,該處理單元將其所對應的檔案區塊由該暫存區取出以回傳至該使用端。
14.如權利要求12所述的云端資料儲存系統,其中,若該處理單元的特征值表格未包含相同的特征值,則該處理單元根據所述特征值以取得對應的所述儲存單元位置,并傳送所述特征值至所對應的所述儲存單元。
15.如權利要求14所述的云端資料儲存系統,其中,所述儲存單元將所對應的所述檔案區塊傳送至該處理單元,該處理單元接收所述檔案區塊而儲存至該區塊資料暫存區,并將所述檔案區塊傳送至該使用端。
16.如權利要求15所述的云端資料儲存系統,其中,該使用端依據該檔案的特征值集合將所述檔案區塊組合。
17.如權利要求3所述的云端資料儲存系統,其中,該儲存單元可對所儲存的檔案區塊做掃描,若發現有病毒的資料區塊時,于該使用端詢問時將其所對應的特征值通知予該使用端,或主動通知所述處理單元建立一病毒特征值表格于使用端詢問時通知使用端。
全文摘要
本發明是有關于一種云端資料儲存系統,包括多個儲存單元、多個處理單元、及多個使用端。多個處理單元是經由網際網絡連接至所述多個儲存單元,多個使用端是連接至所述多個處理單元之一。其中,任一使用端所欲儲存的上傳檔案是分割為多個檔案區塊,所述多個檔案區塊是經由一算法分別計算出對應的特征值,所述特征值是經由另一算法決定所述多個檔案區塊可存入的儲存單元。每一特征值是個別對應至每一儲存單元。檔案資料于上傳與下載的過程中,是經由特征值決定最終儲存位置與傳遞檔案重組的相關信息。
文檔編號H04L29/08GK102347969SQ20101024612
公開日2012年2月8日 申請日期2010年8月3日 優先權日2010年8月3日
發明者李祥宇 申請人:李中富, 李祥宇