本發明涉及分布式云存儲領域,特別是一種隨機分布式虛擬云存儲系統。
背景技術:
云存儲是滿足“大數據”時代海量存儲要求的一種存儲方式,它提高存儲系統讀寫性能,提升數據處理效率,將存儲系統的價值發揮到最大。云存儲通過虛擬化、分布式技術、集群應用、網格技術、負載均衡等技術,將網絡中大量的存儲設備通過軟件集合起來高效協同工作,共同對外提供低成本、高擴展性的數據存儲服務。
谷歌文件系統(Google File System,GFS)、Hadoop分布式文件系統(Hadoop Distributed File System,HDFS)等著名的分布式文件系統都采用了副本布局方式來提高數據存儲的可靠性。這種方法可以利用存儲目錄中存放的存儲節點信息,將數據對象的多個副本放置在不同機架上,從而大大提高系統的數據可靠性。
現有的云存儲系統普遍采用計算機服務器,服務器分布式地部署在各個數據中心,形成多個云數據平臺,但又將多個云數據平臺整合在一個多云存儲架構中,因此,具有較高的系統復雜度。同時,由于現有的云系統以完整的文件方式存儲,需要非常復雜的安全性措施才能保證文件存儲的安全性。況且,采用計算機服務器的云系統,能耗大,維護成本高,其為了保證可靠性所消耗的資源巨大。
本發明提供一種隨機分布式虛擬云存儲系統解決以上問題,其直接效益是:系統簡單、能耗小,安全性高,存取速度快,方便小規模和大規模部署,非常適合各種云存儲需求。
技術實現要素:
為達到上述目的,本發明的技術方案如下:
本發明公開一種隨機分布式虛擬云存儲系統。該系統由部署在互聯網上的2個以上云網關和管理系統組成。本發明采用隨機分布存儲和隨機副本拷貝的分布式存儲數據冗余策略來保證數據存儲安全。在存儲時,管理系統將文件隨機存入指定的云網關中。至少有一個以上的備份數據塊,分別隨機存儲到與文件塊相同網段和不同網段的網關中,從而提高了數據存儲的可靠性。存儲和備份的隨機性,由一個隨機數控制,該隨機數小于256,用來控制和隨機產生云網關IP地址的每段地址。數據文件標簽和其數據、備份數據的存儲地址由數據庫保存。
作為優選方案之一,所述的云存儲系統由部署在互聯網上的云網關和管理系統組成。
進一步,所述的多個云網關可以部署在同一網段中組成云存儲系統,也可以部署在不同網段上。
進一步,多個所述的同一網段網關組成的云存儲系統,可以通過互聯網組成虛擬云存儲系統。
進一步,所述的網絡需要分配給每個云網關一個獨立的IP地址。
進一步,所述的管理系統部署在一臺計算機服務器上。控制文件塊隨機分布存儲和備份數據的隨機分布存儲,其數據庫存儲這些信息,并提供對客戶的管理。
作為優選方案之二,所述的隨機分布式虛擬云存儲系統的文件存儲與備份流程是:首先是將這些文件塊隨機分布存儲到云網關中,再對這些文件塊數據進行隨機備份,最后將文件數據標簽、數據存儲網關IP地址、備份數據存儲網關IP地址存入管理數據庫中。
進一步,所述的文件塊隨機存儲通過一個隨機數控制,該隨機數實時產生,用來控制改變IP地址中的每一段數值,例如IP地址192.168.11.20,其中四段中的任一數值都可以與該隨機數相加或相減產生新的數值。為了與IP地址分段中的數字匹配,該隨機數據取值0到256之間。在某同一網段內,選擇IP地址與該隨機數據最近的云網關存儲該數據塊。例如,獲取到隨機數16,該云系統的IP地址是:192.168.11.XXX。隨機分配給文件塊存儲的網關應該是:192.168.11.16。如果沒有該地址網關,則選取最近的網關,如:192.168.11.17。
進一步,所述的數據塊在隨機備份時,其備份網關的選擇還是由所述的隨機數采用一定的算法控制。例如,將所述的存儲云網關IP地址的第四段加除以2的該隨機數,如果該第四段IP地址小于128,得到新的IP地址。或將所述的存儲云網關IP地址的第四段減除以2的該隨機數,如果該第四段IP地址大于128,得到新的IP地址。例如,文件塊網關地址為:192.168.11.6,隨機控制數為16,新的IP地址為:192.168.11.14。
進一步,所述的數據只做一個備份副本時,優先在本網段的云網關中備份。
進一步,由隨機數和算法選擇的網關如果不存在時,選擇距離其最近的網關。例如,新的IP地址為:192.168.11.14如果該地址沒有網關,則選取最近的網關192.168.11.18。
進一步,云存儲系統由多于一個網段的云網管組成時,選擇多于一個備份副本,以提高云存儲系統的可靠性。第一個副本選擇在同一網段的云網關,其它副本隨機選擇其它網段的云網關。
進一步,采用所述的隨機數和算法由所述的文件塊存儲網關,產生備份云網關其它段地址。將備份數據副本存儲到不同網段的云網關中。例如,將所述的隨機數除以2,如果存儲云的第三段IP地址小于128,則新的第三段地址為該第三段IP地址加除以2的該隨機數,得到新的第三段IP地址。如果存儲云的第三段IP地址大于128,則新的第三段地址為該第三段IP地址減除以2的該隨機數,得到新的第三段IP地址。選最靠近該第三段IP地址的云為備份2的云。
進一步,所述的備份2的網關IP地址由所選的云地址作為第三段IP地址,所選的備份1的第四段IP地址所為其第四段IP地址。如果在備份云中沒有該云網關,選擇離該IP地址最近的云網關作為備份2的數據存儲網關。
進一步,在所述的云存儲系統中,每個文件塊拷貝至少1個副本(由對存儲可靠性要求決定是1個還是多于1個),副本存儲的云網關由文件塊云網關地址和隨機數及算法確定。所以一個云網關的失敗并不會帶來數據丟失,使得該系統的存儲可靠性完全可控。
進一步,所述的文件標簽、存儲云網關、備份云網關的IP地址同時存入數據庫中,并在用戶存取文件時同時發送給用戶。如果用戶在獲取文件塊時發現不能正確獲取時,可以直接獲取備份的副本。
本發明的有益效果是:
提供一種最簡單、部署方便、存儲安全可靠、低能耗綠色環保的云存儲系統。可以為大數據云存儲產業提供優選,推動該產業的發展。
由于所存儲的數據由多個云網關同時讀取,數據讀取效率大大高于其它方法。
采取數據存儲的實時檢測的均衡策略,副本拷貝的虛擬存儲技術保證數據存儲安全,使得該云存儲系統比其它云存儲系統更加安全可靠。
該系統大大降低了成本和使用門檻,極大的方便了云存儲的推廣使用。最智慧城市、智慧社區、智慧醫療的推動具有重要作用。
附圖說明
圖1是本發明優選實施例的系統框圖;
圖2是本發明優選實例的文件塊隨機分布存儲和隨機備份流程;
圖3是本發明優選實例的文件取出流程;
具體實施方式
現在結合附圖和優選實施例對本發明作進一步詳細的說明。這些附圖均為簡化的示意圖,僅以示意方式說明本發明的基本結構,因此其僅顯示與本發明有關的構成。
圖1是本發明優選實施例的系統框圖,所述的系統由:云網關101,文件管理系統102,互聯網104組成。103是一個部署在同網段上的云系統。所述的101和102部署在互聯網104上,都具有獨立的IP地址。102是一臺計算機服務器。103是由多個101組成的局部云存儲系統。
102的管理任務之一是在收到用戶上載文件塊時,對該數據塊進行隨機分布存儲和隨機分布備份處理。此外,通過數據庫對云網關及其數據存儲信息,備份數據信息進行管理。102還對用戶登陸,用戶認證及其文件存儲進行管理。在所述的管理系統中,每個用戶有一個賬號,用戶可以注冊創建賬號,編輯用戶信息,分類存儲文件;用戶登陸賬號需要身份認證保障其安全性。
所述的云網關101內嵌HTTP文件傳送模塊,提供存儲文件的高速下載。
圖2是本發明優選實例的文件塊隨機分布存儲和隨機備份流程。該方法通過一個隨機數來控制文件塊存儲云網關的選擇,實現數據的隨機分布式存儲。此外,該隨機數還用來隨機控制備份網關的選擇,實現虛擬隨機存儲控制,并將文件存儲網關地址和備份網關地址與文件標簽等一起保存到數據庫中。202產生一個小于256的隨機數,該隨機數用來控制隨機存儲和備份。203用該隨機數選擇同網段內與該隨機數地址最靠近的云網關。例如,假設該隨機數是16,則選擇最靠近192.168.11.17的那個云網關作為當前文件塊存儲網關。204判斷該備選網關是否存滿,如果存滿,需要重新隨機選擇文件存儲網關,返回202。如果未滿,205將當前文件塊存入該網關。
206在同一網段云存儲系統中隨機產生備份網關,將該隨機數除以2,如果小于當前文件存儲網關的第四組數據,則用當前文件塊存儲云網關的IP地址第四組數據減去該數據,得到新的IP地址。如果大于該第四組數據,則該數據減去當前文件塊存儲云網關的IP地址,得到新的IP地址。207得到新的IP地址后,選擇與該地址最近的網關作為文件塊備份1的備份存儲網關。208將備份文件塊數據存儲到該網關中。
當云存儲系統由不同網段的多個小云存儲系統組成時,備份的副本數大于1。例如,選擇文件存儲網關IP地址的第三段作隨機分布處理,得到備份2的云地址。將隨機數除以2,如果小于該第三段數據,則用當前文件塊存儲云網關的IP地址第三段數據減去該數據,得到新的第三段IP地址。如果大于該第三段數據,則該數據減去當前文件塊存儲云網關的IP地址,得到新的第三段IP地址。選擇具有與該地址最近的局部云作為文件塊備份2的云,選擇該云中與備份1云網關IP地址的第四段最近的網關作為備份2的存儲網關209。210將備份文件塊數據存儲到該網關中。
圖3是本發明優選實例的文件取出流程。S302開始檢索(申請)所要取出的文件,S303根據所取出的文件下載文件從管理數據庫中獲得存取文件索引,在該索引中包括文件的結構信息,存儲地址和備份存儲地址。S304檢查主存儲數據是否丟失或損壞,如果沒有丟失或損壞,則從主存儲單元下載數據并結束,進入S307下載數據。如果有丟失或損壞,進入S305檢查內網備份數據是否丟失或損壞,如果沒有,進入S307下載數據并結束。如果有丟失或損壞,進入S306檢查外網備份數據是否丟失或損壞,如果沒有,進入S307下載數據并結束。如果有損壞,報告數據讀取失敗并結束。
本發明的有益技術效果:
一是,通過本發明的實施案例可見,所述的云存儲系統架構簡單,部署方便,存儲安全可靠,可以適用于社區、企業網內快速部署和使用,具有安全可靠的優點。
二是,本發明的虛擬存儲技術保證數據存儲安全,使得該云存儲系統比其它云存儲系統更加安全可靠。
以上述依據本發明的實施例為啟示,通過上述的說明內容,相關工作人員完全可以在不偏離本項發明技術思想的范圍內,進行多樣的變更以及修改。本項發明的技術性范圍并不局限于說明書上的內容,必須要根據權利要求范圍來確定其技術性范圍。