一種基于虛擬機運行信息數據發現的備份方法
【專利摘要】本發明涉及一種基于虛擬機運行信息數據發現的備份方法,包括以下步驟:數據緩存單元獲取虛擬機運行時的進程信息;數據備份處理單元將事先存儲的數據發現規則與所述進程信息進行匹配,根據數據發現規則獲取需要備份的應用程序生產數據位置并保存;根據所述生產數據位置對相應的虛擬機生產數據進行備份,并映射至數據備份存儲單元。與現有技術相比,本發明具有備份效率高、速度快、資源消耗少等優點。
【專利說明】一種基于虛擬機運行信息數據發現的備份方法
【技術領域】
[0001]本發明涉及一種虛擬機數據備份技術,尤其是涉及一種基于虛擬機運行信息數據發現的備份方法。
【背景技術】
[0002]虛擬化技術經過多年發展已經成熟,虛擬化廠商通過多年宣傳和實際生產環境測試已被大量企業接受并投入企業生產環境。VMware公司作為虛擬化解決方案領先廠商占據大部分市場份額,其推出的一系列虛擬化的產品幫助用戶解決了硬件資源浪費、IT管理復雜等一系列難題。虛擬化解決方案同時提供硬件平臺無法解決的難題,如在線遷移、克隆、快速部署、云計算等。當前已有大量企業和組織機構將虛擬化產品部署于生產環境中。隨著越來越多的生產應用部署到虛擬化平臺上,如何保護虛擬化平臺上的生產系統在受到系統異常、誤操作等損壞后能夠快速恢復,成為備份軟件廠商關注的熱點問題。
[0003]VMware公司考慮到虛擬機備份需求,提供一套數據保護接口 VADP API (vStorageAPI for Data Protection)為備份應用程序提供了直接訪問、操作虛擬機鏡像文件。如果備份軟件廠商選擇使用VADP,那么VADP的變化塊追蹤技術使虛擬化平臺能夠追蹤上次備份完成后虛擬機文件發生變化的數據塊,但是某些情況下這種變化塊追蹤技術將會失效,此時再對虛擬機做增量備份將會執行全盤備份。VADP對虛擬機磁盤進行備份的時候是通過調用 VDDK API (Virtual Disk Development Kit:VMware 提供的一套操作 vmdk磁盤鏡像的應用程序編程接口集)來讀取虛擬機磁盤的二進制內容,并不解析虛擬機磁盤的內容;備份磁盤有2種模式:1、讀取整個虛擬磁盤邏輯空間并備份所有扇區;2、根據VADP的變化塊追蹤技術獲取到虛擬機磁盤的變化的數據塊,備份相應的變化塊的數據扇區。
[0004]基于VADP對虛擬機進行備份的時候存在性能、空間問題,1、備份虛擬機時是備份鏡像邏輯空間大小而非實際使用大小,從而造成備份大量無用數據,導致備份效率低下;2、增量備份時VADP變化快追蹤可能失敗,此時須執行全備;3.因備份數據龐大,導致恢復也難以快速恢復。
[0005]針對以上使用VADP備份VMware虛擬化平臺虛擬機方法所存在的缺陷,本專利設計一種數據發現方式,使用該方法可以僅備份虛擬機上安裝的應用程序在運行時產生的生產數據(以下簡稱生產數據),從而克服使用VADP備份的缺陷,可以使得備份恢復窗口的時長縮短、減少對虛擬平臺的資源占用以及為客戶節省很多存儲空間。
【發明內容】
[0006]本發明的目的就是為了克服上述現有技術存在的缺陷而提供一種備份效率高、速度快、資源消耗少的基于虛擬機運行信息數據發現的備份方法。
[0007]本發明的目的可以通過以下技術方案來實現:
[0008]一種基于虛擬機運行信息數據發現的備份方法,包括以下步驟:
[0009]數據緩存單元獲取虛擬機運行時的進程信息;[0010]數據備份處理單元將事先存儲的數據發現規則與所述進程信息進行匹配,根據數據發現規則獲取需要備份的應用程序生產數據位置并保存;
[0011]根據所述生產數據位置對相應的虛擬機生產數據進行備份,并映射至數據備份存儲單元。
[0012]所述的數據發現規則根據虛擬機運行應用程序時的數據信息設計。
[0013]所述的數據發現規則為:
[0014]name過濾規則名稱
[0015]uuid備份軟件自動生成
[0016]description過濾規則描述
[0017]process進程名稱,若一組應用有多個進程,使用’;,
[0018]分開,支持模糊匹配
[0019]processCase進程名是否區分大小寫
[0020]suffix后綴名,多個后綴名使用分開
[0021]suffixCase后綴名是否區分大小寫
[0022]searchDir為空,搜尋整個文件系統;指定多個目錄使用’;’
[0023]隔開
[0024]eliminateFiles 刪除除搜尋結果中的特定名稱文件,支持模糊匹
[0025]配
[0026]preBackupCMD備份前指令,多條指令使用’;’分開
[0027]WaitPreBackupCMD 是否等待指令執行結束
[0028]postBackupCMD 備份完成后指令,多條指令使用’;’分開
[0029]waitPostBackupCMD是否等待命令執行結束
[0030]。
[0031]所述的數據發現規則設有多個,形成數據發現規則集。
[0032]所述的數據發現規則事先存儲于數據備份處理單元中,根據虛擬機運行應用程序時的進程信息設計。
[0033]所述的對相應的虛擬機生產數據進行備份具體為:
[0034]1)獲取生產數據位置信息;
[0035]2)執行數據發現規則的備份前指令;
[0036]3)讀取生產數據位置信息對應的虛擬機生產數據,并映射至數據備份存儲單元;
[0037]4)執行備份完成后指令;
[0038]5)重復步驟2),直到所有數據都完成備份。
[0039]與現有技術相比,本發明根據虛擬機運行信息與數據發現規則集進行匹配,僅需要備份生產數據而無須備份整個虛擬機鏡像邏輯空間大小,具有以下有益效果:
[0040]一、不受虛擬機磁盤鏡像邏輯空間大小影響;
[0041]二、僅備份生產數據,避免備份整個虛擬機,也可以像備份普通文件一樣提供完全備份、差異備份;
[0042]三、僅備份生產數據,可以減少對生產虛擬化平臺的內存、網絡帶寬、I / 0讀寫等資源使用;可以減少備份服務器的內存、網絡帶寬、I / 0讀寫等資源使用;可以為客戶節省很多存儲空間,提聞介質的利用率;
[0043]四、在備份與恢復時可以大量減少備份數據量,進而提高備份效率、減少資源消耗、提高備份/恢復速度,提高恢復的RTO(Recovery Time Objective:恢復時間目標);
[0044]五、無需在虛擬化平臺、虛擬機安裝軟件或設置;
[0045]六、支持原虛擬機恢復、異虛擬機恢復、物理機(須安裝恢復客戶端)。
【專利附圖】
【附圖說明】
[0046]圖1為本發明的流程示意圖;
[0047]圖2為本發明的備份流程示意圖。
【具體實施方式】
[0048]下面結合附圖和具體實施例對本發明進行詳細說明。本實施例以本發明技術方案為前提進行實施,給出了詳細的實施方式和具體的操作過程,但本發明的保護范圍不限于下述的實施例。
[0049]一種基于虛擬機運行信息數據發現的備份方法,使用該方法可以僅備份虛擬機上安裝的應用程序在運行時產生的 生產數據(以下簡稱生產數據),從而克服使用現有備份技術的缺陷,可以使得備份恢復窗口的時長縮短、減少對虛擬平臺的資源占用以及為客戶節省很多存儲空間。該備份方法具體包括以下步驟:
[0050]數據緩存單元獲取虛擬機運行時的進程信息;
[0051]數據備份處理單元將事先存儲的數據發現規則與所述進程信息進行匹配,根據數據發現規則獲取需要備份的應用程序生產數據位置并保存;
[0052]根據所述生產數據位置對相應的虛擬機生產數據進行備份,并映射至數據備份存儲單元。
[0053]該備份方法使用的數據發現規則是用來發現虛擬機內需要備份的生產數據,根據虛擬機運行應用程序時的進程信息設計。數據備份處理單元內置常見應用數據發現規則集可以滿足大多數常見應用,用戶也可在根據需要增加新的數據發現規則。使用數據發現規則集時無需對每臺虛擬機維護或指定數據發現規則集,數據發現規則適用于所有通過該備份方法備份的虛擬機。
[0054]該備份方法基于虛擬機動態運行信息數據與數據發現規則集匹配,通過匹配的數據發現規則分析出虛擬機運行的應用類型并發現需要備份的數據,從而達到僅備份生產數據的目的。數據備份處理單元分析全部虛擬機動態運行信息數據并與數據發現規則集匹配,因此可以同時進行多種應用進行數據發現、備份。所述的數據發現規則具體如表1所示。
[0055]表1
[0056]name 過濾規則名稱
【權利要求】
1.一種基于虛擬機運行信息數據發現的備份方法,其特征在于,包括以下步驟: 數據緩存單元獲取虛擬機運行時的進程信息; 數據備份處理單元將事先存儲的數據發現規則與所述進程信息進行匹配,根據數據發現規則獲取需要備份的應用程序生產數據位置并保存; 根據所述生產數據位置對相應的虛擬機生產數據進行備份,并映射至數據備份存儲單J Li o
2.根據權利要求1所述的一種基于虛擬機運行信息數據發現的備份方法,其特征在于,所述的數據發現規則根據虛擬機運行應用程序時的數據信息設計。
3.根據權利要求1所述的一種基于虛擬機運行信息數據發現的備份方法,其特征在于,所述的數據發現規則為: name過濾規則名稱 uuid備份軟件自動生成 description過濾規則描述 process 進程名稱,若一組應用有多個進程,使用’;’
分開,支持模糊匹配 processCase進程名是否區分大小寫 suffix后綴名,多個后綴名使用’;’分開 suffixCase后綴名是否區分大小寫 searchDir為空,搜尋整個文件系統;指定多個目錄使用’;’
隔開 e I iminateF iles 刪除除搜尋結果中的特定名稱文件,支持模糊匹
配 preBackupCMD備份前指令,多條指令使用’;’分開 WaitPreBackupCMD 是否等待指令執行結束 postBackupCMD 備份完成后指令,多條指令使用’;’分開 waitPostBackupCMD是否等待命令執行結束。
4.根據權利要求1所述的一種基于虛擬機運行信息數據發現的備份方法,其特征在于,所述的數據發現規則設有多個,形成數據發現規則集。
5.根據權利要求1所述的一種基于虛擬機運行信息數據發現的備份方法,其特征在于,所述的數據發現規則事先存儲于數據備份處理單元中,根據虛擬機運行應用程序時的進程信息設計。
6.根據權利要求3所述的一種基于虛擬機運行信息數據發現的備份方法,其特征在于,所述的對相應的虛擬機生產數據進行備份具體為: 1)獲取生產數據位置信息; 2)執行數據發現規則的備份前指令; 3)讀取生產數據位置信息對應的虛擬機生產數據,并映射至數據備份存儲單元; 4)執行備份完成后指令; 5)重復步驟2),直到所有數據都完成備份。
【文檔編號】G06F9/455GK103678036SQ201310574430
【公開日】2014年3月26日 申請日期:2013年11月15日 優先權日:2013年11月15日
【發明者】湯玉龍 申請人:上海愛數軟件有限公司