專利名稱:一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息系統(tǒng)領(lǐng)域,特別涉及一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法。
背景技術(shù):
高可用性(High Availability)通常來描述一個信息系統(tǒng)經(jīng)過專門的設(shè)計,從而減少停工時間,而保持其服務(wù)的高度可用性。對于大型制造業(yè)企業(yè)來說,隨著公司的快速發(fā)展,企業(yè)的日常生產(chǎn)運營越來越依賴于核心信息管理系統(tǒng)。如寶鋼的7x24小時運行的熱軋三合一系統(tǒng)對核心信息管理系統(tǒng)提出了更高的業(yè)務(wù)連續(xù)性和高可用性的要求,必須確保關(guān)鍵性系統(tǒng)無論是遇到在計劃內(nèi)系統(tǒng)進行維護的情況下,還是在計劃外系統(tǒng)出現(xiàn)故障和異常情況下都可以快速恢復(fù)、保障生產(chǎn)的持續(xù)進行。目前現(xiàn)有技術(shù)是采用的高可用性(High Availability)技術(shù),以共享存儲系統(tǒng)的方式,通過設(shè)立備用機對主服務(wù)器進行監(jiān)控和故障與異常情況切換,一旦存儲系統(tǒng)或數(shù)據(jù)庫發(fā)生故障和損害,仍然影響系統(tǒng)的正常運行。基于現(xiàn)有技術(shù)的以上缺點,通過引入數(shù)據(jù)容災(zāi)思想和技術(shù),可以大大降低存儲系統(tǒng)故障影響系統(tǒng)運行的可能性,提高系統(tǒng)的高可用性, 大幅減少計劃停機次數(shù)和時間,最大限度降低故障引起的停機對客戶生產(chǎn)經(jīng)營造成的影響。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法,其能提高系統(tǒng)的高可用性,減少系統(tǒng)停機次數(shù),降低系統(tǒng)故障影響正常運行的可能性。一方面,本發(fā)明提供一種提高信息系統(tǒng)可用性的集成設(shè)備,包括應(yīng)用程序單元和數(shù)據(jù)存儲單元,所述應(yīng)用程序單元提供用戶使用的程序,數(shù)據(jù)存儲單元包含系統(tǒng)存儲的數(shù)據(jù),為應(yīng)用程序單元提供數(shù)據(jù),還包括應(yīng)用程序同步單元,所述應(yīng)用程序同步單元為應(yīng)用程序單元的同步鏡像單元,通過服務(wù)器腳本進行切換;數(shù)據(jù)存儲同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲單元中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲同步單元,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。所述服務(wù)器腳本在異常情況出現(xiàn)時,停止應(yīng)用程序單元的運行,釋放應(yīng)用程序單元的IP地址并將IP地址切換到應(yīng)用程序同步單元,同時啟動應(yīng)用程序同步單元。所述數(shù)據(jù)存儲同步單元還通過將數(shù)據(jù)存儲單元的邏輯卷進行鏡像,保證磁盤陣列冗余有效。所述集成設(shè)備還包括將應(yīng)用程序單元與應(yīng)用程序同步單元所用網(wǎng)卡進行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進行故障恢復(fù)轉(zhuǎn)移來提供冗余。另一方面,本發(fā)明還提供一種提高信息系統(tǒng)可用性的集成方法,包括建立應(yīng)用程序單元和數(shù)據(jù)存儲單元,所述應(yīng)用程序單元提供用戶使用的程序,數(shù)據(jù)存儲單元包含系統(tǒng)存儲的數(shù)據(jù),為應(yīng)用程序單元提供數(shù)據(jù),還包括以下步驟A)建立應(yīng)用程序 同步單元,所述應(yīng)用程序同步單元為應(yīng)用程序單元的同步鏡像單元,通過服務(wù)器腳本進行切換;B)建立數(shù)據(jù)存儲同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲單元中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲同步單元,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。所述步驟A還包括設(shè)置服務(wù)器腳本,所述服務(wù)器腳本在異常情況出現(xiàn)時,停止應(yīng)用程序單元的運行,釋放應(yīng)用程序單元的IP地址并將IP地址切換到應(yīng)用程序同步單元,同時啟動應(yīng)用程序同步單元。所述步驟B還包括將數(shù)據(jù)存儲單元的邏輯卷進行鏡像,保證磁盤陣列冗余有效。同時還包括步驟C,將應(yīng)用程序單元與應(yīng)用程序同步單元所用網(wǎng)卡進行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進行故障恢復(fù)轉(zhuǎn)移來提供冗余。采用本發(fā)明所述的一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法,包括應(yīng)用程序單元和數(shù)據(jù)存儲單元,增加設(shè)置了與應(yīng)用程序單元同步鏡像的應(yīng)用程序同步單元,當(dāng)異常情況發(fā)生時,應(yīng)用程序同步單元通過服務(wù)器腳本進行切換從而繼續(xù)進行服務(wù),此外,還增加設(shè)置了數(shù)據(jù)存儲同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)保持與數(shù)據(jù)存儲單元的同步,同時建立磁盤雙陣列進行冗余,這樣大大降低系統(tǒng)故障影響系統(tǒng)運行的可能性,提高系統(tǒng)的高可用性, 減少計劃停機次數(shù)和時間,降低了由故障引起的停機對客戶生產(chǎn)經(jīng)營造成的影響。
圖1是本發(fā)明所述集成設(shè)備的原理框圖;圖2是本發(fā)明所述服務(wù)器腳本進行切換的流程圖;圖3是本發(fā)明所述數(shù)據(jù)存儲單元和數(shù)據(jù)存儲同步單元進行切換的流程圖;圖4是本發(fā)明所述方法的流程示意圖。
具體實施例方式下面結(jié)合附圖和實施例進一步說明本發(fā)明的技術(shù)方案,實施例1以寶山鋼鐵股份公司的7X24小時熱軋三合一系統(tǒng)的核心信息管理系統(tǒng)來進行說明。參照圖1,圖1顯示了本發(fā)明提供的一種提高信息系統(tǒng)可用性的集成化設(shè)備,包括原信息管理系統(tǒng)的設(shè)備,由應(yīng)用程序單元110和數(shù)據(jù)存儲單元所組成。應(yīng)用程序單元110,采用基于AIX系統(tǒng)的小型機架構(gòu),提供用戶使用的程序。數(shù)據(jù)存儲單元120,采用Oracle數(shù)據(jù)庫,存儲應(yīng)用程序單元110所需要的數(shù)據(jù)。作為寶山鋼鐵股份公司7X24小時熱軋三合一系統(tǒng)的核心信息管理系統(tǒng),對于系統(tǒng)可用性有著非常高的要求,同時由于系統(tǒng)無法停機,所以無法進行系統(tǒng)停機升級和維護。 為了提高系統(tǒng)的高可用性,保障核心信息管理系統(tǒng)的正常運行,通過增加了應(yīng)用程序同步單元130和數(shù)據(jù)存儲同步單元140以解決上述技術(shù)問題。所述應(yīng)用程序同步單元130基于AIX系統(tǒng)的小型機架構(gòu),通過鏡像復(fù)制應(yīng)用程序單元110的應(yīng)用程序,并通過操作人員發(fā)布應(yīng)用程序更新保持與應(yīng)用程序單元110的數(shù)據(jù)同步。
當(dāng)應(yīng)用程序單元110發(fā)生異常情況或執(zhí)行計劃內(nèi)維護更新時,將自動執(zhí)行服務(wù)器腳本,將系統(tǒng)切換到應(yīng)用程序同步單元130。所述應(yīng)用程序單元110發(fā)生的異常情況或執(zhí)行計劃內(nèi)維護具體包括1)計劃內(nèi)對服務(wù)器硬件進行微碼升級或配件調(diào)換; 2)計劃內(nèi)對其他硬件微碼升級或配件調(diào)換(switch、SAN switch,陣列;3)計劃內(nèi)對操作系統(tǒng)及核心系統(tǒng)軟件升級;4)計劃外部分硬件損壞;5)計劃外主機服務(wù)器故障宕機;6)計劃外系統(tǒng)軟件故障。如圖2所示,所述服務(wù)器腳本切換過程包括201,開始應(yīng)用程序單元110切換;202,停止應(yīng)用程序單元110的運行,并且釋放應(yīng)用程序單元110的IP地址;203,切換應(yīng)用程序單元110的IP地址到應(yīng)用程序同步單元130 ;204,啟動應(yīng)用程序同步單元130 ;2O5,停止切換。所述服務(wù)器腳本還可通過定制增加其他功能的操作。所述數(shù)據(jù)存儲同步單元140與數(shù)據(jù)存儲單元120采用磁盤整列結(jié)構(gòu)進行冗余。磁盤整列結(jié)構(gòu)通過磁盤整列控制器把要寫入的數(shù)據(jù)分解為多個數(shù)據(jù)塊,然后并行寫入磁盤陣列;讀取數(shù)據(jù)時,磁盤整列控制器并行讀取分散在磁盤陣列中各個硬盤上的數(shù)據(jù),把它們重新組合后提供給主機。由于采用并行讀寫操作,從而提高了存儲系統(tǒng)的讀寫速度,也加強了系統(tǒng)的可靠性。在本實施例中磁盤整列控制器把磁盤陣列中的硬盤分成相同的兩組,互為鏡像,當(dāng)任一磁盤介質(zhì)出現(xiàn)故障時,可以利用其鏡像上的數(shù)據(jù)恢復(fù),從而提高系統(tǒng)的容錯能力。對數(shù)據(jù)的操作仍采用分塊后并行傳輸方式,不僅提高了讀寫速度,也加強系統(tǒng)的可靠性。同時所述數(shù)據(jù)存儲同步單元140采用了數(shù)據(jù)庫同步復(fù)制技術(shù)保證了數(shù)據(jù)存儲同步單元140與數(shù)據(jù)存儲單元120的數(shù)據(jù)同步更新。作為一個實施例,本發(fā)明基于IBM主機系統(tǒng)和IBM存儲系統(tǒng)相互配合的邏輯卷鏡像(LVMMirror)方式,采用雙磁盤系統(tǒng)數(shù)據(jù)同步復(fù)制機制。采用這種方式的數(shù)據(jù)存儲系統(tǒng)可以采用邏輯卷鏡像進行磁盤存儲系統(tǒng)之間的接管,實現(xiàn)存儲系統(tǒng)的高可用性,即使有一半的主機系統(tǒng)和一半的存儲系統(tǒng)發(fā)生故障而不能正常工作,整個系統(tǒng)也不會發(fā)生癱瘓,仍舊可以繼續(xù)運行,充分滿足客戶對高可靠性和連續(xù)可用性的要求。在實施邏輯卷鏡像的數(shù)據(jù)同步復(fù)制方案時,分別將數(shù)據(jù)存儲單元120和數(shù)據(jù)同步存儲單元通過光纖HBA卡連接到SAN交換機上,主機會有效識別兩套存儲系統(tǒng),但對于應(yīng)用沒有任何影響;在主機上,基于磁盤底層的LVM在兩套磁盤系統(tǒng)之間建立鏡像關(guān)系,實現(xiàn)數(shù)據(jù)同步。邏輯卷鏡像可以提供操作系統(tǒng)級別的鏡像(Mirroring)功能,即可以為一個存儲塊提供多份拷貝。該功能包含在邏輯卷管理中,具有以下特點支持2 3份拷貝的鏡像; 可選擇順序(Sequential)和并行(Parallel)兩種存取方式;讀數(shù)據(jù)時可從先找到的拷貝處讀取,加快訪問速度;鏡像功能在數(shù)據(jù)損壞時,能夠從備份中(最多有3份備份)自動恢復(fù),增強系統(tǒng)的可靠性。如圖3所示,當(dāng)數(shù)據(jù)存儲單元120發(fā)生異常造成停機或執(zhí)行計劃內(nèi)升級維護任務(wù)時,磁盤的邏輯卷鏡像的過程如下301,開始數(shù) 據(jù)存儲單元120的切換;302,停止數(shù)據(jù)存儲單元120和數(shù)據(jù)同步存儲單元之間的同步進程;303,切換數(shù)據(jù)存儲單元120的IP地址到數(shù)據(jù)同步存儲單元140 ;304,重啟應(yīng)用程序單元110上的應(yīng)用數(shù)據(jù)庫連接;305,開始數(shù)據(jù)存儲單元120和數(shù)據(jù)同步存儲單元之間的反向同步進程;306.停止切換。本發(fā)明所述的應(yīng)用程序單元110和應(yīng)用程序同步單元130還均安裝有兩塊網(wǎng)卡, 所述網(wǎng)卡采用雙網(wǎng)卡聚合技術(shù),使兩塊網(wǎng)卡虛擬成為一塊網(wǎng)卡,兩塊網(wǎng)卡具有相同的IP地址而并行鏈接聚合成一個邏輯鏈路工作。作為一個實施例,本發(fā)明采用AIX操作系統(tǒng),通過用戶可以配置雙通道網(wǎng)卡綁定(EtherCharmel)的方式實現(xiàn)雙網(wǎng)卡聚合,通過網(wǎng)卡綁定雙網(wǎng)卡不僅綁定有相同的IP地址和MAC地址,而且雙網(wǎng)卡均連接在同一交換機上,切交換機的對應(yīng)端口也需綁定。這樣當(dāng)其中一個網(wǎng)卡失效,或者一根網(wǎng)線失效的時候,不影響整個網(wǎng)絡(luò)的工作,而且,兩個網(wǎng)卡的同時工作,可以增加網(wǎng)絡(luò)帶寬。如圖4所示,本發(fā)明還提供一種提高信息系統(tǒng)可用性的方法。包括建立應(yīng)用程序單元110和數(shù)據(jù)存儲單元120,所述應(yīng)用程序單元110提供用戶使用的程序,數(shù)據(jù)存儲單元 120包含系統(tǒng)存儲的數(shù)據(jù),為應(yīng)用程序單元110提供數(shù)據(jù),還包括以下步驟401建立應(yīng)用程序同步單元130,所述應(yīng)用程序同步單元130為應(yīng)用程序單元110 的同步鏡像單元,通過服務(wù)器腳本進行切換;402建立數(shù)據(jù)存儲同步單元140,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲單元120中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲同步單元140,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。所述步驟A還包括設(shè)置服務(wù)器腳本,所述服務(wù)器腳本在異常情況出現(xiàn)時,停止應(yīng)用程序單元110的運行,釋放應(yīng)用程序單元110的IP地址并將IP地址切換到應(yīng)用程序同步單元130,同時啟動應(yīng)用程序同步單元130。所述步驟B還包括將數(shù)據(jù)存儲單元120的邏輯卷進行鏡像,保證磁盤陣列冗余有效。同時還包括步驟403,將應(yīng)用程序單元110與應(yīng)用程序同步單元130所用網(wǎng)卡進行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進行故障恢復(fù)轉(zhuǎn)移來提供冗余。需要指出的是,本發(fā)明所述的一種提高信息系統(tǒng)可用性的集成設(shè)備和一種提高信息系統(tǒng)可用性的方法,兩者在原理和實施例上是相同或類似的,故其重復(fù)部分不再贅述。本技術(shù)領(lǐng)域中的普通技術(shù)人員應(yīng)當(dāng)認識到,以上的實施例僅是用來說明本發(fā)明, 而并非用作為對本發(fā)明的限定,只要在本發(fā)明的實質(zhì)精神范圍內(nèi),對以上實施例的變化、變型都將落在本發(fā)明的權(quán)利要求書范圍內(nèi)。
權(quán)利要求
1.一種提高信息系統(tǒng)可用性的集成設(shè)備,包括應(yīng)用程序單元和數(shù)據(jù)存儲單元,所述應(yīng)用程序單元提供用戶使用的程序,數(shù)據(jù)存儲單元包含系統(tǒng)存儲的數(shù)據(jù),為應(yīng)用程序單元提供數(shù)據(jù),其特征在于,還包括應(yīng)用程序同步單元,所述應(yīng)用程序同步單元為應(yīng)用程序單元的同步鏡像單元,通過服務(wù)器腳本進行切換;數(shù)據(jù)存儲同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲單元中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲同步單元,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。
2.如權(quán)利要求1所述的一種集成設(shè)備,其特征在于,所述服務(wù)器腳本在異常情況出現(xiàn)時,停止應(yīng)用程序單元的運行,釋放應(yīng)用程序單元的IP地址并將IP地址切換到應(yīng)用程序同步單元,同時啟動應(yīng)用程序同步單元。
3.如權(quán)利要求1所述的一種集成設(shè)備,其特征在于,所述數(shù)據(jù)存儲同步單元還通過將數(shù)據(jù)存儲單元的邏輯卷進行鏡像,保證磁盤陣列冗余有效。
4.如權(quán)利要求1所述的一種集成設(shè)備,其特征在于,所述集成設(shè)備還包括將應(yīng)用程序單元與應(yīng)用程序同步單元所用網(wǎng)卡進行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進行故障恢復(fù)轉(zhuǎn)移來提供冗余。
5.一種提高信息系統(tǒng)可用性的集成方法,包括建立應(yīng)用程序單元和數(shù)據(jù)存儲單元,所述應(yīng)用程序單元提供用戶使用的程序,數(shù)據(jù)存儲單元包含系統(tǒng)存儲的數(shù)據(jù),為應(yīng)用程序單元提供數(shù)據(jù),其特征在于,還包括以下步驟A)建立應(yīng)用程序同步單元,所述應(yīng)用程序同步單元為應(yīng)用程序單元的同步鏡像單元, 通過服務(wù)器腳本進行切換;B)建立數(shù)據(jù)存儲同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲單元中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲同步單元,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。
6.如權(quán)利要求5所述的一種集成方法,其特征在于,所述步驟A還包括設(shè)置服務(wù)器腳本,所述服務(wù)器腳本在異常情況出現(xiàn)時,停止應(yīng)用程序單元的運行,釋放應(yīng)用程序單元的IP 地址并將IP地址切換到應(yīng)用程序同步單元,同時啟動應(yīng)用程序同步單元。
7.如權(quán)利要求5所述的一種集成方法,其特征在于,所述步驟B還包括將數(shù)據(jù)存儲單元的邏輯卷進行鏡像,保證磁盤陣列冗余有效。
8.如權(quán)利要求5所述的一種集成方法,其特征在于,還包括步驟C,將應(yīng)用程序單元與應(yīng)用程序同步單元所用網(wǎng)卡進行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進行故障恢復(fù)轉(zhuǎn)移來提供冗余。
全文摘要
本發(fā)明揭示了一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法,包括應(yīng)用程序單元110和數(shù)據(jù)存儲單元,增加設(shè)置了與應(yīng)用程序單元同步鏡像的應(yīng)用程序同步單元,當(dāng)異常情況發(fā)生時,應(yīng)用程序同步單元通過服務(wù)器腳本進行切換從而繼續(xù)進行服務(wù),此外,還增加設(shè)置了數(shù)據(jù)存儲同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)保持與數(shù)據(jù)存儲單元的同步,同時建立磁盤雙陣列進行冗余,這樣大大降低系統(tǒng)故障影響系統(tǒng)運行的可能性,提高系統(tǒng)的高可用性,減少計劃停機次數(shù)和時間,降低了由故障引起的停機對客戶生產(chǎn)經(jīng)營造成的影響。
文檔編號G06F11/16GK102314381SQ201010219380
公開日2012年1月11日 申請日期2010年7月2日 優(yōu)先權(quán)日2010年7月2日
發(fā)明者辛?xí)F 申請人:上海寶信軟件股份有限公司