專利名稱:在群集計(jì)算環(huán)境中管理存儲資源的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)存儲系統(tǒng)領(lǐng)域,尤其涉及在群集計(jì)算環(huán)境中管理存儲資源的系統(tǒng)和方法。
存儲區(qū)網(wǎng)絡(luò)(SAN)經(jīng)常包括與多個(gè)節(jié)點(diǎn),如工作站和服務(wù)器以通信形式連接的數(shù)據(jù)存儲資源。在本發(fā)明中,術(shù)語“節(jié)點(diǎn)”和“服務(wù)器”是可替換使用的,應(yīng)理解為“服務(wù)器”是“節(jié)點(diǎn)”的一種類型。
在SAN中,服務(wù)器可以通過采用光纖信道協(xié)議的結(jié)構(gòu)訪問數(shù)據(jù)存儲資源。光纖信道協(xié)議是作為普通物理層工作的,該物理層允許傳遞多個(gè)上層協(xié)議,如小型計(jì)算機(jī)系統(tǒng)接口(SCSI)協(xié)議。在SAN環(huán)境中,SCSI協(xié)議將邏輯單元號(LUN)指定給數(shù)據(jù)存儲資源。LUN允許SAN中的服務(wù)器通過參照特殊數(shù)據(jù)存儲資源的SCSI LUN訪問特定的數(shù)據(jù)存儲資源。
盡管光纖信道存儲系統(tǒng)能夠提供巨大的存儲容量,但形成該系統(tǒng)很昂貴。結(jié)果用戶經(jīng)常試圖分享由多個(gè)服務(wù)器之間的系統(tǒng)所提供的可利用的存儲空間。不利的是,如果與指定SAN相連的服務(wù)器使用微軟的WINDOWS NT操作系統(tǒng),則服務(wù)器將嘗試享有對服務(wù)器來說很顯然的任何LUN的所有權(quán)。例如,如果當(dāng)服務(wù)器啟動時(shí)特定的服務(wù)器檢測出有多個(gè)LUN,則可以假設(shè)每個(gè)LUN都有其自身的用途。由此,如果多個(gè)WINDOWS NT服務(wù)器連接在存儲庫或數(shù)據(jù)存儲資源上,則每個(gè)服務(wù)器都可嘗試控制存儲庫中的每個(gè)LUN。當(dāng)多于一個(gè)服務(wù)器試圖訪問同一個(gè)LUN時(shí),這種情況會導(dǎo)致沖突。
試圖解決這個(gè)問題的用戶,通過過濾或通過利用具有LUN掩蔽功能的最小端口的驅(qū)動器來劃分可利用的存儲空間,或?qū)⒃摯鎯臻g分區(qū)。實(shí)際上,這種劃分將使運(yùn)行WINDOWS NT的服務(wù)器看不到?jīng)]有分配給它的存儲空間。這種方法對獨(dú)立的服務(wù)器有效,但在群集計(jì)算環(huán)境中還存在有很多缺點(diǎn)。
群集包含一組獨(dú)立的服務(wù)器的配置,從而它們可作為單個(gè)機(jī)器出現(xiàn)在網(wǎng)絡(luò)上。用戶經(jīng)常將群集作為單個(gè)系統(tǒng)管理,分享公共名稱空間,并進(jìn)行特殊設(shè)計(jì)以能夠容忍單元(component)故障,并能夠以明確的方式支持單元的增加或減少。不利的是,因?yàn)槿杭骶哂袃蓚€(gè)或更多個(gè)以獨(dú)立機(jī)器形式出現(xiàn)的服務(wù)器,所以可以證明上述的劃分技術(shù)在兩個(gè)或更多服務(wù)器試圖訪問同一個(gè)LUN時(shí),將不能避免發(fā)生沖突。
微軟群集服務(wù)器(Microsoft Cluster Server,MSCS)提出了一個(gè)現(xiàn)行的可行性技術(shù),即在群集計(jì)算環(huán)境中裁決沖突,并管理存儲裝置的所有權(quán)。MSCS系統(tǒng)在群集中工作,該群集具有兩個(gè)服務(wù)器,即作為主管服務(wù)器的服務(wù)器A和服務(wù)器B。在工作中,服務(wù)器A將周期性的脈動信號傳遞給服務(wù)器B,以使服務(wù)器B知道服務(wù)器A是“活的”。如果服務(wù)器B沒有適時(shí)從服務(wù)器A處接收到脈動信號,則服務(wù)器B將判斷服務(wù)器A是否是可操作的,并且/或者判斷服務(wù)器B是否將接管服務(wù)器A所保留的所有LUN的所有權(quán)。不利的是,MSCS系統(tǒng)在此過程中可以利用SCSI的目標(biāo)復(fù)位,而該SCSI復(fù)位可能會產(chǎn)生很多問題。例如,在MSCS系統(tǒng)中典型的SCSI復(fù)位可能導(dǎo)致所有在指定光纖信道系統(tǒng)中的服務(wù)器中止其待定的輸入/輸出,即“I/O”進(jìn)程。這種中止進(jìn)程直到總線穩(wěn)定才會最終完成。這種中止/等待/重試的處理會在整個(gè)系統(tǒng)運(yùn)行中產(chǎn)生不利影響。
除了在運(yùn)行中的潛在影響外,MSCS系統(tǒng)和它所使用的SCSI復(fù)位還對整個(gè)系統(tǒng)的可靠性產(chǎn)生不利的影響。在操作中,MSCS系統(tǒng)在某一時(shí)刻只使一個(gè)SCSI復(fù)位,而不能使其后的SCSI復(fù)位,這樣就不能產(chǎn)生期望的作用并降低該系統(tǒng)的可靠性。
根據(jù)本發(fā)明,用于在群集計(jì)算環(huán)境中管理存儲資源的系統(tǒng)和方法優(yōu)于現(xiàn)有技術(shù)中發(fā)展的技術(shù)。所公開的系統(tǒng)和方法在減少對SCSI復(fù)位依賴的情況下,進(jìn)行存儲資源管理和解決沖突。
根據(jù)本發(fā)明的一個(gè)方面,在群集計(jì)算環(huán)境中管理存儲資源的方法包括保留群集計(jì)算環(huán)境第一個(gè)節(jié)點(diǎn)的預(yù)留資源。例如該節(jié)點(diǎn)可以是服務(wù)器,工作站或任何其它包含在群集中的計(jì)算裝置。
可以進(jìn)行第一節(jié)點(diǎn)的第三方進(jìn)程退出(third party processlogout),并釋放第一節(jié)點(diǎn)保留的預(yù)留資源。在一個(gè)實(shí)施例中,第三方進(jìn)程退出對應(yīng)于以第一節(jié)點(diǎn)為名義發(fā)出的退出命令。例如由第二節(jié)點(diǎn)或光纖信道交換機(jī)發(fā)出第三方進(jìn)程退出命令。第三方進(jìn)程退出命令包括識別信息,該信息可確認(rèn)作為發(fā)出退出命令發(fā)令方的第一節(jié)點(diǎn),盡管第一節(jié)點(diǎn)并不是實(shí)際上的發(fā)令方。例如識別信息包括全球域名(world wide name)和指定給第一節(jié)點(diǎn)的資源標(biāo)志符。
在群集計(jì)算環(huán)境中管理存儲資源還包括對光纖信道系統(tǒng)進(jìn)行分區(qū)。所述區(qū)域?qū)⒌谝?、第二?jié)點(diǎn)和多個(gè)存儲資源,如硬盤驅(qū)動器,及其其它數(shù)據(jù)存儲裝置分成組。在分區(qū)的系統(tǒng)中,在第一節(jié)點(diǎn)發(fā)出第三方進(jìn)程退出命令之后,第二節(jié)點(diǎn)將其本身退出。在兩個(gè)節(jié)點(diǎn)退出之后,對鏈接復(fù)位的循環(huán)初始協(xié)議(LIP)進(jìn)行初始化,產(chǎn)生狀態(tài)變化通知,任何功能節(jié)點(diǎn)都可以重新進(jìn)行注冊。
根據(jù)本發(fā)明的另一方面,在群集計(jì)算環(huán)境中管理存儲資源的方法包括接收預(yù)留命令,該預(yù)留命令力圖為群集中節(jié)點(diǎn)預(yù)留存儲資源。響應(yīng)預(yù)留命令,發(fā)出使用預(yù)留服務(wù)操作的SCSI持續(xù)預(yù)留命令(SCSIpersistent reserve out command),以為該節(jié)點(diǎn)保留存儲資源。這種持續(xù)保留將在存儲資源中保持可清除的預(yù)留資源。在一個(gè)實(shí)施例中,而發(fā)出使用清除服務(wù)操作的SCSI持續(xù)預(yù)留命令,預(yù)留資源便被清除掉。在SCSI復(fù)位的同時(shí),與立即清除多個(gè)LUN預(yù)留資源相反,使用持續(xù)預(yù)留命令允許對LUN預(yù)留資源個(gè)別釋放。
根據(jù)本發(fā)明的另一方面,在群集計(jì)算環(huán)境中能夠管理存儲資源的計(jì)算機(jī)系統(tǒng)包括第一節(jié)點(diǎn)、第二節(jié)點(diǎn)和資源管理器,該資源管理器能夠根據(jù)第二節(jié)點(diǎn)沒有適時(shí)接收到第一節(jié)點(diǎn)傳遞的脈動信號,而退出第一節(jié)點(diǎn)。該系統(tǒng)還包括用于存儲資源管理器的計(jì)算機(jī)可讀媒體和與計(jì)算機(jī)可讀媒體相聯(lián)的、并可運(yùn)行資源管理器的中央處理單元。
在一個(gè)實(shí)施例中,該系統(tǒng)還包括多個(gè)與第一節(jié)點(diǎn)以通訊方式相連的計(jì)算機(jī)平臺。例如這些計(jì)算機(jī)平臺可以是個(gè)人計(jì)算機(jī)的網(wǎng)絡(luò)的計(jì)算機(jī)。該系統(tǒng)還包括與第一節(jié)點(diǎn)和多個(gè)存儲資源以通訊方式相連的光纖信道交換機(jī)。在一些實(shí)施例中,光纖信道交換機(jī)包括能夠運(yùn)行資源管理器的中央處理單元。
對應(yīng)于本發(fā)明所公開技術(shù)的系統(tǒng)和方法明顯優(yōu)于普通的群集資源管理方案。例如,所公開的技術(shù)能夠更好地管理和解決存儲資源的沖突。如上所述,群集計(jì)算環(huán)境中的SCSI復(fù)位將退出/等待/重試的初始化處理成多個(gè)I/O程序,該程序會對整個(gè)系統(tǒng)的執(zhí)行產(chǎn)生不利影響。本發(fā)明的技術(shù)有助于減少對SCSI復(fù)位的依賴,和對降級運(yùn)行結(jié)果的依賴。
另外,本發(fā)明公開的技術(shù)有利于避免系統(tǒng)對應(yīng)于群集計(jì)算環(huán)境中SCSI復(fù)位而產(chǎn)生可靠性的問題。傳統(tǒng)群集資源管理系統(tǒng),如MSCS,在原先SCSI復(fù)位的總線出現(xiàn)障礙過程中,不會引起SCSI復(fù)位的初始化。這種限制會產(chǎn)生不期望的情況,并減小系統(tǒng)的可靠性。因?yàn)楸景l(fā)明公開的技術(shù)有利于避免至少一些SCSI復(fù)位問題,所以可提高系統(tǒng)的可靠性。
參照說明書,權(quán)利要求書和附圖,本領(lǐng)域所屬普通技術(shù)人員會理解本發(fā)明的其它優(yōu)點(diǎn)。
參照下列說明和附圖,將能更完全地理解本發(fā)明和本發(fā)明的優(yōu)點(diǎn),其中相同的標(biāo)號表示相同的特征,其中
圖1是根據(jù)本發(fā)明公開的技術(shù),包含有資源管理器的一個(gè)實(shí)施例的存儲區(qū)網(wǎng)絡(luò)的單元圖表;圖2是根據(jù)本發(fā)明公開的技術(shù),在群集計(jì)算環(huán)境中管理存儲資源的方法的一個(gè)實(shí)施例的流程圖;圖3是根據(jù)本發(fā)明公開的技術(shù),在群集計(jì)算環(huán)境中管理存儲資源的方法的另一個(gè)實(shí)施例的流程圖。
圖1表示存儲區(qū)網(wǎng)絡(luò)(SAN)的一般框圖,由標(biāo)號10表示。SAN10包括兩個(gè)群集計(jì)算系統(tǒng),群集12和14。如圖所示,群集12包括節(jié)點(diǎn)16和節(jié)點(diǎn)18,群集14包括節(jié)點(diǎn)20和22。例如節(jié)點(diǎn)16,18,20和22可以是服務(wù)器,工作站或其它網(wǎng)絡(luò)計(jì)算裝置。如圖1所示,群集12可以被多個(gè)注冊裝置所支持,如由標(biāo)號24表示的注冊個(gè)人計(jì)算機(jī)。
SAN10也可以包括存儲庫26,例如該存儲庫26包括多個(gè)物理存儲裝置,如受一個(gè)或多個(gè)存儲控制器控制,并與該存儲控制器連接的硬盤裝置。將該存儲庫26的物理存儲裝置指定為邏輯單元號(LUN)。一些物理存儲裝置也可以歸類為RAID空間,將每一空間指定為SCSI的LUN地址。將其它物理存儲裝置分別指定為一個(gè)或多個(gè)LUN。但是指定了LUN后,圖1的LUN將獲得的存儲庫26的物理存儲映入多個(gè)邏輯存儲裝置,而且確認(rèn)這些邏輯存儲裝置,并將其編址。
在工作中,節(jié)點(diǎn)16,18,20和22,通過采用光纖信道協(xié)議的光纖28與存儲庫26連通并將數(shù)據(jù)傳遞到存儲庫26處,再將數(shù)據(jù)從存儲庫26中傳送出來。如圖1所示,將節(jié)點(diǎn)16和18編入具有LUN-1和LUN-2的區(qū)域30。同樣,將節(jié)點(diǎn)20和22編入具有LUN-3,LUN-4和LUN-5的區(qū)域32。利用交換機(jī)分區(qū)而產(chǎn)生區(qū)30,以防止從節(jié)點(diǎn)16和18看到節(jié)點(diǎn)20和22。同樣,利用交換機(jī)分區(qū)段而產(chǎn)生區(qū)域32,以防止從節(jié)點(diǎn)20和22看到節(jié)點(diǎn)16和18。除分區(qū)外,圖1所示實(shí)施例還使用LUN掩蔽的方法。LUN掩蔽可以將特殊節(jié)點(diǎn)或群集掩蔽起來,而不能看到某些LUN。例如,LUN掩蔽的方法可以防止從節(jié)點(diǎn)16和18看到LUN-3,LUN-4和LUN-5。
在圖1所示的實(shí)施例中,將節(jié)點(diǎn)16,18,20和22指定為統(tǒng)一的全球域名(WWN),該WWN可以是8個(gè)字節(jié)的標(biāo)志符。電子工程師學(xué)會(IEEE)將WWN框圖指定給制造商,從而使制造商可以用唯一的WWN建立光纖信道裝置。為了說明的目的,在圖1所示實(shí)施例中,節(jié)點(diǎn)16的WWN為“AAA”,節(jié)點(diǎn)18的WWN為“BBB”,節(jié)點(diǎn)20的WWN為“CCC”,節(jié)點(diǎn)22的WWN為“DDD”。這樣,耦接到結(jié)構(gòu)28上的其它裝置就可以唯一地確認(rèn)節(jié)點(diǎn)16,18,20和22了。
節(jié)點(diǎn)16,18,20和22除了他們各自的WWN外,還具有識別信息。例如,根據(jù)光纖信道協(xié)議,當(dāng)將節(jié)點(diǎn),如節(jié)點(diǎn)16初始化并聯(lián)入結(jié)構(gòu)28時(shí),將光纖信道ID指定給節(jié)點(diǎn)。該ID將隨每一刻初始化的結(jié)果而改變,例如當(dāng)將其它節(jié)點(diǎn)或裝置聯(lián)入結(jié)構(gòu)28時(shí),該ID將隨每一刻初始化的結(jié)果而改變。如圖1所示,按下列方式結(jié)構(gòu)28分配光纖信道ID節(jié)點(diǎn)16為S-ID-1,節(jié)點(diǎn)18為S-ID-2,節(jié)點(diǎn)20為S-ID-3,節(jié)點(diǎn)22為S-ID-4。
在圖1所示實(shí)施例中,將各種WWN和光纖信道ID存儲在計(jì)算機(jī)可讀媒體34中,該媒體可與SAN10的裝置匹配使用。如圖1所示,SAN10包括用于配置結(jié)構(gòu)28的計(jì)算裝置38。這種計(jì)算裝置可包括以通訊方式與計(jì)算機(jī)可讀媒體34連接的CPU。交換機(jī)36至少具有一個(gè)端口40,該端口用于連接其它裝置,以形成整體光纖信道網(wǎng)絡(luò)。
在本發(fā)明實(shí)際公開的一個(gè)系統(tǒng)實(shí)施例中,可操作計(jì)算裝置38以運(yùn)行資源管理器,該資源管理器存儲在計(jì)算機(jī)可讀媒體34中。也可以用資源管理器來完成各種功能。例如,可以用資源管理器訪問保留的SAN10裝置中WWN和光纖信道ID的表單。另外,也可以用資源管理器識別由節(jié)點(diǎn)發(fā)出的SCSI復(fù)位命令,并且將該復(fù)位命令轉(zhuǎn)換為釋放存儲資源命令。例如,釋放存儲資源命令可以是進(jìn)行第三方進(jìn)程退出(thirdparty process log out)或使用清除操作的SCSI持續(xù)預(yù)留命令。
在MSCS型群集中,當(dāng)節(jié)點(diǎn),如節(jié)點(diǎn)18或20確認(rèn)從各自的群集伙伴處沒有適時(shí)接收到脈動信號42或44時(shí),會發(fā)出SCSI復(fù)位命令。脈動42和44允許節(jié)點(diǎn)18和22分別能夠看到對方(如果它們的群集伙伴仍然在工作)。
例如,如果節(jié)點(diǎn)18不再“看到”節(jié)點(diǎn)16,節(jié)點(diǎn)18可以尋求獲得已釋放的、為節(jié)點(diǎn)16保持的任一個(gè)LUN。為了實(shí)現(xiàn)這種釋放,節(jié)點(diǎn)18發(fā)出一個(gè)與節(jié)點(diǎn)16和18相關(guān)的、SCSI總線的低級總線復(fù)位命令。在一些系統(tǒng)中,如在MSCS系統(tǒng)中,節(jié)點(diǎn)18在嘗試保留已由節(jié)點(diǎn)16保留的LUN之前,會等待特定的時(shí)間。這種等待使節(jié)點(diǎn)16在SCSI復(fù)位之前恢復(fù)控制保留的LUN。這樣,盡管節(jié)點(diǎn)18沒有接收到脈動信號42,但如果節(jié)點(diǎn)16被“激活”,則節(jié)點(diǎn)16仍可以再建立其資源預(yù)留,并使節(jié)點(diǎn)18知道它已被“激活”。
不利的是,如上所述,在群集計(jì)算環(huán)境中的SCSI復(fù)位對整體系統(tǒng)的工作情況和系統(tǒng)的可靠性有不利的影響。所公開的系統(tǒng)和資源管理器以各種途徑幫助減少群集計(jì)算環(huán)境對SCSI復(fù)位的依賴。例如,通過對圖2和圖3的分析能夠更好地理解避免SCSI復(fù)位的技術(shù)。
圖2描述的是一種方法100的實(shí)施例的流程圖,該方法100用于管理群集計(jì)算環(huán)境中的存儲資源。圖2的方法由資源管理器完成,該資源管理器是在與SAN結(jié)構(gòu)連接的存儲控制器上運(yùn)行的。在一些實(shí)施例中,可以在與交換機(jī),如圖1所示的交換機(jī)36相連的CPU上運(yùn)行資源管理器。在另一些實(shí)施例中,可以將CPU與SAN裝置而不是交換機(jī)配合使用。例如,可以在SAN的一個(gè)或多個(gè)節(jié)點(diǎn)上運(yùn)行資源管理器。
在操作SAN過程中,接收到端口注冊命令(PLOGI)。在現(xiàn)有技術(shù)中已知,端口注冊命令是光纖信道命令,其中將節(jié)點(diǎn)接入連接在SAN上的存儲裝置。在結(jié)構(gòu)將光纖信道ID(S-ID)指定給節(jié)點(diǎn)之后,該節(jié)點(diǎn)可以執(zhí)行PLOGI命令。正如在已有技術(shù)中所知的,當(dāng)節(jié)點(diǎn)執(zhí)行光纖接入(FLOGI)命令時(shí),可以指定節(jié)點(diǎn)的S-ID。
在步驟102中,群集節(jié)點(diǎn)的S-ID和WWN被摘錄出來。該摘錄工作可以在不同時(shí)刻進(jìn)行。例如,在節(jié)點(diǎn)發(fā)出PLOGI命令時(shí)進(jìn)行摘錄。一旦摘錄完成后,便更新S-ID和WWN,并將它們存儲在計(jì)算機(jī)可讀媒體上。在一些實(shí)施例中,計(jì)算機(jī)可讀媒體是SAN的一部分,并可以由SAN的多種裝置訪問。
在步驟104中,相對于指定的節(jié)點(diǎn)保留LUN預(yù)留資源。實(shí)際上,指定的節(jié)點(diǎn)有特定的權(quán)利使用保留的LUN。如上所述,群集節(jié)點(diǎn)經(jīng)常用脈動信號與另一個(gè)群集節(jié)點(diǎn)聯(lián)絡(luò)。在步驟106中,SAN裝置可以發(fā)現(xiàn)沒有適時(shí)接收到脈動信號。盡管沒有接收到脈動信號只說明脈動發(fā)生器與脈動接收器之間的通訊聯(lián)系中斷,但如步驟108所示,其從失敗的結(jié)果可以判斷出群集節(jié)點(diǎn)是不可操作的。
在圖2所示實(shí)施例中,對節(jié)點(diǎn)不可操作的判斷導(dǎo)致其它節(jié)點(diǎn)發(fā)出SCSI復(fù)位命令。如步驟110所示,對于已經(jīng)確信節(jié)點(diǎn)是不可操作的(“死”節(jié)點(diǎn))情況,發(fā)出SCSI復(fù)位的命令,以解除該節(jié)點(diǎn)保持的LUN保留。在步驟112中,SCSI復(fù)位命令轉(zhuǎn)換成第三方進(jìn)程退出命令。這種轉(zhuǎn)換可通過例如運(yùn)行資源管理器來完成。
在步驟114中,第三方以“死”節(jié)點(diǎn)的名義發(fā)出對“死”節(jié)點(diǎn)的退出命令。例如,資源管理器可以進(jìn)入存儲“死”節(jié)點(diǎn)的S-ID和WWN的計(jì)算機(jī)可讀媒體中。資源管理器可以使用“死”節(jié)點(diǎn)的S-ID和WWN退出“死”節(jié)點(diǎn)。該第三方執(zhí)行退出,將導(dǎo)致退出節(jié)點(diǎn)所保留的LUN預(yù)留資源釋放。
如圖2的步驟116所示,群集的其它節(jié)點(diǎn)也可以退出和被退出,并且循環(huán)初始化協(xié)議(LIP)的鏈接復(fù)位開始初始化。在步驟118中的LIP鏈接復(fù)位之后,步驟120產(chǎn)生狀態(tài)變化通告。在圖2所示實(shí)施例中,狀態(tài)變化通告導(dǎo)致激活沒有死的群集節(jié)點(diǎn),以完成端口注冊,并尋找LUN預(yù)留資源。在步驟122中可看到被激活的群集節(jié)點(diǎn)的注冊。如果“死”節(jié)點(diǎn)沒有死,它便能夠取回其LUN保留。如“死”節(jié)點(diǎn)死了,則其它群集節(jié)點(diǎn)可以占據(jù)由“死”節(jié)點(diǎn)保留的LUN預(yù)留資源。實(shí)際上,由死節(jié)點(diǎn)保留的存儲資源能夠被“活”節(jié)點(diǎn)利用其導(dǎo)致對存儲資源更好的利用而不需SCSI復(fù)位。
從圖3可看到在群集計(jì)算環(huán)境中管理存儲資源的另一個(gè)方法實(shí)施例200。圖3所示的方法與圖2的方法相同,都是由資源管理器完成的。該資源管理器可以設(shè)在任何地方。例如,可以將該管理器設(shè)到交換機(jī),節(jié)點(diǎn)或與光纖信道結(jié)構(gòu)連接的存儲控制器上。
如步驟202所示,方法200包括接收SCSI LUN預(yù)留資源命令。典型的SCSI預(yù)留資源命令由SCSI復(fù)位而清除。如上所述,SCSI復(fù)位會導(dǎo)致群集計(jì)算環(huán)境中出現(xiàn)很多問題。這樣在步驟204中,使用RESERVE服務(wù)操作,將SCSI復(fù)位命令轉(zhuǎn)換成SCSI持續(xù)預(yù)留命令。例如從SCSI保留到SCSI持續(xù)保留的轉(zhuǎn)換是由運(yùn)行資源管理器完成的。如節(jié)點(diǎn)SCSI預(yù)留命令的為原有節(jié)點(diǎn)而使步驟206所示,持續(xù)預(yù)留命令可以使節(jié)點(diǎn)保留持續(xù)的LUN預(yù)留資源。在步驟208中,判斷出占據(jù)的節(jié)點(diǎn)是不可操作的。根據(jù)這種判斷發(fā)出SCSI復(fù)位命令。步驟210中的SCSI復(fù)位命令根據(jù)。
服務(wù)器的CLEAR操作,在步驟212中轉(zhuǎn)換成SCSI持續(xù)預(yù)留命令。在操作中,使用CLEAR服務(wù)操作的SCSI持續(xù)預(yù)留命令釋放由最初的SCSI持續(xù)預(yù)留命令而保留的LUN預(yù)留資源。步驟214對LUN的釋放有效地將在步驟208中判斷為不可操作的節(jié)點(diǎn)所保留的存儲資源釋放。這樣導(dǎo)致群集計(jì)算環(huán)境中對存儲資源進(jìn)行更好地初始化,并且不利用SCSI復(fù)位就能夠完成這種更好的初始化工作。
本發(fā)明也考慮到了上述實(shí)施例的各種變化。例如,在具有任何數(shù)量的拓?fù)涞腟AN中都可完成本發(fā)明的實(shí)施例。例如,可以有多個(gè)存儲控制器,可以有在每個(gè)群集節(jié)點(diǎn)上運(yùn)行的資源管理器,或者可以有在群集計(jì)算環(huán)境的每個(gè)區(qū)中運(yùn)行的單一的資源管理器。
盡管已經(jīng)詳細(xì)描述了本發(fā)明公開的實(shí)施例,但應(yīng)理解在不脫離其構(gòu)思和范圍的情況下,本發(fā)明的實(shí)施例還有各種變化,替代和修改。
權(quán)利要求
1.用于在群集計(jì)算環(huán)境中管理存儲資源的方法,其特征在于該方法包括保留群集計(jì)算環(huán)境中為第一節(jié)點(diǎn)的預(yù)留存儲資源;對所述第一節(jié)點(diǎn)執(zhí)行第三方進(jìn)程退出;釋放為第一節(jié)點(diǎn)保留的預(yù)留存儲資源。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于該方法還包括判斷第一節(jié)點(diǎn)是否未在運(yùn)行。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于該方法還包括未從第一節(jié)點(diǎn)處接收脈動信號;判斷未從第一節(jié)點(diǎn)處接收脈動信號是由于第一節(jié)點(diǎn)未在運(yùn)行。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于該方法還包括從群集計(jì)算環(huán)境的第二節(jié)點(diǎn)處進(jìn)行第三方進(jìn)程退出。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于該方法還包括從與群集計(jì)算環(huán)境相連的交換機(jī)處進(jìn)行第三方進(jìn)程退出。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于該方法還包括在光纖信道存儲系統(tǒng)中建立一分區(qū),該分區(qū)包括群集計(jì)算環(huán)境的第一節(jié)點(diǎn),群集計(jì)算環(huán)境的第二節(jié)點(diǎn)和至少一個(gè)存儲資源。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于存儲資源包括一硬盤驅(qū)動器。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于該方法還包括存儲關(guān)于第一節(jié)點(diǎn)的標(biāo)識信息;使用所述標(biāo)識信息發(fā)出第三方進(jìn)程退出請求。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于該方法還包括將一全球域名和一資源標(biāo)識符指定給第一節(jié)點(diǎn);使用所述全球域名和資源標(biāo)識符以第一節(jié)點(diǎn)名義發(fā)出第三方進(jìn)程退出請求。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于該方法還包括將一全球域名和一資源標(biāo)識符指定給第一節(jié)點(diǎn);將一第二全球域名和一第二資源標(biāo)識符指定給第二節(jié)點(diǎn);使用所述全球域名和資源標(biāo)識符為第一節(jié)點(diǎn)發(fā)出第三方退出請求;退出第一節(jié)點(diǎn);和退出第二節(jié)點(diǎn)。
11.根據(jù)權(quán)利要求1所述的方法,其特征在于第一節(jié)點(diǎn)包括一服務(wù)器。
12.根據(jù)權(quán)利要求1所述的方法,其特征在于第一節(jié)點(diǎn)包括一工作站。
13.根據(jù)權(quán)利要求1所述的方法,其特征在于該方法還包括退出群集計(jì)算環(huán)境的第二節(jié)點(diǎn)。
14.根據(jù)權(quán)利要求13所述的方法,其特征在于該方法還包括用與群集計(jì)算環(huán)境連接的交換機(jī)發(fā)出狀態(tài)改變通告。
15.根據(jù)權(quán)利要求13所述的方法,其特征在于該方法還包括啟始循環(huán)初始化協(xié)議鏈接復(fù)位;和對應(yīng)于循環(huán)初始化協(xié)議鏈接復(fù)位發(fā)出狀態(tài)改變通告。
16.根據(jù)權(quán)利要求13所述的方法,其特征在于該方法還包括響應(yīng)狀態(tài)改變通告,用第二節(jié)點(diǎn)進(jìn)行相應(yīng)的端口注冊。
17.一種用于群集計(jì)算環(huán)境中管理存儲資源的方法,該方法包括接收尋求為群集計(jì)算環(huán)境中節(jié)點(diǎn)保留存儲資源的小型計(jì)算機(jī)系統(tǒng)的界面預(yù)留命令;響應(yīng)預(yù)留命令,發(fā)出使用預(yù)留服務(wù)操作的小型計(jì)算機(jī)系統(tǒng)界面的持續(xù)預(yù)留命令,以為節(jié)點(diǎn)保留存儲資源。
18.根據(jù)權(quán)利要求17所述的方法,其特征在于小端口驅(qū)動器接收所述預(yù)留命令,并發(fā)出持續(xù)預(yù)留命令。
19.根據(jù)權(quán)利要求17所述的方法,其特征在于該方法還包括通過發(fā)出使用清除服務(wù)操作的小型計(jì)算機(jī)系統(tǒng)界面的持續(xù)預(yù)留命令,從而釋放為節(jié)點(diǎn)保留的預(yù)留資源。
20.一種計(jì)算機(jī)系統(tǒng),該系統(tǒng)包括群集計(jì)算環(huán)境中的第一節(jié)點(diǎn);群集計(jì)算環(huán)境中的第二節(jié)點(diǎn);和能夠?qū)⑿⌒陀?jì)算機(jī)系統(tǒng)界面復(fù)位命令轉(zhuǎn)換成存儲資源釋放命令的資源管理器。
21.根據(jù)權(quán)利要求20的系統(tǒng),其特征在于資源釋放命令包括第三方進(jìn)程退出。
22.根據(jù)權(quán)利要求20的系統(tǒng),其特征在于資源釋放命令包括使用清除操作的小型計(jì)算機(jī)系統(tǒng)界面持續(xù)保留的命令。
23.根據(jù)權(quán)利要求20的系統(tǒng),其特征在于該系統(tǒng)還包括用于存儲資源管理器的計(jì)算機(jī)可讀媒體;和一個(gè)以通信形式與計(jì)算機(jī)可讀媒體相連的、并能夠運(yùn)行資源管理器的中央處理單元。
24.根據(jù)權(quán)利要求23的系統(tǒng),其特征在于該系統(tǒng)還包括多個(gè)以通信形式與第一節(jié)點(diǎn)相連的計(jì)算機(jī)平臺;一以通信形式與第一節(jié)點(diǎn)相連的光纖信道交換機(jī);多個(gè)以通信形式與光纖信道交換機(jī)相連的存儲裝置。
25.根據(jù)權(quán)利要求24的系統(tǒng),其特征在于光纖信道交換機(jī)包括中央處理單元。
全文摘要
一種用于在群集計(jì)算環(huán)境中管理存儲資源的系統(tǒng)和方法。與本發(fā)明公開的技術(shù)相關(guān)的方法包括保留群集計(jì)算環(huán)境中第一節(jié)點(diǎn)的預(yù)留存儲資源。進(jìn)行第一節(jié)點(diǎn)的第三方進(jìn)程退出,釋放第一節(jié)點(diǎn)保留的預(yù)留資源。
文檔編號G06F17/30GK1319816SQ0111110
公開日2001年10月31日 申請日期2001年2月28日 優(yōu)先權(quán)日2000年3月9日
發(fā)明者A·H·塔韋爾, N·V·古延 申請人:戴爾產(chǎn)品有限公司