一種利用raid卡批量檢測硬盤監控和報警的方法
【專利說明】一種利用RAID卡批量檢測硬盤監控和報警的方法
[0001]
技術領域
[0002]本發明涉及硬盤檢測技術,具體的說是一種利用RAID卡批量檢測硬盤監控和報警的方法。
【背景技術】
[0003]隨著計算機技術的提升和業務的發展,以及數據中心業務量的不斷增加,數據存儲量也越來越大,要求服務器存儲系統的密度也在增加,硬盤的數量也越來越大,出現故障也很難避免,一旦某塊硬盤出現故障,通常會嚴重影響機器的正常運行。
[0004]客戶大批量購買使用服務器對公司的發展是有利的,但是從另一個方面,也要求技術人員能夠快速判斷檢測硬件是否有故障問題。面對滿機房成百上千甚至更多的服務器,如何快速檢測定位出有隱患或者故障的硬盤是急需解決的問題。
【發明內容】
[0005]本發明針對目前需求以及現有技術發展的不足之處,提供一種利用RAID卡批量檢測硬盤監控和報警的方法。
[0006]本發明所述一種利用RAID卡批量檢測硬盤監控和報警的方法,解決上述技術問題采用的技術方案如下:所述批量檢測硬盤監控和報警的方法,通過腳本分析RAID卡日志,進行批量機器的硬盤批量檢查,定位出有故障或者有故障隱患的硬盤;該方法的主要步驟包括:第一、在服務器Iinux系統下預先安裝開機自動啟動的腳本,第二、服務器正常開機后,腳本自動執行后輸出所有硬盤的狀態,分析檢測故障或隱患硬盤的情況,第三、若發現有故障或隱患的硬盤,則讓RAID卡對該硬盤發出定位指令,使該硬盤指示燈閃爍。
[0007]優選的,所述腳本集成了 Megacli和Arcconf兩個工具,這兩個工具能夠分別管理LSI 和 ADAPTREC 兩種 RAID 卡。
[0008]優選的,服務器正常開機后,腳本自動執行收集RAID卡的日志,輸出所有硬盤的狀態,若硬盤的media error和pred fail count不為0,則對該硬盤執行locate命令使得該硬盤閃爍。
[0009]本發明的一種利用RAID卡批量檢測硬盤監控和報警的方法與現有技術相比具有的有益效果是:該方法通過腳本分析RAID卡日志,對服務器硬盤批量檢查,能夠快速確認故障硬盤,顯著提高了硬盤故障確定率,以便及時更換故障或隱患硬盤,提高了系統的穩定性和高效性,并且該方法能夠定制化腳本,來適合不同服務器的硬盤配置環境;使用該方法進行硬盤故障監控和報警,整個操作實現過程簡單快捷,極大提高了產品的競爭力。
【附圖說明】
[0010]附圖1:所述利用RAID卡批量檢測硬盤監控和報警的方法的流程圖。
【具體實施方式】
[0011]為使本發明的目的、技術方案和優點更加清楚明白,以下結合具體實施例,并參照附圖,對本發明所述一種利用RAID卡批量檢測硬盤監控和報警的方法進一步詳細說明。
[0012]本發明所述一種利用RAID卡批量檢測硬盤監控和報警的方法,通過腳本分析RAID卡日志,進行批量機器的硬盤批量檢查,定位出有故障或者有故障隱患的硬盤;通過該方法能夠在服務器開機的瞬間,檢測出哪些硬盤有故障或者隱患,從而快速恢復故障或者排除隱患硬盤,為客戶后期平穩運行提供保障。
[0013]該利用RAID卡批量檢測硬盤監控和報警的方法的執行步驟包括:第一、在服務器設備內預先安裝好Iinux系統,第二、在Iinux系統下預先安裝腳本,具有開機自動啟動的功能,第三、服務器正常開機后,自動執行腳本后輸出所有硬盤的狀態,分析檢測哪些硬盤是有故障或者隱患的,第四、若發現有故障或隱患的硬盤,則讓RAID卡對該硬盤發出定位指令,使該硬盤指示燈閃爍,能夠準確判斷出哪些硬盤故障或者隱患。
[0014]實施例:
本實施例所述一種利用RAID卡批量檢測硬盤監控和報警的方法,由于RAID卡本身都對硬盤的磁頭單元、硬盤溫度、盤片表面介質材料、馬達及其驅動系統、硬盤內部電路等進行監測,能夠及時分析并預報硬盤可能發生的問題,RAID卡是硬盤的一個預警損害系統。當各屬性某個數據接近(小于)或達到關鍵階段值,則表示硬盤臨近報廢,或者是超過它的設計使用極限了,相關人員應該對問題硬盤及時做備份或更換。
[0015]本實施例所述批量檢測硬盤監控和報警的方法,具體執行步驟如下:
步驟一,在服務器設備內預先安裝好Iinux系統,內嵌到Iinux系統下一個腳本,該腳本具有開機自啟動的功能,集成了 MegacIi和Arcconf兩個工具,這兩個工具可以分別管理LSI 和 ADAPTREC 兩種 RAID 卡;
步驟二,服務器正常開機后,自動腳本執行收集RAID卡的日志,輸出所有硬盤的狀態,一旦發現有硬盤的media error和pred fail count不為0,則對該硬盤執行locate命令使得該硬盤閃爍,能夠快速定位出故障硬盤,進而更換有潛在隱患的硬盤,如附圖1所示。
[0016]本實施例所述批量檢測硬盤監控和報警的方法,所使用腳本shell.Sh如下(以LSI的RAID卡為例):
#!/bin/bash
rpm -1 MegaCl1-*.noarch, rpm # 安裝 megacli 軟件megacl1-LdPdInfo -aALL > MgLdPdInfo # 收集所有硬盤信息for (i=0, I, i++)
{if (media error ! =0||pred fail count ! =0)locate pd i
}
#讓有故障或者隱患的硬盤閃爍。此外,所述腳本可定制化,以適合不同服務器的硬盤配置環境。
[0017]上述【具體實施方式】僅是本發明的具體個案,本發明的專利保護范圍包括但不限于上述【具體實施方式】,任何符合本發明的權利要求書的且任何所屬技術領域的普通技術人員對其所做的適當變化或替換,皆應落入本發明的專利保護范圍。
【主權項】
1.一種利用RAID卡批量檢測硬盤監控和報警的方法,其特征在于,通過腳本分析RAID卡日志,進行批量機器的硬盤批量檢查,定位出有故障或者有故障隱患的硬盤;該方法的主要步驟包括:第一、在服務器Iinux系統下預先安裝開機自動啟動的腳本,第二、月艮務器正常開機后,腳本自動執行后輸出所有硬盤的狀態,分析檢測故障或隱患硬盤的情況,第三、若發現有故障或隱患的硬盤,則讓RAID卡對該硬盤發出定位指令,使該硬盤指示燈閃爍。2.根據權利要求1所述一種利用RAID卡批量檢測硬盤監控和報警的方法,其特征在于,所述腳本集成了 Megacli和Arcconf兩個工具,這兩個工具能夠分別管理LSI和ADAPTREC 兩種 RAID 卡。3.根據權利要求2所述一種利用RAID卡批量檢測硬盤監控和報警的方法,其特征在于,服務器正常開機后,腳本自動執行收集RAID卡的日志,輸出所有硬盤的狀態,若硬盤的media error和pred fail count不為0,則對該硬盤執行locate命令使得該硬盤閃爍。
【專利摘要】本發明公開一種利用RAID卡批量檢測硬盤監控和報警的方法,涉及硬盤檢測技術,通過腳本分析RAID卡日志,進行批量機器的硬盤批量檢查,定位出有故障或者有故障隱患的硬盤;該方法的主要步驟包括:第一、在服務器linux系統下預先安裝開機自動啟動的腳本,第二、服務器正常開機后,腳本自動執行后輸出所有硬盤的狀態,分析檢測故障或隱患硬盤的情況,第三、若發現有故障或隱患的硬盤,則讓RAID卡對該硬盤發出定位指令,使該硬盤指示燈閃爍。通過該方法能夠對服務器硬盤批量檢查,快速確認故障硬盤,以便及時更換故障或隱患硬盤,提高了系統的穩定性和高效性。
【IPC分類】G06F11/22
【公開號】CN105045689
【申請號】CN201510356477
【發明人】姜政君, 陳彬, 任華進
【申請人】浪潮電子信息產業股份有限公司
【公開日】2015年11月11日
【申請日】2015年6月25日