一種通過發送特定測試數據檢測raid卡內存顆粒良率的方法
【技術領域】
[0001]本發明涉及計算機服務器部件測試領域,具體地說是一種通過發送特定測試數據檢測RAID卡內存顆粒良率的方法。
【背景技術】
[0002]
近期市場上使用某個Raid卡產品,在多個服務器產品的正常運行過程中出現SignalECC Error的報錯,Raid卡出現報錯之后會引起系統宕機。
[0003]該款Raid卡在發生SignalECC Error的時候,是在使用較長時間才發生的,一段時間的使用才會有概率性的出現報錯。工廠的出貨檢測手段單一,只能在操作系統下使用Yes+DD的加壓軟件對Raid卡進行加壓測試,但無法覆蓋到底層顆粒的問題。
[0004]通過對故障Raid卡的分析排查,確認Nanya內存顆粒在Data信號與Clock信號Timing關系處理中存在延遲不夠。因此需要對于該顆粒內存的信號延遲進行專門測試,篩選Ra id卡。
【發明內容】
[0005]本發明的目的是克服現有技術中存在的不足,提供一種通過發送特定測試數據檢測RAID卡內存顆粒良率的方法。
[0006]本發明的技術方案是按以下方式實現的,其特點在于首先對Raid卡內存報錯原因進行分析,找到故障點,其次對故障原因有針對性的開發測試軟件強化數據包發送,檢查內存校驗數據的正確率,篩選內存顆粒的良率;
具體方法包括:
(1)對內存顆粒的Clock與Data傳輸機制進行檢查,明確內存顆粒報錯的原因;
(2)利用軟件對內存進行發包與接收的方式檢查內存處理數據正確率;
對不良Raid卡的根本原因進行分析:
從良品Raid卡與不良Raid卡的內存數據總線Data與clock波形進行對比,Data數據在lock信號下降沿的時候被識別;從Fail的波形分析,Clock下降沿與Data上升沿幾乎在一個Timing位置,導致Data數據不能被正確識別;
根據Raid卡上的控制芯片ECC數據校驗功能,通過發送特定bit的數據并讀取Bit數據來判定數據經過內存處理后是否有錯誤;
該測試程序的檢測原理:當Raid卡數據處理中發生了Data數據讀取錯誤,那就會發出一個ECC比特出錯記錄,該記錄被當作一個可更正的ECC報錯進行上報處理;當如果多個ECC比特出貨,就會變為不可糾正的ECC報錯進行上報;Raid卡FW在運算處理過程中得到實時的ECC報錯通知就會通過測試軟件打印出來,從而發現Raid卡不良。
[0007]本發明的優點是:
本發明的一種通過發送特定測試數據檢測RAID卡內存顆粒良率的方法和現有技術相比,通過內存顆粒DDR總線,借助ECC功能,對發送數據&接收數據進行對比,確認顆粒不良程度。具有設計合理、結構簡單、易于加工、使用方便等特點,因而,具有很好的使用價值。
[0008]實施方式
下面對本發明的一種通過發送特定測試數據檢測RAID卡內存顆粒良率的方法作以下詳細說明。
[0009]本發明的一種通過發送特定測試數據檢測RAID卡內存顆粒良率的方法,其特點在于首先對Raid卡內存報錯原因進行分析,找到故障點,其次對故障原因有針對性的開發測試軟件強化數據包發送,檢查內存校驗數據的正確率,篩選內存顆粒的良率;
具體方法包括:
(1)對內存顆粒的Clock與Data傳輸機制進行檢查,明確內存顆粒報錯的原因;
(2)利用軟件對內存進行發包與接收的方式檢查內存處理數據正確率。
[0010]本發明提出了一種通過發送特定測試數據檢測Raid卡內存顆粒良率的方法用于篩選解決不良Raid卡,滿足供貨需求。
[0011]本發明對不良Raid卡的根本原因進行分析:
從良品Raid卡與不良Raid卡的內存數據總線Data與clock波形進行對比,Data數據在lock信號下降沿的時候被識別。從Fail的波形分析,Clock下降沿與Data上升沿幾乎在一個T iming位置,導致Data數據不能被正確識別。
[0012]進行Raid卡的波形對比。
[0013]Raid卡上的控制芯片ECC數據校驗功能,通過發送特定bit的數據并讀取Bit數據來判定數據經過內存處理后是否有錯誤。
[0014]該測試程序的檢測原理:當Raid卡數據處理中發生了Data數據讀取錯誤,那就會發出一個ECC比特出錯記錄,該記錄被當作一個可更正的ECC報錯進行上報處理。當如果多個ECC比特出貨,就會變為不可糾正的ECC報錯進行上報。Raid卡FW在運算處理過程中得到實時的ECC報錯通知就會通過測試軟件打印出來,從而發現Raid卡不良。
[0015]通過發送特定的測試Pattern給DDR。
[0016]通過建一個RAID6的,在RAID6進行F1,對數據的ECC進行檢測。
[0017]測試軟件提示Pass,表示內存沒有發生顆粒不良。
[0018]通過公司在入廠測試階段增加此測試方法,能夠有效的發現Raid卡顆粒不良隱患,篩選出質量與穩定性更高的產品。
[0019]以上Raid卡測試驗證手段在公司針對該款Raid卡測試2000多例,篩選發現上百例不良部件,體現出較大的實際應用價值。
[0020]本發明的一種通過發送特定測試數據檢測RAID卡內存顆粒良率的方法其加工制作非常簡單方便,按照說明書所示即可加工。
[0021]除說明書所述的技術特征外,均為本專業技術人員的已知技術。
【主權項】
1.一種通過發送特定測試數據檢測RAID卡內存顆粒良率的方法,其特征在于首先對Raid卡內存報錯原因進行分析,找到故障點,其次對故障原因有針對性的開發測試軟件強化數據包發送,檢查內存校驗數據的正確率,篩選內存顆粒的良率; 具體方法包括: (1)對內存顆粒的Clock與Data傳輸機制進行檢查,明確內存顆粒報錯的原因; (2)利用軟件對內存進行發包與接收的方式檢查內存處理數據正確率; 對不良Raid卡的根本原因進行分析: 從良品Raid卡與不良Raid卡的內存數據總線Data與clock波形進行對比,Data數據在lock信號下降沿的時候被識別;從Fail的波形分析,Clock下降沿與Data上升沿幾乎在一個Timing位置,導致Data數據不能被正確識別; 根據Raid卡上的控制芯片ECC數據校驗功能,通過發送特定bit的數據并讀取Bit數據來判定數據經過內存處理后是否有錯誤; 該測試程序的檢測原理:當Raid卡數據處理中發生了Data數據讀取錯誤,那就會發出一個ECC比特出錯記錄,該記錄被當作一個可更正的ECC報錯進行上報處理;當如果多個ECC比特出貨,就會變為不可糾正的ECC報錯進行上報;Raid卡FW在運算處理過程中得到實時的ECC報錯通知就會通過測試軟件打印出來,從而發現Raid卡不良。
【專利摘要】本發明提供一種通過發送特定測試數據檢測RAID卡內存顆粒良率的方法,首先對Raid卡內存報錯原因進行分析,找到故障點,其次對故障原因有針對性的開發測試軟件強化數據包發送,檢查內存校驗數據的正確率,篩選內存顆粒的良率;本發明的一種通過發送特定測試數據檢測RAID卡內存顆粒良率的方法和現有技術相比,通過內存顆粒DDR總線,借助ECC功能,對發送數據&接收數據進行對比,確認顆粒不良程度。具有設計合理、結構簡單、易于加工、使用方便等特點,因而,具有很好的使用價值。
【IPC分類】G11C29/44, G11C29/42
【公開號】CN105551526
【申請號】CN201510893390
【發明人】張鋒
【申請人】浪潮電子信息產業股份有限公司
【公開日】2016年5月4日
【申請日】2015年12月8日