本技術涉及服務器,具體涉及一種數據處理系統、管理平臺及方法。
背景技術:
1、隨著內存的容量越來越大,內存的失效率越來越高,內存故障成為計算設備較為嚴重的故障源之一。相關技術在內存故障預測中,計算設備通常基于本地歷史時間段發生的內存故障的信息或專家規則進行內存故障的預測。然而,這種方法要求計算設備必須具有預測內存故障的功能,如果計算設備不支持內存故障預測,則無法應用這種方法,可見這種方式對計算設備的要求過高,應用的局限性過強。
技術實現思路
1、本技術實施例提供了一種數據處理系統、管理平臺及方法,能夠一定程度上降低要求計算設備具有預測內存故障故障的功能導致應用的局限性。所述技術方案如下。
2、第一方面,提供了一種數據處理系統,所述系統包括管理平臺以及至少一個計算設備;
3、所述計算設備包括第一接口和管理控制器,所述管理控制器與所述第一接口連接,所述第一接口用于與所述管理平臺連接,所述管理控制器用于通過所述第一接口向管理平臺發送第一協議報文,所述第一協議報文包括資源標識符以及內存故障信息,所述資源標識符包括內存的標識。
4、所述管理平臺包括第二接口,所述管理平臺用于通過所述第二接口接收來自所述計算設備的第一協議報文,基于所述計算設備的第一協議報文獲得所述計算設備的內存故障信息,基于所述計算設備的內存故障信息獲得特征集,基于所述特征集以及訓練后的內存故障預測模型,獲得針對所述計算設備的內存故障預測結果。
5、第一接口可以與管理平臺直接連接。第一接口也可以與管理平臺通過網絡連接。
6、通過對報文進行定義,從而能夠實現將內存故障信息傳輸到管理平臺,實現了對計算設備的內存故障進行集中管理,提高了預測精度。
7、在系統中包括一個計算設備的情況下,無需要求該計算設備具有內存故障預測的功能,也可以針對計算設備進行內存故障預測,因此一定程度上降低要求計算設備具有預測內存故障故障的功能導致應用的局限性。
8、在系統中包括多個計算設備的情況下,各個計算設備均可以通過向管理平臺上報本端的內存故障信息,因此能夠將多個計算設備的內存故障信息集中匯聚到管理平臺,支持平臺利用多個計算設備的內存故障信息集中式地進行預測。
9、在一種可能的實現中,所述資源標識符包括第一資源標識符,所述第一資源標識符用于指示內存故障相關的寄存器,所述內存故障信息包括所述寄存器中保存的數據。
10、通過對報文進行定義,從而能夠實現將內存故障相關的寄存器中保存的數據傳輸到管理平臺,實現了對計算設備的寄存器數據進行集中管理,有助于基于寄存器數據獲得更精確的預測結果。
11、在一種可能的實現中,所述內存故障信息包括內存故障相關的寄存器中保存的數據,所述管理平臺,還用于對所述寄存器中保存的數據進行解析,得到內存中出現的錯誤、突發傳輸burst以及數位線dq之間的對應關系,基于所述錯誤、burst以及dq之間的對應關系獲得特征集。
12、不同burst指向內存芯片中的不同的列(column),不同dq指向存儲單元(cell)中的不同比特,因此burst以及dq相當于兩種細化的空間特征,通過burst以及dq均能較為精細地描述錯誤在內存中所處的物理位置,通過利用錯誤、burst以及dq之間的對應關系獲得特征集,由于預測時利用的特征精細到burst以及dq的維度,因此提高了故障預測結果的精確性。
13、在一種可能的實現中,所述管理平臺為應用軟件,所述第二接口為軟件接口,運行所述管理平臺的設備包括物理接口,所述物理接口與所述計算設備的所述第一接口連接,所述物理接口用于接收所述第一協議報文,將所述第一協議報文通過所述軟件接口發送至所述管理平臺;或者,所述管理平臺為運行有應用軟件的設備,所述第二接口包括物理接口和軟件接口,所述物理接口與所述計算設備的所述第一接口連接,所述物理接口用于接收所述第一協議報文,將所述第一協議報文通過所述軟件接口發送至所述管理平臺。
14、通過上述方式,支持通過軟件或者硬件的方式將內存故障信息傳輸到管理平臺,適配更多應用場景。
15、在一種可能的實現中,所述資源標識符包括第二資源標識符,所述第二資源標識符用于指示burst以及dq,所述內存故障信息包括所述內存中出現的錯誤、burst以及dq之間的對應關系。
16、通過對報文進行定義,從而能夠實現將錯誤、burst以及dq之間的對應關系傳輸到管理平臺,支持平臺利用錯誤、burst以及dq之間的對應關系提取特征并進行內存故障預測,由于預測時利用的特征精細到burst以及dq的維度,因此提高了故障預測結果的精確性。
17、在一種可能的實現中,所述特征集包括burst特征,所述burst特征用于描述多個burst中錯誤分布的密集程度,所述管理平臺,用于執行下述至少一項:
18、對所述內存故障信息中burst相鄰的錯誤進行計數,得到所述burst特征;
19、對所述內存故障信息中不同錯誤的burst間隔進行計數,得到所述burst特征;
20、對所述內存故障信息中burst間隔最遠的錯誤進行計數,得到所述burst特征;
21、對所述內存故障信息中不同錯誤的burst間隔進行計數,獲取計數結果的統計值,得到所述burst特征,所述統計值包括最大值、最小值、平均值、中位數、差分值、總和、標準偏差中至少一項。
22、由于burst相鄰的錯誤體現了錯誤在burst維度的集中度,burst相鄰的錯誤數量越多,錯誤在burst維度越集中或者說越密集,因此通過對burst相鄰的錯誤進行計數,使得獲得的burst特征能夠定量化地描述錯誤在burst維度的集中度,例如描述發生錯誤且相鄰的burst的多少,進而有助于特征更精確地描述錯誤的影響。
23、由于burst間隔體現了不同錯誤在burst維度遠近的程度,如果內存故障信息中的各個錯誤之間的burst間隔都比較大,表明不同錯誤在burst維度分布較為隨機松散,也即是不同錯誤在burst維度分布的密度較小,錯誤的嚴重程度較低。如果內存故障信息中的各個錯誤之間的burst間隔都比較小,表明不同錯誤在burst維度分布較為密集,錯誤的嚴重程度較大。因此,通過對錯誤之間的burst間隔進行計數,使得獲得的burst特征能夠定量化地描述錯誤在burst維度的集中度,且定量化地描述burst維度的距離的遠近,因此有助于特征更精確地描述錯誤的影響。
24、通過將統計值作為burst特征,相當于利用已經得到的特征值生成了新的特征值,從而進一步豐富了預測時利用的特征,因此有助于提高預測的精確性。
25、在一種可能的實現中,所述特征集包括dq特征,所述dq特征用于描述多個dq中錯誤分布的密集程度,所述管理平臺,用于執行下述至少一項:
26、對所述內存故障信息中dq相鄰的錯誤進行計數,得到所述dq特征;
27、對所述內存故障信息中不同錯誤的dq間隔進行計數,得到所述dq特征;
28、對所述內存故障信息中dq間隔最遠的錯誤進行計數,得到所述dq特征;
29、對所述內存故障信息中不同錯誤的dq間隔進行計數,獲取計數結果的統計值,得到所述dq特征,所述統計值包括最大值、最小值、平均值、中位數、差分值、總和、標準偏差中至少一項。
30、由于dq相鄰的錯誤體現了錯誤在dq維度的集中度,dq相鄰的錯誤數量越多,錯誤在dq維度越集中或者說越密集,因此通過對dq相鄰的錯誤進行計數,使得獲得的dq特征能夠定量化地描述錯誤在dq維度的集中度,例如描述發生錯誤且相鄰的dq的多少,進而有助于特征更精確地描述錯誤的影響。
31、由于dq間隔體現了不同錯誤在dq維度遠近的程度,如果內存故障信息中的各個錯誤之間的dq間隔都比較大,表明不同錯誤在dq維度分布較為隨機松散,也即是不同錯誤在dq維度分布的密度較小,錯誤的嚴重程度較低。如果內存故障信息中的各個錯誤之間的dq間隔都比較小,表明不同錯誤在dq維度分布較為密集,錯誤的嚴重程度較大。因此,通過對錯誤之間的dq間隔進行計數,使得獲得的dq特征能夠定量化地描述錯誤在dq維度的集中度,且定量化地描述dq維度的距離的遠近,因此有助于特征更精確地描述錯誤的影響。
32、通過將統計值作為dq特征,相當于利用已經得到的特征值生成了新的特征值,從而進一步豐富了預測時利用的特征,因此有助于提高預測的精確性。
33、在一種可能的實現中,所述特征集包括組合特征,所述管理平臺,用于獲取所述內存故障信息中不同錯誤在burst維度的距離以及dq維度的距離;基于所述burst維度的距離以及所述dq維度的距離,獲得所述不同錯誤的組合距離;基于所述組合距離獲得所述組合特征。
34、由于組合距離體現了不同錯誤在burst和dq兩個維度遠近的程度,如果內存故障信息中的各個錯誤之間的組合距離都比較大,表明不同錯誤在burst和dq兩個維度分布整體較為隨機松散。如果內存故障信息中的各個錯誤之間的組合距離都比較小,表明不同錯誤在burst和dq兩個維度整體分布較為密集,組合特征能夠定量化地描述錯誤在burst和dq兩個維度的集中度和距離的遠近,因此有助于特征更精確地描述錯誤的影響。
35、在一種可能的實現中,所述特征集包括第一掩碼的特征以及第二掩碼的特征中至少一項;
36、所述管理平臺,用于基于所述內存故障信息生成第一掩碼,所述第一掩碼的每個元素對應于所述多個dq中的一個dq,所述第一掩碼的每個元素的值表示對應dq是否存在錯誤;對所述第一掩碼中相鄰的錯誤進行計數,得到所述第一掩碼的特征;或者,對所述第一掩碼中錯誤的間隔進行計數,得到所述第一掩碼的特征;或者,
37、所述管理平臺,用于基于所述內存故障信息生成第二掩碼,所述第二掩碼的每個元素對應于所述多個burst中的一個burst,所述第二掩碼的每個元素的值表示對應burst是否存在錯誤;對所述第二掩碼中相鄰的錯誤進行計數,得到所述第二掩碼的特征;或者,對所述第二掩碼中錯誤的間隔進行計數,得到所述第二掩碼的特征。
38、由于基于掩碼中相鄰的錯誤或者錯誤的間隔作為特征集,特征集能夠精確地描述不同錯誤在dq維度的空間位置關系以及burst維度的空間位置關系,此外特征集中包含的特征也更加豐富,因此基于特征集進行預測時預測結果更加精確。
39、在一種可能的實現中,所述管理平臺,還用于向所述計算設備發送第二協議報文,所述第二協議報文包括所述第一資源標識符以及第一讀命令,所述第一讀命令指示讀取所述寄存器中保存的數據。
40、由于管理平臺主動讀取計算設備上寄存器保存的數據,使得計算設備無需實時上報寄存器保存的數據,而是等到接收到管理平臺的讀命令的情況下上報寄存器保存的數據,從而減少上報寄存器保存的數據帶來的處理壓力。
41、在一種可能的實現中,所述計算設備,還用于對內存故障相關的寄存器中保存的數據進行解析,得到所述錯誤、burst以及dq之間的對應關系。
42、由于計算設備解析寄存器的數據,從而節省平臺解析數據造成的處理壓力,此外支持平臺基于解析得到的錯誤、burst以及dq之間的對應關系進行故障預測。
43、在一種可能的實現中,所述管理平臺,還用于向所述計算設備發送第二協議報文,所述第二協議報文包括所述第二資源標識符以及第二讀命令,所述第二讀命令指示讀取所述錯誤、burst以及dq之間的對應關系。
44、由于管理平臺主動讀取計算設備錯誤、burst以及dq之間的對應關系,使得計算設備無需實時上報錯誤、burst以及dq之間的對應關系,而是等到接收到管理平臺的讀命令的情況下上報錯誤、burst以及dq之間的對應關系,從而減少上報錯誤、burst以及dq之間的對應關系。
45、在一種可能的實現中,所述內存故障信息包括所述錯誤的時間信息,所述特征集包括時間特征,所述管理平臺,用于執行下述至少一項:
46、基于所述時間信息獲得每個錯誤的產生時間點,作為時間特征;
47、基于所述時間信息獲得不同錯誤的產生時間點之間的時間差,作為時間特征;
48、基于所述時間信息獲得不同時間窗內產生的錯誤數量,作為時間特征;
49、基于所述時間信息獲得不同時間窗內錯誤隨著時間的增長速率,作為時間特征;
50、基于所述時間信息獲得不同時間窗內錯誤的出現頻率,作為時間特征。
51、平臺通過根據時間信息提取特征,使得特征集能夠描述出不同錯誤的時間分布,由于預測時考慮了錯誤的時間分布,從而提高故障預測的精確性。
52、第二方面,提供了一種管理平臺,與至少一個計算設備通信連接,所述計算設備包括第一接口和管理控制器,所述管理控制器與所述第一接口連接,所述管理平臺包括第二接口,所述第一接口與所述第二接口連接;
53、所述管理平臺用于通過所述第二接口接收來自所述計算設備的第一協議報文,基于所述計算設備的第一協議報文獲得所述計算設備的內存故障信息,基于所述計算設備的內存故障信息獲得特征集,基于所述特征集以及訓練后的內存故障預測模型,獲得針對所述計算設備的內存故障預測結果,其中,所述第一協議報文由所述管理控制器通過所述第一接口向管理平臺發送,所述第一協議報文包括資源標識符以及內存故障信息,所述資源標識符包括內存的標識。
54、管理平臺通過收集管理的計算設備上與內存故障信息,實現了對計算設備的內存故障進行集中管理,預測時可以參考至少一個計算設備的內存故障信息,提高了預測精度,此外無需要求計算設備具有內存故障預測的功能,也可以針對計算設備進行內存故障預測,因此一定程度上降低要求計算設備具有預測內存故障故障的功能導致應用的局限性。
55、在一種可能的實現中,所述資源標識符包括第一資源標識符,
56、所述第一資源標識符用于指示內存故障相關的寄存器,所述內存故障信息包括所述寄存器中保存的數據。
57、在一種可能的實現中,所述內存故障信息包括內存故障相關的寄存器中保存的數據,所述管理平臺,還用于對所述寄存器中保存的數據進行解析,得到內存中出現的錯誤、突發傳輸burst以及數位線dq之間的對應關系,基于所述錯誤、burst以及dq之間的對應關系獲得特征集。
58、在一種可能的實現中,所述管理平臺為應用軟件,所述第二接口為軟件接口,運行所述管理平臺的設備包括物理接口,所述物理接口與所述計算設備的所述第一接口連接,所述物理接口用于接收所述第一協議報文,將所述第一協議報文通過所述軟件接口發送至所述管理平臺;或者,
59、所述管理平臺為運行有應用軟件的設備,所述第二接口包括物理接口和軟件接口,所述物理接口與所述計算設備的所述第一接口連接,所述物理接口用于接收所述第一協議報文,將所述第一協議報文通過所述軟件接口發送至所述管理平臺。
60、在一種可能的實現中,所述資源標識符包括第二資源標識符,所述第二資源標識符用于指示burst以及dq,所述內存故障信息包括所述內存中出現的錯誤、burst以及dq之間的對應關系。
61、在一種可能的實現中,所述特征集包括burst特征,所述burst特征用于描述多個burst中錯誤分布的密集程度,所述管理平臺,用于執行下述至少一項:
62、對所述內存故障信息中burst相鄰的錯誤進行計數,得到所述burst特征;
63、對所述內存故障信息中不同錯誤的burst間隔進行計數,得到所述burst特征;
64、對所述內存故障信息中burst間隔最遠的錯誤進行計數,得到所述burst特征;
65、對所述內存故障信息中不同錯誤的burst間隔進行計數,獲取計數結果的統計值,得到所述burst特征,所述統計值包括最大值、最小值、平均值、中位數、差分值、總和、標準偏差中至少一項。
66、在一種可能的實現中,所述特征集包括dq特征,所述dq特征用于描述多個dq中錯誤分布的密集程度,所述管理平臺,用于執行下述至少一項:
67、對所述內存故障信息中dq相鄰的錯誤進行計數,得到所述dq特征;
68、對所述內存故障信息中不同錯誤的dq間隔進行計數,得到所述dq特征;
69、對所述內存故障信息中dq間隔最遠的錯誤進行計數,得到所述dq特征;
70、對所述內存故障信息中不同錯誤的dq間隔進行計數,獲取計數結果的統計值,得到所述dq特征,所述統計值包括最大值、最小值、平均值、中位數、差分值、總和、標準偏差中至少一項。
71、在一種可能的實現中,所述特征集包括組合特征,所述管理平臺,用于獲取所述內存故障信息中不同錯誤在burst維度的距離以及dq維度的距離;基于所述burst維度的距離以及所述dq維度的距離,獲得所述不同錯誤的組合距離;基于所述組合距離獲得所述組合特征。
72、在一種可能的實現中,所述特征集包括第一掩碼的特征以及第二掩碼的特征中至少一項;
73、所述管理平臺,用于基于所述內存故障信息生成第一掩碼,所述第一掩碼的每個元素對應于所述多個dq中的一個dq,所述第一掩碼的每個元素的值表示對應dq是否存在錯誤;對所述第一掩碼中相鄰的錯誤進行計數,得到所述第一掩碼的特征;或者,對所述第一掩碼中錯誤的間隔進行計數,得到所述第一掩碼的特征;或者,
74、所述管理平臺,用于基于所述內存故障信息生成第二掩碼,所述第二掩碼的每個元素對應于所述多個burst中的一個burst,所述第二掩碼的每個元素的值表示對應burst是否存在錯誤;對所述第二掩碼中相鄰的錯誤進行計數,得到所述第二掩碼的特征;或者,對所述第二掩碼中錯誤的間隔進行計數,得到所述第二掩碼的特征。
75、在一種可能的實現中,所述管理平臺,還用于向所述計算設備發送第二協議報文,所述第二協議報文包括所述第一資源標識符以及第一讀命令,所述第一讀命令指示讀取所述寄存器中保存的數據。
76、在一種可能的實現中,所述計算設備,還用于對內存故障相關的寄存器中保存的數據進行解析,得到所述錯誤、burst以及dq之間的對應關系。
77、在一種可能的實現中,所述管理平臺,還用于向所述計算設備發送第二協議報文,所述第二協議報文包括所述第二資源標識符以及第二讀命令,所述第二讀命令指示讀取所述錯誤、burst以及dq之間的對應關系。
78、在一種可能的實現中,所述內存故障信息包括所述錯誤的時間信息,所述特征集包括時間特征,所述管理平臺,用于執行下述至少一項:
79、基于所述時間信息獲得每個錯誤的產生時間點,作為時間特征;
80、基于所述時間信息獲得不同錯誤的產生時間點之間的時間差,作為時間特征;
81、基于所述時間信息獲得不同時間窗內產生的錯誤數量,作為時間特征;
82、基于所述時間信息獲得不同時間窗內錯誤隨著時間的增長速率,作為時間特征;
83、基于所述時間信息獲得不同時間窗內錯誤的出現頻率,作為時間特征。
84、第三方面,提供了一種內存故障的預測方法,由管理平臺執行,所述管理平臺與至少一個計算設備通信連接,所述計算設備包括第一接口和管理控制器,所述管理控制器與所述第一接口連接,所述管理平臺包括第二接口,所述第一接口與所述第二接口連接;
85、所述方法包括:
86、通過所述第二接口接收來自至少一個計算設備的第一協議報文,所述第一協議報文包括資源標識符以及內存故障信息,所述資源標識符包括內存的標識;
87、基于所述計算設備的第一協議報文獲得所述計算設備的內存故障信息,基于所述計算設備的內存故障信息獲得特征集,基于所述特征集以及訓練后的內存故障預測模型,獲得針對所述計算設備的內存故障預測結果。
88、根據第三方面提供的方法,管理平臺收集管理的至少一個計算設備上與內存故障有關的信息,基于收集到的信息預測計算設備在未來發生內存故障的可能性,實現了對計算設備的內存故障進行集中管理,無需要求計算設備具有內存故障預測的功能,也可以針對計算設備進行內存故障預測,因此一定程度上降低要求計算設備具有預測內存故障故障的功能導致應用的局限性。此外,預測時可以參考至少一個計算設備的內存故障信息,提高了預測精度。
89、在一種可能的實現中,所述內存故障信息用于指示內存中出現的錯誤、突發傳輸burst以及數位線dq之間的對應關系;
90、基于所述內存故障信息獲得特征集,所述特征集包括burst特征以及dq特征中至少一項,所述burst特征用于描述多個burst中錯誤分布的密集程度,所述dq特征用于描述多個dq中錯誤分布的密集程度;
91、基于所述特征集,預測所述計算設備內存發生故障的概率。
92、在一種可能的實現中,所述資源標識符包括第一資源標識符,
93、所述第一資源標識符用于指示內存故障相關的寄存器,所述內存故障信息包括所述寄存器中保存的數據。
94、在一種可能的實現中,所述資源標識符包括第二資源標識符,所述第二資源標識符用于指示burst以及dq,所述內存故障信息包括所述內存中出現的錯誤、burst以及dq之間的對應關系。
95、在一種可能的實現中,所述特征集包括burst特征,所述burst特征用于描述多個burst中錯誤分布的密集程度,所述基于所述內存故障信息獲得特征集,包括以下至少一項:
96、對所述內存故障信息中burst相鄰的錯誤進行計數,得到所述burst特征;
97、對所述內存故障信息中不同錯誤的burst間隔進行計數,得到所述burst特征;
98、對所述內存故障信息中burst間隔最遠的錯誤進行計數,得到所述burst特征;
99、對所述內存故障信息中不同錯誤的burst間隔進行計數,獲取計數結果的統計值,得到所述burst特征,所述統計值包括最大值、最小值、平均值、中位數、差分值、總和、標準偏差中至少一項。
100、在一種可能的實現中,所述特征集包括dq特征,所述dq特征用于描述多個dq中錯誤分布的密集程度,所述基于所述內存故障信息獲得特征集,包括以下至少一項:
101、對所述內存故障信息中dq相鄰的錯誤進行計數,得到所述dq特征;
102、對所述內存故障信息中不同錯誤的dq間隔進行計數,得到所述dq特征;
103、對所述內存故障信息中dq間隔最遠的錯誤進行計數,得到所述dq特征;
104、對所述內存故障信息中不同錯誤的dq間隔進行計數,獲取計數結果的統計值,得到所述dq特征,所述統計值包括最大值、最小值、平均值、中位數、差分值、總和、標準偏差中至少一項。
105、在一種可能的實現中,所述特征集包括組合特征,所述基于所述內存故障信息獲得特征集,包括:
106、獲取所述內存故障信息中不同錯誤在burst維度的距離以及dq維度的距離;
107、基于所述burst維度的距離以及所述dq維度的距離,獲得所述不同錯誤的組合距離;
108、基于所述組合距離獲得所述組合特征。
109、在一種可能的實現中,所述內存故障信息包括內存故障相關的寄存器中保存的數據,所述基于所述內存故障信息獲得特征集,包括:
110、對所述寄存器中保存的數據進行解析,得到內存中出現的錯誤、突發傳輸burst以及數位線dq之間的對應關系;
111、基于所述錯誤、burst以及dq之間的對應關系獲得特征集。
112、在一種可能的實現中,所述管理平臺,還用于向所述計算設備發送第二協議報文,所述第二協議報文包括所述第一資源標識符以及第一讀命令,所述第一讀命令指示讀取所述寄存器中保存的數據。
113、在一種可能的實現中,所述接收來自計算設備的內存故障信息之前,所述方法還包括:
114、向所述計算設備發送第二協議報文,所述第二協議報文包括所述第二資源標識符以及第二讀命令,所述第二讀命令指示讀取所述錯誤、burst以及dq之間的對應關系。
115、在一種可能的實現中,所述特征集包括第一掩碼的特征,所述基于所述內存故障信息獲得特征集,包括:
116、基于所述內存故障信息生成第一掩碼,所述第一掩碼的每個元素對應于所述多個dq中的一個dq,所述第一掩碼的每個元素的值表示對應dq是否存在錯誤;
117、對所述第一掩碼中相鄰的錯誤進行計數,得到所述第一掩碼的特征;或者,對所述第一掩碼中錯誤的間隔進行計數,得到所述第一掩碼的特征。
118、在一種可能的實現中,所述特征集還包括第二掩碼的特征,所述基于所述內存故障信息獲得特征集,包括:
119、基于所述內存故障信息生成第二掩碼,所述第二掩碼的每個元素對應于所述多個burst中的一個burst,所述第二掩碼的每個元素的值表示對應burst是否存在錯誤;
120、對所述第二掩碼中相鄰的錯誤進行計數,得到所述第二掩碼的特征;或者,對所述第二掩碼中錯誤的間隔進行計數,得到所述第二掩碼的特征。
121、在一種可能的實現中,所述內存故障信息包括所述錯誤的時間信息,所述特征集包括時間特征,所述基于所述內存故障信息獲得特征集,包括:
122、基于所述時間信息獲得每個錯誤的產生時間點,作為時間特征;
123、基于所述時間信息獲得不同錯誤的產生時間點之間的時間差,作為時間特征;
124、基于所述時間信息獲得不同時間窗內產生的錯誤數量,作為時間特征;
125、基于所述時間信息獲得不同時間窗內錯誤隨著時間的增長速率,作為時間特征;
126、基于所述時間信息獲得不同時間窗內錯誤的出現頻率,作為時間特征。