本發明屬于計算機領域,尤其涉及一種nfv系統可用性測試方法及裝置。
背景技術:
nfv,即網絡功能虛擬化,是運營商提出并主導的下一代網絡構建解決方案,旨在通過使用x86等通用硬件以及虛擬化技術,來承載愈來愈多的移動網絡功能軟件。
傳統的可用性測試技術是通過在線跟蹤的方法,將多臺同配置的待測系統并行的連續運行相當長一段時間,并記錄此間系統的失效個數,而后計算失效系統個數百分比,此百分比即為該段時間內被測系統的可靠度。對于可維修系統,記錄各個系統出現故障的時間間隔以及用于恢復故障的時間,計算瓶頸值得到平均故障間隔指標mttf(meantimetofailure)和平均修復時間指標mttr(meantimetorecover),進而計算穩態可用度。
nfv系統采用容錯設計策略,可用性高,造價較高,大批量并行測試成本高,且在線跟蹤測試方法測試時間過長。因此,迫切需要提供一種可用性測試方案,解決測試時間有限的問題。
技術實現要素:
本發明提供一種nfv系統可用性測試方法及裝置,以解決上述問題。
本發明提供一種nfv系統可用性測試方法。上述方法包括以下步驟:
確定系統的可更換部件的冗余度;
對所述可更換部件進行平均失效工作時間測評和平均恢復時間測評;
根據所述可更換部件的測評結果獲取所述系統的可用性評測結果;
其中,所述平均失效工作時間是可更換部件在相繼兩次失效間運行的平均持續時間,所述平均恢復時間是在可更換部件失效后恢復運行所需要的平均持續時間。
本發明還提供一種nfv系統可用性測試裝置,包括:冗余度確定單元,第一測試單元和第二測試單元,其中,所述冗余度確定單元與所述第一測試單元連接,所述第一測試單元與所述第二測試單元連接,
所述冗余度確定單元,用于確定系統的可更換部件的冗余度;
所述第一測試單元,用于對所述可更換部件進行平均失效工作時間測評和平均恢復時間測評;
所述第二測試單元,用于根據所述可更換部件的測評結果獲取所述系統的可用性評測結果;
其中,所述平均失效工作時間是可更換部件在相繼兩次失效間運行的平均持續時間,所述平均恢復時間是在可更換部件失效后恢復運行所需要的平均持續時間。
通過以下方案:確定系統的可更換部件的冗余度,對所述更換部件進行平均失效工作時間測評和平均恢復時間測評,根據可更換部件的測評結果獲取系統的可用性評測結果可,通過在相對短的時間內對冗余部件進行mttr測試和mtbf測試,通過mttr和mtbf的值完成整個系統的可用性測評,不需要長時間在線測測的方法測量全系統可用性指標,解決成本高及測試時間有限的問題。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
圖1所示為本發明實施例1的nfv系統可用性測試方法處理流程圖;
圖2所示為本發明實施例2的nfv系統可用性測試方法處理流程圖;
圖3所示為本發明實施例4的nfv系統可用性測試裝置結構圖。
具體實施方式
下文中將參考附圖并結合實施例來詳細說明本發明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。
圖1所示為本發明實施例1的nfv系統可用性測試方法處理流程圖,包括以下步驟:
步驟102:確定系統的可更換部件的冗余度。
步驟104:對所述可更換部件進行平均失效工作時間測評和平均恢復時間測評。
步驟106:根據所述可更換部件的測評結果獲取所述系統的可用性評測結果。
其中,所述平均失效工作時間(mtbf)是可更換部件在相繼兩次失效間運行的平均持續時間,所述平均恢復時間(mttr)是在可更換部件失效后恢復運行所需要的平均持續時間。
平均失效工作時間mtbf(meantimebetweenfailure),在給定條件下,功能單元相繼兩次失效間運行的平均持續時間。
平均恢復時間mttr(meantimetorecovery),對于給定的功能單元,失效后恢復運行所需要的平均持續時間。
對于nfv冗余系統,若其冗余部件的mttr和mtbf可以通過測試獲得,則可通過在相對短的時間內對冗余部件進行mttr測試和mtbf測試,通過mttr和mtbf的值完成整個系統的可用性測評,不需要長時間在線測試的方法測量全系統可用性指標。
進一步地,所述平均恢復時間包括更換時間和服務能力恢復時間。
進一步地,所述平均失效工作時間mebf的計算方式是mebf=nt/f,其中,n是所述可更換部件的數量,t是預設測試時間段,f是在所述測試時間段內發生故障的可更換部件的數量。
進一步地,確定系統的可更換部件,包括:
通過故障注入手段驗證所述系統對于給定故障集的隔離能力,以將目標系統劃分為多個能夠隔離故障、且不相關的功能子系統;
確定所述功能子系統中的可更換部件的冗余度,所述冗余度包括所述可更換部件的數量以及可接受的可更換部件的失效個數。
進一步地,根據所述可更換部件的測評結果獲取所述系統的可用性評測結果,包括:
根據所述可更換部件的測評結果獲取各功能子系統的可用性數據;
根據所述各功能子系統的可用性數據獲取所述系統的可用性評測結果。
圖2所示為本發明實施例2的nfv系統可用性測試方法處理流程圖。
如圖2所示,步驟202,考察目標系統的體系結構。通過故障注入等手段驗證測試目標系統對于給定故障集的隔離能力,從而將目標系統劃分為若干個能夠隔離故障、且不相關的功能子系統。
步驟204,測試功能子系統內部現場可更換部件fru的冗余度。將故障注入方法和負載壓力相結合,測試上述劃分的功能子系統內部fru部件的冗余度,即測試維持某個功能子系統正常工作所需要的fru部件個數以及該功能子系統可以容忍的fru部件失效個數。
前兩步完成后得到各功能子系統可靠性框圖。
步驟206,進行部件mttr測試。mttr測試包括兩類:更換時間和服務能力恢復時間。某些fru部件如風扇、電源等發生失效只改變系統運行的環境,并不會影響系統對外的服務能力,測試其更換時間即可。另一些部件如計算節點板、io箱等發生失效時將會很可能降低系統對外的服務能力,因此針對這部分fru部件的mttr測試不僅需要測試其更換時間,還需要測試fru部件失效降低了系統的對外服務能力后,經過多長時間才能使得系統服務能力恢復至正常水平。
進行部件mtbf驗證測試。對于某類fru,假設其mtbf閾值表示為minmtbf,系統中該類fru總數為n,令定時截尾試驗的時長為t≥minmtbf,相當于單個fru進行了總測試時長為nt的測試,測試時段內fru發生故障的個數記為f,則該類fru的mebf為nt/f。
步驟208,根據系統設計特點以及系統維修策略,為各個功能子系統建立可靠性模型,利用步驟206中得到的mttr和mtbf測試數據,計算各個功能子系統的可用度。
步驟210,最后結合步驟204得到的功能子系統可靠性框圖以及步驟208得到各功能子系統的可用度計算得出全系統的可用度。
圖3所示為本發明實施例4的nfv系統可用性測試裝置結構圖。
如圖3所示,根據本發明的實施例的一種nfv系統可用性測試裝置,包括:冗余度確定單元302,第一測試單元304和第二測試單元306,其中,所述冗余度確定單元302與所述第一測試單元304連接,所述第一測試單元304與所述第二測試單元306連接,
所述冗余度確定單元302,用于確定系統的可更換部件的冗余度;
所述第一測試單元304,用于對所述可更換部件進行平均失效工作時間測評和平均恢復時間測評;
所述第二測試單元306,用于根據所述可更換部件的測評結果獲取所述系統的可用性評測結果;
其中,所述平均失效工作時間是可更換部件在相繼兩次失效間運行的平均持續時間,所述平均恢復時間是在可更換部件失效后恢復運行所需要的平均持續時間。
進一步地,所述平均恢復時間包括更換時間和服務能力恢復時間。
進一步地,所述平均失效工作時間mebf的計算方式是mebf=nt/f,其中,n是所述可更換部件的數量,t是預設測試時間段,f是在所述測試時間段內發生故障的可更換部件的數量。
進一步地,所述冗余度確定單元302通過故障注入手段驗證所述系統對于給定故障集的隔離能力,以將目標系統劃分為多個能夠隔離故障、且不相關的功能子系統,以及確定所述功能子系統中的可更換部件的冗余度,所述冗余度包括所述可更換部件的數量以及可接受的可更換部件的失效個數。
進一步地,所述第二測試單元306還用于根據所述可更換部件的測評結果獲取各功能子系統的可用性數據,以及根據所述各功能子系統的可用性數據獲取所述系統的可用性評測結果。
通過以下方案:確定系統的可更換部件的冗余度,對所述更換部件進行平均失效工作時間測評和平均恢復時間測評,根據可更換部件的測評結果獲取系統的可用性評測結果可,通過在相對短的時間內對冗余部件進行mttr測試和mtbf測試,通過mttr和mtbf的值完成整個系統的可用性測評,不需要長時間在線測測的方法測量全系統可用性指標,解決成本高及測試時間有限的問題。
以上所述僅為本發明的優選實施例而已,并不用于限制本發明,對于本領域的技術人員來說,本發明可以有各種更改和變化。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。