本發明涉及計算機技術領域,具體地說是一種整機柜計算資源池節點及計算資源池化架構。
背景技術:
隨著互聯網經濟的快速發展,海量數據正以前所未有的增長趨勢沖擊著整個數據中心行業,對it基礎架構提出了更高的要求。服務器作為數據中心的核心部件之一,為了適應未來大規模業務增長的需求,也需要對其架構進行優化和重構。
在服務器的資源重構架構中,計算資源重構是其中一個重要應用。同時模塊化和高密度是服務器發展的重要趨勢,表現為通用服務器逐漸向整機柜服務器演化。
目前計算資源的池化設計均未應用于整機柜服務器領域,集成密度低,能耗高,無法集中管理,資源分配模式僵化,資源有效利用率低,安裝和維護工作量大。
基于此,本發明提供一種整機柜計算資源池節點及計算資源池化架構。解決整機柜計算資源池化架構設計技術,將計算資源池化形成1u節點模塊應用到整機柜服務器,并實現級聯擴展、動態池化、集中管理等功能。
技術實現要素:
本發明的技術任務是針對以上不足之處,提供一種整機柜計算資源池節點及計算資源池化架構。
一種整機柜計算資源池節點,以1u節點的形態應用到配置有管理模塊、計算節點的整機柜服務器,其結構包括電源板、gpu節點模塊和gpu,所述gpu節點模塊通過電源板連接到上述管理模塊,實現對gpu節點模塊狀態監控和計算資源的管理功能;在gpu節點模塊中配置有數據交換芯片,該數據交換芯片可連接所述計算節點、gpu并實現gpu與計算節點之間計算數據的交換。
所述電源板與gpu節點模塊之間采用銅排供電,供電電壓為12v。
所述數據交換芯片配置2個數據上行接口和4個數據下行接口,4個數據下行接口分別接入4個gpu,1個數據上行接口可接入計算節點,該數據上行接口、數據下行接口均為pcie接口。
所述gpu節點模塊中還配置有順序互連的bmc芯片、mcpu芯片和pcieswitch芯片,該pcieswitch芯片連接上述數據交換芯片且還連接有可擴展的對外管理接口,該對外管理接口為pcie接口。
所述計算資源池節點可用于級聯,即將至少兩個gpu節點模塊互聯,具體級聯結構為:首先將一gpu節點模塊的上行接口接入計算節點,該gpu節點模塊的另一上行接口則接入另一gpu節點模塊的一上行接口;兩gpu節點模塊之間的對外管理接口相互連通,實現pcie管理信號的互通;該另一gpu節點模塊與其它gpu節點模塊之間則采用上述連接方式實現級聯。
在與計算節點連接的gpu節點模塊中,通過mcpu實現對gpu節點模塊的管理,mcpu通過1個pcieswitch芯片連接到對外管理接口和數據交換芯片,通過bmc芯片實現上行管理通道為1和2的動態選擇,即選擇哪個數據上行接口,當計算節點模塊為被級聯模塊時,管理鏈路切換到通道1,保持1個mcpu進行2個或n個gpu節點模塊的管理,這里的n為被級聯模塊的數量,從而實現gpu節點模塊的級聯。
一種整機柜計算資源池化架構,包括一個計算節點、若干gpu節點模塊、整機柜管理模塊及整機柜電源總線busbar,計算節點和gpu節點模塊分別通過各自的電源板連接到整機柜電源總線busbar取電,實現計算資源池的集中供電;整機柜管理模塊用于實現對整機柜計算資源池的集中管理,計算節點用于作為計算資源池的主設備端,通過線纜分別連接到各gpu節點模塊并傳輸pcie數據信號。
所述計算節點、gpu節點中的bmc芯片分別通過各自的電源板與整機柜管理模塊通信,從而實現計算資源池的集中管理;該整機柜管理模塊用于收集計算節點和gpu節點模塊的資源信息、資源利用率,并上報給該整機柜管理模塊中的上層應用軟件。
所述整機柜管理模塊與監控芯片bmc通信獲取的資源信息包括cpu利用率、gpu利用率、網絡帶寬,并將資源池中資源利用率及時上報給上層應用軟件。
所述系統上層應用軟件將獲取的所有gpu資源統一編碼、管理,形成gpu資源池,并根據具體的相關資源利用率,計算gpu資源池中各gpu的業務飽和度,有效調整資源池業務應用,實現資源動態池化,同時可自動分配新運算任務,實現節點資源的最大化使用。
本發明的一種整機柜計算資源池節點及計算資源池化架構和現有技術相比,具有以下有益效果:
1)、計算資源池節點模塊以1u節點的形態應用到整機柜服務器,提高部署密度。
2)、整機柜計算資源池可實現集中供電、集中管理,提高效率,降低系統能耗。
3)、gpu節點模塊可實現數據級聯,并可通過bmc芯片實現管理鏈路的動態,達到計算資源池擴展目的,減少計算節點資源需求,降低成本。
4)、基于計算資源池化節點模塊設計,結合計算節點,構建整機柜形態的資源池化架構,實現整機柜形態的集中供電、集中管理、動態池化,提高交付效率、運維效率。
5)、系統上層應用軟件將該機制中所有gpu資源統一編碼、管理,形成gpu資源池,并根據具體的相關資源利用率,計算gpu資源池中各gpu業務飽和度,有效調整資源池業務應用,實現資源動態池化,同時可自動分配新運算任務,實現節點資源的最大化使用,從而提高資源池靈活性、利用率,降低系統能耗,實用性強,適用范圍廣泛,具有很好的推廣應用價值。
附圖說明
附圖1是整機柜計算資源池節點示意圖。
附圖2是gpu節點模塊級聯架構示意圖。
附圖3是計算資源池管理鏈路級聯架構示意圖。
附圖4是整機柜計算資源池化架構示意圖。
具體實施方式
下面結合附圖及具體實施例對本發明作進一步說明。
一種整機柜計算資源池節點,通過該計算資源池節點模塊,以1u節點的形態應用到整機柜服務器,可實現計算資源池的集中管理、提高集成密度、降低能耗。計算資源池節點的4個gpu可通過如pex9797的數據交換芯片直接實現相互的計算數據交換,該節點模塊的數據接口可級聯到另外1個計算資源池節點,實現計算資源池數據交換單元的級聯。在數據級聯時,通過bmc芯片實現管理鏈路的動態切換,保持1個mcpu進行2個計算資源數據交換單元的管理,實現數據交換管理單元的級聯。
整機柜管理系統收集計算節點和gpu節點的資源信息、資源利用率并上報給上層應用軟件。系統上層應用軟件將該機制中所有gpu資源統一編碼、管理,形成gpu資源池,并根據具體的相關資源利用率,計算gpu資源池中各gpu業務飽和度,有效調整資源池業務應用,實現資源動態池化,并自動分配新運算任務,實現節點資源的最大化使用。
如附圖1所示,本發明的具體結構包括電源板、gpu節點模塊和gpu,所述gpu節點模塊通過電源板連接到上述管理模塊,實現對gpu節點模塊狀態監控和計算資源的管理功能;在gpu節點模塊中配置有數據交換芯片,該數據交換芯片可連接所述計算節點、gpu并實現gpu與計算節點之間計算數據的交換。
所述電源板與gpu節點模塊之間采用銅排供電,該銅排通過電源板與節點模塊互聯實現12v系統供電,對電源板進行熱插拔、過流、過壓電路設計,提高節點模塊系統可靠性。
所述數據交換芯片配置2個數據上行接口和4個數據下行接口,4個數據下行接口分別接入4個gpu,1個數據上行接口可接入計算節點,該數據上行接口、數據下行接口均為pcie接口。
所述gpu節點模塊中還配置有順序互連的bmc芯片、mcpu芯片和pcieswitch芯片,該pcieswitch芯片連接上述數據交換芯片且還連接有可擴展的對外管理接口,該對外管理接口為pcie接口。
所述計算資源池節點可用于級聯,即將至少兩個gpu節點模塊互聯,具體級聯結構為:首先將一gpu節點模塊的上行接口接入計算節點,該gpu節點模塊的另一上行接口則接入另一gpu節點模塊的一上行接口;兩gpu節點模塊之間的對外管理接口相互連通,實現pcie管理信號的互通;該另一gpu節點模塊與其它gpu節點模塊之間則采用上述連接方式實現級聯。
在與計算節點連接的gpu節點模塊中,通過mcpu實現對gpu節點模塊的管理,mcpu的通過1個pcieswitch芯片連接到對外管理接口和數據交換芯片,通過bmc芯片實現上行管理通道為1和2的動態選擇,即選擇哪個數據上行接口,當計算節點模塊為被級聯模塊時,管理鏈路切換到通道1,保持1個mcpu進行2個或n個gpu節點模塊的管理,這里的n為被級聯模塊的數量,從而實現gpu節點模塊的級聯。
數據交換芯片以pex9797芯片為例,如圖2所示,為計算資源池節點模塊級聯架構示意圖。計算資源池節點的4個gpu可通過pex9797芯片直接實現相互的計算數據交換,節點模塊的1個數據上行接口連接到計算節點,另1個數據接口連接到另外1個計算資源池節點,實現計算資源池數據交換單元的級聯。
如圖3所示,為計算資源池管理鏈路級聯架構示意圖。計算資源池節點模塊通過mcpu實現計算資源數據交換單元的管理,mcpu的pciex1管理信號通過1個pcieswitch芯片連接到對外管理接口和數據交換芯片pex9797,通過bmc芯片實現上行管理通道為1和2的動態選擇。當計算節點模塊為被級聯模塊時,管理鏈路切換到通道1,保持1個mcpu進行2個計算資源數據交換單元的管理,實現數據交換管理單元的級聯。
一種整機柜計算資源池化架構,如圖4所示,其結構包括一個計算節點、若干gpu節點模塊、整機柜管理模塊及整機柜電源總線busbar,計算節點和gpu節點模塊分別通過各自的電源板連接到整機柜電源總線busbar取電,實現計算資源池的集中供電;整機柜管理模塊用于實現對整機柜計算資源池的集中管理,計算節點作為計算資源池的host端,通過pcieredriver芯片增強pcie信號驅動能力,pcie數據信號通過線纜分別連接到各gpu節點模塊,形成gpu資源池,實現整機柜計算資源池化。
所述計算節點、gpu節點中的bmc芯片分別通過各自的電源板與整機柜管理模塊通信,從而實現計算資源池的集中管理;該整機柜管理模塊用于收集計算節點和gpu節點模塊的資源信息、資源利用率,并上報給該整機柜管理模塊中的上層應用軟件。
所述整機柜管理模塊與監控芯片bmc通信獲取的資源信息包括cpu利用率、gpu利用率、網絡帶寬,并將資源池中資源利用率及時上報給上層應用軟件。
所述系統上層應用軟件將獲取的所有gpu資源統一編碼、管理,形成gpu資源池,并根據具體的相關資源利用率,計算gpu資源池中各gpu的業務飽和度,有效調整資源池業務應用,實現資源動態池化,同時可自動分配新運算任務,實現節點資源的最大化使用。
在本發明中,基于數據交換芯片構建計算資源高速數據交換單元,形成計算資源池節點模塊,以1u節點的形態應用到整機柜服務器,可實現計算資源池的集中管理、提高集成密度、降低能耗。
按照圖2構建計算資源池節點模塊數據級聯架構,達到計算資源池擴展目的,減少計算節點資源需求,降低成本。
按照圖3構建計算資源池節點模塊管理鏈路級聯架構,實現計算資源池擴展管理需求,降低成本。
按照圖4所示,基于計算資源池化節點模塊設計,結合計算節點,構建整機柜形態的資源池化架構,實現整機柜形態的集中供電、集中管理、動態池化,提高交付效率、運維效率。
通過上層軟件池化管理技術,實現資源動態池化和任務自動分配,達到節點資源的最大化使用,提高資源池靈活性、利用率,降低系統能耗。
從而實現支持級聯的整機柜計算資源動態池化架構。
本技術方案還可用在服務器和存儲主板工廠生產檢驗環節,針對bios、bmc、cpld的版本檢查。
通過上面具體實施方式,所述技術領域的技術人員可容易的實現本發明。但是應當理解,本發明并不限于上述的具體實施方式。在公開的實施方式的基礎上,所述技術領域的技術人員可任意組合不同的技術特征,從而實現不同的技術方案。
除說明書所述的技術特征外,均為本專業技術人員的已知技術。