一種多路計算機系統的制作方法
【技術領域】
[0001]本發明涉及計算機存儲技術領域,尤指一種基于融合架構支持多節點全局共享
10、存儲及分布式網絡交換的新型多路計算機系統。
【背景技術】
[0002]隨著目前網絡及數據量爆發式的增長,對計算機系統的計算、網絡、存儲能力提出很高的要求。如圖1所示,在目前傳統的計算機系統架構中,由于無法從硬件層面解決多物理系統間底層設備的共享使用,只能通過軟件虛擬機的方式實現在一個單獨的物理系統內部,多個虛擬機對底層輸入輸出(10,Input/Output)和共享設備的訪問。
[0003]在大型的計算機系統中,由于需要強大的計算能力,往往存在不止一個物理的計算子系統,盡管通過虛擬機的方式可以使多個物理子系統訪問到存儲設備,但存儲設備端需要為每個虛擬機都建立對應的獨立磁盤空間,無法實現整個存儲資源的共享訪問,不利于資源的集中利用與管理。同時,現有的架構靈活性相對死板,功能模塊固定,多個功能模塊間無法按需進行互換,因此限制了整個產品的擴展性能。此外,現有計算機架構中往往網絡控制器都只與單一的處理單元連接,當多個處理單元需要同時進行網路數據的訪問時,只能通過與網絡控器連接的處理單元來實現,這樣無法充分利用多路系統的計算優勢、造成了多計算系統中計算資源間的浪費。
【發明內容】
[0004]為了解決上述技術問題,本發明提供了一種多路計算機系統,能夠提升整個計算機體系的性能。
[0005]為了達到本發明目的,本發明提供了一種多路計算機系統,包括:融合應用模塊、計算模塊、分布式交換模塊、快速外圍組件互連PCIe交換模塊、存儲控制模塊、磁盤存儲模塊、輸入輸出I/O擴展模塊和基礎控制模塊,其中,融合應用模塊,用于基于PCIe信號與系統進行互連;計算模塊,用于負責整個系統內應用數據的計算和處理,通過PCIe的信號總線與系統進行互連;分布式交換模塊,用于對系統內連接所有的計算模塊,對系統外提高速連接通道;PCIe交換模塊,用于負責系統中PCIe數據的接收、交換與轉發;存儲控制模塊,用于連接PCIe交換模塊和磁盤存儲模塊,將PCIe信號轉換為磁盤存儲信號;磁盤存儲模塊,用于通過存儲控制模塊將內部獨立的物理磁盤組建成磁盤陣列;1/0擴展模塊,用于提供擴展插槽;基礎控制模塊,用于對系統內部各模塊的監控和管理。
[0006]進一步地,所述融合應用模塊,具體用于:包括存儲模塊、Cache加速模塊和I/O增強模塊,所述存儲模塊、Cache加速模塊和I/O增強模塊均基于PCIe信號與整個系統進行互連。
[0007]進一步地,所述分布式交換模塊,具體用于:對系統內連接所有的計算模塊,對系統外提供3個100Gb/S的高速連接通道;通過所述分布式交換模塊組建成分布式的網絡拓撲,進行基于分布式的并行計算。
[0008]進一步地,所述PCIe交換模塊,具體用于:包括處理器和PLX交換芯片,負責整個系統中PCIe數據的接收、交換與轉發;通過PCIe交換模塊將磁盤存儲模塊和I/O擴展模塊中的磁盤和I/O設備完全池化,提供給計算模塊使用。
[0009]進一步地,所述存儲控制模塊,具體用于:連接PCIe交換模塊和磁盤存儲模塊,將PCIe信號轉換為SAS/SATA信號,并提供針對磁盤存儲模塊上磁盤數據的讀寫、存儲控制。
[0010]進一步地,所述磁盤存儲模塊,具體用于:包括多個單獨的2.5寸物理存儲盤,在單個磁盤存儲模塊上最大可以支持12個2.5寸磁盤,整個系統支持2個磁盤存儲模塊,最多可支持24個2.5寸磁盤;單獨的物理磁盤通過存儲控制模塊組建成RAID0、5、6等多種磁盤陣列。
[0011]進一步地,所述I/O擴展模塊,具體用于:提供10個PCIe3.0的擴展插槽,搭配標準的以太網、光纖通道、Cache加速或運算加速卡;1/0擴展模塊通過PCIe交換模塊與計算模塊及融合應用模塊連接,將I/O資源池化,統一提供給計算模塊及融合應用模塊使用。
[0012]進一步地,所述基礎控制模塊,具體用于:對系統內各模塊進行監控和管理,且提供通用的網絡接口與外部的管理者或集中通訊及管理設備進行連接。
[0013]進一步地,所述多路計算機系統還包括:分布式網絡模塊;所述分布式網絡模塊的兩側的100Gb/S鏈路與左右相鄰的系統間進行互連,中間的I條100Gb/S的鏈路與相對面的系統間進行互連,并在左右兩側支持雙翼的擴展,構建基于分布式網絡的超級計算機系統集群。
[0014]進一步地,所述PCIe交換模塊,還包括:上行端口、下行端口和管理端口,其中,上行端口連接計算模塊和融合應用模塊;下行端口用來連接I/o擴展模塊和存儲控制模塊;管理端口通過I2C鏈路連接微處理單元。
[0015]進一步地,所述分布式交換模塊包括PCIe交換控制器和10Gb網絡控制器,其中,PCIe交換控制器上行通過8個PCIe3.0 x4的鏈路與計算模塊或融合應用模塊連接,下行通過I個PCIe3.0 xl6的鏈路與10Gb網絡控制器連接;10Gb網絡控制器上行通過PCIe3.0xl6的鏈路與PCIe交換控制器連接,將PCIe信號轉換為網絡信號與外部網絡設備進行通訊,下行提供3個100Gb/S的高速連接通道,用于進行網絡的擴展。
[0016]和現有技術相比,本發明在新的計算機系統架構中引入基于新型PCIe交換技術,解決目前傳統的計算機系統架構中由于無法從硬件層面解決多物理系統間底層設備的共享使用,只能通過軟件虛擬機的方式實現在一個單獨的物理系統內部、多個虛擬機對底層10和共享設備的訪問的問題,推出基于MultiHost多節點全局共享10及存儲的新計算機架構。
[0017]在新的計算機系統架構中將分布式網絡架構引入到多路計算機系統設計中,通過系統中的分布式網絡模塊不但可以實現計算機系統內部多個信息處理類模塊間的基于分布式的數據交換,同時分布式網絡模塊對外還提供3條100Gb/S帶寬的通信鏈路,可以在多個新型的計算機系統架構間組建成基于分布式的網絡,這時每個新型的計算機系統將作為分布式網絡中的一個計算單元,并且基于分布式網絡模塊組件的分布式網絡還支持雙翼擴展,可以進一步加強新型計算機架構的網絡擴展與計算性能方面的擴展。
[0018]在計算機體系架構中引入100Gb/s高速交換互聯通道,作為核心的數據交換通路,整體提升整個計算機體系的數據傳輸帶寬和傳輸效率,符合未來大數據時代的需求。
[0019]本發明的其它特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發明而了解。本發明的目的和其他優點可通過在說明書、權利要求書以及附圖中所特別指出的結構來實現和獲得。
【附圖說明】
[0020]附圖用來提供對本發明技術方案的進一步理解,并且構成說明書的一部分,與本申請的實施例一起用于解釋本發明的技術方案,并不構成對本發明技術方案的限制。
[0021]圖1是現有技術中全局資源共享的傳統計算機架構的示意圖。
[0022]圖2是本發明的一種實施例中全局資源共享的新型計算機架構的示意圖。
[0023]圖3是本發明的一種實施例中多路計算機系統的架構示意圖。
[0024]圖4是本發明的一種實施例中多路計算機系統支持雙翼擴展的架構示意圖。
[0025]圖5是本發明的一種實施例中PCIe交換模塊的結構示意圖。
[0026]圖6是本發明的一種實施例中分布式交換模塊的結構不意圖。
【具體實施方式】
[0027]為使本發明的目的、技術方案和優點更加清楚明白,下文中將結合附圖對本發明的實施例進行詳細說明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。
[0028]在附圖的流程圖示出的步驟可以在諸如一組計算機可執行指令的計算機系統中執行。并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執行所示出或描述的步驟。
[0029]圖2是本發明的一種實施例中全局資源共享的新型計算機架構的示意圖。如圖2所示,在新的計算機系統架構中引入基于新型PCIe交換技術,通過快速外圍組件互連(PCIe,Peripheral Component Interconnect Express)交換模塊實現基于 MultiHost 多節點全局共享1及存儲資源的共享,此時無論對于多節點或者任意虛擬機將會是別到一塊同一的磁盤存儲空間,而不是傳統的獨立存儲塊。
[0030]圖3是本發明的一種實施例中多路計算機系統的架構示意圖。如圖3所示,包括融合應用模塊、計算模塊、分布式交換模塊、PCIe交換模塊、存儲控制模塊、磁盤存儲模塊、I/O擴展模塊和基礎控制模塊,其中,
[0031]融合應用模塊:分為存儲模塊、Cache加速模塊、I/O增強模塊三種,各種模塊均是基于PCIe信號與整個系統進行互連,用戶可以根據自己的實際需要在各個模塊間進行更換;
[0032]計算模塊:負責整個系統中應用數據的計算和處理,計算模塊中的處理器可以選用市場上主流Intel公司的X86處理器或ARM處理器,通過PCIe的信號總線與整個系統進行互連;
[0033]分布式交換模塊:整個分布式交換模塊對內連接所有的計算模塊,對外提供3個100Gb/S的高速連接通道,通過分布式交換模塊可以組建成分布式的網絡拓撲,可以實現基于分布式的并行計算,擴展整個新型計算機體系的計算處理能力;