專利名稱:集群工作站及實現該集群工作站的方法
技術領域:
本發明涉及一種集群工作站以及實現該集群工作站的方法。
背景技術:
工作站是一種集圖形圖像,數據運算,結果交付的處理機,工作站的性能一直是高性能計算以及大規模計算的瓶頸,尤其是當有大批量圖形圖像處理任務時,工作站的性能則是影響任務處理效果的關鍵因素。CPU(中央處理器)+GPU(圖形處理器)的圖形圖像處理架構現在已經逐漸的蔓延開來,用GPU的資源專門處理圖形以及輔助計算,可以彌補CPU 單一處理速度的瓶頸。GPU輔助計算將CPU從多個任務的中分離開來,使CPU和GPU各司其職,進而提高性能。目前,在集成有PCIE (PCI-Express)接口的主機節點上插入相應的GPU或者顯卡, 就可以提供高速的圖形圖像功能。目前方案中具有的是單節點(即單一主板,單一工作站)的性能,沒有相應的工作站冗余;同時工作站擴展性不強,增加節點需要通過以太網進行連接,但是現在以太網的速率還是大多數大規模高性能圖形運算的瓶頸,至多可以滿足某些小規模的運算。擴展性不強,沒有相應的冗余,節點連接的性能受限。
發明內容
針對相關技術中存在的一個或多個問題,本發明的目的在于提供一種集群工作站,以解決上述問題中的至少之一。為實現上述目的,根據本發明的一個方面,提供了一種集群工作站,所述工作站包括多個主板,每個所述主板均包括設置在主板上的IB網卡;IB子卡,其可拆卸地與所述主板連接;中板,所述多個主板的IB網卡通過所述IB子卡與所述中板連接;以及IB交換模塊,所述IB交換模塊與所述中板連接。優選地,所述IB交換模塊包括與所述中板/電源連接的第一接口。優選地,所述IB交換模塊包括與所述第一接口電連接的交換芯片,所述交換芯片上設置有多個端口,所述多個主板中的每一個均連接到一個所述端口,以提供所述多個主板之間的信息的交換。優選地,所述工作站還包括圖形處理器,其通過所述主板的IO接口與所述主板連接。優選地,所述IB交換模塊還包括與具有IB端口的設備電連接的第二接口。根據本發明的另一方面,提供一種實現集群工作站的方法,所述方法包括通過 IB子卡將多個主板中的IB網卡連接至中板;以及將所述中板連接至IB交換模塊。優選地,所述IB交換模塊包括與所述中板/電源連接的第一接口。優選地,所述IB交換模塊包括與所述第一接口電連接的交換芯片,所述交換芯片上設置有多個端口,所述多個主板中的每一個均連接到一個所述端口,以提供所述多個主板之間的信息的交換。優選地,所述方法還包括將圖形處理器連接至所述主板的IO接口。優選地,將具有IB端口的設備連接到所述IB交換模塊的第二接口。根據本發明的集群工作站將各個單工作站節點進行資源整合,形成一個整體統一的工作站,對用戶提供數據通信,圖像處理的服務。通過集群內部各個節點之間的高速互聯通道,可以實現不同節點GPU、顯卡之間的數據互通,集運算、圖形圖像處理、信息交互于一整體,并且,其運行高效穩定,管理統一方便,是普通工作站無法比擬的。
本發明上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中圖1為根據本發明的實施例的IB交換模塊的立體圖;圖2為根據本發明的實施例的IB交換模塊的電路板的平面圖;圖3為根據本發明的實施例的實現集群工作站方法的邏輯關系圖;圖4為根據本發明的實施例的實現集群工作站方法的流程圖;以及圖5示出根據本發明實施例的連接有擴展模塊的實現集群工作站方法的邏輯關系圖。
具體實施例方式考慮到相關技術中存在的問題,本發明提供一種集群工作站和實現該集群工作站的方法。下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出。應理解,下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發明,而不能解釋為對本發明的限制。根據本發明,在每個節點(例如,刀片主板)都連接GPU或者顯卡的時候,其之間的互聯是通過中板實現的,節點的IO接口與IB交換模塊的接口連接實現節點和模塊之間的互聯,各個節點之間的連接是通過中板的物理連接實現的,物理連接主要有兩套網絡,以太網和IB網,節點與GPU模塊之間的連接速率沒有瓶頸,各個節點之間的連接帶寬才是GPU 數據在各節點之間傳輸的限制因素。為了實現工作站之間的高速互聯,根據本發明,提供一種IB交換模塊。IB(InfiniBand)網為高速互聯網絡,用于大規模計算數據傳輸和高性能計算,目前支持20(ib/S的DDR速率,各個工作站之間的互聯不是通過GPU或顯卡自身,而是通過節點間的IB網,將各個GPU或者顯卡連接起來,作為一個整體給外界用戶提供高效的數據計算和傳輸以及圖形服務。圖1和圖2為根據本發明的IB交換模塊的立體圖及其電路板7的平面圖。如圖 1所示,該IB交換模塊1的上下左右是封口的,前面是該交換模塊的接口,后面是該交換模塊的主板與刀片機箱的中板接口。如圖2所示,其示出了與中板連接同時也為該交換模塊的供電的第一接口 3、5,還示出了用于提供端口之間信息的高速交換的交換芯片7,第一接口 3、5和交換芯片7均設置在電路板11上。通常,每個刀片主板都有一個IB網卡,這些網卡是相互獨立的,彼此之間的連接都需要先連接到機箱的中板上,然后中板與IB交換模塊相連,從而實現節點之間通過IB交換模塊的互聯。具體地說,各個刀片主板的IB網卡通過IB子卡連接到中板上,其中,該IB 子卡可拆卸地與刀片主板連接,通過該IB子卡來連接IB網卡和中板,實現接口轉換工程, 即將IB網卡接口轉換成與中板相配合的標準接口。然后,通過中板的接口與IB交換模塊的第一接口 3、5連接,由于第一接口 3、5與交換芯片7電連接,從而使得與該IB交換模塊1 連接的中板所連接的刀片服務器之間互相通信。具體地說,交換芯片7上設置有多個端口, 每一個刀片主板均連接至一個端口,通過這些端口提供刀片主板之間的信息的交換。圖3示出了根據本發明的一個實施例的邏輯關系圖。如圖3所示,該圖中示出了 8個刀片服務器2,當然,根據需要,可以設置更多或更少的刀片2。這些刀片2均連接到中板4上,然后,中板4通過其與IB交換模塊的接口 6連接至IB交換模塊1上。根據需要,如圖2所示,該IB交換模塊1還可以包括與外界進行連接通信的第二接口 9,該接口可以設置多個,例如,20個。通過這些第二接口 9,外界(例如,具有IB端口的設備,如IB交換機)可以與刀片服務器連接通信。圖4示出了根據本發明的實施例的實現集群工作站的方法的流程圖。如上所述, 為了得到高速互聯的集群工作站,IB網連接的具體實現方法包括通過可拆卸地連接到刀片主板的IB子卡將多個刀片主板中的IB網卡連接到中板(步驟Si)。將連接有多個刀片主板的中板連接至上述的IB交換模塊(步驟S2),通過該交換模塊的交換芯片使多個刀片之間互相通信。通過將GPU或顯卡連接至刀片主板的IO接口(步驟S3),從而將各個GPU或顯卡連接起來,作為一個整體給外界用戶提供高效的數據計算和傳輸以及圖形服務。如圖5 所示,各個刀片主板的IB網卡通過IB子卡連接到中板上,然后中板4與交換模塊1相連, 這樣就實現了主板的互聯。擴展模塊,如GPU或顯卡等通過主板IO接口連接到主板上,主板上的操作系統將數據分發給各個IB網卡端口,然后IB網卡通過IB子卡連接到中板上, 中板連接到交換模塊上,實現了數據的連接與共享。當需要與外界連接通信時,將IB交換模塊連接至外界,例如,具有IB端口的設備, 如IB交換機等,從而提供一種擴展功能。集群中的每個節點都可以通過上述方法實現單節點工作站需求,將這些節點互聯起來,可以實現工作站集群,通過上述方法,可以實現每個節點之間的數據通信與同步。根據本發明的集群工作站將各個單工作站節點進行資源整合,形成一個整體統一的工作站,對用戶提供數據通信,圖像處理的服務。通過集群內部各個節點之間的高速互聯通道,可以實現不同節點GPU、顯卡之間的數據互通,集運算、圖形圖像處理、信息交互于一整體,并且,其運行高效穩定,管理統一方便,是普通工作站無法比擬的。各個GPU或者顯卡之間的互聯不是通過高速IB網絡,而是通過以太網,雖然也可提供服務,但是服務的質量在低速和小數據傳輸還可以,對于高速和大數據傳輸來說,還需要進一步提高以太網的速率才能滿足。盡管已經示出和描述了本發明的實施例,對于本領域的普通技術人員而言,可以理解在不脫離本發明的原理和精神的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發明的范圍由所附權利要求及其等同限定。
權利要求
1.一種集群工作站,其特征在于,所述工作站包括 多個主板,每個所述主板均包括設置在主板上的IB網卡; IB子卡,其可拆卸地與所述主板連接;中板,所述多個主板的IB網卡通過所述IB子卡與所述中板連接;以及 IB交換模塊,所述IB交換模塊與所述中板連接。
2.根據權利要求1所述的集群工作站,其特征在于,所述IB交換模塊包括與所述中板 /電源連接的第一接口。
3.根據權利要求2所述的集群工作站,其特征在于,所述IB交換模塊包括與所述第一接口電連接的交換芯片,所述交換芯片上設置有多個端口,所述多個主板中的每一個均連接到一個所述端口,以提供所述多個主板之間的信息的交換。
4.根據權利要求1-3中任一項所述的集群工作站,其特征在于,所述工作站還包括圖形處理器,其通過所述主板的IO接口與所述主板連接。
5.根據權利要求4所述的集群工作站,其特征在于,所述IB交換模塊還包括與具有IB 端口的設備電連接的第二接口。
6.一種實現集群工作站的方法,其特征在于,所述方法包括 通過IB子卡將多個主板中的IB網卡連接至中板;以及將所述中板連接至IB交換模塊。
7.根據權利要求6所述的方法,其特征在于,所述IB交換模塊包括與所述中板/電源連接的第一接口。
8.根據權利要求7所述的方法,其特征在于,所述IB交換模塊包括與所述第一接口電連接的交換芯片,所述交換芯片上設置有多個端口,所述多個主板中的每一個均連接到一個所述端口,以提供所述多個主板之間的信息的交換。
9.根據權利要求6-8任一項所述的方法,其特征在于,所述方法還包括將圖形處理器連接至所述主板的IO接口。
10.根據權利要求9所述的方法,其特征在于,所述IB交換模塊具有第二接口,將具有 IB端口的設備連接到所述IB交換模塊的第二接口。
全文摘要
本發明公開一種集群工作站,該工作站包括多個主板,每個所述主板均包括設置在主板上的IB網卡;IB子卡,其可拆卸地與所述主板連接;中板,所述多個主板的IB網卡通過所述IB子卡與所述中板連接;以及IB交換模塊,所述IB交換模塊與所述中板連接。本發明還公開一種實現集群工作站的方法,該方法包括通過IB子卡將多個主板中的IB網卡連接至中板;以及將所述中板連接至IB交換模塊。根據本發明的集群工作站將各個單工作站節點進行資源整合,形成一個整體統一的工作站,對用戶提供數據通信,圖像處理的服務。通過集群內部各個節點之間的高速互聯通道,可以實現不同節點GPU、顯卡之間的數據互通,集運算、圖形圖像處理、信息交互于一整體。
文檔編號H04L12/56GK102542524SQ20111045918
公開日2012年7月4日 申請日期2011年12月31日 優先權日2011年12月31日
發明者戴榮, 李程, 許濤, 馬少杰 申請人:曙光信息產業股份有限公司