專利名稱:一種io擴展系統的制作方法
技術領域:
本發明涉及高性能計算機的 ο擴展技術,特別涉及通過外置式遠程互聯的方法來對系統IO進行擴展的技術。
背景技術:
近幾十年來,半導體技術一直隨摩爾定律快速發展,大規模和超大規模集成電路技術推進高性能計算機的計算速度呈指數級前進。而與之形成鮮明對比的是,系統的IO速度卻一直發展緩慢;隨著信息技術的不斷的發展,計算機需要處理的數據呈爆發式增長,數據密集型應用也越來越多。在此情況下,計算機系統的瓶頸已經從早期的計算能力不足轉移為IO能力不足,即IO墻正成為繼“計算墻”、“內存墻”之后計算機系統新的瓶頸。目前的計算機IO系統正面臨以下問題 接口類型有限常見的高性能計算機IO接口類型主要包括存儲接口 SATA、網絡接口 Khnet或IB以及外接板卡接口 PCIe。 接口數目有限每臺高性能計算機中每種接口數目通常為2 4個。 設備空間有限每臺高性能計算機中留給IO設備的空間通常為IU或2U高,并且留給IO設備的長度最長不超過300mm,限制了大尺寸IO設備的接入。 接口無靈活性不同的接口之間相互獨立,無法根據實際應用需求來增加或減少IO設備數目,無法實現不同接口之間的設備共享。為了彌補現有系統中的IO方面的不足,工業界和學術界分別從幾個方面來進行提尚。首先是提高IO接口速率,常見的包括磁盤接口從IDE到SATA再向SAS的轉變,網絡接口從IOM到100M到1000M甚至到IOG的轉變,但這些接口的提升速度遠不及海量數據處理對計算機IO系統的接口速度要求。其次是IO接口數目得增加。對于高速外設接口 PCIe,高性能計算機上的接口數目已經從2 4個增加了 4 7個。對于以太網,板載千兆網接口一般為1 3個,通過PCIe 擴展后的接口數目更是增加到了每塊卡4 6個接口。但上述IO擴展方式仍是在服務器內部對IO接口進行擴展,仍無法擺脫設備空間和靈活性不足的限制,所以無法從根本上解決目前高性能計算機中的IO容量不足的問題。
發明內容
本發明擬采用將IO設備放在遠程的方式,即將所有的IO接口通過擴展芯片進行擴展,并放在單獨的容器中。系統的IO設備可以根據需要來靈活的在遠程容器中增加、減少、升級或更換,而對主機端的互聯接口不變。并且,根部不同的容量需求,遠端容器中的部分或全部設備可以映射到一臺服務器主機上來。容器中自行進行供電和散熱,確保所有設備可以不受主機端工作狀態影響。一種IO擴展系統,所述系統包括配置管理模塊,IO刀片和設備接口 ;
所述配置管理模塊用于配置管理IO刀片和接口設備,對外提供資源的虛擬視圖, 接收服務器的IO申請并登記,對物理資源進行分配;所述設備接口安裝在所述IO刀片上,所述IO刀片通過標準接口接入到IO容器中,對外提供的IO接口。優選的,所述IO接口包括SATA接口,SAS接口,PCIE接口。優選的,所述配置管理模塊可以將物理設備虛擬化,使一個設備同時被多個服務器使用。優選的,所述IO刀片安裝有供電接口,每個供電接口都可以滿足高耗電設備的用電需求。優選的,所述IO刀片之間留有通風通道,IO刀片外部留有冷風接入口,外部風扇產生的冷風從冷風接入口進入IO刀片內部。優選的,所述IO刀片集成擴展芯片和互聯芯片。優選的,所述IO刀片安裝有信號轉接適配器,用于對信號的整形放大。優選的,所述IO容器的底部安裝有點遠模塊,交換模塊和配置管理模塊,頂部安裝有IO接口。通過本發明的系統,服務器端可以根據需求靈活的配置所需的IO設備接口數目, 并根據需要有選擇性地對遠程設備進行互聯。在不需要的情況下,遠端容器可以只配置一部分IO設備,因此,整個系統的IO成本可以隨設備數目而線性增加,并且不同設備之間可以實現容量和空間的共享,可以有效解決系統的IO容量問題,并為IO虛擬化提供了基礎。 由于設備放在遠程,設備或主機端的故障被有效隔離,可以在系統發生故障時獨立進行修復或升級。
圖1是本發明的系統架構2是本發明虛擬化環境下的連接方式圖3是本發明的一種實施例的系統連接方式圖4是本發明的一種實施例的系統規格圖
具體實施例方式為了實現不同服務器之間的設別共享,本發明中采用將IO設備放入遠程容器中的方法,不同的服務器之間可以根據需要來靈活地連接所需要使用的設備,系統架構如圖1 所示。圖一 a)給出了多個服務器共享遠程設備,其中每個服務器分別連接4個設備的場景。圖一 b)給出了多個設備共享遠程設備,但每臺設備連接的IO設備數目不同的配置場景。系統運行中,可以根據需要來動態地對系統的連接拓撲進行配置和調整,以適合不同的應用對IO設備的數目、性能和容量的需求。為了實現上述的動態配置管理功能,系統需要有一個軟件的配置管理模塊,該模塊統一管理所有的設備,并對外提供資源的虛擬視圖。所有需要連接設備容器的的服務器都需要到配置管理模塊這里進行申請和登記,然后由配置管理模塊進行物理資源的分配和管理,并將分配和管理信息通過虛擬視圖反映到全局。這種方式下,系統的配置方式如圖2 所示。配置管理模塊除了進行設備的劃分和分配之外,對于使用率低下的設備,配置管理模塊還可以將其進行物理設備的虛擬化,即同一個物理設備,提供多個不同的虛擬視圖, 使得該設備可以同時為多個服務器所使用。本發明中IO容器里的所有設備都采用二級接入的方法來進行組織。其中一級接入接口為刀片,二級接入接口為具體的設備接口,如SATA、SAS、PCIE等。這種方式下,首先是將不同接口的設備放入適合的刀片中,通過刀片上的轉接口將協議轉換為同一的刀片接口。然后IO刀片再通過標準接口接入到IO容器,并對外提供統一的IO接口。采用刀片式的一級接入方式,使得IO刀片的增加、刪除和升級變得非常靈活。而刀片內部的接口轉接模塊又可以將不同接口的設備都統一接入到IO刀片中,為系統的靈活性及IO虛擬化提供了基石出。對于GPU等設備,由于設備自身耗電較高,所以每個IO刀片中提供多個供電接口, 每個供電接口都可以獨立滿足GPU類高耗電設備的用電需求。并且,每個IO刀片中都支持高散熱需求的設備,即IO刀片中的設備之間留有足夠的散熱通風通道,IO刀片外部留有冷風接入接口,使得外部風扇產生的冷風可以通過接口進入IO刀片內部,并在不同的散熱通道中自由流動,帶走高散熱類設備產生的熱量。為了提高系統的擴展性并降低系統成本,本發明中將所有的核心互聯及擴展芯片在硬件層次分布在不同的刀片中。即IO刀片主板上集成擴展及互聯芯片,IO容器中的中板僅提供電源和散熱接口。這種方式下,在系統非滿配情況下,系統整體成本的架構將隨IO 刀片的價格呈近似線性的擴展關系,避免了將核心芯片放在IO容器中板上帶來的非滿配開銷。由于服務器端接口數目有限,并且受機箱規格限制,所以為了遠程互聯方案的實施,需要在服務器端配置接口轉接適配器。該適配器規格滿足服務器端適配器的標準需求, 并且可以實現實現主機端協議和遠程設備協議之間的轉換。由于遠程設備連接的距離較長,所以接口轉接適配器還需要對信號進行整形和放大,以補償遠距離信號傳輸情況下的信號損耗和失真。在本發明所設計的方法中,服務器和IO容器的一種連接方式如圖3所示。主機端接入滿足PCIe接口規范的半高半長轉接適配器,適配器的另一端采用PCIe線纜于遠程IO 容器中的一個IO刀片互聯。連接過程中需經過IO容器的中板系統,該中板系統上運行的配置管理模塊對連接進行管理,對IO設備資源進行分配,最終連接到某一個物理的IO刀片中。在一個IO刀片內部,實現采用信號轉接適配器再次對信號進行整形和放大,然后通過PCIE交換芯片連接到不同的PCIE接口卡。每個PCIe卡的供電可以采用兩種方式,對于供電需求不高的設備,可以采用直接從PCIE接口取電的方式。而對于供電需求高的設備,則在IO刀片內部采用獨立供電的方式來提供支持。由于交換和轉接芯片成本較高,所以圖3中的IO刀片中集成了這兩種類型的芯片。因此,僅當系統接入了該IO刀片時,核心芯片的成本才會增加。并且,當系統的某個IO 刀片發生故障時,每個刀片不會影響其他IO刀片,避免了單芯片失效更換多個正常芯片的情況。本發明的一種系統規格示意圖如圖4所示。在一個5U高的容器中,集成了多個IO 刀片。刀片后部,最高的IU高度放置了 IO刀片的對外接口,接下來的3U高度中放置了風扇模塊,所有的風扇模塊采用N+1的冗余架構。風扇最下端,是系統的管理模塊,負責提供設備的接入、配置、虛擬化等功能。容器中總高度為5U情況下,每個刀片高度為4U,可以放入目前已知的各種IO設備。刀片下部,則是系統的電源模塊,為整個系統提供供電。為了確保系統的安全,特別是對于易失性設備,掉電后系統狀態將進入未知狀態,對應用造成不可預測的影響。所以,此處的電源模塊需采用UPS系統,確保外部供電中斷后,管理模塊可以對系統中所有的IO設備做有效的關閉工作。進一步,為了確保系統的安全穩定運行,系統的供電模塊采用N+1冗余的架構。
權利要求
1.一種IO擴展系統,其特征在于所述系統包括配置管理模塊,IO刀片和設備接口 ; 所述配置管理模塊用于配置管理IO刀片和接口設備,對外提供資源的虛擬視圖,接收服務器的IO申請并登記,對物理資源進行分配;所述設備接口安裝在所述IO刀片上,所述IO刀片通過標準接口接入到IO容器中,對外提供的IO接口。
2.如權利要求1所述的系統,其特征在于所述IO接口包括SATA接口,SAS接口,PCIE接口。
3.如權利要求1所述的系統,其特征在于所述配置管理模塊可以將物理設備虛擬化, 使一個設備同時被多個服務器使用。
4.如權利要求1所述的系統,其特征在于所述IO刀片安裝有供電接口,每個供電接口都可以滿足高耗電設備的用電需求。
5.如權利要求1所述的系統,其特征在于所述IO刀片之間留有通風通道,IO刀片外部留有冷風接入口,外部風扇產生的冷風從冷風接入口進入IO刀片內部。
6.如權利要求1所述的系統,其特征在于所述IO刀片集成擴展芯片和互聯芯片。
7.如權利要求1所述的系統,其特征在于所述IO刀片安裝有信號轉接適配器,用于對信號的整形放大。
8.如權利要求1所述的系統,其特征在于所述IO容器的底部安裝有點遠模塊,交換模塊和配置管理模塊,頂部安裝有IO接口。
全文摘要
本發明提供了一種IO擴展系統,所述系統包括配置管理模塊,IO刀片和設備接口;所述配置管理模塊用于配置管理IO刀片和接口設備,對外提供資源的虛擬視圖,接收服務器的IO申請并登記,對物理資源進行分配;所述設備接口安裝在所述IO刀片上,所述IO刀片通過標準接口接入到IO容器中,對外提供的IO接口。通過本發明的系統,服務器端可以根據需求靈活的配置所需的IO設備接口數目,并根據需要有選擇性地對遠程設備進行互聯。在不需要的情況下,遠端容器可以只配置一部分IO設備,因此,整個系統的IO成本可以隨設備數目而線性增加,并且不同設備之間可以實現容量和空間的共享,可以有效解決系統的IO容量問題,并為IO虛擬化提供了基礎。由于設備放在遠程,設備或主機端的故障被有效隔離,可以在系統發生故障時獨立進行修復或升級。
文檔編號G06F13/40GK102521185SQ20111036429
公開日2012年6月27日 申請日期2011年11月17日 優先權日2011年11月17日
發明者劉新春, 朱曉娟, 王英, 許建衛, 邵宗有 申請人:曙光信息產業(北京)有限公司