用于增加計算機網絡中的帶寬的系統和方法
【專利摘要】提供用于增加計算機網絡中的帶寬的系統和方法。計算機網絡可以包括第一下層交換機,所述第一下層交換機具有第一端口和第二端口。計算機網絡可以包括第二下層交換機,所述第二下層交換機具有第一端口和第二端口。計算機網絡可以包括上層交換機,具有直接耦合到第一下層交換機和第二下層交換機的端口的相應端口。所述上層交換機的第三端口可以耦合到無源光分路器的第一端口。無源光分路器可以具有耦合到第一下層交換機和第二下層交換機的相應端口的第二端口和第三端口。無源光分路器可以被配置成傳送在其第一端口處接收到的信號作為其第二端口和第三端口二者上的輸出信號。
【專利說明】用于増加計算機網絡中的帶寬的系統和方法
[0001]相關申請的交叉引用
[0002]本專利申請要求2014年I月31日提交的題為“SYSTEMS AND METHOD FORINCREASING BANDWIDTH IN A COMPUTER NETWORK(用于增加計算機網絡中的帶寬的系統和方法)”的美國實用新型申請N0.14/169,734的優先權,其已被轉讓給本發明的受讓人,并在此明確通過引用將其合并于此。
【背景技術】
[0003]基于云計算的服務被實現并運行在由大量個體計算機組成的數據中心網絡上。通常,希望遞送盡可能多的帶寬給數據中心中的每個計算機。但是,互相物理連接數據中心中的每個計算機會過分昂貴且復雜。而且,數據中心內的帶寬需求會根據時間而變化巨大。因此,僅增加物理連接數目可能不足以增加數據中心內的帶寬。
【發明內容】
[0004]本公開的方面和實施方式涉及用于增加計算機網絡中的帶寬的系統和方法。
[0005]至少一個方面指向一種計算機網絡。所述計算機網絡包括第一下層交換機,所述第一下層交換機具有第一端口和第二端口。所述計算機網絡包括第二下層交換機,所述第二下層交換機具有第一端口和第二端口。所述計算機網絡包括上層交換機,所述上層交換機具有第一端口和第二端口,其第一端口直接耦合到所述第一下層交換機的第一端口,其第二端口直接耦合到所述第二下層交換機的第一端口。所述計算機網絡還包括無源光分路器,所述無源光分路器具有第一端口、第二端口、和第三端口,其第一端口耦合到所述上層交換機的第三端口,其第二端口耦合到所述第一下層交換機的第二端口,其第三端口耦合到是下層交換機的第二端口。所述無源光分路器被配置成傳送在其第一端口處接收的信號作為其第二端口和第三端口上的輸出信號。所述計算機網絡還包括控制器,所述控制器耦合到所述第一下層交換機、所述第二下層交換機、以及所述上層交換機。所述控制器被配置成控制所述第一下層交換機、所述第二下層交換機、和所述上層交換機的數據的傳輸。
[0006]至少一個方面指向一種用于在計算機網絡中傳送數據的方法。所述方法包括由上層交換機在直接通信鏈路上將第一數據分組傳送到第一下層交換機。所述方法包括由所述上層交換機通過光分路器將第二數據分組傳送到所述第一下層交換機,所述光分路器由共享通信鏈路耦合到所述上層交換機、所述第一下層交換機、和第二下層交換機。所述方法包括由所述上層交換機通過所述光分路器將第三數據分組傳送到所述第二下層交換機。
[0007]至少一個方面指向一種計算機可讀介質。所述計算機可讀介質編碼有指令,所述指令在由一個或多個處理器執行時,使得所述處理器執行方法。所述方法包括由上層交換機在直接通信鏈路上將第一數據分組到傳送第一下層交換機。所述方法包括由所述上層交換機通過光分路器將第二數據分組傳送到所述第一下層交換機,所述光分路器由共享通信鏈路耦合到所述上層交換機、所述第一下層交換機、和第二下層交換機。所述方法包括由上層交換機通過光分路器將第三數據分組傳送到所述第二下層交換機。
[0008]下面詳細討論這些和其他方面和實施例。前面的信息和下面的【具體實施方式】包括各種方面和實施例的說明性示例,并且提供用于理解所要求保護的方面和實施例的特性和特點的概覽或框架。附圖提供了對各種方面和實施例的說明和進一步的理解,且并入并構成本說明書的一部分。
【附圖說明】
[0009]附圖并不旨在按比例繪制。各個附圖中的類似的附圖標記和指示表示類似的元件。為了清楚,可以不在每個圖中標注每個組件。
[0010]圖1是示例的基于光分路器的計算機網絡。
[0011]圖2A是根據說明性實施方式的圖1中所示的控制器的框圖。
[0012]圖2B是根據說明性實施方式的圖1中示出的上層交換機的框圖。
[0013]圖3是用于在計算機網絡中傳送數據的過程的流程圖。
[0014]圖4是將共享通信鏈路均勻分布在下層交換機之間的示例計算機網絡。
[0015]圖5是將共享通信鏈路在多于兩個的下層交換機上分布的示例計算機網絡。
[0016]圖6A是包括無源光分路器的示例計算機網絡。
[0017]圖6B是包括四個無源光分路器的示例計算機網絡。
[0018]圖7是包括四個無源光分路器的第二示例計算機網絡。
【具體實施方式】
[0019]下面是對涉及用于增加計算機網絡中的帶寬的系統和方法的各種概念及其實施方式的更詳細描述。上面引入且在下面更詳細描述的各種概念可以以多種方式中的任何方式來實現,因為所述的概念不限于任何特定方式的實施方式。主要為了說明性目的而提供特定實施方式和應用的示例。
[0020]圖1是示例的基于光分路器的計算機網絡100。網絡100包括上層交換機105、兩個下層交換機IlOa和110b(通常稱為下層交換機110)、無源光分路器115、和控制器120。連接上層交換機105、下層交換機110、光分路器115、和控制器120的線表示網絡100內的通信鏈路。上層交換機105包括兩個直接通信鏈路,每個耦合到各個下層交換機110。來自上層交換機105的第三通信鏈路耦合到光分路器115。光分路器115還耦合到每個下層交換機110。
[0021]直接通信鏈路中的一個直接通信鏈路將第一下層交換機IlOa的端口111耦合到上層交換機105的端口 106。另一直接通信鏈路將第二下層交換機的端口 114耦合到上層交換機的端口 108。共享通信鏈路將上層交換機的端口 107耦合到光分路器115。從上層交換機105的端口 107傳送的信號被光發射器115分割且傳送到第一下層交換機110a(經由端口112)和第二下層交換機IlOb(經由端口 113) 二者。
[0022]在一些實施方式中,從上層交換機105到下層交換機110的直接通信鏈路由多模光纖電纜形成,而從上層交換機105到光分路器115以及從光分路器115到下層交換機110的通信鏈路由單模光纖電纜形成。多模光纖電纜可以比單模光纖電纜便宜。多模光纖電纜的光屬性也適于用于直接通信鏈路,且因此多模光纖電纜形成直接通信鏈路的使用可以降低網絡100的整體成本。相對于多模光纖電纜,單模光纖電纜可以提供由諸如光分路器115的無源光分路器所分割的光信號的更可靠傳輸。
[0023]光分路器115準許網絡100中的帶寬被重新分配以滿足變化的帶寬需求。例如,光分路器115可以從上層交換機105接收光信號。光分路器115隨后可以無源地輸出所接收的信號到兩個下層交換機110 二者。共享鏈路通過光分路器115所提供的帶寬因此可以被分配給第一下層交換機IlOa或第二下層交換機110b。在一些實施方式中,控制器120可以分配更大百分比的共享鏈路的帶寬給正在經歷更高帶寬需求的下層交換機110。共享鏈路可以由兩個下層交換機110二者來使用,例如通過采用用于下層交換機110和上層交換機105之間的通信的時域復用技術。
[0024]在一些實施方式中,1x2光分路器115可以使用2x2無源光分路器來實現。2x2無源光分路器是在許多光學通信網絡中找得到的通常使用的設備,且易于從若干制造商處獲得。其包括兩個上端口和兩個下端口。在上端口中的任一個上端口處接收的信號被傳遞到兩個下端口二者,在下端口中的任一個下端口處接收的信號被傳遞到兩個上端口二者。為了實現1x2光分路器115,2x2光分路器的未使用的端口可以保持不連接。在一些實施方式中,2x2光分路器可以用于實現具有任意數目的輸入端和輸出端的單個光分路器,如下面結合圖6A-6B和圖7進一步描述。
[0025]在一些實施方式中,網絡100表示數據中心。圖1的網絡100被極大簡化以便本公開。數據中心可以包括以層級方式通過交換機互連的若干計算設備。例如,上層交換機105或下層交換機110可以表示架頂式(TOR)交換機,每個架頂式(TOR)交換機連接到一組諸如服務器的計算設備。在一些實施方式中,數據中心包括成百或成千的服務器。下層的交換機110可以通過諸如上層交換機105的上層交換機互相連接,所述上層交換機在下層交換機110之間或在下層交換機110和位于網絡100之外的計算設備之間路由數據通信。
[0026]如上所指出的,除了下層交換機IlOa和110b,網絡可以包括許多下層交換機,并且每個下層交換機可以耦合到大量服務器。在一些實施方式中,每個服務器可以包括經由數據總線互相耦合的至少一個處理器、存儲器、和網絡接口卡(NIC)。處理器可以執行存儲在存儲器中的計算機可執行指令以實現各種操作。例如,每個服務器的處理器可以實現與由網絡100托管的云計算服務相關的操作或數據存儲或網絡100內的訪問。
[0027]對兩個下層交換機110的相對帶寬需求可以根據時間而廣泛變化。例如,當耦合到第二下層交換機UOb的服務器經歷相對少的訪問請求時,可能存在大量用戶請求訪問耦合到第一下層交換機IlOa的服務器所托管的文件或應用的時段,導致相對于第二下層交換機IlOb的網絡業務的量來說,大量網絡業務往來于第一下層交換機110a。在其他時段期間,這些相對帶寬需求可以被預留,或者兩個下層交換機110二者的帶寬需求可以基本上相等。通過光分路器115的共享鏈路在不同時段期間提供在獲取到特定下層交換機的增加的帶寬方面的靈活性,并且比起在靜態配置中安裝對于獲取到所有交換機的完全帶寬所必需的物理裝備而言更便宜且更不復雜。從上層交換機105到下層交換機110的直接鏈路還提供用于每個下層交換機110的最小保證帶寬,假定它們不會失敗。在一些實施方式中,直接和/或共享鏈路可以由附加直接和/或共享鏈路來補充以改變固定和動態帶寬之間的比率。
[0028]從上層交換機105到光分路器115的通信通過光分路器115傳送到兩個下層交換機IlOa和110b。作為結果,由上層交換機105沿著該鏈路發送的數據分組將由兩個下層交換機110接收,而不管哪個下層交換機110是預期接收者。存在若干技術來確保沿著共享鏈路發送的數據分組被正確的下層交換機110接收且正確地被不希望作為接收者的交換機所忽略。
[0029]在一些實施方式中,從上層交換機105發送到光分路器115的數據分組可以包括報頭信息,所述報頭信息包括對目的交換機的指示。每個下層交換機110可以被指派有唯一標識符。例如,標識符可以是硬件地址,諸如與連接到下層交換機110的服務器相關聯或與下層交換機110自身相關聯的MAC地址或IP地址。當與數據分組的目的地的唯一標識符相對應的信息被上層交換機105傳送到光分路器115時,所述信息可以包括在數據分組的報頭中。當分組被傳送到下層交換機110時,每個下層交換機110可以比較其所連接到的服務器的標識符與分組報頭內包含的標識符。如果匹配,則指示該下層交換機110是預期接收者,該下層交換機110可以例如通過將數據分組轉發到合適服務器來適當地處理該數據分組。否則,該下層交換機110可以丟棄該數據分組。
[0030]在其他實施方式中,不同調制格式可以用于通過分路器115從上層交換機105傳送分組到下層交換機110。例如,第一下層交換機IlOa可以被配置成僅接收根據第一調制格式傳送的分組。第二下層交換機IlOb可以被配置成接收以第二調制格式傳送的分組。上層交換機105可以以第一調制格式傳送目的地為第一下層交換機IlOa的數據分組,并且可以以第二調制格式傳送目的地為第二下層交換機IlOb的數據分組。當數據被每個下層交換機110接收時,交換機110可以執行檢查以確定傳入的分組是否根據其被指派的調制格式而被格式化,并且可以僅處理具有指派格式的分組。被不同地格式化的分組可以被忽略。
[0031]上述技術中的每個技術涉及對每個所接收的分組的某種程度的交換機分組處理。在其他實施方式中,這樣的分組處理可以被避免。例如,在一些實施方式中,通過光分路器115的共享鏈路的帶寬可以根據復用技術來分配,諸如時分復用(TDM)、波分復用(WDM)、碼分復用(CDM)、或者任何其他復用技術。例如,TDM方案可以用于分配共享鏈路的帶寬。用于傳送分組到下層交換機110中的每個下層交換機110的分立的時隙可以被指派。控制器120可以被配置成確定指派用于將分組從上層交換機105傳輸到下層交換機110中的每個下層交換機110的時隙的數目、持續時間、和時間位置。控制器120還可以與上層交換機105和下層交換機110通信以同步交換機,使得它們能夠服從時分復用方案。考慮到在數據中心場境中交換機之間的相對短的距離,這樣的同步可以容易地以高精確度來實現。在為通過光分路器115從上層交換機105到第一下層交換機IlOa的傳輸而預留的時隙期間,控制器120可以控制第二下層交換機IlOb忽略在共享鏈路上從光分路器115傳送的數據分組。例如,控制器120可以控制第二下層交換機IlOb的收發器在為與第一下層交換機IlOa通信所預留的時隙期間“關閉”。該技術可以降低功率消耗,因為處理在為與第一下層交換機IlOa的通信而預留的時隙期間傳送的分組時,第二下層交換機IlOb不浪費計算功率。類似地,在為通過光分路器115從上層交換機105到第二下層交換機IlOb的傳輸預留的時隙期間,控制器120可以控制第一下層交換機IlOa“關閉”以使得在該時段期間通過光分路器115傳送的數據分組不被第一下層交換機IlOa接收或處理。注意,每個下層交換機110可以繼續經由其直接通信鏈路接收數據而不管時分方案,因為經由直接通信鏈路接收的數據分組的目的地是清楚的。
[0032]每個時隙的絕對和相對持續時間可以根據變化的帶寬需求而改變。例如,在第一下層交換機IlOa經歷比第二下層交換機IlOb更高的帶寬需求的時段期間,為通過光分路器115傳送分組到第一下層交換機IlOa而指派的時隙可以基本上持續時間比為傳送數據到第二下層交換機IlOb預留的時隙更長。替選地,所有時隙可以基本上是相等持續時間的,且更大數目的時隙可以被分配用于與第一下層交換機IlOa通信以增加其可用帶寬。隨著網絡100的帶寬需求改變,控制器120可以通過調整為傳輸數據到下層交換機110中的每個下層交換機110預留的時隙的相對持續時間和數目來響應。
[0033]在一些實施方式中,共享鏈路的帶寬可以根據WDM方案來分配。每個下層交換機可以被指派獨特范圍的波長用于經由共享鏈路接收數據分組。上層交換機105可以被配置成使用各種波長來傳送數據分組,并且可以根據預期目的地來選擇要用于每個數據分組的波長。例如,在一些實施方式中,每個下層交換機110包括光學接收器,被配置成以相對于由每個其他下層交換機110接收的波長而言獨特的特定波長來接收光學信號。因此,傳送到第一下層交換機IlOa的數據不能由下層交換機IlOb來接收。在其他實施方式中,在能夠由與兩個下層交換機110相關聯的光學接收器接收的波長中可能存在一些重疊。在這些實施方式中,下層交換機可以每個都被指派獨特的波長或者波長集,并且可以由控制器120控制以忽略未在其指派的波長范圍內傳送的數據。
[0034]因此,WDM可以用于邏輯地創建經過光分路器115的直接通信鏈路。例如,可以通過光分路器115傳送多個波長的光。每個波長可以表示分立的通信鏈路。從上層交換機105到下層交換機IlOa的一個直接通信鏈路可以由單波長信道組成,該單波長信道物理地通過光分路器115傳送到端口 112,邏輯上表示上層交換機105和下層交換機IlOa之間的直接通信鏈路。另一直接通信鏈路可以由另一單波長信道組成,該另一單波長信道也是物理地通過光分路器115傳送,邏輯上表示上層交換機105和下層交換機IlOb之間的直接通信鏈路。最后,第三波長可以用于上層交換機105和兩個下層交換機110之間的通信。在利用WDM技術的一些實施方式中,通過光分路器115從上層交換機105到兩個下層交換機110的數據分組的傳輸可以同時發生。因此,可能不需要預留分立的時隙用于與下層交換機110中的每個下層交換機110通信。
[0035]在一些實施方式中,通過光分路器115的共享鏈路可以是雙向的,允許下層交換機110通過光分路器115傳送數據到上層交換機105。在一些實施方式中,循環器可以位于光分路器115和下層交換機110a、下層交換機110b、和上層交換機105之間以便利通過單個光分路器115的雙向通信,與使用一個用于下游通信而另一個用于上游通信的兩個分立的光分路器相對。上面討論的分配技術中的任意分配技術可以應用于從下層交換機110到上層交換機105的通信。例如,TDM方案可以用于允許第一下層交換機I 1a在指定時隙期間通過共享鏈路傳送分組,而第二下層交換機I 1b被準許在其他時隙期間傳送分組。替選地,下層交換機110可以每個被指派一個范圍的波長用于向上層交換機105傳送。控制器120可以用來基于帶寬需求確定適當的分配比率并且可以控制下層交換機110遵守所確定的分配。下層交換機110還可以經由其相應的直接鏈路傳送數據到上層交換機105。這保證每個下層交換機110的最小帶寬,而不管共享鏈路的帶寬怎樣分配。
[0036]圖2A是根據說明性實施方式的圖1中所示的控制器120的框圖。控制器120包括業務監視模塊230、帶寬分配模塊240和數據庫260。控制器120的組件工作用于確定網絡參數并分配通過諸如圖1中所示的光分路器115的光分路器共享的網絡鏈路的帶寬。控制器120所生成的帶寬分配可以幫助更有效地在經歷帶寬需求的時變變化的計算機網絡中路由網絡業務。
[0037]控制器120的模塊可以以各種方式來實現。例如,在一些實施方式中,業務監視模塊230和帶寬分配模塊240可以由在通用處理器上執行的計算機指令來定義。例如,業務監視模塊230和帶寬分配模塊240可以由與監視和配備(provis1n)網絡資源相關的邏輯操作集來定義。在其他實施方式中,業務監視模塊230和帶寬分配模塊240可以由例如FPGA(現場可編程門陣列)或ASIC(專用集成電路)的專用邏輯電路實現。例如,模塊可以包括FPGA或ASIC內的電路和邏輯指令的集合。除了硬件,模塊還可以包括創建用于所述計算機程序的執行環境的代碼,例如構成處理器固件、協議棧、數據庫管理系統、操作系統、跨平臺運行時環境、虛擬機、或上述一個或多個組合的代碼。例如,業務監視模塊230、帶寬分配模塊240、和數據庫260可以包括或共享一個或多個數據處理裝置、計算設備、或處理器。
[0038]在一些實施方式中,業務監視模塊230可以監視整個網絡100的網絡業務。例如,業務監視模塊230可以從下層交換機110和上層交換機105接收與當前帶寬使用和每個交換機發送和接收的網絡流的類型相對應的信息。替選地,業務監視模塊230可以通過監視網絡擁塞來確定帶寬需求。網絡監視模塊230可以確定第一下層交換機IlOa比第二下層交換機IlOb更擁塞。例如,擁塞可以通過監視在時段期間下層交換機110中的每個下層交換機110所丟棄的數據分組的相對數目來確定。業務監視模塊可以確定經歷更多丟棄數據分組的下層交換機110需要增加的帶寬。
[0039]在一些實施方式中,網絡100內的帶寬需求可以隨時間改變。例如,業務監視模塊230可以確定在第一時段期間,第一下層交換機IlOa經歷比第二下層交換機IlOb更高的帶寬需求。在隨后的時段期間,業務監視模塊230可以確定第二下層交換機IlOb經歷比第一下層交換機IlOa更高的帶寬需求。在一些實施方式中,業務監視模塊230可以根據時間識別網絡業務中的模式,并且可以在數據庫260中存儲與帶寬需求或所識別的模式相對應的信息。
[0040]帶寬分配模塊240可以確定要分配給第一下層交換機IlOa和第二下層交換機IlOb的相對帶寬。在一些實施方式中,帶寬分配模塊可以通過分配共享通信鏈路上可用的不同百分比的帶寬給第一下層交換機IlOa和第二下層交換機IlOb來調整帶寬分配。帶寬分配可以基于來自業務監視器230的信息。例如,帶寬分配模塊240可以直接與業務監視模塊230通信或者可以從數據庫260檢索網絡業務信息。帶寬分配模塊可以隨后分配更大百分比的可用帶寬給經歷更高需求的下層交換機。在兩個下層交換機的帶寬需求基本相等的情形中,帶寬分配模塊可以分配大約50%的共享通信鏈路給兩個下層交換機110中的每個下層交換機。帶寬分配模塊240所確定的帶寬分配可以存儲在數據庫260中。
[0041]帶寬分配模塊240還可以與上層交換機105和下層交換機110通信以確保帶寬根據所確定的帶寬分配而配備。帶寬分配模塊240可以控制網絡100中數據的傳輸。在一些實施方式中,在TDM方案中帶寬分配模塊240可以調整針對下層交換機110和上層交換機105之間經由光分路器115的通信所預留的時隙的相對持續時間或時間量。例如,如果帶寬分配模塊240確定帶寬應該在兩個下層交換機110之間均勻分割,則帶寬分配模塊240可以指派基本上相等持續時間的時隙給兩個下層交換機110中的每個下層交換機。時隙的相對持續時間可以根據帶寬分配的改變而改變。在其他實施方式中,帶寬分配模塊240可以通過其他手段來調整帶寬。例如,帶寬分配模塊240可以實現WDM方案,在WDM方案中可用于與兩個下層交換機110中的每個下層交換機通信的波長的數目與要分配給每個交換機的帶寬成比例。
[0042]圖2B是根據說明性實施方式的圖1中所示的上層交換機105的框圖。上層交換機105包括光發射器模塊265、路由模塊270、和存儲器280。上層交換機105的路由模塊270可以以各種方式實現。例如,在一些實施方式中,路由模塊270可以由在通用處理器上執行的計算機指令來定義。在其他實施方式中,上層交換機105可以包括實現路由模塊270且執行與傳送和接收數據分組相關的其他任務的專用邏輯電路,例如FPGA(現場可編程門陣列)或ASICX專用集成電路)。在一些實施方式中,存儲器280可以用于實現用于存儲用于由上層交換機105傳送的數據分組的緩沖區。存儲器280還可以存儲其他信息,諸如網絡拓撲信息或路由表。盡管光發射器模塊265在圖2B中被示為單個單元,在一些實施方式中,光學收發器模塊260可以實現為每個都連接到上層交換機105的相應端口的分立的收發器。
[0043]在一些實施方式中,路由模塊270可以確定數據分組是否應該使用直接鏈路(即經由端口 106或端口 108)或者使用共享鏈路(即經由端口 107)被傳送到下層交換機110中的一個下層交換機。例如,路由模塊270可以從存儲在存儲器280中的堆棧或隊列檢索數據分組。路由模塊270可以隨后確定通過其傳送檢索到的數據分組的端口。在一些實施方式中,路由模塊270可以使用包括在數據分組中的信息來選擇將通過其傳送數據分組的端口。路由模塊還可以與存儲在存儲器280中的路由表通信以選擇用于數據分組的傳輸端口。
[0044]在一些實施方式中,路由模塊270可以使用其他信息來選擇用于傳送數據分組的適當端口。例如,控制器120可以確定用于耦合到端口 107的共享鏈路的帶寬分配,如上所討論的。路由模塊270可以使用帶寬分配來選擇用于發射數據分組的端口。在一些實施方式中,路由模塊可以直接與控制器120通信以接收與帶寬分配相對應的信息。在其他實施方式中,控制器120可以發射與帶寬分配相對應的信息到存儲器280,且路由模塊270可以通過對存儲器280進行查詢來檢索信息。
[0045]在一些實施方式中,路由模塊270可以從存儲器280檢索數據分組并且可以首先試圖在相應的直接通信鏈路上發送數據分組到期望的下層交換機。例如,如果帶寬在直接通信鏈路上可用,則路由模塊270可以控制光發射器模塊265通過耦合到直接鏈路的相應端口(即端口 106或端口 108)傳送數據分組。在一些實施方式中,耦合到給定下層交換機的直接通信鏈路可以是用于與該交換機通信的優選路徑,且該直接通信鏈路可以被使用,直到其飽和或者直到其帶寬的預選部分已經被使用。路由模塊270可以隨后確定共享通信鏈路的帶寬是否可用于與下層交換機的通信,且附加分組可以通過端口 107在共享通信鏈路上發送。
[0046]在其他實施方式中,直接通信鏈路可以不必是用于與下層交換機通信的優選路徑。例如,當通過直接通信鏈路到給定下層交換機的帶寬基本上等于可用于通過共享通信鏈路與交換機通信的帶寬時,路由模塊270可以實現等成本多路徑(ECMP)路由策略,在該策略中沒有一個通信鏈路比另一個優選。路由模塊270可以查詢存儲在存儲器280中的ECMP表,例如確定數據分組是應該在其相應的直接通信鏈路上還是應該在共享通信鏈路上被發送到下層交換機。
[0047]對于通過直接通信鏈路到給定下層交換機的帶寬不等于可用于通過共享通信鏈路與交換機通信的帶寬的情形,路由模塊270可以實現加權成本多路徑(WCMP)路由策略以確定是在直接通信鏈路上還是在共享通信鏈路上發送數據分組。例如,共享通信鏈路具有的可用于與期望的下層交換機通信的帶寬可以是到該交換機的直接通信鏈路的三倍。路由模塊270可以在確定哪個鏈路用于數據分組時使用該比率,例如每三個數據分組被引導到共享通信鏈路,將一個數據分組引導到直接通信鏈路。
[0048]如上所討論的,光發射器模塊265可以包括若干光發射器,每個光發射器親合到相應的端口。在一些實施方式中,每個端口可以具有多于一個的發射器。例如,每個端口可以耦合到多個發射器,每個發射器被配置成以不同波長傳送光學信號。路由模塊270可以控制發射器中的每個發射器實現WDM和/或TDM數據傳輸方案。
[0049]圖3是用于在計算機網絡中傳送數據的過程300的流程圖。過程300包括由上層交換機在直接通信鏈路上傳送第一數據分組到第一下層交換機(階段305)。過程300包括由上層交換機通過經由共享通信鏈路耦合到上層交換機的光分路器傳送第二數據分組到第一下層交換機(階段310)。過程300包括由上層交換機通過光分路器傳送第三數據分組到第二下層交換機(階段315)。
[0050]過程300包括由上層交換機在直接通信鏈路上傳送第一數據分組到第一下層交換機(階段305)。直接通信鏈路專用于上層交換機和第一下層交換機之間的通信。因此,沒有第一數據分組被另一計算設備錯誤處理的風險且不需要根據設計用于便利共享鏈路上的通信的復用方案傳送第一數據分組。在一些實施方式中,直接通信鏈路是耦合到上層交換機和第一下層交換機上的端口的多模光纖電纜。多模光纖電纜可以比單模式光纖電纜便宜。多模光纖電纜的光學屬性很好地適用于在直接通信鏈路中使用,并且因此使用多模光纖電纜來形成直接通信鏈路可以降低網絡的整體成本。
[0051]過程300包括由上層交換機通過經由共享通信鏈路耦合到上層交換機的光分路器傳送第二數據分組到第一下層交換機(階段310)。光分路器可以耦合到第一下層交換機和第二下層交換機二者。在一些實施方式中,光分路器無源地分割從上層交換機接收的信號并且將信號傳送到兩個下層交換機。因為信號由光分路器來分割,從上層交換機到光分路器以及從光分路器到第一下層交換機和第二下層交換機的通信鏈路可以由單模光纖電纜形成。相對于多模光纖電纜,單模光纖電纜可以更可靠地傳送由無源光分路器分割的光學信號。多個技術可以用于防止第二下層交換機處理希望僅由第一下層交換機處理的第二數據分組。
[0052]在一些實施方式中,第二數據分組可以包括附加于第二數據分組的報頭信息。報頭信息可以包括將第一下層交換機唯一地識別為數據分組的目的地的信息。當第二數據分組由第一下層交換機和第二下層交換機二者從光分路器接收時,每個下層交換機可以檢查報頭以確定該交換機是否預期處理第二數據分組。第一下層交換機可以確定其是希望的目的地且可以因此處理第二數據分組。第二下層交換機可以確定其不是預期的目的地,且可以因此忽略數據分組。
[0053]在其他實施方式中,諸如WDM和/或TDM的復用方案,可以用于傳送第二數據分組。例如,耦合到上層交換機和下層交換機的控制器可以指派一個或多個波長用于上層交換機和第一下層交換機之間的通信。在一些實施方式中,波長的數目是基于相對于為上層交換機和第二下層交換機之間的通信而預留的帶寬的量而要被分配給第一下層交換機的帶寬的量而確定的。通過光分路器傳送第二數據分組到第一下層交換機可以因此包括以已經為第一下層交換機預留的波長傳送第二數據分組。
[0054]在其他實施方式中,相應的時隙可以為上層交換機和兩個下層交換機之間的通信所預留。傳送第二數據分組可以包括在為第一下層交換機預留的時隙期間傳送第二數據分組。在該時隙期間,與第二下層交換機相關聯的接收器可以被關閉以防止第二下層交換機處理第二數據分組。
[0055]過程300包括由上層交換機通過光分路器傳送第三數據分組到第二下層交換機(階段315)。為了防止第三數據分組錯誤地被第一下層交換機處理,第三數據分組可以包括將第二下層交換機唯一地識別為第三數據分組的目的地的報頭信息。當第三數據分組被第一下層交換機和第二下層交換機二者從光分路器接收時,每個下層交換機可以檢查報頭以確定該交換機是否預期處理第二數據分組。第二下層交換機可以確定其是預期的目的地且可以因此處理第二數據分組。第一下層交換機可以確定其不是預期的目的地,并且可以因此忽略數據分組。
[0056]在其他實施方式中,控制器可以指派一個或多個波長用于上層交換機和第二下層交換機之間的通信。波長的數目是基于相對于為上層交換機和第一下層交換機之間的通信而預留的帶寬的量而要被分配給第二下層交換機的帶寬的量而確定的。通過光分路器傳送第三數據分組到第二下層交換機可以因此包括以已經為第二下層交換機預留的波長傳送第三數據分組。
[0057]在其他實施方式中,相應的時隙可以為上層交換機和兩個下層交換機之間的通信所預留。傳送第三數據分組可以包括在為第二下層交換機所預留的時隙期間傳送第三數據分組。在該時隙期間,與第一下層交換機相關聯的接收器可以被關閉以防止第一下層交換機處理第三數據分組。
[0058]圖4是在下層交換機之間均勻地分布共享通信鏈路的示例計算機網絡400。計算機網絡400包括五個上層交換機405a-405e (概括被稱為上層交換機405)和兩個下層交換機410a和410b(概括被稱為下層交換機410)。每個上層交換機405經由單個直接通信鏈路耦合每個下層交換機410。每個上層交換機405還親合到相應的無源光分路器415a-415e(概括被稱為光分路器415)。每個光分路器415無源地將從上層交換機405接收到的光學信號分割為兩個輸出信號,使得接收到的光學信號通過光分路器415被傳送到兩個輸出通信鏈路。
[0059]在兩個下層交換機410之間均勻地分布每個光分路器415的輸出。也就是,每個光分路器415經由單個鏈路被耦合到每個下層交換機410。通信鏈路的這種布置提供了對于每個下層交換機410平均相等帶寬的可能性,同時仍舊準許通過重新分配共享通信鏈路的帶寬到經歷更高帶寬需求的下層交換機410來在網絡400中調整帶寬。盡管每個光分路器415在圖4中被示出為將從上層交換機405接收到的信號分割為兩個輸出信號,其他配置也是可能的。例如,光分路器415可以將從上層交換機405接收到的輸入信號分割成傳送到下層交換機410的三個或更多信號。在一些實施方式中,附加的分路器輸出還可以在第一下層交換機410a和第二下層交換機410b之間或者在多于兩個的下層交換機410之間均勻地被分割。
[0060]圖4中所示的平衡配置在期望下層交換機410之間的帶寬需求長期平均基本相等但可以經歷下層交換機410所需求的帶寬的短時尖峰的應用中會是特別有用的。許多數據中心展示了來往于某些計算設備的業務的突發,且這些突發通常是短持續時間的且在時間上隨機分布。網絡400的平衡布置會對于這樣的數據中心有用。
[0061]諸如圖1和圖2A中所示的控制器120的控制器(未示出)可以用來分配網絡400中的共享鏈路的帶寬。例如,帶寬可以使用諸如WDM和/或TDM的復用方案來分配,如上所述。控制器可以監視兩個下層交換機410的帶寬需求并且可以調整對共享鏈路的帶寬的分配以更有效地滿足需求。網絡400的平衡性質允許帶寬快速增加或減少,而每個上層交換機405和每個下層交換機410之間的直接通信鏈路提供對每個下層交換機410的保證最小帶寬。
[0062]圖5是在多于兩個的下層交換機上分布共享通信鏈路的示例計算機網絡500。網絡500包括六個上層交換機505a-505f (概括被稱為上層交換機505)和四個下層交換機510a-510d(概括被稱為下層交換機510)。每個上層交換機505也耦合到相應的無源光分路器515a-515f(概括被稱為光分路器515)。每個光分路器515無源地將從上層交換機505接收到的光學信號分割成兩個輸出信號,使得接收到的光學信號通過光分路器515被傳送到兩個輸出通信鏈路。為了說明性目的,在上層交換機505和下層交換機510之間沒有示出任何直接通信鏈路。但是,在一些實施方式中,每個上層交換機505可以通過一個或多個直接通信鏈路耦合到每個下層交換機510。這樣的直接通信鏈路可以為每個下層交換機510提供保證最小帶寬。在其他實施方式中,網絡500可以包括附加光分路器515。例如,附加光分路器515可以被配置成每個都耦合到相應的上層交換機505以及耦合到一對下層交換機510。可以通過包括耦合到每對下層交換機510的光分路器515來更均勻地分配帶寬。
[0063]每個光分路器515的輸出在下層交換機510之間不均勾地分布。例如,每個光分路器515包括到第一下層交換機510a的一個鏈路。但是,其他下層交換機510b-510d每個都僅耦合到六個光分路器515中的兩個。相比于下層交換機510b-510d,這個布置將更平均的帶寬傳遞給下層交換機510a。盡管每個光分路器515在圖5中被示出為將從上層交換機505接收到的信號分割為兩個輸出信號,其他配置也是可能的。例如,光分路器515可以將從上層交換機505接收的輸入信號分割成傳送到下層交換機510的三個或更多個信號。在一些實施方式中,附加分路器輸出還可以在第一下層交換機510a和第二下層交換機510b之間不均勻地分割,以便增加到下層交換機510中的一個下層交換機的帶寬。
[0064]圖4中所示的不均勻配置在期望下層交換機510a的帶寬需求長期平均一致地超過下層交換機510b-510d的帶寬需求的應用中會是有用的。例如,對于數據頻繁地從下層交換機50b-510d中的每個下層交換機轉移到下層交換機510或反之的計算機網絡,網絡500的不均勻配置可以提供更有效的數據傳送。
[0065]在一些實施方式中,諸如圖1和圖2A中所示的控制器120的控制器(未示出)可以用于更有效地使用網絡500的通信鏈路。例如,對于需要從下層交換機510b-510d到下層交換機510a的批量數據轉移的應用,控制器可以分配共享鏈路的帶寬以準許交換機510b-510c在第一時段期間上載數據到上層交換機505。在隨后的時段期間,控制器可以通過將共享鏈路配置成準許上層交換機505下載所有數據到下層交換機510a來利用網絡500的不均勻特性的益處。在一些實施方式中,控制器可以實現WDM方案以準許從下層交換機510b-510d上載以及下載到下層交換機510a基本上同時發生。
[0066]圖6A是包括無源光分路器615的示例計算機網絡600。網絡600包括兩個上層交換機605a和605b (概括被稱為上層交換機605)和兩個下層交換機6 1a和61 Ob (概括被稱為下層交換機610)。網絡600還包括無源光分路器615。無源光分路器615包括四個通信端口。網絡600中的每個交換機被光纖通信鏈路耦合到無源光分路器615的相應端口。光分路器被配置成將從兩個上層交換機605中的任一個上層交換機接收到的信號無源地輸出到兩個下層交換機610 二者。例如,從上層交換機605發送到光分路器615的信號可以被分割且輸出到兩個下層交換機610 二者。類似地,從上層交換機605a發送到光分路器615的信號也可以被分割且輸出到兩個下層交換機610 二者。
[0067]如上所討論的,2x2無源光分路器615通常用于光學網絡且以相對低成本廣泛可用。在一些實施方式中,無源光分路器615可以用來實現圖1中所示的三端口光分路器115。例如,連接到上層交換機605a的端口可以連接到圖1的上層交換機105的端口 107、連接到下層交換機610a的端口可以連接到圖1的下層交換機IlOa的端口 112、并且連接到下層交換機61Ob的端口可以連接到圖1的下層交換機11Ob的端口 113。因為光分路器115包括比光分路器615更少的端口,光分路器615的一個端口(即圖6A中示出耦合到上層交換機605b的端口)可以簡單保持未連接。替選地,該額外端口可以連接到上層交換機105的另一端口。這樣的冗余通信鏈路可以用于在到上層交換機105的第一鏈路故障時增加可靠性。
[0068]光分路器615可以用于其他配置以實現具有任何數目的輸入和輸出端口的光分路器。例如,如上所討論的,光分路器615可以用于通過使得其上端口中的一個上端口斷開連接來實現1x2光分路器。在一些實施方式中,若干光分路器615可以互相耦合以實現具有更大數目輸入和輸出端口的光分路器。下面描述具有附加光分路器的網絡的若干不例。
[0069]圖6B是包括四個無源光分路器615a_615d(概括被稱為無源光分路器615)的示例計算機網絡601。網絡還包括四個上層交換機605a-605d(概括被稱為上層交換機605)和四個下層交換機610a-610d(概括被稱為下層交換機610)。無源光分路器615中的每個無源光分路器類似于圖6A中所示的無源光分路器615。例如,每個無源光分路器615包括四個端口(即兩個上端口和兩個下端口)且被配置成將在上端口中的任一個上端口處接收到的信號傳送到兩個下端口二者。在一些實施方式中,網絡601可以表示簡化的數據中心網絡。例如,下層交換機610可以表示可以耦合到數據中心中諸如服務器的其他計算設備的架頂式交換機。上層交換機605可以用于便利下層交換機610和它們所連接到的計算設備之間的通信。
[0070]無源光分路器615耦合到上層交換機605、下層交換機610、以及耦合到三個其他光分路器615中的兩個光分路器。無源光分路器615a的第一下端口耦合到無源光分路器615c的第一上端口。無源光分路器615a的第二下端口耦合到無源光分路器615d的第一上端口。無源光分路器615b的第一下端口耦合到無源光分路器615c的第二上端口。無源光分路器615b的第二下端口耦合到無源光分路器615d的第二上端口。該配置允許無源光分路器615邏輯上用作單個光分路器,將從上層交換機605中的一個上層交換機接收到的每個信號輸出到所有下層交換機610。
[0071]例如,從上層交換機605a傳送的信號617可以由無源光分路器615a來接收。無源光分路器615a可以在其兩個下端口二者上輸出接收到的信號617,使得信號617被無源光分路器615c和615d接收。類似地,無源光分路器615c和615d可以通過其相應的下端口將接收到的信號617輸出到下層交換機610a-610d。因此,從上層交換機605a傳送的信號617被傳送到所有下層交換機610a-6 1d。由于相同的原理,從其他上層交換機605b_605d中的任何其他上層交換機傳送的信號也將由所有下層交換機610a-610d通過無源光分路器615接收。圖6B中所示的光分路器615的配置可以因此被用于邏輯上實現單個4x4光分路器。在一些實施方式中,附加的光分路器可以添加到網絡601中以任意地增加潛在輸入和輸出的數目。任何不必要的輸入或輸出端口可以保持斷開連接或者可以用于冗余,如上所討論的。
[0072]在一些實施方式中,復用可以用于避免網絡601中的數據沖突并且確保從上層交換機605發送的數據僅由預期的下層交換機610來處理。例如,如上所討論的,TDM、WDM或其他復用方案可以用來在網絡601上傳送和接收數據。
[0073]圖7是包括四個無源光分路器715a_715d(概括被稱為無源光分路器715)的第二示例計算機700。網絡還包括六個交換機705a-705f (概括被稱為交換機705)、六個循環器707a-707f (概括被稱為循環器707)以及兩個鏡子709a和709b (概括被稱為鏡子709)。光分路器715以類似于圖6B中所示的光分路器615的布置的方式而互相耦合。例如,無源光分路器715a的第一下端口耦合到無源光分路器715c的第一上端口。無源光分路器715a的第二下端口耦合到無源光分路器715d的第一上端口。無源光分路器715b的第一下端口耦合到無源光分路器715c的第二上端口。無源光分路器715b的第二下端口耦合到無源光分路器715d的第二上端口。該配置允許無源光分路器715邏輯上用作具有四個輸入和四個輸出的單個光分路器,如上所討論的。在一些實施方式中,網絡700可以表示簡化的數據中心網絡。例如,交換機705可以表示可以耦合到數據中心中諸如服務器的其他計算設備的架頂式交換機。
[0074]交換機705每個通過相應的循環器707耦合到光分路器715中的一個光分路器的相應端口。循環器準許光分路器715和交換機705之間的雙向通信。鏡子709a親合到光分路器715b的上端口且鏡子709b耦合到光分路器715d的下端口。每個鏡子709被配置成將接收到的光學信號反射回到其被傳送的光分路器715。交換機705、循環器707、鏡子709、和光分路器715的布置允許任何交換機705所傳送的信號被所有其他交換機705接收。
[0075]例如,數據信號717可以由交換機705a通過循環器707a傳送到光分路器715a。光分路器715a可以將接收到的信號717進行分割并且在其兩個下端口二者輸出信號717(即,輸出到光分路器715c和715d)。分路器715c和715d類似地可以將接收到的信號717進行分割,使得信號717從其兩個下端口二者輸出到交換機705d、705e和705f,以及到鏡子709b。鏡子709b將信號717反射回光分路器715d,光分路器715d再次對信號617進行分割,且在其兩個上端口上輸出反射的信號717到光分路器715a和715b。信號717隨后由光分路器715a和715b通過循環器707a-707c輸出到交換機705a-705c。因此,由交換機705傳送的信號717被傳送到所有其他交換機705b-705f。在一些實施方式中,交換機705a可以被配置成當信號617被傳送回到交換機705a時忽略其傳送的信號717。由網絡700中任何其他交換機705所傳送的信號類似地由所有其他交換機705接收。
[0076]在一些實施方式中,包括循環器707和鏡子709可以用來增加在具有給定數量的光分路器707的網絡中實現的端口的數量。例如,網絡700和圖6B中所示的網絡601每個都包括四個光分路器。但是,網絡700可以將從第一交換機705接收的信號廣播到五個附加交換機705,而網絡600可以傳送從第一交換機接收的信號到僅四個附加的交換機。
[0077]本說明書中描述的主題和操作的實施方式可以實現為數字電子電路,或者計算機軟件、固件、或硬件,包括在本說明書中公開的結構及其結構等價物,或者它們中一個或多個的組合。本說明中描述的主題可以被實現為一個或多個計算機程序,即一個或多個計算機程序指令的模塊,在一個或多個計算機存儲介質上編碼,以便被數據處理裝置執行,或控制數據處理裝置的操作。
[0078]計算機可讀介質可以是計算機可讀存儲設備、計算機可讀存儲基板、隨機或串行存取存儲器陣列或設備、或者它們中一個或多個的組合,或者包括在其中。而且,盡管計算機可讀介質不是傳播信號,計算機存儲介質可以是在人工生成的傳播信號中編碼的計算機程序指令的源或目的地。計算機存儲介質可以是一個或多個分立的組件或介質(例如,多個CD、盤、或者其他存儲設備),或被包括于其中。因此,計算機可讀介質是有形的且非暫時性的。
[0079]本說明書中描述的操作可由數據處理裝置針對存儲在一個或多個計算機可讀存儲設備上或從其他源接收的數據來執行。術語“數據處理裝置”或“計算設備”包含用于處理數據的所有種類的裝置、設備、和機器,例如包括可編程處理器、計算機、片上系統、或其多個、或上述的組合。裝置可以包括專用邏輯電路,例如FPGA(現場可編程門陣列)或ASIC。除了硬件,裝置還可以包括創建所述計算機程序的執行環境的代碼,例如構建處理器固件、協議桟、數據庫管理系統、操作系統、跨平臺運行時環境、虛擬機、或它們中的一個或多個的組合的代碼。裝置和執行環境可以實現各種不同的計算模型基礎設施,諸如web服務、分布式計算、和網格計算基礎設施。
[0080]計算機程序(也被稱為程序、軟件、軟件應用、腳本、或代碼)可以以任何形式的編程語言來編寫,包括編譯或解釋語言、聲明或流程語言,且其可以以任何形式部署,包括作為單獨程序或作為模塊、組件、子例程、對象、或者適于在計算環境中使用的其他單元。計算機程序可以,但不需要,與文件系統中的文件相對應。程序可以存儲在保持其他程序或數據的文件的一部分中(例如存儲在標記語言文檔中的一個或多個腳本),存儲在專用于所述程序的單個文件中,或者存儲在多個協調文件中(例如,存儲一個或多個模塊、子程序、或代碼部分的文件)。計算機程序可以被部署為在一個計算機上或位于一個站點或在多個站點分布且通過通信網絡互連的多個計算機上執行。
[0081 ] 適合于計算機程序的執行的處理器包括例如通用和專用微處理器二者,以及任何種類的計算機的任何一個或多個處理器。通常,處理器將從只讀存儲器或隨機存取存儲器或二者接收指令和數據。計算機的必要元件是用于根據指令執行動作的處理器以及用于存儲指令和數據的一個或多個存儲器設備。通常,計算機還將包括,或者操作地耦合用于從用于存儲數據的一個或多個大容量存儲設備接收數據或向其傳送數據,大容量存儲設備例如磁盤、磁光盤、或光盤。但是,計算機不需要具有這樣的設備。
[0082]盡管本說明書包含許多【具體實施方式】細節,這些不應該被解釋為對任何發明或可以要求保護的范圍的限制,而是具體對于特定發明的特定實施方式的特征的描述。本說明書中在分立的實施方式的場境中所述的某些特征還可以在單個實施方式中組合實現。反之,在單個實施方式場境中所述的各種特征也可以在多個實施方式或在任何適合的子組合中分立地實現。而且,盡管特征可以如上描述為在某些組合中動作且甚至最初這樣要求保護,來自所要求保護的組合的一個或多個特征可以在某些情況下從組合中剝離,且所要求保護的組合可能涉及子組合或子組合的變型。
[0083]類似地,盡管以特定次序在附圖中描繪了操作,這不應該被理解為需要這樣的操作以所示的特定次序或順序次序來執行,或者執行所有圖示的操作來獲取想要的結果。在特定環境中,多任務和并行處理可能是有利的。而且,上述實施方式中的各種系統組件的分立不應該被理解為在所有實施方式中需要這樣的分立,且應該理解,所述程序組件和系統通常可以集成在單個產品或封裝到多個產品中。
[0084]這樣,已經描述了主題的特定實施方式。其他實施方式在所附權利要求的范圍內。在一些情況下,權利要求中所述的動作可以以不同次序來執行且仍舊獲取所需的結果。此夕卜,附圖中所描繪的過程不必要求所示的特定次序,或者順序次序,來獲取所需結果。在某些實施方式中,多任務和并行處理可能是有利的。
【主權項】
1.一種計算機網絡,包括: 第一下層交換機,所述第一下層交換機具有第一端口和第二端口 ; 第二下層交換機,所述第二下層交換機具有第一端口和第二端口 ; 上層交換機,所述上層交換機具有直接耦合到所述第一下層交換機的所述第一端口的第一端口和直接耦合到所述第二下層交換機的所述第一端口的第二端口 ; 第一無源光分路器,所述第一無源光分路器具有耦合到所述上層交換機的第三端口的第一端口、耦合到所述第一下層交換機的所述第二端口的第二端口、和耦合到所述第二下層交換機的所述第二端口的第三端口,所述第一無源光分路器被配置成傳送在其第一端口處接收的信號作為其第二端口和第三端口 二者上的輸出信號;以及 控制器,所述控制器被耦合到所述第一下層交換機、所述第二下層交換機和所述上層交換機,所述控制器被配置成控制所述第一下層交換機、所述第二下層交換機和所述上層交換機的數據的傳輸,其中,所述控制器被進一步被配置成:通過基于所述第一下層交換機和所述第二下層交換機的相對帶寬需求而交替地分配相應的傳輸時隙給所述第一下層交換機和所述第二下層交換機,來控制所述第一下層交換機和所述第二下層交換機通過所述第一無源光分路器將數據分組傳送到所述上層交換機。2.如權利要求1所述的計算機網絡,其中,所述控制器被進一步配置成: 確定由所述上層交換機傳送的數據分組預期由所述第一下層交換機接收; 控制所述上層交換機將所述數據分組傳送到所述第一無源光分路器;以及 控制所述第二下層交換機在通過所述第一無源光分路器傳送所述數據分組的時間段期間忽略從所述第一無源光分路器接收的網絡數據。3.如權利要求1所述的計算機網絡,其中,所述控制器被進一步配置成: 控制所述上層交換機以第一波長將預期由所述第一下層交換機接收的數據分組傳送到所述第一無源光分路器;以及 控制所述上層交換機以與所述第一波長不同的第二波長將預期由所述第二下層交換機接收的數據分組傳送到所述第一無源光分路器。4.如權利要求1所述的計算機網絡,其中,所述控制器被進一步配置成: 控制所述上層交換機使用第一調制格式將預期由所述第一下層交換機接收的數據分組傳送到所述第一無源光分路器; 控制所述上層交換機使用不同于所述第一調制格式的第二調制格式將預期由所述第二下層交換機接收的數據分組傳送到所述第一無源光分路器; 控制所述第一下層交換機使用所述第一調制格式從所述第一無源光分路器接收數據分組;以及 控制所述第二下層交換機使用所述第二調制格式從所述第一無源光分路器接收數據分組。5.如權利要求1所述的計算機網絡,其中,所述上層交換機的所述第一端口經由多模光纖電纜耦合到所述第一下層交換機的所述第一端口。6.如權利要求1所述的計算機網絡,其中,所述上層交換機的所述第三端口經由單模式光纖電纜耦合到所述第一無源光分路器。7.如權利要求1所述的計算機網絡,其中,所述第一下層交換機和所述第二下層交換機是數據中心中的架頂式交換機。8.如權利要求1所述的計算機網絡,進一步包括:第二無源光分路器,其中,所述第一無源光分路器的所述第二端口通過所述第二無源光分路器耦合到所述第一下層交換機的所述第二端口。9.如權利要求8所述的計算機網絡,進一步包括: 第二上層交換機,所述第二上層交換機具有耦合到所述第一無源光分路器的第四端口的第一端口。10.如權利要求9所述的計算機網絡,進一步包括:鏡子,所述鏡子耦合到所述第二無源光分路器,其中,所述鏡子被配置成:通過所述第二無源光分路器和所述第一無源光分路器,將從所述第二光分路器接收到的光信號反射到所述第二上層交換機。11.一種用于在計算機網絡中傳送數據的方法,所述方法包括: 確定第一下層交換機和第二下層交換機的相對帶寬需求; 基于所確定的相對帶寬需求,將相應的傳輸時隙分配給所述第一下層交換機和所述第二下層交換機; 由上層交換機在直接通信鏈路上將第一數據分組傳送到所述第一下層交換機; 在分配給所述第一下層交換機的時隙期間,由所述上層交換機通過第一光分路器將第二數據分組傳送到所述第一下層交換機,所述第一光分路器由共享通信鏈路耦合到所述上層交換機、所述第一下層交換機和所述第二下層交換機;以及 在分配給所述第二下層交換機的時隙期間,由所述上層交換機通過所述第一光分路器將第三數據分組傳送到所述第二下層交換機。12.如權利要求1所述的方法,進一步包括:由所述上層交換機通過所述第一光分路器和第二光分路器將第四數據分組傳送到所述第一下層交換機,所述第一光分路器和所述第二光分路器耦合到所述第一下層交換機。13.—種具有在其上編碼的指令的計算機可讀介質,所述指令在由一個或多個處理器執行時,致使所述處理器執行方法,所述方法包括: 確定第一下層交換機和第二下層交換機的相對帶寬需求; 基于所確定的相對帶寬需求,將相應的傳輸時隙分配給所述第一下層交換機和所述第二下層交換機; 由所述上層交換機在直接通信鏈路上將第一數據分組傳送到所述第一下層交換機; 在分配給所述第一下層交換機的時隙期間,由所述上層交換機通過光分路器將第二數據分組傳送到所述第一下層交換機,所述光分路器由共享通信鏈路耦合到所述上層交換機;以及 在分配給所述第二下層交換機的時隙期間,由所述上層交換機通過所述光分路器將第三數據分組傳送到所述第二下層交換機。
【文檔編號】G06F13/40GK106062728SQ201580011552
【公開日】2016年10月26日
【申請日】2015年1月30日 公開號201580011552.5, CN 106062728 A, CN 106062728A, CN 201580011552, CN-A-106062728, CN106062728 A, CN106062728A, CN201580011552, CN201580011552.5, PCT/2015/13809, PCT/US/15/013809, PCT/US/15/13809, PCT/US/2015/013809, PCT/US/2015/13809, PCT/US15/013809, PCT/US15/13809, PCT/US15013809, PCT/US1513809, PCT/US2015/013809, PCT/US2015/13809, PCT/US2015013809, PCT/US201513809
【發明人】浦田良平, 劉紅, 阿明·瓦達特, 克里斯托弗·萊勒·約翰森, 周峻嵐, 亞歷山大·施瑞爾
【申請人】谷歌公司