專利名稱::用于擁塞控制的方法和裝置的制作方法
技術領域:
:本發明涉及用于擁塞控制的方法和裝置。
背景技術:
:對于點播(on-demand)流服務,擁塞控制通常通過資源接納控制來執行。這樣的系統,或者通過監測其特征假設已知的正在進行的流的數量,或者通過直接監測流聚集的(瞬時)比特率,檢測其特征假設已知的新流是否仍然適合所有的鏈路,其中所述流將穿過這些鏈路。如果該檢測給出肯定的回答,則接收該流,否則拒絕該流。或者在應用層通過不建立會話,或者即使在已經建立會話時通過網絡邊緣的策略強制服務器(enforcer)來實施該決策(decision),其中網絡阻塞源自被拒絕流的業務。在這樣的架構中,用戶或者獲得完整質量的視頻,或者被拒絕提供服務。擁塞控制的一個可替換的方式是通過可伸縮的編解碼器。其中將每個多媒體流在重要性降低的層中進行編碼。相比于依靠資源接納控制(ResourceAdmissionControl),基于可伸縮編解碼器的方法從不拒絕用戶訪問服務,但是質量有時低于他/她所要求的質量。所有這些已知方法的缺陷是不能絕對保證更重要的分組不會被丟失或丟棄。為了克服這些缺陷,根據本發明的方法包括以下步驟監測到所述節點的傳入(incoming)流的量,使得基于所述傳入流的量和當前接受層數,通過參考動作表(actiontable)以確定進入所述節點的下一接受層數。這樣,通過讓接受層數基于之前的數量、基于傳入流的數量和基于動作表,可獲得更精確的擁塞控制方法,并同時確保可保留更重要的分組。在增強的實施方式中,基于朝向所述節點的觀測業務(observedtraffic)來動態調整該動作表。該實施方式具有這樣的優勢即決策會反映業務狀態、允許可允許的層進行更精確的確定,甚至更會提高質量。基于在觀測周期內觀測的業務以常規間隔動態地調整動作表,并由此使用馬爾可夫決策過程(MarkovDecisionProcess)來確定最佳動作表,甚至可獲得更好的質量。動作表可以由網絡擁塞控制器進行集中計算,并進一步與所述節點進行通信,或可以存儲在所述節點自己的本地。動作表可以在節點內進行本地更新,或通過網絡擁塞控制器進行集中更新。在動作表在節點內更新的情況下,可以執行通過參考所述動作表確定的作為結果的動作在實現所述方法的不同節點之間的通信,從而,在出現沖突的動作時,在所述節點中執行進一步啟發式(heuristic)的控制以修改每一節點的下一可接受層數。按這種方式,可以解決在相鄰節點之間出現的潛在沖突情況。本發明還涉及用于實現本方法的擁塞控制設備,以及涉及用于將動作表和它們的更新通信給擁塞控制設備的某些實施方式的網絡擁塞控制器。3需要注意的是,在權利要求中使用的術語“耦合”,不應被解釋為限制到僅僅是直接連接的情況。因此,表述“設備A與設備B耦合”的范圍不應被限制為設備A的輸出與設備B的輸入直接連接的設備或系統。其意味者,在A的輸出和B的輸入之間存在路徑,其中該路徑可以是包括其它設備或裝置的路徑。需要注意的是,在權利要求中使用的術語“包括”,不應被解釋為限制為此后列舉的裝置。因此,表述“設備包括裝置A和B”的范圍不應被限制為設備僅包括元件A和B。其意味著對于本發明,僅設備的相關元件是A和B。通過參考下列對實施方式的描述并結合附圖,本發明的上述和其它目標和特征會變得更明顯,并會更好地理解本發明自身。圖1示出了用于實現本方法的實施方式的高級(high-level)架構;圖2示出了用于實現本方法的另一實施方式的另一高級架構;圖3示出了可擴展層的原理;圖4示出了在節點實現的實施方式中的擁塞控制設備的示意性實施方式;圖fe和圖恥示出了在擁塞控制設備的一些實施方式中使用的決策表;圖6示出了用于實現本方法的實施方式的第一流程圖;圖7示出了用于實現增強方法的步驟的流程圖;圖8示出了表示本方法的這種增強實施方式的效果的時序圖;圖9示出了擁塞控制設備的增強版本的示意性實施方式;圖10示出了用于實現本方法的不同實施方式的另一高級架構;以及圖11示出了用于實現本方法另一實施方式的另一高級架構;具體實施例方式說明書和附圖僅說明了本發明的原理。因此可以了解的是,盡管這里沒有明確進行介紹或說明,但是本領域技術人員能夠設計實施本發明原理并且包括在本發明的精神和范圍內的各種解決方式。此外,這里引用的所有實施例主要意在明確用于教學目的,以幫助讀者理解發明人對更多現有技術進行貢獻的本發明的原理和概念,并且應被解釋為不局限于這里特別引用的實施例和條件。此外,這里引用本發明的原理、方面和實施方式的所有聲明、以及其特定實施例,意在包括本發明的等價物。本領域技術人員應當理解的是,任何框圖在這里表示實施本發明原理的說明性電路的概念視圖。相似地,可以理解的是,任何流程圖、作業圖、狀態轉移圖、偽代碼等表示各種過程,其中所述過程可以實質上在計算機可讀介質中表示,并由計算機或處理器來執行,無論是否明確示出這樣的計算機或處理器。本方法的實施方式提出一種新型的通過可擴展(scalable)編解碼器的擁塞控制,將其稱為基于堵塞(choing-based)的擁塞控制。該方法可用于多個網絡中,例如在圖1中示意性描述的一個網絡。在下文中本發明的實施方式可被解釋為例如在DSL接入網絡中使用,但是本發明的其他實施方式在所有其它網絡類型中也是可行的,無論是固定的還是移動的。4在圖1中,多媒體服務器MM通過諸如服務聚合體(aggregator)的中間節點IM與至少一個接入點耦合。在圖1中,僅描述了它們中的3個,表示為Am至AN3。在真實網絡中,接入節點的數量可以容易地在10至100的范圍內。概括地說,這些接入節點中的每一個可以與表示為Ul至Un的個別用戶相耦合,一個接入節點典型地服務于100至1000個用戶。根據本發明的實施方式,至少一個節點包括擁塞控制設備。在圖1中,將實施方式描述為所有的節點均配備有這樣的擁塞控制設備,其中將各個接入節點Am至AN3中的擁塞控制設備表示為CCANl至CCAN3,并且CCIM用于表示包括在中間節點IM中的擁塞控制設備。僅在一個節點中包括擁塞控制設備的其他實施方式也是可行的,并不考慮該節點是接入節點或中間節點。在圖2中描述了這樣的實施方式,其中僅有中間節點包括根據本發明的擁塞控制設備,并且將在下面的段落中進行更為詳細的描述。根據本發明的擁塞控制設備的大部分實施方式,假設多媒體流以可擴展的方式進行編碼。可擴展視頻編碼是標準化的,例如在ITU-T推薦的H.沈4“用于通用視聽服務的高級視頻編碼”的附錄G中,并暗示由基礎層和至少一個增強層來構成編碼的視頻流。許多標準的編解碼器,例如MPEG2和MPEG4,具有可擴展的延伸,但是也可以使用其他專有的方案。在基于分組的傳輸中,與每個層相關聯的比特流以基于每個分組報頭中標識符的這種方式進行分組,其知道其屬于哪一層。一個實施例可以是IP報頭中可用于此目的的Diffkrv代碼點(DSCP)或服務類型(TOQ字節,從而識別分組屬于哪一層。然而也可以使用其他類型報頭的其它標識符。當在用戶前提下解碼器僅接收基礎層時,可以按基本質量對視頻進行解碼。解碼器接收的層越多,對解碼的視頻的質量就越好。如圖3所示,在層中具有確定特定層的重要性的順序層0是基礎層,是最重要的層,而具有最大數的層,在這里是L,是最不重要的層。對于任意層1,存在這樣的規則該層1是無用的,除非接收到所有的層0至層1-1。根據本發明,擁塞控制設備的大部分實施方式還依賴于由個別節點中的調度器來執行的調度技術,其中調度器是節點的一部分。在圖4中,將節點IM描述為包括表示為S的調度器。該調度器不會區別不同流的分組,但是會基于識別該層的標識符來區分與不同層相關聯的分組。這樣的調度技術會意味著節點包括輸入緩存,在圖4中用B表示,但是這不是必須的。該節點進一步包括擁塞控制設備CCIM的實施方式,其中它自己包括適于按諸如每秒的預定時隙進行確定和/或調整的控制器C,直到調度器適于在L+1個層中的層1允許傳入分組通過緩沖區B進入節點。如果到達并且允許包括層1,這意味著在下一個時隙具有表示W,1]范圍中層的標識符的所有分組會被接受,而傳入分組中的其余部分將被拒絕。當使用標準的SVC編碼時,多個節點已經包括調度機制,但是基于例如流的目的地來作出接受或拒絕分組的決策。然而,該機制不能解決擁塞問題。在其它現有的機制中,其它缺陷還涉及以下事實具有較大層數的不重要的層可能占用一些緩沖區空間,以損害較低層的緩沖區空間為代價。此外,在這些其它機制中,可允許的層數會隨著時間快速波動,導致不好的用戶體驗。其它缺陷是這樣現有技術系統會發生振蕩。根據本發明,擁塞控制設備的一個實施方式因此可包括控制器,其中控制器可用于基于l(t)的當前值、基于傳入到節點的流的當前數量n(t)和基于決策表T,在預定的時刻t確定用于下一特定時刻t+Ι的值1(t+1)。該控制器從而能夠確定在下一時隙t+Ι中支持哪個層1。在圖4中,控制器C適于在時刻t從監測設備M接收輸入到節點的流Fl至Fn的數量η(t),并進一步查閱表示為T的決策表,從而能夠確定1(t+Ι)。將該值提供給調度器S,調度器因此基于它們的層標識符對傳入分組進行過濾,從而在時刻t+Ι僅允許直到層l(t+l)的分組通過并且緩存。在圖4中,該決策表被表示為T。這樣決策表的實施例如圖fe和圖恥所示。在圖fe中,決策表具有入口變量(entryvariable)最大層數1(t)、到該節點的傳入流的全部數量n(t)。其最后一列示出了根據這些入口的相關動作,該動作用“0”、“-”或“+”來表示。用“0”表示的動作意味著在下一時隙t+Ι,會允許相同數量的層(從0至1并且包括1)進入緩沖區。用“_”表示的動作意味著在下一時隙t+Ι,會允許較少的一個層進入緩沖區,導致將允許具有在0和1-1之間并包括0和1-1的層標識符的所有分組。用“+”表示的動作意味著在下一時隙t+Ι,例如,會允許更多的一個層進入緩沖區,導致允許具有在層0和層1+1之間并包括層0和層1+1的層標識符的所有分組。從而當讀取表fe中的第一行時,這意味著,如果在當前的時隙允許6個層進入緩沖區,而在該時隙中170個輸入流進入節點,只要在下一時隙涉及的允許進入緩沖區的層的數量不用改變,從而該數量保持為6。該表中第二行示出了如果在當前時隙允許6個層進入緩沖區,而在該時隙中有180個輸入流進入節點,可以在下一時隙進入存儲器的緩沖區的層的數量需要減小,例如相對于當前值減1,對應于在下一時隙中允許5個層。該表中第三行示出了如果當前允許7個層進入緩沖區并且節點當前接收130個輸入流,那么在下一時刻將允許8個層進入緩沖區。不同于增加1或減少1,這些動作“+”或“_”還意味著在其它實施方式中,例如可以允許減少或增加2個或3個層。表的另一實施例如圖恥所示。不同于輸入流的絕對數量,將流的數量n(t)分組到箱(bin)中。在該表中,頭三行表示如果在當前的時隙中允許l(t)=6個層進入緩沖區,1)如果流的數量在140和170之間并且包括邊界,則不進行任何動作,在下一時隙保持允許層的數量為6,例如l(t+l)=6(對應于表中顯示的第二行);2)在下一時隙如果具有多于170個流,則該動作是減少接受層的數量,例如從6減少到5(對應于表中顯示的第三行);以及3)如果具有小于140個流,該動作是增加接受層的數量,例如從6增加到7(對應于表中顯示的第一行)。可以對之前的表fe進行相似的考慮從而“+”動作可以表示增加可以大于或等于1的預定數量,而“-”動作可表示減少大于或等于1的數量,其可以與增加的預定數量相同,但是也可以不同。圖如類型的表列舉的所有可能的狀態,從而包括多個行,表示層數量和流數量的所有可能的組合。更具體地,如果沒有對節點當前支持的流的數量n(t)進行分類(bin),行的數量等于層的最大數量乘以流的最大數量,例如,10X1000=10000。分類允許表更短,例如,在表恥中描述的實施例中,每一層需要3個條目。在一個簡單的實施方式中,這樣的決策表可以存儲在節點或擁塞控制設備自身的本地。圖4示出了一個實施方式,其中該表存儲在擁塞控制設備CCIM中。該圖進一步示意性地示出了來自所有流的具有直到層1的標識符的分組以因此被允許進入緩沖區的原理。如該圖所示的,緩沖區自身不需要分成對應于不同層的幾個子緩沖區;這樣繪制僅僅是為了更好地說明來自所有流的分組可以通過,并基于它們的層數進行過濾的原理。圖6示出了用于實現所介紹方法的不同步驟的詳細實施方式的流程圖。該方法從監測當前時隙中傳入流Fl至而的數量開始。這可以通過監測設備M來執行,如圖4所示。在下一步驟中,將傳入流的這個數量以及當前最大允許的層l(t)用于確定表中合適的條目,其中該步驟還能從表中讀取作為結果的動作。這些步驟可以在控制器C中執行。根據作為結果的“動作”值,修改1(t+Ι)的值,并將該值回送給調度器S,其中調度器適于通過所有傳入分組來確定它們屬于哪個層,并相應地在層數小于或等于l(t+l)的情況下將它們傳遞給緩沖區,或在層數大于l(t+l)時丟棄它們。如果該協議用于傳輸,例如可以在IP報頭中發現分組的層標識符。基于它們報頭中的標識符來分類分組的方法對本領域技術人員來說是公知的,并因此不進行進一步詳細解釋。在更為復雜的實施方式中,擁塞控制設備適于定期更新該表,例如對于之前的實施例每20分鐘進行更新,其中用于確定l(t)和l(t+l)時刻的順序是按照秒的數量。該更新可以基于在觀測周期中朝向網絡節點的觀測業務,但這不是必須的。為了更新該表,擁塞控制設備CCIM適于對被稱為觀測周期的特定時間周期上的業務進行建模,其中觀測周期因此大于接受的更新層數的時隙。更精確地,其確定先驗(priori)選擇業務模型的一些參數。這樣的模型可以是馬爾可夫模型,但是如在下面段落中解釋的那樣,其也可以是其他的類型為了更新用于確定l(t+l)的決策表,方法例如可以包括下列過程除了當前激活的決策動作表之外,還保持了多個預先選擇或預先確定的可替換的決策表。這些表例如可通過在圖恥類型的分類表中設置門限來獲得以表示值的集合,其中可基于在每個層1僅需要2個門限的原則進行自我選擇以完全地指定所述表,并且與層1+1相關聯的門限大于與層i相關聯的門限的表是不合乎邏輯的。從而通過記住這些規則,可以容易地選擇有代表性的表的集合,并且將它們初始存儲在IM或擁塞控制器中。對于這些可替換的決策表中的每一個,如果該可替換的動作表可使用,則通過觀測周期計算會產生怎樣的值函數(valuefunction)0這樣的值函數例如由下面的公式(1)給出V[l(t),n(t)]=R[l(t),n(t),a(1(t),η(t))]+V[l(t+1),η(t+1)](1)其中V[1(t),n(t)](和V[1(t+1),η(t+1)])表示在時間t有1個接受的層和η個輸入流時的值函數(分別為時刻t+Ι的將來的值函數)R[l(t),n(t),a(l(t),n(t))]表示瞬時回報函數(rewardfunction)a(l(t),n(t))表示在時間t具有1個允許層和η個輸入流時采取的動作,如在決策表中所給出的。瞬時回報函數的一個實施例由下列公式(2)給出R[l(t),n(t),a(l(t),n(t))]=α·G(l(t))·ηα)_β·n(t)·max{(F_C)/F,0}-γ·n(t)·1{a(1(t),n(t))(2)其中,α、β和Y為具有下列解釋的正常數;α是運營商每個時間單元從每個支持的流獲得的回報,β是運營商對于每個丟失的分組必須支付的處罰,以及Y是運營商對于每個質量改變必須支付的處罰。α-G(Kt))是與時隙t內傳輸直到層1的流相關聯的回報,例如,單個用戶愿意支付以接收視頻的價格,并且該質量對應于層1。F是時隙t中的業務量。對于n(t)個流,F對應于n(t)·1(t)以及C是鏈路容量,也就是,每個時隙t能夠傳送的信息量。可替換地,可將C選擇為稍微小于鏈路容量以更好地避免溢出。在觀測周期后,如果累積的最大值超過了與激活的決策表相關聯的值,將已經累積最大值的可替換的決策表提升為激活的決策表。在這種情況下,將激活的決策表降為可替換的決策表中的一個。為了使該方法更有效,需要評估多個可替換的動作表。下面描述避免該問題的可替換的方法。對于該可替換的方法,首先必須基于業務觀測來創建轉換矩陣。這樣的轉換矩陣可以包含表示流的數量從特定值(由該條目的矩陣行索引的)增加/減少至另一值(由該條目的矩陣列索引的)的可能性的條目。在這種情況下,因此基于當前時隙t和下一時隙t+Ι中流的絕對數量之間的觀測差來構建轉換矩陣TRM[n(t),n(t+l)]。通過將該轉換矩陣作為輸入,用于確定l(t)的決策表可以基于例如馬爾可夫決策過程理論(在下文中縮寫為MDP理論)進行更新,在假設僅可以采用如在上述段落中提到那些的三個可能動作的情況下對值函數的平均值進行優化1)在下一時隙允許一個或多個額外的層,用動作“+”表示,2)在下一時隙允許相同量的層,用于動作“0”表示,或3)在下一時隙允許減少一個或多個層,用于動作“_”表示,這與之前描述的決策表涉及的動作相對應。通過這樣的轉換矩陣TRM[n(t),n(t+l)]和指定的值函數描述的馬爾可夫過程,MDP理論允許選擇最佳動作表。值函數V(l(t),n(t))可包括瞬時回報和自身根據轉換矩陣和所采取的動作預期的未來值的總和,如下列公式(3)所示V[l(t),n(t)]=R[1(t),η(t),a(1(t),η(t))]+ΣJRMtn(t),i]·V[1(t+1),i](3)其中V[1(t),n(t)]表示當在時間t具有1個接受層和η個輸入流時的值函數R[l(t),n(t),a(l(t),n(t))]表示瞬時回報函數a(l(t),n(t))表示當在時間t具有1個允許的層和η個輸入流時所采用的動作,如在決策表中給出的以及XiTRM[n(t),i]-V[l(t+l),i]表示與從狀態(l(t),n(t))移動到(1(t+Ι),η(t+Ι))相關聯的平均未來值,其中1(t+1)是由動作a(l(t),n(t))和允許層1(t)的當前數量所確定的下一時隙中的允許層的數量。事實上,1(t+1)=l(t)+l{a(1,n)=‘‘+’’}-l{aG,n)=‘‘_’’},其中Ia是指示函數(indicatorfunction),當陳述A為真時取值為1,否則取值為0。瞬時回報函數對1(0,11(0,乂1(0,11(0)]的實施例可以由已給出的公式(2)給出。這樣的回報函數的另一實施例可以由下列公式(4)給出R[l(t),n(t),a(l(t),n(t))]=α-G(l(t))-^·max{(F-C)/F,0}-γ·1{a(1(t),n(t))尹。“4)其中,8α、β和Y為正常數α-G(Kt))是與時隙t內傳輸直到層1的流相關聯的獎勵,例如,用戶愿意支付以接收視頻的價格,并且該質量對應于層1。F是時隙t中的業務量。對于η個流,F對應于η·1和C是鏈路容量。在公式⑵和⑷中,max{(F-C)/F,0}近似等于時隙t中丟失的分組,從而該第二項等于丟失分組的折扣(discount)。最后一項是與波動相關聯的折扣(其中l{a(1,n)#}是指示函數,如果a(l,n)=“0”時其取值為1,否則取值為0),其中波動阻礙了通常從時隙至時隙的最大支持層1的變化。圖7示意性地描述了該過程。在該實施方式中,第一個框示出了通過測量下一時隙中流的數量n(t+l)以及通過將其與之前測量的流的數量η(t)進行比較,如何逐步構建轉換矩陣TRM。更具體地,在開始時TRM的所有條目均設置為0。對于每個時隙t,TRM矩陣在具有數量為η(t)的行和具有數量為η(t+1)的列的條目增加1,以免發現流的測量數量實質上從n(l)變回n(t+2)。因此,在整個觀測周期之后,TRM矩陣中的每個條目通常包含輸入流從當前時隙t的n(t)(n(t)是索引行的變量)被改變為下一時隙的η(t+1)(η(t+1)表示索引列的另一變量)的次數。最后,對轉換矩陣進行歸一化(normalized),從而列的所有條目乘以相同的數,導致每個行的條目總和等于1。這能夠例如使用MDP理論的算法通過對值函數的迭代來獲得最佳的決策表T。該最佳決策表是使給定公式(2)的公式(1)最大化的決策表,如圖7所解釋的。一旦基于該MDP理論發現該最佳表,于是可以安裝該最佳表以在下一循環中使用,同樣如圖7所示。這種構建轉換矩陣和確定最佳決策表的過程可以在每個觀測周期T內完成,在優選實施方式中T>>時隙t。需要說明的是,觀測業務的周期不需要等于T,而可以更長,例如2T,并可在處理過程中進行適應。在這樣的情況下,觀測周期和表適應周期可以不同,并且每個都可以在處理過程中進行適應。基于該學習的模型,對于每個單獨節點,這種增強控制器的實施方式適于例如使用馬爾可夫決策過程(MDP)理論計算最佳的決策表。需要說明的是,盡管最佳決策表僅依賴于輸入流的當前量n(t),但采用的動作會考慮到業務可能的未來演化。例如,如果對于已經發生的所有可能事件將觀測周期選擇的足夠長,并且對于已知的每日演進足夠短,MDP理論允許預期最可能的未來演進。該學習過程的效果如圖8所示。該圖示出了作為時間t的函數的輸入流的量η的演進。該演進由粗黑線描述。在時刻0,該數量相當低,在下一時刻(1),該數量已經增加,等等。該圖還示出了在圖恥中描述的用于1的一個特定值的(分類)決策表類型的門限。對于1的該特定值,其中1因此是在當前時隙t內允許進入緩沖區的最高層,根據表恥存在兩個相關聯的門限。根據該表,如果n(t)在最低門限以下,則動作是“+”,如果n(t)位于兩個門限之間,則動作是“0”,并且如果n(t)超過最高門限,則動作是“_”。在圖中僅示出了用于一個特定1的最高門限。該圖解釋了在表調整周期上觀測業務(稱為增量調整)之后,計算并裝載新的決策表。參見圖恥類型的決策表,這里簡化為通過增加高門限的值來調整門限的值,如圖8所示。由于很難發生業務總量超出該門限的情況,因此基于該觀測,MDP算法的結果對于增加該門限是安全的。在圖9中示出了包括在一個節點中的這種更為復雜的擁塞控制設備CCIM’的更詳細的實現。相對于圖4,在該實施方式中,該中間節點包括額外的處理或其它設備,一個是表示為用于構建轉換矩陣的TRM,以及另一個是表示為用于根據由公式(1)和(2)給出的回報函數確定產生最佳回報的決策表的、導致更新決策表T的MDP。當然,所有的方法步驟也可以在控制器C’內或一個處理設備內執行。在這一點上,需要說明的是,在圖中示出的各種元件(包括標記為“控制器”的任何功能塊)的功能,可以通過使用專用硬件以及能夠執行與合適的軟件相關聯的軟件的硬件來提供。當由處理器提供時,該功能可由單個專用處理器、單個共享處理器、或多個單獨處理器(其中一些可是共享的)來提供。此外,明確使用的術語“處理器”或“控制器”不應被排他地解釋為涉及能夠執行軟件的硬件,并可隱含地包括,但不局限于,數字信號處理器(DSP)硬件、網絡處理器、專用集成電路(ASIC)、現場可編程門陣列(FPGA)、用于存儲軟件的只讀存儲器(ROM)、隨機訪問存儲器(RAM)和非易失性存儲器。還可包括其它常規或定制的硬件。除了之前描述的實施方式,其它實施方式是可能的,其中使用協調策略,以避免與相鄰節點之間可能矛盾的決策,每個節點可執行所解釋的方法。在基于樹的具有本地決策表的網絡架構中,用于這樣的協調策略的最簡單的示例可以基于主動的下降和小心的上升。更具體地,再次參見圖1的網絡,其可以包括強制下列策略1)強制來自AN的每個動作“_”,并忽略來自IM的動作“+”,例如,如果至少一個AN具有動作“_”,在IM中將動作“+”轉換為“0”;2)如果僅IM有動作“_”,并且所有AN具有動作“+”或“0”,在支持流的最大數量的AN上強制動作“_”;3)如果沒有AN需要動作“_”,并且僅一個AN需要動作“+”,僅在IM不需要動作“_”時允許這一點;4)如果沒有AN需要動作“_”,并且多于一個的AN需要動作“+”,僅允許一個AN執行動作“_”,例如,具有最小1和最大η的一個AN規定IM不需要動作“_”。擴展至多個節點從而可以使與每個本地狀態lk(t)、nk(t)相關聯的每個節點包括本地決策表,其中k表示每個節點的索引,節點k中合適的動作,加上協調或聯系中斷(tie-breaker)策略。這涉及在節點之間的不同擁塞控制設備之間的一些通信,其中所述通信利用圖10中個別擁塞控制設備之間虛線箭頭表示。或者還可以實現全局協調策略。在這一點上,每個節點的決策表不僅依賴于本地信息,而且還依賴于全局信息以及全局的中央實現的動作表可包括與(I1(t),Ii1(t),...,lk(t),nk(t),...,1K(t),nK(t))的每個可能組合相關聯的動作。在這種情況下,信息需要在將存儲該全局動作表的中央或全局網絡控制器和個別節點之間進行交換,從而它們中的每一個都具有它們自己的、不同的用于每個節點的動作表。將非本地的(I1(t),Ii1(t),...,lk(t),nk(t),...,1K(t),nK(t))的全部信息從全局網絡控制器通信給個別節點。除了該信息交換外,該全局網絡擁塞控制器的另一功能可以是確定表的更新。為10此目的,其對于每個節點k(=1...K)觀測流的數量nk(t)隨時間如何演進。這可以通過其網絡拓撲的知識和與應用提供商的信息交換來進行。從而適于基于在觀測周期T上的觀測,構建用于每個個別節點的轉換矩陣(以捕獲nk如何在節點k處演進)或用于網絡的全局轉換矩陣(以捕獲Oi1(t),...,nk(t),...,nK(t))如何演進)。其進一步適于解決用于每個個別節點(具有相同的本地回報功能和可能動作的相同集合)的或全局的該轉換矩陣的MDP,其中全部回報是本地回報的加權和。每個節點的決策表產生結果,并進一步通信給本地節點。即使在之前的情況下,假設它們已經訪問它們所擁有的擁塞狀態,并且假設它們知道需要協調動作的時間,節點各自確定并修改它們的動作表,并在需要聯系中斷過程的情況下,網絡擁塞控制可以自己計算可能的聯系中斷動作,并將它們通信給各節點,或者網絡擁塞控制器可將本地節點的決策相互轉發,從而它們因此可以作出它們所擁有的決策。圖11描述了具有中央或全局網絡擁塞控制器NC的實施方式。從而適于與不同節點中所有的個別擁塞控制設備進行通信。在另一實施方式中,可以通過鏈路上的比特率而不是通過測量流的數據來觀測業務。盡管上面已經結合特定裝置來介紹了本發明的原理,但是可以清楚地理解到,該說明僅作為示例,并不是對本發明范圍的限制,本發明的范圍由所附權利要求進行限定。權利要求1.一種用于在網絡節點中控制業務擁塞的方法,根據多個層(L)對所述業務進行分類,所述方法包括以下步驟監測到該節點的傳入流的量(n(t)),基于傳入流的所述量(n(t))和基于接受層的當前層數(l(t)),通過參考動作表(T)來確定進入所述節點的接受層的下一層數(l(t+l))。2.根據權利要求1所述的方法,其中基于朝向所述節點的觀測業務來動態調整所述動作表。3.根據權利要求2所述方法,其中基于在觀測期內觀測的業務以常規間隔來動態調整所述動態表,并且由此使用馬爾可夫決策過程來確定最佳動作表。4.根據權利要求1或3中任意一項所述的方法,其中動作表存儲在所述節點本地。5.根據前述權利要求1至3所述的方法,其中所述動作表由網絡擁塞控制器進行集中計算,并進一步將動作表傳送給所述節點。6.根據前述權利要求1至4中任意一項所述的方法,進一步包括在實現所述方法的不同節點之間進行通信的步驟,通過參考所述動作表來確定作為結果的動作,在出現沖突的動作時,在所述節點中執行啟發式的控制以修改對于每一節點的可接受層的下一層數。7.根據權利要求1至4中任意一項所述的方法,其中通過網絡擁塞控制器對所述動作表進行集中更新。8.一種用于控制業務擁塞的擁塞控制設備(CCIM;CCIM’;CCANl;CCAN2;CCAN3),其中根據進入網絡節點(IM;AN1;AN2;AN3)的多個層(L)的對業務進行分類,所述擁塞控制設備(CCIM;CCIM’)適于監測到該節點的傳入流的量(n(t)),并基于傳入流的所述量(n(t)),基于動作表(T)和基于接受層的當前層數(l(t)),確定接受層的下一層數(l(t+l)),從而僅允許由與接受層的所述層數相關的層數所標識的分組進如所述節點。9.根據權利要求8所述的擁塞控制設備(CCIM’),進一步適于基于在觀測期中觀測的朝向所述節點的業務來動態調整所述動作表。10.根據權利要求9所述的擁塞控制設備(CCIM’),適于基于在所述觀測期內觀測的業務以常規間隔動態調整所述動作表,由此通過使用馬爾可夫決策來確定最佳動作表。11.根據前述權利要求9至10中任意一項所述的擁塞控制設備(CCIM),進一步適于與另一節點中的另一擁塞控制設備進行通信,通過參考所述動作表確定作為結果的動作,并在出現沖突的動作時,進一步適于實現進一步啟發式控制以修改可接受層的下一層數。12.—種網絡節點(ANl;AN2;AN3;IM),其特征在于,所述網絡節點包括根據前述權利要求8至11中任意一項所述的擁塞控制設備(CCIM;CCIM’;CCAN2;CCAN3;CCIM)。13.一種用于與根據權利要求8的擁塞控制設備(CCIM)進行通信的網絡擁塞控制設備(NC),所述網絡擁塞控制設備(NC)適于確定所述動作表(T),并將所述動作表傳送給所述擁塞控制設備(CCIM)。14.根據權利要求13所述的網絡擁塞控制設備(NC),進一步適于基于觀測的業務來更新所述動作表,并將所述更新的動作表提供給所述擁塞控制設備(CCIM)。全文摘要提供一種用于在網絡節點中控制業務擁塞的方法,其中業務根據層(L)數進行分類,包括以下步驟監測傳入該節點的流的總量(n(t)),基于傳入流的所述總量(n(t))和接受層的當前數量(1(t)),通過咨詢動作表(T)來確定進入所述節點的接受層的下一數量(l(t+1))。在增強的實施方式中,在觀測期中根據觀測的業務調整動作表。文檔編號H04L12/54GK102461091SQ201080026777公開日2012年5月16日申請日期2010年6月10日優先權日2009年6月18日發明者D·德弗萊斯朔韋爾,D·洪,F·巴切利,K·萊文斯申請人:阿爾卡特朗訊公司