專利名稱:一種基于數學建模技術應用于p2p網絡的流量識別與控制的方法
技術領域:
本發明涉及數據通信領域的流量識別和控制技術,尤其涉及一種基于流量數學模 型匹配方法識別P2P流量并控制P2P流量的方法。
背景技術:
當前,P2P已經成為互聯網應用最廣泛的文件傳輸技術,根據不完全統計,運營商 骨干網帶寬60%左右是P2P軟件產生的流量,大量P2P導致網絡擁塞、帶寬浪費,造成整個 通信網絡效率下降。因此,如何識別和控制P2P是當前面臨的巨大挑戰。
基于P2P技術開發的軟件,具有如下幾個典型特征
1、軟件類型非常繁多,且采用的通信協議不規范,不標準; 2、每一個主機既是服務器,也是客戶端,沒有明顯的中央控制單元,流量具有網狀 連接特征,很難識別; 3、網絡逃避運營商等對P2P業務的控制,普遍采用加密傳輸、頻繁更新協議特征 等技術,導致識別控制困難。 傳統的P2P流量識別,如
公開日期為2006年3月22日,公開號為CN 1750538A 的發明申請,披露了利用特征碼(關鍵字)進行識別P2P流量的技術。但是,一旦出現新的 P2P軟件,或者P2P軟件特征碼更新,或者P2P軟件將流量加密,就無法識別P2P流量。
公開日期為2007年10月10日,公開號為CN 101051997A的發明申請,披露了利 用大于1024的TCP/UDP端口數進行P2P識別的技術。但是,該方法無法將P2P業務和端口 掃描、DdoS攻擊等類型的流量區分開來。
公開日期為2006年11月15日,公開號為CN 1863154A的發明申請,披露了利用 IP地址連接的通信對端IP地址的數量進行P2P識別的技術。但是該方法無法區分一個IP 地址是否屬于一個為眾多用戶提供服務器的設備,還是一個用戶在大量發起P2P連接。
發明內容
本發明通過對P2P技術特征的分析,得出典型的P2P流量模型,通過模型特征值的 提取,能夠非常高效便捷的對它們進行識別。 本發明提供一種基于數學建模技術應用于P2P網絡的流量識別與控制的方法,具 體包括以下步驟對網絡中的每一個IP地址的通信會話進行數學建模,采集該IP地址活動 會話所連接的對端IP地址分布、TCP/UDP端口分布和會話狀態信息,利用數學建模技術產 生數學模型特征值;將數學模型特征值與預設的P2P流量數學模型參數進行匹配;在與P2P 流量數學模型參數匹配的情況下,判定該IP地址當前正在使用P2P技術進行數據傳輸;根 據預先配置的P2P流量控制策略,對該IP地址的所有符合P2P特征的流量進行控制。
上述預設的P2P流量數學模型參數包括最小IP地址擴散度Cip、最小TCP/UDP端 口擴散度Mport、最大會話接通率Cratemax和最小會話接通率Cratemin,上述四個參數被配置到數學模型庫中。 如上所述的方法,對網絡中的每一個活動IP計算它的數學模型特征值,包括每一
個IP地址的連通性擴散度Xip、端口擴散度Xport和會話接通率Xrate。 當同時滿足Xip > Cip、 Xport > Mport禾口 Cratemin < Xrate < Cratemax時,判
定該IP地址當前正在使用P2P技術,之后利用令牌桶算法(token bucket)將P2P報文進
行報文排隊處理,用以限制該IP地址的P2P流量的最高峰值,或者限制該IP地址單位時間
內能夠傳輸的P2P流量的總數據量,或者限制該IP地址的P2P流量的會話數。 本發明優于背景技術中舉例的三個發明所采用的技術具體體現在 1、本發明不依賴于對報文的內容進行關鍵字或者特征碼識別,因此,本發明的方
法能夠對加密的P2P和未知的新出現的P2P流量進行識別; 2、本發明不是僅僅依靠對高于1024的TCP/UDP端口進行統計,識別P2P,它避免了 把P2P流量和網絡掃描、DdoS攻擊等流量混淆起來。因此更精確; 3、本發明不是僅僅依靠對IP地址所連接的對端IP地址數量進行統計,因此避免 了把P2P流量和網站服務器的流量混淆。
圖1是采用本發明所述方法進行P2P流量數學建模模型匹配分析時的處理流程。
圖2是采用本發明所述方法進行P2P流量識別與控制的通信設備處理IP報文的 流程圖。
具體實施例方式
為了避免背景技術中所述的識別方法帶來的弊端,我們研究了P2P業務的通用流 量模型,它存在以下特征 1、P2P軟件下載的流量,和傳統文件服務器下載的流量不同。P2P流量會主動向至 少一百個終端發起數據請求; 2、 P2P軟件為了逃避防火墻攔截, 一般不會使用固定端口 ,而是動態協商端口 ;
3、 P2P軟件連接的終端不一定處于活躍狀態,因此通信接通率沒有保障。 一方面 能夠成功一些通信請求,但是也會失敗一部分。其接通率大于病毒、攻擊產生的會話,小于 正常的網絡通信。 通過綜合采用四個參數來共同決定是否P2P流量,能夠更加精確的識別出網絡中 的P2P流量。 綜合利用Cip、Mport、 Cratemin、 Cratemax這4個參數,能夠做到不依賴于P2P流 量是否加密、是否修改協議字段、是否新出現的P2P,準確的識別分析網絡中的流量。
綜合這4個參數,能夠非常精確、準確的識別P2P,避免了誤判、漏判,從而做到更 加精確的流量控制。 圖1是采用本發明所述方法進行P2P流量數學建模模型匹配分析時的處理流程, 具體步驟包括 步驟S101、初始化數學模型庫; 步驟S102、對P2P流量數學模型的各種預設參數進行配置,假設P2P流量數學模型的IP地址擴散度最小為Cip, TCP/UDP端口擴散度最小為Mport,會話接通率最大為 Cratemax、最小為Cratemin,將上述四個參數配置到數學模型庫中; 步驟S103、采集每一個IP地址通信會話所連接的對端IP地址分布、TCP/UDP端口 分布、會話狀態信息,進行數學建模,實時計算通信網絡中每一個IP地址的連通性擴散度 Xip,端口擴散度Xport,會話接通率Xrate ; 步驟S104、當同時滿足Xip > Cip、 Xport > Mport禾口 Cratemin < Xrate < Cratemax的時候,判定該IP地址流量符合P2P流量模型特征,如符合則執行步驟S105, 否則進入步驟106 ; 步驟S105、如果是P2P流量,啟動預先設置的P2P流量控制策略,利用基于令牌桶 算法的隊列調度算法,對P2P流量進行限制; 步驟S106、如果不符合P2P流量模型特征,按照正常的IP報文轉發流程。 在一個實際的網絡設備中,如在網絡中串聯接入的網關或者網橋設備,可以利用
圖2的軟件流程圖,來實現對P2P的精準控制 步驟S201、進行會話分析,對每一個IP地址計算步驟S103所述的3個數學模型特 征值; 步驟S202、對步驟S201計算出來的數學模型特征值,和步驟S102配置的參數進行 比較,分析每一個IP地址是否存在P2P流量; 步驟S203、識別出使用P2P傳輸數據的IP地址,將它們匯總,形成統一的統計指 標; 步驟S204、讀取流量控制設備中的P2P流量控制策略,決定對這些IP地址的P2P 流量執行何種控制策略,如限制這些IP地址的P2P流量的最高峰值,或者限制這些IP地址 單位時間內能夠傳輸的P2P流量的總數據量,或者限制這些IP地址的P2P流量的會話數;
步驟S205、利用令牌桶算法,對P2P流量進行排隊,按照確定的P2P流量控制策略 實現流量的具體控制。
權利要求
一種基于數學建模技術應用于P2P網絡的流量識別與控制的方法,其特征在于對網絡中的每一個IP地址的通信會話進行數學建模,采集該IP地址通信會話所連接的對端IP地址分布、TCP/UDP端口分布和會話狀態信息,利用數學建模技術產生數學模型特征值;將數學模型特征值與預設的P2P流量數學模型參數進行匹配;在與P2P流量數學模型參數匹配的情況下,判定該IP地址當前正在使用P2P技術進行數據傳輸;根據預先配置的P2P流量控制策略,對該IP地址的所有符合P2P特征的流量進行控制。
2. 如權利要求1所述的方法,其特征在于如果不匹配預設的P2P流量數學模型參數, 執行正常的IP報文轉發流程。
3. 如權利要求1或2所述的方法,其特征在于所述預設的P2P流量數學模型參數包 括最小IP地址擴散度Cip、最小TCP/UDP端口擴散度Mport、最大會話接通率Cratemax和 最小會話接通率Cratemin,上述四個參數被配置到數學模型庫中。
4. 如權利要求3所述的方法,其特征在于所述數學模型特征值包括每一個IP地址的 連通性擴散度Xip、端口擴散度Xport和會話接通率Xrate。
5. 如權利要求4所述的方法,其特征在于當同時滿足Xip > Cip、 Xport 〉Mport和 Cratemin < Xrate < Cratemax時,判定該IP地址當前正在使用P2P技術。
6. 如權利要求5所述的方法,在判定該IP地址當前正在使用P2P技術時,利用令牌桶 算法將P2P報文進行報文排隊處理,并限制該IP地址的P2P流量的最高峰值,或者限制該 IP地址單位時間內能夠傳輸的P2P流量的總數據量,或者限制該IP地址的P2P流量的會話 數。
全文摘要
本發明公開了一種基于數學建模技術應用于P2P網絡的流量識別與控制的方法,具體是采用對流量進行數學建模,基于用戶行為的方法,識別網絡的流量并進行控制的方法。通過在網絡中串聯接入網關或者網橋設備,對網絡中的流量進行分析,分析每一個IP地址活動的會話情況,綜合分析IP活動連接的對端IP地址分布情況、活動會話的TCP/UDP端口分布情況、會話狀態信息等進行數學建模,通過模型匹配判斷用戶P2P下載的行為。本發明基于數學模型匹配,不依賴于傳統的基于協議解析和關鍵字匹配的方法識別應用層網絡流量,大大提高了流量識別的效率和流量控制設備的處理能力。
文檔編號H04L29/08GK101741686SQ20081017180
公開日2010年6月16日 申請日期2008年11月13日 優先權日2008年11月13日
發明者付天福 申請人:天津比蒙新帆信息技術有限公司