專利名稱:一種網絡視頻的識別方法及其設備的制作方法
技術領域:
本發明涉及一種應用識別技術,尤其涉及一種網絡視頻的識別方法及其設備。
背景技術:
網絡視頻是指由網絡視頻服務商提供的,以流媒體為播放格式的、可以在線直播或點播的聲像文件。應用層網絡流控設備可以通過識別網絡視頻的類型,進行有選擇性的監控。然而, 現有技術中的網絡視頻識別技術只針對視頻所屬的網站進行識別,無法做到更深層次的識另IJ,例如對網絡視頻所屬類型,或者網絡視頻所屬的名稱進行識別。因此網絡流控設備對于網絡視頻的監控受到很大的限制
發明內容
本發明要解決的技術問題是,用一種識別精度高的方式識別網絡視頻鏈接,從而更深層次的提取網絡視頻的元信息,例如網絡視頻的類型或者名稱。解決上述技術問題,本發明一方面提供了一種網絡視頻的識別方法,該方法包括以下步驟接收HTTP請求報文;識別HTTP請求報文中的網絡視頻鏈接;如果識別成功,則解析HTTP請求報文,提取網絡視頻元信息。本發明第二方面提供了一種網絡視頻的識別設備。該設備包括接收單元,用于接收HTTP請求報文;識別單元,用于識別HTTP請求報文中的網絡視頻鏈接;解析單元,用于解析HTTP請求報文,提取網絡視頻元信息。本發明通過簽名對HTTP請求報文進行解析的方式,更深層次的獲取了網絡視頻的元信息,包括網絡視頻的類型或者名稱,根據所獲取的網絡視頻的元信息對其進行有選擇性的管控。本發明識別精細度高、可實現性強,可作為網絡流控設備功能實現,可用于策略中的網絡應用控制,并可進行網絡應用時監控。
圖1為本發明實施例網絡視頻的識別方法及其設備的應用場景;圖2為本發明實施例網絡視頻的識別方法流程圖;圖3為本發明實施例網絡視頻的識別設備結構圖。
具體實施例方式下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明的一部分實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動的前提下所獲得的所有其他實施例,都就屬于本發明保護的范圍。圖1為本發明實施例網絡視頻的識別方法及其設備的應用場景。如圖1所示,客戶端11通過網絡流控設備12訪問遠程服務器13。服務器13不斷監聽TCP的端口 80,以便發現客戶端向它發出連接建立請求。一旦監聽到連接建立請求并建立TCP連接之后,瀏覽器就向服務器發出瀏覽某個頁面的HTTP請求報文,服務器接著就返回所請求的頁面作為響應。最后,TCP連接就被釋放。瀏覽器和服務器之間的請求和響應通過超文本傳送協議HTTP進行交互。網絡流控設備12轉發并監控客戶端11和服務器13交互的信息,通過客戶端11 向服務器13下發的HTTP請求報文中識別出網絡視頻信息,例如,網絡視頻的類型和名稱, 并進行有選擇性的管控。圖2為本發明實施例網絡視頻的識別方法流程圖。該方法包括步驟201-204。在步驟201,接收HTTP請求報文。具體地,當用戶通過客戶端的瀏覽器點擊某個網絡視頻的鏈接時,客戶端會通過網絡流控設備向網絡視頻服務器發送HTTP請求報文,此時,網絡流控設備接收HTTP請求報文中有關網絡視頻的鏈接信息。在一個例子中,用戶在56視頻網點擊了名稱為“地道戰”的網絡視頻鏈接。此時, 客戶端通過網絡流控設備向網絡視頻服務器發送的HTTP請求報文如下GET/ac/ac_102. xml ? cid2 = 2002&version = 10,1,102,64&id = 47406343&channel = 35&tag =,,,,&subject = e5% 9c% b0% e9% 81 % 93% e6% 88% 98 HTTP/1. 1HOST :acs. 56. comConnection :keep_alive 其中,HTTP請求報文中開始行的“ GET ”為請求方式,代表請求讀取由URL所標志的信息。“/ac”是存儲ac_102.Xml文件的文件夾,是一個相對路徑,后面帶的是參數,其中參數“channel = 35”代表該網絡視頻所屬類型,例如,在56視頻網中35代表“電視劇”。參數“&subject = e5% 9c% b0% e9% 81% 93% e6% 88% 98”代表該網絡視頻的名稱, 上述編碼“ % e5% 9c % b0% e9% 81% 93% e6% 88% 98”代表的中文名稱為“地道戰”。 HTTP請求報文中首部行的“HOST :acs. 56. com”代表該網絡視頻所屬的主機域名,即網絡視頻的所屬網站56. com。在步驟202,識別HTTP請求報文中的網絡視頻鏈接。具體地,網絡流控設備設置有一個特征庫,該特征庫包括多個特征,每個特征代表一個網絡視頻鏈接信息。通過特征庫中的特征可以對HTTP請求報文中的網絡視頻鏈接進行識別。在一個例子中,特征庫中的一條特征名稱為“W0le_http_datal”的特征,其特征信息如下group wole.http-datal {
Cmd ("GET")
Match ("GET", "/ac", O, 1) Match ("HOST, ""56. COM", O, 1) RET(0x4BDl)
}上述特征信息中,字段“W0le_http_datal”代表特征名稱。字段Cmd ( “GET” )中 “GET”代表請求方式。字段Match ( “GET”,”/ac”,0,l)代表從偏移為0的位置開始,匹配 “GET”中的/ac,其中1代表以搜索形式。字段Match( “HOST,””56. COM”,0,1)代表從偏移為0的位置開始,匹配HOST中的56. com,其中1代表以搜索的形式。RET(0x4BDl)代表特征庫中設置的一個標記值,該標記值“0x4BDl”用于標示56. com視頻網。在步驟203,如果識別成功,則執行步驟204,否則跳至步驟201。具體地,網絡流控設備通過特征庫中的特征對在步驟201中獲取的HTTP請求報文進行識別,則如匹配成功,則執行步驟204。在一個例子中,以特征庫名稱為“wole_http_datal”的特征對在步驟201中獲取的HTTP請求報文進行識別,通過“wole_http_datal”特征中字段Cmd( “GET”)匹配HTTP 請求報文中的請求方式“GET”。通過字段Match( “GET”,”/ac”,0,l)匹配HTTP請求報文中的文件夾路徑“GET/ac”。通過字段Match ( “HOST,” “56. COM”,0,1)匹配主機域名“56. COM”。當以上三個字段都匹配成功時,則HTTP請求報文成功識別為網絡視頻鏈接。步驟204,解析HTTP請求報文,提取網絡視頻元信息。具體地,當網絡流控設備成功識別HTTP請求報文屬于網絡視頻鏈接時,則通過簽名庫中簽名對該HTTP請求報文進行解析,提取網絡視頻元信息。其中提取網絡視頻元信息包括提取網絡視頻的名稱和網絡視頻的類型,或者提取網絡視頻的名稱、提取網絡視頻的類型,其中簽名庫是各個簽名的集合,每個簽名解析一個視頻網。在一個例子中,56視頻網對應的簽名如下group 56-name—ppl {
FILTER=0x4BDl,OFFSET=+
FIELD= "name" &SC (4),SS= "&Subject=" ,ES=“"
FIELD= "type" &SC (5),SS= "&channel=" ,ES= "&tag=" }在上述簽名中,字段‘‘group 56_name_ppl”中‘‘56_name_ppl”代表簽名的名稱。字段“FILTER = 0x4BD 1,OFFSET = + ”中“ 4BD1 ”是一個標記值,用于標記56視頻網,對應名稱為“W0le_http_datal”特征中的標記值,當網絡視頻鏈接被識別為該標記值時,該簽名就會對該網絡視頻鏈接的HTTP請求報文中的GET頭進行解析。字段FIELD ="name"&SC(4), SS ="&Subject =,,,ES = “ ”中的FIELD =“name”代表提取HTTP請求報文中的網絡視頻名稱;字段SS="&Subject =,,,ES = “”代表以“&Subject = ”開始,以“”為結束,中間截取的信息為網絡視頻名稱。字段 FIELD =“type”&SC(5),SS =“&channel =”,ES =“&tag =”中的FIELD =“type”代表提取HTTP請求報文中的網絡視頻類型;SS ="&channel =,,, ES = "&tag =,,代表以"&channel =,,開始,以"&tag =,,結束,中間的信息為視頻類型。在一個例子中,通過特征庫名稱為“W0le_http_datal”的特征已經識別了 HTTP 請求報文中的網絡視頻,其中名稱為“wo 1 e_http_datal,,的特征的標記值為0x4BD 1,根據該標記值使用簽名庫中名稱為56_name_ppl的簽名對該HTTP請求報文進行解析,并從 HTTP請求報文中提取該網絡視頻的元信息。例如,通過56_name_ppl簽名的字段FIELD ="name" &SC (4),SS = "&Subject = ”,ES = “ ” 提取 HTTP 請求報文中的視頻名稱為 “ % e5% 9c% b0% e9% 81% 93% e6% 88% 98”,其中文名稱是“地道戰”。通過字段FIELD = “type”&SC(5),SS = "&channel =,,,ES = "&tag =,,提取 HTTP 請求報文中的網絡視頻類型為35,在56視頻網,35代表網絡視頻類型為“電視劇”。網絡流控設備除了通過簽名的方式對HTTP請求報文解析外,還可以通過正則表達式對HTTP請求報文進行解析。網絡流控設備在提取網絡視頻的元信息后,可以對其進行相應的操作,例如將提取的信息,以日志的形式輸出到網絡流控設備的界面中,或者可以根據提取的網絡視頻類型和網絡視頻名稱,對后續的視頻鏈接進行相應的管控措施,例如針對娛樂類的視頻,需要進行封堵,教育類的視頻可以允許播放。圖3為本發明實施例網絡視頻的識別設備結構圖。所圖所示,該設備包括接收單元31、識別單元32、和解析單元33。接收單元31用于接收HTTP請求報文。當用戶通過客戶端的瀏覽器點擊某個網絡視頻的鏈接時,客戶端會通過網絡流控設備向網絡視頻服務器發送HTTP請求報文,此時, 該網絡視頻流識別備中的接收單元31接收HTTP請求報文中有關網絡視頻的鏈接信息。識別單元32用于識別該HTTP請求報文中的網絡視頻鏈接。 具體地,識別單元32通過特征庫中的特征識別由接收單元31接收的HTTP請求報文的網絡視頻鏈接,其中特征中有一個標記值屬性,用于標示該網絡視頻鏈接。解析單元33用于解析HTTP請求報文,提取網絡視頻元信息。具體地,當識別單元32成功識別HTTP請求報文的網絡視頻鏈接時,則由解析單元 33通過簽名庫中的簽名解析該HTTP請求報文,提取網絡視頻元信息,其中提取網絡視頻元信息包括提取網絡視頻名稱和提取網絡視頻類型,或者只提取網絡視頻名稱、提取網絡視頻類型。本發明實施例網絡視頻的識別設備的接收單元31、識別單元32和解析單元33分別為了實現圖2中各個方法的相應流程,在此不再贅述。盡管已經示出并描述了本發明的特殊實施例,然而在不背離本發明的示例性實施例及其更寬廣方面的前提下,本領域技術人員顯然可以基于此處的教學做出變化和修改。因此,所附的權利要求意在將所有這類不背離本發明的示例性實施例的真實精神和范圍的變化和更改包含在其范圍之內。
權利要求
1.一種網絡視頻的識別方法,其特征在于包括以下步驟接收HTTP請求報文;識別所述HTTP請求報文中的網絡視頻鏈接;如果識別成功,則解析所述HTTP請求報文,提取網絡視頻元信息。
2.根據權利要求1所述的方法,其特征在于所述識別所述HTTP請求報文中的網絡視頻鏈接步驟包括通過特征庫中的特征識別所述HTTP請求報文中的網絡視頻鏈接。
3.根據權利要求2所述的方法,其特征在于所述特征中有一個標記值屬性,用于標示網絡視頻鏈接。
4.根據權利要求1所述的方法,其特征在于所述解析所述HTTP請求報文,提取網絡視頻元信息步驟包括通過簽名庫中的簽名解析所述HTTP請求報文,提取網絡視頻元信息。
5.根據權利要求1或4所述的方法,其特征在于所述提取網絡視頻元信息包括提取網絡視頻名稱和/或提取網絡視頻類型。
6.一種網絡視頻的識別設備,其特征在于包括接收單元,用于接收HTTP請求報文;識別單元,用于識別所述HTTP請求報文中的網絡視頻鏈接;解析單元,用于解析所述HTTP請求報文,提取網絡視頻元信息。
7.根據權利要求6所述的設備,其特征在于所述識別單元通過特征庫中的特征識別所述HTTP請求報文中的網絡視頻鏈接。
8.根據權利要求7所述的設備,其特征在于所述特征中有一個標記值屬性,用于標示網絡視頻鏈接。
9.根據權利要求6所述的設備,其特征在于所述解析單元通過簽名庫中的簽名解析所述HTTP請求報文,提取網絡視頻元信息。
10.根據權利要求6或9所述的設備,其特征在于所述提取網絡視頻元信息包括提取網絡視頻名稱和/或提取網絡視頻類型。
全文摘要
本發明公開了一種網絡視頻的識別方法及其設備。所述方法包括以下步驟接收HTTP請求報文;識別HTTP請求報文中的網絡視頻鏈接;如果識別成功,則解析HTTP請求報文,提取網絡視頻元信息。所述設備包括接收單元,用于接收HTTP請求報文;識別單元,用于識別HTTP請求報文中的網絡視頻鏈接;解析單元,用于解析HTTP請求報文,提取網絡視頻元信息。本發明識別精細度高、可實現性強,可作為網絡流控設備功能實現,并可進行網絡應用時監控。
文檔編號H04N21/434GK102325270SQ201110269390
公開日2012年1月18日 申請日期2011年9月13日 優先權日2011年9月13日
發明者崔淵博, 洪婷婷, 陳振昌, 齊曉璐 申請人:北京網康科技有限公司