專利名稱:基于云計算的音視頻內容轉碼方法、裝置和服務器的制作方法
技術領域:
本發明涉及云計算領域,特別涉及一種基于云計算的音視頻內容轉碼方法、裝置和云計算服務器。
背景技術:
音視頻指紋技術,是通過特定算法從音視頻信號中提取的可以代表一段音視頻重要特征的基于內容的數字摘要。隨著網絡技術和數字媒體壓縮技術的不斷創新,流媒體業務在移動網絡和互聯網上都在高速的發展,用戶通過移動終端觀看視頻業務的場景不斷增多,然而現有的云轉碼系統還存在以下不足:互聯網上的視頻內容依賴唯一的資源標識符進行標識,但是互聯網上的同質內容非常多,對于云轉碼平臺,不同的視頻資源標識符所對應的可能是相同的內容,不能對視頻內容進行精確標識,從而影響了轉碼效率。
發明內容
本發明的發明人發現上述現有技術中存在問題,并因此針對所述問題中的至少一個問題提出了一種新的技術方案。本發明的一個目的是提供一種用于基于云計算的音視頻內容轉碼的技術方案。根據本發明的第一方面,提供了一種基于云計算的音視頻內容轉碼方法,包括:根據音視頻內容生成視頻內容的視頻指紋和音頻內容的音頻指紋;根據所述視頻指紋和音頻指紋生成所述音視頻內容的內容標識;當所述音視頻內容的內容標識在轉碼平臺的內容標識庫中存在匹配內容標識時,不對所述音視頻內容進行轉碼,獲取與所述匹配內容標識對應的已轉碼音視頻內容。優選地,根據音視頻內容生成視頻內容的視頻指紋包括:提取視頻內容中視頻的圖像特征和運動特征作為視頻指紋;和/或根據音視頻內容生成音頻內容的音頻指紋包括:提取音頻內容中音頻的物理類音頻特征作為音頻指紋。優選地,圖像特征為關鍵幀的局部區域的顏色特征,所述運動特征為相鄰兩關鍵幀的局部區域的幀間差異;所述物理類音頻特征為相鄰兩幀的頻域能量差異。優選地,當所述音視頻內容的內容標識在轉碼平臺的內容標識庫中不存在匹配內容標識時,對所述音視頻內容進行轉碼。根據本發明的第二方面,提供一種基于云計算的音視頻內容轉碼裝置,包括轉碼模塊,指紋生成模塊,用于根據音視頻內容生成視頻內容的視頻指紋和音頻內容的音頻指紋;標識生成模塊,用于根據所述視頻指紋和音頻指紋生成所述音視頻內容的內容標識;標識匹配模塊,用于將所述音視頻內容的內容標識在轉碼平臺的內容標識庫中進行匹配,如果存在匹配內容標識,則不對所述音視頻內容進行轉碼,獲取與所述匹配內容標識對應的已轉碼音視頻內容;如果不存在匹配內容標識,則通知所述轉碼模塊對所述音視頻內容進行轉碼。
優選地,指紋生成模塊包括:視頻指紋生成單元,用于提取音視頻內容中視頻的圖像特征和運動特征作為視頻指紋;音頻指紋生成單元,用于提取接收到的音視頻內容中音頻的物理類音頻特征作為音頻指紋。優選地,圖像特征為關鍵幀的局部區域的顏色特征,所述運動特征為相鄰兩關鍵幀的局部區域的幀間差異;所述物理類音頻特征為相鄰兩幀的頻域能量差異。優選地,該裝置還包括:內容解碼模塊,用于對所述音視頻內容進行解碼獲得視頻內容和音頻內容,將所述視頻內容發送給所述視頻指紋生成單元,將所述音頻內容發送給所述音頻指紋生成單元;編碼模塊,用于接收所述轉碼模塊輸出的已轉碼的視頻內容,對所述已轉碼的視頻內容進行編碼輸出。優選地,該裝置還包括:音視頻內容庫,用于存儲已轉碼的音視頻內容;內容標識庫,用于存儲所述音視頻內容庫中的已轉碼的音視頻內容的內容標識。根據本發明的第三方面,還提供一種云計算服務器,包括上述的音視頻內容轉碼裝置本發明的一個優點在于,根據音視頻內容獲得音視頻指紋信息,并根據音視頻指紋信息生成唯一內容標識,當存在對應的內容標識時,直接獲取已轉碼音視頻內容,實現了首視頻內容的精確標識,提聞了轉碼 效率。通過以下參照附圖對本發明的示例性實施例的詳細描述,本發明的其它特征及其優點將會變得清楚。
構成說明書的一部分的附圖描述了本發明的實施例,并且連同說明書一起用于解釋本發明的原理。參照附圖,根據下面的詳細描述,可以更加清楚地理解本發明,其中:圖1不出基于z 計算的首視頻內容處理系統的不意圖;圖2示出本發明的基于云計算的音視頻內容轉碼方法的一個實施例的流程圖;圖3示出本發明的基于云計算的音視頻內容轉碼方法的另一個實施例的流程圖;圖4示出本發明的音視頻內容的內容標識生成的一個實施例的流程圖;圖5示出本發明的基于云計算的音視頻內容轉碼裝置的一個實施例的結構圖;圖6示出本發明的基于云計算的音視頻內容轉碼裝置的另一個實施例的結構具體實施例方式現在將參照附圖來詳細描述本發明的各種示例性實施例。應注意到:除非另外具體說明,否則在這些實施例中闡述的部件和步驟的相對布置、數字表達式和數值不限制本發明的范圍。同時,應當明白,為了便于描述,附圖中所示出的各個部分的尺寸并不是按照實際的比例關系繪制的。以下對至少一個示例性實施例的描述實際上僅僅是說明性的,決不作為對本發明及其應用或使用的任何限制。對于相關領域普通技術人員已知的技術、方法和設備可能不作詳細討論,但在適當情況下,所述技術、方法和設備應當被視為授權說明書的一部分。在這里示出和討論的所有示例中,任何具體值應被解釋為僅僅是示例性的,而不是作為限制。因此,示例性實施例的其它示例可以具有不同的值。應注意到:相似的標號和字母在下面的附圖中表示類似項,因此,一旦某一項在一個附圖中被定義,則在隨后的附圖中不需要對其進行進一步討論。圖1示出基于云計算的音視頻內容處理系統的示意圖。在圖1中示出流媒體接收終端11、流媒體服務器12、云轉碼平臺13、音視頻內容庫14、和流媒體內容傳送網絡15。流媒體接收終端11具有播放音視頻流的功能,能夠支持流媒體傳輸協議;流媒體內容傳送網絡15具有分發、傳播音視頻流的功能,并支持流媒體協議通訊;流媒體服務器12具有接收終端播放流媒體內容的請求、向云轉碼平臺發送轉碼請求、接收云轉碼平臺輸出的目標碼流、向終端提供流媒體服務的功能;云轉碼平臺13具有對音視頻內容進行標識,對音視頻內容進行匹配,存儲內容標識,接收轉碼請求,獲取音視頻內容源,對音視頻內容進行解碼、切片、轉碼、編碼,碼率控制,碼流輸出的功能,并支持流媒體傳輸協議和文件本地存儲;音視頻內容庫14具有將本地音視頻文件或者音視頻流發送給云轉碼平臺的功能。流媒體協議包括但不限于=RTSP或HTTP或RTMP。流媒體內容傳送網絡15包括但不限于:GSM,或CDMA,或3G移動電話網絡,或無線局域網WLAN,或下一代網絡系統NGN。需要指出,流媒體服務器、云轉碼平臺、音視頻內容庫中的任意兩者或者三者可以位于同一服務器或者設備上。圖2示出本發明的基于云計算的音視頻內容轉碼方法的一個實施例的流程圖。如圖2所示,步驟202,根據音視頻內容生成視頻內容的視頻指紋和音頻內容的音頻指紋。步驟204,根據視頻指紋和音頻指紋生成音視頻內容的內容標識。步驟206,對音視頻內容的內容標識和轉碼平臺內容庫中存儲的內容標識進行匹配。步驟208,判斷是否存在匹配?如果音視頻內容的內容標識在轉碼平臺的內容標識庫中存在匹配內容標識,繼續步驟210,否則,對音視頻內容進行轉碼(步驟212)。步驟210,不對音視頻內容進行轉碼,獲取與匹配內容標識對應的已轉碼音視頻內容,以便直接提供給終端。上述實施例中,根據音視頻內容獲得音視頻指紋信息,并根據音視頻指紋信息生成唯一內容標識,當存在對應的內容標識時,直接獲取已轉碼音視頻內容,實現了音視頻內容的精確標識,提聞了轉碼效率。圖3示出本發明的基于云計算的音視頻內容轉碼方法的另一個實施例的流程圖。如圖3所示,步驟302,對音視頻內容進行解碼獲得視頻內容和音頻內容。步驟304,提取視頻內容中視頻的圖像特征和運動特征作為視頻指紋。步驟306,提取音頻內容中音頻的物理類音頻特征作為音頻指紋。步驟308,根據視頻指紋和音頻指紋生成音視頻內容的內容標識。步驟310,對音視頻內容的內容標識和轉碼平臺內容庫中存儲的內容標識進行匹配。步驟312,判斷是否存在匹配?如果音視頻內容的內容標識在轉碼平臺的內容標識庫中存在匹配內容標識,則獲取與匹配內容標識對應的已轉碼音視頻內容(步驟314),否則,繼續步驟316。步驟316,對音視頻內容進行轉碼。步驟318,對轉碼后的音視頻內容進行編碼。上述實施例中,通過視頻的圖像特征和運動特征作為視頻指紋,通過音頻的物理類音頻特征作為音頻指紋,保證了指紋信息的唯一性。圖4示出本發明的音視頻內容的內容標識生成的一個實施例的流程圖。如圖4所示,步驟402,分別提取媒體文件的視頻內容和N(N>= I)個音軌的音頻內容。步驟404 406,分別提取視頻內容的關鍵幀的局部區域的顏色特征和相鄰兩關鍵幀的局部區域的幀間差異,形成視頻內容的視頻指紋。步驟408 410,分別提取N(N>= I)個音頻內容的相鄰兩幀的頻域能量差異,形成N(N>= I)個音頻指紋。步驟412,結合視頻指紋和N(N > = I)個音頻指紋,形成該媒體文件的內容標識。上述實施例中,根據關鍵幀的顏色特征和幀間差異形成視頻指紋,根據音頻頻域能量差異形成音頻指紋,保證了指紋的唯一性。圖5示出本發明的基于云計算的音視頻內容轉碼裝置的一個實施例的結構圖。如圖5所示,該裝置包括指紋生成模塊51、標識生成模塊52、標識匹配模塊53、轉碼模塊54。指紋生成模塊51根據音視頻內容生成視頻內容的視頻指紋和音頻內容的音頻指紋;標識生成模塊52根據視頻指紋和音頻指紋生成音視頻內容的內容標識;標識匹配模塊53將音視頻內容的內容標識在轉碼平臺的內容標識庫中進行匹配,如果存在匹配內容標識,則不對音視頻內容進行轉碼,獲取與匹配內容標識對應的已轉碼音視頻內容;如果不存在匹配內容標識,則通知轉碼模塊54對音視頻內容進行轉碼。圖6示出本發明的基于云計算的音視頻內容轉碼裝置的另一個實施例的結構圖。如圖6所示,該裝置還包括內容解碼模塊60和編碼模塊67。內容解碼模塊60對音視頻內容進行解碼獲得視頻內容和音頻內容,將視頻內容發送給視頻指紋生成單元611,將音頻內容發送給音頻指紋生成單元612 ;編碼模塊67接收轉碼模塊54輸出的已轉碼的視頻內容,對已轉碼的視頻內容進行編碼輸出。在一個實施例中,指紋生成模塊61包括視頻指紋生成單元611和音頻指紋生成單元612。視頻指紋生成單元611接收來自內容解碼模塊60的視頻內容,提取音視頻內容中視頻的圖像特征和運動特征作為視頻指紋;音頻指紋生成單元接收來自內容解碼模塊60的音頻內容,提取接收到的音視頻內容中音頻的物理類音頻特征作為音頻指紋。圖像特征可以是關鍵幀的局部區域的顏色特征,運動特征可以是相鄰兩關鍵幀的局部區域的幀間差異;物理類音頻特征可以是相鄰兩幀的頻域能量差異。在一個實施例中,還包括內容標識庫65和音視頻內容庫66。內容標識庫65存儲音視頻內容庫中的已轉碼的音視頻內容的內容標識。音視頻內容庫66存儲已轉碼的音視頻內容。下面參考圖1介紹本發明的一個應用例的流程。第一步:音視頻內容庫向云轉碼平臺提供音視頻內容源;
第二步:云轉碼平臺提取接收到的音視頻內容中視頻的圖像特征(如關鍵幀的局部區域的顏色特征)和運動特征(如相鄰兩幀的局部區域的幀間差異)作為視頻指紋,提取接收到的音視頻內容中音頻的物理類音頻特征(如相鄰兩幀的頻域能量差異)作為音頻指紋,視頻指紋和音頻指紋共同描述該音視頻內容并組成該音視頻內容的內容標識;第三步:云轉碼平臺將該音視頻內容的內容標識與所存儲的內容標識進行比對,如匹配則不對該音視頻內容進行轉碼,否則將該音視頻內容的內容標識存儲于云轉碼平臺中,并對該音視頻內容進行轉碼,將轉碼后的音視頻流提供給流媒體服務器;第四步:流媒體服務器將云轉碼平臺輸出的音視頻流提供給流媒體內容傳送網絡;第五步:流媒體內容傳送網絡將流媒體服務器輸出的音視頻流提供給流媒體終端;第六步:終端接收流媒體服務器提供的音視頻流,進行解碼和播放。至此,已經詳細描述了根據本發明的基于云計算的音視頻內容轉碼方法、裝置和服務器。為了避免遮蔽本發明的構思,沒有描述本領域所公知的一些細節。本領域技術人員根據上面的描述,完全可以明白如何實施這里公開的技術方案。可能以許多方式來實現本發明的方法和系統。例如,可通過軟件、硬件、固件或者軟件、硬件、固件的任何組合來實現本發明的方法和系統。用于所述方法的步驟的上述順序僅是為了進行說明,本發明的方法的步驟不限于以上具體描述的順序,除非以其它方式特別說明。此外,在一些實施例中,還可將本發明實施為記錄在記錄介質中的程序,這些程序包括用于實現根據本發明的方法的機器可讀指令。因而,本發明還覆蓋存儲用于執行根據本發明的方法的程序的記錄介質。雖然已經通過示例對本發明的一些特定實施例進行了詳細說明,但是本領域的技術人員應該理解,以上示例僅是為了進行說明,而不是為了限制本發明的范圍。本領域的技術人員應該理解,可在不脫離本發明的范圍和精神的情況下,對以上實施例進行修改。本發明的范圍由所附權利要求來限定。
權利要求
1.一種基于云計算的音視頻內容轉碼方法,其特征在于,包括: 根據音視頻內容生成視頻內容的視頻指紋和音頻內容的音頻指紋; 根據所述視頻指紋和音頻指紋生成所述音視頻內容的內容標識; 當所述音視頻內容的內容標識在轉碼平臺的內容標識庫中存在匹配內容標識時,不對所述音視頻內容進行轉碼,獲取與所述匹配內容標識對應的已轉碼音視頻內容。
2.根據權利要求1所述的方法,其特征在于,根據音視頻內容生成視頻內容的視頻指紋包括: 提取視頻內容中視頻的圖像特征和運動特征作為視頻指紋; 和/或 根據音視頻內容生成音頻內容的音頻指紋包括: 提取音頻內容中音頻的物理類音頻特征作為音頻指紋。
3.根據權利要求2所述的方法,其特征在于,所述圖像特征為關鍵幀的局部區域的顏色特征,所述運動特征為相鄰兩關鍵幀的局部區域的幀間差異;所述物理類音頻特征為相鄰兩幀的頻域能量差異。
4.根據權利要求1所述的方法,當所述音視頻內容的內容標識在轉碼平臺的內容標識庫中不存在匹配內容標識時,對所述音視頻內容進行轉碼。
5.根據權利要求4所述的 方法,其特征在于,還包括: 對轉碼后的音視頻內容進行編碼。
6.一種基于云計算的音視頻內容轉碼裝置,包括轉碼模塊,其特征在于,還包括: 指紋生成模塊,用于根據音視頻內容生成視頻內容的視頻指紋和音頻內容的音頻指紋;標識生成模塊,用于根據所述視頻指紋和音頻指紋生成所述音視頻內容的內容標識;標識匹配模塊,用于將所述音視頻內容的內容標識在轉碼平臺的內容標識庫中進行匹配,如果存在匹配內容標識,則不對所述音視頻內容進行轉碼,獲取與所述匹配內容標識對應的已轉碼音視頻內容;如果不存在匹配內容標識,則通知所述轉碼模塊對所述音視頻內容進行轉碼。
7.根據權利要求6所述的裝置,其特征在于,所述指紋生成模塊包括: 視頻指紋生成單元,用于提取音視頻內容中視頻的圖像特征和運動特征作為視頻指紋; 音頻指紋生成單元,用于提取接收到的音視頻內容中音頻的物理類音頻特征作為音頻指紋。
8.根據權利要求7所述的裝置,其特征在于,所述圖像特征為關鍵幀的局部區域的顏色特征,所述運動特征為相鄰兩關鍵幀的局部區域的幀間差異;所述物理類音頻特征為相鄰兩幀的頻域能量差異。
9.根據權利要求7所述的裝置,其特征在于,還包括: 內容解碼模塊,用于對所述音視頻內容進行解碼獲得視頻內容和音頻內容,將所述視頻內容發送給所述視頻指紋生成單元,將所述音頻內容發送給所述音頻指紋生成單元;編碼模塊,用于接收所述轉碼模塊輸出的已轉碼的視頻內容,對所述已轉碼的視頻內容進行編碼輸出。
10.根據權利要求6所述的裝置,其特征在于,還包括:音視頻內容庫,用于存儲已轉碼的音視頻內容;內容標識庫,用于存儲所述音視頻內容庫中的已轉碼的音視頻內容的內容標識。
11.一種云計算服 務器,包括權利要求6至10中任意一項所述的音視頻內容轉碼裝置。
全文摘要
本發明公開了一種基于云計算的音視頻內容轉碼方法、裝置和服務器,涉及云計算流媒體技術領域。該方法包括根據音視頻內容生成視頻內容的視頻指紋和音頻內容的音頻指紋;根據視頻指紋和音頻指紋生成音視頻內容的內容標識;當音視頻內容的內容標識在轉碼平臺的內容標識庫中存在匹配內容標識時,不對音視頻內容進行轉碼,獲取與匹配內容標識對應的已轉碼音視頻內容。根據音視頻內容獲得音視頻指紋信息,并根據音視頻指紋信息生成唯一內容標識,當存在對應的內容標識時,直接獲取已轉碼音視頻內容,實現了音視頻內容的精確標識,提高了轉碼效率。
文檔編號H04N21/2343GK103179430SQ20111042841
公開日2013年6月26日 申請日期2011年12月20日 優先權日2011年12月20日
發明者包盛, 王愛寶, 黃小桑 申請人:中國電信股份有限公司