應用于h.264到hevc轉碼的快速幀間模式決策方法
【技術領域】
[0001] 本發明設及視頻數據的轉碼,具體地指一種基于Fisher線性分類器的H. 264到 肥VC轉碼方法,用于將H. 264/AVC標準的視頻數據轉碼為肥VC標準的視頻數據。
【背景技術】
[0002] MPEG和ITU兩大國際組織在2013年正式發布了皿VC新一代數字視頻編解碼標準, W適應高質量視頻應用的發展。HEVC使用先進的技術用W改善碼流、編碼質量、延時和算法 復雜度之間的關系,有效地提高了視頻編碼效率。肥VC將宏塊的大小從H. 264的16X16擴展 至IJ了 64X64,并采用了四叉樹結構的圖像劃分方式,運種劃分方式可W獲得比H.264/AVC更 好的壓縮效率。同時,肥VC還采用了更加靈活的編碼結構來提高編碼效率,但由于需要對每 一種尺寸的編碼單元(Coding加it,CU)、預測單元(Prediction加it,PU)和變換單元 (TransformUnit,TU)都要通過率失真優化(Rate-Disto;rtionOptimization,畑0)計算得 出最優的劃分,使得編碼器的計算復雜度大幅提升。目前網絡上現存的大多數視頻主要是 基于H. 264標準進行壓縮編碼的,為了減少視頻傳輸的網絡帶寬及存儲空間,需要將現存的 H. 264編碼視頻碼流轉換為肥VC視頻碼流,W進一步對視頻進行壓縮。由于肥VC采用了預測 加變換的混合編碼框架,其編碼結構和H. 264有部分相似性,如果能夠利用H. 264解碼的碼 流信息來提前預測CU的劃分方式,那么就可W對四叉樹進行剪枝,略過一部分的RDO過程, 運樣可W有效地降低編碼器的復雜度。
[0003] 肥VC的測試軟件化EVCTestModel,HM)所采用的CU的大小為64X64、32X32、16 X16和8X8,分別對應CU的深度層次為0、1、2、3。其中深度層次為0的CU記為LClKLargest CodingUnit,LCU),深度層次為3的CU記為SClKSmallestCodingUnit,SCU),而在H.264的 測試軟件(JointMode1,JM)所采用的宏塊大小為16X16和8X8。在肥VC帖間編碼中,對于 深度層次為0和1的CU,其大小并不存在于H. 264的宏塊結構中。而對于深度層次為2和3的 CU,H. 264擁有和皿VC-樣的分塊大小。因此對于運兩類不同的深度層次,本發明將其分為 兩部分進行帖間模式決策加速,運樣有助于進行碼流信息的相關性映射。HM的編碼器采用 遞歸的方式對LCU進行劃分,對于每一層的CU都要利用基于RDO的預測來決定PU和TU的劃 分,其中TU的劃分也采用了四叉樹的劃分方式,在帖間編碼中,它允許變換塊的大小根據運 動補償塊的大小進行自適應的調整。
[0004]為了減少遞歸劃分所帶來的多余的計算,現有的一些方案針對CU的劃分進行了一 系列的優化:例如
[000引文獻1 (參見蔣巧.H. 264到肥VC視頻轉碼技術研究[D].浙江大學,2013.)提出了基 于統計分析和基于區域特征分析的快速帖間轉碼算法。該文獻首先根據肥VC碼流中Skip模 式與H.264碼流中各種模式的統計映射關系對Skip模式進行提前判決,然后利用預測單元 對應編碼區域內宏塊編碼比特數的統計特性,對其分割模式進行了快速選擇;基于區域特 征分析則利用了了編碼比特數和編碼復雜度之間的關系,通過比較平均編碼比特數和分割 闊值來確定重編碼的復雜度,該研究對于Skip模式的提前判定使用了統計分析的方法,因 此基于部分序列統計結果設定的闊值通用性有一定的限制。
[0006]文獻2(參見化ixotoE,MacchiavelloB,deQueirozR,etal.FastH.264/AVC toHEVCtranscodingbasedonmachinelearning[C]//TeIecommunications Symposium(ITS) ,2014Inte;rnational.I邸E,2014:1-4.)統計了碼流信息的相關性,引入了 線性判別函數(XinearDiscriminantF'unctioniLDF),在肥VC重編碼階段利用碼流信息作 為特征,選取視頻的一小段組成訓練樣本集,根據LDF來計算后續視頻帖CU劃分的判定闊 值,在預測模式捜索過程之前直接判定CU是否進行劃分,加速模式決策。由于Skip模式在CU 不劃分的最優模式中比例較高,該方法未充分考慮與Skip相關特征的選取,因此抓-rate上 升的幅度較大。
【發明內容】
[0007]本發明的目的在于提供一種H. 264到肥VC轉碼的快速帖間模式決策方法。
[0008] 首先對肥VC中深度為0和1的CU的預測模式分布情況進行統計,判斷對模式決策優 化的可行性。通過統計分析,當QP為22時,對于運動比較平緩的視頻序列,深度為0時CU最優 模式為Skip模式的比例在25%~45%,深度為1時CU最優模式為Skip模式的比例在30%~ 50 %。而對于運動比較劇烈的視頻序列,CU最優模式為Skip模式的比例則只有20 %左右。隨 著量化參數(如antizationParameter,QP)的增大,視頻編碼的細節處理也隨之變的粗糖, Skip模式被決定為最優模式的比例不斷增加,在QP為37時運動平緩的視頻中,Skip模式的 比例都在70 %W上。因此在CU深度為0和1時,首先提前判斷該CU是否為Skip模式,然后對CU 的繼續劃分進行預測,而在CU深度為2和3時,則根據碼流信息進行模式映射,減少模式捜索 范圍。
[0009]為達到上述目的,本發明的給出的技術方案概括為:首先使用JM解碼器對原始碼 流進行解碼,在解碼過程中提取后續轉碼所需的碼流信息,并得到解碼后視頻序列。在肥VC 重編碼時使用Fisher分類器進行在線學習,計算出一定數量帖的化ipW及CU劃分的權值向 量和闊值,并根據編碼進度進行更新。對于深度為0和1的CU,分別對Skip和CU劃分進行測 試,如果測試結果大于計算得到的闊值,則當前深度的CU被直接判定為Skip模式或是直接 劃分到下一層的子CU。對于深度為2和3的CU,提取H.264碼流信息中的劃分模式,根據H.264 對應宏塊的劃分模式來減少肥VC重編碼過程中的模式捜索范圍。
[0010 ]具體說,本發明技術方案包括W下步驟:
[0011]步驟SI:基于H.264通用的測試平臺JM,對輸入碼流進行解碼,提取所需碼流信息, 同時得到解碼后的視頻序列。具體提取的碼流信息在下面列出,W下特征值計算中出現的n 為肥VC當前層CU包含H. 264對應宏塊個數。
[0012]步驟Sl. 1對于化ip模式提前判定選取如下特征:
[001引a)皿VC與H. 264對應的Skip和InterieX16模式個數。根據對應宏塊對其進行累 計:
[0015]其中化ipi為對應的第i個宏塊是否為化ip或InterieX16模式,表示如下: 「miGi沖.第i個宏塊為.化咕巧/加erl6xl6模式 [0016」 W職'-|0,第沖宏塊不為抓咕徊加erl6X16模式
[0017] b)皿VC與H. 264對應的帖內(In化a)模式個數。該部分模式包括所有帖內劃分模 式,根據對應宏塊對其進行累計:
[0019]其中Intrai為對應的第i個宏塊是否為Intra模式,表示如下:
[0020]Intra,=j 1〇,第i個宏塊不為/ritra橫式
[0021 ] C)皿VC與H. 264對應的帖間(Inter) 16X16大小模式個數。該部分模式包括Inter (16X8,8X16),根據對應宏塊對其進行累計:
[0023]其中InterOi為對應的第i個宏塊是否為第一類Inter模式(16X8,8X16),表示如 下: 口二(1,第i個宏塊為第一類化ter模式
[0024] 0' -k第i個宏挾不為第一類/nter機式
[0025] d)皿VC與H. 264對應的帖間8X8大小模式個數。該部分模式包括Inter(8X8,8X 4,4X8,4X4 ),根據對應宏塊對其進行累計:
[0027] 其中Interli為對應的第i個宏塊是否為第二類Inter模式(8X8,8X4,4X8,4X 4),表不如下:
[0028] /加erl. = 數個宏塊為第二類/加er模式
[002引/船A. (0,第t?個宏塊不為第二類Mter撰式
[0029] e)肥VC與H.264對應的宏塊運動矢量殘差(MotionVectorDifference,MVD)的方 差。在最優模式被判定為Skip模式時,MVD為0,因此在化ip提前判定中對其求方差來確定其 罔散程度:
[0030]Fmvd=D(MVDx)+D(MVDy)
[0031] 其中D(MVDx)和D(MVDy)是MVD的X軸方向和y軸方向分量的方差;
[0032] f)皿VC與H. 264對應的宏塊殘差系數為0的個數。當殘差系數為0時可W在一定程 度上反映Skip模式,該特征累計殘差系數為0的宏塊個數:
[003引 巧?凹二 ^Re.Si' i'en
[0034]其中Resi為對應的第i個宏塊的殘差是否為0,表示如下: 「00W1巧。S=P'漸個宏塊的殘差為0 [00對巧吟-}0,鍛個宏塊的殘差不為0
[0036]g)肥VC中CU對應的H. 264所有宏塊的平均編碼比特數;
[0038] 其中Biti為對應的第i個宏塊的編碼比特數。
[0039] 步驟Sl. 2對于判定CU劃分選取如下特征:
[0040]a)皿VC與H. 264對應的宏塊是否存在Skip或InterieX16模式。遍歷所有對應的宏 塊對其進行存在判定: rrwMiC」1,存在至少一個Sfc曲教1 細舶1_1〇,所有抓咕,都為0
[0042] 其中化ipi計算方法同步驟Sl. 1中的a);
[0043]b)皿VC與H. 264對應宏塊是否存在帖內預測模式。該部分模式包括所有帖內劃分 模式,遍