應用于h.264到hevc轉碼的快速幀間模式決策方法

文檔序號：9671199閱讀：616來源：國知局

應用于h.264到hevc轉碼的快速幀間模式決策方法
【技術領域】
[0001] 本發明設及視頻數據的轉碼，具體地指一種基于Fisher線性分類器的H. 264到肥VC轉碼方法，用于將H. 264/AVC標準的視頻數據轉碼為肥VC標準的視頻數據。
【背景技術】
[0002] MPEG和ITU兩大國際組織在2013年正式發布了皿VC新一代數字視頻編解碼標準， W適應高質量視頻應用的發展。HEVC使用先進的技術用W改善碼流、編碼質量、延時和算法復雜度之間的關系，有效地提高了視頻編碼效率。肥VC將宏塊的大小從H. 264的16X16擴展至IJ了 64X64,并采用了四叉樹結構的圖像劃分方式，運種劃分方式可W獲得比H.264/AVC更好的壓縮效率。同時，肥VC還采用了更加靈活的編碼結構來提高編碼效率，但由于需要對每一種尺寸的編碼單元（Coding加it,CU)、預測單元（Prediction加it,PU)和變換單元 (TransformUnit,TU)都要通過率失真優化（Rate-Disto;rtionOptimization,畑0)計算得出最優的劃分，使得編碼器的計算復雜度大幅提升。目前網絡上現存的大多數視頻主要是基于H. 264標準進行壓縮編碼的，為了減少視頻傳輸的網絡帶寬及存儲空間，需要將現存的 H. 264編碼視頻碼流轉換為肥VC視頻碼流，W進一步對視頻進行壓縮。由于肥VC采用了預測加變換的混合編碼框架，其編碼結構和H. 264有部分相似性，如果能夠利用H. 264解碼的碼流信息來提前預測CU的劃分方式，那么就可W對四叉樹進行剪枝，略過一部分的RDO過程，運樣可W有效地降低編碼器的復雜度。
[0003] 肥VC的測試軟件化EVCTestModel,HM)所采用的CU的大小為64X64、32X32、16 X16和8X8,分別對應CU的深度層次為0、1、2、3。其中深度層次為0的CU記為LClKLargest CodingUnit,LCU)，深度層次為3的CU記為SClKSmallestCodingUnit,SCU)，而在H.264的測試軟件(JointMode1，JM)所采用的宏塊大小為16X16和8X8。在肥VC帖間編碼中，對于深度層次為0和1的CU,其大小并不存在于H. 264的宏塊結構中。而對于深度層次為2和3的 CU，H. 264擁有和皿VC-樣的分塊大小。因此對于運兩類不同的深度層次，本發明將其分為兩部分進行帖間模式決策加速，運樣有助于進行碼流信息的相關性映射。HM的編碼器采用遞歸的方式對LCU進行劃分，對于每一層的CU都要利用基于RDO的預測來決定PU和TU的劃分，其中TU的劃分也采用了四叉樹的劃分方式，在帖間編碼中，它允許變換塊的大小根據運動補償塊的大小進行自適應的調整。
[0004]為了減少遞歸劃分所帶來的多余的計算，現有的一些方案針對CU的劃分進行了一系列的優化:例如
[000引文獻1 (參見蔣巧.H. 264到肥VC視頻轉碼技術研究[D].浙江大學，2013.)提出了基于統計分析和基于區域特征分析的快速帖間轉碼算法。該文獻首先根據肥VC碼流中Skip模式與H.264碼流中各種模式的統計映射關系對Skip模式進行提前判決，然后利用預測單元對應編碼區域內宏塊編碼比特數的統計特性，對其分割模式進行了快速選擇;基于區域特征分析則利用了了編碼比特數和編碼復雜度之間的關系，通過比較平均編碼比特數和分割闊值來確定重編碼的復雜度，該研究對于Skip模式的提前判定使用了統計分析的方法，因此基于部分序列統計結果設定的闊值通用性有一定的限制。
[0006]文獻2(參見化ixotoE,MacchiavelloB,deQueirozR,etal.FastH.264/AVC toHEVCtranscodingbasedonmachinelearning[C]//TeIecommunications Symposium(ITS) ,2014Inte;rnational.I邸E,2014:1-4.)統計了碼流信息的相關性，引入了線性判別函數(XinearDiscriminantF'unctioniLDF)，在肥VC重編碼階段利用碼流信息作為特征，選取視頻的一小段組成訓練樣本集，根據LDF來計算后續視頻帖CU劃分的判定闊值，在預測模式捜索過程之前直接判定CU是否進行劃分，加速模式決策。由于Skip模式在CU 不劃分的最優模式中比例較高，該方法未充分考慮與Skip相關特征的選取，因此抓-rate上升的幅度較大。

【發明內容】

[0007]本發明的目的在于提供一種H. 264到肥VC轉碼的快速帖間模式決策方法。
[0008] 首先對肥VC中深度為0和1的CU的預測模式分布情況進行統計，判斷對模式決策優化的可行性。通過統計分析，當QP為22時，對于運動比較平緩的視頻序列，深度為0時CU最優模式為Skip模式的比例在25%~45%，深度為1時CU最優模式為Skip模式的比例在30%~ 50 %。而對于運動比較劇烈的視頻序列，CU最優模式為Skip模式的比例則只有20 %左右。隨著量化參數(如antizationParameter,QP)的增大，視頻編碼的細節處理也隨之變的粗糖， Skip模式被決定為最優模式的比例不斷增加，在QP為37時運動平緩的視頻中，Skip模式的比例都在70 %W上。因此在CU深度為0和1時，首先提前判斷該CU是否為Skip模式，然后對CU 的繼續劃分進行預測，而在CU深度為2和3時，則根據碼流信息進行模式映射，減少模式捜索范圍。
[0009]為達到上述目的，本發明的給出的技術方案概括為:首先使用JM解碼器對原始碼流進行解碼，在解碼過程中提取后續轉碼所需的碼流信息，并得到解碼后視頻序列。在肥VC 重編碼時使用Fisher分類器進行在線學習，計算出一定數量帖的化ipW及CU劃分的權值向量和闊值，并根據編碼進度進行更新。對于深度為0和1的CU,分別對Skip和CU劃分進行測試，如果測試結果大于計算得到的闊值，則當前深度的CU被直接判定為Skip模式或是直接劃分到下一層的子CU。對于深度為2和3的CU,提取H.264碼流信息中的劃分模式，根據H.264 對應宏塊的劃分模式來減少肥VC重編碼過程中的模式捜索范圍。
[0010 ]具體說，本發明技術方案包括W下步驟：
[0011]步驟SI:基于H.264通用的測試平臺JM，對輸入碼流進行解碼，提取所需碼流信息，同時得到解碼后的視頻序列。具體提取的碼流信息在下面列出，W下特征值計算中出現的n 為肥VC當前層CU包含H. 264對應宏塊個數。
[0012]步驟Sl. 1對于化ip模式提前判定選取如下特征：
[001引a)皿VC與H. 264對應的Skip和InterieX16模式個數。根據對應宏塊對其進行累計：
[0015]其中化ipi為對應的第i個宏塊是否為化ip或InterieX16模式，表示如下：「miGi沖.第i個宏塊為.化咕巧/加erl6xl6模式 [0016」 W職'-|0,第沖宏塊不為抓咕徊加erl6X16模式
[0017] b)皿VC與H. 264對應的帖內（In化a)模式個數。該部分模式包括所有帖內劃分模式，根據對應宏塊對其進行累計：
[0019]其中Intrai為對應的第i個宏塊是否為Intra模式，表示如下：
[0020]Intra,=j 1〇,第i個宏塊不為/ritra橫式
[0021 ] C)皿VC與H. 264對應的帖間（Inter) 16X16大小模式個數。該部分模式包括Inter (16X8，8X16)，根據對應宏塊對其進行累計：
[0023]其中InterOi為對應的第i個宏塊是否為第一類Inter模式（16X8，8X16)，表示如下：口二（1,第i個宏塊為第一類化ter模式
[0024] 0' -k第i個宏挾不為第一類/nter機式
[0025] d)皿VC與H. 264對應的帖間8X8大小模式個數。該部分模式包括Inter(8X8，8X 4，4X8，4X4 )，根據對應宏塊對其進行累計：
[0027] 其中Interli為對應的第i個宏塊是否為第二類Inter模式(8X8,8X4,4X8,4X 4)，表不如下：
[0028] /加erl. = 數個宏塊為第二類/加er模式
[002引/船A. (0,第t?個宏塊不為第二類Mter撰式
[0029] e)肥VC與H.264對應的宏塊運動矢量殘差(MotionVectorDifference,MVD)的方差。在最優模式被判定為Skip模式時，MVD為0,因此在化ip提前判定中對其求方差來確定其罔散程度：
[0030]Fmvd=D(MVDx)+D(MVDy)
[0031] 其中D(MVDx)和D(MVDy)是MVD的X軸方向和y軸方向分量的方差；
[0032] f)皿VC與H. 264對應的宏塊殘差系數為0的個數。當殘差系數為0時可W在一定程度上反映Skip模式，該特征累計殘差系數為0的宏塊個數：
[003引巧?凹二 ^Re.Si' i'en
[0034]其中Resi為對應的第i個宏塊的殘差是否為0,表示如下：「00W1巧。S=P'漸個宏塊的殘差為0 [00對巧吟-}0,鍛個宏塊的殘差不為0
[0036]g)肥VC中CU對應的H. 264所有宏塊的平均編碼比特數；
[0038] 其中Biti為對應的第i個宏塊的編碼比特數。
[0039] 步驟Sl. 2對于判定CU劃分選取如下特征：
[0040]a)皿VC與H. 264對應的宏塊是否存在Skip或InterieX16模式。遍歷所有對應的宏塊對其進行存在判定： rrwMiC」1，存在至少一個Sfc曲教1 細舶1_1〇,所有抓咕,都為0
[0042] 其中化ipi計算方法同步驟Sl. 1中的a);
[0043]b)皿VC與H. 264對應宏塊是否存在帖內預測模式。該部分模式包括所有帖內劃分模式，遍

完整全部詳細技術資料下載

當前第1頁1 2 3 4

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：張冬冬;童杰;
技術所有人：同濟大學;
我是此專利的發明人

上一篇：一種基于Intel、AMD和Nvidia三平臺的H264硬件解碼系統的制作方法
上一篇：一種分布式視頻編碼框架的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數字信號處理 2.傳感器技術及應用 3.機電一體化產品開發 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統開發
3、孫老師：1.振動信號時頻分析理論與測試系統設計 2.汽車檢測系統設計 3.汽車電子控制系統設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網絡及物聯網
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！