專利名稱:一種基于h264視頻編碼標準的宏塊層碼率控制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻編碼技術(shù)領(lǐng)域,尤其涉及一種基于H264視頻編碼標準的宏塊層碼率控制方法。
背景技術(shù):
在視頻通信中,壓縮編碼后的信息流常常需要在帶寬不衡定的網(wǎng)絡(luò)上傳輸。為了使編碼后的視頻流很好地適應(yīng)帶寬,尤其是適應(yīng)低帶寬信道或時變的無線信道并充分利用有限的網(wǎng)絡(luò)資源,碼率控制成為了視頻通信系統(tǒng)中一個必不可少的環(huán)節(jié)。碼率控制的主要任務(wù)是采集緩沖區(qū)狀態(tài)和圖像活動性等信息,來給每幅圖像分配一定的比特數(shù),使得輸出碼率能控制在給定的標準上,并使圖像失真最小。在基于H264/AVC視頻編碼標準的的碼率控制方法中,由于同時在碼率控制和率失真優(yōu)化環(huán)節(jié)使用了量化參數(shù),導致了 “蛋雞悖論”,即對當前幀的宏塊進行率失真優(yōu)化時,需要先通過當前幀或當前宏塊的MAD決定每個宏塊的量化參數(shù),而當前幀或宏塊的MAD僅在率失真優(yōu)化后才能得到。為了解決“蛋雞悖論”問題,很多學者做了大量的研究,文獻[Shin I H,Lee Y L, Park H W. Rate control using linear rate-P model for H264[J].Signal Process Image Com-munication, 2004,19:341-352.]在 P 域模型的基礎(chǔ)上作了改進,應(yīng)用在 H264 的碼率控制中,文獻[Ma Siwei, Gao Wen, Lu Yan. Rate-distortionanalysis for H264/AVC video coding and its application to rate control[J].1EEE Trans on Circuit Syst for Video Technol, 2005,15 (12) : 1533-1544.]提出了碼率與量化步長與量化步長間的關(guān)系模型及相應(yīng)的碼率控制方法,文獻[Ma S. ff, Gao W,WuF and Lu Y. Rate control for JVT video coding scheme with HRD considerations.Proceeding of IEEE International Conference on Image and Processing, 2003, vol.3, pp:793-796.]將HRD—致性約束、平均絕對誤差比綜合考慮,提出了一種新的碼率控制方法。Li Zhengguo提出的JVTG012方法利用線性MAD模型來預測當前基本單元的MAD值,這一方法可以獲得比較好的編碼效果,引起了廣泛的關(guān)注[Li Zhengguo, Gao Wen, PanFeng, et al. Adaptive rate control for H264[J]. Journal of Visual Communicationand Image R印resentation, 2006,17 (2) : 376-406. ]。JVTG012 方法雖然較好地解決了蛋雞悖論問題,然而仍然存在很多問題。比如方法中沒有明確的討論幀內(nèi)的碼率-量化(R-Q)模型,因此文獻[X. Jing, L. P. Chau, and ff. -C Siu, "Frame complexity-basedrate-quantization model for H264/AVC intraframe rate control, 〃IEEE SignalProcessing Letters, vol. 15, pp. 373-376,2008.]提出了一種自適應(yīng)的巾貞內(nèi) R-Q 模型,這種方法通過考慮基于灰度的幀復雜度,自適應(yīng)的更新模型參數(shù),來更精確地選擇幀內(nèi)編碼幀的量化參數(shù)。又比如在基于傳統(tǒng)變換的視頻編碼系統(tǒng)中彩色視頻信號的率失真(R-D)參數(shù)分別為亮度和色度分量模型化,所以文獻[Z. Z. Chen and K. N. Ngan, “Towardsrate-distortion tradeoff in real-time color video coding,,,IEEE Trans. CircuitsSyst. Video Technol.,2007,vol. 17,no. 2,pp. 158-167]提出為彩色視頻編碼建立獨立的R-D模型。基于幀復雜度的H264碼率控制方法(申請?zhí)枮?01010235061. 8)中公開了一種基于幀復雜度的H264碼率控制方法。該方法包括以下步驟:A、根據(jù)幀復雜度確定當前編碼幀的目標比特數(shù);B、計算量化參數(shù)并進行率失真優(yōu)化;其中,幀復雜度是通過一個復雜度系數(shù)來衡量,該復雜度系數(shù)定義為圖像灰度直方圖的平均差值和圖像亮度分量的平均絕對誤差比率的加權(quán)之和,在該復雜度系數(shù)基礎(chǔ)上,通過經(jīng)驗公式對現(xiàn)有的目標比特公式進行了修正。一種H264碼率控制方法(ZL201010239407.1)提供一種結(jié)合圖像復雜度并對量化參數(shù)進行調(diào)整的幀層碼率控制方法,提高視頻輸出序列的平均峰值信噪比,并能夠減小視頻圖像幀間質(zhì)量波動,從而提高視頻圖像質(zhì)量。上述公開的兩方法主要從自然圖像內(nèi)容的復雜性分配碼率,存在著一些缺點根據(jù)圖像內(nèi)容的客觀特性分配碼率,沒有根據(jù)人眼的主觀特性分配碼率,得到的圖像不一定符合人眼的主觀特性。Z. Wang, A. C. Bovik 等人提出結(jié)構(gòu)相似性(SSIM, Structural Similarity)作為一種衡量兩幅圖像相似度的指標。由于人類視覺很容易從圖像中抽取出結(jié)構(gòu)信息,因此計算兩幅圖像的SSIM值就可以用來評價圖像主觀質(zhì)量的好壞。從SSIM出發(fā),許多學者提出了新的H264編碼方法。有人將SSIM用于H264視頻編碼的率失真優(yōu)化(崔子冠,朱秀昌.基于結(jié)構(gòu)相似的H264主觀率失真性能改進機制.電子與信息學報,2012,34(2) : 433-439)。·
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,利用結(jié)構(gòu)相似性理論對宏塊層的碼率進行分配,更合理的分配宏塊層比特,提高視頻的主觀視頻質(zhì)量,提供一種基于H264視頻編碼標準的宏塊層碼率控制方法,具體有以下技術(shù)方案實現(xiàn)所述基于H264視頻編碼標準的宏塊層碼率控制方法,包括如下步驟A、利用流體阻塞模型和線性追蹤理論計算當前幀的目標比特數(shù);B、按照式(I)分配宏塊層的比特數(shù),
權(quán)利要求
1.一種基于H264視頻編碼標準的宏塊層碼率控制方法,其特征在于,包括如下步驟 A、利用流體阻塞模型和線性追蹤理論計算當前幀的目標比特數(shù); B、按照式(I)分配宏塊層的比特數(shù),
2.根據(jù)權(quán)利要求1所述的宏塊層碼率控制方法,其特征在于,所述步驟C中根據(jù)前一參考幀對應(yīng)宏塊的MD,利用基于MAD的線性預測模型預測當前幀中當前宏塊的MD。
3.根據(jù)權(quán)利要求1所述的宏塊層碼率控制方法,其特征在于,所述步驟D包括如下步驟 a、利用二元R-D模型計算相應(yīng)宏塊的量化參數(shù),如式(2):
4.根據(jù)權(quán)利要求2所述的宏塊層碼率控制方法,其特征在于,所述步驟B中的優(yōu)選方案中,取a=0. 4,b=0. 6,圖像內(nèi)容的清晰程度和圖像結(jié)構(gòu)的連續(xù)性由最好的效果。
全文摘要
本發(fā)明涉及一種基于H264視頻編碼標準的宏塊層碼率控制方法,包括如下步驟A.利用流體阻塞模型和線性追蹤理論計算當前幀的目標比特數(shù);B.分配宏塊層的比特數(shù);C.預測當前幀中當前宏塊的平均絕對誤差比率;D.計算相應(yīng)宏塊的量化參數(shù);E.利用從步驟D得出的參數(shù)值,實現(xiàn)當前幀中每個宏塊的率失真優(yōu)化。其有益效果為所述宏塊層碼率控制方法能夠使生成碼率與目標碼率相近的同時,提高視頻輸出序列的結(jié)構(gòu)相似性,從而得到更好的主觀視頻質(zhì)量。
文檔編號H04N7/26GK103067720SQ20131004434
公開日2013年4月24日 申請日期2013年2月5日 優(yōu)先權(quán)日2013年2月5日
發(fā)明者陳曉, 顧冬玨 申請人:南京信息工程大學