分案申請說明
本申請是2013年9月6日進入中國國家階段的、國際申請日為2012年3月8日、申請?zhí)枮?01280012218.8的發(fā)明專利申請(名稱為“視頻編碼設備、視頻解碼設備、視頻編碼方法以及視頻解碼方法”)的分案申請。
本發(fā)明涉及一種視頻編碼技術(shù),并且特別涉及一種參考重構(gòu)的圖像進行預測并且通過量化執(zhí)行數(shù)據(jù)壓縮的視頻編碼技術(shù)。
背景技術(shù):
典型的視頻編碼設備執(zhí)行編碼過程,該編碼過程遵照預定的視頻編碼方案來生成編碼數(shù)據(jù),即比特流。在非專利文獻(npl)1中作為預定視頻編碼方案的代表性示例加以描述的iso/iec14496-10先進視頻編碼(avc)中,每一幀被分成16×16像素大小的塊(稱為mbs(宏塊)),并且每個mb進一步被分成4×4像素大小的塊,將mb設為編碼的最小單元。圖23示出了在幀的色彩格式是ycbcr4:2:0格式和空間分辨率是qcif(四分之一通用中間格式)的情況下塊劃分的示例。
每個劃分的圖像塊按順序輸入到視頻編碼設備并且被編碼。圖24是示出了用于生成符合avc的比特流的典型視頻編碼設備的結(jié)構(gòu)的示例的框圖。參考圖24,典型視頻編碼設備的結(jié)構(gòu)和操作描述如下。
圖24中所示的視頻編碼設備包括變頻器、量化器102、可變長度編碼器103、量化控制器104、逆量化器105、逆變頻器106、幀存儲器107、幀內(nèi)預測器108、幀間預測器109以及預測選擇器110。
在從輸入圖像減去經(jīng)過預測選擇器110由幀內(nèi)預測器108或幀間預測器109提供的預測圖像后,至視頻編碼設備的輸入圖像作為預測誤差圖像輸入到變頻器101。
變頻器101將輸入預測誤差圖像從空間域變換到頻率域,并且輸出結(jié)果作為系數(shù)圖像。
量化器102使用由控制量化的粒度的量化控制器104提供的量化步長來量化由變頻器101提供的系數(shù)圖像,并且輸出作為量化的系數(shù)圖像的結(jié)果。
可變長度編碼器103熵編碼由量化器102提供的量化的系數(shù)圖像。可變長度的編碼器103還編碼以上由量化控制器104提供的量化步長和由預測選擇器110提供的圖像預測參數(shù)。這些編碼的數(shù)據(jù)塊被多路復用并且作為比特流從視頻編碼設備輸出。
這里參考圖25描述在可變長度編碼器103處的用于量化步長的編碼過程。在可變長度編碼器103中,用于編碼量化步長的量化步長編碼器包括如圖25中所示的量化步長緩沖器10311和熵編碼器10312。
量化步長緩沖器10311保持量化步長q(i-1),其被分配給恰好在將要被編碼的圖像塊之前被編碼的先前的圖像塊。
如下面的式(1)中所示,從輸入量化步長q(i)減去由量化步長緩沖器10311提供的先前的量化步長q(i-1),并且將結(jié)果作為差值量化步長dq(i)輸入到熵編碼器10312。
dq(i)=q(i)-q(i-1)…(1)
熵編碼器10312熵編碼輸入差值量化步長dq(i),并且輸出作為對應于量化步長的碼的結(jié)果。
以上描述了用于量化步長的編碼過程。
量化控制器104確定用于當前輸入圖像塊的量化步長。一般來說,量化控制器104監(jiān)測可變長度編碼器103的輸出碼率用于增加量化步長以便減少用于所關(guān)注的圖像塊的輸出碼率,或者相反地,用于減少量化步長以便增加用于所關(guān)注的圖像塊的輸出碼率。量化步長的增加或減少使視頻編碼設備能夠以目標速率編碼輸入運動圖像。確定的量化步長被提供至量化器102和可變長度編碼器103。
由量化器102輸出的量化的系數(shù)圖像被逆量化器105逆量化以獲得用于在編碼隨后的圖像塊中的預測的系數(shù)圖像。由逆量化器105輸出的系數(shù)圖像被逆變頻器106設置回空間域以獲得預測誤差圖像。該預測圖像被加到預測誤差圖像,并且結(jié)果作為重構(gòu)圖像被輸入到幀存儲器107和幀內(nèi)預測器108。
幀存儲器107存儲在過去輸入的編碼圖像幀的重構(gòu)圖像。存儲在幀存儲器107中的圖像幀被稱為參考幀。
幀內(nèi)預測器108參考圖像塊的重構(gòu)圖像來生成預測圖像,該圖像塊在當前正在被編碼的圖像幀內(nèi)在過去被編碼。
幀間預測器109參考由幀存儲器107提供的參考幀來生成預測圖像。
預測選擇器110比較由幀內(nèi)預測器108提供的預測圖像與由幀間預測器109提供的預測圖像,選擇并且輸出一個更接近于輸入圖像的預測圖像。預測選擇器110還輸出關(guān)于由幀內(nèi)預測器108或幀間預測器109使用的預測方法的信息(稱為圖像預測參數(shù)),并且向可變長度編碼器103提供該信息。
根據(jù)上面所提到的處理,典型視頻編碼設備壓縮地編碼輸入移動圖像以生成比特流。
輸出比特流被傳輸?shù)揭曨l解碼設備。視頻解碼設備執(zhí)行解碼過程,以使得比特流將被解壓縮為運動圖像。圖26示出了典型視頻解碼設備的結(jié)構(gòu)的示例,該視頻解碼設備解碼由典型視頻編碼設備輸出的比特流以獲得解碼視頻。參考圖26,典型視頻解碼設備的結(jié)構(gòu)和操作描述如下。
圖26中所示的視頻解碼設備包括可變長度解碼器201、逆量化器202、逆變頻器203、幀存儲器204、幀內(nèi)預測器205、幀間預測器206以及預測選擇器207。
可變長度解碼器201可變長度解碼輸入比特流以獲得控制逆量化的粒度、量化的系數(shù)圖像以及圖像預測參數(shù)的量化步長。上面提到的量化步長和量化的系數(shù)圖像被提供至逆量化器202。圖像預測參數(shù)被提供給預測選擇器207。
逆量化器202基于輸入量化步長逆量化輸入量化系數(shù)圖像,并且輸出作為系數(shù)圖像的結(jié)果。
逆變頻器203將由逆量化器202提供的系數(shù)圖像從頻率域變換到空間域,并且作為預測誤差圖像輸出結(jié)果。由預測選擇器207提供的預測圖像被加到預測誤差圖像以獲得解碼圖像。解碼圖像不僅作為輸出圖像由視頻解碼設備輸出,而且被輸入到幀存儲器204和幀內(nèi)預測器205。
幀存儲器204存儲在過去被解碼的圖像幀。存儲在幀存儲器204中的圖像幀被稱為參考幀。
基于由可變長度解碼器201提供的圖像預測參數(shù),幀內(nèi)預測器205參考圖像塊的重構(gòu)圖像以生成預測圖像,該圖像塊在當前正在被解碼的圖像幀內(nèi)在過去被解碼。
基于由可變長度解碼器201提供的圖像預測參數(shù),幀間預測器206參考由幀存儲器204提供的參考幀以生成預測圖像。
預測選擇器207基于由可變長度解碼器201提供的圖像預測參數(shù)選擇由幀內(nèi)預測器205和幀間預測器206提供的預測圖像中的任何一個。
這里參考圖27描述了在可變長度解碼器201處用于量化步長的解碼過程。在可變長度解碼器201中,用于解碼量化步長的量化步長解碼器包括如圖27中所示的熵解碼器20111和量化步長緩沖器20112。
熵解碼器20111熵解碼輸入碼,并且輸出差值量化步長dq(i)。
量化步長緩沖器20112保持先前的量化步長q(i-1)。
如下面的式(2)中所示,由量化步長緩沖器20112提供的q(i-1)被加到由熵解碼器20111生成的差值量化步長dq(i)。所加的值不僅作為量化步長q(i)輸出,而且被輸入到量化步長緩沖器20112。
q(i)=q(i-1)+dq(i)…(2)
以上描述了用于量化步長的解碼過程。
根據(jù)以上所提到的處理,典型視頻解碼設備解碼比特流以生成運動圖像。
同時,為了維持將要被編碼過程壓縮的運動圖像的主觀質(zhì)量,典型視頻編碼設備中的量化控制器104通常分析輸入圖像和預測誤差圖像中的任一個或兩者,以及分析輸出碼率,以根據(jù)人類視覺靈敏度確定量化步長。換句話說,量化控制器104執(zhí)行基于視覺靈敏度的自適應量化。具體地,當對于將要被編碼的當前圖像的人類視覺靈敏度被確定為高時,量化步長被設為小的,而當視覺靈敏度被確定為低時,量化步長被設為大的。因為這樣的控制可以向低視覺靈敏度區(qū)域分配較大的碼率,所以主觀質(zhì)量得以提高。
作為基于視覺靈敏度的自適應量化技術(shù),例如,用于mpeg-2試驗模型5(tm5)的基于輸入圖像的紋理復雜度的自適應量化是已知的。紋理復雜度通常稱為活動。專利文獻(ptl)1提出了一種結(jié)合輸入圖像的活動使用預測圖像的活動的自適應量化系統(tǒng)。ptl2提出了一種基于考慮邊緣部分的活動的自適應量化系統(tǒng)。
當使用基于視覺靈敏度的自適應量化技術(shù)時,如果量化步長在圖像幀內(nèi)經(jīng)常改變,則將引起問題。在用于生成符合avc方案的比特流的典型視頻編碼設備中,來自用于正好在將要被編碼的圖像塊之前被編碼的圖像塊的量化步長的差值在編碼量化步長中被熵編碼。因此,隨著在編碼序列方向上量化步長的變化變大,編碼量化步長所需的速率增加。結(jié)果,被分配到系數(shù)圖像的編碼的碼率相對減少,并且因此使圖像質(zhì)量退化。
因為編碼序列方向獨立于視覺靈敏度在熒幕上的連續(xù)性,所以基于視覺靈敏度的自適應量化技術(shù)不可避免地增加了編碼量化步長所需的碼率。因此,即使在典型的視頻編碼設備中使用基于視覺靈敏度的自適應量化技術(shù),與用于量化步長的碼率的增加相關(guān)聯(lián)的圖像退化可以抵消由自適應量化技術(shù)提高的主觀質(zhì)量,即,出現(xiàn)無法實現(xiàn)圖像質(zhì)量的足夠改善的問題。
為了解決這個問題,ptl3公開了一種用于根據(jù)空間域和頻率域中的視覺靈敏度自適應地將量化范圍設置為零(即死區(qū))而不是根據(jù)視覺靈敏度自適應地設置量化步長的技術(shù)。在ptl3中描述的系統(tǒng)中,就視覺靈敏度而言被確定為低的變換系數(shù)的死區(qū)比就視覺靈敏度而言被確定為高的變換系數(shù)的死區(qū)更加擴寬。這樣的控制在不改變量化步長的情況下使能基于視覺靈敏度的自適應量化。
引文列表
專利文獻
ptl1:日本專利第2646921號
ptl2:日本專利第4529919號
ptl3:日本專利第4613909號
非專利文獻
npl1:iso/iec14496-10先進視頻編碼
npl2:“wd1:workingdraft1ofhigh-efficiencyvideocoding,”文檔jctvc-c403,itu-tsg16wp3和iso/iecjtc1/sc29/wg11第3次會議的關(guān)于視頻編碼的聯(lián)合協(xié)作團隊(jct-vc),中國廣州,2010年10月
技術(shù)實現(xiàn)要素:
技術(shù)問題
然而,當使用ptl3中描述的技術(shù)時,不能對未落入死區(qū)內(nèi)的變換系數(shù)執(zhí)行適應于視覺靈敏度的量化。換句話說,即使當視覺靈敏度被確定為低時,用于未落入死區(qū)內(nèi)的變換系數(shù)的系數(shù)碼的速率不能被減少。進一步地,當量化步長被放大時,經(jīng)過量化后的變換系數(shù)值集中在零附近,而當死區(qū)加寬時,未落入死區(qū)內(nèi)的變換系數(shù)即使在經(jīng)過量化后也不集中在零附近。換句話說,當死區(qū)擴大時,與量化步長被放大的情況相比,熵編碼的效率不足。由于這些原因,可以說,在典型的編碼技術(shù)中存在向高視覺靈敏度區(qū)域的碼率的分配不能充分地增加的問題。
鑒于上述問題做出本發(fā)明,并且其目的是提供能夠再生高質(zhì)量的運動圖像的視頻解碼設備和視頻解碼方法。
問題的解決方案
根據(jù)本發(fā)明的設備包括:第一獲取裝置,用于獲取至少被分配到已經(jīng)被解碼的向左鄰接的相鄰圖像塊的量化步長和被分配到已經(jīng)被解碼的向上鄰接的相鄰圖像塊的量化步長的平均值;第二獲取裝置,用于獲取控制逆量化的粒度的第二量化步長,該第二量化步長被分配到前一被解碼的圖像塊;選擇裝置,用于選擇至少被分配到已經(jīng)被解碼的向左鄰接的相鄰圖像塊的量化步長和被分配到已經(jīng)被解碼的向上鄰接的相鄰圖像塊的量化步長的平均值或被分配到前一被解碼的圖像塊的第二量化步長;以及計算裝置,用于基于所選擇的量化步長來計算量化步長。
根據(jù)本發(fā)明的方法包括:獲取至少被分配到已經(jīng)被解碼的向左鄰接的相鄰圖像塊的量化步長和被分配到已經(jīng)被解碼的向上鄰接的相鄰圖像塊的量化步長的平均值,獲取控制逆量化的粒度的第二量化步長,該第二量化步長被分配到前一被解碼的圖像塊,選擇至少被分配到已經(jīng)被解碼的向左鄰接的相鄰圖像塊的量化步長和被分配到已經(jīng)被解碼的向上鄰接的相鄰圖像塊的量化步長的平均值或被分配到前一被解碼的圖像塊的第二量化步長,以及基于所選擇的量化步長來計算量化步長。
發(fā)明的有益效果
根據(jù)本發(fā)明,由于視頻解碼設備可以通過僅接收小碼率來解碼頻繁改變的量化步長,所以可以以小碼率再生高質(zhì)量的運動圖像。
附圖說明
圖1描述了示出本發(fā)明的第一示例性實施例中的視頻編碼設備中的量化步長編碼器的框圖。
圖2描述了示出將要被編碼的圖像塊和相鄰圖像塊的示例的解釋性圖。
圖3描述了示出本發(fā)明的第二示例性實施例中的視頻解碼設備中的量化步長解碼器的框圖。
圖4描述了示出本發(fā)明的第三示例性實施例中的視頻編碼設備中的量化步長編碼器的框圖。
圖5描述了示出本發(fā)明的第四示例性實施例中的視頻解碼設備中的量化步長解碼器的框圖。
圖6描述了示出幀內(nèi)預測的預測方向的解釋性圖。
圖7描述了示出幀間預測的示例的解釋性圖。
圖8描述了示出在本發(fā)明的第三示例性實施例中的視頻編碼設備中使用幀間預測的運動矢量預測量化步長的示例的解釋性圖。
圖9描述了示出根據(jù)本發(fā)明的另一視頻編碼設備的結(jié)構(gòu)的框圖。
圖10描述了示出根據(jù)本發(fā)明的另一視頻編碼設備中的特征部件的框圖。
圖11描述了示出量化步長預測參數(shù)的多路復用的示例的列表的解釋性圖。
圖12描述了示出根據(jù)本發(fā)明的另一解碼設備的結(jié)構(gòu)的框圖。
圖13描述了示出根據(jù)本發(fā)明的另一視頻解碼設備中的特征部件的框圖。
圖14描述了示出本發(fā)明的第七示例性實施例中的量化步長編碼器的框圖。
圖15描述了示出本發(fā)明的第八示例性實施例中的視頻解碼設備中的量化步長解碼器的框圖。
圖16描述了示出信息處理系統(tǒng)的配置示例的框圖,該信息處理系統(tǒng)能夠?qū)崿F(xiàn)根據(jù)本發(fā)明的視頻編碼設備和視頻解碼設備的功能。
圖17描述了示出根據(jù)本發(fā)明的視頻編碼設備中的特征部件的框圖。
圖18描述了示出根據(jù)本發(fā)明的另一視頻編碼設備中的特征部件的框圖。
圖19描述了示出根據(jù)本發(fā)明的視頻解碼設備中的特征部件的框圖。
圖20描述了示出根據(jù)本發(fā)明的另一視頻解碼設備中的特征部件的框圖。
圖21描述了示出根據(jù)本發(fā)明的視頻編碼方法中的特征步驟的流程圖。
圖22描述了示出根據(jù)本發(fā)明的視頻解碼方法中的特征步驟的流程圖。
圖23描述了示出塊劃分的示例的解釋性圖。
圖24描述了示出視頻編碼設備的結(jié)構(gòu)的示例的框圖。
圖25描述了示出典型的視頻編碼設備中的量化步長編碼器的框圖。
圖26描述了示出視頻解碼設備的結(jié)構(gòu)的示例的框圖。
圖27描述了示出典型的視頻解碼設備中的量化步長編碼器的框圖。
具體實施方式
以下參考附圖描述本發(fā)明的示例性實施例。
示例性實施例1
如圖24中所示的視頻編碼設備,本發(fā)明的第一示例性實施例中的視頻編碼設備包括變頻器101、量化器102、可變長度編碼器103、量化控制器104、逆量化器105、逆變頻器106、幀存儲器107、幀內(nèi)預測器108、幀間預測器109以及預測選擇器110。然而,包括在可變長度編碼器103中的量化步長編碼器的結(jié)構(gòu)不同于圖25中所示的結(jié)構(gòu)。
圖1是示出本發(fā)明的第一示例性實施例中的視頻編碼設備中的量化步長編碼器的框圖。與圖25中所示的量化步長編碼器相比較,示例性實施例中的量化步長編碼器的不同之處在于包括如圖1中所示的預測量化步長生成器10313。
量化步長緩沖器10311存儲并且保持被分配到在過去被編碼的圖像塊的量化步長。
預測量化步長生成器10313從量化步長緩沖器取回被分配到在過去被編碼的相鄰圖像塊的量化步長以生成預測量化步長。
從輸入量化步長減去由預測量化步長生成器10313提供的預測量化步長,并且其結(jié)果作為差值量化步長被輸入到熵編碼器10312。
熵編碼器10312熵編碼輸入差值量化步長并且作為對應于量化步長的碼輸出結(jié)果。
這樣的結(jié)構(gòu)可以降低編碼量化步長所需的碼率,并且因此可以實現(xiàn)高質(zhì)量的運動圖像編碼。原因在于可以減少輸入到熵編碼器10312的差值量化步長的絕對數(shù)量,因為預測量化步長生成器10313使用獨立于編碼序列的相鄰圖像塊的量化步長來生成預測量化步長。在使用相鄰圖像塊的量化步長來生成預測量化步長的情況下可以減少輸入到熵編碼器10312的差值量化步長的絕對數(shù)量的原因是因為運動圖像中的相鄰像素之間一般存在相關(guān)性并且因此當使用基于視覺靈敏度的自適應量化時,被分配到彼此具有高相關(guān)性的相鄰圖像塊的量化步長的相似度是高的。
以下通過使用具體示例來描述第一示例性實施例中的視頻編碼設備中的量化步長編碼器的具體操作。
在該示例中,假定作為編碼單元的圖像塊大小為固定大小。還假定在同一圖像幀內(nèi)分別向左、向上和向斜右上相鄰的三個圖像塊被用作用于預測量化步長的相鄰圖像塊。
假設將要被編碼的當前圖像塊用x表示,并且三個相鄰圖像塊a、b和c分別位于與如圖2中所示的圖像塊x向左、向上和向斜右上相鄰。在這種情況下,如果任何塊z中的量化步長用q(z)表示并且預測量化步長用pq(z)表示,則預測量化步長生成器10313通過下面的式(3)來確定預測量化步長pq(x)。
pq(x)=median(q(a),q(b),q(c)…(3)
注意,median(x,y,z)是用于由三個值x,y,z確定中間值的函數(shù)。
熵編碼器10312使用作為熵編碼之一的帶符號的exp-golomb(exponential-golomb)碼編碼由下面的式(4)得到的差值量化步長dq(x),并且輸出作為對應于用于所關(guān)注的圖像塊的量化步長的碼的結(jié)果。
dq(x)=q(x)-pq(x)…(4)
在該示例中,在同一圖像幀內(nèi)向左、向上和向斜右上相鄰的三個圖像塊被用作用于預測量化步長的相鄰圖像塊。然而,相鄰圖像塊不限于此。例如,向左、向上和向斜左上相鄰的圖像塊可以用來由下面的式(5)確定預測量化步長。
pq(x)=median(q(a),q(b),q(d))…(5)
用于預測的圖像塊的數(shù)量可以是除三之外的任何數(shù),并且隨著用于預測的計算可以使用,可以使用除中間值之外的平均值等。用于預測的圖像塊并不一定與將要被編碼的圖像塊相鄰。用于預測的圖像塊可以與將要被編碼的圖像塊相隔預定的距離。進一步地,用于預測的圖像塊不限于以空間相鄰(即,在同一圖像幀內(nèi))而定位的圖像塊,其可以是已經(jīng)被編碼的任何其他圖像幀內(nèi)的圖像塊。
進一步地,在該示例中,假定將要被編碼的圖像塊和相鄰的圖像塊具有同一固定大小。然而,本發(fā)明不限于固定大小的情況,并且作為編碼單元的塊大小可以是可變大小。
進一步地,在該示例中,基于exp-golomb碼執(zhí)行編碼以編碼將要被編碼的圖像塊的量化步長與預測量化步長之間的差值。然而,本發(fā)明不限于使用exp-golomb碼,并且可以基于任何其他熵編碼執(zhí)行編碼。例如,可以執(zhí)行基于huffman碼或算術(shù)碼的編碼。
以上描述了本發(fā)明的第一示例性實施例中的視頻編碼設備。
示例性實施例2
如圖26中所示的視頻解碼設備,本發(fā)明的第二示例性實施例中的視頻解碼設備包括可變長度解碼器201、逆量化器202、逆變頻器203、幀存儲器204、幀內(nèi)預測器205、幀間預測器206以及預測選擇器207。然而,包括在可變長度解碼器201中的量化步長解碼器的結(jié)構(gòu)不同于圖27中所示的結(jié)構(gòu)。
圖3是示出本發(fā)明的第二示例性實施例中的視頻解碼設備中的量化步長解碼器的框圖。與圖27中所示的量化步長解碼器相比較,示例性實施例中的量化步長解碼器的不同之處在于包括如圖3中所示的預測量化步長生成器20113。
熵解碼器20111熵解碼輸入碼以輸出差值量化步長。
量化步長緩沖器20112存儲并且保持在過去被解碼的量化步長。
在過去被解碼的量化步長中,預測量化步長生成器20113從量化步長緩沖器取回對應于將要被解碼的當前圖像塊的相鄰像素塊的量化步長以生成預測量化步長。具體地,例如,預測量化步長生成器20113如第一示例性實施例中的視頻編碼設備的具體示例中的預測量化步長生成器10313相同的方式進行操作。
由預測量化步長生成器20113提供的預測量化步長被加到由熵解碼器20111生成的差值量化步長,并且其結(jié)果不僅作為量化步長被輸出,而且被輸入到量化步長緩沖器20112。
量化步長解碼器的這樣的結(jié)構(gòu)使視頻解碼設備能夠通過僅接收較小的碼率來解碼量化步長。結(jié)果,可以解碼和再生高質(zhì)量的運動圖像。原因在于熵解碼器20111僅須解碼接近零的差值量化步長,因為當預測量化步長生成器20113使用獨立于解碼序列的相鄰圖像塊的量化步長生成預測量化步長時,預測量化步長接近于實際分配的量化步長。通過使用相鄰圖像塊的量化步長生成預測量化步長可以獲得接近于實際分配的量化步長的預測量化步長的原因是因為運動圖像中的相鄰像素之間一般存在相關(guān)性并且因此當使用基于視覺靈敏度的自適應量化時,被分配到彼此具有高相關(guān)性的相鄰圖像塊的量化步長的相似度是高的。
以上描述了本發(fā)明的第二示例性實施例中的視頻解碼設備。
示例性實施例3
如本發(fā)明的第一示例性實施例中的視頻編碼設備,本發(fā)明的第三示例性實施例中的視頻編碼設備包括變頻器101、量化器102、可變長度編碼器103、量化控制器104、逆量化器105、逆變頻器106、幀存儲器107、幀內(nèi)預測器108、幀間預測器109以及預測選擇器110,如圖24中所示。然而,包括在可變長度編碼器103中的量化步長編碼器的結(jié)構(gòu)不同于圖25中所示的結(jié)構(gòu)。
圖4是示出本發(fā)明的第三示例性實施例中的視頻編碼設備中的量化步長編碼器的框圖。如圖4中所示,本發(fā)明的第三示例性實施例中的視頻編碼設備中的量化步長編碼器的結(jié)構(gòu)與圖1中所示的量化步長編碼器的結(jié)構(gòu)相同。然而,第三示例性實施例不同于第一示例性實施例的地方在于用于圖像預測的參數(shù)由圖24中所示的預測選擇器110提供到第三示例性實施例中的預測量化步長生成器10313,并且在于預測量化步長生成器10313的操作。
因為量化步長緩沖器10311和熵編碼器10312的操作與第一示例性實施例中的視頻編碼設備中的量化步長編碼器的操作相同,所以這里省略冗余的描述。
預測量化步長生成器10313使用圖像預測參數(shù)來從在過去被編碼的圖像塊中選擇將要被用于預測量化步長的圖像塊。預測量化步長生成器10313從對應于所選擇的圖像塊的量化步長生成預測量化步長。
與第一示例性實施例中的視頻編碼設備相比,這樣的結(jié)構(gòu)使視頻編碼設備能夠進一步降低編碼量化步長所需的碼率。結(jié)果,可以實現(xiàn)高質(zhì)量的運動圖像編碼。原因在于可以從與所關(guān)注的圖像塊具有高相關(guān)性的相鄰圖像塊來預測量化步長,因為預測量化步長生成器10313使用圖像預測參數(shù)來預測量化步長。
示例性實施例4
如本發(fā)明的第二示例性實施例中的視頻解碼設備,本發(fā)明的第四示例性實施例中的視頻解碼設備包括可變長度解碼器201、逆量化器202、逆變頻器203、幀存儲器204、幀內(nèi)預測器205、幀間預測器206以及預測選擇器207,如圖26中所示。然而,包括在可變長度解碼器201中的量化步長解碼器的結(jié)構(gòu)不同于圖27中所示的結(jié)構(gòu)。
圖5是示出本發(fā)明的第四示例性實施例中的視頻解碼設備中的量化步長解碼器的框圖。如圖5中所示,本發(fā)明的第四示例性實施例中的視頻解碼設備中的量化步長解碼器的結(jié)構(gòu)與圖3中所示的量化步長解碼器的結(jié)構(gòu)相同。然而,第四示例性實施例不同于第二示例性實施例的地方在于用于圖像預測的參數(shù)由圖26中所示的預測選擇器207提供到預測量化步長生成器20313,并且在于預測量化步長生成器20113的操作。
因為熵解碼器20111和量化步長緩沖器20112的操作與第二示例性實施例中的視頻解碼設備中的量化步長解碼器的操作相同,所以這里省略冗余的描述。
預測量化步長生成器20113使用圖像預測參數(shù)來從在過去被解碼的圖像塊中選擇將要被用于預測量化步長的圖像塊。預測量化步長生成器20113從對應于所選擇的圖像塊的量化步長生成預測量化步長。由熵解碼器20111輸出的差值量化步長被加到生成的預測量化步長,并且其結(jié)果不僅作為量化步長被輸出,而且被輸入到量化步長緩沖器20112。
因為在預測量化步長生成器20113處的用于預測量化步長的導出方法與在上面所提到的第三示例性實施例中的視頻編碼設備中的預測量化步長生成器10313處的用于預測量化步長的生成方法相同,所以這里省略冗余的描述。
與第二示例性實施例中的視頻解碼設備相比,這樣的結(jié)構(gòu)使視頻解碼設備能夠通過僅接收進一步更小的碼率來解碼量化步長。結(jié)果,可以解碼和再生高質(zhì)量的運動圖像。原因在于可以從與所關(guān)注的圖像塊具有較高相關(guān)性的相鄰圖像塊來預測量化步長,因為預測量化步長生成器20113使用圖像預測參數(shù)來預測量化步長。
[示例1]
使用示例,以上所提及的第三示例性實施例中的視頻編碼設備中的量化步長編碼器的具體操作描述如下。
在該示例中,幀內(nèi)預測的預測方向用作圖像預測參數(shù)以用于預測量化步長。進一步地,作為幀內(nèi)預測,使用npl1中描述的avc中用于4×4像素塊和8×8像素塊的八方向的定向預測以及平均預測(在圖6中圖示)。
假設作為編碼單元的圖像塊大小是固定大小。還假定作為確定量化步長的單元的塊(稱為量化步長傳輸塊)和作為幀內(nèi)預測的單元的塊(稱為預測塊)具有相同大小。如果將要被編碼的當前圖像塊用x表示,并且四個相鄰塊a、b、c和d具有圖2中所示的位置關(guān)系,則預測量化步長生成器10313由下面的式(6)來確定預測量化步長pq(x)。
pq(x)=pq(b);如果m=0
pq(x)=pq(a);如果m=1
pq(x)=(pq(a)+pq(b)+1)/2;如果m=2
pq(x)=pq(c);如果m=3
pq(x)=pq(d);如果m=4
pq(x)=(pq(c)+pq(d)+1)/2;如果m=5
pq(x)=(pq(a)+pq(d)+1)/2;如果m=6
pq(x)=(pq(b)+pq(d)+1)/2;如果m=7
pq(x)=pq(a);如果m=8
…(6)
注意,m是圖6中所示的幀中的幀內(nèi)預測方向指數(shù)。
熵編碼器10312將量化步長q(x)和預測量化步長pq(x)應用于式(4)以獲得差值量化步長dq(x)。熵編碼器10312使用作為熵編碼之一的帶符號的exp-golomb碼來編碼獲得的差值量化步長dq(x),并且輸出作為對應于所關(guān)注的圖像塊的量化步長的代碼的結(jié)果。
在該示例中,八個方向的定向預測和平均預測被用作幀內(nèi)預測,但本發(fā)明不限于此。例如,可以使用在npl2中描述的33個方向的定向預測和平均預測,或者可以使用任何其他的幀內(nèi)預測。
進一步地,用于預測的圖像塊的數(shù)量可以是除四之外的任何數(shù)量。在該示例中,如上面所提到的式(6)中所示,圖像塊中的任何一個圖像塊中的量化步長或者兩個圖像塊中的量化步長的平均值被用作預測量化步長。然而,本發(fā)明不限于上面所提到的式(6),并且任何其他計算結(jié)果可以被用作預測量化步長。例如,如下面的式(7)中所示,可以使用圖像塊中的任何一個圖像塊中的量化步長或者三個量化步長的中間值,或者可以使用任何其他計算來確定預測量化步長。進一步地,用于預測的圖像塊不一定與將要被編碼的當前圖像塊相鄰。用于預測的圖像塊可以與將要被編碼的當前圖像塊相隔預定距離。
pq(x)=pq(b);如果m=0、5或7
pq(x)=pq(a);如果m=1、6或8
pq(x)=pq(c);如果m=3
pq(x)=pq(d);如果m=4
pq(x)=median(pq(a),pq(b),pq(c));如果m=2
…(7)
在該示例中,假設將要被編碼的圖像塊與相鄰圖像塊具有相同的固定大小。然而,本發(fā)明不限于固定大小,并且作為編碼單元的塊可以具有可變大小。
進一步地,在該示例中,假定量化步長傳輸塊和預測塊具有相同大小。然而,本發(fā)明不限于相同大小,并且量化步長傳輸塊和預測塊可以具有不同大小。例如,如果兩個或更多預測塊包含在量化步長傳輸塊中,則兩個或更多預測塊中的任何一個預測塊中的預測塊可以用于預測量化步長。備選地,將任何計算(諸如中間值計算或平均值計算)加到兩個或更多預測塊的預測方向的結(jié)果可以用于預測量化步長。
進一步地,在該示例中,基于exp-golomb碼對將要被編碼的圖像塊的量化步長與預測量化步長之間的差值進行編碼。然而,本發(fā)明不限于使用exp-golomb碼,并且可以執(zhí)行基于任何其他熵編碼的編碼。例如,可以執(zhí)行基于huffman碼或算術(shù)碼的編碼。
[示例2]
使用另一示例,以上所提及的第三示例性實施例中的視頻編碼設備中的量化步長編碼器的具體操作描述如下。
在該示例中,幀間預測的運動矢量被用作用于預測量化步長的圖像預測參數(shù)。由如圖7中所示的塊單元的轉(zhuǎn)化所定義的預測假定為幀間預測。假設預測圖像從位于參考幀中的這樣的位置的圖像塊生成,該位置從與將要被編碼的塊相同的空間位置離開對應于運動矢量的位移。而且,如圖7中所示,從單一參考幀的預測(即單向預測)假定為幀間預測。進一步地,在該示例中,假定量化步長傳輸塊和預測塊具有相同大小。
這里,將要被編碼的塊用x表示,塊x的中心位置用cent(x)表示,x的幀間預測中的運動矢量用v(x)表示,以及將要在幀間預測中被參考的參考幀用refpic(x)表示。然后,如圖8中所示,幀refpic(x)中位置cent(x)+v(x)所屬的塊表示為block(refpic(x),cent(x)+v(x))。預測量化步長生成器10313由下面的式(8)確定預測量化步長pq(x)。
pq(x)=q(block(refpic(x),cent(x)+v(x))
…(8)
dq(x)的推導以及由熵編碼器10312進行的編碼過程與第一示例中的相同。
在該示例中,假設為單向預測,但本發(fā)明不限于使用單向預測。例如,在雙向預測(其中通過加權(quán)平均兩個參考幀中的參考圖像塊來生成預測圖像)的情況下,如果一個參考幀用refpic0(x)表示,對于refpic0(x)的運動矢量用v0(x)表示,另一個參考幀用refpic1(x)表示,對于refpic1(x)的運動矢量用v1(x)表示,在預測圖像的生成上賦予refpic0(x)的權(quán)重用w0表示,以及賦予refpic1(x)的權(quán)重用w1表示,則預測量化步長生成器10313可以由下面的式(9)確定預測量化步長pq(x)。
pq(x)=w0q(block(refpic0(x),cent(x)+v0(x))+w1q(block(refpic1(x),cent(x)+v1(x))
…(9)
進一步地,在該示例中,參考圖像塊的中心位置所屬的塊的量化步長被用作預測量化步長,但是預測量化步長不限于此。例如,參考圖像塊的左上角位置所屬的塊的量化步長可以被用作預測量化步長。備選地,參考圖像塊的所有像素所屬的塊的量化步長可以分別被參考以使用這些量化步長的平均值作為預測量化步長。
進一步地,在該示例中,由塊之間的轉(zhuǎn)化所表示的預測假定為幀間預測。然而,參考圖像塊不限于此,并且其可以具有任何形狀。
進一步地,在該示例中,假定量化步長傳輸塊和預測塊具有相同大小。然而,如同在以上所提到的第三示例性實施例中的視頻編碼設備的第一示例中那樣,量化步長傳輸塊和預測塊可以具有彼此不同的大小。
[示例3]
使用又一示例,以上所提及的第三示例性實施例中的視頻編碼設備中的量化步長編碼器的具體操作描述如下。
在該示例中,幀間預測的運動矢量的預測(即預測運動矢量)用作用于預測量化步長的圖像預測參數(shù)。當預測運動矢量由將要被編碼的塊的相鄰圖像塊導出時,用于導出預測運動矢量的相鄰圖像塊的量化步長用于預測將要被編碼的塊的運動矢量。
在該示例中,假定量化步長傳輸塊和預測塊具有相同大小。而且,如同在以上所提到的第三示例性實施例中的視頻編碼設備的第二示例中那樣,由運動矢量表示的單向預測假定為幀間預測。在該示例中,從圖7中所示的運動矢量減去由預定的方法導出的預測運動矢量,并且其差值被熵編碼。作為預定的預測運動矢量導出方法,使用在npl2的“8.4.2.1.4derivationprocessforlumamotionvectorprediction”中描述的預測運動矢量導出方法。
這里,簡要描述該示例中使用的預測運動矢量導出方法。將要被編碼的塊用x表示,并且如圖2中所示的向左、向上、向斜右上、向斜左上和向斜左下相鄰的塊分別用a、b、c、d和e表示。塊a的運動矢量用mva表示并且塊b的運動矢量用mvb表示。當塊c存在于圖像中并且已經(jīng)被編碼時,塊c的運動矢量被設為mvc。否則,當塊d存在于圖像中并且已經(jīng)被編碼時,塊d的運動矢量被設為mvc。否則,塊e的運動矢量被設為mvc。
進一步地,由下面的式(10)確定的運動矢量用mvmed表示,并且在被分配給將要被編碼的圖像幀的參考幀上與將要被編碼的塊相同的空間位置中的塊(在圖8中被圖示為關(guān)于將要被編碼的塊x的同步塊xcol)的運動矢量用mvcol表示。分配的參考幀例如意思是正好在將要被編碼的圖像幀之前被編碼的圖像幀。
mvmed=(mvmedx,mvmedy)
mvmedx=median(mvax,mvbx,mvcx)
mvmedy=median(mvay,mvby,mvcy)
…(10)
如上所述,五個運動矢量(即,mvmed、mva、mvb、mvc和mvcol)是將要被編碼的塊x中的預測運動矢量的候選者。根據(jù)預定的優(yōu)先級順序從候選者中選擇任何一個運動矢量,并且被設為將要被編碼的塊的預測運動矢量pmv(x)。npl2的“8.4.2.1.4derivationprocessforlumamotionvectorprediction”和“8.4.2.1.8removalprocessformotionvectorprediction”中描述了預定的優(yōu)先級順序的示例。
當如上所述確定預測運動矢量pmv(x)時,預測量化步長生成器10313由下面的式(11)確定將要被編碼的塊x的預測量化步長pq(x)。
pq(x)=q(a);如果pmv(x)=mva
pq(x)=q(b);否則如果pmv(x)=mvb
pq(x)=q(c);否則如果pmv(x)=mvc,并且mvc是塊c的運動矢量
pq(x)=q(d);否則如果pmv(x)=mvc,并且mvc是塊d的運動矢量
pq(x)=q(e);否則如果pmv(x)=mvc,并且mvc是塊e的運動矢量
pq(x)=q(xcol);否則如果pmv(x)=mvcol
pq(x)=median(q(a),q(b),q(c));否則
…(11)
在該示例中,假設為單向預測,但是本發(fā)明不限于使用單向預測。如同在以上所提到的第三示例性實施例中的視頻編碼設備的第二示例中那樣,該示例還可以應用于雙向預測。
進一步地,在該示例中,npl2的“8.4.2.1.4derivationprocessforlumamotionvectorprediction”中描述的預測運動矢量導出方法被用作預測運動矢量導出方法,但是本發(fā)明不限于此。例如,如npl2的“8.4.2.1.3derivationprocessforlumamotionvectorsformergemode”中所描述的,如果將要被編碼的塊x的運動矢量由塊a或塊b的運動矢量來預測,則預測量化步長生成器10313可以由下面的式(12)確定將要被編碼的塊x的預測量化步長pq(x),或者可以使用任何其他預測運動矢量導出方法。
pq(x)=q(a);如果pmv(x)=mva
pq(x)=q(b);否則
…(12)
進一步地,在該示例中,如式(11)中所示,用于預測量化步長的圖像塊以塊a、b、c、d、e和xcol的順序被參考。然而,本發(fā)明不限于該順序,并且可以使用任何順序。至于用于預測量化步長的圖像塊的數(shù)量和位置,可以使用圖像塊的任意數(shù)量和位置。進一步地,在該示例中,當pmv(x)不與mva、mvb、mvc和mvcol中的任何一個一致時,使用如同式(3)中的中間值計算,但是本發(fā)明不限于使用中間值計算。還可以使用諸如如同第一示例性實施例中的平均值計算之類的任何計算。
進一步地,在該示例中,假定量化步長傳輸塊和預測塊具有相同大小。然而,量化步長傳輸塊和預測塊可以具有彼此不同的大小,如同在以上所提到的第三示例性實施例中的視頻編碼設備的第一示例和第二示例那樣。
示例性實施例5
圖9是示出本發(fā)明的第五示例性實施例中的視頻編碼設備的結(jié)構(gòu)的框圖。圖10是示出在該示例性實施例中的視頻編碼設備中的量化步長編碼器的結(jié)構(gòu)的框圖。
與圖24中所示的視頻編碼設備相比較,該示例性實施例中的視頻編碼設備的不同之處在于包括量化步長預測控制器111和多路復用器112,如圖9中所示。注意,圖24中所示的視頻編碼設備也是如上所述的第三示例性實施例中的視頻編碼設備。
進一步地,如圖10中所示,該示例性實施例與第三示例性實施例的不同之處在于與圖4中所示的量化步長編碼器相比較,視頻編碼設備的可變長度編碼器103中用于編碼量化步長的量化步長編碼器被配置為將來自圖9中所示的量化步長預測控制器111的量化步長預測參數(shù)提供到預測量化步長生成器10313,以及在于預測量化步長生成器10313的操作。
量化步長預測控制器111將用于控制預測量化步長生成器10313的量化步長預測操作的控制信息提供到可變長度編碼器103和多路復用器112。用于控制量化步長預測操作的控制信息稱為量化步長預測參數(shù)。
多路復用器112多路復用量化步長預測參數(shù)為由可變長度編碼器103提供的視頻比特流,并且輸出作為比特流的結(jié)果。
使用圖像預測參數(shù)和量化步長預測參數(shù),預測量化步長生成器10313從在過去被編碼的圖像塊中選擇用于預測量化步長的圖像塊。預測量化步長10313還從對應于所選擇的圖像塊的量化步長生成預測量化步長。
與第三示例性實施例中的視頻編碼設備相比,該示例性實施例中的視頻編碼設備的這樣的結(jié)構(gòu)可以進一步降低編碼量化步長所需的碼率。因此,可以實現(xiàn)高質(zhì)量的運動圖像編碼。原因在于可以針對圖像塊以較高的精度預測量化步長,因為預測量化步長生成器10313使用除圖像預測參數(shù)外的量化步長預測參數(shù)來切換或糾正使用圖像預測參數(shù)的量化步長的預測值??梢酝ㄟ^使用量化步長預測參數(shù)切換或校正來以較高的精度預測量化步長的原因是因為圖9中所示的量化控制器104監(jiān)測可變長度編碼器103的輸出碼率以在不單獨依賴于人類視覺靈敏度的情況下增加或減少量化步長,并且因此將要還被給到具有相同視覺靈敏度的圖像塊的量化步長可以不同。
以下使用具體示例描述以上提到的第五示例性實施例中的視頻編碼設備中的量化步長編碼器的具體操作。
在該示例中,如同以上提到的第三示例性實施例中的視頻編碼設備的第二示例中那樣,幀間預測的運動矢量被用作用于預測量化步長的圖像預測參數(shù)。由如圖7中所示的塊單元的轉(zhuǎn)化所定義的預測假定為幀間預測。在這種情況下,假設從位于參考幀中的這樣的位置的圖像塊生成預測圖像,該位置從與將要被編碼的塊相同的空間位置離開對應于運動矢量的位移。而且,如圖7中所示,從單一參考幀的預測(即單向預測)假定為幀間預測。進一步地,在該示例中,假定量化步長傳輸塊和預測塊具有相同大小。
這里,將要被編碼的塊用x表示,將要被編碼的幀用pic(x)表示,塊x的中心位置用cent(x)表示,x的幀間預測中的運動矢量用v(x)表示,并且將要在幀間預測中被參考的參考幀用refpic(x)表示。然后,如圖8中所示,在幀refpic(x)中位置cent(x)+v(x)所屬的塊表示為block(refpic(x),cent(x)+v(x))。進一步地,假設三個相鄰圖像塊a、b和c分別位于向左、向上和向斜右上與塊x相鄰的位置,如圖2中所示。在這種情況下,預測量化步長生成器10313由下面的式(13)確定預測量化步長pq(x)。
pq(x)=q(block(refpic(x),cent(x)+v(x));如果temporal_qp_pred_flag=1
pq(x)=median(pq(a),pq(b),q(c));否則
…(13)
這里,temporal_qp_pred_flag表示用于在幀間運動矢量是否可以用于預測量化步長之間切換的標志。該標志由量化步長預測控制器111提供到預測量化步長生成器10313。
預測量化步長生成器10313還可以使用被用于補償將要被編碼的幀pic(x)和參考幀refpic(x)之間的量化步長的變化的偏移值,即對于量化步長的偏移量qofs(pic(x),refpic(x))來由下面的式(14)確定預測量化步長pq(x)。
pq(x)=q(block(refpic(x),cent(x)+v(x))+qofs(pic(x),refpic(x))
…(14)
進一步地,預測量化步長生成器10313可以使用以上提到的temporal_qp_pred_flag和對于量化步長的偏移量兩者來由下面的式(15)確定預測量化步長pq(x)。
pq(x)=q(block(refpic(x),cent(x)+v(x))+qofs(pic(x),refpic(x));如果temporal_qp_pred_flag=1
pq(x)=median(pq(a),pq(b),q(c));否則
…(15)
例如,如果任何幀z的初始量化步長用qinit(z)表示,則以上提到的式(14)和(15)中對于量化步長的偏移量qofs(pic(x),refpic(x))可以由下面的式(16)確定。
qofs(pic(x),refpic(x))=qinit(pic(x))-qinit(refpic(x))…(16)
初始量化步長是作為用于每幀的量化步長的初始值而給出的值,并且例如,可以使用npl1的“7.4.3sliceheadersemantics”中描述的sliceqpy。
例如,如圖11中所示的列表中所圖示的,其對應于npl1的“specificationofsyntaxfunctions,categories,anddescriptors”中的描述,以上提到的temporal_qp_pred_flag值和qofs(pic(x),refpic(x))值中的任一或者兩者可以作為頭信息被多路復用到比特流中。
在圖11中所示的列表中,qp_pred_offset表示以上提到的式(14)中的qofs值。如圖11中所示,多條qp_pred_offset可以被多路復用為對應于各自的參考幀的qofs值,或者一條qp_pred_offset可以被多路復用為對于所有參考幀的公用qofs值。
在該示例中,幀間預測的運動矢量假設為圖像預測參數(shù)。然而,本發(fā)明不限于使用幀間預測的運動矢量。如同在以上提到的第三示例性實施例中的視頻編碼設備的第一示例中那樣,可以如此使用幀內(nèi)預測的預測方向以致以上提到的標志將在是否使用幀內(nèi)預測的預測方向以預測量化步長之間切換。如同在以上提到的第三示例性實施例中的視頻編碼設備的第三示例中那樣,可以使用預測運動矢量的預測方向,或者可以使用任何其他圖像預測參數(shù)。
進一步地,在該示例中,單向預測假定為幀間預測。然而,本發(fā)明不限于使用單向預測。如同在以上提到的第三示例性實施例中的視頻編碼設備的第二示例中那樣,本發(fā)明還可以被應用于雙向預測。
進一步地,在該示例中,參考圖像塊的中心位置所屬的塊的量化步長被用作預測量化步長。然而,本發(fā)明中預測量化步長的導出不限于此。例如,參考圖像塊的左上角位置所屬的塊的量化步長可以被用作預測量化步長。備選地,參考圖像塊的所有像素所屬的塊的量化步長可以分別被參考以使用這些量化步長的平均值作為預測量化步長。
進一步地,在該示例中,由具有相同形狀的塊之間的轉(zhuǎn)化所表示的預測假定為幀間預測。然而,本發(fā)明的參考圖像塊不限于此,并且其可以具有任何形狀。
進一步地,在該示例中,如式(13)和式(15)中所示,當不使用幀間預測信息時,基于中間值計算從三個空間上相鄰的圖像塊來預測量化步長,但是本發(fā)明不限于此。如同在第一示例性實施例的具體示例中那樣,用于預測的圖像塊的數(shù)量可以是除三以外的任何數(shù)量,并且可以使用平均值計算等而不是中間值計算。進一步地,用于預測的圖像塊不一定與將要被編碼的當前圖像塊相鄰,并且該圖像塊可以從將要被編碼的當前圖像塊隔開預定的距離。
進一步地,在該示例中,假定量化步長傳輸塊和預測塊具有相同大小,但是如同在以上提到的第三示例性實施例中的視頻編碼設備的第一示例中那樣,量化步長傳輸塊和預測塊可以具有彼此不同的大小。
示例性實施例6
圖12是示出本發(fā)明的第六示例性實施例中的視頻解碼設備的結(jié)構(gòu)的框圖。圖13是示出該示例性實施例中的視頻解碼設備中的量化步長解碼器的結(jié)構(gòu)的框圖。
與圖26中所示的視頻解碼設備相比較,該示例性實施例中的視頻解碼設備的不同之處在于包括解多路復用器208和量化步長預測控制器209,如圖12中所示。如上所述,圖26中所示的視頻解碼設備也是第四示例性實施例中的視頻解碼設備。
進一步地,與圖5中所示的量化步長解碼器相比較,如圖13中所示,該示例性實施例中的視頻解碼設備的可變長度解碼器201中用于解碼量化步長的量化步長解碼器與第四示例性實施例的不同之處在于,將來自圖12中所示的量化步長預測控制器209的量化步長預測參數(shù)提供到預測量化步長生成器20113,以及在于預測量化步長生成器20113的操作。
解多路復用器208解多路復用比特流以提取視頻比特流和用于控制量化步長預測操作的控制信息。解多路復用器208進一步分別將提取的控制信息提供到量化步長預測控制器209,并且將提取的視頻比特流提供到可變長度解碼器。
量化步長預測控制器209基于所提供的控制信息建立預測量化步長生成器20113的操作。
預測量化步長生成器20113使用圖像預測參數(shù)和量化步長預測參數(shù)來從在過去被解碼的圖像塊中選擇用于預測量化步長的圖像塊。預測量化步長生成器20113進一步從對應于所選擇的圖像塊的量化步長生成預測量化步長。由熵解碼器20111輸出的差值量化步長被加到生成的預測量化步長,并且其結(jié)果不僅被輸出為量化步長,而且被輸入到量化步長緩沖器20112。
因為在預測量化步長生成器20113處的用于預測量化步長的導出方法與以上提到的第五示例性實施例中的視頻編碼設備中的預測量化步長生成器10313處的用于預測量化步長的生成方法相同,所以這里省略冗余的描述。
與第四示例性實施例中的視頻解碼設備相比,這樣的結(jié)構(gòu)使視頻解碼設備能夠通過僅接收進一步更小的碼率來解碼量化步長。結(jié)果,可以解碼和再生高質(zhì)量的運動圖像。原因在于可以針對圖像塊以較高的精度預測量化步長,因為預測量化步長生成器20113使用除圖像預測參數(shù)外的量化步長預測參數(shù)來切換或糾正使用圖像預測參數(shù)的量化步長的預測值。
示例性實施例7
如同第三示例性實施例中的視頻編碼設備那樣,本發(fā)明的第七示例性實施例中的視頻編碼設備包括變頻器101、量化器102、可變長度編碼器103、量化控制器104、逆量化器105、逆變頻器106、幀存儲器107、幀內(nèi)預測器108、幀間預測器109以及預測選擇器110,如圖24中所示。然而,包含在可變長度編碼器103中的量化步長編碼器的結(jié)構(gòu)不同于圖4中所示的第三示例性實施例中的視頻編碼設備的結(jié)構(gòu)。
圖14是示出本發(fā)明的第七示例性實施例中的視頻編碼設備中的量化步長編碼器的結(jié)構(gòu)的框圖。與圖4中所示的量化步長編碼器相比較,該示例性實施例中的量化步長編碼器的結(jié)構(gòu)的不同之處在于包括如圖14中所示的量化步長選擇器10314。
因為量化步長緩沖器10311、熵編碼器10312和預測量化步長生成器10313的操作與第三示例性實施例中的視頻編碼設備中的量化步長編碼器的操作相同,所以這里省略冗余的描述。
量化步長選擇器10314根據(jù)圖像預測參數(shù)選擇被分配到先前編碼的圖像塊的量化步長或者由預測量化步長生成器10313輸出的預測量化步長,并且輸出作為選擇性預測量化步長的結(jié)果。被分配到先前編碼的圖像塊的量化步長被保存在量化步長緩沖器10311中。從被輸入到量化步長編碼器并且當前將要被編碼的量化步長減去由量化步長選擇器10314輸出的選擇性預測量化步長,并且其結(jié)果被輸入到熵編碼器10312。
與第三示例性實施例中的視頻編碼設備相比,這樣的結(jié)構(gòu)使該示例性實施例中的視頻編碼設備能夠進一步降低編碼量化步長所需的碼率。結(jié)果,可以實現(xiàn)高質(zhì)量的運動圖像編碼。原因在于量化步長可以通過量化步長選擇器10314的操作被編碼以選擇性地使用由圖像預測參數(shù)和先前編碼的量化步長導出的預測量化步長。通過選擇性地使用由圖像預測參數(shù)和先前編碼的量化步長導出的預測量化步長可以進一步降低編碼量化步長所需的碼率的原因是因為編碼設備中的量化控制器104不僅執(zhí)行基于視覺靈敏度的自適應量化,而且監(jiān)測輸出碼率以增加或減少如上所述的量化步長。
以下使用具體示例描述第七示例性實施例中的視頻編碼設備中的量化步長編碼器的具體操作。
這里,幀內(nèi)預測的預測方向被用作用于預測量化步長的圖像預測參數(shù)。進一步地,作為幀內(nèi)預測,使用npl1中描述的avc方案中用于4×4像素塊和8×8像素塊的八方向的定向預測以及平均預測(見圖6)。
假設作為編碼的單元的圖像塊大小是固定大小。還假設作為確定量化步長的單元的塊(稱為量化步長傳輸塊)和作為幀內(nèi)預測的單元的塊(稱為預測塊)具有相同大小。如果將要被編碼的當前圖像塊用x表示,并且四個相鄰塊a、b、c和d具有圖2中所示的位置關(guān)系,則預測量化步長生成器10313由以上提到的式(6)確定預測量化步長pq(x)。
量化步長選擇器10314根據(jù)下面的式(17)選擇由式(6)獲得的預測量化步長pq(x)或者先前編碼的量化步長q(xprev)以生成選擇性預測量化步長sq(x),即,由式(6)確定的預測量化步長作為選擇性預測量化步長被用于定向預測,而先前的量化步長作為選擇性預測量化步長被用于平均值預測。
sq(x)=q(xprev);如果m=2
sq(x)=pq(x);如果m=0、1、3、4、5、6、7或8
…(17)
注意,m是圖6中所示的幀中的幀內(nèi)預測方向指數(shù)。
熵編碼器10312使用作為熵編碼之一的帶符號的exp-golomb(exponential-golomb)碼編碼由下面的式(18)獲得的差值量化步長dq(x),并且輸出作為對應于用于所關(guān)注的圖像塊的量化步長的碼的結(jié)果。
dq(x)=q(x)-sq(x)…(18)
在該示例性實施例中,八方向的定向預測以及平均預測被用作幀內(nèi)預測,但是本發(fā)明不限于此。例如,可以使用npl2中描述的33方向的定向預測以及平均預測,或者可以使用任何其他幀內(nèi)預測。
進一步地,在該示例性實施例中,在預測量化步長和先前被編碼的量化步長之間基于幀內(nèi)預測的參數(shù)做出選擇,但是本發(fā)明不限于使用幀內(nèi)預測信息。例如,可以做出選擇以在幀內(nèi)預測塊中使用預測量化步長而在幀間預測塊中使用先前被編碼的量化步長,反之亦然。當幀間預測的參數(shù)滿足某一具體條件時,可以做出選擇以使用先前被編碼的量化步長。
用于預測的圖像塊的數(shù)量可以是除四以外的任何數(shù)量。進一步地,在示例性實施例中,圖像塊中的任何一個圖像塊中的量化步長或者兩個圖像塊中的量化步長的平均值被用作如式(6)中所示的預測量化步長。然而,預測量化步長不限于式(6)中的那些預測量化步長。任何其他計算結(jié)果可以被用作預測量化步長。例如,如式(7)中所示,可以使用圖像塊中的任何一個圖像塊中的量化步長或者三個量化步長的中間值,或者可以使用任何其他計算來確定預測量化步長。進一步地,用于預測的圖像塊不一定與將要被編碼的當前圖像塊相鄰。用于預測的圖像塊可以與將要被編碼的當前圖像塊相隔預定的距離。
進一步地,在該示例性實施例中,假定將要被編碼的圖像塊和用于預測的圖像塊具有相同的固定大小。然而,本發(fā)明不限于作為編碼單元的圖像塊具有固定大小的情況。作為編碼單元的圖像塊可以具有可變大小,并且將要被編碼的圖像塊和用于預測的圖像塊可以具有彼此不同的大小。
進一步地,在該示例性實施例中,假定量化步長傳輸塊和預測塊具有相同大小。然而,本發(fā)明不限于相同大小的情況,并且量化步長傳輸塊和預測塊可以具有不同大小。例如,當兩個或更多預測塊包含在量化步長傳輸塊中時,兩個或更多預測塊中的任何一個預測塊的預測方向可以用于預測量化步長。備選地,將任何計算(諸如中間值計算或平均值計算)加到兩個或更多預測塊的預測方向的結(jié)果可以用于預測量化步長。
進一步地,在該示例性實施例中,將要被編碼的圖像塊的量化步長和預測量化步長之間的差值基于exp-golomb碼被編碼。然而,本發(fā)明不限于使用exp-golomb碼,并且可以執(zhí)行基于任何其他熵編碼的編碼。例如,可以執(zhí)行基于huffman碼或算術(shù)碼的編碼。
示例性實施例8
如同本發(fā)明的第四示例性實施例中的視頻解碼設備那樣,本發(fā)明的第八示例性實施例中的視頻解碼設備包括可變長度解碼器201、逆量化器202、逆變頻器203、幀存儲器204、幀內(nèi)預測器205、幀間預測器206以及預測選擇器207,如圖26中所示。然而,包含在可變長度解碼器201中的量化步長解碼器的結(jié)構(gòu)不同于圖5中所示的結(jié)構(gòu)。
圖15是示出本發(fā)明的第八示例性實施例中的視頻解碼設備中的量化步長解碼器的框圖。與圖5中所示的量化步長解碼器的結(jié)構(gòu)相比較,該示例性實施例中的量化步長解碼器的結(jié)構(gòu)的不同之處在于包括如圖15中所示的量化步長選擇器20114。
因為熵解碼器20111、量化步長緩沖器20112和預測量化步長生成器20113的操作與第四示例性實施例中的視頻編碼設備中的量化步長解碼器的操作相同,所以這里省略冗余的描述。
量化步長選擇器20114根據(jù)圖像預測參數(shù)選擇被分配到先前被解碼的圖像塊的量化步長或者由預測量化步長生成器20113輸出的預測量化步長,并且輸出作為選擇性預測量化步長的結(jié)果。被分配到先前被解碼的圖像塊的量化步長被保存在量化步長緩沖器20112中。由熵解碼器20111生成的差值量化步長被加到所輸出的選擇性預測量化步長,并且其結(jié)果不僅作為量化步長被輸出,而且被存儲在量化步長緩沖器20112中。
與第四示例性實施例中的視頻解碼設備相比,這樣的結(jié)構(gòu)使視頻解碼設備能夠通過僅接收進一步更小的碼率來解碼量化步長。結(jié)果,可以解碼和再生高質(zhì)量的運動圖像。原因在于量化步長可以通過量化步長選擇器20114的操作被解碼以選擇性地使用由圖像預測參數(shù)和先前被編碼的量化步長導出的預測量化步長,以使得對于通過應用基于視覺靈敏度的自適應量化以及由監(jiān)測輸出碼率導致的量化步長的增加或減少這兩者而生成的比特流,可以用較小的碼率解碼量化步長,并且因此可以以較小的碼率解碼和再生運動圖像。
以上提到的每個示例性實施例可以由硬件或者計算機程序來實現(xiàn)。
圖16中所示的信息處理系統(tǒng)包括處理器1001、程序存儲器1002、用于存儲視頻數(shù)據(jù)的存儲介質(zhì)1003以及用于存儲比特流的存儲介質(zhì)1004。存儲介質(zhì)1003和存儲介質(zhì)1004可以是獨立的存儲介質(zhì),或者包括在相同存儲介質(zhì)中的存儲區(qū)域。作為存儲介質(zhì),諸如硬盤之類的磁存儲介質(zhì)可以被用作存儲介質(zhì)。
在圖16中所示的信息處理系統(tǒng)中,用于實現(xiàn)圖24和圖26中的每幅圖中所示的每個塊(包括圖1、圖3、圖4和圖5中所示的塊中的每個塊,緩沖器塊除外)的功能的程序被存儲在程序存儲器1002中。處理器1001根據(jù)存儲在程序存儲器1002中的程序執(zhí)行處理以分別實現(xiàn)在圖24、圖26以及圖1、圖3、圖4和圖5中的每幅圖中所示的視頻編碼設備或視頻解碼設備的功能。
圖17是示出根據(jù)本發(fā)明的視頻編碼設備中的特征部件的框圖。如圖17中所示,根據(jù)本發(fā)明的視頻編碼設備包括用于編碼控制量化的粒度的量化步長的量化步長編碼單元10,并且量化步長編碼單元10包括用于使用被分配到已經(jīng)被編碼的相鄰圖像塊的量化步長來預測量化步長的量化步長預測單元11。
圖18是示出根據(jù)本發(fā)明的另一視頻編碼設備中的特征部件的框圖。如圖18中所示,除圖17中所示的結(jié)構(gòu)之外,根據(jù)本發(fā)明的另一視頻編碼設備還包括用于使用在過去被編碼的圖像和預定的參數(shù)來生成將要被編碼的圖像塊的預測圖像的預測圖像生成單元20。在該結(jié)構(gòu)中,量化步長編碼單元10使用被用于生成預測圖像的參數(shù)來預測量化步長。還可以包括用于通過使用被分配到已經(jīng)被編碼的相鄰圖像塊的運動矢量來預測用于幀間預測的運動矢量的預測運動矢量生成單元30,以使得量化步長編碼單元10將使用預測運動矢量的預測方向來預測量化步長。
圖19是示出根據(jù)本發(fā)明的視頻解碼設備中的特征部件的框圖。如圖19中所示,根據(jù)本發(fā)明的視頻解碼設備包括用于解碼控制逆量化的粒度的量化步長的量化步長解碼單元50,并且量化步長解碼單元50包括用于使用被分配到已經(jīng)被解碼的相鄰圖像塊的量化步長來預測量化步長的步長預測單元51。
圖20是示出根據(jù)本發(fā)明的另一視頻解碼設備中的特征部件的框圖。如圖20中所示,除圖19中所示的結(jié)構(gòu)之外,根據(jù)本發(fā)明的另一視頻解碼設備還包括用于使用在過去被解碼的圖像和預定的參數(shù)來生成將要被解碼的圖像塊的預測圖像的預測圖像生成單元60。在該結(jié)構(gòu)中,量化步長解碼單元50使用被用于生成預測圖像的參數(shù)來預測量化步長。還可以包括用于通過使用被分配到已經(jīng)被編碼的相鄰圖像塊的運動矢量來預測用于幀間預測的運動矢量的預測運動矢量生成單元70,以使得量化步長解碼單元50將使用預測運動矢量的預測方向來預測量化步長。
圖21是示出根據(jù)本發(fā)明的視頻編碼方法中的特征步驟的流程圖。如圖21中所示,視頻編碼方法包括用于確定幀內(nèi)預測的預測方向的步驟s11、用于使用幀內(nèi)預測生成預測圖像的步驟s12以及用于使用幀內(nèi)預測的預測方向預測量化步長的步驟s13。
圖22是示出根據(jù)本發(fā)明的視頻解碼方法中的特征步驟的流程圖。如圖22中所示,視頻解碼方法包括用于確定幀內(nèi)預測的預測方向的步驟s21、用于使用幀內(nèi)預測生成預測圖像的步驟s22以及用于使用幀內(nèi)預測的預測方向預測量化步長的步驟s23。
部分或所有前述示例性實施例可以被描述為以下提到的補充說明,但是本發(fā)明的結(jié)構(gòu)不限于下面的結(jié)構(gòu)。
(補充說明1)
一種視頻編碼設備,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,其包括用于編碼控制量化的粒度的量化步長的量化步長編碼裝置,以及用于使用在過去被編碼的圖像和預定的參數(shù)來生成將要被編碼的圖像塊的預測圖像的預測圖像生成裝置,該量化步長編碼裝置用于通過使用由該預測圖像生成裝置使用的參數(shù)來預測量化步長,其中該預測圖像生成裝置通過至少使用幀間預測來生成預測圖像,并且該量化步長編碼裝置使用幀間預測的運動矢量來預測量化步長。
(補充說明2)
一種視頻編碼設備,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,其包括用于編碼控制量化的粒度的量化步長的量化步長編碼裝置,以及用于通過使用在過去被編碼的圖像和預定的參數(shù)來生成將要被編碼的圖像塊的預測圖像的預測圖像生成裝置,該量化步長編碼裝置用于通過使用由該預測圖像生成裝置使用的參數(shù)來預測量化步長,其中該量化步長編碼裝置通過使用被分配到已經(jīng)被編碼的相鄰圖像塊的量化步長來預測量化步長,該預測圖像生成裝置通過至少使用幀間預測來生成預測圖像,進一步包括用于通過使用被分配到已經(jīng)被編碼的相鄰圖像塊的運動矢量來預測用于幀間預測的運動矢量的預測運動矢量生成裝置,并且量化步長編碼裝置使用預測運動矢量的預測方向來預測量化步長。
(補充說明3)
一種視頻解碼設備,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,其包括用于解碼控制逆量化的粒度的量化步長的量化步長解碼裝置,以及用于通過使用在過去被解碼的圖像和預定的參數(shù)來生成將要被解碼的圖像塊的預測圖像的預測圖像生成裝置,該量化步長解碼裝置用于通過使用被分配到已經(jīng)被解碼的相鄰圖像塊的參數(shù)來預測量化步長,其中該量化步長解碼裝置通過使用被用于生成預測圖像的參數(shù)來預測量化步長,該預測圖像生成裝置通過至少使用幀間預測來生成預測圖像,并且該量化步長解碼裝置使用幀間預測的運動矢量來預測量化步長。
(補充說明4)
一種視頻解碼設備,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,其包括用于解碼控制逆量化的粒度的量化步長的量化步長解碼裝置,以及用于通過使用在過去被解碼的圖像和預定的參數(shù)來生成將要被解碼的圖像塊的預測圖像的預測圖像生成裝置,該量化步長解碼裝置用于通過使用被分配到已經(jīng)被解碼的相鄰圖像塊的量化步長來預測量化步長,其中量化步長解碼裝置使用被用于生成預測圖像的預測圖像來預測量化步長,預測圖像生成裝置至少使用幀間預測來生成預測圖像,進一步包括用于使用被分配到已經(jīng)被編碼的相鄰圖像塊的運動矢量來預測用于幀間預測的運動矢量的預測運動矢量生成裝置,并且量化步長解碼裝置使用預測運動矢量的預測方向來預測量化步長。
(補充說明5)
一種視頻編碼方法,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,其包括使用被分配到已經(jīng)被編碼的相鄰圖像塊的量化步長來預測控制量化的粒度的量化步長的步驟,以及通過使用在過去被編碼的圖像和預定的參數(shù)來生成將要被編碼的圖像塊的預測圖像的步驟,其中通過使用被用于生成預測圖像的參數(shù)來預測量化步長。
(補充說明6)
根據(jù)補充說明5所述的視頻編碼方法,其中在生成預測圖像的步驟中至少使用幀內(nèi)預測來生成預測圖像,并且?guī)瑑?nèi)預測的預測方向被用來預測量化步長。
(補充說明7)
根據(jù)補充說明5所述的視頻編碼方法,其中在生成預測圖像的步驟中至少使用幀間預測來生成預測圖像,并且?guī)g預測的運動矢量被用來預測量化步長。
(補充說明8)
根據(jù)補充說明5所述的視頻編碼方法,在生成預測圖像的步驟中至少使用幀間預測來生成預測圖像,包括使用被分配到已經(jīng)被編碼的相鄰圖像塊的運動矢量來預測用于幀間預測的運動矢量的步驟,并且預測運動矢量的預測方向被用來預測量化步長。
(補充說明9)
一種視頻編碼方法,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,其包括通過使用被分配到已經(jīng)被解碼的相鄰圖像塊的量化步長來預測控制逆量化的粒度的量化步長的步驟,以及至少使用幀間預測來生成預測圖像的步驟,其中幀間預測的運動矢量被用來預測量化步長。
(補充說明10)
一種視頻解碼方法,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,其包括通過使用被分配到已經(jīng)被解碼的相鄰圖像塊的量化步長來預測控制逆量化的粒度的量化步長的步驟,以及至少使用幀間預測來生成預測圖像的步驟,被分配到已經(jīng)被編碼的相鄰圖像塊的運動矢量被用來預測用于幀間預測的運動矢量,并且預測運動矢量的預測方向被用來預測量化步長。
(補充說明11)
一種用于視頻編碼設備的視頻編碼程序,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,使計算機使用被分配到已經(jīng)被編碼的相鄰圖像塊的量化步長,以便預測控制量化的粒度的量化步長。
(補充說明12)
根據(jù)補充說明11所述的視頻編碼程序,使計算機使用在過去被編碼的圖像和預定的參數(shù)以執(zhí)行生成將要被編碼的圖像塊的預測圖像的過程,以便使用被用于生成預測圖像的參數(shù)來預測量化步長。
(補充說明13)
根據(jù)補充說明12所述的視頻編碼程序,使計算機執(zhí)行至少使用幀內(nèi)預測來生成預測圖像的過程,以便使用幀內(nèi)預測的預測方向來預測量化步長。
(補充說明14)
根據(jù)補充說明12所述的視頻編碼程序,使計算機執(zhí)行至少使用幀間預測來生成預測圖像的過程,以便使用幀間預測的運動矢量來預測量化步長。
(補充說明15)
根據(jù)補充說明12所述的視頻編碼程序,使計算機執(zhí)行至少使用幀間預測來生成預測圖像的過程以及使用被分配到已經(jīng)被編碼的相鄰圖像塊的運動矢量來預測用于幀間預測的運動矢量的過程,以便使用預測運動矢量的預測方向來預測量化步長。
(補充說明16)
一種用于視頻解碼設備的視頻解碼程序,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,使計算機使用被分配到已經(jīng)被解碼的相鄰圖像塊的量化步長,以便預測控制逆量化的粒度的量化步長。
(補充說明17)
根據(jù)補充說明16所述的視頻解碼程序,使計算機執(zhí)行使用在過去被解碼的圖像和預定的參數(shù)來生成將要被解碼的圖像塊的預測圖像的過程,以便使用被用于生成預測圖像的參數(shù)來預測量化步長。
(補充說明18)
根據(jù)補充說明17所述的視頻解碼程序,使計算機執(zhí)行至少使用幀內(nèi)預測來生成預測圖像的過程,以便使用幀內(nèi)預測的預測方向來預測量化步長。
(補充說明19)
根據(jù)補充說明17所述的視頻解碼程序,使計算機執(zhí)行至少使用幀間預測來生成預測圖像的過程,以便使用幀間預測的運動矢量來預測量化步長。
(補充說明20)
根據(jù)補充說明17所述的視頻解碼程序,使計算機執(zhí)行至少使用幀間預測來生成預測圖像的過程,以及使用被分配到已經(jīng)被編碼的相鄰圖像塊的運動矢量來預測用于幀間預測的運動矢量的過程,以便使用預測運動矢量的預測方向來預測量化步長。
(補充說明21)
一種視頻編碼設備,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,其包括用于編碼控制量化的粒度的量化步長的量化步長編碼裝置;用于通過使用在過去被編碼的圖像和預定的參數(shù)來生成將要被編碼的圖像塊的預測圖像的預測圖像生成裝置,其中該量化步長編碼裝置使用由該預測圖像生成裝置使用的參數(shù)來預測量化步長;用于基于預定的參數(shù)來控制量化步長編碼裝置的操作的量化步長預測控制裝置;以及多路復用裝置,用于多路復用量化步長編碼裝置的操作參數(shù)到壓縮編碼過程的結(jié)果中。
(補充說明22)
根據(jù)補充說明21所述的視頻編碼設備,其中量化步長編碼裝置的操作參數(shù)至少包括標志,該標志表示是否使用由預測圖像生成裝置使用的參數(shù),并且量化步長預測控制裝置基于該標志控制量化步長編碼裝置的操作。
(補充說明23)
根據(jù)補充說明21所述的視頻編碼設備,其中量化步長編碼裝置的操作參數(shù)至少包括量化步長的調(diào)制參數(shù),并且量化步長編碼裝置使用該調(diào)制參數(shù)來調(diào)制基于由預測圖像生成裝置使用的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明24)
根據(jù)補充說明23所述的視頻編碼設備,其中量化步長編碼裝置將預定的偏移量加到基于由預測圖像生成裝置使用的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明25)
一種視頻解碼設備,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,其包括:用于解碼控制逆量化的粒度的量化步長的量化步長解碼裝置;用于使用在過去被解碼的圖像和預定的參數(shù)來生成將要被解碼的圖像塊的預測圖像的預測圖像生成裝置,其中該量化步長解碼裝置使用被分配到已經(jīng)被解碼的相鄰圖像塊的量化步長來預測量化步長;用于解多路復用包括量化步長解碼裝置的操作參數(shù)的比特流的解多路復用裝置;以及用于基于量化步長解碼裝置的解多路復用的操作參數(shù)來控制量化步長解碼裝置的操作的量化步長預測控制裝置。
(補充說明26)
根據(jù)補充說明25所述的視頻解碼設備,其中解多路復用裝置至少提取標志作為量化步長解碼裝置的操作參數(shù),該標志表示是否使用由預測圖像生成裝置使用的參數(shù),并且量化步長預測控制裝置基于該標志控制量化步長解碼裝置的操作。
(補充說明27)
根據(jù)補充說明25所述的視頻解碼設備,其中解多路復用裝置至少提取量化步長的調(diào)制參數(shù)作為量化步長解碼裝置的操作參數(shù),并且量化步長解碼裝置使用該調(diào)制參數(shù)來調(diào)制基于由預測圖像生成裝置使用的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明28)
根據(jù)補充說明27所述的視頻解碼設備,其中量化步長解碼裝置將預定的偏移量加到基于由預測圖像生成裝置使用的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明29)
一種視頻編碼方法,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,其包括:編碼控制量化的粒度的量化步長;使用在過去被編碼的圖像和預定的參數(shù)來生成將要被編碼的圖像塊的預測圖像;使用被用于生成預測圖像的參數(shù)來預測量化步長;以及多路復用用于編碼量化步長的操作參數(shù)到壓縮編碼過程的結(jié)果中。
(補充說明30)
根據(jù)補充說明29所述的視頻編碼方法,其中用于編碼量化步長的操作參數(shù)至少包括標志,該標志表示是否在生成預測圖像時使用該參數(shù),以便基于該標志控制用于編碼量化步長的操作。
(補充說明31)
根據(jù)補充說明29所述的視頻編碼方法,其中用于編碼量化步長的操作參數(shù)至少包括量化步長的調(diào)制參數(shù),并且在編碼量化步長時,該調(diào)制參數(shù)被用來調(diào)制基于用于生成預測圖像的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明32)
根據(jù)補充說明31所述的視頻編碼方法,其中預定的偏移量被加到基于用于生成預測圖像的參數(shù)所確定的量化步長,以預測量化步長。
(補充說明33)
一種視頻解碼方法,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,其包括:解碼控制逆量化的粒度的量化步長;使用在過去被解碼的圖像和預定的參數(shù)來生成將要被解碼的圖像塊的預測圖像;在解碼量化步長時,使用被分配到已經(jīng)被解碼的相鄰圖像塊的量化步長來預測量化步長;解多路復用包括用于解碼量化步長的操作參數(shù)的比特流,以及基于解多路復用的操作參數(shù)來控制用于解碼量化步長的操作。
(補充說明34)
根據(jù)補充說明33所述的視頻解碼方法,其中至少提取標志作為用于解碼量化步長的操作參數(shù),該標志表示是否使用被用于生成將要被解碼的圖像塊的預測圖像的參數(shù),并且基于該標志控制用于解碼量化步長的操作。
(補充說明35)
根據(jù)補充說明33所述的視頻解碼方法,其中至少提取量化步長的調(diào)制參數(shù)作為用于解碼量化步長的操作參數(shù),并且使用該調(diào)制參數(shù)來調(diào)制基于用于生成將要被解碼的圖像塊的預測圖像的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明36)
根據(jù)補充說明35所述的視頻解碼方法,其中在解碼量化步長時,將預定的偏移量加到基于用于生成將要被解碼的圖像塊的預測圖像的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明37)
一種視頻編碼程序,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,使計算機執(zhí)行:編碼控制量化的粒度的量化步長的過程;使用在過去被編碼的圖像和預定的參數(shù)來生成將要被編碼的圖像塊的預測圖像的過程;使用被用于生成預測圖像的參數(shù)來預測量化步長的過程;以及多路復用用于編碼量化步長的操作參數(shù)到壓縮編碼過程的結(jié)果中。
(補充說明38)
根據(jù)補充說明37所述的視頻編碼程序,其中用于編碼量化步長的操作參數(shù)至少包括標志,該標志表示是否在生成預測圖像時使用該參數(shù),并且使計算機基于該標志控制用于編碼量化步長的操作。
(補充說明39)
根據(jù)補充說明37所述的視頻編碼程序,其中用于編碼量化步長的操作參數(shù)至少包括量化步長的調(diào)制參數(shù),并且在編碼量化步長時,使計算機使用該調(diào)制參數(shù)調(diào)制基于用于生成預測圖像的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明40)
根據(jù)補充說明39所述的視頻編碼程序,其中使計算機將預定的偏移量加到基于用于生成預測圖像的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明41)
一種視頻解碼程序,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,使計算機執(zhí)行:解碼控制逆量化的粒度的量化步長的過程;使用在過去被解碼的圖像和預定的參數(shù)來生成將要被解碼的圖像塊的預測圖像的過程;在解碼量化步長時,使用被分配到已經(jīng)被解碼的相鄰圖像塊的量化步長來預測量化步長的過程;解多路復用包括用于解碼量化步長的操作參數(shù)的比特流的過程,以及基于解多路復用的操作參數(shù)來控制用于解碼量化步長的操作的過程。
(補充說明42)
根據(jù)補充說明41所述的視頻解碼程序,使計算機進一步執(zhí)行:至少提取標志作為用于解碼量化步長的操作參數(shù)的過程,該標志表示是否使用被用于生成將要被解碼的圖像塊的預測圖像的參數(shù);以及基于該標志控制用于解碼量化步長的操作的過程。
(補充說明43)
根據(jù)補充說明41所述的視頻解碼程序,使計算機進一步執(zhí)行:至少提取量化步長的調(diào)制參數(shù)作為用于解碼量化步長的操作參數(shù)的過程;以及使用該調(diào)制參數(shù)來調(diào)制基于用于生成將要被解碼的圖像塊的預測圖像的參數(shù)所確定的量化步長以便預測量化步長的過程。
(補充說明44)
根據(jù)補充說明43所述的視頻解碼程序,其中在解碼量化步長時,使計算機將預定的偏移量加到基于用于生成將要被解碼的圖像塊的預測圖像的參數(shù)所確定的量化步長,以便預測量化步長。
(補充說明45)
一種視頻編碼設備,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,其包括用于編碼控制量化的粒度的量化步長的量化步長編碼裝置,其中量化步長編碼裝置通過使用被分配到已經(jīng)被編碼的多個相鄰圖像塊的量化步長的平均值來預測控制量化的粒度的量化步長。
(補充說明46)
一種視頻解碼設備,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,其包括:用于解碼控制逆量化的粒度的量化步長的量化步長解碼裝置,其中量化步長解碼裝置通過使用被分配到已經(jīng)被編碼的多個相鄰圖像塊的量化步長的平均值來預測控制逆量化的粒度的量化步長。
(補充說明47)
一種視頻編碼方法,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,其包括使用被分配到已經(jīng)被編碼的多個相鄰圖像塊的量化步長的平均值來預測控制量化的粒度的量化步長。
(補充說明48)
一種視頻解碼方法,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,其包括使用被分配到已經(jīng)被編碼的多個相鄰圖像塊的量化步長的平均值來預測控制逆量化的粒度的量化步長。
(補充說明49)
一種視頻編碼程序,用于將輸入圖像數(shù)據(jù)劃分成預定大小的塊,并且將量化應用于每個劃分的圖像塊以執(zhí)行壓縮編碼過程,使計算機執(zhí)行:編碼控制量化的粒度的量化步長的過程;以及使用被分配到已經(jīng)被編碼的多個相鄰圖像塊的量化步長的平均值來預測控制量化的粒度的量化步長的過程。
(補充說明50)
一種視頻解碼程序,用于使用輸入壓縮視頻數(shù)據(jù)的逆量化來解碼圖像塊以執(zhí)行將圖像數(shù)據(jù)生成為圖像塊的集合的過程,使計算機執(zhí)行:解碼控制逆量化的粒度的量化步長的過程;以及使用被分配到已經(jīng)被解碼的多個相鄰圖像塊的量化步長的平均值來預測控制逆量化的粒度的量化步長的過程。
雖然已經(jīng)參考示例性實施例和示例描述了本發(fā)明,但是本發(fā)明不限于前述示例性實施例和示例。可以對本發(fā)明的結(jié)構(gòu)和細節(jié)在本發(fā)明的范圍內(nèi)做出對于本領域技術(shù)人員而言可以理解的各種改變。
本申請要求基于在2011年3月9日提交的日本專利申請第2011-51291號和在2011年4月21日提交的日本專利申請第2011-95395號的優(yōu)先權(quán),其公開內(nèi)容整體并入本文。
參考標記列表
10量化步長編碼單元
11步長預測單元
20預測圖像生成單元
30預測運動矢量生成單元
50量化步長解碼單元
51步長預測單元
60預測圖像生成單元
70預測運動矢量生成單元
101頻率變換器
102量化器
103可變長度編碼器
104量化控制器
105逆量化器
106逆頻率變換器
107幀存儲器
108幀內(nèi)預測器
109幀間預測器
110預測選擇器
111量化步長預測控制器
112多路復用器
201可變長度解碼器
202逆量化器
203逆頻率變換器
204幀存儲器
205幀內(nèi)預測器
206幀間預測器
207預測選擇器
208解多路復用器
209量化步長預測控制器
1001處理器
1002程序存儲器
1003存儲介質(zhì)
1004存儲介質(zhì)
10311量化步長緩沖器
10312熵編碼器
10313預測量化步長生成器
20111熵解碼器
20112量化步長緩沖器
20113預測量化步長生成器