專利名稱:編碼方法、解碼方法、編碼裝置及解碼裝置的制作方法
技術領域:
本發明涉及編碼方法、解碼方法、編碼裝置及解碼裝置,特別是,涉及用于高效地傳輸、存儲圖像的編碼方法、解碼方法、編碼裝置及解碼裝置。
背景技術:
迄今,圖像編碼的國際標準規格公知有(1)以運動圖像為對象的MPEG(運動圖像專家組)(例如,參見“影像媒體學會編的《MPEG》,歐姆(ォ一厶)公司,1996年4月”);(2)以靜止圖像為對象的JPEG 2000(例如,參見“ISO/IEC 15444-1 JPEG 2000 Part ICore coding system,2000-12-15”)。
MPEG是一種使用了動態補償與DCT(離散余弦變換)的方法,所述方法通過有效除去幀間相關與幀自相關,實現了高編碼效率。而JPEG2000是一種使用了小波變換與被稱為EBCOT(Embedded Block Codingwith Optimized Truncation利用優化截斷的嵌入式塊編碼)的嵌入式熵編碼的方法,所述方法沒有利用幀間相關,所以與MPEG相比其編碼效率差些,但具有MPEG所沒有的空間、SNR(信噪比)可伸縮性等各種有效功能。另外,還提出了也可以適用于運動圖象的Motion JPEG 2000,其具有與JPEG 2000相同的功能。
在JPEG 2000中使用的可伸縮性被稱為是嵌入式的,由于編碼器只進行一次編碼,因此不必根據各個分辨率來重新制作壓縮數據。所以,可以從單一的壓縮文件獲得各種分辨率、SNR的解碼圖像,并且,還可以減小文件容量,降低計算量。圖1示出了JPEG 2000的分辨率可伸縮功能。當原圖像的分辨率為K×L時,在解碼器中可復原分辨率為K/2n×L/2n的圖像。
在上述JPEG 2000中,雖然可復原分辨率比原圖像小的圖像,但所述分辨率僅限于原圖像的1/2n(n為正整數)。但是,通常存在解碼時所需的圖像分辨率不只限于原圖像分辨率的1/2n倍的問題。
發明內容
本發明是鑒于上述幾點完成的,其目的在于提供一種嵌入式編碼及解碼技術,使得能夠以更一般的分辨率來獲得解碼圖像。
上述目的可通過下述的編碼方法來達到,所述編碼方法用于進行原圖像的編碼,其包括分割步驟,將輸入的原圖像分割成M個(M為整數,并且,M>2)等頻帶;編碼步驟,對于將原圖像分割成等頻帶而得到的信號,使用嵌入式熵編碼方法對其進行編碼。
根據本發明,將原圖像分割成等頻帶,并使用嵌入式熵編碼方法來進行編碼,因此,在解碼端可獲得分辨率不限于原圖像分辨率1/2n倍的圖像。
另外,在所述編碼步驟中獲得的編碼數據包含分辨率等級的信息,所述分辨率等級是在被分割的多個頻帶中從低頻頻帶一側開始順序定義的。
此外,所述編碼數據也可以包含分別關于圖像的橫向與縱向的分辨率等級的信息。
此外,上述問題也可以通過下述的編碼方法來解決,所述編碼方法用于進行原圖像的編碼,其包括變換步驟,通過正交變換將輸入的原圖像變換為多個系數;編碼步驟,使用嵌入式熵編碼方法對所述多個系數進行編碼。
在所述編碼步驟中獲得的編碼數據包含分辨率等級的信息,所述分辨率等級是在與所述多個系數相對應的頻率成分中從低頻率成分一側開始順序定義的。
此外,上述問題也可以通過下述的解碼方法來解決,所述解碼方法用于以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,其包括解碼步驟,接收將原圖像分割成M個等頻帶來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻頻帶一側開始提取N個信號,并通過熵解碼方法對其進行解碼;頻帶合成步驟,合成被解碼的N個信號。
在上述方法中,還可以包括計算步驟,獲得原圖像的分辨率與給定的分辨率,并利用原圖像的分辨率與所述分割數M來算出適于所述給定的分辨率的所述N的值。
此外,上述問題也可以通過下述的解碼方法來解決,所述解碼方法用于以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,其包括解碼步驟,接收通過將原圖像分割成M個頻率成分的系數來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻率成分一側開始提取N個信號,并通過熵解碼方法對其進行解碼;合成步驟,合成被解碼的N個信號。
此外,根據本發明,可提供一種具有實現上述方法中各步驟的部件的裝置。另外,還可以提供一種可在計算機中實現上述方法中的各步驟的程序,以及存儲有所述程序的計算機可讀記錄介質。
如上所述,根據本發明,可以獲得具有原圖像分辨率1/2n倍以外的分辨率大小的解碼圖像。
圖1是JPEG 2000的分辨率可伸縮性的示意圖。
圖2是本發明一實施例中的可進行有理數倍變換的分辨率可伸縮功能示意圖。
圖3是本發明第一實施例中的可伸縮編碼器的基本結構圖。
圖4是用于說明第一實施例中的可伸縮編碼器的動作流程圖。
圖5是本發明第二實施例中的可伸縮解碼器的基本結構圖。
圖6是用于說明第二實施例中的可伸縮解碼器的動作的流程圖。
圖7是本發明第三實施例中的使用了濾波器組和EBCOT的編碼器的結構圖。
圖8是用于說明Mallat分割的圖。
圖9是用于說明本發明第三實施例中的使用了濾波器組的N/M倍分辨率變換的圖。
圖10是用于說明本發明第三實施例中的Mallat分割和等頻帶分割的圖。
圖11是本發明第三實施例的JPEG 2000中的空間分辨率等級示意圖。
圖12是RPCL數據結構示意圖。
圖13是本發明第三實施例中的空間分辨率等級示意圖。
圖14是本發明第三實施例中的實現空間分辨率可伸縮性的RPCL數據結構示意圖。
圖15是不等間隔地設定分辨率等級的例子的示意圖。
圖16是圖像的縱向變換比率與橫向變換比率不同情況的例子的示意圖。
圖17是本發明第四實施例中的使用了濾波器組和EBCOT的解碼器的結構圖。
圖18是本發明第四實施例中的分辨率等級與分辨率的關系示意圖。
圖19是不進行分辨率變換時的通常的等分割濾波器組的結構圖。
圖20是用于自動計算所需分辨率等級的流程圖。
圖21示出了在縱向與橫向的變換比率不同的情況下計算出的所需分辨率等級的例子。
圖22是本發明第五實施例中的編碼器結構圖。
圖23是用于說明第五實施例中的頻帶分割方法的圖。
圖24是第五實施例中的空間分辨率等級的定義方法示意圖。
圖25是本發明第六實施例中的解碼器結構圖。
圖26是用于說明第六實施例中解碼器的頻帶合成部分中的處理的圖。
圖27是用于說明用JPEG 2000進行了編碼時可解碼的分辨率的圖。
圖28是對本發明第七實施例中的HDTV圖像進行編碼時的可解碼的分辨率等級示意圖。
圖29是在仿真中使用的原圖像。
圖30是仿真中的復原圖像。
圖31是仿真中的復原圖像的代碼大小與PSNR特性的示意圖表。
發明的最佳實施方式下面,結合附圖對本發明的實施例進行說明。
首先,對本發明的分辨率可伸縮功能進行說明。
圖2示出了本發明一實施例中的分辨率可伸縮功能。該圖所示的編碼系統中,編碼部分對分辨率為K×L的圖像進行編碼,并生成單一的壓縮數據。在解碼部分中,通過提取該壓縮數據的一部分位流,可得到如所述圖2中所示的分辨率為原圖像的有理數倍、即N/M倍(M、N為整數,并且,1≤N≤M,M>2)的圖像。
另外,關于提取在獲得原圖像有理數倍的圖像時所需的一部分編碼代碼的地方,在本例子中是在解碼部分進行的,但是作為另一例子,也可以在編碼部分進行。所述另一例子的結構與JPEG 2000相同。此外,作為再一例子,也可以在通過傳送部件連接在編碼部分與解碼部分之間的中繼裝置進行所述一部分編碼代碼的提取。
(第一實施例)圖3示出了本發明第一實施例中的可伸縮編碼器的基本結構,所述編碼器用于生成能夠以任意有理數倍的空間分辨率進行解碼的壓縮數據。
在圖3中表示的可伸縮編碼器由等頻帶分割部分10、量化部分11以及嵌入式熵編碼部分12構成。下面參照圖4的流程圖,對所述可伸縮編碼器的動作進行說明。
在等頻帶分割部分10中,將輸入的原圖像分割成M個等頻帶(步驟1)。在分割中,使用了濾波器組(P.Vaidyanathan,“多速率信號處理與濾波器組(マルチレ一ト信號処理とフィルタバンク)”,科學技術出版社,2001年11月)或正交變換(小野文孝,渡邊裕,“國際標準圖像編碼的基礎技術(國際標準畫像符號化の基礎技術)”,可羅娜(コロナ)公司,1998年3月)等。另外,關于濾波器組與正交變換,例如,在“阿久津幸惠,小林弘幸,貴家仁志,“一種關于使用了正交變換、濾波器組以及小波變換的分辨率變換的評價方法(直交變換、フィルタバンクぉょびゥエ一ブレット變換を用いた解像度變換の一評価法)”,信學技報DSP93-26”中也有記載。
所分割的信號被量化部分11量化(步驟2),并在嵌入式熵編碼部分12中,通過EBCOT(ISO/IEC 15444-1 JPEG 2000 Part ICore codingsystem,2000-12-15)或EZBC(S.T.Hsiang and J.W.Woods,“Embeddedvideo coding using invertible motion compensated 3-D subband/wavelet filterbank”.Signal ProcessingImage communication,vol.16,May 2001,pp.705-724)等嵌入式熵編碼方法生成壓縮數據(步驟3)。
嵌入式熵編碼部分12是一種用于生成能夠在解碼器中進行可伸縮性解碼的編碼數據的熵編碼器。
另外,在第三實施例中詳細說明作為等頻帶分割部分10使用濾波器組時的編碼器,在第五實施例中詳細說明作為等頻帶分割部分10使用正交變換器時的編碼器。
(第二實施例)圖5示出了本發明第二實施例中的可伸縮解碼器的基本結構。第二實施例中的可伸縮解碼器是一種將在第一實施例的編碼器中生成的壓縮數據以任意有理數倍的空間分辨率來解碼的解碼器。
該圖所示的可伸縮解碼器由嵌入式熵解碼部分20、逆量化部分21以及頻帶合成部分22構成。下面參照圖6的流程圖,說明所述可伸縮解碼器的動作。
在嵌入式熵解碼部分20中,在輸入的壓縮數據中從低頻頻帶一側開始提取N/M個頻帶的數據(步驟4),并進行熵解碼(步驟5)。
在逆量化部分21中,對在嵌入式熵解碼部分解碼的信號進行逆量化(步驟6)。在頻帶合成部分22中,合成被逆量化部分21逆量化的信號并輸出圖像(步驟7)。
根據編碼器一側的圖像分割方法,可以使用濾波器組或者逆DCT變換(IDCT)等正交變換器,來作為頻帶合成部分22。在第四實施例中詳細說明使用濾波器組時的解碼器,在第六實施例中詳細說明使用正交變換器時的解碼器。
(第三實施例)在本實施例中說明作為等頻帶分割部分使用濾波器組,而作為嵌入式熵編碼方法使用EBCOT時的編碼器。
圖7示出了本發明第三實施例中的編碼器結構。
該圖所示的編碼器由使用等分割分析濾波器組的等頻帶分割部分30、量化部分31以及嵌入式熵編碼部分32~34構成。
在JPEG 2000中,頻帶分割使用的是小波變換。小波變換是通過如圖8所示的被稱為“Mallat分割”的分割法來進行頻帶分割的。在Mallat分割中,通過利用一維的二分頻濾波器向低頻方向依次分割,可將輸入信號分割成多個頻帶。如圖8上部分的圖(40)所示,通過進行D次分割,可以分割出具有原圖像1/2D大小的空間分辨率的圖像。在水平方向以及垂直方向上分別進行所述處理。在解碼端,如圖8下部分的圖(41)所示,從低頻開始順序解碼。通過U次解碼,可以復原具有原圖像2U/2D=1/2n倍大小的空間分辨率的圖像。
另一方面,在本發明中,作為頻帶分割部分使用了如圖9左側部分(50)所示的等分割分析濾波器組。在等分割分析濾波器組中,使用頻帶寬度相等的M個濾波器來將原圖像分割成M個等頻帶。通過將各個濾波器的輸出稀疏到1/M(下采樣)來獲得最終的輸出。另外,為進行比較,在圖10中示出了根據JPEG 2000的Mallat分割(60)和根據本發明的等頻帶分割(61)。
在圖7的量化部分31中,對等頻帶分割部分30的輸出信號進行量化。另外,通過使用熵編碼部分(EBCOT編碼處理部分)32~34,即使不進行量化也可以控制壓縮數據量,因此可以省略量化處理。
EBCOT是嵌入式熵編碼方法的一種。在利用EBCOT的熵編碼部分32~34中,首先,在系數位建模部分32中,將圖像按·編碼塊分割·位平面分割·各個位平面在子平面(3個過程)上的分解依次分割,并且在算術編碼部分33中以過程(pass)為最小單位進行算術編碼。經過算術編碼的數據能夠以過程為最小單位進行舍位(bit) (后量化)。僅以所述后處理就可進行編碼量的控制。并且,在編碼代碼封包部分34中,將通過算術編碼編碼的壓縮數據封包,作為編碼流發送。
空間分辨率或SNR可伸縮性等的分層編碼,可以在上述過程單位上加上某種程度的優先級,并通過控制解碼時的時間優先級來實現。優先級有如下四種·L層(SNR等級)·R空間分辨率等級·P位置·C顏色成分層是基于SNR的基準,在JPEG 2000中,可以將編碼后的數據從上位層向下位層進行分割。通過從上位層向下位層進行順序解碼,可以逐步提高圖像的品質。空間分辨率等級實現了空間分辨率的可伸縮性。如圖10所示,當實施兩級小波變換時,如圖11所示,空間分辨率等級(70)被分解為R0、R1、R2三個等級。將所述分辨率等級用作解碼時的優先順序之一。從而可進行從最低頻頻帶開始依次提高分辨率的控制。此外,在分別對RGB信號進行編碼時,將R、G、B分別以什么樣的順序進行解碼是有選擇余地的。另外,還可以優先進行圖像的空間位置(指定區域的圖像)的解碼。通過排列上述四個優先級,可以控制解碼時的順序,從而可以控制再現圖像的品質。在JPEG 2000中有如下四個模式1)LRCP2)RLCP3)PCRL4)CPRL可以通過2)RLCP的模式來實現可逐步解碼的空間分辨率可伸縮性。在圖12中示出了其數據結構。如圖12所示,實現空間分辨率可伸縮性的RPCL數據結構由分辨率(80)、位置(81)、顏色(82)以及層(83)構成。通過解碼R0的數據來獲得原圖像分辨率1/4大小的圖像,通過解碼至R1的數據可獲得原圖像分辨率1/2大小的圖像,通過解碼至R2的數據可獲得與原圖像分辨率相等的圖像。
在本發明中,為了能夠以原圖像N/M倍的分辨率進行解碼,如圖13所示設定分辨率等級(90)。此時,數據結構如圖14所示,設定分辨率(101)、位置(102)、顏色(103)以及層(104)。在解碼器中,通過順序解碼至R0、R1、R2、R3,可以順序解碼原圖像的1/4、2/4、3/4以及與原圖像相等大小的圖像。由此,可獲得相對于原圖像大小為3/4大小的圖像,而這在JPEG 2000中是不可能的。
另外,分辨率等級也可以如圖15所示不等間隔地設定。此時,在解碼端可順序解碼出相當于原圖像的1/4、3/4以及與原圖像相等大小的圖像。
此外,還可以改變圖像的縱向變換比率與橫向變換比率。此時,在編碼器的頻帶分割部分分別設定縱向與橫向的分割數,并與之相對應地確定分辨率等級。
在圖16中示出了縱向分割數為3、橫向分割數為4時的例子。首先,通過等頻帶分割部分30將圖像在縱向及橫向上分別三等分及四等分。然后,對于分割的各個頻帶,如圖16所示設定分辨率等級。此時,在解碼端,例如如果只提取R00,則可以解碼出縱向為1/3倍、橫向為1/4倍的圖像。此外,通過提取R00、R01、R02、R10、R11、R12,可以解碼出縱向為2/3倍、橫向為3/4倍的變換比率不相同的圖像。
如上所述,分辨率等級存在各種模式,例如,如圖13所示的等間隔的情況、如圖15所示的不等間隔的情況、或者如圖16所示的縱向與橫向不相同的情況等。無論在哪一種情況下,為了能夠通過解碼器來進行解碼,在如圖14等中示出的RLCP數據結構的報頭中都記載了與分辨率等級有關的信息。
在報頭中記載的與分辨率等級有關的信息條目如下所示(1)XY1或者0(2)分割等級M(3)分辨率等級數LR(4)分辨率等級i中所包含的子帶數Number_R(i) (i=0,1,…,LR-1)(1)的信息條目是用于判斷縱向(X)與橫向(Y)的分辨率等級是否相同的標記。不同時為1,相同時為0。(2)的信息條目是頻帶分割等級的數目。(3)的信息條目是分辨率等級的數目。(4)的信息條目只在M≠LR時添加,表示分辨率等級R(i)中包含的頻帶數目。
當縱向與橫向的分辨率等級不同時,分別針對縱向與橫向,以縱向→橫向的順序記載上述(2)、(3)、(4)的信息。
例如,當分辨率等級分別為圖13、圖15、圖16(右側)時,上述報頭信息如下。
圖13的情況(1)XY=0(2)M=4(3)LR=4圖15的情況(1)XY=0(2)M=4(3)LR=3(4)Number_R(0)=1,Number_R(1)=2,Number_R(2)=1圖16的情況(1)XY=1(2)M=3(3)LR=3(4)M=4(5)LR=4(第四實施例)在本實施例中,說明作為頻帶合成部分使用了濾波器組、而作為嵌入式熵編碼使用了EBCOT的解碼器。
圖17示出了本發明第四實施例中的解碼器的結構。該解碼器對在所述第三實施例中編碼的壓縮數據進行解碼,并輸出解碼圖像。
該圖所示的解碼器由嵌入式熵編碼EBCOT的解碼部分(EBCOT解碼處理器)110~112、逆量化部分113以及基于等分割合成濾波器組的頻帶合成部分114構成。
解碼部分具有編碼代碼提取部分110、算術解碼部分111以及系數位建模解碼部分112。
在編碼代碼提取部分110中,只提取解碼中所需量的在編碼中被賦與優先級的數據。圖18示出了解碼圖像的分辨率與分辨率等級之間的關系(120)。為獲得原圖像1/4大小的圖像,只提取R0分辨率等級的數據,為獲得原圖像2/4大小的圖像,提取R0、R1分辨率等級的數據,為獲得原圖像3/4大小的圖像,提取R0、R1、R2分辨率等級的數據,而為了獲得與原圖像大小相同的圖像,提取R0、R1、R2、R3所有分辨率等級的數據。所提取的壓縮數據在算術解碼部分111中被算術解碼,在系數位建模解碼部分112中被系數位建模解碼,在逆量化部分113中被逆量化之后,被輸入到頻帶合成部分114中。
通常,當不進行分辨率變換時,在頻帶合成部分114中,如圖19所示,通過與頻帶分割部分相等數目的濾波器組來復原圖像。被上采樣為M倍的信號通過分別具有2π/M的頻帶寬度的各合成濾波器并被相加,從而獲得輸出。此時,輸出圖像的空間分辨率與原圖像的空間分辨率相等。
為了獲得原圖像N/M倍的分辨率的圖像,使合成濾波器組具有如圖9的右圖(51)所示的結構。即,通過使用N分割合成濾波器來實現N/M倍的分辨率變換。被上采樣為N倍的信號通過分別具有2π/N的頻帶寬度的各合成濾波器并被相加,從而獲得輸出。此時,成為具有原圖像分辨率N/M倍的空間分辨率的圖像。
另外,在圖17的編碼代碼提取部分110中,當只提取壓縮數據的必要部分時,關于提取哪一分辨率等級的數據,可以在解碼器中明確指定,也可以由解碼器從解碼端的顯示裝置分辨率自動計算出來。下面,說明自動計算方法。
計算必要的分辨率等級時,需要報頭中的(1)~(4)的信息和原圖像的分辨率(K(縱向)×L(橫向)),但通過將原圖像的分辨率與(1)~(4)的信息一起記載在報頭中,可以從報頭中獲得上述全部信息。另外,也可以在利用編碼器、解碼器的應用中進行上述信息的收發,來代替使用報頭。
這里,作為最一般的例子示出了如圖13所示的計算方法,其中,縱向與橫向的分割數相等,并等間隔地設定了分辨率等級。另外,假設原圖像與解碼圖像的縱橫比(圖像的縱向與橫向的分辨率比率)相同。此外,將在解碼端設置的顯示裝置的分辨率設為X(縱向)×Y(橫向)。
此時所需的分辨率等級可通過如圖20的流程圖中的步驟來計算。
首先,在步驟11中,算出對應于一個分辨率等級的分辨率的大小。接著,在步驟12中,比較解碼圖像的分辨率和在步驟11中算出的對應于一個分辨率等級的分辨率的大小,如果解碼圖像的分辨率小于對應于一個分辨率等級的分辨率的大小,則所需分辨率等級為R0,并結束處理。當解碼圖像的分辨率大于對應于一個分辨率等級的分辨率的大小時,進入步驟13。
在步驟13中,算出所需的最大分辨率等級的下標(index)maxR。另外,round()為舍位運算符。然后,在步驟14中,確定所需的分辨率等級=R0、R1、…、RmaxR,結束處理。
另外,如圖16所示,當縱向與橫向的變換比率不相同時,步驟11~步驟13的處理分別在縱向及橫向上獨立進行。此時,對于縱向及橫向,若將所需的最大分辨率等級的下標分別定義為maxRX及maxRY,則所需的分辨率等級如圖21所示。
另外,當不是在解碼器而是在編碼器一側提取壓縮數據時,由編碼器一側獲得解碼器一側的顯示裝置畫面的分辨率,并計算出應提取的分辨率等級。
(第五實施例)在本實施例中,說明作為圖像分割方法使用了DCT時的編碼器。圖22示出了本實施例的編碼器結構。
所述圖22所示的編碼器具有基于DCT的頻帶分割部分150、量化部分151以及嵌入式熵編碼部分(152~154)。
參照圖23,說明本實施例的頻帶分割部分150中的頻帶分割方法。在基于DCT的頻帶分割中,將原圖像分割成M×M大小的小塊,并以小塊為單位進行DCT變換。在量化部分151中,對DCT系數進行量化。另外,與第三實施例相同,編碼方法使用EBCOT,由此,即使不進行量化也可以進行壓縮數據量的控制,因而可省略量化。嵌入式熵編碼部分中的處理與在第三實施例中說明的處理基本相同。
當根據DCT變換進行了頻帶分割時,如圖24所示來定義空間分辨率等級。以每一小塊(M×M次的DCT變換)為單位,分別進行分辨率等級的設定,并從低頻DCT系數向高頻DCT系數設定為R0、R1、…、RM-1。
(第六實施例)在本實施例中說明解碼器,所述解碼器對通過第五實施例所示的編碼器來編碼的壓縮數據進行解碼。圖25示出了其結構。
圖25所示的解碼器具有EBCOT解碼處理部分160~162、逆量化部分163、基于IDCT(逆DCT變換)的頻帶合成部分164以及亮度調節部分165。
在EBCOT解碼處理部分的編碼代碼提取部分160中,與第四實施例相同,只提取解碼所需量的壓縮數據,其中所述壓縮數據是在編碼中被賦與優先級的數據。所提取的壓縮數據經過算術解碼、系數位建模解碼以及逆量化之后,被輸入到頻帶合成部分(IDCT)164中。
在不伴隨分辨率變換的通常的DCT變換→IDCT變換中,將編碼與解碼的次數設定為相等。即,使得M×M的DCT變換的逆變換為M×M的IDCT變換。
另一方面,在本發明中,為了獲得原圖像N/M倍的分辨率的圖像,如圖26所示,對于低頻一側的N×N個DCT系數,進行N×N次的IDCT變換。此外,舍棄N×N個以外的系數。并且對每一小塊進行所述處理。最后在亮度調節部分165進行亮度調節,輸出具有原圖像N/M倍的空間分辨率的圖像。
另外,在第一~第六實施例中說明的處理,既可以通過由邏輯電路構成的硬件來實現,也可以通過程序來實現。當用程序實現時,對各實施例中所說明的處理內容進行編程,并將所述程序安裝到具有CPU、存儲器、硬盤、通信裝置等的計算機中運行即可。此外,也可以將所述程序記錄、分配在CD-ROM、存儲器等記錄介質中。
(第七實施例)在本實施例中,說明本發明的適用例子。作為一個例子,對通過本發明的方法將1920×1080像素的HDTV圖像編碼時的其可解碼的分辨率進行說明。為了進行比較,在圖27中示出了以JPEG 2000進行編碼時的例子。如果將分割等級數設為3,則由于可解碼的分辨率在縱向和橫向分別是原圖像的1/2n(n=1,2,3),所以,可解碼的分辨率為·240×135·480×270·960×540·1902×1080因此,無法解碼廣泛通用的SDTV圖像。
另一方面,在圖28中示出了通過本發明對1920×1080的HDTV圖像進行編碼時的其可解碼的分辨率。為了使可解碼的最小分辨率成為與上述JPEG 2000基本相同的分辨率,設定橫向的分割數為8級,縱向的分割數為9級。此時,可解碼的最小分辨率為240×120像素,并且,一般可解碼240m×120n(其中,n、m為正整數,n=1,2,…,8;m=1,2,…,9)像素的圖像。此時,可從單一的壓縮文件中容易地解碼出廣泛通用的下述的圖像,即·720×360(SDTV,上下填充黑色)·960×480(SDTV,切除左右)·1440×720(720p,720i)·1920×1080(HDTV)。
下面,示出使用本發明方法的仿真結果。在仿真中,將圖29所示的原圖像(SIDBA標準圖像)通過本發明的編碼方法來編碼,并通過本發明的解碼方法以各種分辨率解碼。在圖30中示出了解碼圖像。仿真中的編碼參數如下分析濾波器組的頻帶分割數4×4;合成濾波器組的頻帶分割數1×1、2×2、3×3;片數1;層數1;編碼塊的大小64×64。編碼器中的壓縮比率為1/5,壓縮后的代碼大小為12705字節。
此外,在圖31中示出了仿真中的解碼圖像的代碼大小和PSNR(峰值信噪比)特性,其中所述PSNR特性是與各分辨率對應的對比圖像比較而得的。這里,對比圖像是通過進行理想的圖像分辨率變換而獲得的圖像。另外,括號內的值是按每個像素換算的位數bpp(每個像素的位數),是將在解碼各分辨率圖像中所需的位數以各分辨率分割所得的值。如圖31所示,獲得了良好的PSNR特性,并可知通過本發明的方法所得的解碼圖像惡化很小。
如上所述,根據本發明,可進行高效的圖像編碼,從而能夠用較小的存儲盤容量進行保存。由于具有空間分辨率可伸縮性,因此能夠以與圖像顯示設備的性能或用途相對應的空間分辨率來解碼圖像。若從低頻帶解碼到任意頻帶,則可再現空間分辨率比原圖像低的圖像,若對所有數據進行解碼,則可再現與原圖像相同分辨率的圖像。此外,根據圖像顯示設備的性能或用途,當再現空間分辨率比原圖像低的圖像時,只需進行直至必要頻帶的相對應編碼數據的解碼。此時,和再現與原圖像相同分辨率的圖像并進行分辨率變換的情況相比,其處理時間更短,并且,由于在傳輸編碼位流時只要傳輸必要的數據即可,因此傳輸率也小。此外,能夠獲得具有原圖像分辨率1/2n倍以外的分辨率大小的圖像。
另外,本發明并不限于上述實施例,可以在權利要求的范圍內進行各種變更、應用。
權利要求
1.一種編碼方法,用于進行原圖像的編碼,其特征在于,包括分割步驟,將輸入的原圖像分割成M個(M為整數,并且,M>2)等頻帶;和編碼步驟,對于將原圖像分割成等頻帶而獲得的信號,使用嵌入式熵編碼方法對其進行編碼。
2.如權利要求1所述的編碼方法,其中,還包括量化步驟,所述量化步驟將通過所述分割步驟而獲得的信號量化,在所述編碼步驟中對通過所述量化步驟而獲得的信號進行編碼。
3.如權利要求1所述的編碼方法,其中,在所述分割步驟中使用等分割濾波器組,在所述編碼步驟中使用在靜止圖像國際標準JPEG 2000中所使用的利用優化截斷的嵌入式塊編碼。
4.如權利要求1所述的編碼方法,其中,在所述編碼步驟中獲得的編碼數據包含分辨率等級的信息,所述分辨率等級是在被分割的多個頻帶中從低頻頻帶一側開始順序定義的。
5.如權利要求4所述的編碼方法,其中,所述編碼數據包含分別關于圖像的縱向與橫向的分辨率等級的信息。
6.一種編碼方法,用于進行原圖像的編碼,其特征在于,包括變換步驟,通過正交變換將輸入的原圖像變換成多個系數;和編碼步驟,使用嵌入式熵編碼方法對所述多個系數進行編碼。
7.如權利要求6所述的編碼方法,其中,在所述編碼步驟中獲得的編碼數據包含分辨率等級的信息,所述分辨率等級是在與所述多個系數相對應的頻率成分中從低頻率成分一側開始順序定義的。
8.一種解碼方法,用于以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,其特征在于,包括解碼步驟,接收將原圖像分割成M個等頻帶來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻頻帶一側開始提取N個信號,并通過熵解碼方法對其進行解碼;和頻帶合成步驟,合成被解碼的N個信號。
9.如權利要求8所述的解碼方法,其中,還包括逆量化步驟,所述逆量化步驟將通過所述解碼步驟而獲得的信號逆量化,在所述頻帶合成步驟中合成通過所述逆量化步驟而獲得的信號。
10.如權利要求8所述的解碼方法,其中,所述解碼步驟中的熵解碼方法使用在靜止圖像國際標準JPEG 2000中所使用的利用優化截斷的嵌入式塊編碼,在所述頻帶合成步驟中使用等分割濾波器組。
11.如權利要求8所述的解碼方法,其中,還包括計算步驟,所述計算步驟獲得原圖像的分辨率與給定的分辨率,并利用原圖像的分辨率與所述分割數M來算出適于所述給定的分辨率的所述N的值。
12.一種解碼方法,用于以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,其特征在于,包括解碼步驟,接收將原圖像分割成M個頻率成分的系數來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻率成分一側開始提取N個信號,并通過熵解碼方法對其進行解碼;和合成步驟,合成被解碼的N個信號。
13.一種編碼裝置,用于進行原圖像的編碼,其特征在于,包括分割部件,將輸入的原圖像分割成M個(M為整數,并且,M>2)等頻帶;和編碼部件,對于將原圖像分割成等頻帶而獲得的信號,使用嵌入式熵編碼方法對其進行編碼。
14.如權利要求13所述的編碼裝置,其中,還包括量化部件,所述量化部件將通過所述分割部件而獲得的信號量化,在所述編碼部件中對通過所述量化部件而獲得的信號進行編碼。
15.如權利要求13所述的編碼裝置,其中,在所述分割部件中使用等分割濾波器組,在所述編碼部件中使用在靜止圖像國際標準JPEG 2000中所使用的利用優化截斷的嵌入式塊編碼。
16.如權利要求13所述的編碼裝置,其中,在所述編碼部件中獲得的編碼數據包含分辨率等級的信息,所述分辨率等級是在被分割的多個頻帶中從低頻頻帶一側開始順序定義的。
17.如權利要求16所述的編碼裝置,其中,所述編碼數據包含分別關于圖像的縱向與橫向的分辨率等級的信息。
18.一種編碼裝置,用于進行原圖像的編碼,其特征在于,包括變換部件,通過正交變換將輸入的原圖像變換成多個系數;和編碼部件,利用嵌入式熵編碼方法對所述多個系數進行編碼。
19.如權利要求18所述的編碼裝置,其中,在所述編碼部件中獲得的編碼數據包含分辨率等級的信息,所述分辨率等級是在與所述多個系數相對應的頻率成分中從低頻率成分一側開始順序定義的。
20.一種解碼裝置,用于以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,其特征在于,包括解碼部件,接收將原圖像分割成M個等頻帶來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻頻帶一側開始提取N個信號,并通過熵解碼方法對其進行解碼;和頻帶合成部件,合成被解碼的N個信號。
21.如權利要求20所述的解碼裝置,其中,還包括逆量化部件,所述逆量化部件將通過所述解碼部件而獲得的信號逆量化,在所述頻帶合成部件中合成通過所述逆量化部件而獲得的信號。
22.如權利要求20所述的解碼裝置,其中,所述解碼部件中的熵解碼方法使用在靜止圖像國際標準JPEG 2000中所使用的利用優化截斷的嵌入式塊編碼,在所述頻帶合成部件中使用等分割濾波器組。
23.如權利要求20所述的解碼裝置,其中,還包括計算部件,所述計算部件獲得原圖像的分辨率與給定的分辨率,并利用原圖像的分辨率與所述分割數M來算出適于所述給定的分辨率的所述N的值。
24.一種解碼裝置,用于以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,其特征在于,包括解碼部件,接收將原圖像分割成M個頻率成分的系數來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻率成分一側開始提取N個信號,并通過熵解碼方法對其進行解碼;和合成部件,合成被解碼的N個信號。
25.一種程序,用于使計算機進行原圖像的編碼處理,所述程序使計算機進行分割過程,將輸入的原圖像分割成M個(M為整數,并且,M>2)等頻帶;和編碼過程,對于將原圖像分割成等頻帶而獲得的信號,利用嵌入式熵編碼方法對其進行編碼。
26.如權利要求25所述的程序,其中,還包括量化過程,所述量化過程將通過所述分割過程而獲得的信號量化,在所述編碼過程中對通過所述量化過程而獲得的信號進行編碼。
27.一種程序,用于使計算機進行對原圖像的編碼處理,所述程序使計算機進行變換過程,通過正交變換將輸入的原圖像變換成多個系數;和編碼過程,利用嵌入式熵編碼方法對所述多個系數進行編碼。
28.一種程序,用于使計算機進行解碼處理,所述解碼處理以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,所述程序使計算機進行解碼過程,接收將原圖像分割成M個等頻帶來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻頻帶一側開始提取N個信號,并通過熵解碼方法對其進行解碼;和頻帶合成過程,合成被解碼的N個信號。
29.如權利要求28所述的程序,其中,還包括逆量化過程,所述逆量化過程對通過所述解碼過程而獲得的信號進行逆量化,在所述頻帶合成過程中合成通過所述逆量化過程而獲得的信號。
30.一種程序,用于使計算機進行解碼處理,所述解碼處理以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,所述程序使計算機進行解碼過程,接收將原圖像分割成M個頻率成分的系數來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻率成分一側開始提取N個信號,并通過熵解碼方法對其進行解碼;和合成過程,合成被解碼的N個信號。
31.一種記錄了用于使計算機進行原圖像的編碼處理的程序的計算機可讀記錄介質,其中,所述計算機可讀記錄介質記錄有使計算機進行如下過程的程序分割過程,將輸入的原圖像分割成M個(M為整數,并且,M>2)等頻帶;和編碼過程,對于將原圖像分割成等頻帶而獲得的信號,使用嵌入式熵編碼方法對其進行編碼。
32.如權利要求31所述的記錄了程序的計算機可讀記錄介質,其中,所述程序還包括量化過程,所述量化過程將通過所述分割過程而獲得的信號量化,并且,在所述編碼過程中對通過所述量化過程而獲得的信號進行編碼。
33.一種記錄了用于使計算機進行原圖像的編碼處理的程序的計算機可讀記錄介質,其中,所述計算機可讀記錄介質記錄有使計算機進行如下過程的程序變換過程,通過正交變換將輸入的原圖像變換成多個系數;和編碼過程,使用嵌入式熵編碼方法對所述多個系數進行編碼。
34.一種記錄了用于使計算機進行解碼處理的程序的計算機可讀記錄介質,所述解碼處理以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,其中,所述計算機可讀記錄介質記錄有使計算機進行如下過程的程序解碼過程,接收將原圖像分割成M個等頻帶來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻頻帶一側開始提取N個信號,并通過熵解碼方法對其進行解碼;和頻帶合成過程,合成被解碼的N個信號。
35.如權利要求34所述的記錄了程序的計算機可讀記錄介質,其中所述程序還包括逆量化過程,所述逆量化過程將通過所述解碼過程而獲得的信號逆量化,并且,在所述頻帶合成過程中合成通過所述逆量化過程而獲得的信號。
36.一種記錄了用于使計算機進行解碼處理的程序的計算機可讀記錄介質,所述解碼處理以原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率對編碼數據進行解碼,其中,所述計算機可讀記錄介質記錄有使計算機進行如下過程的程序解碼過程,接收將原圖像分割成M個頻率成分的系數來編碼的編碼數據,在所述編碼數據中,從分割的多個信號中的低頻頻帶一側開始提取N個信號,并通過熵解碼方法對其進行解碼;和合成過程,合成被解碼的N個信號。
全文摘要
編碼裝置將原圖像分割成M個(M為整數,并且,M>2)等頻帶,并利用嵌入式熵編碼方法對分割的信號進行編碼。解碼裝置接收通過所述編碼裝置編碼的編碼數據,并在所述編碼數據中,從分割的多個信號中的低頻頻帶一側開始提取N個信號,通過熵解碼方法對其進行解碼,合成被解碼的N個信號,獲得原圖像N/M倍(M、N為整數,并且,1≤N≤M,M>2)的分辨率的圖像。
文檔編號H04N7/46GK1698386SQ200480000219
公開日2005年11月16日 申請日期2004年1月13日 優先權日2003年1月14日
發明者仲地孝之, 澤邊知子, 藤井哲郎 申請人:日本電信電話株式會社