專利名稱:用于對視頻目標平面的目標信息進行編碼的方法及裝置的制作方法
技術領域:
本發明涉及一種用于對視頻目標平面的目標信息進行編碼的方法及裝置;且更具體地,涉及一種用于以提高的編碼效率對視頻目標平面的目標信息進行編碼的方法及裝置。
在例如電視電話、電話會議及高清晰度電視系統的數字電視系統中,由于視頻幀信號中的視頻行信號包括一序列稱之為象素值的數字數據,需要大量的數字數據來定義各視頻幀信號。然而,由于常規傳輸信道的可用頻帶寬是有限的,為了通過其發送大量的數字數據,不可避免地要通過使用各種數據壓縮技術來壓縮或減少數據量,特別是在例如電視電話及電話會議系統的低比特率視頻信號編碼器的情況下。
用于低比特率編碼系統的視頻信號編碼技術之一為所謂的面對目標的分析-合成編碼技術(見,例如MPEG-4視頻驗證模型版本7.0,國際標準化組織,運動圖象及相關音頻信息的編碼,ISO/IEC JTC1/SC29/WG11 MPEG97/N1642,布里斯托爾,1997年4月)。根據該面對目標的分析-合成編碼技術,一輸入視頻圖象被劃分成若干個目標,即若干個視頻目標平面(VOP),其中這些VOP對應于使用者可訪問及操縱的一比特流中的實體;并且通過不同的編碼信道對用于定義各目標的運動、形狀及紋理信息的三組參數進行處理。
一個VOP可被稱之為一個目標并由環繞各目標的其寬度和高度可為16象素(一宏塊尺寸)的最小倍數的一劃界矩形表示,以使編碼器可在逐VOP的基礎上,即逐目標的基礎上處理輸入視頻圖象。一個VOP包括表示該VOP的亮度和色度的紋理信息及表示該目標的形狀和位置的形狀信息。
在紋理信息中,一象素由例如1到255范圍中的一值表示;而在形狀信息中,一二進制值,例如O被用于指示位于該VOP中該目標外部的一象素,即一背景象素及另一二進制值,例如255被用于指示位于該目標內部的一象素,即一目標象素。
參見
圖1,說明一用于對-VOP的紋理信息進行編碼的常規的編碼裝置100。在轉換器105,該VOP的形狀信息的目標象素值被從255變至1,從而將一轉換后的形狀信息提供給一乘法器110和一塊選擇單元125,其中該轉換后的形狀信息包括具有1的目標象素和具有零值的背景象素。在乘法器110,該VOP的紋理信息被乘以該轉換后的形狀信息,從而產生轉換后的紋理信息給一填充單元120。在該轉換后的紋理信息中,這些目標象素保持它們的原始值而位于該目標外部的象素具有零值。該填充單元120通過使用一常規的重復填充技術對該轉換后的紋理信息中的背景象素執行填充處理以提高數據壓縮效率,其中在該重復填充技術中,這些背景象素通過根據該目標的邊界象素值所獲得的新值而被填充。
參見圖2,說明一由被填充的紋理信息所表示的示例性VOP10,其中該VOP10包括由劃了陰影線部分表示的一目標15和由未劃陰影線部分表示的一背景20。塊選擇單元25響應于該轉換后的形狀信息及填充后的紋理信息,檢測VOP10中的目標15和背景20;并將該VOP10劃分成多個例如8×8象素的DCT(離散余弦變換)塊,例如塊1至12。然后,塊選擇單元125選擇覆蓋目標15的DCT塊并將它們作為處理塊提供給-DCT單元130。在圖2所示的例子中,該DCT塊1沒有覆蓋目標15;且因此,DCT塊2-12被選擇作為處理塊。在DCT單元130,各處理塊被轉換成一組DCT系數并且該組DCT系數然后被提供給一量化單元140。在量化單元140,該組DCT系數被量化并被傳送給一發射機(未示出)進行發送。
另一方面,除了該目標的運動、形狀和紋理信息外,例如表示該目標的一索引、題目、制作者、使用者可編輯性等的目標信息需要被編碼并被發送作為該目標的編碼序列的頭部,在這種情況下,如果有多個目標被發送,目標信息量變大,從而導致編碼效率降低。
因此,本發明的主要目的在于提供一種對視頻目標平面(VOP)的目標信息進行有效編碼的方法和裝置。
根據本發明的一個方面,提供有一種對視頻信號進行編碼的方法,該視頻信號包括一視頻目標平面(VOP)及其目標信息,該VOP在其中具有一目標,該方法包括有步驟(a)將該VOP劃分成多個塊并檢測邊界塊和目標塊,其中各邊界塊中包括有背景象素和目標象素,而各目標塊中只包括有目標象素,這些背景象素和目標象素分別表示駐留于該目標的外部及內部的象素;(b)將該目標信息轉換成一組目標符號;(c)將各目標符號加至包括在一邊界塊中的一背景象素,從而產生處理塊,這些處理塊包括有這些目標塊和一個或多個其中具有這些目標符號的處理后的邊界塊及其余未被處理的邊界塊,及(d)對這些處理塊進行編碼,從而產生一編碼后的視頻信號。
根據本發明的另一方面,提供有一種對視頻信號進行編碼的裝置,該視頻信號包括一其中具有一目標的視頻圖象和一目標信息,該視頻圖象由若干目標象素和背景象素組成,這些目標象素駐留于目標內部而背景象素駐留于目標外部,該裝置包括用于將該視頻圖象劃分成多個塊并將各塊分類成背景塊、邊界塊和目標塊中的一個的裝置,其中該背景塊中只包括有背景象素,該邊界塊中包括有目標和背景象素及該目標塊只包括有目標象素;用于產生表示該目標信息的一組二進制數的目標符號的裝置;用于通過將這些目標符號加到這些目標塊及邊界塊中而產生處理塊的裝置;及用于對這些處理塊進行編碼,從而產生一編碼后的視頻信號的裝置。
通過結合附圖對優選實施例的描述,本發明的上述及其它目的和特征將變得顯然,附圖中圖1為用于對VOP的信息進行編碼的常規編碼裝置的概略性方框圖;圖2為一被劃分成多個DCT塊的擴展的VOP的示意圖;圖3為根據本發明的一優選案施例的用于對目信息進行編碼的創造性裝置的概略性方框圖;及圖4為圖3中的目標信息插入單元的詳細方框圖。
參見圖3,示出了根據本發明的一優選實施例的用于對目標信息進行編碼的創造性裝置的概略性方框圖。轉換器305、乘法器310和填充單元320的功能及特征與圖1中所示的相似元件105、110和120一樣,因此為簡便起見,省去對它們的描述。來自填充單元320的填充后的紋理信息及來自轉換器305的轉換后的形狀信息被提供給一目標信息插入單元330,該目標信息插入單元330也接收目標信息。下面將參照圖2和4描述在目標信息插入單元330中對目標信息進行編碼的詳細過程,其中圖4為該目標信息插入單元330的詳細方框圖。
以與圖1中所示的填充單元120中相似的方式,一塊檢測單元332檢測覆蓋目標15的DCT塊。在VOP的這些DCT塊中,不覆蓋目標15且僅由背景象素組成的DCT塊1被設定為一背景DCT塊,DCT塊7為一只包括有目標象素的目標DCT塊,而其余的DCT塊2-6和8-12為其中包括有目標及背景象素兩者的邊界DCT塊。一旦檢測到目標和背景DCT塊,該塊檢測單元332給各背景象素附加一識別標志,該識別標志表示一被附加有標志的象素屬于背景20;并將這些目標和邊界DCT塊作為處理DCT塊提供給處理塊生成單元338。
同時,該目標信息被輸入給一轉換單元334。在轉換單元334,表示該目標信息的各字符、數字、符號等被轉換成由例如8比特的二進制數表示的二進制符號。由該轉換單元334生成的一組二進制符號被提供給一隨機目標數據生成單元336。該組二進制符號可產生一與這些目標象素的圖形完全不同的某一圖形,因此,隨后變換過程例如DCT的編碼效率可被降低。為此,該隨機目標數據生成單元336通過將各二進制符號乘以一隨機數而產生一組隨機目標符號。
該隨機數是以一預定方式從一組預定的隨機數中選擇出來的。該隨機數應是非常大足夠使該目標信息在后來的量化過程中不被損壞。來自隨機目標數據生成單元336的該組隨機目標符號被饋送給處理塊生成單元338。該處理塊生成單元338根據附加給背景象素的識別標志,對包括在該處理DCT塊中包括的背景象素進行檢測。
按照常規,這些塊以從左至右和從上至下的光柵掃描次序被處理。因此,圖2中所示的處理DCT塊以DCT塊2到塊12的次序被處理。處理塊生成單元338找出第一處理DCT塊,即塊2,并逐個地將隨機的目標符號加至以光柵掃描次序在DCT塊2中選擇的填充后的背景象素。如果有剩余的隨機目標符號未被附加,這些隨機的目標符號以與上述相同的方式被附加給隨后的邊界DCT塊中的背景象素直至所有的目標符號被處理。一旦處理這些隨機的目標符號,一個或多個處理后的邊界DCT塊包括該隨機的目標符號信息而其余未被處理的邊界DCT塊和每個目標DCT塊保持原封不動。所有這些塊作為處理塊被提供給一變換單元340。
返回參照圖3,變換單元340通過使用例如一常規的離散余弦變換(DCT)技術將各處理塊轉換成一組變換系數,并將該組變換系數提供給一量化單元350,其中該組變換系數被量化以生成一組量化后的變換系數,并被提供給一模數(modulus)單元360。
在模數單元360,根據常規的模數技術對超出一預定最大值的象素進行模數處理。通過從一量化后的變換系數中減去一預定最大值的整數倍,即模數而將該量化后的變換系數值的范圍限定在該預定最大值內,其中該模數為例如255。例如,如果例如根據VLC(可變長度編碼)技術可在隨后的統計編碼處理中被處理的該最大值為255且一對應于其中包括有一隨機目標符號的背景象素的量化后的變換系數具有520的值,則該量化后的變換系數的值被減至10(=520-255×2)并且模信息被附加至其,其中該模信息表示模處理數。在該情況下模信息具有2的值。另一方面,如果與其中包括有一隨機的目標符號的背景象素相對應的量化的變換系數具有值270,該量化的變換系數的值被減至5(=270-255×1)且模信息具有值1。該模處理后的數據被提供給VLC單元370。在VLC單元370,該模處理后的數據被VLC編碼并被發送至-發射機(未示出)用于發射。
在接收端的解碼器,該發送的VLC編碼后的數據通過-序列可變長度解碼、反模數、逆量化和逆變換處理被重構成處理塊,然后,根據自發射機發送的該目標的形狀信息和該重構的處理塊,獲得該目標的紋理信息。然后,根據該目標的該重構的紋理信息的邊界象素執行逆填充處理,且背景象素的填充的象素值被去除。此時的邊界象素的其余值被除以預存在該解碼器的預定組隨機數,從而產生對應于該目標信息的二進制符號。然后該些二進制符號被轉換成目標信息。
盡管只相對于某一優選實施例對本發明進行了描述。但在不脫離由所附權利要求定義的精神及范圍的前提下,可作出其它改型和變化。
權利要求
1.一種對包括有一視頻目標平面(VOP)及其目標信息的視頻信號進行編碼的方法,該VOP中包括有一目標,該方法包括有步驟(a)將該VOP劃分成多個塊并檢測邊界塊和目標塊,其中各邊界塊中包括有背景象素和目標象素而各目標塊中只包括有目標象素,這些背景及目標象素分別表示駐留于該目標外部及內部的象素;(b)將該目標信息轉換成一組目標符號;(c)將各目標符號加至包括在一邊界塊中的一背景象素上,從而產生處理塊,這些處理塊包括有目標塊和一個或多個其中具有目標符號的處理后的邊界塊及其中不具有目標符號的其余未被處理的邊界塊;及(d)對這些處理塊進行編碼,從而生成一編碼后的視頻信號。
2.根據權利要求1的方法,其中各目標符號由二進制數表示。
3.根據權利要求2的方法,其中轉換步驟(b)包括有步驟(b1)將該目標信息轉換成一組二進制數,其中各二進制數由P比特的二進制數表示,P為一正整數;及(b2)將各二進制符號乘以在一預定組隨機數中選擇的一隨機數,從而提供該組目標符號。
4.根據權利要求3的方法,其中這些背景象素具有通過根據這些目標象素執行一填充技術而獲得的值。
5.根據權利要求4的方法,其中該填充技術為一重復填充技術。
6.根據權利要求5的方法,其中編碼步驟(d)包括有步驟(d1)變換各處理塊以提供一組變換系數;(d2)量化該組變換系數以產生一組量化后的系數;及(d3)根據統計編碼技術對該組量化后的系數進行編碼以產生該編碼后的視頻信號。
7.根據權利要求6的方法,其中編碼步驟(d)還包括在量化步驟(d2)后,(d21)步驟根據一模數技術限定這些量化后的系數的值。
8.根據權利要求7的方法,其中附加步驟(c)包括有步驟(c1)檢測一個或多個二進制塊以在其中插入這些目標符號;及(c2)將各目標符號加至在被檢測的二進制塊中所包括的一背景象素,從而生成該些處理后的邊界塊。
9.根據權利要求8的方法,其中劃分步驟(a)包括有步驟(a1)生成識別標志給在這些邊界塊中所包括的背景象素,附加給一象素的一識別標志表示該象素對應于一背景象素。
10.根據權利要求9的方法,其中一個或多個邊界塊通過使用這些識別標志而被檢測到。
11.一種用于對包括有一視頻圖象和目標信息的視頻信號進行編碼的裝置,該視頻圖象中具有一目標且由目標象素和背景象素組成,目標象素駐留于該目標內部而背景象素駐留于該目標外部,該裝置包括有用于將該視頻圖象劃分成多個塊并將各塊分類成背景塊、邊界塊和目標塊中的一個的裝置,其中該背景塊中只包括有背景象素,邊界塊中包括有目標象素和背景象素而目標塊中只包括有目標象素;用于產生一組表示該目標信息的二進制數的目標符號的裝置;用于通過將這些目標符號插入到這些目標塊和邊界塊中而產生處理塊的裝置;及用于對這些處理塊進行編碼,從而生成一編碼后的視頻信號的裝置。
12.根據權利要求11的裝置,其中生成裝置包括用于將該目標信息轉換成一組二進制符號的裝置,各二進制符號由多個預定的二進制數表示;及用于將各二進制符號乘以在一預定組隨機數中以預定方式選擇的一隨機數而獲得該組目標符號的裝置。
13.根據權利要求12的裝置,其中這些處理塊包括這些目標塊和一個或多個其中具有目標符號的處理后的邊界塊及其余不具有目標符號的邊界塊。
14.根據權利要求13的裝置,其中用于產生處理塊的裝置包括用于找出一個或多個邊界塊以在其中插入這些目標符號的裝置,及用于將各目標符號加至找出的該些邊界塊中包括的一背景象素,從而產生這些處理后的邊界塊的裝置。
15.根據權利要求14的裝置,其中該視頻圖象劃分裝置包括有用于將識別標志附加至這些邊界塊中所包括的背景象素的裝置,其中附加到一象素的一識別標志指示該象素為一背景象素。
16.根據權利要求15的裝置,其中根據這些識別標志檢測該一個或多個邊界塊及各目標符號被加至的背景象素。
17.根據權利要求16的裝置,其中根據光柵掃描次序找出該一個或多個邊界塊。
18.根據權利要求17的裝置,其中該編碼裝置包括用于變換各處理塊以提供一組變換系數的裝置;用于量化該組變換系數以生成一組量化后的系數的裝置;及用于對該組量化后的系數進行編碼以生成該編碼后的視頻信號的裝置。
19.根據權利要求18的裝置,其中該編碼裝置包括用于限定該組中的各量化后的系數的值,從而產生一組限定后的量化后的系數的裝置;及用于對該組限定及量化后的系數進行統計編碼以生成該編碼后的視頻信號的裝置。
20.根據權利要求19的裝置,其中限定各量化后的系數的值是根據一模數而被實現的。
全文摘要
一種對包括有一視頻目標平面(VOP)及其目標信息的視頻信號進行編碼的方法,包括有步驟:將該VOP劃分成多個塊并檢測邊界塊和目標塊,其中各邊界塊中包括有背景象素和目標象素而各目標塊中只包括有目標象素;將該目標信息轉換成一組目標符號;將各目標符號加至包括在一邊界塊中的一背景象素上,從而產生處理塊;及對這些處理塊進行編碼,從而生成一編碼后的視頻信號。
文檔編號H04N7/30GK1219824SQ9712171
公開日1999年6月16日 申請日期1997年12月12日 優先權日1997年12月2日
發明者韓錫源 申請人:大宇電子株式會社