專利名稱:二進制圖象的內插方法
技術領域:
本發明涉及二進制圖象的內插方法,并特別涉及根據上下文(相鄰象素的狀態值)確定用于判定由內插要產生的象素值的可變閾值的改進的內插方法。
近來,處理形狀信息的功能已經添加到MPEG-4中。涉及圖象的對象信息的形狀信息表示為二進制圖象。為了對這種二進制圖象進行編碼,MPEG-4采用了基于內容的運算編碼器(CAE)。對于有損形狀編碼,在每一形狀宏塊中執行下降采樣方法和上升采樣方法。形狀圖象分割為具有M×M塊規格的形狀塊。
下降采樣是指根據給定的轉換率用來簡化二進制圖象塊的方法。簡化的圖象塊與轉換率一同傳輸。這里,轉換率的確定要使得原始二進制圖象塊與后來恢復的二進制圖象塊之間的誤差在預定的的范圍內。
通過下降采樣獲得的簡化的圖象塊由基于上下文的運算編碼器(CAE)編碼并然后傳輸。
上升采樣方法用來恢復這種簡化的圖象塊。通過內插上升采樣用于恢復簡化的圖象塊為原始的二進制圖象。
在這種上升采樣處理中,有效的內插方法必須不會在恢復的二進制圖象中引起過分的分塊和平滑效果。
為了滿足上述要求,本發明的一個目的是要提供一種改進的內插方法,其中上下文(由內插產生的與一個象素(被內插的象素)相鄰象素的狀態值)用于內插,由此降低分塊和平滑效果。
為了達到上述目的,提供了一種用于二進制圖象內插方法,即用于恢復由下降采樣從原始的二進制圖象簡化的二進制圖象為原始的二進制圖象的方法,該方法包括步驟(a)基于圍繞被內插的象素簡化的圖象的象素值(對象象素值)計算一內插值;(b)計算上下文Cp(圍繞對象象素的象素(參照象素)的狀態值);(c)獲得對應于計算的上下文的閾值;以及(d)比較內插值與步驟(c)的閾值,并如果內插值大于閾值則設置被內插象素的象素值為“1”,而如果內插值等于或小于閾值則設置被內插象素的象素值為“0”。
通過參照附圖詳細說明其優選實施例,本發明以上的目的和優點將更為明顯,這些附圖是
圖1A是表示根據MPEG-4用于二進制圖象的編碼和解碼方法的示意圖;圖1B是表示圖1A中所示下降采樣步驟的示意圖;圖1C是表示圖1A中所示上升采樣步驟的示意圖;圖2A到圖2D是表示根據本發明的內插方法的示意圖;圖3是表示根據本發明的閾值學習方法的流程圖;圖4A到圖4C表示在與傳統方法比較中根據本發明的內插方法的效果。
圖1A中,根據MPEG-4用于具有對象信息的二進制圖象的編碼和解碼方法包括下降采樣步驟100、編碼步驟102、反編碼步驟104和上升采樣步驟106。
在下降采樣步驟100中,轉換一個M×N二進制圖象塊為(M×CR)×(N×CR)二進制圖象塊。這里,CR是表示相對于原始二進制圖象塊通過下降采樣所獲得的簡化的圖象塊尺寸的率的轉換率。
在編碼步驟102中,簡化的圖象被編碼。為了對包含對象二進制圖象編碼,MPEG-4采用基于運算解碼器(CAE)的上下文。CAE是把二進制圖象分解為塊并以相同的方法處理所有的塊的編碼器。CAE由于其簡潔性比較高的編碼效率在MPEG-4檢驗模型中被采用作為編碼方法。
通過編碼步驟102被編碼的簡化的圖象經過傳輸路徑傳輸。在反編碼步驟104中,被編碼的簡化的圖象恢復為簡化的圖象。在上升采樣步驟106中,對簡化的圖象進行內插以便獲得原始二進制圖象。
圖1B詳細表示圖1A所示的下降采樣步驟100。如圖1B所示,使二進制圖象200形成多個宏塊。宏塊201中由字符“0”指示的象素被轉換為字符“X”指示的一個象素。這里,宏塊的尺寸取決于轉換率而定。MPEG-4的轉換率可以是1、1/2或1/4。這種轉換是對所有宏塊進行的,結果得到按轉換率簡化的一個圖象。在圖1B中,一個宏塊的四個象素(由“0”指示)簡化為一個象素,即轉換率為1/2。
在下降采樣步驟中,如果一個宏塊中每組四個象素的一半或者更多等于“1”,被轉換的象素的象素值變為“1”。這里,具有值“1”的象素表示包含對象的畫面部分,而具有值“0”的象素表示沒有對象的畫面部分。具有值“1”的象素和具有值“0”的象素之間的邊界表示對象信息的邊界。
圖1C詳細表示圖1A所示的上升采樣步驟。在上升采樣步驟期間,原始的二進制圖象的每一象素通過使用簡化圖象的四象素的內插被恢復。
參見圖1C,以下將詳細說明傳統的內插方法。
圖1C中,象素A,B,C和D表示內插中有關象素的對象象素,而象素P1,P2,P3和P4表示被內插的象素,這是通過內插要獲得的象素。這里,對象象素A,B,C和D圍繞被內插的象素P1,P2,P3和P4。而且,對象象素屬于簡化的圖象,而被內插的象素則屬于被恢復的二進制圖象。
首先,通過如下使用對象象素A,B,C和D的線性內插方法獲得一內插值INP[P]INP[P1]=r*A+s*(B+C+D)INP[P2]=r*B+s*(A+C+D)INP[P3]=r*C+s*(A+B+D)INP[P4]=r*D+s*(A+B+C)其中,r和s為權值,r大于s。即對于每一內插的象素,較大的權值用于最靠近每一內插象素的的象素。
然后,比較獲得的內插值INP[P]和閾值THR。這里,閾值THR設置為最大可能的內插值的一半的一個值。如果內插值INP[P]大于閾值THR,則該內插象素的象素值變為“1”。否則,內插象素值變為“0”。
這里,當可能使用多個內插值INP時只使用一個閾值THR。因而如果內插值INP[P]和閾值THR彼此接近,則內插的象素的象素值是否正確變得不清楚。于是,在恢復的二進制圖象中呈現嚴重的成塊或平滑現象。
為了降低成塊或平滑現象,根據上下文(圍繞內插象素的象素(參照象素)狀態值)適當地確定與內插值INP[P]進行比較的一個閾值,由此降低在判定內插象素的象素值中的不確定性。而且,提出的閾值是使用學習方法確定的。
以下將參照圖2A到2D描述根據本發明一種改進的內插方法。在圖2A到2D中,標以“0”的象素A,B,C,D,C0,C1,C2,C3和C4為簡化的圖象的象素,而標以“X”的象素P1,P2,P3和P4表示恢復的二進制圖象的內插象素。
首先,計算由內插要產生的象素的內插值。這里,內插值是通過雙線性內插方法計算的。然而,內插值可以變通地使用對象象素的平均或其它方法計算。
使用雙線性內插方法按以下等式(1)計算內插值INP[P]=A·(1-h)(1-v)+B(1-v)v+C·h(1-v)+D·hv …(1)這里,每一項的h和v表示包含在項中的對象象素和內插象素之間的水平和垂直距離。確定內插值INP[P]為0和1之間的一個值。
對象象素的組合數等于16,并且內插值INP[P]的數目為16。然而,如果不遇到重復的值,則實際的內插值數目為12,這些值都在0與1之間。于是,整數t的范圍為0~11,并且設定的閾值THRc[t]的數目等于12,包括0,0.0625,0.1875,0.25,0.375,0.4375,0.5625,0.625,0.75,0.8125,0.9375和1。
然后,上下文(參照象素的狀態值)由以下公式(2)計算CP=∑0kRK2K…(2)其中P表示內插象素的位置,R表示參照象素,而k為參照象素的指數及權值。這里,指數k依照內插象素的位置而變化。在本發明中,圍繞對象象素的五個象素用作為參照象素。
圖2A到2D分別表示用于對內插的象素P1到P4進行內插的參照象素的位置和指數。
設置的閾值THRc[t]通過下述的學習方法確定。
然后,對內插值INP[P]和基于上下文的閾值THRc進行比較以便判定內插象素的象素值。
如果內插值INP[P]大于閾值THRc,則內插的象素的象素值為“1”。否則,內插象素的象素值為“0”。
另外,以下說明判定基于參照象素上下文的閾值THRc的方法。閾值THRc是通過學習方法獲得的。通過對原始二進制圖象與恢復的二進制圖象的比較步驟而進行學習。
詳細來說,參照圖3,首先定義陣列h[c][t]和THRc[t](步驟310)。
這里,陣列h[c][t]保持命中的數目,權值命中是對恢復的象素值等于原始象素值時給予的名稱。命中是通過向每一上下文施加所有可能的閾值而確定的。這里,c是設置的內插值的指數。在圖2的情形,由于內插值的數目和值的閾值數目都等于12,故陣列的規格為h[11][11]。
而且,陣列THRc[t]存儲設置的閾值。這里,t是設置的閾值的指數。
然后,初始化陣列h[c][t]為零(步驟320)。
始化陣列h[c][t]為零之后,輸入原始的二進制圖象和簡化的二進制圖象(步驟330)。
然后,判定起始內插象素的位置。通過光柵掃描從左上到右下進行內插(步驟340)。
一旦判定了內插象素的位置,就通過以上等式(2)計算上下文(步驟350)。
對閾值指數t進行初始化(步驟355)。
然后,計算內插象素的內插值INP[P](步驟360)。
從THR[t]當前設置的閾值與計算的內插值INP[P]進行比較(步驟370)。如果內插值INP[P]大于設置的閾值THRc[t],則內插象素的象素值P置為“1”(步驟372)。否則,內插象素的象素值P置為“0”(步驟374)。
內插象素的象素值P與原始象素值進行比較(步驟380)。如果象素值P等于原始象素值,則陣列h[c][t]中對應的值增加“1”。這一值表示命中的數目(步驟385)。否則,不進行步驟385。
進行核實,看是否步驟380的比較已經對當前內插值的所有設置的閾值進行(步驟390)。
如果步驟390的條件滿足,則判定內插是否已經對二進制圖象所有的象素進行(步驟400)。
如果步驟390的條件不滿足,則處理返回步驟370。
如果內插已經對二進制圖象所有的象素進行,則設置提供了最高命中頻率的設定的閾值為對應的內插值的閾值(步驟400)。
如果步驟400的條件不滿足,則處理返回步驟350。
根據本發明的內插方法,通過使用上下文能夠消除僅使用由雙線性內插獲得的內插值進行恢復的模糊性,由此降低了恢復的二進制圖象中的恢復誤差。
圖4A到4C與傳統的方法相比較地示出了本發明的內插方法的效果。詳細來說,圖4A表示包含MPEG-4標準的原始二進制圖象,圖4B表示參照圖1C描述的傳統內插的結果,而圖4C則表示根據本發明的內插的結果。從圖4B和4C可以看出,與傳統的方法相比分塊和平滑效果被大大降低。
如上所述,在本發明的內插方法中,通過使用上下文(圍繞內插象素參照象素的的狀態值)消除了內插值與閾值之間比較的不確定性,因而降低了恢復的二進制圖象中的分塊和平滑現象。
權利要求
1.一種二進制圖象內插方法,用于將通過下降采樣從原始的二進制圖象簡化的二進制圖象恢復為原始的二進制圖象,該方法包括以下步驟(a)基于圍繞被內插的象素的象素(對象象素)的象素值計算內插值;(b)計算上下文Cp(圍繞對象象素的象素(參照象素)的狀態值);(c)獲得對應于計算的上下文的閾值;以及(d)比較內插值與步驟(c)的閾值,并如果內插值大于閾值則設置被內插象素的象素值為“1”,而如果內插值等于或小于閾值則設置被內插象素的象素值為“0”。
2.如權利要求1的內插方法,其中步驟(a)是通過雙線性內插方法計算的。
3.如權利要求1的內插方法,其中使用以下等式執行步驟(b)CP=∑0kRK2K其中P表示內插象素的位置,R表示參照象素,而k為參照象素的指數。
4.如權利要求1的內插方法,其中步驟(c)所獲得的閾值是設置的數個閾值之一,閾值數目等于考慮對象象素所有可能允許位置獲得的內插值的數目。
5.如權利要求4的內插方法,其中設置的閾值通過以下步驟獲得(a1)定義陣列h[c][t]及THRc[t],其中c是內插值的的指數,而t是設置的閾值的指數;(a2)初始化陣列h[c][t]為零,并接收原始的二進制圖象及簡化的圖象;(a3)根據光柵掃描判定要被內插的內插象素的位置,并計算參照象素的上下文;(a4)初始化閾值指數t;(a5)計算內插象素的內插值INP[P];(a6)將當前設置的閾值THRc[t]與計算的內插值INP[P]進行比較,并如果內插值INP[P]大于設置的閾值THRc[t],則設置內插的象素的象素值為“1”,而如果內插值INP[P]小于或等于設置的閾值THRc[t],則設置內插的象素的象素值為“0”;(a7)對內插的象素的象素值與原始象素值進行比較,如果有命中,則陣列h[c][t]的值及閾值指數增加“1”,其中命中是指當內插的象素值等于原始的象素值時;(a8)檢驗是否已經對所有設置的閾值進行了步驟a6的比較,如果沒有對所有設置的閾值進行步驟a6的比較,則返回步驟a6;(a9)檢驗是否已經對二進制圖象所有的象素進行了內插,是否對所有設置的閾值進行了步驟a6的比較,并如果沒有對二進制圖象所有的象素進行內插,則返回步驟a3;以及(a10)如果內插對二進制圖象所有象素進行,置提供了最高命中頻率的設置的閾值為對應于內插值的閾值。
全文摘要
本發明為一種改進的內插方法,其中用來判定象素的象素值的閾值根據上下文(相鄰象素的狀態值)產生。在該內插方法中,通過使用上下文(圍繞被內插象素的參照象素的狀態值)消除了內插值與閾值之間的不確定性,因而降低了恢復的二進制圖象中分塊和平滑現象。
文檔編號H04N1/415GK1201333SQ9712346
公開日1998年12月9日 申請日期1997年12月29日 優先權日1997年5月29日
發明者趙大星, 申在燮 申請人:三星電子株式會社