用于編碼數字圖像序列的方法
【專利說明】用于編碼數字圖像序列的方法
[0001] 本發明設及用于編碼數字圖像序列的方法W及對應的解碼方法。另外,本發明設 及用于編碼數字圖像序列的裝置和用于解碼數字圖像序列的裝置。
[0002] 在許多不同的應用中,例如在監測系統中或者在醫學成像裝置中,產生大量圖像 和視頻數據。因而,存在壓縮該數據W便節省存儲容量或者減小在傳輸數據時的帶寬的需 要。
[0003] 在現有技術中,存在許多標準W便壓縮圖像和視頻數據。標準的突出示例是 比264/AVC(AVC=高級視頻編碼,參見文獻[1] )W及草案標準肥VC(肥VC=高效視頻編碼, 同樣參見文獻巧]),其還將被標準化為口U-T推薦H. 265。標準肥VC還將允許無損編碼的 圖像序列的實時傳輸。標準肥VC和比264/AVC包括基于相同圖像中的塊的不同帖內預測 模式(intrapredictionmode)。在那些模式中,針對鄰域中的已經重構的像素而預測當前 塊。編碼器通常測試不同的預測類型并且選擇關于某個失真準則具有最小成本的一個。針 對當前塊而構建預測誤差并且將其連同預測類型一起傳輸至解碼器。按塊(block-wise)預 測具有W下缺點:遠離用于預測的參考像素的像素并不與參考像素很好地相互關聯。因而, 預測誤差對于那些像素而言通常較高。為了改進預測,塊的大小可W被減小。然而,運導致 圖像中的塊的較高數目,其引起用于預測類型的信令的較高比特率。另外,如果參考像素包 含噪聲,則那些像素對于預測而言變成是次優的。
[0004]簡單且高效的按像素的預測方法在文獻巧]中被提出。名為LOCO-I的該預測方 法使用簡單且直接的算法來基于=個周圍的像素而預測像素。該預測方法對于針對有噪聲 的圖像的壓縮也不是最優的。
[0005] 在文獻[4]中W及在國際專利申請No.PCT/EP2012/075988中,公開了一種基于 模板的預測,其中通過將根據像素周圍的模板的補塊(patch)與根據要預測的像素的鄰域 中的像素周圍的模板的其它補塊進行比較來確定像素的經預測值。作為該比較的結果,確 定補塊之間的類似性度量。預測是基于考慮到類似性度量的鄰域中的像素值的加權和,其 中較低的類似性度量導致較低權重。該預測方法相當復雜并且不適合用于特殊類型的內 容,例如計算機屏幕的內容。
[0006] 本發明的目的是提供一種數字圖像序列的編碼,其克服W上缺點并且使得能夠實 現具有低復雜度的高效壓縮。另外,本發明的目的是提供一種對應的解碼方法W及用于編 碼的裝置和用于解碼的裝置。
[0007]該目的通過獨立專利權利要求來解決。本發明的優選實施例在從屬權利要求中被 限定。
[0008] 根據本發明的用于編碼數字圖像序列的方法使用多個預測模式(即至少一個預測 模式)W用于基于之前處理的圖像區域中的像素的經重構的值來預測圖像中的像素值。術 語"像素的經重構的值"要被寬泛地解釋并且取決于所使用的編碼方案。對于無損編碼,像 素的經重構的值對應于像素的原始值。在有損編碼的情況中,像素的經重構的值對應于經 編碼并且此后經解碼的像素值。而且,像素的經重構的值還可W是指在對應預測模式中確 定的像素的經預測的值。像素的經預測的值在當預測當前像素時尚未執行相應像素的編碼 和解碼的情況中使用。
[0009] 在編碼方法中,像素的經預測的值與原始值之間的預測誤差被處理W用于生成數 字圖像的經編碼序列。
[0010] 本發明的方法的特征在于特殊的預設的預測模式,其是基于單個圖像的像素的帖 內預測模式。該預設的預測模式包括如下文中解釋的步驟i)和ii)。
[0011] 在步驟i)中,對于單個圖像中的具有經重構的值的像素的區和對于圖像區域的 模板,將基于模板圍繞要預測的第一像素的區中的像素的第一補塊與若干第二補塊進行比 較,每個第二補塊被分配給來自該區中的多個第二像素的第二像素并且包括基于模板而圍 繞第二像素的區中的像素。基于該比較,確定針對每個第二像素的類似性度量,其描述在被 分配給相應第二像素的第二補塊的像素的經重構的值與第一補塊的像素的經重構的值之 間的類似性。
[0012] 在根據本發明的方法的步驟ii)中,基于在區中的多個第二像素的所有第二像素 之中具有由類似性度量描述的最高類似性的一個或多個第二像素的值來確定第一像素的 經預測的值。
[0013] 本發明是基于W下想法:如文獻[4]和國際專利申請No.PCT/EP2012/075988中 所描述的預測的復雜度可W通過不是在像素的加權和上而是在根據類似性度量具有最高 類似性的像素上來確定經預測的值而被降低。文獻[4]和W上提到的國際專利申請的完整 公開內容通過引用并入在本申請中。
[0014]本發明的方法提供了特別地用于屏幕內容的高效編碼而不需要如在現有技術方 法中的情況那樣求解線性方程組。另外,不存在要用于預測第一像素的第二像素的數目中 的約束。而且,沒有或較少邊信息需要從編碼器傳輸到解碼器,因為根據本發明的預測方案 是后向自適應的。另外,預測是基于樣本實施的,使得預測誤差不取決于像素位置。
[0015] 在本發明的優選實施例中,第一像素的經預測的值是在區中的多個第二像素的所 有第二像素之中具有由類似性度量所描述的最高類似性的單個第二像素的值。如果存在具 有最高類似性的若干第二像素,通過多個第二像素中的第二像素的預定次序來選擇單個第 二像素,其中單個第二像素是W第二像素的預定次序首先具有最高類似性的第二像素。可 替換地或附加地,還可W基于在區中的多個第二像素中具有由類似性度量所描述的最高類 似性的所有第二像素的值確定第一像素的經預測的值。在僅存在具有最高類似性的單個第 二像素的情況中,第一像素的經預測的值是該單個第二像素的值。如果存在具有最高類似 性的若干第二像素,則第一像素的經預測的值是所述若干第二像素的值的組合并且特別地 是其線性組合,優選地為所述第二若干像素的值的平均。W上所描述的本發明的兩個變型 提供了用于應對其中存在具有相同的最大類似性度量的若干像素的情況的高效機制。
[0016] 在本發明的另一實施例中,預設的預測模式針對預定的圖像塊中的第一像素而按 塊執行。因而,方法可W容易地與基于塊的編碼方案組合。
[0017] 在特別優選的實施例中,類似性度量是基于第一補塊和相應第二補塊中的對應 (經重構的)像素之間的絕對差之和。然而,第一補塊和相應第二補塊中的對應像素之間的 平方差之和也可W用于限定類似性度量。
[0018] 在本發明的另一實施例中,單個圖像是具有在多個豎直和水平位置處的像素的二 維圖像,其中區和/或模板中的多個第二像素被限定成使得區和/或模板中的多個第二像 素通過至少兩個相鄰的像素而圍繞對應像素,其中對應像素在限定區中的多個第二像素的 情況中為第一像素并且對應像素在限定模板的情況中為被基于模板的第一或第二補塊圍 繞的像素,所述至少兩個相鄰像素包括: -具有相對于對應像素向上偏移一個像素的豎直位置并且具有與單個圖像中的對應 像素相同的水平位置的上相鄰像素; -具有相對于對應像素向左偏移一個像素的水平位置并且具有與單個圖像中的對應 像素相同的豎直位置的左相鄰像素;W及可選地 -具有相對于對應像素向上偏移一個像素的豎直位置并且具有相對于單個圖像中的 對應像素向左偏移一個像素的水平位置的左上像素。
[0019] 在特別優選的實施例中,區和/或模板中的多個第二像素還包括具有相對于對應 像素向上偏移一個像素的豎直位置并且具有相對于單個圖像中的對應像素向右偏移一個 像素的水平位置的右上像素。
[0020] 基于相鄰像素而限定區中的多個第二像素的W上方法可W與其中給出預定次序 W用于在具有最高類似性的若干第二像素的情況中選擇用于預測的第二像素的本發明的 實施例組合。為了運樣做,可W如下限定多個第二像素中的預定次序: 上相鄰像素,左相鄰像素,左上像素,W及在多個第二像素還包括右上像素的情況中, 右上像素。
[0021] 可替換地,可W如下限定多個第二像素中的預定次序: 上相鄰像素,右上像素(如果存在的話),左相鄰像素和左上像素W及。
[0022] 在特別優選的實施例中,本預測模式用于圖像序列的無損編碼。在該情況中,在步 驟i)中使用的像素的經重構的值等于像素的原始值。
[0023] 在本發明的另一實施例中,本預測模式用于圖像序列的有損編碼。優選地,有損編 碼包括(經變換的)預測誤差的變換和/或量化的已知步驟,其中執行預測誤差的逆變換和 /或解量化(dequantization)W用于確定像素的經重構的值。在針對像素的預測誤差尚未 經受變換和/或量化的情況中,像素的經預測的值被用作經重構的值。
[0024] 在特別優選的實施例中,預測誤差的處理包括增強編碼效率的賭編碼步驟。
[00巧]在另一實施例中,本發明的方法除預設的預測模式之外包括預定的預