對視頻進行解碼的設備的制造方法
【專利摘要】一種對視頻進行解碼的設備。一種使用可變分區的視頻編碼方法,其中,通過使用基于第一分區模式和分區等級確定的多個分區,以作為用于對畫面進行編碼的數據單元的編碼單元為單位執行預測編碼,以便從確定的多個分區中選擇將輸出編碼結果的分區,對表示選擇的分區的第一分區模式和分區等級的分區信息進行編碼和輸出。所述第一分區模式表示作為用于對所述編碼單元執行預測編碼的數據單元的分區的形狀和方向性,所述分區等級表示所述編碼單元被劃分為用于詳細的運動預測的多個分區的程度。
【專利說明】
對視頻進行解碼的設備
[00011 本申請是申請日為2011年1月14日、申請號為201180014086.8、題為"用于預測編 碼的使用可變分區的視頻編碼的方法和設備以及用于預測編碼的使用可變分區的視頻解 碼的方法和設備"的專利申請的分案申請。
技術領域
[0002] 本發明涉及對視頻進行編碼和解碼。
【背景技術】
[0003] 隨著用于再現和存儲高清晰度或高質量視頻內容的硬件的發展和供應,對有效地 對高清晰度或高質量視頻內容進行編碼或解碼的視頻編解碼器的需求正在增加。在現有視 頻編解碼器中,基于具有預定尺寸的宏塊根據有限的編碼方法來對視頻進行編碼。
[0004] 視頻壓縮使用空間相關性和時間相關性。一般來說,以特定尺寸數據的單元(例 如,16 X 16宏塊)執行幀間預測。當具有特定尺寸的宏塊被劃分為兩個、四個或更多個運動 區域并且隨后對每個運動區域執行幀間預測時,會發生與原始圖像相關的恢復的圖像的失 真,并且會產生用于發送幀間預測的結果的開銷。當用于幀間預測的運動區域被精細劃分 時,與原始圖像相關的恢復的圖像的失真減少,但開銷增加。因此,在幀間預測中,存在與原 始圖像相關的恢復的圖像的失真和用于發送幀間預測結果的開銷之間的權衡關系。
【發明內容】
[0005] 技術問題
[0006] 本發明提供使用用于預測編碼的具有可變形狀和可變尺寸的分區的視頻編碼和 視頻解碼。
[0007] 解決方案
[0008] 根據本發明的一方面,提供了一種使用可變分區的視頻編碼方法,實施視頻編碼 方法包括:通過使用基于第一分區模式和分區等級確定的分區,以作為用于對畫面進行編 碼的數據單元的編碼單元為單位執行預測編碼,以便從確定的分區中選擇將輸出編碼結果 的分區,其中,第一編碼模式表示作為用于對編碼單元執行預測編碼的數據單元的分區的 形狀和方向性,并且分區等級表示編碼單元被劃分為用于詳細的運動預測的分區的程度; 以及對表示選擇的分區的第一分區模式和分區等級的分區信息進行編碼和輸出。
[0009] 有益效果
[0010] 不僅可確定具有與現有宏塊相同的尺寸的分區、具有現有宏塊的一半尺寸的分區 和具有現有宏塊的四分之一尺寸的分區,還可確定能夠預測紋理的方向性和位置的改變以 及詳細的運動的分區。由于可基于編碼單元的尺寸對允許分區的詳細運動被預測的分區的 形狀和方向進行調整,因此可充分考慮圖像特性來執行預測編碼和預測解碼。
【附圖說明】
[0011] 圖1是根據本發明的實施例的使用可變分區的視頻編碼設備的框圖;
[0012] 圖2是根據本發明的實施例的使用可變分區的視頻解碼設備的框圖;
[0013] 圖3是示出根據本發明的實施例的具有分層結構的編碼單元的示圖;
[0014] 圖4示出根據本發明的實施例的由第一分區模式和分區等級定義的具有樹形結構 的分區;
[0015] 圖5示出根據本發明的實施例的第一分區模式、分區等級和第二分區模式之間的 關系;
[0016] 圖6是根據本發明的實施例的使用可變分區的視頻編碼方法的流程圖;
[0017] 圖7是根據本發明的實施例的使用可變分區的視頻解碼方法的流程圖;
[0018] 圖8是根據本發明的實施例的使用基于具有樹形結構的編碼單元進行預測編碼的 可變分區的視頻編碼設備的框圖;
[0019] 圖9是根據本發明的實施例的使用基于具有樹形結構的編碼單元進行預測編碼的 可變分區的視頻解碼設備的框圖;
[0020] 圖10是用于描述根據本發明的實施例的編碼單元的概念的示圖;
[0021] 圖11是根據本發明的實施例的基于編碼單元的圖像編碼器的框圖;
[0022] 圖12是根據本發明的實施例的基于編碼單元的圖像解碼器的框圖;
[0023]圖13是示出根據本發明的實施例的根據深度的較深層編碼單元和分區的示圖;
[0024] 圖14是用于描述根據本發明的實施例的編碼單元和變換單元之間的關系的示圖;
[0025] 圖15是用于描述根據本發明的實施例的與編碼深度相應的編碼單元的編碼信息 的示圖;
[0026] 圖16是根據本發明的實施例的根據深度的較深層編碼單元的示圖;
[0027] 圖17、圖18和圖19是用于描述根據本發明的實施例的編碼單元、預測單元和變換 單元之間的關系的示圖;
[0028] 圖20是用于描述根據表2的編碼模式信息的編碼單元、預測單元或分區和變換單 兀之間的關系的不圖;
[0029] 圖21是根據本發明的實施例的使用基于具有樹形結構的編碼單元的可變分區的 視頻編碼方法的流程圖;
[0030] 圖22是根據本發明的實施例的使用基于具有樹形結構的編碼單元的可變分區的 視頻解碼方法的流程圖。
【具體實施方式】
[0031] 最佳模式
[0032] -種根據本發明的實施例的使用可變分區的視頻編碼方法包括:通過使用基于第 一分區模式和分區等級確定的多個分區,以作為用于對畫面進行編碼的數據單元的編碼單 元為單位執行預測編碼,以便從確定的多個分區中選擇將輸出編碼結果的分區,其中,所述 第一分區模式表示作為用于對所述編碼單元執行預測編碼的數據單元的分區的形狀和方 向性,所述分區等級表示所述編碼單元被劃分為用于詳細的運動預測的多個分區的程度; 對表示選擇的分區的第一分區模式和分區等級的分區信息進行編碼和輸出。
[0033] -種根據本發明的實施例的使用可變分區的視頻解碼方法包括:從接收到的比特 流提取包括第一分區模式和分區等級的分區信息,其中,所述提取以作為用于對畫面進行 編碼的數據單元的編碼單元為單位被執行,第一分區模式表示作為用于對編碼單元執行預 測解碼的數據單元的分區的形狀和方向性,分區等級表示編碼單元被劃分為用于詳細的運 動預測的多個分區的程度;通過使用基于提取的分區信息的第一分區模式和分區等級確定 的多個分區執行預測解碼來恢復所述畫面。
[0034] -種根據本發明的實施例的使用可變分區的視頻編碼設備包括:編碼器,通過使 用基于第一分區模式和分區等級確定的多個分區,以作為用于對畫面進行編碼的數據單元 的編碼單元為單位執行預測編碼,以便從確定的多個分區中選擇將輸出編碼結果的分區, 并對所述畫面進行編碼以便確定編碼單元的編碼模式,其中,第一分區模式表示作為用于 對編碼單元執行預測編碼的數據單元的分區的形狀和方向性,分區等級表示編碼單元被劃 分為用于詳細的運動預測的多個分區的程度;輸出單元,對表示選擇的分區的第一分區模 式和分區等級的分區信息、關于選擇的分區的預測模式的信息以及包括關于編碼模式的信 息的編碼信息進行編碼和輸出,并對選擇的分區的運動矢量和殘差數據進行編碼和輸出。
[0035] -種根據本發明的實施例的使用可變分區的視頻解碼設備包括:提取器,從接收 到的比特流提取包括第一分區模式和分區等級的分區信息、關于分區的預測模式的信息、 包括關于編碼模式的信息的編碼信息以及分區的運動矢量和殘差數據,其中,所述第一分 區模式表示作為用于對作為用于對畫面進行編碼的數據單元的編碼單元執行預測編碼的 數據單元的分區的形狀和方向性,分區等級表示編碼單元被劃分為用于詳細的運動預測的 多個分區的程度,其中,所述提取針對每個編碼單元被執行;解碼器,根據基于提取的分區 信息的第一分區模式和分區等級確定的多個分區的預測模式,對所述確定的多個分區執行 預測解碼,并根據編碼模式恢復所述畫面。
[0036] 本發明包括一種記錄有用于執行所述視頻編碼方法的程序的計算機可讀記錄介 質。
[0037] 本發明包括一種記錄有用于執行所述視頻解碼方法的程序的計算機可讀記錄介 質。
[0038]本發明的模式
[0039] 以下,"圖像"可表示視頻的靜止圖像或運動圖像(即,視頻本身)。以下,"數據單 元"可表示構成視頻的多份數據中落入預定范圍之內的多份數據的集。
[0040] 現將參照圖1至圖7描述根據本發明的實施例的使用用于預測編碼的可變分區的 視頻的編碼和解碼。稍后將參照圖8至圖22描述根據本發明的實施例的使用基于具有樹形 結構的編碼單元進行預測編碼的可變分區的視頻的編碼和解碼。
[0041] 圖1是根據本發明的實施例的使用用于預測編碼的可變分區的視頻編碼設備10的 框圖。
[0042] 參照圖1,使用可變分區的視頻編碼設備10包括編碼器11和輸出單元12。為便于解 釋,以下使用可變分區的視頻編碼設備10將被簡稱為視頻編碼設備10。
[0043] 視頻編碼設備10接收視頻的畫面序列,通過對所述畫面序列的每個畫面執行幀間 預測、幀內預測、變換、量化和熵編碼來對所述畫面序列進行編碼,并輸出編碼的視頻數據 (即,編碼的結果)以及包括關于編碼模式的信息的編碼信息。
[0044] 視頻編碼設備10可將當前畫面劃分為多個數據單元(每個數據單元均具有預定尺 寸),并可對每個數據單元執行編碼,以有效地對當前畫面進行編碼。以下,用于對畫面進行 編碼的數據單元被稱為"編碼單元"。編碼器11可確定編碼單元和將對每個編碼單元執行的 編碼方法。針對每個編碼單元確定的編碼方法被稱為編碼模式。
[0045] 數據冗余會發生在視頻的時間連續的多個圖像中,或發生在視頻的圖像的空間相 鄰區域中。在視頻壓縮編碼期間,參考空間/時間相鄰數據區域執行編碼的預測編碼技術被 執行,以去除空間/時間相鄰的數據區域中的數據冗余而減少編碼數據的尺寸。
[0046] 在預測編碼技術中,基于具有預定尺寸和預定形狀的數據單元搜索具有冗余數據 的相鄰數據區域,因此可對搜索的冗余數據單元之間的差距(即,運動)以及原始數據和搜 索的冗余數據單元的冗余數據之間的差值(即,殘差數據)進行編碼。
[0047] 編碼器11可確定作為將與相鄰數據的運動進行比較的數據單元的分區,以對每個 編碼單元執行預測編碼。分區的尺寸可小于或等于編碼單元的尺寸。編碼器11可根據使用 確定的分區的預測編碼輸出通過從每個分區去除冗余數據而獲得的殘差數據。
[0048] 編碼器11通過使用基于第一分區模式和分區等級確定的分區執行預測編碼,來選 擇用于輸出編碼結果的分區。
[0049] 編碼器11可通過使用具有多種形狀、方向性和尺寸的分區對每個編碼單元執行預 測編碼,并從多個分區中選擇一分區,殘差數據最終將通過該分區被輸出。分區的方向性表 示所述分區從編碼單元被劃分的方向。編碼器11可通過根據多種分區確定并比較編碼效率 來選擇產生最高編碼效率的用于預測編碼的分區。
[0050] 可考慮原始數據和恢復的數據之間的誤差、在解碼之后產生的開銷等來確定編碼 效率。可使用基于拉格朗日乘子(Lagrangian multipliers)的率失真最優化來測量根據預 測編碼的編碼效率。
[0051] 可基于第一分區模式和分區等級定義根據本發明的實施例的分區。根據本發明的 實施例的第一分區模式指不分區的形狀和方向性。
[0052]例如,可根據第一分區模式的類型定義分區類型(矩形分區、正方形分區、非矩形 分區等)。例如,可定義根據第一編碼模式的劃分編碼單元的方向性,其中,編碼單元被劃分 的示例包括:i)編碼單元被垂直地,水平地,垂直并水平地均分為多個分區,或對角地劃分 為多個分區;ii)編碼單元沿著偏向編碼單元的左端、右端、上端或下端的劃分線被劃分為 多個分區;或iii)通過從寬度到對面寬度,從高度到對面高度,從寬度到相鄰高度,和從高 度到相鄰寬度對編碼單元進行劃分而獲得多個分區。
[0053]根據本發明的實施例的分區等級表示為了精細運動預測將編碼單元劃分為多個 分區的程度。可根據分區等級的值確定分區的寬度(高度)相對于編碼單元的寬度(高度)的 劃分比率。
[0054] 例如,隨著根據實施例的劃分等級增加,可確定通過對編碼單元的寬度和高度進 行精細劃分而獲得的多個分區。例如,可基于編碼單元的寬度或高度變為η等份的劃分確定 以1: (n_l)、2: (η_2)、…、(η_2): 2和(n_l): 1對編碼單兀的寬度或尚度進行劃分而獲得的多 個分區。
[0055] 然而,根據實施例的分區的最小尺寸是有限的,也就是說,編碼單元無法被無限劃 分。因此,可基于根據分層樹形結構確定的當前編碼單元的尺寸確定分區的分區等級的上 限、下限、或上限和下限兩者。可由系統設置或用戶設置來限制分區等級的值。
[0056] 分區的寬度和高度可增加或減少,其中,所述分區的形狀和方向基于根據實施例 的第一分區模式被確定。可根據第二分區模式定義分區的寬度和高度,其中,所述分區的形 狀和方向基于第一分區模式被確定。換句話說,第二分區模式可從根據第一分區模式的允 許的多個分區中確定詳細的分區類型。
[0057] 第一分區模式的多個分區的形狀和方向根據第一分區模式被確定,并且分區的寬 度、高度、或寬度或高度兩者增加或減少為根據分區等級確定的分區的最小寬度或最小高 度的一倍或多倍。因此,第二分區模式可被定義,以便指示第一分區模式的多個分區中的每 個。
[0058] 例如,當分區的最小寬度和最小高度根據分區等級被確定為編碼單元的寬度和高 度的1/n,第二分區模式指示所述編碼單元的寬度或高度以l :(n-l)、2:(n-2)、~、(n-2):2 和(n-1): 1被劃分的多個分區中的每個。
[0059] 因此,編碼器11還可根據第一分區模式確定第二分區模式,并且第二分區模式的 類型或數量可根據第一分區模式和分區等級被確定。
[0060] 輸出單元12可對表示由編碼器11選擇的分區的第一分區模式和分區等級的模式 信息進行編碼和輸出。分區信息還可根據第一分區模式包括第二分區模式。分區信息可包 括用于確定分區等級的下限或上限的分區等級限制信息。
[0061] 輸出單元12可輸出分區的運動矢量和殘差數據,其中,已通過使用由編碼器11確 定的分區進行預測編碼產生所述分區。輸出單元12還可對關于預測模式的信息以及包括關 于編碼模式的信息的編碼信息進行編碼和輸出,其中,所述預測模式表示使用由編碼器11 確定的分區的預測編碼方法。根據本發明的實施例的編碼信息可被插入到序列參數集 (SPS)。根據實施例的編碼信息可以以數據單元(諸如,序列、畫面、幀、像條、最大編碼單元 等)的每個單位被編碼并被插入輸出比特流。
[0062]圖2是根據本發明的實施例的使用用于預測編碼的可變分區的視頻解碼設備20的 框圖。
[0063]參照圖2,使用用于預測編碼的可變分區的視頻解碼設備20包括提取器21和解碼 器22。為便于解釋,使用用于預測編碼的可變分區的視頻解碼設備20以下將被簡稱為視頻 解碼設備20。
[0064]視頻解碼設備20可接收比特流(其中,視頻的畫面序列已被編碼為比特流),并通 過相對于每個編碼的畫面數據的熵解碼、反量化、逆變換、幀間預測/補償和幀內預測,從而 恢復畫面。
[0065] 提取器21可對接收到的比特流進行解析以提取編碼的畫面數據和運動矢量。提取 器21可對接收到的比特流進行解析以提取編碼的殘差數據。
[0066] 提取器21可對接收到的比特流進行以提取編碼信息。提取器21可從編碼信息讀取 關于編碼模式的信息、分區信息和關于預測模式的信息。可從分區信息讀取編碼單元的分 區的第一分區模式和分區等級。
[0067] 由提取器21提取的分區信息可包括關于分區的形狀和方向的信息,所述分區是具 有由第一分區模式和分區等級形成的分層樹形結構的分區中提供最高編碼效率的分區。
[0068] 解碼器22可基于由提取器21提取并讀取的分區信息確定用于針對畫面進行預測 編碼的分區。解碼器22可通過使用由提取器21提取的預測模式和運動矢量對編碼的殘差數 據進行預測解碼。
[0069] 解碼器22可基于分區信息確定每個編碼單元的分區。解碼器22可基于包括在分區 信息中的第一分區模式確定分區的形狀和編碼單元被劃分為多個分區的方向性。解碼器22 可基于包括在分區信息中的分區等級確定編碼單元被精細地劃分為多個分區的程度。
[0070] 例如,解碼器22可根據第一分區模式的類型確定分區類型(諸如,矩形分區、正方 形分區、非矩形分區等)。解碼器22可基于包括在分區信息中的第一分區模式確定編碼單元 被劃分為多個分區的方向性。例如,根據第一分區模式的多個分區可包括:i)編碼單元被垂 直地,水平地,垂直并水平地,或對角地劃分的分區;ii)位于編碼單元的左端、右端、上端或 下端的分區;或iii)通過從寬度到對面寬度,從高度到對面高度,從寬度到相鄰高度,和從 高度到相鄰寬度對編碼單元進行劃分而獲得的分區。
[0071] 解碼器22可基于分區等級確定編碼單元的寬度和高度被劃分的劃分比。隨著分區 等級增加,通過對編碼單元的寬度和高度進行精細劃分而獲得的多個分區可被確定。例如, 當編碼單元的寬度和高度之一或寬度和高度兩者以l:(n-l)、2 :(n-2)、…、(n-2):2和(n-l):l被劃分的多個分區被確定時,n可隨著分區等級的增加而增加。
[0072] 可基于根據分層樹形結構確定的當前編碼單元的尺寸,確定分區的分區等級的上 限、下限、或上限和下限兩者。可從接收到的比特流提取關于系統或用戶設置中的分區等級 的限制值的信息。
[0073] 提取器21還可從分區信息提取第二分區模式,其中,所述第二分區模式表示具有 基于第一分區模式確定的形狀和方向的多個分區中的具有預定寬度和預定高度的分區。解 碼器22可基于包括在分區信息中的第一分區模式信息、分區等級和第二分區模式確定每個 編碼單元的分區。
[0074] 解碼器22可根據第二分區模式增加或減少具有基于第一分區模式確定的形狀和 方向的分區的寬度和高度。
[0075] 由于第一分區模式可確定分區的形狀和方向性,因此分區等級可確定所述分區的 最小寬度或最小高度,并且第二分區模式可指示根據第一分區模式和分區等級的每個分 區,分區的寬度或高度可被確定為所述分區的最小寬度或最小高度的一倍或多倍。
[0076] 例如,分區的最小寬度和最小高度可根據分區等級被確定為編碼單元的寬度和高 度的1/n。解碼器22可基于第二分區模式確定通過對編碼單元的寬度或高度以l:(n-l)、2: (n-2)、…、(n-2): 2和(n-1): 1進行劃分而獲得的分區。
[0077] 解碼器22可根據預測模式對基于分區信息確定的分區執行預測解碼,并根據編碼 模式恢復畫面。
[0078] 視頻編碼設備10和視頻解碼設備20不僅可確定尺寸與現有宏塊相同的分區、尺寸 為現有宏塊的尺寸的一半的分區和尺寸為現有宏塊的尺寸的四分之一的分區,還可確定能 夠預測分區的紋理和精細運動的方向性和位置的改變的分區。由于可基于編碼單元的尺寸 調整允許分區的詳細運動被預測的分區的形狀和方向,因此可充分考慮圖像特性執行預測 編碼和解碼。
[0079]圖3是示出根據本發明的實施例的具有分層結構30的編碼單元31、32和33的示圖。 [0080] 根據編碼單元31、32和33的分層結構30,編碼單元31、32和33可隨著編碼單元等級 從0經過1增加到2而依次變小。隨著編碼單元31、32、33的尺寸依次變大,更多種形狀和方向 的紋理分量可被包括在編碼單元31、32和33。單個編碼單元可包括視頻序列中的與隨著時 間發生的不同運動相應的不同的運動區域。因此,為了對編碼單元進行更詳細和精確的預 測編碼,包括在編碼單元中的分區的形狀、方向和尺寸需要根據編碼單元的尺寸變化。
[0081] 圖4示出根據本發明的實施例的由第一分區模式和分區等級定義的具有樹形結構 50的分區。
[0082] 樹形結構50可包括由第一分區模式和分區等級定義的多個分區。視頻編碼設備10 的編碼器11可通過使用樹形結構50的的所有分區來對每個編碼單元執行預測編碼,并隨后 確定具有最高編碼效率的分區,并且輸出單元12可對確定的分區的殘差數據進行編碼和輸 出。
[0083] 第一分區模式可表示分區的形狀和方向性,分區等級可表示編碼單元被劃分為用 于詳細的運動預測的多個分區的程度。可由第一分區模式和分區等級的組合定義多個分 區。
[0084]分區等級為0的分區組49包括:第一分區模式0的分區集合40、第一分區模式1的分 區集合41、第一分區模式2的分區集合42、第一分區模式3的分區集合43、第一分區模式4的 分區集合44、第一分區模式5的分區集合45、第一分區模式6的分區集合46和第一分區模式7 的分區集合47。
[0085] 分區等級為0的第一分區模式0的分區集合40包括具有與編碼單元相同的尺寸的 分區0。
[0086] 分區等級為0的第一分區模式1的分區集合41可包括編碼單元被水平地兩等分的 矩形分區〇和1。分區等級為〇的第一分區模式2的分區集合42可包括編碼單元被垂直地兩等 分的矩形分區0和1。
[0087] 分區等級為0的第一分區模式3的分區集合43可包括編碼單元被水平和垂直地兩 等分的(即,被四等分)的矩形分區〇、1、2和3。
[0088] 分區等級為0的第一分區模式4的分區集合44可包括矩形分區0,以及與編碼單元 的其余部分相應的非矩形分區1,其中,所述矩形分區〇位于編碼單元的左上端并通過將編 碼單元的左邊和上邊兩等分而被獲得。
[0089] 分區等級為0的第一分區模式5的分區集合45可包括矩形分區1以及與編碼單元的 其余部分相應的非矩形分區〇,其中,所述矩形分區1位于編碼單元的右上端并通過將編碼 單元的右邊和上邊兩等分而被獲得。
[0090] 分區等級為0的第一分區模式6的分區集合46可包括矩形分區0以及與編碼單元的 其余部分相應的非矩形分區1,其中,所述矩形分區〇位于編碼單元的左下端并通過將編碼 單元的左邊和下邊兩等分而被獲得。
[0091] 分區等級為0的第一分區模式7的分區集合47可包括矩形分區1以及與編碼單元的 其余部分相應的非矩形分區〇,其中,所述矩形分區1位于編碼單元的右下端并通過將編碼 單元的右邊和下邊兩等分而被獲得。
[0092] 第一分區模式1和2可定義這樣的分區,其中,所述分區在編碼單元的上下區域或 左右區域發生不同運動時允許準確的預測編碼被執行。第一分區模式3可定義這樣的分區, 其中,所述分區在編碼單元之內存在多個對象或多個區域并且編碼單元具有復雜運動時允 許精細的預測編碼被執行。
[0093] 第一分區模式4、5、6和7可定義這樣的分區,其中,所述分區在編碼單元之內存在 對角邊時允許針對由編碼單元的對角邊定義的區域執行準確的預測編碼。然而,當第一分 區模式3、4、5、6和7被使用時,可以進行準確的運動預測但開銷會增加。因此,需要考慮編碼 效率和開銷之間的權衡來使用第一分區模式3、4、5、6和7。
[0094] 由于分區等級表示編碼單元被劃分為多個分區以實現詳細的運動預測的程度,因 此分區的最小高度和最小寬度可隨著分區等級的增加而減少。
[0095] 在分區的樹形結構50中,通過將編碼單元的寬度(高度)除以2的冪數來獲得分區 的最小寬度(最小高度),并且2的冪數隨著分區等級的增加而增加。
[0096] 如上所述,當分區等級為0時,編碼單元的高度(寬度)不被劃分或兩等分。當分區 等級增加到1時,分區的最小高度(最小寬度)可以是編碼單元的高度(寬度)的四分之一。當 分區等級增加到2時,分區的最小高度(最小寬度)可以是編碼單元的高度(寬度)的八分之 〇
[0097] 無論多個分區的樹形結構50中的分區等級的值如何,編碼單元的尺寸都不改變。 分區等級為1的分區組59具有的精度為分區等級為0的精度的兩倍。根據實施例,分區等級 為〇的第一分區模式1定義編碼單元的高度以1/2的精度被劃分的多個分區,分區等級為1的 第一分區模式1定義編碼單元的高度以1/4的精度被劃分的多個分區。分區等級為2的第一 分區模式1定義編碼單元的高度以1 /8的精度被劃分的多個分區。
[0098] 在單個第一分區模式下,可在多個分區等級之間重復相同形狀的多個分區。例如, 在第一分區模式3、4、5、6和7下,分區等級為0的分區集合43、44、45、46和47分別具有與分區 等級為1的分區集合536、546、556、566和576相同的形狀。在第一分區模式1和2下,分區等級 為1的分區集合51a和51b分別具有與分區等級為2的分區集合61b和61e相同的形狀,分區等 級為1的分區集合52a和52b分別具有與分區等級為2的分區集合62b和62e相同的形狀。
[0099] 當基于相同的第一分區模式和不同的分區等級確定的多個分區具有相同的形狀 時,在預測編碼期間可僅使用確定的多個分區中的更低分區等級的分區。例如,在第一分區 模式3下,由于分區等級為1的分區集合53e具有與分區等級為0的分區集合43相同的形狀, 因此在實際預測編碼期間可僅使用分區等級為〇(低于分區等級1)的第一分區模式3的分區 集合43,并且可僅對表示分區集合43的分區信息進行編碼。在這種情況下,不定義用于表示 分區集合53e的分區信息。
[0100] 分區等級為1的第一分區模式1的分區集合51a和51b可包括編碼單元分別以1:3和 3:1水平地被劃分的矩形分區0和1。分區等級為1的第一分區模式2的分區集合52a和52b可 包括編碼單元分別以1:3和3:1被垂直地劃分的矩形分區0和1。
[0101] 分區等級為1的第一分區模式3的分區集合53a、53b、53c、53d、53e、53f、53g、53h、 53i中的每個可包括編碼單元被水平和垂直地劃分的4個矩形分區0、1、2、3,從而水平劃分 和垂直劃分中的至少一個以1:3、2:2或3:1被執行。然而,在第一分區模式3下,分區等級為1 的分區集合53e與分區等級為0的分區集合43重復,因此在預測編碼期間可不被使用。可不 定義表示分區等級為1的第一分區模式3的分區集合53e的分區信息。
[0102] 分區等級為1的第一分區模式4的分區集合54a、54b、54c、54d、54e、54f、54g、54h、 54i中的每個可包括矩形分區0以及編碼單元的其余部分的非矩形分區1,其中,所述矩形分 區0位于編碼單元的左上端并通過以1:3、2:2或3:1對編碼單元的左邊和上邊中的至少一個 進行劃分而被獲得。然而,在第一分區模式4下,分區等級為1的分區集合54e與分區等級為Ο 的分區集合44重復,因此在預測編碼期間可不被使用。在分區等級1中,可不定義表示第一 分區模式4的分區集合54e的分區信息。
[0103] 分區等級為1的第一分區模式5的分區集合55a、55b、55c、55d、55e、55f、55g、55h、 55i中的每個可包括矩形分區1以及編碼單元的其余部分的非矩形分區0,其中,所述矩形分 區1位于編碼單元的右上端并通過以1:3、2:2或3:1對編碼單元的右邊和上邊中的至少一個 進行劃分而被獲得。然而,在第一分區模式5下,分區等級為1的分區集合55e與分區等級為0 的分區集合45重復,因此在預測編碼期間可不被使用。在分區等級1中,可不定義表示第一 分區模式5的分區集合55e的分區信息。
[0104] 分區等級為1的第一分區模式6的分區集合56&、5613、56(:、56(1、566、56;1^、568、5611、 56i中的每個可包括矩形分區0以及編碼單元的其余部分的非矩形分區1,其中,所述矩形分 區0位于編碼單元的左下端并通過以1:3、2:2或3:1對編碼單元的左邊和下邊中的至少一個 進行劃分而被獲得。然而,在第一分區模式6下,分區等級為1的分區集合56e與分區等級為0 的分區集合46重復,因此在預測編碼期間可不被使用。在分區等級1中,可不定義表示第一 分區模式6的分區集合56e的分區信息。
[0105] 分區等級為1的第一分區模式7的分區集合57a、57b、57c、57d、57e、57f、57g、57h、 57i中的每個可包括矩形分區1以及編碼單元的其余部分的非矩形分區0,其中,所述矩形分 區1位于編碼單元的右下端并通過以1:3、2:2或3:1對編碼單元的右邊和下邊中的至少一個 進行劃分而被獲得。然而,在第一分區模式7下,分區等級為1的分區集合57e與分區等級為0 的分區集合47重復,因此在預測編碼期間可不被使用。在分區等級1中,可不定義表示第一 分區模式7的分區集合57e的分區信息。
[0106] 類似地,分區等級為2的第一分區模式1的分區集合61a、61b、61c、61d、61e、61f可 包括編碼單元分別以1:7、2:6、3:5、5:3、6: 2和7:1被水平地劃分的矩形分區0和1。然而,在 第一分區模式1下,由于分區等級為2的分區集合61b和61e分別與分區等級為1的分區集合 51a和51b重復,因此可不定義表示分區等級為2的第一分區模式1的分區集合61b和61e的信 息。分區等級為2的第一分區模式2的分區集合62 &、6213、62〇、62(1、626、62€可包括編碼單元 分別以1:7、2:6、3:5、5:3、6:2和7:1被垂直地劃分的矩形分區0和1。然而,在第一分區模式1 下,由于分區等級為2的分區集合62b和62e分別與分區等級為1的分區集合52a和52b重復, 因此可不定義表示分區等級為2的第一分區模式2的分區集合62b和62e的信息。
[0107] 雖然考慮到空間問題在圖4中未示出分區等級為2的第一分區模式3、4、5、6和7的 多個分區,但可在分區等級為2的第一分區模式3下定義4個矩形分區,其中,編碼單元被水 平和垂直地劃分為所述4個分區,從而以1:7、2:6、3:5、4:4、5:3、6: 2和7:1執行水平劃分和 垂直劃分中的至少一個。
[0108] 在分區等級為2的第一分區模式4下,可定義矩形分區和與編碼單元的其它部分相 應的非矩形分區,其中,所述矩形分區位于編碼單元的左上端并通過以1 :7、2:6、3:5、5:3、 6:2和7:1對編碼單元的左邊和上邊中的至少一個進行劃分而被獲得。
[0109] 在分區等級為2的第一分區模式5下,可定義矩形分區和與編碼單元的其它部分相 應的非矩形分區,其中,所述矩形分區位于編碼單元的右上端并通過以1 :7、2:6、3:5、4:4、 5:3、6:2和7:1對編碼單元的右邊和上邊中的至少一個進行劃分而被獲得。
[0110] 在分區等級為2的第一分區模式6下,可定義矩形分區和與編碼單元的其它部分相 應的非矩形分區,其中,所述矩形分區位于編碼單元的左下端并通過以1 :7、2:6、3:5、4:4、 5: 3、6:2和7:1對編碼單元的左邊和下邊中的至少一個進行劃分而被獲得。
[0111] 在分區等級為2的第一分區模式7下,可定義矩形分區和與編碼單元的其它部分相 應的非矩形分區,其中,所述矩形分區位于編碼單元的右下端并通過以1 :7、2:6、3:5、4:4、 5: 3、6:2和7:1對編碼單元的右邊和下邊中的至少一個進行劃分而被獲得。
[0112] 當將被編碼的編碼單元的尺寸足夠大時,分區集合可被擴大到分區等級3和4。
[0113] 因此,在分區的樹形結構50中,可基于第一分區模式確定分區的形狀和方向性,可 基于分區等級確定最小寬度和最小高度。基于第一分區模式和分區等級確定的矩形分區可 包括均具有兩倍于最小寬度的分區寬度以及兩倍于最小高度的分區高度的多個分區。在這 種情況下,第二分區模式可指示基于第一分區模式和分區等級確定的多個分區中具有預定 的寬度或預定的高度的分區。
[0114] 當單個編碼單元包括兩個或更多分區并且分區0的寬度或高度被確定時,其余分 區的寬度或高度基于分區〇的寬度或高度被確定。因此,為便于解釋,現將僅討論分區〇的寬 度或高度。
[0115] 例如,分區的樹形結構50,分區等級為1的第一分區模式1的分區51a和51b均被確 定為具有編碼單元的高度的四分之一的最小高度。分區等級為1的第一分區模式1的分區 51a和51b的高度分別是分區51a和51b中的每個的最小高度的三倍。在這種情況下,第二分 區模式可被定義,以便指示分區等級為1的第一分區模式1的分區51a和51b中的每個。
[0116] 類似地,在分區等級為1的第一分區模式4下,矩形分區的最小寬度和最小高度可 被確定為編碼單元的寬度和高度的1/4,并且可形成位于編碼單元的左上端的矩形分區0以 及與編碼單元的其余部分相應的非矩形分區1兩者。可定義分區等級為1的第一分區模式4 的第二分區模式以指示分區54 &、5413、54〇、54(1、54匕548、5411和541中的每個分區,其中,所 述分區54 &、5仙、54〇、54(1、54廠548、5411和54丨被確定具有一倍、兩倍或三倍于分區的最小值 的分區的寬度和高度中的至少一個的變化。如上所述,在第一分區模式4下,分區等級為1的 分區54e可不被使用。
[0117] 然而,在分區等級0處第二分區模式不需被單獨地定義。隨著根據第一分區模式或 分區等級可能存在的分區類型改變,第二分區模式的數量及其范圍等可能變化。
[0118] 視頻編碼設備10可通過確定構成樹形結構50的多個分區中的一個分區來基于多 個分區的多種形狀、方向和尺寸執行預測編碼。在視頻編碼設備10中預測編碼的準確度和 計算速度之間的權衡中,當計算速度比準確度更重要時,視頻編碼設備10可限制包括在樹 形結構50中的多個分區的第一分區模式、分區等級或第二分區模式的選擇范圍。
[0119] 視頻編碼設備10可在對每個分區的預測模式信息、運動矢量和殘差信息進行編碼 的同時對分區信息(諸如,每個分區的第一分區模式、分區等級和第二分區模式)進行編碼。 因此,視頻解碼設備20可根據提取的分區信息確定分區,并通過使用確定的分區執行預測 解碼。
[0120] 根據本發明的實施例的分區的最小尺寸可以是最小編碼單元被四等分的分區。雖 然根據本發明的實施例的分區的尺寸可基于分區等級被確定,但所述尺寸需要等于或大于 分區的最小尺寸并小于或等于編碼單元。因此,分區的尺寸取決于編碼單元的尺寸。因此, 分區等級還可取決于編碼單元的尺寸。
[0121] 尺寸較小的編碼單元的區域需要用于預測編碼單元的小區域的運動的分區。然 而,隨著編碼單元變大,編碼單元的大區域的運動還有其小區域的運動可發生在編碼單元 的區域之內。因此尺寸較大的編碼單元需要經過的預測編碼不僅使用大分區,還使用小分 區。因此,分區等級還可基于編碼單元的尺寸被確定。
[0122] 因此,根據實施例的編碼單元的尺寸和可定義的分區等級之間的關系被表達在下 面的表1中。
[0123] 【表1】
[0126] 因此,只有具有作為最低等級的0的分區等級的分區可被確定用于8X8編碼單元。 具有〇和1的分區等級的分區可被確定用于16X16編碼單元。具有分區等級0到2的分區、具 有分區等級0到3的分區和具有分區等級0到4的分區可被分別確定用于32 X32、64X 64、128 X 128編碼單元。因此,可基于編碼單元的尺寸可變地允許分區等級。
[0127] 圖5示出根據本發明的實施例的第一分區模式、分區等級和第二分區模式之間的 關系。換句話說,可使用在圖5中示出的編碼單元71、72和73之內存在的多個點來確定根據 分區等級可定義的第一分區模式和第二分區模式的形狀。
[0128] 圖5中,在編碼單元71、72和73之內的多條線可用作包括在編碼單元71、72和73中 多個分區的高度邊和寬度邊,在編碼單元71、72和73之內的多個點可表示分區的寬度邊和 高度邊相交的交點。例如,當沿著編碼單元71、72和73之內的多條線從編碼單元71、72和73 之內的預定的交點向編碼單元71、72和73的寬度邊和高度邊畫出多條直線時,可形成編碼 單元71、72和73被劃分的多個分區。
[0129] 例如,在分區等級0,編碼單元71之內的多條線是將編碼單元71的寬度邊或高度邊 兩等分的多條線。可通過在編碼單元71之內的多條線相互交叉而形成單個交點,可確定由 從所述交點延長到編碼單元71的左邊、右邊、上邊和下邊中兩邊的直線所圍繞的多個分區。 換句話說,編碼單元71之內的多條線的交點可以是確定的分區中的每個的頂點。因此,分區 等級為〇的每個第一分區模式下,編碼單元71之內可僅定義多個分區的一個集合。由于針對 每個第一分區模式僅定義多個分區的一個集合,因此可不設置第二分區模式。
[0130] 在分區等級為1的情況下,編碼單元72之內的多條線是將編碼單元72的寬度邊或 高度邊四等分的多條線。雖然可通過編碼單元72之內的多條線相互交叉產生9個分區頂點, 但可基于8個頂點產生多個分區,其中,所述8個頂點是除與分區等級為0的交點重疊的中心 交點(白色交點)以外的8個頂點。因此,在分區等級為1的每個第一分區模式下,在編碼單元 72之內可定義8個分區集合。
[0131]類似地,在分區等級為2的情況下,編碼單元73之內的多條線是將編碼單元73的寬 度邊或高度邊劃分為8個部分的多條線。雖然可通過編碼單元73之內的多條線相互交叉產 生49個分區頂點,但可基于40個頂點產生多個分區,其中,所述40個頂點是除與分區等級為 〇和1的交點重疊的9個交點(白色交點)以外的40個頂點。因此,在分區等級為2的每個第一 分區模式下,在編碼單元72中可定義40個分區集合。
[0132] 因此,根據分區等級的值,包括在單個第一分區模式中的第二分區模式的數量可 相應于頂點的數量。
[0133] 圖6是根據本發明的實施例的使用用于預測編碼的可變分區的視頻編碼方法的流 程圖。
[0134] 在操作81,通過使用基于第一分區模式和分區等級定義的多個分區來對每個編碼 單元執行預測編碼,從而確定編碼結果被輸出的分區,其中,所述編碼單元是用于對畫面進 行編碼的數據單元。
[0135] 可基于第一分區模式確定分區的形狀和劃分方向性,可基于分區等級確定分區的 最小寬度或最小高度。通過對針對定義的分區進行預測編碼的編碼結果進行相互比較,可 從定義的多個分區確定具有最高編碼效率的分區,并且可對確定的分區的殘差數據進行編 碼。
[0136] 可基于編碼單元的尺寸確定分區等級的允許的范圍。還可根據第一分區模式確定 用于指示具有預定寬度和預定高度的分區的第二分區模式。可基于第一分區模式和分區等 級確定第二分區模式的數量的允許的范圍。
[0137] 在操作82,表示在操作81確定的分區的第一分區模式和分區等級的分區信息被編 碼和輸出。根據第一分區模式,分區信息還可包括第二分區模式。每個分區的運動矢量和殘 差數據可被編碼和輸出。包括分區信息以及關于預測模式和編碼模式的信息的編碼信息可 被編碼和輸出。
[0138] 圖7是根據本發明的實施例的使用用于預測編碼的可變分區的視頻解碼方法的流 程圖
[0139] 在操作91,從接收到的比特流提取表示每個編碼單元的分區的第一分區模式和分 區等級的分區信息。可通過對接收到的比特流進行解析來提取每個分區的運動矢量和殘差 數據。可通過對接收到的比特流進行解析來提取包括分區信息以及關于預測模式和編碼模 式的信息的編碼信息。
[0140]在操作92,使用基于在操作91提取的分區信息的第一分區模式和分區等級確定的 分區執行預測解碼,從而恢復畫面。可從分區信息讀取第一分區模式和分區等級,并可根據 第一分區模式讀取第二分區模式。可基于第一分區模式確定分區的形狀和劃分方向性,并 可基于分區等級確定與編碼單元的寬度或高度相關的分區的寬度或高度。可對每個分區的 殘差數據進行解碼以恢復畫面。
[0141]稍后將參照圖8到圖22,描述根據本發明的實施例的使用用于基于具有樹形結構 的編碼單元進行預測編碼的可變分區的視頻的編碼和解碼。
[0142] 圖8是根據本發明的實施例的使用用于基于具有樹形結構的編碼單元進行預測編 碼的視頻編碼設備的框圖。
[0143] 根據本發明的實施例的使用基于具有樹形結構的編碼單元的數據單元的組合的 視頻編碼設備100包括最大編碼單元劃分器110、編碼單元確定器120和輸出單元130。為便 于解釋,使用基于具有樹形結構的編碼單元的數據單元的組合的視頻編碼設備100以下將 簡稱為視頻編碼設備100。
[0144] 最大編碼單元劃分器110可基于圖像的當前畫面的最大編碼單元來劃分所述當前 畫面。如果當前畫面大于最大編碼單元,則當前畫面的圖像數據可被劃分為至少一個最大 編碼單元。根據本發明的實施例的最大編碼單元可以是具有尺寸為32 X32、64X 64、128 X 128、256X 256等的數據單元,其中,數據單元的形狀是寬度和長度為2的若干次方的正方 形。圖像數據可根據至少一個最大編碼單元被輸出到編碼單元確定器120。
[0145] 根據本發明的實施例的編碼單元可由最大尺寸和深度來表征。深度表示從最大編 碼單元空間劃分編碼單元的次數,并且隨著深度的加深,可將根據深度的較深層編碼單元 從最大編碼單兀劃分為最小編碼單兀。最大編碼單兀的深度是最尚深度,最小編碼單兀的 深度是最低深度。由于隨著最大編碼單元的深度加深,與每個深度相應的編碼單元的尺寸 減小,因此,與更高的深度相應的編碼單元可包括多個與更低的深度相應的編碼單元。
[0146] 如上所述,當前畫面的圖像數據根據編碼單元的最大尺寸被劃分為最大編碼單 元,并且最大編碼單元中的每個可包括根據深度被劃分的較深層編碼單元。由于根據本發 明的實施例的最大編碼單元根據深度被劃分,因此包括在最大編碼單元中的空間域的圖像 數據可根據深度被分層地分類。
[0147] 可預先確定編碼單元的最大深度和最大尺寸,其中,編碼單元的最大深度和最大 尺寸限制最大編碼單元的高度和寬度可被分層地劃分的總次數。
[0148] 編碼單元確定器120對通過根據深度劃分最大編碼單元的區域而獲得的至少一個 劃分區域進行編碼,并根據所述至少一個劃分區域確定用于輸出編碼圖像數據的深度。換 句話說,編碼單元確定器120通過基于當前畫面的最大編碼單元對根據深度的較深層編碼 單元中的圖像數據進行編碼并選擇具有最小編碼誤差的深度來確定編碼深度。因此,與確 定的編碼深度相應的編碼單元的已編碼的圖像數據被最終輸出。另外,與編碼深度相應的 編碼單元可被看作已編碼的編碼單元。
[0149] 確定的編碼深度和根據確定的編碼深度的編碼圖像數據被輸出到輸出單元130。
[0150] 基于與等于或低于最大深度的至少一個深度相應的較深層編碼單元對最大編碼 單元中的圖像數據進行編碼,并且基于較深層編碼單元中的每個對針對圖像數據進行編碼 的結果進行比較。在將較深層編碼單元的編碼誤差進行比較之后,可選擇具有最小編碼誤 差的深度。可針對每個最大編碼單元選擇至少一個編碼深度。
[0151]隨著編碼單元根據深度被分層地劃分,并且隨著編碼單元的數量增加,最大編碼 單元的尺寸被劃分。另外,即使在一個最大編碼單元中多個編碼單元相應于相同深度,也通 過分別測量每個編碼單元的圖像數據的編碼誤差來確定是否將與相同深度相應的編碼單 元中的每一個劃分至更低的深度。因此,即使當圖像數據被包括在一個最大編碼單元中時, 圖像數據也根據多個深度被劃分為多個區域,在一個最大編碼單元中編碼誤差可根據區域 而不同,因此編碼深度可根據圖像數據中的區域而不同。因此,在一個最大編碼單元中可確 定一個或多個編碼深度,并且可根據至少一個編碼深度的編碼單元來劃分最大編碼單元的 圖像數據。
[0152] 因此,編碼單元確定器120可確定包括在最大編碼單元中的具有樹形結構的編碼 單元。根據本發明的實施例的"具有樹形結構的編碼單元"包括最大編碼單元中所包括的所 有較深層編碼單元中與確定為編碼深度的深度相應的編碼單元。在最大編碼單元的相同區 域中,一編碼深度的編碼單元可根據深度被分層地確定,在不同的區域中,該編碼深度的編 碼單元可被獨立地確定。類似地,當前區域中的編碼深度可獨立于另一區域中的編碼深度 被確定。
[0153] 根據本發明的實施例的最大深度是與從最大編碼單元到最小編碼單元被劃分的 次數相關的索引。根據本發明的實施例的第一最大深度可表示圖像數據從最大編碼單元到 最小編碼單元的被劃分的總次數。根據本發明的實施例的第二最大深度可表示從最大編碼 單元到最小編碼單元的深度級的總數。例如,當最大編碼單元的深度是〇時,最大編碼單元 被劃分一次的編碼單元的深度可被設置為1,并且最大編碼單元被劃分兩次的編碼單元的 深度可被設置為2。這里,如果最小編碼單元是最大編碼單元被劃分四次的編碼單元,則存 在深度為〇、1、2、3和4的5個深度級,因此,第一最大深度可被設置為4,第二最大深度可被設 置為5。
[0154] 可根據最大編碼單元執行預測編碼和變換。還可根據最大編碼單元,基于根據等 于最大深度的深度或小于最大深度的多個深度的較深層編碼單元來執行預測編碼和變換。 針對根據實施例的視頻編碼執行的變換的示例可包括頻率變換、正交變換或整數變換等。
[0155] 由于每當最大編碼單元根據深度被劃分時,較深層編碼單元的數量增加,因此對 由于深度的加深而產生的所有的較深層編碼單元執行包括預測編碼和變換的編碼。為了便 于描述,現將在最大編碼單元中基于當前深度的編碼單元來描述預測編碼和變換。
[0156] 視頻編碼設備100可不同地選擇用于對圖像數據進行編碼的數據單元的尺寸或形 狀。為了對圖像數據進行編碼,執行多個操作(諸如,預測編碼、變換和熵編碼),此時,可針 對所有操作使用相同的數據單元,或者可針對每個操作使用不同的數據單元。
[0157] 例如,視頻編碼設備100不僅可選擇用于對圖像數據進行編碼的編碼單元,還可選 擇與該編碼單元不同的數據單元,以便對編碼單元中的圖像數據執行預測編碼。
[0158] 為了在最大編碼單元中執行預測編碼,可基于與編碼深度相應的編碼單元(即,基 于不再被劃分為與更低深度相應的多個編碼單元的編碼單元)執行預測編碼。以下,不再被 劃分并且變為用于預測編碼的基本單元的編碼單元現在將被稱為"預測單元"。通過劃分預 測單元而獲得的分區可包括:通過劃分預測單元的高度和寬度中的至少一個而獲得的預測 單元或數據單元。
[0159] 例如,當2NX2N(其中,N是正整數)的編碼單元不再被劃分并且變為2NX2N的預測 單元時,分區的尺寸可以是2NX2N、2NXN、NX 2N或NXN。分區類型的示例包括通過對預測 單元的高度或寬度進行對稱劃分而獲得的對稱分區、通過對預測單元的高度或寬度進行不 對稱劃分(諸如,1 :n或η: 1)而獲得的分區、通過對預測單元進行幾何劃分而獲得的分區以 及具有任意形狀的分區。
[0160] 根據實施例的預測單元可包括以上參照圖1至圖7描述的分區。換句話說,可基于 實施例的第一分區模式確定預測單元的形狀和劃分方向性,可基于分區等級的值確定預測 單元的尺寸相對于編碼單元的尺寸的比率。可根據編碼單元的尺寸確定分區等級的允許的 范圍(即,分區等級的上限或下限)。
[0161] 可根據第一分區模式確定用于表示詳細分區的類型的第二分區模式。
[0162] 視頻編碼設備100可通過使用具有樹形結構的預測單元基于第一分區模式之間和 分區等級之間的分層關系執行預測編碼,并對預測編碼的結果進行相互比較,從而確定具 有最高編碼效率的的分區。視頻編碼設備1〇〇可針對每個編碼單元確定提供最高編碼效率 的第一分區模式和分區等級的分區。
[0163] 預測單元的預測模式可以是幀內模式、幀間模式和跳過模式中的至少一個。例如, 可對2N X 2N、2N X N、N X 2N或N X N的分區執行幀內模式或幀間模式。另外,可僅對2N X 2N的 分區執行跳過模式。對編碼單元中的一個預測單元獨立地執行編碼,從而選擇具有最小編 碼誤差的預測模式。
[0164] 視頻編碼設備100還可基于用于對圖像數據進行編碼的編碼單元以及基于與該編 碼單元不同的數據單元,對編碼單元中的圖像數據執行變換。
[0165] 為了在編碼單元中執行變換,可基于具有小于或等于編碼單元的尺寸的變換單元 來執行變換。例如,所述變換單元可包括用于幀內模式的變換單元以及用于幀間模式的變 換單元。
[0166] 與基于根據實施例的樹形結構編碼單元類似,編碼單元中的變換單元可被遞歸地 劃分為更小尺寸的區域,因此編碼單元中的殘差數據可根據具有根據變換深度的樹形結構 的變換被劃分。
[0167] 還可在變換單元中設置指示通過對編碼單元的高度和寬度進行劃分而達到變換 單元的劃分次數的變換深度。例如,在2NX2N的當前編碼單元中,當變換單元的尺寸也是2N X2N時,變換深度可以是0,在當前編碼單元的高度和深度中的每一個被劃分為兩等份(總 共被劃分為4 1個變換單元)時,變換深度可以是1,并且變換單元的尺寸因此是NXN,在當前 編碼單元的高度和深度中的每一個被劃分為四等份(總共被劃分為4 2個變換單元)時,變換 深度可以是2,并且變換單元的尺寸因此是N/2XN/2。例如,可根據分層樹形結構來設置變 換單元,在分層樹形結構中,更高變換深度的變換單元根據變換深度的分層特性被劃分為 更低變換深度的四個變換單元。
[0168] 與編碼單元類似,編碼單元中的變換單元可被遞歸地劃分為更小尺寸的區域,從 而可以以區域為單位獨立地確定變換單元。因此,可根據具有根據變換深度的樹形結構的 變換,來劃分編碼單元中的殘差數據。
[0169] 根據與編碼深度相應的編碼單元的編碼信息不僅需要關于編碼深度的信息,還需 要與預測編碼和變換相關的信息。因此,編碼單元確定器120不僅確定具有最小編碼誤差的 編碼深度,還確定預測單元中的分區類型、根據預測單元的預測模式以及用于變換的變換 單元的尺寸。
[0170] 稍后將參照圖11至圖12來詳細地描述根據本發明的實施例的最大編碼單元中的 根據樹形結構的編碼單元以及確定分區的方法。
[0171] 編碼單元確定器120可通過使用基于拉格朗日乘子(Lagrangian multiplier)的 率失真優化來測量根據深度的更深的編碼單元的編碼誤差。
[0172] 輸出單元130在比特流中輸出最大編碼單元的圖像數據以及關于根據編碼深度的 編碼模式的信息,其中,所述圖像數據基于由編碼單元確定器120確定的至少一個編碼深度 被編碼。
[0173] 可通過對圖像的殘差數據進行編碼來獲得編碼圖像數據。
[0174] 關于根據編碼深度的編碼模式的信息可包括關于以下內容的信息:編碼深度、預 測單元中的分區類型、預測模式以及變換單元的尺寸。
[0175] 可通過使用根據深度的劃分信息來定義關于編碼深度的信息,劃分信息指示是否 針對更低深度而非當前深度的編碼單元來執行編碼。如果當前編碼單元的當前深度是編碼 深度,則當前編碼單元中的圖像數據被編碼和輸出,因此劃分信息可被定義為不將當前編 碼單元劃分為更低深度。可選擇地,如果當前編碼單元的當前深度不是編碼深度,則對更低 深度的編碼單元執行編碼,因此劃分信息可被定義為劃分當前編碼單元以獲得更低深度的 編碼單元。
[0176] 如果當前深度不是編碼深度,則對被劃分為更低深度的編碼單元的編碼單元執行 編碼。由于更低深度的至少一個編碼單元存在于當前深度的一個編碼單元中,對更低深度 的每個編碼單元重復地執行編碼,因此可對具有相同深度的編碼單元遞歸地執行編碼。
[0177] 由于對一個最大編碼單元確定具有樹形結構的編碼單元,并且對編碼深度的編碼 單元確定關于至少一個編碼模式的信息,因此可對一個最大編碼單元確定關于至少一個編 碼模式的信息。另外,由于圖像數據根據深度被分層地劃分,最大編碼單元的圖像數據的編 碼深度可根據位置而不同,因此可對圖像數據設置關于編碼深度以及編碼模式的信息。
[0178] 因此,輸出單元130可將關于相應編碼深度和編碼模式的編碼信息分配給包括在 最大編碼單元中的編碼單元、預測單元和最小單元中的至少一個。
[0179] 根據本發明的實施例的最小單元是對組成最低深度的最小編碼單元進行劃分4次 而獲得的矩形數據單元。可選擇地,最小單元可以是最大矩形數據單元,最大矩形數據單元 可被包括在最大編碼單元中所包括的所有編碼單元、預測單元、分區單元和變換單元中。
[0180] 例如,通過輸出單元130輸出的編碼信息可被分類為根據編碼單元的編碼信息以 及根據預測單元的編碼信息。根據編碼單元的編碼信息可包括關于預測模式的信息以及關 于分區的尺寸的信息。根據預測單元的編碼信息可包括關于以下內容的信息:幀間模式的 估計方向、幀間模式的參考圖像索引、運動矢量、幀內模式的色度分量以及幀內模式的插值 方法。另外,關于根據畫面、像條或G0P定義的編碼單元的最大尺寸的信息以及關于最大深 度的信息可被插入到比特流的頭。
[0181] 當基于以上參照圖1至圖7描述的第一分區模式、分區等級等確定預測單元時,輸 出單元130可對包括分區的第一分區模式和分區等級的分區信息進行編碼和輸出以用作編 碼信息。輸出單元130還可以以預測單元為單位對運動矢量和殘差數據進行編碼,并輸出編 碼的結果。
[0182] 在視頻編碼設備100中,較深層編碼單元可以是通過將作為上一層的更高深度的 編碼單元的高度或寬度劃分兩個而獲得的編碼單元。換句話說,在當前深度的編碼單元的 尺寸是2NX2N時,更低深度的編碼單元的尺寸是NXN。另外,具有2NX2N的尺寸的當前深度 的編碼單元可包括最多4個更低深度的編碼單元。
[0183] 因此,視頻編碼設備100可通過基于考慮當前畫面的特性所確定的最大編碼單元 的尺寸和最大深度,針對每個最大編碼單元確定具有最佳形狀和最佳尺寸的編碼單元,來 形成具有樹形結構的編碼單元。另外,由于通過使用各種預測模式和變換中的任何一個對 每個最大編碼單元執行編碼,因此可考慮各種圖像尺寸的編碼單元的特性來確定最佳編碼 模式。
[0184] 另外,由于編碼單元被劃分的預測單元和分區的類型可基于編碼單元的多種尺寸 而變化,還可基于第一分區模式、分區等級、第二分區模式等而變化,因此可執行基于包括 在編碼單元中的圖像特性的預測編碼。
[0185] 圖9是根據本發明的實施例的使用用于基于具有樹形結構的編碼單元進行視頻編 碼的可變分區的視頻解碼設備200的框圖。
[0186] 根據本發明的實施例的使用基于具有樹形結構的編碼單元的數據單元的組合的 視頻解碼設備200包括接收器210、圖像數據和編碼信息提取器220以及圖像數據解碼器 230。為便于解釋,使用基于具有樹形結構的編碼單元的數據單元的組合的視頻解碼設備 200以下將被簡稱為視頻解碼設備200。
[0187] 用于視頻解碼設備200的各種操作的各種術語(諸如,編碼單元、深度、預測單元、 變換單元和關于各種編碼模式的信息)的定義與以上參照圖8和視頻編碼設備100描述的那 些定義和信息類似。
[0188] 接收器210接收編碼視頻的比特流并對該比特流進行解析。圖像數據和編碼信息 提取器220從解析的比特流提取用于每個編碼單元的編碼圖像數據,其中,編碼單元具有根 據每個最大編碼單元的樹形結構,并且將提取的圖像數據輸出到圖像數據解碼器230。圖像 數據和編碼信息提取器220可從關于當前畫面的頭或者SPS提取關于當前畫面的編碼單元 的最大尺寸的信息。
[0189] 另外,圖像數據和編碼信息提取器220從解析的比特流提取關于根據每個最大編 碼單元的用于具有樹形結構的編碼單元的編碼深度以及編碼模式的信息。提取的關于編碼 深度和編碼模式的信息被輸出到圖像數據解碼器230。換句話說,比特流中的圖像數據被劃 分為最大編碼單元,從而圖像數據解碼器230針對每個最大編碼單元對圖像數據進行解碼。
[0190] 可針對關于與編碼深度相應的至少一個編碼單元的信息來設置關于根據最大編 碼單元的編碼深度和編碼模式的信息,并且關于編碼模式的信息可包括關于以下內容中的 信息:與編碼深度相應的相應編碼單元的分區類型、預測模式以及變換單元的尺寸。另外, 根據實施例的關于編碼深度和編碼模式的編碼信息還可包括關于當前預測單元或當前分 區的與組合相關的信息。
[0191]由圖像數據和編碼信息提取器220提取的關于根據每個最大編碼單元的編碼深度 和編碼模式的信息是關于這樣的編碼深度和編碼模式的信息:所述編碼深度和編碼模式被 確定用于當編碼器(諸如,視頻編碼設備100)根據每個最大編碼單元針對根據深度的每個 較深層編碼單元重復執行編碼時產生最小編碼誤差。因此,視頻解碼設備200可通過根據產 生最小編碼誤差的編碼深度和編碼模式對圖像數據進行解碼來恢復圖像。
[0192]由于關于編碼深度和編碼模式的編碼信息可被分配給來自相應編碼單元、預測單 元以及最小單元中的預定數據單元,因此,圖像數據和編碼信息提取器220可根據預定數據 單元提取關于編碼深度和編碼模式的信息。被分配有相同的關于編碼深度和編碼模式的信 息的預定數據單元可指的是包括在相同的最大編碼單元中的數據單元。
[0193] 根據實施例的關于編碼模式的信息可包括分區信息,所述分區信息包括第一分區 模式和分區等級。
[0194] 圖像數據解碼器230通過基于關于根據最大編碼單元的編碼深度和編碼模式的信 息對每個最大編碼單元中的圖像數據進行解碼來恢復當前畫面。換句話說,圖像數據解碼 器230可基于提取的關于來自包括在每個最大編碼單元中的具有樹形結構的編碼單元的每 個編碼單元的分區類型、預測模式和變換單元的信息來對編碼圖像數據進行解碼。解碼處 理可包括預測(所述預測包括幀內預測和運動補償)和反變換。
[0195] 圖像數據解碼器230可基于關于根據編碼深度的編碼單元的預測單元的分區類型 以及預測模式的信息,根據每個編碼單元的分區和預測模式來執行幀內預測或運動補償。
[0196] 圖像數據解碼器230可從關于編碼模式的信息中讀取分區信息,并從分區信息中 確定基于第一分區模式和分區等級定義的分區。圖像數據解碼器230可基于根據實施例的 第一分區模式確定預測單元的形狀和劃分方向性,并基于分區等級的值確定預測單元的尺 寸相對于編碼單元的尺寸的比率。根據第一分區模式,圖像數據解碼器230可考慮用于表示 詳細的分區的類型的第二分區模式來確定分區。
[0197] 根據實施例的第一分區模式、分區等級和第二分區模式可定義這樣的分區,其中, 通過在編碼處理期間使用具有基于第一分區模式之間和分區等級之間的分層關系的樹形 結構的預測單元,執行預測編碼來確定具有最高編碼效率的分區。圖像數據解碼器230可通 過使用提供最高編碼效率的第一分區模式和分區等級的分區來針對每個編碼單元執行預 測解碼。
[0198] 另外,圖像數據解碼器230可讀取關于基于樹形結構的變換單元的信息,其中,所 述信息包括關于根據編碼深度的編碼單元的變換單元的尺寸的信息,圖像數據解碼器230 根據編碼單元為單位執行基于變換單元的反變換,從而根據最大編碼單元執行反變換。
[0199] 圖像數據解碼器230可通過使用根據深度的劃分信息來確定當前最大編碼單元的 至少一個編碼深度。如果劃分信息指示圖像數據在當前深度中不再被劃分,則當前深度是 編碼深度。因此,圖像數據解碼器230可通過使用關于與編碼深度相應的每個編碼單元的關 于預測單元的分區類型、預測模式以及變換單元的尺寸的信息,來對當前最大編碼單元中 與每個編碼深度相應的至少一個編碼單元的編碼數據進行解碼,并且輸出當前最大編碼單 元的圖像數據。
[0200] 換句話說,可通過觀察為來自編碼單元、預測單元和最小單元的針對預定數據單 元分配的編碼信息集,來收集包括包含相同劃分信息的編碼信息的數據單元,收集的數據 單元可被認為是將由圖像數據解碼器以相同的編碼模式進行解碼的一個數據單元。
[0201] 視頻解碼設備200可獲得關于當針對每個最大編碼單元遞歸執行編碼時產生最小 編碼誤差的至少一個編碼單元的信息,并可使用所述信息來對當前畫面進行解碼。換句話 說,可對每個最大編碼單元中被確定為最佳編碼單元的具有樹形結構的編碼單元進行解 碼。
[0202] 視頻解碼設備200提取并讀取關于確定分區的方法的分區信息,其中,所述方法通 過針對具有樹形結構的多個預測單元的預測編碼的結果之間的比較來確定分區,視頻解碼 設備200通過使用所述分區信息執行預測解碼,從而能夠進行準確的解碼。
[0203] 現在將參照圖10至圖20對根據本發明的實施例的確定具有樹形結構的編碼單元、 預測單元和變換單元的方法進行描述。
[0204]圖10是用于描述根據本發明的實施例的編碼單元的概念的示圖。
[0205] 編碼單元的尺寸可按照寬度X高度來表達,并可以是64 X 64、32 X 32、16 X 16和8 X 8。64 X 64的編碼單元可被劃分為64 X 64、64 X 32、32 X 64或32 X 32的分區,32 X 32的編碼 單元可被劃分為32 X 32、32 X 16、16 X 32或16 X 16的分區,16 X 16的編碼單元可被劃分為16 X 16、16 X 8、8 X 16或8 X 8的分區,8 X 8的編碼單元可被劃分為8 X 8、8 X 4、4 X 8或4 X 4的分 區。
[0206] 在視頻數據310中,分辨率是1920X1080,編碼單元的最大尺寸是64,并且最大深 度是2。在視頻數據320中,分辨率是1920 X 1080,編碼單元的最大尺寸是64,并且最大深度 是3。在視頻數據330中,分辨率是352X288,編碼單元的最大尺寸是16,并且最大深度是1。 圖3中示出的最大深度表示從最大編碼單元到最小編碼單元的劃分總數。
[0207]如果分辨率高或者數據量大,則編碼單元的最大尺寸可以很大以便增加編碼效率 并且準確地反映圖像的特性。因此,視頻數據310和視頻數據320的編碼單元的最大尺寸可 以是64,其中,視頻數據310和視頻數據320具有的分辨率高于視頻數據330的分辨率。
[0208] 因為由于視頻數據310的最大深度是2而通過劃分最大編碼單元兩次深度被加深 到兩層,所以視頻數據310的編碼單元315可包括具有長軸尺寸64的最大編碼單元以及具有 長軸尺寸32和16的編碼單元。同時,因為由于視頻數據330的最大深度是1而通過劃分最大 編碼單元一次深度被加深到一層,因此視頻數據330的編碼單元335可包括具有長軸尺寸16 的最大編碼單元以及具有長軸尺寸8的編碼單元。
[0209] 因為由于視頻數據320的最大深度是3而通過劃分最大編碼單元三次深度被加深 到3層,因此視頻數據320的編碼單元325可包括具有長軸尺寸64的最大編碼單元以及具有 長軸尺寸32、16和8的編碼單元。隨著深度的加深,可精確地表達詳細的信息。
[0210] 圖11是根據本發明的實施例的基于編碼單元的圖像編碼器400的框圖。
[0211]圖像編碼器400執行視頻編碼設備100的編碼單元確定器120的操作以對圖像數據 進行編碼。換句話說,幀內預測器410在幀內模式下對當前幀405中的編碼單元執行幀內預 測,運動估計器420和運動補償器425在幀間模式下通過使用當前幀405和參考幀495對當前 幀405中的編碼單元執行幀間估計和運動補償。
[0212] 從幀內預測器410、運動估計器420和運動補償器425輸出的數據通過變換器430和 量化器440被輸出為量化的變換系數。量化的變換系數通過反量化器460和反變換器470被 恢復為空間域中的數據,并且恢復的空間域中的數據在通過去塊單元480和環路濾波單元 490被后處理之后被輸出為參考幀495。量化的變換系數可通過熵編碼器450被輸出為比特 流455。
[0213]為了使得圖像編碼器400被應用到視頻編碼設備100中,圖像編碼器400的所有元 件(即,幀內預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器 450、反量化器460、反變換器470、去塊單元480和環路濾波單元490)在考慮每個最大編碼單 元的最大深度的同時,基于具有樹形結構的多個編碼單元中的每個編碼單元執行操作。
[0214] 具體地講,幀內預測器410、運動估計器420和運動補償器425在考慮當前最大編碼 單元的最大尺寸和最大深度的同時,確定具有樹形結構的多個編碼單元中的每個編碼單元 的分區和預測模式,并且變換器430確定具有樹形結構的多個編碼單元的每個編碼單元中 的變換單元的尺寸。
[0215] 圖12是根據本發明的實施例的基于編碼單元的圖像解碼器500的框圖。
[0216] 解析器510對來自比特流505的將被解碼的編碼的圖像數據以及解碼所需的關于 編碼的信息進行解析。編碼的圖像數據通過熵解碼器520和反量化器530作為反量化的數據 被輸出,并且反量化的數據通過反變換器540被恢復為空間域中的圖像數據。
[0217] 幀內預測器550對于空間域中的圖像數據在幀內模式下對多個編碼單元執行幀內 預測,運動補償器560通過使用參考幀585在幀間模式下對多個編碼單元執行運動補償。
[0218] 經過幀內預測器550和運動補償器560的空間域中的圖像數據可在通過去塊單元 570和環路濾波單元580被后處理之后被輸出為恢復的幀595。另外,經過去塊單元570和環 路濾波單元580被后處理的圖像數據可被輸出為參考幀585。
[0219] 為了在視頻解碼設備200的圖像數據解碼器230中對圖像數據進行解碼,圖像解碼 器500可執行在解析器510之后執行的操作。
[0220]為了使得圖像解碼器500被應用到視頻解碼設備200中,圖像解碼器500的所有元 件(即,解析器510、熵解碼器520、反量化器530、反變換器540、幀內預測器550、運動補償器 560、去塊單元570和環路濾波單元580)對于每個最大編碼單元基于具有樹形結構的多個編 碼單元執行操作。
[0221] 具體地講,幀內預測器550和運動補償器560基于針對具有樹形結構的多個編碼單 元中的每個編碼單元的分區和預測模式來執行操作,并且反變換器540基于針對每個編碼 單元的變換單元的尺寸來執行操作。
[0222] 圖13是示出根據本發明的實施例的根據多個深度的多個較深層編碼單元和多個 分區的示圖。
[0223] 視頻編碼設備100和視頻解碼設備200使用多個分層的編碼單元以考慮圖像的特 性。多個編碼單元的最大高度、最大寬度和最大深度可根據圖像的特性被自適應地確定,或 者可由用戶不同地設置。根據多個深度的多個較深層編碼單元的尺寸可根據編碼單元的預 定最大尺寸被確定。
[0224] 在根據本發明的實施例的多個編碼單元的分層結構600中,多個編碼單元的最大 尚度和最大寬度都是64,并且最大深度是4。最大深度表不從最大編碼單兀到最小編碼單兀 的劃分總數。由于深度沿著分層結構600的縱軸加深,因此較深層編碼單元的高度和寬度都 被劃分。另外,作為用于每個較深層編碼單元的預測編碼的基礎的預測單元和多個分區沿 分層結構600的橫軸被顯示。
[0225] 換句話說,編碼單元610是分層結構600中的最大編碼單元,其中,深度是0,尺寸 (即,高度乘寬度)是64 X 64。深度沿縱軸加深,并且存在具有尺寸32 X 32和深度1的編碼單 元620、具有尺寸16 X 16和深度2的編碼單元630、具有尺寸8 X 8和深度3的編碼單元640以及 具有尺寸4 X 4和深度4的編碼單元650。具有尺寸4 X 4和深度4的編碼單元650是最小編碼單 J L· 〇
[0226] 編碼單元的預測單元和多個分區根據每個深度沿橫軸排列。換句話說,如果具有 尺寸64 X 64和深度0的編碼單元610是預測單元,則該預測單元可被劃分為包括在編碼單元 610中的多個分區(即,具有尺寸64X64的分區610、具有尺寸64X32的多個分區612、具有尺 寸32 X 64的多個分區614、或者具有尺寸32 X 32的多個分區616)。
[0227] 類似地,具有尺寸32X32和深度1的編碼單元620的預測單元可被劃分為包括在編 碼單元620中的多個分區(即,具有尺寸32X32的分區620、具有尺寸32X16的多個分區622、 具有尺寸16 X 32的多個分區624以及具有尺寸16 X 16的多個分區626)。
[0228] 類似地,具有尺寸16X16和深度2的編碼單元630的預測單元可被劃分為包括在編 碼單元630中的多個分區(即,包括在編碼單元630中的具有尺寸16X16的分區、具有尺寸16 X 8的多個分區632、具有尺寸8X16的多個分區634以及具有尺寸8X8的多個分區636)。
[0229] 類似地,具有尺寸8X8和深度3的編碼單元640的預測單元可被劃分為包括在編碼 單元640中的多個分區(即,包括在編碼單元640中的具有尺寸8 X 8的分區、具有尺寸8 X 4的 多個分區642、具有尺寸4 X 8的多個分區644以及具有尺寸4 X 4的多個分區646)。
[0230]具有尺寸4X4和深度4的編碼單元650是最小編碼單元以及最低深度的編碼單元。 編碼單元650的預測單元僅被分配給具有尺寸4X4的分區。還可使用具有尺寸4X2的多個 分區652、具有尺寸2X4的多個分區654以及具有尺寸2X2的多個分區656。
[0231] 由于在圖13中示出的多個分區具有通過將與所述多個分區相應的編碼單元的高 度和寬度中的至少一個兩等分而獲得的形狀,因此圖13的多個分區可相應于以上參照圖1 至圖7描述的分區等級為0的第一編碼模式0、1、2和3的分區集合40、41、42和43。例如,分區 610、620、630、640和650可相應于分區等級為0的第一分區模式0的分區集合40,并且分區 612、622、632、642和652可相應于分區等級為0的第一分區模式1的分區集合41。分區614、 624、634、644和654可相應于分區等級為0的第一分區模式2的分區集合42,并且分區616、 626、636、646和656可相應于分區等級為0的第一分區模式3的分區集合43。
[0232] 為了確定構成最大編碼單元610的多個編碼單元的至少一個編碼深度,視頻編碼 設備100的編碼單元確定器120對包括在最大編碼單元610中的與每個深度相應的編碼單元 執行編碼。
[0233] 隨著深度的加深,包括相同范圍中并且相同尺寸的數據的根據深度的較深層編碼 單元的數量增加。例如,需要四個與深度2相應的編碼單元以覆蓋包括在一個與深度1相應 的編碼單元中的數據。因此,為了根據深度對相同數據的多個編碼結果進行比較,與深度1 相應的編碼單元以及與深度2相應的四個編碼單元都被編碼。
[0234] 為了對多個深度中的當前深度執行編碼,沿分層結構600的橫軸,通過對與當前深 度相應的多個編碼單元中的每個預測單元執行編碼來對當前深度選擇最小編碼誤差。可選 擇地,可通過隨著深度沿分層結構600的縱軸加深,對每個深度執行編碼,根據深度比較最 小編碼誤差,來搜索最小編碼誤差。在編碼單元610中的具有最小編碼誤差的深度和分區可 被選作為編碼單元610的編碼深度和分區類型。
[0235] 圖14是用于描述根據本發明的實施例的編碼單元710和變換單元720之間的關系 的示圖。
[0236] 視頻編碼設備100或視頻解碼設備200針對每個最大編碼單元根據具有尺寸小于 或等于最大編碼單元的多個編碼單元來對圖像進行編碼或解碼。可基于不大于相應編碼單 元的多個數據單元來選擇在編碼期間用于變換的多個變換單元的多個尺寸。
[0237] 例如,在視頻編碼設備100或視頻解碼設備200中,如果編碼單元710的尺寸是64 X 64,則可通過使用具有尺寸32X32的多個變換單元720來執行變換。
[0238] 另外,可通過對具有尺寸小于64 X 64的尺寸32 X 32、16 X 16、8 X 8和4 X 4的每個變 換單元執行變換,來對具有尺寸64 X 64的編碼單元710的數據進行編碼,并且隨后具有最小 編碼誤差的變換單元可被選擇。
[0239] 圖15是用于描述根據本發明的實施例的與編碼深度相應的多個編碼單元的編碼 信息的示圖。
[0240] 視頻編碼設備100的輸出單元130可將如下信息作為關于編碼模式的信息進行編 碼和發送:關于分區類型的信息800、關于預測模式的信息810以及關于與編碼深度相應的 每個編碼單元的變換單元的尺寸的信息820。
[0241] 信息800指示關于通過劃分當前編碼單元的預測單元而獲得的分區的形狀的信 息,其中,所述分區是用于對當前編碼單元進行預測編碼的數據單元。例如,具有尺寸2NX 2N的當前編碼單元CU_0可被劃分為如下分區中的任何一個:具有尺寸2NX2N的分區802、具 有尺寸2NXN的分區804、具有尺寸NX 2N的分區806以及具有尺寸NXN的分區808。
[0242]信息810指示每個分區的預測模式。例如,信息810可指示對由信息800指示的分區 執行的預測編碼的模式(即,幀內模式812、幀間模式814或跳過模式816)。
[0243] 信息820指示當對當前編碼單元執行變換時將被基于的變換單元。例如,變換單元 可以是第一幀內變換單元822、第二幀內變換單元824、第一幀間變換單元826或第二幀內變 換單元828。
[0244] 視頻解碼設備200的圖像數據和編碼信息提取器220可根據每個較深層編碼單元 來提取并使用用于解碼的信息800、810和820。
[0245] 信息800可包括如關于根據實施例的編碼模式的信息的分區信息。例如,信息800 可包括基于第一分區模式信息、分區等級和第二分區模式信息確定的分區類型。
[0246] 圖16是根據本發明的實施例的根據深度的較深層編碼單元的示圖。
[0247] 劃分信息可用于指示深度的改變。劃分信息指示當前深度的編碼單元是否被劃分 為更低深度的多個編碼單元。
[0248] 用于對深度0和尺寸2N_0X2N_0的編碼單元900進行預測編碼的預測單元910可包 括如下分區類型的多個分區:具有尺寸2N_0X2N_0的分區類型912、具有尺寸2N_0XN_0的 分區類型914、具有尺寸N_0X2N_0的分區類型916以及具有尺寸Ν_0ΧΝ_0的分區類型918。 盡管圖16僅示出通過對預測單元910對稱劃分而獲得的分區類型912至918,但是應該理解 分區類型不限于此,并且預測單元910的多個分區可包括多個不對稱分區、具有預定形狀的 多個分區以及具有幾何形狀的多個分區。
[0249] 根據每個分區類型對如下分區重復地執行預測編碼:具有尺寸2N_0 X 2N_0的一個 分區、具有尺寸2N_0 XN_0的兩個分區、具有尺寸N_0 X 2N_0的兩個分區以及具有尺寸N_0 X N_0的四個分區。可對具有尺寸2N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0以及N_0 X N_0的多個分 區執行幀內模式和幀間模式的預測編碼。僅對具有尺寸2N_0X2N_0的分區執行跳過模式的 預測編碼。
[0250] 包括以分區類型912至918的預測編碼的編碼誤差被比較,并且在多個分區類型中 確定最小編碼誤差。如果一編碼誤差在分區類型912至916之一中最小,則預測單元910可不 被劃分為更低深度。
[0251]如果該編碼誤差在分區類型918中最小,則在操作920,深度從0改變為1以劃分分 區類型918,并且對具有深度2和尺寸Ν_0ΧΝ_0的編碼單元930重復地執行編碼以搜索最小 編碼誤差。
[0252] 用于對具有深度1和尺寸211\211(=1〇\1〇)的編碼單元930進行預測編碼 的預測單元940可包括如下分區類型的多個分區:具有尺寸2N_1X2N_1的分區類型942、具 有尺寸2N_1 XN_1的分區類型944、具有尺寸11 X 2N_1的分區類型946以及具有尺寸N_1 X N_1的分區類型948。
[0253] 如果編碼誤差在分區類型948中最小,則在操作950,深度從1改變為2以劃分分區 類型948,并且對具有深度2和尺寸N_2XN_2的編碼單元960重復地執行編碼以搜索最小編 碼誤差。
[0254] 當最大深度是d時,可執行根據每個深度的劃分操作直到當深度變為d-Ι,并且劃 分信息可被編碼直到當深度是〇至d-2之一。換句話說,當執行編碼直到在操作970與深度d-2相應的編碼單元被劃分之后深度是d-1時,用于對具有深度d-1和尺寸2N_(d-l)X2N_(d- 1)的編碼單元980進行預測編碼的預測單元990可包括如下分區類型的多個分區:具有尺寸 2N_(d-l)X2N_(d-l)的分區類型992、具有尺寸2N_(d-l)XN_(d-l)的分區類型994、具有尺 寸N_(d-1) X 2N_(d-l)的分區類型996以及具有尺寸N_(d-1) XN_(d-1)的分區類型998。
[0255] 可對如下分區重復地執行預測編碼:分區類型992至998中的具有尺寸2N_(d_l)X 2N_(d-l)的一個分區、具有尺寸2N_(d-l) X N_(d-1)的兩個分區、具有尺寸N_(d-1) X 2N_ (d-1)的兩個分區、具有尺寸N_(d-1) XN_(d-l)的四個分區,以搜索具有最小編碼誤差的分 區類型。
[0256] 即使在分區類型998具有最小編碼誤差時,由于最大深度是d,因此具有深度d-Ι的 編碼單元CU_(d-l)不再被劃分到更低深度,并且構成當前最大編碼單元900的多個編碼單 元的編碼深度被確定為d-Ι并且當前最大編碼單元900的分區類型可被確定為N_(d-1)XN_ (d-1)。另外,由于最大深度是d并且具有最低深度d-1的最小編碼單元980不再被劃分到更 低深度,因此最小編碼單元980的劃分信息不被設置。
[0257] 數據單元999可以是當前最大編碼單元的"最小單元"。根據本發明的實施例的最 小單元可以是通過按照4劃分最小編碼單元980而獲得的矩形數據單元。通過重復地執行編 碼,視頻編碼設備100可通過根據編碼單元900的多個深度來比較多個編碼誤差來選擇具有 最小編碼誤差的深度以確定編碼深度,并且將相應分區類型以及預測模式設置為編碼深度 的編碼模式。
[0258] 同樣地,根據多個深度的多個最小編碼誤差在所有的深度1至d中被比較,并且具 有最小編碼誤差的深度可被確定為編碼深度。編碼深度、預測單元的分區類型以及預測模 式可被編碼并作為關于編碼模式的信息被發送。另外,由于編碼單元從深度〇到編碼深度被 劃分,因此僅該編碼深度的劃分信息被設置〇,除了編碼深度之外的多個深度的劃分信息被 設置為1。
[0259] 視頻解碼設備200的圖像數據和編碼信息提取器220可提取并使用關于編碼單元 900的編碼深度以及預測單元的信息以對分區912進行解碼。視頻解碼設備200可通過使用 根據多個深度的劃分信息來將劃分信息是〇的深度確定為編碼深度,并且使用關于相應深 度的編碼模式的信息用于解碼。
[0260] 圖17至圖19是用于描述根據本發明的實施例的多個編碼單元1010、多個預測單元 1060和多個變換單元1070之間的關系的示圖。
[0261] 多個編碼單元1010是最大編碼單元中的與視頻編碼設備100確定的多個編碼深度 相應的具有樹形結構的多個編碼單元。多個預測單元1060是多個編碼單元1010的每個的多 個預測單元的多個分區,多個變換單元1070是多個編碼單元1010的每個的多個變換單元。
[0262] 當在多個編碼單元1010中最大編碼單元的深度是0時,多個編碼單元1012和1054 的深度是1,多個編碼單元1014、1016、1018、1028、1050和1052的深度是2,多個編碼單元 1020、1022、1024、1026、1030、1032 和 1048 的深度是 3,多個編碼單元 1040、1042、1044和 1046 的深度是4。
[0263] 在多個預測單元 1060 中,一些編碼單元 1014、1046、1022、1032、1048、1050、1052 和 1054通過劃分多個編碼單元1010的編碼單元而獲得。換句話說,多個編碼單元1014、1022、 1050和1054中的多個分區類型具有尺寸2NXN,多個編碼單元1016、1048和1052中的多個分 區類型具有尺寸NX2N,編碼單元1032的分區類型具有尺寸NXN。編碼單元1010的多個預測 單元和多個分區小于或等于每個編碼單元。
[0264] 以小于編碼單元1052的數據單元對多個變換單元1070中的編碼單元1052的圖像 數據執行變換或反變換。另外,多個變換單元1070的多個編碼單元1014、1016、1022、1032、 1048、1050和1052在尺寸和形狀上與多個預測單元1060的多個編碼單元1014、1016、1022、 1032、1048、1050和1052不同。換句話說,視頻編碼設備100和視頻解碼設備200可對相同編 碼單元中的數據單元獨立地執行幀內預測、運動估計、運動補償、變換和反變換。
[0265] 因此,對最大編碼單元的每個區域中的具有分層結構的多個編碼單元中的每個執 行遞歸編碼,以確定最佳編碼單元,因此可獲得具有遞歸樹形結構的多個編碼單元。編碼信 息可包括關于編碼單元的劃分信息、關于分區類型的信息、關于預測模式的信息以及關于 變換單元的尺寸的信息。表2顯示可由視頻編碼設備100和視頻解碼設備200設置的編碼信 息。
[0266] 表 2
[0269]視頻編碼設備100的輸出單元130可輸出關于具有樹形結構的多個編碼單元的編 碼信息,并且視頻解碼設備200的圖像數據和編碼信息提取器220可從接收的比特流提取關 于具有樹形結構的多個編碼單元的編碼信息。
[0270]劃分信息指示當前編碼單元是否被劃分為更低深度的多個編碼單元。如果當前深 度d的劃分信息是0,則當前編碼單元不再被劃分為更低深度的深度是編碼深度,因此可針 對編碼深度定義關于分區類型、預測模式以及變換單元的尺寸的信息。如果當前編碼單元 根據劃分信息被進一步劃分,則對更低深度的四個劃分編碼單元獨立地執行編碼。
[0271 ]預測模式可以是幀內模式、幀間模式和跳過模式中的一個。可在所有分區類型中 定義幀內模式和幀間模式,并且可在僅具有尺寸2N X 2N的分區類型定義跳過模式。
[0272] 關于分區類型的信息可指示通過對稱地劃分預測單元的高度或寬度而獲得的具 有尺寸2N X 2N、2N X N、N X 2N和N X N的多個對稱分區類型、以及通過不對稱地劃分預測單元 的高度或寬度而獲得的具有尺寸2N X nU、2N X nD、nL X 2N和nR X 2N的多個不對稱分區類型。 可通過以1:3和3:1劃分預測單元的高度來分別地獲得具有尺寸2NXnU和2NXnD的多個不 對稱分區類型,可通過以1:3和3:1劃分預測單元的寬度來分別地獲得具有尺寸nL X 2N和nR X2N的多個不對稱分區類型。
[0273] 參照圖4的具有樹形結構的多個分區,具有尺寸2NXnU和2NXnD的不對稱分區類 型可相應于分區等級為1的第一分區模式1的分區集合51a和51b,并且具有尺寸nLX2N和nR X2N的不對稱分區類型可相應于分區等級為1的第一分區模式2的分區集合52a和52b。變換 單元的尺寸可被設置為幀內模式中的兩種類型以及幀間模式中的兩種類型。換句話說,如 果變換單元的劃分信息是0,則變換單元的尺寸可以是作為當前編碼單元的尺寸的2NX2N。 如果變換單元的劃分信息是1,則可通過劃分當前編碼單元來獲得多個變換單元。另外,如 果具有尺寸2NX2N的當前編碼單元的分區類型是對稱分區類型,則變換單元的尺寸可以是 NXN,如果當前編碼單元的分區類型是不對稱分區類型,則變換單元的尺寸可以是N/2XN/ 2〇
[0274] 關于具有樹形結構的多個編碼單元的編碼信息可包括以下與編碼深度相應的編 碼單元、預測單元以及最小單元中的至少一個。與編碼深度相應的編碼單元可包括:包含相 同編碼信息的預測單元和最小單元中的至少一個。
[0275] 因此,通過對多個相鄰數據單元的編碼單元進行比較,來確定多個相鄰單元是否 被包括在與編碼深度相應的相同的編碼單元中。另外,通過使用數據單元的編碼信息來確 定與編碼深度相應的相應編碼單元,因此最大編碼單元中的多個編碼深度的分布可被確 定。
[0276] 因此,如果基于多個相鄰數據單元的編碼信息預測當前編碼單元,則與當前編碼 單元相鄰的多個較深層編碼單元中的多個數據單元的編碼信息可被直接參考和使用。
[0277] 可選擇地,如果基于多個相鄰數據單元的編碼信息來預測當前編碼單元,則使用 多個數據單元的編碼信息來搜索與當前編碼單元相鄰的多個數據單元,并且搜索到的多個 相鄰編碼單元可被參考以用于預測當前編碼單元。
[0278] 圖20是用于描述根據表2的編碼模式信息的編碼單元、預測單元或分區、和變換單 元之間的關系的示圖。
[0279] 最大編碼單元1300包括多個編碼深度的多個編碼單元1302、1304、1306、1312、 1314、1316和1318。這里,由于編碼單元1318是編碼深度的編碼單元,因此劃分信息可被設 置為0。關于尺寸2NX2N的編碼單元1318的分區類型的信息可被設置為以下分區類型之一: 具有尺寸2NX2N的分區類型1322、具有尺寸2NXN的分區類型1324、具有尺寸NX 2N的分區 類型1326、具有尺寸NXN的分區類型1328、具有尺寸2NXnU的分區類型1332、具有尺寸2NX nD的分區類型1334、具有尺寸nLX2N的分區類型1336和具有尺寸nRX2N的分區類型1338。 [0280]這樣的分區類型可相應于圖4中示出的某些分區。例如,尺寸為2NX2N的分區類型 1322可相應于分區集合1324(分區等級為0的第一分區模式0)。具有尺寸為2NXN的分區類 型1324和具有尺寸NX2N的分區類型1326可分別相應于分區集合41和42(分別為分區等級 為〇的第一分區模式1和2)。具有尺寸NXN的分區類型1328可相應于分區集合43(分區等級 為〇的第一分區模式3)。具有尺寸2NXnU的分區類型1332和具有尺寸為2NXnD的分區類型 1334可分別相應于分區集合51a和51b(兩者為分區等級為1的第一分區模式1)。具有尺寸為 nLX2N的分區類型1336和具有尺寸為nRX2N的分區類型1338可分別相應于分區集合52a和 52b(兩者為分區等級為1的第一分區模式2)。變換單元的劃分信息(TU尺寸標志)是變換索 引之一,并且與變換索引相應的變換單元的尺寸可根據編碼單元的預測單元類型或編碼單 元的分區類型變化。
[0281] 例如,當分區類型被設置為對稱(即,分區類型1322、1324、1326或1328)時,如果變 換單元的TU尺寸標志為0,則設置具有尺寸2N X 2N的變換單元1342,如果TU尺寸標志為1,則 設置具有尺寸NXN的變換單元1344。
[0282] 當分區類型被設置為不對稱(即,分區類型1332、1334、1336或1338)時,如果TU尺 寸標志為0,則設置具有尺寸2N X 2N的變換單元1352,如果TU尺寸標志為1,則設置具有尺寸 N/2XN/2的變換單元1354。
[0283] 以上參照圖18描述的TU尺寸標志是具有值0或1的標志,但TU尺寸標志不限于1比 特,并且在TU尺寸標志從0增加的同時,變換單元可被分層劃分為具有樹形結構。變換單元 的尺寸標志可被用為變換索引的實施例。
[0284] 在這種情況下,根據本發明的實施例,可通過使用變換單元的TU尺寸標志以及變 換單元的最大尺寸和最小尺寸來表示實際上已使用的變換單元的尺寸。根據本發明的實施 例,視頻編碼設備1〇〇能夠對最大變換單元尺寸信息、最小變換單元尺寸信息和最大TU尺寸 標志進行編碼。對最大變換單元尺寸信息、最小變換單元尺寸信息和最大TU尺寸標志進行 編碼的結果可被插入SPS。根據本發明的實施例,視頻解碼設備200可通過使用最大變換單 元尺寸信息、最小變換單元尺寸信息和最大TU尺寸標志來對視頻進行解碼。
[0285] 例如,如果當前編碼單元的尺寸是64 X 64并且最大變換單元尺寸是32 X 32,則當 TU尺寸標志為0時,變換單元的尺寸可以是32X32,當TU尺寸標志為1時,變換單元的尺寸可 以是16 X 16,當TU尺寸標志為2時,變換單元的尺寸可以是8 X 8。
[0286] 作為另一示例,如果當前編碼單元的尺寸是32 X 32并且最小變換單元尺寸是32 X 32,則當TU尺寸標志為0時,變換單元的尺寸可以是32X32。這里,由于變換單元的尺寸不能 夠小于32 X 32,因此TU尺寸標志不能夠被設置為除了0以外的值。
[0287] 作為另一示例,如果當前編碼單元的尺寸是64 X 64并且最大TU尺寸標志為1,則TU 尺寸標志可以是0或1。這里,TU尺寸標志不能被設置為除了 0或1以外的值。
[0288] 因此,如果定義在T U尺寸標志為0時最大T U尺寸標志為 "MaxTransformSizelndex",最小變換單元尺寸為"MinTransformSize",并且變換單元尺寸 為"RootTuSize",則可通過等式(1)來定義可在當前編碼單元中確定的當前最小變換單元 尺寸 "CurrMinTuSize" :
[0289] CurrMinTuSize=max(MinTransformSize ,RootTuSize / (2Λ MaxTransformSizelndex))
[0290] ……(1)
[0291 ]與可在當前編碼單元中確定的當前最小變換單元尺寸"CurrMinTuSize"相比,當 TU尺寸標志為0時的變換單元尺寸"RootTuSize"可表示可在系統中選擇的最大變換單元尺 寸。在等式(1)中,"RootTuSize/(2AMaxTransformSizeIndex)"表示當TU尺寸標志為0時, 變換單元尺寸"RootTuSize"被劃分了與最大TU尺寸標志相應的次數時的變換單元尺寸,并 且 "MinTransformSize" 表示最小變換尺寸。因此,"RootTuSize / (2Λ MaxTransformSizelndex)"和"MinTransformSize "中較小的值可以是可在當前編碼單元中 確定的當前最小變換單元尺寸"CurrMinTuSize"。
[0292] 根據本發明的實施例,最大變換單元尺寸"RootTuSize"可根據預測模式的類型而 改變。
[0293] 例如,如果當前預測模式是幀間模式,則可通過使用以下的等式(2)來確定 "RootTuSize"。在等式(2)中,"MaxTransformSize"表示最大變換單元尺寸,"PUSize"指示 當前預測單元尺寸。
[0294] RootTuSize=min(MaxTransformSize ,PUSize)......(2)
[0295] 也就是說,如果當前預測模式是幀間模式,則當TU尺寸標志為0時的變換單元尺寸 "RootTuSize"可以是最大變換單元尺寸和當前預測單元尺寸中較小的值。
[0296] 如果當前分區單元的預測模式是幀內模式,則可通過使用以下的等式(3)來確定 "RootTuSize"。在等式(3)中,"PartitionSize"表示當前分區單元的尺寸。
[0297] RootTuSize=min(MaxTransformSize ,PartitionSize)......(3)
[0298] 也就是說,如果當前預測模式是幀內模式,則當TU尺寸標志為0時的變換單元尺寸 "RootTuSize"可以是最大變換單元尺寸和當前分區單元的尺寸中較小的值。
[0299] 然而,根據分區單元中的預測模式的類型而改變的當前最大變換單元尺寸 "RootTuSize"僅是示例,并且本發明不限于此。
[0300] 以上參照圖10至圖20描述的預測單元或分區僅被用作圖4的多個分區的樹形結構 50中的分區等級為0的分區模式0、1、2和3的多個分區和分區等級為1的第一分區模式1和2 的多個分區。根據系統環境和設置,分區等級和第一分區模式的上限可被選擇性地限制。因 為在圖10至圖20示出的分區等級和第一分區模式僅是一個實施例,所以本發明的構思不限 于此。
[0301] 圖21是根據本發明的實施例的使用用于基于具有樹形結構的編碼單元進行預測 編碼的可變分區的視頻編碼方法的流程圖。
[0302]在操作1210,視頻的當前畫面可被劃分為多個最大編碼單元。在操作1220,以較深 層編碼單元為單位對當前畫面的每個最大編碼單元的圖像數據進行編碼。可按照編碼單元 為單位執行預測編碼,因此可確定具有最高預測編碼效率的分區或預測單元,其中,所述預 測編碼使用基于第一分區模式和分區等級的具有樹形結構的分區。在包括預測誤差的同時 具有最高編碼效率的深度可被選擇為編碼深度,具有被確定為編碼深度并具有樹形結構的 編碼單元可被確定。
[0303] 在操作1230,每個最大編碼單元的殘差數據和運動矢量可基于具有樹形結構、預 測單元或分區的編碼單元被編碼。用于確定預測單元的包括第一分區模式、分區等級等的 分區信息可與關于編碼深度、預測模式和編碼模式一起被編碼,并可被輸出為編碼信息。
[0304] 圖22是根據本發明的實施例的使用用于基于具有樹形結構的編碼單元進行預測 編碼的可變分區的視頻解碼方法的流程圖。
[0305]在操作1310,編碼的視頻的比特流被接收和解析。在操作1320,根據具有樹形結構 的編碼單元從解析的比特流提取關于每個最大編碼單元的編碼深度和編碼模式的信息。可 提取關于編碼深度和編碼模式的信息中的根據實施例的分區信息。所述分區信息可包括第 一分區模式和分區等級,并還可包括根據第一分區模式的第二分區模式。可以以預測單元 為單位提取編碼的殘差數據和運動矢量。
[0306] 在操作1330,可以以最大編碼單元為單位基于關于編碼深度和編碼模式的信息確 定具有樹形結構的編碼單元,可基于分區信息確定預測單元和分區,并且可對預測單元和 分區執行預測編碼。可基于包括在分區信息中的第一分區信息和分區等級確定預測單元和 分區的形狀、劃分方向性和尺寸,其中,編碼單元被劃分為所述預測單元和分區。可通過使 用預測模式信息和運動矢量對每個預測單元的殘差數據和每個分區進行解碼來恢復畫面。
[0307] 視頻編碼設備100可基于具有樹形結構編碼單元的可變尺寸對具有樹形結構的多 種尺寸、多種形狀和多種預測模式的預測單元(分區)執行預測編碼,對預測編碼的結果進 行相互比較,從而確定具有最高編碼效率的預測單元(分區)。因此,考慮根據編碼單元的尺 寸變化的編碼單元之內的圖像的特性進行預測編碼是可能的。
[0308] 另外,由于關于確定用于預測編碼的預測單元的因素的信息被編碼和發送,因此 視頻解碼設備200可保證準確的恢復。
[0309] 本發明的實施例可被寫成計算機程序并可被實施在使用計算機可讀記錄介質執 行程序的通用數字計算機中。計算機可讀記錄介質的示例包括磁性存儲介質(例如,R0M、軟 盤、硬盤等)和光記錄介質(例如,CD-ROM或DVD)。
[0310]雖然已參照本發明的優選實施例特別地示出并描述了本發明,但本領域的普通技 術人員將理解,在不脫離由權利要求限定的本發明的精神和范圍的情況下,可對本發明在 形式和細節上做出各種改變。優選實施例應被視為僅是描述性的,而不是為了限制。因此, 本發明的范圍由權利要求限定而不由本發明的詳細描述限定,并且在所述范圍之內的所有 不同應被理解為被包括在本發明中。
【主權項】
1. 一種對視頻進行解碼的設備,所述設備包括: 接收器,被配置用于接收包括畫面的數據、關于最大編碼單元的尺寸的信息和劃分信 息的比特流;以及 處理器,被配置用于使用關于最大編碼單元的尺寸的信息將畫面劃分為多個最大編碼 單元,基于劃分信息將最大編碼單元分層劃分為多個編碼單元,使用分區類型信息確定一 個或更多個編碼單元中的編碼單元中的一個或更多個預測單元,并對所述編碼單元中的所 述一個或更多個預測單元中的預測單元執行預測以產生重建的編碼單元,其中,分區類型 信息基于編碼單元的尺寸而被確定。2. 如權利要求1所述的設備, 其中,處理器被配置用于根據劃分信息將最大編碼單元分層劃分為包括當前深度和更 低深度中的至少一個深度的深度的多個編碼單元。3. 如權利要求1所述的設備,當劃分信息指示對當前深度進行劃分時,當前深度的編碼 單元獨立于鄰近編碼單元而被劃分為更低深度的四個矩形編碼單元,當劃分信息指示不對 當前深度進行劃分時,所述一個或更多個預測單元從當前深度的編碼單元而被獲得。
【文檔編號】H04N19/119GK106028048SQ201610656814
【公開日】2016年10月12日
【申請日】2011年1月14日
【發明人】李昌炫, 李泰美, 陳建樂, 趙大星, 韓宇鎮, 金壹求
【申請人】三星電子株式會社