專利名稱:利用層間相關性編碼層內標記的方法、及解碼方法和設備的制作方法
技術領域:
符合本發明的方法和設備涉及視頻壓縮,并更具體地,涉及在基于多層的編解碼器中利用層間相關性對標記的有效編碼。
背景技術:
隨著信息和通信技術的發展,除了文本和語音通信之外,多媒體通信正在增長。現有的以文本為中心的通信系統不足以滿足客戶的各種需求,并由此,可容納各種形式信息(例如文本、圖像、音樂、和其它)的多媒體服務正在增長。由于多媒體數據很大,所以需要大容量存儲介質和寬帶寬來存儲和發送多媒體數據。因此,需要壓縮編碼技術來發送多媒體數據。
數據壓縮的基本原理是去除數據冗余。可通過去除例如圖像中同一顏色或對象的重復的空間冗余、例如活動圖像中的相似相鄰幀或聲音的連續重復的時間冗余、和考慮到人對高頻的敏感度的可視/知覺冗余,而壓縮數據。
在一般視頻編碼方法中,通過基于運動補償的時間濾波而去除時間冗余,并通過空間變換而去除空間冗余。
其中去除了冗余的結果數據在量化處理中根據特定量化操作被有損耗編碼。量化結果最終通過熵編碼被無損耗編碼。
如在聯合視頻組(JVT)已正式發布的當前可伸縮視頻編碼草案(下面稱為SVC草案)中提出的,正對基于現有H.264標準實現多層視頻編解碼器進行研究,其中該聯合視頻組是國際標準化組織/國際電工委員會(ISO/IEC)和國際電信聯盟(ITU)的視頻專家組。
圖1圖示了利用多層結構的可伸縮視頻編碼結構。在該視頻編碼結構中,第一層被設置為15Hz(幀頻)的四分之一公共中間格式(Quarter CommonIntermediate FormatQCIF),第二層被設置為30Hz的公共中間格式(CIF),而第三層被設置為60Hz的標準定義(SD)。如果需要CIF的0.5Mbps的流,那么該比特流可被截短,使得在具有CIF、幀頻30Hz、和比特率0.7Mbps的第二層中的比特率為0.5Mbps。以這種方式,可實現空間、時間和信噪比(SNR)可伸縮性。由于在各層之間存在一些相似性,所以,在對相應層進行編碼時,經常使用用于利用來自另一層的預測信息來提高某一層(例如紋理數據、運動數據等)的編碼效率的方法。
另一方面,在可伸縮視頻編碼中,存在與是否使用層間信息相關的各種標記,該標記可以由碼片(slice)、宏塊、子塊、或者甚至系數來設置。因此,在視頻編碼中,不能忽視由這些標記增加的開銷。
然而,現在,與紋理數據或運動數據不同,在不考慮層間相關性的情況下,標記還沒有被單獨編碼或從未被編碼。
發明內容
本發明的示例性非限制性的實施例克服了上述缺點和上面未描述的其他缺點。而且,不要求本發明克服上述缺點,并且本發明的示例性非限制性的實施例可以不克服任何上述問題。
本發明提供了一種用于基于層間相關性而有效編碼在基于多層的可伸縮視頻編解碼器中使用的各種標記的方法和設備。
根據本發明的一個方面,提供了一種利用與基本層的對應標記的相關性而對在基于多層的視頻中使用的當前層的標記進行編碼的方法,該方法包括判斷在指定單元區域中包括的當前層的標記是否全部等于基本層的標記;根據該判斷結果而設置預測標記;和如果判斷當前層的標記等于基本層的標記,則跳過當前層的標記,并將基本層的標記和預測標記插入到比特流中。
根據本發明的另一方面,提供了一種利用與基本層的對應標記的相關性而對在基于多層的視頻中使用的當前層的標記進行編碼的方法,該方法包括獲得當前層的標記和基本層的標記的異或值;對獲得的異或值執行熵編碼;和將熵編碼的結果和基本層的標記插入到比特流中。
根據本發明的另一方面,提供了一種在基于多層的視頻中利用與基本層的標記的相關性而對編碼后的當前層的標記進行解碼的方法,該方法包括從輸入比特流中讀取預測標記和基本層標記;如果預測標記具有第一比特值,則在預測標記所被分配到的特定單元區域中,用所讀取的基本層的標記替換當前層的標記;和輸出所替換的當前層的標記。
根據本發明的另一方面,提供了一種在基于多層的視頻中利用與基本層的標記的相關性而對編碼后的當前層的標記進行解碼的方法,該方法包括從輸入比特流中讀取基本層的標記和編碼后的當前層的標記;對編碼后的當前層的標記進行熵解碼;對熵解碼的結果和所讀取的基本層的標記執行異或運算;和輸出異或運算的結果。
通過結合附圖對示范實施例的以下詳細描述,本發明的以上和其它方面將變得更明顯,其中圖1是圖示了利用多層結構的可伸縮視頻編碼結構的圖;圖2是圖示了包括離散層和至少一個FGS層的FGS編碼結構的圖;圖3是解釋在可伸縮視頻編碼中提供的三種預測技術的概念視圖;圖4是圖示了根據本發明示范實施例的標記編碼設備的構造的方框圖;圖5是圖示了細分(refinement)系數的例子的圖;圖6是圖示了根據本發明示范實施例的標記解碼設備的構造的方框圖;圖7是圖示了根據本發明示范實施例的標記編碼方法的流程圖;圖8是圖示了根據本發明另一示范實施例的標記編碼方法的流程圖;圖9是圖示了根據本發明示范實施例的標記解碼方法的流程圖;圖10是圖示了根據本發明另一示范實施例的標記解碼方法的流程圖;圖11是圖示了可應用圖4的標記編碼設備的示范性的基于多層的視頻編碼器的構造的方框圖;和圖12是圖示了可應用圖6的標記解碼設備的示范性的基于多層的視頻解碼器的構造的方框圖。
具體實施例方式
下面,將參考附圖來詳細描述本發明的示范實施例。通過參考要結合附圖詳細描述的示范實施例,本發明的各個方面和特征以及實現這些方面和特征的方法將更明顯。然而,本發明不限于下面公開的示范實施例,而可以以各種形式實現。例如詳細構造和元件的在描述中定義的內容只是用來幫助本領域普通技術人員全面理解本發明的特定細節,并且本發明僅被限定在所附權利要求的范圍內。在本發明的整體描述中,相同的附圖標記用于各圖中的相同元件。
在第16屆JVT會議中由J Ridge和M.Karczewicz所提交的論文“Variablelength code for SVC”(JVT-P056,波茲南,第16屆JVT會議;下面稱為“JVT-P056”)中,提出了考慮可伸縮視頻編碼(SVC)特性的上下文自適應可變長度編碼(CAVLC)技術。JVT-P056在離散層中遵循與現有H.264標準相同的處理,但是在細粒度可伸縮性層(fine granular scalability layerFGS層)中使用按照統計特性的分離VLC技術。FGS層是FGS編碼中的等于或高于第二層的層,而離散層是FGS編碼中的第一層。
如圖2所示,在對組成一個離散層和至少一個FGS層的系數執行熵編碼時,使用三個掃描階段(passes),即有效(significance)階段、細分階段、和剩余階段。不同的方法根據他們的統計特性被應用到相應的掃描階段。特別是,對于細分階段,使用在熵編碼中基于值“0”優于其他值的事實而獲得的VLC表格。一般來說,對應離散層系數為“0”的FGS層系數被稱為有效系數,而對應離散層系數不為“0”的FGS層系數被稱為細分系數。該有效系數由有效階段編碼,而該細分系數由細分階段編碼。
在JVT-P056中,已提出了FGS層的VLC技術。根據該技術,在離散層中使用傳統CAVLC技術,而在FGS層中使用利用統計特性的分離技術。具體來說,在三個掃描階段中的細分階段中對細分系數進行編碼時,JVT-P056按照4個一組對細分系數的絕對值進行分組,利用VLC表格對分組的細分系數進行編碼,并與分組的細分系數分離地、對用于區分細分系數的正/負符號的符號標記進行編碼。由于為每一細分系數給出了細分系數的符號標記(除了細分系數為“0”的情況),所以由此引起的開銷增大。因此,為了降低符號標記的開銷,向該符號標記應用例如運行水平(run-level)編碼的熵編碼。然而,這是僅利用對應FGS層中的信息進行的,而沒有利用其他FGS層的信息。
然而,作為觀察各種視頻樣本的結果,可以知道第一FGS層中的細分系數的符號與離散層中的對應細分系數的符號相同。盡管如此,在對第一FGS層中的細分系數的符號標記進行編碼時僅使用對應層的信息,這還是效率很低的。
根據當前可伸縮視頻編碼草案,除了符號標記之外,在執行FGS層的熵編碼時,使用例如殘留預測標記、基本層內(intra base)標記、運動預測標記、基本模式標記等的各種標記。這些標記被包括在比特流中,并被發送到視頻解碼器側。
殘留預測標記是表示是否使用殘留預測的標記。殘留預測是可通過利用基本層的對應殘留信號預測某一層的殘留信號、而降低殘留信號的層間冗余的技術。由于基本層是為了另一層的有效編碼而提到的某一層,所以其不限于第一層,并不必意味著更低層。
是否使用殘留預測由傳遞到視頻解碼器側的殘留預測標記表明。如果該標記為“1”,則這表明使用了殘留預測,而如果該標記為“0”,則這表明沒有使用殘留預測。
基本層內標記是表明是否使用基本層內預測的標記。根據當前可伸縮視頻編碼草案,除了已在現有H.264標準中使用的層間預測(①)和層內預測(②)之外,還支持通過利用基本層圖像預測當前層的幀而降低要編碼的數據的基本層內預測(③),如圖3所示。在該草案中,基本層內預測被視為一種層內預測。在該層內預測中,如果該基本層內標記為“0”,則其表明傳統層內預測,而如果該基本層內標記為“1”,則其表明基本層內預測。
運動預測標記是這樣的標記,其表明在通過預測當前層的運動向量獲得運動向量差(MVD)的過程中、是使用了同一層的另一運動向量還是使用了基本層的運動向量。如果該標記為“1”,則表明使用了基本層的運動向量,而如果該標記為“0”,則表明使用了同一層的另一運動向量。
基本模式標記是這樣的標記,其表明在表明當前層的運動信息的過程中、是否使用了基本層的運動信息。如果基本模式標記為“1”,則基本層自己的運動信息被用作當前層的運動信息,或者使用基本層的以某種方式細分的運動信息。如果基本模式標記為“0”,則其表明當前層的運動信息被單獨恢復和記錄,而與基本層的運動信息無關。運動信息包括宏塊類型mb_type、層間預測期間的畫面參考方向(即前向、后向、和雙向)、和運動向量。
上述標記稍微具有相應層之間的相關性。也就是說,很可能當前層的標記與基本層的對應標記具有相同的值。而且,在典型的熵編碼中,隨著在要編碼的值中包括的值“0”的數目的變大,可改進壓縮效率,這是公知的。這是因為在熵編碼中,一串值“0”被處理為一個游程(run),或參考偏置到“0”的表格而被處理。考慮到這些因素,通過在基本層的標記與當前層的對應標記相等的情況下將標記設置為“0”、否則將標記設置為“1”,可改進執行熵編碼時的壓縮效率。
圖4是圖示了根據本發明示范實施例的標記編碼設備的構造的方框圖。該標記編碼設備100可包括標記讀出單元110、預測標記設置單元120、運算單元130、熵編碼單元140、和插入單元150。
標記讀出單元110讀取在特定存儲區中存儲的標記值。一般來說,標記值由1比特(“1”或“0”)表明,但不限于此。這些標記包括當前層的標記FC和基本層的對應標記FB。
預測標記設置單元110在特定單元區中判斷當前層的標記FC是否全部與基本層的對應標記FB相等,如果是,則將預測標記P_flag設置為“0”,否則,將預測標記P_flag設置為“1”。單元區可以是幀、碼片、宏塊、或子塊。如果單元區中包括的標記在各層中彼此相等,則可跳過當前層的標記FC,而不是被設置為“1”。在該情況下,僅較低層的標記FB和預測標記P_flag被插入到比特流中,并被發送到視頻解碼器側。
在預測標記被設置為“0”的情況下,運算單元130對當前層的標記FC和基本層的對應標記FB執行異或運算。異或運算是這樣的邏輯運算,如果兩個輸入的比特值彼此相等,則輸出“0”,而如果它們彼此不等,則輸出“1”。如果對應層的標記FC和FB很可能彼此相等,則由該運算所獲得的大多數輸出變為“0”,并由此可改進熵編碼效率。
例如,如果假設第一FGS層是當前層,則第一FGS層的每一子塊的細分系數如圖5的陰影部分所示。如果這些細分系數按照圖5的虛線箭頭(按照Z字形方式)的順序排列,則當前層的符號標記變為{10101},而基本層(即離散層)的對應符號標記變為{10100},其中正號被表示為“0”,而負號被表示為“1”。通過對一組標記執行異或運算,該運算結果變為{00001}。在該情況下,對當前層的運算結果{00001}執行熵編碼(而不是對符號標記{10101}執行熵編碼),這對于壓縮效率是有利的。
再次參考圖4,熵編碼單元140對從運算單元130輸出的運算結果執行無損耗編碼。可變長度編碼(包括CAVLC)、算術編碼(包括基于上下文的自適應二進制算術編碼)、霍夫曼編碼等可用作無損耗編碼方法。
在預測標記P_flag為“1”的情況下,插入單元150將該預測標記和基本層的標記FB插入到比特流(BS)中。相反,如果預測標記P_flag為“0”,則插入單元150將該預測標記、基本層的標記FB、和熵編碼后的運算結果RC’插入到比特流(BS)中。比特流(BS)是已由多層視頻編碼器進行有損耗編碼的數據,并且最終比特流作為插入結果被輸出。
圖6是圖示了標記解碼設備的構造的方框圖。該標記解碼設備200可包括比特流讀出單元210、預測標記讀出單元220、替換單元230、熵解碼單元240、和運算單元250。
比特流讀出單元210通過對該最終比特流進行語法分析(parsing)而提取基本層的標記FB和預測標記P_flag。如果該比特流中存在熵編碼后的運算結果RC’,則比特流讀出單元210也提取它。
預測標記讀出單元220讀取所提取的預測標記P_flag,并且如果預測標記值為“0”,則其操作運算單元250,而如果預測標記值為“1”,則其操作替換單元230。
如果預測標記讀出單元220通知該預測標記為“1”,則替換單元230用基本層的標記FB替換當前層的標記FC。因此,所輸出的基本層的標記FB和當前層的標記FC變得彼此相等。
熵解碼單元240對運算結果RC’執行無損耗解碼。該解碼操作與熵編碼單元140執行的無損耗編碼操作互逆。
如果預測標記讀出單元220通知該預測標記為“0”,則運算單元250對基本層的標記FB和無損耗編碼的結果RC執行異或運算。初始地,運算單元130通過下述等式(1)的運算而計算RC(其中,^是異或運算的標志),并且通過在等式(1)的兩側代入“^FB”,等式(1)的右側的“^FB^FB”被刪除,從而產生下述等式(2)的結果。
RC=FC^FB…(1)RC^FC=FC…(2)因此,運算單元250可通過對于RC和FB執行異或運算,而恢復當前層的標記FC。最后,標記解碼設備200的輸出變為基本層的標記FB和當前層的標記FC。
可通過在存儲器的特定區域中執行的任務、類、子例程、過程、對象、執行線程、例如程序的軟件、例如FPGA(現場可編程門陣列)或ASIC(特定用途集成電路)的硬件、或軟件和硬件的組合,而實現圖4和6的相應組成元件。這些組成元件可被包括在計算機可讀存儲介質中,或者它們的部件可分布在多個計算機中。
圖7是圖示了根據本發明示范實施例的標記編碼方法的流程圖。
首先,標記讀出單元110讀取基本層的標記FB和當前層的標記FC(S11)。然后,預測標記設置單元120判斷在單元區域中讀取的標記FB和對應標記FC是否彼此相等(S12)。
如果作為判斷結果的標記FB和FC彼此相等(操作S12中的“是”),則預測標記設置單元120將預測標記P_flag設置為“1”(S17),并且插入單元150將預測標記P_flag和FB插入到比特流中(S18)。
如果作為判斷結果的標記FB和FC彼此不相等(操作S12中的“否”),則預測標記設置單元120將預測標記P_flag設置為“0”(S13)。然后,運算單元130對FB和FC執行異或運算(S14)。在本發明的另一示范實施例中,可省略操作S14的處理(在該情況下,FC將直接被熵編碼)。
熵編碼單元140對運算結果RC執行熵編碼(S15)。最終,插入單元150將預測標記P_flag、基本層的標記FB、和熵編碼的結果RC’插入到比特流中(S16)。
圖8是圖示了根據本發明另一示范實施例的標記編碼方法的流程圖。該標記編碼方法排除了預測標記設置處理。在圖8所示方法中,執行異或運算,而不管FB和FC在單元區域中是否彼此相等。
首先,標記讀出單元110讀取基本層的標記FB和當前層的標記FC(S21)。然后,運算單元130對FB和FC執行異或運算(S22)。熵編碼單元140對運算結果RC執行熵編碼(S23)。最終,插入單元150將預測標記P_flag、基本層的標記FB、和熵編碼的結果RC’插入到比特流中(S24)。
圖9是圖示了根據本發明示范實施例的標記解碼方法的流程圖。
首先,比特流讀出單元210讀取最終比特流(BS),并提取基本層的標記FB、熵編碼后的運算結果RC’、和預測標記P_flag(S31)。然后,預測標記讀出單元220判斷所提取的預測標記P_flag是否為“0”(S32)。
如果作為判斷結果的預測標記P_flag為“1”(操作S32中的“否”),則替換單元230用所提取的基本層的標記FB替換當前層的標記FC(S35),并輸出所替換的當前層的標記FC(S36)。單元區域可對應于幀、碼片、宏塊、或子塊。
如果作為判斷結果的預測標記P_flag為“0”(操作S32中的“是”),則熵解碼單元240通過對熵編碼后的運算結果RC’進行解碼而恢復運算結果RC(S33)。該解碼運算與熵編碼運算互逆。
運算單元250通過對基本層的標記FB和無損耗編碼的結果RC執行異或運算,而恢復當前層的標記FC(S34)。然后,運算單元250輸出所恢復的當前層的標記FC(S36)。
圖10是圖示了根據本發明另一示范實施例的標記解碼方法的流程圖。該標記解碼方法排除與預測標記相關的處理。在圖10所示方法中,應用了熵解碼處理(S42)和異或運算(S43),而不考慮預測標記P_flag的值。
首先,比特流讀出單元210讀取最終比特流(BS),并提取基本層的標記FB和熵編碼后的運算結果RC’(S41)。然后,熵解碼單元240通過對熵編碼的運算結果RC’進行解碼而恢復運算結果RC(S42)。運算單元250通過對基本層的標記FB和無損耗編碼的結果RC執行異或運算而恢復當前層的標記FC(S43),并然后輸出所恢復的當前層的標記FC(S44)。
圖11是圖示了可應用圖4的標記編碼設備的基于多層的視頻編碼器的構造的方框圖。
原始視頻序列被輸入到當前層編碼器400,并(僅在各層之間的分辨率改變的情況下)由下采樣單元350進行下采樣,以輸入到基本層編碼器300。
預測單元410通過以特定方法從當前宏塊中減去預測圖像,而獲得殘留圖像。定向層內預測、層間預測、基本層內預測、和殘留預測可用作該預測方法。
變換單元420利用例如離散余弦變換(DCT)和小波變換的空間變換技術而變換所獲得的殘留信號,并生成變換系數。
量化單元430通過特定量化操作而量化該變換系數(隨著量化操作的變大,數據損耗或壓縮率也變大),并生成量化系數。
熵編碼單元440執行量化系數的無損耗編碼,并輸出當前層比特流。
標記設置單元450根據各種操作中獲得的信息而設置標記。例如,通過從預測單元410獲得的信息而設置殘留預測標記和基本層內標記,并通過從熵編碼單元440獲得的信息而設置細分系數的符號標記。如上所述設置的當前層的標記FC被輸入到標記編碼設備100。
以與當前層編碼器400相同的方式,基本層編碼器300包括預測單元310、變換單元320、量化單元330、熵編碼單元340、和標記設置單元350,它們與當前層編碼器400的組件具有相同的功能。熵編碼單元340將基本層比特流輸出到多路復用器(mux)360,而標記設置單元350將基本層標記FB提供到標記編碼設備100。
多路復用器360組合當前層比特流和基本層比特流,以生成比特流(BS),并將所生成的比特流提供到標記編碼設備100。
標記編碼設備100利用FB和FC之間的相關性而對FC進行編碼,并將所編碼的FC和FB插入到所提供的比特流中,以輸出最終比特流(最終BS)。
圖12是圖示了可應用圖6的標記解碼設備的基于多層的視頻解碼器的構造的方框圖。
輸入最終比特流(最終BS)被輸入到標記解碼設備200和解多路復用器(demux)650。解多路復用器650將最終比特流分離為當前層比特流和基本層比特流,并將當前層比特流和基本層比特流分別提供到當前層解碼器700和基本層解碼器600。
熵解碼單元710通過執行與熵編碼單元440執行的無損耗編碼對應的無損耗解碼,而恢復量化系數。
逆量化單元720通過在量化單元430中使用的量化操作而執行所恢復的量化系數的逆量化。
逆變換單元730使用例如逆DCT和逆小波變換的逆空間變換技術而對逆量化的結果執行逆變換。
逆預測單元740以相同方式獲得預測單元410所獲得的預測圖像,并通過將逆變換的結果添加到所獲得的預測圖像中而恢復視頻序列。
以與當前層解碼器700相同的方式,基本層解碼器600包括熵解碼單元610、逆量化單元620、逆變換單元630、和逆預測單元640。
另一方面,標記解碼設備200從最終比特流中提取基本層標記FB和當前層標記FC的所編碼的值,并根據FB和所編碼的值而恢復當前層標記FC。
所提取的基本層標記FB用于基本層解碼器600的組成元件610、620、630和640的對應操作,而所恢復的當前層標記FC用于當前層解碼器700的組成元件710、720、730和740的對應操作。
如上所述,根據本發明,可改進在基于多層的可伸縮視頻編解碼器中使用的各種標記的編碼效率。
已為了示意性的目的而描述了本發明的示范實施例,并且本領域普通技術人員將理解,在不脫離所附權利要求中公開的本發明的范圍和精神的情況下,各種修改、添加和替換都是可能的。所以,本發明的范圍應該由所附權利要求及其法定等同限定。
權利要求
1.一種利用與基本層的對應標記的相關性而對在基于多層的視頻中使用的當前層的標記進行編碼的方法,該方法包括確定在指定單元區域中包括的當前層的標記是否等于基本層的標記;根據該確定結果而設置預測標記;和如果確定當前層的標記等于基本層的標記,則將基本層的標記和預測標記插入到比特流中。
2.根據權利要求1的方法,還包括如果確定當前層的標記不等于基本層的標記,則對當前層的標記進行熵編碼,并將基本層的標記、預測標記、和熵編碼后的當前層的標記插入到該比特流中。
3.根據權利要求2的方法,還包括在熵編碼之前對當前層的標記和基本層的標記執行異或運算,其中所述熵編碼后的當前層的標記是通過執行異或運算而獲得的值。
4.根據權利要求1的方法,其中該單元區域對應于幀、碼片、宏塊、或子塊。
5.根據權利要求1的方法,其中當前層的標記和基本層的標記包括殘留預測標記、基本層內標記、運動預測標記、基本模式標記、和細分系數的符號標記中的至少一個。
6.根據權利要求1的方法,其中,如果確定當前層的標記等于基本層的標記,則將預測層設置為“1”,而如果確定當前層的標記不等于基本層的標記,則將預測層設置為“0”。
7.一種利用與基本層的對應標記的相關性而對在基于多層的視頻中使用的當前層的標記進行編碼的方法,該方法包括對當前層的標記和基本層的標記執行異或運算;對通過執行異或運算獲得的值進行熵編碼;和將熵編碼后的值和基本層的標記插入到比特流中。
8.根據權利要求7的方法,其中該熵編碼包括可變長度編碼、算術編碼、和霍夫曼編碼中的至少一個。
9.根據權利要求7的方法,其中當前層的標記和基本層的標記包括殘留預測標記、基本層內標記、運動預測標記、基本模式標記、和細分系數的符號標記中的至少一個。
10.一種在基于多層的視頻中利用與基本層的標記的相關性而對編碼后的當前層的標記進行解碼的方法,該方法包括從輸入比特流中讀取預測標記和基本層的標記;如果預測標記具有第一比特值,則在預測標記所被分配到的特定單元區域中,用所讀取的基本層的標記替換當前層的標記;和輸出所替換的當前層的標記。
11.根據權利要求10的方法,還包括從輸入比特流中讀取編碼后的當前層的標記;如果該預測標記具有第二比特值,則對編碼后的當前層的標記執行熵解碼;對熵解碼的結果和所讀取的基本層的標記執行異或運算;和輸出執行異或運算的結果。
12.根據權利要求11的方法,其中該熵解碼包括可變長度解碼、算術解碼、和霍夫曼解碼中的至少一個。
13.根據權利要求10的方法,其中該單元區域對應于幀、碼片、宏塊、或子塊。
14.根據權利要求10的方法,其中當前層的標記和基本層的標記包括殘留預測標記、基本層內標記、運動預測標記、基本模式標記、和細分系數的符號標記中的至少一個。
15.一種在基于多層的視頻中利用與基本層的標記的相關性而對編碼后的當前層的標記進行解碼的方法,該方法包括從輸入比特流中讀取基本層的標記和編碼后的當前層的標記;對編碼后的當前層的標記進行熵解碼;對熵解碼的結果和所讀取的基本層的標記執行異或運算;和輸出執行異或運算的結果。
16.根據權利要求15的方法,其中該熵解碼包括可變長度解碼、算術解碼、和霍夫曼解碼中的至少一個。
17.根據權利要求15的方法,其中當前層的標記和基本層的標記包括殘留預測標記、基本層內標記、運動預測標記、基本模式標記、和細分系數的符號標記中的至少一個。
18.一種利用與基本層的對應標記的相關性而對在基于多層的視頻中使用的當前層的標記進行編碼的設備,該設備包括預測標記設置單元,用于確定在指定單元區域中包括的當前層的標記是否等于基本層的標記,并根據該確定結果而設置預測標記;和插入單元,用于如果確定當前層的標記等于基本層的標記,則將基本層的標記和預測標記插入到比特流中。
19.一種利用與基本層的對應標記的相關性而對在基于多層的視頻中使用的當前層的標記進行編碼的設備,該設備包括運算單元,用于對當前層的標記和基本層的標記執行異或運算;熵編碼單元,用于對通過異或運算獲得的值執行熵編碼;和插入單元,用于將熵編碼的結果和基本層的標記插入到比特流中。
20.一種在基于多層的視頻中利用與基本層的標記的相關性而對編碼后的當前層的標記進行解碼的設備,該設備包括比特流讀出單元,用于從輸入比特流中讀取預測標記和基本層標記;和替換單元,用于如果預測標記具有第一比特值,則在預測標記所被分配到的特定單元區域中,用所讀取的基本層的標記替換當前層的標記,并輸出所替換的當前層的標記。
21.一種在基于多層的視頻中利用與基本層的標記的相關性而對編碼后的當前層的標記進行解碼的設備,該設備包括比特流讀出單元,用于從輸入比特流中讀取基本層的標記和編碼后的當前層的標記;熵解碼單元,用于對編碼后的當前層的標記執行熵解碼;運算單元,用于對熵解碼的結果和所讀取的基本層的標記執行異或運算,并輸出異或運算的結果。
全文摘要
一種基于層間相關性對在基于多層的可伸縮視頻編解碼器中使用的各種標記進行有效編碼的方法和設備。該編碼方法包括判斷在指定單元區域中包括的當前層的標記是否全部等于基本層的標記;根據該判斷結果而設置指定預測標記;和如果判斷當前層的標記等于基本層的標記,則跳過當前層的標記,并將基本層的標記和預測標記插入到比特流中。
文檔編號H04N7/50GK1976458SQ20061013625
公開日2007年6月6日 申請日期2006年10月19日 優先權日2005年10月19日
發明者李培根, 韓宇鎮 申請人:三星電子株式會社