用于視頻譯碼的并行化友好合并候選者的制作方法
【專利摘要】本發明呈現用于在運動向量預測過程的合并模式中譯碼視頻的方法和系統。一種譯碼視頻數據的方法可確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息,以及使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程。所述方法可進一步包括將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除。
【專利說明】用于視頻譯碼的并行化友好合并候選者
[0001]本申請案主張以下各申請案的權利:2011年6月20日申請的第61/499,112號美國臨時申請案、2011年10月4日申請的第61/543,043號美國臨時申請案、2011年10月4日申請的第61/543,059號美國臨時申請案、2011年11月7日申請的第61/556,761號美國臨時申請案、2011年11月21日申請的第61/562,387號美國臨時申請案,以及2011年11月22日申請的第61/562,953號美國臨時申請案,所述這些申請案在此以其全文引用的方式并入本文中。
【技術領域】
[0002]本發明涉及視頻譯碼,且更明確地說,涉及用于在運動向量預測過程中確定運動向量預測候選者的集合的技術。
【背景技術】
[0003]數字視頻能力可并入到廣泛范圍的裝置中,廣泛范圍的裝置包含數字電視、數字直播系統、無線廣播系統、個人數字助理(PDA)、膝上型或桌上型計算機、數字相機、數字記錄裝置、數字媒體播放器、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛星無線電電話、視頻電話會議裝置等等。數字視頻裝置實施視頻壓縮技術以更有效率地發射、接收及存儲數字視頻信息,視頻壓縮技術例如以下各標準中所描述的視頻壓縮技術等:由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG_4(第10部分,高級視頻譯碼(AVC))定義的標準、目前在開發中的高效率視頻譯碼(HEVC)標準,以及此類標準的擴展。
[0004]視頻壓縮技術包含空間預測和/或時間預測以減少或去除視頻序列中固有的冗余。對于基于塊的視頻譯碼,可將視頻幀或切片分割成多個塊。可進一步分割每一塊。經幀內譯碼(I)幀或切片中的塊是使用相對于同一幀或切片中的相鄰塊中的參考樣本的空間預測來編碼。經幀間譯碼(P或B)幀或切片中的塊可使用相對于同一幀或切片中的相鄰塊中的參考樣本的空間預測或相對于其它參考幀中的參考樣本的時間預測。空間預測或時間預測導致對塊的預測性塊譯碼。殘余數據表示待譯碼的原始塊與預測性塊之間的像素差。
[0005]經幀間譯碼塊是根據指向形成預測性塊的參考樣本的塊的運動向量以及指示經譯碼塊中的像素值與預測性塊中的參考樣本之間的差的殘余數據來編碼。經幀內譯碼塊是根據幀內譯碼模式和殘余數據來編碼。為了進一步壓縮,可將殘余數據從像素域變換到變換域,從而產生接著可進行量化的殘余變換系數。可以特定次序來掃描最初以二維陣列布置的經量化的變換系數以產生變換系數的一維向量以用于進行熵譯碼。
【發明內容】
[0006]一股來說,本發明描述用于譯碼視頻數據的技術。本發明描述用于在合并模式運動向量預測過程中確定合并候選者的集合的技術。
[0007]在一些實例中,本發明提議產生用于譯碼單元的當前預測單元的合并候選者集合,而不比較任何合并候選者的運動信息與同一譯碼單元中的任何其它預測單元的運動信息。以此方式,可并行地產生用于譯碼單元的多個預測單元的合并候選者集合,這是因為特定合并候選者的產生并不依賴于與可能已經確定或可能尚未確定的其它預測單元中的運動向量信息的比較。
[0008]本發明進一步提議將包括在同一譯碼單元的另一預測單元內的合并候選者從用于當前預測單元的合并候選者集合中去除。以此方式,一個譯碼單元的所有預測單元將使用相同運動向量信息的可能性有限,從而保留了將譯碼單元分割成多個預測單元的優點。
[0009]在本發明的一個實例中,一種譯碼視頻數據的方法包括確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息,以及使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程。所述方法可進一步包括將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除。
[0010]在本發明的另一實例中,一種經配置以譯碼視頻數據的設備包括視頻譯碼器,所述視頻譯碼器經配置以確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息,以及使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程。所述視頻譯碼器可經進一步配置以將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中去除。
[0011]在本發明的另一實例中,一種經配置以譯碼視頻數據的設備包括用于確定用于當前譯碼單元的當前預測單元的合并候選者集合的裝置,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息,以及用于使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程的裝置。所述設備可進一步包括用于將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除的裝置。
[0012]在本發明的另一實例中,提議一種計算機可讀存儲媒體,其具有存儲于其上的指令,所述指令在經執行時致使經配置以譯碼視頻數據的一個或一個以上處理器進行操作。所述指令可致使所述一個或一個以上處理器確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息,以及使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程。所述指令可進一步致使所述一個或一個以上處理器將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中去除。
[0013]在隨附圖式和下文描述中闡述一個或一個以上實例的細節。其它特征、目標和優點將從所述描述和圖式以及從權利要求書顯而易見。
【專利附圖】
【附圖說明】
[0014]圖1為說明用于根據合并模式的運動向量預測的候選塊的概念圖式。
[0015]圖2為說明實例分割類型的概念圖式。
[0016]圖3A為說明用于譯碼單元的NX2N分割的合并模式運動向量預測的候選塊的概念圖。[0017]圖3B為說明用于譯碼單元的2NXN分割的合并模式運動向量預測的候選塊的概 念圖。
[0018]圖4A為說明用于譯碼單元的NXN分割的合并模式運動向量預測的候選塊的概念 圖。
[0019]圖4B為說明用于譯碼單元的NXN分割的合并模式運動向量預測的候選塊的另一 實例的概念圖。
[0020]圖5為說明實例視頻譯碼系統的框圖。
[0021]圖6為說明實例視頻編碼器的框圖。
[0022]圖7為說明實例視頻解碼器的框圖。
[0023]圖8為說明根據本發明的技術的編碼視頻的實例方法的流程圖。
[0024]圖9為說明根據本發明的技術的解碼視頻的實例方法的流程圖。
【具體實施方式】
[0025]一股來說,本發明描述用于譯碼視頻數據的技術。本發明描述用于在合并模式運 動向量預測過程中確定合并候選者集合的技術。
[0026]數字視頻裝置實施視頻壓縮技術以更有效率地編碼及解碼數字視頻信息。視頻壓 縮可應用空間(幀內)預測和/或時間(幀間)預測技術以減少或去除視頻序列中固有的 冗余。
[0027]存在新的視頻譯碼標準,S卩,高效率視頻譯碼(HEVC),其是由ITU-T視頻譯碼專家 組(VCEG)和IS0/IEC運動圖片專家組(MPEG)的視頻譯碼聯合合作小組(JCT-VC)開發。 HEVC標準的新近草案(其被稱作“HEVC工作草案6”或“WD6”)描述于Brass等人的以下 文檔JCTVC-H1003中:“高效率視頻譯碼(HEVC)文本規范草案6”,ITU-T SG16WP3和ISO/ IEC JTC1/SC29/WG11的視頻譯碼聯合合作小組(JCT-VC),第8次會議:美國加利福尼亞圣 何塞,2012年2月,所述文檔從2012年6月I日起可從http://phenix.1nt-evry.fr/jct/ doc_end_user/documents/8_San% 20Jose/wglI/JCTVC-H1003-v22.zip 下載。
[0028]對于根據當前正由視頻譯碼聯合合作小組(JCT-VC)開發的高效率視頻譯碼 (HEVC)標準的視頻譯碼,可將視頻幀分割成多個譯碼單元。譯碼單元(CU) —股是指用作對 其應用各種譯碼工具以實現視頻壓縮的基本單元的圖像區。CU通常具有可表示為Y的明度 分量,以及可表示為U和V的兩個色度分量。取決于視頻取樣格式,依據樣本的數目來計的 U和V分量的大小可與Y分量的大小相同或不同。CU通常為方形,且可被視為類似于(例 如)例如ITU-T H.264等其它視頻譯碼標準下的所謂的宏塊。
[0029]為了實現更好的譯碼效率,譯碼單元可具有取決于視頻內容的可變大小。另外,可 將譯碼單元分裂成多個較小塊以用于預測或變換。明確地說,可將每一譯碼單元進一步分 割成多個預測單元(PU)和變換單元(TU)。預測單元可被視為類似于例如H.264等其它視 頻譯碼標準下的所謂的分割。變換單元(TU)是指對其應用變換以產生變換系數的殘余數 據塊。
[0030]為了說明的目的,將在本申請案中描述根據在開發中的HEVC標準的目前所提議 的方面中的一些方面的譯碼。然而,本發明中所描述的技術可用于其它視頻譯碼過程,例如 根據H.264或其它標準定義的視頻譯碼過程或專有視頻譯碼過程等。[0031]HEVC標準化努力是基于被稱作HEVC測試模型(HM)的視頻譯碼裝置的模型。HM假定視頻譯碼裝置優于根據(例如)ITU-T H.264/AVC的裝置的若干能力。舉例來說,鑒于H.264提供九個幀內預測編碼模式,HM提供多達三十四個幀內預測編碼模式。
[0032]根據HM,⑶可包含一個或一個以上預測單元(PU)和/或一個或一個以上變換單元(TU)。位流內的語法數據可定義最大譯碼單元(LCU),其為依據像素的數目來計的最大CU。一股來說,除了 CU不具有大小分布以外,CU具有類似于H.264的宏塊的目的。因此,可將CU分裂成多個子CU。一股來說,本發明中對CU的參考可指圖片的最大譯碼單元或LCU的子⑶。可將IXU分裂成多個子⑶,且可將每一子⑶進一步分裂成多個子⑶。用于位流的語法數據可定義可將LCU分裂的最大次數,其被稱作CU深度。因此,位流也可定義最小譯碼單元(S⑶)。本發明也使用術語“塊”或“部分”來指⑶、PU或TU中的任一者。一股來說,“部分”可指視頻幀的任一子集。
[0033]IXU可與四叉樹數據結構相關聯。一股來說,四叉樹數據結構每一⑶包含一個節點,其中根節點對應于IXU。如果將⑶分裂成四個子⑶,那么對應于⑶的節點包含四個葉節點,所述四個葉節點中的每一者對應于所述子CU中的一者。四叉樹數據結構的每一節點可提供用于對應CU的語法數據。舉例來說,四叉樹中的節點可包含分裂旗標,所述分裂旗標指示對應于所述節點的CU是否分裂成多個子CU。可以遞歸方式定義用于CU的語法元素,且用于CU的語法元素可取決于CU是否分裂成多個子CU。如果CU未經進一步分裂,那么⑶被稱作葉⑶。
[0034]此外,葉⑶的TU也可與相應四叉樹數據結構相關聯。即,葉⑶可包含指示如何將葉CU分割成多個TU的四叉樹。本發明提及指示如何將LCU分割為CU四叉樹的四叉樹,以及指示如何將葉CU分割成多個TU作為TU四叉樹的四叉樹。TU四叉樹的根節點一股對應于葉⑶,而⑶四叉樹的根節點一股對應于IXU。未經分裂的TU四叉樹的TU被稱作葉TU。
[0035]葉⑶可包含一個或一個以上預測單元(PU)。一股來說,I3U表示對應⑶的全部或一部分,且可包含用于檢索用于PU的參考樣本的數據。舉例來說,當PU經幀間模式編碼時,PU可包含定義用于的運動向量的數據。定義運動向量的數據可描述(例如)運動向量的水平分量、運動向量的垂直分量、用于運動向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、運動向量指向的參考幀,和/或用于運動向量的參考列表(例如,列表O或列表I)。用于定義的葉CU的數據也可描述(例如)將CU分割成一個或一個以上PU。分割模式可取決于CU未經預測性地譯碼、經幀內預測模式編碼還是經幀間預測模式編碼而不同。對于幀內譯碼,可將PU視為與下文所描述的葉變換單元相同。
[0036]為了譯碼塊(例如,視頻數據的預測單元(PU)),首先導出用于塊的預測子。預測子可經由幀內(I)預測(即,空間預測)或幀間(P或B)預測(即,時間預測)來導出。因此,一些預測單元可使用相對于同一幀中的相鄰參考塊的空間預測來進行幀間譯碼(I),且其它預測單元可相對于其它幀中的參考塊進行幀間譯碼(P或B)。
[0037]在識別預測子后,便計算原始視頻數據塊與其預測子之間的差。此差也被稱為預測殘余,且是指待譯碼的塊的像素與參考塊的對應參考樣本(其可為整數精度像素或經內插的分數精度像素)之間的像素差(即,預測子)。為了實現更好的壓縮,一股例如使用離散余弦變換(DCT)、整數變換、卡南-洛伊夫(Karhunen-Loeve) (K-L)變換或其它變換來變換預測殘余(即,像素差值陣列)。[0038]使用幀間預測譯碼PU涉及計算當前塊與參考幀中的塊之間的運動向量。經由被 稱為運動估計(或運動搜索)的過程來計算運動向量。運動向量(例如)可指示當前幀中 的預測單元相對于參考幀的參考樣本的位移。參考樣本可為發現依據像素差來說緊密匹配 包含經譯碼的PU的⑶的部分的塊,像素差可通過絕對差總和(SAD)、平方差總和(SSD)或 其它差異度量來確定。參考樣本可出現于參考幀或參考切片內的任何處。在一些實例中, 可整體地或部分地來內插參考樣本,且參考樣本出現于分數像素位置處。在尋找到最好地 匹配當前部分的參考幀的一部分后,編碼器便確定用于當前部分的當前運動向量為從當前 部分到參考幀中的匹配部分的位置差(例如,從當前部分的中心到匹配部分的中心)。
[0039]在一些實例中,編碼器可在經編碼視頻位流中用信號發出用于每一部分的運動向 量。用信號發出的運動向量由解碼器使用以執行運動補償以便解碼視頻數據。然而,直接 用信號發出原始運動向量可導致較低效率的譯碼,這是因為輸送信息通常需要大量位。
[0040]在一些情況下,不是直接用信號發出原始運動向量,而是編碼器可預測用于每一 PU的運動向量。在本發明中,術語“塊”可一股地用以指⑶、PU或TU。在執行運動向量預 測過程中,編碼器可選擇針對與當前PU相同的幀中的空間上相鄰塊確定的候選運動向量 集合或針對參考幀中的經并置的PU確定的候選運動向量。編碼器可執行運動向量預測以 選擇特定候選運動向量,且在需要時,用信號發出指示選定運動向量候選者的語法元素以 減少發信號中的位速率。來自空間上相鄰塊的候選運動向量可被稱作空間MVP候選者,而 來自另一參考巾貞中經并置的塊的候選運動向量可被稱作時間MVP候選者。
[0041 ] 本發明的技術是針對運動向量預測的“合并”模式。在合并模式中,視頻編碼器通 過預測語法的位流發信號指導解碼器復制運動向量、參考索引(其在給定參考圖片列表中 識別參考幀,運動向量指向所述參考幀)以及運動預測方向(其識別參考圖片列表(列表0 或列表I),即,依據參考幀在時間上在當前幀之前還是之后)(從用于幀的當前部分的選定 候選運動向量)。此操作通過在位流中用信號發出到候選運動向量集合的索引來完成,所述 索引識別選定候選運動向量(即,特定空間MVP候選者或時間MVP候選者)。候選運動向量 集合可通過預設設置導出或從某些譯碼參數推斷出。因此,對于合并模式,預測語法可包含 識別模式(在此情況下,為“合并”模式)的旗標,以及識別選定候選運動向量的索引。在 一些情況下,候選運動向量將在參考當前PU的表示原因的中。即,候選運動向量將已經 由解碼器解碼。因而,解碼器已經接收及/或確定用于表示原因的PU的運動向量、參考索 引及運動預測方向。因而,解碼器可僅從存儲器檢索與表示原因的PU相關聯的運動向量、 參考索引及運動預測方向,且復制這些值以用于當前PU。為了在合并模式中解碼塊,解碼器 使用運動向量預測獲得預測子塊,且將殘余數據加到預測子塊以重新建構經譯碼塊。
[0042]一旦執行運動估計以確定用于當前部分的運動向量,編碼器便比較參考幀中的匹 配部分與當前部分。此比較通常涉及從當前部分中減去參考幀中的部分(其通常被稱作 “參考樣本”)且產生所謂的殘余數據,如上文所提及。殘余數據指示當前部分與參考樣本 之間的像素差值。編碼器接著將此殘余數據從空間域變換到例如頻域等變換域。通常,編 碼器對殘余數據應用離散余弦變換(DCT)以完成此變換。編碼器執行此變換以便促進殘余 數據的壓縮,這是因為所得變換系數表示不同頻率,其中大部分能量通常集中于少數低頻 系數上。
[0043]通常,所得變換系數是以實現變動長度編碼的方式分群在一起,尤其在變換系數首先經量化(舍入)的情況下。編碼器執行經量化的變換系數的此變動長度編碼且接著執 行統計無損失(或所謂的“熵”)編碼以進一步壓縮經變動長度譯碼的經量化的變換系數。
[0044]在執行無損失熵譯碼之后,編碼器產生包含經編碼視頻數據的位流。此位流在某 些情況下也包含若干預測語法元素,其指定(例如)是否執行運動向量預測、運動向量模式 以及運動向量預測子(MVP)索引(即,具有選定運動向量的候選部分的索引)。MVP索引也 可被稱作其語法元素變量名稱“mvpjdx”。
[0045]圖1展示當前在HEVC標準中提議用于在合并模式中使用的候選運動向量集合90。 合并模式使用來自以下空間和時間塊的六個合并候選者:左下方(BL)塊91、左側(L)塊 92、右上方(RA)塊93、上方(A)塊94、左上方(LA)塊95,以及時間塊(T)96。與這些塊相 關聯的候選運動向量用于在合并模式中確定運動向量預測子。
[0046]時間塊96可在不同于當前PU(例如,T2)的幀中的經并置的塊內或鄰近于不同于 當前PU108(例如,T1)的幀中經并置的塊。圖1中描繪的空間候選塊(即,BL、L、LA、A和 RA)的位置并非絕對位置,而是基于以下一股定義的相對于當前PU98的相對位置。應注意, 候選塊無需為滿足以下定義的最近的可能的塊,而是可為滿足定義的任何PU。LA候選塊95 位于定義當前PU的頂端線上方及定義當前I3U的左側線左側。L候選塊92位于定義當前PU 的左側線左側,而且位于定義當前PU的底端線上方及定義當前的頂端線下方。BL候選 塊91位于定義當前的底端線下方及定義當前的左側線左側。A候選塊94位于定義 當前I3U的頂端線上方,而且位于定義當前I3U的左側線右側及定義當前I3U的右側線左側。 RA候選塊93位于定義當前I3U的右側線右側及定義當前I3U的頂端線上方。
[0047]每一 產生多個合并候選者。即,每一 具有其自身的合并候選者集合。此情 形包含從較大⑶分割的W。圖1的實例是針對經2NX2N分割的PU(例如,方形PU)。圖2 展示具有不同分割類型的預測單元的其它實例。如圖2中所展示,2NX2N分割為方形分割。 基本上,其為來自未經分割的CU的PU。通過將方形CU劃分成兩個水平定向的I3U來作出 2NXN分割,其中PUO在PUl之上。通過將方形⑶劃分成兩個垂直定向的PU來作出NX2N 分割,其中PUO在PUl左側。通過將方形⑶劃分成四個相等大小的I3U來作出NXN分割。 在NXN分割中,PUO在⑶的左上方,PUl在⑶的右上方,PU2在⑶的左下方,且PU3在⑶ 的右下方。
[0048]圖2展示額外類型的“非方形”分割。2NXnD分割為水平定向的非方形分割類型, 其中下部I3U(PUl)具有比上部I3U(PUO)小的大小(S卩,CU大小的四分之一大小)。2NXnU 分割為水平定向的非方形分割類型,其中下部PU(I3Ul)具有比上部I3U(PUO)大的大小(即, ⑶大小的四分之三)。nLX2N分割為垂直定向的非方形分割類型,其中左側PU(PUO)具有 比右側PU(PUl)小的大小(即,⑶大小的四分之一大小)。nRX2N分割為垂直定向的非方 形分割類型,其中左側I3U(PUO)具有比右側I3U(PUl)大的大小(S卩,CU大小的四分之三)。 這些分割實例有時被稱為非對稱運動分割(AMP)。
[0049]根據所述分割類型中的一者來分割CU以提供更準確的幀間預測(時間預測)。分 別針對每一分割用信號發出運動信息。在較精細分割(例如,2NXN分割比2NX2N分割精 細)的情況下,可能有可能針對每一分割導出較好品質的預測子。另一方面,由于分別針對 每一分割用信號發出運動信息,因此在較精細分割情況下的⑶的發信號開銷也相對較高。 在實踐中,確定用于當前CU的分割類型常常是基于速率失真優化。選定的分割類型是預測準確度與發信號開銷之間的折衷。針對HEVC標準的當前提議實施技術以避免使用用于同一 CU的PU的冗余合并候選者。冗余合并候選者為具有與同一 CU中的另一 PU相同的運動信息的合并候選者。對于特定分割類型,將用于PUl (或對于NXN分割,為PU1、PU2和PU3)的合并候選者中的一者與PUO (或對于NXN分割,為PU0、PU1和PU2)的運動信息相比較以避免使用相同運動信息的整個⑶。如果⑶中的每個PU使用相同運動信息,那么結果將為2NX2N分割類型(即,無分割)的復制。因此,將否定分割CU以用于更準確的幀間預測的優點。
[0050]為了避免使用冗余合并候選者,針對HEVC的一個提議提議比較合并候選者集合中的每一合并候選者的運動信息與同一CU的其它PU的運動信息。將具有與先前經譯碼PU相同的運動信息的任何合并候選者從合并候選者集合中去除以避免使用相同運動信息的整個CU。
[0051]根據此技術,用于產生用于的合并候選者集合的過程如下:
[0052]1.檢查用于下一候選塊的運動信息
[0053]2.比較候選運動信息與同一⑶中的先前經譯碼的運動信息
[0054]3.如果候選塊的候選運動信息與先前經譯碼的運動信息相同,那么轉向步驟
I;否則,轉向步驟4
[0055]4.將候選塊添加到合并候選者集合中
[0056]5.如果檢查了所有候選塊,那么過程結束;否則,轉向步驟I
[0057]一股來說,在此過程情況下對合并候選者的限制針對2NXN、NX2N和NXN分割類型產生以下結果:
[0058]1)2NXN/NX2N情況:如果用于第二 PU(PUl)的合并候選者具有與第一 I3U(PUO)的運動信息相同的運動信息,那么將所述合并候選者設定為不可用。
[0059]2) NXN 情況:
[0060]a.PUO和PUl具有相同運動信息。如果PU3的合并候選者具有與PU2相同的運動信息,那么將所述合并候選者設定為不可用;
[0061]b.PUO和PU2具有相同運動信息。如果PU3的合并候選者具有與PUl相同的運動信息,那么將所述合并候選者設定為不可用。
[0062]雖然此過程確實消除冗余合并候選者,但此過程需要在開發用于后續的合并候選者集合之前編碼/解碼所有PU。因而,并行地處理一個⑶的多個的能力受限制。編碼器/解碼器必須在建構用于當前PU的合并候選者集合之前確定同一 CU中的所有先前PU的最終運動信息。此外,用于每一候選塊的比較操作可增加編碼器/解碼器的計算復雜性。
[0063]在一個實例中,本發明提議在產生合并候選者集合期間去除比較檢查操作,從而使得合并候選者產生并行化友好。所揭示技術消除了對于比較候選塊與CU的其它PU之間的運動信息的需要。因而,可并行地產生用于CU的所有PU的合并候選者集合。所揭示過程也可減少編碼及解碼的計算復雜性。
[0064]針對每一 PU的所提議過程為
[0065]1.檢查下一候選塊
[0066]2.將候選塊添加到候選者集合中[0067]3.如果檢查了所有相鄰塊,那么過程結束;否則,轉向步驟I
[0068]此過程提供針對所有PU的統一解決方案,而不考慮預測單元的索引(例如,PU0,PU1)且不進行候選塊的運動信息與先前經譯碼PU的運動信息的比較。可去除上文所說明的運動信息比較步驟。盡管反復地進行描述,但此方法的步驟可并行地來執行。舉例來說,并行過程的第一線程可包含執行步驟I和步驟2的第一實例的指令,且并行過程的第二個不同線程可包含執行步驟I和步驟2的第二實例的指令。也可提供額外線程。
[0069]基于所提議技術,可將在先前內部的合并候選者包含到合并候選者集合中。然而,此情形可使得整個⑶使用相同運動信息。因而,經分割的⑶可以與2NX2N分割相同的經譯碼運動向量結束,且用于幀間預測的分割的益處可受限制。另外,在合并候選者集合中包含此類冗余候選塊可造成一些性能降低,這是因為額外位用以用信號發出冗余合并候選者。因而,本發明也提議:在合并候選者位于同一 CU的另一 內部的情況下,將合并候選者從合并候選者集合中去除。
[0070]圖3A為說明用于⑶的NX2N分割的合并模式的候選塊的概念圖。應注意,圖3A中所展示的技術同樣可適用于nLX 2N或nRX 2N非對稱分割類型。合并候選者集合100展示用于經NX2N分割的⑶的PUO的合并候選者。由于合并候選者集合100中無合并候選者在同一 CU的另一 F1U內,因此所有合并候選者可保持在合并候選者集合100中。合并候選者集合102展示用于經NX 2N分割的CU的PUl的合并候選者。如可見,對于用于PUl的合并集合102,合并候選者L來自同一 CU的PU0。因而,可將合并候選者L從合并候選者集合102中去除/排除。在此上下文中,可將經去除的合并候選者視為從合并候選者的預先定義的列表中去除的候選者。經排除的合并候選者可為在導出合并候選者列表時從合并候選者列表中排除的合并候選者,而不管所述列表是否經預先定義。一股來說,經去除/排除的合并候選者為不在最終合并候選者列表中使用的任何合并候選者。
[0071]應注意,合并候選者L不需要位于PUO中的確切位置中(例如,在PUO經進一步分割的情況下),但是在合并候選者L位于PUO的任何部分中的情況下,可排除所述合并候選者L。也應注意,合并候選者集合100和102中的每一者也具有時間合并候選者T,如圖1中所展示。
[0072]圖3B為說明用于⑶的2NXN分割的合并模式的候選塊的概念圖。應注意,圖3B中所展示的技術同樣可適用于2NXnU或2NXnD非對稱分割類型。合并候選者集合104展示用于經2NXN分割的⑶的PUO的合并候選者。由于合并候選者集合104中無合并候選者在同一 CU的另一 F1U內,因此所有合并候選者可保持在合并候選者集合104中。合并候選者集合106展示用于經2NXN分割的⑶的PUl的合并候選者。如可見的,對于用于PUl的合并集合106,合并候選者A來自同一 CU的PU0。因而,可將合并候選者A從合并候選者集合106中去除/排除。應注意,合并候選者A不需要位于PUO中的確切位置中(如所展示)(例如,在PUO經進一步分割的情況下),但是在合并候選者A位于PUO的任何部分中的情況下,可排除所述合并候選者A。也應注意,合并候選者集合104和106中的每一者也具有時間合并候選者T,如圖1中所展示。
[0073]圖4A為說明用于CU的NXN分割的合并模式的候選塊的概念圖。合并候選者集合108展示用于經NXN分割的⑶的PUO的合并候選者。由于合并候選者集合108中無合并候選者在同一 CU的另一 PU內,因此所有合并候選者可保持在合并候選者集合108中。[0074]合并候選者集合110展示用于經NXN分割的⑶的PUl的合并候選者。如可見的, 對于用于I3Ul的合并集合110,合并候選者L和BL分別來自同一⑶的PUO和PU2。因而, 可將合并候選者L和BL從合并候選者集合110中去除/排除。應注意,合并候選者L和BL 不需要位于PUO和PU2中的確切位置中(如所展示)(例如,在PUO或PU2經進一步分割的 情況下),但是在合并候選者L和/或BL位于PUO和/或PU2的任何部分中的情況下,可排 除所述合并候選者L和/或BL。
[0075]合并候選者集合112展示用于經NXN分割的⑶的PU2的合并候選者。如可見的, 對于用于的合并集合112,合并候選者A和RA分別來自同一⑶的PUO和PUl。因而, 可將合并候選者A和RA從合并候選者集合112中去除/排除。應注意,合并候選者A和RA 不需要位于PUO和PUl中的確切位置中(如所展示)(例如,在PUO或PUl經進一步分割的 情況下),但是在合并候選者A和/或RA位于PUO和/或PUl的任何部分中的情況下,可排 除所述合并候選者A和/或RA。
[0076]合并候選者集合114展示用于經NXN分割的⑶的PU3的合并候選者。如可見的, 對于用于的合并集合114,合并候選者LA、A和L分別來自同一⑶的TOO、PUl和PU2。 因而,可將合并候選者LA、A和L從合并候選者集合114中去除/排除。應注意,合并候選 者LA、A和L不需要位于TOO、PUl和PU2中的確切位置中(如所展示)(例如,在PUO、PUl 或PU2經進一步分割的情況下),但是在合并候選者LA、A和/或L位于PUO、PUl和/或 PU2的任何部分中的情況下,可排除所述合并候選者LA、A和/或L。
[0077]應注意,合并候選者集合108、110、112和114中的每一者也具有時間合并候選者 T,如圖1中所展示。
[0078]盡管上文所描述的實例僅考慮2NXN、NX 2N和NXN分割類型,但其它分割類型 (例如,AMP、幾何運動分割(GMP)等)也可受益于所揭示技術。一般來說,所提議技術確定 合并候選者集合,而不比較合并候選者的運動信息與任何其它預測單元的運動信息。此外, 如果用于當前預測單元的合并候選者集合內的合并候選者在同一譯碼單元的另一預測單 元內,那么可去除/排除所述合并候選者。
[0079]在另一實例中,對于NXN分割模式,使用每一預測單元的所有合并候選者,而不 管由另一預測單元使用的任何合并候選者。圖4B為說明用于譯碼單元之NXN分割的合 并模式的實例候選塊的概念圖,其中無合并候選者經去除/排除,而不管其在另一 PU中的 位置。如圖4B中所展示,對于TO116、PU118、PU120和PU122中的每一者使用所有候選者 (包含時間候選者T)。對于其它分割模式(例如2NXN、NX2N等)以及非對稱模式(例如 2NXnD、2NXnU、nLX2N和nRX 2N等),根據上文所描述的過程應用對于位于同一⑶的另 一 PU內部的當前PU的某些候選者的排除。
[0080]在本發明的另一實例中,在特定分割模式中的預測單元O使用并非將在2NX 2N分 割模式中使用的合并候選者的復制的合并候選者(即,在運動向量預測中實際選定的候選 者)的情況下,產生利用用于NX2N和2NXN分割模式中的預測單元I的圖1中所展示的 集合中的所有可能的合并候選者的合并候選者集合。在另一實例中,對于NXN分割模式, 使用所有合并候選者,而不管由另一預測單元使用的任何合并候選者。
[0081]根據此實例的用于產生合并候選者集合的規則如下:
[0082]1.NX2N分割模式:如果用于PUO的合并索引(即,實際選定的合并候選者)為RA、A或T,那么使用PUl的左側(L)合并候選者;否則,不使用L(與本發明的先前實例形成對 t匕,在先前實例中,對于PUl不使用L)。
[0083]2.2NXN分割模式:如果用于I3UO的合并索引為BL、L或T,那么使用PUl的上方
(A)合并候選者;否則,不使用A(與本發明的先前實例形成對比,在先前實例中,對于PUl 不使用A)。
[0084]3.NXN分割模式:將所有I3U的所有預測候選者視為有效的
[0085]在NX 2N實例中,利用用于PUl的合并候選者L并不會變成2NX 2N分割模式的復 制,這是因為用于NX 2N分割模式中的PUO的合并候選位置RA、A或T將未必用于2NX2N 分割。同樣,在2NXN實例中,利用用于PUl的合并候選者A并不會變成2NX2N分割模式 的復制,這是因為用于I3UO的合并候選者BL、L或T將未必用于2NX2N分割。
[0086]圖5為說明根據本發明的實例的可經配置以利用用于在合并模式中產生候選運 動向量的技術的實例視頻編碼及解碼系統10的框圖。如圖5中所展示,系統10包含源裝 置12,其經由通信信道16將經編碼視頻發射到目的地裝置14。經編碼視頻數據也可存儲 在存儲媒體34或文件服務器36上且可在需要時由目的地裝置14存取。當存儲到存儲媒 體或文件服務器時,視頻編碼器20可將經譯碼視頻數據提供到另一裝置,例如網絡接口、 壓縮光盤(CD)、藍光或數字視頻光盤(DVD)刻錄機或壓印設施裝置或其它裝置等,以用于 將經譯碼視頻數據存儲到存儲媒體。同樣,與視頻解碼器30分離的裝置(例如網絡接口、 CD或DVD讀取器等等)可從存儲媒體檢索經譯碼視頻數據且將所檢索的數據提供到視頻解 碼器30。
[0087]源裝置12和目的地裝置14可包括廣泛多種裝置中的任一者,廣泛多種裝置包含 移動裝置、桌上型計算機、筆記型計算機(即,膝上型計算機)、平板計算機、機頂盒、電話手 機(例如所謂的智能電話等)、電視機、相機、顯示裝置、數字媒體播放器、視頻游戲控制臺 等等。在許多情況下,此類裝置可經裝備用于無線通信。因此,通信信道16可包括適合于 發射經編碼視頻數據的無線信道、有線信道或無線信道和有線信道的組合。類似地,文件服 務器36可由目的地裝置14通過任何標準數據連接(包含因特網連接)存取。此情形可包 含適合于存取存儲在文件服務器上的經編碼視頻數據的無線信道(例如,W1-Fi連接)、有 線連接(例如,DSL、電纜調制解調器等)或兩者的組合。
[0088]根據本發明的實例的用于在合并模式中產生候選運動向量的技術可適用于支持 多種多媒體應用中的任一者的視頻譯碼,多種多媒體應用例如空中電視廣播、有線電視傳 輸、衛星電視傳輸、流式視頻傳輸(例如,經由因特網)、用于存儲在數據存儲媒體上的數字 視頻的編碼、存儲在數據存儲媒體上的數字視頻的解碼,或其它應用。在一些實例中,系統 10可經配置以支持單向或雙向視頻傳輸以支持例如視頻流式傳輸、視頻播放、視頻廣播和 /或視頻電話等應用。
[0089]在圖5的實例中,源裝置12包含視頻源18、視頻編碼器20、調制器/解調器22以 及發射器24。在源裝置12中,視頻源18可包含例如以下各者等源:視頻俘獲裝置(例如 攝像機等)、含有先前俘獲的視頻的視頻存檔、接收來自視頻內容提供者的視頻的視頻饋送 接口,和/或用于產生計算機圖形數據作為源視頻的計算機圖形系統,或此類源的組合。作 為一個實例,如果視頻源18為攝像機,那么源裝置12和目的地裝置14可形成所謂的相機 電話或視頻電話。然而,本發明中所描述的技術一股可適用于視頻譯碼,且可適用于無線和/或有線應用,或經編碼視頻數據存儲在本地磁盤上的應用。
[0090]所俘獲的視頻、經預先俘獲的視頻或計算機產生的視頻可由視頻編碼器20來編碼。經編碼的視頻信息可由調制解調器22根據例如無線通信協議等通信標準來調制,且經由發射器24而發射到目的地裝置14。調制解調器22可包含各種混頻器、濾波器、放大器或經設計以用于信號調制的其它組件。發射器24可包含經設計以用于發射數據的電路,包含放大器、濾波器以及一個或一個以上天線。
[0091]由視頻編碼器20編碼的所俘獲的視頻、經預先俘獲的視頻或計算機產生的視頻也可存儲到存儲媒體34或文件服務器36上以供稍后消耗。存儲媒體34可包含藍光光盤、DVD、CD-ROM、快閃存儲器,或用于存儲經編碼視頻的任何其它合適的數字存儲媒體。存儲在存儲媒體34上的經編碼視頻可接著由目的地裝置14存取以用于解碼及播放。
[0092]文件服務器36可為能夠存儲經編碼視頻及將所述經編碼視頻傳輸到目的地裝置14的任何類型的服務器。實例文件服務器包含web服務器(例如,用于網站)、FTP服務器、網絡附接存儲(NAS)裝置、本地磁盤驅動器,或能夠存儲經編碼視頻數據及將經編碼視頻數據傳輸到目的地裝置的任何其它類型的裝置。來自文件服務器36的經編碼視頻數據的傳輸可為流式傳輸、下載傳輸或兩者的組合。文件服務器36可由目的地裝置14通過任何標準數據連接(包含因特網連接)存取。此情形可包含適合于存取存儲在文件服務器上的經編碼視頻數據的無線信道(例如,W1-Fi連接)、有線連接(例如,DSL、電纜調制解調器、以太網、USB等)或兩者的組合。
[0093]在圖5的實例中,目的地裝置14包含接收器26、調制解調器28、視頻解碼器30以及顯示裝置32。目的地裝置14的接收器26經由信道16接收信息,且調制解調器28解調所述信息以產生用于視頻解碼器30的經解調位流。經由信道16傳達的信息可包含由視頻編碼器20產生以供視頻解碼器30在解碼視頻數據中使用的多種語法信息。此語法也可包含在存儲在存儲媒體34或文件服務器36上的經編碼視頻數據中。視頻編碼器20和視頻解碼器30中的每一者可形成能夠編碼或解碼視頻數據的相應編碼器-解碼器(CODEC)的部分。
[0094]顯示裝置32可與目的地裝置14集成或在目的地裝置14外部。在一些實例中,目的地裝置14可包含集成顯示裝置且也經配置以與外部顯示裝置建立接口。在其它實例中,目的地裝置14可為顯示裝置。一股來說,顯示裝置32將經解碼視頻數據顯示給用戶,且可包括多種顯示裝置中的任一者,多種顯示裝置例如液晶顯示器(LCD)、等離子顯示器、有機發光二極管(OLED)顯示器或另一類型的顯示裝置。
[0095]在圖5的實例中,通信信道16可包括任何無線或有線通信媒體,例如射頻(RF)頻譜或一個或一個以上物理傳輸線,或無線和有線媒體的任何組合。通信信道16可形成基于包的網絡的部分,例如局域網、廣域網或例如因特網等全球網絡等。通信信道16 —股表示任何合適的通信媒體或不同通信媒體的集合,其用于將視頻數據從源裝置12發射到目的地裝置14,包含有線或無線媒體的任何合適連接。通信信道16可包含路由器、交換機、基站,或可用于促進從源裝置12到目的地裝置14的通信的任何其它裝備。
[0096]視頻編碼器20和視頻解碼器30可根據視頻壓縮標準操作,視頻壓縮標準例如目前在開發中的高效率視頻譯碼(HEVC)標準,且可符合HEVC測試模型(HM)。或者,視頻編碼器20和視頻解碼器30可根據其它專有或行業標準操作,例如ITU-T H.264標準(其或者被稱作MPEG-4第10部分,高級視頻譯碼(AVC)),或此類標準的擴展。然而,本發明的技術不限于任何特定譯碼標準。其它實例包含MPEG-2和ITU-T H.263。
[0097]盡管圖5中未展示,但在一些方面,視頻編碼器20和視頻解碼器30可各自與音頻編碼器和解碼器集成,且可包含適當MUX-DEMUX單元,或其它硬件和軟件,以處置共同數據流或單獨數據流中的音頻和視頻兩者的編碼。在可適用的情況下,在一些實例中,MUX-DEMUX單元可符合ITU H.223多路復用器協議,或例如用戶數據報協議(UDP)等其它協議。
[0098]視頻編碼器20和視頻解碼器30各自可實施為多種合適的編碼器電路中的任一者,多種合適的編碼器電路例如一個或一個以上微處理器、數字信號處理器(DSP)、專用集成電路(ASIC)、現場可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任何組合。當部分地以軟件來實施技術時,裝置可將用于軟件的指令存儲在合適的非暫時性計算機可讀媒體中且在硬件中使用一個或一個以上處理器來執行所述指令以執行本發明的技術。視頻編碼器20和視頻解碼器30中的每一者可包含在一個或一個以上編碼器或解碼器中,編碼器或解碼器中的任一者可作為相應裝置中的組合式編碼器/解碼器(CODEC)的部分而集成。
[0099]視頻編碼器20可實施本發明的技術中的任一者或全部以用于在視頻編碼過程中在合并模式中產生候選運動向量。同樣,視頻解碼器30可實施這些技術中的任一者或全部以用于在視頻解碼過程中在合并模式中產生候選運動向量。如本發明中所描述,視頻譯碼器可指視頻編碼器或視頻解碼器。類似地,視頻譯碼單元可指視頻編碼器或視頻解碼器。同樣地,視頻譯碼可指視頻編碼或視頻解碼。
[0100]在本發明的一個實例中,源裝置12的視頻編碼器20可經配置以確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息,以及使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程。視頻編碼器20可經進一步配置以將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中去除。
[0101]在本發明的另一實例中,源裝置12的視頻解碼器30可經配置以確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息,以及使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程。視頻解碼器30可經進一步配置以將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中去除。
[0102]圖6為說明視頻編碼器20的實例的框圖,視頻編碼器20可使用如本發明中所描述的用于在合并模式中產生候選運動向量的技術。為了說明的目的,將在HEVC譯碼的上下文中描述視頻編碼器20,但并無本發明關于其它譯碼標準或方法的限制。
[0103]視頻編碼器20可執行視頻幀內的CU的幀內和幀間譯碼。幀內譯碼依賴于空間預測以減少或去除給定視頻幀內的視頻數據中的空間冗余。幀間譯碼依賴于時間預測以減少或去除視頻序列的當前幀與先前經譯碼幀之間的時間冗余。幀內模式(I模式)可指若干基于空間的視頻壓縮模式中的任一者。例如單向預測(P模式)或雙向預測(B模式)等幀間模式可指若干基于時間的視頻壓縮模式中的任一者。[0104]如圖6中所展示,視頻編碼器20接收待編碼的視頻幀內的當前視頻塊。在圖6的 實例中,視頻編碼器20包含運動補償單元44、運動估計單元42、幀內預測單元46、參考幀緩 沖器64、求和器50、變換模塊52、量化單元54,以及熵編碼單元56。圖6中所說明的變換模 塊52為對殘余數據塊應用實際變換或變換組合的結構或設備,且不應與變換系數塊混淆, 所述變換系數塊可被稱作⑶的變換單元(TU)。對于視頻塊重新建構,視頻編碼器20也包 含逆量化單元58、逆變換模塊60以及求和器62。也可包含解塊濾波器(圖6中未展示) 以對塊邊界進行濾波以將方塊效應假影從經重新建構的視頻中去除。在需要時,解塊濾波 器通常將對求和器62的輸出進行濾波。
[0105]在編碼過程期間,視頻編碼器20接收待譯碼的視頻幀或切片。可將幀或切片劃分 成多個視頻塊,例如,最大譯碼單元(LCU)。運動估計單元42和運動補償單元44相對于一 個或一個以上參考幀中的一個或一個以上塊執行所接收視頻塊的幀間預測性譯碼以提供 時間壓縮。幀內預測單元46可相對于與待譯碼塊相同的幀或切片中的一個或一個以上相 鄰塊執行所接收視頻塊的幀內預測性譯碼以提供空間壓縮。
[0106]模式選擇單元40可(例如)基于每一種模式的誤差(即,失真)結果而選擇譯碼 模式(幀內模式或幀間模式)中的一者,且將所得經幀內或經幀間預測塊(例如,預測單元 (PU))提供到求和器50以產生殘余塊數據,且提供到求和器62以重新建構經編碼塊以用于 在參考幀中使用。求和器62組合所預測塊與來自逆變換模塊60的用于塊的經逆量化的經 逆變換的數據以重新建構經編碼塊,如下文更詳細描述。可將一些視頻幀指明為I幀,其中 I幀中的所有塊是在幀內預測模式中進行編碼。在一些情況下,例如,當由運動估計單元42 執行的運動搜索并不產生所述塊的足夠預測時,幀內預測單元46可執行P幀或B幀中的塊 的幀內預測編碼。
[0107]運動估計單元42和運動補償單元44可高度集成,但為了概念目的而分別加以說 明。運動估計(或運動搜索)為產生估計視頻塊的運動的運動向量的過程。運動向量(例 如)可指示當前幀中的預測單元相對于參考幀的參考樣本的位移。運動估計單元42通過 比較經幀間譯碼幀的預測單元與存儲在參考幀緩沖器64中的參考幀的參考樣本來計算用 于所述預測單元的運動向量。參考樣本可為發現依據像素差來說緊密匹配包含經譯碼的PU 的CU的部分的塊,像素差可通過絕對差總和(SAD)、平方差總和(SSD)或其它差異度量來確 定。參考樣本可出現在參考幀或參考切片內的任何處。
[0108]通過運動向量識別的參考幀的部分可被稱作參考樣本。運動補償單元44可(例 如)通過檢索通過用于PU的運動向量識別的參考樣本來計算用于當前CU的預測單元的預 測值。在一些視頻編碼技術中,運動估計單元42將所計算的運動向量、參考幀和預測方向 (例如,依據參考幀在時間上在當前幀之前還是之后來說的方向)發送到熵編碼單元56和 運動補償單元44。其它視頻編碼技術利用運動向量預測過程來編碼運動向量。可從包含合 并模式的多種模式當中選擇運動向量預測過程。
[0109]在合并模式中,編碼器考慮合并候選塊的集合且選擇具有與待譯碼的當前塊相同 (或最緊密匹配)的運動向量、參考幀和預測方向的塊。此情形是(例如)通過以下操作來 完成:依次檢查每一候選塊,及選擇一旦將其運動向量、參考幀和預測方向復制到當前塊便 產生最好的速率失真性能的候選塊。接著,不是在經編碼視頻位流中用信號發出此運動向 量信息(即,運動向量、參考幀和預測方向),而是編碼器用信號發出用于選定運動向量候選者的索引號。索引號識別候選運動向量集合當中的選定候選運動向量。解碼器可從運動向量候選者復制運動向量信息以用于當前塊。
[0110]在上文所描述的實例中,在經編碼位流中用信號發出運動向量信息未必需要實時地將此類元素從編碼器傳輸到解碼器,而是意味著:將此信息編碼到位流中且使得可由解碼器以任何方式來存取。此情形可包含實時傳輸(例如,在視頻會議中)以及將經編碼位流存儲在計算機可讀媒體上以供解碼器未來使用(例如,流式傳輸、下載、磁盤存取、卡存取、DVD、藍光光盤等)。
[0111]根據上文所描述的本發明的實例,對于合并模式,可產生合并候選者集合,而不比較任何合并候選者的運動信息與與當前PU相同的CU內的其它的運動信息。另外,本發明也提議:在合并候選者位于同一CU的另一PU內部的情況下,將合并候選者從合并候選者集合中去除。合并候選者的產生可由運動補償單元44、運動補償單元42或由視頻編碼器20的任何其它固定功能或可編程硬件結構來處置。
[0112]作為一個實例,對于CU的NX 2N分割,所有合并候選者(例如,圖1中所展示的合并候選者)可用于roo。對于PU1,當合并候選者L在PUO內時,將合并候選者L從合并候選者列表中去除/排除(參見圖3A)。作為另一實例,對于CU的2NXN分割,所有合并候選者(例如,圖1中所展示的合并候選者)可用于PUO。對于TOl,當合并候選者A在PUO內時,將合并候選者A從合并候選者列表中去除(參見圖3B)。
[0113]作為另一實例,對于CU的NXN分割,所有合并候選者(例如,圖1中所展示的合并候選者)可用于PUO。對于PU1,當合并候選者L和BL分別在PUO和PU2內時,將合并候選者L和BL從合并候選者列表中去除/排除(參見圖4A)。對于PU2,當合并候選者A和RA分別在PUO和PUl內時,將合并候選者A和RA從合并候選者列表中去除/排除(參見圖4A)。對于PU3,當合并候選者LA、A和L分別在PU0、PU1和PU2內時,將合并候選者LA、A和L從合并候選者列表中去除/排除(參見圖4A)。因而,PUO可使用合并候選者BL、L、LA、A、RA和T。PUl可使用合并候選者LA、A、RA和T。PU2可使用合并候選者BL、L、LA和T。PU3可使用合并候選者BL、RA和T。
[0114]作為又一實例,對于NXN分割模式,使用每一預測單元的所有合并候選者,而不管由另一預測單元使用的任何合并候選者(參見圖4B)。對于其它分割模式(例如2NXN、NX2N等)以及非對稱模式(例如2NXnD、2NXnU、nLX2N和nRX2N等),根據上文所描述的過程應用對于位于同一 CU的另一 PU內部的當前的某些候選者的排除。
[0115]返回圖6,幀內預測單元46可對所接收塊執行幀內預測,作為對由運動估計單元42和運動補償單元44執行的幀間預測的替代。幀內預測單元46可相對于相鄰的先前經譯碼塊(例如,在當前塊上方、右上方、左上方和左側的塊)預測所接收塊(假定塊的從左到右、從上到下的編碼次序)。幀內預測單元46可經配置而具有多種不同幀內預測模式。舉例來說,幀內預測單元46可經配置以基于經編碼的CU的大小而具有某數目個定向預測模式,例如,三十四個定向預測模式。
[0116]幀內預測單元46可通過(例如)計算各種幀內預測模式的預測誤差值及選擇產生最低誤差值的模式來選擇幀內預測模式。定向預測模式可包含用于組合空間上相鄰像素的值及將組合值應用于PU中的一個或一個以上像素位置的功能。一旦已計算用于中的所有像素位置的值,幀內預測單元46便可基于的所計算的或所預測的值與待編碼的所接收原始塊之間的像素差而計算預測模式的誤差值。幀內預測單元46可繼續測試幀內預 測模式,直到發現產生可接受的誤差值的幀內預測模式為止。幀內預測單元46可接著將PU 發送到求和器50。
[0117]視頻編碼器20通過從經譯碼的原始視頻塊中減去由運動補償單元44或幀內預測 單元46計算的預測數據而形成殘余塊,所述殘余塊可包含一個明度塊和兩個色度塊。求和 器50表示執行此減法運算的一個或一個以上組件。殘余塊可對應于像素差值的二維矩陣, 其中殘余塊中的值的數目與對應于殘余塊的I3U中的像素的數目相同。殘余塊中的值可對 應于PU與待譯碼的原始塊中的經并置的像素的值之間的差(即,誤差)。對明度分量和色 度分量兩者應用此操作,因此差值可取決于經譯碼的塊的類型而為色度差或明度差。
[0118]變換模塊52可從殘余塊形成一個或一個以上變換單元(TU)。變換模塊52從多個 變換當中選擇變換。可基于一個或一個以上譯碼特性(例如,塊大小、譯碼模式等等)而選 擇變換。變換模塊52接著對TU應用選定變換,從而產生包括變換系數的二維陣列的視頻 塊。
[0119]變換模塊52可將所得變換系數發送到量化單元54。量化單元54可接著使變換系 數量化。熵編碼單元56可接著根據掃描模式執行矩陣中的經量化的變換系數的掃描。本 發明將熵編碼單元56描述為執行掃描。然而,應理解,在其它實例中,例如量化單元54等 其它處理單元可執行掃描。
[0120]一旦將變換系數掃描成一維陣列,熵編碼單元56便可對系數應用熵譯碼,例如, 上下文自適應可變長度譯碼(CAVLC)、上下文自適應二進制算術譯碼(CABAC)、基于語法的 上下文自適應二進制算術譯碼(SBAC),或另一熵譯碼方法等。也可對語法元素應用熵譯碼, 例如在合并模式中使用的語法元素。
[0121]為了執行CAVLC,熵編碼單元56可選擇可變長度碼用于待傳輸的符號。VLC中的 代碼字可經建構,使得相對較短代碼對應于更可能的符號,而較長代碼對應于不太可能的 符號。以此方式,與(例如)使用等長度代碼字用于待傳輸的每一符號相比較,使用VLC可 實現位節省。
[0122]為了執行CABAC,熵編碼單元56可選擇上下文模型以應用于某種上下文以編碼待 傳輸的符號。在變換系數的情況下,上下文可與(例如)相鄰值是否為非零有關。熵編碼 單元56也可熵編碼語法元素,例如表示選定變換的信號。根據本發明的技術,熵編碼單元 56可基于(例如)以下各者而選擇用以編碼這些語法元素的上下文模型:用于幀內預測模 式的幀內預測方向、對應于語法元素的系數的掃描位置、塊類型,和/或變換類型,以及用 于上下文模型選擇的其它因素。
[0123]在由熵編碼單元56進行熵譯碼之后,可將所得的經編碼視頻傳輸到另一裝置(例 如視頻解碼器30等),或將所得的經編碼視頻存檔以供稍后傳輸或檢索。
[0124]在一些情況下,熵編碼單元56或視頻編碼器20的另一單元可經配置以除熵譯碼 之外還執行其它譯碼功能。舉例來說,熵編碼單元56可經配置以確定用于⑶和的經譯 碼塊樣式(CBP)值。又,在一些情況下,熵編碼單元56可執行系數的變動長度譯碼。
[0125]逆量化單元58和逆變換模塊60分別應用逆量化和逆變換,以在像素域中重新建 構殘余塊,例如,以供稍后在重新建構參考塊中使用。運動補償單元44可通過將殘余塊加 到由參考幀緩沖器64 (其也可被稱作經解碼圖片緩沖器)的多個幀中的一者形成的預測性塊來計算參考塊。運動補償單元44也可對經重新建構的參考塊應用一個或一個以上內插濾波器以計算用于運動估計中的子整數像素值。求和器62將經重新建構的殘余塊加到由運動補償單元44產生的經運動補償的預測塊以產生經重新建構的視頻塊以用于存儲在參考幀緩沖器64中。經重新建構的視頻塊可由運動估計單元42和運動補償單元44作為參考塊使用以對另一個隨后經譯碼的視頻幀中的塊進行幀間譯碼。
[0126]圖7為說明解碼經編碼視頻序列的視頻解碼器30的實例的框圖。在圖7的實例中,視頻解碼器30包含熵解碼單元70、運動補償單元72、幀內預測單元74、逆量化單元76、逆變換模塊78、參考幀緩沖器82以及求和器80。在一些實例中,視頻解碼器30可執行一股與關于視頻編碼器20所描述的編碼遍次(參見圖6)互逆的解碼遍次。
[0127]熵解碼單元70對經編碼位流執行熵解碼過程以檢索變換系數的一維陣列。所使用的熵解碼過程取決于由視頻編碼器20使用的熵譯碼(例如,CABAC、CAVLC等)。可在經編碼位流中用信號發出由編碼器使用的熵譯碼過程或熵譯碼過程可為預定過程。
[0128]在一些實例中,熵解碼單元70 (或逆量化單元76)可使用鏡射由視頻編碼器20的熵編碼單元56 (或量化單元54)使用的掃描模式的掃描來掃描所接收值。盡管對系數的掃描或者可在逆量化單元76中執行,但為了說明的目的,將掃描描述為由熵解碼單元70執行。另外,盡管為了易于說明而展示為單獨功能單元,但熵解碼單元70、逆量化單元76和視頻解碼器30的其它單元的結構和功能性可彼此高度集成。
[0129]逆量化單元76使提供于位流中且由熵解碼單元70解碼的經量化的變換系數逆量化(即,解量化)。逆量化過程可包含常規過程,例如,類似于針對HEVC提議或由H.264解碼標準定義的過程。逆量化過程可包含使用由視頻編碼器20針對CU計算的量化參數QP以確定量化的程度,且同樣地,確定應應用的逆量化的程度。逆量化單元76可在將系數從一維陣列轉換成二維陣列之前或之后,使變換系數逆量化。
[0130]逆變換模塊78對經逆量化的變換系數應用逆變換。在一些實例中,逆變換模塊78可基于來自視頻編碼器20的發信號或通過從一個或一個以上譯碼特性(例如,塊大小、譯碼模式等等)推斷出變換,來確定逆變換。在一些實例中,逆變換模塊78可基于包含當前塊的LCU的四叉樹的根節點處的用信號發出的變換而確定應用于當前塊的變換。或者,可在LCU四叉樹中的葉節點CU的TU四叉樹的根部用信號發出變換。在一些實例中,逆變換模塊78可應用級聯逆變換,其中逆變換模塊78將兩個或兩個以上逆變換應用于正經解碼的當前塊的變換系數。
[0131]幀內預測單元74可基于用信號發出的幀內預測模式及來自當前幀的先前經解碼塊的數據而產生用于當前幀的當前塊的預測數據。
[0132]根據本發明的實例,視頻解碼器30可從經編碼位流中接收預測語法,所述預測語法指示來自合并候選塊集合的選定合并候選塊的索引,以用于在運動向量預測過程中使用。視頻解碼器經進一步配置以檢索與通過所接收索引識別的合并候選塊相關聯的運動向量、參考幀和預測方向,且使用所檢索的運動向量、參考幀和預測方向執行用于當前塊的幀間預測解碼。
[0133]根據上文所描述的本發明的實例,對于合并模式,可由視頻解碼器30產生合并候選者集合,而不比較任何合并候選者的運動信息與與當前PU相同的CU內的其它的運動信息。另外,本發明也提議:在合并候選者位于同一 CU的另一 PU內部的情況下,將合并候選者從合并候選者集合中去除。合并候選者的產生可由運動補償單元72或由視頻解碼器30的任何其它固定功能或可編程硬件結構來處置。一旦視頻解碼器30已確定最終合并候選者集合,其便可從通過所接收索引指示的合并候選者中檢索運動信息。
[0134]作為一個實例,對于CU的NX 2N分割,所有合并候選者(例如,圖1中所展示的合并候選者)可用于roo。對于PU1,當合并候選者L在PUO內時,將合并候選者L從合并候選者列表中去除/排除(參見圖3A)。作為另一實例,對于CU的2NXN分割,所有合并候選者(例如,圖1中所展示的合并候選者)可用于PUO。對于TOl,當合并候選者A在PUO內時,將合并候選者A從合并候選者列表中去除/排除(參見圖3B)。
[0135]作為另一實例,對于CU的NXN分割,所有合并候選者(例如,圖1中所展示的合并候選者)可用于PUO。對于PU1,當合并候選者L和BL分別在PUO和PU2內時,將合并候選者L和BL從合并候選者列表中去除/排除(參見圖4A)。對于PU2,當合并候選者A和RA分別在PUO和PUl內時,將合并候選者A和RA從合并候選者列表中去除/排除(參見圖4A)。對于PU3,當合并候選者LA、A和L分別在PU0、PU1和PU2內時,將合并候選者LA、A和L從合并候選者列表中去除/排除(參見圖4A)。
[0136]作為又一實例,對于NXN分割模式,使用每一預測單元的所有合并候選者,而不管由另一預測單元使用的任何合并候選者(參見圖4B)。對于其它分割模式(例如2NXN、NX2N等)以及非對稱模式(例如2NXnD、2NXnU、nLX2N和nRX2N等),根據上文所描述的過程應用對于位于同一 CU的PU內部的當前的某些候選者的排除。
[0137]返回圖7,運動補償單元72可產生經運動補償的塊,從而可能執行基于內插濾波器的內插。用于待用于子像素精度的運動估計的內插濾波器的識別符可包含在語法元素中。運動補償單元72可使用如在視頻塊的編碼期間由視頻編碼器20使用的內插濾波器來計算用于參考塊的子整數像素的內插值。運動補償單元72可根據所接收的語法信息來確定由視頻編碼器20使用的內插濾波器,且使用所述內插濾波器來產生預測性塊。
[0138]另外,在HEVC實例中,運動補償單元72和幀內預測單元74可使用語法信息(例如,通過四叉樹提供)中的一些語法信息來確定用以編碼經編碼視頻序列的(多個)幀的LCU的大小。運動補償單元72和幀內預測單元74也可使用語法信息來確定分裂信息,所述分裂信息描述如何分裂經編碼視頻序列的幀的每一 CU(且同樣地,如何分裂子CU)。語法信息也可包含指示如何編碼每一 CU的模式(例如,幀內預測或幀間預測,且對于幀內預測,為幀內預測編碼模式)、用于每一經幀間編碼的PU的一個或一個以上參考幀(和/或含有用于參考幀的識別符的參考列表),以及解碼經編碼視頻序列的其它信息。
[0139]求和器80組合殘余塊與由運動補償單元72或幀內預測單元74產生的對應預測塊以形成經解碼塊。實際上,經解碼塊重新建構最初經譯碼塊,經受歸因于量化或其它譯碼方面產生的損失。在需要時,也可應用解塊濾波器以對經解碼塊進行濾波以便去除方塊效應假影。接著將經解碼視頻塊存儲在參考幀緩沖器82中,參考幀緩沖器82提供用于后續運動補償的參考塊且也產生經解碼視頻以用于呈現在顯示裝置(例如圖5的顯示裝置32等)上°
[0140]圖8為說明根據本發明的技術的編碼視頻的實例方法的流程圖。圖8的方法可由圖6的視頻編碼器20來執行。視頻編碼器20可經配置以確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與另一預測單元的運動信息200,以及將在當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中去除202。合并候選者集合可包含左上方合并候選者、上方合并候選者、右上方合并候選者、左側合并候選者、左下方合并候選者,以及時間合并候選者。
[0141]在當前譯碼單元具有2NXN分割類型(包含定位于預測單元I上方的預測單元0)的情況下,視頻編碼器20可將上方合并候選者從用于預測單元I的合并候選者集合中去除。在當前譯碼單元具有NX 2N分割類型(包含定位于預測單元I左側的預測單元0)的情況下,視頻編碼器20可將左側合并候選者從用于預測單元I的合并候選者集合中去除。
[0142]在當前譯碼單元具有NXN分割類型(包含定位于當前譯碼單元的左上部分中的預測單元O、定位于當前譯碼單元的右上部分中的預測單元1、定位于當前譯碼單元的左下部分中的預測單元2,以及定位于當前譯碼單元的右下部分中的預測單元3)的情況下,視頻編碼器20可將左側合并候選者和左下方合并候選者從用于預測單元I的合并候選者集合中去除。在此情況下,視頻編碼器20可進一步將上方合并候選者和右上方合并候選者從用于預測單元2的合并候選者集合中去除。在此情況下,視頻編碼器20可更進一步將上方合并候選者、左側合并候選者和左上方合并候選者從用于預測單元3的合并候選者集合中去除。
[0143]在其它實例中,排除合并候選者包括針對所有分割模式而不是NXN分割模式,將在當前譯碼單元的另一預測單元內的合并候選者從合并候選者集合中排除。在此情況下,無合并候選者被從具有NXN分割模式的譯碼單元從預測單元中去除/排除。
[0144]視頻編碼器20可經進一步配置以使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程以確定用于當前預測單元的選定合并候選者204,以及在經編碼視頻位流中用信號發出指示選定合并候選者的語法元素206。
[0145]圖9為說明根據本發明的技術的解碼視頻的實例方法的流程圖。圖9的方法可由圖7的視頻解碼器30來執行。視頻解碼器30可經配置以接收指示用于當前預測單元的選定合并候選者的語法元素220,以及確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定合并候選者集合而不比較合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息222。視頻解碼器30可經進一步配置以將在當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中去除224。合并候選者集合可包含左上方合并候選者、上方合并候選者、右上方合并候選者、左側合并候選者、左下方合并候選者,以及時間合并候選者。
[0146]在當前譯碼單元具有2NXN分割類型(包含定位于預測單元I上方的預測單元0)的情況下,視頻解碼器30可將上方合并候選者從用于預測單元I的合并候選者集合中去除。在當前譯碼單元具有NX 2N分割類型(包含定位于預測單元I左側的預測單元0)的情況下,視頻解碼器30可將左側合并候選者從用于預測單元I的合并候選者集合中去除。
[0147]在當前譯碼單元具有NXN分割類型(包含定位于當前譯碼單元的左上部分中的預測單元O、定位于當前譯碼單元的右上部分中的預測單元1、定位于當前譯碼單元的左下部分中的預測單元2,以及定位于當前譯碼單元的右下部分中的預測單元3)的情況下,視頻解碼器30可將左側合并候選者和左下方合并候選者從用于預測單元I的合并候選者集合中去除。在此情況下,視頻解碼器30可進一步將上方合并候選者和右上方合并候選者從用于預測單元2的合并候選者集合中去除。在此情況下,視頻解碼器30可更進一步將上方合并候選者、左側合并候選者和左上方合并候選者從用于預測單元3的合并候選者集合中去除。
[0148]在其它實例中,排除合并候選者包括針對所有分割模式而不是NXN分割模式,將在當前譯碼單元的另一預測單元內的合并候選者從合并候選者集合中排除。在此情況下,無合并候選者被從具有NXN分割模式的譯碼單元從預測單元中去除/排除。
[0149]視頻解碼器30可經進一步配置以使用所述合并候選者集合和所接收語法元素執行用于當前預測單元的合并運動向量預測過程以確定用于當前預測單元的運動向量226,以及使用所確定的運動向量解碼當前預測單元228。
[0150]在一個或一個以上實例中,可以硬件、軟件、固件或其任何組合來實施所描述功能。如果以軟件來實施,那么可將所述功能作為一個或一個以上指令或代碼存儲在計算機可讀媒體上或經由計算機可讀媒體而傳輸且由基于硬件的處理單元來執行。計算機可讀媒體可包含計算機可讀存儲媒體(其對應于例如數據存儲媒體等有形媒體)或通信媒體,通信媒體包含(例如)根據通信協議促進計算機程序從一處傳送到另一處的任何媒體。以此方式,計算機可讀媒體一股可對應于(I)非暫時性的有形計算機可讀存儲媒體,或(2)例如信號或載波等通信媒體。數據存儲媒體可為可由一個或一個以上計算機或一個或一個以上處理器存取以檢索指令、代碼和/或數據結構以用于實施本發明中所描述的技術的任何可用媒體。計算機程序產品可包含計算機可讀媒體。
[0151]以實例說明且非限制,此類計算機可讀存儲媒體可包括RAM、ROM、EEPROM、CD-ROM或其它光盤存儲器、磁盤存儲器或其它磁性存儲裝置、快閃存儲器,或可用以存儲呈指令或數據結構形式的所要程序代碼且可由計算機存取的任何其它媒體。又,將任何連接適當地稱為計算機可讀媒體。舉例來說,如果使用同軸電纜、光纜、雙絞線、數字用戶線(DSL)或無線技術(例如紅外線、無線電和微波等)而從網站、服務器或其它遠程源傳輸指令,那么同軸電纜、光纜、雙絞線、DSL或無線技術(例如紅外線、無線電和微波等)包含在媒體的定義中。然而,應理解,計算機可讀存儲媒體和數據存儲媒體不包含連接、載波、信號或其它暫時性媒體,而是有關非暫時性有形存儲媒體。如本文中所使用,磁盤和光盤包含壓縮光盤(CD)、激光光盤、光學光盤、數字影音光盤(DVD)、軟性磁盤及藍光光盤,其中磁盤通常以磁性方式再生數據,而光盤通過激光以光學方式再生數據。以上各者的組合亦應包含在計算機可讀媒體的范圍內。
[0152]可由例如一個或一個以上數字信號處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現場可編程邏輯陣列(FPGA)或其它等效集成或離散邏輯電路等一個或一個以上處理器來執行指令。因此,如本文中所使用的術語“處理器”可指前述結構或適合于實施本文中所描述的技術的任何其它結構中的任一者。另外,在一些方面,可將本文中所描述的功能性提供于經配置以用于編碼及解碼的專用硬件和/或軟件模塊內,或并入于組合式編碼譯碼器中。又,所述技術可完全實施于一個或一個以上電路或邏輯元件中。
[0153]本發明的技術可在廣泛多種裝置或設備中予以實施,所述裝置或設備包含無線手機、集成電路(IC)或IC集合(例如,芯片集)。在本發明中描述各種組件、模塊或單元以強調經配置以執行所揭示技術的裝置的功能方面,但未必需要通過不同硬件單元來實現。更確切地說,如上文所描述,可將各種單元組合于編碼譯碼器硬件單元中,或通過互操作性硬件單元(包含如上文所描述的一個或一個以上處理器)的集合且結合合適軟件和/或固件來提供所述單元。
[0154]已描述各種實例。這些和其它實例在所附權利要求書的范圍內。
【權利要求】
1.一種譯碼視頻數據的方法,其包括:確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息;以及使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程。
2.根據權利要求1所述的方法,其進一步包括:將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除。
3.根據權利要求2所述的方法,其中排除合并候選者包括針對所有分割模式而不是 NXN分割模式,將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除。
4.根據權利要求3所述的方法,其進一步包括:不將合并候選者從來自具有所述NXN分割模式的所述譯碼單元的預測單元排除。
5.根據權利要求2所述的方法,其中所述合并候選者集合包含左上方合并候選者、上方合并候選者、右上方合并候選者、左側合并候選者、左下方合并候選者,以及時間合并候選者。
6.根據權利要求5所述的方法,其中所述當前譯碼單元具有2NXN、2NXnU或2NXnD 分割類型,包含定位于預測單元I上方的預測單元O,且其中將合并候選者從所述合并候選者集合中排除包括將所述上方合并候選者從用于預測單元I的所述合并候選者集合中排除。
7.根據權利要求5所述的方法,其中所述當前譯碼單元具有NX2N、nLX 2N或nRX 2N 分割類型,包含定位于預測單元I左側的預測單元O,且其中將合并候選者從所述合并候選者集合中排除包括將所述左側合并候選者從用于預測單元I的所述合并候選者集合中排除。
8.根據權利要求2所述的方法,其中所述當前譯碼單元具有NXN分割類型,包含定位于所述當前譯碼單元的左上部分中的預測單元O、定位于所述當前譯碼單元的右上部分中的預測單元1、定位于所述當前譯碼單元的左下部分中的預測單元2,以及定位于所述當前譯碼單元的右下部分中的預測單元3,其中將合并候選者從所述合并候選者集合中排除包括將所述左側合并候選者和所述左下方合并候選者從用于預測單元I的所述合并候選者集合中排除,其中將合并候選者從所述合并候選者集合中排除包括將所述上方合并候選者和所述右上方合并候選者從用于預測單元2的所述合并候選者集合中排除,且其中將合并候選者從所述合并候選者集合中排除包括將所述上方合并候選者、所述左側合并候選者和所述左上方合并候選者從用于預測單元3的所述合并候選者集合中排除。
9.根據權利要求2所述的方法,其中譯碼視頻包括解碼視頻,且其中所述方法進一步包括:接收指示用于所述當前預測單元的選定合并候選者的語法元素;使用所述合并候選者集合和所述所接收語法元素執行用于所述當前預測單元的所述合并運動向量預測過程以確定用于所述當前預測單元的運動向量;以及使用所述所確定運動向量解碼所述當前預測單元。
10.根據權利要求2所述的方法,其中譯碼視頻包括編碼視頻,且其中所述方法進一步包括: 使用所述合并候選者集合執行用于所述當前預測單元的所述運動向量預測過程以確定用于所述當前預測單元的選定合并候選者;以及 在經編碼視頻位流中用信號發出指示所述選定合并候選者的語法元素。
11.一種經配置以譯碼視頻數據的設備,其包括: 視頻譯碼器,其經配置以: 確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息;以及 使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程。
12.根據權利要求11所述的設備,其中所述視頻譯碼器經進一步配置以: 將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除。
13.根據權利要求12所述的設備,其中所述視頻譯碼器經進一步配置以: 針對所有分割模式而不是NXN分割模式,將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除。
14.根據權利要求13所述的設備,其中所述視頻譯碼器經進一步配置以: 不將合并候選者從來自具有所述NXN分割模式的所述譯碼單元的預測單元排除。
15.根據權利要求12所述的設備,其中所述合并候選者集合包含左上方合并候選者、上方合并候選者、右上方合并候選者、左側合并候選者、左下方合并候選者,以及時間合并候選者。
16.根據權利要求15所述的設備,其中所述當前譯碼單元具有2NXN、2NXnU或2NXnD分割類型,包含定位于預測單元I上方的預測單元0,且其中所述視頻譯碼器經進一步配置以將所述上方合并候選者從用于預測單元I的所述合并候選者集合中排除。
17.根據權利要求15所述的設備,其中所述當前譯碼單元具有NX2N、nLX2N或nRX2N分割類型,包含定位于預測單元I左側的預測單元0,且其中所述視頻譯碼器經進一步配置以將所述左側合并候選者從用于預測單元I的所述合并候選者集合中排除。
18.根據權利要求15所述的設備,其中所述當前譯碼單元具有NXN分割類型,包含定位于所述當前譯碼單元的左上部分中的預測單元O、定位于所述當前譯碼單元的右上部分中的預測單元1、定位于所述當前譯碼單元的左下部分中的預測單元2,以及定位于所述當前譯碼單元的右下部分中的預測單元3, 其中所述視頻譯碼器經進一步配置以將所述左側合并候選者和所述左下方合并候選者從用于預測單元I的所述合并候選者集合中排除, 其中所述視頻譯碼器經進一步配置以將所述上方合并候選者和所述右上方合并候選者從用于預測單元2的所述合并候選者集合中排除,且 其中所述視頻譯碼器經進一步配置以將所述上方合并候選者、所述左側合并候選者和所述左上方合并候選者從用于預測單元3的所述合并候選者集合中排除。
19.根據權利要求12所述的設備,其中所述視頻譯碼器為視頻解碼器,且其中所述視頻解碼器經進一步配置以:接收指示用于所述當前預測單元的選定合并候選者的語法元素;使用所述合并候選者集合和所述所接收語法元素執行用于所述當前預測單元的所述合并運動向量預測過程以確定用于所述當前預測單元的運動向量;以及使用所述所確定運動向量解碼所述當前預測單元。
20.根據權利要求12所述的設備,其中所述視頻譯碼器為視頻編碼器,且其中所述視頻編碼器經進一步配置以:使用所述合并候選者集合執行用于所述當前預測單元的所述運動向量預測過程以確定用于所述當前預測單元的選定合并候選者;以及在經編碼視頻位流中用信號發出指示所述選定合并候選者的語法元素。
21.根據權利要求11所述的設備,其中所述視頻譯碼器為移動裝置的部分。
22.—種經配置以譯碼視頻數據的設備,其包括:用于確定用于當前譯碼單元的當前預測單元的合并候選者集合的裝置,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息;以及 用于使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程的裝置。
23.根據權利要求22所述的設備,其進一步包括:用于將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除的裝置。
24.根據權利要求23所述的設備,其中用于排除合并候選者的所述裝置包括用于針對所有分割模式而不是NXN分割模式,將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除的裝置。
25.根據權利要求23所述的設備,其進一步包括:用于不將合并候選者從來自具有所述NXN分割模式的所述譯碼單元的預測單元排除的裝置。
26.根據權利要求23所述的設備,其中所述合并候選者集合包含左上方合并候選者、 上方合并候選者、右上方合并候選者、左側合并候選者、左下方合并候選者,以及時間合并候選者。
27.根據權利要求26所述的設備,其中所述當前譯碼單元具有2NXN、2NXnU或 2NXnD分割類型,包含定位于預測單元I上方的預測單元0,且其中用于將合并候選者從所述合并候選者集合中排除的所述裝置包括用于將所述上方合并候選者從用于預測單元I 的所述合并候選者集合中排除的裝置。
28.根據權利要求26所述的設備,其中所述當前譯碼單元具有NX2N、nLX2N或 nRX2N分割類型,包含定位于預測單元I左側的預測單元0,且其中用于將合并候選者從所述合并候選者集合中排除的所述裝置包括用于將所述左側合并候選者從用于預測單元I 的所述合并候選者集合中排除的裝置。
29.根據權利要求26所述的設備,其中所述當前譯碼單元具有NXN分割類型,包含定位于所述當前譯碼單元的左上部分中的預測單元O、定位于所述當前譯碼單元的右上部分中的預測單元1、定位于所述當前譯碼單元的左下部分中的預測單元2,以及定位于所述當前譯碼單元的右下部分中的預測單元3, 其中用于將合并候選者從所述合并候選者集合中排除的所述裝置包括用于將所述左側合并候選者和所述左下方合并候選者從用于預測單元I的所述合并候選者集合中排除的裝置, 其中用于將合并候選者從所述合并候選者集合中排除的所述裝置包括用于將所述上方合并候選者和所述右上方合并候選者從用于預測單元2的所述合并候選者集合中排除的裝置,且 其中用于將合并候選者從所述合并候選者集合中排除的所述裝置包括用于將所述上方合并候選者、所述左側合并候選者和所述左上方合并候選者從用于預測單元3的所述合并候選者集合中排除的裝置。
30.根據權利要求23所述的設備,其中所述設備經配置以解碼視頻,且其中所述設備進一步包括: 用于接收指示用于所述當前預測單元的選定合并候選者的語法元素的裝置; 用于使用所述合并候選者集合和所述所接收語法元素執行用于所述當前預測單元的所述合并運動向量預測過程以確定用于所述當前預測單元的運動向量的裝置;以及 用于使用所述所確定運動向量解碼所述當前預測單元的裝置。
31.根據權利要求23所述的設備,其中所述設備經配置以編碼視頻,且其中所述設備進一步包括: 用于使用所述合并候選者集合執行用于所述當前預測單元的所述運動向量預測過程以確定用于所述當前預測單元的選定合并候選者的裝置;以及 用于在經編碼視頻位流中用信號發出指示所述選定合并候選者的語法元素的裝置。
32.根據權利要求22所述的設備,其中所述設備為移動裝置的部分。
33.一種計算機可讀存儲媒體,其具有存儲于其上的指令,所述指令在經執行時致使經配置以譯碼視頻數據的一個或一個以上處理器進行以下操作: 確定用于當前譯碼單元的當前預測單元的合并候選者集合,其中確定所述合并候選者集合而不比較所述合并候選者集合中的合并候選者的運動信息與任何其它預測單元的運動信息;以及 使用所述合并候選者集合執行用于所述當前預測單元的合并運動向量預測過程。
34.根據權利要求33所述的計算機可讀存儲媒體,其中所述指令進一步致使所述一個或一個以上處理器進行以下操作: 將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除。
35.根據權利要求34所述的計算機可讀存儲媒體,其中所述指令進一步致使所述一個或一個以上處理器進行以下操作: 針對所有分割模式而不是NXN分割模式,將在所述當前譯碼單元的另一預測單元內的合并候選者從所述合并候選者集合中排除。
36.根據權利要求35所述的計算機可讀存儲媒體,其中所述指令進一步致使所述一個或一個以上處理器進行以下操作:不將合并候選者從來自具有所述NXN分割模式的所述譯碼單元的預測單元排除。
37.根據權利要求34所述的計算機可讀存儲媒體,其中所述合并候選者集合包含左上方合并候選者、上方合并候選者、右上方合并候選者、左側合并候選者、左下方合并候選者, 以及時間合并候選者。
38.根據權利要求37所述的計算機可讀存儲媒體,其中所述當前譯碼單元具有2NXN、 2NXnU或2NXnD分割類型,包含定位于預測單元I上方的預測單元O,且其中所述指令進一步致使所述一個或一個以上處理器將所述上方合并候選者從用于預測單元I的所述合并候選者集合中排除。
39.根據權利要求37所述的計算機可讀存儲媒體,其中所述當前譯碼單元具有NX2N、 nLX2N或nRx2N分割類型,包含定位于預測單元I左側的預測單元O,且其中所述指令進一步致使所述一個或一個以上處理器將所述左側合并候選者從用于預測單元I的所述合并候選者集合中排除。
40.根據權利要求37所述的計算機可讀存儲媒體,其中所述當前譯碼單元具有NXN分割類型,包含定位于所述當前譯碼單元的左上部分中的預測單元O、定位于所述當前譯碼單元的右上部分中的預測單元1、定位于所述當前譯碼單元的左下部分中的預測單元2,以及定位于所述當前譯碼單元的右下部分中的預測單元3,其中所述指令進一步致使所述一個或一個以上處理器將所述左側合并候選者和所述左下方合并候選者從用于預測單元I的所述合并候選者集合中排除,其中所述指令進一步致使所述一個或一個以上處理器將所述上方合并候選者和所述右上方合并候選者從用于預測單元2的所述合并候選者集合中排除,且其中所述指令進一步致使所述一個或一個以上處理器將所述上方合并候選者、所述左側合并候選者和所述左上方合并候選者從用于預測單元3的所述合并候選者集合中 排除。
【文檔編號】H04N19/587GK103609118SQ201280030464
【公開日】2014年2月26日 申請日期:2012年6月19日 優先權日:2011年6月20日
【發明者】鄭云非, 翔林·王, 馬爾塔·卡切維奇 申請人:高通股份有限公司