專利名稱:用于視頻譯碼的幀間預測模式和參考圖片列表索引的譯碼的制作方法
技術領域:
本發(fā)明涉及視頻譯碼,且更確切地說,涉及視頻幀間譯碼技術。
背景技術:
數(shù)字視頻能力可并入到廣泛范圍的裝置中,所述裝置包括數(shù)字電視、數(shù)字直播系統(tǒng)、無線廣播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或桌上型計算機、數(shù)字相機、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛(wèi)星無線電電話、視頻電傳會議裝置及其類似者。數(shù)字視頻裝置實施例如描述于以下各者中的技術的視頻壓縮技術以較有效地傳輸及接收數(shù)字視頻信息由MPEG-2、MPEG-4、ITU-T H. 263、ITU-T H. 264/MPEG-4第10部分(高級視頻譯碼(AVC))定義的標準或新興高效率視頻譯碼(HEVC)標準及這些標準的擴展。 視頻壓縮技術執(zhí)行空間預測及/或時間預測以減小或移除視頻序列中所固有的冗余。對于基于塊的視頻譯碼來說,可將視頻幀或片段劃分成若干視頻塊或若干譯碼單元(CU)。使用相對于相鄰塊的空間預測來編碼幀內(nèi)譯碼(I)的幀或片段中的視頻塊。幀間譯碼(P或B)幀或片段中的視頻塊可使用相對于同一幀或片段中的相鄰塊的空間預測或相對于其它參考圖片的時間預測。使用雙向預測以從兩個不同參考圖片列表(傳統(tǒng)上,過去圖片的一個列表及未來圖片的一個列表)計算兩個運動向量來編碼經(jīng)雙向預測(B)的幀中的視頻塊。使用單向預測以從單一參考圖片列表(傳統(tǒng)上,過去圖片的一列表)計算單一運動向量來編碼經(jīng)單向預測(P)的幀中的視頻塊。
發(fā)明內(nèi)容
大體來說,本發(fā)明涉及用于減少視頻譯碼中譯碼預測信息的成本的技術。可使用來自第一參考圖片列表及第二參考圖片列表中的一者中的參考圖片的單向預測模式,或來自所述第一參考圖片列表及所述第二參考圖片列表兩者中的參考圖片的雙向預測模式來譯碼幀間譯碼的視頻幀的視頻塊。在新興HEVC標準中,引入可為雙向預測⑶的幀概念的特殊狀況的廣義P/B(GPB)幀。使用從相同的兩個單獨參考圖片列表中的參考圖片所計算的高達兩個運動向量來編碼GPB幀中的視頻塊。參考圖片列表可替代地稱作參考幀列表。當所述參考圖片列表中的一者比另一參考圖片列表優(yōu)選時,默認將所述優(yōu)選參考圖片列表用于單向預測可能更有效。當GPB幀經(jīng)啟用以使得第一參考圖片列表與第二參考圖片列表相同時,情況尤其如此。在所述狀況下,第一參考圖片列表及第二參考圖片列表中的任一者可用于單向預測。本發(fā)明的技術包括使用小于兩個位來譯碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻塊的一個或一個以上語法元素。舉例來說,針對視頻塊的運動預測方向的常規(guī)語法元素可包括用以指示使用單向預測模式或是雙向預測模式來編碼所述視頻塊的第一位,及用以指示參考圖片列表用于單向預測模式的第二位。在相同參考圖片列表的狀況下,常規(guī)語法元素的第二位可為冗余的,這是因為所述參考圖片列表中的任一者可互換地用于單向預測模式。在優(yōu)選參考圖片列表的狀況下,可通過指派一值以表示指示相對于所述優(yōu)選參考圖片列表中的參考圖片的單向預測模式的語法元素來譯碼所述語法元素。根據(jù)所述技術,可將語法元素概率偏向或二進制化,以使得經(jīng)指派的值可小于兩個位。在任一狀況下,所述技術減少用以譯碼指示視頻塊的運動預測方向的語法元素的位的數(shù)目。在一個實例中,本發(fā)明是針對一種譯碼視頻數(shù)據(jù)的方法,所述方法包含使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻幀的視頻塊;及譯碼指示使用相對于所述參考圖片列表中的所述參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的一個或一個以上語法元素,其中使用小于兩個位來譯碼所述語法元素。在另一實例中,本發(fā)明是針對一種視頻譯碼裝置,所述視頻譯碼裝置包含存儲器,所述存儲器存儲經(jīng)解碼的參考圖片;及處理器,所述處理器使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻幀的視頻塊,且譯碼指示 使用相對于所述參考圖片列表中的所述參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的一個或一個以上語法元素,其中使用小于兩個位來譯碼所述語法元素。在另一實例中,本發(fā)明是針對一種視頻譯碼裝置,所述視頻譯碼裝置包含用于使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻幀的視頻塊的裝置;及用于譯碼指示使用相對于所述參考圖片列表中的所述參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的一個或一個以上語法元素的裝置,其中使用小于兩個位來譯碼所述語法元素。在另一實例中,本發(fā)明是針對一種包含用于譯碼視頻數(shù)據(jù)的指令的計算機可讀存儲媒體,所述指令在于處理器中執(zhí)行時使所述處理器使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻幀的視頻塊;及譯碼指示使用相對于所述參考圖片列表中的所述參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的一個或一個以上語法元素,其中使用小于兩個位來譯碼所述語法元素。
圖1為說明實例視頻編碼及解碼系統(tǒng)的框圖,所述視頻編碼及解碼系統(tǒng)可利用用于有效地譯碼視頻幀的視頻塊的預測信息的技術。圖2為說明包括GPB幀的實例視頻序列的概念圖。圖3為說明實例視頻編碼器的框圖,所述視頻編碼器可實施用于有效地譯碼視頻幀的視頻塊的預測信息的技術。圖4為說明實例視頻解碼器的框圖,所述視頻解碼器可實施用于有效地譯碼視頻幀的視頻塊的預測信息的技術。圖5為說明編碼指示使用單向預測模式來譯碼GPB幀的視頻塊的單一位語法元素的實例操作的流程圖。圖6為說明解碼指示使用單向預測模式來譯碼GPB幀的視頻塊的單一位語法元素的實例操作的流程圖。圖7為說明使用小于兩個位來編碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式來譯碼視頻塊的一個或一個以上語法元素的實例操作的流程圖。圖8為說明使用小于兩個位來編碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式來譯碼視頻塊的一個或一個以上語法元素的另一實例操作的流程圖。圖9為說明聯(lián)合地譯碼使用雙向預測模式而編碼的GPB幀的視頻塊的第一運動向量及第二運動向量的實例操作的流程圖。
具體實施例方式本發(fā)明涉及用于減少視頻譯碼中譯碼預測信息的成本的技術??墒褂脝蜗蝾A測模式通過相對于第一參考圖片列表及第二參考圖片列表中的一者中的參考圖片的單一運動向量,或使用雙向預測模式通過相對于第一參考圖片列表中的參考圖片的第一運動向量及相對于第二參考圖片列表中的參考圖片的第二運動向量來譯碼幀間譯碼幀的視頻塊。在某些實例中,本發(fā)明具體來說涉及啟用廣義P/B(GPB)幀以使得第一參考圖片列表與第二參考圖片列表相同的狀況。一般來說,參考圖片列表可替代地稱作參考巾貞列表。本發(fā)明的技術包括減少用以用信號發(fā)送指示視頻塊的運動預測方向的一個或一個以上語法元素的位。當參考圖片列表中的一者比另一參考圖片列表優(yōu)選時,默認將所述優(yōu)選參考圖片列表用于單向預測模式可能更有效。當啟用GPB幀時,情況尤其如此。在所述狀況下,所述兩個相同參考圖片列表中的任一者可用于單向預測模式。本發(fā)明的技術包括使用小于兩個位來譯碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻塊的一個或一個以上語法元素。本發(fā)明的技術還包括減少用以用信號發(fā)送使用雙向預測模式而編碼的視頻塊的運動向量信息的位??墒褂秒p向預測模式通過來自相同參考圖片或?qū)嵸|(zhì)上類似的參考圖片的兩個運動向量來編碼GPB幀的一個或一個以上塊。本發(fā)明的技術可包括聯(lián)合地譯碼GPB幀的視頻塊的第一運動向量與第二運動向量。圖1為說明實例視頻編碼及解碼系統(tǒng)10的框圖,所述視頻編碼及解碼系統(tǒng)10可利用用于有效地譯碼視頻幀的視頻塊的預測信息的技術。如圖1中所展示,系統(tǒng)10包括源裝置12,所述源裝置12經(jīng)由通信信道16將經(jīng)編碼的視頻傳輸?shù)侥康牡匮b置14。源裝置12及目的地裝置14可包含廣泛范圍的裝置中的任一者。在一些狀況下,源裝置12及目的地裝置14可包含可經(jīng)由通信信道16傳達視頻信息的無線通信裝置,在此種狀況下,通信信道16為無線信道。然而,本發(fā)明的技術(所述技術涉及有效地譯碼視頻塊的預測信息)不必限于無線應用或設定。舉例來說,這些技術可適用于空中電視廣播、有線電視傳輸、衛(wèi)星電視傳輸、因特網(wǎng)視頻傳輸、編碼于存儲媒體上的經(jīng)編碼的數(shù)字視頻,或其它情形。因此,通信信道16可包含適于傳輸經(jīng)編碼的視頻數(shù)據(jù)的無線或有線媒體的任何組合,且裝置12、14可包含多種有線或無線媒體裝置中的任一者,例如,移動電話、智能電話、數(shù)字媒體播放器、機頂盒、電視、顯示器、桌上型計算機、便攜型計算機、平板計算機、游戲控制臺、便攜型游戲裝置,或其類似者。在圖1的實例中,源裝置12包括視頻源18、視頻編碼器20、調(diào)制器/解調(diào)器(調(diào)制解調(diào)器)22及發(fā)射器24。目的地裝置14包括接收器26、調(diào)制解調(diào)器28、視頻解碼器30及顯示裝置32。在其它實例中,源裝置及目的地裝置可包括其它組件或布置。舉例來說,源裝置12可從例如外部相機、視頻存儲檔案、計算機圖形源或其類似者的外部視頻源18接收視頻數(shù)據(jù)。同樣,目的地裝置14可與外部顯示裝置介接,而非包括集成式顯示裝置。圖1所說明的系統(tǒng)10僅為一個實例??赏ㄟ^任何數(shù)字視頻編碼及/或解碼裝置來執(zhí)行用于有效地譯碼視頻塊的預測信息的技術。也可通過視頻編碼器/解碼器(通常稱作“編解碼器(CODEC)”)來執(zhí)行所述技術。此外,也可通過視頻預處理器執(zhí)行本發(fā)明的技術。源裝置12及目的地裝置14僅為這些譯碼裝置的實例,其中源裝置12產(chǎn)生用于傳輸?shù)侥康牡匮b置14的經(jīng)譯碼的視頻數(shù)據(jù)。在一些實例中,裝置12、14可以實質(zhì)上對稱的方式操作,使得裝置12、14中的每一者包括視頻編碼及解碼組件。因此,系統(tǒng)10可支持視頻裝置12、14之間的單向或雙向視頻傳輸,以(例如)用于視頻串流傳輸、視頻回放、視頻廣播或視頻電話。源裝置12的視頻源18可包括視頻俘獲裝置,例如,攝像機、含有先前俘獲的視頻 的視頻檔案,及/或來自視頻內(nèi)容提供者的視頻饋送。作為另一替代例,視頻源18可產(chǎn)生基于計算機圖形的數(shù)據(jù)作為源視頻,或?qū)崨r視頻、經(jīng)存檔的視頻與計算機產(chǎn)生的視頻的組合。在一些狀況下,如果視頻源18為攝像機,則源裝置12與目的地裝置14可形成所謂的相機電話或視頻電話。然而,如上文所提及,本發(fā)明中所描述的技術可一般性地適用于視頻譯碼,且可應用于無線及/或有線應用。在每一狀況下,可通過視頻編碼器20編碼經(jīng)俘獲、預先俘獲或計算機產(chǎn)生的視頻??山又ㄟ^調(diào)制解調(diào)器22根據(jù)一通信標準調(diào)制經(jīng)編碼的視頻信息,且經(jīng)由發(fā)射器24將所述經(jīng)編碼的視頻信息傳輸?shù)侥康牡匮b置14。調(diào)制解調(diào)器22可包括各種混頻器、濾波器、放大器或經(jīng)設計用于信號調(diào)制的其它組件。發(fā)射器24可包括經(jīng)設計用于傳輸數(shù)據(jù)的電路,包括放大器、濾波器及一個或一個以上天線。根據(jù)本發(fā)明,源裝置12的視頻編碼器20可經(jīng)配置以應用用于減少譯碼視頻塊的預測信息的成本的技術。舉例來說,在單向預測模式的狀況下,視頻編碼器20可使用小于兩個位來編碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來編碼視頻塊的一個或一個以上語法元素。參考圖片列表可為兩個不同參考圖片列表中的一個優(yōu)選參考圖片列表,或在啟用GPB巾貞時為兩個相同參考圖片列表中的任一者。參考圖片列表可替代地稱作參考幀列表。作為另一實例,在雙向預測模式的狀況下,視頻編碼器20可通過來自兩個相同參考圖片列表的兩個運動向量來編碼GPB幀的一個或一個以上視頻塊,且聯(lián)合地譯碼所述視頻塊中的每一者的所述兩個運動向量。所述兩個運動向量可來自相同參考圖片或?qū)嵸|(zhì)上類似的參考圖片。目的地裝置14的接收器26經(jīng)由信道16接收信息,且調(diào)制解調(diào)器28解調(diào)所述信息。經(jīng)由信道16所傳達的信息可包括由視頻編碼器20所定義的語法信息(其也由視頻解碼器30使用),所述語法信息包括描述經(jīng)譯碼的視頻(例如,視頻片段、視頻幀及視頻序列或圖片群組(GOP))的預測單元(TO)、譯碼單元(CU)或其它單元的特性及/或處理的語法元素。顯示裝置32向用戶顯示經(jīng)解碼的視頻數(shù)據(jù),且可包含多種顯示裝置中的任一者,例如,陰極射線管(CRT)、液晶顯示器(LCD)、等離子顯示器、有機發(fā)光二極管(OLED)顯示器或另一類型的顯示裝置。根據(jù)本發(fā)明,目的地裝置14的視頻解碼器30可經(jīng)配置以應用用于減少譯碼視頻塊的預測信息的成本的技術。舉例來說,在單向預測模式的狀況下,視頻解碼器30可使用小于兩個位來解碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻塊的一個或一個以上語法元素。參考圖片列表可為兩個不同參考圖片列表中的一個優(yōu)選參考圖片列表,或在啟用GPB巾貞時為兩個相同參考圖片列表中的任一者。作為另一實例,在雙向預測模式的狀況下,視頻解碼器30可聯(lián)合地解碼GPB幀的一個或一個以上視頻塊中的每一者的兩個運動向量,且通過來自兩個相同參考圖片列表的兩個運動向量來解碼所述視頻塊中的每一者。所述兩個運動向量可來自相同參考圖片或?qū)嵸|(zhì)上類似的參考圖片。在圖1的實例中,通信信道16可包含任何無線或有線通信媒體,例如,射頻(RF)頻譜或一個或一個以上物理傳輸線,或無線媒體與有線媒體的任何組合。通信信道16可形成基于包的網(wǎng)絡(例如,局域網(wǎng)絡、廣域網(wǎng)絡或例如因特網(wǎng)的全球網(wǎng)絡)的部分。通信信道16—般表示用于將視頻數(shù)據(jù)從源裝置12傳輸?shù)侥康牡匮b置14的任何合適通信媒體或不同 通信媒體的集合,包括有線或無線媒體的任何合適組合。通信信道16可包括路由器、交換器、基站,或可用于促進從源裝置12到目的地裝置14的通信的任何其它設備。視頻編碼器20及視頻解碼器30可根據(jù)例如新興高效率視頻譯碼(HEVC)標準或ITU-T H. 264標準(替代地稱作MPEG-4第10部分,高級視頻譯碼(AVC))的視頻壓縮標準進行操作。然而,本發(fā)明的技術不限于任何特定譯碼標準。其它實例包括MPEG-2及ITU-TH.263。盡管未在圖1中展示,但在一些方面中,視頻編碼器20及視頻解碼器30可各自與音頻編碼器及解碼器集成,且可包括適當MUX-DEMUX單元或其它硬件及軟件,以處置共同數(shù)據(jù)串流或單獨數(shù)據(jù)串流中的音頻與視頻兩者的編碼。如果適用,則MUX-DEMUX單元可符合ITU H. 223多路復用器協(xié)議或例如用戶數(shù)據(jù)報協(xié)議(UDP)的其它協(xié)議。HEVC標準化努力是基于視頻譯碼裝置的模型(稱作HEVC測試模型(HM))。HM根據(jù)(例如)ITU-T H.264/AVC假設視頻譯碼裝置相對于現(xiàn)有裝置的若干額外能力。舉例來說,H. 264提供九個幀內(nèi)預測編碼模式,而HM提供多達三十三個幀內(nèi)預測編碼模式。HM將視頻數(shù)據(jù)的塊稱作譯碼單元(CU)。位串流內(nèi)的語法數(shù)據(jù)可定義最大譯碼單元(LCU),最大譯碼單元為在像素數(shù)目方面的最大譯碼單元。一般來說,CU具有與H. 264標準的宏塊的目的類似的目的,只是CU不具有大小差別。因此,CU可分裂成若干子CU。一般來說,本發(fā)明中對CU的參考可涉及圖片的最大譯碼單元或LCU的子CU。LCU可分裂成若干子CU,且每一子CU可進一步分裂成若干子CU。位串流的語法數(shù)據(jù)可定義LCU可分裂的最大次數(shù)(其稱作⑶深度)。因此,位串流也可定義最小譯碼單元(SCT)。不進一步分裂的⑶可包括一個或一個以上預測單元(PU)。一般來說,PU表示對應CU的全部或一部分,且包括用于檢索所述PU的參考樣本的數(shù)據(jù)。舉例來說,當是經(jīng)幀內(nèi)模式編碼時,所述PU可包括描述所述的幀內(nèi)預測模式的數(shù)據(jù)。作為另一實例,當PU是經(jīng)幀間模式編碼時,PU可包括描述所述的運動向量的數(shù)據(jù)。定義運動向量的數(shù)據(jù)可描述(例如)運動向量的水平分量、運動向量的垂直分量、運動向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖片,及/或運動向量的參考圖片列表(例如,列表0或列表I)。關于定義F1U的CU的數(shù)據(jù)還可描述(例如)將所述CU劃分成一個或一個以上PU。劃分模式可在CU是經(jīng)跳過或直接模式編碼、經(jīng)幀內(nèi)預測模式編碼或是經(jīng)幀間預測模式編碼之間而不同。
具有一個或一個以上I3U的⑶還可包括一個或一個以上變換單元(TU)。在使用PU的預測之后,視頻編碼器可計算CU的對應于的部分的殘余值。殘余值對應于可變換成經(jīng)量化且經(jīng)掃描以產(chǎn)生串行化變換系數(shù)以用于熵譯碼的變換系數(shù)的像素差值。TU不必限于PU的大小。因此,TU可能大于或小于同一⑶的對應PU。在一些實例中,TU的最大大小可為對應CU的大小。本發(fā)明使用術語“視頻塊”來指代CU、PU或TU中的任一者。視頻編碼器20及視頻解碼器30各自可實施為多種合適編碼器電路(例如,一個或一個以上微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固件,或其任何組合)中的任一者。視頻編碼器20及視頻解碼器30中的每一者可包括于一個或一個以上編碼器或解碼器中,其中任一者可集成為相應相機、計算機、移動裝置、用戶裝置、廣播裝置、機頂盒、服務器或其類似者中的組合的編碼器/解碼器(編解碼器)的部分。視頻序列通常包括一系列視頻幀。圖片群組(GOP) —般包含一系列一個或一個以上視頻幀。GOP可包括GOP的標頭、GOP的一個或一個以上幀的標頭中或別處的語法數(shù)據(jù), 所述語法數(shù)據(jù)描述包括于GOP中的多個巾貞。每一巾貞可包括描述所述相應巾貞的編碼模式的中貞語法數(shù)據(jù)。視頻編碼器20通常對個別視頻幀內(nèi)的視頻塊進行操作,以便編碼視頻數(shù)據(jù)。視頻塊可對應于譯碼單元(CU)或所述CU的劃分單元(PU)。視頻塊可具有固定或變化的大小,且可根據(jù)指定譯碼標準而在大小上不同。每一視頻幀可包括多個片段。每一片段可包括多個⑶,⑶可包括一個或一個以上PU。作為一實例,HEVC測試模型(麗)支持各種⑶大小的預測。IXU的大小可由語法信息定義。假定特定⑶的大小為2NX2N,則HM支持2NX2N或NXN的大小的幀內(nèi)預測,及2NX2N、2NXN、NX2N或NXN的對稱大小的幀間預測。HM還支持幀間預測的2NXnU、2NXnD、nLX 2N及nRX 2N的不對稱分裂。在不對稱分裂中,⑶的一個方向未分裂,而另一方向分裂成25%及75%。⑶的對應于25%分裂的部分是由“n”隨后是“上”、“下”、“左”或“右”的指示來指示。因此,舉例來說,“2NXnU”指代水平上以頂部的2NX0.5N 及底部的 2NX1. 5N PU 分裂的 2NX2N CU。在本發(fā)明中,“NXN”與“N乘N”可互換使用以指代視頻塊(例如,CU、I3U或TU)在垂直尺寸與水平尺寸方面的像素尺寸(例如,16X16像素或16乘16像素)。一般來說,16X16塊將在垂直方向上具有16個像素(y=16),且在水平方向上具有16個像素(x=16)。同樣,NX N塊一般在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數(shù)值。可將塊中的像素布置成行及列。此外,塊不必需要在水平方向上具有與垂直方向相同數(shù)目個像素。舉例來說,塊可包含NXM個像素,其中M不必等于N。在幀內(nèi)預測性或幀間預測性譯碼以產(chǎn)生CU的PU之后,視頻編碼器20可計算殘余數(shù)據(jù)以產(chǎn)生所述⑶的一個或一個以上變換單元(TU)。⑶的I3U可包含空間域(也稱作像素域)中的像素數(shù)據(jù),而⑶的TU可包含(例如)在將例如離散余弦變換(DCT)、整數(shù)變換、小波變換或概念上類似的變換的變換應用于殘余視頻數(shù)據(jù)之后的變換域中的系數(shù)。所述殘余數(shù)據(jù)可對應于CU的PU的未經(jīng)編碼的圖片的像素與預測值之間的像素差。視頻編碼器20可形成包括⑶的殘余數(shù)據(jù)的一個或一個以上TU。視頻編碼器20可接著變換所述TU。在任何變換以產(chǎn)生變換系數(shù)之后,可執(zhí)行變換系數(shù)的量化。量化一般指代將變換系數(shù)量化以可能地減小用以表示所述系數(shù)的數(shù)據(jù)的量的過程。量化過程可減小與所述系數(shù)中的一些或全部相關聯(lián)的位深度。舉例來說,n位值在量化期間可舍去到m位值,其中n大于nio在一些實例中,視頻編碼器20可利用預定義掃描次序來掃描經(jīng)量化的變換系數(shù)以產(chǎn)生可經(jīng)熵編碼的串行化向量。在其它實例中,視頻編碼器20可執(zhí)行自適應性掃描。在掃描經(jīng)量化的變換系數(shù)以形成一維向量之后,視頻編碼器20可(例如)根據(jù)上下文自適應性可變長度譯碼(CAVLC)、上下文自適應性二進制算術譯碼(CABAC)、基于語法的上下文自適應性二進制算術譯碼(SBAC)或另一熵編碼方法而對所述一維向量進行熵編碼。為執(zhí)行CABAC,視頻編碼器20可選擇一上下文模型應用于某一上下文以編碼待傳輸?shù)姆枴K錾舷挛目赡苁顷P于(例如)相鄰符號是否為非零。視頻編碼器20可接著通過參考基于上下文指派給所述符號的概率而指派一值以表示所述符號。在一些狀況下,值可能為分率位,即,小于一位。為執(zhí)行CAVLC,視頻編碼器20可針對待傳輸?shù)姆栠x擇一可變長度碼??蓪LC中的碼字建構成使得相對較短碼對應于更有可能的符號,而較長碼 對應于較不可能的符號。以此方式,相較于(例如)針對待傳輸?shù)拿恳环柺褂孟嗟乳L度的碼字,使用VLC可實現(xiàn)位節(jié)省。概率確定可基于符號的上下文而進行。視頻編碼器20也可對在編碼視頻塊時所產(chǎn)生的運動預測方向及運動向量信息的語法元素進行熵編碼。根據(jù)本發(fā)明的技術,視頻編碼器20可減少譯碼視頻塊的預測信息的成本。舉例來說,在單向預測模式的狀況下,視頻編碼器20可使用小于兩個位來編碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來編碼視頻塊的一個或一個以上語法元素。參考圖片列表可為兩個不同參考圖片列表中的一個優(yōu)選參考圖片列表,或在啟用GPB巾貞時為兩個相同參考圖片列表中的任一者。作為另一實例,在雙向預測模式的狀況下,視頻編碼器20可通過來自兩個相同參考圖片列表的兩個運動向量來編碼GPB幀的一個或一個以上視頻塊,且聯(lián)合地編碼所述視頻塊中的每一者的所述兩個運動向量。所述兩個運動向量可來自相同參考圖片或?qū)嵸|(zhì)上類似的參考圖片。視頻解碼器30可用與視頻編碼器20的操作方式基本上對稱的方式來操作。舉例來說,視頻解碼器30可接收表示經(jīng)編碼的⑶的經(jīng)熵編碼的數(shù)據(jù),其包括經(jīng)編碼的PU及TU數(shù)據(jù)。此所接收的數(shù)據(jù)可包括在編碼視頻塊時所產(chǎn)生的運動預測方向及運動向量信息的語法元素。視頻解碼器30還可減少譯碼視頻塊的預測信息的成本。舉例來說,在單向預測模式的狀況下,視頻解碼器30可使用小于兩個位來解碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來編碼視頻塊的一個或一個以上語法元素。參考圖片列表可為兩個不同參考圖片列表中的一個優(yōu)選參考圖片列表,或在啟用GPB幀時為兩個相同參考圖片列表中的任一者。作為另一實例,在雙向預測模式的狀況下,視頻解碼器30可聯(lián)合地解碼GPB幀的一個或一個以上視頻塊中的每一者的兩個運動向量,且通過從兩個相同參考圖片列表所計算的兩個運動向量來解碼所述視頻塊中的每一者。可從相同參考圖片或類似參考圖片計算所述兩個運動向量。視頻編碼器20及視頻解碼器30各自可在適用時實施為多種合適編碼器或解碼器電路(例如,一個或一個以上微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯電路、軟件、硬件、固件,或其任何組合)中的任一者。視頻編碼器20及視頻解碼器30中的每一者可包括于一個或一個以上編碼器或解碼器中,其中任一者可集成為組合的視頻編碼器/解碼器(編解碼器)的部分。包括視頻編碼器20及/或視頻解碼器30的裝置可包含集成電路、微處理器及/或無線通信裝置(例如,蜂窩式電話)。圖2為說明實例視頻序列33的概念圖,所述實例視頻序列33包括廣義P/B (GPB)幀36A到36B及38A到38B。在一些狀況下,視頻序列33可稱作圖片群組(GOP)。如所說明的視頻序列33按顯示次序包括幀354、364、38々、358、368、388及35(,及最后幀39。幀34為按顯式次序在序列33之前所出現(xiàn)的序列的最后幀。圖2大體上表示視頻序列的示范性預測結(jié)構,且僅希望說明用于編碼不同幀間模式幀類型的幀參考。實際視頻序列可含有具有不同幀類型且呈不同顯示次序的更多或更少視頻幀。對于基于塊的視頻譯碼來說,可將包括于序列33中的視頻幀中的每一者劃分成若干視頻塊或若干譯碼單元(CU)。視頻幀的每一 CU可包括一個或一個以上預測單元(PU)。使用相對于同一幀內(nèi)譯碼(I)的幀中的相鄰塊的空間預測來編碼所述幀中的視頻塊或PU。幀間譯碼(P或B或GPB)的幀中的視頻塊或I3U可使用相對于同一幀中的相鄰塊的空間預·測或相對于其它參考圖片的時間預測??墒褂秒p向預測以從兩個不同參考圖片列表(傳統(tǒng)上,一個過去幀及一個未來幀)計算兩個運動向量來編碼B幀中的視頻塊。在一些狀況下,可使用來自兩個不同參考圖片列表中的一者的單向預測來編碼B幀中的視頻塊??墒褂脝蜗蝾A測以從單一參考圖片列表(傳統(tǒng)上,一過去幀)計算單一運動向量來編碼P幀中的視頻塊。根據(jù)新興HEVC標準,可使用單向預測以從兩個相同參考圖片列表中的一者計算單一運動向量或使用雙向預測以從所述兩個相同參考圖片列表計算兩個運動向量來編碼GPB幀中的視頻塊。所述兩個相同參考圖片列表可含有過去參考圖片。在一些狀況下,當給定視頻片段、視頻幀或視頻序列完全啟用GPB幀時,GPB幀可替換標準P幀。在此狀況下,可將所有標準P幀視為GPB幀,以使得視頻編碼器可確定將幀間模式幀編碼為B幀或GPB幀。在其它狀況下,當部分啟用GPB幀時,可使用全部三種幀間預測模式。在此狀況下,視頻編碼器可確定將幀間模式幀編碼為B幀、P幀或是GPB幀。在圖2的實例中,將最后幀39指定用于幀內(nèi)模式譯碼作為I幀。在其它實例中,可參考前一序列的最后幀34通過幀間模式譯碼將最后幀39編碼(例如)為P幀。將視頻幀35A到35C(統(tǒng)稱“視頻幀35”)指定用于使用參考一過去幀及一未來幀的雙向預測而譯碼為B幀。在所說明的實例中,參考最后幀34及幀36A將幀35A編碼為B幀,如由從幀34及幀36A到視頻幀35A的箭頭所指示。幀35B及35C經(jīng)類似編碼。可將視頻幀36A到36B (統(tǒng)稱“視頻幀36”)指定用于使用參考一過去幀的單向預測而譯碼為標準P幀或GPB幀。在所說明的實例中,參考最后幀34將幀36A編碼為P幀或GPB幀,如由從幀34到視頻幀36A的箭頭所指示。幀36B經(jīng)類似編碼??蓪⒁曨l幀38A到38B(統(tǒng)稱“視頻幀38”)指定用于使用參考同一過去幀的雙向預測而譯碼為GPB幀。在其它實例中,可使用參考包括于同一參考圖片列表中的實質(zhì)上類似的過去幀的雙向預測來編碼GPB幀。在所說明的實例中,通過對幀36A的兩次參考將幀38A編碼為GPB巾貞,如由從幀36A到視頻幀38A的兩個箭頭所指示。幀38B經(jīng)類似編碼。圖3為說明視頻編碼器20的一實例的框圖,所述視頻編碼器20可實施用于有效地譯碼視頻幀的視頻塊的預測信息的技術。視頻編碼器20可執(zhí)行視頻幀內(nèi)的塊(包括CU或CU的PU)的幀內(nèi)及幀間譯碼。幀內(nèi)譯碼依賴于空間預測以減少或移除給定視頻幀內(nèi)的視頻的空間冗余。幀間譯碼依賴于時間預測以減少或移除視頻序列的鄰近幀內(nèi)的視頻的時間冗余。幀內(nèi)模式(I模式)可指代若干基于空間的壓縮模式中的任一者。例如單向預測(P模式)、雙向預測(B模式)或廣義P/B預測(GPB模式)的幀間模式可指代若干基于時間的壓縮模式中的任一者。如圖3中所展示,視頻編碼器20接收待編碼的視頻幀內(nèi)的當前視頻塊。在圖3的實例中,視頻編碼器20包括模式選擇單元40、預測單元41、參考圖片存儲器64、求和器50、變換單元52、量化單元54,及熵編碼單元56。預測單元41包括運動估計單元42、運動補償單元44,及巾貞內(nèi)預測單元46。對于視頻塊重建構來說,視頻編碼器20還包括反量化單元58、反變換單元60,及求和器62。還可包括解塊濾波器(圖3中未展示)以對塊邊界進行濾波以從經(jīng)重建構的視頻移除方塊效應假影。必要時,所述解塊濾波器將通常對求和器62的輸出進行濾波。在編碼過程期間,視頻編碼器20接收待譯碼的視頻幀或片段??蓪蚱蝿澐?成多個CU或視頻塊。模式選擇單元40可基于誤差結(jié)果針對當前視頻塊選擇譯碼模式(幀內(nèi)或幀間)中的一者,且預測單元41可將所得幀內(nèi)或幀間譯碼的塊提供到求和器50以產(chǎn)生殘余塊數(shù)據(jù),且將所得幀內(nèi)或幀間譯碼的塊提供到求和器62以重建構經(jīng)編碼的塊供用作參考圖片。預測單元41內(nèi)的幀內(nèi)預測單元46可執(zhí)行當前視頻塊相對于處于與待譯碼的當前塊相同的幀或片段中的一個或一個以上相鄰塊的幀內(nèi)預測性譯碼,以提供空間壓縮。預測單元41內(nèi)的運動估計單元42及運動補償單元44執(zhí)行當前視頻塊相對于一個或一個以上參考圖片中的一個或一個以上預測性塊的幀間預測性譯碼,以提供時間壓縮。可從包括存儲于參考圖片存儲器64中的參考圖片的識別符的第一參考圖片列表(列表0)66及/或第二參考圖片列表(列表1)68選擇一個或一個以上參考圖片。運動估計單元42可經(jīng)配置以根據(jù)視頻序列的預定型樣而確定視頻幀的幀間預測模式。預定型樣可將序列中的視頻幀指定為P幀及/或B幀。在一些狀況下,可啟用GPB幀以使得可將一個或一個以上視頻幀指定為GPB幀。在其它狀況下,當啟用GPB幀時,運動估計單元42可確定是否將最初指定的P幀編碼為GPB幀。后一狀況可視GPB幀是經(jīng)完全啟用還是經(jīng)部分啟用而定。可高度集成運動估計單元42與運動補償單元44,但出于概念的目的而對其單獨加以說明。由運動估計單元42所執(zhí)行的運動估計為產(chǎn)生運動向量的過程,運動向量估計視頻塊的運動。運動向量(例如)可指示當前視頻幀內(nèi)的PU或視頻塊相對于參考圖片內(nèi)的預測性塊的移位。預測性塊為在像素差方面被發(fā)現(xiàn)與包括PU的CU的待譯碼部分緊密匹配的塊,可通過絕對差和(SAD)、平方差和(SSD)或其它差異量度來確定像素差。在一些實例中,視頻編碼器20可計算存儲于參考圖片存儲器64中的參考圖片的次整數(shù)(sub-1nteger)像素位置的值。舉例來說,視頻編碼器20可計算參考圖片的四分之一像素位置、八分之一像素位置或其它分率像素位置的值。因此,運動估計單元42可執(zhí)行相對于完整像素位置及分率像素位置的運動搜索,且以分率像素精度輸出運動向量。運動估計單元42通過比較幀間譯碼幀的I3U與列表066或列表168中所識別的參考圖片的塊而計算幀間譯碼幀的所述PU或視頻塊的運動向量。舉例來說,當幀間譯碼幀包含P幀時,運動估計單元42可使用所述P幀中的視頻塊的單向預測,且從列表066及列表168的包括過去巾貞的識別符的一個列表(傳統(tǒng)上為列表066)計算單一運動向量。舉例來說,當幀間譯碼幀包含B幀時,列表066及列表168將包括不同參考圖片(傳統(tǒng)上,過去圖片及未來圖片)的識別符。運動估計單元42可針對所述B幀的視頻塊使用雙向預測,且從列表066及列表168計算兩個運動向量。在一些狀況下,運動估計單元42可針對B幀的視頻塊使用單向預測,且從參考圖片列表66、68中的一者計算單一運動向量。根據(jù)新興HEVC標準,當幀間譯碼幀包含GPB幀時,列表066及列表168包括相同參考圖片的識別符。更具體來說,包括于列表066及列表168中的每一者中的圖片的數(shù)目是相同的,且由列表066中的每一索引條目所指示的圖片與由列表168中的相同索引條目所指示的圖片相同。包括于列表066及列表168中的參考圖片可包含過去圖片。在此狀況下,運動估計單元42可針對GPB幀的視頻塊使用雙向預測,且從列表066及列表168計算兩個運動向量。運動估計單元42還可針對所述GPB幀的視頻塊使用單向預測,且從列表066及列表168中的一者計算單一運動向量。當所述參考圖片列表中的一者比另一參考圖片列表優(yōu)選時,默認將所述優(yōu)選參考圖片列表用于單向預測可能更有效。在與基于所述參考圖片列表的一者相比,最常基于所述參考圖片列表中的另一者執(zhí)行針對B幀的單向預測時,可能會出現(xiàn)這種狀況。舉例來說,與P幀類似,可通常基于來自列表066的過去參考圖片來執(zhí)行針對B幀的單向預測。在所述實例中,運動補償單元44可確定列表066為優(yōu)選參考圖片列表。在GPB幀經(jīng)啟用以使得列表066與列表168相同時,運動補償單兀44可將列表066與列表168中的任一者互換地用于單向預測,而非在所述兩個相同參考圖片列表之間進行選擇。運動估計單元42將所計算出的運動向量發(fā)送到熵編碼單元56及運動補償單元44。由運動補償單元44所執(zhí)行的運動補償可涉及基于由運動估計所確定的運動向量取得或產(chǎn)生預測性塊。視頻編碼器20通過從正經(jīng)譯碼的當前視頻塊減去預測性塊而形成殘余視頻塊。求和器50表示執(zhí)行此減法運算的組件。運動補償單元44可通過檢索由當前⑶的PU的運動向量所識別的預測性塊而計算所述PU的預測信息。預測信息可包括(例如)運動預測方向、包括運動預測子(motionpredictor)的運動向量信息,及參考圖片列表信息。運動補償單元44也可產(chǎn)生經(jīng)定義以表示針對當前視頻塊或PU所計算的預測信息的語法元素。視頻編碼器20可接著編碼指示預測信息的語法元素,且將所述語法元素用信號發(fā)送到視頻解碼器30。根據(jù)本發(fā)明的技術,視頻編碼器20可減少譯碼視頻塊的預測信息的成本。舉例來說,在單向預測模式的狀況下,視頻編碼器20可使用小于兩個位來編碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻塊的一個或一個以上語法元素。參考圖片列表可為兩個不同參考圖片列表中的一個優(yōu)選參考圖片列表,或在GPB幀經(jīng)啟用時為兩個相同參考圖片列表中的任一者。作為另一實例,在雙向預測模式的狀況下,視頻編碼器20可通過來自兩個相同參考圖片列表的兩個運動向量來編碼GPB幀的一個或一個以上視頻塊,且聯(lián)合地編碼所述視頻塊中的每一者的所述兩個運動向量。所述兩個運動向量可來自相同參考圖片或?qū)嵸|(zhì)上類似的參考圖片。
首先將描述在單向預測的狀況下用于減少譯碼視頻塊的預測信息的成本的技術。運動補償單元44可產(chǎn)生針對當前視頻塊的運動預測方向的語法元素。針對B幀中的視頻塊的運動預測方向的常規(guī)語法元素inter_pred_idc包括用以指示使用單向預測或是雙向預測來編碼所述塊的第一位,及用以指示用于單向預測的參考圖片列表的第二位。在相同參考圖片列表的狀況下,常規(guī)語法元素的第二位可為冗余的,這是因為所述參考圖片列表中的任一者可互換地用于單向預測模式。根據(jù)本發(fā)明的技術,運動補償單元44可通過消除用于單向預測模式的參考圖片列表的指示而產(chǎn)生針對運動預測方向的單一位語法元素。視頻編碼器20接著在視頻塊或PU級編碼用于當前視頻幀的每一視頻塊的運動預測方向連同運動向量信息的單一位語法,且將其用信號發(fā)送到視頻解碼器30。在當前視頻幀被指定為GPB幀時,視頻編碼器20存儲含有存儲于參考圖片存儲器64中的相同參考圖片的識別符的列表066及列表168。由于列表066及列表168包括相同參考圖片,所以運動補償單元44可將所述兩個相同參考圖片列表中的任一者互換地用于單向預測模式。視頻編碼器20使用相對于參考圖片列表中的一者中的參考圖片的單向預測模式來編碼GPB幀的一個或一個以上視頻塊。運動補償單元44可產(chǎn)生單一位語法以表示使用單向預測模式編碼的GPB幀的視 頻塊的運動預測方向。視頻編碼器20還可將GPB幀旗標用信號發(fā)送到視頻解碼器30以指示當前視頻幀編碼為GPB幀。GPB幀旗標可用以向視頻解碼器30明確告知序列內(nèi)的給定視頻幀編碼為GPB幀以使得通過單一位語法編碼視頻塊的運動預測方向。明確發(fā)信號可使視頻解碼器30能夠剖析所述單一位語法以確定運動預測方向。在一些狀況下,視頻編碼器20可能不明確地用信號發(fā)送GPB幀旗標,而是隱含地用信號表示在參考圖片列表相同時將給定幀編碼為GPB幀。下文中更詳細描述GPB幀旗標。在一個實例中,可針對GPB幀定義單獨語法,所述單獨語法包含單一位語法元素(例如,bi_pred_flag),所述單一位語法元素經(jīng)定義以指示是使用單向預測模式還是雙向預測模式來編碼GPB幀的視頻塊。引入單一位語法元素可避免與上文所描述的常規(guī)語法元素(即,inter_pred_idC)混淆。運動補償單元44可產(chǎn)生單一位語法元素以表示GPB幀的視頻塊中的每一者的運動預測方向。視頻編碼器20接著編碼用于GPB幀的視頻塊中的一者或一者以上的單一位語法元素,以指示使用單向預測模式及雙向預測模式中的一者來編碼視頻塊。無必要明確用信號表示使用參考圖片列表66、68中的哪一者來編碼GPB幀的視頻塊,這是因為所述相同參考圖片列表中的任一者可用于單向預測。在另一實例中,可針對GPB幀定義常規(guī)語法元素(即,inter_pred_idc)的單一位模式,其中語法元素的僅第一位用以指示是使用單向預測模式還是雙向預測模式來編碼所述GPB幀的視頻塊。運動補償單元44可產(chǎn)生常規(guī)語法元素的僅第一位以表示GPB幀的視頻塊中的每一者的運動預測方向。視頻編碼器20接著僅編碼GPB幀的視頻塊中的一者或一者以上的語法元素的第一位以指示使用單向預測來編碼視頻塊。運動補償單元44可消除針對GPB幀的視頻塊的語法元素的第二位,這是因為所述參考圖片列表中的任一者可用于單向預測。下文所呈現(xiàn)的表I提供在針對運動預測方向(其中僅編碼第一位以指示GPB幀的視頻塊的單向預測)的常規(guī)語法元素(即,inter_pred_idc)的單一位模式下的初始結(jié)果。表I以低延遲高效率配置呈現(xiàn)針對HM的第0. 7版內(nèi)的若干視頻測試序列的歸因于表示GPB幀的視頻塊的運動預測方向的減少位的語法的位深度減小率百分比。歸因于減少位的語法元素的平均位深度減小率為0. 88%o
表I
權利要求
1.一種譯碼視頻數(shù)據(jù)的方法,其包含 使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻幀的視頻塊;及 譯碼指示使用相對于所述參考圖片列表中的所述參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的一個或一個以上語法元素,其中使用小于兩個位來譯碼所述語法元素。
2.根據(jù)權利要求1所述的方法,其進一步包含存儲第一參考圖片列表及第二參考圖片列表,其中所述第一參考圖片列表與所述第二參考圖片列表相同,且用于所述單向預測模式的所述參考圖片列表包含所述第一參考圖片列表及所述第二參考圖片列表中的任一者;且 其中譯碼一個或一個以上語法元素包含譯碼單一位語法元素,所述單一位語法元素指示使用所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊,而不指示用于所述單向預測模式的所述參考圖片列表。
3.根據(jù)權利要求2所述的方法, 其中譯碼單一位語法元素包含在視頻解碼器處剖析指示使用所述單向預測模式或所述雙向預測模式中的所述一者來譯碼所述視頻塊的所述單一位語法元素;且 其中譯碼視頻塊包含使用相對于所述第一參考圖片列表及所述第二參考圖片列表中的任一者中的參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來解碼所述視頻塊。
4.根據(jù)權利要求2所述的方法,其中譯碼單一位語法元素包含 譯碼語法元素的指示使用所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的第一位 '及 消除所述語法元素的經(jīng)定義以指示用于所述單向預測模式的所述參考圖片列表的第二位。
5.根據(jù)權利要求2所述的方法,其進一步包含,在所述第一參考圖片列表與所述第二參考圖片列表相同時,用信號表示所述視頻幀是譯碼為廣義P/B GPB幀。
6.根據(jù)權利要求5所述的方法,其中用信號表示所述視頻幀是譯碼為GPB幀包含 在視頻解碼器處比較所述第一參考圖片列表與所述第二參考圖片列表;及 在所述第一參考圖片列表與所述第二參考圖片列表相同時確定所述視頻幀是譯碼為GPB 幀。
7.根據(jù)權利要求5所述的方法,其中用信號表示所述視頻幀是譯碼為GPB幀包含用信號發(fā)送指示所述視頻幀在視頻片級、視頻幀級或視頻序列級中的一者譯碼為GPB幀的旗標。
8.根據(jù)權利要求5所述的方法,其中用信號表示所述視頻幀是譯碼為GPB幀包含將所述視頻幀譯碼為GPB片、具有GPB旗標的P片或具有GPB旗標的B片中的一者。
9.根據(jù)權利要求5所述的方法,其進一步包含用信號發(fā)送旗標以指示所述GPB幀在視頻中貞級或視頻序列級中的一者經(jīng)啟用。
10.根據(jù)權利要求1所述的方法,其進一步包含存儲第一參考圖片列表及第二參考圖片列表,其中用于所述單向預測模式的所述參考圖片列表包含所述第一參考圖片列表及所述第二參考圖片列表中的優(yōu)選參考圖片列表;且 其中譯碼所述一個或一個以上語法元素包含指派一值以表示所述語法元素,其中經(jīng)指派以表示指示使用相對于所述優(yōu)選參考圖片列表中的參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素的值包含小于兩個位。
11.根據(jù)權利要求10所述的方法, 其中譯碼所述一個或一個以上語法元素包含在視頻解碼器處解碼經(jīng)指派以表示指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素的所述值;且 其中譯碼視頻塊包含使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來解碼所述視頻塊。
12.根據(jù)權利要求10所述的方法,其中指派一值以表示所述語法元素包含參考將所述語法元素指示所述優(yōu)選參考圖片列表的概率偏向于高于所述語法元素指示非優(yōu)選參考圖片列表的概率的配置數(shù)據(jù)。
13.根據(jù)權利要求12所述的方法,其中指派一值以表示指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述較高概率語法元素包含 指派單一位值以表示語法元素的指示使用所述單向預測模式來譯碼所述視頻塊的第一位;及 指派分率位值以表示所述語法元素的指示所述優(yōu)選參考圖片列表用于所述單向預測模式的第二位,其中所述分率位值包含小于一位。
14.根據(jù)權利要求10所述的方法,其中指派一值以表示所述語法元素包含將單一位二進制自適應性地鏈接到指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素。
15.根據(jù)權利要求14所述的方法,其中將單一位二進制自適應性地鏈接到所述語法元素包含在預測單元級、譯碼單元級、視頻片級、視頻幀級或視頻序列級中的一者用信號發(fā)送所述自適應性二進制。
16.一種視頻譯碼裝置,其包含 存儲器,所述存儲器存儲經(jīng)解碼的參考圖片 '及 處理器,所述處理器使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻幀的視頻塊,且譯碼指示使用相對于所述參考圖片列表中的所述參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的一個或一個以上語法元素,其中使用小于兩個位來譯碼所述語法元素。
17.根據(jù)權利要求16所述的視頻譯碼裝置,其中所述處理器 其中所述存儲器存儲第一參考圖片列表及第二參考圖片列表,其中所述第一參考圖片列表與所述第二參考圖片列表相同,且用于所述單向預測模式的所述參考圖片列表包含所述第一參考圖片列表及所述第二參考圖片列表中的任一者;且 其中所述處理器譯碼單一位語法元素,所述單一位語法元素指示使用所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊,而不指示用于所述單向預測模式的所述參考圖片列表。
18.根據(jù)權利要求17所述的視頻譯碼裝置,其中所述視頻譯碼裝置包含視頻解碼裝置,其中所述處理器 剖析指示使用所述單向預測模式或所述雙向預測模式中的所述一者來譯碼所述視頻塊的所述單一位語法元素;及 使用相對于所述第一參考圖片列表及所述第二參考圖片列表中的任一者中的參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來解碼所述視頻塊。
19.根據(jù)權利要求17所述的視頻譯碼裝置,其中所述處理器譯碼語法元素的指示使用所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的第一位,且消除所述語法元素的經(jīng)定義以指示用于所述單向預測模式的所述參考圖片列表的第二位。
20.根據(jù)權利要求17所述的視頻譯碼裝置,其中在所述第一參考圖片列表與所述第二參考圖片列表相同時,所述處理器用信號表示所述視頻幀是譯碼為廣義P/B GPB幀。
21.根據(jù)權利要求20所述的視頻譯碼裝置,其中所述視頻譯碼裝置包含視頻解碼裝置,且其中所述處理器比較所述第一參考圖片列表與所述第二參考圖片列表,且在所述第一參考圖片列表與所述第二參考圖片列表相同時確定所述視頻幀是譯碼為GPB幀。
22.根據(jù)權利要求20所述的視頻譯碼裝置,其中所述處理器用信號發(fā)送指示所述視頻幀在視頻片級、視頻幀級或視頻序列級中的一者譯碼為GPB幀的旗標。
23.根據(jù)權利要求20所述的視頻譯碼裝置,其中所述處理器將所述視頻幀譯碼為GPB片、具有GPB旗標的P片或具有GPB旗標的B片中的一者以指示所述視頻幀是譯碼為GPB幀。
24.根據(jù)權利要求20所述的視頻譯碼裝置,其中所述處理器用信號發(fā)送旗標以指示所述GPB巾貞在視頻巾貞級或視頻序列級中的一者經(jīng)啟用。
25.根據(jù)權利要求16所述的視頻譯碼裝置, 其中所述存儲器存儲第一參考圖片列表及第二參考圖片列表,其中用于所述單向預測模式的所述參考圖片列表包含所述第一參考圖片列表及所述第二參考圖片列表中的一個優(yōu)選參考圖片列表;且 其中所述處理器指派一值以表示所述語法元素,其中經(jīng)指派以表示指示使用相對于所述優(yōu)選參考圖片列表中的參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素的值包含小于兩個位。
26.根據(jù)權利要求25所述的視頻譯碼裝置,其中所述視頻譯碼裝置包含視頻解碼裝置,其中所述處理器 解碼經(jīng)指派以表示指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素的所述值;及 使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來解碼所述視頻塊。
27.根據(jù)權利要求25所述的視頻譯碼裝置,其中所述處理器通過參考將所述語法元素指示所述優(yōu)選參考圖片列表的概率偏向于高于所述語法元素指示非優(yōu)選參考圖片列表的概率的配置數(shù)據(jù)而指派一值以表示所述語法元素。
28.根據(jù)權利要求27所述的視頻譯碼裝置,其中所述處理器通過以下操作而指派一值以表示指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述較高概率語法元素 指派單一位值以表示語法元素的指示使用所述單向預測模式來譯碼所述視頻塊的第一位;及 指派分率位值以表示所述語法元素的指示所述優(yōu)選參考圖片列表用于所述單向預測模式的第二位,其中所述分率位值包含小于一位。
29.根據(jù)權利要求25所述的視頻譯碼裝置,其中所述處理器通過將單一位二進制自適應性地鏈接到指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素而指派一值以表示所述語法元素。
30.根據(jù)權利要求29所述的視頻譯碼裝置,其中所述處理器在預測單元級、譯碼單元級、視頻片級、視頻幀級或視頻序列級中的一者用信號發(fā)送所述自適應性二進制。
31.一種視頻譯碼裝置,其包含 用于使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻幀的視頻塊的裝置;及 用于譯碼指示使用相對于所述參考圖片列表中的所述參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的一個或一個以上語法元素的裝置,其中使用小于兩個位來譯碼所述語法元素。
32.根據(jù)權利要求31所述的視頻譯碼裝置,其進一步包含 用于存儲第一參考圖片列表及第二參考圖片列表的裝置,其中所述第一參考圖片列表與所述第二參考圖片列表相同,且用于所述單向預測模式的所述參考圖片列表包含所述第一參考圖片列表及所述第二參考圖片列表中的任一者;及 用于譯碼單一位語法元素的裝置,所述單一位語法元素指示使用所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊,而不指示用于所述單向預測模式的所述參考圖片列表。
33.根據(jù)權利要求32所述的視頻譯碼裝置,其中所述視頻譯碼裝置包含視頻解碼裝置,其進一步包含 用于剖析指示使用所述單向預測模式或所述雙向預測模式中的所述一者來譯碼所述視頻塊的所述單一位語法元素的裝置;及 用于使用相對于所述第一參考圖片列表及所述第二參考圖片列表中的任一者中的參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來解碼所述視頻塊的裝置。
34.根據(jù)權利要求32所述的視頻譯碼裝置,其進一步包含 用于譯碼語法元素的指示使用所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的第一位的裝置;及 用于消除所述語法元素的經(jīng)定義以指示用于所述單向預測模式的所述參考圖片列表的第二位的裝置。
35.根據(jù)權利要求32所述的視頻譯碼裝置,其進一步包含在所述第一參考圖片列表與所述第二參考圖片列表相同時用于用信號表示所述視頻幀是譯碼為廣義P/B GPB幀的裝置。
36.根據(jù)權利要求31所述的視頻譯碼裝置,其進一步包含 用于存儲第一參考圖片列表及第二參考圖片列表的裝置,其中用于所述單向預測模式的所述參考圖片列表包含所述第一參考圖片列表及所述第二參考圖片列表中的一個優(yōu)選參考圖片列表;及 用于指派一值以表示所述語法元素的裝置,其中經(jīng)指派以表示指示使用相對于所述優(yōu)選參考圖片列表中的參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素的值包含小于兩個位。
37.根據(jù)權利要求36所述的視頻譯碼裝置,其中所述視頻譯碼裝置包含視頻解碼裝置,所述視頻譯碼裝置進一步包含 用于解碼經(jīng)指派以表示指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素的所述值的裝置;及 用于使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來解碼所述視頻塊的裝置。
38.根據(jù)權利要求36所述的視頻譯碼裝置,其中用于指派一值以表示所述語法元素的所述裝置包含用于參考將所述語法元素指示所述優(yōu)選參考圖片列表的概率偏向于高于所述語法元素指示非優(yōu)選參考圖片列表的概率的配置數(shù)據(jù)的裝置。
39.根據(jù)權利要求36所述的視頻譯碼裝置,其中用于指派一值以表示所述語法元素的所述裝置包含用于將單一位二進制自適應性地鏈接到指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素的裝置。
40.一種包含用于譯碼視頻數(shù)據(jù)的指令的計算機可讀存儲媒體,所述指令在于處理器中執(zhí)行時使所述處理器進行以下操作 使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻幀的視頻塊;及 譯碼指示使用相對于所述參考圖片列表中的所述參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的一個或一個以上語法元素,其中使用小于兩個位來譯碼所述語法元素。
41.根據(jù)權利要求40所述的計算機可讀存儲媒體方法,其進一步包含使所述處理器進行以下操作的指令 存儲第一參考圖片列表及第二參考圖片列表,其中所述第一參考圖片列表與所述第二參考圖片列表相同,且用于所述單向預測模式的所述參考圖片列表包含所述第一參考圖片列表及所述第二參考圖片列表中的任一者;及 譯碼單一位語法元素,所述單一位語法元素指示使用所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊,而不指示用于所述單向預測模式的所述參考圖片列表。
42.根據(jù)權利要求41所述的計算機可讀存儲媒體方法,其中所述指令使所述處理器進行以下操作 在視頻解碼器處剖析指示使用所述單向預測模式或所述雙向預測模式中的所述一者來譯碼所述視頻塊的所述單一位語法元素;及 使用相對于所述第一參考圖片列表及所述第二參考圖片列表中的任一者中的參考圖片的所述單向預測模式及所述雙向預測模式中的所述一者來解碼所述視頻塊。
43.根據(jù)權利要求41所述的計算機可讀存儲媒體方法,其中所述指令使所述處理器進行以下操作 譯碼語法元素的指示使用所述單向預測模式及所述雙向預測模式中的所述一者來譯碼所述視頻塊的第一位;及 消除所述語法元素的經(jīng)定義以指示用于所述單向預測模式的所述參考圖片列表的第二位。
44.根據(jù)權利要求41所述的計算機可讀存儲媒體方法,其進一步包含在所述第一參考圖片列表與所述第二參考圖片列表相同時使所述處理器用信號表示所述視頻幀是譯碼為廣義P/B GPB幀的指令。
45.根據(jù)權利要求40所述的計算機可讀存儲媒體方法,其進一步包含使所述處理器進行以下操作的指令 存儲第一參考圖片列表及第二參考圖片列表,其中用于所述單向預測模式的所述參考圖片列表包含所述第一參考圖片列表及所述第二參考圖片列表中的一個優(yōu)選參考圖片列表;及 指派一值以表示所述語法元素,其中經(jīng)指派以表示指示使用相對于所述優(yōu)選參考圖片列表中的參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素的值包含小于兩個位。
46.根據(jù)權利要求45所述的計算機可讀存儲媒體方法,其中所述指令使所述處理器進行以下操作 在視頻解碼器處解碼經(jīng)指派以表示指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素的所述值;及 使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來解碼所述視頻塊。
47.根據(jù)權利要求45所述的計算機可讀存儲媒體方法,其中所述指令使所述處理器通過參考將所述語法元素指示所述優(yōu)選參考圖片列表的概率偏向于高于所述語法元素指示非優(yōu)選參考圖片列表的概率的配置數(shù)據(jù)而指派一值以表示所述語法元素。
48.根據(jù)權利要求45所述的計算機可讀存儲媒體方法,其中所述指令使所述處理器通過將單一位二進制自適應性地鏈接到指示使用相對于所述優(yōu)選參考圖片列表中的所述參考圖片的所述單向預測模式來譯碼所述視頻塊的所述語法元素而指派一值以表示所述語法元素。
全文摘要
本發(fā)明涉及用于減少視頻譯碼中譯碼預測信息的成本的技術。使用從相同的兩個單獨參考圖片列表中的參考圖片所計算的高達兩個運動向量來編碼廣義P/B GPB幀中的視頻塊。當所述參考圖片列表中的一者比另一參考圖片列表優(yōu)選時,可默認將所述優(yōu)選參考圖片列表用于單向預測。當一GPB幀經(jīng)啟用以使得第一參考圖片列表與第二參考圖片列表相同時,所述第一參考圖片列表與所述第二參考圖片列表中的任一者可用于單向預測。所述技術包括使用小于兩個位來譯碼指示使用相對于參考圖片列表中的參考圖片的單向預測模式及雙向預測模式中的一者來譯碼視頻塊的一個或一個以上語法元素。
文檔編號H04N7/36GK103026709SQ201180036841
公開日2013年4月3日 申請日期2011年7月20日 優(yōu)先權日2010年7月28日
發(fā)明者錢威俊, 陳培松, 王翔林, 馬爾塔·卡切維奇, 陳盈, 穆哈默德·Z·科班 申請人:高通股份有限公司