視頻性質的指示的制作方法
【專利說明】
[0001] 本申請案主張2012年10月4日申請的第61/709,922號美國臨時申請案的優先 權,所述美國臨時申請案的整個內容W引用的方式并入本文中。
技術領域
[0002] 本發明設及視頻譯碼。
【背景技術】
[0003] 數字視頻能力可并入到廣泛范圍的裝置中,包含數字電視、數字直播系統、無線廣 播系統、個人數字助理(PDA)、膝上型或桌上型計算機、平板計算機、電子圖書閱讀器、數碼 相機、數字記錄裝置、數字媒體播放器、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛星無線 電電話、所謂的"智能電話"、視頻電話會議裝置、視頻流式發射裝置及其類似者。數字視頻 裝置實施視頻譯碼技術,例如由MPEG-2、MPEG-4、口U-TH. 263或口U-TH. 264/MPEG-4第 10部分高級視頻譯碼(AVC)所定義的標準、目前正在開發的高效率視頻譯碼(肥VC)標準及 該些標準的擴展中所描述的視頻譯碼技術。肥VC包含用于指示交錯視頻的字段指示補充增 強信息(SEI)消息和用于指示帖封裝立體3D視頻的帖封裝布置(FPA)SEI消息的規范。視 頻裝置可通過實施此類視頻譯碼技術而更有效率地發射、接收、編碼、解碼及/或存儲數字 視頻信息。
[0004] 視頻譯碼技術包含空間(圖片內)預測及/或時間(圖片間)預測W減少或移除 視頻序列中固有的冗余。對于基于塊的視頻譯碼來說,視頻切片(即,視頻帖或視頻帖的一 部分)可W分割成視頻塊,視頻塊還可被稱作樹塊、譯碼單元(CU)及/或譯碼節點。使用 相對于同一圖片中的相鄰塊中的參考樣本的空間預測對圖片的經帖內譯碼(I)切片中的 視頻塊進行編碼。圖片的經帖間編碼(P或B)切片中的視頻塊可使用相對于同一圖片中的 相鄰塊中的參考樣本的空間預測或相對于其它參考圖片中的參考樣本的時間預測。圖片可 被稱作帖,且參考圖片可被稱作參考帖。
[0005] 空間或時間預測導致對塊的預測性塊進行譯碼。殘余數據表示待譯碼的原始塊與 預測塊之間的像素差。經帖間譯碼塊是根據指向形成預測塊的參考樣本塊的運動向量及指 示經譯碼塊與預測塊之間的差的殘余數據編碼的。經帖內譯碼塊是根據帖內譯碼模式和殘 余數據來編碼的。為了實現進一步壓縮,可W將殘余數據從像素域變換到變換域,從而產生 殘余變換系數,接著可W對殘余變換系數進行量化。可掃描最初布置為二維陣列的經量化 變換系數,W便產生變換系數的一維向量,且可應用滴譯碼W實現更多壓縮。
【發明內容】
[0006] 一股來說,本發明描述用于在序列參數集(SPS)中指示視頻序列的經譯碼性質的 技術。更具體來說,本發明描述用于再使用序列參數集中存在的簡檔、層次和層級語法結構 的技術。
[0007] 在一個實例中,對視頻數據進行解碼的方法包含由視頻解碼器接收經譯碼視頻序 列w及將用于所述經譯碼視頻序列的保留位語法元素的一或多個位解碼為一或多個譯碼 工具啟用位,其中所述保留位語法元素是包含簡檔和層級信息的語法結構的部分,且其中 所述一或多個譯碼工具啟用位指示一或多個譯碼工具是否經啟用W由所述視頻解碼器用 于對所述經譯碼視頻序列進行解碼。
[000引在另一實例中,對視頻數據進行編碼的方法包含確定待編碼視頻序列W及由視頻 編碼器對視頻序列進行編碼。所述方法進一步包含將用于所述經編碼視頻序列的保留位語 法元素的一或多個位編碼為一或多個譯碼工具啟用位,其中所述保留位語法元素是包含簡 檔和層級信息的語法結構的部分,且其中所述一或多個譯碼工具啟用位指示一或多個譯碼 工具是否經啟用W由所述視頻編碼器用于對所述視頻序列進行編碼。
[0009] 在另一實例中,一種裝置包含視頻譯碼器,所述視頻譯碼器經配置W確定待譯碼 視頻序列,對所述視頻序列進行譯碼,且將用于所述經譯碼視頻序列的保留位語法元素的 一或多個位譯碼為一或多個譯碼工具啟用位,其中所述保留位語法元素是包含簡檔和層級 信息的語法結構的部分,且其中所述一或多個譯碼工具啟用位指示一或多個譯碼工具是否 經啟用W由所述視頻譯碼器用于對所述視頻序列進行譯碼。
[0010] 在另一實例中,一種裝置包含用于確定待譯碼視頻序列的裝置和用于對所述視頻 序列進行譯碼的裝置。所述裝置進一步包含將用于所述經編碼視頻序列的保留位語法元素 的一或多個位譯碼為一或多個譯碼工具啟用位的裝置,其中所述保留位語法元素是包含簡 檔和層級信息的語法結構的部分,且其中所述一或多個譯碼工具啟用位指示一或多個譯碼 工具是否經啟用W由所述視頻譯碼器用于對所述視頻序列進行譯碼。
[0011] 在另一實例中,計算機可讀存儲媒體經編碼有指令,所述指令當執行時致使用于 對視頻數據進行譯碼的裝置的處理器確定待譯碼視頻序列,對所述視頻序列進行譯碼,且 將用于所述經譯碼視頻序列的保留位語法元素的一或多個位譯碼為一或多個譯碼工具啟 用位,其中所述保留位語法元素是包含簡檔和層級信息的語法結構的部分,且其中所述一 或多個譯碼工具啟用位指示一或多個譯碼工具是否經啟用W由視頻譯碼器用于對視頻序 列進行譯碼。
[0012] 在一些實例中,所述語法結構是符合高效率視頻譯碼(肥VC)標準的profile_ tier_level語法結構。此外,在一些實例中,所述保留位語法元素是profile_tie;r_level 語法結構的general_reserved_ze;ro_l^its保留位語法元素。
[0013] 在另一實例中,所述一或多個譯碼工具啟用位未經包含作為參數集中的語法結構 外部的其它語法元素,包含視頻參數集(VP巧和序列參數集(SP巧語法信息。
[0014] 一或多個實例的細節陳述于附圖及W下描述中。其它特征、目標及優勢將從所述 描述及所述圖式W及從權利要求書顯而易見。
【附圖說明】
[0015] 圖1是說明根據本發明中描述的技術的可利用用于指示一些經譯碼性質的技術 的實例視頻編碼和解碼系統的框圖。
[0016] 圖2是圖解說明可實施本發明中描述的技術的實例視頻編碼器的框圖。
[0017] 圖3是圖解說明可實施本發明中描述的技術的實例視頻解碼器的框圖。
[0018] 圖4是說明根據本發明中描述的技術的對視頻序列進行解碼的實例方法的流程 圖。
[0019] 圖5是說明根據本發明中描述的技術的對視頻序列進行編碼的實例方法的流程 圖。
【具體實施方式】
[0020] 一股來說,本發明描述用于在序列參數集(SPS)中指示一或多個經譯碼性質的技 術。更具體來說,本發明的技術使用簡檔、層次和層級語法結構來指示視頻序列的經譯碼性 質。profile_tie;r_level語法結構可在視頻譯碼中根據例如高效率視頻譯碼她VC)標準 等視頻標準在SPS或視頻參數集(VP巧中用信號表示。本文所描述的技術針對經設計W理 解profile_tie;r_level語法結構的輸送標準改善對視頻性質的輕量存取。
[002U 例如肥VC等一些標準界定profile_tier_level語法結構,其包含用于解譯和/ 或譯碼與所述語法結構相關聯的視頻數據的語法元素。簡檔、層次和層級W跨越具有相似 功能要求的各種應用可互操作的方式指定用于實施例如肥VC等標準的符合性點。另外, 指示用于對視頻數據進行譯碼的其它視頻性質的語法元素或旗標可包含在profile_tier_ level語法結構外部的語法結構中,例如在SPS或視頻參數集(VP巧中的別處。該些語法 元素或旗標可指示是否啟用各種譯碼工具用于視頻數據。
[0022] 用于一些視頻裝置的輸送標準,包含(例如)國際標準化組織(ISO)基礎媒體文 件格式、MPEG-2系統、經由超文本傳送協議(HIT巧的動態自適應流式傳輸值ASH)和實時 傳輸協議(RT巧,可經設計W理解profile_tier_level語法結構的至少前若干位。然而,除 profile_tier_level語法結構W外,SPS或VPS中包含的其它額外信息較少可存取。因此, 本發明的一些技術使用profile_tier_level語法結構的一或多個位提供旗標W指示是否 啟用各種譯碼工具,所述旗標原本將包含在SPS或VI^S的較少可存取部分中。在一些實例 中,一或多個譯碼啟用工具位可在作為包含簡檔和層級信息的語法結構的部分或與所述語 法結構連續的保留位語法元素中經譯碼。所述語法結構可為profile_tier_level語法結 構且可位于參數集中。
[0023] 例如肥VC工作草案8 (在本文中被稱作"WD8")的肥VC的草案包含保留用于未 來目的的位的general_reserved_ze;ro_l^its語法元素。本發明中的技術使用profile_ tier_level語法結構中的一些保留位提供旗標W指示各種譯碼工具是否經啟用。譯碼工 具的實例包含顯式經加權預測(除默認(1/2,1/2)、(1,〇)或(〇,1)W外)和/或瓦片是 否經啟用用于經譯碼視頻序列、位流或基本流。可用信號表示的額外實例譯碼工具包含波 前是否經啟用、時間運動向量預測(TMV巧是否經啟用、按比例縮放列表數據是否存在,或 當前位流是否為8位。該些技術提供給定簡檔、層次和層級內的編解碼器之間的更多區分。 換句話說,在給定簡檔/層次/層級內,本發明的技術可使用保留位的一或多個位作為譯 碼工具啟用位W指示某些譯碼工具是否經啟用。在一些實例中,也可W包含一或多個旗標、 general_no_weighted_prediction_flag方負標和general_no_tiles_flag方負標作為語法兀 素的部分。此外,譯碼工具的所有W上指示可彼此獨立。
[0024] 通過在profile_tie;r_level語法結構中包含用于一些譯碼工具的語法元素,它 們并不必須通常存在于SPS中。使用該些技術,所述語法元素可在profile_tier_level語 法結構的前幾個字節中。因此,使用經設計W理解profile_tier_level語法結構的至少前 若干位的輸送標準的視頻裝置可能夠確定一些譯碼工具是否經啟用用于相關聯視頻數據。
[0025]profile_tie;r_level語法結構可在SPS中,或者在VPS中。視頻數據的每一層需 要SPS,導致多個SPS經譯碼且發射。相比之下,VI^S對于視頻數據的所有層僅發送一次。 因此,在VPS中而不是SPS中包含profile_tie;r_level語法結構減少了發送的總位數。
[0026] 圖1是說明根據本發明中描述的技術的可利用用于指示一些經譯碼性質的技術 的實例視頻編碼和解碼系統10的框圖。如圖1中所示,系統10包含源裝置12,其提供稍 后將由目的地裝置14解碼的經編碼視頻數據。確切地說,源裝置12經由可為存儲裝置34 的計算機可讀媒體16將視頻數據提供到目的地裝置14。源裝置12和目的地裝置14可包 括廣泛范圍的裝置中的任一者,包含數字電視、數字直播系統、無線廣播系統、個人數字助 理(PDA)、膝上型或桌上型計算機、平板計算機、電子圖書閱讀器、數碼相機、數字記錄裝置、 數字媒體播放器、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛星無線電電話、所謂的"智能 電話"、視頻電話會議裝置、視頻流式傳輸裝置及其類似者。在一些情況下,源裝置12和目 的地裝置14可能經裝備W用于無線通信。
[0027] 例如源裝置12和目的地裝置14等數字視頻裝置實施視頻譯碼技術,例如由 MPEG-2、MPEG-4、ITU-TH. 263、口U-T比 264/MPEG-4 第 10 部分高級視頻編碼(