專利名稱:根據視頻編碼的采樣點自適應偏移(sao)的制作方法
技術領域:
本發明總體涉及數字視頻處理;更具體地,涉及根據該數字視頻處理的處理及操作。
背景技術:
操作用于傳輸數字媒體(例如,圖像、視頻、數據等)的通信系統已經持續開發了多年。對這種采用某種形式的視頻數據的通信系統而言,以一定的幀速率(例如,每秒幀數)輸出或顯示多個數字圖像以實現適用于輸出和消費的視頻信號。在利用視頻數據進行操作的多個這樣的通信系統中,在吞吐量(例如,可以從第一位置傳輸至第二位置的圖像幀的數量)與最終要被輸出或顯示的信號的視頻和/或圖像質量之間存在著折中。當前技術無法充分地或可接受地提供以下手段:即,其可以根據提供充足的或可接受的視頻和/或圖像質量將視頻數據從第一位置傳輸至第二位置,從而保證與通信相關聯的相對少量的開銷,以及各個通信鏈路端的通信設備的相對較低的復雜度等
發明內容
(I) 一種裝置,包括:至少一個輸入端,用于:從至少一個額外裝置接收視頻信號;以及經由信令從所述至少一個額外裝置接收多個頻帶偏移;以及處理器,用于:分析與至少一個最大編碼單元(LCU)相關的多個像素以識別像素值分布,其中,所述最大編碼單元與所述視頻信號相關;基于所述像素值分布推理地識別多個頻帶指數;根據所述視頻信號或基于所述視頻信號的信號的濾波處理將所述多個頻帶偏移應用到所述多個頻帶指數;對所述視頻信號或基于所述視頻信號的信號執行采樣點自適應偏移(SA0)濾波處理以生成第一濾波信號,其中,所述采樣點自適應偏移濾波處理將所述多個頻帶偏移應用到所述多個頻帶指數;以及對所述第一濾波信號執行去塊濾波處理以生成第二濾波信號。( 2 )根據(I)所述的裝置,其中,所述處理器用于:
分析與至少一個最大編碼單元相關聯的多個像素以生成表示所述像素值分布的像素值直方圖,其中,所述最大編碼單元與所述視頻信號相關;以及基于所述像素值直方圖,識別要被應用所述多個頻帶偏移的所述多個頻帶指數。(3)根據(I)所述的裝置,其中:所述多個頻帶指數具有不連續分布,使得所述多個頻帶指數中的至少兩個連續的頻帶指數彼此分離至少一個頻帶指數值。(4)根據(I)所述的裝置,其中:所述 像素值分布指示分別與所述多個頻帶指數中的至少一部分相關的所述多個像素的多個子集;以及要被應用所述多個頻帶偏移的所述多個頻帶指數對應于所述多個像素的多個子集中的至少一個子集,其中,該至少一個子集與所述多個像素的多個子集中的其他子集相比具有相對較大或最大數量的像素。(5)根據(I)所述的裝置,其中:所述裝置是在衛星通信系統、無線通信系統、有線通信系統、光纖通信系統及移動通信系統中的至少一個中操作的通信設備。(6) —種裝置,包括:輸入端,用于從至少一個額外裝置接收視頻信號及多個頻帶偏移;以及處理器,用于:分析與至少一個最大編碼單元(IXU)相關的多個像素以識別用于識別多個頻帶指數的像素值分布,所述最大編碼單元與所述視頻信號相關;以及根據所述視頻信號或基于所述視頻信號的信號的濾波處理將所述多個頻帶偏移應用到所述多個頻帶指數。(7)根據(6)所述的裝置,其中,所述處理器用于: 對所述視頻信號或基于所述視頻信號的信號執行采樣點自適應偏移(SA0)濾波處理以生成第一濾波信號,其中,所述采樣點自適應偏移濾波處理將所述多個頻帶偏移應用到所述多個頻帶指數;以及對所述第一濾波信號執行去塊濾波處理以生成第二濾波信號。(8)根據(6)所述的裝置,其中,所述處理器用于:分析與至少一個最大編碼單元相關的多個像素以生成表示所述像素值分布的像素值直方圖,其中,所述最大編碼單元與所述視頻信號相關;以及基于所述像素值直方圖,識別要被應用所述多個頻帶偏移的多個頻帶指數。(9)根據(6)所述的裝置,其中:所述多個頻帶指數具有不連續分布,使得所述多個頻帶指數中的至少兩個連續的頻帶指數彼此分離至少一個頻帶指數值。(10)根據(6)所述的裝置,其中:所述像素值分布指示分別與所述多個頻帶指數中的至少一部分相關的所述多個像素的多個子集;以及要被應用所述多個頻帶偏移的所述多個頻帶指數對應于所述多個像素的多個子集中的至少一個子集,其中,該至少一個子集與所述多個像素的多個子集中的其他子集相比具有相對較大或最大數量的像素。(11)根據(6)所述的裝置,其中:所述多個頻帶偏移由所述裝置經由信令從所述至少一個額外裝置接收;以及所述處理器用于基于所述像素值分布推理地識別所述多個頻帶指數。(12)根據(6)所述的裝置,其中:所述裝置是包括視頻解碼器的接收器通信設備;所述至少一個額外裝置是包括視頻編碼器的發射器通信設備;以及所述接收器通信設備及所述發射器通信設備經由至少一個通信信道連接或通信地耦接。(13)根據(6)所述的裝置,其中:所述裝置是在衛星通信系統、無線通信系統、有線通信系統、光纖通信系統及移動通信系統中的至少一個中操作的通信設備。( 14) 一種通信設備的操作方法,所述方法包括:經由所述通信設備的輸入端,從至少一個額外通信設備接收視頻信號及多個頻帶偏移;分析與至少一個最大編碼單元(IXU)相關的多個像素以識別用于識別多個頻帶指數的像素值分布,其中,所述最大編碼單元與所述視頻信號相關;以及根據所述視頻信號或基于所述視頻信號的信號的濾波處理將所述多個頻帶偏移應用到所述多個頻帶指數。(15)根據(14)所述的方法,進一步包括:對所述視頻信號或基于所述視頻信號的信號執行采樣點自適應偏移(SAO)濾波處理以生成第一濾波信號,其中,所述采樣點自適應偏移濾波處理包括將所述多個頻帶偏移應用到所述多個頻帶指數;以及對所述第一濾波信號執行去塊濾波處理以生成第二濾波信號。( 16)根據(14)所述的方法,進一步包括:分析與所述至少一個最大編碼單元相關的多個像素以生成表示所述像素值分布的像素值直方圖,其中,所述最大編碼單元與所述視頻信號相關;以及基于所述像素值直方圖,識別要被應用所述多個頻帶偏移的多個頻帶指數。(17)根據(14)所述的方法,其中:所述多個頻帶指數具有不連續分布,使得所述多個頻帶指數中的至少兩個連續的頻帶指數彼此分離 至少一個頻帶指數值。(18)根據(14)所述的方法,其中:所述像素值分布指示分別與所述多個頻帶指數中的至少一部分相關的所述多個像素的多個子集;以及要被應用所述多個頻帶偏移的所述多個頻帶指數對應于所述多個像素的多個子集中的至少一個子集,其中,該至少一個子集與所述多個像素的多個子集中的其他子集相比具有相對較大或最大數量的像素。(19)根據(14)所述的方法,進一步包括:經由信令從所述至少一個額外通信設備接收所述多個頻帶偏移;以及
基于所述像素值分布推理地識別所述多個頻帶指數。(20)根據(14)所述的方法,其中:所述通信設備在衛星通信系統、無線通信系統、有線通信系統、光纖通信系統及移動通信系統中的至少一個中操作。
圖1和圖2示出了通信系統的各個實施方式。圖3A示出了計算機的實施方式。圖3B示出了筆記本電腦的實施方式。圖3C示出了高清(HD)電視的實施方式。圖3D示出了標準清晰度(SD)電視的實施方式。圖3E示出了手持媒體單元的實施方式。圖3F示出了機頂盒(STB)的實施方式。圖3G示出了數字視頻光盤(DVD)播放器的實施方式。圖3H示出了通用數字圖像和/或視頻處理設備的實施方式。圖4、圖5和圖6是示出了視頻編碼架構的各個實施方式的示圖。
·
圖7是示出了幀內預測處理的實施方式的示圖。圖8是示出了幀間預測處理的實施方式的示圖。圖9和圖10是示出了視頻解碼架構的各個實施方式的示圖。圖11示出了頻帶偏移采樣點自適應偏移(SAO)濾波處理的實施方式。圖12示出了視頻編碼架構的可替換實施方式。圖12示出了 slicer頭語法的實施方式。圖13示出了采樣點自適應偏移(SAO)頻帶偏移模式下的傳輸頻帶偏移的指示(自適應和/或顯式信令)的各個實施方式。圖14示出了 SAO頻帶偏移模式下的頻帶粒度的指示(自適應和/或顯式信令)的各個實施方式。圖15示出了隱式頻帶指數信令的實施方式。圖16示出了隱式頻帶指數信令的可替換實施方式。圖17示出了頻帶偏移編碼的實施方式。圖18及圖19示出了用于操作一個或多個設備(例如,通信設備、接收器和/或解碼器設備、發射器和/或編碼器設備等)的方法的各個實施方式。
具體實施例方式在使用數字媒體(諸如數字視頻)的多個設備中,利用像素表示各個圖像(其本質為數字的)。在某些通信系統中,數字媒體可以從第一位置傳輸至可以輸出或顯示這種媒體的第二位置。數字通信系統(包括操作用于通信數字視頻的通信系統)的目的在于無誤差地或以可接受的低誤碼率將數字數據從一個位置或子系統傳輸至另一個位置。如圖1所示,數據可以通過在各種通信系統中的各個通信信道上進行傳輸:磁性媒介、有線、無線、光纖、銅和/或其他類型的媒介。
圖1和圖2分別示出了通信系統100和200的各個實施方式。參照圖1,通信系統100的實施方式是通信信道199,該通信信道將位于通信信道199 一端的通信設備110 (包括具有編碼器114的發射器112并包括具有解碼器118的接收器116)通信地耦接至位于通信信道199另一端的另一個通信設備120 (包括具有編碼器128的發射器126并包括具有解碼器124的接收器122)。在某些實施方式中,通信設備110和120之一可能僅包括發射器或接收器。存在通信信道199可以通過其實現的幾種不同類型的媒介(例如,使用碟形衛星天線132和134的衛星通信信道130、使用塔142和144和/或本地天線152和154的無線通信信道140、有線通信信道150和/或使用電光(E/0)接口 162和光電(0/E)接口 164的光纖通信信道160)。另外,可以實現不止一種類型的媒介,并可以接口在一起,從而形成通信信道199。要注意的是,在不背離本發明的范圍和精神的情況下,這樣的通信設備110和/或120可以是靜止設備或移動設備。例如,通信設備110和120之一或兩者可以在固定位置實現或可以是具有與多于一個的網絡接入點(例如,在包括一個或多個無線局域網(WLAN)的移動通信系統環境中的各自不同的接入點(AP)、在包括一個或多個衛星的移動通信系統環境中的各自不同的衛星或通常在包括一個或多個網絡接入點的移動通信系統環境中的各自不同的網絡接入點,可以通過這些網絡節點利用通信設備110和/或120來實現通信)相關聯和/或進行通信的能力的移動通信設備。通常采用誤差校正和信道編碼方案來降低通信系統中不可避免所遭受的傳輸誤差。一般情況下,這些誤差校正和信道編碼方案涉及在通信信道199的發射器端使用編碼器以及在通信信道199的接收器端使用解碼器。在任何這樣的所需通信系統(例如,包括針對圖1描述的那些變形例)、任何信息存儲設備(例如,硬盤驅動器(HDD)、網絡信息存儲設備和/或服務器等)或需要對信息進行編碼和/或解碼的任何應用中,可 以采用所描述的任何多種類型的ECC代碼。一般來說,當考慮視頻數據從一個位置或子系統傳輸至另一個位置的通信系統時,一般可以認為視頻數據編碼在通信信道199的傳輸端進行,一般可以認為視頻數據解碼在通信信道199的接收端進行。同樣地,盡管該示圖的實施方式示出了通信設備110和120之間能夠雙向通信,當然要注意的是,在某些實施方式中,通信設備110可能只包括視頻數據編碼功能,通信設備120可能只包括視頻數據解碼功能,反之亦然(例如,根據視頻廣播實施方式的單向實施方式)。參照圖2的通信系統200,在通信信道299的發射端,向發射器297提供信息位201 (例如,尤其對應于一個實施方式中的視頻數據),該發射器可操作用于利用編碼器和符號映射器220 (可以分別視為獨立功能塊222和224)進行這些信息位201的解碼,從而生成一系列離散值調制符號203,將這一系列離散值調制符號提供給發射驅動器230,該發射驅動器使用數模轉換器(DAC) 232來生成連續時間傳輸信號204并利用發射濾波器234來生成大致與通信信道299相稱的經過濾的連續時間傳輸信號205。在通信信道299的接收端,將連續時間接收信號206提供給模擬前端(AFE) 260,該模擬前端包括接收濾波器262(其生成經過濾的連續時間接收信號207)以及模數轉換器(ADC)264 (其生成離散時間接收信號208)。度量生成器270計算解碼器280用來對離散值調制符號和其中210編碼的信息位進行最佳估算的度量值209 (例如,基于符號和/或位)。在發射器297和接收器298的每一個中,可以實現將各個組件、塊、功能塊、電路等任何所需的集成在其中。例如,該圖示出處理模塊280a包括編碼器和符號映射器220以及其中所有相關聯的對應部件,示出處理模塊280包括度量生成器270和解碼器280以及其中所有相關聯的對應部件。這樣的處理模塊280a和280b可以是相應的集成電路。當然,在不背離本發明的范圍和精神的情況下,可以可替換地進行其他邊界和分組。例如,第一處理模塊或集成電路中可以包括發射器297中的所有部件,第二處理模塊或集成電路中可以包括接收器298中的所有部件。可替換地,在其他實施方式中可以任意組合發射器297和接收器298的每一個中的部件。與前述實施方式一樣,這樣的通信系統200可以用于視頻數據從一個位置或子系統傳輸至另一個位置(例如,經由通信信道299從發射器297至接收器298)的通信。可以由以下圖3A至圖3H所示的各個設備中的任何一個來實現數字圖像和/或數字圖像和/或媒體(包括數字視頻信號中的各個圖像)的視頻處理,從而允許用戶觀看這種數字圖像和/或視頻。這些多種設備并不包括窮盡的設備清單,其中可以實現本文描述的圖像和/或視頻處理,要注意的是,在不背離本發明的范圍和精神的情況下,可以實現任何通用數字圖像和/或視頻處理設備以便進行本文所述的處理。圖3A示出了計算機301的實施方式。該計算機301可以是臺式計算機,或主機的企業存儲設備(諸如服務器),其附接至存儲陣列(諸如獨立磁盤冗余陣列(RAID)、存儲路由器、邊緣路由器、存儲交換機和/或存儲導向器)。用戶能夠利用計算機301來查看靜態數字圖像和/或視頻(例如一系列數字圖像)。計算機301上時常包括多種圖像和/或視頻觀看程序和/或媒體播放器程序以允許用戶觀看這種圖像(包括視頻)。圖3B示出了筆記本電腦302的實施方式。在多種情形中的任何一種情形下可以發現并使用這樣的筆記本電腦302。近年,隨著筆記本電腦的處理能力和功能的不斷增長,在先前使用高端且更有能力的臺式計算機的許多情況下采樣這種筆記本電腦。與計算機301一樣,筆記本電腦302可以包括各`個圖像觀看程序和/或媒體播放器程序以便允許用戶觀看這種圖像(包括視頻)。圖3C示出了高清(HD)電視303的實施方式。許多HD電視303包括允許在其上接收、處理并解碼媒體內容(例如電視廣播信號)的集成調諧器。可替換地,有時,HD電視303從另一個接收、處理并解碼電纜和/或衛星電視廣播信號的源(諸如數字視頻光盤(DVD)播放器、機頂盒(STB))接收媒體內容。不管特定實現方式如何,HD電視303可以被實現來進行如本文所描述的圖像和/或視頻處理。一般來說,HD電視303具有顯示HD媒體內容的能力并時常被實現為具有16:9寬屏的縱橫比。圖3D示出了標準清晰度(SD)電視304的實施方式。當然,SD電視304在某種程度上類似于HD電視303,至少一個不同之處在于SD電視304不包括顯示HD媒體內容的能力,且SD電視304時常被實現為具有4:3的全屏縱橫比。盡管如此,甚至是SD電視304也可以被實現來進行如本文所描述的圖像和/或視頻處理。圖3E示出了手持媒體單元305的實施方式。手持媒體單元305可以操作用于對供用戶回放的圖像/視頻內容信息(諸如聯合圖像專家組(JPEG)文件、標記圖像文件格式(TIFF)、位圖、運動圖像專家組(MPEG)文件、Windows Media (WMA/WMV)文件、諸如MPEG4文件等的其他類型的視頻文件)和/或可以以數字格式存儲的其他類型信息進行通用存儲或存儲。從歷史觀點上說,這樣的手持媒體單元主要用于存儲并回放音頻媒體;然而,這樣的手持媒體單元305可以用于存儲并回放任何虛擬媒體(例如,音頻媒體、視頻媒體、圖像媒體等)。而且,這樣的手持媒體單元305還可以包括其他功能,諸如用于有線和無線通信的集成通信電路。這樣的手持媒體單元305可以被實現來進行如本文所描述的圖像和/或視頻處理。圖3F示出了機頂盒(STB)306的實施方式。如上所述,STB306有時可以被實現來接收、處理并解碼要提供給任何合適的顯示可用設備(諸如SD電視304和/或HD電視303)的電纜和/或衛星電視廣播信號。這樣的STB306可以獨立地或協同地與顯示可用設備一起操作以便進行如本文所描述的圖像和/或視頻處理。圖3G示出了數字視頻光盤(DVD)播放器307的實施方式。在不背離本發明的范圍和精神的情況下,這樣的DVD播放器可以是藍光DVD播放機、HD可用DVD播放器、SD可用DVD播放器、上采樣可用DVD播放器(例如從SD至HD等)。DVD播放器可以向任何合適的顯示可用設備(諸如SD電視304和/或HD電視303)提供信號。DVD播放器305可以被實現來進行如本文所描述的圖像和/或視頻處理。圖3H示出了通用數字圖像和/或視頻處理設備308的實施方式。另外,如上所述,上述這些各種設備不包括可以實現本文描述的圖像和/或視頻處理的窮盡的設備清單,要注意的是,在不背離本發明的范圍和精神的情況下,可以實現任何通用數字圖像和/或視頻處理設備308以便進行本文所述的圖像和/或視頻處理。圖4、圖5和圖6分別是示出了視頻編碼架構的各個實施方式400、500和600的示 圖。參照圖4的實施方式400,針對該圖可以看出,由視頻編碼器接收輸入視頻信號。在某些實施方式中,輸入視頻信號由編碼單元(CU)或宏塊(MB)構成。這種編碼單元或宏塊的大小可變并可以包括通常以正方形布置的多個像素。在一個實施方式中,這種編碼單元或宏塊的大小為16X16像素。然而,通常要注意的是,宏塊可以具有任何所需的大小,諸如NXN像素,其中N為整數(例如,16X 16、8X8或4X4)。當然,雖然優選實施方式中采用了方形編碼單元或宏塊,但某些實現方式可以包括非方形編碼單元或宏塊。輸入視頻信號通常可以被稱為對應于原始幀(或圖片)圖像數據。例如,原始幀(或圖片)圖像數據可以經歷處理以生成亮度和色度樣本。在某些實施方式中,宏塊中的亮度樣本組是一個特定布置(例如16X16),色度樣本組是不同的特定布置(例如8X8)。根據本文所描述的實施方式,視頻編碼器以逐塊為單位對這些樣本進行處理。輸入視頻信號然后經歷模式選擇,輸入視頻信號按照該模式選擇性地經歷幀內和/或幀間預測處理。一般來說,輸入視頻信號沿壓縮通路經歷壓縮。當無反饋地進行操作時(例如,不根據幀間預測,也不根據幀內預測)輸入視頻信號經由壓縮通路提供從而經歷變換操作(例如,根據離散余弦變換(DCT))。當然,在可替換實施方式中可以采用其他變換。在這種操作模式下,輸入視頻信號本身就是所壓縮的信號。壓縮通路可以利用人眼缺乏高頻率靈敏度來進行壓縮。然而,通過選擇性地使用幀內或幀間預測視頻編碼,可以沿壓縮通路進行反饋。根據反饋或預測操作模式,壓縮通路對從當前宏塊減去當前宏塊預測值而產生的(相對較低能量)冗余(例如差值)進行操作。根據在指定實例中采用哪種預測形式,生成當前宏塊和至少基于相同幀(或圖片)的一部分或至少基于至少一個其他幀(或圖片)的一部分的宏塊預測值之間的冗余或差值。由此產生的修改的視頻信號然后沿壓縮通路經歷變換操作。在一個實施方式中,離散余弦變換(DCT)對一組視頻樣本(例如,亮度、色度、冗余等)進行操作以計算預定數量的基模式中的每一個的系數值。例如,一個實施方式包括64個基函數(例如,對8 X 8樣本而言)。一般來說,不同實施方式可以采用不同數量的基函數(例如,不同變換)。這些各個基函數(包括合適的且選擇性加權的基函數)的任意組合可以用于表示給定的一組視頻樣本。與進行變換操作的各個方式相關的額外詳情在與包括通過引用并入的如上所述的那些標準/草案標準的視頻編碼相關聯的技術文獻中進行描述。變換處理的輸出包括各自的系數值。將該輸出提供給量化器。一般情況下,大多數圖像塊通常會產生系數(例如,根據離散余弦變換(DCT)操作的實施方式中的DCT系數),使得大多數相關DCT系數的頻率較低。由于這個原因以及人眼對高頻視覺效果的靈敏度相對較差,量化器可以操作用于將大部分不大相關的系數轉換為零值。也就是說,可以根據量化處理來消除相對貢獻率低于某個預定值(例如某個閾值)的那些系數。量化器還可以操作用于將重要系數轉換為比變化處理產生的值可以更加有效地進行編碼的值。例如,量化處理可以通過將每個相應系數除以整數值并丟棄任意余數來進行操作。當對典型的編碼單元或宏塊進行操作時,這個處理通常會產生相對少量的非零系數,這些非零系數然后被傳輸至熵編碼器進行無損編碼并且供根據可以根據視頻編碼選擇幀內和/或幀間預測處理的反饋路徑來使用。熵編碼器根據無損壓縮編碼處理進行操作。相比之下,量化操作通常是有損失的。熵編碼處理對量化處理提供的系數進行操作。那些系數可以表示各個特征(例如,亮度、色度、冗余等)。熵編·碼器可以采用各種類型的編碼。例如,熵編碼器可以進行上下文自適應
二進制算術編碼(CABAC)和/或上下文自適應可變長編碼(CAVLC)。例如,根據熵編碼方案的至少一部分,將數據轉換為(運行、級別)配對(run-level paring)(例如,將數據14,3,0,4,0,0,-3轉換為各個(運行、級別)對(0,14),(0,3),(1,4),(2,-3))。事先,編制將可變長度編碼分配至值對的表,以便將相對較短長度編碼分配給相對常見的值對,并將相對較長長度編碼分配給相對少見的值對。如讀者理解的一樣,逆量化和逆變換的操作分別對應于量化及變換的操作。例如,在DCT用于變換操作的實施方式中,逆DCT (IDCT)是逆變換操作中所采用的變換。圖片緩沖器(或者稱為數字圖片緩沖器或DPB)從IDCT模塊接收信號;圖片緩沖器操作用于存儲當前幀(或圖片)和/或一個或多個其他幀(或圖片),諸如作為根據視頻編碼所進行的幀內預測和/或幀間預測操作使用的幀(或圖片)。要注意的是,根據幀內預測,相對少量的存儲就足夠了,因為也許沒有必要存儲幀(或圖片)序列中的當前幀(或圖片)或任何其他幀(或圖片)。在根據視頻編碼進行幀間預測的時候,所存儲的信息可以用來進行運動補償和/或運動估計。在一個可能的實施方式中,對于運動估計,將來自當前幀(或圖片)的相應的亮度樣本組(例如,16X 16)與幀(或圖片)序列(例如根據幀間預測)中其他幀(或圖片)中的各個緩沖配對物進行比較。在一個可能的實現方式中,定位最匹配區域(例如預測參考)并產生矢量偏移(例如運動矢量)。在單個幀(或圖片)中,可以找到多個運動矢量,但不是所有的運動矢量都必須指向相同的方向。根據運動估計進行的一種或多種操作操作地用于生成一個或多個運動矢量。運動補償操作地采用可以根據運動估計生成的一個或多個運動矢量。識別并交付樣本的預測參考組以便從原始輸入視頻信號中扣除,試圖希望產生相對(例如,理想的、多個)較低的能量冗余。如果此類操作未導致產生較低的能量冗余,就不必進行運動補償,變換操作可以僅對原始輸入視頻信號進行操作,而不對冗余進行操作(例如,根據將輸入視頻信號直接提供給變換操作,以便不進行幀內預測,也不進行幀間預測的操作模式),或可以使用幀內預測并對幀內預測產生的冗余進行變換操作。同樣地,如果運動估計和/或運動補償操作成功,運動矢量還可以與相應的冗余系數一起發送至熵編碼器,用于進行無損熵編碼。來自整個視頻編碼操作的輸出是輸出位流。要注意的是,輸出位流當然可以根據生成連續時間信號(該連續時間信號可以經由通信信道傳輸)來進行一定處理。例如,某些實施方式在無線通信系統中操作。在這種情況下,輸出位流可以在用于生成能夠經由通信信道傳輸的連續時間信號等的無線通信設備中進行適當的數模轉換、頻率變換、縮放、過濾、調制、符號映射和/或任何其他操作。參照圖5的實施方式500,針對該圖可以看出,輸入視頻信號由視頻編碼器接收。在某些實施方式中,輸入視頻信號由編碼單元或宏塊構成(和/或可以劃分為編碼單元(⑶))。編碼單元或宏塊的大小可以改變并可以包括通常設置成正方形的多個像素。在一個實施方式中,編碼單元或宏塊的大小為16X16像素。然而,通常要注意的是,宏塊可以具有任何所需的大小,諸如NXN像素,其中N為整數。當然,雖然優選實施方式中采用了方形編碼單元或宏塊,但某些實現方式可以包括非方形編碼單元或宏塊。輸入視頻信號通常可以被稱為對應于原始幀(或圖片)圖像數據。例如,原始幀(或圖片)圖像數據可以進行處理以生成亮度和色度樣本。在某些實施方式中,宏塊中的亮度樣本組是一個特定布置(例如16X16),色度樣本組是不同的特定布置(例如8X8)。根據本文所描述的實施方式,視頻編碼器以逐塊為單位對這些樣本進行處理。輸入視頻信號然后進行模式選擇,輸入視頻信號按照該模式可選擇性地進行幀內和/或幀間預測處理。一般來說,輸入視頻信號沿壓縮通路進行壓縮。當無反饋地進行操作時(例如,不根據幀間預測,也不根據幀內預測),輸入視頻信號經由壓縮通路提供來進行變換操作(例如,根據離散余弦變換(DCT))。當然,在可替換實施方式中可以采用其他變換。在這種操作模式下,輸入視頻信號本身就是所壓縮的信號。壓縮通路可以利用人眼缺乏高頻率靈敏度來進行壓縮。然而,通過選擇性地使用幀內或幀間預測視頻編碼,可以沿壓縮通路進行反饋。根據反饋或預測操作模式,壓縮通路對從當前宏塊減去當前宏塊預測值而導致的(相對較低能量)冗余(例如差值)進行操作。根據在指定實例中采用哪種預測形式,生成當前宏塊和至少基于相同幀(或圖片)的一部分或至少基于至少一個其他幀(或圖片)的一部分的宏塊預測值之間的冗余或差值。由此產生的修改視頻信號然后沿壓縮通路進行變換操作。在一個實施方式中,離散余弦變換(DCT)對一 組視頻樣本(例如,亮度、色度、冗余等)進行操作以計算預定數量的基模式中的每一個的系數值。例如,一個實施方式包括64個基函數(例如,對8X8樣本而言)。一般來說,不同實施方式可以采用不同數量的基函數(例如,不同變換)。包括合適的選擇性加權的這些基函數的任意組合可以用于表示給定的一組視頻樣本。與進行變換操作的各個方式相關的額外詳情在與包括通過引用并入的如上所述的那些標準/草案標準的視頻編碼相關聯的技術文獻中進行描述。變換處理的輸出包括各自的系數值。將該輸出提供給量化器。一般情況下,大多數圖像塊通常會產生系數(例如,根據離散余弦變換(DCT)操作的實施方式中的DCT系數),使得大多數相關DCT系數的頻率較低。由于這個原因以及人眼對高頻視覺效果的靈敏度相對較差,量化器可以操作用于將大部分不大相關的系數轉換為零值。也就是說,可以根據量化過程來消除相對貢獻低于某個預定值(例如某個閾值)的那些系數。量化器還可以操作用于將重要系數轉換為比變化過程產生的值可以更加有效地進行編碼的值。例如,量化過程可以通過各自的系數除以整數值并丟棄任意余數來進行操作。當對典型的編碼單元或宏塊進行操作時,這個過程通常會產生相對少量的非零系數,這些非零系數然后被傳輸至熵編碼器進行無損編碼并根據視頻編碼選擇幀內和/或幀間預測處理的反饋路徑進行使用。熵編碼器根據無損壓縮編碼過程進行操作。相比之下,量化操作通常是有損的。熵編碼過程對量化過程提供的系數進行操作。那些系數可以表示各個特征(例如,亮度、色度、冗余等)。熵編碼器可以采用各種類型的編碼。例如,熵編碼器可以進行上下文自適應二進制算術編碼(CABAC)和/或上下文自適應可變長編碼(CAVLC)。例如,根據熵編碼方案的至少一部分,將數據轉換為(運行、級別)配對(run-level paring)(例如,將數據14,3,0,4,0,0,-3轉換為各個(運行、級別)對(0,14),(0,3),(1,4),(2,-3))。事先,編制將可變長度碼分配至值對的表,以便將相對較短長度編碼分配給相對常見的值對,并將相對較長長度編碼分配給相對少見的值對。如讀者理解的一樣,逆量化和逆變換的操作分別對應于量化和變換的操作。例如,在DCT用于變換操作的實施方式中,逆DCT (IDCT)是逆變換操作中所采用的變換。
自適應回路濾波器(ALF)被實現來處理來自逆變換塊的輸出。在解碼圖片存儲在圖片緩沖器(有時稱為DPB、數字圖片緩沖器)之前,自適應回路濾波器(ALF)應用于解碼圖片。自適應回路濾波器(ALF)被實現來降低解碼圖像的編碼噪聲,可以逐地選擇性地分別對亮度和色度進行過濾,不管自適應回路濾波器(ALF)是否以片級別或以塊級別應用。在自適應回路濾波器(ALF)的應用中可以使用二維2-D有限脈沖響應(FIR)過濾。濾波器的系數可以在編碼器中逐片地進行設計,然后將此信息傳遞給解碼器(例如,從包括視頻編碼器(或者稱為編碼器)的發射器通信設備傳遞給包括視頻解碼器(或者稱為解碼器)的接收器通信設備)。一個實施方式通過根據維納濾波設計生成系數來進行操作。另外,不管是否進行濾波處理并是否根據四叉樹結構將該決定傳遞給解碼器(例如,從包括視頻編碼器(或者稱為編碼器)的發射器通信設備傳遞給包括視頻解碼器(或者稱為解碼器)的接收器通信設備),都可以在編碼器中一塊一塊地應用,其中塊大小根據率失真優化來決定。要注意的是,利用2D濾波的實現方式可以根據編碼和解碼引入復雜度。例如,通過根據自適應回路濾波器(ALF)及實現方式來使用2D濾波,在編碼器(其在發射器通信設備中實現)和解碼器(其在接收器通信設備中實現)中可能存在一定的增加的復雜性。在某些可選實施方式中,將來自去塊濾波器的輸出提供給被實現為處理來自逆變換塊的輸出的一個或多個其他環內濾波器(例如根據自適應回路濾波器(ALF)、采樣點自適應偏移(SAO)濾波器和/或任何其他濾波器類型實現)。例如,在解碼圖片存儲在圖片緩沖器(有時稱為DPB、數字圖片緩沖器)之前,ALF應用于解碼圖片。ALF被實現來降低解碼圖像的編碼噪聲,可以逐片地選擇地分別對亮度和色度進行過濾,不管ALF是否以片級別或以塊級別應用。在ALF的應用中可以使用二維2-D有限脈沖響應(FIR)過濾。濾波器的系數可以在編碼器中逐片地進行設計,然后將此信息傳遞給解碼器(例如,從包括視頻編碼器(或者稱為編碼器)的發射器通信設備傳遞給包括視頻解碼器(或者稱為解碼器)的接收器通信設備)。一個實施方式根據維納濾波設計操作用于生成系數。另外,不管是否進行濾波處理并是否根據四叉樹結構將該決定傳遞給解碼器(例如,從包括視頻編碼器(或者稱為編碼器)的發射器通信設備傳遞給包括視頻解碼器(或者稱為解碼器)的接收器通信設備),都可以在編碼器中逐塊地應用,其中塊大小根據率失真優化來決定。要注意的是,利用2D濾波的實現方式可以根據編碼和解碼引入復雜度。例如,通過根據ALF及實現方式來使用2D濾波,在編碼器(其在發射器通信設備中實現)和解碼器(其在接收器通信設備中實現)中可能存在一定的增加的復雜性。如針對其他實施方式所述,使用ALF可以提供根據此視頻處理的一系列改進之一,包括通過進行隨機量化去噪導致的峰值信號噪聲比(PSNR)改進客觀質量測量。另外,隨后編碼的視頻信號的主觀質量可以通過照明補償來實現,根據ALF處理,照明補償可以根據進行偏移處理和縮放處理(例如,根據應用增益)來引入。對一種類型的環內濾波器而言,使用自適應回路濾波器(ALF)可以提供根據此視頻處理的一系列改進之一,包括通過進行隨機量化去噪導致的峰值信號噪聲比(PSNR)改進客觀質量測量。另外,隨后編碼的視頻信號的主觀質量可以通過照明補償來實現,根據自適應回路濾波器(ALF)處理,照 明補償可以根據進行偏移處理和縮放處理(例如,根據應用增益)來引入。圖片緩沖器(或者稱為數字圖片緩沖器或DPB)接收從ALF輸出的信號;圖片緩沖器操作用于存儲當前幀(或圖片)和/或一個或多個其他幀(或圖片),諸如按照視頻編碼進行的根據幀內預測和/或幀間預測操作使用的幀(或圖片)。要注意的是,根據幀內預測,相對少量的存儲就足夠了,因為也許沒有必要存儲幀(或圖片)序列中的任何其他幀(或圖片)或當前幀(或圖片)。在根據視頻編碼進行幀間預測的時候,所存儲的信息可以用來進行運動補償和/或運動估計。在一個可能的實施方式中,對于運動估計,將來自當前幀(或圖片)的相應的亮度樣本組(例如,16X 16)與幀(或圖片)序列(例如根據幀間預測)中其他幀(或圖片)中的各個緩沖配對物進行比較。在一個可能的實現方式中,定位最匹配區域(例如預測參考)并產生矢量偏移(例如運動矢量)。在單個幀(或圖片)中,可以找到多個運動矢量,但不是所有的運動矢量都必須指向相同的方向。根據運動估計進行的一種或多種操作操作地生成一個或多個運動矢量。運動補償操作地采用可以根據運動估計生成的一個或多個運動矢量。識別并交付樣本的預測參考組以便從原始輸入視頻信號中扣除,試圖希望產生相對(例如理想的多個)較低的能量冗余。如果此類操作未導致產生較低的能量冗余,就不必進行運動補償,變換操作可以僅對原始輸入視頻信號進行操作,而不對冗余進行操作(例如,根據將輸入視頻信號直接提供給變換操作,以便不進行幀內預測,也不進行幀間預測的操作模式),或可以使用幀內預測并對幀內預測產生的冗余進行變換操作。同樣地,如果運動估計和/或運動補償操作成功,運動矢量還可以與相應的冗余系數一起發送至熵編碼器,用于進行無損熵編碼。來自整個視頻編碼操作的輸出是輸出位流。要注意的是,輸出位流當然可以根據生成連續時間信號(其可以經由通信信道傳輸)來進行一定處理。例如,某些實施方式在無線通信系統中操作。在這種情況下,輸出位流可以在無線通信設備(其用于生成能夠經由通信信道傳輸的連續時間信號等)中進行適當的數模轉換、頻率變換、縮放、過濾、調制、符號映射和/或任何其他操作。參照圖6的實施方式600,針對該圖描述了一種視頻編碼器的可替換實施方式,該視頻編碼器進行預測、變化以及編碼處理以便產生壓縮的輸出位流。這種視頻編碼器可以根據一個或多個視頻編碼協議、標準和/或推薦作法(諸如IS0/IEC14496-10-MPEG-4的第10部分,AVC (高級視頻編碼)(或者稱為H.264/MPEG-4的第10部分或AVC (高級視頻編碼),ITU H.264/MPEG4-AVC)進行操作并與之兼容。要注意的是,對應視頻解碼器(諸如位于通信信道另一端的設備內的視頻解碼器)操作用于進行解碼、逆變換及重建的互補處理以便產生相應的解碼視頻序列,該序列(理想地)表示輸入視頻信號。在將該圖與先前的圖進行比較時,同樣將提供給幀內預測塊的來自逆量化和逆變換(例如IDCT)塊的信號路徑輸出提供給去塊濾波器。將來自去塊濾波器的輸出提供給被實現為處理來自逆變換塊的輸出的一個或多個其他環內濾波器(例如根據自適應回路濾波器(ALF)、采樣點自適應偏移(SAO)濾波器和/或任何其他濾波器類型實現)。例如,在一個可能的實施方式中,在解碼圖片存儲在圖片緩沖器(有時稱為DPB、數字圖片緩沖器)之前,SAO濾波器應用于解碼圖 片。就被實現來生成輸出位流的任何視頻編碼器架構而言,要注意的是,這類架構可以在多種通信設備中的任何一個中實現。輸出位流可以經歷額外的處理(包括誤差校正碼(ECC)、前向糾錯(FEC)等),從而生成其中具有額外的冗余交易的修改輸出位流。同樣,如關于此數字信號可以理解,可以根據生成適用于或適于經由通信信道進行傳輸的連續時間信號進行任何適當的處理。也就是說,這樣的視頻編碼器架構可以在用于經由一個或多個通信信道傳輸一個或多個信號的通信設備中實現。可以對由這種視頻編碼器架構生成的輸出位流進行額外的處理,從而生成可以發射到通信信道中的連續時間信號。圖7是示出了幀內預測處理的實施方式700的示圖。針對該圖可以看出,視頻數據的當前塊(例如通常呈正方形并且通常包括NXN像素)進行處理以便對其中的各個像素進行估計。根據幀內預測采用位于當前塊的上方及左邊的事先編碼像素。從某種角度來說,幀內預測方向可以被視為對應于從當前像素延伸至位于當前像素的上方或左邊的參考像素的矢量。根據H.264/AVC應用于編碼的幀內預測的詳情在上文通過引用并入的對應標準內進行了規定(例如,國際電信聯盟,ITU-T, TELECOMMUNICATION STANDARDIZATION SECTOR OFITU,H.264(03/2010), SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS, Infrastructureof audiovisual services - Coding of moving video, Advanced video coding forgeneric audiovisual services, Recommendation ITU-T H.264 (或稱為 InternationalTelecomm IS0/IEC14496-10 - MPEG-4 的第 10 部分,AVC (高級視頻編碼),H.264/MPEG-4 的第10部分或AVC (高級視頻編碼),ITU H.264/MPEG4-AVC或等效文獻)。冗余(其是當前像素和參考或預測像素之間的差值)為經過編碼的冗余。針對該圖可以看出,幀內預測利用常見幀(或圖片)內的像素進行操作。當然要注意的是,給定像素可以具有與其相關聯的各自不同的分量,且每個分量可能存在各自不同的樣本組。圖8是示出了幀間預測處理的實施方式800的示圖。與幀內預測不同,幀間預測用于基于當前幀(或圖片)內的當前的像素組以及位于幀(或圖片)序列內的一個或多個其他幀(或圖片)內的一組或多組參考或預測像素來識別運動矢量(例如,幀間預測方向)。可以看出,運動矢量從幀(或圖片)序列內的當前幀(或圖片)延伸至另一個幀(或圖片)。幀間預測可以使用子像素插值,使得預測像素值對應于參考幀或圖片中的多個像素的函數。可以根據幀間預測處理來計算冗余,盡管這樣的冗余不同于根據幀內預測處理計算的冗余。根據幀間預測處理,每個像素的冗余再次對應于當前像素和預測像素值之間的差。然而,根據幀間預測處理,當前像素和參考或預測像素不位于相同幀(或圖片)內。盡管該圖示出了關于一個或多個先前的幀或圖片所采用的幀間預測,但同樣要注意的是,可替換實施方式可以利用對應于當前幀之前和/或之后的幀進行操作。例如,根據適當的緩沖和/或內存管理,可以對多個幀進行存儲。當對給定的幀進行操作時,可以根據在給定幀之前和/或之后的其他巾貞來生成參考。 結合CU,基本單元可以用于預測劃分模式(即,預測單元或PU)。同樣要注意的是,僅為最后深度CU限定PU,且相應 大小局限于CU的大小。圖9和圖10是分別示出了視頻解碼架構的各個實施方式900和1000的示圖。一般來說,這種視頻解碼架構對輸入位流進行操作。當然要注意的是,這種輸入位流可以根據通信設備從通信信道接收的信號來生成。可以對從通信信道接收的連續時間信號進行各種操作,包括諸如可以適當根據生成輸入位流的數字采樣、解調、縮放、濾波等。而且,可以實現一種或多種誤差校正碼(ECC)、前向糾錯(FEC)等的某些實施方式可以根據ECC、FEC等進行適當的解碼,從而生成輸入位流。也就是說,在已經根據生成對應輸出位流(例如,可以從發射器通信設備或收發器通信設備的發射器部分進行發射的輸出位流)進行額外的冗余的某些實施方式中,可以根據生成輸入位流來進行適當的處理。總體來說,這樣的視頻解碼架構遺憾的是要處理輸入位流,從而盡可能緊密地并完全在理想情況下生成對應于原始輸入視頻信號的輸出視頻信號,用于輸出至一個或多個視頻顯示可用設備。參照圖9的實施方式900,一般來說,諸如熵解碼器(例如,其可以根據CABAC、CAVLC等實現)的解碼器根據進行編碼(如在視頻編碼器架構中進行的)的互補處理來處理輸入位流。輸入位流可以被視為(盡可能緊密地并完全在理想情況下)由視頻編碼器架構生成的壓縮輸出位流。當然,在實際應用中,在經由一個或多個通信鏈路傳輸的信號中可能已經遭受了一部分誤差。熵解碼器對輸入位流進行處理并提取適當的系數,諸如DCT系數(例如,表示色度、亮度等信息),并將系數提供給逆量化及逆變換塊。如果采用DCT變換,那么逆量化及逆變換塊就可以被實現來進行逆DCT (IDCT)操作。隨后,A/D阻塞濾波器被實現來生成對應于輸出視頻信號的各個幀和/或圖片。可以將這些幀和/或圖片提供給圖片緩沖器或數字圖片緩沖器(DPB),以便用來進行包括運動補償的其他操作。一般來說,這樣的運動補償操作可以被視為對應于與視頻編碼相關聯的幀間預測。同樣,還可以對從逆量化及逆變換塊輸出的信號進行幀間預測。類似于視頻編碼,這種視頻解碼器架構可以被實現來進行模式選擇,根據對輸入位流進行解碼,不通過幀內預測或幀間預測進行,通過幀間預測進行或通過幀內預測進行,從而生成輸出視頻信號。參照圖10的實施方式1000,在某些可選實施方式中,諸如可以根據用于生成輸出位流的視頻編碼來實現的一個或多個環內濾波器(例如,根據自適應回路濾波器(ALF)、采樣點自適應偏移(SAO)濾波器和/或任何其他濾波器類型實現),對應的一個或多個環內濾波器可以在視頻解碼器架構中實現。在一個實施方式中,在去塊濾波器之后適當實現一個或多個環內濾波器。根據某些可能的實施方式,在完成解碼圖片的去塊濾波處理之后(例如,根據在圖6中的其他環內濾波器內實現的SAO濾波),可以執行采樣點自適應偏移(SAO)處理。基于被定義為一個或多個完整最大編碼單元(LCU)的區域執行該處理。圖11示出了頻帶偏移采樣點自適應偏移(SAO)濾波處理的實施方式1100。該圖示出了頻帶偏移SAO的概念。在應用每個偏移之后,由此產生的像素被裁剪為有效的8位像素范圍
。在該圖中,將偏移應用到四個連續、有源的帶;不修改剩余的帶。當然,在其他實施方式中,此等偏移可以應用于非連續帶。圖12示出了視頻編碼架構的可替換實施方式1200。在此實施方式1200中,任何一個或多個其他環內濾波器(例如,根據自適應回路濾波器(ALF)、采樣點自適應偏移(SAO)濾波器和/或任何其他濾波器類型實現的環內濾波器)可以實現為處理逆量化及逆變換塊(例如,在去塊濾波器之前)的輸出。換句話說,在此等實施方式中,在去塊處理之前可以應用一個或多個其他環內濾波器(例如,一個實施方式中的SAO濾波器)。在可替換實施方式中,在去塊處理之前可以實現此等環內濾波器(例如,根據自適應回路濾波器(ALF)、采樣點自適應偏移(SAO)濾波器和/或任何其他濾波器類型實現的環內濾波器)。然而,在去塊處理之前,本發明的 各方面、實施方式和/或其等同物操作地應用此等環內濾波器(例如,根據自適應回路濾波器(ALF)、采樣點自適應偏移(SAO)濾波器和/或任何其他濾波器類型實現的環內濾波器),如圖12所示。根據有些實施方式,當SAO可操作且開啟時(例如,針對來自去塊處理的輸出實現此SAO的實施方式),可能會出現一些不合意的塊狀假影。在這些實施方式中,主要是因為兩個相鄰的LCU正在使用不同的帶偏移值。為了減輕這個問題,在去塊處理之前可以應用此SA0,及去塊處理可以用于在此等情況下減少任何不合意且出現的塊狀假影。在這種情況下,去塊處理過程中使用的邊界強度及變量β及tC也由SAO參數決定。從某些角度來看,帶偏移SAO基本上可視為是校正濾波器(例如,某些實施方式中的直方圖校正濾波器)。基于強度值來分類像素以產生像素的分布。例如,針對直方圖實施方式,基于強度值將像素(例如,一個或多個最大編碼單元(LCU)的像素)歸類為直方圖倉或“帶”。將整個像素范圍(0-255)分成32個均勻的帶,并將特定偏移加到每個帶中的所有像素上。編碼器從范圍[_7,7]選擇要應用的偏移。盡管偏移可應用于全部32個帶,為了簡化帶偏移處理并減少開銷,可以利用任何LCU中的帶偏移SAO對縮減集(例如,僅4個連續的帶)進行實際修改。編碼器選擇四個連續的帶,偏移針對這四個連續的帶進行傳輸。不修改剩余的28個帶(零偏移)。由于可能存在32個帶,因此具有非零偏移的第一個帶以位流表示。band_position參數攜帶有該信息。剩余的三個有源帶可以由i G [I, 3]的(band_position+i)%32確定。注意此處的模運算,如果第一帶是29、30或31,剩余的帶將繞回O。圖13示出了采樣點自適應偏移(SAO)帶偏移模式下的傳輸頻帶偏移的指示(自適應和/或顯式信令)的各個實施方式1300。根據適應性地指明SAO頻帶偏移模式下的傳輸頻帶偏移的數量可以完成這樣的操作。例如,SAO頻帶偏移模式下的傳輸頻帶偏移的數量可能與LCU的尺寸相關(例如,使得SAO頻帶偏移模式下的傳輸頻帶偏移的數量可以是LCU尺寸的函數)。例如,如果LCU尺寸減小,傳輸頻帶的數量也減小。再如,4個傳輸頻帶偏移可以用于64X 64IXU,3個傳輸頻帶偏移可以用于32 X 32IXU,2個傳輸頻帶偏移可以用于16X16LCU。一般情況下,根據LCU各自不同的尺寸,可以指出SAO頻帶偏移模式下的傳輸頻帶偏移的各自不同的數量。每個IXU尺寸的傳輸頻帶偏移的數量也可以按照SPS (序列參數集)、PPS (圖片參數大小)、APS (自適應參數集)、宏塊條頭、IXU數據和/或使用其他部分顯式地以信號通知。圖14示出了 SAO頻帶偏移模式下的頻帶粒度的指示(自適應和/或顯式信令)的各個實施方式1400。根據適應性地指明SAO頻帶偏移模式下的粒度可以完成這樣的操作。在某些實施方式中,將整個像素范圍(0-255)分成32個均勻的頻帶。可以利用任何LCU中的頻帶偏移SAO對僅4個頻帶進行實際修改。編碼器(例如,發射器通信設備)選擇四個連續的頻帶,偏移針對這四個連續的頻帶進行傳輸。不修改剩余的28個頻帶(例如,零偏移)。在每個頻 帶中,將特定偏移加到所有像素上。由于可以改變IXU的尺寸(例如,64 X 64、32 X 32或16 X 16 ),頻帶的粒度可以是自適應的。例如,IXU的尺寸越小,粒度就越粗糙。再如,如果IXU尺寸為32X32,則可以將
均勻分為16個頻帶,每個頻帶涵蓋16個連續的強度值。一般來說,可以根據IXU各自不同的尺寸指明SAO頻帶偏移模式下的各自不同的頻帶粒度。每個IXU尺寸的頻帶粒度也可以按照SPS (序列參數集)、PPS (圖片參數大小)、APS(自適應參數集)、宏塊條頭、IXU數據和/或使用其他部分清楚地以信號通知。圖15示出了隱式頻帶指數信令的實施方式1500。例如,可以基于當前IXU的像素值推斷出(例如,基于LCU的分析確定,推斷地確定,等等)此信息,而沒有顯式地信號通知頻帶指數。例如,通過生成IXU的像素值直方圖,頻帶偏移可以用于像素的數量占主導地位的頻帶。此等頻帶指數不一定是連續的(例如,頻帶指數可以使得具有不連續的分布,以便至少兩個連續的頻帶指數可以間隔至少一個頻帶指數值,換句話說,頻帶指數彼此不一定是連續的)。圖16示出了隱式頻帶指數信令的可替換實施方式1600。在示出了極簡化實施方式的極簡化圖中,存在只具有兩個灰度的LCU。直方圖(例如,如讀者所理解的描述像素分布的可能的一種方式)說明50%的像素具有灰度25,50%的像素具有灰度205。因此,兩個頻帶偏移就足夠,代替了原來的四個。圖17示出了頻帶偏移編碼的實施方式1700。在頻帶偏移模式下,由于sao_band_position表示具有非零偏移的頻帶偏移的開始,因此第一偏移值sao_offset [cldx][saoDepth] [x0] [yO]
必須為非零(例如,在某些情況下,可能的最小的值可以是取 I 的值)。所以,而不直接編碼 sao_offset[cldx] [saoDepth] [xO] [yO]
, bs (sao_offset[cldx][saoDepth][xO][yO]
)I及 sao_offset[cldx][saoDepth][xO][yO]
的符號位可以單獨編碼,其中abs是計算絕對值的函數。圖18及圖19示出了一個或多個設備(例如,通信設備、接收器和/或解碼器設備、發射器和/或編碼器設備等)的操作方法的各個實施方式。參照圖18的方法1800,方法1800首先通過通信設備的輸入端從至少一個額外通信設備接收視頻信號及多個頻帶偏移,如方框1810所示。方法1800繼續分析與至少一個最大編碼單元(LCU)(該最大編碼單元與視頻信號相關聯)相關聯的多個像素以識別用于識別多個頻帶指數的像素值分布,如方框1820所示。方法1800然后根據視頻信號或基于此的信號的濾波處理將多個頻帶偏移應用到多個頻帶指數,如方框1830所示。參照圖19的方法1900,該方法1900首先通過通信設備的輸入端從至少一個額外通信設備接收視頻信號及多個頻帶偏移,如方框1910所示。方法1900繼續分析與至少一個最大編碼單元(LCU)(該最大編碼單元與視頻信號相關聯)相關聯的多個像素以識別用于識別多個頻帶指數的像素值分布,如方框1920所示。方法1900繼續對視頻信號或基于此的信號執行采樣點自適應偏移(SAO)濾波處理以生成第一濾波信號,使得SAO濾波處理包括將多個頻帶偏移應用到多個頻帶指數,如方框1930所示。方法1900繼續對第一濾波信號執行去塊濾波處理以生成第二濾波信號,如方框1940所示。同樣要注意的是,諸如利用其中實現的基帶處理模塊和/或處理模塊和/或其中的其他部件,可以在多種通信設備中的任意一種中進行文中針對各個方法所述的各操作和功能。例如,此基帶處理模塊和/或處理模塊可以生成此等信號并執行如本文所述的此等操作、處理等,還可以執行如本文所述的各操作和分析,或如本文所述的任何其他操作和功能等,或各自的等同物。在某些實施方式中,此基帶處理模塊和/或處理模塊(其可以在相同設備或不同設備中實現)可以執行根據本發明的各方面的此處理、操作等,和/或如本文所述的任何其他操作和功能等,或各自的等同物。在某些實施方式中,此處理通過第一設備中的第一處理模塊以及第二設備中的第二處理模塊協作地執行。在其他實施方式中,此處理、操作等全部由給定的一個設備中的基帶處理模塊和/或處理模塊執行。在甚至其他實施方式中,使用單個設備中的至少第一處理模塊及第二處理模塊執行此處理、操作等。同樣,如本文所使用的術語“基本上”和“近似地”為其對應術語提供行業接收的容差和/或物品間的相關性。行業接收的容差的范圍小于1%_50%并對應于(但不限于)分量值、集成電路工藝變量、溫度變量、上升和下降時間和/或熱噪聲。物品之間的相關性的差別為幾個百分點至數量級。如本文同樣所使用的術語“可操作地耦接至”、“耦接至”和/或“耦接”包括物品之間直接耦接和/或物品之間通過居間物品間接耦接(例如,物品包括(但不限于)部件、元件、電路和/或模塊),其中,對間接耦接而言,居間物品不修改信號信息但可以調節其電流電平、電壓電平 和/或功率電平。如本文進一步所使用的推測耦接(即,當一個元件通過推斷與另一個元件耦接)包括以與“耦接至”相同的方式在兩個物品之間直接和間接耦接。如本文更進一步所使用的術語“可操作用于”或“可操作地耦接至”表明物品包括一種或多種電源連接、輸入、輸出等以便在激活時執行一個或多個對應功能且可以進一步包括與一個或多個其他物品的推測耦接。如本文更進一步所使用的術語“與…相關聯”包括另一物品中嵌入的獨立物品和/或一個物品的直接和/或間接耦接。如本文所使用的術語“與…媲美”表明兩個或兩個以上物品、信號等之間的比較提供所需關系。例如,當所述關系為信號I比信號2的數量級大時,當信號I的數量級比信號2的數量級大時或當信號2的數量級比信號I的數量級小時,可以實現有利比較。如本文同樣所使用的術語“處理模塊”、“模塊”、“處理電路”和/或“處理單元”(例如,包括可以操作、實現和/或用于編碼、解碼、基帶處理的各種模塊和/或電路等)可以是單個處理設備或多個處理設備。這種處理設備可以是微處理器、微控制器、數字信號處理器、微計算機、中央處理器、現場可編程門陣列、可編程邏輯設備、狀態機、邏輯電路、模擬電路、數字電路和/或基于電路的硬編碼和/或操作指令操作信號(模擬和/或數字)的任何設備。處理模塊、模塊、處理電路和/或處理單元可以具有相關聯的存儲器和/或集成存儲元件,該存儲器和/或集成存儲元件可以是單個存儲設備、多個存儲設備和/或處理模塊的嵌入電路、模塊、處理電路和/或處理單元。這種存儲設備可以是只讀存儲器(ROM)、隨機存取存儲器(RAM)、易失性存儲器、非易失性存儲器、靜態存儲器、動態存儲器、閃存、高速緩沖存儲器和/或存儲數字信息的任意設備。要注意的是,如果處理模塊、模塊、處理電路和/或處理單元包括一個以上的處理設備,那么處理設備就可以中心定位(例如,通過有線和/或無線總線結構直接耦接在一起)或可以分布式定位(例如,通過局域網和/或廣域網進行的間接耦接云計算)。進一步要注意的是,如果處理模塊、模塊、處理電路和/或處理單元通過狀態機、模擬電路、數字電路和/或邏輯電路實現一種或多種功能,可以將存儲有相應操作指令的存儲器和/或存儲器元件嵌在包括狀態機、模擬電路、數字電路和/或邏輯電路的電路內或外部。進一步要注意的是,存儲器元件可以存儲,處理模塊、模塊、處理電路和/或處理單元執行對應于一個或多個圖中示出的至少一部分步驟和/或功能的硬編碼和/或操作指令。制品中可以包括有這種存儲器設備或存儲器元件。
上文在示出了指定函數的性能及其關系的方法步驟的幫助下已對本發明進行了描述。為了便于描述,本文任意限定了這些功能構建塊和方法步驟的界限和順序。只要適當執行指定功能和關系,就可以限定替代界限和順序。任何替代界限和順序都在要求保護的本發明的范圍和精神范圍內。此外,為了便于描述,任意限定了這些功能構建塊的界限。只要適當執行某些重要功能,就可以限定替代界限。類似地,本文也任意限定了流程框圖以便示出某些重要功能。從所用的程度來看,另外規定了流程框圖界限和順序,并仍然執行某些重要功能。功能構建塊和流程圖塊和順序的替代定義在要求保護的本發明的范圍和精神范圍內。本領域的普通技術人員還將明白,本文中的功能構建塊及其他說明性塊、模塊和部件可以被實現為利用離散部件、專用集成電路、執行適當軟件等的處理器或其任意組合來示出。可能已經至少部分地針對一個或多個實施方式對本發明進行了描述。本發明的實施方式在本文中用來說明本發明,其一方面、其特點、其概念和/或其實例。體現本發明的裝置、制品、機器和/或工藝的物理實施方式可以包括參照文中所討論的一個或多個實施方式描述的一個或多個方面、特點、概念、實例等。此外,從圖到圖,實施方式可以并入可以使用相同或不同參考編號的相同或類似命名的功能、步驟、模塊等,正因如此,所述功能、步驟、模塊等可以是相同或類似的功能、步驟、模塊等或可以是不同的功能、步驟、模塊等。除非從反面特別說明,傳遞給本文中所顯示的任何一個圖中的元件的信號、來自該元件的信號和/或元件之間的信號可以是模擬信號或數字信號、連續時間信號或離散時間信號以及單端信號或差分信號。例如,如果信號路徑被顯示為單端路徑,則還表示差分信號路徑。類似地,如果信號路徑被顯示為差分路徑,則還表示單端信號路徑。盡管本文對一個或多個特定架構進行了描述,但同樣可以實現其他架構,其他架構使用如本領域的普通技術人員認可的一個或多個數據總線(未明確示出)、元件之間的直接連接和/或其他元件之間的間接耦接。術語“模塊”用于對本發明的各個實施方式進行描述。模塊包括經由硬件實現以便執行一個或多個模塊功能,諸如處理一個或多個輸入信號以產生一個或多個輸出信號的功能塊。實現模塊的硬件本身可以結合軟件和/或固件進行操作。如本文所使用的模塊可以包含一個或多個子模塊,每個子模塊本身就是模塊。盡管本文明確描述了本發明的各個功能和特點的特定組合,但這些特點和功能的其他組合同樣是可能的。本發明不受本文所公開 的特定實例的限制并明確結合其他組合。
權利要求
1.一種裝置,包括: 至少一個輸入端,用于: 從至少一個額外裝置接收視頻信號;以及 經由信令從所述至少一個額外裝置接收多個頻帶偏移;以及 處理器,用于: 分析與至少一個最大編碼單元(LCU)相關的多個像素以識別像素值分布,其中,所述最大編碼單元與所述視頻信號相關; 基于所述像素值分布推理地識別多個頻帶指數; 根據所述視頻信號或基于所述視頻信號的信號的濾波處理將所述多個頻帶偏移應用到所述多個頻帶指數; 對所述視頻信號或基于所述視頻信號的信號執行采樣點自適應偏移(SAO)濾波處理以生成第一濾波信號,其中,所述采樣點自適應偏移濾波處理將所述多個頻帶偏移應用到所述多個頻帶指數;以及 對所述第一濾波信號執行去塊濾波處理以生成第二濾波信號。
2.根據權利要求1所述的裝置,其中,所述處理器用于: 分析與至少一個最大編碼單元相關聯的多個像素以生成表示所述像素值分布的像素值直方圖,其中,所述最大編碼單元與所述視頻信號相關;以及 基于所述像素值直方圖,識別要被應用所述多個頻帶偏移的所述多個頻帶指數。
3.根據權利要求1所述的裝置,其中: 所述多個頻帶指數具有不連續分布,使得所述多個頻帶指數中的至少兩個連續的頻帶指數彼此分離至少一個頻帶指數值。
4.根據權利要求1所述的裝置,其中: 所述像素值分布指示分別與所述多個頻帶指數中的至少一部分相關的所述多個像素的多個子集;以及 要被應用所述多個頻帶偏移的所述多個頻帶指數對應于所述多個像素的多個子集中的至少一個子集,其中,該至少一個子集與所述多個像素的多個子集中的其他子集相比具有相對較大或最大數量的像素。
5.根據權利要求1所述的裝置,其中: 所述裝置是在衛星通信系統、無線通信系統、有線通信系統、光纖通信系統及移動通信系統中的至少一個中操作的通信設備。
6.一種裝置,包括: 輸入端,用于從至少一個額外裝置接收視頻信號及多個頻帶偏移;以及 處理器,用于: 分析與至少一個最大編碼單元(LCU)相關的多個像素以識別用于識別多個頻帶指數的像素值分布,所述最大編碼單元與所述視頻信號相關;以及 根據所述視頻信號或基于所述視頻信號的信號的濾波處理將所述多個頻帶偏移應用到所述多個頻帶指數。
7.根據權利要求6所述的裝置,其中,所述處理器用于: 對所述視頻信號或基于所述視頻信號的信號執行采樣點自適應偏移(SA0)濾波處理以生成第一濾波信號,其中,所述采樣點自適應偏移濾波處理將所述多個頻帶偏移應用到所述多個頻帶指數;以及 對所述第一濾波信號執行去塊濾波處理以生成第二濾波信號。
8.根據權利要求6所述的裝置,其中,所述處理器用于: 分析與至少一個最大編碼單元相關的多個像素以生成表示所述像素值分布的像素值直方圖,其中,所述最大編碼單元與所述視頻信號相關;以及 基于所述像素值直方圖,識別要被應用所述多個頻帶偏移的多個頻帶指數。
9.根據權利要求6所述的裝置,其中: 所述多個頻帶指數具有不連續分布,使得所述多個頻帶指數中的至少兩個連續的頻帶指數彼此分離至少一個頻帶指數值。
10.一種通信設備的操作方法,所述方法包括: 經由所述通信設備的輸入端,從至少一個額外通信設備接收視頻信號及多個頻帶偏移; 分析與至少一個最大編碼單元(LCU)相關的多個像素以識別用于識別多個頻帶指數的像素值分布,其中,所述最大編碼單元與所述視頻信號相關;以及 根據所述視頻信號或基于所述視頻信號的信號的濾波處理將所述多個頻帶偏移應用到所述多個頻 帶指數。
全文摘要
根據視頻編碼的采樣點自適應偏移(SAO)。在去塊處理之前可以執行SAO濾波處理(例如,根據視頻信號解碼和/或編碼)。例如,接收器和/或解碼器通信設備可以從包括各種頻帶偏移的發射器和/或編碼器通信設備接收信令。以推理方式,在無需來自所述發射器和/或編碼器通信設備的此等頻帶指數的信令的情況下,可以通過分析接收視頻信號(例如,從發射器和/或編碼器通信設備接收的視頻信號)來確定對應頻帶指數。在適當分析了由視頻信號生成的一個或多個最大編碼單元(LCU)以確定像素值分布(例如,其在一個實例中可以使用直方圖)之后,然后基于像素值分布,識別頻帶指數且頻帶偏移適用于此。
文檔編號H04N7/50GK103248888SQ20131005284
公開日2013年8月14日 申請日期2013年2月18日 優先權日2012年2月10日
發明者陳培松, 溫偉杰 申請人:美國博通公司