視頻編碼中的顏色自適應的制作方法
【專利說明】視頻編碼中的顏色自適應
【背景技術】
[0001] 數碼相機往往捕獲遠高于在實踐中典型地需要的高顏色深度的圖像。例如,一些 相機在每R通道、G通道W及B通道10或甚至12個比特的深度下捕獲樣本,從而在RGB空 間中給出30至36個比特的總深度。
[0002] 人眼另一方面通常不能夠區分該許多顏色。根據對人類視覺的研究,據估計典型 人類能夠僅感知大約2百萬個不同顏色。那對應于大約20個比特(每通道6至7個比特) 的總顏色深度。
[000引如果所捕獲的數據將被構碼W用于通過網絡傳送,則高顏色深度信息引發非常高 的比特率W及構碼方面的高處理負擔。類似地,如果數據將被構碼W用于存儲,則高顏色深 度引發大量存儲器資源。
[0004]由于此原因,出于視頻構碼的目的從相機捕獲的原始圖像數據常常被量化。該減 少對視頻進行構碼所需要的比特的數目,例如減少待例如作為諸如視頻V〇IP(IP語音電話) 呼叫該樣的實況視頻呼叫的一部分通過網絡傳送的比特流中所需要的比特率;或者減少將 視頻存儲在存儲器中所需要的比特的數目。
【發明內容】
[0005] 各種實施例設及適配例如作為通過網絡的實況視頻呼叫的一部分在視頻構碼和/ 或解碼背景下使用的顏色級別。
[0006] 根據本發明的一個或多個實施例,提供了包括接收器和去量化器的接收設備。接 收器被配置成從構碼器(encoder)接收視頻比特流。比特流包括各自具有表示顏色空間中 的通道的多個分量的共同形式的構碼圖像部分。多個構碼圖像部分中的每一個包括分量的 量化值的不同集合。該些至少包括正從量化級別的第一方案之中量化的所述分量中的第一 個的值。進一步地,從構碼器接收到的比特流包括將第一方案的量化級別映射到至少部分 地去量化的相應級別的查找表。
[0007] 去量化器被在操作上禪接到接收器,并且配置成使用接收到的來自構碼器的比特 流中的查找表來至少部分地去量化多個圖像部分中的第一分量的不同量化值。該通過將第 一分量的量化值轉換為與第一方案的至少部分地去量化級別中的級別相對應的至少部分 地去量化值而完成。接收設備被配置成基于通過所述去量化器的轉換將視頻圖像輸出到屏 幕。
[0008] 通過將量化級別的查找表包括在比特流中,本發明的實施例允許彼此成比例非均 勻的量化級別,并且允許該些非均勻級別被W未必局限于少量預定模型的方式適配。
[0009] 在一個或多個另外的實施例中,提供了傳送設備,所述傳送設備包括被配置成從 視頻相機接收視頻信號的輸入端W及構碼器、量化器和傳送器。構碼器被配置成從所述視 頻信號生成比特流。所生成的比特流包括各自具有表示顏色空間中的通道的多個分量的共 同形式的構碼圖像部分。多個構碼圖像部分中的每一個包括分量的量化值的不同集合。該 些至少包括正從量化級別的第一方案之中量化的所述分量中的第一個的值。
[0010] 量化器被配置成生成量化值,并且傳送器被配置成將構碼比特流傳送到接收設備 的解碼器(decoder)。進一步地,量化器被配置成接收關于接收設備的屏幕的指示。基于所 述指示,它確定將第一方案的量化級別映射到至少部分地去量化的相應級別的查找表。傳 送設備被配置成將查找表插入到比特流中W用于在接收設備處在至少部分地去量化多個 圖像部分的第一分量的不同量化值時使用。
[0011] 在另外的實施例中,可W提供一個或多個對應的計算機程序產品,其被具體化在 有形計算機可讀存儲裝置上,被配置W便當在處理器上執行時依照上述設備特征中的任一 個執行操作。在又另外的實施例中,可W提供承載依照上述特征所構碼的比特流的網絡元 件和/或存儲裝置。
【附圖說明】
[0012] 為了更好地理解所描述的實施例并且為了示出它們如何可W被付諸實施,通過示 例對附圖進行參考,附圖中: 圖1是視頻流的示意表示, 圖2是通信系統的示意框圖, 圖3是構碼視頻流的示意表示, 圖4是構碼器的示意框圖, 圖5是解碼器的示意框圖, 圖6是視頻圖像的變換塊的示意表示, 圖7是用于量化塊的量化方案的示意表示, 圖8是具有量化信息的變換塊的示意表示, 圖9是具有量化信息的變換塊的另一示意表示, 圖10是用于量化塊的量化方案的另一示意表示, 圖11是具有量化信息的變換塊的另一示意表示, 圖12是量化級別分布的示意表示, 圖13是量化級別分布的另一示意表示, 圖14是量化級別分布的另一示意表示, 圖15是量化級別分布的另一示意表示,W及 圖16是多方通f目場景的不意表不。
【具體實施方式】
[0013]顏色深度指代用來表示顏色的比特的數目。顏色空間指代用于表示顏色的通道 (例如,由RGB顏色空間中的紅色通道(R)、綠色通道(G)W及藍色通道(B)構成;或YUV顏 色空間中的亮度通道(Y)和兩個色度通道(U、V))的系統。給定顏色能夠由顏色空間中的 一組值表示,通道中的每一個對應一個值。每個值例如可能是來自相機的樣本輸入,或者從 來自相機的輸入得到的量化的、變換的或構碼的樣本。
[0014]還可能存在不同的格式W用于表達特定類型的顏色空間中的顏色。例如在YUV4:4:4格式上,對于四個亮度樣本Y的每個組存在四個色度樣本U的對應組和四個色度樣 本V的另一對應組。另一方面在YUV4:2:0格式上,對于四個亮度樣本Y的每個組存在由 一個u樣本和一個V樣本組成的兩個色度樣本的對應組,即色度值被塊中的四個像素共享。
[0015] 可W在用來表示特定顏色空間中的顏色的比特的總數、或用來表示顏色空間的特 定通道的構成顏色值或樣本的比特的數目方面考慮顏色深度。
[0016] 如所提到的,數碼相機往往捕獲遠高于在實踐中典型地需要的高顏色深度的圖 像。例如,一些相機在每R通道、G通道W及B通道10或甚至12個比特的深度下捕獲樣本, 從而在RGB空間中給出30至36個比特的總深度。人眼另一方面通常不能夠區分該許多顏 色。根據對人類視覺的研究,據估計典型人類僅能夠感知大約2百萬個不同顏色。那對應 于大約20個比特(每通道6至7個比特)的總顏色深度。如果所捕獲的數據將被構碼W用 于通過網絡傳送,則高顏色深度信息引發非常高的比特率W及構碼方面的高處理負擔。類 似地,如果數據將被構碼W用于存儲,則高顏色深度引發大量存儲器資源。
[0017] 由于該個原因,出于視頻構碼的目的從相機捕獲的原始圖像數據常常被量化。該 減少對視頻進行構碼所需要的比特的數目,例如減少待例如作為諸如視頻VoIP(IP語音電 話)呼叫該樣的實況視頻呼叫的一部分通過網絡傳送的比特流中所需要的比特率;或者減 少將視頻存儲在存儲器中所需要的比特的數目。
[0018] 量化是取連續值并且將它轉換成在離散步長的標度上表示的值的過程,或者在實 踐中因為所有數字輸入數據在某個級別的粒度上是離散的,所W是將在更高粒度標度(使 用更多比特表示)上表示的值轉換為較低粒度標度(更粗趟,使用較少比特表示)的過程。量 化的過程減少頻域中的必要比特的數目,因為它遍及變換系數被應用(見下文)。在顏色值 的情況下,該將包括將在較高深度標度上表示的值轉換為較低深度標度的過程。例如,量化 將描述從數碼相機取近似地連續的10至12個比特輸入樣本并且將它轉換為8比特值。
[0019] 量化值在大小上較小并且所W需要較少比特來構碼,W及在構碼過程中需要較少 的處理資源。犧牲是減少的顏色深度一-即便當在解碼器側去量化時,也將在值或樣本能 夠取的級別之間留下大步長。因此存在待在由構碼所引發的資源與能夠在解碼時再次重建 圖像的準確性之間做出的權衡。
[0020] 理想地,系統設計者將旨在實現使比特率最小化同時仍然不太導致對人眼可感知 的失真的程度的量化。可替換地,如果資源是更有限的或預期為更有限的,則目標可W是W 保留仍然可容忍的失真的方式使比特率最小化。
[0021] 在常規量化過程中,每個值按特定因數按比例縮小,并且然后在解碼器側應用的 去量化中再按該因數按比例擴大。
[0022] 圖1給出了從相機捕獲并且劃分成準備好由視頻構碼器構碼W便生成構碼比特 流的部分的輸入視頻信號的示意圖示。信號包括在時間上劃分成多個帖(F)的運動視頻圖 像,每個帖表示在不同的相應時刻(.....)的圖像。在每個帖內,帖被在空間上 劃分成各自表示多個像素的多個部分。該些部分例如可W被稱為塊。在某些方案中,帖被 劃分并且細分成不同級別的部分或塊。例如可W將每個帖劃分成宏塊(MB)并且可W將每 個宏塊劃分成塊(b),例如每個塊表示帖內的8x8個像素的區域并且每個宏塊表示2x2個塊 (16x16個像素)的區域。在某些方案中,還能夠將每個帖劃分成各自包括多個宏塊的切片 (S)。
[0