面向wmsn的多模式壓縮視頻感知編解碼方法
【技術領域】
[0001] 本發明是一種面向無線多媒體傳感器網絡(WirelessMultimediaSensor Networks,WMSN)的視頻編解碼改進方案,尤其涉及一種面向WMSN的新型視頻編碼方法,屬 于無線傳感器網絡領域。
【背景技術】
[0002] 麗SN視頻節點感知的信息豐富,可以用于固定場景的全方位監測,且監測視頻圖 像的背景變化極為緩慢,使得WMSN視頻數據存在較大的時空冗余,而這些冗余數據在編碼 過程中大部分被丟棄,極大地浪費了有限的WMSN資源。
[0003] 在MPEG-X及H. 26X標準的視頻編碼方案中,采用基于塊的運動估計、運動補償等 技術來提高編碼效率,從而使其在相同的編碼比特率條件下能獲得更高的視覺質量。但這 加重了編碼端的計算負擔,不能滿足WMSN視頻節點低計算量、低能耗的需求。因此,典型視 頻編碼方案不適用于上述領域。
[0004] 壓縮感知(CS)理論將傳統的數據采集與壓縮合二為一,不需要復雜的編碼過程。 在視頻信號處理過程中,CS適合處理單幀圖像處理,而分布式壓縮感知(DCS)理論研究的 是多個信號間存在相關性,可以用于對視頻幀序列進行聯合稀疏、聯合恢復。因此,將CS與 DCS引入視頻編碼,能簡化編碼步驟、降低編碼的復雜度,并在保證視覺質量的前提下獲得 更高的編碼效率,從而達到降低無線視頻傳感器節點能耗目的。
【發明內容】
[0005] 鑒于此,本發明的目的是提供一種面向WMSN的多模式壓縮視頻感知編碼與解碼 方法,可以在保證視覺質量的前提下獲得更高的編碼效率,從而降低無線視頻傳感器節點 的能源消耗。
[0006] 為達到上述目的,本發明的技術方案是這樣實現的:
[0007] 在編碼端,根據視頻的時空相關性,采用自適應分組器對視頻進行對視頻進行分 組,再采用四叉樹圖像分割法將圖像組內的每幅圖像分割為四個大小相同的圖像塊,并構 成四個圖像塊組,將圖像塊組依次送入多模式稀疏編碼器;然后,對圖像塊進行預處理,圖 像塊組的第一個圖像塊被設置為關鍵圖像塊(KB塊),剩余的圖像塊為非關鍵圖像塊(NKB 塊);同時,在多模式稀疏編碼器中,NKB塊被分為三種類型:跳過塊(SKIP塊)、分布式壓縮 感知塊(DCS塊)、壓縮感知塊(CS塊);再根據塊的類型及編號對圖像塊組進行二次分組; 最后,將KB塊、SKIP塊、DCS塊和CS塊分別送入相應的編碼器進行編碼。在解碼端中,根據 圖像塊的不同編碼方式,分別重構出相應的圖像塊,再按圖像塊的編號恢復各圖像塊組;然 后,對四個圖像塊組進行復接,以恢復出相應的G0P組。
[0008] 實現本發明目的的技術方案是:面向WMSN的多模式壓縮視頻感知編碼與解碼方 法,其特征是包括以下步驟:
[0009] 1)多模式稀疏編碼
[0010] la)該方法首先將圖像塊組內的第一個圖像塊設置為KB±夬,剩余圖像塊設置為 NKB塊,并計算其差異值。具體公式如下:
[0011]
[0012] 其中,i,j代表圖像塊橫縱坐標;H,L分別為圖像塊的高度與寬度;KB(i,j)代表KB塊,NKBi(i,j)代表第i個NKB塊。
[0013]lb)根據公式⑴得到的M/ID"值,將圖像塊組內所有的NK塊分為:SKIP塊、DCS 塊、CS塊三種類型。具體公式如下:
[0014]
[0015] 其中,1\與T2是實驗預先設定的門限值。
[0016] lc)根據圖像塊分類結果對NKB塊再次進行分組,最后得到三組新的圖像塊組,分 別為SKIP組,DCS組,CS組。
[0017] Id)二次分組完畢后,將KB塊、SKIP塊組、DCS塊組和CS塊組分別送入多模式稀 疏編碼器進行編碼,具體操作內容如下:
[0018] (1)采用較高采樣率的CS方法對KB塊進行用采樣,并將采樣值與編碼模式信息、 位置信息打包送入解碼端。
[0019] (2)對于SKIP組內的圖像塊,不進行編碼操作,只傳送對應的編碼模式信息與位 置信息。
[0020] (3)對于DCS組內的圖像塊,首先將其分別與對應的KB塊求殘差;然后,對所有的 殘差圖像塊進行聯合稀疏,并在同一測量基?下進行測量,再將所得到的測量值與編碼模 式信息、位置信息打包送入解碼端。
[0021 ] (4)采用較低采樣率的塊CS方法對CS組內的圖像塊進行采樣,并將得到的測量值 與編碼模式信息、位置信息打包送入解碼端。
[0022] 2)多模式解碼
[0023] 2a)對接收到的數據進行解包,得到各圖像塊的測量值、編碼模式信息與位置信 息。
[0024] 2b)采用CS技術恢復KB塊,并將其保存在存儲器中。
[0025] 2c)采用不同的解碼方法對相應類型的NKB塊進行恢復,具體操作內容如下:
[0026] (1)利用已重構出的KB塊替代SKIP組中對應位置的圖像塊。
[0027] (2)借助DCS技術,利用所獲取的聯合稀疏觀測值重構殘差圖像塊組,再將殘差圖 像塊與對應位置的KB塊相加,以恢復出DCS圖像塊組。
[0028] (3)采用字典學習方法,從重構出的KB塊中生成當前圖像塊組的稀疏字典,再利 用稀疏字典恢復出CS組中的圖像塊。
[0029] 與現有技術相比,本發明具有如下優點:
[0030] (1)采用固定圖像分組方式,在場景發生變化時會將相關性不強的視頻幀劃在同 一組,這會導致組內視頻幀間的時空相關不強,從而降低視頻編碼效率;本發明提出的動態 視頻幀分組方法優化了視頻幀分組結構,更好地利用了視頻幀間的時空相關性,從而有效 地解決了上述問題。
[0031] (2)根據圖像塊的特征,將其劃分成KB±夬、SKIP塊、DCS塊和CS±夬,并采用多模式 稀疏編碼器對各類圖像塊分別進行編碼,可以在保證視覺質量的前提下獲得更高的編碼效 率。
[0032] (3)與典型的視頻編碼方案相比,本方案能簡化編碼步驟、降低編碼的復雜度,并 在保證視覺質量的前提下獲得更高的編碼效率,從而達到降低無線視頻傳感器節點能耗目 的。
【附圖說明】
[0033] 圖1是本發明的系統結構框圖。
[0034] 圖2是DCS編解碼結構框圖。
[0035] 圖3是基于K-SVD的CS編解碼結構框圖。
【具體實施方式】
[0036] 為使本發明的目的、技術方案和優點更加清楚,下面結合附圖和實施例對本發明 作進一步的詳細描述。
[0037] 在編碼端,其編碼過程如下:
[0038] 步驟1 :對視頻序列分組
[0039] 1)選取視頻序列第一幀為關鍵幀。
[0040] 2)選擇一幀非關鍵幀,采用公式(3),計算當前非關鍵幀與關鍵幀的平均絕對誤 差。具體公式如下:
[0041 ]
[0042] 其中KF代表關鍵幀,NKFjf表非關鍵幀;H,L分別為非關鍵幀的高度與寬度;i,j 分別表示像素點的橫縱坐標。
[0043] 3)將值與門限值T(T為實驗獲取的經驗值)進行比較。
[0044] 4)當細Df<r時,則重復步驟2)、3);當継麵f>J時,則確定一個G0P。
[0045] 5)重復步驟1)至步驟4)的過程,直至所有圖像分組完畢。
[0046] 步驟2 :采用四叉樹圖像分割法將圖像組內的每幅圖像分割為四個大小相同的圖 像塊,并構成四個圖像塊組,將圖像塊組依次送入多模式稀疏編碼器。
[0047] 步驟3 :將圖像塊組內的第一個圖像塊設置為KB塊,剩余圖像塊設置為NKB塊,并 計算其差異值。具體公式如下:
[0048]
[0049] 其中,i,j代表圖像塊橫縱坐標;H,L分別為圖像塊的高度與寬度;KB(i,j)代表 KB塊,NKBi(i,j)代表第i個NKB塊。
[0050] 步驟4 :根據公式⑷得到的編以值,將圖像塊組內所有的NK塊分為:SKIP塊、 DCS塊、CS塊三種類型。具體公式如下:
[0051]
[0052] 其中,1\與T2是實驗預先設定的門限值。
[0053] 步驟5 :根據步驟4的分類結果,對NKB塊再次進行分組,最后得到三組新的圖像 塊組,分別為SKIP組,DCS組,CS組;并將KB塊、SKIP塊組、DCS塊組和CS塊組分別送入多 模式稀疏編碼器進行編碼,具體操作內容如下:
[0054] 1)對KB塊的編碼方式:假設KB塊是NxXN^的視頻信號,構造一個M一凡維的 觀測矩陣;使用觀測矩陣對KB塊進行測量,得到一個MkXNy維的觀測信號yk;再將yk與編 碼模式信息、位置信息打包送入解碼端。
[0055] 觀測信號yk計算公式如下:
[0056] yk=?xKB=①WxKB (6)
[0057] 其中,Mk<<Nx,?為觀測矩陣,W為稀疏基,O為高斯測量矩陣;知8為KB塊。
[0058] 2)對SKIP組內圖像塊的編碼方式:不進行編碼操作,只傳送對應的編碼模式信息 與位置信息。
[0059] 3)對DCS組內圖像塊的編碼方式:首先將其分別與對應的KB塊求殘差;然后,對 所有的殘差圖像塊進行聯合稀疏,并在同一測量基?下進行測量,再將所得到的測量值與 編碼模式信息、位置信息打包送入解碼端。下面結合圖2的編碼端部分,對所述方法步驟進 行詳細闡述。
[0060] 3a)假設圖像塊組經二次分組后,重新得到的DCS組