基于感興趣區域的視頻編碼方法和設備的制作方法
【專利摘要】本發明公開了一種基于感興趣區域的視頻編碼方法和設備,該視頻編碼方法包括:對象檢測步驟,用于檢測輸入的視頻幀中的特定對象,以基于所檢測的特定對象來識別視頻幀中的感興趣區域和非感興趣區域;量化參數計算步驟,用于計算所識別的感興趣區域和非感興趣區域中的宏塊的量化參數值;宏塊類型選擇步驟,用于基于視頻幀的類型而選擇感興趣區域和非感興趣區域中的宏塊的類型;以及視頻編碼步驟,用于基于所計算的感興趣區域和非感興趣區域中的宏塊的量化參數值以及所選擇的宏塊類型,對視頻幀進行編碼。根據本發明,可以簡單高效地實現視頻壓縮,既保證了感興趣區域的高分辨率,又不會使得非感興趣區域過于模糊而無法分辨。
【專利說明】基于感興趣區域的視頻編碼方法和設備
【技術領域】
[0001]本公開內容涉及視頻處理技術,更具體地,涉及一種基于感興趣區域(Region-of-1nterest, R0I)的視頻編碼方法和設備,其能夠簡單且高效地在實現視頻壓縮,保持視頻幀中的ROI區域的良好視頻質量,同時不會使得非感興趣區域(non-ROI)的視頻圖像過于模糊而無法分辨。
【背景技術】
[0002]近年來,基于智能視頻處理的應用已廣泛用于各種電子裝置中,并且大部分應用需要將壓縮視頻傳送到用于進行進一 步處理的后端服務器或者其它通信終端。因此,存在對于視頻分辨率的高要求與限制了視頻質量的有限網絡帶寬之間出現沖突的問題,從而需要新的視頻編碼方法來解決這種矛盾。
[0003]因此,在視頻處理技術中提出了 ROI概念,以使得應用僅關注視頻幀中的用戶所關心的重要區域或對象,而對于視頻幀或圖片中的其它區域(即,非感興趣區域),可以粗糙地處理甚至忽略這些區域。應用于視頻壓縮中的ROI概念通常表示在編碼時,對于視頻幀中的用戶更為關注的區域分配較多比特,而對于其它區域(例如,背景、無關對象等等)則分配較少比特,從而實現了編碼視頻流的減小。例如,在智能監控應用中,人、汽車、面部等的區域通常可能是ROI區域并且將以更多的比特進行編碼以保持必要的細節清晰可見,而其它的非ROI區域將以較少的比特來編碼以僅提供一些基本信息。
[0004]在視頻編碼領域中,已出現了大量基于ROI的視頻編碼方法。例如,根據以下非專利文獻I中所公開的視頻編碼方法,通過為視頻幀中的ROI區域和非ROI區域中的宏塊(macroblock)設置不同的量化參數值,可以減小編碼后的視頻流的大小。然而,在該方法中,為ROI區域和非ROI區域中的宏塊所設置的量化參數是固定值而非自適應的,因此可能無法滿足對于視頻質量的要求。
[0005]此外,根據以下非專利文獻2中所公開的視頻編碼方法,通過對于每個幀均限制其中的ROI區域和非ROI區域的宏塊類型來減小編碼后的視頻流的大小。然而,這可能會使得如背景的非ROI區域過于模糊而無法分辨。
[0006]而對于以下非專利文獻3中所公開的視頻編碼方法中,采用改進的比率控制算法來計算ROI區域和非ROI區域中的宏塊的量化參數值從而實現視頻壓縮,但是該算法較復雜。
[0007]引用文獻
[0008]【非專利文獻I】:Lino F, Lui s C,Pedro A., “H.264/SVC ROI Encoding withSpatial Scalability,,,Proceedings of International Conference on SignalProcessing and Multimedia Applications.Porto, Portugal:[s.n.], 2008:212-215
[0009]【非專利文獻2】:TaeyoungNa et al,“A Fast Macroblock Mode Decision SchemeUsing RO1-Based Coding of H.2641MPEG-4PartlOAVC for Mobile Video TelephonyApplications,,,Applications of Digital Image Processing XXXI, Andrew G.Tescher編輯,Proceedings of the SPIE, Volume7073, pp.707301-707301-10 (2008)
[0010]【非專利文獻3】:Sira Rao 和 Nikil Jayant, “Optimizing Algorithmsfor Region-of-1nterest Video Compression,with Application to MobileTelehealth”,ICME, pp.513-516.1EEE, (2006)
【發明內容】
[0011]在下文中給出了關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。但是,應當理解,這個概述并不是關于本發明的窮舉性概述。它并不是意圖用來確定本發明的關鍵性部分或重要部分,也不是意圖用來限定本發明的范圍。其目的僅僅是以簡化的形式給出關于本發明的某些概念,以此作為稍后給出的更詳細描述的前序。
[0012]鑒于以上問題,本發明的目的是提供一種簡單且高效的視頻編碼方法,其通過對視頻幀中的ROI區域和非ROI區域自適應地設置其中的宏塊的量化參數值,并且基于視頻幀的類型來選擇ROI區域和非ROI區域中的宏塊類型,在實現視頻壓縮的同時,保證ROI區域的高分辨率且不會使得非ROI區域的視頻過于模糊而無法分辨。
[0013]根據本發明的實施例的一方面,提供了一種基于感興趣區域的視頻編碼方法,包括:對象檢測步驟,用于檢測輸入的視頻幀中的特定對象,以基于所檢測的特定對象來識別視頻幀中的感興趣區域和非感興趣區域;量化參數計算步驟,用于計算所識別的感興趣區域和非感興趣區域中的宏塊的量化參數值;宏塊類型選擇步驟,用于基于視頻幀的類型而選擇感興趣區域和非感興趣區域中的宏塊的類型;以及視頻編碼步驟,用于基于所計算的感興趣區域和非感興趣區域中的宏塊的量化參數值以及所選擇的宏塊類型,對視頻幀進行編碼。
[0014]根據本發明的優選實施例,在宏塊類型選擇步驟中,可以在視頻幀是幀內幀的情況下,對于所述視頻幀中的感興趣區域和非感興趣區域均選擇所有宏塊類型;而在視頻幀是幀間幀的情況下,對于視頻幀中的非感興趣區域,僅選擇幀間宏塊類型,而對于視頻幀中的感興趣區域,選擇所有宏塊類型。
[0015]根據本發明的另一優選實施例,在量化參數計算步驟中,可以根據視頻幀中的感興趣區域的大小來計算感興趣區域中的宏塊的量化參數值。
[0016]根據本發明的另一優選實施例,在量化參數計算步驟中,根據視頻幀中的感興趣區域的大小來計算感興趣區域中的宏塊的量化參數值進一步包括基于感興趣區域中的宏塊的數量與視頻幀中的宏塊的數量的比率來計算感興趣區域中的宏塊的量化參數值。
[0017]根據本發明的另一優選實施例,該視頻編碼方法還包括:采樣步驟,用于在對象檢測步驟之前對視頻幀進行采樣,其中,在對象檢測步驟中,通過識別采樣后的視頻幀中的感興趣區域和非感興趣區域來識別視頻幀中的感興趣區域和非感興趣區域。
[0018]根據本發明的實施例的另一方面,還提供了一種基于感興趣區域的視頻編碼設備,包括:對象檢測單元,被配置成檢測輸入的視頻幀中的特定對象,以基于所檢測的特定對象來識別視頻幀中的感興趣區域和非感興趣區域;量化參數計算單元,被配置成計算所識別的感興趣區域和非感興趣區域中的宏塊的量化參數值;宏塊類型選擇單元,被配置成基于視頻幀的類型而選擇所述感興趣區域和非感興趣區域中的宏塊的類型;以及視頻編碼單元,被配置成基于所計算的感興趣區域和非感興趣區域中的宏塊的量化參數值以及所選擇的宏塊類型,對視頻幀進行編碼。
[0019]根據本發明的實施例的又一方面,還提供了一種存儲介質,該存儲介質包括機器可讀的程序代碼,當在信息處理設備上執行程序代碼時,該程序代碼使得信息處理設備執行根據本發明的基于感興趣區域的視頻編碼方法。
[0020]此外,根據本發明的實施例的再一方面,還提供了一種程序產品,該程序產品包括機器可執行的指令,當在信息處理設備上執行指令時,該指令使得信息處理設備執行根據本發明的基于感興趣區域的視頻編碼方法。
[0021]因此,根據本發明的實施例,通過在宏塊模式預測處理期間根據幀類型而對于ROI區域和非ROI區域限定宏塊類型的范圍并且通過在量化處理期間對于ROI區域和非ROI區域采用不同的量化參數值,可以簡單且高效地實現視頻壓縮,保證了 ROI區域的高視頻質量,同時不會使得非ROI區域的視頻過于模糊,從而適合于內容感知(content-aware)視頻編碼應用,例如門禁系統的人臉識別、停車場的遠程監控系統等等。
[0022]在下面的說明書部分中給出本發明實施例的其他方面,其中,詳細說明用于充分地公開本發明實施例的優選實施例,而不對其施加限定。
【專利附圖】
【附圖說明】
[0023]本發明可以通過參考下文中結合附圖所給出的詳細描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標記來表示相同或者相似的部件。所述附圖連同下面的詳細說明一起包含在本說明書中并形成說明書的一部分,用來進一步舉例說明本發明的優選實施例和解釋本發明的原理和優點。其中:
[0024]圖1是示出根據本發明的實施例的基于ROI的視頻編碼方法的示例的流程圖;
[0025]圖2是示出在圖1所示的基于ROI的視頻編碼方法中的對象檢測步驟中的ROI區域識別的示例的示意圖;
[0026]圖3是示出在圖1所示的基于ROI的視頻編碼方法中的宏塊類型選擇步驟的示例實現的示意圖;
[0027]圖4是示出根據本發明的實施例的基于ROI的視頻編碼方法與現有技術的視頻編碼方法相比的幀比特數減少的效果示例的示意圖;
[0028]圖5是示出根據本發明的實施例的基于ROI的視頻編碼設備的功能配置的示例的框圖;以及
[0029]圖6是示出作為本發明的實施例中所采用的信息處理設備的個人計算機的示例性結構的框圖。
【具體實施方式】
[0030]在下文中將結合附圖對本發明的示范性實施例進行描述。為了清楚和簡明起見,在說明書中并未描述實際實施方式的所有特征。然而,應該了解,在開發任何這種實際實施例的過程中必須做出很多特定于實施方式的決定,以便實現開發人員的具體目標,例如,符合與系統及業務相關的那些限制條件,并且這些限制條件可能會隨著實施方式的不同而有所改變。此外,還應該了解,雖然開發工作有可能是非常復雜和費時的,但對得益于本公開內容的本領域技術人員來說,這種開發工作僅僅是例行的任務。[0031]在此,還需要說明的一點是,為了避免因不必要的細節而模糊了本發明,在附圖中僅僅示出了與根據本發明的方案密切相關的設備結構和/或處理步驟,而省略了與本發明關系不大的其它細節。
[0032]以下將參照圖1至圖6來描述根據本發明的實施例的基于ROI的視頻編碼方法和視頻編碼設備。
[0033]首先,將參照圖1來說明根據本發明的實施例的基于ROI的視頻編碼方法的處理流程示例。
[0034]具體地,參照圖1,根據本發明的實施例的基于ROI的視頻編碼方法包括對象檢測步驟S114、量化參數計算步驟S116、宏塊類型選擇步驟S118和視頻編碼步驟S120。優選地,該方法還可以包括去噪步驟SllO和采樣步驟S112。以下將詳細描述各個步驟中的處理。
[0035]首先,在對象檢測步驟S114中,可以檢測輸入的視頻幀中的特定對象,以基于所檢測的特定對象來識別視頻幀中的感興趣區域和非感興趣區域。具體地,可以根據實際應用的需要而采用適當的對象檢測算法來檢測目標對象(例如,人、汽車等等),從而基于所檢測到的對象來定義視頻幀中的ROI區域和非ROI區域。這些對象檢測算法可以是視頻處理領域公知的任意算法,在此不再詳述。
[0036]優選地,還可以采用例如濾波方法等對輸入的原始視頻幀進行預處理,以去除視頻幀中包括的環境噪聲并且提高視頻壓縮質量。在去噪步驟SllO中,可以去除輸入的視頻幀中包括的噪聲。優選地,為了進一步提高處理效率,去噪步驟SllO和對象檢測步驟S114可以并行地執行。
[0037]此外,為了提高視頻處理的效率,還可以在對象檢測步驟S114之前首先對輸入的視頻幀進行采樣,以減少隨后的對象檢測處理的計算量。優選地,采樣率可以由用戶根據在對象檢測步驟S114中采用的對象檢測算法的復雜度來設定。
[0038]優選地,在對象檢測步驟S114中,可以通過識別采樣后的視頻幀中的ROI區域和非ROI區域來識別原始視頻幀中的ROI區域和非ROI區域。
[0039]具體地,該過程可以參照圖2來詳細說明。對采樣后的視頻幀應用對象檢測算法以檢測其中包括的特定對象,并且基于所檢測的特定對象來識別采樣后的視頻幀中的ROI區域和非ROI區域,以得到采樣后的視頻幀中的ROI區域的位置信息和尺寸信息等。然后,通過調整所得到的采樣后視頻幀中的ROI區域的尺寸并且將其映射回到原始輸入的視頻中,可以獲得原始輸入視頻幀中的ROI區域和非ROI區域的信息(例如,位置,尺寸等),這些信息將用于隨后的編碼處理中。這在圖2中示意性地示出。
[0040]作為示例,由于在視頻處理技術中通常以宏塊級來執行各種處理,因此在這里,ROI區域可以指的是包括包含對象像素的所有宏塊的區域。相應地,作為示例,輸入視頻中的ROI區域的尺寸信息可以由ROI區域中包括的宏塊數量與視頻幀中包括的宏塊總數的比
率來表示,S卩,k=NKra/NT.。
[0041]接下來,在獲得了 ROI區域的相關信息之后,可以在量化參數計算步驟S116中,計算在步驟S114中所識別的ROI區域和非ROI區域中的宏塊的量化參數值。優選地,可以根據視頻幀中的ROI區域的大小來計算ROI區域中的宏塊的量化參數值。
[0042]在視頻壓縮處理中,對本領域技術人員公知的是,由于ROI區域是用戶較關心的區域,而非ROI區域是包含不重要信息的區域(諸如背景等),因此期望在視頻編碼時以較多的比特對ROI區域進行編碼以保證編碼后視頻的高分辨率,而以較少的比特對非ROI區域進行編碼以減小編碼視頻流從而滿足有限網絡帶寬的要求。
[0043]因此,在量化參數計算步驟S116中,分別計算ROI區域和非ROI區域中的宏塊的量化參數,以滿足不同的視頻編碼要求。
[0044]以下給出了計算ROI區域和非ROI區域中的宏塊的量化參數值的具體示例。具體地,對于非ROI區域中的宏塊,通常采用作為預定的固定常數的量化參數值。該固定常數可以根據對于視頻質量的具體要求而預先設定。作為示例,該固定常數在這里可以為45。
[0045]而對于ROI區域中的宏塊,為了控制比特數量,優選地,其量化參數值不是固定的而是可以根據視頻幀中的ROI區域的大小而自適應地更新。
[0046]優選地,基于ROI區域的大小計算ROI區域中的宏塊的量化參數值可以通過基于上述ROI區域中的宏塊數量與輸入視頻幀中的宏塊的總數的比率(即,k)計算ROI區域中的宏塊的量化參數值來實現。該過程例如可以通過下述等式來實現。
[0047]QPE0I=Round (F+R*k) (I)
[0048]QP’ R01=MIN(QPK0I,C) (2)
[0049]其中,QP’ E0I表示ROI區域中的宏塊的量化參數值,k表示上述ROI區域中的宏塊的數量與視頻幀中的宏塊的數量的比率,RoundO表示取整運算,MINO表示取最小值的運算,其中F、R和C分別表示ROI區域中的宏塊的量化參數值的基值、調節值及上限值,均為預定常數。優選地,作為示例,F可以為22,R為50,并且C為32。
[0050]應理解,以上給出的計算方法和數值僅為示例而非限制,并且本領域技術人員可以根據實際需要而采用其它數值或者對上述計算公式進行修改,只需滿足量化參數值越大則編碼所需比特數越少從而分辨率越低的視頻編碼原理即可。
[0051]接下來,為了進一步減少非ROI區域編碼所需的比特數,從而進一步減小編碼視頻流的大小,可以限制在宏塊預測處理中非ROI區域中的宏塊類型。
[0052]具體地,在宏塊類型選擇步驟S118中,可以基于視頻幀的類型而選擇ROI區域和非ROI區域中的宏塊的類型。
[0053]作為示例,參照圖3,在宏塊類型選擇步驟S118中,可以應用以下規則來基于視頻幀的類型分別選擇ROI區域和非ROI區域中的宏塊類型:如果視頻幀是幀內幀,則對于ROI區域和非ROI區域均選擇所有宏塊類型,這是由于一般而言幀內幀需要較多的比特來編碼;而如果視頻幀是幀間幀,則對于視頻幀中的ROI區域,選擇所有宏塊類型以保證高分辨率,而對于視頻幀中的非ROI區域,僅選擇幀間宏塊類型以減少編碼所需的比特。
[0054]關于視頻處理中的宏塊類型的定義,可以參見“Recommendation ITU-T
H.264,Series H:Audiovisual and Multimedia Systems, Infrastructure ofAudiovisual Services-Coding of Moving Video (2009)” 中的相關規定,在此不再詳述。
[0055]然后,在視頻編碼步驟S120中,可以基于在量化參數計算步驟S116中算出的ROI區域和非ROI區域中的宏塊的量化參數值和在宏塊類型選擇步驟S118中選擇的宏塊類型,對視頻幀進行編碼。優選地,該編碼方法可以為熵編碼,以實現無損視頻壓縮。
[0056]優選地,在對視頻幀進行了去噪處理之后,可以在視頻編碼步驟S120中對去噪后的視頻幀。[0057]應理解,上述基于幀類型而選擇ROI區域和非ROI區域中的宏塊類型的規則僅為示例而非限制,并且本領域技術人員可以根據本發明的原理而采用其它適當的規則來減少編碼所需的比特數。
[0058]圖4示意性地示出了根據本發明的實施例的基于ROI的視頻編碼方法與現有技術的視頻編碼方法相比的幀比特數的減少效果。其中,在圖4所示的曲線圖中,橫坐標表示幀數量,而縱坐標表示比特數。
[0059]在該示例中,用于測試的示例輸入視頻幀可以是例如用于辦公室的人臉檢測的視頻序列,因此可以應用面部檢測引擎來獲得ROI區域信息,并且編碼后的序列為IPPPP模式,其中,I表示幀內幀,P表示預測幀。從圖4可以看出,與現有技術的視頻編碼方法相比,通過應用根據本發明的實施例的基于ROI的視頻編碼方法,大大減少了編碼所需的比特數(大約30%至40%),從而能夠在有限的網絡帶寬的情況下,將理想的編碼視頻圖像傳送到用戶終端設備,即,既保證了 ROI區域的高分辨率又不會使得非ROI區域過于模糊的視頻。此夕卜,與現有技術相比,根據本發明的基于ROI的視頻編碼方法的實現較簡單且高效,從而還降低了視頻處理的實現成本。
[0060]雖然上面結合圖1至圖4詳細描述了根據本發明實施例的基于ROI的視頻編碼方法的示例,但是本領域的技術人員應當明白,附圖所示的流程圖僅僅是示例性的,并且可以根據實際應用和具體要求的不同,對上述方法流程進行相應的修改。例如,根據需要,可以對上述方法中的某些步驟的執行順序進行調整,或者可以省去或者添加某些處理步驟。例如,在圖1中以虛線框示出的去噪步驟SllO和采樣步驟S112即是為了提高視頻質量和處理效率而執行的可選步驟,并且根據本發明的視頻編碼方法可以在不包括這兩個步驟的情況下來實現。此外,應理解,以上示例并不構成對本發明的限制,本領域技術人員可以基于所教導的原理,對上述過程進行適當的修改而應用于其它應用場合。
[0061]與根據本發明實施例的基于ROI的視頻編碼方法相對應,本發明的實施例還提供了一種基于ROI的視頻編碼設備。以下將參照圖5詳細描述根據本發明的基于ROI的視頻編碼設備的功能配置示例。
[0062]如圖5所示,根據本發明的基于ROI的視頻編碼設備500可以包括對象檢測單元514、量化參數計算單元516、宏塊類型選擇單元518和視頻編碼單元520。優選地,該視頻編碼設備500還可以包括去噪單元510和采樣單元512。以下將參考圖5詳細描述各個單元的功能配置示例。
[0063]對象檢測單元514可以被配置成檢測輸入的視頻幀中的特定對象,以基于所檢測的特定對象來識別視頻幀中的ROI區域和非ROI區域。可以根據實際需要而采用本領域公知的對象檢測算法來檢測對象。
[0064]量化參數計算單元516可以被配置成計算所識別的ROI區域和非ROI區域中的宏
塊的量化參數值。
[0065]具體地,對于視頻幀中的非ROI區域,其量化參數值通常可以為預定的固定常數,這里例如可以為45。而對于視頻幀中的ROI區域,為了控制比特數量,其量化參數值不是固定的而是可以根據實際需要而自適應地改變。優選地,量化參數計算單元516可以根據視頻幀中的ROI區域的大小來計算ROI區域中的宏塊的量化參數值。
[0066]作為示例,量化參數計算單元516可以基于ROI區域中的宏塊的數量與視頻幀中的宏塊的總數的比率來計算ROI區域中的宏塊的量化參數值。具體計算過程可以參見以上在根據本發明實施例的基于ROI的視頻編碼方法中所描述的計算等式(I)和(2),在此不再贅述。
[0067]應理解,這里給出的計算方法和所采用的具體數值僅為示例而非限制,并且可以根據實際需要進行修改。
[0068]宏塊類型選擇單元518可以被配置成基于視頻幀的類型而選擇ROI區域和非ROI區域中的宏塊的類型。這可以進一步減少非ROI區域編碼所需的比特數,從而進一步減小編碼視頻流的大小。
[0069]具體地,宏塊類型的選擇可以基于以下簡單規則來實現:如果視頻幀是幀內幀,則對于ROI區域和非ROI區域,宏塊類型選擇單元518可以均選擇所有宏塊類型;而如果視頻幀是幀間幀,則對于ROI區域,宏塊類型選擇單元518可以選擇所有宏塊類型,而對于非ROI區域,宏塊類型選擇單元518可以僅選擇幀間宏塊類型。
[0070]基于該規則,可以在保證ROI區域的高分辨率的同時,減少非ROI區域編碼所需的比特數以減小編碼視頻流,并且不會使得非ROI區域的視頻圖像過于模糊。該規則僅是在宏塊模式預測處理中用于選擇宏塊類型的規則示例,并且本領域技術人員可以基于本發明的原理對其進行適當修改。
[0071]視頻編碼單元520可以被配置成基于量化參數計算單元516所計算的ROI區域和非ROI區域中的宏塊的量化參數值和宏塊類型選擇單元518所選擇的宏塊類型,對視頻幀進行編碼。優選地,編碼方法可以為熵編碼。
[0072]此外,為了減少環境噪聲以提高視頻壓縮質量,還可以將原始視頻幀輸入到去噪單元510中接受去噪處理。
[0073]具體地,去噪單元510可以被配置成去除輸入視頻幀中包括的噪聲,這例如可以通過本領域公知的濾波處理來實現。優選地,為了提高處理效率,去噪單元510和對象檢測單元514可以被配置成并行地執行各自的處理,從而視頻編碼單元520可以對去噪后的視頻進行編碼。
[0074]此外,為了減少對象檢測單元514的對象檢測處理的計算量以提高視頻處理的效率,還可以在將視頻輸入到對象檢測單元514之前對其進行采樣處理。
[0075]具體地,采樣單元512可以被配置成對輸入視頻幀進行采樣處理。相應地,對象檢測單元514可以被配置成通過識別采樣后的視頻幀中的ROI區域和非ROI區域來識別原始視頻幀中的ROI區域和非ROI區域。通過將得到的采樣后的視頻幀中ROI區域的位置和尺寸信息等映射回到原始視頻幀中以得到原始視頻幀中的ROI區域信息的具體實現可以參見在以上方法實施例中結合圖2的描述,在此不再贅述。
[0076]需要說明的是,本發明實施例所述的基于ROI的視頻編碼設備是與前述方法實施例相對應的,因此,設備實施例中未詳述的部分,請參見方法實施例中相應位置的介紹,這里不再贅述。
[0077]此外,上述基于ROI的視頻編碼設備500的結構和功能配置僅為示例而非限制,并且本領域技術人員可以根據需要而對上述結構進行修改。例如,圖5中以虛線框示出的去噪單元510和采樣單元512為可選單元。
[0078]另外,還應該指出的是,上述系列處理和設備也可以通過軟件和/或固件實現。在通過軟件和/或固件實現的情況下,從存儲介質或網絡向具有專用硬件結構的計算機,例如圖6所示的通用個人計算機600安裝構成該軟件的程序,該計算機在安裝有各種程序時,能夠執行各種功能等等。
[0079]在圖6中,中央處理單元(CPU) 601根據只讀存儲器(ROM) 602中存儲的程序或從存儲部分608加載到隨機存取存儲器(RAM) 603的程序執行各種處理。在RAM603中,也根據需要存儲當CPU601執行各種處理等等時所需的數據。
[0080]CPU601、R0M602和RAM603經由總線604彼此連接。輸入/輸出接口 605也連接到總線604。
[0081]下述部件連接到輸入/輸出接口 605:輸入部分606,包括鍵盤、鼠標等等;輸出部分607,包括顯示器,比如陰極射線管(CRT)、液晶顯示器(IXD)等等,和揚聲器等等;存儲部分608,包括硬盤等等;和通信部分609,包括網絡接口卡比如LAN卡、調制解調器等等。通信部分609經由網絡比如因特網執行通信處理。
[0082 ]根據需要,驅動器610也連接到輸入/輸出接口 605。可拆卸介質611比如磁盤、光盤、磁光盤、半導體存儲器等等根據需要被安裝在驅動器610上,使得從中讀出的計算機程序根據需要被安裝到存儲部分608中。
[0083]在通過軟件實現上述系列處理的情況下,從網絡比如因特網或存儲介質比如可拆卸介質611安裝構成軟件的程序。
[0084]本領域的技術人員應當理解,這種存儲介質不局限于圖6所示的其中存儲有程序、與設備相分離地分發以向用戶提供程序的可拆卸介質611。可拆卸介質611的例子包含磁盤(包含軟盤(注冊商標))、光盤(包含光盤只讀存儲器(⑶-ROM)和數字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊商標))和半導體存儲器。或者,存儲介質可以是R0M602、存儲部分608中包含的硬盤等等,其中存有程序,并且與包含它們的設備一起被分發給用戶。
[0085]還需要指出的是,執行上述系列處理的步驟可以自然地根據說明的順序按時間順序執行,但是并不需要一定根據時間順序執行。某些步驟可以并行或彼此獨立地執行。
[0086]雖然已經詳細說明了本發明及其優點,但是應當理解在不脫離由所附的權利要求所限定的本發明的精神和范圍的情況下可以進行各種改變、替代和變換。而且,本發明實施例的術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
[0087]根據本發明的實施例,還公開了以下附記:
[0088]1.一種基于感興趣區域的視頻編碼方法,包括:
[0089]對象檢測步驟,用于檢測輸入的視頻幀中的特定對象,以基于所檢測的特定對象識別所述視頻幀中的感興趣區域和非感興趣區域;
[0090]量化參數計算步驟,用于計算所識別的感興趣區域和非感興趣區域中的宏塊的量化參數值;
[0091]宏塊類型選擇步驟,用于基于所述視頻幀的類型而選擇所述感興趣區域和非感興趣區域中的宏塊的類型;以及[0092]視頻編碼步驟,用于基于所計算的所述感興趣區域和非感興趣區域中的宏塊的量化參數值以及所選擇的宏塊類型,對所述視頻幀進行編碼。
[0093]2.根據附記I所述的視頻編碼方法,其中,在所述宏塊類型選擇步驟中,在所述視頻幀是幀內幀的情況下,對于所述視頻幀中的感興趣區域和非感興趣區域均選擇所有宏塊類型;而在所述視頻幀是幀間幀的情況下,對于所述視頻幀中的非感興趣區域,僅選擇幀間宏塊類型,而對于所述視頻幀中的感興趣區域,選擇所有宏塊類型。
[0094]3.根據附記I所述的視頻編碼方法,其中,在所述量化參數計算步驟中,根據所述視頻幀中的感興趣區域的大小來計算所述感興趣區域中的宏塊的量化參數值。
[0095]4.根據附記3所述的視頻編碼方法,其中,在所述量化參數計算步驟中,根據所述視頻幀中的感興趣區域的大小來計算所述感興趣區域中的宏塊的量化參數值進一步包括基于所述感興趣區域中的宏塊的數量與所述視頻幀中的宏塊的數量的比率來計算所述感興趣區域中的宏塊的量化參數值。
[0096]5.根據附記4所述的視頻編碼方法,其中,在所述量化參數計算步驟中,基于以下等式來計算所述感興趣區域中的宏塊的量化參數值:
[0097]QPE0I=Round (F+R*k)
[0098]QP ’ R01=MIN (QPK0I,C)
[0099]其中,QP’ Kra表示所述感興趣區域中的宏塊的量化參數值,k表示所述感興趣區域中的宏塊的數量與所述視頻幀中的宏塊的數量的比率,RoundO表示取整運算,MINO表示取最小值的運算,其中F、R和C分別表示所述感興趣區域中的宏塊的量化參數值的基值、調節值及上限值,均為預定常數。
[0100]6.根據附記5所述的視頻編碼方法,其中,F為22,R為50,并且C為32。
[0101]7.根據附記I所述的視頻編碼方法,還包括:
[0102]去噪步驟,用于去除所述視頻幀中包括的噪聲,
[0103]其中,在所述視頻編碼步驟中,對去噪后的視頻幀進行編碼。
[0104]8.根據附記7所述的視頻編碼方法,其中,所述去噪步驟與所述對象檢測步驟并行地執行。
[0105]9.根據附記I所述的視頻編碼方法,還包括:
[0106]采樣步驟,用于在所述對象檢測步驟之前對所述視頻幀進行采樣,
[0107]其中,在所述對象檢測步驟中,通過識別采樣后的視頻幀中的感興趣區域和非感興趣區域來識別所述視頻幀中的感興趣區域和非感興趣區域。
[0108]10.根據附記1-9中任一項所述的視頻編碼方法,其中,所述非感興趣區域中的宏塊的量化參數值為預定的固定常數。
[0109]11.根據附記10所述的視頻編碼方法,其中,所述固定常數為45。
[0110]12.根據附記1-11中任一項所述的視頻編碼方法,其中,在所述視頻編碼步驟中,對所述視頻幀進行熵編碼。
[0111]13.一種基于感興趣區域的視頻編碼設備,包括:
[0112]對象檢測單元,被配置成檢測輸入的視頻幀中的特定對象,以基于所檢測的特定對象識別所述視頻幀中的感興趣區域和非感興趣區域;
[0113]量化參數計算單元,被配置成計算所識別的感興趣區域和非感興趣區域中的宏塊的量化參數值;
[0114]宏塊類型選擇單元,被配置成基于所述視頻幀的類型而選擇所述感興趣區域和非感興趣區域中的宏塊的類型;以及
[0115]視頻編碼單元,被配置成基于所計算的所述感興趣區域和非感興趣區域中的宏塊的量化參數值以及所選擇的宏塊類型,對所述視頻幀進行編碼。
[0116]14.根據附記13所述的視頻編碼設備,其中,所述宏塊類型選擇單元進一步被配置成在所述視頻幀是幀內幀的情況下,對于所述視頻幀中的感興趣區域和非感興趣區域均選擇所有宏塊類型;而在所述視頻幀是幀間幀的情況下,對于所述視頻幀中的非感興趣區域,僅選擇幀間宏塊類型,而對于所述視頻幀中的感興趣區域,選擇所有宏塊類型。
[0117]15.根據附記13所述的視頻編碼設備,其中,所述量化參數計算單元進一步被配置成根據所述視頻幀中的感興趣區域的大小來計算所述感興趣區域中的宏塊的量化參數值。
[0118]16.根據附記15所述的視頻編碼設備,其中,所述量化參數計算單元進一步被配置成基于所述感興趣區域中的宏塊的數量與所述視頻幀中的宏塊的數量的比率來計算所述感興趣區域中的宏塊的量化參數值。
[0119]17.根據附記16所述的視頻編碼設備,其中,所述量化參數計算單元進一步被配置成基于以下等式來計算所述感興趣區域中的宏塊的量化參數值:
[0120]QPE0I=Round (F+R*k)
[0121]QP ’ R01=MIN (QPK0I,C)
[0122]其中,QP’ E0I表示所述感興趣區域中的宏塊的量化參數值,k表示所述感興趣區域中的宏塊的數量與所述視頻幀中的宏塊的數量的比率,RoundO表示取整運算,MINO表示取最小值的運算,其中F、R和C分別表示所述感興趣區域中的宏塊的量化參數值的基值、調節值及上限值,均為預定常數。
[0123]18.根據附記17所述的視頻編碼設備,其中,F為22,R為50,并且C為32。
[0124]19.根據附記13所述的視頻編碼設備,還包括:
[0125]去噪單元,被配置成去除所述視頻幀中包括的噪聲,
[0126]其中,所述視頻編碼單元進一步被配置成對去噪后的視頻幀進行編碼。
[0127]20.根據附記19所述的視頻編碼設備,其中,所述去噪單元和所述對象檢測單元被配置成并行地執行處理。
[0128]21.根據附記13所述的視頻編碼設備,還包括:
[0129]采樣單元,被配置成對所述視頻幀進行采樣,
[0130]其中,所述對象檢測單元被配置成通過識別采樣后的視頻幀中的感興趣區域和非感興趣區域來識別所述視頻幀中的感興趣區域和非感興趣區域。
[0131]22.根據附記13-21中任一項所述的視頻編碼設備,其中,所述非感興趣區域中的宏塊的量化參數值為預定的固定常數。
[0132]23.根據附記22所述的視頻編碼設備,其中,所述固定常數為45。
[0133]24.根據附記13-23中任一項所述的視頻編碼設備,其中,所述視頻編碼單元進一步被配置成對所述視頻幀進行熵編碼。
[0134]25.一種存儲介質,所述存儲介質包括機器可讀的程序代碼,當在信息處理設備上執行所述程序代碼時,所述程序代碼使得所述信息處理設備執行根據附記I至12中任一項所述的基于感興趣區域的視頻編碼方法。
[0135]26.一種程序產品,所述程序產品包括機器可執行的指令,當在信息處理設備上執行所述指令時,所述指令使得所述信息處理設備執行根據附記I至12中任一項所述的基于感興趣區域的視頻編碼方法。
【權利要求】
1.一種基于感興趣區域的視頻編碼方法,包括: 對象檢測步驟,用于檢測輸入的視頻幀中的特定對象,以基于所檢測的特定對象來識別所述視頻幀中的感興趣區域和非感興趣區域; 量化參數計算步驟,用于計算所識別的感興趣區域和非感興趣區域中的宏塊的量化參數值; 宏塊類型選擇步驟,用于基于所述視頻幀的類型而選擇所述感興趣區域和非感興趣區域中的宏塊的類型;以及 視頻編碼步驟,用于基于所計算的所述感興趣區域和非感興趣區域中的宏塊的量化參數值以及所選擇的宏塊類型,對所述視頻幀進行編碼。
2.根據權利要求1所述的視頻編碼方法,其中,在所述宏塊類型選擇步驟中,在所述視頻幀是幀內幀的情況下,對于所述視頻幀中的感興趣區域和非感興趣區域均選擇所有宏塊類型;而在所述視頻幀是幀間幀的情況下,對于所述視頻幀中的非感興趣區域,僅選擇幀間宏塊類型,而對于所述視頻幀中的感興趣區域,選擇所有宏塊類型。
3.根據權利要求1所述的視頻編碼方法,其中,在所述量化參數計算步驟中,根據所述視頻幀中的感興趣區域的大小來計算所述感興趣區域中的宏塊的量化參數值。
4.根據權利要求3所述的視頻編碼方法,其中,在所述量化參數計算步驟中,根據所述視頻幀中的感興趣區域的大小來計算所述感興趣區域中的宏塊的量化參數值進一步包括基于所述感興趣區域中的宏塊的數量與所述視頻幀中的宏塊的數量的比率來計算所述感興趣區域中的宏塊的量化參數值。
5.根據權利要求1所述的視頻編碼方法,還包括: 采樣步驟,用于在所述對象檢測步驟之前對所述視頻幀進行采樣, 其中,在所述對象檢測步驟中,通過識別采樣后的視頻幀中的感興趣區域和非感興趣區域來識別所述視頻幀中的感興趣區域和非感興趣區域。
6.一種基于感興趣區域的視頻編碼設備,包括: 對象檢測單元,被配置成檢測輸入的視頻幀中的特定對象,以基于所檢測的特定對象來識別所述視頻幀中的感興趣區域和非感興趣區域; 量化參數計算單元,被配置成計算所識別的感興趣區域和非感興趣區域中的宏塊的量化參數值; 宏塊類型選擇單元,被配置成基于所述視頻幀的類型而選擇所述感興趣區域和非感興趣區域中的宏塊的類型;以及 視頻編碼單元,被配置成基于所計算的所述感興趣區域和非感興趣區域中的宏塊的量化參數值以及所選擇的宏塊類型,對所述視頻幀進行編碼。
7.根據權利要求6所述的視頻編碼設備,其中,所述宏塊類型選擇單元進一步被配置成在所述視頻幀是幀內幀的情況下,對于所述視頻幀中的感興趣區域和非感興趣區域均選擇所有宏塊類型;而在所述視頻幀是幀間幀的情況下,對于所述視頻幀中的非感興趣區域,僅選擇幀間宏塊類型,而對于所述視頻幀中的感興趣區域,選擇所有宏塊類型。
8.根據權利要求6所述的視頻編碼設備,其中,所述量化參數計算單元進一步被配置成根據所述視頻幀中的感興趣區域的大小來計算所述感興趣區域中的宏塊的量化參數值。
9.根據權利要求8所述的視頻編碼設備,其中,所述量化參數計算單元進一步被配置成基于所述感興趣區域中的宏塊的數量與所述視頻幀中的宏塊的數量的比率來計算所述感興趣區域中的宏塊的量化參數值。
10.根據權利要求6所述的視頻編碼設備,還包括: 采樣單元,被配置成對所述視頻幀進行采樣, 其中,所述對象檢測單元進一步被配置成通過識別采樣后的視頻幀中的感興趣區域和非感興趣區域來識別所述視頻幀中的感興趣區域和非感興趣區域。
【文檔編號】H04N19/105GK103974071SQ201310034633
【公開日】2014年8月6日 申請日期:2013年1月29日 優先權日:2013年1月29日
【發明者】王琪, 伍健榮 申請人:富士通株式會社