一種視頻質量評估方法及裝置的制造方法
【專利摘要】本發明公開了一種視頻質量評估方法及裝置,所述方法包括:基于視頻內容對待評估視頻進行分組,每個視頻分組中包括至少兩個待評估視頻;基于視頻分組結果生成指向包含有所述至少兩個待評估視頻的播放界面的地址信息,以基于所述地址信息同步播放所述至少兩個待評估視頻,獲得所述至少兩個待評估視頻中每個待評估視頻的主觀評估結果;分別獲取待評估視頻的至少一個評估參數;所述至少一個評估參數表征視頻的質量;基于所述至少一個評估參數、以及為每個評估參數預配置的權重系數獲得所述待評估視頻的客觀評估結果;基于待評估視頻的主觀評估結果及客觀評估結果得到該待評估視頻的質量評估結果。
【專利說明】
-種視頻質量評估方法及裝置
技術領域
[0001] 本發明設及互聯網通信技術,尤其設及一種視頻質量評估方法及裝置。
【背景技術】
[0002] 隨著互聯網和多媒體技術的蓬勃發展,在線觀看視頻已經成為日常生活中主要的 娛樂方式之一,用戶對于觀看體驗的追求也隨著在線視頻的普及不斷提高,視頻質量是影 響用戶觀看體驗的關鍵因素,因此如何有效地評估視頻的質量具有重要意義。
[0003] 目前,對視頻質量進行評估主要有主觀質量評估和客觀質量評估兩種方式,其中, 主觀質量評估通常需要在受限制的環境條件下進行,實施難度較大,且不便于對大量視頻 進行評估。而客觀質量評估采用全參考模型進行,全參考模型需要有原始視頻做對比,可應 用范圍受到限制,適應性差,視頻分辨率縮放之后不具有可比性。
【發明內容】
[0004] 本發明實施例提供一種視頻質量評估方法及裝置,至少解決了現有技術中存在的 問題,能夠方便的實現對多個視頻的質量評估,適用范圍廣、實用性強。
[0005] 本發明實施例的技術方案是運樣實現的:
[0006] 本發明實施例提供了一種視頻質量評估方法,所述方法包括:
[0007] 基于視頻內容對待評估視頻進行分組,每個視頻分組中包括至少兩個待評估視 頻;每個視頻分組中包括的至少兩個待評估視頻確認為具有相同視頻內容;
[000引基于視頻分組結果生成用于指向包含有所述待評估視頻的播放界面的地址信息, W基于所述地址信息播放所述待評估視頻,獲得所述待評估視頻的主觀評估結果;
[0009] 分別獲取待評估視頻的至少一個評估參數;所述至少一個評估參數表征視頻的質 量;
[0010] 基于所述至少一個評估參數、W及為每個評估參數預配置的權重系數獲得所述待 評估視頻的客觀評估結果;
[0011] 基于所述待評估視頻的主觀評估結果及客觀評估結果得到所述待評估視頻的質 量評估結果。
[0012] 上述方案中,所述基于視頻內容對待評估視頻進行分組,包括:
[0013] 分別提取每個待評估視頻的尺度不變特征變換SIFT特征向量,獲得任意兩個SIFT 特征向量之間的歐式距離;
[0014] 確定歐式距離小于預設闊值的SIFT特征向量對應的待評估視頻為具有相同視頻 內容的同組視頻。
[0015] 上述方案中,所述基于視頻分組結果生成用于指向包含有所述待評估視頻的播放 界面的地址信息,包括:
[0016] 將每一個視頻分組中的所述至少兩個待評估視頻進行兩兩分組獲得至少一個視 頻子組;每個視頻子組中包括兩個待評估視頻;
[0017] 針對每個視頻子組生成用于指向包含有所述兩個待評估視頻的播放界面的地址 信息,W基于所述地址信息同步播放所述兩個待評估視頻,獲得所述兩個待評估視頻的主 觀評估結果。
[0018] 上述方案中,所述基于所述至少一個評估參數、W及為每個評估參數預配置的權 重系數獲得所述待評估視頻的客觀評估結果,包括:
[0019] 對待評估視頻的至少一個評估參數及所述至少一個評估參數預配置的權重系數 進行加權求和,獲得所述待評估視頻的客觀評估結果。
[0020] 上述方案中,所述方法還包括:
[0021 ]獲取預配置的主客觀評估結果的相關系數值;
[0022] 基于所述相關系數值、待評估視頻的主觀質量評估結果及其至少一個評估參數對 所述至少一個評估參數對應的權重系數進行系數調整,得到調整后的評估參數對應的權重 系數,W基于調整后的權重系數對待評估視頻進行客觀質量評估。
[0023] 本發明實施例還提供了一種視頻質量評估裝置,所述裝置包括:視頻分組模塊、地 址生成模塊、獲取模塊及處理模塊;其中,
[0024] 所述視頻分組模塊,用于基于視頻內容對待評估視頻進行分組,每個視頻分組中 包括至少兩個待評估視頻;每個視頻分組中包括的至少兩個待評估視頻確認為具有相同視 頻內容;
[0025] 所述地址生成模塊,用于基于視頻分組結果生成用于指向包含有所述待評估視頻 的播放界面的地址信息,W基于所述地址信息播放所述待評估視頻,獲得所述待評估視頻 的主觀評估結果;
[0026] 所述獲取模塊,用于分別獲取待評估視頻的至少一個評估參數;所述至少一個評 估參數表征視頻的質量;
[0027] 所述處理模塊,用于基于所述至少一個評估參數、W及為每個評估參數預配置的 權重系數獲得所述待評估視頻的客觀評估結果;
[0028] W及,基于所述待評估視頻的主觀評估結果及客觀評估結果得到所述待評估視頻 的質量評估結果。
[0029] 上述方案中,所述視頻分組模塊,還用于分別提取每個待評估視頻的尺度不變特 征變換SIFT特征向量,獲得任意兩個SIFT特征向量之間的歐式距離;
[0030] 確定歐式距離小于預設闊值的SIFT特征向量對應的待評估視頻為具有相同視頻 內容的同組視頻。
[0031] 上述方案中,所述地址生成模塊,還用于將每一個視頻分組中的所述至少兩個待 評估視頻進行兩兩分組獲得至少一個視頻子組;每個視頻子組中包括兩個待評估視頻;
[0032] 針對每個視頻子組生成用于指向包含有所述兩個待評估視頻的播放界面的地址 信息,W基于所述地址信息同步播放所述兩個待評估視頻,獲得所述兩個待評估視頻的主 觀評估結果。
[0033] 上述方案中,所述處理模塊,還用于對待評估視頻的至少一個評估參數及所述至 少一個評估參數預配置的權重系數進行加權求和,獲得所述待評估視頻的客觀評估結果。
[0034] 上述方案中,所述處理模塊,還用于獲取預配置的主客觀評估結果的相關系數值;
[0035] 基于所述相關系數值、待評估視頻的主觀質量評估結果及其至少一個評估參數對 所述至少一個評估參數對應的權重系數進行系數調整,得到調整后的評估參數對應的權重 系數,W基于調整后的權重系數對待評估視頻進行客觀質量評估。
[0036] 應用本發明所述實施例,基于視頻內容對待評估視頻進行分組,每個視頻分組中 包括至少兩個待評估視頻;每個視頻分組中包括的至少兩個待評估視頻為具有相同視頻內 容;基于視頻分組結果生成指向包含有所述至少兩個待評估視頻的播放界面的地址信息, W基于所述地址信息同步播放所述至少兩個待評估視頻,獲得所述至少兩個待評估視頻中 每個待評估視頻的主觀評估結果;分別獲取待評估視頻的至少一個評估參數;所述至少一 個評估參數表征視頻的質量;基于所述至少一個評估參數、W及為每個評估參數預配置的 權重系數獲得所述待評估視頻的客觀評估結果;基于所述待評估視頻的主觀評估結果及客 觀評估結果得到所述待評估視頻的質量評估結果。如此,自動按視頻內容進行視頻分組,提 高了處理效率,便于對大批量視頻進行質量評估;自動生成指向可W同步播放至少兩個相 同內容的視頻的地址,便于用戶直接訪問觀看并進行主觀評估,降低了實施難度,且實施過 程中對用戶觀看的環境無限制,更符合真實的用戶觀看條件;對待評估視頻的客觀評估基 于表征視頻質量的評估參數而不是全參考模型,適用范圍更廣,實用性更強;對待評估視頻 的最終質量評估綜合了主觀評估結果和客觀評估結果,彌補了主觀評估波動大、客觀評估 與真實視頻質量符合度不足的缺點。
【附圖說明】
[0037] 圖1為基于全參考模型進行視頻客觀質量評估的示意圖;
[0038] 圖2為本發明實施例中進行信息交互的各方硬件實體的示意圖;
[0039] 圖3為本發明實施例中視頻質量評估方法的流程示意圖一;
[0040] 圖4為本發明實施例中視頻質量評估方法的流程示意圖二;
[0041] 圖5為本發明實施例中視頻質量評估方法的流程示意圖Ξ;
[0042] 圖6為本發明實施例中視頻質量評估方法的系統框架示意圖;
[0043] 圖7為本發明實施例中視頻質量評估裝置的組成結構示意圖;
[0044] 圖8為本發明實施例中視頻質量評估裝置的一個可選的硬件結構示意圖。
【具體實施方式】
[0045] 發明人在研究過程中發現,現有技術中對視頻質量進行評估主要是通過主觀質量 評估和客觀質量評估兩種方式;其中,主觀質量評估是根據ITU標準建議,在一定光照、視距 等條件下,由一組觀測人員對視頻進行觀看并打分,然后求平均得到M0S(Mean化inion Score)值;M0S分為五個等級,如表1所示:
[0046]
[0047] 表 1
[0048] 很顯然現有技術中的主觀質量評估至少存在W下缺點:1)在受限制的環境條件下 進行,需要專口設置評估場地,實施難度較大,與用戶真實觀看環境不符;2)評估發起人需 要人為地將視頻分組排列,效率較低,不便于對大量視頻進行評估。
[0049] 現有技術中客觀質量評估主要是采用全參考模型,計算編碼后視頻相對于原始視 頻的失真,該模型如圖1所示。失真通常采用峰值噪聲比(PSNR,Peak Signal to Noise Ratio)和結構相似性(SSIM,Structural Similarity)來衡量。
[0050] 然而,全參考模型需要有原始視頻做對比,可應用范圍受到限制,適應性差,視頻 分辨率縮放之后不具有可比性;PSNR和SSIM與主觀感受之間存在差異,不能很好地反映真 實的質量。
[0051] 此外,目前主觀質量評估和客觀質量評估方法得出的結果之間不一致,不存在可 W替代主觀評價的客觀評估,也不存在一種客觀評價方法在各個方面都優于其他方法,主 客觀質量評價結果之間的相關性不高。
[0052] 在本發明實施例中,基于視頻內容對待評估視頻進行分組,每個視頻分組中包括 至少兩個待評估視頻;每個視頻分組中包括的至少兩個待評估視頻確認為具有相同視頻內 容;基于視頻分組結果生成用于指向包含有所述至少兩個待評估視頻的播放界面的地址信 息,W基于所述地址信息同步播放所述至少兩個待評估視頻,獲得所述至少兩個待評估視 頻中每個待評估視頻的主觀評估結果;分別獲取待評估視頻的至少一個評估參數;所述至 少一個評估參數表征視頻的質量;基于所述至少一個評估參數、W及為每個評估參數預配 置的權重系數獲得所述待評估視頻的客觀評估結果;基于所述待評估視頻的主觀評估結果 及客觀評估結果得到所述待評估視頻的質量評估結果。
[0053] 圖2為本發明實施例中進行信息交互的各方硬件實體的示意圖,圖2中包括:服務 器11……In、終端設備21-24,終端設備21-24通過有線網絡或者無線網絡與服務器進行信 息交互,終端設備包括手機、臺式機、PC機、一體機等類型。一個示例中,用戶基于終端設備 21-24之一將捜集的待評估的視頻上傳至服務器,服務器基于視頻內容對至少兩個待評估 視頻進行分組,每組視頻至少包括兩個待評估視頻,然后基于視頻分組結果生成指向可W 同步播放至少兩個視頻的統一資源定位符化化),將該TOL發送給觀測人員所在的終端設 備,W使觀測人員基于該抓L觀看打分,然后再上傳至服務器,W使服務器基于觀測人員的 主觀質量評估結果及自身的客觀質量評估結果進行綜合質量評估。
[0054] 下面結合附圖及具體實施例對本發明作進一步詳細的說明。
[0055] 本發明實施例提供了一種視頻質量評估方法,圖3所示為本發明實施例中視頻質 量評估方法的流程示意圖,本發明實施例中視頻質量評估方法包括:
[0056] 步驟101:基于視頻內容對待評估視頻進行分組,每個視頻分組中包括至少兩個待 評估視頻;每個視頻分組中包括的至少兩個待評估視頻確認為具有相同視頻內容。
[0057] 在實際應用中,對于同一內容的視頻,不同的在線視頻網站會采用不同的分辨率、 碼率、編碼參數、預處理、后處理等,需要對視頻質量進行對比評估,從而了解競品之間的優 劣,而同一視頻網站對視頻的編碼參數和處理流程進行優化后,亦需要量化指標來衡量優 化前后的差異,指導優化過程;因此,針對運兩種應用場景,可應用本實施例中的視頻質量 評估方案。
[0058] 在實際實施時,視頻質量評估發起人基于某一終端設備將自身捜集的待評估視頻 (如兩個不同在線視頻網站播放的某一集電視劇)上傳至服務器側,服務器接收待評估視頻 后對視頻進行自動分組,將相同視頻內容的視頻分至同組。
[0059] 具體地,服務器在進行視頻分組時,分別提取每個待評估視頻的尺度不變特征變 換(SIFT,Scale-invariant fea1:ure transform)特征向量,獲得任意兩個SIFT特征向量之 間的歐式距離;確定歐式距離小于預設闊值的SIFT特征向量對應的待評估視頻為具有相同 視頻內容的同組視頻;
[0060] 運里,服務器提取的是待評估視頻每帖的SIFT特征向量,由于SIFT特征向量對旋 轉、尺度縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也能保持一定程度的穩定 性,因此,可將其作為視頻內容的獨特指紋來辨識;
[0061 ]在具體計算SIFT特征向量兩兩之間的歐式距離的時候,可通過公式p(x,y) = ( Σ (又廣7〇~2)~(1/2)得到;其中,口^,7)表示5巧1'特征向量義和5巧1'特征向量7之間的歐式距 離,i表示特征向量的第i維;
[0062] 在實際應用中,所述預設闊值可W依據實際需要進行設定。
[0063] 步驟102:基于視頻分組結果生成用于指向包含有所述待評估視頻的播放界面的 地址信息,W基于所述地址信息播放所述待評估視頻,獲得所述待評估視頻的主觀評估結 果。
[0064] 在實際實施時,當將具有相同內容的視頻分至同一組后,可生成一個地址信息,該 地址指向包含有相同內容的兩個或兩個(優選地為兩個)W上的待評估視頻,W使用戶基于 該地址同步播放所述相同內容的兩個或兩個W上的待評估視頻,然后對觀看的待評估視頻 進行主觀評估,并通過終端設備將主觀評估結果上傳至服務器;
[0065] 運里,在實際應用中,服務器生成的地址具體可W為一個超級鏈接(統一資源定位 符m?L),并可在對應的網頁中嵌入對應待評估視頻數量的flash播放器,W對相同內容的待 評估視頻進行同步播放,不同的用戶在非限制的環境下(不同的光照條件、屏幕尺寸等)觀 看視頻,然后依據主觀感受,按照M0S五個等級進行打分并上傳。
[0066] 由于在實際實施時,每個視頻分組中可能含有多個相同內容的待評估視頻,如5 個,而在用戶進行視頻觀看進行主觀評估時,若將5個待評估視頻同步播放,用戶會無法同 時兼顧觀看5個視頻,對用戶造成困擾,因此,服務器可進一步將每一個視頻分組中的至少 兩個待評估視頻進行兩兩分組獲得至少一個視頻子組;每個視頻子組中包括兩個待評估視 頻;然后針對每個視頻子組生成用于指向包含有所述兩個待評估視頻的播放界面的地址信 息,W使用戶基于該地址同步播放所述兩個待評估視頻;如此,在進行主觀視頻質量評估 時,用戶同時觀看兩個待評估視頻,相互對比,可得到用戶更真實的感受,使得評估結果更 準確。
[0067] 步驟103:分別獲取待評估視頻的至少一個評估參數;所述至少一個評估參數表征 視頻的質量。
[0068] 基于本發明上述實施例,在實際應用中,待評估視頻的評估參數可W包括W下參 數至少之一:塊效應、模糊度、噪聲水平、飽和度。
[0069] 運里,可通過隨機抽取待評估視頻的一定數量(具體可依據實際需要進行設定)的 帖,僅對抽取的帖進行處理得到需要的評估參數,如此可降低復雜度;
[0070] 其中,塊效應是指在視頻采用分塊編碼時,由于粗糖量化等原因導致塊與塊邊緣 之間產生的不連續,體現在畫面上為銀齒、馬賽克;可通過計算所有塊之間相鄰像素的差值 平方和得到;
[0071] 模糊度是由粗糖量化、重疊塊運動補償等引起的,體現在畫面上為邊緣不夠銳利, 圖像結構信息減弱;可通過對圖像進行sobel濾波提取邊緣,按行掃描,計算邊緣的寬度,求 和并平均得到;
[0072] 噪聲水平是指像素上出現的隨機變動,使畫面看起來不干凈;該參數指標的計算 方式為,對圖像進行雙邊濾波得到殘差圖像,將殘差圖像劃分成8x8的塊,每個分塊進一步 按3x3的滑動窗口劃分成9個相互交疊的子塊,求子塊內像素的方差然后選取最小的4個值 進行平均,最后把圖像劃分成紋理區域和非紋理區域,給屬于不同區域中的塊分配不同的 權重并求和;
[0073] 飽和度是指色彩的鮮艷程度,也稱為色彩的純度,在一定的范圍內,飽和度越高, 畫面效果越好;該參數指標通過計算所有像素的彩度與明度比值的平均值得到。
[0074] 步驟104:基于所述至少一個評估參數、W及為每個評估參數預配置的權重系數獲 得所述待評估視頻的客觀評估結果。
[0075] 在實際應用中,可預先為每個評估參數配置相應的權重系數,然后采用線性模型, 對待評估視頻的至少一個評估參數及所述至少一個評估參數預配置的權重系數進行加權 求和,獲得所述待評估視頻的客觀評估結果。而若后續對所述權重系數進行調整,所述預配 置的權重系數則為在進行下一次客觀質量評估前,預先配置的經調整后的權重系數。
[0076] 需要說明的是,服務器進行視頻分組、生成指向播放界面的地址,W獲得主觀評估 結果的操作(步驟101~102),與獲取待評估視頻的評估參數,W計算得到客觀評估結果的 操作(步驟103~104)的順序可互換,當然亦可同時執行。
[0077] 步驟105:基于所述待評估視頻的主觀評估結果及客觀評估結果得到所述待評估 視頻的質量評估結果。
[0078] 運里,當服務器接收到用戶上傳的對于待評估視頻的主觀評估結果后,求得自身 計算得到的客觀評估結果與所述主觀評估結果的平均值,即為該待評估視頻的最終質量評 估結果。
[0079] 在實際應用中,為了提高主客觀評估結果之間的相關性,尋找出最優的評估參數 對應的權重系數,可應用用戶上傳的主觀評估結果對所述線性模型中的權重系數進行校 正,具體可W包括:
[0080] 獲取預配置的主客觀評估結果的相關系數值;運里的相關系數的具體數值可依據 實際需要進行設定,如為0.95;
[0081] 基于所述相關系數值、待評估視頻的主觀質量評估結果及其至少一個評估參數對 所述至少一個評估參數對應的權重系數進行系數調整,得到調整后的評估參數對應的權重 系數,W基于調整后的權重系數對待評估視頻進行客觀質量評估;
[0082] 運里,進行系數調整時具體可采用網格捜索法確定合適的權重系數。
[0083] 應用本發明上述實施例,通過自動按視頻內容進行視頻分組,提高了處理效率,便 于對大批量視頻進行質量評估;自動生成指向可W同步播放至少兩個相同內容的視頻的地 址,便于用戶直接訪問觀看并進行主觀評估,降低了實施難度,且實施過程中對用戶觀看的 環境無限制,更符合真實的用戶觀看條件;對待評估視頻的客觀評估基于表征視頻質量的 評估參數而不是全參考模型,適用范圍更廣,實用性更強;對待評估視頻的最終質量評估綜 合了主觀評估結果和客觀評估結果,彌補了主觀評估波動大、客觀評估與真實視頻質量符 合度不足的缺點;通過建立主客觀評估結果之間的關聯,實現對客觀評估的線性模型中權 重系數的校正調整,提高了主客觀評估結果之間的相關性。
[0084] 本發明實施例提供了一種視頻質量評估方法,應用于評估不同的在線視頻網站的 視頻質量的優劣;圖4所示為本發明實施例中視頻質量評估方法的流程示意圖,本發明實施 例中視頻質量評估方法包括:
[0085] 步驟201:服務器接收終端設備上傳的N個待評估視頻。
[0086] 運里,N為正整數,且N不小于2,由于本實施例的目的在于評估不同的在線視頻網 站的視頻質量的優劣,因此,所述N個待評估視頻為用戶捜集的來自不同在線視頻網站的具 有相同視頻內容的待評估視頻,如:來自Α、ΒΧΞ個不同視頻網站的動畫片Q的第一集,分別 為Q1、Q2、Q3,W及來自D、Ε兩個不同視頻網站的電影W,分別為W1、W2。
[0087] 步驟202:分別提取每個待評估視頻的SIFT特征向量,并獲得任意兩個SIFT特征向 量之間的歐式距離。
[0088] 在具體實施時,服務器分別提取每個待評估視頻每帖的SIFT特征向量,由于SIFT 特征向量對旋轉、尺度縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也能保持一 定程度的穩定性,因此,可將其作為視頻內容的獨特指紋來辨識;
[0089]在具體計算SIFT特征向量兩兩之間的歐式距離的時候,可通過公式p(x,y) = ( Σ (又廣7〇~2)~(1/2)得到;其中,口^,7)表示5巧1'特征向量義和5巧1'特征向量7之間的歐式距 離,i表示特征向量的第i維;
[0090] 在實際應用中,所述預設闊值可W依據實際需要進行設定。
[0091] 步驟203:基于得到的歐式距離及預設距離闊值進行視頻分組,使得每個視頻分組 中的待評估視頻具有相同的視頻內容。
[0092] 在實際實施時,確定歐式距離小于預設闊值的SIFT特征向量對應的待評估視頻為 具有相同視頻內容的同組視頻;
[0093] 在本發明實施例中,由于是對不同視頻網站的競品進行質量評估,因此,每個視頻 分組中包括至少兩個待評估視頻;進行上述視頻分組后可知,待評估視頻Q1、Q2、Q3具有相 同內容被分至同一組,待評估視頻W1、W2具有相同內容被分至同一組。如此,自動按視頻內 容進行視頻分組,提高了處理效率,便于對大批量視頻進行質量評估。
[0094] 步驟204:將每一個視頻分組中的至少兩個待評估視頻進行兩兩分組獲得至少一 個視頻子組;每個視頻子組中包括兩個待評估視頻。
[00M]運里,由于在實際實施時,每個視頻分組中可能含有多個相同內容的待評估視頻, 如本實施例中位于同一視頻組中的待評估視頻91、92、93,而在用戶進行視頻觀看進行主觀 評估時,若將該3個待評估視頻同步播放,用戶會無法同時兼顧觀看3個視頻,對用戶造成困 擾,因此,服務器可進一步將每一個視頻分組中的至少兩個待評估視頻進行兩兩分組,即: 待評估視頻Q1、Q2為一個視頻子組,待評估視頻Q2、Q3為一個視頻子組,待評估視頻Q1、Q3為 一個視頻子組。
[0096]步驟205:針對每個視頻子組生成用于指向包含有所述兩個待評估視頻的播放界 面的地址信息,w基于所述地址信息同步播放所述兩個待評估視頻,獲得所述兩個待評估 視頻的主觀評估結果。
[0097] 在本實施例中,服務器生成的地址為一個超級鏈接,并在對應的網頁中嵌入兩個 flash播放器,W對同一個視頻子組中的兩個待評估視頻進行同步播放;在實際實施時,月良 務器將生成的地址可發送給多個終端設備,W使處于多個不同環境的用戶進行主觀質量評 估;或者,將生成的地址發送給一個終端設備,W使處于該終端設備前的多個用戶進行主觀 質量評估;
[0098] 用戶基于所述地址進行主觀質量評估的方式可W如現有技術中的按照M0S五個等 級進行打分,然后將主觀評估結果上傳至服務器。
[0099] 步驟206:分別獲取待評估視頻的至少一個評估參數;所述至少一個評估參數表征 視頻的質量。
[0100] 在本發明實施例中,待評估視頻的評估參數包括:塊效應、模糊度、噪聲水平、飽和 度;當然,在實際應用中,評估參數并不限于W上四種;
[0101] 運里,通過隨機抽取待評估視頻的一定數量(具體可依據實際需要進行設定)的 帖,僅對抽取的帖進行處理得到需要的評估參數,如此可降低復雜度;
[0102] 其中,塊效應是指在視頻采用分塊編碼時,由于粗糖量化等原因導致塊與塊邊緣 之間產生的不連續,體現在畫面上為銀齒、馬賽克;可通過計算所有塊之間相鄰像素的差值 平方和得到;
[0103] 模糊度是由粗糖量化、重疊塊運動補償等引起的,體現在畫面上為邊緣不夠銳利, 圖像結構信息減弱;可通過對圖像進行sobel濾波提取邊緣,按行掃描,計算邊緣的寬度,求 和并平均得到;
[0104] 噪聲水平是指像素上出現的隨機變動,使畫面看起來不干凈;該參數指標的計算 方式為,對圖像進行雙邊濾波得到殘差圖像,將殘差圖像劃分成8x8的塊,每個分塊進一步 按3x3的滑動窗口劃分成9個相互交疊的子塊,求子塊內像素的方差然后選取最小的4個值 進行平均,最后把圖像劃分成紋理區域和非紋理區域,給屬于不同區域中的塊分配不同的 權重并求和;
[0105] 飽和度是指色彩的鮮艷程度,也稱為色彩的純度,在一定的范圍內,飽和度越高, 畫面效果越好;該參數指標通過計算所有像素的彩度與明度比值的平均值得到。
[0106] 步驟207:基于所述至少一個評估參數、W及為每個評估參數預配置的權重系數獲 得所述待評估視頻的客觀評估結果。
[0107] 在本實施例中,服務器采用線性模型,對待評估視頻的至少一個評估參數及所述 至少一個評估參數預配置的權重系數進行加權求和,獲得所述待評估視頻的客觀評估結 果。當然,在具體實施時,對客觀評估結果的計算并不限于采用線性模型進行加權求和得 到。
[0108] 步驟208:基于所述待評估視頻的主觀評估結果及客觀評估結果得到所述待評估 視頻的質量評估結果。
[0109] 運里,當服務器接收到用戶上傳的對于待評估視頻的主觀評估結果后,求得自身 計算得到的客觀評估結果與所述主觀評估結果的平均值,即為該待評估視頻的最終質量評 估結果。
[0110] 在實際應用中,為了提高主客觀評估結果之間的相關性,尋找出最優的評估參數 對應的權重系數,可應用用戶上傳的主觀評估結果對所述線性模型中的權重系數進行校 正,具體可W包括:
[0111] 獲取預配置的主客觀評估結果的相關系數值;運里的相關系數的具體數值可依據 實際需要進行設定,如為0.9;
[0112] 基于所述相關系數值、待評估視頻的主觀質量評估結果及其至少一個評估參數對 所述至少一個評估參數對應的權重系數進行系數調整,得到調整后的評估參數對應的權重 系數,W基于調整后的權重系數對待評估視頻進行客觀質量評估;
[0113] 運里,進行系數調整時具體可采用網格捜索法確定合適的權重系數。
[0114] 本發明實施例提供了一種視頻質量評估方法,圖5為本發明實施例中視頻質量評 估方法的流程示意圖,圖6為本發明實施例中視頻質量評估方法的系統框架圖,如圖5、圖6 所示,本發明實施例中視頻質量評估方法包括:
[0115] 評估發起人捜集不同競品的視頻,或者編碼優化前后的對比視頻,通過web界面上 傳到服務器系統;服務器系統從視頻提取反映內容的特征向量,并根據特征向量自動地進 行匹配和分組,生成評估任務鏈接,下發評估任務給觀測人員;觀測人員從瀏覽器打開鏈 接,同時同步地觀看兩個視頻,并根據主觀感受進行打分提交;服務器系統捜集打分并計算 出每個視頻的平均主觀得分,同時計算視頻的客觀質量分數,求兩者平均,給出視頻的質量 評估結果。
[0116] 其中,主觀質量評估的具體實現步驟如下:
[0117] 1)提取視頻每帖的SIFT特征向量,作為視頻內容的獨特指紋,該特征對旋轉、尺度 縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也能保持一定程度的穩定性。
[0118] 2)計算特征向量兩兩之間的歐式距離,公式為:
[0119] p(x,y) = (E(x 廣 7ιΓ2Γ(1/2);
[0120] 其中,p(x,y)表示SIFT特征向量X和SIFT特征向量y之間的歐式距離,i表示特征向 量的第i維。
[0121] 3)確定歐式距離小于所設定闊值的視頻即具有相同的內容,劃分為同一組。
[0122] 4)同一組視頻中的視頻兩兩成對生成鏈接,在網頁中嵌入兩個flash播放器,同步 播放兩個視頻。
[0123] 5)觀測人員在非限制的環境下(不同的光照條件、屏幕尺寸等)觀看視頻,并根據 主觀感受,按照M0S五個等級進行打分并提交。
[0124] 客觀質量評估的具體實現步驟如下:
[0125] 1)從視頻中隨機抽取一定數量的帖,僅對抽取的帖進行處理,降低復雜度。
[0126] 2)計算每帖圖像的客觀質量指標,包括塊效應、模糊度、噪聲水平、飽和度。
[0127] 具體地,塊效應是指在視頻采用分塊編碼時,由于粗糖量化等原因導致塊與塊邊 緣之間產生的不連續,體現在畫面上為銀齒、馬賽克,該指標通過計算所有塊之間相鄰像素 的差值平方和得到。
[0128] 模糊度是由粗糖量化、重疊塊運動補償等引起的,體現在畫面上為邊緣不夠銳利, 圖像結構信息減弱。該指標計算方式為,對圖像進行sobel濾波提取邊緣,按行掃描,計算邊 緣的寬度,求和并平均。
[0129] 噪聲水平是指像素上出現的隨機變動,使畫面看起來不干凈,該指標的計算方式 為,對圖像進行雙邊濾波得到殘差圖像,將殘差圖像劃分成8x8的塊,每個分塊進一步按3x3 的滑動窗口劃分成9個相互交疊的子塊,求子塊內像素的方差然后選取最小的4個值進行平 均,最后把圖像劃分成紋理區域和非紋理區域,給屬于不同區域中的塊分配不同的權重并 求和。
[0130] 飽和度是指色彩的鮮艷程度,也稱為色彩的純度,在一定的范圍內,飽和度越高, 畫面效果越好,該指標通過計算所有像素的彩度與明度比值的平均值得到。
[0131] 3)依據為每個客觀質量指標分配的權重系數,采用線性模型進行加權求和得到客 觀質量分數。
[0132] 為了提高主客觀評估結果之間的相關性,本實施例中,還可預設主客觀評估結果 的相關系數,建立主客觀評估結果之間的關聯,然后通過機器學習的對客觀質量擬合模型 的參數進行校正調整,尋找出最優的模型參數,最大化主客觀分數之間的相關性。
[0133] 應用本發明上述實施例,自動按內容匹配及分組,提高了效率,便于對大批量視頻 進行評估;通過網頁下發,瀏覽器直接訪問,降低了實施的難度;非限制的觀測環境,符合真 實的用戶觀看條件;客觀質量評估基于無參考模型,適用范圍更廣,實用性更強;綜合了主 觀質量得分和客觀質量得分,彌補主觀得分波動性大、客觀得分與真實質量符合度不足的 缺點;建立起主客觀得分之間的關聯,能自動學習得到最優的擬合參數,提高主客觀分數之 間的相關性。
[0134] 本發明實施例提供了一種視頻質量評估裝置,如圖7所示,本發明實施例中視頻質 量評估裝置的組成包括:視頻分組模塊71、地址生成模塊72、獲取模塊73及處理模塊74;需 要指出的是,圖7示出的僅僅是視頻質量評估裝置的一種示例性的邏輯功能結構,并不構成 對視頻質量評估裝置結構的限定,本領域技術人員基于圖7示出的功能模塊進行合并或拆 分,從而實現其他的功能結構。
[0135] 視頻質量評估裝置中的功能模塊可W由服務器(如服務器或服務器集群)的硬件 資源,如處理器等計算資源、通信資源(如用于支持實現光纜、蜂窩等各種方式通信)協同實 現。圖8示例性示出了視頻質量評估裝置80的一個可選的硬件結構示意圖,包括處理器81、 輸入/輸出接口 83(例如顯示器、鍵盤、觸摸屏、揚聲器麥克風中的一個或多個),存儲介質84 W及網絡接口 82,組件可W經系統總線85連接通信,其中,存儲介質84中存儲有可執行指 令,用于執行本發明實施例提供的視頻質量評估方法。圖8中示出的部件可W位于同一物理 位置或者分散設置在不同的物理位置。
[0136] W下對圖7示出的視頻質量評估裝置各功能模塊的功能進行說明。
[0137] 所述視頻分組模塊71,用于基于視頻內容對待評估視頻進行分組,每個視頻分組 中包括至少兩個待評估視頻;每個視頻分組中包括的至少兩個待評估視頻確認為具有相同 視頻內容;
[0138] 所述地址生成模塊72,用于基于視頻分組結果生成用于指向包含有所述待評估視 頻的播放界面的地址信息,W基于所述地址信息播放所述待評估視頻,獲得所述待評估視 頻的主觀評估結果;
[0139] 所述獲取模塊73,用于分別獲取待評估視頻的至少一個評估參數;所述至少一個 評估參數表征視頻的質量;
[0140] 所述處理模塊74,用于基于所述至少一個評估參數、W及為每個評估參數預配置 的權重系數獲得所述待評估視頻的客觀評估結果;
[0141] W及,基于所述待評估視頻的主觀評估結果及客觀評估結果得到所述待評估視頻 的質量評估結果。
[0142] 在一實施例中,所述視頻分組模塊71,還用于分別提取每個待評估視頻的尺度不 變特征變換SIFT特征向量,獲得任意兩個SIFT特征向量之間的歐式距離;
[0143] 確定歐式距離小于預設闊值的SIFT特征向量對應的待評估視頻為具有相同視頻 內容的同組視頻。
[0144] 在一實施例中,所述地址生成模塊72,還用于將每一個視頻分組中的所述至少兩 個待評估視頻進行兩兩分組獲得至少一個視頻子組;每個視頻子組中包括兩個待評估視 頻;
[0145] 針對每個視頻子組生成用于指向包含有所述兩個待評估視頻的播放界面的地址 信息,W基于所述地址信息同步播放所述兩個待評估視頻,獲得所述兩個待評估視頻的主 觀評估結果。
[0146] 在一實施例中,所述處理模塊74,還用于對待評估視頻的至少一個評估參數及所 述至少一個評估參數預配置的權重系數進行加權求和,獲得所述待評估視頻的客觀評估結 果。
[0147] 在一實施例中,所述處理模塊74,還用于獲取預配置的主客觀評估結果的相關系 數值;
[0148] 基于所述相關系數值、待評估視頻的主觀質量評估結果及其至少一個評估參數對 所述至少一個評估參數對應的權重系數進行系數調整,得到調整后的評估參數對應的權重 系數,W基于調整后的權重系數對待評估視頻進行客觀質量評估。
[0149] 在本發明實施例中,所述視頻質量評估裝置中的視頻分組模塊71、地址生成模塊 72、獲取模塊73及處理模塊74,均可由服務器中的中央處理器(CPU,Cen化al Processing Unit)或數字信號處理器(DSP,Digital Si即al Processor)、或現場可編程口陣列(FPGA, Field Programmable Gate Array)、或集成電路(ASIC,App 1 i cat i on Specific Integrated Circuit)實現。
[0150] 運里需要指出的是:W上設及視頻質量評估裝置的描述,與上述方法描述是類似 的,同方法的有益效果描述,不做寶述。對于本發明所述視頻質量評估裝置實施例中未披露 的技術細節,請參照本發明方法實施例的描述。
[0151] 本領域的技術人員可W理解:實現上述方法實施例的全部或部分步驟可W通過程 序指令相關的硬件來完成,前述的程序可W存儲于一計算機可讀取存儲介質中,該程序在 執行時,執行包括上述方法實施例的步驟;而前述的存儲介質包括:移動存儲設備、隨機存 取存儲器(RAM,Random Access Memoir)、只讀存儲器(ROM,Read-Only Memoir)、磁碟或者 光盤等各種可W存儲程序代碼的介質。
[0152] 或者,本發明上述集成的單元如果W軟件功能模塊的形式實現并作為獨立的產品 銷售或使用時,也可W存儲在一個計算機可讀取存儲介質中。基于運樣的理解,本發明實施 例的技術方案本質上或者說對相關技術做出貢獻的部分可軟件產品的形式體現出來, 該計算機軟件產品存儲在一個存儲介質中,包括若干指令用W使得一臺計算機設備(可W 是個人計算機、終端、或者網絡設備等)執行本發明各個實施例所述方法的全部或部分。而 前述的存儲介質包括:移動存儲設備、RAM、ROM、磁碟或者光盤等各種可W存儲程序代碼的 介質。
[0153] W上所述,僅為本發明的【具體實施方式】,但本發明的保護范圍并不局限于此,任何 熟悉本技術領域的技術人員在本發明掲露的技術范圍內,可輕易想到變化或替換,都應涵 蓋在本發明的保護范圍之內。因此,本發明的保護范圍應W所述權利要求的保護范圍為準。
【主權項】
1. 一種視頻質量評估方法,其特征在于,所述方法包括: 基于視頻內容對待評估視頻進行分組,每個視頻分組中包括至少兩個待評估視頻;每 個視頻分組中包括的至少兩個待評估視頻確認為具有相同視頻內容; 基于視頻分組結果生成用于指向包含有所述待評估視頻的播放界面的地址信息,以基 于所述地址信息播放所述待評估視頻,獲得所述待評估視頻的主觀評估結果; 分別獲取待評估視頻的至少一個評估參數;所述至少一個評估參數表征視頻的質量; 基于所述至少一個評估參數、以及為每個評估參數預配置的權重系數獲得所述待評估 視頻的客觀評估結果; 基于所述待評估視頻的主觀評估結果及客觀評估結果得到所述待評估視頻的質量評 估結果。2. 根據權利要求1所述的方法,其特征在于,所述基于視頻內容對待評估視頻進行分 組,包括: 分別提取每個待評估視頻的尺度不變特征變換SIFT特征向量,獲得任意兩個SIFT特征 向量之間的歐式距離; 確定歐式距離小于預設閾值的SIFT特征向量對應的待評估視頻為具有相同視頻內容 的同組視頻。3. 根據權利要求1或2所述的方法,其特征在于,所述基于視頻分組結果生成用于指向 包含有所述待評估視頻的播放界面的地址信息,包括: 將每一個視頻分組中的所述至少兩個待評估視頻進行兩兩分組獲得至少一個視頻子 組;每個視頻子組中包括兩個待評估視頻; 針對每個視頻子組生成用于指向包含有所述兩個待評估視頻的播放界面的地址信息, 以基于所述地址信息同步播放所述兩個待評估視頻,獲得所述兩個待評估視頻的主觀評估 結果。4. 根據權利要求1或2所述的方法,其特征在于,所述基于所述至少一個評估參數、以及 為每個評估參數預配置的權重系數獲得所述待評估視頻的客觀評估結果,包括: 對待評估視頻的至少一個評估參數及所述至少一個評估參數預配置的權重系數進行 加權求和,獲得所述待評估視頻的客觀評估結果。5. 根據權利要求1或2所述的方法,其特征在于,所述方法還包括: 獲取預配置的主客觀評估結果的相關系數值; 基于所述相關系數值、待評估視頻的主觀質量評估結果及其至少一個評估參數對所述 至少一個評估參數對應的權重系數進行系數調整,得到調整后的評估參數對應的權重系 數,以基于調整后的權重系數對待評估視頻進行客觀質量評估。6. -種視頻質量評估裝置,其特征在于,所述裝置包括:視頻分組模塊、地址生成模塊、 獲取模塊及處理模塊;其中, 所述視頻分組模塊,用于基于視頻內容對待評估視頻進行分組,每個視頻分組中包括 至少兩個待評估視頻;每個視頻分組中包括的至少兩個待評估視頻確認為具有相同視頻內 容; 所述地址生成模塊,用于基于視頻分組結果生成用于指向包含有所述待評估視頻的播 放界面的地址信息,以基于所述地址信息播放所述待評估視頻,獲得所述待評估視頻的主 觀評估結果; 所述獲取模塊,用于分別獲取待評估視頻的至少一個評估參數;所述至少一個評估參 數表征視頻的質量; 所述處理模塊,用于基于所述至少一個評估參數、以及為每個評估參數預配置的權重 系數獲得所述待評估視頻的客觀評估結果; 以及,基于所述待評估視頻的主觀評估結果及客觀評估結果得到所述待評估視頻的質 量評估結果。7. 根據權利要求6所述的裝置,其特征在于, 所述視頻分組模塊,還用于分別提取每個待評估視頻的尺度不變特征變換SIFT特征向 量,獲得任意兩個SIFT特征向量之間的歐式距離; 確定歐式距離小于預設閾值的SIFT特征向量對應的待評估視頻為具有相同視頻內容 的同組視頻。8. 根據權利要求6或7所述的裝置,其特征在于, 所述地址生成模塊,還用于將每一個視頻分組中的所述至少兩個待評估視頻進行兩兩 分組獲得至少一個視頻子組;每個視頻子組中包括兩個待評估視頻; 針對每個視頻子組生成用于指向包含有所述兩個待評估視頻的播放界面的地址信息, 以基于所述地址信息同步播放所述兩個待評估視頻,獲得所述兩個待評估視頻的主觀評估 結果。9. 根據權利要求6或7所述的裝置,其特征在于, 所述處理模塊,還用于對待評估視頻的至少一個評估參數及所述至少一個評估參數預 配置的權重系數進行加權求和,獲得所述待評估視頻的客觀評估結果。10. 根據權利要求6或7所述的裝置,其特征在于, 所述處理模塊,還用于獲取預配置的主客觀評估結果的相關系數值; 基于所述相關系數值、待評估視頻的主觀質量評估結果及其至少一個評估參數對所述 至少一個評估參數對應的權重系數進行系數調整,得到調整后的評估參數對應的權重系 數,以基于調整后的權重系數對待評估視頻進行客觀質量評估。
【文檔編號】H04N17/00GK106060537SQ201610635636
【公開日】2016年10月26日
【申請日】2016年8月4日 公開號201610635636.2, CN 106060537 A, CN 106060537A, CN 201610635636, CN-A-106060537, CN106060537 A, CN106060537A, CN201610635636, CN201610635636.2
【發明人】沈招益
【申請人】騰訊科技(深圳)有限公司