專利名稱::一種視頻客觀質量評價方法
技術領域:
:本發明涉及一種視頻質量評價技術,尤其是涉及一種視頻客觀質量評價方法。
背景技術:
:隨著視頻處理技術在各個領域中的廣泛應用,人們發現,在不同的應用領域,對視頻質量的要求也各不相同。視頻數據通常先存儲在用于存放視頻數據的各種數據庫中,然后通過網絡進行視頻數據傳播,但在視頻傳播前及傳播中的采樣、壓縮、處理、傳輸和重建等過程中很容易受到各種各樣的失真損失,因此對視頻進行有效的視頻質量評價是至關重要的。目前為止,視頻質量評價方法主要分為兩大類主觀質量評價方法和客觀質量評價方法。主觀質量評價方法較客觀質量評價方法具有較強的可靠性,主觀質量評價方法就是由一系列不同年齡段,從事各種職業的評估者對特定的視頻進行打分評價,但主觀質量評價方法由于需要許多評估者參與且需按復雜程序和步驟進行,存在實施速度緩慢、耗時長、條件要求苛刻、費用高、使用不方便等缺點,使得主觀質量評價方法無論從時間還是從資金方面來說,代價都是昂貴的。因此,目前,對視頻質量評價方法的研究主要集中在客觀質量評價方法上。對于視頻客觀質量評價方法,其中PSNR(PeakSignaltoNoiseRatio,峰值信噪比)和MSE(MeanSquareError,均方根)因其具有實現過程簡單和低復雜度等優點而廣泛應用在視頻質量評價領域,但它們與人們感知到的視頻質量之間相關性比較差,只在獨立不相關的噪聲方面表現了良好的性能,而在壓縮、模糊方面相關性較差。最近ZhouWang等人提出了一種基于結構失真的視頻質量評價方法MSSIM(MeanStructuralSimilarity),這種方法是根據人眼對場景中的結構信息的高度敏感性而提出的,實驗證明MSSIM要優于PSNR和MSE,并且有著良好的性能和較寬的適用范圍,但是在人們進一步研究學習過程中發現,這種方法對模糊和噪聲損失方面評價效果較差。后來Guang一HaoChen等人提出了一種基于結構邊緣信息的圖像質量評價方法ESSIM(Edge-BasedStructuralSimilarity),這種方法對于壓縮、模糊、噪聲方面性能較MSSIM略有提高,但是這種方法直接應用到視頻領域時沒有考慮到視頻中場景的連續性和運動對象的運動性,導致這種方法在視頻領域應用的性能依然不是很好。
發明內容本發明所要解決的技術問題是提供一種視頻客觀質量評價方法,該方法通過重建視頻中各個宏塊與原始視頻中各個宏塊之間的能量差異和重建視頻中各個宏塊的加權系數獲得重建視頻的結構失真度量來評價視頻質量。本發明解決上述技術問題所采用的技術方案為一種視頻客觀質量評價方法,包括以下步驟-①定義外部視頻捕獲工具獲取的未經處理的視頻為原始視頻,采用現有技術對原始視頻的各個幀進行編碼,定義當前正在處理的原始視頻的幀為當前幀,當當前幀采用幀內編碼時得到I幀,當當前幀采用雙向空間預測編碼時得到B幀,當當前幀采用單向空間預測編碼時得到P幀,在對當前幀進行編碼的過程中當該當前幀采用雙向空間預測編碼或單向空間預測編碼時提取該當前幀圖像中各個具有不同尺寸大小的原始宏塊的運動向量值,然后將各個原始宏塊劃分成8x8宏塊,并將被劃分的原始宏塊的運動向量值賦值給其劃分成的各個8x8宏塊,作為8x8宏塊的運動向量值;②對編碼后得到的碼流進行解碼得到重建視頻,定義重建視頻中第i個幀圖像為當前幀圖像,根據當前幀圖像中各個8x8宏塊的運動向量值計算當前幀圖像的平均運動向量值,再利用當前幀圖像的平均運動向量值將當前幀圖像確定為非劇烈運動場景或劇烈運動場景;③計算當前幀圖像中各個8x8宏塊與原始視頻中對應的8x8宏塊之間的能量差異,根據能量差異和當前幀圖像中各個8x8宏塊的加權系數,利用現有的能量失真ESD算法計算當前幀圖像的結構失真度量;④采用計算重建視頻中第i個幀圖像的結構失真度量相同的計算方法獲取重建視頻中各個幀圖像的結構失真度量,再利用重建視頻中各個幀圖像的結構失真度量計算重建視頻的全局結構失真度量。所述的步驟③的具體過程為③-l、定義當前幀圖像中第j個8x8宏塊為當前8x8宏塊,記為祝0&'將與當前8x8宏塊歷ocO目應的原始視頻中的8x8宏塊記為說oc、,將當前8x8宏塊祝oc^中各個像素的亮度值記為O,,^),5/ocA:',v=[尸),將與當前8x8宏塊歷o&'w.相應的原始視頻中的8x8宏塊祝od:,乂中各個像素的亮度值記為i^x"乃),說oc^-[i^w》],其中,(:^為第j個8x8宏塊中的像素坐標;③-2、計算,的結構信息特征序列S/',,,',J卜"力,再利用57',力計算,的結構能量《,,五),〈說ocA^.,S/,.》,其中,符號"<>"為內積操作符號;計算5/oc、的結構信息特征序列S/",》,7,再利用S/,,y計算5/oc^,,的結構能量,£^=〈說0《,5/,》其中,符號"o"為內積操作符號;③-3、根據《,,和^值,得到萬/00^與祝0鳴,;之間的能量差異|£,,,-£,:|;③-4、計算祝ocA^的加權系數w",當當前幀圖像為由I幀圖像解碼后得到的幀圖像時,w,v=^xe,,y,當當前幀圖像為由B幀或P幀圖像解碼后得到的幀圖像時,M^-Lx^xv,.,"其中,/"為說ocA^的亮度加權系數,(0A盧36Cu,y—36)/1636<S52,為中所有像素的平均亮度1~>52值,e,力為歷od^.的結構加權系數,e,,,=4AVE雄Pi,25102255SAVEAMP"<510,AVEAMPj1AVEAMPH<255-畫J當前幀圖像采用現有技術濾波處理后得到的當前8x8宏塊中所有像素的像素平均值,v,j為,的運動加權系數,當當前幀圖像為非劇烈運動場景時,1niii^122-(20-11^)/812〈m,jS20,m,j為祝ocA^的運動向量值,當當前幀圖像2m,」>20',J為劇烈運動場景且當前幀圖像中劇烈宏塊個數占當前幀圖像中所有8x8宏塊個數的比2m^451+(55-m,》/1045<11^^55,當當前幀圖像為劇烈運動場重小于95%時,1>55景且當前幀圖像中劇烈宏塊個數占當前幀圖像中所有8><8宏塊個數的比重大于等于95%時,v,.7.=2-(55-1^)/1045<m,^55;③-5、采用與第j個8><8宏塊相同的處理2m,;>55方法獲取當前幀圖像中各個8x8宏塊與原始視頻中對應的8x8宏塊之間的能量差異,采用計算5/oA',」的加權系數相同的計算方法獲取當前幀圖像中各個8x8宏塊的加權系數;③-6、利用現有的能量失真ESD(EnergyofStructuralDistortion,能量失真)算法計算當前幀圖像的結構失真度量WESDi,WESDi=t^(E,,j—E',》2,其中,K為當前幀圖像中8x8宏塊的個數,w,」.為第i幀圖像中第j個8x8宏塊祝od:',j的加權系數,為的結構能量,;為與相應的原始視頻中的8x8宏塊說oc&j的結構能量。所述的步驟④的具體過程為計算重建視頻的全局結構失真度量『五S",『£SD=^"4-^其中,F為重建視頻中幀圖像的個數,『,為第i個幀圖像的權值,^10<附叫^10210<『咖,.^20320<呢叫S30430<,叫.S40550S『五叫『ESD,為第i個幀圖像的結構失真度:所述的步驟③-4中當前幀圖像采用現有技術濾波處理后得到的當前8x8宏塊中所有像素的像素平均值AVE—AMP,j的計算過程為對當前幀圖像采用現有的sobel濾波技術進行濾波處理,濾波處理過程中采用垂直邊緣檢測模板和水平邊緣檢測模板;將濾波處理后當前8x8宏塊中坐標為(m,n)的像素的像素值記為AMPm,n,AMPm,n=1(-l)承p…-!+(-2)承pm+n+(-1)*Pm+1,n+1+(1)*pm+1,n-l+(2)*Pm+1,n+(1)*Pm+l,n+lI+K-"*Pm-l,n-l+(-2)*pm,n+(-1)*Pm+1,n+(1)*p—"+(2)*pm,n+(1)*pm+i,n+i|,其中,Pm,n為坐標為(m,n)的像素的亮度值;計算濾波處理后當前8x8宏塊中所有像素的像素平均值AVE一AM&,AVE—AMPij=五爿M;"。所述的步驟②將當前幀圖像確定為非劇烈運動場景或劇烈運動場景是以當前幀圖像的平均運動向量值為標準進行確定的,當當前幀圖像的平均運動向量值小于16時,將當前幀圖像確定為非劇烈運動場景;當當前幀圖像的平均運動向量值大于等于16時,將當前幀圖像確定為劇烈運動場景。所述的③-4劇烈宏塊的確定方法為當當前幀圖像為劇烈運動場景時,如果當前幀圖像中的8x8宏塊的運動向量值大于等于40,則該8x8宏塊為劇烈宏塊,否則,該8x8宏塊為非劇烈宏塊。與現有技術相比,本發明的優點在于通過重建視頻中各個宏塊與原始視頻中各個宏塊之間的能量差異和根據當前宏塊的一些特性而對前面得到的能量差異進行加權處理從而獲得重建視頻的全局失真度量,可有效的利用該全局失真度量作為視頻客觀質量評價的評價值來評價重建視頻的質量好壞,本發明方法在壓縮、模糊、噪聲(包括椒鹽噪聲、隨機噪聲和部分椒鹽噪聲)方面均表現出了良好的性能;在計算重建視頻中宏塊的加權系數時,本發明考慮到了視頻中場景的運動性,根據場景的運動性獲取不同的運動加權系數,還考慮到了視頻中的場景結構信息和亮度信息,根據結構信息和亮度信息的不同重要性獲取了不同的加權系數,從而有效的提高了本發明方法的各方面的性能;原始視頻中宏塊的運動向量值是在編碼過程中提取的,在實際應用中不需要額外的計算工作。圖1為本發明方法的流程示意圖2為由VQEG組織提供的"tree"原始視頻序列的第一幀圖像;圖3為由VQEG組織提供的"Harp"原始視頻序列的第一幀圖像;圖4為由VQEG組織提供的"CanoaValsesia"原始視頻序列的第一幀圖像;圖5為由VQEG組織提供的"FlCar"原始視頻序列的第一幀圖像;圖6為由VQEG組織提供的"Fries"原始視頻序列的第一幀圖像;圖7為由VQEG組織提供的"Rugby"原始視頻序列的第一幀圖像;圖8a為垂直邊緣檢測模板;圖8b為水平邊緣檢測模板。具體實施例方式以下結合附圖實施例對本發明作進一步詳細描述。一種視頻客觀質量評價方法,如圖1所示,包括以下步驟①定義外部視頻捕獲工具獲取的未經處理的視頻為原始視頻,釆用現有技術對原始視頻的各個幀進行編碼,定義當前正在處理的原始視頻的幀為當前幀,當當前幀采用幀內編碼時得到I幀,當當前幀采用雙向空間預測編碼時得到B幀,當當前幀采用單向空間預測編碼時得到P幀,在對當前幀進行編碼的過程中當該當前幀采用雙向空間預測編碼或單向空間預測編碼時提取該當前幀圖像中各個具有不同尺寸大小的原始宏塊的運動向量值,然后將各個原始宏塊劃分成8x8宏塊,并將被劃分的原始宏塊的運動向量值賦值給其劃分成的各個8x8宏塊,作為8x8宏塊的運動向量值。原始宏塊具有以下幾種尺寸大小8x8、8x16、16x8、16x16,因為在實驗過程中,基于8x8宏塊進行數據處理時,評價效果最佳,所以在本發明中將原始宏塊分割成8x8宏塊。本發明中原始視頻直接采用由VQEG組織提供的視頻序列,圖2至圖7給出了VQEG組織提供的6個視頻序列的第一幀圖像,這6個幀圖像的分辨率均為720x576。圖2所示的"tree"視頻序列的第一幀圖像,其內容特點是靜態樹,屬于靜態拍攝,場景中存在很多細節,如枝葉、樹干等。圖3所示的"Harp"視頻序列的第一幀圖像,其內容特點是彈奏豎琴,里面有一段時間,會拉近屏幕,某些細節被放大。圖4所示的"CanoaValsesia"視頻序列的第一幀圖像,其內容特點是劃獨木舟,中間有一個轉彎的過程,場景畫面動靜結合。圖5所示的"F1Car"視頻序列的第一幀圖像,其內容特點是賽車比賽,中間有賽車沖出跑道,畫面拉近放大的過程。圖6所示的"Fries"視頻序列的第一幀圖像,其內容特點是炸薯條,中間有場景變化,主題明確。圖7所示的"Rugby"視頻序列的第一幀圖像,其內容特點是橄欖球比賽,畫面運動劇烈,以球為變化中心,人物很多,場面比較雜亂。本發明中重建視頻共分為以下5種質量損失,包括壓縮損失、模糊損失、加入椒鹽噪聲、加入隨機噪聲和部分幀加入椒鹽噪聲,其中,壓縮損失中,針對VQEG組織提供的6個原始視頻,量化步長分別選取6、12、18、24、30;模糊損失中,針對VQEG組織提供的6個原始視頻,模糊模板分別選取3x3、5x5、9x9、ll"l、15^15、19x19;加入椒鹽噪聲中,針對VQEG組織提供的6個原始視頻,加入噪聲分別為0.1%、0.5%、1%、2%、5%;加入隨機噪聲中,針對VQEG組織提供的6個原始視頻,隨機變化幅度范圍分別選取16、24、32、64、128;部分幀加入椒鹽噪聲中,針對VQEG組織提供的6個原始視頻,加噪聲幀的密度分別選取5%、10%、20%、30%、50%,其中噪聲幀中加入噪聲的密度分別選取0.1%、0.5%、1%、2%、5%。其中,編解碼環境是在由XVID組織提供的xvidcore-l丄3版本上進行,編碼參數設置如下-isrc7—ref_62501.yuv-w720-h576-type0-max_bframes2-max_key—interval90,參數說明如下-i后面參數是輸入的文件名,-W后面參數是視頻寬度,-h后面參數視頻高度,-type后面是視頻類型,0表示是該視頻的數據格式為YUV格式,-max_bftames后面參數是最大B幀的間隔,-max—keyjnterval后面參數是最大I幀間隔。②對編碼后得到的碼流進行解碼得到重建視頻,定義重建視頻中第i個幀圖像為當前幀圖像,根據當前幀圖像中各個8x8宏塊的運動向量值計算當前幀圖像的平均運動向量值,再利用當前幀圖像的平均運動向量值將當前幀圖像確定為非劇烈運動場景或劇烈運動場景。在本實施例中,當前幀圖像的平均運動向量值為6480個8x8宏塊的運動向量值之和除以6480。8x8宏塊的個數6480由當前幀圖像的大小即720x576除以8><8得到。上述當前幀圖像確定為非劇烈運動場景或劇烈運動場景是以當前幀圖像的平均運動向量值為標準進行確定的,當當前幀圖像的平均運動向量值小于16時,將當前幀圖像確定為非劇烈運動場景;當當前幀圖像的平均運動向量值大于等于16時,將當前幀圖像確定為劇烈運動場景。此處,值16是在實驗過程中,先經過多個觀察者觀看視頻內容,統計多個觀察者各自的看法,然后將原始視頻劃分成以上兩類,最后分析統計各類視頻編碼過程中原始視頻的各宏塊產生的運動向量值的特征而得到的值16。③計算當前幀圖像中各個8x8宏塊與原始視頻中對應的8x8宏塊之間的能量差異,根據能量差異和當前幀圖像中各個8x8宏塊的加權系數,利用現有的能量失真ESD算法計算當前幀圖像的結構失真度量。具體步驟如下③-l、定義當前幀圖像中第j個8x8宏塊為當前8x8宏塊,記為祝od",將與當前8x8宏塊萬/ocO目應的原始視頻中的8x8宏塊記為,將當前8x8宏塊5/od:。中各個像素的亮度值記為尸,5/ocfc',y=[尸'7,將與當前8x8宏塊歷ocO目應的原始視頻中的8x8宏塊中各個像素的亮度值記為《(jc"^),說ocKS(、,力)],其中,(Jc"力)為第j個8x8宏塊中的像素坐標,;^的變化范圍為[1,8],^的變化范圍為[1,8]。③-2、計算說od',,;的結構信息特征序列,=,,",再利用計算說oc^的結構能量五',?£'^=〈說0^",《》,其中,符號"o"為內積操作符號,說odt。與S/^的內積操作即可以看成5/ocA^.在57"上的投影能量,可以有效的表示重建視頻中的幀圖像相對于原始視頻中的幀圖像的結構能量損失程度;計算5/od,j可知,<SIij,SIij>=l,此特性保證了當與其他幀圖像計算結構能量時,不會破壞其他幀圖像的結構能量。③-3、根據《,;和,;值,得到7與說oc、之間的能量差異-。£,;,=〈B/0d^,S/,7〉,其中,符號"o"為內積操作符號。根據S/,◎-4、計算5/oA',力的加權系數M^,當當前幀圖像為由I幀圖像解碼后得到的幀圖像時,>^.=/,,;><^"當當前幀圖像為由B幀或P幀圖像解碼后得到的幀圖像時,H,W其中,為歷ocryt'w的亮度加權系數。針對一幀圖像中的黑色區域,人們往往不會注意到這部分信息,因此需將對這部分區域賦予一個較小的權值,使用塊亮度信息中的'0A盧^平均值來判斷塊的亮度情況。/,,,='(//,,;-36)/1636</^;52,/^為5/ocA:',力中所1;>52有像素的平均亮度值,在本實施例中5/od^.包含有64個像素。另外,此處的值36和值52是經過如下實驗得到的,我們先觀察一幀圖像,確定亮度區域和灰度區域,然后分析并統計這兩部分區域對應的實際亮度值,從而得到人眼對亮度敏感程度的一個范圍,進而確定了此處的值36和值52。其中,e,」為祝od'Q的結構加權系數。看一幀圖像時,首先會注意到這幀圖像中的輪廓和邊緣信息,輪廓和邊緣信息是一幀圖像中的最重要信息,因此,對于不同重要程4AVEAMPH2510度的宏塊給予不同大小的權值。e,,,.=2255《AVE_AMPid<510,AVE—AM^為當前1AVEAMPh<255幀圖像采用現有技術濾波處理后得到的當前8x8宏塊中所有像素的像素平均值,AVEAMgj的計算過程為對當前幀圖像采用現有的sobel濾波技術進行濾波處理,濾波處理過程中采用圖8a所示的垂直邊緣檢測模板和圖8b所示的水平邊緣檢測模板;將濾波處理后當前8x8宏塊中坐標為(m,n)的像素的像素值記為AMPm,n,AMPm,n=|(-l)*Pm-l'n-l+(-2)*Pm-l,n+(")*Pm+l,n+l+(1)*Pm+l,n懇l+(2)*pm+i,n+(1)*pm+l,n+l|+|(-l)*Pm-l,n-l+(-2)*pm,n+(-1)*pm+1,n+(1)*p—-!+(2)*pm,n+(1)*pm+1,n+1|,其中,pm,n為坐標為(m,n)的像素的亮度值;計算濾波處理后當前8><8宏塊中所有像素的像素平均值AVE—AM&,AVE—ZJM尸^。在此,值255、510是經過如下實驗得到,首先我們對一幀圖像進行濾波處理,然后顯示濾波后值(AMPm,n)大于一指定域值那部分圖像,指定域值可以為由大量統計后得到的比較理想的值510,從圖像中可以獲知這部分區域是重要的輪廓邊緣信息,在值510附近做小范圍的浮動,整體結果變化不大。值255也是經過這樣的實驗得到,最后是經過整體測試結果來最終確定這些值的。其中,v"為祝ocA^.的運動加權系數。當當前幀圖像為非劇烈運動場景時,即整個場景特點是場景變化不大且只有部分對象在運動或變化,1111^122-(20-mJ/812<muS20,m,.,j為祝ocA^的運動向量值,當當前幀圖像2m,j>20為劇烈運動場景且當前幀圖像中劇烈宏塊個數占當前幀圖像中所有8x8宏塊個數的比重小于95%時,說明大部分對象變化不是很明顯,而是一部分對象在高速運動,這部分高速運動的對象是主體,人們注意力會集中在高速運動的對象上,因此給予高速運動的對象一個高的權值,v"=2m^45l+(55-mJ/1045〈m,jS55,當當前幀圖像為劇烈運1m,、j>55動場景且當前幀圖像中劇烈宏塊個數占當前幀圖像中所有8x8宏塊個數的比重大于等于95%時,說明運動劇烈的宏塊較多,這時人們會更關注相對變化較小的對象,1muS452-(55-mg)/1045〈m,jS55。此外,值95%是首先過對視頻運動信息數據進2m,、j>55行分析統計,得到一個大概值,然后根據實驗結果進行調整而得到的一個值。此處,值12、20、45、55是根據實際視頻中對應的塊運動信息值,分析并統計其變化范圍而得到的。上述劇烈宏塊的確定方法為當當前幀圖像為劇烈運動場景時,如果當前幀圖像中的8x8宏塊的運動向量值大于等于40,則該8x8宏塊為劇烈宏塊,否則,該8x8宏塊為非劇烈宏塊。此處,值40是根據視頻實際的運動信息值分析而得到的。③-5、采用與第j個8x8宏塊相同的處理方法獲取當前幀圖像中各個8x8宏塊與原始視頻中對應的8x8宏塊之間的能量差異,采用計算祝ocA:^.的加權系數v^相同的計算方法獲取當前幀圖像中各個8x8宏塊的加權系數。③-6、利用現有的能量失真ESD算法計算當前幀圖像的結構失真度量WESDj,WESDi=堂^(E^-E")2,其中,K為當前幀圖像中8x8宏塊的個數,在此實施例中,K=(720x576)/(8x8)=6480,為第i幀圖像中第j個8x8宏塊說od^的加權系數,£',,;.為祝0<.,;的結構能量,£,,7為與5/0<;相應的原始視頻中的8x8宏塊說o《乂的結構能量。(D采用計算重建視頻中第i個幀圖像的結構失真度量相同的計算方法獲取重建視頻中各個幀圖像的結構失真度量,再利用重建視頻中各個幀圖像的結構失真度量計算重建視頻的全局結構失真度量。具體過程為計算重建視頻的全局結構失真度量『ESD,其中,F為重建視頻中幀圖像的個數,『,為第i個幀圖像的權值,^=0<『£5Z>,^1010<呢叫520Z(X^SZ),"G,『ESD,為第i個幀圖像的結構失真度j30<,叫S40:。將最終得到的全局結構失真度量作為視頻客觀質量評價的評價值。在此,值10、20、30、40、50是根據做主觀實驗時,打分時會劃分出5個標準,加上人的思維方式如非常好、好、一般、不好、非常差等的影響,而劃分出的,另外具體值時根據實驗測試結果而最終定下來的。對采用本發明方法與采用現有的PSNR、MSSIM和ESSIM方法,在相同的實驗條件下進行視頻客觀質量評價對比實驗,實驗結果如表1至表5所示。<table>tableseeoriginaldocumentpage15</column></row><table>表4椒鹽噪聲損失比較數據<table>tableseeoriginaldocumentpage16</column></row><table>表1至表5中pearson和RMSE用于反映模型預測的準確性,spearman用于反映模型預測的單調性。其中,二次曲線回歸數據是在spssl2.0版本上計算得來的。分析表1至表5我們可以得到以下結論A.本發明的客觀質量評價方法在整體評價結果中,針對壓縮損失、模糊損失、加入椒鹽噪聲、加入隨機噪聲和部分幀加入椒鹽噪聲這5種失真,綜合性能是最好的。B.在壓縮損失上,本發明的客觀質量評價結果最佳,明顯優于PSNR、MSSIM和ESSIM方法。C.在模糊損失上,本發明的客觀質量評價結果要明顯優于PSNR、MSSIM和ESSIM方法,彌補了現有的三種方法在這方面表現出來的缺陷。D.在噪聲損失中,雖然性能要略差于PSNR,但是要明顯優于MSSIM和ESSIM方法,接近PSNR的視頻效果。權利要求1、一種視頻客觀質量評價方法,其特征在于包括以下步驟①定義外部視頻捕獲工具獲取的未經處理的視頻為原始視頻,采用現有技術對原始視頻的各個幀進行編碼,定義當前正在處理的原始視頻的幀為當前幀,當當前幀采用幀內編碼時得到I幀,當當前幀采用雙向空間預測編碼時得到B幀,當當前幀采用單向空間預測編碼時得到P幀,在對當前幀進行編碼的過程中當該當前幀采用雙向空間預測編碼或單向空間預測編碼時提取該當前幀圖像中各個具有不同尺寸大小的原始宏塊的運動向量值,然后將各個原始宏塊劃分成8×8宏塊,并將被劃分的原始宏塊的運動向量值賦值給其劃分成的各個8×8宏塊,作為8×8宏塊的運動向量值;②對編碼后得到的碼流進行解碼得到重建視頻,定義重建視頻中第i個幀圖像為當前幀圖像,根據當前幀圖像中各個8×8宏塊的運動向量值計算當前幀圖像的平均運動向量值,再利用當前幀圖像的平均運動向量值將當前幀圖像確定為非劇烈運動場景或劇烈運動場景;③計算當前幀圖像中各個8×8宏塊與原始視頻中對應的8×8宏塊之間的能量差異,根據能量差異和當前幀圖像中各個8×8宏塊的加權系數,利用現有的能量失真ESD算法計算當前幀圖像的結構失真度量;④采用計算重建視頻中第i個幀圖像的結構失真度量相同的計算方法獲取重建視頻中各個幀圖像的結構失真度量,再利用重建視頻中各個幀圖像的結構失真度量計算重建視頻的全局結構失真度量。2、根據權利要求1所述的一種視頻客觀質量評價方法,其特征在于所述的步驟③的具體過程為③-l、定義當前幀圖像中第j個8x8宏塊為當前8x8宏±央,記為5/oc^,將與當前8x8宏塊祝ocO目應的原始視頻中的8x8宏塊記為歷oc、,將當前8x8宏塊說od'w.中各個像素的亮度值記為0」,力),別ocA:'w.-[O,,力)],將與當前8x8宏塊說odt',,j相應的原始視頻中的8x8宏塊說ocy^中各個像素的亮度值記為S(^,^.),祝oc^.力)〗,其中,(巧,力)為第j個8x8宏塊中的像素坐標;③-2、計算說oc^量五u,《,,〈5/oc^,S/;》,其中,符號"<>"為內積操作符號;計算祝od,j的結構信息特征序列S/",S/,,,一w,再利用S/,y計算的結構能量X"1d/、2'—-------,j鬥-—鬥■一一',.j',£u=〈S/0《y,S/;/〉,其中,符號"<>"為內積操作符號;③-3、根據《,;和、值,得到5/0^"與說0^,;之間的能量差異|£,廠£,.:|;③-4、計算祝0dt',y的加權系數M^.,當當前幀圖像為由I幀圖像解碼后得到的幀圖像時,w,7=/,vXe。.,當當前幀圖像為由B幀或P幀圖像解碼后得到的幀圖像時,>^=/,,%><、,其中,^為祝oc/^的亮度0A,盧36-36)/1636《52,/^為5/0<,;中所有像素的平均亮度>52加權系數,/,,=值,e,j為5/oc;t',力的結構加權系數,=4AVE歲&25102255《AVEAMP,,<510,AVEAMg,為1AVE<255當前幀圖像釆用現有技術濾波處理后得到的當前8x8宏塊中所有像素的像素平均值,為歷od:',j的運動加權系數,當當前幀圖像為非劇烈運動場景時,rriij^122-(20—mu)/812<m,^20,m,j為;的運動向量值,當當前幀圖像為2m,〗>20劇烈運動場景且當前幀圖像中劇烈宏塊個數占當前幀圖像中所有8x8宏塊個數的比重'2m"45小于95%時,v「1+(55-m,j)/1045<m,^55,當當前幀圖像為劇烈運動場景1m,j>55且當前幀圖像中劇烈宏塊個數占當前幀圖像中所有8x8宏塊個數的比重大于等于95%1niijS452-(55-m,》/1045<m,^55;③-5、采用與第j個8><8宏塊相同的處理方時,、2mi;>55法獲取當前幀圖像中各個8x8宏塊與原始視頻中對應的8x8宏塊之間的能量差異,采用計算歷od^.的加權系數i^相同的計算方法獲取當前幀圖像中各個8x8宏塊的加權系數;③-6、利用現有的能量失真ESD算法計算當前幀圖像的結構失真度量WESDi,WESD,=t~(E,v-E'J2,其中,K為當前幀圖像中8x8宏塊的個數,v^為第i幀圖像中第j個8x8宏塊B/ocA:',力的加權系數,£'^為說0^',,7.的結構能量,五^為與說ocA:"相應的原始視頻中的8x8宏塊祝ocA^的結構能量。3、根據權利要求2所述的一種視頻客觀質量評價方法,其特征在于所述的步驟④的具體過程為計算重建視頻的全局結構失真度量『五SD,『五SD-^^-i,其中,F為重建視頻中幀圖像的個數,『,為第i個幀圖像的權值,<formula>formulaseeoriginaldocumentpage4</formula>『五SA為第i個幀圖像的結構失真度量,4、根據權利要求2所述的一種視頻客觀質量評價方法,其特征在于所述的步驟③-4中當前幀圖像采用現有技術濾波處理后得到的當前8x8宏塊中所有像素的像素平均值AVEAMP,i的計算過程為對當前幀圖像采用現有的sobel濾波技術進行濾波處理,濾波處理過程中采用垂直邊緣檢測模板和水平邊緣檢測模板;將濾波處理后當前8x8宏塊中坐標為(m,n)的像素的像素值記為AMPm,n,AMPm,n=|(-l)*Pm-l,n-l+(-2)*pm+n+(-1)*Pm+1,n+1+(1)*Pm+,'n"+(2)*pm+1,n+(1)*pm+1,n+l|+K-l)、","+(陽2"pm,n+(-1)*pm+1,n+(1)*Pm-',n-,+(2)*Pm,n+(1)*pm+,n+1I,其中,Pm,n為坐標為(m,n)的像素的亮度值;計算濾波處理后當前8x8宏塊中所有像素的像素平均值AVE一AMI^,AVE—=J]JMPm。5、根據權利要求l所述的一種視頻客觀質量評價方法,其特征在于所述的步驟②將當前幀圖像確定為非劇烈運動場景或劇烈運動場景是以當前幀圖像的平均運動向量值為標準進行確定的,當當前幀圖像的平均運動向量值小于16時,將當前幀圖像確定為非劇烈運動場景;當當前幀圖像的平均運動向量值大于等于16時,將當前幀圖像確定為劇烈運動場景。6、根據權利要求2所述的一種視頻客觀質量評價方法,其特征在于所述的③-4劇烈宏塊的確定方法為當當前幀圖像為劇烈運動場景時,如果當前幀圖像中的8x8宏塊的運動向量值大于等于40,則該8x8宏塊為劇烈宏塊,否則,該8x8宏塊為非劇烈宏塊。全文摘要本發明公開了一種視頻客觀質量評價方法,優點在于通過重建視頻中各個宏塊與原始視頻中各個宏塊之間的能量差異和根據當前宏塊的一些特性而對前面得到的能量差異進行加權處理從而獲得重建視頻的全局失真度量,可有效的利用該全局失真度量作為視頻客觀質量評價的評價值來評價重建視頻的質量好壞,本發明方法在壓縮、模糊、噪聲方面均表現出了良好的性能;在計算重建視頻中宏塊的加權系數時,本發明考慮到了視頻中場景的運動性,根據場景的運動性獲取不同的運動加權系數,還考慮到了視頻中的場景結構信息和亮度信息,根據結構信息和亮度信息的不同重要性獲取了不同的加權系數,從而有效的提高了本發明方法的各方面的性能。文檔編號H04N7/26GK101426148SQ200810162778公開日2009年5月6日申請日期2008年12月1日優先權日2008年12月1日發明者盧國慶,李均利,剛陳,平魏申請人:寧波大學