專利名稱:用于減少壓縮的視頻中的喘息污跡的方法和設(shè)備的制作方法
本申請(qǐng)要求1998年5月7日遞交的美國(guó)臨時(shí)申請(qǐng)No.60/084,632(文檔號(hào)12755P)的利益。
本發(fā)明總地涉及通信系統(tǒng),且更具體地,本發(fā)明涉及一種用于減少編碼的信息流中的“喘息”污跡(breathing artifact)的方法和伴隨設(shè)備。
背景技術(shù):
在幾種通信系統(tǒng)中,待被發(fā)送的數(shù)據(jù)被壓縮以使可用帶寬被更加有效地使用。例如,運(yùn)動(dòng)圖象專家組(MPEG)具有幾種有關(guān)數(shù)字?jǐn)?shù)據(jù)傳輸系統(tǒng)的頒布的標(biāo)準(zhǔn)。第一個(gè)被稱之為MPEG-1,涉及ISO/IEC標(biāo)準(zhǔn)11172且結(jié)合在此作為參考。第二個(gè)被稱之為MPEG-2,涉及ISO/IEC標(biāo)準(zhǔn)13818且被結(jié)合在此作為標(biāo)準(zhǔn)。在先進(jìn)電視系統(tǒng)委員會(huì)(ATSC)數(shù)字電視標(biāo)準(zhǔn)文件A/53中描述了一種壓縮的數(shù)字視頻系統(tǒng)且結(jié)合在此作為參考。
上述有關(guān)標(biāo)準(zhǔn)描述了適合于在數(shù)字通信系統(tǒng)中使用固定或可變長(zhǎng)度碼壓縮及傳輸視頻、音頻和其他信息的數(shù)據(jù)處理及操作技術(shù)。具體地,上述標(biāo)準(zhǔn),及其他“MPEG類”標(biāo)準(zhǔn)和技術(shù)說(shuō)明性地使用幀內(nèi)編碼技術(shù)(例如行程編碼、哈夫曼編碼等)和幀間編碼技術(shù)(例如正向和反向預(yù)測(cè)編碼、運(yùn)動(dòng)補(bǔ)償?shù)?壓縮視頻信息。具體地,在視頻處理系統(tǒng)的情況下,MPEG和MPEG類視頻處理系統(tǒng)的特征在于帶有或不帶有幀內(nèi)和/或幀間運(yùn)動(dòng)補(bǔ)償編碼的視頻幀的基于預(yù)測(cè)的壓縮編碼。
在一典型的MPEG類編碼器中,包括有多個(gè)視頻幀的一接收的視頻流根據(jù)一預(yù)定的圖象組(GOP)結(jié)構(gòu)被編碼。也就是說(shuō),該接收的視頻流被編碼以生成一包括例如一內(nèi)部編碼幀(I幀),后跟隨一或多個(gè)正向預(yù)測(cè)的編碼的幀(P幀)和雙向(即正向和反向)預(yù)測(cè)的幀(B幀)的GOP。
然而,由于運(yùn)動(dòng)補(bǔ)償技術(shù)不是較好的,預(yù)測(cè)的幀或圖象可能遭受不期望的視覺(jué)污跡例如誤差傳播、降低的編輯顆粒性等。而且,包括這些預(yù)測(cè)的幀的GOP結(jié)構(gòu)也會(huì)遭受這些污跡。由于一GOP結(jié)構(gòu)內(nèi)的單獨(dú)幀的保真度趨向于在一初始的高質(zhì)量I幀后衰減,一序列GOP的顯示生成稱之為“喘息”的周期的視覺(jué)污跡,其中該污跡的周期特性與顯示的GOP的長(zhǎng)度相關(guān)。
因此,期望提供一種減少上述“喘息”污跡的方法和設(shè)備。
發(fā)明概述本發(fā)明包括一種用于減少在采用圖象組(GOP)或幀組(GOF)結(jié)構(gòu)的MPEG類視頻信息流中的喘息污跡的方法和設(shè)備。
具體地,在一種用于處理根據(jù)一圖象組(GOP)信息結(jié)構(gòu)所配置的一序列壓縮的圖象的系統(tǒng)中,一種根據(jù)本發(fā)明的用于減少GOP間視覺(jué)污跡的方法包括有步驟對(duì)于該GOP信息結(jié)構(gòu)內(nèi)的第一種信息幀,確定一相應(yīng)的保真度衰減的水平;對(duì)于該GOP信息結(jié)構(gòu)內(nèi)的第二種信息幀,確定一相應(yīng)的保真度衰減的水平;使用確定的保真度衰減的水平,計(jì)算一衰減均衡參數(shù);并使用該計(jì)算的衰減均衡參數(shù),處理該第一和第二種信息幀之一以使該第一和第二種信息幀具有一預(yù)定范圍內(nèi)的保真度衰減的水平。
附圖簡(jiǎn)述通過(guò)以下結(jié)合附圖所作的詳細(xì)描述,可容易地理解本發(fā)明的教義,附圖中
圖1A至1C給出了與一圖象組(GOP)內(nèi)的視頻保真度相關(guān)聯(lián)的一或多個(gè)參數(shù)的有關(guān)逐幀衰減的視圖;圖2給出了根據(jù)本發(fā)明的一MPEG類解碼器的一實(shí)施例;圖3給出了根據(jù)本發(fā)明的用于減少視頻信號(hào)中的喘息污跡的一衰減均衡例程;圖4給出了根據(jù)本發(fā)明的一衰減均衡例程400;圖5給出了根據(jù)本發(fā)明的一GOP均衡例程的流程圖;圖6給出了根據(jù)本發(fā)明的一衰減均衡例程的流程圖;圖7給出了根據(jù)本發(fā)明且適于減少一受存儲(chǔ)器限定的解碼器的上下文內(nèi)的喘息污跡的衰減均衡例程的流程圖;及圖8給出了根據(jù)本發(fā)明的一塊水平修正控制例程的流程圖。
為便于理解,在這些附圖中,相同的參考數(shù)字表示相同的元素。
詳細(xì)描述下面將在一數(shù)字電視(DTV)接收機(jī)(圖示為一ATSC電視接收機(jī))內(nèi)的一視頻解碼器(圖示為一MPEG-2視頻解碼器)的上下文中對(duì)本發(fā)明進(jìn)行描述。然而,本領(lǐng)域的熟練技術(shù)人員可理解到本發(fā)明可應(yīng)用于任何視頻處理系統(tǒng),包括適用于DVB、MPEG-1的系統(tǒng)和其他信息系統(tǒng)。
具體地,主要在接收和解碼一壓縮的視頻信息流以生成一視頻輸出流OUT的MPEG類解碼系統(tǒng)的上下文中描述本發(fā)明。本發(fā)明用于減少在采用一圖象組(GOP)信息結(jié)構(gòu)的視頻或圖象處理系統(tǒng)的情況下,由導(dǎo)致在GOP顯示率的視覺(jué)保真度的調(diào)制的GOP內(nèi)視覺(jué)保真度水平的改變所導(dǎo)致的“喘息”污跡。然而,本領(lǐng)域的熟練技術(shù)人員顯然理解本發(fā)明可適用于具有在一圖象組(GOP)或幀組(GOF)信息結(jié)構(gòu)內(nèi)的不同幀間保真度水平的其他信息系統(tǒng)。
圖1A至1C給出了與一圖象組(GOP)內(nèi)的視頻保真度相關(guān)聯(lián)的一或多個(gè)參數(shù)的相關(guān)逐幀衰減的圖形表示。在這方面來(lái)說(shuō),這樣的在一GOP內(nèi)的逐幀衰減導(dǎo)致具有近似該GOP周期的一周期的視覺(jué)保真度的周期的提高和/或降低,生成上述喘息污跡。如果該視覺(jué)保真度的周期性提高和/或降低足夠大,在一顯示裝置上顯示包括該GOP的視頻序列時(shí),該喘息污跡對(duì)于觀看者來(lái)說(shuō)變得明顯。
例如,考慮到響應(yīng)于一視頻信息流的一每秒30幀(fps)的表示/顯示系統(tǒng)呈現(xiàn)顯著的視覺(jué)保真度中的GOP內(nèi)變化(例如I幀和B幀之間的大的量化差),其中該視頻信息流包括根據(jù)一15幀GOP配置的MPEG類視頻信息的情況。由于該GOP包括一單個(gè)的I幀和多個(gè)B幀,顯示的視頻的各半秒(15幀GOP/30fps)從一高保真度I幀開(kāi)始,后隨有多個(gè)相對(duì)低保真度B幀(和通常地P幀)。由于該GOP內(nèi)的幀間保真度變化,該顯示的圖象序列呈現(xiàn)具有1/2秒周期的脈動(dòng)(即喘息)特性。
本發(fā)明已確定喘息污跡的主要原因是1)一GOP內(nèi)的幀間量化水平差;2)一GOP內(nèi)的半象素(half pel)運(yùn)動(dòng)估算誤差的傳播;和3)處理一GOP的解碼器(或其特性)引起的保真度異常。下面將公開(kāi)解決這三種喘息污跡情況的本發(fā)明的實(shí)施例。
圖1A示出了包括有一I幀及后隨的十個(gè)P幀的一GOP內(nèi)的視頻“銳度”的逐幀衰減的圖形表示。銳度是一高頻響應(yīng)的函數(shù),其是精確呈現(xiàn)邊緣及其他高對(duì)比度亮度過(guò)渡的關(guān)鍵。具體地,圖1A示出了三個(gè)GOP(標(biāo)明為101)的一序列和這些GOP中各幀的銳度水平的對(duì)應(yīng)圖示??梢?jiàn)一視頻圖象的銳度對(duì)于這些GOP中的各I幀處于最大,對(duì)于各連續(xù)的P幀銳度有對(duì)應(yīng)的降低。由于以對(duì)應(yīng)于GOP顯示率的一速率的銳度水平的逐漸衰減和快速提高而產(chǎn)生一喘息污跡。
在圖1A中,各連續(xù)P幀的銳度的對(duì)應(yīng)降低是由處理這些GOP的一解碼器的運(yùn)動(dòng)補(bǔ)償電路內(nèi)的半象素內(nèi)插引起的。該半象素內(nèi)插器進(jìn)行工作以低通濾波這些預(yù)測(cè)的宏塊或象素組。圖1A中的所示的銳度水平的相對(duì)線性衰減是由于使用這些GOP內(nèi)的P幀和一半象素內(nèi)插誤差近似恒定的假設(shè)。圖形中的陰影部分包括各P幀下降內(nèi)的一誤差統(tǒng)計(jì)帶。必須注意盡管各I幀(I1、I2和I3)被示出為具有相同的最大銳度水平,這些I幀的銳度水平初始地由一編碼器的速率控制器根據(jù)許多因素,包括分配給一GOP的位-預(yù)算(bit-budget)被確定。這樣,一I幀的銳度水平和總體的視覺(jué)保真度根據(jù)編碼器的要求在需要時(shí)發(fā)生改變。
圖1B是一12幀GOP內(nèi)的視頻銳度的逐幀衰減的示意圖,該12幀GOP包括一初始的I幀和后隨的三B幀和一P幀的一重復(fù)序列。由于使用環(huán)繞各B幀的緊接的先前錨幀(anchor frame)(I或P幀)預(yù)測(cè)該B幀,兩半象素內(nèi)插被與各B幀相關(guān)聯(lián)。因此,各B幀被示出為具有比用于預(yù)測(cè)該B幀的最小精確基準(zhǔn)幀低半象素的一銳度水平。可見(jiàn)一視頻圖象的銳度對(duì)于這些GOP內(nèi)的各I幀是處于最大,帶有對(duì)于一GOP中的各連續(xù)幀的銳度衰減的一變化量。由于在對(duì)應(yīng)于GOP顯示率的一速率的衰減的變化量和銳度水平的快速提高,生成一喘息污跡。
在圖1B中,第一I幀(I1)被示出為具有最大(max)的銳度水平。跟隨該I幀的第一P幀被示出為具有比該最大值低一半象素的的銳度水平。使用第一I幀和第一P幀預(yù)測(cè)的三個(gè)B幀被示出為具有在該P(yáng)幀的銳度水平之下一半象素的銳度水平。類似地,在第一I幀之后的第二P幀具有第一P幀的銳度水平之下一半象素的銳度水平,自該銳度水平對(duì)其進(jìn)行預(yù)測(cè)。這樣,使用第一P幀和第二P幀預(yù)測(cè)的這些B幀具有第二P幀銳度水平之下一半象素的銳度水平。
圖1C是一12幀GOP內(nèi)的逐幀量化水平(即粒度)的示意圖,該12幀GOP包括一初始的I幀和后隨的三B幀和一P幀的一重復(fù)序列。由于通常用比P幀精細(xì)的量化水平對(duì)I幀進(jìn)行編碼,且由于通常用比B幀精細(xì)的量化水平對(duì)P幀進(jìn)行編碼,圖1C示出了使用該GOP結(jié)構(gòu)生成的視頻圖象的量化水平的變化。通過(guò)檢查可見(jiàn)量化水平開(kāi)始于用于初始I幀(I1)的一細(xì)水平且衰減至用于B幀的一粗水平并到用于P幀的一稍小的粗水平。這樣,使用圖1C所示的GOP結(jié)構(gòu)生成的,包括對(duì)應(yīng)的量化粒度水平的一視頻圖象將根據(jù)用于生成一單獨(dú)視頻幀的GOP結(jié)構(gòu)中的幀類型而具有保真度的提高和降低。。該保真度的改變或調(diào)制也對(duì)上述喘息污跡作出了貢獻(xiàn)。
圖2示出了根據(jù)本發(fā)明的一MPEG類解碼器200的一實(shí)施例。具體地,圖2的解碼器200接收并解碼一壓縮的視頻信息流IN以生成一視頻輸出流OUT。該視頻輸出流OUT適合于傳送給例如一顯示裝置(未示出)內(nèi)的一顯示驅(qū)動(dòng)器電路。該MPEG類解碼器200檢查與該壓縮的視頻信息流IN內(nèi)的信息幀(例如視頻或圖象幀)相關(guān)聯(lián)的保真度指示參數(shù)以確定一得到的解壓的信息流(例如一視頻流)是否可能呈現(xiàn)上述的喘息污跡。響應(yīng)于該對(duì)喘息污跡是否可能出現(xiàn)的確定,該MPEG類解碼器200以傾向于減少喘息污跡的方式修改一解碼的信息流。有利地,本發(fā)明可工作而不考慮有關(guān)形成壓縮的視頻流IN(除該壓縮的視頻流IN內(nèi)的該信息外)的編碼器的工況特點(diǎn)。
圖2的MPEG類解碼器200包括一視頻解碼器210、一視頻處理器220和一控制器230。視頻解碼器210以相對(duì)標(biāo)準(zhǔn)的方式進(jìn)行工作以接收和解碼該壓縮的視頻信息流IN以生成一解壓的視頻流V1。該解壓的視頻流V1對(duì)于由GOP內(nèi)的幀間保真度變化和視頻解碼器210的異常(或特性)引起的喘息污跡是敏感的。該解壓的視頻流V1被傳送給視頻處理器220及任選地傳送給控制器230。
視頻處理器220響應(yīng)于由控制器230生成的一衰減控制信號(hào)C,適應(yīng)該解碼的視頻流V1內(nèi)的一或多個(gè)幀的衰減的水平,以生成視頻輸出流OUT,說(shuō)明性地為一基帶數(shù)字視頻流。
視頻處理器220在幾個(gè)衰減模式(如下所詳述的)之一中工作。簡(jiǎn)明地,在一噪聲注入工作模式下,視頻處理器220將(由控制器230確定的)噪聲量注入一被計(jì)算的較高保真度圖象幀(例如一I幀)以降低該較高保真度圖象幀的有效量化水平。在該工作模式下,由幀間量化水平的較大差異(例如圖1C)所導(dǎo)致的喘息污跡通過(guò)將幀間量化水平差減小到一閾值差水平而被減少。在一濾波工作模式下,該視頻處理器選擇地將低通濾波(LPF)和高通濾波(HPF)施加給一GOP內(nèi)的一或多個(gè)圖象幀或圖象幀類型。在該工作模式下,由預(yù)測(cè)誤差傳播所引起的喘息污跡通過(guò)這樣一方式濾波各圖象幀而被減少該方式傾向于均衡一GOP內(nèi)的所有圖象幀中的銳度衰減的量。下面將討論其他的工作模式。
控制器230從視頻解碼器210接收一保真度指示參數(shù)信號(hào)DATA,該保真度指示參數(shù)信號(hào)DATA指示例如量化水平、幀類型、GOP位置和其他有關(guān)該壓縮的視頻輸入流端內(nèi)的視頻幀的信息。任選地,該控制器230接收該壓縮的視頻流V1。另外,控制器230任選地接收指示在源(即在編碼器)分給該壓縮的視頻信息流IN的誤差的一信號(hào)SOURCE ERROR。
控制器230處理該保真度指示參數(shù)信號(hào)DATA,及任選地,該解壓的視頻流V1以確定與包括該壓縮的視頻信息流IN的一或多個(gè)GOP內(nèi)的一或多個(gè)圖象幀或圖象幀類型相關(guān)聯(lián)的視覺(jué)保真度衰減的水平。
控制器230然后確定圖象幀或圖象幀類型衰減的水平中的變化是否使得可能通過(guò)一后續(xù)顯示的解壓的視頻流V1而生成一喘息污跡。如果被識(shí)別的衰減變化可能會(huì)生成一喘息污跡(例如超出一閾值差水平),則控制器230計(jì)算一或多個(gè)衰減均衡參數(shù),這些衰減均衡參數(shù)然后被傳送給視頻處理器作為衰減控制信號(hào)C。下面將參照?qǐng)D3詳細(xì)描述控制器230的工作。
在圖2的MPEG類解碼器200的示例性實(shí)施例中,視頻解碼器210包括一輸入緩沖存儲(chǔ)器模塊211、一可變長(zhǎng)度解碼器(VLD)模塊212、一反量化器(IQ)模塊213、一反離散余弦變換(IDCT)模塊214、一求和器215、一運(yùn)動(dòng)補(bǔ)償模塊216、一輸出緩沖器模塊218和一錨幀存儲(chǔ)器模塊217。
該輸入緩沖存儲(chǔ)器模塊211接收從一傳送信號(hào)分離器/解碼器電路(未示出)輸出的壓縮的視頻流IN,說(shuō)明性地為代表例如高清晰度電視信號(hào)(HDTV)或標(biāo)準(zhǔn)清晰度電視信號(hào)(SDTV)的一可變長(zhǎng)度編碼的位流。該輸入緩沖存儲(chǔ)器模塊211被用于臨時(shí)地存儲(chǔ)接收的壓縮的視頻流IN直至可變長(zhǎng)度解碼器模塊212準(zhǔn)備接受該視頻數(shù)據(jù)進(jìn)行處理。VLD212具有耦合至輸入緩沖存儲(chǔ)器模塊211的數(shù)據(jù)輸出的一輸入,以抽取例如存儲(chǔ)的可變長(zhǎng)度編碼的視頻數(shù)據(jù)作為數(shù)據(jù)流S1。
VLD212解碼該抽取的數(shù)據(jù)以生成一恒定長(zhǎng)度位流S2,該位流S2包括量化的預(yù)測(cè)誤差DCT系數(shù)和一運(yùn)動(dòng)矢量流MV。該IQ模塊213對(duì)該恒定長(zhǎng)度位流S2進(jìn)行一反量化操作以生成一位流S3,該位流S3包括標(biāo)準(zhǔn)形式的量化的預(yù)測(cè)誤差系數(shù)。IDCT模塊214對(duì)位流S3執(zhí)行一反離散余弦變換操作以生成一位流S4,該位流S4包括逐象素預(yù)測(cè)誤差。這些預(yù)測(cè)誤差(和相關(guān)聯(lián)的圖象衰減)是由象素信息的編碼器側(cè)量化引起的,如上參照?qǐng)D1C所討論的。
求和器215將該逐象素預(yù)測(cè)誤差S4加至由運(yùn)動(dòng)補(bǔ)償模塊216生成的一運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)的象素值流S6。該運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)的象素值流S6將包括一預(yù)測(cè)誤差分量(和相關(guān)聯(lián)的銳度衰減),該預(yù)測(cè)誤差分量與用于生成當(dāng)前象素值的先前預(yù)測(cè)的數(shù)目有關(guān),如以上參照?qǐng)D1A-1B所討論的。這樣,在該示例性實(shí)施例中,求和器215的輸出是一視頻流S5,該視頻流S5包括通過(guò)量化誤差及通過(guò)累積預(yù)測(cè)誤差(以上參照?qǐng)D1A-1C所討論的)被衰減的重構(gòu)的象素值。
由求和器215生成的視頻流S5(包括量化和預(yù)測(cè)誤差)被傳送給錨幀存儲(chǔ)器模塊217和輸出緩沖器模塊218。該錨幀存儲(chǔ)器模塊217由運(yùn)動(dòng)補(bǔ)償模塊216經(jīng)信號(hào)路徑S7進(jìn)行訪問(wèn)。運(yùn)動(dòng)補(bǔ)償模塊216利用一或多個(gè)存儲(chǔ)的錨幀(例如在求和器215的輸出端生成的視頻的I幀或P幀最后幀),和從VLD212接收的運(yùn)動(dòng)矢量信號(hào)MV,以計(jì)算用于運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)的象素值流S6的值。
上述的視頻解碼器210還生成一指示例如量化水平、幀類型、GOP位置和該壓縮的視頻輸入流端內(nèi)的其他有關(guān)視頻幀的信息的保真度指示參數(shù)信號(hào)DATA。具體地,這些和其他保真度指示參數(shù)通過(guò)VLD212以一標(biāo)準(zhǔn)方式被從壓縮的視頻信息流IN中抽取。例如,如果該壓縮的視頻信息流IN包括一MPEG視頻流,該VLD212檢查在一或多個(gè)視頻序列頭部、GOP頭部、圖象頭部、片頭部和宏塊頭部中包含的信息。該抽取的信息被傳送給控制器230作為保真度指示參數(shù)信號(hào)DATA。
在圖2的MPEG類解碼器200的示例性實(shí)施例中,控制器230包括一微處理器234以及用于存儲(chǔ)一衰減均衡例程300、一量化均衡例程400、和一頻率均衡例程500中的至少之一的存儲(chǔ)器238。這些例程的工作在下將參照?qǐng)D3-5進(jìn)行詳細(xì)描述。微處理器234與常規(guī)的支持電路236例如電源、時(shí)鐘電路、超高速緩沖存儲(chǔ)器等以及幫助執(zhí)行這些軟件例程的電路相合作。這樣,打算在此討論作為軟件處理的一些處理步驟可在硬件,例如與微處理器234合作以執(zhí)行各種步驟的電路內(nèi)實(shí)現(xiàn)??刂破?30還包含在微處理器234、視頻解碼器210和視頻處理器220之間形成一接口的輸入/輸出電路232。盡管控制器230說(shuō)明性地為一通用計(jì)算機(jī),被編程以執(zhí)行根據(jù)本發(fā)明的特定的控制功能,本發(fā)明可用例如專用集成電路(ASIC)的硬件被實(shí)現(xiàn)。而且,控制器230可被功能性地與視頻處理器220及視頻解碼器210之一或兩者相組合。實(shí)際上,本發(fā)明人期望基本上包含圖2的MPEG類解碼器200的所有功能的一單個(gè)集成電路被實(shí)現(xiàn)作為一單個(gè)集成電路。
圖3示出了根據(jù)本發(fā)明的用于減少視頻信號(hào)中的喘息污跡的一衰減均衡例程300。該衰減均衡例程300可被實(shí)現(xiàn)作為該控制器230內(nèi)的一控制例程,或在控制器230不包括如上所述的一通用計(jì)算裝置的情況下,該衰減均衡例程300可被實(shí)現(xiàn)作為圖2的MPEG類解碼器200的合作模塊之間的一邏輯函數(shù)(1ogical function)。當(dāng)例如圖2的視頻解碼器210開(kāi)始接收壓縮的視頻信息流IN時(shí),該衰減均衡例程300在步驟302開(kāi)始,然后進(jìn)到步驟304。
在步驟304,接收的視頻幀或視頻幀種相對(duì)衰減的水平被確定。通過(guò)估算與各視頻幀或視頻幀類型相關(guān)聯(lián)的一或多個(gè)參數(shù)來(lái)確定這些相對(duì)衰減的水平。具體地,一或多個(gè)各種圖象或視頻幀參數(shù)例如幀量化水平(例如幀宏塊的平均)、幀類型、GOP內(nèi)的幀位置、幀譜等可被分析以確定與一具體幀相關(guān)聯(lián)的衰減的水平。然后將該與一具體視頻或圖象幀相關(guān)聯(lián)的衰減的水平與例如一額定或平均衰減的水平相比較,該額定或平均衰減的水平與包括一GOP的這些幀或包括一GOP的這些幀的一子組相關(guān)聯(lián)。以此方式,自一GOP或子GOP平均值的一具體幀的衰減變化被確定。然后例程300進(jìn)到步驟306。
在步驟306,在步驟304估算的一些或所有這些幀的衰減的水平和/或衰減變化被用于計(jì)算該GOP中的一或多個(gè)幀的一或多個(gè)衰減均衡參數(shù)。例如,具有相對(duì)高保真度(即相對(duì)低衰減)的該GOP內(nèi)的這些幀根據(jù)在步驟304分析的一或多個(gè)幀參數(shù)而被衰減以使該GOP內(nèi)的幀間保真度衰減的變化被限定至在導(dǎo)致明顯喘息污跡的水平或該水平之下。然后,例程300進(jìn)到步驟308。
在步驟308,在步驟306計(jì)算的衰減均衡參數(shù)被提供給該GOP結(jié)構(gòu)內(nèi)的一或多個(gè)適當(dāng)?shù)膸允乖揋OP結(jié)構(gòu)內(nèi)的幀間衰減變化得到適當(dāng)?shù)南拗?。由于衰減一視頻或圖象幀的保真度通常是更容易的(根據(jù)處理復(fù)雜性等),適當(dāng)?shù)膸ǔň哂邢鄬?duì)高保真度水平的這些幀。然而,在一保真度參數(shù)對(duì)增強(qiáng)敏感的情況下,適當(dāng)?shù)膸砂ň哂邢鄬?duì)低保真度水平的那些幀。然后例程300進(jìn)到步驟310。
在步驟310,詢問(wèn)是否有更多的幀將被處理。如果步驟310的詢問(wèn)得到肯定的答復(fù),則例程300進(jìn)到步驟304。如果步驟310的查詢得到否定的答復(fù),則例程300進(jìn)到步驟312并退出。
將注意到用于均衡衰減的水平的一技術(shù)將還衰減一或多個(gè)相對(duì)高保真度視頻或圖象幀或幀類型。本發(fā)明人還確定例如一GOP內(nèi)的一I幀的保真度的降低與通過(guò)本發(fā)明的操作被有效減少或去除的喘息污跡相比是相對(duì)不太明顯的。這樣,結(jié)果根據(jù)移位或選擇地減少一GOP或GOF的一或多個(gè)幀內(nèi)的視覺(jué)、聽(tīng)覺(jué)或其他信息保真度而進(jìn)行折衷,得到的處理的信息流(例如視頻輸出流OUT)給信息消費(fèi)者提供了優(yōu)越的顯示。
本發(fā)明打算使用一或多種用于確定衰減的水平(步驟304)、計(jì)算衰減均衡參數(shù)(步驟306)并提供衰減均衡參數(shù)(步驟308)的方法。具體地,在本發(fā)明的一實(shí)施例中,圖3的衰減均衡例程300被采用以將一GOP內(nèi)的幀間量化水平的變化減小到基本上一閾值量化變化水平。該量化均衡實(shí)施例特別適合于減少與不同種視頻或圖象幀(即I幀、P幀或B幀)之間的量化水平變化有關(guān)的喘息污跡,且以下參照?qǐng)D4描述該量化均衡實(shí)施例。
在本發(fā)明的另一實(shí)施例中,圖3的衰減均衡例程300被采用以將一GOP內(nèi)的頻域內(nèi)的幀間變化降至一閾值譜變化水平之下。該頻率響應(yīng)均衡實(shí)施例特別適合于減少由于運(yùn)動(dòng)估算誤差的傳播,與分配給預(yù)測(cè)的視頻或圖象幀(即P幀或B幀)的低通濾波(即降低圖象銳度)有關(guān)的喘息污跡,且在以下將參照?qǐng)D5描述該頻率響應(yīng)均衡實(shí)施例。
第一種方法包括檢查與各編碼的視頻幀相關(guān)聯(lián)的一量化水平參數(shù)。通常,例如MPEG視頻解碼器的一視頻解碼器生成一GOP結(jié)構(gòu),該GOP結(jié)構(gòu)具有一相對(duì)高保真度I幀及后隨的一或多個(gè)降低保真度的P幀和B幀。重要地是編碼在一高保真度水平的一GOP結(jié)構(gòu)的初始I幀,因?yàn)樵搸挥糜陬A(yù)測(cè)該GOP結(jié)構(gòu)內(nèi)的后續(xù)幀。這樣,該編碼器中的量化器通常使用一細(xì)量化水平。由于P幀被用作為一GOP結(jié)構(gòu)內(nèi)的錨幀(即P幀被使用以預(yù)測(cè)后繼P幀和緊接后續(xù)和先前的B幀),在通常比用于B幀的水平更細(xì)的一水平量化這些P幀。如先前所指出的,一GOP內(nèi)的量化水平的變化對(duì)不期望的喘息污跡起到貢獻(xiàn)的作用。這樣,為均衡一GOP結(jié)構(gòu)內(nèi)的量化水平,需要提高例如一GOP內(nèi)的該I幀和/或一或多個(gè)P幀的有效量化水平?,F(xiàn)將參照?qǐng)D4描述量化衰減均衡的一例子。
圖4示出了根據(jù)本發(fā)明的一衰減均衡例程400。具體地,圖4的衰減均衡例程400被引向減少與一GOP內(nèi)的一I幀和該GOP內(nèi)的多個(gè)B幀之間的量化水平變化有關(guān)的一視頻信號(hào)中的喘息污跡。例程400適應(yīng)一GOP結(jié)構(gòu)內(nèi)的量化水平以使一GOP內(nèi)的一I幀的保真度被降低到一閾值保真度水平(說(shuō)明性地該GOP內(nèi)的多個(gè)B幀的平均保真度水平)內(nèi)。該衰減均衡例程400可被實(shí)現(xiàn)為控制器230內(nèi)的一控制例程,或在控制器230不包括如圖所示的一通用計(jì)算機(jī)的情況下,被實(shí)現(xiàn)為圖2的MPEG類解碼器200的合作模塊之間的一邏輯函數(shù)。
當(dāng)例如圖2的視頻解碼器210開(kāi)始接收該壓縮的視頻信息流IN時(shí),在步驟402開(kāi)始該衰減均衡例程400。然后例程400進(jìn)到步驟404。
在步驟404,通過(guò)例如平均正被處理的GOP中的一I幀(Qi)內(nèi)的各宏塊的量化水平,來(lái)確定與該I幀相關(guān)聯(lián)的一量化參數(shù)。另外,通過(guò)例如平均正被處理的GOP中的一或多個(gè)B幀(QB)內(nèi)的各宏塊的量化水平,來(lái)確定與這些B幀相關(guān)聯(lián)的一量化參數(shù)??上鄬?duì)于例如MPEG可變量化器標(biāo)度(scale)進(jìn)行該確定,該MPEG可變量化器標(biāo)度可在一MPEG依從視頻流的片層頭部中被發(fā)現(xiàn)且具有1和31之間的一正數(shù)值(假定使用例如確省表的一恒定量化器表)。必須注意該量化器_標(biāo)度在宏塊層也是可調(diào)整的。
例程400然后進(jìn)到步驟406,查詢與B幀QB相關(guān)聯(lián)的量化參數(shù)是否大于與I幀Qi相關(guān)聯(lián)的量化參數(shù)加上一量化參數(shù)閾值量QTH的和,該量化參數(shù)閾值水平QTH代表不導(dǎo)致明顯的歸因于量化差的喘息污跡的,在B幀量化參數(shù)QB和I幀量化參數(shù)QI之間的一最大量化參數(shù)偏差。
如果對(duì)步驟406的查詢的答復(fù)是肯定的,例程400進(jìn)到步驟408。如果對(duì)步驟406的答復(fù)是否定的,例程400進(jìn)到步驟414,查詢是否有更多的幀需要被處理。如果對(duì)步驟414的查詢的答復(fù)是肯定的,例程400進(jìn)到步驟404。如果對(duì)步驟414的答復(fù)是否定的,例程400進(jìn)到步驟416并退出。
在步驟408,該I幀和這些B幀內(nèi)的噪聲被表征。也就是說(shuō),相對(duì)于生成一噪聲分布的量化水平(即步長(zhǎng))確定期望在具有量化參數(shù)QI的一I幀和在具有一量化參數(shù)QB的一B幀內(nèi)被發(fā)現(xiàn)的噪聲量。
一種用于確定期望在一B幀被發(fā)現(xiàn)的附加噪聲量的方法是通過(guò)估算這些B幀DCT系數(shù)的量化的AC系數(shù)的功率密度函數(shù)(pdf),且然后減去用于基準(zhǔn)幀(例如由運(yùn)動(dòng)補(bǔ)償模塊使用的錨幀)的一類似獲得的pdf。在該示例性實(shí)施例中,對(duì)于該DCT內(nèi)的63個(gè)AC系數(shù)的各個(gè)保持一pdf。由于拉普拉斯分布是用于一AC系數(shù)的實(shí)際pdf的一良好近似,該示例性實(shí)施例使用這樣的拉普拉斯分布作為用于適配該數(shù)據(jù)的較佳的pdf。然而,本領(lǐng)域的熟練技術(shù)人員將認(rèn)識(shí)到在實(shí)踐本發(fā)明中也可使用其他的分布函數(shù)。而且,幾種方法之一可被使用以使該數(shù)據(jù)適合下述的拉普拉斯pdf。
如公式1所說(shuō)明的,如果該pdf是被估算的pdf時(shí),通過(guò)計(jì)算使各量化水平的實(shí)際概率(自接收的數(shù)據(jù)計(jì)算得到的)和該量化水平的概率之間的差最小化的α,來(lái)估算該pdf(即pdf(x))。 也就是說(shuō),如公式2所說(shuō)明的,相對(duì)于α進(jìn)行最小化,其中對(duì)所有的量化倉(cāng)(bin)B求和,p(Bi)是接收的信號(hào)中的該倉(cāng)的相對(duì)頻率,Bilow和Bihigh是該量化倉(cāng)的下限和上限(即將被量化成該值的最低值和最高值) 假定原始的(未量化的)pdf跟隨該估算的分布,通過(guò)加上用于各量化倉(cāng)的原始的和重建的水平之間的差的pdf來(lái)計(jì)算該誤差的pdf,如公式3中所說(shuō)明的。 其中 其中rec(Bi)是用于倉(cāng)Bi的重建水平。然后將誤差pdf與一用于基準(zhǔn)幀的(類似獲得的)誤差pdf相比較,并將一適當(dāng)?shù)脑肼暳考又猎摰驮肼晭詼p少喘息污跡。被加上的噪聲將具有一類似(更小)的變化,且還可具有與誤差pdf相同的pdf。
在步驟410,根據(jù)與I幀QI相關(guān)聯(lián)的量化參數(shù),步驟408的表征的B幀噪聲被縮放到一適當(dāng)?shù)乃健R簿褪钦f(shuō),根據(jù)比例QB/OI縮放先前確定的pdf以生成一縮放的pdf。
然后例程400進(jìn)到步驟412,將縮放的表征噪聲注入該I幀。在本發(fā)明的一實(shí)施例中,該噪聲的注入是通過(guò)注入一隨機(jī)數(shù)而實(shí)現(xiàn)的,該隨機(jī)數(shù)是由步驟410確定的該被縮放的量化水平所限界的。以這種方式,與該I幀相關(guān)聯(lián)的有效量化參數(shù)QI被減小到具有與B幀QB相關(guān)聯(lián)的量化參數(shù)的QTH內(nèi)的一值的一量化參數(shù)。
必須注意圖4的例程400可被采用以同時(shí)或單獨(dú)地定址(address)I幀和P幀及P幀和B幀之間的量化水平變化。而且,盡管例程400被示出為在各GOP上單獨(dú)地進(jìn)行,發(fā)明人打算例程400可被修改以在多個(gè)GOP上進(jìn)行。例如,在一恒定位率壓縮的視頻流IN的情況下,用于由一編碼器形成的各GOP的平均位預(yù)算基本上是相同的。然而,在可變位率信息流的情況下,當(dāng)或多或少的帶寬變得可由編碼器使用時(shí),用于由該編碼器形成的各GOP的位預(yù)算可改變。在可變位率的情況下,一附加變量被使用以確保一GOP的平均量化參數(shù)(QGOP)不從一或多個(gè)先前及后繼的GOP的平均量化參數(shù)改變多過(guò)一閾值量。
圖5示出了根據(jù)本發(fā)明的一GOP均衡例程的流程圖。具體地,圖5的GOP均衡例程500被引向減少由一GOP內(nèi)的預(yù)測(cè)幀的后繼半象素內(nèi)插引起的視頻信號(hào)中的喘息污跡。
當(dāng)例如圖2的視頻解碼器210開(kāi)始接收壓縮的視頻信息流IN時(shí),例程500在步驟502開(kāi)始。例程500然后進(jìn)到步驟504,使用該GOP結(jié)構(gòu)確定一銳度函數(shù)。也就是說(shuō),根據(jù)該GOP內(nèi)的幀類型和該GOP內(nèi)的幀數(shù)目作出傳播的圖象銳度的衰減的估算。例如,由于半象素內(nèi)插(因?yàn)槲醋鞒鲱A(yù)測(cè)),包括所有I幀的一GOP將不承受銳度衰減。類似地,由于半象素內(nèi)插,包括一單個(gè)I幀及后隨的多個(gè)P幀和B幀的一GOP將承受一些水平的銳度衰減。在步驟504確定的銳度函數(shù)是作為該GOP內(nèi)的幀位置和/或幀種一函數(shù)的這樣銳度衰減的量的一估算。例程500然后進(jìn)到步驟506。
在步驟506,計(jì)算均衡濾波參數(shù)。這些均衡濾波參數(shù)包括與該GOP內(nèi)的一或多個(gè)幀相關(guān)聯(lián)的低通濾波和/或高通濾波參數(shù)。也就是說(shuō),選擇一基線水平的銳度(例如,該GOP內(nèi)的如由最嚴(yán)重銳度衰減的幀所確定的一最小銳度水平,由所有幀的一平均銳度水平確定的一中間銳度水平,或一特定幀類型等)。根據(jù)該幀的位置和/或幀類型確定用于該GOP內(nèi)的各幀的均衡濾波參數(shù),以使該GOP內(nèi)的幀間的銳度的相對(duì)差異被減小到低于一閾值水平,如先前參照?qǐng)D1所描述的。然后例程500進(jìn)到步驟508。
在步驟508,計(jì)算的均衡濾波參數(shù)被使用以在需要時(shí)均衡該GOP內(nèi)的一或多個(gè)幀。然后例程500進(jìn)到步驟510,查詢是否有附加的GOP將被處理。如果對(duì)步驟510的查詢的答復(fù)是否定的,例程500進(jìn)到步驟512并退出。如果對(duì)步驟510的查詢的答復(fù)是肯定的,例程500進(jìn)到步驟504,計(jì)算與下一GOP相關(guān)的一銳度函數(shù)。在一固定的GOP結(jié)構(gòu)的情況下,在步驟504確定的銳度函數(shù)和在步驟506計(jì)算的均衡濾波參數(shù)可被再使用以用于各后續(xù)GOP。
在本發(fā)明的一實(shí)施例中,“訓(xùn)練序列(training sequence)”被利用以表征由解碼器自身分配給一序列解碼的圖象的誤差。例如,如果由一已知的因素(例如,通過(guò)接收機(jī)或解碼器內(nèi)的運(yùn)動(dòng)內(nèi)插濾波器)引入在一解碼的GOP內(nèi)的一失真,計(jì)算一預(yù)加重濾波系數(shù)(filter)以對(duì)該已知的因素進(jìn)行補(bǔ)償。為識(shí)別該失真,利用一譜分析函數(shù)。也就是說(shuō),包括一或多個(gè)“普通的”解碼的視頻幀的一訓(xùn)練序列的實(shí)際譜特性被與一“期望的”譜特性相比較。然后根據(jù)從該訓(xùn)練序列獲得的濾波系數(shù)對(duì)后續(xù)解碼的視頻幀的譜特性進(jìn)行“校正”。應(yīng)注意可相對(duì)于一第二解碼器確定該“期望的”譜特性。
該譜校正濾波系數(shù)的傳遞函數(shù)被確定為期望的譜和實(shí)際的譜的比例作為一頻率函數(shù)。這是期望的該信號(hào)的頻率響應(yīng)。該濾波系數(shù)可被實(shí)現(xiàn)作為例如一有限脈沖響應(yīng)(FIR)或無(wú)限脈沖響應(yīng)(IIR)濾波系數(shù)。例如,在本發(fā)明的一實(shí)施例中,基本上滿足確定的傳遞函數(shù)的一FIR濾波系數(shù)的系數(shù)被計(jì)算、反轉(zhuǎn)及開(kāi)窗到一期望的抽頭數(shù)。得到的FIR濾波系數(shù)被使用以處理各解碼的幀以使解碼的幀的譜特性接近先前描述的“期望的”譜特性,從而均衡該解碼的視頻輸出信號(hào)。
圖6給出了根據(jù)本發(fā)明的一衰減均衡例程600的流程圖。具體地,圖6的衰減均衡例程600被引向減少由例如解碼器自身內(nèi)的異常所分配給一序列解碼的圖象的污跡。該例程首先使用一訓(xùn)練序列表征該解碼器。該訓(xùn)練序列包括編碼的圖象的一“金碼(Gold code)”序列,它們已經(jīng)使用一“已知的良好的(known good)”解碼器被先前處理以生成具有一相關(guān)聯(lián)的譜特性的輸出圖象序列。該已知的良好解碼的金碼的該相關(guān)聯(lián)的譜特性被標(biāo)注為一“期望的譜(expectedspectrum)”。
例程600在步驟602開(kāi)始,并進(jìn)到步驟604,運(yùn)行一訓(xùn)練序列。該訓(xùn)練序列的運(yùn)行包括施加給該已知的“金碼”序列的編碼的圖象(例如一MPEG類壓縮的視頻信息流)的解碼器輸入端(經(jīng)例如一開(kāi)關(guān)或多路復(fù)用單元)以使生成一解碼的訓(xùn)練信息流。例程600然后進(jìn)到步驟606,該解碼的訓(xùn)練信息流被譜分析以生成一訓(xùn)練序列譜。例程600然后進(jìn)到步驟608。
在步驟608,在步驟606計(jì)算的該訓(xùn)練序列譜被與該期望的譜(即如由一已知的良好解碼器生成的先前計(jì)算的該“金碼”視頻訓(xùn)練序列的譜)。由于,廣義上說(shuō),該訓(xùn)練序列譜和該期望的譜之間的差主要是由解碼器性能中的差異引起的,由該解碼器引入該解碼的視頻信息流的譜異??杀慌c根據(jù)半象素內(nèi)插引入該解碼的視頻流的譜異常、或其他的非解碼器誤差源隔離。例程600然后進(jìn)到步驟610。
在步驟610,查詢待被解碼的該視頻信息流的GOP結(jié)構(gòu)是否是已知的(即非訓(xùn)練壓縮的視頻序列)。如果對(duì)步驟610的查詢的答復(fù)是肯定的,則例程600進(jìn)到步驟612,根據(jù)該訓(xùn)練序列GOP和來(lái)自待被解碼的該壓縮的視頻信息流的一譜分析的GOP之間的譜變化,計(jì)算一GOP均衡濾波系數(shù)。也就是說(shuō),該“金碼”GOP和接收的GOP之間的譜差異被比較且使用以計(jì)算一均衡濾波系數(shù)以使這些GOP之間的譜差異被減小到低于一閾值水平的水平。例程600然后進(jìn)到步驟614,該計(jì)算的GOP均衡濾波系數(shù)被施加給該接收的GOP。
例程600然后進(jìn)到步驟616,查詢是否有更多的GOP將被處理。如果對(duì)步驟616的查詢的答復(fù)是肯定的,例程600進(jìn)到步驟614,將計(jì)算的濾波系數(shù)施加給下一GOP。任選地,例程600可進(jìn)到步驟612,對(duì)待被處理的下一GOP執(zhí)行譜分析和比較功能,導(dǎo)致計(jì)算一新的GOP均衡濾波系數(shù)計(jì)算。如果對(duì)在步驟616的查詢的答復(fù)是否定的,例程600進(jìn)到步驟618并退出。
如果對(duì)在步驟610的查詢的答復(fù)是否定的,例程600進(jìn)到步驟620,該“金碼”訓(xùn)練序列和接收的壓縮的視頻信息流內(nèi)的幀類型之間的譜變化被作出。也就是說(shuō),例如該金碼訓(xùn)練序列內(nèi)的P幀和接收的視頻信息流內(nèi)的P幀之間的譜變化被比較。類似地,I幀和B幀之間的譜差異也被比較。例程600然后進(jìn)到步驟622。
在步驟622,基于幀譜變化的一或多個(gè)幀類型均衡濾波系數(shù)被計(jì)算。也就是說(shuō),例如該金碼訓(xùn)練序列的P幀和接收的信息流的P幀之間的譜變化被使用以計(jì)算一均衡濾波系數(shù),然后將該均衡濾波系數(shù)提供給該接收的信息流內(nèi)的P幀,將該譜變化減小到低于一閾值水平。對(duì)于一具體幀所作的濾波系數(shù)選擇還涉及該GOP內(nèi)的該具體幀之前的I幀和P幀數(shù)目。例如,由于當(dāng)一預(yù)測(cè)誤差被傳播給一GOP內(nèi)的后面的幀時(shí),一預(yù)測(cè)誤差的數(shù)值增大,該用于該GOP內(nèi)的后面的幀的濾波系數(shù)被選擇以將一對(duì)應(yīng)的更大的變化量分配給該基礎(chǔ)信號(hào)。例程600然后進(jìn)到步驟624。
在步驟624,在步驟622計(jì)算的這些幀類型濾波系數(shù)被提供給一接收的GOP內(nèi)的各適當(dāng)?shù)膸?。例?00然后進(jìn)到步驟626,查詢是否有更多的幀將被處理。如果對(duì)在步驟626的查詢的答復(fù)是否定的,則例程600進(jìn)到步驟630并退出。如果對(duì)在步驟626的查詢的答復(fù)是肯定的,則例程600進(jìn)到步驟628,選擇下一幀進(jìn)行處理,并進(jìn)到步驟624,根據(jù)在步驟622計(jì)算的適當(dāng)?shù)膸愋蜑V波系數(shù)對(duì)該選擇的幀進(jìn)行濾波。也就是說(shuō),根據(jù)如先前在步驟622計(jì)算的一I幀譜均衡濾波系數(shù)、一P幀譜均衡濾波系數(shù)或一B幀譜均衡濾波系數(shù)對(duì)被選擇的下一幀(即一I幀、P幀或B幀)進(jìn)行濾波。
本發(fā)明的上述實(shí)施例被引向具有充足存儲(chǔ)器資源的解碼器以存儲(chǔ)一整個(gè)GOP進(jìn)行處理。然而,當(dāng)存儲(chǔ)器限制防止一整個(gè)GOP的存儲(chǔ)和處理時(shí),本發(fā)明人打算幾種用于減少上述喘息污跡的方法。
在根據(jù)本發(fā)明的且指向存儲(chǔ)器限定的解碼器的第一種方法中,該GOP內(nèi)的一單個(gè)幀被選擇作為“保真度基準(zhǔn)”幀。該GOP內(nèi)的其他幀根據(jù)需要被衰減或增強(qiáng)以符合該保真度基準(zhǔn)幀的一閾值水平內(nèi)的一保真度水平。該方法將在以下參照?qǐng)D7被進(jìn)行詳細(xì)描述。
在根據(jù)本發(fā)明的且指向存儲(chǔ)器限定的解碼器的第二種方法中,先前解碼的GOP的特性被使用以適合一當(dāng)前正被解碼的GOP。也就是說(shuō),當(dāng)?shù)谝籊OP被處理時(shí),該第一GOP的特性被確定且被存儲(chǔ)。例如,該GOP結(jié)構(gòu)自身、該GOP內(nèi)利用的量化水平和其他這樣的與保真度有關(guān)的參數(shù)被存儲(chǔ)。以利用相對(duì)于第一GOP確定的該些存儲(chǔ)的參數(shù)的方式處理跟隨第一GOP的第二GOP。由于這些參數(shù)通常在例如包括代表一公共景色的圖象的GOP之間不會(huì)有大的變化,這些假設(shè)是有用的。而且,即使在景色變化的情況下,第一景色的最后GOP與第二景色的第一GOP之間的任何保真度差異從實(shí)際的景色變化看將是不顯著的(即由景色變化導(dǎo)致的大的視覺(jué)不連續(xù)性將傾向于掩蔽由于非精確GOP參數(shù)預(yù)測(cè)導(dǎo)致的任何喘息污跡)。根據(jù)本發(fā)明的且指向在儲(chǔ)器限定的解碼器的這些方法具有這樣一優(yōu)點(diǎn)在解碼一GOP之前不需要等候該整個(gè)GOP被接收。
圖7示出了根據(jù)本發(fā)明且適合于減少一存儲(chǔ)器限定的解碼器的上下文內(nèi)的喘息污跡的衰減均衡例程700的流程圖。當(dāng)例如圖2的視頻解碼器210開(kāi)始接收壓縮的視頻信息流IN時(shí),例程700在步驟702開(kāi)始。然后例程700進(jìn)到步驟704,該GOP的一部分被存儲(chǔ)在存儲(chǔ)器中。具體地,包括有至少一預(yù)定的基準(zhǔn)幀(例如一初始I幀后的第一錨幀)的該GOP的一部分被存儲(chǔ)在存儲(chǔ)器中??商鎿Q地,僅該預(yù)定的基準(zhǔn)幀被存儲(chǔ)在存儲(chǔ)器中。然后例程700進(jìn)到步驟706。
在步驟706,通過(guò)注明例如量化步長(zhǎng)、該GOP內(nèi)的位置、幀類型和其他參數(shù)而以上述的方式將該存儲(chǔ)的基準(zhǔn)幀表征。該基準(zhǔn)幀表征導(dǎo)致該GOP內(nèi)的其他幀將被增強(qiáng)和/或衰減以實(shí)現(xiàn)的一近似基線水平的保真度。也就是說(shuō),在一I幀具有顯著高于所選擇的基準(zhǔn)幀的保真度的情況下,將以多少衰減其保真度以使該I幀和該選擇的基準(zhǔn)幀之間的保真度差異被降低到一閾值水平之下的方式對(duì)該I幀進(jìn)行處理。類似地,如果該選擇的基準(zhǔn)幀的保真度水平明顯地高于例如該GOP內(nèi)的一或多個(gè)B幀,將一傾向于導(dǎo)致保真度的顯然提高的方式對(duì)這些B幀進(jìn)行濾波。例如,這些B幀將被高頻增強(qiáng)以幫助偏移由該解碼器內(nèi)的半象素內(nèi)插所引起的一低通濾波。然后例程700進(jìn)到步驟708。
在步驟708,根據(jù)該基準(zhǔn)幀的這些表征參數(shù)對(duì)該GOP內(nèi)的這些幀進(jìn)行處理。具體地,在步驟708中,根據(jù)在步驟706確定的該基準(zhǔn)幀特性,任何存儲(chǔ)的幀以及該基準(zhǔn)幀被選擇地增強(qiáng)或衰減。然后例程700進(jìn)到步驟710,查詢?cè)揋OP內(nèi)是否還有更多的幀將被處理。
如果對(duì)在步驟710的查詢的答復(fù)是肯定的,例程700進(jìn)到步驟716,根據(jù)在步驟706確定的該基準(zhǔn)幀特性對(duì)該GOP內(nèi)的下一幀進(jìn)行處理。然后例程700進(jìn)到步驟710。
如果對(duì)在步驟710的查詢的答復(fù)是否定的,則例程700進(jìn)到步驟712,查詢是否有更多的GOP將被處理。如果對(duì)在步驟712的查詢的答復(fù)是否定的,則例程700進(jìn)到步驟714并退出。如果對(duì)在步驟712的查詢的答復(fù)是肯定的,則例程700進(jìn)到步驟704,對(duì)下一GOP重復(fù)例程700。必須注意由于GOP到GOP的特性變化相對(duì)緩慢(除了例如景色切換),可任選地使用來(lái)自先前的GOP的表征的基準(zhǔn)幀對(duì)下一GOP進(jìn)行處理。
在本發(fā)明的另一實(shí)施例中,根據(jù)先前的GOP的一平均統(tǒng)計(jì)測(cè)量對(duì)各GOP進(jìn)行處理。也就是說(shuō),當(dāng)各GOP正被處理時(shí),使用一或多種上述技術(shù)對(duì)該GOP進(jìn)行表征。表征的結(jié)果被使用來(lái)處理下一GOP。以這種方式,所需的存儲(chǔ)器量大大降低。而且,由于潛在的GOP間保真度誤差將在一GOP內(nèi)被校正,如果有的話,在一景色的最后GOP和一后隨景色的第一GOP之間有很少的喘息污跡。
在本發(fā)明的另一實(shí)施例中,在逐塊的基礎(chǔ)上將誤差校正和/或均衡分配給被解碼的視頻流。有利地,塊水平處理提供了均衡處理的大大增強(qiáng)的控制。例如,高通濾波被適當(dāng)?shù)厥┘咏o使用幫助-象素(help-pel)內(nèi)插的塊,但不施加給具有整數(shù)運(yùn)動(dòng)矢量的塊。具有整數(shù)運(yùn)動(dòng)矢量的塊通常不包括先前討論的半象素誤差分量且因此不以先前討論的低通濾波方式被衰減,以使保證一均衡高通濾波。另外,逐塊處理提供了均衡處理的更大的控制以使例如該控制器可確保分配給一塊的均衡或校正永遠(yuǎn)不會(huì)超出該量化步長(zhǎng),從而避免將過(guò)分的失真引入得到的圖象。
最后,應(yīng)注意到如由解碼器解碼的該初始基準(zhǔn)幀的一“拷貝”可被存儲(chǔ)并使用作為一基準(zhǔn)以將滑移限制到期望的最大水平,例如一量化步長(zhǎng)(quantizer step)。
這樣,在本發(fā)明的一實(shí)施例中,通過(guò)將校正信息加至“初始”或“異?!被鶞?zhǔn)幀而形成一“增強(qiáng)的”基準(zhǔn)幀(即包括具有最大水平的保真度的塊的一基準(zhǔn)幀)。然后存儲(chǔ)該增強(qiáng)的基準(zhǔn)幀以及該初始基準(zhǔn)幀。每當(dāng)進(jìn)行一校正以避免喘息污跡時(shí),期望檢查該校正以使該校正自身不引入一新的污跡。這可通過(guò)當(dāng)計(jì)算該增強(qiáng)的基準(zhǔn)幀和該初始基準(zhǔn)幀之間的差的DCT時(shí),將該差限制到小于一量化步長(zhǎng)來(lái)實(shí)現(xiàn)。這樣,在本發(fā)明的一實(shí)施例中,該增強(qiáng)的基準(zhǔn)幀內(nèi)的一塊(即一“校正的”塊)和該初始幀內(nèi)的一對(duì)應(yīng)塊之間的差的DCT被計(jì)算。如果該差超出一閾值水平,說(shuō)明性地為一量化步長(zhǎng),則該初始?jí)K被使用或任選地,該校正的宏塊被再處理。另外,該控制分配給增強(qiáng)的塊的校正的處理被使用用于非基準(zhǔn)幀。
圖8示出了根據(jù)本發(fā)明的塊水平校正控制例程的流程圖。該例程800開(kāi)始于步驟802,并進(jìn)到步驟804,對(duì)一塊或宏塊進(jìn)行校正。然后例程800進(jìn)到步驟806,將該校正的宏塊或塊與一對(duì)應(yīng)的未校正的宏塊進(jìn)行比較,或生成一差別量。然后例程800進(jìn)到步驟808,對(duì)該校正的和未校正的宏塊或塊之間的該差執(zhí)行離散余弦變換(DCT)。然后例程800進(jìn)到步驟810,查詢?cè)诓襟E808執(zhí)行的DCT的量化步長(zhǎng)是否大于一。如果對(duì)在步驟810的查詢的答復(fù)是否定的,則例程800進(jìn)到步驟812并退出。如果對(duì)在步驟810的查詢的答復(fù)是肯定的,則例程800進(jìn)到步驟814,查詢?cè)搲K或宏塊是否應(yīng)被再處理。
如果對(duì)在步驟814的查詢的答復(fù)是肯定的,則例程800進(jìn)到步驟804,該塊或宏塊被再處理或被再校正。在步驟804的該再處理或再校正利用該DCT量化步長(zhǎng)的附加信息和在步驟808形成的DCT信息。
如果對(duì)在步驟814的查詢的答復(fù)是否定的,則例程800進(jìn)到步驟816,替代該校正的塊而使用未校正塊或宏塊。然后例程800進(jìn)到步驟812并退出。
本發(fā)明的另一基于塊的實(shí)施例類似于以上參照?qǐng)D3或圖4所述的實(shí)施例,除了相對(duì)于單獨(dú)的塊確定該相對(duì)衰減的水平外,且這些單獨(dú)的塊以尋址量化和/或半象素預(yù)測(cè)衰減的方式被處理。
本發(fā)明的另一基于塊的實(shí)施例類似于以上參照?qǐng)D7所述的實(shí)施例,除了這些塊被處理以符合例如一具體幀類型或GOP內(nèi)幀位置中的這些塊的平均保真度水平外。
在本發(fā)明的一實(shí)施例中,在一編碼器中計(jì)算該校正濾波系數(shù)并與編碼的視頻流一起傳送給解碼器。該校正濾波系數(shù)可包括一輔助流、一增強(qiáng)層流或被包括在一用戶數(shù)據(jù)區(qū)內(nèi)。該解碼器接收并利用該校正濾波系數(shù)數(shù)據(jù)以與類似于先前所述的方式濾波并增強(qiáng)該圖象。然而,由于在該實(shí)施例中,該編碼器負(fù)責(zé)計(jì)算一校正因子,該校正因子將會(huì)更加精確。應(yīng)注意到在解碼器不利用該編碼器提供的校正因子的情況下,校正量相對(duì)較小(盡管對(duì)于削弱喘息污跡是足夠的)且該非利用解碼器將仍能解碼接收的壓縮的視頻流。
本發(fā)明可以計(jì)算機(jī)執(zhí)行的處理的用于實(shí)現(xiàn)這些處理的設(shè)備的形式被具體化。本發(fā)明也可以配置在有形介質(zhì),例如軟盤。CD-ROM、硬盤驅(qū)動(dòng)器或任何其他計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì)中的計(jì)算機(jī)程序碼的形式被具體化,其中,當(dāng)該計(jì)算機(jī)程序碼通過(guò)計(jì)算機(jī)被裝載并被執(zhí)行時(shí),該計(jì)算機(jī)變成實(shí)現(xiàn)本發(fā)明的設(shè)備。本發(fā)明還可以例如存儲(chǔ)介質(zhì)中存儲(chǔ)的、或通過(guò)計(jì)算機(jī)裝載和/或執(zhí)行的、或在一些傳輸介質(zhì)上,例如在電線上或電纜上、通過(guò)光纖或經(jīng)過(guò)電磁輻射傳輸?shù)挠?jì)算機(jī)程序碼的形式被具體化,其中,當(dāng)該計(jì)算機(jī)程序碼通過(guò)計(jì)算機(jī)被裝載并被執(zhí)行時(shí),該計(jì)算機(jī)變成實(shí)現(xiàn)本發(fā)明的設(shè)備。當(dāng)在一通用微處理器上被實(shí)現(xiàn)時(shí),該計(jì)算機(jī)程序碼分段形成該微處理器以建立特定的邏輯回路。
盡管已詳細(xì)示出和描述了結(jié)合本發(fā)明的教義的各種實(shí)施例,本領(lǐng)域的熟練技術(shù)人員可容易地導(dǎo)出許多其他仍結(jié)合有本發(fā)明的教義的改變的實(shí)施例。
權(quán)利要求
1.在一種用于處理根據(jù)一圖象組(GOP)信息結(jié)構(gòu)配置的一序列壓縮的圖象的系統(tǒng)中,一種用于減少GOP間視覺(jué)污跡的方法,包括有步驟對(duì)于所述GOP信息結(jié)構(gòu)內(nèi)的第一種信息幀,確定一相應(yīng)的保真度衰減的水平(304);對(duì)于所述GOP信息結(jié)構(gòu)內(nèi)的第二種信息幀,確定一相應(yīng)的保真度衰減的水平(304);使用所述確定的保真度衰減的水平,計(jì)算一衰減均衡參數(shù)(306);使用所述計(jì)算的衰減均衡參數(shù),處理所述第一和第二種信息幀之一以使所述第一和第二種信息幀具有一預(yù)定范圍內(nèi)的保真度衰減的水平。
2.根據(jù)權(quán)利要求1的方法,其中所述第一種信息幀包括一內(nèi)部編碼的信息幀(I幀)和一正向預(yù)測(cè)的信息幀(P幀)之一,而所述第二種信息幀包括一預(yù)測(cè)編碼的信息幀(P幀或B幀)。
3.根據(jù)權(quán)利要求1的方法,其中所述保真度衰減的水平是相對(duì)于一量化水平而被確定的。
4.根據(jù)權(quán)利要求1的方法,其中所述第一種信息幀具有比第二種信息幀高的保真長(zhǎng)水平,且所述處理的步驟包括的步驟表征與所述第二種信息幀相關(guān)聯(lián)的一量化噪聲參數(shù)Q8(408);根據(jù)所述衰減均衡參數(shù),縮放所述表征的量化噪聲參數(shù)(410);及將近似所述縮放的量化噪聲參數(shù)的量化噪聲注入所述第一信息幀(412)。
5.根據(jù)權(quán)利要求1的方法,還包括有步驟對(duì)于所述GOP信息結(jié)構(gòu)內(nèi)的一第三種信息幀,確定一相應(yīng)的保真度衰減的水平;及使用所述計(jì)算的衰減均衡參數(shù),處理所述第三種信息幀以使所述第一、第二和第三種信息幀具有一預(yù)定范圍內(nèi)的保真度衰減的水平。
6.在一種用于解碼根據(jù)一圖象組(GOP)信息結(jié)構(gòu)配置的一序列壓縮的視頻信息幀的系統(tǒng)中,一種用于減少視覺(jué)污跡的方法,包括有步驟確定一GOP內(nèi)的多個(gè)所述壓縮的視頻信息幀的一相對(duì)保真度衰減的水平(304);使用所述確定的相對(duì)保真度衰減的水平,計(jì)算一保真度衰減均衡參數(shù)(306);及將所述計(jì)算的保真度衰減均衡參數(shù)提供給所述GOP內(nèi)的一或多個(gè)壓縮的視頻信息幀以使所述相對(duì)保真度衰減的水平被減小到一閾值水平。
7.根據(jù)權(quán)利要求6的方法,其中相對(duì)于一量化水平、一壓縮的視頻信息幀類型、所述GOP內(nèi)的所述壓縮的視頻信息幀的一相對(duì)位置、所述GOP內(nèi)的所述壓縮的視頻信息幀的一譜信息分布和所述GOP內(nèi)的所述壓縮的視頻信息幀的一銳度水平中的一個(gè),確定所述相對(duì)保真度衰減的水平。
8.根據(jù)權(quán)利要求6的方法,還包括有步驟將一譜信息分布與一期望的譜分布相比較(608);計(jì)算一譜分布均衡參數(shù)(622);及將所述譜分布均衡參數(shù)提供給所述GOP以使所述譜信息分布和所述期望的譜分布在一閾值水平內(nèi)。
9.在一種用于解碼根據(jù)一圖象組(GOP)信息結(jié)構(gòu)配置的一序列壓縮的視頻信息幀的系統(tǒng)中,一種設(shè)備包括一視頻解碼器(220),用于響應(yīng)于一控制信號(hào)(C)處理視頻信息幀(VI);及一控制器(230),用于響應(yīng)于所述視頻信息幀的保真度的標(biāo)記生成所述控制信號(hào);所述控制器確定(304)一GOP內(nèi)的多個(gè)所述壓縮的視頻信息幀的一相對(duì)保真度衰減的水平,并使用所述確定的相對(duì)保真度衰減的水平,計(jì)算(306)一保真度衰減均衡參數(shù);所述視頻處理器將所述計(jì)算的保真度衰減均衡參數(shù)提供給(308)一或多個(gè)視頻信息幀以使所述相對(duì)保真度衰減的水平被減小到一閾值水平。
10.根據(jù)權(quán)利要求9的設(shè)備,其中所述視頻處理器通過(guò)將量化噪聲注入所述相對(duì)高保真度視頻信息幀,減小所述相對(duì)高保真度視頻信息幀的保真度水平。
全文摘要
一種用于減少采用圖象組(GOP)或幀組(GOF)結(jié)構(gòu)的MPEG類視頻信息流中的喘息污跡的方法和設(shè)備。
文檔編號(hào)G06T3/40GK1301370SQ99805839
公開(kāi)日2001年6月27日 申請(qǐng)日期1999年5月7日 優(yōu)先權(quán)日1998年5月7日
發(fā)明者迪內(nèi)·阿豐索·費(fèi)雷拉·弗洛倫西奧, 李世鵬 申請(qǐng)人:薩爾諾夫公司, 摩托羅拉公司