專利名稱:運動估計設備和運動估計方法
技術領域:
本發明涉及一種運動估計設備和運動估計方法。更具體地說,本發明涉及一種最小化在文本區域中產生的運動誤差的運動估計設備和運動估計方法。
背景技術:
通常,在顯示設備中使用幀速率轉換器來轉換幀速率對顯示面板的時序(timing)調整、灰度表示等是有效的。為此,已經提出在幀速率轉換器和/或解交錯器中使用各個塊的運動向量估計和補償運動的方法,以顯示自然的運動圖像。然而,因為很難找到正確的運動向量,所以這種運動估計和補償方法在實際使用中具有局限性。
例如,由于文本自身具有許多相似的邊緣,因此當文本在運動背景中運動時,在運動背景中滾動文本在尋找其運動向量中有很大困難。
具體地說,由于運動估計誤差,在文本區域和運動背景之間的邊界區域中圖像很容易失真。
因此,需要改進的用于估計運動的設備和方法。
發明內容
本發明的示例性實施例在于至少解決上述問題和/或缺點以及至少提供下述優點。因此,本發明的一個目的是提供一種能夠減小文本區域的邊界上的圖像失真的運動估計設備和運動估計方法。
可通過提供運動估計設備實現本發明的上述和/或其它示例性方面,所述運動估計設備包括背景表示計算器,基于將被內插的幀的運動向量,計算表示將被內插的幀的背景運動的背景表示向量;塊運動計算器,基于當前幀和先前幀,計算將被內插的幀的各個塊的運動向量,向背景表示計算器提供運動向量,并且基于從背景表示計算器輸出的背景表示向量,通過局部搜索計算各個塊的背景運動向量;運動誤差檢測器,基于從塊運動計算器輸出的背景運動向量和背景運動向量,確定每個塊是否處于文本區域中;以及運動校正單元,當每個塊處于文本區域時基于每個塊的外圍塊的運動向量,確定文本區域中的每個塊是否處于邊界區域中,并且當文本區域中的每個塊處于邊界區域中時校正邊界區域中的每個塊的運動向量。
根據本發明的示例性實施例,背景表示計算器可包括離散度計算器,計算從塊運動計算器提供的幀的每個塊的運動向量和每個塊的外圍塊的運動向量之間的離散度,并且檢測具有小于參考值的離散度的運動向量;直方圖產生器,將檢測的運動向量產生為直方圖;以及表示確定單元,將通過直方圖顯示最頻繁的向量確定為背景表示向量。
根據本發明的示例性實施例,塊運動計算器可包括候選向量計算器,基于當前幀和先前幀,計算關于將被內插的幀的每個塊的多個候選向量;運動確定單元,根據準則選擇所述多個候選向量中的一個,并且將選擇的向量確定為每個塊的運動向量;以及背景運動計算器,基于從背景表示計算器輸出的背景表示向量,通過局部搜索計算每個塊的表示運動向量。
根據本發明的示例性實施例,候選向量計算器可包括平均運動計算器,基于每個塊的外圍塊的運動向量,計算平均運動向量;行運動計算器,基于水平方向上的塊的運動向量,產生搜索區域中的行運動向量;零運動計算器,在沒有塊運動的位置計算零運動向量;以及全運動計算器,通過在搜索區域中進行全搜索計算全運動向量。
根據本發明的示例性實施例,運動確定單元可基于根據平均運動向量的平均預測誤差值、根據行運動向量的行預測誤差值、根據零運動向量的零預測誤差值和根據全運動向量的全預測誤差值,選擇平均運動向量、行運動向量、零運動向量和全運動向量中的至少一個作為塊的最終運動向量,并將其輸出。
根據本發明的示例性實施例,運動誤差檢測器可包括文本區域檢測器,基于零預測誤差值、全預測誤差值、確定的運動向量、根據所述運動向量的預測誤差值、背景運動向量和根據背景運動向量的預測誤差值中的至少一個,確定每個塊是否為文本塊;文本標記產生器,當塊為文本塊時,產生所述塊的文本標記;以及文本模式確定單元,計算每一幀連續存在文本標記的塊的數量,并且如果計算的數量超過參考值,則輸出文本模式信號。
根據本發明的示例性實施例,如果將被處理的塊滿足下面的等式,則文本區域檢測器確定將被處理的塊是文本塊 或 其中,MVox和MVoy分別表示運動向量MVox方向上的位移和y方向上的位移。
根據本發明的示例性實施例,如果將被處理的塊還滿足下面的等式,則文本區域檢測器確定將被處理的塊是文本塊SADfx>>THα&SAD0>α×SADfs其中,SADfs表示通過全搜索的最小SAD值,SAD0表示通過運動向量的最小SAD值,THα表示閾值,α表示權值。
根據本發明的示例性實施例,如果將被處理的塊還滿足下面的等式,則文本區域檢測器確定將被處理的塊是文本塊SADzero>>β×SADfs其中,SADZERO表示零運動向量的最小SAD值,β表示權值。
根據本發明的示例性實施例,如果將被處理的塊還滿足下面的等式a和等式b中的一個,則文本區域檢測器確定將被處理的塊是文本塊a.SADb>>ω×SADfx&MVb≠MV0&SADb<SAD0或b.SAD0≈ρ×SADfx&MVb≈MV0&SADb<SAD0其中,ω和ρ表示權值。
根據本發明的示例性實施例,當連續存在至少三個文本標記時確定相應塊處于文本區域中,并且啟動所述塊的文本標記。
根據本發明的示例性實施例,運動校正單元可包括邊界區域檢測器,在x軸方向上和y軸方向上投影文本區域中的塊的外圍塊的運動向量,計算平均向量的離散度,并且如果平均向量中具有最大離散度的平均向量大于參考值,則確定塊是邊界塊。
根據本發明的示例性實施例,運動校正單元可包括向量校正單元,將邊界塊的運動向量校正為在計算的平均向量中與背景運動向量差異最大的平均向量。
根據本發明的示例性實施例,運動估計設備還可包括幀內插器,基于校正的運動向量產生將被內插的幀。
可通過提供運動估計方法實現本發明的上述和/或其它示例性方面,所述運動估計方法包括基于當前幀和先前幀,計算將被內插的幀的每個塊的運動向量,并將其輸出;基于將被內插的幀的運動向量,計算表示將被內插的幀的背景運動的背景表示向量;基于背景表示向量,通過局部搜索計算每個塊的背景運動向量;基于運動向量和背景運動向量,確定每個塊是否處于文本區域中;以及當每個塊處于文本區域中時,基于文本區域中塊的外圍塊的運動向量,確定文本區域中的塊是否處于邊界區域中,并且當文本區域中的塊處于邊界區域中時,校正邊界區域中的塊的運動向量。
根據本發明的示例性實施例,計算背景表示向量可包括計算每幀的每個塊的運動向量和每個塊的外圍塊的運動向量之間的離散度;檢測具有小于參考值的離散度的向量,并且產生直方圖;以及將通過直方圖最頻繁出現的向量確定為背景表示向量。
根據本發明的示例性實施例,計算每個塊的運動向量可包括基于當前幀和先前幀,計算將被內插的幀的每個塊的多個候選向量;根據準則選擇多個候選向量中的一個,并且將選擇的候選向量確定為每個塊的運動向量;以及基于計算的背景表示向量,通過局部搜索計算每個塊的表示運動向量。
根據本發明的示例性實施例,計算多個候選向量可包括基于每個塊的外圍塊的運動向量,計算平均運動向量;基于水平方向上的塊的運動向量,產生搜索區域中的行運動向量;在塊沒有運動的位置計算零運動向量;以及通過在搜索區域中進行全搜索計算全運動向量。
根據本發明的示例性實施例,選擇多個候選向量中的一個,并將選擇的候選向量確定為每個塊的運動向量可包括基于根據平均運動向量的平均預測誤差值、根據行運動向量的行預測誤差值、根據零運動向量的零預測誤差值和根據全運動向量的全預測誤差值,將平均運動向量、行運動向量、零運動向量和全運動向量中的至少一個選擇為每個塊的運動向量,并將其輸出。
根據本發明的示例性實施例,確定每個塊是否處于文本區域中可包括基于零預測誤差值、全預測誤差值、確定的運動向量、根據所述運動向量的預測誤差值、背景運動向量和根據背景運動向量的預測誤差值中的至少一個,檢測每個塊是否在文本區域中;如果塊處于文本區域中,則產生所述塊的文本標記;以及計算每一幀連續存在文本標記的塊的數量,并且如果計算的數量超過參考值,則輸出文本模式信號。
根據本發明的示例性實施例,確定每個塊是否處于文本區域中可包括如果每個塊滿足下面的等式,則確定每個塊處于文本區域中 或 SADfx>>THα&SAD0>α×SADfsSADzero>>β×SADfsa.SAD>>ω×SADfx&MVb≠MV0&SADb<SAD0或b.SAD0≈ρ×SADfx&MVb≈MV0&SADb<SAD0根據本發明的示例性實施例,計算塊的數量并輸出文本模式信號可包括確定連續存在至少三個文本標記的塊處于文本區域中,并且啟動所述塊的文本標記。
根據本發明的示例性實施例,校正運動向量可包括如果塊處于文本區域中,則通過在x軸方向上和y軸方向上投影塊的外圍塊的運動向量來計算平均向量;以及計算已計算的平均向量的離散度,并且如果平均向量中具有最大離散度的平均向量大于參考值,則確定文本區域中的塊處于邊界區域中。
根據本發明的示例性實施例,校正運動向量可包括當文本區域中的塊處于邊界區域中時,將邊界區域中的塊的運動向量校正為在計算的平均向量中與背景運動向量差異最大的平均向量。
根據本發明的示例性實施例,運動估計方法還可包括基于校正的運動向量,產生將被內插的幀。
通過下面結合附圖對示例性實施例進行的描述,本發明的上述和/或其它方面和優點將會變得更加清楚,其中圖1是根據本發明的示例性實施例的運動估計設備的控制框圖;圖2是根據本發明的示例性實施例的塊運動計算器的詳細框圖;圖3是根據本發明的示例性實施例的背景表示計算器的詳細框圖;圖4是根據本發明的示例性實施例的運動誤差檢測器和運動校正單元的詳細框圖;圖5是示出根據本發明的示例性實施例的運動誤差檢測器確定塊是否在文本區域和文本模式的方法的流程圖;
圖6是根據本發明的示例性實施例的解釋由運動校正單元執行的運動校正方法的示圖;圖7是顯示通過運動估計設備根據示例性運動估計方法校正的結果圖像和未校正圖像的示圖。
在整個附圖中,相同的附圖標號將被理解為表示相同的部件、特點和結構。
具體實施例方式
提供例如詳細的結構和部件的在說明書中定義的內容以幫助全面理解本發明的實施例,并且這些內容只是示例性的。因此,本領域的普通技術人員將認識到,在不脫離本發明的范圍和精神的情況下,可對在此描述的實施例進行各種改變和修改。另外,為了清楚和簡明,將省略對已知功能和結構的描述。現將對附圖中示出的本發明的示例性實施例進行詳細地介紹。
根據本發明的示例性實施例的使因在文本區域中的運動誤差而引起的圖像失真最小化的運動估計設備和運動估計方法引入下面的假設。
<假設1>文本區域屬于能夠從背景區域分離的對象區域。
<假設2>在屏幕上滾動的文本具有單一方向性的運動。
<假設3>可將滾動的文本插入到原始圖像。
<假設4>滾動的文本在區域中連續運動。
<假設5>文本區域和背景區域在亮度上存在差異。
<假設6>在具有不同運動向量的邊界上在文本區域中產生的失真明顯。
在上述假設下,根據本發明的示例性實施例,在運動估計設備和運動估計方法中,從背景區域分離對象區域,檢測對象區域的文本區域,檢測文本區域的具有不同運動的邊界區域,并且校正邊界區域的運動向量。
圖1是根據本發明的示例性實施例的運動估計設備的控制框圖。參照圖1,運動估計設備可包括塊運動計算器10、背景表示計算器20、運動誤差檢測器30和運動校正單元40。
塊運動計算器10基于當前幀和先前幀,計算與將被內插的幀的塊相應的運動向量。將參照圖2詳細描述塊運動計算器10。
參照圖2,塊運動計算器10包括候選向量計算器60和運動確定單元70。候選向量計算器60基于當前幀和先前幀,計算與每個塊相應的多個候選向量。運動確定單元70根據準則將所述多個候選向量中的一個確定為運動向量。
如圖2所示,候選向量計算器60可包括全運動計算器61、平均運動計算器63、行運動計算器65和零運動計算器67。
全運動計算器61將當前幀分成多個塊,每個塊具有一定大小,并且全運動計算器61將當前幀中將被進行運動估計的塊與先前幀的搜索區域進行比較,以估計全運動向量MVf。
全運動計算器61將全搜索塊匹配(FSBM)算法應用于計算多個運動預測誤差值。全運動計算器61從具有最小運動預測誤差值的位置估計各個塊的全運動向量MVf。可通過各種方法計算運動預測誤差值,諸如絕對差值和(SAD)方法、平均絕對差值(MAD)方法等。
平均運動計算器63基于從全運動計算器61接收的全運動向量MVf,計算與當前塊臨近的外圍塊的運動向量的平均向量。也就是說,平均運動計算器63配置包括當前塊的具有M×N的大小的窗口,并計算包括在該窗口中的運動向量的平均向量。
例如,窗口可具有3×3的大小。更大的窗口更好的反映整個運動。
為了簡化硬件配置并減少計算時間,平均運動計算器63可積累先前幀的塊的運動向量,以獲得平均運動向量MVmean。也就是說,需要在當前塊之后計算運動向量以獲得全運動向量MVf,這樣增加了時間延遲。由于這個原因,使用先前幀的塊的運動向量來獲得平均運動向量MVmean。
行運動計算器65使用在水平方向上連續排列的塊的運動向量來計算表示當前塊的水平運動的度的行運動向量MVline。
可通過下面的等式1和等式2來獲得行運動向量MVline。
MV_Avg(n)=Σi=0NMotionVector(i,n)]]>[等式2]LineMV(n)=LocalMin(MV_Avg(n),Search_Range)其中,n表示垂直方向上塊的index,i表示水平方向上塊的index。
如從等式1中看到的,行運動計算器65基于當前塊所屬的行上的塊的運動向量,計算行平均運動向量MV_Avg(n)。
在示例性實施例中,在假設在表示相同對象的多個塊一起運動的全運動中的運動誤差具有高斯分布的情況下執行操作。經受全運動的塊的運動向量的平均值幾乎接近實際全運動。隨著獲得平均值所使用的塊的數量的增加,準確度也變高。
例如,由于在新聞等中的文本滾動占據了屏幕的大部分下部區域,因此如果假設使用480像素的標準清晰度(SD)等級,并且每個塊的大小是8×8,則塊的數量是480/8,換句話說,就是60。因此,當實際上產生文本滾動時,可通過對相應塊的運動向量進行平均來獲得與實際正確運動相似的運動向量。
行運動計算器65在以由等式1獲得的平均值為中心的搜索區域內獲得局部最小值,并且計算該局部最小值作為行運動向量MVline。
在假設在搜索區域中的SAD值中的局部最小值周圍存在正確運動向量的情況下執行操作。實際的SAD值指示局部最小值存在于塊近似匹配的區域。
如果在用于計算全運動向量MVf的全搜索方法中搜索區域的大小為N×M,則可使用較小的搜索區域,諸如N/2×M/2等來獲得行運動向量MVline。
零運動計算器67在以運動向量為零的位置為中心的小搜索區域內尋找局部最小值,并且計算找到的局部最小值作為零運動向量MVzero。在示例性實施例中,零運動計算器67在以特定位置(零運動向量(0,0))為中心的M×M的搜索區域內獲得局部最小值,類似于行運動向量MVline。
這是因為從運動向量(0,0)周圍的最小值獲得SAD值,而不是僅獲得運動向量(0,0)SAD值,對使噪聲等的影響最小化是有效的。
運動確定單元70接收全運動向量MVf、平均運動向量MVmean、行運動向量MVline和零運動向量MVzero,并且選擇這些向量中的一個作為運動向量,并將其輸出。更加詳細地說,運動確定單元70將根據全運動向量MVf的全SAD值SADfs、根據平均運動向量MVmean的平均SAD值SADmean、根據行運動向量MVline的行SAD值SADline和根據零運動向量MVzero的零SAD值SADzero相互進行比較。基于通過運動確定單元70比較的結果,復用器選擇與所述多個SAD值中的最小SAD值相應的運動向量作為最終運動向量,并將其輸出。在示例性實施例中,可以通過調整權值給出運動向量的優先級,其中,各個SAD值將與所述權值相乘。
硬件配置需要被簡化以獲得這種運動向量。這就需要共享運動估計。可在全搜索運動估計器中共享平均運動計算器63、行運動計算器65和零運動計算器67分別獲得局部最小值的處理。
平均運動計算器63在具有一定大小(例如3×3)的平均向量MVmean周圍獲得局部最小值,行運動計算器65在行平均向量MVline周圍獲得局部最小值,并且零運動計算器67在零向量MVzero周圍獲得局部最小值。因此,如果全搜索運動估計器設置各個搜索區域,則可計算并存儲相應搜索區域中的SAD值。
因此,可僅通過全搜索運動估計器來計算平均運動向量、零運動向量和行運動向量。在示例性實施例中,由于通過全運動計算器61執行通過全搜索的運動估計,因此可通過共享全運動計算器61的硬件來提取各個運動向量。
背景表示計算器20基于從塊運動計算器10輸出的運動向量,檢測在當前運動向量的外圍運動向量之間相關性最高且在外圍向量中出現最頻繁的向量作為相應幀的背景表示向量。更詳細地說,如圖3所示,背景表示計算器20包括離散度計算器21、直方圖產生器23和表示確定單元25。
在示例性實施例中,離散度計算器21根據下面的等式3計算接收的運動向量和外圍運動向量之間的離散度,并檢測具有小于參考值的離散度的運動向量MVa。
Dmv=Σi=1n|MVC-MVi|]]>其中,Dmv表示運動向量的離散度,MVc表示將被處理的當前塊的運動向量,MVi表示當前塊的外圍運動向量。
如果產生通過離散度計算器21檢測的運動向量MVa,并通過直方圖產生器23將其存儲為運動向量直方圖,則表示確定單元25將由直方圖產生器23產生的運動向量直方圖中出現最頻繁的運動向量確定為背景表示向量MVback。
在示例性實施例中,如圖2所示,塊運動計算器10可還包括背景運動計算器80。背景運動計算器80基于從背景表示計算器20輸出的背景表示向量MVback,通過在區域中進行局部搜索計算各個塊的背景運動向量MV’back。
在示例性實施例中,運動誤差檢測器30基于從塊運動計算器10輸出的運動向量MV0、根據運動向量MV0的最小SAD值SAD0、背景運動向量MVback、根據背景運動向量MVback的最小SAD值SADb、根據全運動向量MVf的最小SAD值SADf和零SAD值SADZERO,檢測文本區域。
將參照圖4和圖5更加詳細地描述運動誤差檢測器30。
參照圖4,運動誤差檢測器30包括文本區域檢測器31、文本標記產生器33和文本模式產生器35。
文本區域檢測器31確定每個塊是否滿足特定等式。文本區域檢測器31通過圖5所示地操作100至操作105確定每個塊是否為文本塊。所述等式定義如下。
或 [等式5]SADfx>>THα&SAD0>α×SADfs[等式6]SADzero>>β×SADfs[等式7]a.SADb》ω×SADfx&MVb≠MV0&SADb<SAD0或b.SAD0≈ρ×SADfx&MVb≈MV0&SADb<SAD0其中,MVox和MVoy分別表示運動向量的x方向位移和y方向位移,THα表示閾值,α、β、ω和ρ表示權值。
首先,在操作100,文本區域檢測器31確定運動向量MV0是否滿足等式4,所述等式4為上述<假設2>建模以表示單一方向特性,所述單一方向特性是表示對象的運動的運動向量MV0僅具有x方向運動或y方向運動。
然后,在操作101,確定是否滿足為上述<假設3>建模的等式5。當使用插入到原始場景中的文本區域中的具有相同運動的兩個幀數據嘗試塊匹配時,新創建原始場景中不存在的區域或存在的區域消失,因而增加最小SAD值。其結果是,根據表示對象區域的運動的運動向量MV0的SAD值SAD0變得比根據全搜索的最小SAD值SADfs大。
接下來,在操作102,文本區域檢測器31確定是否滿足為上述<假設5>建模的等式6。零SAD值SADZERO是對沒有運動的塊的兩幀之間亮度差的和。在亮度高于其外圍區域的文本區域中,零SAD值SADZERO將具有較大的值。
接下來,在操作103和操作104,確定是否滿足為上述<假設1>建模以檢測對象區域的等式7。在這里,考慮背景的運動與對象的運動不同的情況(操作103)和背景的運動與對象的運動相似的情況(操作104)分別定義等式7。
等式7的部分a與背景的運動與對象的運動不同的情況相應,特別是與當表示背景的運動的背景運動向量MVb與表示對象的運動的運動向量MV0不同時相應。另外,由于與所述情況相應的區域屬于對象區域,因此通過背景運動向量MVb計算的最小SAD值SADb大于由對象的運動向量MV0計算的最小SAD值SAD0,并根據全搜索在最小SAD值SADb和最小SAD值SADmin之間的差異較大。
另一方面,等式7的部分b與背景的運動與對象的運動相似的情況相應,特別是與當表示背景的運動的背景運動向量MVb與表示對象的運動的運動向量MV0相似時相應,因此,最小SAD值SADb與最小SAD值SAD0相似。然而,由于與所述情況相應的區域屬于背景和對象的邊界,因此最小SAD值SADb或SAD0與根據全搜索的最小SAD值SADfs具有較大的差異。
如果滿足上述的所有等式,則在操作105,文本標記產生器33將相應塊的文本標記設置為1。否則,在操作106,文本標記產生器33將相應塊的文本標記設置為0。
接下來,在操作200,文本模式產生器35確定在塊中是否連續存在至少三個文本標記。如果在所述塊中連續存在至少三個文本標記,則文本模式產生器35在操作201將所述塊確定為文本區域,并且啟動文本標記。否則,文本標記失效,并且在操作202,盡管相應塊滿足等式4至等式7,但是確定相應塊不在文本區域。在操作200用于文本模式產生器35的等式與上述<假設4>相應。
另外,如果在操作203文本區域中的塊的數量(即,具有文本標記為1的塊的數量)超過每一幀的參考值,則在操作204,文本模式產生器35將文文本模式信號設置為1。否則,在操作205,文本模式產生器35將文文本模式信號設置為0。
在示例性實施例中,運動校正單元40確定文本區域中的塊是否屬于背景和對象之間的邊界區域,并且如果文本區域中的塊屬于邊界區域,則校正塊的運動向量。將參照圖4和圖6更加詳細地描述運動校正單元40。
如圖4所示,運動校正單元40包括邊界區域檢測器41和向量校正單元43。
對于處于設置為1的文本模式中的幀,邊界區域檢測器41確定具有文本標記為1的塊是否處于邊界區域。
首先,如圖6的(A)中所示,邊界區域檢測器41以將被處理的塊為中心配置具有3×3大小的窗口,并且x方向和y方向上投影運動向量。然后,邊界區域檢測器41獲得投影方向上存在的向量的平均值。然后,邊界區域檢測器41根據投影方向獲得x方向上平均向量b的離散度和y方向上平均向量c的離散度。也就是說,離散度越大,運動向量之間的差異就越大。例如,如果對兩個投影方向的離散度為D和E,則選擇與值D和E中較大的值相應的方向。如果選擇的離散度大于參考值,則確定相應區域處于對象和背景之間的邊界區域。在圖6中,由于投影在x方向上的運動向量的離散度大于投影在y方向上的運動向量的離散度,因此確定邊界存在于x方向上。邊界區域檢測器41的確定與上述<假設6>相應。
在邊界區域中,向量校正單元43將被處理的塊的運動向量校正為存在于選擇的方向上的平均向量中具有最大值的向量。如圖6所示,將中心塊的運動向量a校正為投影在x方向上的平均向量中具有最大值的最下端向量a’。既不在文本區域中也不在邊界區域中的塊的運動向量不受運動校正單元40的校正。
在示例性實施例中,如圖1所示,運動估計設備可包括幀內插器50。幀內插器50基于已校正或未校正的運動向量來校正將被插入到當前幀和先前幀之間的內插幀的數據,并將其輸出。
參照圖7,沒有應用本發明的圖像(A)和應用本發明的示例性實施例的圖像(B)在文本的邊界區域有明顯地不同。同樣,通過在處理對象區域和背景區域之間的邊界區域中最小化運動誤差,能夠最小化邊界區域中的圖像失真。
在如上所述的示例性實施例中,候選向量計算器60產生四個候選向量,然而,本發明不限于此。另外,文本模式產生器35當至少3個塊的文本標記為1時確定相應塊處于文本區域中。然而,本發明也可當不同數量的塊的文本標記為1時確定相應塊處于文本區域中。
從上述描述中明顯看出,本發明提供了一種減小文本區域的邊界上的圖像失真的運動估計設備和運動估計方法。
盡管已經參照其特定的示例性實施例顯示和描述了本發明,但本領域的技術人員應該理解,在不脫離本發明的精神和原理的情況下,可以對這些實施例進行改變,本發明的范圍由所附權利要求及其等同物限定。
權利要求
1.一種運動估計設備,包括背景表示計算器,基于將被內插的幀的運動向量,計算表示將被內插的幀的背景運動的背景表示向量;塊運動計算器,基于當前幀和先前幀,計算將被內插的幀的各個塊的運動向量,向背景表示計算器提供運動向量,并且基于從背景表示計算器輸出的背景表示向量,通過局部搜索計算各個塊的背景運動向量;運動誤差檢測器,基于從塊運動計算器輸出的背景運動向量和背景運動向量,確定每個塊是否處于文本區域中;以及運動校正單元,當每個塊處于文本區域時基于每個塊的外圍塊的運動向量,確定文本區域中的每個塊是否處于邊界區域中,并且當文本區域中的每個塊處于邊界區域中時校正邊界區域中的每個塊的運動向量。
2.如權利要求1所述的運動估計設備,其中,背景表示計算器包括離散度計算器,計算從塊運動計算器提供的幀的每個塊的運動向量和每個塊的外圍塊的運動向量之間的離散度,并且檢測具有小于參考值的離散度的運動向量;直方圖產生器,將檢測的運動向量產生為直方圖;以及表示確定單元,將通過直方圖顯示最頻繁的向量確定為背景表示向量。
3.如權利要求1所述的運動估計設備,其中,塊運動計算器可包括候選向量計算器,基于當前幀和先前幀,計算關于將被內插的幀的每個塊的多個候選向量;運動確定單元,根據標準選擇所述多個候選向量中的一個,并且將選擇的向量確定為每個塊的運動向量;以及背景運動計算器,基于從背景表示計算器輸出的背景表示向量,通過局部搜索計算每個塊的表示運動向量。
4.如權利要求3所述的運動估計設備,其中,候選向量計算器包括平均運動計算器,基于每個塊的外圍塊的運動向量,計算平均運動向量;行運動計算器,基于水平方向上的塊的運動向量,產生搜索區域中的行運動向量;零運動計算器,在沒有塊運動的位置計算零運動向量;以及全運動計算器,通過在搜索區域中進行全搜索計算全運動向量。
5.如權利要求4所述的運動估計設備,其中,運動確定單元基于根據平均運動向量的平均預測誤差值、根據行運動向量的行預測誤差值、根據零運動向量的零預測誤差值和根據全運動向量的全預測誤差值,選擇平均運動向量、行運動向量、零運動向量和全運動向量中的至少一個作為塊的最終運動向量,并將其輸出。
6.如權利要求5所述的運動估計設備,其中,運動誤差檢測器包括文本區域檢測器,基于零預測誤差值、全預測誤差值、確定的運動向量、根據所述運動向量的預測誤差值、背景運動向量和根據背景運動向量的預測誤差值中的至少一個,確定每個塊是否為文本塊;文本標記產生器,當塊為文本塊時,產生所述塊的文本標記;以及文本模式確定單元,計算每一幀連續存在文本標記的塊的數量,并且如果計算的數量超過參考值,則輸出文本模式信號。
7.如權利要求6所述的運動估計設備,其中,如果將被處理的塊滿足下面的等式,則文本區域檢測器確定將被處理的塊是文本塊 或 其中,MVox和MVoy分別表示運動向量MVox方向上的位移和y方向上的位移。
8.如權利要求7所述的運動估計設備,其中,如果將被處理的塊還滿足下面的等式,則文本區域檢測器確定將被處理的塊是文本塊SADfx>>THα& SAD0>α×ASDfs其中,SADfs表示通過全搜索的最小SAD值,SAD0表示通過運動向量的最小SAD值,THα表示閾值,α表示權值。
9.如權利要求8所述的運動估計設備,其中,如果將被處理的塊還滿足下面的等式,則文本區域檢測器確定將被處理的塊是文本塊SADzero>>β×SADfs其中,SADZERO表示零運動向量的最小SAD值,β表示權值。
10.如權利要求9所述的運動估計設備,其中,如果將被處理的塊還滿足下面的等式a和等式b中的一個,則文本區域檢測器確定將被處理的塊是文本塊a.SADb>>ω×SADfx& MVb≠MV0& SADb<SAD0或b.SAD0≈ρ×SADfx& MVb≈MV0& SADb<SAD0其中,ω和ρ表示權值。
11.如權利要求10所述的運動估計設備,其中,當連續存在至少三個文本標記時確定相應塊處于文本區域中,并且啟動所述塊的文本標記。
12.如權利要求1或11所述的運動估計設備,其中,運動校正單元包括邊界區域檢測器,在x軸方向上和y軸方向上投影文本區域中的塊的外圍塊的運動向量以計算平均向量,計算平均向量的離散度,并且如果平均向量中具有最大離散度的平均向量大于參考值,則確定塊是邊界塊。
13.如權利要求12所述的運動估計設備,其中,運動校正單元包括向量校正單元,將邊界塊的運動向量校正為在計算的平均向量中與背景運動向量差異最大的平均向量。
14.如權利要求1所述的運動估計設備,其中,還包括幀內插器,基于校正的運動向量產生將被內插的幀。
15.一種運動估計方法,包括基于當前幀和先前幀,計算將被內插的幀的每個塊的運動向量,并將其輸出;基于將被內插的幀的運動向量,計算表示將被內插的幀的背景運動的背景表示向量;基于背景表示向量,通過局部搜索計算每個塊的背景運動向量;基于運動向量和背景運動向量,確定每個塊是否處于文本區域中;以及當每個塊處于文本區域中時,基于文本區域中塊的外圍塊的運動向量,確定文本區域中的塊是否處于邊界區域中,并且當文本區域中的塊處于邊界區域中時,校正邊界區域中的塊的運動向量。
16.如權利要求15所述的運動估計方法,其中,計算背景表示向量包括計算每幀的每個塊的運動向量和每個塊的外圍塊的運動向量之間的離散度;檢測具有小于參考值的離散度的向量,并且產生直方圖;以及將通過直方圖最頻繁出現的向量確定為背景表示向量。
17.如權利要求16所述的運動估計方法,其中,計算每個塊的運動向量包括基于當前幀和先前幀,計算將被內插的幀的每個塊的多個候選向量;根據準則選擇多個候選向量中的一個,并且將選擇的候選向量確定為每個塊的運動向量;以及基于計算的背景表示向量,通過局部搜索計算每個塊的表示運動向量。
18.如權利要求17所述的運動估計方法,其中,計算多個候選向量包括基于每個塊的外圍塊的運動向量,計算平均運動向量;基于水平方向上的塊的運動向量,產生搜索區域中的行運動向量;在塊沒有運動的位置計算零運動向量;以及通過在搜索區域中進行全搜索計算全運動向量。
19.如權利要求18所述的運動估計方法,其中,選擇多個候選向量中的一個,并將選擇的候選向量確定為每個塊的運動向量包括基于根據平均運動向量的平均預測誤差值、根據行運動向量的行預測誤差值、根據零運動向量的零預測誤差值和根據全運動向量的全預測誤差值,將平均運動向量、行運動向量、零運動向量和全運動向量中的至少一個選擇為每個塊的運動向量,并將其輸出。
20.如權利要求19所述的運動估計方法,其中,確定每個塊是否處于文本區域中可包括基于零預測誤差值、全預測誤差值、確定的運動向量、根據所述運動向量的預測誤差值、背景運動向量和根據背景運動向量的預測誤差值中的至少一個,檢測每個塊是否在文本區域中;如果塊處于文本區域中,則產生所述塊的文本標記;以及計算每一幀連續存在文本標記的塊的數量,并且如果計算的數量超過參考值,則輸出文本模式信號。
21.如權利要求20所述的運動估計方法,其中,確定每個塊是否處于文本區域中包括如果每個塊滿足下面的等式,則確定每個塊處于文本區域中 或 SADfx>>THα& SAD0>α×SADfs,SADzero>>β×SADfs,a.SADb>>ω×SADfx& MVb≠MV0& SADb<SAD0或b.SAD0≈ρ×SADfx& MVb≈MV0& SADb<SAD0。
22.如權利要求21所述的運動估計方法,其中,計算塊的數量并輸出文本模式信號包括確定連續存在至少三個文本標記的塊處于文本區域中,并且啟動所述塊的文本標記。
23.如權利要求15或22所述的運動估計方法,其中,校正運動向量包括如果塊處于文本區域中,則通過在x軸方向上和y軸方向上投影塊的外圍塊的運動向量來計算平均向量;以及計算已計算的平均向量的離散度,并且如果平均向量中具有最大離散度的平均向量大于參考值,則確定文本區域中的塊處于邊界區域中。
24.如權利要求23所述的運動估計方法,其中,校正運動向量包括當文本區域中的塊處于邊界區域中時,將邊界區域中的塊的運動向量校正為在計算的平均向量中與背景運動向量差異最大的平均向量。
25.如權利要求15或24所述的運動估計方法,還包括基于校正的運動向量,產生將被內插的幀。
全文摘要
提供一種估計運動的設備和方法。所述設備包括背景表示計算器,基于將被內插的幀的運動向量,計算表示將被內插的幀的背景運動的背景表示向量;塊運動計算器,基于當前幀和先前幀,計算將被內插的幀的各個塊的運動向量,向背景表示計算器提供運動向量,并且基于從背景表示計算器輸出的背景表示向量,通過局部搜索計算各個塊的背景運動向量;運動誤差檢測器,基于從塊運動計算器輸出的背景運動向量和背景運動向量,確定每個塊是否處于文本區域中;以及運動校正單元,當每個塊處于文本區域時基于每個塊的外圍塊的運動向量,確定文本區域中的每個塊是否處于邊界區域中,并且當文本區域中的每個塊處于邊界區域中時校正邊界區域中的每個塊的運動向量。
文檔編號H04N5/14GK1984240SQ200610167030
公開日2007年6月20日 申請日期2006年12月13日 優先權日2005年12月14日
發明者成和錫, 閔鐘述 申請人:三星電子株式會社