專利名稱:檢測圖像取向的方法和設備的制作方法
技術領域:
本發明涉及用于檢測一組圖像中圖像的取向的一種設備和一種方法。
本發明更一般地涉及自動檢測還可能包含文本的圖像的取向。
背景技術:
如掃描儀一樣,數碼相機產生通常在屏幕(例如,計算機屏幕)查看的照片。這些圖像可以正確查看,也就是說,按正確的取向,或者在某種意義上,用戶不必向左或向右轉頭或甚至低頭就能查看。
具體地,諸如數碼相機之類的傳感設備可以按不同方式來捕獲圖像,并且具體地,對于用戶來說,以豎向模式拍攝某些照片,并且以橫向模式拍攝另一些照片,并不罕見。然后,將如此拍攝的照片傳輸到計算機,并且所有照片都按相同方式來查看。因此,某些照片將會正確查看,而其他照片將需要旋轉90、180或270度來正確查看。
某些傳感設備,具體地,某些數碼相機具有檢測對象旋轉的取向傳感器,并且與圖像一起發送從傳感器獲得的旋轉提示。這允許查看設備利用旋轉提示來自動執行圖像的旋轉,從而圖像以正確的方式出現。
其他設備使用用于提取圖像的低級或高級特性的方法。這使得可以在色彩、紋理以及語義內容方面分析圖像的內容。
然而,這種設備不是對于所有類型的圖像都是魯棒的。
發明內容
本發明更具體地涉及在沒有從傳感設備接收到任何取向提示的查看設備中,基于其他圖像的取向,來自動旋轉圖像。
因此,本發明涉及一種用于檢測一組圖像中圖像的取向的方法,包括如下步驟-從這組圖像中選擇參考圖像,-根據所述參考圖像的取向,檢測所述圖像的取向。
用戶常常拍攝表現相同景物的多張圖像,其中一些圖像以豎向模式拍攝,而其他圖像以橫向模式拍攝。對這些圖像中參考圖像的檢測使得可以檢測表現相同景物或類似景物的其他圖像的取向。這在表現風景中的人物的圖像中是尤其常見的,其中用戶希望在一些圖像中拍攝風景,而在其他圖像中通過特寫鏡頭使人物突出。
參考附圖,通過有利的、完全非限制性的示例實施例和實施方式,將更好地理解和演示本發明,附圖中圖1a和1b代表分解為子圖像的示例,圖2代表將子圖像分解為塊。
具體實施例方式
如圖1a和1b所示,在取向待定的目標圖像以及參考子圖像中定位子圖像。
根據圖1a和1b,子圖像的大小小于其所處的圖像。子圖像也可以與圖像相同。
兩個子圖像相對于它們所處的圖像具有相同的相對大小。兩個子圖像具有相同的寬/高比。
如果一個或兩個子圖像分別小于它們各自所處的圖像,則如此定位子圖像,以獲得參考圖像的子圖像與其取向待檢測的目標圖像的子圖像之間的最小距離。為此,測試子圖像的數個位置,并且保留最佳位置。
在另一實施例中,對于參考圖像和目標圖像,將子圖像定位于圖像中央。
在另一實施例中,根據取決于圖像類別的固定規則,來定位子圖像。這假設預先根據類型來對圖像分類,其中類型例如是景物的類型(城鎮、風景、室內景物、人物等)。可以如下定義規則對于風景和室內景物,子圖像位于圖像中央;對于城鎮景物,子圖像位于圖像底部。
在又一實施例中,根據取決于圖像中對象的存在和位置的固定規則,來定位子圖像。這涉及到預先檢測圖像中的對象。對象也可以包括臉部。于是,規則可以是使得子圖像居中位于對象上。
當在參考圖像和目標圖像中定位了子圖像時,執行視覺距離的四個測量。如下執行這四個測量-在目標圖像的子圖像和參考圖像的子圖像之間,-在目標圖像的子圖像和經過90度旋轉的參考圖像的子圖像之間,-在目標圖像的子圖像和經過180度旋轉的參考圖像的子圖像之間,-在目標圖像的子圖像和經過270度旋轉的參考圖像的子圖像之間,為此,將參考圖像和目標圖像的子圖像劃分為A×B塊,其中A在豎直方向,B在水平方向。圖2圖示了劃分為塊的示例,其中A和B等于2。
這種劃分是為了適應所處理圖像的非平穩性(圖像的不同區域呈現極其不同的內容)。塊數越多,要考慮的這種效果越大。
然而,A×B的數目不應超過取決于圖像分辨率的特定閾值,以便獲得足夠的信息。
目標圖像和參考圖像之間距離D的四個測量如此計算D=Σi=0(A*B)-1wiDi]]>距離Di代表四塊圖像之間的四個距離D0、D1、D2、D3,如圖2所示。
對每一塊應用加權因子wi。加權可以取決于根據重要性對塊的分類,或者取決于關于距離計算的置信度測量。
根據如下公式從M個特定距離dm來計算每個距離Di
Di=Σm=0M-1vmdm]]>m代表用來計算距離的描述符的數目。描述符例如可以是色彩、紋理。
使用本領域技術人員公知的方法來執行距離dm的計算。可以產生色彩直方圖差、輪廓直方圖差、子帶能量的差、定向濾波器的響應差,以便測量這些距離。
對每個距離dm應用加權因子vm,以考慮m個距離的計算置信度。
參考圖像是取向通過推理已知的圖像。這些圖像的取向可以通過各種方法獲得,并且具體地,例如,通過檢測這些圖像中的對象或者臉部,但是也可以由用戶手動指出。也可以使用與本發明所提出的方法不同的方法,使得可以檢測圖像的取向,并且可以使用這些方法來檢測參考圖像的取向。例如,在2000年11月17日以Eastman KodakCompany公司名義提交的題為“determining orientation of imagescontaining blue sky”的歐洲專利申請1107182中描述了這種方法。
當數個參考圖像可用于該方法時,通過計算給定圖像與可用于該方法的參考圖像之間的J個距離Ej,來執行參考圖像的選擇。
根據如下公式,從L個特定距離e1來計算每個距離EjEj=Σ1=0L-1q1e1]]>對每個所計算的距離e1應用加權因子q1。
根據已知方法來計算所計算的每個距離e1,如前面就距離dm所述。
然后選擇與目標圖像的距離最小的參考圖像。
隨后,如前所述,計算距離Di的測量作為D。
因此,計算目標圖像與四個位置中的參考圖像(旋轉0、90、180或270度)之間的D。
最小的距離指示為了正確查看而必須對目標圖像進行的旋轉。例如,如果最小距離是目標圖像與旋轉了270度的參考圖像之間的距離,則目標圖像必須旋轉270度以便正確查看。
權利要求
1.一種用于檢測一組圖像中圖像的取向的方法,其特征在于所述方法包括步驟-從這組圖像中選擇參考圖像,-根據所述參考圖像的取向,檢測所述圖像的取向。
2.根據權利要求1所述的方法,其特征在于還包括步驟計算參考圖像與所述圖像之間的視覺距離(D)。
3.根據權利要求2所述的方法,其特征在于還包括步驟計算如下視覺距離(D)-所述圖像和參考圖像之間的視覺距離,-所述圖像和旋轉90度的參考圖像之間的視覺距離,-所述圖像和旋轉180度的參考圖像之間的視覺距離,-所述圖像和旋轉270度的參考圖像之間的視覺距離。
4.根據權利要求3所述的方法,其特征在于還包括步驟確定參考圖像中的子圖像和所述圖像中的子圖像,對各個子圖像執行所述圖像和參考圖像之間視覺距離(D)的計算。
5.根據權利要求4所述的方法,其特征在于所述子圖像相對于其所處的圖像具有相同的相對大小。
6.根據權利要求4所述的方法,其特征在于所述子圖像相對于其所處的圖像居于中央。
7.根據權利要求4所述的方法,其特征在于定位所述子圖像,使所述子圖像之間的視覺距離最小。
8.根據前述權利要求中任一項所述的方法,其特征在于還包括步驟根據參考圖像與目標圖像之間的距離,選擇所述參考圖像。
9.一種用于檢測一組圖像中圖像的取向的設備,其特征在于所述設備包括-用于從這組圖像中選擇參考圖像的裝置,-用于根據所述參考圖像的取向來檢測所述圖像的取向的裝置。
全文摘要
本發明涉及用于檢測一組圖像中圖像的取向的一種方法和一種設備。根據本發明,該方法包括步驟從這組圖像中選擇參考圖像;根據所述參考圖像的取向,檢測所述圖像的取向。
文檔編號H04N1/387GK1906637SQ200580001981
公開日2007年1月31日 申請日期2005年1月4日 優先權日2004年1月6日
發明者于爾根·施陶德爾, 讓-羅南·維古魯, 貝特朗·許波 申請人:湯姆森許可貿易公司