專利名稱:彩色數碼影像的圖像定位方法與裝置的制作方法
技術領域:
本發明涉及一種應用于彩色攝影機或數碼相機所拍攝下來的彩色數碼影像的圖像定位方法與裝置,利用影像處理的技術,將彩色數碼影像中的圖像精準定位,再以切割出來,作為后續影像辨識等的應用。
背景技術:
目前應用于彩色數碼影像中的幾何或字符串圖像的尋找與定位方法,較常使用的是先將彩色影像轉為灰階影像,再利用圖像的灰階梯度變化高于背景的灰階梯度變化的特性來做判斷,例如將彩色影像RGB(紅綠藍)的像素值(pixel)分別相加再除以3得出黑白灰階影像,利用灰階影像求取水平/垂直方向的梯度,再利用圖像的水平/垂直方向梯度變化的特性,進行圖像位置的定位,其中第(i,j)點的水平梯度Fi,j求法如下Fi,j=(r(i,j)+g(i,j)+b(i,j))/3Fi,j+1=(r(i,j+1)+g(i,j+1)+b(i,j+1))/3第i列第j行的水平梯度Fi,j=|Fi,j-Fi,j+1|其中r(i,j)=于坐標(i,j)的R Band(紅色通道)像素值g(i,j)=于坐標(i,j)的G Band(綠色通道)像素值b(i,j)=于坐標(i,j)的B Band(藍色通道)像素值此方法簡單且方便使用,但卻因為將彩色影像轉換成黑白灰階影像,因而喪失了許多有用的信息,當拍攝位置照明不足,或因為色彩的關系使得圖像與背景灰階值差異不大時,很容易導致圖像與背景的灰階梯度拉不開,而無法正確的找出圖像位置,使得后續的辨識品質不能提升,進而降低辨識率。
另外一種方法,將彩色影像轉換成HSI(色調、飽和度、亮度)色彩系統,并定義各種梯度偵測器用以偵測各種彩色邊緣,再透過模糊隸屬函數分別對H、I、S及彩色邊緣圖做處理,在模糊整合后取一個門檻值做二元化,以求得所要的圖像區域,此方法因較為復雜,需要較長的數學運算時間,不適合在線系統使用。
鑒于上述缺點,現有的彩色圖像尋找與定位方法未能達到最佳功效,因而有待改進。
發明內容
本發明的目的即在于提供一種應用于彩色攝影機或數碼相機所拍攝下來的彩色數碼影像的圖像定位方法與裝置,作為影像中特定幾何或字符串圖像尋找與定位的機制,保留彩色信息以增加整體辨識的正確率,方法簡單易于運用并減少運算處理時間,同時可增進后續影像辨識或處理的正確率。
本發明以影像處理技術為核心,利用彩色攝影機或數碼相機擷取包含圖像的彩色數碼影像,以圖像的色彩/色彩飽和度/明暗的水平/垂直方向梯度變化的特性以及先前已知圖像約略大小的信息,進行圖像位置的尋找與定位。
本發明方法保持彩色影像的信息,將彩色影像的RGB Band分別抽出,再計算R Band、G Band及B Band的方向趨勢變化(例如水平/垂直方向的梯度),例如其中第(i,j)點的水平梯度Fi,j求法如下第i列第i行的水平梯度Fi,j=((r(i,j)-r(i,j+1))2+(g(i,j)-g(i,j+1))2+(b(i,j)-b(i,j+1))2)1/2或Fi,j=|r(i,j)-r(i,j+1)|+|g(i,j)-g(i,j+1)|+|b(i,j)-b(i,j+1))|其中r(i,j)=于坐標(i,j)的R Band像素值g(i,j)=于坐標(i,j)的G Band像素值b(i,j)=于坐標(i,j)的B Band像素值本發明方法可以凸顯彩色影像中RGB分別的梯度意義,而不僅僅是求取RGB的平均值來探討黑白灰階的梯度意義,故保留彩色影像的信息再配合先前已知圖像約略大小及紋路(Texture)的信息,可以使得在圖像的定位上更為精確。根據所找到的圖像位置,可使用梯度及Morphology(形態學)的Dilation(擴張)及Erosion(侵蝕)的運算方法再進行圖像的分割。
上述方法可以依圖像的色彩,選擇使用R、G、B Band任一、任二或全部的組合,如圖像為白色,背景為綠色時,則可選擇R及B Band來計算影像梯度(Gradient)值,以增加圖像與背景的對比;而彩色RGB影像也可以轉換成不同的色彩系統,如CMY、YIQ、HSI等,其運算方法與保留彩色信息的意義是相同的。
請參閱以下有關本發明一個較佳實施例的詳細說明及其附圖,將可進一步了解本發明的技術內容及其目的功效;有關該實施例的附圖為圖1為本發明的彩色圖像位置定位模塊流程實施例;圖2為本發明的彩色圖像位置定位、切割與辨識流程實施例;圖3為本發明的彩色影像的圖像定位方法與裝置應用于自動化貨柜辨識流程實施例。
具體實施例方式
請參閱圖1所示,系彩色圖像位置定位模塊流程實施例。將彩色數碼影像輸入,為求加快運算速度,可對彩色數碼影像做向下取樣(Down-sampling),將寬跟高皆每兩點取一點使影像縮小為原始的1/4大小,對縮小或未縮小的影像的RGB三個Band的像素值分別抽取出來,對RGB三個Band的像素值以Fi,j=((r(i,j)-r(i,j+1))2+(g(i,j)-g(i,j+1))2+(b(i,j)-b(i,j+1))2)1/2或Fi,j=|r(i,j)-r(i,j+1)|+|g(i,j)-g(i,j+1)|+|b(i,j)-b(i,j+1))|的方式計算其梯度值,此時所得到的梯度值因保留住彩色的信息,所以在任一色彩邊緣都會較習用的灰階影像所做出的梯度來的強烈,對圖像的定位更加明顯;接下來決定門檻值分別做水平/垂直梯度的二元化,以計算其平均邊緣點,并決定有效列的臨界值,當所有有效列都確定后,對這些有效列做群組化(意即距離近者歸為一組),再來對這些群組以同樣的方式作有效行的認定并做群組化的動作,因此每一列群組內可能會有多個行群組,再對每一列群組取其最大的行群組,最后產生多組候選區,再依先前已知圖像的約略大小及圖像紋理(Texture)特性過濾候選區位置,然后產生出圖像最可能的候選區,再還原成原始大小供后續處理階段使用。
圖2所示的是彩色圖像位置定位、切割與辨識流程實施例。整體彩色圖像位置定位、切割與辨識流程包括(a)彩色影像輸入;(b)彩色圖像位置定位模塊;(c)彩色圖像切割模塊;(d)辨識/處理模塊;(e)辨識結果輸出。這里所定義的圖像以貨柜號碼為例,當貨柜的彩色影像輸入后,經由彩色圖像位置定位模塊利用彩色RGB所運算出的梯度(Gradient)信息,產生貨柜號碼的可能位置,從擷取到的貨柜號碼位置,利用彩色圖像切割模塊分割出貨柜號碼區域,并將各個貨柜號碼字符獨立切割出來,再將切割出來的貨柜號碼字符影像逐一進入辨識/處理模塊進行辨識,在辨識/處理模塊中會將貨柜辨識結果的前10碼與最后一碼做check sum(加總比對法)核對是否正確,最后輸出完整的貨柜號碼。
圖3所示的是詳述本發明所提供的彩色數碼影像的圖像定位方法與裝置應用于自動化貨柜辨識流程實施例,主要包括有彩色數碼影像1、彩色攝影機2、彩色圖像擷取模塊3、彩色圖像定位模塊4、彩色圖像切割模塊5、辨識/處理模塊6及貨柜數據庫7。其中,彩色圖像擷取模塊3負責擷取由彩色攝影機2所拍取的單張彩色數碼影像1,所拍取的貨柜影像供彩色圖像定位模塊4做貨柜號碼位置的定位,再由彩色圖像切割模塊5做貨柜號碼字符串的切割與字符切割,最后由辨識/處理模塊6來執行辨識與后續處理,貨柜號碼辨識結果進入貨柜數據庫7比對是否為核準放行的貨柜車輛,用來作為貨柜車輛進出管制的管理依據。
本發明所提供的彩色數字影像的圖像定位方法與裝置,與現有技術相互比較時,更具有下列的優點該方法不將彩色RGB影像轉換為黑白灰階影像,而是保持彩色影像的信息,將彩色影像的RGB Band分別抽出,再計算R Band、G Band及B Band的方向趨勢變化(例如水平/垂直方向的梯度),以凸顯彩色影像中RGB分別的梯度意義,而不僅僅是求取RGB的平均值來探討黑白灰階的梯度意義,故保留彩色影像的信息再配合先前已知圖像約略大小及紋路(Texture)的信息,可以使得在圖像定位與切割上更為精確。
可以依圖像的色彩種類,選擇使用R、G、B Band三者任一、任二或全部的組合,如圖像為白色,背景為綠色時,則可選擇R及B Band來計算影像梯度(Gradient)值,以增加圖像與背景的對比。
彩色RGB影像可以轉換成不同的色彩系統,如CMY(青、品紅、黃,減色系統)、YIQ(Y指亮度;I、Q指色調,描述色彩及飽和度)、HSI(色調、飽和度、亮度)等,其運算方法與保留彩色信息的意義是相同的。
權利要求
1.一種彩色數碼影像的圖像定位方法,利用彩色CCD攝影機、數碼相機或掃瞄器等彩色影像輸出裝置所產生的彩色數碼影像,進行影像中感興趣的圖像的尋找與定位,其特征為保持彩色影像的信息,將彩色影像的RGB Band分別抽出,再計算R Band、G Band及B Band的方向趨勢變化,以凸顯彩色影像中RGB分別的梯度意義,可以使得在圖像定位與切割上更為精確。
2.按權利要求1所述的彩色數碼影像的圖像定位方法,其特征為依圖像與背景的色彩,選擇使用R、G、B Band三者中的任一、任二或全部的組合來計算方向趨勢變化,以增加圖像與背景的對比。
3.按權利要求1或2所述的彩色數碼影像的圖像定位方法,其特征為其中的方向趨勢變化為梯度計算。
4.按權利要求3所述的彩色數碼影像的圖像定位方法,其特征為其中的梯度計算方式為Fi,j=((r(i,j)-r(i,j+1))2+(g(i,j)-g(i,j+1))2+(b(i,j)-b(i,j+1))2)1/2。
5.按權利要求3所述的彩色數碼影像的圖像定位方法,其特征為其中的梯度計算方式為Fi,j=|r(i,j)-r(i,j+1)|+|g(i,j)-g(i,j+1)|+|b(i,j)-b(i,j+1))|。
6.按權利要求1所述的彩色數碼影像的圖像定位方法,其特征為其中的彩色RGB影像也可以轉換成CMY色彩系統,計算C Band、M Band及Y Band的方向趨勢變化,以凸顯彩色影像中CMY分別的梯度意義,其運算方法與保留彩色信息的意義是相同的,可以使得在圖像定位與切割上更為精確。
7.按權利要求1所述的彩色數碼影像的圖像定位方法,其特征為其中的彩色RGB影像也可以轉換成YIQ色彩系統,計算Y Band、I Band及Q Band的方向趨勢變化,以凸顯彩色影像中YIQ分別的梯度意義,其運算方法與保留彩色信息的意義是相同的,可以使得在圖像定位與切割上更為精確。
8.按權利要求1所述的彩色數碼影像的圖像定位方法,其特征為其中的彩色RGB影像也可以轉換成HSI色彩系統,計算H Band、S Band及I Band的方向趨勢變化,以凸顯彩色影像中HSI分別的梯度意義,其運算方法與保留彩色信息的意義是相同的,可以使得在圖像定位與切割上更為精確。
9.按權利要求6或7或8所述的彩色數碼影像的圖像定位方法,其特征為其中的方向趨勢變化為梯度計算。
10.一種彩色數碼影像的圖像定位裝置,包含彩色圖像定位的處理器與內存,利用彩色攝影機、數碼相機或掃瞄器等彩色影像輸出裝置所產生的彩色數碼影像,進行影像中感興趣的圖像的尋找與定位,其特征為彩色圖像定位的處理器保持彩色影像的信息,將彩色影像的RGB Band分別抽出,再計算R Band、G Band及B Band的方向趨勢變化,以凸顯彩色影像中RGB分別的梯度意義,可以使得在圖像定位與切割上更為精確。
11.按權利要求10所述的彩色數碼影像的圖像定位裝置,其特征為彩色圖像定位的處理器依圖像與背景的色彩,選擇使用R、G、B Band三者中的任一、任二或全部的組合來計算方向趨勢變化,以增加圖像與背景的對比。
12.按權利要求10或11所述的彩色數碼影像的圖像定位裝置,其特征為其中的方向趨勢變化為梯度計算。
13.按權利要求12所述的彩色數碼影像的圖像定位裝置,其特征為其中的梯度計算方式為Fi,j=((r(i,j)-r(i,j+1))2+(g(i,j)-g(i,j+1))2+(b(i,j)-b(i,j+1))2)1/2。
14.按權利要求12所述的彩色數碼影像的圖像定位裝置,其特征為其中的梯度計算方式為Fi,j=|r(i,j)-r(i,j+1)|+|g(i,j)-g(i,j+1)|+|b(i,j)-b(i,j+1))|。
15.按權利要求10所述的彩色數碼影像的圖像定位裝置,其特征為其中的彩色RGB影像也可以轉換成CMY色彩系統,計算C Band、M Band及Y Band的方向趨勢變化,以凸顯彩色影像中CMY分別的梯度意義,其運算方法與保留彩色信息的意義是相同的,可以使得在圖像定位與切割上更為精確。
16.按權利要求10所述的彩色數碼影像的圖像定位裝置,其特征為其中的彩色RGB影像也可以轉換成YIQ色彩系統,計算Y Band、I Band及Q Band的方向趨勢變化,以凸顯彩色影像中YIQ分別的梯度意義,其運算方法與保留彩色信息的意義是相同的,可以使得在圖像定位與切割上更為精確。
17.按權利要求10所述的彩色數碼影像的圖像定位裝置,其特征為其中的彩色RGB影像也可以轉換成HSI色彩系統,計算H Band、S Band及I Band的方向趨勢變化,以凸顯彩色影像中HSI分別的梯度意義,其運算方法與保留彩色信息的意義是相同的,可以使得在圖像定位與切割上更為精確。
18.按權利要求15或16或17所述的彩色數碼影像的圖像定位裝置,其特征為其中的方向趨勢變化為梯度計算。
全文摘要
本發明為一種彩色數碼影像的圖像定位方法與裝置,利用彩色數碼影像中圖像的水平/垂直方向的色彩/色彩飽和度/明暗等的方向趨勢變化的特性以及已知圖像約略大小及紋路的信息,進行圖像位置的定位;根據以上所定位出的圖像,將其切割出來后,即可應用影像辨識或影像處理方法做后續的辨識與處理。
文檔編號G06K9/20GK1687960SQ20051007247
公開日2005年10月26日 申請日期2005年5月20日 優先權日2005年5月20日
發明者吳坤榮, 柳恒崧, 白家榮 申請人:中華電信股份有限公司