專利名稱:圖像處理裝置、圖像形成裝置、圖像讀取裝置及圖像處理方法
技術領域:
本發明涉及一種用于基于從獲取的圖像獲得的特征矢量確定與預先登記的圖像的相似度的圖像處理裝置,還涉及包括該圖像處理裝置的圖像形成裝置和圖像讀取裝置,以及圖像處理方法。
背景技術:
已經提出了某些方法作為其中用掃描儀讀取文檔、并且將通過讀取該文檔獲得的圖像數據與預先登記的圖像數據進行匹配以確定所述圖像之間的相似度的圖像處理,例如一種方法,其中通過OCR(光符閱讀器,OpticalCharacter Reader)從一圖像提取關鍵字,并且基于所提取的關鍵字確定圖像之間的相似度;以及一種方法,其限制相似度要被確定的圖像以形成帶有格線(ruled lines)的圖像,并提取格線的特征以確定圖像之間的相似度。
但是,在這些確定處理中,為了準確地確定圖像之間的相似度,需要校正要讀取的文檔的傾斜(傾斜校正),并且如果不能進行傾斜校正,就會出現不能準確地確定圖像之間的相似度的問題。而且,由于確定圖像之間的相似度的處理很復雜,很難以硬件實現該處理。當通過簡單的算法來實現相似度確定處理時,能夠簡單地實現為硬件。但是,很難提高確定準確性,而且還有對傾斜或諸如噪音的外部干擾的容限(tolerance)不足的問題。
因此,例如提出了一種方法(Nakai Tomohiro和其他三人,“DocumentImage Retrieval Based on Cross-Ratio and Hashing”(基于交比和散列法的文檔圖像檢索),The Institute of Electronics,Information and CommunicationEngineers Technical Research Report(電子協會,信息與通信工程師技術研究報告),2005年3月),該方法計算文檔圖像中的連接部分(connectedcomponent)的重心(centroid),提取計算的重心作為連接部分的特征點,并基于提取的特征點計算對于圖像的旋轉或傾斜的不變量(invariant)以確定圖像之間的相似度,由此能夠準確地確定圖像之間的相似度,即使目標圖像被傾斜或包括沒有包含在預先登記的圖像中的書寫。
作為一種用于計算圖像圖形的重心的方法,提出了一種能夠高速計算重心坐標的圖像處理方法,通過把像素矩陣看作一個單元將圍住目標圖形的外接長方形劃分為多個塊,定義每個塊的相對原點和相對坐標,并對每個塊執行預定的處理(參見日本專利申請公開特許公報No.61-260370)。
而且,作為一種用于計算圖像中特定圖形的重心的裝置,提出了一種能夠高速計算重心的裝置,通過在特定目標對象上設定外接正方形,并且并行地提取設定的特定目標對象的區域和重心值(參見日本專利申請公開特許公報No.10-79035)。
但是,在上述非專利文檔“基于交比和散列法的文檔圖像檢索”公開的方法中,當計算連接部分的重心時,讀取和存儲關于一個頁面的圖像數據,二進制化關于一個頁面的存儲的圖像數據,執行標簽(label)分配以便示出每個像素包含在哪個連接部分中,對于每個連接部分累加包含在連接部分中的像素的坐標值,并且坐標值的和被除以包含在連接部分的中的像素數量以計算連接部分的重心。從而,為了計算重心,需要存儲一個頁面的圖像數據。例如,當通過ASIC實現圖像處理時,如果存儲器容量增加,門電路的數量也增加,因此電路規模變得更大,作為實現規模的硬件的圖像處理的實現很困難,并且成本提高了。
在日本專利申請公開特許公報No.61-260370中公開的方法中,當從掃描儀獲取圖像數據時,以逐行的基礎從掃描儀輸入圖像數據,因此需要與包含在塊中的行數相對應的行緩沖器(line buffer),以便以逐塊的基礎執行處理。因此,當通過使用相對較大的塊來執行處理時,存在需要較大存儲器的問題。而且,在日本專利申請公開特許公報No.10-79035中公開的裝置中,存在從其計算重心的連接部分的形狀受到限制的問題。
發明內容
為了解決上述問題提出了本發明,并且本發明的目的是提供一種圖像處理裝置,能夠同時執行標注(labeling)和特征點提取,與現有技術相比能夠減少需要的存儲器容量,能夠實現為硬件,并且能夠通過沿著預定掃描方向存儲包含在多行中的像素的標簽而高速地確定圖像之間的相似度,確定包含在多行中的當前行中的像素是否被分配了與被分配給包含在緊接在當前行之前掃描的行中的像素的標簽相同的標簽,并且當確定沒有被分配相同的標簽時,提取其中被分配了相同標簽的像素被互相連接的連接部分的特征點,并且本發明的目的還是提供一種圖像形成裝置,一種包括該圖像處理裝置的圖像讀取裝置,以及一種圖像處理方法。
本發明的另一個目的是提供一種圖像處理裝置,其包括累加裝置,用于在確定分配了相同標簽時累加分配了相同標簽的像素的坐標值;用于相關于每個標簽存儲分配所述標簽的像素的坐標值的和的裝置,并基于存儲的坐標值和包含在連接部分中的像素數量,通過提取其中分配了相同標簽的像素互相連接的連接部分的特征點來同時執行標注和特征點提取,并且因此與現有技術相比能夠減少需要的存儲器容量,能夠實現為硬件,并能夠高速確定圖像之間的相似度,并且本發明的目的還是提供包括該圖像處理裝置的圖像形成裝置和圖像讀取裝置。
本發明的再一個目的是提供一種圖像處理裝置,其包括二進制化裝置,用于基于包含在像素塊中的像素的亮度(luminance)值或明度(lightness)值,計算由圖像的多個像素組成的每個像素塊的閾值,并基于計算的閾值二進制化計算閾值的像素塊中的圖像,并因此能夠實現為硬件,并能夠通過主動地(actively)計算用于二進制化的閾值以及穩定地(stably)指定連接部分而準確地確定圖像之間的相似度,并且本發明的目的還是提供包括該圖像處理裝置的圖像形成裝置和圖像讀取裝置。
本發明的又一個目的是提供一種圖像處理裝置,其包括用于基于通過在預定方向上掃描像素塊中的像素而獲得的像素的亮度值或明度值來計算亮度值或明度值的統計值的裝置,以及用于存儲為像素塊中每個掃描方向計算的統計值,并基于像素塊中每個掃描方向的統計值計算閾值,并且因此能夠通過簡單地存儲像素塊中每行的統計值,而為每個像素塊并行地執行二進制化處理的閾值計算和圖像的二進制化的裝置,并且本發明的目的還是提供包括該圖像處理裝置的圖像形成裝置和圖像讀取裝置。
本發明的再一個目的是提供一種圖像處理裝置,其能夠準確確定圖像之間的相似度,通過去除確定圖像之間相似度不需要的高頻成分,通過二進制化由用于執行空間過濾處理來校正圖像的空間頻率特性的裝置處理的圖像,以及即使在使用不同圖像輸入裝置時、登記圖像數據時、以及匹配圖像數據時,根據輸入裝置的特性校正圖像的惡化(degradation),并且本發明的目的還是提供包括該圖像處理裝置的圖像形成裝置和圖像讀取裝置。
本發明的又一個目的是提供一種圖像處理裝置,其能夠即使在通過由用于轉換圖像分辨度的裝置轉換的圖像的二進制化而改變分辨度時確定圖像之間的相似度,并且能夠通過在將圖像轉換為比圖像輸入裝置讀取的分辨度低的分辨度之后執行處理來減少處理量,并且本發明的目的還是提供包括該圖像處理裝置的圖像形成裝置和圖像讀取裝置。
根據本發明的圖像處理裝置的特征在于包括標簽分配部分,用于掃描通過以預定方向二進制化圖像而獲得的二進制圖像的像素,以及根據關于各個像素的二進制化信息分配標簽給像素;標簽存儲部分,用于沿著預定方向對于多行的每一行順序地存儲關于分配的標簽的信息;坐標值存儲部分,用于存儲關于在二進制圖像中分配了相同標簽的像素的坐標值的信息;確定部分,用于確定在多行中的當前行是否存在分配了與分配給包含在緊接在當前行之前掃描的行中的像素的標簽相同的標簽的像素;特征點計算部分,用于在確定沒有像素被分配了相同的標簽時,基于坐標值存儲部分中存儲的關于坐標值的信息,計算其中由坐標值指定的像素互相連接的連接部分中的特征點;特征矢量計算部分,用于基于計算的特征點計算代表圖像特征的特征矢量;以及類似確定部分,用于基于計算的特征矢量確定與其它圖像的類似(analogy)。
根據本發明的圖像處理裝置,其包括累加器部分,用于在確定在當前行中存在分配了相同標簽的像素時,累加分配了相同標簽的像素的坐標值,其中基于關于坐標值之和的信息以及分配了相同標簽的像素數量來計算特征點。
根據本發明的圖像處理裝置的特征在于包括閾值計算部分,用于基于包含在像素塊中的像素的亮度值或明度值,對由多個像素組成的每個像素塊計算閾值;以及二進制化部分,用于基于計算的閾值二進制化像素塊中的圖像。
根據本發明的圖像處理裝置的特征在于基于通過以預定方向掃描像素塊中的像素而獲得的像素的亮度值或明度值計算亮度值或明度值的統計值,以及基于計算的統計值計算閾值。
根據本發明的圖像處理裝置的特征在于包括空間過濾器處理部分,用于執行空間過濾處理以校正圖像的空間頻率特性,其中空間頻率特性由空間過濾器處理部分校正的圖像被二進制化。
根據本發明的圖像處理裝置的特征在于包括分辨度轉換部分,用于轉換圖像的分辨度,其中分辨度由分辨度轉換部分轉換的圖像被二進制化。
根據本發明的圖像形成裝置的特征在于包括由上述發明定義的圖像處理裝置;以及圖像形成部分,用于在薄頁上形成由圖像處理裝置處理的圖像。
根據本發明的圖像讀取裝置的特征在于包括用于讀取圖像的圖像讀取部分;以及由上述發明定義的圖像處理裝置,用于處理在圖像讀取部分中讀取的圖像。
根據本發明的圖像處理方法的特征在于掃描通過以預定方向二進制化圖像而獲得的二進制圖像的像素;根據關于各個像素的二進制化信息將標簽分配給像素;對于沿著預定方向的多行的每一行順序地存儲關于分配的標簽的信息;確定在多行中的當前行中是否存在分配了與分配給包含在緊接在當前行之前掃描的行中的像素的標簽相同的標簽的像素;當確定沒有被分配相同標簽的像素時,基于存儲的關于坐標值的信息計算在其中由坐標值指定的像素互相連接的連接部分中的特征點;基于計算的特征點計算代表圖像特征的特征矢量;以及基于計算的特征矢量確定與其它圖像的類似。
在本發明中,以預定方向掃描包含在當前行中的當前像素,例如基于關于在與當前像素鄰接的預定范圍內、并且包含在當前行以及緊接在當前行之前的行中的像素的二進制信息(例如,“1”或“0”)將標簽分配給當前像素,以及存儲分配的標簽。請注意在當前行是二進制圖像的第一行時,基于關于當前像素的二進制化信息分配標簽,存儲分配的標簽,并且把當前行的下一行當作當前行執行類似的處理。從而,存儲包含在當前行以及緊接在當前行之前的行中的像素的標簽。
當通過掃描包含在當前行中的當前像素來分配標簽時,確定與分配給包含在緊接在當前行之前的行中的像素的標簽相同的標簽是否被分配給包含在當前行中的像素。當確定沒有被分配相同的標簽時,確定分配了相同標簽的連接部分在當前行結束,并且提取其中分配了相同標簽的像素連接在一起的連接部分中的特征點。因此,并行地執行標注包含在當前行中的當前像素以及確定是否分配了相同的標簽。當完成對當前像素的處理時,把下一行當作當前行,并重復相同的處理。因此,通過簡單地存儲多行(例如,兩行)像素的標簽,能夠標注二進制圖像并提取連接部分中的特征點。
在本發明中,當通過掃描包含在當前行中的當前像素分配標簽時,確定與分配給包含在緊接在當前行之前的行中的像素的標簽相同的標簽是否被分配給包含在當前行中的像素。當確定分配了相同的標簽時,累加分配了相同標簽的像素的坐標值(例如,二進制圖像中像素的x坐標和y坐標),并存儲坐標值的和。提取裝置基于在通過將分配了相同標簽的像素連接在一起形成的連接部分中的坐標值的和,以及包含在連接部分中的像素數量,提取連接部分中的特征點。例如,能夠通過將坐標值的和除以像素數量來提取連接部分的重心作為特征點。因此,不限制從其提取特征點的連接部分的形狀,并且能夠準確提取任意圖形中的特征點。而且,通過簡單地將坐標值的和與標簽相關聯地存儲,能夠并行地執行二進制圖像的標注和連接部分中的特征點的提取(例如,連接部分的重心的計算)。
在本發明中,對于由圖像的多個像素組成的每個像素塊,基于包含在像素塊中的像素的亮度值或明度值計算閾值。基于計算的閾值,二進制化裝置二進制化計算了閾值的像素塊中的圖像。因此能夠動態地計算每個像素塊的二進制化的閾值。
在本發明中,基于通過以預定方向掃描像素塊中的像素而獲得的各個像素的亮度值或明度值,計算量度值或明度值的統計值(例如,平均數)。存儲像素塊中對每個掃描方向計算的統計值,并基于對每個掃描方向存儲的統計值計算閾值(例如,如果統計值是平均值,則進一步平均該平均值)。通過簡單地存儲像素塊中的每一行的統計值,能夠對每個像素塊并行地執行圖像中像素塊中的像素的亮度值或明度值的統計值的計算以及像素塊中的圖像的二進制化。
在本發明中,在二進制化圖像之前校正圖像的空間頻率特性。例如,校正由于用于輸入圖像的圖像輸入裝置(例如,圖像讀取裝置)的光學特性中的差別導致的圖像的空間頻率特性,并且即使在使用不同的圖像輸入裝置,修復圖像的惡化(例如,模糊的圖像)。而且,去除提取二進制圖像中的特征點不需要的高頻成分。換句話說,通過空間過濾處理對圖像執行邊緣強化處理和平滑處理。
在本發明中,在二進制化圖像之前轉換圖像的分辨度。例如,當在用于輸入圖像的圖像輸入裝置(例如,圖像讀取裝置)中放大圖像的分辨度時,將圖像再次放大到預定分辨度。從而,即使在改變分辨度時,也能夠提取二進制圖像的特征點而不受改變的影響。當預定分辨度被設定為小于在圖像輸入裝置中讀取圖像的分辨度,能夠減少在后級(subsequent stage)中的處理量。
在本發明中,沿著預定掃描方向存儲包含在多行(例如,兩行)中的各個像素的標簽,并且當包含在多行中當前行的像素中,確定沒有像素被分配了與被分配給包含在緊接在當前行之前掃描的行中的像素的標簽相同的標簽,提取在通過將分配了相同標簽的像素連接在一起而形成的連接部分中的特征點。因此,通過簡單地存儲多行(例如,兩行)像素的標簽,能夠同時執行標注和特征點提取,與現有技術相比能夠減少需要的存儲器容量,能夠將圖像處理時限為硬件,以及能夠高速確定圖像之間的像素性。
本發明包括累加裝置,用于在確定分配了相同標簽時累加分配了相同標簽的像素的坐標值,以及用于將分配了相同標簽的像素的坐標值的和與每個標簽相關聯的存儲的裝置。通過基于包含在通過將分配了相同標簽的像素連接在一起形成的連接部分中的像素的坐標值的和以及像素數量提取連接部分中的特征點,那個提取任意圖形中的特征點。而且,能夠同時執行標注和特征點提取,與現有技術相比能夠減少需要的存儲器容量,并且能夠準確地高速確定圖像之間的相似度。
本發明包括二進制化裝置,用于基于包含在像素塊中的像素的亮度值或明度值對由圖像中的多個像素組成的每個像素塊計算閾值,并且基于計算的閾值二進制化計算閾值的像素塊中的圖像。因此,能夠將圖像處理實現為硬件,能夠動態地計算二進制化的閾值,穩定地指定連接部分,并準確地確定圖像之間的相似度。
本發明包括用于基于通過以預定方向掃描像素塊中的像素而獲得的各個像素的亮度值或明度值計算量度值或明度值的統計值的裝置;以及用于存儲對像素塊中每個掃描方向計算的統計值,并且基于由該裝置對每個掃描方向存儲的統計值計算閾值。因此,通過簡單地存儲像素塊中每一行的統計值,能夠對每個像素塊并行地執行用于二進制化的統計值的計算以及圖像的二進制化。
在本發明中,通過二進制化由用于執行空間過濾處理的裝置處理的圖像來校正圖像的空間頻率特性,即使在使用不同的圖像輸入裝置時也能夠修復圖像的惡化(例如,模糊的圖像)。還能夠去除確定圖像之間的相似度不需要的高頻成分,并且能夠準確地確定圖像之間的相似度。
在本發明中,二進制化由用于轉換圖像的分辨度的裝置轉換的圖像。因此,即使改變分辨度時,能夠提取二進制圖像中的特征點,而不受所述改變的影響,并且能夠準確地確定圖像之間的相似度。而且,當預定分辨度被設定為小于在圖像輸入裝置中讀取圖像的分辨度,能夠減少在后級中的處理量。
通過以下結合附圖的詳細說明,本發明的上述和其它目的和特征將更加清楚。
圖1是示出包括根據實施例的圖像處理裝置的圖像形成裝置的結構的框圖;圖2是示出文檔匹配處理部分的結構的框圖;圖3是示出特征點計算部分的結構的框圖;圖4是示出過濾部分的過濾器系數的例子的說明圖;圖5是示出在二進制化部分中執行的二進制化處理的說明圖;圖6是示出緩沖器結構的示意圖;圖7是示出在重心計算部分中執行的重心計算處理(特征點提取)的說明圖;圖8是示出在重心計算部分中用于標簽分配處理的鄰近像素的例子的說明圖;圖9是示出標簽等價表的例子的說明圖;圖10是示出坐標值緩沖器的結構的說明圖;圖11A到圖11C是示出標志(flag)的轉變的例子的說明圖;圖12是示出連接部分中的特征點的例子的說明圖;圖13是示出提取字符串中的特征點的結果的例子的說明圖;圖14是示出當前特征點和周邊特征點的說明圖;圖15A到圖15C是示出基于當前特征點計算不變量的例子的說明圖;圖16A到圖16C是示出基于當前特征點計算不變量的例子的說明圖;以及圖17A和圖17B是示出散列表結構的說明圖。
具體實施例方式
以下將基于附圖解釋實施例。圖1是示出包括根據這個實施例的圖像處理裝置的圖像形成裝置100的結構的框圖。圖像形成裝置100包括彩色圖像輸入裝置1、彩色圖像處理裝置2(圖像處理裝置)、彩色圖像輸出裝置3作為圖像形成裝置、以及用于執行各種操作的操作面板4。通過以彩色圖像輸入裝置1讀取文檔而獲得的RGB(R紅、G綠、B藍)模擬信號的圖像數據被輸出到彩色圖像處理裝置2,經過彩色圖像處理裝置2中的預定處理,然后輸出到彩色圖像輸出裝置3作為代表CMYK(C青、M品紅、Y黃、K黑)的數字彩色信號。
例如,彩色圖像輸入裝置1是包括CCD(電荷耦合器件)的掃描儀,讀取來自文檔圖像的反射的光圖像作為RGB模擬信號,并將讀取的RGB信號輸出到彩色圖像處理裝置2。彩色圖像輸出裝置3是電子照相型或噴墨型打印機,用于將文檔圖像的圖像數據輸出到記錄紙張(paper)上。彩色圖像輸出裝置3可以是顯示裝置,諸如顯示器。
彩色圖像處理裝置2由后述處理部分組成,并且包括ASIC(特定用途集成電路)。
A/D轉換部分20將從彩色圖像輸入裝置1輸入的RGB模擬信號轉換為10位的數字信號,例如,并將轉換的RGB信號輸出到斑點校正(shadingcorrection)部分21。
斑點校正部分21對輸入的數字RGB信號執行校正處理以便去除在彩色圖像輸入裝置1的照明系統、圖像聚焦系統以及攝像系統等導致的各種類型的惡化,并將校正的RGB信號輸出到輸入色調(tone)校正部分22。
輸入色調校正部分22對輸入的RGB信號(RGB反射率信號)執行調整彩色平衡的處理以及去除背景密度或調整諸如對比度的圖像質量的處理。此外,輸入色調校正部分22執行將RGB信號轉換為諸如由彩色圖像處理裝置2使用的圖像處理系統容易地處理的密度信號之類的信號的處理,并將處理的RGB信號輸出到分割(segmentation)處理部分23。
分割處理部分23根據輸入的RGB信號將輸入圖像的像素分割為字符區域、半色調(halftone)區域、或照片區域。基于分割結果,分割處理部分23將分割類別信號(segmentation class signal)輸出到黑生成和底色去除部分(black generation and under color removal section)26、空間過濾器處理部分27、輸出色調校正部分28和色調再現處理部分29,其中該分割類別信號表示各像素所屬的區域。分割處理部分23還將輸入信號照其樣子(as they are)輸出到位于后級中的文檔匹配處理部分24。
文檔匹配處理部分24二進制化輸入圖像、基于二進制圖像計算指定連接部分中的特征點,基于結果確定輸入圖像和預先登記的圖像(包括文本圖像)之間的相似度。當文檔匹配處理部分24確定圖像互相相似時,其輸出指定對類似文檔的預設處理的分類信號,并執行預定處理。例如,當輸入圖像被確定為類似文檔時,文檔匹配處理部分24執行處理,諸如取消文檔的輸出、禁止文檔的復制、以及在預定文件夾中歸檔(filing)文檔。因此,不但能夠執行圖像(包括文本圖像)的匹配,還能夠執行根據匹配結果的處理。而且,文檔匹配部分24將輸入的RGB信號照其樣子輸出到位于后級中的色調校正部分25。
彩色校正部分25將輸入的RGB信號轉換為CMY色空間,根據彩色圖像輸出裝置3的特性執行彩色校正,并將校正的CMY信號輸出到黑生成和底色去除部分26。更具體地講,為了如實地再現彩色,彩色校正部分25去除包括無用的吸收成分的CMY色材(color materials)的光譜特性上的色濁雜質(color haze impurity)。
黑生成和底色去除部分26基于從彩色校正部分25輸入的CMY信號生成K(黑)信號,從輸入的CMY信號中減去K信號以生成新的CMY信號,并將生成的CMYK信號輸出到空間過濾器處理部分27。
例示了在黑生成和底色去除部分26中執行的處理的例子。例如,當由骨架黑(skeleton black)執行黑生成時,如果骨架曲線的輸入/輸出特性為y=f(x),要輸入的數據為C、M和Y,要輸出的數據為C′、M′、Y′和K′,并且UCR(底色去除)比率為α(0<α<1),則要由黑生成底色去除處理輸出的數據表達為K′=f{min(C,M,Y)},其中C′=C-αK′,M′=M-αK′,以及Y′=Y-αK′。
對于從黑生成和底色去除部分26輸入的CMYK信號,空間過濾器處理部分27基于區域識別信號使用數字過濾器執行空間過濾處理。因此,校正圖像數據的空間頻率特性,由此防止彩色圖形輸出裝置3中輸出圖像的模糊或粒狀惡化。例如,在由分割處理部分23分割為字符區域的區域中,為了特別增強非彩色文本(黑色文本)或有色文本(彩色文本)的再現性,空間過濾器處理部分27通過執行邊緣增強處理增強高頻成分。而且,空間過濾器處理部分27執行低通濾波處理以去除在由分割處理部分23分割為半色調區域的區域中輸入的半色調成分。空間過濾器處理部分27將處理的CMYK信號輸出到輸出色調校正部分28。
輸出色調校正部分28執行輸出色調校正處理,用于將從空間過濾器處理部分27輸入的CMYK信號轉換為彩色圖像輸出裝置3的特性值的半色調區域比率,并在輸出色調校正處理之后將CMYK信號輸出到色調再現處理部分29。
色調再現處理部分29基于從分割處理部分23輸入的區域識別信號對從輸出色調校正部分28輸入的CMYK信號執行預定處理。例如,為了特別增強非彩色文本(黑色文本)或彩色文本的再現,色調再現處理部分29在分割為字符區域的區域上執行二進制化處理或多級抖動處理,以便該區域適于在彩色圖像輸出裝置3中再現高頻成分。
此外,色調再現處理部分29在分割處理部分23中分割為半色調區域的區域上執行色調再現處理(半色調生成),以最終將圖像分離為像素,并再現它們的灰度級。另外,色調再現處理部分29執行二進制化處理或多級抖動處理,以便使在分割處理部分23中分割為照片區域的區域適于彩色圖像輸出裝置3中再現色調。
彩色圖像處理裝置2在存儲部分(未示出)中臨時存儲由色調再現處理部分29處理的圖像數據(CMYK信號),在形成圖像的預定定時讀取存儲在存儲部分中的圖像數據,并將讀取的圖像數據輸出到彩色圖像輸出裝置3。這些操作的控制例如由CPU(未示出)來執行。
圖2是示出文檔匹配處理部分24的結構的框圖。文檔匹配處理部分24包括特征點計算部分241、特征矢量計算部分242、投票處理部分243、相似度確定部分244、存儲器245、以及用于控制上述各個部分的控制器246。
特征點計算部分241執行后面描述的對輸入圖像的預定處理,并且還二進制化輸入圖像,提取(計算)在基于二進制圖像指定的連接部分中的特征點(例如,通過累加在組成連接部分的像素的二進制圖像中的坐標值,并將坐標值的和除以包含在連接部分中的像素的數量而獲得的值),并將提取的特征點輸出到特征矢量計算部分242。
圖3是示出特征點計算部分241的結構的框圖。特征點計算部分241包括信號變換部分2410、分辨度轉換部分2411、過濾部分2412、二進制化部分2413和重心計算部分2414。
當輸入圖像是彩色圖像時,信號變換部分2410將彩色圖像變換為亮度信號或明度信號,并將轉換的圖像輸出到分辨度轉換部分2411。例如,亮度信號Y可以表達為Yj=0.30×Rj+0.59×Gj+0.11×Bj,其中Rj、Gj和Bj分別是各個像素R、G和B的彩色成分,而Yj是每個像素的亮度信號。請注意本發明并不局限于以上等式,還可以將RGB信號轉換為CIE1976L*a*b*信號。
即使在輸入圖像被彩色圖像輸入裝置1光學放大時,分辨度轉換部分2411再將輸入圖像放大到預定分辨度,然后將放大的圖像輸出到過濾部分2412。從而,即使在分辨度被彩色圖像輸入裝置1中執行的放大處理改變時,能夠提取特征點而不受這個改變的影響,并且還能夠準確地確定圖像之間的相似度。特別的,在縮小的字符的情況下,當通過執行二進制化處理指定連接部分時,能夠防止在由于字符被擠壓而使得原始分離的區域被連接在一起的狀態中指定連接部分,以及能夠防止要計算的重心被移位(displaced)。而且,分辨度轉換部分2411將圖像轉換為小于在彩色圖像輸入裝置1等倍(equalmagnification)讀取的圖像的分辨度的分辨度。例如,在彩色圖像輸入裝置1以600dpi(點每英寸)讀取的圖像被轉換為300dpi。因此,能夠減少在后級中的處理量。
過濾部分2412校正輸入圖像的空間頻率特性(諸如,例如,圖像的增強處理和平滑處理),并將校正的圖像輸出到二進制化部分2413。由于彩色圖像輸入裝置1的空間頻率特性根據裝置的類型而不同,過濾部分2412將不同的空間頻率特性校正為期望的特性。由彩色圖像輸入裝置1輸出的圖像(例如,圖像信號)經受由于包括透鏡或鏡面的光學部件的綜合效果、CCD光接收表面的孔徑度(aperture degree)、轉移效率、余象、以及物理掃描,以及掃描偏差所導致的惡化,諸如模糊的圖像。過濾部分2412通過增強邊界或邊緣修復諸如模糊圖像的惡化。而且,過濾部分2412執行平滑處理,用于抑制在后級中執行的特征點提取處理不需要的高頻成分。因此能夠準確地提取特征點,并從而能夠準確地確定圖像之間的相似度。
圖4是示出過濾部分2412的過濾器系數的例子的說明圖。如圖4所示,空間過濾器是用于執行增強處理和平滑處理的7×7(7行、7列)混合過濾器。掃描輸入圖像中的像素,并對所有像素執行使用空間過濾器的計算處理。請注意空間過濾器的尺寸并不限于7×7,也可以是3×3、5×5等。而且,過濾器系數的數值僅僅是一個例子,過濾器系數不限于此,可以根據要使用的彩色圖像輸入裝置1的裝置類型或特性而適當地設定。
二進制化部分2413通過將圖像的亮度值(亮度信號)或明度值(明度信號)與閾值進行比較,并將二進制化的二進制圖像輸出到重心計算部分2414。
圖5是示出由二進制化部分2413執行的二進制化處理的說明圖。圖5示出文檔的一個頁面上的圖像,以圖像左上角作為原點的橫向和縱向分別表示主掃描方向和子掃描方向。在主掃描方向上每行有3584個像素,并且在主掃描方向上圖像的一行被分為28個塊,表示為像素塊A1、A2、……A28,每個塊由128×128個像素組成。
二進制化部分2413包括緩沖器2413a,用于對每一行存儲包含在像素塊A1、A2、……A28的主掃描方向上的一行中的128個像素的亮度值的平均值。
圖6是示出緩沖器2413a的結構的示意圖。由于像素塊A1、A2、……A28的每一個包括128行,每行包括128個像素,該緩沖器2413a存儲像素塊A1、A2、……A28的每一個的128行的平均值,即128個平均值。例如,如圖6所示,對像素塊A1,以逐行基礎對各個區域(1,1)、(2,1)、……(128,1)中的128行存儲128個像素的亮度值的平均值。
二進制化部分2413計算閾值用于對像素塊A1、A2、……A28的每一個執行二進制化處理,并通過使用對像素塊A1、A2、……A28的每一個計算的閾值二進制化在像素塊A1、A2、……A28的每一個中的圖像。更具體地講,二進制化部分2413對像素塊A1、A2、……A28的每一個計算主掃描方向上第一行中像素(128個像素)的亮度值的平均值,并將計算的平均值存儲在緩沖器2413a的各個區域(1,1)、(1,2)、……(1,28)。因此,在緩沖器2413a中,在圖像的主掃描方向上每行存儲28個平均值。
二進制化部分2413移動到子掃描方向上的下一行,對像素塊A1、A2、……A28的每一個計算主掃描方向上第二行中的像素(128個像素)的亮度值的平均值,并將計算的平均值存儲在緩沖器2413a的各自區域(2,1)、(2,2)、……(2,28)。二進制化部分2413對子掃描方向上的128行重復相同的處理。因此,二進制化部分2413存儲對應像素塊A1、A2、……A28的每一個的128行的平均值。
二進制化部分2413還平均對應于為像素塊A1、A2、……A28的每一個存儲的128行的平均值,以計算平均值,并使用計算的平均值作為用于二進制化處理的閾值。例如,通過平均存儲在緩沖器2413a的各個區域(1,1)、(2,1)、……(128,1)中的平均值來計算像素塊A1的閾值。
二進制化部分2413掃描主掃描方向上像素塊A1、A2、……A28中圖像的當前像素,并分別基于對像素塊A1、A2、……A28計算的閾值對它們進行二進制化。當完成對像素塊A1、A2、……A28的閾值計算和二進制化處理時,二進制化部分2413對子掃描方向上接下來的128行重復相同的處理以二進制化整個圖像。請注意閾值計算并不限于使用亮度值的平均值的結構,并可以使用諸如亮度值的中值的其它統計值。
借助于緩沖器2413a,由于與通過參考整個圖像的廣泛區域的像素的亮度值計算閾值相比,不需要使用大容量的存儲器(storage memory),能夠將圖像處理實現為硬件。而且,對期望尺寸的每個像素塊主動地計算閾值。從而,當基于二進制圖像指定連接部分時,能夠穩定地指定連接部分而不受由諸如掃描儀的彩色圖像輸入裝置的特性導致的改變、以及文檔自身的頁面背景的影響。因此,能夠準確地計算連接部分的特征點(例如,重心),并且能夠提高確定圖像之間的相似度的準確性。此外,由于對每個像素塊并行地執行閾值計算和二進制化處理,因此即使在主動地計算閾值時也能夠高速執行二進制化處理。
重心計算部分2414包括后面描述的標簽緩沖器2414a、坐標值緩沖器2414b和標簽等價表,并基于在從二進制化部分2413輸入的二進制圖像中有關每個像素的二進制化信息(例如,用“1”、“0”表示)執行對每個像素的標注(標簽分配處理),指定其中分配了相同標簽的像素被連接在一起的連接部分,提取在指定的連接部分中的重心作為特征點,并將提取的特征點輸出到特征矢量計算部分242。請注意特征點可以用二進制圖像中的坐標值(x坐標、y坐標)來表達。
圖7是示出在重心計算部分2414中執行的重心計算(特征點提取)處理的說明圖。在圖7中,雖然以16×16像素的尺寸示出圖像以便簡化說明,實際圖像可以例如具有3584×3584像素的尺寸。重心計算部分2414包括用于存儲包含在沿著二進制圖像的主掃描方向的兩行(當前行和緊接在當前行之前處理的行)中的像素(圖7中16×2=32像素)的標簽的標簽緩沖器2414a。
圖8是示出在重心計算部分中用于標簽分配處理的鄰近(neighboring)像素的例子的說明圖。如圖8所示,當通過掃描主掃描方向上的當前像素分配標簽時,總共四個鄰接(adjacent)像素被標注為當前像素的鄰接像素,四個鄰接像素包括緊接在當前像素之前處理的鄰接像素,以及包含在緊接在當前行之前處理的行中的三個鄰接像素。請注意鄰近像素的例子并不限于此,也可以選擇其它的鄰接像素。
重心計算部分2414確定與當前行中當前像素鄰接的所有鄰近像素是否已經被標注。如果還沒有被標注,重心計算部分2414分配未使用的標簽給當前像素(例如,如果標簽“1”和“2”已經被使用則分配標簽“3”),并將分配的標簽存儲在對應當前像素的標簽緩沖器2414a。
另一方面,當鄰接當前像素的鄰近像素已經分配了相同標簽時,重心計算部分2414將相同標簽分配給當前像素,并將所分配的標簽存儲在對應當前像素的標簽緩沖器2414a中。
當鄰接當前像素的鄰近像素已經被分配了不同標簽時,重心計算部分2414將不同標簽中最早的標簽分配給當前像素,并將分配的標簽存儲在對應當前像素的標簽緩沖器2414a中。在這種情況下,為了記錄不同標簽是相同標簽的事實,重心計算部分2414將標簽記錄到標簽等價表中,并整合(integrate)各表。當整合各表時,重心計算部分2414還整合像素的坐標值和像素數量。
圖9是示出標簽等價表的例子的說明圖。如圖9所示,標簽等價表包括標簽和表值列,并例如示出了如果對應標簽“3”的表值是“1”,則標簽“3”和“1”是相同的標簽。因此,分配了標簽“3”的像素被整合到分配了標簽“1”的像素中。
因此,重心計算部分2414通過簡單地包括用于兩行的標簽緩沖器2414a能夠執行標簽分配處理。從而,不需要使用在現有技術中使用的那樣的大容量的存儲器用于存儲二進制圖像中所有像素的標簽,并且能夠將用于二進制圖像的標簽分配處理實現為硬件。
重心計算部分2414基于存儲在標簽緩沖器2414a中的兩行像素的標簽、與標簽分配處理同時執行通過累加包括在連接部分中的像素的坐標值的計算連接部分的重心的處理。
圖10是示出坐標值緩沖器2414b的結構的說明圖。坐標值緩沖器2414b包括標簽列、像素數量、x坐標值的和、y坐標值的和、以及標志。相關于每個標簽存儲像素數量、x坐標值的和、y坐標值的和、以及標志。像素數量表示在其中分配了相同標簽的像素被連接在一起的連接部分中的像素的數量。x坐標值的和以及y坐標值的和是分別通過累加包含在連接部分中的像素的x坐標值和y坐標值而獲得的值。
標志通過將狀態分類為“可用的”、“處理的”或“未處理的”來表示標簽的狀態。“可用的”表示標簽未被使用的狀態。“處理的”表示標簽已經被分配給當前行的當前像素的狀態,而“未處理的”表示標簽未被分配給當前行的狀態。
在圖10中,對應標簽“1”和“2”的每一個的像素數量、x坐標值的和、y坐標值的和、以及標志表示當在圖7中對第六當前行的處理已經完成時的狀態。例如,以下是關于在圖7中分配了標簽“1”的九個像素的解釋。從圖7可以清楚地看出分配了標簽“1”的像素數量是九個。分配了標簽“1”的像素的x坐標值的和為(3+4)+(3+4)+(4+5)+(4+5+6)=38。分配了標簽“1”的像素的y坐標值的和為(3+3)+(4+4)+(5+5)+(6+6+6)=42。由于當完成當前行的處理時,標簽“1”被分配給了三個像素,所以標簽表示“處理的”。
以下是關于在圖7中分配了標簽“2”(標簽“2”分配給當前像素)的四個像素的解釋。從圖7可以清楚地看出分配了標簽“2”的像素為四個。分配了標簽“2”的像素的x坐標值的和為(10+11+12+13)=46。分配了標簽“2”的像素的y坐標值的和為(6+6+6+6)=24。由于當完成當前行的處理時,標簽“2”被分配給了四個像素,所以該標簽表示“處理的”。
通過存儲每個標簽的標志,重心計算部分2414可以在對一行(當前行)的處理完成時確定是否執行坐標值的累積相加。
圖11A到圖11C是示出標志的轉變的例子的說明圖。圖11A示出在對圖7中當前行(第六行)的處理完成時的標志。如上所述,由于在對當前行的處理完成時標簽“1”和“2”被分配給當前行的像素,所以該標簽表示“處理的”。
接著,重心計算部分2414刪除存儲在標簽緩沖器2414a中的、緊接在當前行(第六行)之前處理的行(第五行)的像素的標簽,并存儲被刪除區域中當前行(第六行)的像素的標簽。然后,重心計算部分2414可以將第七行當作新的當前行,并存儲當前行的像素的標簽。
在作為新的當前行開始對第七行進行處理之前,重心計算部分2414初始化每個標簽的標志。利用初始化,如圖11B所示,標志“未處理的”被設定為標簽“1”和“2”。請注意未使用的標簽用標志“可用的”來初始化。
如圖7所示,由于在第七行沒有被分配標簽“1”的像素,由分配了標簽“1”的像素組成的連接部分在第七行結束。換句話說,由于在第七行有分配了標簽“2”的像素(在第六行存在與分配了標簽“2”的像素鄰接的像素),由分配了標簽“2”的像素組成的連接部分延續到第七行。因此,如圖11C所示,標簽“1”還未分配,但是當完成對當前行(第七行)的處理時,標簽“2”被分配給當前行中的像素。因此,標志“1”保持“未處理的”,而標志“2”表示“處理的”。
因而,重心計算部分2414在完成對當前行(第七行)的處理時,確定不累加標簽“1”的像素的坐標值,以及確定累加標簽“2”的像素的坐標值。根據不累加標簽“1”的像素的坐標值的決定,重心計算部分2414將存儲在坐標值緩沖器2414b中的對應標簽“1”的x坐標值的和以及y坐標值的和的每一個除以像素的數量,以計算由分配了標簽“1”的像素組成的連接部分的重心。例如,在圖7的情況下,通過將作為x坐標值的和的38除以代表像素數量的9,在標簽“1”的連接部分中的重心的x坐標為x坐標=4.22,而通過將作為y坐標值的和的42除以代表像素數量的9,重心的y坐標為y坐標=4.67。
重心計算部分2414釋放分配給計算重心的連接部分中的像素的標簽“1”。因此,標簽“1”的標志變為可用的,并且能夠作為新的標簽再次使用,并且因此能夠有效地使用坐標值緩沖器2414b的存儲器容量。
通過執行上述處理,即使在整個二進制圖像中出現大量連接部分,也能夠只使用有限的存儲器容量來同時執行標簽分配處理和重心計算處理(特征點提取處理),即用于兩行的標簽緩沖器2414a和坐標值緩沖器2414b。因此,與現有技術相比能夠減少需要的存儲器容量,能夠將圖像處理實現為硬件,并能夠高速確定圖像之間的相似度。而且,能夠計算重心而不管連接部分的形狀,并且能夠準確地確定圖像之間的相似性。
圖12是示出連接部分中的特征點的例子的說明圖。在圖12中,特定連接部分為字符“A”,并且被指定為分配了相同標簽的一組像素。字符“A”的特征點(重心)是圖12中用黑圓表示的位置(x坐標、y坐標)。
圖13是示出提取字符串中的特征點的結果的例子的說明圖。在由多個字符組成的字符串的情況下,提取根據字符類型具有不同坐標的多個特征點。
特征矢量計算部分242把從特征點計算部分241輸入的每個特征點(即,連接部分的重心的坐標值)當作當前特征點,并且例如在從當前特征點的較短距離內提取四個其它的周邊特征點。
圖14是示出當前特征點和周邊特征點的說明圖。如圖14所示,例如對于當前特征點P1,提取由封閉曲線S1所包圍的四個特征點(當前特征點P2也提取作為用于當前特征點P1的特征點)。例如對于當前特征點P2,提取由封閉曲線S2所包圍的四個特征點(當前特征點P1也被提取作為用于當前特征點P2的特征點)。
特征矢量計算部分242從提取的四個特征點中選擇三個特征點,并計算不變量。請注意要選擇的特征點不限于三個,可以選擇四個或五個特征點。要選擇的特征點的數量根據要找到的不變量的類型而變化。例如,從三個點找到的不變量是模擬不變量(analog invariant)。
圖15A到圖15C是示出基于當前特征點P1計算不變量的例子的說明圖。圖16A到圖16C是示出基于當前特征點P2計算不變量的例子的說明圖。如圖15A到圖15C所示,從當前特征點P1周邊的四個特征點選擇三個特征點,三個不同的不變量寫為H1j(j=1,2,3)。特征矢量表示圖像的特征是一包含作為矢量元素的不變量H11、H12和H13的矢量。不變量H1j用等式H1j=(A1j/B1j)×C/D來計算。這里,A1j和B1j表示特征點之間的距離,C是歸一化的常數,D是預定常數。因此,例如,即使在文檔旋轉、移動、或傾斜時,不變量Hij也不改變,并且能夠準確地確定圖像之間的相似度。
類似地,如圖16A到圖16C所示,從當前特征點P2周邊的四個特征點選擇三個特征點,三個不同的不變量寫為H2j(j=1,2,3)。特征矢量表示圖像的特征是一包含作為矢量元素的不變量H21、H22和H23的矢量。不變量H2j用等式H2j=(A2j/B2j)×C/D來計算。這里,A2j和B2j表示特征點之間的距離,C是歸一化的常數,D是預定常數。能夠以相同的方式計算其它當前特征點的不變量。
特征矢量計算部分242基于從各個當前特征點計算的不變量計算散列值Hi。當前特征點Pi的散列值Hi表達為Hi=(Hi1×102+Hi2×101+Hi3×100)/E。這里E是由設定多少余數(remainder)來確定的,并且例如,當E為“10”時,余數的范圍從“0”到“9”,該范圍是要計算的散列值取值的范圍。I是自然數。請注意上述散列值是一個例子,并且本發明不限于此,也可以使用其它散列功能。雖然上面例示了提取六個點作為其它的周邊特征點的例子,但要提取的特征點不限于四個點。例如,能夠提取四個點。在這種情況下,從六個特征點提取五個點,對于提取五個點的六種方法的每一個、通過從五個點提取三個點找出不變量以及計算散列值。
圖17A和圖17B是示出散列表的結構的說明圖。如圖17A所示,散列表的結構包括散列值和代表文檔的索引的列。更具體地講,指針索引(pointindex)表示文檔中的位置,并且不變量與代表文檔的索引相關聯的被登記。為了確定圖像之間的相似度,要進行匹配的圖像或文檔被預先登記在散列表中。散列表被存儲在存儲器245中。如圖17B所示,當散列值互相相等時(H1=H5),能夠將散列表中的兩個條目編組為一個。
投票處理部分243基于由特征矢量計算部分242計算的散列值搜索存儲在存儲器245中的散列表,并投票具有對于散列值登記的索引的文檔。投票處理部分243將累加投票的結果輸出到相似度確定部分244。
相似度確定部分244基于從投票處理部分243輸入的投票結果確定文檔(圖像或文檔圖像)的相似度,并輸出確定結果(分類信號)。更具體地講,相似度確定部分244比較從投票處理部分243輸入的投票的數量與預定閾值,當投票數量大于閾值時確定輸入圖像類似于預先登記的文檔圖像,并進一步確定在確定相似的圖像中具有最高投票的文檔是匹配文檔。相似度確定部分244輸出分類信號以執行根據確定結果確定用于登記文檔的處理(諸如,例如,禁止復制或在預定文件夾中存儲結果)。當從投票處理部分243輸入的投票的數量小于閾值時,相似度確定部分244確定沒有相似文檔,并輸出結果。上述確定方法是一個例子,還能夠使用其它方法,例如,其中在通過將投票除以每個文檔的最高投票(諸如對每個文檔找到的特征點數量)執行歸一化之后進行確定相似度或確定匹配文檔的方法。
接下來,將解釋文檔匹配處理部分24的操作。特征點計算部分241通過使用相對輸入圖像的預定尺寸的像素塊,對每個像素塊并行地執行用于二進制化處理的閾值計算和對圖像的二進制化處理,對每個當前行并行地執行基于二進制圖像的標簽分配處理和對于連接部分的特征點提取(重心計算),并將提取的特征點輸出到特征矢量計算部分242。
特征矢量計算部分242基于從特征點計算部分241輸入的特征點計算預定不變量,基于計算的不變量計算散列值,并將計算的散列值輸出到投票處理部分243。
投票處理部分243基于由特征矢量計算部分242計算的散列值搜索存儲在存儲器245中的散列表,并對具有散列值登記的索引的文檔投票。累加投票的結果被輸出到相似度確定部分244。
相似度確定部分244對從投票處理部分243輸入的投票數量與預定閾值進行比較,當投票數量大于閾值時確定輸入圖像類似于預先登記的文檔圖像,并進一步確定在被確定類似匹配文檔的文檔中具有最高投票的文檔。相似度確定部分244輸出分類信號以根據確定結果執行確定登記文檔的處理(諸如,例如,禁止復制或在預定文件夾中存儲結果)。當從投票處理部分243輸入的投票數量小于閾值時,相似度確定部分244確定沒有相似的文檔,并輸出結果。上述確定方法是一個例子,還能夠使用其它方法,例如,其中在通過將投票除以每個文檔的最高投票(諸如對每個文檔找到的特征點數量)執行歸一化之后進行確定相似度或確定匹配文檔的方法。
如以上所解釋的,在這個實施例中,通過簡單地存儲用于兩行像素的標簽,能夠同時執行標注和特征點提取,與現有技術相比能夠減少需要的存儲器容量,能夠將圖像處理實現為硬件,并能夠高速確定圖像之間的相似度。而且,能夠提取任意圖形的特征點,并且能夠準確地確定圖像之間的相似性。此外,能夠動態地找出二進制化處理的閾值,通過穩定地指定連接部分,準確地確定圖像之間的相似度,而且還能夠同時執行二進制化處理的閾值計算和每個像素塊的圖像的二進制化。另外,即使在使用不同圖像輸入裝置時,能夠修復圖像的惡化(諸如,例如,模糊圖像),去除確定圖像之間相似度不需要的高頻成分,并準確地確定圖像之間的相似度。此外,即使改變分辨度時,能夠提取二進制圖像中的特征點而不受所述改變的影響,能夠準確地確定圖像之間的相似度。當預定分辨度被設定小于在圖像輸入裝置中讀取圖像時的分辨度,能夠減少后級中的處理量。
在上述實施例中,例如,平面掃描儀、膠片掃描儀、數字相機或便攜式電話可以用作彩色圖像輸入裝置1。而彩色圖像輸出裝置3可以例如使用諸如CRT顯示器和液晶顯示器的圖像顯示裝置、用于將處理結果輸出到紀錄紙張上的電子照相型或噴墨型打印機。此外,作為圖像形成裝置100,可以使用用于通過網絡連接服務器裝置的通信裝置的調制解調器。還能夠使用通過網絡從外部存儲裝置、服務器裝置等獲得彩色圖像數據的結構,而不是從彩色圖像輸入裝置1獲取彩色圖像數據。
在上述實施例中,雖然彩色圖像輸入裝置1和彩色圖像處理裝置2被解釋為分離的裝置,還可以將彩色圖像處理裝置2整合到彩色圖像輸入裝置1以構成圖像讀取裝置。
在上述實施例中,文檔匹配處理部分24包括存儲器245和控制器246。但是,本發明并不限于這種結構,還可以在文檔匹配處理部分24的外部提供存儲器245和控制器246。
在上述實施例中,雖然標簽緩沖器存儲用于兩行的標簽,但本發明不限于兩行,還能夠存儲用于三行或更多行的標簽。請注意通過將標簽緩沖器構造為存儲用于兩行的標簽,可以使存儲容量更小。
權利要求
1.一種圖像處理裝置,包括標簽分配裝置,用于掃描通過以預定方向二進制化圖像而獲得的二進制圖像的像素,以及用于根據關于各個像素的二進制化信息將標簽分配給像素;標簽存儲裝置,用于存儲關于沿著預定方向順序地分配給多行的每一行的標簽的信息;坐標值存儲裝置,用于存儲關于在二進制圖像中分配了相同標簽的像素的坐標值的信息;用于確定在多行的當前行中是否存在分配了與分配給包含在緊接在當前行之前掃描的行中的像素的標簽相同的標簽的像素的裝置;用于在確定沒有被分配相同標簽的像素時,基于存儲在所述坐標值存儲裝置中的關于坐標值的信息來計算在由坐標值指定的像素被連接在一起的連接部分中的特征點的裝置;用于基于計算的特征點計算代表圖像特征的特征矢量的裝置;以及用于基于計算的特征矢量確定與其它圖像類似的裝置。
2.根據權利要求1所述的圖像處理裝置,還包括累加器裝置,用于在確定在當前行中存在分配了相同標簽的像素時,加總分配了相同標簽的像素的坐標值,其中基于關于坐標值的和以及分配了相同標簽的像素數量的信息來計算特征點。
3.根據權利要求1所述的圖像處理裝置,還包括用于基于包含在像素塊中的像素的亮度值或明度值對由多個像素組成的每個像素塊計算閾值的裝置;以及用于基于計算的閾值二進制化像素塊中的圖像的裝置。
4.根據權利要求3所述的圖像處理裝置,還包括用于基于通過以預定方向掃描像素快中的像素而獲得的各個像素的亮度值或明度值來計算亮度值或明度值的統計值的裝置;以及用于基于計算的統計值計算閾值的裝置。
5.根據權利要求1所述的圖像處理裝置,還包括用于執行空間過濾處理以校正圖像的空間頻率特性的裝置,其中二進制化其空間頻率特性被所述裝置校正的圖像。
6.根據權利要求1所述的圖像處理裝置,還包括用于轉換圖像的分辨度的裝置,其中二進制化其分辨度被所述裝置轉換的圖像。
7.一種圖像形成裝置,包括在權利要求1到6的任意一個中定義的圖像處理裝置;以及圖像形成裝置,用于在紙張上形成由所述圖像處理裝置處理的圖像。
8.一種圖像讀取裝置,包括圖像讀取裝置,用于讀取圖像;以及在權利要求1到6的任意一個中定義的圖像處理裝置,用于處理由所述圖像讀取裝置讀取的圖像。
9.一種圖像處理方法,包括步驟掃描通過以預定方向二進制化圖像而獲得的二進制圖像的像素,并根據關于各個像素的二進制化信息將標簽分配給像素;存儲與沿著預定方向順序地分配給多行的每一行的標簽相關的信息;存儲與在二進制圖像中分配了相同標簽的像素的坐標值相關的信息;確定在多行的當前行中是否存在分配了與分配給包含在緊接在當前行之前掃描的行中的像素的標簽相同的標簽的像素;當確定沒有被分配相同標簽的像素時,基于存儲的與坐標值相關的信息來計算在由坐標值指定的像素被連接在一起的連接部分中的特征點;基于計算的特征點計算代表圖像特征的特征矢量;以及基于計算的特征矢量確定與其它圖像的類似。
全文摘要
以預定方向掃描通過二進制化圖像而獲得的二進制圖像的像素,根據關于各個像素的二進制化信息將標簽分配給像素,沿著預定方向對多行的每一行順序地存儲關于分配的標簽的信息,存儲關于在分配了相同標簽的像素的二進制圖像中坐標值的信息,在多行的當前行中確定是否存在分配了與分配給包含在緊接在當前行之前掃描的行中的像素的標簽相同的標簽的像素,當確定沒有被分配相同標簽的像素時,基于存儲的關于坐標值的信息,計算在通過將由坐標值指定的像素連接在一起而形成的連接部分中的特征點,基于計算的特征點計算代表圖像特征的特征矢量,以及基于計算的特征矢量確定與其它圖像的類似。
文檔編號G06K9/20GK101064009SQ20071010092
公開日2007年10月31日 申請日期2007年4月28日 優先權日2006年4月28日
發明者大平雅和, 森本淳壽 申請人:夏普株式會社