專利名稱:模式分段裝置和模式識別裝置的制作方法
技術領域:
本發明涉及一種模式分段裝置和模式識別裝置,具體涉及一種從一個字符串圖象中分段一個單字符區域的應用程序。
在常規的字符識別處理中,必須從字符串圖象分段與一個字符對應的模式。在這種分段處理中,存在三個主要處理,即,標記處理,重疊積分處理,垂直積分處理(用于水平書寫),或水平積分處理(用于垂直書寫)。然而,當兩個或多個字符相互連接,或當兩個或多個字符被寫為相互合并在一起時,就不能正確地分段這些字符。因此,在常規的分段處理中,已經采用下面的方法來正確地分段上述連接的字符。
(1)產生沿字符串方向的黑像素投影直方圖(相鄰分布),并且將最小值的點定義為一個段點。
(2)記錄字符串的上、下外形,并且將最小值的點定義為一個段點。
然而,某些字符形狀或字符之間的連接部分不指示相鄰分布最小值或連接點的外形。因此,在常規方法中,已經出現這樣的問題,即,在連接點處的字符不能被正確地分段。
當圖象狀態不太理想,并且當圖象在模式內具有多個不均勻部分時,產生多個段點。因此,整個系統不能免于基于假定檢驗的過分分隔的不利影響。
本發明目的在于提供一種能夠提高字符連接模式的分段準確度的模式分段裝置和模式識別裝置。
為解決上述問題,本發明將類別的特征量與圖象的特征量進行比較,以便從圖象分段與類別特征量對應的部分。
這樣,有可能分段與模式位置處的類別特征量對應的模式。甚至當模式之間的連接位置不對應黑像素投影直方圖的最小點時,在模式之間的位置也能分段模式。另外,有可能從圖象共同分段與類別特征量對應的部分。因此,盡管一個圖象在要分段的模式內具有多個不均勻的部分,也可以防止在模式的最小點將一個模式分段為多個區域,從而提高分段準確度。
根據本發明的一個方面,沿字符串陣列方向獨立移動沿陣列方向設定為一個類別的成分序列的特征量的第一和最后成分,以允許類別的特征量對應于字符串圖象的特征量。
這樣,甚至當字符串圖象出現失真和變形,在類別特征量和字符串圖象的字符模式的特征量之間可以保持比較準確度,從而,當輸入各種字符串圖象時防止類別特征量不匹配的情況。
根據本發明的另一個方面,輸入與沿陣列方向的字符串圖象的成分對應的類別的第一點,并且從對應于該類別的第一點的字符串圖象成分獲得下一個分段位置。
這樣,有可能從一個字符串圖象提取另一個字符區域,以便使得對應于該類別的其他區域在字符串圖象內連續,從而可以從字符串圖象有效提取多個字符區域。
根據本發明進一步的方面,當存在來自圖象的多個分段區域時,分段區域可以相互組合,以便在圖象中不存在不對應于所識別的任何類別的區域。
這樣,有可能允許要分段圖象內的所有區域對應于要識別的任何類別。當存在一個未對應于任何類別的剩余模式時,可放棄該分段位置,并且甚至當從一個圖象獲得多個分段位置時,也能得到最佳的分段位置。例如,僅包含字符串的圖象不包括除字符之外的任何模式。因此,當從僅包含字符串的圖象分段不對應于任何字符的一個模式時,確定該分段位置是錯誤的。因此,通過確定一個分段位置可以避免一個錯誤的分段位置,以便來自要分段的字符串的所有分段結果對應于任何字符類別,從而提高分段準確度。
另外,根據本發明進一步的方面,分開設定類別分段的特征量和類別識別的特征量,并且使用用于類別識別的特征量,識別使用類別分段的特征量分段的模式。
這樣,有可能檢查一個分段為對應于一個類別的區域的一個模式是否匹配該類別,從而提高字符分段準確度。
另外,根據本發明進一步的方面,當使用類別分段的特征量分段一個模式時,輸出該類別作為該模式的識別結果。
這樣,僅通過執行來自圖象的分段處理就可以獲得一個模式的識別結果,并且不必執行與字符識別處理分開的模式識別處理,從而縮短了獲得模式識別結果所需的時間。
圖1是根據本發明一個實施例的模式分段裝置的配置方框圖;圖2A和2B示出根據本發明一個實施例的模式分段方法;圖3是根據本發明第一實施例的模式識別方法流程圖;圖4是根據本發明第二實施例的模式識別方法流程圖;圖5示出根據本發明實施例計算類別的外圍特征的方法;圖6示出根據本發明實施例計算類別的外圍特征的方法;圖7示出根據本發明實施例使用連續DP計算級別差(differencelevel)的方法;圖8示出根據本發明實施例在連續DP內達到當前點所通過的路徑;圖9是根據本發明實施例使用連續DP計算級別差的方法流程圖;圖10示出根據本發明實施例查找開始點的方法;圖11示出根據本發明實施例計算開始點以及級別差的結果的一部分;圖12示出從圖11所示的計算結果查找分段位置的路徑的方法;圖13是根據本發明實施例計算分段位置的方法流程圖;圖14是根據本發明實施例產生一個路徑的處理流程圖;圖15是根據本發明實施例查找基點的處理流程圖;圖16示出根據本發明實施例產生一個路徑的實例;圖17是根據本發明實施例實現模式分段處理和模式識別處理的配置方框圖;以及圖18示出根據本發明實施例提供用于執行模式分段處理和模式識別處理的軟件程序等的方法。
下面參照附圖描述根據本發明實施例的模式分段裝置和模式識別方法。
圖1是根據本發明實施例的模式分段裝置的配置方框圖。在圖1,特征量提取單元1提取圖象的特征量。特征量設定單元2設定一個類別的特征量。特征量比較單元3比較類別特征量與要處理的整個圖象的圖象特征量。分段單元4根據特征量比較單元3的比較結果分段對應于來自圖象的類別特征量的部分。類別特征量和圖象特征量涉及可以從中復制原始模式的特征量或特征量部分。例如,多至第n個外圍特征的外圍特征可用作類別的特征量和圖象的特征量。
這樣,只可以從圖象中共同分段對應于類別特征量的模式。因此,有可能防止分段除字符之外的模式或在多個點的分離狀態下分段字符,從而提高字符分段準確度。另外,當圖象中存在對應于一個字符特征量的部分時,甚至當字符相互連接時,也能指定與字符對應部分的位置。盡管字符的連接位置不對應于黑像素投影直方圖的最小點,也可以在字符的邊界分段一個字符。
沿字符串陣列方向設定類別特征量和圖象特征量。沿陣列方向獨立掃描類別特征量陣列的最后和第一部分,并且在掃描時獲得的類別特征量和圖象特征量之間的對應獲得最佳位置對應。例如,根據類別特征量陣列的最后部分的對應,得到類別特征量陣列的第一部分的對應,以便可以得到類別特征量和圖象特征量之間的最佳對應。
這樣,當從輸入圖象提取對應于類別特征量的部分時,通過擴大和減少類別可以掃描輸入圖象內的類別,從而即使輸入圖象中包含手寫字符時,也能從輸入圖象中高準確度地提取對應于類別特征量的部分。
圖2A和2B示出根據本發明實施例的模式分段方法。在下述的實施例,將類別5的特征量與輸入圖象的特征量進行比較。對于其他類別也是如此。在圖2A,沿y軸方向設定類別5的特征量,類別5的最左側點Lk的特征量對應于y=0,并且類別5的最右側點Rk的特征量對應于y=y1。另一方面,假定輸入圖2B所示的連接字符257作為要分段的圖象。當輸入連接字符257時,將x軸設定為字符串方向,最左側點L1的特征量對應于x=0,并且連接字符257的最右側點R1的特征量對應于x=x1。接著,在x軸的0到x1的范圍內分開查找類別5的最右側點Rk和最左側點Lk,并且在掃描操作所獲得的類別5的特征量和連接字符257的特征量之間的對應獲得最佳位置對應。因此,假定當類別5的最右側點Rk對應于x軸的xR,以及類別5的最左側點Lk對應于x軸的xL時,在類別5的特征量和連接字符257的特征量之間獲得最佳對應,坐標xL和xR為連接字符257的分段位置的候選項。假定沿類別5的水平方向的像素數為dy,并且對應于連接字符257的類別5部分的像素數為dy’,則,甚至當類別5水平方向上的像素數dy與對應于連接字符257的類別5部分的像素數dy’不同時,通過在x軸的0到x1范圍內分開掃描類別5的最右側點Rk和最左側點Lk,也可以高準確度地從連接字符257提取對應于類別5的部分。
可以通過稱為連續DP(動態規劃)的非線性擴大/縮小匹配方法比較特征量。例如,在Seiichi Nakagawa,Maruzen Kabushiki Kaisha的‘模式信息處理’,pp.163—166,1999中描述了連續DP。
這樣,考慮到對應于圖象內的類別部分(被分段為類別字符的部分)的特征量與類別特征量類似。即,定義用于一個圖象的特征量,并且在整個輸入圖象內查找與每個類別的特征量類似的部分。首先,將每個類別的特征量輸入到一個字典。接著,獲得整個輸入圖象的特征量,并且與每個類別的特征量進行比較。因此,得到關于每個類別與輸入圖象的匹配程度,輸入圖象的哪個部分匹配每個類別等的信息。實際上,對于每個類別,可以獲得每個坐標的級別差以及超越級別差的坐標之間的對應。特別是,當每個坐標定義為一個結束點時所得到的級別差,并且得到相應的開始點。假定級別差等于從開始點到結束點分段圖象部分的成本,并且該部分為該類別,則可以相互比較每個分段操作的有效性。通過查找具有最高有效性的分段操作的組合,可以確認分段位置和識別結果。
圖3是根據本發明第一實施例的模式識別方法流程圖。在第一實施例,當通過比較類別的特征量獲得圖象內的分段位置時,將該類別定義為分段位置處的模式識別結果。在圖3,首先,在輸入圖象(步驟S1)執行一個正規化處理(步驟S2)。在正規化處理中,圖象被放大或縮小,以使垂直長度等于預定值,并且接著對所產生的模式執行平滑處理。然后,計算正規化處理之后的輸入圖象的特征量(步驟S3)。將該特征量表示為一個整數序列(或向量)。整數的數目等于正規化圖象的水平像素數。每個整數可以是從0到100的任何值。
使用輸入字典的每個類別的特征量,對整個圖象執行經連續DP的比較處理(步驟S4)。因此,得到關于每個類別和每個坐標的最佳對應的級別差,以及關于最佳對應的開始點的坐標信息。接著,根據信息,計算段點(步驟S5)。實際上,假定每個最佳對應由通過連接開始點和結束點所得到的路徑,并將級別差定義為一個權來表示。在路徑序列,查找需要最低成本的路徑。所得到的路徑序列作為查找結果,即,輸出路徑的開始點和結束點序列作為一個段點。在這種情況下,提供路徑的類別為識別結果。
圖4是根據本發明第二實施例的模式識別方法流程圖。根據第二實施例,將用于識別的類別特征量與用于分段的類別特征量分開地存儲在字典內。當通過比較用于識別的類別特征量與用于分段的類別特征量得到圖象內的分段位置時,使用用于識別的類別特征量對分段位置執行模式識別處理。在圖4,通過執行與如圖3所示的步驟S1到S5相同的處理計算段點(步驟S11到S15)。接著,在段點分段圖象(步驟S16),并根據識別分段模式內的一個字符的結果(步驟S17)確定該類別(步驟S18)。進一步,以最小成本的順序輸出路徑的多個組合。接著,如上所示識別一個字符,并且將最佳識別結果定義為識別結果。
在上述實施例,在水平書寫中不但可以使用來自上部而且可以使用來自底部的多至第n個外圍特征的外圍特征。也可以使用多至第n個外圍特征的外圍特征的一部分。在下面的實例,不但使用來自上部而且使用來自底部的主要和次要外圍特征。
圖5示出根據本發明實施例計算類別的外圍特征的方法。在圖5所示的實例,描述類別5,但是也可以類似地處理其他類別。在圖5,類別5的封閉矩形的較下一側稱為較下Dk。將y軸設定為對應于較下Dk,并且將z軸設定為與y軸垂直。另外,允許構成類別5部分的沿水平方向的每個像素與y坐標對應,并且允許構成類別5部分的沿垂直方向的每個像素與z坐標對應。當掃描線從較下Dk的坐標y垂直延伸時,將到類別5的第一黑像素的距離定義為z1。假定類別5的封閉矩形的高度為dz,則通過下面公式integer of(z1/dz × 100)可得到類別5坐標y處的較下Dk的主要外圍特征。
類似地,假定到一個白像素改變為一個黑像素的點處的距離為z2,則通過下面公式integer of(z2/dz × 100)可得到類別5坐標y處的較下Dk的次要外圍特征。
如果類別5的封閉矩形的較上面一側稱為上限,則可以類似地獲得來自類別5坐標y處的上限的主要和次要外圍特征。
當獲得類別5的坐標y處的較上和較下主要和次要外圍特征時,允許4個值的集合對應于y軸上的每個點。此時,類別5的最左側像素對應于y=0,而類別5的最右側像素對應于y=y1。接著,對于y=0到y1,可以將通過排列y軸上的較上和較下主要和次要外圍特征的四個值的集合得到的成分序列,定義為類別5的外圍特征。
圖6示出根據本發明實施例的類別5的外圍特征計算結果。圖6A示出來自較上Uk的主要外圍特征。圖6B示出來自較上Uk的次要外圍特征。圖6C示出來自較下Dk的主要外圍特征。圖6D示出來自較下Dk的次要外圍特征。
當使用學習樣本得到類別的特征量時,預定每個類別的水平像素數。下面,對于每個學習樣本,按上述方法計算特征量。接著,放大或縮小圖象,并且使整數值相同,以便特征量的四個整數集合的數目與每個類別的預定水平像素數匹配。
對于輸入圖象,設定輸入圖象的上限和下限,并且獲得來自上限和下限的主要和次要外圍特征,從而獲得輸入圖象的外圍特征。
在垂直書寫中,多至第n個外圍特征的外圍特征不但沿右側方向而且沿左側方向。例如,可以使用來自圖象右端和左端的主要和次要外圍特征將一個類別與輸入圖象進行比較。
圖7示出根據本發明實施例通過連續DP計算級別差的方法。在圖7,假定輸入包括連接字符257的模式作為輸入圖象,將存儲在字典內的每個類別的特征量,與包括連接字符257的整個模式的特征量進行比較。
下面描述將輸入字典的類別特征量內的類別5的特征量,與包括連接字符257的整個模式的特征量進行比較的情況。首先,假定沿類別5的水平方向的像素數dy為30,并且將類別5的外圍特征Fk輸入字典作為30個四整數集合的序列,允許這30個四整數集合(k0,k0’,k0”,k0”’),(k1,k1’,k1”,k1”’),…,(k29,k29’,k29”,k29”’)與從y=0到y=y1=29的坐標對應。在該實例,k0,k1,…,k29為來自類別5的上限的主要外圍特征(對應于圖6A),k0’,k1’,…,k29’為來自類別5的上限的次要外圍特征(對應于圖6B),k0”,k1”,…,k29”為來自類別5的下限的主要外圍特征(對應于圖6C),k0”’,k1”’,…,k29”’為來自類別5的下限的次要外圍特征(對應于圖6D)。
另外,假定沿包括連接字符257的模式的水平方向的像素數dx為86,則允許包括連接字符257的模式的左端LI與x=0對應,并且允許包括連接字符257的模式的右端RI與x=85對應。接著,提取包括連接字符257的模式的外圍特征FI作為86個四整數集合的序列。允許這86個四整數集合(I0,I0’,I0”,I0”’),(I1,I1’,I1”,I1”’),…,(I85,I85’,I85”,I85”’)與從x=0到x=x1=85的坐標對應。在該實例,I0,I1,…,I85為來自包括連接字符257的模式的上限的主要外圍特征。I0’,I1’,…,I85’為來自包括連接字符257的模式的上限的次要外圍特征。I0”,I1”,…,I85”為來自包括連接字符257的模式的下限的主要外圍特征。I0”’,I1”’,…,I85”’為來自包括連接字符257的模式的下限的次要外圍特征。
下面,當獲得x軸上的包括類別5的模式的外圍特征FI,以及y軸上的類別5的外圍特征Fk時,允許類別5的外圍特征Fk的30個元素對應于連接字符257的外圍特征FI的成分。在該對應中,獲得最佳對應,并且可以將最佳對應內的x軸上的成分位置定義為連接字符257的分段位置的候選項。就這點而言,獲得成分之間距離的累積值,并利用權正規化。接著,可以將正規化值的最小對應定義為最佳對應。
假定輸入模式的成分和類別成分之間的對應稱為一個路由,則通過選擇表示過去路由內達到當前點(x,y)的最小級別差的路由,可獲得達到當前點(x,y)的最佳路由。在類別和輸入模式的對應中,假定未顛倒成分序列內的順序,并且在采用形成序列部分的成分時未跳躍,則將達到當前點(x,y)的路由限定到圖8所示的三個路徑。
因此,當獲得達到當前點(x,y)的最佳路由時,通過首先得到達到過去點的最佳路由,接著選擇表示三個路由中從過去點達到當前點(x,y)的最小級別差的路由,獲得達到當前點(x,y)的最佳路由。
實際上,在0≤x≤1和0≤y≤1的范圍內,利用累積值的漸變公式(1)到(8),可得到達到當前點(x,y)的最佳路由的級別差的累積值q(x,y)。
漸變公式0≤x≤x1,0≤y≤y1q(—1,y)=q(0,y)=M …(1)其中M表示一個足夠大的值q(x,0)=2d(x,0) …(2)q(x,1)=min{q(x—2,0)+2d(x—1,0)+d(x,1)…(3)q(x—1,0)+2d(x,0) …(4)q(x,0)+d(x,1)}…(5)q(x,y)=min{q(x—2,y—1)+2d(x—1,y)+d(x,y)…(6)q(x—1,y—1)+2d(x,y) …(7)q(x—1,y—2)+2d(x,y—1)+d(x,y)}…(8)其中,例如,可以通過下面的市街區距定義距離d(x,y)。d(x,y)=Σn=1,2|IPn,up(x)-kn,up(y)|+|IPn,down(x)-kn,down(y)...(17)]]>其中IPn,up(x)表示來自點x處的輸入圖象的上限的第n個外圍特征,IPn,down(x)表示來自點x處的輸入圖象的下限的第n個外圍特征,Kn,up(y)表示來自點y處的類別的上限的第n個外圍特征,Kn,down(y)表示來自點y處的類別的下限的第n個外圍特征。
可以利用歐幾里德距離等定義距離d(x,y)。
在圖8,假定到點P1的級別差的累積值為q(x—2,y—1),則到點P2的級別差的累積值為q(x—1,y—2),到點P3的級別差的累積值為q(x—1,y—1),到點P4的級別差的累積值為d(x—1,y),到點P5的級別差的累積值為d(x,y—1),以及到點P6的級別差的累積值為d(x,y),公式(6)對應于通過圖8所示的路由P1→P4→P6得到到點P6的級別差的累積值q(x,y),公式(7)對應于通過圖8所示的路由P3→P6得到到點P6的級別差的累積值q(x,y),公式(8)對應于通過圖8所示的路由P2→P5→P6得到到點P6的級別差的累積值q(x,y)。
通過權的漸變公式(9)到(16)可以得到對應于累積值q(x,y)的權g(x,y)。
權的逐變公式g(—1,y)=g(0,y)=0 …(9)g(x,0)=2…(10)g(x,1)={g(x—2,0)+3 …(11)g(x—1,0)+2…(12)g(x,9)+1} …(13)g(x,y)={g(x—2,y—2)+3…(14)g(x—1,y—1)+2 …(15)g(x—1,y—2)+3}…(16)
其中權的漸變公式(9)到(16)分別對應于累積值的漸變公式(1)到(8)。
通過公式(1)到(16)獲得級別差的累積值q(x,y)和權g(x,y),可以通過公式(17)獲得到點(x,y)的最佳路由的輸入圖象與類別之間的級別差D(x,y)。
D(x,y)=q(x,y)/g(x,y)…(18)使用上述公式,對于圖7所示的每個點(x,y),獲得到點(x,y)的最佳路由的輸入圖象和類別之間的級別差D(x,y)。為獲得當前點(x,y)的級別差D(x,y),必須得到過去點的級別差。因此,通過公式(1)將M的值設定為對應于x=—1和x=0的點的級別差。接著,以D1→D2→…→D6→…→D7→D8→…→D12→…→D37→D38…→D42的順序獲得級別差d(x,y)。
另外,例如,當得到當前點(x,y)的級別差D28時,到當前點(x,y)的路由可以是R1到R3的三條路由中的任何一條。通過替換用于公式(18)的公式(6)內的累積值q(x,y)和公式(14)內的權g(x,y),可以獲得通過路由R1到當前點(x,y)的級別差D(x,y)。類似地,通過替換用于公式(18)的公式(7)內的累積值q(x,y)和公式(15)內的權g(x,y),可以獲得通過路由R2到當前點(x,y)的級別差D(x,y)。進一步,通過替換用于公式(18)的公式(8)內的累積值q(x,y)和公式(16)內的權g(x,y),可以獲得通過路由R3到當前點(x,y)的級別差D(x,y)。因此,在三條路由R1到R3,通過選擇指示最小級別差的路由可以獲得當前點(x,y)的級別差D28。當選擇到當前點(x,y)的三條路由R1到R3中的一條時,輸入所選擇的路由。
圖9是根據本發明實施例使用連續DP計算級別差的方法流程圖。在圖9,首先執行初始化過程(步驟21)。在初始化過程,在0≤y≤y1的范圍內,設定q(—1,y)=q(0,y)=M,并且設定g(—1,y)=g(0,y)=0。接著,設定x=1(步驟s22),以及設定q(x,0)=2d(x,0),和g(x,0)=2(步驟S23)。然后,對于y=1,通過公式(3)到公式(5)獲得累積值q(x,y),以及通過公式(11)到(13)獲得對應于累積值q(x,y)的權g(x,y)。另外,在2≤y≤y1的范圍內,通過公式(6)到公式(8)獲得累積值q(x,y),以及通過公式(14)到(16)獲得對應于累積值q(x,y)的權g(x,y)(步驟S24)。X值每增加1上述過程重復一次(步驟S25)直到x等于x1為止(步驟S26)。
在上述過程中,在0≤x≤1,以及0≤y≤y1的范圍內可以獲得到點(x,y)的最佳路由以及對應的級別差。當獲得到點(x,y)的最佳路由時,通過逆向跟蹤該路由可獲得對應于點(x,y)的開始點(x0,y0)。該對應可以表示如下。
X0=Stc(x,y)Y0=Sty(x,y)如圖10所示,通過逆向跟蹤到對應于類別5的最右側點Rk的點(x,y1)的最佳路由,可以查找對應于類別5的最左側點Lk的點(st,0)。當點(st,0)對應于最左側點Lk時,將x軸上的值st定義為坐標x處的類別5的開始點。
如上所述,通過將級別差定義為Sc(x,K)以及將開始點定義為St(x,K),可以如下獲得類別K和坐標x的比較結果。
Sc(x,K)=D(x,dy—1)St(x,K)=Stx(x,dy—1)在上述過程中,當通過對應于連接字符257的水平方向上的點x的類別5的最右側點Rk將級別差定義為最小時,可以獲得對應于類別5的最左側點Lk的連接字符257的水平方向上的點st,以及相應的級別差。
對包括連接字符257的模式執行上述過程以用于所有要識別的類別K。例如,假定要識別的類別K為0到9,執行上述過程用于所有類別0到9。接著,在0≤x≤x1的范圍內,獲得用于每個類別K的開始點St(x,K)和相應的級別差Sc(x,K)。
圖11示出根據本發明實施例計算用于每個類別的開始點和相應的級別差的結果部分。在圖11示出的實例,僅示出47≤x≤72的范圍,省略了x的其他范圍。另外,當級別差sc等于或大于一個預定的閾值時,其由xx表示。在圖11,例如,當x=60時,盡管將開始點st設定為x軸上的任何點,對于類別0,1,和4,級別差sc也不小于一個預定的閾值。對于類別2,當通過設定開始點st=40將類別2的最右側點設定為點x=60,以及相應的級別差sc=67時,級別差sc最小(在這種情況下,該操作對應于將類別2的最左側點設定在點x=40)。例如,對于類別5,當通過設定開始點st為33將類別5的最右側點設定為點x=60,以及相應的級別差sc=30時,級別差sc最小。
圖12示出從圖11所示的計算結果查找分段位置的路由的方法。在圖12,假定要識別的類別K為0到9,則要分段的連接字符257的模式的水平方向像素數w1為86,則獲得開始點st和相應的級別差sc以用于0≤x≤x1=85范圍內的所有類別0到9。在這種情況下,例如,考慮連接字符257模式的最右側點處的點x=85(下文將該點稱為初始基點)。接著,檢查是否可以在對應于點x=85的級別差sc檢測到等于或小于閾值TH的級別差sc。在該實例,如果將閾值TH設定為,例如,35,則類別7的級別差sc為25,從而檢測級別7具有等于或小于閾值TH 35的級別差sc。當在點x=85處檢測到類別7,則檢查對應于點d=85處的類別7的開始點。因此,由于點x=85處的類別7的開始點st為62,則從開始點st=62獲得連接字符257模式的分段位置。當對應于類別7的模式的最右側點的分段位置設定為x=85,并且對應于類別7的模式的最左側點的分段位置設定為x=62時,開始點st=62指示最小級別差sc。另外,相應的級別差sc為25。因此,假定連接字符257模式的下一個分段位置處于從x=st=62向后預定值th的范圍。例如,如果預定值th=2,則下一個分段位置的查找范圍設定為x=60到62,并且檢查等于或小于閾值TH的級別差sc是否存在于對應于點x=60到62的級別差sc中。由于點x=60處的類別5的級別差sc為30,所以檢測等于或小于閾值TH=35的級別差sc的類別5。當在點x=60檢測到類別5時,將坐標x=60定義為連接字符257模式的下一個分段位置(下文將該點稱為一個基點)。產生連接x=85的初始分段位置處的點與x=60的下一個分段位置處的點的路徑P1。
當產生路徑P1時,檢查對應于點x=60處的類別5的開始點st。因此,表明點x=60處的類別5的開始點st為33,從開始點st=33得到連接字符257的下一個分段位置。因此,下一個分段位置的查找范圍為x=31到33,并且檢查等于或小于閾值TH的級別差sc是否存在于對應于點x=31到33的級別差sc中。由于點x=31的類別2的級別差sc為35,所以檢測等于或小于閾值TH=35的級別差sc的類別2。當檢測點x=31處的類別2時,將坐標x=31定義為連接字符257的下一個分段位置。另外,產生連接x=60的分段位置處的點與x=31的下一個分段位置處的點的路徑P2。
當產生路徑P2時,檢查對應于點x=31處的類別2的開始點st。結果是,由于表明點x=31處的類別2的開始點st為7,從開始點st=7得到連接字符257模式的下一個分段位置。假定在x=7之前的范圍內不存在對應于類別0到9的模式,則將連接字符257模式的分段位置定義為點x=7(下文將該點稱為源點)。接著,產生連接x=31的分段位置處的點與x=7的下一個分段位置處的點的路徑P3,從而結束分段過程。
在上述過程,可以在2和5,以及5和7之間的邊界分段連接字符257的模式。當獲得用于連接字符257模式的路徑P1到P3時,通過考慮路徑P1到P3的權可以評價通過執行經路徑P1→P2→P3的分段處理所得到的分段位置。作為路徑P1到P3的權,可以使用對應于路徑P1到P3的分段的每個模式和對應于每個模式的類別之間的級別差sc。例如,路徑P1的權為從x=85的點的類別7的級別差sc所得到的25,路徑P2的權為從x=60的點的類別5的級別差sc所得到的30,以及路徑P3的權為從x=31的點的類別2的級別差sc所得到的35。當得到路徑P1到P3的權時,將路徑P1到P3的全部權q=25+30+35=90除以路徑P1到P3的數目b=3所得到的值v=90/3=30定義為分段位置評價值。
圖13是根據本發明實施例計算分段位置的方法流程圖。在圖13,首先執行初始基點選擇過程(步驟S31)。在該初始基點選擇過程,考慮對應于輸入模式的最右側點的坐標x=dx—1輸入的級別差Sc(dx—1,K)。以從級別差Sc(dx—1,K)中最小到最大的順序排列類別K,并且從類別K的集合選擇級別差Sc(dx—1,K)內的m個最小類別。假定m個最小類別為K1,K2,…,Km,則將初始基點定義為(dx—1,K1),(dx—1,K2),…,(dx—1,Km)。字符dx表示沿輸入模式的水平方向的像素數。
接著,執行路徑產生過程(步驟S32)。對于該路徑產生過程內的每個初始基點,輸入圖象和每個類別之間的對應被認為是連接開始點和結束點的路徑,并且將該對應的級別差定義為路徑的權。另外,將一個類別的值增加到該路徑。
圖14是根據本發明實施例的路徑產生過程的流程圖。在圖14,對于坐標x和對應于類別K的初始基點(x,K)(步驟S41),檢查級別差sc=Sc(x,K)和開始點sc=St(x,K)(步驟S42)。接著,對于x=st,查找基點(步驟S43)。對于(x,Ki),基點指其Sc(x,Ki)表示Sc(x,Ki)<TH點內的最小值的點,并且在st—th≤x≤st范圍內St(x,Ki)的值在所有類別Ki內恒定。如果基點數目為0(步驟S44),則進入具有開始點st,結束點x,權sc,以及類別K的路徑(步驟S45),從而結束(返回)該過程。另一方面,如果基點數目為a,則基點為(xi,ki)(i=1,…,a)(步驟S44),接著進入具有開始點xi,結束點x,權sc,以及類別K的路徑(步驟S46)。然后,回到步驟S41,對于每個基點執行類似的過程。
圖15是根據本發明實施例的基點查找過程的流程圖。在圖15,初始化BPcheck, BPscore,BPend,以及a(步驟S51)。BPcheck,BPscore,和BPend中的每一個為一個dx陣列。BPcheck表示是否已檢查坐標x,并且初始值全部為0。BPscore包含級別差sc的值,并且初始值全部為—1。BPend包含一個坐標,并且初始值全部為st。整數a表示檢測基點的數目,并且初始值為0。
下面,將K設定為0(步驟S52),并且當K<max(步驟S53)時將x設定為st(步驟S54),其中max表示要識別類別K的數目。當不滿足x≥st—th以及x≥0(步驟S55)的條件時,將K值增加1(步驟S62),并且控制返回到步驟S53。當x≥st—th以及x≥0(步驟S55)時,檢查是否sc(x)=Sc(x,K),st(x)=st(x,K),以及sc(x)<TH(步驟S56)。如果不滿足條件sc(x)<TH,則將x減少1(步驟S61),并且控制返回步驟S55。另一方面,如果sc(x)<TH,則確定是否BPcheck(st(x))>0(步驟S57)。如果不滿足條件BPcheck(st(x))>0,則BPcheck(st(x))=1,并且將a的值增加1(步驟S58),并且控制進入到步驟S60。另一方面,如果BPcheck(st(x))>0,則確定是否滿足條件sc(x)<BPscore(st(x))或sc(x)=Bpscore(st(x))以及x<BPend(st(x))(步驟S59)。如果不滿足步驟S59中的條件,則控制進入到步驟S61。另一方面,如果滿足步驟S59中的條件,則BPscore(st(x))=sc(x),BPend(st(x))=x(步驟S60)。對于滿足條件x≥st—th,以及x≥0的坐標x處所識別的所有類別K執行上述過程。
圖16示出根據本發明實施例產生一個路徑的實例。在圖16,例如,假定在x1=dx—1點處選擇四個初始基點B1到B4。作為檢測初始基點B1的基點B5和B11的結果,得到兩個路徑P19→P20的路由。作為檢測初始基點B2的基點B6,B9和B13的結果,得到三個路徑P17→P18→P13的路由。作為檢測初始基點B3的基點B7,B9,和B13的結果,得到三個路徑P11→P12→P13的路由。作為檢測初始基點B4的基點B8,B10,和B12的結果,得到三個路徑P14→P15→P16的路由。
對路徑P11到P20中的每一個指定一個包括開始點,結束點,權,以及類別的屬性。例如,將開始點xf,結束點x1,對應于初始基點B1的類別的級別差sc,以及對應于初始基點B1的類別指定為路徑P11的屬性。另外,將開始點xd,結束點xf,對應于初始基點B7的類別的級別差sc,以及對應于初始基點B7的類別指定為路徑P12的屬性。
接著,查找最佳路由(步驟S33)。在查找最佳路徑時,在上述處理產生的路徑集合內查找最佳路由。首先,對于每個坐標x,列出具有坐標x的開始點的路徑Pi。這時,對于這些路徑Pi,開始點,結束點,權,以及類別之間的對應函數為st(Pi),ed(Pi),sc(Pi),以及ca(Pi)。另外,假定坐標t(>x)處的權的累積值為q(t),并且表示所通過的路徑數的值為b(t),則設定下式。
(q(ed(Pi))+sc(Pi))/(b(ed(Pi)+1) …(19)選擇指示最小值的路徑Pi,并且將路徑Pi設定為Pi=arg(x)。
接著,設定下面的等式。
q(x)=q(ed(Pi=arg(x))+sc(Pi=arg(x))…(20)b(x)=b(ed(Pi=arg(x))+1…(21)在對于所有坐標執行上述計算之后對于每個坐標內的源點計算下面的等式v(x)。
V(x)=q(x)/b(x)…(22)這里一個源點指這樣一個點,在該點處存在具有坐標x作為開始點的一個或多個路徑,以及在該點處的路徑不具有作為結束點的坐標x。以使用評價值v(x)的順序排列源點,并且將表示最小評價值v(x)的坐標定義為x=Origin。當得到Origin時,通過從Origin逆向跟蹤各路徑得到最短路由的路徑序列。然后,可以提供指定為路徑的結束點和類別來分別作為一個段點和字符識別結果。
例如,在圖16,可以通過兩個路由P11→P12和P17→P18到達基點B9。在這種情況下,通過等式(19)執行計算直到t=xd為止,并且選擇最小結果值。假定選擇路由P11→P12,得到路由P19→P20作為到源點B11的路由,得到路由P14→P15→P16作為到源點B12的路由,以及得到路由P11→P12→P13作為到源點B13的路由。當得到源點B11到B13時,選擇由等式(22)得到最小評價值v(x)。如果選擇源點B12,則將對應于源點B12的坐標xa定義為Origin。通過從Origin經P16逆向跟蹤路徑P14,可以確定段點xc和xe。另外,指定給路徑P14到P16的類別可以為相應分段位置的識別結果。
如上所述,根據本發明,整個圖象可以與其中根據圖象特征不能相互清楚地分段每個字符的字符連接模式的每個類別進行比較。因此,類別和分段位置在所得到的比較結果中恒定,并且可以得到匹配類別和分段位置的組合,從而正確地分段和識別一個字符。另外,通過組合經比較類別的分段處理和字符識別處理,可以以較高準確度執行字符識別處理。
圖17是根據本發明實施例由軟件實現模式分段處理和模式識別處理的信息處理裝置的配置方框圖。在圖17,11是用于執行整個處理的中央處理單元(CPU),12是只讀存儲器(ROM),13是隨機存取存儲器(RAM),14是一個通信接口,15是一個通信網絡,16是一個輸入/輸出接口,17是一個顯示文檔數據等的顯示器,18是一個打印文檔數據的打印機,19是一個暫存從讀取輸入圖象的掃描儀讀取的文檔數據等的存儲器,21是一個鍵盤,22是一個諸如鼠標之類的指向設備,23是一個驅動存儲介質的驅動器,24是一個硬盤,25是一個IC存儲器卡,26是一個磁帶,27是一個軟盤,28是一個諸如CD—ROM,DVD—ROM等之類的光盤,以及29是一個路徑。
可以將用于分段和識別一個模式的程序,類別特征量等存儲在一個諸如硬盤24,IC存儲器卡25,磁帶26,軟盤27,光盤28等的存儲介質上。通過將用于分段和識別一個模式的程序以及類別特征量從存儲介質讀取到RAM13,可以分段并識別一個模式。另外,用于分段和識別一個模式的程序可以存儲在ROM12中。
進一步,可以經通信接口14從通信網絡15檢索用于分段和識別一個模式的程序,類別特征量,輸入圖象特征量等。作為連接到通信接口14的通信網絡15,可以使用例如,一個無線通信網絡,LAN(局域網),WAN(廣域網),因特網,模擬電話網,數字電話網(ISDN綜合業務數字網),PHS(個人手持系統),衛星通信等。
當啟動用于分段或識別一個模式的程序時,CPU11從諸如硬盤24之類的存儲介質,或通信網絡15等獲得類別特征量。另外,經從掃描儀20讀取的輸入圖象,或從經通信網絡15傳輸的輸入圖象,提取一個輸入圖象的特征量。同時相對于類別特征量改變相應的輸入圖象的特征量部分,也可以將類別特征量與輸入圖象特征量進行比較。作為比較結果,當從輸入圖象獲得對應于類別特征量的部分時,將對應于類別特征量的部分定義為輸入圖象的分段位置。當得到輸入圖象的分段位置時,將比較中所用的類別定義為從輸入圖象分段的模式的識別結果。進一步,為獲得識別結果,可以識別從輸入圖象分段的模式。當得到一個識別結果時,該識別結果可以輸出到顯示器17和打印機18,或經通信網絡15傳輸。
圖18示出根據本發明實施例提供用于分段和識別一個模式的軟件程序等的方法。通過在下面三種方法中選擇的一種提供一個程序,等。
(a)如圖17所示,將一個程序提供為安裝在一個計算機的信息處理裝置30內。在這種情況下,程序可以是,例如,在交付之前預安裝。
(b)將程序提供為存儲在便攜式存儲介質31。在這種情況下,將存儲在便攜式存儲介質31的程序等安裝在計算機的信息處理單元30的外部存儲設備中。
(c)從網絡32內的服務器33提供程序。在這種情況下,計算機的信息處理裝置30通過下載存儲在服務器33內的程序等,可以基本得到程序。
如上所述,根據本發明,可以通過根據類別特征量和圖象特征量之間的比較結果,考慮類別的整個形式和結構以及模式的外形或不均勻性分段一個模式,來分段圖象的模式的處理,從而提高模式分段準確性。進一步,可以從圖象共同分段對應于類別特征量的模式,從而防止在多個點分段對應于一個類別的模式。
進一步,根據本發明的一個方面,在未將類別的兩端固定到字符串圖象的兩端的情況下,通過比較類別與其類別的兩端點對應于字符串圖象的各個點的字符串圖象,即使字符串圖象出現失真和變形,也可以保持類別特征量和字符串圖象的字符模式特征量之間的比較準確性。
另外,根據本發明的另一個方面,通過允許類別的一端對應于字符串圖象的成分的坐標,以及通過將對應于類別一端的字符串圖象的成分的坐標輸入表中,可以確定字符串圖象的分段位置,并且可以從表中輕易獲得字符串圖象的下一個分段位置,從而可以從字符串圖象有效提取另一個字符區域。
根據本發明的進一步的方面,可以通過檢查一個區域是否對應于要識別的任何類別,確定一個分段位置是否已被準確分段。因此,甚至當從一個圖象獲得多個分段位置時,也可以從多個區域獲得最佳分段位置。
根據本發明進一步的方面,通過分開設定用于類別分段的特征量以及用于類別識別的特征量,可以使用類別分段的特征量分段一個模式,并且使用類別識別的特征量識別分段模式。因此,可以確定使用不同的特征量是否可以正確地識別模式。另外,當執行一個分段處理時,可以使用適合于分段的特征量,并且當執行識別處理時,可以使用適合于識別的特征量,從而提高分段準確性和識別準確性。
根據本發明進一步的方面,當使用類別分段的特征量分段模式時,將該類別定義為該模式的識別結果,從而僅通過分段來自圖象的模式可獲得模式的識別結果,并縮短獲得模式識別結果的時間。
權利要求
1.一種模式分段裝置,包括一個提取圖象特征量的特征量提取單元;一個設定類別特征量的特征量設定單元;一個比較類別特征量與圖象特征量特征量比較單元;和一個分段對應于圖象類別特征量的部分的分段單元。
2.如權利要求1所述的裝置,其中所述特征量比較單元包括產生類別特征量和圖象特征量之間的對應的對應產生單元,并比較類別特征量和圖象特征量。
3.如權利要求2所述的裝置,其中所述特征量比較單元包括一個比較類別特征量和對應于該對應的圖象特征量之間的級別差的級別差計算單元;和一個從該對應提取表示最低級別差的最佳對應的最佳對應提取單元,其中所述分段單元分段表示對應于等于或小于預定值的最佳對應的級別差的部分。
4.如權利要求3所述的裝置,進一步包括一個利用所述分段裝置產生分段區域的組合以便所述分段單元分段的每個模式可以對應于要識別的任何類別的組合單元;和一個通過使組合中表示較小級別差累積值的組合具有高優先級來確定圖象的分段區域的分段區域確定單元。
5.一種模式分段裝置,包括特征量提取單元,提取字符串圖象的特征量作為沿字符串陣列方向的成分序列;特征量設定單元,沿類別陣列方向設定類別的特征量;對應單元,使類別成分序列內的最后成分與字符串圖象的每個成分相對應;查找單元,通過使具有字符串圖象成分的類別剩余成分序列對應該類別的成分序列的最后成分,來查找對應于該類別成分序列的第一個成分的字符串圖象的一個成分;級別差計算單元,計算字符串圖象和在成分序列內相互對應的類別之間的級別差;和鑒別單元,根據級別差鑒別字符串圖象內的一個字符的分段位置。
6.如權利要求5所述的裝置,其中所述級別差是從類別成分序列內的第一成分到最后成分的成分之間的距離的累積結果得到的。
7.如權利要求6所述的裝置,其中所述查找單元根據表示成分之間的距離的最小累積值的對應,在過去成分的對應中進行當前成分的對應。
8.如權利要求5所述的裝置,進一步包括輸入單元,輸入一組對應于類別成分序列的第一成分的字符串圖象的成分和沿字符串圖象陣列方向的所有成分的對應級別差;查找單元,檢測一個表示等于或小于由對應于字符串圖象的分段位置的每個成分規定的級別差內的一個預定值的級別差;獲取單元,從所述輸入單元得到對應于所述查找單元檢索的級別差的字符串圖象的成分;和計算單元,根據從所述輸入單元得到的字符串圖象的成分,計算該字符串圖象的下一個分段位置。
9.如權利要求8所述的裝置,進一步包括路徑生成單元,生成連接字符串圖象的分段位置與所述計算單元計算的字符串圖象的下一個分段位置的路徑;屬性指定單元,指定分段位置的屬性,所述查找單元檢索的級別差,以及作為該路徑屬性的對應于該級別差的類別;組合生成單元,通過經由該路徑交換字符串圖象生成該路徑的組合;評價單元,根據指定給該路徑的級別差的累積結果評價該路徑的組合;選擇單元,根據評價結果選擇路徑的組合;和段點確定單元,確定指定給所述選擇單元選擇的路徑的坐標作為字符串圖象的段點。
10.如權利要求9所述的裝置,進一步包括識別結果輸出單元,定義指定給所述選擇單元選擇的路徑的類別作為該段點處分段的模式的識別結果。
11.一種模式識別方法,包括設定類別的特征量;查找對應于圖象內的類別的特征量的區域;和分段通過查找處理從圖象得到的區域。
12.如權利要求11所述的方法,其中使用連續DP方法將所述類別特征量與圖象的整個特征量進行比較。
13.如權利要求11所述的方法,其中所述特征量是多至第n(n≥1)個外圍特征的外圍特征。
14.如權利要求11所述的方法,其中從圖象分段的每個模式與要識別的任何一個類別相關;選擇要識別的類別與表示最小總級別差的對應模式的組合。
15.一種對模式進行分段的方法,包括從圖象分段對應于類別特征量的第一分段區域;和當不能從圖象的剩余區域分段對應于類別特征量的第二分段區域時改變第一分段區域。
16.一種字符分段方法,包括提取字符串圖象的特征量作為沿字符串陣列方向的成分序列;設定類別特征量作為沿類別陣列方向的成分序列;相對于字符串圖象成分序列獨立掃描類別成分序列內的第一成分和最后成分;獲取類別成分序列和字符串圖象成分序列之間的對應;計算對應于該對應的字符串圖象和類別之間的級別差;和根據級別差鑒別字符串圖象中是否存在對應于該類別的模式。
17.一種模式識別方法,包括設定類別特征量;查找圖象內一個對應于該類別特征量的區域;分段通過查找處理從圖象獲得的區域;和設定分段處理中所用的類別作為從圖象分段區域的識別結果。
18.一種模式識別方法,包括設定用于分段一個類別的特征量;設定用于類別識別的特征量;根據分段特征量分段一個圖象的模式;和根據識別特征量識別從圖象分段的模式。
19.一種存儲程序的計算機可讀存儲介質,該程序用于實現設定一個類別的特征量;從圖象查找對應于類別特征量的模式;和分段通過查找處理從圖象得到的模式。
20.一種模式識別裝置,包括特征量提取裝置,用于提取圖象特征量;特征量設定裝置,用于設定類別特征量;特征量比較裝置,用于比較類別特征量與圖象特征量;和分段裝置,用于從圖象分段對應于類別特征量的部分。
21.一種模式分段裝置,包括特征量提取裝置,用于提取字符串圖象的特征量作為沿字符串陣列方向的成分序列;特征量設定裝置,用于沿類別陣列方向設定一個類別特征量;對應裝置,使類別成分序列內的最后成分與字符串圖象的每個成分相對應;查找裝置,通過使具有字符串圖象成分的類別剩余成分序列對應該類別的成分序列的最后成分,來查找對應于該類別成分序列的第一個成分的字符串圖象的一個成分;級別差計算裝置,計算字符串圖象和在成分序列內相互對應的類別之間的級別差;和鑒別裝置,根據級別差鑒別字符串圖象內的一個字符的分段位置。
全文摘要
一種模式分段裝置和模式識別裝置可以提高字符連接模式的分段準確性。該模式分段裝置包括提取圖象特征量的特征量提取單元,設定一個類別特征量的特征量設定單元,比較類別特征量與圖象特征量的特征量比較單元,和根據比較結果從圖象分段對應于類別特征量部分的分段單元。
文檔編號G06K9/34GK1279449SQ0012040
公開日2001年1月10日 申請日期2000年7月6日 優先權日1999年7月6日
發明者武部浩明, 堀田悅伸, 直井聰 申請人:富士通株式會社