一種手寫體關(guān)鍵詞檢測方法
【專利摘要】本發(fā)明公開了一種手寫體關(guān)鍵詞檢測方法,包括提取關(guān)鍵詞圖像庫中關(guān)鍵詞圖像的特征點建立關(guān)鍵詞特征庫;提取待檢測文本圖像中文本的特征點,得到待檢測文本圖像的特征點庫;提取待檢測文本圖像的滑動窗口,從特征點庫中提取滑動窗口對應(yīng)的特征點集合,比對特征點集合得到初始的匹配點對集合;篩選初始的匹配點對集合得到準(zhǔn)確的匹配點對;根據(jù)匹配點對篩選待檢測文本圖像中的滑動窗口并整合,得到檢測結(jié)果。在特征提取過程中,本方法采用了SIFT特征表征。該方法適用于大量手寫體文檔的關(guān)鍵詞檢測,如歷史文獻、信函、筆記等等,在建立黑名單圖像庫的前提下,不僅能夠有效檢測出黑名單中的關(guān)鍵詞,更能夠區(qū)分不同作者的筆跡。
【專利說明】—種手寫體關(guān)鍵詞檢測方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像檢測技術(shù),尤其涉及一種基于文字局部特征的特定書寫人手寫體關(guān)鍵詞檢測方法。
【背景技術(shù)】
[0002]手寫體關(guān)鍵詞檢測是在大量手寫文本圖像中檢測特定的關(guān)鍵詞。目前手寫體關(guān)鍵詞檢測的方法通常是在文字識別的基礎(chǔ)上再進行字符檢索。 [0003]然而中文漢字類別多,書寫風(fēng)格多變,現(xiàn)有基于識別文字的手寫體關(guān)鍵詞檢錯方法首先需要建立龐大的漢字模板庫,并花費大量時間進行特征的訓(xùn)練和分類,前期的圖像預(yù)處理和文字分割也很大程度影響識文字的別結(jié)果,進而影響關(guān)鍵詞檢測結(jié)果;此外這種依靠識別的結(jié)果的方法未將不同書寫人的書寫風(fēng)格納入考量,從而無法有效地對手寫體文字的識別。
【發(fā)明內(nèi)容】
[0004]本發(fā)明克服了現(xiàn)有技術(shù)中無法有效地識別特定書寫人手寫體文字的缺陷,提出了一種手寫體關(guān)鍵詞檢測方法。
[0005]本發(fā)明提出了一種手寫體關(guān)鍵詞檢測方法,包括如下步驟:步驟一:獲取關(guān)鍵詞圖像庫,提取所述關(guān)鍵詞圖像庫中關(guān)鍵詞圖像的特征點建立關(guān)鍵詞特征庫;步驟二:提取待檢測文本圖像中文本的特征點,得到所述待檢測文本圖像的特征點庫;步驟三:提取待檢測文本圖像的滑動窗口,從所述特征點庫中提取所述滑動窗口對應(yīng)的特征點集合,將所述特征點集合與所述關(guān)鍵詞特征庫對比,得到初始的匹配點對集合;步驟四:根據(jù)所述滑動窗口中文字幾何結(jié)構(gòu)信息,篩選所述初始的匹配點對集合得到準(zhǔn)確的匹配點對;步驟五:根據(jù)所述匹配點對篩選所述待檢測文本圖像中的滑動窗口并整合,得到檢測結(jié)果。
[0006]本發(fā)明提出的手寫體關(guān)鍵詞檢測方法中,所述步驟三中當(dāng)所述特征點集合中的特征點與所述關(guān)鍵詞特征庫差異小于閾值時,該特征點被檢測為初始的匹配點對,所述特征點如下式所示:
【權(quán)利要求】
1.一種手寫體關(guān)鍵詞檢測方法,其特征在于,包括如下步驟: 步驟一:獲取關(guān)鍵詞圖像庫,提取所述關(guān)鍵詞圖像庫中關(guān)鍵詞圖像的特征點建立關(guān)鍵詞特征庫; 步驟二:提取待檢測文本圖像中文本的特征點,得到所述待檢測文本圖像的特征點庫; 步驟三:提取待檢測文本圖像的滑動窗口,從所述特征點庫中提取所述滑動窗口對應(yīng)的特征點集合,將所述特征點集合與所述關(guān)鍵詞特征庫對比,得到初始的匹配點對集合;步驟四:根據(jù)所述滑動窗口中文字幾何結(jié)構(gòu)信息,篩選所述初始的匹配點對集合得到準(zhǔn)確的匹配點對; 步驟五:根據(jù)所述匹配點對篩選所述待檢測文本圖像中的滑動窗口并整合,得到檢測結(jié)果。
2.如權(quán)利要求1所述的手寫體關(guān)鍵詞檢測方法,其特征在于,所述步驟三中當(dāng)所述特征點集合中的特征點與所述關(guān)鍵詞特征庫差異小于閾值時,該特征點被檢測為初始的匹配點對,所述特征點如下式所示:
3.如權(quán)利要求1所述的手寫體關(guān)鍵詞檢測方法,其特征在于,所述步驟四中通過文字幾何結(jié)構(gòu)信息約束篩選所述初始的匹配點對集合,其過程包括如下步驟: 步驟bl:建立所述特征點集合與所述關(guān)鍵詞圖像的特征點集合之間的幾何信息約束圖; 步驟b2:通過最大團查找算法對所述幾何信息約束圖進行篩選,刪除所述初始的匹配點對集合中誤匹配的匹配點對。
4.如權(quán)利要求3所述的手寫體關(guān)鍵詞檢測方法,其特征在于,所述幾何信息約束圖的約束條件如下式表示:
5.如權(quán)利要求1所述的手寫體關(guān)鍵詞檢測方法,其特征在于,所述步驟五中篩選所述待檢測文本圖像中的滑動窗口包括如下步驟: 步驟Cl:若所述滑動窗口的匹配點的重心與原關(guān)鍵詞的重心偏移比例大于0.15,刪除該 滑動滑動窗口,否則繼續(xù)下一步驟; 步驟c2:若所述滑動窗口的匹配點在左半邊分布的比例與原關(guān)鍵詞的分布比例偏差大于0.18,刪除該滑動滑 動窗口,否則保留該滑動窗口。
【文檔編號】G06K9/68GK103679218SQ201310582398
【公開日】2014年3月26日 申請日期:2013年11月19日 優(yōu)先權(quán)日:2013年11月19日
【發(fā)明者】呂岳, 張文超 申請人:華東師范大學(xué)