根據自洽的候選匹配對生成待變換圖像到模板圖像的幾何變換。其中,自洽的候選匹配對是指這些候選匹配對內在邏輯一致,不含悖論。幾何變換可以包含大小變換和平面外旋轉等。可選地,該步驟S330利用隨機抽樣一致性(Random Sample Consensus, RANSAC)算法。RANSAC算法能魯棒地估計模型參數。例如,它能從包括大量候選匹配對的數據集中估計出高精度的自洽的候選匹配對。此外,該步驟S330還可以用最小二乘法。
[0063]圖4示出了根據本發明一個實施例的待變換圖像到模板圖像的幾何變換示意圖。圖4中,左邊為模板圖像,右邊為待變換圖像。圖4所示不同灰度直線連接的是兩圖的候選匹配對。這些候選匹配對經過選擇后獲得自洽的候選匹配對,根據自洽的候選匹配對可以生成待變換圖像周圍白色四邊形框所代表的幾何變換。
[0064]步驟S340:根據步驟S330所生成的幾何變換變換待變換圖像,使得在待變換圖像中的文字與在模板圖像中的對應文字大小和方向相同。根據所生成的幾何變換,可以獲知待旋轉圖像需要旋轉的角度等幾何變換信息。通過變換待變換圖像,待變換圖像的大小、形狀和方向變得與模板圖像的大小、形狀和方向相同。可以理解,在變換后,圖4所示的白色四邊形框將變換為矩形。本領域普通技術人員可以理解該步驟的具體實現,為了簡潔,在此不再詳述。
[0065]本領域普通技術人員可以理解,上述圖像變換方法300中的待變換圖像可以是證件圖像、圖紙圖像或任意其他適合的圖像。證件圖像在日常中應用較多。將上述變換方法應用于證件圖像不僅可以保證變換的正確率,而且計算量小,節約了技術操作人員的時間和精力。
[0066]可以理解,上述圖像變換方法可以作為多種圖像操作的預處理,例如:模板匹配、圖像識別等等。
[0067]根據本發明另一方面,還提供了一種圖像識別方法。圖5示出了根據本發明一個實施例的圖像識別方法500的流程圖。如圖5所示,圖像識別方法600包括步驟S510和步驟 S520。
[0068]步驟S510:按照上述圖像變換方法對包含文字的待識別圖像進行變換。
[0069]步驟S520:對經變換的圖像進行模式識別。
[0070]圖像變換后,特別是轉正后,待識別圖像的識別精度和識別速度能得到顯著提高。
[0071]該模式識別可以是字符識別等。可選地,上述步驟S520具體包括:步驟S521:根據經變換的圖像與模板圖像的文字對應關系,提取經變換的圖像的結構化信息;步驟S522:根據結構化信息確定經變換的圖像中的文字內容。結構化信息指圖像中各文本區域的信息,如身份證圖像中的文本區域“姓名”、“身份證號碼”等。
[0072]例如,圖6示出了根據本發明一個實施例的、經文字識別的圖像的示意圖。對于圖6所示的圖像,已知模板圖像最上面方框為姓名框,則可以確定待識別圖像中“姓名”為“奧巴馬”。
[0073]此外對于存在結構化信息的圖像,例如證件照片,由于圖像變換后,能將待識別圖像各文本區域與模板圖像中各文本區域直接建立聯系,因此使圖像的結構化信息提取變得非常簡單,識別容易。
[0074]根據本發明又一方面,還提供了一種圖像變換裝置。該圖像變換裝置可以應用于證件圖像等任意合適的圖像。圖7示出了根據本發明一個實施例的圖像變換裝置700的示意性框圖。如圖7所示,圖像變換裝置700包括預識別模塊710、粗匹配模塊720、細匹配模塊730和變換模塊740。
[0075]預識別模塊710用于對包含文字的待變換圖像進行文字預識別。文字預識別可以通過OCR的方式。通過文字預識別,可以獲得諸如文字內容、文字位置等的文字預識別結果O
[0076]可選地,預識別模塊710可包括樣式識別模塊,其用于對待變換圖像進行文字樣式識別。文字樣式可以包括以下項中的一項或多項:文字字體、文字顏色、文字長寬比、文字大小和文字特殊效果。
[0077]可選地,預識別模塊710還可包括置信度確定模塊,其用于針對所預識別的文字,確定文字識別的識別置信度。
[0078]可以理解,上述文字樣式和識別置信度均可以作為文字預識別結果的一部分。
[0079]粗匹配模塊720用于待變換圖像的文字預識別結果以及模板圖像的文本區域,生成待變換圖像與模板圖像之間的候選匹配對。具體地,粗匹配模塊720可以利用打分公式來對文字預識別結果中的各個文本區域打分,進而根據打分結果生成候選匹配對。打分公式可以是多個項的加和。打分公式的項例如是待變換圖像和模板圖像的文本區域的文字內容差異度等。可選地,打分公式還可以考慮文字樣式和/或識別置信度等因素,例如增加表達例如文字字體差異度、文字顏色差異度、文字大小差異度、文字識別置信度差異度的項。
[0080]可選地,粗匹配模塊720包括預定字識別模塊和匹配對生成模塊。預定字識別模塊用于識別文字預識別結果中的預定字;匹配對生成模塊用于針對該文字預識別結果中的、該預定字以外的字生成候選匹配對。通過僅針對非預定字生成候選匹配對,而有選擇性地忽略預定字,可以避免預定字的混淆作用,并且減小了計算量。
[0081]細匹配模塊730用于在粗匹配模塊720所生成的候選匹配對中選擇自洽的候選匹配對并且根據該自洽的候選匹配對生成待變換圖像到模板圖像的幾何變換,例如通過RANSAC 算法。
[0082]變換模塊740用于根據細匹配模塊730所生成的幾何變換變換待變換圖像,使得在待變換圖像中的文字與在模板圖像中的對應文字大小和方向相同。
[0083]根據本發明再一方面,還提供了一種圖像識別裝置。圖8示出了根據本發明一個實施例的圖像識別裝置800的示意性框圖。如圖8所示,圖像識別裝置800包括圖像變換裝置810以及模式識別模塊820。該圖像變換裝置810采用上述的圖像變換裝置700,用于對包含文字的待識別圖像進行變換。模式識別模塊820用于對經變換的圖像進行模式識別。
[0084]可選地,上述模式識別模塊820具體用于對經變換的圖像進行字符識別。
[0085]可選地,上述模式識別模塊820包括信息提取模塊和內容確定模塊。信息提取模塊用于根據經變換的圖像與模板圖像的文字對應關系,提取經變換的圖像的結構化信息。內容確定模塊用于根據結構化信息確定經變換的圖像中的文字內容。
[0086]本領域普通技術人員通過閱讀上文關于圖像變換方法的詳細描述,能夠理解上述圖像識別方法、圖像變換裝置和圖像識別裝置的構成、實現以及優點,因此這里不再贅述。
[0087]在此提供的方法和裝置不與任何特定計算機、虛擬系統或者其它設備固有相關。各種通用系統也可以與基于在此的示教一起使用。根據上面的描述,構造這類系統所要求的結構是顯而易見的。此外,本發明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現在此描述的本發明的內容,并且上面對特定語言所做的描述是為了披露本發明的最佳實施方式。
[0088]在此處所提供的說明書中,說明了大量具體細節。然而,能夠理解,本發明的實施例可以在沒有這些具體細節的情況下實踐。在一些實例中,并未詳細示出公知的方法、結構和技術,以便不模糊對本說明書的理解。
[0089]類似地,應當理解,為了精簡本公開并幫助理解各個發明方面中的一個或多個,在上面對本發明的示例性實施例的描述中,本發明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發明要求比在每個權利要求中所明確記載的特征更多的特征。更確切地說,如下面的權利要求書所反映的那樣,發明方面在于少于前面公開的單個實施例的所有特征。因此,遵循【具體實施方式】的權利要求書由此明確地并入該【具體實施方式】,其中每個權利要求本身都作為本發明的單獨實施例。