圖像變換方法。圖3示出根據本發明一個實施例的圖像變換方法300的流程圖。如圖3所示,圖像變換方法300包括步驟S310、步驟S320、步驟S330和步驟S340。
[0035]步驟S310:對包含文字的待變換圖像進行文字預識別。
[0036]相對于角點,文字是更高層的圖像特征,特異性更高。可以通過光學字符識別(OCR)方式來進行文字預識別,其通過圖像處理和模式識別對光學字符進行預識別。具體而言,OCR是檢查圖像上的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成文字的過程。可以理解,本發明中圖像所包含的文字,并不僅限于漢字,其可以包括英文、日文、韓文等其他文字。
[0037]通過文字預識別,可以對待變換圖像進行文字內容識別。換言之,即識別出待變換圖像上包含哪些具體文字。文字預識別還同時識別了這些文字內容在圖像中的位置。進而,文字預識別可以獲得一個或多個文本區域。
[0038]可選地,本步驟S310可以包括:對待變換圖像進行文字樣式識別。文字樣式是一組可隨圖形保存的文字設置的集合。這些設置可根據需要包括以下項中的一項或多項:文字字體、文字顏色、文字長寬比、文字大小和文字特殊效果等。文字特殊效果簡稱文字特效,其包括文字是否是上標或下標,是否被標記有刪除線、下劃線等,是否具有陰影等等。對于文字大小和文字長寬比,其更適應于已知待變換圖像只需要進行方向變換,即旋轉,而無需明顯的大小和形狀變換的情況。
[0039]可選地,步驟S310進一步包括:針對所預識別的文字,確定文字識別的識別置信度。對于圖像中每個所預識別的文字,其識別置信度是不同的,有些文字的識別置信度高,有些文字的識別置信度低。特別地,對于位于圖像中不同位置的兩個字,其可能內容一致,例如都是文字“阿”,但是其識別置信度也可能各有高低。
[0040]與實施方案相對應地,文字內容、文字樣式和識別置信度均可以作為文字預識別結果的一部分。
[0041]在圖像變換過程中,除了文字內容,還考慮到文字樣式和識別置信度,可以更好地進行待變換圖像和模板圖像的文本區域匹配,避免發生匹配錯誤,進而避免圖像變換失敗。
[0042]步驟S320:基于步驟S310的待變換圖像的文字預識別結果以及模板圖像的文本區域,生成待變換圖像與模板圖像之間的候選匹配對。
[0043]通過對步驟S310的描述,可以理解,文字預識別結果可以至少包括所預識別的具體文字和其在圖像中的位置,進而可以確定圖像包括哪些文本區域。
[0044]模板圖像的文本區域可以是預先確定的。可選地,在步驟S320之前,方法100還可以包括步驟S310’,對模板圖像進行文字預識別,以確定模板圖像的文本區域。該步驟S310’和步驟S310類似,只是操作對象不同,為了簡潔,在此不再贅述。可選地,模板圖像的文本區域也可以通過其他方法預先確定,例如,通過人工輸入,以確保文本區域各個數據的準確性。
[0045]根據待變換圖像的文字預識別結果以及模板圖像的文本區域,可以初步判斷待變換圖像和模板圖像中有哪些文本區域是匹配的,這樣即可生成候選匹配對。
[0046]可選地,利用打分公式來對各個文本區域進行打分,以生成候選匹配對。例如,打分公式d可以如公式⑴所示:
[0047](Ktpt2) = a0 (text Ct1) -text (t2))2+
[0048]a1 (size Ct1) -size (t2))2+
[0049]a2 (stroke-color U1) -stroke-color (t2)) +
[0050]a3 (font Ct1) -font (t2))2+
[0051 ] a4 (aspect-rat1 Ct1) -aspext-rat1 (t2))2+
[0052]a5 (confidence U1)-confidence (t2))2 (I)
[0053]公式⑴中,下標I和下標2分別表示參數所屬的圖像是待變換圖像和模板圖像。tn ^為待比較的文本區域。text O表示文本區域內的文字內容,sizeO表示文本區域內文字的文字大小,stroke-color O表示文本區域內文字的文字顏色,font O表示文本區域內的文字字體,aspect-rat1 O表示文本區域內的文字長寬比,confidence O表示文本區域內文字的文字識別置?曰度。a。、3-1N a2、a3、a4、%為系數,其均為任思頭數,?。、a2、a3、a4、%可以都取相同值,例如I。a。與其余參數相比,其可以為較大值,而剩余參數為較小值。
[0054]對于打分公式中的每項,可以設置其相減的規則。本領域普通技術人員可以理解,各個項之間的相減規則可以不同。例如,每項中的減數與被減數完全相同則差值為0,否則差值為I ο又例如,對于項a。(text U1) -text (t2))2,可以設置為根據文本內容的差異度計算差值text U1)-text (t2)。對于包含字數較多的文本內容text U1)和text (t2),可以根據文字相同的比例計算差值。如果二者完全相同,差值可為O ;如果二者完全不同,差值可為I ;根據二者中相同的文字的個數以及文字總字數,差值可能為諸如0.1,0.2等的不同值。
[0055]本領域普通技術人員可以理解,上述公式(I)僅為打分公式的一個示例,而非限制。例如,&1、&2、&3、&4、&5中的一個或者多個可以為0。又例如,公式(I)的右方可以加和其他的項,例如關于文字特殊效果的項a6 (effect U1)-effect (t2))2。當然,打分公式也可以做其他變化,例如將打分公式中的減法改為除法等。
[0056]當上述打分公式的所獲得的分數低于預定閾值時,生成候選匹配對tJP 12。
[0057]綜上,對于公式(I)所示的打分公式,當兩個文本區域的各項內容足夠接近時,如文字字體類似、文字顏色相似、文字大小相近、文字識別置信度類似的文本區域,才能成為候選匹配對。例如,模板圖像中黑體的文字“阿”與待變換圖像中楷體的文字“阿”不會構成候選匹配對。又例如,模板圖像中文字“阿”的識別置信度為0.9,而待變換圖像中文字“阿”的識別置信度為0.1,則二者也不會構成候選匹配對。對于模板圖像的文本內容為人工輸入的方式預先確定的情況,可以將模板圖像中文本區域內文字的識別置信度設置為I。文字樣式識別和文字識別置信度能夠更好地幫助篩選候選匹配對,保證了候選匹配對的準確性,并且有效減少了候選匹配對數目。進而,在保證圖像變換準確性的同時,減小了后續計算量。
[0058]可選地,步驟S320中包括以下步驟:識別文字預識別結果中的預定字;并且針對文字預識別結果中的、預定字以外的字生成候選匹配對。換言之,可以在生成候選匹配對時,忽略預定字。預定字是識別度、特異性最低的文字。針對這樣的文字生成候選匹配對,對圖像匹配沒有太大幫助反而會造成匹配時的特征混淆,此外還造成了極大計算量。
[0059]預定字可以是最常用字。最常用字是最經常用到的文字。可以根據文字的使用頻率、學科分布、構詞能力、語義功能等因素來選擇最常用字。通常情況下,使用頻率高、學科分布廣、構詞能力強且語義功能多的文字是最常用字。最常用字例如:“的”、“一”、“國”、“在”、“人”等。
[0060]預定字可以是模板圖像和待變換圖像中已知出現頻率非常高的文字。例如對于圖紙圖像,文字“圖”就可能是預定字。
[0061]總之,通過在生成候選匹配對時忽略預定字,可以有效減小計算量,并且對變換正確率沒有顯著負面影響。
[0062]步驟S330:在步驟S320所生成的候選匹配對中選擇自洽的候選匹配對并且