基于信息整合的模式識別的方法和系統的制作方法
【技術領域】
[0001]本發明的實施例總體上涉及模式識別,更具體地,涉及基于信息整合的模式識別的方法和系統。
【背景技術】
[0002]模式識別是指通過計算機技術對圖形、聲音、字符等模式(pattern)進行自動或半自動地處理和判別。模式識別在諸多領域得到廣泛的使用,包括對幾何圖形的識別。一類重要的幾何圖形是基于二維(2D)圖的框圖(2D graph-based diagram)。在本發明的上下文中,術語“框圖”是圖元以及各個圖元之間的相互關系的集合。圖元可以是各種2D圖形,其具有相應的形狀,例如矩形、橢圓形、圓形、三角形、平行四邊形,等等。圖元可以具有相關聯的文字,也可以不具有文字。圖元之間的關系通常由連線(line)表示。連線可以包括直線、弧線以及各種曲線。而且,連線可以是無方向的,也可以是有方向的(包括單向和雙向),方向例如可以通過箭頭來表示。框圖的示例包括但不限于流程圖、方框圖(block diagram)、樹形圖、網狀圖,等等。
[0003]框圖在各個領域被廣泛使用。例如,在很多企業、研究機構、大學以及各種其他組織中,大量的信息通過框圖的形式來呈現。作為示例,在進行各種演示時,演示者常常借助于框圖來表達其主旨。又如,在紙質媒體的各種書籍、報刊、論文、雜志上,也存在大量的框圖。希望能夠利用模式識別技術對非電子媒介上的框圖進行數字化,從而將其轉化為數字格式。已知的方式是利用照相機之類的圖像采集裝置將框圖轉化為圖像,而后對框圖中的圖元及其連接關系進行識別。
[0004]然而,至少由于以下原因,單純基于圖像處理的常規方法容易產生錯誤。首先,很多框圖是用戶手繪的,使得框圖中的圖元和/或連線具有一定的不規范性。其次,在某些情況下,用戶只能使用移動電話、平板電腦、個人數字助理(PDA)等便攜式設備上的圖像采集裝置、在較短的時間內捕獲框圖的圖像。受制于圖像拍攝條件、分辨率等因素,圖像質量可能不是很高,這不利于識別的準確性。另外,在框圖中,很多圖元具有較高的相似性,例如橢圓類似于圓形,矩形類似于正方形,等等。這同樣給模式識別帶來了挑戰。
【發明內容】
[0005]為了解決上述以及其他潛在問題,本發明提出了基于信息整合的模式識別的解決方案。
[0006]在本發明的一個方面,提供一種用于識別圖像中的圖元的方法。所述方法包括:識別所述圖像中的至少一個圖元,以獲得所述至少一個圖元的至少一個候選形狀,所述至少一個候選形狀具有對應的置信度;基于所述置信度確定對所述至少一個圖元的所述識別是否存在潛在錯誤;響應于確定所述識別存在所述潛在錯誤,從用戶處獲取關于所述至少一個圖元的輔助信息;以及至少部分地基于所述輔助信息對所述至少一個圖元進行重新識別。
[0007]在本發明的另一方面,一種用于識別圖像中的圖元的系統。所述系統包括:識別單元,被配置為識別所述圖像中的至少一個圖元,以獲得所述至少一個圖元的至少一個候選形狀,所述至少一個候選形狀具有對應的置信度;潛在錯誤檢測單元,被配置為基于所述置信度確定對所述至少一個圖元的所述識別是否存在潛在錯誤;輔助信息獲取單元,被配置為響應于確定所述識別存在所述潛在錯誤,從用戶處獲取關于所述至少一個圖元的輔助信息;以及重識別單元,被配置為至少部分地基于所述輔助信息對所述至少一個圖元進行重新識別。
[0008]通過下文描述將會理解,不同于現有技術,根據本發明的實施例,圖元的形狀不僅僅依賴于圖像特征而被識別。相反,根據本發明的實施例,基于圖像特征識別出的圖元候選形狀都具有對應的置信度。如果基于置信度確定識別可能存在潛在的精度問題,則可以從用戶處獲取附加的輔助信息。通過在識別階段和/或決策結果對輔助信息和圖像信息進行整合,能夠有效地提高識別的精度。
【附圖說明】
[0009]通過結合附圖對本發明示例性實施方式進行更詳細的描述,本發明的上述以及其它目的、特征和優勢將變得更加明顯其中:
[0010]圖1示出了適于用來實現本發明實施例的示例性計算機系統/服務器的示意性方框圖;
[0011]圖2示出了根據本發明實施例的用于識別圖像中的圖元的方法的流程圖;
[0012]圖3A和圖3B示出了根據本發明實施例的待處理圖像的示意圖;以及
[0013]圖4示出了根據本發明實施例的用于識別圖像中的圖元的系統的方框圖。
[0014]在所有附圖中,相同或相似的標號被用來表示相同或相似的元素。
【具體實施方式】
[0015]下面將參照附圖更詳細地描述本公開的優選實施方式。雖然附圖中顯示了本公開的優選實施方式,然而應該理解,可以以各種形式實現本公開而不應被這里闡述的實施方式所限制。相反,提供這些實施方式是為了使本公開更加透徹和完整,并且能夠將本公開的范圍完整地傳達給本領域的技術人員。
[0016]圖1示出了適于用來實現本發明實施方式的示例性計算機系統/服務器12的方框圖。圖1顯示的計算機系統/服務器12僅僅是一個示例,不應對本發明實施例的功能和使用范圍帶來任何限制。
[0017]如圖1所示,計算機系統/服務器12以通用計算設備的形式表現。計算機系統/服務器12的組件可以包括但不限于:一個或者多個處理器或者處理單元16,系統存儲器28,連接不同系統組件(包括系統存儲器28和處理單元16)的總線18。
[0018]總線18表示幾類總線結構中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結構中的任意總線結構的局域總線。舉例來說,這些體系結構包括但不限于工業標準體系結構(ISA)總線,微通道體系結構(MAC)總線,增強型ISA總線、視頻電子標準協會(VESA)局域總線以及外圍組件互連(PCI)總線。
[0019]計算機系統/服務器12典型地包括多種計算機系統可讀介質。這些介質可以是任何能夠被計算機系統/服務器12訪問的可用介質,包括易失性和非易失性介質,可移動的和不可移動的介質。
[0020]系統存儲器28可以包括易失性存儲器形式的計算機系統可讀介質,例如隨機存取存儲器(RAM)30和/或高速緩存存儲器32。計算機系統/服務器12可以進一步包括其它可移動/不可移動的、易失性/非易失性計算機系統存儲介質。僅作為舉例,存儲系統34可以用于讀寫不可移動的、非易失性磁介質(圖1未顯示,通常稱為“硬盤驅動器”)。盡管圖1中未示出,可以提供用于對可移動非易失性磁盤(例如“軟盤”)讀寫的磁盤驅動器,以及對可移動非易失性光盤(例如⑶-ROM,DVD-ROM或者其它光介質)讀寫的光盤驅動器。在這些情況下,每個驅動器可以通過一個或者多個數據介質接口與總線18相連。存儲器28可以包括至少一個程序產品,該程序產品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執行本發明各實施例的功能。
[0021]具有一組(至少一個)程序模塊42的程序/實用工具40,可以存儲在例如存儲器28中,這樣的程序模塊42包括——但不限于——操作系統、一個或者多個應用程序、其它程序模塊以及程序數據,這些示例中的每一個或某種組合中可能包括網絡環境的實現。程序模塊42通常執行本發明所描述的實施例中的功能和/或方法。
[0022]計算機系統/服務器12也可以與一個或多個外部設備14 (例如鍵盤、指向設備、顯示器24等)通信,還可與一個或者多個使得用戶能與該計算機系統/服務器12交互的設備通信,和/或與使得該計算機系統/服務器12能與一個或多個其它計算設備進行通信的任何設備(例如網卡,調制解調器等等)通信。這種通信可以通過輸入/輸出(I/O)接口 22進行。并且,計算機系統/服務器12還可以通過網絡適配器20與一個或者多個網絡(例如局域網(LAN),廣域網(WAN)和/或公共網絡,例如因特網)通信。如圖所示,網絡適配器20通過總線18與計算機系統/服務器12的其它模塊通信。應當明白,盡管圖中未示出,可以結合計算機系統/服務器12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設備驅動器、冗余處理單元、外部磁盤驅動陣列、RAID系統、磁帶驅動器以及數據備份存儲系統等。
[0023]現在參考圖2,其示出了根據本發明實施例的用于識別圖像中的圖元的方法200的流程圖。
[0024]在步驟S201,識別圖像中的至少一個圖元。根據本發明的實施例,待處理的圖像可以是用戶使用圖像采集裝置從有形媒體獲得的。例如,用戶可以使用照相機、攝像機或者移動電話、平板計算機、PDA等便攜式設備上的圖像采集裝置來獲取圖像或者圖像的一個或多個部分。備選地或附加地,圖像或其部分可以直接以數字化形式被輸入。
[0025]根據本發明的實施例,圖像或其部分中包括由一個或多個圖元組成的框圖。如上文所述,框圖例如可以包括流程圖、方框圖、樹形圖、網絡圖,等等。每個圖元具有相應的形狀,例如矩形、三角形、圓形,等等。圖元可以具有也可以不具有相關聯的文字。圖元之間的關系由連