用于醫學報告單的符號識別方法及系統的制作方法
【技術領域】
[0001] 本發明涉及圖像識別技術領域,尤其涉及一種用于醫學報告單的符號識別方法及 系統。
【背景技術】
[0002] 隨著文本排版格式的復雜化以及文本中出現的特殊字符多樣化,使得處理圖像中 的文本越來越困難。目前,〇CR(OpticalCharacterRecognition,光學字符識別)系統對 大多數文本都有較高的識別率,得到廣泛的應用。
[0003] 醫學領域中的化驗單是對患者進行治療的重要依據,也可能是醫療保險理賠、傷 殘事故鑒定以及醫療糾紛等情況的法律依據。因此,對化驗單的自動高效地解析具有較高 的現實意義。但是醫學報告單中常用特殊符號來標識異常指標,例如加號、減號、大于等于 號、小于等于號、箭頭等。此時,OCR系統的識別準確率不盡如人意,在一定程度上影響了化 驗單的正確解析。
【發明內容】
[0004] 本發明的其中一個目的在于提供一種用于醫學報告單的符號識別方法及系統,用 于提供OCR系統的識別準確率,提高醫學報告單解析效率。
[0005] 第一方面,本發明實施例提供了一種用于醫學報告單的符號識別方法,包括:
[0006] 根據不同符號的特征構造訓練樣本訓練分類器;
[0007] 從醫學報告單圖片中前景圖像上采集不同符號,獲得不同符號的特征以構造符號 模板;
[0008] 利用所述分類器識別與檢測符號模板,用于得到醫學報告單中的異常指標及位 置。
[0009] 可選地,所述構造訓練樣本訓練分類器采用邏輯回歸方法,包括以下步驟:
[0010] 構造訓練樣本;
[0011] 將所述訓練樣本進行尺寸歸一化,得到相同維數的圖像特征;
[0012] 計算訓練樣本的圖像特征值;
[0013] 根據所述圖像特征值訓練所述分類器,獲得所述分類器參數。
[0014] 可選地,從醫學報告單圖片中前景圖像上采集不同符號之前,該方法還包括預處 理步驟,具體包括:
[0015] 利用霍夫變換方法獲得前景圖像的頂點坐標,確定所述前景圖像的尺度信息;
[0016] 利用透視變換方法對所述前景圖像進行傾斜校正,以獲取正投影的所述前景圖 像;
[0017] 利用局部閾值法將所述前景圖像分成若干區域,對每個所述區域進行二值化。
[0018] 可選地,所述從醫學報告單圖片中前景圖像上采集不同符號,還包括確定每行文 本的高度的步驟,包括:
[0019] 讀取所述前景圖像中的文本區域,對所述文本進行膨脹和腐蝕得到連通域;
[0020] 當所述連通域的水平投影能量大于能量預設值時,所述水平投影的位置的最大差 值為每行文本的高度。
[0021] 可選地,當前景圖像上采集的符號為箭頭時,包括以下步驟:
[0022] 根據豎線的特征構造豎線模板;
[0023] 根據所述豎線模板定位所述前景圖像中所有可分離的豎線;
[0024] 根據所述豎線模板構造箭頭模板;
[0025] 分別構造訓練樣本,訓練學習得到分類器參數;
[0026] 在可分離的豎線的位置檢測箭頭位置。
[0027] 可選地,所述根據豎線的特征構造豎線模板,包括:
[0028] 當連續線段的上下左右位置的像素值為0,且與符號模板對應位置的匹配程度大 于預設閾值時,標記連續線段為可分離的豎線;
[0029] 遍歷所述前景圖像,定位前景圖像中所有的可分離的豎線。
[0030] 可選地,根據所述豎線模板構造箭頭模板,包括:
[0031] 在每個可分離的豎線所在的位置,在與豎線模板大小相同的區域內進行水平投 影;
[0032] 計算水平投影能量值大于能量預設值的位置的最大差值,得到豎線的線寬。
[0033] 可選地,所述分類器的函數表達式為:
[0034]
[0035] 其中,P(t)為分類結果,t為特征向量的加權和;
[0036]
[0037]N為特征的維數,Wi為第i維特征的權重系數,xi為第i維特征的特征值。
[0038] 第二方面,本發明實施例還提供了一種用于醫學報告單的符號識別系統,包括:
[0039] 分類器生成模塊,用于根據不同符號的特征構造訓練樣本訓練分類器;
[0040] 符號模板構造模塊,用于從醫學報告單圖片中前景圖像上采集不同符號,獲得不 同符號的特征以構造符號模板;
[0041] 模板匹配模塊,利用所述分類器識別與檢測符號模板,用于得到醫學報告單中的 異常指標及位置。
[0042] 與現有技術相比,本發明不僅彌補了傳統OCR對特殊符號識別率低的不足,也適 應了文本的排版格式復雜化和多樣化;同時將此識別方法應用于醫學領域的醫學報告單的 解析中,利用向上或者向下的箭頭來描述醫學化驗單中的某項指標存在偏高或者偏低的情 況,以此來表征異常指標,能夠實現快速解析醫學報告單,具有極高的應用價值和廣闊的發 展前景。
【附圖說明】
[0043] 通過參考附圖會更加清楚的理解本發明的特征和優點,附圖是示意性的而不應理 解為對本發明進行任何限制,在附圖中:
[0044] 圖1本發明實施例中用于醫學報告單的符號識別方法流程示意圖;
[0045] 圖2是本發明實施例中一種攝像機拍攝的醫學報告單示意圖;
[0046] 圖3是本發明實施例中利用霍夫變換和透射變換對圖2所示醫學報告單校正后得 到的正常圖像;
[0047]圖4是本發明實施例中標定符號的醫學報告單示意圖;
[0048] 圖5是本發明實施例中所提取的箭頭所在行的異常指標示意圖;
[0049] 圖6是本發明實施例中一種用于醫學報告單的符號識別系統框圖。
【具體實施方式】
[0050] 為了能夠更清楚地理解本發明的上述目的、特征和優點,下面結合附圖和具體實 施方式對本發明進行進一步的詳細描述。需要說明的是,在不沖突的情況下,本申請的實施 例及實施例中的特征可以相互組合。
[0051] 在下面的描述中闡述了很多具體細節以便于充分理解本發明,但是,本發明還可 以采用其他不同于在此描述的其他方式來實施,因此,本發明的保護范圍并不受下面公開 的具體實施例的限制。
[0052] -方面,本發明提出了一種用于醫學報告單的符號識別方法,如圖1所示,包括:
[0053] S10、根據不同符號的特征構造訓練樣本訓練分類器;
[0054] S20、從醫學報告單圖片中前景圖像上采集不同符號,獲得不同符號的特征以構造 符號模板;
[0055] S30、利用所述分類器識別與檢測符號模板,用于得到醫學報告單中的異常指標及 位置。
[0056] 可理解的是,本發明中醫學報告單圖片是指將醫學報告單放置在某處拍攝的圖 片;而前景圖像則指醫學報告單在圖片中的成像。
[0057] 針對現有技術中OCR系統對文本中特殊符號識別率低的問題,本發明實施例所提 供的符號識別方法,根據不同符號訓練不同的分類器,然后從醫學報告單上采集符號建立 模板,對分類器進行模板匹配。不僅彌補了傳統OCR對特殊符號識別率低的不足,同時可以 應用到醫學報告單的解析中,從而進行快速解析醫學報告單,有利于提高解析效率。
[0058] -般情況下,通過掃描儀得到的圖像都是正投影,圖像沒有角度偏差,有利于圖像 中的文字識別。而攝像機采集圖像時受到各種條件的限制和干擾,所拍攝物體的圖片會發 生變形(例如近大遠小),需要經過一定的畸變校正處理才能使用,以保證對圖像識別時不 出現誤差。如圖1所示,攝像機拍攝的醫學報告單的圖片,該圖片發生明顯的變形,因此需 要對圖像進行預處理。
[0059] 可選地,從醫學報告單圖片中前景圖像上采集不同符號之前,該方法還包括預處 理步驟,具體包括:
[0060] 利用霍夫變換方法獲得前景圖像的頂點坐標,確定所述前景圖像的尺度信息;
[0061] 利用局部閾值法將所述前景圖像分成若干區域,對每個所述區域進行二值化。
[0062] 首先,介紹利用霍夫變換方法獲得前景圖像的頂點坐標,確定所述前景圖像的尺 度信息的步驟。
[0063] 本發明利用霍夫變換方法檢測醫學報告單圖片的前景圖像邊緣,確定前景圖像的 大小。根據點與線的對偶性,將輸入圖片空間給定的曲線表達形式變為參數空間的點,從而 將輸入圖片中給定曲線的檢測問題轉化為尋找參數空間中的峰值問題。即將檢測整體特征 轉化為檢測局部特性,這樣通過獲得前景圖像的邊緣直線方程,以及直線的交點,即可獲得 前景圖像的頂點坐標以及前景圖像的尺度信息。然后,再分別以寬度和高度的最大值作為 前景圖像矯正后的寬度值和高度值。
[0064] 其次,介紹利用透視變換方法對所述前景圖像進行傾斜校正,以獲取正投影的所 述前景圖像的步驟。
[0065] 確定前景圖像的大小之后,對前景圖像進行傾斜校正。本發明中,將前景圖像映射 到拍攝物體平面上,相當于將攝像機垂直于醫學報告單,從而得到理想的圖像形狀,并且不 丟失前景圖像包含的信息。
[0066] 實際應用中,本領域技術人員為實現對傾斜圖像的校正,也可以采用其他預處理 方法解決上述技術問題,實現基本效果,本發明不作限定。
[0067] 最后,介紹利用局部閾值法將所述前景圖像分成若干區域,對每個所述區域進行 二值化。
[0068] 由于前景圖像包括256個亮度等級,為減少計算的復雜度,提高特殊符號的識別 效率。本發明對該前景圖像進行二值化處理。
[0069] 在圖像二值化處理時,本發明采用局部閾值法。將該前景圖像分成若干個區域,對 每個區域設置一個閾值進行二值化,從而得到二值化的前景圖像,可以在二值化前景圖像 中更好的區分目標和背景。
[0070] 對圖2進行預處理后,可得到校正后的前景圖像,參見圖3。
[0071] 本發明利用攝像機拍攝的醫學化驗單圖像為例,識別其中出現的箭頭,并獲得其 位置信息,以更加準確和快速確定病人的異常指標項。
[0072] 1)構造豎線的模板,定位前景圖像中所有可分離的豎線。根據豎線的特征,即豎線 的上面、下面、左面和右面的預設范圍內的像素值為0,構造豎線模板。
[0073] 按照構造好的豎線模板,在前景圖像的水平和垂直方向上采用不同的步長進行遍 歷,定位出前景圖像中的所有的可分離的豎線。例如,本發明實施例中,初始化豎線模板的 高度和寬度分別為40、3,窗口的水平方向移動步長為4、垂直方向移動步長為2,滑動窗口 的大小為豎線模板的寬度、高度再分別加上水平和垂