一種圖片中相關文本的自動框選方法
【技術領域】
[0001]本發明涉及智能教育移動終端和在線教育軟件的圖像處理領域,涉及基于圖像文本處理對圖像中相關文本的自動框選方法。
【背景技術】
[0002]隨著以教育學生學習為主的學習機或者學習類軟件的普及,學生通過學習機或者學習類軟件獲取學習資源越來越方便,所得到的學習資源范圍也更加廣。目前市面上一些學習類軟件通過學習使用手機拍攝對題目拍攝照片,由于課本上的內容分布較為密集,無法單獨將要上傳內容拍攝下來。其它無關內容的上傳會影響最終的反饋結果,因此,需要將照片中所要上傳內容進行手動框選,手動選擇框選的位置和大小,該過程相對而言較為煩瑣,影響學生的學習效率。
【發明內容】
[0003]鑒于現有技術的不足,本發明的目的在于提供一種圖片中相關文本的自動框選方法,將拍攝的照片進行自動框選,簡化使用者的操作,提高相關教育產品的智能化。
[0004]本發明的具體技術方案如下。
[0005]一種圖片中相關文本的自動框選方法,包括如下步驟:
對拍攝的圖片進行文本預處理,將文本與背景分離,對提取的文本分別進行橫向切割和縱向切割,利用橫向切割和縱向切割結果作為滑動候選框的選取依據,并且得到框外對比區域的寬度,分別計算每個候選框內外的邊緣分布密度,根據候選框內外的邊緣分布密度特點得到每個候選區域的置信值,實現對未知文本的自動相關內容框選。
[0006]進一步地,所述利用提取的文本的橫向切割和縱向切割結果作為滑動候選框的選取依據,具體包括:
A、通過文本的縱向切割得到所有候選框的橫向邊界,以及文本的字寬;
B、通過文本的橫向切割得到文本的字長,將文本的字長作為候選框的擴張滑動步長,滑動候選框將圖像自中心向外擴張式分割成所有可能的候選區域;
C、根據文本的字長得到候選框框外寬度,框外寬度等于文本的字長;
D、根據文本的字寬和字長得到統計邊緣密度的單位區域大小。
[0007]進一步地,所述分別計算每個候選框內外的邊緣分布密度,具體包括:
A、提取候選框內外的邊緣特征,得到二值化的邊緣圖像;
B、以統計邊緣密度的單位區域為塊,分別以半個字寬和字長作為塊的重疊區域;
C、對塊內像素值進行統計,得到每個塊邊緣概率密度;
D、以所有重疊區域對應塊的邊緣概率密度的平均值作為像素點的邊緣概率密度;
E、將邊緣概率密度圖分割成候選框內及候選框外區域。
[0008]進一步地,所述根據候選框內外的邊緣分布密度特點得到每個候選區域的置信值,實現對未知文本的自動相關內容框選,具體包括: A、分別統計滑動候選框框內及對應框外像素的平均邊緣概率密度;
B、將框內平均邊緣概率密度比框外平均邊緣概率密度的值作為該候選框的置信值,并記錄下來;
C、輪詢完所有候選框后,選出所有置信值中的最大值,所對應的候選框作為未知文本的相關內容框選區域。
[0009]進一步地,對候選框初取狀態及后面變化步長的選取,具體包括:
A、由文本的縱向切割得到所有候選框的固定橫向邊界;
B、以圖像中心作為候選框中心,以單字長為框長,作為候選框的初始狀態;
C、以單字長作為候選框長的變化步長。
[0010]進一步地,將拍攝的圖片進行相關文本的自動框選,用于教育移動終端或者教學類軟件中的拍照上傳課本內容或者拍照搜索答案的功能當中。
[0011]與現有技術相比,本發明具有如下優點和技術效果:本發明能用于在相關教育類產品或者學習類軟件中,在拍攝照片到上傳圖像文本過程中實現圖片中相關文本的自動框選。對拍攝的圖片進行文本預處理,將文本與背景分離,對提取的文本分別進行橫向切割和縱向切割,作為滑動候選框的選取依據,并且得到框外對比區域的寬度,分別計算每個候選框內外的邊緣分布密度,根據兩者的邊緣分布密度特點得到每個候選區域的置信值,實現對未知文本的自動相關內容框選。本發明能將拍攝的照片進行相關文本自動框選,,使用者拍攝完照片后無需手動調整待上傳框,該方法智能完成未知文本的框選,簡化使用者的操作,提尚相關教育廣品的智能化。
【附圖說明】
[0012]圖1為實例中框內外區域示意圖。
【具體實施方式】
[0013]以下結合附圖對本發明的具體實施方法作進一步詳細說明,但本發明的實施和保護不限于此。
[0014]一種圖片中相關文本的自動框選方法,具體步驟包括:對拍攝的圖片進行文本預處理,將文本與背景分離,對提取的文本分別進行橫向切割和縱向切割,作為滑動候選框的選取依據,并且得到框外對比區域的寬度,框內及框外區域如圖1所示。分別計算每個候選框內外的邊緣分布密度,根據兩者的邊緣分布密度特點得到每個候選區域的置信值,實現對未知文本的自動相關內容框選。
[0015]首先根據文字的顏色特點,對文本進行二值化處理,將文字與背景區分開,可采用目前經典的算法全局化的動態二值化方法(OTSU)進行處理,提取二值化文本。
[0016]利用提取的文本的橫向切割和縱向切割結果作為滑動候選框的選取依據,具體包括:
A、先通過文本的縱向切割得到所有候選框的橫向邊界,以及文本的字寬m;
B、先通過文本的橫向切割得到文本的字長n,將文本的字長η作為候選框的擴張滑動步長step=n,滑動候選框將圖像自中心向外擴張式分割成所有可能的候選區域;
C、根據文本的字長得到候選框框外寬度,框外寬度等于文本的字長; D、根據文本的字寬和字長得到統計邊緣密度的單位區域大小。
[0017]對候選框初取狀態及其后面變化的選取方法,具體包括:
A、由文本的縱向切割得到所有