專利名稱:一種基于相機和文字識別技術的文字摘抄方法
技術領域:
本發明涉及一種基于相機和文字識別技術的文字摘抄方法,確切 說,涉及一種用相機拍攝的文本圖像進行文字摘抄的方法,屬于用相 機結合文字識別技術進行文字輸入的技術領域。
背景技術:
近年來,隨著相機在智能手機和微機上的應用越來越多,基于用 相機拍攝的文本圖像結合文字識別技術進行文字輸入的應用也越來 越廣泛,如基于相機的名片識別技術,文本圖像分析和識別技術等。 重要的應用之一就是文字摘抄用戶在報刊雜志或其他地方看到一段 文字,或者其中的幾句話,很感興趣,想要摘抄下來,保存起來供日 后或與朋友共享,他/她就可以用相機拍下這些文字,然后用文字識 別技術從相機拍攝的文本圖像中識別并整理出感興趣的那些文字來。目前這樣的利用相機進行文字摘抄的軟件已經有了 ,如廈新N800手機內的"漢王摘抄"軟件就有這樣的功能。用戶利用這個軟件可以選擇讓軟件自動分析相機拍攝的文本圖像,并識別出其中的文 字,也可以選擇讓軟件自動分析用戶以拉框或其他方式選定的某個特 定的文字段或文字行的文本圖像,并識別出其中的文字。利用現有軟件,用戶可以得到整段文本圖像的識別文字; 一整 行文本圖像的識別文字;和用紅色矩形框選中的區域內的文本圖像的 識別文字。如用戶要得到紅線劃出的一句跨行的話的文本圖像的識別 文字,他/她只好先利用軟件得到識別出含這句話的兩行文字的文本 圖像的識別文字,再利用另外的文本編輯工具去做截頭去尾的操作, 最后才能得到這句話中的文字。在現實生活中,人們習慣于用以下兩種方式來選定感興趣的文字方式之一是在書報雜志等紙質媒體上,用筆在感興趣的文句處劃一條線,這條線可以是直的,彎的,甚至是波紋的,可以劃在字上, 也可以劃在字的下方。方式之二是使用microsoft word 等編輯工具或用internet explore 等瀏覽工具閱讀電子文檔時,用戶可以用鼠標操作來方便的選中感興 趣的文句。如用戶要選擇跨行的一句或幾句文句,只需要按住鼠標的 左鍵把鼠標從選中文句的起始位置移動到選中文句的終止位置就可 以了 ,選擇與鼠標移動的路徑無關,鼠標也不必掃過所有選中的文句, 編輯工具或瀏覽工具會自動找出起始位置和終止位置之間的文字來。
背景技術:
的缺點是用戶不能用習慣的選定方式在文本圖像上選 定感興趣的文字區域,從而完成文本摘抄。發明內容本發明的目的是推出一種基于相機和文字識別技術的文字摘抄 方法。該法的優點是用戶能用習慣的選定方式在的文本圖像上選定感 興趣的文字,從而完成文本摘抄。為了實現上述目的,本發明采用以下技術方案。在已有的具有文 本圖像的分析和文字識別功能的智能設備的存儲器內存放有控制和指揮CPU執行以下操作的程序在所述的智能設備的顯示器顯示文本圖像的界面上確認用戶用習慣的選定方式選定的感興趣的文字的 區域,分析和文字識別選定區域內的文字圖像,命令顯示器顯示識別 結果,保存識別結果,完成文本摘抄。現結合附圖詳細說明本發明的技術方案。一種基于相機和文字識別技術的文字摘抄方法,需在具有文本圖 像的分析和文字識別功能的智能設備中施行,用戶根據顯示在顯示器 上的文字選擇感興趣的文字,其特征在于,所述的文字是文本圖像,所述的智能設備內還存放有控制和指揮CPU執行以下操作的程序, 所述的操作為在所述的智能設備的顯示器顯示文本圖像的界面上確 認用戶用習慣的選定方式選定的感興趣的文字的區域,具體操作步 驟第一步所述的智能設備的顯示器顯示文本圖像,開始執行文本 摘抄的操作過程,用戶選擇習慣的選定感興趣的文字的區域的方式;第二步選擇是否以劃線方式在文本圖像上選定感興趣的文字 的區域?如是,進入第四步,如否,進入第三步;第三步以指定起始位置和終止位置的方式在文本圖像中選定感 興趣的文字的區域;第四步CPU分析并識別用戶指定的文字圖像;第五步CPU命令顯示器顯示識別結果;第六步用戶檢查、糾正、編輯和保存識別結果;第七步結束完成文本摘抄。與背景技術相比,本發明有以下優點本發明模仿人們在書報雜志等紙質媒體上進行標記,以及瀏覽電 子文檔時選定感興趣的文字的習慣來對相機拍攝的文本圖像中的用 戶感興趣文字進行摘抄,既節省了用戶手工輸入的時間,又符合日常 的操作習慣,方便實用。
圖l是用戶以劃線方式在文本圖像中選定感興趣的文字的區域。圖2是用戶以從起始位置移動到終止位置的方式在文本圖像中選定感興趣的文字的區域。圖3是用戶以點擊起始位置和終止位置的方式在文本圖像中選 定感興趣的文字的區域。圖4是用戶以在起始位置和終止位置處各劃一個符號的方式在 文本圖像中選定感興趣的文字的區域。圖5是本發明的文本摘抄方法的操作流程圖。
具體實施方式
現結合實施例和附圖進一步說明本發明的技術方案。所有實施例 均按照上述的文本摘抄方法的操作步驟進行操作。每個實施例僅羅列關鍵的技術數據。 實施例1本實施例需在基于windows mobile5.0操作系統的觸摸屏手機 dopod 830中施行,該手機的CPU的工作頻率為200MHz,內存容量 為48M,相機分辨率為2M像素,顯示器是2.8英寸的320*240像素 的觸摸屏,帶有手寫筆,第二步中,選擇是,用戶用手寫筆在觸摸屏 上劃過文本圖像中感興趣的文字區域,CPU確認后,命令顯示器以反 色,高亮,或其他方式突出顯示起始位置和終止位置之間文字;接著 連續執行第四步 第七步。實施例2除以下不同外,其他與實施例1完全相同。第二步中,選擇否, 第三步中,用戶用手寫筆接觸在觸摸屏上從文本圖像中感興趣的文字 的區域的起始位置劃到終止位置。實施例3除以下不同外,其他與實施例l完全相同。第二步中,選擇否, 第三步中,用戶用手寫筆在觸摸屏上在文本圖像中點擊感興趣的文字 區域的起始位置,然后再點擊感興趣的文字區域的終止位置。實施例4除以下不同外,其他與實施例1完全相同。第二步中,選擇否, 第三步中,用戶用手寫筆在觸摸屏上或用鼠標在文本圖像中點擊感興 趣的文字區域的起始位置劃一個符號,然后再在感興趣的文字終止位 置劃一個符號。實施例5本實施例需在接有相機的微機中施行,該微機的CPU的工作頻 率為200MHz,內存容量為256M,相機分辨率為2M像素,帶有鼠標, 第二步中,選擇是,用戶用鼠標劃過文本圖像中感興趣的文字區域, CPU確認后,命令顯示器以反色,高亮,或其他方式突出顯示起始位 置和終止位置之間文字;接著連續執行第四步 第七步。實施例6除以下不同外,其他與實施例5完全相同。第二步中,選擇否, 第三步中,用戶用鼠標從文本圖像中感興趣的文字的區域的起始位置 劃到終止位置。實施例7除以下不同外,其他與實施例5完全相同。第二步中,選擇否,第三步中,用戶用鼠標在文本圖像中點擊感興趣的文字區域的起始位 置,然后再點擊感興趣的文字區域的終止位置。實施例8除以下不同外,其他與實施例5完全相同。第二步中,選擇否, 第三步中,用戶用鼠標在文本圖像中感興趣的文字區域的起始位置劃 一個符號,然后再在感興趣的文字終止位置劃一個符號。
權利要求
1. 一種基于相機和文字識別技術的文字摘抄方法,需在具有文本圖像的分析和文字識別功能的智能設備中施行,用戶根據顯示在顯示器上的文字選擇感興趣的文字,其特征在于,所述的文字是文本圖像,所述的智能設備內還存放有控制和指揮CPU執行以下操作的程序,所述的操作為在所述的智能設備的顯示器顯示文本圖像的界面上確認用戶用習慣的選定方式選定的感興趣的文字的區域,具體操作步驟第一步所述的智能設備的顯示器顯示文本圖像,開始執行文本摘抄的操作過程,用戶選擇習慣的選定感興趣的文字的區域的方式;第二步選擇是否以劃線方式在文本圖像上選定感興趣的文字的區域?如是,進入第四步,如否,進入第三步;第三步以指定起始位置和終止位置的方式在文本圖像中選定感興趣的文字的區域;第四步CPU分析并識別用戶指定的文字圖像;第五步CPU命令顯示器顯示識別結果;第六步用戶檢查、糾正、編輯和保存識別結果;第七步結束完成文本摘抄。
2、 根據權利要求1所述的基于相機和文字識別技術的文字摘抄方法,其特征在于,該方法需在基于windows mobile5.0操作系統的 觸摸屏手機dopod 830中施行,該手機的CPU的工作頻率為200MHz, 內存容量為48M,相機分辨率為2M像素,顯示器是2.8英寸的 320*240像素的觸摸屏,帶有手寫筆,第二步中,選擇是,用戶用手 寫筆在觸摸屏上劃過文本圖像中感興趣的文字區域,CPU確認后,命 令顯示器以反色,高亮,或其他方式突出顯示起始位置和終止位置之 間文字;接著連續執行第四步 第七步。
3、 根據權利要求1所述的基于相機和文字識別技術的文字摘抄 方法,其特征在于,該方法需在基于windows mobile5.0操作系統的 觸摸屏手機dopod 830中施行,該手機的CPU的工作頻率為200MHz, 內存容量為48M,相機分辨率為2M像素,顯示器是2.8英寸的320*240像素的觸摸屏,帶有手寫筆,第二步中,選擇否,第三步中, 用戶用手寫筆接觸在觸摸屏上從文本圖像中感興趣的文字的區域的 起始位置劃到終止位置,CPU確認后,命令顯示器以反色,高亮,或 其他方式突出顯示起始位置和終止位置之間文字;接著連續執行第四 步 第七步。
4、 根據權利要求1所述的基于相機和文字識別技術的文字摘抄 方法,其特征在于,該方法需在基于windows mobile5.0操作系統的 觸摸屏手機dopod 830中施行,該手機的CPU的工作頻率為200MHz, 內存容量為48M,相機分辨率為2M像素,顯示器是2.8英寸的 320*240像素的觸摸屏,帶有手寫筆,第二步中,選擇否,第三步中, 用戶用手寫筆在觸摸屏上在文本圖像中點擊感興趣的文字區域的起 始位置,然后再點擊感興趣的文字區域的終止位置,CPU確認后,命 令顯示器以反色,高亮,或其他方式突出顯示起始位置和終止位置之 間文字;接著連續執行第四步 第七步。
5、 根據權利要求1所述的基于相機和文字識別技術的文字摘抄 方法,其特征在于,該方法需在基于windows mobile5.0操作系統的 觸摸屏手機dopod 830中施行,該手機的CPU的工作頻率為200MHz, 內存容量為48M,相機分辨率為2M像素,顯示器是2.8英寸的 320*240像素的觸摸屏,帶有手寫筆,第二步中,選擇否,第三步中, 用戶用手寫筆在觸摸屏上或用鼠標在文本圖像中點擊感興趣的文字 區域的起始位置劃一個符號,然后再在感興趣的文字終止位置劃一個 符號,CPU確認后,命令顯示器以反色,高亮,或其他方式突出顯示 起始位置和終止位置之間文字;接著連續執行第四步 第七步。
6、 根據權利要求1所述的基于相機和文字識別技術的文字摘抄 方法,其特征在于,該方法需在接有相機的微機中施行,該微機的 CPU的工作頻率為200MHz,內存容量為256M,相機分辨率為2M 像素,帶有鼠標,第二步中,選擇是,用戶用鼠標劃過文本圖像中感 興趣的文字區域,CPU確認后,命令顯示器以反色,高亮,或其他方 式突出顯示起始位置和終止位置之間文字;接著連續執行第四步 第七步。
7、 根據權利要求1所屬的基于相機和文字識別技術的文字摘抄 方法,其特征在于,該方法需在接有相機的微機中施行,該微機的 CPU的工作頻率為200MHz,內存容量為256M,相機分辨率為2M 像素,帶有鼠標,第二步中,選擇否,第三步中,用戶用鼠標從文本 圖像中感興趣的文字的區域的起始位置劃到終止位置,CPU確認后, 命令顯示器以反色,高亮,或其他方式突出顯示起始位置和終止位置 之間文字;接著連續執行第四步 第七步。
8、 根據權利要求1所述的基于相機和文字識別技術的文字摘抄 方法,其特征在于,該方法需在接有相機的微機中施行,該微機的 CPU的工作頻率為200MHz,內存容量為256M,相機分辨率為2M 像素,帶有鼠標,第二步中,選擇否,第三步中,用戶用鼠標在文本 圖像中點擊感興趣的文字區域的起始位置,然后再點擊感興趣的文字 區域的終止位置,CPU確認后,命令顯示器以反色,高亮,或其他方 式突出顯示起始位置和終止位置之間文字;接著連續執行第四步 第 七步。
9、 根據權利要求1所述的基于相機和文字識別技術的文字摘抄 方法,其特征在于,該方法需在接有相機的微機中施行,該微機的 CPU的工作頻率為200MHz,內存容量為256M,相機分辨率為2M 像素,帶有鼠標,第二步中,選擇否,第三步中,用戶用鼠標在文本 圖像中感興趣的文字區域的起始位置劃一個符號,然后再在感興趣的 文字終止位置劃一個符號,CPU確認后,命令顯示器以反色,高亮, 或其他方式突出顯示起始位置和終止位置之間文字;接著連續執行第 四步 第七步。
全文摘要
一種基于相機和文字識別技術的文字摘抄方法,確切說,涉及一種用相機拍攝的文本圖像進行文字摘抄的方法,屬于用相機結合文字識別技術進行文字輸入的技術領域。在已有的具有文本圖像的分析和文字識別功能的智能設備的存儲器內存放有控制和指揮CPU執行以下操作的程序在所述的智能設備的顯示器顯示文本圖像的界面上確認用戶用習慣的選定方式選定的感興趣的文字的區域,分析和文字識別選定區域內的文字圖像,命令顯示器顯示識別結果,保存識別結果,完成文本摘抄。有用戶能用習慣的選定方式在文本圖像上選定感興趣的文字,從而完成文本摘抄的優點。
文檔編號G06K9/00GK101281592SQ20081003722
公開日2008年10月8日 申請日期2008年5月9日 優先權日2008年5月9日
發明者颯 陳 申請人:上海合合信息科技發展有限公司