專利名稱:文本一致性編輯方法
技術領域:
本發明涉及文本編輯技術領域,尤其涉及一種能夠協助用戶編輯文本,使得文本 中使用的專有詞前后一致的文本一致性編輯方法。
背景技術:
用戶通過鍵盤操作輸入字符編輯文本逐漸普及。無論是工作中還是生活中,隨著 互聯網及計算機技術的發展,用戶通過鍵盤操作進行電子郵件的撰寫、專利的撰寫、會議內 容記錄及博文的發布等已經變得很普遍。現有研究多圍繞對文字的編碼進行改進,通過縮 短編碼長度,降低重碼,進而提高鍵盤操作進行文本編輯的效率。同時,一些傳統技術是基 于由用戶輸入的字符序列提出預期字符序列,從增強文本輸入操作效率并簡化其操作。一 些智能拼音輸入法則通過記錄縮寫及縮寫對應的詞組或句子來實現個人輸入定制。通過為 拼音輸入法提供智能組句功能,降低用戶選詞時間,提升選詞的準確率。同時,谷歌拼音輸 入法通過根據用戶上傳到服務器端的個人字典,構造個性化語言模型。不同用戶的輸入內 容在語言風格上,可能又較大的差異,借助于個性化的語言模型,谷歌拼音輸入法對于用戶 輸入的字和詞,特別是詞組和語句的匹配會更加符合用戶的行文風格及聊天習慣,提高文 本編輯的效率。而目前針對進行單個文本編輯時經常出現的前后引用或定義的專有詞不一致問 題沒有被重視,但這個問題卻經常困擾諸如專利撰寫者及論文撰寫者。一致性的文本編輯可以提高用戶編輯效率。智能輸入法能夠根據用戶習慣來進行 候選列表的搭建,但是這并能夠解決上文提到的不一致性問題。因此,目前急需一種能夠支持文本一致性編輯的方法。
發明內容
本發明的目的是通過定制、保存及查找匹配用戶自定制專有詞的系統方法,來支 持用戶的一致性文本編輯,提高文本編輯過程中前后引用或輸入的自定義的字符串的一致 性,為此提供一種文本一致性編輯方法。為了實現所述的目的,本發明提出的一種文本一致性編輯方法,是利用專有詞詞 庫加載模塊、專有詞定制模塊、專有詞保存模塊、候選專有詞列表構建模塊及候選專有詞顯 示模塊實現文本一致性編輯的步驟如下步驟Sl 對文本進行編輯時,專有詞詞庫加載模塊通過專有詞詞庫中的文件標識 來定位專有詞詞庫,并在用戶打開當前文本進行編輯時,將所定位的專有詞詞庫分別加載 到用戶當前使用的輸入法的詞碼表中及內存中,支持對專有詞詞庫的進一步查詢和更新操 作;步驟S2 在用戶選定一個在當前編輯的文本中輸入的字符串作為待定制的專有 詞后,用戶利用專有詞定制模塊判斷內存中的專有詞詞庫中是否已存在與當前待定制的專 有詞相似或是相同的專有詞,如果已存在與當前待定制的專有詞相似或是相同的專有詞,則提示用戶當前選定的作為待定制的專有詞已被定制,執行步驟S4;如果不存在與當前待 定制的專有詞相似或是相同的專有詞,則執行步驟S3 ;步驟S3 專有詞保存模塊將被定制的專有詞保存在內存中的專有詞詞庫及用戶 當前使用的輸入法的詞碼表中;步驟S4:當用戶選定當前編輯的文本中的某一字符串時,候選專有詞列表構建模 塊根據當前輸入字符串在內存中的專有詞詞庫中查找候選專有詞,生成候選專有詞列表;步驟S5 候選專有詞顯示模塊根據候選專有詞與當前用戶輸入字符串的相似度 對候選專有詞進行排序,列出候選專有詞列表,協助用戶決定當前編輯的字符串是否為已 定制的專有詞,從而維持用戶前后輸入的專有詞的一致性。優選實施例步驟Sl所述專有詞詞庫用來存放用戶在編輯所述專有詞詞庫所屬 的文本文件過程中定制的所有專有詞,專有詞詞庫的記錄擁有文本文件標識、編碼、拼音和 漢語詞組字段;根據文本文件標識定位專有詞詞庫所屬的文本文件。優選實施例步驟Sl所述專有詞詞庫加載模塊在保存當前編輯的文本或關閉文 本編輯器后,自動將內存中的當前最新版本的專有詞詞庫以文件形式保存在與所屬的文本 本件相同的路徑下,并覆蓋原有文件,保存專有詞詞庫的文件的默認屬性為隱藏只讀。優選實施例步驟S2所述專有詞定制模塊是以插件形式運行在文本編輯器上,用 戶主動選擇是否定制所輸入的新字符串。優選實施例步驟S4所述候選專有詞列表的構建是由候選專有詞列表構建模塊 根據當前編輯的文字的完整性采用無編碼候選列表生成算法實現;候選專有詞列表構建模 塊根據用戶主動選定的字符串在專有詞詞庫中選出與用戶主動選定的字符串相近的候選 專有詞。優選實施例步驟S4所述候選專有詞列表構建模塊根據當前編輯的字符串在專 有詞詞庫中查找候選專有詞的方法是動態規劃方法或相似度查找算法。當用戶打開當前 文本進行編輯時,候選專有詞列表構建模塊通過為專有詞詞庫中的專有詞分配最高的相似 度、權重或評分,使用戶當前使用的輸入法中已經定制的專有詞被優先列出。優選實施例步驟S5所述協助用戶決定當前編輯的字符串是否為已定制的專有 詞是通過在用戶主動選定某一字符串后,列出候選專有詞列表來實現;候選專有詞列表顯 示在當前編輯的文本旁;用戶根據顯示的候選專有詞列表確定當前編輯字符串所表達的含 義是否已經定義及存在于專有詞詞庫中。優選實施例在用戶進行文本拷貝操作時,步驟Sl所述的專有詞詞庫加載模塊將 提示用戶是否將與所屬的文本本件在相同的路徑下的保存專有詞詞庫的文件同時進行拷 貝,保證被拷貝到其他位置的文本在再次打開時可以成功定位到屬于所打開的文本的保存 專有詞詞庫的文件。本發明的有益效果文本一致性編輯方法是一種與文本編輯器及文本輸入法無關 的方法。文本一致性編輯方法的具體實施難點涉及專有詞詞庫加載的實施,候選專有詞列 表構建的實施。專有詞詞庫加載的實施利用專有詞詞庫加載模塊加載專有詞詞庫包含將專有詞 詞庫加載到內存中及將專有詞詞庫中的內容加載到用戶當前使用的輸入法的詞碼表中。將 專有詞詞庫存儲在內存中可以提高對專有詞詞庫的查找及更新速度。
候選專有詞列表構建的實施首先,候選專有詞列表構建模塊根據當前編輯的字 符串在專有詞詞庫中查找候選專有詞的查找可以是動態規劃方法等相似度查找算法等。候 選專有詞列表構建方法根據當前編輯的文字的完整性可以也可采用無編碼候選列表生成 算法等。1)協助文本編輯者進行一致性文本編輯,提高文本編輯過程中前后引用或輸入的 自定義的新詞或新字符串的一致性;2)所述的文本一致性編輯方法適合工作于任何文本編輯器上,例如Microsoft Off ice、金山WPS Office、UltraEdit等。適用于專利撰寫、論文撰寫等各類文檔的撰寫,在 需要定義新詞或新字符串的文本編輯過程中,幫助用戶進行一致性文本編輯,進而提高工 作效率及工作質量。
圖1為本發明提供的文本一致性編輯方法流程圖。圖2為圖1文本一致性編輯方法提供的文本一致性編輯系統示意圖。
具體實施例方式為使本發明的目的、技術方案和優點更加清楚明白,以下結合具體實施例,并參照 附圖,對本發明進一步詳細說明。圖2示出的文本一致性編輯系統示意圖,所述系統利用計算機實現專有詞詞庫加 載模塊101、專有詞定制模塊103、專有詞保存模塊104、候選專有詞列表構建模塊107及候 選專有詞顯示模塊108。利用圖2示出的文本一致性編輯系統實現圖1示出的文本一致性編輯方法,所述 文本一致性編輯的一種實施方式的步驟如下步驟Sl 對文本進行編輯時,專有詞詞庫加載模塊101通過專有詞詞庫中的文件 標識來定位專有詞詞庫,并在用戶打開當前文本進行編輯時,將所定位的專有詞詞庫分別 加載到用戶當前使用的輸入法的詞碼表中及內存中,支持對專有詞詞庫的進一步查詢和更 新操作。當用戶利用文本編輯器102進行文本編輯時,首先將打開文本文件,與此同時專 有詞詞庫加載模塊101將加載與當前打開的文本文件相關聯的專有詞詞庫105分別到內存 及輸入法的詞表。所述專有詞詞庫加載模塊101在保存當前編輯的文本或關閉文本編輯器 102后,自動將內存中的最新版本的專有詞詞庫105以文件形式保存在與所屬的文本本件 相同的路徑下,并覆蓋原有文件,保存專有詞詞庫105的文件的默認屬性為隱藏只讀。所述 專有詞詞庫105用來存放用戶在編輯所述專有詞詞庫105所屬的文本文件過程中定制的所 有專有詞,專有詞詞庫105的記錄擁有文本文件標識、編碼、拼音和漢語詞組字段。其中,專 有詞詞庫加載模塊101通過專有詞詞庫105中的文本文件標識來定位屬于當前編輯的文本 的專有詞詞庫105,然后,將所定位的專有詞詞庫105分別加載到用戶當前使用的輸入法的 詞碼表中及內存中。當用戶決定保存當前編輯的文本或關閉文本編輯器102時,專有詞詞庫加載模塊 101在保存當前編輯的文本或關閉文本編輯器102后,自動將內存中的當前最新版本的專有詞詞庫105以文件形式保存在與所屬的文本本件相同的路徑下,并覆蓋原有文件,保存 專有詞詞庫105的文件的默認屬性為隱藏只讀。專有詞詞庫加載模塊101在用戶進行文本 拷貝操作時,將提示用戶是否將與所屬的文本本件在相同的路徑下的保存專有詞詞庫105 的文件同時進行拷貝,保證被拷貝到其他位置的文本在再次打開時可以成功定位到屬于所 打開的文本的保存專有詞詞庫105的文件。步驟S2 在用戶選定一個在當前編輯的文本中輸入的字符串作為待定制的專有 詞后,用戶利用專有詞定制模塊判斷內存中的專有詞詞庫中是否已存在與當前待定制的專 有詞相似或是相同的專有詞,如果已存在與當前待定制的專有詞相似或是相同的專有詞, 則提示用戶當前選定的的作為待定制的專有詞已被定制,執行步驟S4;如果不存在與當前 待定制的專有詞相似或是相同的專有詞,則執行步驟S3。當用戶自定義了一個新詞或新的 字符串,用戶通過選定第一次輸入的新詞或新的字符串,利用專有詞定制模塊103進行專 有詞的定制。專有詞定制模塊103是以插件形式運行在文本編輯器102上,用戶主動選擇是 否定制所輸入的新字符串。當用戶選定的作為待定制的專有詞經過專有詞定制模塊103判 斷為非第一次輸入的新詞或新的字符串,則當前選定的待定制的專有詞將被拒絕定制。專 有詞定制模塊103判斷用戶選定的待定制的專有詞是否為第一次輸入的新詞或新的字符 串的方法是通過將待定制專有詞與內存中的專有詞詞庫105進行語義相似度匹配,判斷內 存中的專有詞詞庫105是否已存在與當前待定制的專有詞相似或是相同的專有詞。利用專 有詞定制模塊103進行專有詞的定制的具體實施方式
可以是通過添加定制操作在右鍵列 表中;或是通過在編輯器中添加一個定制按鈕,從而實現專有詞的定制。步驟S3 專有詞保存模塊104將可以被定制的專有詞保存在內存中的專有詞詞庫 105及用戶當前使用的輸入法的詞碼表中;通過存儲現有輸入法詞碼表中的記錄所要求的 字段及字段數據格式,將專有詞詞庫105中的文本文件標識、編碼、拼音和漢語詞組字段轉 換為當前使用的輸入法的詞碼表的字段。步驟S4 當用戶選定當前編輯的文本中的某一字符串時,候選專有詞列表構建模 塊107根據當前輸入字符串在內存中的專有詞詞庫105中查找候選專有詞,生成候選專有 詞列表106。用戶根據顯示的候選專有詞列表106確定當前編輯字符串所表達的含義是否 已經定義及存在于專有詞詞庫105中。候選專有詞列表構建模塊107通過使用動態規劃方 法或相似度查找算法根據當前編輯的字符串在專有詞詞庫105中查找候選專有詞。候選專 有詞列表106的構建是由候選專有詞列表構建模塊根據當前編輯的文字的完整性采用無 編碼候選列表生成算法實現。當用戶對文本進行編輯時,通過分配給專有詞最高的相似度、 權重或評分,使所使用的輸入法列出的候選專有詞列表106中專有詞優先列出。步驟S5 候選專有詞顯示模塊108根據候選專有詞與當前用戶輸入字符串的相似 度對候選專有詞進行排序。候選專有詞列表106顯示在當前編輯的文本旁。候選專有詞列 表106是候選專有詞列表構建模塊107根據用戶主動選定的字符串在專有詞詞庫105中選 出與用戶主動選定的字符串相近候選專有詞,協助用戶決定當前編輯的字符串是否為已定 制的專有詞,從而維持用戶前后輸入的專有詞的一致性。保存專有詞詞庫105的文件將在 下次用戶打開響應的文檔進行編輯時被打開,同時所述文件中保存的專有詞詞庫105中的 內容將被加載。最終,通過在用戶主動選定某一字符串后,列出候選專有詞列表,輔助用戶 在進行文本編輯的過程中,決定當前編輯的字符串所表達的含義是否與已定制的專有詞所表達的含義相同,從而保證用戶編輯的文本中新定義的字符串的表述一致性。所述的文本一致性編輯方法適用于專利撰寫、論文撰寫等需要定義新詞或新的字 符串的文本編輯過程中。上面描述是用于實現本發明及其實施例,本發明的范圍不應由該描述來限定,本 領域的技術人員應該理解,在不脫離本發明的范圍的任何修改或局部替換,均屬于本發明 權利要求來限定的范圍。
權利要求
1.一種文本一致性編輯方法,其特征在于利用專有詞詞庫加載模塊、專有詞定制模 塊、專有詞保存模塊、候選專有詞列表構建模塊及候選專有詞顯示模塊實現文本一致性編 輯的步驟如下步驟Sl 對文本進行編輯時,專有詞詞庫加載模塊通過專有詞詞庫中的文件標識來定 位專有詞詞庫,并在用戶打開當前文本進行編輯時,將所定位的專有詞詞庫分別加載到用 戶當前使用的輸入法的詞碼表中及內存中,支持對專有詞詞庫的進一步查詢和更新操作;步驟S2 在用戶選定一個在當前編輯的文本中輸入的字符串作為待定制的專有詞后, 用戶利用專有詞定制模塊判斷內存中的專有詞詞庫中是否已存在與當前待定制的專有詞 相似或是相同的專有詞,如果已存在與當前待定制的專有詞相似或是相同的專有詞,則提 示用戶當前選定的作為待定制的專有詞已被定制,執行步驟S4;如果不存在與當前待定制 的專有詞相似或是相同的專有詞,則執行步驟S3 ;步驟S3:專有詞保存模塊將被定制的專有詞保存在內存中的專有詞詞庫及用戶當前 使用的輸入法的詞碼表中;步驟S4:當用戶選定當前編輯的文本中的某一字符串時,候選專有詞列表構建模塊根 據當前輸入字符串在內存中的專有詞詞庫中查找候選專有詞,生成候選專有詞列表;步驟S5 候選專有詞顯示模塊根據候選專有詞與當前用戶輸入字符串的相似度對候 選專有詞進行排序,列出候選專有詞列表,協助用戶決定當前編輯的字符串是否為已定制 的專有詞,從而維持用戶前后輸入的專有詞的一致性。
2.根據權利要求1所述的文本一致性編輯方法,其特征在于步驟Sl所述專有詞詞庫 用來存放用戶在編輯所述專有詞詞庫所屬的文本文件過程中定制的所有專有詞,專有詞詞 庫的記錄擁有文本文件標識、編碼、拼音和漢語詞組字段;根據文本文件標識定位專有詞詞 庫所屬的文本文件。
3.根據權利要求1所述的文本一致性編輯方法,其特征在于步驟Sl所述專有詞詞庫 加載模塊在保存當前編輯的文本或關閉文本編輯器后,自動將內存中的當前最新版本的專 有詞詞庫以文件形式保存在與所屬的文本本件相同的路徑下,并覆蓋原有文件,保存專有 詞詞庫的文件的默認屬性為隱藏只讀。
4.根據權利要求1所述的文本一致性編輯方法,其特征在于步驟S2所述專有詞定制 模塊是以插件形式運行在文本編輯器上,用戶主動選擇是否定制所輸入的新字符串。
5.根據專利要求1所述的文本一致性編輯方法,其特征在于步驟S4所述候選專有詞 列表的構建是由候選專有詞列表構建模塊根據當前編輯的文字的完整性采用無編碼候選 列表生成算法實現;候選專有詞列表構建模塊根據用戶主動選定的字符串在專有詞詞庫中 選出與用戶主動選定的字符串相近的候選專有詞。
6.根據專利要求1所述的文本一致性編輯方法,其特征在于步驟S4所述候選專有詞 列表構建模塊根據當前編輯的字符串在專有詞詞庫中查找候選專有詞的方法是動態規劃 方法或相似度查找算法;當用戶打開當前文本進行編輯時,候選專有詞列表構建模塊通過 為專有詞詞庫中的專有詞分配最高的相似度、權重或評分,使用戶當前使用的輸入法中已 經定制的專有詞被優先列出。
7.根據專利要求1所述的文本一致性編輯方法,其特征在于步驟S5所述協助用戶決 定當前編輯的字符串是否為已定制的專有詞是通過在用戶主動選定某一字符串后,列出候選專有詞列表來實現;候選專有詞列表顯示在當前編輯的文本旁;用戶根據顯示的候選專 有詞列表確定當前編輯字符串所表達的含義是否已經定義及存在于專有詞詞庫中。
8.根據專利要求1所述的文本一致性編輯方法,其特征在于在用戶進行文本拷貝操 作時,步驟Sl所述的專有詞詞庫加載模塊將提示用戶是否將與所屬的文本本件在相同的 路徑下的保存專有詞詞庫的文件同時進行拷貝,保證被拷貝到其他位置的文本在再次打開 時可以成功定位到屬于所打開的文本的保存專有詞詞庫的文件。
全文摘要
本發明公開了一種文本一致性編輯方法,文本一致性編輯方法包含專有詞詞庫加載模塊、專有詞定制模塊、專有詞保存模塊、候選專有詞列表構建模塊及候選專有詞顯示模塊。當用戶開始進行文本編輯時,專有詞詞庫加載模塊將負責加載專有詞詞庫。用戶利用專有詞定制模塊在編輯文本時定制專有詞。利用專有詞保存模塊保存用戶定制的專有詞。候選專有詞列表構建模塊根據當前輸入的字符串在專有詞詞庫中查找并構建候選專有詞列表。候選專有詞顯示模塊列出候選專有詞列表,協助用戶決定當前編輯的字符串是否為已定制的專有詞。從而維持用戶前后輸入專有詞的一致性。
文檔編號G06F17/21GK102135953SQ20111007655
公開日2011年7月27日 申請日期2011年3月29日 優先權日2011年3月29日
發明者李娜, 譚杰 申請人:中國科學院自動化研究所