一種漢字注音方法及裝置制造方法
【專利摘要】本發明實施例公開一種漢字注音方法及裝置,其中方法包括如下步驟:當對所輸入的文本中的多音字段進行注音時,獲取所述多音字段的至少兩種讀音;對所述至少兩種讀音中每種讀音進行概率預測,并生成預測結果;根據預測結果確定所述多音字段的當前讀音。可以實現對多音字詞進行準確注音,提升閱讀文本的效率及效果。
【專利說明】一種漢字注音方法及裝置
【技術領域】
[0001] 本發明涉及計算機【技術領域】,尤其涉及一種漢字注音方法及裝置。
【背景技術】
[0002] 隨著漢字的廣泛運用,對于漢語學習者來說,在閱讀漢字文本的過程中經常遇到 一些字段不會讀,特別是對于一些多音字段,因此往往在閱讀中遇到障礙,盡管可以通過查 字典來獲得多音字段的讀音,但需要花費較長的時間,并且由于字典概括的范圍較大,用戶 難以把握多音字段的最準確的讀法,降低了閱讀文本的效率及效果,進而影響漢語學習的 效果。
【發明內容】
[0003] 本發明實施例提供一種漢字注音方法及裝置,可以實現對多音字詞進行準確注 音,提升閱讀文本的效率及效果。
[0004] 為了解決上述技術問題,本發明實施例第一方面提供了一種漢字注音方法,可包 括:
[0005] 當對所輸入的文本中的多音字段進行注音時,獲取所述多音字段的至少兩種讀 音;
[0006] 對所述至少兩種讀音中每種讀音進行概率預測,并生成預測結果;
[0007] 根據預測結果確定所述多音字段的當前讀音。
[0008] 本發明實施例第二方面提供了一種漢字注音裝置,可包括:
[0009] 讀音獲取模塊,用于當對所輸入文本中的多音字段進行注音時,獲取所述多音字 段的至少兩種讀音;
[0010] 預測模塊,用于對所述至少兩種讀音中每種讀音進行概率預測,并生成預測結 果;
[0011] 讀音確定模塊,用于根據預測結果確定所述多音字段的當前讀音。
[0012] 在本發明實施例中,當對所輸入的文本中的多音字段進行注音時,對多音字段的 至少兩種讀音中每種讀音進行概率預測,并根據預測結果確定多音字段的當前讀音,實現 了對多音字段的準確注音,提升閱讀文本的效率及效果,進而提升了漢語學習的效果。
【專利附圖】
【附圖說明】
[0013] 為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以 根據這些附圖獲得其他的附圖。
[0014] 圖1是本發明實施例提供的一種漢字注音方法的流程示意圖;
[0015] 圖2是本發明實施例提供的另一種漢字注音方法的流程示意圖;
[0016] 圖3是本發明實施例提供的一種漢字注音裝置的結構示意圖;
[0017] 圖4是本發明實施例提供的另一種漢字注音裝置的結構示意圖;
[0018] 圖5是本發明實施例提供的預測模塊的結構示意圖;
[0019] 圖6是本發明實施例提供的結果生成單元的結構示意圖;
[0020] 圖7是本發明實施例提供的又一種漢字注音裝置的結構示意圖。
【具體實施方式】
[0021] 下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于 本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他 實施例,都屬于本發明保護的范圍。
[0022] 本發明實施例提供的漢字注音方法可以應用于對閱讀文本中的多音字段進行注 音的場景,例如:當漢字注音裝置接收到輸入的文本,且當對所輸入的文本中的多音字段進 行注音時,所述漢字注音裝置獲取所述多音字段的至少兩種讀音,對所述至少兩種讀音中 每種讀音進行概率預測,并生成預測結果,所述漢字注音裝置根據預測結果確定所述多音 字段的當前讀音的場景等。通過對多音字段的至少兩種讀音中每種讀音進行概率預測,實 現了對多音字段的準確注音,提升閱讀文本的效率及效果。
[0023] 本發明實施例涉及的漢字注音裝置可以包括:計算機、平板電腦、智能手機、筆記 本電腦、掌上電腦以及移動互聯網設備(MID)等終端設備,所述文本可以為一篇文章、一段 文字內容、一個句子、一個詞語或一個漢字;所述多音字段可以為所述文本中的多音漢字或 多音詞語。
[0024] 下面將結合附圖1和附圖2,對本發明實施例提供的漢字注音方法進行詳細介紹。
[0025] 請參見圖1,為本發明實施例提供了一種漢字注音方法的流程示意圖。如圖1所 示,本發明實施例的所述方法包括以下步驟S101-步驟S103。
[0026] S101,當對所輸入的文本中的多音字段進行注音時,獲取所述多音字段的至少兩 種讀音;
[0027] 具體的,用戶可以將待注音的文本輸入至漢字注音裝置,輸入的方式可以通過復 制粘貼該文本,或者通過掃描設備掃描該文本等,所述漢字注音裝置獲取用戶所述文本,當 所述漢字注音裝置對所述文本中的多音字段進行注音時,所述漢字注音裝置獲取所述多音 字段的至少兩種讀音。
[0028] 需要說明的是,在對所輸入的文本中的多音字段進行注音之前,所述漢字注音裝 置需要對所述文本進行分詞處理,例如:假設所述文本為"可以帶你去長長見識",所述漢字 注音裝置優選的可以根據詞性對所述文本進行分詞處理,分詞處理后的所述文本為"可以/ 帶/你/去/長長/見識"。
[0029] 所述漢字注音裝置可以獲取分詞處理后所述文本中的字段和所述字段的讀音屬 性信息,所述讀音屬性信息包括讀音種數和默認讀音。可以理解的是,所述漢字注音裝置中 預先建立了包含所有字段讀音的字典以及常用詞語的詞典,對于只有一種讀音的漢字,直 接在字典中建立漢字與讀音的對應關系,將該讀音作為該漢字的默認讀音,而對于多音漢 字,則將使用頻率最高的讀音作為多音漢字的默認讀音;而詞典的設置與字典的設置相同, 對于只有一種讀音的詞語,在詞典中建立詞語與讀音的對應關系,將該讀音作為該詞語的 默認讀音,而對于多音詞語,則將使用頻率最高的讀音作為多音詞語的默認讀音,例如:多 音詞語"長長",其讀音有三種,分別是"chang2chang2、zhang3chang2、zhang3zhang3",其 中,拼音后的數字表示聲調(以下均統一采用此種格式),由于"chang2chang2"使用的頻率 最高,因此將"chang2chang2"作為"長長"的默認讀音;對于一些固定詞語,例如:"曝"有 兩種讀音,而在"一曝十寒"中的讀音是唯一的,并且"一曝十寒"屬于成語,可以被認為是 常用詞語,因此還可以建立常用詞語的詞典,并部分確定多音字在常用詞語中的讀音。
[0030] 因此,依據上述分詞處理后的所述文本"可以/帶/你/去/長長/見識"為例, 則獲取所述文本中所述字段的讀音屬性信息如下(字段/詞性/讀音種數/默認讀音):
[0031] 可以 /adv/l/ke3yi3 ;
[0032] 帶/v/l/dai4;
[0033] 你 /pron/l/ni3 ;
[0034] 去 /v/l/qu4 ;
[0035] 長長/v/3/chang2chang2 ;
[0036] 見識/n/l/jian4shi3 ;
[0037] 其中,所述讀音屬性信息還可以包括每個字段的詞性,通過詞性配合字段本身進 行讀音種數和默認讀音的查找,可以進一步提高注音的準確性。需要說明的是,假設詞典中 沒有記載"可以"這個字段,則所述漢字注音裝置可以在字典中分別查詢"可"和"以"的讀 音屬性信息。
[0038] 進一步的,當所述讀音種數大于一時,所述漢字注音裝置確定所述字段為多音字 段,并獲取所述多音字段的至少兩種讀音;
[0039] 當所述讀音種數等于一時,所述漢字注音裝置將所述默認讀音確定為所述字段的 當前讀音。
[0040] S102,對所述至少兩種讀音中每種讀音進行概率預測,并生成預測結果;
[0041] 具體的,當所述漢字注音裝置獲取了所述多音字段的至少兩種讀音后,所述漢字 注音裝置分別獲取所述至少兩種讀音中每種讀音的概率值,并根據所述每種讀音的概率值 的數值大小生成預測結果。
[0042] 進一步的,所述漢字注音裝置預先存儲有包含特定的多音字段的訓練語料,采用 條件隨機場(Conditional Random Fields,CRF)訓練算法獲取所述特定的多音字段中每一 個多音字段的CRF模型,所述CRF模型為所述漢字注音裝置通過分析訓練語料中的語言特 征(例如:前一個詞、后一個詞、詞性、句首、句末以及其他特定的詞語或句子結構等),所建 立的模型。所述漢字注音裝置可以根據預存的訓練語料獲取所述多音字段的CRF模型,并 通過分析所述多音字段在所述文本中的字段特征(例如:前一個詞、后一個詞、詞性、句首、 句末以及其他特定的詞語或句子結構等),獲取所述至少兩種讀音中每種讀音的概率值,并 獲取所述每種讀音的概率值中第一概率值與第二概率值的差值,當所述差值大于預設閾值 時,確定所述第一概率值對應的讀音為優先級最高的讀音;當所述差值小于或等于所述預 設閾值時,確定所述默認讀音為優先級最高的讀音。其中,所述第一概率值為所述每種讀音 的概率值中數值最大的概率值,所述第二概率值為所述每種讀音的概率值中數值次大的概 率值,所述預設閾值為根據人為經驗所設置。
[0043] 參照上述舉例,所述多音字段為"長長",其讀音有三種,分別是"chang2chang2、 zhang3chang2、zhang3zhang3 ",通過分析所獲取的對應的概率值為0· 2、0· 1、0· 7,則第 一概率值為〇. 7,第二概率值為0. 2,假設預設閾值為0. 1,由于所述第一概率值與所述 第二概率值的差值為〇. 5,大于所述預設閾值,因此將所述第一概率值對應的讀音,即 "zhang3zhang3"確定為優先級最高的讀音。
[0044] S103,根據預測結果確定所述多音字段的當前讀音;
[0045] 具體的,所述漢字注音裝置將所述優先級最高的讀音確定為所述多音字段的當前 讀音。
[0046] 進一步的,所述漢字注音裝置對所述文本及所述文本中的字段對應的當前注音進 行輸出,參照上述舉例,輸出的結果為"可以帶你去長長見識(ke3yi3dai4ni3qu4zhang3zha ng3jian4shi2) "。并可以將輸出的結果轉換為語音輸出。
[0047] 在本發明實施例中,當對所輸入的文本中的多音字段進行注音時,對多音字段的 至少兩種讀音中每種讀音進行概率預測,并根據預測結果確定多音字段的當前讀音,實現 了對多音字段的準確注音;通過詞性配合字段本身進行讀音種數和默認讀音的查找,可以 進一步提高注音的準確性,提升閱讀文本的效率及效果,進而提升了漢語學習的效果。
[0048] 請參見圖2,為本發明實施例提供了另一種漢字注音方法的流程示意圖。如圖2所 示,本發明實施例的所述方法包括以下步驟S201-步驟S207。
[0049] S201,對所輸入的文本進行分詞處理,并獲取分詞處理后所述文本中的字段和所 述字段的讀音屬性信息,所述讀音屬性信息包括讀音種數和默認讀音;
[0050] 具體的,用戶可以將待注音的文本輸入至所述漢字注音裝置,輸入的方式可以通 過復制粘貼該文本,或者通過掃描設備掃描該文本等,漢字注音裝置需要對所述文本進行 分詞處理,例如:假設所述文本為"可以帶你去長長見識",所述漢字注音裝置優選的可以根 據詞性對所述文本進行分詞處理,分詞處理后的所述文本為"可以/帶/你/去/長長/見 識"。
[0051] 所述漢字注音裝置可以獲取分詞處理后所述文本中的字段和所述字段的讀音屬 性信息,所述讀音屬性信息包括讀音種數和默認讀音。可以理解的是,所述漢字注音裝置中 預先建立了包含所有字段讀音的字典以及常用詞語的詞典,對于只有一種讀音的漢字,直 接在字典中建立漢字與讀音的對應關系,將該讀音作為該漢字的默認讀音,而對于多音漢 字,則將使用頻率最高的讀音作為多音漢字的默認讀音;而詞典的設置與字典的設置相同, 對于只有一種讀音的詞語,在詞典中建立詞語與讀音的對應關系,將該讀音作為該詞語的 默認讀音,而對于多音詞語,則將使用頻率最高的讀音作為多音詞語的默認讀音,例如:多 音詞語"長長",其讀音有三種,分別是" chang2chang2、zhang3chang2、zhang3zhang3 ",其 中,拼音后的數字表示聲調(以下均統一采用此種格式),由于"chang2chang2"使用的頻率 最高,因此將"chang2chang2"作為"長長"的默認讀音;對于一些固定詞語,例如:"曝"有 兩種讀音,而在"一曝十寒"中的讀音是唯一的,并且"一曝十寒"屬于成語,可以被認為是 常用詞語,因此還可以建立常用詞語的詞典,并部分確定多音字在常用詞語中的讀音。
[0052] 因此,依據上述分詞處理后的所述文本"可以/帶/你/去/長長/見識"為例, 則獲取所述文本中所述字段的讀音屬性信息如下(字段/詞性/讀音種數/默認讀音):
[0053] 可以 /adv/l/ke3yi3 ;
[0054] 帶/v/l/dai4;
[0055] 你 /pron/l/ni3 ;
[0056] 去 /v/l/qu4 ;
[0057] 長長/v/3/chang2chang2 ;
[0058] 見識/n/l/jian4shi3 ;
[0059] 其中,所述讀音屬性信息還可以包括每個字段的詞性,通過詞性配合字段本身進 行讀音種數和默認讀音的查找,可以進一步提高注音的準確性。需要說明的是,假設詞典中 沒有記載"可以"這個字段,則所述漢字注音裝置可以在字典中分別查詢"可"和"以"的讀 音屬性信息。
[0060] S202,當所述讀音種數等于一時,將所述默認讀音確定為所述字段的當前讀音;
[0061] 具體的,當所述讀音種數等于一時,所述漢字注音裝置將所述默認讀音確定為所 述字段的當前讀音。
[0062] S203,當所述讀音種數大于一時,確定所述字段為多音字段;
[0063] 具體的,當所述讀音種數大于一時,所述漢字注音裝置確定所述字段為多音字段, 并獲取所述多音字段的至少兩種讀音;
[0064] S204,當對所輸入的文本中的多音字段進行注音時,獲取所述多音字段的至少兩 種讀音;
[0065] 具體的,所述漢字注音裝置獲取用戶所述文本,當所述漢字注音裝置對所述文本 中的多音字段進行注音時,所述漢字注音裝置獲取所述多音字段的至少兩種讀音。
[0066] S205,獲取所述至少兩種讀音中每種讀音的概率值;
[0067] 具體的,當所述漢字注音裝置獲取了所述多音字段的至少兩種讀音后,所述漢字 注音裝置分別獲取所述至少兩種讀音中每種讀音的概率值。
[0068] 進一步的,所述漢字注音裝置預先存儲有包含特定的多音字段的訓練語料,采用 CRF訓練算法獲取所述特定的多音字段中每一個多音字段的CRF模型,所述CRF模型為所述 漢字注音裝置通過分析訓練語料中的語言特征(例如:前一個詞、后一個詞、詞性、句首、句 末以及其他特定的詞語或句子結構等),所建立的模型。所述漢字注音裝置可以根據預存的 訓練語料獲取所述多音字段的CRF模型,并通過分析所述多音字段在所述文本中的字段特 征(例如:前一個詞、后一個詞、詞性、句首、句末以及其他特定的詞語或句子結構等),獲取 所述至少兩種讀音中每種讀音的概率值。
[0069] S206,根據所述每種讀音的概率值的數值大小生成預測結果;
[0070] 具體的,所述漢字注音裝置根據所述每種讀音的概率值的數值大小生成預測結 果。進一步的,所述漢字注音裝置獲取所述每種讀音的概率值中第一概率值與第二概率值 的差值,當所述差值大于預設閾值時,確定所述第一概率值對應的讀音為優先級最高的讀 音;當所述差值小于或等于所述預設閾值時,確定所述默認讀音為優先級最高的讀音。其 中,所述第一概率值為所述每種讀音的概率值中數值最大的概率值,所述第二概率值為所 述每種讀音的概率值中數值次大的概率值,所述預設閾值為根據人為經驗所設置。
[0071] 參照上述舉例,所述多音字段為"長長",其讀音有三種,分別是"chang2chang2、 zhang3chang2、zhang3zhang3 ",通過分析所獲取的對應的概率值為0· 2、0· 1、0· 7,則第 一概率值為〇. 7,第二概率值為0. 2,假設預設閾值為0. 1,由于所述第一概率值與所述 第二概率值的差值為0. 5,大于所述預設閾值,因此將所述第一概率值對應的讀音,即 "zhang3zhang3"確定為優先級最高的讀音。
[0072] S207,根據預測結果確定所述多音字段的當前讀音。
[0073] 其中,本發明實施例的步驟S207可以參見圖1所示實施例的步驟S103,在此不進 行贅述。
[0074] 在本發明實施例中,當對所輸入的文本中的多音字段進行注音時,對多音字段的 至少兩種讀音中每種讀音進行概率預測,并根據預測結果確定多音字段的當前讀音,實現 了對多音字段的準確注音;通過詞性配合字段本身進行讀音種數和默認讀音的查找,且通 過預先建立了包含所有字段讀音的字典、常用詞語的詞典以及預存的訓練語料相結合,可 以進一步提高注音的準確性,提升閱讀文本的效率及效果,進而提升了漢語學習的效果。
[0075] 下面將結合附圖3-附圖6,對本發明實施例提供的漢字注音裝置進行詳細介紹。 需要說明的是,附圖3-附圖6所示的漢字注音裝置,用于執行本發明圖1和圖2所示實施 例的方法,為了便于說明,僅示出了與本發明實施例相關的部分,具體技術細節未揭示的, 請參照本發明圖1和圖2所示的實施例。
[0076] 請參見圖3,為本發明實施例提供了一種漢字注音裝置的結構示意圖。如圖3所 示,本發明實施例的所述漢字注音裝置1可以包括:讀音獲取模塊11、預測模塊12和第一 讀音確定模塊13。
[0077] 讀音獲取模塊11,用于當對所輸入的文本中的多音字段進行注音時,獲取所述多 音字段的至少兩種讀音;
[0078] 具體實現中,用戶可以將待注音的文本輸入至所述漢字注音裝置1,輸入的方式可 以通過復制粘貼該文本,或者通過掃描設備掃描該文本等,所述漢字注音裝置1獲取用戶 所述文本,當所述漢字注音裝置對所述文本中的多音字段進行注音時,所述讀音獲取模塊 11獲取所述多音字段的至少兩種讀音。
[0079] 需要說明的是,在對所輸入的文本中的多音字段進行注音之前,所述漢字注音裝 置1需要對所述文本進行分詞處理,例如:假設所述文本為"可以帶你去長長見識",所述 漢字注音裝置1優選的可以根據詞性對所述文本進行分詞處理,分詞處理后的所述文本為 "可以/帶/你/去/長長/見識"。
[0080] 所述漢字注音裝置1可以獲取分詞處理后所述文本中的字段和所述字段的讀音 屬性信息,所述讀音屬性信息包括讀音種數和默認讀音。可以理解的是,所述漢字注音裝置 1中預先建立了包含所有字段讀音的字典以及常用詞語的詞典,對于只有一種讀音的漢字, 直接在字典中建立漢字與讀音的對應關系,將該讀音作為該漢字的默認讀音,而對于多音 漢字,則將使用頻率最高的讀音作為多音漢字的默認讀音;而詞典的設置與字典的設置相 同,對于只有一種讀音的詞語,在詞典中建立詞語與讀音的對應關系,將該讀音作為該詞語 的默認讀音,而對于多音詞語,則將使用頻率最高的讀音作為多音詞語的默認讀音,例如: 多音詞語"長長",其讀音有三種,分別是 中,拼音后的數字表示聲調(以下均統一采用此種格式),由于"chang2chang2"使用的頻率 最高,因此將"chang2chang2"作為"長長"的默認讀音;對于一些固定詞語,例如:"曝"有 兩種讀音,而在"一曝十寒"中的讀音是唯一的,并且"一曝十寒"屬于成語,可以被認為是 常用詞語,因此還可以建立常用詞語的詞典,并部分確定多音字在常用詞語中的讀音。
[0081] 因此,依據上述分詞處理后的所述文本"可以/帶/你/去/長長/見識"為例, 則獲取所述文本中所述字段的讀音屬性信息如下(字段/詞性/讀音種數/默認讀音):
[0082] 可以 /adv/l/ke3yi3 ;
[0083] 帶/v/l/dai4;
[0084] 你 /pron/l/ni3 ;
[0085] 去 /v/l/qu4 ;
[0086] 長長/v/3/chang2chang2 ;
[0087] 見識/n/l/jian4shi3 ;
[0088] 其中,所述讀音屬性信息還可以包括每個字段的詞性,通過詞性配合字段本身進 行讀音種數和默認讀音的查找,可以進一步提高注音的準確性。需要說明的是,假設詞典中 沒有記載"可以"這個字段,則所述漢字注音裝置1可以在字典中分別查詢"可"和"以"的 讀音屬性信息。
[0089] 進一步的,當所述讀音種數大于一時,所述漢字注音裝置1確定所述字段為多音 字段,并通知所述讀音獲取模塊11獲取所述多音字段的至少兩種讀音;
[0090] 當所述讀音種數等于一時,所述漢字注音裝置1將所述默認讀音確定為所述字段 的當前讀音。
[0091] 預測模塊12,用于對所述至少兩種讀音中每種讀音進行概率預測,并生成預測結 果;
[0092] 具體實現中,當所述讀音獲取模塊11獲取了所述多音字段的至少兩種讀音后,所 述預測模塊12分別獲取所述至少兩種讀音中每種讀音的概率值,并根據所述每種讀音的 概率值的數值大小生成預測結果。
[0093] 進一步的,所述漢字注音裝置1預先存儲有包含特定的多音字段的訓練語料,采 用CRF訓練算法獲取所述特定的多音字段中每一個多音字段的CRF模型,所述CRF模型為 所述漢字注音裝置1通過分析訓練語料中的語言特征(例如:前一個詞、后一個詞、詞性、句 首、句末以及其他特定的詞語或句子結構等),所建立的模型。所述預測模塊12可以根據預 存的訓練語料獲取所述多音字段的CRF模型,并通過分析所述多音字段在所述文本中的字 段特征(例如:前一個詞、后一個詞、詞性、句首、句末以及其他特定的詞語或句子結構等), 獲取所述至少兩種讀音中每種讀音的概率值,并獲取所述每種讀音的概率值中第一概率值 與第二概率值的差值,當所述差值大于預設閾值時,確定所述第一概率值對應的讀音為優 先級最高的讀音;當所述差值小于或等于所述預設閾值時,確定所述默認讀音為優先級最 高的讀音。其中,所述第一概率值為所述每種讀音的概率值中數值最大的概率值,所述第二 概率值為所述每種讀音的概率值中數值次大的概率值,所述預設閾值為根據人為經驗所設 置。
[0094] 參照上述舉例,所述多音字段為"長長",其讀音有三種,分別是"chang2chang2、 zhang3chang2、zhang3zhang3 ",通過分析所獲取的對應的概率值為0· 2、0· 1、0· 7,則第 一概率值為〇. 7,第二概率值為0. 2,假設預設閾值為0. 1,由于所述第一概率值與所述 第二概率值的差值為〇. 5,大于所述預設閾值,因此將所述第一概率值對應的讀音,即 "zhang3zhang3"確定為優先級最高的讀音。
[0095] 第一讀音確定模塊13,用于根據預測結果確定所述多音字段的當前讀音。
[0096] 具體實現中,所述第一讀音確定模塊13將所述優先級最高的讀音確定為所述多 音字段的當前讀音。
[0097] 進一步的,所述漢字注音裝置1對所述文本及所述文本中的字段對應的當前注 音進行輸出,參照上述舉例,輸出的結果為"可以帶你去長長見識(ke3 yi3dai4 ni3 qu4 zhang3 zhang3 jian4 shi2) "。并可以將輸出的結果轉換為語音輸出。
[0098] 在本發明實施例中,當對所輸入的文本中的多音字段進行注音時,對多音字段的 至少兩種讀音中每種讀音進行概率預測,并根據預測結果確定多音字段的當前讀音,實現 了對多音字段的準確注音;通過詞性配合字段本身進行讀音種數和默認讀音的查找,可以 進一步提高注音的準確性,提升閱讀文本的效率及效果,進而提升了漢語學習的效果。
[0099] 請參見圖4,為本發明實施例提供了另一種漢字注音裝置的結構示意圖。如圖4所 示,本發明實施例所述的漢字注音裝置1可以包括:讀音獲取模塊11、預測模塊12、第一讀 音確定模塊13、信息獲取模塊14、通知模塊15和第二讀音確定模塊16 ;其中,第一讀音確 定模塊13的結構可以參見圖3所示實施例的具體描述,在此不進行贅述。
[0100] 信息獲取模塊14,用于對所輸入的文本進行分詞處理,并獲取分詞處理后所述文 本中的字段和所述字段的讀音屬性信息,所述讀音屬性信息包括讀音種數和默認讀音; [0101] 具體實現中,用戶可以將待注音的文本輸入至所述漢字注音裝置1,輸入的方式可 以通過復制粘貼該文本,或者通過掃描設備掃描該文本等,所述信息獲取模塊14需要對所 述文本進行分詞處理,例如:假設所述文本為"可以帶你去長長見識",所述信息獲取模塊 14優選的可以根據詞性對所述文本進行分詞處理,分詞處理后的所述文本為"可以/帶/ 你/去/長長/見識"。
[0102] 所述信息獲取模塊14可以獲取分詞處理后所述文本中的字段和所述字段的讀音 屬性信息,所述讀音屬性信息包括讀音種數和默認讀音。可以理解的是,所述漢字注音裝置 1中預先建立了包含所有字段讀音的字典以及常用詞語的詞典,對于只有一種讀音的漢字, 直接在字典中建立漢字與讀音的對應關系,將該讀音作為該漢字的默認讀音,而對于多音 漢字,則將使用頻率最高的讀音作為多音漢字的默認讀音;而詞典的設置與字典的設置相 同,對于只有一種讀音的詞語,在詞典中建立詞語與讀音的對應關系,將該讀音作為該詞語 的默認讀音,而對于多音詞語,則將使用頻率最高的讀音作為多音詞語的默認讀音,例如: 多音詞語"長長",其讀音有三種,分別是" chang2chang2、zhang3chang2、zhang3zhang3 ",其 中,拼音后的數字表示聲調(以下均統一采用此種格式),由于"chang2chang2"使用的頻率 最高,因此將"chang2 chang2"作為"長長"的默認讀音;對于一些固定詞語,例如:"曝"有 兩種讀音,而在"一曝十寒"中的讀音是唯一的,并且"一曝十寒"屬于成語,可以被認為是 常用詞語,因此還可以建立常用詞語的詞典,并部分確定多音字在常用詞語中的讀音。
[0103] 因此,依據上述分詞處理后的所述文本"可以/帶/你/去/長長/見識"為例, 則獲取所述文本中所述字段的讀音屬性信息如下(字段/詞性/讀音種數/默認讀音):
[0104] 可以 /adv/l/ke3yi3 ;
[0105] 帶/v/l/dai4;
[0106] 你 /pron/l/ni3 ;
[0107] 去/v/l/qu4;
[0108] 長長/v/3/chang2chang2 ;
[0109]見識/n/l/jian4shi3 ;
[oho] 其中,所述讀音屬性信息還可以包括每個字段的詞性,通過詞性配合字段本身進 行讀音種數和默認讀音的查找,可以進一步提高注音的準確性。需要說明的是,假設詞典中 沒有記載"可以"這個字段,則所述信息獲取模塊14可以在字典中分別查詢"可"和"以"的 讀音屬性信息。
[0111] 通知模塊15,用于當所述讀音種數大于一時,確定所述字段為多音字段,并通知所 述讀音獲取模塊11執行獲取所述多音字段的至少兩種讀音的步驟;
[0112] 具體實現中,當所述讀音種數大于一時,所述通知模塊15確定所述字段為多音字 段,并通知所述讀音獲取模塊11獲取所述多音字段的至少兩種讀音;
[0113] 第二讀音確定模塊16,用于當所述讀音種數等于一時,將所述默認讀音確定為所 述字段的當前讀音;
[0114] 具體實現中,當所述讀音種數等于一時,所述第二讀音確定模塊16將所述默認讀 音確定為所述字段的當前讀音。
[0115] 讀音獲取模塊11,用于當對所輸入的文本中的多音字段進行注音時,獲取所述多 音字段的至少兩種讀音;
[0116] 具體實現中,所述漢字注音裝置1獲取用戶所述文本,當所述漢字注音裝置1對所 述文本中的多音字段進行注音時,所述讀音獲取模塊11獲取所述多音字段的至少兩種讀 音。
[0117] 預測模塊12,用于對所述至少兩種讀音中每種讀音進行概率預測,并生成預測結 果;
[0118] 具體實現中,當所述讀音獲取模塊11獲取了所述多音字段的至少兩種讀音后,所 述預測模塊12分別獲取所述至少兩種讀音中每種讀音的概率值,并根據所述每種讀音的 概率值的數值大小生成預測結果。
[0119] 具體的,請一并參見圖5,為本發明實施例提供了預測模塊的結構示意圖。如圖5 所示,所述預測模塊12可以包括:
[0120] 概率獲取單元121,用于獲取所述至少兩種讀音中每種讀音的概率值;
[0121] 具體實現中,當所述讀音獲取模塊11獲取了所述多音字段的至少兩種讀音后,所 述概率獲取單元121分別獲取所述至少兩種讀音中每種讀音的概率值。
[0122] 進一步的,所述漢字注音裝置1預先存儲有包含特定的多音字段的訓練語料,采 用CRF訓練算法獲取所述特定的多音字段中每一個多音字段的CRF模型,所述CRF模型為 所述漢字注音裝置1通過分析訓練語料中的語言特征(例如:前一個詞、后一個詞、詞性、句 首、句末以及其他特定的詞語或句子結構等),所建立的模型。所述漢字注音裝置1可以根 據預存的訓練語料獲取所述多音字段的CRF模型,并通過分析所述多音字段在所述文本中 的字段特征(例如:前一個詞、后一個詞、詞性、句首、句末以及其他特定的詞語或句子結構 等),獲取所述至少兩種讀音中每種讀音的概率值。
[0123] 結果生成單元122,用于根據所述每種讀音的概率值的數值大小生成預測結果;
[0124] 具體實現中,所述結果生成單元122根據所述每種讀音的概率值的數值大小生成 預測結果。進一步的,所述結果生成單元122獲取所述每種讀音的概率值中第一概率值與 第二概率值的差值,當所述差值大于預設閾值時,確定所述第一概率值對應的讀音為優先 級最高的讀音;當所述差值小于或等于所述預設閾值時,確定所述默認讀音為優先級最高 的讀音。其中,所述第一概率值為所述每種讀音的概率值中數值最大的概率值,所述第二 概率值為所述每種讀音的概率值中數值次大的概率值,所述預設閾值為根據人為經驗所設 置。
[0125] 參照上述舉例,所述多音字段為"長長",其讀音有三種,分別是"chang2chang2、 zhang3chang2、zhang3zhang3 ",通過分析所獲取的對應的概率值為0· 2、0· 1、0· 7,則第 一概率值為〇. 7,第二概率值為0. 2,假設預設閾值為0. 1,由于所述第一概率值與所述 第二概率值的差值為〇. 5,大于所述預設閾值,因此將所述第一概率值對應的讀音,即 "zhang3zhang3"確定為優先級最高的讀音。
[0126] 具體的,請一并參見圖6,為本發明實施例提供了結果生成單元的結構示意圖。如 圖6所示,所述結果生成單元122可以包括:
[0127] 差值獲取子單元1221,用于獲取所述每種讀音的概率值中第一概率值與第二概率 值的差值;
[0128] 第一確定子單元1222,用于當所述差值大于預設閾值時,確定所述第一概率值對 應的讀音為優先級最高的讀音;
[0129] 第二確定子單元1223,用于當所述差值小于或等于所述預設閾值時,確定所述默 認讀音為優先級最高的讀音;
[0130] 具體實現中,所述差值獲取子單元1221獲取所述每種讀音的概率值中第一概率 值與第二概率值的差值,當所述差值大于預設閾值時,所述第一確定子單元1222確定所述 第一概率值對應的讀音為優先級最高的讀音;當所述差值小于或等于所述預設閾值時,所 述第二確定子單元1223確定所述默認讀音為優先級最高的讀音。其中,所述第一概率值為 所述每種讀音的概率值中數值最大的概率值,所述第二概率值為所述每種讀音的概率值中 數值次大的概率值,所述預設閾值為根據人為經驗所設置。
[0131] 參照上述舉例,所述多音字段為"長長",其讀音有三種,分別是"chang2chang2、 zhang3chang2、zhang3zhang3 ",通過分析所獲取的對應的概率值為0· 2、0· 1、0· 7,則第 一概率值為〇. 7,第二概率值為0. 2,假設預設閾值為0. 1,由于所述第一概率值與所述 第二概率值的差值為〇. 5,大于所述預設閾值,因此將所述第一概率值對應的讀音,即 "zhang3zhang3"確定為優先級最高的讀音。
[0132] 在本發明實施例中,當對所輸入的文本中的多音字段進行注音時,對多音字段的 至少兩種讀音中每種讀音進行概率預測,并根據預測結果確定多音字段的當前讀音,實現 了對多音字段的準確注音;通過詞性配合字段本身進行讀音種數和默認讀音的查找,且通 過預先建立了包含所有字段讀音的字典、常用詞語的詞典以及預存的訓練語料相結合,可 以進一步提高注音的準確性,提升閱讀文本的效率及效果,進而提升了漢語學習的效果。
[0133] 請參見圖7,為本發明實施例提供了又一種漢字注音裝置的結構示意圖。如圖7 所示,所述漢字注音裝置1000可以包括:至少一個處理器1001,例如CPU,至少一個網絡 接口 1004,用戶接口 1003,存儲器1005,至少一個通信總線1002。其中,通信總線1002用 于實現這些組件之間的連接通信。其中,用戶接口 1003可以包括顯示屏(Display)、鍵盤 (Keyboard),可選用戶接口 1003還可以包括標準的有線接口、無線接口。網絡接口 1004可 選的可以包括標準的有線接口、無線接口(如WI-FI接口)。存儲器1005可以是高速RAM存 儲器,也可以是非不穩定的存儲器(non-volatile memory),例如至少一個磁盤存儲器。存 儲器1005可選的還可以是至少一個位于遠離前述處理器1001的存儲裝置。如圖7所示, 作為一種計算機存儲介質的存儲器1005中可以包括操作系統、網絡通信模塊、用戶接口模 塊以及漢字注音應用程序。
[0134] 在圖7所示的更新發布服務器1000中,用戶接口 1003主要用于為用戶提供輸入 的接口,獲取用戶輸出的數據;而處理器1001可以用于調用存儲器1005中存儲的漢字注音 應用程序,并具體執行以下步驟:
[0135] 當對所輸入的文本中的多音字段進行注音時,獲取所述多音字段的至少兩種讀 音;
[0136] 對所述至少兩種讀音中每種讀音進行概率預測,并生成預測結果;
[0137] 根據預測結果確定所述多音字段的當前讀音。
[0138] 在一個實施例中,所述處理器1001在執行當對所輸入的文本中的多音字段進行 注音之前,還執行以下步驟:
[0139] 對所輸入的文本進行分詞處理,并獲取分詞處理后所述文本中的字段和所述字段 的讀音屬性信息,所述讀音屬性信息包括讀音種數和默認讀音;
[0140]當所述讀音種數大于一時,確定所述字段為多音字段,并執行獲取所述多音字段 的至少兩種讀音的步驟;
[0141] 當所述讀音種數等于一時,將所述默認讀音確定為所述字段的當前讀音。
[0142] 在一個實施例中,所述處理器1001在執行對所述至少兩種讀音中每種讀音進行 概率預測,并生成預測結果時,具體執行以下步驟:
[0143] 獲取所述至少兩種讀音中每種讀音的概率值;
[0144] 根據所述每種讀音的概率值的數值大小生成預測結果。
[0145] 在一個實施例中,所述處理器在執行獲取所述至少兩種讀音中每種讀音的概率值 時,具體執行以下步驟:
[0146] 根據預存的訓練語料以及分析所述多音字段在所述文本中的字段特征,獲取所述 至少兩種讀音中每種讀音的概率值。
[0147] 在一個實施例中,所述處理器1001在執行根據所述每種讀音的概率值的數值大 小生成預測結果時,具體執行以下步驟:
[0148] 獲取所述每種讀音的概率值中第一概率值與第二概率值的差值;
[0149] 當所述差值大于預設閾值時,確定所述第一概率值對應的讀音為優先級最高的讀 音;
[0150] 當所述差值小于或等于所述預設閾值時,確定所述默認讀音為優先級最高的讀 音;
[0151] 其中,所述第一概率值為所述每種讀音的概率值中數值最大的概率值,所述第二 概率值為所述每種讀音的概率值中數值次大的概率值。
[0152] 在一個實施例中,所述處理器1001在執行根據預測結果確定所述多音字段的當 前讀音時,具體執行以下步驟:
[0153] 將所述優先級最高的讀音確定為所述多音字段的當前讀音。
[0154] 在本發明實施例中,當對所輸入的文本中的多音字段進行注音時,對多音字段的 至少兩種讀音中每種讀音進行概率預測,并根據預測結果確定多音字段的當前讀音,實現 了對多音字段的準確注音,提升閱讀文本的效率及效果,進而提升了漢語學習的效果。
[0155] 本領域普通技術人員可以理解實現上述實施例方法中的全部或部分流程,是可以 通過計算機程序來指令相關的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質 中,該程序在執行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質可為 磁碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或隨機存儲記憶體(Random Access Memory,RAM)等。
[0156] 以上所揭露的僅為本發明較佳實施例而已,當然不能以此來限定本發明之權利范 圍,因此依本發明權利要求所作的等同變化,仍屬本發明所涵蓋的范圍。
【權利要求】
1. 一種漢字注音方法,其特征在于,包括: 當對所輸入的文本中的多音字段進行注音時,獲取所述多音字段的至少兩種讀音; 對所述至少兩種讀音中每種讀音進行概率預測,并生成預測結果; 根據預測結果確定所述多音字段的當前讀音。
2. 根據權利要求1所述的方法,其特征在于,所述當對所輸入的文本中的多音字段進 行注音之前,還包括: 對所輸入的文本進行分詞處理,并獲取分詞處理后所述文本中的字段和所述字段的讀 音屬性信息,所述讀音屬性信息包括讀音種數和默認讀音; 當所述讀音種數大于一時,確定所述字段為多音字段,并執行獲取所述多音字段的至 少兩種讀音的步驟; 當所述讀音種數等于一時,將所述默認讀音確定為所述字段的當前讀音。
3. 根據權利要求2所述的方法,其特征在于,所述對所述至少兩種讀音中每種讀音進 行概率預測,并生成預測結果,包括: 獲取所述至少兩種讀音中每種讀音的概率值; 根據所述每種讀音的概率值的數值大小生成預測結果。
4. 根據權利要求3所述的方法,其特征在于,所述獲取所述至少兩種讀音中每種讀音 的概率值,包括: 根據預存的訓練語料以及分析所述多音字段在所述文本中的字段特征,獲取所述至少 兩種讀音中每種讀音的概率值。
5. 根據權利要求3所述的方法,其特征在于,所述根據所述每種讀音的概率值的數值 大小生成預測結果,包括: 獲取所述每種讀音的概率值中第一概率值與第二概率值的差值; 當所述差值大于預設閾值時,確定所述第一概率值對應的讀音為優先級最高的讀音; 當所述差值小于或等于所述預設閾值時,確定所述默認讀音為優先級最高的讀音; 其中,所述第一概率值為所述每種讀音的概率值中數值最大的概率值,所述第二概率 值為所述每種讀音的概率值中數值次大的概率值。
6. 根據權利要求5所述的方法,其特征在于,所述根據預測結果確定所述多音字段的 當前讀音,包括: 將所述優先級最高的讀音確定為所述多音字段的當前讀音。
7. -種漢字注音裝置,其特征在于,包括: 讀音獲取模塊,用于當對所輸入的文本中的多音字段進行注音時,獲取所述多音字段 的至少兩種讀音; 預測模塊,用于對所述至少兩種讀音中每種讀音進行概率預測,并生成預測結果; 第一讀音確定模塊,用于根據預測結果確定所述多音字段的當前讀音。
8. 根據權利要求7所述的裝置,其特征在于,還包括: 信息獲取模塊,用于對所輸入的文本進行分詞處理,并獲取分詞處理后所述文本中的 字段和所述字段的讀音屬性信息,所述讀音屬性信息包括讀音種數和默認讀音; 通知模塊,用于當所述讀音種數大于一時,確定所述字段為多音字段,并通知所述讀音 獲取模塊執行獲取所述多音字段的至少兩種讀音的步驟; 第二讀音確定模塊,用于當所述讀音種數等于一時,將所述默認讀音確定為所述字段 的當前讀音。
9. 根據權利要求8所述的裝置,其特征在于,所述預測模塊包括: 概率獲取單元,用于獲取所述至少兩種讀音中每種讀音的概率值; 結果生成單元,用于根據所述每種讀音的概率值的數值大小生成預測結果。
10. 根據權利要求9所述的裝置,其特征在于,所述概率獲取單元具體用于根據預存的 訓練語料以及分析所述多音字段在所述文本中的字段特征,獲取所述至少兩種讀音中每種 讀音的概率值。
11. 根據權利要求9所述的裝置,其特征在于,所述結果生成單元包括: 差值獲取子單元,用于獲取所述每種讀音的概率值中第一概率值與第二概率值的差 值; 第一確定子單元,用于當所述差值大于預設閾值時,確定所述第一概率值對應的讀音 為優先級最高的讀音; 第二確定子單元,用于當所述差值小于或等于所述預設閾值時,確定所述默認讀音為 優先級最高的讀音; 其中,所述第一概率值為所述每種讀音的概率值中數值最大的概率值,所述第二概率 值為所述每種讀音的概率值中數值次大的概率值。
12. 根據權利要求11所述的裝置,其特征在于,所述第一讀音確定模塊具體用于將所 述優先級最高的讀音確定為所述多音字段的當前讀音。
【文檔編號】G06F17/20GK104142909SQ201410190961
【公開日】2014年11月12日 申請日期:2014年5月7日 優先權日:2014年5月7日
【發明者】吳小平, 戴強 申請人:騰訊科技(深圳)有限公司