專利名稱:自動判斷多國語言的實時翻譯系統及其方法
技術領域:
本發明涉及一種實時翻譯系統及其方法,尤其涉及一種自動判斷多國語言的翻譯
系統及其方法。
背景技術:
近年來,隨著計算機的普及與因特網的蓬勃發展,內含多國語言的文件已普遍流 通,能夠翻譯各種語言的翻譯軟件也應運而生。 一般而言,在使用翻譯軟件進行翻譯之前, 用戶必須先設定待翻譯的語言以及欲翻譯成何種語言的條件,然而當使用者不知道待翻譯 的語言種類時,將無法進行翻譯,即便用戶知道待翻譯的語言種類,也會因需要事先設定條 件而造成使用的不便。 由于上述的方式在實際操作上的不便性,有廠商提出根據語言的編碼來判斷待翻 譯的語言,用以代替上述設定待翻譯語言種類的操作。不過,以此方式在具有同樣字母的西
文語系,例如英文、法文、德文.......等,將無法正確判斷所使用的語言,舉例來說,當詞
匯為〃 即ple〃時,翻譯軟件無法僅根據字母的編碼來判斷該詞匯為英文或法文,導致產生 使用法文的翻譯詞庫來翻譯英文詞匯的情況發生,甚至產生無法翻譯的情形,因此,上述方 式具有無法自動翻譯內含多國語言的文件的問題。 綜上所述,可知現有技術中長期以來一直存在無法自動翻譯內含多國語言的文件 的問題,因此有必要提出改進的技術手段,來解決此一問題。
發明內容
有鑒于現有技術存在的問題。本發明遂揭露一種自動判斷多國語言的實時翻譯系 統及其方法。 本發明所揭露的自動判斷多國語言的實時翻譯系統,包含翻譯數據庫、加載模 塊、分析模塊及翻譯模塊。其中,翻譯數據庫用以分別根據語言儲存翻譯詞匯;加載模塊用 以加載待翻語句,并且根據分割條件將待翻語句拆解為待翻詞匯,其中待翻詞匯分別對應 一個語言參數;分析模塊用以將待翻詞匯分別與語言中的翻譯詞匯進行比對,并且于比對 符合時根據語言來調整待翻詞匯的語言參數;翻譯模塊用以分別根據待翻詞匯所對應的語 言參數,自相應的語言中查詢并顯示翻譯詞匯。 至于本發明的自動判斷多國語言的實時翻譯方法,其步驟包括分別根據語言建 立翻譯詞匯;加載待翻語句,并且根據分割條件將待翻語句拆解為待翻詞匯,其中待翻詞匯 分別對應語言參數;將待翻詞匯分別與語言中的翻譯詞匯進行比對,并且于比對符合時根 據語言調整各待翻詞匯的語言參數;分別根據待翻詞匯所對應的語言參數,自相應的語言 中查詢并顯示翻譯詞匯。 本發明所揭露的系統與方法如上,與現有技術之間的差異在于本發明通過將文件 內的語句拆解成多個詞匯并判斷各詞匯的語言,以便根據詞匯的前后文的語言進行相應的 翻譯調整。
3
通過上述的技術手段,本發明可以達成提高翻譯準確性的技術效果。
圖1為本發明自動判斷多國語言的實時翻譯系統的方塊圖。 圖2為本發明自動判斷多國語言的實時翻譯方法的流程圖。 圖3為應用本發明進行翻譯的第一實施例的示意圖。 圖4為應用本發明進行翻譯的第二實施例的示意圖。 圖5為本發明設定窗口的示意圖。
具體實施例方式
以下將配合附圖及實施例來詳細說明本發明的實施方式,藉此對本發明如何應用
技術手段來解決技術問題并達成技術效果的實現過程能充分理解并據以實施。 在說明本發明所揭露的自動判斷多國語言的實時翻譯系統及其方法之前,先對本
發明所自行定義的名詞作如下的解釋。本發明中所提到的待翻語句及待翻詞匯分別為待翻
譯的句子及待翻譯的單詞,待翻語句是由至少一個待翻詞匯組成,舉例來說當待翻語句為
「This is an卿le」時,其待翻詞匯分別為「This」、「is」、「an」及「卿le」。 首先,先說明本發明的系統,請參照圖1,圖1為本發明自動判斷多國語言的實時
翻譯系統的方塊圖,包含翻譯數據庫101、加載模塊102、分析模塊103及翻譯模塊104。其
中,翻譯數據庫101用以分別儲存不同語言的翻譯詞匯,所述不同語言為具有相同字母元
素的語言如英文、法文、德文.......及意大利文等,也就是說,根據英文來儲存語言為英
文的翻譯詞匯、根據法文來儲存語言為法文的翻譯詞匯.......等以此類推,以便在翻譯查
詢時可以針對不同語言的待翻詞匯來查詢相應的翻譯詞匯。 加載模塊102用以加載待翻語句,并且根據分割條件將待翻語句拆解為待翻詞 匯,其中待翻詞匯分別對應一個語言參數,其加載待翻語句的方式可通過加載文件或是在 窗口中擷取光標所在位置的文字等方式來達成。所述分割條件是根據空格、標點符號至少 其中之一,以進行詞匯拆解的設定,舉例來說,當待翻語句為「This is an即ple」時,可根 據分割條件所記錄的詞匯拆解設定如空格,拆解為「This」、「is」、「an」及「即ple」等多個 待翻詞匯。 另外,所述語言參數可用于記錄對應的待翻詞匯的語言的優先使用順序,例如假 設待翻詞匯為「即ple」,由于英文及法文中皆具有對應此待翻詞匯的翻譯詞匯,當在翻譯數 據庫101進行比對時,若先于英文中查詢到比對符合的翻譯詞匯且再于法文中查詢到比對 符合的翻譯詞匯,則語言參數可記錄第一使用順序為英文,第二使用順序為法文。若其他語
言中同樣具有「a卯le」的詞匯,則可記錄為第三使用順序.......等以此類推,至于如何得
知各語言中是否具有同一待翻詞匯的翻譯詞匯,將在稍后進行說明。除此之外,語言參數亦 可用以記錄待翻詞匯的語言類型,也就是說,語言參數僅記錄一種語言,而非如前述同時記 錄多種語言及其使用順序,在實際實施上,可事先針對每一翻譯詞匯的使用頻率默認一個 頻率參數,以便直接通過該默認的頻率參數來設定及調整語言參數。舉例來說,假設英文及 法文的翻譯詞匯「即ple」分別預設有數值"3"及數值"l"的頻率參數,當進行翻譯詞匯的比 對時,由于在英文及法文中均查詢到比對符合的翻譯詞匯「即ple」,故根據頻率參數的數值來設定及調整語言參數。以此例而言,可將數值較大的頻率參數的翻譯詞匯的語言(例
如英文)記錄于語言參數中,本發明并未限定語言參數的記錄格式及調整方式,稍后將分
別配合附圖以第一實施例及第二實施例來說明不同的記錄格式及調整方式。
分析模塊103用以將待翻詞匯分別與不同語言中的翻譯詞匯進行比對,并且于比
對符合時根據語言的類型來調整待翻詞匯的語言參數。前面提到,本發明可得知各語言中
是否具有同一待翻詞匯的翻譯詞匯,其判斷方式便是通過分析模塊103將待翻詞匯分別與
各語言的翻譯詞匯進行比對。以待翻詞匯「apple」為例,將此待翻詞匯與翻譯數據庫101
中不同語言的所有翻譯詞匯進行比對,于比對符合時,根據語言的類型來調整此待翻詞匯
的語言參數,例如當此待翻詞匯與英文中的翻譯詞匯比對符合時,其待翻詞匯的語言參數
會以英文作為第一使用順序。接著,當待翻詞匯亦與法文中的翻譯詞匯比對符合時,其待翻
詞匯的語言參數會以法文作為第二使用順序,并以此類推直到比對完成。 承上所述,其語言參數的調整更包含根據前一待翻詞匯及次一待翻詞匯的語言參
數來進行調整。舉例來說,前一待翻詞匯的語言參數的第一使用順序為英文,次一待翻詞匯
的語言參數的第一使用順序亦為英文,則待翻詞匯的語言參數的第一使用順序將調整為英
文。若前一待翻詞匯與次一待翻詞匯為不同的語言(即第一使用順序為不同語言)時,則
不調整待翻詞匯的語言參數。特別要說明的是,本發明并未限定僅通過前一待翻詞匯及次
一待翻詞匯來進行調整,在實際實施上,亦可通過整句句子的語言參數作為調整的依據。例
如整句句子有5個待翻詞匯的語言參數的第一使用順序為英文,且有3個待翻詞匯的語言
參數的第一使用順序為法文,此時可將所有待翻詞匯的語言參數的第一使用順序調整為英
文。要注意的是,在調整過程中僅能調整待翻詞匯具有的語言,也就是說,若待翻詞匯的語
言參數中僅具有第一使用順序為法文而無其他使用順序的語言,那么將保留使用法文作為
其語言參數的第一使用順序。 前面提到,所述翻譯詞匯可分別對應一個頻率參數,用以記錄不同語言中各翻譯 詞匯的使用頻率,因此,亦可通過此頻率參數來調整待翻詞匯的語言參數。舉例來說,假 設英文的翻譯詞匯「apple」的頻率參數(例如參數值為數值"2"大于法文的翻譯詞匯 「即ple」的頻率參數(例如參數值為數值"l"),當待翻詞匯為「即ple」且前一待翻詞匯 及次一待翻詞匯的語言參數各自為英文及法文時,將根據翻譯詞匯的頻率參數來進行翻譯 調整。也就是說,當無法直接通過前一待翻詞匯及次一待翻詞匯的語言參數來判斷待翻詞 匯所使用的語言時,可選擇使用頻率數值大的翻譯詞匯(例如英文的翻譯詞匯「apple」) 作為翻譯的依據,亦或是將英文作為待翻詞匯「apple」的語言參數的第一使用順序,而法文 則作為第二使用順序。 翻譯模塊104用以分別根據待翻詞匯所對應的語言參數,自相應的語言中查詢并 顯示翻譯詞匯。舉例來說,待翻詞匯「apple」所對應的語言參數記錄第一使用順序為英文及 第二使用順序為法文,此時,將自翻譯數據庫101查詢相應于英文的翻譯詞匯并進行顯示。
如圖2所示意,圖2為本發明自動判斷多國語言的實時翻譯方法的流程圖,其步驟 包含分別根據語言建立翻譯詞匯(步驟201);加載待翻語句,并且根據分割條件將待翻 語句拆解為待翻詞匯,其中待翻詞匯分別對應語言參數(步驟202);將待翻詞匯分別與語 言中的翻譯詞匯進行比對,并且于比對符合時根據語言調整各待翻詞匯的語言參數(步驟 203);分別根據待翻詞匯所對應的語言參數,自相應的語言中查詢并顯示翻譯詞匯(步驟204)。藉由上述所有步驟將文件內的語句拆解成多個詞匯并判斷各詞匯的語言,以便根據 詞匯的前后文的語言進行相應的翻譯調整,如此一來,即可在翻譯多國語言的文件時提高 翻譯準確性。 以下我們將配合圖3至圖5以實施例方式進行如下說明。請先參閱圖3,圖3為 應用本發明進行翻譯的第一實施例的示意圖,當使用者要翻譯內含多國語言的文件時,可 通過點選翻譯窗口 300中的加載組件301來加載該待翻譯的文件,并且將所加載的文件內 容顯示于待翻語句輸入區塊302中(例如文件內容為「C' est un即ple. This is an apple.」)作為待翻語句。當用戶點選翻譯組件304后,加載模塊102加載待翻語句,并且根 據預設的分割條件(例如設定為根據空格及標點符號進行分割)將待翻語句如「C' est un即ple. This is an即ple.」拆解為待翻詞匯如「C' est」、「un」及「即ple」。
接著,分析模塊103將待翻詞匯(例如「C' est」、「皿」及「即ple」)分別與翻譯 數據庫101中的所有語言的翻譯詞匯進行比對,并且于比對符合時根據語言來調整待翻詞 匯的語言參數。以此例而言,待翻詞匯「C' est」的語言參數記錄第一使用順序為法文(因 為僅能從法文的翻譯詞匯中查詢到比對符合的「C' est」);待翻詞匯「皿」的語言參數記 錄第一使用順序為法文、第二使用順序為英文(由于前一待翻詞匯「C' est」為法文,故可 先從法文的翻譯詞匯中開始進行比對,并于比對符合時記錄第一使用順序為法文,之后亦 于英文的翻譯詞匯中查詢到比對符合的「un」,于是記錄第二使用順序為英文);待翻詞匯 「即ple」的語言參數記錄第一使用順序為英文、第二使用順序為法文(由于前一待翻詞匯
「un」可能為多種語言,故按照默認的順序,如英文、法文......等等,依序與各語言的翻
譯詞匯進行比對)。由于此句中,待翻詞匯「C' est」的語言參數僅記錄第一使用順序為法 文而無其他使用順序,故其語言參數不作調整,而在調整待翻詞匯「un」的語言參數時,因為 前一待翻詞匯「C' est」已經確定為法文,且待翻詞匯及次一待翻詞匯「即ple」皆有法文的 使用順序(分別為第一使用順序及第二使用順序),所以待翻詞匯「皿」的語言參數維持法 文作為第一使用順序、英文作為第二使用順序的設定,接著,在調整待翻詞匯「a卯le」的語 言參數時,其前一待翻詞匯「皿」已經確定為法文,故將本身(即待翻詞匯「apple」)的語言 參數調整成第一使用順序為法文、第二使用順序為英文。 承上所述,當上述待翻詞匯的語言參數皆調整完畢后(即第一使用順序為法文), 翻譯模塊104分別根據這些待翻詞匯的語言參數(即語言參數中所記錄的第一使用順序), 從相應的語言(例如法文)中查詢并顯示翻譯詞匯。以此例而言,將從翻譯數據庫101中 分別查詢相應于待翻詞匯「C' est」、「皿」及「即ple」的法文翻譯詞匯如「這是」、「一個」 及「蘋果」,并且顯示于翻譯結果顯示區塊303。特別要說明的是,在本例中,其語言參數內
所記錄的第一使用順序、第二使用順序......等,僅在調整語言參數的過程中使用,當語
言參數調整完畢后,翻譯模塊104僅根據第一使用順序的記錄從相應的語言中查詢并顯示 翻譯詞匯。 緊接著,以相同的方式將待翻語句的另一段落如「This is an即ple.」拆解為待 翻詞匯如:「This」、「is」、「an」及「卿le」,由于其處理過程與段落為「C' est un即ple」 時相同,故在此不多作贅述,唯一的差異僅在于這些待翻詞匯(即「This」、「is」、「an」及 「即ple」)的語言參數的第一使用順序皆為英文,所以翻譯模塊104將從翻譯數據庫101中 分別查詢相應于待翻詞匯「This」、「is」、「an」及「即ple」的英文翻譯詞匯如:「這」、「是」、「一個」及「蘋果」,并且可根據翻譯軟件內含的語法規則對這些翻譯詞匯進行排列組合。至 此,待翻語句翻譯完成,使用者亦可通過點選恢復組件305恢復到翻譯前的狀態,甚至可將 文件中所包含的語言類型(例如英文及法文)顯示于待翻語言顯示區塊306中。
如圖4所示,圖4為應用本發明進行翻譯的第二實施例的示意圖。當用戶開啟一 般應用程序的顯示窗口 400時,用戶亦可通過拖曳光標401來標記文字,并且以按壓功能鍵 的方式,擷取所標記的文字(例如「This is an即ple.」)以作為待翻語句410,由于擷取 所標記的文字為已知技術,故在此不多作贅述。接下來,加載模塊102加載所擷取的待翻語 句410,并且根據分割條件(例如以空格及標點符號作為拆解的依據)將待翻語句拆解為 多個待翻詞匯如「This」、「is」、「an」及「即ple」,且每一個待翻詞匯分別對應一個語言參 數。 接著,分析模塊103將所有待翻詞匯分別與翻譯數據庫101中的所有翻譯詞匯進 行比對,并且于比對符合時根據其翻譯詞匯的語言來調整各待翻詞匯的語言參數。前面提 到,調整各待翻詞匯的語言參數并未限定僅由前一待翻詞匯及次一待翻詞匯的語言參數來 調整,因此,有別于第一實施例,在此第二實施例中,分析模塊103可在比對符合時分別記 錄對應這些待翻詞匯(即「This」、「is」、「an」及「即ple」)的語言于一列表中(圖中未示), 舉例來說,假設待翻詞匯「This」、「is」及「an」可在英文的翻譯詞匯中得到比對符合的結 果,而待翻詞匯「apple」則可分別在英文及法文的翻譯詞匯中得到比對符合的結果,因此,
所述列表可記錄為「This :英文;is :英文;an :英文;即ple :英文、法文」,并且根據此列表
將英文設定為待翻詞匯「This」、「is」、「an」的語言參數,而待翻詞匯「即ple」雖然具有英 文及法文兩種語言,但是經由列表中可得知英文使用頻率較高,故將英文設定為待翻詞匯 「即ple」的語言參數,至此完成待翻詞匯的語言參數的調整。 當語言參數調整完畢后,翻譯模塊104便分別根據這些待翻詞匯所對應的語言參 數,自翻譯數據庫101中查詢相應于該語言的翻譯詞匯。接下來,即可通過浮動窗口 420顯 示光標401所在位置的待翻詞匯「即ple」及相應的翻譯詞匯421,甚至搭配語法規則,將所 有待翻詞匯進行排列組合后,通過浮動窗口 420顯示整句翻譯(圖中未示),由于經由語法 規則重新排列組合翻譯詞匯為已知技術,故在此不多作贅述。 最后,配合圖5說明如何經由設定窗口來設定頻率參數,請參閱圖5 ,圖5為本發明 設定窗口的示意圖,當使用者具有設定常用翻譯詞匯的需求時,可通過設定翻譯詞匯的頻 率參數來達成,其設定方式可通過設定窗口 500中的語言選擇組件510來選擇欲設定的語 言(例如英文)。接著,在用戶選擇欲設定的語言后,頻率參數設定區塊520會加載翻譯 詞匯及相應的頻率參數,用以提供使用者進行設定。此時,使用者可將常用的翻譯詞匯(例 如翻譯詞匯為「a」)設定為較大的數值(例如數值為"20"),并點選確定組件531儲存 以完成設定,或是點選取消組件532取消設定。特別要說明的是,本發明并未限定設定窗口 500所包含的組件類型及數量,任何可設定頻率參數的組件亦不脫離本發明的精神。
綜上所述,可知本發明與現有技術之間的差異在于通過將文件內的語句拆解成多 個詞匯并判斷各詞匯的語言,以便根據詞匯的前后文的語言進行相應的翻譯調整的技術手 段,藉由此一技術手段可以自動翻譯內含多國語言的文件,來解決現有技術所存在的問題, 進而達成提高翻譯準確性的技術效果。 雖然本發明所揭露的實施方式如上,但所述的內容并非用以直接限定本發明的專
7利保護范圍。任何本發明所屬技術領域中具有通常知識者,在不脫離本發明所揭露的精神 和范圍的前提下,可以在實施的形式上及細節上作些許的更動。本發明的專利保護范圍,仍 須以所附的權利要求書所界定者為準。
權利要求
一種自動判斷多國語言的實時翻譯系統,包含一翻譯數據庫,用以分別根據至少一語言儲存至少一翻譯詞匯;一加載模塊,用以加載一待翻語句,并且根據一分割條件將該待翻語句拆解為至少一待翻詞匯,其中該待翻詞匯分別對應一語言參數;一分析模塊,用以將該些待翻詞匯分別與該些語言中的該些翻譯詞匯進行比對,并且于比對符合時根據該些語言調整各該待翻詞匯的語言參數;及一翻譯模塊,用以分別根據該待翻詞匯所對應的語言參數,自相應的語言中查詢并顯示該翻譯詞匯。
2. 如權利要求1所述的自動判斷多國語言的實時翻譯系統,其中該語言為具有相同字 母元素的語言。
3. 如權利要求1所述的自動判斷多國語言的實時翻譯系統,其中該語言參數為記錄該 些語言的優先使用順序。
4. 如權利要求1所述的自動判斷多國語言的實時翻譯系統,其中該語言參數的調整更 包含根據前一待翻詞匯及次一待翻詞匯的該語言參數來進行調整。
5. 如權利要求1所述的自動判斷多國語言的實時翻譯系統,其中該些翻譯詞匯分別對 應一頻率參數,用以記錄該些語言中各該翻譯詞匯的使用頻率。
6. —種自動判斷多國語言的實時翻譯方法,其步驟包括 分別根據至少一語言建立至少一翻譯詞匯;載入一待翻語句,并且根據一分割條件將該待翻語句拆解為至少一待翻詞匯,其中該 些待翻詞匯分別對應一語言參數;將該些待翻詞匯分別與該些語言中的該些翻譯詞匯進行比對,并且于比對符合時根據 該些語言調整各該待翻詞匯的該語言參數;及分別根據該些待翻詞匯所對應的該語言參數,自相應的該語言中查詢并顯示該翻譯詞匯。
7. 如權利要求6所述的自動判斷多國語言的實時翻譯方法,其中該語言為具有相同字 母元素的語言。
8. 如權利要求6所述的自動判斷多國語言的實時翻譯方法,其中該語言參數為記錄該 些語言的優先使用順序。
9. 如權利要求6所述的自動判斷多國語言的實時翻譯方法,其中該語言參數的調整更 包含根據前一待翻詞匯及次一待翻詞匯的該語言參數來進行調整。
10. 如權利要求6所述的自動判斷多國語言的實時翻譯方法,其中該些翻譯詞匯分別 對應一頻率參數,用以記錄該些語言中各該翻譯詞匯的使用頻率。
全文摘要
本發明公開了一種自動判斷多國語言的實時翻譯系統及其方法,用以解決以往無法自動翻譯內含多國語言的文件的問題,通過將文件內的語句拆解成多個詞匯并判斷各詞匯的語言,以便根據詞匯的前后文的語言進行相應的翻譯調整,藉此達成提高翻譯準確性的技術效果。
文檔編號G06F17/28GK101770456SQ200910001210
公開日2010年7月7日 申請日期2009年1月4日 優先權日2009年1月4日
發明者周韜, 邱全成 申請人:英業達股份有限公司