用于在使用動態話音數據庫的飛機駕駛艙中校正口音誘導話音的系統和方法
【技術領域】
[0001]本文公開的實施例一般地涉及語言通信的處理,并且更特別地,涉及用于降低空對地、地對空以及空對空通信中的口音誘導異常的話音傳輸系統。
【背景技術】
[0002]眾所周知,人類話音正逐漸被用作輸入數據以電子地進行交易、發送和接收信息,以及提供命令和控制。鑒于以上情況,同樣已知的是,航線以及航空電子工業在全球環境中運行,其中多方經常必須通過不是他們主要的語言或母語的語言進行語言通信。通信的準確度取決于每個講話者清晰發出他或她說出的每個單詞的有多好,這可以取決于他或她是否帶有口音講話,以及帶有口音講話的程度。如果講話者的口音很重,諸如相鄰飛機、空中交通控制(ATC)以及降落或起飛飛機等之間的通信可能會成問題。事實上,大約百分之六十五的國際飛行的飛行員報告由于空中交通控制者講英語時的口音導致與ATC通信的困難。
[0003]盡管百分之七十五的通信者使用ICAO(國際民航組織)標準措辭,但是該問題廣泛存在于許多國家的控制者當中。因此,翻譯并不是問題。相反,問題與口音、音高、發音以及比特率有關。這類通信問題削弱了飛行員理解并遵從指令的能力,從而顯著要求更多的努力以及注意力。
[0004]話音識別始終特定于講話者的語言,而講話者語言的發音從一個地區到另一地區并不是標準化的,即使跨國度也是如此。例如,基于音韻、詞法以及特定的句法特征,北美英語能夠被分為若干地區方言。也就是說,北美英語包括美式英語,其本身包括多個地區變體。因此,飛越不同地區的長途飛行上的飛行員可能與采用基于特定地區的語音以及詞法變量的口音講話的空中交通控制者交互,從而增加了飛行員的工作負擔。
[0005]考慮以上內容,將期望在飛機正飛經地區中與飛機通信期間提供一種自動補償地區方言的自適應話音接口。還將期望提供一種自適應話音接口,該話音接口使用為飛機正飛經的獨特地理地區裁剪的聲學模型。
【發明內容】
[0006]提供本概述來以簡要形式介紹概念選擇,下文在詳細描述中進一步描述概念選擇。本概述并不意圖標識所要求保護的主題的關鍵特征或必要特征,也不意圖用作確定所要求保護的主題的范圍的輔助。
[0007]根據實施例,提供了一種在飛機上識別話音的方法,所述方法補償由至少第一和第二獨特的地理地區組成的區域上的不同地區方言。所述方法包括:使用代表第一獨特地理地區中話音的話音數據特性來分析第一獨特地理地區中的話音;檢測從第一獨特地理地區到第二地理地區的位置變化;以及在檢測到飛機已經從第一獨特地理地區轉移到第二獨特地理地區時,使用代表第二獨特地理地區中話音的話音數據特性來分析第二獨特地理地區中的話音。
[0008]還提供了一種用于在飛機上識別話音的飛行甲板系統,其補償由至少第一和第二獨特地理地區組成的區域的不同地區方言。該系統包括話音數據的第一源和話音數據的第二源,話音數據的第一源表示具有第一獨特地理地區中的話音特性的第一話音數據庫,話音數據的第二源表示具有第二獨特地理地區中的話音特性的第二話音數據庫。處理器被耦合到第一源和第二源,并被配置為使用第一源中的數據處理第一獨特地理地區中的話音,當飛機進入第二獨特地理地區時切換到第二源,并且使用第二源中的數據處理第二獨特地理地區中的話音。
[0009]還提供了一種航空電子話音識別方法,其補償由至少第一獨特地理地區中的初始飛行位置和至少第二與第三獨特地理地區組成的區域的地區方言。該方法包括:用當前飛機位置數據以及代表初始獨特飛機位置和至少第一與第二附加獨特地理地區中的話音特性的話音數據來初始化話音識別系統;以及使用與初始獨特地理地區相關聯的話音數據來處理在初始獨特地理地區中的話音,當飛機從初始獨特地理地區轉移到第二獨特地理地區時,使用與第二獨特地理地區相關聯的話音數據來處理在第二獨特地理地區中的話音,以及當飛機從第二獨特地理地區轉移到第三獨特地理地區時,使用與第三獨特地理地區相關聯的話音數據來處理在第三地理地區中的話音。
[0010]提供本概述來以簡要形式介紹概念選擇,下文在詳細描述中進一步描述概念選擇。本概述并不意圖標識所要求保護的主題的關鍵特征或必要特征,也不意圖用作確定所要求保護的主題的范圍的輔助。
【附圖說明】
[0011]當結合附圖考慮時,參照詳細描述和權利要求書可以得到更為完整的對主題的理解,在圖中類似的附圖標記貫穿附圖指代類似元件。
[0012]圖1為根據不例性實施例的表不聲學映射結構的表;
[0013]圖2是根據示例性實施例自動補償地區方言的自適應話音接口的框圖;
[0014]圖3是圖示適于在飛行甲板通信以及顯示系統中用于識別話音的方法的示例性實施例的流程圖,該方法通過根據飛機正飛經的地理地區而改變話音識別聲學模型來識別話音。
【具體實施方式】
[0015]下面的詳細描述本質上僅為說明性的,并不意圖限制主題的實施例或者這類實施例的應用和使用。如本文使用的,單詞“示例性”意為“作為示例、實例或者說明”。本文描述的作為示例的任何實現并不一定被解釋為比其他實現優選或有利。此外,并不意圖受先前技術領域、【背景技術】、
【發明內容】
或下面的詳細描述中呈現的任何表達或暗示的理論所約束。
[0016]可以在本文中根據功能和/或邏輯塊組件并且參考可以由各個計算組件或設備執行的操作、處理任務和功能的符號表示來描述技術和技藝。這類操作、任務以及功能有時被稱為是計算機執行的、計算機化的、軟件實現的或者計算機實現的。實踐中,通過操縱系統存儲器中存儲位置處的表示數據比特的電信號以及其他信號的處理,一個或多個處理器設備能夠執行所描述的操作、任務和功能。數據比特被維持在其中的存儲器位置是具有特定的對應于數據比特的電、磁、光或有機屬性的物理位置。應該明白的是:圖中示出的各個塊組件可以由被配置為執行指定功能的任意數量的硬件、軟件和/或固件組件來實現。例如,系統或組件的實施例可以使用各種集成電路組件,例如,存儲器元件、數字信號處理器元件、邏輯元件、查找表等,它們可以在一個或多個微處理器或其它控制設備的控制下執行各種功能。
[0017]為了簡潔起見,在本文中可能未詳細描述關于圖形和圖像處理、導航、飛行規劃、飛機控制、飛機數據通信系統和某些系統及子系統的其它功能方面(以及某些系統和子系統的單獨操作組件)的常規技術。此外,在包含在本文中的各個圖中示出的連接線旨在表示各個元件之間的示例性的功能關系和/或物理耦合。應該指出的是:許多可替代或附加的功能關系或物理連接可以存在于本主題的實施例中。
[0018]如前陳述的,北美英語包括例如基于以下的若干地區方言:音韻意識(標識并操縱諸如單詞和音節的口語單元的能力);詞法意識(或關于語言的單詞或詞匯,如與它的語法和句法方面所區別開的);以及句法意識(語言中語法正確的句子和短語的形成規則)。
[0019]在航空中,飛行信息地區(FIR)是空域的指定地區,其中提供了飛行信息服務和警告服務(ALRS)。目前,它是世界上在使用的空域的最大常規劃分。大氣的每一部分屬于特定的FIR。單個FIR可以包圍較小國家的空域,而較大國家的空域被細分為多個地區FIR。一些FIR包圍若干國家的領空。海洋空域被劃分為海洋信息地區,并被委任為設定該地區邊界的控制當局。當局間的劃分通過國際民航組織(ICAO)根據國際協議完成。區域控制中心(ACC)是負責控制機場到達和出發之間在高海拔處控制飛機處于空域的特定體(FIR)中的路線的設施。因此,ACC還可被稱為飛行路線交通控制中心。ACC通常接受來自終端控制中心或另一 ACC的交通量,并最終將交通量傳遞到終端控制中心或另一 ACC以進行控制。交通量的傳送由語音通信ATC和飛行員執行。每個FIR地區的地理定義被存儲在FIR數據庫中(圖2中的206)。
[0020]通過使用軟件創建構成每個單詞的聲音的統計表示而制作話音和其文本轉變的音頻記錄,來創建聲學模型。允許單詞由“它們發聲的方式”來定位的語音詞典,即,將每個單詞的常見或語音錯誤拼寫與正確拼寫匹配的詞典。這種詞典使用發音重拼寫來幫助搜索單詞或識別單詞。
[0021]對于每個地區,只有某些聲學模型和它們的關聯語音詞典將遞送高話音識別精確度。因此,本文使用的話音數據庫應包括聲學模型、語音詞典以及語言模型,該語言模型包括由符合FIR/ATC措辭的FIR/ATC控制者能夠說出的所有單詞的統計表示。
[0022]本文描述的實施例設想取決于飛機正飛經的FIR地區而自動改變話音數據庫的自適應話音接口的使用。對于每個FIR,基于組成FIR地區的人員構成來生成話音數據庫。周期地,基于該構成的變化來更新話音數據庫。話音數據庫到飛行信息地區的該映射在本文被稱為FIR聲學映射或FIR聲學關系數據庫。綜合的話音數據庫由用于全世界的FIR聲學映射組成。因此,話音數據庫(圖2中的204)由用于所有FIR地區的聲學模型、語音詞典以及語言模型組成,并且FIR聲學映射將FIR地區與由聲學模型、語音詞典以及語言模型組成的話音數據庫進行相關。
[0023]本文描述的實施例進一步設想:使得話音數據庫204可獲得作為駕駛艙內與圖表、導航數據庫等以非常相同方式可加載的組件。話音數據庫204的修訂可發出以提高精度。還設想,可以使話音數據庫204在覆蓋整個世界或其部分的預訂基礎上是可獲得的,例如由特定航線、包機、或甚至結合私人飛機服務的地理位置。隨著飛機從一個FIR地區轉移到另一地區,飛機中托管的處理器202 (結合圖2被描述)根據FIR聲學映射中定義的規則切換對話音數據庫中的聲學模型、語音詞典以及語言模型的參考,并且將話音屬性自動適配到用于新的FIR地區的話音數據庫。可通過ATC命令來發起聲學映射