一種語音通信系統及其方法
【專利摘要】本發明實施例公開一種語音通信系統及其方法。在一些實施例中,提供一種語音通信系統,該系統包括:第一音頻傳感器,所述第一音頻傳感器用于采集聲音輸入并基于所述聲音輸入產生第一音頻信號,所述第一音頻傳感器放置在紡織結構的第一表面與第二表面之間。在一些實施例中,所述第一音頻傳感器放置在位于所述紡織結構的第一表面和第二表面之間的區域。在一些實施例中,所述第一音頻傳感器放置在位于所述紡織結構的第一表面和第二表面之間的第一通道中。
【專利說明】一種語音通信系統及其方法 【技術領域】
[0001] 本發明涉及通信領域,尤其涉及一種語音通信系統及其方法。具體而言,本發明涉 及利用嵌埋有傳感器的可穿戴設備來提供語音通信系統及其方法。 【【背景技術】】
[0002] 語音控制的技術應用日益普及。例如,移動電話、汽車導航系統等電子設備逐漸可 以通過語音進行控制。更具體來說,例如,通過這種語音控制的技術應用,用戶可以對著麥 克風說出語音指令(例如詞語或短語),電子設備可以接收到語音指令并根據語音指令進行 操作。希望可以為更喜歡免提體驗的用戶,例如正在操作機動車輛、飛行器等的用戶提供這 種語首控制功能。 【
【發明內容】
】
[0003] 本發明提供一種語音通信系統及其方法。在一些實施例中,提供一種語音通信系 統,該系統包括:第一音頻傳感器,所述第一音頻傳感器用于采集聲音輸入并基于所述聲音 輸入產生第一音頻信號,所述第一音頻傳感器放置在紡織結構的第一表面與第二表面之 間。
[0004] 在一些實施例中,所述第一音頻傳感器是裝配在硅晶圓片上的麥克風。
[0005] 在一些實施例中,所述麥克風是微機電系統(MEMS)麥克風。
[0006] 在一些實施例中,所述第一音頻傳感器放置在位于所述紡織結構的第一表面和第 二表面之間的區域。
[0007] 在一些實施例中,所述第一音頻傳感器放置在位于所述紡織結構的第一表面和第 二表面之間的第一通道中。
[0008] 在一些實施例中,所述系統還包括基于聲學輸入產生第二音頻信號的第二音頻傳 感器,所述紡織結構還包括第二通道,并且所述第二音頻傳感器的至少一部分放置在第二 通道中。
[0009] 在一些實施例中,所述第一通道與第二通道平行。
[0010] 在一些實施例中,所述第一音頻傳感器和第二音頻傳感器形成音頻傳感器的差分 子陣。
[0011] 在一些實施例中,所述系統還包括或連接置于獨立設備中基于所述第一音頻信號 和第二音頻信號產生語音信號的處理器。
[0012] 在一些實施例中,所述紡織結構包括多個層。多個層包括第一層和第二層。
[0013] 在一些實施例中,所述第一音頻傳感器和第二音頻傳感器嵌埋在所述紡織結構的 第一層中。
[0014] 在一些實施例中,與所述第一音頻傳感器相連電路的至少一部分嵌埋在所述紡織 結構的第一層中。
[0015] 在一些實施例中,與所述第一音頻傳感器相連電路的至少一部分嵌埋在所述紡織 結構的第二層中。
[0016] 在一些實施例中,所述紡織結構的第一表面與第二表面之間的距離不大于2.5mm。
[0017] 在一些實施例中,所述距離代表紡織結構的最大厚度。
[0018]在一些實施例中,所述處理器還用于:通過合并所述第一音頻信號和第二音頻信 號產生輸出信號;并對輸出信號進行回聲消除。
[0019] 在一些實施例中,所述處理器還用于:構建聲學通路的代表模型;并基于該模型估 計輸出信號的成分。
[0020] 在一些實施例中,所述處理器還用于:對所述第二音頻信號進行延遲以產生延遲 音頻信號;合并所述第一音頻信號和延遲音頻信號以產生輸出信號。 【【附圖說明】】
[0021] 參考下面本發明的詳細描述并結合附圖,將可以更全面地理解本發明的各種目 的、特征和有益效果。附圖中相似的標記表示相似的部分。
[0022] 圖1為本發明實施例中語音通信系統的一個實施例的示意圖;
[0023]圖2A-B為本發明實施例中嵌有傳感器的紡織結構的示意圖;
[0024]圖3為本發明實施例中處理器示意圖;
[0025] 圖4是本發明實施例中波束形成器的一個實施例的示意圖;
[0026] 圖5是本發明實施例中聲學回聲消除器的一個實施例的示意圖;
[0027] 圖6是本發明另一個實施例中聲學回聲消除器的一個實施例的示意圖;
[0028] 圖7是本發明實施例中處理語音通信音頻信號的流程示意圖;
[0029] 圖8是本發明實施例中空間濾波的流程示意圖;
[0030] 圖9是本發明實施例中回聲消除的流程示意圖;
[0031] 圖10是本發明實施例中多通道降噪的流程示意圖;
[0032] 圖11是本發明實施例中嵌埋在可穿戴設備中的音頻傳感器子陣的示意圖;
[0033] 圖12是本發明實施例中語音通信系統的一個實施例示意圖;
[0034] 圖13是本發明實施例中可穿戴設備的截面圖的示意圖;
[0035] 圖14是本發明實施例中可用在可穿戴設備中的紡織結構的示意圖;
[0036]圖15和圖16是本發明實施例中與一個或多個傳感器相連的電路不意圖。 【【具體實施方式】】
[0037] 本發明,根據其各種實施方式,提供了某些用于語音通信的方案,其包括系統及方 法,下面將加以詳細描述。
[0038] 在一些實施例中,所述方案可以提供利用嵌埋有傳感器的可穿戴設備的語音通信 系統。所述可穿戴設備可以是和/或包括任何可以附著在用戶的一個或多個部位的設備。例 如,可穿戴設備可以是和/或包括安全帶、膜片、施工安全護具、可穿戴計算設備、安全帽、安 全帽系帶、頭戴式設備、帶(例如腕帶)等,或它們的任意組合。
[0039] 可穿戴設備可以包括其中可以嵌埋有一個或多個傳感器的一個或多個紡織結構。 舉例來說,紡織結構可以是安全帶等的織帶。嵌入的一個或多個傳感器可以捕捉有關音頻 信號、體溫、脈膊、血壓、心率、呼吸率、心電圖、肌電圖、物體移動的信息、用戶的定位信息 和/或任何其他信息。
[0040]紡織結構可以由任何其中可嵌入傳感器的適當材料制成,例如織物(如織造織物、 非織造織物、導電織物、非導電織物等)、織帶、纖維、紡織品、增強膜、塑料、塑料膜、聚氨酯、 硅橡膠、金屬、陶瓷、玻璃、膜、紙、卡紙、聚合物、聚酯、聚酰亞胺、聚對苯二甲酸乙二醇酯、彈 性材料、壓電材料、碳納米管、仿生材料和/或任何其他可用來制造嵌有傳感器的紡織結構 的適當材料。所述紡織結構可由導電材料(如導電線、導電織物、導電絲、導電纖維等)、非導 電材料(如非導電織物、非導電環氧樹脂等)和/或帶有任何其他導電性的材料制成。
[0041 ] 紡織結構中可嵌有一個或多個傳感器(如麥克風、生物計量傳感器等)。例如,傳感 器可以放置在紡織結構的第一表面和第二表面之間(如朝向機動車輛乘員的安全帶的內表 面、安全帶的外表面等)。在一個更具體的例子中,紡織結構可以包括位于紡織結構的第一 表面和第二表面之間的通道。傳感器和/或其相連電路可以放置在通道中。通道的一個或多 個部分可以是中空的。在另一個更具體的例子中,傳感器和/或其相連電路的一個或多個部 分可以放置在紡織結構的位于第一表面和第二表面之間的區域,使得傳感器及其相連電路 完全嵌入在紡織結構中。這樣,嵌入的傳感器的存在可以不必改變紡織結構的厚度和/或外 觀。紡織結構的厚度仍與無嵌入傳感器時的厚度相同。紡織結構的兩個表面可以都是平滑 的。
[0042] 紡織結構可以具有一個或多個層。各層可以包括一個或多個音頻傳感器、與音頻 傳感器相連的電路和/或任何其他硬件、處理器和/或任何其他適當部分。例如,一個或多個 音頻傳感器及他們的相連電路和/或硬件可以嵌在紡織結構的第一層中。另一個例子是,一 個或多個音頻傳感器可以嵌在紡織結構的第一層中。它們的相連電路的一個或多個部分可 以嵌在紡織結構的一個或多個其他層中(例如第二層、第三層等)。
[0043] 在一些實施例中,紡織結構中可嵌入多個音頻傳感器(如麥克風)以促進語音通 信。音頻傳感器可以排列形成音頻傳感器陣列(本文中也稱為"麥克風陣列")。麥克風陣列 可以包括一個或多個音頻傳感器子陣(本文中也稱為"麥克風子陣")。在一些實施例中,麥 克風子陣可以沿紡織結構的一條或多條縱向線安放。例如,麥克風子陣可以放置在紡織結 構的沿縱向延伸的多個通道中。這些通道可以彼此平行或不平行,可以位于紡織結構的不 同位置。
[0044] 麥克風子陣可以包括嵌在紡織結構中的一個或多個音頻傳感器。在一些實施例 中,麥克風子陣可以包括兩個音頻傳感器(如第一音頻傳感器和第二音頻傳感器),它們可 以形成差分定向麥克風系統。在一些實施例中,第一音頻傳感器和第二音頻傳感器可以沿 紡織結構的橫截面線排列。第一音頻傳感器和第二音頻傳感器可以產生聲學輸入(如包括 相當于用戶語音的成分的輸入信號)的第一音頻信號和第二音頻信號代表。可以對第一音 頻信號和第二音頻信號進行處理以產生具有某些定向特性的麥克風子陣輸出(使用一種或 多種波束形成、空間濾波和/或任何其他適當的技術)。
[0045] 麥克風子陣的輸出可以在沒有麥克風子陣的幾何學信息(如第一麥克風和/或第 二麥克風對于用戶的具體位置)和/或聲源位置(如用戶或用戶嘴巴的位置)的情況下產生, 下面將更詳細地加以描述。這樣,當麥克風子陣的幾何學變化時(例如當用戶位置移動、紡 織結構彎曲時等),可以產生麥克風輸出以實現某些定向特性。
[0046] 在一些實施例中,可以用多個麥克風子陣來產生代表聲學輸入的多個輸出信號。 所述方案可以處理一個或多個輸出信號以產生代表聲學輸入的語音成分(如用戶的聲音) 的語音信號。例如,所述方案可以對一個或多個輸出信號進行回聲消除以減少和/或消除輸 出信號的回聲和/或反饋成分。另一個例子是,所述方案可以對一個或多個輸出信號(如相 當于某些音頻通道的一個或多個輸出信號)進行多通道降噪。再一個例子是,所述方案可以 對一個或多個輸出信號進行殘余噪聲和/或回聲抑制。
[0047] 所述方案還可以處理語音信號以向用戶提供各種不同功能。例如,所述方案可以 分析語音信號以確定語音信號的內容(如使用一種或多種適當的語音識別技術和/或任何 其他信號處理技術)。所述方案接著可以基于經分析的語音信號內容進行一種或多種操作。 例如,所述方案可以基于經分析的內容提供媒體內容(如音頻內容、視頻內容、圖像、文本 等)。更具體地說,例如,所述媒體內容可以涉及地圖、網頁內容、導航信息、新聞、音頻剪輯 和/或任何其他語音信號內容相關的信息。另一個例子是,所述方案可以使用實現了所述方 案的應用軟件和/或任何其他應用軟件為用戶打電話。再一個例子是,所述方案可以基于語 音信號收發信息。還一個例子是,所述方案可以對分析出的內容進行搜索(如向可進行相關 搜索的服務器發送請求)。
[0048] 因此,本發明完整地提供了實現一種可以向用戶提供免提通信體驗的語音通信系 統的方案,。該語音通信系統可以在車輛中得以實現,從而增強用戶的車內體驗。
[0049] 基于檢測到的音頻事件來回放媒體內容的這些和其他特性將在下面結合圖1-16 加以描述。
[0050] 圖1顯示了本發明一些實施例中語音通信系統的一個例子100。
[0051] 如圖1所示,系統100可以包括一個或多個音頻傳感器110、處理器120、控制器130、 通信網絡140和/或任何其他適合用于處理本發明音頻信號的部分。
[0052]音頻傳感器110可以是任何能夠接收聲學輸入、處理聲學輸入、基于聲學輸入產生 一個或多個音頻信號、處理音頻信號和/或進行任何其他適當功能的適當設備。音頻信號可 以包括一個或多個模擬信號和/或數字信號。各音頻傳感器110可以包括或不包括模擬數字 轉換器(ADC)。
[0053]各音頻傳感器110可以是和/或包括任何適當類型的麥克風,如激光麥克風、電容 麥克風、硅元麥克風(如微機電系統(MEMS)麥克風)等或它們的任意組合。在一些實施例中, 硅元麥克風(也稱為麥克風芯片)的制造可以通過直接在硅晶圓中蝕刻出壓敏薄膜而完成。 該制造工藝中的幾何尺寸可以是微米級(如1〇_ 6米)。麥克風芯片的各種電子和/或機械部分 可以集成在芯片中。硅元麥克風的芯片可以包括內置的模擬數字轉換器(ADC)電路和/或任 何其他電路。硅元麥克風可以是和/或包括電容麥克風、光纖麥克風、表面貼裝器件和/或任 何其他類型的麥克風。
[0054] 可以將一個或多個音頻傳感器110嵌埋入可附著在人體一個或多個部位的可穿戴 設備中。可穿戴設備可以是和/或包括安全帶、膜片、施工安全護具、可穿戴計算設備、安全 帽、安全帽系帶、頭戴式設備、帶(例如腕帶)等或它們的任意組合。
[0055]各音頻傳感器110可以具有任何適合嵌在可穿戴設備的紡織結構中的尺寸。例如, 音頻傳感器110的大小(如尺寸)可以使音頻傳感器可以完全嵌入一定厚度(如不大于2.5_ 或任何其他閥值的厚度)的紡織結構中。更具體地說,例如,音頻傳感器可以放置在紡織結 構的第一表面和第二表面之間。
[0056] 例如,可以將一個或多個音頻傳感器110和它們的連接電路嵌埋入紡織結構中,使 音頻傳感器110置于紡織結構的第一表面和第二表面之間。這樣,嵌入的音頻傳感器的存在 可以不必改變紡織結構的厚度和/或外觀。紡織結構的厚度仍與無嵌入傳感器時的厚度相 同。紡織結構的兩個表面可以都是平滑的。更具體來說,例如,可以將一個或多個傳感器嵌 埋在紡織結構的兩個表面之間,沒有任何部件突出于紡織結構的任何部分。在一些實施例 中,音頻傳感器可以按下圖11-16用一種或多種技術嵌入到紡織結構中。
[0057] 音頻傳感器110可以具有各種不同的定向特性。例如,一個或多個音頻傳感器110 可以是定向的,對來自一個或多個具體方向的聲音敏感。更具體來說,例如,音頻傳感器Iio 可以是偶極麥克風、雙向麥克風等或它們的任意組合。另一個例子是,一個或多個音頻傳感 器110可以是非定向的。例如,音頻傳感器110可以是全向麥克風。
[0058] 在一些實施例中,多個音頻傳感器110可以排列成音頻傳感器的陣列(本文也稱為 "麥克風陣列")以促進語音通信。麥克風陣列可以包括音頻傳感器的一個或多個子陣(本文 也稱為"麥克風子陣")。各麥克風子陣可以包括一個或多個音頻傳感器(如麥克風)。麥克風 子陣可以形成指向可穿戴設備用戶(如戴安全帶的車輛乘員)的差分定向麥克風系統。麥克 風子陣可以輸出代表用戶語音的輸出信號。可以對一個或多個麥克風子陣產生的一個或多 個輸出信號加以合并、處理等以產生代表用戶語音和/或用戶提供的任何其他聲學輸入的 語音信號,下面將會詳細描述。在一些實施例中,麥克風陣列的多個音頻傳感器可以嵌埋入 紡織結構(如放在紡織結構的第一表面和第二表面之間)中,下面也會進行詳細描述。
[0059] 處理器120和/或任何其他設備可以處理語音信號以實現一種或多種語音控制的 技術應用。例如,處理器120可以分析語音信號以識別語音信號的內容。更具體地說,例如, 可以用任何適當的語音識別技術來識別用戶所說的一個或多個關鍵詞、短語等。處理器120 接著可以根據識別的內容來執行一種或多種操作(例如通過產生一個或多個執行操作的指 令、通過執行操作、通過提供可用于執行操作的信息等)。例如,處理器120可以將媒體內容 (如音頻內容、視頻內容、文本、圖像等)在顯示裝置上顯示給用戶。媒體內容可能涉及地圖、 網頁內容、導航信息、新聞、音頻片段和/或任何其他有關語音信號內容的信息。另一個例子 是,處理器120可以基于語音信號的內容進行搜索(如通過向服務器發送請求來搜索識別的 關鍵詞和/或短語,通過控制另一個裝置和/或技術應用來發送請求等)。
[0060] 處理器120可以是任何能夠對音頻信號進行接收、處理和/或進行任何其他適當功 能的適當設備。例如,處理器120能接收來自一個或多個麥克風子陣和/或任何其他能夠產 生音頻信號的適當設備的音頻信號。處理器120接著能夠對音頻信號進行空間濾波、回聲消 除、降噪、噪音和/或回聲抑制、和/或任何其他適當的操作以產生語音信號。
[0061] 處理器120可以是和/或包括任何計算機等通用設備或者客戶端、服務器等專用設 備。這些通用或專用設備可以包括任何適當的部分,如硬件處理器(其可以是微處理器、數 字信號處理器、控制器等)、存儲器、通信接口、顯示控制器、輸入設備、存儲設備(其可以包 括硬盤驅動器、數字錄像機、固態存儲設備、可移動存儲設備或任何其他適當的存儲設備) 等。
[0062] 在一些實施例中,處理器120可以是和/或包括圖3所示的處理器。在一些實施例 中,處理器120可以執行一種或多種操作和/或實現下圖7-10所示的一種或多種處理進程 700-1000。
[0063]可以配置控制器130來控制系統100的一個或多個部分的各種功能和操作。控制器 130可以是單獨的控制設備(如控制電路、轉換器等)、控制總線、移動設備(如移動電話、平 板電腦設備等)等或它們的任意組合。在一些實施例中,控制器130可以提供一個或多個用 戶界面(圖1未示出)來獲得用戶指令。在一些實施例中,可以根據不同條件,例如車輛速度、 環境噪聲、用戶特性(如用戶歷史數據、用戶設置)、空間特性等或它們的任意組合來用控制 器130選擇一個或多個子陣、一種或多種處理方法。
[0064] 在一些實施例中,處理器120可以分別通過通信線路151和153與音頻傳感器110和 控制器130通信連接。在一些實施例中,各音頻傳感器110、處理器120和控制器130可以分別 通過通信線路155、157和159與通信網絡140連接。通信線路151、153、155、157和159可以是 和/或包括任何適當的通信線路,如網絡線路、撥號線路、無線線路、藍牙?線路、硬接線線 路、任何其他適當的通信線路或這些線路的組合。
[0065]通信網絡140可以是任何適當的計算機網絡,包括互聯網、內聯網、廣域網 ("WAN")、局域網("LAN")、無線網、數字用戶線路("DSL")網、幀中繼網、異步傳輸模式 ("ATM")網、虛擬專用網("VPN")、有線電視網、光纖網、電話網、衛星網或這些網絡的任意組 合。
[0066] 在一些實施例中,音頻傳感器110、處理器120和控制器130可以通過通信網絡140 彼此通信。例如,音頻信號可以通過通信網絡140由音頻傳感器110傳輸至處理器120以進一 步處理。另一個例子是,控制信號可以通過通信網絡140由控制器130傳輸至一個或多個音 頻傳感器110和處理器120。
[0067] 在一些實施例中,各音頻傳感器110、處理器120和控制器130可以實現于一個獨立 的設備或是與系統100的其他組件集成。
[0068] 在一些實施例中,系統100的各部分可以在一個或多個設備中實現。例如,系統100 的一個或多個音頻傳感器110、處理器120和/或控制器130可以嵌埋入一個可穿戴設備(如 安全帶、膜片等)中。另一個例子是,音頻傳感器110可以嵌入一個可穿戴設備中,而一個或 多個處理器120和控制器130可以置于另一個設備(如獨立的處理器、移動電話、服務器、平 板電腦等)中。
[0069] 在一些實施例中,系統100也可以包括一個或多個生物傳感器,其能夠檢測用戶的 心率、呼吸率、脈搏、血壓、體溫、呼出氣體中酒精含量、指紋、心電圖、肌電圖、位置和/或任 何其他用戶信息之一。系統100可以用作智能控制設備的一部分。例如,如圖13B所示(未見 圖13B),可以根據系統100接收到的語音信號等或其任意組合發出一個或多個控制指令。在 一個實施例中,所述語音信號可以由系統100獲得,可以控制移動電話來進行一項或多項功 能(如開/關機、在通訊錄中搜索名字并打電話、編寫信息等)。在另一個實施例中,呼出氣體 中酒精含量可以由系統100獲得,并且當獲得的酒精含量超過閾值(如高于20mg/100ml、 80mg/100ml等)時車輛可以被鎖定。在還一個實施例中,用戶的心率或任何其他生物計量參 數可以由系統100獲得,并且可以發出警示。在一些實施例中,警示可以被發送至另一個用 戶(例如服務器、健康護理提供者的移動電話等)。
[0070] 圖2A顯示了本發明一些實施例中嵌埋有音頻傳感器的紡織結構的例子200。紡織 結構200可以是可穿戴設備的一部分。
[0071] 如圖所示,紡織結構200可以包括一個或多個層(如層202a、202b、202n等)。雖然圖 2A中顯示了3層,但這僅僅是示意性的。紡織結構200可以包括任何適當的層數(如1層、2層 等)。
[0072]各層202a_n可以被視為其中可以嵌入音頻傳感器、與音頻傳感器相連的電路和/ 或任何其他硬件等的紡織結構。如圖2A所示,層202a-n可以沿煒度方向排列。
[0073]紡織結構200和/或各層202a_n可以由任何適當的材料制成,例如織物(如織造織 物、非織造織物、導電織物、非導電織物等)、織帶、纖維、紡織品、增強膜、塑料、塑料膜、聚氨 酯、硅橡膠、金屬、陶瓷、玻璃、膜、紙、卡紙、聚合物、聚酯、聚酰亞胺、聚對苯二甲酸乙二醇 酯、彈性材料、壓電材料、碳納米管、仿生材料和/或任何其他可用來制造嵌有傳感器的紡織 結構的適當材料。紡織結構200和/或各層202a-n可由導電材料(如導電線、導電織物、導電 絲、導電纖維等)、非導電材料(如非導電織物、非導電環氧樹脂等)和/或帶有任何其他導電 性的材料制成。在一些實施例中,基底200的多個層可以由相同或不同的材料制成。層202a-n的顏色、形狀、密度、彈性、厚度、導電性、導熱性、透氣性和/或任何其他特性可以相同或不 同。
[0074]各層202a_n可以具有任何適當的尺寸(如長度、寬度、厚度(如高度)等)。紡織結構 200的多個層可以具有相同或不同的尺寸。例如,層202a、202b和202η的厚度可以分別為 204a、204b和204η。厚度204a、204b和204η可以彼此相同或不同。在一些實施例中,紡織結構 200的一個或多個層可以具有一定厚度。例如,紡織結構200的所有層的厚度(例如厚度 204a_n之和)可以小于或等于一定厚度(如2.5mm、2.4mm、2mm、3mm、4mm和/或任何其他厚度 值)。另一個例子是,紡織結構200的具體層的厚度可以小于或等于一定厚度(如2.5mm、 2.4111111、2111111、3111111、41111]1和/或任何其他厚度值)。
[0075]在一些實施例中,紡織結構的層的厚度可以用該層的第一表面與該層的第二表面 之間的距離來度量(如厚度204a、204b和204η等)。所述層的第一表面可以與第二表面平行 或不平行。所述層的厚度可以是該層的第一表面與第二表面之間的最大距離(本文也稱為 "最大厚度")。所述層的厚度也可以是該層的第一表面與第二表面之間的任何其他距離。 [0076]類似地,紡織結構的厚度可以用該紡織結構的第一表面與該紡織結構的第二表面 之間的距離來度量。所述紡織結構的第一表面可以與第二表面平行或不平行。所述紡織結 構的厚度可以是該紡織結構的第一表面與第二表面之間的最大距離(本文也稱為"最大厚 度")。所述紡織結構的厚度也可以是該紡織結構的第一表面與第二表面之間的任何其他距 離。
[0077]紡織結構200可以是任何適當的可穿戴設備的一部分,譬如安全帶、施工安全護 具、可穿戴計算設備、安全帽、安全帽系帶、頭戴式設備、帶(例如腕帶)、服裝、軍用服裝等。 在一些實施例中,紡織結構200可以是和/或包括安全帶織帶。
[0078]各層202a_n可以包括一個或多個音頻傳感器、與音頻傳感器相連的電路和/或任 何其他硬件、處理器和/或任何其他適合用于提供可穿戴設備的通信系統的部件。例如,一 個或多個音頻傳感器及它們的連接電路和/或硬件可以嵌在紡織結構200的一個層中。另一 個例子是,一個或多個音頻傳感器可以嵌在紡織結構200的一個特定層中(如第一層)。它們 的連接電路的一個或多個部分可以嵌入紡織結構200的一個或多個其他層中(如第二層、第 三層等)。在一些實施例中,各層202a-n可以是和/或包括圖2B和11-14所示的一個或多個紡 織結構。
[0079] 在一些實施例中,嵌在紡織結構200的一個或多個層中的多個音頻傳感器可以形 成音頻傳感器的一個或多個陣列(如麥克風陣列),各個陣列可以進一步包括音頻傳感器的 一個或多個子陣(如麥克風子陣)。例如,麥克風陣列和/或麥克風子陣可以由嵌在紡織結構 200的特定層中的音頻傳感器形成。另一個例子是,麥克風陣列和/或麥克風子陣可以由嵌 在紡織結構200的多個層中的音頻傳感器形成。在一些實施例中,多個音頻傳感器可以如圖 2B和11-14所示排列在紡織結構200的一個或多個層中。
[0080] 在一些實施例中,層202a-n的一個或多個層可以包括其中可以嵌入音頻傳感器、 音頻傳感器的連接電路、處理器等的一個或多個通道(如通道206a、206b、206η等)。例如,各 通道可以是和/或包括圖2Β的通道201a-g、圖11的通道1101a-e、圖13的通道1310、圖14的通 道1411和1421中的一個或多個。作為替代方案或者補充方案,一個或多個音頻傳感器、與音 頻傳感器相連的電路和/或任何其他硬件(如電極、導線等)等可以集成在紡織結構200的一 個或多個部分。
[0081 ]圖2B顯示了本發明一些實施例中嵌有傳感器的紡織結構的例子210、220、230和 240。各紡織結構210、220、230和240可以代表可穿戴設備的一部分。例如,各紡織結構210、 220、230和240可以包括在圖2A所示的紡織結構的一層中。另一個例子是,兩個或更多個紡 織結構210、220、230和240可以包括在圖2A所示的紡織結構的一層中。作為替代方案或者補 充方案,紡織結構210、220、230和240可以用在多個可穿戴設備中。
[0082] 各紡織結構210、220、230和240可以包括一個或多個通道(例如通道201a、201b、 201(:、201(1、2016、2016、201€和2018)。根據本發明的一些實施例,各通道可以包括一個或多 個音頻傳感器(如音頻傳感器203a-p)、與音頻傳感器相連的電路和/或任何其他硬件、和/ 或任何其他適當的部分。各音頻傳感器203a-p可以是和/或包括圖1所示的音頻傳感器110。 [0083]在一些實施例中,一個或多個通道201a_g可以沿紡織結構縱向延伸。或者,各通道 210a_g可以沿任何其他適當方向排列。
[0084]紡織結構中的多個通道可以按任何適當的方式排列。例如,位于紡織結構中的多 個通道(如通道201b-c、通道201d-e、通道201f-g等)可以彼此平行或不平行。另一個例子 是,紡織結構中的多個通道(如通道201b-c、通道201d-e、通道201f-g等)的起始端和末端可 以相同或不同。還一個例子是,紡織結構中的多個通道可以具有相同或不同的尺寸(如長 度、寬度、高度(即厚度)、形狀等)。各通道201a-g可以具有任何適當的形狀,例如弧形、矩 形、橢圓形等或它們的任意組合。通道201a-g的空間結構可以包括,但不限于:長方體、圓柱 體、橢圓體等或它們的任意組合。多個通道的形狀和空間結構可以相同或不同。各通道 201a_g的一個或多個部分可以是中空的。在一些實施例中,各通道201a_g可以是和/或包括 圖11所示的通道ll〇la-e。各通道201a_g也可以是和/或包括圖14所示的通道1411和/或 1412〇
[0085] 盡管例子220、230和240中顯示了兩個通道,但這僅僅是示意性的。各紡織結構可 以包括任何適當數目的通道(如〇、1、2等)。
[0086]如圖所示,各音頻傳感器203a_p可以放置在通道中。與一個或多個音頻傳感器連 接的一個或多個電路(如圖12-16所示的電路)也可以放置在通道中。在一些實施例中,音頻 傳感器203可以在通道201的縱向線上。在另一個實施例中,音頻傳感器203可以在通道201 的不同線上。在一些實施例中,一排或多排音頻傳感器203可以置于一個通道201中。音頻傳 感器203可以置于帶有或不帶凸起部分的紡織結構的通道201中。例如,在一些實施例中,音 頻傳感器203和/或它們的連接電路不突出于紡織結構。
[0087]在一些實施例中,通道201的數目和音頻傳感器203的排列方式可以相同或不同。 在210中,通道201可以制在紡織結構中并可以在通道201中安置一個或多個音頻傳感器。音 頻傳感器203的輸出可以合并以產生音頻信號。在例子220、230和240中,多個通道201可以 制在紡織結構中并可以在各通道201中安置一個或多個音頻傳感器。相鄰的多個通道201的 間距可以相同或不同。在220中,音頻傳感器可以位于平行的橫向線上。橫向線可以垂直于 縱向線。之后音頻傳感器可以用于形成一個或多個差分定向音頻傳感器子陣。一個或多個 差分定向音頻傳感器子陣的輸出可以合并以產生音頻信號。例如,音頻傳感器203b和203c 可以形成差分定向音頻傳感器子陣。音頻傳感器203d和音頻傳感器203e可以形成差分定向 音頻傳感器子陣。音頻傳感器203f和音頻傳感器203g可以形成差分定向音頻傳感器子陣。 [0088]在230中,音頻傳感器203可位于平行的橫向線和其他線上。位于平行橫向線上的 音頻傳感器203可用于形成一個或多個差分定向音頻傳感器子陣。一個或多個差分定向音 頻傳感器子陣的輸出可以合并以產生音頻信號。例如,音頻傳感器203h和音頻傳感器203i 可以形成差分定向音頻傳感器子陣。音頻傳感器203j和203k可以形成差分定向音頻傳感器 子陣。音頻傳感器203m和203η可以形成差分定向音頻傳感器子陣。在一些實施例中,在240 中,一個或多個音頻傳感器203可以無規排列且位于多條橫向線上。音頻傳感器203的輸出 可以合并以產生音頻信號。
[0089]圖3顯示了本發明一些實施例中處理器的例子300。如圖所示,處理器300可以包括 I/O模塊310、空間濾波模塊320、回聲消除模塊330、降噪模塊340和/或任何其他適當的處理 本發明各種實施例的音頻信號的部分。處理器300也可以包括更多或更少的部分而不失普 遍性。例如,兩個模塊可以合并在一個模塊中,或者一個模塊可以分成兩個或更多個模塊。 在一種實施方式中,一個或多個模塊可以存在不同的電腦設備(如不同的服務器電腦)中。 在一些實施例中,圖3的處理器300可以與圖1的處理器120相同。
[0090] I/O模塊310可以用于不同的控制技術應用中。例如,I/O模塊310可以包括接收來 自電子設備(如音頻傳感器、壓力傳感器、光電傳感器、電流傳感器等或它們的任意組合)的 信號的電路。在一些實施例中,I/O模塊310可以將接收到的信號或任何其他信號(如得自一 個或多個接收到的信號的信號或者與一個或多個接收到的信號有關的信號)傳輸至系統 300的其他模塊(如通過通信線路傳輸至空間濾波模塊320、回聲消除模塊330和降噪模塊 340)。在其他一些實施例中,I/O模塊310可以將處理器300的一個或多個部分產生的信號傳 輸至任何其他設備以進一步處理。在一些實施例中,I/O模塊310可以包括可以將模擬信號 轉換成數字信號的模擬數字轉換器(圖3未示出)。
[0091 ] 空間濾波模塊320可以包括一個或多個波束形成器322、低通濾波器324和/或任何 其他適當的對音頻信號進行空間濾波的部分。波束形成器322可以合并子陣的不同音頻傳 感器接收到的音頻信號。例如,波束形成器322可以對來自不同方向的信號做出不同的響 應。可以允許來自特定方向的信號通過波束形成器322,而來自其他方向的信號則可以被抑 制。由波束形成器322區分的信號方向可以由以下的信息而確定:例如,基于構成波束形成 器322的麥克風陣列和/或麥克風子陣的音頻傳感器的幾何信息、音頻傳感器的數量、源信 號的位置信息、和/或任何其他可能與信號的方向性有關的信息等。在一些實施例中,波束 形成器322可以包括圖4的一個或多個波束形成器400和/或波束形成器400的一個或多個部 分。如下面將就圖4進行討論的,波束形成器322可以不參考音頻傳感器的幾何信息(如音頻 傳感器的位置、音頻傳感器之間的距離等)和源信號的位置來形成波束。
[0092]低通濾波器324可以減輕與使用波束形成器有關的失真。在一些實施例中,低通濾 波器324可以除去波束形成器322產生的音頻信號的失真成分。例如,失真成分可以通過平 衡失真(例如由音頻傳感器的子陣構成、音頻傳感器的數量、信號的源位置等或它們的任意 組合引起的失真)來除去。
[0093]如圖3所示,處理器300也可以包括回聲消除模塊330,其可以除去輸入音頻信號 (如I/O模塊310、空間濾波模塊320或任何其他設備產生的信號)中所含的回聲和/或反饋成 分(本文也稱為"回聲成分")。例如,回聲消除模塊330可以估計輸入音頻信號中所含的回聲 成分,并可以從輸入音頻信號中除去回聲成分(例如通過從輸入音頻信號中減去估計的回 聲成分)。輸入音頻信號的回聲成分可以表不由于聲學環境中的音頻傳感器(如麥克風)和 一個或多個揚聲器之間缺乏合適的隔音而產生的回聲。例如,麥克風產生的音頻信號可以 含有分別來自遠端語音和近端音頻(如指令或來自信息娛樂子系統的音頻信號)的回聲和 反饋成分。這些回聲和/或反饋成分可以由一個或多個揚聲器回放來產生聲學回聲。
[0094]在一些實施例中,回聲消除模塊330可以包括聲學回聲消除器332、雙端發聲檢測 器334和/或任何其他適當的對音頻信號進行回聲和/或反饋消除的部分。
[0095]在一些實施例中,聲學回聲消除器332可以估計輸入音頻信號的回聲成分。例如, 聲學回聲消除器332可以構建產生回聲成分的聲學通路的代表模型。聲學回聲消除器332接 著可以基于該模型估計回聲成分。在一些實施例中,聲學通路可以用自適應算法,如歸一化 最小均方(NLMS)算法、仿射投影(AP)算法、頻域LMS (FLMS)算法等來建模。在一些實施例中, 聲學通路可以由濾波器,如帶有限脈沖響應(FIR)的自適應濾波器來建模。自適應濾波器可 以如下圖5和6所示構建。
[0096]雙端發聲檢測器334可以進行雙端發聲檢測并基于這種檢測指導回聲消除。雙端 發聲可以發生在回聲消除模塊330同時或實質上同時接收到多個談話者語音的多個代表信 號時。通過檢測雙端發聲的出現,雙端發聲檢測器334可以暫停或減慢由聲學回聲消除器 332構建的自適應濾波器。
[0097] 在一些實施例中,雙端發聲檢測器334可以基于一個或多個揚聲器信號和一個或 多個音頻傳感器產生的輸出信號之間的相關性信息來檢測雙端發聲的出現。例如,可以基 于能量比測試、類似統計學的交互關聯或相關性等或它們的任意組合來檢測雙端發聲的出 現。雙端發聲檢測器334也可以提供有關揚聲器信號和麥克風信號與聲學回聲消除器332相 關性的信息。在一些實施例中,可以基于該信息暫停或減慢由聲學回聲消除器332構建的自 適應濾波器。圖5和6將更詳細地討論回聲消除模塊330進行的各種功能。
[0098]降噪模塊340可以對輸入音頻信號,如一個或多個音頻傳感器、I/O模塊310、空間 濾波模塊320、回聲消除模塊330和/或任何其他設備產生的音頻信號進行降噪。如圖3所示, 降噪模塊340可以包括通道選擇單元342、多通道降噪(MNR)單元344、殘余噪聲和回聲抑制 單元346和/或任何其他適當的用來降噪的部分。
[0099] 通道選擇單元342可以選擇一個或多個音頻通道進一步處理。這些音頻通道可以 相應于多個音頻傳感器(例如一個或多個麥克風陣列、麥克風子陣等)的輸出。在一些實施 例中,可以基于音頻通道提供的音頻信號的質量選擇一個或多個音頻通道。例如,可以基于 音頻通道提供的音頻信號的信噪比(SNR)來選擇一個或多個音頻通道。更具體地說,例如, 通道選擇單元342可以選擇一個或多個與具體質量(如具體SNR,如最高的SNR、前三個SNR、 高于閥值的SNR等)相關的音頻通道。
[0100] 通過選擇音頻通道,通道選擇單元342可以向多通道降噪(MCNR)單元344提供有關 選擇的信息、選擇的音頻通道提供的音頻信號和/或任何其他信息以進一步處理。之后MCNR 單元344可以對選擇的音頻通道提供的音頻信號進行降噪。
[0101] MCNR單元344可以接收來自通道選擇單元342、I/O模塊310、空間濾波模塊320、回 聲消除模塊330、一個或多個音頻傳感器、和/或任何其他設備的一個或多個輸入音頻信號。 MCNR單元344接收到的輸入音頻信號可以包括語音成分、噪音成分和/或任何其他成分。語 音信號可以相應于希望的語音信號(如用戶的聲音、任何其他聲學輸入和/或任何其他希望 的信號)。噪音成分可以對應于環境噪音、回路噪音和/或任何其他類型的噪音。MCNR單元 344可以對輸入音頻信號進行處理以產生語音信號(如通過估計語音成分和/或噪音成分的 統計學信息)。例如,MCNR單元344可以構建一個或多個降噪濾波器并可以將降噪濾波器應 用于輸入音頻信號,以產生語音信號和/或降噪信號。類似地,也可以構建一個或多個降噪 濾波器以處理相應于多個音頻通道的多個輸入音頻信號。可以構建一個或多個這些降噪濾 波器用于單通道降噪和/或多通道降噪。降噪濾波器可以基于一種或多種濾波技術構建,例 如經典的Wiener濾波、梳狀濾波技術(采用線性濾波器,僅使來自基因周期的語音的諧波部 分通過)、語音的線性全極點和零極點模型(例如通過估計來自帶噪語音的語音成分的系 數)、隱式馬爾科夫模型等。在一些實施例中,可以通過進行圖10所示的一種或多種操作來 構建一個或多個降噪濾波器。
[0102] 在一些實施例中,MCNR單元344可以在沉默段估計和追蹤噪音的統計數據。當語音 信號出現時,MCNR單元344可以使用估計的信息來抑制噪音成分。在一些實施例中,MCNR單 元344可以在較少甚至沒有語音失真的情況下實現降噪。MCNR單元344可以處理多個音頻傳 感器的輸出信號。多個音頻傳感器的輸出信號可以被分解為來自未知源的成分、噪音成分 和/或任何其他成分。在一些實施例中,MCNR單元344可以估算來自未知源的成分。MCNR單元 344之后可以基于來自未知源的成分和相應的估計過程產生誤差信號。MCNR單元344可以接 著根據誤差信號產生降噪信號。
[0103] 在一些實施例中,可以基于一個或多個其他音頻通道提供的音頻信號的統計數據 對音頻通道進行降噪。作為替代方案或者補充方案,可以使用單通道降噪方式對各音頻通 道進行降噪。
[0104] 由MCNR單元344產生的語音信號可傳輸至殘余噪聲和回聲抑制單元346以進一步 處理。例如,殘余噪聲和回聲抑制單元346可以抑制語音信號中包含的殘余噪聲和/或回聲 (例如任何未被回聲MCNR344和/或回聲消除模塊330除去的噪聲和/或回聲成分)。圖10中將 更詳細地討論降噪模塊340執行的各種功能。
[0105] 本說明書僅用于對本發明進行描述,并非限定權利要求的范圍,其多種變化、變動 和修改對本領域技術人員來說是顯而易見的。本說明書中描述的示例性實施例的特征、結 構、方法和其他特性可以多種方式組合而獲得補充性和/或替代性的示例實施例。例如,回 聲消除模塊330中可以有線路回聲消除器(圖3未示出)以消除線路回聲。另一個例子是,聲 學回聲消除器334可以具有消除線路回聲的功能。
[0106]圖4的示意圖顯示了本發明一些實施例中波束形成器的一個例子400。在一些實施 例中,波束形成器400可以與圖3中所示的波束形成器322相同。
[0107] 在一些實施例中,麥克風子陣450可以包括音頻傳感器410和420。各音頻傳感器 410和420可以是全向麥克風或具有任何其他適當的定向特性。可以放置音頻傳感器410和 420以形成差分波束形成器(如固定差分波束形成器、自適應差分波束形成器、一階差分波 束形成器、二階差分波束形成器等)。在一些實施例中,音頻傳感器410和420可以按某一距 離(如相對于沖擊聲波的波長較小的距離)排列。音頻傳感器410和420可以如圖2A-B所示形 成麥克風子陣。各音頻傳感器410和420可以是和/或包括圖1的音頻傳感器110。
[0108] 軸405是麥克風子陣450的軸。例如,軸405可以表示連接音頻傳感器410和420的 線。例如,軸405可以連接音頻傳感器410和420的幾何中心和/或音頻傳感器410和420的任 何其他部分。
[0109] 音頻傳感器410和音頻傳感器420可以接收聲波407。在一些實施例中,聲波407可 以是沖擊平面波、非平面波(如球面波、柱面波等)等。各音頻傳感器410和420可以產生代表 聲波407的音頻信號。例如,音頻傳感器410和420可以分別產生第一音頻信號和第二音頻信 號。
[0110] 延遲模塊430可以基于第一音頻信號和/或第二音頻信號產生延遲音頻信號。例 如,延遲模塊430可以通過對第二音頻信號施加時間延遲產生延遲音頻信號。時間延遲可以 使用線性算法、非線性算法和/或任何其他適當的可用于產生延遲音頻信號的算法來確定。 可以基于聲波在音頻傳感器410和420之間軸向行進的傳播時間來對時間延遲進行調節,以 實現各種不同的定向性響應,下文將會加以詳述。
[0111]合并模塊440可以合并第一音頻信號(如音頻傳感器410產生的音頻信號)和延遲 模塊430產生的延遲音頻信號。例如,合并模塊440可以以正負交替的方式(alternating sign fashion)合并第一音頻信號和延遲音頻信號。在一些實施例中,合并模塊440可以用 近場模型、遠場模型、和/或任何其他可以用于合并多個音頻信號的模型來合并第一音頻信 號和延遲音頻信號。例如,兩個傳感器可以形成近場波束形成器。在一些實施例中,合并模 塊440所用的算法可以是線性算法、非線性算法、實時算法、非實時算法、時域算法或頻域算 法等或它們的任意組合。在一些實施例中,合并模塊440所用的算法可以基于一種或多種波 束形成或空間濾波技術,例如,基于兩步時延估計(TDOA)的算法、一步時延估計、基于可控 波束的算法、基于獨立成分分析的算法、延遲疊加(DAS)算法、最小方差無畸變響應(MVDR) 算法、廣義旁瓣抵消器(GSC)算法、最小均方誤差(MMSE)等或它們的任意組合。
[0112]在一些實施例中,音頻傳感器410和420可以形成固定的一階差分波束形成器。更 具體來說,例如,所述一階差分波束形成器的(空間)靈敏度與包括最高是第一階的聲壓場 空間導數值成正比。對于入射在麥克風子陣450上的振幅為So、角頻率為ω的平面波來說, 合并模塊440的輸出可以用下式表示:
[0113] Χ(ω,0)=S〇 · [1-e-j-+d.cos0/c)]· (I)
[0114] 式(I)中d表示麥克風間距(如音頻傳感器410和420之間的距離),c表示聲速,Θ表 示聲波407相對于軸405的入射角,τ表示用于麥克風子陣中的一個音頻傳感器的時間延遲。
[0115] 在一些實施例中,音頻傳感器間距d可以較小(如滿足ω · d/c<<Ji且ω · τ<<π 的值)。合并模塊440的輸出可以表不為:
[0116] Χ( ω ,0)^S〇 · ω (τ+d/c · cosB) (2)
[0117] 如式(2)所示,合并模塊440不必參考音頻傳感器410和420的幾何信息以產生輸出 信號。式(2)括號中的項可以包含麥克風子陣的定向響應。
[0118] 在一些實施例中,麥克風子陣可能具有一階高通頻率依賴性。因此,直接到達軸 405(如θ = 〇°)的所希望的信號S(jco)會失真,失真系數為ω。該失真可以用低通濾波器來 減輕和/或消除(如通過均衡合并模塊440產生的輸出信號)。在一些實施例中,低通濾波器 可以是匹配低通濾波器。一個更具體的例子是,低通濾波器可以是一階遞歸低通濾波器。在 一些實施例中,低通濾波器可以是和/或包括圖3的低通濾波器324。
[0119] 在一些實施例中,合并模塊440可以基于聲波在子陣的兩個音頻傳感器之間軸向 行進的傳播時間(如數值d/c)來調節時間延遲τ。更具體地說,例如數值τ可以與數值d/c成 比例(如τ的值可以為0、d/c、d/3c、等)。在一些實施例中,時間延遲τ可以在例如0至 數值d/c之間的范圍內調節以實現不同的定向性響應。例如,可以調節時間延遲以使麥克風 子陣響應的最小值在90°和180°之間變化。在一些實施例中,向音頻傳感器420施加的時間 延遲τ可以用下式確定:
[0120] T - - COS ? (2.1 V' C .. "
[0121] 作為替代方案或者補充方案,延遲時間τ可以用下式計算:
[0122] τ - (2 JV € .
[0123] 圖5顯示了本發明一個實施例中聲學回聲消除器(AEC)的一個例子500。
[0124] 如圖所示,AEC 500可以包括揚聲器501、雙端發聲檢測器(DTD)503、自適應濾波器 505、合成器506和/或任何其他適當的用于進行聲學回聲消除的部分。在一些實施例中,AEC 500的一個或多個部分可以包括在圖3的回聲消除模塊330中。例如,如圖5所示,回聲消除模 塊330可以包括雙端發聲檢測器(DTD)503、自適應濾波器505和合成器506。音頻傳感器508 的更詳細信息可參見圖2A-B中的音頻傳感器203。
[0125] 揚聲器501可以是和/或包括任何可以將音頻信號轉換為相應聲音的裝置。揚聲器 501可以是單獨的裝置或者與一個或多個其他裝置集成。例如,揚聲器501可以是汽車音頻 系統的內置揚聲器、移動電話集成的揚聲器等。
[0126] 揚聲器501可以輸出揚聲器信號507。揚聲器信號507可以通過聲學通路(如聲學通 路519)并可以產生回聲信號509。在一些實施例中,揚聲器信號507和回聲信號509可以分別 表示為x(n)和ye(n),其中η表示離散時間索引。回聲信號509可以與本地語音信號511、本地 噪音信號513和/或任何其他能被音頻傳感器508捕捉的信號一起被音頻傳感器508捕捉。本 地語音信號511和本地噪音信號513可以分別表示為ν(η)和u(n)。本地語音信號511可以表 示用戶的聲音、任何其他聲學輸入和/或任何其他可被音頻傳感器508捕捉的所希望的輸入 信號。本地噪音信號513可以表示環境噪音和/或任何其他類型的噪音。本地語音v(n)511本 質上可以是時斷時續的,而本地噪音u(n)513則可以是相對隨時間靜止的。
[0127]音頻傳感器508可以輸出輸出信號515。輸出信號515可以表不為相應于回聲信號 509的成分(例如回聲成分)、相應于本地語音511的成分(例如語音成分)、相應于本地噪音 513的成分(例如噪音成分)和/或任何其他成分的組合。
[0128] 回聲消除模塊330可以用自適應濾波器505對聲學通路519建模來估計回聲信號 509。自適應濾波器505可以是和/或包括帶有限脈沖響應(FIR)的濾波器以估計回聲信號 509。回聲消除模塊330可以用自適應算法來估計濾波器。在一些實施例中,自適應濾波器 505可以是帶線性濾波器的系統,其具有受一個或多個可變參數和一個或多個裝置控制的 傳遞函數以根據自適應算法調節所述一個或多個參數。
[0129] 自適應濾波器505可以接收揚聲器信號507和輸出信號515。自適應濾波器505之后 可以處理接收到的信號以產生回聲信號509估計的估計回聲信號(如信號代表。估計 的回聲信號可以被視為回聲信號509的副本。合成器506可以通過合并估計的回聲信號和輸 出信號515而產生回聲消除信號517。例如,回聲消除信號517可以通過從輸出信號515中減 去估計的回聲信號產生,以實現回聲和/或反饋消除。在自適應算法中,本地語音信號V(H) 511和本地噪音信號u(n)513二者均可以作為無關干擾。在一些實施例中,本地語音信號511 可以是斷續的,而本地噪音信號513可以是相對隨時間靜止的。
[0130] 在一些實施例中,自適應濾波器505所用的算法可以是線性或非線性的。自適應濾 波器505所用的算法可以包括,但不限于:歸一化最小均方(NLMS)、仿射投影(AP)算法、遞推 最小二乘(RLS)算法、頻域最小均方(FLMS)算法等或它們的任意組合。
[0131] 在一些實施例中,可以用開發的FLMS算法對聲學通路519建模和/或產生估計的回 聲信號。使用FLMS算法中,可以構建聲學通路519的聲學脈沖響應代表和自適應濾波器505。 在一些實施例中,聲學脈沖響應和自適應濾波器505可以具有有限長度L。開發的FLMS算法 可以將來自時域或空域的一個或多個信號轉換成在頻域中的表示,反之亦然。例如,快速傅 立葉變換可以用于將一個輸入信號轉換成在頻域中的表示(例如輸入信號的頻域表示)。重 疊保留處理技術可以處理這種表示。在一些實施例中,重疊保留處理技術可以用于處理輸 入的頻域表示(例如通過估計信號和有限脈沖響應濾波器之間的離散卷積)。從時域或空域 轉換成在頻域中的表示(反之亦然)的轉換方法包括,但不限于:快速傅立葉變換、小波變 換、拉普拉斯變換、Z-變換等或它們的任意組合。FFT可以包括,但不限于:素因子FFT算法、 Bruun FFT算法、Rader FFT算法,Bluestein FFT算法等或它們的任意組合。
[0132] 畝受誦路·??1 9產年的直走畝學脈沖響應可以用矢量,例如下面的矢量來表征:
[0133]
(夂
[0134] 自適應濾波器505可以用矢量、例如下面的矢量來表征:
[0135]
(43.
[0136] 式(3)和(4)中,(·)τ表示矢量或矩陣的轉換,η是離散時間索引。h可以表示聲學 通路519。給?可以表示由自適應濾波器505建模的聲學通路。各矢量可以是實值 矢量。如上所述,在一些實施例中,真實的聲學脈沖響應和自適應濾波器可以具有有限長度 L0
[0137] 可以基于真實的聲學脈沖響應對音頻傳感器508的輸出信號515建模,該信號515 可以包括相應于回聲信號509、語音信號511、本地噪音信號513等的一種或多種成分。例如, 輸出信號515可以如下建模:
[0138] y(n) =χτ(η) · h+w(n), (5)
[0139] 其中
[0140] (:6>
[0141]
[0142] 甲,物戶器倍虧㈧八例卯匕個秤本),v(n)相應于本地語音信 號511,u(n)相應于本地噪音信號513。
[0143] 在一些實施例中,可以將輸出信號y(η)515和揚聲器信號X(η)507分幀。每幀可以 包括一定數目的樣本(例如L個樣本)。輸出信號y(n)515的幀可以寫成:
[0144]
[0145]
[0146]
[0147] 式(8)和(9)中,m表示幀的索引(m = 0,l,2,· · ·)。
[0148] 揚聲器信號和/或輸出信號可以被轉換至頻域(如通過進行一次或多次快速傅立 葉變換(FFT))。變換可以對揚聲器信號和/或輸出信號的一個或多個幀進行。例如,可以通 過如下進行2L點FFT來產生揚聲器信號當前幀(例如第m幀)的頻域表示:
[0149]
(10>
[0150] 其中F2Lx2L可以是(2L X 2L)大小的傅立葉矩陣。
[0151] 應用于上一幀(例如第(m-Ι)幀)的自適應濾波器的頻域表示可以如下確定:
(Π >
[0152] 其中F2Lx2L可以是(2L X 2L)大小的傅立葉矩陣。
[0153] 可以計算Xf - _1)的Schur(-個元素一個元素)乘積。可以產生Schur乘 積的時域表示(例如通過使用反向FFT或任何其他適當的將頻域信號轉換至時域的方法將 Schur乘積轉換至時域)。回聲消除模塊330于是可以基于Schur乘積的時域表示產生回聲信 號當前幀(如y(m))的估計。例如,估計的幀(例如估計的回聲信號回聲ftm)的當前幀)可以 如下基于Schur乘積的時域表示的最后L個元素而產生:
[0154 (12)、
[0155
[0156
[0157] θ可以表示Schur乘積。
[0158] 回聲消除模塊330可以基于回聲信號和估計回聲信號之間的先驗誤差信號代表的 相似性更新自適應濾波器505的一個或多個系數。例如,對于回聲信號的當前幀(如y(m)), 可以基于回聲信號的當前幀(如y(m))和估計信號的當前幀(如穿(m))之間的差異來確定先 驗誤差信號e(m)。在一些實施例中,先驗誤差信號e(m)可基于下式確定:
[0159]
[0160] 川表示對角元素是元素 Xf (m)的2L X 2L對角矩陣,則式 (14)可以寫成:
[0161]
[0162]
[0163]
[0164] 其中λ是指數遺忘因數。λ的值可以設為任何適當的值。例如,λ的值可以在例如〇〈λ <1的范圍內。可以基于代價函數產生正規方程(例如通過將代價函數J(m)的梯度設為0)。 回聲消除模塊330可以基于正規方程得到用于FLMS算法的更新法則。例如,通過在時幀m和 m-Ι實施正規方程可以得到下述更新法則:
(18>
[016
[016
[0167] 其中μ可以是步長,δ可以是正則化因數
[0168]
(1S.IV
[0169] I2lx2l可以是2LX2L大小的恒等矩陣,Sf(m)可以表示對角元素可以是揚聲器501 的信號x(n)507的估計能譜元素的對角矩陣。回聲消除模塊330可以基于下式遞歸更新矩陣 Sf (m)
[0170: (19}
[0171]其中(· Γ可以是復合共扼算子。
[0172]通過使Slfsm接近I2LX2L/2,回聲消除模塊330可以推出FLMS算法的更新版本。回 聲消除模塊330可以遞歸更新自適應濾波器505。例如,自適應濾波器505可以按每L個樣本 更新一次。當L可以與在回聲消除模塊330中一樣大時,長的延遲會惡化自適應算法的循跡 能力。因此,對于回聲消除模塊330來說,通過利用更高或更低的重疊百分比,犧牲一些計算 的復雜性來換取更好的循跡表現會是值得的。
[0173]根據式(16),可以基于遞推最小二乘法(RLS)原則更新FLMS算法。回聲消除模塊 330可以通過調節遺忘因子λ來控制FLMS算法的收斂比、追蹤效果、失調和穩定性等或它們 的任意組合。遺忘因子λ可以在一個或多個頻點獨立地隨時間變化。在一些實施例中,式 (18)中的步長μ和正則化因數δ可以忽略以調節遺忘因子λ。遺忘因子λ可以通過進行一次或 多次下式(20)-(31)的運算來調節。在一些實施例中,FLMS算法的更新法則(如無約束FLMS 算法)可W加下確宙,
[0174]
[0175]
[0176]
[0177]
[0178]
[0179]
[0180] 其中
[0183] 回聲消除模塊330可以如下確定頻域先驗誤差矢量ef(m):[0184][0185][0186]
[0181]
[0182]
[0187] 其中可以使用海1夂·&的近似,且 [018D1
[018
[019
[0191] 在一些實施例中,遺忘因子λ和/或矩陣Λ v(m)可以用回聲消除模塊330來調節以 使下式成立,
[0192]
[0193]
[0194][0195] 士丨々=1"'〇9、/4^=1^〇^、士^1由、、/郵本*莫塊33〇可以得到下式:
[0196]
[0197] 其中< 是可以用來表示隨機變量a的二階矩,即
[0198] 在一些實施例中,基于先驗誤差信號與輸入信號無關的假設,可以獲得式(28)。基 于式(25),回聲消除模塊330可以由式(28)得到下式:
[0199]
(29),
[0200] 在一些實施例中,自適應濾波器可以收斂至一定程度,回聲消除模塊330可以基于 如下近似構建用于FLMS算法的變量遺忘因子控制方案,
[0201]
[0202]
[0203] (31)
[0204] 可以分別用回聲消除模塊330由它們相應的信號遞歸估計。
[0205] 基于上述自適應算法,自適應濾波器505輸出iH/\)可以由音頻傳感器508的輸出信 號y(n)515估計并減去,以實現聲學回聲和反饋消除。
[0206]在一些實施例中,雙端發聲檢測器DTD 503可以檢測出現的一次或多次雙端發聲。 例如,當揚聲器信號507和輸出信號515同時出現在自適應濾波器505(例如x(n)辛0和v(n) 辛0)時,可以確定出現雙端發聲。揚聲器信號507的存在會影響自適應濾波器505的性能(例 如通過引起自適應算法的偏離)。例如,聽得見的回聲可以通過回聲消除模塊330并會出現 在AEC系統500的輸出517中。在一些實施例中,通過檢測雙端發聲的出現,DTD503會產生表 不自適應濾波器505存在雙端發聲的控制信號。該控制信號可以傳輸至自適應濾波器505 和/或AEC 330的任何其他部分以暫停或減慢自適應算法的適應性(例如通過暫停自適應濾 波器505系數的更新)。
[0207] DTD 503可以使用Geigel算法、互相關法、相干法、雙通路(two-path)法等或它們 的任意組合來檢測雙端發聲。DTD 503可以基于揚聲器信號507和輸出信號515之間的相互 關聯信息來檢測雙端發聲的出現。在一些實施例中,揚聲器和麥克風信號之間的高相關性 可以顯不不存在雙端發聲。揚聲器信號507和輸出信號515之間的低相關性可以顯不存在雙 端發聲。在一些實施例中,揚聲器信號和麥克風信號之間的相互關聯性可以用一種或多種 檢測統計數據來表示。當相關性的一種或多種檢測統計數據代表大于或等于閥值時,相互 關聯性可被視為高相關。類似地,當相關性的一種或多種檢測統計數據代表不大于預定的 閥值時,相互關聯性可被視為低相關。DTD 503可以基于自適應濾波器505的系數(例如1)、 揚聲器信號501、麥克風信號515、誤差信號e和/或任何其他可用來確定揚聲器信號507和輸 出信號515之間的相干性和/或相互關聯性的信息,通過確定一種或多種檢測統計數據來確 定揚聲器信號和輸出信號之間的關系。在一些實施例中,DTD 503可以通過對比檢測統計數 據和預定的閥值來檢測雙端發聲的存在。
[0208]通過檢測雙端發聲的存在,DTD 503可以產生控制信號以將自適應濾波器505禁用 或暫停一段時間。確定了雙端發聲不存在和/或雙端發聲在一定時間間隔不存在后,DTD 503可以產生控制信號以將自適應濾波器505激活。
[0209]在一些實施例中,DTD 503可以基于互相關法或相干法類似的統計學來進行雙端 發聲檢測。可以將統計學的決定進一步標準化(例如通過使其上限為1)。在一些實施例中, 當確定了雙端發聲檢測中將使用的閾值時,可以考慮或不考慮聲學通路的變化。
[0210] 在一些實施例中,一種或多種檢測統計數據可以在頻域中得到。在一些實施例中, 揚聲器信號507和輸出信號515之間相關性的一種或多種檢測統計數據代表可以在頻域中 確定(如通過DTD 503)。
[0211] 例如,DTD 503可以根據基于假相干的DTD(PC-DTD)技術確定一種或多種檢測統計 數據和/或進行雙端發聲檢測。PC-DTD可以基于假相干(PC)矢量 srS'其可以如下定義:
[0212]
[0213]
[0214]
[0215]
[0216]
[0217]
[0218] 回聲消除模塊330可以使用愁1^%的近似來計算?f,xx。該計算可以通 過調節遺忘因子4(本文中也稱為背景遺忘因子),用類似(19)的遞歸估計方案來簡化。背 景遺忘因子Ab可以與上述遺忘因子Aa(本文中也稱為前景遺忘因子)相同或不同。DTD 503可 以響應近端語音的開始,然后可以在自適應濾波器可能開始偏離之前發出警示。估計的量 可以基于下式確定:
[0219] ,、 ' ' >.--、一 '"一 '一… (33).
[0220]
[0221] "....... …….' (35> 酬在-些實施例中,由于巇一誠 4,』)可以與(⑷中定義的心(_ 有不同。由于?f,xx(m)可以是對角矩陣,其逆可以簡單確定。
[0223] 檢測統計數據可以基于PC矢量確定。例如,可以基于下式確定檢測統計數據:
[0224] ξ ^ |<ij|l2 (36)~
[0225] 在一些實施例中,DTD 503可以將檢測統計數據(例如ξ的值或任何其他檢測統計 數據)與預定的閥值比較,然后可以基于比較結果來檢測雙端發聲的存在。例如,在確定了 檢測統計數據不大于預定的閥值后,DTD 503可以確定存在雙端發聲。另一個例子是,在確 定了檢測統計數據大于預定的閥值后,DTD 503可以確定不存在雙端發聲。例如,可以根據 下式進行施#-
[0226] (36、1)
[0227] 其中參數T可以是預設的閾值。參數T可以是任何適當的值。在一些實施例中,T的 值可以在一個范圍內(例如0<Τ<1,0.75彡T彡0.98等)。
[0228] 另一個例子是,DTD 503也可以用雙濾波器結構來進行雙端發聲檢測。由式(32)可 以將時ten!的缽許撒抿冰宙的平右£ 2 (一 P々寫為.
[0229]
(37>
[0230] 其中(·)H可以表示一個或多個矩陣或矢量的Hermitian轉置,
[0231]
[0232]
[0233]
[0234]
[0235] 如式(33)-(35)所示,與較遠的過去相比,單極遞歸平均會更重視較近的過去。相 應的脈沖響應衰減為Il鉍:> 辦。4的值可以基于循跡能力、估計偏差和/或任何其他因素 來確定。Ab的值可以是固定值(例如常數)、變量(例如使用下述遞歸技術確定的值)等。在一 些實施例中,可以選擇X b的值以滿足0<Ab<l。在一些實施例中,隨著Ab的減小,追蹤估計量 的變化的能力會得到改進,但估計偏差會增大。對于PC-DTDA b可以如下確定:
[0236] Ab - (41).
[0237] 其中P可以是重疊的百分比,fs可以是采樣率,tc,b可以是遞歸平均的時間常數。在 一些實施例中,DTD 503可以捕捉本地語音v(n)511的一次或多次爆發的引發邊界(例如雙 端發聲的存在)。可以基于循跡能力和估計偏差之間的折衷來選擇A b的值。例如,可以指定 較小的Ab以捕捉本地語音的一次或多次爆發的引發邊界。但當A b過小時,則統計數據決定估 計數據ξ會在閾值之上波動,同時雙端發聲仍會繼續,會導致錯過檢測。
[0238] 在一些實施例中,對應于當前幀的遺忘因子Ab的值可以基于之前的一幀或多幀期 間有無雙端發聲而變化。例如,A b的值可以使用遞歸技術確定(例如雙邊單極遞歸技術)。回 聲消除模塊330可以用下式(42)的規則管理tc, b:
[0239] , (42)
[0240] 其中tc, b, attack可以是本文稱為"引發"系數的系數,tc, b, d_y可以是本文稱為"衰 減"系數的系數。在一些實施例中,可以選擇"引發"系數和"衰減"系數來滿足不等式 tc, b,attack<tc<tc, b, decay。例如,回聲消除模塊 330 可以選擇tc,b, attack = 300mS 和tc,b, decay = 500ms。在一些實施例中,當在上一幀未檢測到雙端發聲時,可以使用較小的tc,b和較小的 Ab。或者,如果上一幀已經是雙端發聲的一部分(例如當檢測到存在與上一幀相關的雙端發 聲),那么考慮到雙端發聲將很可能因語音的天性而持續一段時間,可以選擇較大的Ab。這 會導致ξ的平滑變化,并可以防止有可能發生的錯過檢測。而且,這種情況下,更大的Ab將會 使背景濾波器的更新減慢,而不是完全停下來(例如,與"前景"濾波器一樣)。
[0241] 圖6顯示了本發明另一個實施例中AEC系統的例子600。
[0242] 如圖所示,AEC 600可以包括揚聲器601a_z、一個或多個DTD 603、自適應濾波器 605a-z、一個或多個合成器606和608、音頻傳感器619a和619z和/或任何其他適當的部分來 進行聲學回聲消除。AEC 600可以包括更多或更少部分,而不失其普遍性。例如,兩個模塊可 以合并到一個模塊中,或者一個模塊可以分成兩個或更多個模塊。在一種實施方式中,一個 或多個模塊可以存在于不同的計算設備中(例如不同的服務器計算機)。
[0243] 在一些實施例中,AEC 600的一個或多個部分可以包括在圖3的回聲消除模塊330 中。例如,如圖6所示,回聲消除模塊330可以包括DTD 603、自適應濾波器605a-z、合成器606 和合成器608。在一些實施例中,圖6的DTD 603可以與圖5的DTD 503相同。
[0244] 各揚聲器601a_z可以是和/或包括任何可以將音頻信號轉化為相應聲音的設備。 各揚聲器60 la-z可以是獨立的設備或者與一種或多種其他設備集成。例如,各揚聲器60 Ia-z可以是汽車音頻系統的內置揚聲器、移動電話集成的揚聲器等。盡管圖6中顯示了一定數 目的揚聲器、音頻傳感器、自適應濾波器等,但這僅僅是示意性的。AEC 600中可以包括任何 數目的揚聲器、音頻傳感器、自適應濾波器等。
[0245] 揚聲器601a、b和z可以分別輸出揚聲器信號607a、b和z。揚聲器信號607a_z可以穿 過它們相應的聲學通路(如聲學通路619a-z)并可以產生回聲信號609。回聲信號609可以與 本地語音信號511、本地噪音信號513和/或任何其他可被音頻傳感器619a-z捕捉的信號一 起被音頻傳感器603a和/或603b捕捉。
[0246]各音頻傳感器619a_z可以輸出輸出信號615。回聲消除模塊330可以用自適應濾波 器605a、605b和605z對聲學通路619a-z建模來估計回聲信號609。自適應濾波器605a-z可以 是和/或包括帶有限脈沖響應(FIR)的濾波器來產生回聲信號609。回聲消除模塊330就可以 用自適應算法來估計濾波器。
[0247] 自適應濾波器605a_z可以分別接收揚聲器信號607a_z。各個自適應濾波器就可以 產生并輸出相應于一個揚聲器信號的估計回聲信號。自適應濾波器605a-z的輸出可以表不 相應于揚聲器信號607a-z的估計回聲信號。合成器606可以合并輸出信號而產生回聲信號 609的估計數據的信號代表(如信號麫.η))。
[0248] 在一些實施例中,在揚聲器信號607a_z供給自適應濾波器605a_z之前,可以對一 個或多個揚聲器信號進行變換以降低揚聲器信號的相關性。例如,變換可以包括零記憶非 線性變換。更具體地說,例如所述變換可以通過向揚聲器信號增加揚聲器信號的半波整流 版和/或通過應用控制非線性量的比例因子來進行。在一些實施例中,所述變換可以基于式 (48)進行。另一個例子是,所述變換可以通過向一個或多個揚聲器信號增加不相關噪音(例 如White Gaussian噪音、Schroeder噪音等)來進行。再一個例子是,可以將隨時間變化的全 通濾波器用于一個或多個揚聲器信號。
[0249] 在一些實施例中,可以對各揚聲器信號607a_z進行變換以產生相應的變換揚聲器 信號。自適應濾波器605a_z可以對相應于揚聲器信號607a_z的變換揚聲器信號進行處理而 產生回聲信號609的估計數據。
[0250] 合成器608可以通過合并估計的回聲信號気界> 和輸出信號615來產生回聲消除信 號617。例如,可以通過從輸出信號615中除去估計的回聲信號來產生回聲消除信號617,以 實現回聲和/或反饋消除。
[0251] 如圖6所示,由于K彡2,音頻傳感器619a_z中的一個捕捉到的聲學回聲ye(n)609可 以是來自它們相應聲學通道的、不同但高度相關的揚聲器信號607a_z。音頻傳感器619a的 輸出信號615可以基于真實的聲學脈沖響應建模,并可以包括相應于回聲信號609、語音信 號511、本地噪音信號513等的一種或多種成分。例如,音頻傳感器的輸出信號615可以如下 建模:
[0252]
(43)
[0253] 其中回聲消除模塊330中的定義可以如下:
[0254] (43.1)
[0255]
[0256] 式(43)中,xk(n)相應于揚聲器信號607a_z,w(n)相應于本地語音信號511和本地 噪音信號513之和。
[0257] 回聲消除模塊330可以如下定義堆迭矢量x(n)和h(n):
[0258]
(43.3)、
[0259] M 3.4).
[0260]
[0261]
[0262] x(n)和h的長度扣以為K · L。在一些實施例中,后驗誤差信號ε(η)及其相關代價函 數J可以如下定義:
[0263]
[0264]
[0265] ;
[0266]
[0267]
[0268]
[0269]
[0270] 在多揚聲器AEC系統600中,揚聲器信號607a_z可以是相關的。在一些實施例中,為
單揚聲器情況開發的自適應算法未直接應用于多揚聲器回聲消除。原因是無法獲得希望的 濾波器[例 5時使后驗誤差ε(η)達到一個值。例如,該值可 以為0。
[0271] 解決這一問題的挑戰是將多個揚聲器信號χ(η)507的相關性降低到一定水平。該 水平足以使自適應算法收斂至合適的濾波器,還低至感覺上可以忽略。在一些實施例中,回 聲消除模塊330可以向揚聲器信號增加該揚聲器信號的半波整流版。揚聲器信號也可以用 常數α量度W棹擊丨I韭雜樺看^亦一ftst偷仿Il由亦施W其千下忒講-行:
[0272] (48)、
[0273]自適應濾波器605a_z可以相應于揚聲器601a_z。在一些實施例中,自適應濾波器 605a_z的數目和揚聲器601a_z的數目可以相同或不同。可以估計自適應濾波器605a_z,估 計的自適應濾波器605a_z之和可以由音頻傳感器619a的輸出信號615減去以實現聲學回聲 和/或反饋消除。
[0274] 圖7是本發明一些實施例中處理音頻信號過程的例子700的流程。在一些實施例 中,方法700的一種或多種操作可以用一個或多個處理器進行(例如圖1-6中所示的一個或 多個處理器120)。
[0275] 如圖所示,過程700可以始于701的接收由相應于一個或多個音頻通道的一個或多 個麥克風子陣產生的一個或多個音頻信號。各音頻信號可以包括,但不限于:語音成分、本 地噪音成分、相應于一個或多個揚聲器信號的回聲成分等或它們的任意組合。在一些實施 例中,本發明的傳感器子陣可以是MEMS麥克風子陣。在一些實施例中,麥克風子陣可以如圖 2A-B所示排列。
[0276]在703,過程700可以對音頻信號進行空間濾波以產生一個或多個空間濾波信號。 在一些實施例中,空間濾波的一種或多種操作可以通過圖3-4所示的空間濾波模塊320進 行。
[0277] 在一些實施例中,可以通過對麥克風子陣產生的音頻信號進行空間濾波來產生空 間濾波信號。例如,各個接收到的音頻信號都可以產生空間濾波信號。作為替代方案或者補 充方案,可以通過對多個麥克風子陣產生的多個音頻信號的組合進行空間濾波來產生空間 濾波信號。
[0278] 空間濾波信號可以通過進行任何適當的操作來產生。例如,可以用一個或多個波 束形成器對一個或多個音頻信號進行波束形成來產生空間濾波信號。在一些實施例中,波 束形成可以用圖3-4所示的一個或多個波束形成器來進行。另一個例子是,空間濾波信號可 以通過平衡波束形成器的輸出信號而產生(例如將低通濾波器用于輸出信號)。在一些實施 例中,所述平衡可以通過圖3-4所示的一個或多個低通濾波器來進行。空間濾波可以通過執 行圖8的一種或多種操作來進行。
[0279]在705,過程700可以對空間濾波信號進行回聲消除以產生一個或多個回聲消除信 號。例如,可以如下對空間濾波信號進行回聲消除:估計空間濾波信號的回聲成分,由空間 濾波信號中減去估計的回聲成分。回聲成分可以相應于一個或多個揚聲器產生的一個或多 個揚聲器信號。回聲成分可以基于對產生回聲成分的聲學通路建模的自適應濾波器來估 計。
[0280] 在一些實施例中,回聲消除可以用圖3、5和6所示的回聲消除模塊來進行。用來消 除音頻信號的回聲和反饋的算法可以包括,但不限于:歸一化最小均方(NLMS)、仿射投影 (AP)、塊最小均方(BLMS)和頻域(FLMS)算法等或它們的任意組合。在一些實施例中,回聲消 除可以通過執行圖9所示的一種或多種操作來進行。
[0281] 在707,過程700可以選擇一個或多個音頻通道。選擇可以由圖3所示的降噪模塊 340進行(例如通道選擇單元342)。在一些實施例中,選擇可以使用統計學或聚類算法基于 音頻信號的一種或多種特性進行。在一些實施例中,可以基于音頻通道提供的音頻信號的 質量選擇一個或多個音頻通道。例如,可以基于音頻通道提供的音頻信號的信噪比(SNR)選 擇一個或多個音頻通道。更具體地說,例如,通道選擇單元342可以選擇與具體質量(如具體 SNR,如最高的SNR、前三個SNR、高于閥值的SNR等)關聯的一個或多個音頻通道。在一些實施 例中,所述選擇可以基于用戶設置、自適應計算等或它們的任意組合來進行。在一些實施例 中,過程700中可以省略707。作為替代方案或者補充方案,在一些實施例中,可以進行所有 音頻通道的選擇。
[0282] 在709中,過程700可以對相應于選擇的音頻通道的回聲消除信號進行降噪以產生 一個或多個降噪信號。各降噪信號可以相應于希望的語音信號。在一些實施例中,降噪可以 如圖3所示由降噪模塊340進行。例如,MCNR單元344可以構建一個或多個降噪濾波器并可以 將降噪濾波器用于回聲消除信號。在一些實施例中,降噪可以通過執行圖10中所示的一種 或多種操作來進行。
[0283]在711,過程700可以對降噪信號進行噪音和/或回聲抑制以產生語音信號。在一些 實施例中,殘余噪聲和回聲抑制操作可以由降噪模塊340的殘余噪聲和回聲抑制單元346進 行。例如,殘余噪聲和回聲抑制單元346可以抑制未被MCNR單元344除去的殘余噪聲和/或回 聲。
[0284]在713,過程700可以輸出語音信號。可以進一步處理語音信號以提供各種不同的 功能。例如,可以對語音信號進行分析以確定語音信號的內容(例如使用一種或多種適當的 語音識別技術和/或任何其他信號處理技術)。接下來可以基于分析的語音信號內容由過程 700和/或任何其他過程進行一種或多種操作。例如,基于分析的內容可以呈現媒體內容(如 音頻內容、視頻內容、圖像、文本等)。更具體地說,例如,所述媒體內容可以涉及地圖、網頁 內容、導航信息、新聞、音頻剪輯和/或任何其他有關語音信號內容的信息。另一個例子是, 可以為用戶打電話。再一個例子是,可以基于語音信號收發信息等。還一個例子是,可以進 行分析內容的搜索(如通過向可進行搜索的服務器發送請求)。
[0285]圖8是本發明一些實施例中空間濾波過程的例子800的流程。在一些實施例中,過 程800可以如圖1-4所示,由執行空間濾波模塊320的一個或多個處理器進行。
[0286]在801,過程800可以接收由音頻傳感器子陣的第一音頻傳感器捕捉的聲學輸入的 第一音頻信號代表。聲學輸入可以相應于用戶的聲音和/或任何其他來自一個或多個聲源 的輸入。在803,過程800可以接收子陣的第二音頻傳感器捕捉的聲學輸入的第二音頻信號 代表。在一些實施例中,第一音頻信號和第二音頻信號可以相同或不同。第一音頻信號和第 二音頻信號可以同時、大體上同時和/或以任何其他方式收到。第一音頻傳感器和第二音頻 傳感器的各傳感器可以是和/或包括任何適當的音頻傳感器,如圖1所示系統100的音頻傳 感器110。可以對第一音頻傳感器和第二音頻傳感器進行排列以形成麥克風子陣,如圖2A、 2B和4所示的麥克風子陣。
[0287] 在805,過程800可以通過對第二音頻信號施加時間延遲來產生延遲音頻信號。在 一些實施例中,延遲音頻信號可以如圖3所示,由空間濾波模塊320的波束形成器322產生 (例如圖4所示的延遲模塊430)。在一些實施例中,可以基于第一音頻傳感器和/或第二音頻 傳感器之間的距離來確定及施加時間延遲。例如,時間延遲可以基于式(2.1)和/或式(2.2) 來計算。
[0288]在807,過程800可以合并第一音頻信號和延遲音頻信號以產生合并信號。在一些 實施例中,合并信號可以如圖3所示,由空間濾波模塊320的波束形成器322產生(例如圖4所 示的合并模塊440)。合并信號可以用式(1)和/或(2)表示。
[0289] 在809,過程800可以平衡合并信號。例如,過程800可以通過將低通濾波器(例如圖 3的低通濾波器324)用于合并信號來平衡合并信號。
[0290]在811,過程800可以將平衡信號輸出為音頻傳感器子陣的輸出。
[0291] 圖9是本發明一些實施例中回聲消除過程的例子900的流程。在一些實施例中,過 程900可以如圖3所示,由執行回聲消除模塊330的一個或多個處理器進行。
[0292] 在901,過程900可以接收包括語音成分和回聲成分在內的音頻信號。音頻信號可 以包括任何其他可以被音頻傳感器捕捉的成分。在一些實施例中,如圖5所示,回聲成分和 語音成分可以相應于回聲信號509和本地語音信號511。
[0293] 在903,過程900可以獲得產生回聲成分的參考音頻信號。在一些實施例中,如圖5- 6所示,參考音頻信號可以是和/或包括一個或多個揚聲器信號。作為替代方案或者補充方 案,參考音頻信號可以包括基于揚聲器信號產生的一個或多個信號。例如,參考音頻信號可 以包括基于揚聲器信號產生的變換信號(例如基于式(48))。
[0294] 在905,過程900可以對產生回聲成分的聲學通路建模。例如,聲學通路可以用一個 或多個自適應濾波器構建。在一些實施例中,可以有一個或多個聲學通路的一個或多個模 型代表。聲學通路模型可以是自適應聲學通路模型、開放聲學通路模型、線性聲學通路模 型、非線性聲學通路模型等或它們的任意組合。在一些實施例中,該模型可以基于式(5)- (48)的一個或多個來構建。
[0295] 在907,過程900可以基于模型和參考音頻信號來產生估計回聲信號。例如,估計回 聲信號可以是和/或包括在606構建的自適應濾波器的輸出信號。在一些實施例中,如圖6所 示,估計回聲信號可以是多個自適應濾波器產生的輸出的組合。
[0296] 在909,過程900可以通過合并估計回聲信號和音頻信號來產生回聲消除信號。例 如,回聲消除信號可以通過從音頻信號中減去估計的回聲信號來產生。
[0297] 圖10是本發明一些實施例中多通道降噪過程的例子1000的流程圖。在一些實施例 中,過程1000可以通過執行圖3的降噪模塊340的一個或多個處理器進行。
[0298] 在1001,過程1000可以接收多個音頻傳感器產生的輸入信號。音頻傳感器可以形 成陣列(例如線性陣列、差分陣列等)。各音頻信號可以包括語音成分、噪音成分和/或任何 其他成分。語音成分可以相應于希望的語音信號(例如用戶聲音的信號代表)。語音成分可 以基于來自未知源的通道脈沖響應來建模。噪音成分可以相應于明顯的噪音和/或任何其 他類型的噪音。在一些實施例中,輸入信號可以是和/或包括音頻傳感器的輸出信號。或者, 輸入信號可以是和/或包括由圖3的空間濾波模塊320、圖3的回聲消除模塊330和/或任何其 他設備產生的信號。
[0299] 在一些實施例中,輸出信號可以由形成陣列的一定數目的音頻傳感器(如P個音頻 傳感器)產生。過程1000可以如下對音頻傳感器的輸出信號建模:
[0300] yP(n) = gP · s(n)+vP(n) (49)
[0301 ] =xp(n)+Vp(n) ,p = 1,2, ---P, (50)
[0302]其中p是音頻傳感器的索引,&可以是由未知源s(n)到第p個音頻傳感器的通道脈 沖響應;vP(n)可以是音頻傳感器p處的噪音。在一些實施例中,前端可以包括差分音頻傳感 器子陣。通道脈沖響應可以包括室內脈沖響應和差分陣列波束圖兩者。信號x P(nWPvP(n)可 以是不相關的和零均值的。
[0303] 在一些實施例中,第一音頻傳感器可以具有最高的SNR。例如,過程1000可以用SNR 對輸出信號排序并可以因此對輸出信號重編索引。
[0304]在一些實施例中,MCNR單元可以將一個或多個輸出信號由時域或空域變換至頻 域,反之亦然。例如,可以對各個音頻信號進行時頻變換。時頻變換可以是和/或包括,例如 快速傅立葉變換、小波變換、拉普拉斯變換、Z-變換等或它們的任意組合。FFT可以包括,但 不限于:素因子FFT算法、Bruun FFT算法、Rader FFT算法,Bluestein FFT算法等。
[0305] 例如,過程1000可以用短時傅里葉變換(STFT)將式(49)變換至頻域并得到下式:
[0306] Yp(Jo)=Gp(Jo) . S(j?)+VP(j?) (51)
[0307] =Xp(jW)+VP(j〇),p = l,2,---P, (52)
[0308] 其中,矣./^1,《可以是角頻率4(」(〇)、5(]_?)、6[)(]_?)、父[)(」(0)=6 [)(]_?)4 (j ω )和Vp( j ω )可以分別是yp(n)、s(n)、gP、xP(n;^PIvP(n^STFT。
[0309] 在1003,過程1000可以確定輸入音頻信號的語音信號的估計數據。例如,所述估計 可以通過確定輸入信號的一個或多個功率譜密度(PSD)矩陣來進行。更具體地說,例如,給 定輸入信號(例加第η個f命入音頗信號)Vn(η)的PSDiTf以加下確帝',
[0310]
[0311]
[0312]
[0313] 可以是兩個信號a(n)和b(n)之間的互譜,Φ Μ( ω )和(})bb( ω )可以是它們各自的 PSD,E{ · }可以表示數學期望值,(· Γ可以表示復共扼。在時間系列分析中,互譜可以用作 兩個時間系列之間的互相關或交叉協方差的頻域分析的一部分。
[0314]在一些實施例中,過程1000可以如下由P個音頻傳感器信號獲得Xl(jco )的線性估 計數據:
[0315]
[0316]
[0317]
[0318]
[0319]在一些實施例中,過程1000可以以類似的方式將v( j ω )定義為y( j ω ),
[0320]
[0321]
[0322]
[0323]
[0324]
[0325]
[0326] 可以分別是信號辦⑷和化⑷的PSD矩陣。矩陣Φχχ(」ω)的排行可以等于1。
[0327] 在1005,過程1000可以基于語音成分的估計數據構建一個或多個降噪濾波器。例 如,可以基于語音成分的估計數據、輸入信號的語音成分和/或噪音成分的一個或多個PSD 矩陣、和/或任何其他信息構建Wiener濾波器。
[0328] 更具體地說,例如,過程1000可以基于語音成分和相應的線性估計數據產生誤差 信號。在一些實施例中,過程1000可以基于下式產生誤差信號:
[0329]
[0330]
[0331]
[0332]
[0333]
[0334] 一估算算法的MSE可以衡量"誤差"平方的平均值,即估計值和估計的數據之間的 差異。
[0335] 過程1000可以如下通過將MSE最小化來推導出Wiener方案hw(j ω ):
[0336] hw( j ω )=argminh(jcj)J[h( j ω )]二(62)
[0337]
[0338]
[0339]
[0340]
[0341]
[0342]
[0343]
[0344] 其中tr[ ·]可以表示矩陣的跡。通過使用Woodbury恒等式,通過對原矩陣的逆進 行k秩校正,可以計算一些矩陣的k秩校正的逆。過程1000可以將式(65)代入式(63)中來獲 得如下Wiener濾波器的其他公式:
[0345]
[0346] 在一些實施例中,過程1000可以用單極遞歸技術更新Oyy(jc〇 )和Φνν(」ω )的估 計數據。〇yy( j ω )和Φνν( j ω )的各估計數據可以在靜止期和/或以任何其他適當的方式連 續更新。
[0347] 另一個例子是,過程1000可以用最小方差無畸變響應(MVDR)法構建多通道降噪 (MCNR)濾波器。構建的濾波器在本文中也稱為"MVDR濾波器"。MVDR濾波器可以基于式(56) 設計。可以在希望的語音信號不失真的情況下,構建MVDR濾波器以使MCNR輸出中的噪音水 平達到最低。可以通過解決如下定義的約束最優化問題來構建MCNR:
[0348]
[0349]
[0350]
[0351]
[0352]
[0353]
[0354]
[0355]
[0356]
[0357]
[0358]
[0359]
[0360] 式(74)可以表示在用MVDR濾波器進行MCNR之后用于單通道降噪(SCNR)的Wiener 濾波器。
[0361] 在1007,過程1000單元可以基于降噪濾波器產生降噪信號。例如,過程1000可以將 降噪濾波器用于輸入信號。
[0362] 應當注意的是,圖7-10流程的上述步驟可以按任何次序或順序來執行或進行,并 不限于圖中所示的次序和順序。而且,圖7-10流程的一些上述步驟在適當時可以實質上同 時或者并列執行或進行,以縮短延遲時間和處理時間。此外,還應注意,圖7-10僅用于示例。 至少這些圖中所示的一些步驟可以用與圖中所示不同的次序進行、同時進行或一起省略。 例如,709可以在705之后進行而沒有步驟705。另一個例子是,707、709、711可以在用一個或 多個傳感器子陣接收多個音頻信號之后進行。
[0363] 圖11顯示了本發明一些實施例中紡織結構的例子1110、1120和1130。在一些實施 例中,各紡織結構11ΠΚ1120和1130可以表示可穿戴設備的一部分。作為替代方案或者補充 方案,各紡織結構1110、1120和1130可用于單獨的可穿戴設備。在一些實施例中,各紡織結 構可以包括在圖2A所示紡織結構的一個層中。
[0364] 如圖所示,紡織結構1110、1120和1130可以包括一個或多個通道1101a、1101b、 1101c、IlOld和llOle。各通道1101a-e的一個或多個部分可以是中空的。通道IlOlb和1101c 可以彼此平行或不平行。類似地,通道IlOld可以與通道IlOle平行或不平行。通道1101a、 1101b、1101c、IlOld和IlOle可以具有或不具有相同的結構。
[0365] 紡織結構1110、1120和1130也可以包括一個或多個其中可以放置語音通信系統 (如語音通信系統1105a、1105b、1105c等)的區域(如1103a、1103b、1103c等)。各區域可以包 括供聲音輕易穿過以到達位于該區域的音頻傳感器的部分。供聲音輕易穿過的部分可以是 通孔。供聲音輕易穿過的區域的形狀可以包括,但不限于:密集規則排列的小孔、圓形、多邊 形、基于音頻傳感器的尺寸確定的形狀等或它們的任意組合。
[0366] 可以任何適當的方式在紡織結構中排布一個或多個區域和一個或多個通道。例 如,區域和/或該區域的一個或多個部分(如區域1103a、1103b和1103c)可以是通道的一部 分(如通道1101a、1101b和llOld)。另一個例子是,區域可以不必是通道的一部分。更具體地 說,例如,區域可以位于紡織結構的表面和通道之間。在一些實施例中,一個或多個傳感器 可以嵌在所述區域和/或通道中,以使傳感器和/或傳感器的連接電路沒有任何部分突出于 紡織結構。
[0367] 各區域的形狀可以包括,但不限于:密集規則排列的小孔、圓形、多邊形等或它們 的任意組合。在一些實施例中,指定區域的形狀可以基于位于該區域的語音通信系統的尺 寸來確定和/或制造。制造各區域的方法可以包括,但不限于:激光切割、一體成型等或它們 的任意組合。
[0368] 通道llOla-e的空間結構包括,但不限于:立方體、圓柱體、橢圓體等或它們的任意 組合。制造紡織結構的材料可以包括,但不限于:織帶、尼龍、聚酯纖維等或它們的任意組 合。
[0369] 在一些實施例中,各語音通信系統1105a、1105b和1105c可以包括一個或多個傳感 器(如音頻傳感器)、與傳感器相連的電路和/或任何其他適當的部分。例如,各語音通信系 統1105a、1105b和1105c可以包括圖12的一個或多個語音通信系統1200和/或語音通信系統 1200的一個或多個部分。語音通信系統1200可以固定到通道1101a-e的一個表面。因此,語 音通信系統1200和通道表面之間的連接會比較牢固。連接語音通信系統1200和通道表面的 方法包括但不限于:加熱熱熔膠、粘貼、一體成型、螺絲固定等或它們的任意組合。
[0370]圖12示出了本發明一些實施例中語音通信系統的例子1200。語音通信系統1200可 以包括一個或多個音頻傳感器1201a-c、外罩1203a-c、焊點1205、連接器1207a-b、電容器 1209和/或任何其他適當的用于語音通信系統的部分。
[0371 ]各音頻傳感器1201a、1201b和1201c可以捕捉輸入聲學信號并將捕捉的聲學信號 轉換成一個或多個音頻信號。在一些實施例中,各音頻傳感器1201a、1201b和1201c可以是 和/或包括麥克風。在一些實施例中,麥克風可以包括,但不限于:激光麥克風、電容式麥克 風、MEMS麥克風等或它們的任意組合。例如,MEMS麥克風可以通過直接將壓敏薄膜蝕刻到硅 片中來制造。該制造工藝中的幾何尺寸可以是微米級的。在一些實施例中,各音頻傳感器 1201a、1201b和1201c可以是和/或包括如之前圖1所示的音頻傳感器110。
[0372] 如圖12所示,音頻傳感器1201a、1201b和1201c和/或其連接電路可以分別連接到 外罩1203a、1203b和1203c上。例如,音頻傳感器可以通過包括但不限于焊接、粘貼、一體成 型、螺絲固定等或它們的任意組合的方法連接到外罩上。外罩1203可以連接到圖11的通道 1101表面。各外罩1203a、1203b和1203c可以使用任何適當的材料,如塑料、纖維、任何其他 非導電材料等或它們的任意組合來制造。
[0373] 在一些實施例中,外罩1203a、1203b和1203c可以彼此通信連接。例如,外罩1203a 可以經一個或多個連接器1207a與外罩1203b通信連接。另一個例子是,外罩1203b可以經一 個或多個連接器1207b與外罩1203c通信連接。在一些實施例中,各連接器1207a-b可以通過 焊接(如經焊點1205)連接到語音通信系統1203的外罩上。在一些實施例中,裝在外罩1203 上的音頻傳感器1201a、1201b和1201c可以通過焊接與外罩1203中的電路通信連接。之后, 音頻傳感器1201可以彼此電連接。各連接器1207a-b可以用任何適當的材料,如銅、鋁、鎳合 金等或它們的任意組合來制備。
[0374] 在制造過程中,外罩1203a_c的一個或多個表面和/或通道1310(示于圖13中)可以 涂有熔膠,然后可以將通信系統1200插入通道中。這樣,可以對熔膠進行加熱來將外罩固定 到通道表面。因此,音頻傳感器1201a-c可以固定到紡織結構上。在一些實施例中,在紡織結 構中,沿通道201(圖11-12中未示出)長度方向的柔性余量可以使連接器1207在紡織結構彎 折時彎折。柔性余量可以包括,但不限于:伸縮余量、彈性結構等或它們的任意組合。例如, 連接兩個固定點的連接器1207a-b的長度可以大于這兩個固定點之間的直線距離,這樣可 以產生伸縮余量。在一些實施例中,為了產生彈性結構,連接器1207a-b的形狀可以包括,但 不限于:螺旋狀、S型、折線形等或它們的任意組合。
[0375] 在一些實施例中,電容器1209可以位于外罩上以分流其他電路元器件引起的噪音 并減輕噪音可能對電路其余部分造成的影響。例如,電容器1209可以是去藕電容器。
[0376] 雖然圖12中示出了外罩和音頻傳感器的具體數目,但這僅僅是示意性的。例如,語 音通信系統1200可以包括連接到任何適當數目的音頻傳感器的任何適當數目的外罩。另一 個例子是,語音通信系統1200的外罩可以連接到一個或多個音頻傳感器和/或它們的連接 電路。
[0377] 圖13顯示了本發明一些實施例中嵌有傳感器的紡織結構的截面圖例子1300。在一 些實施例中,紡織結構1300可以是和/或包括如圖11所示的紡織結構。紡織結構1300可以包 括圖12的語音通信系統1200的一個或多個部分。紡織結構1300可以包括在圖2A所示紡織結 構的一個層中。
[0378] 如圖所示,紡織結構1300可以包括可以放置一塊或多塊外罩1320a、1320b和1320c 的通道1310。外罩1320a、1320b和1320c可以經一條或多條連接器1207a、1207b等通信連接。
[0379] 傳感器 1330a、1330b、1330c、1330d、1330e 和 1330f 可以與一塊或多塊外罩 1320a-c 連接。例如,傳感器1330a和1330b可以與外罩1320a連接。各傳感器1330a-f可以捕捉和/或 產生各種類型的信號。例如,各傳感器1330a-f可以是和/或包括可以捕捉聲學信號和/或產 生音頻信號的音頻傳感器(如之前圖1所述的音頻傳感器110)。
[0380] 各傳感器1330a-f可以放置在紡織結構1300的第一表面1301和第二表面1303之 間。例如,傳感器1330a的一個或多個部分和/或其連接電路可以連接到外罩1320a上,并可 以放置在通道1310中。作為補充方案或者替代方案,傳感器1330a的一個或多個部分和/或 其連接電路可以放置在紡織結構1300的位于表面1301和通道1310之間的區域。另一個例子 是,傳感器1330b的一個或多個部分可以與外罩1320a連接,并可以放置在通道1310中。作為 補充方案或者替代方案,傳感器1330b的一個或多個部分和/或其連接電路可以放置在紡織 結構1300的位于表面1303和通道1310之間的區域。在一些實施例中,一個或多個傳感器和/ 或它們的連接電路可以嵌在紡織結構的表面1301和1303之間,沒有任何部件突出于紡織結 構的任何部分。
[0381] 在一些實施例中,表面1301可以朝向用戶(如車輛乘員)。或者,表面1303可以相當 于紡織結構1300可以朝向用戶的部分。在一個更具體的例子中,傳感器1330a可以是和/或 包括音頻傳感器。傳感器1330b可以是和/或包括能夠捕捉脈搏、血壓、心率、呼吸頻率信息 和/或任何其他有關乘員信息的生物傳感器。在一些實施例中,作為這種例子,表面1303可 以朝向使用者。
[0382] 在一些實施例中,一個或多個傳感器1330a_f可以通過包括,但不限于焊接、粘貼、 一體成型、螺絲固定等或它們的任意組合的方法連接至一塊或多塊外罩1320a_c。在一些實 施例中,外罩1320a、1320b和1320c可以分別相當于圖12的外罩1203a、1203b和1203c。
[0383] 外罩1320a_c可以通過連接器1207彼此電連接。在一些實施例中,連接器1207可以 包括長度方向的柔性余量。柔性余量可以包括,但不限于:伸縮余量、彈性結構等或它們的 任意組合。例如,連接兩個固定點的連接器1207的長度可以大于這兩個固定點之間的直線 距離,這樣可以產生伸縮余量。在一些實施例中,為了產生彈性結構,連接器的形狀可以包 括,但不限于:螺旋狀、S型、折線形等或它們的任意組合。
[0384] 沒有附屬物的外罩1320a_c的表面可以涂布熱熔膠。
[0385] 圖14顯示了本發明一些實施例中用于實施語音通信系統1200的嵌有傳感器的紡 織結構例子1410和1420。在一些實施例中,各紡織結構1310和1320可以表不可穿戴設備(如 安全帶、膜片等)的一部分。作為替代方案或者補充方案,紡織結構1410和1420可以表示多 個不同可穿戴設備的多個部分。在一些實施例中,各紡織結構1410和1420可以包括在圖2A 所示紡織結構的一個層中。
[0386] 如圖所示,紡織結構1410包括通道1411。類似地,紡織結構1420可以包括通道 1421。語音通信系統,如一個或多個語音通信系統1200和/或其一個或多個部分可以放置在 通道1411和/或1421中。
[0387] 各通道1411和1421可以在紡織結構的中間部分。在1420中,一個或多個通道中的 一些通道可以在紡織結構的靠近人體聲源的邊緣。例如,人體聲源可以指人的嘴巴。
[0388] 在一些實施例中,紡織結構中可以制造一個或多個通道1411和1421。相鄰的多個 通道1411的間距可以相同或不同。多個通道的起始端和末端可以相同或不同。
[0389] 在制造過程中,語音通信系統1200可以放置在通道1411中,通道1411未被占用的 空白區域可以用填充物填充。這樣,語音通信系統1200可以通過填充物的注塑固定至通道 1401。填充物可以包括,但不限于:硅膠、硅橡膠、天然橡膠等或它們的任意組合。在一些實 施例中,填充過程中可以使用涂有填充物的連接器1207。因此,音頻傳感器1201和外罩1203 可以在填充過程中用填充物填充。在另一些實施例中,連接器1207、音頻傳感器1201和外罩 1203可以在一個填充過程中用填充物填充。
[0390]在一些實施例中,填充物可以產生供聲音沿音頻傳感器1201的外表面輕易穿過的 區域。例如,該區域可以是圖11所示的區域1103。在填充物的注塑之后,通道1411中的容納 物各部分的厚度可以小于和/或大于通道1411的相應深度。通道深度在不同部分可以不同。 因此,通道1411中的容納物可以包括從通道1411凸起和/或不凸起的部件。
[0391] 圖15顯示了本發明一些實施例中語音通信系統1200的布線例子1500。布線1500可 以包括一個或多個VDD連接器1501、GND連接器1503、SD數據連接器1505、音頻傳感器1201和 外罩1203和/或任何其他適當的用來實施語音通信系統的部分。
[0392] 音頻傳感器1201可以包括一個或多個管腳1507。例如,音頻傳感器203可以包括6 個管腳1507a-f。各音頻傳感器1201的管腳可以相同或不同。一個或多個管腳可以連接至 VDD連接器1501和GM)連接器1503。之后,可以向音頻傳感器1201供電。例如,三個管腳 1507a-c可以連接至GND連接器1503,一個管腳1507f可以連接至VDD連接器1501。一個或多 個管腳1507可以彼此相連。在一些實施例中,管腳1507b和1507e可以彼此相連。音頻傳感器 1201可以包括連到輸出信號的一個或多個管腳1507。例如,管腳1507d可以連接至SD數據連 接器1505至輸出信號。在圖15中,布線1500可以包括4個音頻傳感器1201和4個相應的SD數 據連接器1505a、1505b、1505c和1505d。在其他一些實施例中,音頻傳感器1201的數目和SD 數據連接器1505的數目可以變化。另外,音頻傳感器1201的數目和SD數據連接器的數目可 以相同或不同。
[0393] VDD連接器1501、GND連接器1503、SD數據連接器1505和外罩1203之間的連接可以 是串聯和/或并聯。在一些實施例中,外罩1203可以有一層或多層。VDD連接器1501、GND連接 器1503和SD數據連接器1505的交叉連接可以在外罩1203中實現。VDD連接器1501、GND連接 器1503和SD數據連接器1505可以彼此平行。語音通信系統1200的布線1500可以插入紡織結 構的通道201中(圖15中未示出)并固定至通道201的表面。
[0394] 圖16顯示了本發明一些實施例中語音通信系統1200的布線例子1600。布線1600可 以包括一條或多條VDD連接器1601、GND連接器1603、WS位時鐘連接器1605、SCK采樣時鐘連 接器1607、SD數據連接器1609、音頻傳感器1201a-b和外罩1203和/或任何其他適當的用來 實施語音通信系統的部分。
[0395] 音頻傳感器1201a_b可以包括一個或多個管腳1611和1613。例如,音頻傳感器 1201a可以包括八個管腳1611a-h。音頻傳感器1201b可以包括八個管腳1613a-h。一個或多 個管腳可以連接至VDD連接器1601和GND連接器1603。之后,可以對音頻傳感器120Ia和 1201b供電。例如,在1201a中,管腳1611f可以連接至VDD連接器1601,管腳1611h可以連接至 GND連接器1603。在1201b中,1613d和1613f可以連接至VDD連接器1601,管腳1613h可以連接 至GND連接器1603。一個或多個管腳1611可以彼此相連。一個或多個管腳1613也可以彼此相 連。在一些實施例中,在1201a中,管腳161 If可以連接至161 lg。161 Id和161 Ie可以連接至 1611h。在1201b中,管腳1613f可以連接至16138<31613 θ可以連接至1613h。
[0396] WS位時鐘連接器1605和SCK采樣時鐘連接器1607可以提供一個或多個時鐘信號。 在1201a中,管腳1611c可以連接至WS位時鐘連接器1605,管腳1611a可以連接至SCK采樣時 鐘連接器1607。在1201b中,管腳1613c可以連接至WS位時鐘連接器1605,管腳1613a可以連 接至SCK采樣時鐘連接器1607。
[0397] 音頻傳感器1201可以包括連到輸出信號的一個或多個管腳。一個或多個管腳可以 連接至SD數據連接器1609。一個或多個SD數據連接器1609可以連接至管腳1611和/或1613。 例如,1201a中的管腳1611b和1201b中的管腳1613b可以連接至SD數據連接器1609a至輸出 信號。在圖16中,布線1600可以包括四條SD數據連接器1609a、1609b、1609c和1609d。其他音 頻傳感器1201(圖16未示出)可以連接至SD數據連接器1609。在其他實施例中,音頻傳感器 1201的數目和SD數據連接器1609的數目可以變化。這兩個數目也可以相同或不同。
[0398] VDD連接器1601、GND連接器1603和SD數據連接器1609可以串聯和/或并聯連接至 外罩1203。在一些實施例中,外罩1203可以具有一層或多層。VDD連接器1601、GND連接器 1603和SD數據連接器1609的交叉連接可以在外罩1203中實現。VDD連接器1601、GND連接器 1603和SD數據連接器1609可以彼此平行。語音通信系統1200的布線1600可以插入紡織結構 的通道201 (圖16未示出)并固定到通道201的表面。
[0399] 本說明書在以上說明中提到了很多細節,但顯而易見的是,沒有這些具體細節本 發明也可以實施。在一些例子中,為了突出本發明的內容,熟知的結構和設備以方塊圖的形 式顯示,而非具體細節。
[0400] 之后的詳細描述的一部分以計算機存儲中的數據位運算的算式和符號表達呈現。 這些算法描述和表達是數據處理領域的技術人員常用的手段,以最有效地將他們的實質性 工作傳遞給該領域的其他技術人員。總地來說,本文中的算法是一連串獨立的步驟,可以獲 得希望的結果。這些步驟要求物理量的物理運算。通常來說,盡管不是必需的,這些量是能 夠被存儲、傳輸、合并、比較和進行其他運算的電信號或磁信號的形式。由于常用的原因,可 以方便地將這些信號稱為比特、(數)值、元素、符號、字符、術語、數字等。
[0401] 然而,應該記住的是,所有這些和類似的術語用于與適當的物理量關聯,并僅僅是 用于這些量的方便的標簽。如無特別指明,由下述討論中可以看出,整個說明書中,使用如 "發送"、"接收"、"產生"、"提供"、"計算"、"執行"、"存儲"、"確定"、"嵌"、"(放)置"、"位于" 等術語進行的討論是指計算機系統或類似的電子計算設備的行為或過程,其將以計算機系 統的寄存器和存儲器中的物理(電子)量表示的數據處理和轉換成其他類似地以計算機系 統的存儲器或寄存器或其他這類信息存儲、傳送或顯示裝置中的物理量表示的數據。
[0402]本文中使用的術語"第一"、"第二"、"第三"、"第四"等是用于區分不同部件的標 記,可以不必具有所用數字編號的序數含義。
[0403]在實施本發明的一些方式中,可以使用任何適當的計算機可讀介質來存儲進行本 文所述過程的指令。例如,在一些實施方式中,計算機可讀介質可以是臨時性的或非臨時性 的。例如,非臨時性的計算機可讀介質可以包括如磁性介質(如硬盤、軟盤等)、光學介質(如 光盤、數字視頻光盤、藍光光盤等)、半導體介質(如閃存、電可編程只讀存儲器(EPROM)、電 可擦除可編程只讀存儲器(EEPROM)等)等介質、任何適當的在傳輸期間不會消逝或缺乏外 表的持久性的介質、和/或任何適當的有形介質。另一個例子是,臨時性的計算機可讀介質 可以包括在網絡上、連接器、半導體、光纖、電路、任何適當的在傳輸期間消逝并缺乏外表的 持久性的介質、和/或任何適當的有形介質中的信號。
【主權項】
1. 一種語音通信系統,其特征在于,包括:第一音頻傳感器,所述第一音頻傳感器用于 采集聲音輸入并基于所述聲音輸入產生第一音頻信號,所述第一音頻傳感器放置在紡織結 構的第一表面與第二表面之間。2. 根據權利要求1所述的系統,其特征在于,所述第一音頻傳感器是裝配在硅晶圓片上 的麥克風。3. 根據權利要求1所述的系統,其特征在于,所述第一音頻傳感器放置在位于紡織結構 的第一表面和第二表面之間的區域。4. 根據權利要求1所述的系統,其特征在于,所述紡織結構包含位于該紡織結構的第一 表面和第二表面之間的第一通道,所述第一音頻傳感器放置在所述第一通道中。5. 根據權利要求4所述的系統,其特征在于,所述系統還包括基于聲學輸入產生第二音 頻信號的第二音頻傳感器,所述紡織結構還包括第二通道,并且所述第二音頻傳感器的至 少一部分放置在第二通道中。6. 根據權利要求5所述的系統,其特征在于,所述第一通道與第二通道平行。7. 根據權利要求5所述的系統,其特征在于,所述第一音頻傳感器和第二音頻傳感器形 成音頻傳感器的差分子陣。8. 根據權利要求5所述的系統,其特征在于,所述系統還包括基于所述第一音頻信號和 第二音頻信號產生語音信號的處理器。9. 根據權利要求1所述的系統,其特征在于,所述第一音頻傳感器和第二音頻傳感器嵌 埋在所述紡織結構的第一層中。10. 根據權利要求9所述的系統,其特征在于,與所述第一音頻傳感器相連電路的至少 一部分嵌埋在所述紡織結構的第二層中。11. 根據權利要求1所述的系統,其特征在于,所述紡織結構的第一表面與第二表面之 間的距離不大于2.5 mm。12. 根據權利要求8所述的系統,其特征在于,為了產生語音信號,所述處理器還用于: 通過合并所述第一音頻信號和第二音頻信號產生輸出信號;并對輸出信號進行回聲消除。13. 根據權利要求12所述的系統,其特征在于,為了進行回聲消除,所述處理器還用于: 構建聲學通路的代表模型;并基于該模型估計輸出信號的成分。14. 根據權利要求1所述的系統,其特征在于,所述第一音頻傳感器不突出于所述紡織 結構。15. 根據權利要求1所述的系統,其特征在于,還包括放置于紡織結構的第一表面和第 二表面之間的生物傳感器。16. -種語音通信方法,其特征在于,包括: 接收由麥克風陣列產生的多個音頻信號,其中所述麥克風陣列包括第一麥克風子陣, 所述多個音頻信號包括第一麥克風子陣產生的第一音頻信號; 對多個音頻信號進行空間濾波以產生多個空間濾波信號; 通過處理器對多個音頻信號進行回聲消除以產生至少一個語音信號。17. 根據權利要求16所述的方法,其特征在于,對多個音頻信號進行降噪以產生語音信 號,其中進行降噪包括: 構建至少一個降噪濾波器;和 將降噪濾波器用于多個音頻信號。18. 根據權利要求17所述的方法,其特征在于,所述構建至少一個降噪濾波器包括: 基于多個音頻信號確定第一音頻信號的所希望成分的估計值; 基于第一音頻信號的所希望成分的估計值確定誤差信號; 基于誤差信號解決最優化問題。19. 根據權利要求所述18所述的方法,其特征在于,所述構建至少一個降噪濾波器還包 括: 確定第一音頻信號的第一功率譜密度, 確定第一音頻信號的所希望成分的第二功率譜密度; 確定第一音頻信號的噪音成分的第三功率譜密度; 基于第一功率譜密度、第二功率譜密度或第三功率譜密度的至少一個構建至少一個降 噪濾波器。20. 根據權利要求17所述的方法,其特征在于,所述至少一個降噪濾波器包括相應于麥 克風陣列中的多個音頻傳感器的多個非因果濾波器。21. 根據權利要求17所述的方法,其特征在于,還包括采用單極遞歸技術更新降噪濾波 器。22. 根據權利要求17所述的方法,其特征在于,進行降噪還包括將降噪濾波器用于空間 濾波信號。23. 根據權利要求16所述的方法,其特征在于,進行回聲消除包括: 接收多個揚聲器產生的多個揚聲器信號; 對各揚聲器信號進行非線性變換以產生多個變換的揚聲器信號; 基于變換的揚聲器信號構建多個濾波器,其中各個濾波器代表對應于多個揚聲器信號 中的一個的聲學通路; 將多個濾波器用于變換的揚聲器信號以估計第一音頻信號的回聲成分。24. 根據權利要求23所述的方法,其特征在于,對多個揚聲器信號的第一揚聲器信號進 行非線性變換包括:向第一揚聲器信號增加該第一揚聲器信號的半波整流版。25. 根據權利要求23所述的方法,其特征在于,所述構建多個濾波器包括: 基于第一音頻信號確定后驗誤差信號; 基于后驗誤差信號確定代價函數:和 使代價函數最小化。26. 根據權利要求16所述的方法,其特征在于,所述進行回聲消除還包括: 確定第一音頻信號的上一幀是否檢測到雙端發聲; 基于確定結果計算遺忘因子;和 基于遺忘因子對第一音頻信號的當前幀進行雙端發聲檢測。27. 根據權利要求16所述的方法,其特征在于,所述第一麥克風子陣包括第一音頻傳感 器和第二音頻傳感器,其中對多個輸出信號進行空間濾波包括: 對所述第二音頻傳感器產生的第二音頻信號施加時間延遲以產生延遲信號; 合并所述第一音頻信號和延遲信號以產生合并信號,其中所述第一音頻信號由第一音 頻傳感器產生;和 將低通濾波器用于合并信號。
【文檔編號】G10L15/22GK105940445SQ201680000358
【公開日】2016年9月14日
【申請日】2016年2月4日
【發明人】黃以騰, 曾新曉
【申請人】曾新曉