Vad檢測麥克風及其操作方法
【專利說明】VAD檢測麥克風及其操作方法
[0001]相關申請的交叉參考
[0002]本專利根據35U.S.C.§ 119(e)條款,請求享受名為“VAD detect1n Microphoneand Method of Operating the Same”、在2013年5月23日提交的美國臨時申請N0.61826587的優先權,其內容通過引用方式作為整體合并于此。
技術領域
[0003]本申請涉及麥克風,更具體地涉及使用這種麥克風的語音活動檢測(VAD)方法。
【背景技術】
[0004]麥克風用于從揚聲器獲取語音信號。所述信號一旦被獲得可以以多種不同的方式被處理。多種不同的功能可以被用于今天的麥克風中,并且他們可以交互并利用多種不同的算法。
[0005]語音觸發,例如在移動系統中使用的,是客戶所希望使用的逐漸流行的特征。例如,用戶可能希望對移動裝置說出命令并且使該裝置對該命令進行反應。這種情況下,數字信號處理將會首先檢測是否有語音存在于麥克風所捕獲的音頻信號中,隨后對該信號進行分析以預測接收到的音頻信號中所說的文字是什么。不同的語音活動檢測(VAD)方法已經被發展并在如便攜式電話和個人計算機的不同類型的裝置中采用。
[0006]在這些方案的使用中,功率消耗成為關注點。低功率消耗帶來較長的待機時間。對今天的智能手機(尤其是)來說,電能的使用是關鍵因素。不幸的是,目前操作麥克風的方法使用并浪費了很多電能。這導致用戶對這些先前方法和系統的不滿。
【附圖說明】
[0007]為了對公開內容的更完整理解,可以參照下面的具體描述和附圖,其中:
[0008]圖1包括根據本發明的不同實施方式的具有使用VAD算法并包括節電特征的麥克風的系統框圖;
[0009]圖2包括根據本發明的不同實施方式的使用了使用了 VAD算法并包括節電特征的麥克風的系統的不同狀態流程圖;
[0010]圖3包括根據本發明的不同實施方式的使用了VAD算法并包括節電特征的麥克風的框圖;
[0011]圖4包括根據本發明的不同實施方式的專用集成電路(ASIC)的框圖;
[0012]圖5包括根據本發明的不同實施方式的主機的框圖;以及
[0013]圖6包括示出了根據本發明的不同實施方的使用了 VAD算法并包括節電特征的麥克風的操作的時序圖。
[0014]本領域技術人員將會明白附圖中的元素被簡單和清楚的闡述。還會明白某個動作和/或步驟可能被按照特殊的發生順序描述或描寫,同時那些本領域技術人員將會明白這種關于順序的特性沒有被精確地要求。還可以明白的是,這里所使用的具有通常含義的術語和表述是分別與調查和學習領域相關的這類術語和表述,除了在這之前另有特殊含義被提出。
【具體實施方式】
[0015]現有的方法改變了現有移動系統被劃分的方式,麥克風的功能、和其運行模式。為此,出現了具有語音或事件檢測塊的麥克風,這使得麥克風能產生中斷信號來喚醒系統。
[0016]在某些方面,這里所描述的麥克風包括五個外部連接。第一連接可以是電源連接,并且第二連接可以是接地連接。第三連接、第四連接和第五連接是連接該麥克風與主機裝置(例如,在安裝有該麥克風的裝置中的主機電路)。更具體地,第三連接可以是數據連接,第四連接可以是中斷(由麥克風向主機發送),第五連接可以是時鐘信號(由主機向麥克風發送)。
[0017]該麥克風可以具有多種操作模式并受時鐘信號的控制。所述主機從麥克風接收數據信號和中斷信號。該主機具有多個受由該麥克風產生的中斷信號控制的電源模式。該主機產生用于麥克風的時鐘信號,從而控制麥克風的操作模式。在一個示例中,時鐘的缺失使得麥克風進入語音活動檢測模式。
[0018]在一個示例中,所述麥克風包括VAD(語音活動檢測)操作模式。在這種操作模式中,麥克風具有很低的功率消耗,并且運行在相對低的時鐘頻率上,該時鐘頻率可以由外部(來自主機)提供或來自片上振蕩器。
[0019]這種操作支持非常的低功率消耗水平,因為在這種模式中僅激活最必要的信號處理。在一方面,麥克風的模擬信號處理塊(諸如,麥克風的前置放大器、模數轉換器、電壓調節器和為微機電系統(MEMS)麥克風提供偏壓的電荷栗)以低功率運行。在這種模式中,這些塊以降低的功率運行,該功率足以獲得使VAD或事件檢測器運行所需的帶寬和信噪比(SNR)。例如,可以獲得抽取(decimat1n)之后大約為8kHz的運行帶寬和大約為60dB的SNR。
[0020]可以使用公知的技術實現上述VAD或事件檢測器。例如,短期能量計與長期能量計、零交叉等等可以被用于檢測語音信號。
[0021]還應該注意的是,接口(主機與麥克風之間的連接)不局限于這里所描述的精確的信號。為此,可以使用其他信號或信號的其他組合。該接口的實體實現方式可以變更。例如,可以是單個實體雙向線或多個單向線。
[0022]在其他方面,麥克風還包括延遲緩沖器。在其它示例中,在喚醒時,緩沖數據通過第一傳輸線傳輸并且實時數據通過獨立的第二輸出線被同時傳輸。在進一步其他示例中,在模式切換時,緩沖數據被刷新或丟棄。
[0023]在進一步其他方面,麥克風被超頻以使緩存數據趕上實時數據。麥克風還可以被用于多麥克風語音觸發應用。在一個示例中,麥克風喚醒并且在緩沖或實時模式下使第二麥克風能夠數據同步。
[0024]參照圖1,描述了使用具有VAD算法并包括節能特征的麥克風102的系統100。該麥克風102可以在一個示例中包括MEMS芯片(具有MEMS晶片(die),振動膜和電荷板)和專用集成電路。該系統還包括主機104。該主機104可以包括多種處理功能并可以是裝有該麥克風102的裝置(例如,個人計算機或便攜電話、移動手持機或平板電腦)的一部分。
[0025]VDD電源信號112和接地信號114被耦接到麥克風102。中斷信號108和數據信號110從麥克風102向主機104發送。時鐘信號106從主機104向麥克風102發送。
[0026]在圖1的系統100的操作的一個示例中,麥克風102具有多種操作模式,且這些操作模式由時鐘信號106控制。主機104從麥克風102接收數據信號110以及中斷信號108。主機104具有受控于中斷信號108的多種電源模式,該中斷信號108由麥克風102在檢測到語音活動或某個語音事件(例如,所說的特定詞匯)時產生。主機104產生用于麥克風102的時鐘信號106從而控制麥克風102的操作模式。
[0027]在一個示例中,麥克風102包括VAD(語音活動檢測)操作模式。在這種模式中,麥克風102具有非常低的功率消耗,并且運行在相對低的時鐘頻率上,該時鐘頻率可以由外部(從主機104提供的時鐘信號106)提供或來自麥克風102中的內部片上振蕩器。因此,當進行中斷時,低電能操作可以被改變成高電能操作模式。可知,該中斷允許系統在低電能操作模式和高電能操作模式下操作。
[0028]在某些方面,集成電路和MEMS電路從外部主機接收時鐘信號。該時鐘信號使得MEMS電路和集成電路能在第一時間段在全系統操作模式下操作并且第二時間段在操作的語音活動模式下操作。該語音活動模式具有第一功率消耗或水平,該全系統操作模式具有第二功率消耗或水平。該第一功率消耗小于該第二功率消耗。集成電路被構造成在檢測到語音活動時產生中斷并向主機發送該中斷。時鐘的缺失使得麥克風進入到語音活動檢測模式。時鐘電路可以與其他部件設置在同一芯片上或設置在外部。
[0029]在其他方面,本方案提供了在第三功率消耗或水平操作內部時鐘并且之后產生外部數據流和時鐘以向系統通知使其在第四功率消耗或水平操作。第三功率水平小于第四功率水平,并且第四功率水平小于第一功率水平。
[0030]在進一步其他方面,外部時鐘可以被檢測并可以在檢測到語音活動之后施加。然后,內部時鐘被同步到所述外部時鐘。進而,VAD信號處理在同步后也被同步到外部時鐘。
[0031]在又一些其它方面,當外部時鐘被移除以降低整個系統的功率時,為了在第一或第二功率水平節能,所述系統還可以退回到內部時鐘。
[0032]在另一個示例中,外部信號可以由時鐘和聲學活動檢測的內部組合來產生,其作為信號和時鐘的組合以向主機通知中斷/喚醒并且識別語音信號。緩沖后的輸入信號的帶寬在一個示例中可以大約為8kHz。其他例子也是可能的。數據可以以PCM或PDM格式提供。格式的其他示例也是可能的。
[0033]現在參照圖2,描述了使用了使用了 VAD算法的麥克風的系統的不同操作狀態的流程圖。圖2的方法具有三種操作模式:VAD模式202、(部分)喚醒主機模式204和全系統操作模式206。
[0034]在VAD模式202中,沒有數據從麥克風中傳出。主機在這種模式中是睡眠的。在一個方面,當主機睡眠時,僅對來自麥克風的所產生的中斷信號必要反應的功能被使能。在這種模式下,主機低頻運行以降低功率消耗,并且所有非必要的功能都被停止。這種模式具有可能的絕對低功率消耗,因為所有非必要塊都被停止并且沒有時鐘或數據信號切換的發生。換句話說,模式202是低功率模式,其中VAD被使能并且不從主機接收外部時鐘。
[0035]在(部分)喚醒主機模式204中,從主機接收外部時鐘。數據被從麥克風中傳出。由于檢測到關鍵字和/或語音活動,主機被部分地喚醒。隨后,用于麥克風的外部時鐘被以對應于足以進行可靠的關鍵字檢測的較高的性能水平的時鐘頻率使能。
[0036]全系統操作模式206是麥克風的高功率或標準操作模式。
[0037]在圖2的狀態轉換圖的操作的一個示例中,系統開始于模式202。VAD算法檢測觸發從VAD模式202轉換到部分喚醒/喚醒模式204的事件。
[0038]在模式204中,主機檢測關鍵字/講話并判斷關鍵字、短語或句子被識別。這種確定觸發從模式204轉換到全系統喚醒206。
[0039]在模式206中,主機關鍵字檢測/講話識別算法判斷沒有識別出關鍵字、短語或句子,其觸發回到VAD模式202。這里,另一個模式或狀態(未在圖2中示出)確定系統應該進入部分喚醒/喚醒模式204或直接進入VAD模式202。
[0040]現在參見圖3,描述了使用VAD算法并包括節能特征的麥克風300。所述麥克風300包括麥克風芯片或裝置302。麥克風芯片302包括MEMS晶片、振動膜和電荷板。所述系統還包括ASIC 304。ASIC 304可以包括各種處理功能。MEMS芯片302從ASIC 304接收電荷栗信