專利名稱:將音頻與鈴聲數據混合的方法及系統的制作方法
技術領域:
本發明涉及音頻處理,且更確切地說涉及允許同時播放至少兩個音頻信號的音 頻混合技術。本發明與題為“智能縮放及混合以區分音頻源(Intelligent Scaling and Mixing to Differentiate Audio Sources) ”的共同待決且共同相關的第 11/449,454號專 利申請案相關。
背景技術:
現代電話手持機現在包含高級音樂特征,其允許用戶收聽高質量的音樂且還進行 電話呼叫和接收來自第三方的電話呼叫。多媒體手持機設計需要靈活的數字音頻取樣及強 大的處理能力以實現高保真品質的音頻錄制及播放特征。舉例來說,例如多段均衡或3D聲 音處理的復雜音頻處理可能變成優化信號以供經由揚聲器電話或頭戴式受話器播放所必 須的。在當前手持機變得越來越強大時,用戶同時在其手持機使用方面需要較大靈活 性。為了支持這些新興的復雜用戶模式,所述手持型裝置開始需要靈活的數字及模擬接口, 所述接口允許在播放模式期間混合不同內容。舉例來說,如果檢測到傳入電話呼叫,則許多 當前電話將暫停音樂或視頻播放。其它電話將降低音樂或視頻的音量并播放音調以警示用 戶一呼叫正在傳入。這些不同數據流通常具有不同取樣率,此情況增加了管理這些手持機 特征的復雜性。當蜂窩式電話閑置且接收傳入呼叫通知時,所述蜂窩式電話將通常存取待經由電 話的揚聲器播放的鈴聲數據。所述鈴聲數據可為簡單音調或復雜樂譜,且其通常由用戶選 擇以既在美感方面令人愉悅又識別呼叫者。然而,當蜂窩式電話的用戶已忙于用電話通話 時,鈴聲特征通常不存在。簡單音調聲音向手機用戶指示存在另外的傳入呼叫,因為手機無 法在不影響進行中的通話的質量的情況下產生復雜聲音。
發明內容
本發明中所描述的一個方面是一種在現行通信會話期間在通信裝置中播放經混 合的音頻的方法,所述方法包括從現行通信會話接收第一音頻信號;接收通知;響應于所 述通知,起始將經存儲的音頻文件轉換為第二音頻信號;混合第一音頻信號及第二音頻信 號以產生經混合的音頻信號;及將經混合的音頻信號輸出到通信裝置的輸出端。本發明中所描述的另一方面是一種經配置以在現行通信會話期間播放經混合的 音頻的通信裝置,所述裝置包括收發器,其經配置以接收第一音頻信號;事件處置器,其 經配置以接收通知;存儲設備,其經配置以存儲至少一個音頻文件;處理器,其經配置以基 于所接收的通知起始將存儲設備中所存儲的音頻文件轉換為第二音頻信號;混合器,其經 配置以混合第一音頻信號及第二音頻信號以產生經混合的音頻信號;及輸出裝置,其用于 輸出經混合的音頻信號。—個方面是一種在現行通信會話期間在通信裝置中播放經混合的音頻的方法。此方法包含從現行通信會話接收第一音頻信號;接收通知;響應于所述通知,起始將經存儲 的音頻文件轉換為第二音頻信號;混合第一音頻信號及第二音頻信號以產生經混合的音頻 信號;及將經混合的音頻信號輸出到通信裝置的輸出端。另一方面是一種經配置以在現行通信會話期間播放經混合的音頻的通信裝置。此 裝置包含收發器,其經配置以接收第一音頻信號;事件處置器,其經配置以接收通知;存 儲設備,其經配置以存儲至少一個音頻文件;處理器,其經配置以基于所接收的通知起始將 存儲設備中所存儲的音頻文件轉換為第二音頻信號;混合器,其經配置以混合第一音頻信 號及第二音頻信號以產生經混合的音頻信號;及輸出裝置,其經配置以輸出經混合的音頻 信號。又一配置是一種經配置以在現行通信會話期間播放經混合的音頻的通信裝置,其 中所述裝置具有用于從現行通信會話接收第一音頻信號的裝置;用于接收通知的裝置; 用于基于所述通知起始將經存儲的音頻文件轉換為第二音頻信號的裝置;用于混合第一音 頻信號及第二音頻信號以產生經混合的音頻信號的裝置;及用于將經混合的音頻信號輸出 到通信裝置的輸出端的裝置。再一配置是一種或一種以上處理器可讀存儲裝置,其具有處理器可讀代碼,所述 處理器可讀代碼用于對一個或一個以上處理器進行編程以執行在現行通信會話期間在通 信裝置中播放音頻的方法。所述存儲裝置經編程以執行一方法,所述方法是從現行通信會 話接收第一音頻信號;接收通知;響應于所述通知,起始將經存儲的音頻文件轉換為第二 音頻信號;混合第一音頻信號及第二音頻信號以產生經混合的音頻信號;及將經混合的音 頻信號輸出到通信裝置的輸出端。 另外一種配置是一種在通信裝置中的電路,其經配置以執行在現行通信會話期間 播放音頻的方法,所述方法是提供第一可混合的音頻信號;接收通知;基于所述所接收的 通知,起始將不可混合的音頻文件轉換為第二可混合的音頻信號;混合所述第一可混合的 音頻信號及所述第二可混合的音頻信號以產生經混合的音頻信號;及輸出所述經混合的音 頻信號。
圖1是本發明中的示范性配置的功能框圖。圖2是展示同時播放語音信號及MIDI文件的方法的流程圖。圖3是展示在一時間周期內分配處理能力的圖表。圖4是展示根據本發明中的一種配置的中斷優先權的圖表。
具體實施例方式一種配置是用于在現行通信會話期間在通信裝置中播放經混合的音頻的系統及 方法。舉例來說,一種配置允許向蜂窩式電話的用戶播放與傳入呼叫相關聯的鈴聲,同時所 述電話繼續對來自已正發生的電話通話的語音音頻進行編碼和解碼。所述鈴聲可為簡單音 符或復雜音樂片斷。如下文所論述,本文中所描述的其它配置將鈴聲的音樂數據與進行中 的通話合并,而不會使在通信裝置上發生的通話的質量降級。如所提及,通信裝置可為無線蜂窩式電話。另外,通信裝置可為個人數字助理
5(PDA)、個人通信器、基于陸線的電話或配備有通信能力的立體或便攜型音樂播放器。另外, 通信裝置可為使用IP(因特網協議)語音的移動單元,其中所述移動單元可為PDA、移動電 話、膝上型計算機、個人計算機等。一般來說,現行通信會話是兩個裝置之間的數據會話,其 中數據正傳輸到一裝置或從一裝置傳輸到另一裝置(例如,基站或另一終端)。現行通信會 話包括所述裝置與另一裝置或系統之間的通信鏈路。現行通信會話的一實例是無線通信系 統中的進行中的電話呼叫,例如,當第一無線呼叫者對第二基于地面的呼叫者或無線呼叫 者談話時。關于混合音頻信號,線性重疊的原理首先適用于聲波。亦即,當同時播放兩個聲音 時,每一聲音產生一聲波,且在任何時間點所測量的聲音大約等于在所述時間點所述兩個 波的和。因此,可稱混合兩個聲音產生單個聲音,所述單個聲音是所述兩個輸入聲音的和。 類似地,混合兩個音頻流(其各自代表一聲音)導致單個音頻流,所述單個音頻流代表所述 兩個輸入聲音的和。然而,混合兩個不同的音頻流可能不止涉及簡單的求和。舉例來說,在 一些配置中,必須首先確保每一音頻流處于“可混合的音頻格式”。可混合的音頻格式包含 其中存在代表一系列取樣時間點的基本聲波形的數據的數據格式。所述格式的一個實例是 脈碼調制(PCM)。為了混合兩個信號,對于兩個信號來說,取樣時間點相同可能是有利的。 此做法簡化了所述兩個信號的求和。為了實現此效果,可能必須對所述信號中的一者或兩 者重新取樣,亦即,計算不同系列的取樣時間點的基本聲波形的所述值。混合也可包含以其它方式改變一個或兩個音頻流。舉例來說,可能必須調整音量 (或基本波形的振幅)以便當兩個信號混合時避免不良音頻效果(例如,限幅)。改變所述 音頻流中的一者或兩者以使得收聽者在聽到經混合的音頻流時可區分所述兩個聲音可能 也是有利的。舉例來說,可相對于音頻流中的一者使音頻流中的另一者衰減以使得可較容 易聽到所述一者。音頻流中的每一者可使其平衡得以調整,以便在右聽筒中聽到一個音頻 流且在左聽筒中聽到另一個音頻流。在題為“智能縮放及混合以區分音頻源(Intelligent Scaling and Mixing to Differentiate Audio Sources) ”的第 11/449,454號美國專利申 請案中描述又一混合技術。因為混合可包含將每一數據流設置成可混合的格式,所以混合可包含數據流的合 成、解壓縮、解碼或其它處理。在為進行混合需要以合成為條件的一種類別的不可混合的音 頻文件格式是例如MIDI (樂器數字接口)的事件驅動文件格式。MIDI格式經設計以用于 在例如音樂合成器及PC聲卡的電子音樂裝置之間發送音樂信息。可在因特網上在MIDI. ORG處找到關于MIDI文件的更多信息。MIDI文件并不含有經數字化的聲音,而是含有可由 處理器解譯并合成為可混合的音頻流的一組數字音樂指令(音符)。因為MIDI格式僅含 有呈音符形式的指令,所以MIDI文件可能非常小。以MIDI格式存儲的音頻文件通常具有 擴展名.mid或.midi。其它相似或并入有MIDI的特征的格式包含XMF (可擴展音樂格式) 或SMAF(合成音樂移動應用格式)。一些事件驅動格式包括用于在特定時間播放所存儲的 數字音頻文件的指令,而不包括用于播放必須在特定時間合成的音符的指令(或除了用于 播放必須在特定時間合成的音符的指令之外,還包括用于在特定時間播放所存儲的數字音 頻文件的指令)。這些數字音頻文件可包含以可混合的音頻文件格式存儲的文件。還應注 意,可在將兩個事件驅動文件中的任一者合成為“可混合的音頻格式”之前混合所述兩個事 件驅動文件,且可在所述混合之后實現所述合成。
另一類別的不可混合的音頻文件格式包含例如MP3的經壓縮的音頻格式,其在輸 出到混合器或數/模轉換器之前需要處理。又一類別的不可混合的音頻文件格式包含經編 碼的音頻格式,例如,用以傳輸語音數據的無線通信應用(例如,EVRC(增強型可變速率編 解碼器)或GSM(全球移動通信系統))中的經編碼的音頻格式。這些不可混合的文件通常可轉換為在電子裝置內較容易混合的音頻格式。一種此 類別的可混合的格式包含PCM (脈碼調制)及相關格式,例如,ADPCM (自適應PCM)、WAV或 AIFF (音頻交換文件格式)。一種配置允許將至少兩個不可混合的音頻文件轉換為兩個可混合的音頻流并混 合所述音頻流以產生對用戶的經混合的音頻輸出。將在維持聲音的保真度并產生盡可能少 的因處理引起的時間延遲的同時實現此效果。舉例來說,如果在蜂窩式電話通話期間接收 到傳入呼叫,則將通話的語音數據與同所述傳入呼叫相關聯的鈴聲數據混合將是有利的。 經混合的音頻流的產生優選極少引起通話或傳入呼叫的通知的延遲,且類似地極少引起語 音數據及鈴聲數據的失真。雖然本發明的一個方面涉及傳入呼叫通知,但是可使用如本文中所描述的鈴聲數 據來執行各種其它通知。舉例來說,可使用專用鈴聲在電話通話期間宣告低電池電量狀況 或傳入文本消息的宣告。通知甚至可包含來自用戶的播放特定鈴聲或其它音頻文件的指 令。舉例來說,如果用戶正收聽MP3文件并希望查閱他/她的當前鈴聲庫。另一配置也可 能未能包含所述用戶起始的通知。應理解其它配置可利用在電話通話期間發生的任何類型 的通知。在一種配置中,為了在蜂窩式電話正使用時提供鈴聲音頻,處理器將鈴聲數據合 成為可混合的音頻信號。如本文中所揭示,此合成優選與蜂窩式電話正在呼叫中執行其正 常操作(例如,對語音包進行編碼及解碼)同時發生。在繼續下文之前,定義在描述本文中所描述的裝置的配置時將使用的一些額外術 語可能是有幫助的。因此,貫穿此詳細描述,以下術語應具有此處歸于所述術語的意義術語“宣告”或“呼叫宣告”意謂由電信裝置執行以指示傳入呼叫的感觀可感知發 生事件。宣告可為媒體文件、特定序列的閃爍或穩定光、振動或任何其它感觀可感知機制。術語“發起裝置”意謂發起出站呼叫的電信裝置。所述術語發起裝置也可與“主叫 方”或“發起方”可互換地使用。術語“接收裝置”意謂接收入站呼叫的電信裝置。所述術語接收裝置也可與“被叫 方”或“接收方”可互換地使用。所述系統包括如下文詳細論述的各種模塊。如所屬領域的技術人員可了解,所述 模塊中的每一者可包括各種子例程、程序、定義語句及宏。通常單獨編譯模塊中的每一者并 將其鏈接成單個可執行程序。因此,為了方便起見,使用對模塊中的每一者的以下描述來描 述優選系統的功能性。因此,可將模塊中的每一者經受的處理任意地重新分配到其它模塊 中的一者,一起組合在單個模塊中,或使其可在(例如)可共享的動態鏈接庫中獲得。可使用標準編程或工程技術將本文中所揭示的配置實施為方法、設備或制品以產 生軟件、固件、硬件或其任何組合。如本文中所使用的術語“制品”指實施在硬件或例如光 學存儲裝置及易失性或非易失性存儲器裝置的計算機可讀媒體中的代碼或邏輯。所述硬件 可包含(但不限于)現場可編程門陣列(FPGA)、專用集成電路(ASIC)、復雜可編程邏輯裝置(CPLD)、可編程邏輯陣列(PLA)、微處理器或其它相似處理裝置。圖1是本發明的示范性配置的功能框圖。此配置包含手機110。所述手機可為任 何類型的常規無線電話,例如,由SAMSUNG 、NOKIA 、RESEARCH IN MOTION 以及其 它公司制造的無線電話。所述手機包括收發器130、處理器112、存儲器126、混合器120及 揚聲器122以及其它。所述收發器130經配置以發送和接收數字信號。在特定配置中,收 發器可包括用于無線通信的天線。處理器112可為任何標準或定制設計的微處理器。在一 種配置中,處理器包括來自高通(Qualcomm)的MSM(移動臺調制解調器)系列的芯片組,例 如,MSM 6290或MSM 6800。可在因特網上在qualcomm. com處找到關于這些處理器的更多 信息。耦合到所述處理器的(或在一些配置中,所述處理器的一部分)是事件處置器128。 所述事件處置器128能夠經由小鍵盤、處理器、收發器或其它能夠發送通知并產生導致處 理器112采取預定動作的事件的裝置來接收來自用戶的通知。舉例來說,所述事件處置器 128可作為函數調用在軟件中實施。存儲器126可為任何類型的數字存儲設備,例如,快閃 存儲卡或磁性硬盤驅動器。耦合到存儲器(或在一些配置中存儲在存儲器內)的是音頻文 件庫124。可以例如上文所列舉的格式的各種格式存儲音頻文件124。音頻文件124可包括待在接收到由事件處置器128處置的傳入呼叫通知后播放的 鈴聲數據。當接收到所述傳入呼叫通知時,基于由用戶選擇的準則來選擇適當的音頻文件。 舉例來說,來自工作的手機呼叫可與作為MIDI文件存儲在所述音頻文件庫124中的第一鈴 聲相關聯,而來自朋友的電話呼叫可與作為WAV文件存儲在所述音頻文件庫124中的第二 鈴聲相關聯。混合器120經配置以將輸出提供到揚聲器122。混合器120經配置以將兩個或 兩個以上音頻流混合在一起,并且將單個音頻流輸出到揚聲器122。可單獨實施混合器120 或作為處理器的一部分實施混合器120,且可由軟件或固件來實現其執行的功能。如上文所 提及,為了混合兩個音頻流,將混合器連接到至少一聲碼器解碼器(vocoder decoder) 118 及一 MIDI合成器116。在一些配置中,聲碼器解碼器118及MIDI合成器116是混合器120 的一部分。聲碼器解碼器118經配置以將與電話呼叫或現行通信會話相關聯的語音包(語音 數據)解碼成可混合的音頻格式。所述聲碼器解碼器118對來自例如另一手機或陸線電話 的發起裝置的傳入話音進行解碼。MIDI合成器116經配置以基于輸入的MIDI文件以可混 合的音頻格式合成音頻信號。MIDI合成器的一個實例是CMX MIDI合成器。也在手機110 內的是聲碼器解碼器118,其對來自例如另一手機或陸線電話的發起裝置的傳入話音進行 解碼。當輸入語音包及MIDI文件時,來自混合器120的經組合的輸出允許用戶在與另一方 的電話通話期間聽到MIDI鈴聲。圖2是展示同時將語音信號及MIDI文件輸出到用戶的過程200的流程圖。當手 機具有正在處理的呼叫時,可發生所述過程200。在狀態210處,處理器等待接收傳入呼叫 通知。如果不存在另一傳入呼叫的通知,則狀態210繼續循環。一旦手機收到通知有傳入 呼叫,便在狀態212處從所存儲的MIDI文件中選擇與所述傳入呼叫相關聯的適當的鈴聲數據。一旦已在狀態212處選擇適當的鈴聲數據,則所述過程200移動到決策狀態220 以確定在手機內是否存在足夠可用處理能力來處理語音編碼、語音解碼及鈴聲數據的合 成。下文關于圖3更完整地論述此情況。如果在決策狀態220處作出處理器并不具有合成全部量的鈴聲數據(由于大量處理能力專用于語音編碼及/或解碼)的能力的確定,則在 狀態216處修改鈴聲數據。在狀態216中,系統可減少鈴聲數據的復雜性以便可使用較少處理器循環來合成 所述鈴聲數據。此做法允許系統維持語音編碼及解碼處理的保真度,但仍向用戶播放所選 擇的鈴聲。在一種配置中,在狀態216期間,當正由MIDI合成器合成鈴聲時,系統從所述鈴 聲中移除一個或一個以上音符。因為MIDI文件基本上是組成鈴聲的音符的文件,所以有可 能在將文件作為鈴聲重建成數字音樂之前從MIDI文件中減少特定音符。典型用戶不可能 注意到此減少,因為此減少將僅對鈴聲的總體聲音作出極微小的改變。在一種配置中,音符移除的次序是基于限制移除音符對用戶的所感知的影響。舉 例來說,因為收聽者將不會在像相對較大聲的音符一樣的程度上發現較安靜的音符的遺 失,所以移除音量較低的音符將對收聽者產生較少影響。對于減少鈴聲的復雜性的另一選 擇是通過移除(且因此不合成)“釋放部分”中的音符。在一鈴聲中,任何特定音符或音調 均可具有若干狀態。最初,音符在特定時間周期內可處于“初始”部分中。所述音符接著在 特定時間周期內從所述初始部分移動到“持續”部分。所述“持續”部分之后是音符的釋放 部分。因為與其它部分相比釋放部分可能較安靜且對于鈴聲的總體樂曲來說較不重要,所 以減少音符的釋放部分的持續時間可能不會被用戶注意。預期減少鈴聲數據的復雜性的另外其它方法。舉例來說,可給予例如旋律的特定 MIDI音軌高于其它音軌的優先權。如已知的,與例如和音或和聲的一次性事件相反,鈴聲 的旋律是音樂事件的線性連續。因此,可用高于和聲的保真度來合成旋律,而不破壞鈴聲的 所感知的聲音。因此,在一種配置中,移除來自和聲或特定和音的音符以便減少鈴聲的復雜 性,而不改變旋律音軌內的音符。一旦系統通過上文所描述的方法中的一者減少了音樂的復雜性,所述過程200便 移動到決策狀態218,其中作出是否已將文件減少足夠量以允許處理器合成鈴聲且還對進 行中的電話呼叫的語音信號進行解碼和編碼的確定。如果作出不存在足夠的剩余MIPS(每 秒百萬條指令,處理能力的度量)來以高保真度對語音信號進行解碼和編碼的確定,則所 述過程200返回到狀態216,其中采取額外方法來減少鈴聲的復雜性。然而,如果作出手持 機內存在足夠的剩余MIPS來對語音進行解碼和編碼且還合成鈴聲的確定,則所述過程200 移動到狀態220,其中合成鈴聲。一旦已在狀態220處將鈴聲數據合成為音頻信號,便將所述所得音頻信號與從聲 碼器解碼器接收的輸出音頻信號混合222。為了將從MIDI合成器接收的音頻信號與來自聲 碼器解碼器的語音數據混合,對每一數據流重新取樣以具有相同取樣頻率可能是有利的。 在一種配置中,在48kHz下對語音及鈴聲音頻信號取樣。當然,系統并不限于在任何特定頻 率下取樣。接著經由手機的揚聲器播放經混合的聲音224。圖3是展示在60毫秒的時間周期內分配手持機中的處理能力的圖表,在所述時間 周期內,用戶正進行電話呼叫且鈴聲也正試圖在同一周期期間播放,從而通知用戶有傳入 呼叫。在手機通話期間,處理器負責語音編碼、語音解碼及鈴聲合成以及其它。在特定電話 呼叫期間,語音編碼/解碼可使用的芯片/微處理器/計算機處理能力的最大量取決于正 處理的特定編解碼器。在任何給定時間使用的此最大量取決于實際編碼或解碼的信號。舉 例來說,編碼/解碼靜默耗費極少的處理能力。在圖3中,可能需要70 %的處理能力的示范
9性編解碼器用于在電話呼叫期間對語音信號進行編碼和解碼。當此編解碼器在使用時,此 70%的處理能力專用于語音編碼/解碼。因此,在接收到通知的情況下,剩余處理能力可用 于鈴聲合成。當然,編解碼器可需要的處理能力的百分比可為除70%以外的數目,且預期在一 種配置中,可根據使用的編解碼器來動態分配處理能力。在圖3中所展示的實例中,在0毫 秒與10毫秒之間,大約一半的專用處理能力用于聲碼器操作。在10毫秒結束時,語音解碼 已將所接收的不可混合的語音包轉換成可混合的音頻格式,所述可混合的音頻格式可被饋 送到數/模轉換器并經由揚聲器播放。在10毫秒結束時,向電話的用戶播放所述經解碼的 音頻。當播放此音頻時,在下一 10毫秒中,聲碼器需要大約3/4的專用處理能力來執行語 音包編碼及解碼。在下一 10毫秒結束時,將不可混合的語音包解碼成可混合的音頻格式并 向用戶播放所述語音包。因此,在0與20毫秒之間,處理器對來自電話通話的語音信號完 全編碼和解碼。在大約20毫秒時,接收傳入呼叫通知,從而促使處理器選擇適當的鈴聲數 據并開始將其合成為可混合的音頻信號。因此系統開始執行10毫秒的語音編碼/解碼及 MIDI合成兩者。此外,未使用100%的專用于聲碼器操作的處理能力,且在此情況下未使用 100%的用于鈴聲合成的剩余處理能力。因為可在來自處理器的可用MIPS內合成第一 10毫 秒的MIDI鈴聲數據,所以無需采取任何措施來減少鈴聲的復雜性。在此10毫秒時間周期 結束時,已將不可混合的語音包轉換為可混合的音頻流,且已將不可混合的鈴聲數據合成 為可混合的音頻流。混合此兩個流并將其以盡可能少的延遲播放。因此,當在下一 10毫秒 內合成鈴聲數據的下一部分時,向用戶播放包括語音及鈴聲音頻的經混合的音頻流。在30 毫秒與40毫秒之間的下一 10毫秒中,大量專用聲碼器處理能力正在使用,且繼續發生鈴聲 合成。然而,在此情況下,鈴聲數據過于復雜以致不能使用可用處理能力來完全合成所述鈴 聲數據。所述可用處理能力用于盡可能如實地合成10毫秒的鈴聲數據。如上文所論述, 系統可通過上文所描述的方法中的一者或一者以上來減少鈴聲的復雜性,而非僅合成(例 如)第一 5毫秒的鈴聲部分。舉例來說,通過從輸入到MIDI合成器的數據中移除音符,需 要較少的處理能力來將數據合成為音頻信號。如上文所論述,音符移除的次序是基于限制 丟棄音符的所感知的效果。應認識到,在一種配置中,系統繼續減少復雜性以使得鈴聲的時 序不會受進行中的電話通話的損害。因此,雖然可減少鈴聲的復雜性,但并非合成所述鈴聲 而使得音樂樂曲中具有間隙或跳躍。樂曲仍在其正常時間周期中播放,可依據處理器對語 音數據進行編碼及解碼的繁忙程度而僅或多或少地減少所述樂曲的復雜性。此做法確保鈴 聲維持與用戶預期的聲音相同的聲音而無跳過或噪音。以許多方式中的任一者執行減少鈴聲數據的復雜性。在一種配置中,把將在處理 能力可用的情況下在給定時間合成的所有音符存儲在存儲器中,其中給予每一音符設置成 開或關的“現行”屬性。為了減少復雜性,僅需要將“現行”屬性改成關。將對MIDI合成器 進行編程以僅合成“現行”屬性設置成開的那些音符。圖4是展示根據一種配置的中斷優先權的圖表。考慮混合器410、音頻命令412、 聲碼器解碼器414、MIDI合成器416及聲碼器編碼器418間的優先權,混合器410具有最高 優先權以確保無噪音播放。第二,音頻命令412具有第二優先權,因為其是短小的,且在一 些配置中,主處理器需要快速的響應。第三,聲碼器解碼器414具有第三優先權,因為其時序約束可能較嚴格。MIDI合成器416具有第四優先權,因為其10毫秒的時間分辨率比聲碼 器編碼器的20毫秒幀精細。將MIDI合成器設計成不會消耗大于預分配的處理能力的處理 能力。否則,聲碼器編碼器的輸出可能惡化。聲碼器編碼器418具有較低優先權。最終,因為所有處理是中斷驅動的,所以閑置 循環在最上級代碼中可能是有利的。在硬件支持MIDI合成的情況下,可存在額外MIDI硬 件ISR。MIDI硬件的優先權可與音頻命令相同以實現MIDI硬件的最大利用。所述中斷用 于對處理器執行給定命令系列的次序區分優先次序。舉例來說,如果處理器正使用聲碼器 編碼器對語音包進行編碼且其突然接收到開始MIDI合成的指令,則處理器可在返回使用 聲碼器編碼器完成對語音包的編碼之前執行MIDI合成(因為其中斷優先權較高)。如上文所提及,一種配置是一種在現行通信會話期間在通信裝置中播放經混合的 音頻的方法,所述方法包括從現行通信會話接收第一音頻信號;接收通知;響應于所述通 知,起始將經存儲的音頻文件轉換為第二音頻信號;混合第一音頻信號及第二音頻信號以 產生經混合的音頻信號;及將經混合的音頻信號輸出到通信裝置的輸出端。上文已描述用 于執行此方法的步驟的結構。下文論述用于執行所述步驟的額外方式。可由收發器130執 行從現行通信會話接收第一音頻信號的步驟。收發器130可包含用于接收無線信號的天線 或與公共數據網絡(例如,因特網)的有線連接。舉例來說,處理器112也可經由收發器130 來接收第一音頻信號。可由事件處置器128執行接收通知的步驟。舉例來說,當蜂窩式電 話的電池電量低時,處理器112可向事件處置器128產生通知,事件處置器128又指示處理 器112從存儲器126或音頻文件庫124中選擇適當的音頻文件。舉例來說,處理器112也 可從事件處置器或經由收發器130來接收通知。可由處理器112在其從存儲器126或音頻 文件庫124中加載音頻文件時執行起始將經存儲的音頻文件轉換為第二音頻信號的步驟。 存儲器126也可在其響應于來自處理器112或事件處置器128的指令將第二音頻信號傳輸 到處理器112、混合器120或MIDI合成器116時執行起始轉換。可由混合器120執行混合 第一音頻信號及第二音頻信號的步驟。另外,可由處理器112執行此步驟。在混合例如兩 個MIDI文件的兩個事件驅動音頻信號的情況下,MIDI合成器116可能能夠執行所述混合。 可由混合器120執行將經混合的音頻信號輸出到通信裝置的輸出端的步驟。通信裝置的輸 出裝置可為揚聲器122或收發器130。在輸出裝置為收發器130的情況下,處理器112可 能能夠執行所述輸出步驟。在輸出裝置為天線的配置中,收發器130可執行所述輸出步驟。 在混合器120將經混合的音頻信號饋送到處理器112以用于進一步處理(例如,在輸出到 揚聲器之前的數/模轉換)的配置中,處理器112可執行所述輸出步驟。應注意,所屬領域的技術人員將認識到一電路可實施上文所描述的功能中的一些 或全部。可能存在一個實施所有功能的電路。也可能存在與一可實施所有功能的第二電路 組合的電路的多個區段。大體來說,如果在電路中實施多個功能,則所述電路可為集成電 路。使用當前移動平臺技術,集成電路可包括至少一個數字信號處理器(DSP)及控制所述 至少一個DSP及/或與所述至少一個DSP通信的至少一個ARM處理器。可按區段描述一電 路。通常重新使用區段以執行不同功能。通信裝置中的電路可經配置以提供第一可混合的音頻信號。同一電路、不同電路 或同一或不同電路的第二區段可經配置以接收通知。另外,同一電路、不同電路或同一或不 同電路的第三區段可經配置以基于所接收的通知起始將不可混合的音頻文件轉換為第二可混合的音頻信號。經配置以起始轉換的電路部分可耦合到接收通知的電路部分,或其可 為同一電路。同一或不同電路的第四區段可經配置以混合第一可混合的音頻信號及第二可 混合的音頻信號以產生經混合的音頻信號。所述第四區段可有利地耦合到第一區段及第四 區段以獲得第一及第二可混合的音頻信號。或者,第一、第三及第四區段可實施于同一電路 中。同一或不同電路的第五區段可經配置以輸出經混合的音頻信號。所述第五區段可有利 地耦合到第四區段,或其可與第四區段實施于同一電路中。 前文描述闡述各種優選配置及其它示范性但非限制性配置。所述描述給出關于所 揭示的配置的組合及模式的一些細節。所述配置的所揭示的特征及方面的其它變化、組合、 修改、模式及/或應用(包含所屬領域的技術人員在閱讀本說明書后了解的變化、組合、修 改、模式及/或應用)也在本發明的范圍內。因此,應僅通過清楚地閱讀隨附權利要求書來 確定本文中所主張的內容的范圍。
權利要求
一種在現行通信會話期間在通信裝置中播放經混合的音頻的方法,所述方法包括從所述現行通信會話接收第一音頻信號;接收通知;響應于所述通知,起始將經存儲的音頻文件轉換為第二音頻信號;混合所述第一音頻信號及所述第二音頻信號以產生經混合的音頻信號;以及將所述經混合的音頻信號輸出到所述通信裝置的輸出端。
2.根據權利要求1所述的方法,其中所述第一音頻信號包括語音數據。
3.根據權利要求1所述的方法,其中所述通知包括傳入呼叫的通知。
4.根據權利要求1所述的方法,其中所述通信裝置包括電話且所述現行通信會話包括 進行中的電話呼叫。
5.根據權利要求1所述的方法,其中所述通信裝置是無線蜂窩式電話。
6.根據權利要求1所述的方法,其中所述第二音頻文件包括鈴聲數據。
7.根據權利要求1所述的方法,其中所述第二音頻文件包括以事件驅動音頻格式存儲 的文件。
8.根據權利要求7所述的方法,其中所述事件驅動音頻格式包括MIDI分量。
9.根據權利要求1所述的方法,其中所述混合包括改變所述音頻信號中的至少一者的 音頻感知特性。
10.根據權利要求1所述的方法,其中所述混合包括對可混合的音頻文件中的至少一者重新取樣。
11.根據權利要求1所述的方法,其中所述混合包括合成、解壓縮或解碼。
12.—種經配置以在現行通信會話期間播放經混合的音頻的通信裝置,所述裝置包括收發器,其經配置以接收第一音頻信號; 事件處置器,其經配置以接收通知; 存儲設備,其經配置以存儲至少一個音頻文件;處理器,其經配置以基于所述所接收的通知起始將所述存儲設備中所存儲的音頻文件 轉換為第二音頻信號;混合器,其經配置以混合所述第一音頻信號及所述第二音頻信號以產生經混合的音頻 信號;以及輸出裝置,其經配置以輸出所述經混合的音頻信號。
13.根據權利要求12所述的裝置,其中所述通信裝置包括電話且所述現行通信會話包 括進行中的電話呼叫。
14.根據權利要求13所述的裝置,其中所述電話包括無線蜂窩式電話。
15.根據權利要求12所述的裝置,其中所述輸出裝置是揚聲器。
16.根據權利要求12所述的裝置,其中所述處理器、事件處置器及混合器中的至少兩 者實施在同一單元中。
17.根據權利要求12所述的裝置,其中所述處理器進一步經配置以對所接收的語音數 據進行解碼以提供第一可混合的音頻信號。
18.根據權利要求12所述的裝置,其中所述通知由所述處理器產生。
19.根據權利要求12所述的裝置,其中所述通知包括傳入呼叫通知。
20.根據權利要求12所述的裝置,其中不可混合的音頻文件包括鈴聲數據。
21.根據權利要求12所述的裝置,其中所述混合器經配置以對所述可混合的音頻信號 中的至少一者重新取樣。
22.根據權利要求12所述的裝置,其中所述混合器及所述處理器中的至少一者經配置 以執行合成、解壓縮或解碼。
23.—種經配置以在現行通信會話期間播放經混合的音頻的通信裝置,所述裝置包括用于從所述現行通信會話接收第一音頻信號的裝置; 用于接收通知的裝置;用于基于所述通知起始將經存儲的音頻文件轉換為第二音頻信號的裝置; 用于混合所述第一音頻信號及所述第二音頻信號以產生經混合的音頻信號的裝置;以及用于將所述經混合的音頻信號輸出到所述通信裝置的輸出端的裝置。
24.一種或一種以上處理器可讀存儲裝置,其具有處理器可讀代碼,所述處理器可讀代 碼用于對一個或一個以上處理器進行編程以執行在現行通信會話期間在通信裝置中播放 音頻的方法,所述方法包括從所述現行通信會話接收第一音頻信號; 接收通知;響應于所述通知,起始將經存儲的音頻文件轉換為第二音頻信號; 混合所述第一音頻信號及所述第二音頻信號以產生經混合的音頻信號;以及 將所述經混合的音頻信號輸出到所述通信裝置的輸出端。
25.根據權利要求24所述的一種或一種以上處理器可讀存儲裝置,其中所述現行通信 會話包括進行中的電話呼叫。
26.根據權利要求24所述的一種或一種以上處理器可讀存儲裝置,其中所述通知包括 傳入電話呼叫的通知。
27.—種在通信裝置中的電路,其經配置以執行在現行通信會話期間播放音頻的方法, 所述方法包括提供第一可混合的音頻信號; 接收通知;基于所述所接收的通知,起始將不可混合的音頻文件轉換為第二可混合的音頻信號; 混合所述第一可混合的音頻信號及所述第二可混合的音頻信號以產生經混合的音頻 信號;以及輸出所述經混合的音頻信號。
28.根據權利要求27所述的電路,其中所述第一可混合的音頻信號包括經解碼的語音 數據。
29.根據權利要求27所述的電路,其中接收所述通知包括接收傳入電話呼叫的通知。
全文摘要
本發明揭示一種用于在現行通信會話期間在通信裝置(110)中播放經混合的音頻的方法及系統。一種配置允許與在進行中的電話呼叫期間接收的語音音頻同時聽到鈴聲音頻。在一種配置中,所述裝置(110)包括收發器(130),其經配置以接收第一音頻信號;事件處置器(128),其經配置以接收通知;存儲設備(126),其經配置以存儲至少一個音頻文件(124);處理器(112),其經配置以基于所述所接收的通知起始將所述存儲設備(126)中所存儲的音頻文件(124)轉換為第二音頻信號;混合器(120),其經配置以混合所述第一音頻信號及所述第二音頻信號以產生經混合的音頻信號;及輸出裝置(122),其用于輸出所述經混合的音頻信號。
文檔編號H04M1/725GK101911662SQ200880123578
公開日2010年12月8日 申請日期2008年11月21日 優先權日2007年11月21日
發明者卡西克·卡納安, 張敖成, 惠雅·納爾遜, 西瓦·帕萬·庫馬爾·米特納拉, 貝俊彥 申請人:高通股份有限公司