在呼叫方側替換電話待機音樂的方法和裝置的制造方法
【技術領域】
[0001]本發明涉及通信領域,尤其涉及在被置于待機狀態的電話呼叫中對音頻內容進行操控。
【背景技術】
[0002]常見的電話功能是將用戶置于“保持”或者“待機(on-hold)”狀態。當第一用戶將第二用戶置于待機狀態時,在連接被保持的同時,第一用戶的手持設備從該連接斷開。這使得第一用戶能夠進行另一呼叫或者離開手持設備。當保持功能或狀態被使能時,第二用戶可以被連接至接收信號路徑的另一信號源(例如,廣播新聞或者預先記錄的消息)。用于待機連接的非常常見的信號源是被稱為“待機音樂”的預先記錄或者廣播的音樂,其中當連接處于待機狀態時,音樂選擇被傳送至接收端。音樂選擇在第二用戶的手持設備接收端被播放,直到待機狀態終止為止。
[0003]第二用戶一般無法對待機音樂進行控制。一些類型的待機音樂可能是令人反感或討厭的。因此,一般需要用由第二用戶選擇并在連接的第二用戶側提供的其他內容來替換待機音樂。這一需求導致允許在電話連接中替換待機音樂的各種方法和裝置的開發。
[0004]例如,W02009/073035公開了一種無線電話手持設備,其中,當處于待機狀態時,該手持設備允許用戶選擇用于手持設備接收端的媒體播放、以及隨后在待機狀態終止時被用信號通知的一個或多個源。待機狀態的檢測是通過檢測待機音樂或接收待機信令實現的。媒體源位于用戶的手持設備中或者通過在手持設備和網絡之間建立的單獨連接被訪問。
[0005]類似地,US7, 136,479公開了在電話接收端用來自本地源的音頻內容來替換待機音樂。在待機音樂被檢測到時,本地音頻內容被播放給用戶。
[0006]更一般地,US8, 412,164公開了當用戶在電話連接中被置于待機狀態時再現各種用戶可選擇的數據。
【發明內容】
[0007]待機音樂的檢測花費了顯著時間。當待機音樂因為待機條件被取消而被終止時,這尤其是不期望的。例如,當呼叫方在被置于待機狀態的同時播放他或她自身的內容時,在呼叫方自身內容的播放可以被停止并且正常的雙向語音通信被建立之前,待機條件的取消必須被察覺或確定。因此,之前被置于待機狀態并聆聽他或她自身的音樂的呼叫方可能會錯過另一方所說的前面一部分單詞。
[0008]本方法緩解或移除了上面所討論的不期望的狀況。
[0009]在本方法的第一方面,在電話連接中由第二方向第一方提供的電話待機音樂被檢測到。待機音樂的檢測可以在作為被置于待機狀態的一方的第一方側的電話設備中、或者在位于第一和第二方之間的網絡中的檢測器中執行,其中,該網絡具有到連接的入口并且具有對于該連接的某些方面的控制權。待機音樂在被檢測到時,在第一方的控制下被修改或提升,或者被替換為由第一方選擇的內容。對待機音樂的修改包括減弱或靜音。提升包括向待機音樂添加非音頻內容(待機音樂在再現時被減弱,即,被以更低的音量再現或者被完全靜首)。
[0010]例如,用戶可以在被置于待機狀態時觀看展示圖片的幻燈片。在幻燈片展示期間,待機音樂被以較低的音量回放,并且散布于待機音樂中的所有或所選擇的通告可以被以較高的音量甚至原來的音量回放。一般,音量改變之間的漸變避免了點擊噪音(click-noise)。
[0011]替換包括利用包括靜音或靜電噪音在內的任何音頻或音視頻內容替換。非音頻內容包括幻燈片展示、照片展示、文本、網絡攝像頭視頻等。用于提升或替換的內容取決于第一方的裝備的能力。替換或提升待機音樂的內容由獨立于第二方的源提供。
[0012]對待機音樂的檢測被連續執行。來源于第二方的一段最近接收的音頻信息被連續存儲。即,大約數秒的輸入音頻信息-指向第一方-被以浮動窗口的方式存儲(始終包括當前輸入的音頻信息和來自預定的在先時段的音頻信息)。所存儲的輸入音頻的長度(即,浮動窗口的長度)取決于檢測待機音樂所需的時間。如之前提到的,待機音樂的檢測將花費一些時間(例如,當使用音頻信號分析時),因為音頻信號必須在依賴于算法的某段時間內被分析。當在檢測到待機音樂的在先時間段之后沒有再檢測到待機音樂時,僅從所存儲的一段最近接收的音頻信息中取回語音信息(即,還可能存在于所存儲的時間窗口中的任何待機音樂被忽略并且不被取回)。用于待機音樂檢測的音頻信號分析可以使用傳統算法,例如,由Schreiner和Slaney在加利福尼亞州帕羅奧圖的Interval ResearchCor.中發表的 “Construct1n and evaluat1n of a robust multifeature Speech/Music discriminator (健壯多功能語音/音樂鑒別器的構造和評估)”、以及由奧地利林茨大學(Kepler University)的 Seyerlehner, Pohle, Schedl 和 Widmer 在 2007 年發表的“Automatic Music Detect1n in Televis1n Product1ns (電視生產中的自動音樂檢測)”中提到的用于音樂/語音辨認的已知算法。
[0013]一般,待機音樂的檢測可以被以不同方式執行。之前已經提到了使用音頻信號分析的一種方式。另一種方式包括向待機音樂(可選地還向語音通告)添加水印。又一種方式包括以類似于FM無線電中使用的RDS (Rad1 Data System,無線電數據系統)流量通告的帶內方式,或者在專用的控制信道上傳送信號(例如,標記)。在每種情形中,檢測器被設置在第一方的設備處,或者被設置在網絡中并且與第一方的設備通信。檢測所需的時間可以在這些不同方式之間變動。
[0014]應用于連接的待機音樂檢測的類型(即,音頻信號分析、水印、或者被傳送的標記)可以根據所撥打的電話號碼被預先設置。該信息可以被存儲于在撥號時訪問的數據庫中。該數據庫可以被自動更新(例如,在網絡上或者通過學習算法)。例如,一旦電話號碼被撥打并且待機音樂被接收到,用戶就可以手動觸發嘗試每種檢測類型的辨認處理(優選地從水印和標記開始)。一旦特定類型被檢測到,信息即被存儲于數據庫中供以后參考。當然,可以用使音頻信號分析長期運行并且嘗試檢測待機音樂來替換用戶交互。一旦通過音頻信號分析檢測到待機音樂,則可以嘗試其他方法進行改進,并且可以基于該分析更新數據庫。在改進中,數據庫存儲與電話號碼相關聯的典型的音樂類型(例如,使用少數音符或“真實的”音樂錄音以電子化的方式生成的音樂)。該信息可以用于通過相應地預先設置檢測器來實現更快的辨認。
[0015]當待機音樂不再被檢測到時,對待機音樂的修改和提升、或者替換被停止,并且所取回的語音信息被再現給第一方。應當注意,取回語音信息、停止修改和提升、或者替換的順序是可交換的。由于檢測待機音樂或者其缺失所需的時間,會在第一和第二方之間的通信中引入時間偏移。
[0016]在本方法的實施例中,在待機音樂不再被檢測到之后,由檢測導致的時間偏移被消除。在第一追趕模式中,從所存儲的一段最近接收的音頻信息中取回的語音信息被以比原來的速度更快的速度回放,直到來源于第二方的所存儲的一段最近接收的音頻信息中被回放的語音信息對應于當前從第二方接收的音頻信息為止。此時,由檢測待機音樂的缺失所需的時間引入的偏移被取消,并且第一和第二方之間的通信被同步。在這點,可以停止記錄從第二方接收的信息。
[0017]在第一追趕模式的改進中,通過相應的音頻信號處理,由以比原來的速度更快的速度回放從所存儲的一段最近接收的音頻信息取回的語音信息引入的更高的音高被調低。
[0018]在第二追趕模式中,在從所存儲的一段最近接收的音頻信息中取回的語音信息中檢測靜默期。靜默期在再現期間被縮短甚至被跳過,直到再現的所取回的語音信息和當前從第二方接收的音頻信息彼此對應為止。此時,由檢測待機音樂的缺失所需的時間引入的偏移被取消,并且第一和第二方之間的通信被同步。在這點,可以停止記錄從第二方接收的?目息O
[0019]第一和第二追趕模式可以被組合在一起,以實現第一和第二方之間的通信的更快的同步。
[0020]很常見的是,在待機音樂中散布有語音通告(S卩,中斷音樂)。這會妨礙待機音樂檢測并導致被提升或者被替換的內容的再現中的不期望的中斷(尤其是在散布的通告沒有對待機方提供額外信息或價值的情形下)。這樣的通告包括諸如“請保持在線”、“服務代理將很快響應,感謝你的耐心”、或“所有線路忙,請等待”之類的通用或標準語音通告。這種類型的通告可以被分配給第一類型語音通告的群組,在本方法的環境下這種類型的通告可以被忽略。在一個實施例中,本方法進一步包括識別散布于待機音樂中的語音通告并忽略選自第一類型語音通告的列表中的語音通告。即,第一類型的語音通告將不會導致停止被提升的內容的再現或者內容的替換