確定聲道間時間差參數的方法和裝置的制造方法
【專利摘要】提供一種確定聲道間時間差參數的方法和裝置,能夠降低在立體聲編碼過程中聲道間時間差參數搜索計算過程的計算量,方法包括:根據第一聲道的時域信號及第二聲道的時域信號,確定基準參數,基準參數對應于第一聲道的時域信號與第二聲道的時域信號之間的獲取順序,第一聲道的時域信號及第二聲道的時域信號對應于同一時段;根據基準參數和極限值Tmax,確定搜索范圍,其中,極限值Tmax是根據第一聲道的時域信號的采樣率確定的,搜索范圍屬于[-Tmax,0],或搜索范圍屬于[0,Tmax];基于第一聲道的頻域信號及第二聲道的頻域信號,在搜索范圍內進行搜索處理,以確定與第一聲道及第二聲道相對應的第一聲道間時間差ITD參數。
【專利說明】
確定聲道間時間差參數的方法和裝置
技術領域
[0001] 本發明涉及音頻處理領域,并且更具體地,涉及確定聲道間時間差參數的方法和 裝置。
【背景技術】
[0002] 隨著生活質量的提高,人們對高質量音頻的需求不斷增大。相對于單聲道音頻,立 體聲音頻具有各生源的方位感和分布感,能夠提高信息的清晰度和可懂度,因而備受人們 青睞。
[0003]目前,已知一種針對立體聲音頻信號的傳輸技術,編碼端將立體聲信號轉換為單 聲道音頻信號和聲道間時間差(ITD,Inter-Channel Time Difference)等參數,分別對其 進行編碼并傳輸給解碼端,解碼端得到單聲道音頻信號后,進一步根據ITD等參數恢復立 體聲信號,從而,能夠實現立體聲信號的低比特高質量傳輸。
[0004] 在上述技術中,編碼端基于單聲道音頻的時域信號的采樣率,能夠確定該采樣率 下ITD參數的極限值!^,,從而,可以基于該頻域信號,逐子帶在[-τ_,T_]范圍內搜索計 算以獲得ITD參數。
[0005] 但是,上述較大的搜索范圍致現有技術在頻域內確定ITD參數過程的計算量較 大,增加了編碼端的性能要求,影響了處理效率。
[0006] 因此,希望提供一種技術,能夠在確保ITD參數準確性的前提下,減少ITD參數搜 索計算過程的計算量。
【發明內容】
[0007] 本發明實施例提供一種確定聲道間時間差參數的方法和裝置,能夠降低在立體聲 編碼過程中聲道間時間差參數搜索計算過程的計算量。
[0008] 第一方面,提供了一種確定聲道間時間差參數的方法,該方法包括:根據第一聲道 的時域信號及第二聲道的時域信號,確定基準參數,該基準參數對應于該第一聲道的時域 信號與該第二聲道的時域信號之間的獲取順序,其中,該第一聲道的時域信號及該第二聲 道的時域信號對應于同一時段;根據該基準參數和極限值!^.,確定搜索范圍,其中,該極限 值!^.是根據該第一聲道的時域信號的采樣率確定的,該搜索范圍屬于[_Τ_,0],或該搜索 范圍屬于[0,Τ_];基于該第一聲道的頻域信號及該第二聲道的頻域信號,在該搜索范圍內 進行搜索處理,以確定與該第一聲道及該第二聲道相對應的第一聲道間時間差ITD參數。
[0009] 結合第一方面,在第一方面的第一種實現方式中,該根據第一聲道的時域信號及 第二聲道的時域信號,確定基準參數,包括:對該第一聲道的時域信號及該第二聲道的時域 信號進行互相關處理,以確定第一互相關處理值及第二互相關處理值,其中,該第一互相關 處理值是該第一聲道的時域信號相對于該第二聲道的時域信號的互相關函數在預設范圍 內的最大函數值,該第二互相關處理值是該第二聲道的時域信號相對于該第一聲道的時域 信號的互相關函數在該預設范圍內的最大函數值;根據該第一互相關處理值及該第二互相 關處理值之間的大小關系,確定該基準參數。
[0010] 結合第一方面及其上述實現方式,在第一方面的第二種實現方式中,該基準參數 是該第一互相關處理值及該第二互相關處理值中較大一方所對應的索引值或者該索引值 的相反數。
[0011] 結合第一方面及其上述實現方式,在第一方面的第三種實現方式中,該根據第一 聲道的時域信號及第二聲道的時域信號,確定基準參數,包括:對該第一聲道的時域信號及 該第二聲道的時域信號進行峰值檢測處理,以確定第一索引值及第二索引值,其中,該第一 索引值是與該第一聲道的時域信號在預設范圍內的最大幅度值相對應的索引值,該第二索 引值是與該第二聲道的時域信號在該預設范圍內的最大幅度值相對應的索引值;根據該第 一索引值與該第二索引值之間的大小關系,確定該基準參數。
[0012] 結合第一方面及其上述實現方式,在第一方面的第四種實現方式中,該方法還包 括:基于第二ITD參數,對該第一 ITD參數進行平滑處理,其中,該第一 ITD參數是第一時段 的ITD參數,該第二ITD參數是第二時段的ITD參數的平滑值,該第二時段處于該第一時段 之前。
[0013] 第二方面,提供了一種確定聲道間時間差參數的裝置,該裝置包括:確定單元,用 于根據第一聲道的時域信號及第二聲道的時域信號,確定基準參數,該基準參數對應于該 第一聲道的時域信號與該第二聲道的時域信號之間的獲取順序,其中,該第一聲道的時域 信號及該第二聲道的時域信號對應于同一時段,并根據該基準參數和極限值τ_,確定搜索 范圍,其中,該極限值τ_是根據該第一聲道的時域信號的采樣率確定的,該搜索范圍屬于 [-τ_,ο],或該搜索范圍屬于[0, τ_];處理單元,用于基于該第一聲道的頻域信號及該第 二聲道的頻域信號,根據該基準參數,進行搜索處理,以確定與該第一聲道及該第二聲道相 對應的第一聲道間時間差ITD參數。
[0014] 結合第二方面,在第二方面的第一種實現方式中,該確定單元具體用于對該第一 聲道的時域信號及該第二聲道的時域信號進行互相關處理,以確定第一互相關處理值及第 二互相關處理值,并根據該第一互相關處理值及該第二互相關處理值之間的大小關系,確 定該基準參數,其中,該第一互相關處理值是該第一聲道的時域信號相對于該第二聲道的 時域信號的互相關函數在預設范圍內的最大函數值,該第二互相關處理值是該第二聲道的 時域信號相對于該第一聲道的時域信號的互相關函數在該預設范圍內的最大函數值。
[0015] 結合第二方面及其上述實現方式,在第二方面的第二種實現方式中,該確定單元 具體用于將該第一互相關處理值及該第二互相關處理值中較大一方所對應的索引值或者 所述索引值的相反數確定為該基準參數。
[0016] 結合第二方面及其上述實現方式,在第二方面的第三種實現方式中,該確定單元 具體用于對該第一聲道的時域信號及該第二聲道的時域信號進行峰值檢測處理,以確定第 一索引值及第二索引值,并根據該第一索引值與該第二索引值之間的大小關系,確定該基 準參數,其中,該第一索引值是與該第一聲道的時域信號在預設范圍內的最大幅度值相對 應的索引值,該第二索引值是與該第二聲道的時域信號在該預設范圍內的最大幅度值相對 應的索引值。
[0017] 結合第二方面及其上述實現方式,在第二方面的第四種實現方式中,該處理單元 還用于基于第二ITD參數,對該第一 ITD參數進行平滑處理,其中,該第一 ITD參數是第一 時段的ITD參數,該第二ITD參數是第二時段的ITD參數的平滑值,該第二時段處于該第一 時段之前。
[0018] 根據本發明實施例的聲道間時間差參數的方法和裝置,通過在時域上確定與第一 聲道的時域信號及第二聲道的時域信號之間的獲取順序相對應的基準參數,能夠基于該基 準參數,確定搜索范圍,并在該搜索范圍內從在頻域上進行針對該第一聲道的頻域信號及 該第二聲道的頻域信號的搜索處理,以確定該第一聲道及該第二聲道相對應的聲道間時間 差ITD參數,本發明實施例中根據基準參數確定的搜索范圍屬于[-τ_,0]或[0,T_],小于 現有技術中的搜索范圍[_Τ_,Τ_],從而能夠降低聲道間時間差ITD參數的搜索計算量,降 低了對編碼端的性能要求,提高了編碼端的處理效率。
【附圖說明】
[0019] 為了更清楚地說明本發明實施例的技術方案,下面將對本發明實施例中所需要使 用的附圖作簡單地介紹,顯而易見地,下面所描述的附圖僅僅是本發明的一些實施例,對于 本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他 的附圖。
[0020] 圖1是根據本發明實施例的確定聲道間時間差參數的方法的示意性流程圖。
[0021] 圖2是根據本發明一實施例的搜索范圍確定過程的示意圖。
[0022] 圖3是根據本發明另一實施例的確定搜索范圍確定過程的示意圖。
[0023] 圖4是根據本發明再一實施例的確定搜索范圍確定過程的示意圖。
[0024] 圖5是根據本發明實施例的確定聲道間時間差參數的裝置的示意性框圖。
[0025] 圖6是根據本發明實施例的確定聲道間時間差參數的設備的示意性結構圖。
【具體實施方式】
[0026] 下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基于本發 明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施 例,都屬于本發明保護的范圍。
[0027] 圖1是示出了本發明實施例的確定聲道間時間差參數的方法100的示意性流程 圖,該方法100的執行主體可以是傳輸音頻信號的編碼端設備(也可以稱為,發送端設備), 如圖1所示,該方法100包括:
[0028] S110,根據第一聲道的時域信號及第二聲道的時域信號,確定基準參數,該基準參 數對應于該第一聲道的時域信號與該第二聲道的時域信號之間的獲取順序,其中,該第一 聲道的時域信號及該第二聲道的時域信號對應于同一時段;
[0029] S120,根據該基準參數和極限值!^.,確定搜索范圍,其中,該極限值!^.是根據該 第一聲道的時域信號的采樣率確定的,該搜索范圍屬于[_Τ_,0],或該搜索范圍屬于[0, τ_];
[0030] S130,基于該第一聲道的頻域信號及該第二聲道的頻域信號,在該搜索范圍內進 行搜索處理,以確定與該第一聲道及該第二聲道相對應的第一聲道間時間差ITD參數。
[0031] 本發明實施例的確定聲道間時間差參數的方法100可以應用于具有至少兩個聲 道的音頻系統,在該音頻系統中,通過來自至少兩個聲道(即,包括第一聲道和第二聲道) 的單聲道信號合成立體聲信號,例如,通過來自左聲道(即,第一聲道的一例)的單聲道信 號和來自右聲道(即,第二聲道的一例)的單聲道信號合成立體聲信號。
[0032] 其中,作為傳輸該立體聲信號的方法,可以列舉參數立體聲(PS)技術,該技術根 據空間感知特性,編碼端將立體聲信號轉換為單聲道信號和空間感知參數,并分別進行編 碼,解碼端得到單聲道音頻后,進一步根據空間參數恢復立體聲信號。該技術能夠實現立體 聲信號的低比特高質量傳輸。聲道間時間差ITD(ITD,Inter-Channel Time Difference) 參數是表示聲源水平方位的空間參數,是空間參數的重要組成部分,本發明實施例主要涉 及該ITD參數的確定過程。另外,在本發明實施例中,根據ITD參數對立體聲信號和單聲道 信號進行編解碼的過程與現有技術相似,這里為了避免贅述,省略其詳細說明。
[0033] 應理解,以上列舉的音頻系統所具有的聲道數量僅為示例性說明,本發明并未限 定于此,例如,該音頻系統也可以具有三個或三個以上的聲道,并且,能夠通過任意兩個聲 道的單聲道信號合成立體聲信號。以下,為了便于理解,以將該方法100應用于具有兩個聲 道(即,左聲道和右聲道)的音頻系統使的處理過程為例,進行說明,并且,為了便于區分, 以左聲道作為第一聲道,以右聲道作為第二聲道,進行說明。
[0034] 具體地說,在S110,編碼端設備可以通過例如,與左聲道相對應的麥克風等音頻輸 入設備獲取與左聲道相對應的音頻信號,并根據預設的采樣率α (即,第一聲道的時域信 號的采樣率的一例),對該音頻信號進行采樣處理,以生成左聲道的時域信號(即,第一聲 道的時域信號的一例,以下,為了便于理解和區分,記做時域信號#L)。并且,在本發明實施 例中,該獲取時域信號#L的過程可以與現有技術相似,這里,為了避免贅述,省略其詳細說 明。
[0035] 在本發明實施例中,第一聲道的時域信號的采樣率與第二聲道的時域信號的采樣 率相同,因此,類似地,編碼端設備可以通過例如,與右聲道相對應的麥克風等音頻輸入設 備獲取與右聲道相對應的音頻信號,并根據上述采樣率α,對該音頻信號進行采樣處理,以 生成右聲道的時域信號(即,第二聲道的時域信號的一例,以下,為了便于理解和區分,記 做時域信號#R)。
[0036] 需要說明的是,在本發明實施例中,時域信號#L與時域信號#R是對應同一時段的 時域信號(或者說,在同一時段內獲取的時域信號),例如,該時域信號#L與時域信號#R可 以是對應同一幀(即,20ms)的時域信號,此情況下,基于時域信號札與時域信號#R能夠獲 得與該一幀信號相對應的一個ITD參數。
[0037] 再例如,該時域信號#L與時域信號#R也可以是對應同一幀內的同一子幀(即, 10ms或5ms等)的時域信號,此情況下,基于時域信號#L與時域信號#R能夠獲得與該一 幀信號相對應的多個ITD參數,例如,如果該時域信號#L與時域信號#R所對應的子幀為 l〇ms,則通過該一幀(即,20ms)信號能夠獲得兩個ITD參數。再例如,如果該時域信號#L 與時域信號#1?所對應的子幀為5ms,則通過該一幀(即,20ms)信號能夠獲得四個ITD參數。
[0038] 應理解,以上列舉的時域信號#L與時域信號#R所對應的時段的長度僅為示例性 說明,本發明并未限定于此,可以根據需要任意變更該時段的長度。
[0039] 其后,編碼端設備可以根據該時域信號#L和時域信號#R,確定基準參數。其中,該 基準參數可以與該時域信號#L和時域信號#R獲取順序(例如,輸入至上述音頻輸入設備 的先后順序)相對應,隨后,結合該基準參數的確定過程,對該對應關系進行詳細說明。
[0040] 在本發明實施例中,可以通過對時域信號#L和時域信號#R進行互相關處理來確 定該基準參數(即,方式1),也可以通過搜索時域信號#L和時域信號#R的幅度最大值來確 定該基準參數(即,方式2),下面,分別對該方式1和方式2進行詳細說明。
[0041] 方式 1
[0042] 可選地,該根據第一聲道的時域信號及第二聲道的時域信號,確定基準參數,包 括:
[0043] 對該第一聲道的時域信號及該第二聲道的時域信號進行互相關處理,以確定第一 互相關處理值及第二互相關處理值,其中,該第一互相關處理值是該第一聲道的時域信號 相對于該第二聲道的時域信號的互相關函數在預設范圍內的最大函數值,該第二互相關處 理值是該第二聲道的時域信號相對于該第一聲道的時域信號的互相關函數在該預設范圍 內的最大函數值;
[0044] 根據該第一互相關處理值及該第二互相關處理值之間的大小關系,確定該基準參 數。
[0045] 具體地說,在本發明實施例中,編碼端設備可以根據以下式1確定時域信號札相 對于時域信號#R的互相關函數c n (i),即:
[0046]
[0047] 其中,T_表示ITD參數的極限值(或者說,時域信號#L與時域信號#R之間的獲 取時間差的最大值)可以根據上述采樣率α確定,并且,其確定方法可以與現有技術相似, 這里為了避免贅述,省略其詳細說明。x R(j)表示時域信號#R在第j個采樣點處的信號值, xjj+i)表示時域信號#L在第j+i個采樣點處的信號值,Length表示時域信號#R包括的 采樣點的總數量,或者說,時域信號#R的長度,例如,可以為一個幀的長度(即,20ms)或一 個子幀的長度(例如,l〇ms或5ms等)。
[0048] 并且,編碼端設備可以確定該互相關函數cn(i)的最大值。
[0049] 類似地,編碼端設備可以根據以下式2確定時域信號#R相對于時域信號#L的互 相關函數c p(i),即: T i>vurrth - 1 - j
[0050]
[0051] 并且,編碼端設備可以確定該互相關函數cp(i)的最大值
[0052] 在本發明實施例中,編碼端設備可以根據與之間的關 系,通過以下方式1A或方式1B確定基準參數的值。
[0053] 方式 1A
[0054] 如圖2所示,如果,,m=,、h⑴K 則編碼端設備可以確定時域信號 #L是先于時域信號#R獲取的,即,左右聲道之間的ITD參數為正數,此情況下,可以將基準 參數T置為1。
[0055] 從而,在S120的判定過程中,編碼端設備可以判定該基準參數大于0,從而確定搜 索范圍為[0, T_],即,當時域信號#L是先于時域信號#R獲取時,ITD參數為正數,搜索范 圍為[0, T_] ( 即,搜索范圍屬于[0, T_]的一例)。
[0056] 或者,如果,則編碼端設備可以確定時域信號#L是后 于時域信號#R獲取的,即,左右聲道之間的ITD參數為負數,此情況下,可以將基準參數T 置為0。
[0057] 從而,在S120的判定過程中,編碼端設備可以判定該基準參數不大于0,從而確定 搜索范圍為[_Τ_,0],即,當時域信號#L是后于時域信號#R獲取時,ITD參數為負數,搜索 范圍為[-T_,0] ( 即,搜索范圍屬于[_Τ_,0]的一例)。
[0058] 方式 1Β
[0059] 可選地,該基準參數是該第一互相關處理值及該第二互相關處理值中較大一方所 對應的索引值或者索引值的相反數。
[0060] 具體地說,如圖3所示,如果,則編碼端設備可以確定 時域信號#L是先于時域信號#R獲取的,即,左右聲道之間的ITD參數為正數,此情況下,可 以將基準參數T置為所對應的索引值。
[0061] 從而,在其后的判定過程中,編碼端設備在判定基準參數T大于0之后,可以進 一步判定該基準參數T是否大于或等并根據判定結果確定搜索范圍,例如,當 T彡T_/2時,搜索范圍為[T_/2,T_](即,搜索范圍屬于[0,T_]的一例)。當T < T_/2 時,搜索范圍為[0, T_/2] ( 即,搜索范圍屬于[0, Τ_]的另一例)。
[0062] 或者,如果則編碼端設備可以確定時域信號虬是后 于時域信號#R獲取的,即,左右聲道之間的ITD參數為負數,此情況下,可以將基準參數Τ 置為《思所對應的索弓丨值的相反數。
[0063] 從而,在S120的判定過程中,編碼端設備在判定基準參數T小于或等于0之后,可 以進一步判定該基準參數T是否小于于或等于-T_/2,并根據判定結果確定搜索范圍,例 如,當Τ < -Τ_/2時,搜索范圍為[-T_,-T_/2] ( SM叟索范圍屬于[_Τ_,0]的一例)。當 Τ > -Τ_/2時,搜索范圍為[-T_/2,0] ( 即,搜索范圍屬于[_Τ_,0]的另一例)。
[0064] 方式 2
[0065] 可選地,該根據第一聲道的時域信號及第二聲道的時域信號,確定基準參數,包 括:
[0066] 對該第一聲道的時域信號及該第二聲道的時域信號進行峰值檢測處理,以確定第 一索引值及第二索引值,其中,該第一索引值是與該第一聲道的時域信號在預設范圍內的 最大幅度值相對應的索引值,該第二索引值是與該第二聲道的時域信號在該預設范圍內的 最大幅度值相對應的索引值;
[0067] 根據該第一索引值與該第二索引值之間的大小關系,確定該基準參數。
[0068] 具體地說,在本發明實施例中,編碼端設備可以檢測時域信號札的幅度值(記做: L(j))最大值max(L(j)),j e [0,Length_l],并記錄該max(L(j))所對應的索引值口1(^,其 中,Length表示時域信號#L包括的采樣點的總數量。
[0069] 并且,編碼端設備可以檢測時域信號#1?的幅度值(記做:R(j))最大值 max(R(j)),j e [0,Length_l],并記錄該 max(R(j))所對應的索引值 pright,其中,Length 表 示時域信號#R包括的采樣點的總數量。
[0070] 其后,編碼端設備可以判定plrft與p "ght之間的大小關系。
[0071] 如圖4所不,如果pleft^= p hght,則編碼端設備可以確定時域彳目號#L是先于時域{目 號#R獲取的,即,左右聲道之間的ITD參數為正數,此情況下,可以將基準參數T置為1。
[0072] 從而,在S120的判定過程中,編碼端設備可以判定該基準參數大于0,從而確定搜 索范圍為[0, T_],即,當時域信號#L是先于時域信號#R獲取時,ITD參數為正數,搜索范 圍為[0, T_] ( 即,搜索范圍屬于[0, T_]的一例)。
[0073] 或者,如果pleft< p hght,則編碼端設備可以確定時域?目號是后于時域彳目號#尺獲 取的,即,左右聲道之間的ITD參數為負數,此情況下,可以將基準參數T置為0。
[0074] 從而,在S120的判定過程中,編碼端設備可以判定該基準參數不大于0,從而確定 搜索范圍為[_Τ_,0],即,當時域信號#L是后于時域信號#R獲取時,ITD參數為負數,搜索 范圍為[-T_,0] ( 即,搜索范圍屬于[_Τ_,0]的一例)。
[0075] 在S130,編碼端設備可以對時域信號#L進行時頻變換處理以獲得左聲道的頻域 信號(即,第一聲道的頻域信號的一例,以下,為了便于理解和區分,記做頻域信號札)。可 以對時域信號#1?進行時頻變換處理以獲得右聲道的頻域信號(即,第二聲道的頻域信號的 一例,以下,為了便于理解和區分,記做頻域信號#R)
[0076] 例如,在本發明實施例中,可以采用快速傅氏變換(FFT,Fast Fourier Transformation)技術,基于以下式3,進行時頻變換處理。
[0077]
n:-〇^
[0078] 其中,X(k)表示頻域信號,FFT_LENGTH表示時頻變換長度。x(n)表示時域信號 (即,時域信號#L或時域信號#R),Length表示時域信號包括的采樣點的總數量。
[0079] 應理解,以上列舉的時頻變換處理的過程僅為示例性說明,本發明并不限定于此, 該視頻變換處理的方法和過程可以與現有技術相似,例如,還可以采用修正離散余弦變換 (MDCT, Modified Discrete Cosine Transform)等技術。
[0080] 從而,編碼端設備可以在如上所述確定的搜索范圍內,對如上所述確定的頻域信 號#L和頻域信號#R進行搜索處理,以確定左聲道與右聲道之間的ITD參數,例如,可以列 舉以下搜索處理的過程:
[0081] 首先,編碼端設備可以根據預設的帶寬A,將頻域信號的FFT_LENGTH個頻點劃分 為N subbandf (例如,1個)子帶,其中,對于第k個子帶A k,其包含的頻點為Ak A b彡A k-l,
[0082] 在上述搜索范圍內,根據以下式4計算頻域信號#L的相關函數mag (j)
[0083]
[0084] 其中,Xjb)表示頻域信號#L在第b個頻點的信號值,XR (b)表示頻域信號#R在第 b個頻點的信號值,FFT_LENGTH表示時頻變換長度,j的取值范圍是如上所述確定的搜索范 圍,為了便于理解和說明,將該搜索范圍記做[a,b]。
[0085] 則第k個子帶的ITD參數值為7=噸,,("喂(/)),即mag(j)的最大值對應的 索引值。
[0086] 由此,可以得到左聲道與右聲道之間的一個或多個(根據如上所述確定的子帶的 數量相對應)ITD參數值。
[0087] 其后,編碼端設備還可以對上述ITD參數值進行量化處理等,并將處理后的ITD參 數值以及對左右聲道的信號進行例如下混頻等處理得到的單聲道信號發送給解碼端設備 (或者說,接收端設備)。
[0088] 解碼端設備可以根據單聲道音頻信號和ITD參數值,恢復出立體聲音頻信號。
[0089] 可選地,該方法還包括:
[0090] 基于第二ITD參數,對該第一 ITD參數進行平滑處理,其中,該第一 ITD參數是第 一時段的ITD參數,該第二ITD參數是第二時段的ITD參數的平滑值,該第二時段處于該第 一時段之前。
[0091] 具體地說,在本發明實施例中,在對ITD參數值進行量化處理等之前,編碼端設備 還可以對如上所述或缺的ITD參數值進行平滑處理,作為示例而非限定,編碼端設備可以 根據以下式5進行該平滑處理:
[0092] Tsm (k) = w1*Tsm[ 11 (k) +w2*T (k)式 5
[0093] 其中,Tsni(k)表示第k個幀或第k個子幀所對應的平滑處理后的ITD參數值,T sni[ 1] 表示第k-1個幀或第k-1個子幀所對應的平滑處理后的ITD參數值,T(k)表示第k個幀或 第k個子幀所對應的未經平滑處理的ITD參數值, Wl、w2為平滑因子,w p w2可以設置為常 數,或者Wl、w2也可以根據Tsni [14PT(k)的差值設置,只要滿足Wl+w2=l即可。另外,當k =1時,T sni[1]可以為預設的數值。
[0094] 需要說明的是,在本發明實施例的確定聲道間時間差參數的方法中,上述平滑處 理可以由編碼端設備執行,也可以由解碼端設備執行,本發明并未特別限定,即,編碼端設 備也可以不進行上述平滑處理而將如上所述獲得的ITD參數值直接發送給解碼端設備,并 由解碼端設備對該ITD參數值進行平滑處理,并且,該解碼端設備所進行的平滑處理的方 法和過程可以與上述解碼端設備所進行的平滑處理的方法和過程相似,這里,為了避免贅 述,省略其詳細說明。
[0095] 根據本發明實施例的確定聲道間時間差參數的方法,通過在時域上確定與第一聲 道的時域信號及第二聲道的時域信號之間的獲取順序相對應的基準參數,能夠基于該基準 參數,確定搜索范圍,并在該搜索范圍內從在頻域上進行針對該第一聲道的頻域信號及該 第二聲道的頻域信號的搜索處理,以確定該第一聲道及該第二聲道相對應的聲道間時間差 ITD參數,本發明實施例中根據基準參數確定的搜索范圍屬于[_Τ_,0]或[0,T_],小于現 有技術中的搜索范圍[_Τ_,Τ_],從而能夠降低聲道間時間差ITD參數的搜索計算量,降低 了對編碼端的性能要求,提高了編碼端的處理效率。
[0096] 上文中,結合圖1至圖4,詳細描述了根據本發明實施例的確定聲道間時間差參數 的方法,下面,將結合圖5,詳細描述根據本發明實施例的根據本發明實施例的確定聲道間 時間差參數的裝置。
[0097] 圖5示出了根據本發明實施例的確定聲道間時間差參數的裝置200的示意性框 圖。如圖5所示,該裝置200包括:
[0098] 確定單元210,用于根據第一聲道的時域信號及第二聲道的時域信號,確定基準參 數,該基準參數對應于該第一聲道的時域信號與該第二聲道的時域信號之間的獲取順序, 其中,該第一聲道的時域信號及該第二聲道的時域信號對應于同一時段,并根據該基準參 數和極限值T_,確定搜索范圍,其中,該極限值T_是根據該第一聲道的時域信號的采樣率 確定的,該搜索范圍屬于[_Τ_,0],或該搜索范圍屬于[0,Τ_];
[0099] 處理單元220,用于基于該第一聲道的頻域信號及該第二聲道的頻域信號,根據該 基準參數,進行搜索處理,以確定與該第一聲道及該第二聲道相對應的第一聲道間時間差 ITD參數。
[0100] 可選地,該確定單元210具體用于對該第一聲道的時域信號及該第二聲道的時域 信號進行互相關處理,以確定第一互相關處理值及第二互相關處理值,并根據該第一互相 關處理值及該第二互相關處理值之間的大小關系,確定該基準參數,其中,該第一互相關處 理值是該第一聲道的時域信號相對于該第二聲道的時域信號的互相關函數在預設范圍內 的最大函數值,該第二互相關處理值是該第二聲道的時域信號相對于該第一聲道的時域信 號的互相關函數在該預設范圍內的最大函數值。
[0101] 可選地,該確定單元210具體用于將該第一互相關處理值及該第二互相關處理值 中較大一方所對應的索引值或者該索引值的相反數確定為該基準參數。
[0102] 可選地,該確定單元210具體用于對該第一聲道的時域信號及該第二聲道的時域 信號進行峰值檢測處理,以確定第一索引值及第二索引值,并根據該第一索引值與該第二 索引值之間的大小關系,確定該基準參數,其中,該第一索引值是與該第一聲道的時域信號 在預設范圍內的最大幅度值相對應的索引值,該第二索引值是與該第二聲道的時域信號在 該預設范圍內的最大幅度值相對應的索引值。
[0103] 可選地,該處理單元220還用于基于第二ITD參數,對該第一 ITD參數進行平滑處 理,其中,該第一 ITD參數是第一時段的ITD參數,該第二ITD參數是第二時段的ITD參數 的平滑值,該第二時段處于該第一時段之前。
[0104] 根據本發明實施例的確定聲道間時間差參數的裝置200作為本發明實施例的確 定聲道間時間差參數的方法100的實施主體,可對應于本發明實施例的方法中的編碼端設 備,并且,該確定聲道間時間差參數的裝置200中的各單元及模塊和上述其他操作和/或功 能分別為了實現圖1中的方法100的相應流程,為了簡潔,在此不再贅述。
[0105] 根據本發明實施例的確定聲道間時間差參數的裝置,通過在時域上確定與第一聲 道的時域信號及第二聲道的時域信號之間的獲取順序相對應的基準參數,能夠基于該基準 參數,確定搜索范圍,并在該搜索范圍內從在頻域上進行針對該第一聲道的頻域信號及該 第二聲道的頻域信號的搜索處理,以確定該第一聲道及該第二聲道相對應的聲道間時間差 ITD參數,本發明實施例中根據基準參數確定的搜索范圍屬于[-Τ_,0]或[0,Τ_],小于現 有技術中的搜索范圍[_Τ_,Τ_],從而能夠降低聲道間時間差ITD參數的搜索計算量,降低 了對編碼端的性能要求,提高了編碼端的處理效率。
[0106] 上文中,結合圖1至圖4,詳細描述了根據本發明實施例的確定聲道間時間差參數 的方法,下面,將結合圖6,詳細描述根據本發明實施例的確定聲道間時間差參數的設備。
[0107] 圖6示出了根據本發明實施例的確定聲道間時間差參數的設備300的示意性框 圖。如圖6所示,該設備300可以包括:
[0108] 總線 310;
[0109] 與該總線相連的處理器320 ;
[0110] 與該總線相連的存儲器330 ;
[0111] 其中,該處理器320通過該總線310,調用該存儲器330中存儲的程序,以用于根據 第一聲道的時域信號及第二聲道的時域信號,確定基準參數,該基準參數對應于該第一聲 道的時域信號與該第二聲道的時域信號之間的獲取順序,其中,該第一聲道的時域信號及 該第二聲道的時域信號對應于同一時段;
[0112] 用于根據該基準參數和極限值T_,確定搜索范圍,其中,該極限值T_是根據該 第一聲道的時域信號的采樣率確定的,該搜索范圍屬于[-τ_,0],或該搜索范圍屬于[0, τ_];
[0113] 用于基于該第一聲道的頻域信號及該第二聲道的頻域信號,在該搜索范圍內進行 搜索處理,以確定與該第一聲道及該第二聲道相對應的第一聲道間時間差ITD參數。
[0114] 可選地,該處理器320具體用于對該第一聲道的時域信號及該第二聲道的時域信 號進行互相關處理,以確定第一互相關處理值及第二互相關處理值,其中,該第一互相關處 理值是該第一聲道的時域信號相對于該第二聲道的時域信號的互相關函數在預設范圍內 的最大函數值,該第二互相關處理值是該第二聲道的時域信號相對于該第一聲道的時域信 號的互相關函數在該預設范圍內的最大函數值;
[0115] 用于根據該第一互相關處理值及該第二互相關處理值之間的大小關系,確定該基 準參數。
[0116] 可選地,該基準參數是該第一互相關處理值及該第二互相關處理值中較大一方所 對應的索引值或者該索引值的相反數。
[0117] 可選地,該處理器320具體用于對該第一聲道的時域信號及該第二聲道的時域信 號進行峰值檢測處理,以確定第一索引值及第二索引值,其中,該第一索引值是與該第一聲 道的時域信號在預設范圍內的最大幅度值相對應的索引值,該第二索引值是與該第二聲道 的時域信號在該預設范圍內的最大幅度值相對應的索引值;
[0118] 用于根據該第一索引值與該第二索引值之間的大小關系,確定該基準參數。
[0119] 可選地,該處理器320還用于基于第二ITD參數,對該第一 ITD參數進行平滑處 理,其中,該第一 ITD參數是第一時段的ITD參數,該第二ITD參數是第二時段的ITD參數 的平滑值,該第二時段處于該第一時段之前。
[0120] 在本發明實施例中,設備300的各個組件通過總線310耦合在一起,其中,總線310 除包括數據總線之外,還包括電源總線、控制總線和狀態信號總線。但是為了清楚明起見, 在圖中將各種總線都標為總線310。
[0121] 處理器320可以實現或者執行本發明方法實施例中的公開的各步驟及邏輯框圖。 處理器320可以是微處理器或者該處理器也可以是任何常規的處理器,解碼器等。結合本 發明實施例所公開的方法的步驟可以直接體現為硬件處理器執行完成,或者用解碼處理器 中的硬件及軟件模塊組合執行完成。軟件模塊可以位于隨機存儲器,閃存、只讀存儲器,可 編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領域成熟的存儲介質中。該存儲 介質位于存儲器330,處理器讀取存儲器330中的信息,結合其硬件完成上述方法的步驟。
[0122] 應理解,在本發明實施例中,該處理器320可以是中央處理單元(Central Processing Unit,簡稱為"CPU"),該處理器320還可以是其他通用處理器、數字信號處理 器(DSP)、專用集成電路(ASIC)、現成可編程門陣列(FPGA)或者其他可編程邏輯器件、分立 門或者晶體管邏輯器件、分立硬件組件等。通用處理器可以是微處理器或者該處理器也可 以是任何常規的處理器等。
[0123] 該存儲器330可以包括只讀存儲器和隨機存取存儲器,并向處理器320提供指令 和數據。存儲器330的一部分還可以包括非易失性隨機存取存儲器。例如,存儲器330還 可以存儲設備類型的信息。
[0124] 在實現過程中,上述方法的各步驟可以通過處理器320中的硬件的集成邏輯電路 或者軟件形式的指令完成。結合本發明實施例所公開的方法的步驟可以直接體現為硬件處 理器執行完成,或者用處理器中的硬件及軟件模塊組合執行完成。軟件模塊可以位于隨機 存儲器,閃存、只讀存儲器,可編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領 域成熟的存儲介質中。
[0125] 根據本發明實施例的確定聲道間時間差參數的設備300作為本發明實施例的確 定聲道間時間差參數的方法100的實施主體,可對應于本發明實施例的方法中的編碼端設 備,并且,該確定聲道間時間差參數的設備300中的各單元及模塊和上述其他操作和/或功 能分別為了實現圖1中的方法100的相應流程,為了簡潔,在此不再贅述。
[0126] 根據本發明實施例的確定聲道間時間差參數的設備,通過在時域上確定與第一聲 道的時域信號及第二聲道的時域信號之間的獲取順序相對應的基準參數,能夠基于該基準 參數,確定搜索范圍,并在該搜索范圍內從在頻域上進行針對該第一聲道的頻域信號及該 第二聲道的頻域信號的搜索處理,以確定該第一聲道及該第二聲道相對應的聲道間時間差 ITD參數,本發明實施例中根據基準參數確定的搜索范圍屬于[_Τ_,0]或[0,T_],小于現 有技術中的搜索范圍[_Τ_,Τ_],從而能夠降低聲道間時間差ITD參數的搜索計算量,降低 了對編碼端的性能要求,提高了編碼端的處理效率。應理解,在本發明的各種實施例中,上 述各過程的序號的大小并不意味著執行順序的先后,各過程的執行順序應以其功能和內在 邏輯確定,而不應對本發明實施例的實施過程構成任何限定。
[0127] 本領域普通技術人員可以意識到,結合本文中所公開的實施例描述的各示例的單 元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結合來實現。這些功能究竟 以硬件還是軟件方式來執行,取決于技術方案的特定應用和設計約束條件。專業技術人員 可以對每個特定的應用來使用不同方法來實現所描述的功能,但是這種實現不應認為超出 本發明的范圍。
[0128] 所屬領域的技術人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統、 裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
[0129] 在本申請所提供的幾個實施例中,應該理解到,所揭露的系統、裝置和方法,可以 通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件 可以結合或者可以集成到另一個系統,或一些特征可以忽略,或不執行。另一點,所顯示或 討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦 合或通信連接,可以是電性,機械或其它的形式。
[0130] 所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個 網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目 的。
[0131] 另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。
[0132] 所述功能如果以軟件功能單元的形式實現并作為獨立的產品銷售或使用時,可以 存儲在一個計算機可讀取存儲介質中。基于這樣的理解,本發明的技術方案本質上或者說 對現有技術做出貢獻的部分或者該技術方案的部分可以以軟件產品的形式體現出來,該計 算機軟件產品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個 人計算機,服務器,或者網絡設備等)執行本發明各個實施例所述方法的全部或部分步驟。 而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取 存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
[0133] 以上所述,僅為本發明的【具體實施方式】,但本發明的保護范圍并不局限于此,任何 熟悉本技術領域的技術人員在本發明揭露的技術范圍內,可輕易想到變化或替換,都應涵 蓋在本發明的保護范圍之內。因此,本發明的保護范圍應以所述權利要求的保護范圍為準。
【主權項】
1. 一種確定聲道間時間差參數的方法,其特征在于,所述方法包括: 根據第一聲道的時域信號及第二聲道的時域信號,確定基準參數,所述基準參數對應 于所述第一聲道的時域信號與所述第二聲道的時域信號之間的獲取順序,其中,所述第一 聲道的時域信號及所述第二聲道的時域信號對應于同一時段; 根據所述基準參數和極限值τ_,確定搜索范圍,其中,所述極限值τ_是根據所述第 一聲道的時域信號的采樣率確定的,所述搜索范圍屬于[-τ_,0],或所述搜索范圍屬于[0, τ_]; 基于所述第一聲道的頻域信號及所述第二聲道的頻域信號,在所述搜索范圍內進行搜 索處理,以確定與所述第一聲道及所述第二聲道相對應的第一聲道間時間差ITD參數。2. 根據權利要求1所述的方法,其特征在于,所述根據第一聲道的時域信號及第二聲 道的時域信號,確定基準參數,包括: 對所述第一聲道的時域信號及所述第二聲道的時域信號進行互相關處理,以確定第一 互相關處理值及第二互相關處理值,其中,所述第一互相關處理值是所述第一聲道的時域 信號相對于所述第二聲道的時域信號的互相關函數在預設范圍內的最大函數值,所述第二 互相關處理值是所述第二聲道的時域信號相對于所述第一聲道的時域信號的互相關函數 在所述預設范圍內的最大函數值; 根據所述第一互相關處理值及所述第二互相關處理值之間的大小關系,確定所述基準 參數。3. 根據權利要求2所述的方法,其特征在于,所述基準參數是所述第一互相關處理值 及所述第二互相關處理值中較大一方所對應的索引值或者所述索引值的相反數。4. 根據權利要求1所述的方法,其特征在于,所述根據第一聲道的時域信號及第二聲 道的時域信號,確定基準參數,包括: 對所述第一聲道的時域信號及所述第二聲道的時域信號進行峰值檢測處理,以確定第 一索引值及第二索引值,其中,所述第一索引值是與所述第一聲道的時域信號在預設范圍 內的最大幅度值相對應的索引值,所述第二索引值是與所述第二聲道的時域信號在所述預 設范圍內的最大幅度值相對應的索引值; 根據所述第一索引值與所述第二索引值之間的大小關系,確定所述基準參數。5. 根據權利要求1至4中任一項所述的方法,其特征在于,所述方法還包括: 基于第二ITD參數,對所述第一 ITD參數進行平滑處理,其中,所述第一 ITD參數是第 一時段的ITD參數,所述第二ITD參數是第二時段的ITD參數的平滑值,所述第二時段處于 所述第一時段之前。6. -種確定聲道間時間差參數的裝置,其特征在于,所述裝置包括: 確定單元,用于根據第一聲道的時域信號及第二聲道的時域信號,確定基準參數,所述 基準參數對應于所述第一聲道的時域信號與所述第二聲道的時域信號之間的獲取順序,其 中,所述第一聲道的時域信號及所述第二聲道的時域信號對應于同一時段,并根據所述基 準參數和極限值Τ_,確定搜索范圍,其中,所述極限值Τ_是根據所述第一聲道的時域信號 的采樣率確定的,所述搜索范圍屬于[-Τ_,0],或所述搜索范圍屬于[0,Τ_]; 處理單元,用于基于所述第一聲道的頻域信號及所述第二聲道的頻域信號,根據所述 基準參數,進行搜索處理,以確定與所述第一聲道及所述第二聲道相對應的第一聲道間時 間差ITD參數。7. 根據權利要求6所述的裝置,其特征在于,所述確定單元具體用于對所述第一聲道 的時域信號及所述第二聲道的時域信號進行互相關處理,以確定第一互相關處理值及第二 互相關處理值,并根據所述第一互相關處理值及所述第二互相關處理值之間的大小關系, 確定所述基準參數,其中,所述第一互相關處理值是所述第一聲道的時域信號相對于所述 第二聲道的時域信號的互相關函數在預設范圍內的最大函數值,所述第二互相關處理值是 所述第二聲道的時域信號相對于所述第一聲道的時域信號的互相關函數在所述預設范圍 內的最大函數值。8. 根據權利要求7所述的裝置,其特征在于,所述確定單元具體用于將所述第一互相 關處理值及所述第二互相關處理值中較大一方所對應的索引值或者所述索引值的相反數 確定為所述基準參數。9. 根據權利要求6所述的裝置,其特征在于,所述確定單元具體用于對所述第一聲道 的時域信號及所述第二聲道的時域信號進行峰值檢測處理,以確定第一索引值及第二索引 值,并根據所述第一索引值與所述第二索引值之間的大小關系,確定所述基準參數,其中, 所述第一索引值是與所述第一聲道的時域信號在預設范圍內的最大幅度值相對應的索引 值,所述第二索引值是與所述第二聲道的時域信號在所述預設范圍內的最大幅度值相對應 的索引值。10. 根據權利要求6至9中任一項所述的裝置,其特征在于,所述處理單元還用于基于 第二ITD參數,對所述第一 ITD參數進行平滑處理,其中,所述第一 ITD參數是第一時段的 ITD參數,所述第二ITD參數是第二時段的ITD參數的平滑值,所述第二時段處于所述第一 時段之前。
【文檔編號】G10L25/03GK106033671SQ201510101315
【公開日】2016年10月19日
【申請日】2015年3月9日
【發明人】張興濤, 苗磊
【申請人】華為技術有限公司