本技術涉及音頻編解碼技術,尤其涉及一種場景音頻信號的解碼方法和裝置。
背景技術:
1、三維音頻技術是通過計算機、信號處理等方式對真實世界中聲音事件和三維聲場信息進行獲取、處理,傳輸和渲染回放的音頻技術。三維音頻使聲音具有強烈的空間感、包圍感及沉浸感,給人以“聲臨其境”的非凡聽覺體驗。其中,高階立體混響(higher?orderambisonics,hoa)技術具有在錄制、編碼與回放階段與揚聲器布局無關的性質以及hoa格式數據的可旋轉回放特性,在進行三維音頻回放時具有更高的靈活性,因而也得到了更為廣泛的關注和研究。
2、為了實現更好的音頻聽覺效果,hoa技術需要大量的數據記錄更詳細的聲音場景的信息。雖然這種基于場景的三維音頻信號采樣和存儲更加利于音頻信號空間信息的保存和傳輸,但對于n階hoa信號來說,其對應的通道數為(n+1)2,隨著hoa階數的增加,將會產生更多的數據,大量的數據可能造成傳輸和存儲的困難,因此需要對hoa信號進行編解碼。
3、相關技術可以通過對部分通道進行編解碼以節省碼流,提高編解碼效率,但是沒有考慮到暫態信號的處理,導致重建音頻信號的質量下降,影響用戶的聽覺體驗。
技術實現思路
1、本技術提供一種場景音頻信號的解碼方法和裝置,以實現對場景音頻信號中的暫態信號的處理,提升重建場景音頻信號的質量和用戶的聽覺體驗
2、第一方面,本技術提供一種場景音頻信號的解碼方法,包括:對接收到的碼流進行直接解碼以得到第一通道的重建信號,所述第一通道是重建場景音頻信號包含的c個通道中采用直接解碼處理的通道,c為正整數;獲取待重建的第二通道的暫態標識,所述第二通道是所述c個通道中沒有采用直接解碼處理的通道;當所述暫態標識表示所述第二通道存在暫態信號時,根據所述第一通道的重建信號獲取所述第二通道的重建信號。
3、本技術實施例,解碼端根據通道的暫態標識,根據直接解碼的通道的重建信號對存在暫態信號的通道的重建信號實現暫態恢復,從而可以實現對場景音頻信號中的暫態信號的處理,提升重建場景音頻信號的質量和用戶的聽覺體驗。
4、重建場景音頻信號包括c個通道的音頻信號,c為正整數。解碼端可以采用至少兩種解碼方法對碼流進行解碼,以得到前述c個通道的音頻信號,采用至少兩種解碼方法包括直接解碼。
5、解碼端解碼碼流后得到的第一重建信號包括全部采用直接解碼處理的通道的音頻信號,上述第一通道的重建信號可以是第一重建信號中的任意一個通道的音頻信號,例如,當速率為768kbps時,1-9號通道中任意一個通道的音頻信號。
6、本技術實施例中,第一通道可以是重建場景音頻信號的c個通道中的w通道(即編號為1的通道)。
7、第二通道可以是c個通道中沒有采用直接解碼處理的通道,亦即,第二通道可以是c個通道中采用空間解碼處理或解相關處理的通道。例如,當速率為256kbps時,采用空間解碼處理的通道6-8和11-15中的一個,采用解相關處理的通道5、9-10和16中的一個。當速率為384kbps時,采用空間解碼處理的通道6-8和11-15中的一個,采用解相關處理的通道5、9-10和16中的一個。當速率為512kbps時,采用空間解碼處理的通道7-9和11-15中的一個,采用解相關處理的通道10或16。當速率為768kbps時,采用空間解碼處理的通道11-15中的一個或者采用解相關處理的通道10或16。
8、本技術實施例中,第二通道可以是采用解相關處理的通道。
9、可選的,解碼端可以將第一通道的重建信號直接拷貝作為第二通道的重建信號。
10、即,解碼端可以在通道的整個頻帶上做信號的拷貝,將第一通道的重建信號完全拷貝給第二通道的重建信號。
11、可選的,解碼端根據第一通道的重建信號進行解相關處理得到第二通道的第一信號;將第一通道的重建信號的第一頻帶的信號作為第二通道的第一信號的第二頻帶的信號,以得到第二通道的重建信號,第一頻帶是第一通道的重建信號的子頻帶,第二頻帶是第二通道的重建信號的子頻帶,第一頻帶與第二頻帶相同。
12、解碼端進行解相關處理得到第二通道的第一信號,例如,核心解碼器解碼得到w通道(第一通道),采用全通濾波器對w通道進行處理,得到第10和第16通道(第二通道)的解相關通道。
13、解碼端可以對通道的音頻信號進行分頻,例如,與預設閾值進行比較,最低頻點大于或等于該閾值的頻帶作為高頻,最高頻點小于該閾值的頻帶作為低頻。應理解,解碼端還可以采用其他方法對通道的信號進行頻帶劃分,本技術實施例對此不做具體限定。
14、可選的,可以用第一通道的重建信號中的高頻信號替換第二通道的第一信號中的高頻信號,以得到第二通道的重建信號。
15、可選的,可以用第一通道的重建信號中的低頻信號替換第二通道的第一信號中的低頻信號,以得到第二通道的重建信號。
16、應理解,解碼端可以以預設的方式確定替換的子頻帶,還可以采用其他的方式確定子頻帶的替換方法,本技術實施例對此不做具體限定。
17、第二方面,本技術提供一種場景音頻信號的解碼裝置,包括:解碼模塊,用于對接收到的碼流進行直接解碼以得到第一通道的重建信號,所述第一通道是重建場景音頻信號包含的c個通道中采用直接解碼處理的通道,c為正整數;獲取模塊,用于獲取待重建的第二通道的暫態標識,所述第二通道是所述c個通道中沒有采用直接解碼處理的通道;暫態恢復模塊,用于當所述暫態標識表示所述第二通道存在暫態信號時,根據所述第一通道的重建信號獲取所述第二通道的重建信號。
18、在一種可能的實現方式中,所述暫態恢復模塊,具體用于將所述第一通道的重建信號作為所述第二通道的重建信號。
19、在一種可能的實現方式中,所述暫態恢復模塊,具體用于根據所述第一通道的重建信號進行解相關處理得到所述第二通道的第一信號;將所述第一通道的重建信號的第一頻帶的信號替換所述第二通道的第一信號的第二頻帶的信號,以得到所述第二通道的重建信號,所述第一頻帶是所述第一通道的重建信號的子頻帶,所述第二頻帶是所述第二通道的第一信號的子頻帶,所述第一頻帶與所述第二頻帶相同。
20、在一種可能的實現方式中,所述第一通道是所述c個通道中的w通道。
21、在一種可能的實現方式中,所述第二通道是采用解相關處理的通道。
22、在一種可能的實現方式中,所述第一頻帶的最高頻點小于預設閾值;或者,所述第一頻帶的最低頻點大于或等于所述預設閾值。
23、第三方面,本技術提供一種電子設備,包括:一個或多個處理器;存儲器,用于存儲一個或多個程序;當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如上述第一方面中任一項所述的方法。
24、第四方面,本技術提供一種芯片,包括一個或多個接口電路和一個或多個處理器;所述接口電路用于從電子設備的存儲器接收信號,并向所述處理器發送所述信號,所述信號包括存儲器中存儲的計算機指令;當所述處理器執行所述計算機指令時,使得所述電子設備執行上述第一方面中任一項所述的方法。
25、第五方面,本技術提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,當所述計算機程序運行在計算機或處理器上時,使得所述計算機或所述處理器執行如上述第一方面中任一項所述的方法。
26、第六方面,本技術提供一種計算機程序產品,所述計算機程序產品包括計算機程序代碼,當所述計算機程序代碼在計算機上運行時,使得計算機執行上述第一方面中任一項所述的方法。
27、第七方面,本技術提供一種存儲碼流的裝置,所述裝置包括:接收器和至少一個存儲介質,所述接收器用于接收碼流;所述至少一個存儲介質用于存儲所述碼流。
28、第八方面,本技術提供一種傳輸碼流的裝置,所述裝置包括:發送器和至少一個存儲介質,所述至少一個存儲介質用于存儲碼流;所述發送器用于從所述存儲介質中獲取所述碼流并將所述碼流通過傳輸介質發送給端側設備。
29、第九方面,本技術提供一種分發碼流的系統,所述系統包括:至少一個存儲介質,用于存儲至少一個碼流,流媒體設備,用于從所述至少一個存儲介質中獲取所述碼流,并將所述碼流發送給端側設備,其中,所述流媒體設備包括內容服務器或內容分發服務器。