多通道音頻數據編碼/解碼方法和設備的制作方法

文檔序號：2823369閱讀：180來源：國知局

專利名稱：：多通道音頻數據編碼/解碼方法和設備的制作方法
技術領域：
：本發明涉及音頻編碼和解碼，更具體地講，涉及多通道音頻數據編碼和解碼方法以及設備。
背景技術：
：從2003年起，地面數字多媒體廣播(DMB)已經使用音頻編解碼器MPEG-4比特分片算術編碼(BSAC)。盡管目前只能提供立體聲服務，但是可以預期在將來將包括多通道服務。MPEG-4BASC應該能夠增加壓縮效率和改善技術的功能，例如帶寬擴展的和空間音頻。在傳統BSAC多通道中，在一個層中交替地編碼中央、前左、前右、后左和后右通道。圖1示出傳統BASC多通道的結構。BSAC結構提供精細可分級(FGS)功能。S卩，所有五個通道在一個層中并且可從最后層中剪切數據。關于通道的工具旁信息(sideinformation)應該在general—header(通用頭)中限定。考慮到每個通道中的特性，高性能壓縮需要單獨的旁信息。圖2是使用傳統的BSAC方法的音頻編碼設備的功能模塊的框圖。該設備包括心理聲學模型單元200、時間/頻率映射單元210、時域噪聲修整(TNS)單元220、強度立體聲處理單元230、知覺噪聲替換(PNS)單元240、中側(M/S)立體聲處理單元250、量化單元260和比特打包單元270。由于相對于時間人可以覺察的信號之間的差別不是很大，所以時間/頻率映射單元210將時域中的音頻信號轉換為頻域中的信號。然而，在頻域中的信號的情況下，相對于人類聲學模型，可被人覺察的信號與不能被人覺察的信號之間的差別在每個帶寬中都很大。因此，通過改變相對于每個頻率帶寬的比特數，可增強壓縮的效率。心理聲學模型單元200將被時間/頻率映射單元從時域轉換到頻域中的音頻信號結合到合適的子帶的信號中，并通過使用由每個信號的交互作用而發生的掩蔽現象，計算每個子帶的掩蔽閾值。TNS單元220被用于控制每個轉換窗口中的量化噪聲的時域形狀。通過應用頻率數據的濾波處理實現TNS。TNS單元220被隨意地應用在編碼器中。強度立體聲處理單元230被設計為用于更有效地處理立體聲信號。在該裝置中，僅關于相對于兩個通道之一的比例因子波段的量化信息被編碼，并且相對于剩余的通道僅僅比例因子被發送。在編碼器中，不是必須使用單元230。在當前幀中信號具有強噪聲特性的情況下，通過編碼與比例因子波段相應的頻率分量的每個的能量值，而不編碼頻率系數的值，PNS單元240可以減少產生的將被使用的比特的量。PNS單元240可確定是否以比例因子波段為單位使用比特。M/S立體聲處理單元230也是用于更有效地處理立體聲信號的裝置。在該裝置中，左通道的信號和右通道的信號分別被轉為被加的信號和被減的信號，然后這些信號被處理。在編碼器中，也不是必須使用M/S立體聲處理單元。量化單元260執行每個波段的頻率信號的標量量化，從而使得每個波段的量化噪聲的大小小于掩蔽閾值，這樣人們就感覺不到噪聲。比特打包單元270收集在編碼設備的每個模式中產生的信息項，并根據產生的適合于可分級的(scalable)音頻編解碼器的句法形成比特流。然而，在圖1中所示的傳統的BSAC多通道結構中，不能使用中側(M/S)立體聲。這是因為在傳統的編碼和解碼句法中，當通道的數目是2或更多時，不能使用M/S立體聲功能。因此，編碼效率降低。另外，由于窗口切換和PNS對于所有的通道應該使用相同的旁信息，因此，編碼效率降低。此外，由于5通道全部被交織，需要比單聲道音頻的內存大5倍的內存。
發明內容本發明提供一種多通道音頻數據編碼方法以及設備，該方法和設備遵守MPEG標準并改善傳統的多通道BSAC方法的性能。本發明還提供一種多通道音頻數據解碼方法以及設備，該方法和設備遵守MPEG標準并改善傳統的多通道BSAC方法的性能。根據本發明的一方面，提供了一種多通道音頻信號編碼方法，包括編碼單聲道和/或立體聲音頻數據；編碼除了單聲道和/或立體聲音頻數據之外的擴展的多通道音頻數據。單聲道和/或立體聲音頻數據可具有分層的比特率。擴展的多通道音頻數據可包括擴展的通道的類型信息，該類型信息至少指示音頻通道的配置，并被表達為通道配置索引。所述擴展的多通道音頻數據的編碼可包括編碼指示擴展的多通道音頻數據的起始的預定的起始代碼(zero—code，同步字)；以及按通道編碼擴展的音頻數據。所述起始代碼可包括由32比特的連續的0形成的zero—code，以及由8比特的連續的1形成的同步字。按通道編碼擴展的數據的步驟可包括編碼指示音頻通道的配置的擴展的通道的類型，以及編碼擴展的通道音頻數據。擴展的通道的類型可由通道配置索引形成。按通道編碼擴展的數據的步驟可包括編碼擴展的數據的長度；以及編碼旁信息(bsacj!eader，general_header)。擴展的通道音頻數據的編碼可包括編碼具有最低比特率的基本層；以及編碼比特率高于基本層的比特流的增強層，如果有多個增強層，則隨增強層的數量而增加比特率。根據本發明的另一方面，提供了一種多通道音頻信號編碼設備，包括單聲道/立體聲編碼單元，用于編碼單聲道和/或立體聲音頻數據；以及擴展的數據編碼單元，用于編碼除了單聲道和/或立體聲音頻數據之外的擴展的多通道音頻數據。單聲道/立體聲編碼單元可編碼具有分層的比特率的單聲道和/或立體聲音頻數據。擴展的數據編碼單元的擴展的多通道音頻數據可包括擴展的通道的類型信息，所述的類型信息至少指示音頻通道的配置，并被表達為通道配置索引。擴展的數據編碼單元可包括起始代碼編碼單元，用于編碼指示擴展的多通道音頻數據的起始的預定起始代碼(zero—code，同步字)；以及通道編碼單元，用于按通道編碼擴展的音頻數據。起始代碼編碼單元的起始代碼可包括由32比特的連續0形成的zero—code，以及由8比特的連續1形成的同步字。通道編碼單元可包括擴展的通道類型編碼單元，用于編碼指示音頻通道的配置的擴展的通道的類型；以及擴展的音頻編碼單元，用于編碼擴展的通道音頻數據。擴展的通道的類型可由通道配置索引形成。通道編碼單元可包括擴展的數據長度編碼單元，用于編碼擴展的數據的長度；以及旁信息編碼單元，用于編碼旁信息(bsac_header，general_header)。擴展的音頻編碼單元可包括基本層編碼單元，用于編碼具有最低比特率的基本層；以及增強層編碼單元，用于編碼比特流高于基本層的比特率的增強層，如果存在多個增強層，則隨增強層的數量而增加比特率。根據本發明的又一方面，提供了一種多通道音頻信號解碼方法，包括解碼單聲道和/或立體聲音頻數據；檢驗除了單聲道和/立體聲音頻數據之外是否存在將被解碼的擴展的多通道音頻數據；如果存在將被解碼的擴展的數據，則解碼擴展的多通道音頻數據。該單聲道和/或立體聲音頻數據可具有分層的比特率。擴展的多通道音頻數據可包括擴展的通道的類型信息，所述的類型信息至少指示音頻通道的配置，并被表達為通道配置索引。在是否存在擴展的多通道音頻數據的檢驗中，可檢驗指示擴展的多通道音頻數據的起始的預定的起始代碼(zero—code、同步字)的存在，如果存在起始代碼，則確定存在擴展的數據。所述的起始代碼可包括由32比特的連續0形成的zero—code，以及由8比特的連續1形成的同步字。在擴展的多通道音頻數據的解碼中，如果存在將被解碼的擴展的數據，則可按通道解碼擴展的數據。按通道解碼擴展的數據的步驟可包括解碼指示音頻通道的配置的擴展的通道的類型；以及解碼擴展的通道的音頻數據。所述的擴展的通道的類型可由通道配置索引形成。按通道解碼擴展的數據的步驟可包括解碼擴展的數據的長度；以及解碼旁信息(bsacjieader，general—header)。擴展的通道音頻數據的解碼可包括解碼具有最低比特率的基本層；以及解碼比特率高于基本層的比特率的增強層，如果存在多個增強層，則隨增強層的數量而增加比特率。根據本發明的再一方面，提供了一種多通道音頻信號解碼設備，包括單聲道/立體聲解碼單元，用于解碼單聲道和/或立體聲音頻數據；擴展的數據檢驗單元，檢驗除了單聲道和/或立體聲音頻數據之外是否存在將被解碼的擴展的多通道音頻數據；以及擴展的數據解碼單元，如果存在將被解碼的數據，則解碼擴展的多通道音頻數據。單聲道和/立體聲音頻數據具有分層的比特率。所述擴展的數據檢驗單元可通過預定起始代碼(zer0_code,同步字)的存在進行檢驗，所述的預定起始代碼指示擴展的多通道音頻數據的起始。如果存在起始代碼，則確定存在擴展的數據。所述的起始代碼可包括由32比特的連續0形成的zero—code;以及由8比特的連續1形成的同步字。如果存在將被解碼的數據，則擴展的數據解碼單元按通道解碼擴展的數據。所述的擴展的數據解碼單元可包括擴展的通道類型解碼單元，用于解碼指示音頻通道的配置的擴展的通道的類型；以及擴展的通道音頻解碼單元，用于解碼擴展的通道音頻數據。所述擴展的通道的類型可由通道配置索引形成。擴展的數據解碼單元可包括擴展的數據長度解碼單元，用于解碼擴展的數據的長度；以及旁信息解碼單元，用于解碼旁信息(bsacheader,generalheader)。所述擴展的通道音頻解碼單元可包括基本層解碼單元，用于解碼具有最低比特率的基本層；增強層解碼單元民用于解碼比特流高于基本層的比特率的增強層，如果存在多個增強層，則隨增強層的數量而增加比特率。6根據本發明的又一方面，提供了一種多通道音頻信號編碼方法，包括編碼單聲道/立體聲音頻數據的基本層；編碼單聲道/立體聲音頻數據的增強層；編碼指示擴展的多通道音頻數據的起始的預定起始代碼(zero—code，同步字)；對構成擴展的多通道音頻數據的至少一個通道數據編碼基本層，并對所述的至少一個通道數據編碼增強層。所述的對至少一個通道數據的基本層的編碼可包括編碼通道數據的長度；編碼指示通道的類型的通道配置索引(channel_configuration_index);編碼旁信息(bsac_header,general—header);以及編碼基本層的音頻數據。根據本發明的又一方面，提供了一種多通道音頻信號解碼方法，包括解碼單聲道/立體聲音頻數據的基本層；解碼單聲道/立體聲音頻數據的增強層；檢驗除了單聲道/立體聲音頻數據之外，是否存在將被解碼的擴展的多通道音頻數據；如果存在將被解碼的擴展的多通道音頻數據，則解碼預定的起始代碼(zero—code、同步字)，所述的起始代碼指示擴展的多通道音頻數據的起始；對構成擴展的多通道音頻數據的至少一個通道數據解碼基本層，并對所述的至少一個通道數據解碼增強層。對至少一個通道數據的基本層的解碼包括解碼通道數據的長度；解碼指示通道的類型的通道配置索引(channel_configuration」ndex);解碼旁信息(bsacheader,generalheader);解碼基本層的音頻數據。根據本發明的另一方面，提供了一種其上包含有計算程序的計算機可讀記錄介質，該計算機程序用于執行多通道音頻數據編碼和解碼方法。通過下面參照附圖對本發明實施例的詳細描述，本發明的上述和其他特點和優點將會變得更清楚，其中圖1示出傳統的比特分片算術編碼(BSAC)多通道的結構；圖2是使用傳統的BSAC方法的音頻編碼設備的功能模塊的框圖；圖3是根據本發明的多通道音頻數據編碼設備的結構的框圖；圖4是擴展的數據編碼單元的詳細框圖；圖5是擴展的音頻編碼單元的詳細框圖；圖6示出根據本發明的用于多通道音頻數據編碼的基本數據結構；圖7是由根據本發明的多通道音頻數據編碼方法執行的操作的流程圖；圖8是用于擴展的通道的音頻數據編碼的詳細的流程圖；圖9是多通道音頻解碼設備的結構的框圖；圖10是圖9的擴展的數據解碼單元的框圖；圖11是圖9的擴展的通道音頻解碼單元的框圖；圖12是根據本發明的多通道音頻解碼方法的操作的流程圖；圖13是用于圖12中的操作1230的擴展的通道的音頻數據解碼的詳細流程圖；圖14是示出表示圖12中的操作1200至1240的實施例的Basc_raw_data_block()的句法；圖15示出表示每個擴展的音頻通道解碼的實施例的extended_bsac_raw_data_block()的句法；圖16示出操作1100的extended_bsac_raw_element()的例子的句法；圖17示出通過使用根據本發明的多通道音頻信號編碼和/或解碼方法及設備測量聲音質量的測試結果。具體實施例方式現在，將參照附圖更全面地描述本發明的多通道音頻編碼和/或解碼設備及方法，其中表示了發明的示例性實施例。首先，將解釋多通道音頻編碼設備和方法。圖3是根據本發明的多通道音頻數據編碼設備的結構的框圖。該設備包括單聲道/立體聲編碼單元300和擴展的數據編碼單元350。單聲道/立體聲編碼單元300編碼單聲道或立體聲音頻數據。優選地，單聲道/立體聲編碼單元300編碼具有分層的比特率的單聲道或立體聲音頻數據。詳細地說，根據ISO/IEC14496-3以比特分片算術編碼(BSAC)方法來編碼單聲道或立體聲音頻數據是更可取的。由于BSAC方法的音頻編碼是公知技術，所以這里將省略對該方法的解釋。擴展的數據編碼單元350除了編碼單聲道或立體聲音頻數據外還編碼擴展的多通道音頻數據。優選地，擴展的多通道音頻數據至少包括指示音頻通道的配置的擴展的通道的類型信息，擴展的通道類型信息被表達為通道配置索引(channel—configurationjndex)。優選地，通道配置索引具有指示音頻輸出通道配置的3比特字段，如表l中所示。因此，通道配置索引指示與通道相應的每個揚聲器的特性。表1<table>tableseeoriginaldocumentpage8</column></row><table>圖4是擴展的數據編碼單元350的詳細框圖，包括起始代碼編碼單元400和通道編碼單元450。起始代碼編碼單元400編碼預定的起始代碼，所述的起始代碼指示擴展的多通道音頻數據的起始。起始代碼形成有zero—code和同步字。zero—code是由指示立體聲音頻數據的算術解碼完成的32比特的連續0形成。同步字由指示擴展的多通道音頻數據的起始的8比特的連續1形成。該比特串是llll1111。通道編碼單元450編碼每個通道中的擴展的音頻數據，并形成有擴展的通道長度編碼單元452、擴展的通道類型編碼單元454、旁信息編碼單元456和擴展的音頻編碼單元458。擴展的通道長度編碼單元452編碼擴展的數據的長度。當執行算術解碼時，擴展的數據長度信息被使用。擴展的通道類型編碼單元454編碼指示音頻通道的配置的擴展的通道的類型。旁信息編碼單元456編碼旁信息(bsac—header、general—header)。旁信息(bsac—header、general—header)與當以BSAC方法編碼單聲道或立體聲音頻數據時使用的旁信息相同。擴展的音頻編碼單元458編碼擴展的通道音頻數據。圖5是擴展的音頻編碼單元458的詳細框圖。該擴展的音頻編碼單元458包括基本層編碼單元500和增強層編碼單元550。基本層編碼單元500編碼具有最低比特率的基本層。增強層編碼單元550編碼其比特率比基本層的比特率高的增強層，如果有多個層，則比特率隨層數而增加。本發明使用在傳統的立體聲比特率中擴展的通道的方法。通道配置索引被指定給每個通道元素，并且指示修改關于當編碼音頻時每個可用工具的旁信息的可能性。由于在窗口、M/S、和PNS信息的每個通道元素中存在通用頭(generalheader)，所以可修改需要修改的所有工具。圖6示出根據本發明的用于多通道音頻數據編碼的基本數據結構。圖7是根據本發明的多通道音頻數據編碼方法的操作的流程圖。參照圖3和圖7，將解釋根據本發明的多通道音頻編碼方法和設備的操作。首先，在操作700中，在單聲道/立體聲編碼單元300中編碼單聲道或立體聲音頻數據。然后，在擴展的數據編碼單元350中，除了單聲道或立體聲數據之外，擴展的多通道音頻數據被編碼。優選地，如上所述，單聲道或立體聲數據具有分層的比特率。此外，擴展的多通道音頻數據包括如上所述的擴展的通道的類型信息，該信息至少指示音頻通道的配置，并被表達為通道配置索引。現在將更詳細地解釋擴展的多通道音頻數據的編碼。單聲道或立體聲音頻數據被編碼，然后在操作710中檢驗將被編碼的數據是否存在。如果將被編碼的數據存在，則在操作720中，在起始代碼編碼單元400中編碼指示擴展的多通道音頻數據的起始的預定起始代碼(zero—code、同步字)。該起始代碼與上述編碼設備中的起始代碼相同。然后，通過通道編碼單元450編碼用于每個通道的擴展的音頻數據。這里，首先在操作730中編碼用于一個通道的擴展的音頻數據，當該通道的編碼完成時，在操作740中檢驗是否存在用于另一個通道的將被編碼的音頻數據。如果用于另一通道的將被編碼的音頻數據存在，則編碼用于該通道的音頻數據。對所有擴展的通道執行該處理。圖8是操作730中的用于擴展的通道的音頻數據編碼的詳細流程圖。在操作800中，在擴展的數據長度編碼單元452中編碼擴展的數據的長度。此外，在操作820中，在擴展的通道類型編碼單元454中編碼指示音頻通道的配置的擴展的通道的類型。在操作840中，在旁信息編碼單元456中編碼旁信息(bsacheader、generalheader)。然后，在操作860中，在擴展的音頻編碼單元458中編碼擴展的通道音頻數據。在操作860中的擴展的通道音頻數據的編碼中，首先，在基本層編碼單元500中編碼具有最低比特率的基本層中的音頻數據，然后在增強層編碼單元550中編碼增強層的音頻數據。增強層具有比基本層的比特率高的比特率。當多個增強層存在時，比特率隨著增強層的數量而增加。同時，將解釋根據本發明的多通道音頻解碼設備和方法。基本上，多通道音頻解碼以與編碼操作相反的順序執行操作。圖9是多通道解碼設備的結構的框圖。該設備包括單聲道/立體聲解碼單元900、擴展的數據檢驗單元920和擴展的數據解碼單元940。單聲道/立體聲解碼單元900解碼單聲道或立體聲音頻數據。優選地，單聲道或立體聲音頻數據具有分層的比特率，并根據ISO/IEC14496-3以BASC方法被解碼。擴展的數據檢驗單元920檢驗除了單聲道或立體聲音頻數據之外是否存在將被解碼的擴展的多通道音頻數據。擴展的數據檢驗單元920檢驗指示擴展的多通道音頻數據的起始的預定起始代碼(zero—code、同步字)的存在，如果存在起始代碼，則確定存在擴展的數據。該起始代碼由zero—code和同步字形成。zero—code由指示立體聲音頻數據的算術解碼完成的32比特的連續的0形成。同步字由指示擴展的多通道音頻數據的起始的8比特的連續l形成。該比特串是llll1111。如果存在將被解碼的擴展的數據，則擴展的數據解碼單元940解碼擴展的多通道音頻數據。此外，優選地，當執行解碼時，擴展的數據解碼單元940按通道解碼擴展的數據。圖10是圖9的擴展的數據解碼單元940的框圖，包括擴展的數據長度解碼單元1000、擴展的通道類型解碼單元1020、旁信息解碼單元1040和擴展的通道音頻解碼單元1060。擴展的數據長度解碼單元1000解碼擴展的數據的長度信息。擴展的通道類型解碼單元1020解碼指示音頻通道的配置的擴展的通道的類型。優選地，擴展的通道類型信息被表達為通道配置索引(channel_configurationjndex)。通道配置索引定義通道被映射到揚聲器時的通道數，并如表1所示具有指示音頻輸出通道配置的3比特字段。旁信息解碼單元1040解碼旁信息。旁信息對解碼音頻數據是必需的，所述旁信息是除了音頻數據之外的信息，如bsacheader和generalheader。基本上，該旁信息(bsac_header和general—header)與BSAC方法中解碼單聲道或立體聲音頻數據所需的旁信息相同。擴展的通道音頻解碼單元1060解碼擴展的音頻數據。圖11是圖10的擴展的通道音頻解碼單元1060的框圖，該通道音頻解碼單元包括基本層解碼單元1100和增強層解碼單元1150。基本層解碼單元1100解碼具有最低比特率的基本層。增強層解碼單元解碼其比特率比基本層的比特率高的增強層。如果存在多個層，則增加隨增加的層數而增加的比特率。圖12是由根據本發明的多通道音頻解碼方法執行的操作的流程圖。參照圖12，將解釋根據本發明的多通道音頻數據解碼方法和設備的操作。首先，在操作1200中，通過單聲道/立體聲解碼單元900解碼單聲道或立體聲音頻數據。然后，在操作1210中，由擴展的數據檢驗單元920檢驗除了單聲道/立體聲音頻數據之外是否存在擴展的多通道音頻數據。在操作1220中，通過解碼預定起始代碼(zero—code、同步字)并檢驗起始代碼的存在來確定擴展的多通道音頻數據的存在，所述的預定起始代碼指示擴展的多通道音頻數據的起始。如果存在起始代碼，則確定存在擴展的數據。即，如果存在zero—code，則表明單聲道或立體聲音頻數據的解碼被完成，如果其后存在同步字，則表明存在將被解碼的多通道音頻數據。如果通過起始代碼確定存在將被解碼的擴展的數據，則在操作1230中通過擴展的數據解碼單元940解碼擴展的多通道音頻數據。如圖14所示，以句法(Bsac_raw_data_block())表達了操作1200至1230的實施例.參照圖14，BSaC_raW_data_bl0Ck()是包含編碼的音頻數據、相關的信息和其他數據的原始數據塊，并且主要由bsac_base_element()禾P幾個basc_layer_element()形成。BSaC_raW_data_bl0Ck()是用于確定bsac比特流是否具有擴展部分的模塊。優選地，如上所述單聲道或立體聲數據具有分層的比特率。此外，擴展的多通道音頻數據包括擴展的通道的上面描述的類型信息，該類型信息至少指示音頻通道的配置并被表達為通道配置索引。在關于一個通道的擴展的音頻數據在操作1230中被解碼之后，在操作1240中檢驗是否存在將被解碼的用于另一通道的音頻數據。如果存在將被解碼的用于另一通道的音頻數據，則解碼用于另外的通道的音頻數據。通過對所有擴展的通道執行該處理，解碼所有擴展的通道音頻數據。圖15中示出表示每個音頻通道的解碼的實施例的句法(extended_bsac_raw_block())。參照圖15，extended_bsac_raw_block()是包括與多通道擴展的數據相應的編碼的音頻數據以及與該音頻數據相關的信息的原始數據塊。eXtended_bSaC_raW_bl0Ck()主要由extended_bsac_element()禾口幾個bsac_layer_element()形成。圖13是操作1230的用于擴展的通道的音頻數據解碼的詳細流程圖。在操作1300中，在擴展的數據長度解碼單元1000中解碼擴展的數據的長度。此外，在操作1320中，在擴展的通道類型解碼單元1020中解碼指示音頻通道的配置的擴展的通道的類型。在操作1340中，在旁信息解碼單元1040中解碼旁信息(bsacheader、generalheader)。解碼操作1300至1340的執行順序無關緊要。然后，在操作1360中，在擴展的通道音頻解碼單元1060中解碼擴展的通道音頻數據。在操作1360的擴展的音頻數據的解碼中，具有最低比特率的基本層的音頻數據首先在基本層解碼單元1100中被解碼，然后，增強層的音頻數據在增強層解碼單元1150中被解碼。增強層的比特率高于基本層的比特率，如果存在多個增強層，則比特率隨著增強層數的增加而增加。圖16表示操作1230的句法(extended_bsac_raw_data_block())的實施例。參照圖16，extended_bsac_raw_data_block()是基本層比特流的句法的元素，包含與BSAC擴展的部分相應的編碼的音頻數據以及與音頻數據相關的信息。本發明也可被實現為計算機(包括具有信息處理功能的所有設備)可讀記錄介質11上的計算機可讀代碼。計算機可讀記錄介質是能夠存儲可由計算機系統隨后讀取的數據的任何數據存儲裝置。計算機可讀記錄介質的例子包括只讀存儲器(R0M)、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光學數據存儲裝置。雖然已經參照本發明的示例性實施例具體表示和描述了本發明，但是本領域的普通技術人員應該理解，在不脫離由權利要求限定的本發明的精神和范圍的情況下，可在其中作出形式和細節的各種改變。這些優選實施例應該被理解為只是描述性的，而不是為了限制的目的。因此，本發明的范圍不是由本發明的詳細描述來限定，而是所附權利要求限定。該范圍內的所有不同應該認為包括在本發明中。根據本發明的多通道音頻編碼和/或解碼設備以及方法，多通道數據交錯需要的內存比使用傳統的BSAC方法所需的內存少20X。這是因為當使用根據本發明的多通道方法時，正被添加的通道元素被順序地處理，因此同時進行的內存使用的數量相對小，而在傳統的多通道方法中，整個多通道的所有數據應該被裝載到內存上。圖17表示通過使用根據本發明的多通道音頻信號編碼和/或解碼方法測量聲音質量的結果。收聽試驗條件如下。使用窗口切換和M/S立體聲工具并且在前和后通道元件的每個中控制比特率。參與試驗的四個音頻專家以及與傳統的BSAC相比的相對聲音質量(-2—2)被測量。對于測試項，用于MPEG-2NBC的共46項被選擇。根據本發明的多通道音頻編碼和/或解碼方法以及設備，通過僅僅一個比特流，可根據用戶環境提供單聲道、立體聲和多通道音頻。此外，在多通道音頻中，根據用戶終端和網絡的狀態來提供FGS功能。而且，可實現多通道BSAC的性能的增強，例如，高的聲音質量、低的復雜性和可分級性。詳細地說，可滿足對MPEG標準化(傳統BSAC的兼容性、維持FGS功能和最小的修改)的各種需求，此外，該方法和設備可被用于更逼真的數字多媒體廣播和基于移動影院的和基于家庭影院的服務中。權利要求一種多通道音頻信號編碼方法，包括編碼單聲道和/或立體聲音頻數據；編碼除了單聲道和/或立體聲音頻數據之外的擴展的多通道音頻數據，其中，所述擴展的多通道音頻數據包括擴展的通道的類型信息，所述類型信息至少指示音頻通道的配置，并被表達為通道配置索引。2.如權利要求1所述的方法，其中，所述擴展的多通道音頻數據的編碼包括編碼指示擴展的多通道音頻數據的起始的預定的起始代碼；按通道編碼擴展的音頻數據。3.如權利要求1所述的方法，其中，所述擴展的多通道音頻數據的編碼包括編碼具有最低比特率的基本層；編碼比特率高于基本層的比特率的增強層，當存在多個增強層時，比特率隨增強層數的增加而增加。4.一種多通道音頻信號編碼設備，包括單聲道/立體聲編碼單元，用于編碼單聲道和/或立體聲音頻數據；擴展的數據編碼單元，用于編碼除了單聲道和/或立體聲音頻數據之外的擴展的多通道音頻數據，其中，擴展的數據編碼單元的擴展的多通道音頻數據包括擴展的通道的類型信息，所述類型信息至少指示音頻通道的配置，并被表達為通道配置索引。5.如權利要求4所述的設備，其中，所述擴展的數據編碼單元包括起始代碼編碼單元，用于編碼指示擴展的多通道音頻數據的起始的預定起始代碼；通道編碼單元，用于按通道編碼擴展的音頻數據。6.—種多通道音頻信號解碼方法，包括解碼單聲道和/或立體聲音頻數據；檢驗除了單聲道和/或立體聲音頻數據之外是否存在將被解碼的擴展的多通道音頻數據；當存在將被解碼的擴展的數據時，解碼擴展的多通道音頻數據，其中，所述擴展的多通道音頻數據包括擴展的通道的類型信息，所述類型信息至少指示音頻通道的配置，并被表達為通道配置索引。7.如權利要求6所述的方法，其中，在檢驗是否存在擴展的多通道音頻數據的步驟中，檢驗指示擴展的多通道音頻數據的起始的預定起始代碼的存在，如果存在起始代碼，則確定存在擴展的數據。8.—種多通道音頻信號解碼設備，包括單聲道/立體聲解碼單元，用于解碼單聲道和/或立體聲音頻數據；擴展的數據檢驗單元，檢驗除了單聲道和/或立體聲音頻數據之外是否存在將被解碼的擴展的多通道音頻數據；擴展的數據解碼單元，當存在將被解碼的擴展的數據時，解碼擴展的多通道音頻數據，其中，所述擴展的數據檢驗單元檢驗預定起始代碼的存在，所述預定起始代碼指示擴展的多通道音頻數據的起始，如果存在起始代碼，則確定存在擴展的數據。9.一種多通道音頻信號解碼方法，包括解碼單聲道和/或立體聲音頻數據的基本層；解碼單聲道和/或立體聲音頻數據的增強層；當存在將被解碼的擴展的多通道音頻數據時，解碼預定起始代碼，所述預定起始代碼指示擴展的多通道音頻數據的起始；對構成擴展的多通道音頻數據的至少一個通道數據解碼基本層，并對所述至少一個通道數據解碼增強層。10.如權利要求9所述的方法，其中，所述對至少一個通道數據的基本層的解碼包括解碼通道數據的長度；解碼指示通道的類型的通道配置索引；解碼旁信息；解碼基本層的音頻數據。11.一種多通道音頻信號編碼方法，包括生成指示其中音頻數據被編碼的凈荷已經完成的標識代碼；生成指示擴展的數據的凈荷已經開始的標識代碼；生成擴展數據的類型，所述擴展的數據的類型為將音頻數據的通道擴展為多通道，編碼擴展的數據。12.—種多通道音頻信號解碼方法，包括檢測指示音頻數據的凈荷已經完成的標識代碼；檢測指示擴展的數據的凈荷已經開始的標識代碼；檢測擴展的數據的類型；確定被檢測的擴展的數據類型是否是將音頻數據的通道擴展為多通道；當確定檢測的類型為將音頻數據的通道擴展為多通道時，則解碼擴展的數據。13.—種多通道音頻信號解碼方法，包括解碼被分層編碼的音頻數據；檢測指示音頻數據的凈荷已經完成的標識代碼；檢測指示擴展的數據的凈荷已經開始的標識代碼；檢測擴展的數據的類型；確定被檢測擴展數據的類型是否為將音頻數據的通道擴展為多通道；當確定被檢測的類型為將音頻數據的通道擴展為多通道時，則解碼擴展的數據。14.一種多通道音頻信號解碼方法，包括解碼被分層編碼的音頻數據；確定是否存在還未被解碼的數據；當確定存在還未解碼的數據時，檢測指示音頻數據的凈荷已經被完成的標識代碼；檢測擴展的數據的類型；確定檢測的擴展的數據的類型是否為將音頻數據的通道擴展為多通道；當確定檢測的類型是將音頻數據的通道擴展為多通道時，則解碼擴展的數據。全文摘要提供一種多通道音頻數據編碼和/或解碼方法以及設備。該編碼方法包括編碼單聲道和/或立體聲音頻數據；以及編碼除了單聲道和/或立體聲音頻數據之外的擴展的多通道音頻數據。解碼方法包括解碼單聲道和/或立體聲音頻數據；檢驗除了單聲道和/或立體聲音頻數據之外是否存在將被解碼的擴展的多通道音頻數據；如果存在，則解碼該數據。根據該方法和設備，僅通過一個比特流，可根據用戶環境來提供單聲道、立體聲和多通道。另外在多通道音頻中，根據用戶終端和網絡的狀態提供精細可分級(FGS)功能。此外，可實現BSAC的性能的增強。可滿足對MPEG標準化的各種需求。可用于更逼真的數字多媒體廣播和基于移動以及基于家庭影院的服務。文檔編號G10L19/00GK101789792SQ201010122240公開日2010年7月28日申請日期2005年7月14日優先權日2004年7月14日發明者吳殷美,金尚煜,金度亨,金美英,金重會申請人:三星電子株式會社

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：吳殷美;金美英;金尚煜;金度亨;金重會
技術所有人：三星電子株式會社
我是此專利的發明人

上一篇：一種聲屏障用板材及其制作方法
上一篇：一種變步長自適應盲源分離方法及盲源分離系統的制作方法

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！