根據用戶的喜好適配音頻信號的裝置和方法

文檔序號：7581828閱讀：264來源：國知局

專利名稱：根據用戶的喜好適配音頻信號的裝置和方法
技術領域：
本發明涉及一種音頻信號適配裝置及其方法，具體地說，涉及一種用于使音頻信號適合于用戶喜好的裝置及其方法。
背景技術：
運動圖像專家組(MPEG)已經提出了作為新標準工作項的數字項適配(DIA)。數字項(DI)是指具有標準表示法、標識和元數據的結構化數字對象，DIA表示用于生成在資源適配引擎或描述符適配引擎中處理之后獲得的經適配的ID。
這里，資源是指諸如視頻或音頻、圖像或紋理結構等可單獨識別的項。描述符是指與所述DI中的一個項或成分相關的信息。另外，用戶包括所有的制作者、公證人、發行人和消費者。媒體資源是指能夠直接用數字表示的內容，此后，術語“內容”被用在DI、媒體資源和資源的相同含義中。
傳統的技術具有下述問題，即，它們不能提供一種單源多使用環境，在這種環境下，通過使用與諸如用戶特征、用戶的自然環境和用戶終端的能力的消費所述音頻內容的使用環境相關的信息可以使一個單一音頻內容適合于不同的使用環境。
“單一源”是指從多媒體源中產生的一個單一內容，而“多使用”是指多個用戶終端，其中的每個終端都具有不同的使用環境，并消費適合于每個使用環境的“單一源”。
單一源多使用的優點在于通過將內容處理成適合于不同的使用環境，可以以不同的形式提供一個內容。此外，當適合于各種使用環境的單一源被提供給多個用戶終端時，該單一源多使用可以使網絡帶寬減小或被有效使用。
因此，內容提供者可以減少當多個內容被產生和發送以便使音頻信號與不同使用環境相適配時所產生的不必要的成本。內容的消費者也能夠克服他/她的環境的空間限制和消費滿足該內容消費者的聽力和喜好的最佳音頻內容。
但是，即使是在通用多媒體接入(UMA)環境下，現有技術也不能最佳地利用單一源多使用環境的優點。
也就是說，所述多媒體源在不考慮諸如用戶特征、用戶的自然環境和用戶終端的能力等的使用環境的情況下不加區別地發送音頻內容。由于裝備有諸如視窗媒體播放器、MP3播放器和真實播放器(Real Player)等的音頻播放器的用戶終端消費其形式同于從所述多媒體源接收的音頻內容，所以，它不適合于單一源多使用環境。
為了克服現有技術的缺點和支持所述單一源多使用環境，所述多媒體源提供多個考慮到各種使用環境的多媒體內容。但是，這在內容的產生和發送方面帶來了更多的負擔。

發明內容
因此，本發明的一個目的就是提供一種音頻適配裝置和方法，用于通過使用描述用戶終端的使用環境的信息來使音頻內容適合于多種使用環境。
通過附圖、本發明的詳細描述以及本說明書的權利要求，本領域內普通技術人員將很容易理解本發明的其它目的和優點。
根據本發明的一個方面，提供了一種用于使音頻信號適合于單一源多使用的裝置，該裝置包括音頻使用環境信息管理單元，用于收集、描述和管理來自每個消費所述音頻信號的用戶終端的音頻使用環境信息；和音頻適配單元，用于適配所述音頻信號，從而將所述音頻信號輸出給可適合于音頻使用環境信息的用戶終端，其中，所述音頻使用環境信息包括用于描述所述用戶對所述音頻信號的聲場喜好的用戶特征信息。
根據本發明的另一方面，提供了一種方法，用于使音頻信號適合于單一源多使用，該方法包括下述步驟a)收集、描述和管理來自消費所述音頻信號的每個用戶終端的音頻使用環境信息；和b)適配所述音頻信號，從而將所述音頻信號輸出給可適合于所述音頻使用環境信息的所述用戶終端，其中，所述音頻使用環境信息包括用于描述所述用戶對所述音頻信號的聲場喜好的用戶特征信息。

通過下面結合附圖給出的最佳實施例的詳細描述，本發明的上述和其它目的和特性將變得更加清楚，其中圖1是示出了包括根據本發明一個實施例的音頻信號適配裝置的用戶終端的概況的框圖；圖2是示出了根據本發明一個實施例的音頻適配裝置的框圖；圖3是描述了在圖1所示的音頻信號適配裝置中執行的音頻信號適配處理的流程圖；圖4是示出了圖3所示的音頻信號適配處理的流程圖；圖5是示出了通過音頻內容和脈沖響應的卷積來具體表達用戶喜好的聲場特征的圖；和圖6是用于描述感知參數的描述符的曲線圖。
具體實施例方式
通過下面結合附圖對實施例的描述，本發明的其它目的和方面將變得明顯，這將在下文中闡明。
下面的描述僅僅舉例說明了本發明的原理。即使是在本說明書中沒有描述或清楚地示出這些例子，本領域的普通技術人員也能夠使本發明的原理具體化并在本發明的概念和范圍內發明各種裝置。
在本說明書中示出的條件術語和實施例的使用只是試圖使得本發明的概念更容易被理解，本發明并不局限于在說明書中描述的這些實施例和狀態。
另外，關于本發明的原理、觀點和實施例以及特定實施例的所有描述都應當被理解為包括在結構和功能方面與其等效的等效物。所述等效物不僅包括當前已知的等效物，還包括將來要被開發出來的等效物，即，被開發出來執行相同功能的所有設備，而不管它們的結構如何。
例如，本發明的框圖應當被理解為示出了實施本發明的原理的示范性電路的概念性觀點。類似地，所有的流程圖、狀態轉換圖、偽代碼等都可以在計算機可讀媒體中得到足夠的表示，和無論是鑒別性地描述了計算機還是處理器，它們都應當被理解為表示由計算機或處理器運行的各種處理。
不僅可以通過使用專用于所述功能的硬件、而且還可以通過使用能夠運行用于所述功能的適當軟件的硬件來提供在包括被表示為處理器或類似概念的功能塊的附圖中所示出的各種設備的功能。當利用處理器提供功能時，可以通過單一專用處理器、信號共享處理器或其中的一部分可以被共享的多個單獨的處理器來提供所述功能。
術語‘處理器’、‘控制’或類似的概念的表面的使用不應當被理解為專指能夠運行軟件的一部分硬件，而應當被理解為隱含地包括數字信號處理器(DSP)、硬件以及用于存儲軟件的ROM、RAM以及非易失性存儲器。其中也可以包括其它已經公知和公用的硬件。
在本說明書的權利要求書中，被表示為用于執行詳細說明書中所描述的功能的裝置的元件試圖包括所有用于執行包括諸如用于執行所需功能的電路的組合、固件/微碼等的所有軟件格式的功能的所有方法。
為了執行所需的功能，所述元件與一適當電路協作以執行所述軟件。由權利要求所定義的本發明包括用于執行多種特定功能的各種裝置，和所述裝置以所述權利要求書中請求的方法彼此相互連接。因此，能夠提供所述功能的任何一種裝置都應當被理解為與本說明書所指出的相關裝置等效。
通過下面結合附圖對實施例的描述，本發明的其它目的和方面將變得更加清楚，這在下文中闡明。相同的附圖標記被給予相同的元件，盡管這些元件出現在不同的附圖中。另外，如果確定對相關現有技術的進一步詳細描述將使本發明的觀點模糊，則這種描述將予以省略。下面，將參考附圖對本發明的最佳實施例做詳細的描述。
圖1是示出了根據本發明一個實施例的包括音頻信號適配裝置的用戶終端的概況的框圖。音頻適配裝置100包括音頻適配單元103和音頻使用環境信息管理單元107。音頻適配單元103和音頻使用環境信息管理單元107中的每一個都能夠被單獨安裝在音頻處理系統上。
所述音頻處理系統包括膝上型計算機、筆記本計算機、桌上型計算機、工作站、主機或其它類型的計算機。還包括諸如個人數字助理(PDA)和移動通信站的數據處理系統或信號處理系統。
所述音頻處理系統可以是形成網絡路徑的多個節點之一，例如是多媒體源節點系統、多媒體中繼節點系統和末端用戶終端。所述末端用戶終端裝備配有音頻播放器，諸如是視窗媒體播放器、MP3播放器或真實播放器(realplayer)。
例如，當音頻適配裝置100被安裝在多媒體源節點系統上并被運行時，音頻適配裝置100從末端用戶終端接收使用環境信息，適配內容使其適合于使用環境，并將經適配的內容發送給末端用戶終端。即，使用與其中消費音頻內容的使用環境相關的信息將所述內容適配為適合于所述適用環境。
國際標準組織技術委員會(ISO)/國際電子技術委員會(IEC)在其標準文本中描述了本發明的最佳實施例中示出的元件的功能和操作。因此，所述標準文本可以作為本發明的一部分被包括在幫助理解本發明的技術的范圍內。
音頻數據源單元101接收從多媒體源產生的音頻數據。音頻數據源單元101可以被包括在多媒體源節點系統中，或被包括在多媒體中繼節點系統中、或被包括在接收從多媒體源節點系統經由有線/無線網絡發送的音頻數據的末端用戶終端中。
音頻適配單元103從音頻數據源單元101中接收音頻數據。然后，音頻使用環境信息管理單元107通過使用包括與用戶特征、用戶的自然環境和用戶終端的能力相關的信息的使用環境信息來適配所述音頻數據使其適合于使用環境。
這里，音頻適配單元103的功能不必被包括在任何一個節點系統中，但它可以被分散(dispersed)在形成網絡路徑的另一節點系統中。例如，具有控制音量功能并與網絡帶寬無關的音頻適配單元103被包括在末端用戶終端中，而具有與網絡帶寬相關的功能，例如控制音級、即時域中特定音頻信號的強度的功能的音頻適配單元103能夠被包括在多媒體源節點系統中。
音頻使用環境信息管理單元107預先從用戶、該用戶的用戶終端和自然環境中收集信息，然后加以描述并管理使用環境信息。
與由音頻適配單元103執行的功能相關的使用環境信息可以被分散在網絡路徑上的節點系統中，恰好做為音頻適配單元103。
音頻數據輸出單元105輸出由音頻適配單元103適配的音頻數據。所輸出的音頻數據可以經過有線/無線網絡被發送給末端用戶終端的音頻播放器，或被發送給多媒體中繼節點系統或末端用戶終端。
圖2是示出了根據本發明一個實施例的音頻適配裝置的框圖。參看圖2，音頻數據源單元101包括音頻元數據201和音頻內容203。
音頻數據源單元101收集和存儲由多媒體源產生的音頻內容203和音頻元數據201。這里，音頻內容203可以以例如是MP3、AC-3、AAC、WMA、RA和CELP等各種不同的編碼方法來被存儲，或者它們包括以信息流形式發送的不同音頻格式。
音頻元數據201是與音頻內容相關的數據，諸如編碼方法、取樣速率、信道數量(例如單聲道、立體聲和5.1信道)和位速率。可以使用可擴展的標記語言(XML)方案來定義和描述它們。
音頻使用環境信息管理單元107包括用戶特征信息管理單元207、用戶特征信息輸入單元217、用戶自然環境信息管理單元209、用戶自然環境信息輸入單元219、音頻終端能力信息管理單元211和音頻終端能力信息輸入單元221。
用戶特征信息管理單元207從用戶終端接收用戶特征信息并管理該信息。所述用戶特征信息包括聽力、所喜好的音頻量以及關于所喜好頻譜的均衡模式等的特征。特別是，用戶特征信息管理單元207接收和管理與該用戶所喜好的聲場相關的信息。所輸入的用戶特征信息以例如XML形式的語言的機械可讀的語言進行管理。
用戶自然環境信息管理單元209接收與其中經過用戶自然環境信息輸入單元219消費音頻內容的自然環境相關的信息并管理該自然環境信息。所輸入的自然環境信息以例如XML形式的語言的機械可讀的語言進行管理。
用戶自然環境信息輸入單元219將能夠由噪聲環境分類表所定義的噪聲環境特征信息發送給用戶自然環境信息管理單元209。所述噪聲環境分類表是預先確定的，或者是通過收集特定地方的數據和分析所述數據獲得的。
音頻終端能力信息管理單元211經過音頻終端能力信息輸入單元221接收音頻終端能力信息并管理該信息。所輸入的音頻終端能力信息以例如XML形式的語言的機械可讀的語言進行管理。
音頻終端能力信息輸入單元221能夠將在用戶終端中確定或由用戶輸入的音頻終端能力信息發送給音頻終端能力信息管理單元211。
音頻適配單元103能包括音頻元數據適配處理單元213和音頻內容適配處理單元215。音頻內容適配處理單元215經過諸如噪聲掩蔽(noise-masking)的音頻信號處理來解析在用戶自然環境信息管理單元209中被管理的所述用戶自然環境信息并執行代碼轉換，從而使所述音頻內容被適配為適合于所述自然環境進而能夠承受所述噪聲環境。
類似地，音頻內容適配處理單元215解析分別在用戶特征信息管理單元217和音頻終端能力信息管理單元211中被管理的所述用戶特征信息和所述音頻終端能力信息，并對所述音頻信號進行適配，從而使得所述音頻內容適合于用戶特征和音頻終端能力。
音頻元數據適配處理單元213提供音頻內容適配處理所需的元數據并對與所述音頻內容適配的結果相對應的音頻元數據的內容進行適配。
圖3是描述了在圖1所示的音頻信號適配裝置中執行的音頻信號適配處理的流程圖。參看圖3，本發明的處理開始于音頻使用環境信息管理單元107。
在步驟S301，音頻使用環境信息管理單元107預先從用戶、移動終端和自然環境收集音頻內容的使用環境信息，并描述用戶特征信息、用戶自然環境信息和用戶終端能力信息。在步驟S303，音頻數據源單元101接收音頻數據。
最后，在步驟S305，音頻適配單元103使用在步驟S301處所描述的使用環境信息對在步驟S303接收的音頻內容的音頻信號進行適配以使其適合于例如用戶特征、用戶自然環境和用戶終端能力的所述使用環境信息。在步驟S307，音頻數據輸出單元105輸出在步驟S305處適配的音頻數據。
圖4示出了圖3的音頻信號適配處理的流程圖。參看圖4，在步驟S401，音頻適配單元103檢查由音頻數據源單元101所接收的音頻內容和音頻元數據。然后，在步驟S403，所述音頻數據被適配為適合于所述用戶特征、用戶自然環境和用戶終端能力。
隨后，在步驟S405，音頻適配單元103基于在步驟S403處的音頻內容適配的結果對音頻內容的音頻元數據的內容進行適配。下面將描述由音頻使用環境信息管理單元107管理的描述信息的結構。
應當使用諸如用戶特征、用戶自然環境和用戶終端能力的被預先描述的使用環境信息對與用戶特征、用戶終端能力和自然環境特征相關的信息進行管理，以便使所述音頻內容適合于其中消費所述音頻內容的使用環境。
特別是，用戶特征信息包括多個“AudioPresentationPreference”，描述符，用于描述用戶的音頻表達喜好。在運動圖像專家組21(MPEG21)中已經討論的“AudioPresentationPreference”描述符是“AudioPower”、“Mute”、“FrequencyEqualizer”、“Period”、“Level”、“PresetEqualizer”、“AudioFrequencyRange”和“AudibleLevelRange”描述符。
“AudioPower”描述符表示用戶對音頻響度的喜好。它被以從0到1的歸一化百分比標度進行描述。“Mute”描述符表示用戶對數字設備中音頻的靜音部分的喜好。
“FrequencyEqualizer”描述符表示用戶對于使用頻域和衰減值均衡的唯一概念的喜好。“Period”描述符是“FrequencyEqualizer”描述符的一特性，它定義了以赫茲(Hz)表示的均衡范圍的下角頻率和上角頻率。
“Level”描述符是所述“FrequencyEqualizer”描述符的特性，它定義了以分貝(db)表示的標度從-15到15的頻率范圍的放大和衰減值。
“PresetEqualizer”描述符表示用戶對于經均衡器予置的語言學技術均衡的唯一概念的喜好。所述予置被表達為爵士、搖滾、古典音樂和流行音樂。“AudioFrequencyRange”描述符表示用戶對于特定頻率區域的喜好。它是以赫茲(Hz)的形式從所述下角頻率到所述上角頻率表示的。
“AudibleLevelRange”描述符表示用戶對特定級別范圍的喜好。最高值和最低值分別為1和0。
其間，“AudioPresentationPreference”描述符不能充分描述用戶對聲場的喜好。因此，需要一種能夠描述用戶對聲場喜好信息的描述符。因此，本發明建議利用脈沖響應和多個感知參數在特定地方描述對聲場的喜好。
例如，諸如禮堂或教堂的聲場可以通過利用一個或多個麥克風獲得相應地方的脈沖響應和利用對應的音頻內容卷積所獲得的脈沖響應來表示。
圖5是示出了通過音頻內容和脈沖響應的卷積而實施的用戶喜好的聲場特征的圖。參看圖5，音頻適配單元103卷積所述脈沖響應和所述音頻內容，從而使所述音頻內容能夠反映用戶的聲場特征。
脈沖響應的使用使得可以最恰當地描述被消費內容的聲場，所述感知參數表示諸如聲源興奮和聲音沉重的由該用戶所接收的音頻信號的感覺。
下面描述由圖1所示的音頻使用環境信息管理單元107管理的使用環境的技術信息的結構。它示出了一個表示在XML方案定義的基礎上用戶所喜好的聲場的解釋性語法。
<元素名稱＝“SoundFieldGenerator”>
<順序>
<元素名稱＝“ImpulseResponse”minOccurs＝“0”>
<complexType>
<順序maxOccurs＝“不限制”>
<元素名稱＝“時間”型＝“浮動”/>
<元素名稱＝“幅度”型＝“浮動”/>
</順序>
</complexType>
<元素>
<元素名稱＝“PerceptualParameters”minOccurs＝“0”>
<順序>
<元素名稱＝“SourcePresence”型＝“浮動”/>
<元素名稱＝“SourceWarmth”型＝“浮動”/>
<元素名稱＝“SourceBrilliance”型＝“浮動”/>
<元素名稱＝“RoomPresence”型＝“浮動”/>
<元素名稱＝“RunningReverberance”型＝“浮動”/>
<元素名稱＝“Envelopment”型＝“浮動”/>
<元素名稱＝“LateReverberance”型＝“浮動”/>
<元素名稱＝“Heavyness”型＝“浮動”/>
<元素名稱＝“Liveness”型＝“浮動”/>
<元素名稱＝“RefDistance”型＝“浮動”/>
<元素名稱＝“FreqLow”型＝“浮動”/>
<元素名稱＝“FreqHigh”型＝“浮動”/>
<元素名稱＝“Timelimit1”型＝“浮動”/>
<元素名稱＝“Timelimit2”型＝“浮動”/>
<元素名稱＝“Timelimit3”型＝“浮動”/>
</元素>
描述符“ImpulseResponse”和描述符“Perceptural Parameters”分別描述了脈沖響應和感知參數。音頻適配單元103基于描述符“ImpulseResponse”和描述符“Perceptural Parameters”將音頻數據適配為適合于用戶喜好的聲場特征。
如在上述XML碼中所示，脈沖響應可以用連續的時間值和幅度值表示。另一方面，可以通過考慮“ImpulseResponse”的數據量來利用具有脈沖響應特征信息的唯一資源識別符(URI)地址來代替脈沖響應。
另外，用戶對于聲場的喜好可以通過添加諸如“SamplingFrequency”、“BitsPerSample”和“NumOfChannel”描述符并與從URI地址獲得的脈沖響應特征一起來反映。感知參數使用MPEG-4 Advanced AudioBIFS的“PerceptualParameters”描述符去描述用戶喜好的場面。關于每個描述符的更多說明，可以參考“ISO/IEC 14496-11999”。
如在上述XML碼中所示，所述“PerceptualParameters”包括“SourcePresence”、“SourceWarmth”、“SourceBrilliance”、“RoomPresence”、“RunningReverberance”、“Envelopment”、“LateReverberance”、“Heavyness”、“Liveness”、“RefDistance”、“FreqLow”、“FreqHigh”、“TimeLimit1”、“TimeLimit2”和“TimeLimit3”描述符。
圖6示出了描述符“PerceptionParameters”的曲線圖。“SourcePresence”描述符以分貝的形式描述了直達聲和早先室內效果的能量。所述“SourceWarmth”描述符以分貝的形式描述了低頻處相對早的能量。
“SourceBrilliance”描述符以分貝的形式描述了高頻處相對早的能量。描述符“RoomPresence”以分貝的形式描述了較后室內效果的能量。
描述符“RunningReverberance”描述了毫秒(ms)級的相對早的衰減時間。描述符“Envelopment”以分貝的形式描述了早先室內效果相對于直達聲的能量。
“LateReverberance”描述符描述了毫秒(ms)級的最近衰減時間。“Heavyness”描述符描述了低頻處的相對衰減時間。“Liveness”描述符描述了高頻處的相對衰減時間。
“RefDistance”描述符以米(m)的形式描述了定義感知參數的參考距離。“FreqLow”描述符以赫茲(Hz)的形式描述了低頻的限制，如圖6所示。“FreqHigh”描述符以赫茲(Hz)的形式描述了高頻的限制，如圖6所示“TimeLimit1”描述符以毫秒(ms)的形式描述了第一瞬間的限制(l1)，如圖6所示。“TimeLimit2”描述符以毫秒(ms)的形式描述了第二瞬間的限制(l2)，如圖6所示。“TimeLimit3”描述符以毫秒(ms)的形式描述了第三瞬間的限制(l3)，如圖6所示。
正如所述脈沖響應，所述音頻適配單元103在所述感知參數的基礎上反映了在所述音頻內容中所述用戶喜好的聲場特征。
另外，對于脈沖響應特征和感知參數來講，可以添加“AuditoriumParameters”描述符，以獲得三維聲音。
其中消費內容的空間可以根據用戶而不同，即使用戶所喜好的聲場特征是相同的。因此，被恢復的內容可以具有不同的聲場特征。因此，音頻適配單元103在“AuditoriumParameters”描述符的基礎上消除由用戶聲音環境所引起的不良影響。
下面將描述由圖1的音頻使用環境信息管理單元107管理的使用環境的技術信息的結構。它示出了在XML方案定義的基礎上表示所述用戶聲音環境的解釋性語法。
<元素名稱＝“AuditoriumParameters”minOccurs＝“0”>
<順序>
<元素名稱＝“ReverberationTime”型＝“浮動”minOccurs＝“0”/>
<元素名稱＝“InitialDecayTime”型＝“浮動”minOccurs＝“0”/>
<元素名稱＝“RDRatio”型＝“浮動”minOccurs＝“0”/>
<元素名稱＝“Clrity”型＝“浮動”minOccurs＝“0”/>
<元素名稱＝“IACC”型＝“浮動minOccurs＝“0”/>
</順序>
</元素>
“AuditoriumParameters”使用“ReverberationTime”、“InitialDecayTime”、“RDRatio”、“Clarity”和“IACC”描述符來表示用戶消費音頻內容的空間的聲音環境。
“ReverberationTime”描述符表示混響時間(reverberation time)。它以毫秒的形式描述將聲級衰減60分貝所占用的時間。混響時間被表示為RT或T60，這是一個表示內部聲音特征的最基本的物理量。
“InitialDecayTime”描述符表示最初的衰減時間。它以毫秒的形式描述了在直達聲和反射聲之間的時間差。最初的衰減時間是表示與禮堂(hall)親合性的物理量。它也被稱之為IDT。
“RDRatio”描述符以百分比(％)的形式描述在50毫秒之后直達聲和反射聲的能量比。該“RDRatio”描述符是表示單聲和混響聲(reverberation sound)的波形的信息量，它是一個指出圖像清晰度的物理量并被稱之為D50。
“clarity”描述符以百分比(％)的形式描述在80毫秒之后直達聲和所述反射聲的能量比。它是一個指出音樂清晰度的基本物理量合并被稱之為C80。
“IACC”描述符描述了當在從-1ms到1ms范圍內獲取在左耳和右耳處獲得的脈沖響應的內部交叉相關功能時獲得的最大值。“IACC”描述符表示到達聽眾每個耳朵處的聲音的相似度。它是一個指出聲音傳播感覺的物理量。
上述描述符表示了所述用戶的聲音環境特征。根據本發明，可以提供一種單源多使用環境，其中，通過使用用戶喜好的聲場信息和用戶聲音環境信息，可以在不同的使用環境下將音頻內容適配為適合于各種用戶的所述特征和興趣。
盡管已經結合某些最佳實施例描述了本發明，但是，很明顯，對于本領域的普通技術人員來講，在不脫離在后述權利要求書所定義的本發明的范圍的情況下，可以做出各種改變和修改。
權利要求
1.一種使音頻信號適合于單源多使用的裝置，包括音頻使用環境信息管理裝置，用于收集、描述和管理來自消費所述音頻信號的每個用戶終端的音頻使用環境信息；和音頻適配裝置，用于適配所述音頻信號，以便向所述用戶終端輸出適合于所述音頻使用環境信息的音頻信號，其中，所述音頻使用環境信息包括描述用戶對所述音頻信號的聲場喜好的用戶特征信息。
2.根據權利要求1所述的裝置，其中，所述使用特征信息包括對脈沖響應的喜好，以及所述音頻適配裝置通過基于對所述脈沖響應的喜好來改變所述音頻信號的聲場特征來適配該音頻信號，并將經過適配的音頻信號發送給所述用戶終端。
3.根據權利要求2所述的裝置，其中，利用時間和幅度來描述所述脈沖響應。
4.根據權利要求1所述的裝置，其中，所述用戶特征信息包括對所述音頻信號的感知參數的喜好，和所述音頻適配裝置通過基于對所述感知參數的喜好改變所述音頻信號的聲場特征來適配所述音頻信號，并將經過適配的音頻信號發送給所述用戶終端。
5.根據權利要求1所述的裝置，其中，所述用戶特征信息包括其中所述用戶消費所述音頻信號的空間的聲音環境信息，和所述音頻適配裝置基于所述聲音環境信息通過消除所述音頻信號的聲場特征當中由所述用戶的聲音環境引起的不良影響來適配所述音頻信號，并將經過適配的音頻信號發送給所述用戶終端。
6.根據權利要求5所述的裝置，其中，所述聲音環境信息包括所述空間的混響時間信息。
7.根據權利要求5所述的裝置，其中，所述聲音環境信息包括所述空間的最初衰減時間。
8.根據權利要求5所述的裝置，其中，所述聲音環境信息包括在預定時間之后在所述空間的直達聲和反射聲之間的能量比信息。
9.根據權利要求5所述的裝置，其中，所述聲音環境信息是表示聲音傳播的感覺的物理量以及所述聲音環境信息包括到達用戶每個耳朵中的聲音的相似性信息。
10.一種使音頻信號適合于單源多使用的方法，包括下述步驟a)收集、描述和管理來自消費所述音頻信號的每個用戶終端的音頻使用環境信息；和b)適配所述音頻信號，以便向所述用戶終端輸出適合于所述音頻使用環境信息的音頻信號，其中，所述音頻使用環境信息包括用于描述所述用戶對所述音頻信號的聲場喜好的用戶特征信息。
11.根據權利要求10所述的方法，其中，所述用戶特征信息包括對脈沖響應的喜好，和在步驟b)，通過基于對所述脈沖響應的喜好改變所述音頻信號的聲場特征來適配所述音頻信號，并將該音頻信號發送給所述用戶終端。
12.根據權利要求11所述的方法，其中，利用時間和幅度來描述所述脈沖響應。
13.根據權利要求10所述的方法，其中，所述用戶特征信息包括對所述音頻信號的感知參數的喜好，和在步驟b)，通過基于對所述感知參數的喜好改變所述音頻信號的聲場特征來適配所述音頻信號并將該音頻信號發送給所述用戶終端。
14.根據權利要求10所述的方法，其中，所述用戶特征信息包括該用戶消費所述音頻信號的空間的聲音環境信息，和在步驟b)，通過基于所述聲音環境信息消除所述音頻信號的聲場特征當中由所述用戶的聲音環境引起的不良影響來適配所述音頻信號并將該音頻信號發送給所述用戶終端。
15.根據權利要求14所述的方法，其中，所述聲音環境信息包括所述空間的混響時間信息。
16.根據權利要求14所述的方法，其中，所述聲音環境信息包括所述空間的最初衰減時間。
17.根據權利要求14所述的方法，其中，所述聲音環境信息包括在預定時間之后在所述空間的直達聲和反射聲之間的能量比信息。
18.根據權利要求14所述的方法，其中，所述聲音環境信息是表示聲音傳播的感覺的物理量，和所述聲音環境信息包括到達所述用戶每個耳朵處的聲音的相似性信息。
全文摘要
一種用于根據用戶的喜好適配音頻信號的裝置和方法。所述裝置和方法通過使音頻內容適合于用戶的聲場喜好而允許用戶提供數字內容的最佳感受。所述裝置包括音頻使用環境管理單元和音頻適配單元，用于適配與用戶的適配請求相關聯的音頻內容。
文檔編號H04S7/00GK1717956SQ200380104052
公開日2006年1月4日申請日期2003年10月15日優先權日2002年10月15日
發明者徐廷一, 張大永, 姜京玉, 金鎮雄, 安致得申請人:韓國電子通信研究院

完整全部詳細技術資料下載