專利名稱:“指紋”的提取的制作方法
技術領域:
本發明涉及從媒體信號中提取“指紋”的方法和裝置。
背景技術:
“指紋”,一般也稱作簽名或者雜亂的信號,是從多媒體內容,比如歌曲,圖象圖片,一個視頻片斷等中提取的比特序列。多媒體“指紋”特別是在鑒別領域,在需要時可以用來識別所接收到的內容是否為原始內容,或者探測內容是否被篡改。“指紋”也常常被用來識別媒體內容。一個在不遠的將來即將流行的服務就是音頻識別。從一段未知的音樂中提取的“指紋”被發送到一個可以查閱音樂的名稱,音樂家的名字和其他元數據的數據庫,然后再返回的消費者。
一個已知的從媒體信號中提取指紋的方法在申請人的編號為WO02/065782國際專利申請中被披露。這一現有技術的方法顯示在
圖1中。這個媒體信號(這里的是一首歌)被分成疊加的幀(101)。每一幀的頻譜表示通過一個快速傅里葉變換(102)而獲得。子頻帶中對數間隔的音頻信號的能量隨后被計算出來(103)。在300-200赫茲范圍內的頻帶是可感知的最相關范圍。該33的能量級構成了一相應音頻信號幀的可感知特性樣本的一個序列。為了相對音頻信號的絕對音量不變化和阻止一個主單音頻為連續幀生成相同序列,一個簡單的2維濾波器(104)被用于在獲得32個差分特性樣本前的頻譜圖上。該序列隨后被一個適當的閾值操作(105)轉換成一些比特串(105)。更具體的,一個特定幀的一個子頻帶,如果與相鄰子頻帶的能量差不同大于與它相鄰的前面一幀中子頻帶的能量差,則被分配比特“1”。否則,指紋比特是“0”。
該已知的方法為每一個音頻幀生成一個32比特的字符串(約等于0.4秒)。這些幀最好重疊(例如系數31/32),因此比特串隨著時間緩慢改變。這樣指紋的提取不會隨著時間偏移和幀邊界定位的變化而變化。具有代表性的,256個重疊幀的塊,即256×32=8192b比特(約等于3秒的音頻)被用來識別一首歌。
現有技術的指紋提取方法相對于所有普遍使用的音頻處理步驟已經非常穩固,如MP3編碼,抽樣率的變換,數字與模擬間的轉換,均衡。但是,它相對速度變化卻不穩固。廣播電臺加快幾個百分點的播放速度是很普遍的。這樣做應該有兩個原因。第一,歌曲的播放時間會更短,因此可以讓他們能播放更多的商業內容。第二,這些歌曲的節拍會快一些,而且聽眾看起來喜歡這樣。這種速度的變化一般在0-4%之間。
發明目的和概述本發明的目的之一是提供一個改進的從媒體信號中提取指紋的方法和裝置。
根據本發明,為了實現這個目的,提取方法包含從媒體信號獲得信號的給定的可感知特性的樣本序列;將特性樣本施加一個自動相關函數,以獲得一自動相關值序列;把這個自動相關值與各自的閾值比較;通過各自的指紋比特表現這個比較的結果。
本發明的提取方法與現有技術的指紋提取方法不同,本發明的指紋比特不是從信號的可感知特性上獲得,而是從所述特性的自動相關獲得的。本發明是根據一種認知,即音頻信號的速度變化導致子頻帶中的能量級從一個子頻帶轉移到另一個子頻帶,并且利用了自動相關函數偏移不變的特性。
該自動相關函數在一個持續的時間域內是眾所周知的。但是,我們這里要解決的是有限的特性值序列(如能量水平)。因此,根據本發明的方法的一個實際應用的具體實施例,預期的自動相關是通過將一個特性樣本子序列和特性樣本的完整序列相關來近似的。
該自動相關函數最好是通過大量的大于預期指紋比特量的特性樣本量被計算出的。被計算出的自動相關函數的下采樣被用來獲得預期的自動相關數值。
附圖簡述圖1示意性地顯示現有技術從音頻信號提取指紋的方案。
圖2示意性地現實根據本發明從音頻信號中提取指紋的方案。
具體實施例一個音頻信號的速度變化導致時間和頻域的失調。關于時間的失調,一個音頻摘錄2%的速率改變導致這個摘錄第250個指紋被從原摘錄的第255個指紋處提取到。幸而,為了位移的不變,指紋是這樣被構建的,它沿著時間軸具有相關性。因此,原始摘錄和速度改變的相同摘錄之間的BFR(比特錯誤率)不會由于時間的失調而大大增加。
因此速度大量改變所引起的的主要問題是頻率失調。在圖1所示的現有方案中,2%的提速將會導致由傅里葉變換獲得一個頻譜的頻率軸縮放。例如,一個500赫茲的音調導致一個510赫茲的音調和一個1000赫茲的音調導致一個1020赫茲的音調。在計算頻譜后,對數間隔頻帶里的能量被確定了。因為頻帶被對數地間隔,速度的變化導致的能量從一個頻帶改變到了下一個頻帶。從一個頻帶到下一個頻帶的能量偏移越大,提取指紋的比特錯誤的可能性越大。這是因為,該指紋的比特是被相鄰頻帶的能量差異所決定的。
已經建議用強制的途徑去識別顯著速率變化的音頻。強制途徑包括在數據庫中存儲在多種速度下提取的指紋,或者在數據庫中查尋在多種速度下提取的指紋。這種方法的缺點是,搜索的速度和/或儲存的規格被提高系數N,N即在具體應用中所需的不同速率數。
圖2顯示的一個根據本發明從一個音頻信號中提取指紋的裝置。在該圖中,相同的參數被用作在圖1已經討論過的同一的或相似的步驟。更具體的,該音頻信號被分為重疊的幀(101)和每一幀的頻譜被計算(102)。
一個自動相關的步驟(202)是取得更好的速度變化復原能力的基本步驟。一個速度變化導致被計算出的能量矢量的移位。自動相關有位移不變的特性。就像一般的所知,一個連續函數f(t)的自動相關p(x)是ρ(x)=∫-∞∞f(t)f(t+x)dt]]>但是,我們在這里并不涉及一個無限的連續函數f(t),而是一個有限的特性樣本(能量)序列。為了從統計的大量的特性樣本中計算出自動相關,512個子頻帶的能量被計算(201),而不是33個子頻帶。該頻帶仍然是對數的而且仍在300赫茲到2000赫茲的范圍內。因而該頻帶有一個較小的帶寬。該自動相關被通過將能量的一個子序列和完整的序列相關來近似。更具體的,如下從子頻帶能量樣本E(j)計算出自動相關ρ[x]ρ[x]=Σj=1ME(K+j)E(x+j)forx=1,2,··,N-M]]>其中N表示整個能量矢量的長度(這里N=512),M表示子序列的長度和K表示子序列在該完整序列中開始的位置。M和K的典型設置分別是64和96。為了提高穩固性,該產生出的自動相關值被選擇性地低通濾波(203)。該低通濾波的自動相關具有512-64=448個值,而在執行該閱值操作前,需要33個輸入值,以用于2維濾波器(104)。因此,該448個自動相關值在一個下抽樣器里被向下采樣到33個值(204)。所產生出的指紋是一個每一幀的32比特字符串。
雖然已經參考音頻指紋提取描述了本發明的方法和裝置的實施例,但是本發明并不限于此。申請人已經提到的國際專利申請WO02/065782揭示了視頻指紋的提取方法,其中指紋是從每個圖像被劃分成的圖象塊的平均亮度值獲得的。根據本發明,每個圖像被分成大量的圖塊,圖塊的一個子集(一個“超級圖塊”)對于所述超級塊的一些位置被與該整個圖像相關。該獲得的自動相關值的序列不隨視頻圖像的位移而變化。該序列被選擇性地低通濾波,隨后被向下取樣。
本發明可以被總結如下。指紋是被從媒體信號(如一個音頻或視頻片斷)中提取的比特字符串,用以識別所述媒體信號。典型的,他們被從信號的可感知特性獲得,例如,一個音頻片斷的頻譜能量分布或者一個視頻圖像的亮度分布。這里揭示的是一個相對于可感知的特性位移穩固的提取指紋的方法和裝置。這種位移發生在指紋從一個音頻信號的對數映射的頻譜的能量分布獲得時的,所述音頻信號有速度的改變。根據本發明,該指紋不是被從可感知特性提取的,而是通過它的自動相關函數提取的。
權利要求
1.一種從媒體信號提取指紋的方法,包含從所述的媒體信號中提取信號的給定的可感知特性的樣本序列,和從所述序列獲得構成所述指紋的一個二進制序列的步驟,其中所述方法包含如下步驟給特性樣本序列施加一個自動相關函數(202),以獲得一個自動相關值的序列;比較(105)所述的自動相關值與各自的閾值;通過指紋的各個比特表示出所述比較的結果。
2.根據權利要求1所述的方法,其中給特性樣本序列施加自動相關函數的所述步驟包括,將特性樣本的一個子序列和特性樣本的完整序列相關。
3.根據權利要求1所述的方法,其中給特性樣本序列施加自動相關函數的所述步驟進一步包括,對自動相關值下采樣(204),以獲得所需個數的自動相關值。
4.根據權利要求1所述的方法,其中從所述媒體信號獲取可感知特性值的序列的步驟包括,將一個音頻信號劃分成子頻帶并且計算所述音頻子頻帶的能量。
5.根據權利要求1所述的方法,其中從所述媒體信號獲取一個可感知特性序列的步驟包括,將圖象劃分成塊并計算所述圖象塊的亮度。
6.一種用于從媒體信號提取指紋的設備,包括用于從所述媒體信號獲取信號的給定可感知特性樣本序列的裝置,用于從所述序列獲取構成所述指紋的二進制序列的裝置,其特征在于,所述設備包括裝置,用于給特性樣本序列施加一個自動相關函數,以獲得一個自動相關值序列;裝置,用于比較所述自動相關值和相應的閾值;和用指紋的相應比特表示所述比較的結果。
7.一個計算機程序,包括使可編程設備執行以下步驟的指令從接收的媒體信號獲取信號的給定可感知特性的樣本序列;給特性樣本施加一個自動相關函數,以獲得一個自動相關值序列;比較所述自動相關值和相應的閾值;通過相應的指紋比特表示所述比較的結果。
全文摘要
“指紋”是指從媒體信號(例如一個音頻或視頻片斷)中提取的位串,用以識別所述媒體信號。具體講,他們是通過信號的可感知性被收集到的,例如,一個音頻片斷的頻譜能量分配或者一個視頻圖像的亮度分布。這里揭示的是一種相對于可感知性的偏移穩固的提取“指紋”的方法和裝置。尤其當“指紋”是源自一個音頻信號的對數映射的頻譜能量分配,并且該音頻信號是處在速度變化之中時會發生這種偏移。根據本發明,指紋不是源自前面講的媒體信號的可感知性,而是來自它的自動相關功能。
文檔編號G10L19/018GK1685703SQ03823392
公開日2005年10月19日 申請日期2003年8月11日 優先權日2002年9月30日
發明者J·A·海特斯馬 申請人:皇家飛利浦電子股份有限公司