專利名稱:表征媒體的方法和裝置的制作方法
技術領域:
本發明總體涉及媒體監測,更具體地說,涉及用于表征媒體以及用 于生成對媒體信息進行識別的簽名的方法和裝置。
背景技術:
已知使用簽名匹配技術來對媒體信息進行識別,更具體地說,對音 頻流(例如,音頻信息)進行識別。已知的簽名匹配技術通常用于電視 及電臺受眾統計應用(metering application),并且使用幾種用于生成簽名 并匹配的方法來實現。例如,在電視觀眾統計應用中,在監測地點(例 如,監測的家庭)和參考地點生成簽名。監測地點通常包括例如對受眾 成員的媒體消費進行監測的家庭的之類的位置。例如,在監測地點,可 以基于與所選擇的頻道、廣播臺等相關聯的音頻流來生成監測的簽名。 然后,可以將該監測的簽名發送到中央數據收集裝置進行分析。在參考 地點,基于在廣播區域內提供的已知節目來生成簽名(通常稱為參考簽 名)。該參考簽名可以存儲在參考位置和/或中央數據收集裝置,并且與在 監測位置生成的監測簽名進行比較。可以找到一個與參考簽名匹配的監 測簽名,并且與匹配的參考簽名對應的已知節目可以被識別為在監測地 點呈現的節目。
圖1A和圖1B例示了用于生成簽名并識別音頻流的示例性的音頻流 識別系統。
圖2是例示了示例性的簽名生成處理的流程圖。 圖3是例示了圖2示出的示例性的捕捉音頻處理的進一步細節的流 程圖。
圖4是例示了圖2示出的示例性的計算判決量度處理的進一步細節 的流程圖。
圖5是例示了用于確定圖4所示的頻段(bin)和頻帶(band)之間
關系的一個示例性處理的進一步細節的流程圖。
圖6是例示了用于確定圖4所示的頻段和頻帶之間關系的第二示例
性處理的進一步細節的流程圖。
圖7是示例性的簽名匹配處理的流程圖。
圖8是如何根據圖7的流程圖對簽名進行比較的圖。
圖9是基于音頻流或音頻塊來生成簽名的示例性簽名生成系統的框圖。
圖IO是用于比較簽名的示例性的簽名比較系統的框圖。 圖11是可以用于實現此處描述的方法和裝置的示例性的處理器系統 的框圖。
具體實施例方式
雖然以下公開了除了其他部件以外使用在硬件上執行的軟件實現的 示例性的系統,但是應注意的是,這種系統僅僅是示例性的,而不應當 視為是限制性的。例如,可以單獨用硬件,單獨用軟件或者以硬件和軟 件的任何組合來實施這些硬件和軟件部件中的任何一個或全部。因此, 雖然以下描述了示例性系統,但本領域的技術人員容易理解,所提供的 示例不是實現該系統的唯一方式。
此處描述的方法和裝置總體涉及生成可用于對媒體信息進行識別的 數字簽名。數字簽名是出于匹配、索引或數據庫檢索的目的而精確地表 征音頻信號的音頻描述符。具體而言,針對基于音頻流或音頻塊(例如,音頻信息)生成數字簽名而描述了所公開的方法和裝置。但是,此處描 述的方法和裝置還可以基于任何其它類型的媒體信息(例如,視頻信息、 網頁、靜止圖像、計算機數據等)來生成數字簽名。此外,媒體信息可 以與以下信息相關聯廣播信息(例如,電視信息,電臺信息等),從任
何存儲介質(例如,壓縮盤(CD)、數字通用盤(DVD)等)中重現的 信息,或者與音頻流、視頻流相關聯的任何其它信息,或者從中生成了 數字簽名的任何其它媒體信息。在一個具體的示例中,基于以下數字簽 名來對音頻流進行識別,這些數字簽名包括監測地點(例如,監測的家 庭)生成的監測數字簽名以及在參考地點和/或中央數據收集裝置處生成 和/或存儲的參考數字簽名。
如以下將具體描述的,此處描述的方法和裝置基于數字簽名來對包 括音頻流的媒體信息進行識別。此處描述的示例性的技術利用音頻采樣 塊通過對音頻采樣塊中的音頻頻譜的屬性進行分析而在特定時間計算簽 名。如下面將要描述的,對音頻頻譜的信號頻帶計算判決函數或判決量 度,并且基于該判決量度的值將簽名比特分配給音頻采樣塊。可以基于 頻譜頻帶之間的比較或者通過將頻帶與兩個或更多個矢量進行巻積來計 算判決函數或判決量度。除了根據原始信號的頻譜表示(spectral representation)以外,可以根據其他方法(例如小波變換、余弦變換等) 得到判決函數。
可以基于與受眾所消費的媒體信息(例如,監測的音頻流)相關聯 的音頻流在監測地點利用以上技術來生成監測的簽名。例如,可以基于 在監測地點呈現的電視節目的軌道(track)的音頻塊來生成監測的簽名。 然后,該監測的簽名可以被傳送到中央數據收集裝置以與一個或更多個 參考簽名進行比較。
基于與已知的媒體信息相關聯的音頻流而在參考地點和/或中央數 據收集裝置處利用以上技術來生成參考簽名。已知的媒體信息可包括在 區域內廣播的媒體、在家庭內重現(reproduce)的媒體、經由互聯網接 收到的媒體等。各參考簽名與媒體標識信息(例如,歌曲標題、電影標 題等) 一起存儲在存儲器中。當在中央數據收集裝置處接收到監測的簽名時,將該監測的簽名與一個或更多個簽名進行比較直到找到一個匹 配。然后,該匹配信息用于對從中生成了該監測簽名的媒體信息(例如, 監測的音頻流)進行識別。例如,可以參照查找表或數據庫來檢索與從
中生成了該監測簽名的媒體信息相對應的媒體標題、節目標識(program identity)、居操號(episode number)等。
在一個示例中,監測簽名和參考簽名的生成速率可能不同。當然, 在監測簽名與參考簽名的數據速率不同的設置中,當將監測簽名與參考 簽名進行比較時,必須對該差異進行說明。例如,如果監測速率是參考 速率的25%,則各個連續的監測簽名將對應于每第4個參考簽名。
圖1A和圖1B例示了用于生成數字頻譜簽名以及識別音頻流的示例 性的音頻流識別系統100和150。示例性的音頻流識別系統100和150可 以分別實現為電視廣播信息識別系統和無線電廣播信息識別系統。示例 性的音頻流識別系統100包括監測地點102 (例如,監測家庭)、參考地 點104及中央數據收集裝置106。
對電視廣播信息進行監測包括以下步驟基于電視廣播信息的音頻 數據在監測地點102生成監測的簽名,并且將監測的簽名經由網絡108 傳送至中央數據收集裝置106。可以在參考地點104處生成參考簽名并且 也可以經由網絡108將參考簽名傳送至中央數據收集裝置106。可以在中 央數據收集裝置106處通過將監測的簽名與一個或更多個參考簽名進行 比較直到找到一個匹配為止來對由在監測地點102處生成的監測的簽名 所代表的音頻內容進行識別。或者,可以將監測的簽名從監測地點102 傳送至參考地點104,并且在參考地點104處將該監測的簽名與一個或更 多個參考簽名進行比較。在另一個示例中,可以將參考簽名傳送至監測 地點102并且在監測地點102中將該參考簽名與監測的簽名進行比較。
監測地點102可以是,例如,對受眾的媒體消費進行監測的家庭。 通常,監測地點102可包括多個媒體遞送設備110、多個媒體呈現設備 112、和用于生成與在監測地點102呈現的媒體相關聯的監測的簽名的簽 名生成器114。
該多個媒體遞送設備110可包括,例如,機頂盒調諧器(例如,有線調諧器、衛星調諧器等)、DVD播放器、CD播放器、收音機等。媒體 遞送設備110 (例如,機頂盒調諧器)中的部分或全部可以以可通信的方 式耦合到一個或更多個廣播信息接收設備116,廣播信息接收設備116可 包括電纜、碟形衛星天線、天線、和/或用于接收廣播信息的任何其它的 合適設備。媒體遞送設備110可被配置為基于例如廣播信息和/或存儲的 信息來重現媒體信息(例如,音頻信息、視頻信息、網頁、靜止圖像等)。 可以從廣播信息接收設備116獲得廣播信息,并且可以從信息存儲介質 (例如,DVD、 CD、磁帶等)獲得存儲的信息。媒體遞送設備110以可 通信的方式耦合到媒體呈現設備112,并且可被配置為將媒體信息傳送至 媒體呈現設備112進行呈現。媒體呈現設備112可包括具有顯示設備和/ 或一組揚聲器的電視,受眾成員通過電視來消費例如廣播電視信息、音 樂、電影等。
如下面將更詳細描述的那樣,簽名生成器114可用于基于音頻信息 生成監測的數字簽名。具體而言,在監測地點102,可以將簽名生成器 114配置成基于監測的音頻流來生成監測的簽名,該監測的音頻流是由媒 體遞送設備110重現和/或由媒體呈現設備112呈現的。簽名生成器114 可經由音頻監測接口 118以可通信的方式耦合到媒體遞送設備110和/或 媒體呈現設備112。按照這種方式,簽名生成器114可獲得與媒體遞送設 備110重現的和/或媒體呈現設備112呈現的媒體信息相關聯的音頻流。 另外地或另選的是,簽名生成器114可以以可通信的方式耦合到被放置 在靠近媒體呈現設備112處的麥克風(未示出)以監測音頻流。簽名生 成器114還可以以可通信的方式經由網絡108耦合到中央數據收集裝置 106。
網絡108可用于在監測地點102、參考地點104和中央數據收集裝 置106之間傳送簽名(例如,數字頻譜簽名)、控制信息、和域配置信息。 任何有線或無線通信系統(例如,寬帶有線網絡、DSL網絡、蜂窩電話 網絡、衛星網絡和/或任何其它通信網絡)都可以用于實現網絡108。
如圖1A所示,參考地點104可包括多個廣播信息調諧器120、參考 簽名生成器122、發射機124、數據庫或存儲器126和廣播信息接收設備128。參考簽名生成器122和發射機124可以以可通信的方式耦合到存儲 器126以在其中存儲參考簽名和/或從其中檢索存儲的參考簽名。
廣播信息調諧器120可以以可通信的方式耦合到廣播信息接收設備 128,廣播信息接收設備128可包括電纜、天線、碟形衛星天線和/或用于 接收廣播信息的任何其它的合適設備。各個廣播信息調諧器120可被配 置為調諧到特定的廣播頻道。通常,參考地點104處的調諧器的數量等 于特定的廣播區域中可用的頻道的數量。按照這種方式,可以對通過廣 播區域中的所有的頻道發送的所有媒體信息來生成參考簽名。可以將經 過調諧后的媒體信息的音頻部分從廣播信息調諧器120傳送至參考簽名 生成器122。
參考簽名生成器122可以被配置為獲得在特定的廣播區域中可得到 的所有媒體信息中的音頻部分。然后,參考簽名生成器122可以基于音 頻信息生成多個參考簽名(如以下將更詳細描述的)并且將該參考簽名 存儲在存儲器126中。雖然在圖1中示出了一個參考簽名生成器,但是 在參考地點104可以使用多個參考簽名生成器。例如,該多個簽名生成 器中的每一個可以以可通信的方式耦合到這些廣播信息調諧器120中一 個相應廣播信息調諧器120。
發射機124可以以可通信的方式耦合到存儲器126并且被配置為從 其中檢索簽名,并且經由網絡108將參考簽名傳送至中央數據收集裝置 106。
中央數據收集裝置106可以被配置為將從監測地點102接收到的監 測的簽名與從參考地點104接收到的參考簽名進行比較。此外,中央數 據收集裝置106可以被配置為通過將監測的簽名與參考簽名進行匹配來 對監測的音頻流進行識別并且利用該匹配信息來從數據庫中檢索電視節 目標識信息(例如,節目標題、廣播時間、廣播頻道等)。中央數據收集 裝置106包括接收機130、簽名分析器132和存儲器134,它們都如圖所 示以可通信的方式耦合。
接收機130可以被配置成經由網絡108接收監測的簽名和參考簽名。 接收機130以可通信的方式耦合到存儲器134并且被配置為將監測的簽名以及參考簽名存儲其中。
簽名分析器132可以用于對參考簽名與監測的簽名進行比較。簽名 分析器132以可通信的方式耦合到存儲器134并且被配置為從存儲器134 中檢索監測的簽名和參考簽名。簽名分析器132可以被配置為從存儲器 134中檢索參考簽名和監測的簽名,并且將該監測的簽名與參考簽名進《亍 比較直到找到一個匹配為止。可以使用任何機器可訪問的信息存儲介質 (例如一個或更多個硬盤驅動器、 一個或更多個光存儲設備等)來實現 存儲器134。
雖然在圖1A中簽名分析器132位于中央數據收集裝置106中,但是, 簽名分析器132可以更換為位于參考地點104。在這樣的配置中,可以經 由網絡108將監測的簽名從監測地點102傳送至參考地點104。另選的是, 存儲器134可以位于監測地點102,并且可以通過發射機124經由網絡 108周期性地將參考簽名添加到存儲器134。另外,雖然簽名分析器132 被示出為與簽名生成器114及122分離的設備,但是,簽名分析器132 可以與參考簽名生成器122和/或簽名生成器114 一體地形成。另外,雖 然圖1說明了單個的監測地點(S卩,監測地點102)和單個的參考地點(即, 參考地點104),但是,可以經由網絡108將多個這種地點耦合到中央數 據收集裝置106。
圖1B的音頻流識別系統可以配置為對與無線電廣播信息相關聯的 音頻流進行監測和識別。通常,音頻流識別系統150用于對由特定的廣 播區域中的多個無線電臺廣播的內容進行監測。與用于對受眾所消費的 電視內容進行監測的音頻流識別系統100不同,音頻流識別系統150可 以用于對在廣播區域內廣播的音樂、歌曲等以及它們被廣播的次數進行 監測。這種類型的媒體追蹤可用于確定與各個音頻作品相關聯的版稅 (royalty)支付、版權的正確使用等。音頻流識別系統150包括監測地點 152、中央數據收集裝置154和網絡108。
監測地點152被配置為接收在特定的廣播區域中可得到的所有的無 線電廣播信息,并且基于該無線電廣播信息生成監測的簽名。監測地點 152包括該多個廣播信息調諧器120、該發射機124、該存儲器126和該廣播信息接收設備128,所有這些都結合圖1A進行了說明。此外,監測 地點152包括簽名生成器156。當在音頻流識別系統150中使用時,廣播 信息接收設備128被配置為接收無線電廣播信息,并且廣播信息調諧器 120被配置為調諧到該無線電廣播電臺。監測地點152處的廣播信息調諧 器120的數量可以等于特定廣播區域中無線電廣播電臺的數量。
簽名生成器156被配置為從各個廣播信息調諧器120接收被調諧到 的音頻信息并且生成該調諧到的音頻信息的監測簽名。雖然示出了一個 簽名生成器(即,簽名生成器156),但是監測地點152可以包括多個簽 名生成器,各個簽名生成器以可通信的方式耦合到廣播信息調諧器120 中的一個。簽名生成器156可以將監測的簽名存儲在存儲器126中。發 射機124可以從存儲器126中檢索監測的簽名并且經由網絡108將它們 傳送至中央數據收集裝置154。
中央數據收集裝置154被配置為從監測地點152接收監測的簽名, 基于參考音頻流生成參考簽名,并將監測的簽名與參考簽名進行比較。 中央數據收集裝置154包括接收機130、簽名分析器132和存儲器134。 所有這些都結合圖1A在上面進行了具體說明。此外,中央數據收集裝置 154包括參考簽名生成器158。
參考簽名生成器158被配置為基于參考音頻流生成參考簽名。該參 考音頻流可以存儲在任何類型的機器可訪問介質(例如,CD、 DVD、數 字音頻帶(DAT))中。通常,藝術家和/或唱片制作公司將它們的音頻作 品(g卩,音樂、歌曲等)發送至中央數據收集裝置154以將它們添加到 參考庫中。參考簽名生成器158可以從機器可訪問的介質中讀取音頻數 據并且基于各個音頻作品(即,圖3中的捕獲的音頻300)生成多個參考 簽名。然后,參考簽名生成器158可以將參考簽名存儲在存儲器134中 以用于由簽名分析器132進行隨后的檢索。可以將與各個參考音頻流相 關聯的標識信息(例如,歌曲標題、藝術家的名字、軌道號等)存儲在 數據庫中并且可以基于參考簽名進行索引。按照這種方式,中央數據收 集裝置154包括具有參考簽名以及與所有已知且可得到的歌曲標題相對 應的標識信息的數據庫。接收機130被配置為從網絡108接收監測的簽名,并且將該監測的 簽名存儲在存儲器134中。由簽名分析器132從存儲器134中檢索出監 測的簽名和參考簽名以用于對在廣播區域內廣播的監測音頻流進行識 另lj。簽名分析器132可以通過首先將監測的簽名與參考簽名進行匹配來 對監測的音頻流進行識別。然后,將該匹配信息和/或匹配參考簽名用于 從存儲在存儲器134中的數據庫中檢索標識信息(例如,歌曲標題、歌 曲軌道、藝術家等)。
雖然在圖1B中示出了一個監測地點(例如,監測地點152),但是 多個監測地點可以以可通信的方式耦合到網絡108并且被配置為生成監 測的簽名。具體而言,各個監測的地點可以位于各自廣播區域中,并且 被配置為對各自廣播區域內的廣播電臺的內容進行監測。
下面描述了用于創建例如長度為24比特的數字簽名的示例性簽名 生成處理和裝置。在一個示例中,從具有大約2秒時長音頻采樣的長塊 中得到各個簽名(即,各個24比特的字)。當然,所選擇的簽名長度以 及音頻采樣塊的大小僅僅是示例性的,并且可以選擇其它的簽名長度和 塊大小。
圖2是表示示例性的簽名生成處理200的流程圖。如圖2所示,簽 名生成處理200首先捕捉要由簽名表征的音頻塊(方框202)。可以經由 例如到音頻源的硬線連接(hardwiredconnection)或者經由到音頻源的無 線連接(諸如音頻傳感器)來從音頻源捕捉音頻。如果音頻源是模擬的, 則該捕捉包括使用例如模/數轉換器來對模擬音源進行采樣(數字化)。
以8kHz的采樣率(Fs)對要確定其簽名的進來的模擬音頻流進行數 化字采樣。這意味著由以每秒8000個采樣的速率或者以125微秒(us) 1個采樣的速率抽取的數字采樣來表示模擬音頻。可以用16比特的分辨 率來表示各個音頻采樣。通常,這里用變量N來表示音頻塊中捕捉的采 樣數量。在一個示例中,以8kHz對音頻采樣2.048秒的時長,其結果是 N二 16384個時域的采樣。在這種設置中,捕捉的音頻的時間范圍對應于 t…t+N/Fs,其中,t是第一個釆樣的時間。當然,上面規定的具體采樣率、 比特分辨率、采樣時長和所得到的時域采樣的數量僅僅是一個示例。如圖3所示,可以通過在輸入緩存區中將采樣移位諸如256個采樣 的量(方框302),并且讀取新的采樣以填入緩存區中為空的部分(方框 304)來實現捕捉音頻處理202。如下面的示例中描述的,因為單獨的頻 段(Frequency Bin)對于音頻塊的選擇更為敏感,所以從包括多個頻段 的頻帶中而不是從頻段中得到表征音頻塊的簽名。在一些示例中,因為 參考簽名和測量地點簽名(后面稱作地點單元簽名(site unit signature)) 是從在時域中無法彼此對準的音頻采樣塊中計算出來的,所以確保該簽 名相對于塊排列的穩定至關重要。為了解決這個問題,在一個示例中, 以32毫秒的間隔來捕捉參考簽名(即,通過附加上256個新的采樣并且 丟棄最舊的256個采樣來對16384采樣的音頻塊進行更新)。在示例性的 地點單元中,以128毫秒的時間間隔或者以1024個采樣的采樣增量來捕 捉簽名。因此,最差情況參考簽名與地點單元簽名之間的塊偏差是128 個釆樣。簽名的所期望特征是對128個釆樣的移位具有魯棒性。實際上, 在下述的匹配處理中,希望地點單元簽名與參考簽名完全一致以能夠成 功地"命中(hit)"査找表
參照圖2,在捕捉到音頻之后(方框202),對捕捉到的音頻進行變 換(方框204)。在一個示例中,該變換可以是從時域到頻域的變換。例 如,可以將捕捉到的音頻的N個采樣轉換成音頻頻譜,該音頻頻譜由包 括實部頻率分量和虛部頻率分量的N/2個復數的離散傅立葉變換(DFT) 系數來表示。下式1示出了一個示例性的頻率轉換式,對時域的幅度值 執行該頻率轉換以將其轉換成復值的頻域譜系數X[k]。
<formula>formula see original document page 18</formula>式l
其中,x[k]是具有實部分量和虛部分量的復數,從而,
Z[W-^^] + A/[W,0"SiV-l,實部和虛部分別為A閱和^p]。由頻段 索引k來標識各個頻率分量。雖然上述說明提及了DFT處理,但是,可 以釆用任何適當的變換(諸如,小波變換、離散余弦變換(DCT)、 MDCT、 哈爾(Haar)變換、沃爾什(Walsh)變換等)。變換結束后(方框204),處理200對判決量度進行計算(方框206)。 如下所述,可以通過將變換后的音頻劃分成為頻帶(即,劃分成幾個頻 帶,各個頻帶包括幾個復值的頻率分量段(frequency component bin))來 計算判決量度。在一個示例中,可以將變換后的音頻劃分成頻段的24個 頻帶。劃分之后,針對各個頻帶,例如,基于頻帶中的譜系數值之間的 關系(對它們進行相互比較,或者與另一個頻帶的值進行比較,或者用 兩個或更多個矢量進行巻積)來確定判決量度。所述關系可以基于對各 個頻帶內頻率分量組的處理。在一個具體的示例中,可以按照迭代的方 式來選擇頻率分量組以使得一個頻帶內的所有頻率分量段在迭代中的一 些點處成為組中的一個成員。判決量度的計算針對所考慮的頻段的各個 頻帶生成了例如一個判決量度。因此,對于頻段的24個頻帶,生成了24 個離散的判決量度。下面結合圖4至圖6來說明示例性的判決量度計算。 基于判決量度(方框206),處理200確定數字簽名(方框208)。因 此,簽名的一個示例性的結構是從相應的判決量度的符號(即,正和負) 中得到各個比特。例如,如果相應的判決量度(下面將其定義為DB[p], 其中p是包括正在分析的頻段的集合(collection)的頻帶)為非負,則 將24比特的簽名中的各個比特設為1。反之,如果相應的判決量度(DB[p]) 為負,則將24比特的簽名中的1個比特設為0。
確定了簽名之后(方框208),處理200確定是否應該對簽名生成處 理進行迭代(方框210)。當應該生成另一個簽名時,處理200捕捉音頻 (方框202),處理200進行重復。
圖4中示出了計算判決量度206的示例性的處理。根據此示例,在 對音頻進行了變換之后(方框206),將變換后的音頻劃分成頻帶(方框 402)。在一個示例中,通過在例如開始于k=508處的3072個連續頻段 (其被劃分成24個頻帶)處對譜分量(實部和虛部)進行觀察來計算在 時刻t (例如,捕捉到最后一個幅度的時間)處的24比特的簽名S(t)。這 3072個頻段跨越了例如從大約250Hz至大約3.25kHz的頻率范圍。該頻 率范圍是其中包含了典型音頻內容(諸如語音和音樂)中的大部分音頻 能量的頻率范圍。這些頻段的集合形成了例如24個頻帶B[p] (0Sp^P,其中,P-24個頻帶),其中每個頻帶包括128個頻段。通常,在一些示 例中,對于不同的頻帶, 一個頻帶內的頻段的數量可以不同。
在將變換后的音頻劃分成頻帶之后(方框402),確定各個頻帶中的 頻段之間的關系(方框402)。也就是說,為了利用簽名來表征頻譜,必 須按照能夠對各個頻帶縮減到單個數據比特的方式來對一個頻帶中相鄰 頻段之間的關系進行計算。可以通過對頻率分量段進行分組并且對各個 組進行操作來確定這些關系。圖5和圖6示出了用于確定各個頻帶中的 頻段之間關系的兩個示例性的方式。在一些示例中,可以將針對所選擇 頻帶的判決函數計算視為數據縮減步驟,由此來將一個頻帶中的頻譜系 數的值縮減為1個比特的值。
通常,可以在不參考底層(underlying)頻帶的能量或者頻譜分量的 幅度的情況下構造判決函數或量度D。為了得到不同的函數D,可以對 于能夠使用的DFT系數的實部和虛部矢量來構造二次型(quadratic form)。考慮矢量(XR(k),X!(k"的集合(其中,k是DFT系數的索引),可 以將二次型D寫成上述集合中的矢量的兩兩的標量積(點積)的線性組 合。可以通過將表示頻段的虛部分量和實部分量相乘并相加來確定各個 頻帶中的頻段之間的關系。這是可行的,因為如上所述,變換的結果包 括各頻段的實部分量和虛部分量。下式2示出了判決量度的示例。如下 所示,D[M]是圍繞頻率索引為m的頻段的一個鄰域的或一組的頻段 m-w,…m,…,m+w的實頻譜分量與虛頻譜分量的乘積。當然,D[M]的計算 對于頻帶內的各m值是迭代的。因此,對式2示出的計算進行迭代直到 處理了整個頻帶的頻率分量段為止。
式2
其中,^,々 ,、是要確定的系數,而厶i^A",v是跨過整個鄰域(即, 跨過頻帶中的所有頻段)的索引。設計目標是確定呈完全指定了D[m]的 該二次型形式的系數b,AH的數值。
在基于各m值附近的頻段而針對所選擇的頻帶中的各m值計算出了D[m]的值之后,在構成頻帶p的所有頻段上對D[m]求和以獲得頻帶p的 總判決量度DB[p]。通常,可以用由頻譜幅度的實部和虛部形成的矢量的 點積的線性組合來表示DB[p]。因此,還可以用式3所示的形式來表示頻 帶p的判決函數。如結合圖2所述的,在一個示例中,符號(即,判決 量度的正或負)決定了所考慮的頻帶的簽名比特分配。
式3
轉向圖6,可以按照與結合圖5所描述的示例性方式不同的方式來 確定頻帶中的頻段之間的關系。如下所述,該第二示例性的方式是如下 方法,即通過將表示或構成頻譜的頻帶的各頻段與一對M分量的復矢量 進行巻積來從信號(諸如音頻信號)的頻譜中得到魯棒的簽名。
在一個這樣的示例中,判決量度可以將組的寬度限制為3個頻段。 也就是說,由圖4的方框402執行的劃分生成了分別具有3個頻段的多 個組,從而可以考慮w=l的值。在這樣的布置中,不是計算系數 ,,々 ,^ ,
而是在一個示例中可以用一對3個元素的復矢量與構成一個組的3個所 選擇的頻段(例如,3個傅立葉系數)執行巻積(方框602)。用于巻積 的示例性矢量如下式4和5所示。根據以上的說明,可以對考慮的3個 頻段寬的組進行索弓I并遞增直到頻帶中的各個頻段都被考慮了為止。
雖然在下式中示出了具體的示例性的矢量,但是,應了解的是,可 以用任何適當的矢量值與感興趣的3個頻段的組(g卩,表示了感興趣頻 段的傅立葉系數)進行頻域巻積或滑動相關。在另一些示例中,可以使 用長度大于3的矢量。因此,以下的示例僅僅是可以使用的矢量的一個 實施例。在一個示例中,用于以等概率來生成值為1或0的簽名比特的 一對矢量必須具有恒定的能量(即,這兩個矢量的元素的平方和必須完 全相同)。此外,在期望保持計算簡單時,矢量元素的數量應當較少。在 一個示例性的實現中,元素的數量為奇數以創建在感興趣的頻段的任一 側長度對稱的鄰域。在生成簽名時,有利的是,針對不同的頻帶選擇不 同的矢量對以在簽名的比特之間獲得最大的去相關(decorrelation )。<formula>formula see original document page 22</formula>對于索引為k的頻段,與復數的3元素矢量W:[a+jb,c,d+je]的巻積得 到式6所示的復數輸出。
<formula>formula see original document page 22</formula>
對于上面的矢量對,可以使用這兩個矢量來計算巻積的頻段幅度之 間的能量差。在式7中示出了該差。
<formula>formula see original document page 22</formula>
在展開并簡化之后,其結果如式8所示。
<formula>formula see original document page 22</formula>
其中,<formula>formula see original document page 22</formula>并且<formula>formula see original document page 22</formula>
以上針對時域采樣塊內的頻段k計算了與能量分布特性有關的特
征。在這種情況下,這是對稱的測度。如果在頻帶Bp的所有頻段上對能 量差求和,可以得到如式9所示的整個塊的相應分布測度。
<formula>formula see original document page 22</formula>其中,尸,和&是頻帶戶的起始頻段索引和結束頻段索引。因此,感興趣的頻帶的總判決函數可以是實部及虛部分量與針對屬于該頻帶的各頻段而適當選擇的數值參數的乘積之和。
為了使簽名是唯一的,該簽名的各個比特應當與其它比特高度地去相關。這種去相關可以通過在不同的頻帶的巻積計算中使用不同的系數來實現。通過對包含對稱的復數三元組的矢量進行巻積有助于提高這種去相關。在以上的示例中,獲得了相關的乘積,其包括與巻積相關聯的所有3個頻段的實部和虛部兩者。這與基于對實部和虛部進行平方并相加的簡單的能量測度大不相同。
在一些布置中,缺點之一是,所生成的大約30%的簽名包含高度相關的相鄰比特。例如,24比特中的最高位8個比特可能全為1或0。這種簽名稱作平凡(trivial)的簽名,因為它們是從如下的音頻塊中得到的在所述音頻塊中,對于許多頻譜頻帶而言,能量分布至少關于頻譜的有效(significant)部分幾乎是完全相同。所得到的頻帶的這種高度相關的特性導致了在很大片段中簽名比特彼此完全相同。彼此差異很大的幾個音頻波形可能會產生將導致虛假的正匹配的簽名。這種平凡的簽名可以在匹配處理期間被拒絕并且可以由檢測是否存在1或0的長字符串的匹配處理來檢測這種平凡的簽名。
為了從這種歪曲(skewed)的分布中提取出有意義的簽名,需要使用多于兩個矢量來提取頻帶表示。在一個示例中,可以使用3個矢量。在下式10 — 12中示出了可以使用的3個矢量的示例。
^ <formula>formula see original document page 23</formula>『3
i,i VJ .、' i,i VI 、 —(—+—y)丄一(---力
2 22 2 2 2
式12
現在可以按照以下方式來計算24比特的簽名,即簽名的各個比特p (03-3)與用于確定其值的矢量對中的其相鄰的比特不同
式12
作為示例,在上式中p=0,3,6等的比特或頻帶可以使用m=l,n=2; 而p=l,4,7等的比特或頻帶可以使用m=l,n=3; p=2,5,8等的比特或頻帶可 以使用111=2,11=3。也就是說,這些索引可以與矢量的任何子集進行組合。 即使是從彼此緊鄰的頻帶中得到了相鄰的比特,使用不同的矢量對來進 行巻積使得它們響應于音頻塊的不同的部分。按照這種方式,這些矢量 變得去相關。
當然,可以使用多個3個的矢量,可以以任何適當方式將這些矢量 與具有索引的比特組合。在一些示例中,使用多于兩個的矢量可能會使 平凡簽名的出現減少到10%。另外, 一些使用多于兩個矢量的示例可能 使成功匹配的數量提高了 20%。
以上說明了可以執行用于確定表示捕捉的音頻的一部分的簽名的簽 名技術。如上所述,這些簽名可以作為參考簽名或地點單元簽名而生成。 通常,可以按例如32毫秒或256個音頻采樣的間隔來計算參考簽名,并 將參考簽名存儲在"哈希表"中。在一個示例中,表的查找地址是簽名本 身。該位置的內容是參考音頻流中指定了對該特定簽名進行捕捉的位置 的索引。當接收到了用于匹配的地點單元簽名時,其值構成用于輸入哈 希表的地址。如果該位置包括有效地時間索引,則其表明已經檢測到了 潛在的匹配。但是,在一個示例中,基于從2秒的音頻塊得到的簽名的 單個匹配不能用來聲明一個成功匹配。
實際上,由位置單元簽名本身訪問的哈希表可以包括被存儲為鏈表 的多個索引。每個這種條目(entry)指示了參考音頻流中潛在的匹配位置。為了對匹配進行確認,在哈希表中對隨后的地點單元簽名進行"命中"檢査。每個這種命中可生成指向不同參考音頻流位置的索引。還對地點單元簽名進行時間索引。
地點位置簽名與匹配參考單元簽名之間索引值的差異提供了一個偏
移值。當觀察到一個成功匹配時,彼此相隔128毫秒時間步長(time step)的幾個地點單元簽名產生哈希表的命中,使得該偏移值與前一次命中的偏移值相同。當在一段地點單元簽名中觀察到的完全相同的偏移的數量超過閾值時,可以確認在參考和地點單元流中存在兩個相應時間段之間的匹配。
圖7示出了可用于對參考簽名(即,在參考地點處確定的簽名)與監測的簽名(即,在監測地點確定的簽名)進行比較的一個示例性的簽名匹配處理700。簽名匹配的最終目標是找到査詢音頻簽名(例如,監測的音頻)與數據庫中的簽名(例如,基于參考音頻得到的簽名)之間的最接近的匹配。可以在參考地點、監測地點、或能夠對監測的簽名及包含參考簽名的數據庫進行訪問的其它數據處理地點執行該比較。
現在,具體參照圖7的示例性的方法,示例性的處理700包括獲得監測的簽名及其相關聯的定時(方框702)。如圖8所示,簽名集合可以包括多個監測的簽名,在圖8中用標號802、 804和806處示出了其中的3個。各個簽名由sigma 來表示。監測的簽名802、 804和806中的每一個可包括定時信息808、 810、 812,無論該定時信息是隱式的還是顯式的。
然后,對包含參考簽名的數據庫進行查詢(方框704)以識別出數據庫中具有最接近匹配的簽名。在一個實現中,將簽名之間的相似性(近似性)測度取為漢明距離,即,查詢值與參考比特串不同的位置的數量。在圖8中,在標號816處示出了簽名及定時信息的數據庫。當然,數據庫806可包括來自不同媒體呈現的任何數量的不同簽名。然后,建立匹配參考簽名所關聯的節目與未知簽名之間的關聯(方框706)。
可選的是,處理700然后可以建立監測的簽名與參考簽名之間的偏移(方框708)。因為該偏移在連續查詢簽名(連續査詢簽名的值從連續的內容中得到)的相當長的時段中保持恒定,因此非常有幫助。恒定的 偏移值本身是表示匹配精度的測度。該信息可以用于在進一步的數據査
詢中輔助處理700。
在多于一個參考簽名的所有描述符都與低于預定漢明距離閾值的漢 明距離相關聯的情況下,多于一個監測的簽名需要與可能的匹配參考音 頻流的各個參考簽名進行匹配。基于監測的音頻流而生成的所有監測的 簽名與多于一個參考音頻流的所有參考簽名相匹配幾乎是不可能的,因 此,能夠防止將多于一個的參考音頻流錯誤地匹配到監測的音頻流。
可以通過硬件、軟件和/或它們的組合來實現上述示例性的方法、處 理和/或技術。更具體地說,可以在圖9和圖10的框圖所限定的硬件中執 行該示例性的方法。還可以通過在處理器系統(例如,圖11的處理器系 統lllO)上執行的軟件來實現該示例性的方法、處理和/或技術。
圖9是用于生成數字頻譜簽名的示例性的簽名生成系統900的框圖。 具體而言,示例性的簽名生成系統900可用于基于上述采樣、變換和判 決量度計算來生成監測的簽名和/或參考簽名。例如,示例性的簽名生成 系統900可以用于實現圖1A的簽名生成器114和122或者圖1B的簽名 生成器156和158。另外,該示例性簽名生成系統900可以用于實現圖2 至圖6的示例性方法。
如圖9所示,示例性的簽名生成系統900包括采樣生成器902、變 換器908、判決量度計算器910、簽名確定器914、存儲部916和數據通 信接口 918,所有這些部件以可通信的方式如圖所示進行耦合。示例性的 簽名生成系統卯0可以被配置為獲得示例性的音頻流,從示例性的音頻 流中獲取多個音頻采樣以形成音頻塊并且從該單個的音頻塊生成表示該 音頻塊的簽名。
采樣生成器902可以被配置為獲得示例性的音頻流或媒體流。該流 可以是任何的模擬或數字音頻流。如果該示例性的音頻流是模擬音頻流, 則可以使用模/數轉換器來實現該采樣生成器902。如果該示例性的音頻 流是數字音頻流,則可以使用數字信號處理器來實現該采樣生成器902。 此外,該采樣生成器902可以被配置為按照任何期望的采樣頻率Fs來獲取和/或提取音頻采樣。例如,如上所述,該采樣生成器可以被配置為以
8kHz來獲取N個釆樣,并且可以用16比特來表示各個采樣。在這種布置中,N可以是任何數量的采樣(諸如16384)。采樣生成器902還可以通知參考時間生成器904何時開始音頻采樣獲取處理。采樣生成器902將釆樣傳送至變換器908。
定時設備903可以被配置為生成時間數據和/或時間戳信息,并且可以通過時鐘、定時器、計數器和/或任何其它適當的設備來實現定時設備卯3。定時設備903可以以可通信的方式耦合到參考時間生成器904并且可以被配置為將時間數據和/或時間戳傳送到參考時間生成器904。定時設備903也可以以可通信的方式耦合到釆樣生成器902并且可以聲明一個起始信號或中斷以指示釆樣生成器902開始收集或獲取音頻釆樣數據。在一個示例中,通過以毫秒的分辨率來追蹤時間的周期為24小時的實時時鐘來實現定時設備903。在這種情況下,定時設備903可以被配置為在午夜復位為0并且相對午夜按照毫秒來追蹤時間。
當從采樣生成器902接收到通知時,參考時間生成器904可以對參考時間化進行初始化。該參考時間t。可用于指示在音頻流內生成簽名的時間。具體而言,參考時間生成器904可以被配置為當由采樣生成器902通知了采樣獲取處理開始時,從時間設備903中讀出時間數據和/或時間戳的值。然后,參考時間生成器904可以將時間戳的值存儲為參考時間t0。
變換器908可以被配置為對各個16384采樣的音頻塊執行N/2點的DFT。例如,如果采樣生成器獲得了 16384個采樣,則變換器將從以下釆樣生成頻譜,在這些采樣中頻譜由具有實部分量和虛部分量的8192個離散頻率系數表示。
在一個示例中,判決量度計算器910被配置為通過對要考慮的相鄰頻段進行分組來對變換器908生成的DFT內的幾個頻帶(例如,24個頻帶)進行識別。在一個示例中,每頻帶選擇3個頻段,從而形成了24個頻帶。可以根據任何技術來選擇頻帶。當然,可以選擇任何數量的合適的頻帶以及每個頻帶的頻段。然后,判決量度計算器910確定各頻帶的判決量度。例如,判決量度計算器910可以將一個頻帶中相鄰頻段的復幅度或能量相乘并相加。另選的是,如上所述,判決量度計算器910可以將頻段與兩個或更多個任意維矢量進行巻積。例如,判決量度計算器910可以將一個頻帶中的3個頻段與2個矢量(分別為3維)巻積。在另一個示例中,判決量度計算器910可以將一個頻帶中的3個頻段與從具有3個矢量的集合中選擇的2個矢量進行巻積,其中基于所考慮的頻帶來選擇這3個矢量中的2個。例如,可以按照輪換的方式來選擇矢量,其中,第一矢量和第二矢量用于第一頻帶,第一和第三矢量用于第二頻帶,并且第二矢量和第三矢量用于第三頻帶,其中循環進行這種選擇輪換。
判決量度計算器910的結果是針對由頻段組成的各頻帶的單一數值。例如,如果存在24個由頻段組成的頻帶,則判決量度計算器910將生成24個判決量度。
簽名確定器914對從判決量度計算器910得到的值進行操作以針對判決量度中的每一個而生成一個簽名比特。例如,如果判決量度為正,則可以分配比特值l,而如果判決量度為負,則可以分配比特值O。將該簽名比特輸出至存儲部916。
存儲器可以是適于進行簽名存儲的任何適當的介質。例如,存儲部916可以是諸如隨機存取存儲器(RAM)、閃存等之類的存儲器。另外地或另選的是,存儲部916可以是諸如硬盤驅動器、光存儲介質、帶驅動器等的大容量存儲器。
存儲部916耦合到數據通信接口 918。例如,如果該系統900位于監測地點(例如,在一個人家中),則可以利用數據通信接口918將存儲部916中的簽名信息傳送到收集裝置、參考地點等。
圖10是用于比較數字頻譜簽名的示例性的簽名比較系統1000的框圖。具體而言,示例性的簽名比較系統1000可以用于對監測的簽名與參考簽名進行比較。例如,示例性的簽名比較系統1000可以用于實現對監測的簽名與參考簽名進行比較的圖1A的簽名分析器132。另外,示例性的簽名比較系統1600可以用于實現圖7的示例性處理。示例性的簽名比較系統1000包括監測簽名接收機1002、參考簽名接收機1004、比較器1006、漢明距離濾波器1008、媒體識別器1010和媒體標識查找表接口 1012,所有這些部件如圖所示以可通信的方式耦合。
監測簽名接收機1002可被配置為經由網絡108 (圖1)獲得監測的簽名,并且將該監測的簽名傳送至比較器1606。參考簽名接收機1604可以被配置為從存儲器134 (圖1A和圖1B)獲得參考簽名,并將該參考簽名傳送至比較器1006。
比較器1006和漢明距離濾波器1008可以被配置為利用漢明距離對參考簽名與監測的簽名進行比較。具體而言,比較器1006可以被配置為將監測的簽名的描述符與多個參考簽名的描述符進行比較以針對各個比較而生成漢明距離的值。然后,漢明距離濾波器1008從比較器1006獲得漢明距離的值并且基于該漢明距離的值的將不匹配的參考簽名濾除。
當找到了匹配的參考簽名之后,媒體識別器IOIO可以獲得該匹配的參考簽名并且與媒體標識査找表接口 1012協同工作可以對與未識別出的音頻流相關聯的媒體信息進行識別。例如,媒體標識査找表接口 1012可以以可通信的方式耦合到媒體標識查找表或者耦合到用于基于參考簽名而對媒體標識信息(例如,電影標題、展覽標題、歌曲標題、藝術家名字、劇集號等)進行交叉對照(cross-reference)的數據庫。按照這種方式,媒體識別器IOIO可以基于匹配的參考簽名從媒體標識數據庫中檢索媒體標識信息。圖11是可以用于實現此處描述的裝置和方法的示例性處理器系統1110的框圖。如圖11所示,處理器系統1110包括耦合到互聯總線或網絡114的處理器1112。處理器1112包括寄存器組或寄存器空間1116 (在圖11中示出為完全位于片上),但是,另選的是,該存器組或寄存器空間1116可以完全地或部分地位于片外,并且經由專用電連接和/或經由互聯的網絡或總線1114直接耦合到處理器1112。處理器1112可以是任何適當的處理器、處理單元或微處理器。雖然在圖11中沒有示出,但是,系統1110可以是多處理器系統,因此,可以包括與處理器1112完全相同或類似的并且以可通信的方式耦合到互聯總線或網絡1114的一個或更多個附加的處理器。圖11的處理器1112耦合到芯片組1118,該芯片組1118包括存儲器控制器1120和輸入/輸出(I/O)控制器1122。公知的是,芯片組通常提供I/O和存儲器管理功能以及可由耦合到該芯片組的一個或更多個處理器訪問或者使用的多個通用和/或專用的寄存器、定時器等。存儲器控制器1120執行使處理器1112(或者這些處理器(如果存在多個處理器的話))能夠訪問系統存儲器1124和大容量存儲器1125的功能。
系統存儲器1124可包括任何期望類型的易失性和/或非易失性存儲器,例如,靜態隨機存取存儲器(SRAM)、動態隨機存取存儲器(DRAM)、閃存、只讀存儲器(ROM)等。大容量存儲器125可包括任何期望類型的大容量存儲設備,包括硬盤驅動器、光驅動器、帶存儲設備等。
I/O控制器1122執行使處理器1112能夠經由I/O總線1130與外圍的輸入/輸出(I/O)設備1126和1128進行通信的功能。I/O設備1126和1128可以是任何期望類型的I/O設備,諸如鍵盤、視頻顯示器或監視器、鼠標等。雖然在圖11中將存儲器控制器1120和I/O控制器1122描述為芯片組1118內的獨立功能框,但是,由這些框執行的功能可以集成在單個半導體電路中或者可以利用兩個或更多個單獨的集成電路來實現。
這里描述的方法可以利用存儲在計算器可讀介質上并由處理器112執行的指令來實現。計算器可讀介質可包括固態、磁和/或光媒體的任何期望的組合,該固態、磁和/或光媒體是利用大容量設備(例如,盤驅動器)、可移除存儲設備(例如,軟盤、存儲卡或記憶棒等)和/或集成存儲器設備(例如,隨機存取存儲器、閃存等)的任何期望的組合來實現。
容易理解的是,可以按照任何數量的不同方式來實現上述簽名生成和匹配處理和域方法。例如,除了這些部件以外,可以利用在硬件上執行的軟件或固件來實現這些處理。但是,這僅僅是一個示例,并且可以預期的是,可以使用任何形式的邏輯來實現該處理。該邏輯可包括例如專門在專用硬件(例如,電路、晶體管、邏輯門、硬編碼(hard-coded)處理器、可編程陣列邏輯(PAL)、專用集成電路(ASIC)等)中、專門在軟件中、專門在固件中、或者在硬件、固件和/或軟件的某種組合中的實現。例如,表示示出的處理的一部分或全部的指令可以存儲在一個或更多個存儲器或其它機器可讀媒體(諸如,硬盤驅動器等)中。這種指 令可以是硬編碼的或者是可改變的。另外,可以人工地執行該處理的某 些部分。此外,雖然按照特定的順序示出了此處說明的各個處理,但是, 本領域的技術人員容易認識到,這種順序僅僅是一個示例,存在大量其 它的順序。因此,雖然以上說明了示例性的處理,但是,本領域的技術 人員容易理解,這些示例并非實現這種處理的唯一方式。
雖然此處已經描述了特定的方法、裝置和制品,但是本專利的覆蓋 范圍不限于此。
權利要求
1、一種表征媒體的方法,該方法包括以下步驟捕捉音頻塊;至少將所述音頻塊的一部分轉換成包括多個復數值頻率分量的頻域表示;限定要考慮的復數值頻率分量的頻帶;利用所述復數值頻率分量的頻帶來確定判決量度;以及基于所述判決量度的值來確定簽名比特。
2、 根據權利要求1所述的方法,其中,捕捉音頻塊的步驟包括經由 硬線連接來獲得音頻。
3、 根據權利要求1所述的方法,其中,捕捉音頻塊的步驟包括經由 無線音頻傳感器來獲得音頻。
4、 根據權利要求1所述的方法,其中,捕捉音頻塊的步驟包括以下 步驟對音頻信號進行數字化采樣并且將數字采樣存儲在緩存區中。
5、 根據權利要求4所述的方法,其中,捕捉音頻塊的步驟包括以下 步驟將若干個舊的采樣移位出所述緩存區,并且將若干個新的采樣移 位到所述緩存區中。
6、 根據權利要求1所述的方法,其中,至少將所述音頻塊的一部分 轉換成頻域表示的步驟包括以下步驟使用傅立葉變換。
7、 根據權利要求1所述的方法,其中,限定復數值頻率分量的頻帶 的步驟包括以下步驟對在所述頻域表示中相鄰的復數值頻率分量進行分組。
8、 根據權利要求7所述的方法,其中,限定復數值頻率分量的頻帶的步驟包括以下步驟對聽覺頻率范圍內的復數值頻率分量進行分組。
9、 根據權利要求1所述的方法,其中,利用所述復數值頻率分量的頻帶來確定判決量度的步驟包括以下步驟對一個集合的矢量的點積進 行線性組合,該集合的矢量表示所述頻帶中的所述復數值頻率分量的實 部分量和虛部分量。
10、 根據權利要求9所述的方法,其中,基于所述頻帶內的一組復 數值頻率分量來計算所述線性組合。
11、 根據權利要求9所述的方法,其中,確定判決量度的步驟進一 步包括以下步驟對所述頻帶中所有復數值頻率分量的線性組合進行求 和計算。
12、 根據權利要求1所述的方法,其中,利用所述復數值頻率分量 的頻帶來確定判決量度的步驟包括以下步驟將復數值頻率分量與復矢 量進行巻積。
13、 根據權利要求12所述的方法,其中,所述巻積包括將所述頻帶 中的各復數值頻率分量與一對復矢量進行巻積。
14、 根據權利要求13所述的方法,其中,所述頻帶中的一組3個復 數值頻率分量分別與一對3元素復矢量進行巻積。
15、 根據權利要求14所述的方法,其中,確定判決量度的步驟包括 以下步驟對巻積進行求和。
16、 根據權利要求15所述的方法,其中,第一個3元素矢量的平方 和等于第二個3元素矢量的平方和。
17、 根據權利要求15所述的方法,其中,該對3元素復矢量是從具 有3個或多于3個的3元素復矢量的集合中選擇的。
18、 根據權利要求17所述的方法,其中,基于正在處理的頻帶來選 擇該對3元素復矢量。
19、 根據權利要求12所述的方法,其中,復數值頻率分量與復矢量 的巻積表示了在所述頻帶中對稱的能量分布。
20、 根據權利要求12所述的方法,其中,所述判決量度是基于所述 復數值頻率分量和第一復矢量的巻積結果與所述復數值頻率分量和第二 復矢量的巻積結果之差。
21、 根據權利要求20所述的方法,其中,所述判決量度是基于對所 述復數值頻率分量和第一復矢量的巻積結果與所述復數值頻率分量和第 二復矢量的巻積結果之差的求和。
22、 一種表征媒體的裝置,其包括采樣生成器,其捕捉音頻塊;變換器,其至少將所述音頻塊的一部分轉換成包括多個復數值頻率 分量的頻域表示;判決量度計算器其限定要考慮的復數值頻率分量的頻帶;并且 其利用所述復數值頻率分量的頻帶來確定判決量度;以及簽名確定器,其基于所述判決量度的值來確定簽名比特。
23、 根據權利要求22所述的裝置,其中,捕捉音頻塊包括經由硬線連接來獲得音頻。
24、 根據權利要求22所述的裝置,其中,捕捉音頻塊包括經由無線 音頻傳感器來獲得音頻。
25、 根據權利要求22所述的裝置,其中,捕捉音頻塊包括對音頻信 號進行數字化采樣并且將數字采樣存儲在緩存區中。
26、 根據權利要求25所述的裝置,其中,捕捉音頻塊包括將若干個 舊的釆樣移位出所述緩存區,并且將若干個新的采樣移位到所述緩存區 中。
27、 根據權利要求22所述的裝置,其中,至少將所述音頻塊的一部 分轉換成所述頻域表示包括使用傅立葉變換。
28、 根據權利要求22所述的裝置,其中,限定復數值頻率分量的頻 帶包括對在所述頻域表示中相鄰的頻率分量進行分組。
29、 根據權利要求28所述的裝置,其中,限定復數值頻率分量的頻 帶包括對聽覺頻率范圍內的復數值頻率分量進行分組。
30、 根據權利要求22所述的裝置,其中,利用所述復數值頻率分量 的頻帶來確定所述判決量度包括對一個集合的矢量的點積進行線性組 合,該集合的矢量表示所述頻帶中的所述復數值頻率分量的實部分量和 虛部分量。
31、 根據權利要求30所述的裝置,其中,基于所述頻帶內的一組復 數值頻率分量來計算所述線性組合。
32、 根據權利要求30所述的裝置,其中,確定判決量度進一步包括 對所述頻帶中所有復數值頻率分量的線性組合進行求和計算。
33、 根據權利要求22所述的裝置,其中,利用該組復數值頻率分量 來確定判決量度包括將復數值頻率分量與復矢量進行巻積。
34、 根據權利要求33所述的裝置,其中,所述巻積包括將所述頻帶 中的各復數值頻率分量與一對復矢量進行巻積。
35、 根據權利要求34所述的裝置,其中,所述頻帶中的一組3個復 數值頻率分量分別與一對3元素復矢量進行巻積。
36、 根據權利要求35所述的裝置,其中,確定判決量度包括對巻積 進行求和。
37、 根據權利要求35所述的裝置,其中,第一個3元素矢量的平方 和等于第二個3元素矢量的平方和。
38、 根據權利要求35所述的裝置,其中,該對3元素復矢量是從具 有3個或多于3個的3元素復矢量的集合中選擇的。
39、 根據權利要求35所述的裝置,其中,基于正在處理的頻帶來選 擇該對3元素復矢量。
40、 根據權利要求33所述的裝置,其中,復數值頻率分量與復矢量 的巻積表示在所述頻帶內對稱的能量分布。
41、 根據權利要求33所述的裝置,其中,所述判決量度是基于所述 復數值頻率分量和第一復矢量的巻積結果與所述復數值頻率分量和第二 復矢量的巻積結果之差。
42、 根據權利要求41所述的裝置,其中,所述判決量度是基于所述 復數值頻率分量和第一復矢量的巻積結果與所述復數值頻率分量和第二 復矢量的巻積結果之差的求和。
43、 一種存儲有指令的機器可讀介質,當所述指令在執行時使得機 器進行以下操作捕捉音頻塊;至少將所述音頻塊的一部分轉換成包括多個復數值頻率分量的頻域 表示;限定要考慮的頻帶內的一組復數值頻率分量; 利用所述復數值頻率分量的頻帶來確定判決量度;以及 基于所述判決量度的值來確定簽名比特。
44、 根據權利要求43所述的機器可讀介質,其中,所述指令進一步 使得所述機器經由硬線連接獲得音頻。
45、 根據權利要求43所述的機器可讀介質,其中,所述指令進一步使得所述機器經由無線音頻傳感器獲得音頻。
46、 根據權利要求43所述的機器可讀介質,其中,所述指令進一步 使得所述機器對音頻信號進行數字化采樣并且將數字采樣存儲在緩存區 中。
47、 根據權利要求46所述的機器可讀介質,其中,所述指令進一步 使得所述機器將若干個舊的采樣移位出所述緩存區,并且將若干個新的 采樣移位到所述緩存區中。
48、 根據權利要求43所述的機器可讀介質,其中,所述指令進一步 使得所述機器通過使用傅立葉變換而至少將所述音頻塊的一部分轉換成 所述頻域表示。
49、 根據權利要求43所述的機器可讀介質,其中,所述指令進一步 使得所述機器對在所述頻域表示中相鄰的復數值頻率分量的頻帶進行限 定。
50、 根據權利要求49所述的機器可讀介質,其中,所述指令進一步 使得所述機器通過在可聽見的頻率范圍中對復數值頻率分量進行分組來 限定復數值頻率分量的頻帶。
51、 根據權利要求43所述的機器可讀介質,其中,所述指令進一步 使得所述機器通過對頻帶中表示所述復數值頻率分量的實部分量和虛部 分量的矢量集合的點積進行線性組合而利用所述復數值頻率分量的頻帶 來確定所述判決量度。
52、 根據權利要求51所述的機器可讀介質,其中,所述線性組合是 基于所述頻帶內的一組復數值頻率分量來計算。
53、 根據權利要求51所述的機器可讀介質,其中,所述指令進一步使得所述機器還通過對所述頻帶中所有的復數值頻率分量的線性組合進 行求和計算來確定判決量度。
54、 根據權利要求43所述的機器可讀介質,其中,所述指令進一步 使得所述機器利用復數值頻率分量與復矢量的巻積而基于所述復數值頻 率分量的頻帶來確定所述判決量度。
55、 根據權利要求54所述的機器可讀介質,其中,所述指令進一步 使得所述機器將所述頻帶中各復數值頻率分量與一對復矢量進行巻積。
56、 根據權利要求55所述的機器可讀介質,其中,所述頻帶中的一 組3個復數值頻率分量分別與一對3元素復矢量進行巻積。
57、 根據權利要求56所述的機器可讀介質,其中,確定所述判決量 度包括對巻積求和。
58、 根據權利要求57所述的機器可讀介質,其中,第一個3元素矢 量的平方和等于第二個3元素矢量的平方和。
59、 根據權利要求57所述的機器可讀介質,其中,該對3元素復矢 量是從具有3個或多于3個的3元素復矢量的集合中選擇的。
60、 根據權利要求59所述的機器可讀介質,其中,基于正在處理的 頻帶來選擇該對3元素復矢量。
61、 根據權利要求50所述的機器可讀介質,其中,復數值頻率分量 與復矢量的巻積表示在所考慮的頻帶內對稱的能量分布。
62、 根據權利要求54所述的機器可讀介質,其中,所述判決量度是 基于所述復數值頻率分量和第一復矢量的巻積結果與所述復數值頻率分 量和第二復矢量的巻積結果之差。
63、 根據權利要求62所述的機器可讀介質,其中,所述判決量度是 基于所述復數值頻率分量和第一復矢量的巻積結果與所述復數值頻率分 量和第二復矢量的巻積結果之差的求和。
64、 一種表征媒體的方法,該方法包括以下步驟 捕捉音頻塊;至少將所述音頻塊的一部分轉換成包括多個變換域系數的變換域表限定要考慮的變換域系數的頻帶;通過計算所述變換域系數與復矢量的巻積來確定判決量度;以及 基于所述判決量度的值來確定簽名比特。
65、 根據權利要求64所述的方法,其中,所述巻積包括將所述頻帶 中的各變換域系數與一對復矢量進行巻積。
66、 根據權利要求65所述的方法,其中,所述頻帶中的一組3個變 換域系數分別與一對3元素復矢量進行巻積。
全文摘要
本發明描述了一種用于表征媒體的方法和裝置。在一個示例中,表征媒體的方法包括以下步驟捕捉音頻塊;至少將所述音頻塊的一部分轉換成包括多個復數值頻率分量的頻域表示;限定要考慮的復數值頻率分量的頻帶;利用所述復數值頻率分量的頻帶來確定判決量度;以及基于所述判決量度的值來確定簽名比特。本發明示出并說明了其它示例。
文檔編號H04H20/14GK101669308SQ200880012844
公開日2010年3月10日 申請日期2008年2月20日 優先權日2007年2月20日
發明者亞歷山大·托普奇, 阿倫·拉馬斯瓦米, 韋努戈帕爾·斯里尼瓦桑 申請人:尼爾森(美國)有限公司