計算機系統及音頻比對方法
【技術領域】
[0001] 本發明是有關于一種計算機系統及音頻比對方法,且特別是有關于一種循序進行 音頻比對的計算機系統及音頻比對方法。
【背景技術】
[0002] 音頻比對是一種快速的音頻檢索方式,使用者可在噪音環境下錄制一段正在播放 的音頻片段,并在音頻比對系統中找到最符合此音頻片段的歌曲、電影、電視節目或廣播節 目。
[0003] 然而,已知的音頻比對系統在音頻比對的正確率、音頻比對所需的等待時間以及 執行音頻比對的服務器的運算量上仍有許多改進的空間。
[0004] 因此,如何設計一個新的音頻比對裝置及方法,以解決上述的問題,乃為此一業界 亟待解決的問題。
【發明內容】
[0005] 因此,本發明的一方面是在提供一種計算機系統,用以進行音頻比對。計算機系統 包含客戶終端以及服務器。
[0006] 客戶終端包含分類器、第一地標特征擷取模塊、第一編碼模塊以及整合模塊。分類 器用以估算第一音頻樣本的一第一音頻片段的辨識難易度。第一地標特征擷取模塊用以根 據辨識難易度,決定地標特征擷取的次數,并對第一音頻片段進行相對應次數的地標特征 擷取,以產生多個第一地標特征。第一編碼模塊用以將第一地標特征編碼為多個第一散列 鍵。整合模塊用以整合第一散列鍵,并產生整合后的多個散列鍵傳送至服務器。
[0007] 服務器包含第二地標特征擷取模塊、第二編碼模塊、散列表、查表模塊、分析模塊 以及判斷模塊。
[0008] 第二地標特征擷取模塊用以對第二音頻樣本進行地標特征擷取,以產生多個第二 地標特征。第二編碼模塊用以將第二地標特征編碼為多個第二散列鍵。散列表用以儲存第 二散列鍵與其所對應的多個散列值。查表模塊,用以將客戶終端所傳送的散列鍵與散列表 中的第二散列鍵進行查表比對。分析模塊用以分析查表比對的結果。判斷模塊,用以決定 音頻比對結果,并將音頻比對結果傳送至客戶終端。
[0009] 依據本發明一實施例,判斷模塊還用以測量一信心度,當信心度達到門檻值時,則 決定音頻比對結果,并將音頻比對結果傳送至客戶終端。當信心度未達門檻值時,則判斷模 塊發送請求至客戶終端,客戶終端配合服務器依據請求對第一音頻樣本中的一第二音頻片 段進行音頻處理。
[0010] 依據本發明另一實施例,上述第二音頻片段是接續于第一音頻片段。
[0011] 依據本發明又一實施例,上述信心度為第一音頻片段中每秒比對到的散列鍵數 目。
[0012] 依據本發明更具有的一實施例,上述第一地標特征與第二地標特征包含一起始頻 率、一頻率差以及一時間差。
[0013] 依據本發明另具有的一實施例,上述第二散列鍵的散列值包含一地標特征開始時 間以及一節目數據。
[0014] 依據本發明又具有的一實施例,上述分類器于估算該辨識難易度時,利用第一音 頻片段的一絕對音量的平均值、一相對音量的標準差、一三次微分絕對值加總的標準差中 的一者或上述三者的組合估算辨識難易度。
[0015] 依據本發明再具有的一實施例,于上述客戶終端中,當兩個第一散列鍵相同時,上 述整合模塊還用以刪除該兩個第一散列鍵其中之一。
[0016] 依據本發明另又一實施例,上述第一音頻樣本為一歌曲、一電影、一電視節目或一 廣播節目的音頻。
[0017] 依據本發明另再一實施例,上述客戶終端為一智能手機、一平板電腦、一筆記型電 腦、一智能手表、一智能眼鏡、一智能電視,或一數字電視機上盒。
[0018] 本發明的再一方面是在提供一種音頻比對方法,包含下列步驟:
[0019] 估算第一音頻樣本的一第一音頻片段的辨識難易度;根據辨識難易度,決定地標 特征擷取的次數,并對第一音頻片段進行相對應次數的地標特征擷取,以產生多個地標特 征;將地標特征編碼為多個第一散列鍵;整合第一散列鍵,并將整合后的多個散列鍵與散 列表中的多個第二散列鍵進行查表比對;分析查表比對的結果;以及決定音頻比對結果。
[0020] 依據本發明一實施例,音頻比對方法還包含下列步驟:測量信心度;當信心度達 到門檻值時,則決定音頻比對結果;以及當信心度未達門檻值時,則對第一音頻樣本的一第 二音頻片段重新進行上述音頻比對方法。
[0021] 依據本發明另一實施例,上述音頻比對方法中,第二音頻片段是接續于該第一音 頻片段。
[0022] 依據本發明又一實施例,上述音頻比對方法中,信心度為第一音頻片段中每秒比 對到的散列鍵數目。
[0023] 依據本發明更具有的一實施例,上述音頻比對方法中,各地標特征還包含一起始 頻率、一頻率差以及一時間差。
[0024] 依據本發明再具有的一實施例,上述音頻比對方法中,各第二散列鍵的散列值還 包含一地標特征開始時間以及一節目數據。
[0025] 依據本發明又具有的一實施例,上述音頻比對方法中,估算辨識難易度時,還利用 第一音頻片段的絕對音量的平均值、相對音量的標準差、三次微分絕對值加總的標準差中 的一者或其組合或上述三者的組合。
[0026] 依據本發明另具有的一實施例,上述音頻比對方法中,整合第一散列鍵的步驟還 包含:當兩個第一散列鍵相同時,刪除該兩個第一散列鍵其中之一。
[0027] 本發明的又一方面是在提供一種計算機可讀取記錄媒體,儲存一計算機程序,用 以執行一種音頻比對方法,音頻比對方法包含下列步驟:
[0028] 估算第一音頻樣本的一第一音頻片段的辨識難易度;根據辨識難易度,決定地標 特征擷取的次數,并對第一音頻片段進行相對應次數的地標特征擷取,以產生多個地標特 征;將地標特征編碼為多個第一散列鍵;整合第一散列鍵,并將整合后的多個散列鍵與散 列表中的多個第二散列鍵進行查表比對;分析查表比對的結果;以及決定音頻比對結果。
[0029] 應用本發明的優點在于可依音頻片段的音頻特征將取樣音框平移,并多次計算地 標特征以減少音頻片段的取樣音框與音頻樣本的取樣音框不對齊的影響,如此可有效提高 音頻比對的正確率。另外,使用者可以循序上傳音頻片段的信息至服務器進行辨識,并在信 心度達到門檻值后即回傳比對結果,如此可有效減少音頻比對所需的等待時間,并減少服 務器的運算量,而輕易地達到上述的目的。
【附圖說明】
[0030] 圖1為本發明一實施例中,一種計算機系統的方塊示意圖。
[0031] 圖2為本發明一實施例中,對音頻片段進行地標特征擷取的示意圖。
[0032] 圖3為本發明一實施例中,對音頻片段進行地標特征擷取的示意圖。
[0033] 圖4為本發明一實施例中,一種音頻比對方法的流程示意圖。
[0034] 圖5為本發明另一實施例中,一種音頻比對方法的流程示意圖。
【具體實施方式】
[0035] 下文是舉實施例配合所附附圖作詳細說明,但所提供的實施例并非用以限制本發 明所涵蓋的范圍,而結構運作的描述非用以限制其執行的順序,任何由元件重新組合的結 構,所產生具有均等功效的裝置,皆為本發明所涵蓋的范圍。此外,附圖僅以說明為目的,并 未依照原尺寸作圖。為使便于理解,下述說明中相同元件將以相同的符號標示來說明。
[0036] 在全篇說明書與權利要求書所使用的用詞(terms),除有特別注明外,通常具有每 個用詞使用在此領域中、在此揭露的內容中與特殊內容中的平常意義。某些用以描述本揭 露的用詞將于下或在此說明書的別處討論,以提供本領域技術人員在有關本揭露的描述上 額外的引導。
[0037]另外,關于本文中所使用的"耦接"或"連接",均可指二或多個元件相互直接作實 體或電性接觸,或是相互間接作實體或電性接觸,亦可指二或多個元件