一種音頻處理方法及裝置的制造方法
【技術領域】
[0001]本發明涉及互聯網技術領域,尤其涉及音頻技術領域,具體涉及一種音頻處理方法及裝置。
【背景技術】
[0002]副歌,通常指音頻文件(如歌曲、音樂等等)的高潮部分。以歌曲為例,一首歌曲通常采用AA’BA’Form(音樂結構),A代表主歌,而B代表副歌;也即時說,通常一首歌曲由“前奏+兩段主歌+ —段副歌+過門音樂+ —段副歌+ —段主歌+結尾音樂”按順序連接構成。副歌定位對音頻文件的分析和處理起著重要作用,現有技術主要是基于對音頻文件的分析處理定位副歌,但是,基于音頻文件的分析處理計算量大,準確度低,從而降低了音頻處理的智能性。
【發明內容】
[0003]本發明實施例提供一種音頻處理方法及裝置,可以基于音頻文件對應的MIDI (Musical Instrument Digtal Interface,樂器數字接口)文件對音頻文件進行副歌定位,提升音頻處理的準確度,提升音頻處理的智能性。
[0004]本發明實施例第一方面提供一種音頻處理方法,可包括:
[0005]獲取音頻文件對應的MIDI文件;
[0006]解析所述MIDI文件,獲得至少一個音符,及所述至少一個音符的特征值與時間屬性;
[0007]采用所述至少一個音符,及所述至少一個音符的特征值與時間屬性,構建所述音頻文件的參考序列;
[0008]采用所述至少一個音符的特征值,構建所述音頻文件的第一特征序列;
[0009]對所述第一特征序列進行線性運算,獲得所述音頻文件的第二特征序列;
[0010]對所述參考序列和所述第二特征序列進行分析處理,定位所述音頻文件的副歌。
[0011]本發明實施例第二方面提供一種音頻處理裝置,可包括:
[0012]文件獲取單元,用于獲取音頻文件對應的MIDI文件;
[0013]解析單元,用于解析所述MIDI文件,獲得至少一個音符,及所述至少一個音符的特征值與時間屬性;
[0014]參考序列構建單元,用于采用所述至少一個音符,及所述至少一個音符的特征值與時間屬性,構建所述音頻文件的參考序列;
[0015]特征序列構建單元,用于采用所述至少一個音符的特征值,構建所述音頻文件的第一特征序列;
[0016]線性運算單元,用于對所述第一特征序列進行線性運算,獲得所述音頻文件的第二特征序列;
[0017]定位單元,用于對所述參考序列和所述第二特征序列進行分析處理,定位所述音頻文件的副歌。
[0018]實施本發明實施例,具有如下有益效果:
[0019]本發明實施例中,可以基于音頻文件對應的MIDI文件,構建所述音頻文件的參考序列和第一特征序列,對所述第一特征序列進行線性運算可獲得所述音頻文件的第二特征序列,通過對所述參考序列和所述第二特征序列進行分析處理,可以定位所述音頻文件的副歌,由于MIDI文件的數據量較小,基于MIDI文件的副歌定位可以減少計算負荷,提升音頻處理的準確度,提升音頻處理的智能性。
【附圖說明】
[0020]為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
[0021]圖1為本發明實施例提供的一種音頻處理方法的流程圖;
[0022]圖2為圖1所示的步驟S103的實施例的流程圖;
[0023]圖3為圖1所示的步驟S104的實施例的流程圖;
[0024]圖4為圖1所示的步驟S105的實施例的流程圖;
[0025]圖5為圖1所示的步驟S106的實施例的流程圖;
[0026]圖6為本發明實施例提供的一種音頻處理裝置的結構示意圖;
[0027]圖7為本發明實施例提供的一種參考序列構建單元的結構示意圖;
[0028]圖8為本發明實施例提供的一種特征序列構建單元的結構示意圖;
[0029]圖9為本發明實施例提供的一種線性運算單元的結構示意圖;
[0030]圖10為本發明實施例提供的一種定位單元的結構示意圖;
[0031]圖11為本發明實施例提供的一種副歌定位單元的結構示意圖。
【具體實施方式】
[0032]下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0033]本發明實施例中,音頻文件可以包括但不限于:歌曲、歌曲片段、音樂、音樂片段、演奏樂、演奏樂片段、哼唱歌曲、哼唱歌曲片段等文件。MIDI是一個工業標準的電子通信協議,MIDI傳輸諸如音符、控制參數等非聲音信號的指令,用于指示MIDI設備的操作以及控制MIDI設備之間的交互。MIDI文件通常是以.mid為結尾的指令文件,這些指令可以包括某個音符的開始時間、結束時間、代表音符的音調特征的特征值等信息。
[0034]本發明實施例的音頻處理方案主要是基于音頻文件對應的MIDI文件,對音頻文件的副歌進行快速定位。本發明實施例的音頻處理方案可以應用于互聯網領域的多個場景中,例如:可以應用于對互聯網音頻庫中的音頻文件進行分析處理的場景,包括:可應用于主音查找的場景中進行副歌的快速定位和準確提取,也可應用于哼唱搜索的場景中進行副歌的快速定位和準確提取,還可應用于樂曲識別的場景中進行副歌的快速定位和準確提取等等;再如:可以應用于對互聯網音頻庫中的音頻文件進行試聽的場景,包括:可提供副歌進行在線播放或音樂下載前的試聽;或者,可以應用于彩鈴下載或試聽場景,包括:快速定位和準確提取副歌,將副歌作為彩鈴提供給用戶進行下載或試聽,等等。
[0035]下面將結合附圖1-附圖5,對本發明實施例提供的音頻處理方法進行詳細介紹。需要說明的是,附圖1-附圖5所示的音頻處理方法可以由本發明實施例提供的音頻處理裝置所執行,該音頻處理裝置可運行于終端設備或服務器中,其中,終端設備可包括但不限于:PC(Personal Computer,個人計算機)、PAD (平板電腦)、手機、智能手機、筆記本電腦等設備。
[0036]請參見圖1,為本發明實施例提供的一種音頻處理方法的流程圖;該方法可包括以下步驟SlOl-步驟S106。
[0037]S101,獲取音頻文件對應的MIDI文件。
[0038]一個音頻文件通常對應一個MIDI文件,該MIDI文件可以由諸如音頻文件的作曲者等音頻制作人制作生成,也可以由具備MIDI制作功能的設備根據音頻文件制作生成。音頻文件對應的MIDI文件可以作為該音頻文件的音準參考文件,當用戶對音頻文件進行重新演繹時,可以采用該音頻文件對應的MIDI文件對重新演繹的內容進行音準比對,并可用于對重新演繹的內容進行評分。本步驟中,可以從互聯網音頻庫中獲取待處理的音頻文件對應的MIDI文件。
[0039]S102,解析所述MIDI文件,獲得至少一個音符,及所述至少一個音符的特征值與時間屬性。
[0040]一個MIDI文件通常是以.mid為結尾的指令文件,這些指令可以包括某個音符的開始時間、結束時間、代表音符的音調特征的特征值等信息。本步驟中,根據MIDI文件的格式標準解析所述MIDI文件,可以獲得至少一個音符,及所述至少一個音符的特征值與時間屬性。
[0041]其中,音符是指用來記錄長短音的符號。其中,音符的特征值可用于表示音符的音調特征,一般地,音符的特征值的取值范圍為[21,108],音符的特征值越大,表示該音符的音調越高;音符的特征值越小,表示該音符的音調越低。其中,音符的時間屬性可用于描述音符的持續時間,音符的時間屬性可包括:音符的開始時間和音符的結束時間。
[0042]S103,采用所述至少一個音符,及所述至少一個音符的特征值與時間屬性,構建所述首頻文件的參考序列。
[0043]所述參考序列包括:至少一個參考元素及所述至少一個參考元素的索引;其中,一個參考元素包含一個音符、所包含音符的特征值及所包含音符的時間屬性。本步驟中,可以將一個音符、該音符的特征值及該音符的時間屬性確定為一個參考元素的三要素,那么,所述至少一個音符,及所述至少一個音符的特征值與時間屬性,則可以分別作為至少一個參考元素的三要素。將所述至少一個參考元素順序排列,生成所述音頻文件的參考序列。
[0044]S104,采用所述至少一個音符的特征值,構建所述音頻文件的第一特征序列。
[0045]所述第一特征序列包括:至少一個特征元素及所述至少一個特征元素的索引;一個特征元素包括一個音符的特征值。本步