本發(fā)明涉及多媒體技術(shù)領(lǐng)域,具體涉及一種歌曲處理方法及裝置。
背景技術(shù):
唱歌類應(yīng)用是目前深受用戶尤其是年輕用戶喜愛與追捧的一類應(yīng)用,其具備在線獨唱和在線合唱等多種功能。在線合唱功能是將多個用戶針對同一歌曲演唱的不同部分進行合成,從而達到合唱的效果。為了實現(xiàn)在線合唱功能,后臺需要預(yù)先對歌曲進行分段,劃分為多個部分,以供不同用戶演唱。
目前的歌曲分段方式一般是基于歌詞進行的,比如,當歌曲需要兩個用戶演唱時,將歌曲按照歌詞句數(shù)平分的方式進行劃分。在實踐中發(fā)現(xiàn),這種歌曲分段方式可能會出現(xiàn)一個用戶演唱到歌曲高潮部分時需要切換到另一用戶演唱的情況,從而使得用戶在合唱時容易出現(xiàn)銜接不連貫的問題。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供了一種歌曲處理方法及裝置,可以保證合唱的銜接連貫,從而提高合唱的流暢度。
本發(fā)明實施例第一方面提供了一種歌曲處理方法,包括:
按照目標歌曲的歌詞信息將所述目標歌曲劃分為n個音頻句,并提取每個音頻句的音頻特征;
根據(jù)所述每個音頻句的音頻特征將所述n個音頻句劃分為m個段落,得到每個段落的音頻句列表,其中,n和m為正整數(shù),n大于或等于m;
按照所述每個段落的音頻句列表輸出所述目標歌曲的歌詞信息。
可選的,所述提取每個音頻句的音頻特征,包括:
對每個音頻句進行分幀處理,得到幀序列;
提取所述幀序列中每幀數(shù)據(jù)的第一音頻特征;
根據(jù)所述第一音頻特征確定所述幀序列的第二音頻特征,并將所述第二音頻特征確定為所述每個音頻句的音頻特征。
可選的,所述根據(jù)所述每個音頻句的音頻特征將所述n個音頻句劃分為m個段落,得到每個段落的音頻句列表,包括:
將所述n個音頻句劃分為m個段落,得到每個段落的第一音頻句列表;
根據(jù)所述第一音頻句列表中音頻句的音頻特征,訓(xùn)練每個段落的音頻特征模型;
針對所述n個音頻句中的每個音頻句,分別計算所述每個音頻句的音頻特征與每個段落的所述音頻特征模型的匹配度,并將所述每個音頻句劃分到與所述每個音頻句的匹配度最高的段落中;
獲得音頻句重新劃分后的每個段落的第二音頻句列表;
針對每個段落,判斷所述每個段落的第二音頻句列表的音頻句與所述每個段落的第一音頻句列表的音頻句是否相同;
如果相同,則將所述第二音頻句列表確定為所述每個段落的音頻句列表。
可選的,所述方法還包括:
如果所述每個段落的第二音頻句列表的音頻句與所述每個段落的第一音頻句列表的音頻句不相同,則將所述第二音頻句列表確定為所述每個段落的第一音頻句列表,并返回執(zhí)行所述根據(jù)所述第一音頻句列表中音頻句的音頻特征,訓(xùn)練每個段落的音頻特征模型的操作。
可選的,所述對每個音頻句進行分幀處理,得到幀序列,包括:
針對每個音頻,以第一時長為幀移,第二時長為幀長對所述每個音頻句進行分幀處理,得到幀序列。
本發(fā)明實施例第二方面提供了一種歌曲處理裝置,包括:
第一劃分模塊,用于按照目標歌曲的歌詞信息將所述目標歌曲劃分為n個音頻句;
提取模塊,用于提取每個音頻句的音頻特征;
第二劃分模塊,用于根據(jù)所述每個音頻句的音頻特征將所述n個音頻句劃分為m個段落,得到每個段落的音頻句列表,其中,n和m為正整數(shù),n大于或等于m;
輸出模塊,用于按照所述每個段落的音頻句列表輸出所述目標歌曲的歌詞信息。
可選的,所述提取模塊包括:
處理單元,用于對每個音頻句進行分幀處理,得到幀序列;
提取單元,用于提取所述幀序列中每幀數(shù)據(jù)的第一音頻特征;
第一確定單元,用于根據(jù)所述第一音頻特征確定所述幀序列的第二音頻特征,并將所述第二音頻特征確定為所述每個音頻句的音頻特征。
可選的,所述第二劃分模塊包括:
劃分單元,用于將所述n個音頻句劃分為m個段落,得到每個段落的第一音頻句列表;
訓(xùn)練單元,用于根據(jù)所述第一音頻句列表中音頻句的音頻特征,訓(xùn)練每個段落的音頻特征模型;
計算單元,用于針對所述n個音頻句中的每個音頻句,分別計算所述每個音頻句的音頻特征與每個段落的所述音頻特征模型的匹配度;
所述劃分單元,還用于將所述每個音頻句劃分到與所述每個音頻句的匹配度最高的段落中;
獲取單元,用于獲得音頻句重新劃分后的每個段落的第二音頻句列表;
判斷單元,用于針對每個段落,判斷所述每個段落的第二音頻句列表的音頻句與所述每個段落的第一音頻句列表的音頻句是否相同;
第二確定單元,用于在所述判斷單元的判斷結(jié)果為是時,將所述第二音頻句列表確定為所述每個段落的音頻句列表。
可選的,所述第二確定單元,還用于在所述判斷單元的判斷結(jié)果為否時,將所述第二音頻句列表確定為所述每個段落的第一音頻句列表,并觸發(fā)所述訓(xùn)練單元執(zhí)行所述根據(jù)所述第一音頻句列表中音頻句的音頻特征,訓(xùn)練每個段落的音頻特征模型的操作。
可選的,所述處理單元對每個音頻句進行分幀處理,得到幀序列的具體方式為:
針對每個音頻,以第一時長為幀移,第二時長為幀長對所述每個音頻句進行分幀處理,得到幀序列。
本發(fā)明實施例中,歌曲處理裝置可以在將某一歌曲按照歌詞信息劃分為n個音頻句后,提取每個音頻句的音頻特征,從而根據(jù)音頻特征將n個音頻句劃分為指定的段落,最終按照劃分的段落輸出該歌曲的歌詞信息。通過本發(fā)明實施例,歌曲處理裝置可以基于音頻特征對歌曲劃分段落,能夠明顯提升歌曲分段的效果,從而可以保證用戶合唱銜接的連貫,提高合唱的流暢度。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實施例提供的一種歌曲處理方法的流程示意圖;
圖2a是本發(fā)明實施例提供的歌詞文件格式的示意圖;
圖2b是本發(fā)明實施例提供的歌曲分段后的歌詞展示界面示意圖;
圖3是本發(fā)明實施例提供的一種歌曲處理設(shè)備的結(jié)構(gòu)示意圖;
圖4是本發(fā)明實施例提供的一種歌曲處理裝置的結(jié)構(gòu)示意圖;
圖5是本發(fā)明實施例提供的提取模塊的分解示意圖;
圖6是本發(fā)明實施例提供的第二劃分模塊的分解示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明實施例提供了一種歌曲處理方法及裝置,可以基于音頻特征對歌曲劃分段落,能夠明顯提升歌曲分段的效果,從而可以保證用戶合唱銜接的連貫,提高合唱的流暢度。以下分別進行詳細說明。
請參閱圖1,圖1是本發(fā)明實施例提供的一種歌曲處理方法的流程示意圖。本實施例中所描述的方法,包括以下步驟:
101、歌曲處理裝置按照目標歌曲的歌詞信息將目標歌曲劃分為n個音頻句,并提取每個音頻句的音頻特征。
本發(fā)明實施例中,歌曲處理裝置可以應(yīng)用于客戶端、唱歌類應(yīng)用的服務(wù)器等,其中,客戶端可以為唱歌類應(yīng)用、可以為安裝唱歌類應(yīng)用的終端設(shè)備,該終端設(shè)備可以是筆記本電腦、臺式電腦、手機、平板電腦、車載終端、智能可穿戴設(shè)備等,本發(fā)明實施例不做限定。
本發(fā)明實施例中,目標歌曲是指需要對其進行分段的歌曲,可以是用戶指定的需要合唱的歌曲,也可以是歌曲處理裝置的數(shù)據(jù)庫中的任意一首歌曲,本發(fā)明實施例不做限定。當歌曲處理裝置獲取到目標歌曲的文件信息后,確定出目標歌曲的歌詞信息,從而依據(jù)歌詞信息將目標歌曲劃分為n個音頻句。其中,n為正整數(shù)。
具體實現(xiàn)中,歌曲處理裝置按照目標歌曲的歌詞信息將目標歌曲劃分為n個音頻句的具體方式可以為:
請一并參閱圖2a,圖2a是本發(fā)明實施例提供的歌詞文件格式的示意圖。由圖2a可以看出,歌詞信息中每行歌詞就是連續(xù)演唱的一句話,在句子行開始就表示了這句話在歌曲中的起始時間和持續(xù)時間,一般以毫秒計算。例如,第一句是從第1.03秒到3.76秒結(jié)束,持續(xù)了2.73秒,而第一句與第二句之間有一段純伴奏,在第3.76秒到4.2秒,如圖2a中的歌詞一共37句,則按照下面步驟進行處理:
歌曲處理裝置首先將目標歌曲文件解碼為16k16bit單通道音頻,然后按照圖2a中的歌詞信息對音頻進行切分,如歌詞為n句,則切分為n段。例如,圖2a的第一句為第1.03秒到3.76秒,第二句為第4.20秒到6.86秒,歌曲處理裝置則將音頻中的第1.03秒到3.76秒的音頻作為第一句音頻句,第4.20秒到6.86秒作為第二句音頻句,其余沒有歌詞的音頻部分暫時不用,這樣就得到了n個音頻句,每個音頻句可以用xi表示,其中,i∈[1,n]。
進一步的,歌曲處理裝置在對目標歌曲劃分為n個音頻句后,會針對每一個音頻句提取該音頻句的音頻特征。其中,該音頻特征可以為梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC)特征。
具體的,歌曲處理裝置提取每個音頻句的音頻特征的具體方式可以為:
1)對每個音頻句進行分幀處理,得到幀序列。
2)提取幀序列中每幀數(shù)據(jù)的第一音頻特征。
3)根據(jù)第一音頻特征確定幀序列的第二音頻特征,并將第二音頻特征確定為該每個音頻句的音頻特征。
具體實現(xiàn)中,歌曲處理裝置對每個音頻句進行分幀處理,得到幀序列的具體方式可以為:針對每個音頻句,以第一時長為幀移,第二時長為幀長對該音頻句進行分幀處理,得到該音頻句的幀序列。其中,第一時長可以是10ms,第二時長可以是30ms,本發(fā)明實施例不做限定。
也就是說,歌曲處理裝置首先會將n個音頻句中任意一個音頻句xi以第一時長為幀移,第二時長為幀長對其進行分幀,從而得到該音頻句的幀序列,然后對幀序列中每幀的數(shù)據(jù)提取13維靜態(tài)MFCC特征,具體為:對每幀的數(shù)據(jù)以及進行離散傅里葉變換、取模平方、三角濾波函數(shù)組處理、取對數(shù)、離散余弦變換,從而得到每幀數(shù)據(jù)的MFCC特征向量序列。最后在利用對每幀數(shù)據(jù)提取出的13維靜態(tài)MFCC特征分別計算一階差分和二階差分,從而得到該幀序列的39維MFCC特征序列,該特征序列即為該音頻句xi的音頻特征,可以用yi表示。同理,歌曲處理裝置會按照上述方式對n個音頻句中的每個音頻句提取音頻特征。
102、歌曲處理裝置根據(jù)每個音頻句的音頻特征將n個音頻句劃分為m個段落,得到每個段落的音頻句列表。
本發(fā)明實施例中,歌曲處理裝置在對每個音頻句提取音頻特征之后,會根據(jù)每個音頻句的音頻特征將n個音頻句劃分為m個段落,得到每個段落的音頻句列表。其中,m表示該歌曲需要合唱的用戶數(shù)量,為正整數(shù),n大于或等于m,可以是歌曲處理裝置按照歌曲類型或歌詞結(jié)構(gòu)定義的,也可以是用戶發(fā)起合唱時自定義的,一般情況下,合唱用戶數(shù)量m設(shè)置為2,本發(fā)明實施例不做限定。
本發(fā)明實施例中,歌曲處理裝置可以按照每個音頻句的音頻特征的相似度將其劃分為同一個段落,從而分別得到每個段落對應(yīng)的音頻句列表。
作為一種可行的實施方式,歌曲處理裝置根據(jù)每個音頻句的音頻特征將n個音頻句劃分為m個段落,得到每個段落的音頻句列表的具體方式可以包括以下步驟:
1)將n個音頻句劃分為m個段落,得到每個段落的第一音頻句列表;
2)根據(jù)第一音頻句列表中音頻句的音頻特征,訓(xùn)練每個段落的音頻特征模型;
3)針對n個音頻句中的每個音頻句,分別計算每個音頻句的音頻特征與每個段落的音頻特征模型的匹配度,并將每個音頻句劃分到與其匹配度最高的段落中;
4)獲得音頻句重新劃分后的每個段落的第二音頻句列表;
5)針對每個段落,判斷每個段落的第二音頻句列表的音頻句與每個段落的第一音頻句列表的音頻句是否相同;
6)如果相同,則將第二音頻句列表確定為該每個段落的音頻句列表。
針對1),歌曲處理裝置首先可以對n個音頻句進行初始化分段,可以是隨機分段,也可以是平均分段,還可以是其他方式,本發(fā)明實施例不做限定。為了減少后續(xù)迭代訓(xùn)練的步驟,歌曲處理裝置可以將n個音頻句按照以下方式進行初始化分段:將n個音頻句中第k句劃分到第k%m段,其中,%是模運算,即求余數(shù),k為小于或等于n的正整數(shù)。
舉例來說,假設(shè)n為5,m為2,即目標歌曲共分為5個音頻句,需要劃分為2個段落,供兩人合唱,那么歌曲處理裝置就可以通過模運算將第1、3、5句音頻句劃分到第1段,第2、4句音頻句劃分到第2段,從而完成對n個音頻句劃分為2個段落的初始化劃分。
針對2),在將n個音頻句初始劃分為m個段落后,每個段落劃分的多個音頻句各自組成該段落的第一音頻句列表。歌曲處理裝置會針對每個段落,進行訓(xùn)練迭代,即,根據(jù)每個段落對應(yīng)的第一音頻句列表中每個音頻句的音頻特征(MFCC特征),訓(xùn)練該段落的音頻特征模型。具體可以是高斯模型,也可以是其他模型,本發(fā)明實施例不做限定。
又舉例來說,假設(shè)第1段落的第一音頻句列表所包含的音頻句為x1、x3、x5,歌曲處理裝置會將其對應(yīng)的音頻特征y1、y3、y5合并到一起,從而可以采用最大期望(Expectation Maximization,EM)算法訓(xùn)練該段落的256維混合高斯模型(即音頻特征模型)??蛇x的,歌曲處理裝置還可以采用其他算法訓(xùn)練該段落的音頻特征模型,如k-means算法等,本發(fā)明實施例不做限定。
通過上述方式,歌曲處理裝置可以分別訓(xùn)練出每個段落的音頻特征模型,記為zj,其中,j∈[1,m]。
針對3)本發(fā)明實施例中,歌曲處理裝置在訓(xùn)練出每個段落的音頻特征模型后,會針對n個音頻句中的每個音頻句,計算該音頻句的音頻特征yi分別與m個段落各自的音頻特征模型zj的似然值,從而得到每個音頻句分別與每個段落之間的匹配度。匹配度越高,則說明該音頻句更有可能屬于該段落。下面以音頻特征模型為混合高斯模型為例進行舉例說明。
混合高斯模型由m個單高斯表示,
其中,表示每個單高斯的權(quán)重,N、μ為常量,每個段落的取值可能會有所不同;表示第j個混合高斯模型的似然值估計。
那么匹配度I計算的似然函數(shù)如下:
表示每個音頻句在每個高斯模型上計算似然的概率,再加權(quán)求和,最后n個特征的概率相乘。其中,Θ=(θ1,...,θm)T,θj=(aj,μj,∑j)。
通過上述方法從而可以計算出yi與zj的似然值Iij。
進一步的,歌曲處理裝置在計算出每個音頻句分別與每個段落的匹配度后,會依據(jù)匹配度將n個音頻句重新劃分段落,即,將音頻句劃分到與其匹配度最高的段落中。以第一句為例,假設(shè)I11=0.5,I12=0.8,I13=0.6,那么歌曲處理裝置就會將其劃分到第二段落,這樣每個段落就會有新的音頻句列表。
針對4)和5),歌曲處理裝置在將每個音頻句按照匹配度重新劃分段落后,就會得到重新劃分的每個段落的第二音頻句列表。進一步的,歌曲處理裝置會針對重新劃分的每個段落,判斷該段落的第二音頻句列表中包括的音頻句與該段落的第一音頻句列表包括的音頻句是否相同,即,針對該段落,判斷重新劃分段落后的所有音頻句包含的歌詞信息是否均與重新劃分段落前的所有音頻句包含的歌詞信息一致,如果一致,則說明第一音頻句列表的音頻句和第二音頻句列表的音頻句相同。
針對6),通過上述方式,如果所有段落的第一音頻句列表的音頻句與第二音頻句列表的音頻句相同,那么歌曲處理裝置就會將第二音頻句列表確定為該段落的音頻句列表,最終得到每個段落的音頻句列表。
可選的,針對每個段落,如果該段落的第一音頻句列表的音頻句與第二音頻句列表的音頻句不相同,則說明迭代不穩(wěn)定,歌曲處理裝置則會將第二音頻句列表作為第一音頻句列表,從而返回執(zhí)行2)~5)的操作,再次進行迭代,即,重新訓(xùn)練段落的音頻特征模型,重新劃分段落,直到迭代穩(wěn)定,即,每個段落的第一音頻句列表的音頻句與第二音頻句列表的音頻句相同為止。
通過這種方式,可以將音色相同的音頻句劃分為同一個段落,供同一人演唱,這樣會使得用戶在合唱時能夠達到最佳效果,使得用戶在合唱切換時銜接連貫。其中,音色是指伴奏樂器類型、演唱頻段分布等,本發(fā)明實施例不做限定。
103、歌曲處理裝置按照每個段落的音頻句列表輸出目標歌曲的歌詞信息。
本發(fā)明實施例中,歌曲處理裝置在將n個音頻句按照音頻特征劃分為m個段落后,會按照不同段落的音頻句列表來輸出目標歌曲的歌詞信息。
請一并參閱圖2b,圖2b是本發(fā)明實施例提供的歌曲分段后的歌詞展示界面示意圖。在圖2b中,可以看出,歌曲處理裝置在將音頻句分段后,加粗的歌詞信息,即,第1~4句、9~11句為一段,由一個用戶演唱,不加粗的歌詞信息,即,第5~8句為一段,由另一個用戶演唱,這樣用戶按照這種歌曲劃分方式對歌曲進行合唱,就會達到更好的合唱效果。
可見,在圖1所描述的方法中,歌曲處理裝置可以在將某一歌曲按照歌詞信息劃分為n個音頻句后,提取每個音頻句的音頻特征,從而根據(jù)音頻特征將n個音頻句劃分為指定的段落,最終按照劃分的段落輸出該歌曲的歌詞信息。通過本發(fā)明實施例,歌曲處理裝置可以基于音頻特征對歌曲劃分段落,能夠明顯提升歌曲分段的效果,從而可以保證用戶合唱銜接的連貫,提高合唱的流暢度。
基于上述實施例所示的歌曲處理方法,本發(fā)明實施例還提供了一種歌曲處理設(shè)備,該歌曲處理設(shè)備可以是唱歌類應(yīng)用客戶端,也可以是服務(wù)器,還可以是終端設(shè)備,該歌曲處理設(shè)備可用于執(zhí)行上述圖1所示方法流程的相應(yīng)步驟。請參見圖3,圖3是本發(fā)明實施例公開的一種歌曲處理設(shè)備的結(jié)構(gòu)示意圖。該歌曲處理設(shè)備的內(nèi)部結(jié)構(gòu)可包括但不限于:處理器、網(wǎng)絡(luò)接口及存儲器。其中,歌曲處理設(shè)備內(nèi)的處理器、網(wǎng)絡(luò)接口及存儲器可通過總線或其他方式連接,在本發(fā)明實施例所示圖3中以通過總線連接為例。
其中,處理器(或稱CPU(Central Processing Unit,中央處理器))是歌曲處理設(shè)備的計算核心以及控制核心。網(wǎng)絡(luò)接口可選的可以包括標準的有線接口、無線接口(如WI-FI、移動通信接口等)。存儲器(Memory)是歌曲處理設(shè)備中的記憶設(shè)備,用于存放程序和數(shù)據(jù)??梢岳斫獾氖牵颂幍拇鎯ζ骺梢允歉咚賀AM存儲器,也可以是非不穩(wěn)定的存儲器(non-volatile memory),例如至少一個磁盤存儲器;可選的還可以是至少一個位于遠離前述處理器的存儲裝置。存儲器提供存儲空間,該存儲空間存儲了服務(wù)平臺的操作系統(tǒng),可包括但不限于:Windows系統(tǒng)(一種操作系統(tǒng))、Linux(一種操作系統(tǒng))系統(tǒng)等等,本發(fā)明對此并不作限定。存儲器的存儲空間還存儲了歌曲處理裝置。
在本發(fā)明實施例中,歌曲處理設(shè)備通過運行存儲器中的歌曲處理裝置來執(zhí)行上述1所示方法流程的相應(yīng)步驟。請一并參見圖4,圖4是本發(fā)明實施例提供的一種歌曲處理裝置的結(jié)構(gòu)示意圖。如圖4所示,在執(zhí)行歌曲分段過程中,該裝置運行如下單元:
第一劃分模塊401,用于按照目標歌曲的歌詞信息將該目標歌曲劃分為n個音頻句。
提取模塊402,用于提取每個音頻句的音頻特征。
第二劃分模塊403,用于根據(jù)每個音頻句的音頻特征將n個音頻句劃分為m個段落,得到每個段落的音頻句列表,其中,n和m為正整數(shù),n大于或等于m。
輸出模塊404,用于按照每個段落的音頻句列表輸出目標歌曲的歌詞信息。
本發(fā)明實施例中,目標歌曲是指需要對其進行分段的歌曲,可以是用戶指定的需要合唱的歌曲,也可以是歌曲處理裝置的數(shù)據(jù)庫中的任意一首歌曲,本發(fā)明實施例不做限定。音頻特征可以為MFCC特征。
作為一種可行的實施方式,請一并參閱圖5,圖5是本發(fā)明實施例提供的提取模塊的分解示意圖,如圖5所示,提取模塊402可以包括處理單元4021、提取單元4022以及第一確定單元4023,可以應(yīng)用于圖4所示的提取模塊402,用于執(zhí)行以下操作:
處理單元4021,用于對每個音頻句進行分幀處理,得到幀序列.
提取單元4022,用于提取幀序列中每幀數(shù)據(jù)的第一音頻特征。
第一確定單元4023,用于根據(jù)第一音頻特征確定幀序列的第二音頻特征,并將第二音頻特征確定為每個音頻句的音頻特征。
可選的,處理單元4021對每個音頻句進行分幀處理,得到幀序列的具體方式可以為:
針對每個音頻,以第一時長為幀移,第二時長為幀長對每個音頻句進行分幀處理,得到幀序列。
作為另一種可行的實施方式,請一并參閱圖6,圖6是本發(fā)明實施例提供的第二劃分模塊的分解示意圖,如圖6所示,第二劃分模塊403包括劃分單元4031、訓(xùn)練單元4032、計算單元4033、獲取單元4034、判斷單元4035以及第二確定單元4036,可以應(yīng)用于圖4所示的第二劃分模塊403,用于執(zhí)行以下操作:
劃分單元4031,用于將n個音頻句劃分為m個段落,得到每個段落的第一音頻句列表。
訓(xùn)練單元4032,用于根據(jù)第一音頻句列表中音頻句的音頻特征,訓(xùn)練每個段落的音頻特征模型。
計算單元4033,用于針對n個音頻句中的每個音頻句,分別計算每個音頻句的音頻特征與每個段落的音頻特征模型的匹配度。
所述劃分單元4031,還用于將每個音頻句劃分到與其匹配度最高的段落中。
獲取單元4034,用于獲得音頻句重新劃分后的每個段落的第二音頻句列表。
判斷單元4035,用于針對每個段落,判斷每個段落的第二音頻句列表的音頻句與其對應(yīng)的第一音頻句列表的音頻句是否相同;
第二確定單元4036,用于在判斷單元4035的判斷結(jié)果為是時,將第二音頻句列表確定為每個段落的音頻句列表。
進一步的,第二確定單元4036,還用于在判斷單元4035的判斷結(jié)果為否時,將第二音頻句列表確定為每個段落的第一音頻句列表,并觸發(fā)訓(xùn)練單元4032執(zhí)行根據(jù)第一音頻句列表中音頻句的音頻特征,訓(xùn)練每個段落的音頻特征模型的操作。
本發(fā)明實施例中,歌曲處理裝置可以在將某一歌曲按照歌詞信息劃分為n個音頻句后,提取每個音頻句的音頻特征,從而根據(jù)音頻特征將n個音頻句劃分為指定的段落,最終按照劃分的段落輸出該歌曲的歌詞信息。通過本發(fā)明實施例,歌曲處理裝置可以基于音頻特征對歌曲劃分段落,能夠明顯提升歌曲分段的效果,從而可以保證用戶合唱銜接的連貫,提高合唱的流暢度。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory,ROM)或隨機存取存儲器(Random Access Memory,簡稱RAM)等。
以上對本發(fā)明實施例所提供的一種歌曲處理方法及裝置進行了詳細介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。