本發明涉及音頻處理
技術領域:
,尤其涉及一種音頻合成的方法及終端。
背景技術:
:隨著信息科技的不斷發展和成熟,終端設備所具備的處理能力也大幅提高,使得很多復雜的應用得以實現,例如音頻或歌聲合成等相關技術。目前市面上出現的唱歌軟件,例如虛擬歌手、練唱軟件等,大多是為一些唱歌愛好者,特別是唱歌比較好聽的人群設計的,通過錄音發布自己演唱的歌曲。但其并不適用于那些不會唱歌、但妙語連珠適合創作的人。在實踐中發現,現有技術中的音頻合成方案,通常需要預先錄制真人的歌曲樣本數據庫以建立歌曲語料庫,用戶輸入文本文字后,通過文字匹配到歌曲語料庫中的目標歌曲,然后將目標歌曲的歌詞對應替換為用戶輸入的文本文字,即可輸出用戶想要的演唱歌曲。然而,建立歌曲語料庫需要較長的時間消耗,并且錄制數量還會受限。此外,受限于預錄的歌曲語料庫,輸出的演唱歌曲只能為固定音色,并不能保留用戶自身的音色,使得差異化不大。技術實現要素:本發明實施例所要解決的技術問題在于,提供一種音頻合成的方法及終端,可實現一鍵歌聲音頻合成的功能,且保留有用戶自身的音色特征,具有明顯地差異化,提升了音頻合成的實用性。第一方面,本發明實施例公開提供了一種音頻合成的方法,所述方法包括:接收用戶輸入的人聲音頻,并對所述人聲音頻進行切割處理,得到M個音頻切片,M為大于0的正整數;根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,其中,每個音頻切片對應一個或多個目標MIDI信息,所述至少一個MIDI信息按照時間序列組成所述預設樂曲MIDI文件,所述MIDI信息包括旋律;根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律;按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。其中可選的,所述根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息具體包括:按照時間序列,將預設樂曲MIDI文件中的至少一個MIDI信息順序匹配給所述M個音頻切片中每個音頻切片,并作為所述每個音頻切片對應的目標MIDI信息;其中,每個音頻切片對應一個或多個目標MIDI信息。其中可選的,所述旋律包括音高、音長、音量中的至少一個,所述根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片具體包括:根據確定的所述目的MIDI信息中的旋律,來對應調整和處理所述M個音頻切片中每個音頻切片,以得到處理后的M個音頻切片;其中,所述處理后的M個音頻切片與確定的所述目的MIDI信息具有以下相同內容中的至少一個:音高、音長、音量。其中可選的,所述對所述人聲音頻進行切割處理,得到M個音頻切片具體包括:在存在所述人聲音頻對應的文本歌詞的情況下,通過對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片;或者,在沒有所述人聲音頻對應的文本歌詞的情況下,通過對所述人聲音頻進行語音識別,得到所述人聲音頻對應的文本歌詞,并對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片。其中可選的,所述方法還包括:獲取所述預設樂曲MIDI文件或所述人聲音頻對應的伴奏音頻;將所述伴奏音頻和所述歌聲音頻進行音頻合成處理,得到混合歌曲音頻。第二方面,本發明實施例還公開提供了一種終端,所述終端包括:接收單元,用于接收用戶輸入的人聲音頻;切割單元,用于對所述人聲音頻進行切割處理,得到M個音頻切片,M為大于0的正整數;確定單元,用于根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,其中,每個音頻切片對應一個或多個目標MIDI信息,所述至少一個MIDI信息按照時間序列組成所述預設樂曲MIDI文件,所述MIDI信息包括旋律;處理單元,用于根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律;合成單元,用于按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。其中可選地,所述確定單元,具體用于按照時間序列,將預設樂曲MIDI文件中的至少一個MIDI信息順序匹配給所述M個音頻切片中每個音頻切片,并作為所述每個音頻切片對應的目標MIDI信息;其中,每個音頻切片對應一個或多個目標MIDI信息。其中可選地,所述旋律包括音高、音長、音量中的至少一個,所述處理單元,具體用于根據確定的所述目的MIDI信息中的旋律,來對應調整和處理所述M個音頻切片中每個音頻切片,以得到處理后的M個音頻切片;其中,所述處理后的M個音頻切片與確定的所述目的MIDI信息具有以下相同內容中的至少一個:音高、音長、音量。其中可選地,所述切割單元,具體用于在存在所述人聲音頻對應的文本歌詞的情況下,通過對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片;或者,所述切割單元,具體用于在沒有所述人聲音頻對應的文本歌詞的情況下,通過對所述人聲音頻進行語音識別,得到所述人聲音頻對應的文本歌詞,并對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片。其中可選地,所述終端還包括:獲取單元,用于獲取所述預設樂曲MIDI文件或所述人聲音頻對應的伴奏音頻;所述合成單元,還用于將所述伴奏音頻和所述歌聲音頻進行音頻合成處理,得到混合歌曲音頻。第三方面,提供了一種終端,其特征在于,包括:處理器、存儲器、通信接口和總線;所述處理器、所述存儲器和所述通信接口通過所述總線連接并完成相互間的通信;所述存儲器存儲可執行程序代碼;所述處理器通過讀取所述存儲器中存儲的可執行程序代碼來運行與所述可執行程序代碼對應的程序,以用于執行一種音頻合成的方法;其中,所述方法為第一方面任一項所述的方法。第四方面,本發明提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲了計算設備所執行的用于音頻合成的程序代碼。所述程序代碼包括用于執行在第一方面中任一項的方法的指令。本發明實施例中,通過對用戶輸入的人聲音頻進行切割處理,得到M個音頻切片,然后根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,接著根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律,最后按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。采用本發明,可實現一鍵歌聲音頻合成的功能,且保留有用戶自身的音色,具有明顯地差異化,提升了音頻合成的實用性和方便快捷性。附圖說明為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1是本發明實施例的一種音頻合成方法的流程示意圖;圖2是本發明實施例的另一種音頻合成方法的流程示意圖;圖3是本發明實施例的一種終端的結構示意圖;圖4是本發明實施例的另一種終端的結構示意圖;圖5是本發明實施例的另一種終端的結構示意圖。具體實施方式為了使本
技術領域:
的人員更好地理解本發明方案,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分的實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本發明保護的范圍。本發明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”和“第三”(如果存在)等是用于區別不同對象,而非用于描述特定順序。此外,術語“包括”以及它們任何變形,意圖在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過程、方法、系統、產品或設備沒有限定于已列出的步驟或單元,而是可選地還包括沒有列出的步驟或單元,或可選地還包括對于這些過程、方法、產品或設備固有的其它步驟或單元。請參見圖1,是本發明實施例的一種音頻合成方法的流程示意圖,本發明實施例的所述方法可以應用在諸如智能手機、平板電腦、智能可穿戴設備等帶通信網絡功能的終端中,具體可由這些終端的處理器來實現。本發明實施例的所述方法還包括如下步驟。S101、接收用戶輸入的人聲音頻,并對所述人聲音頻進行切割處理,得到M個音頻切片,M為大于0的正整數。本發明實施例中,用戶可以對終端進行操作,如點擊錄音按鈕錄制用戶自身的語音音頻,即人聲音頻等操作以輸入自己的人聲音頻,所述終端可以檢測并獲取用戶自己輸入至該終端的人聲音頻;或者,所述終端可以通過有線或無線通訊的方式(如WIFI、藍牙、數據線等)接收從其他終端或服務器發送過來的人聲音頻。當所述終端獲取到所述人聲音頻后,所述終端可以對所述人聲音頻進行分割處理,以將所述人聲音頻切割成一個或多個音頻切片,也可稱為音頻碎片,這里設為M個音頻切片,其中,M大于0,且M為正整數。其中可選地,所述對所述人聲音頻進行切割處理,得到M個音頻切片具體包括:在存在所述人聲音頻對應的文本歌詞的情況下,通過對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片;或者,在沒有所述人聲音頻對應的文本歌詞的情況下,通過對所述人聲音頻進行語音識別,得到所述人聲音頻對應的文本歌詞,并對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片。在本發明的一個實施例中,如果所述終端在檢測/獲取所述人聲音頻時,還檢測并獲取到與所述人聲音頻所對應的文本歌詞時,也即是所述終端檢測到存在與所述人聲音頻對應的文本歌詞的情況下,所述終端可以直接通過分析所述文本歌詞來對對所述人聲音頻進行分割,以得到對應的M個音頻切片。例如,用戶在錄制人聲音頻時可以將該人聲音頻對應的文本歌詞編輯到所述終端中,方便用戶按照該文本歌詞來錄制對應的人聲音頻;或者,所述終端接收的所述人聲音頻中直接攜帶有對應的文本歌詞。此時所述終端可以直接根據所述文本歌詞中的分段、分句或者根據韻母發音來對所述文本歌詞進行分割,進而可以得到與所述文本歌詞以及所述人聲音頻所對應的M個音頻切片。在本發明另一個實施例中,當所述終端檢測到本終端中不存在與所述人聲音頻對應的文本歌詞的情況下,所述終端可以對接收的所述人聲音頻進行語音識別處理,以獲得與所述人聲音頻對應的文本歌詞,進而通過對所述文本歌詞進行諸如分句、分段、韻母發音、設定字數分割等規則的分割處理,將所述人聲音頻分割為M個音頻切片。在本發明另一個實施例中,當所述終端檢測到本終端中不存在與所述人聲音頻對應的文本歌詞的情況下,所述終端可以通過對所述人聲音頻進行語言識別,根據所述人聲音頻中的停頓或間隔,以將所述人聲音頻分割為M個音頻切片。需要說明的是,上述M個音頻切片中均保留有用戶說話聲音原本的音色,且M個音頻切片中包含有用戶錄制時的原始音高、原始音量、原始音長(聲音長度)、原始音速(聲音速度)、原始音調、原始旋律、或者其他的用于描述文本歌詞發聲的信息,本發明實施例不做限制。所述終端可以包括智能手機(如Android手機、IOS手機等)、個人電腦、平板電腦、掌上電腦、移動互聯網設備(MID,MobileInternetDevices)或穿戴式智能設備等互聯網設備,本發明實施例不作限定。S102、根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,其中,每個音頻切片對應一個或多個目標MIDI信息,所述至少一個MIDI信息按照時間序列組成所述預設樂曲MIDI文件,所述MIDI信息包括旋律。本發明實施例中,用戶/系統可以預先在終端中存儲一個或多個樂曲MIDI(MusicalInstrumentDigitalInterface,MIDI,中文稱為音樂設備數字接口)文件,當用戶想要進行音頻合成時,該用戶可以從預存的多個樂曲MIDI文件中自主選取一個預設樂曲MIDI文件,以按照該預設樂曲MIDI文件來將自身的人聲音頻合成為對應的歌聲音頻。其中,所述預設樂曲MIDI文件可以為由至少一個MIDI信息(也可以是MIDI指令)組成,且這些MIDI信息/指令按照時間序列進行排序。應理解的是,MIDI文件是一種電子樂器之間以及電子樂器與電腦之間的統一交流協議。它是一種描述性的音樂語言,將樂曲的所有信息用字節進行描述。譬如在某一時刻使用什么樂器,以什么音符開始,以什么音調結束,加以什么伴奏等信息/指令。在實際應用中,MIDI文件實際以note文件的形式存儲在終端中,該note文件是將MIDI文件的圖形畫轉化為數據結構形成的一種腳本,其具體可以由起始時間,單位可以但不限于毫秒(ms)、持續時長,也即是音長,單位同樣可以但不限于ms,以及音高Pitch等信息組成。也可以理解為note文件僅是MIDI文件的一種變形保存方式,該note文件和MIDI文件包括有相同的信息,如音高、音長等。示例性地,下表1所示給出一種note文件的結構示意圖。表1序列對應文字起始時間持續時長(音長)Pitch(音高)1甜4769936782蜜5709466813…6179466834蜜6649701785你8060466746笑8530701767的9235231748甜9470466769蜜99404668110蜜1041023181可知,上表1給出的note文件(MIDI文件)中包含有10個MIDI信息(或MIDI指令),且每個MIDI信息按照時間序列進行排序,并統一構成所述note文件(MIDI文件)。此外,每一條MIDI信息可以由對應文字(即文本歌詞)、起始時間(即唱這個文本歌詞對應的開始時間)、持續時長,也即是音長,用戶唱這個文本歌詞對應的持續時長、以及音高Pitch組成,這里的音高表示一個音的音調高低。在本發明的一個實施例中,所述根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息具體包括:按照時間序列,將預設樂曲MIDI文件中的至少一個MIDI信息順序匹配給所述M個音頻切片中每個音頻切片,并作為所述每個音頻切片對應的目標MIDI信息;其中,每個音頻切片對應一個或多個目標MIDI信息。具體的,所述終端可以將用戶選取的所述預設樂曲MIDI文件中包含的所有MIDI信息按照時間序列依次順序地分配給上述分割處理得到的M個音頻切片,使得一個MIDI信息對應一個音頻切片,但一個音頻切片可以對應一個或多個MIDI信息;這樣即可為所述M個音頻切片中每個音頻切片分配到對應的目標MIDI信息。在本發明的另一個實施例中,如果所述終端接收的所述人聲音頻中包含有旋律,那么所述終端可以直接對所述人聲音頻進行語言識別處理,以確定出于所述人聲音頻對應的旋律,然后根據確定的所述人聲音頻對應的旋律從預存的樂曲數據庫中匹配出一個預設樂曲MIDI文件;同理,所述終端也可以分別對切割所得的M個音頻切片進行語言識別,以根據所述M個音頻切片中每個音頻切片對應的旋律來從所述樂曲MIDI文件中匹配出旋律相似度超過預設閾值所對應的目標MIDI信息,以作為為所述M個音頻切片中每個音頻切片所匹配/分配的目標MIDI信息,其中所述MIDI信息包括有旋律。需要說明的是,這里的旋律可以是有設定的音高、音長、以及音量,甚至還包括有音調等信息組成。可選地,所述終端在確定到所述M個音頻切片中每個音頻切片對應的目標MIDI信息后,還可以根據所述M個音頻切片中每個音頻切片與確定的所述目的MIDI信息的對應關系,生成對應的映射關聯關系;進一步地還可以用圖表的形式進行顯示,以便用戶查看。可選地,所述目的MIDI信息的個數可以是一個或多個,當所述目的MIDI信息的數量為兩個或兩個以上時,所述終端可以在相應的音頻切片(如起始時間位置)中標記該音頻切片對應匹配到的目的MIDI信息的個數,以更好地實現音頻合成,節省合成時間。S103、根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律。本發明實施例中,所述終端可以根據確定所述目的MIDI信息中的旋律來對應對所述M個音頻切片進行對應的音頻調整出來,使得處理后的M個音頻切片具有和對應的所述目的MIDI信息相同的旋律。其中可選地,所述根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片具體包括:根據確定的所述目的MIDI信息中的旋律,來對應調整和處理所述M個音頻切片中每個音頻切片,以得到處理后的M個音頻切片;其中,所述處理后的M個音頻切片與確定的所述目的MIDI信息具有以下相同內容中的至少一個:音高、音長、音量。示例性地如,所述終端可以按照確定的所述目的MIDI信息中包含的音量、音長、音高等信息來對應拉升或壓縮所述M個音頻切片中每個音頻切片的音量、音長、音高等信息,使得調整后的M個音頻切片具有和所述目的MIDI信息相同的音量、音長、音高等信息。需要說明的是,在一些預設樂曲MIDI文件中也會存在無音高Pitch的段落,如一些說唱RAP歌曲,其樂曲MIDI文件對應的演唱部分沒有音高,針對這種情況而言,所述終端可以不對音頻切片的音高進行調整,保留原有音頻切片對應的音高,使其呈現出有節奏感說RAP的效果。S104、按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。本發明實施例中,所述終端可以按照預設樂曲MIDI文件中的時間序列,將上述處理后的M個音頻切片進行無縫拼接和合成處理,最終拼接合成出一首完整的歌聲音頻。可選地,所述終端還可以對所述拼接合成的歌聲音頻進行平滑處理,以得到平滑無噪聲的歌聲音頻。其中可選地,所述方法還包括:獲取所述預設樂曲MIDI文件或所述人聲音頻對應的伴奏音頻;將所述伴奏音頻和所述歌聲音頻進行音頻合成處理,得到混合歌曲音頻。具體的,所述終端還可以通過網絡或從本地中獲取與所述預設樂曲MIDI文件對應的伴奏音頻;或者,所述終端可以根據所述預設樂曲MIDI文件驅動模擬樂器生成對應的伴奏音頻。進而,所述終端可以將所述伴奏音頻和所述歌聲音頻進行音頻合成處理,最終合成出一首混合歌曲音頻,以作為用戶想要發布的最終歌曲音頻,進而所述終端可以保存或上傳所述混合歌曲音頻。可選地,所述終端在檢測到針對所述混合歌聲音頻的播放指令時,自動播放所述混合歌聲音頻。此外,所述終端還可以接收用戶自定義為所述混合歌聲音頻選取的節奏音效或和聲,進而按照用戶選擇的節奏音效或和聲來對應調整所述混合歌聲音頻。例如,用戶可以在所述混合歌聲音頻中增加、刪除或修改一些如貝斯、鋼琴等音效操作,所述終端檢測到用戶的上述音效操作時,對應在所述混合歌聲音頻中添加、刪除或修改對應的音效。又如,用戶還可以再所述混合歌聲音頻的開始或結尾處增加一段時間長度的音頻自我介紹等等描述性音頻。為幫助人們對上述實施例的進一步理解,下面通過一個例子進行詳細闡述。例如,一終端接收到用戶輸入的人聲音頻內容或語音識別結果內容為“曾經有一份真摯的感情”,通過對上述文本歌詞進行分析,找到對應的分割位置,將其分割為10個音頻切片分別為:P1,P2,P3……P10,這里也即是將每個字都分割開所得。結合如上表1給出的note文件結構示意圖,從表1的note文件中尋找到“甜蜜…蜜你笑的甜蜜蜜”這10個MIDI信息,則將音頻切片P1~P10依次順序匹配到一條目的MIDI信息。具體可參見如下表2所示給出一種音頻切片與MIDI信息的匹配映射關系表。所述終端可以按照匹配的所述目的MIDI信息中的持續時長和音高Pitch,來對應拉升或壓縮所述音頻切片的持續時長和Pitch音高,使得處理后的音頻切片與所述目的MIDI信息具有相同的持續時長和音高。最后,所述終端按照時間序列,這里可以按照起始時間來對應拼接處理后的10個音頻切片,使其拼接合成出新的歌聲音頻。也即是用表1給出的《甜蜜蜜》的音樂旋律來演唱“曾經有一份真摯的感情”。表2需要說明的是,當為一個音頻切片匹配到多條MIDI信息時,所述終端可以將一對多的地方進行標記,如在所述音頻切片的起始時間位置處進行標記,以便所述終端知悉該音頻切片對應匹配占用多少個MIDI信息。舉例來說,例如表1給出的歌曲甜蜜蜜中的演唱第一個蜜字存在轉音,此時對應占用了兩條MIDI信息,那么可以在起始時間字段/位置標記這個信息。同理,對應在演唱“曾經有一份真摯的感情”時,應該演唱為“曾經~有”而不是“曾經有一”。此時上表2給出的音頻切片與MIDI信息的匹配映射關系表,對應變更為如下表3所示,給出的部分音頻切片與MIDI信息的匹配映射關系表。表3序列對應文字起始時間持續時長(音長)Pitch(音高)音頻切片1甜476993678→曾2蜜570946681→經3…617946683→…4蜜664970178→有本發明實施例中,通過對用戶輸入的人聲音頻進行切割處理,得到M個音頻切片,然后根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,接著根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律,最后按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。采用本發明,可實現一鍵歌聲音頻合成的功能,且保留有用戶自身的音色,具有明顯地差異化,提升了音頻合成的實用性和方便快捷性。請參見圖2,是本發明實施例的另一種音頻合成方法的流程示意圖,本發明實施例的所述方法可以應用在諸如智能手機、平板電腦、智能可穿戴設備等帶通信網絡功能的終端中,具體可由這些終端的處理器來實現。本發明實施例的所述方法還包括如下步驟。S201、接收用戶輸入的人聲音頻。S202、在存在所述人聲音頻對應的文本歌詞的情況下,通過對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片。S203、在沒有所述人聲音頻對應的文本歌詞的情況下,通過對所述人聲音頻進行語音識別,得到所述人聲音頻對應的文本歌詞,并對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片。需要說明的是,上述步驟S203是步驟S202的一種替換實現方式。S204、按照時間序列,將預設樂曲MIDI文件中的至少一個MIDI信息順序匹配給所述M個音頻切片中每個音頻切片,并作為所述每個音頻切片對應的目標MIDI信息;其中,每個音頻切片對應一個或多個目標MIDI信息,所述至少一個MIDI信息按照時間序列組成所述預設樂曲MIDI文件,所述MIDI信息包括旋律S205、根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律。通過根據確定的所述目的MIDI信息中的旋律,來對應調整和處理所述M個音頻切片中每個音頻切片,以得到處理后的M個音頻切片,使得所述處理后的M個音頻切片與確定的所述目的MIDI信息具有以下相同內容中的至少一個:音高、音長、音量。S206、按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。S207、獲取所述預設樂曲MIDI文件或所述人聲音頻對應的伴奏音頻。S208、將所述伴奏音頻和所述歌聲音頻進行音頻合成處理,得到混合歌曲音頻。本發明實施例中,通過對用戶輸入的人聲音頻進行切割處理,得到M個音頻切片,然后根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,接著根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律,最后按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。采用本發明,可實現一鍵歌聲音頻合成的功能,且保留有用戶自身的音色,具有明顯地差異化,提升了音頻合成的實用性和方便快捷性。請參見圖3,是本發明實施例的一種終端的結構示意圖,本發明實施例的所述終端3包括:接收單元30,用于接收用戶輸入的人聲音頻;切割單元31,用于對所述人聲音頻進行切割處理,得到M個音頻切片,M為大于0的正整數;確定單元32,用于根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,其中,每個音頻切片對應一個或多個目標MIDI信息,所述至少一個MIDI信息按照時間序列組成所述預設樂曲MIDI文件,所述MIDI信息包括旋律;處理單元33,用于根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律;合成單元34,用于按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。本發明實施例中涉及的各個單元的具體實現可參考圖1至圖2對應實施例中相關功能單元或者實施步驟的描述,在此不贅述。本發明實施例中,通過對用戶輸入的人聲音頻進行切割處理,得到M個音頻切片,然后根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,接著根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律,最后按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。采用本發明,可實現一鍵歌聲音頻合成的功能,且保留有用戶自身的音色,具有明顯地差異化,提升了音頻合成的實用性和方便快捷性。請參見圖4,是本發明實施例的另一種終端的結構示意圖,本發明實施例的所述終端3包括:上述的接收單元30、切割單元31、確定單元32,處理單元33、以及合成單元34,其中,所述確定單元32,具體用于按照時間序列,將預設樂曲MIDI文件中的至少一個MIDI信息順序匹配給所述M個音頻切片中每個音頻切片,并作為所述每個音頻切片對應的目標MIDI信息;其中,每個音頻切片對應一個或多個目標MIDI信息。其中可選地,所述旋律包括音高、音長、音量中的至少一個,所述處理單元33,具體用于根據確定的所述目的MIDI信息中的旋律,來對應調整和處理所述M個音頻切片中每個音頻切片,以得到處理后的M個音頻切片;其中,所述處理后的M個音頻切片與確定的所述目的MIDI信息具有以下相同內容中的至少一個:音高、音長、音量。其中可選地,所述切割單元31,具體用于在存在所述人聲音頻對應的文本歌詞的情況下,通過對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片;或者,所述切割單元31,具體用于在沒有所述人聲音頻對應的文本歌詞的情況下,通過對所述人聲音頻進行語音識別,得到所述人聲音頻對應的文本歌詞,并對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片。其中可選地,所述終端還包括:獲取單元35,用于獲取所述預設樂曲MIDI文件或所述人聲音頻對應的伴奏音頻;所述合成單元34,還用于將所述伴奏音頻和所述歌聲音頻進行音頻合成處理,得到混合歌曲音頻。本發明實施例中涉及的各個單元的具體實現可參考圖1至圖3對應實施例中相關功能單元或者實施步驟的描述,在此不贅述。本發明實施例中,通過對用戶輸入的人聲音頻進行切割處理,得到M個音頻切片,然后根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,接著根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律,最后按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。采用本發明,可實現一鍵歌聲音頻合成的功能,且保留有用戶自身的音色,具有明顯地差異化,提升了音頻合成的實用性和方便快捷性。請參見圖5,圖5為本發明實施例公開的另一種終端的結構示意圖。本實施例的終端3包括:至少一個處理器601、通信接口602、用戶接口603和存儲器604,處理器601、通信接口602、用戶接口603和存儲器604可通過總線或者其它方式連接,本發明實施例以通過總線605連接為例。其中,處理器601可以是通用處理器,例如中央處理器(CentralProcessingUnit,CPU)。通信接口602可以為有線接口(例如以太網接口)或無線接口(例如蜂窩網絡接口或使用無線局域網接口),用于與其他終端或網站進行通信。本發明實施例中,通信接口602具體用于將合成的歌聲音頻輸出或播放給終端的用戶。用戶接口603具體可為觸控面板,包括觸摸屏和觸控屏,用于檢測觸控面板上的操作指令,用戶接口603也可以是物理按鍵或者鼠標。用戶接口603還可以為顯示屏,用于輸出、顯示圖像或數據。存儲器604可以包括易失性存儲器(VolatileMemory),例如隨機存取存儲器(RandomAccessMemory,RAM);存儲器也可以包括非易失性存儲器(Non-VolatileMemory),例如只讀存儲器(Read-OnlyMemory,ROM)、快閃存儲器(FlashMemory)、硬盤(HardDiskDrive,HDD)或固態硬盤(Solid-StateDrive,SSD);存儲器604還可以包括上述種類的存儲器的組合。存儲器604用于存儲一組程序代碼,處理器601用于調用存儲器604中存儲的程序代碼,執行如下操作:接收用戶輸入的人聲音頻,并對所述人聲音頻進行切割處理,得到M個音頻切片,M為大于0的正整數;根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,其中,每個音頻切片對應一個或多個目標MIDI信息,所述至少一個MIDI信息按照時間序列組成所述預設樂曲MIDI文件,所述MIDI信息包括旋律;根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律;按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。進一步可選地,所述處理器601具體用于:按照時間序列,將預設樂曲MIDI文件中的至少一個MIDI信息順序匹配給所述M個音頻切片中每個音頻切片,并作為所述每個音頻切片對應的目標MIDI信息;其中,每個音頻切片對應一個或多個目標MIDI信息。進一步可選地,所述處理器601具體用于:根據確定的所述目的MIDI信息中的旋律,來對應調整和處理所述M個音頻切片中每個音頻切片,以得到處理后的M個音頻切片;其中,所述處理后的M個音頻切片與確定的所述目的MIDI信息具有以下相同內容中的至少一個:音高、音長、音量。進一步可選地,所述處理器601具體用于:在存在所述人聲音頻對應的文本歌詞的情況下,通過對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片;或者,在沒有所述人聲音頻對應的文本歌詞的情況下,通過對所述人聲音頻進行語音識別,得到所述人聲音頻對應的文本歌詞,并對所述文本歌詞進行分割處理,得到與所述人聲音頻對應的至少一個音頻切片。進一步可選地,所述處理器601還用于:獲取所述預設樂曲MIDI文件或所述人聲音頻對應的伴奏音頻;將所述伴奏音頻和所述歌聲音頻進行音頻合成處理,得到混合歌曲音頻。本發明實施例中,通過對用戶輸入的人聲音頻進行切割處理,得到M個音頻切片,然后根據預設樂曲MIDI文件中的至少一個MIDI信息,確定所述M個音頻切片中每個音頻切片對應的目標MIDI信息,接著根據確定的所述目標MIDI信息中的旋律,將所述M個音頻切片中每個音頻切片進行對應的音頻處理,得到處理后的M個音頻切片,所述處理后的M個音頻切片具有與所述目標MIDI信息相同的旋律,最后按照時間序列,將所述處理后的M個音頻切片進行拼接和合成處理,以得到歌聲音頻。采用本發明,可實現一鍵歌聲音頻合成的功能,且保留有用戶自身的音色,具有明顯地差異化,提升了音頻合成的實用性和方便快捷性。本發明實施例還提供一種計算機存儲介質,其中,該計算機存儲介質可存儲有程序,該程序執行時包括上述方法實施例中記載的音頻合成方法的部分或全部步驟。需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本發明并不受所描述的動作順序的限制,因為依據本發明,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于優選實施例,所涉及的動作和模塊并不一定是本發明所必須的。在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。在本申請所提供的幾個實施例中,應該理解到,所揭露的裝置,可通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統,或一些特征可以忽略,或不執行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。另外,在本發明的各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現,也可以采用軟件功能單元的形式實現。所述集成的單元如果以軟件功能單元的形式實現并作為獨立的產品銷售或使用時,可以存儲在一個計算機可讀取存儲介質中。基于這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產品的形式體現出來,該計算機軟件產品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可為個人計算機、服務器或者網絡設備等)執行本發明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機存取存儲器(RAM,RandomAccessMemory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質。以上所述,以上實施例僅用以說明本發明的技術方案,而非對其限制;盡管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的范圍。當前第1頁1 2 3