視頻處理裝置、方法及移動(dòng)終端的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信技術(shù)領(lǐng)域,更具體地說,涉及一種視頻處理裝置、方法及移動(dòng)終端。
【背景技術(shù)】
[0002]當(dāng)前,在視頻播放中,已經(jīng)存在通過人臉識(shí)別在視頻中只看某一個(gè)人,或者根據(jù)人臉識(shí)別和其他信息實(shí)現(xiàn)視頻的智能快進(jìn)。但是在顯示生活中不同的人對(duì)視頻內(nèi)容的關(guān)注點(diǎn)是不同的,例如,在電影的拍攝中,往往只有官方放出來的一個(gè)版本,但是很多觀眾關(guān)注的只是他們心目中的那個(gè)人,對(duì)他們來說,相對(duì)于整個(gè)視頻,他們更愿意觀看以他們心目中的那個(gè)人為視角播放出來的視頻。在日常生活中,某一個(gè)重要時(shí)刻,如婚禮,眾多親朋好友紛紛拿起手機(jī)拍攝新郎新娘,鏡頭在轉(zhuǎn)換的時(shí)候不可避免的涉及到其他親朋好友,該親朋好友一般也很有意愿去關(guān)注自己在婚禮上的舉動(dòng),但把所有視頻都看完不僅費(fèi)事也很費(fèi)力。綜上,現(xiàn)有的視頻拍攝播放沒能在眾多視頻中把用戶關(guān)心的內(nèi)容給展現(xiàn)出來。
[0003]上述內(nèi)容僅用于輔助理解本發(fā)明的技術(shù)方案,并不代表承認(rèn)上述內(nèi)容是現(xiàn)有技術(shù)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的主要目的在于解決現(xiàn)有的視頻處理方法無法從眾多視頻拍攝播放設(shè)備中自動(dòng)篩選出相關(guān)人物的視頻片段進(jìn)行播放,以節(jié)省用戶的時(shí)間成本,提高用戶體驗(yàn)的問題。
[0005]為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種視頻處理裝置,所述視頻處理裝置包括:
[0006]獲取模塊,用于獲取關(guān)聯(lián)終端的視頻文件;
[0007]提取模塊,用于對(duì)所述視頻文件進(jìn)行特征識(shí)別,并提取出含有所述視頻文件中人物標(biāo)識(shí)的視頻片段和音頻片段;
[0008]可選地,所述提取模塊包括:圖像提取單元,用于從所述視頻文件中提取所述視頻文件的圖像幀;人臉識(shí)別單元,用于對(duì)所述視頻文件的圖像幀進(jìn)行人臉識(shí)別,獲取含有人臉圖像的圖像幀。組合單元,用于將所述含有人臉圖像的圖像幀組合為含有人物標(biāo)識(shí)的視頻片段。
[0009]可選地,所述提取模塊還包括:音頻提取單元,用于從所述視頻文件中提取所述視頻的音頻文件;聲紋識(shí)別單元,用于對(duì)所述音頻文件進(jìn)行聲紋識(shí)別,提取出含有人物標(biāo)識(shí)對(duì)應(yīng)的聲紋特征的音頻片段;組合單元,用于組合出所述含有人物標(biāo)識(shí)聲紋特征的音頻片段。
[0010]播放模塊,用于確定待播放人物標(biāo)識(shí),將待播放人物標(biāo)識(shí)對(duì)應(yīng)的視頻片段和音頻片段合成新的視頻文件后并播。
[0011]可選地,所述播放模塊包括:顯示單元,用于顯示待播放人物標(biāo)識(shí)列表和/或照片選擇界面和/或錄音界面;確認(rèn)單元,用于確認(rèn)選擇的待播放人物標(biāo)識(shí)或與照片人臉圖像識(shí)別匹配的人物標(biāo)識(shí)或與聲紋識(shí)別匹配的人物標(biāo)識(shí);組合單元,用于將所述待播放人物標(biāo)識(shí)對(duì)應(yīng)的視頻片段、音頻片段組合為待播放人物標(biāo)識(shí)的視頻文件;
[0012]進(jìn)一步地,本發(fā)明還提供了一種視頻處理方法,所述視頻處理方法包括:
[0013]獲取關(guān)聯(lián)終端的視頻文件;
[0014]對(duì)獲取的所述視頻文件進(jìn)行特征識(shí)別,并提取含有人物標(biāo)識(shí)的視頻片段和音頻片段;
[0015]可選地,所述提取方法包括,從所述獲取關(guān)聯(lián)終端的視頻文件中提取所述視頻文件的圖像幀;對(duì)所述圖像幀進(jìn)行人臉識(shí)別,獲取含有與所述人臉識(shí)別結(jié)果匹配的人臉圖像的圖像幀并組合為含有人物標(biāo)識(shí)的視頻片段。
[0016]可選地,所述提取方法還包括,從所述獲取關(guān)聯(lián)終端的視頻文件中提取所述視頻文件的音頻文件;對(duì)所述音頻文件進(jìn)行聲紋識(shí)別,提取出含有所述待播放人物對(duì)應(yīng)的聲紋特征的音頻片段。
[0017]確定待播放人物標(biāo)識(shí),組合待播放人物標(biāo)識(shí)對(duì)應(yīng)的視頻片段和音頻片段,并播放。
[0018]可選地,所述確定待播放人物標(biāo)識(shí)的步驟包括:提供選擇界面顯示的所述視頻中出現(xiàn)的人物標(biāo)識(shí);在接收到基于所述選擇界面觸發(fā)的待播放人物選擇完畢指令時(shí),確定所述待播放人物對(duì)應(yīng)的人物標(biāo)識(shí);
[0019]可選地,所述確定待播放人物標(biāo)識(shí)的步驟還包括:提供照片選擇界面和/或聲音錄入界面,獲取選擇的照片和/或錄入的音頻文件;對(duì)所述選擇的照片進(jìn)行人臉圖像識(shí)別和/或?qū)︿浫氲囊纛l文件進(jìn)行聲紋識(shí)別;選擇與所述照片人臉圖像識(shí)別匹配的人物標(biāo)識(shí)和/或選擇與所述聲紋識(shí)別匹配的人物標(biāo)識(shí)。
[0020]為實(shí)現(xiàn)上述目的,本發(fā)明還提供了如上述方法所述的移動(dòng)終端
[0021 ] 本發(fā)明公開了一種視頻處理裝置、方法及移動(dòng)終端,所述視頻處理裝置包括:獲取模塊,用于獲取拍攝到的視頻片段;提取模塊,對(duì)所述視頻片段進(jìn)行特征識(shí)別,并提取出含有所述視頻片段中人物標(biāo)識(shí)的圖像幀;播放模塊,用于在接收到播放指令時(shí),確定待播放人物;還用于將所有相關(guān)聯(lián)的移動(dòng)終端中提取的視頻片段進(jìn)行重新組合并播放。本發(fā)明實(shí)現(xiàn)了在對(duì)特定人物從多個(gè)不同的角度進(jìn)行播放,根據(jù)用戶的選擇自動(dòng)篩選相關(guān)人物的視頻片段進(jìn)行播放,可以更好的展現(xiàn)用戶關(guān)注的視頻內(nèi)容,提高了用戶體驗(yàn)。
【附圖說明】
[0022]下面將結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明,附圖中:
[0023]圖1為實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例的移動(dòng)終端的硬件結(jié)構(gòu)示意;
[0024]圖2為如圖1所示的移動(dòng)終端的無線通信系統(tǒng)示意圖;
[0025]圖3為本發(fā)明第一實(shí)施例提供的視頻處理裝置功能模塊示意圖;
[0026]圖4為本發(fā)明第二實(shí)施例提供的獲取模塊細(xì)化功能模塊示意圖;
[0027]圖5為本發(fā)明第三實(shí)施例提供的提取模塊細(xì)化功能模塊示意圖;
[0028]圖6為本發(fā)明第四實(shí)施例提供的播放模塊細(xì)化功能模塊示意圖;
[0029]圖7為本發(fā)明第五實(shí)施例提供的視頻處理方法流程示意圖;
[0030]圖8為本發(fā)明第六實(shí)施例提供的提取模塊具體步驟流程示意圖;
[0031]圖9為本發(fā)明第七實(shí)施例提供的播放模塊具體流程示意圖;
[0032]圖10為本發(fā)明第七實(shí)施例提供的視頻播放界面人物標(biāo)識(shí)列表示意圖;
【具體實(shí)施方式】
[0033]應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0034]現(xiàn)在將參考附圖描述實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例的移動(dòng)終端。在后續(xù)的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發(fā)明的說明,其本身并沒有特定的意義。因此,〃模塊〃與〃部件〃可以混合地使用。
[0035]移動(dòng)終端可以以各種形式來實(shí)施。例如,本發(fā)明中描述的終端可以包括諸如移動(dòng)電話、智能電話、筆記本電腦、數(shù)字廣播接收器、PDA(個(gè)人數(shù)字助理)、PAD(平板電腦)、PMP (便攜式多媒體播放器)、導(dǎo)航裝置等等的移動(dòng)終端以及諸如數(shù)字TV、臺(tái)式計(jì)算機(jī)等等的固定終端。下面,假設(shè)終端是移動(dòng)終端。然而,本領(lǐng)域技術(shù)人員將理解的是,除了特別用于移動(dòng)目的的元件之外,根據(jù)本發(fā)明的實(shí)施方式的構(gòu)造也能夠應(yīng)用于固定類型的終端。
[0036]圖1為實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例的移動(dòng)終端的硬件結(jié)構(gòu)示意。
[0037]移動(dòng)終端100可以包括無線通信單元110、A/V (音頻/視頻)輸入單元120、用戶輸入單元130、感測(cè)單元140、輸出單元150、存儲(chǔ)器160、接口單元170、控制器180和電源單元190等等。圖1示出了具有各種組件的移動(dòng)終端,但是應(yīng)理解的是,并不要求實(shí)施所有示出的組件??梢蕴娲貙?shí)施更多或更少的組件。將在下面詳細(xì)描述移動(dòng)終端的元件。
[0038]無線通信單元110通常包括一個(gè)或多個(gè)組件,其允許移動(dòng)終端100與無線通信系統(tǒng)或網(wǎng)絡(luò)之間的無線電通信。例如,無線通信單元可以包括廣播接收模塊111、移動(dòng)通信模塊112、無線互聯(lián)網(wǎng)模塊113、短程通信模塊114和位置信息模塊115中的至少一個(gè)。
[0039]廣播接收模塊111經(jīng)由廣播信道從外部廣播管理服務(wù)器接收廣播信號(hào)和/或廣播相關(guān)信息。廣播信道可以包括衛(wèi)星信道和/或地面信道。廣播管理服務(wù)器可以是生成并發(fā)送廣播信號(hào)和/或廣播相關(guān)信息的服務(wù)器或者接收之前生成的廣播信號(hào)和/或廣播相關(guān)信息并且將其發(fā)送給終端的服務(wù)器。廣播信號(hào)可以包括TV廣播信號(hào)、無線電廣播信號(hào)、數(shù)據(jù)廣播信號(hào)等等。而且,廣播信號(hào)可以進(jìn)一步包括與TV或無線電廣播信號(hào)組合的廣播信號(hào)。廣播相關(guān)信息也可以經(jīng)由移動(dòng)通信網(wǎng)絡(luò)提供,并且在該情況下,廣播相關(guān)信息可以由移動(dòng)通信模塊112來接收。廣播信號(hào)可以以各種形式存在,例如,其可以以數(shù)字多媒體廣播(DMB)的電子節(jié)目指南(EPG)、數(shù)字視頻廣播手持(DVB-H)的電子服務(wù)指南(ESG)等等的形式而存在。廣播接收模塊111可以通過使用各種類型的廣播系統(tǒng)接收信號(hào)廣播。特別地,廣播接收模塊111可以通過使用諸如多媒體廣播-地面(DMB-T)、數(shù)字多媒體廣播-衛(wèi)星(DMB-S)、數(shù)字視頻廣播-手持(DVB-H),前向鏈路媒體(MediaFLOO)的數(shù)據(jù)廣播系統(tǒng)、地面數(shù)字廣播綜合服務(wù)(ISDB-T)等等的數(shù)字廣播系統(tǒng)接收數(shù)字廣播。廣播接收模塊111可以被構(gòu)造為適合提供廣播信號(hào)的各種廣播系統(tǒng)以及上述數(shù)字廣播系統(tǒng)。經(jīng)由廣播接收模塊111接收的廣播信號(hào)和/或廣播相關(guān)信息可以存儲(chǔ)在存儲(chǔ)器160 (或者其它類型的存儲(chǔ)介質(zhì))中。
[0040]移動(dòng)通信模塊112將無線電信號(hào)發(fā)送到基站(例如,接入點(diǎn)、節(jié)點(diǎn)B等等)、外部終端以及服務(wù)器中的至少一個(gè)和/或從其接收無線電信號(hào)。這樣的無線電信號(hào)可以包括語音通話信號(hào)、視頻通話信號(hào)、或者根據(jù)文本和/或多媒體消息發(fā)送和/或接收的各種類型的數(shù)據(jù)。
[0041]無線互聯(lián)網(wǎng)模塊113支持移動(dòng)終端的無線互聯(lián)網(wǎng)接入。該模塊可以內(nèi)部或外部地耦接到終端。該模塊所涉及的無線互聯(lián)網(wǎng)接入技術(shù)可以包括WLAN(無線LAN) (W1-Fi)、Wibro (無線寬帶)、Wimax (全球微波互聯(lián)接入)、HSDPA (高速下行鏈路分組接入)等等。
[0042]短程通信模塊114是用于支持短程通信的模塊。短程通信技術(shù)的一些示例包括藍(lán)牙TM、射頻識(shí)別(RFID)、紅外數(shù)據(jù)協(xié)會(huì)(IrDA)、超寬帶(UWB)、紫蜂TM等等。
[0043]位置信息模塊115是用于檢查或獲取移動(dòng)終端的位置信息的模塊。位置信息模塊的典型示例是GPS (全球定位系統(tǒng))。根據(jù)當(dāng)前的技術(shù),GPS模塊115計(jì)算來自