一種視頻處理方法及裝置的制造方法

文檔序號：10539160閱讀：418來源：國知局

一種視頻處理方法及裝置的制造方法
【專利摘要】本發明實施例提供一種視頻處理方法及裝置，用以在拍攝的視頻中增加字幕，解決現有技術中視頻拍攝同質化的缺陷。所述視頻處理方法包括檢測到開始錄制語音觸發事件時開始播放已拍攝完成的視頻并進行語音信息錄制；在檢測到結束錄制語音觸發事件時，停止播放所述視頻和錄制語音信息；對錄制的語音信息進行識別得到字幕信息；根據錄制的語音信息的時間信息將所述字幕信息插入到所述視頻中。
【專利說明】
一種視頻處理方法及裝置
技術領域
[0001]本發明實施例涉及視頻拍攝技術領域，尤其涉及一種視頻處理方法及裝置。
【背景技術】
[0002]隨著智能移動終端技術的發展，使用移動終端進行短視頻拍攝成為當下熱門應用之一。目前，利用移動終端進行視頻拍攝的拍攝方式單一，即用戶利用視頻拍攝應用程序提供的模板、濾鏡等輔助工具進行視頻拍攝。視頻拍攝完成后，用戶可以將其發布到網站供其他用戶觀看或者下載，也可以在移動終端本地存儲，用戶無法對拍攝完成的視頻按照自己的意愿進行處理，使用用戶拍攝的視頻趨于同質化。
[0003]實際應用中，用戶可能存在如下需求:在拍攝完成的視頻中添加字幕，而現有的視頻拍攝方法無法實現該功能，因此，如何在拍攝的視頻中增加字幕成為利用移動終端進行視頻拍攝技術領域亟待解決的技術問題之一。

【發明內容】

[0004]本發明實施例提供一種視頻處理方法及裝置，用以在拍攝的視頻中增加字幕，解決現有技術中視頻拍攝同質化的缺陷。
[0005]本發明實施例提供一種視頻處理方法，包括:
[0006]檢測到開始錄制語音觸發事件時開始播放已拍攝完成的視頻并進行語音信息錄制;
[0007]在檢測到結束錄制語音觸發事件時，停止播放所述視頻和錄制語音信息；
[0008]對錄制的語音信息進行識別得到字幕信息；
[0009]根據錄制的語音信息的時間信息將所述字幕信息插入到所述視頻中。
[0010]本發明實施例提供一種視頻處理裝置，包括:
[0011]控制單元，用于在檢測到開始錄制語音觸發事件時開始播放已拍攝完成的視頻并進行語音信息錄制；以及在檢測到結束錄制語音觸發事件時，停止播放所述視頻和錄制語音信息；
[0012]語音識別單元，用于對錄制的語音信息進行識別得到字幕信息；
[0013]字幕信息插入單元，用于根據錄制的語音信息的時間信息將所述字幕信息插入到所述視頻中。
[0014]本發明實施例提供一種視頻處理設備，包括處理器和存儲器，處理器可以用于讀取存儲器中的程序，執行下列過程:檢測到開始錄制語音觸發事件時開始播放已拍攝完成的視頻并進行語音信息錄制；在檢測到結束錄制語音觸發事件時，停止播放所述視頻和錄制語音信息；對錄制的語音信息進行識別得到字幕信息；根據錄制的語音信息的時間信息將所述字幕信息插入到所述視頻中。
[0015]本發明實施例提供的視頻處理方法及裝置，在視頻拍攝完成后，通過將用戶錄制的語音識別為字幕并插入至拍攝完成的視頻中，用戶可以為拍攝的視頻添加字幕，使得拍攝的視頻更具個性，提高了用戶體驗。
【附圖說明】
[0016]為了更清楚地說明本發明實施例或現有技術中的技術方案，下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹，顯而易見地，下面描述中的附圖是本發明的一些實施例，對于本領域普通技術人員來講，在不付出創造性勞動的前提下，還可以根據這些附圖獲得其他的附圖。
[0017]圖1a為本發明實施例中視頻拍攝完成后用戶需要對以完成視頻進行處理時的顯示界面示意圖；
[0018]圖1b為本發明實施例中語音錄制頁面的界面示意圖；
[0019]圖1c為本發明實施例中為提供字幕開啟/關閉開關的界面示意圖；
[0020]圖1d為本發明實施例中添加了字幕的視頻播放效果示意圖；
[0021]圖2為本發明實施例中視頻處理方法流程圖；
[0022]圖3為本發明實施例中視頻拍攝裝置結構示意圖。
【具體實施方式】
[0023]為使本發明實施例的目的、技術方案和優點更加清楚，下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例是本發明一部分實施例，而不是全部的實施例。基于本發明中的實施例，本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例，都屬于本發明保護的范圍。
[0024]實施例一
[0025]為了提高用戶體驗，本發明實施例中，用戶在拍攝完成視頻之后，可以為拍攝的視頻添加字幕。如圖1a所示，為本發明實施例中，視頻拍攝完成后用戶需要對以完成視頻進行處理時的顯示界面示意圖，用戶需要為拍攝完成的視頻添加字幕時，可以點擊添加旁白按鍵觸發視頻處理應用程序啟動。視頻處理應用程序啟動后，進入語音錄制頁面，如圖1b所示，為語音錄制頁面的界面示意圖。用戶可以通過點擊開始錄制按鍵開始錄制語音，觸發語音錄制流程，用戶點擊開始錄制按鍵的同時，開始播放已完成的視頻，用戶根據播放的視頻錄制語音信息。當用戶需要結束語音錄制流程時，點擊結束錄制按鍵，同時停止播放視頻。
[0026]基于此，如圖2所示，為本發明實施例提供的視頻處理方法實施例流程圖，可以包括以下步驟:
[0027]S21、檢測到開始錄制語音觸發事件時開始播放已拍攝完成的視頻并進行語音信息錄制。
[0028]在檢測到用戶點擊開始錄制按鍵時確定檢測到開始錄制語音觸發事件，此時開始播放已完成視頻，并進入語音錄制流程。
[0029]S22、在檢測到結束錄制語音觸發事件時，停止播放所述視頻和錄制語音信息。
[0030]在檢測到用戶點擊結束錄制按鍵時確定檢測到結束錄制語音觸發事件，此時停止播放已完成視頻，結束語音錄制流程。
[0031]S23、對錄制的語音信息進行識別得到字幕信息。
[0032]S24、根據錄制的語音信息的時間信息將得到的字幕信息插入到視頻中。
[0033]需要說明的是，具體實施時，還可以在錄制語音信息的同時對錄制的語音信息進行識別，并插入到視頻中進行顯示，即步驟S23、步驟S24可以與步驟S21同時執行。
[0034]在步驟S23中，可以有以下兩種實施方式:
[0035]第一種實施方式、在網絡側進行識別
[0036]具體的，在檢測到結束錄制語音觸發事件時，向網絡側服務器發送語音識別請求，其中攜帶有錄制的語音信息，由網絡側服務器利用語音識別技術將接收到的語音信息識別為字幕信息后返回。
[0037]第二種實施方式、在終端設備本地進行識別
[0038]這種實施方式下，需要開發人在預先在視頻處理應用程序中預先寫入翻譯庫，在安裝視頻處理應用程序時存儲至終端設備本地，以識別用戶錄制的語音。受制于終端設備的存儲空間，預先寫入的翻譯庫中包含的語言可能并不完整，例如，可以僅僅寫入大部分用戶常用的語言，例如中文，英文，對于一些不常見的語言可以不寫入，以節省終端設備的存儲空間。
[0039]另外，與網絡側識別方式相比，在終端設備本地識別響應速度相對較快，用戶在錄制結束后立即可以識別出對應的字幕信息。
[0040]在網絡側進行識別的實施方式中，由于網絡側服務器可利用的翻譯資源較多，因此，可以將用戶錄制的語音信息識別為不同語言的字幕信息，且其識別結果更加準確。但是，其受網絡環境影響較大，如果網絡環境較好，終端設備得到字幕信息的延遲較小，如果網絡環境較差，終端設備得到字幕信息的延遲較大。
[0041]為了使得視頻播放與語音信息識別得到的字幕信息融合效果更好，具體實施時，在進行字幕識別過程中可以控制視頻播放與語音錄制同步進行。下面通過實施例二進行說明。
[0042]實施例二
[0043]在檢測到開始錄制語音觸發事件時開始播放視頻，并獲取視頻的開始播放時間點；在檢測到結束錄制語音觸發事件時停止播放視頻，并獲取視頻的結束播放時間點。基于此在向視頻中插入字幕信息時，可以將字幕信息插入到獲取的開始播放時間點與結束播放時間點之間的視頻中。
[0044]例如，在檢測到開始錄制語音觸發事件時開始播放視頻，并獲取到視頻的開始播放時間點為第5s，在檢測到結束錄制語音觸發事件時停止播放視頻，并獲取到視頻的結束播放時間點為第15s，則將識別出的字幕信息插入到視頻的第5s-第15s之間。
[0045]針對網絡側識別的識別結果延遲問題，本發明實施例中，在檢測到結束錄制語音觸發事件后，如果獲得字幕信息延遲大于預設閾值，例如，字幕信息延遲2s才獲得，則在向視頻中插入字幕信息時，需要增加延遲的時間。例如，用戶錄制5s的語音信息，在2s后獲得了識別出的字幕信息，這種情況下，假設獲取的開始播放時間點為第5s，結束播放時間點為第10s，在向視頻中插入字幕信息時，需要增加2s的延遲，即將字幕信息插入到第5s-第12s之間的視頻中。如果獲得字幕信息延遲不大于預設閾值，則可以忽略不計，即仍然按照獲取的開始播放時間點和結束播放時間點進行插入即可，即將識別出的字幕信息插入到第5s-第1s之間的視頻中。
[0046]基于實施二中視頻播放與語音錄制同步的實施例，實施例三中用戶可以分多次完成語音信息的錄制，并分別進行識別得到字幕，根據語音錄制時間插入到對應的視頻內容中。基于此，本發明實施例提供了實施例三。
[0047]實施例三
[0048]針對一段拍攝完成的視頻，用戶可以分多次錄制語音信息后插入到該視頻中。例如，用戶拍攝了一段20s的視頻，可以分四次錄制語音信息。每一段語音信息與其中的一段視頻對應。具體實施時，錄制完成一段語音信息并獲得其對應的字幕信息后，根據錄制時間點將其插入對應播放時間點的視頻中。例如，假設錄制第一段語音信息的錄制時間點為第0s-第5s，其對應的播放時間點為第Os-第5s，則獲得了識別出的字幕后，將其插入到第Os-第5s的視頻中。假設錄制第二段語音信息的錄制時間點為第5s-第12s，其對應的播放時間點為第5s-第12s，則獲得了識別出的字幕后，將其插入到第5s-第12s的視頻中，以此類推。
[0049]如果錄制過程中，網絡環境較差，例如，假設錄制第一段語音信息的錄制時間點為第Os-第5s，其對應的播放時間點為第Os-第5s，在錄制結束后2s獲得了識別出的字幕信息，則將獲得的字幕信息插入到第Os-第7s視頻中，且第二段語音信息的開始錄制時間從第7s開始，假設錄制第二段語音信息的錄制時間點為第7s-第15s，其對應的播放時間點為第7s-第15s，則獲得了識別出的字幕后，將其插入到第7s-第15s的視頻中。在處理過程中，始終需要保持錄制時間點和播放時間點一致。
[0050]用戶在錄制完成全部的語音信息或者在錄制語音信息的過程中，如果用戶分多次錄制完成一段視頻的語音信息，即錄制的語音信息由至少一個按照錄制時間排列的子語音信息組成。用戶可以刪除錄制不滿意的語音信息并重新錄制，具體實施時，可以按照實施例四實施子視頻刪除以及重新錄制的過程。
[0051]實施例四
[0052]本實施例中，在檢測到刪除任一子語音信息觸發事件時，刪除對應的子語音信息。相應的，用戶在刪除已錄制完成的子語音信息時，如果再次檢測到開始錄制語音觸發事件時，可以提示用戶是否重新錄制被刪除的子語音信息，根據用戶的選擇確定是否重新錄制被刪除的子語音信息。在確定重新錄制被刪除的子語音信息時，從被刪除子語音信息的開始錄制時間點開始播放視頻并重新進行語音信息錄制；并對重新錄制的語音信息進行識別得到字幕信息并根據重新錄制語音信息的時間信息將識別得到的字幕信息插入該視頻中。
[0053]較佳的，在重新錄制被刪除的子語音信息時，本發明實施例提供以下兩種重新錄制被刪除的子語音信息的實施方式:
[0054]第一種實施方式，僅重新錄制被刪除的子語音信息。
[0055]這種實施方式下，在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放視頻并重新進行語音信息錄制，直至到達該被刪除子語音信息的結束錄制時間點時停止錄制語音信息并停止播放視頻。
[0056]例如，用戶為一段20s的視頻錄制了 4個子語音信息，假設用戶刪除的子語音信息的錄制時間點為第5s-第12s，則其對應的視頻播放時間點為第5s-第12s，用戶在刪除了該子語音信息后，從播放時間點第5s開始播放視頻，同時進行語音錄制，在播放時間點到達第12s時，停止結束語音錄制并停止播放視頻。
[0057]第二種實施方式，對錄制時間點在用戶選擇刪除的子語音信息之后的全部子語音信息進行重新錄制。
[0058]這種實施方式下，在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制，直至到達錄制時間最晚的子語音信息的結束錄制時間點時停止錄制語音信息并停止播放所述視頻。
[0059]例如，用戶為一段20s的視頻錄制了 4個子語音信息，假設用戶刪除的子語音信息的錄制時間點為第5s-第12s，則其對應的視頻播放時間點為第5s-第12s，用戶在刪除了該子語音信息后，從播放時間點第5s開始播放視頻，同時進行語音錄制，在播放時間點到達第20s時，停止結束語音錄制并停止播放視頻。當然，在錄制過程中，用戶也可以分多次錄制第5s-第20s對應的語音信息。例如，用戶第一次錄制第5s-第8s，第二次錄制第8s_第15s，第二次錄制第15s_第20s。每次錄制語首過程中，視頻播放時間點與語首錄制時間點保持一致即可。
[0060]具體實施時，為了進一步提高語音識別為字幕的準確性，用戶也可以分段錄制視頻，最后為每一段視頻錄制語音信息。例如，用戶份4次拍攝20s的視頻，假設每次拍攝5s、6s、5s、4s的視頻片段，之后，用戶再分別針對每一段視頻利用上述方法為其添加字幕即可。
[0061]具體實施時，還可以提供字幕開啟/關閉開關，根據檢測到的開啟/關閉觸發事件開啟/關閉字幕。如圖1c所示，為提供字幕開啟/關閉開關的界面示意圖，圖1c中右下角為字幕開啟/關閉的開關，具體的，當開關為圖1c所示狀態時，字幕可以為開啟狀態，當開關被觸發向左滑動時，可將字幕關閉。如圖1d所示，為添加了字幕的視頻播放效果示意圖。
[0062]本發明實施例提供的視頻處理方法中，用戶可以為自己拍攝的視頻添加字幕，使得拍攝出的視頻更加具有個性，提高了用戶體驗。
[0063]與本申請實施例一?實施例四基于同一發明構思，實施例五提供了一種視頻拍攝處理裝置，由于本裝置解決問題的原理與上述的視頻拍攝處理方法相似，因此上述裝置的實施可以參見方法的實施，重復之處不再贅述。
[0064]實施例五
[0065]如圖3所示，為本發明中視頻拍攝處理裝置實施例結構示意圖，可以包括:
[0066]控制單元31，用于在檢測到開始錄制語音觸發事件時開始播放已拍攝完成的視頻并進行語音信息錄制；以及在檢測到結束錄制語音觸發事件時，停止播放所述視頻和錄制語音信息；
[0067]語音識別單元32，用于對錄制的語音信息進行識別得到字幕信息；
[0068]字幕信息插入單元33，用于根據錄制的語音信息的時間信息將所述字幕信息插入到所述視頻中。
[0069]具體實施時，語音識別單元32，可以用于向網絡側發送語音識別請求，其中所述語音識別請求攜帶有錄制的語音信息；接收所述網絡側根據所述語音信息識別出的字幕信息；或者將錄制的語音信息在本地識別為字幕信息。
[0070]本發明實施例提供的視頻處理裝置，還可以包括獲取單元，其中:
[0071]獲取單元，用于在檢測到開始錄制語音觸發事件時，獲取所述視頻的開始播放時間點；以及在檢測到結束錄制語音觸發事件時，獲取所述視頻的結束播放時間點；字幕信息插入單元33，用于將所述字幕信息插入到所述開始播放時間點和結束播放時間點之間的視頻中。
[0072]具體實施時，錄制的語音信息由至少一個按照錄制時間排列的子語音信息組成。
[0073]基于此，本發明實施例提供的視頻處理裝置還可以包括:
[0074]刪除單元，用于在檢測到刪除任一子語音信息觸發事件時，刪除對應的子語音信息。
[0075]控制單元31，還可以用于在刪除單元刪除對應的子語音信息之后，在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制；
[0076]語音識別單元32，還可以用于對重新錄制的語音信息進行識別得到字幕信息；
[0077]字幕信息插入單元33，還可以用于根據重新錄制的語音信息的時間信息將識別得到的字幕信息插入所述視頻中。
[0078]其中，控制單元31，具體用于在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制，直至到達所述被刪除子語音信息的結束錄制時間點時停止錄制語音信息并停止播放所述視頻；或者在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制，直至到達錄制時間最晚的子語音信息的結束錄制時間點時停止錄制語音信息并停止播放所述視頻。
[0079]為了描述的方便，以上各部分按照功能劃分為各模塊(或單元)分別描述。當然，在實施本發明時可以把各模塊(或單元)的功能在同一個或多個軟件或硬件中實現。具體實施時，上述設備識別裝置可以設置于終端設備中。
[0080]本發明實施例中可以通過硬件處理器(hardware processor)來實現圖3所示的相關功能單元。具體實施時，處理器可以用于讀取存儲器中的程序，執行下列過程以實現圖3所示的相關功能單元:檢測到開始錄制語音觸發事件時開始播放已拍攝完成的視頻并進行語音信息錄制；在檢測到結束錄制語音觸發事件時，停止播放所述視頻和錄制語音信息；對錄制的語音信息進行識別得到字幕信息；根據錄制的語音信息的時間信息將所述字幕信息插入到所述視頻中。
[0081]以上所描述的裝置實施例僅僅是示意性的，其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個地方，或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性的勞動的情況下，即可以理解并實施。
[0082]通過以上的實施方式的描述，本領域的技術人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現，當然也可以通過硬件。基于這樣的理解，上述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來，該計算機軟件產品可以存儲在計算機可讀存儲介質中，如R0M/RAM、磁碟、光盤等，包括若干指令用以使得一臺計算機設備(可以是個人計算機，服務器，或者網絡設備等)執行各個實施例或者實施例的某些部分所述的方法。
[0083]最后應說明的是:以上實施例僅用以說明本發明的技術方案，而非對其限制?’盡管參照前述實施例對本發明進行了詳細的說明，本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改，或者對其中部分技術特征進行等同替換；而這些修改或者替換，并不使相應技術方案的本質脫離本發明各實施例技術方案的精神和范圍。
【主權項】
1.一種視頻處理方法，其特征在于，包括: 檢測到開始錄制語音觸發事件時開始播放已拍攝完成的視頻并進行語音信息錄制；在檢測到結束錄制語音觸發事件時，停止播放所述視頻和錄制語音信息；對錄制的語音信息進行識別得到字幕信息；根據錄制的語音信息的時間信息將所述字幕信息插入到所述視頻中。2.根據權利要求1所述的方法，其特征在于，對錄制的語音信息進行識別得到的字幕信息，具體包括: 向網絡側發送語音識別請求，其中所述語音識別請求攜帶有錄制的語音信息；接收所述網絡側根據所述語音信息識別出的字幕信息；或者將錄制的語音信息在本地識別為字幕信息。3.根據權利要求1所述的方法，其特征在于，還包括: 在檢測到開始錄制語音觸發事件時，獲取所述視頻的開始播放時間點；在檢測到結束錄制語音觸發事件時，獲取所述視頻的結束播放時間點；以及根據錄制的語音信息的時間信息將所述字幕信息插入到所述視頻中，具體包括: 將所述字幕信息插入到所述開始播放時間點和結束播放時間點之間的視頻中。4.根據權利要求1所述的方法，其特征在于，錄制的語音信息由至少一個按照錄制時間排列的子語音信息組成。5.根據權利要求4所述的方法，其特征在于，所述方法還包括:在檢測到刪除任一子語音信息觸發事件時，刪除對應的子語音信息。6.根據權利要求5所述的方法，其特征在于，所述刪除對應的子語音信息之后包括: 在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制；對重新錄制的語音信息進行識別得到字幕信息并根據重新錄制語音信息的時間信息將識別得到的字幕信息插入所述視頻中。7.根據權利要求6所述的方法，其特征在于，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制，具體包括: 在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制，直至到達所述被刪除子語音信息的結束錄制時間點時停止錄制語音信息并停止播放所述視頻；或者在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制，直至到達錄制時間最晚的子語音信息的結束錄制時間點時停止錄制語音信息并停止播放所述視頻。8.一種視頻處理裝置，其特征在于，包括: 控制單元，用于在檢測到開始錄制語音觸發事件時開始播放已拍攝完成的視頻并進行語音信息錄制；以及在檢測到結束錄制語音觸發事件時，停止播放所述視頻和錄制語音信息; 語音識別單元，用于對錄制的語音信息進行識別得到字幕信息；字幕信息插入單元，用于根據錄制的語音信息的時間信息將所述字幕信息插入到所述視頻中。9.根據權利要求8所述的裝置，其特征在于，所述語音識別單元，具體用于向網絡側發送語音識別請求，其中所述語音識別請求攜帶有錄制的語音信息；接收所述網絡側根據所述語音信息識別出的字幕信息；或者將錄制的語音信息在本地識別為字幕信息。10.根據權利要求8所述的裝置，其特征在于，還包括獲取單元，其中: 所述獲取單元，用于在檢測到開始錄制語音觸發事件時，獲取所述視頻的開始播放時間點；以及在檢測到結束錄制語音觸發事件時，獲取所述視頻的結束播放時間點；所述字幕信息插入單元，用于將所述字幕信息插入到所述開始播放時間點和結束播放時間點之間的視頻中。11.根據權利要求8所述的裝置，其特征在于，錄制的語音信息由至少一個按照錄制時間排列的子語音信息組成。12.根據權利要求11所述的裝置，其特征在于，還包括: 刪除單元，用于在檢測到刪除任一子語音信息觸發事件時，刪除對應的子語音信息。13.根據權利要求12所述的裝置，其特征在于，所述控制單元，還用于在所述刪除單元刪除對應的子語音信息之后，在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制；所述語音識別單元，還用于對重新錄制的語音信息進行識別得到字幕信息；所述字幕信息插入單元，還用于根據重新錄制的語音信息的時間信息將識別得到的字幕信息插入所述視頻中。14.根據權利要求13所述的裝置，其特征在于，所述控制單元，具體用于在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制，直至到達所述被刪除子語音信息的結束錄制時間點時停止錄制語音信息并停止播放所述視頻；或者在檢測到重新錄制被刪除的子語音信息的開始錄制語音觸發事件時，從被刪除子語音信息的開始錄制時間點開始播放所述視頻并重新進行語音信息錄制，直至到達錄制時間最晚的子語音信息的結束錄制時間點時停止錄制語音信息并停止播放所述視頻。
【文檔編號】H04N21/44GK105898169SQ201510511387
【公開日】2016年8月24日
【申請日】2015年8月19日
【發明人】李瑞科, 姜樂
【申請人】樂視網信息技術（北京）股份有限公司

完整全部詳細技術資料下載