語音數據處理方法、裝置、設備、介質及程序產品與流程

文檔序號：39720244發布日期：2024-10-22 13:10閱讀：2來源：國知局

本發明涉及物聯網，尤其涉及語音數據處理方法、裝置、設備、介質及程序產品。

背景技術：

1、nb-iot(窄帶物聯網)聚焦于低功耗廣覆蓋(lpwa)物聯網(iot)市場，是一種可在全球范圍內廣泛應用的新興技術。具有覆蓋廣、連接多、速率低、成本低、功耗低、架構優等特點。nb-iot使用license頻段，可采取帶內、保護帶或獨立載波等三種部署方式，與現有網絡共存。目前已經出現了大量物與物的聯接，這些聯接大多通過藍牙、wi-fi等短距通信技術承載，非運營商移動網絡。家庭門禁、門鈴等系統，以家庭為單位其設備連接多，速率低，功耗低的需求，以及其使用頻率低，時延要求低的特點，和nb-iot的特點非常匹配，因此，現有的很多家庭智能設備采用窄帶物聯網實現互聯。

2、但是nb-iot其上下行速率的穩定性與運營商移動網絡比還是相差甚遠，雖然上行速率理論值為16.9kbps，但某些不穩定網絡情況下網速只有3kbps左右，由于網絡情況不穩定通常無法在此網絡環境下提供穩定的通話體驗。

技術實現思路

1、本發明提供語音數據處理方法、裝置、設備、介質及程序產品，用以解決現有技術中窄帶物聯網網絡情況不穩定無法提供穩定的通話體驗的缺陷，實現根據網絡情況動態選擇語音編碼方式，提升通話體驗穩定性。

2、本發明提供一種語音數據處理方法，包括：

3、獲取上行帶寬數據，根據所述上行帶寬數據在多個預設編碼格式中確定第一候選編碼格式，基于所述第一候選編碼格式確定目標編碼格式；

4、向通話對端發送通知指令，并監聽所述通話對端發送的針對所述通知指令的答復消息，所述通知指令用于指示編碼格式切換；

5、在接收到所述答復消息后，基于所述目標編碼格式對語音數據進行編碼，得到語音數據包，所述語音數據包中包括反映所述目標編碼格式的標志位，將所述語音數據包發送至所述通話對端。

6、根據本發明提供的一種語音數據處理方法，所述多個預設編碼格式包括lyra編碼格式，所述根據所述上行帶寬數據在多個預設編碼格式中確定第一候選編碼格式，包括：

7、當所述上行帶寬數據低于第一預設閾值時，確定lyra編碼格式作為所述第一候選編碼格式。

8、根據本發明提供的一種語音數據處理方法，所述基于所述目標編碼格式對語音數據進行編碼，得到語音數據包，包括：

9、當所述上行帶寬數據小于第二預設閾值時，對所述語音數據進行話音激活檢測，得到多個語音數據段以及各個所述語音數據段對應的時間戳，所述語音數據段中包括語音信號；

10、基于所述目標編碼格式對所述多個語音數據段進行編碼，得到多個語音幀以及各個所述語音幀對應的時間戳；

11、基于多個所述語音幀生成一個所述語音數據包，所述語音數據包中包括各個所述語音幀對應的時間戳。

12、根據本發明提供的一種語音數據處理方法，所述基于所述目標編碼格式對語音數據進行編碼之前，包括：

13、獲取采集數據，對所述采集數據進行特征提取，得到語音特征，所述采集數據是語音采集裝置進行語音采集得到的數據；

14、將所述語音特征輸入至降噪模型中，獲取所述降噪模型輸出的處理特征；

15、對所述處理特征進行量化處理，得到所述語音數據。

16、根據本發明提供的一種語音數據處理方法，所述基于所述第一候選編碼格式確定目標編碼格式，包括：

17、將所述第一候選編碼格式發送至所述通話對端；

18、獲取所述通話對端發送的第一候選解碼格式，基于所述第一候選編碼格式和所述第一候選解碼格式確定所述目標編碼格式。

19、根據本發明提供的一種語音數據處理方法，還包括：

20、獲取設備性能數據，基于所述設備性能數據在多個解碼格式中確定第二候選解碼格式；

21、基于第二候選解碼格式確定目標解碼格式；

22、基于所述目標解碼格式對所述通話對端發送的數據包進行解碼。

23、本發明還提供一種語音數據處理裝置，包括：

24、網絡判斷模塊，用于獲取上行帶寬數據，根據所述上行帶寬數據在多個預設編碼格式中確定第一候選編碼格式，基于所述第一候選編碼格式確定目標編碼格式；

25、語音編碼控制模塊，用于向通話對端發送通知指令，并監聽所述通話對端發送的針對所述通知指令的答復消息，所述通知指令用于指示編碼格式切換；

26、語音編解碼模塊，用于在接收到所述答復消息后，基于所述目標編碼格式對語音數據進行編碼，得到語音數據包，所述語音數據包中包括反映所述目標編碼格式的標志位，將所述語音數據包發送至所述通話對端。

27、本發明還提供一種電子設備，包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序，所述處理器執行所述程序時實現如上述任一種所述語音數據處理方法。

28、本發明還提供一種非暫態計算機可讀存儲介質，其上存儲有計算機程序，該計算機程序被處理器執行時實現如上述任一種所述語音數據處理方法。

29、本發明還提供一種計算機程序產品，包括計算機程序，所述計算機程序被處理器執行時實現如上述任一種所述語音數據處理方法。

30、本發明提供的一種語音數據處理方法、裝置、設備、介質及程序產品，通過獲取上行帶寬數據，根據上行帶寬數據在多個預設編碼格式中確定第一候選編碼格式，基于第一候選編碼格式確定目標編碼格式，確定目標編碼格式，向通話對端發送通知指令，接收到通話對端針對該通知指令的答復消息后，基于目標編碼格式對語音數據進行編碼，得到語音數據包，并且在語音數據包中插入標志位，該標志位可以反映當前的編碼格式已經切換為目標編碼格式，通話對端就可以對應切換為目標編碼格式對應的解碼格式進行解碼。本發明通過在通話過程中根據實際的上行帶寬數據適應性地選擇編碼格式，就可以在上行網絡速率不佳的時候，選擇更加適合低帶寬環境的語音編碼技術，在上行網絡速度較好的時候，選擇更加適合高帶寬環境的語音編碼技術，并且通過在數據包中添加標志位的方式通知通話對端編碼格式的變更，可以實現無額外開銷的編碼格式切換，提供穩定的通話體驗的效果。

技術特征：

1.一種語音數據處理方法，其特征在于，包括：

2.根據權利要求1所述的語音數據處理方法，其特征在于，所述多個預設編碼格式包括lyra編碼格式，所述根據所述上行帶寬數據在多個預設編碼格式中確定第一候選編碼格式，包括：

3.根據權利要求1所述的語音數據處理方法，其特征在于，所述基于所述目標編碼格式對語音數據進行編碼，得到語音數據包，包括：

4.根據權利要求1所述的語音數據處理方法，其特征在于，所述基于所述目標編碼格式對語音數據進行編碼之前，包括：

5.根據權利要求1所述的語音數據處理方法，其特征在于，所述基于所述第一候選編碼格式確定目標編碼格式，包括：

6.根據權利要求1所述的語音數據處理方法，其特征在于，所述方法還包括：

7.一種語音數據處理裝置，其特征在于，包括：

8.一種電子設備，包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序，其特征在于，所述處理器執行所述程序時實現如權利要求1至6任一項所述語音數據處理方法。

9.一種非暫態計算機可讀存儲介質，其上存儲有計算機程序，其特征在于，所述計算機程序被處理器執行時實現如權利要求1至6任一項所述語音數據處理方法。

10.一種計算機程序產品，包括計算機程序，其特征在于，所述計算機程序被處理器執行時實現如權利要求1至6任一項所述語音數據處理方法。

技術總結
本發明提供語音數據處理方法、裝置、設備、介質及程序產品，其中方法包括：獲取上行帶寬數據，根據上行帶寬數據在多個預設編碼格式中確定第一候選編碼格式，基于第一候選編碼格式確定目標編碼格式；向通話對端發送通知指令，并監聽通話對端發送的針對通知指令的答復消息，通知指令用于指示編碼格式切換；在接收到答復消息后，基于目標編碼格式對語音數據進行編碼，得到語音數據包，語音數據包中包括反映目標編碼格式的標志位，將語音數據包發送至通話對端。本發明通過在通話過程中根據實際的上行帶寬數據適應性地選擇編碼格式，并在數據包中添加標志位的方式通知通話對端編碼格式的變更，可以實現無額外開銷的編碼格式切換，提供穩定的通話體驗。

技術研發人員：周駿華,吳慶航,陳民,程寶平
受保護的技術使用者：中移（杭州）信息技術有限公司
技術研發日：
技術公布日：2024/10/21

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：周駿華,吳慶航,陳民,程寶平
技術所有人：中移（杭州）信息技術有限公司
我是此專利的發明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數字信號處理 2.傳感器技術及應用 3.機電一體化產品開發 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統開發
3、孫老師：1.振動信號時頻分析理論與測試系統設計 2.汽車檢測系統設計 3.汽車電子控制系統設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網絡及物聯網
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！