語音控制設備的方法、裝置、電子設備及介質與流程

文檔序號：39710914發布日期：2024-10-22 12:56閱讀：4來源：國知局

本發明涉及人工智能，尤其是涉及一種語音控制設備的方法、裝置、電子設備及介質。

背景技術：

1、隨著智能穿戴設備的持續發展，越來越多的智能穿戴設備被應用到社會生活中。為了提高智能穿戴設備的智能性，可以通過語音控制智能穿戴設備的操作。目前，現有的方法中通常是簡單地語音類喚醒，以及基于內置的語音控制算法進行控制，然而內置的語音控制算法通過詞條嵌入進行識別，表現呆板，一旦用戶的語音超過詞條范圍內的內容則無法進行識別，從而無法控制智能穿戴設備的操作。

技術實現思路

1、有鑒于此，本發明的目的在于提供一種語音控制設備的方法、裝置、電子設備及介質，以提升了語音控制的識別準確率，進而提升了設備的智能性和用戶的體驗感。

2、為了實現上述目的，本發明實施例采用的技術方案如下：

3、第一方面，本發明實施例提供了一種語音控制設備的方法，包括：獲取用戶通過智能穿戴設備輸入的音頻數據，并將音頻數據轉換成文本信息；其中，音頻數據用于描述要控制智能穿戴設備執行的操作內容；基于大語言模型對文本信息進行內容識別得到控制智能穿戴設備的文字指令，并將文字指令發送至預先訓練的設備垂直領域模型，基于設備垂直領域模型匹配文字指令對應的設備操作協議指令；將設備操作協議指令返回至智能穿戴設備，以使智能穿戴設備執行對應的設備操作。

4、在一種實施方式中，將音頻數據轉換成文本信息之后，還包括：將文本信息與歷史消息管道中緩存的歷史文字指令進行匹配；如果匹配成功，則從歷史消息管道中獲取與文本信息匹配的歷史文字指令，并將歷史文字指令發送至設備垂直領域模型中，基于設備垂直領域模型匹配歷史文字指令對應的設備操作協議指令；如果匹配失敗，則基于大語言模型對文本信息進行內容識別得到控制智能穿戴設備的文字指令，并將文字指令發送至設備垂直領域模型中，基于設備垂直領域模型匹配文字指令對應的設備操作協議指令。

5、在一種實施方式中，基于大語言模型對文本信息進行內容識別得到控制智能穿戴設備的文字指令，包括：基于大語言模型對文本信息進行內容識別，得到控制智能穿戴設備的語言描述內容；通過檢索增強生成模型調用指令命令多語言描述庫，并基于大語言模型從指令命令多語言描述庫中匹配語言描述內容對應的文字指令，并將文字指令按照執行順序進行排序。

6、在一種實施方式中，基于設備垂直領域模型匹配文字指令對應的設備操作協議指令，包括：按照文字指令的執行順序，基于設備垂直領域模型匹配文字指令對應的設備操作協議指令，并將設備操作協議指令按照執行順序進行排序。

7、在一種實施方式中，將設備操作協議指令返回至智能穿戴設備，以使智能穿戴設備執行對應的設備操作，包括：將設備操作協議指令按照執行順序封裝至app端，以使app端將設備操作協議指令通過藍牙發送至智能穿戴設備，并通過智能穿戴設備對設備操作協議指令進行識別，并執行對應的設備操作。

8、在一種實施方式中，將文字指令按照執行順序進行排序之后，還包括：將文字指令和用戶輸入的音頻數據轉換得到的文本信息保存至歷史消息管道中。

9、在一種實施方式中，獲取用戶通過智能穿戴設備輸入的音頻數據，并將音頻數據轉換成文本信息，包括：在智能穿戴設備開啟ai智能控制功能后，接收用戶輸入的音頻數據，并將音頻數據保存為第一格式，將第一格式的音頻數據發送至app端；通過app端將第一格式的音頻數據轉換為第二格式，并將第二格式的音頻數據、用戶信息和智能穿戴設備的設備信息通過https表單請求發送至服務器端；通過服務器端調用文字識別接口，將第二格式的音頻數據轉換為文本信息。

10、第二方面，本發明實施例提供了一種語音控制設備的裝置，包括：音頻獲取模塊，用于獲取用戶通過智能穿戴設備輸入的音頻數據，并將音頻數據轉換成文本信息；其中，音頻數據用于描述要控制智能穿戴設備執行的操作內容；指令獲取模塊，用于基于大語言模型對文本信息進行內容識別得到控制智能穿戴設備的文字指令，并將文字指令發送至預先訓練的設備垂直領域模型，基于設備垂直領域模型匹配文字指令對應的設備操作協議指令；指令執行模塊，用于將設備操作協議指令返回至智能穿戴設備，以使智能穿戴設備執行對應的設備操作。

11、第三方面，本發明實施例提供了一種電子設備，包括處理器和存儲器，存儲器存儲有能夠被處理器執行的計算機可執行指令，處理器執行計算機可執行指令以實現上述第一方面提供的任一項的方法的步驟。

12、第四方面，本發明實施例提供了一種計算機可讀存儲介質，計算機可讀存儲介質上存儲有計算機程序，計算機程序被處理器運行時執行上述第一方面提供的任一項的方法的步驟。

13、本發明實施例帶來了以下有益效果：

14、本發明實施例提供的上述語音控制設備的方法、裝置、電子設備及介質，首先獲取用戶通過智能穿戴設備輸入的音頻數據(用于描述要控制智能穿戴設備執行的操作內容)，并將音頻數據轉換成文本信息；然后基于大語言模型對文本信息進行內容識別得到控制智能穿戴設備的文字指令，并將文字指令發送至預先訓練的設備垂直領域模型，基于設備垂直領域模型匹配文字指令對應的設備操作協議指令；最后將設備操作協議指令返回至智能穿戴設備，以使智能穿戴設備執行對應的設備操作。上述方法中用戶可以通過在智能穿戴設備輸入音頻數據，描述對智能穿戴設備的操作需求，并利用大語言模型對用戶需求進行精準識別確定用戶的操作行為的文字指令，并通過設備垂直領域模型將文字指令轉換為對應的智能穿戴設備的設備操作協議指令，進行設備操作，從而提升了語音控制的識別準確率，進而提升了設備的智能性和用戶的體驗感。

15、本發明的其他特征和優點將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實施本發明而了解。本發明的目的和其他優點在說明書、權利要求書以及附圖中所特別指出的結構來實現和獲得。

16、為使本發明的上述目的、特征和優點能更明顯易懂，下文特舉較佳實施例，并配合所附附圖，作詳細說明如下。

技術特征：

1.一種語音控制設備的方法，其特征在于，包括：

2.根據權利要求1所述的方法，其特征在于，將所述音頻數據轉換成文本信息之后，還包括：

3.根據權利要求1或2所述的方法，其特征在于，基于大語言模型對所述文本信息進行內容識別得到控制所述智能穿戴設備的文字指令，包括：

4.根據權利要求3所述的方法，其特征在于，基于所述設備垂直領域模型匹配所述文字指令對應的設備操作協議指令，包括：

5.根據權利要求1所述的方法，其特征在于，將所述設備操作協議指令返回至所述智能穿戴設備，以使所述智能穿戴設備執行對應的設備操作，包括：

6.根據權利要求3所述的方法，其特征在于，將所述文字指令按照執行順序進行排序之后，還包括：

7.根據權利要求1所述的方法，其特征在于，

8.一種語音控制設備的裝置，其特征在于，包括：

9.一種電子設備，其特征在于，包括處理器和存儲器，所述存儲器存儲有能夠被所述處理器執行的計算機可執行指令，所述處理器執行所述計算機可執行指令以實現權利要求1至7任一項所述的方法的步驟。

10.一種計算機可讀存儲介質，所述計算機可讀存儲介質上存儲有計算機程序，其特征在于，所述計算機程序被處理器運行時執行上述權利要求1至7任一項所述的方法的步驟。

技術總結
本發明提供了一種語音控制設備的方法、裝置、電子設備及介質，包括：獲取用戶通過智能穿戴設備輸入的音頻數據，并將音頻數據轉換成文本信息；其中，音頻數據用于描述要控制智能穿戴設備執行的操作內容；基于大語言模型對文本信息進行內容識別得到控制智能穿戴設備的文字指令，并將文字指令發送至預先訓練的設備垂直領域模型，基于設備垂直領域模型匹配文字指令對應的設備操作協議指令；將設備操作協議指令返回至智能穿戴設備，以使智能穿戴設備執行對應的設備操作。本發明提升了語音控制的識別準確率，進而提升了設備的智能性和用戶的體驗感。

技術研發人員：朱燕雄,嚴崇正,朱燕升,王楠,趙燕,許曉凱
受保護的技術使用者：深圳市愛都科技有限公司
技術研發日：
技術公布日：2024/10/21

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：朱燕雄,嚴崇正,朱燕升,王楠,趙燕,許曉凱
技術所有人：深圳市愛都科技有限公司
我是此專利的發明人

上一篇：一種便于拆卸的橡膠密封圈的制作方法
上一篇：一種供水管道維護裝置的制作方法

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！