本公開涉及音頻轉換的技術領域,尤其涉及一種音頻信息處理的方法及裝置。
背景技術:
在采訪和演講會等活動中,需要將即時的將音頻信息轉換為文本信息。在將音頻信息轉換為文本信息的過程中,需要使用具體的文件來存儲所述文本信息,針對不同的應用目的,可以使用不同類型的文本格式的文件來存儲文本信息。使用.txt文本格式類型的優點在于同樣的存儲文本信息所占用的存儲空間較小;使用.doc文本格式類型的優點在于便于后期的修改和撰寫;使用.pdf文本格式的優點在于便于印刷和在不同終端展示效果的一致性。在將音頻信息轉換為文本信息的過程中,在某些情況下,從始到終的使用一種類型的文本格式是無法滿足用戶的使用需求的。在現有技術中,若在此過程中更改文本格式的類型,是需要用戶進入相應的應用軟件中進行相關的設置的。在很多情況下,將音頻信息轉換為文本信息的過程是發生在現場的采訪和演講會中的,這就需要用戶在進行邊進行采訪或者邊聽演講,邊進行相應的繁瑣復雜的設置操作,這給用戶帶來不良的用戶體驗。如何以簡單便捷的方式來解決上述問題,就成為了業界亟待解決的問題。
技術實現要素:
本公開公開實施例提供音頻信息處理的方法及裝置。所述技術方案如下:
根據本公開實施例的第一方面,提供一種音頻信息處理的方法,包括:
接收輸入的音頻信息;
將所述音頻信息轉化為相應的文本信息;
實時監測終端接收到的手勢信息;
判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配;
當匹配時,將所述文本信息按照所述預設的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:該技術方案在處理音頻信息的文檔格式轉換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
在一個實施例中,所述接收輸入的音頻信息之前,所述方法還包括:
設置默認的文件格式;
所述將所述音頻信息轉化為相應的文本信息之后,所述方法還包括:
當未監測到所述手勢信息時或者當所述接收到的手勢信息與預設的文件格式對應的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:設置默認的文件格式可以在用戶未能及時的設置文件格式的情況下,妥善的保存音頻信息轉化的文本信息。
在一個實施例中,所述實時監測終端接收到的手勢信息,包括:
所述手勢信息包括終端的運動狀態信息和/或終端的觸控狀態信息;
實時監測所述終端的運動狀態信息包括:實時通過所述終端中內置的重力傳感器、陀螺儀中的任一者多者監測所述終端的運動狀態信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據分析結果確定所述終端的運動狀態信息;或者實時監測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據分析結果確定所述終端的運動狀態信息;
實時監測所述終端的觸控狀態信息包括:實時監測所述終端的預設按鍵、觸摸屏幕中的任一者或多者的觸控狀態信息。
本公開的實施例提供的技術方案可以包括以下有益效果:可以通過多種方式來獲得終端的手勢信息,可增強獲取終端的手勢信息的魯棒性,增強本技術方案在各種應用情景下的適用度。
在一個實施例中,所述實時監測終端接收到的手勢信息,包括:
實時獲取終端接收到的手勢信息;
判斷所述接收到的手勢信息是否滿足預設啟動條件;
當所述接收到的手勢信息未滿足預設啟動條件時,舍棄所述接收到的手勢信息;
當所述接收到的手勢信息滿足預設啟動條件時,繼續執行判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配的步驟。
本公開的實施例提供的技術方案可以包括以下有益效果:克服了因為人手握持時抖動所產生的運動狀態信息的干擾和無意中的觸控所產生的觸控狀態信息,降低了非用戶操作意圖而產生的手勢信息的干擾,提高了本方案的實用性和用戶的操作體驗。
在一個實施例中,所述判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配,包括:
篩選出所述終端的手勢信息與預設的存儲文件格式對應的存儲操作信息庫中匹配度最高的存儲操作信息;
當所述匹配度最高的存儲操作信息的匹配度的數值大于預設的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預設的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:排除匹配度過低的手勢信息的干擾,可以提升終端的手勢信息的準確度。
根據本公開實施例的第二方面,提供一種音頻信息處理的裝置,包括:
接收模塊,用于接收輸入的音頻信息;
轉化模塊,用于將所述音頻信息轉化為相應的文本信息;
監測模塊,用于實時監測終端接收到的手勢信息;
判斷模塊,用于判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配;
第一存儲模塊,用于當匹配時,將所述文本信息按照所述預設的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:該技術方案在處理音頻信息的文檔格式轉換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
在一個實施例中,還包括:
所述接收輸入的音頻信息之前,還包括:
設置模塊,用于設置默認的文件格式;
所述將所述音頻信息轉化為相應的文本信息之后,還包括:
第二存儲模塊,用于當未監測到所述手勢信息時或者當所述接收到的手勢信息與預設的文件格式對應的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:設置默認的文件格式可以在用戶未能及時的設置文件格式的情況下,妥善的保存音頻信息轉化的文本信息。
在一個實施例中,所述監測模塊,包括:
所述手勢信息包括終端的運動狀態信息和/或終端的觸控狀態信息;
第一監測子模塊,用于實時監測所述終端的運動狀態信息包括:實時通過所述終端中內置的重力傳感器、陀螺儀中的任一者多者監測所述終端的運動狀態信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據分析結果確定所述終端的運動狀態信息;或者實時監測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據分析結果確定所述終端的運動狀態信息;
第二監測子模塊,用于實時監測所述終端的觸控狀態信息包括:實時監測所述終端的預設按鍵、觸摸屏幕中的任一者或多者的觸控狀態信息。
本公開的實施例提供的技術方案可以包括以下有益效果:可以通過多種方式來獲得終端的手勢信息,可增強獲取終端的手勢信息的魯棒性,增強本技術方案在各種應用情景下的適用度。
在一個實施例中,所述監測模塊,包括:
獲取子模塊,用于實時獲取終端接收到的手勢信息;
第一判斷子模塊,用于判斷所述接收到的手勢信息是否滿足預設啟動條件;
舍棄子模塊,用于當所述接收到的手勢信息未滿足預設啟動條件時,舍棄所述接收到的手勢信息;
第二判斷子模塊,用于當所述接收到的手勢信息滿足預設啟動條件時,繼續執行判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配的步驟。
本公開的實施例提供的技術方案可以包括以下有益效果:克服了因為人手握持時抖動所產生的運動狀態信息的干擾和無意中的觸控所產生的觸控狀態信息,降低了非用戶操作意圖而產生的手勢信息的干擾,提高了本方案的實用性和用戶的操作體驗。
在一個實施例中,所述判斷模塊,包括:
篩選子模塊,用于篩選出所述終端的手勢信息與預設的存儲文件格式對應的存儲操作信息庫中匹配度最高的存儲操作信息;
確定子模塊,用于當所述匹配度最高的存儲操作信息的匹配度的數值大于預設的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
存儲子模塊,用于當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預設的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:排除匹配度過低的手勢信息的干擾,可以提升終端的手勢信息的準確度。
根據本公開實施例的第三方面,提供一種音頻信息處理的裝置,所述裝置包括:
處理器;
用于存儲處理器可執行指令的存儲器;
其中,所述處理器被配置為:
接收輸入的音頻信息;
將所述音頻信息轉化為相應的文本信息;
實時監測終端接收到的手勢信息;
判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配;
當匹配時,將所述文本信息按照所述預設的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:該技術方案在處理音頻信息的文檔格式轉換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。
圖1是根據一示例性實施例示出的一種音頻信息處理的方法的流程圖;
圖2是根據另一示例性實施例示出的一種音頻信息處理的方法的流程圖;
圖3是根據一示例性實施例示出的一種音頻信息處理的方法的步驟s13流程圖;
圖4是根據另一示例性實施例示出的一種音頻信息處理的方法的步驟s13的流程圖;
圖5是根據一示例性實施例示出的一種音頻信息處理的方法的步驟s14的流程圖;
圖6是根據一示例性實施例示出的一種音頻信息處理的裝置的框圖;
圖7是根據另一示例性實施例示出的一種音頻信息處理的裝置的框圖;
圖8是根據一示例性實施例示出的一種音頻信息處理的裝置的監測模塊63的框圖;
圖9是根據另一示例性實施例示出的一種音頻信息處理的裝置的監測模塊63的框圖;
圖10是根據一示例性實施例示出的一種音頻信息處理的裝置的判斷模塊64的框圖;
圖11是根據另一示例性實施例示出的一種音頻信息處理的裝置的框圖。
具體實施方式
這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本公開相一致的所有實施方式。相反,它們僅是與如所附權利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
圖1是根據一示例性實施例示出的一種音頻信息處理方法的流程圖,如圖1所示,該音頻信息處理的方法,包括以下步驟s11-s15:
在步驟s11中,接收輸入的音頻信息;
在步驟s12中,將所述音頻信息轉化為相應的文本信息;
在步驟s13中,實時監測終端接收到的手勢信息;
在步驟s14中,判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配;
在步驟s15中,當匹配時,將所述文本信息按照所述預設的文件格式存儲。
在一個實施例中,接收輸入的音頻信息之前,先設置默認的文件格式;接收輸入的音頻信息;將該音頻信息轉化為相應的文本信息;該將該音頻信息轉化為相應的文本信息之后,當未監測到該手勢信息時、或者當該接收到的手勢信息與預設的文件格式對應的存儲操作信息不匹配時,將該文本信息按照該默認的文件格式存儲。
實時監測終端接收到的手勢信息;該手勢信息包括終端的運動狀態信息和/或終端的觸控狀態信息;實時監測該終端的運動狀態信息包括:實時通過該終端中內置的重力傳感器、陀螺儀中的任一者多者監測該終端的運動狀態信息;或者實時獲取外部攝像頭攝取到的該終端的圖像,對該圖像中的終端進行位置分析,根據分析結果確定該終端的運動狀態信息;或者實時監測外部回聲定位裝置得到的該終端的回聲定位信息,對該終端的回聲定位信息進行分析,根據分析結果確定該終端的運動狀態信息。實時監測該終端的觸控狀態信息包括:實時監測該終端的預設按鍵、觸摸屏幕中的任一者或多者的觸控狀態信息。當該接收到的手勢信息與預設的文件格式對應的存儲操作信息匹配時,將該文本信息按照該預設的文件格式存儲。
實時獲取終端接收到的手勢信息;判斷該手勢信息是否滿足預設啟動條件;當該手勢信息未滿足預設啟動條件時,舍棄該手勢信息。篩選出該終端的手勢信息與預設的存儲文件格式對應的存儲操作信息庫中匹配度最高的存儲操作信息;當該匹配度最高的存儲操作信息的匹配度的數值大于預設的匹配度閾值時,確定該手勢信息與該存儲操作信息相匹配;當該手勢信息與該存儲操作信息相匹配時,將該文本信息按照該預設的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:在處理音頻信息的文檔格式轉換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
在一個實施例中,如圖2所示,在執行步驟s11之前,可執行如下步驟s21:
在步驟s21中,設置默認的文件格式;
在執行步驟s12之后,還可執行如下步驟s22:
在步驟s22中,當未監測到所述手勢信息時或者當所述接收到的手勢信息與預設的文件格式對應的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
舉例而言,在接收輸入的音頻信息之前,提前設置默認的文件格式,通過該默認的文件格式來存儲文本信息。在音頻信息轉化為相應的文本信息之后,當未監測到手勢信息時、或者當接收到的手勢信息與預設的文件格式對應的存儲操作信息不匹配時,將該文本信息按照所述默認的文件格式存儲。
例如,在開始接收輸入的音頻信息之前,提前設置默認的文件格式為pdf。在開始音頻信息轉化為相應的文本信息之后,在未檢測到手勢信息、或接收到的手勢信息與預設的文件格式對應的存儲操作信息不匹配時,將該文本信息按照pdf的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:設置默認的文件格式可以在用戶未能及時的設置文件格式的情況下,妥善的保存音頻信息轉化的文本信息。
在一個實施例中,如圖3所示,步驟13包括步驟s31或s32:
在步驟s31中,實時監測所述終端的運動狀態信息包括:實時通過所述終端中內置的重力傳感器、陀螺儀中的任一者多者監測所述終端的運動狀態信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據分析結果確定所述終端的運動狀態信息;或者實時監測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據分析結果確定所述終端的運動狀態信息。
在步驟s32中,實時監測所述終端的觸控狀態信息包括:實時監測所述終端的預設按鍵、觸摸屏幕中的任一者或多者的觸控狀態信息。
在一個實施例中,該手勢信息包括終端的運動狀態信息和/或終端的觸控狀態信息。
實時監測終端接收到的手勢信息的方式分為三種:實時監測終端的運動狀態信息、實時監測終端的觸控狀態信息、實時監測終端的運動狀態信息和觸控狀態信息。
第一種實時監測終端接收到的手勢信息的方式:實時監測該終端的運動狀態信息可以根據終端內置的感應裝置比如重力傳感器和/或陀螺儀來進行監測。陀螺儀可以根據測量終端相對慣性空間的轉動運動信息,可以測量終端的偏轉、傾斜時的轉動角速度。重力傳感器可以監測軸向的線性動作信息,能夠感知到加速力的變化;獲取終端的運動狀態信息還可以根據外設的攝像頭來拍攝終端的運動狀態信息,根據圖像分析處理方法,首先通過終端的形狀特征、顏色特征、角點特征和紋理特征中的一種或多種,來分析出拍攝的整幅畫面中終端的圖像信息,根據拍攝到的多幀圖像中的終端的圖像信息,連續分析在多幀畫面中終端的位置變換信息,從而得到終端的運動狀態信息;獲取終端的運動狀態信息還可以根據外設的回聲定位設備,利用定位設備發射出超聲波,通過折回的聲音來定向,即通過空間定向的方法來獲得終端的位置信息,然后通過在一個連續時間內的回聲定位信息來獲得終端的運動狀態信息。
第二種實時監測終端接收到的手勢信息的方式:實時監測終端的觸控狀態信息可通過實時監控終端的預設按鍵和觸摸屏幕中的任一者或多者的觸控狀態信息。觸控狀態信息包括:雙擊、長按和預設的滑動軌跡。例如,通過監檢預設按鍵是否發生了雙擊事件或者是長按事件;通過該監測觸摸屏幕上是否發生了“l”型的觸控滑動軌跡;在監測到預設按鍵發了長按事件的同時,檢測觸摸屏幕上是否發生了“z”型的觸控滑動軌跡。
第三種實時監測終端接收到的手勢信息的方式:通過對上述的第一種實時監測終端接收到的手勢信息的方式和第二種實時監測終端接收到的手勢信息的方式的有機結合,即可得到第三種實時監測終端接收到的手勢信息的方式。
本公開的實施例提供的技術方案可以包括以下有益效果:可以通過多種方式來獲得終端的手勢信息,增強了獲取終端的手勢信息的魯棒性,提升了本技術方案在各種應用情景下的適用度。
在一個實施例中,如圖4所示,步驟13包括如下步驟s41-s44:
在步驟s41中,實時獲取終端接收到的手勢信息;
在步驟s42中,判斷所述接收到的手勢信息是否滿足預設啟動條件,當未滿足時,執行步驟s43,當滿足時執行步驟s44;
在步驟s43中,當所述接收到的手勢信息未滿足預設啟動條件時,舍棄所述接收到的手勢信息;
在步驟s44中,當所述接收到的手勢信息滿足預設啟動條件時,繼續執行判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配的步驟。
舉例而言,在一個實施例中,監測終端獲得的運動狀態信息和終端的觸控狀態信息中包含了很多由于用戶握持終端時不自覺的微抖動所產生的運動狀態信息和用戶無意中的觸控所產生的觸控狀態信息,且用戶無法避免在握持終端時不發生輕微的抖動和發生無意中的觸控,這些微抖動和無意中的觸控所產生的手勢信息并非是由用戶的操作意圖所產生的。
目前在業界,廣泛應用在拍攝設備上的防抖動功能就是針對人們在握持設備下的微抖動而設計的,通過各種方法來補償人在握持設備時抖動而產生的誤差,來達到克服微抖動所帶來的影響。在本方案中不需要專門設計一套防抖動功能來克服人們在握持設備時發生的微抖動,只需要合理設計預設啟動條件來排除因為微抖動而產生的運動狀態信息即可,例如:設置預設啟動條件為達到預設運動狀態信息閾值。當監測得到終端的運動狀態信息未滿足預設啟動條件,舍棄該運動狀態信息。對于無意中發生的觸控也可以通過設置預設啟動條件,例如長按時長的合理區間、雙擊的間隔時長和預設的滑動距離。當監測得到終端的觸控狀態信息未滿足預設啟動條件,舍棄該觸控狀態信息。
本公開的實施例提供的技術方案可以包括以下有益效果:克服了因為人手握持時抖動所產生的運動狀態信息的干擾和無意中的觸控所產生的觸控狀態信息,降低了非用戶操作意圖而產生的手勢信息的干擾,提高了本方案的實用性和用戶的操作體驗。
在一個實施例中,如圖5所示,步驟14還包括如下步驟s51-s53:
在步驟s51中,篩選出所述終端的手勢信息與預設的存儲文件格式對應的存儲操作信息庫中匹配度最高的存儲操作信息;
在步驟s52中,當所述匹配度最高的存儲操作信息的匹配度的數值大于預設的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
在步驟s53中,當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預設的文件格式存儲。
在預設的存儲文件格式對應的存儲操作信息庫中,根據該終端的手勢信息,進行匹配,篩選出匹配度最高的存儲操作信息,該存儲操作信息用來更改存儲文檔的文件格式。
根據系統預設的匹配度閾值來排除匹配度過低的存儲操作信息。當該匹配度最高的存儲操作信息的匹配度的數值大于預設的匹配度閾值時,才確定該手勢信息與所述存儲操作信息相匹配。當該匹配度最高的存儲操作信息的匹配度的數值小于等于預設的匹配度閾值時,確定該手勢信息與所述存儲操作信息不匹配。
當該手勢信息與該存儲操作信息相匹配時,將該文本信息按照該預設的文件格式存儲。
在本技術方案中,可選的,當手勢信息與存儲操信息作相匹配后,將文本信息按照預設的文檔格式存儲。其中,該文本信息可包括所有的文本信息,還可包括在該手勢信息與該存儲操作信息相匹配之后產生的文本信息。
主要文檔格式包括:.txt(純文字文檔)、.rtf(豐富文本格式)、.doc(微軟word文檔)、.xls(微軟excel表格)、.ppt(微軟powerpoint演示文稿)、.htm/html(網頁)、.wpd(corelwordperfect文檔)以及.pdf(可移植文檔格式)等。
本公開的實施例提供的技術方案可以包括以下有益效果:排除匹配度過低的手勢信息的干擾,可提升終端的手勢信息的準確度。
在一個實施例中,圖6是根據一示例性實施例示出的一種音頻信息處理的框圖。如圖6所示,該裝置包括接收模塊61、轉化模塊62、監測模塊63、第一存儲模塊64和第一存儲模塊65。
該接收模塊61被配置為接收輸入的音頻信息;
該轉化模塊62被配置為將所述音頻信息轉化為相應的文本信息;
該監測模塊63被配置為實時監測終端接收到的手勢信息;
該判斷模塊64被配置為判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配;
該第一存儲模塊65被配置為當匹配時,將所述文本信息按照所述預設的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:本公開的實施例提供的技術方案可以包括以下有益效果:該技術方案在音頻信息處理的文檔格式轉換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
在一個實施例中,如圖7所示,還包括設置模塊71和計算子模塊72:
該設置模塊71被配置為在所述接收輸入的音頻信息之前,設置默認的文件格式;
該第二存儲模塊72被配置為在將所述音頻信息轉化為相應的文本信息之后,當未監測到所述手勢信息時或者當所述接收到的手勢信息與預設的文件格式對應的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:設置默認的文件格式可以在用戶未能及時的設置文件格式的情況下,妥善的保存音頻信息轉化的文本信息。
在一個實施例中,如圖8所示,該監測模塊63包括第二獲取模塊81和第二判斷模塊82:
該第一監測子模塊81被配置為實時監測所述終端的運動狀態信息包括:實時通過所述終端中內置的重力傳感器、陀螺儀中的任一者多者監測所述終端的運動狀態信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據分析結果確定所述終端的運動狀態信息;或者實時監測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據分析結果確定所述終端的運動狀態信息。
該第二監測子模塊82被配置為實時監測所述終端的觸控狀態信息包括:實時監測所述終端的預設按鍵、觸摸屏幕中的任一者或多者的觸控狀態信息。
本公開的實施例提供的技術方案可以包括以下有益效果:通過多種方式來獲得終端的手勢信息,增強了獲取終端的手勢信息的魯棒性,提升了本技術方案在各種應用情景下的適用度。
在一個實施例中,如圖9所示,該第一存儲模塊64包括獲取子模塊91、第一判斷子模塊92、舍棄子模塊93和第二判斷子模塊94:
該獲取子模塊91被配置為實時獲取終端接收到的手勢信息;
該第一判斷子模塊92被配置為判斷所述接收到的手勢信息是否滿足預設啟動條件;
該舍棄子模塊93被配置為當所述接收到的手勢信息未滿足預設啟動條件時,舍棄所述接收到的手勢信息;
該第二判斷子模塊94被配置為當所述接收到的手勢信息滿足預設啟動條件時,繼續執行判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配的步驟。
本公開的實施例提供的技術方案可以包括以下有益效果:克服了因為人手握持時抖動所產生的運動狀態信息的干擾和無意中的觸控所產生的觸控狀態信息,降低了非用戶操作意圖而產生的手勢信息的干擾,提高了本方案的實用性和用戶的操作體驗。
在一個實施例中,如圖10所示,該第一存儲模塊64還包括篩選子模塊101、確定子模塊102和存儲子模塊103:
該篩選子模塊101被配置為篩選出所述終端的手勢信息與預設的存儲文件格式對應的存儲操作信息庫中匹配度最高的存儲操作信息;
該確定子模塊102被配置為當所述匹配度最高的存儲操作信息的匹配度的數值大于預設的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
該存儲子模塊103被配置為當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預設的文件格式存儲。
本公開的實施例提供的技術方案可以包括以下有益效果:排除匹配度過低的手勢信息的干擾,可以提升終端的手勢信息的準確度。
根據本公開實施例的第三方面,提供一種音頻信息處理的裝置,包括:
處理器;
用于存儲處理器可執行指令的存儲器;
其中,處理器被配置為:
接收輸入的音頻信息;
將所述音頻信息轉化為相應的文本信息;
實時監測終端接收到的手勢信息;
判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配;
當匹配時,將所述文本信息按照所述預設的文件格式存儲。
上述處理器還可被配置為:
所述接收輸入的音頻信息之前,所述方法還包括:
設置默認的文件格式;
所述將所述音頻信息轉化為相應的文本信息之后,所述方法還包括:
當未監測到所述手勢信息時或者當所述接收到的手勢信息與預設的文件格式對應的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
所述實時監測終端接收到的手勢信息,包括:
所述手勢信息包括終端的運動狀態信息和/或終端的觸控狀態信息;
實時監測所述終端的運動狀態信息包括:實時通過所述終端中內置的重力傳感器、陀螺儀中的任一者多者監測所述終端的運動狀態信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據分析結果確定所述終端的運動狀態信息;或者實時監測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據分析結果確定所述終端的運動狀態信息;
實時監測所述終端的觸控狀態信息包括:實時監測所述終端的預設按鍵、觸摸屏幕中的任一者或多者的觸控狀態信息。
所述實時監測終端接收到的手勢信息,包括:
實時獲取終端接收到的手勢信息;
判斷所述接收到的手勢信息是否滿足預設啟動條件;
當所述接收到的手勢信息未滿足預設啟動條件時,舍棄所述接收到的手勢信息;
當所述接收到的手勢信息滿足預設啟動條件時,繼續執行判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配的步驟
所述當所述接收到的手勢信息與預設的文件格式對應的存儲操作信息匹配時,將所述文本信息按照所述預設的文件格式存儲,包括:
篩選出所述終端的手勢信息與預設的存儲文件格式對應的存儲操作信息庫中匹配度最高的存儲操作信息;
當所述匹配度最高的存儲操作信息的匹配度的數值大于預設的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預設的文件格式存儲。
圖11是根據一示例性實施例示出的一種用于音頻信息處理的裝置1200的框圖,該裝置適用于終端設備。例如,裝置1200可以是移動電話,計算機,數字廣播終端,消息收發設備,游戲控制臺,平板設備,醫療設備,健身設備,個人數字助理等。
參照圖11,裝置1200可以包括以下一個或多個組件:處理組件1202,存儲器1204,電源組件1206,多媒體組件1208,音頻組件1210,輸入/輸出(i/o)的接口1212,傳感器組件1214,以及通信組件1216。
處理組件1202通常控制裝置1200的整體操作,諸如與顯示,電話呼叫,數據通信,相機操作和記錄操作相關聯的操作。處理元件1202可以包括一個或多個處理器1220來執行指令,以完成上述的方法的全部或部分步驟。此外,處理組件1202可以包括一個或多個模塊,便于處理組件1202和其他組件之間的交互。例如,處理部件1202可以包括多媒體模塊,以方便多媒體組件1208和處理組件1202之間的交互。
存儲器1204被配置為存儲各種類型的數據以支持在設備1200的操作。這些數據的示例包括用于在裝置1200上操作的任何應用程序或方法的指令,聯系人數據,電話簿數據,消息,圖片,視頻等。存儲器1204可以由任何類型的易失性或非易失性存儲設備或者它們的組合實現,如靜態隨機存取存儲器(sram),電可擦除可編程只讀存儲器(eeprom),可擦除可編程只讀存儲器(eprom),可編程只讀存儲器(prom),只讀存儲器(rom),磁存儲器,快閃存儲器,磁盤或光盤。
電源組件1206為裝置1200的各種組件提供電力。電源組件1206可以包括電源管理系統,一個或多個電源,及其他與為裝置1200生成、管理和分配電力相關聯的組件。
多媒體組件1208包括在所述裝置1200和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(lcd)和觸摸面板(tp)。如果屏幕包括觸摸面板,屏幕可以被實現為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還監測與所述觸摸或滑動操作相關的持續時間和壓力。在一些實施例中,多媒體組件1208包括一個前置攝像頭和/或后置攝像頭。當設備1200處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數據。每個前置攝像頭和后置攝像頭可以是一個固定的光學透鏡系統或具有焦距和光學變焦能力。
音頻組件1210被配置為輸出和/或輸入音頻信號。例如,音頻組件1210包括一個麥克風(mic),當裝置1200處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器1204或經由通信組件1216發送。在一些實施例中,音頻組件1210還包括一個揚聲器,用于輸出音頻信號。
i/o接口1212為處理組件1202和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
傳感器組件1214包括一個或多個傳感器,用于為裝置1200提供各個方面的狀態評估。例如,傳感器組件1214可以監測到設備1200的打開/關閉狀態,組件的相對定位,例如所述組件為裝置1200的顯示器和小鍵盤,傳感器組件1214還可以監測裝置1200或裝置1200一個組件的位置改變,用戶與裝置1200接觸的存在或不存在,裝置1200方位或加速/減速和裝置1200的溫度變化。傳感器組件1214可以包括接近傳感器,被配置用來在沒有任何的物理接觸時監測附近物體的存在。傳感器組件1214還可以包括光傳感器,如cmos或ccd圖像傳感器,用于在成像應用中使用。在一些實施例中,該傳感器組件1214還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件1216被配置為便于裝置1200和其他設備之間有線或無線方式的通信。裝置1200可以接入基于通信標準的無線網絡,如wifi,2g或3g,或它們的組合。在一個示例性實施例中,通信部件1216經由廣播信道接收來自外部廣播管理系統的廣播信號或廣播相關信息。在一個示例性實施例中,所述通信部件1216還包括近場通信(nfc)模塊,以促進短程通信。例如,在nfc模塊可基于射頻識別(rfid)技術,紅外數據協會(irda)技術,超寬帶(uwb)技術,藍牙(bt)技術和其他技術來實現。
在示例性實施例中,裝置1200可以被一個或多個應用專用集成電路(asic)、數字信號處理器(dsp)、數字信號處理設備(dspd)、可編程邏輯器件(pld)、現場可編程門陣列(fpga)、控制器、微控制器、微處理器或其他電子元件實現,用于執行上述方法。
在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質,例如包括指令的存儲器1204,上述指令可由裝置1200的處理器820執行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質可以是rom、
一種非臨時性計算機可讀存儲介質,當所述存儲介質中的指令由裝置1200的處理器執行時,使得裝置1200能夠執行圖1所示的方法,所述方法包括:
接收輸入的音頻信息;
將所述音頻信息轉化為相應的文本信息;
實時監測終端接收到的手勢信息;
判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配;
當匹配時,將所述文本信息按照所述預設的文件格式存儲。
所述存儲介質中的指令還可以包括:
所述接收輸入的音頻信息之前,所述方法還包括:
設置默認的文件格式;
所述將所述音頻信息轉化為相應的文本信息之后,所述方法還包括:
當未監測到所述手勢信息時或者當所述接收到的手勢信息與預設的文件格式對應的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
所述實時監測終端接收到的手勢信息,包括:
所述手勢信息包括終端的運動狀態信息和/或終端的觸控狀態信息;
實時監測所述終端的運動狀態信息包括:實時通過所述終端中內置的重力傳感器、陀螺儀中的任一者多者監測所述終端的運動狀態信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據分析結果確定所述終端的運動狀態信息;或者實時監測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據分析結果確定所述終端的運動狀態信息;
實時監測所述終端的觸控狀態信息包括:實時監測所述終端的預設按鍵、觸摸屏幕中的任一者或多者的觸控狀態信息。
所述實時監測終端接收到的手勢信息,包括:
實時獲取終端接收到的手勢信息;
判斷所述接收到的手勢信息是否滿足預設啟動條件;
當所述接收到的手勢信息未滿足預設啟動條件時,舍棄所述接收到的手勢信息;
當所述接收到的手勢信息滿足預設啟動條件時,繼續執行判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配的步驟。
所述判斷所述接收到的手勢信息與預設的文件格式對應的存儲操作信息是否匹配,包括:
篩選出所述終端的手勢信息與預設的存儲操作格式對應的存儲操作信息庫中匹配度最高的存儲操作信息;
當所述匹配度最高的存儲操作信息的匹配度的數值大于預設的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預設的文件格式存儲。
本領域技術人員在考慮說明書及實踐這里公開的公開后,將容易想到本公開的其它實施方案。本公開旨在涵蓋本公開的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本公開的一般性原理并包括本公開未公開的本技術領域中的公知常識或慣用技術手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權利要求指出。
應當理解的是,本公開并不局限于上面已經描述并在附圖中示出的精確結構,并且可以在不脫離其范圍進行各種修改和改變。本公開的范圍僅由所附的權利要求來限制。