一種數據輸入校準的方法及終端的制作方法
【專利摘要】本發明實施例公開了一種數據輸入校準的方法及終端,用于提高終端將語音信息轉換為文字信息的準確性。本發明實施例方法包括:終端獲取語音信息,根據語音與文字的預設轉換表將語音信息轉換為對應文字信息,根據預設獲取規則獲取對應文字信息中的待校準文字,根據預設校準規則對待校準文字進行校準。這樣,終端在將語音信息轉換為對應文字信息后,還對該對應文字信息進行了智能判斷,并獲取該對應文字信息中待校準的文字,然后對該帶校準的文字進行校準,從而提高了終端轉換語音信息為文字信息的準確性,提高了用戶體驗。
【專利說明】
一種數據輸入校準的方法及終端
技術領域
[0001]本發明實施例涉及終端領域,尤其涉及一種數據輸入校準的方法及終端。【背景技術】
[0002]隨著科學技術的發展,語音識別技術可以被應用到很多場景,比如在進行會議時, 為了留住會議資料,往往需要將會議上談論的內容進行錄入,由于目前語音識別技術所轉換成的文字不夠準確,所以無法被應用到會議中的文字錄入,目前會議紀要進行錄入方式一般采取手工,即錄入員將自己聽到的會議內容進行手動輸入到電腦中,這將耗費很多的勞動力,而且對錄入員的效率要求比較高。由于現有技術中語音識別技術所識別出的文字不夠準確,導致了用戶體驗不高。
【發明內容】
[0003]本發明實施例提供了一種數據輸入校準的方法及終端,用于提高語音信息轉換為文字信息的準確性。
[0004]本發明實施例第一方面提供一種數據輸入校準的方法,包括:
[0005]獲取語音信息;[〇〇〇6]根據語音與文字的預設轉換表將語音信息轉換為對應文字信息;
[0007]根據預設獲取規則獲取對應文字信息中的待校準文字;
[0008]根據預設校準規則對待校準文字進行校準。
[0009]—種可能的實現方式中,根據預設獲取規則獲取對應文字信息中的待校準文字, 包括:
[0010]當語音信息在預設轉換表中對應的多種文字信息時,確定語音信息轉換的對應文字信息為待校準文字;
[0011]則根據預設獲取規則獲取對應文字信息中的待校準文字之后,還包括:
[0012]標記待校準文字。
[0013]另一種可能的實現方式中,根據預設獲取規則獲取對應文字信息中的待校準文字,包括:
[0014]獲取用戶輸入的選擇指令;
[0015]根據選擇指令選取對應文字信息,將用戶所選擇的文字確定為待校準文字。
[0016]另一種可能的實現方式中,根據預設校準規則對待校準文字進行校準,包括:
[0017]顯示語音信息對應的多種文字信息;
[0018]根據接收的選取指令選取多種文字信息中的文字;
[0019]將待校準文字替換為選取的文字。
[0020]另一種可能的實現方式中,對根據預設校準規則對待校準文字進行校準,包括:
[0021]接收用戶輸入的比對文字;
[0022]將待校準文字替換為用戶輸入的比對文字。
[0023]另一種可能的實現方式中,根據預設獲取規則獲取對應文字信息中的待校準文字,包括:[〇〇24]接收用戶輸入的比對文字;
[0025]檢測對應文字信息中是否存在與比對文字相匹配的文字,其中相匹配的文字與比對文字不一致;
[0026]當檢測結果為是時,確定相匹配的文字為待校準文字;[〇〇27]則對待校準文字進行校準,包括:
[0028]將待校準文字替換為用戶輸入的比對文字。
[0029]本發明實施例第二方面提供一種終端,包括:
[0030]獲取單元,用于獲取語音信息;
[0031]轉換單元,用于根據語音與文字的預設轉換表將語音信息轉換為對應文字信息;
[0032]獲取單元還用于,根據預設獲取規則獲取對應文字信息中的待校準文字;[〇〇33]校準單元,用于根據預設校準規則對待校準文字進行校準。[〇〇34] 一種可能的實現方式中,,獲取單元具體用于:
[0035]當語音信息在預設轉換表中對應的多種文字信息時,確定語音信息轉換的對應文字信息為待校準文字;[〇〇36] 終端還包括:[〇〇37]標記單元,用于標記待校準文字。
[0038]另一種可能的實現方式中,根獲取單元具體還用于:[〇〇39]獲取用戶輸入的選擇指令;
[0040]根據選擇指令選取對應文字信息,將用戶所選擇的文字確定為待校準文字。
[0041]另一種可能的實現方式中,校準單元具體用于:[〇〇42]接收用戶輸入的比對文字;
[0043]將待校準文字替換為用戶輸入的比對文字。
[0044]從以上技術方案可以看出,本發明實施例具有以下優點:本發明實施例中,終端獲取語音信息,根據語音與文字的預設轉換表將語音信息轉換為對應文字信息,根據預設獲取規則獲取對應文字信息中的待校準文字,根據預設校準規則對待校準文字進行校準。這樣,終端在將語音信息轉換為對應文字信息后,還對該對應文字信息進行了智能判斷,并獲取該對應文字信息中待校準的文字,然后對該帶校準的文字進行校準,從而提高了終端轉換語音信息為文字信息的準確性,提高了用戶體驗。【附圖說明】
[0045]圖1為本發明實施例中數據輸入校準的方法一個實施例示意圖;
[0046]圖2為本發明實施例中數據輸入校準的方法另一實施例示意圖;
[0047]圖3為本發明實施例中終端的一個實施例示意圖;
[0048]圖4為本發明實施例中終端的另一實施例示意圖。【具體實施方式】
[0049]本發明實施例提供了一種數據輸入校準的方法及終端,用于提高語音信息轉換為文字信息的準確性。
[0050]下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明實施例一部分實施例,而不是全部的實施例。基于本發明實施例中的實施例,本領域技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明實施例保護的范圍。
[0051]參照圖1所示,本發明實施例中數據輸入校準的方法的一個實施例包括:[〇〇52]101、獲取語音信息;
[0053]終端中,獲取語音信息具體可以包括兩種,一種是通過終端本身對聲音進行采集, 得到語音信息;另一種是接收到其它設備發送的語音信息。本發明實施例所述的數據輸入校準的方法適用于終端對實時采集的語音信息進行轉換為文字信息并校準的應用場景,也適用于終端對接收到的語音信息進行轉換為文字信息并校準的應用場景。
[0054]102、根據語音與文字的預設轉換表將所述語音信息轉換為對應文字信息;
[0055]終端執行將語音信息轉換為文字信息的指令下,獲取到語音信息后,則需要對該語音信息轉換為對應文字信息。具體的,終端需要根據語音與文字的預設轉換表中查找到所述語音信息所對應的文字信息,然后輸出所述對應的文字信息。該語音與文字的預設轉換表可以存儲在終端本地中,也可以存儲在遠端服務器中,該語音與文字的預設轉換表具體為,將語音以聲紋形式存儲,并將該聲紋所對應的文字與該聲紋建立對應關系。終端將獲取到的語音信息與所述預設轉換表中的語音信息進行匹配,找到相匹配的所述預設轉換表中的語音信息,并輸出所述預設轉換表中相匹配的語音信息的對應文字信息。
[0056]可選的,終端可以將語音信息進行整段轉換,或者分段轉換,具體的分段長度可以根據聲紋的長度或波動而定,比如根據預設的速率將聲紋分成兩個字的聲紋或者四個字的聲紋,又如根據聲紋波動,將每一次聲紋波動較大的點進行一次分段。
[0057]103、根據預設獲取規則獲取所述對應文字信息中的待校準文字;
[0058]由于終端只能根據語音信息的聲紋轉換為對應文字信息,然而在實際應用中,不同文字的讀音可能是一樣的,也就造成了不同文字的聲紋是一樣的。比如“他”、“她”、“它”, 這三個字指代了不同含義的第三稱呼,但是三者的讀音完全一樣,終端所錄入的聲紋也會是完全一樣的,從而導致終端所轉換的對應文字信息不準確。另一種情況中,當終端所獲取到的語音信息并非十分標準時,也將導致終端所轉換的文字信息不準確,比如該語音信息是一段地方方言,那么終端將很難轉換為準確的文字信息。因此,終端在轉換這種語音信息時,則無法確定具體所對應的文字信息,那么所轉換后的文字信息也將不準確,則需要對其進行校準。[〇〇59]104、根據預設校準規則對所述待校準文字進行校準。
[0060]在獲取待校準文字后,終端則根據預設校準規則對該待校準文字進行校準,將該待校準文字校準為準確的文字,使得輸出的文字為準確的文字,所述預設校準規則可以為人為設置,也可以為終端進行智能判斷獲取的。
[0061]本發明實施例中,終端獲取語音信息,根據語音與文字的預設轉換表將所述語音信息轉換為對應文字信息,根據預設獲取規則獲取所述對應文字信息中的待校準文字,根據預設校準規則對所述待校準文字進行校準。這樣,終端在將語音信息轉換為對應文字信息后,還對該對應文字信息進行了智能判斷,并獲取該對應文字信息中待校準的文字,然后對該帶校準的文字進行校準,從而提高了終端轉換語音信息為文字信息的準確性,提高了用戶體驗。
[0062]參照圖2所示,本發明實施例中數據輸入校準的方法的另一實施例包括:[〇〇63]201、獲取語音信息;[〇〇64]詳細內容參照步驟101所述。[〇〇65]202、根據語音與文字的預設轉換表將所述語音信息轉換為對應文字信息;[〇〇66]詳細內容參照步驟102所述。
[0067]203、當所述語音信息在所述預設轉換表中對應的多種文字信息時,確定所述語音信息轉換的所述對應文字信息為待校準文字;
[0068]如上述實施例所示內容,一個語音信息可能對應多種文字信息,比如“他”、“她”、 “它”所對應的語音信息相同,終端可能無法判斷出具體應該對應的文字,所以終端所輸出的對應文字可能不準確,此時終端在輸出一個文字信息后,同時確定所輸出的文字信息為待校準文字,待后續需要對該待校準的文字進行校準。比如,終端將一個語音信息轉換為對應文字信息“他”,由于該語音信息對應多種文字,所以終端確定所轉換的文字信息“他”為待校準文字。
[0069]另一種可能的實現方式中,由于語音本身并不標準而造成的終端所轉換的文字信息不準確,終端無法判斷出所轉換后的文字信息是不準確的。比如,該語音信息為一句方言,導致終端所轉換后的文字信息為“恰飯”,其實真正的含義是“吃飯”。這種情況下,終端也還可以獲取用戶輸入的選擇指令,并根據所述選擇指令選取所述對應文字信息,將用戶所選擇的文字確定為所述待校準文字。比如,終端輸出轉換的對應文字信息后,用戶瀏覽該對應文字信息,找到了“恰飯”不準確,因此用戶通過輸入手勢選擇指令選擇“恰飯”不準確, 需要進行校準。
[0070]另一種可能的實現方式中,在實時語音轉換過程中,終端在進行語音信息轉換為對應文字信息的同時,人工也可以同時進行文字錄入,但是人工可以只錄入比較難以轉換的文字,比如一些生僻字或者一些專業術語的文字,例如“P2P”,終端獲取到“P2P”的語音信息后,可能轉換為的文字信息為“P to P”,因此可以由人工來輸入比對文字,終端接收到該比對文字后,檢測所述對應文字信息中是否存在與所述比對文字相匹配的文字,其中所述相匹配的文字與所述比對文字不一致。比如,終端能夠將對比文字“P2P”與“P to P”進行匹配,由于兩者很相似,因此可以認為匹配成功,那么終端則可以直接將比對文字“P2P”替換該對應文字“P to P”。
[0071]204、標記所述待校準文字;
[0072]在終端確定待校準文字后,終端可以對該帶校準文字進行標記,比如比較為黃顏色的字體,使得用戶能夠快速觀察到待校準的文字,從而進行校準。[〇〇73]205、顯示所述語音信息對應的多種文字信息;
[0074]在終端確定待校準文字后,若這種情況為語音信息對應多種文字信息,那么終端會將該語音信息所對應的所有文字信息羅列顯示出來,以供用戶去選擇判斷。
[0075]206、根據接收的選取指令選取所述多種文字信息中的文字;[〇〇76]用戶在看到終端所羅列顯示的多種文字信息后,會將對該多種文字信息中正確的文字進行選擇,比如終端羅列了 “他”、“她”、“它”,用戶點擊“她”,從而輸入了選取指令。
[0077]207、將所述待校準文字替換為選取的所述文字;
[0078]終端在接收到用戶輸入的選取指令后,則根據用戶所選取的文字,替換該待校準的文字,比如,待校準文字為“他”,而用戶選取了 “她”,則將該帶校準文字“他”替換為“她”。 [〇〇79]另一種實現方式中,如步驟203所述,待校準文字為用戶所選擇的,因此終端可能無法羅列出準確的多種對應的文字信息,這種情況下,可以由用戶輸入比對文字進行校準。 比如,待校準文字為“恰飯”,終端接收到用戶輸入的比對文字為“吃飯”,那么終端則將待校準文字“恰飯”替換為“吃飯”。[0〇8〇]參照圖3所示,本發明實施例中終端的一個實施例包括:
[0081]獲取單元301,用于獲取語音信息;[〇〇82]詳細內容參照步驟101所述。
[0083]轉換單元302,用于根據語音與文字的預設轉換表將所述語音信息轉換為對應文字信息;[〇〇84]詳細內容參照步驟102所述。
[0085]所述獲取單元301還用于,根據預設獲取規則獲取所述對應文字信息中的待校準文字;[〇〇86]詳細內容參照步驟103所述。
[0087]校準單元303,用于根據預設校準規則對所述待校準文字進行校準。[〇〇88]詳細內容參照步驟104所述。
[0089]參照圖4所示,本發明實施例中終端的另一實施例包括:
[0090]獲取單元401,用于獲取語音信息;[〇〇91]詳細內容參照步驟201所述。
[0092]轉換單元402,用于根據語音與文字的預設轉換表將所述語音信息轉換為對應文字信息;[〇〇93]詳細內容參照步驟202所述。
[0094]所述獲取單元401還用于,當所述語音信息在所述預設轉換表中對應的多種文字信息時,確定所述語音信息轉換的所述對應文字信息為所述待校準文字;[〇〇95]詳細內容參照步驟203所述。
[0096]所述獲取單元401具體還用于:獲取用戶輸入的選擇指令;
[0097]根據所述選擇指令選取所述對應文字信息,將用戶所選擇的文字確定為所述待校準文字。[〇〇98]詳細內容參照步驟203所述。[〇〇99] 標記單元403,用于標記所述待校準文字;[〇1〇〇]詳細內容參照步驟204所述。
[0101]校準單元404用于:接收用戶輸入的比對文字,將所述待校準文字替換為用戶輸入的所述比對文字。
[0102]詳細內容參照步驟207所述。[〇1〇3]需要說明的是,本發明實施例中終端中所述的獲取單元、轉換單元、校準單元以及標記單元均可集成在處理器上實現,處理器包括中央處理器(Central Processing Unit, CPU)、專用集成電路(Applicat1n Specific Integrated Circuit,簡稱:ASIC)、現場可編程門陣列(Field—Programmable Gate Array,簡稱:FPGA)或者其他可編程邏輯器件等。本發明實施例中涉及的存儲單元可在存儲器上實現,存儲器可以包括易失性存儲器(英文: volatile memory),例如隨機存取存儲器(英文:random-access memory,縮寫:RAM)用于實現存儲單元中內存區域的功能;存儲器也可以包括非易失性存儲器(英文:non-volatile memory),例如只讀存儲器(英文:read-only memory,縮寫:ROM),快閃存儲器(英文:flash memory),硬盤(英文:hard disk drive,縮寫:HDD)或固態硬盤(英文:solid state drive, 縮寫:SSD),用于實現存儲單元中非易失性存儲區的功能;存儲器還可以包括上述種類的存儲器的組合。
[0104]所屬領域的技術人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統, 裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
[0105]在本發明實施例所提供的幾個實施例中,應該理解到,所揭露的系統,裝置和方法,可以通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統,或一些特征可以忽略,或不執行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。
[0106]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。
[0107]另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現,也可以采用軟件功能單元的形式實現。
[0108]所述集成的單元如果以軟件功能單元的形式實現并作為獨立的產品銷售或使用時,可以存儲在一個計算機可讀取存儲介質中。基于這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產品的形式體現出來,該計算機軟件產品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行本發明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
[0109]以上所述,以上實施例僅用以說明本發明的技術方案,而非對其限制;盡管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的精神和范圍。
【主權項】
1.一種數據輸入校準的方法,其特征在于,所述方法包括:獲取語音信息;根據語音與文字的預設轉換表將所述語音信息轉換為對應文字信息;根據預設獲取規則獲取所述對應文字信息中的待校準文字;根據預設校準規則對所述待校準文字進行校準。2.根據權利要求1所述的方法,其特征在于,所述根據預設獲取規則獲取所述對應文字 信息中的待校準文字,包括:當所述語音信息在所述預設轉換表中對應的多種文字信息時,確定所述語音信息轉換 的所述對應文字信息為所述待校準文字;則所述根據預設獲取規則獲取所述對應文字信息中的待校準文字之后,還包括:標記所述待校準文字。3.根據權利要求1所述的方法,其特征在于,所述根據預設獲取規則獲取所述對應文字 信息中的待校準文字,包括:獲取用戶輸入的選擇指令;根據所述選擇指令選取所述對應文字信息,將用戶所選擇的文字確定為所述待校準文字。4.根據權利要求2所述的方法,其特征在于,所述根據預設校準規則對所述待校準文字 進行校準,包括:顯示所述語音信息對應的多種文字信息;根據接收的選取指令選取所述多種文字信息中的文字;將所述待校準文字替換為選取的所述文字。5.根據權利要求1-3任一項所述的方法,其特征在于,所述對根據預設校準規則對所述 待校準文字進行校準,包括:接收用戶輸入的比對文字;將所述待校準文字替換為用戶輸入的所述比對文字。6.根據權利要求1所述的方法,其特征在于,所述根據預設獲取規則獲取所述對應文字 信息中的待校準文字,包括:接收用戶輸入的比對文字;檢測所述對應文字信息中是否存在與所述比對文字相匹配的文字,其中所述相匹配的 文字與所述比對文字不一致;當檢測結果為是時,確定所述相匹配的文字為所述待校準文字;則所述對所述待校準文字進行校準,包括:將所述待校準文字替換為用戶輸入的所述比對文字。7.—種終端,其特征在于,所述終端包括:獲取單元,用于獲取語音信息;轉換單元,用于根據語音與文字的預設轉換表將所述語音信息轉換為對應文字信息; 所述獲取單元還用于,根據預設獲取規則獲取所述對應文字信息中的待校準文字;校準單元,用于根據預設校準規則對所述待校準文字進行校準。8.根據權利要求7所述的終端,其特征在于,所述獲取單元具體用于:當所述語音信息在所述預設轉換表中對應的多種文字信息時,確定所述語音信息轉換 的所述對應文字信息為所述待校準文字;所述終端還包括:標記單元,用于標記所述待校準文字。9.根據權利要求7所述的終端,其特征在于,所述根獲取單元具體還用于:獲取用戶輸入的選擇指令;根據所述選擇指令選取所述對應文字信息,將用戶所選擇的文字確定為所述待校準文字。10.根據權利要求7至9任一項所述的終端,其特征在于,所述校準單元具體用于:接收用戶輸入的比對文字;將所述待校準文字替換為用戶輸入的所述比對文字。
【文檔編號】G10L15/26GK106022357SQ201610311414
【公開日】2016年10月12日
【申請日】2016年5月11日
【發明人】謝志強
【申請人】珠海市魅族科技有限公司