本發明涉及計算機處理,尤其涉及一種信息匹配方法、裝置、電子設備以及存儲介質。
背景技術:
1、目前,在信息編輯的過程中,為了提高編輯效率可以在編輯過程中顯示與編輯信息相關聯的信息。
2、但是,相關聯信息的確定多是采用模糊匹配算法或者單純通過編輯距離來確定的,存在受常用詞或錯別字干擾導致存在匹配效果不佳的問題。
技術實現思路
1、本發明提供了一種信息匹配方法、裝置、電子設備以及存儲介質,以達到信息匹配的準確性以及高效性的效果。
2、根據本發明的一方面,提供了一種信息匹配方法,該方法包括:
3、通過對接收到的待匹配信息分詞處理,得到與所述待匹配信息相一致的至少一個待處理詞匯,其中,所述待匹配信息中至少包括文本和/或音頻;
4、依據預先確定的詞頻統計表分別確定所述至少一個待處理詞匯的出現頻次,其中,所述詞頻統計表是依據預先獲取的多個標準信息確定的;
5、依據所述至少一個待處理詞匯的出現頻次和預設詞頻范圍,從所述至少一個待處理詞匯中確定出至少一個關鍵詞;
6、從數據庫中調取與每個關鍵詞相對應至少一個候選信息,并確定所述候選信息與所述待匹配信息之間的匹配度,以基于所述匹配度確定與所述待匹配信息相匹配的至少一個目標信息;
7、其中,所述目標信息為所述多個標準信息中的信息。
8、進一步的,采用下述方式確定所述詞頻統計表:
9、獲取多個標準信息,并對所述標準信息分詞處理,得到多個待統計詞匯;
10、對每個待統計詞匯的出現頻次統計處理,得到所述待統計詞匯的出現頻次;
11、依據各待統計詞匯以及相應的出現頻次,確定所述詞頻統計表。
12、進一步的,所述依據所述至少一個待處理詞匯的出現頻次和預設詞頻范圍,從所述至少一個待處理詞匯中確定出至少一個關鍵詞,包括:
13、依據所述至少一個待處理詞匯的出現頻次從低往高的順序選擇第一數量的待調整詞匯,并確定所述待調整詞匯所對應的總頻次;
14、在所述總頻次在預設詞頻范圍之內時,將所述待調整詞匯作為關鍵詞。
15、進一步的,所述方法還包括:
16、若所述總頻次未在所述預設詞頻范圍之內時,調整所述第一數量,以基于更新后的所述第一數量確定待調整詞匯,并確定所述待調整詞匯的總頻次;
17、若所述總頻次依然未在所述預設詞頻范圍之內,則重復執行調整所述第一數量,以及確定待調整詞匯的步驟,直至所述總頻次在所述預設詞頻范圍之內。
18、進一步的,所述從數據庫中調取與每個關鍵詞相對應至少一個候選信息,包括:
19、對于每個關鍵詞,從數據庫中調取與所述關鍵詞相關聯的多個待使用候選信息;
20、將所有關鍵詞的待使用候選信息去重處理,得到所有關鍵詞所對應的至少一個候選信息。
21、進一步的,所述確定所述候選信息與所述待匹配信息之間的匹配度,以基于所述匹配度確定與所述待匹配信息相匹配的至少一個目標信息,包括:
22、基于相似度算法模型或者編輯距離確定模型分別確定所述待匹配信息與所述候選信息之間的匹配度;或,
23、基于預先訓練的匹配度確定模型對所述待匹配信息和候選信息匹配處理,得到所述待匹配信息和所述候選信息之間的匹配度;
24、從所述匹配度中篩選出預設數量的目標候選信息,并將所述目標候選信息作為所述目標信息。
25、進一步的,所述標準信息對應于企業/學校名稱,所述待匹配信息對應于用戶編輯的信息。
26、根據本發明的另一方面,提供了一種信息匹配裝置,該裝置包括:
27、待處理詞匯確定模塊,用于通過對接收到的待匹配信息分詞處理,得到與所述待匹配信息相一致的至少一個待處理詞匯,其中,所述待匹配信息中至少包括文本和/或音頻;
28、頻次確定模塊,用于依據預先確定的詞頻統計表分別確定所述至少一個待處理詞匯的出現頻次,其中,所述詞頻統計表是依據預先獲取的多個標準信息確定的;
29、關鍵詞確定模塊,用于依據所述至少一個待處理詞匯的出現頻次和預設詞頻范圍,從所述至少一個待處理詞匯中確定出至少一個關鍵詞;
30、目標信息確定模塊,用于從數據庫中調取與每個關鍵詞相對應至少一個候選信息,并確定所述候選信息與所述待匹配信息之間的匹配度,以基于所述匹配度確定與所述待匹配信息相匹配的至少一個目標信息;
31、其中,所述目標信息為所述多個標準信息中的信息。
32、根據本發明的另一方面,提供了一種電子設備,所述電子設備包括:
33、至少一個處理器;以及
34、與所述至少一個處理器通信連接的存儲器;其中,
35、所述存儲器存儲有可被所述至少一個處理器執行的計算機程序,所述計算機程序被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本發明實施例任一所述的信息匹配方法。
36、根據本發明的另一方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機指令,所述計算機指令用于使處理器執行時實現本發明實施例任一所述的信息匹配方法。
37、根據本發明的另一方面,提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時用于執行如本發明實施例任一所述的信息匹配方法。
38、本發明實施例所提供的技術方案,通過對接收到的待匹配信息分析處理,可以得到與待匹配信息相對應的至少一個待處理詞匯。對于每個待處理詞匯,可以依據預先確定的詞頻統計表,確定相應待處理詞匯所對應的出現頻次,進而依據出現頻次和預設詞頻范圍,從至少一個待處理詞匯中確定出關鍵詞。調取與關鍵詞相對應的候選信息,并根據候選信息與待匹配信息之間的匹配度,可以確定出與待匹配信息相對應的目標信息,解決了現有技術中采用數據庫模糊匹配或者單純采用編輯距離來確定目標信息時,存在效果不佳的問題,實現了提高確定目標信息準確率的效果。
39、應當理解,本部分所描述的內容并非旨在標識本發明的實施例的關鍵或重要特征,也不用于限制本發明的范圍。本發明的其它特征將通過以下的說明書而變得容易理解。
1.一種信息匹配方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,采用下述方式確定所述詞頻統計表:
3.根據權利要求1所述的方法,其特征在于,所述依據所述至少一個待處理詞匯的出現頻次和預設詞頻范圍,從所述至少一個待處理詞匯中確定出至少一個關鍵詞,包括:
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
5.根據權利要求1所述的方法,其特征在于,所述從數據庫中調取與每個關鍵詞相對應至少一個候選信息,包括:
6.根據權利要求1所述的方法,其特征在于,所述確定所述候選信息與所述待匹配信息之間的匹配度,以基于所述匹配度確定與所述待匹配信息相匹配的至少一個目標信息,包括:
7.根據權利要求1所述的方法,其特征在于,所述標準信息對應于企業/學校名稱,所述待匹配信息對應于用戶編輯的信息。
8.一種信息匹配裝置,其特征在于,包括:
9.一種電子設備,所述電子設備包括:
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機指令,所述計算機指令用于使處理器執行如權利要求1-7任一所述的信息匹配方法。