本公開涉及數據處理,尤其涉及一種網絡安全檢索的方法及裝置、電子設備和存儲介質。
背景技術:
1、數據庫是一個長期存儲在計算機內的、有組織的、可共享的、統一管理的大量數據的集合,因此,所述數據庫是存放數據的倉庫。
2、在進行所述數據庫的網絡安全檢索技術方面,主要通過將加密關鍵字索引和加密后的數據索引進行匹配,得到加密的目標數據,但是采用前述方式對所述目標數據進行檢索時,存在檢索結果不準確的問題。
技術實現思路
1、本公開提供了一種網絡安全檢索的方法及裝置、電子設備和存儲介質。其主要目的在于解決使用現有檢索方式對目標數據進行檢索,存在檢索結果不準確的問題。
2、根據本公開的第一方面,提供了一種網絡安全檢索的方法,其中,包括:
3、將加密數據劃分為第一預設數量的數據層;
4、分別將各所述數據層中的所述加密數據按照所述加密數據的數據特性分配至所述數據層對應的目標子分層,不同數據層所分配的目標子分層的數量相同或不同;
5、對每個所述目標子分層中的所述加密數據進行詞語提取,得到目標提取詞語集合;
6、在所述目標提取詞語集合中獲取對所述加密數據進行檢索的關鍵詞集合,以便根據所述關鍵詞集合對所述加密數據進行檢索。
7、可選的,所述對每個目標子分層中存在的加密數據進行詞語提取,得到目標提取詞語集合包括:
8、將每個所述目標子分層中的所述加密數據與所述數據層進行對應,標記對應完成的所述加密數據為對應數據;
9、對所述對應數據中的類型語句進行分詞操作,得到類型語句中的提取詞語,其中,將每個所述目標子分層中存在的相同類型的所述加密數據進行集合,每個集合中的所述加密數據為類型語句;
10、確定每個所述提取詞語的詞語特征及每個所述提取詞語在所述類型語句中的語句特征;
11、根據預設詞條及每個所述提取詞語的所述詞語特征,確定所述提取詞語之間的第一相似度;
12、根據所述第一相似度及每個所述提取詞語在所述類型語句中的所述語句特征,確定所述提取詞語之間的第二相似度;
13、對所述第二相似度大于預設相似度的所述提取詞語進行去重復處理,得到目標提取詞語集合。
14、可選的,所述在所述目標提取詞語集合中獲取對所述加密數據進行檢索的關鍵詞集合包括:
15、將所述目標提取詞語集合中位置連續的所述提取詞語以文本最小單元進行拼接,得到拼接詞語;
16、根據詞性統計特征對所述拼接詞語進行清洗,得到所述關鍵詞集合,其中,所述詞性統計特征為將所述拼接詞語中的文本根據所述文本屬于實詞或虛詞進行特征分類,得到的分類結果;
17、根據每個所述目標子分層的所述關鍵詞集合確定所述加密數據中每一層包括的關鍵詞,并通過搜索引擎對每一層的所述關鍵詞進行關聯,以便對所述加密數據進行檢索。
18、可選的,在所述將加密數據分配至第一預設數量的數據層之前,所述方法還包括:
19、將明文數據分別通過第二預設數量的加密方式進行加密,得到所述第二預設數量的加密結果;所述第二預設數量的加密方式至少包含五種加密方式;
20、分別對所述第二預設數量的加密結果進行安全性分析,得到所述第二預設數量的分析加密結果;
21、將所述第二預設數量的所述分析加密結果中閾值最高的所述分析加密結果對應的加密結果確定為加密數據。
22、可選的,在所述將加密數據分配至第一預設數量的數據層之前,所述方法還包括:
23、獲取所述加密數據與數據傳輸平臺之間的通信信道,并將所述通信通道標記為目標通道;
24、對所述目標通道進行數據掃描,根據掃描結果確定所述目標通道的信道參數,其中,所述信道參數包括通信信道飽和度和當前通信信道剩余容量;
25、根據所述信道參數對所述目標通道設置專用的參數模型;
26、根據所述參數模型確定標準的數據包的數據量,所述數據量為傳輸一次所述加密數據的數據量。
27、可選的,在所述根據所述參數模型確定標準的數據包的數據量之后,所述方法包括:
28、獲取待傳輸的所述加密數據的整體數據量;
29、根據所述整體數據量和所述數據量設置所述加密數據的第一傳輸時間間隔;
30、基于所述第一傳輸時間間隔對所述加密數據進行傳輸。
31、可選的,所述基于所述第一傳輸時間間隔對所述加密數據進行傳輸包括:
32、按照所述標準數據包對應的所述數據量對所述加密數據進行數據包劃分,得到至少一個所述數據包,其中,所述數據包劃分過程中最后剩余的不滿一個或兩個完整的所述標準數據包對應的所述數據量時,按照不低于所述數據量下限值和不超過所述數據量上限值的原則進行隨機數據量的數據包劃分;
33、基于所述第一傳輸時間間隔對所述加密數據劃分為的所述數據包進行傳輸。
34、可選的,所述對所述加密數據劃分為的所述數據包進行傳輸包括:
35、實時監測對所述加密數據進行傳輸的所述目標通道的通信信道剩余容量,并將所述通信信道剩余容量與預設的剩余容量閾值進行比較,獲得比較結果;
36、若所述比較結果表明所述通信信道剩余容量超過預設的剩余容量閾值,則按照所述第一傳輸時間間隔持續進行所述數據包的傳輸。
37、可選的,若所述比較結果表明所述通信信道剩余容量未超過預設的剩余容量閾值,則利用傳輸速度自適應調整模型對所述第一傳輸時間間隔進行實時自適應調整,并按照調整后的第二傳輸時間間隔持續進行所述數據包的傳輸。
38、根據本公開的第二方面,提供了一種網絡安全檢索的裝置,包括:
39、劃分單元,用于將加密數據劃分為第一預設數量的數據層;
40、分配單元,用于分別將各所述數據層中的所述加密數據按照所述加密數據的數據特性分配至所述數據層對應的目標子分層,不同數據層所分配的目標子分層的數量相同或不同;
41、提取單元,用于對每個所述目標子分層中的所述加密數據進行詞語提取,得到目標提取詞語集合;
42、第一獲取單元,用于在所述目標提取詞語集合中獲取對所述加密數據進行檢索的關鍵詞集合,以便根據所述關鍵詞集合對所述加密數據進行檢索。
43、可選的,所述提取單元包括:
44、對應模塊,用于將每個所述目標子分層中的所述加密數據與所述數據層進行對應,標記對應完成的所述加密數據為對應數據;
45、分詞模塊,用于對所述對應數據中的類型語句進行分詞操作,得到類型語句中的提取詞語,其中,將每個所述目標子分層中存在的相同類型的所述加密數據進行集合,每個集合中的所述加密數據為類型語句;
46、第一確定模塊,用于確定每個所述提取詞語的詞語特征及每個所述提取詞語在所述類型語句中的語句特征;
47、第二確定模塊,用于根據預設詞條及每個所述提取詞語的所述詞語特征,確定所述提取詞語之間的第一相似度;
48、第三確定模塊,用于根據所述第一相似度及每個所述提取詞語在所述類型語句中的所述語句特征,確定所述提取詞語之間的第二相似度;
49、去重模塊,用于對所述第二相似度大于預設相似度的所述提取詞語進行去重復處理,得到目標提取詞語集合。
50、可選的,所述第一獲取單元包括:
51、拼接模塊,用于將所述目標提取詞語集合中位置連續的所述提取詞語以文本最小單元進行拼接,得到拼接詞語;
52、清洗模塊,用于根據詞性統計特征對所述拼接詞語進行清洗,得到所述關鍵詞集合,其中,所述詞性統計特征為將所述拼接詞語中的文本根據所述文本屬于實詞或虛詞進行特征分類,得到的分類結果;
53、確定模塊,用于根據每個所述目標子分層的所述關鍵詞集合確定所述加密數據中每一層包括的關鍵詞,并通過搜索引擎對每一層的所述關鍵詞進行關聯,以便對所述加密數據進行檢索。
54、可選的,所述裝置還包括:
55、加密單元,用于將明文數據分別通過第二預設數量的加密方式進行加密,得到所述第二預設數量的加密結果;所述第二預設數量的加密方式至少包含五種加密方式;
56、分析單元,用于分別對所述第二預設數量的加密結果進行安全性分析,得到所述第二預設數量的分析加密結果;
57、第一確定單元,用于將所述第二預設數量的所述分析加密結果中閾值最高的所述分析加密結果對應的加密結果確定為加密數據。
58、可選的,所述裝置還包括:
59、標記單元,用于獲取所述加密數據與數據傳輸平臺之間的通信信道,并將所述通信通道標記為目標通道;
60、掃描單元,用于對所述目標通道進行數據掃描,根據掃描結果確定所述目標通道的信道參數,其中,所述信道參數包括通信信道飽和度和當前通信信道剩余容量;
61、第一設置單元,用于根據所述信道參數對所述目標通道設置專用的參數模型;
62、第二確定單元,用于根據所述參數模型確定標準的數據包的數據量,所述數據量為傳輸一次所述加密數據的數據量。
63、可選的,所述裝置包括:
64、第二獲取單元,用于獲取待傳輸的所述加密數據的整體數據量;
65、第二設置單元,用于根據所述整體數據量和所述數據量設置所述加密數據的第一傳輸時間間隔;
66、傳輸單元,用于基于所述第一傳輸時間間隔對所述加密數據進行傳輸。
67、可選的,所述傳輸單元包括:
68、劃分模塊,用于按照所述標準數據包對應的所述數據量對所述加密數據進行數據包劃分,得到至少一個所述數據包,其中,所述數據包劃分過程中最后剩余的不滿一個或兩個完整的所述標準數據包對應的所述數據量時,按照不低于所述數據量下限值和不超過所述數據量上限值的原則進行隨機數據量的數據包劃分;
69、傳輸模塊,用于基于所述第一傳輸時間間隔對所述加密數據劃分為的所述數據包進行傳輸。
70、可選的,所述傳輸模塊還用于:
71、實時監測對所述加密數據進行傳輸的所述目標通道的通信信道剩余容量,并將所述通信信道剩余容量與預設的剩余容量閾值進行比較,獲得比較結果;
72、若所述比較結果表明所述通信信道剩余容量超過預設的剩余容量閾值,則按照所述第一傳輸時間間隔持續進行所述數據包的傳輸。
73、可選的,所述傳輸模塊還用于:
74、若所述比較結果表明所述通信信道剩余容量未超過預設的剩余容量閾值,則利用傳輸速度自適應調整模型對所述第一傳輸時間間隔進行實時自適應調整,并按照調整后的第二傳輸時間間隔持續進行所述數據包的傳輸。
75、根據本公開的第三方面,提供了一種電子設備,包括:
76、至少一個處理器;以及
77、與所述至少一個處理器通信連接的存儲器;其中,
78、所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行前述第一方面所述的方法。
79、根據本公開的第四方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行前述第一方面所述的方法。
80、根據本公開的第五方面,提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現如前述第一方面所述的方法。
81、本公開提供的網絡安全檢索的方法、裝置、電子設備和存儲介質,將加密數據劃分為第一預設數量的數據層;分別將各所述數據層中的所述加密數據按照所述加密數據的數據特性分配至所述數據層對應的目標子分層,不同數據層所分配的目標子分層的數量相同或不同;對每個所述目標子分層中的所述加密數據進行詞語提取,得到目標提取詞語集合;在所述目標提取詞語集合中獲取對所述加密數據進行檢索的關鍵詞集合,以便根據所述關鍵詞集合對所述加密數據進行檢索。與相關技術相比,通過對每個所述目標子分層進行詞語提取,得到所述目標提取詞語集合,并根據所述目標提取詞語集合獲取對所述加密數據進行檢索的關鍵詞集合,基于所述關鍵詞集合對所述加密數據進行檢索,可以更快更準確的檢索到所需的所述加密信息。
82、應當理解,本部分所描述的內容并非旨在標識本技術的實施例的關鍵或重要特征,也不用于限制本技術的范圍。本技術的其它特征將通過以下的說明書而變得容易理解。