本發明涉及通信?,尤其涉及一種異常號碼檢測方法及裝置。
背景技術:
1、現階段異常號碼(指疑似具有詐騙、騷擾等違規行為的號碼,將確定具有詐騙、騷擾等違規行為的號碼稱為違規號碼)檢測主要是基于圖數據庫查詢通話關系的方法來實現。該方法中,為了更好的區分不同通話屬性關系的不同,通過構建通話關系知識圖譜,存儲號碼通話所蘊含的知識,并最終通過圖數據庫存儲知識圖譜。對于異常號碼,可通過查詢圖數據庫的方式,根據已有知識判斷是否為違規號碼;對于已知違規號碼,可以構建知識模型,根據知識模型從圖數據庫中檢測可能的違規號碼,即異常號碼。
2、上述方法可以存儲號碼之間的知識信息,判斷準確率較高,但是由于數據量巨大,會導致最終存儲的關系十分冗余,包含大量無法利用的知識,查詢效率低下,導致基于關系檢測異常號碼的效率低;而且該方法是在已知號碼違規特征基礎上進行異常號碼識別,而違規號碼的特征規則的制定需要大量的違規號碼樣本。在只有少量樣本違規號碼樣本的條件下,難以制定針對性的檢測規則檢測異常號碼,導致現有異常號碼檢測方法存在一定的局限性。
技術實現思路
1、本發明提供一種異常號碼檢測方法及裝置,用以解決現有技術的異常號碼檢測方法存在一定局限性,且異常號碼檢測效率低的問題。
2、本發明提供一種異常號碼檢測方法,包括以下步驟。
3、獲取一個檢測周期內的主叫號碼、被叫號碼以及表示主叫號碼和被叫號碼各屬性信息的結構化數據。
4、對所述結構化數據進行數據清洗,以去除構建三元組所需關鍵信息缺失的結構化數據。
5、構建通話三元組,所述通話三元組以主叫號碼和被叫號碼為實體,所述屬性信息為關系。
6、將具有相同關系的所述通話三元組轉換成通話關系圖。
7、將所述通話關系圖輸入圖神經網絡,得到所述圖神經網絡輸出的任一號碼在每個關系下對應的號碼節點嵌入,基于所有關系對應的號碼節點嵌入生成所述任一號碼對應的當前的總號碼節點嵌入。
8、基于所述當前的總號碼節點嵌入更新節點嵌入存儲數據庫。
9、基于更新后的節點嵌入存儲數據庫和作為參考的已知違規號碼確定一個檢測周期內的異常號碼。
10、根據本發明提供的一種異常號碼檢測方法,基于所述當前的總號碼節點嵌入更新節點嵌入存儲數據庫,包括:在所述節點嵌入存儲數據庫中查詢所述當前的總號碼節點嵌入對應的當前號碼;在所述節點嵌入存儲數據庫中查詢不到所述當前號碼的情況下,將所述當前號碼和對應的當前的總號碼節點嵌入寫入所述節點嵌入存儲數據庫,否則,基于所述當前的總號碼節點嵌入更新所述當前號碼在節點嵌入存儲數據庫中對應的舊的總號碼節點嵌入。
11、根據本發明提供的一種異常號碼檢測方法,基于所述當前的總號碼節點嵌入更新所述當前號碼在節點嵌入存儲數據庫中對應的舊的總號碼節點嵌入,包括:以所述當前的總號碼節點嵌入、舊的總號碼節點嵌入及各自的預設更新權重對舊的總號碼節點嵌入更新,以得到新的總號碼節點嵌入,當前的總號碼節點嵌入對應的更新權重取值范圍為(0,1],舊的總號碼節點嵌入對應的更新權重取值范圍為[0,?1),且所述當前的總號碼節點嵌入的更新權重與舊的總號碼節點嵌入的更新權重之和為1。
12、根據本發明提供的一種異常號碼檢測方法,所述當前的總號碼節點嵌入的更新權重大于舊的總號碼節點嵌入的更新權重。
13、根據本發明提供的一種異常號碼檢測方法,基于更新后的節點嵌入存儲數據庫和作為參考的已知違規號碼確定一個檢測周期內的異常號碼,包括以下步驟。
14、采用k近鄰查詢算法,在所述節點嵌入存儲數據庫中查詢與所述已知違規號碼的參考號碼節點嵌入距離最小的k個目標總號碼節點嵌入。
15、將所述k個目標總號碼節點嵌入對應的目標號碼確定為一個檢測周期內的所述異常號碼。
16、根據本發明提供的一種異常號碼檢測方法,基于更新后的節點嵌入存儲數據庫和作為參考的已知違規號碼確定一個檢測周期內的異常號碼,包括以下步驟。
17、對所述節點嵌入存儲數據庫中的總號碼節點嵌入進行聚類,以建立號碼節點嵌入索引。
18、將與所述已知違規號碼的參考號碼節點嵌入距離最近的號碼節點嵌入索引確定為目標索引。
19、在所述目標索引對應的總號碼節點嵌入類別中采用k近鄰查詢算法,查詢與所述參考號碼節點嵌入距離最小的k個目標總號碼節點嵌入。
20、將所述k個目標總號碼節點嵌入對應的目標號碼確定為一個檢測周期內的所述異常號碼。
21、本發明還提供一種異常號碼檢測裝置,包括以下模塊。
22、結構化數據獲取模塊,用于獲取一個檢測周期內的主叫號碼、被叫號碼以及表示主叫號碼和被叫號碼各屬性信息的結構化數據。
23、數據清洗模塊,用于對所述結構化數據進行數據清洗,以去除構建三元組所需關鍵信息缺失的結構化數據。
24、三元組構建模塊,用于構建通話三元組,所述通話三元組以主叫號碼和被叫號碼為實體,所述屬性信息為關系。
25、關系圖轉換模塊,用于將具有相同關系的所述通話三元組轉換成通話關系圖。
26、總號碼節點嵌入生成模塊,用于將所述通話關系圖輸入圖神經網絡,得到所述圖神經網絡輸出的任一號碼在每個關系下對應的號碼節點嵌入,基于所有關系對應的號碼節點嵌入生成所述任一號碼對應的當前的總號碼節點嵌入。
27、數據庫更新模塊,用于基于所述當前的總號碼節點嵌入更新節點嵌入存儲數據庫。
28、異常號碼確定模塊,用于基于更新后的節點嵌入存儲數據庫和作為參考的已知違規號碼確定一個檢測周期內的異常號碼。
29、本發明還提供一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如上述任一種所述的異常號碼檢測方法。
30、本發明還提供一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現如上述任一種所述的異常號碼檢測方法。
31、本發明還提供一種計算機程序產品,包括計算機程序,所述計算機程序被處理器執行時實現如上述任一種所述的異常號碼檢測方法。
32、本發明提供的異常號碼檢測方法及裝置,通過獲取一個檢測周期內的主叫號碼、被叫號碼以及表示主叫號碼和被叫號碼各屬性信息的結構化數據;對所述結構化數據進行數據清洗,以去除構建三元組所需關鍵信息缺失的結構化數據;構建通話三元組,通話三元組以主叫號碼和被叫號碼為實體,屬性信息為關系;將具有相同關系的所述三元組轉換成通話關系圖;將通話關系圖輸入圖神經網絡,得到所述圖神經網絡輸出的任一號碼在每個關系下對應的號碼節點嵌入,基于所有關系對應的號碼節點嵌入生成所述任一號碼對應的當前的總號碼節點嵌入;基于所述當前的總號碼節點嵌入更新節點嵌入存儲數據庫;基于更新后的節點嵌入存儲數據庫和作為參考的已知違規號碼確定一個檢測周期內的異常號碼。由于采用圖神經網絡學習號碼在不同關系下的號碼節點嵌入(即特征向量),并生成總號碼節點嵌入,從而能夠根據已知的違規號碼,有效地利用號碼在不同關系下的特征,檢測未知的異常號碼,可以有效利用號碼之間的關系知識信息,提升異常號碼檢測的維度,進而提高了異常號碼的檢測效率;而且圖神經網絡是無監督的神經網絡,可以在無樣本的前提下基于每一檢測周期的數據自學習得到號碼節點嵌入,從而可以高效的檢測新的異常號碼,提升了整體的場景適用范圍,解決了由于樣本少導致的局限性的問題。