本公開涉及大數據,尤其涉及一種數據獲取方法、裝置。
背景技術:
1、隨著網絡技術和業務模式的發展,電信網絡詐騙呈現出產業化、多樣化、精準化、生態化的趨勢,詐騙風險和防范治理難度不斷提升,對抗日趨激烈,帶來了諸多全新挑戰。因此,為了減少電信網絡詐騙,可以采用涉詐電話識別模型進行識別,其中,進行模型訓練時需要使用涉詐號碼。該涉詐號碼例如可以從歷史涉詐信息中獲取,但是由于涉詐信息的獲取難度較大,且實時性較差,使得涉詐號碼的獲取準確性和便利性較差。
技術實現思路
1、本公開提供一種數據獲取方法、裝置,可以提高涉詐號碼數據集獲取的準確性,提高預測模型識別的準確性和便利性。本公開的技術方案如下:
2、根據本公開實施例的第一方面,提供一種數據獲取方法,包括:
3、接收超級用戶識別卡(subscriber?identity?module,sim)服務器通過回調方式發送的與初始涉詐號碼數據集對應的初始標注結果;
4、對所述初始標注結果進行處理,獲取所述初始涉詐號碼數據集對應的目標標注結果;
5、根據所述目標標注結果和所述初始涉詐號碼數據集關聯的全量通話話單,獲取目標涉詐號碼數據集;
6、采用所述目標涉詐號碼數據集對初始涉詐號碼預測模型進行訓練,得到目標涉詐號碼預測模型。
7、根據一些實施例,所述對所述初始涉詐號碼數據集進行數據處理,獲取所述初始涉詐號碼數據集對應的目標標注結果,包括:
8、根據所述標注結果中異常標注信息,對所述初始涉詐號碼數據集進行數據處理,得到處理后的涉詐號碼數據集;
9、根據所述標注結果對應的至少一個標注信息和加權的多數表決方法,獲取所述初始涉詐號碼數據集對應的目標標注結果。
10、根據一些實施例,所述根據所述標注結果對應的至少一個標注信息和加權的多數表決方法,獲取所述初始涉詐號碼數據集對應的目標標注結果,包括:
11、獲取所述標注結果對應的至少一個標注用戶信息;
12、根據所述至少一個標注信息,獲取所述至少一個標注用戶信息中各標注用戶信息對應的權重信息,其中,所述至少一個標注信息包括標注一致性、標注用戶信息、標注頻度和標注速度,所述標注一致性用于指示不同標注用戶在的預設周期內針對同一涉詐號碼的標注是否一致;
13、對所述初始涉詐號碼數據集中各號碼的類別和所述權重信息進行求和,獲取個號碼的加權值,并根據所述加權值獲取所述初始涉詐號碼數據集對應的目標標注結果。
14、根據本公開實施例的第二方面,提供一種數據獲取方法,包括:
15、接收終端發送的呼叫請求,并響應于所述呼叫請求完成呼叫操作;
16、獲取與所述呼叫請求相關的會話發起協議(session?initiation?protocol,sip)信令;
17、對所述會話發起協議sip信令發送至提醒服務器,其中,所述會話發起協議sip信令用于指示所述提醒服務器確定所述會話發起協議sip信令中主叫號碼的查詢結果,以所述超級sim卡基礎服務器確定初始涉詐號碼數據集對應的初始標注結果。
18、根據本公開實施例的第三方面,提供一種數據獲取方法,包括:
19、在接收到核心網設備發送的會話發起協議sip信令的情況下,獲取所述會話發起協議sip信令中的主叫號碼和被叫號碼;
20、根據所述主叫號碼、所述被叫號碼和涉詐號碼庫,獲取所述主叫號碼的查詢結果;
21、根據所述主叫號碼的查詢結果發送消息下發請求至超級sim卡基礎服務器,其中,所述消息下發請求用于指示所述超級sim卡基礎服務器發送通知信息至至少一個終端,所述消息下發請求包括消息模板標識、模板參數、發送號碼和鑒權參數。
22、根據一些實施例,所述根據所述主叫號碼、所述被叫號碼和涉詐號碼庫,獲取所述主叫號碼的查詢結果,包括:
23、在所述被叫號碼屬于所述涉詐號碼庫的黑名單的情況下,則終止數據獲取流程,丟棄所述會話發起協議sip信令;
24、在所述被叫號碼不屬于所述涉詐號碼庫的黑名單,且所述主叫號碼屬于所述涉詐號碼庫的黑名單的情況下,獲取所述主叫號碼的查詢結果為所述主叫號碼存儲于所述涉詐號碼庫。
25、根據本公開實施例的第四方面,提供一種數據獲取方法,包括:
26、接收提醒服務器發送的消息下發請求,其中,所述消息下發請求包括消息模板標識、模板參數、接收號碼和鑒權參數;
27、根據所述消息模板標識和模板參數,獲取通知信息;
28、發送通知消息發送請求至短信服務器,其中,所述通知消息發送請求包括所述通知信息,所述通知消息發送請求用于指示所述短信服務器發送所述通知信息至所述接收號碼所在終端且在所述接收號碼所在終端的通話界面上展示所述通知信息之后,接收所述接收號碼所在終端針對所述主叫號碼的初始標注結果;
29、接收所述短信服務器發送的所述初始標注結果;
30、通過回調方式發送所述初始標注結果至涉詐號碼識別服務器。
31、根據本公開實施例的第五方面,提供一種數據獲取裝置,包括:
32、第一結果接收單元,用于接收超級sim卡服務器通過回調方式發送的與初始涉詐號碼數據集對應的初始標注結果;
33、結果獲取單元,用于對所述初始標注結果進行處理,獲取所述初始涉詐號碼數據集對應的目標標注結果;
34、數據集獲取單元,用于根據所述目標標注結果和所述初始涉詐號碼數據集關聯的全量通話話單,獲取目標涉詐號碼數據集;
35、模型獲取單元,用于采用所述目標涉詐號碼數據集對初始涉詐號碼預測模型進行訓練,獲取目標涉詐號碼預測模型。
36、根據本公開實施例的第六方面,提供一種數據獲取裝置,包括:
37、第一請求接收單元,用于接收終端發送的呼叫請求,并響應于所述呼叫請求完成呼叫操作;
38、信令獲取單元,用于獲取與所述呼叫請求相關的會話發起協議sip信令;
39、信令發送單元,用于對所述會話發起協議sip信令發送至提醒服務器,其中,所述會話發起協議sip信令用于指示所述提醒服務器確定所述會話發起協議sip信令中主叫號碼的查詢結果,以所述超級sim卡基礎服務器確定初始涉詐號碼數據集對應的初始標注結果。
40、根據本公開實施例的第七方面,提供一種數據獲取裝置,包括:
41、號碼獲取單元,用于在接收到核心網設備發送的會話發起協議sip信令的情況下,獲取所述會話發起協議sip信令中的主叫號碼和被叫號碼;
42、結果查詢單元,用于根據所述主叫號碼、所述被叫號碼和涉詐號碼庫,獲取所述主叫號碼的查詢結果;
43、第一請求發送單元,用于根據所述主叫號碼的查詢結果發送消息下發請求至超級sim卡基礎服務器,其中,所述消息下發請求用于指示所述超級sim卡基礎服務器發送通知信息至至少一個終端,所述消息下發請求包括消息模板標識、模板參數、發送號碼和鑒權參數。
44、根據本公開實施例的第八方面,提供一種數據獲取裝置,包括:
45、第二請求接收單元,用于接收提醒服務器發送的消息下發請求,其中,所述消息下發請求包括消息模板標識、模板參數、接收號碼和鑒權參數;
46、信息獲取單元,用于根據所述消息模板標識和模板參數,獲取通知信息;
47、第二請求發送單元,用于發送通知消息發送請求至短信服務器,其中,所述通知消息發送請求包括所述通知信息,所述通知消息發送請求用于指示所述短信服務器發送所述通知信息至所述接收號碼所在終端且在所述接收號碼所在終端的通話界面上展示所述通知信息之后,接收所述接收號碼所在終端針對所述主叫號碼的初始標注結果;
48、第二結果接收單元,用于接收所述短信服務器發送的所述初始標注結果;
49、結果發送單元,用于通過回調方式發送所述初始標注結果至涉詐號碼識別服務器。
50、根據本公開實施例的第九方面,提供一種網絡設備,包括:
51、處理器;
52、用于存儲所述處理器可執行指令的存儲器;
53、其中,所述處理器被配置為執行所述指令,以實現前述任一方面中任一項所述的數據獲取方法。
54、根據本公開實施例的第十方面,提供了一種存儲介質,當所述存儲介質中的指令由網絡設備的處理器執行時,使得網絡設備能夠執行前述任一方面中任一項所述的數據獲取方法。
55、根據本公開實施例的第十一方面,提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現前述任一方面中任一項所述的方法。
56、本公開的實施例提供的技術方案至少帶來以下有益效果:
57、在一些或者相關實施例中,通過接收超級sim卡服務器通過回調方式發送的與初始涉詐號碼數據集對應的初始標注結果;對所述初始標注結果進行處理,獲取所述初始涉詐號碼數據集對應的目標標注結果;根據所述目標標注結果和所述初始涉詐號碼數據集關聯的全量通話話單,獲取目標涉詐號碼數據集;采用所述目標涉詐號碼數據集對初始涉詐號碼預測模型進行訓練,得到目標涉詐號碼預測模型。因此,在獲取涉詐號碼數據集時無需獲取歷史涉詐信息,減少數據量過小使得模型在訓練數據集上存在過擬合的情況,可以提高模型的泛化能力,且數據集獲取時無需監聽大量涉詐號碼語音信息以及無需人工進行終端操作,可以減少數據集獲取的滯后性以及數據集獲取步驟,可以提高目標涉詐號碼預測模型與當前業務的匹配性,提高涉詐號碼數據集獲取的準確性,提高預測模型識別的準確性和便利性。
58、應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本公開。