信息采集方法和裝置的制造方法
【技術領域】
[0001]本申請涉及計算機技術領域,具體涉及互聯網技術領域,尤其涉及信息采集方法和裝置。
【背景技術】
[0002]隨著互聯網的快速發展,惡意代碼的黑色利益鏈已經形成,每日新增的惡意代碼樣本已經數以萬計,傳統的客戶端檢測方式轉變為云查殺的檢測方式,因此云端需要收集大量的文件數據。為了提升客戶端檢測的準確性,需要收集相關客戶端軟件的行為日志信息,在云端形成大數據日志分析,通過海量數據分析調整鑒定策略,從而有效提升產品的檢測能力。然而,提升產品檢測能力的前提條件是通過客戶端采集相關的數據信息,并通過傳輸機制把數據信息回傳到云端的數據存儲中心,再經過大數據的分析處理,反饋于產品應用。
[0003]現有技術采用了云數據采集方法,采集客戶端數據信息時,一般會直接使用機器系統信息作為用戶標識號,例如,使用機器名稱作為用戶標識號,將采集的數據信息完全上傳,而機器系統信息可能會存在用戶的個人信息等敏感信息,因此缺乏安全性的考慮。
【發明內容】
[0004]本申請的目的在于提出一種保護隱私的信息采集方法和裝置,來解決以上【背景技術】部分提到的技術問題。
[0005]第一方面,本申請提供了一種信息采集方法,所述方法包括:采集客戶端系統信息,并將所述系統信息模糊化處理;采集各種運行相關數據;在所述運行相關數據包含身份標識的情況下,將所述運行相關數據進行過濾處理;將經處理的所述系統信息和所述運行相關數據通過加密后上傳服務器,其中,上傳的所述系統信息和所述運行相關數據在所述服務器中是分塊存儲的。
[0006]在一些實施例中,所述將經處理的所述系統信息和所述運行相關數據通過加密后上傳傳服務器,包括:對所述運行相關數據進行檢測;如果檢測到不能識別的可移植的執行體文件,則上傳所述可移植的執行體文件的路徑信息;根據分片采集指令分片上傳所述可移植的執行體文件,其中,所述分片采集指令由所述服務器基于所述路徑信息而生成并下發的。
[0007]在一些實施例中,所述如果檢測到不能識別的可移植的執行體文件,則上傳所述可移植的執行體文件的路徑信息,包括:在上傳所述可移植的執行體文件的所述路徑信息時,將所述路徑信息中包含的用戶名進行過濾處理。
[0008]在一些實施例中,所述系統信息包括以下至少一項:已安裝的軟件列表信息,系統配置實用程序列表信息,服務列表信息,操作系統版本信息,瀏覽器版本信息,網卡Mac地址、硬盤序列號、內存信息、系統結構信息。
[0009]在一些實施例中,所述采集客戶端系統信息,并將所述系統信息模糊化處理,包括:采集客戶端系統信息,將所述系統信息生成文件,對所述文件進行哈希計算,生成唯一標識號。
[0010]在一些實施例中,所述各種運行相關數據包括以下至少一項:軟件行為數據、用戶操作行為數據、用戶統一資源定位符數據、檢測威脅日志數據、文件信息及內容數據。
[0011 ] 第二方面,本申請提供了一種信息采集裝置,所述裝置包括第一采集單元,配置用于采集客戶端系統信息,并將所述系統信息模糊化處理;第二采集單元,配置用于采集各種運行相關數據;過濾處理單元,配置用于在所述運行相關數據包含身份標識的情況下,將所述運行相關數據進行過濾處理;傳輸單元,配置用于將經處理的所述系統信息和所述運行相關數據通過加密后上傳服務器,其中,上傳的所述系統信息和所述運行相關數據在所述服務器中是分塊存儲的。在一些實施例中,所述傳輸單元進一步配置用于:對所述運行相關數據進行檢測;如果檢測到不能識別的可移植的執行體文件,則上傳所述可移植的執行體文件的路徑信息;根據分片采集指令分片上傳所述可移植的執行體文件,其中,所述分片采集指令由所述服務器基于所述路徑信息而生成并下發的。
[0012]在一些實施例中,所述過濾處理單元進一步配置用于:在上傳所述可移植的執行體文件的所述路徑信息時,將所述路徑信息中包含的用戶名進行過濾處理。
[0013]在一些實施例中,所述系統信息包括以下至少一項:網卡Mac地址、硬盤序列號、內存信息、系統結構信息。
[0014]在一些實施例中,所述模糊處理單元進一步配置用于:采集客戶端系統信息,將所述系統信息生成文件,對所述文件進行哈希計算,生成唯一標識號。
[0015]在一些實施例中,所述各種運行相關數據包括以下至少一項:軟件行為數據、用戶操作行為數據、用戶統一資源定位符數據、檢測威脅日志數據、文件信息及內容數據。
[0016]本申請提供的信息采集方法和裝置,通過采集客戶端系統信息,并將上述系統信息模糊化處理,再采集各種運行相關數據,在上述運行相關數據包含身份標識的情況下,將上述運行相關數據進行過濾處理,最后將經處理的上述系統信息和上述運行相關數據通過加密后上傳,從而降低了采集信息的敏感度,減少信息采集帶來的安全性問題。
【附圖說明】
[0017]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優點將會變得更明顯:
[0018]圖1是本申請可以應用于其中的示例性系統架構圖;
[0019]圖2是根據本申請的信息采集方法的一個實施例的流程圖;
[0020]圖3是根據本申請的信息采集方法的又一個實施例的流程圖;
[0021]圖4是根據本申請的信息采集裝置的一個實施例的結構示意圖;
[0022]圖5是適于用來實現本申請實施例的終端設備或服務器的計算機系統的結構示意圖。
【具體實施方式】
[0023]下面結合附圖和實施例對本申請作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋相關發明,而非對該發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關發明相關的部分。
[0024]需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。
[0025]圖1示出了可以應用本申請的信息采集方法或信息采集裝置的實施例的示例性系統架構100。
[0026]如圖1所示,系統架構100可以包括終端設備101、102、103,網絡104和服務器105。網絡104用以在終端設備101、102、103和服務器105之間提供通信鏈路的介質。網絡104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
[0027]用戶可以使用終端設備101、102、103通過網絡104與服務器105交互,以接收或發送消息等。終端設備101、102、103上可以安裝有各種客戶端軟件應用,例如可能涉及用戶信息采集的即時通信工具、郵箱客戶端、社交平臺軟件等。
[0028]終端設備101、102、103可以是各種電子設備,包括但不限于個人電腦、智能手機、智能手表、平板電腦、個人數字助理等等。
[0029]服務器105可以是提供各種服務的服務器。服務器可以對接收到的數據進行存儲、分析等處理,并將處理結果反饋給終端設備。
[0030]需要說明的是,本申請實施例所提供的信息采集方法一般由終端設備101、102、103執行。相應的,信息采集裝置一般設于終端設備101、102、103中。
[0031]應該理解,圖1中的終端設備、網絡和服務器的數目僅僅是示意性的。根據實現需要,可以具有任意數目的終端設備、網絡和服務器。
[0032]繼續參考圖2,其示出了根據本申請的信息采集方法的一個實施例的示例性流程200。所述的信息采集方法,包括以下步驟:
[0033]步驟201,采集客戶端系統信息,并將系統信息模糊化處理。
[0034]在本實施例中,信息采集方法運行于其上的電子設備(例如圖1所示的終端設備)可以采集系統信息。具體而言,當用戶在上述電子設備上安裝客戶端軟件時,客戶端軟件可以從本地獲取上述系統信息,并將上述系統信息模糊化處理。
[0035]在本實施例的一些可選的實現方式中,上述系統信息可以包括以下至少一項:已安裝的軟件列表信息,系統配置實用程序(Microsoft Syste