本發明涉及信息獲取
技術領域:
,具體涉及一種安全性高的信息獲取裝置。
背景技術:
:隨著移動互聯網時代的到來,移動終端如何安全獲取信息已經成為亟待解決的問題。技術實現要素:針對上述問題,本發明旨在提供一種安全性高的信息獲取裝置。本發明的目的采用以下技術方案來實現:提供了一種安全性高的信息獲取裝置,用于移動終端,包括身份驗證系統、信息獲取系統和信息處理系統,所述身份驗證系統用于對用戶的身份信息進行驗證,所述信息獲取系統用于通過驗證的用戶從微博中獲取信息,所述信息處理系統用于對獲取的信息進行處理。本發明的有益效果為:提高了移動終端獲取信息的安全性。附圖說明利用附圖對本發明作進一步說明,但附圖中的實施例不構成對本發明的任何限制,對于本領域的普通技術人員,在不付出創造性勞動的前提下,還可以根據以下附圖獲得其它的附圖。圖1是本發明的結構示意圖;附圖標記:身份驗證系統1、信息獲取系統2、信息處理系統3。具體實施方式結合以下實施例對本發明作進一步描述。參見圖1,本實施例的一種安全性高的信息獲取裝置,用于移動終端,包括身份驗證系統1、信息獲取系統2和信息處理系統3,所述身份驗證系統1用于對用戶的身份信息進行驗證,所述信息獲取系統2用于通過驗證的用戶從微博中獲取信息,所述信息處理系統3用于對獲取的信息進行處理。本實施例提高了移動終端獲取信息的安全性。優選的,所述信息獲取系統2包括垃圾用戶發現模塊、垃圾用戶剔除模塊和信息獲取模塊,所述垃圾用戶發現模塊用于確定微博垃圾用戶,所述垃圾用戶剔除模塊用于對垃圾用戶進行剔除,所述信息獲取模塊從剔除垃圾用戶后的微博用戶中獲取信息。本優選實施例提高了信息獲取質量。優選的,所述用戶的身份信息包括用戶的姓名、聯系電話、頭像和郵箱地址。本優選實施例安全性更高。優選的,所述垃圾用戶發現模塊包括建模子模塊、分類子模塊和垃圾用戶發現子模塊,所述建模子模塊用于建立微博用戶網絡模型,所述分類子模塊基于微博用戶網絡模型對微博用戶進行分類,所述垃圾用戶發現子模塊基于用戶分類確定微博用戶中的垃圾用戶;所述微博用戶網絡模型基于用戶關注關系建立:采用微博中用戶關注關系形成的有向圖h=(w,b)作為微博用戶網絡模型,有向圖中,w為微博用戶集合,b為邊集,如果用戶存在關注關系,則用戶之間存在邊。本實施例垃圾用戶發現模塊能夠有效地發現微博中的垃圾用戶,有助于提高信息獲取系統信息獲取水平。優選的,所述分類子模塊包括一次處理單元和二次處理單元,所述一次處理單元用于確定用于分類的特征,所述二次處理單元用于根據分類特征確定用戶類別;所述一次處理單元包括一次處理子單元和二次處理子單元,所述一次處理子單元用于確定判定垃圾用戶的特征,所述二次處理子單元用于確定判定正常用戶的特征。所述判定垃圾用戶的特征包括第一垃圾用戶特征cf1和第二垃圾用戶特征cf2:采用以下方式確定所述第一垃圾用戶特征:計算用戶的第一垃圾用戶特征指數:在式子里,p(xi)表示將用戶的時間序列劃分為m個子序列,第xi個子序列發表消息數目占總時間序列的比值,若滿足rl1≥bz1,則該用戶滿足第一垃圾用戶特征,其中,bz1為設定閾值;采用以下方式確定所述第二垃圾用戶特征:計算用戶的第二垃圾用戶特征指數:在式子里,d1表示用戶發表消息中包含“@”的消息數目,l1表示用戶發表消息中包含“http//”的消息數目,d表示用戶發表的消息總數;若滿足rl2≥bz2,則表示用戶滿足第二垃圾用戶特征,其中,bz2為設定閾值。所述判定正常用戶的特征包括第一正常用戶特征pa1和第二正常用戶特征pa2:采用以下方式確定所述第一正常用戶特征:計算用戶的第一正常用戶特征指數:若滿足gp1≤bz3,則該用戶滿足第一正常用戶特征,其中,bz3為設定閾值;采用以下方式確定所述第二正常用戶特征:計算用戶的第二正常用戶特征指數:若滿足gp2≤bz4,則表示用戶滿足第二正常用戶特征,其中,bz4為設定閾值。本優選實施例垃圾用戶發現模塊通過建立多種分類判斷特征,全面獲取了用戶各種特征,為后續用戶分類奠定了基礎,具體的,第一垃圾用戶特征指數和第一正常用戶特征指數反映了用戶的發帖規律,第二垃圾用戶特征指數合第二正常用戶特征指數反映了用戶的發送垃圾信息情況。優選的,所述二次處理單元采用以下方式確定用戶類別:步驟1、對于任意用戶w∈w,給定判定垃圾用戶的特征集合cf={cfi},i=1,2,如果滿足垃圾用戶的第i個特征,則其成為垃圾用戶的概率會高,如果僅存在一個特征,使得用戶w有更高的概率為垃圾用戶,則該用戶為疑似垃圾用戶,如果存在兩個特征,使得用戶w有更高的概率為垃圾用戶,則該用戶為近似垃圾用戶;對于任意用戶w∈w,給定判定正常用戶的特征集合pa={paj},j=1,2,如果滿足正常用戶的第j個特征,則其成為正常用戶的概率會高,如果僅存在一個特征,使得用戶w有更高的概率為正常用戶,則該用戶為疑似正常用戶,如果存在兩個特征,使得用戶w有更高的概率為正常用戶,則該用戶為近似正常用戶;步驟2、對于任意用戶w∈w,如果既不滿足垃圾用戶判定特征,也不滿足正常用戶判定特征,則用戶w為不確定用戶。本優選實施例垃圾用戶發現模塊通過確定垃圾用戶的特征和正常用戶的特征確定用戶類別,實現了用戶的準確分類,具體來講,通過滿足特征的數量判定用戶屬于垃圾用戶和正常用戶的概率,為后續確定垃圾用戶打下了良好的基礎。優選的,所述垃圾用戶發現子模塊采用以下方式確定垃圾用戶:步驟1、計算用戶得分fv:在式子里,α1表示用戶被疑似正常用戶關注的數目,a2表示用戶被近似正常用戶關注的數目,b1表示用戶關注疑似垃圾用戶的數目,b2表示用戶關注近似垃圾用戶的數目;步驟2、若用戶為近似垃圾用戶且滿足用戶得分fv>0.2,若用戶為疑似垃圾用戶且滿足用戶得分fv>0.5,若用戶為不確定用戶且滿足用戶得分fv>1,若用戶為疑似正常用戶且滿足用戶得分fv>2,若用戶為近似正常用戶且滿足用戶得分fv>4,則將用戶確定為垃圾用戶,否則為正常用戶。本優選實施例垃圾用戶發現模塊采用用戶得分與特征相結合的方式確定垃圾用戶,降低了垃圾用戶發現的誤判率,提高了垃圾用戶的發現準確率。采用本發明安全性高的信息獲取裝置挖掘垃圾用戶,挖掘的垃圾用戶數目分別為10、20、30、40、50時,對垃圾用戶發現時間和垃圾用戶發現準確率進行統計,同現有垃圾用戶發現系統相比,產生的有益效果如下表所示:垃圾用戶數目垃圾用戶發現時間縮短垃圾用戶發現準確率提高1023%21%2025%20%3024%25%4026%22%5024%23%最后應當說明的是,以上實施例僅用以說明本發明的技術方案,而非對本發明保護范圍的限制,盡管參照較佳實施例對本發明作了詳細地說明,本領域的普通技術人員應當理解,可以對本發明的技術方案進行修改或者等同替換,而不脫離本發明技術方案的實質和范圍。當前第1頁12