一種基于社交網絡用戶行為的用戶影響力分析方法
【專利摘要】本發明提出了一種基于社交網絡用戶行為的用戶影響力分析方法,涉及信息【技術領域】。本發明可以通過社交網絡的數據集,從用戶關系和用戶活動兩個方法,綜合分析出影響力強的用戶。針對于現有的基于社交網絡分析影響力的方法,與基于PageRank的模型相比,本發明涉及更多數據關系,并且在影響力的擴散與初值有關,擴散過程中受到用戶評論數目和內容的影響,更為合理。與基于IDM的模型相比,本發明對于用戶之間的關系利用更加充分,不存在IDM模型中的斷層現象。與傳統的基于用戶行為模型相比,本發明類比了人與人線下關系的模式,這樣更加符合社交網絡中將人與人線下關系移動的線上的初衷。
【專利說明】一種基于社交網絡用戶行為的用戶影響力分析方法
【技術領域】
[0001]本發明涉及信息【技術領域】,特別是涉及一種基于社交網絡用戶行為的用戶影響力分析方法。
【背景技術】
[0002]隨著互聯網的發展,用戶已經從一個被動的通過瀏覽器從各大網站獲取信息閱讀信息的瀏覽者,轉向了可以主動參與到互聯網的發展之中的編輯者,使用者和傳播者。在web2.0時代,用戶擁有更多的話語權和主動權,可以直接參與和發布內容,極大加強了用戶間的交流性。社交網絡作為這個時代一個突出的產物,其具有用戶規模大,話題種類多,信息傳遞迅速和影響范圍廣等特點。社交網絡的迅速發展已經成為了一個新型了信息載體和轉播媒介,對于日常工作和生活產生的影響也越來越大。在信息傳播的過程中,意見領袖作為一種重要力量,在社會輿論的形成過程中發揮著不可忽視的作用,局部意見在意見領袖的引導下演化為輿論,影響力直接滲透到現實社會。
[0003]為了識別出社交網路中的意見領袖,需要分析社交網路中用戶的影響力,找出影響力強的用戶。現有的基于社交網絡分析影響力的方法分為三大類。第一類是基于PageRank網頁排名算法。基于PageRank的算法,多為對社交網絡中的某一個因素,套用PageRank的思想,計算出用戶影響力。其不足是所用的因素比較單一,沒有針對內容分析。第二類基于影響力擴散模型(IDM),IDM模型主要是針對話題,根據帖子上下文詞語出現的頻率關系,得到話題的影響力。通過計算用戶所有話題得到用戶的影響力。這種方法的不足是用戶之間的聯系不太緊密。第三類是傳統的基于用戶行為模型。該模型通過統計用戶的各種行為,例如跟隨、轉推、提及,來計算用戶的影響力。這種方法比較簡單,但是各種行為的歸一化系數不好確定。
【發明內容】
[0004]本發明提供了一種基于社交網絡用戶行為的用戶影響力分析方法。這個方法可以通過社交網絡的數據集,從用戶關系和用戶活動兩種方法,綜合分析出影響力強的用戶,包括如下步驟:
[0005]步驟1:統計分析相關數據信息
[0006]在社交網絡中,數據量非常龐大,為了從龐大的數據量中分析用戶影響力首先需要統計以下信息。第一,統計分析社交網絡中用戶之間的關注和被關注關系。第二,統計分析用戶之間的評論數目和評論內容。
[0007]步驟2:用戶關系影響力計算
[0008]用戶關系影響力是實現過程借鑒了 PageRank網頁排名算法的思想,以用戶之間的關注情況類比PageRank中的鏈接情況。通過公式(I)計算出用戶關系影響力。由于用戶關系影響力算法是一收斂算法,所以其結果只與用戶之間相互關注的關系有關,與用戶初始值無關。[0009]
【權利要求】
1.一種基于社交網絡用戶行為的用戶影響力分析方法,其特征在于包括如下步驟:步驟1:統計分析社交網絡中用戶之間的關注和被關注關系及評論數目和評論內容;步驟2:設置用戶關系影響力初值為1,通過計算N次用戶關系影響力,直到用戶關系影響力趨于平穩,兩次相鄰計算的結果差小于結果值的百分之一,用戶關系影響力計算方法如下:
【文檔編號】G06F17/30GK103886105SQ201410146306
【公開日】2014年6月25日 申請日期:2014年4月11日 優先權日:2014年4月11日
【發明者】姜偉, 高夢迪, 張建標, 賴英旭, 李健, 莊俊璽, 張世翔 申請人:北京工業大學