一種基于r覆蓋率優先的社交網絡觀察點選取方法
【專利摘要】本發明公開了一種基于R覆蓋率優先的社交網絡觀察點選取方法,該方法的核心思想,是將觀察點集在網絡中的R覆蓋率作為判斷觀察點定位性能的依據,在指定觀察點數量的情況下,選取網絡中R覆蓋率最大的一組節點作為觀察點,使得這組觀察點可以用盡可能小的計算消耗達到最高的定位準確率。本發明中的觀察點選取方法是用于傳播信息源定位的,對于相同的觀察點數目,本發明具有更高的定位準確率。該方法能找到一組優化的觀察點集合,這組觀察點集合可以滿足在固定觀察點數量的情況下,其定位準確率更高;在保證定位準確率的情況下,需要的觀察點更少,計算消耗也更小。
【專利說明】一種基于R覆蓋率優先的社交網絡觀察點選取方法
【技術領域】
[0001]本發明屬于社交網絡【技術領域】,具體為一種基于R覆蓋率優先的社交網絡觀察點選取方法。
【背景技術】
[0002]伴隨著博客(Blog)、微博(Mic1-Blog)等新型社交網絡服務的大量出現,社交網絡(Social Networks Services, SNS)已經成為社會大眾獲取信息的重要渠道之一。社交網絡上的信息傳播為人們帶來方便的同時,也為網絡謠言的擴散提供了一種途徑。因此需要對社交網絡中信息擴散源進行定位,進而對輿情進行監控。一種可行的定位方法,是在網絡中部署觀察點,對信息源進行似然估計。
[0003]現有的觀察點選取方法,是在網絡中選取中心性特征值較大的節點作為觀察點。通過這種方法得到的觀察點,其定位準確率低,且計算消耗大,不適用于龐大的社交網絡。針對上述情況,本發明提出了一種基于R覆蓋率優先的社交網絡觀察點選取方法,其目的是提高擴散源定位的準確率。通過該方法得到的觀察點集,在固定觀察點數量的情況下,其定位準確率更高;在保證定位準確率的情況下,需要的觀察點更少,計算消耗也更小。準確的定位社交網絡中的謠言擴散源點,是一種有效的網絡輿情監控手段。現有的一種定位方法,是在網絡中部署少量的觀察點,根據觀察點記錄的信息首次傳入時間和傳入方向,計算候選信息源的似然估計值,進而推斷信息源。這種方法的定位準確性和計算消耗,都與觀察點在網絡中的部署位置有關。
[0004]現有的觀察點選取方法,一種是從網絡中隨機選取一定數量的觀察點,另一種是優先選取網絡中中心性特征值(例如度數中心性、介數中心性、緊密度中心性、特征向量中心性、聚類系數、K-核等)大的節點。這兩類方法選取的觀察點集合,其定位準確率均較低,如果需要保證一個較高的定位準確率,就需要增加觀察點的個數。但是,隨著觀察點數量的增加,計算的消耗也隨之增加。對于社交網絡這樣規模龐大的用戶群體來說,這樣的計算消耗會嚴重影響定位的及時性。
【發明內容】
[0005]為了解決現有技術中存在的問題,本發明提供一種基于R覆蓋率優先的社交網絡觀察點選取方法,找到一組優化的觀察點集合,這組觀察點集合可以滿足在固定觀察點數量的情況下,其定位準確率更高;在保證定位準確率的情況下,需要的觀察點更少,計算消耗也更小。該方法的核心思想,是將觀察點集在網絡中的R覆蓋率作為判斷觀察點定位性能的依據(理論依據下面有證明過程),在指定觀察點數量的情況下,選取網絡中R覆蓋率最大的一組節點作為觀察點,使得這組觀察點可以用盡可能小的計算消耗達到最高的定位準確率。其技術方案為:
[0006]一種基于R覆蓋率優先的社交網絡觀察點選取方法,用m表示種群規模,G表示遺傳代數,t表示當前種群代數,G (t)表示第t代種群,Size(G(t))表示第t代種群中染色體個數,
[0007]算法.R覆蓋率優先觀察點集選取算法
[0008]輸入:遺傳代數G,種群規模m
[0009]輸出:一組R覆蓋率優先的觀察點集
[0010]包括以下步驟:
[0011]步驟1:當t = O時,初始化G (O);
[0012]步驟2:如果t<G
[0013]步驟3:計算G(t)中染色體的適應度函數值:取
【權利要求】
1.一種基于R覆蓋率優先的社交網絡觀察點選取方法,其特征在于, 用m表示種群規模,G表示遺傳代數,t表示當前種群代數,G(t)表示第t代種群,size(Gt))表示第t代種群中染色體個數, 算法.R覆蓋率優先觀察點集選取算法 輸入:遺傳代數G,種群規模m 輸出:一組R覆蓋率優先的觀察點集 包括以下步驟: 步驟1:當t = O時,初始化G(O); 步驟2:如果t < G 步驟3:計算G(t)中染色體的適應度函數值:取一組節點的R覆蓋率值為該組節點的適應度函數,記為
即對于染色體上的基因Xi來說,當Xi = O時,Ti為空;當Xi = I時,以網絡中節點i為根做R階生成樹,得到全部滿足|E(s, Xi) I≤r的節點的集合& ; 步驟4:對G(t)進行復制操作,將父染色體存入G(t+1);
步驟 5:如果 size (G(t)) < m ; 步驟6:執行交叉操作,將新生成的染色體存入G(t+1); 步驟7:執行變異操作,將新生成的染色體存入G(t+1); 步驟8:否則 步驟9:t+l,跳到步驟2 ; 步驟10:否則 步驟11:得到當前種群中適應度函數值最大的染色體,解碼得到對應的觀察點集合。
【文檔編號】G06F17/30GK104199884SQ201410418143
【公開日】2014年12月10日 申請日期:2014年8月19日 優先權日:2014年8月19日
【發明者】張錫哲, 張聿博, 張斌, 呂天陽 申請人:東北大學