< 間的相似度,可得元素8與 間的相似度為S5i8= 0. 67,元素8與if間的相似度為S6,8+s7,s= 0. 67+0. 67 = 1. 34 ;由 于I. 34 > 0. 67,因此將元素8加入最大相容類Cf,即tf = (5丨,c〖4 = {6,7,8};再分別計(jì)算集 合H中的元素9與cf和if間的相似度,可得元素9與cf間的相似度為S5i9= 0. 67,元素 9 與 ef 間的相似度為 s6,9+s7,9+ss, 9= 0. 67+0. 67+1 = 2. 34 ;由于 2. 34 > 0. 67,因此將元素 9加入最大相容類 < ,即cf =丨5丨,< =彳6,7,8,9} ·,從而獲得第2個(gè)最大相容類集合C" a= {{1,2,3,4}, {5}, {6,7,8,9}};
[0082] 根據(jù)步驟9至步驟25的過(guò)程依次處理每一個(gè)最大相容類,最終會(huì)得到共6層的社 團(tuán)結(jié)構(gòu),即:
[0083] P1= {{1},{2},{3},{4},{5},{6},{7},{8},{9}};
[0084] P2= {{1,2,3}, {4}, {5}, {6,7}, {8,9}};
[0085] P3= {{1,2,3,4}, {5}, {6,7}, {8,9}};
[0086] P4= {{1,2,3,4}, {5}, {6,7,8,9}};
[0087] P5= {{1,2,3,4}, {5,6,7,8,9}};
[0088] P6= {{1,2,3,4,5,6,7,8,9}}.
[0089] 步驟26、將a+Ι賦值給a,并返回步驟9順序執(zhí)行,直到a > k為止,從而獲得k層 社團(tuán)結(jié)構(gòu)。
[0090] 當(dāng)選擇LHN-I相似度指標(biāo)
其中Γ⑴表示節(jié)點(diǎn)i的所有鄰 居節(jié)點(diǎn)的集合,k(i)表示節(jié)點(diǎn)i的度,Δ u是一懲罰項(xiàng),當(dāng)節(jié)點(diǎn)i與節(jié)點(diǎn)j有直接連邊時(shí)記 為1,否則記為〇 ;計(jì)算該網(wǎng)絡(luò)的第i個(gè)節(jié)點(diǎn)和第j個(gè)節(jié)點(diǎn)的相似度Sli ],則可構(gòu)建相似度矩
,節(jié)點(diǎn)與其自身的相似度為 + 0,為計(jì)算方便,在此假設(shè)該值為大于的值,如為2。
[0091] 假設(shè)從相似度矩陣R中選取6個(gè)互不相同的元素并進(jìn)行降序排序構(gòu)成截距集合L ={2, 0. 34, 0. 24, 0. 12, 0. 09, 0},依次執(zhí)行步驟4至步驟26,最終會(huì)得到共6層的社團(tuán)結(jié) 構(gòu),即:
[0092] P1= {{1},{2},{3},{4},{5},{6},{7},{8},{9}};
[0093] P2= {{1,2,3}, {4}, {5}, {6,7}, {8,9}};
[0094] P3= {{1,2,3,4}, {5}, {6,7}, {8,9}};
[0095] P4= {{1,2,3,4}, {5}, {6,7,8,9}};
[0096] p5= {{1,2,3,4}, {5,6,7,8,9}};
[0097] p6= {{1,2,3,4,5,6,7,8,9}}.
[0098] 由以上兩個(gè)不同相似度指標(biāo)的例子可以發(fā)現(xiàn),對(duì)于不同的相似度計(jì)算公式,只要 保證通過(guò)它們計(jì)算所得到的相似度矩陣是同構(gòu)的且所選擇的截距同序,就可以得到相同的 分層遞階的多粒度社團(tuán)劃分結(jié)果。
【主權(quán)項(xiàng)】
1. 一種分層遞階的多粒度社團(tuán)發(fā)現(xiàn)方法,其特征是按如下步驟進(jìn)行: 步驟1、定義G= (X,E)表示一個(gè)網(wǎng)絡(luò),在所述網(wǎng)絡(luò)G中,X= {1,2,…,i,…,j,…,η} 表示網(wǎng)絡(luò)G中的節(jié)點(diǎn)集合,i和j分別表示所述網(wǎng)絡(luò)G中第i個(gè)節(jié)點(diǎn)和第j個(gè)節(jié)點(diǎn),η表示 所述網(wǎng)絡(luò)G中的節(jié)點(diǎn)總數(shù),1 <i<j<n;E= {e^e2,…,em}表示所述網(wǎng)絡(luò)G中的邊集合, m表示所述網(wǎng)絡(luò)G中的邊總數(shù);^表示所述網(wǎng)絡(luò)G中第m條邊; 步驟2、計(jì)算所述網(wǎng)絡(luò)G中第i個(gè)節(jié)點(diǎn)和第j個(gè)節(jié)點(diǎn)的相似度Su,且Sy〉max{s, 從而構(gòu)建相似度矩陣η,nj 步驟3、從所述相似度矩陣R中選取k個(gè)互不相同的元素并進(jìn)行降序排序構(gòu)成截距集 合L=隊(duì),12,…,la,…,lk} ;la表示第a個(gè)截距;且1 a+1< 1a;l1表示最大的截距;1 k表示 最小的截距;1彡a彡k;k表示截距的總數(shù),且B ; 2 步驟4、初始化a= 1 ; 步驟5、選取所述截距集合L中第a個(gè)截距l(xiāng)a;判斷所述相似度矩陣R中的第i個(gè)節(jié)點(diǎn) 和第j個(gè)節(jié)點(diǎn)的相似度Sli]與第a個(gè)截距1 3之間的大小關(guān)系,若s^ ,彡1a,則令心=i;否 則令=〇 ,從而構(gòu)建包含最大相容類的第a個(gè)相容關(guān)系矩陣步驟6、找出所述第a個(gè)相容關(guān)系矩陣Ra中所有的最大相容類構(gòu)成第a個(gè)最大相容類集合,記為C=縛,式…;c6u;和4分別表示所述第a個(gè)最大相容類集合c3 中的第b個(gè)最大相容類和第d個(gè)最大相容類,l<b<d<r,r表示第a個(gè)最大相容類集 合Ca中最大相容類的總數(shù); 步驟7、將a+Ι的值賦給a后,判斷a彡k是否成立,若成立,則返回執(zhí)行步驟5和步驟 6 ;從而獲得k個(gè)最大相容類集合{C1,C2,…,Ca,…,Ck},否則,執(zhí)行步驟8 ; 步驟8、初始化a= 1 ; 步驟9、判斷< = 0是否成立;若成立,則將(T賦值給P%從而獲得第a個(gè)等價(jià)類集 合產(chǎn)Η#>丨,···Wr··,W,…,Wh<和W分別表示所述第a個(gè)最大相容類集合Ca中的 第b個(gè)等價(jià)類和第d個(gè)等價(jià)類;否則,執(zhí)行步驟10 ; 步驟10、定義變量μ和ω,并初始化μ= 1 ; 步驟11、初始化ω= 1 ; 步驟12、定義集合D,并初始化i) = 0 ; 步驟13、對(duì)所述第a-1個(gè)等價(jià)類集合中第ω個(gè)等價(jià)類和所述第a個(gè)最大相容類集 合Ca中第μ個(gè)最大相容類士判斷C1 (6=4是否成立;若成立,則將集合D與第ω個(gè)等價(jià) 類的并集賦值給集合D;否則,將ω+l的值賦給ω后,判斷ω 是否成立,若成立, 則返回執(zhí)行步驟13 ;否則,執(zhí)行步驟14 ; 步驟14、判斷£>#0;是否成立,若成立,則將集合D賦值給第μ個(gè)最大相容類<·從而 獲得更新的第μ個(gè)最大相容類# ;否則,將第μ個(gè)最大相容類< 從第a個(gè)最大相容類集 合(:3中刪去; 步驟15、將μ+l的值賦給μ后,判斷μ彡r是否成立,若成立,則返回執(zhí)行步驟11 ;從而獲得更新的第a個(gè)最大相容類集啟 :否則,執(zhí)行步驟16 ; 步驟16、定義集合H,并初始化; 步驟17、初始化μ= 1 ; 步驟18、初始化ω=μ+l; 步驟19、將所述更新的第a個(gè)最大相容類集合a中第μ個(gè)最大相容類 < 和第ω個(gè) 最大相容類<〖:取交集并把所獲得的結(jié)果賦值給所述集合Η; 步驟20、判斷集合好矣層:是否成立,若成立,則執(zhí)行步驟21 ;否則,執(zhí)行步驟25 步驟21、將所述更新的第a個(gè)最大相容類集合a中第μ個(gè)最大相容類 所述集合 Η的差集賦值給第μ個(gè)最大相容類Cfd#所述更新的第a個(gè)最大相容類集合a中第ω個(gè)最大相容類4:,與所述集合Η的差集賦值給第ω個(gè)最大相容類從而獲得再次更新的 第μ個(gè)最大相容類和第μ個(gè)最大相容類cf; 步驟22、假設(shè)所述集合Η包含γ個(gè)元素,并初始化σ= 1 ; 步驟23、求更新后的集合Η中的第σ個(gè)元素分別與再次更新的第μ個(gè)最大相容類< 和第ω個(gè)最大相容類<·'的間相似度,將第〇個(gè)元素加入到與其具有最大相似度的第μ 個(gè)最大相容類或第ω個(gè)最大相容類:£^中; 步驟24、將σ+l賦值給σ;并執(zhí)行步驟23,直到σ>γ為止,從而將γ個(gè)元素均加 入到相應(yīng)的最大相容類中; 步驟25、將ω+l的值賦給ω后,判斷ω彡r是否成立,若成立,則返回執(zhí)行步驟19 ; 否則,將μ+1的值賦給μ后,判斷μ彡r是否成立,若成立,則返回執(zhí)行步驟18 ;否則,獲 得第a個(gè)最大相容類集合,即第a層社團(tuán)結(jié)構(gòu); 步驟26、將a+Ι賦值給a,并返回步驟9順序執(zhí)行,直到a>k為止,從而獲得k層社團(tuán) 結(jié)構(gòu)。
【專利摘要】本發(fā)明公開了一種分層遞階的多粒度社團(tuán)發(fā)現(xiàn)方法,其特征是按如下步驟進(jìn)行:1計(jì)算所述網(wǎng)絡(luò)中任意兩個(gè)節(jié)點(diǎn)的相似度;2構(gòu)建截距集合;3找出最大相容類集合;4近似獲得等價(jià)類集合;5根據(jù)截距集合,并重復(fù)步驟3和4,從而獲得不同截距下的社團(tuán)結(jié)構(gòu)。本發(fā)明能在原始網(wǎng)絡(luò)結(jié)構(gòu)特性的基礎(chǔ)上發(fā)現(xiàn)所有節(jié)點(diǎn)之間的層次關(guān)系以及不同粒度的社團(tuán)結(jié)構(gòu),從而確保社團(tuán)劃分結(jié)果的準(zhǔn)確性和層次的唯一性。
【IPC分類】G06F17/30, G06Q50/00
【公開號(hào)】CN105260415
【申請(qǐng)?zhí)枴緾N201510621622
【發(fā)明人】趙姝, 柯望, 陳潔, 張燕平, 余成進(jìn), 唐杰
【申請(qǐng)人】安徽大學(xué)
【公開日】2016年1月20日
【申請(qǐng)日】2015年9月24日