用于得到在電信呼叫圖的節點之間的邊緣的復合連結度量的方法和裝置制造方法
【專利摘要】一種用于得到電信呼叫圖的節點之間的邊緣的復合連結度量的方法,包括:接收具有描述性屬性的原始值的描述性數據,該描述性屬性與由在節點之間的邊緣形成的電信呼叫圖相關聯。每個邊緣涉及兩個節點。每個原始值涉及邊緣和形成相應的原始值的邊緣屬性對的描述性屬性。描述性數據被存儲在本地存儲設備中。在考慮到相應的描述性屬性的原始值的分布和描述性屬性的公共基的情況下,確定對于每個描述性屬性的縮放因子。確定每個描述性屬性的加權因子。基于描述性屬性的原始值、縮放因子和加權因子來計算邊緣的復合連結度量。
【專利說明】用于得到在電信呼叫圖的節點之間的邊緣的復合連結度量
的方法和裝置
【背景技術】
[0001]此申請基于2011年9月8日提交的美國臨時申請N0.61/532,151,并要求其優先權,其全部內容通過引用合并于此。
[0002]本公開涉及用于基于在電信呼叫圖的節點之間的邊緣的多個屬性來得到該邊緣的復合連結度量的過程。例如,本公開描述了一種用于得到邊緣的復合連結度量的方法的示例性實施例,該方法考慮到邊緣的多個屬性的值、在電信呼叫圖中邊緣的多個屬性的值的分布、多個屬性到共同尺度的轉換、以及關于復合連結度量對每個屬性的相對貢獻的靈敏度對多個屬性進行加權。本公開還描述了一種裝置的示例性實施例,該裝置基于經由與電信呼叫圖相關聯的電信網絡通信的歷史數據記錄來得到邊緣的復合連結度量。這里描述的方法和裝置的各種實施例可以結合對服務提供商提供關于流失預測的建議來使用。然而,這里描述的方法和裝置可以用于其他目的,諸如電信服務采用的預測、定向廣告、定向市場營銷、異常檢測或可以從用戶行為的預測獲益的其他用途。
[0003]社交網絡分析(SNA)是用于更好地理解用戶的行為和關系的有效方法。通常在在線社交網絡(OSN)的背景下應用SNA,在線社交網絡諸如Facebook、Flickr和Twitter,其中,用戶可以直接建立連結、共享信息以及加入群組以與具有類似興趣的用戶連接。在這些網絡中,SNA對直接暗示用戶之間的社交連接的屬性進行操作。例如,兩個用戶是OSN上的好友、他們屬于相同的群組、或他們彼此共享信息的事實可以各自單獨用于推斷出社交連結存在。
[0004]這樣的OSN包含因果關系信息,即暗示存在社交連結的數據屬性。然而,存在其他社交網絡,其中僅可以觀察到一個社交連結的效果。每個效果單獨地取出并不直接表明社交連結強度。移動呼叫圖是這樣的社交網絡的示例。在移動呼叫圖中,強的社交連結的效果可能包括大量撥出的電話、花長時間的交談以及在周末和晚上期間的很多電話。然而,沒有任何屬性本身直接暗示連結強度。例如,用戶可能呼叫銀行以查詢余額并且支付帳單的次數比他們給朋友打電話的次數更多,即使友誼是更強的社交連結。
[0005]移動呼叫圖表示大量用戶彼此通信的方式,并且這些通信的模式涉及人們之間的社交連結。因此,對移動呼叫圖應用SNA的研究受到歡迎。然而,這樣的研究僅挑選關于在兩個用戶之間進行的呼叫的單個特征來定義社交關系。結果,由這些研究得到的結論僅基于可能存在的社交關系的單個效果。為了對呼叫圖進行更加如實地考慮用戶之間的社交關系的觀察,需要對連結強度的改進的測量。
[0006]關于將SNA應用于移動呼叫圖的研究的其他信息,參見例如=Dasgupta等人的“Social Ties and their Relevance to Churn in Mobile Telecom Networks,,,發表于2008年 3 月 25-30舉行的第 11 次ACM International Conference on Extending DatabaseTechnology 的會刊第 668-677 頁;ii) Onnela 等人的 “Structure and tie strengths inmobile communication networks”,發表于 2007 年 5 月 I 日的 the National Academyof Sciences of the United States 的會刊,vol.104,n0.18,第 7332 - 7336 頁;iii)Richter 等人的 “Predicting customer churn in mobile networks through analysisof social groups”,發表于 2010 年 4 月 29 到 5 月 I 日舉行的 SIAM InternationalConference on Data Mining 的會刊第 732-741 頁;iv) Seshardi 等人的 “Mobile CallGraphs:Beyond Power-Law and Lognormal Distributions,,,發表于 2008 年 8 月 24-27 舉行的 14th ACM Conference on Knowledge Discovery and Data Mining的會刊第596-604頁;以及 v)Nanavati 等人的“On the Structural Properties of Massive Telecom CallGraphs:Findings and Implications”,發表于 2006 年 11 月 5-11 日舉行的 15th ACMConference on Information and Knowledge Management 的會干丨J第 435-444 頁。這 5 個文獻的內容通過引入完全并入本文。
[0007]對計算社交連結強度的問題的現有解決方案適用于在線社交網絡(0SN),其中存在因果關系的信息,即存在暗示社交連結存在的數據屬性。例如,兩個用戶是OSN上的好友、他們屬于相同的群組、或他們彼此共享信息的事實可以各自單獨被用于推斷社交連結存在。然而,對于電話網絡,僅有社交連結的效果被觀察到。每個效果單獨取出并不直接表明關系強度。例如,在移動呼叫圖中,強的社交連結的效果可能包括大量撥出的電話、花長時間的交談以及在周末和晚上期間的很多電話。然而,沒有任何屬性本身直接暗示連結強度。例如,用戶可能呼叫銀行以查詢余額并且支付帳單的次數比他們給朋友打電話的次數更多,即使友誼是更強的社交連結。
[0008]存在將SNA應用于移動呼叫圖的大量研究。然而,這樣的研究僅挑選關于在兩個用戶之間進行的呼叫的單個特征來定義社交關系。結果,由這些研究得到的結論僅基于可能存在的社交關系的單個效果。為了對呼叫圖進行更加如實地考慮用戶之間的社交關系的觀察,需要對連結強度的改進的測量。
[0009]檢測移動呼叫圖的異常行為具有若干優點:使用率顯著下降的鏈接可能是由于減少的呼叫活動而導致節點在未來可能流失的早期指示。在另一方面,顯著增加的活動可以指示對于影響力傳播的新的連結和可能的鏈接的形成。對呼叫圖的異常檢測具有用于執法機構的應用。海外通話、在一天中的不尋常時間期間打電話、某些節點之間的增加的呼叫活動以及甚至服務的不充分使用或者過度使用(與“扔掉”電話相關聯)可能被檢測為執法機構在調查案件時所利用的異常信號。復合連結變化度量的使用通過將多個屬性上的異常活動合并成單個度量來促進異常檢測。
[0010]異常檢測還適用于監視在電信網絡中的鏈路上的業務。電信網絡由網絡節點(即,電信設備)以及連接不同的網絡節點和傳輸業務的鏈路構成。為了從網絡獲取最佳性能,有利的是使鏈路處于特定的活動水平并且能夠檢測鏈路是否偏離了其正常的期望行為。例如,過載鏈路可能降低性能并且使網絡癱瘓,而未充分利用的鏈路表示損失收入的可能。檢測鏈路的異常行為使得運營商能夠采取行動,并且糾正該情況。為了準確的異常檢測,需要考慮的鏈路的性能的多個因素;而不僅僅是單個測量。
[0011]出于這些和其他原因,需要基于電信呼叫圖的節點之間的邊緣的多個特性來定義表示該邊緣的復合度量。
【發明內容】
[0012]在一個方面中,提供了一種用于得到電信呼叫圖的節點之間的邊緣的復合連結度量的方法。在一個實施例中,該方法包括:在計算設備處從遠程存儲設備接收多個描述性數據,其中多個描述性數據包括針對多個描述性屬性j的原始值Xq,該多個描述性屬性j與由在多個節點之間的多個邊緣i形成的電信呼叫圖相關聯,其中,每個邊緣i涉及多個節點中的兩個節點,其中每個原始值Xq涉及電信呼叫圖中的唯一的邊緣i和針對相應的邊緣i的唯一的描述性屬性j,唯一的邊緣i和唯一的描述性屬性j形成與相應的原始值Xi,^相關的邊緣屬性對i,j ;至少臨時地將多個描述性數據存儲在本地存儲設備中;以下述方式來確定用于每個描述性屬性j的縮放因子:該方式考慮到針對相應的描述性屬性j的原始值Xi, j的分布和針對多個描述性屬性j的公共基;確定用于每個描述性屬性j的加權因子;以及至少部分地基于下述來計算在第一節點和第二節點之間的第一邊緣I1的復合連結度量S:與第一邊緣I1相關聯的第一屬性J1的第一原始值、用于第一屬性J1的第一縮放因子、用于第一屬性i的第一加權因子、與第一邊緣I1相關聯的第二屬性j2的第二原始值xh,iz、用于第二屬性j2的第二縮放因子、以及用于第二屬性j2的第二加權因子,其中,多個描述性屬性j包括第一屬性J1和第二屬性j2。可以理解的是,這里描述的用于得到復合連結度量的過程可以用于超過示例性第一屬性和第二屬性的任何數目的屬性。
[0013]在另一方面中,提供了一種用于得到電信呼叫圖的節點之間的邊緣的復合連結度量的裝置。在一個實施例中,該裝置包括:數據通信模塊,被配置為從遠程存儲設備接收多個描述性數據,其中多個描述性數據包括針對多個描述性屬性j的原始值Xy,該多個描述性屬性j與由在多個節點之間的多個邊緣i形成的電信呼叫圖相關聯,其中,每個邊緣i涉及多個節點中的兩個節點,其中每個原始值Xm涉及電信呼叫圖中的唯一的邊緣i和相應的邊緣i的唯一的描述性屬性j,唯一的邊緣i和唯一的描述性屬性j形成與相應的原始值Xi, j相關的邊緣屬性對i,j ;本地存儲設備,被配置成至少臨時地存儲多個描述性數據;縮放/加權處理器,被配置成以下述方式來確定用于每個描述性屬性j的縮放因子:該方式考慮到針對相應的描述性屬性j的原始值Xi, J的分布和針對多個描述性屬性j的公共基,并且被配置成確定用于每個描述性屬性j的加權因子;以及復合連結度量處理器,被配置成至少部分地基于下述來計算在第一節點和第二節點之間的第一邊緣ii的復合連結度量s:針對與第一邊緣ii相關聯的第一屬性J1的第一原始值-Wh用于第一屬性J1的第一縮放因子、用于第一屬性J1的第一加權因子、`針對與第一邊緣ii相關聯的第二屬性j2的第二原始值用于第二屬性j2的第二縮放因子、以及用于第二屬性j2的第二加權因子,其中,多個描述性屬性j包括第一屬性J1和第二屬性j2。
[0014]在又一個方面中,提供了一種存儲程序指令的非瞬時計算機可讀介質,當由處理器執行時,該程序指令使得計算設備執行用于得到電信呼叫圖的節點之間的邊緣的復合連結度量的方法。在一個實施例中,該方法包括:在從遠程存儲設備接收多個描述性數據之后,其中多個描述性數據包括針對多個描述性屬性j的原始值Xy,該多個描述性屬性j與由在多個節點之間的多個邊緣i形成的電信呼叫圖相關聯,以下述方式來確定用于每個描述性屬性j的縮放因子:該方式考慮到針對相應的描述性屬性j的原始值Xi, J的分布和針對多個描述性屬性j的公共基,其中,每個邊緣i涉及多個節點中的兩個節點,其中每個原始值Xm涉及電信呼叫圖中的唯一的邊緣i和相應的邊緣i的唯一的描述性屬性j,唯一的邊緣i和唯一的描述性屬性j形成與相應的原始值Xi, j相關的邊緣屬性對i,j ;確定用于每個描述性屬性j的加權因子;以及至少部分地基于下述來計算在第一節點和第二節點之間的第一邊緣ii的復合連結度量S:針對與第一邊緣ii相關聯的第一屬性J1的第一原始值用于第一屬性J1的第一縮放因子、用于第一屬性J1的第一加權因子、針對與第一邊緣ii相關聯的第二屬性j2的第二原始值&^2、用于第二屬性j2的第二縮放因子、以及用于第二屬性j2的第二加權因子,其中,多個描述性屬性j包括第一屬性J1和第二屬性j2。
[0015]根據下面提供的詳細描述,本發明的進一步的適用范圍將變得顯而易見。然而,應當理解,詳細描述和特定示例盡管指示本發明的優選實施例,但是他們僅通過例示的方式被給出,因為在本發明的精神和范圍內的各種改變和修改對于本領域技術人員來說將變得顯而易見。
【專利附圖】
【附圖說明】
[0016]本發明存在于設備的各部分的構建、布置和組合,以及方法的步驟,由此,所預期的目標被實現,如在下文中被更全面地闡述、在權利要求中被具體指出、并且在附圖中被圖不的,在附圖中:
[0017]圖1是示出在電信呼叫圖中的邊緣的若干示例性屬性和復合連結度量之間的關聯的一組圖;
[0018]圖2是示出在電信呼叫圖中的邊緣的若干示例性屬性的復合連結度量質量的圖;
[0019]圖3是示出在電信呼叫圖中的邊緣的示例性屬性的復合連結度量質量的圖;
[0020]圖4是示出在電信呼叫圖中的邊緣的另一示例性屬性的復合連結度量質量的圖;
[0021]圖5是示出在電信呼叫圖中的邊緣的又一示例性屬性的復合連結度量質量的圖;
[0022]圖6是用于得到電信呼叫圖的節點之間的邊緣的復合連結度量的過程的示例性實施例的流程圖;
[0023]與圖6相結合的圖7是用于得到在電信呼叫圖的節點之間的邊緣的復合連結度量的過程的另一示例性實施例的流程圖;
[0024]與圖6相結合的圖8是用于得到在電信呼叫圖的節點之間的邊緣的復合連結度量的過程的又一示例性實施例的流程圖;
[0025]與圖6和圖8相結合的圖9是用于得到在電信呼叫圖的節點之間的邊緣的復合連結度量的過程的又一示例性實施例的流程圖;
[0026]與圖6相結合的圖10是用于得到在電信呼叫圖的節點之間的邊緣的復合連結度量的過程的又一示例性實施例的流程圖;
[0027]與圖6和圖10相結合的圖11是用于得到在電信呼叫圖的節點之間的邊緣的復合連結度量的過程的又一示例性實施例的流程圖;
[0028]圖12是用于得到在電信呼叫圖的節點之間的邊緣的復合連結度量的計算設備的示例性實施例的框圖;以及
[0029]圖13是由計算設備執行的用于得到在電信呼叫圖的節點之間的邊緣的復合連結度量的過程的示例性實施例的流程圖,該計算設備具有執行存儲在非瞬時計算機可讀介質中的程序指令的處理器。 【具體實施方式】[0030]總體上,本公開描述了用于得到邊緣度量的兩個過程。第一度量是針對電信圖邊緣的基于變量的評分的測量,引起多個屬性值的組合距離屬性平均值的偏差。該過程基于主成分分析(PCA)方法的使用。本實施例可以用于檢測異常行為。第二過程包括與社交連結強度有關的度量的計算。第二過程可以用于理解用戶對其他用戶的行為的社交影響力。
[0031]本公開例如使用用于測量用戶之間的復合連結度量的方法來檢查移動呼叫圖。這里公開了用于通過很多呼叫屬性的合成來量化合成連結度量的算法的各種實施例,該很多呼叫屬性的值是社交連接的效果。關于連結強度的其他信息,參見例如Granovetter于American Journal of Sociology, Vol.78,Issue6, Mayl973, pp.1360 - 1380 發表的 “TheStrength of Weak Ties”,其全部內容通過引用合并于此。算法的各種實施例可以應用于由主要移動服務提供商所提供的呼叫圖以研究在復合連結度量和呼叫圖結構之間的關系。
[0032]在算法的一個示例性實施例中,移動呼叫圖被定義為簡單的有向圖G= (V,E),其中該組頂點V表示移動電話用戶,并且當且僅當a,be V并且a對b打電話時,邊緣e= (a,b) e E。G表示在|V| = η個用戶當中|E| = m個連結。目標在于定義加權函數S:E — R其將每個有向的邊緣映射成一個值,該值以在邊緣上附帶的用戶之間的關系為特征。
[0033]在本實施例中,每個邊緣被表示為k個屬性的向量。k個屬性的對應向量可以組成mX k矩陣E,其中E的行對應于G的邊緣,并且IE | tf是針對邊緣i的屬性j的值。為了將E的行向量映射成以在邊緣上附帶的用戶之間的關系為特征的值,應用由主要成分分析(PCA)所啟示的方法,該方法將數據投射到更好地表示在數據內存在的變化的子空間。投影使用向量的正交基集合,該向量指向其中數據的變化最大(稱為主要分量(PO)的方向。該集合由E的協方差矩陣Σ的特征向量給出。關于PCA的其他信息,參見例如Jackson于Wiley-1nterscience, September, 10,2003,592pages發表的“A User’s Guide to PrincipalComponents”,其內容通過引用合并于此。
[0034]Σ的特征值的總和等于該數據內的總方差,如果具有零均值和單位方差,則其與數據的維度相同。換言之,Σ的 特征值使由投影的數據的每個維度解釋的變化量與沿著原始數據的維度的變化相關。投影的數據的每個分量被乘以相應的特征值。這些加權的分量被求和以得到以兩個用戶之間的關系為特征的值。這給出了其中數據對復合連結度量值呈現出非常大的變化附加影響的維度。
[0035]在另一實施例中,該算法可以概括如下:
[0036]I)對于所有 j,設置,
【權利要求】
1.一種用于得到電信呼叫圖的節點之間的邊緣的復合連結度量的方法,包括: 在計算設備處從遠程存儲設備接收多個描述性數據,其中所述多個描述性數據包括多個描述性屬性j的原始值XM,所述多個描述性屬性j與由在多個節點之間的多個邊緣i形成的電信呼叫圖相關聯,其中,每個邊緣i涉及所述多個節點中的兩個節點,其中每個原始值及所述電信呼叫圖中的唯一的邊緣i和針對相應的邊緣i的唯一的描述性屬性j,所述唯一的邊緣i和所述唯一的描述性屬性j形成與相應的原始值相關的邊緣屬性對i,j ; 至少臨時地將所述多個描述性數據存儲在本地存儲設備中; 以下述方式來確定用于每個描述性屬性j的縮放因子:該方式考慮到相應的描述性屬性j的所述原始值Xy的分布和所述多個描述性屬性j的公共基; 確定用于每個描述性屬性j的加權因子;以及 至少部分地基于下述來計算在第一節點和第二節點之間的第一邊緣I1的復合連結度量s:與第一邊緣I1相關聯的第一屬性J1的第一原始值XiiJ1、用于第一屬性J1的第一縮放因子、用于第一屬性i的第一加權因子、與第一邊緣I1相關聯的第二屬性j2的第二原始值A1J2、用于第二屬性」2的第二縮放因子、以及用于第二屬性」2的第二加權因子,其中,所述多個描述性屬性j包括所述第一屬性J1和所述第二屬性j2。
2.根據權利要求1所述的方法,其中,所確定的用于每個描述性屬性j的縮放因子至少部分地基于針對相應的描述性屬性j的代表性的最大值|\|,以建立每個描述性屬性j的單位基作為公共基。
3.根據權利要求2所述的方法,其中, 針對每個描述性屬性j的代表性的最大值|χ」至少部分地基于如下表達式:
4.根據權利要求2所述的方法,進一步包括: 用所述第一屬性J1的所述代表性的最大值μΑ|除所述第一原始值J1,以形成用于相應的第一邊緣屬性對L J1的第一縮放的值
5.根據權利要求1所述的方法,結合確定所述縮放因子和所述加權因子,所述方法進一步包括: 計算針對每個描述性屬性j的代表性平均值%; 計算針對每個描述性屬性j的標準差σ ^ ; 確定針對每個描述性屬性j的每個原始值Xi,j和代表性平均值A之間的差,以形成針對每個描述性屬性j的中間值的相應集合; 將每個描述性屬性j的每個中間值為,|除以相應的描述性屬性j的所述標準差σ P以形成針對每個描述性 屬性j的縮放的值fy的相應集合,其中每個描述性屬性j具有由零均值和單位方差表示的公共基;以及 根據所述多個描述性屬性j的所述縮放的值fI,i形成協方差矩陣Σ。
6.根據權利要求1所述的方法,其中,所述縮放因子被確定為使得縮放的值先的相應集合根據每個描述性屬性j的所述原始值Xi, j形成,使得每個描述性屬性j的所述縮放的值為的所述公共基反映零均值和單位方差,所述方法進一步包括: 根據用于所述多個描述性屬性j的所述縮放的值右J形成協方差矩陣Σ ;以及 找到所述協方差矩陣Σ的特征向量的集合和特征值的相應集合。
7.一種用于得到電信呼叫圖的節點之間的邊緣的復合連結度量的裝置,包括: 數據通信模塊,被配置為從遠程存儲設備接收多個描述性數據,其中所述多個描述性數據包括多個描述性屬性j的原始值Xu,所述多個描述性屬性j與由在多個節點之間的多個邊緣i形成的電信呼叫圖相關聯,其中,每個邊緣i涉及所述多個節點中的兩個節點,其中每個原始值Xm涉及所述電信呼叫圖中的唯一的邊緣i和針對相應的邊緣i的唯一的描述性屬性j,所述唯一的邊緣i和所述唯一的描述性屬性j形成與相應的原始值Xm相關的邊緣屬性對i,j ; 本地存儲設備,被配置成至少臨時地存儲所述多個描述性數據; 縮放/加權處理器,被配置成以下述方式來確定用于每個描述性屬性j的縮放因子:所述方式考慮到相應的描述性屬性j的所述原始值Xy的分布和所述多個描述性屬性j的公共基,并且所述縮放/加權處理器被配置成確定用于每個描述性屬性j的加權因子;以及 復合連結度量處理器,被配置成至少部分地基于下述來計算在第一節點和第二節點之間的第一邊緣I1的復合連結度量S:與所述第一邊緣I1相關聯的第一屬性J1的第一原始值用于第一屬性J1的第一縮放因子、用于第一屬性J1的第一加權因子、與第一邊緣ii相關聯的第二屬性j2的第二原始值&ιΑ、用于第二屬性j2的第二縮放因子、以及用于第二屬性j2的第二加權因子,其中,所述多個描述性屬性j包括所述第一屬性J1和第二屬性j2。
8.根據權利要求7所述的裝置,其中,所述縮放/加權處理器被配置成至少部分地基于確定針對相應的描述性屬性j的代表性的最大值IxfI來確定用于每個描述性屬性j的縮放因子,以建立每個描述性屬性j的單位基作為公共基。
9.根據權利要求7所述的裝置,其中,所述縮放/加權處理器被配置成計算針對每個描述性屬性j的代表性平均值&,被配置成計算針對每個描述性屬性j標準差σ P被配置成確定針對每個描述性屬性j的每個原始值Xi, j和代表性平均值%之間的差,以形成針對每個描述性屬性j的中間值hi的相應集合,被配置為將針對每個描述性屬性j的每個中間值勾J除以針對相應的描述性屬性j的標準差σ P以形成針對每個描述性屬性j的縮放的值hj的相應集合,其中所述每個描述性屬性j具有由零均值和單位方差表示的公共基,并且被配置為根據針對所述多個描述性屬性j的所述縮放的值矣,/形成協方差矩陣Σ。
10.根據權利要求7所述的裝置,其中,所述縮放/加權處理器被配置成確定縮放因子,使得縮放的值fy的相應集合根據每個描述性屬性j的所述原始值Xi,j形成,使得針對每個描述性屬性j的所述縮放的值fy的公共基反映零; 其中,所述縮放/加權處理器被配置成根據所述多個描述性屬性j的所述縮放的值fy形成協方差矩陣?,并且被配置成找到協方差矩陣σ的特征向量的集合和特征值的相應集合。
【文檔編號】G06F17/30GK103890758SQ201280043804
【公開日】2014年6月25日 申請日期:2012年9月6日 優先權日:2011年9月8日
【發明者】V·B·門迪拉塔, D·多蘭, C·法蒂克, H·烏祖納利歐格魯, D·庫什尼爾 申請人:阿爾卡特朗訊