本發明屬于數據測算
技術領域:
,具體涉及一種基于手機數據測算城際人信綜合聯系強度的方法。
背景技術:
:近年來,隨著我國城市化高速發展,全國的城市化率已經超過了50%。由于現代交通和通訊的便利條件,城市群越來越多,城市之間的聯系越來越密切,這種密切聯系尤其反映在城際之間的人流、通訊流的總量不斷增加。因此,如何衡量城市之間的聯系密切情況,就需要使用聯系強度的概念,而這一概念一直得不到準確的衡量和測算。在區域城市發展研究、城市規劃、交通規劃以及城市管理中,迫切需要衡量與測算出城際聯系強度,并且這種強度測算最好不是單一指標,既要有客流聯系的考量,也要有通訊流聯系的考量。由此,引入了“城際人信綜合聯系強度”的概念,具體是指綜合測算兩城市之間的雙向客流量和交互通訊量。技術實現要素:本發明的目的是根據上述現有技術的不足之處,提供一種基于手機數據測算城際人信綜合聯系強度的方法,該方法根據兩城市之間的交互通訊量和雙向客流量,識別其與手機網絡總用戶量的比值,并根據工作日與休息日的不同情況賦予不同的權重,進而綜合測算得出兩城之間的人信綜合聯系強度,即綜合考量了工作日、周末、雙向客流量、交互通訊量四種不同因素。本發明目的實現由以下技術方案完成:一種基于手機數據測算城際人信綜合聯系強度的方法,其特征在于所述方法包括以下步驟:(1)獲取任一手機運營商分別在城市a和b中連續n天的手機信令數據,n≥28,識別測算所述手機信令數據中的每日有效用戶總量,將城市a和b在n天內的各工作日有效用戶總量分別拼接成數列{a(1)}、{b(1)},將城市a和b在n天內的各休息日有效用戶總量aj(0)、bj(0)分別拼接成數列{a(0)}、{b(0)};其中,i表示n天內的第i個工作日,j表示n天內的第j個休息日;(2)獲取所述手機運營商分別在城市a和b中連續n天的通訊數據,n≥28,識別測算所述通訊數據中的每日有效用戶總量,將城市a和b在n天內的各工作日有效用戶總量分別拼接成數列{a(1)}、{b(1)},將城市a和b在n天內的各休息日有效用戶總量aj(0)、bj(0)分別拼接成數列{a(0)}、{b(0)};其中,i表示n天內的第i個工作日,j表示n天內的第j個休息日;(3)對所述手機信令數據在n天內的有效用戶總量的穩定性進行檢驗,剔除其中不符合穩定性條件的日期;對所述通訊數據在n天內的有效用戶總量的穩定性進行檢驗,剔除其中不符合穩定性條件的日期;經過穩定性檢驗、剔除不符合穩定性條件的日期后,從剩下的日期中挑選,挑選條件必須滿足:a、b兩城日期同步、日期連續、天數大于等于7天的數據,舍棄其余不連續日期的所有數據,整理得到如下各組數據:aj(0)、bj(0)、aj(0)、bj(0);其中,i≥5,j≥2,并且i和j在日歷表上連續;(4)根據步驟(1)和(3),識別、測算城市a和b之間基于所述手機信令數據的工作日和休息日的雙向客流量客流量以人次計;(5)根據步驟(2)和(3),識別、測算城市a和b之間基于所述通訊數據的工作日和休息日的交互通訊量交互通訊量以人次計;(6)基于步驟(4)和(5)所獲得的數據,進行突發性檢查:當城市a和b同為工作日或同為休息日時的雙向客流量相差大于10%時,或是當城市a和b同為工作日或同為休息日時的雙向交互通訊量相差大于15%時,剔除對應該日期的所有數據;之后,從剩下的天數中挑選,條件須滿足城市a和b時期同步、日期連續、天數等于7天的數據,舍棄其余日期的所有數據,整理得到如下各組數據:aj(0)、bj(0)、aj(0)、bj(0)、其中,i=1~5,j=1~2,并且i和j在日歷表上連續;(7)根據步驟(6),整理城際人信綜合聯系強度測算的基礎數據,包括信令數據有效用戶總量均值通訊數據有效用戶總量均值兩城雙向客流量均值兩城交互通訊量均值其中,分別表示城市a工作日、休息日信令數據有效用戶總量均值;分別表示城市b工作日、休息日信令數據有效用戶總量均值;分別表示城市a工作日、休息日的通訊數據有效用戶總量均值;分別表示城市b工作日、休息日的通訊數據有效用戶總量均值;分別表示工作日、休息日的兩城雙向客流量均值;分別表示工作日、休息日的兩城交互通訊量均值;(8)根據步驟(7),利用信令數據有效用戶總量均值和兩城雙向客流量均值分別計算獲得工作日和休息日的城際客流聯系強度;利用通訊數據有效用戶總量均值和兩城交互通訊量均值分別計算工作日和休息日的城際通訊流聯系強度;依此,計算城際人信綜合聯系強度。步驟(1)中,識別測算所述手機信令數據中的每日有效用戶總量的方法為:所述手機信令數據中的每個用戶記錄須滿足駐留時長可靠性條件,才可識別為當天所在城市的有效用戶,所述可靠性條件為:tzs-tzr≥120分鐘其中,tzs是指在一天計時周期內,用戶于所在城市的尾記錄的時間;tzr是指在一天計時周期內,用戶于所在城市的首記錄的時間。步驟(2)中,識別測算所述通訊數據中的每日有效用戶總量的方法為:在一天的計時周期內,任意用戶在所在城市的所述通訊數據中顯示有“打電話、接電話、發送短信、接收短信”中的任何一個數據記錄,才可識別為當天所在城市的有效用戶。步驟(3)中,對所述手機信令數據在n天內的有效用戶總量的穩定性進行檢驗的方法為:基于步驟(1),分別對工作日與休息日的四組數據{a(1)}、{b(1)}、{a(0)}、{b(0)}做環比2日移動平均:當表明城市a的工作日數據不穩定,剔除第i+1天城市a和b的所有數據;當表明城市b的工作日數據不穩定,剔除第i+1天城市a和b的所有數據;當表明城市a的休息日數據不穩定,剔除第j+1天城市a和b的所有數據;當表明城市b的休息日數據不穩定,剔除第j+1天城市a和b的所有數據;對所述通訊數據在n天內的有效用戶總量的穩定性進行檢驗的方法為:基于步驟(2),分別對工作日與休息日四組數據aj(0)、bj(0)做環比2日移動平均:當表明城市a的工作日數據不穩定,剔除第i+1天城市a和b的所有數據;當表明城市b的工作日數據不穩定,剔除第i+1天城市a和b的所有數據;當表明城市a的休息日數據不穩定,剔除第j+1天城市a和b的所有數據;當表明城市b的休息日數據不穩定,剔除第j+1天城市a和b的所有數據。步驟(4)中所述雙向客流量的測算方法為:在一天的計時周期內,同一個手機用戶在城市a和b中的所述手機信令數據中均有記錄,且每次在城市a或b中的駐留時間均超過1小時以上,則識別該手機用戶為有效停留;手機用戶在城市a和b中停留時間的先后順序分為如下情況,均識別為雙向客流量的有效計次:計為1次的:a→b,或b→a;計為2次的:a→b→a,或b→a→b;…;計為2n-1次的:a→b→…→b,或b→a→…→a;計為2n次的:a→b→…→a,或b→a→…→b;基于上述有效計次,分別測算工作日和休息日每天城市a與城市b之間的雙向客流總量:工作日每天雙向客流量(工作日每天符合有效停留的有效計次);休息日每天雙向客流量(休息日每天符合有效停留的有效計次)。步驟(5)中所述交互通訊量的測算方法為:在滿足打電話雙方或是收發短信的雙方分別在城市a和城市b內的情況下,進行城市a和b之間交互通訊的有效計次,有效計次包括如下情況:城市a和城市b內的所有手機呼出電話次數,包括城市a內手機呼城市b內手機或座機,城市b內手機呼城市a內手機或座機;城市a和城市b內的所有接收非手機打來音訊電話次數;城市a和城市b內所有發出短信的次數;基于上述有效計次,分別測算工作日和休息日每天城市a和b之間的交互通訊總量:工作日每天交互通訊量(工作日每天符合交互通訊的有效計次);休息日每天交互通訊量(休息日每天符合交互通訊的有效計次)。步驟(6)中的所述突發性檢查分為雙向客流量的突發性檢查和交互通訊量的突發性檢查;所述雙向客流量的突發性檢查的方法為:分別對工作日與休息日兩組數據{f(1)}、{f(0)}做環比2日移動平均:當表明城市a和b的工作日雙向客流量通不過所述雙向客流量的突發性檢查,剔除第i+1天城市a和b的所有數據;當表明城市a和b的休息日雙向客流量通不過所述雙向客流量的突發性檢查,剔除第j+1天城市a和b的所有數據;所述交互通訊量的突發性檢查的方法為:分別對工作日與休息日兩組數據{f(1)}、{f(0)}做環比2日移動平均:當表明城市a和b的工作日交互通訊量通不過所述交互通訊量的突發性檢查,剔除第i+1天城市a和b的所有數據;當表明城市a和b的休息日交互通訊量通不過所述交互通訊量的突發性檢查,剔除第j+1天城市a和b的所有數據。步驟(7)中,所述信令數據有效用戶總量均值的計算方法如下:所述通訊數據有效用戶總量均值的計算方法如下:所述兩城雙向客流量均值的計算方法如下:所述兩城交互通訊量均值的計算方法如下:步驟(8)中城際人信綜合聯系強度的計算方法如下:(8.1)分別計算工作日和休息日的城際客流聯系強度:工作日城市a對于城市b的客流聯系強度休息日城市a對于城市b的客流聯系強度工作日城市b對于城市a的客流聯系強度休息日城市b對于城市a的客流聯系強度(8.2)分別計算工作日和休息日的城際通訊流強度:工作日城市a對于城市b的城際通訊流強度休息日城市a對于城市b的城際通訊流強度工作日城市b對于城市a的城際通訊流強度休息日城市b對于城市a的城際通訊流強度(8.3)計算城際客流聯系強度:城市a對于城市b的客流聯系強度城市b對于城市a的客流聯系強度(8.4)計算城際通訊流強度:城市a對于城市b的城際通訊流強度城市b對于城市a的城際通訊流強度(8.5)分別計算工作日和休息日城際人信綜合聯系強度:工作日城市a對于城市b的人信綜合聯系強度休息日城市a對于城市b的人信綜合聯系強度工作日城市b對于城市a的人信綜合聯系強度休息日城市b對于城市a的人信綜合聯系強度(8.6)計算城際人信綜合聯系強度:城市a對于城市b人信綜合聯系強度ia~b=ifa~b*80%+ifa~b*20%;城市b對于城市a人信綜合聯系強度ib~a=ifb~a*80%+ifb~a*20%。本發明的優點是,充分依托現有的無線通信網絡信息資源,利用已有手機網絡中的時間、空間數據,通過對工作日、休息日、兩城市雙向客流量、兩城市交互通訊量等各種維度的綜合測算,取得城際人信綜合聯系強度,實現低成本、高采樣、低誤測、高實效地獲取城際人信綜合聯系強度,其測算結果具有可比性、科學性、實用性和綜合性。附圖說明圖1為本發明中基于手機數據測算城際人信綜合聯系強度的方法流程框圖。具體實施方式以下結合附圖通過實施例對本發明的特征及其它相關特征作進一步詳細說明,以便于同行業技術人員的理解:實施例:如圖1所示,本實施例具體涉及一種基于手機數據測算城際人信綜合聯系強度的方法,該方法需要確定兩個待研究的城市,即城市a和b,以測算這兩個城市的人信綜合聯系強度,具體包括如下步驟:【步驟1】獲取一家手機網絡運營商分別在城市a和b的手機信令數據(簡稱信令數據),對于信令數據的條件要求為:a)時期相同,連續n天,n≥28,連續n天的數據,必然包含至少20個工作日、4個周六、4個周日;b)信令數據必須包含手機用戶id、時間戳、位置戳等字段信息,并包括開關機、接打電話、收發短信、切換基站、上網下網、基站定時喚醒等事件類型。(步驟1.1)選取同期數據、分組:將兩個城市n天的數據分別分成兩組,一組為工作日(周一至周五)的數據a(1)、b(1),另一組為休息日(周六、日)的數據a(0)、b(0)。例如:城市a獲取數據起始日期為2016-11-19、最后日期為2016-12-22;城市b獲取數據起始日期為2016-11-18、最后日期為2016-12-20。首先,選取城市a與城市b同期的數據,即取ab兩城日期同為2016-11-19至2016-12-20共32天的數據。然后將工作日與休息日的數據分組,分別整理如下:工作日城市a的數據日期為:(2016-11-21為周一)a11-21到a11-25、a11-28到a12-02、a12-05到a12-09、a12-12到a12-16、a12-19、a12-20(共22天);工作日城市b的數據日期為:b11-21到b11-25、b11-28到b12-02、b12-05到b12-11、b12-14到b12-18;休息日城市a的數據日期為:(2016-11-19為周六)a11-19、a11-20、a11-26、a11-27、a12-03、a12-04、a12-10、a12-11、a12-17、a12-18(共10天);休息日城市b的數據日期為:b11-19、b11-20、b11-26、b11-27、b12-03、b12-04、b12-10、b12-11、b12-17、b12-18。(步驟1.2)識別信令數據有效用戶:信令數據中的每個用戶記錄須滿足駐留時長可靠性條件,才可識別為當天所在城市的有效用戶,該可靠性條件為:tzs-tzr≥120分鐘其中,tzs是指在一天計時周期內,用戶于所在城市的尾記錄的時間;tzr是指在一天計時周期內,用戶于所在城市的首記錄的時間;例如:日期2016-11-30,這一天為周三,是工作日,計算時間從該日凌晨00:00:00到夜里24:00:00。城市a的四個手機用戶分別為路人甲、乙、丙、丁,他們在城市a留下的信令數據記錄如下表:表(1):信令數據城市a用戶首尾記錄上表中,路人甲、路人乙和路人丁的tzs-tzr均大于或等于120分鐘,被識別為有效用戶,記錄到當天有效用戶總量中,而路人丙的tzs-tzr由于小于120分鐘,故不被記錄到當天有效用戶總量中。計算城市a當日有效用戶總量=∑(所有被識別為有效用戶的數量)=2389541。(步驟1.3)對每天的信令數據有效用戶總量分別按工作日和休息日拼接成數列:對22個工作日城市a每天的有效用戶總量數據將其拼接成數列{a(1)},按日期進行先后的排列,如下表所示:i=1~22日期星期{a(1)}i=012016-11-21一2408223i=022016-11-22二2397954i=032016-11-23三1851336……i=082016-11-30三2389541……i=222016-12-20二2375648表(2):信令數據工作日城市a每天用戶總量同樣地,對10個休息日城市a每天的有效用戶總量數據aj(0),將其拼接成連續數列{a(0)},按日期先后進行排列,如下表所示:j=1~10日期星期{a(0)}j=012016-11-19六2356678j=022016-11-20日2349924j=032016-11-26六1691376……j=102016-12-18日2275483表(3):信令數據休息日城市a每天用戶總量同樣地,將工作日和休息日城市b的有效用戶每天總量也按上述步驟一一整理排序,組成連續數列{b(1)}、{b(0)}。【步驟2】獲取該家手機網絡運營商分別在城市a和b的通訊數據,對于通訊數據的條件要求為:a)與步驟1獲取的信令數據的時期相同,連續n天,n≥28,連續n天的數,必然包含至少20個工作日、4個周六、4個周日;b)通訊數據必須包含手機用戶id、時間戳、位置戳等字段信息,并包括打電話、接電話、發送短信、接收短信等事件類型。(步驟2.1)選取同期數據、分組:將兩個城市n天的數據分別分成兩組,一組為工作日(周一至周五)的數據a(1)、b(1),另一組為休息日(周六、日)的數據a(0)、b(0)。例如:城市a獲取數據起始日期為2016-11-15、最后日期為2016-12-28;城市b獲取數據起始日期為2016-11-14、最后日期為2016-12-21。對照步驟1.1信令數據的日期,選取同期的數據,即取ab兩城日期同為2016-11-19至2016-12-20共32天的數據。其中工作日22個,休息日10個。然后將工作日與休息日的數據分組,分別整理如下:工作日城市a的數據日期為:(2016-11-21為周一)a11-21到a11-25、a11-28到a12-02、a12-05到a12-09、a12-12到a12-16、a12-19、a12-20(共22天);工作日城市b的數據日期為:b11-21到b11-25、b11-28到b12-02、b12-05到b12-11、b12-14到b12-18。休息日城市a的數據日期為:(2016-11-19為周六)a11-19、a11-20、a11-26、a11-27、a12-03、a12-04、a12-10、a12-11、a12-17、a12-18(共10天);休息日城市b的數據日期為:b11-19、b11-20、b11-26、b11-27、b12-03、b12-04、b12-10、b12-11、b12-17、b12-18。(步驟2.2)識別通訊數據有效用戶通訊數據中的有效用戶必須滿足通訊活躍性條件,即一個用戶在某一天某個城市的通訊數據顯示有“打電話、接電話、發送短信、接收短信”其中的任何一個數據記錄,才識別為當天該城市的有效用戶。例如:日期2016-12-17,這一天為周六,是休息日,計算時間從該日凌晨00:00:00到夜里24:00:00。城市b的四個手機用戶分別為路人#1、#2、#3、#4,他們在城市b留下的通訊數據記錄如下表:表(4):通訊數據城市b用戶記錄上表中,路人#1、路人#3和路人#4當天有符合條件的通訊數據記錄,被識別為有效用戶,記錄到當天有效用戶總量b(0)中。路人#2由于沒有任何記錄,故不被記錄到當天用戶總量。計算城市b當日有效用戶總量=∑(所有被識別為有效用戶的數量)=1253216。(步驟2.3)對每天的通訊數據有效用戶總量分別按工作日和休息日拼接成數列:對10個休息日城市b每天的有效用戶總量bj(0),將其拼接成連續數列{b(0)},按日期先后進行排列,如下表所示:j=1~10日期星期{b(0)}j=012016-11-19六1262283j=022016-11-20日1260305j=032016-11-26六1257495j=042016-11-27日651373……j=092016-12-17六1253216j=102016-12-18日1251638表(5):通訊數據休息日城市b每天用戶總量同樣地,對22個工作日城市b每天的有效用戶總量數據將其拼接成連續數列{b(1)},按日期先后進行排列,如下表所示:i=1~22日期星期{b(1)}1=012016-11-21一1356656i=022016-11-22二1349938……i=072016-11-29二891344……i=222016-12-20二1375664表(6):通訊數據工作日城市b每天用戶總量同樣地,將城市a的有效用戶每天總量也按上述步驟一一整理排序,組成連續數列{a(1)}、{a(0)}。【步驟3】經過步驟1、步驟2獲取、識別和測算所得到的數據,必須檢測手機數據的穩定性和連續性。(步驟3.1)信令數據有效用戶總量的穩定性檢驗:基于步驟1,分別對工作日與休息日的四組數據{a(1)}、{b(1)}、{a(0)}、{b(0)}做環比2日移動平均:當表明城市a的工作日數據不穩定,剔除第i+1天城市a和b的所有數據;當表明城市b的工作日數據不穩定,剔除第i+1天城市a和b的所有數據;當表明城市a的休息日數據不穩定,剔除第j+1天城市a和b的所有數據;當表明城市b的休息日數據不穩定,剔除第j+1天城市a和b的所有數據;由表(2),經檢測:表明城市a的11月23日(工作日i=3對應日期)的數據不穩定,因此,對應11月23日整天的數據應當剔除。由表(3),經檢測:表明城市a的11月26日(休息日j=3對應日期)的數據不穩定,因此,對應11月26日整天的數據應當剔除。同理,由于城市b的11月30日、12月17日的數據都不符合穩定性檢測,應當剔除。(布置3.2)通訊數據有效用戶總量的穩定性檢驗:基于步驟2,分別對工作日與休息日四組數據aj(0)、bj(0)做環比2日移動平均:當表明城市a的工作日數據不穩定,剔除第i+1天城市a和b的所有數據;當表明城市b的工作日數據不穩定,剔除第i+1天城市a和b的所有數據;當表明城市a的休息日數據不穩定,剔除第j+1天城市a和b的所有數據;當表明城市b的休息日數據不穩定,剔除第j+1天城市a和b的所有數據。由表(5),經檢測:表明城市b的11月27日(休息日j=4對應日期)的數據不穩定,因此,對應11月27日整天的數據應當剔除。由表(6),經檢測:表明城市b的11月29日(工作日j=7對應日期)的數據不穩定,因此,對應11月29日整天的數據應當剔除。同理,按以上方法經檢測、由于城市a的12月13日、15日的數據都不符合穩定性檢測,應當剔除。(步驟3.3)連續性檢驗:經過穩定性檢驗、剔除不符合條件的日期后,從剩下的天數中挑選,挑選條件必須滿足:ab兩城時期同步、日期連續、天數大于等于7天的數據(舍棄其余不連續日期的所有數據)。經過步驟3.1和步驟3.2的穩定性檢驗,日期2016-11-23、26、27、29、30和2016-12-13、15、17的數據被剔除,剩下的日期中2016-11-19、20、21、22和2016-12-14、18、19、20的數據雖然通過了穩定性檢驗,但是日期連續都不超過7天,應當舍棄。最后僅有日期2016-12-01到12-12連續12天數據是符合要求的,整理得到如下各組數據:aj(0)、bj(0)、aj(0)、bj(0);其中,i≥5,j≥2,并且i和j在日歷表上是連續的,這種連續可以從一周的任何一天開始,并保證連續7天以上,工作日、休息日與對應日期連續排列,詳見下表:i=1~8日期星期i=12016-12-01四i=22016-12-02五i=32016-12-05一……i=72016-12-09五i=82016-12-12一表(7):工作日與對應日期連續排列表j=1~4日期星期j=12016-12-03六j=22016-12-04日j=32016-12-10六j=42016-12-11日表(8):休息日與對應日期連續排列表表(7)和表(8)分別是通過有效性、連續性檢測后得到的工作日和休息日的連續12天的數據,其中,工作日有8個,休息日有4個,且從2016-12-01至2016-12-12日的日期是連續的。【步驟4】在步驟1、步驟3的基礎上,進一步識別、測算城市a和城市b之間的(基于信令數據的)工作日和休息日的雙向客流量客流量以人次計;其步驟如下:(步驟4.1)識別有效停留:在一天中,同一個手機用戶在城市a和城市b的信令數據中均有記錄(表示該手機用戶去過ab兩城),并且每次在城市a或者城市b的駐留時間均超過1小時以上,才識別為有效停留。對于每一用戶的有效停留條件為:tls-tlr≥60分鐘tls:在一次停留城市內,一個用戶的尾記錄的時間;tlr:在一次停留城市內,一個用戶的首記錄的時間;例如:日期2016-12-06(工作日),某些手機用戶有甲、丁,他們分別在城市a和城市b留下的數據記錄如下表:表(9):2016-12-06用戶甲在ab兩城的有效停留表表(10):2016-12-06用戶丁在ab兩城的有效停留表(步驟4.2)識別雙向客流量的有效計次:滿足上述條件情況,用戶甲和丁被識別為該手機用戶在城市a或b有效停留。按照一個手機用戶在城市a與城市b中停留時間的先后順序有如下排列情況,均識別為雙向客流量的有效計次:計為1次的:a→b,或b→a;計為2次的:a→b→a,或b→a→b;…;計為2n-1次的:a→b→…→b,或b→a→…→a;計為2n次的:a→b→…→a,或b→a→…→b;n≥2;1、2n-1為奇數次停留計次,2、2n為偶數次停留計次。因此上述排列情況已經涵蓋了所有可能發生的有效計次,沒有遺漏。)根據表(9)和表(10),按照上述方法,測算出用戶甲的有效計次為3次、用戶丁的有效計次為2次。(步驟4.3)測算每天ab兩城雙向客流總量:基于上述有效計次,分別測算工作日和休息日每天城市a與城市b之間的雙向客流總量:工作日每天雙向客流量(工作日每天符合有效停留的有效計次)休息日每天雙向客流量(休息日每天符合有效停留的有效計次)經過測算工作日、休息日ab兩城雙向客流每天總量如下兩表:表(11):工作日與對應日期雙向客流量測算表表(12):休息日與對應日期雙向客流量測算表【步驟5】在步驟2、步驟3的基礎上,識別、測算城市a和城市b之間的(基于通訊數據的)工作日和休息日的交互通訊量交互通訊量以人次計。(步驟5.1)識別交互通訊:ab兩城之間,每次交互通訊必須滿足以下識別條件:打電話的雙方必須分別在城市a和城市b兩地(包含雙方都是手機用戶或者其中一方是手機用戶的情況),并且每次通話時間在6秒鐘(包含)以上,或者收發短信的雙方必須分別在城市a和城市b兩地。tch≥6秒鐘,其中,tch為通話時長。例如:日期2016-12-10(休息日),某些手機用戶有#1、#4,在與另一個城市進行點對點通訊留下的通訊數據記錄分別如下表:表(13):2016-12-10用戶#1在ab兩城的通訊數據記錄表(14):2016-12-10用戶#4在ab兩城的通訊數據記錄(步驟5.2)識別有效計次:滿足上述條件情況下,在識別有效計次時應當剔除重復計次也不能減漏計次,具體做法是根據通訊數據記錄,對如下情形,均為識別為有效計次:城市a+城市b的所有手機呼出電話次數(包括a城手機呼b城手機或座機,b城手機呼a城手機或座機);城市a+城市b的所有接收非手機打來音訊電話次數;城市a+城市b的所有發出短信次數。(“城市a+城市b的所有接收手機打來電話次數”和“城市a+城市b的所有接收短信次數”與前者統計重復,所以不再計次)根據表(13)和表(14),識別有效計次如下表:表(15):2016-12-10用戶#1在ab兩城的通訊數據的有效記錄表(16):2016-12-10用戶#4在ab兩城的通訊數據的有效記錄根據表(15)和表(16),按照上述方法,測算出用戶#1的有效計次為3次、用戶#4的有效計次為1次。步驟(5.3)測算每天ab兩城交互通訊總量:工作日每天交互通訊量(工作日每天符合交互通訊的有效計次);休息日每天交互通訊量(休息日每天符合交互通訊的有效計次)。經過測算工作日休息日ab兩城交互通訊每天總量如下兩表:i=1~8日期星期fi(1)i=12016-12-01四72453i=22016-12-02五72756i=32016-12-05一68351……i=72016-12-09五72376i=82016-12-12一112656表(17):工作日與對應日期交互通訊量測算表j=1~4日期星期fj(0)j=12016-12-03六66436j=22016-12-04日65376j=32016-12-10六65516j=42016-12-11日65890表(18):休息日與對應日期交互通訊量測算表【步驟6】雙向客流量和交互通訊量的突發性檢測:當ab兩城或其中一個城市發生重大事件(如國際會議、全國比賽等等),數據量出現反常,會干擾雙向客流量和交互通訊量的最后結果。因此要進行突發性檢驗。當同為工作日或同為休息日的雙向客流量相差大于10%,或者當同為工作日或同為休息日的交互通訊量相差大于15%,表明數據不穩定、或者有突發事件干擾,剔除對應這一天的所有數據。基于步驟4、步驟5獲取、識別和測算所得到的數據,進行突發性檢驗,具體步驟如下:(步驟6.1)雙向客流量的突發性檢測:基于步驟4,分別對工作日與休息日兩組數據{f(1)}、{f(0)}做環比2日移動平均:當表明城市a和b的工作日雙向客流量通不過所述雙向客流量的突發性檢查,剔除第i+1天城市a和b的所有數據;當表明城市a和b的休息日雙向客流量通不過所述雙向客流量的突發性檢查,剔除第j+1天城市a和b的所有數據。由表(11)、表(12),經檢測:表明ab兩城市12月2日(工作日第i=2天對應日期)的雙向客流量通不過數據突發性檢驗,剔除12月2日a、b兩城的所有數據。(步驟6.2)交互通訊量的突發性檢驗:基于步驟5,分別對工作日與休息日兩組數據{f(1)}、{f(0)}做環比2日移動平均:當表明城市a和b的工作日交互通訊量通不過所述交互通訊量的突發性檢查,剔除第i+1天城市a和b的所有數據;當表明城市a和b的休息日交互通訊量通不過所述交互通訊量的突發性檢查,剔除第j+1天城市a和b的所有數據。由表(17)、表(18),經檢測:表明ab兩城市12月12日(工作日第i=8天對應日期)的交互通訊量通不過數據突發性檢驗,剔除12月12日(工作日第i=8天)a、b兩城的所有數據。(步驟6.3)連續性檢驗和數據整理:經過突發性檢驗、剔除不符合條件日期的數據后,從剩下的天數中挑選,條件必須滿足:ab兩城時期同步、日期連續、天數等于7天的數據(舍棄其余日期的所有數據),整理得到如下各組數據:aj(0)、bj(0)、aj(0)、bj(0)、其中,i=1~5,j=1~2,并且i和j在日歷表上是連續的7天(5個工作日和2個休息日,也稱為全周期)。經過步驟6.1和步驟6.2,現有符合條件的連續數據的共有9天,即2016-12-03至2016-12-11,其中日期12-03、12-04、12-10、12-11為周六、周日,其余為工作日。因此,我們選定2016-12-03至2016-12-09這7天的數據做樣本(符合5個工作日和2個休息日,并且7天日期是連續的要求),也稱為全周期。現將7天的數據整理成下表:表(19):突發性檢測和連續性檢測后的7天數據【步驟7】整理城際人信綜合聯系強度測算的基礎數據,包括信令數據有效用戶總量均值通訊數據有效用戶總量均值兩城雙向客流量均值兩城交互通訊量均值(步驟7.1)計算整理ab兩城的信令數據有效用戶總量均值:根據步驟1、3、4、6,分別測算城市a和城市b的工作日和休息日的信令數據有效用戶總量均值具體如下:(式01)城市a工作日用戶總量均值(式02)城市a休息日用戶總量均值a(0)(式03)城市b工作日用戶總量均值(式04)城市b休息日用戶總量均值(步驟7.2)計算整理ab兩城的通訊數據有效用戶總量均值:根據步驟2、3、5、6,分別測算城市a和城市b的工作日和休息日的通訊數據有效用戶總量均值具體如下:(式05)城市a工作日用戶總量均值(式06)城市a休息日用戶總量均值(式07)城市b工作日用戶總量均值(式08)城市b休息日用戶總量均值(步驟7.3)計算整理ab兩城的雙向客流量均值:根據步驟1、3、4、6,分別測算工作日和休息日的兩城雙向客流量均值具體如下:(式09)工作日雙向客流量均值(式10)休息日雙向客流量均值(步驟7.4)計算整理ab兩城的交互通訊量均值:根據步驟2、3、5、6,分別測算工作日和休息日的兩城交互通訊量均值具體如下:(式11)工作日交互通訊量均值(式12)休息日交互通訊量均值【步驟8】根據步驟7,計算各種城際人信綜合聯系強度,分別如下:(步驟8.1)工作日和休息日的客流聯系強度:考慮到城際聯系的復雜性、研究使用的廣泛性,我們從單一因子的城際聯系強度到多因子城際聯系強度,作了詳細計算。并且,多因子城際聯系強度更能綜合地、真實地反映城市之間聯系的密切性如何。單一因子是指僅考慮工作日或者休息日某一種“流”的大小,例如工作日城市a對于城市b的客流聯系強度,又例如休息日城市b對于城市a的通訊量聯系強度等等,都是指單一因子的城際聯系強度。多因子聯系強度是指綜合考慮工作日與休息日以后的聯系強度,還有綜合考慮雙向客流與交互通訊流以后的聯系強度,以及考慮工作日、休息日、雙向客流、交互通訊流所有因子的城際聯系強度。根據(式01)~(式04)、(式09)、(式10),分別計算工作日和休息日城際客流聯系強度,如下:(式13)工作日城市a對于城市b的客流聯系強度(式14)休息日城市a對于城市b的客流聯系強度(式15)工作日城市b對于城市a的客流聯系強度(式16)休息日城市b對于城市a的客流聯系強度(步驟8.2)根據(式05)~(式08)、(式11)、(式12),分別計算工作日和休息日城際通訊流聯系強度,即工作日和休息日的通訊流聯系強度單獨計算,如下:(式17)工作日城市a對于城市b的通訊流聯系強度(式18)休息日城市a對于城市b的通訊流聯系強度(式19)工作日城市b對于城市a的通訊流聯系強度(式20)休息日城市b對于城市a的通訊流聯系強度步驟8.1和8.2所計算的城際聯系強度,是區分了工作日和休息日以后的單一聯系強度,因此還有必要綜合考慮工作日與休息日合并起來后的城際聯系強度。(步驟8.3)工作日和休息日合并在一起計算客流聯系強度:根據(式13)~(式16),計算城際客流聯系強度,如下:(式21)城市a對于城市b的客流聯系強度ifa~b(式22)城市b對于城市a的客流聯系強度ifb~a(步驟8.4)工作日和休息日合并在一起計算通訊流聯系強度:根據(式17)~(式20),計算城際通訊流聯系強度,如下:(式23)城市a對于城市b的通訊流聯系強度ifa~b(式24)城市b對于城市a的通訊流聯系強度ifb~a(步驟8.5)單獨計算工作日和休息日的客流與通訊流綜合聯系強度:根據(式13)~(式20)式,分別計算工作日和休息日城際人信綜合聯系強度,如下:(式25)工作日城市a對于城市b的人信綜合聯系強度(式26)休息日城市a對于城市b的人信綜合聯系強度(式27)工作日城市b對于城市a的人信綜合聯系強度(式28)休息日城市b對于城市a的人信綜合聯系強度(步驟8.6)根據(式21)~(式24),計算城際人信綜合聯系強度,如下:(式29)城市a對于城市b人信綜合聯系強度ia~b=ifa~b*80%+ifa~b*20%=0.03636*80%+0.03193*20%=0.0355(式30)城市b對于城市a人信綜合聯系強度ib~a=ifb~a*80%+ifb~a*20%=0.05756*80%+0.05161*20%=0.0564其中,(式29)就是綜合考慮了工作日、休息日、雙向客流、交互通訊流四個因子的城市a對于城市b的人信綜合聯系強度。(式30)就是綜合考慮了工作日、休息日、雙向客流、交互通訊流四個因子的城市b對于城市a的人信綜合聯系強度。聯系強度越大,表示兩個城市之間的聯系越緊密。隨著現代城市經濟的發展,城際聯系是不可或略的研究熱點,通過對城際聯系強度的描述,研究者可以輕松把握城市之間的聯系密切性,從而了解城際發展的內在聯系。有了強度,就可以建立聯系標準的分類,進而可以幫助研究城際聯系強度大小數值的分類標準,例如:0<i<0.01為微弱聯系,0.01≤i<0.03為一般聯系,0.03≤i<0.06為緊密聯系,i≥0.06以上為同城化聯系,等等。i為兩城之間的人信綜合聯系強度,例如:ia~b=0.028,ib~a=0.056,表明對于城市a來講,兩城的聯系緊密性為一般聯系,對于城市b來講,兩城的聯系緊密性為緊密聯系,也就是城市b更加依附于城市a。不同性質的城市,表現出的城際聯系強度特征也不一樣。例如旅游城市的休息日聯系強度會大于工作日的聯系強度,此時可以用單一因子聯系強度更有助于分析旅游城市的城際聯系特征。由于工作日與周末是兩種不同的時期,城際的客流與通訊流會有不同的特征,上述各種強度分別表征了在不同時期的城際客流與通訊流,并依據這種特點對城際聯系強度進行綜合考量,最后測算出城際人信綜合聯系強度。過程中還包括了基于工作日、周末、兩城市雙向客流量、兩城市交互通訊量等四種不同角度測算城際聯系強度,使得這些強度更廣泛地適用于各種不同領域對城際聯系的研究。其中,(式13)~(式16)為單因子客流聯系強度,(式17)~(式20)為單因子通訊流聯系強度;(式21)、(式22)為全周期客流聯系強度,(式23)、(式24)為全周期通訊流聯系強度;(式25)~(式28)為區分工作日、休息日的城際人信綜合聯系強度;(式29)為城市a對于城市b人信綜合聯系強度,(式30)為城市b對于城市a人信綜合聯系強度。當前第1頁12