專利名稱:利用手機數據發現城市活動中異常事件的方法
技術領域:
本發明屬于城市管理和信息技術領域,涉及一種城市異常事件發現方法。
背景技術:
隨著城市化步伐的加快,能夠理解和預測群體事件對于城市管理者尤其是對大城市的管理者來說是一個嚴重的挑戰。當不能準確地確定參加事件的人數時(例如,從門票收入),傳統預測的手段是靠直覺和經驗來估計群體性事件的。即使知道了參加事件的準確人數,那么預測事件參與者對城市管理的影響也是很困難的。事件預測可以采用基于人群分析的方法,在人群分析方法中有事件推理和人群建模兩個概念。事件推理的目標是在給定數據(例如一個地方和集成通話的圖像)情況下檢測人群是否存在。事件推理中的事件可能是可預測的,也可能是對應一個實際的公共異常事件;人群建模的任務包括建立人群模式或者人群描述,這些模式或者描述能夠預測或者模擬人群行為。一個成功的人群模型考慮到了有效的應用,例如空間的預測,計劃的可行性,防止危險情況或以及計劃一個應急疏散都是有效的應用。從三個層次對人群建模進行分析微觀、宏觀、介觀。在微觀層面上,個人是研究對象,而在宏觀層面上的研究對象是群組。介觀層次上的建模包括前兩者的特性,既要把一個群體看成一個有均一水平的團體又要考慮個體之間的相互作用以及個體的特點。對于人群行為的建模,能夠涉及到幾個不同的領域。在計算機視覺中,人群建模是通過視覺手段分析人群的視頻數據來表現周期性行為。在物理學中,受到流體動力學,群, 元胞自動機的啟發發展了許多方法。在過去幾年,“普遍計算社區”開發了一些技術,例如 GSM、藍牙或者無線定位技術;這樣一來我們可以利用這些技術大規模地分析人群事件并得到更重要的信息。從數據收集的角度來看,傳統的人群分析方法由來自控制點的數據聚合(如售出門票數量;在賓館的夜晚,每個房間的人數;總人數)以及從隨機選擇的個人調查組成。在 90年代,從計算機視覺研究帶來另外的(非侵入性的)方法,即檢測密度(人在空間的數量),地點,速度,和人群形狀,通過這些方法提取人群的相關特點。雖然可以對這些屬性進行有用的分析,但是可用相機的數量限制了這種研究。隨著移動電話的爆發,連同現在的傳感器和更先進的通信系統(如GPS、數碼相機、藍牙、WiFi)的出現,使得用中大量的數據來研究群體、個體或者個體與群里的結合成為可能。前述各種技術帶來了不同的挑戰但是這使得相關事件的推論成為可能。當事件被定位在空間時用傳統的方法進行分析是緩慢的、精確的。計算機視覺允許事件的自動推理同時也提供了事件的一些特性,例如上面提到的有限的可視化數據。采用如通信或者GPS 這樣的數字足跡跟蹤可以有更廣闊的區域,但是與前述方法比精度比較低。就細節水平而言,傳統的方法在宏觀粒度(除非個性化數據收集)上是能勝任的,計算機視覺是適用與任何粒度水平尤其適用與宏觀和介觀分析,而這種利用手機位置移動數據或者叫數字足跡(這些手機數據是通過手機的計費數據獲得)的方法在個人隱私受到很好的保護時能用于任何粒度的分析,即微觀水平。當然,這種方法的精度是依靠研究中技術的滲透速率(例如人群中手機用戶的數量)決定的。為能夠在國家、地區或城市管理的水平上調查異常事件對經濟和城市擁塞的影響,從而更有效實現交通規劃及交通物流管理就必須清楚地了解的中、大規模的異常事件及其經濟影響。其中一個問題是在中大規模事件中了解人群模式的穩定性。如果可以找到人群的規律性,那么就可以開發出基于這種人群模式的服務了,并來完善事件的經驗(例如,事件后提供疏散建議);相反的,也可以通過了解居民更愿意參加哪類事件來特征化居民。這就會繪出到每個區域的愛好結構圖,反過來在定位系統上增加愛好結構圖,那么增加了偏好值的地理信息會變成有關的空間語境信息。如果事件參與者的來源位置和事件類型直接相關,就可以通過參與者的來源信息能夠預測事件類型。已經有人確定了事件參與者的來源和事件類型之間存在著關系,那么對于大規模事件就可以通過考慮它的事件類型來推測出是否為異常事件和這個大規模事件額外的需求。例如,可以提供一些關于交通管理決策中的關鍵信息,增加從某個區域到事件地點的公家車路線的數量等。
發明內容
本發明的目的是提供一種能夠快速發現事件參與者的來源和事件類型之間的關系,從事件參與者的來源分布推測出事件類型或者推測是否為異常事件的事件預測方法。 本發明的技術方案如下一種利用手機數據發現城市活動中異常事件的方法,包括下列步驟(1)從某個區域的已知事件中選擇符合下列標準的事件;-參與人數應該滿足所設定的規模;-在空間上相對于相鄰事件是獨立的;-事件的場地是明確區域;-在時間上和該區域的任何事件是獨立的;-至少持續一段時間;(2)利用手機計費數據對符合上述標準的事件進行參與者的篩選和參與者家庭住址的定位,之后對所有的事件進行計數統計來特征化這些事件,得到標準庫的數據集,步驟如下2-1從電信運營商那里獲得匿名手機計費數據;2-2將用戶每使用一次手機視為發生一次用戶事件,對于所搜集到的每個用戶的手機計費數據,統計各個用戶事件的間隔時間,利用由經度、緯度組成的位置點Pi和時間戳 ti來特征化用戶移動行為的個體位置測量數據Hli ;2-3從個體位置測量數據中按照下列方法提取軌跡a.設一個軌跡是一個用戶按時間順序訪問過的η個位置序列Traj =
{Pi — P2 — Λ — pj ;b.對軌跡進行分割得到子軌跡;c.設定時間閾值Tth和空間閾值Sth,對每個子軌跡,確定用戶停止移動的時間和呼叫停止位置點,用一組連續的呼叫停止位置點來表征用戶的停止序列
權利要求
1. 一種利用手機數據發現城市活動中異常事件的方法,包括下列步驟(1)從某個區域的已知事件中選擇符合下列標準的事件;-參與人數應該滿足所設定的規模;-在空間上相對于相鄰事件是獨立的;-事件的場地是明確區域;-在時間上和該區域的任何事件是獨立的;-至少持續一段時間;(2)利用手機計費數據對符合上述標準的事件進行參與者的篩選和參與者家庭住址的定位,之后對所有的事件進行計數統計來特征化這些事件,得到標準庫的數據集,步驟如下1)從電信運營商那里獲得匿名手機計費數據;2)將用戶每使用一次手機視為發生一次用戶事件,對于所搜集到的每個用戶的手機計費數據,統計各個用戶事件的間隔時間,利用由經度、緯度組成的位置點Pi和時間戳、來特征化用戶移動行為的個體位置測量數據Hli ;3)從個體位置測量數據中按照下列方法提取軌跡a.設一個軌跡是一個用戶按時間順序訪問過的η個位置序列Traj={Pi — P2 — Λ — pj ;b.對軌跡進行分割得到子軌跡;c.設定時間閾值Tth和空間閾值Sth,對每個子軌跡,確定用戶停止移動的時間和呼叫停止位置點,用一組連續的呼叫停止位置點來表征用戶的停止序列P = {1)3,?3+1,人,?111},其中 Vs <u^mimaXCdistanCe(PilPj)) 且tm-ts > Tth,序列中的每個呼叫停止位置點稱之為用戶的停留點;4)用戶的家庭位置被認為成在晚上最頻繁的停留點,據此推斷用戶的家庭住址;5)根據下列判據,判斷一個用戶是否是事件的參與者i)用戶在與事件相同的位置單元停留ii)停留時間至少和事件時間有70%的重疊iii)家庭住址和事件位置單元是不同的6)統計各個事件發生的位置單元、參加事件的人數、事件類型,對事件進行計數統計的特征化,建立標準庫的數據集;(3)設事件類型數為K,并設定對數據集進行聚類訓練的初始類中心,對標準庫的數據集里的未經訓練的事件數據進行如下的聚類訓練1)計算每兩個事件之間的距離,并選擇最大距離和最小距離;令a=最大距離/K,b = 最小距離/K,進行下一步;2)對數據集中的每個事件做如下操作a.從當前的初始類中心中找到與該事件最近的類中心;b.如果該事件與最近類中心的距離小于a,則該事件被劃分到該類,否則,將該事件作為一個新的類中心;3)若類中心的個數大于K個,從各個類中心中選取包含事件個數最多的K個類中心作為初始類中心,否則,選取所有的類中心作為初始類中心;4)重復以下操作,直到每個初始類中心m的距離變化小于b :a.計算每個事件與各個初始類中心的距離,將其劃分到最近的類;b.重新計算每個類中心m、半徑d和標準差c;(4)對于發生在該區域里并符合步驟(1)列出的標準的待檢測的新事件,采用步驟(2) 的方法,對事件進行參與者的篩選和參與者家庭住址的定位,之后對待檢測的新事件進行計數統計,得到新的事件數據,再按照步驟(3)的方法聚類訓練,并計算待檢測的新事件和每個類中心m的距離,從中選擇一個最小的距離minD ;如果minD小于(d+3c)則該事件的類型不是異常事件,否則判斷該事件可能為異常事件。
2.根據權利要求1所述的利用手機數據發現城市活動中異常事件的方法,其特征在于,在對每個子軌跡,確定用戶停止移動的時間和呼叫停止位置點之前,對于軌跡,先利用低通濾波器濾去由于手機計費數據噪音產生的子軌跡噪音。
3.根據權利要求1所述的利用手機數據發現城市活動中異常事件的方法,其特征在于,所述的位置單元即是根據郵編劃定的行政區域。
全文摘要
本發明屬于城市管理和信息技術領域,涉及一種利用手機數據發現城市活動中異常事件的方法,包括下列步驟(1)從某個區域的已知事件中選擇符合標準的事件;(2)利用手機計費數據對符合上述標準的事件進行參與者的篩選和參與者家庭住址的定位,之后對所有的事件進行計數統計來特征化這些事件,得到標準庫的數據集;(3)對標準庫的數據集里的未經訓練的事件數據進行聚類訓練;(4)對于發生在該區域里的待檢測的新事件,進行計數統計和聚類訓練,并判斷該事件是否為可能為異常事件。本發明能夠快速發現事件參與者的來源和事件類型之間的關系,從事件參與者的來源分布推測出事件類型或者推測是否為異常事件。
文檔編號G06Q50/00GK102184512SQ20111011961
公開日2011年9月14日 申請日期2011年5月10日 優先權日2011年5月10日
發明者王文俊, 陳飛 申請人:天津大學