地理信息點的確定方法和裝置的制造方法
【專利摘要】本申請公開了地理信息點的確定方法和裝置。所述方法的一【具體實施方式】包括:獲取用戶的定位信息,其中,所述定位信息包括用戶定位坐標;將所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,其中,所述貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得到,其中,所述基本信息包括地理信息點的定位坐標、歷史到訪用戶的歷史定位信息;將最大概率值對應的地理信息點確定為所述用戶所處的地理信息點。該實施方式實現了確定用戶所處的地理信息點。
【專利說明】
地理信息點的確定方法和裝置
技術領域
[0001 ]本申請涉及計算機技術領域,具體涉及互聯網技術領域,尤其涉及地理信息點的確定方法和裝置。
【背景技術】
[0002]地理信息點(Ρ0Ι,Point Of Interest),又稱為“信息點”或“興趣點”,指的是具有一定意義的場所,例如餐館、學校、停車場。現有技術的定位,尤其是對用戶定位,都是針對的用戶所處于的絕對位置進行研究。
[0003]然而,現有技術缺少對用戶所處于的地理信息點的數據進行挖掘和計算,不能確定用戶所處的地理信息點。
【發明內容】
[0004]本申請的目的在于提出一種改進的地理信息點的確定方法和裝置,來解決以上【背景技術】部分提到的技術問題。
[0005]第一方面,本申請提供了一種地理信息點的確定方法,所述方法包括:獲取用戶的定位信息,其中,所述定位信息包括用戶定位坐標;將所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,其中,所述貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得到,其中,所述基本信息包括地理信息點的定位坐標、歷史到訪用戶的歷史定位信息;將最大概率值對應的地理信息點確定為所述用戶所處的地理信息點。
[0006]在一些實施例中,所述貝葉斯預測模型參數包括至少一個地理信息點中每個地理信息點的歷史到訪概率,其中,所述歷史到訪概率根據地理信息點的定位坐標和所述歷史定位信息得到,其中:根據地理信息點的定位坐標和所述歷史定位信息得到歷史到訪概率包括:按照預設規則選取至少一個地理信息點,并建立地理信息點集合;根據所述地理信息點集合中每個地理信息點的定位坐標和所述地理信息點集合中每個歷史到訪用戶定位信息得到所述地理信息點集合中每個歷史到訪次數;計算所述地理信息點集合中的每個地理信息的歷史到訪次數的總和,將所述總和作為地理信息點集合的歷史到訪總次數;根據所述歷史到訪總次數和所述地理信息點集合中的地理信息點的歷史到訪次數,得到所述地理信息點集合中的每個地理信息點的歷史到訪概率。
[0007]在一些實施例中,所述根據地理信息點的定位坐標和所述地理信息點的歷史到訪用戶定位信息得到所述地理信息點的歷史到訪次數,包括:選取地理信息點預設范圍內的歷史用戶;獲取所述歷史定位坐標對應的歷史用戶的歷史定位信息和歷史搜索記錄,其中,歷史定位信息包括歷史定位坐標和采集所述歷史定位坐標時的歷史定位時間;如果所述歷史搜索記錄中包括所述地理信息點的標識信息;則計算所述歷史定位時間和搜索該地理信息點的時間點之間的時間間隔;響應于所述時間間隔小于預定閾值,將所述歷史用戶確定為所述地理信息點的歷史到訪用戶。
[0008]在一些實施例中,所述歷史到訪用戶的歷史定位信息包括歷史定位坐標和所述歷史到訪用戶位于所述歷史定位坐標時的歷史定位時間;以及,所述貝葉斯預測模型參數包括:地理信息點的時間概率分布,其中,所述時間概率分布根據所述地理信息點的歷史到訪用戶的歷史定位時間得到。
[0009]在一些實施例中,所述用戶的定位信息還包括所述用戶位于所述用戶定位坐標時的用戶定位時間;以及,所述將所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,包括:將所述用戶定位時間和所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值。
[0010]在一些實施例中,所述貝葉斯預測模型參數包括地理信息點的定位概率,其中,所述定位概率根據所述地理信息點與聚類中心之間的距離得到,其中,所述聚類中心由至少一個地理信息點聚類得到。
[0011]在一些實施例中,所述聚類中心由至少一個地理信息點聚類得到,包括:通過K-means算法聚類得到至少一個地理信息點的聚類中心,其中:選取至少一個地理信息點,并建立聚類地理信息點集合;根據所述聚類地理信息點集合到訪的總次數確定聚類數目;選取所述聚類數目個定位坐標作為初始聚類中心;將所述聚類數目、所述初始聚類中心對應的坐標和聚類地理信息點集合中地理信息點的定位坐標設置為K-means算法的輸入值,得到所述聚類數目個聚類中心。
[0012]在一些實施例中,所述用戶的定位信息還包括所述用戶位于所述用戶定位坐標時的用戶定位時間;以及,所述獲取用戶的定位信息,包括:篩選出用戶定位時間在預設時間段內的用戶定位坐標,并建立原始用戶定位坐標集合;剔除所述原始用戶定位坐標集合中的異常點,得到用戶定位坐標集合,其中,所述異常點是指在第二預設時間段內移動的距離大于預設距離閾值的坐標點;將所述用戶定位坐標集合中的至少一個用戶定位坐標通過軌跡聚類算法聚合成一個軌跡中心坐標;將所述用戶定位坐標集合中的至少一個用戶定位時間的所對應時間點的平均時間點作為軌跡中心時間;以及,所述將所述軌跡中心坐標和所述軌跡中心時間作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,包括:將所述軌跡中心坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值。
[0013]在一些實施例中,所述方法在將最大概率值對應的地理信息點確定為所述用戶所處的地理信息點后,還包括:對所述用戶的定位信息添加所述最大概率值對應的地理信息點的歷史到訪用戶標記;將帶有歷史到訪用戶標記的所述用戶的定位信息加入到所述貝葉斯預測模型的樣本數據集合中;利用所述樣本數據集合中的樣本數據訓練生成新的貝葉斯預測模型。
[0014]第二方面,本申請提供了一種地理信息點的確定裝置,所述裝置包括:獲取模塊,配置用于獲取用戶的定位信息,其中,所述定位信息包括用戶定位坐標;計算模塊,配置用于將所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,其中,所述貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得到,其中,所述基本信息包括地理信息點的定位坐標、歷史到訪用戶的歷史定位信息;確定模塊,配置用于將最大概率值對應的地理信息點確定為所述用戶所處的地理信息點。
[0015]在一些實施例中,所述貝葉斯預測模型參數包括至少一個地理信息點中每個地理信息點的歷史到訪概率,其中,所述歷史到訪概率根據地理信息點的定位坐標和所述歷史定位信息得到,其中:根據地理信息點的定位坐標和所述歷史定位信息得到歷史到訪概率包括:按照預設規則選取至少一個地理信息點,并建立地理信息點集合;根據所述地理信息點集合中每個地理信息點的定位坐標和所述地理信息點集合中每個歷史到訪用戶定位信息得到所述地理信息點集合中每個歷史到訪次數;計算所述地理信息點集合中的每個地理信息的歷史到訪次數的總和,將所述總和作為地理信息點集合的歷史到訪總次數;根據所述歷史到訪總次數和所述地理信息點集合中的地理信息點的歷史到訪次數,得到所述地理信息點集合中的每個地理信息點的歷史到訪概率。
[0016]在一些實施例中,所述根據地理信息點的定位坐標和所述地理信息點的歷史到訪用戶定位信息得到所述地理信息點的歷史到訪次數,包括:選取地理信息點預設范圍內的歷史用戶;獲取所述歷史定位坐標對應的歷史用戶的歷史定位信息和歷史搜索記錄,其中,歷史定位信息包括歷史定位坐標和采集所述歷史定位坐標時的歷史定位時間;如果所述歷史搜索記錄中包括所述地理信息點的標識信息;則計算所述歷史定位時間和搜索該地理信息點的時間點之間的時間間隔;響應于所述時間間隔小于預定閾值,將所述歷史用戶確定為所述地理信息點的歷史到訪用戶。
[0017]在一些實施例中,所述歷史到訪用戶的歷史定位信息包括歷史定位坐標和所述歷史到訪用戶位于所述歷史定位坐標時的歷史定位時間;以及,所述貝葉斯預測模型參數包括:地理信息點的時間概率分布,其中,所述時間概率分布根據所述地理信息點的歷史到訪用戶的歷史定位時間得到。
[0018]在一些實施例中,所述用戶的定位信息還包括所述用戶位于所述用戶定位坐標時的用戶定位時間;以及,所述計算模塊,進一步用于:將所述用戶定位時間和所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值。
[0019]在一些實施例中,所述貝葉斯預測模型參數包括地理信息點的定位概率,其中,所述定位概率根據所述地理信息點與聚類中心之間的距離得到,其中,所述聚類中心由至少一個地理信息點聚類得到。
[0020]在一些實施例中,所述聚類中心由至少一個地理信息點聚類得到,包括:通過K-means算法聚類得到至少一個地理信息點的聚類中心,其中:選取至少一個地理信息點,并建立聚類地理信息點集合;根據所述聚類地理信息點集合到訪的總次數確定聚類數目;選取所述聚類數目個定位坐標作為初始聚類中心;將所述聚類數目、所述初始聚類中心對應的坐標和聚類地理信息點集合中地理信息點的定位坐標設置為K-means算法的輸入值,得到所述聚類數目個聚類中心。
[0021]在一些實施例中,所述用戶的定位信息還包括所述用戶位于所述用戶定位坐標時的用戶定位時間;以及,所述獲取模塊,進一步用于:篩選出用戶定位時間在預設時間段內的用戶定位坐標,并建立原始用戶定位坐標集合;剔除所述原始用戶定位坐標集合中的異常點,得到用戶定位坐標集合,其中,所述異常點是指在第二預設時間段內移動的距離大于預設距離閾值的坐標點;將所述用戶定位坐標集合中的至少一個用戶定位坐標通過軌跡聚類算法聚合成一個軌跡中心坐標;將所述用戶定位坐標集合中的至少一個用戶定位時間的所對應時間點的平均時間點作為軌跡中心時間;以及,所述將所述軌跡中心坐標和所述軌跡中心時間作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,包括:將所述軌跡中心坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值。
[0022]在一些實施例中,所述裝置還包括更新模塊,配置用于:對所述用戶的定位信息添加所述最大概率值對應的地理信息點的歷史到訪用戶標記;將帶有歷史到訪用戶標記的所述用戶的定位信息加入到所述貝葉斯預測模型的樣本數據集合中;利用所述樣本數據集合中的樣本數據訓練生成新的貝葉斯預測模型。
[0023]本申請提供的地理信息點的確定方法和裝置,通過獲取用戶的定位信息,其中,所述定位信息包括用戶定位坐標;將所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,其中,所述貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得至IJ,其中,所述基本信息包括地理信息點的定位坐標、歷史到訪用戶的歷史定位信息;將最大概率值對應的地理信息點確定為所述用戶所處的地理信息點,實現了確定用戶所處的地理?目息點O
【附圖說明】
[0024]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優點將會變得更明顯:
[0025]圖1是本申請可以應用于其中的示例性系統架構圖;
[0026]圖2是根據本申請的地理信息點的確定方法的一個實施例的流程圖;
[0027]圖3是根據本申請的地理信息點的確定方法的又一個實施例的流程圖;
[0028]圖4是根據本申請的地理信息點的確定方法的地理信息點的時間概率分布;
[0029]圖5是根據本申請的地理信息點的確定裝置的一個實施例的結構示意圖;
[0030]圖6是適于用來實現本申請實施例的終端設備或服務器的計算機系統的結構示意圖。
【具體實施方式】
[0031]下面結合附圖和實施例對本申請作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋相關發明,而非對該發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關發明相關的部分。
[0032]需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。
[0033]圖1示出了可以應用本申請的地理信息點的確定方法或地理信息點的確定裝置的實施例的示例性系統架構100。
[0034]如圖1所示,系統架構100可以包括終端設備101、102、103,網絡104和服務器105。網絡104用以在終端設備101、102、103和服務器105之間提供通信鏈路的介質。網絡104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
[0035]用戶可以使用終端設備101、102、103通過網絡104與服務器105交互,以接收或發送消息等。終端設備101、102、103上可以安裝有各種通訊客戶端應用,例如地圖類應用、購物類應用、搜索類應用、即時通信工具、郵箱客戶端、社交平臺軟件等。
[0036]終端設備101、102、103可以是具有顯示屏并且支持網頁瀏覽的各種電子設備,包括但不限于智能手機、平板電腦、電子書閱讀器、MP3播放器(Moving Picture ExpertsGroup Aud1 Layer 111,動態影像專家壓縮標準音頻層面3)、MP4 (Moving PictureExperts Group Aud1 Layer IV,動態影像專家壓縮標準音頻層面4)播放器、膝上型便攜計算機和臺式計算機等等。
[0037]服務器105可以是提供各種服務的服務器,例如對終端設備101、102、103的定位服務提供支持的定位服務服務器。定位服務服務器可以對接收到的定位數據等數據進行分析等處理。
[0038]需要說明的是,本申請實施例所提供的地理信息點的確定方法一般由服務器105執行,相應地,地理信息點的確定裝置一般設置于服務器105中。
[0039]應該理解,圖1中的終端設備、網絡和服務器的數目僅僅是示意性的。根據實現需要,可以具有任意數目的終端設備、網絡和服務器。
[0040]繼續參考圖2,示出了根據本申請的地理信息點的確定方法的一個實施例的流程200 ο上述的地理信息點的確定方法,包括以下步驟:
[0041 ]步驟201,獲取用戶的定位信息。
[0042]在本實施例中,地理信息點的確定方法運行于其上的電子設備(例如圖1所示的服務器)可以基于用戶所使用的移動終端獲取用戶的定位信息。需要指出的是,上述基于用戶所使用的移動終端獲取用戶的定位信息,可以有多種方式實現,在這里,實現方式包括但不限于基于GPS(Global Posit1ning System,全球定位系統)的定位、基于移動運營網的基站的定位、基于AGPS(Assi stedGPS,輔助全球衛星定位系統)的定位、基于WiFi的定位以及其他現在已知或將來開發的移動終端定位方式。
[0043]在本實施例中,上述用戶的定位信息包括用戶定位坐標。在這里,用戶定位坐標可以是經瑋度坐標。
[0044]步驟202,將用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據貝葉斯預測模型得到用戶處于至少一個地理信息點中每個地理信息點的概率值。
[0045]在本實施例中,基于步驟201中得到用戶的用戶定位坐標,上述電子設備(例如圖1所示的服務器)可以首先將上述定位坐標作為預先訓練貝葉斯預測模型的輸入值;之后再利用貝葉斯預測模型得到用戶處于某個地理信息點的概率;一次或多次利用貝葉斯預測模型得到用戶處于至少一個地理信息點中每個地理信息點的概率,作為示例,可以將用戶的用戶定位坐標作為貝葉斯預測模型的輸入值得到用戶處于甲地的概率是a,再利用貝葉斯預測模型預測上述用戶得到用戶處于乙地的概率是b。
[0046]在本實施例中,貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得至IJ,其中,上述基本信息包括地理信息點的定位坐標,歷史到訪用戶的歷史定位信息。在這里,上述貝葉斯預測模型是以貝葉斯公式為基礎原理所建立的預測模型,作為示例,應用于本實施例的貝葉斯公式可以用下式表示:
[0047]P(U|poi)=A*B
[0048]其中,poi表示某一地理信息點,U表示用戶的定位信息,P(U|poi)表示用戶處于某一地理信息點的概率,A、B均是貝葉斯預測模型參數,*表示參數貝葉斯預測模型A和貝葉斯預測模型參數B之間具有運算關系,上述運算關系包括但不限于乘積關系、加和關系。
[0049]在本實施例的一些可選的實現方式中,上述貝葉斯預測模型參數包括至少一個地理信息點中每個地理信息點的歷史到訪概率,其中,上述歷史到訪概率根據地理信息點的定位坐標和上述歷史定位信息得到,其中,可以通過以下步驟得到根據地理信息的定位坐標和上述歷史定位信息到底歷史到訪概率:按照預設規則選取至少一個地理信息點,并建立地理信息點集合;根據上述地理信息點集合中每個地理信息點的定位坐標和上述地理信息點集合中每個歷史到訪用戶定位信息得到上述地理信息點集合中每個歷史到訪次數;計算上述地理信息點集合中的每個地理信息的歷史到訪次數的總和,將上述總和作為地理信息點集合的歷史到訪總次數;根據上述歷史到訪總次數和上述地理信息點集合中的地理信息點的歷史到訪次數,得到上述地理信息點集合中的每個地理信息點的歷史到訪概率。
[0050]作為示例,選取距離較近的三個地理信息點建立地理信息點集合,三個地理信息點分別命名為地理信息點a、地理信息點b、地理信息點c,這三個地理信息點到訪的在一天中到訪的總次數是100次,其中到訪地理信息點a的次數是20次,到訪地理信息點b的次數堵車30次,到訪地理信息點c的次數是50次,那么地理信息點a的歷史到訪概率是20/100為百分之二十,那么地理信息點a的歷史到訪概率是30/100為百分之三十,那么地理信息點a的歷史到訪概率是50/100為百分之五十。
[0051]可選地,根據地理信息點的定位坐標和上述地理信息點的歷史到訪用戶定位信息得到上述地理信息點的歷史到訪次數,可以通過以下步驟得到:選取地理信息點預設范圍內的歷史用戶;獲取上述歷史定位坐標對應的歷史用戶的歷史定位信息和歷史搜索記錄,其中,歷史定位信息包括歷史定位坐標和采集上述歷史定位坐標時的歷史定位時間;如果上述歷史搜索記錄中包括上述地理信息點的標識信息;則計算上述歷史定位時間和搜索該地理信息點的時間點之間的時間間隔;響應于上述時間間隔小于預定閾值,將上述歷史用戶確定為上述地理信息點的歷史到訪用戶。
[0052]作為示例,選取地理信息點甲的半徑100米范圍內上午10點到11點的歷史用戶,例如用戶張一在上午10點30分位于此范圍內,然后獲取張一的搜索記錄,如果搜索記錄,如果搜索記錄中包括地理信息點甲的標識信息,比如地理信息點甲的名稱、與地理信息點甲的名稱相似的名稱,再后,獲取搜索地理信息點甲的標識信息的時間點,比如是10點15分,搜索時間點10點15分與歷史定位時間10點30分時間間隔小于預定閾值,則將上述歷史用戶確定為上述地理信息點的歷史到訪用戶,可以理解的是,上述預定閾值可以是半小時,可以是一天,也可以是一個月。
[0053]可選地,根據地理信息點的定位坐標和上述地理信息點的歷史到訪用戶定位信息得到上述地理信息點的歷史到訪次數,可以通過以下方式得到:獲取歷史用戶連接WiFi的數據,如果此WiFi已確定屬于某一地理信息點,那么可以確定此歷史用戶為該地理信息點的歷史到訪用戶。
[0054]可選地,根據預設規則選取至少一個地理信息點,并建立地理信息點集合,其中,選取至少一個地理的預設規則可以是選取以用戶為中心,預定范圍內的若干個地理信息點。也可以是預先根據地理信息點的密集程度建立了將某一區域的地理信息點劃分為若干個地理信息點集合,例如,將某一大學校園分別以主教學樓、體育館、圖書館為中心,建立三個地理信息點集合,其中,以體育館為中心的地理信息點集合中可能包括器材室、操場。
[0055]在本實施例一些可選的實現方式中,上述貝葉斯預測模型參數包括地理信息點的定位概率,其中,上述定位概率根據上述地理信息點與聚類中心之間的距離得到,其中,上述聚類中心由至少一個地理信息點聚類得到。例如,將上述地理信息點與上述聚類中心之間距離的反比作為上述地理信息點的定位概率。當然,還可以將地理信息點與聚類中心之間距離的反比再乘以系數作為上述地理信息點的定位概率。
[0056]可選地,可以利用上述聚類中心為上述用戶與地理信息點之間的橋梁,首先計算用戶-聚類中心概率,例如可以將上述用戶與聚類中心距離的反比作為用戶-聚類中心概率,再將用戶-聚類中心概率與上述定位概率的乘積作為用戶在地理信息點的概率。作為示例,用戶甲在聚類中心A和聚類中心B附近,用戶甲與聚類中心A之間的距離是10米,用戶甲與聚類中心A之間的距離是20米;聚類中心A的聚類地理信息點集合中有地理信息點c和地理信息點d,其中,地理信息點c與聚類中心A之間的距離I米,地理信息點c與聚類中心A之間的距離是2米;聚類中心B的聚類地理信息點集合中有地理信息點e,其中,地理信息點e與聚類中心B之間的距離是4米;那么,如果將地理中心與聚類中心之間距離的反比作為定位概率,那么地理信息點a的定位概率是1/1,那么地理信息點b的定位概率是1/2,那么地理信息點c的定位概率是1/4,用戶與聚類中心A之間的用戶-聚類中心概率是1/10,用戶與聚類中心B之間的用戶-聚類中心概率是1/20;最后,得到,上述用戶在地理信息點a的概率是(I/
1)*(1/10),上述用戶在地理信息點b的概率是(1/2)*(1/10),上述用戶在地理信息點c的概率是(1/4)*(1/20)。在這里,表示除號,表示運算,優選地,表示乘號。
[0057]可選地,至少一個地理信息點聚類得到聚類中心可以隨機劃分區域,可以利用聚類算法聚類,其中,聚類算法包括但不限于:k-means聚類算法、層次聚類算法、SOM聚類算法、FCM聚類算法。應該理解,上述聚類算法本身的計算過程是本領域的技術人員所公知的,在此不作贅述。
[0058]可選地,可以通過K-means算法聚類得到至少一個地理信息點的聚類中心,可選地,具體過程如下:選取至少一個地理信息點,并建立聚類地理信息點集合;根據上述聚類地理信息點集合到訪的總次數確定聚類數目;選取上述聚類數目個定位坐標作為初始聚類中心;將上述聚類數目、上述初始聚類中心對應的坐標和聚類地理信息點集合中地理信息點的定位坐標設置為K-means算法的輸入值,得到上述聚類數目個聚類中心。應該理解,K-means算法是本領域的技術人員公知的聚類算法,在此不作贅述。
[0059]可選地,可以根據聚類地理信息集合中地理信息點的個數確定聚類數目,也可以根據聚類地理信息點集合中地理信息點分布是否具有明顯的分區密集的現象確定地理信息點的個數。
[0060]可選地,可以隨機選取上述聚類數目個定位坐標作為初始聚類中心,也可以將歷史到訪概率大于預定閾值的地理信息點的定位坐標作為初始聚類中心。
[0061 ]步驟203,將最大概率值對應的地理信息點確定為上述用戶所處的地理信息點。
[0062]在本實施例中,基于步驟202得到的用戶處于至少一個地理信息點中每個地理信息點的概率值,上述概率值中選取出最大的概率值作為最大概率值,將最大概率值對應的地理信息點確定為上述用戶所處的地理信息點。
[0063]本申請的上述實施例提供的方法通過利用地理信息點的歷史到訪概率和定位概率,實現了確定用戶所處的地理信息點。
[0064]進一步參考圖3,其示出了地理信息點的確定方法的又一個實施例的流程300。該地理信息點的確定方法的流程300,包括以下步驟:
[0065]步驟301,獲取用戶的用戶定位坐標和用戶定位時間。
[0066]在本實施例中,地理信息點的確定方法運行于其上的電子設備(例如圖1所示的服務器)可以基于用戶所使用的移動終端獲取用戶的定位信息。
[0067]在本實施例中,上述用戶的定位信息包括用戶定位坐標和上述用戶位于上述用戶定位坐標時的用戶定位時間。可以通過以下步驟獲取用戶的定位信息:篩選出用戶定位時間在預設時間段內的用戶定位坐標,并建立原始用戶定位坐標集合;剔除上述原始用戶定位坐標集合中的異常點,得到用戶定位坐標集合,其中,上述異常點是指在第二預設時間段內移動的距離大于預設距離閾值的坐標點;將上述用戶定位坐標集合中的至少一個用戶定位坐標通過軌跡聚類算法聚合成一個軌跡中心坐標;將上述用戶定位坐標集合中的至少一個用戶定位時間的所對應時間點的平均時間點作為軌跡中心時間;將上述軌跡中心坐標和上述軌跡中心時間作為預先訓練的貝葉斯預測模型的輸入值,并根據上述貝葉斯預測模型得到上述用戶處于至少一個地理信息點中每個地理信息點的概率值。
[0068]步驟302,將用戶定位坐標和用戶定位時間作為預先訓練的貝葉斯預測模型的輸入值,并根據貝葉斯預測模型得到用戶處于至少一個地理信息點中每個地理信息點的概率值。
[0069]在本實施例中,基于步驟301中得到用戶的用戶定位坐標,上述電子設備(例如圖1所示的服務器)可以首先將上述定位坐標作為預先訓練貝葉斯預測模型的輸入值;之后再利用貝葉斯預測模型得到用戶處于某個地理信息點的概率;一次或多次利用貝葉斯預測模型得到用戶處于至少一個地理信息點的概率。
[0070]在本實施例中,貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得至IJ,其中,上述基本信息包括地理信息點的定位坐標,歷史到訪用戶的歷史定位信息。在這里,上述貝葉斯預測模型是以貝葉斯公式為基礎原理所建立的預測模型,作為示例,應用于本實施例的貝葉斯公式可以用下式表示:
[0071]P(U|poi)=A*B
[0072]其中,poi表示某一地理信息點,U表示用戶的定位信息,P(U|poi)表示用戶處于某一地理信息點的概率,A、B均是貝葉斯預測模型參數,*表示參數貝葉斯預測模型A和貝葉斯預測模型參數B之間具有運算關系,上述運算關系包括但不限于乘積關系、加和關系。
[0073]在本實施例中,上述貝葉斯預測模型參數包括至少一個地理信息點中每個地理信息點的歷史到訪概率,其中,上述歷史到訪概率根據地理信息點的定位坐標和上述歷史定位ig息得到O
[0074]在本實施例中,上述貝葉斯預測模型參數包括地理信息點的定位概率,其中,上述定位概率根據上述地理信息點與聚類中心之間的距離得到,其中,上述聚類中心由至少一個地理信息點聚類得到。
[0075]在本實施例中,上述貝葉斯預測模型參數包括地理信息點的時間概率分布,其中,上述時間概率分布根據地理信息點的歷史到訪用戶的歷史定位時間得到,其中,上述歷史定位時間是歷史到訪用戶處于歷史定位坐標時的時間點,歷史定位坐標和歷史定位時間屬于歷史到訪用戶的歷史定位信息,通過采集歷史用戶的歷史定位信息得到上述歷史定位坐標和歷史定位時間。作為示例,可以參考圖4,其示出了地理信息點按照一周的時間概率分布。地理信息點甲在一周七天里總共有100個歷史到訪用戶,周一到周五每天有10個歷史到訪用戶,周六有20個歷史到訪用戶,周日有30個歷史到訪用戶,在這里,假定每個歷史到訪用戶到訪地理信息點甲一次。可以建立以星期為周期的時間概率分布。
[0076]可選地,時間概率分布的周期可以是一天的二十四小時,可以是一周的七天,可以是一個月的天數,可以是一年的十二個月,也可以是一年的四個季度。當然,也可以上述周期形式的組合。作為示例,可以建立一天二十四小時和一周七天的組合,某用戶在周五的19點到訪地理信息點甲的概率,可以將周五在地理信息點甲一周中對應的時間概率和19點在地理信息點甲一天中對應的時間概率,作為參數值計算該用戶在周五的19點到訪地理信息點甲的概率。
[0077]在本實施例一些可選的實現方式中,上述用戶的定位信息還包括上述用戶位于上述用戶定位坐標時的用戶定位時間,可以將上述用戶定位時間和上述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據上述貝葉斯預測模型得到上述用戶處于至少一個地理信息點中每個地理信息點的概率值。
[0078]步驟303,將最大概率值對應的地理信息點確定為用戶所處的地理信息點。
[0079]在本實施例中,基于步驟302得到的用戶處于至少一個地理信息點中每個地理信息點的概率值,上述概率值中選取出最大的概率值作為最大概率值,將最大概率值對應的地理信息點確定為上述用戶所處的地理信息點。
[0080]步驟304,基于用戶的定位信息生成新的貝葉斯預測模型。
[0081]在本實施例中,基于步驟303,對上述用戶的定位信息添加上述最大概率值對應的地理信息點的歷史到訪用戶標記,將帶有歷史到訪用戶標記的上述用戶的定位信息加入到上述貝葉斯預測模型的樣本數據集合中,利用上述樣本數據集合中的樣本數據訓練生成新的貝葉斯預測模型。
[0082]從圖3中可以看出,與圖2對應的實施例相比,本實施例中的地理信息點的確定方法的流程300突出了引入用戶的用戶定位時間的步驟,并且利用了地理信息點的時間概率分布,從而實現更準確地確定用戶所處的地理信息點。
[0083]進一步參考圖5,作為對上述各圖所示方法的實現,本申請提供了一種地理信息點的確定裝置的一個實施例,該裝置實施例與圖2所示的方法實施例相對應,該裝置具體可以應用于各種電子設備中。
[0084]如圖5所示,本實施例上述的地理信息點的確定裝置500包括:獲取模塊501、計算模塊502、確定模塊503。其中,獲取模塊,配置用于獲取用戶的定位信息,其中,上述定位信息包括用戶定位坐標;計算模塊,配置用于將上述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據上述貝葉斯預測模型得到上述用戶處于至少一個地理信息點中每個地理信息點的概率值,其中,上述貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得到,其中,上述基本信息包括地理信息點的定位坐標、歷史到訪用戶的歷史定位信息;確定模塊,配置用于將最大概率值對應的地理信息點確定為上述用戶所處的地理信息點。
[0085]在本實施例中,地理信息點的確定裝置500的獲取模塊501可以基于用戶所使用的移動終端獲取用戶的定位信息。需要指出的是,上述基于用戶所使用的移動終端獲取用戶的定位信息,可以有多種方式實現。
[0086]在本實施例中,基于獲取模塊501得到的用戶的定位信息,上述計算模塊502可以獲取模塊501中得到用戶的用戶定位坐標,上述電子設備(例如圖1所示的服務器)可以首先將上述定位坐標作為預先訓練貝葉斯預測模型的輸入值;之后再利用貝葉斯預測模型得到用戶處于某個地理信息點的概率;一次或多次利用貝葉斯預測模型得到用戶處于至少一個地理信息點中每個地理信息點的概率。
[0087]在本實施例中,基于計算模塊502得到的用戶處于至少一個地理信息點中每個地理信息點的概率值,確定模塊503從上述概率值中選取出最大的概率值作為最大概率值,將最大概率值對應的地理信息點確定為上述用戶所處的地理信息點。
[0088]在本實施例一些可選的實現方式中,地理信息點的確定裝置500還包括更新模塊504,配置用于對上述用戶的定位信息添加上述最大概率值對應的地理信息點的歷史到訪用戶標記,將帶有歷史到訪用戶標記的上述用戶的定位信息加入到上述貝葉斯預測模型的樣本數據集合中,利用上述樣本數據集合中的樣本數據訓練生成新的貝葉斯預測模型。
[0089]本領域技術人員可以理解,上述地理信息點的確定裝置500還包括一些其他公知結構,例如處理器、存儲器等,為了不必要地模糊本公開的實施例,這些公知的結構在圖5中未示出。
[0090]下面參考圖6,其示出了適于用來實現本申請實施例的服務器的計算機系統600的結構示意圖。
[0091]如圖6所示,計算機系統600包括中央處理單元(CPU)601,其可以根據存儲在只讀存儲器(R0M)602中的程序或者從存儲部分608加載到隨機訪問存儲器(RAM)603中的程序而執行各種適當的動作和處理。在RAM 603中,還存儲有系統600操作所需的各種程序和數據。CPU 60KROM 602以及RAM 603通過總線604彼此相連。輸入/輸出(I/O)接口605也連接至總線 604。
[0092]以下部件連接至I/O接口605:包括鍵盤、鼠標等的輸入部分606 ;包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚聲器等的輸出部分607;包括硬盤等的存儲部分608;以及包括諸如LAN卡、調制解調器等的網絡接口卡的通信部分609。通信部分609經由諸如因特網的網絡執行通信處理。驅動器610也根據需要連接至I/O接口 605。可拆卸介質611,諸如磁盤、光盤、磁光盤、半導體存儲器等等,根據需要安裝在驅動器610上,以便于從其上讀出的計算機程序根據需要被安裝入存儲部分608。
[0093]特別地,根據本公開的實施例,上文參考流程圖描述的過程可以被實現為計算機軟件程序。例如,本公開的實施例包括一種計算機程序產品,其包括有形地包含在機器可讀介質上的計算機程序,上述計算機程序包含用于執行流程圖所示的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分609從網絡上被下載和安裝,和/或從可拆卸介質611被安裝。
[0094]附圖中的流程圖和框圖,圖示了按照本申請各種實施例的系統、方法和計算機程序產品的可能實現的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,上述模塊、程序段、或代碼的一部分包含一個或多個用于實現規定的邏輯功能的可執行指令。也應當注意,在有些作為替換的實現中,方框中所標注的功能也可以以不同于附圖中所標注的順序發生。例如,兩個接連地表示的方框實際上可以基本并行地執行,它們有時也可以按相反的順序執行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執行規定的功能或操作的專用的基于硬件的系統來實現,或者可以用專用硬件與計算機指令的組合來實現。
[0095]描述于本申請實施例中所涉及到的模塊可以通過軟件的方式實現,也可以通過硬件的方式來實現。所描述的模塊也可以設置在處理器中,例如,可以描述為:一種處理器包括獲取模塊、計算模塊、確定模塊。其中,這些模塊的名稱在某種情況下并不構成對該模塊本身的限定,例如,獲取模塊還可以被描述為“獲取用戶的定位信息的模塊”。
[0096]作為另一方面,本申請還提供了一種非易失性計算機存儲介質,該非易失性計算機存儲介質可以是上述實施例中上述裝置中所包含的非易失性計算機存儲介質;也可以是單獨存在,未裝配入終端中的非易失性計算機存儲介質。上述非易失性計算機存儲介質存儲有一個或者多個程序,當上述一個或者多個程序被一個設備執行時,使得上述設備:獲取用戶的定位信息,其中,上述定位信息包括用戶定位坐標;將上述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據上述貝葉斯預測模型得到上述用戶處于至少一個地理信息點中每個地理信息點的概率值,其中,上述貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得到,其中,上述基本信息包括地理信息點的定位坐標、歷史到訪用戶的歷史定位信息;將最大概率值對應的地理信息點確定為上述用戶所處的地理信息點。
[0097]以上描述僅為本申請的較佳實施例以及對所運用技術原理的說明。本領域技術人員應當理解,本申請中所涉及的發明范圍,并不限于上述技術特征的特定組合而成的技術方案,同時也應涵蓋在不脫離上述發明構思的情況下,由上述技術特征或其等同特征進行任意組合而形成的其它技術方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術特征進行互相替換而形成的技術方案。
【主權項】
1.一種地理信息點的確定方法,其特征在于,所述方法包括: 獲取用戶的定位信息,其中,所述定位信息包括用戶定位坐標; 將所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,其中,所述貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得到,其中,所述基本信息包括地理信息點的定位坐標、歷史到訪用戶的歷史定位信息; 將最大概率值對應的地理信息點確定為所述用戶所處的地理信息點。2.根據權利要求1所述的方法,其特征在于,所述貝葉斯預測模型參數包括至少一個地理信息點中每個地理信息點的歷史到訪概率,其中,所述歷史到訪概率根據地理信息點的定位坐標和所述歷史定位信息得到,其中: 根據地理信息點的定位坐標和所述歷史定位信息得到歷史到訪概率包括: 按照預設規則選取至少一個地理信息點,并建立地理信息點集合; 根據所述地理信息點集合中每個地理信息點的定位坐標和所述地理信息點集合中每個歷史到訪用戶定位信息得到所述地理信息點集合中每個歷史到訪次數; 計算所述地理信息點集合中的每個地理信息的歷史到訪次數的總和,將所述總和作為地理信息點集合的歷史到訪總次數; 根據所述歷史到訪總次數和所述地理信息點集合中的地理信息點的歷史到訪次數,得到所述地理信息點集合中的每個地理信息點的歷史到訪概率。3.根據權利要求2所述的方法,其特征在于,所述根據地理信息點的定位坐標和所述地理信息點的歷史到訪用戶定位信息得到所述地理信息點的歷史到訪次數,包括: 選取地理信息點預設范圍內的歷史用戶; 獲取所述歷史定位坐標對應的歷史用戶的歷史定位信息和歷史搜索記錄,其中,歷史定位信息包括歷史定位坐標和采集所述歷史定位坐標時的歷史定位時間; 如果所述歷史搜索記錄中包括所述地理信息點的標識信息; 則計算所述歷史定位時間和搜索該地理信息點的時間點之間的時間間隔; 響應于所述時間間隔小于預定閾值,將所述歷史用戶確定為所述地理信息點的歷史到訪用戶。4.根據權利要求1所述的方法,其特征在于,所述歷史到訪用戶的歷史定位信息包括歷史定位坐標和所述歷史到訪用戶位于所述歷史定位坐標時的歷史定位時間;以及, 所述貝葉斯預測模型參數包括: 地理信息點的時間概率分布,其中,所述時間概率分布根據所述地理信息點的歷史到訪用戶的歷史定位時間得到。5.根據權利要求4所述的方法,其特征在于,所述用戶的定位信息還包括所述用戶位于所述用戶定位坐標時的用戶定位時間;以及, 所述將所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,包括: 將所述用戶定位時間和所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值。6.根據權利要求1所述的方法,其特征在于,所述貝葉斯預測模型參數包括地理信息點的定位概率,其中,所述定位概率根據所述地理信息點與聚類中心之間的距離得到,其中,所述聚類中心由至少一個地理信息點聚類得到。7.根據權利要求6所述的方法,其特征在于,所述聚類中心由至少一個地理信息點聚類得到,包括: 通過K-means算法聚類得到至少一個地理信息點的聚類中心,其中: 選取至少一個地理信息點,并建立聚類地理信息點集合; 根據所述聚類地理信息點集合到訪的總次數確定聚類數目; 選取所述聚類數目個定位坐標作為初始聚類中心; 將所述聚類數目、所述初始聚類中心對應的坐標和聚類地理信息點集合中地理信息點的定位坐標設置為K-means算法的輸入值,得到所述聚類數目個聚類中心。8.根據權利要求1-7任一項所述的方法,其特征在于,所述用戶的定位信息還包括所述用戶位于所述用戶定位坐標時的用戶定位時間;以及, 所述獲取用戶的定位信息,包括: 篩選出用戶定位時間在預設時間段內的用戶定位坐標,并建立原始用戶定位坐標集合; 剔除所述原始用戶定位坐標集合中的異常點,得到用戶定位坐標集合,其中,所述異常點是指在第二預設時間段內移動的距離大于預設距離閾值的坐標點; 將所述用戶定位坐標集合中的至少一個用戶定位坐標通過軌跡聚類算法聚合成一個軌跡中心坐標; 將所述用戶定位坐標集合中的至少一個用戶定位時間的所對應時間點的平均時間點作為軌跡中心時間;以及, 所述將所述軌跡中心坐標和所述軌跡中心時間作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,包括: 將所述軌跡中心坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值。9.根據權利要求8所述的方法,其特征在于,所述方法在將最大概率值對應的地理信息點確定為所述用戶所處的地理信息點后,還包括: 對所述用戶的定位信息添加所述最大概率值對應的地理信息點的歷史到訪用戶標記;將帶有歷史到訪用戶標記的所述用戶的定位信息加入到所述貝葉斯預測模型的樣本數據集合中; 利用所述樣本數據集合中的樣本數據訓練生成新的貝葉斯預測模型。10.一種地理信息點的確定裝置,其特征在于,所述裝置包括: 獲取模塊,配置用于獲取用戶的定位信息,其中,所述定位信息包括用戶定位坐標; 計算模塊,配置用于將所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,其中,所述貝葉斯預測模型利用地理信息點的基本信息作為樣本數據訓練得到,其中,所述基本信息包括地理信息點的定位坐標、歷史到訪用戶的歷史定位信息; 確定模塊,配置用于將最大概率值對應的地理信息點確定為所述用戶所處的地理信息點。11.根據權利要求10所述的裝置,其特征在于,所述貝葉斯預測模型參數包括至少一個地理信息點中每個地理信息點的歷史到訪概率,其中,所述歷史到訪概率根據地理信息點的定位坐標和所述歷史定位信息得到,其中: 根據地理信息點的定位坐標和所述歷史定位信息得到歷史到訪概率包括: 按照預設規則選取至少一個地理信息點,并建立地理信息點集合; 根據所述地理信息點集合中每個地理信息點的定位坐標和所述地理信息點集合中每個歷史到訪用戶定位信息得到所述地理信息點集合中每個歷史到訪次數; 計算所述地理信息點集合中的每個地理信息的歷史到訪次數的總和,將所述總和作為地理信息點集合的歷史到訪總次數; 根據所述歷史到訪總次數和所述地理信息點集合中的地理信息點的歷史到訪次數,得到所述地理信息點集合中的每個地理信息點的歷史到訪概率。12.根據權利要求11所述的裝置,其特征在于,所述根據地理信息點的定位坐標和所述地理信息點的歷史到訪用戶定位信息得到所述地理信息點的歷史到訪次數,包括: 選取地理信息點預設范圍內的歷史用戶; 獲取所述歷史定位坐標對應的歷史用戶的歷史定位信息和歷史搜索記錄,其中,歷史定位信息包括歷史定位坐標和采集所述歷史定位坐標時的歷史定位時間; 如果所述歷史搜索記錄中包括所述地理信息點的標識信息; 則計算所述歷史定位時間和搜索該地理信息點的時間點之間的時間間隔; 響應于所述時間間隔小于預定閾值,將所述歷史用戶確定為所述地理信息點的歷史到訪用戶。13.根據權利要求10所述的裝置,其特征在于,所述歷史到訪用戶的歷史定位信息包括歷史定位坐標和所述歷史到訪用戶位于所述歷史定位坐標時的歷史定位時間;以及, 所述貝葉斯預測模型參數包括: 地理信息點的時間概率分布,其中,所述時間概率分布根據所述地理信息點的歷史到訪用戶的歷史定位時間得到。14.根據權利要求13所述的裝置,其特征在于,所述用戶的定位信息還包括所述用戶位于所述用戶定位坐標時的用戶定位時間;以及, 所述計算模塊,進一步用于: 將所述用戶定位時間和所述用戶定位坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值。15.根據權利要求10所述的裝置,其特征在于,所述貝葉斯預測模型參數包括地理信息點的定位概率,其中,所述定位概率根據所述地理信息點與聚類中心之間的距離得到,其中,所述聚類中心由至少一個地理信息點聚類得到。16.根據權利要求15所述的裝置,其特征在于,所述聚類中心由至少一個地理信息點聚類得到,包括: 通過K-means算法聚類得到至少一個地理信息點的聚類中心,其中: 選取至少一個地理信息點,并建立聚類地理信息點集合; 根據所述聚類地理信息點集合到訪的總次數確定聚類數目; 選取所述聚類數目個定位坐標作為初始聚類中心; 將所述聚類數目、所述初始聚類中心對應的坐標和聚類地理信息點集合中地理信息點的定位坐標設置為K-means算法的輸入值,得到所述聚類數目個聚類中心。17.根據權利要求10-16任一項所述的裝置,其特征在于,所述用戶的定位信息還包括所述用戶位于所述用戶定位坐標時的用戶定位時間;以及, 所述獲取模塊,進一步用于:篩選出用戶定位時間在預設時間段內的用戶定位坐標,并建立原始用戶定位坐標集合; 剔除所述原始用戶定位坐標集合中的異常點,得到用戶定位坐標集合,其中,所述異常點是指在第二預設時間段內移動的距離大于預設距離閾值的坐標點; 將所述用戶定位坐標集合中的至少一個用戶定位坐標通過軌跡聚類算法聚合成一個軌跡中心坐標; 將所述用戶定位坐標集合中的至少一個用戶定位時間的所對應時間點的平均時間點作為軌跡中心時間;以及, 所述將所述軌跡中心坐標和所述軌跡中心時間作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值,包括: 將所述軌跡中心坐標作為預先訓練的貝葉斯預測模型的輸入值,并根據所述貝葉斯預測模型得到所述用戶處于至少一個地理信息點中每個地理信息點的概率值。18.根據權利要求17所述的裝置,其特征在于,所述裝置還包括更新模塊,配置用于: 對所述用戶的定位信息添加所述最大概率值對應的地理信息點的歷史到訪用戶標記; 將帶有歷史到訪用戶標記的所述用戶的定位信息加入到所述貝葉斯預測模型的樣本數據集合中; 利用所述樣本數據集合中的樣本數據訓練生成新的貝葉斯預測模型。
【文檔編號】G06K9/62GK105893537SQ201610196304
【公開日】2016年8月24日
【申請日】2016年3月31日
【發明人】程允勝, 吳海山, 汪天, 汪天一, 許夢雯
【申請人】百度在線網絡技術(北京)有限公司