一種基于歷史定位信息的數據挖掘方法及裝置的制造方法
【技術領域】
[0001]本發明涉及數據挖掘領域,特別是一種基于歷史定位信息的數據挖掘方法及裝置。
【背景技術】
[0002]隨著計算機技術、通信技術以及各種其他多媒體傳輸技術的發展,信息提供方式變得愈加多種多樣。而針對用戶的生活習慣,有目的地向用戶推送信息是最有效、最合理的方法。
[0003]通過用戶的歷史定位信息能夠一定程度上了解用戶的生活習慣,因此當前亟需一種基于用戶歷史定位信息進行數據挖掘的方案。
【發明內容】
[0004]本發明要解決的技術問題是提供一種基于歷史定位信息的數據挖掘方法及裝置,能夠根據用戶的歷史定位信息挖掘出對信息推送具有參考價值的信息。
[0005]為解決上述技術問題,本發明的實施例提供一種基于歷史定位信息的數據挖掘方法,包括:
[0006]獲取用戶的歷史定位信息;
[0007]根據所述歷史定位信息,確定所述用戶的常去場所以及在所述常去場所的出現時間;
[0008]根據用戶的常去場所以及在所述常去場所的出現時間,確定該常去場所針對所述用戶的語義信息。
[0009]其中,根據所述歷史定位信息,確定所述用戶的常去場所,包括:
[0010]根據所述歷史定位信息,確定用戶在地圖數據中,出現過的多個位置點;
[0011]通過基于密度的聚類分析法,在所有位置點中,確定用戶的常去區域;
[0012]根據地圖數據,確定用戶的常去區域所對應的場所,并將該場所作為用戶的常去場所;
[0013]其中,通過基于密度的聚類分析法,在所述多個位置點中,確定用戶的常去區域,包括:
[0014]以位置點為中心,分別針對每個位置點,確定一第一預設范圍的位置區域;
[0015]將包含位置點最多、且位置點數量多第一預設閾值的一個位置區域確定為用戶的常去區域;
[0016]保存常去區域內所有的位置點,并對距該常去區域的中心點預設距離之內的所有位置點進行過濾;
[0017]基于過濾后剩余的位置點,重新確定用戶另一個常去區域,直至用戶的所有常去區域全部確認完畢。
[0018]其中,根據所述歷史定位信息,確定用戶對應于常去場所的出現時間,包括:
[0019]根據所述歷史定位信息,確定用戶出現在常去場所的多個位置點所對應的定位時間;
[0020]將用戶出現在常去場所的多個位置點對應的定位時間,作為用戶在常去場所的出現時間。
[0021]其中,根據用戶的常去場所以及在所述常去場所的出現時間,確定該常去場所針對所述用戶的語義信息,包括:
[0022]根據用戶在所述常去區域的每個出現時間,與預設的辦公時間、休閑時間以及居家時間進行匹配,得到一匹配結果;
[0023]若所述常去場所為工作場所,且所述匹配結果指示用戶在辦公時間內出現在所述常去場所的次數最多,則將該常去場所確定為用戶的公司;和/或
[0024]若所述常去場所為居住場所,且所述匹配結果指示用戶在居家時間內出現在所述常去場所的次數最多,則將該常去場所確定為用戶的住宅;和/或
[0025]若所述常去場所為服務場所,且所述匹配結果指示用戶在休閑時間內出現在所述常去場所的次數最多,則將該常去場所確定為用戶常去的服務地點。
[0026]其中,若地圖數據將所述常去場所細分為多個子區域,則所述方法還包括:
[0027]根據所述地圖數據,確定所述常去場所中每個子區域所包含的位置點;
[0028]根據子區域中的位置點數量,確定所述常去區域中各個子區域的權重值;
[0029]若某一子區域的權重值大于其他子區域,且其權重值占所有子區域的權重之和的比例大于第二預設閾值,則將該子區域作為用戶在所述常去場所中的具體位置。
[0030]其中,根據所述歷史定位信息,確定用戶在地圖數據中,出現過的多個位置點,包括:
[0031]將所述歷史定位信息按照時間段進行分組;
[0032]根據每一組歷史定位信息,在地圖數據中,確定各時間段內用戶出現過的所有位置點;
[0033]對同一時間段內用戶出現過的所有位置點進行過濾,使得在同一時間段,一個第二預設范圍的區域內,最多保留一個位置點。
[0034]其中,對同一時間段內用戶出現過的所有位置點進行過濾,使得在同一時間段,一個第二預設范圍的區域內,最多保留一個位置點,包括:
[0035]以位置點為中心,分別針對以同一時間段的每個位置點,確定一第二預設范圍的檢測區域;
[0036]在包含位置點最多一個檢測區域中,過濾掉除中心位置點以外的所有其它位置占.V,
[0037]根據過濾后剩余的位置點,重新確定一個包含位置點最多的檢測區域,并進行過濾,直至同一時間段內沒有可再過濾的位置點。
[0038]其中,根據所述歷史定位信息,確定用戶出現過的多個位置點,還包括:
[0039]根據地圖數據,確定并過濾掉坐落在道路、河流、湖泊以及海洋的位置點。
[0040]此外,本發明的另一實施例還提供一種基于歷史定位信息的數據挖掘裝置,包括:
[0041]獲取模塊,用于獲取用戶的歷史定位信息;
[0042]第一處理模塊,用于根據所述歷史定位信息,確定所述用戶的常去場所以及在所述常去場所的出現時間;
[0043]第二處理模塊,用于根據用戶的常去場所以及在所述常去場所的出現時間,確定該常去場所針對所述用戶的語義信息。
[0044]其中,所述第一處理模塊,包括:
[0045]投影子模塊,用于根據所述歷史定位信息,確定用戶在地圖數據中,出現過的多個位置點;
[0046]聚類分子模塊,用于根通過基于密度的聚類分析法,在所有位置點中,確定用戶的常去區域;
[0047]確定子模塊,用于根據地圖數據,確定用戶的常去區域所對應的場所,并將該場所作為用戶的常去場所;
[0048]其中,所述聚類分子模塊包括:
[0049]位置區域確定單元,用于以位置點為中心,分別針對每個位置點,確定一第一預設范圍的位置區域;
[0050]常去區域確定單元,用于將包含位置點最多、且位置點數量多第一預設閾值的一個位置區域確定為用戶的常去區域;
[0051]過濾單元,用于保存常去區域內所有的位置點,并對距該常去區域的中心點預設距離之內的所有位置點進行過濾;
[0052]控制單元,用于控制所述常去區域確定單元以及過濾單元進行循環工作,直至用戶的所有常去區域全部確認完畢。
[0053]其中,所述第一處理模塊,還包括:
[0054]第一確定子模塊,用于根據所述歷史定位信息,確定用戶出現在常去場所的多個位置點所對應的定位時間;
[0055]第二確定子模塊,用于將用戶出現在常去場所的多個位置點對應的定位時間,作為用戶在常去場所的出現時間。
[0056]其中,所述第二處理模塊包括:
[0057]時間匹配子模塊,用于根據用戶在所述常去區域的每個出現時間,與預設的辦公時間、休閑時間以及居家時間進行匹配,得到一匹配結果;
[0058]第一挖掘子模塊,用于若所述常去場所為工作場所,且所述匹配結果指示用戶在辦公時間內出現在所述常去場所的次數最多,則將該常去場所確定為用戶的公司;和/或
[0059]第二挖掘子模塊,用于若所述常去場所為居住場所,且所述匹配結果指示用戶在居家時間內出現在所述常去場所的次數最多,則將該常去場所確定為用戶的住宅;和/或
[0060]第三挖掘子模塊,用于若所述常去場所為服務場所,且所述匹配結果指示用戶在休閑時間內出現在所述常去場所的次數最多,則將該常去場所確定為用戶常去的服務地點。
[0061]其中,若地圖數據將所述常去場所細分為多個子區域,則所述數據挖掘裝置還包括:
[0062]第三處理模塊,用于根據所述地圖數據,確定所述常去場所中每個子區域所包含的位置點;
[0063]第四處理模塊,用于根據子區域中的位置點數量,確定所述常去區域中各個子區域的權重值;
[0064]第五處理模塊,用于若某一子區域的權重值大于其他子區域,且其權重值占所有子區域的權重之和的比例大于第二預設閾值,則將該子區域作為用戶在所述常去場所中的具體位置。
[0065]其中,所述投影子模塊,包括:
[0066]分組單元,用于將所述歷史定位信息按照