專利名稱:興趣點流行度獲取方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及導(dǎo)航領(lǐng)域,特別是涉及一種興趣點流行度獲取方法和裝置。
技術(shù)背景
隨著地理信息系統(tǒng)的發(fā)展和完善,電子地圖的設(shè)計開發(fā)技術(shù)也日趨成熟。電子地圖中,有一類數(shù)據(jù)被稱為興趣點(Point of Interest,Ρ0Ι),是指人們感興趣的數(shù)據(jù),如餐館、公園、商場等建筑物信息,或是一些街道信息等等。通常,POI數(shù)據(jù)主要包括名稱、類別、 坐標(biāo)(如經(jīng)緯度)、地址、電話、郵編等等信息。POI數(shù)據(jù)是電子地圖中最重要的元素之一, 也是人們使用電子地圖時最為關(guān)注的信息。
電子地圖通常包含很多的POI數(shù)據(jù),這些POI數(shù)據(jù)涵蓋了該地圖范圍內(nèi)的絕大部分地理信息。但是,電子地圖中各POI的流行度有所不同,POI流行度是用于評估不同POI 數(shù)據(jù)重要程度的指標(biāo),在汽車導(dǎo)航、生活搜索等領(lǐng)域具有廣泛的應(yīng)用。
目前,還沒有比較成熟的POI流行度獲取方法,傳統(tǒng)上,POI流行度主要是通過計算POI屬性信息的豐富程度獲取得到,也就是說,通過計算POI數(shù)據(jù)所包含的名稱、類別、坐標(biāo)、地址、電話、郵編等信息的豐富程度,進而評估獲得POI流行度。
在對現(xiàn)有技術(shù)的研究和實踐過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)存在以下問題現(xiàn)有 POI流行度的獲取方法僅考慮了 POI數(shù)據(jù)屬性信息的豐富程度,而POI屬性信息的豐富程度并不能非常客觀準(zhǔn)確的反映出其被關(guān)注的重要程度。因此,迫切需要一種獲取POI流行度的技術(shù)方案,該方案獲取的POI流行度能夠準(zhǔn)確客觀地反映POI被人們關(guān)注的重要程度,以滿足地理信息系統(tǒng)的高速發(fā)展的需求。發(fā)明內(nèi)容
本發(fā)明實施例提供一種興趣點流行度獲取方法和裝置,使獲得的POI流行度能夠更加準(zhǔn)確客觀的反映被人們關(guān)注的重要程度。
為實現(xiàn)上述目的,本發(fā)明實施例提供了如下方案
一種興趣點流行度獲取方法,包括
對興趣點進行網(wǎng)絡(luò)搜索;
采集該興趣點在搜索結(jié)果中出現(xiàn)的頻度;
利用所述頻度計算該興趣點流行度。
一種興趣點流行度獲取裝置,包括
網(wǎng)絡(luò)搜索模塊,用于對興趣點進行網(wǎng)絡(luò)搜索;
頻度采集模塊,用于采集該興趣點在搜索結(jié)果中出現(xiàn)的頻度;
流行度計算模塊,用于利用所述頻度采集模塊采集的頻度計算該興趣點流行度。
根據(jù)本發(fā)明提供的具體實施例,公開了以下技術(shù)效果
本發(fā)明實施例中,結(jié)合互聯(lián)網(wǎng)搜索引擎技術(shù)采集POI數(shù)據(jù)在網(wǎng)絡(luò)上出現(xiàn)的頻度, 進而根據(jù)該頻度計算POI數(shù)據(jù)的網(wǎng)絡(luò)流行度,由于POI數(shù)據(jù)在網(wǎng)絡(luò)出現(xiàn)的頻度,基本反映了CN 102541936 A人們對該POI數(shù)據(jù)的關(guān)注度,因此,根據(jù)頻度計算POI數(shù)據(jù)的網(wǎng)絡(luò)流行度,能夠客觀的反映其在互聯(lián)網(wǎng)上實際出現(xiàn)的頻度,也就是說,能夠客觀的反映該POI數(shù)據(jù)在互聯(lián)網(wǎng)上被人們實際關(guān)注的多少??梢姡景l(fā)明實施例提供的POI流行度的獲取方案,能夠更加準(zhǔn)確客觀的反映POI數(shù)據(jù)被人們關(guān)注的重要程度。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例提供的興趣點流行度獲取方法流程圖2為本發(fā)明實施例中利用頻度計算興趣點流行度的具體實現(xiàn)方式的方法流程圖3為本發(fā)明實施例的一個具體實例的方法流程圖4為本發(fā)明實施例還提供的興趣點流行度獲取裝置結(jié)構(gòu)框圖5為本發(fā)明實施例中網(wǎng)絡(luò)搜索模塊結(jié)構(gòu)框圖6為本發(fā)明實施例中查詢串策略獲取子模塊結(jié)構(gòu)框圖7為本發(fā)明實施例中分詞等級判斷單元結(jié)構(gòu)框圖。
具體實施方式
為使本發(fā)明實施例的目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步詳細的說明。
參見圖1,本發(fā)明實施例提供了一種興趣點流行度獲取方法,主要包括如下步驟
SlOl 對興趣點進行網(wǎng)絡(luò)搜索。
S102 并采集該興趣點在搜索結(jié)果中出現(xiàn)的頻度。
一條POI數(shù)據(jù)在互聯(lián)網(wǎng)上出現(xiàn)的頻度越大,說明該POI點在現(xiàn)實生活中被人們關(guān)注的程度越高,本發(fā)明實施例利用網(wǎng)絡(luò)搜索引擎技術(shù),在互聯(lián)網(wǎng)上對POI數(shù)據(jù)進行搜索,并采集該POI在網(wǎng)絡(luò)搜索結(jié)果中出現(xiàn)的頻度,來計算其流行度,從而可以客觀準(zhǔn)確的反映該 POI數(shù)據(jù)在互聯(lián)網(wǎng)上被人們實際關(guān)注的多少。
本領(lǐng)域技術(shù)人員可以理解,本發(fā)明實施例中該興趣點在搜索結(jié)果中出現(xiàn)的頻度, 在實際應(yīng)用中,可以具體是搜索到包含該POI的網(wǎng)頁個數(shù),比如,搜索興趣點“高德軟件”, 共搜索到10萬個包含該POI的網(wǎng)頁,則此時興趣點“高德軟件”在搜索結(jié)果中出現(xiàn)的頻度為 10萬;還可以具體是該POI在搜索到的網(wǎng)頁中出現(xiàn)的次數(shù),比如,搜索興趣點“高德軟件”, 共搜索到10萬個網(wǎng)頁,在這10萬個網(wǎng)頁中“高德軟件”共出現(xiàn)了 100萬次,則興趣點“高德軟件”在搜索結(jié)果中出現(xiàn)的頻度為100萬次。
需要說明的是,利用上述兩種具體實現(xiàn)方式采集到的頻度,均能較為客觀的體現(xiàn)出不同POI數(shù)據(jù)在互聯(lián)網(wǎng)上出現(xiàn)的頻度的多少,均可以用于計算該興趣點的流行度,實現(xiàn)更加準(zhǔn)確客觀的反映該POI數(shù)據(jù)被人們實際關(guān)注的重要程度的發(fā)明目的。在實際應(yīng)用中, 對于上述第二種具體實現(xiàn)方式需要將所有搜索到的頁面下載,再分析其中包含的POI數(shù)目,得到該POI的頻度。對于上述第一種具體實現(xiàn)方式而言,可以直接用搜索到的網(wǎng)頁數(shù)作為頻度計算流行度,即只需要分析一個搜索結(jié)果頁面即可,相對而言實現(xiàn)起來較為簡單, 且也能在一定程度上較為客觀準(zhǔn)確的體現(xiàn)出不同興趣點在網(wǎng)絡(luò)中出現(xiàn)的頻度多少,故優(yōu)選的,本發(fā)明實施例中,所述采集該興趣點在搜索結(jié)果中出現(xiàn)的頻度具體為從網(wǎng)絡(luò)查詢結(jié)果頁面中抽取該興趣點相關(guān)網(wǎng)頁的個數(shù)。
S103 利用上述頻度計算該興趣點流行度。
需要說明的是,利用頻度計算該興趣點流行度的方法可以有很多種,也就是說,本發(fā)明實施例中,只要將該POI在網(wǎng)絡(luò)上出現(xiàn)的頻度作為POI流行度計算的一個參考因素, 即可實現(xiàn)本發(fā)明實施例的目的,即能夠提供一種更加準(zhǔn)確客觀反映被人們關(guān)注重要程度的 POI流行度的獲取方法,在具體實現(xiàn)中,本領(lǐng)域技術(shù)人員可以根據(jù)自己的需要具體設(shè)計如何將POI在網(wǎng)絡(luò)上出現(xiàn)的頻度作為評價流行度高低的一個參考因素,比如對頻度進行可靠性修正、歸一化處理等等,本發(fā)明實施例對此并不限制。
可見,結(jié)合互聯(lián)網(wǎng)搜索引擎技術(shù)采集POI數(shù)據(jù)在網(wǎng)絡(luò)上出現(xiàn)的頻度,進而根據(jù)該頻度計算POI數(shù)據(jù)的網(wǎng)絡(luò)流行度,由于POI數(shù)據(jù)在網(wǎng)絡(luò)出現(xiàn)的頻度,基本反映了人們對該 POI數(shù)據(jù)的關(guān)注度,因此,根據(jù)頻度計算POI數(shù)據(jù)的網(wǎng)絡(luò)流行度,能夠客觀的反映其在互聯(lián)網(wǎng)上實際出現(xiàn)的頻度,也就是說,能夠客觀的反應(yīng)該POI數(shù)據(jù)在互聯(lián)網(wǎng)上被人們實際關(guān)注的多少??梢?,本發(fā)明實施例提供了一種更加合理的POI流行度的獲取方案,能夠更加準(zhǔn)確客觀的反映POI數(shù)據(jù)被人們關(guān)注的重要程度。
需要說明的是,采集POI數(shù)據(jù)在網(wǎng)絡(luò)上出現(xiàn)頻度時,存在如何保證互聯(lián)網(wǎng)搜索引擎的查詢結(jié)果與需要查詢的POI數(shù)據(jù)真實相關(guān)的問題,具體而言,由于搜索引擎具備中文分詞、模糊查詢等特點,僅僅簡單選取POI的某個或某幾個關(guān)鍵詞進行網(wǎng)絡(luò)搜索,比如僅僅簡單的選取名稱、地址等相關(guān)的某個或某幾個關(guān)鍵詞進行網(wǎng)絡(luò)搜索,往往會出現(xiàn)網(wǎng)絡(luò)搜索結(jié)果排序靠后的網(wǎng)頁與該POI數(shù)據(jù)的相關(guān)性甚小或者無關(guān),而如果采集了這部分網(wǎng)頁中 POI出現(xiàn)的頻度,會影響POI流行度的計算準(zhǔn)確度。本發(fā)明實施例為了進一步提高POI流行度計算的準(zhǔn)確度,通過制定一定的網(wǎng)絡(luò)查詢策略,以合理調(diào)整用于網(wǎng)絡(luò)搜索的查詢串,盡可能的達到使網(wǎng)絡(luò)查詢結(jié)果與POI的表述相統(tǒng)一,盡可能減小搜索結(jié)果中與該POI數(shù)據(jù)相關(guān)性甚小或無關(guān)的網(wǎng)頁出現(xiàn)。
具體的,本發(fā)明實施例中,所述對興趣點進行網(wǎng)絡(luò)搜索包括
獲取興趣點的查詢串策略;
依據(jù)所述查詢策略,對興趣點的名稱、類別和/或地址進行組合,得到興趣點查詢串;
根據(jù)所述興趣點查詢串進行網(wǎng)絡(luò)搜索。
其中,所述獲取興趣點的查詢串策略的步驟可以具體包括
判斷所述興趣點名稱的分詞等級;
依據(jù)所述興趣點的類別和所述分詞等級查詢策略配置表,得到所述興趣點的查詢串策略。
其中,所述策略配置表中建立有興趣點所屬類別、名稱分詞等級和查詢串策略的對應(yīng)關(guān)系,其中所述查詢串策略為按預(yù)設(shè)規(guī)則對興趣點的名稱、類別和/或地址進行組合得到的。
優(yōu)選的,本發(fā)明實施例中,查詢串策略是按預(yù)設(shè)規(guī)則對興趣點的名稱、類別和/或地址進行組合得到的。表1示出查詢串策略的一種具體實現(xiàn)方式
表 權(quán)利要求
1 一種興趣點流行度獲取方法,其特征在于,包括 對興趣點進行網(wǎng)絡(luò)搜索;采集該興趣點在搜索結(jié)果中出現(xiàn)的頻度; 利用所述頻度計算該興趣點流行度。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對興趣點進行網(wǎng)絡(luò)搜索包括 獲取興趣點的查詢串策略;依據(jù)所述查詢策略,對興趣點的名稱、類別和/或地址進行組合,得到興趣點查詢串; 根據(jù)所述興趣點查詢串進行網(wǎng)絡(luò)搜索。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,獲取興趣點的查詢串策略具體包括 判斷所述興趣點名稱的分詞等級;依據(jù)所述興趣點的類別和所述分詞等級查詢策略配置表,得到所述興趣點的查詢串策略。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述判斷所述興趣點名稱的分詞等級包括對所述興趣點名稱進行基本詞分詞處理;判斷經(jīng)分詞處理后的興趣點名稱包括的基本詞數(shù)量,當(dāng)基本詞數(shù)量為1時確定分詞等級為短詞,當(dāng)基本詞數(shù)量為2時確定分詞等級為中長詞,當(dāng)基本詞數(shù)量為3個以上時確定分詞等級為長詞。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述查詢串策略包括主查詢串策略和輔查詢串策略,所述依據(jù)所述查詢策略,對興趣點的名稱、類別和/或地址進行組合,得到興趣點查詢串包括依據(jù)所述主查詢串策略,對興趣點的名稱、類別和/或地址進行組合,得到所述興趣點的主查詢串;依據(jù)所述輔查詢串策略,對興趣點的名稱、類別和/或地址進行組合,得到所述興趣點的輔查詢串。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述利用所述頻度計算該興趣點流行度包括將根據(jù)所述主查詢串進行網(wǎng)絡(luò)搜索采集的主搜索頻度和根據(jù)所述輔查詢串進行網(wǎng)絡(luò)搜索采集的輔搜索頻度進行合并處理,得到所述興趣點的流行度。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述合并處理之前還包括根據(jù)預(yù)置的網(wǎng)絡(luò)搜索頻度范圍對所述主搜索頻度和輔搜索頻度分別進行修正處理; 所述合并處理之后還包括 將合并處理結(jié)果進行歸一化處理。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述輔搜索頻度為空時,所述合并處理包括將所述主搜索頻度作為合并處理結(jié)果; 所述輔搜索頻度為非空時,所述合并處理包括判斷所述主搜索頻度和輔搜索頻度之間的數(shù)量級是否相近或相同,是則對所述主搜索頻度和輔搜索頻度進行加權(quán)平均處理,否則直接將數(shù)量級小的頻度作為合并處理結(jié)果。
9.根據(jù)權(quán)利要求1-8任一項所述的方法,其特征在于,所述采集該興趣點在搜索結(jié)果中出現(xiàn)的頻度具體為從網(wǎng)絡(luò)查詢結(jié)果頁面中抽取該興趣點相關(guān)網(wǎng)頁的個數(shù)。
10.一種興趣點流行度獲取裝置,其特征在于,包括 網(wǎng)絡(luò)搜索模塊,用于對興趣點進行網(wǎng)絡(luò)搜索;頻度采集模塊,用于采集該興趣點在搜索結(jié)果中出現(xiàn)的頻度;流行度計算模塊,用于利用所述頻度采集模塊采集的頻度計算該興趣點流行度。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述網(wǎng)絡(luò)搜索模塊包括 查詢串策略獲取子模塊,用于獲取興趣點的查詢串策略;查詢串確定子模塊,用于依據(jù)所述查詢策略,對興趣點的名稱、類別和/或地址進行組合,得到所述興趣點查詢串;網(wǎng)絡(luò)搜索子模塊,用于根據(jù)所述興趣點查詢串進行網(wǎng)絡(luò)搜索。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述查詢串策略獲取子模塊包括 分詞等級判斷單元,用于判斷所述興趣點名稱的分詞等級;查詢串策略獲取單元,用于依據(jù)所述興趣點的類別和所述分詞等級查詢策略配置表, 得到所述興趣點的查詢串策略。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述分詞等級判斷單元包括 分詞處理子單元,用于對所述興趣點名稱進行基本詞分詞處理;等級確定子單元,用于判斷經(jīng)分詞處理后的興趣點名稱包括的基本詞數(shù)量,當(dāng)基本詞數(shù)量為1時確定分詞等級為短詞,當(dāng)基本詞數(shù)量為2時確定分詞等級為中長詞,當(dāng)基本詞數(shù)量為3個以上時確定分詞等級為長詞。
14.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述查詢串策略包括主查詢串策略和輔查詢串策略,所述查詢串確定子模塊包括主查詢串獲取子單元,用于依據(jù)所述主查詢串策略,對興趣點的名稱、類別和/或地址進行組合,得到所述興趣點的主查詢串;輔查詢串獲取子單元,用于依據(jù)所述輔查詢串策略,對興趣點的名稱、類別和/或地址進行組合,得到所述興趣點的輔查詢串。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述流行度計算模塊包括合并處理子模塊,用于將根據(jù)所述主查詢串進行網(wǎng)絡(luò)搜索采集的主搜索頻度和根據(jù)所述輔查詢串進行網(wǎng)絡(luò)搜索采集的輔搜索頻度進行合并處理,得到所述興趣點的流行度。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述流行度計算模塊還包括 修正處理子模塊,用于根據(jù)預(yù)置的網(wǎng)絡(luò)搜索頻度范圍對所述主搜索頻度和輔搜索頻度分別進行修正處理,將修正處理后的主搜索頻度和輔搜索頻度發(fā)送至所述合并處理子模塊;歸一化處理子模塊,用于將所述合并處理子模塊的合并處理結(jié)果進行歸一化處理。
17.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述輔搜索頻度為空時,所述合并處理子模塊具體用于將所述主搜索頻度作為合并處理結(jié)果;所述輔搜索頻度為非空時,所述合并處理子模塊具體用于判斷所述主搜索頻度和輔搜索頻度之間的數(shù)量級是否相近或相同,是則對所述主搜索頻度和輔搜索頻度進行加權(quán)平均處理,否則直接將數(shù)量級小的頻度作為合并處理結(jié)果。
18.根據(jù)權(quán)利要求10-17任一項所述的裝置,其特征在于,所述頻度采集模塊,具體用于從網(wǎng)絡(luò)查詢結(jié)果頁面中抽取該興趣點相關(guān)網(wǎng)頁的個數(shù)。
全文摘要
本發(fā)明實施例公開一種興趣點流行度獲取方法和裝置,涉及導(dǎo)航領(lǐng)域。所述方法包括對興趣點進行網(wǎng)絡(luò)搜索;采集該興趣點在搜索結(jié)果中出現(xiàn)的頻度;利用所述頻度計算該興趣點流行度。所述裝置包括網(wǎng)絡(luò)搜索模塊,頻度采集模塊和流行度計算模塊。本發(fā)明實施例結(jié)合互聯(lián)網(wǎng)搜索引擎技術(shù)采集POI數(shù)據(jù)在網(wǎng)絡(luò)上出現(xiàn)的頻度,進而根據(jù)該頻度計算POI數(shù)據(jù)的網(wǎng)絡(luò)流行度,使得POI流行度能夠客觀的反映其在互聯(lián)網(wǎng)上實際出現(xiàn)的頻度,更加準(zhǔn)確客觀的反映POI數(shù)據(jù)被人們關(guān)注的重要程度。
文檔編號G06F17/30GK102541936SQ20101061823
公開日2012年7月4日 申請日期2010年12月31日 優(yōu)先權(quán)日2010年12月31日
發(fā)明者姜吉發(fā), 黃鶴 申請人:高德軟件有限公司