數據文件的地域標記方法以及裝置制造方法
【專利摘要】本發明提供一種數據文件的地域標記方法以及裝置,所述地域標記方法包括:獲得樹狀結構,樹狀結構具備多個節點,多個節點包括多個行政區名稱及標志性名稱,多個行政區名稱及標志性名稱之間具有階層關系;接收數據文件,并從數據文件擷取至少一關鍵字;比對至少一關鍵字與多個節點,以找出和至少一關鍵字匹配的第一節點;以及標記第一節點與第一節點相關的至少一父節點于數據文件。
【專利說明】數據文件的地域標記方法以及裝置
【技術領域】
[0001] 本發明涉及一種文件的分類技術,特別是涉及一種數據文件的地域標記方法以及 裝直。
【背景技術】
[0002] 藉由科技的發展,網絡已成為現代人生活中不可或缺的信息取得媒介,尤其是網 絡新聞的發展與普及,不僅可取代紙張來符合現今環保的潮流,更可因應瞬息萬變的時事 而立即更新新聞訊息。
[0003] 為了讓使用者能快速搜尋到所需的網絡新聞,對網絡新聞進行分類乃是十分重要 的工作,特別是有關于網絡新聞的地域性分類。其原因在于,使用者經常希望了解位于鄰近 地點或是特定地點、特定城市的新聞。
[0004] 然而,一般而言,門戶網站對于網絡新聞的地域性分類乃是使用較概略性的作法, 尤其是對于幅員廣大以及人口眾多的國家(如中國),其作法例如是僅采用大都市的網絡 新聞,而較少采用小地方的網絡新聞。此外,網絡新聞業者通常是藉由編輯來人工進行網絡 新聞的地域性分類,此舉非常費時費力。另外,新聞內容本身乃具有復雜的數據訊息,因此 藉由機器來對新聞進行地域性分類的自動化并非一件容易的事情。
【發明內容】
[0005] 本發明提供一種數據文件的地域標記方法以及裝置,其藉由特定階層式地域數據 來對數據文件進行比對,藉以標記出數據文件的對應地域性特征,從而減輕數據文件編輯 者對數據文件進行地域性分類的負擔,以及增進數據文件閱讀者在搜尋數據文件時的方便 性。
[0006] 本發明提供一種數據文件的地域標記方法,地域標記方法包括:獲得樹狀結構,樹 狀結構具備多個節點,多個節點包括多個行政區名稱及標志性名稱,多個行政區名稱及標 志性名稱之間具有階層關系;接收數據文件,并從數據文件擷取至少一關鍵字;比對至少 一關鍵字與多個節點,以找出和至少一關鍵字匹配的第一節點;以及標記第一節點與第一 節點相關的至少一父節點于數據文件。
[0007] 本發明提供一種數據文件的地域標記裝置,包括分類單元、擷取單元、比對單元、 標記單元及儲存數據庫。分類單元通過網絡獲得樹狀結構,樹狀結構具備多個節點,多個節 點包括多個行政區名稱及標志性名稱,多個地域及標志性名稱之間具有階層關系。擷取單 元通過網絡接收數據文件,并從數據文件擷取至少一關鍵字。比對單元耦接于擷取單元,t匕 對單元比對至少一關鍵字與多個節點,以找出和至少一關鍵字匹配的第一節點;標記單元 耦接于比對單元。標記單元標記第一節點與第一節點相關的至少一父節點于數據文件。儲 存數據庫耦接于分類單元、擷取單元、比對單元與標記單元,儲存數據庫用以儲存樹狀結構 與數據文件。
[0008] 基于上述,本發明的實施例藉由樹狀結構中包括有行政區名稱及標志性名稱的多 個節點來比對數據文件中所擷取出的關鍵字,從而標記所匹配的第一節點與相關的父節點 于數據文件中,以使數據文件具有對應的地域性特征。
[0009] 為使本發明的上述特征和優點能更明顯易懂,下文特舉實施例,并結合附圖詳細 說明如下。
【專利附圖】
【附圖說明】
[0010] 圖1為根據本發明的多個實施例的電子裝置以及伺服器的方塊圖。
[0011] 圖2為根據本發明的一實施例的訊息通知裝置的方塊圖。
[0012] 圖3為根據本發明的一實施例的訊息通知方法的流程圖。
[0013] 圖4為根據本發明的另一實施例的訊息通知方法的流程圖。
[0014] 圖5是根據本發明的一實施例的地標數據的顯示方法的流程圖。
[0015] 圖6是根據本發明的另一實施例的地標數據的顯示方法的流程圖。
[0016] 圖7為根據本發明的另一實施例的地標數據的顯示方法的流程圖。
[0017] 圖8為根據本發明的另一實施例的地標數據的顯示方法的流程圖。
[0018] 圖9為根據本發明的一實施例的數據文件的地域標記裝置的方塊圖。
[0019] 圖10為根據本發明的一實施例的數據文件的地域標記方法的流程圖。
[0020] 圖11為根據本發明的一實施例的樹狀結構的示意圖。
[0021] 圖12為根據本發明的另一實施例的數據文件的地域標記方法的流程圖。
[0022] 圖13A?圖13D為根據本發明的一實施例的樹狀結構的建構過程的示意圖。
[0023] 圖14為根據本發明的一實施例的數據文件的排序方法的流程圖。
[0024] 圖15為根據本發明的一實施例的數據文件的排序方法的流程圖。
[0025] 附圖符號說明
[0026] 101:電子裝置
[0027] 103 :伺服器
[0028] 200 :訊息通知裝置
[0029] 210 :通訊單元
[0030] 23〇 :儲存單元
[0031] 250 :播放單元
[0032] 270 :陀螺儀
[0033] 29〇 :控制單元
[0034] S310?S330 :訊息通知方法的步驟
[0035] S401、S402、S310?S330 :訊息通知方法的步驟
[0036] S510?S550、S541?S542、S710?S740、S731?S733 :地標數據的顯示方法的 步驟
[0037] 900 :地域標記裝置
[0038] 910 :分類單元
[0039] 93〇 :擷取單元
[0040] %0 :比對單元
[0041] 970 :標記單元
[0042] 990 :儲存數據庫
[0043] S1010?S1040 :地域標記方法的步驟
[0044] S1011 ?S1013、S1021 ?S1022、S1031 ?S1033 及 S1041 ?S1042 :地域標記方 法的步驟
[0045] 1301 ?1304 :第二節點
[0046] S1410?S1430、S1440、S1441、S1442及S1450 :數據文件的排序方法的步驟
【具體實施方式】
[0047] 圖1為根據本發明的一實施例的電子裝置101以及伺服器103的方塊圖。伺服器 103可以是個人計算機、工作站、主機計算機或是各種其他類型的計算機或處理器。電子裝 置101可以是筆記型計算機、平板計算機、個人數字助理、智能型手機或是各種其他類型的 便攜式電子裝置。電子裝置101可通過網絡來與伺服器103通訊。在本實施例的敘述中, 將以訊息通知裝置200來代表電子裝置101的舉例。換句話說,電子裝置101與訊息通知 裝置200可為實質上相等同并可互換的裝置。
[0048] 當使用者欲對訊息通知裝置200設定所欲關注的信息種類時,使用者可先藉由訊 息通知裝置200來發出請求信息。例如,〃如果有最新的日本核事故新聞,馬上告訴我"、 〃如果我的自選股中有股票漲跌超過2%,就馬上通知我〃或者是〃如果第三十六期彩卷開 出來了馬上通知我"等。在本發明實施例中,使用者可藉由語音說話的方式來輸入請求信 息至訊息通知裝置200。訊息通知裝置200可通過各種類型的自然語言處理模塊來判別請 求信息的可能意圖,或者是可更進一步藉由對儲存有大量字詞的結構化數據庫進行檢索以 判別所擷取出的關鍵字詞的屬性,藉以對此請求信息進行分析與理解后,可得知對應的命 令條件,并將此命令條件傳送至伺服器103。舉例來說,命令條件可以是〃有最新的日本核 事故新聞產生〃、〃特定股票漲幅超過2%〃或者是〃第三十六期彩卷開獎〃。伺服器103即 可根據此命令條件,來查詢是否具備對應的提示訊息,例如,〃最新的日本核事故新聞的內 容"、"特定股票的股價"或者是"第三十六期彩卷的中獎號碼"。在本發明實施例中,可 藉由訊息通知裝置200來對請求信息進行分析與理解。在本發明的另一實施例中,訊息通 知裝置200亦可將請求信息傳送至伺服器103以藉由伺服器103中的各種類型的自然語言 處理模塊來判別請求信息的可能意圖。或者是,可更進一步藉由對儲存有大量字詞的結構 化數據庫進行檢索以判別所擷取出的關鍵字詞的屬性,藉以對所擷取出的關鍵字詞進行分 析及理解。伺服器103在查詢是否具備滿足命令條件的對應提示訊息之后,若判斷有具備 滿足命令的相關條件時,訊息通知裝置200可接著將對應提示訊息下載并儲存,接者可將 其播放出來。在本發明實施例的概念中,由于是藉由伺服器103來定期(或即時)記錄使 用者所設定其欲關注的信息種類的最新信息,藉以在接收到命令條件時查詢對應的提示訊 息,因此,相對于藉由訊息通知裝置200來定期(或即時)記錄使用者所設定其欲關注的信 息種類的最新信息而言,本發明可進一步降低訊息通知裝置200的耗電量與工作量。
[0049] 在本發明實施例中,伺服器103可查詢在特定時間間隔內滿足命令條件的對應提 示訊息。此特定時間間隔可以是使用者設定的某一段時間間隔,也可以是在使用者離開訊 息通知裝置200其間的時間間隔。舉例來說,使用者可因洗澡或忘了帶出門等因素,而將訊 息通知裝置200留在桌上;在經過了特定時間間隔后,使用者又再度回到桌邊而拿起了訊 息通知裝置200。此時,由于在離開訊息通知裝置200其間可能有使用者所關注的信息種類 的最新消息發生,因此訊息通知裝置200可對應此特定時間間隔的起始時間與終止時間, 來將其對應的提示訊息從伺服器103下載并儲存,并接著播放出來以提醒使用者。下列將 對此進一步詳述。
[0050] 圖2為根據本發明的一實施例的訊息通知裝置的方塊圖。如圖2所示,訊息通知 裝置200包括通訊單元210、儲存單元230、播放單元250、陀螺儀270以及控制單元290。 控制單元290耦接于通訊單元210、儲存單元230、播放單元250以及陀螺儀270。通訊單 元210用以和伺服器103通訊,儲存單元230用以儲存數據,播放單元250用以播放訊息, 陀螺儀270用以檢測訊息通知裝置200的角速度。通訊單元210可以是無線通訊芯片或模 塊,或是其他具有網絡連線功能的芯片或模塊。儲存單元230可以是各種類型的數據儲存 媒介。播放單元250可以是各種類型的數據播放裝置,例如揚聲器、顯示器或是其他的數據 輸出裝置。控制單元290可以是各種類型的功能模塊、芯片或微處理器。圖3為根據本發 明的一實施例的訊息通知方法的流程圖。如圖3所示,根據本發明實施例的訊息通知方法 包括步驟S310?S330。請同時參照圖2及圖3。
[0051] 在步驟S310中,控制單元290判斷是否具備訊息通知裝置200開始進入靜止狀態 的第一時間點(即上述的起始時間)以及終止靜止狀態的第二時間點(即上述的終止時 間)。舉例來說,使用者可因洗澡或忘了帶出門等因素,而將訊息通知裝置200留在桌上,因 而訊息通知裝置200在第一時間點進入了靜止狀態,此時,控制單元290可將第一時間點記 錄于儲存單元230中。過了特定時間間隔后,使用者又再度回到桌邊而拿起了訊息通知裝 置200,因而訊息通知裝置200在第二時間點終止了靜止狀態,此時,控制單元290亦可將第 二時間點記錄于儲存單元230中。控制單元290可藉由查詢儲存單元230來判斷是否具備 第一時間點與第二時間點。
[0052] 在步驟S320中,若控制單元290判斷其具備第一時間點以及第二時間點,則伺服 器103查詢是否具備第一時間點至第二時間點之間的至少一提示訊息。舉例來說,若控制 單元290判斷其具備第一時間點以及第二時間點,此即代表使用者可能離開了訊息通知裝 置200-段時間,此時控制單元290將所得知的第一時間點與第二時間點傳送至伺服器103 做查詢,判斷在這段時間內是否有提示訊息產生。例如,若這段時間內使用者有未接來電或 是有未讀訊息,則其提示訊息可以是〃您有一通未接來電〃或是〃您有一則未讀訊息"。所 述提示訊息還可以是使用者設定的關注信息,比如,熱點新聞、股票或彩券等。
[0053] 在步驟S330中,若伺服器103具備至少一提示訊息,則訊息通知裝置200下載此 至少一提示訊息并儲存至儲存單元230,且通過播放單元250來播放此至少一提示訊息。舉 例來說,若在使用者所離開的第一時間點以及第二時間點之間,使用者有未接來電或是有 未讀訊息,或者是有產生了股票、彩券或熱點新聞的關注信息,則訊息通知裝置200可將提 示訊息〃您有一通未接來電〃或是〃您有一則未讀訊息",或者是對應所產生的股票、彩券 或熱點新聞的具體信息下載并儲存至儲存單元230,并通過播放單元250來播放。在本發明 實施例中,播放單元250播放提示訊息的方式可以是播放文字或是播放影像,在此不加以 限制。
[0054] 圖4為根據本發明的另一實施例的訊息通知方法的流程圖。如圖4所示,根據本 發明實施例的訊息通知方法包括步驟S401、S402、S410、S420及S430。請同時參照圖2及 圖4。
[0055] 在步驟S401中,使用者可藉由訊息通知裝置200接收請求信息。舉例來說,使用 者的請求信息可以是"如果有最新的日本核事故新聞,馬上告訴我"、"如果我的自選股中 有股票漲跌超過2%,就馬上通知我〃或者是〃如果第三十六期彩卷開出來了馬上通知我〃。 如上所述,在本發明實施例中,使用者可藉由語音說話的方式來輸入請求信息至訊息通知 裝置200。在本發明的另一實施例中,使用者亦可藉由特定軟件界面或是其他各種方式來輸 入請求信息,在此不加以限制。
[0056] 在步驟S402中,擷取請求信息中的至少一關鍵字詞,以判別請求信息的命令條件 以及設定閾值。在本發明實施例中,可藉由控制單元290來擷取請求信息中的關鍵字詞以 進行分析及理解。在本發明的另一實施例中,亦可將請求信息傳送到伺服器103,接著于伺 服器103中擷取請求信息中的關鍵字詞以進行分析及理解。關鍵字詞可以是使用者的關注 信息的種類、用以表達命令的字詞、或是其他可用以分析及理解的預定義字詞。在本發明實 施例中,控制單元290可通過各種類型的自然語言處理模塊來判別請求信息的可能意圖, 或者是可更進一步藉由對儲存有大量字詞的結構化數據庫進行檢索以判別所擷取出的關 鍵字詞的屬性,藉以對所擷取出的關鍵字詞進行分析及理解,以求得請求信息中的對應的 命令條件,例如,是否有最新的日本核事故新聞產生,特定股票漲幅是否超過2%,或者是第 三十六期彩卷是否開獎。此外,控制單元290亦可藉由關鍵字詞的分析及理解結果來求得 閾值以在步驟S410中使用。
[0057] 在步驟S410中,控制單元290根據閾值來判斷是否具備訊息通知裝置200進入靜 止狀態后的第一時間點,以及終止靜止狀態的第二時間點。閾值可以是時間閾值或是角速 度閾值。在本發明實施例中,控制單元290可藉由陀螺儀270來檢測訊息通知裝置200的角 速度,以判別訊息通知裝置200是否進入靜止狀態以及是否終止靜止狀態,從而取得第一 時間點與第二時間點。舉例來說,當訊息通知裝置200的角速度小于角速度閾值,則控制單 元290可判定訊息通知裝置200進入靜止狀態,而當訊息通知裝置200的角速度小于角速 度閾值且其所持續的時間超過時間閾值,則控制單元290可判定使用者已離開了訊息通知 裝置200,從而將此時間點設定為第一時間點。若又再過了一段時間,當訊息通知裝置200 的角速度大于或等于角速度閾值時,則控制單元290可判定訊息通知裝置200終止了靜止 狀態(即進入了移動狀態),換句話說,控制單元290可判定使用者再度拿起了訊息通知裝 置200,從而將此時間點設定為第二時間點。如上所述,第一時間點及第二時間點可記錄于 儲存單元230中。在本發明實施例中,若訊息通知裝置200本身具有震動模式(例如,在有 來電或有簡訊時,則訊息通知裝置200會進入震動模式),則角速度閾值可大于訊息通知裝 置200在震動模式下所造成的角速度,藉此,則控制單元290便不會將在震動模式下的訊息 通知裝置200判定為進入了移動狀態。在本發明的另一實施例中,控制單元290可藉由檢 測訊息通知裝置200是否進入休眠模式或者是藉由檢測訊息通知裝置200是否接收觸控輸 入訊號,來判斷訊息通知裝置200是否進入或終止了靜止狀態。
[0058] 在步驟S420中,若控制單元290判斷其具備第一時間點以及第二時間點,則伺服 器103查詢其是否具備第一時間點至第二時間點之間滿足命令條件的至少一提示訊息。舉 例來說,若在第一時間點與第二時間點之間的特定時間間隔內,發生了 "最新的日本核事 故新聞產生〃、〃特定股票漲幅超過2%〃或者是〃第三十六期彩卷開獎〃,則伺服器103可 具備有提示訊息。在本發明實施例中,提示訊息可以是對應使用者所關注信息種類的最新 消息的內容本身,例如,"最新的日本核事故新聞的報導內容"、"特定股票的股價"或者是 "第三十六期彩卷的中獎號碼"。在本發明的另一實施例中,提示訊息亦可以是用以提示使 用者已產生有其所關注信息種類的最新消息內容的訊息,例如,"提醒您,現有最新日本核 事故新聞〃、〃親愛的使用者,您的XXX股票已大漲〃或者是〃第三十六期彩卷已經開獎嘞 〇
[0059] 在步驟S430中,若伺服器103具備至少一提示訊息,則訊息通知裝置200下載此 至少一提示訊息并儲存至儲存單元230,且通過播放單元250來播放對應此至少一提示訊 息的語音。舉例來說,若在使用者所離開的第一時間點以及第二時間點之間,控制單元290 通過伺服器103來判斷其具備有提示訊息〃最新的日本核事故新聞的報導內容"、〃特定股 票的股價〃或者是"第三十六期彩卷的中獎號碼",則將此提示訊息下載并儲存至儲存單元 230,并通過播放單元250來播放。在本發明實施例中,播放單元250可將提示訊息的內容 以語音方式播放出來。
[0060] 綜上所述,本發明可接收使用者以語音方式輸入的請求信息,并擷取其關鍵字詞 以進行判別命令條件以及設定閾值之用,在使用者離開訊息通知裝置其間,可根據此閾值 (時間閾值或者角速度閾值)來檢測訊息通知裝置開始進入靜止狀態的第一時間點以及終 止靜止狀態的第二時間點,進而在使用者拿回訊息通知裝置時,可在伺服器中查詢滿足命 令條件的提示訊息,并將提示訊息下載及儲存至訊息通知裝置,來藉由語音方式播放提示 訊息以提醒使用者,從而減少其忽略重要訊息的機率。
[0061] 如圖1所示,在本發明的另一實施例中,電子裝置101以及伺服器103亦可用于執 行地標數據的顯示方法。
[0062] 在本發明實施例中,當使用者藉由電子裝置101來執行特定地標的搜尋時,可輸 入地名關鍵字,而電子裝置101便可將所輸入的地名關鍵字傳送至伺服器103中,伺服器 103對此地名關鍵字執行搜尋,并接著對所搜尋到的地標數據進行排序,以使較有可能符合 使用者的尋找需求的地標數據具有較高的排序順位。最后,伺服器再將地標數據的排序結 果傳送回電子裝置101來顯示,使用者便得以從中找尋最有益的訊息。接著,在本發明實施 例中,電子裝置101可通過地圖應用程序來將排序結果中的地標數據的各自的地標名稱顯 示出來。在本發明的另一實施例中,電子裝置101本身即具有對特定地名的搜尋功能以及 對所搜尋到的地標數據進行排序的功能,因此電子裝置101便無需再通過伺服器103即可 對使用者顯示出地標數據的排序結果。
[0063] 地標數據可具有特定的特征化參數。舉例來說,不同的地標數據可具有不同的知 名度。因此,在地標數據的排序的過程中便可產生對應的順位關系。因此,在本發明實施例 中,在使用者藉由電子裝置101輸入地名關鍵字來執行特定地標的搜尋之前,伺服器103可 對現有的地標數據進行知名度的計算。下列將對此加以詳述。
[0064] 圖5是根據本發明的一實施例的地標數據的顯示方法的流程圖。表1是根據本發 明的一實施例的地標數據的示意圖。如圖5所示,根據本發明實施例的地標數據的顯示方 法的步驟包括S510?S550。如表1所示,地標數據可具有地標名稱、客觀層級類別、地址、 地指引用次數以及對應所計算出的知名度。下列請同時參照圖5及表1。
[0065] [表 1]
[0066]
【權利要求】
1. 一種數據文件的地域標記方法,該地域標記方法包括: 獲得一樹狀結構,該樹狀結構具備多個節點,這些節點包括多個行政區名稱及標志性 名稱,這些行政區名稱及標志性名稱之間具有階層關系; 接收該數據文件,并從該數據文件擷取至少一關鍵字; 比對該至少一關鍵字與這些節點,以找出和該至少一關鍵字匹配的一第一節點;以及 標記該第一節點與該第一節點相關的至少一父節點于該數據文件。
2. 如權利要求1所述的地域標記方法,其中獲得該樹狀結構包括下列步驟: 取得一地域性名稱; 判斷該地域性名稱是否從屬于該樹狀結構中的一第二節點;以及 將該地域性名稱加入該樹狀結構, 其中,該地域性名稱包括行政區名稱及標志性名稱。
3. 如權利要求1所述的地域標記方法,其中從該數據文件擷取該至少一關鍵字還包 括: 由該數據文件的一標題或一正文擷取該至少一關鍵字;以及 由該數據文件的一來源擷取該至少一關鍵字, 其中,該數據文件的該來源包括該數據文件相關的一發生地點和一數據文件提供者所 在地點。
4. 如權利要求3所述的地域標記方法,其中比對該至少一關鍵字與這些節點,以找出 和該至少一關鍵字匹配的該第一節點還包括: 分別對該至少一關鍵字定義對應的一權重。
5. 如權利要求4所述的地域標記方法,其中比對該至少一關鍵字與這些節點,以找出 和該至少一關鍵字匹配的該第一節點還包括: 根據該至少一關鍵字相對應的該權重作為比對該至少一關鍵字與這些節點的順位參 考。
6. 如權利要求1所述的地域標記方法,其中比對該至少一關鍵字與這些節點,以找出 和該至少一關鍵字匹配的該第一節點還包括: 搜尋該樹狀結構以比對該樹狀結構中是否存在該第一節點,該第一節點所包括的該行 政區名稱或該標志性名稱和該至少一關鍵字的其中之一相同;以及 找出該樹狀結構中與該第一節點相關的該至少一父節點。
7. 如權利要求1所述的地域標記方法,其中標記該第一節點與該第一節點相關的該至 少一父節點于該數據文件還包括: 根據該第一節點與該第一節點相關的該至少一父節點,建立對應的多個標簽;以及 連結這些標簽與該數據文件以完成標記并儲存該數據文件于一儲存數據庫。
8. -種數據文件的地域標記裝置,包括: 一分類單元,通過一網絡獲得一樹狀結構,該樹狀結構具備多個節點,這些節點包括多 個行政區名稱及標志性名稱,這些地域及標志性名稱之間具有階層關系; 一擷取單元,通過該網絡接收該數據文件,并從該數據文件擷取至少一關鍵字; 一比對單元,f禹接于該擷取單元,比對該至少一關鍵字與這些節點,以找出和該至少一 關鍵字匹配的一第一節點; 一標記單元,稱接于該比對單元,標記該第一節點與該第一節點相關的該至少一父節 點于該數據文件;以及 一儲存數據庫,耦接于該分類單元、該擷取單元、該比對單元與該標記單元,用以儲存 該樹狀結構與該數據文件。
9. 如權利要求8所述的地域標記裝置,其中該分類單元獲得該樹狀結構包括下列步 驟: 取得一地域性名稱; 判斷該地域性名稱是否從屬于該樹狀結構中的一第二節點;以及 將該地域性名稱加入該樹狀結構,其中 該地域性名稱包括行政區名稱以及標志性名稱。
10. 如權利要求8所述的地域標記裝置,其中該擷取單元從該數據文件擷取該至少一 關鍵字還包括: 由該數據文件的一標題或一正文擷取該至少一關鍵字;以及 由該數據文件的一來源擷取該至少一關鍵字,其中該數據文件的該來源包括該數據文 件相關的一發生地點和一數據文件提供者所在地點。
11. 如權利要求10所述的地域標記裝置,其中該比對單元分別對該至少一關鍵字定義 對應的一權重。
12. 如權利要求11所述的地域標記裝置,其中該比對單元根據該至少一關鍵字相對應 的該權重作為比對該至少一關鍵字與這些節點的順位參考。
13. 如權利要求8所述的地域標記裝置,其中該比對單元還執行: 搜尋該樹狀結構以比對該樹狀結構中是否存在該第一節點,該第一節點所包括的該行 政區名稱或該標志性名稱和該至少一關鍵字的其中之一相同;以及 找出該樹狀結構中與該第一節點相關的該至少一父節點。
14. 如權利要求8所述的地域標記裝置,其中該標記單元還執行: 根據該第一節點與該第一節點相關的該至少一父節點,建立對應的多個標簽;以及 連結這些標簽與該數據文件以完成標記并儲存該數據文件于該儲存數據庫。
【文檔編號】G06F17/27GK104281578SQ201310273265
【公開日】2015年1月14日 申請日期:2013年7月2日 優先權日:2013年7月2日
【發明者】張國峰, 朱逸斐 申請人:威盛電子股份有限公司