專利名稱:基于用戶意圖的信息搜索方法以及信息提供方法
技術領域:
本發明涉及能夠基于自然語言的作為關鍵字的單詞、短語以及句子來提供并搜索信息以及能夠基于用戶的意圖來更為精確地提供并搜索信息的多功能搜索方法及系統。
背景技術:
近年來,開發對信息及內容提供者、消費者的擴大以及各種信息提供媒體進行融合的技術的需求正在加大。典型的融合技術的示例可包括對有線和無線廣播及通信技術、 綜合信息網絡服務技術以及便于各個用戶層的用戶接口技術開發進行融合的融合技術。在該技術的詳細內容中,期望開發信息市場技術,以滿足信息內容的用戶的口味和意圖,并通過自動分析特性以及對所提供的內容及信息或將由計算機提供的內容及信息進行語意分析,通過方便和不同的方法來建議和提供信息內容。例如,公開號為10-2006-0043333 的韓國專利申請(SYSTEM AND METHOD FOR DETERMINING INTENTION OF DATA AND RESPONDING TO DATA BASED ON INTENTION)公開了一種便于數據處理的系統。該系統是包括數據管理器和用于接收數據的組件的系統,所述數據管理器用于確定所述數據的意圖、基于該意圖來至少對數據子集進行重新系統化以及將重新系統化后的數據自動提供給用戶。該數據管理器為用于分析所述數據、將所述數據分類成具有相關特征的至少一個組、從至少一個數據組中提取特征以形成數據子集的系統。可選地,所述數據管理器是使用元數據、屬性、內容、上下文、關鍵字、歷史、試探法、推理、規則、劃分(damarcation)、時間、日期、相關處理成本、相關處理收益以及數據源中的至少一者來促成數據分析的系統,其中至少部分地基于語法結構、語法屬性、語言結構以及語言屬性來提取所述特征。所述語言特征是包括根據句子生成的單詞、根據句子生成的雙單詞(word bigram)以及根據句子生成的三單詞(word trigram)中的至少一者的系統。公開號為2002-0028593 的韓國專利申請(METHOD FOR ISOLATING HARMFUL WORD) 公開了一種用于隔離有害單詞(harmful word)的方法,該方法包括允許計算機用戶輸入會員信息并訪問管理服務器,允許計算機用戶輸入用于注冊/傳送的信息至所述管理服務器所顯示的信息輸入屏幕,允許用于將有害單詞與管理服務器相隔離的模塊確定有害單詞是否包含在計算機用戶輸入的信息中,以及允許管理服務器根據用于隔離有害單詞的模塊的判斷結果來隔離與計算機用戶的連接或注冊/傳送信息。假定所述有害單詞指的是行話(jargon)、俚語、涉及性隔離或性格隔離的單詞,則公開號為2002-0028593的韓國專利申請包括在所傳送的消息不包括這些有害單詞時連續執行聊天的處理模塊。公開號為的 2002-0028593的韓國專利申請是以聊天中的消息是否包括有害單詞為基礎的。公開號為10-2006-0062300 的韓國專利申請(MULTISTAGE TEXT FILTERING METHOD FOR ISOLATING HARMFUL SITE)公開了一種用于隔離有害站點的多級文本過濾方法,該方法包括根據淫穢程度及文本將要被用作用于隔離色情站點的數據的所述文本劃分為至少一個組,之后對所述文本進行數據庫處理;從訪問網站收集所述文本;以及通過將所述文本與所述組內的文本進行比較以確定所述訪問網站是否被隔離,來執行至少一個多級過濾,從而根據所述文本中的淫穢程度對有害站點進行隔離。公開號為10-2006-0062300 的韓國專利申請(A SYSTEM AND METHOD FOR PROVIDING IMPROVED SPAM MESSAGE FILTERING)公開了一種用于提供垃圾消息過濾的方法,該方法包括無線網絡服務器接收將從呼叫方終端傳送到用戶終端的消息;語料庫DB 存儲自然語言句子及其附屬信息的使用示例,且為大型語言DB(數據庫);詞匯分析單元檢測所述無線網絡服務器內的消息的接收,并從包含在接收到的消息中的句子中提取至少一個名詞型關鍵字;語料庫搜索裝置選擇被提取的名詞型關鍵字中的至少一個名詞型關鍵字,并搜索在包含在所述語料庫DB的每個用戶類別中的每個句子內的垃圾信息使用頻率以及在包含在用戶類別之外的類別中的句子中的基本使用頻率;當至少一個垃圾信息使用頻率以及基本使用頻率被輸入時,概率計算單元計算包含所選名詞型關鍵字的句子被包含于用戶類別中的概率;以及過濾控制器控制所述詞匯分析單元和語料庫搜索裝置以使得所述概率計算單元計算每一名詞型關鍵字被包含于垃圾消息內的概率,判斷接收到的消息是否為垃圾消息,并將判斷結果傳送至無線電網絡服務器。公開號為10-2008-0000416 的韓國專利申請(FILTERING SYSTEM FOR HARMFUL MES SAGE AND METHOD THEREOF AND RECORDING MEDIUM THEREOF)公開了一種利用用于對網絡社區上的有害消息進行過濾的過濾系統來對有害消息進行分類的技術領域。該專利申請提供的方法能夠通過提供智能垃圾過濾技術,來在反垃圾市場內實現高的適銷性。針對有害消息的過濾系統包括數據庫,用于存儲接收自客戶端的消息;消息接收器,用于接收所述消息;單詞提取單元,用于從接收到的消息中提取多個單詞;以及評估單元,用于通過使用所提取的單詞來判斷所述消息是否有害,并將其存儲于數據庫中,并且所述評估單元使用存儲在所述數據庫中的單詞評估值來判斷所述消息是否為有害消息,之后該消息被分類為多個有害消息。注冊號為10-0484944 的韓國專禾U (SYSTEM FOR AUTOMATICALLY TAGGING SEMANTICS OF MORPHEME BASED ON LOCAL SYNTAX RELATION AND SEMANTIC CO-OCCURRENCE DICTIONARY)公開了一種基于本地短語關系以及語義共現(cooccurrence)目錄的自動語素語義標記系統,該系統包括短句識別器,用于通過使用基本語法生成規則、從屬語法規則、電子語素語意目錄、語義框架以及經由對原始句子的語素分析生成的可變格短語共現目錄,來對短句進行識別;助詞格恢復模塊,用于通過使用語義框架以及可變格短語語義共現目錄,來執行針對助詞的格恢復;爭議名詞(argument noun)語意確定模塊,用于通過使用可變格短語語義共現目錄來確定爭議名詞的語意;名詞短語語意確定模塊,用于通過使用名詞短語語意共現目錄(由名詞/介詞/名詞以及名詞/名詞共現信息配置而成)來確定名詞短語和復合名詞內的名詞的語意。自動語素語義標記系統使用語言方面的語法結構信息來使用語法上下文信息(其是比現有的其他語義歧義裝置更為精確的共現信息),從而提出了一種用于解決名詞的語意歧義的方法。注冊號為10-0757951 的韓國專利(SEARCH METHOD USING MORPHEME ANALYZING IN WEB PAGE)公開了一種通過對網頁進行語素分析的搜索方法,該方法包括如果客戶端用戶通過分頁式瀏覽器(tab browser)連接至網站,則將所連接的網站的內容顯示給該分頁式瀏覽器;通過由分析服務器對顯示至客戶端的分頁式瀏覽器的內容執行上下文語素分析,來辨別重復句子或單詞的頻率;從被識別的單詞中選擇具有預定頻率值或更高頻率值的句子及單詞作為關鍵字(即,很重要的單詞);輸出所選的重要單詞作為每一分頁式瀏覽器的標題;對將每一分頁式瀏覽器的標題作為入口網站的查詢字進行搜索,并將搜索結果作為每一分頁式瀏覽器的內容進行輸出;在分析服務器中,提供信息至客戶端(諸如,筆記本、移動電話、PDA等)。該專利利用搜索系統的一種方法論,通過語素處理,來計算句子及單詞出現于文本內的次數,將分頁式瀏覽器標題作為關鍵字進行輸出。注冊號為10-0691400 的韓國專利(METHOD FOR ANALYZING MORPHEME USING ADDITIONAL INFORMATION AND MORPHEME ANALYZER FOR EXECUTING THE METHOD)公開了一種用于分析語素的方法,該方法包括從索引數據中獲取語素分析對象以及與該語素分析對象相關聯的附加信息;基于該附加信息,生成關鍵點(key);以及使用該關鍵點對語素分析對象執行語素分析。公開號為10-2007-0029389 的韓國專利申請(METHOD AND SYSTEM FOR PROVIDING ADVERTISEMENT SERVICE USING CORE KEYWORD AND RECORD MEDIA RECORDED PROGRAM FOR REALIZING THE SAME)公開了一種記錄介質,該記錄介質可由數字處理裝置讀取,且其上實施有命令字,該命令字可由數字處理裝置執行以通過使用核心關鍵字來提供關鍵字廣告服務,包括通過分析內容文本的語素來提取關鍵字;通過與廣告關鍵字DB服務器進行交互, 確定核心關鍵字;通過與廣告DB服務器進行交互,接收與所述核心關鍵字相匹配的廣告列表;以及將包含于該廣告列表內的至少一廣告插入至所述內容文本中。公開號為10-2006-0011333 的韓國專利申請(SYSTEM AND METHOD FOR PROVIDING LOCAL INFORMATION BY MESSAGE ANALYSIS)公開了一種用于提供本地信息的系統,該系統包括數據庫,用于存儲每一區域及商業類型的廣告信息;消息識別單元,用于分析存儲的短消息或存儲的文本消息;語音識別單元,用于分析存儲的語音消息;位置信息收集單元, 用于檢查訂閱者終端的當前位置;服務控制器,用于向消息識別單元及語音識別單元請求與服務訂閱者相關的消息是否已被存儲,檢查接收到的消息分析結果,向位置信息收集單元請求訂閱者終端的當前位置信息,以及根據消息分析結果向訂閱者終端提供期望的商業類型及區域信息;以及SMS生成單元,用于從數據庫搜索信息,將搜索結果添加至短消息中,并將其傳送至訂閱者終端。公開號為10-2007-0015752 的韓國專利申請(SYSTEM AND METHOD FOR AD TRIGGERING MESSAGING SERVICE BASED ON MOBILE MESSAGING SERVICE)公開了一種用于 AD觸發消息服務的系統,該系統包括消息服務器,用于在通過對傳送自呼叫方終端的消息進行分析而檢測到AD觸發標識符時,在將預定AD消息傳送至呼叫方終端之后,傳送消息內容至接收終端。注冊號為10-0775680 的韓國專禾U (METHOD AND SYSTEM FOR PROVIDING ADVERTISEMENT CONTENTS BY USING CHATTING IN MOBILE TERMINAL)公開了一種用于通過無線通信網絡來在移動通信終端與服務器之間通過messager (—種聊天軟件)收發消息的方法,該方法包括判斷連接至服務器的移動通信終端是否從聊天伙伴中選擇任何虛擬聊天伙伴;根據移動通信終端的用戶偏好信息來在服務器中提取AD內容產品的聊天場景,以根據場景規則來將消息傳送至移動通信終端;傳送移動通信終端中的針對所述服務器的消息的響應消息;對在服務器內接收到的移動通信終端的消息進行分析,并根據用戶的意圖以及場景規則來傳送請求AD內容信息推薦許可的消息至移動通信終端;當從所述移動通信終端向服務器傳送允許AD內容信息推薦的消息時,傳送AD內容信息至移動通信終端;以及在服務器內,在傳送消息至移動通信終端之前,通過對移動通信終端的消息進行分析,來將messager的特征狀態調整成與用戶的意圖相對應。注冊號為10-05974 的韓國專禾U (SYSTEM AND METHOD FOR CLASSIFYING QUESTION BASED ON HYBRID OF INFORMATION SEARCH AND QUESTION ANSWER SYSTEM)公開了一種基于信息搜索及問答系統的混合來對問題進行分類的系統及方法,其包括被問化名(questioned work name)處理器,用于識別包含于所輸入問題內的化名;問題語言分析器,用于通過語素分析過程、對象名稱識別過程以及單詞語意標記過程,來將每一單詞轉換為語義代碼;基于規則的問題分類器,用于通過使用問題的LSP(詞匯語法模式)代碼以及預定義問題分類規則,來對問題所請求的答案類型進行分類;基于統計的問題分類器,用于通過使用在標記答案類型的學習文檔中構建的統計信息,來對問題的LSP代碼進行分類; 以及被問答案類型確定器,用于通過使用上述兩個分類器的結果,來最終確定用戶問題的答案類型。注冊號為10-0361166 的韓國專禾U (SYSTEM AND METHOD FOR SEARCHING INFORMATION)公開了一種用于搜索信息的系統及方法,其包括處理裝置,該處理裝置在數據庫(該數據庫根據領域來對多個信息進行分類,將代碼分配至每一分類領域,并結合每一領域的代碼來對表示包含于相應領域內的多個信息的單詞進行編碼)通過使用通信裝置、經由網絡訪問用戶搜索數據之后,當輸入表明待搜索的信息或相應信息所屬的領域的單詞時,對輸入單詞進行編碼,并基于編碼后的單詞來對數據庫進行搜索以搜索與該編碼單詞相對應的信息。其中存儲于數據庫內的信息被分類為多個信息區,每一信息區被分配有信息分類代碼,該信息分類代碼被分類至至少一個詳細信息區中,結合相應信息區的信息分類代碼來對該詳細信息區進行編碼,表示相應信息的多個單詞內相互之間具有相同或類似語意的單詞由同一代碼進行存儲,以系序(set order)來對每一字代碼進行排列。公開號為10-2005-00擬955 的韓國專利申請(SYSTEM AND METHOD FOR ONLINE AD INCLUDING COPY OF ADVERTISER FIT FOR CONTENTS)公開了一種用于進行在線廣告的系統及方法,其包括第一存儲裝置,用于存儲將被廣告的信息;第二存儲裝置,用于存儲原始內容;至少一個服務器,用于從所述第二存儲裝置獲取原始內容,通過自然語言處理機制對該原始內容進行分析,從所述第一存儲裝置獲取與分析結果相對應的將被廣告的信息,并將廣告信息中的詞性(part)信息插入所述原始內容中;以及第三存儲裝置,用于通過所述至少一個服務器來對插有廣告信息的內容進行存儲。注冊號為10-0669534 的韓國專利(METHOD AND SYSTEM FOR EXTRACTING SUMMARY OF DOCUMENT BY UTILIZING SENTENCE ABSTRACTION AND ABDUCTION RULES)公開了一種通過使用句子抽象及逆推規則來對文檔進行概括的方法,其包括句子輸入,用于輸入并存儲將被概括的文檔內容;語法分析,用于對所述步驟內存儲的數據的語法進行分析并存儲; 句子主要成分提取,用于在該步驟處順序讀取語法數據,并存儲本體數據;句子抽象化,用于通過將所述步驟處的本體數據值與識別上限信息(該識別上限信息為針對包含于每一所選主要成分內的語意的預定分類參考)進行比較,將每一所選主要成分理解為抽象語意;主題句選擇,用于在所述步驟處讀取被存儲的值,并將讀取的存儲值輸入至逆推規則程序可移動裝置單元中,以選擇語法之間具有逆推性的多個主題句,并存儲該多個所選主題句的每一識別值;概要寫入,用于在所述步驟處讀取針對被存儲并被選擇的主要成分而理解的抽象語意的相應值,并將讀取的值作為語法概要句子進行組合和存儲;概要句子輸出, 用于確定是否存在輸出控制信號,如果存在,則在該步驟處通過輸出單元的操作來輸出并顯示存儲的數據值。注冊號為10-0836878 的韓國專利(APPARATUS AND METHOD FOR ALLOCATION OF SUBJECT OR FIELD IN INFORMATION SEARCH SYSTEM)是用于在信息搜索系統內分配主題或字段的設備,所述信息搜索系統連接至用戶終端、網絡入口站點、網站,對信息進行搜索并提供搜索到的信息,信息搜索服務器包括搜索引擎,用于基于與查詢字或文檔相對應的索引字來對文檔執行信息搜索;數據庫,用于對搜索引擎搜索到的信息進行存儲和管理; 同義詞匹配單元,用于從存儲于所述數據庫內的原始句子中提取所述索引字,并通過該索引字執行同義詞匹配,以對所述原始句子執行主題或域分配;分眾分類(folksonomy)處理器,用于從存儲于所述數據庫內的定義句子中提取術語,通過提取的術語來分配所述主題并使用分眾分類法來分配域。此外,大型信息搜索門戶網站(諸如,谷歌、雅虎等)所使用的信息搜索系統是以搜索鍵類型的“單詞”單元為基礎的。雖然可執行“短語”輸入,但當前技術通過邏輯運算符 (與、或、非)而非通過根據高技術“短語”的語言處理方法來連接基于N元語法的索引鍵, 以給出搜索結果,從而在改善信息搜索的再生及精確性方面存在局限性。特別地,“移動信息搜索”技術已作為下一代信息搜索領域而嶄露頭角,并且正在提出并討論作為“語義網” 技術飛新的網絡搜索技術。然而,截至目前為止,并不存在具體的成功示例。
發明內容
本發明被設計為解決上述問題。本發明的目標為提供用于搜索多功能綜合信息 (integration information)的方法及系統,該方法及系統能夠通過將單詞單元用作關鍵字來擴展信息搜索系統內的短語單元及句子單元內的搜索鍵,以使信息搜索系統的用戶界面更為便利,并且能夠執行多功能綜合處理(諸如信息的供應、搜索、分類、評估、監視等)。此外,本發明的另一目標為提供一種用于搜索多功能綜合信息的方法及系統,該方法及系統能夠檢測信息搜索者或信息提供者的意圖,并基于檢測到的意圖來提供信息結^ ο為實現上述目標,根據本發明的示例性實施方式,提供一種用于搜索信息的方法, 該方法包括通過使用針對關鍵字的分析結果來檢測搜索者的意圖;向所述搜索者提供符合所述搜索者的意圖的編輯器;以及對具有與通過所述編輯器的輸入項輸入的元數據相關聯的內容進行搜索。所述用于搜索信息的方法可進一步包括將輸入的關鍵字分離為語意單詞;以及對分離后的關鍵字執行語法分析,其中,對搜索者的意圖進行檢測可以通過使用執行所述語法分析時的語法分析結果來檢測搜索者的意圖。所述語法分析的執行可以輸出語法表達式來作為語法分析結果,其中,可以通過分析句子內分離后的單詞是否具有任何文法關系以及語義關聯來獲取所述語法表達式。所述語法表達式可為邏輯表達式、修飾-被修飾以及語法列表表達式中的至少一
者ο
所述語法分析的執行可參考語法文法規則字典,以分析句子內分離后的單詞是否具有任何文法關系以及語義關聯,且所述語法文法規則字典可列有短語結構文法、格文法、 敏感文法(sensitive grammar)以及詞匯文法中的至少一者。所述分離可針對每個詞性(part)來對所述關鍵字進行分離。所述分離可通過參考與每個單詞的詞性相關的信息來針對每個詞性對所述關鍵字進行分離,所述信息以數據庫方式存儲于語素字典內。所述用于搜索信息的方法可進一步包括提取內容的符合搜索者意圖的元數據,其中所述編輯器的提供可提供作為符合搜索者的意圖的編輯器的編輯器,在該編輯器中,被提取的元數據成為輸入項。所述用于搜索信息的方法可進一步包括通過參考信息提供者的意圖來確定用于執行搜索的目錄,其中所述搜索可對與所確定的目錄相同或相似的目錄中的內容進行搜索。所述關鍵字可為單詞單元、短語單元以及句子單元中的任一者。所述搜索可對具有與通過所述編輯器的輸入項輸入的元數據中的至少一者相同的元數據、或具有與通過所述編輯器的輸入項輸入的元數據中的至少一者同義的元數據的內容進行搜索。所述用于搜索信息的方法可進一步包括在搜索時將附加服務添加至搜索結果。所述附加服務可為內容上下文認知服務,并且該內容上下文認知服務可包括以下各項中的至少一者導航服務、銷售服務、廣告服務、教育服務、咨詢服務、推薦服務以及行政月艮務(administrative service)。所述編輯器的輸入項中的至少一個輸入項可以作為通過使用所述關鍵字生成的實際數據(real data)而被自動輸入。所述用于搜索信息的方法可進一步包括通過將輸入的元數據與用于配置被搜索內容的元數據進行比較,來分別選擇并輸出具有高度一致性的內容。根據本發明另一示例性實施方式,提供一種提供用于搜索的信息的方法,該方法包括通過使用針對包含于信息內的文本的分析結果,來檢測提供所述信息的信息提供者的意圖;將符合所述信息提供者的意圖的編輯器提供給用戶;以及將對通過所述編輯器的輸入項輸入的元數據進行整合的內容進行存儲。所述提供用于搜索的信息的方法可進一步包括將包含于輸入信息內的文本分離成語意單詞;以及對分離后的關鍵字執行語法分析,其中對信息提供者的意圖進行檢測可以通過使用執行所述語法分析時的語法分析結果來檢測提供信息的信息提供者的意圖。所述語法分析的執行可以輸出語法表達式來作為語法分析結果,其中,可以通過分析句子內分離后的單詞是否具有任何文法關系以及語義關聯來獲取所述語法表達式。所述語法表達式可為邏輯表達式、修飾-被修飾以及語法列表表達式中的至少一者ο所述語法分析的執行可參考語法文法規則字典,以分析句子內分離后的單詞是否具有任何文法關系以及語義關聯,且所述語法文法規則字典可列有短語結構文法、格文法、 敏感文法以及詞匯文法中的至少一者。所述分離可針對每個詞性來對所述文本進行分離。
所述分離可通過參考與每個單詞的詞性相關的信息來將針對每個詞性對所述文本進行分離,所述信息以數據庫方式存儲于語素字典內。所述提供用于搜索的信息的方法可進一步包括提取內容的符合信息提供者的意圖的元數據,其中所述編輯器的提供可提供作為符合信息提供者的意圖的編輯器的編輯器,在該編輯器中,被提取的元數據成為輸入項。所述提供用于搜索的信息的方法可進一步包括通過參考信息提供者的意圖來確定存儲所述信息的目錄,其中內容的存儲可以將所述內容存儲于所確定的目錄內。所述提供用于搜索的信息的方法可進一步包括對包含于針對每一目錄劃分的內容內的文本進行收集,其中所述檢測可使用對收集到的文本的分析結果。根據本發明的另一示例性實施方式,提供一種提供用于搜索的信息的方法,該方法包括對包含于針對每一目錄劃分的內容內的文本進行收集;通過使用針對收集到的文本的分析結果,來檢測提供信息的信息提供者的意圖;將符合信息提供者的意圖的編輯器提供給用戶;以及將對通過所述編輯器的輸入項輸入的元數據進行整合的內容進行存儲。根據本發明的另一示例性實施方式,提供一種用于搜索信息的方法,該方法包括 接收關鍵字;接收輸入所述關鍵字的搜索者的意圖;將符合最終意圖的編輯器提供給所述搜索者,所述最終意圖整合了針對所述關鍵字的分析結果以及所述搜索者的意圖;以及對具有與通過所述編輯器的輸入項輸入的元數據相關聯的元數據的內容進行搜索。所述用于搜索信息的方法可進一步包括將輸入的關鍵字分離成語意單詞;以及對分離后的關鍵字執行語法分析,其中所述編輯器的提供可使用執行所述語法分析時的語法分析結果。根據本發明的另一示例性實施方式,提供一種提供用于搜索的信息的方法,該方法包括接收信息;接收輸入所述信息的信息提供者的意圖;將符合最終意圖的編輯器提供給所述信息提供者,所述最終意圖整合了針對所述信息的分析結果以及所述信息提供者的意圖;以及將對通過所述編輯器的輸入項輸入的元數據進行整合的內容進行存儲。所述提供用于搜索的信息的方法可進一步包括將輸入的信息分離成語意單詞; 以及對分離后的單詞執行語法分析,其中所述編輯器的提供可以使用執行所述語法分析時的語法分析結果。如上所述,與現有的將“搜索單詞”用作關鍵字,并通過將邏輯運算符與、或和非的組合用作所述關鍵字的擴展來搜索其他搜索單詞的搜索方法相比,本發明的示例性實施方式可執行“短語”及“句子”級別的搜索,實現了信息的再現性及精確性。進一步地,本發明的示例性實施方式可根據提供者的意圖來針對每一目錄對信息提供者所提供的信息進行分類及存儲,并通過檢測信息搜索者的搜索意圖來對存儲于相應目錄內的信息進行搜索,從而通過上下文認知信息供應/搜索提供了經雙方同意的/定制的搜索服務。另外,本發明的示例性實施方式還針對每一內容來定義不同的元數據,并采用通過使用基于該元數據生成的編輯器來更為詳細地對信息供應及搜索內容進行開發的方法, 從而相比于現有的搜索方法,能夠更為方便且精確地執行搜索。此外,本發明的示例性實施方式從搜索者輸入的信息來檢測搜索者的意圖、基于檢測到的意圖來推導詳細的元數據輸入以及使用輸入的元數據,從而在符合搜索者意圖的目錄里執行搜索。進一步地,在本發明的示例性實施方式中,信息提供者或搜索者可更為方便地輸入元數據,并可在輸入哪種類型的元數據方面接收引導,從而提高了輸入的方便性。另外,本發明的示例性實施方式可以基于信息提供者的意圖來對針對每一目錄的相應信息進行劃分,且可以對相應的元數據進行匹配和存儲。同時,本發明的示例性實施方式可從搜索者輸入的信息來檢測搜索者的意圖,并基于檢測到的意圖來推導詳細元數據的輸入,從而可自動輸入生成實際數據的元數據。進一步地,本發明的示例性實施方式可直接輸入信息提供者及信息搜索者的意圖,以更為精確地檢測信息提供者及信息搜索者的意圖,從而精確地提供并搜索信息。另外,本發明的示例性實施方式可通過使用PC或移動電話等來將候選人的宣傳資料發布給投票者,從而可通過使用目前使用成本很低的宣傳紙來迅速地提供候選人的宣傳資料。
圖1為示出了根據本發明示例性實施方式的搜索系統的圖示;圖2為示出了內容的元數據的圖示;圖3為示出了韓文語素字典的圖示;圖4為用于對將短語/句子處理成語素并之后執行語法分析的過程進行解釋的圖示;圖5為用于對根據本發明另一示例性實施方式的搜索方法進行解釋的流程圖;圖6為用于對根據本發明另一示例性實施方式的搜索方法進行解釋的流程圖;圖7為用于對地理導航服務進行解釋的圖示,該地理導航服務作為存儲于附加服務數據庫內且生成自附加服務生成器的附加服務的示例,并且是一種上下文認知搜索服務;圖8為用于對提供不同于圖7所示類型的附加服務的方法進行解釋的圖示;圖9為示出了將信息搜索窗口及信息提供窗口提供在一起的信息提供/搜索窗口的示例的圖示;圖10為示出了根據本發明另一示例性實施方式的搜索系統的圖示;圖11和圖12為用于對根據本發明另一示例性實施方式的搜索方法進行解釋的圖示;圖13為用于對根據本發明另一示例性實施方式的搜索方法進行解釋的圖示;圖14-圖16為用于對圖13所示的搜索方法進行附加解釋的圖示;圖17為示出了根據本發明另一示例性實施方式的搜索系統的圖示;圖18為用于對根據本發明另一示例性實施方式的搜索系統進行解釋的圖示;圖19為用于對根據本發明另一示例性實施方式的搜索系統進行解釋的圖示;圖20為示出了應用于宣傳候選人以進行電子投票的示例的圖示。參考標記及符號說明101 信息搜索窗口102:關鍵字輸入裝置
103 關鍵字語素處理器104 關鍵字語法分析器105 搜索者意圖檢測器106 信息監視器107 用于搜索的元數據提取器108 用于搜索的編輯器109:搜索目錄確定裝置110 搜索裝置111:元數據比較器112:附加服務數據庫113:附加服務生成器114:搜索結果生成器115:信息存儲單元116:存儲目錄確定裝置117:信息提供編輯器118 信息提供元數據提取器119:元數據 DB120 信息提供者意圖檢測器121 信息監視器122 信息語法分析器123 語法文法規則字典124 信息語素處理器125 語素字典126 信息輸入裝置127:信息提供窗口128 信息數據庫129 搜索結果顯示單元1001 信息搜索窗口1002:關鍵字輸入裝置1003 關鍵字語素處理器1004 關鍵字語法分析器1005 搜索者意圖檢測器1006 信息監視器1007 用于搜索的元數據提取器1008 用于搜索的編輯器1009 搜索裝置1010:元數據比較器1011 附加服務數據庫1012:附加服務生成器
1013 搜索結果生成器1014 信息存儲裝置1015 信息提供編輯器1016 信息提供元數據提取器1017:元數據 DB1018 內容提供者意圖檢測器1019 信息監視器1020:語法分析器1021 語法文法規則字典1022:語素處理器1023:語素字典1024:目錄內容搜索器1025 :信息081026 搜索結果顯示裝置1027 搜索目錄確定裝置1028 存儲目錄確定裝置1701 信息提供/搜索窗口1702:語素處理器1703:語素字典1704 語法分析器1705 語法文法規則字典1706 意圖指定器1707 信息監視器1708 信息提供元數據提取器1709 信息提供編輯器1710:存儲目錄確定裝置1711 信息存儲裝置1712 J^gDB1714 用于搜索的元數據提取器1715 用于搜索的編輯器1716:搜索目錄確定裝置1717 搜索裝置1718:元數據比較器1719 搜索結果生成器1720 搜索結果顯示裝置1721:附加服務 DB1722:附加服務生成器
具體實施方式
下文中,將參考附圖對本發明的示例性實施方式進行描述。圖1示出了根據本發明示例性實施方式的搜索系統。構成根據本發明示例性實施方式的搜索系統的塊可通過S/W及H/W來實現。此外,構成所述搜索系統的一些塊可通過 S/W來實現,而其余的塊則可通過H/W來實現。根據本發明示例性實施方式的搜索系統通過上下文認知信息供應/搜索來提供經雙方同意的/定制的搜索服務,該服務根據提供者的意圖、針對每一目錄來對信息提供者提供的信息進行分類和存儲,并通過檢測信息搜索者的搜索意圖來對存儲于相應目錄內的信息執行搜索。此外,本發明的示例性實施方式還針對每一內容來定義不同的元數據,并采用通過使用基于該元數據生成的編輯器來更為詳細地對信息供應及搜索內容進行開發的方法, 從而相比于現有的搜索方法,能夠更為方便且精確地執行搜索。在此情況下,所述元數據可為可詳細且系統地定義內容的特征(其為信息供應/ 搜索的對象)的數據。例如,“書籍”的元數據指有關書籍的詳細信息,諸如書籍名稱、作者、出版社、出版年限、價格、主題等。在本發明的示例性實施方式中,可通過具有已定義框架的編輯器來對所述元數據進行輸入及確認。可通過表格格式或句子格式來實施所述框架格式。圖2為示出了內容的元數據的圖示。如圖2所示,可以確認,已對所有領域的內容的必要的元數據進行了定義。例如,可以確認,在不動產交易202中,將“銷售物品”、“位置""預期價格”、“特征”、
“地鐵信息”和“視頻信息”等標準化為元數據。圖2所示的內容的元數據存儲于圖1所示的元數據DB 119中。同時,如圖1所示,根據示例性實施方式的搜索系統包括信息搜索窗口 101、關鍵字輸入裝置102、關鍵字語素處理器103、關鍵字語法分析器104、搜索者意圖檢測器105、 信息監視器106、用于搜索的元數據提取器107、用于搜索的編輯器108、搜索目錄確定裝置 109、搜索裝置110、元數據比較器111、附加服務數據庫112、附加服務生成器113、搜索結果生成器114、信息存儲裝置1115、存儲目錄確定裝置116、信息提供編輯器117、信息提供元數據提取器118、元數據DB 119、信息提供者意圖檢測器120、信息監視器121、信息語法分析器122、語法文法規則字典123、信息語素處理器124、語素字典125、信息輸入裝置126、信息提供窗口 127、信息DB 128以及搜索結果顯示裝置129。信息輸入裝置1 將用戶通過信息提供窗口 127輸入的信息傳輸至信息語素處理器 1240語素字典125以數據庫方式對每個單詞的詞性信息進行存儲。此外,語素字典125 對每一單詞的擴展信息、同義詞信息或外文翻譯擴展信息等以數據庫方式進行存儲。在此情況下,由于對登記于語素字典125內的單詞不存在限制,所以還可在該語素字典125內登記其他詞性信息(part information)(代詞、形容詞、后置詞或結尾等)。可參考登記于語素字典125內的詞性信息來將針對每個詞性對文本進行分離,且可使用語義信息來理解內容作者或搜素者的意圖。此外,可使用同義詞信息來在更寬范圍內執行擴展搜索,且可使用外文翻譯來執行多語言搜索。
圖3示出了登記于語素字典125內的信息,且下面將參考圖3對語素字典125進行詳細描述。信息語素處理器124以“語義單詞”為單元對傳輸自信息輸入裝置126的文本進行分離。在此情況下,所述“語義單詞”指一個詞性。從而,可以理解的是,信息語素處理器 124針對每個詞性來將文本進行分離。為此目的,信息語素處理器IM通過參考語素字典125內以數據庫方式存儲的單詞的詞性信息,來針對每個詞性將文本進行分離。信息語法分析器122基于信息語素處理器124的語素處理結果,對用戶輸入的信息執行語法分析。該信息語法分析器122在執行語法分析的同時參考語法文法規則字典 123內登記的文法規則。信息提供者意圖檢測器120使用輸出自信息語法分析器122的語法分析結果來檢測信息提供者的意圖。信息監視器121對信息提供者意圖檢測器120檢測到的信息提供者的意圖進行輸出,以使得用戶可見。為此目的,該信息監視器121可使用圖形化工具。信息提供元數據提取器118從元數據DB 119中提取符合信息提供者意圖檢測器 120檢測到的信息提供者意圖的內容的元數據。信息提供編輯器117生成編輯器(其中,信息提供元數據提取器118提取的元數據被形成為輸入項),并將該編輯器提供給信息提供者。存儲目錄確定裝置116確定信息DB 1 上適于存儲所述內容的目錄。在此情況下,存儲目錄確定裝置116可通過參考信息提供者意圖檢測器120檢測到的信息提供者的意圖來確定所述目錄。信息存儲裝置115將整合了信息提供編輯器117所生成的元數據的內容存儲于信息DB 128內。在此情況下,該內容存儲于由存儲目錄確定裝置116所確定的目錄內。上述組件為用于生成并存儲提供所述信息所必須的信息的組件。在下文中,將對當信息搜索者通過輸入關鍵字來請求進行搜索時可通過推導通過搜索意圖檢測而輸入的詳細關鍵字來更為精確地執行搜索的組件進行詳細描述。在此情況下,用戶輸入的關鍵字的示例可包括單詞、短語以及句子。信息搜索窗口 101提供輸入窗口,用戶可通過該窗口輸入關鍵字,諸如單詞、短語或句子。進一步地,關鍵字輸入裝置102將用戶通過信息搜索窗口 101輸入的關鍵字傳輸至關鍵字語素處理器103。關鍵字語素處理器103以“語義單詞”為單元對傳輸自關鍵字輸入裝置102的關鍵字進行分離。在此情況下,所述“語義單詞”指一個詞性。從而,可以理解的是,關鍵字語素處理器103以類似于信息語素處理器124的方式來針對每個詞性將關鍵字進行分離。為此目的,關鍵字語素處理器103通過參考語素字典125內以數據庫方式存儲的單詞的詞性信息,針對每個詞性將文本進行分離。關鍵字語法分析器104基于關鍵字語素處理器103的語素處理結果,對搜索者輸入的關鍵字執行語法分析。該關鍵字語法分析器104在執行語法分析的同時,參考語法文法規則字典123。
搜索者意圖檢測器105使用輸出自關鍵字語法分析器104的語法分析結果來檢測搜索者的意圖。信息監視器106對搜索者意圖檢測器105檢測到的搜索者意圖進行輸出,以使得用戶可見。為此目的,該信息監視器106可使用圖形化工具。用于搜索的元數據提取器107從元數據DB 119中提取符合信息搜索者意圖檢測器105檢測到的搜索者意圖的內容的元數據。用于搜索的編輯器108生成編輯器(其中,用于搜索的元數據提取器108提取的元數據被形成為輸入項),并將該編輯器提供給搜索者。搜索目錄確定裝置109確定信息DB 1 上適于搜索所述內容的目錄。在此情況下,搜索目錄確定裝置109可通過搜索者意圖檢測器105檢測到的搜索者的意圖來確定所述目錄。進一步地,搜索目錄確定裝置109可另外確定與所確定的目錄相類似的目錄。這可執行更寬范圍的搜索。搜索裝置110對信息DB 128內的具有與由用于搜索的編輯器108輸入的元數據相同的元數據的內容進行搜索。在此情況下,在搜索目錄確定裝置109中所確定的目錄內執行所述搜索。搜索裝置110可執行擴展搜索,該擴展搜索通過將用于搜索的編輯器108輸入的元數據替換為同義詞來執行所述搜索。進一步地,搜索裝置110可搜索在結構及單詞方面具有與元數據完全相同的元數據的內容以及僅在結構及單詞中的詞性方面具有與元數據相同的元數據的內容。換言之, 搜索裝置110還可執行相同搜索、部分搜索或相關搜索。元數據比較器111將通過由用于搜索的編輯器108輸入的元數據與構成由搜索裝置110所搜索的內容的元數據進行比較,并基于比較結果來僅選擇和輸出具有高度一致性的內容。如上所述,可通過將以表格格式形成的元數據分別進行比較來執行所述比較(確定所述一致性)。附加服務數據庫112可存儲用于提供適合于搜索者的搜索意圖的站點信息或相關廣告服務等的單元。附加服務生成器113生成與所述關鍵字相關的附加服務。為此目的,附加服務生成器113使用存儲于附加服務數據庫112內的附加服務中的、適合于搜索者的搜索意圖的附加服務。附加服務數據庫112及附加服務生成器113所提供的附加服務可被實施為內容上下文認知服務。在此情況下,該內容上下文認知服務的示例可包括導航服務、銷售服務、廣告服務、教育服務、咨詢服務、推薦服務、行政服務等。搜索結果生成器114根據與輸出自元數據比較器111的搜索結果(內容)的一致性,來添加附加服務生成器113所生成的附加服務。搜索結果顯示單元1 通過屏幕輸出從搜索結果生成器114生成的添加有附加服務的搜索結果,以將該結果提供給用戶。同時,可僅將與搜索結果一致的內容提供給用戶,而不提供附加服務。這可以通過下面的方式來實現附加服務生成器113不生成附加服務,或即使附加服務生成器113生成了附加服務,搜索結果生成器114亦不添加所生成的附加服務。
下文中,將參考圖3,對上述語素字典125進行詳細描述。圖3示出了作為語素字典的示例的韓文語素字典。如圖3所示,語素字典125被配置成分別列有1)第一列的韓文單詞;2)第二列的單詞詞性信息;3)第三列的單詞語義信息;4)第四列的一組同義詞(或同意短語)、類似單詞和/或代表單詞力)第五列的英文翻譯;6)第六列的日文翻譯;以及7)第七列的中文翻譯。通過使用圖3所示的語素字典125,可允許信息語素處理器IM將文本作為語素進行處理,并允許關鍵字語素處理器103將關鍵字作為語素進行處理。如上所述,語素處理指的是給定句子的元素是否被配置為任何有意義的單詞。 例如,當將叫1 ^"Cf (我去學校)”被作為語素進行處理時,劃分單詞界(例如, “計51+011+外+1_鈄”)即為語素處理。在此情況下,所使用的信息(該信息為存儲于語素字典125內的詞性信息)審查各詞性之間的關系,并輸出諸如“計JiI /名詞+叫/介詞+ 7]· /動詞+ L /結尾”這樣的關系作為處理結果。進一步地,作為語素處理的附帶信息,可獲得諸如“單詞頻率”、“句子數量”之類的語言統計值,且可同時輸出語義信息、同義詞信息、外文翻譯。
同時,可對登記于語素字典125內的語義信息進行如下分類
動物/ 頻率/ 域名稱/2)動詞實例行為/立即 /服務等。
1)名詞實例
事情/自然/物質/元素/工具/裝置/人際關系/社會/罪行人類/植物/數字/抽象/建筑/具體/行為/狀態/時間/地點比率/等級/數量/重點/事實/情感/弊端/辱罵/政治/經濟/ 思想/人名/食物/邪惡/醫藥用品等。
組織
化/文化/
‘位置/周期/ 公司名稱/區
繼續/運動/改變/情感/思考/認知/存在/確定/意外/表達
/目標
3)形容詞實例
狀態/關系/屬性/等級/重點/好的感覺/不好的感覺/選擇/邪惡/方面等
4)介詞實例
短語I裝置/方法I原料
結果I給出結束I接收結束
材料I起因/原因I源/起始點I原點/方向I對象地點I時間I情況I內容I角色I對比I范圍/頻
率I等級I數量I比率I重點I事實I方面等。5)副詞實例I重點I等。6)結尾表示方面的實例過去I當前I未來I否定I可能性I親密I義務I必需性主張I確定估計I不確定估計/計劃I希望I執行I命令I問題
工作I依賴I被動性I利益I謙虛I榮譽稱號等。然而,上述分類僅為示例,且可被改變。單詞的語意時刻均在變化,從而可根據時
間變化來改變語意分類,而非不變。進一步地,在對語義信息進行分類時,可參考根據同義
18
必然性I請求I需求忠誠I允許I邀請詞分類的詞匯字典。根據圖3所示,1)可以理解的是,“Syng Man lee 125-1”的詞性信息為“名詞”、語義信息為“人名”、以及同義詞信息為“南韓總統”。2)可以理解的是,"Naengmyeon 125-2”的詞性信息為“名詞”、語義信息為“食品名稱”、以及同義詞信息為“韓國的代表性面食”。3)可以理解的是,“Carbon Dioxide 125_3”的詞性信息為“名詞”、語義信息為“有害物質”、以及同義詞信息為“二氧化碳,全球變暖”。4)可以理解的是,Meyo 125_4”的詞性信息為“結尾”、語義信息為“請求,尊敬”、 以及同義詞信息為“命令”。5)可以理解的是,"Nom 125-5"的詞性信息為“名詞”、語義信息為“謙稱”、以及同義詞信息為“成員”。可使用所述語義信息及同義詞信息來擴大和擴展搜索。例如,當將“Syng Man lee”用作關鍵字時,還可提供針對“Syng Man lee”的搜索結果以及與“南韓總統”相關的搜索結果。此外,當將“二氧化碳對策”用作關鍵字時,可進一步提供“有害物質”、“C02對策”、 “全球變暖對策”以及“二氧化碳對策”的搜索結果。類似地,由于語義信息(諸如,“牛肉、豬肉、韓國泡菜”等)為“食物”且同義詞信息為“肉”及“蔬菜”,所以可通過使用該語義信息及同義詞信息來執行擴展搜索。如上所述,可將詞性信息、語義信息以及同義詞信息登記于語素字典125內,從而可搜索豐富的信息。下文中,將參考圖3,進一步對通過處理短語/句子來對語法進行分析的過程進行描述。所述語法分析為是分析構成句子的每一語意單詞是否具有其他構成正確句子的結構的過程。可使用描述自然語言的文法理論來對語法進行分析。描述自然語言的文法理論的示例可包括短語結構文法、格文法、敏感文法或詞匯文法等,這些對于文法描述方法而言均是不同的。由于可將文法理論應用至所有語言(諸如英文、韓文、中文或日文等),還可將本實施方式所述的韓文語法分析方法應用至其他語言。將經歷圖4所示的語素處理401過程的輸入句子分離為語意單詞單元,并將詞性信息添加至每一分離后的單詞402。該詞性信息變為大約10-12個詞性名稱,諸如{名詞, 代詞,數字,形容詞,副詞,介詞,···}等。為了分析每個單詞相互之間如何耦合以形成正確的短語、從句以及句子,需要用于每種語言的正確短語、從句以及句子的生成規則403。該規則包含于上述語法文法規則字典123中,從而可從語法文法規則字典123中提取。例如,當文法清楚地表達了 “句子包括主題(名詞短語)以及謂語(動詞短語),, 這一知識時,S(句子)可被表示為一NP(名詞短語)·νΡ(動詞短語)。用于短語、從句以及句子的生成規則403即為定義該規則之處。簡要描述這些規則1)基于短語、從句以及句子中生成的規則,以單詞為單位來定義短語結構文法類型;幻格文法類型及敏感文法類型以單詞從句為單位來定義修飾單元與被修飾單元之間的關系;3)詞匯文法類型采用VP = cat (動詞,基礎語意、…,Sub, SEM)類型,且通過被稱之為聯合的操作來執行各個單詞之間的正確耦合。作為具體示例,對短語結構文法規則及處理方法作如下定義(I)S ^ PPV(2) PP — NP當對“來自首爾”的語法進行分析時,生成語素處理結果的單詞(首爾/N(名詞), 自/P(介詞),來Λ(動詞)過去)。當執行短語分析時,由于“自首爾”為“NP”,故根據文法規則⑵將“自首爾”的語法分析為“PP(介詞短語)”,且由于“來”為動詞,故根據文法規則(1)將PP和V分析為“S(句子)”,從而就韓文而言,結果被輸出為稱之為(來(自首爾))的樹狀結構公式或列表結構公式。同時,當根據敏感文法規則來對上述示例句子進行分析時,通過被稱之為“自首爾 —來”的表達式來輸出語法分析關系,其中單詞子句“自首爾”修飾單詞子句“來”。進一步地,詞匯文法類型輸出被稱之為(來,[誰].[自首爾])的語法分析結果作為語義表達式。本發明可根據文法理論來輸出語法分析表達式404中的每一者。因此, 可輸出根據詞性信息的表達式405、根據語義信息的表達式406以及根據同義詞/短語的表達式407。圖5示出了用于對根據本發明另一示例性實施方式的搜索方法進行解釋的流程圖。如圖5所示,當用戶通過信息提供窗口 127輸入“吾衛外普M坤(銷售二手車),,時,信息輸入裝置126將用戶輸入的信息傳輸至信息語素處理器124(501)。信息語素處理器IM通過參考語素字典125來針對每個詞性將“吾衛^“普^! 4 (銷售二手車)”進行分離,并將“銷售二手車”輸出為“U) (502)。在此情況下,根據語素處理結果,將詞性信息及語義信息(名詞/ 二手車,,動詞/ 銷售,結尾/尊敬)一起輸出。在此情況下,所述詞性信息為名詞、動詞以及結尾,而所述語義信息為二手車、銷售以及尊敬。之后,信息語法分析器122對語素處理結果執行語法分析,并輸出結果(二手車一銷售)(503)。信息提供者意圖檢測器120使用輸出自信息語法分析器122的語法分析結果來檢測信息提供者的意圖為“銷售二手車”(504)。因此,信息提供元數據提取器118從元數據DB 119中提取適于信息提供者意圖的內容的元數據,即“詈衛斗例(二手車交易)” (505)。信息提供編輯器117生成編輯器(其中提取的元數據成為輸入項),并將該編輯器提供給信息提供者(506)。最終,信息提供者通過提供的編輯器輸入元數據(507)。圖5示出了這樣一種情況,即將“二手車名稱索納塔”、“變速箱自動”、“年份 2001”、“行駛里程100, 000公里”、“顏色銀色”、“預期價格1, 200,000韓元”以及照片信息輸入至具體項。存儲目錄信息裝置116確定信息DB 128上適于存儲所述內容的目錄,并添加目錄索引鍵(二手車,銷售)。這將在相應的目錄內存儲所述內容。同時,除了所述目錄索引鍵 (二手車,銷售)之外,存儲目錄確定裝置116還可添加用戶ID (508)。進一步地,信息存儲裝置115將整合了信息提供編輯器117所輸入的元數據的內容存儲于信息DB 1 內。在此情況下,所述內容被存儲于存儲目錄確定裝置116所確定的目錄內。以上對根據信息提供者輸入的信息來檢測用戶的意圖并基于檢測到的意圖來推導將被存儲為單個內容的詳細元數據輸入的過程進行了詳細描述。下文中,將參考圖6對通過使用上述過程所存儲的元數據來基于搜索者輸入的關鍵字執行搜索的過程進行描述。圖6為用于對根據本發明另一示例性實施方式的搜索方法進行解釋的圖示。在該示例性實施方式中,當信息搜索者輸入關鍵字時,可檢測搜索者的搜索意圖,且可以基于檢測到的搜索者意圖來進行詳細且精確的搜索。在此情況下,用戶輸入的關鍵字的示例可包括單詞、短語以及句子。如圖6所示,當用戶通過信息搜索窗口首次輸入關鍵字“吾衛外晳Μ斗(購買二手車)”(601)時,關鍵字語素處理器103針對每個詞性來對輸入的關鍵字進行分離,并在將其輸出為(吾JI外MlVW 鈄)(602)的同時,添加并輸出詞性信息及語義信息(即,名詞/吾衛外,動詞/干呻,結尾/尊敬)。之后,信息語法分析器104基于語素處理結果來執行語法分析,并之后輸出結果 (二手車一購買)(60 。搜索者意圖檢測器105使用語法分析結果來檢測搜索者的意圖為 “二手車一購買”(604)。之后,用于搜索的元數據提取器107從元數據DB 119中提取適于搜索者的意圖 “購買二手車”的內容的元數據,且用于搜索的編輯器108生成編輯器(其中用于搜索的元數據提取器107提取的元數據為輸入項),并將該編輯器提供給搜索者(605)。結果,搜索者通過提供的編輯器來輸入元數據(606)。圖6示出了這樣一種情況,即將“二手車名稱索納塔”、“變速箱自動”、“年份2001年之后”、“行駛里程低于 100, 000公里”、“顏色銀色”、“預期價格1, 200,000韓元或更低”以及“燃料液化氣”輸入至具體項。搜索目錄確定裝置109確定信息DB 128上適于搜索所述內容的目錄,且搜索裝置 110在信息DB 1 中搜索具有與由用于搜索的編輯器108輸入的元數據相同的元數據的內容。在搜索目錄確定裝置109中確定的目錄內執行所述搜索。在此情況下,搜索目錄確定裝置109可通過參考搜索者意圖檢測器105檢測到的搜索者意圖來確定所述目錄。可另外確定與所確定的目錄相類似的目錄。這可執行更寬范圍的搜索。進一步地,搜索裝置110還可執行相同搜索、部分搜索或相關搜索。之后,元數據比較器111將通過用于搜索的編輯器108輸入的元數據與構成搜索者110所搜索的內容的元數據進行比較(608)。進一步地,元數據比較器111基于比較結果來僅選擇并輸出具有高度一致性的內容。到目前,詳細描述了根據搜索者輸入的信息來檢測搜索者的意圖、基于檢測到的意圖來推導詳細的元數據輸入以及通過使用輸入的元數據來在符合搜索者意圖的目錄中執行所述搜索的過程。
本發明的示例性實施方式可被實施為通過使用常規或標準編輯器來輸入元數據。 因此,信息提供者或搜索者可更方便地輸入元數據,并且可在輸入哪種類型的元數據方面接收引導。因此,可增加輸入的方便性。通過使用常規編輯器來輸入元數據的形式還可被應用至諸如移動電話或IPTV之類的裝置的情形。同時,本發明的示例性實施方式可執行條件搜索,該條件搜索可根據特定條件來限制特定元數據。例如,執行關鍵字為“120進省叫許營衛許(1,200,000韓元或更低的二手車)”的搜索對應于所述條件搜索。圖7為用于對地理導航服務進行解釋的圖示,該地理導航服務作為存儲于附加服務數據庫112內且生成自附加服務生成器113的附加服務的示例,并且是一種上下文認知搜索服務。為此目的,圖7中假設通過信息搜索窗口 101來輸入句子“叫^^ 艾效芒^Hfle]司]厶互眢芒(這附近是否有美味的意大利餐館)”(701)。語素處理器103以語素形式對輸入句子701進行處理,并將其分離成 “叫己祠/貲效/芒/叫砷司/矧厶旦智/芒” (702),之后輸出加入了語義信息的
“O〗己詞/名詞/當前位置,貨效/形容詞/食物評價,芒/介詞/修飾,O] _司/名詞/ 國名,矧厶互名詞/餐館,各/介詞/暗示”(703)。之后,關鍵字語法分析器104對語素處理結果的語法進行分析,且搜索者意圖檢測器105通過語法分析結果來檢測搜索者的意圖。具體而言,搜索者意圖檢測器105分別指示上下文認知單詞“芒/芒”的語義信息為“溝μι,,,上下文認知單詞“叫e祠”被檢測為具有“可以通過GPS確認的當前位置”的語意,且“叫砷司釗厶旦導”被檢測為具有要求搜索餐館數據庫的意圖。因此,附加服務生成器113通過使用GPS來檢測當前位置(704),搜索裝置110執行對美味意大利餐館的搜索(705),附加服務生成器113執行映射(706),并且指示地圖 (該地圖上顯示了當前位置)上被搜索到的美味意大利餐館的地圖被輸出(707)。圖8為用于對提供不同類型的附加服務的方法進行解釋的圖示。圖8所示的附加服務用于將與包含于文本輸出中的特定單詞及主題相關的各種附加信息提供作為搜索結果。為此目的,可使用存儲于附加服務數據庫112內的各種信息,諸如組織信息801、廣告信息802、特性信息803、正題主題信息804或公司信息805等,且可以從通過網絡相連的其他數據庫中獲取所述各種信息。圖9為示出了將信息搜索窗口及信息提供窗口提供在一起的信息提供/搜索窗口的示例的圖示。所示信息提供/搜索窗口中的輸入窗口 901為用于輸入關鍵字的窗口,信息提供按鈕902為在信息被提供/登記輸入至輸入窗口 901時使用的按鈕,信息搜索按鈕 903為用于命令對輸入至輸入窗口 901的關鍵字進行信息搜索的按鈕。進一步地,提供于底部的按鈕904用于設置搜索方法及提供搜索結果的方法。例如,圖9中給出的“完整搜索”按鈕用于將搜索類型設置為完整搜索,“廣告許可”按鈕用于允許將與搜索結果相關的廣告與搜索結果一起顯示,“相關服務提供許可”按鈕用于允許在包含于搜索結果內的單詞及短語上一起提供附加信息。
還可將圖7-9中所給出的實施示例應用于將在以下進行描述的其他示例性實施方式,因此,將在以下進行描述的示例性實施方式將不再重復地描述以上實施的示例。圖10為示出了根據本發明另一示例性實施方式的搜索系統的圖示。構成根據本發明示例性實施方式的搜索系統的塊可通過S/W及H/W來實現。此外,構成所述搜索系統的一些塊可通過S/W來實現,而其余的塊則可通過H/W來實現。如圖10所示,根據本示例性實施方式的搜索系統包括信息搜索窗口 1001、關鍵字輸入裝置1002、關鍵字語素處理器1003、關鍵字語法分析器1004、搜索者意圖檢測器 1005、信息監視器1006、用于搜索的元數據提取器1007、用于搜索的編輯器1008、搜索裝置 1009、元數據比較器1010、附加服務數據庫1011、附加服務生成器1012、搜索結果生成器 1013、信息存儲裝置1014、信息提供編輯器1015、信息提供元數據提取器1016、元數據DB 1017、信息提供者意圖檢測器1018、信息監視器1019、語法分析器1020、語法文法規則字典 1021、語素處理器1022、語素字典1023、目錄內容搜索器IOM、信息DB 1025、搜索結果顯示裝置10 、搜索目錄確定裝置1027以及存儲目錄確定裝置1(^8。目錄內容搜索器IOM收集包含于分離自每一目錄的內容中的文本。目錄內容搜索器IOM收集到的文本被傳輸至將在以下描述的語素處理器1022。圖10示出了工作信息21、大學入學考試信息13、不動產23、金融M、汽車25、電影及游戲沈、購物27、交通信息觀、旅游信息四、推薦30等作為在其中存儲內容的目錄,但還可采用其他目錄。語素字典1023可被實施為與圖1所示的語素字典125相同的語素字典。語素處理器1022通過參考語素字典1023,針對每個詞性將傳輸自目錄內容搜索器IOM的文本進行分離,并輸出每個詞性。語法分析器1020基于語素處理器1022的語素處理結果,來對包含于內容內的文本執行語法分析。語法分析器1020在執行語法分析的同時,參考語法文法規則字典1021。內容提供者意圖檢測器1018使用輸出自語法分析器1020的語法分析結果來檢測內容作者的意圖。信息監視器1019輸出信息提供者意圖檢測器1018檢測到的信息作者的意圖,以使得用戶可見。為此目的,信息監視器1019可使用圖形化工具。信息提供元數據提取器1016從元數據DB 1017中提取符合信息提供者意圖檢測器1018檢測到的信息提供者意圖的內容的元數據。信息提供編輯器1015生成編輯器(其中,信息提供元數據提取器1016提取的元數據被形成為輸入項),并將該編輯器提供給信息提供者。存儲目錄確定裝置10 確定信息DB 1025上適于存儲所述內容的目錄。在此情況下,存儲目錄確定裝置10 可通過參考信息提供者意圖檢測器1020檢測到的內容提供者的意圖來確定所述目錄。信息存儲裝置1014將整合了信息提供編輯器1015所生成的元數據的內容存儲于信息DB 1025內。在此情況下,所述內容存儲于存儲目錄確定裝置10 所確定的目錄內。到目前為止所描述的組件用于收集內容,并基于作者的意圖來對收集到的內容進行劃分及存儲。下文中,將對當信息搜索者通過輸入關鍵字來請求進行搜索時可通過推導通過搜索意圖檢測而輸入的詳細關鍵字來更為精確地執行搜索的組件進行詳細描述。在此情況下,用戶輸入的關鍵字的示例可包括單詞、短語以及句子。信息搜索窗口 1001提供輸入窗口,用于可通過該輸入窗口輸入關鍵字,諸如單詞、短語或句子。進一步地,關鍵字輸入裝置1002將用戶通過信息搜索窗口 1001輸入的關鍵字傳輸至關鍵字語素處理器1003。語素處理器1003通過參考語素字典1023,針對每個詞性將傳輸自關鍵字輸入裝置1002的關鍵字進行分離,并輸出每個詞性。關鍵字語法分析器1004基于關鍵字語素處理器1003的語素處理結果,對搜索者輸入的關鍵字執行語法分析。該關鍵字語法分析器1004在執行語法分析的同時,參考語法文法規則字典1021。搜索者意圖檢測器1005使用輸出自關鍵字語法分析器1004的語法分析結果來檢測搜索者的意圖。信息監視器1006對搜索者意圖檢測器1005檢測到的搜索者意圖進行輸出,以使得用戶可見。為此目的,該信息監視器1006可使用圖形化工具。用于搜索的元數據提取器1007從元數據DB 1017中提取符合搜索者意圖檢測器 1005檢測到的搜索者意圖的內容的元數據。用于搜索的編輯器1008生成編輯器(其中,用于搜索的元數據提取器1007提取的元數據被形成為輸入項),并將該編輯器提供給搜索者。搜索目錄確定裝置1027確定信息DB 1025上適于搜索所述內容的目錄。在此情況下,搜索目錄確定裝置1027可通過參考搜索者意圖檢測器1005檢測到的搜素者的意圖來確定所述目錄。進一步地,搜索目錄確定裝置1027可另外確定與所確定的目錄相類似的目錄。這可執行更寬范圍的搜索。搜索者1009對信息DB 1025中的具有與用于搜索的編輯器1008輸入的元數據相同的元數據的內容進行搜索。在此情況下,在搜索目錄確定裝置1027中所確定的目錄內執行所述搜索。搜素裝置1009可執行擴展搜索,該擴展搜索通過將用于搜索的編輯器1008輸入的元數據替換為同義元數據來執行所述搜索。進一步地,搜索裝置1009可搜索在結構及單詞方面具有與元數據完全相同的元數據的內容以及僅在結構及單詞中的詞性方面具有與元數據相同的元數據的內容。換言之,搜索裝置1009還可執行相同搜索、部分搜索或相關搜索。元數據比較器1010將通過由用于搜索的編輯器1008輸入的元數據與構成搜索裝置1010所搜索的內容的元數據進行比較,并基于比較結果來僅選擇和輸出具有高度一致性的內容。如上所述,可通過將以表格格式形成的元數據分別進行比較的方法來執行所述比較(確定所述一致性)。附加服務數據庫1011可存儲用于提供適合于搜索者的搜索意圖的站點信息或相關廣告服務等的擔憂。附加服務生成器1012生成與搜索鍵相關的附加服務。為此目的,附加服務生成器 1012使用存儲于附加服務數據庫1011內的附加服務中的、適合于搜索者的搜索意圖的附加服務。附加服務數據庫1011及附加服務生成器1012所提供的附加服務可被實施為內容上下文認知服務。在此情況下,該內容上下文認知服務的示例可包括導航服務、銷售服務、 廣告服務、教育服務、咨詢服務、推薦服務等。搜索結果生成器1013根據與輸出自元數據比較器1010的搜索結果(內容)的一致性,來添加附加服務生成器1012所生成的附加服務。搜索結果顯示裝置10 通過屏幕輸出從搜索結果生成器1013生成的添加有附加服務的搜索結果,以將該結果提供給用戶。同時,可僅將搜索結果及一致性提供給用戶,而不提供任何附加服務。這可以通過下面的方式來實現附加服務生成器1012不生成附加服務,或即使附加服務生成器113生成了附加服務,搜索結果生成器1013亦不添加所生成的附加服務。下文中,將參考圖11,對考慮了以下情形的過程進行詳細描述,該情形為推薦目錄 30上列有推薦中國餐館及第一次生日聚會的體驗經歷的記錄,且該記錄作為信息被存儲。 圖11為用于對根據本發明另一示例性實施方式的搜索方法進行解釋的圖示。首先,如圖IlA所示,目錄內容搜索器IOM收集列于推薦目錄30上的推薦記錄, 并將該推薦記錄傳輸至語素處理器1022。之后,語素處理器1022通過參考語素字典1023來執行語素處理。圖IlB示出了語素處理器1022的語素處理結果。之后,語法分析器1020對圖IlB執行語法分析。圖IlC示出了該語法分析器1020 的語素分析結果。進一步地,內容提供者意圖檢測器1018基于圖IlC來檢測提供者的意圖。圖IlD 示出了內容提供者意圖檢測器1018檢測到的提供者的意圖。之后,信息提供元數據提取器1016從元數據DB 1017中提取符合提供者意圖的內容的元數據。信息提供編輯器1015生成編輯器(其中,提取的元數據成為輸入項),并將該編輯器提供給信息提供者。在圖IlD中,符合“第一次生日聚會一地點一推薦”的內容是內容“第一次生日聚會地點提供”。如圖IlE所示,信息提供編輯器1015對內容提供者意圖檢測器1018檢測到的內容提供者的意圖進行排列。進一步地,信息提供編輯器1015自動將對應的元數據輸入至圖12A所示的編輯器的每一項中,其中圖12B示出了輸入結果。存儲目錄確定裝置10 確定信息DB 1025上適于存儲所述內容的目錄。在此情況下,該存儲目錄確定裝置10 可通過參考內容提供者意圖檢測器1018檢測到的內容提供者的意圖來確定所述目錄。信息存儲裝置1014將整合了信息提供編輯器1015所生成的元數據的內容存儲于信息DB 1025內。在此情況下,所述內容被存儲于存儲目錄確定裝置10 所確定的目錄內。根據本發明的示例性實施方式可以基于內容提供者的意圖來對針對每一目錄的相應信息進行劃分,且可以對相應的元數據進行匹配和存儲。下文中,將參考圖13對通過使用上述過程所存儲的元數據來基于信息搜索者輸入的關鍵字執行搜索的過程進行描述。圖13為用于對根據本發明另一示例性實施方式的搜索方法進行解釋的圖示。在該示例性實施方式中,當信息搜索者輸入關鍵字時,可檢測搜索者的搜索意圖,并可以基于該搜索者的意圖來進行詳細且精確的搜索。在此情況下,用戶輸入的關鍵字的示例可包括單詞、短語以及句子。如圖13所示,當用戶輸入通過信息搜索窗口 1001輸入關鍵字“0")租
晉釷赴畀只丨智外導(請推薦這周六值得欣賞的音樂劇),,(1301)時, 關鍵字語素處理器1003針對每個詞性將輸入的關鍵字進行分離,并在輸出(這次/星期六 /觀看/音樂劇/推薦/期望)(1302)的同時,添加并輸出詞性信息及語義信息(名詞/現在,名詞/日期,形容詞/好的感覺,名詞/音樂劇,名詞/推薦,動詞/請求)(1303)。之后,關鍵字語法分析器1004基于語素處理結果來執行語法分析,并之后輸出 (這次一星期六,值得一音樂劇,一推薦,一期望)作為結果(1304)。可以理解的是,通過語法分析,示例句子中可存在兩個上下文認知信息。一個是作為實際物理數據“所有的星期六”的日期,另一個是作為“意圖”的“推薦,請求”。因此,關鍵字語法分析器1004針對前者執行上下文認知處理,這將在以下進行描述。首先,將對生成“本周六”的上下文認知實際數據的過程進行詳細描述。圖14示出了指示時間的上下文認知單詞,其可列于語素字典1023內。如圖14所示,將每個單詞的語義信息定義為“過去”、“現在”或“將來”等。圖15通過指定“現在時間”的單位為“年”、“月”、“日”、“星期”、“時”、“分”、“秒”,
示出了系統所管理的情況。圖16示出了在當天對“本周六”的語言表示進行數量上的計算的方式。換言之, 由于將獲得的時間為指示將獲得的時間的語言表示中的實際量化時間,當對“本周六”執行語素處理時,根據語義信息“本/當前,周六/星期六”而在系統日歷中獲得的當前日期為星期三,并且由于當前系統“星期六”為三天之后即“星期三一星期四一星期五一星期六”, 故當將三天加到當前日期2008年11月6日之后,可生成實際數據2008年11月9日。通過上述過程,還可將指示不同于當前時間的時間的語言表示變形為實際數據。 參考圖14-16描述的“本周六”的上下文認知實際數據的生成對應于圖13中的1306、1307 以及1308。同時,搜索者意圖檢測器1005使用語法分析結果來將搜素者的意圖檢測為“音樂劇一推薦一請求”(1308)。之后,用于搜索的元數據提取器1007從元數據DB 1017中提取適于搜索者意圖即 “音樂劇推薦請求”的內容的元數據,且用于搜索的編輯器1008生成編輯器(其中,用于搜索的元數據提取器1007提取的元數據為輸入項),并將該編輯器提供給搜索者(1311)。在此情況下,履行日期“2008年11月9日”(即所生成的實際日期)被自動輸入至編輯器。結果,搜索者通過提供的編輯器來輸入元數據(1312)。搜索目錄確定裝置1027確定信息DB 1025上適于搜索所述內容的目錄,且搜索裝置1009對信息DB 1025中的具有與用于搜索的編輯器1008所輸入的元數據相同的元數據的內容進行搜索(131;3)。該搜索在搜索目錄確定裝置1027中確定的目錄內執行。在此情況下,搜索目錄確定裝置1027可通過參考搜索者意圖檢測器1005檢測到的搜索者的意圖來確定所述目錄。可另外確定與所確定的目錄相類似的目錄。這可執行更寬范圍的搜索。
進一步地,搜索裝置1009還可執行相同搜索、部分搜索或相關搜索。之后,元數據比較器1010將通過用于搜索的編輯器1008輸入的元數據與構成搜索裝置1009所搜索的內容的元數據進行比較(1314)。進一步地,元數據比較器1010基于比較結果來僅選擇并輸出具有高度一致性的內容(1315)。到目前,詳細描述了根據搜索者輸入的信息來檢測搜索者的意圖、基于檢測到的意圖來推導詳細的元數據輸入、自動輸入用于生成實際數據的元數據以及通過使用該元數據來在符合搜索者意圖的目錄中執行搜索的過程。在到目前為止所描述的示例性實施方式中,通過對輸入語言表示進行分析來自動檢測信息提供者或信息搜索者的意圖。例如,包含諸如“獲取、買、購買、給予、請求、詢問、尋找”等語言表示的表示被檢測為被稱為“信息搜索”的意圖,因為信息“搜索”的語意在語意中被稱為“尋找信息”;而所有包含諸如“賣、銷售、提供、給予、呈現”等語言表示的表示均被檢測為“信息提供”的意圖, 因為信息“提供”的語意在語意中被稱為“信息提供”。之后,處理該意圖。將在以下進行描述的示例性實施方式采用由信息提供者或信息搜索者直接輸入的方法,而非自動檢測信息提供者及信息搜索者的意圖。這是為了更為精確地檢測信息提供者及信息搜索者的意圖。圖17示出了根據本發明示例性實施方式的搜索系統。構成根據本發明示例性實施方式的搜索系統的塊可通過S/W及H/W來實現。此外,構成所述搜索系統的一些塊可通過S/W來實現,而其余的塊則可通過H/W來實現。如圖17所示,根據本發明示例性實施方式的搜索系統包括信息提供/搜索窗口 1701、語素處理器1702、語素字典1703、語法分析器1704、語法文法規則字典1705、意圖指定器1706、信息監視器1707、信息提供元數據提取器1708、信息提供編輯器1709、存儲目錄確定裝置1710、信息存儲單元1711、信息DB 1712、元數據DB 1713、用于搜索的元數據提取器1714、用于搜索的編輯器1715、搜索目錄確定裝置1716、搜索裝置1717、元數據比較器 1718、搜索結果生成器1719、搜索結果顯示單元1720、附加服務數據庫1721以及附加服務生成器1722。信息提供/搜索窗口 1701為用于輸入將由信息提供者登記的信息或輸入由信息搜索者提供的關鍵字的用戶界面。信息提供/搜索窗口 1701提供有輸入窗口 1701-1、信息提供按鈕1701-2以及信息搜索按鈕1701-3。輸入窗口 1701-1為用于輸入將被提供的信息或關鍵字的窗口,并且輸入窗口 1701-1可輸入作為單詞、短語或句子的信息及關鍵字。信息提供按鈕1701-2是在提供并登記輸入至輸入窗口 1701-1的信息時使用的按鈕,而信息搜索按鈕1701-3是用于命令對輸入至輸入窗口 1701-1的關鍵字進行信息搜索的按鈕。通過信息提供/搜索窗口 1701輸入的信息或關鍵字被傳輸至語素處理器1702。語素字典1703可被實施為與圖1所示的語素字典125相同的語素字典。語素處理器1702通過參考語素字典1023來針對每個詞性將通過信息提供/搜索窗口 1701輸入的信息或關鍵字進行分離,并輸出每個詞性。語法分析器1704基于語素處理器1702的語素處理結果來對用戶的輸入信息或關鍵字執行語法分析。語法分析器1704在執行語法分析的同時,參考登記于語法文法規則字典1705內的文法規則。意圖指定器1706提供用于對信息提供者的意圖或信息搜索者的意圖進行直接指定的用戶界面單元,并對語法分析結果所指定的意圖進行整合以輸出最終意圖。信息監視器1707對輸出自意圖指定器1706的最終意圖進行輸出,以使得用戶可見。為此目的,該信息監視器1707可使用圖形化工具。信息提供元數據提取器1708從元數據DB 1713中提取符合輸出自意圖指定器 1706的信息提供者的最終意圖的內容的元數據。信息提供編輯器1709生成編輯器(其中,信息提供元數據提取器1708提取的元數據被形成為輸入項),并將該編輯器提供給信息提供者。存儲目錄確定裝置1710確定信息DB 1712上適于存儲所述內容的目錄。在此情況下,存儲目錄確定裝置1710可通過參考意圖指定器1706檢測到的信息提供者的最終意圖來確定所述目錄。信息存儲單元1711將整合了信息提供編輯器1709所生成的元數據的內容存儲于信息DB 1709內。在此情況下,所述內容存儲于存儲目錄確定裝置1710所確定的目錄內。用于搜索的元數據編輯器1714從元數據DB 1713中提取符合輸出自意圖指定器 1706的信息提供者的最終意圖的內容的元數據。搜索編輯器1715生成編輯器(其中,用于搜索的元數據提取器1714提取的元數據被形成為輸入項),并將該編輯器提供給搜索者。搜索目錄確定裝置1716確定信息DB 1712上適于搜索所述內容的目錄。在此情況下,搜索目錄確定裝置1716可通過參考輸出自意圖指定器1706的搜索者的最終意圖來確定所述目錄。進一步地,搜索目錄確定裝置1716可另外確定與所確定的目錄相類似的目錄。這可執行更寬范圍的搜索。搜索裝置1717對信息DB 1712中的具有與由用于搜索的編輯器1715輸入的元數據相同的元數據的內容進行搜索。在此情況下,在搜索目錄確定裝置1716所確定的目錄中執行所述搜索。搜索裝置1717可執行擴展搜索,該擴展搜索通過將搜索編輯器1715輸入的元數據替換為同義元數據來執行所述搜索。進一步地,搜索裝置1717可搜索在結構及單詞方面具有與元數據完全相同的元數據的內容以及僅在結構及單詞中的詞性方面具有與元數據相同的元數據的內容。換言之,搜索裝置1717還可執行相同搜索、部分搜索或相關搜索。元數據比較器1718將通過由用于搜索的編輯器1715輸入的元數據與構成搜索裝置1717所搜索的內容的元數據進行比較,并基于比較結果來僅選擇和輸出具有高度一致性的內容。如上所述,可通過將以表格格式形成的元數據分別進行比較的方法來執行所述比較(確定所述一致性)。附加服務數據庫1721可存儲用于提供適合于搜索者的搜索意圖的站點信息或相關廣告服務等的單元。附加服務生成器1722生成與搜索鍵相關的附加服務。為此目的,附加服務生成器 1722使用存儲于附加服務數據庫1721內的附加服務中的、適合于搜索者的搜索意圖的附加服務。附加服務數據庫1721及附加服務生成器1722所提供的附加服務可被實施為內容上下文認知服務。在此情況下,該內容上下文認知服務的示例可包括導航服務、銷售服務、 廣告服務、教育服務、咨詢服務、推薦服務、行政服務等。搜索結果生成器1719根據與輸出自元數據比較器1718的搜索結果(內容)的一致性,來添加附加服務生成器1722所生成的附加服務。搜索結果顯示單元1720通過屏幕輸出從搜索結果生成器1719生成的添加有附加服務的搜索結果,以將該結果提供給用戶。同時,可僅將搜索結果及一致性提供給用戶,而不提供附加服務。這可以通過以下的方式來實現附加服務生成器1722不生成附加服務,或即使附加服務生成器113生成了附加服務,搜索結果生成器1719亦不添加所生成的附加服務。圖18為用于對根據本發明另一示例性實施方式的搜索方法進行解釋的流程圖。如圖18所示,當用戶輸入“對課程進行計劃”至信息提供/搜索窗口 1701的輸入窗口 1701-1中并按下信息提供按鈕1701-2(1801)時,語素處理器1702通過參考語素字典1703來針對每個詞性將“對課程進行計劃”進行分離,以將其輸出為“對課程進行計劃,,(1802)。之后,語法分析器1704對語素處理結果執行語法分析,并輸出結果(課程一計劃) (1803)。之后,當意圖指定器1706將信息提供者的意圖指定為“提供”(1804和1805)時, 意圖指定器1706基于語法分析來輸出整合了所指定意圖的最終意圖“課程一計劃一提供,,(1806)。之后,信息提供元數據提取器1708從元數據DB 1713中提取適于信息提供者的最終意圖“課程一計劃一提供”的內容的元數據(1807)。信息提供編輯器1709生成編輯器(其中,提取的元數據成為輸入項),并將該編輯器提供給信息提供者(1808)。結果,信息提供者通過所提供的編輯器來輸入元數據
(1809)。之后,存儲目錄確定裝置1710確定信息DB 1712上適于存儲所述內容的目錄
(1810)。進一步地,信息存儲裝置1711將整合了由信息提供編輯器1709輸入的元數據的內容存儲于信息DB 1712內。在此情況下,所述內容被存儲于由存儲目錄確定裝置1710所確定的目錄內。到目前為止,詳細描述了根據信息提供者輸入的信息及意圖來檢測信息提供者的最終意圖、并基于檢測到的意圖來推導將被存儲為單個內容的詳細元數據輸入的過程。下文中,將參考圖19來對通過使用上述過程所存儲的元數據來基于信息搜索者提供的關鍵字及意圖來執行搜索的過程進行描述。圖19為用于對根據本發明另一示例性實施方式的搜索方法進行解釋的圖示。在本發明的該示例性實施方式中,信息搜索者可基于關鍵字及意圖來執行詳細且精確的搜索。在此情況下,用戶輸入的關鍵字的示例可包括單詞、短語以及句子。如圖19所示,當用戶輸入“計劃列表”至信息提供/搜索窗口 1701的輸入窗口1701-1并按下搜索按鈕1701-3 (1901)時,語素處理器1702通過參考語素字典1703來針對每個詞性將“計劃列表”進行分離,以將其輸出為“計劃/列表”(1902)。之后,語法分析器1704對語素處理結果執行語法分析,并輸出結果(計劃一列表) (1903)。之后,當意圖指定器1706將信息提供者的意圖指定為“搜索”(1904和1905)時, 意圖指定器1706基于語法分析來輸出整合了所指定意圖的最終意圖“計劃一列表一搜索,,(1906)。之后,用于搜索的元數據提取器1714從元數據DB 1713中提取適于搜索者的最終意圖“計劃一列表一搜索”的內容的元數據,且用于搜索的編輯器1715生成編輯器(其中,用于搜索的元數據提取器1714提取的元數據是輸入項),并將該編輯器提供給搜索者 (1908)。結果,搜索者通過所提供的編輯器輸入元數據(1909)。搜索目錄確定裝置1716確定信息DB 1712上適于搜索所述內容的目錄(1910), 且搜索裝置1717對信息DB 1712的具有與由用于搜索的編輯器1715輸入的元數據相同的元數據的內容進行搜索(1911)。在搜索目錄確定裝置1716中所確定的目錄內執行所述搜索。在此情況下,搜索目錄確定裝置1716可通過參考意圖指定器1706檢測到的搜索者意圖來確定所述目錄。可另外確定與所確定的目錄相類似的目錄。這可執行更寬范圍的搜索。進一步地,搜索裝置1717還可執行相同搜索、部分搜索或相關搜索。之后,元數據比較器1718將通過用于搜索的編輯器1715輸入的元數據與構成搜索裝置1717所搜索的內容的元數據進行比較(191幻。進一步地,元數據比較器1718基于比較結果來僅選擇并輸出具有高度一致性的內容(1913)。到目前為止,詳細描述了基于搜索者輸入的信息及意圖來推導詳細元數據輸入并通過使用輸入的元數據來在符合搜索者的意圖的目錄內執行所述搜索的過程。上述示例性實施方式可用于宣傳候選人以進行電子投票。圖20示出了輸入元數據至編輯器的結果,該結果通過輸入“提供候選人的宣傳信息”至信息提供/搜索窗1701并對其執行語素處理、語法分析、意圖指定以及元數據提取而生成,且所述編輯器被提供給信息提供者。之后,當通過存儲目錄確定來將所述信息存儲于信息DB 1712內時,可將候選人的宣傳資料通過PC或移動電話等分發給投票者。因此,可通過使用目前使用成本很低的宣傳紙來迅速地提供候選人的宣傳資料。上述的示例性實施方式可實施于移動信息裝置(諸如移動電話)中以及其他信息裝置內。此外,信息提供按鈕及信息搜索按鈕可對應于/分派至移動信息裝置(諸如移動電話)以及其他信息裝置的特定按鈕(按鍵)。雖然已結合目前被視為實際示例性實施方式的實施方式對本發明進行了描述,但可以理解的是,本發明并不局限于所公開的實施方式,相反地,本發明意欲覆蓋包含于所附權利要求書的精神及范圍內的各種變化及等價布置。
權利要求
1.一種用于搜索信息的方法,該方法包括通過使用針對關鍵字的分析結果來檢測搜索者的意圖;向所述搜索者提供符合所述搜索者的意圖的編輯器;以及搜索具有與通過所述編輯器的輸入項輸入的元數據相關聯的元數據的內容。
2.根據權利要求1所述的方法,該方法進一步包括 將輸入的關鍵字分離為語意單詞;以及對分離后的關鍵字執行語法分析,其中,對搜索者的意圖的檢測通過使用執行所述語法分析時的語法分析結果來檢測所述搜索者的意圖。
3.根據權利要求2所述的方法,其中所述語法分析的執行將語法表達式輸出作為所述語法分析結果,其中通過分析句子內分離后的單詞是否具有任何文法關系以及語義關聯來獲取所述語法表達式。
4.根據權利要求3所述的方法,其中所述語法表達式為邏輯表達式、修飾-被修飾以及語法列表表達式中的至少一者。
5.根據權利要求3所述的方法,其中語法分析的執行參考語法文法規則字典,以分析句子內分離后的單詞是否具有任何文法關系以及語義關聯,以及所述語法文法規則字典列有短語結構文法、格文法、敏感文法以及詞匯文法中的至少 “"者 ο
6.根據權利要求2所述的方法,其中所述分離針對每個詞性來對所述關鍵字進行分離。
7.根據權利要求6所述的方法,其中所述分離通過參考與每個單詞的詞性相關的信息來針對每個詞性將所述關鍵字進行分離,所述與每個單詞的詞性相關的信息以數據庫方式存儲于語素字典內。
8.根據權利要求1所述的方法,該方法進一步包括提取符合所述搜索者的意圖的內容的元數據,其中編輯器的提供提供作為符合所述搜索者的意圖的編輯器的編輯器,在該編輯器中,被提取的元數據成為輸入項。
9.根據權利要求1所述的方法,該方法進一步包括通過參考信息提供者的意圖來確定用于執行搜索的目錄,其中所述搜索對與所確定的目錄相同或相似的目錄中的內容進行搜索。
10.根據權利要求1所述的方法,其中所述關鍵字為單詞單元、短語單元以及句子單元中的任一者。
11.根據權利要求1所述的方法,其中所述搜索對具有與通過所述編輯器的輸入項輸入的元數據中的至少一者相同的元數據、或具有與通過所述編輯器的輸入項輸入的元數據中的至少一者同義的元數據的內容進行搜索。
12.根據權利要求1所述的方法,該方法進一步包括在搜索時將附加服務添加至搜索結果中。
13.根據權利要求12所述的方法,其中所述附加服務為內容上下文認知服務,并且該內容上下文認知服務包括以下各項中的至少一者導航服務、銷售服務、廣告服務、教育服務、咨詢服務、推薦服務以及行政服務。
14.根據權利要求1所述的方法,其中所述編輯器的輸入項中的至少一者被自動輸入作為通過使用所述關鍵字生成的實際數據。
15.根據權利要求1所述的方法,該方法進一步包括通過將輸入的元數據與構成所搜索的內容的元數據進行比較,來分別選擇并輸出具有高度一致性的內容。
16.一種提供用于搜索的信息的方法,該方法包括通過使用針對包含于信息內的文本的分析結果,來檢測提供所述信息的信息提供者的意圖;將符合所述信息提供者的意圖的編輯器提供給用戶;以及對整合了通過所述編輯器的輸入項輸入的元數據的內容進行存儲。
17.根據權利要求16所述的方法,該方法進一步包括將包含于輸入信息內的文本分離成語意單詞;以及對分離后的關鍵字執行語法分析,其中對信息提供者的意圖的檢測通過使用執行所述語法分析時的語法分析結果來檢測提供所述信息的所述信息提供者的意圖。
18.根據權利要求17所述的方法,其中語法分析的執行將語法表達式輸出作為所述語法分析結果,其中通過分析句子內分離后的單詞是否具有任何文法關系以及語義關聯來獲取所述語法表達式。
19.根據權利要求18所述的方法,其中所述語法表達式為邏輯表達式、修飾-被修飾以及語法列表表達式中的至少一者。
20.根據權利要求18所述的方法,其中語法分析的執行參考語法文法規則字典,以分析句子內分離后的單詞是否具有任何文法關系以及語義關聯,以及所述語法文法規則字典列有短語結構文法、格文法、敏感文法以及詞匯文法中的至少 “"者 ο
21.根據權利要求17所述的方法,其中所述分離針對每個詞性來對所述文本進行分1 O
22.根據權利要求21所述的方法,其中所述分離通過參考與每個單詞的詞性相關的信息來針對每個詞性將所述文本進行分離,所述與每個單詞的詞性相關的信息以數據庫方式存儲于語素字典內。
23.根據權利要求16所述的方法,該方法進一步包括提取符合所述信息提供者的意圖的內容的元數據,其中編輯器的提供提供作為符合所述信息提供者的意圖的編輯器的編輯器,在該編輯器中,被提取的元數據成為輸入項。
24.根據權利要求16所述的方法,該方法進一步包括通過參考所述信息提供者的意圖來確定存儲所述信息的目錄,其中所述內容的存儲將所述內容存儲于所確定的目錄內。
25.根據權利要求16所述的方法,該方法進一步包括對包含于針對每一目錄劃分的內容內的文本進行收集,其中所述檢測使用針對收集到的文本的分析結果。
26.一種提供用于搜索的信息的方法,該方法包括 對包含于針對每一目錄劃分的內容內的文本進行收集;通過使用針對收集到的文本的分析結果,來檢測提供信息的信息提供者的意圖; 將符合所述信息提供者的意圖的編輯器提供給用戶;以及對整合了通過所述編輯器的輸入項輸入的元數據的內容進行存儲。
27.一種搜索信息的方法,該方法包括 接收關鍵字;接收輸入所述關鍵字的搜索者的意圖;將符合最終意圖的編輯器提供給所述搜索者,所述最終意圖整合了對所述關鍵字的分析結果以及所述搜索者的意圖;以及搜索具有與通過所述編輯器的輸入項輸入的元數據相關聯的元數據的內容。
28.根據權利要求27所述的方法,該方法進一步包括 將輸入的關鍵字分離為語意單詞;以及對分離后的關鍵字執行語法分析,其中所述編輯器的提供使用執行所述語法分析時的語法分析結果。
29.一種提供用于搜索的信息的方法,該方法包括 接收信息;接收輸入所述信息的信息提供者的意圖;將符合最終意圖的編輯器提供給所述信息提供者,所述最終意圖整合了對所述信息的分析結果以及所述信息提供者的意圖;以及對整合了通過所述編輯器的輸入項輸入的元數據的內容進行存儲。
30.根據權利要求四所述的方法,該方法進一步包括 將輸入的信息分離為語意單詞;以及對分離后的單詞執行語法分析,其中所述編輯器的提供使用執行所述語法分析時的語法分析結果。
全文摘要
提供了基于用戶意圖的信息搜索方法以及信息供應方法。所述信息搜索方法包括通過使用對被搜索的關鍵字的分析結果,來提供與所確認的搜索者的意圖相匹配的編輯裝置;以及,對具有與通過該編輯裝置輸入的元數據相關的元數據的內容進行搜索。以此方式,可根據搜索者輸入的信息來確認搜索者的意圖,可基于所確認的意圖來導出詳細元數據,并可通過使用輸入的元數據來執行搜索。
文檔編號G06F17/30GK102246164SQ200980150114
公開日2011年11月16日 申請日期2009年12月11日 優先權日2008年12月11日
發明者鄭喜盛 申請人:有限公司呢哦派豆