一種搜索方法
【專利說明】
[0001]
技術領域
[0002] 本發明涉及信息資源積累及搜索技術領域,尤其涉及一種搜索方法。
【背景技術】
[0003] 目前,用戶通常使用搜索引擎來搜索互聯網上的信息。具體地,用戶先輸入搜索 詞,然后搜索引擎根據用戶輸入的搜索詞匹配網頁或網絡服務中包含該搜索詞的搜索結 果,然后提供排序后的搜索結果和推薦的引導內容,用戶通過搜索的結果或點擊推薦的引 導內容再搜索實現獲取用戶想要的搜索結果。
[0004] 上述中無論何種方式給出的多條搜索結果都是用其中每條結果對應一個網頁去 解決用戶需求,并且這個網頁是直接解決或回答用戶問題的網頁,這種方式主要存在以下 問題: (1)每條結果對應一個網頁提供針對性的信息資源過少,用戶在搜索一個較為寬泛的 內容時,搜索引擎給出的是一條條包含有搜索詞的結果,而且這一條條結果對應的網頁內 容都是針對網頁標題的一篇文章或一個具體內容,從而用戶無法通過一條結果對應的一個 網頁上獲取需要多篇文章對應的多個網面從多個角度滿足用戶針對這個寬泛內容需求的 信息資源,無法向用戶提供一個針對用戶需求的目錄索引頁面,這個目錄索引頁面包含用 戶需求的多個內容對應的多個網頁頁面鏈接,現在的搜索引擎可以給出上千萬條的結果, 由于用戶只會去瀏覽的前十條或二十條結果,而且這前十條或二十條的結果對應的網頁之 間只存在都包含有搜索詞的關系,而不是相互補充的從多個角度為用戶提供最優結果的關 系,所以這前十條或二十條的結果也無法滿足用戶需求的最優化的、系統的、全面的結果, 這時用戶不會再瀏覽前十條或二十條后面的結果,要么再次搜索,要么轉身離開,這對用戶 體驗是很差的。
[0005] (2)每條結果對應的一個網頁提供的資源結構單一,用戶在搜索一個非常寬泛的 內容時,搜索引擎給出的是一條條包含有搜索詞的結果,而且這一條條結果對應的網頁內 容都是針對網頁標題的一篇文章或一個具體內容,對于這個寬泛搜索用戶需求的是很多個 信息資源,而這很多個信息資源對應在很多個網頁中,顯然現在的搜索引擎無法將這些信 息資源對應的網頁進行分門別類并將其分類后的分類信息及對應的資源網頁等一并通過 其中的一條結果對應的網頁提供給用戶,當然現有的搜索引擎可以在搜索上千萬條包含有 用戶所有需求的多條結果,但是這多條結果對應的網頁在內容相關性上無規律和條理性, 用戶無法很快速的找到需要的結果。
[0006] (3)每條結果對應的一個網頁提供的資源類型單一,用戶在搜索一個寬泛的內容 時,用戶可能既需要相關的知識經驗又需要相關的軟件等多種類型的資源時,現有的搜索 引擎通常只能為我們提供包含有用戶輸入搜索詞的一條條的結果,顯然無法一次在一條結 果對應的網頁中為用戶提供各種類型的文件,比如用戶輸入"java學習"搜索,圖8為相關 技術中搜索引擎提供的一個關于搜索詞"java學習"的搜索結果的示例圖,相關搜索引擎 雖然沒有在通過一條結果提供多種類型信息資源的內容,但是通過很多條結果為用戶提供 了各種各樣的內容,可是對于用戶java學習過程中需要的學習教程,學習視頻以及學習中 要用的軟件這些重要內容,用戶想從上述結果中找到有些困難,雖然用戶可以通過點擊搜 索引擎提供的相關搜索推薦內容里的推薦詞"java學習視頻"重新進行搜索,但是這次重 新搜索未必能一次找到能使用的學習視頻,多次搜索獲取想要的"java學習視頻"后想搜 索"java學習教程",用戶又得再次搜索,所以說雖然現有搜索引擎技術能搜索到用戶需要 的各種類型的資源,但是要浪費用戶大量的時間從大量的結果中尋找,無法有效的提高用 戶的搜索效率。
[0007] (4)匹配搜索詞無法提供搜索詞分類下的具體內容。用戶在搜索一個寬泛的內容 時,現有的搜索引擎只能為用戶提供包含有用戶輸入搜索詞的一條條的結果,而無法為用 戶提供這個寬泛的內容對應下面具體分類內容的相關結果,比如用戶輸入"工程分包合同" 搜索時,搜索引擎為用戶提供的是包含搜索詞"工程分包合同"的一條條結果,而無法為用 戶提供"工程分包合同"對應下面如"土建承包合同"、"鋼筋工承包合同"、"木工承包合同" 這些具體的分類對應內容結果。
[0008] (5)匹配搜索詞無法提供搜索詞對應前置需求與關聯內容,搜索引擎目前的匹配 機制只能為用戶提供包含有用戶輸入搜索詞的一條條的結果,無法一次給出對應前置需求 與關聯內容。了解學習掌握一個知識內容之前必須先學習掌握另一個知識,這另一個知識 口H"前置知識",對"前置知識"的需求叫"前置需求"。比如用戶輸入"如何安裝win7操作 系統"搜索時,搜索引擎能給出各種如何安裝win7操作系統的結果但不會一起提供"如何 設置BIOS"結果,但用戶需要"如何設置BIOS"的相關知識,因為用戶不知如何設置BIOS的 話是無法學會設置BIOS的,這時用戶用戶只能重新搜索"如何設置BIOS",這樣的話無法為 用戶提供更好的體驗。
[0009] (6)提供解決問題方法而不是具體內容,用戶在搜索一個寬泛的內容時,搜索引擎 通常會提供網站給用戶,用戶通過這個網站逐步搜索獲取搜索結果,而無法一次給出具體 的多個內容,比如用戶輸入"互聯網搜索專利下載"想獲取多個搜索專利,現有的搜索引擎 不會馬上提供多個與互聯網搜索技術相關的專利(比如按公司名稱分類的多個專利),而是 提供一個搜索網站讓用戶自己再去搜索,無法為用戶提供最高效的搜索。
[0010] 綜上所述,當前的搜索引擎及相關技術無法一次搜索就為用戶提供多套包含有多 種類型的多個內容系統的全面的并對這些網頁知識信息資源進行分類整理的方案式的內 容(本發明中方案式的每條結果對應網頁包含一套方案式的內容),這樣用戶為了得到全面 的系統的方案式的內容就得多次搜索與多次尋找,所以無法更高效率的為用戶服務,無法 更好滿足充分競爭快捷式學習社會市場的需求。
[0011] 對于有時用戶對搜索結果不滿意或想搜索相關的其他內容時,當前的搜索引擎給 基于搜索詞拓展的用戶關注的熱門推薦搜索詞,這種機制存在以下問題: 1)當用戶想了解一個較為具體的內容(比如一個視頻、一篇文章等)后,想更多更系統 全面的了解這個內容相關的知識經驗信息或資源信息,這時搜索引擎通常提供的是基于該 搜索詞拓展的推薦內容,這些推薦內容是關于用戶關注的熱門高頻率推薦搜索詞,無法反 應知識資源的完整性、相關性、類別性,所以對于用戶想了解該內容相關的知識資源分類組 織體系,現有的搜索引擎給出推薦內容的無法滿足用戶需求的,這種情況下用戶只能構造 搜索詞重新搜索獲取更全面的知識資源信息,無法為用戶提供更高效的、智能的、便利化的 搜索。
[0012] 2)當用戶想了解一個較為寬泛內容相關的較為系統全面的結果時,寬泛內容比如 "Java學習〃的綜合內容,〃壁紙〃的圖片內容,用戶要了解該寬泛內容的知識經驗分類體 系或資源的分類,根據該寬泛內容的分類一次次構造其分類的搜索詞,然后一次次的輸入 搜索詞來獲取用戶想要的搜索結果,這種方式效率非常低,用戶體驗非常差。
[0013] 截止目前,仍然沒有較好的關于分類智能引導用戶搜索的技術發布,百度在線網 絡技術有限公司申請的"搜索方法和搜索引擎"中提出一種引導搜索方式,第一,這種方式 無法通過搜索詞識別用戶當前在工作、生活、成長、學習過程中所處的知識資源信息需求狀 態,然后給出該需求狀態下的知識經驗資源信息的分類組織結構的引導內容;比如用戶輸 入搜索詞"java環境變量設置",搜索引擎分析出用戶在學習java,并給出java學習的相關 知識分類去引導用戶搜索,而百度在線網絡技術有限公司提出的是當用戶輸入"java學習" 時,給出java學習相關的如"java學習視頻"、"java學習資料"等需求維度的引導搜索內 容,無法實現見微知著,從用戶搜索詞的細節給出用戶以后生活、工作、學習、成長中需要更 多的知識經驗信息資源分類引導內容。第二,該專利權利要求中提出的是一種至少一級需 求維度來引導用戶搜索,是從需求維度角度將用戶的需求分成一級需求,二級需求,三級需 求等等,一級需求對應用戶最需要的搜索內容,二級需求對應最二需要的搜索內容,以此類 推,但是不同的用戶需求將很大差別的,所以實際應用中這種需求很難以捕捉的,所以本發 明提出了從知識經驗資源信息的知識結構體系和資源類別的角度進行分類,然后根據搜索 詞獲取用戶工作、生活、成長、學習中的狀態,最后根據這個狀態給出對應的知識資源分類 內容引導用戶搜索。所以更具有可操作性、引導內容更合理、更能滿足用戶需求。
[0014]
【發明內容】
[0015] 針對以上問題,本發明提供了一種能智能感知用戶的生活狀態并給出該生活狀態 中需求的知識經驗資源的分類結構去引導用戶搜索,能快速命中用戶的搜索對象,一次搜 索就能給出全面的、系統的、多種文件類型的知識資料資源,可極大提高用戶搜索效率,幫 助用戶快速獲取想要的搜索結果的搜索方法。
[0016] 本發明的技術方案如下: 上述的搜索方法,為一種方案式的搜索方法且具體包括以下步驟:(110)搜索引擎獲 取搜索詞;(120)搜索引擎根據所述的搜索詞確定多條搜索結果,搜索結果中包含至少有 一條具有不少于一級分類組織結構的方案式的結構化信息資源集合的結果,對所有搜索結 果去同、排序后提供到搜索結果頁面中。
[0017] 所述搜索方法,其中,所述步驟(120)具體包括:(121)搜索引擎根據網絡上抓取 的網頁建立網頁數據庫;(122)搜索引擎在對所有網頁建立數據索引庫過程中,根據方案 式內容提供標準對每一個網頁進行分析,判斷是否為符合方案式內容提供標準的網頁,對 于符合的根據其方案式內容的網頁相關信息建立方案式內容的索引數據庫,對于不符合方 案式提供標準的網頁根據該網頁相