專利名稱:一種搜索與應用相結合的方法和設備的制作方法
技術領域:
本發明涉及計算機技術領域,尤其涉及用于將搜索與應用相結合的方法和設備。
背景技術:
自從70、80年代互聯網普及以來,為滿足用戶在互聯網上訪問海量信息的要求, 出現了許多網絡搜索技術,我們簡單回顧如下90年代早期出現基于人工信息分類的EINet Galaxy搜索引擎。隨后與19994年 Lycos搜索引擎推出,其包括基于機器人程序(Robot)的數據挖掘技術和支持搜索結果相 關性排序。1995年的AltaVista推出的搜索引擎第一個支持自然語言搜索的搜索引擎,具備 了基于網頁內容分析,智能處理的能力,第一個實現高級搜索語法的搜索引擎(如AND、0R、 NOT 等)。1997年,Northernlight公司推出的搜索引擎第一個支持對搜索結果進行簡單的 自動分類,也是當時擁有最大數據庫的搜索引擎之一。1998年,Google推出基于其PAGERANK算法的搜索引擎,其根據網頁之間相互的超 鏈接計算的網頁排序。2000年,百度創始人李彥宏推出基于超鏈分析的百度搜索引擎。現有的搜索引擎的基本工作原理如下1)自動搜集信息搜索引擎的信息搜集基本都是自動的。搜索引擎利用稱為網絡 蜘蛛(spider)的自動搜索機器人程序來連上每一個網頁上的超鏈接。機器人程序根據網
頁鏈到其中的超鏈接,就象日常生活中所說的“一傳十,十傳百......”一樣,從少數幾個網
頁開始,連到數據庫上所有到其他網頁的鏈接。理論上,若網頁上有適當的超鏈接,機器人 便可以遍歷絕大部分網頁。2)建立索引庫搜索引擎整理信息的過程稱為“建立索引”。搜索引擎不僅要保存 搜集起來的信息,還要將它們按照一定的規則進行編排并保存于索引庫中。這樣,搜索引擎 可以根據查詢信息在索引庫中迅速找到所要的資料。3)接受查詢用戶向搜索引擎發出查詢,搜索引擎接受查詢并向用戶返回資料。 搜索引擎每時每刻都要接到來自大量用戶的幾乎是同時發出的查詢,它按照每個用戶的 要求檢查自己的索弓丨,在極短時間內找到用戶需要的資料,并將搜索結果返回給用戶,其 中搜索結果一般包括網頁鏈接及摘要描述。在有多個搜索結果的情形下,需要利用各種 算法進行排序,其中,最著名的搜索排序算法為Google的I^geRank算法(參見美國專利 US6285999),其原理是根據網頁之間相互的超鏈接計算進行網頁排序,搜索引擎把從A網 頁到B網頁的鏈接解釋為A網頁給B網頁投票,并根據投票來源(甚至來源的來源,即鏈接 到A網頁的網頁)和投票目標的等級來決定新的等級。簡單的說,一個高等級的網頁可以 使被其鏈接或引用的其他低等級網頁的等級提升。其中,整理信息及接受查詢的過程,大量應用了文本信息檢索技術,并根據網絡超文本的特點,引入了更多的信息。對于文本信息檢索,早期的信息檢索系統采用“布爾查詢”的方法來進行全文檢 索。用戶必須詳細的規劃自己的查詢,其復雜程度不亞于編程語言。這種檢索方式并不提 供任何的文檔相關性測度,對于文檔與查詢的評價就只有“匹配”,“不匹配”兩種而已。這 兩點問題決定了布爾查詢不能被廣泛應用。對于大規模的語料庫,任何檢索都可能返回數量眾多的結果,因此對檢索結果進 行排序是必須的。因此,一個好的信息檢索模型必須提供文檔相關性測度。一個好的測度 應該使與用戶查詢需求最相關的那些結果,排在最前面,同時允許盡可能多的,與用戶查詢 有一定關系的結果被包括進來。目前,最為常用的信息檢索模型有三種I 向量空間模型(Vector Space Model, VSM)II概率模型(Probabilistic Model)III推理網絡模型 inference Network Model)常規的搜索引擎在接收到用戶輸入的查詢請求時,會返回相關的鏈接列表以及該 鏈接指向的網頁的簡短摘要,這些鏈接直接指向相關的網址或網頁。用戶通過瀏覽這些鏈 接的摘要,篩選出可能相關的網頁,然后點擊鏈接進入該網頁進行瀏覽。通常可能需要點擊 進入多個網頁才能夠找到所需的內容。當點擊鏈接進入一個網頁時,瀏覽器會下載該鏈接 對應的整個網頁,包括圖片、文字、Flash、廣告等等,其中大部分內容是與用戶的需求無關 的。下載過程需要等待時間并且占用網絡帶寬,下載的頁面會占據內存和硬盤空間。即便瀏 覽完畢后關閉該頁面,內存也可能不被釋放。因此通常打開20多個網頁后,內存容量被耗 盡,進而采用硬盤的空間作為虛擬內存,大大地降低計算機的運行速度。并且緩存在硬盤中 的網頁日積月累,會產生大量存儲碎片,需要定期清理。如此反復地打開關閉網頁的過程, 費時費力,效率較低。
發明內容
為了提高搜索引擎的效率,減少用戶打開新的網頁的次數,降低網絡流量,減少對 內存和硬盤空間的占用。本發明的目的是提供一種搜索與應用相結合的方法,該方法包括 以下步驟獲取該用戶的查詢請求;根據所述查詢請求進行匹配搜索,以獲得包含與所述 查詢請求相匹配的應用接口的搜索選項;以及將所述包含應用接口的搜索選項提供給所述 用戶。根據本發明的另一個方面,還提供了一種搜索與應用相結合的設備,該設備包括 獲取裝置,用于獲取該用戶的查詢請求;查詢裝置,用于根據所述查詢請求進行匹配搜索, 以獲得包含與所述查詢請求相匹配的應用接口的搜索選項;提供裝置,用于將所述包含應 用接口的搜索選項提供給所述用戶。與現有技術相比,本發明允許用戶通過在搜索引擎中輸入關鍵字,直接向用戶呈 現相關的應用接口,用戶對應用接口的直接操作即可獲得相關的信息而不需要打開新的網 頁,等待下載網頁內容這些操作步驟。
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發明的其它特征、目的和優點將會變得更明顯圖1示出根據本發明的方法向用戶提供應用接口的流程圖;圖2示出根據本發明的方法用戶操作應用接口的流程圖;圖3示出根據本發明的方法由搜索引擎自動收集網頁的應用接口的流程圖;圖4示出根據本發明的方法由用戶提交網頁的應用接口的流程圖;圖5示出根據本發明的設備的一個實施例的方框圖;圖6示出根據本發明的設備的另一個實施例的方框圖;圖7A示出在搜索引擎上呈現的應用接口的示意圖;以及圖7B示出在包含對應應用接口的網頁上呈現的應用接口的示意圖。
附圖中相同或相似的附圖標記代表相同或相似的部件。
具體實施例方式下面結合附圖對本發明作進一步詳細描述。與常規的搜索引擎使用方式相類似,用戶在搜索特定內容時,需要在搜索框中輸 入相關的關鍵詞,然后搜索引擎服務器將從索引庫中查找與該關鍵詞對應的鏈接及其相關 內容呈現給用戶。本發明與現有搜索引擎不同之處在于,搜索引擎不只是向用戶呈現僅僅 能夠點擊跳轉的鏈接,而是還根據用戶的需求以及對大量用戶行為的統計分析,提供相關 網頁上的應用接口。這些應用接口包括但不限于圖表、輸入框、控件、選項列表、下載鏈接、 運算接口和/或對話框等等。用戶不需要離開搜索引擎的頁面就可以直接對這些應用接口 進行操作,以獲得進一步的信息。根據接口的類型不同,這些操作包括但不限于登錄、選 擇、計算、查詢、下載、游戲操作、即時通訊和\或音視頻通信等等。這些應用接口來源于目 標網頁,但不一定與目標網頁上的接口表現形式相同。圖7A示出在搜索引擎上呈現的應用接口的示意圖;圖7B示出在包含對應應用接 口的網頁上呈現的應用接口的示意圖。如圖7A中所示,當用戶在搜索框701中輸入“新浪郵箱”時,搜索引擎將把“新浪 郵箱”的鏈接702和其登錄框703呈現給用戶。用戶不需要打開新浪郵箱702的鏈接就可 以直接在搜索引擎的頁面上的登錄框703中輸入用戶名和密碼,然后直接登錄新浪郵箱。 這里的登錄框703是本發明中所述的一種應用接口。該搜索引擎中的應用接口與相關網頁 “新浪郵箱”702的應用接口相對應。如圖7B中所示,當打開“新浪郵箱”702的鏈接時可以 看到在“新浪郵箱”網頁上有兩個登錄框“新浪免費郵箱”登錄框704和“新浪VIP郵箱”登 錄框705。在搜索引擎頁面上呈現的登錄框703與“新浪郵箱”頁面上的“新浪免費郵箱”登 錄框704相對應。當用戶在登錄框703中輸入用戶名和密碼并登錄時,搜索引擎的應用接 口將把用戶輸入的用戶名和密碼傳遞到“新浪郵箱”頁面上的“新浪免費郵箱”登錄框704 相應框中,實現郵箱的登錄。因此,本發明的將搜索與應用接口相結合,減少了用戶的操作 步驟,減少頁面打開的次數。下面參照圖1描述本發明的方法的實現步驟。圖1示出根據本發明的方法向用戶提供應用接口的流程圖。如圖1中所示,首先在步驟S101,獲取用戶的查詢請求。該查詢請求可以是用戶輸 入的單個關鍵詞、關鍵詞的組合、句子等。在步驟S102中,搜索引擎從用戶輸入的查詢請求中提取的關鍵詞,然后再索引庫中進行匹配搜索,獲得與該查詢請求相匹配的應用接口的 搜索選項;接著在步驟S103中,將包含應用接口的搜索選項提供給用戶。所述搜索選項中 除了應用接口之外一般還包括該應用接口對應的網頁的鏈接以及相關描述內容。該步驟執 行完成后可以轉到圖2中所示的用戶操作階段。圖2示出根據本發明的方法用戶操作應用接口的流程圖。如圖2中所示,在步驟S201中,用戶可以直接對搜索引擎提供的應用接口進行操 作(S201),根據所呈現的應用接口不同,用戶對應用接口的操作方式也不同。例如,如果應 用接口是一個下載鏈接,則用戶可以在應用接口中直接下載相關程序和文件;如果應用接 口是一個登錄框,用戶可以直接在該應用接口上完成登錄操作;如果應用接口是一個搜索 框,用戶可以在該應用接口上執行進一步的搜索操作;如果應用接口是一個客服界面,則用 戶在該應用接口中提出問題,并及時得到回應,如此等等。根據對應用接口執行操作后是否 需要跳轉到其他網頁,可以把應用接口的類型分為返回型和跳轉型(S203)。對于返回型應 用接口來說,用戶不需要跳轉到新的頁面,用戶對應用接口的操作搜索引擎被反饋到提供 該應用接口或該應用接口對應的網站,網站根據用戶對應用接口的操作返回相應信息給搜 索引擎,搜索引擎接著將返回的信息呈現給用戶(S204)。從用戶端來看,不需要打開新的網 頁即可獲得相關的信息。對于跳轉型應用接口來說,搜索引擎把用戶對應用接口進行的操 作發送到相關網頁,并且同時跳轉到該網頁操作的結果頁面(S205),這時在用戶端需要打 開新的結果頁面,但是省略了登錄初始頁面的操作。圖3示出根據本發明的方法由搜索引擎自動收集網頁的應用接口的流程圖。如圖3中所示,搜索引擎可以定期分析大量網頁上是否存在應用接口(S301),以 及用戶對這些應用接口的操作頻率,對包含該應用接口的網頁的點擊頻率,對包含該應用 接口的網站的點擊頻率是否超過預定閾值來判斷是否滿足提取條件(S302)。如果判斷滿足 提取條件,則提取應用接口和特定關鍵詞,并且置于索引庫中(S303)。接著,將所提取的應 用接口與特定關鍵詞相關聯(S304)。如果不滿足提取條件,則轉到步驟S301,繼續分析下 一個網頁。除了系統自動搜索和提取應用接口之外,用戶也可以主動地向搜索引擎提交應用 接口。圖4示出根據本發明的方法由用戶提交網頁的應用接口的流程圖。在步驟S401,用戶向搜索引擎提交特定網頁上的應用接口。搜索引擎可以審核所 提交的應用接口是否符合要求。如果符合要求,則在步驟S402將應用接口和該網頁上獲得 的特定關鍵詞或者用戶提供的關鍵詞置于索引庫中;并且在步驟S403,將所提取的應用接 口與特定關鍵詞相關聯。為了實現本發明的方法,在此提供一種將搜索與應用相結合的設備。圖5示出根 據本發明的設備的一個實施例的方框圖。如圖5中所示,搜索引擎服務器50包括提取裝置501、收集裝置502、關聯裝置 503、索引庫504、提交裝置505、查詢裝置506、獲取裝置507和提供裝置508。上述裝置分別實現本發明的從網頁收集應用接口并提供給用戶的方法。圖6示出根據本發明的設備的另一個實施例的方框圖。圖6中所示的搜索引擎服務器50還包括反饋裝置509、跳轉裝置510、更新裝置511、應用接口操作裝置512和呈現裝置513。上述裝置相互配合用于實現用戶對搜索引擎 呈現的應用接口的操作過程。 以上對本發明的具體實施例進行了描述。需要理解的是,本發明并不局限于上述 特定實施方式,本領域技術人員可以在所附權利要求的范圍內做出各種變形或修改。
權利要求
1.一種搜索與應用相結合的方法,該方法包括以下步驟 獲取該用戶的查詢請求;根據所述查詢請求進行匹配搜索,以獲得包含與所述查詢請求相匹配的應用接口的搜 索選項;以及將所述包含應用接口的搜索選項提供給所述用戶。
2.根據權利要求1所述的方法,其中所述應用接口包括圖表、輸入框、控件、選項列表、 下載鏈接、運算接口和/或對話框。
3.根據權利要求1或2所述的方法,其中用戶直接對搜索選項中的所述應用接口進行 操作,以獲得相應的結果。
4.根據權利要求3所述的方法,其中對所述應用接口的操作包括登錄、選擇、計算、查 詢、下載、游戲操作、即時通訊和\或音視頻通信。
5.根據權利要求3或4所述的方法,其中將用戶對應用接口的操作反饋回到提供該應 用接口的網頁,并返回來自該網頁的操作結果。
6.根據權利要求3或4所述的方法,其中將用戶對應用接口的操作反饋回到提供該應 用接口的網頁,并跳轉到對該網頁進行相應操作所獲得的結果頁面。
7.根據權利要求1-4中的任何一項所述的方法,其中還包括如下步驟 定期地分析各個網頁,并判斷和提取網頁上呈現的各種應用接口 ; 將所提取的應用接口置于索引庫中;以及將所述應用接口與特定關鍵詞相關聯。
8.根據權利要求1-4中的任何一項所述的方法,其中還包括如下步驟 用戶提交特定網頁上呈現的應用接口;將所提交的應用接口置于索引庫中;以及 將所述應用接口與特定關鍵詞相關聯。
9.根據權利要求7或8所述的方法,其中還包括如下步驟當用戶輸入的查詢包含特定關鍵詞時,在搜索選項中給出與該關鍵詞相關聯的應用接
10.根據權利要求7所述的方法,其中所述提取應用接口的步驟包括根據對所述應用 接口的訪問量、所述應用接口所在網頁的被鏈接數量和\或對所述應用接口所在主網址或 網頁的訪問量來確定是否提取該應用接口。
11.根據權利要求7或8所述的方法,其中定期或根據用戶指示同步更新索引庫中的應 用接口。
12.根據權利要求1-4中的任何一項所述的方法,其中根據網絡熱點確定應用接口的 展現方式和內容。
13.一種搜索與應用相結合的設備,該設備包括 獲取裝置,用于獲取該用戶的查詢請求;查詢裝置,用于根據所述查詢請求進行匹配搜索,以獲得包含與所述查詢請求相匹配 的應用接口的搜索選項;提供裝置,用于將所述包含應用接口的搜索選項提供給所述用戶。
14.根據權利要求13所述的設備,其中所述應用接口包括圖表、輸入框、控件、選項列表、下載鏈接、運算接口和/或對話框。
15.根據權利要求13或14所述的設備,其中還包括應用接口操作裝置,用于直接對搜索選項中的所述應用接口進行操作以獲得相應的結果。
16.根據權利要求15所述的設備,其中對所述應用接口的操作包括登錄、選擇、計算、 查詢、下載、游戲操作、即時通訊和\或音視頻通信。
17.根據權利要求15或16所述的設備,其中還包括反饋裝置,用于將用戶對應用接口的操作反饋回到提供該應用接口的網頁,并返回來 自該網頁的操作結果。
18.根據權利要求15或16所述的設備,其中還包括跳轉裝置,將用戶對應用接口的操作反饋回到提供該應用接口的網頁,并跳轉到對該 網頁進行相應操作所獲得的結果頁面。
19.根據權利要求13-16中的任何一項所述的設備,其中還包括如下裝置 提取裝置,用于定期地分析各個網頁,并判斷和提取網頁上呈現的各種應用接口 ; 收集裝置,用于將所提取的應用接口置于索引庫中;以及關聯裝置,用于將所述應用接口與特定關鍵詞相關聯。
20.根據權利要求13-16中的任何一項所述的設備,其中還包括如下裝置 提交裝置,用于使用戶提交特定網頁上呈現的應用接口 ;收集裝置,用于將所提交的應用接口置于索引庫中;以及 關聯裝置,用于將所述應用接口與特定關鍵詞相關聯。
21.根據權利要求19或20所述的設備,其中當用戶輸入的查詢包含特定關鍵詞時,所 述提供裝置在搜索選項中給出與該關鍵詞相關聯的應用接口。
22.根據權利要求19所述的設備,其中所述提取裝置根據對所述應用接口的訪問量、 所述應用接口所在網頁的被鏈接數量和\或對所述應用接口所在主網址或網頁的訪問量 來確定是否提取該應用接口。
23.根據權利要求19或20所述的設備,其中還包括更新裝置,用于定期或根據用戶指示同步更新索引庫中的應用接口。
24.根據權利要求13-16中的任何一項所述的設備,其中還包括 呈現裝置,用于根據網絡熱點確定應用接口的展現方式和內容。
全文摘要
本發明提供一種搜索與應用相結合的方法,該方法包括以下步驟獲取該用戶的查詢請求;根據所述查詢請求進行匹配搜索,以獲得包含與所述查詢請求相匹配的應用接口的搜索選項;以及將所述包含應用接口的搜索選項提供給所述用戶。本發明還提供了一種搜索與應用相結合的設備。本發明的方法允許用戶通過在搜索引擎中輸入關鍵字,直接向用戶呈現相關的應用接口,用戶對應用接口的直接操作即可獲得相關的信息而不需要打開新的網頁,等待下載網頁內容這些操作步驟。
文檔編號G06F17/30GK102063454SQ201010187100
公開日2011年5月18日 申請日期2010年5月31日 優先權日2010年5月31日
發明者孫云豐, 張玉睿, 徐波, 李明, 金海燕 申請人:百度在線網絡技術(北京)有限公司