專利名稱:分布式網絡站點及其信息搜索方法及系統的制作方法
技術領域:
本發明涉及網絡信息搜索方法,尤其是涉及一種基于超文本傳輸協議(HTTP, Hypertext Transfer Protocol)對分布式網絡進行信息搜索的方法及系統,以及執行該搜 索方法的分布式網絡站點。
背景技術:
隨著互聯網的普及,互聯網上的內容信息急劇增長,因而通過關鍵字在互聯網上 搜索要查詢的內容的方法也得到廣泛使用。 然而,目前的搜索方式,都是由幾個大公司,使用自己的網絡蜘蛛程序,不斷地搜 索成千上萬的網頁,然后再按自己排序技術、信息處理技術做進一步加工。因此,用戶訪問 的關鍵字結果,不一定和原網站的內容匹配;搜索結果信息可能會滯后,對應的搜索結果已 經不存在;而搜索結果的排序也可能會被搜索公司任意修改。 調查顯示,現在有95%的人使用搜索引擎 ,并把它們當作健康、理財、工作、生活等 各方面的"決策顧問",所以,搜索引擎向網民提供完整、公正、客觀的信息尤為重要。
發明內容
本發明的目的在于提出一種基于超文本傳輸協議(HTTP, Hypertext Transfer Protocol)對分布式網絡進行信息搜索的方法及系統,以及執行該搜索方法的分布式網絡 站點,為用戶提供客觀真實的搜索結果。 為解決本發明的技術問題,本發明公開一種分布式網絡的信息搜索方法,其,包 括 客戶端將用戶輸入的關鍵字按HTTP協議組織成Content-Type的類型為 即plication/Search的HTTP-POST請求消息,并將HTTP-POST請求消息發送至指定的一個 或多個分布式網絡站點; 網絡站點接收所述HTTP-POST請求消息,分析關鍵字,在網絡站點內部搜索與關 鍵字匹配的網站內容,將網站內容組織成XML文本以HTTP響應消息返回給客戶端;
其中,關鍵字的表達式必須符合XML文本格式。 優選的,本發明是按照與關鍵字的相關程度對所述匹配的網站內容進行排序處理。 優選的,本發明是按照與關鍵字的相似程度或網站內容的重要程度對所述匹配的
網站內容進行排序處理。
另外,本發明還公開一種分布式網絡的信息搜索系統,其包括 客戶端將用戶輸入的關鍵字按HTTP協議組織成Content-Type的類型為
即plication/Search的HTTP-POST請求消息,并將HTTP-POST請求消息發送至指定的一個
或多個分布式網絡站點;其中,關鍵字的表達式必須符合XML文本格式; 分布式連入互聯網絡的多個網絡站點接收所述HTTP-POST請求消息,分析關鍵字,在網絡站點內部搜索與關鍵字匹配的網站內容,將網站內容組織成XML文本以HTTP響 應消息返回給客戶端。 再者,本發明還公開一種分布式網絡站點,以分布式連入互聯網絡,其中,每個網 絡站點包括 網絡接收模塊,用于接收客戶端通過網絡將用戶輸入的關鍵字按HTTP協議組織
成Content-Type的類型為application/Search的HTTP-POST請求消息; 搜索模塊,用于從HTTP-POST請求消息之中分析關鍵字,在網絡站點內部搜索與
關鍵字匹配的網站內容; 搜索響應模塊,用于將與關鍵字匹配的網站內容組織成XML文本以HTTP響應消息 返回給客戶端; 其中,關鍵字的表達式必須符合XML文本格式。 優選的,每個網絡站點包括搜索結果排序模塊,用于按照與關鍵字的相關程度對 所述匹配的網站內容進行排序處理。 優選的,搜索結果排序模塊是按照與關鍵字的相似程度或網站內容的重要程度對
所述匹配的網站內容進行排序處理。 與現有技術相比,本發明具有如下有益效果 本發明利用現有的HTTP傳輸協議,定義一種分布式搜索方式,含發送搜索請求、 搜索結果返回的通用標準,可以實現分布式搜索,而且搜索結果直接從內容擁有者提供,保 證內容的實時性、準確性;另外,只要各網絡站點遵循這種分布式模式,則所有的網絡站點 都可以提供自己的搜索結果,而不管網站是基于何種技術搭建,網站內容是基于何種存儲 方式保存,從而保障了信息搜索的全面性和廣泛的適用性。
圖1是本發明的系統拓撲結構圖; 圖2是本發明的流程示意圖; 圖3是圖1中網絡站點的結構示意圖。
具體實施例方式
如圖1所示,若干個網絡站點30分布在各地,通過網絡20連接。而客戶端10則 通過網絡接入設備(比如路由器、網絡節點)接入網絡20,并可通過網絡20訪問任何一個 網絡站點30。 結合圖2所示。任何一個客戶端10均可以將用戶輸入的關鍵字按HTTP協議組織 成Content-Type的類型為即plication/Search的HTTP-POST請求消息,并將HTTP-POST 請求消息發送至指定的一個或多個分布式網絡站點,其中,關鍵字的表達式必須符合可擴 展標記語言(Extensible Markup Language, XMU文本格式。 由于HTTP協議簡單,使得HTTP服務器的程序規模小,因而通信速度很快;另外, HTTP允許傳輸任意類型的數據對象,正在傳輸數據對象或內容的類型由Content-Type 加以標記,也就是說,Content-Type屬性指定服務端響應的HTTP內容類型,如果未指定 Content-Type,渠犬認為text/html 。
而本發明是在常規HTTP協議中稍加擴充,增加 一 個Content-Type的類型為 application/Search,其表示正在傳輸的數據對象或內容的類型Content-Type是進行搜 索。 任何一個網絡站點接收所述HTTP-POST請求消息,分析關鍵字,在網絡站點內部
搜索與關鍵字匹配的網站內容,按照與關鍵字的相關程度對所述匹配的網站內容進行排序
處理,甚至按照與關鍵字的相似程度或網站內容的重要程度對所述匹配的網站內容進行排
序處理,將排序處理后的網站內容組織成XML文本以HTTP響應消息返回給客戶端。 結合圖3所示,本發明還公開一種分布式網絡站點30,以分布式連入互聯網絡20,
其中,每個網絡站點30包括網絡接收模塊31、搜索模塊32、搜索結果排序模塊33和搜索
響應模塊。 其中,網絡接收模塊31用于接收客戶端通過網絡將用戶輸入的關鍵字按HTTP協 議組織成Content-Type的類型為即plication/Search的HTTP-POST請求消息,且鍵字的 表達式必須符合XML文本格式;搜索模塊32用于從HTTP-POST請求消息之中分析關鍵字, 在網絡站點內部搜索與關鍵字匹配的網站內容;搜索結果排序模塊33用于按照與關鍵字 的相關程度對所述匹配的網站內容進行排序處理,優選的,搜索結果排序模塊是按照與關 鍵字的相似程度或網站內容的重要程度對所述匹配的網站內容進行排序處理;搜索響應模 塊34用于將與關鍵字匹配的網站內容組織成XML文本以HTTP響應消息返回給客戶端。
綜上,本發明利用現有的HTTP傳輸協議,提出一種分布式搜索方式,含發送搜索 請求、搜索結果返回的通用標準,可以實現分布式搜索,而且搜索結果直接從內容擁有者提 供,保證內容的實時性、準確性;另外,只要各網絡站點遵循這種分布式模式,則所有的網絡 站點都可以提供自己的搜索結果,而不管網站是基于何種技術搭建,網站內容是基于何種 存儲方式保存,從而保障了信息搜索的全面性和廣泛的適用性。
權利要求
一種分布式網絡的信息搜索方法,其特征在于,包括客戶端將用戶輸入的關鍵字按HTTP協議組織成Content-Type的類型為application/Search的HTTP-POST請求消息,并將HTTP-POST請求消息發送至指定的一個或多個分布式網絡站點;網絡站點接收所述HTTP-POST請求消息,分析關鍵字,在網絡站點內部搜索與關鍵字匹配的網站內容,將網站內容組織成XML文本以HTTP響應消息返回給客戶端;其中,關鍵字的表達式必須符合XML文本格式。
2. 根據權利要求l所述分布式網絡的信息搜索方法,其特征在于,還包括按照與關鍵 字的相關程度對所述匹配的網站內容進行排序處理。
3. 根據權利要求2所述分布式網絡的信息搜索方法,其特征在于,按照與關鍵字的相 似程度或網站內容的重要程度對所述匹配的網站內容進行排序處理。
4. 一種分布式網絡的信息搜索系統,其特征在于,包括客戶端將用戶輸入的關鍵字按HTTP協議組織成Content-Type的類型為 即plication/Search的HTTP-POST請求消息,并將HTTP-POST請求消息發送至指定的一個 或多個分布式網絡站點;其中,關鍵字的表達式必須符合XML文本格式;分布式連入互聯網絡的多個網絡站點接收所述HTTP-POST請求消息,分析關鍵字,在 網絡站點內部搜索與關鍵字匹配的網站內容,將網站內容組織成XML文本以HTTP響應消息 返回給客戶端。
5. —種分布式網絡站點,以分布式連入互聯網絡,其特征在于,每個網絡站點包括 網絡接收模塊,用于接收客戶端通過網絡將用戶輸入的關鍵字按HTTP協議組織成Content-Type的類型為application/Search的HTTP-POST請求消息;搜索模塊,用于從HTTP-POST請求消息之中分析關鍵字,在網絡站點內部搜索與關鍵 字匹配的網站內容;搜索響應模塊,用于將與關鍵字匹配的網站內容組織成XML文本以HTTP響應消息返回 給客戶端;其中,關鍵字的表達式必須符合XML文本格式。
6. 根據權利要求5所述分布式網絡站點,其特征在于,每個網絡站點包括搜索結果排 序模塊,用于按照與關鍵字的相關程度對所述匹配的網站內容進行排序處理。
7. 根據權利要求6所述分布式網絡站點,其特征在于,搜索結果排序模塊是按照與關 鍵字的相似程度或網站內容的重要程度對所述匹配的網站內容進行排序處理。
全文摘要
本發明公開一種分布式網絡站點及其信息搜索方法及系統。其中,所述信息搜索方法包括客戶端將用戶輸入的關鍵字按HTTP協議組織成Content-Type的類型為application/Search的HTTP-POST請求消息,并將HTTP-POST請求消息發送至指定的一個或多個分布式網絡站點;網絡站點接收所述HTTP-POST請求消息,分析關鍵字,在網絡站點內部搜索與關鍵字匹配的網站內容,將網站內容組織成XML文本以HTTP響應消息返回給客戶端;其中,關鍵字的表達式必須符合XML文本格式。本發明可以實現分布式搜索,而且搜索結果直接從內容擁有者提供,保證內容的實時性、準確性和客觀性。
文檔編號H04L29/06GK101763391SQ20081024181
公開日2010年6月30日 申請日期2008年12月23日 優先權日2008年12月23日
發明者侯華鋒 申請人:康佳集團股份有限公司