專利名稱:網絡文摘定制搜索引擎的制作方法
技術領域:
本發明是涉及一種互聯網通訊信息技術領域,特別是指網絡文摘類的定制搜索引擎。
背景技術:
對目前互聯網上的信息搜索的技術,常見的有網絡爬行、分詞引索、搜索等技術。這些網絡搜索信息只是面對互聯網海量信息的積累。當我們采用現有搜索技術查詢某個特定的確切信息時,用一個關鍵詞即可搜索出來成千上萬的鏈接網頁結果。而在這些成千上萬的搜索結果中不一定有用戶所期望和關注的準確信息,用戶也不可能有更多的時間去逐個翻看現有搜索技術所呈現出來的成千上萬個網頁鏈接結果。同時,當用戶離線時,如果互聯網上有出現用戶所希望的最新信息,因用戶不在線而沒有發出搜索指令,用戶就會失去及時閱讀和保存該信息的時機。為此,現有的搜索技術和方法已經無法滿足人們希望在海量信息中,要求準確、及時、方便的找出目標信息的愿望。于是個性化網絡文摘定制搜索引擎的出現將帶來信息搜索技術領域內的革命性變化。
發明內容
本發明的目的在于提出一種網絡文摘類的定制搜索引擎技術和方法。
為了適應人們快節奏網絡信息生活,滿足人們在海量信息中希望得到準確、及時、方便、快速的找出目標信息的愿望。本發明提供了一個既滿足人們希望在互聯網上獲取個性需求信息,又可以對所搜索出的成千上萬的結果進行定時搜索、自動過濾和分類存儲;同時還可以使用戶在離線狀態下,將用戶自行設定和經常關注的最新信息即時保存到用戶的網絡自有空間內。使得用戶不再為搜索不準確和必須查看成千上萬個網頁結果而煩惱,并解決了因用戶離線失去及時獲得網絡上最新信息的難題。該系統提供了人性化,量身打造的網絡文摘類服務平臺。同時該系統還可以實現移動手機與電腦為一體的快速查閱方式;讓用戶及時和便捷地掌握所關注最新準確的網絡信息。
本發明采用全新的算法能夠精確匹配搜索是縮小搜索結果范圍的有力工具。該系統平臺為用戶提供個性化的設置專業詞語和關鍵字,之后由平臺系統的搜索引擎功能自動地從互聯網上搜索符合用戶設置的專業詞語和關鍵字的文摘信息,并將搜索到的文摘信息分類并存儲到指定的個人空間庫,供用戶在線或離線時查閱。在系統平臺的個人空間中,用戶還可以根據需要設置和劃分不同的信息存入各個子目錄,系統平臺會將搜索到的信息結果自動歸類、定時和定向放置在個人空間中,供用戶登錄后閱讀或離線整理。為防止用戶在不在線的情況下錯失所關注最新文摘信息,該平臺的移動手機短信定制功能,可以查閱用戶自己定制的搜索目標有無最新信息;并且也可以通過手機短信定制方式隨時接收和閱讀最新定制的網絡文摘信息。
本發明的技術方案是一種適用與于個性化網絡文摘類的定制搜索引擎技術和方法,其特征在于全新的設計理念和程序算法精確定位用戶需求的信息,采用實時或自動定時抽取和信息歸類技術實現用戶獲取信息的及時性以及分類的自動化,同時還實現了搜索引擎和移動設備的綁定,成為移動手機用戶登錄互聯網的入口,為用戶打造準確、及時、方便的個性化網絡文摘信息服務空間。
其流程主要分為在線網絡用戶設定定制的資源→抓取網絡資源建立資源庫→系統自動歸類到用戶的個人空間。
首先,用戶定制資源。用戶在系統平臺的個人空間內,根據個性需求選取或設定行業網站鏈接和關鍵詞;選取或設定要求系統進行的搜索時間或搜索頻率;選取或設定個人空間內的子目錄名稱和歸類。
其次,系統對用戶所設置行業和關鍵詞建立搜索機制;按照用戶設定的時間周期自動獲取站點更新信息。系統采取一個能訪問網絡的爬蟲器程序,依據URL之間的關聯性自動爬行整個互聯網,并對爬行過的網頁進行抓取收集。當網頁被收集回來后,采用索引分析程序進行網頁信息的分析,依據一定的相關算法進行大量計算,創建倒排序的索引庫。索引庫建好后系統就可以通過提供的搜索界面提交關鍵詞進行再搜索,然后依據特定的排序算法返回搜索結果。因此,搜索引擎并不是對互聯網進行直接搜索,而是對已抓取網頁索引庫的搜索,這也是能快速返回搜索結果的原因,索引在其中扮演了最為重要的角色,索引算法的效率直接影響搜索引擎的效率,是評測搜索引擎是否高效的關鍵因素。
網頁爬行器、索引器、查詢器共同構成了搜索引擎的重要組成單元,針對像中文、韓文,英文等系統的特定語言,還需要分詞器進行分詞,一般情況下,分詞器與索引器一起使用創建特定語言的索引庫。
其三,無論用戶是否在線,系統都將把獲得資源進行分類定向放置到用戶指定空間中去;最后,用戶通過登錄自有空間以及采取手機短信定制的功能,時時查閱和整理自己定制的個性化網絡文摘類搜索信息;本發明的優點在于通過全新的程序算法判斷哪些是用戶個性需求的搜索結果信息,用定時或實時抽取的搜索引擎和新型的定向放置技術,無論用戶是否在線,系統將搜索到信息自動歸納存儲到系統用戶的自有空間中,以供用戶再次登陸自有空間時任意閱讀和整理。該發明實現了為用戶量身定制的個性化網絡文摘服務機制,為用戶提供了更加準確、及時和方便的網絡信息檢索服務。
是本發明網絡系統平臺的搜索引擎過程流程在技術方案已進一步說明。
是本發明網絡系統平臺的技術模式如所示。
是本實用網絡系統平臺的業務功能事務處理流程。
是本實用網絡系統平臺的網絡部署結構。
具體實施例方式
第一步本發明實施前期條件準備1.準備系統數據庫用戶存儲會員信息、資源分類信息、會員存檔資料信息、收集的資源信息;2.準備相應的操作系統系統數據庫與相應的操作系統相結合,不僅維護成本低,而且二者結合可提高系統的優越性;3.準備本系統套件實現互聯網信息的爬行,下載的資源建立索引,構建索引庫以及提供信息檢索的功能;4.準備防火墻和防毒系統用于防止黑客攻擊和病毒的侵犯;5.選擇合適的CDN緩存服務器供應商。
第二步系統網絡部署本發明網絡部署結構,結合附圖[圖4]對本發明的具體實施方式
作進一步詳細說明(01)系統從互聯網上搜索的最新信息經過防火墻過濾把病毒和各種垃圾信息過慮掉,保存最新關注搜索信息到系統數據庫中;(02)主要是管理(01)防火墻的過濾功能的詳細設置;(03)索引服務器是對從互聯網上搜索并經過(01)防火墻過濾的信息進行分詞處理存入系統數據庫中;(04)數據庫服務器是安裝(05)系統信息索引數據庫的服務器,用來保證系統能讀取到搜索的最新信息;(05)用于存放系統經過索引器處理的搜索信息數據的數據倉庫;(06)數據庫服務器是安裝(05)系統數據庫的服務器,用來保證系統的正常運行;(07)網站服務器是安裝該搜索引擎系統網絡服務系統的服務器;(08)短信網關是該搜索引擎系統網絡服務系統與短信服務提供商連續的接口;(09)在線支付是網絡服務平臺會員繳納會費時與銀行管理系統聯結傳輸數據的接口;(010)主要是對CND外網緩存服務器進行過濾和防止網絡病毒的入侵功能;(011)對過濾和防止網絡病毒防火墻的過濾功能管理合理管理;(012)系統網絡服務平臺外網緩存服務器,外部機構訪問網絡緩存器就能訪問到網絡服務平臺系統,其中網絡服務平臺外網緩存服務器必須和系統在(03)互聯網搜索的信息保持同步。
第三步系統搭建本發明系統搭建業務功能,結合附圖[圖3]對的具體實施方式
作進一步詳細說明(101)注冊會員用戶登錄服務平臺系統平臺對該登錄用戶進行判斷是否為新用戶;(102)登錄系統的會員用戶輸入或定制與搜索相關的關鍵字,保存到系統數據庫中;(103)網面爬行器從系統數據庫中提取用戶輸入或定制的關鍵字信息資源在互聯網上爬行大量網頁進行搜索結果;(104)網頁爬行器搜索的結果信息通過控制器接口存放于信息庫中;(105)索引器(分詞器)從信息庫中讀取搜索結果信息通過索引器分詞處理后存放入索引庫中;(106)通過定向放置技術處理從索引庫中讀取的搜索結果信息經過分類存放入設置好的用戶個人空間庫網絡文件夾中;(107)顯示定制的信息從個人空間庫中提取搜索最新信息存入系統數據庫中;(108)會員用戶登錄系統查看存檔數據或進入設置好的個人空間即可看到搜索結果信息,還可以通過手機短信定制功能及時查看到搜索的最新信息。
權利要求
1.一種基于網絡空間定制后自動生成的搜索引擎服務平臺系統,其特征在于系統通過特殊程序算法實時或定時并特定抽取的搜索引擎方式,以及智能的定向放置技術實現特殊要求的網絡文摘型的空間服務模式。
2.根據權利要求1所述的網絡文摘定制搜索引擎服務平臺系統,其特征在于平臺網絡用戶可根據個性需求設置關鍵字和鏈主題目錄,當用戶離線下網時系統將自動在互聯網上逐層瀏覽并準確而不漏的抓取到用戶設定的所需最新信息。
3.根據權利要求1所述的網絡文摘定制搜索引擎服務平臺系統,其特征在于無論用戶是否在線,系統平臺都能將用戶設定的需求信息自動抓取并自動分類放置到用戶的自有網絡空間內。
4.根據權利要求1所述的網絡文摘定制搜索引擎服務平臺系統,其特征在于平臺系統可支持超文本信息格式,DOC、PDF、EXCEL格式和超媒體的搜索方式。利用信息分類主題樹形結構,以節點為基本單位建立節點間的超鏈方式將文本信息形成信息搜索方式,使用戶從任一節點,不同角度,靈活、方便地設定需要瀏覽和查詢搜索到的最新信息。
5.根據權利要求1所述的網絡文摘定制搜索引擎服務平臺系統,其特征在于平臺系統同時還支持自然語言和受控語言的檢索方式。該系統可接受主題詞、關鍵字或一段檢索要求語言,并由系統對其進行分詞處理和“分類主題詞表”的主題詞匹配,匹配者進行索引式檢索,未匹配者進行關鍵字或短語的全文檢索。
6.根據權利要求1所述的網絡文摘定制搜索引擎服務平臺系統,其特征在于平臺系統支持用戶可根據個人需求自行設置搜索內容、搜索時間和搜索頻率。同時具有無線網絡移動手機短信定制通訊功能,用戶可即時獲得自有空間內的最新信息。
全文摘要
本發明涉及一種基于網絡空間定制后自動生成的搜索引擎服務平臺系統和方法。本發明包括網絡平臺用戶可根據個性需求設置關鍵字和鏈主題目錄,由系統自動、定時或實時逐層在互聯網上瀏覽到用戶所需最新信息;無論用戶是否在線,系統都將已獲取的特定信息自動存放到用戶的自有網絡空間內;系統支持用戶可根據個人需求自行設置搜索時間和搜索頻率。本發明使得新型的搜索引擎技術與用戶間定向、定時、定位的需求統一為一體,它實現了“搜索引擎”技術的“網絡文摘定制”方法。
文檔編號G06F17/30GK101059815SQ20071009779
公開日2007年10月24日 申請日期2007年5月9日 優先權日2007年5月9日
發明者宋鳴 申請人:宋鳴