專利名稱:用于生成搜索引擎搜索結果的方法和系統的制作方法
技術領域:
本發明涉及用于使得搜索引擎和可搜索的內容豐富的數據庫在當前顯示的搜索結果中并入并使用戶注意到存儲在用戶的本地系統上的與當前搜索請求有關的先前已訪問過的搜索結果的方法、系統和設備。
背景技術:
因特網和內網兩者都是實現對大量信息的交換和獲取的公知通信手段。由經由運行在用戶的本地系統(例如客戶端計算機)上的Web(網絡)瀏覽器訪問服務器的用戶在因特網和內網上交換和獲取該信息。Web瀏覽器提供了用于獲取和查看由因特網/內網服務器(下文中統稱為“Web服務器”)提供的信息、應用和其他資源的圖形用戶接口(“GUI”)。
Web服務器一般使用超文本傳輸協議(“HTTP”)以網頁的形式將Web內容發送給Web瀏覽器。HTTP是一種提供到網站或這些網站的網頁的用戶訪問的應用協議,其具有各種格式,包括文本、圖形、圖像、聲音和動態功能。使用超文本標記語言(HTML)來對每個網頁進行格式化,HTML是結合HTTP而使用的標準頁面描述語言。HTML使得可以以文本和圖形來顯示網頁,并且實現了播放聲音、動畫和視頻數據。一旦用戶選擇了特定的超文本鏈接,本地系統的Web瀏覽器就讀取和解譯與這些鏈接相關聯的統一資源定位符(“URL”)。然后,瀏覽器在選定的URL處與Web服務器連接,并請求該選定鏈接的HTTP。作為返回,Web服務器以HTML格式將所請求的鏈接發送給運行在本地系統上的Web瀏覽器以便由瀏覽器解譯,并且最終由用戶查看該網頁或網立。
在獲取所顯示的超文本鏈接的處理中,可能會指示Web服務器集中搜索和顯示結果。這是通過用戶將搜索查詢輸入到運行在Web服務器上的搜索引擎或可搜索數據庫(下文中統稱為“搜索引擎”)的搜索窗口中來完成的。搜索查詢可以包括關鍵字和/或短語。搜索引擎瀏覽因特網或內網以對包含期望的關鍵字和/或短語的網頁進行定位。然后,搜索引擎返回包含這些關鍵字和/或短語的網頁的列表以供用戶查看,其中已基于搜索引擎所使用的算法而對網頁進行了排序。
然而,采用常規搜索引擎的問題是,搜索僅限于對因特網或內網上的網頁文件或網站文件進行定位,并將這些網頁或網站顯示給用戶。除了這一問題之外,一旦用戶得到了這些搜索結果,如果用戶期望在以后搜索相同主題或類似主題,則搜索引擎會顯示一組新的結果,其可能包括或可能不包括在先前的搜索結果中已經定位的這些網頁或網站。這是不期望的,原因是用戶可能期望訪問或再次訪問在先前的搜索結果中列出的一些選定的網頁或網站。
當用戶使用與過去所使用的那些關鍵字或短語不同的關鍵字或短語來搜索先前已搜索過的主題時,以上問題變得甚至更加復雜。在這種情況下,搜索引擎通常返回包括大量新的網站和網頁的搜索結果,使得用戶必須在隨后通過新列出的網站或網頁執行冗長和耗費時間的瀏覽任務,以對期望的先前已訪問過的感興趣的網頁或網站進行定位。此外,當向用戶呈現新的搜索結果列表時,任何所存儲的關于用戶如何到達特定網站或網頁的導航歷史一般已丟失。
因此,將會有益的是提供一種方法、系統和設備,用于使得用戶可以容易且迅速地訪問包括用戶先前在過去的會話期間訪問過的文件(即網頁或網站)的詳細的搜索結果列表,以使得該用戶能夠對感興趣的網站或網頁進行定位。
發明內容鑒于現有技術的問題和缺陷,本發明的一個目的是提供用于在搜索引擎顯示中將聯機和脫機搜索結果合并在一個單一的概覽中的方法、系統和設備。
本發明的另一個目的是提供生成合并的聯機和脫機搜索結果列表,使得用戶能夠容易和迅速地訪問先前已訪問過的感興趣的文件的方法、系統和設備。
本發明的另一個目的是提供用于使得搜索引擎和可搜索的內容豐富的數據庫在當前顯示的搜索結果中并入并使用戶注意到存儲在用戶的本地系統上的與當前搜索請求有關的先前已訪問過的搜索結果的方法、系統和設備。
本發明的又一個目的是提供用于重構導航路徑,使得用戶可以沿循該用戶先前所沿循的瀏覽或搜索路徑的方法、系統和設備。
根據說明書,本發明的其他目的和優點將部分地變得明顯并且將部分地顯而易見。
在本發明中實現了以上目的和其他目的,其對本領域的普通技術人員來說是顯而易見的,本發明針對一種用于生成搜索引擎搜索結果的方法。該方法包括提供搜索引擎并將搜索查詢輸入到該搜索引擎中。然后,使用搜索引擎來對與搜索查詢有關的聯機文件進行定位,并且對駐留在客戶端計算機上的與搜索查詢有關的脫機文件進行定位。然后,將已定位的聯機文件與脫機文件合并以生成顯示在搜索引擎顯示中的單一的搜索結果概覽。
在本發明的這一方面中,脫機文件是來自過去的會話的先前已排序的文件,其現在駐留在客戶端計算機上。這使得本發明能夠使用搜索引擎的評分算法來生成單一的搜索結果概覽,其中對所呈現的搜索結果中的脫機文件以及聯機文件進行排序。單一的搜索結果概覽的脫機文件優選地在搜索引擎顯示中引起用戶的注意以向該用戶表明這些脫機文件實際上駐留在用戶的計算機上。
這一生成搜索引擎搜索結果的方法還可以包括使用唯一的標識符來標識客戶端計算機處的用戶,以及由搜索引擎利用該唯一標識符訪問存儲在客戶端計算機上的該用戶的個人文件。對與所輸入的搜索查詢有關的聯機文件和脫機文件進行定位,以便生成所呈現的單一的搜索結果概覽。這些搜索結果是使用搜索引擎的評分算法來生成的。
在對脫機文件進行定位的步驟中,首先確定搜索引擎是否愿意與客戶端計算機共享評分算法。如果搜索引擎愿意共享評分算法,則確定客戶端計算機是否能夠執行評分算法。如果客戶端計算機能夠執行評分算法,則將評分算法下載到客戶端計算機,使用這種評分算法來對脫機文件進行排序,然后將已排序的文件存儲在客戶端計算機上以供搜索引擎獲取。運行在搜索引擎上的本發明組件使用這一信息來生成單一的搜索結果概覽。
在客戶端計算機不能執行評分算法的情況下,則必須確定脫機文件是否是從聯機源獲得的。如果脫機文件是從聯機源獲得的,則在聯機源上對這些脫機文件的原始聯機文件進行定位,并將到這些原始聯機文件的鏈接存儲在客戶端計算機中以供搜索引擎獲取。然而,如果該脫機文件并非來自聯機源,則確定搜索引擎是否將接受來自客戶端計算機的上傳文件,并且如果搜索引擎將接受上傳文件,則從客戶端計算機向搜索引擎上傳文件,使用評分算法來進行排序,并提供到這些已排序的上傳文件的唯一鏈接并將其存儲在客戶端計算機上以供搜索引擎根據本發明而使用。
可以得到一種在搜索引擎不愿意共享評分算法時對脫機文件進行定位的替代性的方法。在本發明的這一方面,確定脫機文件是否是從聯機源獲得的。在脫機文件來自該聯機源的情況下,對原始聯機文件進行定位,由搜索引擎生成到這些原始聯機文件的鏈接并將其存儲在客戶端計算機中,以便提供本發明的單一的搜索結果概覽。
然而,如果脫機文件并非來自聯機源,則必須確定搜索引擎是否將接受來自客戶端計算機的上傳文件。如果接受上傳文件,則從客戶端計算機向搜索引擎上傳選定的文件,并使用搜索引擎評分算法來進行排序。在搜索引擎上生成到這些已排序的上傳文件的唯一鏈接并將其存儲在客戶端計算機中以供搜索引擎在以后獲取以便生成單一的搜索結果概覽。
在生成搜索引擎搜索結果時,該方法還可以包括將單一的搜索結果概覽發送給客戶端計算機,確定搜索結果中的選定脫機文件在客戶端計算機上是否仍然可用,并且如果脫機文件可用,則將這些所存儲的先前已在過去的會話期間排序的脫機文件與搜索結果中的選定脫機文件進行匹配。然后,搜索引擎獲取匹配脫機文件的過去路徑信息以便重構先前所沿循的路徑。將這一信息連同本發明的單一的搜索結果概覽一起結合到搜索引擎顯示中。
本發明還針對用于生成本發明的單一的搜索結果概覽的系統和程序存儲設備,該單一的搜索結果概覽包括響應于搜索查詢而進行定位并使用搜索引擎的評分算法進行排序的聯機文件和脫機文件。
特別地在所附權利要求
中闡明了確信為新穎的本發明特征以及本發明所特有的單元。附圖僅用于說明的目的并且并非按比例繪制。然而,通過參考以下結合附圖而進行的詳細說明,可以最好地針對操作的組織和方法而理解本發明本身,其中圖1A-圖1B是本發明的用于提供合并的聯機和脫機搜索結果的系統的示意圖。
圖2示出了本發明的用于提供合并的聯機和脫機搜索結果的處理流程的流程圖。
圖3示出了用于從客戶端計算機獲得脫機文件以便包含在圖2的合并的聯機和脫機搜索結果中的處理流程的流程圖。
圖4示出了用于重構先前已訪問過的文件的所沿循的過去的路徑以便包含在圖2的合并的聯機和脫機搜索結果中的處理流程的流程圖。
圖5示出了選擇選項,其可以顯示在搜索搜索引擎窗口上以便采用本發明來提供合并的聯機和脫機搜索結果。
具體實施方式在描述本發明的優選實施例時,將在此對附圖的圖1-圖5進行參考,其中相似的標號表示本發明的相似特征。
當前的搜索引擎的問題是,它們不會將聯機搜索結果與來自客戶端計算機的脫機(即桌面)搜索結果合并。本發明通過提供用于將聯機和脫機搜索結果合并在單一搜索引擎概覽中以便顯示給用戶的方法、系統和程序產品而解決了這一問題。合并的單一概覽搜索結果為請求搜索查詢的用戶提供了已排序的搜索結果,其包括位于因特網或內網上的聯機文件以及存儲在用戶的計算機上的脫機個人文件。這有利地使得用戶能夠再次訪問該用戶先前已經在過去的瀏覽或搜索會話期間訪問過的感興趣的文件,諸如網頁或網站。
參考圖1A,本發明包括一種運行在客戶端計算機上的系統,用于存儲先前已訪問過的文件,特別是先前已訪問過的網頁或網站,并用于與本發明的運行在搜索引擎上的用于生成本發明的合并的搜索結果的系統進行通信。在第一處理10中,用戶在搜索引擎上打開會話,請求搜索查詢,并且搜索引擎對與搜索查詢相匹配的文件(即網頁或網站)進行定位(步驟20)。用搜索引擎的評分算法根據搜索結果中的文件與所請求的搜索查詢的相關度來對這些文件進行排序。一旦用戶訪問搜索結果中的文件,或一個接一個地瀏覽文件,就將標識每個被訪問的文件的信息以及訪問這些文件的頁序或路徑發送給客戶端計算機(步驟30)以便存儲到客戶端計算機上的存儲器中(步驟40),并且以便如下所述地根據本發明而進行后續使用。退出當前搜索會話(步驟50)。
如圖1B所示,一旦用戶決定在以后發起后續的搜索會話(步驟100),該用戶就輸入用于運行在搜索引擎上的另一個搜索查詢(步驟110)。根據本發明,運行在搜索引擎上的系統隨后與運行在客戶端計算機上的系統進行通信(步驟120、130和140)以便訪問存儲在客戶端計算機上的脫機個人文件,并且以便將這些脫機文件包括在本發明的搜索結果中(步驟150)。正如以下將進行進一步描述的,使用搜索引擎的評分算法在所呈現的合并的搜索結果中對這些先前已訪問過的脫機文件進行排序,并且這些先前已訪問過的脫機文件優選地在搜索結果中引起用戶的注意。
例如,所呈現的合并的搜索結果可以包括1000個已排序的網頁和網站的列表,而向用戶高亮顯示50個駐留在用戶的客戶端計算機上的這種已定位的相關的、已排序的文件。因此,本發明使得本發明的合并的搜索結果可以引用存儲在用戶的客戶端計算機上的脫機個人文件。本發明的另一個優點是,由于存儲在客戶端計算機上的個人文件包括標識每個先前已訪問過的文件的信息,以及訪問這些文件的順序或路徑(步驟30),因此所呈現的合并的搜索結果包括使得用戶可以重構先前在過去的瀏覽或搜索會話期間所沿循的路徑或導航歷史的特征。
另一個特征是,通常,如上所述,在用戶使用與在過去的搜索中所使用的那些關鍵字不同的關鍵字來搜索先前已搜索過的主題時,來自那些過去的搜索的先前已訪問過的文件存儲在客戶端計算機上的存儲器中。一旦存儲在其中,并且用戶使用不同的關鍵字來搜索相同主題,本發明就使用已知的數據轉換技術來對先前已訪問過的與當前搜索查詢有關的文件進行定位,這些數據轉換技術包括但不限于數據挖掘、模式識別、分析、代碼轉換等。這樣,應當意識到,本發明能夠提供跨多個瀏覽器會話的合并的聯機和脫機搜索結果。
為易于理解本發明,現在對圖2-圖4的流程圖進行參考,這些流程圖示出了本發明的方法步驟,其用于使得包括可搜索的內容豐富的數據庫的搜索引擎能夠將存儲在用戶的本地系統上的相關的先前已訪問過的引用結合到當前的聯機搜索結果中,以便為用戶提供合并的聯機和脫機搜索結果。優選地,駐留在用戶的計算機上的搜索結果中的那些文件會引起用戶的注意。盡管以下描述是本發明的優選處理流程,但應當意識到并理解,在不偏離用于提供合并的聯機和脫機搜索結果的本發明的情況下,可以存在若干替代性方案、修改和變型。
在圖2-圖4的流程圖中,圓圈中的標號標識去往和來自該流程圖的其他部分的連接。對本發明的處理流程的流程圖描述如下210識別用戶。客戶端計算機上的用戶訪問運行在因特網上或內網上的搜索引擎,并由唯一標識符進行標識以與其他搜索引擎用戶相區分。例如,唯一標識符可以包括用戶名和口令、用戶的URL、用戶的計算機上的cookie等。一旦識別出用戶,處理流程就繼續到步驟220。
220訪問個人文件。在識別出用戶后,在搜索引擎與用戶的客戶端計算機之間提供鏈接。由于用戶的個人文件將不會直接包含在搜索引擎、因特網或內網中,因此該鏈接將使得搜索引擎可以訪問駐留在用戶的計算機上的個人文件。用戶的個人文件可以包括但不限于先前已訪問過并下載的網頁、網站、文檔等。處理流程來到步驟230。
230用戶輸入搜索查詢。用戶在搜索引擎的窗口中輸入搜索查詢,并且處理流程繼續到步驟240。
240獲得聯機和脫機搜索結果。正是在此時,搜索引擎對與搜索查詢相關的聯機(即在因特網或內網上的)文件和駐留在用戶的客戶端計算機上的脫機文件進行定位。搜索引擎使用搜索引擎的評分算法來對相關的聯機和脫機文件進行排序,并向用戶呈現合并的搜索結果列表,其包括來自因特網或內網的聯機文件和駐留在用戶的計算機上的脫機文件。
在完成該提供合并的聯機和脫機搜索結果的任務時,搜索引擎使用搜索查詢關鍵字或短語在因特網或內網上搜索與所請求的搜索查詢相關的聯機文件(即網頁或網站)。同時,使用相同的搜索查詢關鍵字或短語,本發明搜索并獲得來自用戶的計算機的相關脫機文件以便根據本發明進行排序并包含在已排序的搜索結果中。以下將參考圖3詳細描述該獲得脫機搜索結果的處理。
為一般地理解獲得脫機搜索結果的處理,本發明首先確定搜索引擎是否愿意與客戶端計算機共享其評分算法(步驟310)。如果搜索引擎愿意共享其評分算法,并且已經確定用戶的客戶端計算機具有足夠的處理能力和容量(步驟315),則本發明將評分算法下載到客戶端計算機。然后,使用搜索引擎評分算法針對相關度對駐留在客戶端計算機上的個人文件進行排序(步驟320)。將這些已評分的脫機文件存儲在客戶端計算機上的存儲器中以便上傳到聯機搜索引擎(步驟330)。
然而,如果搜索引擎不愿意共享其評分算法(步驟310),或者客戶端計算機上沒有足夠的處理能力(步驟315),則確定個人脫機文件是否曾經聯機(步驟340)。如果脫機文件是從在此統稱為聯機源(即WAN(廣域網)或LAN(局域網))的因特網或內網獲得的,則本發明將脫機文件與其原始聯機文件進行匹配以便使用本發明的評分算法來對這些文件進行排序(步驟350)。然后,將到該匹配聯機文件的鏈接存儲在用戶的計算機上的存儲器中(步驟370)。
在脫機文件最初不是聯機的情況下(步驟340),本發明確定搜索引擎是否將從客戶端計算機接受上傳的個人文件(步驟360)。如果接受上傳文件,則將存儲在客戶端計算機上的個人文件上傳給搜索引擎。然后,搜索引擎使用其評分算法來對這些上傳的個人文件進行排序,生成到已排序的個人文件的鏈接,并刪除上傳文件本身(步驟365)。將到已排序的個人文件的鏈接連同唯一標識存儲在客戶端計算機上的存儲器中(步驟370)。然而,如果搜索引擎不接受上傳文件(步驟360),則確定是否要搜索更多的搜索引擎(步驟380),并且如果有更多的搜索引擎待搜索,則處理結束(步驟390)。如果沒有更多的搜索引擎待搜索,則處理流程繼續對聯機文件進行定位和排序并將這些結果顯示給用戶。
然后,將來自步驟330的存儲在客戶端計算機上的本地存儲器中的已排序的脫機文件以及來自步驟370的存儲在客戶端計算機中的到匹配聯機文件的鏈接上傳到聯機搜索引擎以便生成合并的聯機和脫機搜索結果列表。在這樣做的過程中,以在此描述的方式,搜索引擎對因特網或內網上的與搜索查詢相關的聯機文件進行定位,并同時對來自用戶的客戶端計算機的與搜索查詢相關的脫機個人文件進行定位。使用搜索引擎評分算法來對這些聯機和脫機文件進行評分以便生成按照與所請求的搜索查詢的相關度而排序的合并的聯機和脫機搜索結果列表。
一旦生成了合并的聯機和脫機搜索結果列表,處理流程就來到步驟250。
250發送搜索結果給本地瀏覽器。然后,將合并的聯機和脫機搜索結果列表發送給用戶的計算機。處理流程繼續到步驟255。
255個人文件在本地系統上是否可用?然后,使用合并的搜索結果列表,本發明確定合并列表中的脫機文件(即駐留在客戶端計算機上的那些文件)是否仍然駐留在該客戶端計算機上。然后,對于合并列表中的每個脫機文件,運行在客戶端計算機上的本發明的系統確定客戶端計算機上的匹配文件在該客戶端計算機上是否仍然可用。如果匹配文件在客戶端計算機上不可用,則處理流程繼續到步驟260。然而,如果匹配文件在客戶端計算機上可用,則處理流程繼續到步驟265。
260通知搜索引擎。在與合并的搜索結果列表中的那些脫機文件相匹配的文件不可用或不再可用的情況下,將關于這種不可用性的通知發送給搜索引擎。然后,搜索引擎將在生成顯示給用戶的其最終搜索結果時使用這一信息。處理流程繼續到步驟280。
265將存儲在本地系統中的文件與搜索查詢進行匹配。如果匹配文件在客戶端計算機上可用,則系統將存儲在客戶端計算機上的這些文件與合并的搜索結果列表中的脫機文件進行匹配。實質特征在于,先前已經使用在此所述的搜索引擎評分算法對來自客戶端計算機的這些所存儲的文件進行了評分或排序。繼續到步驟270。
270獲取針對已匹配文件的過去路徑數據。一旦在客戶端計算機上對匹配文件進行了定位,系統就獲取與存儲在客戶端計算機上的這種匹配文件有關的過去路徑信息。下面將結合圖5來更詳細地說明該獲取用戶所沿循的過去路徑的處理。然后,將匹配文件和過去路徑信息發送給搜索引擎以便進行進一步處理。處理流程繼續到步驟280。
280呈現結果。搜索引擎獲取不可用的匹配文件信息(來自步驟260)以及匹配文件和過去路徑信息(來自步驟265-270),并使用這一信息來生成合并的搜索結果報告,其包括駐留在客戶端計算機上的當前可用脫機文件以及與搜索查詢相關的聯機文件。如上所述,使用搜索查詢評分算法根據這些合并的聯機和脫機搜索結果與搜索查詢的相關度來對這些結果進行排序。
在這樣做的過程中,駐留在用戶的客戶端計算機上并且僅供客戶端計算機處的用戶使用的相關脫機文件優選地在搜索結果中引起用戶的注意。這可以通過以下操作來完成,即在合并搜索結果的顯示中對脫機文件進行高亮顯示或顏色編碼,將相關脫機文件顯示在其自己的顯示窗口中,在彈出窗口中,或向用戶表明搜索結果中的選定文件直接駐留在用戶的客戶端計算機上的任意其他顯示手段。在將本發明的合并的聯機和脫機搜索結果呈現給用戶時,運行在客戶端計算機上的瀏覽器通過Java啟動程序或甚至通過HTML來顯示本發明的搜索結果。處理繼續到步驟290。
290結束。一旦將合并的搜索結果報告顯示給用戶,處理流程就結束。然后,用戶可以通過輸入新的搜索查詢來重新開始處理流程。
為更好地理解如何根據本發明獲得脫機文件搜索結果,以下將描述圖3的詳細處理流程。一旦確定搜索引擎必須對駐留在客戶端計算機上的脫機文件進行定位(步驟240),則處理流程如下310評分算法是否可用?運行在客戶端計算機上的本發明的系統確定用戶所登錄的當前搜索引擎是否愿意與該系統共享其評分算法以便對存儲在客戶端計算機上的脫機文件進行排序。通過使用搜索引擎評分算法,基于存儲在客戶端計算機上的脫機文件與所請求的搜索查詢的相關度來對其進行排序或評分。例如,可以基于所搜索的查詢關鍵字在文件中的出現率從最高到最低對已定位的脫機文件進行排序。
如果搜索引擎允許于客戶端計算機共享其評分算法,就下載該評分算法并將其存儲在客戶端計算機上以便對位于該客戶端計算機上的脫機文件進行排序。一旦下載了評分算法,處理流程就繼續到步驟315。然而,如果搜索引擎不允許共享其評分算法,則處理流程繼續到步驟340。
315是否有足夠的處理必要條件?如果聯機搜索引擎愿意與客戶端計算機共享其評分算法,則本發明的系統確定客戶端計算機是否具有足夠的處理能力和資源來實現和執行所下載的搜索引擎評分算法。例如,可以確定客戶端計算機是否能夠使用其當前資源在任意時間約束或在合理的時間量之內執行該評分算法。
如果客戶端計算機能夠執行所下載的評分算法,則處理流程繼續到步驟320。作為替代,如果客戶端計算機不具有足夠的處理能力和資源來執行這種評分算法,則處理流程繼續到步驟340。
320對本地文件進行評分。然后,該系統在用戶的客戶端計算機上搜索存儲在客戶端計算機上與搜索查詢相關的文件,并使用所下載的搜索引擎評分算法來對這些已定位的脫機文件進行排序。來到步驟330。
330存儲已評分的文件。然后,將已排序的脫機文件存儲在例如DB1 335之類的駐留在用戶的客戶端計算機上的本地數據庫中以便包括在步驟240的搜索結果中。繼續到步驟240。
340是否發現文件聯機?如果已經確定搜索引擎不允許共享其評分算法(步驟310),或者客戶端計算機上沒有足夠的處理能力和資源來執行搜索引擎評分算法(步驟315),則本發明尋找一種對在用戶的客戶端計算機上的能量和/或資源消耗更少的替代性方法。在這一方法中,本發明使用聯機文件與脫機文件之間的相似度來獲得針對存儲在客戶端計算機上的脫機文件的相對評分。在這樣做的過程中,本發明首先確定存儲在客戶端計算機上的文件是否曾經是聯機源(即在因特網或內網上)。
例如,本發明可以分析本地文件以確定它們是否是網頁或網站,或者是否是從因特網或內網或者任意其他可搜索數據庫下載到客戶端計算機上的。可以通過以下操作來獲得這一信息,即本發明分析客戶端計算機上的本地高速緩存,或分析文件本身。如果確定文件曾經是聯機的,則處理流程繼續到步驟350。然而,如果文件未聯機過,則處理流程繼續到步驟360。
350找到原始聯機文件。如果本地脫機文件曾經聯機,則使用搜索引擎對因特網或內網進行搜索以對當前聯機的這種文件的原始文件進行定位。這使得能夠使用搜索引擎的評分算法來獲取對與用戶的脫機文件相匹配的當前聯機文件的相關度排序。一旦已定位,就生成到客戶端計算機中的文件的該聯機版本的引用或鏈接。然后,處理流程來到步驟370。
360搜索引擎是否允許上傳文件?然而,如果確定存儲在本地客戶端計算機上的文件先前未聯機過,則本發明確定搜索引擎是否將允許從用戶的本地客戶端計算機上傳文件。在這樣做的過程中,從客戶端計算機向聯機搜索引擎發送請求,請求該聯機搜索引擎接受來自客戶端計算機的上傳文件,以便使用搜索引擎的評分算法根據與所請求的搜索查詢的相關度來對這些文件進行分類和排序。然后,使得這些經分類和排序的文件僅對該用戶可用,正如以下將結合步驟365所述。如果搜索引擎接受從客戶端計算機上傳文件,則處理繼續到步驟365,并且如果搜索引擎不接受從客戶端計算機上傳文件,則處理來到步驟380。
365搜索引擎對文件進行處理。在搜索引擎將接受來自客戶端計算機的上傳的脫機文件并對其進行評分的情況下(步驟370),將來自用戶的客戶端計算機的選定文件上傳到聯機服務器。這些文件是基于位置(諸如“My Documents”(我的文檔)之類的位置)、編輯歷史(未編輯過的文件很有可能不是該用戶自己準備的文檔)和可選選擇(基于該可選選擇將文件選定為存檔在備份存儲解決方案上)來選擇的。然后,運行在服務器上的搜索引擎使用搜索引擎的評分算法來對來自客戶端計算機的上傳文件進行分類以基于與所請求的搜索查詢的相關度優選地從最高到最低對這些文件進行排序。
在使得已排序的個人文件僅對該用戶可用時,搜索引擎生成到用戶的計算機上的每個已排序的文件的位置的鏈接,并刪除該上傳的文件本身以節省搜索引擎上的存儲空間。該鏈接唯一地標識了用戶的計算機上的每個文件的位置和排序,并且對特定用戶計算機來說是唯一的,以便使得該用戶能夠控制對位于該用戶的計算機上的其個人文件的訪問。在這樣做的過程中,用戶優選地通過口令與指令的結合來控制對其個人文件的訪問,該指令是關于搜索引擎如何使得文件對該用戶可用的。正是這些指令優選地包括了命令,該命令用于將該用戶標識為有權訪問用于訪問該用戶的計算機上的文件的唯一鏈接的唯一個人或實體。
然后,處理流程繼續到步驟370。
370存儲在存儲器中。本發明存儲來自步驟350的到用戶的脫機文件的已排序的聯機匹配文件的引用或鏈接,或者作為替代,其存儲來自步驟365的到該用戶的計算機上的每個已排序的文件的位置的引用或鏈接,以便使得僅有該用戶能夠訪問該文件。在任一方法中,將每個引用或鏈接存儲在客戶端計算機的存儲器中,諸如本地數據庫335中,或者用戶計算機上的不同數據庫中。處理流程繼續到步驟240。
380尋找更多的搜索引擎。如果在步驟360中搜索引擎不允許上傳文件,則處理流程可以繼續判斷搜索查詢是否將被輸入到更多的搜索結果中。如果要在其他搜索引擎中搜索該搜索查詢,則處理流程繼續到步驟390。然而,如果不再在其他搜索引擎中搜索該搜索查詢,則處理來到步驟240。
390結束。此時已經確定將利用其他搜索引擎來生成針對所請求的搜索查詢的相關搜索結果。當前會話的處理流程結束,并且用戶可以隨后通過在另一個搜索引擎上發起新的搜索會話來重新進入本發明的處理流程。
關于獲取過去的路徑的步驟,該處理使得用戶可以重構先前在過去的瀏覽或搜索會話期間所沿循的路徑。實質特征在于,用戶先前在這種過去的會話期間已訪問過的文件現在連同相應的過去路徑信息一起存儲在用戶的計算機上(步驟270)。在這樣做的過程中,該處理有利地使得用戶能夠對該用戶曾經在先前的搜索會話期間進行過定位的期望的網站進行定位。
應當理解,該獲取過去的路徑的步驟是可選的,并且可以在用戶需要這種過去路徑信息時由用戶選擇。在用戶想要重構先前所沿循的路徑的情況下,用戶可以在搜索引擎窗口顯示上選擇過去路徑選項。應當意識到,該過去路徑選項可以自動地運行在本發明的系統上,以便當搜索引擎生成合并的聯機和脫機搜索結果時,可以將該過去路徑信息結合和嵌入在這些結果中。然后,用戶只需要進行過去路徑選項選擇。
作為替代,過去路徑選擇選項可以由用戶在搜索引擎生成本發明的合并的聯機和脫機搜索結果之后選擇。在這一方面,一旦將這些合并的搜索結果顯示給用戶,該用戶就可以選擇針對列在搜索引擎中的特定文件的過去路徑信息,并且然后,搜索引擎將獲取過去路徑信息,正如在此所述。
在獲取該過去路徑信息時,無論其是在生成本發明的合并的搜索結果之前還是之后進行的,一旦已經在客戶端計算機上對與搜索結果脫機文件相匹配的文件進行了定位(步驟270),就通過沿循如下處理流程來獲得用戶在他先前訪問該匹配文件時所選取的路徑410加載瀏覽器歷史。一旦在客戶端計算機上對匹配文件進行了定位,就將與該文件相關聯的瀏覽器歷史加載到存儲在客戶端計算機上的本地存儲器中。處理繼續到步驟420。
420加載“最近的文件”。同樣將最近從客戶端計算機的操作系統訪問過的文件加載到存儲在客戶端計算機上的本地存儲器中。處理來到步驟430。
430對于每個找到的搜索結果,找到出現率。然后,運行在客戶端計算機上的本發明的系統確定存儲到存儲器中的瀏覽器歷史或存儲在存儲器中的“最近的文件”中的每個已定位的匹配文件的出現率。
440用戶是否想要選擇“過去的路徑”?此時,用戶必須確定是否要獲得與該用戶針對特定文件(即網頁或網站)而選取過的過去路徑有關的信息。這可以通過由用戶在用戶的顯示屏上選擇“過去的路徑,”選項來完成,以下將結合圖5進行進一步的討論。在用戶不想要針對合并的搜索結果中的任何脫機文件的“過去路徑”信息的情況下,處理流程繼續到步驟280。然而,如果用戶想要獲取針對特定脫機文件的過去的路徑,則該用戶在顯示屏上進行這種選擇,并且處理流程繼續到步驟450。
450選擇“最近的文件”或瀏覽器歷史。然后,本發明確定選定的“過去的路徑”是否駐留在“最近的文件”中或駐留在位于客戶端計算機上的瀏覽器歷史中。如果“過去的路徑”駐留在任一位置中,則對于用戶期望過去路徑信息的選定文件,本發明根據存儲在客戶端計算機上的信息確定用戶緊接在期望的過去路徑選擇文件之前和之后訪問了哪些文件。對所有識別出的之前和之后已訪問過的文件重復這一處理,從而生成一條路徑,該路徑重構了該用戶先前在過去的會話期間進行訪問的步驟和文件。處理流程繼續到步驟460。
460恢復和顯示歷史。將來自步驟450的已生成的過去路徑信息發送給搜索引擎。搜索引擎在以下操作時使用這一信息生成合并的聯機和脫機搜索結果(步驟270)以連同搜索結果一起顯示期望其過去路徑信息的選定文件,并向用戶顯示所重構的在客戶端計算機先前訪問該選定文件時用戶所沿循的路徑。期望其過去路徑信息的選定文件優選地引起用戶的注意,諸如通過高亮顯示該文件來引起用戶的注意。可以在搜索結果窗口中或在顯示屏上的單獨窗口中顯示這一重構的路徑。處理來到步驟270。
在發起本發明時,可以將搜索引擎顯示實現為具有若干新的選擇選項,作為顯示中的不同的窗口或作為菜單選項,諸如圖5中示出的那些。這些選擇選項可以包括使得用戶選擇他是否希望存儲在該用戶的客戶端計算機上的個人文件被搜索引擎訪問和結合到本發明的所呈現的合并的聯機和脫機搜索結果中的選項。例如,搜索引擎窗口可以包括用于由用戶選擇的“包括個人文件”選項510,以便使得可以在合并的聯機和脫機搜索結果中結合并且可選地高亮顯示該用戶的個人文件。作為替代,用戶可以選擇“不發送文件給搜索引擎”選項520,其防止用戶的個人文件被訪問和結合到所呈現的搜索結果中。當機密文件駐留在客戶端計算機上時,這一選項是期望的。
其他選項包括顯示在搜索引擎窗口上的“保護我的聯機文件”選項530、“包括過去的路徑”選項540以及“包括文件細節”選項550。“保護我的聯機文件”選項530使得用戶能夠通過“管理聯機訪問控制文件列表”532來控制和管理搜索引擎有權訪問哪些個人文件,并通過“管理要選擇的文件”534來區分對聯機文件的訪問控制。
當用戶期望與在先前的會話期間所沿循的過去路徑有關的信息時,該用戶可以選擇“包括過去的路徑”選項540。如上所述,這一選項使得搜索引擎能夠為用戶提供先前已訪問過的文件(即網站或網頁)的歷史或路徑,使得該用戶可以再次訪問期望的文件。在這樣做的過程中,可以將首選項設置為限制所生成的過去路徑歷史。例如,可以將搜索引擎顯示實現為具有用戶可以從中進行選擇的另外的選項,諸如“提供路線長度”542、“將歷史限制為搜索結果中的文件所屬的URL域”544等。
用戶還可以選擇選取“包括文件細節”選項550。這一選項向搜索引擎表明文件細節必須包括在本發明的合并的搜索結果中。該“包括文件細節”選項使得用戶能夠選擇該用戶希望在合并的搜索結果中查看哪些文件細節(例如,文件名、創建日期、文件大小、最后修改日期、最后訪問日期等),從而使得搜索引擎能夠根據用戶的首選項提供搜索結果。
本發明適合于結合聯機搜索系統和本地搜索系統以及在瀏覽器技術中使用。應當意識到,可以將本發明的組件具體體現為存儲在程序存儲設備上的計算機程序產品。可以將這些程序存儲設備設計為、制造為和用作利用光學元件、磁性元件和/或電子元件來執行本發明的特定方法步驟的機器的組件。這些程序存儲設備可以包括但不限于諸如磁盤或計算機硬盤驅動器、磁帶之類的磁介質,光盤,只讀存儲器(ROM),軟盤,半導體芯片,等等。可以采用以已知源代碼編寫的計算機可讀程序代碼來對在此描述的特定方法步驟進行轉換。
盡管已經結合特定優選實施例特別地描述了本發明,但顯然,根據前述描述,本領域的普通技術人員將容易想到很多替代性方案、修改和變型。因此,可以考慮到,所附權利要求
將涵蓋在本發明的實際范圍和本質內的任意這種替代性方案、修改和變型。
權利要求
1.一種用于生成搜索引擎搜索結果的方法,包括提供搜索引擎;將搜索查詢輸入到所述搜索引擎中;使用所述搜索引擎來對與所述搜索查詢有關的聯機文件進行定位;對駐留在客戶端計算機上的與所述搜索查詢有關的脫機文件進行定位;將所述聯機文件與所述脫機文件合并以生成單一的搜索結果概覽;以及在所述搜索引擎的顯示中提供所述單一的搜索結果概覽。
2.根據權利要求
1所述的方法,其中所述脫機文件包括先前已排序的駐留在所述客戶端計算機上的脫機文件,其中使用所述搜索引擎的評分算法對所述聯機文件以及所述先前已排序的脫機文件進行排序,以生成所述單一的搜索結果概覽。
3.根據權利要求
1所述的方法,其中所述駐留在所述客戶端計算機上的脫機文件包括來自先前的聯機會話的先前已訪問過的存儲在所述客戶端計算機上的聯機文件。
4.根據權利要求
1所述的方法,其中所述單一的搜索結果概覽中的所述脫機文件引起用戶注意,以便向所述用戶表明所述脫機文件駐留在所述客戶端計算機上。
5.根據權利要求
1所述的方法,還包括步驟使用唯一的標識符來標識所述客戶端計算機處的用戶;由所述搜索引擎利用所述唯一標識符訪問存儲在所述客戶端計算機上的所述脫機文件;對與所述輸入的搜索查詢有關的所述聯機文件和所述脫機文件進行定位;以及使用所述搜索引擎的評分算法來生成具有所述聯機文件以及所述脫機文件的所述單一的搜索結果概覽。
6.根據權利要求
5所述的方法,其中所述對所述脫機文件進行定位的步驟還包括確定所述搜索引擎是否愿意與所述客戶端計算機共享所述評分算法。
7.根據權利要求
6所述的方法,其中如果所述搜索引擎愿意共享所述評分算法,則確定所述客戶端計算機是否能夠執行所述評分算法。
8.根據權利要求
7所述的方法,其中如果所述客戶端計算機能夠執行所述評分算法,則所述方法還包括步驟將所述評分算法下載到所述客戶端計算機;使用所述所下載的評分算法根據與所述搜索查詢的相關度來對所述客戶端計算機上的所述脫機文件進行排序;將所述已排序的脫機文件存儲在所述客戶端計算機上;以及由所述搜索引擎獲取所述已排序的脫機文件以便生成所述單一的搜索結果概覽。
9.根據權利要求
8所述的方法,其中如果所述客戶端計算機不能執行所述評分算法,則確定所述脫機文件是否是從聯機源獲得的。
10.根據權利要求
9所述的方法,其中如果所述脫機文件是從所述聯機源獲得的,則所述方法還包括步驟對所述聯機源上的所述脫機文件的原始聯機文件進行定位;將到所述原始聯機文件的鏈接存儲在所述客戶端計算機中;由所述搜索引擎獲取所述原始聯機文件以便生成所述單一的搜索結果概覽。
11.根據權利要求
9所述的方法,其中如果所述脫機文件不是從所述聯機源獲得的,則確定所述搜索引擎是否將接受來自所述客戶端計算機的上傳文件。
12.根據權利要求
11所述的方法,其中如果所述搜索引擎接受所述上傳文件,則所述方法還包括步驟從所述客戶端計算機向所述搜索引擎上傳選定的文件;使用所述搜索引擎的所述評分算法根據與所述搜索查詢的相關度來對所述選定文件進行排序;在所述搜索引擎上生成到所述已排序的選定文件的唯一鏈接;將所述唯一鏈接存儲在所述客戶端計算機中;以及由所述搜索引擎獲取所述唯一鏈接以便生成所述單一的搜索結果概覽。
13.根據權利要求
6所述的方法,其中如果所述搜索引擎不愿意共享所述評分算法,則確定所述脫機文件是否是從聯機源獲得的。
14.根據權利要求
13所述的方法,其中如果所述脫機文件是從所述聯機源獲得的,則所述方法還包括步驟對所述聯機源上的所述脫機文件的原始聯機文件進行定位;將到所述原始聯機文件的鏈接存儲在所述客戶端計算機中;由所述搜索引擎獲取所述原始聯機文件以便生成所述單一的搜索結果概覽。
15.根據權利要求
13所述的方法,其中如果所述脫機文件不是從所述聯機源獲得的,則確定所述搜索引擎是否將接受來自所述客戶端計算機的上傳文件。
16.根據權利要求
15所述的方法,其中如果所述搜索引擎接受所述上傳文件,則所述方法還包括步驟從所述客戶端計算機向所述搜索引擎上傳選定的文件;使用所述搜索引擎的所述評分算法根據與所述搜索查詢的相關度來對所述選定文件進行排序;在所述搜索引擎上生成到所述已排序的選定文件的唯一鏈接;將所述唯一鏈接存儲在所述客戶端計算機中;以及由所述搜索引擎獲取所述唯一鏈接以便生成所述單一的搜索結果概覽。
17.根據權利要求
7所述的方法,還包括步驟將所述單一的搜索結果概覽發送給所述客戶端計算機;確定所述單一的搜索結果概覽中的選定脫機文件當前在所述客戶端計算機上是否可用;以及如果所述脫機文件可用,則將存儲在所述客戶端計算機上的先前已排序的脫機文件與來自所述單一的搜索結果概覽的所述選定脫機文件進行匹配。
18.根據權利要求
17所述的方法,還包括步驟獲取所述匹配脫機文件的過去路徑信息以便重構先前所沿循的路徑;將所述過去路徑信息發送給所述搜索引擎;以及生成所述單一的搜索結果概覽并顯示所述匹配脫機文件的所述過去路徑信息。
19.一種用于生成搜索引擎搜索結果的系統,包括運行在客戶端計算機上的第一組件,用于對先前已訪問過的存儲在所述客戶端計算機上的與所請求的搜索查詢有關的脫機文件進行定位;運行在搜索引擎上的第二組件,用于對與所述所請求的搜索查詢有關的聯機文件進行定位,并用于訪問所述與所述所請求的搜索查詢有關的已定位的脫機文件;運行在所述搜索引擎上的第三組件,用于將所述已定位的聯機文件和脫機文件合并為單一的搜索結果概覽,其中使用搜索引擎評分算法來對所述單一的搜索結果概覽中的所述已定位的聯機文件和脫機文件進行排序。
專利摘要
用于生成搜索引擎搜索結果的方法、系統和程序存儲設備。由搜索引擎對與所請求的搜索查詢有關的聯機文件進行定位,同時使用相同的搜索查詢來對先前已訪問過的駐留在客戶端計算機上的脫機文件進行定位。該搜索引擎從客戶端計算機獲取脫機文件并將這些脫機文件與已定位的聯機文件合并在單一的搜索結果概覽中。在該合并的搜索結果中文件的排列是使用搜索引擎評分算法根據與搜索查詢的相關度來排序的,使得該合并的搜索結果中的脫機文件優選地引起用戶的注意以表明這些文件駐留在客戶端計算機上。
文檔編號G06F17/30GK1996310SQ200710001506
公開日2007年7月11日 申請日期2007年1月4日
發明者蒂日斯·威爾布林克, 愛德華·E·凱利 申請人:國際商業機器公司導出引文BiBTeX, EndNote, RefMan