專利名稱:用于分析用戶的Web歷史的系統和方法
技術領域:
本發明通常涉及搜索和瀏覽計算機網絡系統的領域,特別是涉及 用于使用用戶信息來定制用戶的搜索和瀏覽環境的系統和方法。
背景技術:
搜索引擎通常響應由用戶提交的搜索查詢提供來自互聯網(或內 聯網)可被快速掃描的索引文檔源。隨著經互聯網可訪問的文檔的數 量增加,匹配特定查詢的文檔數量也可能增加。然而,從用戶的觀點 看,并非與該查詢匹配的每一文檔均同樣重要。用戶可能被搜索引擎 返回的龐大文檔量淹沒,除非基于與用戶查詢的相關度來排序文檔。 排序文檔的一種方法是PageRank(網頁排名)算法,在S.Brin和L.page 的文章"The Anatomy of a Large-Scale Hypertextual Search Engine"(第 七次國際萬維網會議錄,布里斯班,澳大利亞)和美國專利號 No.6,285,999中有全面的描述,二者內容在此引入作為背景信息。
隨時間流逝,用戶將會完成某種搜索查詢的歷史,所檢查結果, 所點擊的廣告以及反映用戶偏好和興趣的其他各種瀏覽活動。通常, 用戶可能有興趣檢查用戶的這種以前的活動。因此期望能夠允許用戶 使用以前的活動來增強用戶的搜索和瀏覽體驗。
發明內容
根據本發明的一些實施例,用于分析用戶的歷史活動的方法和系 統包括識別用戶的歷史活動的一部分以及由該部分來識別第一會話和 第二會話。對每一個會話,識別一個或多個分組。將第一會話中的所 識別的分組與第二會話中的所識別的分組相關聯。
結合附圖和本發明的下述詳細描述,將更清楚地理解本發明的上 述方面以及另外的方面,其中,相同的參考數字表示幾個附圖中的相 應組件。
圖1示例說明根據本發明的一些實施例的客戶機-服務器網絡環境。
圖2描述根據本發明的一些實施例,用于接收和存儲信息的過程。 圖3描述根據本發明的一些實施例,用于接收訂閱信息的過程。 圖4描述根據本發明的一些實施例,用于接收歷史或簡檔編輯信 息的過程。
圖5描述根據本發明的一些實施例,數據結構中的用戶記錄。 圖6描述根據本發明的一些實施例,用于處理歷史搜索査詢和將 信息與歷史日志進行匹配的過程。
圖7描述根據本發明的一些實施例,用于處理歷史搜索查詢的過程。
圖8A描述根據本發明的一些實施例,呈現用戶的先前歷史的一種
方法的示例性屏幕截圖。
圖8B描述根據本發明的一些實施例,呈現用戶的先前歷史的另一
種方法的示例性屏幕截圖。
圖9描述根據本發明的一些實施例,用于處理搜索查詢的過程。 圖IO描述根據本發明的一些實施例,呈現用戶的先前歷史的一種
方法的示例性屏幕截圖。
圖11描述根據本發明的一些實施例,在某時間段上的用戶的活動
的圖形顯示的示例性屏幕截圖。
圖12描述根據本發明的一些實施例,創建在某時間段上的用戶的
活動的圖形顯示的過程。
圖13描述根據本發明的一些實施例,識別喜好集的過程。 圖14描述根據本發明的一些實施例,修改排名值的過程。 圖15A描述用于根據本發明的一些實施例,將偏好位置的用戶集
與另一位置集結合的過程。
圖15B描述根據本發明的一些實施例,用于創建組合偏好位置集 的過程。
圖16描述根據本發明的一些實施例,用于管理瀏覽信息的多個源 的過程。
圖17示例說明根據本發明的一些實施例的客戶機系統。 圖18示例說明根據本發明的一些實施例的服務器系統。
具體實施例方式
允許用戶可以搜索和/或瀏覽用戶過去的搜索和/或瀏覽活動,以及 使用那些過去的活動來增強搜索結果集,以此來增強用戶的計算環境。 一些實施例與用戶信息數據庫中的用戶活動的收集和存儲有關。在一
些實施例中,活動(activity)可以是各類別型用戶活動的一個或多個, 包括但不限于把搜索查詢提交給搜索引擎,從搜索引擎選擇返回的 結果(如通過點擊),從搜索引擎選擇與這些結果一起返回的各種廣 告,選擇在搜索結果頁上呈現的其他信息項,瀏覽各種網頁或位置, 點進所瀏覽頁面上的廣告,查閱產品評論和經多種不同方式監視的其 他用戶瀏覽活動,或與各種客戶機應用有關的其他活動,諸如(但不 限于)即時消息傳遞、聊天室參與、電子郵件管理、文檔創建和編輯, 或任何泛化的歸檔活動(諸如統稱為"先前活動"的活動)。根據一 些實施例,使用所收集的歷史來創建一個或多個導出的信息段。
隨著用戶歷史信息的創建(以及當可用時還有導出信息),可以 用任意多種方式檢査信息,并且還可以使用歷史信息來修改用戶的搜 索和/或瀏覽體驗。根據一些實施例,使用用戶的先前活動來識別相對 于某些位置的用戶偏好(例如網站、網絡上的文檔等等)。使用這些
偏好來創建用于該用戶的排序的偏好位置集。在一些實施例中,可以 共享用戶的偏好位置和/或與一個或多個其他用戶合并。在一些實施例
中,可以圖示地顯示在指定時間段期間的用戶的先前活動。在一些實 施例中,使用用戶的先前活動來修改從文檔庫返回的搜索結果集。在 一些實施例中,可以使用用戶的先前活動來修改來自搜索引擎的結果。 例如,在搜索結果的順序中,可以把用戶先前已經訪問過的結果向前 移。在一些實施例中,相對于用戶的先前活動而應用的技術可以應用 于其他類型的活動。
圖1示例說明根據本發明的一些實施例的系統100,以及表示將在 下面的詳細論述中引用的各種功能組件。系統100可以包括一個或多
個客戶機102。每一客戶機102具有客戶機助理104、客戶機應用106 和客戶機存儲器108。客戶機102可以是用來可啟用(enable)上述活 動的多種設備中的任何一個(例如計算機、互聯網信息站、個人數字 助理、蜂窩電話、游戲設備、臺式計算機、膝上型計算機)。客戶機 102連接到通信網絡110。通信網絡IIO將客戶機102連接到搜索系統 112。搜索系統112包括連接到通信網絡110的查詢服務器114、用戶 信息數據庫116、其他數據庫117和查詢處理控制器118。
查詢服務器114包括均互連的客戶機通信模塊120、查詢接收、處 理和響應模塊122、用戶信息處理模塊124、偏好位置模塊126和歷史 模塊128。客戶機通信模塊120將查詢服務器114連接到通信網絡110 以及使得可從通信網絡110接收通信以及將通信提供給通信網絡110 界限,用于客戶機102或其他目的地。査詢接收、處理和響應模塊122 主要負責接收搜索查詢、處理它們,并且經客戶機通信模塊120將應 答返回給客戶機102。偏好位置模塊126幫助確定用于用戶的偏好位置 集,在一些實施例中,可能基于把用戶的偏好位置與用于一個或多個 用戶或組的偏好位置組合。歷史模塊128幫助允許用戶搜索和/或瀏覽 用戶的先前活動,以及能提供搜索結果或僅瀏覽,或組合來自更通用 搜索的其他結果。在一些實施例中,歷史模塊128基于用戶的歷史來 調整搜索結果的順序。用戶信息處理模塊124幫助訪問、更新和修改 用戶信息數據庫116。用戶信息數據庫116將有關上述用戶活動的各種 信息存儲在用戶記錄和/或客戶機記錄中。另外,用戶信息數據庫116 可以基于用戶的活動來存儲有關用戶的導出信息。其他數據庫117包 括與查詢服務器114中的各種模塊互連的其他數據庫,諸如消息數據
庫(電子的或其他的等),以及用戶創建的文檔數據庫(例如由字處 理程序、電子表格程序或其他各種應用創建的文檔)。
在一些實施例中,更少和/或另外的模塊、功能或數據庫包括在搜 索引擎110中。作為搜索引擎110的一部分,圖1中所示的模塊表示 在示例性實施例中執行的功能。
查詢處理控制器118連接到倒排文檔索引130、文檔數據庫132和 查詢高速緩存134。高速緩存134可以包括組件,諸如索引,其功能是 定位高速緩存中的緩存結果條目。倒排文檔索引130和文檔數據庫132 有時被統稱為文檔數據庫。在一些實施例中,"搜索文檔數據庫"是 指搜索倒排文檔索引130以識別與特定搜索查詢或詞語(term)相匹配 的文檔。
盡管圖1描述離散的各塊,但該圖是作為本發明的一些實施例的 功能描述,而不是功能要素的結構描述。本領域的技術人員能夠理解, 實際實現可讓這些功能要素在各種組件之間組合或拆分。例如,用戶 信息數據庫116可以是查詢服務器114的一部分。在一些實施例中, 用戶信息數據庫116可以使用一個或多個服務器實現,其主要功能是 存儲和處理用戶信息。類似地,文檔數據庫132可以實現在一個或多 個服務器上,其主要目的是存儲各種文檔。此外,圖1中的一個或多 個框中可以實現在設計成提供所述功能的一個或多個服務器上。盡管 這里的描述涉及在客戶機102中實現的某些特征和在查詢系統112中 實現的某些特征,但本發明的實施例不限于這些特性。例如,在此描 述的作為査詢系統112 —部分的特征也能在客戶機中整體或部分地實 現,反過來也是如此。
圖2示例說明可以用在本發明的一些實施例中的過程200,用于監 視和/或記錄用戶的各種活動。首先,可通過各種方法的任何一種監視 (202)用戶的活動,諸如通過整體或部分設計的、在客戶機102中本
地駐留的程序來偵聽或確定用戶的活動(例如客戶機助理104)。這種
程序也可以是客戶機應用106的一部分(例如瀏覽器、電子郵件程序、 即時消息傳遞程序)或可用作客戶機應用106的插件(例如從各種在 線源提供)。監視也能結合在遠離客戶機102的設備上運行的應用來 實現。例如,相對于所提供的特定服務(諸如搜索引擎或基于其他Web 或服務器的應用),服務器端程序可以接收全部或部分用戶的活動。 例如,服務器方的組件可以記錄在痩客戶機型設備上出現的活動。將 用戶被監視的活動從監視組件(例如客戶機助理104) (204)發送到 處理組件(例如搜索系統112) (206)。在一些實施例中,監視組件 和處理組件可以位于相同設備中。在這些情況下,發送和接收是可選 的。
確定源標識符(210)來識別所接收的用戶活動的源,從而可以與 用戶信息數據庫(例如用戶信息數據庫116)中可能存儲的適當標識符 相關聯。標識符可以與用戶和/或客戶機應用關聯。在一些實施例中, 客戶機應用標識符(例如cookie值)與該信息一起發送來識別客戶機 助理104的特定實例。在一些實施例中,可以經與登錄服務有關的用 戶標識符(ID)來識別用戶。在一些實施例中,搜索引擎服務允許用 戶將一個或多個標識符彼此關聯(例如用戶可以將客戶機助理104的 一個或多個實例與用戶標識符關聯)。在這些實施例中,用戶能使用 多個客戶機助理104 (例如一個在家一個在辦公室),需要或不需要登 錄到注冊服務。
然后確定用戶信息的數據類型(218),數據類型表示所接收的用 戶的事件活動的類型。例如,在一些實施例中,數據類型能是下述的 一個或多個,但不限于提交給搜索引擎的查詢、提交給Web服務的 請求、由搜索引擎提供的來自結果頁的搜索結果,或對這些搜索結果 的選擇(例如經點擊);廣告顯現(即,特定廣告是否呈現給用戶); 在以各種方式諸如在內容顯示上呈現或與其關聯的方式呈現的廣告上 的點擊(例如但不限于,搜索結果頁、電子郵件消息顯示、即時消息
顯示,或可以呈現或關聯廣告的其他內容);特定用戶已經與內容關 聯的信息(例如用于一個或多個査詢的注釋和/或標記、Web頁、Web 位置、鏈接、消息、文檔或其他內容);產品評論;或可以被監視的 任何其他用戶活動或事件(例如用戶的瀏覽活動、即時消息傳遞活動、 聊天室活動、與各種應用諸如Word處理的交互等等)。
在一些實施例中,為用戶提供以個人或集體的方式有選擇訂閱各 種數據類型中的每一種的機會。確定用于所識別數據類型的用戶訂閱 (subscription)信息(220)。如果用戶不訂閱在218確定的類型,則 處理可停止。例如,如果用戶不訂閱用于廣告點進的數據類型(即用 戶已經表示用戶不想記錄這類別型信息),那么如果在218確定了這 種數據類型,那么此時處理將停止。在一些實施例中,如果用戶還未 表示訂閱喜好,或如果無訂閱信息存在,那么識別缺省的訂閱值。在 一些實施例中,這種缺省訂閱簡檔保持增加而不是減少的有關用戶私 密性的量(例如不存儲信息)。在一些實施例中,用戶可以訂閱和/或 不訂閱來讀取和/或寫入特定數據類型。例如,用戶可以訂閱來讀取(即 已經存在的信息可以由各種應用讀取,諸如確定導出信息的那些), 但不訂閱寫入(即可以不記錄新信息)。在這種情況下,先前信息將 由各種應用(例如簡檔確定、搜索排名、導出數據)訪問,但將不記 錄新事件。
可選地,根據本發明的一些實施例,系統的一個或多個部分可以 提供相對于用戶活動的監視和/或記錄的"打盹"功能。基于某些標準, 打盹功能使用戶可禁用(disable)用戶活動的處理和/或記錄。作為替 換,打盹功還可一起禁止用戶活動的監視。在一些實施例中,打盹功 能在可以在由系統提供的時間段、從提供給用戶的列表中選擇的時間 段或由用戶手動輸入的時間段(例如5分鐘、2小時等等)內禁用用戶 活動的處理(或監視)。在一些實施例中,用戶可以設置在將來恢復 處理(或監視)的時間(例如下一日、下次啟動應用例如瀏覽器時)。 在一些實施例中,可設置處理(例如監視)在用戶的活動或非活動的時段后恢復。本領域的技術人員將容易想到其他可能性。打盹功能可
在客戶機102、在客戶機102、部分在客戶機102以及部分在搜索系統 112中實現。
在一些實施例中,打盹功能集成到訂閱條件中。例如,在打盹期 間,用于特定數據類型的打盹條件可以實現為訂閱條件的切換。艮p, 在打盹期間,如果用戶先前訂閱了數據類型,則該用戶可臨時不訂閱 該數據類型。在一些實施例中,用戶可以打盹如上所述的任何或所有 訂閱選項(即讀取和/或寫入任何數據類型)。因此,在一些實施例中,
用戶選擇打盹將導致在打盹時段中在220識別的訂閱條件的改變。
在一些實施例中,可以使用過濾器來防止記錄某些事件,盡管這 些事件是訂閱數據類型(222)的一部分。例如,過濾器可以識別屬于 特定主題或類別信息的事件(與數據類型無關),以及防止進一步處 理所述事件(如與成人內容有關的事件)。在一些實施例中,過濾器 標準可以由系統自動提供,或根據來自用戶的輸入確定,或是兩者的
妙A $口 PI o
如果對所確定的數據類型啟用了訂閱,并且不過濾事件,則更新 數據結構(例如用戶信息數據庫116)或在適當時增加新信息(224)。
在一些實施例中,從存在于用戶信息數據庫116中的其他信息(例 如在206接收的數據),導出與用戶有關并存儲在用戶信息數據庫116 中的一些信息。導出的信息值可以依賴于來自一種或多種數據類型的 一個或多個事件。如果確定一個或多個導出的信息值依賴于在206所 接收的信息的數據類型的全部或部分或從中導出,使用新信息可再次 導出受影響的導出信息值(226)。例如,在一些實施例中,根據用戶 提交給搜索引擎的搜索查詢的檢查,確定用戶簡檔的一個或多個部分 (例如類別的簡檔或對用戶有用的相關權重)。接收新査詢導致再次 導出受影響的簡檔信息以把新接收的査詢信息考慮在內。在一些實施
例中,接近實時地(例如接收后立即)導出這種導出信息。在一些實 施例中,定期地(例如每小時、每夜、或每周)導出導出信息。在一 些實施例中,什么時間導出信息依賴于特定導出值本身(例如較之其 他值更頻繁地導出對新信息更敏感的值)。在一些實施例中,其他觸 發器可能導致重新確定(例如用戶啟動的動作,系統刪除舊事件或導 出信息)。
在一些實施例中,用戶訂閱信息的變化將影響導出信息。在一些 實施例中,從已訂閱至未訂閱的訂閱條件的變化導致與該數據類型有 關的所有信息不可用。因此,在沒有該信息的情況下,重新導出所有 導出信息。在一些實施例中,從己訂閱到未訂閱的訂閱條件的變化防 止該數據類型的新信息影響所導出值(在未訂閱期間),但不導致在 訂閱變化前的信息不可用。因此,導出的信息值將保持其取值(保持 程度依賴過去的但現在仍然可用的值)。在一些實施例中,從未訂閱 到已訂閱的訂閱條件的變化導致與該數據類型有關的所有信息再次可 用。因此,利用可用信息可重新導出所有導出信息。在一些實施例中, 從已訂閱到未訂閱的訂閱條件的變化導致與該數據類型有關的所有信 息永久不可用。
圖3描述用于實現這些實施例的示例性過程300。接收訂閱信息,
表示用戶訂閱的修改(302)。確定特定數據類型(304),然后改變 用于該數據類型的訂閱條件(305)。如上所述,訂閱條件能影響該數 據類型的用戶信息數據庫116的讀出和/或寫入。確定以某種方式(直 接或間接)依賴于該數據類型的任何導出信息值(306)。然后,基于 更新信息,再次導出一個或多個這些受影響的導出信息值。在一些實 例中,訂閱變化將導致從值的導出刪除數據類型(即,在沒有該數據 類型的情況下重新計算導出值),以及在一些實例中,訂閱信息的變 化將允許一個或多個數據類型添加在導出中(即,利用該數據類型重 新計算導出值)。根據訂閱信息,修改與該數據類型有關的可用性條 件(310)。在一些實施例中,將與用戶已經訂閱的數據類型有關的事
件維持在信息數據庫116中。當用戶未訂閱該數據類型時,可用性條 件防止所選應用程序(諸如搜索某些數據的程序和確定所導出信息值 的程序)存取該數據類型。
在一些實施例中,用戶能添加、修改或刪除在數據類型之內或跨 各數據類型的一個或多個離散事件或信息段,或與用戶有關的其他信 息。例如,用戶可以從用戶歷史刪除搜索查詢。在另一例子中,用戶 可以提供更新的簡檔信息(例如提供新的感興趣領域、刪除感興趣領 域,或修改與特定感興趣領域有關的重要性值)。在另一例子中,在 一些實施例中,用戶可以提供或修改與特定項(例如查詢、統一資源 定位符("URL")或站點、廣告、電子郵件、產品評論等等)有關 的排名值。在一些實施例中,刪除事件導致刪除其他事件。例如,在 一些實施例中,刪除查詢導致刪除與該查詢有關的任何結果點擊或廣 告點擊。在一些實施例中,用戶可以刪除相關事件的組(例如按主題、 相關查詢集、相關結果點擊集等等關聯的事件)。然而,在確定一個 或多個導出值,可以全部或部分地使用受用戶動作影響的事件和/或信 息(例如過去的查詢和/或結果點擊可以用來確定用戶的簡檔或偏好位 置集)。在一些實施例中,事件和/或信息的修改或刪除觸發導出信息 的重新導出。
圖4描述用于對更新用戶信息(或者歷史、簡檔信息或其他)起 作用的示例性過程400。當識別用戶信息的編輯時(402),根據所接 收的信息,識別和修改任何直接受影響的事件和/或值(404)。識別任 何受影響的導出信息值(406)以及根據修改信息,再次導出該導出信 息值(408),在與上述類似的時間點(例如定期,接近實時或離線成 批),能重新導出受影響的導出信息。
圖5描繪根據本發明的一些實施例的來自用戶信息數據庫116的 示例性用戶記錄500。在一些實施例中,用戶信息數據庫116包含圖5 中所述的要素的子集或超集。用戶信息數據庫116包含將用戶信息數
據庫116中的某些信息與特定用戶或用戶標識符關聯的用戶標識符
502。在一些實施例中,用戶標識符502與客戶機應用的特定實例關聯。 在一些實施例中,用戶標識符與用戶關聯。能與用戶關聯的一些信息 包括基于事件的數據504、導出數據506和額外數據508。基于事件的 數據504包括一個或多個事件,分別具有與其相關聯的數據類型。在 一些實施例中,基于事件的數據包括 一個或多個查詢510、 一個或多 個結果點擊512 (即用戶所點擊的存在于搜索結果集中的結果)、 一個 或多個廣告點擊514 (即用戶所點擊的呈現給用戶的廣告)、 一個或多 個瀏覽數據516(例如用戶訪問的位置,例如URL,用戶瀏覽的圖像), 以及一個或多個產品事件517 (例如搜索產品評論)。每一基于事件的 數據504包括與該事件有關的一個或多個要素。例如,在一些實施例 中,基于事件的數據504中的事件包括eventlD518和時間戳520的任 何一個或兩者。在一些實施例中,eventlD518是與可以由搜索系統分 配的與特定事件有關的唯一標識符(例如64位二進制數)。時間戳518 是表示創建基于事件的數據504中的特定事件記錄或發生特定事件的 日期和/或時間的值(例如64位二進制數)。
在一些實施例中, 一個或多個查詢事件510、 一個或多個結果點擊 512、 一個或多個廣告點擊514和一個或多個產品事件517包括查詢部 分520,其包括與所記錄事件有關的零個或多個查詢詞語。在一些實施 例中,所述查詢部分表示與事件有關的查詢串(例如何種查詢產生用 戶點進的結果)。在一些實施例中,查詢部分520包括與結果點擊或 廣告點擊有關的指針或標識符(例如eventID)。在一些實施例中,查 詢部分520可以另外識別"相關查詢"。例如,相關查詢可以是與包 含拼寫錯誤的初始查詢有關的查詢。在一些實例中,更期望將事件與 改正的查詢相關聯,而不是與包含拼寫錯誤的查詢相關聯。在一些實 施例中,搜索系統112可以基于用戶輸入查詢自動生成"相關查詢"。
在一些實施例中, 一個或多個結果點擊512、 一個或多個廣告點擊 514和一個或多個瀏覽數據516包括contentID 522,用于標識與特定事
件相關聯的內容。例如,在一些實施例中,廣告點擊事件514中的 contentID 522表示特定廣告的唯 一標識符以及在 一些實施例中, contentID 522識別與廣告有關的著陸頁面。對結果點擊512, contentID 能表示已經由用戶點擊的URL。對瀏覽事件516, contentID 522能是 用來識別瀏覽事件的位置的內容標識符(例如URL、數據位置或其他 類似的標識符)。在一些實施例中,contentID 522可以是識別文檔庫 中文檔的文檔標識符。
在一些實施例中,基于事件的數據具有歷史得分525。事件歷史得 分525可以用各種不同的方法或方法組合來計算。例如,歷史得分525 可以是根據自從記錄該事件以來已經過去的時間長度定期修改的基于 時間的排名值。在一些實施例中,歷史庫的值隨著從記錄開始的時間 增加而減小。在一些實施例中,可以刪除那些其基于時間的排名值低 于某個閾值的事件數據。能在各種時間點定期地確定和重新確定這些 值。在一些實例中,如上所述,刪除一個或多個事件觸發重新確定一 個或多個導出值。在一些實施例中,不是在批量或離線處理期間來確 定,而是響應請求來確定歷史得分525。
在一些實施例中,瀏覽事件516表示與查詢無關而是與一些其他 用戶活動有關的特定瀏覽事件。該其他用戶活動能在信息字段526中 識別。例如,在電子郵件會話期間呈現和點進廣告(例如通過Google Gmail服務)將不一定具有與其有關的查詢,但它仍然對跟蹤用戶的廣 告點進活動有用。因此,在信息字段526中識別用戶事件和相關活動。 在一些實施例中,信息字段526存儲與事件有關的排名值。該排名值 能是系統生成、用戶創建或用戶修改(例如用于URL的PageRank,由 用戶分配給該事件的值)。用戶活動的其他例子包括但不限于即時消 息傳遞、字處理、聊天室參與、軟件應用執行和互聯網電話呼叫。
在一些實施例中,導出數據506包括一個或多個信息字段528,包 含從基于事件數據504導出的信息。例如在一些實施例中,信息字段
528表示由一個或多個用戶査詢事件510、結果點擊事件512、廣告點 擊事件514和瀏覽事件516生成的用戶簡檔。例如,通過檢查各種事 件的一個或多個,可以創建用戶簡檔,表示在各種主題類別中感興趣 的級別(例如Open Directory Project主題的加權集(http:〃dmoz.org))。
在一些實施例中,導出數據506包括根據某個用戶社區中一個或 多個用戶整體或部分導出的數據。例如,可以導出用于該用戶社區的
用戶簡檔。
在一些實施例中,導出數據506包括與特定contentID 534有關的 一對或多對得分532。得分532表示分配給與contentID 534(例如網頁) 有關的內容的導出得分。得分532可基于多種不同因素的一個或多個。 在一些實施例中,得分532結合在某個時間段內用戶在該contentID點 擊的次數(根據搜索查詢和/或瀏覽活動,可以包括點進數)。在一些 實施例中,得分5 3 2包含用戶查看該內容所用的估計時間(停留時間)。 在一些實施例中,得分532包含自用戶上次瀏覽該內容以來的時間。 在一些實施例中,得分532可以基于用戶活動來修改。在一些實施例 中,如果為用戶呈現一系列搜索結果中的內容,但不能從結果頁選擇 該內容,則對得分532有負面影響。在一些實施例中,當用戶訪問與 內容類似的位置或頁面或點擊結果時,則對得分532有正面影響。通 過各種公知的技術(例如文本分類器、ODP分類、鏈接結構、URL、 編輯間隔等等),可確定相似性。在一些實施例中,將站點定義為邏 輯相關頁面組,或物理相關頁,諸如屬于相同URL或相關各URL的 頁面。在一些實施例中,得分532包含對其呈現該內容的用戶的過去 查詢數(例如將特定內容呈現給該用戶的較高次數與較高得分532關 聯)。在一些實施例中,得分532包含對其呈現相關內容的用戶的過 去查詢數(例如,根據用戶查詢結果,相關內容呈現給該用戶的較高 次數與較高得分532關聯)。在一些實施例中,導出數據506包括累 計得分。例如,相同查詢可以多次由用戶生成,以及在一些實施例中, 每一發生將具有不同的eventID。因此,在一些實施例中,對出現多次
的事件,保持總得分。通過各種不同的方法,計算總得分。能將多個 事件和總得分的參考值保持在導出數據506中。
在一些實施例中,額外數據508包括關于用戶的更多信息,這些 信息不一定表示在基于事件的數據504或導出數據506中(例如在一 個或多個信息字段530)。例如,在一些實施例中,用戶可以用可由用 戶使用的關鍵字注釋一個或多個URL、網頁或搜索査詢以提供有關 URL、網頁或查詢的某些信息。例如,用戶可以添加表示特定URL有 用或屬于用戶感興趣的某些信息的關鍵字。在一些實施例中,可以相 對于注釋、單獨或結合其他信息來運行用戶搜索。信息字段530可以 識別其所屬的注釋和信息(例如事件標識符、內容標識符)。在一些 實施例中,用戶可以表示用戶感興趣的某些主題,這些主題可以存儲 在信息字段530 (例如簡檔部分)中。在一些實施例中,用戶可以在信 息字段530中表示用于特定事件(例如查詢、URL、站點、廣告)的 用戶修改的排名值。在一些實施例中,用戶可以在信息字段530中表 示將對照來自另一用戶的優選內容集應用的加權函數、用戶社區或用 戶感興趣的特定主題。能使用這種加權函數來將用戶優選內容集與來 自另一用戶的優選內容集、用戶社區或與用戶感興趣的特定主題有關 的內容集結合。在一些實施例中,與特定的基于事件的數據有關的信 息可以位于"其他"字段524中并與基于事件的數據504中的各個事 件一起存儲。在一些實施例中,額外數據508包括一對或多對 querylD538和識別哪一結果與特定査詢有關的結果540(例如與用戶查 詢有關的contentID)。在一些實施例中,結果540表示將哪些結果呈 現/顯示給用戶。
用戶信息數據庫116 (連同其他數據庫117)能用來提供多個不同 的特征。例如,在一些實施例中,用戶信息數據庫116中的信息允許 用戶對用戶的先前歷史執行搜索或瀏覽(例如查詢、廣告)。圖6描 述根據本發明的一些實施例用于搜索用戶歷史的示例性過程600。接收 搜索查詢(602),包含全部或部分相對于用戶歷史運行的一個或多個
搜索詞語。在一些實施例中,歷史包括先前提交的查詢。在一些實施 例中,歷史包括相對于先前查詢訪問的文檔(例如結果點擊數)。另 外,在一些實施例中,歷史包括這二者的組合。在一些實施例中,歷 史包括其他事件,如廣告點擊,以及在一些實施例中不必或不直接與 特定查詢有關的通用瀏覽信息包括在用戶搜索歷史中。在一些實施例 中,允許用戶相對于運行該搜索的歷史選擇各個部分(或其組合)。
根據運行該搜索所相對的歷史的部分,識別用戶和用戶信息數據 庫116中的用戶信息。可以基于包括在搜索查詢中的信息,諸如來自 注冊服務的cookie標識符和/或用戶標識符,識別用戶。在一些實施例 中,通過檢查與特定用戶標識符502有關的用戶信息數據庫116的那 些事件504來識別用戶信息。在一些實施例中,檢查來自導出數據506 的信息和/或額外數據508。
然后,根據感興趣的搜索查詢和數據類型,搜索相關用戶信息來 查找匹配事件和/或相關事件。可以修改搜索查詢(例如通過擴展、修 改、添加或刪除查詢詞語),以識別額外的匹配信息或相關信息。可 以在某些搜索詞語上執行非常公知的詞干操作(包括單數詞的復數形 式)。可在搜索查詢中校正(添加)明顯拼錯的詞語。通過多種非常 公知的搜索技術的任何一種來識別匹配和/或相關事件。例如,可以將 事件處理為項的矢量,并且可基于在該項矢量和由查詢創建的矢量之 間的矢量距離來確定相關性,由此產生查詢得分。較高查詢分對應于 相關性的一種度量(例如較高的查詢分表示與該查詢的較高相關度)。 根據各種標準,可以排序和/或分組相關項。在一些實施例中,返回多 個事件類型(例如查詢和廣告),能一同可選地分組(608)。例如, 在一些實施例中,搜索產生先前查詢列表和用戶先前己經訪問過的廣 告列表。在一些實施例中,與所識別廣告不同地呈現所識別查詢(例 如在結果窗的不同部分中)。在一些實施例中,還返回按搜索査詢結 果訪問的位置并根據產生該結果的査詢來分組(例如結果點擊)。本 領域的技術人員將易于意識到能相對于用戶信息數據庫116中的任一
或所有信息,有選擇地運行搜索。
可以根據各種排名標準,排序所識別的事件和Z或信息。在一些實
施例中,根據重要性因素(例如PageRank值)對URL排名。在一些 實施例中,根據先前查詢匹配與所提交的査詢的接近程度和相關程度 (例如通過兩個查詢之間的編輯距離)來排序查詢。在一些實施例中, 同時使用多種排名標準。例如,當返回并同時分組査詢和結果點擊時, 能根據前一查詢的提交距今有多近來排名査詢,以及能根據它們各自 的PageRanks來排名與各種查詢有關的各個結果點擊。可以為用戶提 供各種不同的選項,用于搜索用戶歷史。本領域的技術人員將易于意 識到排名和事件類型的各種組合落在本發明的實施例的范圍內。例如, 下面提供各種組合。最后將排序的響應提供給客戶機(612)。
圖7描述根據本發明的一些實施例的用于搜索先前歷史的示例性 過程700。接收歷史搜索查詢(702),包含一個或多個搜索詞語。在 一些實施例中,還發送信息,表示將運行何種歷史搜索和/或將如何呈 現結果。在一些實施例中,信息指定該搜索將相對于何種數據類型(一 個或多個)運行(諸如過去的查詢、過去的廣告點擊、過去的廣告點 擊與查詢、過去的瀏覽)。在一些實施例中,該信息指出了合成或分 組的等級以應用于返回結果。例如,査詢(以及相關點擊結果)能基 于特定用戶會話或跨多個會話來分組(即在搜索或瀏覽會話內,彼此 相關的查詢分組在一起)。可以由多種已知的聚類技術(例如相關詞、 時間關系、與某主題有關的査詢)來識別來自用戶先前査詢的相關查 詢。同樣地,能根據各種標準來分組結果點擊和/或瀏覽事件。
然后從所接收的查詢(704)識別查詢相關信息。在一些實施例中, 該相關信息表示査詢所屬的一個或多個主題(例如,諸如在Open Directory Project (http:〃dmoz.org/)中所找到的)。在一些實施例中, 使用該查詢信息來幫助從用戶信息數據庫116中的用戶信息搜索相關 信息。例如,在一些實施例中,搜索基于主題而不是基于實際査詢詞
語,以及在一些實施例中,能同時使用査詢詞語和主題。
根據一些實施例,將瀏覽會話定義為有界時間段,在該時間段內 用戶執行一系列相關或不相關搜索和/或瀏覽活動。例如,能將瀏覽會 話定義為天,或可能定義為兩個更長無活動時段之間的搜索或瀏覽活 動的時段。在許多實例中,在會話期間,時間上關聯的用戶活動也傾 向于主題相關(例如在午飯后的一定時間段中,用戶搜索有關食物中 毒的信息)。在一些實施例中,能按其他標準定義瀏覽會話。在一些 實施例中,特定瀏覽會話期間的相關査詢被標識為查詢會話(706)。 在本說明書中此處和其他地方,應理解到,當識別査詢時,可以識別 與那些查詢有關的其他事件(例如結果選擇、廣告選擇)。另外,通 過根據可以或可以不與查詢關聯的其他標準(例如用戶檢査哪些是與 體育相關的位置),通過關聯,將各種事件分組為瀏覽會話的一部分。 在一些實施例中,從一個瀏覽會話中識別的查詢會話可以與識別為相 關、來自一個或多個其他瀏覽會話的一個或多個查詢會話組合,以形 成會話組。在一些實施例中,査詢會話和會話組的識別離線地發生, 并且有關查詢會話和會話組的信息存儲在用戶信息數據庫116(例如導 出數據506)中。在一些實施例中,當用戶對照用戶歷史信息來提交搜 索查詢時,發生識別。在一些實施例中,能創建分組信息并臨時保存 特定時長(如一天)。頻繁的會話識別和處理使得包括最近提交的査 詢和其他信息。在一些實施例中,在一些固定(例如用戶首次使用該 服務)或定期(例如每月)的時間點,創建初始查詢會話和會話組標 識,然后基于更近的瀏覽活動,進行增量式修改。在一些實施例中, 類別與查詢會話或會話組有關,諸如一個或多個Open Directory Project 主題。
然后識別相關査詢會話或會話組(708)。在一些實施例中,通過 將搜索查詢應用于全部或部分在査詢會話和/或會話組中包括的信息 集,來識別相關查詢會話或會話組。包括在査詢會話中的信息集包括
但不限于 一個或多個查詢、査詢類別、事件描述、事件(例如結果
選擇、廣告選擇)、與事件相關聯的文本(例如URL文本、文本片斷
等等),以及與事件相關聯的內容(例如位于URL上的內容、廣告的
著陸頁面)。如果該查詢對照其運行的查詢會話的任何部分與搜索查 詢有關,那么搜索會話是用于呈現給用戶的候選。在一些實施例中, 當識別特定査詢會話時,根據結果,所識別的查詢會話所屬的整個會 話組變為用于呈現給用戶的候選。用于呈現的候選根據各種排名標準
排序(710)。在一些實例中,在響應增中僅提供排名最高的N個候選, 其中,N是基于各種系統特征選擇的整數。排名標準能基于任意多個 因素,諸如查詢會話(或會話組)中的識別信息相關度或與歷史搜索 查詢匹配度。排名也能基于查詢會話的時間/日期值(即根據會話的日 期/時間,排序查詢會話和/或會話組)。在一些實施例中,通過包括在 會話組中的最近査詢會話的日期/時間值來處理會話組。
在一些實施例中,排序查詢會話和/或會話組內的信息(712)。在 一些實施例中,分組事件類型,并且特定事件類型內的排序基于各種 排名標準。在一個例子中,根據與歷史搜索結果的相似度來分組和排 名查詢會話中的查詢,以及根據URL的PageRank來分組和排名查詢 會話中的結果點擊。在另一例子中,根據提交查詢時間的遠近來排名 查詢會話中的查詢,并且根據基于點擊的內容與歷史搜索査詢的相關 和/或匹配程度的查詢得分來排名查詢會話中的結果點擊。在另一例子 中,根據由其他用戶或用戶社區提供的排名,排名結果點擊。在一些
實施例中,通過査詢會話排序會話組內的信息,其中,査詢會話的排 序可以基于任意多個標準。在一些實施例中,使用上述排序技術的任 何一個,在不參考單個査詢會話的情況下,排序會話組內的事件信息。 本領域的普通技術人員將易于意識到在不背離本發明的方法的情況 下,排序該信息的其他方法。在排序后,將N個最高排名結果返回給 搜索請求者(714)。在一些實施例中,以多個更小頁為單位,將結果 呈現給用戶,每一頁單位包含總候選的子集。所述的技術易于擴展到 不包括查詢的分組(例如相關位置、相關廣告)。
在一些實施例中,為用戶提供查看與顯示給用戶的各種項(例如 查詢、結果、廣告)有關的信息的機會。例如,用戶可以選擇與作為 搜索請求的一部分返回的結果有關的鏈接或圖標(相對于文檔庫和/或 相對于用戶的歷史運行)。選擇鏈接或圖標導致系統識別和返回與該 項有關的信息。例如, 一些實施例中,為用戶提供與被選項類似的其 他項。在一些實施例中,用于查詢的相關信息包括在該查詢前提交的 三個査詢和之后的三個。在一些實施例中,選擇用于相關信息的結果 點擊導致產生將顯示的結果的其他查詢(由用戶和/或其他人提交)。
圖8A和8B根據本發明的一些實施例,提供查詢會話和會話組的 示例性屏幕截圖。參考圖8A,窗口 802包括三個查詢會話804、 806 和808。如圖8A所示,按日期(例如日期810)分組查詢會話,盡管 其他分組也是可能的。在查詢會話804內,為查詢部812和結果部814。 查詢部812包括在查詢會話期間提交的一個或多個相關查詢(如上確 定)。結果部814包括用戶點進的零或多個結果。結果部814也可以 包括表示用戶該天訪問該結果的時間的訪問時間816。在一些實施例 中,查詢部812包括相關歷史鏈接818,當由用戶選擇時,將產生待顯 示的與查詢會話S04有關的零或多個查詢會話。相關查詢會話可以來 自査詢會話804的日期或可以來自其他日期。因此,為用戶提供用于 可以包括來自不同日子的查詢會話的相關查詢集的查詢/結果歷史。圖 8B示例說明示例性會話組顯示,其中,可以例如通過選擇相關歷史鏈 接S18而產生其一部分。如圖8B所示,窗口 820包括兩個會話組S22 和824。在一些實施例中,會話組822和824通常不相關。在這些實施 例中,如果它們相關,它們將在相同會話組中(確定為相關)。會話 組822包括查詢部826和結果部828。查詢部826包括確定相關的査詢 會話中的那些查詢(如上所述)。由于結果部828中的結果可以包括 在多個不同日子檢查的結果,結果部828包括訪問日期830,表示最后 一次訪問該結果的日期。在一些實施例中,包括用戶已經訪問該結果 的次數。在一些實施例中,該數量包括用戶所做的任何瀏覽。在一些 實施例中,結果部包括不與該査詢會話相關但基于位置的內容而確定
相關的位置。在一些實施例中,會話組包括其他相關信息。
在一些實施例中,用戶可以瀏覽用戶的歷史。來自該歷史的信息 可以用任意多種方式顯示。例如,用戶可以按日期、按主題或按頻率 顯示歷史。在一些實施例中,如上所述顯示查詢會話和/或會話組。在 一些實施例中,如上所述,按會話和/或會話組來顯示相關事件組。例 如,用戶歷史的基于主題的顯示將顯示與特定主題有關的查詢會話和 會話組。應該注意,上述關于搜索的技術易于應用于瀏覽用戶歷史。 例如,請求按組顯示用戶歷史與生成所有查詢組匹配的搜索類似。
本發明的一些實施例能修改那些不同于主要是用戶先前活動的搜 索的用戶搜索體驗。圖9描述用于基于在用戶信息數據庫116中存儲 的用戶歷史行為來調整搜索結果集的過程。首先,由相對于文檔庫運
行查詢的搜索引擎(904)來接收搜索查詢(902)。在接收結果后(906), 根據來自用戶歷史的信息,調整搜索結果(908)。在一些實施例中, 調整搜索結果的順序。在一些實施例中,搜索結果集中的用戶結果的 存在或不存在受用戶信息數據庫116中的用戶歷史影響(例如可以將 存在于用戶歷史中的結果添加到呈現給用戶的結果集)。在一些實施 例中,根據歷史得分525和/或任何用戶修改的結果得分調整搜索結果 的順序。在一些實施例中,結合搜索結果得分和歷史得分以及基于組 合得分,重新排序搜索結果集。
在一些實施例中,向用戶提供先前訪問過的位置的表示(例如URL 結果),與是否記錄搜索結果無關。表示的例子包括但不限于提供有 關或接近用戶先前已經訪問過的單個搜索結果的可視和/或文本指示 器。在一些實施例中,指示器包括最后一次訪問的日期和/或時間。在 一些實施例中,指示器包括在某一時間段內(例如三個月)用戶已經 訪問該網站的次數。
在一些實施例中,在搜索結果之上的區域中,顯示用戶先前已經
訪問過的M個最高排名的結果(例如三個)。在其他實施例中,在顯 示器的其他預定區域或單獨的窗口中,顯示這些結果。在一些實施例
中,根據各種排名標準(例如歷史得分、PageRank、最后一次訪問時 間、訪問次數),排序M個先前訪問過的位置。在一些實施例中,M 個先前訪問過的位置不包括在搜索結果集內(即,從該集合刪除它們 并在它們自己的區域中顯示)。在一些實施例中,不在搜索結果的當 前頁上的M個先前訪問過的位置顯示在當前頁的預定區域中。前述的 另外的實施例的一些中,可以與搜索結果一起,顯示査詢會話和/或會 話組,并相對于圖7,如上所述排序。
在一些實施例中,在搜索結果集中,對過去已經呈現給用戶并且 用戶已經點擊的搜索結果給予更高的評價。在一些實施例中,除或代 替特定搜索結果的過去呈現和點擊外,還考慮用戶的瀏覽事件。例如, 在一些實施例中,先前由用戶訪問過的位置將具有提高的得分,其中, 提高的幅度與用戶已經訪問該位置的次數有關。相反,在一些實施例 中,在搜索結果集中,降級對先前呈現給用戶但未點擊的搜索結果的 評價。
在一些實施例中,不重新排序搜索結果集,但使用歷史得分,諸 如歷史得分52,來確定是否利用可視指示(例如彩色、高亮)提供結 果。例如,用黃色標記具有高得分的結果,以及用黃色和粗體標記具 有超高歷史得分的結果。
在一些實施例中,如果用戶已經訪問或點擊來自相關網站或網頁 的結果,在排序中,把該結果在搜索結果順序中的位置升得更高。
在一些實施例中,過去査詢也會影響搜索結果順序中的文檔的位 置。例如可考慮檢索(或關聯)指定結果的過程查詢的數量(以及它 們多久前出現等等)。例如,可提高對與大量查詢有關的結果的評價。
在一些實施例中,使用用戶的歷史來識別另外的搜索結果。例如, 不在當前檢索集中但由類似査詢所檢索的用戶歷史中的結果可添加到 搜索結果集。在一些實施例中,在與初始識別的搜索結果集不同的不 同屏幕區中,放置另外的結果。
在一些實施例中,通過建議另外的査詢,調整搜索結果。例如, 建議由用戶先前提交的類似查詢。能以許多方式計算査詢相似性(例 如編輯距離、詞干操作、先前拼錯字的校正、語義映射、檢索文檔集 的相似性。)
在一些實施例中,在相同查詢會話或會話組中,根據緊接著在所 述查詢的前后提交的用戶歷史,建議査詢。
在一些實施例中,跨各文檔源庫來應用上述技術。例如,當用戶 發出Web搜索并且在過去已經對產品評論執行了類似搜索,則為用戶 提供在產品評論庫運行查詢的選項。在一些實施例中,呈現來自產品 評價庫的最頂部結果(例如三個)。
在一些實施例中,基于各種標準和/或使用在用戶信息數據庫116 中可用的信息,為用戶提供過濾結果的能力。例如,用戶能刪除先前 未查看的呈現結果。在另一例子中,用戶能請求查看自用戶最后一次 執行該查詢或訪問該結果網站以來,內容已經改變的結果。
圖IO是示例說明在窗口 1002中,從用戶的歷史找到的結果的示 例性屏幕截圖。窗口 1002包括用戶輸入搜索查詢(例如"普林斯頓") 的査詢文本框1004和用戶選擇開始搜索的搜索按鈕1006。在兩個區域 中返回結果歷史區1008和主結果區1010。示例性歷史區包括歷史結 果1012。歷史結果1012包括與結果的位置的鏈接1014、頻率指示器 1016和日期指示器1018,分別表示用戶已經訪問該位置的次數和最后 一次訪問的日期。在主結果區1010中,通過附帶日期指示器1020,示
例說明結果中的一個。在一些實施例中,如果適當的話,在主結果區 1010中,提供一個或多個頻率指示器,諸如頻率指示器1016。在一些
實施例中,與一個或多個結果一起,將"相關信息"鏈接1022包括在 歷史區1008和/或主結果區1010中。當用戶選擇"相關信息"鏈接1022 時,系統通過為用戶提供與結果有關的信息來響應。在一些實施例中, 相關信息包括但不限于下述的一個或多個生成結果的查詢(來自用 戶和/或其他人);用于該位置的用戶訪問信息以及過去由該用戶訪問 過的類似頁。
在一些實施例中,可以表示用戶先前訪問過的廣告。在一些實施 例中,用與結果選擇類似的一個或多個方式,表示這些廣告,如上所 述。在一些實施例中,允許用戶搜索用戶的過去廣告選擇,與先前的 搜索查詢和/或結果選擇無關。
根據本發明的一些實施例,可以向用戶圖示地提供用戶的搜索歷 史。圖11提供一個示例性圖形顯示1100。顯示畫面IIOO包括以時間 1104為子單位(例如天)在某時間段1102 (例如月)內搜索活動的可 視指示器,以及可視指示器的鍵1106。在顯示1100中,與時間的子單 位有關的顏色的強度(或灰度級)對應于該子單位內的搜索活動的量 (例如較高強度表示比較低強度更多的活動)。在一些實施例中,使 用多種不同的可視特色指示器,分別表示搜索活動的特色或互斥強度 級。例如, 一種可視特色指示器將對應于等于零至100個事件的搜索 活動的排名和/或事件的加權組合,以及另一可視特色指示器將對應于 等于101至1000事件的搜索活動的排名和/或事件的加權組合等等。在 一些實施例中,在條形圖中,可視特色指示器能是矩形,其高度或寬 度與搜索活動的排名有關。在一些實施例中,可視特色指示器的大小 與搜索活動的排名有關。在一些實施例中,使用不同的顏色來表示多 種可視特色指示器的每一個。本領域的普通技術人員將意識到可視顯 示用戶搜索活動的量的其他方法,而不背離本發明的范圍(例如使用 不同顏色而不是顏色強度)。在一些實施例中,用戶可以選擇將生成
圖形顯示的數據類型或事件(例如査詢、廣告、結果點擊、訪問過的 內容位置)
在一些實施例中,用戶可以通過點擊用于該時間子單位的可視特 色指示器,選擇和擴展用于時間子單位的可視特色指示器。這種選擇 導致時間的子單位的擴展視圖。在一些實施例中,選擇導致將被選子 單位用作時間顯示的新單位以及將新時間單位的子單位用作顯示的子 單位的另一圖示表示。在一些實施例中,擴展視圖是用于被選時間單 位的搜索活動的列表和/或分組。例如,當被選時間單位為天時,從顯 示選擇該天用作擴展導致用于該天的用戶搜索活動的列表和/或分組。 搜索活動能以各種不同的方式顯示。例如,在一些實施例中,根據類 型,顯示搜索活動(例如查詢、結果選擇、廣告選擇、產品評論、所 瀏覽的網頁)。在一些實施例中,顯示能包括用戶先前歷史活動的各 種顯示,如上所述。
圖12描述根據本發明的一些實施例用于生成用戶的歷史的圖形表 示的過程1200。接收用于圖形顯示的請求(1202)和識別用戶的歷史 (1204),對每一時間單位(例如月)識別用于每一時間的子單位(例 如天)的事件數(1206)以及創建事件時間段(1208)。最后,將時 間段顯示提供給用戶(1210)。
在一些實施例中,提供圖形顯示歷史活動量的其他方法。在一些 實施例中,通過各種標準(例如,查詢相似性、內容相似性,或事件 類型),過濾用來創建圖形顯示的事件。換句話說,圖形顯示能顯示 用于任意多個活動的活動量。在一個例子中,在創建顯示中,選擇僅 與所輸入的查詢相匹配和/或與所輸入的査詢相似的那些查詢。因此, 用戶能輸入特定査詢,以及根據圖形顯示可視地確定在哪些天用戶在 搜索與所輸入査詢相類似的查詢。在一些實施例中,可視指示器可以 表示某天的査詢與所輸入查詢的匹配程度(例如用顏色)。在另一例 子中,通過事件類型過濾事件。在一些實施例中,為用戶提供選擇可
以顯示的各種項(查詢、結果、查詢會話、會話組、廣告、產品評論、 瀏覽事件)中任何一個的能力;這些選擇將使用被選項來創建圖形顯 示,以過濾歷史數據。在一些實施例中,將加權函數應用于各種事件 類型來確定用于指定時間單位的活動量。因此,在這些實施例中,活 動量和事件之間不一定存在一一對應。例如,在一個實施例中,每一 結果點進分配加權值1.0,以及每一廣告點進分配加權值0.5。根據修 改的加權,代表性的活動量是累計這些事件。在一些實施例中,能將 來自其他數據庫117的信息添加到可用于圖形顯示的信息集。例如,一 些實施例中,用戶能查看與特定主題有關的電子郵件和/或消息的量。 在一些實施例中,將多個圖形顯示提供給用戶(例如基于過濾標準的 一個,以及基于總活動的一個)。在一些實施例中,多個圖形顯示可 以彼此圖形地對齊。
在一些實施例中,用戶信息數據庫116用來將偏好位置集提供給 用戶。根據用戶的先前訪問來識別偏好位置集,并根據各種標準排序。 在一些實施例中,用戶的偏好位置集包括一個或多個廣告。在一些實 施例中,用戶具有僅包括偏好廣告的集合。用這種方式,用戶不需要 記住清楚地將內容位置(例如位置、廣告)區分為偏好的或喜愛的, 因為系統將隱含地識別用戶的偏好位置。在一些實施例中,為用戶提 供各種方式來修改單個或組排名,用于識別偏好位置類型或影響選擇 和排序。在一些實施例中,可以用各種方式,將用戶的偏好位置集與 其他偏好位置集,諸如來自其他用戶、用戶組、相關的被選感興趣主 題或其任意組合的集合結合。在一些實施例中,為用戶提供用來與其 他人共享該用戶的偏好位置集的各種選項。例如,用戶能選擇誰或哪 一組有權訪問該用戶的偏好位置集。在一些實施例中,用戶可以防止 將某些位置共享為用戶偏好位置的一部分。在一些實施例中,為用戶 提供來自另一用戶的共享用戶的偏好位置的請求,必須清楚地知道要 共享的位置。
圖13描述根據本發明的一些實施例,用于識別偏好位置集的示例
性過程1300。首先,接收用于偏好位置的請求(1302)。識別做出該
請求的用戶,以及識別用戶信息數據庫116中的可用記錄(1304)(例 如經用戶標識符502)。依據該請求所感興趣的偏好位置的類型,從用 戶信息數據庫116識別相關事件(1306)。例如,用戶可能對下述感 興趣來自用戶由于任何原因已經訪問過的任何位置的偏好位置集; 用戶已經訪問過的任何廣告著陸頁;用戶已經點擊過的任何廣告等等。 本領域的普通技術人員可理解,在此所述的技術很容易應用于根據在 用戶信息數據庫116中存儲的一個或多個數據類型和事件來創建偏好 事件集。然后,根據一個或多個排名值來排序所識別的事件(1308)。 在一些實施例中,使用一個或多個下述標準來排名事件在訂閱時間 段內(例如三個月)訪問的頻率;最后一次訪問該位置的日期;位置 的重要性值(例如PageRank);用戶對該位置提供的排名值;該位置 和用戶簡檔信息間的相似性得分。在一些實施例中,按一個或多個不 同分類來分組偏好位置(例如主題、訪問日期、位置、注釋)。
如前所述,根據一些實施例,為用戶提供瀏覽與優選廣告相關的 位置的能力。在一些實施例中,當用戶點擊廣告的次數超出閾值數時 (例如2),那么將廣告的著陸頁包括在偏好位置的列表中。在一些實 施例中,與其他類型的偏好位置不同,將與廣告有關的偏好位置的列 表提供給用戶(例如在顯示窗的單獨部分中)。在一些實施例中,與 其他類型的偏好位置一起,排名和顯示與廣告有關的偏好位置的列表。
在一些實施例中,當排名在瀏覽事件516的信息字段526中存儲 的偏好位置的列表中的位置時,使用用于位置的"停留時間"值。在 一些實施例中,停留時間僅僅是用來排名偏好位置的列表的因素之一。 可以將停留時間看作是用戶的位置重要性的代表(即用戶在某一位置 停留或瀏覽時間越長,用戶更可能對該位置感興趣)。在一些實施例 中,客戶機助理104根據監視用戶在特定位置停留多久的用戶活動, 確定停留時間值。在一些實施例中,將瀏覽信息傳送到搜索引擎110, 由其確定停留時間值。在一些實施例中,通過查看從在結果頁上點擊
URL時到從該結果頁點擊另一結果時的時間,確定停留時間。
在一些實施例中,全部或部分使用訪問得分來排名偏好位置。在 一些實施例中,對頁面的每一訪問,創建即時訪問得分。用于頁面的 總訪問得分是所有即時訪問得分的總和。在一些實施例中,隨著訪問 日期變得更久遠,即時訪問得分值減小。在一些實施例中,將即時得 分設置為最大得分減去某個值,其中,該值的量隨自訪問以來的時間 長度的增加而增加。
在一些實施例中,當用戶請求偏好位置時,確定用戶的排名偏好 位置集。在一些實施例中,定期(例如每夜)確定和在用戶信息數據
庫116中維護該集合。在一些實施例中,在首次請求時間段(例如天) 時確定該集合并在該時間段中,維護在用戶信息數據庫116中。在一
些實施例中,基于在確定和初始存儲該集合后所接收的用戶信息,逐 步地更新所存儲的集合。
在一些實施例中,用戶可以修改用于偏好位置的一個或多個排名
值。在一些實施例中,排名值存儲在信息字段526中,或信息字段528 或530中,并且與位置相關聯。在一些實施例中,用戶能增加或減小 排名值。因此,根據修改的排名值,相關位置將在排名列表中上升(或 下降)。在一些實施例中,修改是臨時的(例如針對當前瀏覽會話)。 可以為用戶提供各種方式來修改排名值。在一些實施例中,用戶可以 編輯表示排名值的得分。當用戶從偏好位置集選擇位置(或使用其他 選擇方式)時,用戶可以覆蓋、刪除或改變提供給用戶的得分輸入框 中的得分。在一些實施例中,用戶能強制用于位置的高或低排名值, 諸如上限或下限排名值。在一些實施例中,用戶可以經常訪問位置, 但不期望該位置出現在偏好位置的集合中(或至少在排名列表中不出 現得非常高),在這種情況下,用戶能將相關排名值設置為低。在一 些實施例中,用戶修改相對于排名值應用的加權因子。加權因子能存 儲在信息字段526中,或存儲在信息字段528或530中,并與位置相
關聯。例如,用戶選擇0.5值,表示用于該位置的排名值應當在排名之 前乘以0.5。在這些實施例中,用戶不直接影響位置排名值的確定,而 是影響最后排名順序。用這種方式,在不求助于用戶的期望修改的情 況下,能確定用于位置的排名值,直到最后排名這些位置為止。在一 些實施例中,為用戶提供滑動條,用戶可使用滑動條根據需要上下調 整加權因子。
圖14描述根據本發明一些實施例的用來處理用于位置的用戶修改 排名的示例性過程1400。首先,用戶選擇內容位置(例如URL、站點、 廣告)(1402),以及使用上述的任何技術,修改排名值或加權因子 (1404)。更新用戶信息數據庫116 (1406)來反映來自1404的信息。 對偏好位置集的任何隨后的請求,將考慮這種更新信息。在一些實施 例中,在接收新或修改的排名值后,重新確定偏好位置集。
如上所述,在一些實施例中,用戶可以將一個或多個關鍵字與內 容位置(例如URL、廣告)關聯。這些關鍵字可以存儲在例如用戶信 息數據庫166中。在一些實施例中,索引關鍵字使得可在注釋上執行 搜索,根據相關聯的關鍵字,將返回匹配和/或相關位置。在一些實施 例中,用戶可以任意地將各種信息項關聯在一起(例如通過提供與被 選信息項相關聯的"標簽")。例如,用戶可以將標簽應用于一個或 多個電子郵件消息。在一些實施例中,用戶可以將標簽應用于其他活 動或事件(例如位置)。因此,基于與標簽有關的關鍵字的搜索(或 瀏覽)能返回用戶已經與該標簽關聯的項。
在一些實施例中,可以將用戶的偏好位置集與來自其他用戶的一 個或多個偏好位置或用戶組相組合。在一些實施例中,偏好位置集包 括一個或多個結果點擊量、廣告點擊量、訪問過的網頁以及產品評論。 在一些實例中,將與用戶結合的偏好位置集與用戶組關聯。例如,能 從社會網、新聞組、郵寄列表、工作組、學習組等等識別用戶組。偏 好位置集可通過特定信息類別、諸如ODP類別(例如與"狗"類別有
關的偏好位置集)來識別或包括某些定位信息(例如與特定地理位置 有關的位置)。在一些實施例中,來自其他人的偏好位置集是根據上 述一個或多個技術所確定的位置。在一些實施例中,來自其他人的偏 好位置集是基于各種標準預先選擇的位置。
在一些實施例中,將私密性模型應用于用戶的信息。私密性模型
表示用戶樂意共享用戶的哪些信息或與誰共享以及在何種條件下共
享。例如,在系統對包括電子郵件消息的用戶組生成偏好信息集的實
施例中,用戶可能不希望共享電子郵件消息。然而,同一用戶可能希 望共享用戶訪問過的位置。
圖15A描述根據本發明一些實施例的用于將一個或多個偏好位置 集組合的示例性過程1500。首先,識別用戶的偏好位置集(1502)以 及將與用戶集合相結合的集合(1504)。也識別任何可用的加權因子 (1506)。在一些實施例中,用戶可以選擇加權因子來應用于所有或 每一待組合的集合。加權因子將影響如何使用其他集合的排名值來排 序該組合集合(1507)。例如用戶可以指示,較之來自郵件列表的偏 好集合,將較高加權因子應用于來自用戶緊密關聯的集合。在一些實 施例中,相對于將結合到用戶集合中的集合的排名值,乘用于集合的 加權因子。該組合集合由此反映由用戶分配的加權。注意對組中的成 員,由于成員自己的偏好位置和將應用于其他偏好位置集的用戶的加 權因子的選擇,作為呈現給每一成員的組合偏好位置集可能大不相同。
在其他實施例中,其他偏好位置集中的位置可以不具有直接相關 的排名值。在這些實例中,排名值能從其他源獲得(例如PageRank值), 或者集合中的每一位置能根據其在集合中的位置被分配缺省排名值
(列表中較高的位置被給予高于列表中較低的位置的缺省排名值)。 另外,可按任意方式將集合與用戶的偏好位置集合交織。
最后,將集合提供給用戶(1508)。使用上述的任何技術,能實
現組合列表的存儲(即使根據沒有組合列表)(例如將組合列表存儲 在用戶信息數據庫116中)。
圖15B描述用來創建用于用戶社區的組合偏好位置集的過程。首 先,識別偏好位置集的每一個(1510)。可以通過首先確定為其創建 組合集合的用戶社區中的每一用戶來識別這些集合。在一些實施例中, 偏好位置集包括一個或多個結果點進率、廣告點進率、訪問過的網頁
和產品評論。識別加權因子(1512)。加權因子表示將應用于每一集
合的權重。例如,用于特定用戶的權重可以與該特定用戶所關聯的信
任度或重要性值關聯。使用加權因子來組合集合(1524)(例如,按 與上述組合操作類似的方式)。在一些實施例中,能將一個或多個主 題相關偏好位置集與用戶偏好位置集組合。例如,如果用戶社區與特 定主題(例如golden retriever)有關,與該主題相關聯的位置集能與用 戶偏好位置集組合。在一些實施例中,典型相關位置也具有各自的加 權因子。在一些實施例中,當新用戶被添加到社區時,重新確定用戶 社區的偏好位置。
在一些實施例中,用戶可基于任意多個標準(例如通過一個或多 個查詢詞語或其他信息)來搜索偏好位置集和/或組合偏好位置集。相 對于偏好位置集,應用搜索標準,以及使用上述的各種排名技術的一 個或多個來排名來自偏好位置集的相關位置,并返回給用戶(包括但 不限于考慮用戶修改排名或加權)。這為用戶提供搜索用戶的先前歷 史以及覆蓋多種不同排名技術的任何一個來改進用戶搜索結果。在一 些實施例中,提供各種排名技術作為優選設定值中的可選項(例如選 擇框指示按先前訪問次數排名位置的選項)。在一些實施例中,在査 詢輸入頁上,提供各種排名技術作為可選項。在一些實施例中,能同 時使用這兩種技術。
在一些實施例中,可以將用戶的偏好位置集(如上述標識的)與 用戶的加書簽位置集組合(即用戶已使用瀏覽器的"書簽"特征識別
這些位置)。能使用加權函數來組合這些集合。
盡管參考偏好位置和組合偏好位置來描述,但上述技術可以同樣 地應用于其他類型的用戶所信息或事件。例如,根據本發明的一些實 施例的被確定為屬于用于用戶的偏好信息集的項的集合包括電子郵 件、即時消息、軟件應用、圖像、聯系人簿項或其他類型的用戶活動 的一個或多個。響應識別用戶的偏好位置集的命令,系統能返回包括 用戶訪問過的任何信息的偏好信息集。在一些實施例中,為用戶提供 包括頻繁存取的電子郵件、軟件應用、査詢和位置的偏好信息集。上 述任何一種技術,包括但不限于確定、排名、修改排名和組合偏好站 點能應用于這些其他類型的用戶活動的一個或多個或與之組合。
在本發明的一些實施例中,用戶可以將一個或多個客戶機應用和/ 或客戶機助理與中心用戶賬號關聯。這允許用戶累積來自不至一個機 器和/或不至一個類型瀏覽器的瀏覽和搜索信息。圖16描述示例性過程 1600,使用戶可關聯多個客戶機應用和/或客戶機助理。在一些實施例 中,客戶機標識符與客戶機應用(例如瀏覽器)的特定安裝相關聯。 在一些實施例中,客戶機標識符與客戶機助理的特定安裝(例如與瀏 覽器有關的工具條)相關聯。下述論述適用于這兩類實施例,盡管為 簡化目的,該論述僅參考與客戶機應用有關的客戶機標識符。
首先,用戶登錄位于中心服務器上的服務(1602)。這種服務能 經多種方式來訪問,諸如經客戶機應用和/或客戶機助理訪問。檢測與 客戶機應用相關聯的唯一標識符并發送到注冊服務(1604)。在一些 實施例中,標識符存儲在與客戶機應用有關的cookie中。在接收后, 確定該標識符目前是否與用戶標識符關聯(1606),其中,用戶標識 符與已經注冊到該服務的用戶關聯。如果客戶機標識符不與用戶標識 符關聯(1606-否),那么,確定是否為用戶提供將客戶機標識符與用 戶標識符關聯的選項(1608)。在一些實施例中,可以防止在某時間 段內用戶把超出訂閱數量的客戶機標識符與任何用戶標識符關聯。在
一些實施例中,限制用戶使得在任何指定時間,僅能關聯訂閱總的多 個客戶機標識符。這種條件能防止個人嘗試將大量客戶機應用與單一 用戶標識符關聯。如果提供關聯的條件不滿足(1608-否),那么記錄 用戶保持登錄時生成的瀏覽信息并與用戶標識符關聯(1610),但客 戶機標識符不與用戶標識符關聯。
如果提供關聯的條件滿足(1608-是有),那么為用戶提供將客戶 機標識符與用戶標識符關聯的選項(1612)。如果用戶選擇不將客戶 機標識符與用戶標識符關聯(1612-否),那么客戶機標識符不與用戶 標識符關聯,但記錄用戶保持登錄時生成的瀏覽信息并與用戶標識符 關聯(1610)。
如果用戶的確決定將客戶機標識符與用戶標識符關聯(1612-是), 那么將客戶機標識符與用戶標識符關聯(1614)。可以存在某些條件, 在這些條件下,可以允許用戶合并或遷移在與用戶標識符關聯前發生 的與客戶機標識符有關的先前活動(1614)。如果滿足條件,那么向 用戶提供合并的機會(1616)。在一些實施例中,與客戶機標識符有 關的用戶活動在存儲器中維持一定的時間段(例如3至7天)。在一 些實施例中,當客戶機標識符新與用戶標識符關聯時,則滿足條件并 且為用戶提供合并先前活動的選項(1616)。
在一些實施例中,該服務跟蹤用戶合并的與目前關聯用戶標識符 的客戶機標識符相關的瀏覽活動的最后次(1606-是),如果自最后一 次合并以來,訂閱時間量流逝,那么滿足條件。
如果用戶選擇不合并先前的活動(1616-否),那么記錄用戶保持 登錄時生成的信息并與用戶標識符關聯(1610)。如果用戶決定合并 (1616-是),那么與客戶機標識符相關聯的活動與目前與用戶標識符 關聯的活動合并(1618)。在一些實施例中,將信息復制到與用戶標 識符相關聯的記錄中。在一些實施例中,提供鏈接,把所存儲的與客
戶機標識符相關聯的信息鏈接至用戶標識符。記錄用戶保持登錄時生 成的信息并與用戶標識符關聯(1610)。
在一些實施例中, 一旦將客戶機標識符與用戶標識符關聯,那么, 注意與客戶機標識符有關的任何時間活動,其自動地與用戶標識符關 聯,與用戶是否注冊到服務無關。在一些實施例中,僅當用戶注冊到 該服務時,記錄與客戶機標識符有關的活動并與用戶標識符關聯。
在一些實施例中,為用戶提供在客戶機標識符和用戶標識符間刪 除關聯的能力。在一些實施例中,當用戶使客戶機標識符與用戶標識 符不相關聯時,保存與客戶機標識符有關的先前相關瀏覽信息,而在 其他實施例中,刪除先前相關瀏覽信息。在一些實施例中,如前所述, 刪除瀏覽活動觸發重新確定導出值。
參考圖17,客戶機系統102通常包括一個或多個處理單元(CPU) 1702、 一個或多個網絡或其他通信接口 1704、存儲器1706和一個或多 個通信總線1708用于互連這些組件。客戶機系統102可以包括用戶接 口 1710,例如顯示器1712和鍵盤1714。存儲器1706可以包括高速隨 機存取存儲器,以及也可以包括非易失存儲器,諸如一個或多個磁性 或光學存儲介質。存儲器1706可以包括與CPU 1702異地的大容量存 儲器。存儲器1706可以存儲下述組件或這些組件的子集或超集
*操作系統1716,包括用于處理各種基本系統服務和用于實現硬
件相關任務的過程; *網絡通信模塊(或指令)1718,用于經一個或多個通信接口 1704 (有線或無線)將客戶機系統102連接到其他計算機,諸如互 聯網、其他廣域網、局域網、城域網等等; *如上所述的客戶機應用106;
參客戶機助理104,包括用于監視用戶的活動的監視模塊1722, 以及傳輸模塊1724,用于將有關用戶的活動的信息傳送到搜索 系統112,以及從搜索系統112接收信息,以及 如上所述的客戶機存儲器108
參考圖18,搜索引擎1800通常包括一個或多個處理單元(CPU) 1802、 一個或多個網絡或其他通信接口 1804、存儲器1S06和一個或多 個通信總線1808用于互連這些組件。搜索引擎1800可以包括用戶接 口 1810,包括顯示器1812和鍵盤1814。存儲器1806可以包括高速隨 機存取存儲器,以及也可以包括非易失存儲器,諸如一個或多個磁性 或光學存儲介質。存儲器1806可以包括與CPU 1802異地的大容量存 儲器。存儲器1806可以存儲下述元件、或這些元件的子集或超集-*操作系統1816,包括用于處理各種基本系統服務和用于實現硬
件相關任務的過程; *網絡通信模塊(或指令)1818,用于經一個或多個通信接口 1804 (有線或無線)將搜索引擎1800連接到其他計算機,諸如互 聯網、其他廣域網、局域網、城域網等等; 參查詢服務器,用于響應和處理來自客戶機102的通信;以及 *用戶信息數據庫116,用于存儲如參考圖5A和5B所述的有關 用戶的信息。
在一些實施例中,査詢服務器114包括下述元件,或這些元件的
子集客戶機通信模塊120,用于接收和傳送信息;查詢接收、處理和
響應模塊122,用于接收和響應搜索查詢;歷史模塊128,用于處理和 管理對搜索用戶歷史的請求;用戶信息和處理模塊124,用于訪問和修 改用戶信息數據庫116,用戶信息數據庫116包括一個或多個用戶記錄, 用戶記錄包括用戶標識符502、基于事件的數據(包括查詢信息510、 結果點擊信息512、廣告點擊信息514和瀏覽信息516)、導出數據506 (包括一個或多個信息值528),以及附加數據508 (包括一個或多個 信息值530)。在一些實施例中,查詢服務器114包括這些模塊的子集。 在一些實施例中,查詢服務器114和/或用戶信息數據庫116包括附加 模塊。
為說明目的,參考具體實施例描述了上述說明。然而上文的示例 性論述不是意在窮舉或將本發明限定到所公開的具體形式。鑒于上述 教導,許多改進和變化是可能的。選擇和描述實施例是為了最佳地說 明本發明的原理和實際應用,由此允許本領域的技術人員根據所預期 的特定應用最佳地利用本發明和各種實施例以及各種改進。
權利要求
1.一種分析用戶的歷史活動的方法,包括識別用戶的歷史活動的部分;從所述部分識別第一會話和第二會話;對所述會話的每個識別一個或多個分組;以及將所述第一會話中的所識別的分組與所述第二會話中所識別的分組相關聯。
2. 如權利要求l所述的方法,進一步包括 接收顯示歷史請求;以及根據所述相關聯分組,至少呈現所述部分的子集。
3. 如權利要求2所述的方法,其中,每一相關聯分組具有相應的 日期/時間值,以及所述呈現步驟包括根據所述相應的日期/時間值來排 序所述相關聯分組。
4. 如權利要求l所述的方法,進一步包括 接收搜索請求;從文檔數據庫獲得與所述搜索請求有關的搜索結果; 識別與所述搜索請求有關的相關聯分組;以及 同時顯示所述相關聯分組和所述搜索結果的至少子集。
5. 如權利要求l所述的方法,其中,所述第一會話的日期和所述 第二會話的日期相隔大于1天。
6. 如權利要求l所述的方法,其中,至少一個分組包括事件,所 述事件包括搜索結果選擇、廣告選擇、查詢、瀏覽事件和產品評論選 擇的一個或多個。
7. 如權利要求l所述的方法,其中,所述相關聯步驟包括當所述 第一會話中所識別的分組和所述第二會話中所識別的分組之間的相似 度得分大于閾值時,把在所述第一會話中的所識別的分組與在所述第 二會話中所識別的分組相關聯。
8. 如權利要求l所述的方法,其中,所述識別一個或多個分組的步驟包括識別相應會話中的一個或多個相關查詢,每一査詢具有與之相關 聯的零個或多個被訪問站點。
9. 如權利要求8所述的方法,進一步包括 從搜索請求者接收搜索查詢;以及確定至少一個分組是否包含與該搜索查詢有關的內容信息,所述 內容信息包括所述一個或多個相關查詢中的搜索詞語和與所述零個或 多個被訪問站點相關聯的內容。
10. 如權利要求1所述的方法,其中,所述識別一個或多個分組的步驟包括識別在所述第一會話期間提交的一個或多個相關查詢的第一集合;以及識別在所述第二會話期間提交的一個或多個相關查詢的第二集
11. 一種結合計算機系統使用的計算機程序產品,所述計算機程 序產品包括計算機可讀存儲介質和嵌入其中的計算機程序機制,所述計算機程序機制包括用于識別用戶的歷史活動的 一 部分的指令; 用于從所述部分識別第一會話和第二會話的指令; 用于對所述會話的每個識別一個或多個分組的指令;以及 用于把所述第一會話中的所識別的分組與所述第二會話中所識別的分組相關聯的指令。
12. 如權利要求ll所述的方法,其中,所述第一會話的日期和所 述第二會話的日期相隔大于l天。
13. 如權利要求11所述的方法,其中,至少一個分組包括事件, 所述事件包括搜索結果選擇、廣告選擇、査詢、瀏覽事件和產品評論選擇的一個或多個。
14. 如權利要求11所述的方法,其中,所述用于相關聯的指令包括當所述第一會話中所識別的分組和所述第二會話中所識別的分組之 間的相似度得分大于閾值時,用于把在所述第一會話中的所識別的分 組與在所述第二會話中所識別的分組相關聯的指令。
15. 如權利要求ll所述的方法,其中,所述用于識別一個或多個分組的指令包括指令用于識別相應會話中的一個或多個相關查詢,每一查詢閾值相關聯的 零個或多個被訪問站點。
16. 如權利要求13所述的方法,進一步包括指令用于 從搜索請求者接收搜索査詢;以及確定至少一個分組是否包含與該搜索査詢有關的內容信息,所述 內容信息包括所述一個或多個相關查詢中的搜索詞語和與所述零個或 多個被訪問站點相關聯的內容。
17. 如權利要求ll所述的方法,其中,所述用于識別一個或多個 分組的指令包括指令用于-識別在所述第一會話期間提交的一個或多個相關查詢的第一集 合;以及識別在所述第二會話期間提交的一個或多個相關査詢的第二集
18. —種計算機,包括 主存儲器;處理器;以及存儲在所述主存儲器中并由所述處理器執行的程序,所述程序包括用于識別用戶的歷史活動的一部分的指令; 用于從所述部分識別第一會話和第二會話的指令; 用于對所述會話的每個識別一個或多個分組的指令;以及 用于把所述第一會話中的所識別的分組與所述第二會話中所識別 的分組相關聯的指令。
19. 一種分析用戶歷史活動的系統,包括 用于識別用戶的歷史活動的一部分的裝置; 用于從所述部分識別第一會話和第二會話的裝置; 用于對所述會話的每個識別一個或多個分組的裝置;以及 用于把所述第一會話中的所識別的分組與所述第二會話中所識別的分組相關聯的裝置。
全文摘要
記錄用戶的先前搜索和瀏覽活動用于后續的使用。用戶可以按若干不同的方式來檢索用戶的先前搜索和瀏覽活動,包括與廣告有關的用戶先前活動的指示。可以根據用戶的歷史活動修改搜索結果集。檢查用戶的活動以識別偏好位置集。可以將用戶的活動集與一個或多個其他用戶共享。可以增強呈現給用戶的偏好位置集以包括一個或多個其他用戶的偏好位置。可以由一個或多個不同的客戶機設備或客戶機應用監視用戶的瀏覽活動。可以圖示地顯示用戶的瀏覽量。
文檔編號G06F17/30GK101189608SQ200680019268
公開日2008年5月28日 申請日期2006年3月24日 優先權日2005年3月31日
發明者奧倫·E·扎米爾, 安德魯·菲克斯, 杰弗里·L·科恩, 莉莉·克里斯蒂娜·伊拉尼 申請人:谷歌公司