專利名稱:對用于進行由一組無層次話題指導的搜索的附連的用戶創建和分級及其用戶界面的制作方法
相關專利申請本發明要求2004年9月10日提交的發明人為Palmon等人的題為USERCREATING AND RATING OF ATTACHMENTS FOR CONDUCTING A SEARCHDIRECTED BY A HIERARCHY-FREE SET OF TOPICS,AND A USERINTERFACE THEREFOR(為進行由一組無層次話題指示的搜索對附件進行用戶創建和分級及其用戶界面)的美國臨時專利申請第60/609,215號的優先權。該臨時專利申請的內容通過引用結合于此。
背景本發明涉及搜索信息,例如在因特網上搜索信息。更具體而言,本發明涉及搜索由諸如關鍵字等一組話題指導的信息,其中該組話題不必要是分層的,并且其中在任何特定的搜索期間,在進行中創建任何話題搜索分層結構。
搜索可能位于本地或可能分布在網絡或互聯網中,甚至分布在因特網上的信息是眾所周知的。例如,Google和Yahoo已成為在因特網上搜索信息的同義詞。這類搜索的結果是到萬維網(“Web”)上的網頁的一組有序的URL或其它信息項。
通過向每一信息項附加類別或關鍵詞(此處稱為話題)來對信息分類也是眾所周知的。例如Yahoo一開始是允許人們按照這些話題的引導來搜索的Web目錄。這一現有技術的分類是明確地分層的,這表現在話題具有子話題等等,使得該話題集合可被構造成樹結構或樹圖的形式。這一分層分類的一個問題是一旦選中了第一個話題,唯一可用于進一步搜索的子話題是該第一個話題的那些子話題。這可能會導致遺漏某些結果,或不能使用分類來得到良好的指導。
因此,用嚴格的分層結構來構造話題可能會導致不成功的搜索。
如何將搜索結果自動歸類到一組分層話題中的一個話題也是眾所周知的。授予Krellenstein的美國專利5,924,090以及Northern Light搜索引擎產品(參見馬薩諸塞州劍橋市Northern Light Group有限公司2004年6月15日的“Northern LightEnterprise Search Engine Overview White Paper(Northern Light企業搜索引擎綜述白皮書),該文獻也可在www.northernlight.com上獲得)描述了這一自動化歸類,但是僅僅是對應一組預定義的分層話題。然而,該組話題是以分層結構來預定義的。如果使用了一組非分層的預定義話題,則不生成話題的分層結構。然而,期望具有話題的分層結構來引導搜索。即,在選擇了一個搜索詞或話題之后,期望生成候選話題以進一步細化搜索而無需在話題中具有預定義的分層結構。
在沒有一組已定義的話題的情況下在進行中聚集搜索結果也是眾所周知的。例如,參見賓西法尼亞州匹茲堡市的Vivísimo公司制作的Vivísimo ClusteringEngineTM。這一聚集引擎在進行中自動將搜索或數據庫查詢結果組織成有意義的分層文件夾。該聚集引擎將一搜索結果列表變換成分類信息而無需對源文檔進行任何預處理。然而,類別不是預定義的,而是從搜索結果本身中包含的單詞和短語中選擇的。Vivísimo的聚集引擎不使用預定義的主題;其描述是在進行中從搜索結果列表中創建的。不生成話題的分層結構。
同樣參見加拿大多倫多市1999年第八屆國際萬維網研討會(EighthInternational World Wide Web Conference)會議論文集第148上B.D.Davison、A.Gerasoulis、K.Kleisouris、Y.Lu、H.Seo、W.Wang和B.Wu的“DiscoWeb}ApplyingLink Analysis to Web Search”(DiscoWeb向Web搜索應用鏈接分析)。再參見1998年澳大利亞墨爾本的SIGIR-98,第21屆ACM信息檢索的研發國際研討會(21stACM International Conference on Research and Development in Information Retrieval)會議論文集第104-111頁上Krishna Bharat和Monika R.Henzinger的“Improvedalgorithms for topic distillation in a hyperlinked environment”(在有超鏈接的環境中對話題進行提煉的改進算法)中關于如何分析網頁并根據相關性和群集來對它們排序的討論。
由此,本領域中需要一種包括將潛在的搜索結果歸類到話題下的搜索方法,其中該組話題不必要是分層的,但是要在進行中生成話題的分層結構來引導搜索。
話題引導的搜索也是眾所周知的,其中在每一搜索步驟之后,提供用于進一步搜索的建議話題。例如,諸如加利福尼亞州洛杉磯市的BisRate.com等購物網站是眾所周知的,它建議供進一步搜索的購物話題作為搜索的結果。然而,這些話題是預定的,且具有分層結構。例如,在BizRate.com中存在話題“Computers &Software”(計算機和軟件),而在該話題下的是話題“Digital Cameras”(數碼相機)。在“Digital Cameras”下的是若干話題,諸如品牌名稱Canon、Kodak等、對數碼相機分類的不同分辨率等等。這些話題具有分層結構。
期望提供與話題引導的搜索中所提供的同樣的引導,但是其中的話題不必具有分層結構。
還需要為例如已注冊的人(“用戶”)等搜索者提供定義新話題以添加到話題集合、以及定義信息項和新定義的話題及先前定義的話題之間的附連的能力。
并非話題和信息項之間的所有附連都是同等相關的。例如,一個話題可以是“better”(更好),或對Web上的頁面比另一話題更適用。由此,本領域中需要測量信息項和話題之間的附連的質量。
類似地,并非所有的用戶都是同等可信的。由此,本領域中還需要根據可信性度量來對用戶評級。
本領域中還需要為已注冊用戶提供個性化。例如,已注冊用戶可能希望使先前對話題的搜索或先前對話題的遍歷被記錄以供重復使用。
概述本發明的一方面是提供可用于引導搜索的話題集合,每一話題具有與例如適合該話題的網頁等一個或多個信息項的附連。該話題集合不必是分層排列的。相反,對于以初始話題或搜索短語開始的特定搜索,在進行中確定用于該特定搜索的話題的分層結構。該分層搜索的每一步驟包括選擇一話題或提供一搜索短語,并得到建議話題集合以供進一步搜索。在任何階段,也提供對于迄今為止的搜索的結果,例如信息項的URL。該建議話題集合是通過分析初始搜索或搜索話題下的搜索結果的附連來生成的。本發明的一方面是建議話題包括根據一細化話題準則從多個話題中確定的一個或多個細化話題。
在一個實施例中,初始搜索頁面允許用戶輸入搜索短語并在用戶未登入的情況下登入。由此,最初,搜索者輸入一搜索短語,并被呈現包括細化話題在內的建議話題集合,以及導致對輸入的搜索短語的搜索的選中信息項。搜索者現在可從建議話題中選擇一話題,或可選擇一新的搜索短語。
在另一實施例中,預定義一初始話題集合,且該初始話題集合用于確定一初始的建議話題集合。
本發明的一方面是在某些實施例中,它向例如已通過提供注冊信息來注冊的搜索者等用戶提供創建話題的能力。在其中預定義一初始話題集合的一種形式中,用戶因而被提供了向該初始話題集合進行添加的能力。本發明的另一方面是為這類用戶提供創建信息項和話題之間的附連的能力。本發明的另一方面是為這類用戶提供對附連分級的能力。在一個實施例中,向用戶提供使用二元分級系統對話題和信息項之間的附連進行分級的機制,該二元分級系統具有第一值(“肯定”、“肯定分級”)和不如第一值令人滿意的第二值(“否定”、“否定分級”)。本發明的另一方面是一種基于用戶對附連的分級對每一附連計算總體附連質量的方法。
本發明的另一方面是已注冊用戶可選擇一個或多個話題為對該用戶是“偏好”或“最愛”的。向該用戶呈現與呈現給另一搜索者的不同的搜索結果的視圖。在一個實施例中,所建議的用于進一步搜索的話題按照被選為最愛的話題出現在其它話題之前的順序來呈現。
本發明的另一方面是例如細化話題等所建議的用于進一步搜索的話題按照根據一細化話題評級方法確定的順序來呈現。在一個實施例中,該評級方法依賴于系統的已注冊用戶如何來為與對每一潛在細化話題的搜索結果的附連分級,特別是根據所計算的潛在細化話題和搜索結果的信息項之間的附連的總體附連質量來分級。
本發明的又一方面是一種例如存儲機制等用于儲存數據結構的承載介質,該數據結構包括儲存該話題集合的用戶數據結構、被配置成儲存該話題集合的話題數據結構(話題不必是分層構造的)、以及被配置成儲存話題和例如網頁等信息項之間的附連的附連數據結構。這些數據結構是主數據結構的一部分。在一個實施例中,主數據結構采用關系型數據庫表的集合的形式,而話題數據結構、用戶數據結構和附連數據結構各自是數據庫的一張表。
附圖簡述
圖1示出了耦合到諸如因特網或內聯網等網絡的客戶機系統并包括本發明的一個實施例的一個實施例。
圖2示出了本發明的一個方法實施例的簡化流程圖,它被示為客戶機方活動,以及在圖1的網絡中的搜索服務器處發生的活動。
圖3示出了在搜索服務器處實現的方法的簡化流程圖,包括接受搜索請求信息、確定搜索結果、以及形成網頁以向搜索者顯示搜索結果。
圖4示出了用戶提供附連信息的方法實施例400的流程圖。
圖5示出了初始用戶界面顯示的一個實施例,包括供用戶輸入例如電子郵件地址等用戶ID的窗口、以及指示已經輸入了用戶信息的按鈕,并且還包括供搜索者輸入搜索短語的供應項(provision)。
圖6示出了第二用戶界面顯示的一個實施例,該用戶界面可在不必是用戶的搜索者進行的示例性搜索的多階段搜索的一個階段處得到。
圖7示出了第三用戶界面顯示的一個實施例,該用戶界面可在用于圖6所示的但對于已注冊用戶的示例性搜索的多階段搜索的同一階段處得到。
圖8示出了包括供用戶定義新話題的供應項的用戶界面顯示的一個實施例。
詳細描述此處描述的是一種計算機程序形式的方法和搜索引擎,該計算機程序實現一種輔助搜索的方法。定義一話題集合,該話題集合不必是分層的。在搜索的任一階段,使用該系統的人-稱為搜索者-或者提供一搜索短語,或者從已提供的話題的第一子集中選擇一話題。作為搜索的結果,向該搜索者提供可進行進一步搜索的話題的第二子集,且在一個實施例中,向搜索者提供迄今為止的搜索結果。
搜索者可以通過提供注冊信息來向系統注冊,以成為此處所稱的用戶。此處描述的是一種計算機程序形式的方法和搜索引擎,該方法和搜索引擎允許用戶具有一可信性度量,使得例如話題以及由不同用戶創建的話題與信息項之間的附連根據定義該附連的用戶的可信性可具有不同的質量度量。
此處描述的主要的應用是搜索網頁。然而,本發明不限于這一應用。一般而言,本發明的一方面是搜索“信息的項”,也稱為“內容元素”和“信息項”。由此,在此處最多描述的實施例中,這些信息項是網頁。在另一實施例中,這些是出版物或文檔,而在又一實施例中,這些信息項是駐留在數據庫中的數據元素。也可構想其它應用和組合的應用。在此處的描述中,每一信息項無論是網頁還是其它,都可被假定為具有描述其例如在計算機網絡中、本地計算機上、互聯網中、因特網中或別處的位置的統一資源定位符URL。由此,不失一般性,術語URL此處將用于指代信息項。
由此,存在可將URL附連到其上的一話題集合。在一個實施例中,該話題集合是預定義的。在另一實施例中,話題可由已注冊用戶添加到該話題集合中以創建更大的話題集合。該話題集合不必具有分層結構,且在此處的描述中,假定該話題集合沒有分層結構。
客戶機-服務器計算機網絡本發明較佳地,但不一定要在客戶機-服務器網絡中,即在分布式計算機系統上實現。包括本發明的一個實施例的一個示例性客戶機-服務器環境在圖1中示出。示例性客戶機101經由網絡105連接到示例性Web服務器103,并經由網絡105連接到搜索服務器151。為說明起見,網絡105是因特網。然而,網絡105可以是專用網絡(內聯網)、互聯網、外聯網或用于提供網絡連接的任何其它已知的機制。盡管僅示出了Web服務器103,但Web服務器103可以是可由諸如客戶機101等客戶機訪問的多個服務器之一。Web服務器也可由示為搜索服務器151的搜索服務器訪問。
諸如客戶機101等示例性客戶機器通常包括至少一個處理器107、存儲器子系統117、顯示子系統119、鍵盤115、諸如鼠標或另一輸入設備等定點和選擇設備123(所有這些輸入設備總的示為123)、本地存儲109以及將處理器系統耦合到網絡105的網絡接口(NIC)113的處理系統。客戶機的處理系統的各元件經由總線子系統111耦合在一起,該總線子系統為簡明起見被示為單根總線。客戶機可包括比已知的更多或更少的組件。
諸如搜索服務器151等示例性搜索服務器包括至少一個處理器157、存儲器子系統167、顯示子系統169、鍵盤165、本地存儲159、以及將處理器系統耦合到網絡105的NIC 162的處理系統。服務器151的處理系統的各元件經由總線子系統161耦合在一起,該總線子系統為簡明起見被示為單根總線。搜索服務器可包括比已知的更多或更少的組件。
諸如Web服務器103等示例性Web服務器也包括圖1中未詳細示出的處理系統。Web服務器儲存如所公知的各自由URL標識的網頁。一種這樣的網頁被示為頁面131。
客戶機101包括圖1中示為在存儲器117中的瀏覽器應用程序121,然而本領域的技術人員可以理解,即使在瀏覽器正在操作中,也并非瀏覽器的所有指令都同時在存儲器中。本描述中假定的用戶界面被實現為使用瀏覽器應用程序121顯示在客戶機的顯示器119上的頁面。
搜索服務器151包括圖1示為在存儲器167中的搜索引擎應用程序163。搜索引擎包括本發明的各方面,即實現本發明的一個實施例的一組指令,然而本領域的技術人員可以理解,并非搜索引擎163的所有指令都同時在存儲器中。搜索服務器151也可以包括圖1中示為161的一個或多個其它程序。
此外,盡管圖1示出了搜索引擎163在搜索服務器151中操作,但是本發明的其它實施例不必且在許多情況下也不在一個服務器上操作,而是可在耦合到所示的搜索服務器,例如經由因特網耦合到服務器151,或經由局域網耦合到服務器151的某一其它處理器上操作。本發明的若干方法實施例還可在全部經由因特網或本地網耦合的若干位置上操作。此外,互聯網上的處理器中的搜索引擎可將至少一個任務分配給各個處理器,使得本發明的某些方面可在至少一個計算機系統上遠程地操作,甚至在(多個)計算機系統上并行操作。本領域的技術人員可以清楚如何將此處的描述修改為在以分布式方式實現。
本發明的若干方法也可以在全部都經由因特網或本地網耦合的若干位置上操作。此外,因特網上的處理器中的搜索引擎可將至少一個任務分配給各處理器,使得本發明的某些方面可以在至少一個計算機系統上遠程地操作,甚至在計算機系統上并行地操作。本領域的技術人員可以清楚如何將此處的描述修改為以分布式方式來實現。
對搜索短語的Web搜索例如在因特網上搜索網頁等搜索是公知的。Yahoo、Google等都運行這樣的搜索。為簡明起見,假定這一搜索使用了索引,且一個這樣的索引171被示為在搜索服務器的存儲159中。該搜索引擎被假定為包括執行對一個或多個搜索詞的Web搜索、提供例如按“相關性得分”排序的結果的元素,且這些搜索元素被假定是已知的。例如,參見Ricardo Baeza-Yates、Berthier Ribiero-Neto、Berthier Ribeiro-Neto的“Modem Information retrieval”(現代信息檢索),Addison-Wesley,1999;C.J.vanRijsbergen的“Geometry of Information Retrieval”(信息檢索的幾何學),英國,劍橋劍橋大學出版社,2004;或者C.J.van Rijsbergen的Information Retrieval(信息檢索)第2版,倫敦,Butterworths,1979。在一個實施例中,對一個或多個搜索詞進行搜索的搜索部分是例如使用諸如Google或Yahoo的服務在搜索服務器151遠程實現的。在Web搜索中搜索的搜索詞的集合可以是單詞、單詞集合、諸如搜索詞的布爾表達式等單詞集合的組合或其等效物。術語“搜索短語”此處用于表示搜索的每一和所有這樣的項。此外,可在多步搜索期間輸入多個搜索短語。在這一情況下,搜索短語是期望的組合,例如搜索短語的并集/邏輯和。
搜索者和用戶使用搜索方法的人被稱為搜索者。這一搜索者可以已向搜索服務器注冊或未注冊。例如通過提供注冊信息已向系統注冊的人此處被稱為用戶。用戶在一個實施例中由電子郵件地址來標識,而在另一實施例中由唯一用戶名來標識。用戶標識符此處被表示為UserID。
用戶集合,即已注冊搜索者的集合由搜索服務器151維護,且被示為搜索服務器151的存儲159中的用戶數據結構179。數據結構179中的每一元素表示一用戶。
在一個實施例中,該用戶數據結構是駐留在搜索服務器151的存儲159中的主數據結構177的一部分。在一個特定實施例中,主數據結構177采用了包括表集合的關系型數據庫的形式。在這一實施例中,用戶數據結構179是主數據結構177的一張表。
話題本發明使用了話題集合,在圖1中示為駐留在搜索服務器151的存儲159中的主數據結構177的話題數據結構173。每一話題是話題數據結構173中的一個元素。話題不必要是分層構造的,且本發明的一個發明性方面實現了由非分層構造的話題集合引導的搜索。每一話題被附連到形成可搜索項的整體的URL集合中的至少一個URL。由此,附連意味著URL和話題之間的關聯。每一附連至少由<URL,topic(話題)>二元組來定義。如以下進一步描述的,用戶可創建附連,且在這一情況下,每一附連至少由三元組<UserID,<URL,topic>>來定義,其中UserID是用戶標識符。在其中數據結構177采用關系型數據庫的表集合的形式的實施例中,話題數據結構是表173。附連在圖1中示為作為數據結構177的一部分的附連數據結構175。在其中主數據結構包括關系型數據庫的表集合的實施例中,附連數據結構是附連表175。
盡管話題在表173中不是分層構造的,但本發明的一方面是在進行中生成用于特定搜索的分層結構作為搜索者選擇話題和/或搜索詞的結果。
客戶機方和服務器方操作現在呈現由搜索者在進行搜索的客戶機處操作的一個方法實施例。搜索在搜索服務器方操作。
圖2示出了本發明的一個方法實施例200,它示出了在客戶機方和服務器方發生了什么。在客戶機方,搜索者在201處調用瀏覽器并向搜索服務器151請求搜索頁面以在客戶機101的顯示器119上顯示。這例如通過向客戶機指示使得搜索服務器151為搜索者供應起始頁面的網站來完成。在搜索服務器方,在203處,搜索引擎163提供包括供應項的初始搜索頁面以供搜索者輸入搜索短語。
在一個實施例中,還為作為用戶的搜索者,即已提供了注冊信息的搜索者在205處顯示的初始頁面上提供供應項,以通過在207處提供用戶名和口令來登錄到系統。在這一實施例中,也為非用戶搜索者提供供應項,以通過向系統提供注冊信息向系統注冊來成為用戶,或選擇繼續作為非用戶。
在一種變體中,該初始搜索頁面還包括向搜索者呈現的話題集合的一初始子集,且帶有供搜索者選擇所呈現的話題中的任一個的供應項。在一個實施例中,該初始子集被預定義為要呈現給任何搜索者的話題的初始子集。在另一實施例中,該初始子集是用戶專用的。例如,在一種形式中,該用戶專用初始集合是根據例如在用戶注冊期間輸入的屬性等屬性來預定義的。在一種形式中,作為替代或除此之外,特定用戶可修改該預定義的初始子集以形成個性化的用戶專用子集以供初始顯示。用戶集合中的一個用戶可通過定義新話題和/或話題和信息項之間的新附連來向話題的通用初始子集或用戶專用初始子集進行添加。或者,除此之外,該用戶專用初始集合是根據用戶先前的活動來計算的。在一個實施例中,用戶表179因而包括關于每一用戶的個性化話題子集的信息。在另一實施例中,話題表173對每一話題都包括聲明了“所有權”的每一用戶的名字。
在客戶機方,客戶機101接收該初始頁面,且Web瀏覽器在顯示器119上顯示該初始頁面。用戶可在207處輸入正確的用戶名和口令(統稱為“用戶ID”)。
如果用戶成功地輸入了正確的用戶名和口令(見分支208),則客戶機在209處將用戶ID發送到服務器151。搜索引擎163在211處接收該信息、在表179中的用戶集合中查找該用戶ID(此處表示為UserID)以授權用戶、并在假定成功授權的情況下在211處供應新的初始頁面。在一個實施例中,該初始頁面包括個性化的,例如由用戶選擇的或為用戶選擇的話題的初始子集。
在客戶機方,在213處,在顯示器119上向用戶顯示帶有個性化的話題子集的新初始頁面,以及供用戶選擇話題之一的供應項,例如通過點擊話題的顯示,或通過用戶輸入搜索短語并引起搜索,例如通過按下初始頁面上標記為搜索的按鈕。
在本討論的其余部分中,搜索者可以是用戶,或者作為分支208的結果,可以是非注冊搜索者。
由此,在為用戶提供話題的情況下,客戶機101在215處等待搜索者選擇話題或輸入搜索短語。所選擇的話題和任何搜索短語輸入此處被稱為“搜索請求信息”。一旦提供了搜索請求信息,則在217處,客戶機將該搜索請求信息發送給搜索服務器151。
在搜索服務器151處,在219處,接收搜索請求信息,并且搜索引擎在219處基于該搜索請求信息生成結果。如將在下文中更詳細描述的,本發明的一方面是在219處生成的搜索結果包括根據一個或多個搜索準則(見下文)滿足該搜索請求信息的一個或多個URL,并且還包括一個或多個建議話題集合,搜索者可選擇這些建議話題,使得搜索者對任何建議話題的選擇將進一步指導搜索。建議話題的生成在下文更詳細描述。
在搜索服務器處繼續,219還包括生成并供應包含搜索結果的新頁面,包括建議話題,并且還包括迄今為止選擇的任何話題。
在客戶機101處,在221處,接收所供應的頁面并向搜索者顯示。搜索者現在可繼續搜索。客戶機方過程因此返回到215,在那里客戶機101等待搜索者選擇話題,例如選擇建議話題之一作為另一話題或選擇先前選擇的話題,或者等待搜索者輸入新的搜索短語,或者等待搜索者選擇所顯示的URL之一以供進一步顯示。
注意,圖2的流程圖不包括諸如搜索者結束該過程、用戶登出、非注冊搜索者注冊等細節。本領域的技術人員可以清楚,這些特征可被包括在內,且本領域的技術人員還可以清楚如何擴展該流程圖以包括這些特征。此外,圖2的流程圖不包括關于如何接收網頁、如何生成網頁、以及本領域的技術人員同樣已知的其它方面的細節。
因此,可通過繼續215、217、219和221來繼續分層搜索,這些步驟包括在客戶機方請求和提供搜索請求信息、然后在搜索服務器方生成針對該搜索請求信息的結果以及包含該結果的網頁、然后在客戶機方顯示回這些結果。每一這樣的循環以分層的方式進行進一步的搜索。
注意,當顯示URL時,例如作為對搜索請求信息的搜索的結果來顯示時,每一URL可用各種形式來顯示,包括內容摘要,這些形式當今在諸如加利福尼亞州的Mountain View市的Google公司所運作的搜索引擎中是常見的。點擊URL向搜索者或用戶提供網頁的顯示。
在一個實施例中,在219處供應并在221處向搜索者顯示的結果頁面包括●按序的迄今為止選擇的每一話題以及迄今為止輸入的每一搜索短語。
●建議話題集合。
●搜索短語或當前短語以及先前包括的短語。
●迄今為止選擇的話題下的搜索短語的URL。
一個實施例允許用戶,即已注冊搜索者定義最愛話題的集合。在這一實施例中,在219處供應并在221處向搜索者顯示的結果頁面還包括用戶最愛話題的集合。
搜索話題路徑和搜索準則搜索可以是分層的,這表現在搜索可通過搜索者選擇一個話題,然后在下一次請求一頁面、另一話題等來遍歷話題集合。例如,通過選擇搜索話題A,將向搜索者示出話題A下,即附連到話題A的結果集合。通過現在選擇第二個話題,如話題B,搜索者可以看到來自先前示出的結果內的附連到話題B,由此也附連到話題A的結果。由此,話題的分層結構是為搜索者在進行中生成的。搜索話題路徑意味著在特定搜索者進行的特定搜索期間選擇的話題集合。搜索話題路徑中的最后一個話題是這一遍歷中最近選擇的話題。在一個實施例中,搜索話題路徑的順序不是重要的,因為搜索話題路徑中的任一URL具有與搜索路徑中的每一個和所有話題的附連。然而,仍可向搜索者顯示排序,以輔助向搜索者示出迄今為止選擇的話題集合中的排序。
由此,在任一階段,搜索請求信息包括搜索話題路徑和任何搜索短語。
還要注意,在搜索中的任一點,搜索者可通過選擇先前遍歷的話題作為最后一個話題來縮短搜索話題路徑。
例如,話題集合中的四個話題由A、B、C和D來表示。請求搜索請求信息的當前顯示的頁面的搜索話題路徑用A>B>C>D來表示。搜索者現在可以選擇搜索話題中的話題C。搜索請求信息現在包括搜索話題路徑A>B>C,且新的所得的搜索頁面將具有A>B>C作為搜索話題路徑,且所顯示的URL各自具有與話題A、B和C中的每一個的附連。
因此,搜索請求信息包括活動搜索話題路徑和任何活動搜索短語。注意,搜索短語如同它是話題那樣來起作用,因而此處被稱為偽話題,這表現在滿足針對搜索短語的一個或多個準則的任何URL都可被認為是類似于附連到該搜索短語,此處稱為偽附連。由此,當存在由S表示的搜索短語以及搜索話題路徑A>B>C>D時,由A>B>C>D和搜索短語S構成的搜索請求信息可被認為是搜索話題路徑A>B>C>D>S,其中搜索短語S被認為是偽話題,而從搜索S中得到的URL被認為是具有與話題S的偽附連。搜索者可在搜索中輸入若干搜索短語,例如S1和S2,由此創建了類似A>B>S1>C>S2的路徑。在一個實施例中,這與搜索路徑A>B>C>(S1.and.S2)相同。
建議話題在分層搜索中的任一階段,該方法在219處接受搜索請求信息,該搜索請求信息包括新的或修改的搜索短語或新的或修改的搜索話題路徑作為搜索者提供搜索短語或選擇話題的結果。該方法在219處產生URL形式的結果,以及一個或多個建議話題集合。
注意,在一個實施例中,搜索者在215處提供新搜索請求信息包括搜索者輸入或修改搜索短語,或選擇一話題。在另一實施例中,搜索者在215處既可以輸入/修改搜索短語也可選擇一話題。
對建議話題中的任一個的進一步選擇將進一步指導搜索。
在一個實施例中,建議話題集合之一是縮小搜索的話題集合(“細化話題”),使得一附加的話題被添加到最后一個搜索話題路徑中。在另一實施例中,建議話題集合之一是將產生類似或相關結果的話題集合(“相關話題”),使得一備選的最后一個話題替換了先前的話題路徑中的最后一個話題。在又一實施例中,搜索者可選擇一相關話題來替換整個搜索路徑。例如,在Microsoft Windows環境中,用戶可選擇替換最后一個選擇的路徑,或者可通過在選擇期間右鍵點擊來選擇替換完整的搜索話題路徑。
由此,即使話題集合中的話題不必是分層的,但仍在進行中生成話題的分層結構作為多步搜索的結果。
圖3是圖2的流程圖中框219的簡化流程圖。在303處,接受搜索短語或所選擇的話題,或來自搜索者的其它輸入。
可以回想,搜索結果可被格式化成若干結果頁面,使得搜索者或用戶可請求查看另一頁面,例如下一結果頁面。如果其它輸入是對顯示已供應的搜索結果的另一頁面的請求,則分支305以在321處形成所請求的例如現有搜索結果的下一頁面的方法繼續。該所請求的頁面在313處供應。
否則,在307處,該方法確定附連到(經更新的)搜索話題路徑的URL,并且確定是否存在同樣“偽附連”到搜索短語的搜索短語,因為這些URL是導致對搜索短語進行搜索的URL。
用于對搜索短語進行搜索的實際搜索方法不在此處進一步描述。可使用任何已知的搜索方法。在一個實施例中,搜索是使用例如遠程位置處的單獨的搜索引擎對搜索服務器遠程地進行的,例如由諸如Google或Yahoo等某一第三方來運行。
在309處,通過分析URL與搜索話題路徑的附連來生成一個或多個建議話題集合。
一個實施例包括縮小搜索范圍的話題集合作為建議話題集合之一。這些話題此處被稱為“細化話題”。這些細化話題能夠細化搜索。
在一個實施例中,建議話題集合之一是產生類似或相關結果的話題集合,此處稱為“相關話題”。
在又一實施例中,在搜索者是已定義了最愛話題的集合的用戶的情況下,提供用戶最愛話題作為建議話題集合。
在該較佳實施例中,如果所有三個建議話題集合都非空,則將它們呈現給搜索者以進行進一步的搜索。即,該方法為搜索者提供細化話題集合、相似話題集合、以及在用戶具有最愛話題的集合的情況下的用戶最愛話題的集合。
在311處,該方法形成頁面。在一個實施例中,頁面包括●搜索話題路徑,且帶有選擇其中的任何話題的供應項。
●根據細化話題排序準則排序的細化話題集合。
●根據相似話題排序準則排序的相似話題集合。
●在已具有最愛話題的集合的用戶的情況下,最愛話題的集合。
●附連到搜索話題路徑的URL,且如果有搜索短語,則為偽附連到該搜索短語的URL,并以根據搜索順序準則的順序進行。
●輸入搜索短語的供應項,且如果已經有了搜索短語,則為輸入一個或多個搜索短語的供應項。在搜索過程期間輸入了若干搜索短語的情況下,搜索短語以所輸入的搜索短語的組合的形式來示出。
●在搜索結果無法在單個頁面中顯示的情況下,還包括讓搜索者請求下一頁面的供應項。
在313處,該方法向客戶機供應所得的頁面。
用戶交互和附連本發明的一方面是向用戶,即已注冊搜索者提供創建話題的能力。本發明的另一方面是向用戶,即已注冊搜索者提供定義從URL到現有(或新創建的)話題的附連的能力。這一附連歸于用戶。因此,二元組<URL,Topic>之間的附連至少是三元組<UserID,<Topic,URL>>,其中UserID是用戶標識符。
因此,附連集合的表175中的元素包括數據結構177中用戶表179的用戶。
圖4示出用戶提供附連信息的方法實施例400的流程圖。用戶可以如此定義同一URL和多個話題之間的附連。參考圖4,221與圖2中的相同顯示由服務器供應的帶有搜索結果的頁面,包括建議話題和搜索的URL。在一個實施例中,Web瀏覽器包括允許添加當前顯示的搜索話題路徑和URL之間的附連的用戶專用探查器欄或其它附加面板。此上下文中的探查器欄是通常用于最愛的與諸如InternetExplorerTM(華盛頓州雷蒙德市的微軟公司)等Web瀏覽器的附連的附加面板。
在一個實施例中,用戶專用探查器欄包括添加當前頁面的按鈕。圖4包括用戶在403處選擇一個頁面來查看。在405處,將所請求的頁面信息發送到適當的位置并在Web瀏覽器的主窗口上供應和顯示所請求的頁面。圖4示出用戶在407處點擊探查器欄上的“添加當前頁面”按鈕。包括搜索話題路徑和頁面URL在內的用戶請求在409處被發送到例如服務器151等服務器,且在服務器方,在411處,該方法接收附連信息,并通過更新數據庫177中的附連集合(表175)來創建附連,包括創建URL與針對該用戶的搜索話題路徑中的每一話題之間的附連。
注意,在一個實施例中,搜索話題路徑的排序是不重要的。即,附連到一話題路徑的任何URL都具有該URL與該話題路徑的話題集合中每一話題之間的附連。
在另一實施例中,附連的排序僅僅是定義了URL與一完整搜索路徑的附連的特定用戶的事情,且對于所有用戶是不重要的。對于該特定用戶,搜索路徑的排序是重要的。參見下文對個性化話題視圖的描述。
創建并供應一新頁面,例如具有結果的用戶專用頁面。顯示搜索結果的頁面(221)。在那之后,用戶可通過選擇一話題或輸入一搜索短語來進行進一步的搜索,或者用戶可創建更多新附連。
話題創建如上所述,根據本發明的一方面,已注冊用戶可向話題集合添加話題,并且可添加附連到該話題的一個或多個URL。因此,在一個實施例中,預定義了一初始話題集合。在一種形式中,該集合包括來自開放目錄項目(Open Directory Project,ODP)的頂層話題,ODP也稱為DMOZ,它由加利福尼亞州Mountain View市的Netscape Communication公司運行。對于更多信息,參見www.dmoz.org和http://dmoz.org/about.html。
當越來越多的用戶使用該系統時,話題集合通過用戶創建話題來增大。在任何時刻,用戶可創建話題并將一個或多個URL附連到該話題上以創建一個或多個新附連。
用于用戶創建話題的系統是已知的。例如,參見上述也稱為DMOZ的開放目錄項目(ODP)。同樣參見加利福尼亞州舊金山市的LookSmart有限公司所有、且可在www.zeal.com網站上獲得的Zeal系統。
當用戶創建一新話題時,該用戶同時或稍后創建該新創建的話題與一個或多個URL之間的一個或多個附連。
在一個實施例中,用戶專用探查器面板包括供用戶用于例如通過點擊該探查器面板上的“添加新話題”按鈕來創建新話題的機制。圖4示出用戶在415處點擊“添加新話題”按鈕來創建一新話題。在一個實施例中,這使得一彈出窗口出現。用戶然后可在該彈出窗口中輸入信息。盡管在一個實施例中,該彈出窗口是本地創建的,但在圖4所示的另一實施例中,該彈出窗口由服務器151供應。由此,作為用戶在415處點擊以創建新話題的結果,在417處將信息發送到服務器。服務器為用戶構建包括供用戶用于輸入新話題的窗口的頁面,并向用戶供應話題創建頁面,例如作為供用戶查看的另一頁面或彈出窗口。在421處,客戶機處的Web瀏覽器顯示該頁面以供針對附連的話題創建。在423處,用戶例如通過鍵入話題名稱來輸入話題。一個實施例包括供用戶還能為復選指示用戶希望將話題作為當前搜索話題路徑中的最后一個話題的子話題輸入的復選框的工具。見下文對子話題以及如何使用子話題例如用于為特定用戶將潛在細化話題評級的進一步討論。
在425處,將新話題的信息發送給服務器。在服務器方,在427處,該方法接收該新話題信息,并更新數據庫177中的話題集合173。創建并供應包括由用戶創建的話題的帶結果的新頁面。在221處顯示搜索結果的頁面。在那之后,用戶可通過選擇一話題或輸入一搜索短語來進一步搜索,或者用戶可創建更多的新附連。
當創建了類似話題集合的現有話題的話題時,在一個實施例中,系統自動查看根據接近性度量接近的現有話題名稱。如果有與新創建的名稱相對非常接近的至少一個名稱,例如根據接近性度量比預定義的接近性閾值更接近,則向用戶呈現提供相對非常接近的一個或多個名稱的用戶界面。請求用戶指示所呈現的名稱中是否有任一個可被使用,且如果是,則將該話題作為用戶意指的話題。
例如,如果用戶提交新話題名稱“tidepool”或“tidepools”或“tide pool”或“tde pool”(蓄潮池),且在話題集合中已存在話題“tide pools”,則將向用戶呈現詢問“tide pools”是否可以或者用戶是否想要新話題的用戶界面。
本領域中已知有多種用于串的接近性的度量。一個實施例使用表示為dH的漢明(Hamming)距離作為兩個文本串之間的接近性的度量。源和目標串中相同且正確放置的任何字母各自貢獻距離0,而不同的任何字母各自貢獻距離1。另一度量是Levenshtein距離,它被定義為將一個串變換成另一個串所需的刪除、插入或替換的次數。還有已知的以例如基于用于特定語言的鍵盤上的位置的可能置換為基礎的其它更多距離度量。例如,在英語語言鍵盤中,“wuick”接近“quick”因為字母“q”和“w”是相鄰的。然而,在法語鍵盤上,“w”不在“q”的旁邊。所使用的鍵盤類型對于客戶機器而言是已知的。這一可選串接近性度量例如用于拼寫檢查程序中。
在一個實施例中,用戶還可向話題添加所謂的“子話題”。例如,如果存在話題A,則用戶可創建A的“子話題”B,表示為A>B。如果存在搜索話題路徑A>B>C>D,則用戶可向搜索話題路徑的最低層話題D創建子話題E以創建子話題D>E。以此方式,子話題向搜索話題路徑添加了一額外的話題。參考圖4,在一個實施例中,在419處供應并在421處顯示的話題創建彈出窗口包括供用戶用于鍵入指示用戶希望將話題作為當前搜索話題路徑中的最后一個話題的子話題輸入的復選按鈕的工具一復選框。
與此同時,或在稍后的時候,當用戶創建URL和子話題A>B之間的附連時,這創建了話題A和話題B之間的附連。注意,盡管術語“子話題”暗示了分層結構,但這一分層結構僅應用于該用戶。對于所有其它搜索者,并不存在從子話題A>B中所得的話題A和B的分層結構。由此,對于特定用戶,對非分層話題集合的話題儲存了分層結構。這些用戶專用子話題如下所述用于對潛在細分話題評級以進一步進行搜索來向用戶呈現。
對附連和URL的分級除每一用戶能夠定義話題和附連之外,本發明的另一方面是每一用戶可對URL和話題之間的附連分級,使得一般而言,附連可包括信息的四元組用戶、話題、URL和附連數據結構(表)175中的分級。
在本實施例中,僅使用兩種分級第一分級(“肯定”)和不如第一分級令人滿意的第二分級(“否定”)。替換實施例可包括多種分級,例如0到5之間的整數,而在另一實施例中,為0到10之間的整數。
在此處所描述的兩種分級的實施例中,附連作為四元組<UserID,Topic,URL,NegRate>,其中NegRate是一二進制量,對于肯定的分級它為假(值0),而對于否定的分級它為真(值1)。替換實施例使用不同的值來儲存分級。
在搜索話題路徑下查看的URL也可由用戶積極地分級,且對URL的這一分級創建了URL和搜索話題路徑中的每一話題之間的新的用戶專用附連并如同它是第一附連那樣對其進行了分級。
肯定分級在此處描述的兩種分級的實施例中,用戶通過指示附連是“被選中”來對一附連進行肯定的分級。在一種形式中,當用戶創建附連時,以及當用戶通過指示該附連被選中來明確地對該附連進行肯定的分級時,創建了該附連的肯定分級。
對附連進行肯定分級的一個示例是通過對URL進行肯定分級。例如,查看例如作為搜索結果附連到一個或多個話題的URL的用戶可對所查看的URL中的任一個進行肯定分級。在本描述中,對URL進行這樣的肯定分級被稱為將該URL“選擇”在“我的URL”列表中,并且也被稱為將該URL標記為“最愛”URL。當用戶如此對URL進行肯定分級時,在該URL和搜索的話題之間創建了帶有肯定分級的新附連,如同該新附連是第一個附連一樣。在一個實施例中,如果搜索已遍歷了若干話題,使得搜索已動態地創建了分層結構-搜索話題路徑,則在該URL和該搜索話題路徑中的每一話題之間創建一附連并對其進行肯定分級,使得一次性創建多個肯定分級的附連。在一替換實施例中,僅該URL和搜索話題路徑中的最后一個話題之間的附連被肯定分級。由此,只要URL被標記為最愛,就創建該URL和至少一個話題之間的新附連,其中每一這樣的附連包括該特定用戶,如同這是創建該附連的第一個用戶一樣。
在一個實施例中,標記為對特定用戶“選中”的附連在針對該特定用戶的視圖中總是在其它附連之前。由此,本發明的一方面是為用戶提供包括“我的頁面”的個性化視圖。
由此,可以有包括特定的<URL,Topic>二元組的若干肯定分級的附連。
否定分級在此處所描述的兩種分級的實施例中,當用戶明確地對一附連進行否定分級時創建該附連的否定分級。進行否定分級在此處被稱為將附連分級為垃圾附連,或簡稱為令附連成為垃圾。
對一附連進行否定分級的一種方法是通過對例如搜索結果中的URL等URL進行否定分級。對一URL進行否定分級是例如通過將該URL標記為“垃圾”來實現的。在一個實施例中,在搜索已遍歷了若干話題,使得對該特定搜索在進行中創建了分層結構時,如果搜索已遍歷了若干話題,對一URL進行否定分級創建了該URL和搜索話題路徑中的最后一個話題之間的新的否定分級的用戶專用附連。由此,例如,假定用戶在搜索路徑為“Palo Alto/Hiking”時令一特定URL成為“垃圾”。在這一情況下,該特定URL與搜索路徑中的任何更高層次之間的附連不被否定分級,例如,該特定URL與“Palo Alto”之間的附連不被否定分級,除非先前已對該話題作出了這樣的“成為垃圾”。
注意,當一URL與任何話題之間的附連被否定分級時,該搜索話題路徑的任何擴展下的任何URL被自動否定分級。由此,例如,如果用戶具有子話題“PaloAlto/Hiking”且令該子話題下的特定URL“成為垃圾”,則“Palo Alto/Hiking”的任何進一步的子話題對這一用戶也被標記為垃圾,例如,對子話題“PaloAlto/Hiking/Shops”的附連被否定分級。
所有權除對附連分級的人的身份的指示之外,一個實施例在附連數據庫175中還包括首先創建URL和話題之間的任何附連的人的指示。這一用戶被稱為這一附連的“所有者”。如將在稍后描述的,可向用戶分配一可信性度量,且在一個實施例中,特定用戶的可信性表示由所擁有的這些附連,即首先由該用戶創建的附連被系統的其它用戶分級得有多好。為允許這一情況,每一附連包括關于它是對<URL,Topic>二元組創建的第一個附連的指示。
由此,在一個實施例中,數據庫177的附連表175中的每一附連相關聯了一信息五元組<UserID,Topic,URL,NegRate,FirstCreated>,其中FirstCreated是如果這是在Topic和URL之間創建的第一個附連則為真的指示。
用戶最愛和垃圾話題及URL本發明的另一方面是用戶對話題和搜索話題路徑分級的能力。在一個實施例中,使用一種二元分級系統,根據該系統,每一用戶具有一相關聯的期望(“最愛”)話題和搜索話題路徑的集合,且類似地,每一用戶具有一相關聯的不期望(“垃圾”)話題和搜索話題路徑的集合。當然,如果用戶尚未將任何話題標記為最愛或垃圾,則這些集合中的每一個可以為空。本發明的另一方面是向用戶提供一種用于選擇話題以及將該話題分級為最愛或垃圾的機制。在一個實施例中,例如作為搜索的結果或作為要顯示的初始話題集合呈現給用戶的建議話題包括被用戶(先前)選擇為最愛的話題,并排除被用戶(先前)選為“垃圾”的任何話題。注意,如果附連到標記為垃圾的話題的一個或多個URL也附連到搜索話題路徑中的其它話題,或者如果這類URL是對搜索短語的搜索的結果,則包括搜索結果的頁面也將包括這類URL。
最愛URL如上所述,每一附連可以被用戶進行肯定或否定的分級。由此,用戶還可具有相關聯(“最愛”)附連的列表。這些是用戶進行肯定分級的附連。
如上所述,當用戶查看一搜索結果時,本發明的一方面是該用戶界面向用戶提供一種將所顯示的URL選為“最愛”URL的機制。如上所述,如此將URL選為最愛URL創建了該URL和搜索話題路徑中的每一話題之間的肯定分級的附連。
類似地,本發明的一方面是該用戶界面為用戶提供一種將所顯示的URL選為“垃圾”URL的機制。如上所述,如此將一URL選為垃圾URL創建了該URL和搜索話題路徑中的最后一個話題之間的否定分級的附連。
在本發明的一方面,當查看話題時,用戶不會看見附連到被用戶標記為垃圾的任何話題的任何URL。然而,如果被標記為垃圾的附連的這類URL也附連到搜索話題路徑的其它話題,或者如果它們是自由搜索查詢的結果,則用戶也可看見這類URL。因此,假定一URL具有與搜索話題路徑否定分級的附連,因而具有與該話題集合的子集的否定分級的附連。這一URL對于該搜索話題路徑的父集也將被認為是垃圾。
總體附連質量由此,如上所述,在URL和話題之間可以有多個附連,且每一這樣的附連可具有一不同的分級,取決于個別用戶如何對該附連分級。本發明的一方面是定義URL和話題之間的關系的總體質量度量,它反映了用戶如何對URL和話題之間的附連分級。該質量度量是根據一總體附連質量計算方法來計算的,在一個實施例中,該計算方法提供了對附連進行肯定分級的用戶的相對數目與對附連進行否定分級的用戶的相對數目的比較。在一個實施例中,總體附連質量計算方法可由一質量計算公式來表達。
在一個實施例中,總體附連質量計算方法如下。質量度量在0和1之間。最初,向每一附連分配質量1/2。如果一個或多個用戶對該附連進行了肯定分級,且沒有用戶對該附連進行否定分級,則該附連具有值1。如果一個或多個用戶對該附連進行了肯定分級,且通常有至少一個這樣的用戶-定義該附連的用戶,則該話題附連質量從不為0,除非僅有創建了該附連且稍后對該附連進行否定分級的用戶。
一般而言,對于表示為URL1,URL2,...,URLi,...的URL整體、以及表示為A1,A2,...,Aj,...的話題集合,則URLi和Aj之間的附連表示為<i,j>。對附連<i,j>進行肯定分級的用戶的個數由NumPosij表示,而對附連<i,j>進行否定分級的用戶的個數由NumNegij表示。以任何方式對<i,j>對的附連分級的用戶的總數由Numij表示,即,Numij=NumPosij+NumNegij。<i,j>對的附連的總體質量由Qij表示。則在一個實施例中,Qij=[1/2+1/2*(NumPosij-NumNegij)/Numij],其中*表示乘法。
<i,j>對的附連的總體質量是使得在最初,以及只要沒有用戶對一附連進行否定分級,該附連就具有質量度量1。
在其它替換實施例中,肯定和否定附連被不同地加權。例如,設α+和α-是用于肯定和否定附連的相對權重,其中α++α-=1。
則在另一替換實施例中,Qij=[α-+(α+*NumPosij-α-*NumNegij)/Numij]。
這在α+=α-=1/2時約簡為第一替換實施例。
用戶可信性和貢獻指標本發明的另一方面是向每一用戶分配一可信性度量。這例如提供了對附連的總體質量的替換度量,該度量依賴于用戶可信性,這表現在較可信用戶的分級對于附連質量比較不可信用戶有更大效果。
在一個實施例中,用戶的可信性度量是有多少其他用戶對由用戶首先創建的話題進行了肯定分級的度量。該可信性度量因此提供了對于每一用戶在定義話題以及對附連分級中有多可信的指示。在又一實施例中,該可信性度量還受到貢獻指標的影響,該貢獻指標指示,在用戶為系統創建的原始附連的個數方面,用戶對系統貢獻了多少。
對于任何用戶,用戶UserID為系統創建的附連的個數,即,對用戶UserID,其中UserID是該用戶且對其FirstCreated為真的附連的個數由NumCreatedUserID表示。
設Qk,k=1,2,...,NumCreatedUserID是首先由用戶UserID創建的附連的相應質量。
在第一實施例中,定義表示為RawCredUserID的用戶UserID的“原始”可信性,作為由用戶提供給系統的附連的平均質量。即RawCredUserID=(∑kQk)/NumCreatedUserID。
理想的是用戶貢獻指標考慮到用戶創建的附連的個數,無論它是作為第一個附連創建的,還是通過將附連分級為肯定或否定來創建的。
貢獻指標的一種形式如下在貢獻方面為百分之十到百分之九十的所有用戶貢獻的每一用戶貢獻的平均附連數,即除其NumUserID在前10%和后10%的那些用戶之外的所有用戶的平均附連數,用NumCreatedAve來表示。
對于一特定用戶,例如用戶UserID,將用戶定義的附連數用NumCreatedUserID來表示。如果一用戶貢獻了至少NumAttachAve個附連,設該用戶具有高貢獻指標,例如“全”貢獻指標。如果該用戶貢獻了少于平均的每一用戶的貢獻,則該貢獻指標“緩慢”減小。在一種形式中,貢獻指標呈對數地減少。
用戶的貢獻指標用ContrUserID來表示。則在一個實施例中,ContrUserID=log[min(NumCreatedUserID,NumCreatedAve)]/log[NumCreatedAve]。
在一個實施例中,用戶的總體可信性是該用戶的可信性用用戶的貢獻指標來加權。用戶的總體可信性用CredUserID來表示,它包括用戶的附連是如何被分級的以及用戶的相對貢獻兩者。則CredUserID=RawCredUserID*ContrUserID=RawCredUserID*log[min(NumCreatedUserID,NumCreatedAve)]/log[NumCreatedAve],使得如果用戶貢獻了多于平均的每一用戶的貢獻,則用戶的貢獻指標與用戶的原始可信性相關,而如果用戶具有與平均相同或更少的貢獻,則用戶的貢獻指標與用戶的原始可信性按相對貢獻數呈對數地加權相關。
在一個實施例中,用戶可信性度量固有地為0和1之間的數。
確定在搜索時要顯示的“細化”話題和“相似”話題現在作為示例來描述對細化和相似話題的確定。在該示例中,對其正進行搜索的搜索短語用S表示。搜索話題路徑用P表示。例如,假定用戶運行對于搜索短語S的搜索且該搜索被細化到在話題A下然后在話題B下。則P=A>B。該搜索方法包括標識具有與搜索話題路徑的附連且滿足搜索短語的信息項(如果有)。這些所標識的信息項,即URL搜索結果采用URL集合的形式。將所標識的信息項的集合,即該URL集合表示為{S:P},這表示“偽附連”到搜索短語S(可以為空)以及附連到搜索話題路徑P,即附連到搜索話題路徑P中的所有話題的URL。空搜索短語S意味著URL搜索結果是與搜索話題路徑中的每一話題附連的所有URL。P=A>B例如意味著集合{S:P}中P=A>B的每一URL具有與搜索話題路徑中的每一話題,例如與話題A和話題B的至少一個附連。
確定細化話題集合細化話題是根據一細化話題準則使用一細化選擇方法來確定的。在一個實施例中,細化話題準則可以是個別準則的組合。本發明不限于任何一種細化話題準則和相關聯的細化選擇方法。在一個實施例中,根據第一細化話題準則和相關聯的細化選擇方法,潛在細化話題是具有與所標識的信息項中的至少一個,例如與{S:P}中的至少一個URL的附連的話題。由此,如果P=A>B,則如果{S:A>B>C}不為空,C是{S:P}的一個細化話題。
細化選擇方法選擇潛在細化話題。本發明的另一方面是該細化選擇方法包括對潛在細化話題評級的細化評級方法。這一細化話題評級方法用于確定兩個潛在細化話題中的哪一個是較好的細化話題。在一個實施例中,細化話題例如在供應給搜索者的頁面中以根據細化評級的順序來呈現。
一種,即第一細化評級方法對每一潛在細化話題確定一細化度量,作為{S:P}中與潛在話題附連的成員的個數,該細化度量作為{S:P}的大小的百分比,{S:P}的大小表示為|{S:P}|,且是{S:P}中的URL的個數。根據該第一評級方法實施例,最佳潛在細化話題是其細化度量最接近50%的細化話題。其細化度量為50%的細化話題將結果分成兩個相等大小的URL集合。下一最佳細化話題是其細化度量是最接近50%的下一度量的細化話題,依此類推。
第一種細化評級方法僅列出一個URL與一個話題的任何附連一次。由此,話題和URL之間的所有附連都被計數一次。在另一實施例中,提供一質量度量作為每一附連的質量的度量。在一種形式中,在URL和話題之間可以有一個以上附連,例如通過用戶作出可能已經存在的附連。見下文對用戶添加附連的描述。所使用的一個質量度量是與同一URL、話題對之間的附連的個數成正比的附連的質量度量。
第二種評級方法考慮到系統用戶所作出的附連分級。可以回想本發明的一方面是提供URL和話題之間的附連的總體質量度量。該第二種評級方法包括對每一潛在的細化話題,確定作為該潛在話題與{S:P}中的任何成員的所有附連的總質量之和的細化度量,作為一個比例,如{S:P}的所有附連的總質量度量的百分比。根據該第二評級方法實施例,最佳潛在細化話題是其細化度量最接近50%的細化話題。下一最佳的細化話題是其細化度量是下一最接近50%的細化度量的細化話題,依此類推。
在一個實施例中,顯示、按字母表順序或以其它方式排序前10個最佳(或某一其它預選數目)細化話題,其中任何同樣是用戶最愛話題的細化話題以某種加亮的方式來顯示。
根據又一實施例,使用了類似于第一方法的第三種評級方法,它也根據{S:P}中與潛在細化話題附連的URL的個數與URL結果的個數({S:P}的大小),一般是結果中信息項的個數之比,為每一潛在細化話題確定一細化度量。根據該第三種評級方法,細化度量是1)與潛在細化話題附連的所標識的信息項的個數與{S:P}中URL的個數之比,以及2){S:P}中不與潛在細化話題附連的URL的個數與{S:P}中URL的個數之比的平方和。該第三種評級方法與細化度量反向地為潛在話題評級。最佳潛在細化話題是具有最小細化度量的細化話題,下一最佳細化話題是具有下一最低細化度量的細化話題,依此類推。
根據再一實施例,使用類似于第二種方法的第四種評級方法,它也根據URL結果與潛在細化話題的附連的質量度量之和與涉及URL結果的附連的質量之和之比來為每一潛在細化話題確定一細化度量。根據該第三種評級方法,細化度量是1)從{S:P},即結果中的信息項與潛在細化話題的所有附連的總體質量度量之和與所標識的信息項的個數之比,以及2)從結果,即{S:P}與除潛在細化話題之外的話題的所有附連的總體質量度量之和與來自{S:P}的所有附連的總體質量度量之和之比的平方和。該第四種評級方法與細化度量反向地為潛在話題評級。最佳潛在細化話題是具有最小細化度量的細化話題,下一最佳細化話題是具有下一最低細化度量的細化話題,依此類推。
在一個實施例中,在輸入了搜索短語,且也存在精確地匹配該搜索短語的話題的情況下,結果如同該話題被選中一樣來呈現。在另一實施例中,結果也將該話題呈現為細化話題,在一種形式中,將其呈現為第一細化話題,即使根據細化話題評級方法該話題并不是“最佳”細化話題。
如先前所描述的,對已注冊搜索者(用戶)還顯示該用戶的最愛話題。如果細化話題中的任一個也在用戶的最愛話題集合中,則這一最愛的細化話題被呈現在以某一加亮方式顯示的所提供的頁面上,例如出現在話題旁邊的優先位置,或者以另一種方法,以粗體或另外強調的顯示字體出現。
當用戶定義了子話題時,它是具有用于該特定用戶的分層結構的一對話題,則細化話題評級方法的一個實施例使用樣的子話題分層結構。例如考慮以話題B結束的搜索話題路徑,并假定C和D都是潛在細化話題。根據本發明的一個實施例,如果與A>D相比更多用戶具有子話題A>C,則該細化話題評級方法將C評級得比D高。
確定相似話題集合相似話題是根據一相似度話題準則來確定的。本發明不限于任一種相似度話題準則。
現在描述第一相似度話題準則。考慮話題D,并假定D具有與集合{S:P}中的多個(表示為XD)URL的附連。各自具有與話題D的肯定分級的附連的URL集合定義為{>D}。具有與D的肯定附連的URL的個數用|{>D}|來表示。如果XD≥|{S:P}|的33%且進一步如果|>D}|,即具有與話題D的肯定附連的所有URL的個數不大于XD的三倍,則話題D是{S:P}的一個細化話題。
根據對話題相似度評級的第一種方法,最佳相似話題是XD=50%且|{>D}|=2XD的相似話題。下一最佳相似話題是比率之和(XD-50%)2+((|{>D}|-2XD)/D)2最小的相似話題。
根據一個替換實施例,用于確定相似話題并對其評級的第二種方法如下。
考慮集合{S:P}。如果滿足以下條件,則D是相似話題1)在話題集合中有話題E,使得{>E}包括{S:P}中的所有話題且|{>E}|不會太大,例如|{>E}|不大于|{S:P}|的三倍;2){>E}也包括在{>D}中;并且3){>D}至少是|{S:P}|的大小的一半。
根據該第二種方法,如果滿足以下條件,則表示為D1的第一相似話題的評級比表示為D2的第二相似話題的評級高|{>E}-({S:P}{>D1})|<|{>E}-({S:P}{>D2})|其中“-”表示集合減法,表示并。由此,如果{<E}中附連的個數比{>D2}和{S:P}的并集中附連的個數更接近{>D1}和{S:P}的并集中附連的個數,則D1的評級比D2高。
顯示本發明的另一方面是向用戶顯示以供搜索并作為搜索結果的用戶界面。
在一個實施例中,搜索結果包括在提供了短語的情況下對搜索短語進行搜索的結果,以及選擇一話題的進一步結果,但是在搜索話題路徑的情況下也可以是查看與所選話題或話題集合具有附連的URL的結果。
當在搜索中顯示URL時,首先以與路徑反向的順序顯示與用戶相關聯的URL。“所選的”URL例如用相鄰的星來標記。例如,如果話題路徑是A>B>C,則與用戶相關聯且具有與C的附連的那些URL被顯示在與B附連的那些URL之前,而與B附連的那些URL被顯示在與A附連的那些URL之前。
在一個實施例中,具有被特定用戶分級為垃圾的附連的URL完全不向該用戶顯示。
用戶信息在一個實施例中,當用戶登錄到系統時,向用戶提供該用戶的總體可信性。在用戶數據庫表179中維護總體可信性度量的不同分量,例如貢獻指標以及用戶的原始可信性以供系統使用。
盡管是內部的,但在數據庫177的用戶表179中為每一用戶的總體可信性維護一數值度量,例如作為由0和1之間的數字表示的度量,并且為顯示的目的,使用更直觀的度量。一個實施例使用了字母等級,例如字母等級集合A+、A、A-、B+、B、B-、C+、C、C-、D+、D和D-中的一個等級。在另一實施例中,使用星體系。其它替換實施例使用在視覺上提供容易理解的可信性度量的替換機制。
用戶界面本發明的另一方面是用于在不必為分層的話題集合的引導下搜索URL的協作搜索引擎和搜索方法的用戶界面。本發明的一方面是向搜索者呈現包括供搜索者輸入搜索短語的供應項以及供搜索者例如通過提供用戶ID來指示該搜索者是用戶的供應項的用戶界面顯示。
圖5示出了初始用戶界面顯示500。其中包括供用戶輸入例如作為電子郵件地址的用戶ID的窗口503,以及指示用戶信息已被輸入的按鈕505。用戶界面顯示500包括供不是用戶的搜索者輸入注冊信息的供應項507。點擊“Click to Register”(點擊注冊)507使得服務器提供一注冊頁面。搜索者輸入注冊信息。該注冊信息被發送給服務器,且作為結果,修改數據庫177中的用戶表179。現在提供一用戶專用頁面并替換了初始頁面500。
繼續圖5,初始用戶界面顯示500包括窗口509和按鈕511形式的供搜索者輸入初始搜索短語的供應項。
在另一實施例中,初始頁面包括話題集合的初始子集。
用戶輸入一搜索短語,或者在其中話題的初始子集已被呈現在第一呈現的用戶界面顯示的實施例中,用戶輸入話題之一。結果,本發明的另一方面是向搜索者呈現第二用戶界面顯示,該界面顯示是從用戶選擇搜索短語所得的,或者在話題的初始子集已被呈現在第一呈現的用戶界面顯示的情況下,是從用戶選擇話題之一所得的。第二用戶界面顯示包括作為對搜索短語進行搜索的結果的URL(或者對于包括最初呈現的話題子集的實施例,如果選擇了話題,則是附連到話題的URL)形式的搜索結果。第二用戶界面包括從話題集合中選擇的幫助用戶進行進一步搜索的建議話題的集合。在一種形式中,該第二子集包括根據一細化話題準則細化從話題集合中選擇的搜索的一個或多個話題。在另一種形式中,該第二子集包括與作為搜索的結果的URL有關的一個或多個話題。該用戶界面向搜索者提供了用于例如通過點擊所呈現的話題來選擇話題之一的供應項。
搜索者現在可通過提供搜索短語或通過選擇建議的話題之一來繼續搜索。這得到具有作為搜索的結果的新URL和新的建議話題集合,包括細化話題的新的第二用戶界面。用戶現在可繼續。結果,對于特定搜索,為搜索者在進行中確定一話題分層結果,作為搜索者選擇的話題的結果。
作為一個示例,假定搜索者對在加利福尼亞州的Half Moon Bay的徒步旅行路線感興趣。最初,搜索者輸入“Half Moon Bay”作為搜索短語。假定話題集合包括話題“Half Moon Bay”。
在一個實施例中,在輸入了搜索短語,且還存在精確匹配該搜索短語的話題的情況下,結果如同該話題被選中那樣來呈現。由此,由于存在精確匹配該搜索短語的話題,因此搜索結果如同搜索者選擇了話題“Half Moon Bay”的搜索結果。在話題“Half Moon Bay”之下呈現URL和細化話題的集合。結果,呈現細化話題的集合以及附連到話題“Half Moon Bay”的URL的搜索結果。如可以想像的,這些包括Half Moon Bay的酒店以及與“Half Moon Bay”有關的其它信息。建議的細化話題因此可包括California(加利福尼亞州)、Accommodation(住宿)等等。假定細化話題包括話題“Things to do”(要做的事情)。還假定搜索者選擇該話題作為下一話題,則再一次呈現URL集合和建議話題的集合,包括細化話題。假定細化話題包括話題“Whale watching”(鯨魚觀賞)、“Bird Watching”(鳥類觀賞)、“Fishing”(釣魚)、“Hiking”(徒步旅行)等。對徒步旅行路線感興趣的搜索者選擇“Hiking”。假定作為結果,有URL和建議話題的集合,且假定建議話題之一是“Trails”(路線)。假定用戶選擇“Trails”。
圖6示出了對該示例在該搜索階段可能得到的第二用戶界面顯示600。所呈現的用戶界面顯示包括搜索話題路徑603的指示,在此情況下為“Half MoonBay>Things to do>Hiking>Trails”。所呈現的用戶界面顯示還包括結果607,在此情況下為系統中總共600個URL的前三個URL。對每一結果,在顯示中提供附連到該URL的標題和簡短描述,使得搜索者選擇(點擊)所顯示的結果的任一個將使由該URL定義的網頁被顯示。在圖6的情況下,結果中URL的個數使得需要若干個頁面來示出結果中的所有URL。所呈現的用戶界面顯示包括正在顯示多頁面結果中的哪一頁面的指示613,并且還產生選擇其它頁面之一的機制以及顯示下一頁面的機制。如果所顯示的頁面是除第一個頁面之外的頁面,則還顯示用于顯示前一頁面的機制。
所呈現的用戶界面顯示還包括細化話題集合605形式的建議話題的集合。在一個實施例中,包括圖6中所示的那些的相似話題集合609也用供搜索者選擇相似話題之一來替換搜索話題路徑的機制來顯示。在一個實施例中,還顯示每一建議的話題之下的URL的個數。
所呈現的用戶界面顯示的一個實施例還包括供搜索者提供附加搜索短語以在搜索話題路徑中搜索的機制。在圖6中,這采用了其中用戶可輸入搜索短語的文本窗口611,以及啟動搜索中的下一步的按鈕615的形式。
注意,一替換實施例進一步不僅示出了系統中的搜索的結果,例如與搜索話題路徑中的每一話題有至少一個附連的URL的結果,還示出了Web搜索的結果。還注意,在所示的實施例中,還顯示廣告鏈接615。在其它替換實施例中,還包括其它鏈接。
圖6的所呈現的用戶界面顯示還包括供搜索者開始新搜索的機制,并且還包括如果搜索者是用戶則供搜索者登入的機制。即,圖6的所呈現的用戶界面顯示包括圖5的第一呈現的用戶界面顯示的機制。
例如,假定用戶在此階段登入,或假定用戶在早先的階段登入,并同樣到達搜索話題路徑“Half Moon Bay>Things to do>Hiking>Trails”。
當用戶登入時,將用戶ID發送給服務器,服務器確定該潛在用戶是否已注冊。如果搜索者實際上是用戶,則服務器提供包括用戶專用信息的經修改的頁面。由此,本發明的另一方面是向作為用戶的搜索者呈現包括用戶專用信息的第三用戶界面顯示的方法。
圖7示出了對于本示例在搜索的這一階段可能得到的第三用戶界面顯示700。所呈現的用戶界面顯示700包括主顯示區域750和用戶專用探查器欄(或其它附加窗口)760。所呈現的用戶界面顯示700包括對當前用戶的指示719,在本示例中作為具有用戶在注冊期間選擇的用戶名的歡迎(Welcome)消息。如果所示的用戶名是不同的用戶,則還為用戶提供了例如通過登入來指示的供應項。還提供了登出供應項79,在本示例中它在探查器欄760中,以供用戶登出。
所呈現的用戶界面顯示的主窗口750包括圖6所示的結果的修改,但是是以用戶專用的方式來修改的。例如,主窗口750包括搜索話題路徑指示703,在本示例中同樣是“Half Moon Bay>Things to do>Hiking>Trails”。在一個實施例中,包括了向所儲存的用戶最愛的搜索話題路徑的集合添加當前搜索話題路徑的供應項,在本實施例中作為標記為“Add to My Topixa”(添加到My Topixa)的可點擊對象717或類似的標志,其中在本示例中,“My Topixa”是用戶的用戶專用信息,諸如用戶的最愛話題、肯定分級的附連以及其它用戶專用信息。在一個實施例中,主窗口750還包括消息區域745,在本示例中它被示為包含消息“This topic path hasbeen added to My Topixa”(該路徑已被添加到My Topixa)。這一消息可例如在用戶點擊可點擊對象717以使當前搜索話題路徑703成為最愛話題之后得到。
在一個實施例中,所呈現的第三用戶界面顯示700的主顯示窗口750還包括URL結果701,在本實施例中,它在三個不同的呈現中。第一個呈現包括肯定分級的,例如“最愛”的結果,即,與搜索話題路徑中用戶“選擇”要作為用戶的“最愛”附連包括的話題有附連的那些URL。第二個列表743是總體結果的列表,例如,圖6的列表607中所呈現的URL。在一個實施例中,沒有包括用戶選為“垃圾”的任何結果。即,在一個實施例中,那些“被分為垃圾”的URL不在第二列表743中示出。由此,在本示例中,總體結果的列表具有比圖6的結果607少的URL。
如同圖6的情況一樣,結果中的URL個數使得需要若干頁面來示出結果中的所有URL。所呈現的用戶界面顯示700的主窗口750包括正在顯示多頁面結果中的哪一頁面的指示,并且還包括選擇其它頁面之一的機制、以及顯示下一頁面的機制。如果所顯示的頁面是除第一個頁面之外的頁面,則還顯示用于選擇前一頁面的機制。
圖7詳細示出了最愛URL。對于每一結果,在顯示中提供標題和簡短描述,它們鏈接到該URL,使得搜索者選擇(點擊)所顯示的結果中的任一個將使由該URL定義的網頁被顯示。在一個實施例中,還呈現首先定義該URL的附連的用戶的標識符725。同樣顯示的還有系統對用戶的可信性747。
在一個實施例中,所呈現的用戶界面顯示700的主窗口750在最愛結果707中包括例如復選窗口721形式的將一個或多個結果“分為垃圾”的供應項、以及用“Delete link from My Topixa”(從My Topixa中刪除鏈接)適當標記的“junk”(分為垃圾)按鈕723,其中“My Topixa”是搜索話題路徑下的最愛附連的列表。復選任何結果并點擊所提供的按鈕723對所標記的URL與搜索話題路徑的附連進行否定分級。
通過點擊總體結果743在本示例頁面3中選擇總體結果中的第一個頁面類似地產生總體結果的第一頁面。在這一情況下,在一個實施例中,所呈現的用戶界面顯示700的主窗口750在總體結果中包括選擇結果中的一個或多個的供應項,該供應項例如采用復選窗口和例如用“Add to My Topixa”或類似的注釋適當標記的“addto favorites”(添加到最愛)按鈕的形式。復選任何結果并點擊所提供的按鈕對所標記的URL與搜索話題路徑的附連進行肯定分級。
在一個實施例中,所呈現的用戶界面顯示700的主窗口750包括在Web上搜索搜索話題路徑中的詞語的結果。
所呈現的用戶界面顯示700的主窗口750還包括細化話題集合705形式的建議話題集合。在一個實施例中,還顯示每一建議話題下的URL的個數。所呈現的用戶界面顯示窗口750的一個實施例還包括供搜索者提供附加搜索短語以在搜索話題路徑中搜索的機制。在圖7中,該機制采用了其中用戶可輸入搜索短語的文本窗口711以及啟動搜索中的下一步的按鈕715的形式。
在一個實施例中,將細化話題集合連同關于建議話題中的哪一個是用戶的最愛話題的指示一起呈現。在圖7中,在列表705中示出了星以指示最愛的建議話題。此外,順序是使得最愛的建議話題被呈現在其它建議話題之前的順序。在圖7所示的示例中,建議的細化話題中的三個“family trails”(家庭路線)、“long trails”(長途路線)和“nature hikes”(自然徒步)是最愛,例如先前已被該用戶選為最愛。因此,圖7中建議的細化話題的順序可以且在本示例中也的確與圖6的建議的細化話題605的順序不同。
在一個實施例中,所呈現的用戶界面顯示700包括提供用戶專用信息的用戶專用探查器欄760(或類似的面板)。在一個實施例中,如果當前的搜索話題路徑成為最愛,則顯示該搜索話題路徑731。在一個替換實施例中,即使當前的搜索話題路徑并未成為最愛,也顯示該搜索話題路徑731。提供了用于顯示和管理所有最愛搜索話題路徑的可點擊對象,并且提供了用于將新的搜索話題路徑作為最愛搜索話題路徑來添加的此處標記為“New...”(新建)727的可點擊對象。
在一個實施例中,探查器欄(或類似的面板)760包括對當前搜索話題路徑的用戶的最愛附連的列表741。探查器欄(或類似的面板)760還包括在圖7中被標記為“Add currentpage”(添加當前頁面)的用于添加當前顯示的搜索話題路徑與主窗口750中顯示的網頁之間的附連的可點擊對象739。由此,用戶通過點擊結果701之一來選擇一網頁。這使得該URL被提供并被顯示在主窗口750中。用戶現在點擊可點擊對象739使得信息被發送到服務器,服務器添加主窗口中顯示的URL與當前顯示的搜索話題路徑731中的每一話題的附連。
由此,提供了供用戶對所顯示的搜索結果與搜索話題路徑之間的任何附連的質量進行分級的機制。
在一個實施例中,所呈現的第三用戶界面顯示的探查器欄(或類似的面板)760包括供用戶添加話題或子話題的供應項。在所示的形式中,該供應項采用了當被調用時使得服務器提供用于向當前顯示的搜索話題路徑,例如向搜索話題路徑中的最后一個話題添加新話題或子話題的彈出頁面的可點擊對象737。每一新話題或子話題成為該特定用戶的最愛。
圖8示出了作為用戶點擊圖7的探查器面板760中的“Add newtopic/subtopic...”(添加新話題/子話題)對象的結果而提供的彈出窗口800的一個實施例。在一個實施例中,彈出窗口800包括當前搜索話題路徑的顯示803,以及被示為以“Save”(保存)標記供用戶輸入新話題或子話題的機制,在本情況中為可填充文本窗口805和按鈕807。提供了復選框809用于指示對于用戶新話題是否要作為子話題添加到搜索話題路徑中的最后一個話題-在所示的示例中為話題“Trails”。彈出窗口800還包括取消對話題或子話題的添加的可點擊對象。
如此已描述了用于按不必為分層的話題集合的引導來進行搜索的方法。
除非另外具體規定,否則如可從以下討論中清楚的,可以理解,在本說明書的全部討論中利用的諸如“處理”、“計算”、“運算”、“確定”等術語指的是計算機或計算系統或類似的電子計算設備的動作和/或進程,該動作和/或進程將表示為諸如電子量等物理量的數據處理和/或變換成同樣表示為物理量的其它數據。
以類似的方式,術語“處理器”可以指處理例如來自寄存器和/或存儲器的電子數據以將該電子數據變換成例如可被儲存在寄存器和/或存儲器中的其它電子數據的任何設備或設備的一部分。“計算機”或“計算機器”或“計算平臺”可包括一個或多個處理器。
此處所描述的方法在一個實施例中可由包括接受含有指令的計算機可讀(也稱為機器可讀)代碼的一個或多個處理器的機器來執行。對于此處所描述的方法中的任一種,當指令由機器執行時,該機器執行該方法。能夠執行指定要由該機器采取的動作的指令集(順序地或以其它方式)的任何機器都被包括在內。由此,一種典型的機器可用包括一個或多個處理器的典型處理系統為例。每一處理器可包括CPU、圖形處理單元以及可編程DSP單元中的一個或多個。處理系統還可包括包含主RAM和/或靜態RAM和/或ROM的存儲器子系統。可包括總線子系統以在組件之間進行通信。如果處理系統需要顯示器,則可包括這樣的顯示器,例如液晶顯示器(LCD)或陰極射線管(CRT)顯示器。如果需要手動數據輸入,則處理系統還包括輸入設備,例如諸如鍵盤等字母數字輸入單元、諸如鼠標等定點控制設備等中的一個或多個。此處使用的術語存儲器單元還包含諸如盤驅動器單元等存儲系統。某些配置中的處理系統可包括聲音輸出設備以及網絡接口設備。因此,存儲器子系統包括承載指令的計算機可讀代碼(例如,軟件)的承載介質,該指令用于在被處理系統執行時實現此處所描述的方法中的一種或多種。注意,當方法包括若干元素,例如若干步驟時,除非特別規定,否則并不暗示這些元素的排序。軟件可駐留在硬盤內,或者也可在其被計算機系統執行期間完全或至少部分地駐留在RAM和/或處理器內。由此,存儲器和處理器也構成了承載計算機可讀代碼的承載介質。
在替換實施例中,機器作為獨立的設備來操作,或者在聯網部署中,可連接到,例如聯網到其它機器,在服務器-客戶機網絡環境中,機器可作為服務器或客戶機來操作,或在對等或分布式網絡環境中作為對等機器來操作。機器可以是個人計算機(PC)、圖形輸入板PC、機頂盒(STB)、個人數字助理(PDA)、蜂窩電話、web設備、網絡路由器、交換器或網橋、或能夠執行指定要由該機器采取的動作的指令集(順序地或以其它方式)的任何機器。
注意,盡管某一(些)視圖僅示出了單個處理器和承載計算機可讀代碼的單個存儲器,但是本領域的技術人員可以理解,上述組件中的許多都被包括在內,但是未明確示出或描述以免使本發明方面晦澀。例如,盡管僅示出了單個機器,但是術語“機器”應當被認為是包括單獨或聯合地執行指令集(或多個指令集)以實現此處所討論的方法中的任一種或多種的機器的任何集合。
由此,此處所描述的方法的每一種的一個實施例采用了在處理器系統,例如作為搜索服務器的一部分的一個或多個處理器上執行的計算機程序的形式。由此,如本領域的技術人員可以理解的,本發明的實施例可被具體化為方法、諸如專用裝置等裝置、諸如數據處理系統等裝置或例如計算機程序產品等承載介質。承載介質承載了用于控制處理系統實現方法的計算機可讀代碼。因此,本發明的各方面可采用方法、完全硬件實施例、完全軟件實施例或組合了軟件和硬件方面的實施例的形式。此外,本發明可采用承載了包含在介質中的計算機可讀程序代碼的承載介質(例如,計算機可讀存儲介質上的計算機程序產品)的形式。
軟件還可經由網絡接口設備通過網絡來發送或接收。盡管承載介質在一個示例性實施例中被示為是單個介質,但是術語“承載介質”應當被認為是包括儲存一個或多個指令集的單個介質或多個介質(例如,集中式或分布式數據庫,和/或相關聯的高速緩存和服務器)。術語“承載介質”也應當被認為是包括能夠儲存、編碼或承載供機器執行并使得機器實現本發明的方法中的任一種或多種的指令集的任何介質。承載介質可采用多種形式,包括但不限于非易失性介質、易失性介質和傳輸介質。非易失性介質包括例如光盤、磁盤和磁光盤。易失性介質包括諸如主存儲器等動態存儲器。傳輸介質包括同軸電纜、銅線和光纖,包括構成總線子系統的導線。傳輸介質還可以采用聲波或光波的形式,諸如在無線電波和紅外數據通信期間生成的那些波。例如,術語“承載介質”相應地應當被認為包括但不限于固態存儲器、光學和磁性介質以及載波信號。
可以理解,所討論的方法的步驟在一個實施例中由執行儲存在存儲中的指令(計算機可讀代碼)的處理系統(即,計算機)的適當處理器(或多個處理器)執行。還可以理解,本發明不限于任何特定的實現或編程技術,并且本發明可使用用于實現此處所描述的功能的任何適當的技術來實現。本發明不限于任何特定的編程語言或操作系統。
貫穿本說明書對“一個實施例”或“一實施例”的參考指的是結合該實施例描述的特定特征、結構或特性被包括在本發明的至少一個實施例中。由此,短語“在一個實施例中”或“在一實施例中”在本說明書各處的出現不必都指代同一實施例。此外,如本領域的普通技術人員從本公開內容中可以清楚的,特定的特征、結構或特性在一個或多個實施例中可用任何適當的方式來組合。
類似地,應當理解,在以上對本發明示例性實施例的描述中,為流線化本發明的公開并有助于理解各個發明性方面中的一個或多個的目的,本發明的各種特征有時候在單個實施例、附圖或其描述中被分組在一起。然而,本發明公開的方法并不被解釋為反映了所要求保護的本發明需要比在每一權利要求中明確所述的更多的特征的意圖。相反,如所附權利要求書所反映的,各發明性方面在于少于單個上述公開的實施例的全部特征。由此,詳細描述之后的權利要求書此處被明確地結合到該詳細描述中,其中每一權利要求獨立地作為本發明的一個單獨實施例。
此外,盡管此處描述的某些實施例包括其它實施例中所包括的某些特征但不包括其它特征,但是不同實施例的特征的組合意味著落入本發明的范圍之內,并形成不同的實施例,如本領域的技術人員可以理解的。例如,在所附權利要求書中,所要求保護的實施例的任一個可在任何組合中使用。
此外,此處將某些實施例描述為可由計算機系統的處理器或實現功能的其它裝置實現的方法或方法元素的組合。由此,處理器連同用于實現這一方法或方法元素的必要指令一起形成了用于實現方法或方法元素的裝置。此外,此處所描述的裝置實施例的元件是用于實現由該元件為實現本發明的目的而執行的功能的裝置的示例。
在此處所提供的描述中,陳述了眾多具體細節。然而,可以理解,本發明的實施例可以在沒有這些具體細節的情況下實現。在其它情況下,未示出公知的方法、結構和技術以免使對本說明書的理解晦澀。
如此處所使用的,除非另外指明,否則對序數詞“第一”、 “第二”、“第三”等的使用來描述一公共對象僅指示指代了相同對象的不同實例,而不意圖暗示如此描述的對象必須在時間上、空間上、排序上或以任何其它方式為給定的順序。
此處所引用的所有出版物、專利和專利申請都通過引用結合于此。
在所附權利要求書和此處的說明書中,術語“包括”、“由……組成”或“其中包括”中的任一個是開放式術語,意味著至少包括以下元素/特征而不排除其它。由此,當在權利要求書中使用時,術語“包括”不應被解釋為對之后列出的裝置或元素或步驟是限制性的。例如,表達方法“設備包括A和B”的范圍不應限于該設備僅包括元素A和B。此處所使用的術語“包含”或“其中包含”或“它包含”中的任一個也是開放式術語,它們也意味著至少包括該術語之后的元素/特征而不排除其它。由此,“包含”與“包括”同義并意味著“包括”。
類似地,要注意,當在權利要求書中使用時,術語“耦合”不應被解釋為僅限于直接連接。可使用術語“耦合”和“連接”及其派生詞。應當理解,這些術語并不旨在是彼此的同義詞。由此,表達方式“設備A耦合到設備B”的范圍不應限于其中設備A的輸出直接連接到設備B的輸入的設備或系統。它意味著在A的輸出和B的輸入之間存在一條路徑,該路徑可以是包括其它設備或裝置的路徑。“耦合”可以意味著兩個或更多元件或者直接物理或電接觸,或者兩個或更多元件不是彼此直接接觸而仍共同操作或彼此交互。
由此,盡管描述了所謂的本發明的較佳實施例,但是本領域的技術人員將認識到,可在不脫離本發明的精神的前提下對其作出其它和進一步的修改,且旨在聲明所有這些改變和修改都落入本發明的范圍之內。例如,以上給出的任何公式僅表示可使用的過程。可向框圖添加或刪除功能,并且可在功能塊中互換操作。可向在本發明的范圍內描述的方法添加或刪除步驟。
本申請的權利要求1、3和10-16被修改。權利要求45現在重新編號為權利要求59。增加了權利要求45-58和60-62。
權利要求1增加了說明書中的特征,即建議話題是細化話題、相似話題中的任一個或者既是細化話題又是相似話題。修改權利要求3和10-16以糾正打字錯誤和/或使權利要求變為多項從屬,或更改語序。
新的權利要求45-58和60-62要求保護了所提交的申請中描述的特征。
如有任何問題或意見,請聯系署名者,電話+1-510-547-3378,傳真+1-510-291-2985,email:dov@inventek.com
1.一種指導由話題集合輔助的搜索的計算機實現的方法,所述話題不必具有分層結構,每一話題具有與多個信息項中的至少一個信息項的至少一個附連,所述方法包括根據由第一搜索者提供的搜索請求信息為所述第一搜索者標識所述多個信息項中的一個或多個信息項,所述搜索請求信息包括由搜索短語和所述話題集合中的一個或多個搜索話題的子集構成的組中的至少一個;從所述話題集合中確定一個或多個建議話題,所述建議話題是根據所述建議話題與一個或多個所標識的信息項的附連來確定的;以及向所述第一搜索者提供搜索結果,所述搜索結果包括所標識的信息項中的至少某一些和所述建議話題中的至少一個,其中,所述建議話題包括來自由以下兩個集合構成的組的一個或多個話題的至少一個集合使用一細化選擇方法根據一細化話題準則從所述話題集合中確定的一個或多個細化話題的第一集合,以及使用一相似度話題選擇方法根據一相似度話題準則從所述話題集合中確定的一個或多個相似話題的第二集合,使得所述第一搜索者選擇所述建議話題之一將引起生成包括一新的建議話題集合的新結果,并使得在選擇細化話題的情況下,為所述第一搜索者的特定搜索在進行中形成一話題分層結構。
2.如權利要求1所述的方法,其特征在于,所述話題和所述信息項之間的附連的至少某一些是由用戶定義的,用戶是已提供了注冊信息的搜索者。
3.如權利要求2所述的方法,其特征在于,所述附連中的至少一個具有附連質量度量,所述話題和信息項之間的附連的附連質量度量是從由用戶提供的分級中確定的,一特定附連最初被分配當更多用戶對所述附連分級時可改變的初始質量度量。
4.如權利要求3所述的方法,其特征在于,所述細化選擇方法考慮任何潛在細化話題和所標識的信息項之間的附連的附連質量度量。
5.如權利要求1所述的方法,其特征在于,根據所述細化話題選擇方法,潛在細化話題是具有與所標識的項的至少一個的附連的話題,且所述細化話題是從所述潛在細化話題中選擇的。
6.如權利要求5所述的方法,其特征在于,所述細化話題選擇方法包括對潛在細化話題評級以為所述細化話題確定排序的細化話題評級方法。
7.如權利要求6所述的方法,其特征在于,所述細化話題評級方法確定一細化度量,它對每一潛在細化話題確定取決于所標識的信息項中與所述潛在細化話題附連的個數與所標識的信息項的個數之比的細化度量。
8.如權利要求7所述的方法,其特征在于,所述細化評級方法包括對每一潛在細化話題,確定作為所標識的信息項中與所述潛在細化話題附連的個數與所標識的信息項的個數之比的細化度量,使得評級最高的潛在細化話題是其細化度量最接近表達為百分比的50%的細化話題,且下一評級最高的潛在細化話題是其細化度量是下一最接近于被表達為百分比的50%的細化話題,由此其細化度量是被表達為百分比的50%的細化話題將所標識的信息項分為兩個相等大小的信息項集合。
9.如權利要求7所述的方法,其特征在于,所述細化評級方法包括對每一潛在細化話題,根據以下兩項的平方和確定細化度量所標識的信息項中與所述潛在細化話題附連的個數與所標識的信息項的個數之比,以及所標識的信息項中不與所述潛在細化話題附連的個數與所標識的信息項的個數之比,使得評級最高的潛在細化話題是其細化度量最小的細化話題,且下一評級最高的潛在細化話題是其細化度量為下一最小的細化話題。
10.如權利要求7所述的方法,其特征在于,所述附連中的至少一個具有附連質量度量,所述話題和信息項之間的附連的附連質量度量是從由用戶提供的分級中確定的,一特定附連最初被分配當更多用戶對所述附連分級時可改變的初始質量度量,以及所述細化評級方法包括對每一潛在細化話題,根據以下兩項的平方和確定細化度量所述潛在細化話題與所標識的信息項中的任一個的所有附連的總體質量之和與所標識的信息項的所有附連的總質量度量之比,以及所標識的信息項中的任一個與除所述潛在細化話題之外的任何話題之間的所有附連的總體質量之和與任何所標識的信息項的所有附連的總質量度量之比,使得評級最高的潛在細化話題是其細化度量最小的細化話題,且下一評級最高的潛在細化話題是其細化度量為下一最小的細化話題。
11.如前述權利要求中任一項所述的方法,其特征在于,每一信息項是網頁。
12.如前述權利要求中任一項所述的方法,其特征在于,還包括從用戶接受所述多個信息項之一與所述話題集合之一之間的新附連,用戶是已提供了注冊信息的搜索者。
13.如前述權利要求中任一項所述的方法,其特征在于,還包括從用戶接受要添加到所述話題集合的新話題以及所述多個信息項之一與所述新話題之間的新附連,用戶是已提供了注冊信息的搜索者。
14.如前述權利要求中任一項所述的方法,其特征在于,所述標識一個或多個信息項包括從所述第一搜索者接受所述搜索請求信息;以及根據所接受的搜索請求信息以及一個或多個搜索準則搜索所述多個信息項以標識所述一個或多個信息項,所述搜索準則包括所標識的信息項各自具有與所接受的搜索請求信息中的每一話題的附連。
15.如前述權利要求中任一項所述的方法,其特征在于,所述提供搜索結果包括向所述第一搜索者顯示所述搜索的結果,以及其中,所述第一搜索者選擇所述建議話題之一引起向新搜索者顯示所生成的新結果。
16.一種指導由話題集合輔助的搜索的計算機實現的方法,所述話題不必具有分層結構,所述話題集合中的每一話題具有與多個信息項中的至少一個信息項的至少一個附連,所述方法包括定義所述附連,所述對每一附連的定義是由至少一個用戶進行的,用戶是已提供了注冊信息的搜索者,所述定義附連包括從至少一個用戶接受至少一個話題與所述多個信息項中的至少一個信息項之間的至少一個附連,使得所述話題集合中的每一話題具有與所述多個信息項中的至少一個信息項的至少一個附連;
根據由第一搜索者提供的搜索請求信息為所述第一搜索者標識所述多個信息項中的一個或多個信息項,所述搜索請求信息包括由搜索短語和來自所述話題集合的搜索話題構成的組中的至少一個;從所述話題集合中確定一個或多個建議話題,所述建議話題是根據所述建議話題與一個或多個所標識的信息項的附連來確定的;以及向所述第一搜索者提供搜索結果,所述搜索結果包括所標識的信息項中的至少某一些和所述建議話題中的至少一個,其中所述建議話題包括使用一細化選擇方法根據一細化話題準則從所述話題集合中確定的一個或多個細化話題,使得選擇所述建議話題之一將生成一新的建議話題集合,使得為特定搜索在進行中形成一話題分層結構。
17.如權利要求16所述的方法,其特征在于,不同用戶定義同一話題和同一信息項之間的不同附連,使得由不同用戶定義的多個附連可存在于一特定話題和一特定信息項之間。
18.如權利要求17所述的方法,其特征在于,一特定話題和一特定URL之間的每一附連具有從由不同用戶提供的所述特定話題和所述特定URL之間的不同附連個數確定的附連質量度量。
19.如權利要求17所述的方法,其特征在于,一特定話題與一特定URL之間的每一附連具有從由不同用戶提供的分級中確定的附連質量度量,每一附連最初被分配當更多用戶對所述附連分級時可改變的初始質量度量。
20.如權利要求19所述的方法,其特征在于,對一特定附連分級的特定用戶根據一二元值分級來對所述附連分級,所述二元值分級具有第一分級(“肯定”)和不如所述第一分級令人滿意的第二分級(“否定”)。
21.一種方法,包括定義話題集合中的每一話題與信息項集合中的相應信息項之間的一個或多個附連,所述話題不必具有分層結構,所述對每一附連的定義是由至少一個用戶進行的,用戶是已提供了注冊信息的搜索者,所述定義附連包括從至少一個用戶接受至少一個話題與所述多個信息項中的至少一個信息項之間的至少一個附連,使得所述話題集合中的每一話題具有與所述多個信息項中的至少一個信息項的至少一個附連,
其中所述話題用于由特定搜索者根據由所述特定搜索者提供的搜索請求信息在所述多個信息項中搜索一個或多個信息項,所述搜索請求信息包括所述話題集合中的至少一個話題,所述搜索包括標識具有與所述搜索請求信息中的至少一個話題的附連的至少一個或多個信息項。
22.如權利要求21所述的方法,其特征在于,還包括從用戶接受要添加到所述話題集合的新話題;以及將所接受的新話題添加到所述話題集合。
23.如權利要求21所述的方法,其特征在于,預定義初始的多個話題。
24.如權利要求21所述的方法,其特征在于,第一用戶定義第一話題與第一信息項之間的第一附連以及第二用戶定義所述第一話題與所述第一信息項之間的附連的結果是在所述第一話題與所述第一信息項之間存在至少兩個附連。
25.如權利要求24所述的方法,其特征在于,還包括從用戶接受對所述話題集合中的一特定話題與一特定信息項之間的特定附連的分級,使得所述特定話題與所述特定信息項之間的多個附連可具有不同的分級。
26.如權利要求25所述的方法,其特征在于,所述分級具有兩個值,即第一值(“肯定”)和不如第一值令人滿意的第二值(“否定”)。
27.如權利要求25所述的方法,其特征在于,所述分級具有兩個以上值。
28.如權利要求25所述的方法,其特征在于,還包括基于用戶對所述特定話題與所述特定信息項之間的附連的分級,為所述特定話題和所述特定信息項之間的一個或多個附連確定一總體附連質量。
29.一種提供用于一搜索方法的用戶界面的計算機實現的方法,所述搜索方法由一話題集合來輔助,所述話題不必具有分層結構,每一話題具有與多個信息項中的至少一個信息項的至少一個附連,所述方法包括引起向第一搜索者顯示第一用戶界面,所述用戶界面允許所述搜索者輸入包括由搜索短語和所述話題集合中的一個或多個搜索話題的子集構成的組中的至少一個的搜索請求信息;執行所述搜索方法,所述搜索方法包括接受所述第一搜索者輸入的所述搜索請求信息;根據所接受的搜索請求信息標識所述多個信息項中的一個或多個信息項;以及從所述話題集合中確定一個或多個建議話題,所述建議話題是根據所述建議話題與一個或多個所標識的信息項的附連來確定的;以及作為執行所述搜索方法的結果,引起向所述第一搜索者顯示第二用戶界面,所述第二用戶界面包括所標識的信息項中的至少某一些和所述建議話題中的至少一個,所述第二用戶界面為所述第一搜索者提供了選擇所述建議話題之一的能力,其中所述建議話題包括使用一細化選擇方法根據一細化話題準則從所述話題集合中確定的一個或多個細化話題,使得所述第一搜索者使用所顯示的第二用戶界面選擇所述建議話題之一生成一新的建議話題集合,并引起向所述第一搜索者顯示所述新建議話題集合中的至少某些話題,使得對所述第一搜索者的特定搜索在進行中形成一話題分層結構。
30.如權利要求29所述的方法,其特征在于,向查看者最多顯示預定個數的細化話題。
31.如權利要求29所述的方法,其特征在于,所述第一用戶界面和所述第二用戶界面分別是第一網頁和第二網頁。
32.如權利要求29所述的方法,其特征在于,還包括從所述搜索者接受新的搜索請求信息;確定包括所標識的信息項集合和一個或多個建議話題的新集合的新搜索結果,所述新搜索結果是通過向所接受的新搜索請求信息應用所述一個或多個搜索準則來確定的;以及向所述搜索者呈現所述新搜索結果。
33.如權利要求32所述的方法,其特征在于,所接受的新搜索請求信息包括從先前的建議話題中選擇的話題;所述新搜索結果中的信息項具有與所述從先前的建議話題中選擇的話題的附連。
34.如權利要求29所述的方法,其特征在于,呈現給所述第一搜索者的建議話題包括根據與所標識的信息項有關的話題相似度準則從所述話題集合中確定的一個或多個相似話題。
35.如權利要求34所述的方法,其特征在于,所述相似話題是根據依照一相似度話題評級方法來確定的相似度評級來排序的。
36.如權利要求35所述的方法,其特征在于,最多向查看者顯示預定個數的相似話題。
37.一種方法,包括
定義一話題集合用于附連到多個信息項中的一個或多個信息項,所述定義是由至少一個用戶進行的,用戶是已提供了注冊信息的搜索者,所述定義話題包括從至少一個用戶接受至少一個話題;以及將所述話題添加到所述話題集合,其中所述話題不必具有分層結構;其中每一話題用于附連到所述多個信息項中的一個或多個信息項,以及其中附連到至少一個信息項的所述話題用于由特定搜索者根據由所述特定搜索者提供的搜索請求信息來搜索所述多個信息項中的一個或多個信息項,所述搜索請求信息包括所述話題集合中的至少一個話題,所述搜索包括標識具有與所述搜索請求信息中的至少一個話題的附連的至少一個信息項。
38.如權利要求37所述的方法,其特征在于,還包括從至少一個用戶接受所述話題集合中的至少一個話題與所述多個信息項中的至少一個信息項之間的至少一個附連;以及對先前沒有與一信息項的附連的任何話題,將所述話題添加到一個或多個話題的組,所述一個或多個話題中的每一個具有與所述多個信息項中的至少一個信息項的至少一個附連。
39.如權利要求37所述的方法,其特征在于,預定義一初始話題集合。
40.如權利要求38所述的方法,其特征在于,第一用戶定義第一話題與第一信息項之間的第一附連以及第二用戶定義所述第一話題與所述第一信息項之間的附連的結果是在所述第一話題與所述第一信息項之間存在至少兩個附連。
41.如權利要求39所述的方法,其特征在于,還包括從用戶接受對所述話題集合中一特定話題與一特定信息項之間的特定附連的分級,使得所述特定話題與所述特定信息項之間的多個附連可具有不同的分級。
42.如權利要求41所述的方法,其特征在于,所述分級具有兩個值,即第一值(“肯定”)和不如所述第一值令人滿意的第二值(“否定”)。
43.如權利要求41所述的方法,其特征在于,所述分級具有兩個以上值。
44.如權利要求41所述的方法,其特征在于,還包括基于用戶對所述特定話題與所述特定信息項之間的附連的分級對所述特定話題與所述特定信息項之間的一個或多個附連確定總體附連質量。
45.如權利要求1所述的方法,其特征在于,所述新結果包括所選擇的建議話題對其具有附連的一個或多個信息項。
46.如權利要求1所述的方法,其特征在于,所述話題集合包括由一個或多個用戶定義的話題,用戶是已提供了注冊信息的搜索者。
47.如權利要求6所述的方法,其特征在于,一話題與一信息項之間的每一附連具有從由用戶提供的分級確定的附連質量度量,每一附連最初被分配當更多用戶對所述附連分級時可改變的初始質量度量,所述細化話題評級方法考慮到任何潛在細化話題與所標識的信息項之間的附連的附連質量度量,并且其中,所述細化話題評級方法確定一細化度量,所述細化度量對每一潛在細化話題取決于從任一標識的信息項到所述潛在細化話題的附連的質量度量之和與來自任一標識的信息項的附連的質量度量之和之比。
48.如權利要求47所述的方法,其特征在于,所述細化評級方法包括對每一潛在細化話題,確定作為所述潛在話題與所標識的信息項中的任一個的所有附連的總體質量之和與所標識的信息項的所有附連的總質量度量之比的細化度量,使得評級最高的潛在細化話題是其細化度量最接近表達為百分比的50%的細化話題,且下一評級最高的潛在細化話題是其細化度量為下一最接近表達為百分比的50%的細化話題。
49.如權利要求3所述的方法,其特征在于,所述相似度選擇方法考慮到任一潛在相似話題與所標識的信息項之間的附連的附連質量度量。
50.如權利要求1至10中任一項或權利要求49所述的方法,其特征在于,所述相似話題是根據依照一相似度話題評級方法確定的相似度評級來排序的。
51.如權利要求49所述的方法,其特征在于,所述相似度話題選擇準則包括如果一特定話題與所述搜索結果中所標識的信息項的附連占所述搜索結果中的附連總數的百分比至少是預定義的百分比,且如果具有與所述特定話題的肯定分級的附連的信息項的個數至少是所述特定話題與所述搜索結果中的信息項的附連個數的預定義的不必為整數的倍數,則所述特定話題是相似話題。
52.如權利要求49所述的方法,其特征在于,所述相似度話題選擇準則包括如果滿足以下各條件則一特定話題是第一話題的相似話題(i)在所述話題集合中有第一話題,使得具有與所述第一話題的肯定分級的附連的信息項包括所述搜索結果,且使得具有與所述第一話題的肯定分級的附連的信息項的個數不會太大,
(ii)具有與所述特定話題的肯定分級的附連的信息項包括具有與所述第一話題的肯定分級的附連的信息項,以及(iii)具有與所述特定話題的肯定分級的附連的信息項的個數至少是所述搜索結果中的信息項的個數的預定義百分比。
53.如前述權利要求中任一項所述的方法,其特征在于,還包括向用戶顯示所述信息項中選擇的一個,作為所述用戶選擇所述選擇的一個信息項的結果,用戶是已提供了注冊信息的搜索者;從所述用戶接受新話題,以作為所選擇的一個信息項的話題而添加到所述話題集合;以及創建所述多個信息項中選擇的一個與所述新話題之間的新附連。
54.如權利要求13或53所述的方法,其特征在于,還包括從所述用戶接受對所述新話題的一個或多個子話題以對所述用戶形成所述新話題和所述一個或多個子話題的分層結構;以及形成所述子話題中的每一個與所述多個信息項之一之間的附連。
55.如權利要求54所述的方法,其特征在于,所述細化話題選擇方法包括對潛在細化話題評級以為所述細化話題確定排序的細化話題評級方法;所述細化話題評級方法使用子話題分層結構。
56.如權利要求55所述的方法,其特征在于,所述細化話題評級方法被設置成使得在一個或多個用戶創建了包括第一話題和作為所述第一話題的子話題的第二話題的第一子話題分層結構之后,選擇所述第一話題的、不必是用戶且不必是所述第一子話題分層結構的創建者之一的搜索者可能被呈現所述第二話題作為所述細化話題之一。
57.如權利要求55所述的方法,其特征在于,所述細化話題評級方法被設置成使得對第一話題之后的第一潛在細化話題以及所述第一話題之后的第二潛在細化話題,如果使含有所述第一潛在細化話題的子話題分層結構作為所述第一話題的子話題的用戶比使含有所述第二潛在細化話題的子話題分層結構作為所述第一話題的子話題的用戶多,則所述細化話題評級方法將所述第一細化話題評級為比所述第二細化話題高。
58.如權利要求15所述的方法,其特征在于,還包括形成向所述搜索者顯示的網頁,所述網頁包括所標識的信息項中的至少某一些以及所述建議話題中的至少某一些。
59.一種承載指示處理系統的處理器執行如前述權利要求中任一項所述的方法的一個或多個計算機可讀代碼段的承載介質。
60.一種承載數據結構的計算機可讀承載介質,所述數據結構包括被配置成儲存一話題集合的話題數據結構,所述話題數據結構具有用于每一話題的元素,所述話題數據結構還被配置成使得對所述話題集合無需存在話題分層結構;被配置成儲存一用戶集合的用戶數據結構,用戶是已提供了注冊信息的搜索者,所述用戶數據結構具有用于每一話題的元素,每一用戶數據結構元素包括所述用戶的注冊信息;被配置成儲存一附連集合的附連數據結構,每一附連是所述話題集合中的話題之一與一信息項集合中的一個信息項之間的附連,所述附連數據結構具有用于每一附連的元素;以及被配置成供指導由所述話題集合輔助的搜索的計算機實現的方法使用的數據結構,所述計算機實現的方法如權利要求1至59中任一項所述。
61.如權利要求60所述的承載介質,其特征在于,所述數據結構采用關系型數據庫的表集合的形式,并且其中,所述話題數據結構、所述用戶數據結構和所述附連數據結構中的每一個都采用了關系型數據庫的表的形式。
62.如權利要求60至61中任一項所述的承載介質,其特征在于,所述新搜索結果包括所選擇的建議話題對其具有附連的一個或多個信息項。
權利要求
1.一種指導由話題集合輔助的搜索的計算機實現的方法,所述話題不必具有分層結構,每一話題具有與多個信息項中的至少一個信息項的至少一個附連,所述方法包括根據由第一搜索者提供的搜索請求信息為所述第一搜索者標識所述多個信息項中的一個或多個信息項,所述搜索請求信息包括由搜索短語和所述話題集合中的一個或多個搜索話題的子集構成的組中的至少一個;從所述話題集合中確定一個或多個建議話題,所述建議話題是根據所述建議話題與一個或多個所標識的信息項的附連來確定的;以及向所述第一搜索者提供搜索結果,所述搜索結果包括所標識的信息項中的至少某一些和所述建議話題中的至少一個,其中,所述建議話題包括使用一細化選擇方法根據一細化話題準則從所述話題集合中確定的一個或多個細化話題,使得所述第一搜索者選擇所述建議話題之一將生成一新的建議話題集合,并使得為所述第一搜索者的特定搜索在進行中形成一話題分層結構。
2.如權利要求1所述的方法,其特征在于,所述話題和所述信息項之間的附連的至少某一些是由用戶定義的,用戶是已提供了注冊信息的搜索者。
3.如權利要求2所述的方法,其特征在于,所述附連中的至少一個具有附連質量度量,所述話題和信息項之間的附連的附連質量度量是從由用戶提供的分級中確定的,一特定附連最初被分配當更多用戶對所述附連分級時可改變的初始質量度量。
4.如權利要求3所述的方法,其特征在于,所述細化選擇方法考慮任何潛在細化話題和所標識的信息項之間的附連的附連質量度量。
5.如權利要求1所述的方法,其特征在于,根據所述細化話題選擇方法,潛在細化話題是具有與所標識的項的至少一個的附連的話題,且所述細化話題是從所述潛在細化話題中選擇的。
6.如權利要求5所述的方法,其特征在于,所述細化話題選擇方法包括對潛在細化話題評級以為所述細化話題確定排序的細化話題評級方法。
7.如權利要求6所述的方法,其特征在于,所述細化話題評級方法確定一細化度量,它對每一潛在細化話題確定細化度量,所述細化度量取決于所標識的信息項中與所述潛在細化話題附連的個數與所標識的信息項的個數之比。
8.如權利要求7所述的方法,其特征在于,所述細化評級方法包括對每一潛在細化話題,確定作為所標識的信息項中與所述潛在細化話題附連的個數與所標識的信息項的個數之比的細化度量,使得評級最高的潛在細化話題是其細化度量最接近表達為百分比的50%的細化話題,且下一評級最高的潛在細化話題是其細化度量是下一最接近于被表達為百分比的50%的細化話題,由此其細化度量是被表達為百分比的50%的細化話題將所標識的信息項分為兩個相等大小的信息項集合。
9.如權利要求7所述的方法,其特征在于,所述細化評級方法包括對每一潛在細化話題,根據以下兩項的平方和確定細化度量所標識的信息項中與所述潛在細化話題附連的個數與所標識的信息項的個數之比,以及所標識的信息項中不與所述潛在細化話題附連的個數與所標識的信息項的個數之比,使得評級最高的潛在細化話題是其細化度量最小的細化話題,且下一評級最高的潛在細化話題是其細化度量為下一最小的細化話題。
10.如權利要求7所述的方法,其特征在于,所述附連中的至少一個具有附連質量度量,所述話題和信息項之間的附連的附連質量度量是從由用戶提供的分級中確定的,一特定附連最初被分配當更多用戶對所述附連分級時可改變的初始質量度量,以及所述細化評級方法包括對每一潛在細化話題,根據以下兩項的平方和確定細化度量所述潛在細化話題與所標識的信息項中的任一個的所有附連的總體質量之和與所標識的信息項的所有附連的總質量度量之比,以及所標識的信息項中的任一個與除所述潛在細化話題之外的任何話題之間的所有附連的總體質量之和與任何所標識的信息項的所有附連的總質量度量之比,使得評級最高的潛在細化話題是其細化度量最小的細化話題,且下一評級最高的潛在細化話題是其細化度量為下一最小的細化話題。
11.如權利要求1所述的方法,其特征在于,每一信息項是網頁。
12.如權利要求1所述的方法,其特征在于,還包括從用戶接受所述多個信息項之一與所述話題集合之一之間的新附連,用戶是已提供了注冊信息的搜索者。
13.如權利要求1所述的方法,其特征在于,還包括從用戶接受要添加到所述話題集合的新話題以及所述多個信息項之一與所述新話題之間的新附連,用戶是已提供了注冊信息的搜索者。
14.如權利要求1所述的方法,其特征在于,所述標識一個或多個信息項包括從所述第一搜索者接受所述搜索請求信息;以及根據所接受的搜索請求信息以及一個或多個搜索準則搜索所述多個信息項以標識所述一個或多個信息項,所述搜索準則包括各自具有與所接受的搜索請求信息中的每一話題的附連的所標識的信息項。
15.如權利要求14所述的方法,其特征在于,還包括向所述第一搜索者顯示所述搜索的結果。
16.一種指導由話題集合輔助的搜索的計算機實現的方法,所述話題不必具有分層結構,所述話題集合中的每一話題具有與多個信息項中的至少一個信息項的至少一個附連,所述方法包括定義所述附連,所述對每一附連的定義是由至少一個用戶進行的,用戶是已提供了注冊信息的搜索者,所述定義附連包括從至少一個用戶接受至少一個話題與所述多個信息項中的至少一個信息項之間的至少一個附連,使得所述話題集合中的每一話題具有與所述多個信息項中的至少一個信息項的至少一個附連;根據由第一搜索者提供的搜索請求信息為所述第一搜索者標識所述多個信息項中的一個或多個信息項,所述搜索請求信息包括由搜索短語和來自所述話題集合的搜索話題構成的組中的至少一個;從所述話題集合中確定一個或多個建議話題,所述建議話題是根據所述建議話題與一個或多個所標識的信息項的附連來確定的;以及向所述第一搜索者提供搜索結果,所述搜索結果包括所標識的信息項中的至少某一些和所述建議話題中的至少一個,其中所述建議話題包括使用一細化選擇方法根據一細化話題準則從所述話題集合中確定的一個或多個細化話題,使得選擇所述建議話題之一將生成一新的建議話題集合,使得為特定搜索在進行中形成一話題分層結構。
17.如權利要求16所述的方法,其特征在于,不同用戶定義同一話題和同一信息項之間的不同附連,使得由不同用戶定義的多個附連可存在于一特定話題和一特定信息項之間。
18.如權利要求17所述的方法,其特征在于,一特定話題和一特定URL之間的每一附連具有從由不同用戶提供的所述特定話題和所述特定URL之間的不同附連個數確定的附連質量度量。
19.如權利要求17所述的方法,其特征在于,一特定話題與一特定URL之間的每一附連具有從由不同用戶提供的分級中確定的附連質量度量,每一附連最初被分配當更多用戶對所述附連分級時可改變的初始質量度量。
20.如權利要求19所述的方法,其特征在于,對一特定附連分級的特定用戶根據二元值分級來對所述附連分級,所述二元值分級具有第一分級(“肯定”)和不如所述第一分級令人滿意的第二分級(“否定”)。
21.一種方法,包括定義話題集合中的每一話題與信息項集合中的相應信息項之間的一個或多個附連,所述話題不必具有分層結構,所述對每一附連的定義是由至少一個用戶進行的,用戶是已提供了注冊信息的搜索者,所述定義附連包括從至少一個用戶接受至少一個話題與所述多個信息項中的至少一個信息項之間的至少一個附連,使得所述話題集合中的每一話題具有與所述多個信息項中的至少一個信息項的至少一個附連,其中所述話題用于由特定搜索者根據由所述特定搜索者提供的搜索請求信息在所述多個信息項中搜索一個或多個信息項,所述搜索請求信息包括所述話題集合中的至少一個話題,所述搜索包括標識具有與所述搜索請求信息中的至少一個話題的附連的至少一個或多個信息項。
22.如權利要求21所述的方法,其特征在于,還包括從用戶接受要添加到所述話題集合的新話題;以及將所接受的新話題添加到所述話題集合。
23.如權利要求21所述的方法,其特征在于,預定義初始的多個話題。
24.如權利要求21所述的方法,其特征在于,第一用戶定義第一話題與第一信息項之間的第一附連以及第二用戶定義所述第一話題與所述第一信息項之間的附連的結果是在所述第一話題與所述第一信息項之間存在至少兩個附連。
25.如權利要求24所述的方法,其特征在于,還包括從用戶接受對所述話題集合中的一特定話題與一特定信息項之間的特定附連的分級,使得所述特定話題與所述特定信息項之間的多個附連可具有不同的分級。
26.如權利要求25所述的方法,其特征在于,所述分級具有兩個值,即第一值(“肯定”)和不如第一值令人滿意的第二值(“否定”)。
27.如權利要求25所述的方法,其特征在于,所述分級具有兩個以上值。
28.如權利要求25所述的方法,其特征在于,還包括基于用戶對所述特定話題與所述特定信息項之間的附連的分級,為所述特定話題和所述特定信息項之間的一個或多個附連確定一總體附連質量。
29.一種提供用于一搜索方法的用戶界面的計算機實現的方法,所述搜索方法由一話題集合來輔助,所述話題不必具有分層結構,每一話題具有與多個信息項中的至少一個信息項的至少一個附連,所述方法包括引起向第一搜索者顯示第一用戶界面,所述用戶界面允許所述搜索者輸入包括由搜索短語和所述話題集合中的一個或多個搜索話題的子集構成的組中的至少一個的搜索請求信息;執行所述搜索方法,所述搜索方法包括接受所述第一搜索者輸入的所述搜索請求信息;根據所接受的搜索請求信息標識所述多個信息項中的一個或多個信息項;以及從所述話題集合中確定一個或多個建議話題,所述建議話題是根據所述建議話題與一個或多個所標識的信息項的附連來確定的;以及作為執行所述搜索方法的結果,引起向所述第一搜索者顯示第二用戶界面,所述第二用戶界面包括所標識的信息項中的至少某一些和所述建議話題中的至少一個,所述第二用戶界面為所述第一搜索者提供了選擇所述建議話題之一的能力,其中所述建議話題包括使用一細化選擇方法根據一細化話題準則從所述話題集合中確定的一個或多個細化話題,使得所述第一搜索者使用所顯示的第二用戶界面選擇所述建議話題之一生成一新的建議話題集合,并引起向所述第一搜索者顯示所述新建議話題集合中的至少某些話題,使得對所述第一搜索者的特定搜索在進行中形成一話題分層結構。
30.如權利要求29所述的方法,其特征在于,向查看者最多顯示預定個數的細化話題。
31.如權利要求29所述的方法,其特征在于,所述第一用戶界面和所述第二用戶界面分別是第一網頁和第二網頁。
32.如權利要求29所述的方法,其特征在于,還包括從所述搜索者接受新的搜索請求信息;確定包括所標識的信息項集合和一個或多個建議話題的新集合的新搜索結果,所述新搜索結果是通過向所接受的新搜索請求信息應用所述一個或多個搜索準則來確定的;以及向所述搜索者呈現所述新搜索結果。
33.如權利要求32所述的方法,其特征在于,所接受的新搜索請求信息包括從先前的建議話題中選擇的話題;所述新搜索結果中的信息項具有與所述從先前的建議話題中選擇的話題的附連。
34.如權利要求29所述的方法,其特征在于,呈現給所述第一搜索者的建議話題包括根據與所標識的信息項有關的話題相似度準則從所述話題集合中確定的一個或多個相似話題。
35.如權利要求34所述的方法,其特征在于,所述相似話題是根據依照一相似度話題評級方法來確定的相似度評級來排序的。
36.如權利要求35所述的方法,其特征在于,最多向查看者顯示預定個數的相似話題。
37.一種方法,包括定義一話題集合用于附連到多個信息項中的一個或多個信息項,所述定義是由至少一個用戶進行的,用戶是已提供了注冊信息的搜索者,所述定義話題包括從至少一個用戶接受至少一個話題;以及將所述話題添加到所述話題集合,其中所述話題不必具有分層結構;其中每一話題用于附連到所述多個信息項中的一個或多個信息項,以及其中附連到至少一個信息項的所述話題用于由特定搜索者根據由所述特定搜索者提供的搜索請求信息來搜索所述多個信息項中的一個或多個信息項,所述搜索請求信息包括所述話題集合中的至少一個話題,所述搜索包括標識具有與所述搜索請求信息中的至少一個話題的附連的至少一個信息項。
38.如權利要求37所述的方法,其特征在于,還包括從至少一個用戶接受所述話題集合中的至少一個話題與所述多個信息項中的至少一個信息項之間的至少一個附連;以及對先前沒有與一信息項的附連的任何話題,將所述話題添加到一個或多個話題的組,所述一個或多個話題中的每一個具有與所述多個信息項中的至少一個信息項的至少一個附連。
39.如權利要求37所述的方法,其特征在于,預定義一初始話題集合。
40.如權利要求38所述的方法,其特征在于,第一用戶定義第一話題與第一信息項之間的第一附連以及第二用戶定義所述第一話題與所述第一信息項之間的附連的結果是在所述第一話題與所述第一信息項之間存在至少兩個附連。
41.如權利要求39所述的方法,其特征在于,還包括從用戶接受對所述話題集合中一特定話題與一特定信息項之間的特定附連的分級,使得所述特定話題與所述特定信息項之間的多個附連可具有不同的分級。
42.如權利要求41所述的方法,其特征在于,所述分級具有兩個值,即第一值(“肯定”)和不如所述第一值令人滿意的第二值(“否定”)。
43.如權利要求41所述的方法,其特征在于,所述分級具有兩個以上值。
44.如權利要求41所述的方法,其特征在于,還包括基于用戶對所述特定話題與所述特定信息項之間的附連的分級對所述特定話題與所述特定信息項之間的一個或多個附連確定總體附連質量。
45.一種承載指示處理系統的處理器執行如前述權利要求中任一項所述的方法的一個或多個計算機可讀代碼段的承載介質。
全文摘要
指導由不必具有分層結構的話題集合輔助的搜索的計算機實現的方法和軟件產品。每一話題附連到多個信息項中的至少一個信息項,諸如由URL標識的網頁。該方法包括標識多個信息項中的一個或多個信息項,根據建議話題與所標識的信息項的附連從話題集合中確定一個或多個建議話題,并向用戶提供包括所標識的信息項中的至少某一些以及建議話題中的至少一個的搜索結果。選擇建議話題之一生成一新的建議話題集合,使得對特定搜索在進行中形成話題分層結構。
文檔編號G06F17/30GK101073077SQ200580035172
公開日2007年11月14日 申請日期2005年9月9日 優先權日2004年9月10日
發明者E·派拉蒙, F·薩曼加, O·本-沙查, I·丹, G·泰弗 申請人:色杰斯提卡股份有限公司