專利名稱:用于查詢細化的系統和方法
技術領域:
本發明的實施例涉及用于細化用戶查詢的技術,尤其涉及用于向用戶提供適當的搜索結果的技術。
背景技術:
通過因特網的其它網絡,用戶獲取對分布在大量計算機上的大量信息的訪問。為訪問該巨大數量的信息,用戶通常實現用戶瀏覽器來訪問搜索引擎。搜索引擎通過返回可通過因特網或其它網絡獲得的一個或多個信息源來響應輸入的用戶查詢。
當前,當實現搜索引擎時,用戶輸入一個或多個關鍵詞,并接收一組結果。取決于由用戶輸入的特定項,搜索引擎產生多個結果。在某些情況下,用戶選擇的項可能不導致搜索引擎定位期望的信息。具體地,當用戶輸入通常包含了太多信息的多詞查詢時,用戶常常對由搜索引擎產生的不令人滿意的或最小限度的結果感到失望。
在操作中,搜索引擎通常實現爬尋器(crawler)來訪問多個網站,并在索引中儲存對那些網站的引用。索引中的引用可基于一個或多個關鍵詞來分類。搜索引擎也可將某些結果儲存在高速緩存中。
當響應于用戶查詢時,搜索引擎可首先遍歷該索引,以定位輸入的查詢項。然而,在許多情況下,索引中的項可能不對應于輸入的查詢項。期望信息可以基于同義項或關鍵詞的替換組合來索引。由此,為接收期望的搜索結果,用戶可在接收可接受的結果或任何結果之前實現反復試驗技術并多次輸入查詢項。
當現有搜索引擎接收無法在索引中找到的用戶輸入查詢項時,這些現有搜索引擎通常無法提供任何結果。某些搜索引擎將試圖進行拼寫糾正并重新發出搜索。然而,如果用戶希望搜索輸入項的變體,則通常要求用戶用不同的輸入項來重復搜索。
因此,需要一種用于處理多詞搜索查詢的解決方案,該解決方案通過基于所返回的搜索結果的數量或質量自發地拓寬輸入查詢來確保適當結果的供應。較佳地,這一解決方案將確保獲得最大數量的相關結果。
發明內容
本發明的實施例針對一種用于響應于多詞用戶輸入自動增強由搜索引擎產生的初始搜索結果的方法。該方法包括在搜索引擎內實現用于評估初始搜索結果的適當性的結果評估機制。該方法還包括如果初始搜索結果被該結果評估機制認為是不適當的,則制定至少一個替換查詢,以及顯示包括初始搜索結果以及任何制定的替換查詢的清單的結果信息。
其它實施例針對一種用于響應于多詞用戶輸入自動增強由搜索引擎產生的初始搜索結果的方法。該實施例包括將多詞用戶查詢剖析成多個子查詢,并通過確定子查詢結果的數量或子查詢結果的相關度或數量和相關度的組合來確定多個子查詢的有效性。該方法還可包括顯示初始搜索結果、子查詢以及確定的子查詢有效性。
在其它實施例中,可提供一種用于響應于多詞用戶輸入自動增強由搜索引擎產生的初始搜索結果的系統。該系統可包括搜索引擎內用于評估初始結果的適當性的結果評估機制。該系統還可包括用于如果初始搜索結果由結果評估機制評估為不適當,則制定替換查詢的替換查詢確定機制。該系統還包括用于輸出替換查詢以及初始搜索結果以供顯示的結果輸出組件。
本發明在下文中參考附圖來詳細描述,附圖中圖1是示出依照本發明的一個實施例的系統的綜述的框圖;圖2是示出其中可實現本發明的計算機化的環境的框圖;圖3是示出依照本發明的一個實施例的查詢細化組件的框圖;圖4是示出依照本發明的一個實施例的結果評估機制的框圖;以及圖5是示出依照本發明的一個實施例用于細化用戶查詢的方法的流程圖。
具體實施例方式
I.系統綜述圖1是示出依照本發明的實施例的系統綜述的框圖。包括用戶瀏覽器12的用戶計算機10可通過網絡20與搜索引擎200連接。搜索引擎200可包括,例如web爬尋器210、索引220、高速緩存230。搜索引擎200可包括其它標準組件,這些組件為簡明起見被省略不作描述。搜索引擎200也可包括查詢細化組件300。查詢細化組件230可在搜索引擎200無法產生適當的結果時細化來自用戶計算機10和用戶瀏覽器12的用戶查詢。通常,搜索引擎200基于由web爬尋器210遍歷的網站,如網站30來維護索引220。
本發明的實施例包括用于當搜索引擎無法產生適當的結果時細化用戶查詢以避免遇到僵局的方法和系統。結果可能由于在數量上太少或在相關度上太低而不適當。在操作中,系統和方法的實施例可確定結果是不適當的,并給予用戶拓寬輸入查詢的建議。不適當的結果可以通過諸如對點擊通過率的評估等已知技術來確定,或者可以基于閾值數來確定。
當結果被認為不合適時,查詢細化組件300可將多詞查詢分解成子查詢。在對每一子查詢返回結果之后,查詢細化組件300可捕捉前面的結果的相關度以及子查詢的結果數量。最后,搜索引擎200可輸出具有需要數量的結果或具有需要閾值相關度的所有結果集。
II.示例性操作環境圖2示出了適合在其中實現本系統和方法的查詢細化的計算系統環境100的一個示例。計算系統環境100僅為合適的計算環境的一個示例,并非對本發明的使用范圍或功能提出任何局限。也不應將計算環境100解釋為對示例性操作環境100中示出的任一組件或其組合具有任何依賴或需求。
本發明在諸如由計算機執行的程序模塊等計算機可執行指令的一般上下文環境中描述。一般而言,程序模塊包括例程、程序、對象、組件、數據結構等等,它們執行特定的任務或實現特定的抽象數據類型。此外,本領域的技術人員可以理解,本發明可以用于其它計算機系統配置來實施,包括手持式設備、多處理器系統、基于微處理器或可編程消費者電子設備、小型機、大型機等等。本發明也可以在分布式計算環境中實踐,其中,任務由通過通信網絡連接的遠程處理設備來執行。在分布式計算環境中,程序模塊可以位于包括存儲器存儲設備的本地和遠程計算機存儲介質中。
參考圖2,用于實現本發明的示例性系統包括計算機110形式的通用計算設備,包括處理單元120、系統存儲器130以及將包括系統存儲器的各類系統組件耦合至處理單元120的系統總線121。
計算機110通常包括各種計算機可讀介質。作為示例而非局限,計算機可讀介質包括計算機存儲介質和通信介質。系統存儲器130包括以易失性和/或非易失性存儲器形式的計算機存儲介質,如只讀存儲器(ROM)131和隨機存取存儲器(RAM)132。基本輸入/輸出系統133(BIOS)包括如在啟動時幫助在計算機110內的元件之間傳輸信息的基本例程,通常儲存在ROM 131中。RAM 132通常包含處理單元120立即可訪問或者當前正在操作的數據和/或程序模塊。作為示例而非局限,圖2示出了操作系統134、應用程序135、其它程序模塊136和程序數據137。
計算機110也可包括其它可移動/不可移動、易失性/非易失性計算機存儲介質。僅作示例,圖2示出了對不可移動、非易失性磁介質進行讀寫的硬盤驅動器141、對可移動、非易失性磁盤152進行讀寫的磁盤驅動器151以及對可移動、非易失性光盤156,如CD ROM或其它光介質進行讀寫的光盤驅動器155。可以在示例性操作環境中使用的其它可移動/不可移動、易失性/非易失性計算機存儲介質包括但不限于,磁帶盒、閃存卡、數字多功能盤、數字錄像帶、固態RAM、固態ROM等等。硬盤驅動器141通常通過不可移動存儲器接口,如接口140連接到系統總線121,磁盤驅動器151和光盤驅動器155通常通過可移動存儲器接口,如接口150連接到系統總線121。
上文討論并在圖2出的驅動器及其相關聯的計算機存儲介質為計算機110提供了計算機可讀指令、數據結構、程序模塊和其它數據的存儲。例如,在圖2中,示出硬盤驅動器141儲存操作系統144、應用程序145、其它程序模塊146和程序數據147。注意,這些組件可以與操作系統134、應用程序135、其它程序模塊136和程序數據137相同,也可以與它們不同。這里對操作系統144、應用程序145、其它程序模塊146和程序數據147給予不同的標號來說明至少它們是不同的副本。用戶可以通過輸入設備,如鍵盤162和定位設備161(通常指鼠標、跟蹤球或觸摸板)向計算機110輸入命令和信息。其它輸入設備(未示出)可包括麥克風、操縱桿、游戲墊、圓盤式衛星天線、掃描儀等等。這些和其它輸入設備通常通過耦合至系統總線的用戶輸入接口160連接至處理單元120,但是也可以通過其它接口和總線結構連接,如并行端口、游戲端口或通用串行總線(USB)。監視器191或其它類型的顯示設備也通過接口,如視頻接口190連接至系統總線121。除監視器之外,計算機也可包括其它外圍輸出設備,如揚聲器197和打印機196,它們通過輸出外圍接口195連接。
本發明中的計算機110可以使用到一個或多個遠程計算機,如遠程計算機180的邏輯連接在網絡化環境中操作。遠程計算機180可以是個人計算機,并通常包括許多或所有相對于計算機110所描述的元件,盡管在圖2中僅示出了存儲器存儲設備181。圖2描述的邏輯連接包括局域網(LAN)171和廣域網(WAN)173,但也可包括其它網絡。
當在LAN網絡環境中使用時,計算機110通過網絡接口或適配器170連接至LAN 171。當在WAN網絡環境中使用時,計算機110通常包括調制解調器172或用于通過WAN 173,如因特網建立通信的其它裝置。調制解調器172可以是內置或外置的,通過用戶輸入接口160或其它適當的機制連接至系統總線121。在網絡化環境中,相對于計算機110所描述的程序模塊或其部分可儲存在遠程存儲器存儲設備中。作為示例,而非局限,圖2示出遠程應用程序185駐留在存儲器設備181中。可以理解,示出的網絡連接是示例性的,也可以使用在計算機之間建立通信鏈路的其它手段。
盡管未示出計算機110的許多其它內部組件,然而本領域的普通技術人員可以理解,這些組件和互連是公知的。因此,關于計算機110的內部構造的其它細節無需結合本發明來揭示。
III.本發明的系統和方法如上所述,圖1是示出依照本發明的實施例的系統綜述的框圖。諸如用戶計算機10等包括用戶瀏覽器12的用戶計算機可通過網絡20與搜索引擎200連接。網絡20可以是因特網,或者可以是上文參考圖2所描述的網絡類型中的任一種。
搜索引擎200可包括web爬尋器210、web索引220和高速緩存230。web爬尋器通常在常規的基礎上遍歷網站30,并在索引220中索引網站30,以響應于用戶輸入查詢而容易地訪問結果。查詢細化組件300可在搜索引擎200無法響應于用戶查詢產生適當的結果時評估和細化來自用戶計算機10和用戶瀏覽器12的用戶查詢。通常,當生成結果時,搜索引擎200維護所遍歷的網站,諸如網站30的索引。所創建的索引220可以基于出現在所遍歷的網站30中的關鍵詞。
圖3示出了依照本發明的一個實施例的查詢細化組件300的進一步細節。查詢細化組件300可包括結果評估機制310、子查詢確定機制320、子查詢搜索機制330以及結果輸出組件340。結果評估機制310的一個實施例在圖4中進一步示出。結果評估機制310可包括相關度確定組件312以及可調整閾值指示器314。相關度確定組件312可確定為用戶輸入查詢所檢索的結果是否相關,和/或產生的結果數量是否足夠。相關度確定組件312可訪問可調整閾值指示器314以作出這一確定。例如,可調整閾值指示器314可儲存預設的閾值結果數,諸如10個結果,和/或預設的相關度指示器或得分閾值。相關度確定組件312可基于諸如點擊通過率等可跟蹤相關度因素來評估相關度。存在用于基于用戶行為模式來確定相關度的有關技術。相關度確定組件312可實現用于確定相關度的任何已知技術。
如果用戶輸入查詢不產生滿足預定閾值的結果,則結果評估機制310可通知子查詢確定機制從輸入查詢創建子查詢。子查詢確定機制320將用戶輸入查詢剖析成單獨的子查詢。子查詢搜索機制然后可搜索索引220,或提示搜索引擎200在索引220中搜索匹配的結果。產生的結果可再一次由結果評估機制310在轉發到結果輸出組件340以供輸出到用戶計算機10之前評估。
子查詢確定機制320可通過實現同義詞典以提供同義詞來另外補充其替換子查詢。通常,由用戶輸入的相可以用替換同義詞來索引。因此,在子查詢確定機制320內提供同義詞典可增強結果的相關度。
結果評估機制310可在接收到為每一子查詢返回的結果之后捕捉前面的結果的相關度,例如前三個結果的相關度,并可另外對查詢的結果數量進行計數。結果輸出組件340隨后可顯示搜索的所有子查詢以及所示的結果數量,或者可替換地顯示具有高于預設閾值的相關度索引的查詢。
作為一個示例,如果輸入查詢是“mini blue ipod”(迷你型藍色的ipod),且結果評估機制310確定從該多詞查詢產生的結果不是適當的,則查詢細化組件300可通過使用子查詢確定機制320、子查詢搜索介質330和結果輸出組件340將具有所接收結果數量的替換查詢輸出到UI。例如,響應于對于“blue mini ipod”(藍色的迷你型ipod)的用戶查詢,除對輸入查詢“blue mini ipod”的結果之外,結果輸出組件340可輸出以下“You can try″blue ipod″~50k results or″Mini Ipod″~15k results”(你可以嘗試“blue ipod”,大約有50000個結果,或者“Mini Ipod”,大約有15000個結果)這一示例示出替換子查詢以及由每一替換子查詢產生的結果數量。子查詢確定機制320將用戶輸入查詢“blue mini ipod”剖析成“blue ipod”和“mini ipod”。子查詢確定機制320不選擇短語“blue mini”,因為由兩個形容詞組成的短語的結果的相關度可能比上述兩個短語的相關度要低得多,在上述兩個短語中,其每一個都包括一個名詞和一個形容詞。
或者,結果輸出組件340可產生附加的相關度得分而非結果數量或者同時附加了相關度得分和結果數量的替換子查詢。如上所述,觸發子查詢搜索和建議的值可以是可配置或可調整的。這些值可以由搜索引擎選擇,并可在可調整閾值指示器314中設置。在替換實施例中,搜索引擎200可允許用戶主動調整閾值。在高系統負載的情況下,查詢細化組件300可被手動或自動停用。停用選項防止對查詢細化組件300的使用導致對搜索引擎用戶不可接受的等待時間。
搜索引擎200可確定多少人點擊各種提供的選擇,并基于點擊數和相關度級別來調整閾值。如果用戶僅點擊具有較高得分的項目或結果,則系統可基于點擊重設該閾值。由此,由所選擇的技術確定的相關度觸發對選項的顯示。
上述組件可以在許多環境中使用。在一個示例性環境中,查詢細化組件300可在在線購物環境中使用。例如,用戶可輸入諸如“Digital Camera,Price<$200,manufacturer=cannon”(數碼相機,價格<$200,制造商=佳能)的查詢。如果該查詢返回不適當的結果集,則可實現查詢細化組件300以拓寬查詢,來包括例如200和250美元之間的佳能相機或由其它公司制造的200美元以下的相機。子查詢確定機制320可實現系統來確定放松哪一準則。在某些情況下,放松價格可產生更多結果,且結果具有較高的相關度得分。在其它情況下,品牌或其它準則可以是要放松的適當準則。
圖5是示出依照本發明的一個實施例用于查詢細化的方法的流程圖。該方法在步驟500開始,搜索引擎200在步驟502接收并處理輸入的用戶多詞查詢。在步驟504,查詢細化組件300評估處理步驟的結果。如果結果在步驟506被認為是適當的,則搜索引擎200在步驟508顯示結果。如上所述,適當性可基于所產生的結果的數量、質量或數量和質量的組合來確定。
如果結果在步驟506不被認為是適當的,則查詢細化組件300在步驟510將查詢劃分成子查詢。在步驟512,查詢細化組件300處理子查詢。在步驟514,查詢細化組件300評估子查詢處理的結果,并選擇合適的結果。在步驟516,搜索引擎200顯示所有選中的結果,并且該過程在步驟518結束。
盡管此處示出并詳細描述了本發明的特定實施例,然而應當理解,可以對本發明作出各種改變和修改而不脫離本發明的精神和范圍。此處所描述的實施例在所有方面都旨在說明性而非限制性的。本發明所屬領域的技術人員可以明白替換實施例而不脫離其范圍。
從以上內容可以看到,本發明較好地適用于達到上述的所有目的和目標,以及本系統和方法中明顯且固有的其它優點。可以理解,某些特征和子組合是實用的,并可在不引用其它特征和子組合的情況下使用。這是所構想的,且落入所附權利要求書的范圍之內。
權利要求
1.一種用于響應于多詞用戶查詢自動增強由搜索引擎產生的初始搜索結果的方法,所述方法包括在所述搜索引擎內實現用于評估所述初始搜索結果的適當性的結果評估機制;如果所述初始搜索結果被所述結果評估機制認為是不適當的,則制定至少一個替換查詢;以及顯示包括所述初始搜索結果以及任何制定的替換查詢的清單的結果信息。
2.如權利要求1所述的方法,其特征在于,實現所述結果評估機制包括評估所述初始結果的數量和相關度中的至少一個。
3.如權利要求1所述的方法,其特征在于,制定至少一個替換查詢包括從所述多詞用戶查詢中制定至少一個子查詢。
4.如權利要求3所述的方法,其特征在于,還包括制定多個子查詢。
5.如權利要求4所述的方法,其特征在于,還包括確定子查詢結果的數量和相關度中的至少一個。
6.如權利要求5所述的方法,其特征在于,還包括顯示所述子查詢結果的數量和相關度中的至少一個。
7.如權利要求1所述的方法,其特征在于,還包括如果所述初始搜索結果落在相關度和數量閾值之一以下,則制定所述至少一個查詢。
8.如權利要求7所述的方法,其特征在于,還包括提供用于觸發所述至少一個替換查詢的制定的可調整閾值。
9.如權利要求1所述的方法,其特征在于,還包括在高使用率周期期間消除所述替換查詢的制定。
10.一種用于響應于多詞用戶查詢自動增強由搜索引擎產生的初始搜索結果的方法,所述方法包括將所述多詞用戶查詢剖析成多個子查詢;通過確定子查詢結果的數量和子查詢結果的相關度中的一個來確定所述多個子查詢的有效性;以及顯示所述初始搜索結果。
11.如權利要求10所述的方法,其特征在于,還包括顯示所述子查詢和所確定的子查詢的有效性。
12.如權利要求10所述的方法,其特征在于,還包括僅顯示具有超過預先選擇的閾值的確定的有效性值的子查詢。
13.如權利要求10所述的方法,其特征在于,還包括通過評估所述初始搜索結果的數量和相關度中的一個來評估所述初始搜索結果的有效性。
14.如權利要求13所述的方法,其特征在于,還包括如果所述初始搜索結果落在相關度和數量閾值中的一個以下,則剖析所述多詞查詢。
15.如權利要求14所述的方法,其特征在于,還包括顯示所述子查詢結果的數量和相關度中的至少一個。
16.如權利要求14所述的方法,其特征在于,還包括提供用于觸發所述多詞查詢的剖析的可調整閾值。
17.一種用于響應于多詞用戶查詢自動增強由搜索引擎產生的初始搜索結果的系統,所述系統包括所述搜索引擎內用于評估所述初始搜索結果的適當性的結果評估機制;用于在所述初始搜索結果被所述結果評估機制評估為不適當時制定替換查詢的替換查詢確定機制;以及用于輸出所述替換查詢以及所述初始搜索結果以供顯示的結果輸出組件。
18.如權利要求17所述的系統,其特征在于,所述結果評估機制包括用于評估所述初始結果的數量和相關度的至少一個的機制。
19.如權利要求17所述的系統,其特征在于,所述替換查詢制定機制從所述多詞用戶查詢制定至少一個子查詢。
20.如權利要求19所述的系統,其特征在于,所述子查詢評估機制包括用于確定子查詢結果的數量和相關度中的至少一個的組件。
全文摘要
提供了一種用于響應于多詞用戶查詢自動增強由搜索引擎產生的初始搜索結果的方法和系統。該方法可包括在搜索引擎內實現用于評估初始搜索結果的適當性的結果評估機制。該方法還可包括如果初始搜索結果被結果評估機制認為是不適當的,則制定至少一個替換查詢,如子查詢。該方法還可包括顯示包括初始搜索結果和任何制定的替換查詢的清單的結果信息。
文檔編號G06F17/30GK1811763SQ20051010738
公開日2006年8月2日 申請日期2005年12月26日 優先權日2005年1月25日
發明者E·B·沃森 申請人:微軟公司