專利名稱:一種搜索結果生成方法及信息搜索系統的制作方法
技術領域:
本申請涉及計算機應用領域,特別是涉及一種搜索結果生成方法及信息搜索系統。
背景技術:
信息搜索系統是一種能夠為用戶提供信息檢索服務的系統,以互聯網中常用的搜 索引擎為例,作為應用在互聯網領域的搜索系統,搜索引擎目前已經成為用戶上網必不可 少的輔助工具之一。從用戶的角度看,搜索引擎一般提供一個包含搜索框的頁面,用戶在搜 索框輸入關鍵詞或其他搜索條件,通過瀏覽器提交給搜索引擎后,搜索引擎就會返回與用 戶輸入的關鍵詞內容相匹配的信息。針對同樣的用戶搜索請求(例如用戶在搜索時所輸入的搜索關鍵詞),搜索引擎 往往能夠檢索到多條匹配信息,這個數量可能會達到數十至數萬。而從用戶的角度來講,往 往只會重點關注在搜索結果中排序比較靠前的信息。這樣,在搜索引擎向用戶提供搜索結 果時,如何對這些信息進行排序就顯得尤為重要,搜索結果的排序是否合理將直接影響著 用戶的體驗。搜索引擎在對信息進行排序時,會對多種因素進行綜合考慮,參考的因素可以包 括信息來源、信息可信度、用戶反饋等等,其中,用戶反饋是影響搜索結果排序的一個重要 因素。例如,當搜索關鍵詞為“中國中央電視臺”時,80%的用戶都點擊了中國中央電視臺 的官方主頁,那么,如果僅從用戶反饋的角度來講,搜索引擎就有理由將中國中央電視臺的 官方主頁排在“中國中央電視臺”這個關鍵詞所對應搜索結果的第一位。為達到上述效果,現有技術中,搜索引擎是通過對搜索關鍵詞所對應各條匹配信 息的用戶反饋量進行統計,并根據用戶反饋量由大到小的順序,生成搜索結果提供給用戶。 通過對現有技術的研究,發明人發現現有搜索結果生成方法存在的問題是對于新發布的 信息,反饋量的初始值為0(或很低),導致其排名靠后,由于排名靠后又很難被用戶關注 至IJ,這樣就一直無法提升排名。而從另一個角度講,個別用戶也可以通過一些作弊手段(例 如欺詐點擊)來迅速改變反饋量,從而使自己發布的信息能夠在搜索結果中排名靠前,對 他人的正常利益造成影響。可見,從用戶的角度來看,現有技術生成的搜索結果排序存在著 不合理之處,對用戶體驗造成了影響。
發明內容
為解決上述技術問題,本申請提供了一種搜索結果生成方法及信息搜索系統,可 以將更為合理的匹配信息排序結果展現給用戶,提升用戶體驗,技術方案如下本申請提供一種搜索結果生成方法,包括信息搜索系統接收搜索請求,通過檢索獲得與所述搜索請求相匹配的各條匹配信 息;對所述各條匹配信息的用戶反饋量進行查詢,進一步計算得到所述各條匹配信息所屬類別的用戶反饋總量;根據所述各條匹配信息所屬類別的用戶反饋總量的大小,對所述各條匹配信息進 行排序,生成搜索結果。本申請還提供一種信息搜索系統,包括信息檢索單元,用于接收搜索請求,通過檢索獲得與所述搜索請求相匹配的各條 匹配信息;用戶反饋量計算單元,用于對各條匹配信息的用戶反饋量進行查詢,進一步計算 得到每個類別的匹配信息的用戶反饋總量;結果生成單元,用于根據所述各條匹配信息所屬類別的用戶反饋總量的大小,對 所述各條匹配信息進行排序,生成搜索結果。
與現有技術相比,本申請實施例所提供的技術方案,不是以單條信息的用戶反饋 量大小作為排序依據,而是以每條信息所屬類別的用戶反饋總量的大小作為排序依據。這 樣,即使是新發布信息的用戶反饋量很小,如果其所屬類別比較受用戶關注,那么該條信息 同樣有機會排在相對靠前的位置。從另一個角度來講,單條信息的用戶反饋量的增加,并不 能直接提高該條信息的排名,而是提高了該條信息所屬類別的排名,因此可以有效地減小 欺詐點擊等作弊手段對搜索結果排序的影響。
為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例或現 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 申請中記載的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提 下,還可以根據這些附圖獲得其他的附圖。圖1為本申請實施例一種搜索結果生成方法的流程圖;圖2為本申請實施例一種信息搜索系統的結構示意圖;圖3為本申請實施例結果生成單元的結構示意圖;圖4為本申請實施例排序分值計算子單元的結構示意圖;圖5為本申請實施例結果生成單元的另一種結構示意圖。
具體實施例方式首先對本申請實施例的一種搜索結果生成方法進行說明,包括信息搜索系統接收搜索請求,通過檢索獲得與所述搜索請求相匹配的各條匹配信 息;對所述各條匹配信息的用戶反饋量進行查詢,進一步計算得到所述各條匹配信息 所屬類別的用戶反饋總量;根據所述各條匹配信息所屬類別的用戶反饋總量的大小,對所述各條匹配信息進 行排序,生成搜索結果。為了使本技術領域的人員更好地理解本申請中的技術方案,下面將結合本申請實 施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施 例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本申請保護 的范圍。 下面以網絡搜索應用為例,對本申請所提供的技術方案進行詳細說明,圖1所示 為本申請實施例的一種搜索結果生成方法的流程圖,包括以下步驟S101、搜索引擎接收搜索請求,通過檢索獲得與所述搜索請求相匹配的各條匹配 fn息;當用戶需要在網絡上搜索信息時,會輸入一個或多個搜索條件,一般最為常用的 搜索條件是搜索關鍵詞,根據具體搜索應用場景的不同,有些搜索引擎還可以支持更多類 型的搜索條件,例如信息發布時間、信息屬性等等,本申請實施例中,將各種搜索條件統稱 為搜索請求。搜索引擎接收到搜索請求之后,檢索與搜索請求相匹配的信息。對應不同的 搜索應用場景,檢索到的信息類型也有所不同,例如在網頁搜索中,檢索到的信息為網頁; 在電子商務搜索中,檢索到的信息為商品;在文獻搜索中,檢索到的信息為期刊或論文等 等。其中,根據搜索請求檢索與之相匹配的信息,其實現方法與現有技術相同,本申請實施 例對此不再進行詳細說明。S102、對各條匹配信息的用戶反饋量進行查詢,進一步計算得到各條匹配信息所 屬類別的用戶反饋總量;對應一個搜索請求,搜索引擎往往能夠檢索到多條與之相匹配的信息,搜索引擎 需要根據一定的原則,對這些信息進行篩選、排序,以方便用戶的閱讀。其中,用戶反饋是影響搜索結果排序的一個重要因素,其基本原則是將用戶最為 關注的信息排在搜索結果的最前面。在本申請實施例中,以用戶反饋量作為反映用戶對某 條信息關注程度的參數。例如,一個網頁鏈接點擊次數、鏈接被收藏次數等,能夠直接反映 出用戶對這個網頁的關注程度,因此,對于網頁來說,可以以鏈接點擊次數、鏈接被收藏次 數等信息作為用戶反饋量。而在電子商務中,某個商品的用戶反饋量可以包括商品成交 量、商品成交金額、商品詢價次數、商品信息被收藏次數等信息。本領域技術人員可以理解 的是,可以選擇某一種信息來表示用戶反饋量,也可以綜合考慮多種信息來表示用戶反饋 量,例如用戶反饋量=商品成交量X0. 3+被收藏次數X2、用戶反饋量=商品成交金額X商品信息被收藏次數+log(商品成交量),等等。用戶反饋量一般是被記錄在用戶反饋日志中,搜索引擎通過讀取用戶反饋日志, 就可以獲得各條匹配信息所對應的用戶反饋量。可以理解的是,搜索引擎可以選擇只對某 段時間(例如最近一周、最近一個月等)的用戶反饋日志進行讀取,以適應用戶興趣點的不 斷變化。假設對應某個搜索請求,搜索引擎檢索到4條與之相匹配的信息,讀取用戶反饋 日志,得到各條匹配信息所對應的用戶反饋量如表1所示
"11用戶反饋量
匹配信息ι~~Ioo 表 1由表1可以看出,4條匹配信息的用戶反饋量大小關系為匹 配信息1 >匹配信息 3 >匹配信息2 >匹配信息4。如果根據現有技術的方案,也將以這個順序生成搜索結果, 并最終展現給用戶。而在本申請技術方案中,需要對各條匹配信息所對應的用戶反饋量做 進一步處理。互聯網中的信息,很多都是按照一定的類別進行發布的,例如,在門戶網站中,網 頁類型可以包括新聞、體育、娛樂、財經等等,在電子商務網站中,商品類別包括家居、電器、 服飾、食品等等。那么,對于搜索引擎檢索到的每條匹配信息,都會對應一個自身所屬的類 另IJ。本申請實施例中,獲得各條匹配信息所對應的用戶反饋量之后,首先查詢各條匹配信息 所屬的類別。對于網頁而言,可以根據網址的路徑獲知網頁所屬的類別,例如,網址路徑中 包含‘‘news”字段的網頁為新聞類網頁,網址路徑中包含‘‘sports”字段的網頁為體育類網 頁,等等;而對于商品而言,直接查詢其商品信息就可以獲得該商品所屬的類別。還要進一步計算每個類別的匹配信息的用戶反饋總量。例如,在表1的例子中,匹 配信息1和匹配信息4是屬于“類型A”,匹配信息2和匹配信息3是屬于“類型B”,則“類 型A”的用戶反饋總量為100+5 = 105、“類型B”的用戶反饋總量為30+40 = 70,如表2所 示 表2S103、根據各條匹配信息所屬類別的用戶反饋總量的大小,對各條匹配信息進行 排序,生成搜索結果。由表2可以看出,“類型Α”比“類型B”更受用戶的關注,因此,如果僅從用戶反饋 總量的角度考慮,屬于“類型Α”的信息應該排在屬于“類型B”的信息的前面。對于匹配信息4而言,其用戶反饋量很小,如果應用現有技術的方案,常規情況 下,匹配信息4將很難獲得靠前的排名。而本申請的技術方案并不是以單條信息的用戶反 饋量大小作為排序依據,匹配信息4的用戶反饋量雖然很小,但是由于它屬于比較受到關 注的類型,因此在本申請技術方案所生成的搜索結果中,匹配信息4將排在匹配信息2和匹 配信息3的前面(或者說匹配信息4將有更多的機會排在匹配信息2和匹配信息3的前面)。這樣,即使是新發布的信息,也有了更多的機會能夠在搜索結果中獲得比較靠前的排名,更好地適應了用戶的實際需求。以表1為基礎,如果有人新發布了能夠和搜索請求相匹配的信息5 (假設該信息5 屬于類型C),并且通過欺詐點擊等手段令其用戶反饋量在短時間內達到50,如果應用現有 技術的方案,這條匹配信息5將直接排在搜索結果中的第二名,從而影響了其他信息發布 者的正常利益。但是,應用本申請的技術方案,由于其所屬類型C的用戶反饋總量低于類型 A和類型B,因此即使通過作弊手段,匹配信息5仍然無法獲得靠前的排名。可以理解的,上 述的例子僅用于示意性說明,在實際應用中,信息的分類更多,所檢索到的匹配信息數量也 更大,個別用戶雖然可以對自己所發布的一條或幾條信息采用作弊手段提高反饋量,但是 無法對信息所在類別的用戶反饋總量造成太大影響,從而有效地減小了作弊對搜索結果排 序的影響。需要說明的是,以上實施例所介紹的,是僅從用戶反饋量這一角度考慮,對匹配信 息進行排名,在實際的應用中,搜索引擎在生成搜索結果時,可以對多種因素進行綜合考 慮。一般是將每個因素都作為一個加權參數,并且根據這些因素的重要程度,為每個加權參 數設定一個加權系數,通過對各個加權參數的加權平均處理,得到一個排序分值,搜索引擎 最終根據各條匹配信息排序分值的大小,確定各條匹配信息在搜索結果中的排列順序。如果應用現有技術的方案,單條匹配信息的用戶反饋量越大,則其所獲得的加權 值就越大。而應用本申請的技術方案,單條匹配信息所屬類別的用戶反饋總量越大,則其所 獲得的加權值就越大。根據表2所示的結果,匹配信息1和匹配信息4在用戶反饋量這項 參數的加權值大于匹配信息2和匹配信息3的加權值。與現有技術相比,匹配信息1將有 更大的機會獲得比較靠前的排名。具體而言,可以根據每個類別匹配信息的用戶反饋總量的比值,計算得到屬于每 個類別的匹配信息的加權值。以表2為例,類型A的用戶反饋總量為105、類型B的用戶反 饋總量為70,其比值為3 2。可以進一步對該比值進行歸一化處理,例如,將每一個類別 的用戶反饋總量除以所有類別的用戶反饋總量之和,所得到的比值為0.6 0.4,那么0.6 和0. 4就分別是屬于類別A和類別B的匹配信息在用戶反饋量這一參數上所獲得的加權 值。也可以將每一個類別的用戶反饋總量除以最大的單類用戶反饋總量,則所得的比值為 1 0.67,那么1和0.67就分別是屬于類別A和類別B的匹配信息在用戶反饋量這一參數 上所獲得的加權值。搜索引擎也可以對每個類別匹配信息的用戶反饋總量進行排序,根據排序結果, 得到屬于每個類別的匹配信息的加權值。如表3所示 表3可見,最終的每個類別信息所獲得的加權值,只和這個類別的用戶反饋總量的排 列順序有關,與具體的用戶反饋總量值無關,也就是說,對于屬于類型E的信息而言,只有 當類型E的用戶反饋總量超過500時,才會獲得更大的加權值以提升排名,從而能夠進一步 減小作弊對搜索結果排序的影響。以上介紹了兩種計算加權值的具體例子,根據“單條匹配信息所屬類別的用戶反 饋總量越大,則其所獲得的加權值就越大”這一原則,本領域技術人員還可以結合具體需 求,采取其他技術手段來計算加權值,這些也在本申請的保護范圍內。在實際應用中,對于多種因素的綜合考慮,除了采用加權的形式之外,還可以采用 分級的形式。即在根據一個(或多個)因素對匹配信息進行第一次排序之后,再根據其他 一個或多個因素對第一次排序的結果做第二次排序。針對本申請所提出的技術方案,本領域技術人員容易想到的是在根據各條匹配 信息所屬類別的用戶反饋總量的大小對各條匹配信息進行排序之后,還可以進一步根據各 條匹配信息的用戶反饋量大小,對各類別下的匹配信息進行排序。以表1中的數據為例,應用申請技術方案,可得到“屬于類型A的信息應該排在屬 于類型B的信息的前面”,即匹配信息1和4應排在匹配信息2和3之前。進一步地,根據 單條匹配信息的用戶反饋量大小對每個類別下的匹配信息進行二次排序,可以得到匹配 信息1應排在匹配信息4之前、匹配信息3應排在匹配信息2之前,則最終的排序結果為匹配信息4、匹配信息1、匹配信息3、匹配信息2。可見,上述方案,一方面保證了受關注的類型能夠排在前面,另一方面,在類型相 同的前提下,進一步根據單條用戶反饋量的大小,分別對每個類別下的匹配信息進行排序。 當然,本領域技術人員可以理解的是,在根據各條匹配信息所屬類別的用戶反饋總量的大 小對各條匹配信息進行排序之后,也可以根據其他的因素(可是一個或多個)對各類別下 的各條匹配信息進行排序。并且,如果有必要,還可以根據其他因素進一步做第三次排序、 第四次排序......,本說明書不再一一列舉。下面將結合幾個具體的應用實例,對本申請的搜索結果生成方法進行說明。例如在網頁搜索應用中,以“赤壁”這一關鍵詞進行搜索,搜索引擎會檢索到很多 條與“赤壁”匹配的網頁,這些網頁分別屬于不同類別。通過讀取某段時間的用戶反饋日志, 并根據網頁類別計算每個類別的用戶反饋總量,得到結果如表4所示 表4“赤壁”對應的是一場著名的古代戰役,自然有很多匹配的網頁都是屬于“軍事”、 “歷史”類別的;同時“赤壁”也經常出現于影視或游戲情節中,所以也有很多匹配的網頁是 屬于“娛樂”、“游戲”類別。此外“赤壁”還是一個旅游景點,因此,也有一些匹配網頁是屬 于“旅游”類別。由于用戶反饋量是通過讀取某段時間的用戶反饋日志獲得,因此可以反映出這段 時間的用戶關注焦點。例如,《赤壁》作為一部電影,受到大量人的關注,因此,在影片上映前 后的一段時間內,屬于“娛樂”這一類別的匹配網頁將會多于其他類別,并且有著很高的用 戶點擊量,如表4所示。應用本申請技術方案,如果用戶使用“赤壁”這一關鍵詞進行搜索, 那么屬于“娛樂”這一類別的匹配網頁,無論其單個網頁的用戶點擊量多少,都將會獲得更 高的加權值,從而在搜索結果中排在比較靠前的位置,便于用戶進行點擊瀏覽。本申請所提供的技術方案,還適用于電子商務的搜索應用。例如,用戶以關鍵詞 “筆記本”進行商品搜索,搜索引擎可能檢索到的商品會涉及筆記本電腦,筆記本電池、筆記 本散熱器,甚至傳統意義上寫字用的筆記本。按照電子商務網站對商品類別的劃分,筆記本 電腦可能屬于“筆記本整機”類別,而筆記本電池、筆記本散熱器屬于“筆記本配件”類別, 至于傳統意義上寫字用的筆記本,則可能屬于“文化用品,,或“辦公用品,,類別。通過對用 戶反饋量的統計,可以發現在現階段,大部分以“筆記本”為關鍵詞進行搜索的用戶,其真正 關注的商品都是筆記本電腦,那么,應用本申請技術方案,屬于“筆記本整機”這一類型的商 品,都將獲得較高的加權值,從而在搜索結果中排在比較靠前的位置,便于用戶進行點擊瀏 覽,并且,對于新發布的筆記本電腦商品信息,同樣有機會排在比較靠前的位置。而對于屬 于“文化用品”或“辦公用品”類別的傳統筆記本,即使通過作弊手段(例如發布者自己提 高詢價次數、自己對商品信息多次進行收藏),也無法針對“筆記本”這一關鍵詞提升排名。 因為傳統的筆記本根本不是大多數搜索“筆記本”的用戶所真正關注的(真正關注傳統筆 記本的用戶會進一步在“文化用品,,或“辦公用品,,的范圍進行搜索,與本申請技術方案無 關,在此不做詳細說明),可見,應用本申請技術方案所生成的搜索結果,其排序更加符合多 數用戶的需求,有效提高了用戶體驗。以上兩個例子,僅用于示意性說明,實際的互聯網信息,可能具有更為完善的分類 層次,例如,在上面的例子中,“筆記本電池”和“筆記本散熱器”指的都是“筆記本配件”分 類下的單條的商品信息。而在實際應用中,“筆記本電池”和“筆記本散熱器”也可能是“筆 記本配件”分類下的兩個子類。那么,應用本申請所提供的技術方案,這兩個子類也分別具 有所對應的用戶反饋總量,如果用戶是在“筆記本配件”這個范圍內進行搜索,那么這兩個子類的商品也將分別獲得不同的加權值。可以理解的是,如果用戶是在一個最小的分類范 圍內進行搜索,那么所獲得的搜索結果,就是以該類別下的單條商品信息的用戶反饋量大 小作為排序依據的。
以上介紹了本申請技術方案在網頁搜索和電子商務搜索兩個方面的應用,可以理 解的是,這只是本申請技術方案較佳的兩種實施方式,事實上,本申請技術方案可以應用于 各類搜索需求,例如圖書數據庫搜索、文獻數據庫搜索等。并且應用范圍也僅不局限于互聯 網領域,其他如單機、局域網中的搜索,都可以應用本申請所提供的技術方案。相應于上面的方法實施例,本申請還提供一種信息搜索系統,參見圖2所示,包 括信息檢索單元210,用于接收搜索請求,通過檢索獲得與所述搜索請求相匹配的各 條匹配信息;用戶反饋量計算單元220,用于對各條匹配信息的用戶反饋量進行查詢,進一步計 算得到每個類別的匹配信息的用戶反饋總量;其中,所述用戶反饋總量為屬于該類別的匹配信息的用戶反饋量之和;結果生成單元230,用于根據各條匹配信息所屬類別的用戶反饋總量的大小,對各 條匹配信息進行排序,生成搜索結果。其中所述用戶反饋量計算單元220,可以通過讀取特定時間段的用戶反饋日志,對 各條匹配信息的用戶反饋量進行查詢。參見圖3所示,所述結果生成單元230,可以包括排序分值計算子單元231,用于以各條匹配信息所屬類別的用戶反饋總量的大小 作為加權參數,計算所述各條匹配信息的排序分值;其中,如果第一匹配信息所屬類別的用戶反饋總量大于第二匹配信息所屬類別的 用戶反饋總量,則所述第一匹配信息的加權值大于所述第二匹配信息的加權值;結果生成子單元232,用于根據各條匹配信息排序分值的大小,生成搜索結果。參見圖4所示,所述排序分值計算子單元231,可以包括第一加權值計算模塊2311,用于根據各條匹配信息所屬類別的用戶反饋總量的大 小,得到屬于每個類別的匹配信息的加權值;本領域技術人員可以理解,排序分值計算子單元231中,還可以進一步包括第二
加權值計算模塊2312、第三加權值計算模塊2313......,用于對其他加權參數所對應的加
權值進行計算。加權平均模塊2310,用于對包括所述第一加權值計算模塊的計算結果在內的加權 值進行加權平均處理,得到各條匹配信息的排序分值。其中,所述第一加權值計算模塊2311,具體可以用于計算每個類別匹配信息的用 戶反饋總量的比值,根據所述比值,得到屬于每個類別的匹配信息的加權值。也可以對每個 類別匹配信息的用戶反饋總量進行排序,根據排序結果,得到屬于每個類別的匹配信息的 加權值。參見圖5所示,所述結果生成單元230,也可以包括以下的組成部分第一排序子單元233,用于根據所述各條匹配信息所屬類別的用戶反饋總量的大 小,對所述各條匹配信息進行排序;
第二排序子單元234,用于根據所述各條匹配信息的用戶反饋量大小,對各類別下 的匹配信息進行排序。以上所提供的信息搜索系統,可以是應用于互聯網搜索的搜索引擎,也可以是應 用于單機、局域網絡的搜索的信息搜索系統。當然,用戶反饋量并不一定是對搜索結果排序的唯一因素。其他因素,例如用戶輸 入的關鍵詞與網頁所展示信息的匹配程度,網頁的Page Rank值等,都可以與用戶反饋量一 起作為對搜索結果排序的因素。為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本 申請時可以把各單元的功能在同一個或多個軟件和/或硬件中實現。 通過以上的實施方式的描述可知,本領域的技術人員可以清楚地了解到本申請可 借助軟件加必需的通用硬件平臺的方式來實現。基于這樣的理解,本申請的技術方案本質 上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品 可以存儲在存儲介質中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設備 (可以是個人計算機,服務器,或者網絡設備等)執行本申請各個實施例或者實施例的某些 部分所述的方法。本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部 分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統實 施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關之處參見方法實施例 的部分說明即可。以上所描述的系統實施例僅僅是示意性的,其中所述作為分離部件說明 的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是 物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要 選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出 創造性勞動的情況下,即可以理解并實施。本申請可用于眾多通用或專用的計算系統環境或配置中。例如個人計算機、服務 器計算機、手持設備或便攜式設備、平板型設備、多處理器系統、基于微處理器的系統、置頂 盒、可編程的消費電子設備、網絡PC、小型計算機、大型計算機、包括以上任何系統或設備的 分布式計算環境等等。本申請可以在由計算機執行的計算機可執行指令的一般上下文中描述,例如程序 模塊。一般地,程序模塊包括執行特定任務或實現特定抽象數據類型的例程、程序、對象、組 件、數據結構等等。也可以在分布式計算環境中實踐本申請,在這些分布式計算環境中,由 通過通信網絡而被連接的遠程處理設備來執行任務。在分布式計算環境中,程序模塊可以 位于包括存儲設備在內的本地和遠程計算機存儲介質中。以上所述僅是本申請的具體實施方式
,應當指出,對于本技術領域的普通技術人 員來說,在不脫離本申請原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應 視為本申請的保護范圍。
權利要求
一種搜索結果生成方法,其特征在于,包括信息搜索系統接收搜索請求,通過檢索獲得與所述搜索請求相匹配的各條匹配信息;對所述各條匹配信息的用戶反饋量進行查詢,進一步計算得到所述各條匹配信息所屬類別的用戶反饋總量;根據所述各條匹配信息所屬類別的用戶反饋總量的大小,對所述各條匹配信息進行排序,生成搜索結果。
2.根據權利要求1所述的方法,其特征在于,所述用戶反饋總量為屬于該類別的匹配 信息的用戶反饋量之和。
3.根據權利要求2所述的方法,其特征在于,所述對所述各條匹配信息的用戶反饋量 進行查詢,具體實現為通過讀取特定時間段的用戶反饋日志,對所述各條匹配信息的用戶反饋量進行查詢。
4.根據權利要求3所述的方法,其特征在于,所述根據所述各條匹配信息所屬類別的 用戶反饋總量的大小,對所述各條匹配信息進行排序,包括以所述各條匹配信息所屬類別的用戶反饋總量的大小作為加權參數,計算所述各條匹 配信息的排序分值;其中,如果第一匹配信息所屬類別的用戶反饋總量大于第二匹配信息所屬類別的用戶 反饋總量,則所述第一匹配信息的加權值大于所述第二匹配信息的加權值;所述各條匹配 信息排序分值的大小,用于確定所述各條匹配信息在所述搜索結果中的排列順序。
5.根據權利要求4所述的方法,其特征在于,所述以所述各條匹配信息所屬類別的用 戶反饋總量的大小作為加權參數,具體實現為計算每個類別匹配信息的用戶反饋總量的比值,根據所述比值,得到屬于每個類別的 匹配信息的加權值。
6.根據權利要求4所述的方法,其特征在于,所述以所述各條匹配信息所屬類別的用 戶反饋總量的大小作為加權參數,具體實現為對每個類別匹配信息的用戶反饋總量進行排序,根據排序結果,得到屬于每個類別的 匹配信息的加權值。
7.根據權利要求3所述的方法,其特征在于,所述根據所述各條匹配信息所屬類別的 用戶反饋總量的大小,對所述各條匹配信息進行排序之后,還包括根據所述各條匹配信息的用戶反饋量大小,對各類別下的匹配信息進行排序。
8.根據權利要求1所述的方法,其特征在于,所述搜索請求,包括網頁搜索請求,和/或電子商務搜索請求。
9.根據權利要求8所述的方法,其特征在于,當所述搜索請求為網頁搜索請求時,所述 用戶反饋量包括網頁鏈接點擊次數,和/或網頁鏈接被收藏次數。
10.根據權利要求8所述的方法,其特征在于,當所述搜索請求為電子商務搜索請求 時,所述用戶反饋量包括商品成交量、商品成交金額、商品詢價次數和/或商品信息被收藏次數。
11.一種信息搜索系統,其特征在于,包括信息檢索單元,用于接收搜索請求,通過檢索獲得與所述搜索請求相匹配的各條匹配fn息;用戶反饋量計算單元,用于對各條匹配信息的用戶反饋量進行查詢,進一步計算得到 每個類別的匹配信息的用戶反饋總量;結果生成單元,用于根據所述各條匹配信息所屬類別的用戶反饋總量的大小,對所述 各條匹配信息進行排序,生成搜索結果。
12.根據權利要求11所述的系統,其特征在于,所述用戶反饋總量為屬于該類別的匹 配信息的用戶反饋量之和。
13.根據權利要求12所述的信息搜索系統,其特征在于,所述用戶反饋量計算單元,通 過讀取特定時間段的用戶反饋日志,對所述各條匹配信息的用戶反饋量進行查詢。
14.根據權利要求13所述的信息搜索系統,其特征在于,所述結果生成單元,包括排序分值計算子單元,用于以所述各條匹配信息所屬類別的用戶反饋總量的大小作為 加權參數,計算所述各條匹配信息的排序分值;其中,如果第一匹配信息所屬類別的用戶反饋總量大于第二匹配信息所屬類別的用戶 反饋總量,則所述第一匹配信息的加權值大于所述第二匹配信息的加權值;結果生成子單元,用于根據所述各條匹配信息排序分值的大小,生成搜索結果。
15.根據權利要求14所述的信息搜索系統,其特征在于,所述排序分值計算子單元,包括第一加權值計算模塊,用于根據所述各條匹配信息所屬類別的用戶反饋總量的大小, 得到屬于每個類別的匹配信息的加權值;加權平均模塊,用于對包括所述第一加權值計算模塊的計算結果在內的加權值進行加 權平均處理,得到所述各條匹配信息的排序分值。
16.根據權利要求15所述的信息搜索系統,其特征在于,所述第一加權值計算模塊,用于計算每個類別匹配信息的用戶反饋總量的比值,根據 所述比值,得到屬于每個類別的匹配信息的加權值。
17.根據權利要求15所述的信息搜索系統,其特征在于,所述第一加權值計算模塊,用于對每個類別匹配信息的用戶反饋總量進行排序,根據 排序結果,得到屬于每個類別的匹配信息的加權值。
18.根據權利要求13所述的信息搜索系統,其特征在于,所述結果生成單元,包括第一排序子單元,用于根據所述各條匹配信息所屬類別的用戶反饋總量的大小,對所 述各條匹配信息進行排序;第二排序子單元,用于根據所述各條匹配信息的用戶反饋量大小,對各類別下的匹配 信息進行排序。
全文摘要
本申請公開了一種搜索結果生成方法及信息搜索系統。一種搜索結果生成方法,包括信息搜索系統接收搜索請求,通過檢索獲得與所述搜索請求相匹配的各條匹配信息;對所述各條匹配信息的用戶反饋量進行查詢,進一步計算得到所述各條匹配信息所屬類別的用戶反饋總量;根據所述各條匹配信息所屬類別的用戶反饋總量的大小,對所述各條匹配信息進行排序,生成搜索結果。應用以上技術方案,在用戶進行搜索時,可以將更為合理的匹配信息排序結果展現給用戶,提升用戶體驗。
文檔編號G06F17/30GK101887437SQ20091013527
公開日2010年11月17日 申請日期2009年5月12日 優先權日2009年5月12日
發明者侯磊, 張勤, 謝宇恒, 邢飛, 郭寧 申請人:阿里巴巴集團控股有限公司