專利名稱:用于生成使用搜索引擎執行的搜索的結果的方法
技術領域:
本發明的目標是用于生成使用搜索引擎執行的搜索的結果的方法。本質上,本發明的目標是改進尤其是在因特網網絡上的通過搜索引擎發起的計算機搜索的結果的可靠性。本發明的領域總體上是通信網絡上的信息搜索的領域。本發明可以在使用搜索引擎發送尤其是可視數據的任意通信網絡上實現;這里,所考慮的可視數據是縮略圖(thumbnail)類型的可視數據。本發明將在所考慮的 通信網絡是因特網網絡的情況下進行描述,所述因特網網絡是用戶通過因特網瀏覽器訪問的網絡;在該網絡上,用戶可以通過搜索引擎執行搜索。然而,本發明還可以在其他類型的網絡(例如公司內部網網絡)上實現。
背景技術:
現今,越來越多的文檔被數字化并且通過搜索引擎可訪問。被數字化并且在線可訪問的文檔數量上的增長的直接后果是當例如通過關鍵字由因特網瀏覽器執行搜索時獲得的結果數量上的增長。如果因此獲得的結果呈現了相對深入的特性,則對于用戶而言增加了從搜索結果列表中找到期望信息的難度。某些搜索引擎設法對找到的結果的相關性劃分優先級,但是手動步驟仍然存在,用戶必須執行該手動步驟以從獲得的結果列表中選擇用戶真正感興趣的結果。為了促進該手動步驟,通常以與URL相關聯的文本行的形式返回結果列表的某些瀏覽器利用縮略圖類型圖像來補充搜索結果。縮略圖是指如下尺寸上減少的圖像,其允許與該圖像相關聯的結果被視覺上標識。例如,縮略圖可以由唱片套或書籍的封面的圖像構成。縮略圖的尺寸可以被自愿減少以便能夠例如和與搜索結果相關聯的文本協調進行放置,并且能夠維持在屏幕上可視地同時顯示大量搜索結果的能力。在某些情況下,縮略圖本身構成所執行搜索的結果行,而不與文本行相關聯。因此,在搜索之后,縮略圖可以直接出現或者與URL地址類型信息相關聯地出現。然而,仍然存在困難盡管使用了縮略圖,但是由搜索引擎執行的搜索的結果可能以相對無組織方式呈現,并且可能對于用戶而言難于利用。因此,在大多數情況下,這些結果包括結果族(family),每個結果族對應于指定類似元素的結果。但在實踐中,這些結果族沒有被編組在一起。因此,例如如果用戶搜索給定藝術家的特定專輯(他忘記了該專輯的名稱),則該用戶會在其搜索引擎的適當窗口中錄入該藝術家的名字。然后,不同的專輯將會出現在結果列表中;但是,針對所考慮的藝術家的給定專輯的不同結果不一定編組在一起,例如編組在搜索結果的連續行中。實際上,相同專輯可以由不同URL引用,這些URL在結果列表中不一定是連續的。另外,相同專輯中的微小差別可能存在于唱片套中;例如,專輯的“簡裝”版與“收藏”版之間的微小差別就屬于上述情況;事實上,相同專輯的不同版本對應于藝術家的相同作品,并且因此可能看起來在由搜索引擎產生的結果列表中將上述版本編組在一起以便促進用戶的搜索是令人感興趣的。在本發明的上下文中,已經利用藝術家專輯描述的示例可容易地轉變成其他項目,諸如書籍、DVD或其他項目。
發明內容
根據本發明的方法提出了一種對上述問題的解決方案。本發明提出了一種解決方案,從而使得當通過搜索引擎發起搜索時生成的縮略圖在由搜索引擎產生的結果列表中通過條目族編組在一起。條目族是指如下多個條目,其相關聯的縮略圖呈現相似性,從而使得這些條目被認為指代相同的對象。為此,提出了執行以下操作以便使得搜索結果對于用戶而言更加可讀將由搜索產生的不同縮略圖進行比較,以及將呈現強相似性的類似縮略圖編組在一起。本發明本質上涉及一種用于生成使用搜索引擎執行的搜索的結果的方法,其中在所述搜索操作之后建立結果列表,其特征在于,所述方法包括以下不同步驟-從結果列表中標識與所示結果相關聯的縮略圖類型圖像; -執行對圖像的分析操作,包括成對比較所標識的縮略圖類型圖像;-將通過比較縮略圖類型圖像的操作確定的共享相似度的縮略圖類型圖像編組成圖像族;-根據編組成圖像族來生成搜索的結果。實踐中,如果兩個圖像實際上表示相同對象,則所述兩個圖像被認為呈現彼此之間的相似度,所述圖像可以按照細節的順序在它們之間呈現差異。通常,如果在以相同格式并且以相同尺寸返回的情況下構成兩個圖像的像素的小于20%呈現不同的分量值,則可以認為這兩個圖像是彼此相似的。除了先前段落中已經提到的主要步驟之外,根據本發明的方法可以包括以下中的一個或多個附加特性-比較操作通過編碼器執行;-編碼器為H264類型;-通過編碼器執行的比較操作包括如下不同步驟-從標識的縮略圖類型圖像組成所有可能的縮略圖類型圖像對;-針對每對組成的圖像,通過編碼器執行對所述圖像對進行編碼的操作;-從編碼操作確定圖像對中兩個圖像之間的差別;-將所考慮的圖像對中的兩個圖像之間的差別量化,以獲得量化值;-如果所考慮的圖像對的量化值小于先前確定的差別閾值,則將圖像對中的兩個圖像編組到相同的圖像族中;-在圖像分析步驟之前,所述方法包括以下步驟訪問與每個標識的縮略圖相關聯的高分辨率圖像,然后在該高分辨率圖像上執行圖像分析步驟;-在圖像分析步驟之前,所述方法包括以下步驟將標識的縮略圖類型圖像轉換成相同的圖像格式;-所標識的縮略圖類型圖像轉換成的圖像格式是YUV格式;-包括從結果列表標識與所示結果相關聯的縮略圖類型圖像的步驟在所述結果列表中先前確定數目的結果上執行。
根據本發明的方法的不同附加特性在它們不相互排斥的情況下,根據所有組合可能性進行組合,以產生本發明的實施方式的不同示例。在閱讀以下描述并且查看附圖之后,將更好地理解本發明及其各種應用。
附圖是出于指示目的而呈現并且不以任何方式限制本發明。其中圖I是示出了根據本發明的方法的實現的示例的示圖;圖2是根據本發明生成通過搜索引擎執行的搜索的結果的示意表示;以及圖3是圖示了通過圖像族對圖像進行編組的值表的表示。
具體實施方式
除非另外說明,出現在不同附圖中的元素將保持相同的附圖標記。圖I表示了圖示了根據本發明的方法的實現示例的示圖;圖2中圖示了組織從搜索生成結果的方法的所述程序的不同步驟。因此,將同時對圖I和圖2進行描述。本發明在由用戶在因特網網絡上通過搜索引擎執行搜索的上下文中進行描述。圖2表示了分別表示根據本發明的方法的實現之前以及根據本發明方法的實現之后的搜索結果的第一屏幕200和第二屏幕300。在所表示的示例中,用戶通過在搜索引擎的區域202中鍵入一組關鍵字201 (這里是“藝術家X”)來發起搜索。繼而,用戶獲得對應于唱片套、根據特定于每個搜索引擎的方法而分層級地組織的結果列表203。在所示示例中,為了簡單化,結果列表203限于縮略圖,省略了實踐中可能會呈現的與URL地址相關聯的文本。因此,這里考慮結果列表排他地由所示結果組成,即,由與縮略圖相關聯的結果組成。仍然是為了簡單化,結果列表203限于八個結果的列表,按其呈現在屏幕上的順序引用為301至308。實踐中,結果的數目經常大得多,并且對縮略圖的使用必須成為用于在用戶感興趣的結果的選擇方面進行辨別的工具。在表示的示例中,針對藝術家X列出了三個專輯,第一專輯具有描述“DISC I”(縮略圖301,304,306和308),第二專輯具有描述“DISC 2” (縮略圖302,305和307),而第三專輯具有描述“DISC 3”(縮略圖303)。如可以看出的,不同的專輯在結果列表中是以無組織的方式出現所考慮的專輯的不同情況在結果列表中沒有被編組在一起,這對用戶而言是不實際的,尤其是在結果列表203包括大量結果時。如圖I中所示,為了根據按本發明的方法的實施方式的示例生成搜索結果,在第一步驟101中,本發明執行操作以在結果列表203中標識縮略圖類型圖像。這種操作可以通過傳統的圖像處理操作或者通過標識與縮略圖相關聯的URL來執行。在本發明的特定實施方式中,在之后的步驟102中,將縮略圖的標識限制于預先確定的數目(例如五十),以便限制隨后介入的計算量,并且通過考慮這種限制將促進用戶選擇其實際上感興趣的結果的任務。在所考慮的示例中,縮略圖的數目被限制在先前提到的八個縮略圖。有利地,在之后的步驟103中,執行操作以訪問與所考慮的縮略圖相關聯的高分辨率圖像。為此,可以使用例如與所考慮的縮略圖相關聯的URL。在之后的步驟104中,執行操作以將縮略圖類型圖像(如果有必要,以其高分辨率版本)從其原始格式(jpeg、gif 等)轉換成由編碼器類型設備直接可用的格式。這種格式例如是YUV 4:2:0格式或RGB格式。在之后的步驟105中,執行基于經轉換的圖像來分析圖像的步驟。在所考慮的示例中,該步驟包括以下不同操作-操作121,通過根據所有可能性組合所有標識的圖像來構成圖像對;因此,在所考慮的示例中,從八個標識的縮略圖中獲得28對兩個圖形(Bi,Bj),其中i和j屬于集合{1-8}。-操作122,在操作122期間,對(Bi,Bj)由H264類型解碼器編碼;在實施方式的其他示例中,編碼器可以是VCl或Dirac類型。因此在編碼器的輸出,針對每個編碼對(Bi,Bj),以如下數據序列的形式獲得信息集{Ri,?(1,1),?(1,2)... (1,!11)},其中虹是圖像 Bi的壓縮格式,并且數據P(i,m)是指示在圖像Bj與圖像Bi之間觀察到的改變的數據,值m對應于在該處已經觀察到圖像Bi與圖像Bj之間的差別的圖像的區域(通常為矩形)的數目。-操作123,在該操作123期間,針對已經經歷過編碼操作的每對圖像(Bi,Bj)對圖像Bi與圖像Bj之間觀察到的差異進行量化;為此,考慮信息集{Ri,P(i,l),P(i,2)... P (i,m)},并且針對每個編碼對出1,8」),將所有數據?(1,!11)相加以獲得被稱為差異值的值。該值越低,則圖像Bi與圖像Bj之間的相似性就越高。-操作124,用于將圖像編組在一起,在以上描述的操作之后呈現低于或者低于或等于先前確定的閾值的圖像Bi與圖像Bj在操作124期間被編組在一起到相同的圖像族中。編組到相同圖像族中的圖像繼而被認為共享相似度。圖3示意性地圖示了圖像族的構成。在該圖中表示了表320,該表的每行與該表的每列對應于八個縮略圖301-308之一。與縮略圖相關聯的行和與另一縮略圖相關聯的列的交叉點給出根據以上描述的方法計算的被稱為比較值的值。因此,通過對其比較值小于先前確定的閾值的圖像進行編組來執行圖像編組操作。在所考慮的示例中,值“2”被當作閾值。因此,如圖2中所示,在示意性地表示遵循根據本發明的方法的實現而生成的搜索的結果的屏幕300處-縮略圖301、304、306和308被編組在一起到相同行上以形成第一圖像族311;實際上,這些縮略圖之間僅有的差異包括在單詞“DISC”的不同字母之間存在符號,這些縮略圖在所有其他方面都是相同的。-縮略圖302、305和307被編組在一起到相同行上以形成第二圖像族312;實際上,這些縮略圖之間僅有的差異包括出現在單詞“DISC”的不同字母之間存在符號,這些縮略圖在所有其他方面都是相同的。因此,用戶可以更容易地定位所搜索的對象。
權利要求
1.一種用于生成使用搜索弓I擎執行的搜索的結果的方法,其中在所述搜索操作之后建立結果列表,其特征在于,所述方法包括如下不同步驟 -從所述結果列表中標識(101)與所示結果相關聯的縮略圖類型圖像(301-308); -執行對所述圖像的分析操作(105),包括成對比較所標識的縮略圖類型圖像; -將通過比較所述縮略圖類型圖像的操作確定的共享相似度的所述縮略圖類型圖像編組(124)成圖像族(311 ;312); -根據編組成圖像族來生成所述搜索的結果。
2.根據先前權利要求所述的方法,其特征在于,所述比較操作通過編碼器執行。
3.根據先前權利要求所述的方法,其特征在于,所述編碼器是H264類型。
4.根據權利要求2或3中的任意一項所述的方法,其特征在于,通過所述編碼器執行的所述比較操作包括如下不同步驟 -從所標識的縮略圖類型圖像構成(121)所有可能的縮略圖類型圖像對(Bi,Bj); -針對每對組成的圖像,通過所述編碼器執行(122)對所述圖像對進行編碼的操作; -從所述編碼操作確定所述圖像對中所述兩個圖像之間的差別; -將所考慮的所述圖像對中的所述兩個圖像之間的差別量化(123),以獲得量化值;-如果所考慮的所述圖像對的所述量化值小于先前確定的差別閾值,則將所述圖像對中的所述兩個圖像編組(124)到相同的圖像族中。
5.根據先前權利要求中任意一項所述的方法,其特征在于,在所述圖像分析步驟之前,所述方法包括以下步驟訪問(103)與每個標識的縮略圖相關聯的高分辨率圖像,然后在所述高分辨率圖像上執行所述圖像分析步驟。
6.根據先前權利要求中任意一項所述的方法,其特征在于,在所述圖像分析步驟之前,所述方法包括以下步驟將所標識的縮略圖類型圖像轉換(104)成相同的圖像格式。
7.根據先前權利要求所述的方法,其特征在于,所標識的縮略圖類型圖像轉換成的所述圖像格式是YUV格式。
8.根據先前權利要求中任意一項所述的方法,其特征在于,包括從所述結果列表標識與所示結果相關聯的所述縮略圖類型圖像的步驟在所述結果列表中先前確定數目的結果上執行(102)。
全文摘要
本發明涉及一種用于生成使用搜索引擎執行的搜索的結果的方法,其中在所述搜索操作之后建立結果列表,其特征在于,所述方法包括如下不同步驟從所述結果列表中標識(101)與所示結果相關聯的縮略像(301-308);執行對所述圖像的分析操作(105),包括成對比較所標識的縮略像;將通過比較所述縮略像的操作預先確定的共享相似度的縮略像編組(124)成圖像族(311;312);以及基于編組成圖像族來生成所述搜索的結果。
文檔編號G06F17/30GK102713902SQ201080054826
公開日2012年10月3日 申請日期2010年9月8日 優先權日2009年12月2日
發明者J-P·莫拉爾 申請人:薩基姆通訊寬帶公司