本發明涉及數據處理領域,具體涉及一種垂直搜索引擎對檢索請求的處理方法及裝置。
背景技術:
垂直搜索是針對某一個行業或領域的專業搜索。當用戶利用客戶端發送檢索請求后,垂直搜索引擎需要理解檢索請求中的用戶需求,并根據檢索請求中的檢索串查詢資源庫,最終向用戶返回查詢結果,幫助用戶找到目標信息。
與傳統搜索引擎相比,垂直搜索引擎的搜索資源量相對較小。當用戶發送的檢索請求在表述上具有模糊性、口語化的特點時,垂直搜索引擎可能不能準確理解檢索請求中的用戶需求,從而出現檢索無結果或結果相關性較差的情況。
技術實現要素:
為了提高垂直搜索引擎對具有模糊性、口語化特點的檢索請求的處理結果的準確率和召回率,本發明提供了一種垂直搜索引擎對檢索請求的處理方法及裝置。
本發明提供了一種垂直搜索引擎對檢索請求的處理方法,所述方法應用于垂直搜索引擎,所述方法包括:
接收來自客戶端的任一檢索請求,所述檢索請求包括檢索串;
判斷所述檢索串是否為模糊性檢索串;
當確定所述檢索串為模糊性檢索串時,提取所述模糊性檢索串中的檢索標簽;
在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象。
優選地,所述判斷所述檢索串是否為模糊性檢索串,包括:
計算所述檢索串的熵;
判斷所述檢索串的熵是否大于預設的熵閾值;
當所述檢索串的熵大于所述熵閾值時,確定所述檢索串為模糊性檢索串。
優選地,所述判斷所述檢索串是否為模糊性檢索串,包括:
判斷所述檢索串中是否包括預設的模糊性關鍵詞;
當確定所述檢索串中包括任一預設的模糊性關鍵詞時,確定所述檢索串為模糊性檢索串。
優選地,所述提取所述模糊性檢索串中的檢索標簽,包括:
將所述模糊性檢索串劃分為若干檢索詞;
判斷預設的檢索標簽中是否包括所述模糊性檢索串劃分出的任一檢索詞,如果是,則提取所述檢索詞作為所述模糊性檢索串的檢索標簽。
優選地,所述提取所述模糊性檢索串中的檢索標簽,包括:
將所述模糊性檢索串劃分為若干檢索詞;
計算各個檢索詞的權重,并提取權重最大的檢索詞作為所述模糊性檢索串的檢索標簽。
優選地,所述在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象之前,還包括:
根據用戶檢索日志,建立檢索標簽庫,所述檢索標簽庫中包括檢索標簽;
利用預設的模糊性檢索串生成模板,為所述檢索標簽庫中的各個檢索標簽生成對應的模糊性檢索串;
在第三方網站上抓取各個模糊性檢索串對應的搜索對象,并對所述搜索對象進行去噪處理,得到各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系;
根據所述各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系,建立并存儲所述檢索標簽庫中的各個檢索標簽與搜索對象的對應關系。
優選地,所述方法還包括:
根據在第三方網站上抓取的各個模糊性檢索串對應的搜索對象的分布情況,確定所述檢索標簽與搜索對象的對應關系中,各個搜索標簽與其對應的搜索結果的關聯度。
本發明還提供了一種垂直搜索引擎對檢索請求的處理裝置,所述裝置包括:
接收模塊,用于接收來自客戶端的任一檢索請求,所述檢索請求包括檢索串;
判斷模塊,用于判斷所述檢索串是否為模糊性檢索串;
提取模塊,用于在確定所述檢索串為模糊性檢索串時,提取所述模糊性檢索串中的檢索標簽;
查詢模塊,用于在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象。
優選地,所述判斷模塊,包括:
第一計算子模塊,用于計算所述檢索串的熵;
第一判斷子模塊,用于判斷所述檢索串的熵是否大于預設的熵閾值;
第一確定子模塊,用于在所述檢索串的熵大于所述熵閾值時,確定所述檢索串為模糊性檢索串。
優選地,所述判斷模塊,包括:
第二判斷子模塊,用于判斷所述檢索串中是否包括預設的模糊性關鍵詞;
第二確定子模塊,用于在確定所述檢索串中包括任一預設的模糊性關鍵詞時,確定所述檢索串為模糊性檢索串。
優選地,所述提取模塊,包括:
第一劃分子模塊,用于將所述模糊性檢索串劃分為若干檢索詞;
第三判斷子模塊,用于判斷預設的檢索標簽中是否包括所述模糊性檢索串劃分出的任一檢索詞;
第一提取子模塊,用于在所述第三判斷子模塊的結果為是時,提取所述檢索詞作為所述模糊性檢索串的檢索標簽。
優選地,所述提取模塊,包括:
第二劃分子模塊,用于將所述模糊性檢索串劃分為若干檢索詞;
第二計算子模塊,用于計算各個檢索詞的權重;
第二提取子模塊,用于提取權重最大的檢索詞作為所述模糊性檢索串的檢索標簽。
優選地,所述裝置還包括:
第一建立模塊,用于根據用戶檢索日志,建立檢索標簽庫,所述檢索標簽庫中包括檢索標簽;
生成模塊,用于利用預設的模糊性檢索串生成模板,為所述檢索標簽庫中的各個檢索標簽生成對應的模糊性檢索串;
抓取模塊,用于在第三方網站上抓取各個模糊性檢索串對應的搜索對象;
去噪模塊,用于對所述搜索對象進行去噪處理,得到各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系;
第二建立模塊,用于根據所述各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系,建立并存儲所述檢索標簽庫中的各個檢索標簽與搜索對象的對應關系。
優選地,所述裝置還包括:
確定模塊,用于根據在第三方網站上抓取的各個模糊性檢索串對應的搜索對象的分布情況,確定所述檢索標簽與搜索對象的對應關系中,各個搜索標簽與其對應的搜索結果的關聯度。
本發明中,首先,接收來自客戶端的任一檢索請求,所述檢索請求包括檢索串;其次,判斷所述檢索串是否為模糊性檢索串;當確定所述檢索串為模糊性檢索串時,提取所述模糊性檢索串中的檢索標簽;最后,在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象。與現有技術相比,本實施例能夠提高垂直搜索引擎對具有模糊性、口語化特點的檢索請求的處理結果的準確率和召回率。
附圖說明
為了更清楚地說明本申請實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明提供的一種垂直搜索引擎對檢索請求的處理方法流程圖;
圖2為本發明提供的一種設置檢索標簽與搜索對象的對應關系的方法流程 圖;
圖3為本發明提供的一種垂直搜索引擎對檢索請求的處理方法交互圖;
圖4為本發明提供的一種垂直搜索引擎對檢索請求的處理裝置結構示意圖;
圖5為本發明提供的一種判斷模塊402的結構示意圖;
圖6為本發明提供的另一種判斷模塊402的結構示意圖;
圖7為本發明提供的一種提取模塊403的結構示意圖;
圖8為本發明提供的另一種提取模塊403的結構示意圖;
圖9為本發明提供的服務器的部分結構的框圖。
具體實施方式
下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
實施例一
參考圖1,圖1為本實施例提供的一種垂直搜索引擎對檢索請求的處理方法流程圖,具體可以包括:
S101:接收來自客戶端的任一檢索請求,所述檢索請求包括檢索串。
本實施例應用于垂直搜索引擎,當用戶通過客戶端發送檢索請求時,接收所述檢索請求,并提取所述檢索請求中的檢索串。具體的,所述檢索串為用戶輸入的搜索關鍵字\詞,如“微信里的游戲”、“可以買東西的軟件”等。
S102:判斷所述檢索串是否為模糊性檢索串。
本實施例中,在提取出所述檢索請求中的檢索串后,判斷所述檢索串是否為模糊性檢索串。其中,所述模糊性檢索串在表述上具有模糊性、口語化的特點,不能準確表達用戶的檢索需求。
本實施例提供了一種用于判斷檢索串是否為模糊性檢索串的方法,具體的,在提取出所述檢索請求中的檢索串后,首先計算所述檢索串的熵。其中,可以利用公式(1)計算檢索串的熵,具體的,公式(1)如下:
其中,QEq用于表示檢索串的熵值,p(d,q)表示檢索詞為q時,搜索對象d被搜索到的比率,其中,搜索對象被搜索到的比率等于搜索對象被搜索到的次數與總搜索次數的比值,如檢索詞為q時,產生的總搜索次數為n,其中,m次搜索到了搜索對象d,則p(d,q)=m/n。檢索串的熵值為搜索對象被搜索到的比率的以2為底的對數值和搜索對象被搜索到的比率的乘積。p(d,q)=m/n的值的范圍為(0,1),log2(p(d,q)的值為負值。
其次,在通過計算得到所述檢索串的熵后,判斷所述檢索串的熵是否大于預設的熵閾值。其中,熵大于所述熵閾值的檢索串在表述上具有模糊性、口語化的特點,可以被確定為模糊性檢索串。相反的,熵小于所述熵閾值的檢索串則可以被認為是能夠準確表達用戶的檢索需求的檢索串。
除了上述利用熵計算確定模糊性檢索串的方法之外,本實施例還提供了一種用于判斷檢索串是否為模糊性檢索串的方法。具體的,本實施例可以預先確定模糊性檢索串中通常包括的模糊性關鍵詞,如“關于XX的游戲”、“可以XXX的軟件”、“有沒有能XXX”等模糊性檢索串中通常都包括模糊性關鍵詞,如“關于”、“可以”、“有沒有”等。當提取到檢索請求中的檢索串后,判斷所述檢索串中是否包括預設的任意一個模糊性關鍵詞。只要所述檢索串中包括任意一個預設的模糊性關鍵詞,則可以直接確定所述檢索串為模糊性檢索串。
另外,本實施例也可以預先制定模糊性檢索串生成模板,具體的,利用預先指定的模板分別為各個預設的模糊性關鍵詞生成對應的模糊性檢索串。當提取到檢索請求中的檢索串后,判斷所述檢索串是否為任意一個預先生成的模糊性檢索串。
事實上,能夠判斷檢索串是否為模糊性檢索串的方法遠不止本實施例提供的上述兩種方法。本實施例對于能夠實現判斷檢索串是否為模糊性檢索串功能的方法不一一列舉,但是其均在本發明保護范圍之內。
S103:當確定所述檢索串為模糊性檢索串時,提取所述模糊性檢索串中的檢索標簽。
本實施例中,當確定所述檢索請求中的檢索串是模糊性檢索串時,在所述模糊性檢索串中提取檢索標簽。例如,當模糊性檢索串為“找吃飯的軟件”時, 提取的檢索標簽可以為“找吃飯”。
實際應用中存在各種各樣的提取檢索標簽的方法,均在本發明的保護范圍之內,在此發明人不一一列舉,僅提供以下兩個具體的實現方法作為舉例。
第一種提取檢索標簽的方法中,首先,將模糊性檢索串劃分為若干檢索詞,如模糊性檢索串為“找吃飯的軟件”時,可以將其劃分為檢索詞“找吃飯”、“軟件”。其次,在預先設置的檢索標簽中查找是否存在與所述模糊性檢索串劃分出的任意一個檢索詞相同的檢索標簽。當存在時,則提取所述檢索詞作為所述模糊性檢索串的檢索標簽。
實際應用中,可以預先建立一個檢索標簽庫,所述檢索標簽庫用于存儲通過各種途徑生成的檢索標簽。例如,可以根據用戶檢索日志,生成檢索標簽,并存儲于檢索標簽庫中。具體到應用搜索領域,本實施例還可以通過用戶在群組中的發言記錄,以及為各個應用貼的標簽,生成檢索標簽。
第二種提取檢索標簽的方法中,首先,還是將模糊性檢索串劃分為若干檢索詞,其次,分別計算各個檢索詞的權重,并提取權重最大的檢索詞作為所述模糊性檢索串的檢索標簽。具體的,計算各個檢索詞的權重的方法為現有技術,本實施例在此不再贅述。
值得注意的是,如果不能確定所述檢索串為模糊性檢索串,則可以根據所述檢索串做傳統搜索。
S104:在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象。
本實施例中,當提取到所述模糊性檢索串中的檢索標簽時,可以在預設的檢索標簽與搜索對象的對應關系中,查詢與提取出的檢索標簽對應的搜索對象,至此完成垂直搜索引擎對檢索請求的處理。
值得注意的是,本實施例在執行S104之前,可以先執行本實施例提供的一種設置檢索標簽與搜索對象的對應關系的流程。參考圖2,為本實施例提供的一種設置檢索標簽與搜索對象的對應關系的方法流程圖,具體包括:
S201:根據用戶檢索日志,建立檢索標簽庫,所述檢索標簽庫中包括檢索標簽。
本實施例中,可以根據用戶檢索日志,生成常用的檢索標簽,并將檢索標 簽存儲在檢索標簽庫中。
另外,在應用搜索領域,還可以通過用戶在群組中的發言記錄,以及為各個應用貼的標簽,生成常用的檢索標簽,并存儲于檢索標簽庫中。
S202:利用預設的模糊性檢索串生成模板,為所述檢索標簽庫中的各個檢索標簽生成對應的模糊性檢索串。
本實施例可以預先設置模糊性檢索串生成模板,如“可以XXX的軟件”、“關于XX的游戲”等。利用預設的各個模糊性檢索串生成模板,分別為所述檢索標簽庫中的各個檢索標簽生成對應的模糊性檢索串。如,利用模板“可以XXX的軟件”生成模糊性檢索串“可以找吃飯的軟件”。
S203:在第三方網站上抓取各個模糊性檢索串對應的搜索對象,并對所述搜索對象進行去噪處理,得到各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系。
本實施例中,在生成模糊性檢索串后,可以在第三方網站(如百度、谷歌等上抓取各個模糊性檢索串對應的搜索對象。另外,由于第三方網站上的搜索對象也存在不準確或者不能滿足用戶需求的問題,所以,本實施例還提供了對抓取到的搜索對象的去噪處理,以便得到更準確的搜索對象。最終,建立各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系。
實際應用中,對抓取到的搜索對象的去噪處理是一個復雜的過程,本實施例可以結合多種去噪方法對抓取到的搜索對象進行處理。
具體的,可以在第三方網頁抓取的過程中,結合網頁的上下文,計算出了一批轉義風險較大的搜索對象的名稱集合,并構建搜索對象的名稱黑名單,從而去掉關聯性較小的搜索對象。另外,由于搜索結果的文本長度一般較小,所以,還可以通過控制搜索對象的文本長度的方法,去掉一部分關聯性較小的搜索對象。另外,本實施例還可以利用LDA主題模型、或者基于主題信息等方式對第三方網頁抓取的搜索對象進行去噪處理。
S204:根據所述各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系,建立并存儲所述檢索標簽庫中的各個檢索標簽與搜索對象的對應關系。
本實施例中,由于檢索標簽庫中的各個檢索標簽是由模糊性檢索串中提取出的,所以,可以根據已經建立的各個模糊性檢索串與經過去噪處理后的搜索 對象的對應關系,建立并存儲所述檢索標簽庫中的各個檢索標簽與搜索對象的對應關系。
本實施例中,為了使得垂直搜索引擎對檢索請求的處理結果更加準確,本實施例還可以根據在第三方網站上抓取的各個模糊性檢索串對應的搜索對象的分布情況,確定所述檢索標簽與搜索對象的對應關系中,各個搜索標簽與其對應的搜索結果的關聯度。例如,可以為建立的檢索標簽與搜索對象的各個對應關系設置分數,以表示二者的關聯度。
本實施例中,首先,接收來自客戶端的任一檢索請求,所述檢索請求包括檢索串;其次,判斷所述檢索串是否為模糊性檢索串;當確定所述檢索串為模糊性檢索串時,提取所述模糊性檢索串中的檢索標簽;最后,在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象。與現有技術相比,本實施例能夠提高垂直搜索引擎對具有模糊性、口語化特點的檢索請求的處理結果的準確率和召回率。
實施例二
參考圖3,為本實施例提供的一種垂直搜索引擎對檢索請求的處理方法交互圖。其中,所述垂直搜索引擎用于應用搜索領域,所述方法用于對應用搜索領域中的搜索請求進行處理。所述方法具體包括:
S301:客戶端向服務器發送檢索請求,所述檢索請求包括用戶輸入的檢索串。
其中,所述檢索串可以為用戶輸入的搜索關鍵字\詞,如“微信里的游戲”、“可以買東西的軟件”等,用于表明用戶想要搜索的應用。
S302:所述服務器判斷所述檢索串是否為模糊性檢索串,如果是,則執行S303。
具體的,判斷檢索串是否為模糊性檢索串的方法可以參照實施例一中的介紹進行理解,在此不再贅述。
S303:所述服務器提取所述模糊性檢索串中的檢索標簽。
S304:所述服務器在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象。
S305:所述服務器將查詢到的所述搜索對象返回至所述客戶端,并顯示給用戶。
實際應用中,可以將召回的搜索對象進行排序后顯示給用戶。具體的,根據檢索標簽與搜索對象的關聯度對召回的搜索對象進行排序。
另外,還可以將通過本實施例召回的搜索對象與通過傳統搜索召回的搜索對象進行混合排序,最終顯示給用戶。
本實施例提供的應用搜索領域中對檢索請求的處理方法,與現有技術比,能夠提高應用搜索領域中對具有模糊性、口語化特點的檢索請求的處理結果的準確率和召回率。
實施例三
參考圖4,為本實施例提供的一種垂直搜索引擎對檢索請求的處理裝置結構示意圖,所述裝置包括:
接收模塊401,用于接收來自客戶端的任一檢索請求,所述檢索請求包括檢索串;
判斷模塊402,用于判斷所述檢索串是否為模糊性檢索串;
提取模塊403,用于在確定所述檢索串為模糊性檢索串時,提取所述模糊性檢索串中的檢索標簽;
查詢模塊404,用于在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象。
一種實施方式中,參考圖5,為本實施例提供的一種判斷模塊402的結構示意圖,所述判斷模塊402,包括:
第一計算子模塊501,用于計算所述檢索串的熵;
第一判斷子模塊502,用于判斷所述檢索串的熵是否大于預設的熵閾值;
第一確定子模塊503,用于在所述檢索串的熵大于所述熵閾值時,確定所述檢索串為模糊性檢索串。
另一種實施方式中,參考圖6,為本實施例提供的另一種判斷模塊402的結構示意圖,所述判斷模塊402,包括:
第二判斷子模塊601,用于判斷所述檢索串中是否包括預設的模糊性關鍵 詞;
第二確定子模塊602,用于在確定所述檢索串中包括任一預設的模糊性關鍵詞時,確定所述檢索串為模糊性檢索串。
一種實施方式中,參考圖7,為本實施例提供的一種提取模塊403的結構示意圖,所述提取模塊403,包括:
第一劃分子模塊701,用于將所述模糊性檢索串劃分為若干檢索詞;
第三判斷子模塊702,用于判斷預設的檢索標簽中是否包括所述模糊性檢索串劃分出的任一檢索詞;
第一提取子模塊703,用于在所述第三判斷子模塊的結果為是時,提取所述檢索詞作為所述模糊性檢索串的檢索標簽。
另一種實施方式中,參考圖8,為本實施例提供的另一種提取模塊403的結構示意圖,所述提取模塊403,包括:
第二劃分子模塊801,用于將所述模糊性檢索串劃分為若干檢索詞;
第二計算子模塊802,用于計算各個檢索詞的權重;
第二提取子模塊803,用于提取權重最大的檢索詞作為所述模糊性檢索串的檢索標簽。
另外,為了更準確的完成對檢索請求的處理過程,所述裝置還可以包括:
第一建立模塊,用于根據用戶檢索日志,建立檢索標簽庫,所述檢索標簽庫中包括檢索標簽;
生成模塊,用于利用預設的模糊性檢索串生成模板,為所述檢索標簽庫中的各個檢索標簽生成對應的模糊性檢索串;
抓取模塊,用于在第三方網站上抓取各個模糊性檢索串對應的搜索對象;
去噪模塊,用于對所述搜索對象進行去噪處理,得到各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系;
第二建立模塊,用于根據所述各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系,建立并存儲所述檢索標簽庫中的各個檢索標簽與搜索對象的對應關系。
另外,所述裝置還可以包括:
確定模塊,用于根據在第三方網站上抓取的各個模糊性檢索串對應的搜索 對象的分布情況,確定所述檢索標簽與搜索對象的對應關系中,各個搜索標簽與其對應的搜索結果的關聯度。
本實施例提供的垂直搜索引擎對檢索請求的處理裝置中,接收來自客戶端的任一檢索請求,所述檢索請求包括檢索串;判斷所述檢索串是否為模糊性檢索串;當確定所述檢索串為模糊性檢索串時,提取所述模糊性檢索串中的檢索標簽;在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象。與現有技術相比,本實施例能夠提高垂直搜索引擎對具有模糊性、口語化特點的檢索請求的處理結果的準確率和召回率。
相應的,本發明實施例還提供一種服務器,參見圖9所示,可以包括:
處理器901、存儲器902、輸入裝置903和輸出裝置904。服務器中的處理器901的數量可以一個或多個,圖9中以一個處理器為例。在本發明的一些實施例中,處理器901、存儲器902、輸入裝置903和輸出裝置904可通過總線或其它方式連接,其中,圖9中以通過總線連接為例。
存儲器902可用于存儲軟件程序以及模塊,處理器901通過運行存儲在存儲器902的軟件程序以及模塊,從而執行服務器的各種功能應用以及數據處理。存儲器902可主要包括存儲程序區和存儲數據區,其中,存儲程序區可存儲操作系統、至少一個功能所需的應用程序等。此外,存儲器902可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態存儲器件。輸入裝置903可用于接收輸入的數字或字符信息,以及產生與服務器的用戶設置以及功能控制有關的鍵信號輸入。
具體在本實施例中,處理器901會按照如下的指令,將一個或一個以上的應用程序的進程對應的可執行文件加載到存儲器902中,并由處理器901來運行存儲在存儲器902中的應用程序,從而實現各種功能:
接收來自客戶端的任一檢索請求,所述檢索請求包括檢索串;
判斷所述檢索串是否為模糊性檢索串;
當確定所述檢索串為模糊性檢索串時,提取所述模糊性檢索串中的檢索標簽;
在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的 搜索對象。
優選地,所述判斷所述檢索串是否為模糊性檢索串,包括:
計算所述檢索串的熵;
判斷所述檢索串的熵是否大于預設的熵閾值;
當所述檢索串的熵大于所述熵閾值時,確定所述檢索串為模糊性檢索串。
優選地,所述判斷所述檢索串是否為模糊性檢索串,包括:
判斷所述檢索串中是否包括預設的模糊性關鍵詞;
當確定所述檢索串中包括任一預設的模糊性關鍵詞時,確定所述檢索串為模糊性檢索串。
優選地,所述提取所述模糊性檢索串中的檢索標簽,包括:
將所述模糊性檢索串劃分為若干檢索詞;
判斷預設的檢索標簽中是否包括所述模糊性檢索串劃分出的任一檢索詞,如果是,則提取所述檢索詞作為所述模糊性檢索串的檢索標簽。
優選地,所述提取所述模糊性檢索串中的檢索標簽,包括:
將所述模糊性檢索串劃分為若干檢索詞;
計算各個檢索詞的權重,并提取權重最大的檢索詞作為所述模糊性檢索串的檢索標簽。
優選地,所述在預設的檢索標簽與搜索對象的對應關系中,查詢與所述檢索標簽對應的搜索對象之前,還包括:
根據用戶檢索日志,建立檢索標簽庫,所述檢索標簽庫中包括檢索標簽;
利用預設的模糊性檢索串生成模板,為所述檢索標簽庫中的各個檢索標簽生成對應的模糊性檢索串;
在第三方網站上抓取各個模糊性檢索串對應的搜索對象,并對所述搜索對象進行去噪處理,得到各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系;
根據所述各個模糊性檢索串與經過去噪處理后的搜索對象的對應關系,建立并存儲所述檢索標簽庫中的各個檢索標簽與搜索對象的對應關系。
優選地,所述方法還包括:
根據在第三方網站上抓取的各個模糊性檢索串對應的搜索對象的分布情 況,確定所述檢索標簽與搜索對象的對應關系中,各個搜索標簽與其對應的搜索結果的關聯度。
對于裝置實施例而言,由于其基本對應于方法實施例,所以相關之處參見方法實施例的部分說明即可。以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性勞動的情況下,即可以理解并實施。
需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
以上對本發明實施例所提供的一種垂直搜索引擎對檢索請求的處理方法及裝置進行了詳細介紹,本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發明的方法及其核心思想;同時,對于本領域的一般技術人員,依據本發明的思想,在具體實施方式及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。