從查詢詞中提取中心詞的方法和裝置的制造方法
【技術領域】
[0001] 本發明設及計算機技術領域,具體而言,設及一種從查詢詞中提取中屯、詞的方法 和裝置。
【背景技術】
[0002] 查詢詞推薦是根據用戶當前進行捜索的查詢詞,通過機器學習算法,提取查詢詞 的中屯、詞,并W此為用戶推薦其最可能感興趣的其他查詢詞。
[0003] 目前,提取中屯、詞的方式主要是通過人工標注的方式提取中屯、詞:人工標注中屯、 詞只能適用于非常少量的查詢詞,當查詢詞數目巨大的時候人工標注顯然是不可行的,而 且人工標注提取中屯、詞不能自動化,所W具有W下不足之處:(1)需要較多的人力、時間、費 時費力;(2)每個人的評價標準不一樣,導致標注的中屯、詞有偏差;(3)無法自動化提取查詢 詞的中屯、詞;(4)不適用于大量查詢詞的中屯、詞提取。
【發明內容】
[0004] 鑒于上述問題,提出了本發明W便提供一種克服上述問題或者至少部分地解決上 述問題的從查詢詞中提取中屯、詞的方法和裝置。
[0005] 依據本發明的一種從查詢詞中提取中屯、詞的方法,包括:獲取用戶輸入的第一查 詢詞;基于已知的多個查詢詞W及所述多個查詢詞的中屯、詞訓練得到的模型,從所述第一 查詢詞中提取所述第一查詢詞的中屯、詞。
[0006] 可選地,前述的方法,基于已知的多個查詢詞W及所述多個查詢詞的中屯、詞訓練 得到的模型,從所述第一查詢詞中提取所述第一查詢詞的中屯、詞,具體包括:基于所述多個 查詢詞的特征屬性W及所述多個查詢詞的中屯、詞訓練得到的所述模型,對所述第一查詢詞 的特征屬性進行分析得到所述第一查詢詞的中屯、詞。
[0007] 可選地,前述的方法,還包括:從預設的點擊記錄中,獲取所述用戶點擊的同一地 址對應的多個第二查詢詞;所述點擊記錄用于記錄所述用戶已輸入的查詢詞W及已點擊的 地址;對所述多個第二查詢詞分詞得到多個詞;根據所述多個詞的指定屬性從所述多個詞 中選擇一個詞,將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中屯、詞;選出 中屯、詞的第二查詢詞用于訓練所述模型。
[000引可選地,前述的方法,所述指定屬性為所述多個詞在所述多個第二查詢詞中的詞 頻;根據所述多個詞的指定屬性從所述多個詞中選擇一個詞,具體包括:選擇所述多個詞中 詞頻最局的詞。
[0009] 可選地,前述的方法,將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞 的中屯、詞,具體包括:將所述所選詞作為所述多個第二查詢詞中對應的頁面瀏覽量最高的 第二查詢詞的中屯、詞。
[0010] 可選地,前述的方法,在將所選詞作為所述多個第二查詢詞中至少一個第二查詢 詞的中屯、詞之前,還包括:判斷所述所選詞是否包含在所述至少一個第二查詢詞中,在判斷 結果為是時,執行將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中屯、詞。
[0011] 可選地,前述的方法,在將所選詞作為所述多個第二查詢詞中至少一個第二查詢 詞的中屯、詞之前,還包括:判斷所述所選詞與所述至少一個第二查詢詞的長度差是否位于 預設區間,在判斷結果為是時,執行將所選詞作為所述多個第二查詢詞中至少一個第二查 詢詞的中屯、詞。
[0012] 依據本發明的一種從查詢詞中提取中屯、詞的裝置,包括:查詢詞獲取模塊,用于獲 取用戶輸入的第一查詢詞;中屯、詞提取模塊,用于基于已知的多個查詢詞W及所述多個查 詢詞的中屯、詞訓練得到的模型,從所述第一查詢詞中提取所述第一查詢詞的中屯、詞。
[0013] 可選地,前述的裝置,所述中屯、詞提取模炔基于所述多個查詢詞的特征屬性W及 所述多個查詢詞的中屯、詞訓練得到的所述模型,對所述第一查詢詞的特征屬性進行分析得 到所述第一查詢詞的中屯、詞。
[0014] 可選地,前述的裝置,還包括:記錄獲取模塊,用于從預設的點擊記錄中,獲取所述 用戶點擊的同一地址對應的多個第二查詢詞;所述點擊記錄用于記錄所述用戶已輸入的查 詢詞W及已點擊的地址;分詞模塊,用于對所述多個第二查詢詞分詞得到多個詞;中屯、詞選 擇模塊,用于根據所述多個詞的指定屬性從所述多個詞中選擇一個詞,將所選詞作為所述 多個第二查詢詞中至少一個第二查詢詞的中屯、詞;選出中屯、詞的第二查詢詞用于訓練所述 模型。
[0015] 可選地,前述的裝置,所述中屯、詞選擇模塊選擇所述多個詞中詞頻最高的詞。
[0016] 可選地,前述的裝置,所述中屯、詞選擇模塊將所述所選詞作為所述多個第二查詢 詞中對應的頁面瀏覽量最高的第二查詢詞的中屯、詞。
[0017] 可選地,前述的裝置,還包括:第一判斷模塊,用于判斷所述所選詞是否包含在所 述至少一個第二查詢詞中,所述中屯、詞選擇模塊在判斷結果為是時將所選詞作為所述多個 第二查詢詞中至少一個第二查詢詞的中屯、詞。
[0018] 可選地,前述的裝置,還包括:第二判斷模塊,用于判斷所述所選詞與所述至少一 個第二查詢詞的長度差是否位于預設區間,所述中屯、詞選擇模塊在判斷結果為是時將所選 詞作為所述多個第二查詢詞中至少一個第二查詢詞的中屯、詞。
[0019] 根據W上技術方案,本發明的從查詢詞中提取中屯、詞的方法和裝置至少具有W下 優點:
[0020] 在本發明的技術方案中,通過對已知查詢詞W及已知查詢詞的中屯、詞進行訓練, 能夠得到用于提取查詢詞中屯、詞的模型,利用該模型可W自動進行對查詢詞的中屯、詞提 取,提取速度、準確率都非常高,有利于后續的基于中屯、詞推薦查詢詞的快速進行。
[0021] 上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段, 而可依照說明書的內容予W實施,并且為了讓本發明的上述和其它目的、特征和優點能夠 更明顯易懂,W下特舉本發明的【具體實施方式】。
【附圖說明】
[0022] 通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通 技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本發明 的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0023] 圖1示出了根據本發明的一個實施例的從查詢詞中提取中屯、詞的方法的流程圖;
[0024] 圖2示出了根據本發明的一個實施例的從查詢詞中提取中屯、詞的方法的流程圖;
[0025] 圖3示出了根據本發明的一個實施例的從查詢詞中提取中屯、詞的裝置的框圖;
[0026] 圖4示出了根據本發明的一個實施例的從查詢詞中提取中屯、詞的裝置的框圖。
【具體實施方式】
[0027] 下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開 的示例性實施例,然而應當理解,可各種形式實現本公開而不應被運里闡述的實施例 所限制。相反,提供運些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍 完整的傳達給本領域的技術人員。
[00%]如圖1所示,本發明的一個實施例中提供了一種從查詢詞中提取中屯、詞的方法,包 括:
[0029] 步驟110,獲取用戶輸入的第一查詢詞。
[0030] 步驟120,基于已知的多個查詢詞W及多個查詢詞的中屯、詞訓練得到的模型,從第 一查詢詞中提取第一查詢詞的中屯、詞。根據本實施例的技術方案,通過對已知查詢詞W及 已知查詢詞的中屯、詞進行訓練,能夠得到用于提取查詢詞中屯、詞的模型,利用該模型可W 自動進行對查詢詞的中屯、詞提取,提取速度、準確率都非常高,有利于后續的基于中屯、詞推 薦查詢詞的快速進行。
[0031] 本發明的另一個實施例中提供了一種從查詢詞中提取中屯、詞的方法,相比于前述 的實施例,本實施例的從查詢詞中提取中屯、詞的方法,步驟120,具體包括:
[0032] 基于多個查詢詞的特征屬性W及多個查詢詞的中屯、詞訓練得到的模型,對第一查 詢詞的特征屬性進行分析得到第一查詢詞的中屯、詞。在本實施例中,對特征屬性的種類不 進行限制,其具體包括但不限于下表所示,例如,可W用2393維向量表示每個詞,通過離線 訓練得到的模型來提取查詢詞的中屯、詞,W此為用戶推薦新的查詢詞。
[0033]
[0034] 如圖2所示,本發明的另一個實施例中提供了一種從查詢詞中提取中屯、詞的方法, 相比于前述的實施例,本實施例的從查詢詞中提取中屯、詞的方