一種篩選推廣關鍵詞的方法和裝置的制造方法
【專利說明】一種篩選推廣關鍵詞的方法和裝置 【技術領域】
[0001] 本發明涉及計算機網絡技術,特別涉及一種篩選推廣關鍵詞的方法和裝置。 【【背景技術】】
[0002] 搜索引擎推廣因其見效快近年來被商家廣泛采用,尤其是電子商務類網站。由于 搜索引擎推廣是采用投放關鍵詞的推廣方式,使得用戶在搜索引擎上搜索該關鍵詞時,能 夠展現投放了該關鍵詞的商家的推廣信息。因此,對于商家而言,搜索引擎推廣中尤為重要 的環節就是關鍵詞的篩選。優質的關鍵詞既能夠增加商家網站發展所需要的流量,也能夠 滿足商家網站預期的投放要求。
[0003] 目前常用的推廣關鍵詞篩選方法主要是,提取關鍵詞在本網站或者其他網站的推 廣系統中的效果數據,例如流量、點擊數量、轉化率等等,根據運營經驗針對不同的效果數 據設置不同的閾值來篩選滿足條件的關鍵詞作為優質關鍵詞。這種方式雖然操作簡單,但 在確定篩選的閾值時需要依賴運營經驗,這種基于固定閾值的篩選方式規則性較強,并且 僅能夠基于關鍵詞在推廣系統中的已有效果進行篩選,該效果并不一定適用于搜索引擎推 廣,準確性不高。 【
【發明內容】
】
[0004] 有鑒于此,本發明提供了一種篩選推廣關鍵詞的方法和裝置,以便于提高搜索引 擎推廣中優質推廣關鍵詞篩選的準確性。
[0005] 具體技術方案如下:
[0006] 本發明提供了一種篩選推廣關鍵詞的方法,該方法包括:
[0007] 選取候選推廣關鍵詞;
[0008] 提取候選推廣關鍵詞的特征,所述特征包括:搜索引擎特征、非引入流量的效果特 征和文本特征中的至少一種;
[0009] 將各候選推廣關鍵詞的特征作為預先建立的關鍵詞篩選模型的輸入數據,根據所 述關鍵詞篩選模型的預測結果得到優質推廣關鍵詞。
[0010] 根據本發明一優選實施方式,所述選取候選推廣關鍵詞包括:
[0011] 利用商家網站的搜索關鍵詞和/或已投放于搜索引擎的推廣關鍵詞的擴展詞,選 取候選推廣關鍵詞。
[0012] 根據本發明一優選實施方式,所述特征還包括競價特征;
[0013] 其中,在最低競價和最高競價之間,按照預設的競價間隔分別構造候選推廣關鍵 詞的競價特征。
[0014] 根據本發明一優選實施方式,該方法還包括:確定優質推廣關鍵詞的建議出價,具 體包括:
[0015] 將關鍵詞篩選模型預測的優質推廣關鍵詞的競價特征進行合并,取其中的最大競 價作為該優質推廣關鍵詞的建議出價。
[0016] 根據本發明一優選實施方式,該方法還包括:對得到的優質推廣關鍵詞進行以下 過濾處理中的至少一種:
[0017] 將得到的優質推廣關鍵詞去除已投放于搜索引擎的推廣關鍵詞;
[0018] 根據商家網站的違禁詞黑名單和/或搜索引擎違禁詞黑名單,將得到的優質推廣 關鍵詞去除非法關鍵詞。
[0019] 根據本發明一優選實施方式,所述關鍵詞篩選模型的建立包括:
[0020] 利用已投放于搜索引擎的推廣關鍵詞數據作為訓練樣本;
[0021 ] 利用推廣關鍵詞數據確定各推廣關鍵詞的投資收益比,根據各推廣關鍵詞的投資 收益比對訓練樣本進行標注;
[0022] 提取訓練樣本中各推廣關鍵詞的特征,所述特征與提取的所述候選推廣關鍵詞的 特征一致;
[0023] 利用提取的特征和標注的訓練樣本訓練分類模型,得到所述關鍵詞篩選模型。
[0024] 根據本發明一優選實施方式,所述利用推廣關鍵詞數據確定各推廣關鍵詞的投資 收益比包括:
[0025] 將推廣關鍵詞通過搜索引擎引入商家網站的流量與商家為該推廣關鍵詞投入的 成本的比值作為該推廣關鍵詞的投資收益比;或者,
[0026] 將推廣關鍵詞通過搜索引擎引入商家的廣告收益與商家為該推廣關鍵詞投入的 成本的比值作為該推廣關鍵詞的投資收益比;或者,
[0027] 將推廣關鍵詞通過搜索引擎引入商家的成交量與商家為該推廣關鍵詞投入的成 本的比值作為該推廣關鍵詞的投資收益比。
[0028] 根據本發明一優選實施方式,所述根據各推廣關鍵詞的投資收益比對訓練樣本進 行標注包括:
[0029] 如果推廣關鍵詞的投資收益比大于或等于預設的第一閾值,則標注該推廣關鍵詞 為優質推廣關鍵詞;
[0030] 如果推廣關鍵詞的投資收益比小于預設的第二閾值,則標注該推廣關鍵詞為劣質 推廣關鍵詞;
[0031] 其中所述第一閾值大于或等于所述第二閾值。
[0032] 根據本發明一優選實施方式,如果所述第一閾值大于所述第二閾值,則所述根據 各推廣關鍵詞的投資收益比對訓練樣本進行標注還包括:
[0033] 如果推廣關鍵詞的投資收益比大于或等于所述第二閾值并且小于所述第一閾值, 則標注該推廣關鍵詞為中等推廣關鍵詞。
[0034] 根據本發明一優選實施方式,推廣關鍵詞的搜索引擎特征包括:推廣關鍵詞在搜 索引擎上的搜索量和/或熱度信息;
[0035] 推廣關鍵詞的非引入流量的效果特征包括:推廣關鍵詞在商家網站上的搜索量、 瀏覽量、點擊量和成交量中的至少一種;
[0036] 推廣關鍵詞的文本特征包括:推廣關鍵詞的單詞特征、語義特征和行業特征中的 至少一種;
[0037] 其中所述單詞特征包括推廣關鍵詞所包含的最小切詞單元、最小切詞單元的數量 和字符長度中的至少一種;
[0038] 所述語義特征包括推廣關鍵詞所包含的中心詞、產品詞和品牌詞中的至少一種;
[0039] 所述行業特征指推廣關鍵詞所屬的行業類目。
[0040] 本發明還提供了一種篩選推廣關鍵詞的裝置,該裝置包括:
[0041] 關鍵詞選取單元,用于選取候選推廣關鍵詞;
[0042] 特征提取單元,用于提取所述候選推廣關鍵詞的特征,所述特征包括:搜索引擎特 征、非引入流量的效果特征和文本特征中的至少一種;
[0043] 關鍵詞篩選單元,用于將各候選推廣關鍵詞的特征作為預先建立的關鍵詞篩選模 型的輸入數據,根據所述關鍵詞篩選模型的預測結果得到優質推廣關鍵詞。
[0044] 根據本發明一優選實施方式,所述關鍵詞選取單元,具體用于利用商家網站的搜 索關鍵詞和/或已投放于搜索引擎的推廣關鍵詞的擴展詞,選取候選推廣關鍵詞。
[0045] 根據本發明一優選實施方式,所述特征還包括競價特征;
[0046] 所述特征提取單元,還用于在最低競價和最高競價之間,按照預設的競價間隔分 別構造候選推廣關鍵詞的競價特征。
[0047] 根據本發明一優選實施方式,該裝置還包括:出價建議單元,用于確定優質推廣關 鍵詞的建議出價,具體包括:將關鍵詞篩選模型預測的優質推廣關鍵詞的競價特征進行合 并,取其中的最大競價作為該優質推廣關鍵詞的建議出價。
[0048] 根據本發明一優選實施方式,該裝置還包括:關鍵詞過濾單元,用于將所述關鍵詞 篩選單元得到的優質推廣關鍵詞進行以下過濾處理中的至少一種:
[0049] 將得到的優質推廣關鍵詞去除已投放于搜索引擎的推廣關鍵詞;
[0050] 根據商家網站的違禁詞黑名單和/或搜索引擎違禁詞黑名單,將得到的優質推廣 關鍵詞去除非法關鍵詞。
[0051] 根據本發明一優選實施方式,該裝置還包括:篩選模型建立單元;
[0052] 所述篩選模型建立單元具體包括:
[0053] 樣本確定子單元,用于利用已投放于搜索引擎的推廣關鍵詞數據作為訓練樣本;
[0054] 樣本標注子單元,用于利用推廣關鍵詞數據確定各推廣關鍵詞的投資收益比,根 據各推廣關鍵詞的投資收益比對訓練樣本進行標注;
[0055] 特征提取子單元,用于提取訓練樣本中各推廣關鍵詞的特征,所述特征與提取的 所述候選推廣關鍵詞的特征一致;
[0056] 模型訓練子單元,用于利用提取的特征和標注的訓練樣本訓練分類模型,得到所 述關鍵詞篩選模型。
[0057] 根據本發明一優選實施方式,所述樣本標注子單元采用以下方式確定各推廣關鍵 詞的投資收益比:
[0058] 將推廣關鍵詞通過搜索引擎引入商家網站的流量與商家為該推廣關鍵詞投入的 成本的比值作為該推廣關鍵詞的投資收益比;或者,
[0059] 將推廣關鍵詞通過搜索引擎引入商家的廣告收益與商家為該推廣關鍵詞投入的 成本的比值作為該推廣關鍵詞的投資收益比;或者,
[0060] 將推廣關鍵詞通過搜索引擎引入商家的成交量與商家為該推廣關鍵詞投入的成 本的比值作為該推廣關鍵詞的投資收益比。
[0061] 根據本發明一優選實施方式,所述樣本標注子單元采用以下方式對訓練樣本進行 標注:
[0062] 如果推廣關鍵詞的投資收益比大于或等于預設的第一閾值,則標注該推廣關鍵詞 為優質推廣關鍵詞;
[0063] 如果推廣關鍵詞的投資收益比小于預設的第二閾值,則標注該推廣關鍵詞為劣質 推廣關鍵詞;
[0064] 其中所述第一閾值大于或等于所述第二閾值。
[0065] 根據本發明一優選實施方式,如果所述第一閾值大于所述第二閾值,則所述樣本 標注子單元進一步對訓練樣本進行以下標注:
[0066] 如果推廣關鍵詞的投資收益比大