基于用戶行為反饋的關(guān)鍵詞推薦方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種基于用戶行為反饋的關(guān)鍵詞推薦方法和系統(tǒng),屬于電子商務(wù)技術(shù)領(lǐng)域。該方法包括步驟獲取用戶搜索的關(guān)鍵詞并對(duì)所述關(guān)鍵詞進(jìn)行預(yù)處理;記錄針對(duì)所述關(guān)鍵詞搜索結(jié)果的用戶行為;解析所述用戶行為頁面的標(biāo)簽,為所述關(guān)鍵詞添加標(biāo)簽;為具有相同標(biāo)簽的關(guān)鍵詞分類,在后續(xù)搜索中按照分類推薦備選關(guān)鍵詞。本發(fā)明的技術(shù)方案通過記錄并解析用戶行為,為關(guān)鍵詞添加適當(dāng)?shù)臉?biāo)簽來擴(kuò)展單一關(guān)鍵詞的搜索范圍,由于充分利用了用戶行為進(jìn)行反饋,可以及時(shí)適應(yīng)關(guān)鍵詞的衍生含義,準(zhǔn)確把握搜索熱點(diǎn),此外還降低了人工維護(hù)更新詞庫的成本。
【專利說明】
基于用戶行為反饋的關(guān)鍵詞推薦方法和系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及電子商務(wù)搜索引擎技術(shù)領(lǐng)域,特別涉及一種基于用戶行為反饋的關(guān)鍵 詞推薦方法和系統(tǒng)。
【背景技術(shù)】
[0002] 現(xiàn)有技術(shù)中,網(wǎng)絡(luò)搜索的擴(kuò)展多從語義分析處理方面進(jìn)行優(yōu)化,目前很多網(wǎng)站在 關(guān)于相關(guān)搜索詞計(jì)算方面主要考慮詞和詞之間的支持度。現(xiàn)有方案雖然可W盡量獲得更多 的相關(guān)搜索結(jié)果,但單純的語義擴(kuò)展只考慮了即成的文字聯(lián)系,會(huì)導(dǎo)致推薦出來的搜索詞 過于死板,缺乏對(duì)新產(chǎn)品和新概念的實(shí)時(shí)理解,很難適應(yīng)快速變化的流行趨勢(shì)和網(wǎng)絡(luò)熱點(diǎn); 如果依賴人工對(duì)擴(kuò)展詞進(jìn)行定期維護(hù)的話又會(huì)增加成本。
【發(fā)明內(nèi)容】
[0003] 針對(duì)現(xiàn)有技術(shù)的上述缺陷,本發(fā)明所要解決的技術(shù)問題是如何動(dòng)態(tài)擴(kuò)展關(guān)鍵詞的 搜索范圍。
[0004] 為實(shí)現(xiàn)上述目的,一方面,本發(fā)明提供一種基于用戶行為反饋的關(guān)鍵詞推薦方法, 該方法包括步驟:
[0005] 獲取用戶搜索的關(guān)鍵詞并對(duì)所述關(guān)鍵詞進(jìn)行預(yù)處理;
[0006] 記錄針對(duì)所述關(guān)鍵詞搜索結(jié)果的用戶行為;
[0007] 解析所述用戶行為頁面的標(biāo)簽,為所述關(guān)鍵詞添加標(biāo)簽;
[0008] 為具有相同標(biāo)簽的關(guān)鍵詞分類,在后續(xù)搜索中按照分類推薦備選關(guān)鍵詞。
[0009] 優(yōu)選地,所述方法中,將頁面搜索信息表中的關(guān)鍵詞獲取為所述用戶搜索的關(guān)鍵 詞。
[0010] 優(yōu)選地,所述預(yù)處理包括詞語規(guī)整、去除特殊字符、字符統(tǒng)一轉(zhuǎn)換、拼寫糾正、截 取、拼音轉(zhuǎn)漢字、中英文互換中的至少一種處理。
[0011] 優(yōu)選地,為所述關(guān)鍵詞添加標(biāo)簽還包括步驟:
[0012] 根據(jù)關(guān)鍵詞的標(biāo)簽按照預(yù)定的規(guī)則進(jìn)行合并組成W修正關(guān)鍵詞。
[0013] 優(yōu)選地,所述按照分類推薦備選關(guān)鍵詞還包括:
[0014] 若同一分類中有多個(gè)備選關(guān)鍵詞,將其全部推薦給用戶、或?qū)溥x關(guān)鍵詞按排序 后的順序優(yōu)選推薦。
[0015] 另一方面,本發(fā)明還提供一種基于用戶行為反饋的關(guān)鍵詞推薦系統(tǒng),包括:
[0016] 預(yù)處理模塊,用于獲取用戶搜索的關(guān)鍵詞并對(duì)所述關(guān)鍵詞進(jìn)行預(yù)處理;
[0017] 行為記錄模塊,用于記錄針對(duì)所述關(guān)鍵詞搜索結(jié)果的用戶行為;
[0018] 解析模塊,用于解析所述用戶行為頁面的標(biāo)簽,為所述關(guān)鍵詞添加標(biāo)簽;
[0019] 分類推薦模塊,用于為具有相同標(biāo)簽的關(guān)鍵詞分類,在后續(xù)搜索中按照分類推薦 備選關(guān)鍵詞。
[0020] 優(yōu)選地,所述預(yù)處理模塊中還包括:獲取模塊,用于將頁面搜索信息表中的關(guān)鍵詞 獲取為所述用戶搜索的關(guān)鍵詞。
[0021] 優(yōu)選地,所述預(yù)處理包括詞語規(guī)整、去除特殊字符、字符統(tǒng)一轉(zhuǎn)換、拼寫糾正、截 取、拼音轉(zhuǎn)漢字、中英文互換中的至少一種處理。
[0022] 優(yōu)選地,所述解析模塊還包括:關(guān)鍵詞修正模塊,用于根據(jù)關(guān)鍵詞的標(biāo)簽按照預(yù)定 的規(guī)則進(jìn)行合并組成W修正關(guān)鍵詞。
[0023] 優(yōu)選地,所述分類推薦模塊中還包括:備選詞篩選模塊,用于在同一分類中有多個(gè) 備選關(guān)鍵詞時(shí),將全部備選關(guān)鍵詞推薦給用戶、或?qū)溥x關(guān)鍵詞按排序后的順序優(yōu)選推薦。
[0024] 本發(fā)明的技術(shù)方案通過記錄并解析用戶行為,為關(guān)鍵詞添加適當(dāng)?shù)臉?biāo)簽來擴(kuò)展單 一關(guān)鍵詞的搜索范圍,由于充分利用了用戶行為進(jìn)行反饋,可W及時(shí)適應(yīng)關(guān)鍵詞的衍生含 義,準(zhǔn)確把握搜索熱點(diǎn),此外還降低了人工維護(hù)更新詞庫的成本。
【附圖說明】
[00巧]圖1是本發(fā)明一個(gè)實(shí)施例中的基于用戶行為反饋的關(guān)鍵詞推薦方法的流程示意 圖;
[0026] 圖2是本發(fā)明另一個(gè)實(shí)施例中的基于用戶行為反饋的關(guān)鍵詞推薦系統(tǒng)的結(jié)構(gòu)示 意圖。
【具體實(shí)施方式】
[0027] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述。顯然,所描述的實(shí)施例為實(shí)施本發(fā)明的較佳實(shí)施方式,所述描述是W說明本發(fā)明 的一般原則為目的,并非用W限定本發(fā)明的范圍。本發(fā)明的保護(hù)范圍應(yīng)當(dāng)W權(quán)利要求所界 定者為準(zhǔn),基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)的前提下 所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0028] 現(xiàn)有的語義擴(kuò)展僅考慮了詞義之間的聯(lián)系,為進(jìn)一步體現(xiàn)搜索詞實(shí)際代表的含 義,本發(fā)明中利用用戶行為進(jìn)行反饋,為搜索詞或搜索詞的組合添加對(duì)應(yīng)標(biāo)簽,從而準(zhǔn)確識(shí) 別搜索詞所表達(dá)的隱藏含義,為后續(xù)搜索推薦滿足用戶需求的結(jié)果。其中,圖1是本發(fā)明一 個(gè)實(shí)施例中的基于用戶行為反饋的關(guān)鍵詞推薦方法的流程示意圖,如圖1所示,該方法包 括步驟:
[0029] S1、獲取用戶搜索的關(guān)鍵詞并對(duì)所述關(guān)鍵詞進(jìn)行預(yù)處理;
[0030] S2、記錄針對(duì)所述關(guān)鍵詞搜索結(jié)果的用戶行為;
[0031] S3、解析所述用戶行為頁面的標(biāo)簽,為所述關(guān)鍵詞添加標(biāo)簽;
[0032] S4、為具有相同標(biāo)簽的關(guān)鍵詞分類,在后續(xù)搜索中按照分類推薦備選關(guān)鍵詞。
[0033] 其中,獲取用戶搜索的關(guān)鍵詞一般是將頁面搜索信息表中的關(guān)鍵詞作為搜索關(guān)鍵 詞。
[0034] 對(duì)關(guān)鍵詞進(jìn)行的預(yù)處理包括但不限于詞語規(guī)整、去除特殊字符、字符統(tǒng)一轉(zhuǎn)換、拼 寫糾正、截取、拼音轉(zhuǎn)漢字、中英文互換等;W下僅作為示例說明常用的預(yù)處理形式,不應(yīng)視 作對(duì)本發(fā)明的具體限制:
[0035] (1)去掉僅由符號(hào)、數(shù)字、字母Η者組成的關(guān)鍵詞記錄;
[0036] 似去掉僅由符號(hào)組成的關(guān)鍵詞記錄;
[0037] (3)去掉僅由空格或回車符組成的關(guān)鍵詞記錄;
[0038] (4)去掉關(guān)鍵詞首尾的空格,關(guān)鍵詞內(nèi)部空格保留一個(gè);
[0039] (5)關(guān)鍵詞中的全角字符均轉(zhuǎn)換為半角字符;
[0040] (6)對(duì)于關(guān)鍵詞首末含$%'&*()'~! + = {}':〇??!? § ;,,\\[\\].<〉/?~! @(_)八 ¥% ……&*〇 --+1 {}【】';;""'。,、? ' "Θ 0 J ^-1--L ' □ ' * δ #$--_及回車符等特殊字符的,去掉送些特殊字符;
[0041] (7)關(guān)鍵詞中的小寫字母統(tǒng)一用大寫字母代替;
[0042] (8)僅保留關(guān)鍵詞長(zhǎng)度為2-20個(gè)字符的關(guān)鍵詞;
[0043] (9)將漢語拼音轉(zhuǎn)化為漢字;如關(guān)鍵詞"shouji"轉(zhuǎn)化為"手機(jī)";"sanxing"轉(zhuǎn)換 為"H星"。
[0044] 用戶行為主要指用戶對(duì)搜索結(jié)果頁面的訪問行為,包括鼠標(biāo)停留查看、點(diǎn)擊鏈接 W及對(duì)鏈接頁面中元素的進(jìn)一步操作等動(dòng)作。根據(jù)用戶對(duì)關(guān)鍵詞搜索結(jié)果的具體訪問行 為,解析行為對(duì)應(yīng)的頁面元素屬性W提取為該關(guān)鍵詞的標(biāo)簽。
[0045] 優(yōu)選地,本發(fā)明W電商搜索為例,搜索結(jié)果包括多個(gè)商品,用戶行為包括查看摘要 圖、調(diào)整數(shù)量、加入購(gòu)物車、直接購(gòu)買、篩選、對(duì)比、點(diǎn)擊鏈接、和/或?qū)︽溄禹撁嬷械倪M(jìn)一步 操作。在該優(yōu)選實(shí)施例中,行為對(duì)應(yīng)的頁面元素屬性主要指商品屬性,根據(jù)用戶行為操作的 對(duì)象在頁面中找到商品名、目錄(分類或品類)、品牌、廠商及型號(hào)等屬性信息作為標(biāo)簽。上 述標(biāo)簽既可W是系統(tǒng)本身為商品頁面添加的分類標(biāo)簽,也可W是提取頁面信息后自動(dòng)挖掘 歸類的標(biāo)簽。
[0046] 具體地,為關(guān)鍵詞添加標(biāo)簽包括打上或更新標(biāo)簽等不同處理。根據(jù)關(guān)鍵詞本身與 解析得到的詞類別、相似商品目錄、相似品牌和相似型號(hào)/廠商能否匹配,找出關(guān)鍵詞自身 的商品目錄、品牌和型號(hào)/廠商屬性值,同時(shí)判斷關(guān)鍵詞自身的商品目錄、品牌和型號(hào)/廠 商屬性值是否為空,若為空則為關(guān)鍵詞打上得到的標(biāo)簽,若不為空則對(duì)關(guān)鍵詞標(biāo)簽進(jìn)行更 新。詞標(biāo)簽格式一般為調(diào)類別_品牌_型號(hào)_商品目錄;標(biāo)簽添加規(guī)則;W詞類別開頭, 對(duì)品牌、型號(hào)/廠商、商品目錄進(jìn)行組合,詞類別_品牌_廠商_商品目錄,"連接構(gòu)成 詞標(biāo)簽。
[0047] 比如,詞標(biāo)簽主要包含:
[0048]
[0049]
[0050] 在本發(fā)明的優(yōu)選實(shí)施例中,還將關(guān)鍵詞的標(biāo)簽,比如品牌、型號(hào)、商品目錄等屬性 按照一定的規(guī)則進(jìn)行合并組成W修正關(guān)鍵詞。修正后的關(guān)鍵詞由品牌、型號(hào)、商品目錄等屬 性按順序合并構(gòu)成。當(dāng)關(guān)鍵詞的品牌、型號(hào)和商品目錄都存在的情況下,修正后關(guān)鍵詞的構(gòu) 成依次為品牌、商品目錄和型號(hào)。其他情況下,修正后的關(guān)鍵詞按照品牌、型號(hào)、商品目錄的 順序進(jìn)行重組。如,關(guān)鍵詞"手機(jī)Η星"應(yīng)調(diào)整為"H星手機(jī)";"手機(jī)N0TE3"調(diào)整為"NOTES 手機(jī)"。
[0051] 隨后,將具有相同標(biāo)簽的關(guān)鍵詞進(jìn)行分類,W便在后續(xù)搜索時(shí),在一定的推薦規(guī)則 下,優(yōu)先推薦同一類的關(guān)鍵詞。
[0052] W下是本發(fā)明的一個(gè)優(yōu)選實(shí)施例中用戶分別W "H星"和"海爾手機(jī)"為關(guān)鍵詞進(jìn) 行搜索時(shí)的反饋和推薦過程,示例的詳細(xì)流程為:
[005引用"立星"進(jìn)行搜索;
[0054] 用戶點(diǎn)擊了搜索結(jié)果中的部分頁面,其中一個(gè)頁面包含"……Η星……手機(jī)…… 優(yōu)惠……",標(biāo)簽解析模塊解析后,系統(tǒng)為關(guān)鍵詞"Η星"打上標(biāo)簽"品牌+類型";另一個(gè)頁 面中包含"……Η星手機(jī)Note2……",標(biāo)簽解析模塊解析后,系統(tǒng)為關(guān)鍵詞"H星"打上標(biāo) 簽"品牌+類型+型號(hào)";將關(guān)鍵詞"H星"及相應(yīng)標(biāo)簽保存于數(shù)據(jù)庫中;
[00巧]用"海爾手機(jī)"進(jìn)行搜索;
[0056] 用戶點(diǎn)擊了搜索結(jié)果中的部分頁面,其中一個(gè)頁面包含"……海爾……手機(jī)……0 元購(gòu)機(jī)……",標(biāo)簽解析模塊解析后,系統(tǒng)為關(guān)鍵詞"海爾手機(jī)"打上標(biāo)簽"品牌+類型";另 一個(gè)頁面中包含"……海爾手機(jī)5220……",標(biāo)簽解析模塊解析后,系統(tǒng)為關(guān)鍵詞"海爾手 機(jī)"打上標(biāo)簽"品牌+類型+型號(hào)";將關(guān)鍵詞"海爾手機(jī)"及相應(yīng)標(biāo)簽保存于數(shù)據(jù)庫中;
[0057] 系統(tǒng)對(duì)"H星"的標(biāo)簽和"海爾手機(jī)"的標(biāo)簽進(jìn)行比對(duì),發(fā)現(xiàn)關(guān)鍵詞"H星"和"海 爾手機(jī)"的標(biāo)簽完全一致;將兩關(guān)鍵詞分為一類;
[0058] 在下一次搜索"海爾手機(jī)"時(shí),系統(tǒng)將優(yōu)先推薦"H星"作為備選關(guān)鍵詞。
[0059] 優(yōu)選地,若同一類中有多個(gè)備選關(guān)鍵詞,可全部推薦給用戶或?qū)溥x關(guān)鍵詞按排 序后的順序優(yōu)選推薦。排序可基于各種預(yù)定或自選規(guī)則進(jìn)行,比如關(guān)鍵詞間的潛在相關(guān)度, 或按照關(guān)鍵詞的搜索次數(shù)、點(diǎn)擊量,或按關(guān)鍵詞相關(guān)商品的關(guān)注度、銷量、好評(píng)度等等信息 單獨(dú)或綜合排序。
[0060] 本領(lǐng)域相關(guān)技術(shù)人員應(yīng)能理解,與本發(fā)明的方法相對(duì)應(yīng)的,本發(fā)明還同時(shí)包括一 種基于用戶行為反饋的關(guān)鍵詞推薦系統(tǒng),與上述方法步驟一一對(duì)應(yīng),如圖2所示,該系統(tǒng)包 括:
[0061] 預(yù)處理模塊201,用于獲取用戶搜索的關(guān)鍵詞并對(duì)所述關(guān)鍵詞進(jìn)行預(yù)處理;
[0062] 行為記錄模塊202,用于記錄針對(duì)所述關(guān)鍵詞搜索結(jié)果的用戶行為;
[0063] 解析模塊203,用于解析所述用戶行為頁面的標(biāo)簽,為所述關(guān)鍵詞添加標(biāo)簽;
[0064] 分類推薦模塊204,用于為具有相同標(biāo)簽的關(guān)鍵詞分類,在后續(xù)搜索中按照分類推 薦備選關(guān)鍵詞。
[0065] 相應(yīng)地,上述方法實(shí)施例中的各具體步驟在系統(tǒng)中同樣存在對(duì)應(yīng)的處理模塊,各 模塊主要基于執(zhí)行的步驟和/或?qū)崿F(xiàn)的功能進(jìn)行劃分,在此不再一一賞述。
[0066] 本發(fā)明的技術(shù)方案通過記錄并解析用戶行為,為關(guān)鍵詞添加適當(dāng)?shù)臉?biāo)簽來擴(kuò)展單 一關(guān)鍵詞的搜索范圍,由于充分利用了用戶行為進(jìn)行反饋,可W及時(shí)適應(yīng)關(guān)鍵詞的衍生含 義,準(zhǔn)確把握搜索熱點(diǎn),此外還降低了人工維護(hù)更新詞庫的成本。
[0067] 可W理解的是,W上實(shí)施方式僅僅是為了說明本發(fā)明的原理而采用的示例性實(shí)施 方式,然而本發(fā)明并不局限于此。對(duì)于本領(lǐng)域內(nèi)的普通技術(shù)人員而言,在不脫離本發(fā)明的精 神和實(shí)質(zhì)的情況下,可W做出各種變型和改進(jìn),送些變型和改進(jìn)也視為本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1. 一種基于用戶行為反饋的關(guān)鍵詞推薦方法,其特征在于,所述方法包括步驟: 獲取用戶搜索的關(guān)鍵詞并對(duì)所述關(guān)鍵詞進(jìn)行預(yù)處理; 記錄針對(duì)所述關(guān)鍵詞搜索結(jié)果的用戶行為; 解析所述用戶行為頁面的標(biāo)簽,為所述關(guān)鍵詞添加標(biāo)簽; 為具有相同標(biāo)簽的關(guān)鍵詞分類,在后續(xù)搜索中按照分類推薦備選關(guān)鍵詞。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,將頁面搜索信息表中的關(guān)鍵詞獲取為所 述用戶搜索的關(guān)鍵詞。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)處理包括詞語規(guī)整、去除特殊字 符、字符統(tǒng)一轉(zhuǎn)換、拼寫糾正、截取、拼音轉(zhuǎn)漢字、中英文互換中的至少一種處理。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,為所述關(guān)鍵詞添加標(biāo)簽還包括步驟: 根據(jù)關(guān)鍵詞的標(biāo)簽按照預(yù)定的規(guī)則進(jìn)行合并組成以修正關(guān)鍵詞。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照分類推薦備選關(guān)鍵詞還包括: 若同一分類中有多個(gè)備選關(guān)鍵詞,將其全部推薦給用戶、或?qū)溥x關(guān)鍵詞按排序后的 順序優(yōu)選推薦。6. -種基于用戶行為反饋的關(guān)鍵詞推薦系統(tǒng),其特征在于,所述系統(tǒng)包括: 預(yù)處理模塊,用于獲取用戶搜索的關(guān)鍵詞并對(duì)所述關(guān)鍵詞進(jìn)行預(yù)處理; 行為記錄模塊,用于記錄針對(duì)所述關(guān)鍵詞搜索結(jié)果的用戶行為; 解析模塊,用于解析所述用戶行為頁面的標(biāo)簽,為所述關(guān)鍵詞添加標(biāo)簽; 分類推薦模塊,用于為具有相同標(biāo)簽的關(guān)鍵詞分類,在后續(xù)搜索中按照分類推薦備選 關(guān)鍵詞。7. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述預(yù)處理模塊中還包括:獲取模塊,用 于將頁面搜索信息表中的關(guān)鍵詞獲取為所述用戶搜索的關(guān)鍵詞。8. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述預(yù)處理包括詞語規(guī)整、去除特殊字 符、字符統(tǒng)一轉(zhuǎn)換、拼寫糾正、截取、拼音轉(zhuǎn)漢字、中英文互換中的至少一種處理。9. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述解析模塊還包括:關(guān)鍵詞修正模塊, 用于根據(jù)關(guān)鍵詞的標(biāo)簽按照預(yù)定的規(guī)則進(jìn)行合并組成以修正關(guān)鍵詞。10. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述分類推薦模塊中還包括:備選詞篩 選模塊,用于在同一分類中有多個(gè)備選關(guān)鍵詞時(shí),將全部備選關(guān)鍵詞推薦給用戶、或?qū)溥x 關(guān)鍵詞按排序后的順序優(yōu)選推薦。
【文檔編號(hào)】G06F17/30GK105824833SQ201510005745
【公開日】2016年8月3日
【申請(qǐng)日】2015年1月7日
【發(fā)明人】沈海旺, 張偵, 曾敏銳
【申請(qǐng)人】蘇寧云商集團(tuán)股份有限公司