一種基于階段的動(dòng)態(tài)產(chǎn)品推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,尤其是涉及一種基于階段的動(dòng)態(tài)產(chǎn)品推薦方法。
【背景技術(shù)】
[0002] 由于向人們推薦他們感興趣的產(chǎn)品產(chǎn)生了越來越多的經(jīng)濟(jì)效益,個(gè)性化推薦正變 得越來越受歡迎。許多的電子商務(wù)網(wǎng)站已經(jīng)從產(chǎn)品推薦系統(tǒng)中獲得了很大的利益。大部分 的研究者都嘗試通過使用基于內(nèi)容或者協(xié)同過濾或者混合前面兩種技術(shù)的方式開發(fā)推薦 系統(tǒng)。然而,送種推薦模式不能有效的解決所有可能發(fā)生在現(xiàn)實(shí)應(yīng)用中的事件。
[0003] 在電子推薦系統(tǒng)中,存在一類特殊的推薦問題,即用戶的購買行為是隨著時(shí)間而 改變的。在人的不同階段,用戶會(huì)偏好不同的商品。在送里使用基于商品的方法來做個(gè)性 化推薦是不合理的,因?yàn)椴煌瑫r(shí)期購買的商品可能會(huì)完全不同。通常,一個(gè)商品分類方法是 和一個(gè)推薦系統(tǒng)相關(guān)聯(lián)的,送樣客戶能很容易的轉(zhuǎn)向不同的產(chǎn)品類別。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是針對(duì)現(xiàn)有的產(chǎn)品推薦中存在的問題,提出一種適用性強(qiáng)、可靠性 好的動(dòng)態(tài)產(chǎn)品推薦方法。
[0005] 實(shí)現(xiàn)本發(fā)明目的的技術(shù)解決方案為: 將產(chǎn)品分類知識(shí)用來形式化用戶的長期偏好,同時(shí)獲取用戶的興趣變化。然而,僅僅有 長期偏好并不能提供足夠的證據(jù)來得到用戶的當(dāng)前愿望。對(duì)于進(jìn)入一個(gè)新的購買階段的客 戶來說,他可能會(huì)喜歡W前從來沒有購買過的商品類型。因此,僅考慮用戶的長期偏好是不 能獲取他的意愿的。為了解決送個(gè)問題,我們提出通過分析相似用戶購買行為來探索用戶 的短期偏好。
[000引具體步驟如下: 1、 分割用戶的購買記錄,將其分為不同階段:定義一個(gè)統(tǒng)一的時(shí)間片T作為一個(gè)分割 單位,然后根據(jù)T來分割購買記錄H,即H=化t。,Hti,…,HJ,其中t。表示當(dāng)前階段,即最近購 買時(shí)期,對(duì)于每個(gè)時(shí)期,我們都使用商品分類法對(duì)用戶行為Hti進(jìn)行建模; 2、 使用產(chǎn)品分類方法對(duì)用戶的長期偏好進(jìn)行建模;對(duì)用戶長期偏好進(jìn)行建模包括生 成用戶信息W及模型改善;生成用戶信息:假設(shè)基本的類別向量為<Ci,C2, C3, C4, C5〉,權(quán)重 類別向量=<1,2, 0, 1,1〉,其中每一項(xiàng)表示用戶對(duì)相應(yīng)的類別的隱式評(píng)分。在送個(gè)表達(dá) 式中,我們賦予產(chǎn)品分類中更高層的類別更大的權(quán)重,W避免陷入特定的主題W及失去對(duì) 用戶偏好的整體認(rèn)知。權(quán)重類別向量是12歸一化的。最后,我們定義用戶的長期信息為 Rui=TR笠,,R這,…},同時(shí)我們可W確定Ui的當(dāng)前推薦階段為Htc ; 模型改善:我們通過指定H種不同的相似度用戶與用戶的相似度(S。),產(chǎn)品之間的相 似度(Si),類別之間的相似度(S。),進(jìn)一步的形式化送個(gè)基于分類的信息模型。
[0007] 3、基于與目標(biāo)用戶相似的用戶的購買行為構(gòu)建一張多模態(tài)圖;建立一個(gè)節(jié)點(diǎn)包括 用戶、產(chǎn)品和類別的多模態(tài)圖,而節(jié)點(diǎn)之間的邊的權(quán)重由鄰接矩陣W確定。Up、Pp、P。分別表 示用戶與產(chǎn)品、用戶與類別、產(chǎn)品與類別之間的關(guān)系,建立一個(gè)鄰接矩陣W,節(jié)點(diǎn)之間的邊 的權(quán)重由鄰接矩陣W確定。
[0008] 4、在構(gòu)建的多模態(tài)圖上進(jìn)行隨機(jī)游走推理,得到最終的推薦列表: 執(zhí)行隨機(jī)游走原理RWR來取得與給定用戶q高度相關(guān)的元素,在向量ij誦!議5^.;?選 擇一個(gè)排在頂端的元素子集e,如果是用戶,則選擇最近購買的產(chǎn)品放進(jìn)推薦列表1 中;如果Gi是產(chǎn)品,則直接將Gi放進(jìn)1中;如果Gi是類別,則選擇對(duì)Gi的IC值貢獻(xiàn)最大的 產(chǎn)品放進(jìn)1中。送樣就得到了最終的產(chǎn)品推薦列表。
[0009] 本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn)是: 1. 靈活性強(qiáng); 2. 可靠性高; 3. 頭用性好。
【附圖說明】
[0010] 圖1是產(chǎn)品分類示意圖。
[0011] 圖2是動(dòng)態(tài)推薦過程示意圖。
[0012] 圖3是隨機(jī)游走推理算法示意圖。
【具體實(shí)施方式】
[0013] W下結(jié)合附圖,詳細(xì)說明本發(fā)明的實(shí)施方式。
[0014] 結(jié)合圖1,本發(fā)明的動(dòng)態(tài)產(chǎn)品推薦方法中,定義幾個(gè)集合;用戶知識(shí)庫U={ui,U2,… ,U。},U包括電子商務(wù)網(wǎng)站上的所有用戶;產(chǎn)品知識(shí)庫P= {Pi,P2,…,PmK P包括電子商務(wù)網(wǎng) 站上提供的所有產(chǎn)品;用戶評(píng)價(jià)R=出1,R2,…,R。},R包括用戶對(duì)產(chǎn)品的所有評(píng)價(jià)信息;產(chǎn)品 類別C= {Ci,C2,…,CiJ,一件產(chǎn)品只能屬于一個(gè)特定的類別。
[001引首先提取Ui的交易數(shù)據(jù),Ri={p4i,P5i,化J。對(duì)于Ri中的每個(gè)項(xiàng)目,我們定位了其 直接所屬的細(xì)粒度類別即C4,然后從底到頂遍歷送個(gè)分類W獲得從送個(gè)類別開始的類別路 徑,即C4 一 Cl。接下來將P41上的評(píng)價(jià)得分轉(zhuǎn)換為類別路徑,即將路徑上的每個(gè)類別定義設(shè) 為"1"。因此,我們匯總了每個(gè)類別的評(píng)價(jià)得分,并用一個(gè)權(quán)重類別向量表示用戶階段信息。
[0016] 結(jié)合圖2,本發(fā)明的動(dòng)態(tài)產(chǎn)品推薦方法中,商品的動(dòng)態(tài)推薦過程包括分割用戶的購 買記錄、對(duì)用戶長期偏好進(jìn)行建模、構(gòu)建多模態(tài)圖,最后是進(jìn)行隨機(jī)游走推理,W得到最終 的推薦列表。
[0017] 分割用戶的購買記錄:定義一個(gè)統(tǒng)一的時(shí)間片T作為一個(gè)分割單位,然后根據(jù)T來 分割購買記錄H,即H=化t。,Hti,…,HJ,其中t。表示當(dāng)前階段,即最近購買時(shí)期。對(duì)于每個(gè) 時(shí)期,我們都使用商品分類法對(duì)用戶行為Hti進(jìn)行建模。
[0018] 對(duì)用戶長期偏好進(jìn)行建模包括生成用戶信息W及模型改善。
[0019] 生成用戶信息;假設(shè)基本的類別向量為<Ci,C2, C3, C4, C5〉,權(quán)重類別向量巧潔 =<1,2, 0, 1,1〉,其中每一項(xiàng)表示用戶對(duì)相應(yīng)的類別的隱式評(píng)分。在送個(gè)表達(dá)式中,我們賦予 產(chǎn)品分類中更高層的類別更大的權(quán)重,W避免陷入特定的主題W及失去對(duì)用戶偏好的整體 認(rèn)知。權(quán)重類別向量是12歸一化的。最后,我們定義用戶的長期信息為Rui={Rl, ,R器,…},同時(shí)我們可W確定Ui的當(dāng)前推薦階段為Ht。。
[0020] 模型改善;我們通過指定H種不同的相似度,進(jìn)一步的形式化送個(gè)基于分類的信 息模型。
[0021] 用戶與用戶的相似度(S。);用戶之間的相似性產(chǎn)生自兩個(gè)不同的組件:用戶與產(chǎn) 品之間的相似性Sui和用戶與類別之間的相似性S。。。給定兩個(gè)用戶Ui和U2, Sui可W通過送 兩個(gè)用戶所購頭的廣品集合1。1, 1。2之間的化CCard相似度求得,而Suc可W由送兩個(gè)用戶可 確定的階段信息向量Rui, Ru2之間的Consine相似度求得。
[0024] 通過送種方式我們可W很容易的得到來自分類層次和實(shí)際購買行為層次的兩個(gè) 用戶的相關(guān)度。
[00巧]產(chǎn)品之間的相似度(Si):產(chǎn)品之間的相似度可W由產(chǎn)品到產(chǎn)品的協(xié)同過濾計(jì)算得 到。給定一個(gè)產(chǎn)品P,我們的目的是找到與P相似的產(chǎn)品;送里的相似指的是購買送兩個(gè)產(chǎn) 品的用戶集Upi、Up2具有相當(dāng)?shù)闹丿B。我們使用化ccard相似性來得到Si扣。1,Up2),即 務(wù):接挪還礙置麥與鑛粋''輪爲(wèi)翠類八鳴:互:姑蘇狂;} 類別之間的相似度(S。);送個(gè)相似度可W幫助確定在一個(gè)產(chǎn)品分類里面兩個(gè)不同類別 的語義相關(guān)性。我們使用信息內(nèi)容(IC)來計(jì)算S。,IC衡量了一個(gè)給定的類別C的發(fā)生概 率的信息數(shù)量,在我們的例子中就是在類別C中產(chǎn)品被購買的概率。IC越大,送個(gè)類別就越 受歡迎。IC(C)= -log P(C)D使用一個(gè)分類中最小公共包含的IC來計(jì)算一對(duì)內(nèi)容的相關(guān) 性。則
構(gòu)建多模態(tài)圖:多模態(tài)圖包括多種資源,如用戶、產(chǎn)品和類別之間多種類型的聯(lián)系,即 用戶與用戶、產(chǎn)品與產(chǎn)品、類別與類別之間的關(guān)系等等。我們將送個(gè)圖封裝成一個(gè)鄰接矩 陣。令Up、Pp、P。分別表示用戶與產(chǎn)品、用戶與類別、產(chǎn)品與類別之間的關(guān)系,建立一個(gè)鄰接 矩陣
,其中Uu、Pp、C。都由Eq計(jì)算得到,W中的其他塊可W由購買行為 或者產(chǎn)品分類計(jì)算得到。
[0026] 隨機(jī)游走推理:使用隨機(jī)游走重啟(RWR)推理來獲得推薦產(chǎn)品,送樣被推薦的 產(chǎn)品不會(huì)與用戶的購買興趣產(chǎn)生太大的偏離。使用歸一化的拉普拉斯圖構(gòu)建一個(gè)矩陣 A=浸:S蹲瓣茲P擊泡是一個(gè)對(duì)角矩陣,而且它的第(i,U個(gè)元素等于W中第i行的 總和。
[0027] 結(jié)合圖3,本發(fā)明的動(dòng)態(tài)產(chǎn)品推薦方法中,我們首先建立一個(gè)節(jié)點(diǎn)包括用戶、產(chǎn)品 和類別的多模態(tài)圖,而節(jié)點(diǎn)之間的邊的權(quán)重由鄰接矩陣W確定。使用拉普拉斯圖來歸一化 W,執(zhí)行隨機(jī)游走原理RWR來取得與給定用戶q高度相關(guān)的元素,在向量慧蠢遺L;議選擇 一個(gè)排在頂端的元素子集e,如果是用戶,則選擇最近購買的產(chǎn)品放進(jìn)推薦列表1中; 如果Gi是產(chǎn)品,則直接將Gi放進(jìn)1中;如果Gi是類別,則選擇對(duì)Gi的IC值貢獻(xiàn)最大的產(chǎn) 品放進(jìn)1中。送樣就得到了最終的產(chǎn)品推薦列表。
【主權(quán)項(xiàng)】
1. 一種基于階段的動(dòng)態(tài)產(chǎn)品推薦方法,其特征在于以下步驟: a. 首先分割用戶的購買記錄,將其分為不同階段:定義一個(gè)統(tǒng)一的時(shí)間片T作為一個(gè) 分割單位,然后根據(jù)T來分割購買記錄H,即H= {Ht。,Htl,…,HJ,其中t。表示當(dāng)前階段,即最 近購買時(shí)期,對(duì)于每個(gè)時(shí)期,都使用商品分類法對(duì)用戶行為H tl進(jìn)行建模; b. 使用產(chǎn)品分類方法對(duì)用戶的長期偏好進(jìn)行建模:對(duì)用戶長期偏好進(jìn)行建模包括生 成用戶信息以及模型改善;生成用戶信息:假設(shè)基本的類別向量為< Cl,c2, c3, c4, c5>,權(quán)重 類別向量_||=〈1,2, 0, 1,1>,其中每一項(xiàng)表示用戶對(duì)相應(yīng)的類別的隱式評(píng)分;權(quán)重類別向 量是12歸一化的,用戶的長期信息為Rul={Rg,Rg,Rf5.,…},確定U 1的當(dāng)前推薦階 段為Ht。; c. 基于與目標(biāo)用戶相似的用戶的購買行為構(gòu)建一張多模態(tài)圖;建立一個(gè)節(jié)點(diǎn)包括用 戶、產(chǎn)品和類別的多模態(tài)圖,而節(jié)點(diǎn)之間的邊的權(quán)重由鄰接矩陣W確定;U p、Pp、P。分別表示 用戶與產(chǎn)品、用戶與類別、產(chǎn)品與類別之間的關(guān)系,d. 在構(gòu)建的多模態(tài)圖上運(yùn)用隨機(jī)游走推理,得到最終的推薦列表:執(zhí)行隨機(jī)游走原理 RWR來取得與給定用戶q高度相關(guān)的元素,在向量定.?:后選擇一個(gè)排在頂端的元素 子集e,如果ei是用戶,則選擇ei最近購買的產(chǎn)品放進(jìn)推薦列表1中;如果ei是產(chǎn)品,則直 接將ei放進(jìn)1中;如果ei是類別,則選擇對(duì)ei的IC值貢獻(xiàn)最大的產(chǎn)品放進(jìn)1中,進(jìn)而得 到最終的產(chǎn)品推薦列表。2. 根據(jù)權(quán)利要求1所述的一種基于階段的動(dòng)態(tài)產(chǎn)品推薦方法,其特征在于所述的隨機(jī) 游走推理是使用歸一化的拉普拉斯圖構(gòu)建了一個(gè)矩陣A=|}dH/|rV 2,其中D是一個(gè) 對(duì)角矩陣,而且它的第(i,i)個(gè)元素等于W中第i行的總和。
【專利摘要】本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,具體涉及一種基于階段的動(dòng)態(tài)產(chǎn)品推薦方法。它包括分割用戶購買記錄、對(duì)用戶長期偏好進(jìn)行建模、構(gòu)建多模態(tài)圖和進(jìn)行隨機(jī)游走推理,最終得到產(chǎn)品推薦列表。本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn)是靈活性強(qiáng),可靠性高,實(shí)用性高。
【IPC分類】G06Q30/00
【公開號(hào)】CN105528704
【申請(qǐng)?zhí)枴緾N201410502965
【發(fā)明人】李濤, 劉敏, 李千目, 侯君, 徐建
【申請(qǐng)人】南京理工大學(xué)常熟研究院有限公司
【公開日】2016年4月27日
【申請(qǐng)日】2014年9月28日