一種基于自適應主動學習的項目選擇方法
【技術領域】
[0001] 本發明涉及推薦系統技術領域,尤其涉及一種基于自適應主動學習的項目選擇方 法。
【背景技術】
[0002] 在協同過濾推薦系統中,解決用戶冷啟動問題的關鍵在于如何快速建立新用戶的 興趣偏好模型。在用戶初始使用系統時,基于主動學習評分引導的方法主動挑選一些項目 讓用戶評價可以有效獲得用戶的個性化偏好信息。挑選項目給用戶評分出于兩點考慮:(1) 用戶對項目評分可以獲得用戶更多的評分數據,評分信息越多,推薦系統越有效;(2)并非 所有評分信息都是等效的,有些評分能夠代表用戶的個性化信息,有些則不能,因此不同的 主動學習評分引導方法會帶來不同的效果。比如一直挑選熱門項目給用戶評價,雖然能獲 得更多的用戶評分數據,但是對于系統獲得用戶的個性化偏好信息幫助不大,因為大多數 用戶都喜歡熱門項目。因此,如何設計一個有效的主動學習項目選擇策略,能盡可能少的選 擇信息含量較高的項目評分數據來更好地表示用戶的偏好信息是非常關鍵的問題,也是目 前亟待解決的問題。
【發明內容】
[0003] 本發明提供了一種基于自適應主動學習的項目選擇方法,能夠綜合考慮項目的不 確定性和代表性挑選出信息含量最高的項目。
[0004] 本發明提供了一種基于自適應主動學習的項目選擇方法,包括:
[0005] 計算候選項目的不確定性;
[0006] 計算候選項目的代表性;
[0007] 根據所述不確定性和代表性選擇信息含量最高的項目。
[0008] 優選地,所述計算候選項目的不確定性為:
【主權項】
1. 一種基于自適應主動學習的項目選擇方法,其特征在于,包括: 計算候選項目的不確定性; 計算候選項目的代表性; 根據所述不確定性和代表性選擇信息含量最高的項目。
2. 根據權利要求1所述的方法,其特征在于,所述計算候選項目的不確定性為: 依據公式
計算出候選項目的不確定性,其中;R。,表 示用戶C對項目X的評分,忘表示用戶的平均評分,Uy(sim)表示和當前新用戶相似且對項 目X有評分行為的用戶集合。
3. 根據權利要求2所述的方法,其特征在于,所述計算候選項目的代表性包括: 在訓練集T。上根據預測模型0計算得到C對X的預測評分.V(0),并估計C為X評分 為r的概率P扣=C,氏,=r),并將r當作y( 0 )變化值,其中,.M巧二r; 更新評分訓練集合T。,將預測評分變化值(巧添加到C的已評分項目集合列表中,得 至Ij新的評分訓練集Te,r=TeU(X,r); 在評分訓練集T。和Tw上,根據預測模型0,預測c對未評分項目集合中的其它 未評分項目Xi的評分值,分別得到對應訓練集上的預測評分為記.(0)和乂,'(巧; 在評分為r的概率P扣=c,Rty=r)下,估計當前候選項目X的評分變化對 其它項目預測評分的影響,用片.(0)與.V;;/ (0)差值的平方表示評分變化,依據公式
I計算出當前候選項目X的代表性 rep(X),其中;C表示當前新用戶,X代表當前候選項目,X戸代表C的未評分項目集 合,單表示C的已評分項目集合,巧'W表示去掉X后C的剩余未評分項目集合,即 =巧'> \樹,乂中的每個項目用X康示,;巧=LU'…hiU)是C對應的訓練數 據集,表不C對X的評分。
4. 根據權利要求3所述的方法,其特征在于,所述根據所述不確定性和代表性選擇信 息含量最局的項目為: 依據公式
計算得出信息含量高的項目,其中: uncedainty(x)為不確定性,rep(x)為代表性,C表示當前新用戶,X代表當前候選項目, 《"代表C的未評分項目集合。
5. 根據權利要求1所述的方法,其特征在于,所述計算候選項目的代表性后還包括: 預先指定權值集合W,W= {Wi, *2,…,*。_1,W。},其大小IWI=n; 設置候選項目集合I為空,/ =0; 針對當前權值Wi,WiE W,選擇前L個候選項目,構成項目集合I i; 更新候選項目集合I=IUli; 在用戶c已有的評分集合T。上訓練得到預測模型0,根據0計算c對項目X的預測 評分乂.、.,更新訓練集T。; 計算每個項目對應的預測評分偏差e(X); 從候選項目集合I中選擇最具信息含量的項目x>。
6. 根據權利要求5所述的方法,其特征在于,所述針對當前權值W1,WiGW,選擇前L個 候選項目為: 根據所述不確定性unce;rtainty(X)和代表性rep(X),依據公式 info(X) =uncertainty(x)wXrep(x)d-w)計算出組合后項目的信息含量info(X); 依據公式
計算出最具信息含量的項目X%選擇前L個候選項目。
7. 根據權利要求6所述的方法,其特征在于,所述在用戶C已有的評分集合T。上訓練 得到預測模型e,根據0計算C對項目X的預測評分乂,.T,更新訓練集T。為: 依據公式r=rU<-、-,乂,. >更新訓練集T。。
8. 根據權利要求7所述的方法,其特征在于,所述計算每個項目對應的預測評分偏差 e(X)為: 根據更新后的T。訓練得到新的預測模型g,基于各、.預測C對已評分項目訓練集合中 項目t(t G T。)的評分根據公
估計真實評分與預測評分的偏差 e(X),其中表示更新后的協同過濾模型§預測的C對項目t的評分。
9. 根據權利要求8所述的方法,其特征在于,所述從候選項目集合I中選擇最具信息含 量的項目為: 依據公
選擇最具信息含量的項目x>。
【專利摘要】本發明公開了一種基于自適應主動學習的項目選擇方法,包括:計算候選項目的不確定性;計算候選項目的代表性;根據所述不確定性和代表性,自適應地動態選擇信息含量最高的項目。本發明能夠綜合考慮項目的不確定性和代表性挑選出信息含量最高的項目。
【IPC分類】G06F17-30
【公開號】CN104794250
【申請號】CN201510255684
【發明人】吳健, 李承超, 張宇
【申請人】蘇州融希信息科技有限公司
【公開日】2015年7月22日
【申請日】2015年5月19日