異質(zhì)化的因素可有多種,其中一個(gè)因素是 因?yàn)閳D片中包含了灰度,RGB(紅綠藍(lán),Red Green Blue)等視覺上的原始特征,保證了圖片 相似度計(jì)算結(jié)果的準(zhǔn)確性。而相似度Sim(Ta,Tb)為抽象的特征,相比圖片的原始特征稀 疏,無法保證計(jì)算結(jié)果的準(zhǔn)確性。因此,根據(jù)查詢信息與待推薦候選內(nèi)容在預(yù)設(shè)空間中的相 似度,可以推薦出不是根據(jù)相似度Sim(Ta,Tb)直接計(jì)算出來的推薦內(nèi)容,而是推薦根據(jù)圖 片相似度ImageSim (Image (Ta), Image (Tb))計(jì)算出來的推薦內(nèi)容。根據(jù)擬合圖片相似度計(jì) 算出的參數(shù)信息W1,W2,可以把文本轉(zhuǎn)化到預(yù)設(shè)空間,從而根據(jù)在預(yù)設(shè)空間中計(jì)算出的相似 度來推薦內(nèi)容,提高了推薦內(nèi)容的多樣性。
[0036] 需要說明的是,本實(shí)施例中的預(yù)設(shè)空間可以是想象空間。想象空間是基于用戶看 到一個(gè)字符串的時(shí)候,在大腦中形成一個(gè)想象的圖片,用圖片的形式來表示這個(gè)字符串要 表達(dá)的意思。因此,把字符串轉(zhuǎn)為在高維空間中的數(shù)學(xué)表示,從而計(jì)算出字符串在高維空間 的相似度,此處的高維空間即為想象空間。
[0037] S103,根據(jù)參數(shù)信息計(jì)算出查詢信息與待推薦候選內(nèi)容在預(yù)設(shè)空間中的相似度, 并根據(jù)相似度從待推薦候選內(nèi)容中篩選出待推薦內(nèi)容,以用于向用戶展現(xiàn)待推薦內(nèi)容。
[0038] 在本發(fā)明的實(shí)施例中,可根據(jù)參數(shù)信息計(jì)算出查詢信息在預(yù)設(shè)空間中對(duì)應(yīng)的第一 向量,并根據(jù)參數(shù)信息計(jì)算出每個(gè)待推薦候選內(nèi)容在預(yù)設(shè)空間中對(duì)應(yīng)的第二向量,然后計(jì) 算第一向量與每個(gè)第二向量間的相似度,從而可計(jì)算出查詢信息與待推薦候選內(nèi)容在預(yù)設(shè) 空間中的相似度,即將第一向量與每個(gè)第二向量間的相似度作為查詢信息與待推薦候選內(nèi) 容在預(yù)設(shè)空間中的相似度。
[0039] 以第一向量V⑷)進(jìn)行舉例說明,假設(shè)查詢信息Q為"我愛北京天安門",學(xué)習(xí)網(wǎng)絡(luò) 為三層,則第一層輸入層由"我"、"愛"、"北京"和"天安門"四個(gè)詞組成,詞典V的大小為 100000個(gè),則輸入為100000維的向量VI,向量VI的"我"、"愛"、"北京"、"天安門"這四個(gè) 詞所對(duì)應(yīng)的位置的值為1,詞典V當(dāng)中的其他詞的位置所對(duì)應(yīng)的值為0。第二層為學(xué)習(xí)網(wǎng)絡(luò) 的隱含層,是一個(gè)大小為L(zhǎng)ayer2_SIZE的向量V2, Layer2_SIZE是一個(gè)大于1的整數(shù),取值 范圍為100到10000。向量V2中每個(gè)元素V2[i]的取值,可通過如下的公式計(jì)算得出:
[0040] V2 [i] = sigmoid (W1 [i] [0] *V1 [0]+W1 [i] [1] *V1 [1] + …+W1 [i] [100000-1]*V1[100000-1])
[0041] 其中,sigmoid函數(shù)是一個(gè)用來進(jìn)行非線性變換的函數(shù)sigmoid(z)=~ri7,其函數(shù) \+e 曲線可如圖3所示。第三層為進(jìn)行相似度計(jì)算的高維向量V3,其大小Layer3_Si ze通常的 取值會(huì)小于Layer2_SiZe,取值范圍是50到2000。其中,每個(gè)元素的計(jì)算方法可通過如下 的公式計(jì)算得出:
[0042] V3[i] =sigmoid(W2[i] [0]*V2[0]+W2[i] [1]*V2[1]+-+W2[i] [Layer2_ SIZE-1]*V2[Layer2_SIZE-l])
[0043] 最終計(jì)算出的V3即為V(Q),即第一向量。
[0044]同理,可計(jì)算出待推薦候選內(nèi)容C的高維向量V(C),即第二向量。
[0045] 在獲得第一向量為V(Q),第二向量為V(C)后,則可通過公式
【主權(quán)項(xiàng)】
1. 一種信息的推薦方法,其特征在于,包括: 獲得查詢信息及其對(duì)應(yīng)的待推薦候選內(nèi)容; 獲得所述查詢信息和所述待推薦候選內(nèi)容對(duì)應(yīng)的學(xué)習(xí)網(wǎng)絡(luò)的參數(shù)信息;W及 根據(jù)所述參數(shù)信息計(jì)算出所述查詢信息與所述待推薦候選內(nèi)容在預(yù)設(shè)空間中的相似 度,并根據(jù)所述相似度從待推薦候選內(nèi)容中篩選出待推薦內(nèi)容,W用于向用戶展現(xiàn)所述待 推薦內(nèi)容。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述參數(shù)信息計(jì)算出所述查詢 信息與所述待推薦候選內(nèi)容在預(yù)設(shè)空間中的相似度,包括: 根據(jù)所述參數(shù)信息計(jì)算出所述查詢信息在所述預(yù)設(shè)空間中對(duì)應(yīng)的第一向量; 根據(jù)所述參數(shù)信息計(jì)算出每個(gè)待推薦候選內(nèi)容在所述預(yù)設(shè)空間中對(duì)應(yīng)的第二向量;W 及 計(jì)算所述第一向量與每個(gè)第二向量間的相似度。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述相似度從待推薦候選內(nèi)容 中篩選出待推薦內(nèi)容,包括: 確定所述相似度大于預(yù)設(shè)闊值的第二向量,并根據(jù)確定的第二向量獲得所述待推薦內(nèi) 容;或者 按照所述相似度由高到低的順序確定預(yù)定數(shù)量的第二向量,并根據(jù)確定的第二向量獲 得所述待推薦內(nèi)容。
4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲得所述查詢信息和所述待推薦候 選內(nèi)容對(duì)應(yīng)的學(xué)習(xí)網(wǎng)絡(luò)的參數(shù)信息,包括: 根據(jù)所述查詢信息和所述待推薦候選內(nèi)容構(gòu)建對(duì)應(yīng)的學(xué)習(xí)網(wǎng)絡(luò); 獲取所述學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練樣本,使用所述訓(xùn)練樣本通過預(yù)設(shè)算法獲取所述參數(shù)信息。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述預(yù)設(shè)算法包括反向傳播算法和隨機(jī) 梯度下降法。
6. -種信息的推薦裝置,其特征在于,包括: 第一獲得模塊,用于獲得查詢信息及其對(duì)應(yīng)的待推薦候選內(nèi)容; 第二獲得模塊,用于獲得所述查詢信息和所述待推薦候選內(nèi)容對(duì)應(yīng)的學(xué)習(xí)網(wǎng)絡(luò)的參數(shù) 信息;W及 篩選模塊,用于根據(jù)所述參數(shù)信息計(jì)算出所述查詢信息與所述待推薦候選內(nèi)容在預(yù)設(shè) 空間中的相似度,并根據(jù)所述相似度從待推薦候選內(nèi)容中篩選出待推薦內(nèi)容,W用于向用 戶展現(xiàn)所述待推薦內(nèi)容。
7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述篩選模塊,具體用于: 根據(jù)所述參數(shù)信息計(jì)算出所述查詢信息在所述預(yù)設(shè)空間中對(duì)應(yīng)的第一向量; 根據(jù)所述參數(shù)信息計(jì)算出每個(gè)待推薦候選內(nèi)容在所述預(yù)設(shè)空間中對(duì)應(yīng)的第二向量;W 及 計(jì)算所述第一向量與每個(gè)第二向量間的相似度。
8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述篩選模塊,具體用于: 確定所述相似度大于預(yù)設(shè)闊值的第二向量,并根據(jù)確定的第二向量獲得所述待推薦內(nèi) 容;或者 按照所述相似度由高到低的順序確定預(yù)定數(shù)量的第二向量,并根據(jù)確定的第二向量獲 得所述待推薦內(nèi)容。
9. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第二獲得模塊,具體用于: 根據(jù)所述查詢信息和所述待推薦候選內(nèi)容構(gòu)建對(duì)應(yīng)的學(xué)習(xí)網(wǎng)絡(luò); 獲取所述學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練樣本,使用所述訓(xùn)練樣本通過預(yù)設(shè)算法獲取所述參數(shù)信息。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述預(yù)設(shè)算法包括反向傳播算法和隨機(jī) 梯度下降法。
【專利摘要】本發(fā)明公開了一種信息的推薦方法和裝置,其中,信息的推薦方法包括:獲得查詢信息及其對(duì)應(yīng)的待推薦候選內(nèi)容;獲得查詢信息和待推薦候選內(nèi)容對(duì)應(yīng)的學(xué)習(xí)網(wǎng)絡(luò)的參數(shù)信息;以及根據(jù)參數(shù)信息計(jì)算出查詢信息與待推薦候選內(nèi)容在預(yù)設(shè)空間中的相似度,并根據(jù)相似度從待推薦候選內(nèi)容中篩選出待推薦內(nèi)容,以用于向用戶展現(xiàn)待推薦內(nèi)容。本發(fā)明實(shí)施例通過獲得查詢信息及其對(duì)應(yīng)的待推薦候選內(nèi)容,獲得查詢信息和待推薦候選內(nèi)容對(duì)應(yīng)的學(xué)習(xí)網(wǎng)絡(luò)的參數(shù)信息,以及根據(jù)參數(shù)信息計(jì)算出查詢信息與待推薦候選內(nèi)容在預(yù)設(shè)空間中的相似度,并根據(jù)相似度從待推薦候選內(nèi)容中篩選出待推薦內(nèi)容,可以實(shí)現(xiàn)向用戶推薦出能夠激發(fā)用戶需求的推薦內(nèi)容,解決了同質(zhì)化的問題。
【IPC分類】G06F17-30
【公開號(hào)】CN104572825
【申請(qǐng)?zhí)枴緾N201410738395
【發(fā)明人】張軍, 吳先超, 牛罡, 董大祥
【申請(qǐng)人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
【公開日】2015年4月29日
【申請(qǐng)日】2014年12月4日