。例如,如果第一新聞為體育新聞,則選取的標(biāo)桿新聞為體育新聞。
[0031]本發(fā)明的一個實施例中還提供一種確定新聞之間相關(guān)性的方法,相比于前述的實施例,本實施例的確定新聞之間相關(guān)性的方法,在步驟110之前,還包括:
[0032]獲取第一新聞中的關(guān)鍵詞,并從標(biāo)桿新聞集合中選擇具有關(guān)鍵詞的標(biāo)桿新聞。在本實施例中,如果第一新聞、第二新聞與標(biāo)桿新聞之間的距離過大,只能說明第一新聞、第二新聞與標(biāo)桿新聞均有很大不同,但難以說明第一新聞、第二新聞之間的相關(guān)性如何;而具有相同關(guān)鍵詞的新聞之間具有較高的相關(guān)性,則本實施例使得第一新聞與標(biāo)桿新聞之間的距離較小,說明第一新聞與標(biāo)桿新聞相關(guān)性較高,則第二新聞與標(biāo)桿新聞距離大則相當(dāng)于與第一新聞距離大,即第一新聞與第二新聞相關(guān)性較弱,第二新聞與標(biāo)桿新聞距離小則相當(dāng)于與第一新聞距離小,即第一新聞與第二新聞相關(guān)性較強。例如,如果第一新聞標(biāo)題為《明星A獲獎》,則選取的標(biāo)桿新聞可以是《明星A全紀(jì)錄》,關(guān)鍵詞是明星A。
[0033]本發(fā)明的一個實施例中還提供一種確定新聞之間相關(guān)性的方法,相比于前述的實施例,本實施例的確定新聞之間相關(guān)性的方法,步驟110,具體包括:
[0034]獲取第一新聞的特征屬性,并根據(jù)述第一新聞的特征屬性生成第一新聞對應(yīng)的向量,將第一新聞對應(yīng)的向量與標(biāo)桿新聞對應(yīng)的向量進行比較。
[0035]步驟120,具體包括:獲取第二新聞的特征屬性,并根據(jù)述第二新聞的特征屬性生成第二新聞對應(yīng)的向量,并將第二新聞對應(yīng)的向量與標(biāo)桿新聞對應(yīng)的向量進行比較。
[0036]在本實施例中,對特征屬性不進行限制;利用新聞的一個或多個特征屬性,容易將新聞量化稱謂數(shù)字,能夠更容易、更精確地計算新聞之間的距離。
[0037]本發(fā)明的一個實施例中還提供一種確定新聞之間相關(guān)性的方法,相比于前述的實施例,本實施例的確定新聞之間相關(guān)性的方法,步驟110,具體包括:
[0038]對第一新聞進行分詞得到多個詞,計算第一新聞的多個詞的詞頻,作為第一新聞的特征屬性;
[0039]步驟120,具體包括:對第二新聞進行分詞得到多個詞,計算第二新聞的多個詞的詞頻,作為第二新聞的特征屬性。
[0040]在本實施例中,可以為第一新聞分配一個隨機數(shù),根據(jù)隨機數(shù)和計算得到的詞頻,為第一新聞構(gòu)造出一個文章向量;同樣地,第二新聞、標(biāo)桿新聞也可以構(gòu)造相應(yīng)的文章向量;在本實施例中,對第一新聞、第二新聞、標(biāo)桿新聞的文章向量取最小哈希值再進行計算,能夠得到第一新聞與標(biāo)桿新聞之間的具體距離值、第二新聞與標(biāo)桿新聞之間的距離值。例如,新聞A、新聞B與標(biāo)桿新聞之間的距離分別為4、3,差值較小為I表示新聞A、新聞B相關(guān)性較高,而新聞C與標(biāo)桿新聞的差值為I,其與新聞A、新聞B的距離差值較大,則相關(guān)性較低。
[0041]本發(fā)明的一個實施例中還提供一種確定新聞之間相關(guān)性的方法,相比于前述的實施例,本實施例的確定新聞之間相關(guān)性的方法,步驟130,具體包括:
[0042]在距離差位于預(yù)設(shè)區(qū)間時,將第二新聞設(shè)置為第一新聞的相關(guān)新聞,以用于在需推送第一新聞的相關(guān)新聞時推送第二新聞。例如,結(jié)合前述的實施例內(nèi)容,假設(shè)預(yù)設(shè)區(qū)間為0-1,則新聞A為新聞B的相關(guān)新聞,用戶查看新聞A時可以為用戶推送新聞B。
[0043]如圖2所示,本發(fā)明的一個實施例中提供了一種確定新聞之間相關(guān)性的裝置,包括:
[0044]第一距離計算模塊210,用于將第一新聞與標(biāo)桿新聞進行比較,得到第一新聞與標(biāo)桿新聞的距離。在本實施例中,對標(biāo)桿新聞不進行限制,任何一篇新聞都可以選定作為標(biāo)桿新聞。
[0045]第二距離計算模塊220,用于將第二新聞與標(biāo)桿新聞進行比較,得到第二新聞與標(biāo)桿新聞的距離。
[0046]相關(guān)性計算模塊230,用于計算第一新聞和標(biāo)桿新聞的距離與第一新聞與標(biāo)桿新聞的距離之間的距離差,根據(jù)距離差確定第一新聞與第二新聞之間的相關(guān)性。在本實施例中,距離反映了新聞之間的差別,本實施例對計算距離的方式不進行限制;根據(jù)本實施例的技術(shù)方案,容易理解,當(dāng)?shù)谝恍侣勁c標(biāo)桿新聞之間的距離,和第二新聞與標(biāo)桿新聞之間的距離相似時,說明第一新聞與第二新聞之間的距離較近,也就是兩個新聞之間的相關(guān)性較強;當(dāng)?shù)谝恍侣勁c標(biāo)桿新聞之間距離較近,第二新聞與標(biāo)桿新聞之間的距離較遠時,說明第一新聞與第二新聞之間的距離較遠,兩個新聞之間的相關(guān)性較弱。
[0047]如圖3所示,本發(fā)明的一個實施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實施例,本實施例的確定新聞之間相關(guān)性的裝置,還包括:
[0048]第一標(biāo)桿新聞獲取模塊310,用于識別第一新聞的類型,并從標(biāo)桿新聞集合中選擇具有相對應(yīng)類型的標(biāo)桿新聞。在本實施例中,如果第一新聞、第二新聞與標(biāo)桿新聞之間的距離過大,只能說明第一新聞、第二新聞與標(biāo)桿新聞均有很大不同,但難以說明第一新聞、第二新聞之間的相關(guān)性如何;而同類型的新聞之間具有較高的相關(guān)性,則本實施例使得第一新聞與標(biāo)桿新聞之間的距離較小,說明第一新聞與標(biāo)桿新聞相關(guān)性較高,則第二新聞與標(biāo)桿新聞距離大則相當(dāng)于與第一新聞距離大,即第一新聞與第二新聞相關(guān)性較弱,第二新聞與標(biāo)桿新聞距離小則相當(dāng)于與第一新聞距離小,即第一新聞與第二新聞相關(guān)性較強。例如,如果第一新聞為體育新聞,則選取的標(biāo)桿新聞為體育新聞。
[0049]如圖3所示,本發(fā)明的一個實施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實施例,本實施例的確定新聞之間相關(guān)性的裝置,還包括:
[0050]第二標(biāo)桿新聞獲取模塊320,用于獲取第一新聞中的關(guān)鍵詞,并從標(biāo)桿新聞集合中選擇具有關(guān)鍵詞的標(biāo)桿新聞。在本實施例中,如果第一新聞、第二新聞與標(biāo)桿新聞之間的距離過大,只能說明第一新聞、第二新聞與標(biāo)桿新聞均有很大不同,但難以說明第一新聞、第二新聞之間的相關(guān)性如何;而具有相同關(guān)鍵詞的新聞之間具有較高的相關(guān)性,則本實施例使得第一新聞與標(biāo)桿新聞之間的距離較小,說明第一新聞與標(biāo)桿新聞相關(guān)性較高,則第二新聞與標(biāo)桿新聞距離大則相當(dāng)于與第一新聞距離大,即第一新聞與第二新聞相關(guān)性較弱,第二新聞與標(biāo)桿新聞距離小則相當(dāng)于與第一新聞距離小,即第一新聞與第二新聞相關(guān)性較強。例如,如果第一新聞標(biāo)題為《明星A獲獎》,則選取的標(biāo)桿新聞可以是《明星A全紀(jì)錄》,關(guān)鍵詞是明星A。
[0051]如圖3所示,本發(fā)明的一個實施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實施例,本實施例的確定新聞之間相關(guān)性的裝置,還包括:
[0052]第一向量生成模塊330,用于獲取第一新聞的特征屬性,并根據(jù)述第一新聞的特征屬性生成第一新聞對應(yīng)的向量;第一標(biāo)桿新聞獲取模塊310將第一新聞對應(yīng)的向量與標(biāo)桿新聞對應(yīng)的向量進行比較。
[0053]第二向量生成模塊340,用于獲取第二新聞的特征屬性,并根據(jù)述第二新聞的特征屬性生成第二新聞對應(yīng)的向量;第一標(biāo)桿新聞獲取模塊320將第二新聞對應(yīng)的向量與標(biāo)桿新聞對應(yīng)的向量進行比較。
[0054]在本實施例中,對特征屬性不進行限制;利用新聞的一個或多個特征屬性,容易將新聞量化稱謂數(shù)字,能夠更容易、更精確地計算新聞之間的距離。
[0055]本發(fā)明的一個實施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實施例,本實施例的確定新聞之間相關(guān)性的裝置,第一向量生成模塊330對第一新聞進行分詞得到多個詞,計算第一新聞的多個詞的詞頻,作為第一新聞的特征屬性.
[0056]第二向量生成模塊340對第二新聞進行分詞得到多個詞,計算第二新聞的多個詞的詞頻,作為第二新聞的特征屬性。
[0057]在本實施例中,可以為第一新聞分配一個隨機數(shù),根據(jù)隨機數(shù)和計算得到的詞頻,為第一新聞構(gòu)造出一個文章向量;同樣地,第二新聞、標(biāo)桿新聞也可以構(gòu)造相應(yīng)的文章向量;在本實施例中,對第一新聞、第二新聞、標(biāo)桿新聞的文章向量取最小哈希值再進行計算,能夠得到第一新聞與標(biāo)桿新聞之間的具體距離值、第二新聞與標(biāo)桿新聞之間的距離值。例如,新聞A、新聞B與標(biāo)桿新聞之間的距離分別為4、3,差值較小為I表示新聞A、新聞B相關(guān)性較高,而新聞C與標(biāo)桿新聞的差值為I,其與新聞A、新聞B的距離差值較大,則相關(guān)性較低。
[0058]本發(fā)明的一個實施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實施例,本實施例的確定新聞之間相關(guān)性的裝置,相關(guān)性計算模塊310在距離差位于預(yù)設(shè)區(qū)間時,將第二新聞設(shè)置為第一新聞的相關(guān)新聞,以用于在需推