推廣行為的檢測方法及裝置的制造方法
【技術領域】
[0001] 本發明設及網絡信息智能處理技術領域,尤其設及一種推廣行為的檢測方法及裝 置。
【背景技術】
[0002] 問答社區作為一個供用戶尋求和提供知識的平臺而廣泛流行,在問答社區中,用 戶可W提出一個問題,稱為開放問題,其他用戶可W對于該問題給出各自的答案,如果提問 者對于某個答案滿意的話,那么可W將此答案選為滿意答案并關閉問題,關閉W后其他用 戶不可W繼續回答。對于每個答案,問答社區用戶可W投票贊成或者不贊成。問答社區也為 捜索引擎用戶提供了更多的捜索結果。例如,常用的問答社區在國外有化hoo!Answers、 如ora等,國內有百度知道、捜狗問問等。不同問答社區的組成部分大致相同,W捜狗問問為 例,主要包括問題、答案、用戶=個部分。
[0003] 但是,有研究表明,問答社區中有較高比例的答案是低質量的,作弊者會在問答社 區中將推廣信息展示給用戶W增加他們的商業利益,例如,在答案的前半部分包含了一些 給提問者的高質量的建議,但是在答案的最后,回答者推廣了一個產品,并給出了產品的購 買鏈接,使得它成為了推廣行為的一部分。運個答案可能會被現有的質量評估方法識別為 高質量答案,因為它確實包含了一些有用的信息。但是,和有用信息同時提供的推廣信息可 能是有誤導性的。因此,如何快速、并更加準確地從問答社區中檢測推廣作弊行為已成為亟 待解決的問題。
【發明內容】
[0004] 本發明的目的旨在至少在一定程度上解決上述的技術問題之一。
[0005] 為此,本發明的第一個目的在于提出一種推廣行為的檢測方法,該方法能夠通過 抓取種子推廣渠道來找到問答平臺中具有推廣行為的答案,有效并快速地檢測出推廣作弊 行為,提升了問答社區用戶體驗,減小了用戶的損失。
[0006] 本發明的第二個目的在于提出一種推廣行為的檢測裝置。
[0007] 為達上述目的,本發明第一方面實施例提出了一種推廣行為的檢測方法包括:基 于眾包網站,獲取所述眾包網站中針對多個第一用戶發布的多個推廣任務信息,并根據所 述多個推廣任務信息獲取N個第一推廣渠道,W及將所述N個第一推廣渠道作為種子推廣渠 道,其中,N為正整數;基于問答平臺,獲取所述問答平臺中的多個答案信息、多個問題信息、 W及多個第二用戶信息,并確定所述多個答案信息W及多個問題信息中的M個第二推廣渠 道,其中,所述M個第二推廣渠道包含所述種子推廣渠道和非種子推廣渠道,且M為正整數; 根據所述M個第二推廣渠道、多個答案信息、W及多個第二用戶信息構建用戶-渠道的二部 圖;根據所述種子推廣渠道和用戶-渠道的二部圖計算所述二部圖中每個用戶與每個渠道 分別對應的分數值;W及根據所述二部圖中每個用戶與每個渠道分別對應的分數值對所述 多個答案信息進行推廣行為檢測。
[0008] 根據本發明實施例的推廣行為的檢測方法,獲取眾包網站中多個第一用戶發布的 多個推廣任務信息,并從中抓取出N個第一推廣渠道W作為種子推廣渠道,并獲取問答平臺 中的多個答案信息、多個問題信息和第二用戶信息,并確定運些答案和問題信息中所包含 的第二推廣渠道,之后,根據第二推廣渠道、答案信息、W及第二用戶信息構建用戶-渠道的 二部圖,并根據種子推廣渠道和用戶-渠道的二部圖計算二部圖中每個用戶與每個渠道對 應的分數值,并根據該分數值對多個答案信息進行推廣行為檢測。該方法能夠通過抓取種 子推廣渠道來找到問答平臺中具有推廣行為的答案,有效并快速地檢測出推廣作弊行為, 提升了問答社區用戶體驗,減小了用戶的損失。
[0009] 在本發明的一個實施例中,所述N個第一推廣渠道和所述M個第二推廣渠道包括 ML地址、電話號碼、和/或社交媒體賬號。
[0010] 在本發明的一個實施例中,所述根據所述M個第二推廣渠道、多個答案信息、W及 多個第二用戶信息構建用戶-渠道的二部圖,包括:根據所述多個第二用戶信息確定多個第 二用戶;W所述多個第二用戶、M個第二推廣渠道作為所述二部圖的節點,如果所述多個答 案信息中包含第i第二推廣渠道,其中,i為正整數,且1含i含M,則確定所述多個答案信息對 應的第二用戶,并建立所述多個答案信息對應的第二用戶與所述第i第二推廣渠道之間的 對應關系,W所述構建用戶-渠道的二部圖。
[0011] 在本發明的一個實施例中,所述根據所述種子推廣渠道和用戶-渠道的二部圖計 算所述二部圖中每個用戶與每個渠道分別對應的分數值,包括:基于所述二部圖,確定所述 二部圖中的所述種子推廣渠道的節點,并將所述種子推廣渠道的分數值設置為1,W及分別 將所述非種子推廣渠道和每個用戶的分數值設置為0;針對每輪迭代過程中,對于所述每個 用戶,將與所述每個用戶的節點相連的第二推廣渠道的分數值進行加權求平均,并將所述 加權求平均得到的分數值作為所述每個用戶的分數值;針對每個非種子推廣渠道,將與所 述每個非種子推廣渠道的節點相鄰的用戶的分數值進行加權求平均,并將所述加權求平均 得到的分數值作為所述每個非種子推廣渠道的分數值,直至在相鄰的兩輪迭代中,所述每 個用戶和所述每個非種子推廣渠道的分數值的變化量小于第一預設闊值時,停止迭代。
[0012] 在本發明的一個實施例中,所述根據所述二部圖中每個用戶與每個渠道分別對應 的分數值對所述多個答案信息進行推廣行為檢測,包括:基于所述二部圖,針對每個答案信 息,將所述每個答案信息中所包含的第二推廣渠道的最高分數值作為所述每個答案信息的 作弊分數值;將作弊分數值大于或等于第二預設闊值的答案判定為所述推廣行為。
[0013] 在本發明的一個實施例中,在根據所述種子推廣渠道和用戶-渠道的二部圖計算 所述二部圖中每個用戶與每個渠道分別對應的分數值之后,還包括:
[0014] 根據所述多個答案信息和多個問題信息確定多個問答對信息;基于所述二部圖中 每個用戶與每個渠道分別對應的分數值,對于每個問答對信息,抽取所述每個問答對信息 的=維特征,其中,所述=維特征包括所述每個問答對信息中提問者的分數值、回答者的分 數值、W及所述每個問答對信息的答案信息中所包含的第二推廣渠道的最高分數值;根據 所述每個問答對信息的=維特征W及預先建立的分類模型對所述多個問答對信息進行分 類,W分類出滿足預設條件的問答對,并將所述滿足預設條件的問答對判定為所述推廣行 為。
[0015] 為達上述目的,本發明第二方面實施例提出了一種推廣行為的檢測裝置包括:第 一獲取模塊,用于基于眾包網站,獲取所述眾包網站中針對多個第一用戶發布的多個推廣 任務信息,并根據所述多個推廣任務信息獲取N個第一推廣渠道,W及將所述N個第一推廣 渠道作為種子推廣渠道,其中,N為正整數;第二獲取模塊,用于基于問答平臺,獲取所述問 答平臺中的多個答案信息、多個問題信息、W及多個第二用戶信息;第一確定模塊,用于確 定所述多個答案信息W及多個問題信息中的M個第二推廣渠道,其中,所述M個第二推廣渠 道包含所述種子推廣渠道和非種子推廣渠道,且M為正整數;構建模塊,用于根據所述M個第 二推廣渠道、多個答案信息、W及多個第二用戶信息構建用戶-渠道的二部圖;計算模塊,用 于根據所述種子推廣渠道和用戶-渠道的二部圖計算所述二部圖中每個用戶與每個渠道分 別對應的分數值;W及檢測模塊,用于根據所述二部圖中每個用戶與每個渠道分別對應的 分數值對所述多個答案信息進行推廣行為檢測。
[0016] 根據本發明實施例的推廣行為的檢測裝置,通過第一獲取模塊獲取眾包網站中多 個第一用戶發布的多個推廣任務信息,并根據該推廣任務信息得到N個第一推廣渠道,并將 其作為種子推廣渠道,第二獲取模塊獲取問答平臺中的多個答案信息、多個問題信息和第 二用戶信息,第一確定模塊確定運些答案和問題信息中所包含的第二推廣渠道,構建模塊 根據第二推廣渠道、答案信息、W及第二用戶信息構建用戶-渠道的二部圖,檢測模塊根據 種子推廣渠道和用戶-渠道的二部圖計算二部圖中每個用戶與每個渠道對應的分數值,并 根據該分數值對多個答案信息進行推廣行為檢測。該裝置能夠通過抓取種子推廣渠道來找 到問答平臺中具有推廣行為的答案,有效并快速地檢測出推廣作弊行為,提升了問答社區 用戶體驗,減小了用戶的損失。
[0017] 在本發明的一個實施例中,所述N個第一推廣渠道和所述M個第二推廣渠道包括 ML地址、電話號碼、和/或社交媒體賬號。
[0018] 在本發明的一個實施例中,所述構建模塊包括:確定單元,用于根據所述多個第二 用戶信息確定多個第二用戶;構建單元,用于W所述多個第二用戶、M個第二推廣渠道作為 所述二部圖的節點,在所述多個答案信息中包含第i第二推廣渠道時,其中,i為正整數,且1 < i <M,確定所述多個答案信息對應的第二用戶,并建立