商品推薦方法及系統的制作方法
【專利摘要】本發明公開了一種商品推薦方法及系統。該商品推薦方法包括以下步驟:接收目標用戶輸入的語音信息;將語音信息識別轉換為文本信息;處理文本信息生成結構化文本;查詢獲取語音查詢結果;將結構化文本記錄至目標用戶的日志中;聚類分析并確定目標用戶所屬的用戶聚類;搜索目標用戶的最近鄰用戶;根據最近鄰用戶對商品的評分及目標用戶的平均評分計算目標用戶對商品的潛在評分,根據潛在評分篩選商品以生成候選商品集;根據結構化文本從候選商品集中選取出若干商品并推薦給目標用戶。本發明的商品推薦方法及系統避免了電子商務中用戶搜索所需商品所產生的瀏覽中的大量無關信息,大大提高了電子商務的效率,同時大大改善了用戶的使用體驗。
【專利說明】商品推薦方法及系統
【技術領域】
[0001]本發明涉及一種商品推薦方法及系統。
【背景技術】
[0002]隨著電子商務規模的不斷擴大,商品個數和種類快速增長,顧客需要花費大量的時間才能找到自己想買的商品。這種瀏覽大量無關的信息和產品過程無疑會使淹沒在信息過載問題中的消費者不斷流失。
[0003]另一方面,語音查詢功能在各行業中都有非常實際的應用。隨著移動終端的普及,越來越多的語音識別應用被開發。利用語音識別技術能夠在一定程度上便于用戶的搜索或操作,若能夠將語音識別技術輔以主動根據用戶需求對商品進行篩選推薦的系統,則有望更快、更便利地推薦最適合用戶的產品,以達到使得用戶能夠更便捷地找尋所需商品的目的,從而大大改善用戶的使用體驗。
【發明內容】
[0004]本發明要解決的技術問題是為了現有電子商務中用戶需要花費大量的時間才能找到自己想買的商品,而在這種瀏覽中必然產生大量無關的信息,因而會大大降低電子商務的效率,同時嚴重影響用戶的使用體驗的缺陷,提出一種商品推薦方法及系統。
[0005]本發明是通過下述技術方案來解決上述技術問題的:
[0006]本發明提供了一種商品推薦方法,其特點在于,在一數據庫中記錄有多個用戶的多個用戶日志,用戶日志一一對應地記錄有用戶的歷史記錄,該商品推薦方法包括以下步驟:
[0007]S1、接收一用戶輸入的語音信息,并將這一用戶作為目標用戶;
[0008]S2、對語音信息進行語音識別轉換為一文本信息;
[0009]S3、對該文本信息進行結構化處理,以生成一結構化文本;
[0010]S4、根據結構化文本在數據庫中進行查詢,以獲取一語音查詢結果;
[0011]S5、若在該數據庫中記錄有該目標用戶的用戶日志,則將該結構化文本記錄至該目標用戶的用戶日志中,若在該數據庫中未記錄有該目標用戶的用戶日志,則在該數據庫中創建該目標用戶的用戶日志、并將該結構化文本記錄至該目標用戶的用戶日志中;
[0012]S6、根據該數據庫中記錄的該多個用戶的用戶日志對用戶進行聚類分析,以得到聚類結果,該聚類結果包括若干用戶聚類及其特征;
[0013]S7、確定該目標用戶所屬的用戶聚類;
[0014]S8、根據協同過濾推薦算法,在對應的用戶聚類中搜索該目標用戶的最近鄰用戶;
[0015]S9、根據該最近鄰用戶對商品的評分及該目標用戶的平均評分計算該目標用戶對商品的潛在評分,根據潛在評分篩選商品以生成一候選商品集;
[0016]Sltl、根據該結構化文本從該候選商品集中選取出若干商品,并將該若干商品推薦給該目標用戶。
[0017]其中用戶日志可以是用戶的歷史語音查詢日志,用戶日志中收集了用戶的歷史行為等內容,用于作為聚類分析、近鄰用戶確定等后續分析處理的基礎。
[0018]上述步驟S9可以為根據用戶日志建立用于分析用戶喜好的模型,根據收集的用戶信息的行為記錄,按照多種維度抽取出用戶的信息,建立用戶喜好或偏好的模型。在用戶喜好或偏好的基礎上,利用用戶的歷史信息較為準確地預測目標用戶對特定商品的喜歡程度,并根據這一喜好程度對目標用戶進行推薦商品。
[0019]較佳地,該步驟S2包括以下步驟:
[0020]S21、對語音信息進行音頻特征的提取;
[0021]S22、獲取以馬爾科夫模型為基礎建立的聲學模型,然后根據該聲學模型解析得到和提取的首頻特征匹配度最聞的詞序列;
[0022]S23、將該詞序列生成為該文本信息。
[0023]上述步驟中,以馬爾科夫模型為基礎建立聲學模型,并建立包含系統所能處理的詞匯集和其發音的發音模型(可包含于聲學模型中),在發音模型中,包含了聲學模型建模單元與語言模型建模單元之間的映射。根據聲學模型打分,尋找一個詞模型序列以描述輸入語音信號,從而得到對應的詞解碼序列。上述過程也可理解為,對輸入的信號,根據聲學模型及詞典,找尋最大概率輸出的詞串或詞序列。
[0024]較佳地,該步驟S3包括以下步驟:
[0025]S31、利用預設的分詞和詞性標注算法對該文本信息進行分詞和詞性標注;
[0026]S32、對分詞后的該文本信息進行同義詞替換,以進行歸一化處理;
[0027]S33、找出該文本信息所包含的第一類詞,并以預設的通配符代替該文本信息中的第一類詞,以形成該結構化文本。
[0028]較佳地,該步驟S21為:對語音信息進行模數轉換、端點檢測、預加重、加窗、自相關序列、LPC系數、和/或倒頻譜系數的計算,以提取音頻特征。其中的LPC為LinearPredictive Coding,譯為線性預測編碼,也稱為聲源編碼。
[0029]較佳地,該步驟S7為:計算用戶對商品的關注性和用戶對商品的評分的相似性,并將關注性和評分兩者線性組合以構成一聚類分析參數,然后利用該聚類分析參數對用戶進行聚類。
[0030]經過上述步驟S7的處理所形成的聚類結果,實質上是大體將對商品具有相近似的興趣點的用戶放入同一聚類中。
[0031]本發明還提供了一種商品推薦系統,其包括:
[0032]數據庫,其中記錄有多個用戶的多個用戶日志,用戶日志一一對應地記錄有用戶的歷史記錄;
[0033]輸入模塊,用于接收一用戶輸入的語音信息,并將這一用戶作為目標用戶;
[0034]語音識別模塊,用于對語音信息進行語音識別轉換為一文本信息;
[0035]結構化模塊,用于對該文本信息進行結構化處理,以生成一結構化文本;
[0036]查詢模塊,用于根據結構化文本在數據庫中進行查詢,以獲取一語音查詢結果;
[0037]日志記錄模塊,用于在該數據庫中記錄有該目標用戶的用戶日志的情況下將該結構化文本記錄至該目標用戶的用戶日志中,在該數據庫中未記錄有該目標用戶的用戶日志的情況下在該數據庫中創建該目標用戶的用戶日志、并將該結構化文本記錄至該目標用戶的用戶日志中;
[0038]聚類分析模塊,用于根據該數據庫中記錄的該多個用戶的用戶日志對用戶進行聚類分析,以得到聚類結果,該聚類結果包括若干用戶聚類及其特征;
[0039]屬類確定模塊,用于確定該目標用戶所屬的用戶聚類;
[0040]近鄰搜索模塊,用于根據協同過濾推薦算法,在對應的用戶聚類中搜索該目標用戶的最近鄰用戶;
[0041]篩選模塊,用于根據該最近鄰用戶對商品的評分及該目標用戶的平均評分計算該目標用戶對商品的潛在評分,根據潛在評分篩選商品以生成一候選商品集;
[0042]推薦模塊,用于根據該結構化文本從該候選商品集中選取出若干商品,并將該若干商品推薦給該目標用戶。
[0043]較佳地,語音識別模塊包括音頻特征提取單元、詞序列匹配單元和文本生成單元。
[0044]音頻特征提取單元用于對語音信息進行音頻特征的提取。詞序列匹配單元用于獲取以馬爾科夫模型為基礎建立的聲學模型,然后根據該聲學模型解析得到和提取的音頻特征匹配度最高的詞序列。文本生成單元用于將該詞序列生成為該文本信息。
[0045]較佳地,結構化模塊包括詞性標注單元、同義詞替換單元、通配符單元。
[0046]詞性標注單元用于利用預設的分詞和詞性標注算法對該文本信息進行分詞和詞性標注。同義詞替換單元用于對分詞后的該文本信息進行同義詞替換,以進行歸一化處理。通配符單元用于找出該文本信息所包含的第一類詞,并采用預設的通配符代替該文本信息中的第一類詞以形成該結構化文本。其中涉及的用于替換的同義詞、通配符以及其替換規則應當理解為預存在系統中。
[0047]較佳地,音頻特征提取單元用于對語音信息進行模數轉換、端點檢測、預加重、力口窗、自相關序列、LPC系數、和/或倒頻譜系數的計算,以提取音頻特征。
[0048]較佳地,屬類確定模塊用于計算用戶對商品的關注性和用戶對商品的評分的相似性,并將關注性和評分兩者線性組合以構成一聚類分析參數,然后利用該聚類分析參數對用戶進行聚類。
[0049]在符合本領域常識的基礎上,上述各優選條件,可任意組合,即得本發明各較佳實例。
[0050]本發明的積極進步效果在于:
[0051]本發明的商品推薦方法及系統避免了電子商務中用戶搜索所需商品所產生的瀏覽中的大量無關信息,大大提高了電子商務的效率,同時大大改善了用戶的使用體驗。
【專利附圖】
【附圖說明】
[0052]圖1為本發明實施例1的商品推薦方法的流程圖。
[0053]圖2為本發明實施例2的商品推薦系統的示意圖。
【具體實施方式】
[0054]下面結合附圖給出本發明較佳實施例,以詳細說明本發明的技術方案,但并不因此將本發明限制在所述的實施例范圍之中。
[0055]實施例1
[0056]本實施例的商品推薦方法,在一數據庫中記錄有多個用戶的多個用戶日志,用戶日志一一對應地記錄有用戶的歷史記錄。參考圖1所示,本實施例的商品推薦方法包括以下步驟:
[0057]S1、接收一用戶輸入的語音信息,并將這一用戶作為目標用戶;
[0058]S2、對語音信息進行語音識別轉換為一文本信息;
[0059]S3、對該文本信息進行結構化處理,以生成一結構化文本;
[0060]S4、根據結構化文本在數據庫中進行查詢,以獲取一語音查詢結果;
[0061]S5、若在該數據庫中記錄有該目標用戶的用戶日志,則將該結構化文本記錄至該目標用戶的用戶日志中,若在該數據庫中未記錄有該目標用戶的用戶日志,則在該數據庫中創建該目標用戶的用戶日志、并將該結構化文本記錄至該目標用戶的用戶日志中;
[0062]S6、根據該數據庫中記錄的該多個用戶的用戶日志對用戶進行聚類分析,以得到聚類結果,該聚類結果包括若干用戶聚類及其特征;
[0063]S7、計算用戶對商品的關注性和用戶對商品的評分的相似性,并將關注性和評分兩者線性組合以構成一聚類分析參數,然后利用該聚類分析參數對用戶進行聚類;
[0064]S8、根據協同過濾推薦算法,在對應的用戶聚類中搜索該目標用戶的最近鄰用戶;
[0065]S9、根據該最近鄰用戶對商品的評分及該目標用戶的平均評分計算該目標用戶對商品的潛在評分,根據潛在評分篩選商品以生成一候選商品集;
[0066]Sltl、根據該結構化文本從該候選商品集中選取出若干商品,并將該若干商品推薦給該目標用戶。
[0067]其中,該步驟S9為根據用戶日志建立用于分析用戶喜好的模型,根據收集的用戶信息的行為記錄,按照多種維度抽取出用戶的信息,建立用戶喜好或偏好的模型。在用戶喜好或偏好的基礎上,利用用戶的歷史信息較為準確地預測目標用戶對特定商品的喜歡程度,并根據這一喜好程度對目標用戶進行推薦商品。
[0068]具體來說步驟S2和步驟S3包括如下所述的具體步驟。
[0069]步驟S2包括以下步驟:
[0070]S21、對語音信息進行模數轉換、端點檢測、預加重、加窗、自相關序列、LPC系數、和/或倒頻譜系數的計算,以提取音頻特征;
[0071]S22、獲取以馬爾科夫模型為基礎建立的聲學模型,然后根據該聲學模型解析得到和提取的首頻特征匹配度最聞的詞序列;
[0072]S23、將該詞序列生成為該文本信息。
[0073]步驟S3包括以下步驟:
[0074]S31、利用預設的分詞和詞性標注算法對該文本信息進行分詞和詞性標注;
[0075]S32、對分詞后的該文本信息進行同義詞替換,以進行歸一化處理;
[0076]S33、找出該文本信息所包含的第一類詞,并以預設的通配符代替該文本信息中的第一類詞,以形成該結構化文本。
[0077]實施例2
[0078]如圖2所示,本實施例的商品推薦系統包括:數據庫1、輸入模塊2、語音識別模塊3、結構化模塊4、查詢模塊5、日志記錄模塊6、聚類分析模塊7、屬類確定模塊8、近鄰搜索模塊9、篩選模塊10和推薦模塊11。
[0079]數據庫I中記錄有多個用戶的多個用戶日志,用戶日志一一對應地記錄有用戶的歷史記錄。輸入模塊2用于接收一用戶輸入的語音信息,并將這一用戶作為目標用戶。語音識別模塊3用于對語音信息進行語音識別轉換為一文本信息。
[0080]結構化模塊4用于對該文本信息進行結構化處理,以生成一結構化文本。查詢模塊5用于根據結構化文本在數據庫中進行查詢,以獲取一語音查詢結果。
[0081]日志記錄模塊6用于在該數據庫中記錄有該目標用戶的用戶日志的情況下將該結構化文本記錄至該目標用戶的用戶日志中,在該數據庫中未記錄有該目標用戶的用戶日志的情況下在該數據庫中創建該目標用戶的用戶日志、并將該結構化文本記錄至該目標用戶的用戶日志中。
[0082]聚類分析模塊7用于根據該數據庫中記錄的該多個用戶的用戶日志對用戶進行聚類分析,以得到聚類結果,該聚類結果包括若干用戶聚類及其特征。屬類確定模塊8用于確定該目標用戶所屬的用戶聚類。近鄰搜索模塊9用于根據協同過濾推薦算法,在對應的用戶聚類中搜索該目標用戶的最近鄰用戶;
[0083]篩選模塊10用于根據該最近鄰用戶對商品的評分及該目標用戶的平均評分計算該目標用戶對商品的潛在評分,根據潛在評分篩選商品以生成一候選商品集。推薦模塊11用于根據該結構化文本從該候選商品集中選取出若干商品,并將該若干商品推薦給該目標用戶。
[0084]其中,語音識別模塊包括音頻特征提取單元、詞序列匹配單元和文本生成單元。而結構化模塊包括詞性標注單元、同義詞替換單元、通配符單元。
[0085]具體來說,音頻特征提取單元用于對語音信息進行模數轉換、端點檢測、預加重、加窗、自相關序列、LPC系數、和/或倒頻譜系數的計算,以提取音頻特征。
[0086]詞序列匹配單元用于獲取以馬爾科夫模型為基礎建立的聲學模型,然后根據該聲學模型解析得到和提取的音頻特征匹配度最高的詞序列。文本生成單元用于將該詞序列生成為該文本信息。
[0087]詞性標注單元用于利用預設的分詞和詞性標注算法對該文本信息進行分詞和詞性標注。同義詞替換單元用于對分詞后的該文本信息進行同義詞替換,以進行歸一化處理。通配符單元用于找出該文本信息所包含的第一類詞,并采用預設的通配符代替該文本信息中的第一類詞以形成該結構化文本。其中涉及的用于替換的同義詞、通配符以及其替換規則應當理解為預存在系統中。
[0088]屬類確定模塊用于計算用戶對商品的關注性和用戶對商品的評分的相似性,并將關注性和評分兩者線性組合以構成一聚類分析參數,然后利用該聚類分析參數對用戶進行聚類。
[0089]雖然以上描述了本發明的【具體實施方式】,但是本領域的技術人員應當理解,這些僅是舉例說明,本發明的保護范圍是由所附權利要求書限定的。本領域的技術人員在不背離本發明的原理和實質的前提下,可以對這些實施方式做出多種變更或修改,但這些變更和修改均落入本發明的保護范圍。
【權利要求】
1.一種商品推薦方法,其特征在于,在一數據庫中記錄有多個用戶的多個用戶日志,用戶日志一一對應地記錄有用戶的歷史記錄,該商品推薦方法包括以下步驟: 51、接收一用戶輸入的語音信息,并將這一用戶作為目標用戶; 52、對語音信息進行語音識別轉換為一文本信息; 53、對該文本信息進行結構化處理,以生成一結構化文本; 54、根據結構化文本在數據庫中進行查詢,以獲取一語音查詢結果; 55、若在該數據庫中記錄有該目標用戶的用戶日志,則將該結構化文本記錄至該目標用戶的用戶日志中,若在該數據庫中未記錄有該目標用戶的用戶日志,則在該數據庫中創建該目標用戶的用戶日志、并將該結構化文本記錄至該目標用戶的用戶日志中; 56、根據該數據庫中記錄的該多個用戶的用戶日志對用戶進行聚類分析,以得到聚類結果,該聚類結果包括若干用戶聚類及其特征; 57、確定該目標用戶所屬的用戶聚類; 58、根據協同過濾推薦算法,在對應的用戶聚類中搜索該目標用戶的最近鄰用戶; 59、根據該最近鄰用戶對商品的評分及該目標用戶的平均評分計算該目標用戶對商品的潛在評分,根據潛在評分篩選商品以生成一候選商品集; Sltl、根據該結構化文本從該候選商品集中選取出若干商品,并將該若干商品推薦給該目標用戶。
2.如權利要求1所述的商品推薦方法,其特征在于,該步驟S2包括以下步驟: 521、對語音信息進行音頻特征的提取; 522、獲取以馬爾科夫模型為基礎建立的聲學模型,然后根據該聲學模型解析得到和提取的首頻特征匹配度最聞的詞序列; 523、將該詞序列生成為該文本信息。
3.如權利要求1所述的商品推薦方法,其特征在于,該步驟S3包括以下步驟: 531、利用預設的分詞和詞性標注算法對該文本信息進行分詞和詞性標注; 532、對分詞后的該文本信息進行同義詞替換,以進行歸一化處理; 533、找出該文本信息所包含的第一類詞,并以預設的通配符代替該文本信息中的第一類詞,以形成該結構化文本。
4.如權利要求2所述的商品推薦方法,其特征在于,該步驟S21為:對語音信息進行模數轉換、端點檢測、預加重、加窗、自相關序列、LPC系數、和/或倒頻譜系數的計算,以提取音頻特征。
5.如權利要求1-4中任意一項所述的商品推薦方法,其特征在于,該步驟S7為:計算用戶對商品的關注性和用戶對商品的評分的相似性,并將關注性和評分兩者線性組合以構成一聚類分析參數,然后利用該聚類分析參數對用戶進行聚類。
6.—種商品推薦系統,其特征在于,包括: 數據庫,其中記錄有多個用戶的多個用戶日志,用戶日志一一對應地記錄有用戶的歷史記錄; 輸入模塊,用于接收一用戶輸入的語音信息,并將這一用戶作為目標用戶; 語音識別模塊,用于對語音信息進行語音識別轉換為一文本信息; 結構化模塊,用于對該文本信息進行結構化處理,以生成一結構化文本; 查詢模塊,用于根據結構化文本在數據庫中進行查詢,以獲取一語音查詢結果; 日志記錄模塊,用于在該數據庫中記錄有該目標用戶的用戶日志的情況下將該結構化文本記錄至該目標用戶的用戶日志中,在該數據庫中未記錄有該目標用戶的用戶日志的情況下在該數據庫中創建該目標用戶的用戶日志、并將該結構化文本記錄至該目標用戶的用戶曰志中; 聚類分析模塊,用于根據該數據庫中記錄的該多個用戶的用戶日志對用戶進行聚類分析,以得到聚類結果,該聚類結果包括若干用戶聚類及其特征; 屬類確定模塊,用于確定該目標用戶所屬的用戶聚類; 近鄰搜索模塊,用于根據協同過濾推薦算法,在對應的用戶聚類中搜索該目標用戶的最近鄰用戶; 篩選模塊,用于根據該最近鄰用戶對商品的評分及該目標用戶的平均評分計算該目標用戶對商品的潛在評分,根據潛在評分篩選商品以生成一候選商品集; 推薦模塊,用于根據該結構化文本從該候選商品集中選取出若干商品,并將該若干商品推薦給該目標用戶。
7.如權利要求6所述的商品推薦系統,其特征在于,語音識別模塊包括音頻特征提取單元、詞序列匹配單元和文本生成單元,音頻特征提取單元用于對語音信息進行音頻特征的提取,詞序列匹配單元用于獲取以馬爾科夫模型為基礎建立的聲學模型、然后根據該聲學模型解析得到和提取的音頻特征匹配度最高的詞序列,文本生成單元用于將該詞序列生成為該文本信息。
8.如權利要求6所述的商品推薦系統,其特征在于,結構化模塊包括詞性標注單元、同義詞替換單元、通配符單元,詞性標注單元用于利用預設的分詞和詞性標注算法對該文本信息進行分詞和詞性標注,同義詞替換單元用于對分詞后的該文本信息進行同義詞替換、以進行歸一化處理,通配符單元用于找出該文本信息所包含的第一類詞、并以預設的通配符代替該文本信息中的第一類詞以形成該結構化文本。
9.如權利要求7所述的商品推薦系統,其特征在于,音頻特征提取單元用于對語音信息進行模數轉換、端點檢測、預加重、加窗、自相關序列、LPC系數、和/或倒頻譜系數的計算,以提取音頻特征。
10.如權利要求6-9中任意一項所述的商品推薦系統,其特征在于,屬類確定模塊用于計算用戶對商品的關注性和用戶對商品的評分的相似性,并將關注性和評分兩者線性組合以構成一聚類分析參數,然后利用該聚類分析參數對用戶進行聚類。
【文檔編號】G06Q30/02GK104361507SQ201410668170
【公開日】2015年2月18日 申請日期:2014年11月20日 優先權日:2014年11月20日
【發明者】何玉 申請人:攜程計算機技術(上海)有限公司