一種商品排重方法和系統的制作方法
【技術領域】
[0001] 本發明涉及電子商務領域,尤其涉及一種商品排重方法和系統。
【背景技術】
[0002] 隨著互聯網技術的飛速發展以及人們消費觀念的逐漸轉變,電子商務開始迅猛發 展,電子商務平臺隨著海量商家的入駐,對千萬級商品的管理成為開放電子商務平臺的難 題,商品重復過多,消費者在前臺搜索后出現的商品太多,為消費者挑選商品造成了困難, 同時也為電子商務平臺的管理帶來了不便。
【發明內容】
[0003] 本發明所要解決的技術問題是,提供一種商品排重方法和系統,以解決由于商品 重復過多,商家、商品難以管理,商家搜索商品造成的一品多商的問題。
[0004] 本發明解決上述技術問題所采用的技術方案是提供一種商品排重方法,該方法包 括步驟:
[0005] Sl、根據商品類型和商品屬性定制排重模板;
[0006] S2、獲取商家申請商品的所述商品類型和商品屬性;
[0007] S3、根據所述商品類型調用相應模板,根據所述商品屬性計算相似度分值;
[0008] S4、將所述相似度分值與所述排重模版的排重閾值相比較;
[0009] S5、若所述分值大于所述閾值,則所述商品重復;
[0010] S6、若所述分值小于所述閾值,則新建所述商品。
[0011] 優選地,步驟Sl中,所述排重模板包括所述商品屬性的排重閾值、排重參數和所 述參數的權重,其中,所述排重參數包括品牌、重量和體積等參數。
[0012] 優選地,步驟S3中,將所述商品屬性輸入到solr (企業級搜索應用服務器)中,查 詢并打分,得到所述相似度分值。
[0013] 優選地,在所述solr中得到所述相似度分值包括步驟:
[0014] S301、讀取用戶輸入的查詢詞;
[0015] S302、所述solr對所述查詢詞進行分詞處理,將所述分詞輸入到所述solr中進行 查詢;
[0016] S303、根據相似度計算公式
[0017]
[0018] 計算所述相似度分值,其中,
[0019] q為所述查詢詞,t為所述分詞,d為所述查詢詞需匹配的模板;
[0020] tf (t in d)統計所述分詞t在所述模板中的詞頻;
[0021] boost (t,field in d)在索引過程中設置字段參數;
[0022] lengthNorm(t, feild in d)計算在索引過程存儲的分詞的數目;
[0023] S304、將得到的所述相似度分值由高到低排列并返回至商家。
[0024] 優選地,步驟S303中,所述相似度分值score (t)在(0, 1]之間,分值越高,所述查 詢詞與所述模板d匹配度越高。
[0025] 另一方面,本發明提供一種商品排重系統,所述系統包括:
[0026] 模板制定單元,用于根據商品類型和商品屬性制定排重模版;
[0027] 第一輸入單元,用于輸入商家申請的所述商品類型和商品屬性;
[0028] solr計算單元,用于根據所述商品類型調用相應模板,并根據所述商品屬性計算 相似度分值;
[0029] 判斷單元,用于判斷所述相似度分值是否超過所述排重模板中的閾值,若超過,則 所述商品重復,若未超過,則新建所述商品。
[0030] 優選地,所述排重模版包括所述商品屬性的排重閾值、排重參數和所述參數的權 重,其中,所述排重參數包括品牌、重量和體積等參數。
[0031] 優選地,所述solr計算單元將所述商品屬性輸入到solr(企業級搜索應用服務 器)中,查詢并打分,得到所述相似度分值。
[0032] 優選地,所述solr計算單元包括:
[0033] 第二輸入單元,用于將商家輸入的查詢詞輸入到所述solr中;
[0034] 分詞單元,用于對所述查詢詞進行分詞處理;
[0035] 打分單元,用于根據相似度計算公式計算所述相似度分值;
[0036] 輸出單元,用于按照得分高低排列所述相似度分值,并將查詢結果輸出至商家。
[0037] 優選地,所述打分單元中得到的所述相似度分值在(0, 1]之間,分值越高,所述查 詢詞與所述排重模板匹配度越高。
[0038] 本發明中,根據所述商品類型調用相應的排重模板,利用所述商品屬性計算相似 度分值,并將所述相似度分值與設定好的閾值相比較,確定該商品是否重復,濾除掉大部分 重復商品,防止重復商品過多、商家和商品難以管理,同時,解決了同一商品多個商家重復 申請的問題。
【附圖說明】
[0039] 圖1是本發明的一個優選實施例中商品排重方法的流程圖;
[0040]圖2是本發明的一個優選實施例中商品排重系統的結構圖。
【具體實施方式】
[0041] 以下實施例僅用于更加清楚地說明本發明的技術方案,而不能以此來限制本發明 的保護范圍。說明書后續描述為實施本發明的較佳實施方式,然所述描述乃以說明本發明 的一般原則為目的,并非用以限定本發明的范圍。本發明的保護范圍當視所附權利要求所 界定者為準。
[0042] 下面結合附圖和具體實施例對本發明做進一步詳細說明。
[0043] 如圖1所示,為本發明的一個優選實施例,公開了一種商品排重方法,該方法包含 步驟:
[0044] Sl、根據商品類型和商品屬性定制排重模板;
[0045] S2、獲取商家申請商品的商品類型和商品屬性;
[0046] S3、根據商品類型調用相應模板,根據商品屬性計算相似度分值;
[0047] S4、將相似度分值與排重模版的排重閾值相比較;
[0048] S5、若分值大于所述閾值,則商品重復;
[0049] S6、若分值小于閾值,則新建商品。
[0050] 本實施例中,根據商品類型調用相應的排重模板,利用商品屬性計算相似度分值, 并通過與設定好的閾值相比較,確定該商品是否重復,這樣可以根據對閾值的設定濾除掉 大部分重復商品,防止重復商品過多,商家和商品難以管理,解決了同一商品多個商家重復 申請的問題。
[0051] 進一步地,步驟Sl中,排重模板包括商品屬性的排重閾值、排重參數和參數的權 重,其中,排重參數包括品牌、重量和體積等參數。
[0052] 本實施例中,排重模板包括閾值和品牌、重量以及體積等參數以及這些參數所占 的權重,能夠使電子商務平臺客觀的根據商家輸入的商品類型和屬性判斷該商品與排重模 板之間的相似度。
[0053] 進一步地,步驟S3中,將商品屬性輸入到solr (企業級搜索應用服務器)中,查詢 并打分,得到相似度分值。
[0054] 進一步地,在solr中得到相似度分值包括步驟:
[0055] S301、讀取用戶輸入的查詢詞;
[0056] S302、solr對查詢詞進行分詞處理,將分詞輸入到solr中進行查詢;
[0057] S303、根據相似度計算公式
[0058]
[0059] 計算相似度分值,其中,
[0060] q為查詢詞,t為分詞,d為查詢詞需匹配的模板;
[0061] tf (t in d)統計分詞t在模板中的詞頻;
[0062] boost (t,field in d)在索引過程中設置字段參數;
[0063] lengthNorm(t, feild in d)計算在索引過程存儲的分詞的數目;
[0064] S304、將得到的相似度分值由高到低排列并返回至商家。
[0065] 更進一步地,步驟S303中,