汽車養護方向的智能溝通平臺的制作方法
【專利摘要】汽車養護方向的智能溝通平臺,屬于智能溝通領域,解決答案庫中存在問題解答的答案,但是,由于問題的表述問題,卻無法匹配該答案的問題,以此實現,問題與答案的高度匹配,加快問題匹配速度。技術要點是,包括:提取關鍵字單元,建立汽車養護問題的答案庫,將答案庫中的客戶問題分詞,并提取得到關鍵字;近似詞匹配單元,汽車專業類語料庫作近似詞匹配,得到答案庫中關鍵字的多個近似詞,并計算得到關鍵字和近似詞的相似度;問答實施單元,自動機器問答實施,對客戶問題分詞,并提取關鍵字,將提取的關鍵字匹配答案庫中的關鍵字,匹配成功時返回答案;匹配不成功時,匹配關鍵字的近似詞,并重新匹配答案庫中的關鍵字。
【專利說明】
汽車養護方向的智能溝通平臺
技術領域
[0001] 本發明屬于智能溝通領域,涉及汽車養護問題的自動機器問答溝通方法的建立和 應用。
【背景技術】
[0002] 近年來,隨著汽車保有量的日益增多,汽車故障維修咨詢的需求也越來越大,傳統 汽車4S店由于其增長量遠遠不及汽車的增長量,導致服務不能到位,而且一些4S店存在不 誠信的行為,因此弊端日益凸顯。
[0003] 另外,汽車養護方向問題智能人機溝通技術的出現,使得客戶問題可以被收集,組 織技術人員對客戶問題進行解答,形成對應于客戶問題的答案庫;經過大量的調研,對問題 中的關鍵字進行統計,客戶問題往往集中于幾個方面,大部分的問題,可以在答案庫中尋求 答案,為了可以快速和精確的尋找問題答案,需要對答案庫進行分詞和提取關鍵字;而往往 由于語言系統的龐大,客戶問題與答案庫中的關鍵字不對應,或者是用答案庫中關鍵字的 近似詞表示,這會降低答案的準確率,存在這樣的情況,答案庫中存在問題解答的答案,但 是,由于問題的表述問題,卻無法匹配該答案。
【發明內容】
[0004] 為了解決上述答案庫中存在問題解答的答案,但是,由于問題的表述問題,卻無法 匹配該答案的問題,本發明提供了一種汽車養護方向的智能溝通平臺,以此實現,問題與答 案的高度匹配,加快問題匹配速度。
[0005] 為了實現上述目的,本發明技術方案的要點是:
[0006] -種汽車養護方向的智能溝通平臺,
[0007] 有益效果:本發明可及時有效地回答車主關于汽車養護方法的問題,并可擴展到 故障及車輛保險方面的問題的回答,問題匹配時,匹配速度快,精度高,還可以在無法匹配 的情況下,進行關鍵詞的近似詞匹配,增加了問題回答的范圍,避免了由于客戶表述問題差 異,導致的具有答案,卻無法匹配的問題。
【附圖說明】
[0008] 圖1是實施例中自動機器問答實施步驟的流程圖。
【具體實施方式】
[0009] 實施例1: 一種汽車養護方向的智能溝通方法,包括如下步驟:
[0010] Sl.建立汽車養護問題的答案庫,將答案庫中的客戶問題分詞,并提取得到關鍵 字;
[0011] S2.汽車專業類語料庫作近似詞匹配,得到答案庫中關鍵字的多個近似詞,并計算 得到關鍵字和近似詞的相似度;
[0012] 其中,優選汽車專業類語料庫作近似詞匹配的步驟是:通過神經網絡的詞向量計 算模型,對汽車專業類語料庫做近似詞匹配,得到答案庫中關鍵字的多個近似詞,并通過余 弦相似度方法得到關鍵字和相似詞的相似度,將相似度最大的詞作為相似詞保留。
[0013] S3.自動機器問答實施,對客戶問題分詞,并提取關鍵字,將提取的關鍵字匹配答 案庫中的關鍵字,匹配成功時返回答案;匹配不成功時,匹配關鍵字的近似詞,并重新匹配 答案庫中的關鍵字。
[0014]其中,優選自動機器問答實施的步驟是:
[0015] 第一步:得到客戶問題,用基于隱馬定理的常規語言自然方法將客戶問題分詞;
[0016] 第二步:通過TF-IDF方法得到分詞里的關鍵字;
[0017]第三步:將客戶問題里的關鍵字與答案庫的關鍵字匹配,匹配成功則直接得到解 決問題的答案;
[0018] 第四步:第三步沒有匹配成功,則通過神經網絡的詞向量計算模型得到客戶問題 里的關鍵字的近似詞再重新匹配答案庫關鍵字,直到得到解決問題的答案。
[0019] 作為本實施例優選技術方案,所述客戶問題分詞,并提取關鍵字的方法是:
[0020] 第一步:計算詞頻;
[0021] 第二步:計算逆文檔頻率;
[0022] 第三步:計算TF-IDF。
[0023]該上述步驟的具體實現是:
[0024] 所述的計算詞頻的步驟是:
[0025] -個客戶問題出現了(&1,&2,^^)共!11個詞,每個詞在客戶問題中出現的頻率分別 為(111,112,"_111 11),則第:[(1<:[<111)個詞的詞頻1?為
(3. 2. 1)
[0026]
[0027] 所述的計算逆文檔頻率的步驟是:
[0028] 通過汽車專業類語料庫模擬語言使用環境,汽車專業類語料庫中的文檔總數為q, 包含所述的第i個詞的文檔總數為P,則詞ai的逆文檔頻率IDF為:
Γ ? (3. 2. 2)
[0029]
[0030] 所述計算TF-IDF的步驟是:
[0031] TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)
[0032] 將TF-IDF算法,用于分詞和關鍵字提取,并協同于近似詞匹配,可以在加速匹配的 同時,可以增加問題匹配的寬度;使得問題被解答的可能性增加,且避免了提高速度,卻犧 牲了準確度的缺陷。
[0033] 實施例2: -種汽車養護方向的智能溝通裝置,包括:
[0034] 答案庫建立模塊,建立汽車養護問題的答案庫,將答案庫中的客戶問題分詞,并提 取得到關鍵字;
[0035] 近似詞匹配模塊,汽車專業類語料庫作近似詞匹配,得到答案庫中關鍵字的多個 近似詞,并計算得到關鍵字和近似詞的相似度;
[0036] 自動機器問答實施模塊,自動機器問答實施,對客戶問題分詞,并提取關鍵字,將 提取的關鍵字匹配答案庫中的關鍵字,匹配成功時返回答案;匹配不成功時,匹配關鍵字的 近似詞,并重新匹配答案庫中的關鍵字。
[0037] 該裝置與實施例1中任意方法技術方案相對應,該裝置可用于執行實施例1中所述 的任意種汽車養護方向的智能溝通平臺的技術方案。
[0038] 實施例3:本實施例記載了實施例1中的方法和實施例2中的裝置技術方案的形成 路線:
[0039] 3.1.大數據統計結果
[0040]在建立上述方法和裝置或者建立系統之前,我們針對幾千名奧迪車主的咨詢問題 做了大量細致的大數據分類研究,發現車主所提問題主要集中在表1所示的幾個方面:
[0042] 表1
[0043] 在上述提問中,76%的問題都可以通過技術經理和專門的車險行業專家所建立的 答案庫得到答案。
[0044] 3.2.建立答案庫
[0045] 通過對上千名車主問題的提取,我們組成了專門的解答團隊做解答,形成了答案 庫,并通過TF-IDF算法提取了問題的關鍵詞,以方便下一階段機器自主回答技術的實現。如 表2所示:
[0047] TF-IDF算法步驟如下:
[0048]第一步:計算詞頻
[0049] 假設一個車主問題出現了(ai,a2,一am)共m個詞,每個詞在車主問題中出現的頻率 分別為(11 1,112,"_1〇,則第1(1<<111)個詞的詞頻了?為
(3. 2. 1)
[0050]
[00511第二步:計算逆文檔頻率
[0052]第二步中,我們通過一個汽車相關的語料庫,來模擬了語言的使用環境。
[0053]假設,語料庫中的文檔總數為q,包含該詞的文檔總數為p,則詞的逆文檔頻率 IDF為
[0054] (3. 2. 2)
[0055] 通過3.2.2式可知,如果一個詞越常見,那么分母就越大,逆文檔頻率IDF(ai)就越 接近于0。
[0056] 第三步:計算TF-IDF
[0057] TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)
[0058] 通過3.2.3式可以看到,TF-IDF與一個詞在文檔中的出現次數成正比,與該詞在整 個語言中的出現次數成反比。所以,自動提取關鍵詞的算法就是計算出文檔的每個詞的TF-IDF值,然后按降序排列,取排在最前面的幾個詞做為關鍵詞。
[0059] 3.3.語料庫匹配近似詞
[0060]通過神經網絡的詞向量計算模型,我們對汽車專業類語料庫做了近似詞匹配,得 到了答案庫中關鍵字的多個近似詞,并通過余弦相似度方法得到了關鍵字和相似詞的相似 度,將相似度最大的詞作為相似詞保留。如胎壓警告可以得到如表3所示的近似詞表,我們 保留"胎壓異常"作為"胎壓警告"的相似詞
[0062] 表 3
[0063] 3.4.自動機器問答系統實施步驟
[0064] 第一步:得到客戶問題后,用基于隱馬定理的常規語言自然方法將客戶問題分詞; [0065]第二步:通過TF-IDF方法得到分詞里的關鍵詞;
[0066]第三步:將客戶問題里的關鍵詞與答案庫的關鍵字匹配,如果匹配成功則直接得 到解決方案;
[0067]第四步:如果第三步沒有匹配成功,則通過神經網絡的詞向量計算模型得到關鍵 詞的近似詞再重新匹配答案庫關鍵字,得到解決方案。
[0068] 具體流程見圖1。針對實施例1和2的技術方案,基于大數據的統計結果,將傳統的 面對面問答模式由線下發展到線上,解決了 76%的客戶所提出的問題,滿足了車主的咨詢 需求,而且以機器回答為主的方式,也節省了車主的時間,同時減少了車主的經濟支出。
[0069] 實施例4: 一種汽車養護方向的智能溝通系統,包括:
[0070] 答案庫,所述答案庫具有汽車養護問題,答案庫中的客戶問題被分詞,并提取得到 客戶問題的關鍵字;
[0071 ]汽車專業類語料庫,為答案庫中關鍵字提供多個近似詞,并計算得到關鍵字和近 似詞的相似度;
[0072] 匹配庫,用于自動機器問答實施,對客戶提出的問題分詞,并提取關鍵字,將提取 的關鍵字匹配答案庫中的關鍵字,匹配成功時返回答案;匹配不成功時,匹配關鍵字的近似 詞,并重新匹配答案庫中的關鍵字。
[0073] 該系統與實施例1中任意方法技術方案相對應,該裝置可用于執行實施例1中所述 的任意種汽車養護方向的智能溝通平臺的技術方案。
[0074]實施例5:-種TF-IDF算法在汽車養護方向的智能溝通系統或汽車養護方向的智 能溝通平臺中的應用。其應用過程,詳見實施例1-4,另,本實施例還公開了近似詞匹配和 TF-IDF算法協同在汽車養護方向的智能溝通系統或汽車養護方向的智能溝通平臺中的應 用。
[0075] 實施例6:-種汽車養護方向的智能溝通平臺,包括
[0076] 提取關鍵字單元,建立汽車養護問題的答案庫,將答案庫中的客戶問題分詞,并提 取得到關鍵字;
[0077]近似詞匹配單元,汽車專業類語料庫作近似詞匹配,得到答案庫中關鍵字的多個 近似詞,并計算得到關鍵字和近似詞的相似度;
[0078] 問答實施單元,自動機器問答實施,對客戶問題分詞,并提取關鍵字,將提取的關 鍵字匹配答案庫中的關鍵字,匹配成功時返回答案;匹配不成功時,匹配關鍵字的近似詞, 并重新匹配答案庫中的關鍵字。
[0079] 本實施例所述的平臺,為計算機實現實施例1-5中所述的方法。
[0080] 所述提取關鍵字單元中,客戶問題分詞,并提取關鍵字的方法是:
[0081] 第一步:計算詞頻;
[0082] 第二步:計算逆文檔頻率;
[0083] 第三步:計算TF-IDF。
[0084]所述的計算詞頻的步驟是:
[0085] -個客戶問題出現了(&1,&2,^^)共!11個詞,每個詞在客戶問題中出現的頻率分別 為(111,112,"_111 11),則第:[(1<:[<111)個詞的詞頻1?為
(3.2.1):
[0086]
[0087] 所述的計算逆文檔頻率的步驟是:
[0088] 通過汽車專業類語料庫模擬語言使用環境,汽車專業類語料庫中的文檔總數為q, 包含所述的第i個詞的文檔總數為P,則詞ai的逆文檔頻率IDF為:
(3.2.2)
[0089]
[0090] 所述計算TF-IDF的步驟是:
[0091] TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)
[0092] 所述近似詞匹配單元,汽車專業類語料庫作近似詞匹配的步驟是:通過神經網絡 的詞向量計算模型,對汽車專業類語料庫做近似詞匹配,得到答案庫中關鍵字的多個近似 詞,并通過余弦相似度方法得到關鍵字和相似詞的相似度,將相似度最大的詞作為相似詞 保留。
[0093] 所述問答實施單元,自動機器問答實施的步驟是:
[0094] 第一步:得到客戶問題,用基于隱馬定理的常規語言自然方法將客戶問題分詞; [0095]第二步:通過TF-IDF方法得到分詞里的關鍵字;
[0096]第三步:將客戶問題里的關鍵字與答案庫的關鍵字匹配,匹配成功則直接得到解 決問題的答案;
[0097]第四步:第三步沒有匹配成功,則通過神經網絡的詞向量計算模型得到客戶問題 里的關鍵字的近似詞再重新匹配答案庫關鍵字,直到得到解決問題的答案。
[0098]以上所述,僅為本發明創造較佳的【具體實施方式】,但本發明創造的保護范圍并不 局限于此,任何熟悉本技術領域的技術人員在本發明創造披露的技術范圍內,根據本發明 創造的技術方案及其發明構思加以等同替換或改變,都應涵蓋在本發明創造的保護范圍之 內。
【主權項】
1. 一種汽車養護方向的智能溝通平臺,其特征在于:包括 提取關鍵字單元,建立汽車養護問題的答案庫,將答案庫中的客戶問題分詞,并提取得 到關鍵字; 近似詞匹配單元,汽車專業類語料庫作近似詞匹配,得到答案庫中關鍵字的多個近似 詞,并計算得到關鍵字和近似詞的相似度; 問答實施單元,自動機器問答實施,對客戶問題分詞,并提取關鍵字,將提取的關鍵字 匹配答案庫中的關鍵字,匹配成功時返回答案;匹配不成功時,匹配關鍵字的近似詞,并重 新匹配答案庫中的關鍵字。2. 如權利要求1所述的汽車養護方向的智能溝通平臺,其特征在于,所述提取關鍵字單 元中,客戶問題分詞,并提取關鍵字的方法是: 第一步:計算詞頻; 第二步:計算逆文檔頻率; 第三步:計算TF-IDF。3. 如權利要求2所述的汽車養護方向的智能溝通平臺,其特征在于, 所述的計算詞頻的步驟是: 一個客戶問題出現了(ai,a2, 共m個詞,每個詞在客戶問題中出現的頻率分別為 (ni,n2,"_nm),則第i(l<i<m)個詞的詞頻TF為所述的計算逆文檔頻率的步驟是: 通過汽車專業類語料庫模擬語言使用環境,汽車專業類語料庫中的文檔總數為q,包含 所述的第i個詞的文檔總數為P,則詞ai的逆文檔頻率IDF為:所述計算TF-IDF的步驟是: TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)。4. 如權利要求1或4所述的汽車養護方向的智能溝通平臺,其特征在于,所述近似詞匹 配單元,汽車專業類語料庫作近似詞匹配的步驟是:通過神經網絡的詞向量計算模型,對汽 車專業類語料庫做近似詞匹配,得到答案庫中關鍵字的多個近似詞,并通過余弦相似度方 法得到關鍵字和相似詞的相似度,將相似度最大的詞作為相似詞保留。5. 如權利要求1或4所述的汽車養護方向的智能溝通平臺,其特征在于,所述問答實施 單元,自動機器問答實施的步驟是: 第一步:得到客戶問題,用基于隱馬定理的常規語言自然方法將客戶問題分詞; 第二步:通過TF-IDF方法得到分詞里的關鍵字; 第三步:將客戶問題里的關鍵字與答案庫的關鍵字匹配,匹配成功則直接得到解決問 題的答案; 第四步:第三步沒有匹配成功,則通過神經網絡的詞向量計算模型得到客戶問題里的 關鍵字的近似詞再重新匹配答案庫關鍵字,直到得到解決問題的答案。
【文檔編號】G06Q10/00GK106056220SQ201610363331
【公開日】2016年10月26日
【申請日】2016年5月27日
【發明人】田雨農, 董向前
【申請人】大連樓蘭科技股份有限公司