基于維修決策樹/詞向量的故障遠程診斷平臺的制作方法
【專利摘要】本發明涉及故障遠程診斷技術領域,尤其涉及基于維修決策樹/詞向量的故障遠程診斷平臺。本發明的一種故障遠程診斷平臺,包括:故障信息接收單元,用于接收所述一故障描述語句T;故障信息分析單元,用于在所述細胞詞庫中切詞檢索所述細胞詞,并排列所述細胞詞;故障信息解決單元,用于通過決策樹模型的決策分類,給出維修解決方案。本發明的有益效果為:可以遠程并快速地識別設備的故障,準確的給出有效維修解決方案。檢測標準統一,避免由于人工判斷帶來的誤差。并且節省了大量人力物力。
【專利說明】
基于維修決策樹/詞向量的故障遠程診斷平臺
技術領域
[0001] 本發明涉及故障遠程診斷技術領域,尤其涉及基于維修決策樹/詞向量的故障遠 程診斷平臺。
【背景技術】
[0002] 傳統的設備維修行業的故障診斷使用的是"望、聞、問、切"的經驗方式。
[0003] 通常的診斷流程是:
[0004] 1.設備故障燈亮起或用戶感覺到設備有問題,比如有異響、有異味、抖動等,8卩"發 現問題進店"。
[0005] 2.在維修點通過專業的故障診斷儀檢測出故障碼和故障描述,8卩"檢測問題"。
[0006] 3.維修技師通過看故障碼和故障描述,結合多年的維修經驗,進行現場診斷并提 出解決方案,即"解決方案判斷"。
[0007] 4.備件人員開單給出具體備件號、備件名稱和備件價格,8卩"備件開單"。
[0008] 5.服務顧問開單給出工項號、工項名稱、工時和工時費,8卩"工項開單"。
[0009] 在現有技術下,用戶要針對設備故障進行診斷很多時候需要憑借自身經驗發現問 題。在確認確實存在需要通過維修解決的問題后,用戶需要將設備運送到維修點去檢測故 障,費時費力。故障檢測時,維修技師結合自身經驗得出維修方案,并且給出備件號、備件名 稱和備件價格,這個過程主觀性很強,缺乏統一標準。然后再由被檢人員和服務顧問分別給 出不同單據,費時費力。
【發明內容】
[0010] 本發明的目的在于克服現有技術的不足,提供一種故障診斷平臺,構建一個從故 障描述到詞向量分解,建立維修細胞詞庫;通過故障描述在細胞詞庫的切詞檢索,依據細胞 詞權重建立的句法規則,實現從決策過程到決策建議再到維修解決方案的維修決策樹,最 終實現故障遠程診斷,并對工時費和備件費進行估價。
[0011] 本發明解決其技術問題是采取以下技術方案實現的:一種故障遠程診斷平臺包 括:故障信息接收單元,用于接收所述一故障描述語句T;故障信息分析單元,用于在所述細 胞詞庫中切詞檢索所述細胞詞,并排列所述細胞詞;故障信息解決單元,用于通過決策樹模 型的決策分類,給出維修解決方案。
[0012] 優選地,所述故障信息分析單元包含故障描述語句分解單元,檢索單元,計算單元 以及排列單元;所述語句分解單元用于對所述一故障描述語句T在所述細胞詞庫中進行切 詞;所述檢索單元用于在所述細胞詞庫中檢索;所述計算單元用于計算每個所述細胞詞的 權重;所述排列單元用于按所述句法規則排列所述細胞詞。
[0013] 優選地,所述檢索單元進行切詞檢索。
[0014] 優選地,所述計算單元計算每個所述細胞詞的權重的方法為:S1計算每個所述細 胞詞的卡方統計量;S2取所述卡方統計量分值最高的第i個細胞詞,計算所述第i個細胞詞 在第j個故障描述中出現的次數。
[0015] 優選地,所述S1步驟所述卡方統計量分值的計算方法為:
[0016] weight = round(10X (l+lg(tfij))/(l+lg(lj)));
[0017]其中tfij為第i個細胞詞在第j個故障描述中出現的次數,1」為第j個故障描述的長 度。
[0018] 優選地,所述故障信息解決單元結合元器件測量值給出維修解決方案。
[0019] 本發明的優點和積極效果是:可以遠程并快速地識別設備的故障,準確的給出有 效維修解決方案。檢測標準統一,避免由于人工判斷帶來的誤差。并且節省了大量人力物 力。
【附圖說明】
[0020] 圖1為本發明的構建句法規則圖;
[0021 ]圖2為決策樹分析法分類模型1;
[0022]圖3為決策樹分析法分類模型2。
【具體實施方式】
[0023]下面結合附圖、通過具體實施例對本發明作進一步詳述。以下實施例只是描述性 的,不是限定性的,不能以此限定本發明的保護范圍。
[0024]本發明通過將自然語言數字化達成將自然語言理解的問題轉化為機器自學習的 問題。
[0025] (1)構建基礎語料庫
[0026] 創建基礎語料庫的方法為給定一個字符串,它的自然語言的概率是P(wl,w2, w3,…,wn),wl到wn依次是這句話的各個細胞詞。
[0027] 模型基于這樣一種假設,第n個詞的出現只與前面n-1個詞相關,而與其它任何詞 都不相關,整句的概率就是各個分詞出現概率的乘積。
[0028] 對于一個故障描述T,它的概率計算公式為:
[0029] P(T) =P(wi,W2,W3, ,Wn)
[0030] =P(W1) XP(W2 I Wl) XP(W3 I W1,W2) X …XP(Wn| W1,W2,…,Wn-1)
[0031 ]~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn I Wn-1)
[0032] (2)詞向量分解:詞向量為切分成若干個細胞詞后的語句。每個故障描述T都可表 示成n維的詞向量,T=(W1,W2, . . .,wn),其中wi到wn為各個詞向量中包含的各個細胞詞。 [0033]以汽車故障為例:
[0035] 以詞向量表示上述故障描述語句,上述故障描述語句可以用詞向量(wi,W2,w3,…, Wn)。其中,W1為凸輪軸,W2為位置,W3為氣缸,W4為正時,W5為過度。選取各個細胞詞作為特征 項,其中Wi表示第i個特征項。
[0036] 算出各個細胞詞的卡方統計量,然后在訓練集中取分值最高的第i個細胞詞作為 代表詞,從而找出與詞向量(¥1,'\¥2,'?3,一,'?〇相關性最小的細胞詞。
[0037] Wi的權重的計算公式為:
[0038] weight = round( (10 X (l+lg(tfij))/(l+lg(lj))),3);
[0039] 其中tfij為第i個詞向量在第j個故障描述中出現的次數,lj為第j個故障描述的長 度。Round函數四舍五入到指定的小數位,在上式中為小數點后第三位。
[0040] 計算權重之后的故障描述詞向量的特征表述為:
[0042] 實施例1
[0043] (1)檢索排列細胞詞:
[0044] 如圖1所示,當用戶輸入故障描述T后,首先對故障描述T進行詞向量分解將完整語 句切分成多個細胞詞的組合。然后針對各個細胞詞,在細胞詞庫中進行切詞檢索。如果檢索 到了,則計算該細胞詞的權重;如果沒有檢索到,則將此次未檢索到的細胞詞存入新增行業 細胞詞庫,再針對剩余細胞詞進行檢索,計算其概率。
[0045] 根據在細胞詞庫中檢索到的各個細胞詞并計算權重,按照權重從大到小排列細胞 。
[0046] (2)分析結果:
[0047]以汽車故障為例:
[0049]在細胞詞庫中檢索到的各個細胞詞并計算權重,按照權重從大到小排列細胞詞:
[0052] 使用判別分析法:
[0053] 故障描述T的詞向量序列為T=(wl,w2,w3, . . .,wn),故障描述T中每個細胞詞計算 權重后的序列為3=(81,82, 83,...,811)。詞向量分類匹配最大概率的計算公式為:¥ = argmaxP(S|T)〇
[0054] 按照詞向量分類匹配最大概率從高到低排列的句法規則進行分級:
[0056] (4)決策樹分析
[0057]根據上述句法規則針對細胞詞分級的結果建立決策樹。
[0058] 分類模型1
[0059] 如圖2所示,凸輪軸為一級,位置、轉換、調節為二級,傳感器、促動器、響應、正時、 排氣為三級。相對應的解決方案分別是:傳感器對應凸輪軸位置傳感器、發動機線束和發動 機控制單元,促動器對應發動機線束、發動機控制單元和凸輪軸調節器,正時對應發動機線 束、發動機控制單元、凸輪軸調節器、凸輪軸張緊器和正時鏈條,以此類推。粗箭頭指向的解 決方案表示需要更換此配件的概率遠大于更換其他細箭頭指向的配件的概率,此概率為根 據大量維修數據而預先設定入決策樹模型中的。因此,通過對故障描述"凸輪軸位置(氣缸 列2)-正時過度超前"進行詞向量分解并在細胞詞庫中進行檢索,得到凸輪軸、位置和正時 三個細胞詞,經計算細胞詞權重并根據句法規則對細胞詞進行排列得出凸輪軸位于一級, 位置位于二級,正時位于三級。經過決策樹模型的決策分類,得出最有可能的維修解決方案 為更換或維修凸輪軸張緊器。
[0060] 分類模型2
[0061] 如圖3所示,對故障描述語句"凸輪軸位置傳感器= > 傳感器不可信信號"進行詞向 量分解并在細胞詞庫中檢索,得到凸輪軸、位置、傳感器三個細胞詞。針對三個細胞詞計算 細胞詞權重并根據句法規則對細胞詞進行排列得出凸輪軸位于一級,位置位于二級,傳感 器位于三級。再結合元器件測量值,判斷需要更換的配件。首先檢查電線插頭有無接觸不 良,針頭彎曲。如果是,則需要更換電線插頭。如果否,則進入下一級決策樹,檢查凸輪軸傳 感器電壓供應是否在4.5-5.5V之間。如果是則檢查發動機控制單元的信號電壓,是否在 4.5-5.5V之間。如果否則需要更換發動機線束。以此類推,經過決策樹模型的決策分類結合 元器件測量值,給出維修解決方案。
【主權項】
1. 一種故障遠程診斷平臺,其特征在于,包括: 故障信息接收單元,用于接收所述一故障描述語句T; 故障信息分析單元,用于在所述細胞詞庫中切詞檢索所述細胞詞,并排列所述細胞詞; 故障信息解決單元,用于通過決策樹模型的決策分類,給出維修解決方案。2. 根據權利要求1所述的一種故障遠程診斷平臺,其特征在于:所述故障信息分析單元 包含故障描述語句分解單元,檢索單元,計算單元以及排列單元; 所述語句分解單元用于對所述一故障描述語句T在所述細胞詞庫中進行切詞; 所述檢索單元用于在所述細胞詞庫中檢索; 所述計算單元用于計算每個所述細胞詞的權重; 所述排列單元用于按所述句法規則排列所述細胞詞。3. 根據權利要求2所述的一種故障遠程診斷平臺,其特征在于:所述檢索單元進行切詞 檢索。4. 根據權利要求2所述的一種故障遠程診斷平臺,其特征在于,所述計算單元計算每個 所述細胞詞的權重的方法為: S1計算每個所述細胞詞的卡方統計量; S2取所述卡方統計量分值最高的第i個細胞詞,計算所述第i個細胞詞在第j個故障描 述中出現的次數。5. 根據權利要求4所述的一種故障遠程診斷平臺,其特征在于,所述S1步驟所述卡方統 計量分值的計算方法為: weight = round( 10 X(l+lg(tfij))/(l+lg(lj))); 其中tfij為第i個細胞詞在第j個故障描述中出現的次數,lj為第j個故障描述的長度。6. 根據權利要求1-5中任一權利要求所述的一種故障遠程診斷平臺,其特征在于:所述 故障信息解決單元結合元器件測量值給出維修解決方案。
【文檔編號】G05B23/02GK106054857SQ201610364696
【公開日】2016年10月26日
【申請日】2016年5月27日
【發明人】田雨農, 張祥
【申請人】大連樓蘭科技股份有限公司