一種應用于企業的異常質量事件快速響應系統的制作方法
【技術領域】
[0001] 本發明涉及一種應用于企業的異常質量事件快速響應系統,適用于對原材料質量 有嚴格要求的領域,包括食品、醫藥、汽車、電子消費品等領域,用于幫助企業快速響應突發 事件,避免異常質量事件引起經濟損失。
【背景技術】
[0002] 隨著信息量的增加和傳播速度提高,現代企業面臨信息爆炸的影響。一方面,由于 市場交易的透明化,消費者的質量的要求逐漸提高,低質量的產品會損害企業名譽和競爭 力,進而影響企業效益。另一方面,企業外部環境復雜多變,對于大型集團公司,同時經營多 家工廠,并與跨行業的多家供應商和客戶發生業務往來。當重大異常事件突然發生時,企業 不能及時做出反應,繼續使用質量不合格的原材料,或銷售質量不合格的產品,導致經濟損 失。
[0003] 企業可以通過關注政府機構公告和閱讀新聞報道等途徑來響應突發事件,這種方 法的缺點是人工工作量大,反應不夠及時,容易遺漏。
【發明內容】
[0004] 本發明的目的在于:針對現有技術中存在的上述技術問題,提供一種使用計算機 自動從信息源搜集信息,識別相關的供應商、原料和產成品,自動判斷消息類型(正面、中性 或無關、負面),可配置自動干預企業業務流程和發送消息給相關業務員的一種應用于企業 的異常質量事件快速響應系統。
[0005] 本發明是通過以下技術方案實現的: 計算機通過數據收集模塊從事件源模塊中搜索信息,數據收集模塊將收集到的信息發 送至數據分析模塊,數據分析模塊自動判斷信息類型,數據分析模塊將處理后的信息通過 ERP系統中的消息通知發與業務員; 進一步,所述事件源模塊包括政府公告和互聯網新聞。
[0006] 進一步,所述述數據收集模塊定期從事件源模塊下載內容,并通過抽取規則從ERP 系統的業務實體中抽取出相關信息。
[0007] 進一步,所述的業務實體與供應商和物料相關聯式。
[0008] 進一步,所述的數據分析模塊的文本分類步驟如下: 步驟101,從互聯網新聞網頁中獲取事件文本; 步驟102,采用中文分詞工具進行分詞,事件文本分割成詞語向量; 步驟103,將上一步分割號的詞語向量輸入分類器; 步驟104,預先標記一些文本的類別放入訓練樣本;將訓練樣本輸入分類器; 步驟105,為了不斷提高分類的準確性,將用戶反饋結果加入訓練樣本; 步驟106,調度器控制定期重新訓練分類器。
[0009] 進一步,所述的事件文本是互聯網新聞的網頁去除HTML標簽、圖片和腳本后得到 的純文本。
[0010] 進一步,使用中文分詞工具前把業務實體的名稱和標簽導入分詞工具的字典。
[0011] 進一步,所述的分類器為基于支持向量機(SVM)的分類器。
[0012]進一步,所述的述ERP系統開放若干接口以備用。
[0013] 進一步,所述的ERP系統消息通知XML格式如下: 〈message〉 〈vendor〉供應商l〈/vendor> 〈type〉公告〈/type〉 <rate>-〇.95</rate> 〈/message〉; 所述的rate為事件分級,所述事件分級的取值范圍為[-1,1],1表示最正面,-1表示最 負面 綜上所述,由于采用了上述技術方案,本發明的有益效果是: 1、 本發明的系統自動從信息源搜集信息,識別相關的供應商、原料和產成品,自動判斷 消息類型(正面、中性或無關、負面),可配置自動干預企業業務流程和發送消息給相關業務 員; 2、 本發明把機器學習技術應用于ERP系統,實現了自動挖掘異常事件并自動響應的功 能,可提尚企業對異常事件的響應能力,減少經濟損失。
【附圖說明】
[0014]本發明將通過例子并參照附圖的方式說明,其中: 圖1為xlsx存儲結構示意圖; 圖2為以人員檔案為例的xlsx存儲結構。
【具體實施方式】
[0015]本說明書中公開的所有特征,或公開的所有方法或過程中的步驟,除了互相排斥 的特征和/或步驟以外,均可以以任何方式組合。
[0016]本說明書(包括任何附加權利要求、摘要和附圖)中公開的任一特征,除非特別敘 述,均可被其他等效或具有類似目的的替代特征加以替換。即,除非特別敘述,每個特征只 是一系列等效或類似特征中的一個例子而已。
[0017]如圖1所示的,一種應用于企業的異常質量事件快速響應系統,計算機通過數據收 集模塊從事件源模塊中搜索信息,數據收集模塊將收集到的信息發送至數據分析模塊,數 據分析模塊自動判斷信息類型,數據分析模塊將處理后的信息通過ERP系統中的消息通知 發與業務員; 其中,事件源模塊包括政府公告和互聯網新聞。政府公告由有資質的政府機構,如國家 食品藥品監督管理總局、國家質量監督檢驗檢疫總局,發布到官方網站,通常針對具體行業 或企業,對企業生產經營、經銷商進貨退貨、消費者購買有重要的指導作用。互聯網新聞是 在互聯網上存儲和傳播的多媒體信息,本裝置只使用新聞的文字內容。
[0018]數據收集模塊定期從事件源下載內容,并抽取出相關的業務實體。
[0019]業務實體在ERP系統里定義,包括供應商、客戶、物料、倉庫、工廠等需要關注相關 事件的實體。本裝置關注供應商和物料,并使用兩種方式從ERP系統獲得實體信息:1、定期 掃描ERP數據庫;2、當ERP系統里新增、修改、刪除實體時,發送通知給裝置,可避免不必要的 數據庫操作和網絡傳輸。以第2種方式為例,對于支持注冊插件擴展功能的ERP系統,注冊一 個監聽實體變化事件的插件,當新增物料時向裝置發送[zsll]: <inform) 〈add〉 〈material〉物料名稱〈/material〉 〈/add〉 </inform) 建立數據庫以存儲下載的新聞、公告,數據結構如下表1: 表1,
收集政府公告的方法是定期刷新網頁并下載新的公告,如果網站提供RSS (ReallySimpleSyndication,簡易信息聚合)訂閱或RESTfulAPI( -種互聯網服務的公開 接口),則通過RSS或API直接獲取新的公告,下載成功的公告鏈接保存到數據庫,以免重復 下載。收集互聯網新聞,除了通過RSS或API獲取綜合新聞服務商的新聞列表并下載新聞,還 支持使用網絡爬蟲增強新聞收集能力。
[0020]抽取業務實體時,對公告采用XPath表達式作為規則來匹配的方式抽取。對新聞采 用關鍵詞匹配的方式抽取,存在識別錯誤的可能性。為了降低匹配錯誤的概率,由業務員給 實體打上標簽(一組關鍵詞,描述業務特征,例如"中石油"的標簽可以是:原油、汽油、柴油、 煤油)。實體和標簽的對應關系是多對多的關系,即一個實體使用多個標簽,一個標簽被多 個實體使用。利用上述特性定義: 兩個實體相關度=共同標簽數/兩個實體使用的不重復的標簽總數類似的,定義兩個 標簽的相關度。
[0021] 使用關鍵詞匹配的方式抽取新聞中的標簽。考慮到新聞可同時匹配到實體和標 簽,還需要定義實體和標簽的相關度。實體與標簽之間存在實體-標簽-實體-標簽……的傳 遞關系,定義實體到標簽的距離為傳遞關系上的最短路徑,則距離