一種支持復雜企業環境的信用數據管理系統及方法
【專利摘要】本發明涉及一種支持復雜企業環境的信用數據管理系統及方法,包括:用戶申請模塊、數據獲取模塊、數據處理模塊、數據倉庫、數據分析模型管理模塊、分析評價模塊和信用管理模塊。本發明解決了復雜企業環境下企業數據的集成、標準化、管理和分析的問題,對分散的和不規范的企業信息進行處理和轉換、讓數據更為規范、并集成到數據倉庫中為企業的信用評價提供支撐。同時,結合對外部數據的處理,提出一種更適合信用數據管理系統來實現的企業信用數據分析和評價的方法,提升對企業信息分析的效率和評價的準確性。
【專利說明】一種支持復雜企業環境的信用數據管理系統及方法
【技術領域】
[0001] 本發明涉及一種面向復雜企業環境下企業信用數據的集成、管理和分析的系統與 方法,屬于計算機軟件【技術領域】。
【背景技術】
[0002] 隨著信息技術的發展和企業信息化進程的推進,很多企業都采用信息系統來實現 對企業的經營和管理,企業的數據也從傳統的紙質文件逐漸轉變為電腦里的數據,大部分 都處于不同位置的信息系統里。但是,由于企業所采用的信息系統是由不同的廠家開發的, 導致信息系統的運行平臺多種多樣、所采用的數據庫也不相同。同時,由于企業的類型復 雜、規模大小也不同,企業信息系統所存儲數據的內容和格式也不相同,既有結構化數據, 也有非結構化數據。正是因為企業的業務信息系統所采用的異構數據庫和數據庫里存儲的 大量異構數據,而且沒有統一的標準,才會導致企業間信息難以對接和整合、對數據的利用 率不高。
[0003] 企業信息系統里大量的經營和管理數據反映了企業的真實經營情況,這些信息可 以為企業的信用評價提供數據支撐。但是,由于企業信息系統里存儲的數據的異構性以及 數據安全性的考慮,在數據對接交換過程中面臨很多問題。如何將企業處于不同運行平臺 上信息系統里的異構數據與信用管理系統進行對接實現數據的集成,這是一個很有意義但 又很有難度的一件事情。目前,雖然市面上有一些數據集成的軟件,但都需要在企業的信息 系統服務器上和信用管理系統上安裝客戶端,一般的企業出于安全的考慮都不愿意這樣來 操作。同時,從外面集成來的企業數據格式多樣、數據不規范,需要經過處理和轉換,變為適 合信用管理系統的數據才能進行使用。
[0004] 目前,一般企業的信用評價都是采用線下或者與線上結合的方式,對用戶提供的 紙質材料進行審核、分析和評價。同時,也有的機構采用信息系統來實現評價審批的流程, 而通過信用管理系統對外部企業數據進行分析的很少,并且沒有針對外部數據的特點來對 數據進行處理和轉換,使得通過信息系統對企業數據分析的效率低、評價的準確性不高,尤 其對于非結構化數據的分析和評價更不準確。所以說,通過信息系統來實現對企業數據的 分析和評價的關鍵是外部企業數據的獲取和轉換處理的方法,以及一個更適合信息系統 的、更符合企業特點的信用數據分析和評價的方法。
【發明內容】
[0005] 本發明技術解決問題:克服現有技術的不足,提供一種支持復雜企業環境的信用 數據管理系統及方法,解決復雜企業環境下企業數據的集成、標準化、管理和分析的問題, 對分散的和不規范的企業數據進行處理和轉換、讓數據更為規范、并集成到數據倉庫中為 企業的信用評價提供支撐。同時,結合對外部數據的處理,提出一種更適合信用數據管理 系統來實現的企業信用數據分析和評價的方法,提升對企業數據分析的效率和評價的準確 性。
[0006] 本發明所采用的技術方案是:以數據集成、數據倉庫和數據分析等相關技術為基 礎的支持復雜企業環境的信用數據管理系統由用戶申請模塊、數據獲取模塊、數據處理模 塊、數據倉庫、數據分析模型管理模塊、分析評價模塊和信用管理模塊等組成,本發明的系 統也可作為對一般信用管理系統的補充。
[0007] (1)用戶申請模塊:提供給企業用戶通過網絡來發起評價的申請、填寫企業的資 料、上傳有關的證明附件到系統中、指定數據源信息,該模塊是信用數據管理系統獲取外部 企業數據的一個方式之一。
[0008] (2)數據獲取模塊:實現從不同企業內部的信息系統獲取企業信用數據的功能, 針對不同企業提供的數據交換方式,通過數據接口與之對接,檢查并獲取企業的數據。
[0009] (3)數據處理模塊:實現對外部企業獲取過來數據的檢查清洗、排序過濾、數據格 式轉換和數據存儲功能,提高數據的質量,以保證數據的正確性、可用性和規范性。
[0010] (4)數據倉庫:將處理過的外部企業數據通過多維建模的方式建立企業信用數據 的多維數據結構,并將數據存儲到數據倉庫中,得到企業數據的一個全局視圖,為后續的數 據分析提供支持。
[0011] (5)數據分析模型管理模塊:結合處理的數據實現對企業信用數據分析的指標、 分析模型的定義和管理的功能,根據分析人員對企業的初步評價來調整和優化分析模型。 數據分析模型直接影響到從外部企業獲取和處理的數據內容,并影響到分析評價的結果。
[0012] (6)分析評價模塊:結合數據分析模型和數據分析引擎對外部企業的信用數據進 行分析和評價,給出企業的得分和對應的信用等級,包括對結構化數據和非結構化數據的 分析和評價。
[0013] (7)信用管理模塊:實現對信用評價過程的管理、審核流程的管理、評價結果的管 理和報表等服務。
[0014] 所述用戶申請模塊的實現過程如下:
[0015] (1)企業用戶登錄信用數據管理系統的網站,通過認證之后進入系統的用戶申請 模塊;
[0016] (2)用戶發起認證的請求并填寫企業的結構化的數據信息,結合數據分析模型的 不同企業上傳的信息也不同;
[0017] (3)企業用戶通過系統上傳非結構化數據信息,包括一些掃描的圖片、文檔和視頻 等附件;
[0018] (4)指定用于數據交換的數據源信息,可以是數據庫的視圖(View)、XML文件或者 Excel文件,提供給數據獲取模塊使用;
[0019] (5)提交信息、等待信息審核。
[0020] 所述數據獲取模塊的實現過程如下:
[0021] (1)根據外部企業提供的數據源訪問信息確定數據源的類型并調用支持該類型的 數據訪問接口;
[0022] (2)根據選擇的是數據庫視圖、XML文件或者excel文件接口類型,連接到外部的 數據源中;
[0023] (3)獲取外部企業提供的數據信息,并對數據進行檢查、保證數據的可用性和一致 性;
[0024] (4)數據獲取過程中通過安全控制和傳輸監控功能監控數據的獲取過程。
[0025] 所述數據處理模塊的實現過程如下:
[0026] (1)對數據獲取模塊發送過來的數據進行檢查和清洗,檢測數據中存在的錯誤和 不一致,提高數據的質量。
[0027] (2)對數據進行排序過濾、過濾掉不需要的數據,并提取有用的信息;
[0028] (3)對清洗過的不同格式的數據進行轉換,變為符合自己需要的格式;
[0029] (4)結合元數據和編碼規范對數據進行梳理,讓數據更加規范化;
[0030] (5)調用數據存儲功能將數據存儲到數據倉庫中,形成企業信息的多維數據庫。
[0031] 所述的數據倉庫將存儲從外部企業集成和經過處理的數據,并結合0LAP服務為 數據分析提供支持。通過數據倉庫的監控功能對數據倉庫的運行進行監測,保證數據服務 的質量。
[0032] 所述數據分析模型管理模塊的實現過程如下:
[0033] (1)根據企業評價的內容來添加和定義企業信用數據分析的指標,結合企業多維 數據的建模,采用二級指標體系來組織數據,每個一級指標相當于企業信息的一個維度,指 標的定義包括結構化數據類型和非結構化數據類型的指標;
[0034] (2)如果是結構化數據指標的定義,需要給出結構化數據的取值和得分的對應關 系,以實現根據外部企業數據自動計算和分析的功能;
[0035] (3)如果是非結構化數據指標的定義,需要給出非結構化數據的影響因素,為了后 續的數據分析提供支持,以實現更準確的非結構化數據的分析;
[0036] (4)定義外部企業數據分析的模型,選取一級和二級指標添加到模型中;
[0037] (5)采用歸一化方法或者層次分析法來計算權重系數。
[0038] 所述分析評價模塊的實現過程如下:
[0039] (1)選擇對外部企業信用數據評價所采用的分析模型;
[0040] (2)系統自動分析和計算出結構化數據指標的得分,然后人工去校驗得分的情況, 如果有必要可以進行修改;
[0041] (3)對非結構化數據指標的分析,首先選擇該非結構化數據指標采用哪些影響因 素來進行評價,然后系統通過對數據庫中歷史數據的分析和當前用戶選擇的結果進行分 析,計算出該非結構化數據指標的參考得分,參考這個得分給出該指標實際的得分;
[0042] (4)計算出對企業信用數據分析的總得分,根據數據庫中信用等級和得分的對應 關系確定企業所對應的信用等級。
[0043] 所述信用管理模塊主要用來對評價的過程和評價結果進行管理,信用分析管理部 門用于實現內部的審核流程、生成信用評價報告、將評價結果推送給企業,企業用戶可查看 信用信息審核和評價的結果。
[0044] 面向復雜企業環境下的信用數據管理和分析方法實現步驟如下:
[0045] (1)用戶登陸信用數據管理系統發起評價的申請,填寫企業的結構化信用數據,上 傳相關的非結構化的附件,指定本企業信用數據源的類型、位置和安全訪問信息,提交申請 之后等待信用管理部門的處理;
[0046] (2)用戶提交申請之后,系統會自動調用數據獲取模塊,連接到外部企業的數據源 來獲取數據;
[0047] (3)獲取數據的同時將調用數據處理模塊,對外部集成過來的數據進行檢查和清 洗;
[0048] (4)調用數據轉換功能,結合元數據等信息將獲取的數據轉換為數據倉庫里統一 格式的數據;
[0049] (5)處理過的數據將存儲到多維數據倉庫中,為后面的數據分析服務做準備;
[0050] (6)信用數據分析部門的人員接收到用戶的申請之后,將根據企業類型、規模等特 征選擇用于數據分析和評價的模型,如果沒有適合的模型將轉入模型定義流程;
[0051] (7)數據分析模型的定義首先選擇用于企業數據分析的指標,并根據指標的多少 選擇不同的權重系數的計算方法來計算獲得模型的權重系數;
[0052] (8)選擇好數據分析模型之后,對企業提供的信用數據進行分析,包括結構化數 據指標和非結構化數據指標的分析和評價,結構化數據指標的得分由系統自動分析計算獲 得;
[0053] (9)而非結構化數據指標的分析將會結合用戶對影響因素的選擇情況以及數據庫 內歷史數據的分析來進行。最后計算出企業總的得分和對應的信用等級;
[0054] (10)通過信用管理模塊對分析結果進行審核,生成信用評價報告,并將結果推送 給企業用戶。
[0055] 本發明與現有技術相比的優點在于:
[0056] (1)實現從外部企業的信息系統或者數據源來獲取企業的信用數據信息,數據的 真實性和可靠性更高;
[0057] (2)解決了復雜企業環境下企業信用數據分散和不規范的問題,對企業數據進行 集成、轉換和處理讓數據標準化,并構建企業多維數據庫。有利于通過信息系統來進行分 析,提高了信息處理和分析的效率;
[0058] (3)結合對外部數據的處理和轉換,提出一種更適合信用數據管理系統來實現的 企業信用數據分析和評價的方法,提升對企業信用數據分析和評價的準確性。
【專利附圖】
【附圖說明】
[0059] 圖1為本發明的面向復雜企業環境下的信用數據管理系統結構圖;
[0060] 圖2為本發明中用戶申請模塊的實現過程圖;
[0061] 圖3為本發明中數據獲取模塊的實現過程圖;
[0062] 圖4為本發明中數據處理模塊的實現過程圖;
[0063] 圖5為本發明中數據分析模型管理模塊的實現過程圖;
[0064] 圖6為本發明中權重系數的計算流程圖;
[0065] 圖7為本發明中分析評價模塊的實現方式和過程圖;
[0066] 圖8為本發明中非結構化數據指標分析的實現過程圖;
[0067] 圖9為采用本發明方法的供應鏈會員信用管理系統的企業用戶界面;
[0068] 圖10為采用本發明方法的供應鏈會員信用管理系統的管理員界面。
【具體實施方式】
[0069] 下面將結合附圖對本發明做進一步說明。
[0070] 本發明的面向復雜企業環境下的信用數據管理系統及方法可以作為一個獨立的 系統,也可以作為其它信用管理系統的補充、對系統功能的改進和擴充。
[0071] 本發明的系統功能結構如圖1所示,主要由用戶申請模塊、數據獲取模塊、數據處 理模塊、數據倉庫、數據分析模型管理模塊、分析評價模塊和信用管理模塊組成。其中用戶 申請模塊主要起到獲取外部數據源的信息;數據獲取模塊和數據處理模塊實現了對外部數 據的獲取、轉換、處理和存儲服務;數據分析模型管理模塊、分析評價模塊實現對處理過的 外部企業數據的分析。
[0072] 1.如圖2所示,用戶申請模塊的實現方式和過程,企業用戶可以通過這個模塊來 發起信用評價的申請,并提交企業的信用數據。
[0073] 用戶通過認證登錄系統之后,進入申請模塊發起申請,并填寫企業的結構化數據 信息,主要是企業的基本信息、詳細信息,包括獲利能力、償債能力、履約能力和經營管理等 類型的信息,這些數據項將根據企業類型和規模的不同、結合數據分析模型的要求由系統 自動生成,不同企業提交的數據也可能不同。
[0074] 然后,企業需要上傳非結構化的數據信息,主要包括企業的各種資質證明、合同掃 描件等信息,采用PDF和JPG等不可隨意編輯的格式,保證數據不會被隨意篡改。上傳附件 的時候需要對附件的關鍵數據項進行描述,填寫每個附件的關鍵信息,用于后面的管理和 分析。
[0075] 接下來需要指定用于數據交換的數據源信息,這些信息是從企業信息系統的數據 庫里經過整理后直接與外界進行交換的,與數據庫的信息保持一致,并且都處于及時更新 的狀態。數據源的數據與上面申請時填寫的結構化數據的區別在于,數據源的數據為實時 更新的數據、可以轉換為數據倉庫里的結構化數據,讓信用數據管理系統能夠及時獲得企 業的最新信息,兩者是相輔相成的;出于數據安全性和方便性的考慮,采用數據庫視圖、XML 文件或者Excel文件的方式進行交換。企業用戶需要在申請的時候指定這些數據源的訪問 方式,包括訪問地址、訪問權限信息,還有數據源的描述信息、如表名、字段名等。這些信息 將提供給數據獲取模塊來進行數據的集成。
[0076] 最后,填好所有的信息后進行提交、等待信用分析部門的處理。
[0077] 2.如圖3所示,數據獲取模塊的實現方式和結構為,信用分析人員對企業的信用 數據進行分析的時候將首先觸發數據獲取模塊從企業外部的數據源獲取數據。
[0078] 根據數據源的類型采用不同的數據訪問接口,這里有三種方式,基于數據庫視圖 的方式、XML文件的方式、Excel的方式。企業提供的數據源里數據的結構和數據內容將根 據信用管理部門要求的格式來定義并整理數據,方便后面的數據獲取。
[0079] ?數據庫視圖的方式更為方便,可及時獲得企業最新最原始的數據信息。基于數 據庫視圖的訪問接口將通過訪問的用戶名和密碼直接訪問外部企業的數據視圖來獲取數 據。這種方式可保證企業數據庫的安全,并可以獲得企業最真實的數據。
[0080] ?對于XML文件方式的數據源,將采用XML解析器對XML文件進行分析和讀取。一 般企業根據信用管理部門的要求將自己信息系統內的數據經過整理后轉為XML格式與外 界進行交換。
[0081] ?對于Excel文件格式的數據,通過Excel解析器來實現數據的讀取,這種方式的 數據雖然方便通過Office打開進行瀏覽,但是數據格式與一般的數據庫不同,通過數據處 理模塊轉換的工作量將會大一些。
[0082] 連接到外部企業的數據源獲取數據的同時,需要對數據進行檢查,保證數據的一 致性,所連接的外部數據源的數據與企業用戶通過用戶申請模塊填寫的數據源描述信息一 致,并且與信用管理部門規定的數據結構一樣,對不符合的數據源信息及時給出提示并記 錄到系統日志當中。
[0083] 數據獲取的過程中通過安全控制功能實現對外部數據源的連接和數據的安全進 行控制;通過數據傳輸監控功能實現對數據獲取的全過程實時的監測,并記錄到系統日志 當中。
[0084] 3.如圖4所示,數據處理模塊的實現方式和結構為,對外部企業獲取的數據進行 處理變為可用的數據格式存儲到多維數據倉庫中,處理的數據主要是結構化的數據和非結 構化數據的結構化描述信息。處理的過程一般包括數據檢查清洗、排序過濾、數據轉換、數 據存儲等步驟。
[0085] (1)對外部企業數據檢查清洗的目的是找出數據存在的錯誤和不一致的地方,提 高數據的質量和可用性,一般的數據檢查和清洗包括對殘缺數據、錯誤數據和重復數據的 處理:
[0086] ①檢查殘缺的數據
[0087] 檢查數據庫表里主表的字段,通過程序判斷是否有關鍵的字段內容為空值NULL 的情況,對這些殘缺的數據進行登記,提供給管理員來處理。
[0088] 檢查表的字段關聯的外鍵的數據,看外鍵所在的表里是否有對應的數據,對于沒 有關聯數據的要做出記錄。
[0089] ②檢查錯誤的數據
[0090] 數據表中的一些錯誤將會影響到后續的數據轉換和存儲過程,首先,要檢查表字 段的類型與所存儲的數據類型是否一致,對于不一致的數據在系統中進行登記。
[0091] 檢查表中數據的格式是否與字段的定義相符,例如日期的格式是否一致、是否存 在不該有的全角字符和數字等。數據格式不同的數據在轉換過程中會導致轉換出錯,進程 終止。
[0092] ③檢查重復的數據
[0093] 檢查數據表中是否存在重復的記錄,檢查多個表之間是否有重復的數據,檢查不 同的表中是否有沖突的字段。對重復和沖突的數據條目進行登記,讓管理員與企業進行溝 通確認重復的數據項是否存在不一致的地方。
[0094] (2)在進行數據轉換之前還要對檢查和清洗的數據進行排序過濾的處理讓數據更 為規范化。按照需要排序的字段對獲取過來的數據進行重新的排序操作。
[0095] 同時,按照過濾的要求對所有的數據進行過濾操作,去掉不需要的數據,過濾的條 件包括數據倉庫里已有的數據、過期的數據、不需要的數據等。
[0096] (3)從不同企業的信息系統集成過來的數據類型復雜、數據結構也不相同,尤其是 從XML和Excel提取的數據格式更是比較特殊,需要根據信用數據管理系統的數據格式要 求對數據進行轉換,轉變為企業的多維數據視圖的格式,有利于后面對數據的分析和評價。 對數據所做的轉換一般包括數據類型的轉換、字段長度的轉換、數據的編碼、數據關聯關系 的建立等。
[0097] ①對外部數據的轉換最主要的是數據類型的轉換,不同數據源過來的數據類型不 一致的比較多,都需要進行轉換。以SQL為例,在進行數據庫的數據操作的時候有的數據可 以自動進行隱式的類型轉換,有的數據類型就不能轉換,需要采取數據類型轉換函數來實 現。建議都通過轉換函數來實現,這樣可以對數據格式進行定義,并可以指定目標數據類型 的長度,可通過函數 CAST(expression AS data_type[(length)])和 CONVERT(data_type[ (length)], expression!!,style])來實現,而CONVERT函數可以實現對不同時間格式的定 義。在數據類型轉換的過程要監測轉換失敗的數據,例如有的數據不能強行轉換為目標的 數據類型,有的數據太長轉換失敗等情況,然后通過人工的方式來進行檢查。
[0098] ②為了提高數據存儲、統計和數據分析的效率,對一些基礎的數據都要進行編碼, 以代碼表的方式來進行替換和存儲,建立元數據規范和基礎數據的編碼規范來對數據進行 梳理。從外部來的數據通過數據轉換模塊將基礎數據轉換為基礎數據代碼,再存儲到數據 倉庫中。
[0099] ③在數據轉換的過程中還需要建立數據之間的關聯,以外部企業的數據和數據關 聯為基礎、根據目標數據倉庫里數據之間的關聯關系,對數據進行處理,建立數據之間的關 聯。
[0100] (4)對處理之后的數據調用數據存儲功能存儲到數據倉庫中,形成企業信息的多 維數據庫視圖。這些數據主要是結構化數據、非結構化數據的描述和索引,后續將轉化為企 業評價的指標。
[0101] 4.根據企業的信用評價需求,對企業的信用數據進行多維建模,每一個維描述企 業的一個業務主題,例如獲利能力、償債能力、履約、經營管理、發展能力和潛力等,企業多 維數據視圖能夠提高數據分析的效率。以多維建模為基礎構建數據倉庫,對于數據的存儲 可采用H0LAP(hybrid 0LAP)的方式,以關系型數據庫和多維數組的方式存儲數據,通過數 據存儲模塊負責外部數據的存儲工作。
[0102] 數據倉庫以0LAP的方式為數據的分析評價模塊提供服務,通過數據倉庫監控功 能對數據倉庫的運行情況進行監測,并及時記錄所有的數據服務日志,保證提供高質量的 數據服務。
[0103] 5.如圖5所示,數據分析模型管理模塊的實現方式和過程為,主要包括評價指標 的定義、模型定義、權重系數的計算、模型版本控制。
[0104] (1)指標定義
[0105] 以外部企業集成過來的信用數據為基礎,結合信用評價的需求,建立用于評價的 指標體系,評價指標將由企業提供的數據和信用管理部門的評價要求共同組成。本發明采 用二級指標體系描述企業的數據信息,一級指標Ti (i = 1,2, . . .,η),一級指標Ti下屬的二 級指標Tij (j = 1,2,. . .,m)。第一級指標Ti 一般包括獲利能力指標、償債能力指標、履約指 標、經營管理、發展能力和潛力等,二級指標在此基礎上進行擴展定義。
[0106] 指標包括結構化數據指標和非結構化數據指標,結構化數據指標能夠進行量化, 添加結構化數據指標的時候需要設置該指標的實際值和得分之間的對應關系,采用 實際值的一個取值區間或者一個值對應一個得分的方式,并將結果記錄到取值和得分對應 庫中,這種對應關系為后續結構化數據指標的自動分析計算提供支持。
[0107] 添加非結構化數據指標L的時候需要同時添加該指標對應的影響因素集Eij = ieiJ1,eiJ2, · · ·,eiJk},其中k是影響因素的個數,影響因素為后續非結構化數據指標參考得 分的計算提供支持。
[0108] (2)模型定義
[0109] 分析評價模型定義包括添加、修改和刪除模型,首先從添加模型開始,新添加一個 模型包括2個步驟,第一步是根據企業的特點從定義好的二級指標體系里選擇一級指標和 二級指標添加到模型當中。
[0110] 第二步計算權重系數,計算流程如圖6所示,由于需要人工參與交互,可根據計算 量的大小優先選擇采用歸一化處理方法或者層次分析法,兩種方法的計算步驟如下:
[0111] ①歸一化方法
[0112] 歸一化處理方法是簡單直接的權重系數的確定方法,從信息系統的操作角度來說 較為方便。先確定第一級指標Ti (i = 1,2, ...,η)的權重系數,根據每個評價指標的重要 程度給一個0-99之間的分值Sy然后對所有指標的分值進行歸一化的處理,獲得每個評價 指標t對應的權重系數
【權利要求】
1. 一種支持復雜企業環境的信用數據管理系統,其特征在于包括:用戶申請模塊、數 據獲取模塊、數據處理模塊、數據倉庫、數據分析模型管理模塊、分析評價模塊和信用管理 模塊;其中: 用戶申請模塊:提供給企業用戶通過網絡來發起評價申請、填寫企業的資料、上傳有關 證明附件、指定數據源信息,提供給數據獲取模塊;然后提交信息、等待信息審核; 數據獲取模塊:實現從不同企業內部的信息系統獲取企業信用數據的功能,針對不同 企業提供的數據交換方式,通過數據接口與之對接,檢查并獲取企業的數據,然后將企業的 數據送至數據處理模塊; 數據處理模塊:對數據獲取模塊發送過來的數據進行檢查和清洗,檢測數據中存在的 錯誤和不一致,提高數據的質量;然后對清洗過的數據進行排序過濾、過濾掉不需要的數 據,并提取有用的信息數據,再對不同格式的有用的信息數據進行轉換,變為符合要求的格 式,并將轉換后的信息數據存儲到數據倉庫中; 數據倉庫:將處理過的企業信息數據通過多維建模的方式建立企業信用數據的多維數 據結構,得到企業信息數據的一個全局視圖,形成企業信息的多維數據庫,為分析評價模塊 提供支持; 數據分析模型管理模塊:結合處理的數據實現對企業信用數據分析的指標、分析模型 的定義和管理的功能,根據分析人員對企業的初步評價來調整和優化分析模型; 分析評價模塊:結合數據分析模型和數據分析引擎對企業的信用數據進行分析和評 價,給出企業的得分和對應的信用等級,包括對結構化數據指標和非結構化數據指標的分 析和評價; 信用管理模塊:用來對評價的過程和評價結果進行管理,實現對信用評價過程的管理、 審核流程的管理、評價結果的管理和報表服務;具體實現為:信用分析管理部門實現內部 的審核流程、生成信用評價報告、并將評價結果推送給企業,企業用戶可查看信用信息審核 和評價的結果。
2. 根據權利要求1所述的支持復雜企業環境的信用數據管理系統,其特征在于:所述 數據獲取模塊的實現過程如下: (1)根據外部企業提供的數據源訪問信息確定數據源的類型并調用支持該類型的數據 訪問接口; ⑵根據選擇的是數據庫視圖、XML文件或者Excel文件接口類型,連接到外部的數據 源中; (3) 獲取外部企業提供的數據信息,并對數據進行檢查、保證數據的可用性和一致性; (4) 數據獲取過程中通過安全控制和傳輸監控功能監控數據的獲取過程。
3. 根據權利要求1所述的支持復雜企業環境的信用數據管理系統,其特征在于:所述 數據分析模型管理模塊的實現過程如下: (1) 根據企業評價的內容來添加和定義企業信用數據評價指標,結合企業多維數據的 建模,采用二級指標體系來組織數據,每個一級指標相當于企業信息的一個維度,指標的定 義包括結構化數據指標和非結構化數據指標; (2) 如果是結構化數據指標的定義,需要給出結構化數據指標的取值和得分的對應關 系,以實現根據外部企業數據自動分析計算得分的功能; (3) 如果是非結構化數據指標的定義,需要給出非結構化數據指標的影響因素,為了后 續指標的數據分析提供支持,以實現更準確的非結構化數據指標的評價; (4) 定義企業數據分析的模型,選取一級和二級指標添加到模型中; (5) 采用歸一化方法或者層次分析法來計算權重系數。
4. 根據權利要求1所述的支持復雜企業環境的信用數據管理系統,其特征在于:所述 分析評價模塊的實現過程如下: (1) 選擇對企業信用數據評價所采用的分析模型; (2) 自動計算給出結構化數據指標的得分,然后人工去校驗得分的情況,如果有必要可 以進行修改; (3) 對非結構化數據指標的分析,首先選擇該指標采用哪些影響因素來進行評價,然后 系統通過對數據庫中歷史數據的分析和當前用戶選擇的結果進行分析,計算出該非結構化 數據指標的參考得分,參考這個得分給出該指標實際的得分; (4) 計算出總的得分,根據數據倉庫中信用等級和得分的對應關系確定企業所對應的 信用等級。
5. -種支持復雜企業環境的信用數據管理方法,其特征在于實現步驟如下: (1) 用戶登陸信用數據管理系統發起信用評價的申請,填寫企業的結構化的信用數據, 上傳相關的非結構化的附件,指定本企業信用數據源的類型、位置和安全訪問信息,提交申 請之后等待信用管理部門的處理; (2) 用戶提交申請之后,自動調用數據獲取模塊,連接到企業的數據源來獲取數據; (3) 獲取數據的同時將調用數據處理模塊,對外部集成過來的數據進行檢查和清洗; (4) 調用數據轉換功能,結合元數據信息將獲取的數據轉換為數據倉庫里統一格式的 數據; (5) 處理過的數據將存儲到多維數據倉庫中,為后面的數據分析服務作準備; (6) 信用數據分析部門的人員接收到用戶的申請之后,將根據企業類型、規模特征選擇 用于數據分析和評價的模型,如果沒有適合的模型將轉入模型定義流程; (7) 數據分析模型的定義首先選擇用于企業數據分析的指標,并根據指標的多少選擇 不同的權重系數的計算方法來計算獲得模型的權重系數; (8) 選擇好數據分析模型之后,對企業提供的信用數據進行分析,包括結構化數據指標 和非結構化數據指標的分析,結構化數據指標的得分由系統自動計算獲得; (9) 非結構化數據指標的分析將會結合用戶對影響因素的選擇情況以及數據庫內歷史 數據的分析來進行,最后計算出企業總的得分和對應的信用等級; (10) 通過信用管理模塊對分析結果進行審核,生成信用評價報告,并將結果推送給企 業用戶。
【文檔編號】G06Q10/06GK104299105SQ201410602829
【公開日】2015年1月21日 申請日期:2014年11月2日 優先權日:2014年11月2日
【發明者】李培軍, 許舒人, 李慧, 魏克剛, 劉祥龍, 董源 申請人:中國科學院軟件研究所