專利名稱:使用變量計分的模型優化系統的制作方法
技術領域:
本發明涉及使用變量計分的模型優化系統。
背景技術:
建模常被用于預報或預測行為或結果。這些模型可以通過回歸分析或者分析歷史 數據的其他方法來生成。例如,公司使用歷史銷售數據來生成預測銷售在未來將如何受到 影響的模型,并且這些公司可以相應地做出調整以改善銷售或者控制產品庫存。存在多種傳統技術用以評估這些模型的輸出(例如,銷售預測)的準確性。然而, 一旦模型被確定為不準確的,如果用來生成模型的輸入數據存在問題,則非常難以改進模 型的準確性。不佳的模型性能可能是來自某些數據收集源的某些模型輸入參數的不充分數 據的結果,或者歸因于不同的源在確定參數時執行的不一致計算。分析每個輸入參數以標 識哪些輸入參數導致了模型預測的不準確可能將花費多個人工小時。此外,沒有用于評估 輸入參數的質量以及用于估計不同數據質量方面對最終模型質量的影響的客觀測量,這一 事實可能使分析進一步復雜化。而且,公司收集歷史數據和構建模型是高成本的。通常,最 初并未分析收集的數據以確定該數據是否可以用于構建準確的模型。結果是,把時間和金 錢浪費在構建不準確的模型上。
發明內容
按照一個實施方式,一種模型優化系統,配置用于確定用于模型生成的變量的質 量。數據存儲,存儲輸入變量、該輸入變量的質量度量以及該質量度量的權重。該質量度量 描述輸入變量的數據的充分性和質量,并且該數據針對多個地區而提供。計分模塊,基于輸 入變量以及經加權的質量度量來確定每個地區的得分。優化器,基于得分來確定是否要修 改針對地區的至少一個輸入變量,以及確定該地區的總得分是否可操作以使用經修改的輸 入變量來得以改善。按照另一實施方式,一種用于確定用于建模的數據質量的方法,包括標識可操作 以用于建模以便估計因變量的輸入變量;確定描述輸入變量的數據的充分性的質量度量, 其中該數據針對多個地區而提供;對質量度量進行加權;以及由計算機系統基于經加權的 質量度量來確定每個地區的得分。該方法可以具體化在一個或多個計算機程序中,該計算 機程序包括計算機可讀指令,并且存儲在非瞬態計算機可讀介質上。一種計算機系統,可以 執行計算機可讀指令以執行該方法。
在下文描述中,將參考附圖詳細描述本發明的實施方式。圖1示出了按照一個實施方式的系統;圖2示出了按照一個實施方式的說明性變量的示例;圖3示出了按照一個實施方式的得分的示例;圖4示出了按照一個實施方式的地區的總得分的示例;圖5示出了按照一個實施方式的用于確定得分的方法;圖6示出了按照一個實施方式的用于改善總得分的方法;以及圖7示出了按照一個實施方式的可用于方法和系統的計算機系統。
具體實施例方式出于簡便和說明目的,實施方式的原理將主要通過參考其示例來描述。在下文描 述中,記載了多個特定細節以提供對實施方式的透徹理解。然而,對于本領域普通技術人員 而言易見的是,可以不限于這些特定細節來實踐實施方式。在某些實例中,沒有詳細描述公 知的方法和結構以避免不必要的混淆實施方式。1.概述按照一個實施方式,一種系統,可操作以確定銷售影響數據是否足以生成可以用 來進行關于銷售的準確預測的模型。該系統還可操作以標識改善模型性能以進行準確預測 所需要的銷售影響數據的改變。模型可以包括時間序列計量經濟學模型,其使用來自銷售 影響數據的參數作為輸入,用以進行關于特定的參數或參數集合將如何影響銷售的預測。 使用這些預測,公司可以修改營銷活動或者其他銷售策略,以改善其產品的銷售。該系統可 操作以量化模型的輸入參數的質量,從而確定是否可以構建準確的模型或者是否可以改善 已有模型。銷售影響數據被用作模型的輸入并由系統進行評估,其包括與銷售有關或者可能 影響產品銷售的任何信息。產品可以是一個或多個貨品或服務。銷售影響數據的示例包括 關于所進行的實際銷售的信息,關于促銷的信息,廣告和其他營銷信息,宏觀經濟因素(諸 如,關于經濟衰退或通貨膨脹的信息),等等。在此描述的實施方式包括一個或多個技術方面。例如,系統生成顯示,其通過得分 來提供用于生成模型的數據的充分性的方便可視化。由此,實施方式可以降低為了執行確定 數據和變量是否足以生成準確模型這一任務而需要的來自用戶的精神和身體上的努力。另一 技術方面是數據(諸如,質量度量)向得分的轉換,其可以使用簡單的計分標度,這允許用戶 快速標識用于模型構建的輸入變量的可行性,以及用于輸入變量的優化從而改善模型。2.系統圖1示出了按照一個實施方式的模型優化系統100。系統100包括計分模塊110、 仿真器120、模型構建器130、優化器140、用戶接口 150以及數據存儲160。系統100接收 銷售影響數據,包括輸入變量101、變量關系數據102、質量度量103以及由系統100用于評 估變量和模型構建的其他數據。該數據以及由系統100生成的數據和模型存儲于數據存儲 160中,數據存儲160可以包括數據庫或其他類型的存儲系統。存儲在數據存儲160中并由 系統100使用的至少某些數據可以經由用戶接口 150來接收。
計分器110確定銷售影響數據中包括的輸入變量101的得分105。輸入變量101 是用來構建模型106的變量。模型106繼而可以用來預測銷售變量的值,其中銷售變量可 以是因變量,具有根據一個或多個輸入變量計算的值。輸入變量101以及用于評估輸入變 量的質量度量105的示例在圖2和圖3中示出,并將在下文詳述。輸入變量101的得分105可以用來評估和優化輸入變量101,以用于模型構建以 及改善用于進行銷售變量預測的模型(諸如,模型106)的準確性。得分105可以包括輸入 質量度量得分、源得分、類別得分以及總得分。計分模塊110確定輸入變量101的質量度量 103的質量度量得分。這些得分被用來計算源得分,該源得分與提供銷售影響數據和/或營 銷渠道的數據源有關。質量度量得分還被用來計算針對輸入變量的不同類型的類別得分。 根據計算出的得分來計算總得分。總得分可以是針對地理區域的總得分,并且指示適用于 該地區的輸入變量的質量。而且,可以使用加權來計算得分。變量關系數據102包括用于 計分的權重、范圍和標度。可以基于累積的專家知識來確定變量關系數據102,并且應用統 計分布以確定用于計分的范圍和標度。得分計算的示例關于圖2-圖4提供。系統100還包括仿真器120。仿真器120允許優化器140改變輸入變量,并且仿真 器120繼而向計分器110發送經修訂的輸入變量以重新計算得分。例如,優化器140確定 某個地區的總得分是否在預定閾值之下。優化器140可以確定某些輸入變量不具有用于生 成模型的充分質量。優化器140可以例如通過將輸入變量的得分與閾值進行比較來標識不 充分的變量。用戶還可以通過用戶接口 150可視地查看得分,并且選擇具有低得分的一個 或多個輸入變量以便替換。優化器140確定標識的輸入變量是否可以修改。這可以包括確 定是否存在針對不充分變量的任何其他數據源。此確定可以基于在數據存儲160中搜索其 他源,或者從用戶處接收其他源可用的指示以及還接收這些源的數據。如果另一源可用,則 來自新源的數據被用來確定不充分變量的質量度量得分,并且用來確定是否可以使用新數 據來改善總得分。標識具有低得分的“問題”變量,諸如對于百分比覆蓋率質量度量具有1的輸入變 量。確定并執行用于獲得具有較好質量的輸入變量的方式。例如,優化器140可以通過由 仿真器120執行的仿真來確定已經發現具有較好百分比覆蓋率得分的備選變量源。如果 獲得具有較好覆蓋率的較好質量變量,則仿真器120和計分模塊110確定變量的改變是否 充分地改善了總得分。如果改變改善了總得分,則向模型構建器130發送輸入變量,包括經 修改的問題變量。模型構建器130使用輸入變量來構建模型106。模型構建器130可以構建可用于 總得分在閾值之上的地區(這指示輸入變量對于該地區模型構建而言是充分的)的模型。 例如,給定輸入變量的選定集合,使用統計回歸(例如,線性回歸)方法來確定模型系數。這 些系數是將變量的數據(例如,營銷渠道的成本數據)最佳映射為相應的歷史表現數據的 模型變量的系數。使用回歸技術來估計模型變量的系數,以產生將給定輸入數據的計算輸 出最佳擬合至其相應輸出的多元函數(例如,曲線)。在某些實施方式中,回歸技術針對模 型的至少某些變量執行非線性回歸,以便將與此類變量(例如,展示收益遞減行為的市場 變量)相關聯的任何非線性行為納入考慮。確定變量與銷售之間的關系以及確定構成模型的響應曲線在由Andris Umblijs 等人于2006年7月7日提交的名為“ModelingMarketing Data”的共同未決美國專利申請序列號11/483,401中進一步描述,在此通過引用并入其全部內容。圖2示出了用于評估輸入變量101的質量度量103的示例。該示例包括百分比 覆蓋率201和202、數據周期性203以及數據刷新頻率204。說明210描述每個質量度量 201-204。應當注意,可以使用其他質量度量。示出了標度205。在此示例中,標度205為0-3。標度中的值0_3是質量度量得 分,其可以由計分模塊110根據針對質量度量的測量和范圍來確定。針對每個得分確定范 圍。例如,對于百分比覆蓋率201,范圍0-20%映射為得分0 ;范圍20-40%映射為得分1 ; 范圍40-75%映射為得分2 ;并且范圍75-100%映射為得分3。計分模塊110標識百分比覆 蓋率度量201的測量值,其可以由外部源提供并且存儲在數據存儲160中。例如,測量值為 30%,其落入20-40%的范圍內。由此,對于測量值30%來說,百分比覆蓋率度量201的得 分為1。在圖2中針對每個質量度量201-204示出了得分的范圍的示例。此示例中的標度是簡單標度0-3,因此易于用戶快速標識輸入變量被認為有多好 或多不好。然而,可以使用更為復雜的標度。而且,可以通過對歷史數據的專家分析來確定 標度和范圍。圖3示出了地區301的得分205的示例。在此示例中,地區301是巴西,并且地區 301的總得分302是2. 54。請注意,圖3中示出的總得分302和其他得分使用了用于質量 度量的相同標度,諸如0-3。計分模塊110根據類別得分、輸入變量得分和質量度量得分以及輸入變量的權 重,來計算總得分302。輸入變量在類別中示出。類別是因變量303、由客戶端304控制的 自變量以及不由客戶端控制的外部自變量305。客戶端可以是使用系統100來評估輸入變 量和構建模型以估計銷售或其他信息的公司或其他實體。自變量304由客戶端控制,并且可以包括針對諸如電視、有線電視、印刷品等不同 營銷渠道的營銷變量。營銷變量可以包括為每個營銷渠道花費的數額、提利(uplift)等。 外部自變量305在客戶端的控制之外,并且可以包括國家零售銷售、信用卡數目、商店或零 售商批發商店的數目,等等。因變量303是有待自變量來解釋和/或預測的變量。這可以 包括其值將使用模型來進行預測的變量。因變量的一個示例是購買量。其他示例可以是增 量銷售、利潤、客戶周期等。每個類別下可以存在多個變量。計分模塊110分別計算類別303-305的類別得分306-308。類別得分306-308分 別使用類別權重309-311以及針對每個類別的源得分來計算。針對每個類別示出了輸入變量。例如,對于類別303,示出了銷售輸入變量312和 銷售1輸入變量313。類別304具有涉及不同營銷渠道的輸入變量314,并且類別305具有 輸入變量315。對于每個類別中的每個輸入變量,示出了輸入變量權重316-318。針對每個 類別的輸入變量權重的和可以等于100。例如,銷售輸入變量312具有100%的權重,而銷 售1輸入變量313具有0%的權重。在此描述的權重可以通過專家分析和數據分析來確定。 銷售1可以具有0%的權重,因為它的源被認為是不可靠的。還可以考慮其他因素。請注 意,如果源是已知的,則可以示出源。例如,輸入變量312和313分別具有由主要源和次要 源提供的數據。輸入變量314可以具有外部源(諸如,媒體代理),或者可以由客戶端提供。根據質量度量得分和質量度量權重來計算輸入變量得分。質量度量318針對每個 輸入變量而示出,并且可以包括百分比覆蓋率、數據周期性以及數據刷新頻率。還示出了質量度量得分,并且其可以基于相同的0-3標度。對于類別303示出了質量度量得分310。對 于類別303還示出了質量度量權重320,但是未針對其他類別示出;然而,每個類別都可以 使用質量度量權重(即使未示出)。圖3中示出以及上文描述的得分可以使用以下公式來計算。公式1總得分=ΣΡ=1類別得分i *類別權重i其中η是類別的數目。例如,總得分302 是 2. 64 = (2. 6*. 45)+ (2. 44*. 45)+ (2. 68*. 1)。公式2類別得分=Ef=I輸入t量得分i*輸入變量權重i其中χ是該類別的輸入變量的數目。例如,因變量類別303的類別得分是2. 60 = (2. 60*1. 00)+ (2. 20*0. 0)。公式3輸入變量得分=Zf=1質量良量得分i夂質量度量權重i其中y是質量度量的數目。例如,因變量類別303的銷售輸入變量得分是2. 60 = (3*. 60)+ (2*. 30)+ (2*. 10)。系統100可以用來計算不同地區的總得分。圖4示出了針對不同國家的總得分 401。而且,示出了每個類別303-305的對應得分及其權重309-311。還示出了全球平均。查 看這些結果的用戶可以將墨西哥標識為具有最差輸入變量,并且仿真器120和優化器140 可以用來標識要修改的輸入變量,以便改善墨西哥的總得分并為墨西哥構建質量更好的模 型。3.方法圖5示出了按照一個實施方式的用于確定得分的方法500。得分表示用來構建準 確模型的輸入變量的質量,其可以用來預測銷售變量或者其他因變量的值。作為示例而非 限制,方法500和下文描述的其他方法可以關于圖1-圖4中的一個或多個來描述。在步驟501,標識構建用于估計銷售變量的一個或多個模型所需要的輸入變量,其 可以是因變量。例如,圖3示出了營銷自變量,其可以具有在不同營銷渠道上花費的數額、 外部自變量以及因變量(例如,購買量)。可以使用這些變量中的一個或多個來估計銷售變 量。估計的變量可以包括因變量,諸如購買量。例如,給定每個營銷渠道中的特定營銷投資 以及給定外部自變量的值,可以使用模型來估計購買量。利潤和客戶周期是可以針對選定 的輸入變量集合而估計的銷售變量的其他示例。用戶可以為模型選擇要使用的變量。在步驟502,確定輸入變量的質量度量。質量度量描述輸入變量的數據的充分性。 可以提供不同地區的數據。質量度量的示例在圖2中示出。例如,可以從輸入變量的各種 源提供數據。數據周期性的質量度量描述針對輸入變量從源收集數據的頻度。在一個示例 中,假設收集較頻繁的數據被認為對于創建模型而言較為充分,并被給予較高的得分。計分模塊110可以基于計分標度以及在標度上為每個值指派的范圍來為質量度 量計分,從而確定質量度量。例如,系統100使用得分0-3,并且為每個質量度量的特定范圍 指派每個得分。得分的示例在圖3和圖4中示出,并且映射至每個得分的范圍的示例在圖 2中示出。在步驟503,確定權重。權重包括用于每個質量度量的權重、用于每個輸入變量的 權重以及用于輸入變量的每個類別的權重。權重還可以針對源的每個類型而確定,諸如圖3中針對不同營銷渠道而示出的。可以基于累積的專家知識和/或對歷史數據的分析,來確 定權重、計分系統以及范圍。在步驟504,系統100生成得分。基于銷售影響數據、權重以及可以包括計分標度 (例如,0-3)的計分系統,針對每個輸入變量、每個類別以及針對所有輸入變量(也即,總得 分)而生成得分。總得分可以逐個地區來提供,如圖4中所示。圖6示出了按照一個實施方式的用于改善總得分的方法600。在步驟601,確定總 得分是否在閾值之下。這可以是針對地區的總得分。如果總得分在閾值之下,則在步驟602, 標識具有最低得分的一個或多個個體輸入變量。閾值可由用戶或另一實體來預先確定。例 如,確定閾值2,并且認為在2之下的任何總得分對于模型構建而言是不充分的。在步驟603,確定是否可以修改任何輸入變量以潛在地改善總得分。這可以包括從 具有較好質量度量的新源獲得數據。其他源可能不可用,在這些情況下,針對地區的輸入變 量和總得分可能無法改善,如步驟604表示。如果可以修改至少一個輸入變量以潛在地改 善地區的總得分,則在步驟605修改變量,這可以包括獲得提供較好質量度量的輸入變量 數據。在步驟606,對地區進行重新計分。這包括使用經修改的輸入變量來計算該地區的新 總得分。繼而,可以重復方法600以確定新的總得分是否在閾值之上。對于總得分在閾值 之上的所有地區,可以構建模型,并將其用于預報銷售量或者其他因變量。5.計算機可讀介質圖7示出了可以與在此描述的實施方式結合使用的計算機系統700。計算機系統 700表示包括可以在服務器或者其他計算機系統中的部件的通用平臺。計算機系統700可 以用作用于執行一個或多個在此描述的方法、功能和其他步驟的平臺。這些步驟可以具體 化為存儲在一個或多個計算機可讀介質上的軟件(包括計算機可讀指令),其中計算機可 讀介質可以是非瞬態存儲設備。此外,圖1中所示的系統100的部件可以是軟件、硬件或者 硬件和軟件的結合。計算機系統700包括處理器702,其可以實現或者執行軟件指令,軟件指令執行某 些或全部在此描述的方法、功能和其他步驟。來自處理器702的命令和數據通過通信總線 704傳送。計算機700還包括主存儲器707,諸如隨機訪問存儲器(RAM),用于處理器702 的軟件和數據可以在運行時期間駐留在此;以及次級數據存儲708,其可以是非易失性的, 并且存儲軟件和數據。存儲器和數據存儲是計算機可讀介質的示例。計算機系統700可以包括一個或多個I/O設備710,諸如鍵盤、鼠標、顯示器等。計 算機系統700可以包括用于連接至網絡的網絡接口 712。對于本領域的技術人員易見的是, 可以在計算機系統700中添加或替換其他已知的電子部件。在此描述的方法的一個或多個步驟和在此描述的其他步驟以及在此描述的系統 的一個或多個部件可以實現為計算機代碼,其存儲在諸如存儲器和/或次級存儲的計算機 可讀介質上,并且在計算機系統上執行,例如由處理器、專用集成電路(ASIC)或者其他控 制器來執行。代碼可以作為包括源代碼、目標代碼、可執行代碼或者其他格式的程序指令的 軟件程序而存在。計算機可讀介質的示例包括傳統的計算機系統RAM(隨機訪問存儲器)、 ROM(只讀存儲器)、EPR0M(可擦除可編程ROM) ,EEPROM(電可擦除可編程ROM)、硬盤驅動以 及閃存。盡管已經參考示例描述了實施方式,但是本領域技術人員能夠在不脫離要求保護的實施方式的范圍的情況下,對所描述的實施方式進行各種修改。例如,作為示例,模型優 化系統100 —般地關于優化營銷模型來進行描述。系統100可以用來為變量計分以及優化 其他類型的模型,其可以用于預報天氣、股市等。
權利要求
1.一種模型優化系統,配置用于確定用于模型生成的變量的質量,所述系統包括 數據存儲,存儲輸入變量、所述輸入變量的質量度量以及所述質量度量的權重,其中所述質量度量描述所述輸入變量的數據的充分性,并且所述數據針對多個地區而提供; 計分模塊,基于所述輸入變量以及經加權的質量度量,來確定每個地區的得分;以及 優化器,由計算機系統執行,并且基于所述得分來確定是否要修改針對地區的至少一 個輸入變量,以及確定所述地區的總得分是否可操作以使用經修改的輸入變量來得以改善。
2.如權利要求1所述的模型優化系統,還包括模型構建器,使用所述輸入變量來生成針對得分在閾值之上的每個地區的模型。
3.如權利要求1所述的模型優化系統,其中所述計分模塊基于針對所述質量度量的測 量來確定每個質量度量的質量度量得分,其中所述每個地區的得分根據所述質量度量得分 來計算。
4.如權利要求1所述的模型優化系統,其中所述計分模塊通過確定所述輸入變量的 類別來確定所述每個地區的得分,其中每個類別與輸入變量的類型相關聯;確定每個類別 的類別權重;以及基于所述類別權重來確定所述每個地區的得分。
5.如權利要求4所述的模型優化系統,其中所述類別包括由實體控制的自變量,所述 實體的控制之外的自變量,以及依賴于另一類別的變量的因變量。
6.一種用于確定用于建模的數據的質量的方法,所述方法包括 標識可操作以用于建模以便估計因變量的輸入變量;確定描述所述輸入變量的數據的充分性的質量度量,其中所述數據針對多個地區而提供;對所述質量度量進行加權;以及由計算機系統基于經加權的質量度量來確定每個地區的得分。
7.如權利要求6所述的方法,還包括對于每個輸入變量,確定針對每個質量度量的測量;以及基于所述測量來確定每個質量度量的質量度量得分,其中所述每個地區的得分根據所 述質量度量得分來計算。
8.如權利要求7所述的方法,其中確定質量度量得分包括 確定每個質量度量的值的標度;將所述針對每個質量度量的測量與映射至所述標度內的值的值范圍進行比較;以及 基于所述比較來確定每個質量度量的質量度量得分。
9.如權利要求6所述的方法,其中確定每個地區的得分包括 確定所述輸入變量的類別,其中每個類別與輸入變量的類型相關聯; 確定每個類別的類別權重;以及基于所述類別權重來確定所述每個地區的得分。
10.如權利要求9所述的方法,其中所述類別包括由實體控制的自變量,所述實體的 控制之外的自變量,以及依賴于另一類別的變量的因變量。
11.如權利要求6所述的方法,其中確定每個地區的得分包括 確定所述輸入變量的所述數據的源;確定每個類別的源權重;以及基于所述源權重來確定所述每個地區的得分。
12.如權利要求6所述的方法,還包括從確定的得分中標識落在針對所述地區之一的閾值之下的得分; 基于所述質量度量從所述輸入變量中標識可操作以被改進的輸入變量; 修改標識的輸入變量;使用修改的輸入變量對所述地區重新計分,以確定所述地區的新得分;以及 確定所述新得分是否落在所述閾值之下。
13.如權利要求6所述的方法,還包括使用所述輸入變量來生成針對得分在閾值之上的每個地區的模型。
14.一種用于確定用于建模的數據的質量的設備,所述設備包括 用于標識可操作以用于建模以便估計因變量的輸入變量的裝置;用于確定描述所述輸入變量的數據的充分性的質量度量的裝置,其中所述數據針對多 個地區而提供;用于對所述質量度量進行加權的裝置;以及用于由計算機系統基于經加權的質量度量來確定每個地區的得分的裝置。
15.如權利要求14所述的設備,還包括用于對于每個輸入變量確定針對每個質量度量的測量的裝置;以及 用于基于所述測量來確定每個質量度量的質量度量得分的裝置,其中所述每個地區的 得分根據所述質量度量得分來計算。
16.如權利要求15所述的設備,其中用于確定質量度量得分的裝置包括 用于確定每個質量度量的值的標度的裝置;用于將所述針對每個質量度量的測量與映射至所述標度內的值的值范圍進行比較的 裝置;以及用于基于所述比較來確定每個質量度量的質量度量得分的裝置。
17.如權利要求14所述的設備,其中用于確定每個地區的得分的裝置包括 用于確定所述輸入變量的類別的裝置,其中每個類別與輸入變量的類型相關聯; 用于確定每個類別的類別權重的裝置;以及用于基于所述類別權重來確定所述每個地區的得分的裝置。
18.如權利要求17所述的設備,其中所述類別包括由實體控制的自變量,所述實體的 控制之外的自變量,以及依賴于另一類別的變量的因變量。
19.如權利要求14所述的設備,其中用于確定每個地區的得分的裝置包括 用于確定所述輸入變量的所述數據的源的裝置;用于確定每個類別的源權重的裝置;以及 用于基于所述源權重來確定所述每個地區的得分的裝置。
20.如權利要求14所述的設備,還包括用于從確定的得分中標識落在針對所述地區之一的閾值之下的得分的裝置; 用于基于所述質量度量從所述輸入變量中標識可操作以有所改進的輸入變量的裝用于修改標識的輸入變量的裝置;用于使用修改的輸入變量對所述地區重新計分以確定所述地區的新得分的裝置以及 用于確定所述新得分是否落在所述閾值之下的裝置。
全文摘要
本發明涉及使用變量計分的模型優化系統。具體地,公開了一種模型優化系統,配置用于確定用于模型生成的變量的質量。數據存儲,存儲輸入變量、該輸入變量的質量度量以及該質量度量的權重。該質量度量描述輸入變量的數據的充分性,并且該數據針對多個地區而提供。計分模塊,基于輸入變量以及經加權的質量度量來確定每個地區的得分。優化器,基于得分來確定是否要修改針對地區的至少一個輸入變量,以及確定該地區的總得分是否可操作以使用經修改的輸入變量來得以改善。
文檔編號G06Q30/00GK102004982SQ201010251599
公開日2011年4月6日 申請日期2010年8月11日 優先權日2009年8月31日
發明者A·尤姆布利杰斯 申請人:埃森哲環球服務有限公司