對試驗或生產(chǎn)結(jié)果數(shù)據(jù)進行快速分析的方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬科學計算領(lǐng)域,尤其涉及通過計算機對試驗或生產(chǎn)結(jié)果數(shù)據(jù)進行快速分 析的方法及系統(tǒng)。
【背景技術(shù)】
[0002] 在研發(fā)過程和生產(chǎn)過程之中,經(jīng)常產(chǎn)生大量的結(jié)果數(shù)據(jù),常常要探討不同的條件 (或者說不同的處理方法)對研發(fā)或生產(chǎn)結(jié)果的影響,通常需要對結(jié)果數(shù)據(jù)進行方差分析。 目前,傳統(tǒng)公認的單因素方差分析(Analysis of Variance,簡稱AN0VA),又稱"變異數(shù)分 析"或"F檢驗",是由R. A. Fisher發(fā)明的,用于兩個及兩個以上樣本均數(shù)差別的顯著性檢 驗。其基本原理是認為不同處理組的均值差別的基本來源有兩個:組內(nèi)差異(用變量在各 組的均值與該組內(nèi)變量值之偏差平方和的總和表示)以及組間差異(用變量在各組的均值 與總均值之偏差平方和表示),再由此構(gòu)造出F統(tǒng)計量,用F值與其臨界值比較,推斷各樣本 是否來自相同的總體。但是,上述統(tǒng)計量的計算過程繁瑣,不便于快速得出分析結(jié)果。
【發(fā)明內(nèi)容】
[0003] 為克服上述不足,本發(fā)明提供一種快速判斷不同條件(或者說不同處理方法)對 研發(fā)或生產(chǎn)結(jié)果是否有顯著影響的方法。不但能大幅簡化傳統(tǒng)的方差分析的計算,便于快 速得出分析結(jié)果;同時不削減其檢驗能力。
[0004] 本發(fā)明的對試驗或生產(chǎn)結(jié)果數(shù)據(jù)進行快速分析的方法,包括構(gòu)建一種統(tǒng)計量,所 述統(tǒng)計量的分布與原正態(tài)總體的均值無關(guān),且與所述原正態(tài)總體的方差無關(guān)。
[0005] 作為優(yōu)先方案的,所述統(tǒng)計量的構(gòu)建包括以下步驟:
[0006] S1、獲取有多個不同條件,每個條件下做了多次測試的結(jié)果數(shù)據(jù);
[0007] S2、以任意兩個條件間,最大值與最小值之差的最大值為分子,以所有條件下極差 最大值為分母,計算此分子式的值。
[0008] 作為優(yōu)先方案的,若所述結(jié)果數(shù)據(jù)之中的最大值和最小值在同一條件下,判定各 條件間無顯著性差異。
[0009] 作為優(yōu)先方案的,所述多個不同條件,數(shù)量為不小于三;所述每個條件下做了多次 測試,數(shù)量為不小于四。
[0010] 作為優(yōu)先方案的,若統(tǒng)計量的值大于1. 6,在0. 05的顯著性水平下判斷各條件間 有顯著性差異,拒絕原假設。
[0011] 作為優(yōu)先方案的,若統(tǒng)計量的值小于1. 2,在0. 05的顯著性水平下判斷各條件間 無顯著性差異,接受原假設。
[0012] 作為優(yōu)先方案的,通過計算所述統(tǒng)計量得到相應的分位數(shù)表。
[0013] 本發(fā)明的一種對試驗或生產(chǎn)結(jié)果數(shù)據(jù)進行快速分析的系統(tǒng),包括:數(shù)據(jù)收集模塊, 用于錄入試驗或生產(chǎn)結(jié)果數(shù)據(jù);建立統(tǒng)計量模塊,用于構(gòu)建與原正態(tài)總體的均值無關(guān),且與 原正態(tài)總體的方差無關(guān)的統(tǒng)計量;分析模塊,用于分析各條件間有無顯著性差異。
[0014] 作為優(yōu)先方案的,所述建立統(tǒng)計量模塊為:通過獲取有多個不同條件,每個條件下 做了多次測試的結(jié)果數(shù)據(jù),以任意兩個條件間,最大值與最小值之差的最大值為分子,以所 有條件下極差最大值為分母,計算此分子式的值。
[0015] 作為優(yōu)先方案的,包括:所述分析模塊,在所述結(jié)果數(shù)據(jù)之中的最大值和最小值不 在同一條件下的前提下,用于判斷統(tǒng)計量的值,將統(tǒng)計量的值分別與1.2以及1.6進行比 較;若統(tǒng)計量的值大于1. 6,在0. 05的顯著性水平下判斷各條件間有顯著性差異,拒絕原假 設;若統(tǒng)計量的值小于1. 2,在0. 05的顯著性水平下判斷各條件間無顯著性差異,接受原假 設;若所述結(jié)果數(shù)據(jù)之中的最大值和最小值在同一條件下,所述分析模塊判定各條件間無 顯著性差異。
[0016] 本發(fā)明所采用的技術(shù)方案是根據(jù)方差分析的基本原理,對傳統(tǒng)方差分析的統(tǒng)計量 進行改進,構(gòu)造出一個全新的、更加簡單的統(tǒng)計量W,并利用統(tǒng)計量W的分位數(shù)表進行分析, 進而達成簡算方差分析的目的。一、統(tǒng)計量W的構(gòu)建如下:
[0017] 設矩陣
表示有m個不同條件,每個條件下做了 η次試驗的結(jié) 果,其中,Xij (i = 1,…,m, j = 1,…η)彼此獨立,Xij服從 Ν( μ i, 〇 2),i = 1,…,m, j = 1,… n〇
[0018] 設Xi⑴彡x i〇!)彡…彡x iW, i = 1,2,…,m為每個條件的樣本次序統(tǒng)計量。
[0019] 提出假設:Η。: μ != μ 2=…=μ m= μ
[0020] 定義統(tǒng)計量W為
[0021]
⑴
[0022] 其中,
表示m個不同條件下各極差的最大值;
[0023]
表示任意兩個不同條件間,最大值與最小值之差的最大值。
[0024] 如果,所有數(shù)據(jù)之中的最大值與最小值在同一條件之下,可知各水平間無顯著性 差異。
[0025] 二、統(tǒng)計量性質(zhì)
[0026] 性質(zhì):統(tǒng)計量W的分布與原正態(tài)總體的均值μ無關(guān);統(tǒng)計量W的分布與原正態(tài)總 體的方差σ 2無關(guān)。
[0027] 證明:設所有數(shù)據(jù)Xij, i = 1,2,…,m, j = 1,2,…,η是來自Ν(μ, 〇 2)的樣本, Xi⑴< X i(2々"< X i(n),i = 1,2, ...,m為其次序統(tǒng)計量;Xij標準化后得:
[0028]
[0029] 將上述標準化后的數(shù)據(jù)按各條件排序得到:
[0030] CN 105138841 A I兄明書 3/15 頁
[0031]
[0032]
[0033] 從而,任意正態(tài)分布的樣本與將樣本標準化后代入統(tǒng)計量計算是一樣的,故統(tǒng)計 量W的分布與原正態(tài)總體的均值μ以及方差σ 2無關(guān)。
[0034] 二、計算方差分析
[0035] 利用上述統(tǒng)計量W的定義以及得到的分位數(shù)表(表九),與傳統(tǒng)方法相比,本發(fā)明 的計算量明顯更少,進而能夠?qū)Ψ讲罘治鲞M行計算:
[0036] 1、找出各條件下得出的結(jié)果數(shù)據(jù)的最大值和最小值;
[0037] 2、根據(jù)公式(1)得到統(tǒng)計量W的值;
[0038] 3、將統(tǒng)計量W的值分別與1. 2以及1. 6進行比較;
[0039] 4、若統(tǒng)計量W的值大于1. 6,可在0. 05的顯著性水平下判斷各條件間有顯著性差 異,(一般而言,0. 05是最常用的顯著性水平),拒絕原假設;
[0040] 5、若統(tǒng)計量W的值小于1. 2,可在0. 05的顯著性水平下判斷各條件間無顯著性差 異,接受原假設。
[0041] 本發(fā)明設計了一個新的統(tǒng)計量,大幅簡化方差分析的計算,進而達到可快速計算 得出因果關(guān)系的效果;同時,驗證了新方法與傳統(tǒng)方法具有類似的檢驗能力。針對目前各產(chǎn) 業(yè)利用計算機進行大數(shù)據(jù)分析,以獲取有價值的商業(yè)信息,本發(fā)明的對試驗或生產(chǎn)結(jié)果數(shù) 據(jù)進行快速分析的方法及系統(tǒng),正迎合了產(chǎn)業(yè)的需求,能夠幫助人們通過簡化計算步驟,得 到較為正確的分析結(jié)果,有利于節(jié)約計算的時間,提高計算的效率。
【具體實施方式】
[0042] 下面利用一個例子來對本發(fā)明的【具體實施方式】做更進一步的說明:
[0043] 實施例1
[0044] 用4種安眠藥在兔子身上進行試驗,特選24只健康的兔子,隨機把它們均分為4 組,每組各服用一種安眠藥,安眠時間(單位:h)如下所示
[0045] 表一、安眠藥試驗數(shù)據(jù)
[0046]
[0047] CN 105138841 A 說明書 4/15 頁
[0048] 原方法:
[0049] 提出假設:H。:因子影響不顯著
[0050] 列出計算表
[0051] 表二、安眠藥試驗數(shù)據(jù)計算表
[0052]
[0053] 計算各偏差平方和以及自由度
[0054]
[0055]
[0056]
[0057] 列出方差分析表
[0058] 表三、安眠藥試驗數(shù)據(jù)的方差分析表
[0059]
[0060] 取 α = 〇· 05,則 F0. 95(3, 20) = 3. 10,由于 F = 5. 73>3· 10,故認為因子 A (安眠 藥)是顯著的,即四種安眠藥對兔子的作用有明顯的差別。
[0061] 新方法:
[0062] 提出假設:Η。:因子影響不顯著
[0063] 因為:(1)厶1條件下的極差為:6.3-5.9 = 0.4
[0064] (2)厶2條件下的極差為:7.1-6.3 = 0.8
[0065] (3) A3條件下的極差為:7· 1-6. 6 = 0· 5
[0066] (4)厶4條件下的極差為:6.4-5.4 = 1.0
[0067] (5)任意兩個不同條件間,最大值與最小值之差的最大值(在本實施例之中,SP為 所有數(shù)據(jù)的
[0068] 極差)為:7· 1-5.4 = 1.7
[0069] 所以,統(tǒng)計量妒=K =1.7
[0070] 取 α = 〇.〇5,則WO. 95(4,6) = L 427,由于W= L 7>1·6>1· 427,故認為因子A(安 眠藥)是顯著的,即四種安眠藥對兔子的作用有明顯的差別。
[0071] 實施例2:
[0072] 某糧食加工廠試驗三種儲藏方法對糧食含水率有無顯著影響.現(xiàn)取一批