一種基于線性混合模型對大型數據的統計分析方法
【技術領域】
:
[0001]本發明涉及線性混合模型技術領域,具體涉及一種基于線性混合模型對大型數據的統計分析方法。
【背景技術】
:
[0002]MS是最早的大型數據庫管理系統,其數據庫模式是多個物理數據庫記錄型(PDBR)的集合。每個TOBR對應層次數據模型的一個層次模式,用一個DBD定義。各個用戶所需數據的邏輯結構稱為外模式,每個外模式是一組邏輯數據庫記錄型(LDBR)的集合。LDBR是應用程序所需的局部邏輯結構。用戶按照外模式操縱數據。大型數據庫的數據定義包括數據庫模式定義和外模式定義。大型數據庫的數據庫模式是物理數據庫記錄型的集合。每個物理數據庫記錄型對應于層次數據模型中的一個層次模式,由一個DBD定義。物理數據庫記錄型到存儲數據庫的映射包含在這個物理數據庫記錄型的DBD定義中。
[0003]混合線性模型有時又稱為多水平線性模型或層次結構線性模型。重復測量資料也屬于混合線性模型,但重復測量資料與多水平線性模型有所不同。第一:在多水平線性模型第一層次上的觀察點個數可以不等,但重復測量資料第一層次上的觀察點個數(即各觀察對象在各時間點上的觀察值個數)是相等的(假定無缺失值)。第二,多水平線性模型的方差協方差結構多為復合對稱結構或無結構類型,但重復測量資料還具有多種其他形式。
[0004]現有技術中基于線性混合模型對大型數據的統計分析方法浪費時間,而且反應時間長,數據處理復雜。
【發明內容】
:
[0005]本發明的目的是提供一種基于線性混合模型對大型數據的統計分析方法,它便于對大型數據進行統計分析,速度快,節省時間,效率高。
[0006]為了解決【背景技術】所存在的問題,本發明是采用如下技術方案:它的方法為:
[0007]步驟一:建立完整的數據庫,且采用實時更新的方式進行數據更新;
[0008]步驟二:數據的預處理:
[0009](2.1)、數據過濾:對數據進行去噪音;
[0010](2.2)、基線校正:去掉由于系統誤差產生的基線;
[0011](2.3)、數據標準化:校正從樣本中解吸和電離得到的大量蛋白質的系統差異;
[0012](2.4)、峰的提取和量化:找到在對照組和殘疾組有顯著差異的特征峰,量化它們的特征,確定位置并得到峰的高度;
[0013](2.5)、峰的配準:校正并配準樣本件不一致的生物標記物;
[0014]步驟三:數據的處理:利用步驟二中提取的特征峰矩陣進行臨床診斷,且進行監控,并將其分類;
[0015]步驟四:數據的統計:將所獲得的數據進行統計,并且做成相應的表格。
[0016]本發明具有如下有益效果:便于對大型數據進行統計分析,速度快,節省時間,效率高。
【具體實施方式】
:
[0017]本【具體實施方式】采用如下技術方案:它的方法為:
[0018]步驟一:建立完整的數據庫,且采用實時更新的方式進行數據更新;
[0019]步驟二:數據的預處理:
[0020](2.1)、數據過濾:對數據進行去噪音;
[0021](2.2)、基線校正:去掉由于系統誤差產生的基線;
[0022](2.3)、數據標準化:校正從樣本中解吸和電離得到的大量蛋白質的系統差異;
[0023](2.4)、峰的提取和量化:找到在對照組和殘疾組有顯著差異的特征峰,量化它們的特征,確定位置并得到峰的高度;
[0024](2.5)、峰的配準:校正并配準樣本件不一致的生物標記物;
[0025]步驟三:數據的處理:利用步驟二中提取的特征峰矩陣進行臨床診斷,且進行監控,并將其分類;
[0026]步驟四:數據的統計:將所獲得的數據進行統計,并且做成相應的表格。
[0027]以上所述僅為本發明的較佳實施例而已,并不用以限制本發明,凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。
【主權項】
1.一種基于線性混合模型對大型數據的統計分析方法,其特征在于它的方法為: 步驟一:建立完整的數據庫,且采用實時更新的方式進行數據更新; 步驟二:數據的預處理: (2.1)、數據過濾:對數據進行去噪音; (2.2)、基線校正:去掉由于系統誤差產生的基線; (2.3)、數據標準化:校正從樣本中解吸和電離得到的大量蛋白質的系統差異; (2.4)、峰的提取和量化:找到在對照組和殘疾組有顯著差異的特征峰,量化它們的特征,確定位置并得到峰的高度; (2.5)、峰的配準:校正并配準樣本件不一致的生物標記物; 步驟三:數據的處理:利用步驟二中提取的特征峰矩陣進行臨床診斷,且進行監控,并將其分類; 步驟四:數據的統計:將所獲得的數據進行統計,并且做成相應的表格。
【專利摘要】一種基于線性混合模型對大型數據的統計分析方法,它涉及線性混合模型技術領域,它的方法為:步驟一:建立完整的數據庫,且采用實時更新的方式進行數據更新;步驟二:數據的預處理;步驟三:數據的處理:利用步驟二中提取的特征峰矩陣進行臨床診斷,且進行監控,并將其分類;步驟四:數據的統計:將所獲得的數據進行統計,并且做成相應的表格;它便于對大型數據進行統計分析,速度快,節省時間,效率高。
【IPC分類】G06F19/28
【公開號】CN104933330
【申請號】CN201510249134
【發明人】傅濤, 朱平, 蔣霞
【申請人】江蘇博智軟件科技有限公司
【公開日】2015年9月23日
【申請日】2015年5月15日