本發明涉及一種混凝土強度預測方法,具體涉及一種海洋環境下混凝土強度預測方法。
背景技術:
隨著經濟的發展,大量的建筑工程在海洋環境中開展。在海洋環境下,Mg2+濃度、SO42-濃度、Cl-濃度、溫度等因素相互之間耦合作用導致混凝土性能劣化,尤其是強度的退化,從而使海洋環境下混凝土建筑物的耐久性成為研究者們關注的問題。而海洋環境下混凝土強度服役狀態的預測評價,對于混凝土結構的安全性判定以及建筑物的服役壽命的預測及設計具有重要意義。由于多種因素之間錯綜復雜,相互耦合以及不可避免的偶然因素,導致預測評價出強度的劣化狀態,是非常困難的。
傳統的回歸統計方法以及半經驗半理論推導的方法,得到的結果不是很理想,并且有一定局限性,很難從某一次或者少量的實驗數據中得到合理的混凝土性能劣化的規律。因此從大數據分析出發,探索其中的復雜規律勢在必行。但是在實際的混凝土服役環境下,能充分考慮服役環境的變化和材料組分變化對混凝土性能的影響,并探究其潛在的顯性邏輯關系,是非常困難的。
因此,有必要提出混凝土性能劣化的預測新方法,提取潛在的邏輯推理關系,這對于混凝土設計和以耐久性具有重要意義。
技術實現要素:
發明目的:本發明的目的在于針對現有技術的不足,提供一種海洋環境下混凝土強度劣化預測評價方法,通過處理不同服役條件下、不同時期的劣化數據,并進行分析建模,得到樹狀IF-THAN決策邏輯規則,最終預測服役混凝土不同年限和服役環境下強度的退化情況。
技術方案:本發明提供了一種海洋環境下混凝土強度劣化預測評價方法,包括以下步驟:
(1)通過實驗檢測不同配比下混凝土在海洋環境下隨齡期強度劣化的數據,并收集已有公開文獻中的數據形成數據庫;
(2)將獲得的運行數據分為訓練組和測試組,其中影響混凝土強度的因素作為因素屬性集,強度劣化的狀態作為劣化結果屬性集;
(3)進行決策樹建模:
(3.1)將訓練組按屬性進行劃分,計算每個屬性的信息增益,選擇信息增益值最大的屬性作為特征屬性,并設置優先級,作為決策樹的一級中間節點,所對應的劣化狀態的屬性類別作為一級分支;
(3.2)依次從訓練組中取出屬性,確定屬性的信息增益,直至得到訓練組中所有屬性的信息增益,對所有屬性的信息增益進行排序,信息增益值最大的屬性即為特征屬性;
(3.3)按照特征屬性的類別種類將訓練組進行劃分,訓練群組將已經判定為特征屬性的屬性去除,并判斷剔除的特征屬性是否存在使運行類別為劣化狀態的類別,如果存在,則劣化狀態類別對應的下一節點為葉子節點,該葉子節點中存儲劣化的運行類別,并進入步驟(3.4);若剔除的特征屬性不存在劣化狀態的類別,則繼續尋找其他屬性進行分支;
(3.4)在每個新劃分的訓練群組中計算每個屬性的信息增益,選擇信息增益值最大的屬性作為特征屬性,并設置優先級為r,作為決策樹的r級中間節點,其中r=2,3,4,…N,N為正整數,逐層形成決策樹節點;
(3.5)重復步驟(3.3)(3.4),直至劃分的訓練群組中只存在最后一個屬性,將該屬性作為特征屬性,特征屬性的類別對應的運行類別均存儲在下一分支的葉子節點中,決策樹構建完成;
(4)按照所述對應屬性的屬性值選擇輸出分支,直至到達葉子節點,將葉子節點存放的運行類別作為分析結果輸出;
(5)模型性能評估;
(6)采用C4.5算法對建立的決策樹減枝。
進一步,屬性信息增益確定的方法為:
設S是由屬性組成的樣本集合,將S劃分為c個類Ci(i=1,2,…,c),每個類Ci含有的樣本數目為ni,則S劃分為c個不同類的信息熵或期望信息:
其中,pi為S中的樣本屬于i類Ci的概率,即pi=ni/n,n為S的樣本總數;SV是S中屬性Δx的值為V的樣本子集,選擇Δx導致的信息熵定義為:
其中,E(SV)是將SV中的樣本劃分到各個類的信息熵,屬性Δx相對樣本集合S的信息增益Gain(S,Δx)定義為:
Gain(S,Δx)=E(S)-E(S,Δx)
Gain(S,Δx)是指因知道屬性Δx的值后導致的熵的期望壓縮,Gain(S,Δx)越大,說明選擇測試屬性Δx對分類提供的信息越多。
進一步,步驟(5)通過將屬性值代入決策樹,得到劣化的強度數值,并通過平均誤差、均方根誤差和擬合度檢驗其精確度。
進一步,步驟(6)使用剔除屬性之外的其他屬性設置為每一層的葉子節點,通過步驟(5)分析決策樹性能,如果誤差下降則選擇該屬性作為新的節點,如果誤差沒有下降則原有屬性無需被代替,依次計算每一個分支節點,得到簡化后的決策樹。
有益效果:1、與傳統的數據擬合公式、理論推導的半經驗半理論預測方法相比,適用性更強,并首次使用決策樹得到if-then決策樹狀屬性規則,并提出規則優化方法,對混凝土性能劣化進行定量預測。
2、與目前現有的神經網絡,支持向量機不同,決策樹得到的是數據間的邏輯關系,是一個可見的白盒模型(決策樹狀圖),而神經網絡和支持向量機等模型得到的是黑匣子關系,最終得到的是不同因素和結果之間的非線性映射函數關系。
3、針對復雜混凝土服役環境劣化條件以及最終劣化狀態響應,采用ID3算法得到最終的決策樹狀圖,并使用C4.5優化算法對決策樹進行減枝,能夠明顯提高決策樹的性能,更好的對海洋服役條件下混凝土強度劣化狀態做出預測評價,從而能得到建筑物強度的劣化即時信息,提前對建筑物耐久性破壞造成的危險進行評估。
附圖說明
圖1實施例中決策樹的構建圖;
圖2(a)(b)為訓練集和測試集的實驗和預測效果圖;
圖3(a)(b)為80組訓練集和36組測試集相對誤差;
圖4為C4.5算法減枝后決策樹;
圖5為116組減枝前后預測效果對比。
具體實施方式
下面對本發明技術方案進行詳細說明,但是本發明的保護范圍不局限于所述實施例。
實施例:一種海洋環境下混凝土強度裂化預測評價方法的預測方法,本實施例數據來源于不同實驗的116組混凝土實驗室人工模擬混凝土強度劣化的數據,具體操作如下:
(1)通過實驗檢測不同配比下混凝土隨齡期強度劣化的數據,并收集已有公開文獻中的數據形成數據庫。
(2)將獲得的運行數據分為(80)訓練組和(36)測試組,將各訓練組按屬性進行劃分,其中影響混凝土強度的因素作為因素屬性集,在表1所示的訓練樣例中,訓練組分為8個屬性:放入海水時的強度(Δx1),粉煤灰參量(Δx2),礦渣參量(Δx3),氯離子濃度(Δx4),鎂離子濃度(Δx5),硫酸根濃度(Δx6),時間(Δx7),溫度(Δx8)。強度劣化的狀態作為劣化結果屬性集,本實施例抗壓強度f作為輸出參數形成劣化結果屬性集。
(3)由于期望信息越小,信息增益越大,從而純度越高。所以構建決策樹的核心思想就是選擇分裂后信息增益最大的屬性作為特征屬性,再進行下一步分裂。其中,核心部分就是計算每個屬性的信息增益,根據信息增益獲得特征屬性,具體操作步驟如下:
(3.1)將訓練組按屬性進行劃分,計算每個屬性的信息增益,選擇信息增益值最大的屬性Δx作為特征屬性,并設置優先級,作為決策樹的中間節點,所對應的劣化狀態的屬性類別作為一級分支。信息增益計算如下所示:
設S是由8個輸入屬性組成的樣本集合,將樣本集劃分為10個不同的類Ci(i=1,2,…,10),每個類Ci含有的樣本數目為8,則S劃分為10個不同類的信息熵或期望信息為:
其中,pi為S中的樣本屬于i類Ci的概率,即pi=ni/n;SV是S中屬性Δx的值為V的樣本子集,選擇Δx導致的信息熵定義為:
其中,E(SV)是將SV中的樣本劃分到各個類的信息熵,屬性Δx相對樣本集合S的信息增益Gain(S,Δx)定義為:
Gain(S,Δx)=E(S)-E(S,Δx)
Gain(S,Δx)是指因知道屬性Δx的值后導致的熵的期望壓縮,Gain(S,Δx)越大,說明選擇測試屬性Δx對分類提供的信息越多。該步驟ID3算法就是在每個節點選擇信息增益(S,Δx)最大的屬性作為測試屬性。
(3.2)依次從訓練組中取出屬性,重復步驟(3.1),直至得到訓練元組中所有屬性的信息增益,對所有屬性的信息增益進行排序,息增益值最大的屬性即為特征屬性。經過計算,在表1所示的訓練樣本中,訓練組中8個屬性的信息增益中第Δx7個屬性鎂離子的信息增益最大,設為第一層分支節點,如圖1第一層節點所示。
表1混凝土強度劣化的部分數據及條件
(3.3)按照特征屬性的類別種類將訓練組進行劃分,訓練群組將Δx7剔除,并判斷剔除的特征屬性是存在使運行類別為劣化狀態的類別,則劣化狀態類別對應的下一節點為葉子節點,葉子節點中存儲劣化狀態的運行類別,轉向步驟(3.4)。
(3.4)在每個新劃分的訓練群組中計算每個屬性的信息增益,選擇信息增益值最大的屬性作為特征屬性,并設置優先級為r,作為決策樹的r級中間節點,其中r=2,3,4,…N,N為正整數,逐層形成決策樹節點;
(3.5)重復步驟(3.3)(3.4)直至新劃分的訓練群組中只存在一個屬性,將該屬性作為特征屬性,這個特征屬性的類別對應的運行類別均存儲在下一分支的葉子節點中,決策樹構建完成,如圖1所示。
(4)按照所述對應屬性的屬性值選擇輸出分支,直至到達葉子節點,將葉子節點存放的運行類別作為分析結果輸出,例如圖1中,每一個分支的終止就是運行的結果。
(5)評價模型性能
將80組訓練集和36組測試集的8個屬性值Δx,分別帶入(3)中的決策樹,得到劣化的強度數值,并通過公式a,b,c檢驗其精確度。
a.平均誤差
b.均方根誤差
c.擬合度
式中y為8個屬性對應的實驗測量值,yi為輸入8個屬性值后得到的預測強度劣化值。
(6)由于訓練樣本太少或數據中存在噪音和孤立點,許多分枝反映的是訓練樣本集中的異常現象,建立的決策樹會過度擬合訓練樣本集。剪枝方法可以減少訓練樣本集中噪音的影響,剪枝的時機選擇是很關鍵的。本專利采用C4.5算法,最小分度值為5,即擴展的葉子結點為每5個數據的匯總。
由訓練集得到的決策樹模型,減枝的主要過程為:使用剔除屬性之外的其他屬性設置為每一層的葉子節點,通過(4)中的公式分析決策樹性能,如果誤差下降就選擇新的屬性作為節點,分別使用其他屬性,例如放入海水初始強度(Δx1),粉煤灰參量(Δx2),礦渣參量(Δx3),氯離子濃度(Δx4),硫酸根濃度(Δx6),時間(Δx7),溫度(Δx8)代替鎂離子濃度(Δx5),作為第一級分支,誤差沒有下降,則不能代替,依次計算每一個分支節點,得到簡化后的決策樹,如圖4所示。減枝后的決策樹預測性能通過圖5可以看出。
本實施例實驗操作時使用不同配合比的混凝土試件,不同海域的海水濃度對混凝土進行侵蝕試驗,通過上文中的提到的建模方式,建立模型生成決策樹,得到if-than邏輯決策關系,從而對混凝土的性能劣化做出預測。通過對訓練集進行訓練,得到圖1的決策樹,然后檢驗決策樹的性能如圖2和3所示,訓練集和測試集平均相對偏差為7.64%和13.12%,其性能滿足工程需求。采用C4.5減枝算法得到減枝后的決策樹如圖4所示,此方法將ID3的模型簡化并且還能提高預測精度,如圖5。其中116組數據中ID3平均相對誤差為9.22%,減枝后平均相對誤差為7.85%。