基于人工智能隨機森林方法建立不同車型分零件遠程定損系統及方法
【專利摘要】基于人工智能隨機森林方法建立不同車型分零件遠程定損系統及方法,屬于車輛定損領域,為了解決車輛碰撞后,對于零件檢測的問題,技術要點是:零件檢測子系統,判斷車輛碰撞時零件所產生的損傷等級;所述零件檢測子系統對零件訓練數據進行學習從而生成零件模型,所述零件模型建立使用隨機森林方法。效果是:上述技術方案,可以實現對于車輛碰撞的零件檢測,在遠程定損的這個技術領域使用了機器學習的方法,針對的機器學習方法,在定損過程中,判別的準確率上得以提升。
【專利說明】
基于人工智能隨機森林方法建立不同車型分零件遠程定損系統及方法
技術領域
[0001]本發明屬于車輛定損領域,涉及一種基于人工智能隨機森林方法建立不同車型分零件遠程定損系統及方法。
【背景技術】
[0002]針對車輛在低速運動(包括低速道路行駛、車輛停靠等)過程中頻發碰撞事故而導致的理賠糾紛問題,遠程定損技術通過采集車輛行駛過程中的多種信號(如速度、加速度、角速度、聲音等)并用信號處理和機器學習技術加以分析,以判斷碰撞是否發生以及碰撞后車輛的損毀情況。
[0003]車輛發生碰撞事故后,前端設備能夠檢測出碰撞的發生并截取碰撞過程的信號,通過無線網絡發送至云端,遠程服務器從收到的信號中抽取出事先設計的特征值,用機器學習算法進行分析,先判斷碰撞數據的準確性,再判斷碰撞物體和工況情況,以確定碰撞數據集對什么零件產生了哪種等級的損傷,然后根據零件損傷等級計算出參考理賠金額并發送至保險公司。這期間會涉及對于車型、工況、目標、零件和區域的檢測。
【發明內容】
[0004]為了解決車輛碰撞后,對于零件檢測的問題,本發明提出了一種基于人工智能隨機森林方法建立不同車型分零件遠程定損系統及方法,以實現定損過程中的零件檢測。
[0005]為了解決上述技術問題,本發明提供的技術方案的要點是:包括:
[0006]車型選擇子系統,選擇車輛所對應的車型數據作為總數據集;
[0007]數據分類子系統,讀取CAE仿真數據和實車數據,并相應對數據進行分類;
[0008]碰撞檢測子系統,判斷車輛在行車過程中是否發生碰撞;所述碰撞檢測子系統對碰撞訓練數據進行學習從而生成碰撞模型,所述碰撞模型建立使用隨機森林方法;
[0009]工況檢測子系統,判斷碰撞發生的所有工況信息;所述工況檢測子系統對工況訓練數據進行學習從而生成工況模型,所述工況模型建立使用隨機森林方法;
[0010]零件檢測子系統,判斷車輛碰撞時零件所產生的損傷等級;所述零件檢測子系統對零件訓練數據進行學習從而生成零件模型,所述零件模型建立使用隨機森林方法。
[0011 ]有益效果:上述技術方案,可以實現對于車輛碰撞的零件檢測,在遠程定損的這個技術領域使用了機器學習的方法,針對的機器學習方法,在定損過程中,判別的準確率上得以提升;本發明通過選擇車型來導入該車型所對應的數據,而數據分類則是為了模型訓練和測試的目的而加入的步驟;零件的檢測是該方案實現的目的,是經過一系列操作所要得到的結果。
【附圖說明】
[0012]圖1為本發明所述的系統的結構示意框圖。
【具體實施方式】
[0013]為了對本發明作出更為清楚的解釋,下面對本發明涉及的技術術語作出定義:
[0014]工況:碰撞角度、方向、目標、區域等全體碰撞信息;
[0015]車型:汽車型號;
[0016]目標:碰撞目標;
[0017]區域:碰撞位置;
[0018]零件:汽車零件;
[0019]工況檢測:檢測本車碰撞角度、方向、目標、區域等全體碰撞信息;
[0020]車型檢測:檢測與本車發生碰撞的汽車型號;
[0021]目標檢測:檢測本車碰撞目標;
[0022]區域檢測:檢測本車碰撞位置;
[0023]零件檢測:檢測本車汽車零件。
[0024]實施例1:
[0025]—種基于人工智能隨機森林方法建立不同車型分零件遠程定損系統,包括:
[0026]車型選擇子系統,選擇車輛所對應的車型數據作為總數據集;
[0027]數據分類子系統,讀取CAE仿真數據和實車數據,并相應對數據進行分類;
[0028]碰撞檢測子系統,判斷車輛在行車過程中是否發生碰撞;所述碰撞檢測子系統對碰撞訓練數據進行學習從而生成碰撞模型,所述碰撞模型建立使用隨機森林方法;
[0029]工況檢測子系統,判斷碰撞發生的所有工況信息;所述工況檢測子系統對工況訓練數據進行學習從而生成工況模型,所述工況模型建立使用隨機森林方法;
[0030]零件檢測子系統,判斷車輛碰撞時零件所產生的損傷等級;所述零件檢測子系統對零件訓練數據進行學習從而生成零件模型,所述零件模型建立使用隨機森林方法。
[0031 ]所述碰撞檢測子系統包括,碰撞訓練模塊、碰撞測試模塊、碰撞驗證模塊,所述碰撞訓練模塊用于對碰撞訓練數據進行學習從而生成碰撞模型,碰撞測試模塊用于將碰撞測試數據帶入碰撞模型中檢測碰撞模型的結果,碰撞驗證模塊使用真實跑車數據驗證碰撞模型的可靠性和準確率;
[0032]所述工況檢測子系統包括,工況訓練模塊、工況測試模塊、工況驗證模塊,所述工況訓練模塊用于對工況訓練數據進行學習從而生成工況模型,所述工況測試模塊用于將工況測試數據帶入模型中檢測工況模型的結果,工況驗證模塊使用真實跑車數據驗證工況模型的可靠性和準確率;
[0033]所述零件檢測子系統包括,零件訓練模塊、零件測試模塊、零件驗證模塊,所述零件訓練模塊用于將零件訓練數據進行學習從而生成零件模型,零件測試模塊用于將零件測試數據帶入模型中檢測零件模型的結果,零件驗證模塊使用真實跑車數據驗證零件模型的可靠性和準確率。
[0034]所述隨機森林方法的步驟是:
[0035]步驟1.使用隨機森林方法建立模型;
[0036]步驟2.使用隨機森林的預測。
[0037]其中,所述步驟I包括:
[0038]步驟1.1.給定訓練集S,測試集T,特征維數F;
[0039]確定參數:使用到的CART的數量t,每棵樹的深度d,每個節點使用到的特征數量f;
[0040]終止條件:節點上最少樣本數s,節點上最少的信息增益m;
[0041]對于第Ι-t 棵樹,i = l_t:
[0042]步驟1.2.從S中有放回的抽取大小和S—樣的訓練集S( i),作為根節點的樣本,從根節點開始訓練;
[0043]步驟1.3.如果當前節點上達到終止條件,則設置當前節點為葉子節點;
[0044]如果是分類問題,該葉子節點的預測輸出為當前節點樣本集合中數量最多的那一類C( j),概率P為c( j)占當前樣本集的比例;
[0045]如果是回歸問題,預測輸出為當前節點樣本集各個樣本值的平均值,然后繼續訓練其他節點;
[0046]如果當前節點沒有達到終止條件,則從F維特征中無放回的隨機選取f維特征,利用f維特征,尋找分類效果最好的一維特征k及其閾值th,當前節點上樣本第k維特征小于th的樣本被劃分到左節點,其余的被劃分到右節點,繼續訓練其他節點;有關分類效果的評判標準在后面會講。
[0047]步驟1.4.重復步驟2至步驟3,直到所有節點都訓練過了或者被標記為葉子節點。
[0048]步驟1.5.重復重復步驟2至步驟4,直到所有CART都被訓練過;
[0049]所述步驟2包括,對于第Ι-t棵樹,i = l_t,進行如下操作:
[OO5O ]步驟2.1.從當前樹的根節點開始,根據當前節點的閾值t h,判斷是進入左節點(〈th),還是進入右節點(> = th),直到到達某個葉子節點,并輸出預測值;
[0051 ]步驟2.2.重復執行步驟2.1,直到所有的t棵樹都輸出了預測值;
[0052]如果是分類問題,則輸出為所有樹中預測概率總和最大的那一個類,即對每個c(j)的P進行累計;如果是回歸問題,則輸出為所有樹的輸出的平均值。
[0053]對于分類問題(將某個樣本劃分到某一類),也就是離散變量問題,CART使用Gini值作為評判標準。定義為Gini = 1-E (P( i )*P( i)),P( i)為當前節點上數據集中第i類樣本的比例。例如:分為2類,當前節點上有100個樣本,屬于第一類的樣本有70個,屬于,第二類的樣本有30個,則Gini = 1-0.7 X 07-0.3X03 = 0.42,可以看出,類別分布越平均,Gini值越大,類分布越不均勾,Gini值,越小。在尋找最佳的分類特征和閾值時,評判標準為:argmax(Gin1-GiniLeft-GiniRight),即尋找最佳的特征f和閾值th,使,得當前節點的Gini值減去左子節點的Gini和右子節點的Gini值最大。
[0054]實施例2:
[0055]—種基于人工智能隨機森林方法建立不同車型分零件遠程定損方法,包括以下步驟:
[0056]步驟一.選擇車輛所對應的車型數據作為總數據集;
[0057]步驟二.讀取CAE仿真數據和實車數據,并相應對數據進行分類;
[0058]步驟三.判斷車輛在行車過程中是否發生碰撞;所述碰撞檢測子系統對碰撞訓練數據進行學習從而生成碰撞模型,所述碰撞模型建立使用隨機森林方法;
[0059]步驟四.判斷碰撞發生的所有工況信息;所述工況檢測子系統對工況訓練數據進行學習從而生成工況模型,所述工況模型建立使用隨機森林方法;
[0060]步驟五.判斷車輛碰撞時零件所產生的損傷等級;所述零件檢測子系統對零件訓練數據進行學習從而生成零件模型,所述零件模型建立使用隨機森林方法。
[0061]具體步驟是:
[0062]步驟三包括:
[0063]S3.1.使用碰撞檢測子系統對CAE碰撞仿真數據處理,再對其進行分類以產生碰撞訓練數據和碰撞測試數據;
[0064]S3.2.在碰撞訓練模塊中對碰撞訓練數據進行學習并產生碰撞模型,來模擬碰撞訓練數據的效果;
[0065]S3.3.在碰撞測試模塊中使用碰撞測試數據來測試碰撞模型的結果;
[0066]S3.4.使用真實跑車數據作為碰撞驗證數據并帶入碰撞驗證模塊,來驗證碰撞模型的準確性;
[0067]步驟四包括:
[0068]S4.1.使用工況檢測子系統對CAE工況仿真數據處理,再對其進行分類產生工況訓練數據和工況測試數據;
[0069]S4.2.在工況訓練模塊中對工況訓練數據進行學習并產生工況模型,來模擬工況訓練數據的效果;
[0070]S4.3.在工況測試模塊中使用工況測試數據來測試工況模型的結果;
[0071]S4.4.使用真實跑車數據作為工況驗證數據并帶入工況驗證模塊,來驗證工況模型的準確性;
[0072]步驟五包括:
[0073]S1.使用零件檢測子系統對CAE零件仿真數據處理,再對其進行分類以產生零件訓練數據和零件測試數據;
[0074]S2.在零件訓練模塊中對零件訓練數據進行學習并產生零件模型,來模擬零件訓練數據的效果;
[0075]S3.在零件測試模塊中使用零件測試數據來測試零件模型的結果;
[0076]S4.使用真實跑車數據作為零件驗證數據并帶入零件驗證模塊,來驗證零件模型的準確性。
[0077]所述隨機森林方法的步驟是:
[0078]步驟1.使用隨機森林方法建立模型;
[0079]步驟2.使用隨機森林的預測。
[0080]其中,所述步驟I包括:
[0081 ]步驟1.1.給定訓練集S,測試集T,特征維數F;
[0082]確定參數:使用到的CART的數量t,每棵樹的深度d,每個節點使用到的特征數量f;
[0083]終止條件:節點上最少樣本數s,節點上最少的信息增益m;
[0084]對于第Ι-t 棵樹,i = l_t:
[0085]步驟1.2.從S中有放回的抽取大小和S—樣的訓練集S( i),作為根節點的樣本,從根節點開始訓練;
[0086]步驟1.3.如果當前節點上達到終止條件,則設置當前節點為葉子節點;
[0087]如果是分類問題,該葉子節點的預測輸出為當前節點樣本集合中數量最多的那一類C( j),概率P為c( j)占當前樣本集的比例;
[0088]如果是回歸問題,預測輸出為當前節點樣本集各個樣本值的平均值,然后繼續訓練其他節點;
[0089]如果當前節點沒有達到終止條件,則從F維特征中無放回的隨機選取f維特征,利用f維特征,尋找分類效果最好的一維特征k及其閾值th,當前節點上樣本第k維特征小于th的樣本被劃分到左節點,其余的被劃分到右節點,繼續訓練其他節點。
[0090]步驟1.4.重復步驟2至步驟3,直到所有節點都訓練過了或者被標記為葉子節點。[0091 ] 步驟1.5.重復重復步驟2至步驟4,直到所有CART都被訓練過;
[0092]所述步驟2包括,對于第Ι-t棵樹,i = l_t,進行如下操作:
[0093]步驟2.1.從當前樹的根節點開始,根據當前節點的閾值th,判斷是進入左節點(<th),還是進入右節點(> = th),直到到達某個葉子節點,并輸出預測值;
[0094]步驟2.2.重復執行步驟2.1,直到所有的t棵樹都輸出了預測值;
[0095]如果是分類問題,則輸出為所有樹中預測概率總和最大的那一個類,即對每個c(j)的P進行累計;如果是回歸問題,則輸出為所有樹的輸出的平均值。
[0096]對于分類問題(將某個樣本劃分到某一類),也就是離散變量問題,CART使用Gini值作為評判標準。定義為Gini = 1-E (P( i )*P( i)),P( i)為當前節點上數據集中第i類樣本的比例。例如:分為2類,當前節點上有100個樣本,屬于第一類的樣本有70個,屬于,第二類的樣本有30個,則Gini = 1-0.7 X 07-0.3X03 = 0.42,可以看出,類別分布越平均,Gini值越大,類分布越不均勾,Gini值,越小。在尋找最佳的分類特征和閾值時,評判標準為:argmax(Gin1-GiniLeft-GiniRight),即尋找最佳的特征f和閾值th,使,得當前節點的Gini值減去左子節點的Gini和右子節點的Gini值最大。
[0097]實施例3:
[0098]作為實施例1或2的進一步補充:對隨機森林方法進行說明:
[0099]在機器學習中,隨機森林由許多的決策樹組成,因為這些決策樹的形成采用了隨機的方法,因此也叫做隨機決策樹。隨機森林中的樹之間是沒有關聯的。當測,試數據進入隨機森林時,其實就是讓每一顆決策樹進行分類,最后取所有決策樹中分類結果最多的那類為最終的結果。因此隨機森林是一個包含多個決策樹的分類,器,并且其輸出的類別是由個別樹輸出的類別的眾數而定。隨機森林可以既可以處理屬性為離散值的量,比如ID3算法,也可以處理屬性為連續值的量,比如,C4.5算法。另外,隨機森林還可以用來進行無監督學習聚類和異常點檢測。
[0100]隨機森林由決策樹組成,決策樹實際上是將空間用超平面進行劃分的一種方法,每次分割的時候,都將當前的空間一分為二,比如說下面的決策樹(其屬性的值都是連續的實數):
[0101 ]隨機深林的優點:比較適合做多分類問題;訓練和預測速度快;對訓練數據的容錯能力,是一種有效地估計缺失數據的一種方法,當數據集中有大比例的數據缺失時,仍然可以保持精度不變;能夠有效地處理大的數據集;可以處理沒有刪減的成千上萬的變量;能夠在分類的過程中可以生成一個泛化誤差的內部無偏估計;能夠檢測到特征之間的相互影響以及重要性程度;不過出現過度擬合;實現簡單容易并行化。
[0102]本發明使用隨機森林方法建立模型方法,具體實現方法如下:
[0103]步驟1.給定訓練集S,測試集T,特征維數F。確定參數:使用到的CART的數量t,每棵樹的深度d,每個節點使用到的特征數量f,終止條件:節點上最少樣本數S,節點上最少的信息增益m。
[0104]對于第l_t 棵樹,i = l_t:
[0105]步驟2.從S中有放回的抽取大小和S—樣的訓練集S(i),作為根節點的樣本,從根節點開始訓練
[0106]步驟3.如果當前節點上達到終止條件,則設置當前節點為葉子節點,如果是分類問題,該葉子節點的預測輸出為當前節點樣本集合中數量最多的那一類c(j),,概率P為c(j)占當前樣本集的比例;如果是回歸問題,預測輸出為當前節點樣本集各個樣本值的平均值。然后繼續訓練其他節點。如果當前節點沒有達到終止條,件,則從F維特征中無放回的隨機選取f維特征。利用這f維特征,尋找分類效果最好的一維特征k及其閾值th,當前節點上樣本第k維特征小于th的樣本被劃,分到左節點,其余的被劃分到右節點。繼續訓練其他節點。有關分類效果的評判標準在后面會講。
[0107]步驟4.重復(2)(3)直到所有節點都訓練過了或者被標記為葉子節點。
[0108]步驟5.重復(2),(3),(4)直到所有CART都被訓練過。
[0109]利用隨機森林的預測過程如下:
[0110]對于第ι-t 棵樹,i = l_t:
[0?11 ]步驟1.從當前樹的根節點開始,根據當前節點的閾值th,判斷是進入左節點(〈th)還是進入右節點(> = th),直到到達,某個葉子節點,并輸出預測值。
[0112]步驟2.重復執行(I)直到所有t棵樹都輸出了預測值。如果是分類問題,則輸出為所有樹中預測概率總和最大的那一個類,即對每個c(j)的P進行累計;如果是回歸問題,則輸出為所有樹的輸出的平均值。
[0113]注:有關分類效果的評判標準,因為使用的是CART,因此使用的也是CART的評判標準,和C3.0,C4.5都不相同。
[0114]對于分類問題(將某個樣本劃分到某一類),也就是離散變量問題,CART使用Gini值作為評判標準。定義為Gini = 1-, Σ (P(i)*P(i)),P(i)為當前節點上數據集中第i類樣本的比例。例如:分為2類,當前節點上有100個樣本,屬于第一類的樣本有70個,屬于,第二類的樣本有30個,則Gini = 1-0.7 X 07-0.3X03 = 0.42,可以看出,類別分布越平均,Gini值越大,類分布越不均勾,Gini值,越小。在尋找最佳的分類特征和閾值時,評判標準為:argmax(Gin1-GiniLeft-GiniRight),即尋找最佳的特征f和閾值th,使,得當前節點的Gini值減去左子節點的Gini和右子節點的Gini值最大。
[0115]實施例4:具有與實施例1或2或3相同的技術方案,更為具體的是:
[0116]上述方案中的總體數據集:全部是CAE仿真數據和跑車數據;分為三份如下
[0117]1.訓練數據集:是用來訓練模型或確定模型參數(CAE仿真數據和跑車數據)。
[0118]2.驗證數據集:是用來做模型選擇(model ,select1n),即做模型的最終優化及確定的(CAE仿真數據和跑車數據)。
[0119]3.測試數據集:則純粹是為了測試已經訓練好的模型的推廣能力。(CAE仿真數據和跑車數據)。
[0120]本實施例中還對定損過程中涉及的濾波、加權選取、特征提取、歸一化、特征變換作出了說明。
[0121]1.濾波器技術:已實現的濾波方法包括FIR濾波、FIR切比雪夫逼近法、切比雪夫濾波、巴特沃茲濾波等,在主程序的Filtering.m文件實現。各濾波器均為常見的濾波器,Matlab都有相應的函數實現,具體算法可參考信號處理專業書籍。此處給出FIR濾波器的內容和流程的介紹。
[0122]有限沖擊響應數字濾波器(FIR,Finite,Impulse,Response)是一種全零點的系統,FIR濾波器的設計在保證幅度特性滿足技術要求的同事,很容易做到嚴格的線性相位特性,所以據有穩定和線性相位特性是FIR濾波器的突出優點。切比雪夫逼近法是一種等波紋逼近法,能夠使誤差頻帶均勻分布,對同樣的技術指標,這種比肩發需要的濾波器階數低,對于同樣階數的濾波器,這種逼近法最大誤差最小,其設計的主要步驟如下:
[0123]步驟1:濾波器參數的設置
[0124]濾波器的參數包括:通帶截止頻率、阻帶截止頻率、通帶最大衰減和阻帶最小衰減;
[0125]步驟2:設置在通帶和阻帶上理想的幅頻響應
[0126]步驟3:給定在通帶截止頻率和阻帶截止頻率點上的加權
[0127]步驟4:利用方程計算切比雪夫逼近法濾波器系數
[0128]步驟5:保存系數
[0129]步驟6:提取系數進行數據濾波
[0130]其中:濾波器參數的設置是為了保證信號在進行處理的過程中不會出現失真現象,濾波后的信號的截止頻率和采樣頻率需要滿足奈奎斯特定理,也就是在濾波后信號的最高頻率不能超過原信號采樣頻率的1/2,否則就會出現漏頻現象。根據目前項目中的信號采集板的采樣頻率主要是50Hz和IKHz,以50Hz為例根據公式F#±,〈50/2,故選擇濾波器截止頻率在25以下。
[0131]2.特征提取技術:特征抽取是在碰撞信號上進行的。判斷碰撞使用的特征包括窗口內加速度絕對值的最大值、窗口內加速度最大值與最小值之間的差值、窗口內加速度的平均能量(窗口內所有點的加速度的平方和除以點數)、窗口內各點斜率的絕對值的平均值。
[0132]判斷零件種類所使用的特征包括速度、加速度最大值到最小值之間的平均能量、最大值和最小值之間的幅值,/,兩者之間的寬度、加速度最大值、加速度最小值、最大值所在半波的寬度、最小值所在半波的寬度、最大值和最小值之間的差值、最大值到最小值之間的跨度、各點斜率的絕對值的平均值、信號進行傅立葉變換后O?38頻率范圍內的信號的各個頻率分量的幅值。
[0133]3.歸一化技術:為了消除特征之間的量綱或數量級不同而對分類任務造成的不利影響,需要對特征數據進行歸一化處理,使得各特征值之間具有可比性,避免數值較大的特征淹沒數值較小的特征。原始的特征數據經過歸一化處理后,各特征處于相同的值域范圍。由于Z-Score的性能表現更好,使用Z-Score做為歸一化方法。
[0134]4.特征變換技術:在特征較多的情況下,為了消除特征之間的相關性并減少冗余特征,需要對特征進行變換,用盡可能少的新特征來反映樣本信息。在實驗樣本較少的情況下(本項目的實際情況)降低過多的特征維數,還能在一定程度上避免過擬合或欠擬合的發生。根據實際需要,目前已實現的特征變換是PCA。通過實驗發現,PCA對于提高本項目的分類性能并無幫助,甚至還有所下降,這是由于目前所使用的特征較少,沒有冗余特征,因此暫不使用PCA,但是隨著后續特征的逐步增加,不排除以后使用PCA的可能性。
[0135]附圖1中,記載的:車型選擇即為本發明中的車型選擇子系統;數據分類模塊即為本發明中的數據分類子系統;碰撞判斷模塊即為本發明中的碰撞檢測子系統;工況檢測模塊即為本發明的工況檢測子系統;車型檢測模塊即為本發明的車型檢測子系統;零件檢測模塊即零件檢測子系統;目標檢測模塊即為本發明的目標檢測子系統,區域檢測模塊即為本發明的區域檢測子系統。
[0136]以上所述,僅為本發明創造較佳的【具體實施方式】,但本發明創造的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發明創造披露的技術范圍內,根據本發明創造的技術方案及其發明構思加以等同替換或改變,都應涵蓋在本發明創造的保護范圍之內。
【主權項】
1.一種基于人工智能隨機森林方法建立不同車型分零件遠程定損系統,其特征在于,包括: 車型選擇子系統,選擇車輛所對應的車型數據作為總數據集; 數據分類子系統,讀取CAE仿真數據和實車數據,并相應對數據進行分類; 碰撞檢測子系統,判斷車輛在行車過程中是否發生碰撞;所述碰撞檢測子系統對碰撞訓練數據進行學習從而生成碰撞模型,所述碰撞模型建立使用隨機森林方法; 工況檢測子系統,判斷碰撞發生的所有工況信息;所述工況檢測子系統對工況訓練數據進行學習從而生成工況模型,所述工況模型建立使用隨機森林方法; 零件檢測子系統,判斷車輛碰撞時零件所產生的損傷等級;所述零件檢測子系統對零件訓練數據進行學習從而生成零件模型,所述零件模型建立使用隨機森林方法。2.如權利要求1所述的基于人工智能隨機森林方法建立不同車型分零件遠程定損系統,其特征在于, 所述碰撞檢測子系統包括,碰撞訓練模塊、碰撞測試模塊、碰撞驗證模塊,所述碰撞訓練模塊用于對碰撞訓練數據進行學習從而生成碰撞模型,碰撞測試模塊用于將碰撞測試數據帶入碰撞模型中檢測碰撞模型的結果,碰撞驗證模塊使用真實跑車數據驗證碰撞模型的可靠性和準確率; 所述工況檢測子系統包括,工況訓練模塊、工況測試模塊、工況驗證模塊,所述工況訓練模塊用于對工況訓練數據進行學習從而生成工況模型,所述工況測試模塊用于將工況測試數據帶入模型中檢測工況模型的結果,工況驗證模塊使用真實跑車數據驗證工況模型的可靠性和準確率; 所述零件檢測子系統包括,零件訓練模塊、零件測試模塊、零件驗證模塊,所述零件訓練模塊用于將零件訓練數據進行學習從而生成零件模型,零件測試模塊用于將零件測試數據帶入模型中檢測零件模型的結果,零件驗證模塊使用真實跑車數據驗證零件模型的可靠性和準確率。3.如權利要求1或2所述的基于人工智能隨機森林方法建立不同車型分零件遠程定損系統,其特征在于,所述隨機森林方法的步驟是: 步驟I.使用隨機森林方法建立模型; 步驟2.使用隨機森林的預測。4.如權利要求3所述的基于人工智能隨機森林方法建立不同車型分零件遠程定損系統,所述步驟I包括: 步驟1.1.給定訓練集S,測試集T,特征維數F,確定以下參數:使用到的CART的數量t,每棵樹的深度d,每個節點使用到的特征數量f; 確定終止條件:節點上最少樣本數S,節點上最少的信息增益m; 對于第1-t棵樹,i = Ι-t: 步驟1.2.從訓練集S中有放回的抽取大小和訓練集S—樣的訓練集S( i),作為根節點的樣本,從根節點開始訓練; 步驟1.3.如果當前節點上達到終止條件,則設置當前節點為葉子節點; 如果是分類問題,該葉子節點的預測輸出為當前節點樣本集合中數量最多的那一類c(j),概率P為C( j)占當前樣本集的比例; 如果是回歸問題,預測輸出為當前節點樣本集各個樣本值的平均值,然后繼續訓練其他節點; 如果當前節點沒有達到終止條件,則從F維特征中無放回的隨機選取f維特征,利用f維特征,尋找分類效果最好的一維特征k及其閾值th,當前節點上樣本第k維特征小于th的樣本被劃分到左節點,其余的被劃分到右節點,繼續訓練其他節點; 步驟1.4.重復步驟1.2至步驟1.3,直到所有節點都訓練過了或者被標記為葉子節點; 步驟1.5.重復重復步驟1.2至步驟1.4,直到所有CART都被訓練過。5.如權利要求3所述的基于人工智能隨機森林方法建立不同車型分零件遠程定損系統,其特征在于,所述步驟2,對于第1-t棵樹,i = 1-t,進行如下操作: 步驟2.1.從當前樹的根節點開始,根據當前節點的閾值th,判斷是進入左節點(〈th),還是進入右節點(> = th),直到到達某個葉子節點,并輸出預測值; 步驟2.2.重復執行步驟2.1,直到所有的t棵樹都輸出了預測值; 如果是分類問題,則輸出為所有樹中預測概率總和最大的那一個類,即對每個c(j)的P進行累計;如果是回歸問題,則輸出為所有樹的輸出的平均值。6.—種基于人工智能隨機森林方法建立不同車型分零件遠程定損方法,其特征在于,包括以下步驟: 步驟一.選擇車輛所對應的車型數據作為總數據集; 步驟二.讀取CAE仿真數據和實車數據,并相應對數據進行分類; 步驟三.判斷車輛在行車過程中是否發生碰撞;對碰撞訓練數據進行學習從而生成碰撞模型,所述碰撞模型建立使用隨機森林方法; 步驟四.判斷碰撞發生的所有工況信息;對工況訓練數據進行學習從而生成工況模型,所述工況模型建立使用隨機森林方法; 步驟五.判斷車輛碰撞時零件所產生的損傷等級;對零件訓練數據進行學習從而生成零件模型,所述零件模型建立使用隨機森林方法。7.如權利要求6所述的基于人工智能隨機森林方法建立不同車型分零件遠程定損方法,其特征在于,具體步驟是: 步驟三包括: 53.1.使用碰撞檢測子系統對CAE碰撞仿真數據處理,再對其進行分類以產生碰撞訓練數據和碰撞測試數據; 53.2.在碰撞訓練模塊中對碰撞訓練數據進行學習并產生碰撞模型,來模擬碰撞訓練數據的效果; 53.3.在碰撞測試模塊中使用碰撞測試數據來測試碰撞模型的結果; 53.4.使用真實跑車數據作為碰撞驗證數據并帶入碰撞驗證模塊,來驗證碰撞模型的準確性; 步驟四包括: 54.1.使用工況檢測子系統對CAE工況仿真數據處理,再對其進行分類產生工況訓練數據和工況測試數據; 54.2.在工況訓練模塊中對工況訓練數據進行學習并產生工況模型,來模擬工況訓練數據的效果; 54.3.在工況測試模塊中使用工況測試數據來測試工況模型的結果; 54.4.使用真實跑車數據作為工況驗證數據并帶入工況驗證模塊,來驗證工況模型的準確性; 步驟五包括: 51.使用零件檢測子系統對CAE零件仿真數據處理,再對其進行分類以產生零件訓練數據和零件測試數據; 52.在零件訓練模塊中對零件訓練數據進行學習并產生零件模型,來模擬零件訓練數據的效果; 53.在零件測試模塊中使用零件測試數據來測試零件模型的結果; 54.使用真實跑車數據作為零件驗證數據并帶入零件驗證模塊,來驗證零件模型的準確性。8.如權利要求6或7所述的基于人工智能隨機森林方法建立不同車型分零件遠程定損方法,其特征在于,所述隨機森林方法的步驟是: 步驟I.使用隨機森林方法建立模型; 步驟2.使用隨機森林的預測。9.如權利要求8所述的基于人工智能隨機森林方法建立不同車型分零件遠程定損方法,所述步驟I包括: 所述步驟I包括: 步驟1.1.給定訓練集S,測試集T,特征維數F,確定以下參數:使用到的CART的數量t,每棵樹的深度d,每個節點使用到的特征數量f; 確定終止條件:節點上最少樣本數S,節點上最少的信息增益m; 對于第1-t棵樹,i = Ι-t: 步驟1.2.從訓練集S中有放回的抽取大小和訓練集S—樣的訓練集S( i),作為根節點的樣本,從根節點開始訓練; 步驟1.3.如果當前節點上達到終止條件,則設置當前節點為葉子節點; 如果是分類問題,該葉子節點的預測輸出為當前節點樣本集合中數量最多的那一類c(j),概率P為C( j)占當前樣本集的比例; 如果是回歸問題,預測輸出為當前節點樣本集各個樣本值的平均值,然后繼續訓練其他節點; 如果當前節點沒有達到終止條件,則從F維特征中無放回的隨機選取f維特征,利用f維特征,尋找分類效果最好的一維特征k及其閾值th,當前節點上樣本第k維特征小于th的樣本被劃分到左節點,其余的被劃分到右節點,繼續訓練其他節點; 步驟1.4.重復步驟1.2至步驟1.3,直到所有節點都訓練過了或者被標記為葉子節點; 步驟1.5.重復重復步驟1.2至步驟1.4,直到所有CART都被訓練過。10.如權利要求8所述的基于人工智能隨機森林方法建立不同車型分零件遠程定損方法,其特征在于,所述步驟2,對于第1-t棵樹,i = 1-t,進行如下操作: 步驟2.1.從當前樹的根節點開始,根據當前節點的閾值th,判斷是進入左節點(〈th),還是進入右節點(> = th),直到到達某個葉子節點,并輸出預測值; 步驟2.2.重復執行步驟2.1,直到所有的t棵樹都輸出了預測值; 如果是分類問題,則輸出為所有樹中預測概率總和最大的那一個類,即對每個c(j)的P進行累計;如果是回歸問題,則輸出為所有樹的輸出的平均值。
【文檔編號】G06K9/62GK106056150SQ201610365554
【公開日】2016年10月26日
【申請日】2016年5月27日
【發明人】田雨農, 劉俊俍
【申請人】大連樓蘭科技股份有限公司