一種基于相關性原理的動態樣本點選取方法
【專利摘要】本發明公開了一種基于相關性原理的動態樣本點選取方法,是基于相關性的原理,根據初始選取的樣本點信息,計算每個樣本點的留一誤差,針對留一誤差較大的樣本點,采用變異函數計算每個變量方向留一誤差的影響范圍,進而確定該樣本點處每個變量方向的加點區域范圍,最后在每個加點區域增選樣本點,實現樣本點的針對性選取。本發明充分利用性能空間的特性來指導樣本點的選取區間,進而實現樣本點的“按需分配”,在樣本點的選取上考慮了函數空間對樣本點分布的需求,對應的近似模型的精確度明顯高于一次性樣本點選取所對應的近似模型,樣本點的利用效率更高。
【專利說明】一種基于相關性原理的動態樣本點選取方法
【技術領域】
[0001] 本發明涉及一種樣本的的選取方法,具體是一種基于相關性原理的動態樣本點選 取方法。
【背景技術】
[0002] 由于船型性能的數值計算很耗時,而船型優化中需要對成百上千的船型方案進行 性能計算,因此為了提高船型優化的效率,實現其工程應用,往往需要構建船型相關性能的 近似模型。在構建近似模型的過程中,樣本點的選取至關重要,因為它為近似模型的構建提 供數據依據。這里的每個樣本點代表著一種方案,也就是一個船型方案。傳統的做法是根 據變量的變化范圍,在變量空間G s中均勻地選取樣本點Pn(P1,P2,…Pn),然后計算每個樣本 點對應船型的相關性能,最后根據樣本點的計算結果構建相關的近似模型,具體流程如圖1 所示。
[0003] 這類方法的實質是把整個變量空間同等對待,沒有考慮船型性能空間的差異性, 本質上是一種靜態的樣本點選取方法。這一方式的優點是操作簡單,易于實現,但缺點是樣 本點利用率不高,不能根據得到的性能空間信息進行樣本點"有選擇"地分布。因為其缺乏 對船型性能F(X)空間特性的考慮,將整個變量空間同等考慮。某一區域樣本點的數量僅取 決于該變量區域在整個變量空間中所占比例的大小,而沒有考慮該變量區域對應的船型性 能空間的變化。如果該區域船型性能空間變化劇烈,則需要更多的樣本點才能保證近似模 型的精確度,反之較少的樣本點就能構建出高精確度的近似模型。
[0004] 以Farhang-Mehr函數為例,如果直接應用均勻設計方法在變量空間選取均勻分 布的21個樣本點,其分布如圖2中點所示。可見樣本點分布的多少僅與區間大小有關,即 每個單位區域分布的樣本點數量是一定的,但是將樣本點對應到目標函數空間中,發現目 標函數空間對樣本點的需求卻不是均衡的。在這種情況下,如果想提高近似模型的精確度 只能通過不斷地增加樣本點數,這對實際優化問題來說是難以接受的。
[0005] 對于船舶性能空間而言,同樣存在上述問題。圖3所示為船體曲面參數對應的船 體興波阻力空間,其中實線圓圈區域對應的性能空間較為平緩,虛線圓圈區域對應的性能 空間振蕩更加劇烈。而實線圓圈區域對應的變量空間稍大,因此采用均勻設計方法選取樣 本點時,該區域會比虛線圓圈區域有更多的樣本點,但是從性能空間的特性來看,反而是虛 線圓圈區域需要更多的樣本點。此時采用均勻設計選取樣本點就會存在樣本點"分配"不 合理的問題,沒有實現樣本點的"按需分配"。
【發明內容】
[0006] 本發明的目的在于提供一種近似模型精確度更好、樣本點利用率更高的基于相關 性原理的動態樣本點選取方法,以解決上述【背景技術】中提出的問題。
[0007] 為實現上述目的,本發明提供如下技術方案:
[0008] -種基于相關性原理的動態樣本點選取方法,是基于相關性的原理,根據初始選 取的樣本點信息,計算每個樣本點的留一誤差,針對留一誤差較大的樣本點,采用變異函數 計算每個變量方向留一誤差的影響范圍,進而確定該樣本點處每個變量方向的加點區域范 圍,最后在每個加點區域增選樣本點,實現樣本點的針對性選取;
[0009] 所述基于相關性原理的動態樣本點選取方法的具體流程,包括如下步驟:
[0010] 1)首先確定優化變量及其取值范圍,同時根據優化變量數和取值范圍,采用均勻 設計方法初次選取一定數量均勻分布的樣本點;
[0011] 2)計算初次選取的樣本點的目標函數值,即對應船型的相關性能值;
[0012] 3)將數據歸一化處理便于分析以及后續神經網絡近似模型的建立,再采用留一法 分別計算每個初始樣本點的留一誤差,并判斷其留一誤差是否滿足要求,如果所有樣本點 的留一誤差均滿足要求則構建整個性能空間的近似模型,否則繼續進行后續步驟;
[0013] 4)計算每個變量方向的變異函數,求取每個變量方向的變程,從而確定留一誤差 在該變量方向的影響范圍;
[0014] 5)針對每個留一誤差較大的樣本點,根據變程分別確定其在每個變量方向的加點 區域范圍,進而確定該樣本點處的加點區域,最后采用均勻設計方法在每個加點區域增選 樣本點;
[0015] 6)判斷增選樣本點后的樣本點數是否達到優化所能承受的最大樣本點數,如果達 至IJ,則構建整個性能空間的近似模型,否則繼續進行后續步驟;
[0016] 7)計算每個增選樣本點的留一誤差,如果留一誤差滿足要求,則構建整個性能空 間的近似模型,否則計算增選樣本點區域的變異函數,并回到步驟4)。
[0017] 作為本發明進一步的方案:所述留一法的基本原理是從所有樣本點中抽取一個作 為測試點,用剩余的樣本點構建近似模型,并用該近似模型對測試點進行預報,計算其留一 誤差,這一過程持續到每個樣本點都被當作一次測試點為止。
[0018] 作為本發明進一步的方案:所述變程是令距離為h的協方差減函數不為零的最大 距離,代表了從存在相關性的狀態向不存在相關性的狀態轉變的分界線。
[0019] 作為本發明再進一步的方案:變異函數是用于描述變量變化程度的函數,描述變 量的空間結構性,在整個空間的變異程度僅與距離有關,而與點的位置無關,它被定義為變 量在某方向上相距h的增量的方差。
[0020] 與現有技術相比,本發明的有益效果是:
[0021] 本發明充分利用性能空間的特性來指導樣本點的選取區間,進而實現樣本點的 "按需分配",在樣本點的選取上考慮了函數空間對樣本點分布的需求,對應的近似模型的 精確度明顯高于一次性樣本點選取所對應的近似模型,樣本點的利用效率更高。
【專利附圖】
【附圖說明】
[0022] 圖1為近似模型構建的一般流程示意圖。
[0023] 圖2為Farhang-Mehr函數靜態樣本點的分布示意圖。
[0024] 圖3為船體曲面參數對應的船體興波阻力空間示意圖。
[0025] 圖4為Farhang-Mehr函數動態樣本點的分布及對比示意圖。
[0026] 圖5為基于相關性原理的動態樣本點選取方法的流程示意圖。
[0027] 圖6為留一誤差較大的點示意圖之一。
[0028] 圖7為留一誤差較大的點示意圖之二。
[0029] 圖8為變異函數與協方差之間關系示意圖。
[0030] 圖9為實施例中Peaks函數空間示意圖。
[0031] 圖10為實施例中初次選取的樣本點分布示意圖。
[0032] 圖11為實施例中增選樣本點的區域示意圖。
[0033] 圖12為實施例中增選樣本點的分布示意圖。
[0034] 圖13為實施例中對比樣本點分布示意圖。
[0035] 圖14為實施例中選取的測試點分布示意圖之一。
[0036] 圖15為實施例中選取的測試點分布示意圖之二。
[0037] 圖16為實施例中選取的測試點分布示意圖之三。
[0038] 圖17為實施例中選取的測試點分布示意圖之四。
[0039] 圖18為實施例中近似模型的平均絕對預報誤差示意圖。
[0040] 圖19為實施例中近似模型的平均相對誤差示意圖。
【具體實施方式】
[0041] 下面結合【具體實施方式】對本專利的技術方案作進一步詳細地說明。
[0042] -種基于相關性原理的動態樣本點選取方法,是基于相關性的原理,根據初始選 取的樣本點信息,計算每個樣本點的留一誤差,針對留一誤差較大的樣本點,采用變異函數 計算每個變量方向留一誤差的影響范圍,進而確定該樣本點處每個變量方向的加點區域范 圍,最后在每個加點區域增選樣本點,實現樣本點的針對性選取,即根據初次選取樣本點反 饋的性能空間信息,判斷需要增加樣本的區域,然后在各區域內分別增加樣本,最后構建近 似模型,充分利用性能空間的特性來指導樣本點的選取區間,進而實現樣本點的"按需分 配"。
[0043] 請參閱圖4,對于Farhang-Mehr函數,考慮其函數空間特性,可見應用動態樣本點 選取方法后,樣本點更能體現函數空間的特性,對構建高精確度的近似模型更加有利。
[0044] 請參閱圖5,所述基于相關性原理的動態樣本點選取方法的具體流程,包括如下步 驟:
[0045] 1)首先確定優化變量及其取值范圍,同時根據優化變量數和取值范圍,采用均勻 設計方法初次選取一定數量均勻分布的樣本點;
[0046] 2)計算初次選取的樣本點的目標函數值,即對應船型的相關性能值;
[0047] 3)將數據歸一化處理便于分析以及后續神經網絡近似模型的建立,再采用留一法 分別計算每個初始樣本點的留一誤差,并判斷其留一誤差是否滿足要求,如果所有樣本點 的留一誤差均滿足要求則構建整個性能空間的近似模型,否則繼續進行后續步驟;
[0048] 4)計算每個變量方向的變異函數,求取每個變量方向的變程,從而確定留一誤差 在該變量方向的影響范圍;
[0049] 5)針對每個留一誤差較大的樣本點,根據變程分別確定其在每個變量方向的加點 區域范圍,進而確定該樣本點處的加點區域,最后采用均勻設計方法在每個加點區域增選 樣本點;
[0050] 6)判斷增選樣本點后的樣本點數是否達到優化所能承受的最大樣本點數,如果達 至IJ,則構建整個性能空間的近似模型,否則繼續進行后續步驟;
[0051] 7)計算每個增選樣本點的留一誤差,如果留一誤差滿足要求,則構建整個性能空 間的近似模型,否則計算增選樣本點區域的變異函數,并回到步驟4)。
[0052] 所述留一法最初是用來驗證近似模型的精確度,留一法的基本原理是從所有樣本 點中抽取一個作為測試點,用剩余的樣本點構建近似模型,并用該近似模型對測試點進行 預報,計算其留一誤差,這一過程持續到每個樣本點都被當作一次測試點為止。
[0053] Xi點處的留一誤差的計算公式如下:
[0054] (1)
[0055] 式中y(Xi)表示實際目標函數值,KW表示近似模型預報值。
[0056] 請參閱圖6,留一法不僅僅能夠用來衡量近似模型的精確度,還可以用它來確定某 些樣本點附近是否有足夠的樣本點分布,即樣本點附近是否需要增選樣本點,圖6中計算 方框點處的留一誤差時,因為其附近點的目標函數值與該點的值相差較大,空間變化劇烈, 因此該點處擬合的曲線,即圖中虛線與實際曲線有較大差別,導致則該點處的預報誤差較 大,即留一誤差較大。
[0057] 在采用留一法確定了誤差較大的樣本點之后,為了彌補該處樣本點不足的問題, 需要在該樣本點附近增加樣本。增選樣本點首先需要確定留一誤差的影響范圍,然后在該 范圍內再增加樣本點。統計學中的協方差函數是用來表征數據之間相關程度的函數,因此 通過該函數來定義留一誤差影響范圍。
[0058] 協方差函數表示隨機變量Z(X)和Z(x+h)之間的相關程度,通常是距離為h的減 函數。當點X和x+h之間的距離太大時,Z(X)和Z(x+h)之間的相關程度往往會消失,即當 |h| ,有C(h) -0。實際上,只要h大到一定程度,兩點之間的就可以認為不具有相關 性,即當|h|彡a,有C(h) =0;令C(h)不為零的最大距離a稱為變程,代表了從存在相關 性的狀態向不存在相關性的狀態轉變的分界線。
[0059] 變異函數是用于描述變量變化程度的函數,也就是變異程度,它既能描述變量的 空間結構性,在整個空間的變異程度僅與距離有關,而與點的位置無關,它被定義為變量在 某方向上相距h的增量的方差。其定義如下:
[0060]
【權利要求】
1. 一種基于相關性原理的動態樣本點選取方法,其特征在于,是基于相關性的原理,根 據初始選取的樣本點信息,計算每個樣本點的留一誤差,針對留一誤差較大的樣本點,采用 變異函數計算每個變量方向留一誤差的影響范圍,進而確定該樣本點處每個變量方向的加 點區域范圍,最后在每個加點區域增選樣本點,實現樣本點的針對性選取;基于相關性原理 的動態樣本點選取方法的具體流程,包括如下步驟: 1) 首先確定優化變量及其取值范圍,同時根據優化變量數和取值范圍,采用均勻設計 方法初次選取一定數量均勻分布的樣本點; 2) 計算初次選取的樣本點的目標函數值,即對應船型的相關性能值; 3) 將數據歸一化處理便于分析以及后續神經網絡近似模型的建立,再采用留一法分別 計算每個初始樣本點的留一誤差,并判斷其留一誤差是否滿足要求,如果所有樣本點的留 一誤差均滿足要求則構建整個性能空間的近似模型,否則繼續進行后續步驟; 4) 計算每個變量方向的變異函數,求取每個變量方向的變程,從而確定留一誤差在該 變量方向的影響范圍; 5) 針對每個留一誤差較大的樣本點,根據變程分別確定其在每個變量方向的加點區域 范圍,進而確定該樣本點處的加點區域,最后采用均勻設計方法在每個加點區域增選樣本 占. 6) 判斷增選樣本點后的樣本點數是否達到優化所能承受的最大樣本點數,如果達到, 則構建整個性能空間的近似模型,否則繼續進行后續步驟; 7) 計算每個增選樣本點的留一誤差,如果留一誤差滿足要求,則構建整個性能空間的 近似模型,否則計算增選樣本點區域的變異函數,并回到步驟4)。
2. 根據權利要求1所述的基于相關性原理的動態樣本點選取方法,其特征在于,所述 留一法的基本原理是從所有樣本點中抽取一個作為測試點,用剩余的樣本點構建近似模 型,并用該近似模型對測試點進行預報,計算其留一誤差,這一過程持續到每個樣本點都被 當作一次測試點為止。
3. 根據權利要求1所述的基于相關性原理的動態樣本點選取方法,其特征在于,所述 變程是令距離為h的協方差減函數不為零的最大距離,代表了從存在相關性的狀態向不存 在相關性的狀態轉變的分界線。
4. 根據權利要求1所述的基于相關性原理的動態樣本點選取方法,其特征在于,所述 變異函數是用于描述變量變化程度的函數,描述變量的空間結構性,在整個空間的變異程 度僅與距離有關,而與點的位置無關,它被定義為變量在某方向上相距h的增量的方差。
【文檔編號】G06F17/50GK104376148SQ201410582917
【公開日】2015年2月25日 申請日期:2014年10月28日 優先權日:2014年10月28日
【發明者】常海超 申請人:常海超