專利名稱:使用分級模型的推理系統及方法和控制系統及方法
技術領域:
本發明涉及人類使用操作或控制對象時得到的經歷數據形成模型特別是形成具有由相互連鎖的目標、策略和動作構成的經歷結構的模型的推理系統及方法和使用形成的模型自動地操作或控制對象的系統及方法。
本發明的系統和方法對于工廠的自動化特別是制造設備和傳輸設備的實時動態的控制操作是非常有用的。
工廠自動化的目的在于為了處理傳感器的信號及控制傳動機構,通過開發電-機裝置及計算機算法語言而提高生產效率。很多裝置和算法語言已將人們從無聊的、激烈的、重復性多的并且危險的工作中解放了出來。盡管如此,在制造業和其他產業領域,有些希望實現自動化的工作依然需要人來作。為了提高生產效率、降低成本、減少浪費、提高產品質量、改善勞動的安全性和減少培訓所需要的費用,應該進一步推進自動化。
在競爭的社會,人們謀求更有效的生產質量更高的產品的更高明的工廠的自動化手段。這種手段之一,就是形成人的操作的自動化模型的裝置。
在關系人的知識的人工智能(AI)領域,關于如何構筑該模型的模型化有很多逼近方法。
最一般的逼近方法,就是專家系統。它是將通過訪問而收集的專家的知識用一群規則表現。一群規則由邏輯推理機構進行處理,并據此生成說明、預測或暗示。邏輯推理機制具有包括模糊邏輯的各種方法。通常,規則用概念或狀況的程度表示知識。
數據指向性最強的逼近方法是稱為事件庫推理(case-basedreasoning)的逼近方法。它就是存儲事件并進行比較的學習戰略。即,通過與存儲在存儲器內的先前的同樣的狀況進行比較和對比來解決新的狀況。這就是認識新的狀況,進行新的推理,當不能進行推理時,就發出詢問。通常,事件用操作程度表示知識。
本發明提供擴展到規則庫逼近(rule-based approach)和事件庫逼近兩方面的新的逼近方法。
在本發明中,為了將人對對象的操作或控制模式化并根據該模式利用機械再現人的操作或控制,根據下面的行動原則進行。
“動作中存在某些策略,策略中存在某些目標。”在本發明中,以人的實際的操作或控制的記錄為信息源。通過從該記錄抽出策略,從策略導出目標,構筑由目標、策略和動作構成的等級結構的模式。
本發明的推理方法若最抽象地進行規定,則為如下所述。
本發明的推理方法是取入由通過操作或控制對象而得到的輸入輸出變量值的組構成的一連串的動作數據,著眼于取入的上述動作數據中的輸入變量值,對每個輸入變量作成以上述操作或控制為目標的目標,著眼于取入的上述動作數據中的輸出變量值,作成為了達到上述目標的策略,將上述目標與尚未達到該目標的策略連鎖,將上述策略與實現該策略的動作數據連鎖,借此形成由相互連鎖的目標、策略和動作構成的等級結構的模型。
先有的事件庫推理,是限于經驗的水平即動作情況的推理,沒有超過該經驗的發展性。當出現過去沒有經驗過的情況時,就不能獲得適當的解。
按照本發明,根據實際的動作取樣作成目標,然后作成為了達到該目標的策略。并且,將目標、策略和動作相互連結。因此,為了進行操作及控制,按照概念的程度確定方向性(目標),向著該目標按照與該目標連鎖的策略進行與狀況對應的意志決定。最后,根據與策略連鎖的動作情況進行具體的意志決定(輸出值的決定)。
在包括模糊規則的規則庫推理中,為了作成規則,需要訪問專家,進行將其知識規則化的作業。按照本發明,可以根據過去的操作記錄自動地作成目標和策略。
若具體地規定本發明的推理方法,則如下所述。
本發明的推理方法是取入由通過操作或控制對象而得到的輸入輸出變量值的組構成的一連串的動作數據,著眼于取入的上述動作取樣中的輸入變量值,對每個輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規定的目標路線,著眼于取入的上述動作取樣中的輸出變量值,抽出輸出變量值保持同一性的輸入變量的范圍,對于各范圍作成將輸入變量的范圍與輸出變量值連結的策略路線,將具有不滿足上述目標路線的條件的輸入變量范圍的策略路線與該編碼路線連鎖,將具有進入上述策略路線的輸入變量范圍的輸入變量值的動作路線與該策略路線連鎖,借此形成由相互連鎖的目標路線、策略路線和動作路線構成的等級結構的模型在極佳的實施例中,取入的上述動作取樣變換為指定位的二進制數據。
在其他極佳的實施例中,作成目標路線的上述步驟由作成臨時的目標路線的步驟、輸出作成的目標路線的步驟和將接收用戶評價后的目標路線作為最終的目標路線的步驟構成。
上述用戶的評價包括對目標路線的追加、刪除和變更。
作成策略路線的上述步驟更具體地說是由當順序比較按時間順序排列的輸出變量值的相鄰的值,有變化時,由存儲前后的輸出變量值作成策略取樣的步驟、參照上述動作取樣將上述策略取樣變換為具有do…when…until…min…max的形式的策略路線的步驟、和使變換后的上述策略路線最優化的步驟構成。
使上述策略路線最優化的步驟的一個例子,就是減少具有相同輸出變量值的2個以上的策略路線的數。
策略路線與目標路線的連鎖,具體地說,在存儲器中是利用設在各策略路線中的指向目標路線的指針和設在各目標路線中的指向策略路線的指針實現的。
動作路線與策略路線的連鎖,具體地說,在存儲器中是利用設在各動作路線中的指向策略路線的指針和設在各策略路線中的指向動作路線的指針實現的。
動作路線是通過將由完全相同的輸入、輸出變量值的組構成的動作取樣留下1個將其他刪除而作成的。
這樣作成的模型通過將上述一系列的動作取樣作為輸入輸出數據進行驗證。
即,通過按時間順序逐一取入上述動作取樣,搜尋具有取入的動作取樣的輸入變量值不滿足的條件的目標路線,將與搜尋出的目標路線連鎖的策略路線列表,從上述列表的策略路線中搜尋具有上述取入的輸入變量值滿足的條件的策略路線,將與搜尋出的策略路線連鎖的動作路線列表,在上述列表的動作路線中輸出具有和上述取入的輸入變量值一致或最接近的輸入變量值的動作路線的輸出變量值,進行該驗證。用戶通過比較該輸出值和動作取樣的輸出變量值,驗證上述模型。
另外,本發明還提供使用按上述推理方法作成的模型操作或控制對象的方法。
該方法順序取入從對象得到的輸入數據,搜尋具有取入的輸入數據不滿足的條件的目標路線,將與搜尋出的目標路線連鎖的策略路線列表,從上述列表的策略路線中搜尋具有上述取入的輸入數據滿足的條件的策略路線,將與搜尋出的策略路線連鎖的動作路線列表,在上述列表的動作路線中輸出具有與上述取入的輸入數據一致的或最接近的輸入變量值的動作路線的輸出變量值,每次取入輸入數據都反復進行上述處理。
本發明還提供執行上述推理方法和控制方法的系統。
本發明的推理系統具有取入并存儲由通過操作或控制對象而得到的輸入輸出變量值的組構成的一系列的動作取樣的存儲裝置、著眼于取入的上述動作取樣中的輸入變量值對每個輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規定的目標路線的作成裝置、著眼于取入,的上述動作取樣中的輸出變量值抽出輸出變量值具有同一性的輸入變量的范圍并對各范圍作成將輸入變量的范圍與輸出變量值連結的策略路線的作成裝置、將具有不滿足上述目標路線的條件的輸入變量范圍的策略路線與該目標路線連鎖的連鎖裝置和將具有進入上述策略路線的輸入變量范圍的輸入變量值的動作路線于該策略路線連鎖的連鎖裝置,借此形成由相互連鎖的目標路線、策略路線和動作路線構成的等級結構的模型。
使用由上述推理系統作成的模型操作或控制對象的系統具有順序取入從對象得到的輸入數據的輸入裝置、搜尋具有取入的輸入數據不滿足的條件的目標路線并在存儲器中將與搜尋出的目標路線連鎖的策略路線列表的列表裝置、從上述列表的策略路線中搜尋具有上述取入的輸入數據滿足的條件的策略路線并將與搜尋出的策略路線連鎖的動作路線在存儲器中列表的列表裝置、在上述列表的動作路線中輸出具有與上述取入的輸入數據一致或最接近的輸入變量值的動作路線的輸出變量值的輸出裝置和每次取入輸入數據時反復進行上述處理的控制裝置。
本發明的其他特征和優點,通過參照
實施例便可清楚。
圖1是在模型形成模式中包括控制對象的整個系統的結構的框圖。
圖2是在問題解決模式中包括控制對象的整個系統的結構的框圖。
圖3是表示使用等級結構模型的本發明的系統的結構例的框圖。
圖4是表示作為控制對象例的升降機控制系統的斜視圖。
圖5是振動角檢測用的其他結構例。
圖6是表示進行升降機控制的模擬的系統的框圖。
圖7是表示模擬的變量。
圖8a和圖8b是表示模型形成模式的處理順序的流程圖。
圖9是表示在升降機控制的模擬中得到的輸入、輸出數據的一個例子。
圖10是表示通過將圖9所示的輸入、輸出數據進行二進制編碼而得到的二進制字符串。
圖11是表示在升降機控制的模擬數據中按每個輸入變量作成的目標路線作成用的列表的例子。
圖12是表示升降機控制的目標路線的例子。
圖13是升降機控制的策略取樣的例子。
圖14~圖16是用于說明向策略取樣的策略路線變換的簡單的例子,圖14是動作取樣的例子,圖15是策略取樣的例子,圖16是動作取樣的曲線圖。
圖17是升降機控制的動作取樣的曲線圖。
圖18a和圖18b是表示升降機控制的策略路線的例子。
圖19是圖18a和圖18b的策略路線的二進制字符串。
圖20是表示各目標路線向策略路線的連鎖。
圖21是表示各策略路線向目標路線和動作路線的連鎖。
圖22是表示各動作路線向策略路線的連鎖。
圖23是表示由目標、策略和動作構成的等級結構。
圖24是表示問題解決模式的處理順序的流程圖。
圖25是表示問題解決模式的輸入、輸出數據的例子。
實施本發明的最佳的實施例(1)系統的2個模式使用等級結構模型的本發明的系統具有2個模式。其一是模型形成模式,其二是問題解決模式。
在模型形成模式中,輸入人(操作者)實際操作控制對象(被控制系統)時得到的數據(操作量和控制量),形成后面所述的具有等級結構的模型。
在問題解決模式中,按照已形成的模型對控制對象現實地進行控制。
圖1是模型形成模式中包括控制對象的整個系統的結構。本發明的系統以模型形成模式(或學習系統)進行體現。
控制對象(被控制系統)10的控制量通常由傳感器11,12,…,1k進行檢測。檢測的控制量(輸入數據x1,x2,…,xk)輸入操作裝置20。操作者觀察著控制對象的狀況,根據需要觀察著顯示的控制量(例如確認儀表的指針的位置)進行操作使控制對象成為所希望的狀態。從操作裝置20輸出的操作量y(輸出數據)(不限于1種)輸入調節器21,由調節器21實際驅動或運轉控制對象10。有時控制量x1,x2,…,xk的全部或一部分也不輸入操作裝置20。控制量也可以是從控制對象10得到的邏輯值(或計算值或估算值)。
由傳感器11~1k檢測的控制量x1~xk和從操作裝置20輸出的操作量y輸入模型形成系統1A。調節器21的輸出或其測量值也可以作為操作量輸入模型形成系統1A。模型形成系統1A使用這些輸入數據x1~xk和輸出數據y作成關于控制(或操作)的模型。
圖2是問題解決模式中包括控制對象的整個系統的結構。本發明的系統以自動控制系統(自動操作系統)1B進行體現。
自動控制系統1B取入由傳感器11~1k檢測的控制對象10的控制量x1~xk,按照前面作成的模型計算應輸入控制對象10的操作量y。操作量y輸入驅動控制對象10的調節器21(另外,控制調節器21以使調節器21的輸出成為計算的值)。這樣,控制對象10便和操作者使用操作裝置20控制(操作)控制對象20一樣,由自動控制系統1B進行控制(操作)。(2)系統結構和應用例圖3是根據模式使用作為模型形成系統或自動控制系統而體現的本發明的等級結構模型的系統的結構例子。
本系統基本上利用計算機30實現。計算機30不論是所謂的個人計算機還是大型、小型或其他通用計算機都可以使用。
在計算機30中設有存儲用于執行模型形成模式和問題解決模式的處理的程序的存儲器31和存儲在這些處理中生成的或使用的數據(包括表示模型的數據)的存儲器32。這些存儲器31和32利用ROM、RAM、硬盤、軟盤、光盤等實現。既可以存儲器31和32都利用硬盤實現,也可以存儲器31利用ROM和硬盤或軟盤實現,而存儲器32利用RAM和硬盤實現。這里,存儲器31和32是根據存儲的數據的種類而分類的概念。
另外,輸入裝置33和作為輸出裝置的顯示裝置34及打印機35與計算機30連接。輸入裝置33包括鍵盤和鼠標器。也可以將顯示菜單畫面的顯示裝置34視為輸入裝置33的一部分。作為輸出裝置,只要有顯示裝置34和打印機35中的至少任意一種(最好是顯示裝置34)就可以。
此外,將由傳感器11~1k檢測的控制對象10的控制量(通常為模擬量)變換為數字數據的A/D變換器36、在模型形成模式中將從操作裝置20輸出的操作量(為模擬量時)變換為數字數據的A/D變換器37和在問題解決模式中根據需要將計算的輸入調節器21的操作量(通常為數字量)變換為模擬量的D/A變換器38與計算機30連接。這些A/D變換器和D/A變換器也可以內裝在計算機內使用。另外,如果不需要這些A/D變換器和D/A變換器,就可以不必設置。例如,當調節器是可以接收數字量的調節器時,就不需要D/A變換器38。
在計算機30中,根據需要還可以設置用于控制量及操作量的輸入和操作量的輸出的接口(如后面所述的微分電路等)。
圖4是作為控制對象的例子的升降機控制系統。為了簡單起見,該升降機系統是只包含1條軌道的升降機。
1條軌道50水平地架設在適當高度的位置。架空平臺(臺車)40通過滑輪41支持在該軌道50上,可以自由移動。滑輪41由運行電機42直接或通過減速器進行轉動驅動。
另外,在架空平臺40上設置提升機。該提升機包括滑輪44、驅動滑輪44的提升電機46和繞在滑輪44上的鋼絲繩47。滑輪44固定在轉軸45上,轉軸45架設到固定在架空平臺40上的軸承架43上,可以自由轉動,該轉軸45由電機46直接或通過減速器進行轉動驅動。掛鉤48安裝在鋼絲繩47的下端,重物49掛在該掛鉤48上。
假定進行如下升降控制。即,通過使架空平臺40從軌道50上的一點A運行到另一點B搬運重物49。這時,為了盡可能減小鋼絲繩47的振動角(在架空平臺移動方向的振動角)(將其限制在指定的角度以內,稱此角度為最大容許振動角度)進行架空平臺40的運行控制。
作為控制量,可以采用架空平臺40的位置、振動角度和振動角度的微分值。
架空平臺40的位置,取以出發點A為原點指向終點B的方向為正方向。該位置由設在電機42的轉軸或滑輪41的軸上的轉動傳感器(圖中未示出)進行檢測。從轉動傳感器輸出的脈沖串(或表示位置的數字數據)輸入計算機(不需要A/D變換器36)。根據需要,可以設置檢測架空平臺40位于出發點A的原點檢測器。
鋼絲繩47的振動角由安裝在架空平臺40上的并且用于對鋼絲繩47進行攝像而配置的電視攝像機51和對該攝像機51的圖像信號進行圖像處理的處理裝置進行檢測。圖像處理裝置可以利用計算機30的一部分實現。這時,攝像機51的圖像信號通過A/D變換器36輸入計算機30。用于對線狀物體的垂線的角度檢測的圖像處理,可以利用眾所周知的方法進行。
振動角的微分值,可以利用計算機30進行運算。
如圖5所示,使用旋轉吊桿47A取代鋼絲繩47起吊重物時,可以更簡單地檢測振動角。旋轉吊桿47A的上端固定在轉軸45上。轉軸45支持在軸承架43上,可以自由轉動。旋轉吊桿47A的下端為掛鉤48。轉軸45的轉動角由角度傳感器52檢測。當角度傳感器52的輸出信號為模擬量時,由A/D變換器36變換為數字量后輸入計算機30。另外,角度傳感器52的輸出信號由微分電路進行微分,該微分信號通過A/D變換器36作為振動角的微分值輸入計算機30。當然,微分處理也可以利用計算機30進行。當角度傳感器52的輸出為數字量時,就直接輸入計算機30。
操作量是架空平臺40的移動速度。移動速度也可以作為加到運行電機42上的電壓或電流進行表現。
本發明的系統也可以應用于沒有檢測控制量的傳感器及輸入操作量的調節器的控制對象,例如股票的預測系統。這時,輸入數據是當天的股票價格(對于各品種的)、當天的平均股票價格等,從鍵盤、通信裝置、軟盤驅動器等輸入。輸出數據是賣出決定、買入決定及其數量。這些數值從顯示裝置及打印機輸出。
作為其他例子,就是店鋪的銷售預測系統。輸入數據是星期、氣候、庫存量等,從鍵盤、通信裝置、軟盤驅動器等輸入。輸出數據是預測銷售額、采購量等,從顯示裝置及打印機輸出。
下面,以上述升降機控制系統為例詳細說明模型形成模式和問題解決模式。在模型形成模式中使用的實際的運轉數據是根據模擬得到的數據。模擬系統的例子示于圖6。該系統由計算機30、程序存儲器31、數據存儲器32、輸入裝置33、顯示裝置34和打印機35構成。在該系統中,也可以進行問題解決模式的處理。可以說圖6是利用本發明的系統的最小限度的結構(當然,作為輸出裝置,只要有顯示裝置和打印機中的任意一種就可以了)。
在模擬中,求架空平臺的位置x和轉動角度θ使用的計算公式為(參見圖7)d2xdt2=(m2m1)·g·θ+Fm1+(m2m1)·e·(dθdt)2·θ]]>d2θdt2=-(m1+m2m1e)·e·θFm2m1em1·(dθdt)2·θ]]>其中,m1為架空平臺的質量m2為重物的質量l為鋼絲繩的長度g為重力加速度F為電機的推進力,可以由下式求出。
F=K1ω1+K2ω2+K3V其中,ω1=Vd-Vω2=∫t0ω1(τ)dτ]]>式中,K1、K2、K3是常數。
V1是電機速度,Vd是電機的目標速度,在模擬中是由操作者給定的操作量。即,Vd取如下數值。Vd=(-40(m/min),0,40(m/min))(3)模型形成模式的處理本項和下面的((4)問題解決模式的處理)主要利用計算機30執行。因此,只要未特別聲明,下面所述的具體的處理都是指利用計算機30進行的處理。
模型具有由目標(目的或目標)、策略(戰略)和動作(執行,行動)3個層次構成的等級結構。該結構基于如下原理。
“在所有的動作中,存在與其關聯的至少1個策略,在所有的策略中,存在與其關聯的至少1個目標。”下面,參照圖8a和圖8b說明模型形成模式的具體的處理順序。
在S101,操作者使用操作裝置20實際操作(運轉)控制對象10。這時,按一定時間間隔對從傳感器11~1k得到的控制量(輸入數據)和供給調節器21的操作量(輸出數據)進行采樣,并輸入計算機30。這些輸入、輸出數據作為教師數據存儲到數據存儲器32內。輸入、輸出數據是實際的操作記錄。
圖9是在上述升降機控制系統的模擬中得到的輸入、輸出數據的一個例子。
輸入、輸出數據每0.3秒采樣一次。如上所述,升降機按前進、后退和停止3種操作進行運轉。前進時,設定操作輸出(架空平臺的移動速度輸出數據)u=+40(m/min),后退時,設定u=-40(m/min),停止時,設定u=0(m/min)。輸入數據是架空平臺的位置x(m)、鋼絲繩的振動角θ(rad)和振動角的變化率(微分值)dθ(rad/sec)(以下,將dθ/dt表為dθ)。
在圖9中,用T1表示的時間帶是架空平臺的起動時間,調整操作輸出u使振動角θ限制在盡可能小的范圍內。在T2表示的時間帶,架空平臺以恒定速度運轉。在T3表示的時間帶,調整操作輸出u以使架空平臺恰好在目的地點B停止。時間帶T4是架空平臺基本上到達地點B而重物的振動角θ逐漸減小的過程。
在S102,將輸入輸出數據2值化,變換為形成二進制字符串。將干二進制字符串稱為動作取樣。
圖9所示的輸入輸出數據的二進制字符串示于圖10。輸入數據x、θ、dθ和輸出數據u分別由8位構成。
在編碼處理中,不論哪個輸入、輸出變量,其最小值都變換為00000000,最大值都變換為11111111。位置x的最小值為-1(m),最大值為22(m)。振動角θ的最小值為-0.1(rad),最大值為+0.1(rad)。其微分值dθ的最小值為-0.1(rad/sec),最大值為+0.1(rad/sec)。移動速度u的最小值為-40(m/min),最大值為+40(m/min)。為了容易理解圖10,位置x=0(m)、振動角θ=0(rad)、振動角的微分值dθ=0(rad/sec)和移動速度u=0(m/min)分別預先用二進制值00001011,10000000,10000000,10000000表示。
用高級語言編寫模型形成模式的處理程序時,二進制編碼特別有意義。采用二進制編碼的第1個理由在于,容易改變動作取樣的分辨率。例如,通過舍棄16位的數據的低8位,可以獲得8位數據。第2個理由在于,最優化算法語言之一即遺傳算法語言的最佳的表現方法就是二進制字符串。
在S103-1,首先,對每個輸入變量抽出最初的(初始)動作取樣和最終的(終點)動作取樣,通過求它們的差進行比較。另外,對每個輸入變量計算最大值和最小值。
在圖9所示的例子中,時間t=0.00的動作取樣是最初的動作取樣(值),時間t=29.10的動作取樣是最終的動作取樣(值)。對它們都加上虛線的長方形框。另外,輸入變量θ、dθ的最大值和最小值都加上實線的長方形框。輸入變量x的最大值和最小值是加虛線的長方形框的最終值和最初值。
在S103-2,作成在S103-1得到的結果的列表。當然,在數據存儲器32中也作成該列表。
對圖9所示的例子得到的列表示于圖11。
在S103-3,如果(最大值)-(最小值)=0,則不計該輸入變量,將該輸入變量掩蔽。
最大值和最小值相等的輸入變量,在控制對象的操作中是完全不變化的,對操作及控制也沒有任何影響。
在S103-4,當最初值與最終值之差不為0時,對于該輸入變量,目標條件表為如下形式目標jxi“最終狀態”的值=(最終值)目標j+ixi“過渡狀態”寬度=[最小值,最大值]在控制對象的實際操作中,對于輸入變量,最初值和最終值不同就意味著該操作一定要使輸入變量xi從(最初值)變化為(最終值)。并且,可以斷定一定是使這時的輸入變量xi的變化幅度限制在(最小值)與(最大值)之間。因此,對于輸入變量xi的目標(控制目的)就是使輸入變量xi的值從(最初值)出發最后成為(最終值),這時,將xi的變化幅度限制在(最小值)與(最大值)之間。
在圖11所示的例子中,輸入變量x的最初值和最終值不同。因此,對于輸入變量x,臨時設定如下目標條件。
目標1x“最終狀態”的值=9.467目標2x“過渡狀態”寬度=
在S103-5,當最初值與最終值之差為0時,對于該輸入變量,目標條件表為如下形式目標jxi“過渡狀態”寬度=[最小值,最大值]對于某一輸入變量,當其最初值和最終值相同時,不論根據最初值還是最終值都不能導出目標。這時,在操作的過程中寧可將輸入變量保持在一定的范圍內。這就是上述目標條件的意義。
在圖11所示的例子中,不論振動角θ還是其微分值dθ,它們的最初值和最終值都相同(都是0.000)。因此,對于輸入變量θ、dθ,臨時設定如下目標條件。
目標3θ“過渡狀態”寬度=[-0.029,0.027]目標4dθ“過渡狀態”寬度=[-0.039,0.042]在S103-6,上述S103-3、103-4和103-5的結果由打印機35進行打印。另外,在顯示裝置34上進行顯示。
在S103-7,上述目標條件按照如下排列編碼為二進制字符串。
“目標序號輸入變量類型·標志值”對于該排列,在下面的S104的說明中詳細說明。
在S104,用戶看了利用打印機35打印的或由顯示裝置34顯示的目標的假說(臨時設定的上述目標1~4)之后,對它們進行評價,根據需要添加新的目標條件或刪除某個目標條件或者修正目標條件。
在升降機的控制系統的例子中,在設定的上述假說(目標1~4)中,目標2作為不需要的目標而刪除了。目標2是關于輸入變量x(表示位置)的過渡狀態寬度的目標,位置x只要從最初值向最終值單調地增加就可以了,所以,關于過渡狀態寬度的目標假說是不需要的。這樣,目標3和目標4的目標序號便逐一上移1,分別成為目標2和目標3。
經過用戶的評價最后得到的目標稱為目標路線。在上述例子中,最終得到的3個目標路線與其二進制字符串一起示于圖12。
下面,先說明二進制字符串的各項的排列和該二進制數據(參見S103-7)。
開頭的目標1、目標2、目標3的1、2、3是“目標路線序號(目標序號)”,用2位表示。
第2項的x、θ、dθ是“輸入變量”的種類,它們都用2位表示。x為00,θ為01,dθ為10。
第3項的“類型·標志”是表示“最終狀態”的值或“過渡狀態”的寬度。該類型·標志為2位,“最終狀態”的值用01表示,“過渡狀態”的寬度用10表示。
最后一項的“值”隨類型·標志而不同。類型·標志為01時,“值”為“最終值”(用8位表示)。由于“最終值”只有1個,所以,該8位數據反復2次。類型·標志為10時,“值”為按最小值,最大值(都用8位表示)的順序排列的16位數據(參見圖9、圖10、圖11)。
在S105,對于輸出變量,通過比較動作取樣抽出策略。
具體地說,就是先將輸出變量的最初值和最終值存儲到數據存儲器32內。然后,將時刻t的輸出數據(動作取樣)與其后的時刻t+1的輸出數據進行比較。如果這兩個輸出數據不同,就存儲時刻t的輸出數據和時刻t+1的輸出數據。這一處理從t=0進行到t=最終時刻,將t的值逐次增加1反復進行。將這樣存儲到存儲器中的數據稱為“策略取樣”。
下面,使用升降機控制系統的動作取樣具體地說明。參照圖10所示的二進制字符串。
圖13是最后得到的策略取樣。這里,為了便于參照,也示出了時刻和動作取樣序號。
存儲輸出變量的最初值10000000(時刻t=0.00,取樣序號=1)和最終值10000000(時刻t=29.10,取樣序號=98)。
由于時刻t=0.00的輸出變量值10000000與時刻t=0.30的輸出變量值11111111不同,所以,存儲時刻t=0.30的輸出變量值(時刻t=0.00的輸出變量值已存儲過了)。
將時刻t=0.30的輸出變量值11111111與時刻t=0.60的輸出變量值10000000進行比較。由于它們相互不同,所以,存儲這兩個值。
同樣,由于時刻t=0.60的值與時刻t=0.90的值不同,時刻t=0.90的值與時刻t=1.20的值不同,以及時刻t=1.20的值與時刻t=1.50的值不同,所以,存儲這些值。
從時刻1.50到時刻14.40的值相同。因此,不存儲這些時刻的輸出變量值。
時刻14.40的值與時刻14.70的值不同,因此,存儲這兩個時刻的輸出變量值。
時刻14.70的值與時刻15.00的值相同,因此,不存儲這兩個時刻的值。
由于時刻15.00的值與時刻15.30的值不同,時刻15.30的值與時刻15.60的值不同,時刻15.60的值與時刻15.90的值不同,所以,存儲這些值。
由于時刻15.90的值與時刻16.20的值相同,所以,不存儲這兩個值。
由于時刻16.20的值與時刻16.50的值不同,所以,存儲這兩個值。
由于時刻16.50以后的輸出變量值直至最終時刻29.10都相同,所以,不存儲這些值。
這樣,尋找輸出變量變化的位置,將其前后時刻的輸出變量值存儲到存儲器內。
在上述例子中,說明了輸出變量只為一種的情況,但是,輸出變量的種類為多種時也一樣。這時,如果某一種輸出變量的值發生變化,在輸出變量變化后,就存儲該變化前后所有的輸出變量的值。
在S106,參照動作取樣將這樣抽出的策略取樣變換為具有如下形式的策略路線。
“do…when…until…min…max…”在do之后,接輸出變量(1種或多種)的值。在when之后,接輸入變量的值(1個或多個)。在until之后,也接輸入變量的值。在min之后,排列各輸入變量的最小值,在max之后,排列各輸入變量的最大值。
下面,參照圖14~圖16使用簡單的例子進行說明。在這些圖中,輸入變量為2種,即x1、x2,輸出變量為1種,即u。時刻用tp~tp+11表示。
圖14是動作取樣的簡單例子。圖15是根據圖14的動作取樣作成的策略取樣。在圖14中,著眼于輸出變量,當輸出變量變化時,通過抽出其前后時刻的輸出變量的值,便可得到圖15所示的策略取樣,如在S105說明的那樣。
圖16是輸入變量空間的動作取樣的曲線圖。正交的2個軸為輸入變量x1和x2。用長方形表示輸出變量u保持一定值的范圍。
在輸入變量種類為3個時形成的3維輸入變量空間,用長方體表示輸出變量保持一定值的范圍。在4維以上的輸入空間,用雙曲盒(超長方體)表示該范圍。在以下的說明中,不論輸入變量空間是2維還是3維,對于包括長方形、長方體在內的所有情況,使用稱為雙曲盒的術語。
在圖16中,雙曲盒Q是輸出變量u為90的范圍,雙曲盒Q+1是u為100的范圍。
規定1個雙曲盒的輸入、輸出變量的集合稱為策略路線。以策略路線Q為例,則可表為dou=90 when x1=3.0,x2=20until x1=4.5,x2=45min x1=3.0,x2=10max x1=5.5,x2=45其意義如下“從輸入為x1=3,x2=20上到x1=4.5,x2=45時,使輸出u為90。但是,對于輸入x1,容許范圍為從最小值3.0到最大值5.5,對于輸入x2,容許范圍為從最小值10到最大值45。
雙曲盒Q的1個頂點用(x1的最小值,x2的最小值)(該點在圖16中表為MIN)表示,與其相對的另一個頂點用(x1的最大值,x2的最大值)(該點在圖16中表為MAX)表示。
容易理解,策略路線Q+1可以表為dou=100 when x1=3.5,x2=47until x1=1.0,x2=34min x1=1.0,x2=34max x1=3.5,x2=48對于升降機控制的上述例子,輸入空間的動作取樣的曲線圖示于圖17。為了簡單起見,示出了以位置x和振動角θ為正交的2個坐標軸的2維輸入變量空間(當然,正確地說應是以x、θ、dθ為相互正交的坐標軸的3維輸入變量空間)。
參照圖13所示的策略取樣得到的策略路線示于圖18a、圖18b和圖19。圖18a和圖18b是用10進制數的數值表示,圖19是變換為二進制字符串的情況(參見圖10)。
在圖18a和圖18b中,接在do之后的是輸出變量值。另外,在when之后,輸入變量值(when項的輸入變量值)按輸入變量x、θ、dθ的順序排列。同樣,在until、min、max之后,輸入變量值(until項、min項和max項的輸入變量值)也按x、θ、dθ的順序排列。
在圖19中,2進制代碼對各變量值用8位表示。其順序為when項的x、θ、dθ的輸入變量值,until項的x、θ、dθ的輸入變量值,min項的x、θ、dθ的輸入變量值,max項的x、θ、dθ的輸入變量值,并且,最后是do項的輸出變量值。
在圖17中,策略路線1,2,3,4,7和8不是長方形(雙曲盒),用1點表示(該點也可以包含在雙曲盒的概念內)。
在S107,在經過上述處理得到的所有的策略路線中,通過不計(刪除)不需要的策略路線,使策略路線實現最優化。
首先,看一下是否有具有相同的輸出變量值的2個以上的策略路線。當發現了具有相同的輸出變量值的2個以上的策略路線時,就根據輸入變量值(雙曲盒)計算這些路線的遠近程度。當遠近程度接近時,就留下1個策略路線,刪除其他策略路線或者將這些策略路線合而為一。
例如,當2個以上的策略路線的雙曲盒完全重合時,就留下其中的1個,將其他刪除。
此外,例如計算2個以上的雙曲盒的距離,當得到的距離小于指定的閾值時,就將這些策略路線合而為一或者刪除掉一方。作為距離,例如著眼于由在when(或until)項記述的輸入變量值表示的輸入變量空間的點(或MIN點或MAX點),可以使用2個路線的這些點間的距離。
對于盡可能減少策略路線的數量的方法,有很多逼近方法。
在升降機控制系統的例子中,雖然輸出變量u的值相等的路線有多個,但是,由那些輸入變量值表示的點相當遠,所以,所有的策略路線就都需要保留。
在S108,將按上述方式作成的目標路線和策略路線作如下聯系(或連接、連鎖)。
在S108-1,對于第1個策略路線(參見圖18a或圖19),將其狀態量與各目標路線的目標條件進行比較。所謂狀態量,在策略路線中,就是when項的輸入變量值(或until項的輸入變量值)。
在S108-2,當狀態量不滿足目標條件時,將第1個策略路線與該目標條件聯系。當滿足目標條件時,就不將它們聯系。因為滿足目標條件時不需要針對該目標的策略。
在S108-3,對所有的策略路線反復進行S108-1和108-2的處理。
作為狀態量,取when項的輸入變量值,對于上述升降機控制系統的例子,試具體地進行該聯系。
參照圖12所示的目標路線和圖18a及圖18b所示的策略路線。
對于策略路線序號1,在when項記述的輸入變量x的值為0.000。該值不滿足目標序號1的目標條件(“最終狀態”的值=9.467)。因此,將策略路線1與目標路線1連鎖。
在策略路線1的when項記述的輸入變量θ的值為0.000。該值滿足目標路線2的目標條件(“過渡狀態”的寬度=[-0.029,0.027])。因此,不將策略路線1與目標路線2連鎖。
同樣,在策略路線1的when項記述的輸入變量dθ的值為0.000。該值滿足目標路線3的目標條件(“過渡狀態”的寬度=[-0.039,0.042])。因此,也不將策略路線1與目標路線3連鎖。
結果,策略路線1便只與目標路線1連鎖(連接)。
同樣,對于策略路線2~10應用上述S108-1,108-2的處理,可以得到如下結果。
策略路線2、3、4、5、6、8、9和10只與目標路線1連鎖。
策略路線7與目標路線1和7連鎖。
相反,如果從目標路線的角度說,則為如下表述。
目標路線1與策略路線1、2、3、4、5、6、7、8、9和10連鎖。
目標路線2與任何策略路線都不連鎖。
目標路線3只與策略路線7連鎖。
為了將這些連鎖存儲到存儲器內,各策略路線具有指向與其連鎖的所有的目標路線的指針(與表示各策略路線的數據對應地存儲這些指針)。另外,各目標路線具有指向與其連鎖的所有的策略路線的指針。
圖20是設在各目標路線中的指針。PL表示指向策略路線的指針,由PL之后的箭頭指示的序號是與該目標路線連鎖的策略路線的序號。指針PL按各目標路線序號設置。
圖21是與各策略路線序號對應地設置的指針。指針PH是指向目標路線的指針,指針PL是指向動作路線的指針(下面說明)。由PH之后的箭頭指示的序號是與該策略路線連鎖的目標路線的序號,由PL之后的箭頭指示的序號是與該策略路線連鎖的動作路線的序號。
這樣的策略路線與目標路線的連鎖,根據需要進行顯示或打印。用戶可以根據需要添加新的策略路線,刪除不需要的策略路線,修正現有的策略路線。
在S109,將策略路線與動作路線進行如下聯系(或連接、連鎖)。所謂動作路線,是指各時刻的輸入表述值與輸出表述值的組,與動作取樣的意義大致相同。但是,從動作路線中將具有完全相同值的動作取樣刪除。
在S109-1,對于第1個動作路線(參見圖9或圖10),將其狀態量與各策略路線的策略條件進行比較。所謂狀態量,是指動作路線的輸入表述值組。所謂策略條件,是指從在策略路線的when項記述的輸入表述值組到在until項記述的輸入表述值組的范圍(以下,將其稱為when~until范圍)。
在S109-2,當狀態量滿足策略條件時,就將第1個動作路線與該策略路線聯系。
在S109-3,對所有的動作路線反復進行S109-1和109-2的處理。
對上述升降機控制系統的例子,試進行這種聯系。參照圖9和圖18a及圖18b。圖9所示的所有的動作取樣是動作路線。但是,由于第1個動作路線表示架空平臺的靜止狀態,所以,在模型形成和問題解決模式中沒有意義,沒有必要特別進行聯系。因此,從第2個動作路線開始進行聯系。
在第2個動作路線(序號2)中,狀態量為x=0.000,θ=0.000,dθ=0.000,它們都在策略路線序號1的when~until范圍(x=0.000~0.000,θ=0.000~0.000,dθ=0.000~0.000)內。另外,動作路線2的狀態量不在其他策略路線的when~until范圍內。因此,動作路線2只與策略路線1連鎖。
同樣,對其他動作路線進行時鐘連鎖處理(S109-1,109-2),可以得到圖22所示的連鎖。
在圖22中,對每個動作路線序號,用指針PH表示與該動作路線連鎖的策略路線。指針PH是指向連鎖的策略路線的動作路線的指針。在指針PH的箭頭之后,記述連鎖的策略路線序號。
對每個策略路線,也設置指向與其連鎖的動作路線的指針。這就是在圖21中用PL所示的指針。由對各策略路線序號設置的指針PL的箭頭指示的序號是與該策略路線連鎖的動作路線。
由目標路線、策略路線和動作路線構成的模型具有圖23所示的等級結構,并且,可知它們相互關聯。目標(路線)位于最高位的等級(概念的意志決定的等級)。策略(路線)位于中間的等級(根據狀況的意志決定的等級)。動作(路線)位于最低位的等級(經驗的意志決定的等級)。
在S110,如果需要,就驗證這樣作成的模型。
為了進行驗證,可以使用上述動作取樣(教師數據;圖9或圖10)。使用動作取樣的輸入數據,按照和后面所述的問題解決模式的順序相同的順序(S121的輸入變量值讀入和編碼不一定需要),根據前面作成的模型計算輸出。將得到的輸出數據和動作取樣的輸出數據進行比較。如果兩個輸出數據是相等的值或接近的值(例如,兩數據之差小于指定的閾值),就可以認為作成的模型正確。
此外,如果需要,還可以隨機地生成輸入數據,并將該輸入數據輸入系統。系統根據模型計算輸出數據并進行輸出。輸出數據是否妥當,由用戶進行判斷。
在S111,最后,從存儲器的作業區域將表示作成的模型的數據傳送到文件區域進行保存。(4)問題解決模式的處理在問題解決模式中,系統使用上述模型實際控制(運轉或操作)控制對象(參見圖2)。其處理順序示于圖24。
在S121,將傳感器11、12、1k(圖2)或表示位置x的振動傳感器的輸出和表示振動角的角度傳感器等(圖4、圖5)的輸入變量值讀入系統1。將這些輸入值以適當的分辨率變換為2值數據。
在S122,將得到的輸入數據與包含在模型中的目標路線的目標條件進行比較。如果有具有輸入數據不滿足的目標條件的目標路線,就將與該目標路線連鎖的策略路線進行列表。
在本階段,系統通過決定適當的目標路線,進行概念等級的意志決定。這樣,便可決定適當的策略路線。
在S123,將輸入數據與在上述S122選擇的策略路線進行比較。如果有具有與輸入數據匹配的策略條件(when~until范圍)的策略路線,就將與該策略路線連鎖的動作路線進行列表。
在本階段,系統通過決定適當的策略路線進行狀況的意志決定。結果,便可決定適當的動作路線。
在S124,在S123選擇的動作路線中,選擇具有與輸入數據完全一致的輸入變量值的或與輸入數據最接近的輸入變量值的(輸入變量空間的距離最短的)路線作為候補路線。
在S125,通常,由于在S124選擇1個候補,所以,將該候補的動作路線的輸出變量值作為輸出數據而輸出。當存在2個以上的候補時,就選擇最佳的候補,將該動作路線的輸出變量值作為輸出數據而輸出。例如,2個策略路線的雙曲盒一部分重復,當輸入數據包含在該重復的空間時,就從2個策略路線導出不同的輸出變量值。這時,例如選擇從輸入數據與雙曲盒的端點(MIN或MAX點)的距離近的雙曲盒得到的輸出值,或者無條件地選擇在處理中最初得到的輸出值。
圖25示出了根據模型自動運轉升降機控制系統時得到的輸入數據、根據模型計算的輸出數據(升降機控制用的)和在得到輸出值的過程中選擇的路線的序號。最右邊的括號內的3個數字(用箭頭聯系)表示根據前面選擇的目標路線序號、策略路線序號和動作路線序號。
例如,輸入輸出數據序號1的輸入數據是x=0.000,θ=0.000,dθ=0.000。這些輸入數據不滿足目標路線1的目標條件,滿足其他目標路線2,3的目標條件(參見圖12)。因此,選擇與目標路線1連鎖的10個策略路線1、2、3、4、5、6、7、8、9和10(參見圖20)(S122)。
在這些策略路線1~10中,具有滿足上述輸入數據的策略條件的只是策略路線1(參見圖18a)。因此,選擇與策略路線1連鎖的動作路線2(參見圖21)(S123)。
因此,將動作路線2的輸出變量值u=40.00作為輸出數據而輸出(參見圖9)(S124、125)。
在圖25中,不僅輸入輸出數據序號8~10的輸入數據x不滿足目標路線1的目標條件,而且輸入數據θ也不滿足目標路線2的目標條件。因此,選擇目標路線1和2。但是,與目標路線2連鎖的策略路線不存在。因此,從與目標路線1連鎖的策略路線1~10中選擇輸入數據匹配的策略路線。具有滿足輸入輸出數據序號8~10的全部輸入數據x、θ、dθ的策略條件的策略路線不存在。這時,選擇與輸入數據最接近的(例如一部分輸入變量的輸入數據滿足策略條件或具有位于與輸入數據最接近的距離的雙曲盒)策略路線。這里,選擇策略路線5。
在與策略路線6連鎖的動作路線中(參見圖21),分別選擇具有與各輸入輸出數據序號8、9、10的輸入數據最接近的輸入變量值的動作路線9、10、11,將這些動作路線的輸出變量值(u=40.000)作為輸出數據而輸出。
每次從控制對象讀入輸入數據(每隔一定時間),反復進行圖24的S121~125的處理。
權利要求
1.一種推理方法,其特征在于取入由通過操作或控制對象而得到的輸入輸出變量值的組構成的一連串的動作數據,著眼于取入的上述動作取樣中的輸入變量值,對每個輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規定的目標路線,著眼于取入的上述動作取樣中的輸出變量值,抽出輸出變量值保持同一性的輸入變量的范圍,對于各范圍作成將輸入變量的范圍與輸出變量值連結的策略路線,將具有不滿足上述目標路線的條件的輸入變量范圍的策略路線與該編碼路線連鎖,將具有進入上述策略路線的輸入變量范圍的輸入變量值的動作路線與該策略路線連鎖,借此形成由相互連鎖的目標路線、策略路線和動作路線構成的等級結構的模型。
2.按權利要求1所述的推理方法,其特征在于包括將取入的上述動作取樣變換為指定位的二進制數據的步驟。
3.按權利要求1所述的推理方法,其特征在于作成目標路線的上述步驟由作成臨時的目標路線的步驟、輸出作成的目標路線的步驟和將接收用戶的評價后的目標路線作為最終的目標路線的步驟構成。
4.按權利要求3所述的推理方法,其特征在于上述用戶的評價包括目標路線的添加、刪除和改變。
5.按權利要求1所述的推理方法,其特征在于作成策略路線的上述步驟由順序比較按時間順序排列的輸出變量值的相鄰的數值并當有變化時就存儲其前后的輸出變量值作成策略取樣的步驟、參照上述動作取樣將上述翠綠取樣變換為具有do…when…until…min…max的形式的策略路線的步驟和使變換后的上述策略路線實現最優化的步驟構成。
6.按權利要求5所述的推理方法,其特征在于使上述策略路線實現最優化的步驟是減少具有相同的輸出變量值的2個以上的策略路線的數量。
7.按權利要求1所述的推理方法,其特征在于利用設在各策略路線中的指向目標路線的指針和設在各目標路線中的指向策略路線的指針實現策略路線與目標路線的連鎖。
8.按權利要求1所述的推理方法,其特征在于利用設在各動作路線中的指向策略路線的指針和設在各策略路線中的指向動作路線的指針實現動作路線與策略路線的連鎖。
9.按權利要求1所述的推理方法,其特征在于通過將由完全相同的輸入輸出變量值的組構成的動作取樣只留下1個將其他刪除,作成動作路線。
10.按權利要求1所述的推理方法,其特征在于將上述一系列的動作取樣作為用于驗證上述模型的數據使用,按其時間順序逐一取入上述動作取樣,搜尋具有取入的動作取樣的輸入變量值不滿足的條件的目標路線,將與搜尋出的目標路線連鎖的策略路線進行列表,從上述列表的策略路線中搜尋具有上述取入的輸入變量值滿足的條件的策略路線,將與搜尋出的策略路線連鎖的動作路線進行列表,在上述列表的動作路線中,輸出與上述取入的輸入變量值一致的或具有最接近的輸入變量值的動作路線的輸出變量值,借此驗證上述模型。
11.一種用于使用根據由權利要求1所述的推理方法作成的模型操作或控制對象的方法,該控制方法的特征在于順序取入從對象得到的輸入數據,搜尋具有取入的輸入數據不滿足的條件的目標路線,將與搜尋出的目標路線連鎖的策略路線列表,從上述列表的策略路線中搜尋具有上述取入的輸入數據滿足的條件的策略路線,將與搜尋出的策略路線連鎖的動作路線列表,在上述列表的動作路線中輸出具有與上述取入的輸入數據一致的或最接近的輸入變量值的動作路線的輸出變量值,每次取入輸入數據都反復進行上述處理。
12.一種推理方法,其特征在于取入由通過操作或控制對象而得到的輸入輸出變量值的組構成的一連串的動作數據,著眼于取入的上述動作數據中的輸入變量值,對每個輸入變量作成以上述操作或控制為目標的目標,著眼于取入的上述動作數據中的輸出變量值,作成為了達到上述目標的策略,將上述目標與尚未達到該目標的策略連鎖,將上述策略與實現該策略的動作數據連鎖,借此形成由相互連鎖的目標、策略和動作構成的等級結構的模型。
13.一種推理系統,其特征在于具有取入并存儲由通過操作或控制對象而得到的輸入輸出變量值的組構成的一系列的動作取樣的存儲裝置、著眼于取入的上述動作取樣中的輸入變量值對每個輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規定的目標路線的作成裝置、著眼于取入,的上述動作取樣中的輸出變量值抽出輸出變量值具有同一性的輸入變量的范圍并對各范圍作成將輸入變量的范圍與輸出變量值連結的策略路線的作成裝置、將具有不滿足上述目標路線的條件的輸入變量范圍的策略路線與該目標路線連鎖的連鎖裝置和將具有進入上述策略路線的輸入變量范圍的輸入變量值的動作路線于該策略路線連鎖的連鎖裝置,借此形成由相互連鎖的目標路線、策略路線和動作路線構成的等級結構的模型。
14.按權利要求13所述的推理系統,其特征在于取入上述動作取樣的存儲裝置包括將取入的上述動作取樣變換為指定位的二進制數據的裝置。
15.按權利要求13所述的推理系統,其特征在于作成目標路線的上述作成裝置由作成臨時目標路線的裝置、輸出作成的目標路線的裝置和將接收用戶的評價后的目標路線作為最終的目標路線進行存儲的裝置構成。
16.按權利要求15所述的推理系統,其特征在于上述用戶的評價包括目標路線的添加、刪除和改變。
17.按權利要求13所述的推理系統,其特征在于作成策略路線的上述作成裝置由順序比較按時間順序排列的輸出變量值的相鄰的數值并當有變化時就存儲其前后的輸出變量值作成策略取樣的裝置、參照上述動作取樣將上述翠綠取樣變換為具有do…when…until…min…max的形式的策略路線的裝置和使變換后的上述策略路線實現最優化的裝置構成。
18.按權利要求17所述的推理系統,其特征在于使上述策略路線實現最優化的裝置是減少具有相同的輸出變量值的2個以上的策略路線的數量的裝置。
19.按權利要求13所述的推理系統,其特征在于使上述策略路線與目標路線連鎖的裝置利用設在各策略路線中的指向目標路線的指針和設在各目標路線中的指向策略路線的指針實現策略路線與目標路線的連鎖。
20.按權利要求13所述的推理系統,其特征在于使上述動作路線與策略路線連鎖的裝置利用設在各動作路線中的指向策略路線的指針和設在各策略路線中的指向動作路線的指針實現動作路線與策略路線的連鎖。
21.按權利要求13所述的推理系統,其特征在于通過將由完全相同的輸入輸出變量值的組構成的動作取樣只留下1個將其他刪除,作成動作路線。
22.按權利要求13所述的推理系統,其特征在于還具有為了作為驗證用的數據使用而按時間順序逐一取入上述動作取樣的輸入裝置、搜尋具有取入的輸入數據不滿足的條件的目標路線并在存儲器中將與搜尋出的目標路線連鎖的策略路線列表的列表裝置、從上述列表的策略路線中搜尋具有上述取入的輸入數據滿足的條件的策略路線并將與搜尋出的策略路線連鎖的動作路線在存儲器中列表的列表裝置、在上述列表的動作路線中輸出具有與上述取入的輸入數據一致或最接近的輸入變量值的動作路線的輸出變量值的輸出裝置,借此驗證上述模型。
23.一種用于使用根據由權利要求13所述的推理系統作成的模型操作或控制對象的系統,該控制系統的特征在于具有順序取入從對象得到的輸入數據的輸入裝置、搜尋具有取入的輸入數據不滿足的條件的目標路線并在存儲器中將與搜尋出的目標路線連鎖的策略路線列表的列表裝置、從上述列表的策略路線中搜尋具有上述取入的輸入數據滿足的條件的策略路線并將與搜尋出的策略路線連鎖的動作路線在存儲器中列表的列表裝置、在上述列表的動作路線中輸出具有與上述取入的輸入數據一致或最接近的輸入變量值的動作路線的輸出變量值的輸出裝置和每次取入輸入數據時反復進行上述處理的控制裝置。
全文摘要
本發明取入由通過操作或控制對象而得到的輸入輸出變量值的組構成的一系列的動作取樣,對每個輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規定的目標路線,抽出輸出變量值保持同一性的輸入變量的范圍,對各范圍作成將輸入變量的范圍與輸出變量值聯系的策略路線。將具有不滿足目標路線的條件的輸入變量范圍的策略路線與該目標路線連鎖。將具有進入策略路線的輸入變量范圍的輸入變量值的動作路線與該策略路線連鎖。
文檔編號G05B13/02GK1142269SQ95191798
公開日1997年2月5日 申請日期1995年12月14日 優先權日1994年12月28日
發明者井坂曉 申請人:歐姆龍株式會社