專利名稱:信號處理設備的制作方法
技術領域:
本發明涉及一種信號處理設備,尤其涉及這樣一種信號處理設備,例如,它在不需要用戶知道的情況下學習用戶的操作,以便幫助用戶執行最佳處理。
背景技術:
例如,作為常規的NR(降噪)電路,如果用戶操作其中的調節旋鈕并把它設置到某個位置,將執行對應于該旋鈕位置的噪聲去除處理。
現在,輸入到NR電路的信號的S/N(信噪比)和頻率特性等并不一定總是恒定的,相反,通常它們都是變化的。如果輸入到NR電路的信號的S/N(信噪比)和頻率特性等發生變化,則并不一定執行對應于用戶已經設置的旋鈕位置的噪聲去除處理中關于輸入到NR電路的信號的適當處理。相應地,用戶需要經常地操作旋鈕來替他或她自己執行適合的噪聲去除處理,而這讓人感到不便。
發明內容
本發明是基于這種情況提出的,并且相應地,其中的一個目的是在不需要用戶知道的情況下學習用戶的操作,以便幫助用戶執行最佳處理。
根據本發明的信號處理設備,包括判斷部件,用于監視根據用戶的操作所提供的操作信號,并判斷該信號是否對學習有用;學習部件,用于基于可用于學習的操作信號的學習操作信號,學習校正規范(norm),該校正規范是一種用于校正輸入信號的規范;校正部件,用于基于從學習中獲得的所述校正規范,校正輸入信號并輸出校正后的信號作為輸出信號。
根據本發明的信號處理方法,包括判斷步驟,用于監視根據用戶的操作所提供的操作信號,并判斷該信號是否對學習有用;學習步驟,用于基于可用于學習的操作信號的學習操作信號,學習校正規范,該校正規范是一種用于校正輸入信號的規范;校正步驟,用于基于從學習中獲得的所述校正規范,校正輸入信號并輸出校正后的信號作為輸出信號。
根據本發明的程序,包括判斷步驟,用于監視根據用戶的操作所提供的操作信號,并判斷該信號是否對學習有用;學習步驟,用于基于可用于學習的操作信號的學習操作信號,學習校正規范,該校正規范是一種用于校正輸入信號的規范;校正步驟,用于基于從學習中獲得的所述校正規范,校正輸入信號并輸出校正后的信號作為輸出信號。
根據本發明的存儲程序的記錄介質,該程序包括判斷步驟,用于監視根據用戶的操作所提供的操作信號,并判斷該信號是否對學習有用;學習步驟,用于基于可用于學習的操作信號的學習操作信號,學習校正規范,該校正規范是一種用于校正輸入信號的規范;校正步驟,用于基于從學習中獲得的所述校正規范,校正輸入信號并輸出校正后的信號作為輸出信號。
通過根據本發明的信號處理設備、信號處理方法、程序和記錄介質,監視根據用戶操作提供的操作信號,作出關于該信號是否對學習有用的判斷,并基于所述學習操作信號,學習用于校正輸入信號的規范的校正規范。接著,基于從學習中獲得的所述校正規范,校正輸入信號,并且輸出校正后的信號作為輸出信號。
圖1是說明應用本發明的優化設備的實施例的配置的方框圖;圖2是描述優化設備的優化處理的流程圖;圖3是說明使用優化設備的NR電路的實施例的配置示例的方框;圖4A是表示輸入信號的波形圖;圖4B是表示輸入可靠性的波形圖;圖5是描述NR電路校正處理的流程圖;圖6是描述NR電路校正參數計算處理的流程圖;圖7是描述NR電路控制數據學習處理的流程圖;圖8A至圖8C是描述控制數據學習處理的圖;圖9是說明使用優化設備的NR電路的另一個實施例的配置示例的方框圖;圖10是說明和參數控制數據相乘的多個像素的例圖;圖11是描述NR電路的校正參數計算處理的流程圖;圖12是描述NR電路的控制數據學習處理的流程圖;
圖13是說明應用本發明的自動駕駛(automatic driving)設備的實施例的配置的方框圖;圖14是說明優化設備54的配置示例的方框圖;圖15是描述優化設備54的校正參數計算處理的流程圖;圖16是描述關于優化設備54的控制數據學習處理的流程圖。
圖17是說明優化設備54的另一種配置示例的方框圖;圖18是指示由計算單元53輸出的駕駛方向的例圖;圖19解釋優化設備54的校正處理的流程圖;圖20是描述優化設備54的校正參數學習處理的流程圖;圖21是說明應用本發明的計算機的實施例的配置示例的方框圖。
具體實施例方式
圖1說明了應用本發明的優化設備的實施例的配置示例。
利用該優化設備,在用戶不知道的情況下通過學習用戶的操作幫助用戶執行最優化處理。即,利用該優化設備,監視對應于用戶的操作而提供的操作信號,并判斷這些信號是可用于學習。如果所述操作信號是可用于學習的學習操作信號,則基于所述學習操作信號,學習作為用于校正輸入信號的規范的校正規范。另一方面,基于通過學習而獲得的所述校正規范,校正輸入信號,并輸出校正后的信號作為輸出信號。
優化設備由一個校正單元1和一個學習單元2組成,除了要進行處理的輸入信號外,與用戶操作對應的操作信號也被提供給這兩個單元。
從操作單元3提供所述操作信號。即,例如,所述操作單元3由旋轉或滑動按鈕、開關、定點設備等組成,并把與用戶操作對應的操作信號提供給所述優化設備。
例如,和來自學習單元2的用作校正輸入信號的校正規范的校正參數一樣,數字輸入信號也被提供給用來組成優化設備的校正單元1。校正單元1基于所述校正參數校正所述輸入信號,并輸出校正后的信號作為輸出信號。
如同把來自操作單元3的操作信號提供給學習單元2一樣,當必要時,也把輸入信號或輸出信號提供給學習單元2。學習單元2監視所述操作信號,并判斷這些信號是否可用于學習。如果所述操作信號是對學習有用的學習操作信號,當必要時,學習單元2就基于所述學習操作信號,利用輸入信號或輸出信號學習用于校正輸入信號的校正參數,并把它們提供給校正單元1。
注意,學習單元2有一個內置的學習數據存儲器33和學習信息存儲器35,其中學習數據存儲器33存儲用于學習的學習數據,而學習信息存儲器35存儲通過學習而獲得的、后面就會描述到的學習信息。
接下來,參照圖2所示的流程圖,將描述在圖1所示的優化設備中執行的處理(優化處理)。
首先,在步驟S1中,學習單元2判斷是否收到來自操作單元3的學習操作信號。這里,如果對操作單元3進行操作,通常,用戶首先執行一般的操作,然后執行詳細操作,同時在確認根據操作而輸出的輸出信號,然后在獲得用戶認為是最終的最佳輸出信號的某點停止操作。在獲得用戶認為是最終的最佳輸出信號的點與操作單元3的位置相對應的操作信號是所述學習操作信號,并且因此,如果操作單元3被操作了預定的時間值或更長的時間,然后停止該操作,學習單元2把停止時刻的操作信號判斷為學習操作信號。
在步驟S1中,例如,如果判斷出沒有收到所述學習操作信號,即,如果用戶沒有操作操作單元3,或者雖然已經操作了,但是仍在尋找最佳位置,則跳過步驟S2至步驟S10,流程進行到步驟S11,并且,校正單元1根據已經設置好的校正參數校正輸入信號,并輸出輸出信號作為校正結果,接著,流程返回步驟S1。
同時,在步驟S1中,如果判斷出已接收到所述學習操作數據,流程進行到步驟S2,學習單元2基于所述學習操作信號獲得用于學習的學習數據,并且,流程進行到步驟S3。在步驟S3中,學習數據存儲器33存儲在步驟S2中獲得的最新學習數據。
這里,學習數據存儲器33具有能夠存儲多組學習數據的存儲容量。同時,如果該存儲容量被填滿,就調整學習數據存儲器33以便用下一個學習數據蓋寫最早存儲的數值。因此,在學習數據存儲器33中就存有最新存儲的多組學習數據。
繼在步驟S3中在學習數據存儲器33存儲學習數據之后,流程進行到步驟S4,這里,學習單元2利用在學習數據存儲器33中存儲的最新學習數據和在學習信息存儲器35中存儲的學習信息來執行學習,并獲得校正參數,然后,流程進行到步驟S5。在步驟S5中,學習單元2用在步驟S4的學習過程中所中途獲得的新的學習信息更新學習信息存儲器35中已存儲的內容,接著,流程進行到步驟S6。
在步驟S6中,學習單元2獲得表示在步驟S4中獲得的校正參數的適合性的、隨后所述的適合性,流程進行到步驟S7,并且基于該適合性判斷在步驟S4中獲得的校正參數是否合適。
如果在步驟S7中判斷出所述校正參數是合適的,則跳過步驟S8和步驟S9,流程進行到步驟S10,并且,學習單元2把判斷為合適的校正參數輸出到校正單元1,流程進行到步驟S11。因此,在這種情況下,在步驟S4中通過學習而新獲得校正參數之后,在校正單元1中執行隨后的輸入信號的校正。
另一方面,如果在步驟S7中判斷出所述校正參數不合適,流程進行到步驟S8,學習單元2僅僅利用在學習數據存儲器33存儲的學習數據中的最新學習數據來執行學習,獲得校正參數,接著,流程進行到步驟S9。在步驟S9中,學習單元2用在步驟S8中的學習過程中所中途獲得的新的學習信息更新學習信息存儲器35中已存儲的內容,接著,流程進行到步驟S10。在這種情況下,在步驟S10中,學習單元2把在步驟S8中僅從最新的學習數據中獲得的校正參數輸出到校正單元1,并且,流程進行到步驟S11。因此,在這種情況下,在步驟S8中通過學習而新獲得校正參數之后,在校正單元1中執行隨后的輸入信號校正。
接下來,例如,圖3說明了這樣一種情況下的一個詳細配置示例,其中,如圖1所示的優化設備被應用到一個NR電路,該電路用來從圖像信號和音頻信號中去除噪聲。
權重(weighting)存儲器11存儲隨后所述的作為由學習單元2的選擇單元21提供的校正參數的權重(系數)W(即,一個大于等于0而小于等于1的值)。而權重存儲器12則存儲由計算單元13提供的權重1-W。
計算單元13提供這樣一個差值,其中,由學習單元2中的選擇單元21提供的權重W被從1中減去,該差值被作為權重提供給權重存儲器12。計算單元14將輸入信號和在權重存儲器12中存儲的權重1-W相乘,并把相乘后的值提供給計算單元16。計算單元15將在權重存儲器11中存儲的權重W和在鎖存電路17中存儲(鎖存)的輸出信號相乘,并把相乘后的值提供給計算單元16。計算單元16把計算單元14和15的輸出相加,并輸出相加之后的值作為輸出信號。
鎖存電路17鎖存計算單元16輸出的輸出信號,并把這些信號提供給計算單元15。
在如圖3所示的實施例中,校正單元1由上述的權重存儲器11和12、計算單元13、14、15和16以及鎖存電路17組成。
選擇單元21在由權重校正單元26輸出的權重或由操作信號處理單元30輸出的權重中二者擇其一,并把它作為校正參數提供給校正單元1。
將輸入信號提供給輸入可靠性計算單元22,并通過它獲得表示其輸入信號的可靠性的輸入可靠性,該輸入可靠性被輸出到輸出可靠性計算單元23和權重計算單元25。輸出可靠性計算單元23基于來自輸入可靠性計算單元22的輸入可靠性獲得表示輸出信號的可靠性的輸出可靠性,并把它提供給鎖存電路24和權重計算單元25。鎖存電路24存儲(鎖存)來自輸出可靠性計算單元23的輸出可靠性,并把它提供給輸出可靠性計算單元23和權重計算單元25。
權重計算單元25根據來自輸入可靠性計算單元22的輸入可靠性和來自輸出可靠性計算單元23的輸出可靠性,計算權重,并把它輸出到權重校正單元26。對權重校正單元26提供來自于參數控制數據存儲器37的參數控制數據,該參數控制數據控制作為校正參數的權重,除了權重外,權重校正電路26還用所述參數控制數據對權重進行處理(校正),并把它提供給選擇單元21。
對操作信號處理單元30提供來自操作單元3(圖1)的操作信號,同時操作信號處理單元30對提供給它的操作信號進行處理,并把與其中操作信號對應的權重提供給選擇單元21、老師(tutor)數據生成單元31和學生(student)數據生成單元32。此外,所述操作信號處理單元30判斷所述操作信號是否是如上所述的學習操作信號,并且如果操作信號就是學習操作信號,則把表明這種結果的一個標志(以后稱作學習標志)加到將被輸出的權重中。
一旦從操作信號處理單元30收到帶有學習標志的權重,老師數據生成單元31就產生一個作為學習的老師的老師數據,并把它提供給學習數據存儲器33。即,老師數據生成單元31把加入學習標志的權重作為老師數據提供給學習數據存儲器33。
學生數據生成單元32一旦從操作信號處理單元30收到加入學習標志的權重,就產生一個作為學習的學生的學生數據,并把它提供給學習數據存儲器33。即,學生數據生成單元32以與如上所述的輸入可靠性計算單元22、輸出可靠性計算單元23、鎖存單元24和權重計算單元25相同的方法被配置,以便根據提供給它的輸入信號計算權重,并且一旦收到帶有學習標志的權重,就把根據輸入信號計算的權重作為學生數據提供給學習數據存儲器33。
學習數據存儲器33把從老師數據生成單元31提供的用作對應于學習操作信號的權重的一組老師數據,和從學生數據生成單元32提供的用作在收到學習操作信號的時刻從輸入信號計算的權重的學生數據,作為一組學習數據存儲起來。如上所述,所述學習數據存儲器33具有存儲多組學習數據的能力,并且,一旦存儲的學習數據達到存儲容量,所述學習數據存儲器33就通過蓋寫最早存儲的數據來存儲下一個學習數據。因此,學習數據存儲器33在任何時候都基本上具有存儲在其中的最新的學習數據組。
參數控制數據計算單元34對作為學習數據存儲在學習數據存儲器33中的老師數據和學生數據進行學習,同時,如果必要,也學習提供給判斷控制單元36的在判斷控制單元36的控制下,使用存儲在學習信息存儲器35中的學習信息并通過計算新的學習信息,使預定統計誤差最小的參數控制數據。同時,參數控制數據計算單元34用通過學習而獲得的新的學習信息來更新在學習信息存儲器35所存儲的內容。學習信息存儲器35存儲來自參數控制數據計算單元34的學習信息。
判斷控制單元36參照存儲在學習數據存儲器33中的最新學習數據,對由參數控制數據計算單元34提供的參數控制數據的適合性進行判斷。同時,判斷控制單元36也對參數控制數據計算單元34進行控制,并把從參數控制數據計算單元34提供的參數控制數據提供給參數控制數據存儲器37。參數控制數據存儲器37用從判斷控制單元36提供的參數控制數據,更新其中所存儲的內容,并把它提供給權重校正單元26。
在圖3所示的實施例中,學習單元2由上述選擇單元21至權重校正單元26和操作信號處理單元30至參數控制數據存儲器37組成。
輸入信號的噪聲通過按如上所述配置的用作NR電路的優化設備按如下所述方法去除。
即,例如,為了簡化描述,用一個恒定真值且疊加隨時間波動的噪聲的輸入信號來考慮去除隨時間波動的噪聲方法,如圖4A所示,通過對其取平均,并采取給高噪聲的輸入信號(即,S/N較差的信號)一個小的權重值(不給予太多的考慮),例如按照噪聲的程度,同時給低噪聲的輸入信號(即,具有高S/N的信號)一個高的權重值,噪聲就可被有效地去除。
因此,利用如圖3所示的NR電路,通過獲得相對于真實值的輸入信號的近似作為輸入信號的評估值,如圖4B中說明輸入可靠性表示輸入信號是真實值的可靠性的示例所示,并通過執行與輸入信號的輸入可靠性對應的權重運算計算其均值來有效去除噪聲。
因此,利用如圖3所示的NR電路,使用與輸入可靠性對應的權重就可獲得關于輸入信號的加權平均,并輸出它作為輸出信號,而且由如下表達式可獲得該輸出信號y(t),這里,在t時刻的輸入信號、輸出信號、輸入可靠性分別由x(t)、y(t)、αx(t)表示[表達式1]y(t)=Σi=0tαx(i)x(i)Σi=0tαx(i)...(1)]]>這里,輸入可靠性αx(t)越大,被提供的權重值就越大。
根據表達式(1),從當前時刻t后退一個采樣點的輸出信號y(t-1)可以由下式獲得[表達式2]y(t-1)=Σi=0t-1αx(i)x(i)Σi=0t-1αx(i)...(2)]]>在考慮輸出信號y(t)的同時,也把表示真值逼近值的輸出可靠性αy(t),即輸出信號y(t)是真值的可靠性作為輸出信號y(t)的評估值來引入,并且,通過下式定義從當前時刻t后退一個采樣點的輸出信號y(t-1)的輸出可靠性αy(t-1)。
αy(t-1)=Σi=0t-1αx(i)...(3)]]>在此情況下,根據表達式(1)至(3),其中的輸出信號y(t)和輸出可靠性αy(t)可表達如下。
[表達式5]αy(t)=αy(t-1)+αx(t)...(5)同時,用于獲得在t時刻的輸出信號y(t)的權重可用w(t)表示,并由下式定義。
w(t)=αy(t-1)αy(t-1)+αx(t)...(6)]]>根據表達式(6),下式成立。
1-w(t)=αx(t)αy(t-1)+αx(t)...(7)]]>利用表達式(6)和表達式(7),可以根據如下的乘法和加法運算的加權平均表示表達式(4)中的輸出信號y(t)。
y(t)=w(t)y(t-1)+1(1-w(t))x(t)...(8)注意,根據用于后退一個采樣的輸出信號y(t-1)的輸出可靠性αy(t-1)和用于當前輸入信號x(t)的輸入可靠性αx(t),從表達式(6)中可以得到在表達式(8)中使用的權重w(t)(和1-w(t))。同時,根據用于后退一個采樣的輸出信號y(t-1)的輸出可靠性αy(t-1)和用于當前輸入信號x(t)的輸入可靠性αx(t),也可以得到用于當前輸出信號y(t)的輸出可靠性αy(t)。
現在,分別利用方差σx(t)2或σy(t)2的倒數作為輸入信號x(t)的輸入可靠性αx(t)或輸出信號y(t)的輸出可靠性αy(t),即,按如下表達式定義輸入可靠性αx(t)和輸出可靠性αy(t)。αx(t)=1σx(t)2]]>αy(t)=1σy(t)2...(9)]]>根據下式可以得到表達式(6)中的權重w(t)和表達式(7)中的權重1-w(t)。
w(t)=σx(t)2σt(t-1)2+σx(t)2...(10)]]>[表達式11]1-w(t)=σy(t-1)2σy(t-1)2+σx(t)2...(11)]]>另外,根據下式可以得到σy(t)2[表達式12]σy(t)2=w(t)2σy(t-1)2+(1-w(t))2σx(t)2...(12)如圖3所示的NR電路基本上按照表達式(6)來執行用于計算作為權重w(t)的校正參數的校正參數計算處理,并利用該權重w(t)按表達式(8)計算在后退一個采樣的輸出信號y(t-1)和當前輸入信號x(t)之間的加權平均,從而,執行用于有效去除包含在輸入信號x(t)中的噪聲的校正處理。
現在,用戶將沒必要感覺到通過根據表達式(6)獲得的權重w(t)而對輸入信號進行校正處理而獲得的結果的輸出信號是最佳的。因此,如圖3所示的NR電路為了獲得用于控制(校正)作為校正參數的權重w(t),通過學習用戶對操作單元3的操作來執行控制數據學習處理,并利用由參數控制數據校正的權重執行輸入信號的校正處理。
控制數據學習處理按如下方式進行。
即,可以這樣認為,對于在提供學習操作信號的時刻輸入的輸入信號而言,用戶認為對應于通過用戶在第i時刻對操作單元3操作而提供的學習操作信號的權重wi是最佳的,并且因此,對于控制數據學習處理來說,獲得能把按照表達式(6)獲得的權重w(t)校正成對應于學習操作信號的權重wI的接近值(理論上是相同值)的參數控制數據就足夠了。
為此,現在讓我們這樣考慮,把根據表達式(6)獲得的權重w(t)作為用于學習的如同學生的學生數據,而把與學習操作信號對應的權重wi作為用于學習的如同老師的老師數據,并從作為學生數據的權重w(t)中獲得一個相對于根據由諸如如下式所示的參數控制數據a和b定義的線性表達式預測的作為老師數據的權重Wi的預測值Wi'。[表達式13]Wi′=awi+b...(13)注意,在表達式(13)中(如同在隨后描述的表達式(14)以及表達式(16)至(21)一樣),就對應于作為老師數據的學習操作信號的權重Wi被輸入的時刻輸入的輸入信號而言,wi表示根據表達式(6)獲得的用作學生數據的權重w(t)。
根據表達式(13),在作為老師數據的Wi和它的預測值Wi′之間的誤差(預測誤差)ei按如下所示的表達式表達。[表達式14]ei=Wi-Wi′=Wi-(awi+b)...(14)現在,讓我們考慮利用如下表達式表達的,獲得能使在表達式(14)中預測誤差ei的方差(square error)之和最小的參數控制數據a和b。[表達式15]Σi=1Nei2...(15)]]>注意,在表達式(15)中(如同在隨后描述表達式(16)至(21)一樣),N表示老師數據和學生數據的組數。
首先,用參數控制數據a和b分別對表達式(15)中的方差之和取偏導數得到如下表達式。[表達式16]∂Σi=1Nei2∂a=-2Σi=1Nwi(Wi-(awi+b))...(16)]]>[表達式17]∂Σi=1Nei2∂b=-2Σi=1N(Wi-(awi+b))...(17)]]>因為表達式(15)中的方差之和的最小值(極小值)可以通過使表達式(16)和表達式(17)的右邊為0的a和b獲得,令表達式(16)和表達式(17)的右邊為0,則分別地,從表達式(16)得到表達式(18),和從表達式(17)得到表達式(19)。[表達式18]NΣi=1NwiWi=NbΣi=1Nwi+NaΣi=1Nwi2...(18)]]>[表達式19]Nb=Σi=1NWi-aΣi=1Nwi...(19)]]>將表達式(19)代入表達式(18)從如下表達式得到參數控制數據a。[表達式20]a=NΣi=1NwiWi-Σi=1NwiΣi=1NWiNΣi=1Nwi2-(Σi=1Nwi)2...(20)]]>同時,根據表達式(19)和表達式(20)可以從如下表達式獲得參數控制數據b。[表達式21]b=Σi=1NWi-aΣi=1NwiN...(21)]]>為了獲得如上所述的參數控制數據a和b,如圖3所示的NR電路將執行控制數據學習處理。
接下來,參照圖5至圖7的流程圖描述在如圖3所示的NR電路中執行的校正處理、校正參數計算處理和控制數據學習處理。
首先,將參照圖5中的流程圖描述校正處理。
一旦學習單元2的選擇單元21把作為校正參數的權重w(t)提供給了校正單元1,校正單元1中的權重存儲器11就以蓋寫的形式存儲權重w(t)。此外,校正單元1中的計算單元13從1中減去權重w(t)而得到權重1-w(t),并把它提供給權重存儲器12,繼而以蓋寫的形式把它存儲起來。
接著,一旦提供了輸入信號x(t),在步驟S21中,計算單元14就計算輸入信號x(t)和存儲在權重存儲器12中的權重1-w(t)的積,并把它提供給計算單元16。此外,在步驟S21中,計算單元15計算存儲在權重存儲器11中的權重w(t)和由鎖存電路17鎖存的后退一個采樣的輸出信號y(t-1)的積,并把它提供給計算單元16。
流程圖接著進行到步驟S22,這里,計算單元16把權重w(t)和輸出信號y(t-1)的積和輸入信號x(t)和權重1-w(t)的積相加,由此得到輸入信號x(t)和輸出信號y(t-1)的加權和值(1-w(t))x(t)+w(t)y(t-1),并把它作為輸出信號y(t)輸出。同時也把該輸出信號y(t)提供給鎖存電路17,并且鎖存電路17以蓋寫的形式存儲輸出信號y(t)。繼而,流程返回步驟S21,等待提供下一個采樣的輸入信號,繼而,重復相同處理。
接下來,參照如圖6所示的流程圖描述校正參數計算處理。
例如,在步驟S31中,首先,輸入可靠性計算單元22基于輸入信號的離差(dispersion),獲得輸入可靠性αx(t)。
即,輸入可靠性計算單元22有一個內置的未示出的FIFO(先入先出)存儲器,它除了能夠鎖存當前輸入信號的采樣x(t)外,還能夠鎖存幾個過去的采樣,并鎖存利用當前輸入信號和幾個過去的采樣信號計算的離差,以及把作為輸入可靠性αx(t)獲得并提供給輸出可靠性計算單元23和權重計算單元25的倒數。注意存在好幾種情況,例如,其中,緊跟在輸入信號的起始輸入之后將沒有足夠的計算離差所必需的輸入信號采樣,在此情況下,將把缺省值作為輸入可靠性αx(t)輸出。
接著,流程進行到步驟S32,權重計算單元25利用來自輸入可靠性計算單元22的輸入可靠性αx(t),由表達式(6)獲得權重w(t)。
即,在輸入可靠性計算單元22提供輸入可靠性αx(t)給權重計算單元25的時序,鎖存電路24把輸出可靠性計算單元23已經輸出一個采樣的輸出可靠性αy(t-1)鎖存起來,并在步驟S32中,權重計算單元25利用來自輸入可靠性計算單元22的輸入可靠性αx(t)和鎖存電路24鎖存的輸出可靠性αy(t-1)根據表達式(6)獲得權重w(t)。并把該權重w(t)提供給權重校正單元26。
接著,流程進行到步驟S33,權重校正單元26從參數控制數據存儲器37中讀取參數控制數據,流程進行到步驟S34。在步驟S34中,權重校正單元26判斷從參數控制數據存儲器37讀出的參數控制數據是否是其中的權重w(t)沒有被校正過的一種模式的數據,即,表示這樣一種模式的自動模式數據,在該模式中,也可以說,其中在權重計算單元25,從輸入可靠性和輸出可靠性中自動獲得的權重w(t)、作為用于校正輸入信號x(t)的權重W,而不管用戶在操作單元3的操作(以后稱之為自動模式)。
在步驟S34中,如果判斷出所述參數控制數據不是自動模式數據,流程進行到步驟S35,權重校正單元26按照在從參數控制數據存儲器37提供的參數控制數據a和b所定義的表達式(13)中的線性表達式,對權重校正單元25提供的權重w(t)進行校正,程序進行到步驟S36。在步驟S36,權重校正單元26把校正后的權重提供給選擇單元21,而流程進行到步驟S37。這里,在表達式(13)中,wi等價于由權重計算單元25提供的權重w(t),而Wi′等價于校正后的權重W。
另一方面,在步驟S34中,如果判斷出參數控制數據是自動模式數據,流程跳過步驟S35,進行到步驟S36,這里,權重校正單元26把來自權重計算單元25的權重w(t)不加改變地提供給選擇單元21,流程進行到步驟S37。
在步驟S37中,輸出可靠性計算單元23對輸出可靠性進行更新。即,輸出可靠性計算單元23按照表達式(5)把在前面的步驟S31中輸入可靠性計算單元22已經計算過的輸入可靠性αx(t),和在鎖存電路24中已經鎖存的來自后退一個采樣的輸出可靠性αy(t-1)相加,由此得到當前輸出可靠性αy(t),該可靠性αy(t)以蓋寫形式存儲在鎖存電路24中。
接著,流程進行到步驟S38,選擇單元21根據操作信號處理單元30的輸出,判斷用戶是否正在對操作單元3操作。如果在步驟S38中判斷出沒有對操作單元3操作,流程進行到步驟S39,這里,選擇單元21選擇由權重校正單元26提供的權重(以后稱作校正權重),該權重被輸出到校正單元1,流程返回步驟S31。
同時,在步驟S38中,如果判斷出正在對操作單元3操作,流程進行到步驟S40,這里,選擇單元21按操作選擇由操作信號處理單元30輸出的權重,并把它輸出到校正單元1,流程進行到步驟S31。
因此,在如圖6所示的校正參數計算處理中,如果沒有對操作單元3進行操作,就把校正權重提供給校正單元1,而如果正在對操作單元3進行操作,就把對應于操作信號的權重提供給校正單元1。結果,在校正單元1,如果沒有對操作單元3操作,校正權重就對輸入信號校正,而如果正在對操作單元3操作,對應于操作信號的權重就對輸入信號校正。
此外,在圖6的校正參數計算處理中,如果是自動模式,僅僅根據輸入可靠性和輸出可靠性就能得到用于校正處理的權重,而不管對操作單元3是否操作,如果不是自動模式,就需要基于對操作單元3的操作,利用在隨后所述的圖7所示的控制數據學習處理中通過學習而獲得的參數控制數據,得到用于校正處理的權重。
接著,參照圖7所示的流程圖描述控制數據學習處理。
在控制數據學習處理中,首先,在步驟S41中,操作信號處理單元30判斷從操作單元3是否已接收到學習操作信號,如果判斷出沒有收到,流程返回步驟S41。
同時,如果判斷出在步驟S41中從操作單元3已接收到學習操作信號,即是說,如果能判斷出用戶為了得到想要的輸出信號已經對操作單元3進行了操作,諸如這樣一些情形,其中,例如,啟動對操作單元3操作,在此之后,在不超過第一時間段t1或更長時間段,就接著連續操作一段時間即第二時間段t2或更長時間段,繼它之后,連續停止操作一段時間即第三段時間t3或更長時間,流程進行到步驟S42,這里,老師數據生成單元31生成老師數據,而學生數據生成單元32生成學生數據。
即,如果一旦接收到學習操作信號,操作信號處理單元30就把對應于學習操作信號的權重W(例如,對應于操作單元3的操作量、或用作操作單元3的旋鈕或手把位置的權重)和學習標志一起提供給老師數據生成單元31和學生數據生成單元32。一旦接收到帶有學習標志的權重W,老師數據生成單元31就獲得作為老師數據的權重W,并把它提供給學習數據存儲器33。同時,一旦接收到帶有學習標志的權重,學生數據生成單元32也獲得一個與在此時作為學生數據的輸入信號對應的權重w,并把它提供給學習數據存儲器33。
這里,也可以說,與輸入信號對應的權重w意指根據輸入可靠性和輸出可靠性并按照表達式(6)自動獲得的權重,并如上所述,學生數據生成單元32根據輸入信號計算與輸入信號對應的該權重w。
一旦從老師數據生成單元31接收到老師數據W并從學生數據生成單元32接收到學生數據w,學習數據存儲器33就在步驟S43把一組最新的老師數據W和學生數據w存儲起來,流程進行到步驟S44。
在步驟S44中,參數控制數據計算單元34用老師數據和學生數據執行用于最小二乘(least square)的加法運算。
即,參數控制數據計算單元34執行在表達式(20)和(21)中的等價于學生數據wi和老師數據Wi的乘法運算(wiWi)和加法運算(∑wiWi)、等價于學生數據wi的加法運算(∑wi)、等價于老師數據WI的加法運算(∑Wi)、等價于學生數據wi自身的先積后和(summation of the product of)的運算(∑wi2)的運算。
現在假定,例如,已經獲得N-1組老師數據和學生數據,并獲得作為最新老師數據和學生數據的第N′組老師數據和學生數據,此時,在參數控制數據計算單元34中已經執行了第N′-1組老師數據和學生數據的加入。因此,對于第N′組老師數據和學生數據而言,只要保存了加入第N′-1組老師數據和學生數據的結果,通過加入第N′組老師數據和學生數據就可獲得加入了N組老師數據和學生數據的、包括最新老師數據和學生數據的結果。
因此,參數控制數據計算單元34把前一步驟的加入結果存儲在學習信息存儲器35中作為學習信息,并使用該學習信息執行關于第N′組老師數據和學生數據的加入。現在,至目前為止用于加入的老師數據和學生數據的組數N對于加入也是必要的,并學習信息存儲器35存儲組數N作為學習信息。
繼在步驟S44中執行加入之后,參數控制數據計算單元34把加入的結果作為學習信息以蓋寫的形式存儲在學習信息存儲器35中,流程進行到步驟S45。
在步驟S45中,參數控制數據計算單元34從存儲在學習信息存儲器35中的作為學習信息的加入結果,判斷是否可以用表達式(20)和(21)獲得參數控制數據a和b。
即,利用適合的以后被當作一個學習對(learning pair)的老師數據和學生數據組,如果不存在通過至少兩個學習對而獲得的學習信息,則不可能從表達式(20)和(21)中獲得參數控制數據a和b。因此在步驟S45中,判斷是否可從學習信息中獲得參數控制數據a和b。
如果在步驟S45中判斷出不可能獲得參數控制數據a和b,參數控制數據計算單元34就把得出此結果的通知提供給判斷控制單元36,流程進行到步驟S49。在步驟S49中,判斷控制單元36把指示自動模式的自動模式數據提供給參數控制數據存儲器37,這里,存儲自動模式數據作為參數控制數據。接著,流程返回到步驟S41,并接下來,重復相同的處理。
因此,如果不存在足夠的用于獲得參數控制數據a和b的學習信息,則正如圖6所示,從輸入可靠性和輸出可靠性自動獲得的權重w(t)就可以不變地用于校正輸入信號x(t)。
另一個方面,如果在步驟S45中判斷出可以獲得參數控制數據a和b,流程進行到步驟S46,在此利用判斷控制單元36所提供的學習信息通過計算表達式(20)和(21)獲得參數控制數據a和b,流程進行到步驟S47。
在步驟S47中,判斷控制單元36按照由來自參數控制數據計算單元34的參數控制數據a和b定義的表達式(13)中的線性表達式,從存儲在學習數據存儲器33中的每條學生數據中,獲得對應于老師數據的預測值,并獲得在表達式(15)中表示的、用于其預測值的預測誤差的方差的和(對于存儲在學習數據存儲器33中的老師數據的誤差)。此外,判斷控制單元36獲得一個歸一化誤差(normalization error),例如,其中,方差的和用存儲在學習數據存儲器33中的學習對數目來除,流程進行到步驟S48。
在步驟S48中,判斷控制單元36判斷所示歸一化誤差是否大于(大于或等于)一個預定的閾值S1。在步驟S48中,如果判斷出歸一化誤差大于等于預定的閾值S1,即,如果在由參數控制數據a和b定義的表達式(13)中的線性表達式不以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,流程進行到步驟S49,如上所述,在此,判斷控制單元36把表示自動模式的自動模式數據作為參數控制數據提供給參數控制數據存儲器37并存儲起來。流程進行到步驟S41,并重復相同的步驟。
因此,即使能夠獲得參數控制數據a和b,如果在由參數控制數據a和b定義的表達式(13)中的線性表達式不以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則不變地使用從輸入可靠性和輸出可靠性自動獲得的權重w(t)來校正輸入信號x(t),以不存在足夠的用于獲得參數控制數據a和b的學習信息的情形中相同的方式。
另一方面,在步驟S48中,如果判斷出歸一化誤差不大于等于預定的閾值S1,即,如果在由參數控制數據a和b定義的表達式(13)中的線性表達式以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則流程進行到步驟S50,在此,判斷控制單元36獲得由參數控制數據a和b定義的表達式(13)中的線性表達式表示的回歸線和由存儲在學習數據存儲器33中的最新老師數據和學生數據推得的點之間的誤差(距離)ε。
接著流程進行到步驟S51,在此,判斷控制單元36判斷誤差ε的大小是否大于等于預定的閾值S2,并且,如果判斷出它不大于,則跳過步驟S52,流程進行到步驟S53,并且,判斷控制單元36把在步驟S46中獲得的參數控制數據a和b輸出到參數控制單元數據存儲器37。參數控制數據存儲器37把來自判斷控制單元36的參數控制數據a和b以蓋寫的形式存儲起來,流程返回到步驟S41。
另一個方面,如果在步驟S51中判斷出誤差ε的大小大于預定的閾值S2,則流程進行到步驟S52,在這里,判斷控制單元36通過控制參數控制數據計算單元34(不使用在學習信息存儲器35中的學習信息),僅僅利用從存儲在學習數據存儲器33中的作為最新的老師數據和學生數據回退預定數目的學習對,重新計算參數控制數據a和b。流程進行到步驟S53,在這里,判斷控制單元36把在步驟S52中獲得的參數控制數據a和b輸出到參數控制數據存儲器37,并在這里把它以蓋寫形式存儲起來,流程返回到步驟S41。
因此,如果可以獲得參數控制數據a和b,并且同時如果在由參數控制數據a和b定義的表達式(13)中的線性表達式以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則按照由通過利用基于用戶對操作單元3的操作而獲得的學習對執行學習而獲得的參數控制數據a和b定義的表達式(13),校正從輸入可靠性和輸出可靠性獲得的權重w(t),并把因對其校正而獲得的校正權重W用于對輸入信號x(t)的校正。
現在,由在步驟S46獲得的參數控制數據a和b定義的表達式(13)中的線性表達式表示的回歸線是這樣一條線,它將使由如圖8A所示的由N組學生數據和老師數據推定的N個點的方差(之和)最小。并在步驟S50中,得到該線和由最新老師數據和學生數據推得的點之間的誤差ε。
如果該誤差ε的大小不大于預定的閾值S2,則可以認為由在步驟S46獲得的參數控制數據a和b定義的表達式(13)中的線性表達式表示的回歸線,以相對精確的方式逼近包括由最新老師數據和學生數據推得的點在內的、由到目前為止提供的老師數據和學生數據推得的每個點。
然而,如果該誤差ε的大小大于閾值S2,即如果如圖8B所示,由最新老師數據和學生數據推得的點(在圖8B中用圓圈表示)大大地偏離了由在步驟S46獲得的參數控制數據a和b定義的表達式(13)中的線性表達式表示的回歸線,則可以認為用戶出于某種原因以某種趨勢已經對操作單元3執行了有別于至目前為止的操作。
因此,在此情況下,判斷控制單元36通過控制參數控制數據計算單元34,在步驟S52中僅僅利用存儲在學習數據存儲器33的學習對中的幾個最新學習對,重新計算的參數控制數據a和b。
即是說,在此情況下,參數控制數據計算單元34在不利用(忘記)存儲在學習信息存儲器35中的作為過去的加入結果的學習信息的情況下,僅僅利用幾個最近的老師數據和學生數據組,重新計算在表達式(13)中用來定義該線的那些最逼近由老師數據和學生數據推定的一組點的參數控制數據a和b。
具體地講,例如,如圖8C所示,參數控制數據計算單元34得到用來定義穿過由最新老師數據和學生數據推定的點(在圖8C中用圓圈表示)和由后退一個時間提供的老師數據和學生數據推定的點(在圖8C中用三角形表示)的線的參數控制數據a′和b′。
如上所述,根據按照用戶操作提供的操作信號是否對學習有用而作出判斷,如果信號是能用于學習的學習操作信號,則基于該學習操作信號學習用于校正用作校正輸入信號的權重的參數控制數據a和b,于是在不需要用戶使用和知道的情況下就可以學習用戶的操作,結果,基于學習結果漸漸執行適合于用戶的處理,直至最后幫助用戶執行最佳處理。
這就意味著,從用戶的角度來看,在對操作單元3正常操作一段時間以后,即使不進行任何操作,對于各種類型的輸入信號而言,也都能得到對于用戶最佳的降噪結果,因此,也就是說,設備變得受過訓練。在訓練設備階段,用戶對操作單元3操作以便獲得想要的輸出信號,于是用戶漸漸清楚地認識到操作單元3的操作和用于校正輸入信號的權重W之間的關系,于是最終用戶對操作單元3的操作和用于校正輸入信號的權重W在性質上是相關的。
同時,在如圖3所示的NR電路中,用于在操作單元1中執行的校正處理(圖5)的權重W依用戶對操作單元3的操作而改變,結果得到用戶想要的輸出信號。即,一旦用戶對操作單元3操作,操作信號處理單元30就輸出表示對應于該操作的操作信號的權重,選擇單元21選擇該權重,并把它提供給校正單元1。在這種情況下,在校正單元1,利用與用戶所作的操作對應的權重執行表達式(8)表示的校正處理。如果由于用戶的操作而使表達式(8)中的權重w(t)變化,則由表達式(8)表示的處理內容也會變化,于是,可以理所當然地說,在如圖3所示的NR電路中,“處理的內容”隨用戶的操作而變化,結果得到用戶想要的輸出信號。
此外,在如圖3所示的NR電路中,如果不能得到參數控制數據a和b,或如果雖然能得到參數控制數據a和b,但是在由參數控制數據a和b定義的表達式(13)中的線性表達式不以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則在校正單元1使用從輸入可靠性和輸出可靠性自動獲得的權重進行校正處理。另一方面,如果能得到參數控制數據a和b,同時,在由參數控制數據a和b定義的表達式(13)中的線性表達式以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則按照由通過利用基于用戶對操作單元3的操作而獲得的學習對來執行學習而獲得的參數控制數據a和b定義的表達式(13),校正從輸入可靠性和輸出可靠性獲得的權重,并把通過該校正而獲得的已校正權重用于校正單元1的校正處理。
即是說,在如圖3所示的NR電路中,如果用戶沒有輸入足夠的學習對,或者如果在此沒有輸入可能是高精確逼近的學習對,則在校正單元1使用從輸入可靠性和輸出可靠性自動獲得的權重作校正處理,并且如果在此輸入可能是高精確逼近的學習對,則在校正單元1使用利用所述學習對執行學習而獲得的參數控制數據a和b而得到的校正權重作校正處理。
因此,歸納起來,表達式(8)中的權重w(t)在這樣兩種情形之間變化,一種情形是,不能獲得足夠數目的學習對或能高精確逼近的學習對,另一種情形是,能獲得高精確逼近的學習對,從而由表達式(8)表示的校正處理內容也跟著發生變化,所以從這一點來看如圖3所示的NR電路,可以這么說,正是由于改變了“處理內容”所以才得到用戶想要的輸出信號。
此外,在如圖3所示的NR電路中,用于計算用作校正處理的權重的系統將隨著這樣一些情形而變化,其中一些情形是,不能獲得足夠數目的學習對或高精確逼近的學習對,另一些情形是,能獲得高精確逼近的學習對。
即是說,在不能獲得足夠數目的學習對或能高精確逼近的學習對的情形下,不管用戶是否操作,權重都從輸入可靠性和輸出可靠性得到。另一方面,如果已經得到高精確逼近的學習對,則基于通過學習獲得的參數控制數據并利用基于用戶操作獲得的學習對就可獲得所述權重。
因此,在此情況下,可以說,隨著用戶的操作而改變用于計算權重的處理系統即如何獲得權重的算法,就可得到用戶想要的輸出信號。
現在用函數F表示用于獲得權重的處理,改變如上所述的“處理內容”就等價于改變函數F。這里,函數F發生變化的情形可以分為兩種情形,一種是,函數F本身的形式發生改變(即,這種情形是,F=x變為F=x2等)另一種情形是,函數F本身的形式不變化但是定義函數F的系數變化(即,F=2x變為F=3x,等)現在,相對“處理的內容”中的變化而言,如果我們假定這樣一種情形,其中,表示本身變化的處理的函數F的形式是“處理的配置”的變化,那么,改變用于計算如上所述的等待(用于如何獲得權重的算法)的處理系統就可以說是改變“處理的配置”。
因此,在如圖3所示的NR電路中,除了“處理的內容”外,“處理的配置”同時也隨用戶的操作而改變,從而得到用戶想要的輸出信號。
同時,對于輸入信號而言,也可以使用圖像信號和音頻信號,當然還有其他信號。如果輸入信號是圖像信號,則基于將被處理的某個像素附近的多個像素獲得的離差,就可要么在空域或要么在時域計算輸入可靠性。
同時,對于如上所述的情形,為了便于描述,由在學習單元2中的參數控制數據a和b定義的表達式(13)中的線性表達式,把從輸入可靠性等獲得的權重w校正成校正權重W,但實際上,權重w的校正更傾向于由更高次表達式執行。同時,例如,基于所使用的優化設備的應用等更傾向于把在高次表達式中的次數設置成一個適合的值。
此外,可以調整用于從權重w中得到校正權重W的表達式(以后稱作校正權重計算表達式),其中,除了在表達式(13)中的線性表達式w=aw+b外,還預備了多次方表達式,例如,諸如二次方表達式w=aw2+bw+c,三次方表達式w=aw3+bw2+cw+d等(其中a,b,c,和d是預定的系數),并且其中采用了屏蔽(shield)最小歸一化誤差的多次方校正權重計算表達式。注意,在此情況下,選擇其中根據由用戶操作獲得的學習對而得到的歸一化誤差最小的校正權重計算表達式,并利用被選中的校正權重計算表達式得到校正權重。即是說,如何得到校正權重的算法隨著用戶的操作變化而變化。由此,同樣在此情況下,也可以說,“處理的配置”隨著用戶的操作變化而變化。
接下來,圖9說明了其中把如圖1所示的優化設備應用到NR電路這樣一種情況的另一個詳細配置示例。在該圖中,與圖3所述的情形相對應的部分被賦予相同的參考號碼,并且,適當地省略了其中的描述。即是說,除了沒有提供權重校正單元26以及分別用輸入可靠性計算單元41和學生數據生成單元42代替輸入可靠性計算單元22和學生數據生成單元32外,如圖9所示的NR電路與如圖3所示的NR電路基本上相同。
輸入可靠性計算單元41根據輸入信號的多個采樣和存儲在參數控制數據存儲器37中的參數控制數據,計算輸入可靠性,并把計算結果提供給輸出可靠性計算單元23和權重計算單元25。
學生數據生成單元42獲得作為學生數據的輸入信號和從輸出可靠性計算單元23輸出的輸出可靠性,并把它提供給學習數據存儲器33。
注意,在如圖9所示的實施例中,沒有提供權重校正單元26,所以就直接把在權重計算單元25得到的權重不變地提供給選擇單元21,并且該選擇單元21按如圖3所示的相同的方法選擇和輸出由權重計算單元25輸出的權重或操作信號處理單元30輸出的權重的一個或另一個。
同時,在如圖9所示的實施例中,參數控制數據用作控制輸入可靠性的數據。
正如如圖3所示的NR電路一樣,在圖9所示的NR電路同樣也執行校正處理、校正參數計算處理和控制數據學習處理。按照參照如圖5所述的相同方法執行校正處理,所以將忽略如圖9所示NR電路的校正處理的描述,而描述校正參數計算處理和控制數據學習處理。
即是說,例如,對于如圖9所示的NR電路,利用如下表達式所定義的輸入可靠性αx(t)推定在校正處理中使用的、如表達式(6)所示的權重來執行校正參數計算處理和控制數據學習處理。
αx(t)=a1x1+a2x2+...+aNxN...(22)然而,注意到在表達式(22)中,a1,a2,a3,...,aN表示參數控制數據,而x1,x2,x3,...,xN表示預定的和將要進行處理的輸入信號采樣相關的輸入信號采樣(感興趣的采樣)。現在,例如,如果輸入信號是圖像信號,例如可以使用作為一個感興趣的像素(在圖10中用X表示)和一個在時間或空間意義上在此像素位置附近的像素(在圖10中用圓圈表示),用作x1,x2,X3,…,XN。
根據表達式(22),由表達式(6)提供的杈重w(t)可以用表達式(23)表達。[表達式23]w(t)=αy(t-1)αy(t-1)+αx(t)...(23)]]>αy(t-1)αy(t-1)+(a1x1+a2x2+...+aNxN)]]>因此,如果輸入輸入信號x1、x2、x3、…、XN,為了獲得用戶提供的權重w,根據表達式(23)應該能夠得到滿足如下表達式的參數控制數據a1、a2、a3、…、aN。[表達式24]W=αy(t-1)αy(t-1)+(a1x1+a2x2+...+aNxN)...(24)]]>對表達式(24)變形,可以得到表達式(25)。[表達式25](a1x1+a2x2+…+aNxN)w+(w-1)αy(t-1)=0…(25)一般來講,任何時刻都得到滿足表達式(25)的參數控制數據al、a2、a3、…、aN是困難的,所以這里,例如,我們將考慮通過最小二乘方法得到使表達式(25)的左邊和右邊的方差之和最小的參數控制數據a1、a2、a3、....aN。
這里,使表達式(25)的左邊和右邊的方差之和最小意味著使由表達式(23)提供的權重w(t)和由用戶提供的權重W的方差最小,即,利用由用戶提供的作為老師數據的權重w和在表達式(23)中定義權重w(t)的、作為學生數據的輸入信號x1、x2、x3、…、xN和輸出可靠性αy(t-1),等價于使由表達式(23)根據學生數據計算的權重w(t)和由用戶提供的作為老師數據的權重w的方差最小,并且根據參數控制數據a1,a2,a3,…,aN和學生數據計算的權重w(t)和老師數據w之間有一個小的誤差。
表達式(26)提供了表達式(25)的左邊和右邊的方差e2。[表達式26]e2={(a1x1+a2x2+…+aNxN)w+(w-1)αy(t-1)}2…(26)根據在用每個參數控制數據a1,a2,a3,…,aN對表達式(26)中的方差e2的偏導數為O的條件,即通過下式提供使方差e2最小的參數控制數據a1、a2、a3、...、aN。[表達式27]∂e2∂a1=0,∂e2∂a2=0,...,∂e2∂aN=0...(27)]]>將表達式(26)代入表達式(27)得表達式(28)。[表達式28](a1x1W+a2x2W+...+aNxNW+(W-1)αy(t-1))Wx1=0(a1x1W+a2x2W+...+aNxNW+(W-1)αy(t-1))Wx2=0 ...(28)..
..
..
(a1x1W+a2x2W+...+aNxNW+(W-1)αy(t-1))WxN=0因此,分別如表達式(29)所示那樣定義矩陣X,A和Y,則根據表達式(28),表達式(30)所示的關于矩陣X,A和Y的關系成立。[表達式29] [表達式30]XA=Y...(30)注意,表達式(29)中的和(∑)意味著關于輸入信號x1至xN的組數和根據用戶在從用戶輸入的輸入信號x1至xN基礎上提供的權重W的總和。
例如,通過克萊斯基(Cholesky)方法等可以對表達式(30)求解關于矩陣(矢量)A即參數控制數據a1,a2,a3,...,aN。
如圖9所示的NR電路按如上所述的方法執行控制數據學習處理,其中,用由用戶提供的、作為老師數據的權重W并用在表達式(23)中定義權重w(t)的、作為學生數據的參數控制數據a1、a2、a3、...、aN和輸出可靠性αy(t-1),利用最小二乘法學習使由表達式(23)根據學生數據計算的權重w(t)和由用戶提供的作為老師數據的權重W的方差最小的輸入信號x1、x2、x3、...、xN。此外,如圖9所示的NR電路根據由參數控制數據a1至aN定義的表達式(22)獲得輸入可靠性αx(t),并按照表達式(23)根據輸入可靠性αx(t)和輸出可靠性αy(t-1),進一步執行用于獲得作為校正參數的權重的校正參數計算處理。
現在,將參照圖11的流程圖描述如圖9所示的NR電路的校正參數計算處理。
在校正參數計算處理中,首先,在步驟S61中,輸入可靠性計算單元41從參數控制數據存儲器37中讀取參數控制數據,流程執行到步驟S62。在步驟S62中,輸入可靠性計算單元41判斷從參數控制數據存儲器37中讀取的參數控制數據是否是表示自動模式的自動模式數據,其中,所述自動模式表示可不使用參數控制數據獲得輸入可靠性,即,也就是說,其中輸入可靠性是僅僅根據輸入信號自動獲得的一種模式,而不管用戶對操作單元3的操作(該模式以后也稱作自動模式)。
在步驟S62中,如果判斷出所述參數控制數據不是自動模式數據,流程進行到步驟S63,輸入可靠性計算單元41利用提供至此的最新N個輸入信號采樣x1至xN,按照由從參數控制數據存儲器37讀取的參數控制數據定義的表達式(22)中的線性表達式,得到輸入可靠性αx(t),并把它提供給輸出可靠性計算單元23和權重計算單元25,流程進行到步驟S65。
同時,例如,如果在步驟S62中判斷出參數控制數據是自動模式數據,流程進行到步驟S64,并且,輸入可靠性計算單元41僅僅利用輸入信號并基于其中的離差按圖6的步驟S31的相同方法得到輸入可靠性αx(t),并把它提供給輸出可靠性計算單元23和權重計算單元25。
在步驟S65中,權重計算單元25按照表達式(23),利用來自輸入可靠性計算單元41的輸入可靠性αx(t)和由輸出可靠性計算單元23后退一個樣點輸出的、在鎖存電路24鎖存的輸出可靠性αy(t-1)得到權重w(t)。權重計算單元25將該權重w(t)提供給選擇單元21。
繼而,流程進行到步驟S66,并按如同圖6中步驟S37的相同方法,輸出可靠性計算單元23按照表達式(5),把由輸入可靠性計算單元41提供的輸入可靠性αx(t)和在鎖存電路24中鎖存的、后退一個采樣點輸出的輸出可靠性αy(t-1)相加,從而更新輸出可靠性αy(t),并以蓋寫鎖存電路24的方式存儲起來。
接著,流程進行到步驟S67,這里,選擇單元21根據操作信號處理單元30的輸出判斷操作單元3是否正由用戶操作。如果在步驟S67中判斷出沒有操作操作單元3,流程進行到步驟S68,選擇單元21選中由權重計算單元25提供的權重,并把它輸出到校正單元1,接著流程返回到步驟S61。
同時,如果在步驟S67中判斷出正在對操作單元3進行操作,流程進行到步驟S69,其中,選擇單元21選中由輸出信號處理單元30根據此處的操作輸出的權重,并把它輸出到校正單元1,流程返回到步驟S61。
因此,在圖11的校正參數計算處理中,如果沒有對操作單元3操作,就把基于輸入可靠性計算的權重提供給校正單元1,并且如果正在對操作單元3操作,就把與此處的操作信號對應的權重提供給校正單元1。結果,在校正單元1,如果沒有對校正單元3操作,就由基于輸入可靠性的權重校正輸入信號,并且如果正在對操作單元3操作,就按照與此處操作信號對應的權重校正輸入信號。
此外,在圖11的校正參數計算處理中,如果是自動模式,就基于輸入信號的離差并根據輸入可靠性獲得用于校正處理的權重,而不管是否對操作單元3操作,并且如果不是自動模式,就基于對操作單元3的操作并根據輸入可靠性得到用于校正處理的權重,而該輸入可靠性是利用通過隨后所述的如圖12所示的控制數據學習處理學習而獲得的參數控制數據得到的。
接著,將參照圖12的流程圖描述在如圖9所示的NR電路中執行的控制數據學習處理。
對于控制數據學習處理而言,首先,在步驟S71中,按圖7中步驟S41的相同方法,操作信號處理單元30判斷是否從操作單元3收到學習操作信號,如果判斷出沒有收到,流程返回到步驟S71。
同時,如果判斷出在步驟S71中從操作單元3收到學習操作信號,即,如果能判斷出用戶為了得到想要的輸出信號已經對操作單元3進行了操作,諸如這樣一些情形,其中,例如,剛開始對操作單元3操作,接著,在不超過第一時間段t1或更長時間段,就接著連續操作一段時間即第二時間段t2或更長時間段,繼它之后,連續停止操作一段時間即第三段時間t3或更長時間,流程進行到步驟S72,這里,老師數據生成單元31生成老師數據,而學生數據生成單元42生成學生數據。
即,如果一旦接收到學習操作信號,操作信號處理單元30就把對應于所述學習操作信號的權重W和學習標志一起提供給老師數據生成單元31和學生數據生成單元42。一旦接收到帶有學習標志的權重W,該數據生成單元31就獲得作為老師數據的權重W,并把它提供給學習數據存儲器33。
另一方面,學生數據生成單元42有一個用于緩存輸入信號的內置緩沖區(沒有標出),并且在此緩存區不斷存儲輸入信號直至其存儲容限,而如果接收到帶有學習標志的權重,就從內置緩沖區讀取與在該時刻輸入的輸入信號的采樣有預定位置關系的輸入信號采樣x1至xN。此外,學生數據生成單元42從輸出可靠性計算單元23中讀取輸出可靠性αy(t-1)。接著,學生數據生成單元42把輸入信號的采樣x1至xN和輸出可靠性αy(t-1)作為學生數據提供給學習數據存儲器33。
一旦接收到來自老師數據生成單元31的老師數據W和來自學生數據生成單元42的學生數據x1至xN和輸出可靠性αy(t-1),在步驟S73中,學習數據存儲器33就把該組最新老師數據W、學生數據x1至xN和αy(t-1)存儲起來,流程進行到步驟S74。
在步驟S74,參數控制數據計算單元34對老師數據和學生數據執行用于最小二乘的加法運算。
即,參數控制數據計算單元34執行表達式(29)中的矩陣X和Y的元素的學生數據和另一個學生數據之間積的運算、學生數據和老師數據的積的運算以及它們的和的運算。
現在,按圖7中的步驟S44的相同方法執行步驟S74中的加法運算。即是說,把前面的加入結果作為學習信息存儲在學習信息存儲器35中,而參數控制數據計算單元34利用該學習信息,執行關于最新老師數據和學生數據的加入運算。
步驟S74中的加法運算之后,參數控制數據計算單元34把加入結果作為學習信息以蓋寫形式存儲在學習信息存儲器35中,流程進行到步驟S75,參數控制數據計算單元34根據存儲在學習信息存儲器35中作為學習信息的加入結果,判斷表達式(30)是否能求解矩陣A,即是否可以得到參數控制數據a1至aN。
即是說,如果根據預定數目或比預定數目更多的學習對獲得的學習信息不存在,則不能求解表達式(30)的矩陣A,并且也不能得到作為其中元素的參數控制數據a1至aN。因此,在步驟S75中判斷是否能根據所述學習信息得到參數控制數據a1至aN。
在步驟S75中,如果判斷出不能得到參數控制數據a1至aN,參數控制數據計算單元34就把得出此結果的信息提供給判斷控制單元36,流程進行到步驟S79。在步驟S79中,判斷控制單元36把表示自動模式的自動模式數據作為參數控制數據提供給參數控制數據存儲器37。流程接著返回到步驟S71,并繼而重復相同處理。
因此,如果不存在足夠的用于獲得參數控制數據a1至aN的學習信息,正如參照圖11所描述的那樣,就把基于輸入信號的離差,根據輸入可靠性得到的權重用于輸入信號x(t)的校正。
另一方面,如果在步驟S75中判斷出能夠得到參數控制數據,流程進行到步驟S76,在此,參數控制數據計算單元34利用所述學習信息,通過求解表達式(30)的矩陣A得到參數控制數據a1至aN,并把它提供給判斷控制單元36,而流程進行到步驟S77。
在步驟S77,判斷控制單元36根據由來自參數控制數據計算單元34的參數控制數據a1至aN定義的表達式(23),并從存儲在學習數據存儲器33中的學生數據得到對應的老師數據的預測值,并得到由表達式(26)表示的方差,和該預測值的預測誤差(對于存儲在學習數據存儲器33中的老師數據的誤差)之和。此外,例如,判斷控制單元36得到一個歸一化誤差,其中,方差和被存儲在學習數據存儲器33中的學習對數除,流程進行到步驟S78。
在步驟S78中,判斷控制單元36判斷所述歸一化誤差是否大于(等于或多于)一個預定的閾值S1。如果在步驟S78中判斷出歸一化誤差大于所述預定閾值S1,即,如果在由參數控制數據a1至aN定義的表達式(23)中的線性表達式不精確逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則流程進行到步驟S79,判斷控制單元36把表示自動模式的自動模式數據作為參數控制數據提供給參數控制數據存儲器37。流程返回到步驟S71,并繼而重復相同的處理。
因此,即使能夠得到參數控制數據a1至aN,如果在由參數控制數據a1至aN定義的表達式(23)中的線性表達式不精確逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則基于輸入信號的離差通過輸入可靠性獲得的權重,也能按照不存在足夠的用于獲得參數控制數據a1至aN的學習信息情形下的相同方法,校正輸入信號x(t)。
另一方面,如果在步驟S78中判斷出歸一化誤差不大于預定閾值S1,即,如果由參數控制數據a1至aN定義的表達式(23)中的線性表達式精確逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則流程進行到步驟S80,判斷控制單元36獲得由參數控制數據a1至aN定義的表達式(23)中的線性表達式的平面(plane)(線),和由存儲在學習數據存儲器33中的最新老師數據和學生數據推得的點之間的誤差(距離)ε。
接著流程進行到步驟S81,在此,判斷控制單元36判斷誤差ε的大小是否大于(等于或多于)預定的閾值S2,并且,如果判斷出它不大于,則跳過步驟S82,流程進行到步驟S83,并且,判斷控制單元36把在步驟S76中獲得的參數控制數據a1至aN輸出到參數控制單元數據存儲器37。參數控制數據存儲器37把來自判斷控制單元36的參數控制數據a1至aN以蓋寫的形式存儲起來,流程返回到步驟S71,繼而重復相同處理。
另一個方面,如果在步驟S81中判斷出誤差ε的大小大于預定的閾值S2,則流程進行到步驟S82,在這里,判斷控制單元36控制參數控制數據計算單元34以便于僅僅利用存儲在學習數據存儲器33中的最新老師數據和學生數據,重新計算參數控制數據a1至aN。接著流程進行到步驟S83,在這里,判斷控制單元36把在步驟S82中獲得的參數控制數據a1至aN輸出到參數控制數據存儲器37,并在這里把它以蓋寫形式存儲起來,流程返回到步驟S71。
即,同樣在圖12所示的實施例中,按如圖7中的實施例的相同方法,在步驟S82中可以獲得根據到目前為止提供的老師數據和學生數據而獲得的參數控制數據a1至aN,由表達式(23)定義的平面和由最新老師數據和學生數據推得的點之間的誤差ε。
如果該誤差ε的大小不大于預定的閾值S2,則可以認為由表達式(23)根據在步驟S76獲得的參數控制數據a1至aN定義的平面,以相對精確的方式逼近包括由最新老師數據和學生數據推得的點在內的、由到目前為止提供的老師數據和學生數據推得的點,因而就把該參數控制數據a1至aN存儲在參數控制數據存儲器37中。
另一方面,如果該誤差ε的大小大于閾值S2,可以認為由在步驟S76獲得的參數控制數據a1至aN定義的表達式(23)的平面,相對大地偏離了由最新老師數據和學生數據推得的點,于是判斷控制單元36控制參數控制數據計算單元34以便于在步驟S82僅僅利用存儲在學習數據存儲器33中的最新老師數據和學生數據,重新計算參數控制數據a1至aN。
利用如圖9所示的NR電路,根據如上所述得到的參數控制數據a1至aN,在輸入可靠性計算單元41按照表達式(22)計算輸入可靠性αx(t)。
因此,同樣在此情況下,基于按照用戶操作提供的學習操作信號,對表達式(22)中推定的輸入可靠性αx(t)的參數控制數據a1至aN執行學習,于是在用戶不知道的情況下可以學習用戶的操作,此外,利用該學習結果可以幫助用戶執行最佳處理。
同時,如同圖3的NR電路一樣,對于圖9的NR電路,一旦用戶對操作單元3操作,操作信號處理單元30就輸出表示對應于該操作的操作信號的權重,選擇單元21選擇該權重,并把它提供給校正單元1。在這種情況下,在校正單元1利用與用戶所作的操作對應的權重,執行用表達式(8)表示的校正處理。如果由于用戶的操作而使表達式(8)中的權重w(t)變化,則表達式(8)表示的內容也會變化,于是,可以理所當然地說,同樣在如圖9所示的NR電路中,“處理的內容”隨用戶的操作而變化,結果得到用戶想要的輸出信號。
此外,在如圖9所示的NR電路中,如果不能得到參數控制數據a1至aN,或如果雖然能得到參數控制數據a1至aN,但是在由參數控制數據a1至aN定義的表達式(23)中的線性表達式不精確逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則把基于輸入信號的離差從輸入可靠性獲得的權重用于校正單元1的校正處理。另一方面,如果能得到參數控制數據a1至aN,同時,由參數控制數據a1至aN定義的表達式(23)中的線性表達式,精確逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則按照表達式(23),把從輸入信號、參數控制數據a1至aN(更適合的是從中計算的輸入可靠性)和輸出可靠性獲得的權重用于校正單元1的校正處理,其中,表達式23由通過利用基于用戶對操作單元3的操作而獲得的學習對來執行學習而獲得的參數控制數據a1至aN(當然,在此有被用于計算的輸入可靠性)所定義。
即,如同如圖3所示的NR電路一樣,在如圖9所示的NR電路中,用于計算被用作校正處理的權重的系統在這樣兩種情形之間變化,一種情形是,不能獲得足夠數目的學習對或能高精確逼近的學習對,另一種情形是,能獲得高精確逼近的學習對。
因此,同樣在如圖9所示的NR電路中,除了“處理的內容”以外,“處理的配置”也隨用戶的操作而改變,從而輸出用戶想要的輸出信號。
現在,在上述情況中,如表達式(5)所示,利用根據輸入可靠性αx(t-1)獲得的輸出可靠性αy(t-1)得到參數控制數據a1至aN作為學生數據。朝著獲得用戶想要的權重的方向,通過執行如圖12所示的控制數據學習處理,漸漸改善輸入可靠性αx(t),于是同時也改善了輸出可靠性αy(t-1)。
同時,對于如上所述的情況,把輸出可靠性設置成一個已知值,并由參數控制數據a1至aN推定輸入可靠性,由此得到能夠產生用戶想要的權重的參數控制數據a1至aN,但是相反地,可以作這樣的調整,其中把輸入可靠性設置成一個已知值,并由參數控制數據a1至aN推定輸出可靠性,由此得到能夠產生用戶想要權重的參數控制數據a1至aN。
此外,可以作這樣的調整,例如,其中把輸出可靠性設置成一個已知值,并由參數控制數據a1至aN推定輸入可靠性,由此可以得到能夠產生用戶想要權重的參數控制數據a1至aN,進一步也可以把通過參數控制數據a1至aN得到的輸入可靠性設置成一個已知值,并由參數控制數據a1′至aN′推定輸出可靠性,從而能夠得到生成用戶想要權重的參數控制數據a1至aN,即可得到兩組參數控制數據a1至aN和a1′至aN′。
同時,在上述情形中,已經對如表達式(6)所示的、為了獲得參數控制數據a1至aN而被定義的輸入可靠性αx(t)和輸出可靠性αy(t-1)作了描述。但是除此之外,例如,也能作諸如表達式(31)所示的調整,其中,除了輸入可靠性αx(t)和輸出可靠性αy(t-1)外,還利用了一個輸入可靠性αx(t)和輸出可靠性αy(t-1)的校正項Δα,以便于能夠得到參數控制數據a1至aN和校正項Δα[表達式31]w(t)=αy(t-1)+Δααy(t-1)+Δα+αx(t)...(31)]]>此外,用于通過參數控制數據定義輸入可靠性的表達式不限于表達式(22)。
接著,圖13說明了用于汽車的自動駕駛設備的一個實施例的配置示例,如圖1所示的優化設備已被應用到該設備中。
利用自動駕駛設備得到定位坐標(X,Y)和駕駛方向θ,并按預定的路線駕駛該汽車。然而,在利用自動駕駛設備得到定位坐標(X,Y)和駕駛方向θ的過程中會經常含有誤差,在此情況下,汽車可能會偏離預定的路線。因此,利用如圖13所示的自動駕駛設備,在用戶不知道的情況下學習用戶的操作,并基于學習的結果按預定路線駕駛汽車。即,即使汽車偏離預定的路線,一般來講,用戶會操作方向盤或油門踏板使汽車沿預定路線運動。因此,如圖13所示的自動駕駛設備實施控制,以便在用戶不知道的情況下學習用戶的操作而使汽車基于學習的結果漸漸沿著預定路線運動。
陀螺傳感器51檢測汽車的偏航率r,并把它提供給計算單元53。方向盤脈沖發生器52把與汽車方向盤的旋轉角度對應數目的電脈沖提供給計算單元53。
計算單元53根據陀螺傳感器51和方向盤脈沖發生器52的輸出,按照例如如下表達式,計算定位坐標(X,Y)和駕駛方向θ,并把它提供給優化設備54。[表達式32]θ=θ(0)+∫rdt]]>X=X(0)+∫Vrcos(θ+β)dt...(32)]]>Y=Y(0)+∫Vrsin(θ+β)dt]]>注意在表達式(32)中,θ(0)表示在駕駛的起始時刻汽車的方向,而(X(0),Y(0))表示在駕駛的起始時刻汽車的坐標。同時,利用未標明的GPS(全球定位系統)等可以得到θ(0)和(X(0),Y(0))。此外,Vr表示汽車的駕駛速度,而β表示汽車重心的偏離角。
現在,在日本未經審查的專利申請文件No.10-69219中公布了,例如,如何得到如上所述的坐標(X,Y)和駕駛方向θ的方法。
優化設備54學習用戶在操作單元58所作的操作,即,基于用戶對操作單元58操作提供的操作信號執行學習,校正來自計算單元53的坐標(X,Y)和駕駛方向θ,以便基于學習的結果執行用戶想要的駕駛,并把它提供給自動駕駛控制單元55。
自動駕駛控制單元55存儲用于自動駕駛的地圖數據和事先設置的路線(以后稱作設置路線)。自動駕駛控制單元55根據優化設備54提供的坐標(X,Y)和駕駛方向θ,識別當前汽車的位置和駕駛方向,并產生一個用于控制隨后所述的駕駛單元57的控制信號,以使汽車沿著用于駕駛的設置路線行進,并把它輸出給選擇單元56。
把來自自動駕駛控制單元55的控制信號提供給選擇單元56,同時也把來自操作單元58的操作信號提供給選擇單元56。選擇單元56根據來自自動駕駛控制單元55的控制信號和來自操作單元58的操作信號的較高優先權重級選擇操作信號,并把這些操作信號輸出給駕駛單元57,即,通常選擇單元56選擇來自自動駕駛控制單元55的控制信號并把這些操作信號輸出給駕駛單元57,但是一旦接收到來自操作單元58的操作信號,則在接收到操作信號的同時停止輸出來自自動駕駛控制單元55的控制信號,并把來自操作單元58的操作信號輸出給駕駛單元57。
駕駛單元57根據來自選擇單元56的控制信號或操作信號驅動為駕駛所必需的汽車機械裝置,諸如一個未知的發動機、方向盤、制動器、離合器等。例如,操作單元58由駕駛方向盤、油門腳踏板、剎車踏板、離合踏板等組成,并把與用戶操作對應的操作信號提供給優化設備54和選擇單元56。
利用如上所述配置的自動駕駛設備,根據陀螺設備51和方向盤脈沖發生器52的輸出在計算單元53計算汽車的當前坐標(X,Y)和駕駛方向θ,并通過優化設備54把它們提供給自動駕駛控制單元55。自動駕駛控制單元55根據提供給它的坐標(X,Y)和駕駛方向θ,識別汽車當前坐標(X,Y)和駕駛方向,產生一個用于控制隨后所述的駕駛單元57的控制信號,并通過選擇單元56把它們提供給駕駛單元57。這樣,汽車按照自動駕駛控制單元55輸出的控制信號就執行了自動駕駛操作。
另一方面,一旦用戶對操作單元58操作,就通過選擇單元56把與其操作對應的操作信號提供給駕駛單元57,由此就按用戶在操作單元58的操作駕駛汽車行進。
此外,由于用戶對操作單元58操作,操作單元58輸出的操作信號也同樣被提供給優化設備54。優化設備54基于用戶對操作單元58操作提供的操作信號執行學習。一旦用戶停止對操作單元58的操作,優化設備54就基于所述學習結果對坐標(X,Y)和駕駛方向θ進行校正,以便按照用戶想要的駕駛設置路線駕駛,并把它提供給自動駕駛控制單元55。
接下來,圖14說明了在圖13中的優化設備的配置示例。在該圖中,與如圖3所示對應的部件被賦予相同的參考標號,在下面的適當地方將省略對其描述。即,除了沒有提供選擇單元21外,如圖14所示的優化設備54的構造和如圖3所示基本相同,并且分別提供操作信號處理單元60和老師數據生成單元61代替操作信號處理單元30和老師數據生成單元31。
現在,為了簡化下面的描述,對于由計算單元53提供給優化設備54的坐標(X,Y)和駕駛方向θ而言,所作描述僅僅考慮駕駛方向θ。然而,坐標(X,Y)也會受到與現在所述的駕駛方向θ的相同處理。
操作信號處理單元60從操作單元58接收操作信號,并判斷這些信號是否是學習操作信號。如果所述操作信號是學習操作信號,則操作信號處理單元60就接著把得出此結果的消息提供給學生數據生成單元32和老師數據生成單元61。
把來自操作信號處理單元60的含有操作信號是學習操作信號的結果消息(以后稱作學習消息),同時也把來自計算單元53的駕駛方向θ作為輸入信號提供給老師數據生成單元61。此外,也把已經過校正的來自計算單元53的駕駛方向θ(以后稱作已校正駕駛方向)作為從校正單元1(計算設備16)輸出的輸出信號提供給老師數據生成單元61。老師數據生成單元61根據作為在收到學習消息時刻提供的輸入信號的駕駛方向θ,和作為輸出信號的已校正駕駛方向,獲得與所述學習操作信號對應的權重,且把它作為老師數據提供給學習數據存儲器33。
即,在此情況下,有必要獲得用戶對其是方向盤的操作單元58操作后汽車以預定方向前進時的權重W作為老師數據,以便汽車按預定的方向前進。即,在緊跟用戶對用作駕駛方向盤的操作單元58的操作和汽車已朝著預定方向前進之后,有必要利用作為老師數據的用于對指示駕駛方向θ的輸入信號x(t)的校正的權重。根據表達式(8),利用對輸入信號x(t)和正好在對操作單元58的操作之前的輸出信號y(t-1)的加權和,把緊跟在對操作單元58操作之后的輸入信號x(t)校正成緊跟在對操作單元58的操作之后的輸出信號y(t),于是根據表達式(8),就能從緊跟在對操作單元58操作之后的輸入信號x(t)、緊跟在對操作單元58的操作之后的輸出信號y(t)和正好在對操作單元58的操作之前的輸出信號y(t-1)中,得到用于校正緊跟在對操作單元58操作之后的輸入信號x(t)的權重W。因此,老師數據生成單元61根據作為緊跟在接收學習消息之后提供的輸入信號x(t)的駕駛方向θ,和作為分別在接收學習消息之前和之后的輸出信號y(t-1)和輸出信號y(t)的已校正駕駛方向,得到權重W,并把它提供給學習數據存儲器33。
同時,一旦接收到學習消息,學生數據生成單元32就把根據作為正好在此點之前提供的輸入信號的駕駛方向獲得的權重w作為學生數據提供給學習數據存儲器33。
即,如圖3所述一樣,學生數據生成單元32以與輸入可靠性計算單元22、輸出可靠性計算單元23、鎖存電路24和權重計算單元25相同的方式配置,并對作為提供給它的輸入信號的駕駛方向的權重w(與在權重計算單元25獲得的是同樣的權重w)進行計算,且把正好在接收到學習消息之前已計算的權重作為學生數據提供給學習數據存儲器33。
因此,在參數控制數據計算單元34,把在用戶對操作單元58操作并且駕駛方向成為用戶所希望方向的時刻的權重當作老師數據,而把用戶對操作單元58操作之前,權重計算單元25輸出的權重當作學生數據,并執行如表達式(20)和表達式(21)所示的參數控制數據a和b(的計算)。
接著,在權重校正單元26,利用參數控制數據a和b,根據表達式(13)對在權重計算單元25獲得的權重w進行校正,并把它提供給校正單元1。
結果,參數控制數據a和b用來校正在權重計算單元25獲得的權重w,以便把用戶對操作單元58操作之前的駕駛方向校正成用戶對操作單元58操作之后的駕駛方向,于是汽車就沿著預定路線執行自動駕駛操作。
即,可以認為實際情況是,用戶操作操作單元58意味著計算單元53輸出的駕駛方向θ包含有由于陀螺傳感器51的誤差或其輸出的噪聲、計算單元53的計算誤差等導致的誤差,因而不能表示汽車的真實駕駛方向,并由此汽車實際駕駛方向就偏離了設置路線。此外,并且可以認為在此情況下,終端用戶對操作單元58的操作是為了把汽車的實際駕駛方向改變成沿著設置路線的方向。因此,執行學習,其中,把用戶對操作單元58操作和汽車實際駕駛方向沿著設置路線方向時刻的權重W當作老師數據,并把用戶對操作單元58操作之后在權重計算單元25獲得的權重W,即權重計算單元25在偏離設置路線狀態時輸出的權重,作為學生數據,表達式(13)中的參數控制數據a和b用于校正在表達式(6)中的權重,以便于把偏離設置路線狀態的駕駛方向校正成沿著設置路線的方向。
接下來,將根據圖14所示的優化設備54進行描述。現在,正如如圖3所示的NR電路一樣,如圖14所示的優化設備54,通過用于校正作為輸入信號x(t)由計算單元53輸出的駕駛方向θ的校正處理,用于獲得用于校正處理的校正參數的權重的校正參數計算處理,和用戶對操作單元58的操作(圖13),來執行用于獲得用于控制(校正)作為校正參數的權重的控制數據學習處理,但是,由于該校正處理和圖3所示的NR電路執行的、參照圖5已進行過描述的校正處理一樣,所以在此描述如圖14所示的優化設備54執行的校正參數計算處理和學生數據學習處理。
首先,將參照如圖15所示的流程圖描述如圖14所示的優化設備54執行的校正參數計算處理。
在校正參數計算處理中,首先,在步驟S91,和圖6步驟S31中的方法一樣,輸入可靠性計算單元22基于來自計算單元53作為輸入信號的駕駛方向θ的離差,得到輸入可靠性αx(t),并把它提供給輸出可靠性計算單元22和權重計算單元25。
隨之,流程進行到步驟S92,在該步驟,權重計算單元25利用輸入可靠性計算單元22得到的輸入可靠性αx(t),獲得被提供給權重校正單元26的權重w(t),流程進行到步驟S93。
在步驟S93中,權重校正單元26從參數控制數據存儲器37讀取參數控制數據,接著流程進行到步驟S94。在步驟S94,權重校正單元26判斷從參數控制數據存儲器37讀取的參數控制數據是否是表示其中的權重w(t)沒有被校正的自動模式數據,即,這樣一種模式,其中,根據在權重計算單元25從輸入可靠性和輸出可靠性自動獲得的權重w(t)不變地作為校正輸入信號x(t)的的權重W,而不管用戶對操作單元58(圖13)的操作(自動模式)。
如果在步驟S93判斷出參數控制數據不是自動模式數據,流程進行到步驟S95,在此,權重校正單元26按照由參數控制數據存儲器37提供的參數控制數據a和b定義的表達式(13)中的線性表達式,對權重校正單元25提供的權重w(t)進行校正,接著,程序進行到步驟S96。在步驟S96,權重校正單元26把校正后的權重作為校正參數提供給校正單元1,流程進行到步驟S97。
另一方面,如果在步驟S94判斷出參數控制數據是自動模式數據,流程跳過步驟S95,進行到步驟S96,這里,權重校正單元26把來自權重計算單元25的權重w(t)不加改變地提供給校正單元1作為校正參數,流程進行到步驟S97。
在步驟S97中,輸出可靠性計算單元23對輸出可靠性進行更新。即,輸出可靠性計算單元23按照表達式(5),把輸入可靠性αx(t)和在鎖存電路24中已經鎖存的來自后退一個采樣的輸出可靠性αy(t-1)相加,由此得到當前輸出可靠性αy(t),該可靠性αy(t)以蓋寫形式存儲在鎖存電路24中。
繼該處理和步驟S97之后,流程返回到步驟S91,并接著重復相同的處理。
如上所述,對于如圖15所示的校正參數計算處理,如果是按照自動模式,則根據輸入可靠性和輸出可靠性獲得用于校正處理的權重,而不管對操作單元58的操作,并且,如果不是按照自動模式,則基于對操作單元58的操作,利用通過在隨后就會描述到的圖16的控制數據學習處理中的學習而獲得的參數控制數據,得到用于校正處理的權重。
接下來,將參照如圖16所示的流程圖,描述關于如圖14所示的優化設備54執行的控制數據學習處理。
在所述控制數據學習處理中,首先,在步驟S101,操作信號處理單元60判斷從操作單元58(圖13)是否已接收到學習操作信號,如果判斷出沒有收到,流程返回步驟S101。
同時,如果判斷出在步驟S101中從操作單元58已接收到學習操作信號,即是說,例如,如果剛開始對作為操作單元58的方向盤等進行操作,接著,在不超過第一時間段t1或更長時間段之內,接著連續操作一段時間即第二時間段t2或更長時間段,繼它之后,連續停止操作一段時間即第三段時間t3或更長時間,或者,這樣一些情形,其中,在開始對作為操作單元58的方向盤等操作之后,連續停止操作一段時間即第三段時間t3或更長時間,結果可以判斷出用戶已經對作為操作單元58的方向盤等進行了操作以便于將汽車指向想要的方向,則流程進行到步驟S102,這里,老師數據生成單元61生成老師數據,而學生數據生成單元32生成學生數據。
即是說,一旦判斷出已經接收到學習操作信號,操作信號處理單元60就把學習消息提供給老師數據生成單元61和學生數據生成單元32。一旦從操作信號處理單元60接收到學習消息,在步驟S102,老師數據生成單元61就根據作為從計算單元53提供的輸入信號的駕駛方向θ,和來自計算單元53的作為由校正單元1(計算設備16)輸出的輸出信號的已校正駕駛方向θ(已校正方向),獲得與學習操作信號對應的權重W。
具體地講,老師數據生成單元61從計算單元53(圖13)接收到表示緊跟在用戶對作為方向盤的操作單元58操作和汽車朝著想要方向之后的駕駛方向θ的輸入信號x(t)。同時,老師數據生成單元61保持由校正單元1輸出的當前輸出信號y(t)和后退一個時間的輸出信號y(t-1),即,在對操作單元58操作之前的輸出信號y(t-1),并利用輸入信號x(t)、輸出信號y(t)和y(t-1)根據表達式(8)獲得在學習操作信號被提供的時刻,在校正單元1使用的(與學習操作信號對應的權重)權重W。
注意在此情形下,為簡化描述,認為用戶對作為操作單元58的方向盤所作的操作是在從t-1到t的一個時序之內即刻完成的。
老師數據生成單元61獲得與如上所述的學習操作信號對應的權重W,并把權重W作為老師數據提供給學習數據存儲器33。
此外,在步驟S102,已經從操作信號處理單元60接收到學習消息的學生數據生成單元32,把與利用輸入可靠性和輸出可靠性計算的、根據從計算單元53(圖13)提供的作為輸入信號的駕駛方向獲得的、與權重計算單元25輸出的權重一樣的權重w作為學生數據提供給學習數據存儲器33。
因此,把學習對提供給學習數據存儲器33,其中,把在汽車實際*駕駛方向已變成用戶想要方向的時刻,在校正單元1所使用的權重W當作老師數據,而把在用戶對操作單元58操作之前根據輸入可靠性和輸出可靠性獲得的權重w當作學生數據。
一旦接收到來自老師數據生成單元61的老師數據W和來自學生數據生成單元32的學生數據w,在步驟S103,學習數據存儲器33就把最新老師數據W和學生數據w存儲起來,接著,流程進行到步驟S104。
在步驟S104,參數控制數據計算單元34按照如圖7的步驟S44的相同方法,對存儲在學習數據存儲器33中的最新老師數據和學生數據以及存儲在學習信息存儲器35中的學習信息執行用于最小二乘的加入運算。此外,在步驟S104,參數控制數據計算單元34把作為學習信息的加入結果按蓋寫學習信息存儲器35的形式存儲起來,接著流程進行到步驟S105。
在步驟S105,參數控制數據計算單元34如同在圖7的步驟S95中的情形一樣,判斷是否可以根據作為存儲在學習信息存儲器35中學習信息的加入結果,用表達式(20)和表達式(21)得到參數控制數據a和b。
如果在步驟S105中判斷出不能得到參數控制數據a和b,參數控制數據計算單元34就把含有該結果的信息提供給判斷控制單元36,而且流程進行到步驟S109。在步驟S109,判斷控制單元36把表示自動模式的自動模式數據作為參數控制數據提供給參數控制數據存儲器37,在此把它存儲起來。接著,流程返回到步驟S101,繼而,重復相同的處理。
因此,如果不存在足夠的用于獲得參數控制數據a和b的學習信息,則在權重計算單元25(圖14)從輸入可靠性和輸出可靠性自動獲得的權重w(t)可以固定不變地用來校正輸入信號x(t)。
另一個方面,如果在步驟S105中判斷出可以獲得參數控制數據a和b,流程進行到步驟S106,在此參數控制數據計算單元34利用判斷控制單元36提供的學習信息計算表達式(20)和(21),由此獲得參數控制數據a和b,流程進行到步驟S107。
在步驟S107中,判斷控制單元36按照由來自參數控制數據計算單元34的參數控制數據a和b定義的表達式(13)中的線性表達式,從存儲在學習數據存儲器33中的學生數據獲得對應于老師數據的預測值,并獲得在表達式(15)中表示的、用于預測值的預測誤差的方差的和(對于存儲在學習數據存儲器33中的老師數據的誤差)。此外,判斷控制單元36獲得一個歸一化誤差,例如,其中,方差的和用存儲在學習數據存儲器33中的學習對數目來除,流程進行到步驟S108。
在步驟S108中,判斷控制單元36判斷所述歸一化誤差是否大于(大于或等于)一個預定的閾值S1。在步驟S108中,如果判斷出如果歸一化誤差大于預定的閾值S1,即,如果由參數控制數據a和b定義的表達式(13)中的線性表達式不以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,流程進行到步驟S109,如上所述,在此,判斷控制單元36把表示自動模式的自動模式數據作為參數控制數據提供給參數控制數據存儲器37并存儲起來。流程進行到步驟S101,并重復相同的步驟。
因此,即使能夠獲得參數控制數據a和b,如果由參數控制數據a和b定義的表達式(13)中的線性表達式不以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則也能使用從輸入可靠性和輸出可靠性自動獲得的權重w(t)來校正輸入信號x(t),這種方式同樣適用于獲得參數控制數據a和b的學習信息不充分的情形。
另一方面,在步驟S108中,如果判斷出所述歸一化誤差不大于預定的閾值S1,即,如果由參數控制數據a和b定義的表達式(13)中的線性表達式以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則流程進行到步驟S110,在此,判斷控制單元36獲得由參數控制數據a和b定義的表達式(13)中的線性表達式表示的回歸線和由存儲在學習數據存儲器33中的最新老師數據和學生數據推得的點之間的誤差(距離)ε。
接著流程進行到步驟S111,在此,判斷控制單元36判斷所述誤差ε的大小是否大于(等于或多于)預定的閾值S2,并且,如果判斷出它不大于,則跳過步驟S112,流程進行到步驟S113,并且,判斷控制單元36把在步驟S106中獲得的參數控制數據a和b輸出到參數控制單元數據存儲器37。參數控制數據存儲器37把來自判斷控制單元36的參數控制數據a和b以蓋寫的形式存儲起來,流程返回到步驟S101。
另一個方面,如果在步驟S111中判斷出誤差ε的大小大于預定的閾值S2,則流程進行到步驟S112,在這里,判斷控制單元36通過控制參數控制數據計算單元34,僅僅利用存儲在學習數據存儲器33中的最新老師數據和學生數據中的預定數目的最新學習對,重新計算參數控制數據a和b(不使用學習信息存儲器35中的學習信息)。流程進行到步驟S113,在這里,判斷控制單元36把在步驟S112中獲得的參數控制數據a和b輸出到參數控制數據存儲器37,并在這里把它以蓋寫形式存儲起來,流程返回到步驟S101。
因此,如果可以獲得參數控制數據a和b,并且同時如果由參數控制數據a和b定義的表達式(13)的線性表達式以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則按照通過利用基于用戶對操作單元3的操作而獲得的學習對執行學習而獲得的參數控制數據a和b定義的表達式(13),校正從輸入可靠性和輸出可靠性獲得的權重w(t),并把因對其校正而獲得的校正權重W用于校正輸入信號x(t)。
如上所述,同樣在如圖13所示的自動駕駛設備中,判斷響應用戶操作而提供的操作信號是否能用于學習,并且如果這些信號是可以用于學習的學習操作信號,則基于所述學習操作信號,學習用于校正用作校正輸入信號的權重的參數控制數據a和b,于是,在用戶不知道的情況下可以學習用戶的操作,并且,繼而,基于所述學習結果執行漸漸適合于用戶的處理,而最后終于幫助用戶執行最佳處理。
即,由于用戶對操作單元58執行操作以便于把駕駛方向校正到沿著設置路線,汽車將漸漸執行沿著設置路線的自動駕駛。
同時,對于如圖14所示的優化設備54也同樣按如圖3所示的NR電路的相同方法,用于校正單元1執行的校正處理的權重W,隨著用戶對操作單元58的操作而改變,于是汽車的實際駕駛方向沿著設置路線。即是說,一旦用戶對操作單元58操作以致汽車朝著想要的方向,則由計算單元53輸出的作為輸入信號的駕駛方向θ也變化,所以根據駕駛方向θ獲得的輸入可靠性以及根據該輸入可靠性得到的輸出可靠性也跟著變化,輸入可靠性和輸出可靠性中的變化引起在權重計算單元25獲得的權重也跟著發生變化,并且該已經變化的權重通過權重校正單元26被提供給校正單元1。校正單元1接著利用該被提供的權重執行由表達式(8)表示的校正處理。因此,如果用戶對操作單元58操作,表達式(8)的權重將隨用戶的操作而變化,并接著以如圖3的NR電路所述情形的一樣的方法,表達式(8)表示的處理內容(校正處理)理所當然地也會變化,于是,可以說,同樣在如圖14所示的優化設備54中,“處理的內容”隨用戶的操作而變化,結果可以得到用戶想要的駕駛方向。
此外,同在如圖3所示的NR電路一樣,如圖14所示的優化設備54,在用戶沒有輸入足夠的學習對,或如果沒有輸入可能高精確逼近的學習對的情況下,則在校正單元1使用從輸入可靠性和輸出可靠性自動獲得的權重進行校正處理,并且,如果輸入了可能高精確逼近的學習對,則通過利用該學習對執行學習而獲得的參數控制數據a和b獲得的校正權重,用于校正單元1的校正處理。即是說,用于計算用作校正處理的權重的系統將隨著這樣一些情形而變化,其中一些情形是,不能獲得足夠數目的學習對或高精確逼近的學習對,另一些情形是,能獲得高精確逼近的學習對。
因此,和如圖3所示的NR電路一樣,同樣在如圖14所示的優化設備54中,除了“處理的內容”外,“處理的配置”同時也隨用戶的操作而改變,從而汽車按照沿著設置路線的駕駛方向執行自動駕駛。
同時,例如,在日本未經審查的專利申請文件No.7-13625中,公布了用于工作車輛諸如插秧機的駕駛控制設備,并利用該駕駛控制設備計算在自動操縱狀態中的控制參數校正量,于是可以減小在用戶操作狀態和基于陀螺傳感器等的檢測結果的信息之間的誤差。因此,在如圖13所示的自動駕駛設備和在日本未經審查的專利申請文件No.7-13625中描述的駕駛控制設備擁有的共同點是,都基于用戶的操作而改變用于自動駕駛(自動操縱)的參數校正量。
然而,如圖13所示的自動駕駛設備和在日本未經審查的專利申請文件No.7-13625中描述的、在自動操縱狀態中計算控制參數校正量的駕駛控制設備有很大差異,僅在于,就判斷由用戶的操作所提供的操作信號是否能夠被用于學習這一點,開關被手動切換到手動操縱控制模式,和如果該操作信號是能夠被用于學習的學習操作信號,基于所述學習操作信號,學習用于對校正輸入信號的權重校正的參數控制數據。
由于這些差異,對于在日本未經審查的專利申請文件No.7-13625中描述的駕駛控制設備而言,每次用戶都會覺得沒有執行適合的自動操縱,用戶必須把開關切換到手動操縱控制模式,并計算控制參數的校正量之后,再一次把開關切換到自動操縱控制模式,而這該用戶帶來麻煩。
相反,如圖13所示的自動駕駛設備,判斷依照用戶所作的操作提供的操作信號是否可以被用于學習,此外,如果這些就是可以用于學習的學習操作信號,基于所述學習操作信號,學習用于對校正輸入信號的權重進行校正的參數控制數據,于是甚至在用戶沒有執行如上所述的這樣的開關切換操作的情況下,也能執行適合的自動駕駛。即是說,在用戶不知情的情況下,也能執行對用戶操作的學習,于是學習正如用戶校正駕駛方向那樣進行,并且,汽車漸漸會沿著設置路線駕駛,甚至在用戶沒有操作的情況下也這樣。
此外,如圖13所示的自動駕駛設備,處理的配置隨著用戶的操作而改變,從而同樣就該點而言有別于在日本未經審查的專利申請文件No.7-13625中描述的駕駛控制設備。
接下來,圖17說明了圖13所示的優化設備54的另一個配置示例。注意圖中與如圖14所示的情形對應的部分被賦予相同的參考標號,下面在適當的時候就省略其描述。
如圖3和圖9的NR電路以及如圖14所示的優化設備54,利用基于用戶所作的操作而獲得的學習對,學習用于控制校正參數的參數控制數據,但是,如圖17所示的優化設備54,利用基于用戶所作的操作而獲得的學習對,學習校正參數自身。
即,對于如圖17所示的實施例,校正單元1由校正量計算單元71和計算設備72組成,而學習單元2由學習數據存儲器33、學習信息存儲器35、判斷控制單元36、操作信號處理單元60、老師數據生成單元73、學生數據生成單元74、校正參數計算單元75和校正參數存儲器76組成。
在學習單元2,把隨后所述的、來自校正參數存儲器76的校正參數提供給校正量計算單元71,同時校正量計算單元71利用該校正參數計算用于校正作為輸入信號的駕駛方向θ的校正量,并把它提供給計算設備72。
把來自校正量計算單元71的校正量同時也把來自計算單元53(圖13)、作為輸入信號的駕駛方向θ提供給計算設備72,同時,計算單元72通過將提供給它的校正量加入而校正作為輸入信號的駕駛方向θ,并把校正后的駕駛方向(已校正駕駛方向)作為輸出信號輸出給自動駕駛控制單元55(圖13)。
老師數據生成單元73把收到來自操作信號處理單元60的學習消息之后緊跟提供的作為輸入信號的駕駛方向,作為老師數據提供給學習數據存儲器33。學生數據生成單元74把收到來自操作信號處理單元60的學習消息之前提供的作為輸入信號的駕駛方向,作為學生數據提供給學習數據存儲器33。
校正參數計算單元75利用作為學習數據存儲在學習數據存儲器33中的老師數據和學生數據,通過計算新的學習信息,學習使預定的統計誤差最小的校正參數,并在判斷控制單元36的控制下,必要時,使用存儲在學習信息存儲器35中的學習信息,并把它提供給判斷控制單元36。校正參數計算單元75用通過學習而獲得的新的學習信息,更新學習信息存儲器35所存儲的內容。校正參數存儲器76存儲由判斷控制單元36輸出的校正參數。
如上所述的優化設備54,將按如下所述的方法校正由計算單元53提供的駕駛方向θ。
即,用r′表示在時刻t由陀螺傳感器51(圖13)輸出的偏航率,根據在表達式(32)中用r′代替r,在計算單元53計算駕駛方向。
現在,用er表示包含在由陀螺傳感器51輸出的偏航率r′中的誤差,并用r表示真正的偏航率,則由陀螺傳感器51輸出的偏航率r′可用下式表示。[表達式32]r′=r+er...(33)在計算單元53,根據表達式(32)和表達式(33),由陀螺傳感器51輸出的偏航率r′計算的駕駛方向θ′表示如下。[表達式34]θ′=θ(0)+∫r′dt]]>=θ(0)+∫(r+er)dt...(34)]]>=θ(0)+∫rdt+∫erdt]]>因此,通過計算單元53獲得的駕駛方向θ′和從真正的偏航率r獲得的的真正駕駛方向θ之間的關系如下式所示。[表達式35]θ′=θ+∫erdt...(35)]]>如果在由陀螺傳感器51輸出的偏航率r′中包含的誤差er是白色的(white),則表達式(35)右邊的第二項從長期(long term)來看是0,如下式所示,所以不存在特別的問題。表達式(35)右邊的第二項從短期(short term)來看不是0,但是這種情況可用如圖14所示的優化設備54來處理。[表達式36]∫erdt=0...(36)]]>然而,如果誤差er是有色的(colored),則誤差er就會隨著時間的t的推移而累積,于是通過計算單元53獲得的駕駛方向θ′就會大大偏離真正的駕駛方向θ。
即,為了簡化描述,考慮以恒定方向按直線駕駛前進,則在自動駕駛控制單元55(圖13)生成使通過計算單元53獲得的駕駛方向θ′保持恒定的控制信號,如圖18的點劃線所示。
然而,如果在通過計算單元53獲得的駕駛方向θ′中包含的誤差er是有色的,則誤差er就會隨著時間的t的推移而累積,以致在通過計算單元53獲得的駕駛方向θ′跟蹤如圖18所示實線所示的彎曲路線時,汽車仍繼續向前行駛。
因此,用圖17中的優化設備54,基于來自用戶的學習操作信號,執行用于學習校正駕駛方向θ′的校正參數a0、a1、...、aN的校正參數學習處理,以致通過計算單元53獲得的、作為輸入信號被提供的駕駛方向θ′,跟蹤如圖18所示實線所示的彎曲路線,并且利用校正參數a0至aN,執行用于校正通過計算單元53獲得的駕駛方向θ′的校正處理。
因此,將參照圖19和圖20描述如圖17所示的優化設備54執行的校正處理和校正參數學習處理。圖15中的實施例涉及汽車以固定方向直線駕駛前進,而如圖17所示的優化設備54可被應用到沿任意路線自動駕駛的情形。
首先,將參照如圖19所示的流程圖描述如圖17所示的優化設備54執行的校正處理。
在校正處理中,在步驟S121中,校正量計算單元71利用存儲在校正參數存儲器76中的校正參數a0至aN,計算校正量。
即,例如,在此用如在表達式(37)中所示的那樣,利用校正參數a0至aN和從計算單元53獲得的作為輸入信號的駕駛方向θ′,用實際駕駛方向θ計算校正量。[表達式37]θ=θ′+α0+α1t1+α2t2+...+αNtN...(37)由此,在校正量計算單元71根據表達式(37)計算作為校正量的a0+a1t1+a2t2+...+aNtN。并把該校正量提供給計算單元72。
在步驟S122,在計算單元72把從計算單元53獲得的駕駛方向θ′和校正量相加,并把其相加之和作為輸出信號輸出,流程等待下一個要被提供的輸入信號的采樣,并返回到步驟S122,繼而重復相同處理。
接下來,將參照圖20中的流程圖描述在圖17中的優化設備54執行的校正參數學習處理。
在校正參數學習處理中,首先,在步驟S131,操作信號處理單元60判斷從操作單元58(圖13)是否已收到學習操作信號,如果判斷出在其中沒有收到,流程返回步驟S131。
同時,如果判斷出在步驟S131中從操作單元58已收到學習操作信號,即是說,例如,如果剛開始對操作單元58操作,接著,在不超過第一時間段t1或更長時間段之內,連續操作一段時間即第二時間段t2或更長時間段,繼它之后,連續停止操作一段時間即第三段時間t3或更長時間,或者是這樣一些情形,其中,在開始對作為操作單元58的方向盤操作之后,連續停止操作一段時間即第三段時間t3或更長時間,結果可以判斷出用戶已經操作單元58進行了操作以便于將汽車指向想要的方向,流程進行到步驟S132,這里,老師數據生成單元73生成老師數據,而學生數據生成單元74生成學生數據。
即是說,如果一旦收到所述學習操作信號,操作信號處理單元60就把含有此結果的學習消息提供給老師數據生成單元73和學生數據生成單元74。一旦接收到該學習消息,老師數據生成單元73就得到緊跟其后被提供的作為輸入信號作為老師數據的駕駛方向,并把它提供給學習數據存儲器33。
即是說,在該情形中,對于老師數據,有必要使用在用戶對作為駕駛方向盤的操作單元58操作之后的駕駛方向,以使汽車朝向想要的方向。
由此,老師數據生成單元73就把作為在接收到學習消息之后提供的輸入信號的駕駛方向θ,作為老師數據提供給學習數據存儲器33。
同時,學生數據生成單元32一旦收到所述學習消息,就把在此之前提供的作為輸入信號的駕駛方向,即在汽車朝著想要的方向之前的駕駛方向,作為學生數據提供給學習數據存儲器33。
在此之后,流程進行到步驟S133,在此學習數據存儲器33把一組來自老師數據生成單元31的老師數據和學生數據存儲起來,接著流程進行到步驟S134。
在步驟S134中,校正參數計算單元75執行如同表達式(22)至表達式(30)所述的相同的關于老師數據和學生數據的最小二乘加法運算。
注意到,按如上所述的相同方法,利用存儲在學習信息存儲器35中作為學習信息的前面步驟的加入結果,執行步驟S134中的加入運算。同時在此執行用于獲得和表達式(37)中的θ′一樣的、使老師數據的預測值的方差之和、即在表達式(37)中利用學生數據和對應的老師數據計算的θ最小的校正參數a0至aN的加法運算。
步驟S134的加法運算之后,校正參數計算單元75以蓋寫學習信息存儲器的的方式,存儲所述加入結果作為學習信息,流程進行到步驟S135。
在步驟S135中,判斷校正參數計算單元75是否可以依據存儲在學習信息存儲器35中的作為學習信息的加入結果,得到校正參數a0至aN。
如果在步驟S135中判斷出不可能獲得校正參數a0至aN,校正參數計算單元75就把得出此結果的通知提供給判斷控制單元36,流程進行到步驟S139。在步驟S139中,判斷控制單元36把表示禁止校正的禁止數據提供給校正參數存儲器76并在此存儲作為校正參數。接著,流程返回到步驟S131,并接下來,重復相同的處理。
因此,如果不存在足夠的用于獲得校正參數a0至aN的學習信息,則在校正單元1不執行輸入信號的校正。即,輸入信號的校正量是0。
另一個方面,如果在步驟S135中判斷出可能獲得校正參數,流程進行到步驟S136,在此校正參數計算單元75使用所述學習信息獲得校正參數a0至aN,并把它們提供給判斷控制單元36,接著流程進行到步驟S137。
在步驟S137中,判斷控制單元36按照由來自校正參數計算單元75的校正參數a0至aN定義的表達式(37),從存儲在學習數據存儲器33中的每條學生數據中,獲得對應于老師數據的預測值,并獲得所述預測值的預測誤差的平方和(對于存儲在學習數據存儲器33中的老師數據的誤差)。此外,判斷控制單元36獲得一個歸一化誤差,例如,其中,預測誤差的平方和用存儲在學習數據存儲器33中的學習對數目來除,接著,流程進行到步驟S138。
在步驟S138中,判斷控制單元36判斷所述歸一化誤差是否大于(大于或等于)一個預定的閾值S1。在步驟S138中,如果判斷出所述歸一化誤差大于預定的閾值S1,即,如果由校正參數a0至aN定義的表達式(37)中的線性表達式不以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,流程進行到步驟S139,在此,判斷控制單元36如上所述把禁止數據提供給校正參數存儲器76并存儲作為校正數據。接著流程返回到步驟S131,并繼而重復相同的步驟。
因此,即使能夠獲得校正參數a0至aN,如果由校正參數a0至aN定義的表達式(37)不以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則輸入信號x(t)的校正量是0,這種方式同樣適用于用于獲得校正參數a0至aN的學習信息不充分的情形。
另一方面,在步驟S138中,如果判斷出所述歸一化誤差不大于預定的閾值S1,即,如果由校正參數a0至aN定義的表達式(37)以一種精確方式逼近存儲在學習數據存儲器33中的學生數據和老師數據的關系,則流程進行到步驟S140,在此,判斷控制單元36獲得由來自校正參數計算單元75的校正參數a0至aN定義的表達式(37)的平面,和由存儲在學習數據存儲器33中的最新老師數據和學生數據推得的點之間的誤差ε。
接著流程進行到步驟S141,在此,判斷控制單元36判斷所述誤差ε的大小是否大于(等于或多于)預定的閾值S2,并且,如果判斷出它不大于,則跳過步驟S142,流程進行到步驟S143,在此,判斷控制單元36把在步驟S136中獲得的校正參數a0至aN輸出到校正參數存儲器76。在此情形下,校正參數存儲器76把來自判斷控制單元36的校正參數a0至aN以蓋寫的形式存儲起來,流程返回到步驟S131。
另一個方面,如果在步驟S141中判斷出所述誤差ε的大小大于預定的閾值S2,則流程進行到步驟S142,在這里,判斷控制單元36控制校正參數計算單元75,僅僅利用存儲在學習數據存儲器33中的最新老師數據和學生數據,重新計算校正參數a0至aN。流程進行到步驟S143,在這里,判斷控制單元36把在步驟S142中獲得的校正參數a0至aN輸出到參數控制數據存儲器37,并在這里把它以蓋寫形式存儲起來,流程返回到步驟S131。
即,同樣在圖20所示的實施例中,按如圖7中的實施例的相同方法,可以獲得根據到目前為止提供的老師數據和學生數據獲得的校正參數a0至aN,由表達式(37)定義的平面和由最新老師數據和學生數據推得的點之間的誤差ε。
如果該誤差ε的大小不大于所述閾值S2,則可以認為由表達式(37)根據在步驟S136獲得的校正參數a0至aN定義的平面以相對精確的方式逼近包括最新老師數據和學生數據推得的點在內的、由到目前為止提供的老師數據和學生數據推得的所有點,因而就把該校正參數a0至aN存儲在校正參數存儲器76中。
另一方面,如果該誤差ε的大小大于閾值S2,可以認為由最新老師數據和學生數據推得的點相對大地偏離了由在步驟S136獲得的校正參數a0至aN定義的表達式(23)的平面,于是在步驟S142中,判斷控制單元36僅僅利用存儲在學習數據存儲器33中的最新老師數據和學生數據重新計算校正參數a0至aN。
因此,同樣在此情況下,基于按照用戶操作提供的學習操作信號執行用于表達式(37)中的校正參數a0至aN的學習,于是在用戶不知道的情況下可以學習用戶的操作,此外,利用學習結果可以幫助用戶執行最佳處理。
此外,在此情況下,如果由計算單元53(圖13)輸出的包含在前進方向的誤差是有色的,則可以使汽車沿著預定的設置路線執行自動駕駛。
同時,圖17中的優化設備54中,在校正單元1執行的校正處理(圖5)中使用的校正參數隨用戶對操作單元58操作而改變,以使汽車的實際駕駛方向沿著設置路線。即,一旦用戶對操作單元58操作以致汽車的駕駛方向朝著想要的方向,則用對操作單元58操作之前和之后由計算單元43輸出的作為輸入信號的每個駕駛方向θ,分別作為學生數據和老師數據執行校正參數的學習,由此更改校正參數。把已更改的校正參數提供給校正單元1,利用該校正參數在校正單元1計算校正量,并根據該校正量執行輸入信號的校正處理(圖19)。因此如果用戶對操作單元58操作,則表達式(37)中的校正參數就會隨著用戶的操作而變化,結果由表達式(37)表示的處理內容(校正處理)理所當然地也會變化,于是,可以說,同樣在如圖17所示的優化設備54中,“處理的內容”隨用戶的操作而變化,結果得到用戶想要的駕駛方向。
此外,如圖17的優化設備54中,如果用戶沒有輸入足夠的學習對,或如果沒有輸入可能高精確逼近的學習對,則在校正單元1的輸入信號的校正量是0,并且,如果用戶輸入了可能高精確逼近的學習對,則利用該學習對根據通過執行學習而獲得的校正參數而獲得的校正量執行輸入信號的校正。即,用于計算用作校正處理的權重的系統將隨著這樣一些情形而變化,其中一些情形是,不能獲得足夠數目的學習對或高精確逼近的學習對,另一些情形是,能獲得高精確逼近的學習對。
因此,同樣在如圖17所示的優化設備54中,除了“處理的內容”外,“處理的配置”同時也隨用戶的操作而改變,從而汽車按照沿著設置路線的駕駛方向執行自動駕駛。
現在,在圖20的實施例中(和如圖7和12的實施例一樣),在步驟S140,獲得由來自校正參數計算單元75的校正參數a0至aN定義的表達式(37)的平面和由最新老師數據和學生數據推得的點之間的誤差ε,并執行后續的處理,但是可以這樣調整,其中,在步驟S140,獲得由在多組最近的學生數據和老師數據被提供之前在步驟S136中獲得的校正參數a0至aN定義的表達式(37)的平面,和由多組最近的老師數據和學生數據推得的點之間的誤差ε,并基于所述的多個誤差ε執行后續的處理。
注意,圖13中的優化設備54除了如圖14和17所示的那樣外,也可以使用如圖9所示的優化設備來配置。
接下來,如上所述的一系列處理可以用硬件實施,也可以用軟件實施。如果用軟件來實施所述的一系列處理,則把組成軟件的程序安裝在通用計算機等中。
現在,圖21說明了安裝有執行如上所述一系列處理的程序的計算機的第一個實施例的配置示例。
可以把程序預先安裝在作為內置于計算機的記錄介質的硬盤105或ROM103中。
或者,該程序也可以暫時或永久存儲在移動記錄介質111中,諸如軟盤,CD-ROM(Compact Disc Read-Only Memory),MO(磁光magneto-optical)盤,DVD(數字多功能盤),磁盤,半導體存儲器等。也可以所謂的封裝式軟件包提供這樣一種移動記錄介質111。
同時,除了可以把程序從這樣的移動記錄介質111安裝到計算機外,也可以把所述程序從下載點通過無線方式經用于數字衛星廣播的衛星,或由電纜經網絡諸如LAN(本地網)或因特網轉發到計算機中,結果計算機通過通信單元108接收如此轉發的所述程序并把程序安裝在內置硬盤105中。
該計算機有一個內置的CPU(中央處理單元)102。通過總線101把輸入/輸出接口110連接到該CPU上,并且一旦通過由鍵盤、鼠標和麥克風等組成的輸入單元107經過輸入/輸出接口110輸入命令,于是CPU 102就會執行存儲在ROM(只讀存儲器)103中的程序。或者,所述CPU 102就把通過衛星轉發、由通信單元108接收以及安裝在硬盤105中的程序,或從安裝在驅動器109的移動式記錄介質111讀取并安裝在硬盤105中的程序,下載到RAM(隨機訪問存儲器)。從而,CPU 102執行遵循如上所述的流程圖的處理或由如上所述方框圖的配置實施的處理。例如,CPU 102從由LCD(液晶顯示器)或揚聲器等組成的輸出單元106經輸入/輸出接口110輸出處理結果,或從通信單元108發送出去,此外,對硬盤105執行記錄等。
現在,在說明書中描述的處理沒有必要根據流程圖的描述順序執行,并且本發明還包括了并行的或獨立的處理(即并行處理或針對對象的處理)。
同時,所述程序可以在一個計算機中處理,或者劃分到多個計算機中處理。此外,所述程序也可以轉發到遠端計算機執行。
雖然上面已經描述了把本發明應用到去除輸入信號噪聲或自動駕駛方面,但是,本發明可以被廣泛應用到除去除輸入信號噪聲或自動駕駛方面之外的場合。即,信號的頻率特性轉換等。
工業適用性如上所述,依照本發明,監視根據用戶的操作而提供的操作信號,并且判斷這些信號是否對學習有用。如果所述操作信號是可以用于學習的學習操作信號,則基于所述學習操作信號學習用于校正輸入信號的校正規范。另一方面,基于通過學習獲得的校正規范校正輸入信號的校正后信號被作為輸出信號輸出。因此,在用戶不知情的情況下可以學習用戶所作的操作,此外,基于學習結果可以幫助用戶執行最佳處理。
權利要求
1.一種校正輸入信號并輸出輸出信號的信號處理設備,所述信號處理設備包括判斷部件,用于監視根據用戶的操作而提供的操作信號,并判斷該信號是否對學習有用;學習部件,用于基于可以適用于學習的所述操作信號的學習操作信號,學習用作校正所述輸入信號的校正規范(norm);和校正部件,用于基于從所述學習中獲得的所述校正規范,校正所述輸入信號,并輸出校正之后的信號作為所述輸出信號。
2.如權利要求1所述的信號處理設備,其中,如果用戶的操作連續一段預定的時間或更長時間并接著停止操作,所述判斷部件判斷在停止時刻的所述操作信號是學習操作信號。
3.如權利要求1所述的信號處理設備,其中,所述學習部件根據提供所述學習操作信號時刻的所述輸入信號,學習所述校正規范。
4.如權利要求3所述的信號處理設備,其中,所述校正部件基于相應于所述輸入信號的所述校正規范,校正所述輸入信號。
5.如權利要求1所述的信號處理設備,所述學習部件包括學習數據生成部件,用于基于所述學習操作信號,生成用于所述學習的學習數據;和校正規范生成部件,用于基于從所述學習數據生成的新的學習信息和此時以前獲得的學習信息,生成所述校正規范。
6.如權利要求5所述的信號處理設備,還包括學習數據存儲部件,用于存儲預定數目的最新的所述學習數據組;學習信息存儲部件,用于存儲所述信息;和校正規范判斷部件,用于判斷通過所述校正規范生成部件獲得的所述校正規范的適合性;其中,如果判斷使用所述學習數據和學習信息獲得的所述校正規范不適合,則所述校正規范生成部件僅僅利用預定數目的最新所述學習數據組再次獲得所述校正規范,并用在獲得校正規范時獲得的新的學習信息,更新用所述學習信息存儲部件所存儲的內容。
7.如權利要求5所述的信號處理設備,其中,所述學習數據生成部件根據所述學習操作信號、在獲得所述學習操作信號時刻的所述輸入信號和所述輸出信號的一個或多個,生成所述學習數據。
8.如權利要求5所述的信號處理設備,其中,所述校正部件通過當前輸入信號和過去的輸出信號的加權和,校正當前輸入信號;并且,其中所述操作信號是表示用于所述加權和的權重系數的信號;并且,其中所述學習數據生成部件把由所述學習操作信號表示的所述權重系數,和根據作為在所述學習操作信號被輸入時刻的所述輸入信號的可靠性的輸入可靠性和作為所述輸出信號的可靠性的輸出可靠性而獲得的所述權重系數,作為所述學習數據。
9.如權利要求5所述的信號處理設備,其中,所述校正部件通過當前輸入信號和過去的輸出信號的加權和,校正所述當前輸入信號;并且,其中所述操作信號是表示用于所述加權和的權重系數的信號;并且,其中所述學習數據生成部件把由所述學習操作信號表示的所述權重系數,和根據與在所述學習操作信號輸入時刻的所述輸入信號有預定關系的多個所述輸入信號、和作為所述輸出信號的可靠性的輸出可靠性獲得的所述權重系數作為所述學習數據。
10.如權利要求5所述的信號處理設備,其中,所述校正部件通過當前輸入信號和過去的輸出信號的加權和,校正所述當前輸入信號;并且,其中所述學習數據生成部件把用于在所述學習操作信號被輸入時刻的所述加權和的權重系數,和根據在輸入所述學習操作信號之前輸入的所述輸入信號獲得的所述權重系數,作為所述學習數據。
11.如權利要求5所述的信號處理設備,其中,所述校正部件通過所述當前輸入信號和根據預定參數得到的預定校正量的線性耦合,校正所述當前輸入信號;并且,其中所述學習數據生成部件把在輸入所述學習操作信號之后輸入的所述輸入信號,和在輸入所述學習操作信號之前輸入的所述輸入信號,作為所述學習數據。
12.如權利要求1所述的信號處理設備,還包括輸入可靠性計算部件,用于計算作為所述輸入信號的可靠性的輸入可靠性;輸出可靠性計算部件,用于計算作為所述輸出信號的可靠性的輸出可靠性;和權重計算部件,用于基于所述輸入可靠性和輸出可靠性,計算用于校正所述輸入信號的權重系數;其中,所述校正部件利用所述權重系數校正所述輸入信號。
13.如權利要求12所述的信號處理設備,所述校正部件包括輸出信號存儲部件,用于存儲所述輸出信號;加法部件,用于利用所述權重系數,對作為其對象的所述輸入信號和所述輸出信號存儲部件中存儲的輸出信號,執行加權和運算。
14.如權利要求12所述的信號處理設備,所述學習部件包括老師數據生成部件,用于生成與所述學習操作信號對應的所述權重系數,作為用作所述學習的老師的老師數據;學生數據生成部件,用于生成用作校正在獲得所述學習操作信號時刻的所述輸入信號的權重系數,作為所述學習的學生的學生數據;和控制數據計算部件,用于計算所述控制數據,以使在根據用于控制所述權重系數和所述學生數據的控制數據而獲得的權重系數和所述老師數據之間的統計誤差最小;此外,還包括權重處理部件,用于基于所述控制數據,處理通過所述權重計算部件而獲得的權重系數,并最終得到用于校正所述輸入信號的權重系數。
15.如權利要求12所述的信號處理設備,所述學習部件包括老師數據生成部件,用于生成與所述學習操作信號對應的所述權重系數,作為用作所述學習的老師的老師數據;學生數據生成部件,用于獲得與在獲得所述學習操作信號時刻輸入的所述輸入信號有預定關系的輸入信號,作為所述學習的學生的學生數據;和控制數據計算部件,用于計算所述控制數據,以使在根據用于控制所述輸入可靠性和基于所述輸入可靠性計算的所述學生數據的控制數據而獲得的所述權重系數,和所述老師數據之間的統計誤差最小;其中,所述輸入可靠性計算部件基于所述輸入信號和控制數據計算所述輸入可靠性。
16.如權利要求12所述的信號處理設備,其中,所述權重計算部件基于所述輸入信號計算作為所述輸入信號的可靠性的輸入可靠性,并基于所述輸入可靠性獲得所述權重系數。
17.如權利要求16所述的信號處理設備,其中,所述權重計算部件基于所述輸入信號的離差(dispersion),獲得所述輸入可靠性。
18.如權利要求16所述的信號處理設備,其中,所述權重計算部件還計算作為所述輸出的可靠性的輸出可靠性,并基于所述輸入可靠性和輸出可靠性,獲得所述權重系數。
19.如權利要求18所述的信號處理設備,其中,所述權重計算部件基于所述輸入可靠性,獲得所述輸出可靠性。
20.如權利要求1所述的信號處理設備,所述學習部件包括老師數據生成部件,用于獲得在獲得所述學習操作信號之后緊跟輸入的所述輸入信號,作為用作所述學習的老師的老師數據;學生數據生成部件,用于獲得緊挨在獲得所述學習操作信號之前輸入的所述輸入信號,作為所述學習的學生的學生數據;和控制數據計算部件,用于計算校正參數,以使根據用于控制校正所述輸入信號和所述學生數據的校正量的校正參數而獲得的信號,和所述老師數據之間的統計誤差最小;其中,所述校正部件根據所述校正參數獲得所述校正量,并按照所述校正量校正所述輸入信號。
21.如權利要求1所述的信號處理設備,其中所述輸入信號是圖像信號或音頻信號。
22.如權利要求1所述的信號處理設備,其中所述輸入信號是表示運動物體的運動方向或位置的信號。
23.一種用于校正輸入信號并輸出輸出信號的信號處理方法,所述方法包括判斷步驟,用于監視根據用戶操作而提供的操作信號,并判斷該信號是否對學習有用;學習步驟,用于基于可以適用于學習的所述操作信號的學習操作信號,學習用作校正所述輸入信號的規范的校正規范;和校正步驟,用于基于從所述學習中獲得的所述校正規范,校正所述輸入信號,并輸出校正之后的信號作為所述輸出信號。
24.一種使計算機執行用于校正輸入信號并輸出輸出信號的信號處理的程序,所述程序包括判斷步驟,用于監視根據用戶操作而提供的操作信號,并判斷該信號是否對學習有用;學習步驟,用于基于可以適用于學習的所述操作信號的學習操作信號,學習用作校正所述輸入信號的規范的校正規范;和校正步驟,用于基于從所述學習中獲得的所述校正規范,校正所述輸入信號,并輸出校正之后的信號作為所述輸出信號。
25.一種存儲使計算機執行用于校正輸入信號并輸出輸出信號的信號處理的程序的記錄介質,所述程序包括判斷步驟,用于監視根據用戶操作而提供的操作信號,并判斷該信號是否對學習有用;學習步驟,用于基于可以適用于學習的所述操作信號的學習操作信號,學習用作校正所述輸入信號的規范的校正規范;和校正步驟,用于基于從所述學習中獲得的所述校正規范,校正所述輸入信號,并輸出校正之后的信號作為所述輸出信號。
全文摘要
一種信號處理設備,在用戶不知情的情況下學習用戶操作,允許用戶執行最適于用戶的操作。學習單元(2)監視響應用戶操作而提供的操作信號,并判斷該信號是否可被用于學習。如果所述操作信號是可以用于學習的學習操作信號,則學習單元(2)參考所述學習操作信號,學習用于校正輸入信號的規范的校正規范。在校正單元(1),根據通過學習而獲得的校正規范,校正輸入信號,校正后信號作為輸出信號被輸出。所述信號處理設備可被應用到NR(降噪)電路,用于減小噪聲。
文檔編號G05B13/02GK1460227SQ02801063
公開日2003年12月3日 申請日期2002年2月21日 優先權日2001年2月21日
發明者近藤哲二郎 申請人:索尼公司