本發明涉及人工智能算法領域,具體涉及一種稀缺樣本數據集條件下bn模型參數的學習系統及方法。
背景技術:
隨著人工智能的不斷發展,各種人工智能算法得到人們的廣泛關注。由于貝葉斯網絡(bayesiannetwork,bn)在解決復雜系統的不確定性和不完整性問題凸顯出強大的適應性,并且成功應用于智能系統所涉及的眾多領域,因此備受關注,尤針對bn模型的參數學習。
bn模型的參數學習是指在bn模型結構已知的前提下估算出bn模型參數的問題。目前,常見的參數學習方法包括最大似然估計(maximumlikelihoodestimation,mle)、最大后驗估計(maximumaposterior,map)以及定性最大后驗概率方法(qualitativemaximumaposterior,qmap)等(ruichang,weiwang.novelalgorithmforbayesiannetworkparameterlearningwithinformativepriorconstraints.proceedingsofthe2010internationaljointconferenceonneuralnetworks.barcelona,spain:ieee,2010,1-8.)。其中,mle適用于充足樣本數據集條件下的bn模型參數學習,且學習結果具有較高的精度;最大后驗估計融入了要估計量的先驗分布,故最大后驗估計可以看做規則化的最大似然估計。qmap是隨稀缺樣本數據集條件下bn模型參數學習應運而生的。qmap方法將定性領域知識定義為條件概率上的不同約束不等式集合,結合訓練數據進行bn參數學習。
在實際中,某些系統中獲取大量樣本數據非常困難或者代價十分昂,人們僅僅能獲得樣本量較小的數據集,例如地震預測、航空發動機故障診斷系統中的樣本數據等。當所研究的系統為上述稀缺樣本數據集系統時,由于mle和map并未考慮先驗專家定性約束經驗,若利用mle以及map方法往往無法學習出符合客觀規律且較為精確的參數;若采用qmap方法,其運算過程中的估算滿足約束的候選模型所需的逼近似然函數較難選取,且整體運算過程復雜,限制了該方法的實用性。
技術實現要素:
本發明的目的是提供一種稀缺樣本數據集條件下bn模型參數的學習系統及方法,能夠解決現有參數學習法存在的不精確或復雜的問題,實現稀缺樣本數據集條件下bn模型參數的有效學習。
本發明所采用的技術方案為:
稀缺樣本數據集條件下bn模型參數的學習方法,其特征在于:
包括以下步驟:
獲取領域定性約束知識和稀缺樣本數據集;
依據所述領域定性約束知識和自助法,獲得滿足多組約束的bn參數集;
采用傳統參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數;
根據所述滿足多組約束的bn參數集和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數。
依據所述領域定性約束知識和自助法,獲得滿足多組約束的bn參數集的具體步驟包括:
將所述領域定性約束知識轉化為不等式參數約束集合;
根據所述不等式參數約束集合和所述自助法,獲得所述滿足多組約束的bn參數集。
根據所述滿足多組約束的bn參數集和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數的具體步驟包括:
求取出所述滿足多組約束的bn參數集的累加和,并標記為累加約束參數;
根據所述累加約束參數和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數。
根據所述累加約束參數和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數的具體步驟包括:
求取第一預設權值與所述累加約束參數之積,并標記為第一參數;
求取第二預設權值與所述初始參數之積,并標記為第二參數;
根據最大熵原則、所述第一參數和所述第二參數,求取出所述稀缺樣本數據集條件下bn模型的參數。
所述傳統參數學習方法包括最大似然估計法和最大后驗概率參數學習方法;
其中,所述采用傳統參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數的具體步驟包括:
獲得所述稀缺樣本數據集的大小;
判斷所述大小是否大于所述預設值;
若所述大小小于等于所述預設值,采用所述最大后驗概率參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數;
若所述大小大于所述預設值,采用所述最大似然估計法計算出所述稀缺樣本數據集條件下bn模型的初始參數。
稀缺樣本數據集條件下bn模型參數的學習系統,其特征在于:
所述系統包括:
獲取模塊,用于獲取領域定性約束知識和稀缺樣本數據集;還用于依據所述領域定性約束知識和自助法,獲得滿足多組約束的bn參數集;
計算模塊,用于采用傳統參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數;還用于根據所述滿足多組約束的bn參數集和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數。
所述獲取模塊具體用于:
將所述領域定性約束知識轉化為不等式參數約束集合;
根據所述不等式參數約束集合和所述自助法,獲得所述滿足多組約束的bn參數集。
所述計算模塊包括:
求取單元,用于求取出所述滿足多組約束的bn參數集的累加和,并標記為累加約束參數;
計算單元,用于根據所述累加約束參數和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數。
所述計算單元具體用于:
求取第一預設權值與所述累加約束參數之積,并標記為第一參數;
求取第二預設權值與所述初始參數之積,并標記為第二參數;
根據最大熵原則、所述第一參數和所述第二參數,求取出所述稀缺樣本數據集條件下bn模型的參數。
所述傳統參數學習方法包括最大似然估計法和最大后驗概率參數學習方法;
其中,所述計算模塊具體用于:
獲得所述稀缺樣本數據集的大小;
判斷所述大小是否大于所述預設值;
若所述大小小于等于所述預設值,采用所述最大后驗概率參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數;
若所述大小大于所述預設值,采用所述最大似然估計法計算出所述稀缺樣本數據集條件下bn模型的初始參數。
本發明具有以下優點:
本發明實施例提供了一種稀缺樣本數據集條件下bn模型參數學習方法和系統,首先,獲得領域定性約束知識和稀缺樣本數據集;再依據領域定性約束知識和自助法,獲得滿足多組約束的bn參數集;然后,采用傳統參數學習方法計算出稀缺樣本數據集條件下bn模型的初始參數;之后,根據滿足多組約束的bn參數集和初始參數,獲得稀缺樣本數據集條件下bn模型的參數。這樣一來,系統可通過領域定性約束知識和稀缺樣本數據集來學習到稀缺樣本數據集條件下bn模型的初始參數,從而避免了現有方法學習結果的不精確性和復雜性的問題,能夠實現在稀缺樣本數據集條件下通過便捷的方法獲得精確的bn模型的參數,從而擴展了人工智能算法的應用范圍。
附圖說明
圖1為本發明實施例一提供的一種稀缺樣本數據集條件下bn模型參數學習方法流程圖;
圖2為本發明實施例一提供的bn模型參數學習獲得滿足多組約束的bn參數集方法流程圖;
圖3為本發明實施例一提供的bn模型參數學習初始參數計算方法流程圖;
圖4為本發明實施例一提供的另一種稀缺樣本數據集條件下bn模型參數學習方法流程圖;
圖5為本發明實施例一提供的一種獲取bn模型參數方法流程圖;
圖6為本發明實施例二提供的一種稀缺樣本數據集條件下bn模型參數學習方法流程圖;
圖7為本發明實施例三提供的一種稀缺樣本數據集條件下bn模型參數學習系統結構示意圖;
圖8為本發明實施例三提供的另一種稀缺樣本數據集條件下bn模型參數學習系統結構示意圖。
具體實施方式
下面結合具體實施方式對本發明進行詳細的說明。
本發明涉及的稀缺樣本數據集條件下bn模型參數的學習方法,包括以下步驟:
獲取領域定性約束知識和稀缺樣本數據集;
依據所述領域定性約束知識和自助法,獲得滿足多組約束的bn參數集;
采用傳統參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數;
根據所述滿足多組約束的bn參數集和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數。
上述方法中:
1、依據所述領域定性約束知識和自助法,獲得滿足多組約束的bn參數集的具體步驟包括:
將所述領域定性約束知識轉化為不等式參數約束集合;
根據所述不等式參數約束集合和所述自助法,獲得所述滿足多組約束的bn參數集。
2、根據所述滿足多組約束的bn參數集和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數的具體步驟包括:
求取出所述滿足多組約束的bn參數集的累加和,并標記為累加約束參數;
根據所述累加約束參數和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數。
其中,根據所述累加約束參數和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數的具體步驟包括:
求取第一預設權值與所述累加約束參數之積,并標記為第一參數;
求取第二預設權值與所述初始參數之積,并標記為第二參數;
根據最大熵原則、所述第一參數和所述第二參數,求取出所述稀缺樣本數據集條件下bn模型的參數。
3、所述傳統參數學習方法包括最大似然估計法和最大后驗概率參數學習方法;
其中,所述采用傳統參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數的具體步驟包括:
獲得所述稀缺樣本數據集的大小;
判斷所述大小是否大于所述預設值;
若所述大小小于等于所述預設值,采用所述最大后驗概率參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數;
若所述大小大于所述預設值,采用所述最大似然估計法計算出所述稀缺樣本數據集條件下bn模型的初始參數。
上述方法涉及了稀缺樣本數據集條件下bn模型參數的學習系統,所述系統包括:
獲取模塊,用于獲取領域定性約束知識和稀缺樣本數據集;還用于依據所述領域定性約束知識和自助法,獲得滿足多組約束的bn參數集;
計算模塊,用于采用傳統參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數;還用于根據所述滿足多組約束的bn參數集和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數。
系統中:
1、所述獲取模塊具體用于:
將所述領域定性約束知識轉化為不等式參數約束集合;
根據所述不等式參數約束集合和所述自助法,獲得所述滿足多組約束的bn參數集。
2、所述計算模塊包括:
求取單元,用于求取出所述滿足多組約束的bn參數集的累加和,并標記為累加約束參數;
計算單元,用于根據所述累加約束參數和所述初始參數,計算所述稀缺樣本數據集條件下bn模型的參數。
其中:
所述計算單元具體用于:
求取第一預設權值與所述累加約束參數之積,并標記為第一參數;
求取第二預設權值與所述初始參數之積,并標記為第二參數;
根據最大熵原則、所述第一參數和所述第二參數,求取出所述稀缺樣本數據集條件下bn模型的參數。
3、所述傳統參數學習方法包括最大似然估計法和最大后驗概率參數學習方法;
其中,所述計算模塊具體用于:
獲得所述稀缺樣本數據集的大小;
判斷所述大小是否大于所述預設值;
若所述大小小于等于所述預設值,采用所述最大后驗概率參數學習方法計算出所述稀缺樣本數據集條件下bn模型的初始參數;
若所述大小大于所述預設值,采用所述最大似然估計法計算出所述稀缺樣本數據集條件下bn模型的初始參數。
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述。
實施例一
本發明實施例提供一種稀缺樣本數據集條件下bn模型參數學習方法,應用于稀缺樣本數據集條件下bn模型參數學習系統,如圖1所示,該方法包括:
s101、獲取領域定性約束知識和稀缺樣本數據集。
這里,領域定性約束知識是根據客觀規律以及專家經驗獲得的,該領域定性約束知識能夠反映出所研究系統的bn模型參數之間存在固有屬性。稀缺樣本數據集可以通過系統中的采集模塊采集得到,該采集模塊可以由各種傳感器組成;此外,稀缺樣本數據集的形式可以且不限于包括短消息、語音、機械振動信號等等。這里對采集模塊和稀缺樣本數據集的形式并不做限定。
s102、依據領域定性約束知識和自助法,獲得滿足多組約束的bn參數集。
這里,自助法是一種從給定訓練集中有放回的均勻抽樣。
具體的,如圖2所示,s102可以且不限于包括:
s1021:將領域定性約束知識轉化為不等式參數約束集合;
s1022:根據不等式參數約束集合和自助法,獲得滿足多組約束的bn參數集。
這里,不等式約束參數集合是指不同概率之間的大小關系。具體的,首先,將抽象的領域定性約束知識轉化為不等式約束參數集合,即將抽象的信息具體化,并且用數學語言表示出來;接著,通過自助法生成一組參數,判斷該組參數是否滿足上述不等式約束參數集合,若滿足則將該組參數標記為一組約束參數,否則便舍棄該組參數。這的說明的是,最終生成約束參數的組數是人為提前設定的,只需重復通過使用自助法來生成滿足設定組數的滿足多組約束的bn參數集。
示例的,若認為預先設定需要l-1組約束參數,那么就需要反復通過自助法生成約束參數,直至約束參數的組數達到l-1時停止。這里,l為大于等于1的正整數。
s103、采用傳統參數學習方法計算出稀缺樣本數據集條件下bn模型的初始參數。
這里,傳統參數學習方法包括mle和map參數學習方法。
具體的,如圖3所示,s103可以且不限于包括:
s1031:獲取稀缺樣本數據集的大小;
s1032:判斷稀缺樣本數據集的大小是否大于預設值;如是則執行s1033’,否則執行s1033。
s1033:采用map參數學習方法計算出稀缺樣本數據集條件下bn模型的初始參數。
s1033’:采用mle參數學習方法計算出稀缺樣本數據集條件下bn模型的初始參數。
這里,預設值的選取與所研究的系統密切相關:當研究系統包含的節點較多時,選取的預設值就較大;當研究系統包含的節點較少時,選取的預設值就較小。也就是說,當mle方法能夠適用于所研究系統的bn參數學習時,會優先選擇該方法;當獲得的數據集非常有限,mle方法已經失效時,則采用map方法學習出初始參數。
實際上,當稀缺樣本數據集的大小小于等于預設值時,就表明此時樣本數據集已經很小,如采用mle參數學習方法,可能使計算公式產生分母為零的情況,無法計算出初始參數。而map參數學習方法恰好克服了mle該缺點,即樣本數據集再小也不會出現分母為零的情況,因此,在該情況下采用map參數學習方法計算出稀缺樣本數據集條件下bn模型的初始參數。
事實上,當樣本數據集的大小大于預設值時,表明此時樣本數據集并不是非常小,也就是說此時mle參數學習方法還是適用的,再加之mle具有運算簡單、精度高的特點,因此,在該種情況之下就采用mle參數學習方法進行稀缺樣本數據集條件下bn模型初始參數的計算。
s104、根據滿足多組約束的bn參數集和初始參數,獲得稀缺樣本數據集條件下bn模型的參數。
具體的,如圖4所示,s104可以且不限于包括:
s1041:求取出滿足多組約束的bn參數集的累加和,并標記為累加約束參數;
s1042:根據累加約束參數和所述初始參數,獲得稀缺樣本數據集條件下bn模型的參數。
具體的,如圖5所示,s1042可以且不限于包括:
s10421:求取第一預設權值與累加約束參數之積,并標記為第一參數;
s10422:求取第二預設權值與初始參數之積,并標記為第二參數;
s10423:根據最大熵原則、第一參數和第二參數,求取出稀缺樣本數據集條件下bn模型的參數。
這里,第一預設權值為[0,1]之間的任意自然數,第二預設權值也為[0,1]之間的任意自然數,并且第一預設權值與第二預設權值的和恒為1。
示例的,假設約束參數的組數為l-1,第一預設權值為α,α∈[0,1]。滿足多組約束的bn參數集分別為
其中,
值得說明的是,本實施例中所提的稀缺樣本數據集條件下bn模型參數學習的方法能夠適用于bn應用的各個領域,例如:故障診斷、疾病診斷、模式識別等實際問題,本實施例并不對所提方法的應用領域作具體限定。
這樣一來,系統可通過領域定性約束知識和稀缺樣本數據集來學習到稀缺樣本數據集條件下bn模型的初始參數,從而避免了現有方法學習結果的不精確性和復雜性的問題,能夠實現在稀缺樣本數據集條件下通過便捷的方法獲得精確的bn模型的參數,從而擴展了人工智能算法的應用范圍。
實施例二
基于與實施例一相同的發明構思,本發明實施例提供一種稀缺樣本數據集條件下bn模型參數學習方法,應用于軸承故障診斷裝置。這里,該滾動軸承可以是深溝球軸承、滾針軸承、角接觸軸承以及調心球軸承等任何類型的滾動軸承。在本實施例中,假設該滾動軸承為skf6205深溝球軸承,并在實際采集時僅僅獲得較少的樣本數據集,在此基礎上,完成滾動軸承bn建模,實現skf6205深溝球軸承的故障診斷。如圖6所示,該方法包括:
s601、獲取軸承的領域定性約束知識和稀缺樣本數據集;
s602、將領域定性約束知識轉化為不等式參數集合;
s603、通過不等式參數集合和自助法,獲得滿足多組約束的bn參數集;
s604、獲取稀缺樣本數據集的大小;
s605、判斷稀缺樣本數據集的大小是否大于預設值;如果是則執行s606,否則執行s606’;
s606、采用mle參數學習方法計算出稀缺樣本數據集條件下bn模型的初始參數;
s606’、采用map參數學習方法計算出稀缺樣本數據集條件下bn模型的初始參數;
s607、求取出滿足多組約束的bn參數集的累加和,并標記為累加約束參數;
s608、求取第一預設權值與累加約束參數之積,并標記為第一參數;
s69、求取第二預設權值與初始參數之積,并標記為第二參數;
s610、根據最大熵原則、第一參數和第二參數,求取出skf6205深溝球軸承稀缺樣本數據集條件下bn故障診斷模型的參數。
s611、根據已知skf6205深溝球軸承bn結構和skf6205深溝球軸承稀缺樣本數據集條件下bn故障診斷模型的參數,建立skf6205深溝球軸承bn故障診斷模型;
s612、利用skf6205深溝球軸承bn模型進行skf6205深溝球軸承故障診斷。
這樣一來,系統可通過領域定性約束知識和稀缺樣本數據集來學習到稀缺樣本數據集條件下bn模型的初始參數,從而避免了現有方法學習結果的不精確性和復雜性的問題,能夠實現在稀缺樣本數據集條件下通過便捷的方法獲得精確的bn模型的參數,從而擴展了人工智能算法的應用范圍。
實施例三
基于與實施例一相同的發明構思,本發明實施例提供一種稀缺樣本數據集條件下bn模型參數學習系統70,該系統能夠實現在稀缺樣本數據集條件下通過便捷的方法獲得精確的bn模型的參數,如圖7所示,該系統70包括:
獲取模塊701,用于獲取領域定性約束知識和稀缺樣本數據集;還用于依據自助法和領域定性約束知識,獲得滿足多組約束的bn參數集;計算模塊702,用于采用傳統參數學習方法計算出稀缺樣本數據集條件下bn模型的初始參數;還用于根據滿足多組約束的bn參數集和初始參數,計算稀缺樣本數據集條件下bn模型的參數。
具體的,獲取模塊具體用于:將領域定性約束知識轉化為參數不等式約束集合;根據自助法和參數不等式約束集合,獲得滿足多組約束的bn參數集。
具體的,如圖8所示,計算模塊702包括:求取單元7021,用于求取出滿足多組約束的bn參數集的累加和,并標記為累加約束參數;計算單元7022,用于根據累加約束參數和初始參數,計算稀缺樣本數據集條件下bn模型的參數。
具體的,計算單元具體用于:求取第一預設權值與累加約束參數之積,并標記為第一參數;求取第二預設權值與初始參數之積,并標記為第二參數;根據最大熵原則、第一參數和第二參數,求取出稀缺樣本數據集條件下bn模型的參數。
具體的,傳統參數學習方法包括最大似然估計法和最大后驗概率參數學習方法;計算模塊具體用于:獲得樣本數據集的大小;判斷大小是否大于預設值;若大小小于等于預設值,采用最大后驗概率參數學習方法計算出稀缺樣本數據集條件下bn模型的初始參數;若大小大于預設值,采用最大似然估計法計算出稀缺樣本數據集條件下bn模型的初始參數。
這樣一來,系統可通過領域定性約束知識和稀缺樣本數據集來學習到稀缺樣本數據集條件下bn模型的初始參數,從而避免了現有方法學習結果的不精確性和復雜性的問題,能夠實現在稀缺樣本數據集條件下通過便捷的方法獲得精確的bn模型的參數,從而擴展了人工智能算法的應用范圍。
本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或計算機程序產品。因此,本發明可采用硬件實施例、軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器和光學存儲器等)上實施的計算機程序產品的形式。
本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程圖或方框圖來描述的。應理解可由計算機程序指令實現流程圖或方框圖中的每一流程或方框、以及流程圖或方框圖中的流程和方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和方框圖一個方框或多個方框中指定的功能的系統。
這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和方框圖一個方框或多個方框中指定的功能的步驟。
本發明的內容不限于實施例所列舉,本領域普通技術人員通過閱讀本發明說明書而對本發明技術方案采取的任何等效的變換,均為本發明的權利要求所涵蓋。