專利名稱:一種空間聚類挖掘pse系統(tǒng)及其構(gòu)建方法
技術(shù)領(lǐng)域:
本發(fā)明涉及空間數(shù)據(jù)信息的挖掘技術(shù),更具體地,涉及一種空間聚類挖掘PSE系統(tǒng)及其構(gòu)建方法。
背景技術(shù):
空間數(shù)據(jù)是研究解決人口、資源、環(huán)境、自然災(zāi)害、經(jīng)濟發(fā)展、軍事防衛(wèi)等重大問題時必需的信息資源,同時空間數(shù)據(jù)是由與地理位置相關(guān)的海量信息構(gòu)成的,從海量數(shù)據(jù)中發(fā)現(xiàn)和抽取有利于決策的數(shù)據(jù),是任何基于空間數(shù)據(jù)的信息系統(tǒng)所必須解決的問題。然而, 這一問題也非常復(fù)雜,成為了制約空間數(shù)據(jù)信息系統(tǒng)發(fā)展的瓶頸。近年來PSE等技術(shù)理念的提出,為空間數(shù)據(jù)的挖掘開拓了新的思路。(1) PSE (問題解決環(huán)境)Rice J R,Boisvert,R F(1996),Gallopoulos Stratis,Houstis Elias,Rice Joh (1994)提出PSE(Problem Solving Environments)是由提供面向目標(biāo)的問題求解能力的計算資源和設(shè)施組成的計算機系統(tǒng),其目的是構(gòu)建一個分析和解決特定領(lǐng)域內(nèi)復(fù)雜問題的服務(wù)平臺,該平臺能夠自動或半自動化地選擇求解算法和模塊,用戶不需要知道系統(tǒng)的軟硬件組成就能夠順利地實現(xiàn)其問題求解,并借助于豐富的圖形化界面以友好的、可視化的形式把結(jié)果呈現(xiàn)給用戶。Watson (2002)提出了“問題解決環(huán)境”(PSE)的概念,即面向需要解決的問題,針對每一個問題,提出解決方法并實現(xiàn),從而提供解決問題的計算環(huán)境。PSE是繼DSS以及GIS之后的一種新的計算模式,是一種集成的計算系統(tǒng),該系統(tǒng)根據(jù)問題域的要求,能夠提供完整的和便利的高水平工具箱用于解決特殊領(lǐng)域的問題,是GIS的DSS屬性在網(wǎng)絡(luò)時代的發(fā)展。它被要求基于WEB環(huán)境對外部提供的大量數(shù)據(jù)開展數(shù)據(jù)挖掘、模擬計算, 最后提供決策支持。目前,PSE雖受到國內(nèi)外一些學(xué)者的關(guān)注,但應(yīng)用方面仍很有限,能找到的參考文獻(xiàn)也并不多。國外,(Garbowet al. 2001, 2002, 2003)開發(fā)了基于網(wǎng)絡(luò)的咨詢系統(tǒng),該系統(tǒng)可令用戶在客戶端服務(wù)器通過網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行分析;R. Dymond · V. Lohani · D. Kibler · D. Bosch (2003)構(gòu)建了土地利用變化分析問題求解環(huán)境,它給管理人員和用戶提供了一個網(wǎng)絡(luò)接口,使得用戶可以探求一些有意義的土地利用變化問題并且了解這些變化在水文、生態(tài)和經(jīng)濟方面的影響。國內(nèi),劉揚(2003)構(gòu)建了區(qū)域經(jīng)濟增長分析的PSE,該集成計算環(huán)境既可以從Web直接訪問數(shù)據(jù)庫,進(jìn)行數(shù)據(jù)查詢分析,也可以從Web上直接輸入數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,從而實現(xiàn)了分布式的計算;陳瑞卿,周健等(2006)設(shè)計開發(fā)了支持軸承設(shè)計的問題求解環(huán)境,系統(tǒng)提供了軸承類產(chǎn)品設(shè)計部分環(huán)節(jié)的計算服務(wù);徐俊剛,王軍等(2007)構(gòu)建了一個面向智能建筑的基于網(wǎng)絡(luò)的問題求解環(huán)境,用戶可以不用了解具體的硬件設(shè)備和軟件開發(fā)知識就可以利用它開發(fā)分布式智能建筑應(yīng)用系統(tǒng),對智能建筑中的設(shè)備進(jìn)行實時監(jiān)控。(2)空間聚類聚類分析是數(shù)據(jù)挖掘中的一個很活躍的研究領(lǐng)域,并提出了許多聚類算法。這些算法可以被分為劃分方法、層次方法、基于密度方法、基于網(wǎng)格方法和基于模型方法。基于劃分的方法主要有K中心的方法和K平均的方法。這兩種算法都需要用戶指定簇的個數(shù)。所謂K中心方法,就是選取K個實際點作為K個簇的中心位置,然后把其他點分別指派到這K個簇中,在指派過程中,選取離簇中心最近的這個點作為中心點。所謂K 平均方法,就是選取K個實際點作為K個簇的中心位置,然后把其他點分別指派到這K個簇中,在指派的過程中,計算簇中所有點的中心位置作為中心,而不是選取其中某個特定點。層次方法包括凝聚的層次聚類方法和分裂的層次聚類方法。凝聚的層次聚類采用自底向上策略,首先將每個樣本作為一個簇,然后合并這些原子簇形成越來越大的簇,減少簇的數(shù)目,直到所有的樣本都在一個簇中,或某個終結(jié)條件被滿足。分裂的層次聚類采用自頂向下策略,首先將所有樣本置于一個簇中,然后逐漸細(xì)分為越來越小的簇,來增加簇的數(shù)目,直到每個樣本自成一個簇,或者達(dá)到某個終結(jié)條件,例如達(dá)到了某個希望的簇的數(shù)目或兩個最近的簇之間的距離超過了某個閾值?;诿芏鹊乃惴?,其基本思想就是將位置相對集中的點合并成簇。它不是基于各種各樣的距離的,而是基于密度的。這樣就能克服基于距離的算法只能發(fā)現(xiàn)類圓形的聚類的缺點。這個方法的指導(dǎo)思想就是,只要一個區(qū)域中的點的密度大過某個閾值,就把它加到與之相近的聚類中去?;诰W(wǎng)格的算法是將數(shù)據(jù)空間分割成網(wǎng)格狀(這是通過將數(shù)據(jù)空間中的每一維劃分成相同的區(qū)間數(shù)來做到的,這就意味著每一個單元具有相同的體積,這樣單元中點的密度的計算可以轉(zhuǎn)換成簡單的點計數(shù)),然后將落到某個單元中的點的個數(shù)當(dāng)成這個單元的密度(density)。這時可以指定一個數(shù)值,當(dāng)某個單元格的點的個數(shù)大于該數(shù)值時,我們就說這個單元格是密集的。最后,聚類也就定義為連通的所有的密的(dense)單元格的集合。代表算法有STNIG算法、CLIQUE、WAVE-CLUSTER算法。基于模型的方法給每一個聚類假定一個模型,然后去尋找一個很好的滿足這個模型的數(shù)據(jù)集。這樣一個模型可能是數(shù)據(jù)點在空間中的密度分布函數(shù)或者其它。它的一個潛在的假定就是目標(biāo)數(shù)據(jù)集是由一系列的概率分布所決定的。通常有三種嘗試方向統(tǒng)計方法、機器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等等。(3) OGC WPS 規(guī)范OGC是一個非營利性國際組織,成立于1994年,屬于論壇性國際標(biāo)準(zhǔn)化組織,以美國為中心,目前已經(jīng)有近400個來自不同國家和地區(qū)的成員。OGC指定的標(biāo)準(zhǔn)已逐漸成為被廣泛認(rèn)可的主流標(biāo)準(zhǔn)。美國聯(lián)邦地理數(shù)據(jù)委員會(F⑶C)在1994年就計劃引用OGC的標(biāo)準(zhǔn)實現(xiàn)國家空間數(shù)據(jù)基礎(chǔ)設(shè)施工程,并于1997年正式開展地理信息數(shù)據(jù)處理互操作技術(shù)合作,實現(xiàn)網(wǎng)上地理信息數(shù)據(jù)和傳播功能。OGC經(jīng)過幾年努力,各項規(guī)范已逐漸成熟,它提出的地理數(shù)據(jù)互操作技術(shù)被普遍接受并開始付諸實踐。OGC的目標(biāo)是通過信息基礎(chǔ)設(shè)施,把分布式計算、對象技術(shù)、中間件軟件技術(shù)等用于地理信息處理,使地理空間數(shù)據(jù)和地理處理資源集成到主流的計算技術(shù)中。由于OGC所涉及問題的挑戰(zhàn)性,使得在地理信息與地理信息處理領(lǐng)域中的著名專家參與了 OGC的互操作計劃(Interoperability Program,簡稱IP)。該項計劃的目標(biāo)是提供一套綜合的開放接口規(guī)范,以使軟件開發(fā)商可以根據(jù)這些規(guī)范來編寫互操作組件,從而滿足互操作需求。OGC 已經(jīng)正式發(fā)布的標(biāo)準(zhǔn)達(dá)40種,其中應(yīng)用最廣泛的有WMS,WFS,WCS等。WPS (Web ProcessingService)即網(wǎng)絡(luò)處理規(guī)范,是OGC最近新推出的針對空間數(shù)據(jù)處理的OGC規(guī)范。OGC規(guī)范的網(wǎng)絡(luò)處理服務(wù)規(guī)范(WPS,Web Processing Service)于2005年發(fā)布第一個版本,2008年2月22號被正式納入OGC標(biāo)準(zhǔn),它是承擔(dān)支持加拿大空間信息數(shù)據(jù)組織 (Canadian Geospatial Data Infrastructure Service, NLffIS)工作的結(jié)果,尤其是國際水土信息服務(wù)和國際森林信息服務(wù),是OGC最新的標(biāo)準(zhǔn)之一,WPS提出了一個促進(jìn)地理空間信息處理服務(wù)發(fā)布、發(fā)現(xiàn)和綁定的標(biāo)準(zhǔn)接口,并且發(fā)現(xiàn)和綁定服務(wù)的操作均由用戶完成,處理服務(wù)包含任何算法、公式或者其他可以對空間數(shù)據(jù)進(jìn)行處理的過程;服務(wù)發(fā)布即提供一些像元數(shù)據(jù)一樣描述處理和數(shù)據(jù)信息的數(shù)據(jù),以便用戶進(jìn)行搜索查詢,而“綁定”則是允許網(wǎng)絡(luò)上提供的服務(wù)能夠被發(fā)現(xiàn)和使用。WPS作為一個網(wǎng)絡(luò)處理服務(wù),可以通過互聯(lián)網(wǎng)為用戶提供任何的GIS功能,在空間處理方面,WPS不僅可以提供簡單的空間處理服務(wù)如用一系列空間參考數(shù)據(jù)減去另外一系列參考數(shù)據(jù)的計算(例如,確定不同季節(jié)流行感冒的區(qū)別等),也能夠提供比較復(fù)雜的空間處理服務(wù),如全球氣候變化模型。WPS處理服務(wù)所需要的數(shù)據(jù)可以通過兩種方式獲得,一種是通過網(wǎng)絡(luò)傳輸?shù)玫狡渌?wù)器上的數(shù)據(jù)資源,另外一種就是直接從本地服務(wù)器獲得。WPS規(guī)范的目的是描述服務(wù),提供可通過Web方式執(zhí)行的處理服務(wù),并且在底層機制對用戶透明的情況下允許用戶輸入數(shù)據(jù)和調(diào)用服務(wù)。WPS標(biāo)準(zhǔn)是基于XML和Http的傳輸協(xié)議,通過網(wǎng)絡(luò)為客戶端提供空間數(shù)據(jù)處理相關(guān)的GIS函數(shù)功能,同時,它可以包裝其他任何類型的數(shù)據(jù)處理功能。WPS處理規(guī)范是針對空間數(shù)據(jù)處理的標(biāo)準(zhǔn),為用戶提供了標(biāo)準(zhǔn)的發(fā)布、發(fā)現(xiàn)和綁定的接口,同時WPS服務(wù)規(guī)范也可以發(fā)布封裝其他任何非空間處理服務(wù)。(4)、PortalPortal (門戶)是一個信息系統(tǒng)的集成應(yīng)用框架,通過向用戶提供及時、準(zhǔn)確地信息優(yōu)化運作和提高生產(chǎn)力。Portal提供一個統(tǒng)一的操作簡便的訪問入口,使一系列的內(nèi)部和外部作業(yè)過程轉(zhuǎn)變成對各種信息有條理的綜合管理過程。Portal 系統(tǒng)由三部分組成Portal Web 應(yīng)用、Portlet 容器、Portlet。Portal Web應(yīng)用是一個基于web的應(yīng)用程序,它主要提供個性化、單點登錄、不同資源的內(nèi)容整合,負(fù)責(zé)整個信息系統(tǒng)的展現(xiàn)層。此應(yīng)用把用戶定制的不同資源里的內(nèi)容聚合在一個web頁面并處理用戶的請求。Portlet容器Portlet在Portlet容器中運行,Portlet容器為Portlet提供必需的運行環(huán)境。Portlet容器包含Portlet (組件)并且管理它們的生命周期,它也為Portlet 的參數(shù)設(shè)置提供持久化的存儲。Portlet容器通過標(biāo)準(zhǔn)的PortletAPI對Portlet進(jìn)行調(diào)用。Portlet =Portlet是基于web的Java組件。它由Portlet容器管理,能夠處理請求,產(chǎn)生動態(tài)內(nèi)容。Portlet被Portal用作為可插拔的用戶接口組件,為信息系統(tǒng)提供展現(xiàn)。由Portlet動態(tài)產(chǎn)生的內(nèi)容也被叫做fragment,是遵循某種規(guī)則的標(biāo)記(例如HTML, xHTML,WML),可與其他的fragment —起建立一個完整的文檔。Portlet產(chǎn)生的內(nèi)容和其他的Portlet產(chǎn)生的內(nèi)容聚集在一起形成Portal網(wǎng)頁。Portal架構(gòu)優(yōu)點①它無需在客戶端安裝特定軟件,僅安裝瀏覽器或特定的查看圖形的插件即可,便于用戶使用;②Portal體現(xiàn)的是以用戶為中心,面向服務(wù)的思想,為用戶提供統(tǒng)一的服務(wù)平臺,以透明的方法將網(wǎng)絡(luò)上的各種模型算法功能集成到現(xiàn)有的應(yīng)用界面環(huán)境把服務(wù)整合到Portal中,提供了簡潔、直觀的界面。綜上所述,聚類算法的完善為海量空間數(shù)據(jù)的發(fā)掘和利用提供了科學(xué)的算法基礎(chǔ),PSE、Portal等計算機解決方案的發(fā)展為空間數(shù)據(jù)發(fā)掘提供了新的平臺架構(gòu),WPS標(biāo)準(zhǔn)為空間數(shù)據(jù)處理建立了統(tǒng)一標(biāo)準(zhǔn)和接口,如果能夠?qū)⒁陨戏矫娴募夹g(shù)整合為一種以PSE架構(gòu)為基礎(chǔ)的空間聚類挖掘PSE系統(tǒng),實現(xiàn)規(guī)范封裝、靈活可擴展、網(wǎng)絡(luò)共享,必將實現(xiàn)空間數(shù)據(jù)的高效整合和利用,極大促進(jìn)基于空間數(shù)據(jù)的信息分析和科學(xué)決策。
發(fā)明內(nèi)容
針對現(xiàn)有空間數(shù)據(jù)發(fā)掘技術(shù)的上述不足和實際需求,本發(fā)明提供了一種空間聚類挖掘PSE系統(tǒng)及其構(gòu)建方法。本發(fā)明首先構(gòu)建了空間聚類挖掘模型,并利用OGC WPS標(biāo)準(zhǔn)封裝該挖掘模型服務(wù),即利用WPS提供的操作規(guī)范去標(biāo)準(zhǔn)化服務(wù)請求、服務(wù)描述和服務(wù)調(diào)用的消息傳輸機制,使其以一種與平臺無關(guān)的消息模式進(jìn)行通信,最終得以在任何一種系統(tǒng)和應(yīng)用平臺上實現(xiàn)服務(wù)共享。所述空間聚類挖掘PSE系統(tǒng)的架構(gòu)設(shè)計采用Portal架構(gòu), Portal架構(gòu)可擴充性良好,采用統(tǒng)一的服務(wù)訪問入口,提供了從用戶登陸到處理服務(wù)獲取、 數(shù)據(jù)提交、處理、結(jié)果可視化及結(jié)果信息提取等界面,并且通過界面的訪問控制連接用戶與服務(wù)端的應(yīng)用模型。本發(fā)明所述的空間聚類挖掘PSE系統(tǒng),其特征在于,包括數(shù)據(jù)層、功能層以及用戶層,所述數(shù)據(jù)層包括用于提供基礎(chǔ)空間數(shù)據(jù)的至少一個空間數(shù)據(jù)庫;所述功能層用于封裝空間聚類挖掘模型并提供統(tǒng)一的接口,實現(xiàn)空間聚類模型服務(wù)的發(fā)布、發(fā)現(xiàn)和調(diào)用,并且將空間聚類分析的結(jié)果可視化顯示和返回;所述用戶層提供用于用戶輸入?yún)?shù)及模型服務(wù)選擇的接口。優(yōu)選地,所述功能層包括PSE服務(wù)器,用于提供所述空間聚類模型,根據(jù)用戶請求和輸入?yún)?shù)確定空間聚類挖掘模型,根據(jù)從所述數(shù)據(jù)層或網(wǎng)絡(luò)取得的數(shù)據(jù)執(zhí)行所述空間聚類挖掘模型對所述數(shù)據(jù)進(jìn)行分析并生成可視化處理結(jié)果。優(yōu)選地,所述功能層進(jìn)一步包括PSE管理中心,用于根據(jù)OGC WPS規(guī)范對各PSE服務(wù)器提供的所述空間聚類挖掘模型進(jìn)行封裝并提供查詢請求、描述請求及調(diào)用過程的統(tǒng)一接口,執(zhí)行利用所述模型的標(biāo)準(zhǔn)描述文檔實現(xiàn)對模型功能的發(fā)布,執(zhí)行輸入?yún)?shù)的判斷和初始化,并返回模型處理結(jié)果。進(jìn)一步優(yōu)選地,所述統(tǒng)一接口包括數(shù)據(jù)初始化接口、模型處理接口及結(jié)果返回接口。優(yōu)選地,所述功能層進(jìn)一步包括PSE服務(wù)端,用于接收客戶端發(fā)送的調(diào)用所述模型的請求,定位和調(diào)用所述模型并將處理結(jié)果生成符合OGC WPS規(guī)范的格式返回客戶端,以及調(diào)用繪圖類將聚類結(jié)果顯示在地圖上。優(yōu)選地,所述功能層基于OGC WPS標(biāo)準(zhǔn)對空間聚類挖掘模型的服務(wù)查詢請求、服務(wù)描述請求和服務(wù)調(diào)用請求及其返回結(jié)果的通信方式進(jìn)行封裝,并將每個功能封裝為一個功能類。進(jìn)一步優(yōu)選地,所述功能類包括GetCapabilities、DescribeProcess和Execute ; 通過GetCapabilities請求并獲取服務(wù)能夠?qū)崿F(xiàn)的功能,DescribeProcess獲取網(wǎng)絡(luò)服務(wù)中輸入、輸出參數(shù)的類型;在本地數(shù)據(jù)庫或網(wǎng)絡(luò)獲取到數(shù)據(jù)后,通過Execute調(diào)用數(shù)據(jù)挖掘模型方法對數(shù)據(jù)進(jìn)行分析,并展示結(jié)果。進(jìn)一步優(yōu)選地,所述功能類還包括:WPS,作為功能類的基類,分別就OGC WPS規(guī)范的三個標(biāo)準(zhǔn)接口涉及的各種參數(shù)變量進(jìn)行定義,同時對公共的方法進(jìn)行定義;ProcessMng類,用于接受來自客戶端發(fā)送的調(diào)用模型方法的請求,定位到相應(yīng)的處理服務(wù);RequestProcessor類,用于實現(xiàn)模型服務(wù)的處理服務(wù)調(diào)用,并將處理結(jié)果生成符合OGC WPS規(guī)范XML格式返回到客戶端GetMap類調(diào)用繪圖類,通過聚類結(jié)果在地圖上進(jìn)行顯示。
優(yōu)選地,所述空間聚類挖掘模型的算法是①將空間數(shù)據(jù)中的各樣品各自作為一類,并規(guī)定樣品之間的距離和類與類之間的距離;②將距離最近的兩類合并成一個新類,計算新類與其他類的距離;③重復(fù)進(jìn)行步驟②,每次減少一類,直至所有的樣品合并為一類。本發(fā)明還提供了實現(xiàn)上述空間聚類挖掘PSE系統(tǒng)的構(gòu)建方法,其特征在于,包括構(gòu)建空間聚類模型和取得空間數(shù)據(jù)庫;利用OGC WPS標(biāo)準(zhǔn)對空間聚類挖掘模型的服務(wù)查詢請求、服務(wù)描述請求和服務(wù)調(diào)用請求及其返回結(jié)果的通信方式進(jìn)行封裝,提供查詢請求、描述請求及調(diào)用過程的統(tǒng)一接口,并將每個功能封裝為一個功能類;基于Portal結(jié)構(gòu)構(gòu)建PSE系統(tǒng),所述系統(tǒng)包括數(shù)據(jù)層、功能層以及用戶層,所述數(shù)據(jù)層包括用于提供基礎(chǔ)空間數(shù)據(jù)的至少一個空間數(shù)據(jù)庫;所述功能層用于封裝空間聚類挖掘模型并提供統(tǒng)一的接口,實現(xiàn)空間聚類模型服務(wù)的發(fā)布、發(fā)現(xiàn)和調(diào)用,并且將空間聚類分析的結(jié)果可視化顯示和返回;所述用戶層提供用于用戶輸入?yún)?shù)及模型服務(wù)選擇的接口。綜上所述,本發(fā)明采用OGC WPS標(biāo)準(zhǔn),實現(xiàn)了空間聚類模型服務(wù)封裝的標(biāo)準(zhǔn)化、調(diào)用的規(guī)范化和充分的網(wǎng)絡(luò)共享;引入PSE思想,建立了空間聚類挖掘的問題解決環(huán)境,為相關(guān)問題的解決提供了一種新的思路和方法。本發(fā)明屬于空間數(shù)據(jù)挖掘的基礎(chǔ)性研究范圍,可廣泛應(yīng)用于國民經(jīng)濟和社會發(fā)展的各個領(lǐng)域中,如氣象領(lǐng)域、城市規(guī)劃、環(huán)境監(jiān)測、石油天然氣勘探、經(jīng)濟研究、人口種族研究、政府和防衛(wèi)、交通研究、水資源利用、地址災(zāi)害、防災(zāi)減災(zāi)、數(shù)據(jù)統(tǒng)計、經(jīng)濟普查、動態(tài)監(jiān)測、信息展示、媒介等方面,為從海量的與位置有關(guān)的數(shù)據(jù)中發(fā)現(xiàn)和抽取出有利于決策的數(shù)據(jù)提供了有效的支持,大大提高和拓寬了空間數(shù)據(jù)挖掘模型的應(yīng)用層次及質(zhì)量,具有明顯的社會效益和經(jīng)濟效益。
下面結(jié)合附圖和具體實施方式
對本發(fā)明作進(jìn)一步詳細(xì)的說明圖IA是本發(fā)明空間聚類挖掘PSE系統(tǒng)采用的Portal架構(gòu)的基本組成框架圖;圖IB是Portlet的用戶請求處理方式流程示意圖;圖2是空間聚類挖掘PSE系統(tǒng)的架構(gòu)示意圖;圖3是空間聚類挖掘PSE系統(tǒng)功能層的工作流程圖。
具體實施例方式為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明的技術(shù)方案,并使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合實施例及實施例附圖對本發(fā)明作進(jìn)一步詳細(xì)的說明。本發(fā)明設(shè)計的空間聚類挖掘PSE系統(tǒng)優(yōu)于其他傳統(tǒng)桌面PSE和網(wǎng)絡(luò)PSE之處在于它的規(guī)范性和服務(wù)共享性及可擴展性。主要解決了以下技術(shù)問題(1)模型服務(wù)的規(guī)范性封裝;(2)模型服務(wù)的網(wǎng)絡(luò)共享;(3)PSE架構(gòu)的靈活性和可擴充性。為了達(dá)到上述目的,本發(fā)明實現(xiàn)了空間聚類挖掘模型,并利用OGC WPS標(biāo)準(zhǔn)封裝挖掘模型服務(wù),即利用WPS提供的操作規(guī)范去標(biāo)準(zhǔn)化服務(wù)請求、服務(wù)描述和服務(wù)調(diào)用的消息傳輸機制,使其以一種與平臺無關(guān)的消息模式進(jìn)行通信,最終得以在任何一種系統(tǒng)和應(yīng)用平臺上實現(xiàn)服務(wù)共享。PSE系統(tǒng)的架構(gòu)設(shè)計采用Portal架構(gòu),Portal架構(gòu)可擴充性良好,采用統(tǒng)一的服務(wù)訪問入口,提供了從用戶登陸到處理服務(wù)獲取、數(shù)據(jù)提交、處理、結(jié)果可視化及結(jié)果信息提取等界面,并且通過界面的訪問控制連接用戶與服務(wù)端的應(yīng)用模型。下面從以下幾個方面對本發(fā)明的空間聚類挖掘PSE系統(tǒng)及其構(gòu)建方法加以詳細(xì)說明(1)空間聚類方法的研究與實現(xiàn)系統(tǒng)聚類其基本過程是①將各樣品各自作為一類,并規(guī)定樣品之間的距離和類與類之間的距離;②將距離最近的兩類合并成一個新類,計算新類與其他類的距離;③重復(fù)進(jìn)行步驟②,每次減少一類,直至所有的樣品合并為一類。離差平方和法定義類中各樣品到類重心(均值)的平方歐式距離之和稱為(類內(nèi))離差平方和。 設(shè)Gk和G^合并成新類Gm,則GK、Gl和Gm的離差平方和分別是· = Σ ·廣 Τκ)' “ — D-I = ^Cxi ~ %)
一 _
權(quán)利要求
1.一種空間聚類挖掘PSE系統(tǒng),其特征在于,包括數(shù)據(jù)層、功能層以及用戶層,所述數(shù)據(jù)層包括用于提供基礎(chǔ)空間數(shù)據(jù)的至少一個空間數(shù)據(jù)庫;所述功能層用于封裝空間聚類挖掘模型并提供統(tǒng)一的接口,實現(xiàn)空間聚類模型服務(wù)的發(fā)布、發(fā)現(xiàn)和調(diào)用,并且將空間聚類分析的結(jié)果可視化顯示和返回;所述用戶層提供用于用戶輸入?yún)?shù)及模型服務(wù)選擇的接口。
2.根據(jù)權(quán)利要求1所述的空間聚類挖掘PSE系統(tǒng),其特征在于,所述功能層包括PSE服務(wù)器,用于提供所述空間聚類模型,根據(jù)用戶請求和輸入?yún)?shù)確定空間聚類挖掘模型,根據(jù)從所述數(shù)據(jù)層或網(wǎng)絡(luò)取得的數(shù)據(jù)執(zhí)行所述空間聚類挖掘模型對所述數(shù)據(jù)進(jìn)行分析并生成可視化處理結(jié)果。
3.根據(jù)權(quán)利要求2所述的空間聚類挖掘PSE系統(tǒng),其特征在于,所述功能層進(jìn)一步包括PSE管理中心,用于根據(jù)OGC WPS規(guī)范對各PSE服務(wù)器提供的所述空間聚類挖掘模型進(jìn)行封裝并提供查詢請求、描述請求及調(diào)用過程的統(tǒng)一接口,執(zhí)行利用所述模型的標(biāo)準(zhǔn)描述文檔實現(xiàn)對模型功能的發(fā)布,執(zhí)行輸入?yún)?shù)的判斷和初始化,并返回模型處理結(jié)果。
4.根據(jù)權(quán)利要求3所述的空間聚類挖掘PSE系統(tǒng),其特征在于,所述統(tǒng)一接口包括數(shù)據(jù)初始化接口、模型處理接口及結(jié)果返回接口。
5.根據(jù)權(quán)利要求3或4所述的空間聚類挖掘PSE系統(tǒng),其特征在于,所述功能層進(jìn)一步包括PSE服務(wù)端,用于接收客戶端發(fā)送的調(diào)用所述模型的請求,定位和調(diào)用所述模型并將處理結(jié)果生成符合OGC WPS規(guī)范的格式返回客戶端,以及調(diào)用繪圖類將聚類結(jié)果顯示在地圖上。
6.根據(jù)權(quán)利要求1所述的空間聚類挖掘PSE系統(tǒng),其特征在于,所述功能層基于OGC WPS標(biāo)準(zhǔn)對空間聚類挖掘模型的服務(wù)查詢請求、服務(wù)描述請求和服務(wù)調(diào)用請求及其返回結(jié)果的通信方式進(jìn)行封裝,并將每個功能封裝為一個功能類。
7.根據(jù)權(quán)利要求6所述的空間聚類挖掘PSE系統(tǒng),其特征在于,所述功能類包括 GetCapabilities>DescribeProcess禾口Execute ;通過GetCapabilities請求并獲取月艮務(wù)能夠?qū)崿F(xiàn)的功能,DescribeProcess獲取網(wǎng)絡(luò)服務(wù)中輸入、輸出參數(shù)的類型;在本地數(shù)據(jù)庫或網(wǎng)絡(luò)獲取到數(shù)據(jù)后,通過Execute調(diào)用數(shù)據(jù)挖掘模型方法對數(shù)據(jù)進(jìn)行分析,并展示結(jié)果。
8.根據(jù)權(quán)利要求7所述的空間聚類挖掘PSE系統(tǒng),其特征在于,所述功能類還包括 WPS,作為功能類的基類,分別就OGC WPS規(guī)范的三個標(biāo)準(zhǔn)接口涉及的各種參數(shù)變量進(jìn)行定義,同時對公共的方法進(jìn)行定義;ProcessMng類,用于接受來自客戶端發(fā)送的調(diào)用模型方法的請求,定位到相應(yīng)的處理服務(wù);RequestProcessor類,用于實現(xiàn)模型服務(wù)的處理服務(wù)調(diào)用,并將處理結(jié)果生成符合OGC WPS規(guī)范XML格式返回到客戶端;GetMap類調(diào)用繪圖類, 通過聚類結(jié)果在地圖上進(jìn)行顯示。
9.根據(jù)權(quán)利要求1所述的空間聚類挖掘PSE系統(tǒng),其特征在于,所述空間聚類挖掘模型的算法是①將空間數(shù)據(jù)中的各樣品各自作為一類,并規(guī)定樣品之間的距離和類與類之間的距離;②將距離最近的兩類合并成一個新類,計算新類與其他類的距離;③重復(fù)進(jìn)行步驟②,每次減少一類,直至所有的樣品合并為一類。
10.一種空間聚類挖掘PSE系統(tǒng)的構(gòu)建方法,其特征在于,包括構(gòu)建空間聚類模型和取得空間數(shù)據(jù)庫;利用OGC WPS標(biāo)準(zhǔn)對空間聚類挖掘模型的服務(wù)查詢請求、服務(wù)描述請求和服務(wù)調(diào)用請求及其返回結(jié)果的通信方式進(jìn)行封裝,提供查詢請求、描述請求及調(diào)用過程的統(tǒng)一接口,并將每個功能封裝為一個功能類;基于Portal結(jié)構(gòu)構(gòu)建PSE系統(tǒng),所述系統(tǒng)包括數(shù)據(jù)層、功能層以及用戶層,所述數(shù)據(jù)層包括用于提供基礎(chǔ)空間數(shù)據(jù)的至少一個空間數(shù)據(jù)庫;所述功能層用于封裝空間聚類挖掘模型并提供統(tǒng)一的接口,實現(xiàn)空間聚類模型服務(wù)的發(fā)布、發(fā)現(xiàn)和調(diào)用,并且將空間聚類分析的結(jié)果可視化顯示和返回;所述用戶層提供用于用戶輸入?yún)?shù)及模型服務(wù)選擇的接口。
全文摘要
本發(fā)明提供了一種空間聚類挖掘PSE系統(tǒng),包括數(shù)據(jù)層、功能層以及用戶層,所述數(shù)據(jù)層包括用于提供基礎(chǔ)空間數(shù)據(jù)的至少一個空間數(shù)據(jù)庫;所述功能層用于封裝空間聚類挖掘模型并提供統(tǒng)一的接口,實現(xiàn)空間聚類模型服務(wù)的發(fā)布、發(fā)現(xiàn)和調(diào)用,并且將空間聚類分析的結(jié)果可視化顯示和返回;所述用戶層提供用于用戶輸入?yún)?shù)及模型服務(wù)選擇的接口。本發(fā)明構(gòu)建了空間聚類挖掘模型,并利用OGC WPS標(biāo)準(zhǔn)封裝該挖掘模型服務(wù),最終得以在任何一種系統(tǒng)和應(yīng)用平臺上實現(xiàn)服務(wù)共享;應(yīng)用Portal架構(gòu),可擴充性良好,為從海量與位置有關(guān)的數(shù)據(jù)中發(fā)現(xiàn)和抽取出有利于決策的數(shù)據(jù)提供了有效的支持,大大提高和拓寬了空間數(shù)據(jù)挖掘模型的應(yīng)用層次及質(zhì)量。
文檔編號H04L29/08GK102360377SQ20111030762
公開日2012年2月22日 申請日期2011年10月12日 優(yōu)先權(quán)日2011年10月12日
發(fā)明者康風(fēng)光, 董春, 袁衛(wèi)平 申請人:中國測繪科學(xué)研究院