專利名稱:用于作物單產和森林單位蓄積量估計的分層回歸遙感抽樣技術的制作方法
技術領域:
本發明涉及一種以遙感為數據源,采用分層回歸抽樣技術,估計農作物單產和森林單位面積蓄積量的方法,主要應用于遙感工程、農業工程、林業工程和統計領域。
背景技術:
分層回歸遙感抽樣技術,是指借助輔助信息,對遙感數據信息進行分層,并對各層運用回歸估計方法估計總體變量。農作物單產或森林單位面積蓄積量,是指單位地表面積上農作物產量或森林蓄積量。我國是一個農林產品生產大國、消費大國和貿易大國。農作物長勢與單產、森林的長勢與蓄積量都是國家社會經濟的基礎信息,關系國計民生,對于制定國家和區域社會經濟發展規劃,制定農林產品進出口計劃,確保國家糧食與生態安全,加強生態環境保護,掌控農林產品期貨市場信息,提高國家宏觀調控能力具有重要價值。
國家統計局系統幾十年來一直通過兩種渠道獲取農業生產狀況,其一是,國家、省、地區、縣四級統計局,按行政單元逐級統計匯總上報;其二是,國家統計局系統直屬有全國農業調查隊,遍布全國800多個縣,進行抽樣統計。第一種方法受各級行政部門的人為因素干擾嚴重,數據的準確性差,時間周期長,近幾年由于農村體制改革,這種按行政辦法的統計的數據已難以獲得;第二種方法雖然克服了部分人為干擾,但地面工作量大,并且全國農業調查隊的樣點布設長期不變,不能及時反映農業生產結構調整,以及環境變遷對農作物單產的影響,降低了全國農業調查隊樣點資料的可靠性。對于林業局而言,森林單位面積蓄積量由于森林生長周期的長期性,地面實測數據更加難以獲得。通過引入遙感數據用于作物單產和森林單位面積蓄積量估計,可以大大降低成本,提高信息獲取的時效性。
自60年代開始,國內外開始將遙感數據應用于農業和林業監測,80年代開始陸續投入運行,如美國農業部的全球農業遙感估產運行系統(FAS/USDA)、歐盟(EU)農業局(EU-VI)的農作物遙感監測運行系統(MARS)、澳大利亞農業調查公司(AGRECON)的農作物預報遙感運行系統(CFS)等。國內農業遙感研究始于80年代初,先后開展了“京津冀冬小麥遙感估產研究”、“北方11省市冬小麥氣象衛星遙感綜合估產技術研究”、“全國主要農作物遙感調查”等。但這些研究和應用中的遙感統計抽樣技術主要用于面積獲取,而單產數據則主要直接來源于運行化的NOAA/AVHRR衛星數據,但由于該傳感器分辨率低,包含大量不同類地物的混合像元,而且沒有采用統計抽樣技術,造成精度低,誤差大,結果可靠性差。
本項發明首次將分層回歸抽樣技術應用到遙感領域,用于解決遙感應用于農作物單產和森林單位面積蓄積量中的抽樣框選取與統計推斷問題,在國內外同類技術中屬于首創。利用新一代MODIS衛星數據,空間分辨率比NOAA數據提高16倍以上;解決混合像元問題,為純農作物單產和純森林單位面積蓄積量抽樣框的選取提供可能;引入分層回歸抽樣技術,克服以前遙感農作物單產中的科學性不足和低精度問題;同時本發明所提出的一套完整的遙感農作物單產、森林單位面積蓄積量的抽樣方法,為統計局地面布點合理化提供科學依據,具有巨大的社會效益和經濟效益。
主要引證文件1、水稻遙感估產,王人潮等著,中國農業出版社,2002;2、中國水稻遙感動態監測與估產,趙銳等編,中國科學技術出版社,1996;3、中國農作物遙感動態監測與估產總論,孫九林等編,中國科學技術出版社,1996;4、中國小麥遙感動態監測與估產,王乃斌編,中國科學技術出版社,1996;5、中國玉米遙感動態監測與估產,萬恩璞等編,中國科學技術出版社,1996;6、中國農作物遙感動態監測與估產集成系統,熊利亞編,中國科學技術出版社,1996;7、農業信息科學與農業信息技術,王人潮等著,中國農業出版社,2003;8、3S一體化技術支持下的西南地區冬小麥估產——以安寧河谷四縣為例,江曉波等,地理研究,2002年第5期;9、氣象衛星作物長勢監測及產量預報系統,李劍萍,氣象科技,2002年第2期;10、我國農業遙感的應用現狀與展望,邢素麗等,農業工程學報,2003年第6期。
發明內容
本項發明的目的,是以遙感數據源代替傳統地面實地觀測,以分層回歸抽樣技術代替傳統的隨意采樣或多階段抽樣等低效率抽樣方法,從而獲得代表性強、估計量效率高的采樣點,用于估計農作物單產和森林單位面積蓄積量。本項發明是一項農業、林業、遙感和統計交叉領域的創新技術,也是一項具有寬廣開發前景的應用技術,對我國農作物單產和森林單位面積蓄積量的動態監測及其技術手段的提高、更新和換代具有指導價值。
本項發明的主要內容是,以新一代MODIS遙感影像為數據源,提取能夠反映農作物和森林長勢的參數;結合影響農作物單產和森林單位面積蓄積量的關鍵因子,構造一個無量綱數作為分層依據;采用750m*750m的空間數據為抽樣基本單元,引入分層回歸遙感抽樣技術,從而對農作物單產和森林單位面積蓄積量進行估計。
本項發明與現有技術相比,具有如下優點和積極效果使用高時間分辨率的遙感影像源,大大提高信息獲取的時效性;用遙感數據構造的抽樣框,樣本代表性強,樣本量較傳統估計方法大大減少,降低成本;首次將分層回歸抽樣技術應用到遙感領域,克服以前遙感農作物單產和森林單位面積蓄積量中的科學性不足和低精度問題,大大提高估計量的效率;利用250米空間分辨率的新一代遙感影像,在空間分辨率上比現有NOAA/AVHRR影像提高16倍以上;解決不同類型地物混合像元的檢測和解混問題,為純農作物單產和純森林單位面積蓄積量抽樣框的選取提供可能,提高估計精度。
本項發明是農學、林學、統計學和遙感技術相互交叉、相互滲透的復合型邊緣學科的應用技術,實現本項發明的基本技術方案及最佳方式,可以歸納為如下步驟1、抽樣框的確定(1)、結合土地利用圖和遙感影像,提取農作物或森林的覆蓋區域;(2)、從覆蓋區域中剔除包括不同地物類型的混合像元;(3)、對于完全覆蓋某種農作物或森林的純像元,選取750m×750m的網格(3×3像元),作為抽樣總體;2、分層標志的選擇要選擇恰當的變量作為分層標志,最好采用每個網格內研究對象的單產值,但這些數據根本無法精確獲得。本技術方案選擇一個與調查指標有較大線性相關的無量綱數為分層標志。具體做法如下(1)、利用遙感影像獲得能反映農作物單產或森林單位面積蓄積量的參數;(2)、收集影響農作物單產或森林蓄積量的關鍵因子;(3)、對每個網格,將參數和關鍵因子相乘合成一個新的無量綱的數;(4)、按每個網格內的無量綱數進行分層。
3、確定分層抽樣的層數對總體盡可能多地進行分層時,能夠使得層內差異降低,抽樣效率得到提高。但是同時還需要考慮到層數增加時估計量方差的下降速度。理論和實踐表明,當層數增加到一定的時候,在精度上的收益將非常小,除非研究變量與輔助變量的相關系數大于0.95,層數一般不超過6為宜。
4、按 的累積值確定層距設分層的輔助變量X表示每個網格內研究對象的無量綱數。按照Dalenius和Hodges提出的快速近似確定層界的方法確定最優分層點。具體來說,首先把無量綱數從小到大排列,按一個較小區間分組,然后分別統計各組內網格的數目f(x),計算各組的 并累加,求出總的累加值。假設劃分為6層,按等距劃分,確定每層的跨度并以x為標度的各層的分界值。
5、對研究對象編制每層內部的關于無量綱數的抽樣框6、計算Nh、Wh、Xh、Sh2、XNh表示每個層內有多少個無量綱數值。Wh表示該層的權重,X和Xh分別表示總體無量綱數的均值和每層無量綱數的均值,Sh2表示該層的方差。
Wh=NhN]]>X‾h=1NhΣj=1NhXhj]]>
Sh2=1Nh-1Σj=1Nh(Xhj-X‾h)2]]>X‾=1NΣh=1LNhX‾h]]>7、計算樣本量因為無量綱數和單產間存在很強的相關性,可以用無量綱數的均值和方差來估算所要抽取的樣本量。
當d=0.05,r=0.1,t=1.96,V=(dt)2=(rX‾t)2]]>給定時,按比例分配先計算n0=ΣWhSh2V]]>其中,X‾h=1NhΣj=1Nhxhj]]>Sh2=1Nh-1Σj=1Nh(xhj-X‾h)2]]>如果,n0N<0.05,]]>,則就取n0,否則對n0進行修正n=n01+n0N]]>每層的Sh2已知時,按Neyman分配法確定的樣本量n0=(ΣWhSh)2V]]>n=n01+n0N]]>8、各層樣本量的確定比例分配nh=NhNn]]>Neyman分配nh=WhShΣh=1LWhShn]]>9、盡量選取離公路較近的抽樣單元,建立靜態抽樣框與動態抽樣框10、獲取各樣本點的單產值11、分層隨機抽樣下的回歸估計量及估計量方差的估計分別回歸估計量適用條件各層的樣本量不太小(大于30),且各層的回歸系數相差較大(可加一個判斷)。
總體均值Y的回歸估計量為y‾lrs=Σh=1LWhy‾lrh=Σh=1LWh(y‾h+βh(X‾h-x‾h))]]>通常βh未知,可用樣本回歸系數bh作為βh的估計bh=Σi=1nh(yhi-y‾h)(xhi-x‾h)Σi=1nh(xhi-x‾h)2]]>這時,分別回歸估計量是有偏的,但當每一層的樣本量nh都較大時,估計的偏倚可以忽略,其方差的樣本估計為v(y‾lrs)=Σh=1LWh2(1-fh)nhseh2]]>式中,seh2=1nh-2Σi=1nh((yhi-y‾h)-bh(xhi-x‾h))2]]>fh=nhNh]]>聯合回歸估計適用條件各層的樣本量不太大(小于30),且各層的回歸系數大致相同(可加一個判斷)。
總體均值Y的回歸估計量為y‾lrc=y‾st+β(X‾-x‾st)=Σh=1LWhy‾h+β(X‾-Σh=1Lx‾h)]]>當回歸系數未知時,取β為bc=ΣhWh2(1-fh)nh(nh-1)Σi=1nh(yhi-y‾h)(xhi-x‾h)ΣhWh2(1-fh)nh(nh-1)Σi=1nh(xi-x‾)2=ΣhWh2(1-fh)nhsyxhWh2(1-fh)nhsxh2]]>這時聯合回歸估計是有偏的,但當樣本量n較大時,估計量的偏倚趨于零,回歸估計是漸進無偏的,且方差的樣本估計量為v(y‾lrc)=ΣhWh2(1-fh)nh(syh2+bc2Sxh2-2bcsyxh)]]>12、檢察是否需要再抽樣本,如果需要,則按前述方法將補充的樣本分配到各層比較r的值是否達到了10%,V=(dt)2=(rY‾t)2.]]>。如果沒有,則需補充樣本量,使得總的樣本量為n=s12V(1+2n1)]]>其中s12=ΣWhseh2=ΣWh1nh-2Σi=1nh((yhi-y‾h)-bh(xhi-x‾h))2,]]>,或者,s12=ΣWh(syh2+bc2Sxh2-2bcsyxh).]]>。n1是第3步所確定的樣本量。
13、推斷總體總值的置信限為Y‾^±uα2v(Y‾^)]]>
權利要求
1.一種以遙感為數據源,采用分層回歸抽樣技術,估計農作物單產和森林單位面積蓄積量的方法,其特征在于(1)抽樣框的確定a、結合土地利用圖和遙感影像,提取農作物或森林的覆蓋區域;b、從覆蓋區域中剔除包括不同地物類型的混合像元;c、對于完全覆蓋某種農作物或森林的純像元,選取750m×750m的網格(3×3像元),作為抽樣總體;(2)分層標志的選擇要選擇恰當的變量作為分層標志,最好采用每個網格內研究對象的單產值,但這些數據根本無法精確獲得;本技術方案選擇一個與調查指標有較大線性相關的無量綱數為分層標志;具體做法如下a、利用遙感影像獲得能反映農作物單產或森林單位面積蓄積量的參數;b、收集影響農作物單產或森林蓄積量的關鍵因子;c、對每個網格,將參數和關鍵因子相乘合成一個新的無量綱的數;d、按每個網格內的無量綱數進行分層;(3)確定分層抽樣的層數對總體盡可能多地進行分層時,能夠使得層內差異降低,抽樣效率得到提高;但是同時還需要考慮到層數增加時估計量方差的下降速度;理論和實踐表明,當層數增加到一定的時候,在精度上的收益將非常小,除非研究變量與輔助變量的相關系數大于0.95,層數一般不超過6為宜;(4)按 的累積值確定層距設分層的輔助變量X表示每個網格內研究對象的無量綱數;按照Dalenius和Hodges提出的快速近似確定層界的方法確定最優分層點;具體來說,首先把無量綱數從小到大排列,按一個較小區間分組,然后分別統計各組內網格的數目f(x),計算各組的 并累加,求出總的累加值;假設劃分為6層,按等距劃分,確定每層的跨度并以x為標度的各層的分界值;(5)對研究對象編制每層內部的關于無量綱數的抽樣框(6)計算Nh、Wh、Xh、Sh2、XNh表示每個層內有多少個無量綱數值;Wh表示該層的權重,X和Xh分別表示總體無量綱數的均值和每層無量綱數的均值,Sh2表示該層的方差;Wh=NhN]]>X‾h=1NhΣj=1NhXhj]]>Sh2=1Nh-1Σj=1Nh(Xhj-X‾h)2]]>X‾=1NΣh=1LNhX‾h]]>(7)計算樣本量因為無量綱數和單產間存在很強的相關性,可以用無量綱數的均值和方差來估算所要抽取的樣本量;當d=0.05,r=0.1,t=1.96,V=(dt)2=(rX‾t)2]]>給定時,按比例分配先計算n0=ΣWhSh2V]]>其中,X‾h=1NhΣj=1Nhxhj]]>Sh2=1Nh-1Σj=1Nh(xhj-X‾h)2]]>如果,n0N<0.05,]]>則就取n0,否則對n0進行修正n=n01+n0N]]>每層的Sh2已知時,按Neyman分配法確定的樣本量n0=(ΣWhSh)2V]]>n=n01+n0N]]>(8)各層樣本量的確定比例分配nh=NhNn]]>Neyman分配nh=WhShΣh=1LWhShn]]>(9)盡量選取離公路較近的抽樣單元,建立靜態抽樣框與動態抽樣框(10)獲取各樣本點的單產值(11)分層隨機抽樣下的回歸估計量及估計量方差的估計分別回歸估計量適用條件各層的樣本量不太小(大于30),且各層的回歸系數相差較大(可加一個判斷);總體均值Y的回歸估計量為y‾lrs=Σh=1LWhy‾lrh=Σh=1LWh(y‾h+βh(X‾h-x‾h))]]>通常βh未知,可用樣本回歸系數bh作為βh的估計bh=Σi=1nh(yhi-y‾h)(xhi-x‾h)Σi=1nh(xhi-x‾h)2]]>這時,分別回歸估計量是有偏的,但當每一層的樣本量nh都較大時,估計的偏倚可以忽略,其方差的樣本估計為v(y‾lrs)=Σh=1LWh2(1-fh)nhseh2]]>式中,seh2=1nh-2Σi=1nh((yhi-y‾h)-bn(xhi-x‾h))2]]>fh=nhNh]]>聯合回歸估計適用條件各層的樣本量不太大(小于30),且各層的回歸系數大致相同(可加一個判斷);總體均值Y的回歸估計量為y‾lrc=y‾st+β(X‾-x‾st)=Σh=1LWhy‾h+β(X‾-Σh=1Lx‾h)]]>當回歸系數未知時,取β為bc=ΣhWh2(1-fh)nh(nh-1)Σi=1nh(yhi-y‾h)(xhi-x‾h)ΣhWh2(1-fh)nh(nh-1)Σi=1nh(xi-x‾)2=ΣhWh2(1-fh)nhsyxhWh2(1-fh)nhsxh2]]>這時聯合回歸估計是有偏的,但當樣本量n較大時,估計量的偏倚趨于零,回歸估計是漸進無偏的,且方差的樣本估計量為v(y‾lrc)=ΣhWh2(1-fh)nh(syh2+bc2Sxh2-2bcsyxh)]]>(12)檢察是否需要再抽樣本,如果需要,則按前述方法將補充的樣本分配到各層比較r的值是否達到了10%,V=(dt)2=(rY‾t)2;]]>如果沒有,則需補充樣本量,使得總的樣本量為n=s12V(1+2n1)]]>其中s12=ΣWhseh2=ΣWh1nh-2Σi=1nh((yhi-y‾h)-bh(xhi-x‾h))2,]]>或者,s12=ΣWh(syh2+bc2Sxh2-2bcsyxh);]]>n1是第3步所確定的樣本量;(13)推斷總體總值的置信限為Y‾^±uα2v(Y‾^)]]>
全文摘要
一種以遙感為數據源,采用分層回歸抽樣技術,估計農作物單產和森林單位面積蓄積量的方法,主要應用于遙感工程、農業工程、林業工程和統計領域。以新一代MODIS遙感影像為數據源,提取能夠反映農作物和森林長勢的參數;結合影響農作物單產和森林單位面積蓄積量的關鍵因子,構造一個無量綱數作為分層依據;采用750m*750m的空間數據為抽樣基本單元,引入分層回歸遙感抽樣技術,從而對農作物單產和森林單位面積蓄積量進行估計。可以應用于估計農作物單產和森林單位面積蓄積量。
文檔編號G01B21/28GK1651859SQ200410046260
公開日2005年8月10日 申請日期2004年6月8日 優先權日2004年6月8日
發明者趙彥云, 王汶, 鐘衛, 王作成, 郝志敏 申請人:趙彥云