基于Lucene的光譜曲線檢索方法及引擎的制作方法
【技術領域】
[0001] 本發(fā)明涉及高光譜遙感圖像技術領域,特別涉及一種基于Lucene的光譜曲線檢 索方法及引擎。
【背景技術】
[0002] 遙感的目的是通過對圖像的定性、定量分析,從而深入研宄各種自然環(huán)境要素。其 中,由于組成成份的差異使地物覆蓋形成了可診斷的典型光譜反射特征,從而成為地物光 譜識別的物理基礎。迄今為止各種航空和航天遙感儀的工作波段選擇都與對波譜特性的分 析密切相關。光譜匹配模型將從高光譜圖像上反演的像元光譜與參考光譜進行比對,進而 求算它們之間的相似性或差異性,突出特征譜段,有效地提取光譜維信息,以便對地物特性 進行詳細分析。
[0003] 相關技術中,在光譜匹配方面已經(jīng)有了許多優(yōu)秀的算法旨在提升匹配的準確性, 同時也有許多遙感圖像處理領域的軟件例如ENVI、ERDASIMAGINE、PCIGeomatica都提供 了光譜匹配成熟算法的實現(xiàn)。然而,相關技術中的算法在提升準確性的同時一般忽略了對 匹配速度的要求,并且軟件的擴展性較差,只適合研宄中的光譜分析,對批量處理和進一步 的網(wǎng)絡化云端處理等要求都顯乏力,存在改進的必要。
【發(fā)明內容】
[0004] 本發(fā)明旨在至少在一定程度上解決上述相關技術中的技術問題之一。
[0005] 為此,本發(fā)明的一個目的在于提出一種基于Lucene的光譜曲線檢索方法,該方法 能加快讀物文件速度,提高檢索效率,且簡單便捷。
[0006] 本發(fā)明的另一個目的在于提出一種基于Lucene的光譜曲線檢索引擎。
[0007] 為達到上述目的,本發(fā)明一方面實施例提出了一種基于Lucene的光譜曲線檢索 方法,包括以下步驟:通過Lucene的FSDirectory類打開索引文件夾;選擇索引特征,以利 用所述Lucene對光譜庫中的曲線文件建立索引;調用Lucene的IndexWriter類將建好的 索引寫入到所述索引文件夾中;輸入待檢索文件;以及打開所述索引文件夾,并采用線性 搜索將文件夾中的Document索引文件依次與輸入的特征數(shù)組進行相似度比較,以從所述 索引文件中按所選特征的相似度返回檢索結果。
[0008] 根據(jù)本發(fā)明實施例提出的基于Lucene的光譜曲線檢索方法,通過利用Lucene對 光譜庫中的曲線文件建立索引,在輸入由高光譜像元提取出的光譜曲線之后,從索引文件 中按所選特征的相似度返回檢索結果,實現(xiàn)加快讀取文件速度的目的,不但提高了檢索效 率,而且操作簡單便捷,同時索引的檢索形式適用于嵌入式及云端處理的開發(fā)。
[0009] 另外,根據(jù)本發(fā)明上述實施例的基于Lucene的光譜曲線檢索方法還可以具有如 下附加的技術特征:
[0010] 進一步地,在本發(fā)明的一個實施例中,所述索引特征包括相關性、一階微分相關 性、絕對值、歐氏距離、一階微分絕對值、最小平方、一階微分最小平方中的一個或多個。
[0011] 進一步地,在本發(fā)明的一個實施例中,所述索引可以為特征點索引或全特征索引。
[0012] 進一步地,在本發(fā)明的一個實施例中,所述待檢索文件為由高光譜像元提取出的 光譜曲線或已提取的特征數(shù)組文件,其中,如果為所述光譜曲線文件,則通過所述所選特征 相應計算出字節(jié)數(shù)組;如果為所述已提取的特征數(shù)組文件,則上傳特征名以尋找相應特征 建立的索引文件。
[0013] 進一步地,在本發(fā)明的一個實施例中,相似度評分公式為:
[0017] 其中,a,b為兩組長度為1的特征數(shù)組。
[0018] 本發(fā)明另一方面實施例提出了一種基于Lucene的光譜曲線檢索引擎,包括:開 啟模塊,用于通過Lucene的FSDirectory類打開索引文件夾;建立模塊,用于選擇索引特 征,以利用所述Lucene對光譜庫中的曲線文件建立索引;寫入模塊,用于調用Lucene的 IndexWriter類將建好的索引寫入到所述索引文件夾中;輸入模塊,用于輸入待檢索文件; 以及檢索模塊,用于打開所述索引文件夾,并采用線性搜索將文件夾中的Document索引文 件依次與輸入的特征數(shù)組進行相似度比較,以從所述索引文件中按所選特征的相似度返回 檢索結果。
[0019] 根據(jù)本發(fā)明實施例提出的基于Lucene的光譜曲線檢索引擎,通過利用Lucene對 光譜庫中的曲線文件建立索引,在輸入由高光譜像元提取出的光譜曲線之后,從索引文件 中按所選特征的相似度返回檢索結果,實現(xiàn)加快讀取文件速度的目的,不但提高了檢索效 率,而且操作簡單便捷,同時索引的檢索形式適用于嵌入式及云端處理的開發(fā)。
[0020] 另外,根據(jù)本發(fā)明上述實施例的基于Lucene的光譜曲線檢索引擎還可以具有如 下附加的技術特征:
[0021] 進一步地,在本發(fā)明的一個實施例中,所述索引特征包括相關性、一階微分相關 性、絕對值、歐氏距離、一階微分絕對值、最小平方、一階微分最小平方中的一個或多個。
[0022] 進一步地,在本發(fā)明的一個實施例中,所述索引為特征點索引或全特征索引。
[0023] 進一步地,在本發(fā)明的一個實施例中,所述待檢索文件為由高光譜像元提取出的 光譜曲線或已提取的特征數(shù)組文件,其中,如果為所述光譜曲線文件,則通過所述所選特征 相應計算出字節(jié)數(shù)組;如果為所述已提取的特征數(shù)組文件,則上傳特征名以尋找相應特征 建立的索引文件。
[0024] 進一步地,在本發(fā)明的一個實施例中,相似度評分公式為:
[0028] 其中,a,b為兩組長度為1的特征數(shù)組。
[0029] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【附圖說明】
[0030] 本發(fā)明的上述和/或附加的方面和優(yōu)點從結合下面附圖對實施例的描述中將變 得明顯和容易理解,其中:
[0031] 圖1為根據(jù)本發(fā)明實施例的基于Lucene的光譜曲線檢索方法的流程圖;
[0032] 圖2為根據(jù)本發(fā)明一個實施例的基于Lucene的光譜曲線檢索方法的流程圖;
[0033] 圖3為根據(jù)本發(fā)明一個實施例的索引的操作示意圖;
[0034] 圖4為根據(jù)本發(fā)明一個實施例的基于特征絕對值檢索的結果示意圖;
[0035] 圖5為根據(jù)本發(fā)明一個實施例的基于特征一階微分最小平方檢索的結果示意圖; 以及
[0036] 圖6為根據(jù)本發(fā)明實施例的基于Lucene的光譜曲線檢索引擎的結構示意圖。
【具體實施方式】
[0037] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0038] 此外,術語"第一"、"第二"僅用于描述目的,而不能理解為指示或暗示相對重要性 或者隱含指明所指示的技術特征的數(shù)量。由此,限定有"第一"、"第二"的特征可以明示或 者隱含地包括一個或者更多個該特征。在本發(fā)明的描述中,"多個"的含義是兩個或兩個以 上,除非另有明確具體的限定。
[0039] 在本發(fā)明中,除非另有明確的規(guī)定和限定,術語"安裝"、"相連"、"連接"、"固定"等 術語應做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機 械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,可以是兩個元 件內部的連通。對于本領域的普通技術人員而言,可以根據(jù)具體情況理解上述術語在本發(fā) 明中的具體含義。
[0040] 在本發(fā)明中,除非另有明確的規(guī)定和限定,第一特征在第二特征之"上"