一種基于搜索引擎的重復報警識別方法和系統的制作方法
【專利摘要】本發明涉及一種基于搜索引擎的重復報警識別方法和系統,所述方法包括以下步驟:S1、構建GIS地址庫;S2、設定事發要素權重值及重復報警閾值;S3、基于搜索引擎在GIS地址庫匹配最相似的事發地址地圖坐標,將匹配度最高的地址庫地圖坐標賦值給當前事發地址地圖坐標;S4、確定事發地址覆蓋范圍半徑r,根據事發地址地圖坐標計算Δt時期內覆蓋半徑范圍內的報警信息;S5、基于步驟S4的查詢結果,將當前報警信息的事發要素與查詢結果的事發要素通過搜索引擎及分詞技術計算匹配度,比較匹配度與閾值,匹配度高于閾值的報警則提示當前報警可能為重復報警,并將對應報警信息對比展示。能夠識別有效重復報警,識別準確率較高,能夠提高接處警效率。
【專利說明】
一種基于搜索引擎的重復報警識別方法和系統
技術領域
[0001]本發明涉及公安、醫療接警領域,更具體的說,是涉及一種基于搜索引擎的重復報警識別方法和系統。
【背景技術】
[0002]現有重復信息識別的方法主要是對單要素文本進行分詞計算匹配度,而沒有對多要素分詞匹配計算信息綜合匹配度,導致匹配度不高。且現有重復信息識別的方法沒有涉及時間、空間的匹配處理。對于公安、醫療接警領域,時間、空間是很重要的要素,對于時間、空間的匹配處理能夠大大提到重復信息識別的準確率。
[0003]在公安、醫療接警領域,目前能夠給接警員提供識別有效重復警情的工具幾乎沒有,識別重復警情更多的依賴于人的經驗及運氣,重復警情識別率低,導致接警、派警、處警各環節處理重復警情時均存在人力資源浪費的情況。如何通過智能方法有效識別重復警情,減少資源浪費,提高接處警效率,成為亟待解決的問題。
【發明內容】
[0004]有鑒于此,有必要針對上述問題,提供一種基于搜索引擎的重復報警識別方法和系統,能夠識別有效重復報警,識別準確率較高,能夠提高接處警效率。
[0005]為了實現上述目的,本發明的技術方案如下:
[0006]—種基于搜索引擎的重復報警識別方法,包括以下步驟:
[0007]S1、構建GIS地址庫;
[0008]S2、設定事發要素權重值及重復報警閾值;
[0009]S3、基于搜索引擎在GIS地址庫匹配最相似的事發地址地圖坐標,將匹配度最高的地址庫地圖坐標賦值給當前事發地址地圖坐標;
[0010]S4、確定事發地址覆蓋范圍半徑r,根據事發地址地圖坐標計算At時期內覆蓋半徑范圍內的報警信息;
[0011]S5、基于步驟S4的查詢結果,將當前報警信息的事發要素與查詢結果的事發要素通過搜索引擎及分詞技術計算匹配度,比較匹配度與閾值,匹配度高于閾值的報警則提示當前報警可能為重復報警,并將對應報警信息對比展示。
[0012]作為優選的,在步驟S2中,所述事發要素包括事發地址、事發時間、事發類型、報警人姓名、報警人電話、報警描述。
[0013]作為優選的,所述步驟S3具體包括:將事發地址進行分詞,并通過搜索引擎將分詞結果與GIS地址庫地址進行匹配,將匹配度最高的地址庫地圖坐標賦值給當前事發地址地圖坐標。
[0014]作為優選的,所述步驟S4中,一定時期At內覆蓋半徑范圍內的報警信息滿足的條件為:
[0015]事發時間tl一待查詢的事發時間t2〈 Δ t
[0016](事發地址坐標經度1n—待查詢的事發地址坐標經度x)2+(事發地址坐標瑋度Iat—待查詢的事發地址坐標瑋度y)2〈事發地址覆蓋范圍半徑r2(距離轉換為經瑋度單位)。
[0017]作為優選的,所述步驟S2中,根據事發要素屬性及批量數據實驗確定各要素權重值(vl ,v2,v3...vN),閾值Vmin。
[0018]作為優選的,所述步驟S5具體包括:將當前報警信息的事發要素與查詢結果的事發要素通過搜索引擎及分詞技術計算匹配度,得到各要素匹配度(ml,m2,m3...mN),與每條報警信息匹配度(vl*ml,v2*m2,v3*m3...vN*mN),匹配度與閾值Vmin進行比較,大于Vmin的報警信息則提示為可能重復報警。
[0019]作為優選的,所述事發各要素匹配度計算報警信息匹配度與閾值比較的過程包括:
[0020]vl*ml+v2*m2+v3*m3...+vN*mN>Vmin。
[0021 ]作為優選的,還包括步驟S6:
[0022]將當前報警信息與識別的重復報警信息對比展示,進行人工二次確認。
[0023]—種根據上述方法進行重復報警識別的系統,包括報警模塊和重復報警識別模塊,所述報警模塊包括接警系統客戶端和接警系統數據庫;所述重復報警識別模塊包括地址庫、分詞工具、搜索引擎、比較判斷單元;
[0024]所述接警系統客戶端用于將報警數據錄入到接警系統數據庫;所述接警系統數據庫用于存儲報警數據;
[0025]所述地址庫用于構建GIS地址庫;所述分詞工具用于對關鍵詞進行自動分詞;所述搜索引擎用于將分詞結果進行匹配,并計算匹配度;
[0026]所述比較判斷單元用于設置閾值,將匹配度與閾值進行比較,并大于閾值的報警信息則提示為可能重復報警信的信息。
[0027]作為優選的,所述重復報警模塊還包括一顯示單元,用于顯示識別為可能重復報警的報警信息。
[0028]與現有技術相比,本發明的有益效果在于:本發明結合GIS地址庫,分詞匹配賦予事發地址地圖坐標,而不依賴于報警人必須提供GPS坐標信息,根據事發各要素計算當前報警信息與歷史報警信息的匹配度與閾值的比較,給接警員提供是否為重復警情的有效參考,能夠有效的識別是否為重復警情,提高接處警效率。
【附圖說明】
[0029]圖1為本發明實施例的方法流程圖;
[0030]圖2為本發明實施例系統結構框圖。
【具體實施方式】
[0031]下面結合附圖和實施例對本發明所述的一種基于搜索引擎的重復報警識別方法和系統作進一步說明。
[0032]以下是本發明所述的一種基于搜索引擎的重復報警識別方法和系統的最佳實例,并不因此限定本發明的保護范圍。
[0033]圖1示出了一種基于搜索引擎的重復報警識別方法,包括以下步驟:
[0034]S1、構建GIS(Geographic Informat1n System,,地理信息系統)地址庫;在本實施例中,GIS地址庫數據來源有以下幾種方式:公安標準地址庫、高德或其他GIS廠家地址庫、自主學習的地址,根據事發地址人工定位后自動歸入地址庫。
[0035]S2、設定事發要素權重值及重復報警閾值;
[0036]S3、基于搜索引擎在GIS地址庫匹配最相似的事發地址地圖坐標,將匹配度最高的地址庫地圖坐標賦值給當前事發地址地圖坐標;
[0037]S4、確定事發地址覆蓋范圍半徑r,根據事發地址地圖坐標計算At時期內覆蓋半徑范圍內的報警信息;
[0038]S5、基于步驟S4的查詢結果,將當前報警信息的事發要素與查詢結果的事發要素通過搜索引擎及分詞技術計算匹配度,比較匹配度與閾值,匹配度高于閾值的報警則提示當前報警可能為重復報警,并將對應報警信息對比展示。分詞工具可選擇HTTPCWS、IKAnalyzer等。搜索引擎,也有多種可以選擇,如Solr、Elasticsearch等
[0039]作為優選的,在步驟S2中,所述事發要素包括事發地址、事發時間、事發類型、報警人姓名、報警人電話、報警描述。
[0040]作為優選的,所述步驟S3具體包括:將事發地址進行分詞,并通過搜索引擎將分詞結果與GIS地址庫地址進行匹配,將匹配度最高的地址庫地圖坐標賦值給當前事發地址地圖坐標。
[0041]作為優選的,所述步驟S4中,事發地址坐標經瑋度(lon,lat),待查詢的事發地址坐標經瑋度(x,y),事發時間tl,待查詢的事發時間t2,一定時期范圍At,計算滿足條件的歷史報警信息。一定時期At內覆蓋半徑范圍內的報警信息滿足的條件為:
[0042]tl—t2<At
[0043](1n—x)2+(lat—y)2〈r2(距離轉換為經瑋度單位)。
[0044]作為優選的,所述步驟S2中,根據事發要素屬性及批量數據實驗確定各要素權重值(vl ,v2,v3...vN),閾值Vmin。
[0045]作為優選的,所述步驟S5具體包括:將當前報警信息的事發要素與查詢結果的事發要素通過搜索引擎及分詞技術計算匹配度,得到各要素匹配度(ml,m2,m3...mN),與每條報警信息匹配度(vl*ml,v2*m2,v3*m3...vN*mN),匹配度與閾值Vmin進行比較,大于Vmin的報警信息則提示為可能重復報警。
[0046]作為優選的,所述事發各要素匹配度計算報警信息匹配度與閾值比較的過程包括:
[0047]vl*ml+v2*m2+v3*m3...+vN*mN>Vmin;其中各要素匹配度(ml,m2,m3...mN)值的獲取是基于搜索引擎對各要素分詞后的結果進行計算得到。
[0048]作為優選的,還包括步驟S6:
[0049]將當前報警信息與識別的重復報警信息對比展示,進行人工二次確認。
[0050]圖2示出了一種根據上述方法進行重復報警識別的系統,包括報警模塊和重復報警識別模塊,所述報警模塊包括接警系統客戶端和接警系統數據庫;所述重復報警識別模塊包括地址庫、分詞工具、搜索引擎、比較判斷單元;
[0051]所述接警系統客戶端用于將報警數據錄入到接警系統數據庫;所述接警系統數據庫用于存儲報警數據;
[0052]所述地址庫用于構建GIS地址庫;所述分詞工具用于對關鍵詞進行自動分詞;所述搜索引擎用于將分詞結果進行匹配,并計算匹配度;
[0053]所述比較判斷單元用于設置閾值,將匹配度與閾值進行比較,并大于閾值的報警信息則提示為可能重復報警信的信息。
[0054]作為優選的,所述重復報警模塊還包括一顯示單元,用于顯示識別為可能重復報警的報警信息,可以將當前報警信息與識別的重復報警信息對比展示,進行人工二次確認。
[0055]與現有技術相比,本發明的有益效果在于:本發明結合GIS地址庫,分詞匹配賦予事發地址地圖坐標,而不依賴于報警人必須提供GPS坐標信息,根據事發各要素計算當前報警信息與歷史報警信息的匹配度與閾值的比較,給接警員提供是否為重復警情的有效參考,能夠有效的識別是否為重復警情,提高接處警效率。
[0056]以上所述實施例僅表達了本發明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發明專利范圍的限制。應當指出的是,對于本領域的普通技術人員來說,在不脫離本發明構思的前提下,還可以做出若干變形和改進,這些都屬于本發明的保護范圍。因此,本發明專利的保護范圍應以所附權利要求為準。
【主權項】
1.一種基于搜索引擎的重復報警識別方法,其特征在于,包括以下步驟: 51、構建GIS地址庫; 52、設定事發要素權重值及重復報警閾值; 53、基于搜索引擎在GIS地址庫匹配最相似的事發地址地圖坐標,將匹配度最高的地址庫地圖坐標賦值給當前事發地址地圖坐標; 54、確定事發地址覆蓋范圍半徑r,根據事發地址地圖坐標計算At時期內覆蓋半徑范圍內的報警信息; 55、基于步驟S4的查詢結果,將當前報警信息的事發要素與查詢結果的事發要素通過搜索引擎及分詞技術計算匹配度,比較匹配度與閾值,匹配度高于閾值的報警則提示當前報警可能為重復報警,并將對應報警信息對比展示。2.根據權利要求1所述的基于搜索引擎的重復報警識別方法,其特征在于,在步驟S2中,所述事發要素包括事發地址、事發時間、事發類型、報警人姓名、報警人電話、報警描述。3.根據權利要求1所述的基于搜索引擎的重復報警識別方法,其特征在于,所述步驟S3具體包括:將事發地址進行分詞,并通過搜索引擎將分詞結果與GIS地址庫地址進行匹配,將匹配度最高的地址庫地圖坐標賦值給當前事發地址地圖坐標。4.根據權利要求1所述的基于搜索引擎的重復報警識別方法,其特征在于,所述步驟S4中,一定時期A t內覆蓋半徑范圍內的報警信息滿足的條件為: 事發時間tl一待查詢的事發時間t2〈 Δ t (事發地址坐標經度1n—待查詢的事發地址坐標經度x)2+(事發地址坐標瑋度Iat—待查詢的事發地址坐標瑋度y)2〈事發地址覆蓋范圍半徑r2(距離轉換為經瑋度單位)。5.根據權利要求1所述的基于搜索引擎的重復報警識別方法,其特征在于,所述步驟S2中,根據事發要素屬性及批量數據實驗確定各要素權重值(vl,v2,v3...vN),閾值Vmin。6.根據權利要求5所述的基于搜索引擎的重復報警識別方法,其特征在于,所述步驟S5具體包括:將當前報警信息的事發要素與查詢結果的事發要素通過搜索引擎及分詞技術計算匹配度’得到各要素匹配度^^^…^^^與每條報警信息匹配度…*!!!^*!^^*m3...vN*mN),匹配度與閾值Vmin進行比較,大于Vmin的報警信息則提示為可能重復報警。7.根據權利要求6所述的基于搜索引擎的重復報警識別方法,其特征在于,所述事發各要素匹配度計算報警信息匹配度與閾值比較的過程包括: vl*ml+v2*m2+v3*m3...+vN*mN>Vmin。8.根據權利要求6所述的基于搜索引擎的重復報警識別方法,其特征在于,還包括步驟S6: 將當前報警信息與識別的重復報警信息對比展示,進行人工二次確認。9.一種根據權利要求1至8任一所述的方法進行重復報警識別的系統,其特征在于,包括報警模塊和重復報警識別模塊,所述報警模塊包括接警系統客戶端和接警系統數據庫;所述重復報警識別模塊包括地址庫、分詞工具、搜索引擎、比較判斷單元; 所述接警系統客戶端用于將報警數據錄入到接警系統數據庫;所述接警系統數據庫用于存儲報警數據; 所述地址庫用于構建GIS地址庫;所述分詞工具用于對關鍵詞進行自動分詞;所述搜索引擎用于將分詞結果進行匹配,并計算匹配度; 所述比較判斷單元用于設置閾值,將匹配度與閾值進行比較,并大于閾值的報警信息則提示為可能重復報警信的信息。10.根據權利要求1所述的重復報警識別系統,其特征在于,所述重復報警模塊還包括一顯示單元,用于顯示識別為可能重復報警的報警信息。
【文檔編號】G06F17/30GK106095967SQ201610436993
【公開日】2016年11月9日
【申請日】2016年6月17日
【發明人】李小龍, 楊波, 賀珊, 張雪瓊
【申請人】武漢烽火眾智數字技術有限責任公司