本發明涉及物流倉儲、計算機視覺和自然語言處理領域,具體是一種基于深度學習的快遞信息提取及其分布式表征方法。
背景技術:
1、隨著電子商務的快速發展,快遞行業的業務量急劇增加,如何高效、準確地管理和分發快遞信息成為一個亟待解決的問題。傳統的快遞信息處理方法通常依賴于人工操作,不僅效率低下,而且容易出錯。基于深度學習的目標檢測和光學字符識別(ocr)技術的快速發展,為解決這一問題提供了新的技術手段。
技術實現思路
1、本發明旨在提供一種基于深度學習的快遞信息提取及其分布式表征方法,通過使用yolov5目標檢測網絡和paddleocr光學字符識別技術,實現快遞面單和目標文本區域的高效識別,并將識別到的文本信息數字化,形成統一的數字編碼,以實現快遞信息的自動化管理和高效分發。傳統的快遞信息處理方法通常依賴于人工操作,不僅效率低下,而且容易出錯。
2、一種基于深度學習的快遞信息提取及其分布式表征方法,所述方法包括以下步驟:
3、s1.獲取訓練所需的快遞面單數據集,通過數據增強的方法豐富訓練集,對數據集進行預處理并完成數據標注;
4、s2.使用yolov5目標檢測網絡訓練一種針對快遞面單區域識別的網絡,預測面單位置和旋轉角度;進行檢測模型推理,根據檢測到的位置和角度,對面單進行旋轉目標檢測,輸出面單圖像和面單旋轉角度,將裁切好的面單方向轉正,得到完整的面單區域;
5、s3.使用yolov5目標檢測網絡訓練一種檢測目標文本位置的模型,預測目標文本位置;進行檢測模型推理,根據檢測到的位置,計算出文本區域坐標,得到yolo目標信息框;
6、s4.使用paddleocr光學字符識別技術,識別快遞面單信息,得到paddleocr文字框,基于yolov5的目標識別結果和paddleocr光學字符識別技術的文字識別結果,計算paddleocr文字框坐標與yolo目標信息框坐標的重合度篩選文本信息;
7、s5.建立信息數字化分布式表征方法對所得文本信息進行分類,并存儲在excel表格中;
8、s6.根據所述信息數字化分布式表征方法建立完整的客戶數據庫,數據庫中每個客戶的特征信息包括姓名、地址、電話號碼,并以數字的方式存儲;
9、s7.按照信息數字化分布式表征方法,將識別到的含有文字姓名地址電話號碼等特征的快遞特征信息轉換為數字特征信息,進而將快遞特征信息編成一串有序代碼;當某種快遞面單特征信息未識別到時,編碼將該信息用單字節字符0標識;
10、s8.根據信息數字化分布式表征方法得到的快遞特征信息是一串按照既定順序排列的數字編碼,與數據庫中客戶特征信息對應的數字編碼比對,依次匹配數字地址編碼,數字電話編碼和數字姓名編碼,若均能匹配正確,將此快遞綁定給這位客戶;若未能正確匹配,則將信息錄入客戶數據庫。
11、作為本發明進一步的技術方案,信息數字化分布式表征方法包括:
12、a)識別地址,將文字地址中的各段地址(包括社區,樓宇和戶號)轉換為數字地址,地址是一個8位的數字串;
13、b)識別客戶的電話號碼,電話號碼是一個11位的數字串;
14、c)識別客戶姓名,客戶姓名是一個12位的數字串,按照四角號碼字典對照,一位漢字對應4位數字,組成一個編碼串。
15、作為本發明進一步的技術方案,所述s1中數據集的數據標注包括標注快遞面單區域和面單中有效信息區域兩種,快遞面單區域數據集采集多組不同角度拍攝的帶有面單的快遞,將rgb圖像轉換為640×480分辨率大小,面單中有效信息數據集采集裁剪后的快遞面單,將灰度圖像轉換為640×480分辨率大小,并使用數據增強的方法進行數據增強,數據增強的方法包括旋轉、裁剪、翻轉和噪聲添加;標注快遞面單區域是使用labelme軟件對不同角度拍攝的快遞面單的rgb圖像中的快遞面單區域進行矩形標簽標注,標簽保存格式選擇yolo格式;標注面單中的有效信息區域是使用labelme軟件對裁剪后快遞面單的灰度圖像中的快遞單號和收件人信息進行矩形標簽標注,標簽保存格式選擇yolo格式。
16、作為本發明進一步的技術方案,所述s2中使用yolov5目標檢測網絡訓練得到模型,所述模型對重疊面單、多面單、模糊面單和信息不全的面單及褶皺面單都可以進行有效檢測并裁切提取;面單提取是為了裁切完整的面單區域,首先旋轉面單角度,采用opencv的仿射變換進行初步校正,然后使用朝向分類模型判斷面單朝向,將倒向、左右側向的面單進行最后校正,最后輸出面單均為文字朝上的正向角度;面單信息提取基于yolov5的旋轉目標檢測,對面單進行旋轉目標檢測,根據模型預測的旋轉矩形框裁切完整的面單區域,不包含其它非面單區域;所述s3中訓練的yolov5目標檢測網絡訓練,樣本按照3:1:1的比例劃分訓練集、驗證集和測試集,得到檢測目標文本位置的模型;目標位置檢測是為了框選出圖片中的有效的文本區域信息,包括面單中客戶的姓名、地址、電話以及快遞單號。
17、作為本發明進一步的技術方案,所述s4中使用的paddleocr光學字符識別技術是基于卷積神經網絡的光學字符識別技術,將文字通過光學輸入方式轉化為圖像信息,光學輸入方式包括掃描,再利用文字識別技術將圖像信息轉化為可編輯的計算機文本,通過計算paddleocr框坐標與yolo框坐標的重合度篩選文本信息;計算paddleocr文本框與yolov5文本框的重合度,將重合度達到0.5的paddleocr文本框保留下來,達到對文本信息篩選的目的。
18、作為本發明進一步的技術方案,所述s5中的信息數字化分布式表征方法的預設順序為:從左到右依次為包括社區、樓宇、戶號、電話號碼和姓名;用31位單字節字符形成一段編碼表示一個具體的特征信息,編碼由5段組成,分別是社區代碼段、樓宇代碼段、戶號代碼段、電話代碼段和姓名代碼段,其中社區代碼段由2位單字節字符組成,樓宇代碼段由2位單字節字符組成,戶號代碼段由4位單字節字符組成,電話代碼段由11位單字節字符組成,姓名代碼段由12位單字節字符組成。
19、作為本發明進一步的技術方案,所述s5中的信息數字化分布式表征方法的地址代碼段包括:十分之一地址代碼段、百分之一地址代碼段、千分之一地址段和萬分之一地址代碼段,所述十分之一地址代碼段為所述地址代碼段的第一第二位字符,所述百分之一地址代碼段為所述地址代碼段的第三第四位字符,所述千分之一地址代碼段為片區代碼段的第五第六位字符,所述萬分之一地址代碼段為所述地址代碼段的第七第八位字符。
20、作為本發明進一步的技術方案,所述s6中完整的客戶數據庫是所在社區客戶的數字特征信息,所在社區客戶錄入本人信息,按照信息數字化分布式表征方法將社區客戶特征信息轉化為數字編成的有序代碼,得到的所在社區客戶的特征數字信息。
21、作為本發明進一步的技術方案,所述s7中的快遞特征信息是在快遞投遞時,通過相機拍攝快遞面單,使用基于深度學習的光學字符識別技術獲取快遞面單上的信息,將識別到的快遞面單信息根據信息數字化方法轉換為數字特征信息,數字信息分配實行從前向后逐級分配的原則,形成一串有序代碼,由于外界因素導致面單信息不存在,按照信息數字化方法轉換時,對不存在的信息轉換為數字0,所述外界因素包括快遞面單模糊、重疊、污漬和褶皺。
22、作為本發明進一步的技術方案,所述s8中的信息數字化分布式表征方法得到的快遞特征信息是一串按照既定順序排列的數字編碼,若快遞特征信息與客戶特征信息均匹配正確,則將該快遞綁定給相應的客戶;若未能正確匹配,判斷為快遞所屬客戶的客戶信息未在客戶數據庫中,將此快遞特征信息作為數據庫中客戶特征信息存儲在客戶數據庫中。
23、與現有技術相比,本發明的有益效果是:
24、本發明通過結合yolov5目標檢測網絡和paddleocr光學字符識別技術,實現了快遞面單和目標文本區域的高效識別,并通過信息數字化方法,將識別到的文本信息轉化為統一的數字編碼,實現了快遞信息的自動化管理和高效分發,提高了快遞信息處理的效率和準確性,降低了人工操作的錯誤率。