一種基于改進YOLOv5模型的無人駕駛道路行人識別方法

文檔序號：39329262發布日期：2024-09-10 11:35閱讀：13來源：國知局

本發明涉及行人檢測識別，尤其是涉及一種基于改進yolov5模型的無人駕駛道路行人識別方法。

背景技術：

1、據研究顯示，無人駕駛技術有助于增強道路交通的安全性，減輕城市的交通壓力，提升出行的效率，并降低駕駛員的入門標準。無人駕駛技術的核心研究內容可以概述為三個部分：環境感知、行為決策和車輛控制。在智能交通的發展中，道路行人檢測是比較重要的環節。行人檢測是后續任務的基礎，因此提高行人檢測算法的檢測精度有很高的研究價值。

2、在行人檢測的過程中，由于檢測圖像中存在相互遮擋、背景環境復雜、行人目標較小等問題，導致檢測過程中常常出現漏檢、誤檢的現象。目前，行人檢測算法有兩個分支，一種是基于手工提取特征的傳統目標檢測算法；另一種是基于深度學習的目標檢測算法。其中，傳統目標檢測算法采用人工特征提取的方法，其技術要點在于通過特殊算法對圖像中的某些鮮明特征進行特征提取，并進行檢測，這種方法只能識別特定的特征，若要改變識別對象，則需要重新設計特征提取算子，存在泛化能力差、魯棒性差等問題。基于深度學習的目標檢測算法中，考慮到檢測精度和檢測速度，yolo算法在檢測精度相差不大的基礎上，速度得到很大提升，比如yolov5是工業界常用的一種目標檢測模型，具有速度快、精度高的特征，yolov5的設計是針對各種尺度的通用目標的監測。但yolov5由于是為通用目標檢測設計的，當直接用于小目標(小目標通常指占圖像寬或圖像高的比例小于某個閾值的目標，比如該閾值可以是10％或20％等等)的檢測時，其速度和精度都大打折扣，無法準確、高效地進行小目標行人檢測。

技術實現思路

1、本發明的目的就是為了克服上述現有技術存在的缺陷而提供一種基于改進yolov5模型的無人駕駛道路行人識別方法，能夠解決背景環境復雜、行人目標較小導致檢測過程中出現漏檢、誤檢的問題，提高小目標行人檢測的準確性和速度。

2、本發明的目的可以通過以下技術方案來實現：一種基于改進yolov5模型的無人駕駛道路行人識別方法，包括以下步驟：

3、s1、針對yolov5模型進行改進，引入repgfpn(region?proposal-based?globalfeature?pyramid?network，基于區域選擇的全局特征金字塔網絡)改進yolov5的頸部結構，在特征融合階段，添加自適應融合機制，引入simam(simple?parameter-freeattention?module，簡單無參數注意力機制)注意力模塊，并優化損失函數；

4、s2、利用圖像數據集對改進后的yolov5模型進行訓練測試，得到小目標行人檢測模型；

5、s3、將待檢測圖像輸入小目標行人檢測模型，輸出得到小目標行人檢測結果。

6、進一步地，所述步驟s1具體包括以下步驟：

7、s11、在yolov5模型的頸部引入repgfpn，以充分交換高級語義信息和低級空間信息，更好地融合不同尺度的特征圖；

8、s12、通過自適應融合模塊，引入simam，利用上下文信息，增強小尺度行人的特征；

9、s13、使用ota(optimal?transport?assignment，最佳傳輸分配)優化損失函數，提高道路行人的檢測精度。

10、進一步地，所述步驟s11具體包括以下步驟：

11、s111、在特征融合階段，采用不同通道尺寸的不同比例特征映射的設置，通過控制不同尺度的通道數量，以提高特征融合精度；

12、s112、特征融合塊中，用cspnet(channel-wise?spatial?pyramid?network，通道式空間金字塔網絡)代替原來基于3×3的卷積的特征融合，通過引入重參數化機制和高效層聚合網絡的連接，對cspnet進行升級，在不增加額外的計算負擔的情況下，實現更高的精度。

13、進一步地，所述步驟s12中simam通過推斷特征圖中的三維注意力權重來工作，不需要向原始網絡添加參數，能同時關注對待每個通道及空間位置特征的重要性。

14、進一步地，所述步驟s13中使用ota優化損失函數，具體是從全局的層面上實現卷積網絡中一對多的分配問題，將標簽分配問題變成一個最優運輸問題。

15、進一步地，所述ota優化損失函數的具體工作過程為：

16、假設有m個真值目標gt，n個錨框anchor、即所有fpn層的anchor之和，將gt看作正標簽的供貨商，用于供應標簽，能夠對k個anchor供應正標簽，也就是每個gt對k個anchor負責(si＝k,i＝1,2,...,m)，將anchor看作需求方，其需要一個標簽(dj＝1,j＝1,2,...,n)，將一個正標簽從gti傳遞到anchoraj的花費為cfg，該花費就是分類損失和回歸損失的加權和，是所有gt和所有anchor分別點對點求的loss之和，計算公式為：

17、

18、除正標簽外，針對anchor是負標簽的情況，引入一個供應商——背景，用于提供負標簽，標準的ot問題中，供貨商和需求方的數量是一樣的，所以，背景提供的負標簽的數量為n-m×k，將一個負標簽從背景傳遞到anchoraj的花費為cbg，只有分類損失，計算公式為：

19、

20、每個供應商負責的anchor個數為si，以m為區分，m+1表示的就是背景，計算公式為：

21、

22、有成本、供應商、需求方后，使用sinkho-rn-knopp迭代得到最優傳輸計劃π*，得到π*之后，將每個anchor分配到能給他供貨最多、即提供標簽數量最多的gt，由此實現最優標簽分配。

23、進一步地，所述步驟s2具體是利用city?persons數據集對改進后的yolov5模型進行訓練測試。

24、進一步地，所述步驟s2具體是在深度學習框架pytorch下進行模型的構建、訓練和部署。

25、一種計算機設備，包括存儲器和處理器，所述存儲器存儲有計算機程序，所述處理器執行所述計算機程序時實現上述基于改進yolov5模型的無人駕駛道路行人識別方法的步驟。

26、一種計算機可讀存儲介質，其上存儲有計算機程序，所述計算機程序被處理器執行時實現上述基于改進yolov5模型的無人駕駛道路行人識別方法的步驟。

27、與現有技術相比，本發明具有以下優點：

28、本發明通過改進yolov5算法，引入repgfpn改進yolov5的頸部結構，能夠充分交換高級語義信息和低級空間信息，更好地融合不同尺度的特征圖；在特征融合階段，添加自適應融合機制，引入simam注意力模塊，利用上下文信息，增強小尺度行人的特征，使網絡更關注行人目標；同時使用ota優化損失函數，使得模型的行人檢測更加準確。由此在針對業務場景的待檢測目標為小目標時，能夠實現更高的精度和魯棒性，在小目標行人檢測過程中取得更好的精度和速度。

技術特征：

1.一種基于改進yolov5模型的無人駕駛道路行人識別方法，其特征在于，包括以下步驟：

2.根據權利要求1所述的一種基于改進yolov5模型的無人駕駛道路行人識別方法，其特征在于，所述步驟s1具體包括以下步驟：

3.根據權利要求2所述的一種基于改進yolov5模型的無人駕駛道路行人識別方法，其特征在于，所述步驟s11具體包括以下步驟：

4.根據權利要求2所述的一種基于改進yolov5模型的無人駕駛道路行人識別方法，其特征在于，所述步驟s12中simam通過推斷特征圖中的三維注意力權重來工作，不需要向原始網絡添加參數，能同時關注對待每個通道及空間位置特征的重要性。

5.根據權利要求2所述的一種基于改進yolov5模型的無人駕駛道路行人識別方法，其特征在于，所述步驟s13中使用ota優化損失函數，具體是從全局的層面上實現卷積網絡中一對多的分配問題，將標簽分配問題變成一個最優運輸問題。

6.根據權利要求5所述的一種基于改進yolov5模型的無人駕駛道路行人識別方法，其特征在于，所述ota優化損失函數的具體工作過程為：

7.根據權利要求1所述的一種基于改進yolov5模型的無人駕駛道路行人識別方法，其特征在于，所述步驟s2具體是利用city?persons數據集對改進后的yolov5模型進行訓練測試。

8.根據權利要求1所述的一種基于改進yolov5模型的無人駕駛道路行人識別方法，其特征在于，所述步驟s2具體是在深度學習框架pytorch下進行模型的構建、訓練和部署。

9.一種計算機設備，包括存儲器和處理器，所述存儲器存儲有計算機程序，其特征在于，所述處理器執行所述計算機程序時實現如權利要求1～8任一所述基于改進yolov5模型的無人駕駛道路行人識別方法的步驟。

10.一種計算機可讀存儲介質，其上存儲有計算機程序，其特征在于，所述計算機程序被處理器執行時實現如權利要求1～8任一所述基于改進yolov5模型的無人駕駛道路行人識別方法的步驟。

技術總結
本發明涉及一種基于改進YOLOv5模型的無人駕駛道路行人識別方法，包括：針對YOLOv5模型進行改進，具體是引入RepGFPN改進YOLOv5的頸部結構，充分交換高級語義信息和低級空間信息，更好地融合不同尺度的特征圖；在特征融合階段，添加自適應融合機制，引入SimAM注意力模塊，利用上下文信息，增強小尺度行人的特征；并使用OTA優化損失函數，提高道路行人的檢測精度；之后利用圖像數據集對改進后的YOLOv5模型進行訓練測試，得到小目標行人檢測模型；將待檢測圖像輸入小目標行人檢測模型，輸出得到小目標行人檢測結果。與現有技術相比，本發明能夠解決背景環境復雜、行人目標較小導致檢測過程中出現漏檢、誤檢的問題，提高小目標行人檢測的準確性和速度。

技術研發人員：韓文花,王亞鵬
受保護的技術使用者：上海電力大學
技術研發日：
技術公布日：2024/9/9

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：韓文花,王亞鵬
技術所有人：上海電力大學
我是此專利的發明人

上一篇：一種井下聲信號模擬器及其應用方法
上一篇：一種軟件包翻譯方法及計算設備與流程

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯網安全、大數據安全 2.安全態勢感知、輿情分析和控制 3.區塊鏈及應用
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！