1.一種圖像自動標注方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種圖像自動標注方法,其特征在于,所述多模態大模型包括卷積層、注意力模塊、空間金字塔池化層、特征融合層以及全連接層,所述卷積層用于提取輸入圖像的第一圖像特征,所述注意力模塊用于基于通道注意力機制和空間注意力機制對所述第一圖像特征進行特征加強得到第二圖像特征,所述空間金字塔池化層用于對所述第二圖像特征進行不同尺度的池化操作得到多尺度圖像特征,所述特征融合層用于對所述多尺度圖像特征進行特征融合得到多模態融合特征,所述全連接層用于根據所述多模態融合特征輸出對應的圖像標注結果。
3.根據權利要求1所述的一種圖像自動標注方法,其特征在于,所述將所述標注數據集輸入到所述多模態大模型,得到訓練好的圖像標注模型,其具體包括:
4.根據權利要求1所述的一種圖像自動標注方法,其特征在于,所述將所述初始描述語句拆解為多個最小化問句,其具體為:
5.根據權利要求1所述的一種圖像自動標注方法,其特征在于,所述將所述目標圖像和所述最小化問句輸入到所述圖像標注模型,得到各所述最小化問句對應的目標標注結果,其具體包括:
6.根據權利要求5所述的一種圖像自動標注方法,其特征在于,所述根據所述目標標注結果對所述最小化問句進行篩選和內容重組,得到所述目標圖像的目標描述語句,其具體包括:
7.根據權利要求1至6中任一項所述的一種圖像自動標注方法,其特征在于,所述根據所述目標標注結果對所述最小化問句進行篩選和內容重組之前,還包括:
8.一種圖像自動標注系統,其特征在于,包括:
9.一種電子設備,其特征在于,所述電子設備包括存儲器、處理器、存儲在所述存儲器上并可在所述處理器上運行的程序以及用于實現所述處理器和所述存儲器之間的連接通信的數據總線,所述程序被所述處理器執行時實現如權利要求1至7中任一項所述的圖像自動標注方法的步驟。
10.一種存儲介質,所述存儲介質為計算機可讀存儲介質,用于計算機可讀存儲,其特征在于,所述存儲介質存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執行,以實現如權利要求1至7中任一項所述的圖像自動標注方法的步驟。