1.本申請涉及一種用于訓練深度神經網絡的方法和系統,以生成牽引車-拖車組合的路徑,從而最小化或以其他方式減少牽引車和拖車掃過區域的軌道偏離。2.相關技術說明卡車運輸行業已被視為最有希望部署自動駕駛技術的行業。鉸接式結構和較大尺寸的半卡車(牽引車-拖車組合)可能會在沒有適當規劃的情況下導致偏離軌道(即,道路駕駛)。目前用于普通車輛或客運車輛的路徑/軌跡規劃器不考慮超大尺寸,并且可能導致拖車路徑不可行,而復雜的規劃器(例如,基于mpc算法的規劃器)通常需要強大的計算能力才能滿足實時要求。雖然自動駕駛半卡車和自動駕駛客運車在感知、映射和定位以及預測方面的問題基本相同,但由于牽引車-拖車組合(例如,見圖1)的鉸接式結構和系統的大尺寸,在規劃路徑/軌跡時確實會遇到新的挑戰。人類駕駛員在操縱這些牽引車拖車系統時,在轉彎時往往靠車道外側行駛,這是因為拖車往往會掃過轉彎的內側。但是,目前為普通自動駕駛汽車設計的路徑規劃器并沒有考慮這些附接的拖車,并且如果直接應用于自動駕駛半卡車,則可能會導致拖車路徑不可行(即,偏離軌道),尤其在急轉彎時。雖然確實存在諸如基于mpc的路徑規劃算法等數值優化方法,但是這些復雜的規劃器通常需要大量的計算資源才能滿足實時要求。
背景技術:
技術實現思路
1、示例實施例涉及一種用于訓練深度神經網絡的方法和系統,以生成牽引車-拖車組合的路徑,從而最小化或以其他方式減少牽引車和拖車掃過區域的軌道偏離。
2、根據本披露內容的實施例的一方面,提供了一種訓練神經網絡的方法,該方法在推斷時可以相對快速地生成可行路徑,其目的是最小化牽引車和拖車掃過區域的軌道偏離,并且避免與靜態障礙物發生碰撞。當人類駕駛員規劃這種低級路徑或軌跡時,并不總是涉及復雜縝密的計算,在大多數情況下,規劃是根據駕駛員過去的經驗或直覺中相當快地做出的。
3、根據本申請的實施例的一方面,提供了一種ai路徑規劃器,該ai路徑規劃器具有編碼器-解碼器架構,該編碼器-解碼器架構生成自動駕駛半卡車的可行路徑,以最小化牽引車和拖車掃過區域的軌道偏離,并且同時避免與靜態障礙物發生碰撞。
4、根據本申請的實施例的一方面,提供了一種路徑成本函數,該路徑成本函數從絕對、客觀的角度評估路徑的“真正”成本,并且使用該成本來指導ai路徑規劃器的訓練。這消除了收集/擴充專家駕駛數據的需要,并且使得能夠用完全偽造的數據進行訓練。
5、根據本申請的實施例的一方面,提供了一種方法,其中,使用牽引車-拖車系統的運動學模型從給定的牽引車路徑推斷出對應的拖車路徑,該運動學模型在構建路徑成本函數中發揮了關鍵作用。
6、[牽引車-拖車系統的路徑規劃]
7、該領域的文獻主要側重于牽引車-拖車系統的越野或非結構化駕駛。經典運動規劃方法可以大致分為三個類別:基于圖搜索(例如,混合a*)的、增量采樣和搜索(例如,快速探索隨機樹或rrt),以及基于優化(例如,模型預測控制或mpc)的,采用并擴展這些方法,以在考慮所附拖車的大小和動力學的條件下解決這個新問題。
8、對于牽引車-拖車系統的道路或結構化駕駛,文獻中僅存在少數研究系統路徑規劃的論文,所有這些論文都是基于優化的。在一篇論文中,路徑規劃問題被表述為非線性最優控制問題(ocp),而控制目標是最小化車輛車身掃過區域的軌道偏離,并且避免與障礙物發生碰撞。然后,使用序列二次規劃(sqp)方法來解決ocp問題。
9、[使用深度學習的運動規劃]
10、雖然將深度學習技術應用于自動駕駛問題的大部分工作都集中在感知上,但近年來深度學習在預測和規劃方面的應用也越來越多。運動規劃的最具代表性的兩種深度學習范例是模仿學習和深度強化學習。
11、模仿學習的理念是經由監督式學習來復制一些駕駛專家(通常是人類駕駛員)的駕駛行為。但是,即使具有大量的專家駕駛數據,單純模仿不足以處理復雜的駕駛場景,其中,在先前提出的系統中,chauffeurnet神經網絡以像素圖像的形式將地圖和感知環境信息作為輸入,并且在每個時間步長處輸出規劃軌跡。作者不是單純模仿所有數據,而是將收集到的數據以擾動形式合成到專家駕駛,并通過對不期望事件進行罰分的附加損失來增大模仿損失,從而提高了學習模型的魯棒性并實現了性能的改善。
12、相比之下,基于深度強化學習(drl)的智能體在沒有任何監督的條件下,通過探索具有定義獎勵函數的仿真環境來學習駕駛車輛。經訓練的drl智能體沒有明確地規劃路徑或軌跡,而是學習將狀態映射到動作的策略,執行該策略將隱含地產生一條軌跡。該“動作”可以是低級動作(比如,方向盤角度命令),也可以高級動作(比如,抽象駕駛策略)。schwartz(2016)的作者將運動規劃器分解成學習的駕駛策略規劃器和未學習的具有硬約束的軌跡規劃器。然后,應用drl來學習策略,該策略將(不可知)狀態空間中的狀態映射到一組期望中,該組期望基本上表示高級駕駛策略。期望的目標是使駕駛舒適,而硬約束保證駕駛安全性。
1.一種用于訓練牽引車-拖車組合的路徑規劃模塊的方法,該路徑規劃模塊包括神經網絡,該神經網絡接收包括道路的目標車道的車道標記信息的輸入數據,并且生成包括該牽引車-拖車組合沿該目標車道自動移動的參考路徑的輸出數據,該方法包括:
2.如權利要求1所述的方法,其中,該神經網絡包括編碼器-解碼器架構,在該編碼器-解碼器架構中,編碼器部分和解碼器部分接收該輸入數據,并且該解碼器部分生成該輸出數據,并且更新該神經網絡包括通過該編碼器部分和該解碼器部分反向傳播該成本值來更新該編碼器部分和該解碼器部分的參數,以降低該成本值。
3.如權利要求1所述的方法,其中,該成本值基于一組標準來確定,該組標準包括相對于該目標車道上或附近的至少一個靜態障礙物的碰撞避免數據。
4.如權利要求1所述的方法,其中,該成本值基于一組標準來確定,該組標準包括該牽引車-拖車組合的牽引車和拖車與該參考路徑的偏差。
5.如權利要求4所述的方法,其中,該拖車的路徑是基于與該牽引車-拖車組合相關聯的運動學模型從該牽引車的路徑推斷出的。
6.如權利要求1所述的方法,其中,該成本值被表示為多個單獨成本的線性組合。
7.如權利要求1所述的方法,其中,該輸入數據包括沒有專家駕駛數據的隨機生成的數據。
8.一種用于牽引車-拖車組合的自動駕駛系統,包括: