在自動駕駛中,基于立體視覺的深度估計技術可以幫助準確估計障礙物的距離,這對于正確的車輛路徑規(guī)劃至關重要。
立體深度估計問題已被公式化為具有卷積神經網絡的深度學習模型。但是,這些模型需要大量的后處理,并且不具有對不適定區(qū)域或新場景的強大適應能力。另外,由于在實際情況下難以標注真實地面深度,因此該系統(tǒng)的訓練數據受到限制。
由中國科學院深圳先進技術研究院(SIAT)的張切石博士領導的研究團隊提出了一種新的技術解決方案,以解決當前自動駕駛的深度估計問題。
研究人員提出了一種自我改進的金字塔立體網絡,該網絡可以直接獲得回歸視差而無需復雜的后處理,并且在不適定區(qū)域具有強大的魯棒性。
此外,通過在線學習,提出的模型不僅可以解決數據限制問題,而且可以節(jié)省實踐中在培訓和硬件資源上花費的時間。同時,它具有對新場景的自我完善能力,可以根據測試數據及時及時調整,提高了預測的準確性。
實驗和基準測試表明,所提出的網絡可以實現深度估計,錯誤率為8.3%。
該研究發(fā)表在IET智能交通系統(tǒng)上。