技術(shù)頻道

娓娓工業(yè)
您現(xiàn)在的位置: 中國傳動網(wǎng) > 技術(shù)頻道 > 技術(shù)百科 > 什么是自動駕駛決策系統(tǒng)?發(fā)展有何挑戰(zhàn)?

什么是自動駕駛決策系統(tǒng)?發(fā)展有何挑戰(zhàn)?

時間:2025-10-30 18:06:53來源:OFweek 人工智能網(wǎng)

導(dǎo)語:?把自動駕駛汽車想象成一個不斷學(xué)習(xí)并做決定的人,車上的“眼睛”負(fù)責(zé)看(感知)、“記憶/推理”負(fù)責(zé)想(預(yù)測與決策)、“手腳”負(fù)責(zé)做(規(guī)劃與控制),決策系統(tǒng)則處在這個鏈條的中間位置。它把來自感知(相機、雷達、激光雷達、定位、地圖等)的信息和預(yù)測模塊(對周圍行人、車輛未來行為的猜測)整合起來,輸出“我下一步要怎么走、以什么速度走、如何避讓”等指令。

  決策并不是單一的動作,而是一個層級化的流程,先想清楚要干什么(行為層,像是“變道”“左轉(zhuǎn)”“減速跟車”),再把這個行為轉(zhuǎn)成一條具體的、安全可執(zhí)行的軌跡(軌跡層),最后把軌跡交給底層控制器去跟蹤(控制層)。

  決策系統(tǒng)要同時滿足安全(永遠優(yōu)先)、舒適(不要讓乘客暈)、合法(遵守交通規(guī)則)、高效(不無謂地慢)以及可解釋(出了問題能查原因)等要求。但這些要求恰恰會產(chǎn)生沖突,最安全的動作可能太保守影響效率,最快的動作可能帶來風(fēng)險,所以決策系統(tǒng)本質(zhì)上是在這些要求之間做權(quán)衡的過程。

  經(jīng)典與主流的方法:層級、優(yōu)化與規(guī)則

  長期以來,自動駕駛的決策與規(guī)劃主要沿著“層級化+優(yōu)化/采樣”的路線發(fā)展,系統(tǒng)會先基于地圖和當(dāng)前交通情形選擇一個合理的策略,例如在交叉口是“先等候再左轉(zhuǎn)”還是“突出加速通過”,通過這些合理的策略,可以確保自動駕駛汽車安全行駛。

  為了能夠生成更安全的軌跡,常用的方法分為兩類,即采樣/搜索類和優(yōu)化類。采樣類方法通過生成若干候選軌跡(基于軌跡庫或隨機采樣),評估每條軌跡的代價(碰撞風(fēng)險、舒適性、距離、法規(guī)約束等),然后選擇代價最低的那一條。這類方法實現(xiàn)直觀,但當(dāng)情形復(fù)雜時需要大量候選樣本,計算量容易爆炸。

  優(yōu)化類方法把軌跡看成一個連續(xù)的函數(shù),用數(shù)學(xué)優(yōu)化求最小代價路徑,常見的工具包括基于拉格朗日的優(yōu)化、迭代線性二次調(diào)節(jié)(iLQR)、以及模型預(yù)測控制(MPC)。MPC特別受歡迎,因為它把動力學(xué)約束、狀態(tài)與控制約束直接納入優(yōu)化問題,還能以有限時域滾動優(yōu)化的方式去應(yīng)對環(huán)境變化,這使得控制既能考慮未來又能實時運行。

  除了純數(shù)學(xué)的優(yōu)化外,規(guī)則/符號化方法也被廣泛用于保證安全行駛。例如Mobileye提出的Responsibility-Sensitive Safety(RSS)提出了一套數(shù)學(xué)化的“常識駕駛規(guī)則”,用來判斷何時應(yīng)該采取防御性動作,從而為系統(tǒng)提供白盒式的安全保證。RSS強調(diào)可驗證性與可解釋性,是工業(yè)界推行“可證明安全”思路的代表之一。

  在很多商用系統(tǒng)里,還會加一層“安全裁判”或“監(jiān)護層”(supervisorysafetylayer),它不是去生成軌跡,而是在主規(guī)劃動作可能造成危險時進行攔截或修正。近年常把學(xué)習(xí)型模塊(負(fù)責(zé)復(fù)雜場景下做出靈活行為)與基于物理/規(guī)則的安全模塊(保證萬一學(xué)習(xí)出錯時仍不致于發(fā)生危險)結(jié)合起來,形成“學(xué)習(xí)+證據(jù)化安全”的混合結(jié)構(gòu)。

  近兩年的新技術(shù)熱點

  現(xiàn)在自動駕駛行業(yè)有一個非常明顯的趨勢,第一個是把預(yù)測與規(guī)劃之間的界限變得模糊,過去感知負(fù)責(zé)“看”,預(yù)測負(fù)責(zé)“猜未來”,規(guī)劃負(fù)責(zé)“決定”;現(xiàn)在越來越多的工作嘗試把世界建模(worldmodeling)、多主體行為預(yù)測與軌跡生成緊耦合,甚至把規(guī)劃也放到同一個學(xué)習(xí)框架里去訓(xùn)練。

  Transformer架構(gòu)因其優(yōu)秀的時序與交互建模能力被廣泛采用。像MTR(Motion TRansformer)和Agent Former這樣的工作展示了Transformer在多主體、長時序軌跡預(yù)測上的強勁表現(xiàn);它們能夠用自注意力機制去捕捉不同交通參與者之間的交互,從而生成更合理、具多模態(tài)性的未來軌跡預(yù)測。

  與之相關(guān)的第二個趨勢是擴散(diffusion)模型被引入到軌跡預(yù)測與采樣生成領(lǐng)域。擴散模型擅長從復(fù)雜分布中生成高質(zhì)量且多樣化的樣本,擴散方法能更好地表達未來的不確定性,生成的軌跡模式通常比傳統(tǒng)高斯混合或簡單回歸更豐富。

  第三個大趨勢是BEV(Bird’s Eye View,俯視圖),把原始相機/雷達/激光點云數(shù)據(jù)先投影或轉(zhuǎn)換成車輛局部的俯視格網(wǎng)或向量化地圖,再在這個BEV表示上做感知、軌跡預(yù)測和規(guī)劃。BEV的好處在于它把空間結(jié)構(gòu)顯式化,使得后續(xù)的規(guī)劃模塊可以直接在統(tǒng)一的空間中做代價評估與軌跡優(yōu)化。

  第四個值得注意的方向是“大模型”與多模態(tài)模型的嘗試。一些公司和研究團隊嘗試把大型多模態(tài)神經(jīng)網(wǎng)絡(luò)應(yīng)用到駕駛場景,用更大的模型去整合相機幀、點云、地圖和歷史軌跡,甚至把語言或世界知識納入決策過程。像是Waymo與Google的多模態(tài)/大模型合作方向在內(nèi)部探索將大型多模態(tài)模型用于世界建模和軌跡生成的可能性(如EMMA),其目標(biāo)是用更通用的模型來縮短“模塊間信息斷層”、增強推理能力,但同時也面臨計算與工程化挑戰(zhàn)。

  上面這些技術(shù)趨勢的共同點是更強調(diào)“聯(lián)合建?!焙汀安淮_定性建?!薄鹘y(tǒng)系統(tǒng)里每一層獨立優(yōu)化,信息在層與層之間被“壓縮”傳遞;新趨勢嘗試在更大的端到端或半端到端框架里聯(lián)合訓(xùn)練,以避免信息損失,同時用概率模型或生成模型來保留和利用不確定性(比如何時可能發(fā)生緊急剎車、其他車輛可能的多種軌跡等),從而讓規(guī)劃在面對多種可能未來時更穩(wěn)健。

  安全、可驗證性與工程化挑戰(zhàn)

  技術(shù)強并不意味著立刻可以上路,自動駕駛決策系統(tǒng)面臨極高的工程與合規(guī)門檻。安全與可驗證性就是其中一個,機器學(xué)習(xí)模型尤其是端到端、深度網(wǎng)絡(luò)通常是“黑盒”,在極端或稀有場景下可能會產(chǎn)生不可預(yù)測的行為。為此,在實際應(yīng)用時一直強調(diào)在系統(tǒng)中保留可解釋和可驗證的模塊,或者在學(xué)習(xí)模塊外加上可證明的安全層,并結(jié)合控制屏障函數(shù)(Control Barrier Functions,CBF)等技術(shù)來保證系統(tǒng)滿足安全約束。近年來有方案把實時MPC與CBF結(jié)合,證明在城市場景下能以可計算的代價提供安全保障,這類方法在可證明安全方面是有實際意義的進展。

  實時性與算力也是決策系統(tǒng)發(fā)展需要考慮的難題,擴散模型、巨型Transformer、以及多模態(tài)大模型在訓(xùn)練與推理上都很吃資源。實際車輛的算力、功耗、散熱和延遲都有硬性限制,任何決策模型必須在嚴(yán)格的延遲預(yù)算內(nèi)給出輸出。常見的做法是混合采用,在邊緣用輕量化或確定性模塊做“快尚能”決策(fast-fallback),在云或離線環(huán)境中用大模型做策略更新、數(shù)據(jù)采樣或仿真訓(xùn)練。

  還有一個難題就是對稀有/危險場景的處理,在現(xiàn)實的交通場景中,會出現(xiàn)很多危險但少見的邊緣場景,但正因為它們危險,系統(tǒng)必須在這類場景上能夠靈活處理。其中解決辦法包括大量合成數(shù)據(jù)、基于仿真的極端場景生成(scenariogeneration)、重要性采樣與對抗式訓(xùn)練,或者用基于規(guī)則的強制安全邊界來覆蓋學(xué)習(xí)系統(tǒng)的盲點。此外,如何對學(xué)習(xí)系統(tǒng)做形式化驗證仍然是一個開放問題,這就需要結(jié)合可解釋AI、可證實安全理論與充分的實測/仿真驗證框架。

  法規(guī)與社會信任其實一直是自動駕駛發(fā)展最難平衡的問題,決策系統(tǒng)的行為牽涉到責(zé)任歸屬和倫理問題。像Mobileye的RSS試圖把“常識駕駛”數(shù)學(xué)化,雖然這方便證明和溝通,但也引出了責(zé)任與法律層面的討論。有很多技術(shù)的做法是把透明性與可追溯性做為產(chǎn)品化的基本要求,決策日志、黑匣子式的數(shù)據(jù)記錄與回放、以及在系統(tǒng)內(nèi)置的可解釋性接口,都是建立社會信任的必要手段。

標(biāo)簽: 自動駕駛

點贊

分享到:

上一篇:看似簡單的自動泊車需要哪些...

下一篇:沒有了!

傳動網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來源:傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為傳動網(wǎng)(surachana.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

網(wǎng)站簡介|會員服務(wù)|聯(lián)系方式|幫助信息|版權(quán)信息|網(wǎng)站地圖|友情鏈接|法律支持|意見反饋|sitemap

傳動網(wǎng)-工業(yè)自動化與智能制造的全媒體“互聯(lián)網(wǎng)+”創(chuàng)新服務(wù)平臺

網(wǎng)站客服服務(wù)咨詢采購咨詢媒體合作

Chuandong.com Copyright ?2005 - 2025 ,All Rights Reserved 深圳市奧美大唐廣告有限公司 版權(quán)所有
粵ICP備 14004826號 | 營業(yè)執(zhí)照證書 | 不良信息舉報中心 | 粵公網(wǎng)安備 44030402000946號