您現(xiàn)在的位置：中國傳動網(wǎng) > 技術(shù)頻道 > 技術(shù)百科 > 什么是自動駕駛決策系統(tǒng)？發(fā)展有何挑戰(zhàn)？

什么是自動駕駛決策系統(tǒng)？發(fā)展有何挑戰(zhàn)？

時間：2025-10-30 18:06:53來源：OFweek 人工智能網(wǎng)

導(dǎo)語：?把自動駕駛汽車想象成一個不斷學(xué)習(xí)并做決定的人，車上的“眼睛”負(fù)責(zé)看（感知）、“記憶/推理”負(fù)責(zé)想（預(yù)測與決策）、“手腳”負(fù)責(zé)做（規(guī)劃與控制），決策系統(tǒng)則處在這個鏈條的中間位置。它把來自感知（相機、雷達、激光雷達、定位、地圖等）的信息和預(yù)測模塊（對周圍行人、車輛未來行為的猜測）整合起來，輸出“我下一步要怎么走、以什么速度走、如何避讓”等指令。

　　決策并不是單一的動作，而是一個層級化的流程，先想清楚要干什么(行為層，像是“變道”“左轉(zhuǎn)”“減速跟車”)，再把這個行為轉(zhuǎn)成一條具體的、安全可執(zhí)行的軌跡(軌跡層)，最后把軌跡交給底層控制器去跟蹤(控制層)。

　　決策系統(tǒng)要同時滿足安全(永遠優(yōu)先)、舒適(不要讓乘客暈)、合法(遵守交通規(guī)則)、高效(不無謂地慢)以及可解釋(出了問題能查原因)等要求。但這些要求恰恰會產(chǎn)生沖突，最安全的動作可能太保守影響效率，最快的動作可能帶來風(fēng)險，所以決策系統(tǒng)本質(zhì)上是在這些要求之間做權(quán)衡的過程。

　　經(jīng)典與主流的方法：層級、優(yōu)化與規(guī)則

　　長期以來，自動駕駛的決策與規(guī)劃主要沿著“層級化+優(yōu)化/采樣”的路線發(fā)展，系統(tǒng)會先基于地圖和當(dāng)前交通情形選擇一個合理的策略，例如在交叉口是“先等候再左轉(zhuǎn)”還是“突出加速通過”，通過這些合理的策略，可以確保自動駕駛汽車安全行駛。

　　為了能夠生成更安全的軌跡，常用的方法分為兩類，即采樣/搜索類和優(yōu)化類。采樣類方法通過生成若干候選軌跡(基于軌跡庫或隨機采樣)，評估每條軌跡的代價(碰撞風(fēng)險、舒適性、距離、法規(guī)約束等)，然后選擇代價最低的那一條。這類方法實現(xiàn)直觀，但當(dāng)情形復(fù)雜時需要大量候選樣本，計算量容易爆炸。

　　優(yōu)化類方法把軌跡看成一個連續(xù)的函數(shù)，用數(shù)學(xué)優(yōu)化求最小代價路徑，常見的工具包括基于拉格朗日的優(yōu)化、迭代線性二次調(diào)節(jié)(iLQR)、以及模型預(yù)測控制(MPC)。MPC特別受歡迎，因為它把動力學(xué)約束、狀態(tài)與控制約束直接納入優(yōu)化問題，還能以有限時域滾動優(yōu)化的方式去應(yīng)對環(huán)境變化，這使得控制既能考慮未來又能實時運行。

　　除了純數(shù)學(xué)的優(yōu)化外，規(guī)則/符號化方法也被廣泛用于保證安全行駛。例如Mobileye提出的Responsibility-Sensitive Safety(RSS)提出了一套數(shù)學(xué)化的“常識駕駛規(guī)則”，用來判斷何時應(yīng)該采取防御性動作，從而為系統(tǒng)提供白盒式的安全保證。RSS強調(diào)可驗證性與可解釋性，是工業(yè)界推行“可證明安全”思路的代表之一。

　　在很多商用系統(tǒng)里，還會加一層“安全裁判”或“監(jiān)護層”(supervisorysafetylayer)，它不是去生成軌跡，而是在主規(guī)劃動作可能造成危險時進行攔截或修正。近年常把學(xué)習(xí)型模塊(負(fù)責(zé)復(fù)雜場景下做出靈活行為)與基于物理/規(guī)則的安全模塊(保證萬一學(xué)習(xí)出錯時仍不致于發(fā)生危險)結(jié)合起來，形成“學(xué)習(xí)+證據(jù)化安全”的混合結(jié)構(gòu)。

　　近兩年的新技術(shù)熱點

　　現(xiàn)在自動駕駛行業(yè)有一個非常明顯的趨勢，第一個是把預(yù)測與規(guī)劃之間的界限變得模糊，過去感知負(fù)責(zé)“看”，預(yù)測負(fù)責(zé)“猜未來”，規(guī)劃負(fù)責(zé)“決定”;現(xiàn)在越來越多的工作嘗試把世界建模(worldmodeling)、多主體行為預(yù)測與軌跡生成緊耦合，甚至把規(guī)劃也放到同一個學(xué)習(xí)框架里去訓(xùn)練。

　　Transformer架構(gòu)因其優(yōu)秀的時序與交互建模能力被廣泛采用。像MTR(Motion TRansformer)和Agent Former這樣的工作展示了Transformer在多主體、長時序軌跡預(yù)測上的強勁表現(xiàn);它們能夠用自注意力機制去捕捉不同交通參與者之間的交互，從而生成更合理、具多模態(tài)性的未來軌跡預(yù)測。

　　與之相關(guān)的第二個趨勢是擴散(diffusion)模型被引入到軌跡預(yù)測與采樣生成領(lǐng)域。擴散模型擅長從復(fù)雜分布中生成高質(zhì)量且多樣化的樣本，擴散方法能更好地表達未來的不確定性，生成的軌跡模式通常比傳統(tǒng)高斯混合或簡單回歸更豐富。

　　第三個大趨勢是BEV(Bird’s Eye View，俯視圖)，把原始相機/雷達/激光點云數(shù)據(jù)先投影或轉(zhuǎn)換成車輛局部的俯視格網(wǎng)或向量化地圖，再在這個BEV表示上做感知、軌跡預(yù)測和規(guī)劃。BEV的好處在于它把空間結(jié)構(gòu)顯式化，使得后續(xù)的規(guī)劃模塊可以直接在統(tǒng)一的空間中做代價評估與軌跡優(yōu)化。

　　第四個值得注意的方向是“大模型”與多模態(tài)模型的嘗試。一些公司和研究團隊嘗試把大型多模態(tài)神經(jīng)網(wǎng)絡(luò)應(yīng)用到駕駛場景，用更大的模型去整合相機幀、點云、地圖和歷史軌跡，甚至把語言或世界知識納入決策過程。像是Waymo與Google的多模態(tài)/大模型合作方向在內(nèi)部探索將大型多模態(tài)模型用于世界建模和軌跡生成的可能性(如EMMA)，其目標(biāo)是用更通用的模型來縮短“模塊間信息斷層”、增強推理能力，但同時也面臨計算與工程化挑戰(zhàn)。

　　上面這些技術(shù)趨勢的共同點是更強調(diào)“聯(lián)合建?！焙汀安淮_定性建?！薄鹘y(tǒng)系統(tǒng)里每一層獨立優(yōu)化，信息在層與層之間被“壓縮”傳遞;新趨勢嘗試在更大的端到端或半端到端框架里聯(lián)合訓(xùn)練，以避免信息損失，同時用概率模型或生成模型來保留和利用不確定性(比如何時可能發(fā)生緊急剎車、其他車輛可能的多種軌跡等)，從而讓規(guī)劃在面對多種可能未來時更穩(wěn)健。

　　安全、可驗證性與工程化挑戰(zhàn)

　　技術(shù)強并不意味著立刻可以上路，自動駕駛決策系統(tǒng)面臨極高的工程與合規(guī)門檻。安全與可驗證性就是其中一個，機器學(xué)習(xí)模型尤其是端到端、深度網(wǎng)絡(luò)通常是“黑盒”，在極端或稀有場景下可能會產(chǎn)生不可預(yù)測的行為。為此，在實際應(yīng)用時一直強調(diào)在系統(tǒng)中保留可解釋和可驗證的模塊，或者在學(xué)習(xí)模塊外加上可證明的安全層，并結(jié)合控制屏障函數(shù)(Control Barrier Functions,CBF)等技術(shù)來保證系統(tǒng)滿足安全約束。近年來有方案把實時MPC與CBF結(jié)合，證明在城市場景下能以可計算的代價提供安全保障，這類方法在可證明安全方面是有實際意義的進展。

　　實時性與算力也是決策系統(tǒng)發(fā)展需要考慮的難題，擴散模型、巨型Transformer、以及多模態(tài)大模型在訓(xùn)練與推理上都很吃資源。實際車輛的算力、功耗、散熱和延遲都有硬性限制，任何決策模型必須在嚴(yán)格的延遲預(yù)算內(nèi)給出輸出。常見的做法是混合采用，在邊緣用輕量化或確定性模塊做“快尚能”決策(fast-fallback)，在云或離線環(huán)境中用大模型做策略更新、數(shù)據(jù)采樣或仿真訓(xùn)練。

　　還有一個難題就是對稀有/危險場景的處理，在現(xiàn)實的交通場景中，會出現(xiàn)很多危險但少見的邊緣場景，但正因為它們危險，系統(tǒng)必須在這類場景上能夠靈活處理。其中解決辦法包括大量合成數(shù)據(jù)、基于仿真的極端場景生成(scenariogeneration)、重要性采樣與對抗式訓(xùn)練，或者用基于規(guī)則的強制安全邊界來覆蓋學(xué)習(xí)系統(tǒng)的盲點。此外，如何對學(xué)習(xí)系統(tǒng)做形式化驗證仍然是一個開放問題，這就需要結(jié)合可解釋AI、可證實安全理論與充分的實測/仿真驗證框架。

　　法規(guī)與社會信任其實一直是自動駕駛發(fā)展最難平衡的問題，決策系統(tǒng)的行為牽涉到責(zé)任歸屬和倫理問題。像Mobileye的RSS試圖把“常識駕駛”數(shù)學(xué)化，雖然這方便證明和溝通，但也引出了責(zé)任與法律層面的討論。有很多技術(shù)的做法是把透明性與可追溯性做為產(chǎn)品化的基本要求，決策日志、黑匣子式的數(shù)據(jù)記錄與回放、以及在系統(tǒng)內(nèi)置的可解釋性接口，都是建立社會信任的必要手段。

標(biāo)簽：自動駕駛

分享到：

上一篇：看似簡單的自動泊車需要哪些...

下一篇：沒有了！

傳動網(wǎng)版權(quán)與免責(zé)聲明：凡本網(wǎng)注明[來源：傳動網(wǎng)]的所有文字、圖片、音視和視頻文件，版權(quán)均為傳動網(wǎng)(surachana.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“傳動網(wǎng)”，違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件，均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士，版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者，禁止擅自篡改，違者自負(fù)版權(quán)法律責(zé)任。

相關(guān)資訊

技術(shù)熱點