123,123

為什么“中間表達”對于自動駕駛來說非常重要？

2026-01-19 11:58

在談自動駕駛技術的時候，“中間表達”是一個經(jīng)常出現(xiàn)的詞。相較于熟知的激光雷達、車載攝像頭、毫米波雷達等硬件，亦或是大模型、端到端、算法等軟件層面的概念，“中間表達”這個詞相對比較抽象，那中間表達到底是個啥？它有什么作用？

什么是中間表達？

要理解“中間表達”，我們可以從系統(tǒng)處理的信息特點一步步展開來看。在自動駕駛系統(tǒng)里，傳感器提供的數(shù)據(jù)形式非常多樣，攝像頭輸出彩色圖像；激光雷達給出三維點云；毫米波雷達提供目標距離和速度信息；GPS和慣性測量裝置給出位置和運動狀態(tài)。這些原始數(shù)據(jù)雖然包含了場景所有的細節(jié)，但它們大而雜，難以直接用于決策。因此，系統(tǒng)就必須把這些原始輸入轉化成更便于推理和利用的信息。

為了實現(xiàn)這個目標，車輛要從各種傳感器拿到大量的原始數(shù)據(jù)，這些數(shù)據(jù)本身并不能直接用來做決策，它需要經(jīng)過一系列的處理，才會成為既準確又可用的信息。這些處理之后的、介于原始數(shù)據(jù)和最終駕駛決策之間的數(shù)據(jù)或信息，就是我們說的“中間表達”。

舉個例子，從傳感器圖像和點云里識別出的一條車道線的位置、一輛后面車輛的相對速度和距離、一個紅綠燈當前狀態(tài)等都是中間表達。它們比原始像素和點坐標更具意義，但還不是最終的控制指令。它們相當于系統(tǒng)對眼前世界的“理解和總結”。通過把原始數(shù)據(jù)轉換成這些表達，自動駕駛系統(tǒng)可以把注意力集中在對行駛有實際影響的環(huán)境要素上，減少對無關細節(jié)的處理和依賴。

中間表達有時也被稱為中間表示，這與計算機科學中編譯器里使用的中間語言概念有相似性，它們都是在原始輸入和最終輸出之間的一種中間層，用來提高整個流程的效率和可分析性。對于自動駕駛來說，一個好的中間表達必須能夠在不丟失關鍵信息的前提下，使得后續(xù)模塊可以更容易、更準確地做出預測和規(guī)劃。

簡而言之，中間表達在自動駕駛系統(tǒng)里擔負著把原始數(shù)據(jù)加工成更有意義的信息的職責。它的形式多種多樣，可以是二維場景的語義描述、也可以是三維空間里物體的位置信息、更可以是對未來行為的預測。它既比原始感知數(shù)據(jù)更精煉，也比最終的控制輸出更接近對環(huán)境的理解。

中間表達在不同架構中的角色

自動駕駛系統(tǒng)有不同的實現(xiàn)架構，它們對中間表達的定義和使用也有細微差別。在傳統(tǒng)的模塊化系統(tǒng)中，中間表達會被顯式地定義和傳遞。一個模塊輸出的中間表達會作為下一個模塊的輸入，這樣的信息流是清晰的可觀察的，這種設計也讓自動駕駛系統(tǒng)更容易調(diào)試、驗證和優(yōu)化。

在這種架構里，感知模塊輸出的中間表達既包括靜態(tài)特征（如車道線、障礙物位置），也包括動態(tài)特征（如物體運動速度、變化趨勢）。這些信息通過標準格式傳遞給預測模塊，由預測模塊根據(jù)這些信息判斷未來一段時間內(nèi)場景的變化。緊接著，規(guī)劃模塊會根據(jù)預測結果確定車輛下一步安全且合理的軌跡。在模塊化系統(tǒng)里，中間表達是約定好的信息形式，能讓各個模塊獨立開發(fā)、獨立測試。由于模塊化設計可以檢查某個環(huán)節(jié)的中間輸出是不是出了問題，如果感知輸出錯誤，那么預測、規(guī)劃自然也會受到影響，因此，這樣的設計也便于定位具體的故障點。

圖片源自：網(wǎng)絡

現(xiàn)階段，端到端的應用非常普遍，這類系統(tǒng)試圖跳過顯式中間模塊，把傳感器輸入直接映射到控制輸出。這種方式在某些場景下可以減少手工設計的復雜性，但它也帶來了可解釋性差的問題。端到端系統(tǒng)的內(nèi)部處理過程會被隱藏在一個整體的神經(jīng)網(wǎng)絡模型里，如果沒有明確的中間表達，就很難得知系統(tǒng)是基于什么具體環(huán)境特征做出某個決策的。這種黑箱式的決策對安全驗證和調(diào)試非常不利。

為了兼顧端到端學習的靈活性和系統(tǒng)的可解釋性，有技術提出了“二段式端到端”的方法。在這種架構里，網(wǎng)絡首先學習把原始輸入轉換成一種對駕駛決策友好的中間表達，然后再用這種中間表達生成控制指令。舉個例子，系統(tǒng)可以先生成一張語義鳥瞰圖和一組預測軌跡點作為中間表達，再用這些信息生成最終的控制輸出。這種方式既保持了端到端學習的優(yōu)勢，又通過顯式的中間表達提高了模型的可解釋性和系統(tǒng)的可靠性。

中間表達的常見形式及作用

要更好地理解中間表達，可以看看它在系統(tǒng)中有哪些具體形式，以及這些形式為什么對系統(tǒng)有用。不同的中間表達承載的信息側重點并不一樣，但它們共同的目標是把傳感器信息變成對后續(xù)任務更有幫助的數(shù)據(jù)。

一種常見的中間表達是幾何語義類。這種表達描述的是環(huán)境的空間結構，像是道路的幾何形狀、車道線的位置、路緣的位置、車輛和行人的邊界框等就屬于這種表達。這些數(shù)據(jù)本質(zhì)上回答了“周圍有什么”和“它們在哪里”的問題。對于規(guī)劃模塊來說，理解這些幾何信息是決定車輛可通行空間和路徑的基礎。

還有一種中間表達是語義理解類，像是交通標志、紅綠燈狀態(tài)、道路類型等信息就屬于語義理解類的中間表達。這樣的表達幫助系統(tǒng)在路徑選擇和行為決策時理解場景語義。如果系統(tǒng)知道前方是紅燈而不是綠燈，它就會停下而不是繼續(xù)前進，這種信息是語義性的，而不是純粹的幾何數(shù)據(jù)。

還有更高級的中間表達會包含動態(tài)預測類信息，它不僅描述當前環(huán)境，還可預測未來環(huán)境可能的變化。如系統(tǒng)會根據(jù)當前車速和運動方向來預測前方車輛在未來幾秒內(nèi)可能的位置。這樣的預測結果會和概率結合在一起，成為規(guī)劃模塊做決策的重要參考。如果不對動態(tài)信息進行預測，車輛就只能根據(jù)當前瞬間狀態(tài)做決策，會讓自動駕駛系統(tǒng)失去對未來風險的洞察。

上述這些中間表達的設計和選用，并不是隨意的，而是基于自動駕駛在實際道路上運行所需的核心判斷能力所決定的。好的中間表達能讓系統(tǒng)在復雜、動態(tài)變化的道路環(huán)境中做出更準確、更安全的決策。

為什么關注中間表達對自動駕駛很重要

理解了中間表達，就有助于深入認識自動駕駛系統(tǒng)的本質(zhì)。不是簡單把攝像頭或雷達數(shù)據(jù)扔進一個大模型里，就能自動得出駕駛指令。系統(tǒng)需要把原始數(shù)據(jù)轉化成能表達環(huán)境狀態(tài)的信息，再基于這種表達去預測、規(guī)劃和控制。中間表達不僅是工程實現(xiàn)的信息橋梁，也是性能和安全保障的基石。

在模塊化設計里，中間表達讓各個階段的功能更清晰、更容易驗證。如果某個表達在某種場景下表現(xiàn)不穩(wěn)定，就可以針對這一環(huán)節(jié)進行優(yōu)化。這種清晰的分層還利于和傳統(tǒng)的控制理論結合，從而提高自動駕駛系統(tǒng)整體的魯棒性和可控性。

在學習驅動方法中，明確的中間表達可以提供更豐富的監(jiān)督信號，不僅可以讓模型學會控制，還能讓其正確理解場景。比如在訓練階段，人們可以用帶有標簽的中間表達作為額外約束，避免模型只關注最終控制結果而忽略對場景本身的正確認識。

中間表達的重要性還體現(xiàn)在自動駕駛的安全性評估上。因為自動駕駛系統(tǒng)需要通過大量測試和驗證才能投入實際道路運營，明確的表達能讓測試覆蓋更多的極端情況，并且更容易診斷出系統(tǒng)在某類場景下的弱點。

最終的話

中間表達是自動駕駛系統(tǒng)內(nèi)部非常核心的一類信息結構，它連接了感知層和決策層，是整個系統(tǒng)能理解環(huán)境并做出正確判斷的關鍵。在不同的技術架構里，中間表達的形式和作用略有差異，但它們都承擔著把海量、原始的傳感器數(shù)據(jù)轉化為對未來行為有意義的信息的任務。理解中間表達，有助于理解自動駕駛技術的設計邏輯、性能邊界以及工程實現(xiàn)方式。隨著自動駕駛技術的不斷發(fā)展，中間表達的設計和優(yōu)化依然是需要持續(xù)關注的重要方向。

-- END --

原文標題 : 為什么“中間表達”對于自動駕駛來說非常重要？