訂閱
糾錯(cuò)
加入自媒體

純視覺自動(dòng)駕駛的優(yōu)勢(shì)和劣勢(shì)有哪些?

最近有很多小伙伴在后臺(tái)詢問純視覺自動(dòng)駕駛的優(yōu)劣,純視覺自動(dòng)駕駛以其低成本、高冗余的技術(shù)路徑,正成為自動(dòng)駕駛現(xiàn)階段主要的一個(gè)發(fā)展方向。但它由于在多個(gè)場(chǎng)景下的感知能力不如激光雷達(dá),也一直飽受爭(zhēng)議。今天智駕最前沿就圍繞純視覺自動(dòng)駕駛,聊聊它的優(yōu)劣。

什么是純視覺自動(dòng)駕駛

所謂純視覺自動(dòng)駕駛,是指車輛不依賴激光雷達(dá)、毫米波雷達(dá)等主動(dòng)傳感器,而是僅依靠車載攝像頭和圖像處理算法來感知周圍環(huán)境。這一思路模仿人類駕駛員靠眼睛“看”道路的方式,通過多個(gè)角度的高清攝像頭捕捉圖像,再用深度學(xué)習(xí)等算法來理解這些圖像,從而識(shí)別車輛、行人、交通標(biāo)志、車道線等信息,最終做出駕駛決策。

純視覺自動(dòng)駕駛的核心工作是在二維圖像中提取有用信息,然后通過算法推斷出三維空間結(jié)構(gòu)與動(dòng)態(tài)變化,從而實(shí)現(xiàn)判斷前方車輛的距離、相對(duì)速度以及可能的路徑等功能。這些推斷并不是簡(jiǎn)單的幾何計(jì)算,而是深度神經(jīng)網(wǎng)絡(luò)通過大量訓(xùn)練數(shù)據(jù)學(xué)習(xí)出來的“經(jīng)驗(yàn)”。“從圖像推斷世界”是純視覺方案的基礎(chǔ),也是它優(yōu)劣的根源所在。

視覺感知的技術(shù)優(yōu)勢(shì)

視覺傳感器本身的成本遠(yuǎn)低于激光雷達(dá)等主動(dòng)傳感器。攝像頭硬件便宜、體積小、易于大規(guī)模部署,這對(duì)整車成本控制尤為重要。相比激光雷達(dá)曾經(jīng)動(dòng)輒上萬元的價(jià)格,攝像頭的投入可以說是微乎其微。

視覺數(shù)據(jù)對(duì)語義信息的表達(dá)也更為豐富。攝像頭捕獲的是光學(xué)圖像,其中包含顏色、紋理、符號(hào)等大量信息,這些信息在理解道路標(biāo)志、交通燈狀態(tài)、危險(xiǎn)手勢(shì)等復(fù)雜場(chǎng)景時(shí)非常有用。相比之下,激光雷達(dá)輸出的點(diǎn)云數(shù)據(jù)雖然精確,但在原始語義信息量上遠(yuǎn)不如圖像數(shù)據(jù)。

對(duì)于純視覺自動(dòng)駕駛來說,輸入是統(tǒng)一的圖像數(shù)據(jù),這使算法開發(fā)與迭代可以更集中、更一致。在多傳感器融合的系統(tǒng)中,每種傳感器的數(shù)據(jù)格式就不一樣,在開發(fā)時(shí),需要先做復(fù)雜的數(shù)據(jù)對(duì)齊和融合架構(gòu)設(shè)計(jì);而在純視覺方案中,開發(fā)者只需圍繞圖像感知算法本身積累數(shù)據(jù)、迭代模型,相對(duì)簡(jiǎn)化了數(shù)據(jù)處理流程。

此外,通過不斷訓(xùn)練視覺模型,還可以讓自動(dòng)駕駛系統(tǒng)在更多復(fù)雜環(huán)境下對(duì)物體做出更準(zhǔn)確的識(shí)別和分類。對(duì)于一些動(dòng)態(tài)對(duì)象的意圖預(yù)測(cè)(比如前車突變方向、行人可能橫穿馬路等),圖像數(shù)據(jù)本身的細(xì)節(jié)也能給出更多線索。

純視覺方案的技術(shù)劣勢(shì)

純視覺的優(yōu)勢(shì)非常明顯,但劣勢(shì)也有很多,這也是為什么很多主機(jī)廠依然選擇激光雷達(dá)作為主要感知硬件的原因。

純視覺最顯著的問題是距離和深度的推斷不如激光雷達(dá)、毫米波雷達(dá)等主動(dòng)傳感器穩(wěn)定。攝像頭捕獲的是二維圖像,要從二維圖像準(zhǔn)確推斷三維空間結(jié)構(gòu)和測(cè)量距離,需要依賴模型內(nèi)部的估計(jì)和推理。這種推斷在普通場(chǎng)景下可以做得不錯(cuò),但在極端光照、遮擋嚴(yán)重或遠(yuǎn)距離場(chǎng)景中,會(huì)出現(xiàn)誤判或者不穩(wěn)定的情況。與之相比,激光雷達(dá)通過發(fā)射激光束直接測(cè)量返回時(shí)間,從而獲得精確的三維信息,這種測(cè)距方法在很多情況下更可靠。

攝像頭對(duì)光照和天氣條件也非常敏感。雨天、霧天、大雪、逆光等條件都會(huì)極大削弱圖像的清晰度或?qū)Ρ榷,這會(huì)影響視覺算法對(duì)環(huán)境元素的識(shí)別能力。相對(duì)而言,雷達(dá)類傳感器在雨霧等惡劣天氣下表現(xiàn)得更穩(wěn)定,像是毫米波雷,在低能見度環(huán)境中更是能穩(wěn)定提供有效信息,這是純視覺難以達(dá)到的能力。

純視覺自動(dòng)駕駛在復(fù)雜場(chǎng)景的泛化能力也有限。純視覺系統(tǒng)訓(xùn)練需要大量樣本覆蓋各種可能出現(xiàn)的路況和動(dòng)態(tài)組合,但現(xiàn)實(shí)世界場(chǎng)景多變且不確定性因素很多,訓(xùn)練數(shù)據(jù)永遠(yuǎn)無法完備。在未見過的極端情況或特殊組合場(chǎng)景下,深度學(xué)習(xí)模型可能無法做出正確判斷,這也會(huì)帶來潛在的安全風(fēng)險(xiǎn)。

很多視覺系統(tǒng)還需要在圖像預(yù)處理、特征提取、三維重建等環(huán)節(jié)使用極高算力,這在車載平臺(tái)資源有限的情況下也帶來了很大的困難。高算力投入相當(dāng)于“隱性成本”,雖然硬件本身便宜,但為了保證實(shí)時(shí)性可能需要更昂貴的計(jì)算平臺(tái)。

技術(shù)發(fā)展的方向

現(xiàn)階段,很多車企的自動(dòng)駕駛方案都是選擇“融合感知”路線,即在攝像頭之外加入激光雷達(dá)、毫米波雷達(dá)等感知硬件來補(bǔ)充信息。這種融合既能利用視覺數(shù)據(jù)的豐富語義,也能借助激光雷達(dá)等提供的精確空間信息,使自動(dòng)駕駛汽車在復(fù)雜場(chǎng)景下提升整體感知的可靠性與冗余能力。

從技術(shù)趨勢(shì)上看,純視覺和多傳感器融合其實(shí)各有適用場(chǎng)景。純視覺依靠圖像信息和強(qiáng)大的算法,能夠?qū)崿F(xiàn)較低成本下的環(huán)境理解,并且隨著算力提升和模型優(yōu)化,其感知能力可以不斷提高。多傳感器融合則在環(huán)境理解的穩(wěn)定性和安全冗余性上有天然優(yōu)勢(shì),尤其是在復(fù)雜或極端工況下可以更可靠。

最后的話

純視覺感知對(duì)于自動(dòng)駕駛行業(yè)來說,并不是一個(gè)低成本的選擇,而是一套以圖像為核心、通過數(shù)據(jù)規(guī)模與工程化閉環(huán)換取感知能力的系統(tǒng)型路線。它的優(yōu)勢(shì)在于低硬件成本、豐富語義信息與統(tǒng)一的數(shù)據(jù)生態(tài),這使得模型迭代、在線回流與大規(guī)模場(chǎng)景覆蓋成為可能,可以加速產(chǎn)品化與自動(dòng)駕駛普及。

-- END --

       原文標(biāo)題 : 純視覺自動(dòng)駕駛的優(yōu)勢(shì)和劣勢(shì)有哪些?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)