自動(dòng)駕駛技術(shù)的核心之一是感知模塊,它依賴于多種傳感器如毫米波雷達(dá)和攝像頭來識別和分類周圍環(huán)境中的物體,包括行人、車輛和障礙物。這些傳感器收集的數(shù)據(jù)被傳遞給神經(jīng)網(wǎng)絡(luò)進(jìn)行處理,借鑒生物神經(jīng)系統(tǒng)的結(jié)構(gòu),通過多層處理和學(xué)習(xí),實(shí)現(xiàn)對環(huán)境的精準(zhǔn)理解。特別地,BEV視角在多傳感器融合中發(fā)揮關(guān)鍵作用,幫助神經(jīng)網(wǎng)絡(luò)處理多個(gè)視角的圖像,提升目標(biāo)檢測和環(huán)境理解的準(zhǔn)確性。端到端的解決方案正被探索,旨在簡化自動(dòng)駕駛系統(tǒng)中的感知、預(yù)測、規(guī)劃和控制步驟,以提高系統(tǒng)效率和響應(yīng)速度。
一、深度學(xué)習(xí)基礎(chǔ)原理神經(jīng)網(wǎng)絡(luò)的生物學(xué)啟發(fā)與數(shù)學(xué)原理
從數(shù)學(xué)角度看,人工神經(jīng)網(wǎng)絡(luò)的核心運(yùn)算為權(quán)重與輸入數(shù)據(jù)的乘積再加上偏差。以圖像識別為例,輸入圖像的像素值與權(quán)重相乘并加上偏差,不斷調(diào)整權(quán)重和偏差以優(yōu)化輸出結(jié)果。若輸出結(jié)果與標(biāo)注不一致,便通過反向反饋機(jī)制修正權(quán)重和偏差,直至得到滿意結(jié)果。這一過程需要進(jìn)行大量的乘法和加法運(yùn)算,因此,專門為處理此類運(yùn)算設(shè)計(jì)的NPU或GPU在深度學(xué)習(xí)中發(fā)揮著重要作用。
卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)算過程
卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中常用的模型,由卷積和神經(jīng)網(wǎng)絡(luò)兩部分組成。卷積操作通過一個(gè)特定的視框在圖像上滑動(dòng)掃描,為每個(gè)像素區(qū)域分配權(quán)重,從而生成新的特征圖。與傳統(tǒng)全連接方式相比,卷積減少了計(jì)算量,且在權(quán)重之上增加了權(quán)重,增強(qiáng)了模型對圖像特征的提取能力。
卷積后的特征圖在一定程度上失去了原圖像的物理含義,但更便于模型進(jìn)行后續(xù)的運(yùn)算和特征提取。在卷積過程中,還可以根據(jù)圖像大小和需求進(jìn)行分層卷積,進(jìn)一步優(yōu)化運(yùn)算效率。隨著卷積層數(shù)的增加,數(shù)據(jù)量會(huì)不斷增大,此時(shí)池化操作應(yīng)運(yùn)而生。池化通過將多個(gè)像素合并為一個(gè)進(jìn)行處理,減少數(shù)據(jù)量,降低計(jì)算復(fù)雜度,提高運(yùn)算效率。在實(shí)際應(yīng)用中,卷積和池化的層數(shù)設(shè)置通?;诮?jīng)驗(yàn)和對模型性能的考量。
二、視覺感知算法與目標(biāo)檢測視覺感知算法的構(gòu)成與流程
視覺感知算法主要由圖像的預(yù)處理、神經(jīng)網(wǎng)絡(luò)模型和后處理三部分組成。預(yù)處理階段對輸入圖像進(jìn)行整合和前處理,為后續(xù)模型輸入做準(zhǔn)備;神經(jīng)網(wǎng)絡(luò)模型涉及深度學(xué)習(xí)算法,包含目標(biāo)檢測、語義分割、圖像分類等多種功能;后處理則利用傳統(tǒng)算法優(yōu)化網(wǎng)絡(luò)模型的輸出效果。
在實(shí)際應(yīng)用場景中,如自動(dòng)駕駛的目標(biāo)檢測,由于現(xiàn)實(shí)中圖像包含多個(gè)目標(biāo),簡單的圖像分類無法滿足需求,需要進(jìn)行語義分割。語義分割在預(yù)處理階段先利用圖像的閾值信息將目標(biāo)框選出來,再針對每個(gè)框內(nèi)的目標(biāo)分別進(jìn)行神經(jīng)網(wǎng)絡(luò)運(yùn)算,以實(shí)現(xiàn)對多個(gè)目標(biāo)的精準(zhǔn)識別。像車道線檢測、紅綠燈檢測和攝像頭障礙物檢測等任務(wù),都需要先進(jìn)行分割操作,然后再進(jìn)行后續(xù)的檢測和識別。
障礙物檢測的多頭網(wǎng)絡(luò)與多模型應(yīng)用
障礙物檢測通常需要獲取目標(biāo)物的多種信息,如動(dòng)態(tài)或靜態(tài)狀態(tài)、速度、長寬高以及3D形狀等。這并非僅通過一次神經(jīng)網(wǎng)絡(luò)運(yùn)算就能完成,往往需要運(yùn)行多個(gè)模型協(xié)同工作。例如,?Fast R-CNN模型,首先進(jìn)行語義分割,然后進(jìn)行分類,再分別對2D和3D信息進(jìn)行檢測。
多頭網(wǎng)絡(luò)的出現(xiàn)就是為了解決這一問題,它通過不同的檢測模塊,對同一輸入進(jìn)行不同維度的檢測,如一個(gè)模塊輸出分類結(jié)果,一個(gè)模塊輸出2D邊框信息,另一個(gè)模塊輸出3D形狀等,從而全面獲取目標(biāo)物的各類信息。車道線檢測目前多采用神經(jīng)網(wǎng)絡(luò)方法,相較于傳統(tǒng)的灰度識別,神經(jīng)網(wǎng)絡(luò)檢測準(zhǔn)確率更高,能有效減少偏差。
三、BEV空間感知模型BEV模型產(chǎn)生的背景與原理
在自動(dòng)駕駛中,傳統(tǒng)基于透視視角的圖像信息難以直接與其他傳感器融合,且存在諸多局限,如地平面假設(shè)難以滿足。為解決這些問題,BEV空間感知模型應(yīng)運(yùn)而生。
BEV模型通過神經(jīng)網(wǎng)絡(luò),先將攝像頭數(shù)據(jù)輸入骨干網(wǎng)絡(luò)提取特征,然后進(jìn)行跨攝像頭融合,最后轉(zhuǎn)換到BEV空間。這種方法避免了傳統(tǒng)方法中各攝像頭數(shù)據(jù)單獨(dú)處理后再融合帶來的問題,如目標(biāo)ID識別困難、位移偏差處理復(fù)雜等。BEV模型將多個(gè)攝像頭的數(shù)據(jù)統(tǒng)一處理,通過調(diào)整權(quán)重和偏差,實(shí)現(xiàn)了更高效的融合,使得跨攝像頭融合和時(shí)序多幀融合變得更加容易。
BEV模型的優(yōu)勢、挑戰(zhàn)與應(yīng)用
BEV模型具有多方面優(yōu)勢,在空間融合方面表現(xiàn)出色,便于進(jìn)行3D目標(biāo)識別、跟蹤和預(yù)測,能更有效地與其他傳感器信息融合,為端到端優(yōu)化提供便利。然而,其應(yīng)用也面臨一些挑戰(zhàn),對算力要求較高,至少需要50Tops算力;對傳感器聯(lián)合標(biāo)定和時(shí)間同步的要求也很嚴(yán)格;并且需要大量的數(shù)據(jù)支持。
特斯拉采用了BEV網(wǎng)絡(luò),小鵬、地平線等企業(yè)也在積極研發(fā),部分量產(chǎn)車型已體現(xiàn)出該技術(shù)的應(yīng)用成果。BEV模型可實(shí)現(xiàn)多任務(wù)功能,如3D物體檢測、語義地圖構(gòu)建和運(yùn)動(dòng)預(yù)測等,能根據(jù)不同時(shí)間的信息進(jìn)行補(bǔ)償和預(yù)測,為自動(dòng)駕駛提供更全面、精準(zhǔn)的環(huán)境感知。
四、占用網(wǎng)絡(luò)與端到端方案占用網(wǎng)絡(luò)的原理與特點(diǎn)
O占用網(wǎng)絡(luò)是特斯拉為解決視覺長尾問題提出的模型。該模型將周邊空間劃分為小立方體,通過預(yù)測3D空間的占用概率(0/1)來還原目標(biāo)物的形狀和位置,并利用神經(jīng)輻射場(NeRF)的可微分渲染圖像進(jìn)行監(jiān)督訓(xùn)練。
占用網(wǎng)絡(luò)的優(yōu)勢在于,它能夠預(yù)測空間占用情況,有效解決非標(biāo)物體的識別問題,還可利用多攝像頭和視頻時(shí)序信息,對動(dòng)態(tài)車流進(jìn)行測量,透過遮擋持續(xù)檢測已存在的對象,且內(nèi)存和計(jì)算效率較高,能在約10ms內(nèi)運(yùn)行。但它也存在數(shù)據(jù)量要求高、云端算力要求高的缺點(diǎn)。目前,特斯拉已開始應(yīng)用該模型,其他企業(yè)仍處于起步階段,預(yù)計(jì)2025年前后會(huì)有更多車型應(yīng)用。
端到端方案的概念與發(fā)展趨勢
傳統(tǒng)自動(dòng)駕駛方案按感知、預(yù)測、規(guī)劃、控制的順序依次執(zhí)行,結(jié)構(gòu)簡單、可解釋性強(qiáng),但存在規(guī)則復(fù)雜、場景泛化性不足的問題。端到端方案則融合了這些模塊,形成一個(gè)統(tǒng)一架構(gòu),通過傳感器輸入,直接完成從原始數(shù)據(jù)到軌跡或控制信號的映射,更符合人類駕駛原理,具有更高的上限。
以UniAD基于nuScenes訓(xùn)練集的表現(xiàn)為例,其在各方面均優(yōu)于傳統(tǒng)技術(shù)。特斯拉FSD v12據(jù)稱已實(shí)現(xiàn)端到端方案,國內(nèi)的華為、小鵬等企業(yè)也在積極探索該領(lǐng)域。端到端方案與BEV、transformer的結(jié)合是當(dāng)前的研究熱點(diǎn),這種結(jié)合能夠充分發(fā)揮各技術(shù)的優(yōu)勢,實(shí)現(xiàn)從圖像輸入到?jīng)Q策輸出的直接生成,減少中間模塊的接口交互,提高系統(tǒng)的整體性能和效率。
聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議。文章事實(shí)如有疑問,請與有關(guān)方核實(shí),文章觀點(diǎn)非本網(wǎng)觀點(diǎn),僅供讀者參考。
相關(guān)新聞
- 尊界S800發(fā)布6大核心技術(shù),預(yù)計(jì)5月底正式上市
- 科創(chuàng)50指數(shù)一周漲逾7%科技股走強(qiáng)持續(xù)推高“中國
- 智能駕駛芯片市場競爭白熱化,本土企業(yè)加速上車
- 近視防控需求激增,創(chuàng)新眼鏡行業(yè)如何在兒童市場中脫
- 丹江口水庫上岸漁民:借直播東風(fēng),轉(zhuǎn)型升級鋪就生態(tài)
- 和府撈面榮膺“鄉(xiāng)村振興杰出貢獻(xiàn)榜樣” 助力地方農(nóng)
- 《酌見》重磅回歸:俞敏洪對話董明珠 洞見“鐵娘子
- 自如攜手景順成立資管平臺(tái)“星耀如景”, 首發(fā)12
- 無人機(jī)“秒出警”助力高速事故快處,保障春運(yùn)道路暢
- 長征八號甲首飛成功,拉開中國航天與航空高密度發(fā)展


- 錦江樂園華麗升級,“哈利·波特”魔法世界科技融
- 北交所兩融余額42.72億元較上一日增加375
- 明園蜂業(yè)丨時(shí)尚便攜,從經(jīng)典到創(chuàng)新,健康方式再升
- 從小眾到主流,銀發(fā)游火熱!多樣需求激活多元產(chǎn)業(yè)
- 蘇州黃埭鎮(zhèn):為經(jīng)濟(jì)高質(zhì)量發(fā)展提供科技支撐保障
- 工行溫度民勤支行暖心服務(wù)聽障客戶
- 陳勇:C909實(shí)現(xiàn)全生命周期系列化發(fā)展道路為中
- 華潤醫(yī)藥商業(yè)集團(tuán)有限公司榮獲由ICAS英格爾認(rèn)
- 微短劇行業(yè)實(shí)施分類分層審核一年,精品化趨勢顯現(xiàn)
- “NBA版春晚”落幕新賽制引發(fā)網(wǎng)友熱議 我國現(xiàn)

- 聚焦新質(zhì)生產(chǎn)力與產(chǎn)業(yè)國際競爭力提升2024年上
- 澳特證券am broker提示:債市“強(qiáng)?!蹦?/a>
- 低空經(jīng)濟(jì)成為地方兩會(huì)高頻詞,行業(yè)有望迎來快速發(fā)
- 以節(jié)能環(huán)保為核心,萬和電氣連續(xù)三年領(lǐng)跑一級能效
- 春晚扭秧歌人形機(jī)器人爆火出圈,我國機(jī)器人相關(guān)企
- 綠色運(yùn)力崛起!新能源重卡交付火爆開啟物流新篇
- 美團(tuán)企業(yè)版總經(jīng)理康凱:供應(yīng)鏈整合、場景管控、服
- 歐克科技等成立智能智造創(chuàng)業(yè)投資基金出資額15億
- 喜報(bào)!南京市建鄴區(qū)“愛情灣”公園被納入長三角區(qū)
- 豐田開發(fā)新型燃料電池系統(tǒng)可用于商用車和乘用車等