最近這段時間,關于純視覺智駕方案的討論比較火,口水滿天飛,大家互相懟,其實核心的爭論只有一個,就是攝像頭能不能消滅激光雷達。
彎彎繞繞也許是男女談情的小妙招,但是,談論技術最好還是單刀直入。
如果站在整車的視角,激光雷達的應用不僅局限于智駕,還能用于主動安全、智能底盤,甚至可能在未來四處開花,發(fā)展出更加花里胡哨的玩法,對整車而言,激光雷達是不可能被消滅的。
因此,不要顧左右而言他,也別站在整車的角度談激光雷達,對著問題的根本直搗黃龍,問題的關鍵或者說關鍵的問題是:單純看智駕,攝像頭能不能消滅激光雷達?
兩年前,關于這個問題還沒有太多的爭論。
在暗光、炫光、逆光的光照條件下,攝像頭感知能力明顯不及激光雷達,即便不考慮光照,攝像頭拍攝到的是二維圖像,當時的視覺神經網絡很難在二維圖像中得到比較細致的3D信息,這就使得純視覺智駕方案可以運行在車輛距離比較大、障礙物種類有限的高速場景,很難用于車輛密集、障礙物種類眾多的城區(qū)場景。
隨后,特斯拉在2022年CVPR會議上公開占用網絡,并在同年的AI DAY上給出了占用網絡的模型架構,業(yè)界一片歡騰:終于有希望拿掉成本高昂的激光雷達了,要知道,2022年,單顆高線數(shù)激光雷達的價格依然高達上萬!
占用網絡解決了本質上仍然是2D信息的BEV網絡的兩大問題。
第一,它將3D空間劃分成一個又一個體素網格,為每個網絡分配一個特征向量,通過對每個體素進行三維語義占有預測,給出車周環(huán)境精細的3D信息。
第二,由于其對物體形狀、背景環(huán)境、異常障礙等都能進行可靠的表示和識別,從而可以有效地處理訓練數(shù)據集中未曾出現(xiàn)過的物體。
所以,視覺占用網絡出現(xiàn)之后,激光雷達的作用的確是大大下降了。
宜將剩勇追窮寇,不可沽名學霸王。
在良好光照條件下,視覺占用網絡的兩種優(yōu)異特性給了激光雷達重重的打擊,ISP的進化又進一步削弱了激光雷達在暗光、炫光和逆光場景下的優(yōu)勢。
插一句題外話,在雨雪霧天氣條件下,激光雷達的工作特性盡管比攝像頭好一些,但跟毫米波雷達相比,攝像頭和激光雷達大哥不說二哥,工作特性都比較差,那些認為激光雷達能抗惡劣天氣的說法其實是不對的。
攝像頭既然可以通過視覺神經網絡算法的進步提高三維建模能力,當然也可以通過其他技術的進步提高抗暗光和抗強光的能力,ISP就是這樣的技術之一。
目前,ISP算法的進步已經可以比較好地支撐攝像頭在暗光和逆光下的表現(xiàn)。
說起來,原理倒也不復雜。在一般的暗光條件下,通過自動增益控制技術,根據環(huán)境光線自動調整圖像亮度和對比度,拉高特別暗的區(qū)域的像素值,就可以顯露暗光區(qū)域丟失的畫面細節(jié)。
強光條件下,場景中不同區(qū)域亮度的差異大,采用高動態(tài)范圍技術,抑制強光部分的過分曝光,就可以同時兼顧亮部和暗部的細節(jié),做到亮處不過曝、暗處細節(jié)不丟失。
說起攝像頭的這種超能力,有一個有趣的對比。
有種說法認為,人眼大概相當于3-6億像素的相機,目前800萬像素的車載攝像頭永遠無法和人類相比。
但是,有了AI ISP技術,攝像頭可以自動調節(jié)不同區(qū)域圖像的對比度和曝光強度,這顯然是AI技術加持的攝像頭能碾壓人眼的地方。
不要覺得不可思議,這一輪AI技術大爆發(fā)以來,大模型已經在很多層面上超越了人類的能力,AI ISP技術只不過是AI技術在圖像處理領域的又一次秀肌肉而已。
做人不能刻舟求劍,死守著老理兒,尤其在技術快速發(fā)展的年代,更得時刻保持刷新自己認知的能力。
長江后浪推前浪,后浪把前浪拍倒在沙灘上。
AI技術的進步催生了視覺專用網絡,增強了攝像頭在暗光、炫光下的工作能力,但這并不意味著激光雷達從此沒有了價值。
原因有二,第一,視覺占用網絡的源頭來自激光雷達,第二,攝像頭在暗光、炫光下依然比不上激光雷達。
萬事萬物都有緣起,藥匣子說不想知道自己是怎么來的,只想知道自己到底是怎么沒的,但我們要知道的恰恰是:視覺占用網絡到底是怎么來的?
這幾年,網上經常出現(xiàn)搭載激光雷達的特斯拉車型的照片,按馬斯克一條路走到黑的性格,這當然不意味著特斯拉下一代車型要加裝激光雷達,這只不過說明,它的視覺占用網絡需要激光雷達提供真值做訓練。
具體的做法是,將高質量、高線數(shù)的激光雷達搭載在特斯拉的車型上,在路側中收集數(shù)據,在自動化數(shù)據生產線中做數(shù)據標注,通過激光雷達點云包含的距離幾何信息在攝像頭圖像中標注出精確的3D信息,將精標后的數(shù)據投喂給視覺神經網絡做訓練。
如此乾坤大挪移,視覺神經網絡就學到了激光雷達獲取3D信息的能力。
很顯然,視覺占用網絡模仿學 的是激光雷達的能力,和真值提供者當然會存在一定的差距。
再說到光照條件,激光雷達通過光線的飛行和反射測量物體距離,這種工作特性和光線亮暗一點關系都沒有。
攝像頭就不一樣了,ISP技術處理強光比較容易,但在真正的暗光條件下,其工作能力比較差。
巧婦難為無米之炊,沒有足夠的光線反射到攝像頭的感光單元上,AI ISP技術也無法“無中生有”。
在光線真的很弱的情況下,上帝說沒有光也就沒有了光,它兒子耶穌來了也沒用,我說的。
看這張圖,攝像頭的抗暗光能力遠遜色于抗強光能力,其道理就來自于這里。
隨著算法的進步和更多數(shù)量的訓練,視覺占用網絡可以越來越準確地估計3D信息,但是,激光雷達可以提供真實而非估計的幾何3D信息。
在暗光條件下,激光雷達雷達具有更強的工作能力?;谶@兩種能力,單純看智駕,攝像頭也依然無法消滅激光雷達。
嚴謹一點的話,可以再加一個定語,攝像頭無法消滅高階智駕中的激光雷達。