摘要:算力上的提前布局,讓小鵬汽車在國內(nèi)率先實(shí)現(xiàn)端到端智能駕駛大模型量產(chǎn)上車。小鵬汽車認(rèn)為,端到端只是開始,不是終局,真正的競(jìng)賽正在云端展開,云端大模型才是制勝關(guān)鍵。擁有強(qiáng)大算力的阿里云,支撐小鵬汽車端到端大模型的快速迭代。
智能駕駛近兩年的提速,端到端技術(shù)無疑是關(guān)鍵動(dòng)因。
2024年10月24日,小鵬汽車宣布AI天璣5.4.0正式開啟公測(cè),并首發(fā)搭載在小鵬P7+上。新版本為小鵬汽車帶來了最強(qiáng)AI智能駕駛功能,根據(jù)數(shù)據(jù)統(tǒng)計(jì),已經(jīng)享受到公測(cè)版的P7+用戶,在用戶滲透率和里程滲透率上均取得了顯著提升。早些時(shí)候,小鵬汽車已經(jīng)完成了國內(nèi)首個(gè)端到端智能駕駛大模型量產(chǎn)上車。
▲小鵬汽車發(fā)布AI天璣5.4.0系統(tǒng),大幅提升智能駕駛能力
這一系列的成績,源于小鵬汽車多年來全力投入AI的決心。早在2022年,小鵬汽車就率先完成城市導(dǎo)航輔助駕駛(NGP)的落地。當(dāng)時(shí),小鵬汽車自動(dòng)駕駛團(tuán)隊(duì)就在思考,是否需要更進(jìn)一步提升AI泛化能力。同年4月,小鵬汽車開始嘗試對(duì)傳統(tǒng)智能駕駛中的感知、融合、預(yù)測(cè)、規(guī)劃、控制、定位等技術(shù)模塊進(jìn)行融合。這也成為小鵬汽車探索端到端大模型的雛形。
小鵬汽車董事長何小鵬在談及端到端智能駕駛大模型時(shí)強(qiáng)調(diào),“往后10年、20年,我不知道今天的大模型邏輯是否會(huì)適用,但它一定會(huì)比之前的算法或規(guī)則模型都要強(qiáng)?!?/p>
智能駕駛新一輪競(jìng)爭正圍繞算法、算力、數(shù)據(jù)三要素展開,出現(xiàn)任何一塊短板,都將引發(fā)木桶效應(yīng)。這場(chǎng)競(jìng)賽中,小鵬汽車和阿里云一直在并肩前行。
01.AI席卷智能駕駛,小鵬汽車篤定端到端技術(shù)路線
端到端(End-to-End),起初并非源于智能駕駛,而是多用于深度學(xué) 領(lǐng)域的一套方法,并且在語音識(shí)別、自然語言處理等領(lǐng)域已有比較多的學(xué)術(shù)研究。其設(shè)計(jì)原理是神經(jīng)網(wǎng)絡(luò)在學(xué) 中不進(jìn)行分模塊或分階段訓(xùn)練,直接從輸入數(shù)據(jù)到輸出結(jié)果,減少人為干預(yù)和預(yù)處理的需求,類似于encoder-decoder架構(gòu)。
端到端技術(shù)能夠避免傳統(tǒng)人工特征提取中的信息損失,提高模型的效率和準(zhǔn)確性,簡化訓(xùn)練流水線。
在智能駕駛領(lǐng)域,端到端智能駕駛方案利用統(tǒng)一的深度學(xué) 神經(jīng)網(wǎng)絡(luò),將感知、規(guī)劃與控制等多個(gè)功能模塊整合為一體。將攝像頭、傳感器實(shí)時(shí)采集的原始數(shù)據(jù)作為輸入,直接輸出為轉(zhuǎn)向、加速、制動(dòng)等駕駛指令,這種一體化架構(gòu)實(shí)現(xiàn)了信息無縫傳輸并降低延遲,讓汽車反應(yīng)更加順滑。特斯拉在北美率先推出的FSD V12版本,就采用了端到端技術(shù)。同樣,小鵬汽車在國內(nèi)快速推進(jìn)了端到端智能駕駛。
小鵬汽車選擇的是“云端大模型”路線,通過構(gòu)建云端大模型,然后將云端大模型蒸餾到車端,在車端進(jìn)行模型部署。小鵬云端大模型的參數(shù)量是車端的80倍,云端強(qiáng)化訓(xùn)練后,車端大模型的上限大幅提高。
▲小鵬云端大模型的參數(shù)量是車端的80倍
據(jù)小鵬汽車自動(dòng)駕駛產(chǎn)品高級(jí)總監(jiān)袁婷婷介紹,端到端往往包含非常復(fù)雜的深度學(xué) 網(wǎng)絡(luò)。但大模型的黑盒問題導(dǎo)致難以解釋其決策過程和推理邏輯,尤其是表現(xiàn)出不良效果后,不可解釋性還增加了解決和驗(yàn)證的難度,更無法保證其安全可靠性。
基于此,根據(jù)端到端的思路,小鵬汽車隨即推出了“三網(wǎng)合一”架構(gòu),其中XNet類似于人的眼睛,對(duì)現(xiàn)實(shí)世界中的可通行空間進(jìn)行3D還原;XPlanner類似于人的肌肉和小腦直覺,通過海量數(shù)據(jù)的不間斷訓(xùn)練,優(yōu)化駕駛策略;XBrain類似于人的大腦,會(huì)進(jìn)行更深入的理解和意圖推理,包括時(shí)序、環(huán)境、路牌文字等。三網(wǎng)以全局性視角聯(lián)合執(zhí)行駕駛?cè)蝿?wù),可以對(duì)模型進(jìn)行聯(lián)合預(yù)訓(xùn)練和標(biāo)注,同時(shí)三網(wǎng)又各有側(cè)重,出現(xiàn)問題可快速診斷定位,了解模型和系統(tǒng)的缺陷問題。更重要的是,在駕駛安全性上,三網(wǎng)使得系統(tǒng)應(yīng)對(duì)一些特殊、緊急場(chǎng)景的上限變得更高的同時(shí),也需要一定的安全措施保證下限。
在端到端技術(shù)的加持下,小鵬汽車整體邁向了以輕地圖、輕雷達(dá)、重算力為核心的智能駕駛方案。針對(duì)復(fù)雜路況,能夠做到點(diǎn)到點(diǎn)的輔助駕駛能力,包括自動(dòng)通過高速ETC閘機(jī)、紅綠燈識(shí)別、擁堵路段跟車以及主動(dòng)變道超車等等。尤其在體驗(yàn)和流暢性上,用戶基本感覺不到任何斷點(diǎn)。
小鵬汽車自動(dòng)駕駛產(chǎn)品高級(jí)總監(jiān)袁婷婷指出,行業(yè)內(nèi)一般用記憶泊車VPA(Valet Parking Assist)+NOA(Navigate on Autopilot)城市輔助駕駛的方式來實(shí)現(xiàn)車位到車位,這也是小鵬在2021年采用的方案。但使用拼接方案,就會(huì)存在卡頓,比如汽車行駛到停車場(chǎng)與公開道路的交匯點(diǎn)時(shí),會(huì)因切換軟件導(dǎo)致卡殼現(xiàn)象。
▲目前行業(yè)內(nèi)主要有三種端到端技術(shù)路線
目前小鵬汽車已經(jīng)通過端到端智能駕駛大模型對(duì)其能力進(jìn)行了全面升級(jí),在行業(yè)內(nèi)首個(gè)用一套智能駕駛軟件以及基于“端到端大模型”實(shí)現(xiàn)“車位到車位”。在最新的測(cè)試場(chǎng)景中,車位到車位的整條鏈路——從園區(qū)內(nèi)、地庫內(nèi),到過閘機(jī),再到公開道路的銜接,都能以更加流暢的體驗(yàn)方式實(shí)現(xiàn)。此外,路線規(guī)劃也能夠無感生成,讓駕駛變得更加便捷高效。
“絲滑、篤定、直覺性”這些用于形容老司機(jī)開車一樣的駕駛體驗(yàn),正在小鵬汽車端到端智能駕駛系統(tǒng)上呈現(xiàn)。
可以看到,端到端的出現(xiàn),突破了原先依靠規(guī)則驅(qū)動(dòng)的智能駕駛研發(fā)體系,至少在當(dāng)前階段,端到端已是自動(dòng)駕駛競(jìng)爭的關(guān)鍵技術(shù)路徑之一。
02.真正適配智能駕駛的算力底座
多年來在端到端智能駕駛大模型上的投入,模型參數(shù)量的急劇擴(kuò)張,使得小鵬汽車智能駕駛系統(tǒng)和功能迭代速度持續(xù)加快。
由于當(dāng)前車端芯片算力的限制,即便采用兩片Orin芯片,能支持的車端模型參數(shù)量依然有限。而云端大模型可以全面吸納智能駕駛數(shù)據(jù),不遺漏重點(diǎn)信息細(xì)節(jié)。通過大量數(shù)據(jù)訓(xùn)練,盡可能窮盡智能駕駛中的長尾問題,以覆蓋更多駕駛場(chǎng)景,使XNGP實(shí)現(xiàn)L3級(jí)的智能駕駛體驗(yàn)。
訓(xùn)練一個(gè)云端大模型,對(duì)大規(guī)模高性能算力以及數(shù)據(jù)存儲(chǔ)和處理提出了非常高的要求。其一,提高并行訓(xùn)練性能和利用率的要求,這對(duì)云基礎(chǔ)設(shè)施包括網(wǎng)絡(luò)互聯(lián)、帶寬,以及系統(tǒng)軟件優(yōu)化等帶來了挑戰(zhàn);其二,對(duì)模型訓(xùn)練持久穩(wěn)定性的要求,比如模型訓(xùn)練中斷,訓(xùn)練出現(xiàn)問題后能否快速拉起任務(wù),縮短故障時(shí)間;其三,大規(guī)模多模態(tài)數(shù)據(jù)的存儲(chǔ)與處理能力,實(shí)現(xiàn)并行訓(xùn)練的高性能、高吞吐,滿足模型訓(xùn)練不斷提升的數(shù)據(jù)量增長需求;其四,海量數(shù)據(jù)的存儲(chǔ)成本要求,在滿足數(shù)據(jù)處理性能要求的前提下,通過支持?jǐn)?shù)據(jù)分層存儲(chǔ),實(shí)現(xiàn)最優(yōu)的成本。
實(shí)現(xiàn)這些要求并非易事。大模型的預(yù)訓(xùn)練需要集群化,構(gòu)建萬卡甚至更大規(guī)模的集群,且整個(gè)集群需要組成一個(gè)龐大的“整體”。形象來說,就像每一排都有兩個(gè)人且兩人之間把腿綁在一起,共同前進(jìn)。只有每張GPU卡、每臺(tái)機(jī)器都以相同的“步伐”前進(jìn),才能提升整體的模型訓(xùn)練效率。
早在2022年,小鵬汽車就與阿里云在烏蘭察布建成了當(dāng)時(shí)中國最大的自動(dòng)駕駛智算中心“扶搖”,用于自動(dòng)駕駛模型訓(xùn)練?!胺鰮u”依托于阿里云靈駿智算集群構(gòu)建,該集群是阿里云面向AI時(shí)代打造的智能算力基礎(chǔ)設(shè)施,支撐了小鵬汽車端到端智能駕駛大模型的快速迭代。
▲2022年小鵬汽車與阿里云合作建立自動(dòng)駕駛智算中心
隨著模型規(guī)模擴(kuò)大到百億甚至千億量級(jí),一次訓(xùn)練任務(wù)需要更多GPU協(xié)同,規(guī)模會(huì)放大很多問題。
首先碰到的問題就是擴(kuò)展集群規(guī)模是否能帶來訓(xùn)練任務(wù)相同倍數(shù)的線性加速。為了將“相同步伐”效率提升到極致,阿里云升級(jí)到HPN 7.0網(wǎng)絡(luò)架構(gòu),把網(wǎng)絡(luò)能力推向一個(gè)全新的高度。通過3.2Tbps高性能RDMA網(wǎng)絡(luò)連接,讓服務(wù)器之間的通訊更順暢;自研的擁塞控制算法解決了路由的復(fù)雜度和數(shù)據(jù)交換的沖突;同時(shí),訓(xùn)練過程實(shí)現(xiàn)自動(dòng)網(wǎng)絡(luò)拓?fù)涓兄{(diào)度,為大模型訓(xùn)練自動(dòng)調(diào)度最佳網(wǎng)絡(luò)拓?fù)涞挠?jì)算節(jié)點(diǎn),從而減少通信開銷,進(jìn)一步提升訓(xùn)練效率。
此外,計(jì)算和存儲(chǔ)流量分離大大減少存儲(chǔ)IO和計(jì)算通信的互相干擾,進(jìn)而提升了整體GPU集群的計(jì)算效率。小鵬汽車在阿里云上的千卡級(jí)訓(xùn)練任務(wù)線性加速比可以達(dá)到90%以上。
由于訓(xùn)練任務(wù)的特殊性,部件故障會(huì)導(dǎo)致整體訓(xùn)練停滯,如何盡可能早的預(yù)測(cè)故障,以及發(fā)生故障后系統(tǒng)能快速拉起恢復(fù),是令小鵬汽車自動(dòng)駕駛技術(shù)團(tuán)隊(duì)頭疼的第二個(gè)問題。
小鵬汽車自動(dòng)駕駛中心大數(shù)據(jù)管理部負(fù)責(zé)人Jay提到,“訓(xùn)練是一個(gè)持續(xù)幾十天的過程,當(dāng)我們的訓(xùn)練規(guī)模越大,就有可能遇到越多的意外情況,訓(xùn)練過程中,穩(wěn)定性非常重要?!?/p>
針對(duì)這些問題,阿里云技術(shù)團(tuán)隊(duì)采取了一系列措施以提高系統(tǒng)的穩(wěn)定性和訓(xùn)練效率。阿里云提供千卡集群健康檢測(cè)能力,可實(shí)現(xiàn)對(duì)計(jì)算集群包括單節(jié)點(diǎn)算力檢查,單節(jié)點(diǎn)內(nèi)GPU互聯(lián)檢查,多節(jié)點(diǎn)互聯(lián)檢查等,實(shí)現(xiàn)在訓(xùn)練前、訓(xùn)練中和故障后及時(shí)發(fā)現(xiàn)問題節(jié)點(diǎn),并通過AI助手設(shè)置運(yùn)維策略,保障集群整體資源穩(wěn)定可用。同時(shí),配置節(jié)點(diǎn)分鐘級(jí)自動(dòng)自愈能力以及秒級(jí)的訓(xùn)練進(jìn)度保存機(jī)制,實(shí)現(xiàn)故障后任務(wù)仍可以自動(dòng)恢復(fù),并以無損的訓(xùn)練進(jìn)度實(shí)現(xiàn)續(xù)訓(xùn),從而節(jié)約訓(xùn)練時(shí)間、降低訓(xùn)練成本。
今年,小鵬汽車也開始使用阿里云容器計(jì)算服務(wù)ACS,該服務(wù)為小鵬提供基礎(chǔ)設(shè)施全托管算力服務(wù),無需管理和維護(hù)底層服務(wù)器,即使遇到服務(wù)器發(fā)生故障,應(yīng)用也能迅速切換到其他服務(wù)器,確保模型訓(xùn)練的連續(xù)運(yùn)行。
▲小鵬汽車在云端加速智能創(chuàng)新
智能駕駛模型的演進(jìn)迭代需要海量數(shù)據(jù),過程中的數(shù)據(jù)采集、挖掘、處理,又同樣對(duì)存儲(chǔ)、數(shù)據(jù)處理能力提出了更高要求。
截至今年9月小鵬汽車公開數(shù)據(jù)顯示,小鵬汽車使用了折算里程超10億+公里的視頻訓(xùn)練,累計(jì)646萬公里、1972個(gè)城市和區(qū)縣的實(shí)車測(cè)試,以及累計(jì)2.16億公里、2.2萬核心模擬場(chǎng)景、5.8萬專業(yè)模擬場(chǎng)景的仿真測(cè)試。
阿里云把內(nèi)存、本地磁盤、CPFS高性能并行文件存儲(chǔ)以及OSS對(duì)象存儲(chǔ)等形成一個(gè)完整的階梯型存儲(chǔ)架構(gòu),進(jìn)行統(tǒng)一的管理,把熱數(shù)據(jù)放在延遲最低的存儲(chǔ)上面,并實(shí)現(xiàn)冷熱數(shù)據(jù)的自動(dòng)流轉(zhuǎn),不斷提升存儲(chǔ)的使用效率,降低存儲(chǔ)成本。
數(shù)據(jù)的積累屬于基礎(chǔ),更重要的是讓數(shù)據(jù)有效轉(zhuǎn)起來。小鵬汽車通過自研工具鏈結(jié)合阿里云大數(shù)據(jù)平臺(tái)、數(shù)據(jù)庫服務(wù)等實(shí)現(xiàn)全棧數(shù)據(jù)閉環(huán),對(duì)數(shù)據(jù)的清洗處理以及高效的挖掘,數(shù)據(jù)的高效流轉(zhuǎn),端到端大模型的大規(guī)模分布式訓(xùn)練,實(shí)現(xiàn)測(cè)試階段實(shí)車測(cè)試與仿真測(cè)試并重,加快迭代節(jié)奏,推動(dòng)智能駕駛技術(shù)的快速發(fā)展。
小鵬汽車自動(dòng)駕駛中心大數(shù)據(jù)管理部負(fù)責(zé)人Jay表示:“明年小鵬整體的數(shù)據(jù)量將迎來大幅度提高,更需要云基礎(chǔ)設(shè)施做很好的承載?!?/p>
03. 當(dāng)智能駕駛的熱情被點(diǎn)燃
何小鵬曾說過:“小鵬從創(chuàng)始之初就一直致力于做中國的自動(dòng)駕駛第一?!?/p>
通過“All in AI”,小鵬汽車不僅率先實(shí)現(xiàn)端到端智能駕駛大模型量產(chǎn)上車,根據(jù)“端到端四部曲”規(guī)劃,在未來兩年,小鵬還將基于L2的硬件和成本實(shí)現(xiàn)L3+的用戶體驗(yàn),并最終通往L4無人駕駛。
小鵬汽車自動(dòng)駕駛負(fù)責(zé)人李力耘曾在接受采訪時(shí)表示,端到端時(shí)代,好似從冷兵器時(shí)代來到熱兵器時(shí)代。過去的輔助駕駛時(shí)代是“冷兵器時(shí)代”,只要湊齊了武林高手就可以打。但熱兵器時(shí)代需要更大的算力、更多的數(shù)據(jù)、讓算力和數(shù)據(jù)流轉(zhuǎn)起來的機(jī)制和工程能力。擁有強(qiáng)大算力的阿里云,也將持續(xù)支撐小鵬汽車端到端大模型的快速迭代。(內(nèi)容參考《云棲戰(zhàn)略參考》)
來源:車東西