熱衷于“拉仇恨值”的馬斯克前不久再一次不負(fù)眾望,給我們貢獻(xiàn)了四月的最后一瓜——激光雷達(dá)傻瓜論。
坊間流傳一個(gè)說法:激光雷達(dá)就是自動(dòng)駕駛的“眼睛”,換句話說,凡是想搞自動(dòng)駕駛的廠商,必須先拜激光雷達(dá)這個(gè)“山頭”。
不過,在4月24日的“Autonomy Day”產(chǎn)品發(fā)布會(huì)上,懟天懟地懟空氣的馬斯克就將炮火對(duì)準(zhǔn)了激光雷達(dá)。
原話是這么說的,“Lidar is a fool’s errand”,傻子才用激光雷達(dá),現(xiàn)在誰(做自動(dòng)駕駛)還要靠激光雷達(dá),那就注定完蛋!不信走著瞧!
言辭之激烈,內(nèi)容之放肆,放在“狂言人設(shè)”的馬斯克身上,都有些令人驚訝了。于是乎,一夜之間,AI圈、汽車圈、朋友圈都炸了。各路大佬紛紛下場,從技術(shù)爭論吵到人品諷刺,要多熱鬧有多熱鬧,媒體群里也洋溢著歡樂的氣氛:頭條穩(wěn)了!
馬斯克用一周的時(shí)間,如同葫蘆娃一樣為大家貢獻(xiàn)了“一根藤上七個(gè)瓜”。
“做車一族”集體diss馬斯克的觀點(diǎn),馭勢科技、文遠(yuǎn)知行、Autowise等出行企業(yè),以及Velodyne等激光雷達(dá)企業(yè)的重要負(fù)責(zé)人,都旗幟鮮明地表示,自動(dòng)駕駛想要完全擺脫激光雷達(dá),根本不可能。
但馬斯克本人并不孤單,很快科技撰稿人Steve Cheney就出來聲援,認(rèn)為“三年內(nèi)所有明智的人都會(huì)拋棄激光雷達(dá)”,理由也和馬斯克一樣,因?yàn)?激光雷達(dá))“沒有必要且非常昂貴”。
不得不說,雙方大佬的觀點(diǎn)都是一些……老生常談。其實(shí),關(guān)于自動(dòng)駕駛的實(shí)現(xiàn)到底是靠激光雷達(dá)還是攝像頭,這個(gè)話題早已爭論多年了。
更令我們感興趣的是,“激光雷達(dá)傻瓜論”出現(xiàn)在當(dāng)下這個(gè)時(shí)間節(jié)點(diǎn),或許并非偶然。其背后隱含的是自動(dòng)駕駛汽車長期以來未能解決的痼疾,也確實(shí)到了該重新思考方向的時(shí)候。
今天我們就用一篇文章幫大家捋捋清楚,當(dāng)大佬們談?wù)摷す饫走_(dá)時(shí),究竟在談些什么?
當(dāng)眾diss激光雷達(dá)?
馬斯克表示:坐下,常規(guī)操作!
吃瓜之前,咱們先捋一捋,自動(dòng)駕駛與激光雷達(dá)之間的緊密關(guān)系:
如果我們要做一臺(tái)自動(dòng)駕駛車,那么需要完成幾個(gè)必需而關(guān)鍵步驟:首先是感知,即獲取外界的信息,然后判斷,主要依賴云端算法,最后做出決策,該停時(shí)停,該走時(shí)走。
由此可見,感知階段是自動(dòng)駕駛汽車性能最基本、最重要的信息來源和體驗(yàn)保障。而目前主流的感知方式,則是依靠雷達(dá),攝像頭和激光雷達(dá)這三大傳感器系統(tǒng)實(shí)現(xiàn)。
這三種方式各有利弊,其中“激光雷達(dá)”是一直是產(chǎn)業(yè)界關(guān)注的焦點(diǎn)。原因也很簡單,激光雷達(dá)具有雷達(dá)的測距能力,但分辨率又比雷達(dá)高;具有攝像頭的感知能力,但又可以不受光線條件的限制。它唯一的缺點(diǎn)是,造價(jià)太高,無法大規(guī)模地使用在量產(chǎn)車上。
在過去的幾年間,幾乎所有自動(dòng)駕駛廠商都無法回避激光雷達(dá)。區(qū)別只是在于,誰能讓這三者的排列組合更高效、更精準(zhǔn)、更便宜。比如豐田TRI 研究院打造的無人駕駛汽車,就在車身上武裝了7個(gè)Velodyne 的激光雷達(dá)。而谷歌自動(dòng)駕駛公司W(wǎng)aymo獨(dú)立之后做的第一件事,就是努力將激光雷達(dá)的成本暴跌,從原來7萬美元干到了7500美元。
與行業(yè)對(duì)激光雷達(dá)的追捧相比,馬斯克是個(gè)十足的異類。
他堅(jiān)持認(rèn)為使用激光雷達(dá)是一個(gè)錯(cuò)誤的選擇,在目前的智能駕駛量產(chǎn)汽車中,只靠攝像頭的僅特斯拉一家。這至少說明,馬斯克不是“口嫌體正直”,而是發(fā)自內(nèi)心地認(rèn)為激光雷達(dá)對(duì)自動(dòng)駕駛的未來毫無價(jià)值。
說到這里,“課代表”來給大家總結(jié)一下,“倒雷派”(diss激光雷達(dá)的一部分人)的幾個(gè)重要論點(diǎn):
1.激光雷達(dá)成本太高。由于激光雷達(dá)的“不可取代”性,相應(yīng)的價(jià)格也十分高昂,這就導(dǎo)致汽車廠商和芯片公司都很難在激光雷達(dá)的前提下實(shí)現(xiàn)盈利。
那么為何不考慮降低成本呢?目前激光雷達(dá)市場主要是靠汽車行業(yè)在支撐,短期內(nèi)幾乎不可能出現(xiàn)新的大規(guī)模需求,機(jī)械式激光雷達(dá)的生產(chǎn)組裝效率也無法迅速提升,邊際成本自然居高不下。
而有的企業(yè)為了降低整車價(jià)格,采用了更便宜的固態(tài)激光雷達(dá),但也帶來了新的問題,那就是這種雷達(dá)無法360度轉(zhuǎn)動(dòng),不能探測背后的情況,還需要引入新的傳感器,在經(jīng)濟(jì)效應(yīng)上并不可行。
2.激光雷達(dá)實(shí)際應(yīng)用中有bug。一個(gè)是由于不能識(shí)別顏色,導(dǎo)致激光雷達(dá)無法完成跟蹤目標(biāo)等任務(wù);同時(shí),激光雷達(dá)在高速移動(dòng)中要處理的信號(hào)越多,海量像素會(huì)對(duì)廣電探測器帶來干擾,造成識(shí)別進(jìn)度下降;此外,激光雷達(dá)需要額外插入外部適配器進(jìn)行充電,使用上更加繁瑣。
3.更關(guān)鍵的是,以激光雷達(dá)為提升汽車感知能力的捷徑,也催生了科技公司和汽車廠商的“懶惰”。主要體現(xiàn)在高級(jí)自動(dòng)駕駛方案上過分依賴和堆砌激光雷達(dá),使得他們或多或少地回避了對(duì)自動(dòng)駕駛來說至關(guān)重要的視覺識(shí)別算法和芯片基本問題。換句話說,激光雷達(dá)不但不能解決實(shí)際問題,還有可能讓創(chuàng)業(yè)者們陷入盲目堆砌資源的資金戰(zhàn)。
是不是聽起來還很好道理的樣子?試想一下,如果去掉激光雷達(dá),全面引入視覺識(shí)別算法和高性能計(jì)算硬件,這樣不就節(jié)省下來了大筆的激光雷達(dá)部署費(fèi)用。對(duì)于自動(dòng)駕駛廠商和躍躍欲試的潛在車主們來說,無疑是個(gè)福音。
也確實(shí)有公司這么干了。除了特斯拉之外,創(chuàng)業(yè)公司AutoX就讓一輛只搭載7 個(gè)攝像頭的林肯 MKZ在無人駕駛狀態(tài)下泡上了普通車道。
但是,更多的車企和無人駕駛技術(shù)公司之所以一邊吐槽著激光雷達(dá)高昂的價(jià)格和“業(yè)務(wù)能力”,一邊還不得不日以繼夜地研究著怎么才能讓激光雷達(dá)能更好用一丟丟。
這當(dāng)然不是因?yàn)樗麄冏詭А岸禡”體質(zhì),而是相比其他技術(shù)解決方案來說,以激光雷達(dá)為主已經(jīng)是當(dāng)時(shí)能找到的最優(yōu)解了。
你行你上:視覺算法能扛起大王旗嗎?
大會(huì)上,特斯拉人工智能高級(jí)主管Andrej Karpathy是這樣說的——我們?nèi)祟愰_車,都是完全視覺驅(qū)動(dòng),為啥到機(jī)器就非激光雷達(dá)不可了呢?
這也是特斯拉的另一種技術(shù)實(shí)現(xiàn)思路:通過多攝像頭方案采集數(shù)據(jù),再借助還原實(shí)際環(huán)境的模擬器來訓(xùn)練神經(jīng)網(wǎng)絡(luò),通過智能視覺實(shí)現(xiàn)車輛對(duì)交通道路狀況的“認(rèn)知”。
特斯拉現(xiàn)場公布了一組數(shù)據(jù),其全視覺感知的方案,已經(jīng)能處理99.999%的場景。每天特斯拉汽車會(huì)發(fā)生10萬起車道變更,沒有發(fā)生任何交通事故。
并且,使用這一仿真視覺模擬系統(tǒng)的用戶越多,神經(jīng)網(wǎng)絡(luò)的性能也就越好,特斯拉預(yù)測并處理交通狀況也就會(huì)越熟練。
當(dāng)然,特斯拉并不是將3D圖像處理的訓(xùn)練工作全部交給了用戶來說,圍繞算法做了許多重要的工作,比如通過軟件算法來讓圖像數(shù)據(jù)變得更加健壯,從而實(shí)現(xiàn)對(duì)圖像的深度感知。
為了保障算法在無人車終端的運(yùn)行效率,特斯拉還打造了全自動(dòng)駕駛硬件。然而盡管做了一系列的準(zhǔn)備工作,還砍了激光雷達(dá)一刀“祭天”,但馬斯克的攝像頭“視覺感知”理想,真的靠譜么?
至少在一部分堅(jiān)定的“挺雷派”眼中,是不能接受的。他們反駁的理由也并非毫無根據(jù):
首先,堅(jiān)持采用攝像頭做感知器的特斯拉,此前的事故率就已經(jīng)啪啪打臉了。特斯拉官方公布的2019年第一季度數(shù)據(jù)顯示,使用Autopilot自動(dòng)駕駛的事故數(shù)量就比以往有所增加。每行駛287萬英里,就會(huì)發(fā)生一起事故。相關(guān)車禍新聞報(bào)道近年來更是新聞媒體和電視臺(tái)的常客。
更關(guān)鍵的是,以攝像頭+視覺感知技術(shù)+芯片的技術(shù)矩陣,并未能帶來令人驚喜的效果。舉個(gè)例子,特斯拉的Autopilot已經(jīng)是目前各家輔助駕駛功能里面最好的了,但就是這樣的系統(tǒng),也會(huì)每隔幾分鐘就要提醒人工進(jìn)行干預(yù),一些曲率大一點(diǎn)的道路彎口都會(huì)猶豫不決直接停擺。在一些特殊的天氣環(huán)境中,單一的攝像頭傳感器系統(tǒng)更是捉襟見肘。
關(guān)于這一點(diǎn),有網(wǎng)友在Hacker News上現(xiàn)身說法:幾周前芝加哥下雪了,我的AutoPilot關(guān)閉了,因?yàn)榇笱┱谧×藬z像頭。所以我不會(huì)買這些“沒有激光雷達(dá)的自動(dòng)駕駛”。
這種情況下,真的很難令人相信,3D視覺感知技術(shù)已經(jīng)成熟到了可以完全拋棄激光雷達(dá)的程度。
以康奈爾大學(xué)最新的論文成果來看,偽激光雷達(dá)的3D 深度表示,比此前最優(yōu)圖像方法的識(shí)別準(zhǔn)確率提升了2倍,在KITTI 3D 目標(biāo)檢測排行榜上達(dá)到了當(dāng)前的最高水平,但也僅僅只是把立體攝像機(jī)系統(tǒng)和激光雷達(dá)系統(tǒng)之間的性能差距縮減了一半。
而對(duì)于成熟的汽車廠商和科技出行公司來說,他們需要面臨市場和用戶的重重考驗(yàn),以及政府監(jiān)管與公共安全的基本約束,需要最大限度地保證無人車的穩(wěn)定和準(zhǔn)確。反饋到大眾層面, “激光雷達(dá)”已經(jīng)成了一個(gè)必不可少的存在,哪怕只是作為甩鍋道具或者安慰劑。
所以說,如果關(guān)于這場“激光雷達(dá)傻瓜論”一定要爭出個(gè)所以然來,那么結(jié)果很顯然是,無論是產(chǎn)業(yè)界還是學(xué)術(shù)界,都在傳遞一個(gè)清晰的信號(hào):短時(shí)期內(nèi),指望攝像頭+視覺系統(tǒng)沒戲,激光雷達(dá)還是必需且必要的。
既然如此,大佬們是不是都有點(diǎn)閑得慌了啊,放著那么多問題不去解決,光顧著打嘴架了?目前看來,這場爭論最大的意義在于,消解了激光雷達(dá)長期以來神圣不可動(dòng)搖的產(chǎn)業(yè)意義,并試圖尋找新的解決方向。
硬or軟or軟硬兼施:自動(dòng)駕駛的未來由誰做主?
馬斯克此時(shí)站出來反對(duì)激光雷達(dá),固然有些激進(jìn),但或許也指出了上一個(gè)階段自動(dòng)駕駛廠商身上那件“皇帝的新衣”,確實(shí)不適合繼續(xù)穿著了。
關(guān)于這一點(diǎn),也有不少產(chǎn)業(yè)界人士表示贊同。
比如馭勢科技創(chuàng)始人兼CEO吳甘沙就認(rèn)為,完全不用激光雷達(dá)一定是有問題的,在相當(dāng)長的一段時(shí)間內(nèi)純視覺方案的魯棒性一定是不如視覺加激光融合方案的。但從更長的維度來看,靠激光雷達(dá)確實(shí)沒前途,因?yàn)閿z像頭視覺能夠有更豐富的維度去理解這個(gè)世界。
部分高精地圖創(chuàng)業(yè)公司也強(qiáng)調(diào)從成本出發(fā),采用低成本的攝像頭方案采集高精數(shù)據(jù)。
喧嘩聲中,一場關(guān)于硬件和軟件的主導(dǎo)權(quán)之爭已經(jīng)悄然拉開了序幕。
想要理解這一點(diǎn),我們將視角方的更全面一點(diǎn),來看看除了diss激光雷達(dá)之外,特斯拉還同時(shí)搞了哪些事情?
其一,是發(fā)布了性能強(qiáng)大的全自動(dòng)駕駛硬件Hardware 3.0,每套HW3.0含2套FSD硬件,能夠處理高達(dá)每秒2.5千兆像素和36.8 TOPS,據(jù)說浮點(diǎn)運(yùn)算能力是英偉達(dá)Drive Xavier的7倍。
值得注意的是,F(xiàn)SD只運(yùn)行特斯拉加密過的軟件,非特斯拉軟件,概不支持。
馬斯克還很拉仇恨地表示,“特斯拉從沒有設(shè)計(jì)過芯片,怎么一下子就能搞出全世界最好的芯片呢?但它就這樣發(fā)生了”。
其二,是虛擬仿真系統(tǒng)。
基于大規(guī)模量產(chǎn)的特斯拉電動(dòng)車(50 萬臺(tái),并且還在快速增長),特斯拉擁有了訓(xùn)練神經(jīng)網(wǎng)絡(luò)的關(guān)鍵資源。
比如說,如果特斯拉解決不了車上架著自行車這樣的難題(因?yàn)闀?huì)被系統(tǒng)識(shí)別成兩個(gè)物體),就會(huì)下命令讓汽車將“問題”圖片上傳到總部,特斯拉對(duì)這些圖片進(jìn)行標(biāo)記,再導(dǎo)入神經(jīng)網(wǎng)絡(luò)中繼續(xù)訓(xùn)練,直到視覺系統(tǒng)能夠熟練地掌握識(shí)別技能。
比如只通過雷達(dá)和攝像頭,只要兩者得出的距離相匹配,神經(jīng)網(wǎng)絡(luò)就能估算出車輛的間距。
從這個(gè)角度看,特斯拉的野心并不是給整個(gè)行業(yè)投出一顆重磅炸彈,而是構(gòu)建出軟硬件一體化的自動(dòng)駕駛解決方案。
在底層技術(shù)上,特斯拉通過自主研發(fā)的高性能AI芯片,來了一個(gè)底層硬件的“彎道超車”,解決了對(duì)于算力的迫切需求,同時(shí)擺脫了供應(yīng)商的限制,最大程度地將核心零部件主動(dòng)權(quán)把握在自己手里。
在軟性的技術(shù)壁壘上,特斯拉也在變得更強(qiáng)。算法上,特斯拉擁有以實(shí)景數(shù)據(jù)為載體的神經(jīng)網(wǎng)絡(luò)訓(xùn)練平臺(tái),同時(shí)坐擁實(shí)時(shí)生成的海量細(xì)節(jié)數(shù)據(jù)。
至此,拿出軟硬件一體化解決方案的特斯拉,再一次與同行們拉開了競爭差距。同時(shí)也擺好了姿態(tài),以一種軟硬兼施的方式,吸引更多伙伴加入自己的陣營。
這場論戰(zhàn)雖然是以“挑釁”開頭,也離不開營銷炒作的一貫手筆。但也同時(shí)讓人們看清楚一件事,如同汽車沒有被發(fā)明的年代,人類只想要一輛更快的馬車。
當(dāng)自動(dòng)駕駛來到產(chǎn)業(yè)的冷靜期,技術(shù)的快速迭代與生存的如履薄冰,使得廠商們不得不時(shí)時(shí)驚惶。但沉浸在這種“技術(shù)恐慌”之中,也容易忘記,人類需要的是發(fā)明汽車,而不是建造跑的更快的馬車。
從這個(gè)意義上講,特斯拉的自動(dòng)駕駛帝國正在以最具創(chuàng)造性和顛覆性的樣式成型。過分惹眼的裝飾物背后,已經(jīng)隱隱顯露出了未來的冰山一角。
轉(zhuǎn)載請(qǐng)注明出處。