作為馬斯克口中的「傻子王」,Waymo終于發(fā)話了。
在馬斯克大肆抨擊激光雷達(dá)十多天后,Waymo高管在Google I\/O 開(kāi)發(fā)者大會(huì)上對(duì)其進(jìn)行了公開(kāi)駁斥。
「你可以想象只用攝像頭進(jìn)行自動(dòng)駕駛,但你需要最好的攝像系統(tǒng)才能真正做到這一點(diǎn)?!筗aymo首席科學(xué)家Drago Anguelov表示:「因此,這是一個(gè)非常大的賭注,你有可能實(shí)現(xiàn)它。但這非常非常冒險(xiǎn),而且沒(méi)有必要。」
1
「傻子論」:不用激光雷達(dá)的理由
半個(gè)月前,馬斯克在特斯拉舉辦的「Autonomy Day」上,對(duì)激光雷達(dá)傳感器大肆抨擊:「傻子才用激光雷達(dá),任何依賴激光雷達(dá)的人注定要完蛋。注定是這樣?。す饫走_(dá))是昂貴的、不必要的傳感器。這就像有一大堆昂貴的附屬品。比如,一個(gè)闌尾是壞的,但現(xiàn)在你有了一大堆闌尾,你會(huì)發(fā)現(xiàn)這太荒謬了?!?/span>
如果你對(duì)激光雷達(dá)不太了解,我們先來(lái)對(duì)它做個(gè)介紹。
激光雷達(dá)是一種會(huì)發(fā)射激光的雷達(dá),它把不可見(jiàn)的光脈沖發(fā)送到世界上,并計(jì)算出它們返回的時(shí)間。這使得它在低分辨率下呈現(xiàn)出黑色和紅色的圖像,但與每個(gè)像素間的距離精確。一些激光雷達(dá)還能告訴你目標(biāo)彈開(kāi)的速度有多快。這樣,它就有了超人的視覺(jué),盡管分辨率低,目前的高成本和更有限的范圍意味著它不是在每個(gè)方面都優(yōu)秀。
激光雷達(dá)將3D成像技術(shù)引入自動(dòng)駕駛汽車計(jì)算機(jī),是目前大多數(shù)其他自動(dòng)駕駛系統(tǒng)的關(guān)鍵元件。目前,Waymo、Uber、福特、通用Cruise等公司將激光雷達(dá)與攝像頭結(jié)合使用,讓自動(dòng)駕駛汽車了解道路和道路上的情況。
價(jià)格昂貴是馬斯克抨擊激光雷達(dá)的一個(gè)主要原因。
但目前,每個(gè)主要的機(jī)器人車開(kāi)發(fā)商和大多數(shù)創(chuàng)業(yè)公司都使用激光雷達(dá)與攝像頭和雷達(dá)相結(jié)合的解決方案。他們傾向于增加更多的雷達(dá)和一個(gè)或多個(gè)激光雷達(dá),有些還添加了不同類型的激光雷達(dá),甚至夜視攝像頭。
之所以這么做,是因?yàn)樵谒麄兛磥?lái),現(xiàn)在并不是降低成本的時(shí)候。現(xiàn)在是最大限度保證安全的時(shí)候,并且要盡快實(shí)現(xiàn)它,以及首先進(jìn)入市場(chǎng)??煽啃允顷P(guān)鍵。
從技術(shù)上看,在激光雷達(dá)+攝像頭或者攝像頭的選擇上,前者是更快、更安全的路徑。更多的信息,特別是更可靠的信息是更好的選擇。
如果想僅僅使用攝像頭,則必須在一定程度上理解一幅圖像,接近人類用眼睛和大腦所做的事情。
沒(méi)有激光雷達(dá)超人的測(cè)距能力,人類通過(guò)智能計(jì)算出與遙遠(yuǎn)物體的距離。我們知道人和車有多大,所以一輛車或一個(gè)人如果看起來(lái)越小,我們就知道它離我們?cè)竭h(yuǎn)。當(dāng)我們移動(dòng)時(shí),我們通過(guò)這個(gè)物體相對(duì)于另一個(gè)物體移動(dòng)的方式來(lái)推測(cè)距離。
當(dāng)物體離我們很近時(shí),我們也能從兩只「立體」眼睛和通過(guò)眼睛聚焦光線的方式得知距離。這些都是有用的,但事實(shí)證明,人們只用一只能看到遠(yuǎn)處的眼睛就可以很好地駕駛——真正的關(guān)鍵在于正確理解場(chǎng)景。
激光雷達(dá)無(wú)需任何理解就能知道萬(wàn)物之間的固有距離。它在這方面近乎完美。對(duì)很多事情來(lái)說(shuō),「賭上你的生命」是可靠的——而且必須如此。人們可以也確實(shí)將「理解」添加到激光雷達(dá)的方案中,但這并不總是必要的,因此,你可以更寬容地理解錯(cuò)誤。
激光雷達(dá)可以在白天或晚上工作,而攝像頭必須處理不斷變化的外部光線。
Waymo(激光雷達(dá)傳感器的先驅(qū))首席技術(shù)官Dmitri Dolgov承認(rèn)早期版本的激光雷達(dá)「非常昂貴」。但他同時(shí)認(rèn)為,這種高成本與大多數(shù)新技術(shù)首次開(kāi)發(fā)時(shí)沒(méi)有什么不同。
「從根本上來(lái)說(shuō),激光雷達(dá)并不昂貴。」Dolgov說(shuō),「我們已經(jīng)大幅降低了從第一代到現(xiàn)在的激光雷達(dá)產(chǎn)品的價(jià)格??梢韵胂?,隨著規(guī)模的擴(kuò)大,我們將節(jié)省多少成本?!?/span>
今年3月,Waymo宣布,將開(kāi)始向不與該公司自動(dòng)拼車服務(wù)競(jìng)爭(zhēng)的客戶銷售激光雷達(dá),包括機(jī)器人、農(nóng)業(yè)、安全等行業(yè)的公司。這個(gè)額外的渠道可能會(huì)幫助Waymo通過(guò)擴(kuò)大生產(chǎn)來(lái)提高規(guī)模經(jīng)濟(jì),最終進(jìn)一步降低其為自己的汽車生產(chǎn)零部件的價(jià)格。
2
純視覺(jué)真的什么都能扛?
特斯拉在眾多主流汽車制造商中獨(dú)樹(shù)一幟,只使用了攝像頭+雷達(dá)的解決方案。馬斯克表示,特斯拉的自動(dòng)駕駛技術(shù)將完全依賴內(nèi)置攝像頭。
特斯拉選擇攝像頭方案的原因很簡(jiǎn)單,目前根本沒(méi)有量產(chǎn)并能真正商業(yè)化推開(kāi)的激光雷達(dá)。
特斯拉現(xiàn)在在銷售汽車,即使他們想裝激光雷達(dá),也裝不上。但是,他們未來(lái)的計(jì)劃也是無(wú)激光雷達(dá)的。
特斯拉決定只用8個(gè)攝像頭(前面3個(gè)、每側(cè)2個(gè)、后面1個(gè))加上前面一個(gè)雷達(dá)和一些用于近距離工作的超聲波傳感器來(lái)解決駕駛問(wèn)題。
但現(xiàn)在,計(jì)算機(jī)視覺(jué)還不是那么好。
在過(guò)去幾年里,計(jì)算機(jī)視覺(jué)技術(shù)取得了一系列驚人的突破,每個(gè)人都在使用它們。但是,這項(xiàng)技術(shù)并沒(méi)有可靠到能「堵上你的性命」的地步,至少現(xiàn)在還不可靠。問(wèn)題是,這種情況是否會(huì)發(fā)生,以及何時(shí)會(huì)發(fā)生。
大多數(shù)人說(shuō)「什么時(shí)候」而不是「如果」,特斯拉和其他人說(shuō),既然人類只用眼睛就能開(kāi)車,那么,顯然這是可以做到的。但我們旅行時(shí)只用腿,這并不是說(shuō)汽車應(yīng)該用腿而不是輪子。鳥(niǎo)兒扇動(dòng)翅膀,但這并不能證明飛機(jī)也應(yīng)該這樣做。有時(shí),機(jī)器的方法是贏家。我們還不知道答案。
早期的激光雷達(dá)非常非常昂貴,但正如很容易預(yù)測(cè)的那樣,任何電子技術(shù)都不會(huì)永遠(yuǎn)昂貴下去。數(shù)十家公司正在建造新的激光雷達(dá),其成本不會(huì)對(duì)出租車的成本造成任何負(fù)擔(dān),也不會(huì)對(duì)私家車的成本帶來(lái)太大影響。
如果成本不是問(wèn)題所在(特別是因?yàn)楝F(xiàn)在還不是廉價(jià)的時(shí)候),那么大多數(shù)開(kāi)發(fā)人員都已經(jīng)表明,更可靠的信息是一個(gè)顯而易見(jiàn)的選擇。
「一旦解決了視覺(jué)問(wèn)題,(激光雷達(dá))就一文不值了?!?/span>
馬斯克提出了如下觀點(diǎn)。他知道自動(dòng)駕駛的問(wèn)題很難解決,盡管他經(jīng)常錯(cuò)誤地宣稱特斯拉很快就能解決這個(gè)問(wèn)題。太難了,你需要非常非常好的計(jì)算機(jī)視覺(jué)來(lái)解決它。
大多數(shù)人都同意他的觀點(diǎn)——他們認(rèn)為激光雷達(dá)不能獨(dú)自完成這項(xiàng)工作(盡管谷歌的第一代汽車基本上只用激光雷達(dá)和雷達(dá)就可以開(kāi)得很好)。確實(shí)需要很好的計(jì)算機(jī)視覺(jué)來(lái)完成這項(xiàng)工作。
但如果按照馬斯克所說(shuō)的,計(jì)算機(jī)視覺(jué)就必須非常好,好到它可以為你做激光雷達(dá)能做的一切。就像人類的視覺(jué)皮層一樣,它必須在各種光線下工作。它必須能夠可靠地計(jì)算出所有東西的距離。如果它能做到這一切,那么你就不需要激光雷達(dá)了。如果你開(kāi)發(fā)使用激光雷達(dá),你就浪費(fèi)了大量時(shí)間和金錢(qián)在一些你最終并不需要的東西上。
因?yàn)閿z像頭的分辨率更高,它們能看到彩色的東西、更遠(yuǎn)的東西——你的攝像頭能做到這一點(diǎn),甚至做的更好。
也許有一天他是對(duì)的。但沒(méi)有人知道那一天是什么時(shí)候。我們知道不是今天,我們可以猜測(cè)可能是在2030年之前。但我們今天想制造汽車。我們知道,便宜的激光雷達(dá)很快就會(huì)出現(xiàn)。
特斯拉正在豪賭。他們押注,視覺(jué)上的突破將很快實(shí)現(xiàn)。他們希望自己成為實(shí)現(xiàn)這一目標(biāo)的人,通過(guò)使用他們定制的神經(jīng)網(wǎng)絡(luò)硬件和從不斷增長(zhǎng)的特斯拉汽車車隊(duì)中收集到的海量數(shù)據(jù)。其他公司則押注于一個(gè)更安全的賭注,他們認(rèn)為,實(shí)現(xiàn)突破還有很長(zhǎng)的路要走,而便宜的激光雷達(dá)更有可能出現(xiàn)。
即使在視覺(jué)能力達(dá)到良好的那一天,許多人仍然可能會(huì)選擇保留非常低成本的激光雷達(dá),據(jù)預(yù)測(cè),激光雷達(dá)將在那個(gè)時(shí)候出現(xiàn)。它們所提供的優(yōu)勢(shì)永遠(yuǎn)不會(huì)為零,而且,完全「賭上你的生命」的可靠性基本上不需要任何妥協(xié)。
即使你可以用一只眼睛通過(guò)一個(gè)單色濾鏡開(kāi)車,你也不能這么做。你可以為了節(jié)省一大筆錢(qián)而放棄安全,但不能為了節(jié)省一點(diǎn)錢(qián)而放棄安全。
一個(gè)致命案例佐證了目前計(jì)算機(jī)視覺(jué)能力的缺陷。
上周,特斯拉因一起致命事故被起訴。在這起事故中,特斯拉的算法顯然誤解了車道標(biāo)志,并將車駛?cè)肓说缆泛统隹谠训乐g的假「車道」。它直接撞上了防撞護(hù)欄,致使駕駛者當(dāng)場(chǎng)死亡。
按照特斯拉目前的技術(shù)水平,它有時(shí)會(huì)錯(cuò)過(guò)車道標(biāo)志。由于它的雷達(dá)和視覺(jué)算法都未能識(shí)別出這道屏障,所以它撞上了防護(hù)欄。
同樣,這種情況有時(shí)會(huì)發(fā)生在今天的技術(shù)上。雷達(dá)可以看到它,但作為靜止物體,雷達(dá)系統(tǒng)無(wú)法準(zhǔn)確地分辨它們的位置,因此,當(dāng)雷達(dá)從路徑附近的靜止物體反彈回來(lái)時(shí),你不能每次都剎車。
更重要的是,計(jì)算機(jī)視覺(jué)系統(tǒng)無(wú)法識(shí)別障礙。有一種可能的假設(shè)是,它們只是沒(méi)有受過(guò)檢測(cè)這些障礙的訓(xùn)練,尤其是檢測(cè)受損的;十多天前,一個(gè)普通的人類司機(jī)打破了這道屏障。
神經(jīng)網(wǎng)絡(luò)只能識(shí)別它們接受過(guò)訓(xùn)練的東西,或者類似的東西。特斯拉的網(wǎng)絡(luò)訓(xùn)練有素,能夠識(shí)別道路上每輛車的后部以及某些類型的物體,但在2018年,它們可能沒(méi)有接受過(guò)這方面的訓(xùn)練。
它們繼續(xù)開(kāi)車,更糟的是,它們加速了,因?yàn)樗鼈儸F(xiàn)在認(rèn)為有了一條完全開(kāi)放的新車道,這是自適應(yīng)巡航控制在這種情況下經(jīng)常做的。
激光雷達(dá)系統(tǒng)幾乎肯定能探測(cè)到這個(gè)障礙。
如果是在安裝了激光雷達(dá)系統(tǒng)的情況下啟用Autopilot,激光雷達(dá)系統(tǒng)就會(huì)檢測(cè)到那輛橫穿馬路、撞死Joshua Brow(特斯拉駕駛者)的貨車。
激光雷達(dá)系統(tǒng)不需要知道它們前面的物體是什么,也不需要知道它在哪里,它到底有多大。適當(dāng)?shù)募す饫走_(dá)\/軟件系統(tǒng)確實(shí)能更好地了解障礙是什么,它們與視覺(jué)相結(jié)合,將達(dá)到視覺(jué)無(wú)法單獨(dú)達(dá)到的水平。
總之,解決視覺(jué)問(wèn)題,讓它告訴你激光雷達(dá)告訴你的一切,是一個(gè)非常艱巨的任務(wù)。不久前,很難找到任何一個(gè)人說(shuō)這是迫在眉睫的。如今,也有這樣的人,包括馬斯克,但大多數(shù)人仍然認(rèn)為這很難。
但特斯拉希望,他們能從特斯拉車隊(duì)的汽車中收集大量數(shù)據(jù),這將是找到解決方案的秘密因素。如果是這樣,使用 Autopilot 駕駛,表明特斯拉仍然還有很長(zhǎng)的路要走。特斯拉的 Autopilot 提供了一個(gè)屏幕來(lái)顯示其感知系統(tǒng)的輸出,任何使用它的人都知道它仍然相當(dāng)不穩(wěn)定。
訣竅是,你不需要解決視覺(jué)問(wèn)題就能得到一個(gè)輔助駕駛儀Autopilot,你甚至不需要那么接近。
從99%的精準(zhǔn)視力(可以成為一名不錯(cuò)的司機(jī)助手)到99.99999%的精準(zhǔn)視力,是一個(gè)漫長(zhǎng)的旅程,你可以用自己的生命打賭。
Sterling Anderson曾是特斯拉Autopilot的負(fù)責(zé)人,現(xiàn)在是Aurora的首席產(chǎn)品官,喜歡稱他的老東家的方法為,試圖通過(guò)建造一個(gè)更高的梯子到達(dá)月球。(馬斯克確實(shí)對(duì)登月略知一二。)
3
馬斯克如果押錯(cuò)了呢?
特斯拉的賭注可能會(huì)取得好結(jié)果。
想要持有自動(dòng)駕駛股票投資組合的投資者可能希望同時(shí)擁有Waymo(如果可能的話)和特斯拉。這是普通多元化投資者的正確策略。
盡管賭注很大,但還是有一些安全網(wǎng)的。如果特斯拉無(wú)法用他們最新的硬件很快解決全自動(dòng)駕駛問(wèn)題,他們?nèi)匀挥谐錾碾妱?dòng)汽車業(yè)務(wù)。
他們?cè)陔娏鲃?dòng)系統(tǒng)和高科技汽車設(shè)計(jì)方面擁有明確的領(lǐng)導(dǎo)地位。他們的自動(dòng)駕駛產(chǎn)品(autopilot products)將繼續(xù)增加新的和出色的功能,即使它們不能在車內(nèi)沒(méi)有人的情況下沿著海岸開(kāi)車,或者在你睡覺(jué)時(shí)把你的車開(kāi)到另一個(gè)城鎮(zhèn)。
有一些早期功能可以更容易地解決,而且可能不需要激光雷達(dá),例如:
停車場(chǎng)代客泊車
在處理電子郵件時(shí)應(yīng)對(duì)交通堵塞
深夜低速行駛,最終,白天作業(yè),將汽車送往充電站
無(wú)人監(jiān)督的高速公路駕駛,先是在稀疏的高速公路上駕駛,然后在更擁擠的高速公路上駕駛
在預(yù)先批準(zhǔn)的有限范圍內(nèi)低速運(yùn)作
更好的ADAS(高級(jí)駕駛輔助系統(tǒng)),讓你開(kāi)車時(shí)越來(lái)越難撞車
它們并不像機(jī)器人出租車(robotaxi)那樣令人興奮或者有利可圖。但它們?nèi)匀环浅S杏?,特斯拉可能是第一個(gè)實(shí)現(xiàn)上述一些功能的汽車制造商。(一些汽車制造商已經(jīng)實(shí)施了無(wú)人監(jiān)管的交通擁堵操作。)
如果特斯拉決定它需要激光雷達(dá),在吞下一些驕傲后,它將需要對(duì)它們的汽車進(jìn)行一些重新設(shè)計(jì)。
雖然前向激光雷達(dá)可能很難添加到后視鏡的攝像頭陣列中,但目前特斯拉還沒(méi)有明確的地方可以安裝低阻力激光雷達(dá)。它必須比現(xiàn)在的型號(hào)小。前向激光雷達(dá)是最安全的關(guān)鍵。
4
馬斯克如果賭對(duì),其他公司也不吃虧
人們?cè)谘芯窟@個(gè)問(wèn)題時(shí)常犯的一個(gè)錯(cuò)誤是,忘記了其他公司并沒(méi)有把全部精力投入到激光雷達(dá)中。
有和特斯拉一樣熱衷于神經(jīng)網(wǎng)絡(luò)和視覺(jué)的,他們只是想把神經(jīng)網(wǎng)絡(luò)和視覺(jué)與激光雷達(dá)結(jié)合起來(lái),而且他們有資金在這兩方面進(jìn)行研究。
一個(gè)特別重要的競(jìng)爭(zhēng)對(duì)手是谷歌的兄弟公司W(wǎng)aymo。
幾乎所有人都同意,在神經(jīng)網(wǎng)絡(luò)方面,谷歌是全球領(lǐng)導(dǎo)者。那些向世界傳授深度神經(jīng)網(wǎng)絡(luò)新方法的先驅(qū),如杰夫·辛頓本人,為谷歌工作。在圍棋比賽中擊敗人類冠軍的神經(jīng)網(wǎng)絡(luò)來(lái)自谷歌。Waymo有使用谷歌神經(jīng)網(wǎng)絡(luò)的權(quán)限,使用TPU神經(jīng)網(wǎng)絡(luò)處理器的權(quán)限。
Dolgov在Medium上的一篇文章中寫(xiě)道:
谷歌的人工智能研究人員也幫助 Waymo在通往真正的自動(dòng)駕駛汽車的道路上起步。
當(dāng)深度學(xué)習(xí)開(kāi)始起步時(shí),Waymo的自動(dòng)駕駛工程師與谷歌大腦團(tuán)隊(duì)并肩工作,將深度網(wǎng)絡(luò)應(yīng)用于Waymo的行人檢測(cè)系統(tǒng)。即使在早期,結(jié)果也是顯著的ーー在幾個(gè)月的時(shí)間里,能夠?qū)⑿腥藱z測(cè)的錯(cuò)誤率降低100倍,使Waymo的系統(tǒng)更安全、也更有能力在道路上行駛。
「我們使用TensorFlow生態(tài)系統(tǒng)和谷歌的數(shù)據(jù)中心(包括TPU)訓(xùn)練神經(jīng)網(wǎng)絡(luò);TPU可以更有效地訓(xùn)練我們的網(wǎng)絡(luò),效率提升高達(dá)15倍?!?/span>
「憑借我們多年的經(jīng)驗(yàn),與Google AI的合作,以及強(qiáng)大的基礎(chǔ)設(shè)施,我們比以往任何時(shí)候都更接近一個(gè)交通更安全、更容易、更便捷的未來(lái)。」Dolgov在文章最后總結(jié)道。
雖然馬斯克宣稱特斯拉的神經(jīng)網(wǎng)絡(luò)芯片是「世界上最好的」,但事實(shí)并非如此——谷歌的TPU更好,除了Waymo,其他人買不到它。
不過(guò),沒(méi)關(guān)系,因?yàn)樵谏窠?jīng)網(wǎng)絡(luò)方面,硅谷有很多初創(chuàng)公司都在開(kāi)發(fā)他們自己版本的「世界上最好的芯片」,你會(huì)在2019-2020年看到很多這樣的公司。與此同時(shí),英偉達(dá)的GPU可以做到這一點(diǎn),性能超過(guò)特斯拉的芯片,但它們的功耗更高。
如果激光雷達(dá)明顯是多余的,Waymo和其他幾家公司將準(zhǔn)備轉(zhuǎn)移。
他們沒(méi)有特斯拉的車隊(duì),但是有辦法得到這些資源,盡管有時(shí)成本更高,而特斯拉聰明地讓客戶為收集數(shù)據(jù)和為特斯拉做測(cè)試的機(jī)會(huì)付費(fèi)。 (Uber和Lyft還有更多的司機(jī)可能會(huì)為他們做同樣的事情。)
如果正如馬斯克預(yù)測(cè)的那樣,激光雷達(dá)敗了,特斯拉將擁有優(yōu)勢(shì),但并非是不可逾越的優(yōu)勢(shì)。
他還必須確保自己下的其他賭注也能兌現(xiàn)——比如沒(méi)有詳細(xì)地圖的駕駛——以及使用機(jī)器學(xué)習(xí)來(lái)做出戰(zhàn)術(shù)駕駛決策,比如在十字路口使用哪條車道。他也(溫和地)反對(duì)模擬測(cè)試:他們使用模擬測(cè)試,但不像Waymo和其他一些玩家那樣廣泛使用。
特斯拉可能仍需要在其軟件成熟時(shí)調(diào)整其傳感器??拷嚨牡胤?,攝像頭看不到,如果遇到惡劣天氣,汽車側(cè)面和后部也沒(méi)有雨刷。即使在那些地方,激光雷達(dá)的愛(ài)好者也不會(huì)避開(kāi)神經(jīng)網(wǎng)絡(luò)。他們使用神經(jīng)網(wǎng)絡(luò)理解激光雷達(dá)數(shù)據(jù),就像他們用它來(lái)理解攝像頭數(shù)據(jù)一樣。 (它們也可用于雷達(dá)數(shù)據(jù)。)由于激光雷達(dá)的分辨率較低,這些神經(jīng)網(wǎng)絡(luò)更加簡(jiǎn)單和快速。
馬斯克表示,特斯拉「明年」將有100萬(wàn)輛自動(dòng)駕駛出租車上路,雖然特斯拉的叫車計(jì)劃缺乏許多重要細(xì)節(jié)。
至于Waymo何時(shí)將其自動(dòng)拼車服務(wù)Waymo One推向進(jìn)行初始測(cè)試的鳳凰城地區(qū)以外的市場(chǎng),Waymo高管對(duì)具體時(shí)間守口如瓶。
「我們有一個(gè)路線圖和將業(yè)務(wù)擴(kuò)展到鳳凰城以外的地區(qū)的計(jì)劃。」Dolgov說(shuō),「但一如既往,我們的部署將以安全為前提?!?/span>
參考來(lái)源:Mashable、福布斯、Wired
轉(zhuǎn)載請(qǐng)注明出處。