‧ GPU 如何驅動自動駕駛的發展？

本文整理奇點·創新者峰會演講嘉賓 NVIDIA 全球副總裁張建中的演講（文字有刪減）：

NVIDIA 發明瞭一項技術叫 GPU，20 年前就用在視覺計算上。今天， NVIDIA 幾乎所有的業務都是來自於 GPU 這個核心技術上：

第一個業務就是年輕人喜歡的遊戲；第二是用於做專業的圖形圖象設計，大型電影動漫作品都是用 GPU 渲染而來；第三是用來處理人工智能、高性能計算；；第四是汽車的自動駕駛。

NVIDIA 的 GPU 在今年推出一個新產品之後，性能有很大突破，它的成本幾乎讓所有研究單位都買得起。深度學習的算法，其原理是需要大量的數據採集進行自我學習。可以說沒有大數據，就沒有深度學習，也就沒有人工智能的進步。

深度學習與傳統計算機研究並不一樣。在以前的電算機研究方法當中，很多是依靠科學家寫模型、寫算法。但每個人寫的程序不一樣：聰明的設計師或者程序員，如果寫的代碼比較準確，模型不錯，那計算結果也會準確。但如果有人水平比較有限，那麼他製作出來的模型和算法也就有限，因為結果與算法有關。

傳統的計算方法就是靠好的專家、老師和學生，不停的培養、研究、優化。深度學習則摒棄了傳統算法，用深度學習的神經元網路計算去訓練計算機模型。這些模型的原始數據得益於大數據採集：數據越大，訓練模型越準確。

我們看到藍點是傳統專家做圖形圖象識別研究的效果。他過去花很多年，一直到四五年前，他們的頂級水平也就是 70% 左右。但是採用深度學習之後，很快提升到 90% 以上。而今天人眼的識別率是 94.5% 左右。

在真正機器訓練之後，你會發現所有機器圖形圖像辨識會勝過我們每一個人。機器的辨識準確率將遠遠超過人類，今天電腦的計算能力、辨識能力很強大，這會讓人工智慧技術有很快的發展。

比如我們今天談的汽車領域：自動駕駛、輔助駕駛、無人駕駛。所有這些應用，各個不同公司有很大的突破。

但是，我們最終要達到真正的無人駕駛這種頂級水平很難。

首先得有高精地圖把路況探測準確，可以定位汽車在路上哪個位置，要能看見周圍物體和障礙，最後才決定如何去駕駛。這個原理非常簡單，但是要執行非常準確是相當困難的。

那麼在這個過程當中，我們到底如何實現汽車的自動駕駛？

用深度學習的方法把數據採集回來，有強大的深度學習計算機，因此我們做了 DGX-1，這個服務器的計算能力相當於 250 個普通 CPU 服務器的計算能力，而它只是在一個小小的機箱當中。這台機器可以讓我們所有致力於汽車，無人駕駛的研究單位，通過它可以把所有的數據放到這個深度學習系統當中進行測試。

汽車終端用 DRIVE PX 實時使用，不停產生數據，返回到服務器再訓練再應用。這樣它的駕駛能力和水平就會不斷提升。

如果說他採集的數據比較多，尤其是在中國，它的決策會越來越準確，最後在實際使用中就會越來越準確。這也是用深度學習的方式讓準確率不斷提升。大概過幾年之後，汽車駕駛行為的培訓和實際使用能力的提升，可以讓自動駕駛在實際當中得以實現。

目前這當中最重要的一環是辨識汽車周邊的物體：準確度很重要。 NVIDIA 自己開發了一個虛擬網絡叫 DRIVENET，在通常的圖形測試當中我們的準確度已經做到第一位。

如果在不同的狀態下，比如在簡單狀態下可以做到 90% 以上，在最難的情況下可以做到 87% 以上，已經接近於人眼辨識。相信通過一系列訓練之後，這種圖形就可以在實際當中使用。

所有的算法會基於傳統的 Caffe、CNTK、KALDI 幫助我們做訓練。在實測過程中，它可以在路況當中把所有訊息都捕捉回來，計算機可以通過程序來判斷駕駛行為。

其中高精地圖是最重要的，如果不是高精地圖，那麼採集回來的數據就會有偏差。我們和很多地圖公司合作，把他們的地圖變成高精地圖。當然有一些國家的高精地圖應用，需要政府的批准才可以去採集高精地圖，否則不能用於民用。

在中國，因為政府對汽車自動駕駛非常支持，所以我們已經有很多公司拿到執照，並採集高精地圖。像 HERE、TOMTOM、ZENRIN 採集的地圖都可以結合到 NVIDIA 的虛擬網路幫助他們進行訓練。

如果說依靠高精地圖、定位、辨識汽車的周圍狀況，直接進行汽車自動駕駛，這是我們傳統的思路。NVIDIA 要打破這些傳統思路，我們在想一種方法，怎麼能去學習人的駕駛。

每個人在開車的時候，看到的只是前面的前擋玻璃和反光鏡、後視鏡。那麼汽車是不是看到這些圖象就可以做自動駕駛？

我們做一個網路就是模擬真正駕駛員的行為。而決定駕駛行為，就是方向盤怎麼打，油門、剎車怎麼踩，這些是簡單的數據。在不同的車況和速度之下，駕駛行為的決策就會有大數據訓練模型。

給大家看一個簡單的視頻：這輛汽車一開始不知道如何駕駛，會犯很多錯誤。駕駛員在行駛了 3000 公里之後，這輛汽車學會了如何駕駛、如何順利安全到達目的地。

雖然它已經可以上路，但離實際使用還差很遠。我們可以看到一個新方法：它並不複雜，沒有地圖，不知道前方發生了什麼，只是看有什麼樣的圖象之後，車輛模擬駕駛員操作的油門、剎車、方向盤。因此深度學習完全可以採用一種全新方法去做自動駕駛。

我們希望這個方法能給其他研究單位新的啓發，來挑戰我們傳統的計算模式，用新的計算方式建造新的人工智慧系統。我們完全可以想像，在深度學習之後，大學當中學的每一個計算模型都會受到挑戰，每一個模型都可以用全新的數據方法，建立新的人工智慧系統，去取代任何自己花了幾十年的研究成果建立的模型。

所有的人工智慧，無論是做語言還是語音、圖像、搜索，都和 GPU 相關。所有傳統行業都會利用深度學習去推動新的改革，讓新的研究方向達到一個新高度和新的飛躍。

按此回今日3S Market新聞首頁

3S MARKET