本文整理奇點·創新者峰會演講嘉賓 NVIDIA 全球副總裁張建中的演講(文字有刪減):
NVIDIA 發明瞭一項技術叫 GPU,20 年前就用在視覺計算上。今天, NVIDIA 幾乎所有的業務都是來自於 GPU 這個核心技術上:
第一個業務就是年輕人喜歡的遊戲;第二是用於做專業的圖形圖象設計,大型電影動漫作品都是用 GPU 渲染而來;第三是用來處理人工智能、高性能計算;;第四是汽車的自動駕駛。
NVIDIA 的 GPU 在今年推出一個新產品之後,性能有很大突破,它的成本幾乎讓所有研究單位都買得起。深度學習的算法,其原理是需要大量的數據採集進行自我學習。可以說沒有大數據,就沒有深度學習,也就沒有人工智能的進步。
深度學習與傳統計算機研究並不一樣。在以前的電算機研究方法當中,很多是依靠科學家寫模型、寫算法。但每個人寫的程序不一樣:聰明的設計師或者程序員,如果寫的代碼比較準確,模型不錯,那計算結果也會準確。但如果有人水平比較有限,那麼他製作出來的模型和算法也就有限,因為結果與算法有關。
傳統的計算方法就是靠好的專家、老師和學生,不停的培養、研究、優化。深度學習則摒棄了傳統算法,用深度學習的神經元網路計算去訓練計算機模型。這些模型的原始數據得益於大數據採集:數據越大,訓練模型越準確。
我們看到藍點是傳統專家做圖形圖象識別研究的效果。他過去花很多年,一直到四五年前,他們的頂級水平也就是 70% 左右。但是採用深度學習之後,很快提升到 90% 以上。而今天人眼的識別率是 94.5% 左右。
在真正機器訓練之後,你會發現所有機器圖形圖像辨識會勝過我們每一個人。機器的辨識準確率將遠遠超過人類,今天電腦的計算能力、辨識能力很強大,這會讓人工智慧技術有很快的發展。
比如我們今天談的汽車領域:自動駕駛、輔助駕駛、無人駕駛。所有這些應用,各個不同公司有很大的突破。
但是,我們最終要達到真正的無人駕駛這種頂級水平很難。
首先得有高精地圖把路況探測準確,可以定位汽車在路上哪個位置,要能看見周圍物體和障礙,最後才決定如何去駕駛。這個原理非常簡單,但是要執行非常準確是相當困難的。
那麼在這個過程當中,我們到底如何實現汽車的自動駕駛?
用深度學習的方法把數據採集回來,有強大的深度學習計算機,因此我們做了 DGX-1,這個服務器的計算能力相當於 250 個普通 CPU 服務器的計算能力,而它只是在一個小小的機箱當中。這台機器可以讓我們所有致力於汽車,無人駕駛的研究單位,通過它可以把所有的數據放到這個深度學習系統當中進行測試。
汽車終端用 DRIVE PX 實時使用,不停產生數據,返回到服務器再訓練再應用。這樣它的駕駛能力和水平就會不斷提升。
如果說他採集的數據比較多,尤其是在中國,它的決策會越來越準確,最後在實際使用中就會越來越準確。這也是用深度學習的方式讓準確率不斷提升。大概過幾年之後,汽車駕駛行為的培訓和實際使用能力的提升,可以讓自動駕駛在實際當中得以實現。
目前這當中最重要的一環是辨識汽車周邊的物體:準確度很重要。 NVIDIA 自己開發了一個虛擬網絡叫 DRIVENET,在通常的圖形測試當中我們的準確度已經做到第一位。
如果在不同的狀態下,比如在簡單狀態下可以做到 90% 以上,在最難的情況下可以做到 87% 以上,已經接近於人眼辨識。相信通過一系列訓練之後,這種圖形就可以在實際當中使用。
所有的算法會基於傳統的 Caffe、CNTK、KALDI 幫助我們做訓練。在實測過程中,它可以在路況當中把所有訊息都捕捉回來,計算機可以通過程序來判斷駕駛行為。
其中高精地圖是最重要的,如果不是高精地圖,那麼採集回來的數據就會有偏差。我們和很多地圖公司合作,把他們的地圖變成高精地圖。當然有一些國家的高精地圖應用,需要政府的批准才可以去採集高精地圖,否則不能用於民用。
在中國,因為政府對汽車自動駕駛非常支持,所以我們已經有很多公司拿到執照,並採集高精地圖。像 HERE、TOMTOM、ZENRIN 採集的地圖都可以結合到 NVIDIA 的虛擬網路幫助他們進行訓練。
如果說依靠高精地圖、定位、辨識汽車的周圍狀況,直接進行汽車自動駕駛,這是我們傳統的思路。NVIDIA 要打破這些傳統思路,我們在想一種方法,怎麼能去學習人的駕駛。
每個人在開車的時候,看到的只是前面的前擋玻璃和反光鏡、後視鏡。那麼汽車是不是看到這些圖象就可以做自動駕駛?
我們做一個網路就是模擬真正駕駛員的行為。而決定駕駛行為,就是方向盤怎麼打,油門、剎車怎麼踩,這些是簡單的數據。在不同的車況和速度之下,駕駛行為的決策就會有大數據訓練模型。
給大家看一個簡單的視頻:這輛汽車一開始不知道如何駕駛,會犯很多錯誤。駕駛員在行駛了 3000 公里之後,這輛汽車學會了如何駕駛、如何順利安全到達目的地。
雖然它已經可以上路,但離實際使用還差很遠。我們可以看到一個新方法:它並不複雜,沒有地圖,不知道前方發生了什麼,只是看有什麼樣的圖象之後,車輛模擬駕駛員操作的油門、剎車、方向盤。因此深度學習完全可以採用一種全新方法去做自動駕駛。
我們希望這個方法能給其他研究單位新的啓發,來挑戰我們傳統的計算模式,用新的計算方式建造新的人工智慧系統。我們完全可以想像,在深度學習之後,大學當中學的每一個計算模型都會受到挑戰,每一個模型都可以用全新的數據方法,建立新的人工智慧系統,去取代任何自己花了幾十年的研究成果建立的模型。
所有的人工智慧,無論是做語言還是語音、圖像、搜索,都和 GPU 相關。所有傳統行業都會利用深度學習去推動新的改革,讓新的研究方向達到一個新高度和新的飛躍。
0 comments:
張貼留言