leiphone 老吕IO
編者按:以深度學習架構為基礎的人工智慧技術(如深度神經網路,DNN)早已在全球鋪開,其應用範圍覆蓋了汽車市場、電腦視覺、自然語言處理、傳感器融合、物體辨識別和自動駕駛等領域。
眼下,自動駕駛新創公司、網路公司和 OEM 商都在探索圖形處理單元(GPU)在神經網路中的應用,推動車輛早日進入自動駕駛時代。
如今,業界最先進的高級駕駛輔助系統(ADAS)一般都建立在整合或開放平台之上。想要獲得更智能更複雜的ADAS系統,並邁向完全自動駕駛時代,我們需要開發、模擬,並最終拿出一套完整的解決方案。
這篇論文描述了,以深度神經網路為基礎的深度學習架構發展現狀,該架構將充當汽車上的超級電腦,成為整合在自動駕駛車輛平台的驅動核心。本文主要對人工智慧技術,在自動駕駛車輛中的運用進行介紹。
| 什麼是深度學習?
深度學習是當下推動 AI 發展,最受歡迎的方法,它讓機器能認識並理解這個世界。神經網路是一大批簡單、可訓練的數學單位,它們可攜起手來學習複雜的動作,如本篇提到的駕駛。
深度學習還是一個過程,在這一過程中,數據被轉換成了電腦程序做出的決定。它與那類基於算法的系統的最大不同,就是一旦搭建起基礎模型,深度學習系統就能靠自己學習,來完成既定任務。
這些任務的範圍也十分寬泛,包括為圖片加標籤、理解人類語言、保證無人機獨立執行任務和驅動車輛自動行駛。深度學習可以模仿人類,大腦的學習和認知模式,理解語言和關係,並分辨話語中的歧義。
神經網路都是固有的並行模型,因此它們與多核心的GPU簡直是天作之合,而後者在PC、機器人和車輛上,都扮演著重要的角色。GPU可以充分釋放神經網路的平行性,在深度學習系統的定義、訓練、優化和佈局上優勢巨大。
美國《大眾科學》(Popular Science)曾撰文稱,「GPU是現代AI技術的骨幹。」
| ImageNet
深度學習過程中最簡單的一個例子,就是 ImageNet 大規模視覺辨識挑戰。該挑戰將評估大規模圖片和影像資料庫中物體辨識、圖片和場景分類算法的能力。
在2012年前,由於傳統電腦視覺算法的瓶頸,物體辨識準確度的提升相當緩慢(辨識率低於70%)。但2012年深度學習技術的引入,讓辨識準確度躍升至80%左右,而現在這一數字則提升至 95%,深度學習已經完全替代了傳統的電腦視覺算法。(見圖表1)
圖表 1 : 在ImageNet挑戰中傳統電腦視覺與深度學習,在準確度方面的對比
| 深度學習在高科技產業中的現狀
社交巨頭Facebook是業界第一家,利用GPU加速器訓練深度神經網路的公司。深度神經網路和GPU在全新的「大蘇爾」計算平台,和Facebook的AI研究院(FAIR)系統中,扮演著重要角色。
Facebook稱自己的目標是,推動機器智慧不斷進化,並為人類找到更棒的溝通方式。
谷歌在深度學習領域也投入巨大。TensorFlow 是該公司第二代機器學習系統,其任務是理解大量的數據和模型。在架構內,TensorFlow 可靈活的完成各種任務,如知覺和言語理解,因此它在圖片辨識和分類、跨文本分析等方面,有著得天獨厚的優勢。
谷歌用數千個 GPU 大幅提升了深度學習能力,而若換成同樣是數量的 CPU,其能力僅有搭載 GPU 平台的十分之一。
該公司負責電腦視覺和機器學習的研究員 Anelia Angelova 認為,谷歌還在自動駕駛汽車項目中,用到了串聯型的深度神經網路,它可幫助車輛探測路上行人的軌跡。
| 自動駕駛迴路
圖表2:自動駕駛迴路
圖表2向我們展示了,自動駕駛迴路的主要組成模組。其目標是通過相機、雷射雷達和超音波傳感器,即時感應車輛周圍360度範圍內的情況。通過這些設備收集的數據,算法可以準確的理解車輛周邊環境,並給予精確回反饋,包括車輛周邊靜態和動態的物體。
深度神經網絡路的加入,讓車輛對周邊物體的探測,和分類能力大幅提高,因此傳感器數據的融合,也變得更準確。隨後,這些經過加工的數據,將成為車輛感知、定位和規劃路線的重要依據。
在這一複雜過程中,
- ‧第一步名為「感知」,它覆蓋了傳感器數據融合、物體探測、分類、探測和追蹤的人物劃分。‧第二步則是「定位」,它包括地圖融合、地標和GPS定位。精確獲取自己所處的位置對自動駕駛車輛非常重要,因為這是它安全行駛的前提之一。而如何整合高精度地圖數據,這是車輛判定自己位置的關鍵。
‧最後一步是「路徑規劃」,其中包括車輛的線路和行為。自動駕駛車輛需要在高度動態的環境中,安全的躲避各種潛在風險,通過複雜的算法,找出適合行駛的路徑,同時對環境的變化作出預測。 - 此外,車輛需要保持行車的穩定,減少對乘客和其他車輛的干擾。在路徑規劃中,車輛需要將以上因素全部考慮在內,並最終給出一個完美的解決方案。
因此,想完成這一任務,車上的智能慧攝影機只能算杯水車薪,這其中每一步都需要深度神經網路的參與。通過深度神經網路,車輛要完成路面物體的探測和分類,地標建築的辨識和駕駛過程中的判斷等。
此外,深度神經網路完全是一個開放平台,各家車廠或一級供應商都可在該基礎之上,拿出自己的解決方案,同時防止自家產品與競爭對手同質化。
| 深度學習流程
深度神經網絡是多層神經網路集結在一起形成的。在物體辨識上,第一層的神經元會探測到各種邊緣,而第二層的神經元則會辨識更為複雜的形狀,如由各種邊緣組合而成的三角形和矩形。而在第三層中,神經元的辨識能力再次增強。因此,只要能搭建起神經網路框架,就能解決許多特殊問題。
自動駕駛技術挑戰性巨大,就是因為擁堵的城市中路況非常複雜,很難進行有效預判。因此,研究人員需要將許多傳感器和數據進行有機結合,以便精確定位車輛位置,並感知路況、設定路線和控制方向盤。
深度學習簡直就是以上這些困難的克星。眼下,與Caffe類似的神經網路框架,可以進行選擇性的學習。Caffe是伯克利視覺與學習中心的作品,它在表達、速度和模組化程度上優勢巨大,因此非常適合肩負起自動駕駛的挑戰。
圖表3: 深度神經網路的物體辨識過程
完成以上諸多步驟後,特定的框架需要為特殊任務進行特訓,物體辨識和分類就是典型例子。像體育訓練一樣,想帶深度神經網路,出師需要一個教練來保駕護航,指導它如何做出反應。
圖表 4 中提到的打分函數,決定了期望輸出與實際輸出的不同,而這一不同就是我們所說的預測誤差。神經網路中的每個神經元都會出現誤差,而這些誤差會成為神經元之間相互調整的權重訊息。這樣一來,在同樣的述如下,神經網路的反應就會準確很多。在外部刺激下,無需程序員干預,深度神經網路也能做出正確選擇。
圖表 4 : 深度神經網路訓練迴路
為瞭解決訓練問題,開發人員首先要用駕駛場景的圖片,搭建一個數據庫。此外,訓練前他們還要給這些圖片貼上正確的標籤,或正確的駕駛決定。一旦數據庫搭建完成,框架模型就能配置成功,訓練的問題也就迎刃而解了。
隨後,研發人員需要在模擬的駕駛情況下,對完成訓練的神經網路進行離線測試。驗證完成後,它就正式「畢業」並可以被刷入自動駕駛車輛的行車電腦(ECU)來進行路試了。另外,端對端系統的培養方案與其類似。
圖表5: 駕駛場景
圖表5介紹了一個現實中常見的駕駛場景,圖中的視角是美國高速公路上經常會看到的。研究人員會將數據灌入,以深度神經網路為基礎的自動駕駛系統,圖片下方的窗口會將各種數據視覺化。
位於窗口中心的白色車輛,已經感應到了身邊的兩輛車。根據車輛間的相對速度、位置和其他數據,路徑規劃系統會選擇最佳路線(圖中的綠色線)並根據情況決定是否變道。
| 英偉達DRIVE™解決方案
圖表 6 : 端對端深度學習平台
現下,英偉達已經拿出了一個可用於訓練、測試和自動駕駛車輛部署的整合平台。DRIVE解決方案讓車廠、一級供應商,和研究機構實力與靈活性大增,它們可在此基礎上,打造出讓車輛觀察、思考和學習的系統。
這套解決方案始於英偉達的DGX-1,這款深度學習超級電腦,可以用行駛中蒐集的數據來訓練深度神經網路。隨後,DRIVE PX 2就可以做出提前推斷,保證車輛在路上的安全。而連接兩者的是英偉達的DriveWorks,這款套件包括了各種工具、庫和模型,能大大提高自動駕駛車輛的研發、模擬和測試。
DriveWorks可以幫助傳感器校準,並獲取周邊數據,並通過DRIVE PX 2上複雜的算法,同步處理傳感器蒐集的數據。
| KITTI Benchmark
英偉達利用DRIVE解決方案,來發展自家的物體辨識系統,不過,該系統還有個名為DRIVENet的神經網路框架來當助手。
在5個月時間內,這套解決方案KITTI benchmark上拿到了最高分,最重要的是DRIVENet,可以即時做決定。
值得注意的是,英偉達的GPU們異常強悍,它們直接承包了分數排行榜前五名。這台名為KITTI的分數評價系統,由德國卡爾斯魯厄理工學院,與豐田工業大學聯合打造,它能判別物體辨識是否有效。
圖表 7 : KITTI benchmark測試成績
許多自動駕駛公司,已經是英偉達深度學習技術的用戶了,通過該技術它們訓練神經網路的速度提高了30-40倍。寶馬、戴姆勒和福特就是英偉達的用戶,此外,日本新創公司Preferred Networks和ZMP也是英偉達死忠粉。
在實地測試中,奧迪利用該技術在四小時內,完成了深度神經網路的訓練,同樣的工作量,一個智慧攝影機需要2年時間。沃爾沃則直接將英偉達DRIVE PX 2放進了實車中,未來它們將在哥德堡上路測試。
| 對未來的展望
BI Intelligence 預測,到 2020 年,全世界將有 1000 萬輛車,擁有一定的自動駕駛能力。它們中的許多都需要利用 AI 來感知周邊環境、確定車輛位置並應對複雜的交通環境。
圖表 9 : 搭載自動駕駛功能車輛未來的市場增長預期
眼下,一場自動駕駛領域的軍備競賽已經開打,未來會有更多新公司加入。同時,在各家公司的努力下,現在市場上 100+ 個行車電腦解決方案最終也將走向整合。
1. Introduction to deep learning, GTC 2015 Webinar, NVIDIA, July 2015 http://on-demand.gputechconf.com/gtc/2015/webinar/deep-learning-course/intro-to-deep-learning.pdf
2. The Crown Jewel of Technology Just Crushed Earnings, Ophir Gottlieb, Feb 17 2016, Capital Market Laboratorieshttp://ophirgottlieb.tumblr.com/post/139506538909/the-crown-jewel-of-technology-just-crushed
3. Google's release of TensorFlow could be a game-changer in the future of AI, David Tuffley, November 13, 2015, PHYS.ORG http://phys.org/news/2015-11-google-tensorflow-game-changer-future-ai.html
4. Facebook Open-Sources The Computers Behind Its Artificial Intelligence, Dave Gershgorn, December 10, 2015, Popular Sciencehttp://www.popsci.com/facebook-open-source-hardware-behind-artificial-intelligence
5. IMAGENET Large Scale Visual Recognition Challenge (ILSVRC),http://www.image-net.org/challenges/LSVRC/
6. Facebook AI Research (FAIR), https://research.facebook.com/ai
7. Google's Open Source Machine Learning System: TensorFlow, Mike Schuster, Google, January 15 2016, NVIDIA Conference, Tokyo
沒有留言:
張貼留言