2019年6月26日 星期三

.福特汽車技術研究員 Dimitar Filev : 用於智慧出行的智慧車輛系統

Ford Displays 'Smart Cars' That Prevent Accidents



來源:智车科技IV


5 月 7 日在對岸中國科學院自動化研究所舉辦。本期講座邀請到美國福特公司創新與研發中心技術研究員 Dimitar Filev 博士做題為「 Intelligent vehicle systems for smart mobility  」的報告。

報告聚焦人工智慧技術在福特智慧汽車系統中的應用,重點介紹機器學習、決策方法以及算法,在福特產品的生產過程中的應用,包括機器學習應用於車輛診斷和校準、駕駛建模和車輛個性化,燃油經濟性優化和自動駕駛。

報告還討論了,在車輛控制和資訊系統中,整合人工智能技術的經驗教訓、正在進行的研究,以及作為智慧移動應用建構模塊的未來趨勢。

Dimitar Filev 博士現任美國國家工程院院士、福特研究創新與研發中心技術研究員,主要進行計算智慧、人工智慧和智慧控制的研究,以及它們在自動駕駛、車輛系統,和汽車工程中的應用。發表學術論文 200 餘篇,14000 餘次引用的會議論文,擁有美國專利 100 多項。

2008 年獲 IEEE SMC 協會諾伯特·維納獎,2015 年獲 IEEE CIS 協會先鋒獎。他獲於 1979 年在捷克理工大學(Czech Technical University)獲得電氣工程博士學位。

目前是 IEEE 會士和美國國家工程院院士。曾於 2016 年-2017年擔任 IEEE 系統、人與控制論學會(IEEE Systems, Man, & Cybernetics Society)主席。


內容:
早上好,我的名字是 Dimitar Filev 非常感謝王教授的精彩介紹,我跟他共同在 IEEE ,以及一些團體工作多年。但是我們從沒有正式合作過,但我認為現在是個好機會,因為我們現在在北京有研究中心,我們可以建立專業的合作,我本人非常期待。非常高興今天能再次與你們進行分享。


福特在汽車工業領域擁有悠久的歷史,生產了許多汽車和卡車。福特不僅僅是汽車生產商,也是一家科技創新公司,我們在全球範圍內,擁有多家研究和先進工程中心,分別在墨爾本、南京、慕尼黑等等。




這是我們主要的四個研究領域,第一個集中於動力系統(Propulsion),為車輛提供動力,包括汽油引擎、柴油引擎、能量管理以及傳動;第二部分是汽車研究與技術(Vehicle Research and Technology),由被動安全、材料&輕量化、車架內外部和底盤等組成;第三部分是控制(Control),主要是駕駛輔助、自動駕駛車輛以及車輛動態和控制;最後是電子(Electrical),Compute單元專注於用戶體驗、電子以及資訊安全。


福特的「研究&先進工程組織」由兩名亨利福特技術 Fellow 領銜,擁有 20 名高級技術領導、數百名技術專家,其中 34% 具有博士學位,分別位於密西根的 Dearborn、德國的Aachen、加州的 Palo Alto三個中心。

福特是世界上第一個,將神經網路,應用到阿斯頓馬丁的汽車點火失敗檢測中去的,點火失敗會導致燃燒不充分,後來將這個方法,應用到了福特的V10引擎。

大概在二十年前,人們不相信 AI 能提供任何效果,如今是 AI 發展的好時機。湧現出了像 Github、Tensorflow 等這樣的好的資源,這些開源的人人都可以用,Arxiv上也有成千上萬的論文可供閱讀。


AI 的進步和汽車的改變,是推動智慧系統,部署在車輛上的主要的驅動力。車輛產生的數據,從過去的每小時 0.5 GB到後來的 25 GB 再到現在無人駕駛車輛的 1.7 TB。


如此大量的數據,如何即時的進行擬合,以及合理利用,是個重要的話題,車輛已經成為了大數據源和移動計算平台,設備製造商(OEMs),和交通系統都在發生著改變。

傳統的車輛已經具備很好的動力總成系統、底盤系統、空調系統和娛樂系統,同時車輛具備一些智慧駕駛輔助系統,例如ABS、車身動態穩定系統、尋跡系統等。


這些系統已經非常智慧,但我們在此基礎上,設計了智慧使用者介面,讓車輛更加客製化,以適應不同的使用者。虛擬駕駛系統與交通移動雲連接,控制著車輛。因此,客製化和智是自動駕駛車輛發展的兩個方向。

接下來討論幾個駕駛汽車中的應用,以及福特在自動駕駛中的研究。在汽車控制中有自動動力系統控制、自動轉向控制,和半自主懸架系統,這些不同的系統,經過標定可以實現舒適、常規和運動,三種模式之間的切換。


車輛模式的選擇共有27中組合,讓駕駛員在這之間進行選擇,是一件困難的事,而智慧系統則可以基於道路特點,和駕駛員的反應選擇最優的模式,這也是客製化的一個方面。

另一個重要的應用,是智慧巡航控制,它基於速度曲線,尋找最優的巡航速度設置點,來達到最優化燃油消耗的目標。


透過對數位地圖的分析、交通標誌的辨識、道路幾何形狀的辨識系統,能夠為駕駛者建議最優的加減速、檔位,提供最高效的駕駛模式選擇。


此外,分析駕駛員的行為,由此生成評估報告、根據車輛在不同時間頻繁的行車、停車的記錄,可以估計出下一個目的地。

福特在自動駕駛領域的佈置和發展,包括投資了 Argo AI ,以及成立了自動駕駛子公司AV LLC,這兩家由福特所有的獨立實體計劃,在2021年前完成研發並投入生產。


福特研究自動駕駛,採用的是分層級的方法,層級從反射級 Reflexive 到深思級 Reflective。反射級指的是當人們在駕駛時,不需要思考,而下意識作出的一些舉動,Reflective 則是完全相反的,比如人在高速駕駛的時候,會不斷地思考獲取最佳的決策。

分層級方法有三個層級,Decision Making 曾屬於高層規劃,基於強化學習、博弈論方法;稍低一個層級的 Path Planning,主要完成避障等場景;沿著規定好的軌跡行駛,則是由最後的 Path Following 層級使用模型預測控制完成。


Path Planning 部分使用的是 Q 強化學習方法,強化學習透過最大化累計收益函數,Q 函數來獲得最佳決策,此處狀態為車輛本身,以及相鄰車輛的即時的橫向和縱向位置,行為是車道保持、巡航速度增減,以及左右換道。

仿真器用來訓練神經網路擬合決策 Q 函數,該算法提供了狀態到行動的映射,得到的是貝爾曼方程的即時解。


強化學習近些年變得很火熱,尤其是谷歌的 Deepmind 推出了Alpha Go 取得了成功,他們提出了 Deep Q Learning(DQN),現在幾乎成了強化學習的標準。在DQN算法中,我們建立了⋯⋯

一個人工目標於是得到:
Y 與 Q 的差值,可模擬監督學習中的預測值,與標籤的差值,由此得到的時域差,用來更新網路得到最優值。在此基礎上,Deepmind 提出了三個主要的改進,形成了 Double DQN,首先是提出適合多層神經網路的Q函數;第二他們提出一個採樣任意的 Minibatch 的方式,處理訓練網路的數據;第三個則是他們提出了兩個 Q 函數,分別為當前 Q 函數,和目標 Q 函數來更新網路,這些改進使得強化學習更加穩定。

然而,當福特直接使用這些方法,是發現訓練神經網路經常容易失敗,並且訓練速度很慢。因此他們加入了一些常識性的規則,當發現行為不安全時,將安全的行為加入網路,對碰撞的判別,會混合到採樣隨機  Minibatch 中,用於網路的更新,最終結果取得顯著性效果。


在強化學習中,應該不僅僅依賴於對數據,這些短期性的經驗的學習,一些常識性的長期經驗規則的使用也很重要。

當前智慧駕駛汽車算法,和解決方案面臨的挑戰如下:
1、能學習特定駕駛員和環境、擁有最少的手工標定和標籤數據的車載或者雲平台的實時解決方案;

2、相比較監督式學習,更傾向於無監督和半監督強化學習;

3、包含認知資訊和實體模型的混合 AI 算法;

4、AI 算法可解釋、可驗證;

5、擁有加強特性,並且可以自評估;

6、維護成本低。
下面介紹一些有效的解決方案,每當我們遇到一個複雜系統時,我們會努力學習用一些複雜函數,去近似這個系統,例如神經網 路,這是其中一種方法。另一種方法使用許多簡單的小的子系統,進行組合模擬複雜系統。


非監督的演化聚類算法,可以實現即時的學習,對系統的狀態空間進行預測,一個重要的例子,是對引擎特性具有自適應標定,和控制能力的在線上空時濾波器。

混合馬爾科夫模型,對於目的地和路徑的預測,也是非常有效的。神經網路的可解釋性,是近年來的熱點話題,強化學習可以使用神經網路,將狀態空間映射到行為空間,這是個非線性映射。

這種非線性映射,可不可以使用其他的映射,來近似並且時刻解釋的呢?


基於強化學習的控制器,將狀態空間映射到行為空間,而使用模糊控制器,基於規則的模型,則是一種通用的近似器,透過將強化學習 Agent 仿真,為黑盒子動態系統,它可以被有限級的「if-then」規則近似和解釋。

以強化學習車輛跟蹤控制為例,跟車問題,基本是是一種自適應巡航問題,後車需要保持與前車的安全距離、控制好各自的車速以及加速度,傳統方法中車速控制器,基於吉布斯分布、加速度控制器使用智慧駕駛模型(Intelligent Driving Model,IDM)建模,福特使用強化學習,分別建立速度、加速度,以及距離的獎勵函數,最大化獎勵函數得到的結果,達到甚至超過傳統方法。


在得到加速度結果後,他們使用聚類算法,以相對速度和相對距離作為輸入,預測加速度作為輸出,對數據進行聚類,來近似強化學習控制器,強化學習器被近似為可解釋的 PI 控制器的非線性組合的形式,組合系數為各數據點,到聚類中心距離負值的 Softmax 函數。




擬合效果基本達到原始強化學習其的性能,但是推理時間從強化學習器的 0.3ms,降低到了非線性組合的 0.13 ms。最後,對演化系統地總結如下:

1、使用演化聚類和核粒化的方法,講一個複雜系統,即時分解為多個相互重疊的子區域;

2、即時同步學習系統架構,以及局部子系統的參數;

3、對具有多個操作模式,和多元化行為的系統即時建模;

4、特定的機器學習技巧(無監督聚類與監督學習的組合);

5、反映人類從現實中學習、總結、管理知識的能力。

我們在此提到的演化系統是多個子系統的組合,它的功能非常強大,包含了監督學習方法和非監督學習方法,可應用在即時的無人駕駛大數據處理中。

大數據、物聯網以及 AI 技術的快速發展,為智慧汽車提供了更多的解決方案,AI 算法則需要具備更多的人性化、自適應,和最小標定,以適應嵌入式實施的需求也很廣泛,智慧汽車的發展,為傳統 AI 算法的改進,提供了新的發展方向,傳統 AI 算法,應與基於規則的系統、認知知識,和基於第一性原理的模型相結合,此外,認知模型對統計機器學習的近似,使得傳統機器學習算法,變得可解釋和性能的可升。

以上就是我的報告,非常感謝大家!

任何顏色車牌——都拍攝的清清楚楚!

台灣區電信工程工業同業公會

沒有留言:

張貼留言