3S Market「全球智慧科技應用」市場資訊網: ．福特汽車技術研究員 Dimitar Filev ：用於智慧出行的智慧車輛系統

Ford Displays 'Smart Cars' That Prevent Accidents

MITS 旭捷網路時間管理解決方案

https://tw.mitscomponent.com/products_237_59.htm

5 月 7 日在對岸中國科學院自動化研究所舉辦。本期講座邀請到美國福特公司創新與研發中心技術研究員 Dimitar Filev 博士做題為「 Intelligent vehicle systems for smart mobility 」的報告。

報告聚焦人工智慧技術在福特智慧汽車系統中的應用，重點介紹機器學習、決策方法以及算法，在福特產品的生產過程中的應用，包括機器學習應用於車輛診斷和校準、駕駛建模和車輛個性化，燃油經濟性優化和自動駕駛。

報告還討論了，在車輛控制和資訊系統中，整合人工智能技術的經驗教訓、正在進行的研究，以及作為智慧移動應用建構模塊的未來趨勢。

Dimitar Filev 博士現任美國國家工程院院士、福特研究創新與研發中心技術研究員，主要進行計算智慧、人工智慧和智慧控制的研究，以及它們在自動駕駛、車輛系統，和汽車工程中的應用。發表學術論文 200 餘篇，14000 餘次引用的會議論文，擁有美國專利 100 多項。

2008 年獲 IEEE SMC 協會諾伯特·維納獎，2015 年獲 IEEE CIS 協會先鋒獎。他獲於 1979 年在捷克理工大學（Czech Technical University）獲得電氣工程博士學位。

目前是 IEEE 會士和美國國家工程院院士。曾於 2016 年－2017年擔任 IEEE 系統、人與控制論學會（IEEE Systems， Man，＆ Cybernetics Society）主席。

內容：

早上好，我的名字是 Dimitar Filev 非常感謝王教授的精彩介紹，我跟他共同在 IEEE ，以及一些團體工作多年。但是我們從沒有正式合作過，但我認為現在是個好機會，因為我們現在在北京有研究中心，我們可以建立專業的合作，我本人非常期待。非常高興今天能再次與你們進行分享。

福特在汽車工業領域擁有悠久的歷史，生產了許多汽車和卡車。福特不僅僅是汽車生產商，也是一家科技創新公司，我們在全球範圍內，擁有多家研究和先進工程中心，分別在墨爾本、南京、慕尼黑等等。

這是我們主要的四個研究領域，第一個集中於動力系統（Propulsion），為車輛提供動力，包括汽油引擎、柴油引擎、能量管理以及傳動；第二部分是汽車研究與技術（Vehicle Research and Technology），由被動安全、材料＆輕量化、車架內外部和底盤等組成；第三部分是控制（Control），主要是駕駛輔助、自動駕駛車輛以及車輛動態和控制；最後是電子（Electrical），Compute單元專注於用戶體驗、電子以及資訊安全。

福特的「研究＆先進工程組織」由兩名亨利福特技術 Fellow 領銜，擁有 20 名高級技術領導、數百名技術專家，其中 34％具有博士學位，分別位於密西根的 Dearborn、德國的Aachen、加州的 Palo Alto三個中心。

福特是世界上第一個，將神經網路，應用到阿斯頓馬丁的汽車點火失敗檢測中去的，點火失敗會導致燃燒不充分，後來將這個方法，應用到了福特的V10引擎。

大概在二十年前，人們不相信 AI 能提供任何效果，如今是 AI 發展的好時機。湧現出了像 Github、Tensorflow 等這樣的好的資源，這些開源的人人都可以用，Arxiv上也有成千上萬的論文可供閱讀。

AI 的進步和汽車的改變，是推動智慧系統，部署在車輛上的主要的驅動力。車輛產生的數據，從過去的每小時 0.5 GB到後來的 25 GB 再到現在無人駕駛車輛的 1.7 TB。

如此大量的數據，如何即時的進行擬合，以及合理利用，是個重要的話題，車輛已經成為了大數據源和移動計算平台，設備製造商（OEMs），和交通系統都在發生著改變。

傳統的車輛已經具備很好的動力總成系統、底盤系統、空調系統和娛樂系統，同時車輛具備一些智慧駕駛輔助系統，例如ABS、車身動態穩定系統、尋跡系統等。

這些系統已經非常智慧，但我們在此基礎上，設計了智慧使用者介面，讓車輛更加客製化，以適應不同的使用者。虛擬駕駛系統與交通移動雲連接，控制著車輛。因此，客製化和智慧化是自動駕駛車輛發展的兩個方向。

接下來討論幾個駕駛汽車中的應用，以及福特在自動駕駛中的研究。在汽車控制中有自動動力系統控制、自動轉向控制，和半自主懸架系統，這些不同的系統，經過標定可以實現舒適、常規和運動，三種模式之間的切換。

車輛模式的選擇共有27中組合，讓駕駛員在這之間進行選擇，是一件困難的事，而智慧系統則可以基於道路特點，和駕駛員的反應選擇最優的模式，這也是客製化的一個方面。

另一個重要的應用，是智慧巡航控制，它基於速度曲線，尋找最優的巡航速度設置點，來達到最優化燃油消耗的目標。

透過對數位地圖的分析、交通標誌的辨識、道路幾何形狀的辨識系統，能夠為駕駛者建議最優的加減速、檔位，提供最高效的駕駛模式選擇。

此外，分析駕駛員的行為，由此生成評估報告、根據車輛在不同時間頻繁的行車、停車的記錄，可以估計出下一個目的地。

福特在自動駕駛領域的佈置和發展，包括投資了 Argo AI ，以及成立了自動駕駛子公司AV LLC，這兩家由福特所有的獨立實體計劃，在2021年前完成研發並投入生產。

福特研究自動駕駛，採用的是分層級的方法，層級從反射級 Reflexive 到深思級 Reflective。反射級指的是當人們在駕駛時，不需要思考，而下意識作出的一些舉動，Reflective 則是完全相反的，比如人在高速駕駛的時候，會不斷地思考獲取最佳的決策。

分層級方法有三個層級，Decision Making 曾屬於高層規劃，基於強化學習、博弈論方法；稍低一個層級的 Path Planning，主要完成避障等場景；沿著規定好的軌跡行駛，則是由最後的 Path Following 層級使用模型預測控制完成。

Path Planning 部分使用的是 Q 強化學習方法，強化學習透過最大化累計收益函數，Q 函數來獲得最佳決策，此處狀態為車輛本身，以及相鄰車輛的即時的橫向和縱向位置，行為是車道保持、巡航速度增減，以及左右換道。

仿真器用來訓練神經網路擬合決策 Q 函數，該算法提供了狀態到行動的映射，得到的是貝爾曼方程的即時解。

強化學習近些年變得很火熱，尤其是谷歌的 Deepmind 推出了Alpha Go 取得了成功，他們提出了 Deep Q Learning（DQN），現在幾乎成了強化學習的標準。在DQN算法中，我們建立了⋯⋯

一個人工目標於是得到：

Y 與 Q 的差值，可模擬監督學習中的預測值，與標籤的差值，由此得到的時域差，用來更新網路得到最優值。在此基礎上，Deepmind 提出了三個主要的改進，形成了 Double DQN，首先是提出適合多層神經網路的Q函數；第二他們提出一個採樣任意的 Minibatch 的方式，處理訓練網路的數據；第三個則是他們提出了兩個 Q 函數，分別為當前 Q 函數，和目標 Q 函數來更新網路，這些改進使得強化學習更加穩定。

然而，當福特直接使用這些方法，是發現訓練神經網路經常容易失敗，並且訓練速度很慢。因此他們加入了一些常識性的規則，當發現行為不安全時，將安全的行為加入網路，對碰撞的判別，會混合到採樣隨機 Minibatch 中，用於網路的更新，最終結果取得顯著性效果。

在強化學習中，應該不僅僅依賴於對數據，這些短期性的經驗的學習，一些常識性的長期經驗規則的使用也很重要。

當前智慧駕駛汽車算法，和解決方案面臨的挑戰如下：

1、能學習特定駕駛員和環境、擁有最少的手工標定和標籤數據的車載或者雲平台的實時解決方案；

2、相比較監督式學習，更傾向於無監督和半監督強化學習；

3、包含認知資訊和實體模型的混合 AI 算法；

4、AI 算法可解釋、可驗證；

5、擁有加強特性，並且可以自評估；

6、維護成本低。

下面介紹一些有效的解決方案，每當我們遇到一個複雜系統時，我們會努力學習用一些複雜函數，去近似這個系統，例如神經網路，這是其中一種方法。另一種方法使用許多簡單的小的子系統，進行組合模擬複雜系統。

非監督的演化聚類算法，可以實現即時的學習，對系統的狀態空間進行預測，一個重要的例子，是對引擎特性具有自適應標定，和控制能力的在線上空時濾波器。

混合馬爾科夫模型，對於目的地和路徑的預測，也是非常有效的。神經網路的可解釋性，是近年來的熱點話題，強化學習可以使用神經網路，將狀態空間映射到行為空間，這是個非線性映射。

這種非線性映射，可不可以使用其他的映射，來近似並且時刻解釋的呢？

基於強化學習的控制器，將狀態空間映射到行為空間，而使用模糊控制器，基於規則的模型，則是一種通用的近似器，透過將強化學習 Agent 仿真，為黑盒子動態系統，它可以被有限級的「if－then」規則近似和解釋。

以強化學習車輛跟蹤控制為例，跟車問題，基本是是一種自適應巡航問題，後車需要保持與前車的安全距離、控制好各自的車速以及加速度，傳統方法中車速控制器，基於吉布斯分布、加速度控制器使用智慧駕駛模型（Intelligent Driving Model，IDM）建模，福特使用強化學習，分別建立速度、加速度，以及距離的獎勵函數，最大化獎勵函數得到的結果，達到甚至超過傳統方法。

在得到加速度結果後，他們使用聚類算法，以相對速度和相對距離作為輸入，預測加速度作為輸出，對數據進行聚類，來近似強化學習控制器，強化學習器被近似為可解釋的 PI 控制器的非線性組合的形式，組合系數為各數據點，到聚類中心距離負值的 Softmax 函數。

擬合效果基本達到原始強化學習其的性能，但是推理時間從強化學習器的 0.3ms，降低到了非線性組合的 0.13 ms。最後，對演化系統地總結如下：

1、使用演化聚類和核粒化的方法，講一個複雜系統，即時分解為多個相互重疊的子區域；

2、即時同步學習系統架構，以及局部子系統的參數；

3、對具有多個操作模式，和多元化行為的系統即時建模；

4、特定的機器學習技巧（無監督聚類與監督學習的組合）；

5、反映人類從現實中學習、總結、管理知識的能力。

我們在此提到的演化系統是多個子系統的組合，它的功能非常強大，包含了監督學習方法和非監督學習方法，可應用在即時的無人駕駛大數據處理中。

大數據、物聯網以及 AI 技術的快速發展，為智慧汽車提供了更多的解決方案，AI 算法則需要具備更多的人性化、自適應，和最小標定，以適應嵌入式實施的需求也很廣泛，智慧汽車的發展，為傳統 AI 算法的改進，提供了新的發展方向，傳統 AI 算法，應與基於規則的系統、認知知識，和基於第一性原理的模型相結合，此外，認知模型對統計機器學習的近似，使得傳統機器學習算法，變得可解釋和性能的可升。

以上就是我的報告，非常感謝大家！