設計和製造機器人並使之具有類人的智慧,是人類文明進步與科技發展的目標之一。自上世紀中葉,第一台可程式設計機械手及工業機器人問世以來,機器人的研究取得了豐碩的成果,並在工業、醫學、農業、建築業、軍事等領域得以廣泛應用。
由於機器人技術綜合了多個學科的研究成果,代表了高科技發展的前沿,因此機器人成為體現各國科技實力的一項重要指標,引發了全球研究的熱潮。
探索的步伐從未停歇
從中國西周出現的“歌舞伶人”、古希臘人發明的“自動機(Automata)”,一直到當下各國研發的各類先進機器人,綜觀這一研發歷程可知,人類對機器人的研究,經歷了探索概念原型、面向程式控制機械、注重自主功能、強調高智慧水準等發展階段。
1954年,第一台可程式設計機器人(機械手),和1959年第一台工業機器人相繼問世,標誌著真正意義上的機器人誕生;1968年美國斯坦福研究所研製出名為Shakey的第一台自主移動機器人,機器人以獨立可移動個體的身份出現在世人面前;1969年日本早稻田大學加藤一郎實驗室研製了第一台以雙腳走路的人形機器人,與人們長期期待的真正像人一樣的機器人的夢想實現了接軌。
機器人學來自人們生產生活的大量實際需求,並且由於涉及眾多學科的技術革新,促使機器人技術飛速發展。機器人行業的巨大潛在價值得到了各國政府的強力支持、各大公司及科研院所的產學研整合。
正是這些力量的彙聚,架構了一個前景廣闊的機器人產業。與機器人學緊密相關的各個學科的突破和發展為機器人的研發打下了堅實的基礎。20世紀末,一系列各具特色的機器人井噴式湧現。
2015年6月,在美國國防先進項目研究局(DARPA)舉辦的挑戰賽上,登臺亮相了一批來自世界各國的先進機器人。幾乎每一款先進機器人的研製都有其相對應的強大力量作為支撐 —— 如DARPA支持下的波士頓動力研究所(Boston Dynamics)大狗(BigDog)機器人、Petman機器人、美國麻省理工學院(MIT)Atlas機器人與獵豹(Cheetah)機器人、歐盟框架計畫(EUFP6,EUFP7,Horizon 2020)支援下的iCub、日本產業技術綜合研究所(AIST)HRP系列機器人、日本本田公司的ASIMO機器人以及韓國高等科技研究院的HUBO機器人等。
美國波士頓動力研究所的大狗(Big Dog)機器人
儘管機器人的研發已經取得了長足的進展,然而“如何使機器人具備智慧”仍然是一項具有極大挑戰的課題。首先要回答的問題便是:機器人能否具備智慧?這是一個哲學性質的命題,而對這一命題的解答是以另一個問題的回答為基礎的,那就是:智慧的本質是什麼?該問題與物質、宇宙、生命被學者並列為自然界的四大奧秘。
目前看來,在包括腦科學與認知科學在內的眾多相關學科取得更大的、根本性的突破進展之前,該問題仍然無法獲得完美解答。
與人工智慧領域的研究及發展類似,如何使機器人具備智慧這一課題的研究,並未因其根本問題未予完美解答而停滯。相反,使機器人具備高智慧性正成為現階段機器人領域研究的主題。
研究者以人的智慧行為能力為藍本,從強調機器人環境知覺組織、複雜場景適應、交互與協作、概念形成與整合、知識獲取與推理、自主認知與高級決策、類人智慧行為等角度,展開機器人的智慧性研究。
雙足才是最優選
與輪式、履帶式和多足式機器人不同,雙足的仿人機器人(Humanoid Robot)作為結構複雜、高度集成的機器人家族成員,由於外形與人相似,不僅更適合在生活和工作環境中與人類協同工作,而且更適宜借鑒來自於人的智慧行為能力的啟示,從而成為研究機器人智慧性的最佳選擇。最典型的代表是在歐盟第6及第7框架計畫(EUFP6,EUFP7)以及Horizon 2020計畫支持下的iCub機器人。
iCub由歐洲10所大學組成的歐洲創新大學協會聯合研製,他們認為“仿人的操作是人類認知能力至關重要的因素”。基於這一“具身認知(Embodied Cognition)”思想,研究人員盡最大可能地模仿人的各類傳感及結構,歷時6年(2004年至2010年)開發了一個外形與2歲兒童相似的機器人iCub。iCub強調“認知能力的學習”,並將其作為開源平臺,通過與環境交互和與人交互來獲得各類行為能力和認知能力。
iCub機器人的外形與2歲兒童相似
日本本田公司研發的ASIMO機器人,以其移動能力和能實現複雜動作的特點,而聲名大噪。隨後在其版本更新的過程中,ASIMO對環境的認知能力也不斷加強,如增加了在複雜辦公室環境裡的靈活避障、與人交互的基本智慧行為等。
日本本田公司研發的ASIMO機器人
由於雙足機器人是一個固有的非線性不穩定系統。故而在現階段,其在複雜多變路面環境下的穩定、快速雙足行走,仍然是一個挑戰。韓國高等科技研究院HUBO仿人機器人,在2015年6月舉行的美國DARPA機器人挑戰賽上一舉奪魁,主要技術策略正是對雙足行走的研究成果。
HUBO機器人利用在其膝蓋和腳踝處裝置的滾輪,通過一個跪下行為實現了由雙足行走到輪式行走的切換,極大地提升了移動速度。這為研究機器人智慧行為借鑒其他優勢模式的有益性提供了例證。
韓國高等科技研究院HUBO仿人機器人
自主學習不可或缺
學習能力是系統智慧性的必要條件,一個不具備學習能力的系統,當然談不上“智慧”二字。學習的本質是指系統能根據過往經驗提升自身性能。機器學習作為人工智慧領域的核心內容,本就是一個持續受到高度關注的熱點,在“深度學習(Deep Learning)”取得巨大成功之後則更是如此。
在探索機器人智慧性的過程中,強調學習的特性是自然而然的事情。然而,我們想要強調的是,這種學習更應是機器人的自主學習。
以機器人獲得辨識人臉能力為例,自主學習指的是這樣的情形:機器人通過自己的眼睛(即安裝在機器人上的攝影機),不斷觀察呈現在它面前的人臉圖像,最終形成能正確辨識人臉的策略,這一過程應是增量式且終生性的,即辨識性能可隨觀察的增多而不斷地提升(Incremental Learning),且像人類一樣,在機器人生命期內一直持續(Life-long Learning),並非僅僅將一個事先訓練好的人臉辨識模型裝載在“機器人的大腦”(機器人的主機)中便萬事大吉。
儘管後一種處理方式可能省時省力,也可以使機器人暫時性地具備更好的識別性能,但這種方式卻忽略了機器人在“習得”這一能力過程中所擁有的豐富“副產品”—— 其他各種可能會在以後轉化為知識的有用圖像資訊。
機器人智慧性的體現不應是在代替人從事單一工作時的表現,更應是像人類那樣,智慧地從事各類工作,並應對多種情況。工業機器人引發了社會的重大變革,極大地提高了生產力,但那僅僅是“重大的”,並不是“徹底的”、“顛覆性的”。真正能夠使人類的生產生活發生深刻變革的,只可能是具備“通用智慧(General Intelligence)”的機器人。
這當然極具挑戰,甚至可能無法實現,但有關機器人智慧性的研究正朝著這個目標邁進,而強調機器人的自主學習方式,無疑是一個很好的出發點。
自主學習的三大特點
智慧型機器人自主學習的基本場景,體現在其各項技能的具體獲取過程中。前面提到的機器人自主學習,辨識人臉是機器人獲得人臉辨識這項技能的一個例子,另一個更直接的例子,是機器人獲得各項運動行為能力的過程。
根據機器人系統的構造方式,理論上,其在工作空間內的任意穩定運動行為(不僅包括靜態穩定,也包括動態穩定)都可以通過設計一組多關節運動軌跡來實現,如雙足仿人機器人的起立、行走甚至跳舞、打太極拳等。
但是,如果這些行為是根據專家經驗事先設計調整而成的,那麼便毫無智慧性可言;只有當這些行為是在自主學習的框架下獲得的,並且具備前述增量學習和終生學習的特點,才算是機器人具有智慧性的一種體現。
智慧型機器人自主學習的另一個特點,是對過往經驗或已有知識的再利用。這一思路與發展學習(或發育學習,即Developmental Learning)的思想是相吻合的。它是對人的學習成長過程的借鑒,因為利用已有經驗或知識來學習新的事物是人類提升認知能力和行為能力的基本特徵之一。
“機器人能否像小孩一樣學習?”
事實上,機器人基於自主學習思想獲得智慧行為能力的過程,正是借鑒了兒童認知發展的過程。早在1950年,以阿蘭·圖靈(Alan Turing)為代表的許多先驅學者便已提出“機器人能否像小孩一樣學習?”等類似問題。
然而針對這些問題的系統性研究,直到20世紀末才得以展開,這類課題的研究進程以Weng等人於2001年在美國《科學》雜誌上發表的“機器人或動物的自主心智發展”為代表。在機器人的已有研究中,有不少工作因其借鑒了人的行為方式從而取得成功,如基於人體運動捕獲資料(Human Motion Capture Data, HMCD)的一系列研究、機器人穩定行走研究中的膝蓋拉伸(Knee Stretched)及支撐腳橫滾策略(Rolling Foot)、抗推搡研究中的踝關節策略(Ankle Strategy)、臀部策略(Hip Strategy)以及邁步策略(Stepping Strategy)等等。
在探索“機器人能否像小孩一樣學習?”這個問題之前,首先要弄清楚的問題是“小孩是如何學習的?”。在這個問題上,著名心理學家皮亞傑(J. Piaget)將兒童的認知發展分為感知運動階段Sensorimotor
Stage(0歲至2歲左右)、前運算階段Preoperational Stage(2歲至6或7歲)、具體運算階段Concrete Operations Stage(6或7歲至11或12歲)、形式運算階段Formal Operations Stage(11或12歲及以後)四個階段,這一思想被公認為20世紀發展心理學上最權威的理論,該思想也為機器人自主學習各項行為能力(特別是運動行為能力)提供了理論依據和實施借鑒。
電影《人工智慧》從兒童認知發展角度為機器人的自主學習帶來深刻的思考
從兒童認知發展的過程,我們能夠得到一系列智慧型機器人構建其自主學習框架的重要啟示:
第一,完全自主性。我們完全做不到像對待機器人那樣,對嬰兒各關節賦以角度序列,使其完成某些動作;
第二,家長示教。儘管不能直接干預嬰兒的運動行為,家長仍可通過間接輔教,協助嬰兒完成特定的運動行為;
第三,主觀模仿。無論是家長刻意重複特定運動行為過程,還是嬰兒自己的主觀觀察,都更有助於嬰兒獲得該運動的行為能力;
第四,環境交互學習。嬰兒獲得的每一項特定運動行為能力,都是在與實際環境不斷交互後才逐漸真正掌握的;
第五,試錯模式。在與環境的不斷交互過程中,嬰兒總能根據環境的回饋對自身行為能力不斷加以調節。
如何管理已獲得的行為能力
智慧型機器人的自主學習還要面對一個問題是:如何合理高效地利用已獲得的各項行為能力。歸根結底,智慧型機器人研究的根本目標之一是在人類生產生活的實際環境中更好地服務於人類自身。這就需要機器人不僅擁有多項行為能力,而且在任務改變或環境變化時能即時做出恰當的回應,即線上改變其運動行為。
一個直觀的方法便是“記憶-回檔”法:仿人機器人將其已獲得的各項特定行為能力以某種方式記憶存儲,當遇到特定任務或環境時,它會迅速地切換或回檔出相應的應對行為與能力。然而,由於任務的多樣性以及環境的複雜多變性,對於機器人而言,意味著它要面臨過多項不同的運動行為能力的選擇。
比如,沿不同坡度的坡面行走可能對應著不同的運動技能(要麼是不同的控制模型,要麼是同一模型的不同參數),那麼,簡單的記憶回檔便不能滿足要求了。因此,智慧型機器人如何通過自主學習獲得對已有經驗知識的抽取和表示,也成為一個重要的研究課題。
智慧型機器人通過自主學習獲得具有切實的類人的智慧行為能力,是一個長久目標,絕非一日之功。然而,前進道路上的每個階段性進展,在當今機器人技術研發和應用的大熱潮下,都可能引發巨大的市場效益,對推動本地市場乃至世界機器人科技的進步,都將發揮重要作用。
沒有留言:
張貼留言