cookieOptions = {...}; ‧ 整天看片,就能預測未來? - 3S Market「全球智慧科技應用」市場資訊網

智慧生活設計事務所


2016年6月29日 星期三

leiphone 恒亮



整天看片,就能预测未来?

我們在看電影電視劇時,常常遇到看了開頭就知道結尾的片子。在這種「預測」行為中,其實我們不自覺地調取了日常生活中的各種經歷和過往,在大腦中閃電般地計算出一個事件發生的大致概率分布,然後才得出了結尾的劇情橋段。

可是你有沒有想過機器預測未來這件事,要怎麼實現呢?它們可沒有「生活經驗」可談。試想,如果機器具備了預測未來的能力,世界將會變成什麼樣?那時,世界杯、NBA都成了概率計算,美國總統大選也成了數學遊戲,明年會發生什麼問問機器人就知道了,是不是還挺可怕,挺無趣的?不過,目前還不用擔心,當前的技術水平畢竟還沒有這麼先進,但是來自美國麻省理工的幾位大神卻在向著這個方向努力,並且取得了一些成果。

 

上周,來自麻省理工計算機與人工智能實驗室的研究者們,發明瞭一種針對視覺機器人的全新算法,憑借該算法,視覺機器人可以一邊看電視劇一邊告訴主人:男主下面可能要跟女主握手,下面可能擁抱,下面可能打啵,下面可能擊掌歡慶(沒錯,目前只支持這4種行為的預測⋯⋯)。另一方面,機器人還能根據當前的圖像預測5秒之後可能出現什麼物體,比如打開冰箱之後5秒,機器人告訴你可能出現一盒牛奶。

談到他們具體是怎麼實現該神奇功能時,來自該實驗室的Carl Vondrick博士表示(他同時也是該項研究的領頭人):人類具有通過自己的歷史經驗和教訓預測未來的能力。我們想證明,通過向視覺機器人輸入大量的YouTube視訊和電視節目,再經過一些列的算法分析和加工,就能讓機器人具備類似我們人類的預測能力。


實現思路
通常的視覺預測方法大概有如下兩類:一個是單獨分析圖像中的每個像素點,然後計算下一幅圖的像素組成。這種方式其實更像是畫畫,而不是電腦科學,Vondrick博士表示。第二種是預處理一些圖片,由人工標明哪些是風景,哪些是人物,然後再輸入電腦進行運算,這種方式顯然不適合大數據量的預測,也不適合實際應用。
 與這兩種方法不同,Vondrick博士的團隊發明瞭一種新的算法,據稱可以實現「視覺表達」。該算法並不是以單獨的像素點為單位,而是以一組像素為單位,進行整幅圖像的預測。比如具有鼻子、眼睛和嘴巴這些像素點的一組像素,可以視為一張臉,然後用「臉」作為基本的運算單位來進行整圖分析。

此外,團隊還在算法中引入了深度學習,神經網路系統的算法,通過輸入大量的視訊圖像數據,然後讓機器自己分析和學習,類似於AlphaGo那樣整天自己跟自己下棋,這個機器人通過自己一個人整天看片的形式,學習其中人物的各種動作特徵,從而達到預測的能力。

The left-most column shows the frame before the action begins, with the algorithm's prediction below it. The right columns show the next frames of the video.

該系統在預測時是多線程並行工作,然後以類似於「加權取平均」的形式得到最終結論。由於目前只支持擁抱、握手、接吻和擊掌四種行為,因此分為四個並行線程,然後系統將四個線程的結果統一匯總,得到一個最終預測結果。比如,三個線程都預測下面會接吻,第四個預測是擁抱,則結果可能就是接吻了。

Vondrick博士說:視訊並不像《選擇你自己的冒險》系列叢書中所寫的那樣,人們能清晰地看到每一種選擇。現實是,未來通常都難以預測。但是,我覺得能通過團隊的努力,運用數據和算法計算出每一種可能的結局,這也是一件激動人心的事。

測試方法
讓系統獨自看片達600小時之後,研究人員開始對系統輸入一些新的影片,並開始訓練和測試。
第一步是讓機器預測下一秒,影片裡的人物會做什麼(當然還是從擁抱、握手、接吻和擊掌這四種選其一)。測試結果顯示,準確率可以達到43%,這比目前已知的其他算法要提高7%的準確率。

第二步是輸入影片中的一幀圖像,然後讓機器預測五秒後會出現什麼物體。比如,看到一個人打開微波爐,機器可能預測5秒後出現一個咖啡杯。測試結果顯示,這一步的正確率高達73%

研究者們還請了一些志願者來做對比測試,發現人類志願者的預測準確率只有71%,還略低於機器算法。

Vondrick博士表示:在人類的社交行為中隱含著許多的細節,我們希望可以研究這些細節,預測更複雜的人類行為。

未來如何
雖然現階段來說,該算法的準確度還並沒有達到實際應用的水平。但是Vondrick博士表示,該團隊非常看好算法未來的發展,他們認為該算法可能被應用在諸多的保全領域,例如預測有人要闖紅燈,然後發出告警等


Vondrick博士說:我很好奇如果花費一個人一生的時間,輸入足夠數量的數據到機器里,將會達到怎樣的預測水平。我們將很可能看到一個在現實生活中真實可用的預警機器人,那時人類的生活將會發生怎樣的巨變?

據稱,該項目得到了美國國家科學基金會和谷歌的資助。

還有一個關於該算法的影片介紹請點擊 這裡
來源mit

                                                                                                                                                                                                                            

0 意見: