‧ 整天看片，就能預測未來？

leiphone 恒亮

我們在看電影電視劇時，常常遇到看了開頭就知道結尾的片子。在這種「預測」行為中，其實我們不自覺地調取了日常生活中的各種經歷和過往，在大腦中閃電般地計算出一個事件發生的大致概率分布，然後才得出了結尾的劇情橋段。

可是你有沒有想過機器預測未來這件事，要怎麼實現呢？它們可沒有「生活經驗」可談。試想，如果機器具備了預測未來的能力，世界將會變成什麼樣？那時，世界杯、NBA都成了概率計算，美國總統大選也成了數學遊戲，明年會發生什麼問問機器人就知道了，是不是還挺可怕，挺無趣的？不過，目前還不用擔心，當前的技術水平畢竟還沒有這麼先進，但是來自美國麻省理工的幾位大神，卻在向著這個方向努力，並且取得了一些成果。

上周，來自麻省理工計算機與人工智能實驗室的研究者們，發明瞭一種針對視覺機器人的全新算法，憑借該算法，視覺機器人可以一邊看電視劇一邊告訴主人：男主下面可能要跟女主握手，下面可能擁抱，下面可能打啵，下面可能擊掌歡慶（沒錯，目前只支持這4種行為的預測⋯⋯）。另一方面，機器人還能根據當前的圖像預測5秒之後可能出現什麼物體，比如打開冰箱之後5秒，機器人告訴你可能出現一盒牛奶。

談到他們具體是怎麼實現該神奇功能時，來自該實驗室的Carl Vondrick博士表示（他同時也是該項研究的領頭人）：人類具有通過自己的歷史經驗和教訓預測未來的能力。我們想證明，通過向視覺機器人輸入大量的YouTube視訊和電視節目，再經過一些列的算法分析和加工，就能讓機器人具備類似我們人類的預測能力。

Action-Prediction Algorithms

實現思路

通常的視覺預測方法大概有如下兩類：一個是單獨分析圖像中的每個像素點，然後計算下一幅圖的像素組成。這種方式其實更像是畫畫，而不是電腦科學，Vondrick博士表示。第二種是預處理一些圖片，由人工標明哪些是風景，哪些是人物，然後再輸入電腦進行運算，這種方式顯然不適合大數據量的預測，也不適合實際應用。

與這兩種方法不同，Vondrick博士的團隊發明瞭一種新的算法，據稱可以實現「視覺表達」。該算法並不是以單獨的像素點為單位，而是以一組像素為單位，進行整幅圖像的預測。比如具有鼻子、眼睛和嘴巴這些像素點的一組像素，可以視為一張臉，然後用「臉」作為基本的運算單位來進行整圖分析。

此外，團隊還在算法中引入了深度學習，神經網路系統的算法，通過輸入大量的視訊圖像數據，然後讓機器自己分析和學習，類似於AlphaGo那樣整天自己跟自己下棋，這個機器人通過自己一個人整天看片的形式，學習其中人物的各種動作特徵，從而達到預測的能力。

The left-most column shows the frame before the action begins, with the algorithm's prediction below it. The right columns show the next frames of the video.

該系統在預測時是多線程並行工作，然後以類似於「加權取平均」的形式得到最終結論。由於目前只支持擁抱、握手、接吻和擊掌四種行為，因此分為四個並行線程，然後系統將四個線程的結果統一匯總，得到一個最終預測結果。比如，三個線程都預測下面會接吻，第四個預測是擁抱，則結果可能就是接吻了。

Vondrick博士說：視訊並不像《選擇你自己的冒險》系列叢書中所寫的那樣，人們能清晰地看到每一種選擇。現實是，未來通常都難以預測。但是，我覺得能通過團隊的努力，運用數據和算法計算出每一種可能的結局，這也是一件激動人心的事。

測試方法

讓系統獨自看片達600小時之後，研究人員開始對系統輸入一些新的影片，並開始訓練和測試。

第一步是讓機器預測下一秒，影片裡的人物會做什麼（當然還是從擁抱、握手、接吻和擊掌這四種選其一）。測試結果顯示，準確率可以達到43%，這比目前已知的其他算法要提高7%的準確率。

第二步是輸入影片中的一幀圖像，然後讓機器預測五秒後會出現什麼物體。比如，看到一個人打開微波爐，機器可能預測5秒後出現一個咖啡杯。測試結果顯示，這一步的正確率高達73%。

研究者們還請了一些志願者來做對比測試，發現人類志願者的預測準確率只有71%，還略低於機器算法。

Vondrick博士表示：在人類的社交行為中隱含著許多的細節，我們希望可以研究這些細節，預測更複雜的人類行為。

未來如何

雖然現階段來說，該算法的準確度還並沒有達到實際應用的水平。但是Vondrick博士表示，該團隊非常看好算法未來的發展，他們認為該算法可能被應用在諸多的保全領域，例如預測有人要闖紅燈，然後發出告警等。

Vondrick博士說：我很好奇如果花費一個人一生的時間，輸入足夠數量的數據到機器里，將會達到怎樣的預測水平。我們將很可能看到一個在現實生活中真實可用的預警機器人，那時人類的生活將會發生怎樣的巨變？

據稱，該項目得到了美國國家科學基金會和谷歌的資助。

還有一個關於該算法的影片介紹請點擊這裡

來源：mit

按此回今日3S Market新聞首頁

3S MARKET

‧ 整天看片，就能預測未來？

0 comments:

Recent Comments

Arsip Blog