你想知道Facebook 接下來的十年願景嗎?VR垂直媒體VRerse(元代碼)的創始人Nada撰文一聊(超詳實版)~
對與科技公司來說,關注 CEO 有時候不如關注 CTO 得到的收穫貨多。而 Facebook 今年 F8 大會的第二天,開場就是 Facebook 的 CTO 以及 Oculus 公司的首席科學家。他們兩人,共同告訴了我們接下來十年 Facebook 想要達到的一切。
上來,先是 Facebook 的 CTO Mike Schroepfer 介紹 Facebook 的願景。作為世界最大的網路社交平臺,在接下來的十年中, Facebook 希望能成為一個,更緊密地連接人與人之間關係的通道。但他們打算如何去做呢?有三個問題亟待解決。
第一:Facebook 需要建立一個全球化的基礎設施系統,來連接整個世界,覆蓋那些沒有互聯網的地區。
第二:Facebook 需要開發出一個自然的對話模式,來處理日漸雜亂的資訊,保證人們不被資訊海洋所淹沒。
第三:Facebook 需要打造虛擬實境,來讓人們和自己願意的人,在願意的地方,進行自己想要的體驗。
而為什麼 Facebook 想要通過解決這三個問題,來達到它的目的呢?Mike 以歷史的變遷打了比方:基礎設施就是資訊傳遞的方式 – 從馬車到火車到電報到電話,這些東西都是傳遞資訊,連接人類的方式,對於這個層面的問題來說,效率是最重要的。
然而,到了電話,有史以來第一次人類有了一種自然的對話模式,人們可以通過通話中,對方的語調來判斷情緒,進行深層次的交流
– 到了這個層面,講求的是設計,如何通過設計來強化人與人之間的交流,也就至關重要了。虛擬實境則是這一切的終點,因為交流,不過是和你的交流物件,在某一個空間裡進行的特定體驗。
這是 Facebook 接下來十年的主要任務,那麼,他們現在已經做到了什麼地步了呢?
這是 Facebook 建立的四個開放運算專案中心,裡面的結構、元件都由 Facebook 工程師設計製造,其效率相比一般的設計,一年僅在硬體層面就為
Facebook 節約了20億美金。這個專案在四年前就已經全部開源,大受業內好評,任何人都可以根據自己的需要,參考 Facebook 的設計,來組建自己的運算服務中心。
光是硬體當然不夠,軟體層面,Facebook 則有高性能PHP虛擬機器 HHVM,之前也已經開源,Mike 同時宣佈前端方面 React Native 開源。
而在網路方面,現在大約有11億到28億人是生活,在行動網路覆蓋範圍之外的。在這些範圍內無法鋪設基站,因為從任何層面來算帳都划不來,在人口密度過低的地區,建立大規模的基地台,實在是浪費又不環保。那有什麼降低成本的方式嗎?
這些無人機為太陽能機翼,翼長超過波音737,但品質只有一部小轎車那麼重,會在18公里-27公里的高空飛翔,一次起飛將滯空三個月,為偏遠地區帶來行動網路的覆蓋。今年下半年 Facebook 會為大家披露更多資訊,這也算是他們對 Google Fibre 和氣球的回應吧。
這是在基礎設施方面,Facebook 做出的努力
– 將整個世界用網路連接,同時給開發者們,提供建設行動網路的伺服器、底層以及前端工具。
至於自然交互的方式,目前最需要解決的就是資訊噪音。現在的我們被資訊海洋所淹沒,每天都有大量未經過濾的資訊傳遞給我們。這該怎麼辦呢?Facebook 在人工智慧的領域也有了一些進展 – 圖片對於機器來說不過是像素的集合;但是一些特定的東西,其像素組合是有規律的。Facebook 的人工智慧目前僅靠像素分析,就能分清楚400多種不同的運動,而且還是影像來著。
但真正困難的是對話背景。比如說這個問題:我在辦公室,小明在球場打籃球。我接了個電話,我在哪?
對於人來說,這個問題再簡單不過,但對於電腦來說,這幾乎是天書 – 因為要回答上面的問題,實際上要求的是有一個完整的世界框架,知道世界的基本運行方式。
而 Facebook 則採用了一種,叫做 Memory Network 的方式,模擬人的大腦,能即時地學習目前的狀況,並回答問題。而實現出來最後的結果,就是能閱讀懂一段關於魔戒的閱讀理解,並能以類似人的方式回答相關問題。這是僅僅六個月前 Facebook 的突破。
而當這些東西成功之後,人工智慧就能夠開始,為你挑選你需要的資訊 – 你喜歡什麼,你討厭什麼,盡在掌控。你將不為你不感興趣的資訊所擾,你寶貴的時間都會放在自己喜歡或者需要的事情上。
實際上,在個人助手這個層面,另外三大巨頭都已經有面世的產品:Google 的 Google Now,蘋果的 Siri ,以及微軟的 Cortana。以後在這個層面就是赤裸裸的人工智慧水準的高下之爭了。
對於 VR,疑問也更加多:VR 這個概念挺棒的,但是為什麼會是現在呢?畢竟這是在上世紀80年代就已經被定義下來了的概念。
原因在於 – 一個 VR 頭顯裡的每一個組件,只有在今天,才到了能夠在整合起來後,得到讓虛擬實境真正有意義的一個最低門檻
– 臨場感效果的水準。
>比如,螢幕只有到了今天,才能在一個5-6寸的面積裡放下 1920 × 1080 以上像素,且開關速度達到2ms級別的水準。
>比如,追蹤只有到了今天,才能夠以足夠低的價格,保證0.25°以下的角度誤差,0.1毫米以下的位置誤差的水準。
>比如,延遲只有到了今天,才能保證在20毫秒以內,完成次世代級別的畫面渲染。
而所有這些組件製作出來的價格,只有到了今天,才能達到為消費者接受的程度,且能保證消費者能體驗到進入另一個世界
– 臨場感的感受。
而每一個部件,每一個核心技術必須要達到一個最低要求,所以我們才能將它們組合到一起,成就一個虛擬實境的體系。
這是1980年的虛擬實境坦克駕駛模擬遊戲。你們覺得自己在坦克裡嗎?
而下面這個,則是今年將會發佈的一款虛擬實境遊戲:EVE:
Valkyrie 的遊戲實際影片:
想像一下,1:1完全地坐在一個駕駛艙裡……從此,“我們的征途是星辰大海”可以不再只是口號。
在現場放完這段影片後,Mike 問大家:”你們能感受到沖出隧道那一刹的作用力嗎?你們今年就能在 VR 裡感受到。”
“你們能夠……(意味深長地暫停3秒,眼珠不停轉動,嘴角抽動)在 Oculus 發佈的某款產品中玩到這個……” 介紹了一下新月灣原型機,告訴大家這款原型機,終於能做到讓人的潛意識認為,自己進入了另一個世界
– 當你在 VR 中看到自己站在懸崖邊上時,你沒有辦法邁開自己的腳,即使你的理智非常清楚明白,自己正在一個安全的房間裡。“我們今年終於可以通過消費級的產品,達到臨場感的最低要求。”
但是,這個和 Facebook 有什麼關係呢?Mike 問了大家一個問題:“你們中有多少人是自己一個人去電影院的?”
“為什麼你會和別人一起去一個封閉的空間裡,也沒有辦法和他人交流,只是一起盯著一個大螢幕?為什麼不一個人去?”
“因為,你和他人在一起,共用一個空間,創造了一段體驗和回憶。無論是在去的路上的興奮和回來的路上的探討,你和你的家人、朋友、愛人共用了一段體驗、生活。”
“而這種體驗,是人和人之間交流的本質,也是
Facebook 的最終願景和終極任務。”
正是和在乎的人在一起,體驗才有了意義。那些無法趕到現場的人。那些生活中的每一個驚喜。那些天涯海角的眷念。
“四天前,我四歲的女兒第一次自己騎上了一輛小自行車。那一刻,我想讓她的爺爺奶奶舅舅舅媽都看到,我希望所有人都能被傳送到那裡,分享我的喜悅。”
因此,這種讓人真的從最低層的潛意識感覺到,被傳送到另一個地方的臨場感,和世界上最大的社交平臺,就在這一刻融合。
而這,就是 Facebook 接下來十年的目標
– 真正地把人帶到一起。
而你,對“真正”這個詞,可能嗤之以鼻 – 虛擬實境嘛,再怎樣也是假的。
但是,安東尼賈逵稱:現實是塑膠,你想怎麼彎,就能怎麼彎(咦)
阿爾弗雷德說:地圖並非疆域。
心經有雲:色不異空,空不異色。
不過對於理科生來說,上面這些都是歪門邪道,我們要用科學的方法!來證明這個世界是假的,一切都是錯的!
所以,Michael Abrash,被 Mike 請上臺的 Oculus 的首席科學家,將會在下面用各種例子告訴你:“為什麼,虛擬實境對你會非常重要,而遲早,你也會被 VR 所吸納。”
虛擬實境這個概念,在上個世紀已經被埋葬過了。它被稱之為是無法實現的科學幻想,以及讓人頭昏眼花的科學笑話。但也許,這就是所謂的趕得早不如趕得巧,而現在,大家又開始重新關注 VR 了。不過,Abrash 對於
VR 系統化的思考,還是從『雪崩』以及『玩家一號』這兩本科幻小說開始的。『雪崩』讓 Abrash 明白虛擬世界的可行性,而『玩家一號』則讓大家看到了 VR 能成為什麼樣子。
這些科幻小說給了 Abrash 一個思考的框架,但,『駭客帝國』系列電影則讓他真正的理解了虛擬實境的意義和重要性。
答案,就在墨菲斯的那句世界名言裡:
這句話,就能讓你知道為什麼 VR 不僅僅是非常有意思,而且還能改變世界
– 以及遲早,你也得參與其中。
那麼接下來細細說明這句話的含義:
多數人,關注的都在虛擬實境的“虛擬”二字上,意思就是針對人的各個感官系統打造的各項信號系統。但實際上,真正應該關注的是“現實”二字。墨菲斯的名言則幾乎就是虛擬實境意義的核心主旨所在。
我們的意識,或者稱之為“靈魂”,從未和真正的現實(如果存在)進行過交流,實際上,我們一直在交流的,不過是眼耳鼻舌身意對應的大腦部位而已。
我們永遠不知道,真實的世界在經過我們的感官系統過濾之前是什麼樣子 – 而且這些感官感知到的也不過是真實世界中非常小的一部分。
就拿我們感知系統最發達的一部分 – 視覺來說吧,我們看不見紅外、紫外、X外線,我們只有三原色的感覺系統,真正的高解析度部分的可視角度只有2°左右,和一個拇指指甲大小差不多,我們每隻眼都有一個盲點,除了焦點以外,其它都是模糊的……
但即便我們能以360°的角度,非常完整精確地記錄每一個到達我們眼部的光子,我們依然沒有辦法建立一個正確的世界框架。
比如前段時間非常著名的藍黑白金裙子,其中的圖像實際顏色,和周圍環境暗示的顏色,有著非常大的差距。而每個人對於暗示和實際的感知都有不同。不過這不是最主要的,最主要的在於,你可以看到在這場席捲全球網路的爭議之中,所有人都對自己的感知正確性深信不疑。
所以,我們可以再回頭看看墨菲斯那句話的定義部分:真實不過是大腦給你的電子信號而已。
我們是如何通過如此有限的資訊感知世界的呢?基本上,我們已經有了一個關於這個世界的靜態模型,然後不停地根據外在資訊來更新它。而正是這個模型,才是你的世界,以及你感知到的一切。
我們感受到的並不是這個世界,而是這個世界的模型,我們本身不過是一個感受器而已。
但實際上,你把一切擋住,會發現無論紅藍,都是一樣。
左邊魔術方塊裡的藍色和右邊魔術方塊裡的黃色也是一樣。這個例子告訴我們:現實中多數時候的顏色魔術方塊都是由我們的感知系統憑空捏造出來的,而且其捏造程度遠遠超出你的想像。
還有更極端的例子,大腦的腦補能力能把真實的顏色完全反過來。
也許你會說,這些都是顏色而已,這個世界上還有色盲呢……那麼,形狀呢?
這些都是正常的橫平豎直的形狀,對嗎?但我們只要簡單地在上面加一些點……
如果你不相信這個圖和上面的方塊一樣是橫平豎直的,可以用任何直的東西量一下。這個幻覺產生的原因是,你的大腦會根據對比來判斷方向,而這些在方塊角落上的點,正是利用這一點,來讓你的大腦產生方向偏差的幻覺。這是一個二維下的形狀的例子,如果在三維下又會怎樣呢?
左邊的桌子明顯看起來瘦長,右邊的寬短。但實際上,這兩個桌子的面積完全一樣。在三維世界中,一個二維的面積大小取決於各種因素,你的大腦會自動調整。這種調整在這裡是錯的,但一般來說更有利於我們在三維世界的行動。
形狀完了……運動又如何呢?也許你認為,觀察運動一定是基於對於現實的回饋吧。
看看左邊,然後用餘光看右邊,注意點的轉動方向。接下來看看右邊,用餘光看左邊,注意點的轉動方向。你再來回試試看?
這個的原理是基於你的眼睛的感知系統 – 你的餘光解析度很低,只能注意到高對比,也就是黑色的部分,而黑色的部分恰好以符合逆時針的方向閃爍,於是在你的餘光裡,就會認為點在往逆時針方向轉動。
而下面這個則是簡易的人臉辨識系統,能自動追蹤觀測者的臉……
更離譜的是聲音。下面這個 McGurk 效應告訴我們,連聲音都是經過了我們大腦修正了的。我們聽到的會被我們看到的東西所影響
– 眼見不一定為實,耳聽更有可能就是虛的。
所以,我們認為的現實,不過是幻覺而已 – 一個經過了千萬年進化錘煉、能讓人自如地,在這個危險世界裡生存繁衍的精緻幻覺。這些例子告訴我們,一旦給予了我們合適的資訊,即便從理性上我們知道真正的“現實”是怎樣的,我們也很難去選擇感受到的一切。
這樣,就讓某些情況額外突出了 – 就是那些我們能選擇的現實:
我們可以選擇到底是從斜上方看到的還是從斜下方看到的這個方塊。
斯坦福大學虛擬互動實驗室創始人 Jeremy
Bailenson 說過:“所有的現實都是虛擬的。”
這就讓我們回到了虛擬實境這個話題上,以及這項技術,為什麼和之前所有的技術,有那麼大不同 – VR 是讓你真實地去體驗一個虛擬的世界,而上面這些例子告訴我們的就是,一個體驗是否真實,完全由你的感官系統決定。你的感官系統會自動為你做出判斷,無論你覺得自己有多理性,多“聰明”。
也就是說,當虛擬實境做得足夠好,就是現實。
而這些例子從另一個角度也告訴我們,我們無需完美地複製出現實(現在也做不到),就能讓你感覺真的去到了另一個世界。
比如說,新月灣裡的畫面,是每秒90幀的速度傳到你的眼睛裡,而現實世界的畫面當然是連續的。如果把速度降到60,有些人就會感覺到閃爍;降到10,所有人都能知道這是假的。新月灣的顯示和現實世界的呈現方式差異很大,但只需要滿足人們大腦的輸入要求,就能達到臨在感的效果。
而對於輸入的要求,最重要的一點就是回饋。比如,在新月灣的某個演示中,當你站在某個摩天大樓樓頂邊緣時,沒有人敢往前踏一步。而如果你看的是大螢幕上的影片時,無論多高,沒有人需要說要找個扶手。
差別在於,當你在新月灣原型機中,稍微轉動腦袋,你專門感受運動的前庭器官,對應上了視覺上的平移視差,完全符合了你對於這個世界的認知模型。當這些對應關係的延遲足夠低(20毫秒以內)時,你的大腦就混亂了,將這些虛擬的人造信號認知為真實世界的一部分。這就是虛擬實境和之前所有媒介的最大不同之處。
VR 的關鍵,就是直接 Hack 我們所有的感知系統,造出另一個現實來接管,所謂的“現實”對我們的控制。
這意味著,真正的虛擬實境,不僅僅能創造出目前世界上所有可能有的體驗(比如山上攀岩、在水裡游泳),更能創造出在人的感知範圍內,有能力經歷的一切體驗(比如在奇幻世界裡飛行)。真正地帶你飛。
當然,有很多事情今天是做不到的……今天的消費級技術,連在虛擬世界中看到自己的身體都有困難。但同時,這也是最讓人激動人心的點
– 虛擬實境有太多可以讓人來設計,來優化的地方了。
比如說,力回饋。我們希望在虛擬世界中看到自己的手,更希望能和虛擬世界互動,能摸到虛擬世界裡的物品。而現在的遊戲手柄,顯然沒有辦法提供這種體驗。但虛擬世界中的手,和現實世界中的手的使用差距,並沒有多數人想的那麼遙遠。
比如說,視覺。可視角度、像素密度、動態範圍、圖像品質、可變焦距,都有非常大的上升空間,而伴隨著這些參數的改進,工業設計和體積也會得到升級。這些上升空間有多大呢?
假設我們希望新月灣的顯示品質,和你桌子上在正常視距下的普通顯示器一樣,那麼新月灣的單眼解析度至少要到5k×5k,比目前新月灣的像素大概多上20倍左右(小猜測:5000×5000/20=1,250,000 ;1200×1080=1,296,000)。蛤?你問要到retina@180°級別?16k×16k(200倍)……
聲音好很多了,不需要太多的硬體更新,只需要更多的運算量和演算法反覆運算。
跟蹤也會是重要的一環,尤其是跟蹤人體,如果需要將你的表情,映射到虛擬實境中的角色身上,讓他人看見,那麼這意味著跟蹤必須要可以捕捉到眼部、嘴巴,乃至臉部肌肉的抽動。
而這些技術的每一部分,都要求人們對對應人體的每一部分,如何工作有更深層次的瞭解,而現在的程度還遠遠不夠。
那為什麼,Abrash 認為這一次 VR 會復甦呢?
首先是馬上要發佈的消費者版的,已經足夠吸引人了,能夠帶來以往任何設備都帶不來的體驗。每一個沒有預設的人,帶上這個設備都會興奮得瘋掉。
第三點是長期的推進承諾,在 Facebook 的收購之後,VR 的地位已經可以被確保,這麼大的賭注一旦下去,沒有人能夠撤回來。
最後一點則是技術的演進速度。 Abrash 拿自己的第一台電腦(沒有浮點運算能力),和 nV 剛剛發佈的 TitanX 浮點運算能力作比較,33年的提升大概是10億倍。這就是在競爭和需求的情況下,技術演進的速度。這,也會是 VR 的未來。
下一個平臺是什麼?對於我們來說,VR 可能不僅僅只是下一個平臺,因為它能創造出所有的人類體驗,它可能就是人類的終點。當然,現在還有很多碎片沒有拼合上:沒人知道應該如何解決在虛擬實境中的移動問題,沒人有完美的輸入方案,更不要說 VR 電影、社交方式運以及人們想在 VR 中玩的遊戲了。
但這些,遲早都會解決,在這個過程中留給大家的就是各種機會。我們都有可能成為 VR 大潮中的一部分 – 而我們每個人要思考的就是,到底在何時加入到這股永生難忘的浪潮中?
也許你希望成為領導者,推廣者;也許你希望等到這個技術成熟以後。但 VR 有著改變世界的潛力,且奇酷無比。因此,早晚你都會來到我們的身邊。
0 comments:
張貼留言