SoftKinetic 3D Vision Technology
來源: 超多維SuperD
蘋果將在新一代產品iPhone 8上,使用前置3D深度攝影機的消息,讓3D深度攝影機的概念,進入了普通大眾的視野。
實際上,未來眾多先進領域的應用,將越來越依賴深度攝影機,比如VR、機器人、安全監控、自動駕駛等,這也是為什麼國際巨頭都在佈局於此的原因。
日前華為在其中國首都北京發佈榮耀V9,是業內首款3D建模手機,用戶可以通過雷射對焦獲得人臉數據,透過算法構建人像3D模型,進而透過預裝的APP,鏈接3D列印平台的各類消費需求。
目前,3D深度攝影機已經度過技術基礎期,方向明確,將進入3-5年的成長期,未來將掀起3D傳感器的浪潮。在這項技術引發革命前,我們先來簡要瞭解一下。
什麼是3D深度攝影機?
3D深度攝影機與普通攝影機的區別在於,除了能夠獲取平面圖像,還可以獲得拍攝對象的深度資訊,也就是三維的位置和尺寸資訊,於是整個計算系統就獲得了環境和對象的三維立體數據,這些資訊可以用在人體跟蹤、三維重建、人機交互、SLAM等領域。
深度攝影機具備以下優點:
1)相對二維圖像,可透過距離資訊,獲取物體之間更加豐富的位置關係,即區分前景與後景;
2)深度資訊依舊可以完成對目標圖像的分割、標記、辨識、跟蹤等傳統應用;
3)經過進一步深化處理,可以完成三維建模等應用;
4)能夠快速完成對目標的辨識與追蹤;
5)主要配件成本相對低廉,包括CCD和普通 LED 等,對今後的普及化生產及使用有利;
6)借助 CMOS 的特性,可獲取大量數據及資訊,對複雜物體的姿態判斷極為有效,無需掃描設備輔助工作。
3D深度攝影機採用的主流視覺技術
根據硬體實現方式的不同,目前行業內所採用的主流3D視覺技術有三種:結構光技術、飛行時間法(ToF)、雙目多角立體成像。
1)結構光(Structure Light)
通過雷射的折射,以及算法計算出物體的位置和深度資訊,進而復原整個三維空間。
結構光的代表產品,有微軟的Kinect一代。透過發射特定圖形的散斑或者點陣的雷射紅外線圖案,當被測物體反射這些圖案,透過攝影機捕捉到這些反射回來的圖案,計算上面散斑或者點的大小,跟原始散斑或者點的尺寸做對比,從而測算出被測物體到攝影機之間的距離。
目前是業界比較成熟的深度檢測方案,很多的雷射雷達和3D掃描技術,都是採用的結構光方案。
不過由於以折射光的落點位移來計算位置,這種技術不能計算出精確的深度資訊,對辨識的距離也有嚴格的要求。而且容易受到環境光線的干擾,強光下不適合,響應也比較慢。
典型的結構光方案包括:PrimeSense(微軟Kinect1代)、英特爾RealSense(前置方案)。
2)飛行時間法(TIme of Flight)
TOF系統是一種光雷達 (LIDAR) 系統,可從發射極向對象發射光脈衝,接收器則可透過計算光脈衝,從發射器到對象,再以像素格式返回到接收器的運行時間,來確定被測量對象的距離。
TOF系統可同時獲得整個場景,確定3D範圍影像。利用測量得到的對象坐標,可創建3D影像,並可用於機器人、製造、醫療技術,以及數位攝影等領域的設備控制。
TOF方案的優點在於響應速度快,深度資訊精度高,不容易受環境光線干擾,這些優點使其成為行動端,手勢辨識最被看好的方案。代表廠商有微軟(Kinect2代)、意法半導體、英飛凌、德州儀器等。
3)雙目多角立體成像(MulTI-camera)
現在手勢辨識領域的佼佼者Leap MoTion,使用的就是這種技術。它使用兩個或者兩個以上的攝影機,同時採集圖像,透過比對這些不同攝影機,在同一時刻獲得的圖像的差別,使用算法來計算深度資訊,從而多角三維成像。
Leap MoTion方案使用2個攝影機,獲得左右立體影像,該影像有些輕微偏移,與人眼同序。電腦透過比較這兩個影像,就可獲得對應於影像中物體位移的不同影像。該不同影像或地圖,可以是彩色的,也可以為灰階,具體取決於特定系統的需求。
雙目多角立體成像方案的優點,在於不容易受到環境光線的干擾,適合室外環境,滿足7*24小時的長時間工作要求,不易損壞。缺點是昏暗環境、特徵不明顯時不適合,目前應用在智慧安全監控、機器人視覺、物流檢測等領域。
0 comments:
張貼留言