小編找到的專業人士名叫 Leo,美國史丹佛大學機械工程博士和電腦碩士雙學位,向小編提供了一篇專業的論文《IMU Integrated Structured-Light Stereo Depth Camera for Mobile Robot Navigation and Obstacle Detection》(為機器人導航和避障而打造的的小覓雙目結構光慣導深度攝影機),當然作者正是Leo本人,讓我們一起來領略一下雙目結構光慣導技術。
Leo認為傳統的雙目屬於被動的雙目,而另外一種是主動雙目。被動雙目如果同時打兩個結構光的斑點的話,會發生干涉和光污染的問題,但主動雙目就沒有這樣的問題。這篇文章主要是基於 Leo 的論文完成的,感謝 Leo。
人和動物的最大區別主要在於語言,那麼人和機器之間最大的區別是什麼?這正是人工智慧(AI)所要研究的核心問題。人的眼睛能夠獲得 3D 的資訊,可以準確的認識這個世界,沒有複雜的算法、延遲、解析度,而機器認識這個世界,只能透過感測器來認識,用攝影機(相機)模仿人的眼睛,是最好的一種方式,這種技術被稱之為電腦視覺,也被稱之為人工智慧。
雙目視覺慣導里程計(Stereo VIO)和之前 SLAM 最大的不同在於兩點:首先,VIO 在硬體上需要感測器的融合,包括攝影機和六軸陀螺儀,相機產生圖片,六軸陀螺儀產生加速度和角速度。攝影機相對準、但相對慢,六軸陀螺儀的原始加速度,如果拿來直接積分會在很短的時間飄走(zero-drift),但六軸陀螺儀的頻率很高,至少有200Hz。
對於短時間內的快速運動,IMU 能夠提供一些較好的估計。這正是相機的弱點。當運動過快時,(捲簾快門的)攝影機會出現運動模糊 (小覓的雙目採用全局快門),或者兩幀之間重疊區域太少,以至於無法進行特徵匹配,所以純視覺 SLAM ,需要加大視角以應對快速的運動。而有了IMU,即使在攝影機數據無效的那段時間內,也能保持一個較好的位姿估計,這是純視覺 SLAM 無法做到的。
相比於 IMU,攝影機數據基本不會有漂移。如果攝影機放在原地固定不動,那麼(在靜態場景下)視覺 SLAM 的位姿估計也是固定不動的。所以,攝影機數據可以有效地估計,並修正 IMU 讀數中的漂移,使得在慢速運動後的位姿估計依然有效。
當圖像發生變化時,本質上沒法知道是攝影機自身發生了運動,還是外界條件發生了變化,所以純視覺 SLAM 難以處理動態的障礙物。而 IMU 能夠感受到自己的運動資訊,從某種程度上,減輕動態物體的影響。
作為基於視覺辨識技術的 3D 感測器,雙目結構光深度慣導攝影機,適用於室內外雙重環境,可以應對室外強光環境,辨識距離可達 30 到 50 米,完全黑暗的室內環境亦可工作。
除了支持 AI 和電腦視覺技術的 Missed Scan Detection 系統,沃爾瑪還在為建構全面的「AI 商店」做更多的技術研發和投入。
早在 2018 年 11 月,沃爾瑪就成立了一個,名為「智慧零售實驗室」的 AI 實驗室,和沃爾瑪店內負責建造 AI 實驗室的團隊 Kepler。他們就全自動化購物建模式進行技術開發,例如行動結賬、庫存管理攝影機系統、電子貨架標籤,以及透過附帶電腦視覺技術的攝影機來管理庫存,店鋪也能夠跟清潔機器人聯動,讓這些機器人自動清潔地板。