cookieOptions = {...}; .解密人臉辨識算法原理 - 3S Market「全球智慧科技應用」市場資訊網

3S Market


八月3S Market精彩文章閱覽前十名


2018年7月9日 星期一

Smart Face Recognition System | Deep Learning | Opencv Python





來源: OFweek人工智能网



近日,由美國國家標準與技術研究院NIST(National Institute of Standards and Technology) 組織的人臉辨識算法測試FRVT2018結果公佈,三家對岸中國公司挺進前五。

其中冠軍被中國公司依圖科技再度摘得,中國科學院深圳先進技術研究院獲得第二名,排名前五的另一家企業是曠視科技。

NIST測試以其評測標準的嚴謹性、一致性和全面性,成為了全球規模最大、標準最嚴、競爭最激烈、最權威的人臉辨識算法比賽。

依圖科技其實是第二次獲得NIST比賽人臉辨識冠軍,去年6月NIST官方公佈的測試結果中,依圖在千萬分之一誤報下,達到辨識準確率95.5%,是當時全球工業界在此項指標下的最好水準。

今年依圖將這一指標,提升到了接近極限的水準,即在千萬分之一誤報下的辨識準確率已經接近99%。根據NIST官方4月發佈的競賽結果,曠視科技也曾登頂榜首,在百萬分之一誤報下的準確率為97.5%。

為此,小編特別想探究一下人臉辨識背後的算法原理。

1.基於幾何特徵的方法

基本思想:採用幾何特徵,進行正面人臉辨識,一般是透過提取人眼、口、鼻等重要特徵點的位置,和眼睛等重要器官的幾何形狀,作為分類特徵。

因為人臉由眼睛、鼻子、嘴巴、下巴等部件構成,正因為這些部件的形狀、大小和結構上的各種差異,才使得世界上每個人臉千差萬別,所以對這些部件的形狀,和結構關係的幾何描述,可以做為人臉辨識的重要特徵。


依图NIST夺冠,解密人脸识别算法原理



局限性:基於幾何特徵的方法是最早、最傳統的方法,通常需要和其他算法結合,才能有比較好的效果。基於參數的人臉表示,可以實現對人臉顯著特徵的一個高效描述,但它需要大量的前處理和精細的參數選擇。

同時,採用一般幾何特徵,只描述了部件的基本形狀,與結構關係,忽略了局部細微特徵,造成部分資訊的丟失,更適合於做粗分類,而且目前已有的特徵點檢測技術,在精確率上還遠不能滿足要求,計算量也較大。

2.特徵臉方法(PCA)
特徵臉方法是90年代初期,由Turk和Pentland提出的目前最流行的算法之一,具有簡單有效的特點, 也稱為基於主成分分析(principal component analysis,簡稱PCA)的人臉辨識方法。

基本思想:該方法是先確定眼虹膜、鼻翼、嘴角等,面像五官輪廓的大小、位置、距離等屬性,然後再計算出它們的幾何特徵量,而這些特徵量形成一描述該面像的特徵向量。其技術的核心,實際為「局部人體特徵分析」,和「圖形/神經辨識算法。」

這種算法是利用人體面部各器官,及特徵部位的方法。如對應幾何關係多數據形成辨識參數,與數據庫中所有的原始參數進行比較、判斷與確認。

局限性:特徵臉方法是一種簡單、快速、實用的基於變換系數特徵的算法,但由於它在本質上,依賴於訓練集和測試集圖像的灰度相關性,而且要求測試圖像與訓練集比較像,所以它有著很大的局限性。

3.神經網路方法

基本思想:人工神經網路是一種非線性動力學系統,具有良好的自組織、自適應能力。目前神經網路方法,在人臉辨識中的研究方興未艾,但在人臉辨識上的應用,比起前兩類方法來有一定的優勢,因為對人臉辨識的許多規律或規則,進行顯性的描述是相當困難的,而神經網路方法則,可以透過學習的過程,獲得對這些規律和規則的隱性表達,它的適應性更強,一般也比較容易實現。

因此人工神經網路辨識速度快,但辨識率低 。


依图NIST夺冠,解密人脸识别算法原理



局限性:神經網路方法,通常需要將人臉作為一個一維向量輸入,因此輸入節點龐大,其辨識重要的一個目標,就是降維處理。

影響人臉辨識的關鍵因素
光照變化
光照變化,是影響人臉辨識性能的最關鍵因素,對該問題的解決程度,關係著人臉辨識實用化進程的成敗。

目前有兩種解決思路:
第一是利用光照模式參數空間,估計光照模式,然後進行針對性的光照補償,以便消除非均勻正面光照造成的陰影、高光等影響;

第二是基於光照子空間模型的任意光照圖像生成算法,用於生成多個不同光照條件的訓練樣本,然後利用具有良好的學習能力的人臉辨識算法,如子空間法。

姿態問題

姿態問題涉及頭部,在三維垂直坐標系中,繞三個軸的旋轉造成的臉部變化,其中垂直於圖像平面的兩個方向的深度旋轉,會造成臉部資訊的部分缺失,因此姿態問題成為人臉辨識的一個技術難題。


依图NIST夺冠,解密人脸识别算法原理



解決姿態問題有三種思路:
第一種思路是學習並記憶,多種姿態特徵,這對於多姿態人臉數據,可以容易獲取的情況比較實用;

第二種思路是基於單張視圖生成多角度視圖,可以在只能獲取用戶單張照片的情況下,合成該用戶的多個學習樣本,可以解決訓練樣本,較少的情況下的多姿態人臉辨識問題,從而改善辨識性能;

第三種思路是基於姿態不變特徵的方法,即尋求那些不隨姿態的變化而變化的特徵。






0 意見: