2016年11月14日 星期一

.關於人臉辨識你至少應該知道這些

How Does Facial Recognition Work? - Brit Lab



來源: 億歐網


人工智慧(Artificial Intelligence,AI),英文縮寫為AI。廣義上的人工智實際上等同於機器智,通俗的解釋就是就是賦予機器以人的智慧,讓機器像人一樣學會思考。

機器學習(Machine Learning,ML)是人工智的一個研究分支,主要是設計和分析一些,讓計算及自動獲取知識的算法,涉及到概率論、統計學、逼近論等多個領域。

深度學習(Deep Learning,DL)又是機器學習的一個分支,可以理解為用電腦的算法,模擬人類大腦的深度神經網路,然而對於神經網路,我們還沒有一個嚴格的定義,但其特點是試圖模仿大腦的神經元之間傳遞,處理訊息的模式。

因此,簡單而言,人工智慧、機器學習和深度學習是一種包含關係。我們通過在計算能力和計算方式上的探索,在不斷接近人工智的本質——一個具備自我學習和應變能力的智機體。

但我們不能單純地認為,人工智只是把數學模型做的更準確一點,讓機器擁有擬人化能力,是一個漫長的發展過程:畢竟從電腦誕生,到現在的行動網路,我們就用了70年的時間。

而現在我們才剛開始,觸摸到到智時代的拐點的邊緣。我們之所以認為是「今天」處在智時代的臨界點,是因為以下最重要的兩個條件的形成:

1.計算能力到達了一定高度,摩爾定律推動了世界的發展;

2.大數據的積累、傳感技術的成熟。

今年正是人工智概念提出的第六十週年,當年參與達特茅斯會議的最後一名在世的科學家——人工智之父馬文明斯基也於年初離世,我們經歷了一個時代的結束,也面臨著一個新的時代的開始。

大數據和機器學習,讓電腦變得特別聰明,以至於使電腦能夠在某些領域,很大程度的超過人類的極限能力,比如谷歌AlphaGo戰勝了圍棋世界冠軍李世石,而人工智的目的,絕對不是讓電腦和人類下下棋而已,可以說未來幾十年,將面臨由大數據帶來的智革命,機器會獲得越來越全面的能力。

但實際上,人工智的應用範圍博大精深,繁冗複雜,在每一個垂直領域的應用,都需要克服難以想象的障礙。所以,我們先拆分大腦的功能,讓機器一點點實現智化。

人的大腦需要借助各種感官,如眼睛、耳朵等,感知外界資訊,然後進行判斷,這其中用機器來代替人眼,來做測量跟判斷的動作,稱為機器視覺,機器視覺是人工智學科中發展的最為快速的分支,而當今大家熟知的人臉辨識技術,就是機器視覺最富有挑戰性的課題之一。

人臉辨識
在深度學習誕生前,人臉辨識研究人員試圖不斷改進、提高電腦辨識人臉的能力,但相對人類本身所具有的人臉辨識能力,仍然望塵莫及。

直到2012年,深度學習開始影響人臉辨識技術的發展,基於深度卷積神經網路的方法,在不斷突破人工智算法的世界紀錄。如何在一張環境複雜的圖片中,快速辨識出人臉,對於人來說很簡單,但對於機器而言,需要經歷以下幾個步驟:人臉檢測、人臉分析、人臉辨識

科普:关于人脸识别你至少应该知道这些

一張圖片輸入機器後,需要先找到人臉的位置——人臉檢測,然後在這個基礎上,定位人臉關鍵點的位置(如眼睛中心或嘴角等)並提取特徵值——人臉分析,每個系統關鍵提取的數量相差很大,有的只有左右眼睛中心兩個點,有的可能多達近百個點。

這些點的位置,一是用來做人臉的幾何校正,即把人臉通過縮放、旋轉、拉伸等圖像變化,變到一個比較標準的大小位置。這樣待辨識的人臉區域會更加規整,便於後續進行匹配。

同時,現在的實際系統,一般也都配有人臉光學校正模組,通過一些濾波的方法,去除一些對光照更加敏感的臉部特徵。在做完這些預處理之後,就是從人臉區域提取各種特徵,包括LBP、HOG、Gabor等。

最終相關的特徵,會連接成一個長的特徵向量(Feature Vector),然後匹配出人臉的相似度,根據相似度的大小,系統會判定兩張圖片到底是不是一個人——人臉辨識。所以,想要降低人臉辨識的失誤率,需要強大的算法支撐。

但失誤率低,是否就能在商業領域中站穩腳跟?

產學研究
常言道:實踐出真知。

再強大的算法,如果不和現實的應用場景相結合,也無異於紙上談兵,除了名次的提升和無限接近於100%的實驗結果,並沒有帶來實際的價值,更何談社會效益。

人工智能產生的初衷,是為了取代人力,將人類解放出來去創造更多的價值,人臉辨識技術也同樣應該遵循這個基本原則。目前,隨著技術的發展和市場需求的快速增長,人臉已經在很多領域發揮了這樣的價值,如遠端線上核身,用刷臉替代實名場景中,需要的人力和物力。

而在實際應用場景中,我們通常會提到兩個概念:即1:1和1:N。

1:1可以粗暴地理解為,證明你就是你。事實上,1:1屬於一種靜態比對,在泛金融的核身、資訊安全領域中,還有潛在巨大的商用價值。例如在機場安檢口,總是需要有一個人拿著你的身份證,看看你再看看證件,來確認你就是持證人,這種場景就是典型的1:1場景。

然而人的肉眼辨識精準度是在95%左右,且長時間工作容易疲勞,所以機場安檢人員,需要在半個小時到一個小時之內,換班一次,來保證辨識的準確率。

而人臉辨識技術的出現,就完全能夠解決這種場景下「需要一個人」的問題,當然,這種價值同樣能在考試考生身份的審核、酒店入住辦理,火車站人票合一認證等,任何需要實名制的場景中體現。

在行業應用中,1:1更多是應用在金融、核身、資訊安全領域,特點是精準安全。

而1:N主要應用的方向是在商業、安防等。比如一個女士去商場買包包,店員不知道她是否是會員。如果引用機器視覺技術,不管店員換沒換,當顧客進門的時候,她的資訊就被推送給店員完成精準的推薦,這就是機器視覺在商業領域VIP客戶辨識的典型應用。在安防方面的應用,比如公共場所動態監控、緝拿逃犯、人員佈控等。

需要說明的是,人臉辨識技術的成熟,雖然能讓電腦替代人眼,取代一大部分在審核、找人工作中的勞動力,但它並不能作為嚴肅場景中的唯一的驗證方式。

舉例說明,在某公共場所動態監控緝拿逃犯時,因受外界環境干預,可能會同時彈出5個疑似的人選,這時就需要人工協助,共同完成辨識確認過程;又或者在企業應用中,具有較高機密性質的場所,可以採用人臉辨識和刷卡的雙重認證,來確保安全性。

可以肯定的是,相比於人眼的效率來說,人工智慧的人臉辨識能力,要遠遠超過人類。但這並不代表機器不會出錯,因此在準確形容人臉辨識通過率的專用詞彙中,有誤識率一詞,就曠視(Face++)而言,完全可以做到在萬分之一誤識率下,通過率達到98%並能夠滿足日常生活中的應用場景。

畢竟,人工智慧的意義,是賦予人類更強大的能力、協助人類更高效的工作——正如如我們開篇說的,Power human with AI,而並非取代人類。 



                                                                                                                                                                                                                            

Netgear arlo 無線雲端攝影機

沒有留言:

張貼留言