編者按:本文作者宮雅卓,聚虹光電創始人,上海交大博士。對生物特徵辨識有所研究,尤在虹膜辨識領域有15年的專研。
2015年9月8日,被眾多極客戲稱為“全球最不務正業”的“百度深度學習實驗室”,向全球正式發佈了趣味換臉APP——臉優Face It.
在這款APP上,用戶自拍或上傳任意一張臉部照片,即可自動生成素材。“臉優”既可以利用前置攝影機將素材貼合到用戶的臉上,進行即時演繹;也可以使用後置攝影機,將不同的臉與海報、電影、電視劇畫面貼合,毫無PS痕跡。通過“點擊拍照”或“錄製20秒影片”分享到微信、微博、QQ空間。
人臉辨識技術,由三個關鍵部分組成:人臉檢測、特徵提取、匹配辨識。
1、在背景景物中進行人臉檢測
也就是說,臉優首先判斷用戶上傳的照片中有沒有人臉,如果有,再利用人臉的左右對稱性定位臉形,並通過膚色、眼睛顏色、毛髮等特徵確定種族。
2、對人臉進行預處理,提取人臉特徵
一旦臉形確定,就可以從中心擴散,利用人體特徵器官的灰度變化、縱深複雜度和匹配度演算法,對諸多關鍵點進行檢測。
(臉優:帥哥變狗狗)
臉優的“圖像拼合”功能,是找到嘴、鼻子、眼睛、眉毛等關鍵點,與使用者選定的圖片素材相互拼合。人臉的關鍵點數量,可以分為不同等級,如5、25兩級,分別對應不同的調整需求。一般情況下,檢測到雙眼、鼻尖、兩邊嘴角這5個關鍵點,就可以實現步驟1的定位人臉。
(湯姆·克魯斯的5個人臉關鍵點 )
如果採用25個人臉關鍵點,在娛樂性應用中可以對更多人臉細節進行調整,如修片神器“美圖秀秀”深諳“大眼睛小臉”的審美,鎖定眼睛、嘴、下頜等多個關鍵點,讓女生一秒變女神。
2015年火爆全球的微軟“猜年齡 How-Old.net”,則是根據臉上27個隨著年齡變化明顯的人臉特徵,如眼角、嘴角、鼻子等關鍵點,判斷用戶的性別和年齡。“歲月是把殺豬刀”,隨著時光流逝,歲月磨蝕,皮膚會出現棕褐色暗斑和皺紋,眼角和嘴角也會下垂,而老化正是影響人臉辨識精度的關鍵因素。
(25個關鍵點對應的人臉部位)
3、匹配辨識
人臉辨識(Face Identification)就是將待辨識的人臉,與資料庫中的已知人臉匹配,判斷用戶的身份。中國婚戀網站世紀佳緣,採用人臉辨識技術,從海量資料中篩選出與使用者上傳照片最相似的人臉,為單身男女“牽線搭橋”,本質上就是看哪一對年輕人最有“夫妻相”。
百度魔圖,曾經推出一款HTML5遊戲,用戶自拍或上傳照片後,遊戲就會告訴你和哪個明星相似,相似度是多少百分比。
人臉辨識技術,用於“徵婚”、“追星”這類對辨識精度要求不高的娛樂應用,是可以滿足要求的。但是,一旦用於高安全等級的場景,人臉辨識精度就很不理想了。
最戲劇性的案例是,澳洲雪梨機場曾採用一套,具有最高辨識精度的人臉辨識系統,希望在乘客中辨識出恐怖分子,而這套人臉辨識系統的精度實在讓人失望,居然把美國著名女明星薇諾娜-瑞德 Winona Ryder ,錯認成了恐怖大亨賓拉登 Osama bin Laden。
花鉅資採購的人臉辨識系統,為什麼會犯這樣的低級錯誤?
最重要的原因是,人臉的“非剛體性”特徵。
“非剛體性”主要表現為人臉圖像在光照、姿態、表情等不同採集條件下的差異,髮型、鬍鬚、化妝、飾物、著裝的變化,以及年齡、疾病、外傷等因素的影響。人臉特徵先天就是不穩定的,隨著外部條件不斷變化的,這才是導致人臉識別精確度不高的根本原因。
在高安全性應用中,人臉辨識技術是不能獨立使用的,往往要與辨識精度更高的其他生物特徵配合使用,進行多模態辨識。最常見的多模態組合,就是“人臉+虹膜”。
“人臉+虹膜”的多模態辨識系統
“人臉+虹膜”的多模態辨識系統,一般使用流程是:採用監控攝影機對來往人流進行精度較低的人臉辨識(誤識率大約1/1000),一旦發現與警方提供的嫌疑犯臉部相似的人,便會發出警報,再採用精度更高的虹膜辨識(誤識率大約1/100萬),進一步精準判斷罪犯的身份。
人臉,在無需使用者配合的情況下,就可以採集到照片,幾乎沒有侵犯性的用戶體驗,使其成為“具有最高易用性”的生物特徵;而虹膜,是公認具有“最高辨識精度”的生物特徵。因此,“人臉+虹膜”的多模態應用,將兩者的優點(高易用性、高精確性)集於一身,才是目前生物辨識應用中最有優勢的技術方案。
沒有留言:
張貼留言