cookieOptions = {...}; . 用這種圖片能辨識人臉,也是夠了 - 3S Market「全球智慧科技應用」市場資訊網

3S MARKET

3S MARKET
2015年8月10日 星期一

清晨7:15:00


leiphone  思睿



紅外線監控影像或者是紅外線閉路電視的影像所存在的一個問題就是,它難以利用這些圖像來辨識出人物的身份。臉部在紅外線成像中看起來,會有很大的不同,要將紅外線圖像與他們正常外觀的圖像進行匹配,是一個尚未解決的挑戰。  人們的外表在紅外線和可見光之間的關係是高度非線性的,紅外線其趨向於使用被動感測器來檢測人體所散發出來的光線,而不是人體所反射的光線。


如今,德國卡爾斯魯厄理工學院的 Saquib Sarfraz Rainer Stiefelhagen 表示,他們已經研究出了如何建立中、遠端紅外臉部圖像,與對應的可見光圖像的關係。他們已經完美的教導神經網路來完成所有的工作。




面部散發紅外線的方式,與它反射光線的方式完全不同。散發的紅外線與空氣的溫度和皮膚的溫度十分相關,而這些又取決於人體的活動水準,以及人體是否有發燒等情況的影響。還有一個問題,使得紅外線圖像難以辨認臉部:可見光圖像具有更高的解析度,而遠紅外線圖像則低得多,這是由攝影機的性質而定的。總之,這些因素使得匹配紅外線圖像,與對應的可見光圖像變得很難。


但是近年來深層神經網路在應對各種複雜問題的改善上,給予了 Sarfraz Stiefelhagen 啟發。為什麼不訓練神經網路通過觀察紅外線版本的圖像,從而辨識可見光的臉部?近年來,兩個重要因素的結合使得神經網路變得更加強大。


l  一是更好地瞭解如何建立和調整網路來執行任務,這項技術領導了深度神經網路的創建。

l  二是大型資料庫的可用性越來越高,它們可被用來訓練神經網路。


將紅外線與可見光圖像進行比較的資料集很難得到,不過 Sarfraz Stiefelhagen 還是從聖母大學那得到了可用的資料:來自於82人的4585張照片,有解析度為1600×1200的可見光圖像,和解析度為312 x 239的遠紅外圖像。

該資料庫包含了人們面帶微笑、大笑,以及自然表情的圖像,並以兩種不同的光線條件來捕捉每天人們的外觀變化。之後,他們將圖像分割成像素為20×20的相互重疊的各部分,從而擴充資料庫。最後,Sarfraz Stiefelhagen 使用前41個人的圖像,來訓練他們的神經網路,並用另外41個人的圖像進行測試。


從測試結果來看,神經網路能夠在短短35毫秒內,完成熱成像圖與其對應的可見光圖像的匹配。他們表示:“匹配速度非常得快,能夠以28fps的刷新率即時運行。”但這並不意味著它已趨於完美。測試結果表明,最好的結果其精度也只是剛剛超過80%,而一對一的比較精度僅有55%。


更高的精度顯然只有更大的資料庫和更強大的網路才能辦到,但因此其成本也會更高。不過對這項技術感興趣的客戶,很可能是那些涉及到安全相關的軍事、執法機構和政府等,它們並不缺錢。


                                                                                                                                                                                                                            

0 comments: