cookieOptions = {...}; ★ 深度人臉辨識:簡單易懂的概述 - 3S Market「全球智慧科技應用」市場資訊網

3S MARKET

3S MARKET
2025年9月8日 星期一


基於深度學習的方法,極大地推動了人臉辨識技術的進步。閱讀關於深度人臉辨識技術及其應用和挑戰的概述。


viso.ai


人臉辨識是一種利用臉部辨識或驗證個人身分的方法。它是最重要的電腦視覺應用之一,具有巨大的商業價值。因此,靜態或即時人臉辨識,是電腦視覺和人工智慧 (AI) 領域研究最廣泛的主題之一。它在安全監控、執法、生物辨識、服務業、行銷等領域有著廣泛的應用。


Face Detection using Computer Vision with Facial Keypoints
使用臉部關鍵點的電腦視覺進行人臉偵測


該技術與人臉偵測相關,用於在應用人臉辨識方法之前,從影像背景中偵測、定位和提取人臉區域。


深度人臉辨識的歷史

20 世紀 90 年代初,隨著歷史性特徵臉 (Eigenface) 方法的引入,人臉辨識技術開始流行。在 20 世紀 90 年代和 21 世紀初,整體方法在人臉辨識領域佔據主導地位。整體方法透過某些分佈假設(例如線性子空間、流形和稀疏表示)推導出低維表示。整體方法的問題,在於它們無法處理偏離其先前假設的不受控制的臉部變化。這導致了 21 世紀初,基於局部特徵的人臉辨識技術的發展。


21 世紀初,基於局部臉部特徵的辨識,和基於學習的局部描述符被引入。人臉辨識軟體使用 Gabor 濾波器,和局部二值模式 (LBP) ,及其多級和高維擴展,透過局部濾波的一些不變特性,實現了穩健的性能。然而,手工建構的特徵缺乏獨特性和緊湊性。 2010 年代初,基於學習的局部描述符被引入人臉辨識領域,其中學習局部濾波器,以提高獨特性,並學習編碼碼本,以提高緊湊性。


2014 年,Facebook 的 DeepFace 和 DeepID,在著名的 Labeled Faces in the Wild (LFW) 基準測試中,取得了最佳準確率,首次在無約束場景下超越了人類的表現。此後,研究重點轉向基於深度學習的方法。深度學習方法使用多層級聯處理單元,進行特徵提取和轉換。因此,更大規模的人臉資料庫,和先進的人臉處理技術應運而生,以促進深度人臉辨識的發展。因此,隨著表示管道變得越來越深,LFW(野外標記人臉)性能穩步提高,從 60% 左右提高到 97% 以上。


Deep Face Recognition History

人臉辨識的歷史和里程碑。在 20 世紀 90 年代和 21 世紀初,整體方法一直很流行,直到 21 世紀初和 21 世紀初引入了基於局部特徵的方法。自 2014 年以來,基於深度學習的方法佔據了主導地位。 

人臉辨識與深度學習

深度學習,尤其是深度卷積神經網路 (CNN),在人臉辨識領域引起了越來越多的關注,並提出了多種深度學習方法。


自 2014 年以來,深度學習技術重塑了人臉辨識的研究格局,這得益於 DeepFace 和 DeepID 方法的突破。從那時起,利用分層架構學習判別性,人臉表徵的深度人臉辨識技術,顯著提升了最先進的效能,並催生了許多成功的實際應用。深度學習應用多層處理,來學習資料表徵,並進行多層次的特徵提取。


Overview of Deep Face Recognition Architectures
上行展示了物件分類中典型的網路架構。下行展示了人臉辨識演算法及其架構。


以下列出了最受歡迎的人臉辨識評估資料集:

1. 快速人臉驗證資料集

  • 自然界標註人臉 (LFW)
  • 自然名人正面肖像 (CFP-FP)
  • 交叉姿勢 LFW (CPLFW) 資料庫
  • 自然界年齡資料庫 (AgeDB)

2. 大規模人臉驗證與辨識資料集

  • 百萬人臉辨識 (MegaFace)
  • IARPA Janus Benchmark-B 人臉挑戰賽 (IJB-B)
  • IARPA Janus Benchmark-C 人臉挑戰賽 (IJB-C)

3. 基於視訊的人臉驗證資料集

  • YouTube 人臉資料庫 (YTF)


上敦 AXXON 台灣總代理


深度神經網路人臉辨識的工作原理是什麼?

人臉辨識憑藉其非侵入式和自然辨識的特性,已成為身分驗證的主要生物特徵辨識技術。因此,它已廣泛應用於軍事、金融、公共安全和日常生活等許多領域。


人臉辨識任務不同於一般的物體分類任務,因為它具有人臉的特殊性:它需要處理海量類別,這些類別之間的差異很小,但個體內部由於不同的姿勢、光照、表情、年齡和遮擋而存在巨大的差異。深度學習方法學習對應於不同抽象層次的多層表徵。這些層次構成概念的層次結構,對臉部姿勢、光線和表情的變化表現出強烈的不變性。


憑藉大量的訓練資料和現代圖形處理單元 (GPU),深度人臉辨識方法的效能,在過去五年中得到了顯著提升,並催生了許多成功的實際應用。因此,人們對人臉辨識及其子領域進行了多項研究,包括光照不變人臉辨識、3D 人臉辨識、姿勢不變人臉辨識、蒙面人臉偵測等等。


基於海量標註資料、演算法和 GPU,深度人臉辨識在一些標準基準測試中,已經達到了超越人類的表現,具體包括近正面人臉驗證、相似人臉鑑別、跨年齡人臉驗證等。


Face Recognition with Deep Learning
深度學習人臉辨識面臨的主要挑戰


深度神經網路人臉辨識應用

人臉辨識變體

3D 人臉辨識相較於 2D 方法具有先天優勢,但由於缺乏大量標註的 3D 數據,3D 深度人臉辨識發展尚不成熟。為了擴充 3D 訓練資料集,大多數研究採用「一對多增強」的方法來合成 3D 人臉。然而,提取 3D 人臉深度特徵的有效方法仍有待探索。


部分人臉辨識用於辨識完整人臉的任意影像區塊。部分人臉經常出現在不受約束的影像捕捉環境中,尤其是在透過監視攝影機 (CCTV) 或手機等手持裝置捕捉人臉時。此外,用於控制冠狀病毒的電腦視覺應用 —— 蒙面人臉辨識 —— 也屬於部分人臉辨識的範疇。


行動裝置的人臉辨識。隨著手機、平板電腦和擴增實境技術的興起,人臉辨識已應用於行動裝置。然而,由於計算能力的限制,這些設備中的辨識任務,需要以輕量但及時的方式執行。MobiFace 是一個深度神經網路,它提供了一種簡單有效的方法,可用於在行動裝置上有效地佈署人臉辨識。儘管它很輕量級,但卻取得了優異的效能結果(在 LFW 資料庫上準確率為 99.7%,在 Megaface 資料庫上準確率為 91.3%)。


人臉反攻擊

人臉辨識技術的成功,也引發了各種類型的攻擊,主要是對抗性機器學習攻擊,這些攻擊可能構成巨大的威脅。


人臉欺騙是指使用印刷的照片、佩戴的口罩,甚至是顯示在其他電子設備上的圖像,將假臉呈現給生物辨識感應器。為了防禦此類攻擊,人們開發了多種方法,例如,雙流 CNN,其中局部特徵,可以區分與人臉空間區域無關的欺騙區塊。另一種方法是使用整體深度圖,來確保輸入的活體樣本具有與人臉相似的深度。透過訓練真實和虛假圖像集(深度偽造),神經網路可以從預訓練模型進行微調。


對抗擾動是另一種攻擊類型,可以定義為增加一個最小向量。將此向量加入輸入影像後,深度學習模型會對輸入進行錯誤分類。目前已有一些對抗檢測和緩解演算法的實現。


模板重建攻擊:鄰域反捲積神經網路 (NbNet) ,可用於從深度模板重建人臉影像。


儘管反攻擊演算法取得了進展,但攻擊方法也在不斷更新,人臉辨識系統需要進一步提高安全性和穩健性。


AI generated photo of Trump and Biden
一張走紅的人工智慧深度偽造川普和拜登的照片


人臉辨識系統去偏差

現有資料集在人口群體分佈方面存在嚴重偏差,這可能會顯著影響深度模型的公平性。為了解決這個問題,一些研究試圖將公平性,引入人臉辨識軟體,並減輕人口統計偏差,例如,不平衡訓練、屬性移除和領域自動調整。


不平衡訓練方法,透過模型正規化來減輕偏差,同時兼顧人臉辨識系統的公平性。一個突出的問題是表徵不平衡,例如人臉辨識資料中,某些人口群體的代表性不足。例如,非白種人的錯誤率,通常遠高於白種人的錯誤率。基於強化學習的種族平衡網絡 (RL-RBN) 被開發出來,目的在利用感知偏度的強化學習,來減輕人臉辨識中的偏差。此方法是一種降低不同種族之間,特徵散度偏差的方法。


屬性移除方法,會混淆或移除人臉的人口統計資訊,以學習屬性不變的表徵。例如,引入了一種方法,該方法應用混淆損失,使分類器無法區分範例的屬性,從而從特徵表示中消除多個虛假變數。例如,SensitiveNets 引入了隱私保護神經網路特徵表示,以抑制學習空間的敏感資訊,同時保持資料的效用。此方法在最小化敏感資訊的同時,保持正負嵌入之間的距離。


領域自動調整方法,提出從領域自適應的角度研究資料偏差問題,並嘗試設計領域不變的特徵表示,來減輕跨領域偏差。例如,開發了一種資訊最大化自適應網路 (IMAN) ,來減輕種族偏差,它在領域層級匹配全局分佈,同時在聚類層級學習判別性目標分佈。另一種方法是藉助在公共子空間中,學習到的稀疏重建係數,將影像空間中的白種人資料,直接轉換為非白種人域。


電腦視覺中的人臉模糊處理保護資料隱私



0 comments: