．人臉辨識應用日益廣泛， 技術公平性和準確性如何保證？

What’s Going On With Facial Recognition? | Untangled

智慧安控專區，展覽報名聯絡人：

0935-970-603 施正偉

來源：专业学士作者：专业学士

由於深度學習的普及，近年來機器學習研究蒸蒸日上，人臉辨識技術也得到了極大的改善。在一個典型的用例中，照片、影像，或即時流媒體中的人臉會被掃描、分析，接著，它們的特徵會被拿來與數據庫中，注釋過的人臉進行比較。

這項技術，在中國正被用於打擊人口販運，和機場快速安檢，同時它也被用於監視音樂會、體育賽事。

然而，臉部辨識的準確性仍是一個問題。研究人員開始擔心人工智慧系統中存在的歧視和偏見。該技術在正確辨識有色人種和女性等方面，還存在著重大缺陷。造成這一問題的原因之一，是數據集裡男性相對於女性、白人相對有色人種的懸殊比例。

對機器訓練來說，數據多樣性很重要，但數據的體量大小也同樣重要。人臉辨識系統的訓練和測試，需要在數百萬甚至數千萬張人臉上進行。

多年來，研究人員一直透過人臉辨識數據集，來進行相關研究。這個包含圖片鏈接的數據集，都是從一個資源包中，整理生成。該資源包被用於各種各樣的科學項目研究，包括在不使用地理坐標的情況下，估算照片和影像的拍攝地點的研究。

IBM 開發了一個名為「人臉多樣性」的新項目，並為其準備了上百萬張圖片，該項目將進一步提升人臉辨識的公平性和準確性。

研究人員們透過網路，收集並注釋了各類物體的照片，以此來訓練電腦，讓其可以更好地瞭解它們周圍的世界。

通常，他們透過谷歌圖片搜索，和一些其他的途徑，獲取數量巨大的圖片。得到的數據集通常被用於學術研究，比如訓練或測試人臉辨識算法。

但隨著微軟、亞馬遜、臉書和谷歌等公司，押寶人工智慧，人臉辨識正走出實驗室，進入大型企業的視野中。

隨著消費者意識到他們在互聯網上，留下的數據能夠產生的巨大威力，人臉辨識數據集正在加劇，人們對隱私和監控的擔心。因此，一些研究人員正在重新審視，這種野蠻收集他人照片的行徑。在充滿分享精神的互聯網中，使用他人照片本應徵求別人同意。

許多公司、研究機構和個人，都為人臉辨識編制了數據集，IBM 只是其中之一。其中一些數據集由實際的圖像組成，還有一些類似 IBM 的數據集，是由圖像鏈接組成的。有時，數據集也是可以透過拍攝模特兒得到的。

通常情況下，這些數據集是知識共享的，但它們必須用於非商業目的，比如算法研究。但大量的類似數據集，可以從網站免費下載。

知識共享協議於 2002 年首次發佈，遠遠早於當前的人工智慧熱潮。

儘管研究人員在網站上免費使用圖片，但他們也承認，許多上傳這些照片的人，可能會對照片被用於訓練人工智慧的事實，感到驚訝。

一些研究人員認為，人們應該透過授權，自己決定圖片是否可以用於電腦視覺或人工智慧研究。

對此，知識共享協議，並不能幫上大忙。只要遵循相關的條款，這個來自非營利組織的許可協議，並不限制任何形式的人工智慧開發。

知識共享組織首席執行官稱：「這些協議，並不是為了保護隱私，或研究倫理而設計的。」

近年來，人工智慧發展之快，以至於相關法規幾乎還沒有來得及制訂，更不用說實施了。法律上，在收集和使用圖像，進行人臉辨識時，公司並沒有告知義務。

目前還沒有相關的聯邦法規出台。在各州，情況則有所不同：例如，美國伊利諾斯州有一項法律，要求公司在收集生物特徵資訊之前，必須得到客戶的同意；亞馬遜和微軟總部所在地，華盛頓州的州參議院，最近通過了一項，限制人臉辨識使用的法案，該法案仍需在該州眾議院獲得通過。

今年 3 月，參議院提出了一項法案，要求企業在收集和共享辨識數據之前，必須徵得消費者的同意。它還要求公司進行外部測試，以確保算法在實施前是公平的。

數位版權組織電子先進基金會技術政策主管則表示，即使沒有嚴格的法律限制私人照片，用於人工智慧訓練，企業和研究團體也應該注意遵守道德規範。

在他看來，這意味著使用照片，就要得到照片中人物的明確同意。即便這很難做到，它也是企業必須面對的現實。

按此回今日3S Market新聞首頁

3S MARKET