Using facial recognition to identify strangers - BBC Trending
來源: 興業證券研究報告
發展至今,大數據不再為網路企業獨有,而是逐漸成為覆蓋各行業、可以為具體業務服務的技術。
在對岸的中國,春節不僅演化成了一年一度的「人口遷徙」大節,還成了交通、保全等領域,接受技術檢驗的關鍵時刻,交通疏導,以及火車站、汽車站、機場等場所的安全防範工作,均是重中之重。人滿則為患,影像大數據分析技術,在其中承擔了巨大的作用。
在複雜環境下,對人、車、物的多重特徵資訊提取,和事件檢測,從而有效區分行人與干擾物體,這種精確的客流統計,離不開智慧攝影機監控。
據悉,元宵節當天,中國的南京夫子廟先後湧進近70萬觀燈市民,人流峰值曾達到了11.5萬人。(數據來源於海康威視)
觀燈會中使用的雙目客流攝影機,在雙鏡頭立體成像的基礎上,能夠對遊客的徘徊和身高進行過濾,並可以結合後端客流量統計分析系統,協助南京公安即時進行客流管控,一旦客流量統計分析系統,檢測出入口客流數據成長超出預期,指揮部馬上通知該出入口的民警,採取人員引導、限流和組織人牆措施,從而保證賞燈的有序性和安全性。
為什麼攝影機能夠自動過濾篩選資訊呢?
影像大數據分析需要經過三個層面的問題,一是目標檢測和跟蹤,二是目標辨識, 三是行為辨識。
設想一下, 在一幀影像內容裡,我們首先要把人,從周圍環境中分離出來(目標檢測),然後分析出這個人是誰(目標辨識),最後通過對其肢體動作分析,得到他在幹什麼(停留還是徘徊,或者其他行為)的結論,甚至推理出—— 他將要幹什麼(行為理解)。
目標檢測和跟蹤(你在哪兒)
可見,這三個層次是依次遞進的,目標檢測是目標辨識的基礎,而行為辨識是目標辨識的高級階段,這三個層次總體構成了攝影機智慧過濾的功能。
其中影像目標檢測和跟蹤,具有很強的實用價值,主要應用在影像監控、智慧交通、人機交互、機器人導航等領域。
以下是幾種常用的動態影像目標檢測方法:
背景減除:背景的建模是背景減除方法的技術關鍵,它一般能夠提供相對來說,比較全面的運動目標的特徵數據,但對於動態場景的變化,如光線照射情況,和外來無關事件的干擾等,也特別敏感。
時間差分:又稱相鄰幀差方法,利用相鄰幀圖像的相減,來提取出前景移動目標的資訊,對於動態環境具有較強的自適應性,但一般不能完全提取出,所有相關的特徵像素點,在運動實體內部容易產生空洞現象,只能夠檢測到目標的邊緣,當運動目標停止運動時,一般時間差分方法便失效。
光流:基於光流方法的運動檢測,採用了運動目標,隨時間變化的光流特性,該方法的優點是,在所攝場所運動存在的前提下,也能檢測出獨立的運動目標。大多數的光流計算方法相當複雜,且抗噪性能差,如果沒有特別的硬體裝置,則不能被應用於全幀影像串流的即時處理。
目標辨識(你是誰)
目標辨識主要是判斷影像的內容是什麼,如透過人臉辨識技術,達到判定目的。目標辨識的過程,是將待辨識的目標,與指定的目標庫中的特徵進行比較,以確定是否與該庫中的某一目標相匹配。其方法主要有:幾何特徵法、神經網路法、隱馬爾可夫模型法、利用人臉側面像的輪廓,進行辨識等。
目前,該技術的難度,在於光照條件的改變、 角度的不同、 遮擋,人臉辨識技術中,還包括人臉表情的變化、年齡增長等帶來的變化。
行為辨識(你在幹什麼)
行為辨識即是行為理解,它對數據分析結果的應用,極其重要。因為其回答了目標「將要幹什麼」的問題,可以基於理解的結果,進行預判。
例如,在各種光照變化、人群遮擋等複雜環境下,相關機構可以透過影像數據,分析估計人群數量和密度,同時檢測人群過密、異常聚集、滯留、逆行、混亂等多種異常現象,實現重大活動、重要區域的人流統計與控制,並提供即時警報功能。
深度學習(模仿人腦機制解釋數據)
在影像大數據分析的三個層次中,目前研究熱點,主要集中在目標辨識和行為理解兩大領域。學術界和產業界最終的目的,是讓電腦具備人類眼睛和大腦的功能,「看到」並「領會」到圖像和影像上的資訊。
在具體技術手段上,業內往往採用電腦視覺技術,特別是以深度學習為基礎的電腦視覺技術,近年來在影像分析中得到廣泛應用。
電腦視覺技術,指的是依靠算法,在沒有其他輔助資訊的前提下,僅根據圖片像素資訊,分析出圖像的語義,一般分為圖像獲取、預處理、特徵提取、檢測/分區和高級處理。
沒有留言:
張貼留言