Hitachi reveals AI security software
來源:OFweek安防网
經過20多年的本土化發展,安控經歷了類比、數位、網路、高清四個時代,目前已經進入到「安控 + AI」智慧化階段。就在傳統安控企業砥礪前行之時,廣闊的 AI 安控藍海市場,吸引了眾多 AI 公司紛紛參與圍獵,就連 BAT、華為等巨頭也參與其中。
5月27日,智慧交通知名整合商千方科技,宣佈獲得阿里巴巴近36億元參股,一時竟引得行業紛紛競猜阿里巴巴的安控佈局意圖。其實在此之前,阿里巴巴就已經推出了佈局智慧城市頂層應用的「城市大腦」,這是一套基於大數據應用的城市級管理平台,也是阿里佈局安控的標誌。
以阿里之能,仍需投資一家擁有安控生態的整合商,至少說明阿里此前的安控佈局進展並不順利,需要擴充資源,來協助其 AI 技術在安控領域縱橫捭闔。
那麼,安控究竟一個什麼樣的行業?其 AI 生態都存在哪些痛點,竟然在眾多知名 AI 企業圍剿下仍需合縱連橫?
四重生態,AI 各有佈局
我們看安控 + AI,通常為算法 + 晶片、設備製造 + 解決方案、行業應用三級生態。
最上層為基礎算法和晶片,以宇視科技為代表的安控企業,都開發有各自的 AI 算法;商湯、曠視、依圖、雲從 4 大 AI 獨角獸更是聞名全球,可以說在算法端,中國企業、中國的安控公司都走在了世界前列。而晶片端,主流產品有 GPU、ASIC、FPGA 三大類型產品,相較國際晶片巨頭,中國已能滿足自給自足需求。
中游則是各種軟硬體產品和解決方案。宇視科技高級人工智慧專家黃攀告訴小編:這是安控生態中,宇視科技等一眾安控企業的強項,可以提供從端計算——邊緣計算——雲計算的三個覆蓋大安控各細分行業的所有產品和解決方案,其中就包括了AI、儲存、大數據等基礎應用。
下游為政府、教育、醫療、零售等各個行業場景應用,涉及的產業鏈和企業類型較多,除了深耕安控的設備商外,還包括營運服務商、系統整合商、軟體定制服務商等安控生態企業;宇視黃攀指出,安控 + AI 的產品落地中,最終面對用戶的部分恰是產品變現的「最後一公里」。
除了上面三部分生態,安控 + AI 還需要最底層的核心架構,也是最易為大家所忽視的部分。目前主流的 AI 底層架構有Caffe(卷積神經網路框架)、Tensor Flow(第二代人工智慧學習系統)等,且掌握在谷歌、Facebook 等國際巨頭手裡,本土企業中,僅有百度、阿里巴巴、商湯、曠視等少數 AI 玩家在建構自己的深度學習架構。
兩大因素限制約早期 AI 爆發
人工智慧之於安控,一直存在;只是人臉辨識技術起來後,才廣被大眾所熟知。其實,安控領域是人工智慧技術應用最早、類型最全的一個行業,涵蓋車輛、行人、人臉、行為、動作、步態、物品、事件等的辨識與應用,不過早期安控智慧較集中於智慧交通領域,對車輛的車牌辨識、車輛品牌、顏色等車輛屬性涉及較多,近幾年才慢慢擴展到人體、人臉、動作、事件等各種智慧方案。宇視黃攀認為,這是歷史發展規律使然,主要有受兩方面因素限制。
先從算法維度分析,安控業經歷了從類比——數位——高清——智慧畫的轉變。早期安控首先需要解決的是圖像清晰化的命題,編解碼算法和圖像處理算法,是業內廠商最優先發展的算法;隨著智慧交通的興起,對車輛屬性的辨識成為主流應用,傳統模式辨識 + 淺層機器學習逐步在安控領域成為主流。隨著2012年AlexNet的驚艷表現,深度學習算法得到爆發性發展,安控智慧真正進入到「深度」智慧階段,並最先在人臉辨識領域得到大規模應用。
再從硬體維度分析,早期沒有專門針對人工智慧的算法晶片——算力,當行業進入到深度學習算法階段後,專注於遊戲業務的英偉達發現 GPU 在分布式計算、大規模集群運算中,有著非常大的優勢,由此找到了新的業務落腳點,併發力推出針對人工智慧,深度學習的多個產品線專用處理晶片,如工業級的 Tesla 系列、消費級的 GTX 系列等。
隨著算力的大幅提升,原先需要幾個月才能完成的深度訓練更新,在分布式 GPU 集群的加持下,只需要幾個小時便可完成。
固定場景讓車輛辨識脫穎而出
經如上介紹,大家會產生新的疑惑:在深度學習算法興起之前,為什麼車牌辨識技術能在眾多的 AI 應用中脫穎而出?
對此,宇視黃攀給出了兩個字的答案——場景,他進一步分析道:「早期的智慧交通,雖然採用的是普通圖像處理,和淺層機器學習技術,但它們與其他 AI 應用最大的區別,在於有標準化場景,如交通要塞、電警中的六米安裝高度、夜間提供爆閃補光、專業的圖像調教、45度朝下抓拍角度等,加上車輛的可變動幅度不大,使得抓拍的圖像非常清晰,因此在傳統算法下,也有非常高的辨識率,可做到 95%~99% 的精準辨識效果。」
需要說明的是,在2010-2012年,小編曾做過多次車輛抓拍辨識測試,即便是採用200萬像素智慧交通攝影機,只要場景設置得當,辨識率可輕鬆做到99%,很好佐證了宇視黃攀的觀點。
但傳統方案也有缺陷,一是算法對多種場景的適應性,難以進一步提升,如辨識率很難趨近於100%;二是傳統的淺層機器學習在特徵提取、算法設計上對開發人員要求較高,不能很好滿足智慧交通的複雜場景需求。
在進入到深度學習階段,大量的場景適應性問題,透過豐富的訓練素材,讓算法在訓練更新中得到解決,大幅提升了算法強化性,大大簡化了對技術人員的要求。
利用新的算法體系做影像結構化,在標準場景下,車牌辨識率無限趨近於 100%;而在非標準場景下,車牌辨識率也能達到 98% 以上,如輔助交通要塞的車牌抓拍辨識應用。
不過早期與車牌辨識應用,幾乎同時發展的人臉辨識需求,卻始終無法滿足,主要受兩大因素限制,一是因為人臉並不像車牌那樣,是一種相對固定的模型,人臉在檢測過程中,受到姿態、表情、穿戴物、朝向、年齡等各種因素的影響;二是攝影機的安裝場景,無法達到交通要塞般的標準化水準,受環境影響較大。
透過淺層機器學習算法,在這樣的條件下完成人臉辨識,會遇到非常大的挑戰,特徵提取方式,嚴重依賴工程師的豐富經驗:不同場景下,邊緣特徵、顏色特徵等的提取,需要工程師具備非常好的數學能力和經驗,如此才能設計出最佳特徵提取方式;即便如此,人臉辨識還要面臨人員移動隨意性、臉部裝飾、環境光照等的限制,辨識率難以有保障。這些問題的存在,一度讓人臉辨識難以在實際場景中得到落地。
利用深度學習算法後,機器可自學習最適合的特徵提取方式,對工程師的依賴大大降低。設備透過大數據學習,獲取人臉特徵經驗,以此來自動辨識人臉,由原來的經驗為王,轉變為以數據為王,更是突破了逆光人臉、陰陽臉、戴墨鏡、戴帽子等極端場景人臉的辨識障礙。
自此,深度學習讓人臉辨識得到了爆發式發展,這也使得人臉辨識,成為安控第一個變現的深度人工智慧技術。顯而易見,深度學習給人臉辨識帶來了巨大改變——讓理想照進現實,並得到了眾安控企業的高度重視,開始將該技術逐步移植到車牌辨識、行為分析、事件分析,甚至是大數據等其他 AI 應用中來。
「AI + 安控」和「安控 + AI」的界限仍很明顯
目前圍獵安控 AI 應用的企業很多,主要有兩大類,一是以四大算法公司(商湯、曠視、依圖、雲從)為代表的 AI 獨角獸,他們主推「AI+安控」模式;二是以宇視科技等公司為代表的安控陣營,主導「安控 + AI」之路。
宇視黃攀認為,截至目前,「AI + 安控」和「安控 + AI」的界限仍很明顯。
以四大算法公司提出的「AI + 安控」為例,他們的定位是「1 + 1 + X」,即「算法 + 產品 + 行業解決方案」,「X」代表各行各業的行業解決方案,安控只是其中之一。AI 公司的行業賦能模式屬於扁平化架構,主要是解決算法問題,這使得他們在安控領域的耕耘,沒有傳統安控企業透徹。
又因為安控是 AI 落地最深、最廣的一個行業,為了實現營收,AI 公司選擇安控行業來進行算法驗證和變現,因此我們看到,現在 AI 公司越來越重視安控行業。
而以宇視為代表的安控企業提出的「安控 + AI」,基於大安控的整體生態鏈比較完備,從上游的人工智慧算法、中游軟硬體/解決方案,到下遊行業客製化軟體等都一應俱全,尤其在前端智慧 IP Cam、智慧 NVR、智慧儲存上有突出的優勢,加上早已在多年累積中,建立了完善的行銷通路。安控企業可以輕鬆地讓 AI 產品在安控垂直細分領域,得到快速變現,這是安控陣營跟 AI 陣營耕耘「安控 + AI」的最大區別。
當然,我們也看到,目前安控公司跟 AI 公司的相互滲透越來越多,在 AI 公司進入安控領域的同時,安控公司也在不斷向教育、醫療、金融等垂直領域延伸,將 AI 的適用範圍,不再局限於安全監控。
賦能安控,AI 面臨哪些困境
宇視黃攀告訴小編,目前 AI 賦能安控主要面臨兩大難題,即大規模應用能力,和產品變現能力。
首先,黃攀認為安控的 AI 產品面臨的最大困難,不再是算法、算力、大數據等技術問題,而是轉移到 AI 六要素中的工程、場景、方案等實際落地應用問題。
目前很多公司對外宣稱,自己支援 AI 深度學習,並獲得了從央視到行業垂直媒體的大力度推廣,讓用戶產生錯覺,並對 AI 抱以很高期待,忽略了算法與場景,算法與產品工程化的匹配問題,甚至超出了目前 AI 的能力範圍,導致項目落地後的應用效果,與用戶預期效果形成落差。
其次是 AI 的產品變現能力還在探索中。現在所有的行業都歡迎 AI 產品,但大量的細分市場的定制化需求、客製化解決方案未能同步跟上,若採用通用方案,則效果大打折扣,需要各行各業的 AI 玩家持之以恆地開發與完善。
在安控領域,宇視等傳統安控企業,對各類場景都有很深滲透與理解,細化解決方案客製能力強,因此變現能力相對強很多。即便如此,安控企業還是會遇到很多問題,如各種客製化需求、各類型場景方案開發等,給經驗豐富的安控企業提出了很大挑戰。
其中細分市場的客製化算法難度最大,黃攀以監獄的「打架檢測」為例介紹。「打架」是一種人類的常識性的事件描述,背後是大量人類認知的體現,跟通常的車輛、人臉,這種相對有固定邊界的模型不同,是一種寬泛的、形容性的概念。人類需要訓練 AI 算法,什麼才是「打架」,但是打架並非固定模式,有可能是群體的劇烈衝突,也可能是一方對另一方的霸凌,動作不劇烈,更有可能是被多人環繞的隱蔽式衝突,形式非常寬泛;這就需要突破傳統深度學習,對固定模型的檢測能力,昇華到對人體動作的理解能力。
邊緣雲計算是 AI 賦能探索的結果
原來的中心雲端運算方案,是將資源集中在雲端處理,這會帶來很大的頻寬傳輸壓力,導致數據丟失、高延時等情況變得頻繁。同時對客製化需求無能為力。
實際上,前端算力資源非常龐大,哪怕是單價幾百元的前端攝影機,其算力、算法也,已經能很好地實現人臉辨識等功能,不需要額外投入雲端處理系統。
因此,邊緣雲計算是安控公司在多年探索中形成的共識,不僅充分利用了各類型算力資源,還很好地降低了投入成本。
目前對岸國內晶片性能提升明顯,以海思、寒武紀為代表的 ASIC 晶片方案,與英偉達等企業的產品相比已不落下風,尤其是單路影像辨識的性價比更高,現已成為安控行業前端 AI 晶片首選。
在伺服器端,安控公司並不局限於英偉達的通用 GPU 方案,基於 ASIC 的專用 AI 板卡方案,也被廣泛接受。以宇視「崑崙」系列智慧分析伺服器為例,整合了數十顆專用 AI 加速晶片,在三層分布式計算架構的加持下,併發計算能力達到業內領先水平。
賦能「意識」、降低成本是 AI 未來發展走勢
不可否認,目前 AI 還存在很多痛點,黃攀認為其中賦予機器,更多的「聯想能力」,是提升 AI 應用能力的重要部分,如以圖搜圖檢索人的應用中,用於檢索的算法,可能難以檢索出更換衣服、更換交通工具、僅局部特徵、時間跨度長、晝夜相反、圖像模糊等,數據庫中的同一個「人」的圖片/影像;這時候就需要現有的人臉、人體半結構化特徵與動作辨識、步態辨識等新的 AI 技術關聯起來,這是接下來 AI 在安控應用中的重點發展領域。
另外,無論雲端運算還是邊緣運算,共同目標都是為了降低單路 AI 商用成本。宇視「崑崙」的推出,正是為瞭解決這一痛點,它提出了多模型、多智慧、ALL in One 的設計理念,可將人臉辨識伺服器、行為分析伺服器、影像結構化伺服器、大數據伺服器、平台伺服器等功能,以板卡形式整合於一台伺服器中,大大節約了硬體投入和空間佔用,而且維護更為簡便;其同時整合了三重分布式集群調度系統(晶片間集群調度、板卡間集群調度、伺服器間集群調度),可將 AI 處理需求,精確地分配到每一顆晶片中的某一部分資源,大大降低了單路影像的應用成本。
最後,算力也是未來要提升的部分。目前對岸國內晶片廠家的發展速度很快,尤其是在 AI 端側應用晶片領域,對岸國內晶片的發展,已經出現多強爭霸的局面,正在快速衝擊著目前的格局。在通用晶片領域,雖然我們沒有先發優勢,但在近年對岸國家政策的扶持,和行業需求的多重驅動下,各大晶片廠商正在奮起直追,預計很快就會迎來產業變局。
沒有留言:
張貼留言