What is Computer Vision
為什麼對電腦視覺概念有很好的理解,對於評估當今的影像分析安控產品很重要⋯⋯
深度學習的最新進展,吸引了影像分析方面的數十億美元的年度投資,並導致影像分析功能的顯著改進,這對於安全性影像行業而言是個好消息。 但是,影像分析的發展歷來看,是安全行業的好消息或壞消息,這種情況已經經歷了影像分析的兩個過度炒作階段,而第三個階段已經到來。
就在幾週前,亞馬遜網路服務(AWS)宣布發布了一種名為全景的新影像攝影機技術,該技術與全景攝影機(即 360° 攝影機)毫無關係。AWS 將 Panorama 稱為電腦視覺(CV)技術,我馬上問自己:實際上是否有將安全影像分析技術稱為「電腦視覺」的技術基礎,或者這只是另一個將大大增加市場推廣的術語,混淆了安全影像分析領域?
大約一年前,使用的是實詞還是流行詞?文章標題為「人工智慧、機器學習和深度學習」,我說,隨著使用它們的產品不斷湧現,未來的文章將討論 AI、ML 和 DL 的更多方面。這是一篇這樣的文章。在那篇文章中,我提到了 AI 研究的歷史是這樣的:
人工智慧 – 1950 年代至 1980 年代,並且仍在持續
– –> 機器學習– 1980 年代至 2010 年代,並且仍在持續
– –> – –> 深度學習–直到現在和 2010 年代仍在進行中
正如 Wikipedia 解釋的那樣:1960 年代後期,電腦視覺開始於開創人工智慧的大學。它旨在模仿人類視覺系統,是賦予機器人智慧行為的墊腳石。1966年,人們認為可以透過一個夏季項目來實現這一目標,方法是將攝影機安裝到電腦上並「描述所見」,這使電腦視覺與當時的數位圖像處理領域有所不同。希望從圖像中提取三維結構,以實現對整個場景的理解。
「全場景理解」是「情境意識」的另一種表達方式,它是七個真實單詞或流行詞系列中涵蓋的重要且廣泛的主題?文章(第1部分,第2部分,第3部分,第4部分,第5部分,第6部分和第7部分)。情境意識適用於很多領域,包括體育領域,針對這些領域提供針對運動的情境意識培訓。對於無人駕駛(包括防撞和其他車輛安全功能)而言,這是非常重要的,自動駕駛應用了雷達和影像分析等感測器的組合。
安全影像分析炒作因素
深度學習的最新進展,吸引了影像分析方面的數十億美元的年度投資,並導致影像分析功能的顯著改進,這對於安全性影像行業而言是個好消息。但是,影像分析的發展歷來是安全行業的好消息/壞消息,這種情況已經經歷了影像分析的兩個過度炒作階段,而第三個階段已經到來。
這三個階段是從上面列出的電腦視覺研究的三個階段演變而來的:早期的人工智慧、機器學習和現在的深度學習。安全影像分析的前兩個階段都被大肆宣傳,因此安全行業的最終用戶客戶以及安全服務提供商現在對安全影像分析的說法倍加謹慎。
從炒作到現實
與安全影像分析的前幾十年相比,今天存在幾個主要差異,其中包括現在非常有理由像 AWS 一樣將影像分析應用,稱為電腦視覺應用。首先,安全影像總體上受益於相關的 IT 大趨勢,即不斷降低技術成本和技術能力呈指數級成長。
Pivot 3 在本月的《安全性商業》雜誌上發表的簡短但生動的文章中對此進行了解釋,該文章重點介紹了可簡化智慧影像分析佈署的設計,佈署和擴展的現代技術。
其次-正如另一篇安全業務文章「AI 和專業分析正在改變影像監視」中所解釋的那樣,各種類型的專業分析現在為安全和安全態勢感知,以及業務營運目的提供了巨大的價值。透過針對設備,現場設備和雲的計算和數據儲存技術的進步,專業分析的出現成為可能。
第三,免費開源和獲得許可的專有深度學習軟體的進步使廣泛的專業分析得以發展,而這正是 AWS、Microsoft Azure、Bosch 和其他公司現在的重點。
電腦視覺和影像分析
正如我為安全行業協會(Security Industry Association)撰寫的白皮書「影像安全分析的狀態(PDF)」所述,影像分析的基本定義,在學術界也被稱為影像內容分析(VCA)。從數位影像中提取有意義的相關資訊。下面的圖 1 顯示瞭如何進行學術界研究 - 大多數 AI / ML / DL 研究都是在這裡完成的 - 觀點 c
圖1.人工智慧和電腦視覺
對於產品,很容易理解為什麼影像安全行業在其產品中使用「影像分析」標籤而不是「電腦視覺」標籤。在引入安全影像分析之時,機器視覺已在製造業中得到廣泛使用,其中自動化生產線可以透過使用電腦視覺來高速運行。
最初,例如,使用簡單的光感測器來檢測生產線上是否存在盒子和其他物體。電腦視覺提供了光學字符辨識功能,從而可以自動讀取零件和產品標籤,並且電腦可以管理生產線活動並記錄跟踪的結果。
當涉及到電腦視覺時,這些和其他製造應用是普通大眾的想法。因此,將影像安全性對電腦視覺的使用稱為「影像分析」。當時,簡單的模式辨識用於影像分析,而機器學習和深度學習則不涉及。
隨著 AI 的發展並發展到圖1 所示的狀態,影像分析一詞繼續適用於安全影像行業的產品,因此沒有理由對其進行更改。但是,AWS 積極參與提供用於機器學習、深度學習和更廣泛的電腦視覺領域的軟體工具和雲端運算平台,因此有很好的理由將其 Panorama 技術標記為電腦視覺類別,因為它的範圍很窄,重點使用它提供的更廣泛的 AI 工具和計算平台。
此外,Panorama 技術所包含的內容,遠遠超過了過去的安全影像分析產品。影像分析是更大的 Panorama 技術產品的一部分。而且,AWS 為 Panorama 的目的不是提供影像分析產品本身,而是提供開發它們的功能,以及使它們能夠在設備(相機),現場電腦和雲中運行的技術。
這與博世的安保與物聯網(S&ST)計劃,具有相似的目的,它具有更大的雲端技術方面,因為 Panorama 設備包含專門設計用於運行深度學習應用的硬體元素,並且其軟體具有與 AWS 和 Azure 雲端環境。在即將到來的 Real Words 或 Buzzwords 中,還會有更多關於這種專門的硬體功能的說法?文章。
什麼是 AWS Panorama?
Panorama 技術由韌體、軟體,軟體開發套件(SDK)和用於運行 AWS 稱為「電腦視覺應用」的設備組成,目的在攝影機上,運行基於 Panorama 的機器學習(ML)影像分析內嵌全景技術,或在現場的 Panorama 設備上,嵌入全景技術的位置 - 靠近攝影機或 Microsoft Azure 中 AWS 託管的雲中的位置。
由於 Panorama 的目的,是促進高價值利基影像應用的開發及其佈署,因此將技術類別歸類為「影像分析」是完全可以的。但與此同時,重要的是要認識到 Panorama 提供的功能,遠不止我們過去從安全影像行業影像分析供應商那裡看到的內容。
0 comments:
張貼留言