如何使用人工智慧驅動的影像分析來最大化你的閉路電視環境
影像分析和人工智慧:為 21 世紀誕生的夥伴關係
在 21 世紀的世界,圖像和影像分析軟體在公共場所(包括零售中心、購物中心、機場和道路)變得司空見慣。
在過去的 40 年裡,公眾、政府和研究機構,都積極參與了電腦視覺和相關研究領域。其中一個原因當然是創造了大量公共空間影像提要和資料。因此,影像分析及其無數應用,現在已經滿足跨部門的不同需求,將人工智慧(AI)和機器學習(ML)佈署在其核心。
一方面,人工智慧驅動的影像分析,可以準確評估每個事件。另一方面,它允許我們收集事件 —— 在長期內從統計和整體上測量。
到目前為止,對影像分析的大部分理解,主要在於檢測警報事件和異常行為 —— 無論是公共安全、擁擠的形成、臉部辨識、威脅檢測、入侵控制和/或安全應用。但隨著人工智慧和 ML 模型的出現,人們對影像分析軟體和服務,所獲得的純粹粒度和複雜性知之甚少。
影像分析 —— 核心主題和應用
今天,影像分析主要圍繞四個主題 —— 電腦視覺、人群統計、行為分析和系統。例如,在安全和相關應用中,檢測異常或可疑的人群統計資料行為非常重要,幾乎總是即時。
如果人們關注城市空間的人群形成及其管理,則需要影像情報專注於監控正常事件(例如,人們進入商場或辦公室),並且通常認為足以捕捉和儲存觀察結果,以進行離線分析。
例如,考慮一下這個。 在城市和半城市擁擠的環境中,影像分析用於收集有關人群形成,及其行為的統計資訊(例如,有多少人進入,並在特定地點徘徊,有多少女性/男性,或哪些年齡組導致人群形成,以及人群遵循的路徑是什麼)
現代機場也許是 21 世紀最好的隱喻。一系列複雜、多模式、多維、移動的碎片。例如,在普通機場,總是需要即時估計檢測擁堵和排隊時間,特別是在出發、安全、檢查區和出入境控制區。
人工智慧驅動的影像分析,是為了應對這樣一個世界的挑戰而誕生的
隨著如此多的攝影機幾乎在當代人類文化中,無處不在地安裝,產生了大量的影像資料。高效率搜尋和檢索,這種恆定的影像資料串流,是影像分析應用的核心挑戰之一。
Videonetics 是少數幾個開發基於人工智慧的演算法的組織之一,這些演算法很容易適用於安全、商業和民用環境。我們植根於對人工智慧和機器學習的深刻理解的專業知識,使我們能夠滿足客戶的跨頻譜,他們的需求從開發簡單的電腦視覺到成熟的、複雜的影像分析應用套件。
我們的案例充分展示了現有影像分析技術的創新適應,和/或植根於 ML 和人工智慧的新方法的開發。Videonetics 的統一影像運算平台,非常適合動態業務環境,使我們的客戶能夠檢測、追蹤和辨識多個影像中感興趣的物件,更具體地說,可以解釋他們的行為和活動。UVCP 透過整合各種電腦視覺和模式辨識技術來實現這一點,以建構一個統一、智慧的影像分析運算框架。
深度學習是機器學習的一種形式,而卷積神經網路(CNN)是兩門基本應用科學,幫助人工智慧框架訓練電腦視覺演算法,使引擎能夠觀察和學習。
就像人類一樣,CNN 使用電腦視覺來辨識不同形狀的物體或主體,將它們分解成畫素並貼上標籤。它使用這些標記來進一步執行數學運算,或卷積來預測它正在看什麼。我們把這種預測稱為人工智慧驅動的影像分析。
它訓練自己的資料越多,人工智慧引擎的準確性就越高。Videonetics AI 引擎是市場上強大的人工智慧引擎之一,其自己的設計 CNN 可確保在具有挑戰性環境中的最高準確性和效能。
物件檢測和追蹤是任何影像分析系統的關鍵組成部分。物體可以是一張臉、一個頭、一個人、一排人、一群人,或只是另一個無生命的東西!在 Videonetics,物件檢測和追蹤,對我們來說是一個強大的差異化因素。我們的研究團隊精通物件檢測、物件建模和物件追蹤的最新方法,以便為客戶產生正確的見解。
攝影機校準是另一個重要的組成部分。然而,方便的校準本身仍然是一個挑戰。大型網路的校準框架,可以包括非重疊攝影機,依賴於來自多個維度的資訊。正是在這裡,開發和佈署正確的人工智慧,可以為客戶提供正確的突破性解決方案。
利用智慧影像監控進行人群形成、人群分散檢測和人群異常檢測
收集有關快速人群形成和/或傳播人群的人群資訊,是影像情報的一個重要部分。例如,有多少人參觀了購物中心,他們的性別分佈和逗留時間長短。與其僱用人類手動觀察客戶,不如開發一個運算系統,透過檢測攝影機捕捉的影像中的人的存在,和分析人們的行為,來自動收集人群統計資訊。
人類年齡和性別分類有不同的運算方法。 可以使用熱圖和導航報告開發一個工作系統,以幫助辨識人群統計資料。 從策略決策的角度來看,它可以幫助客戶發現網站導航或其他因素中的問題。
人群形成、排隊長度檢測、排隊超限檢測和瓶頸預防
在公共場所,人群形成顯示發生擁塞、延誤、不穩定或打鬥、騷亂和緊急情況等異常事件。智慧影像是人群資訊的最佳工具,例如人員在整個空間、吞吐率和本地密度的分佈。影像分析佈署了各種人群計數方法,這些方法使用當地功能來估計人群規模,及其在特定地點的分佈。正確的影像演算法可以預算當地佔用率統計資料。
影像分析還可以篩選數百小時的影像活動模式,透過與行人和車輛檢測的互動,自動辨識各種功能元素,如人行道、道路、停車位和門口。
監控排隊停留統計資料,如排隊停留長度檢測、排隊停留限制超過檢測、排隊停留中的平均等待時間、排隊停留中的社交距離、平均服務時間和排隊停留長度,可以幫助客戶最佳化人群形成和空間管理挑戰。
人工智慧與影像分析的整合,有助於系統設計和驗證自動排隊停留統計估計和檢測的一般解決方案。該設計可以考慮多個變數,如影像幾何、照明動力、攝影機視角、人物外觀等。
特別是在新冠疫情後的世界裡,一個安全參數已經成為任何人群管理工作的基礎 —— 社交距離。
基於人工智慧的圖像和影像分析,透過智慧影象處理、分割、物件辨識和圖像/影像的語義解釋,解決了監測社交距離的不同方面。
深度學習模型的使用會自動化做到這一點,在人群/群體結構的連續層面監控社交距離。人工智慧和深度學習使我們能夠建立能夠監控不同層次社交距離的電腦化視覺系統。
這些人工智慧和深度學習模型,讓我們從知識、演算法和實現三個角度來評估人群。
對於最先進的影像分析軟體,如 Videonetics 的軟體,這些社交距離監控演算法擅長表示相關資訊,並預測風險可能在哪裡。
主動事件響應的即時警報
群組監控是影像分析的重要載體。透過考慮人與人之間的關係,群體建模可以為視覺事件提供更有意義的語義描述。基於人工智慧的影像分析,可以分析人群和群體活動。
可以考慮不同的方面:1)群體的生活,分析如何在擁擠的情況下(即群體的誕生和死亡)檢測群體的存在,2)如何追蹤移動群體(其演變)。特別是,可以檢測到人類注意力更集中的環境區域。
在公共場所,人群形成及其規模可能是擁塞、延遲、不穩定或打鬥、騷亂或緊急情況等異常事件的指標。人群形成相關資訊,還可以提供重要的商業智慧,例如人員在整個空間中的分佈、吞吐率、未經授權進入限制區域、檢測感興趣的人和形成流動的人群形成密度。
臉部辨識警報
在管理一大群人時,瞭解人們在不同空間之間移動需要多長時間,在每個空間中花費多長時間,以及當他們從一個地方移動到另一個地方時,他們可能會去哪裡,這總是有利的。 目前,這些措施只能手動確定,或透過使用硬體標籤(即 RFID)。
臉部辨識技術可用於描述和唯一辨識個人。它們包括性別、臉部特徵、臉部幾何等特徵。臉部辨識可以透過範圍內的監控攝影機獲得,無需任何使用者合作,提供強大的認證,並可用於從合理距離提供辨識。
基於人工智慧的影像分析系統,擅長使用臉部辨識來確定,與人們如何在空間中移動相關的操作統計資料。這方面可用於定位看起來與眾不同的人,然後在分散的攝影機網路中的不同位置檢測到這些人,以逐漸獲得操作統計資料。
商機探討
沒有留言:
張貼留言