cookieOptions = {...}; ★ 人工智慧能否檢測人類行為?探索人的活動辨識 - 3S Market「全球智慧科技應用」市場資訊網

3S MARKET

3S MARKET
2025年12月29日 星期一


如果北捷有裝置這類「AI 安控攝影機」,無差別攻擊的發生機率,或許更能得到控制 ……


ultralytics


上敦 AXXON 台灣總代理


從健身應用程式到病人監測,探索電腦視覺如何解決以下問題:人工智慧能否在現實世界中偵測人類行為動作?


日常生活充滿了我們很少停下來思考的細微動作。穿過房間、坐在辦公桌前或向朋友揮手致意,對我們來說可能毫不費力,但用人工智慧來辨識這些動作,卻遠比我們想像的複雜得多。對人類來說自然而然的動作,在機器試圖理解時,卻變得異常複雜。


這種能力被稱為人體活動辨識(HAR,Human Activity Recognition),它使電腦能夠檢測和解讀人類行為模式。健身應用 app 就是 HAR 應用的絕佳例證。透過追蹤步數和運動計劃,它展示了人工智慧如何監控日常活動。


看到 HAR 的潛力,許多產業已經開始採用這項技術。事實上,預計到 2033年,人體活動辨識市場規模將超過 125.6 億美元。


這項進展很大程度上得益於電腦視覺,它是人工智慧的一個分支,使機器能夠分析圖像和影像等視覺數據。借助電腦視覺和影像辨識技術,HAR已從一個研究概念,發展成為尖端人工智慧應用中,一個實用且令人興奮的部分。


本報導將探討,什麼是人體動作辨識(HAR),用於辨識人體動作的不同方法,以及電腦視覺如何幫助解答「人工智慧能否在實際應用中偵測人體動作」這個問題。讓我們開始吧!


tyco 監控攝影機系列(總代理上敦企業


什麼是人體動作辨識?


人體動作辨識使電腦系統,能夠透過分析身體運動,來理解人類的活動或動作。與簡單地在圖像中檢測人不同,HAR 可以幫助辨識人們正在做什麼。例如,區分行走和跑步,辨識揮手動作,或注意到有人跌倒。


HAR 的基礎在於運動和姿勢模式。人體手臂或腿部位置的細微變化,可以傳遞各種動作訊息。透過捕捉和解讀這些細微之處,HAR 系統可以從身體運動中獲得有意義的洞察。


為了實現這一點,人體動作辨識結合了多種技術,例如機器學習、深度學習模型、電腦視覺和影像處理,這些技術協同工作,以更高的精度分析身體運動並解讀人體動作。


圖 1. 人類活動辨識涉及電腦科學的不同分支(資料來源:cell.com)

早期的人體動作辨識(HAR)系統功能非常有限。它們只能在受控環境下處理少數簡單的重複性動作,在實際應用中往往表現不佳。


如今,由於人工智慧和大量影像數據,HAR 的準確性和穩健性,都得到了顯著提升。現代系統能夠以更高的精度辨識各種各樣的活動,使其在醫療保健、安全監控和互動設備等領域,具有實用價值。


不同的人體動作偵測方法

現在我們對人體動作辨識有了更深入的了解,接下來讓我們來看看機器偵測人體動作的不同方法。


以下是一些常見的方法:

  • 基於感測器的方法:諸如加速度計、穿戴式裝置和智慧型手機等智慧型手機,可以直接捕捉人體訊號。它們可以顯示行走、跑步,甚至靜止站立等運動模式。智慧手錶上的計步器,就是這種方法的一個很好的例子。
  • 基於視覺的方法:攝影機與電腦視覺技術相結合,分析圖像和影像,逐幀追蹤人體的外觀和運動。這使得辨識更複雜的活動成為可能。手勢控制電視或遊戲系統,就依賴這種方法。
  • 多模態方法:它結合了感測器和攝影機,能夠創建一個更可靠的系統,因為一個資料來源,可以驗證另一個資料來源的偵測結果。例如,穿戴式裝置可以記錄運動,而攝影機可以驗證姿勢,這種設定常用於老年人護理中的跌倒檢測。


上敦 AXXON 台灣總代理

資料集在人體活動辨識中的作用

對於任何人體活動辨識 (HAR) 模型或系統而言,資料集都是起點。HAR 資料集是一系列範例的集合,例如影像片段、圖像或感測器數據,用於捕捉行走、坐下或揮手等動作。這些範例用於訓練人工智慧模型,使其辨識人體運動模式,然後可將其應用於實際應用中。


訓練資料的品質直接影響模型的效能。乾淨、一致的數據,使系統更容易準確辨識動作。


這就是為什麼資料集通常在訓練前,需要進行預處理的原因。一個常見的步驟是歸一化,它將數值進行一致的縮放,以減少誤差,並防止過度擬合(即模型在訓練資料上表現良好,但在處理新資料時表現不佳)。為了衡量模型在訓練之外的表現,研究人員依賴評估指標和基準資料集,以便進行公平的測試和比較。諸如 UCF101、HMDB51 和 Kinetics 等常用資料集,包含數千個用於人體動作偵測的已標註影像片段。在感測器方​​面,從智慧型手機和穿戴式裝置收集的資料集,提供了寶貴的運動訊號,使辨識模型在不同環境下更具穩健性。


圖 2. 人類活動辨識資料集概覽。(Source)

電腦視覺如何支援人體活動辨識

在眾多檢測人體動作的方法中,電腦視覺已迅速成為最受歡迎、研究最廣泛的方法之一。其主要優勢在於能夠直接從圖像和影像中,提取豐富的細節資訊。透過逐幀分析像素,並分析運動模式,它可以即時辨識活動,而無需佩戴額外的設備。


近年來,深度學習,特別是卷積神經網路(CNN)的進步,使得電腦視覺速度更快、精度更高、可靠性更強。卷積神經網路專為分析影像而設計。


例如,像 Ultralytics YOLO11 這樣,廣泛使用的先進電腦視覺模型,正是基於這些進步而建構的。YOLO11 支援目標偵測、實例分割、跨影像幀追蹤人物,以及估計人體姿態等任務,使其成為人體活動辨識的強大工具


Ultralytics YOLO11 概述

Ultralytics YOLO11 是一款兼顧速度與精準度的視覺 AI 模型。它支援目標檢測、目標追蹤和姿態估計等核心電腦視覺任務。這些功能在人體活動辨識方面特別有用。


目標偵測功能,可以辨識並定位場景中的人物;追蹤功能可以追蹤人物在影像畫面中的移動軌跡,從而辨識動作序列;姿態估計功能則可以繪製人體關鍵關節的座標,以區分相似的活動,或偵測跌倒等突發變化。


例如,模型提供的分析結果,可以用來區分一個人先安靜地坐著,然後站起來,最後舉起手臂歡呼的動作。這些簡單的日常動作,乍看之下可能很相似,但如果按順序分析,它們的含義卻截然不同。


圖 3. 使用 Ultralytics YOLO11 進行姿勢估計。 (Source)


電腦視覺和人體活動辨識的實際應用

接下來,我們將深入探討電腦視覺驅動的人體活動辨識技術,如何在影響我們日常生活的實際應用案例中,發揮作用。


醫療保健與健康

在醫療保健領域,細微的動作變化就能為了解患者的健康狀況,提供有用的資訊。例如,老年患者的踉蹌或復健期間肢體的角度變化,都可能揭示風險或進展。這些跡象,往往容易被傳統的體檢方式所忽略。


YOLO11 利用姿態估計和影像分析技術,即時監測患者,從而提供幫助。它可以用於偵測跌倒、追蹤復健運動,以及觀察日常活動,例如行走或伸展。由於它透過視覺分析工作,無需感測器或可穿戴設備,因此提供了一種簡單的方式,來收集準確的資訊,從而支持患者護理。


圖 4. 使用 YOLO11 的姿態估計功能追蹤身體運動。 (Source)


安全與監控

安全系統依賴快速偵測異常的人類活動,例如有人徘徊、在禁區內奔跑,或突然表現出攻擊性。在繁忙的環境中,保全人員無法手動監控所有情況,這些跡象往往容易被忽略。而電腦視覺和 YOLO11 正是解決這個問題的利器


YOLO11 透過支援即時影像監控,能夠偵測可疑活動,並發送即時警報,從而簡化安全監控流程。它有助於保障公共場所的人群安全,並增強私人區域的入侵偵測能力


借助這種方法,保全人員可以與電腦視覺系統協同工作,建立人機互動和夥伴關係,從而對可疑活動做出更快、更及時的回應。


使用電腦視覺進行人體活動辨識的優缺點

以下是使用電腦視覺,進行人體活動辨識的一些優點:

  • 可擴展性:一旦設定完成,同一辨識系統即可自動監控多人,使其適用於醫療機構、工廠和公共場所的自動化
  • 即時處理:視覺 AI 解決方案可以即時分析影像串流,從而實現更快的反應處理速度。
  • 非侵入式追蹤:與穿戴式裝置或感測器不同,它無需人們攜帶任何設備,從而實現自然流暢的行為分析。


雖然使用電腦視覺進行人體活動辨識 (HAR) 有許多優勢,但也存在一些限制需要考慮。以下是一些需要注意的因素:

  • 隱私問題:影像的監控可能會引發,資料保護和使用者同意的問題,尤其是在家庭或工作場所等敏感環境中。
  • 潛在偏差:如果訓練資料集缺乏多樣性,演算法可能會「錯誤解讀」某些人群的行為,導致不公平或不準確的結果。
  • 環境敏感度:光線不足、背景雜亂或人員部分被遮蔽,都可能導致準確率下降,這意味著系統需要精心設計。



Klacci 凱樂奇 U95系列雙系統行動生物辨識智慧門鎖



重點摘要

人工智慧和電腦視覺技術,使機器能夠更準確、更即時地辨識人類行為。透過分析影像畫面和運動模式,這些系統可以辨識日常手勢和突發變化。隨著科技的不斷進步,人體活動辨識正走出實驗室,成為醫療保健、安全和日常應用領域的實用工具。造訪 GitHub 程式碼庫,並加入社群,探索更多人工智慧相關內容。查看我們的解決方案頁面,了解人工智慧在機器人領域的應用,以及電腦視覺在製造業中的應用。了解 GitHub 的授權選項,開啟你的視覺人工智慧之旅。


Klacci 凱樂奇 iF+ 系列雙系統免接觸式智慧門鎖


0 comments: