cookieOptions = {...}; 🔎 是什麼決定了 AI 影像辨識的準確率? - 3S Market「全球智慧科技應用」市場資訊網

3S MARKET

3S MARKET
2026年6月15日 星期一

 

3S Market 整理

 Klacci 凱樂奇 Kii Assistant 智慧酒店服務系統

從攝影機、光線、AI 模型到場域工程,看懂智慧安控真正的核心

很多人以為:AI 影像辨識的準確率,主要取決於「演算法夠不夠強」。

但實際上,真正影響 AI 辨識效果的,往往不是 AI 本身,而是:

  • 光學
  • 感測器
  • 攝影機和鏡頭的部署
  • 環境條件
  • 運算架構
  • 資料品質
  • 場域特性

這些條件共同疊加後的結果。

也因此,在智慧安控、智慧城市、智慧工廠、智慧交通、智慧零售與醫療場域中,AI 專案失敗的原因,很多並不是模型不夠好,而是:

  • 鏡頭角度錯誤
  • 夜間照度不足
  • GPU 算力不夠
  • 壓縮率太高
  • 訓練資料偏差
  • 現場場景與資料集差異太大 ……


換句話說:AI 影像辨識,本質上是一個「光學 × 影像工程 × AI 模型 × 場域工程」共同構成的系統工程。


AI 看世界,和人眼其實完全不同

人眼即使在:

  • 昏暗環境
  • 部分遮擋
  • 強逆光
  • 雨天霧氣


仍然可以依靠:經驗、情境、記憶、推理來辨認目標。

但 AI 並不是這樣。

AI 主要依靠:

  • 邊緣特徵
  • 紋理
  • 對比
  • 像素差異
  • 顏色分布
  • 空間特徵


來判斷物件。這代表:畫面品質的微小變化,都可能導致 AI 辨識率大幅下降。


第一層核心:影像品質(Input Quality)

AI 再強,如果輸入畫面品質不好,結果一定崩。這是整個 AI 影像辨識最底層、也最重要的因素。


解析度決定 AI 能不能「看清楚」

解析度直接影響:

  • 人臉是否足夠清晰
  • 車牌是否可讀
  • 小物件是否能辨識
  • 遠距離目標是否模糊


很多專案問題其實非常單純:不是 AI 不準,而是目標像素太少。


AI 影像辨識常見像素需求

應用類型

建議條件

人臉辨識

臉部至少 80150 px

車牌辨識

車牌寬度至少 120160 px

People Counting

人體高度至少 60100 px

PPE 穿戴辨識

安全帽區域至少 40 px

圖說:解析度不足,是 AI 辨識失敗最常見原因之一

  • 同一支攝影機下,遠距離人物可能只有數十個像素。
  • 人眼仍能猜測對象,但 AI 已無法建立有效特徵。
  • 這也是為何高空俯視的人臉辨識常失敗。


光線,是 AI 最大敵人之一

很多人誤以為:只要人眼看得到,AI 就一定能辨識。但其實:AI 對光線的敏感程度,遠高於人眼。

尤其:

  • 逆光
  • 過曝
  • 強陰影
  • 夜間低照度
  • 黃光混白光
  • LED 閃爍

都可能造成 AI 判斷錯誤。


夜間環境是 AI 辨識最大挑戰

夜間會出現:

  • Noise 增加
  • 色彩消失
  • IR 過曝
  • 對比下降
  • 紋理消失


因此很多 AI 系統:

  • 白天準確率 95%
  • 夜間可能降到 70%


甚至更低。



動態模糊(Motion Blur)會讓 AI 失去特徵

當目標移動太快時:

  • 車輛
  • 堆高機
  • 奔跑中的人
  • 大量移動人流


如果快門速度不足:AI 特徵會直接糊掉。

尤其:

  • 車牌辨識(LPR)
  • 人臉辨識
  • 行為分析


最容易受到影響。




第二層核心:攝影機與光學部署

很多人以為 AI 是軟體問題。但實際上:超過一半 AI 辨識問題,出在攝影機部署。


鏡頭角度,比 AI 模型更重要

例如:人臉辨識最佳角度

最佳條件:

  • 接近水平
  • 正面視角
  • 穩定光源


最差條件:

  • 天花板俯視
  • 超廣角變形
  • 強逆光入口


這也是為什麼:很多大樓「人臉辨識失敗」,其實是因為:攝影機安裝在錯的位置。



安裝高度也會影響辨識率

以 People Counting 為例:

安裝狀況

常見問題

太低

人群互相遮擋

太高

人體像素不足

超廣角

人體邊緣變形


因此:People Counting 並不是:「裝一支攝影機就能準」。而是需要:

  • 高度
  • 角度
  • FOV
  • 光線
  • 人流方向

共同最佳化。


第三層核心:真實世界環境條件

AI 最怕的:其實是真實世界。因為現實環境永遠比實驗室複雜。


天氣因素會直接影響 AI

包括:雨、霧、雪、水氣、沙塵、反光,都會造成:

  • 對比下降
  • 可視距離降低
  • IR 反射異常
  • 紋理消失



遮擋(Occlusion)是 AI 長期難題

AI 很怕:口罩、墨鏡、雨傘、安全帽、貨架、柱子、多人重疊,尤其是在人潮密集場景,如車站、夜市、醫院、商場,People Counting 準確率會快速下降。


第四層核心:AI 模型本身

大家最愛談 AI 模型,但它其實只是整體中的一部分。


AI 只能辨識它學過的東西

AI 的本質是統計學習,因此如果模型主要用歐美資料訓練,到了亞洲市場可能出現偏差。在台灣經常看到的可能是中國的資料,用在台灣的場景。

例如:

  • 亞洲車牌
  • 機車海
  • 制服樣式
  • 黃色安全帽
  • 夜市場景

都可能影響辨識率。



標註品質會決定 AI 是否「學壞」

如果:

  • 安全帽框錯
  • 人物框偏移
  • 車牌位置不準

AI 就可能學到錯誤特徵。因此 AI 專案後面真正昂貴的,往往不是 GPU,而是資料清洗與標註。


第五層核心:算力與系統架構

AI 不是只有模型。還包括:

  • GPU
  • NPU
  • Edge AI
  • Server 架構
  • FPS
  • 頻寬
  • 壓縮率


以上所共同影響。不過,很多廠商不會這樣說,可能會說:你過,我們的辨識率很強,連很小的物件都可以清楚的辨認 ……


算力不足會造成 AI 漏事件

GPU 不夠時,系統通常會:

  • 降 FPS
  • 降解析度
  • 跳 Frame
  • 延遲增加


結果AI 可能直接漏掉事件。

例如:5 FPS 下,人可能已經穿越畫面。


AI 系統架構對辨識率的影響

架構

優點

缺點

Edge AI

即時、低延遲

算力有限

Server AI

可跑大型模型

頻寬與延遲增加

Hybrid AI

平衡架構

系統較複雜

圖說:Edge AI 正在成為下一代安控核心

  • AI 開始從雲端回到設備端。
  • 攝影機、NVR、AI Box 本身即具備推論能力。
  • 即時反應能力大幅提升。


不同場域,AI 難度完全不同

很多人問:「AI 準確率有多高?」,但真正正確的問題應該是:「在哪個場域?」


不同場域 AI 難度比較

場域

AI 難度

辦公室

校園

工地

港口

很高

急診室

極高


原因在於場景越混亂:

  • 光線變化越大
  • 遮擋越多
  • 移動速度越高
  • 事件越難定義


AI 難度就越高。


AI 準確率,其實從來不是固定值

很多廠商會宣稱:「AI 準確率 98%」

但很少告訴你:

  • 白天還夜晚?
  • 多遠距離?
  • 哪種鏡頭?
  • 哪種 GPU?
  • 哪種資料集?
  • 是否多人重疊?
  • 是否下雨?
  • 是否逆光?

因為:AI 準確率從來不是固定數字。而是:「特定場景條件下的動態結果」。


安控產業真正正在改變的事

過去安控產業重視:

  • 攝影機規格
  • 錄影天數
  • 夜視距離


但現在開始轉向:

  • Metadata 品質
  • AI 可辨識率
  • 場景資料化能力
  • 空間事件分析
  • 行為理解能力


這代表攝影機不再只是錄影設備,而是:「AI 感測器」。


下一代智慧安控的真正核心

因此現在產業開始快速聚焦:

  • Edge AI
  • 高感光
  • AI ISP
  • WDR
  • Metadata
  • Multi-sensor
  • AI SoC
  • 空間治理
  • 行為分析
  • 零信任空間管理


因為未來的智慧安控,真正競爭的已經不是:「看得到什麼」而是:「系統能不能理解正在發生什麼」。


Klacci 凱樂奇 100% 台灣製商用級智慧門鎖


按此 ☞ 回今日3S Market新聞首頁

0 comments: