🔎 是什麼決定了 AI 影像辨識的準確率？

3S Market 整理

Klacci 凱樂奇 Kii Assistant 智慧酒店服務系統

從攝影機、光線、AI 模型到場域工程，看懂智慧安控真正的核心

很多人以為：AI 影像辨識的準確率，主要取決於「演算法夠不夠強」。

但實際上，真正影響 AI 辨識效果的，往往不是 AI 本身，而是：

光學
感測器
攝影機和鏡頭的部署
環境條件
運算架構
資料品質
場域特性

這些條件共同疊加後的結果。

也因此，在智慧安控、智慧城市、智慧工廠、智慧交通、智慧零售與醫療場域中，AI 專案失敗的原因，很多並不是模型不夠好，而是：

鏡頭角度錯誤
夜間照度不足
GPU 算力不夠
壓縮率太高
訓練資料偏差
現場場景與資料集差異太大 ……

換句話說：AI 影像辨識，本質上是一個「光學 × 影像工程 × AI 模型 × 場域工程」共同構成的系統工程。

AI 看世界，和人眼其實完全不同

人眼即使在：

昏暗環境
部分遮擋
強逆光
雨天霧氣

仍然可以依靠：經驗、情境、記憶、推理來辨認目標。

但 AI 並不是這樣。

AI 主要依靠：

邊緣特徵
紋理
對比
像素差異
顏色分布
空間特徵

來判斷物件。這代表：畫面品質的微小變化，都可能導致 AI 辨識率大幅下降。

第一層核心：影像品質（Input Quality）

AI 再強，如果輸入畫面品質不好，結果一定崩。這是整個 AI 影像辨識最底層、也最重要的因素。

解析度決定 AI 能不能「看清楚」

解析度直接影響：

人臉是否足夠清晰
車牌是否可讀
小物件是否能辨識
遠距離目標是否模糊

很多專案問題其實非常單純：不是 AI 不準，而是目標像素太少。

AI 影像辨識常見像素需求

應用類型	建議條件
人臉辨識	臉部至少 80～150 px
車牌辨識	車牌寬度至少 120～160 px
People Counting	人體高度至少 60～100 px
PPE 穿戴辨識	安全帽區域至少 40 px

圖說：解析度不足，是 AI 辨識失敗最常見原因之一

同一支攝影機下，遠距離人物可能只有數十個像素。
人眼仍能猜測對象，但 AI 已無法建立有效特徵。
這也是為何高空俯視的人臉辨識常失敗。

光線，是 AI 最大敵人之一

很多人誤以為：只要人眼看得到，AI 就一定能辨識。但其實：AI 對光線的敏感程度，遠高於人眼。

尤其：

逆光
過曝
強陰影
夜間低照度
黃光混白光
LED 閃爍

都可能造成 AI 判斷錯誤。

夜間環境是 AI 辨識最大挑戰

夜間會出現：

Noise 增加
色彩消失
IR 過曝
對比下降
紋理消失

因此很多 AI 系統：

白天準確率 95%
夜間可能降到 70%

甚至更低。

動態模糊（Motion Blur）會讓 AI 失去特徵

當目標移動太快時：

車輛
堆高機
奔跑中的人
大量移動人流

如果快門速度不足：AI 特徵會直接糊掉。

尤其：

車牌辨識（LPR）
人臉辨識
行為分析

最容易受到影響。

第二層核心：攝影機與光學部署

很多人以為 AI 是軟體問題。但實際上：超過一半 AI 辨識問題，出在攝影機部署。

鏡頭角度，比 AI 模型更重要

例如：人臉辨識最佳角度

最佳條件：

接近水平
正面視角
穩定光源

最差條件：

天花板俯視
超廣角變形
強逆光入口

這也是為什麼：很多大樓「人臉辨識失敗」，其實是因為：攝影機安裝在錯的位置。

安裝高度也會影響辨識率

以 People Counting 為例：

安裝狀況	常見問題
太低	人群互相遮擋
太高	人體像素不足
超廣角	人體邊緣變形

因此：People Counting 並不是：「裝一支攝影機就能準」。而是需要：

高度
角度
FOV
光線
人流方向

共同最佳化。

第三層核心：真實世界環境條件

AI 最怕的：其實是真實世界。因為現實環境永遠比實驗室複雜。

天氣因素會直接影響 AI

包括：雨、霧、雪、水氣、沙塵、反光，都會造成：

對比下降
可視距離降低
IR 反射異常
紋理消失

遮擋（Occlusion）是 AI 長期難題

AI 很怕：口罩、墨鏡、雨傘、安全帽、貨架、柱子、多人重疊，尤其是在人潮密集場景，如車站、夜市、醫院、商場，People Counting 準確率會快速下降。

第四層核心：AI 模型本身

大家最愛談 AI 模型，但它其實只是整體中的一部分。

AI 只能辨識它學過的東西

AI 的本質是統計學習，因此如果模型主要用歐美資料訓練，到了亞洲市場可能出現偏差。在台灣經常看到的可能是中國的資料，用在台灣的場景。

例如：

亞洲車牌
機車海
制服樣式
黃色安全帽
夜市場景

都可能影響辨識率。

標註品質會決定 AI 是否「學壞」

如果：

安全帽框錯
人物框偏移
車牌位置不準

AI 就可能學到錯誤特徵。因此 AI 專案後面真正昂貴的，往往不是 GPU，而是資料清洗與標註。

第五層核心：算力與系統架構

AI 不是只有模型。還包括：

GPU
NPU
Edge AI
Server 架構
FPS
頻寬
壓縮率

以上所共同影響。不過，很多廠商不會這樣說，可能會說：你過，我們的辨識率很強，連很小的物件都可以清楚的辨認 ……

算力不足會造成 AI 漏事件

GPU 不夠時，系統通常會：

降 FPS
降解析度
跳 Frame
延遲增加

結果AI 可能直接漏掉事件。

例如：5 FPS 下，人可能已經穿越畫面。

AI 系統架構對辨識率的影響

架構	優點	缺點
Edge AI	即時、低延遲	算力有限
Server AI	可跑大型模型	頻寬與延遲增加
Hybrid AI	平衡架構	系統較複雜