3S Market 整理
Klacci 凱樂奇 Kii Assistant 智慧酒店服務系統從攝影機、光線、AI 模型到場域工程,看懂智慧安控真正的核心
很多人以為:AI 影像辨識的準確率,主要取決於「演算法夠不夠強」。
但實際上,真正影響 AI 辨識效果的,往往不是 AI 本身,而是:
- 光學
- 感測器
- 攝影機和鏡頭的部署
- 環境條件
- 運算架構
- 資料品質
- 場域特性
這些條件共同疊加後的結果。
也因此,在智慧安控、智慧城市、智慧工廠、智慧交通、智慧零售與醫療場域中,AI 專案失敗的原因,很多並不是模型不夠好,而是:
- 鏡頭角度錯誤
- 夜間照度不足
- GPU 算力不夠
- 壓縮率太高
- 訓練資料偏差
- 現場場景與資料集差異太大 ……
換句話說:AI 影像辨識,本質上是一個「光學 × 影像工程 × AI 模型 × 場域工程」共同構成的系統工程。
AI 看世界,和人眼其實完全不同
人眼即使在:
- 昏暗環境
- 部分遮擋
- 強逆光
- 雨天霧氣
仍然可以依靠:經驗、情境、記憶、推理來辨認目標。
但 AI 並不是這樣。
AI 主要依靠:
- 邊緣特徵
- 紋理
- 對比
- 像素差異
- 顏色分布
- 空間特徵
來判斷物件。這代表:畫面品質的微小變化,都可能導致 AI 辨識率大幅下降。
第一層核心:影像品質(Input Quality)
AI 再強,如果輸入畫面品質不好,結果一定崩。這是整個 AI 影像辨識最底層、也最重要的因素。
解析度決定 AI 能不能「看清楚」
解析度直接影響:
- 人臉是否足夠清晰
- 車牌是否可讀
- 小物件是否能辨識
- 遠距離目標是否模糊
很多專案問題其實非常單純:不是 AI 不準,而是目標像素太少。
AI 影像辨識常見像素需求
應用類型 | 建議條件 |
人臉辨識 | 臉部至少 80~150 px |
車牌辨識 | 車牌寬度至少 120~160 px |
People Counting | 人體高度至少 60~100 px |
PPE 穿戴辨識 | 安全帽區域至少 40 px |
圖說:解析度不足,是 AI 辨識失敗最常見原因之一
- 同一支攝影機下,遠距離人物可能只有數十個像素。
- 人眼仍能猜測對象,但 AI 已無法建立有效特徵。
- 這也是為何高空俯視的人臉辨識常失敗。
光線,是 AI 最大敵人之一
很多人誤以為:只要人眼看得到,AI 就一定能辨識。但其實:AI 對光線的敏感程度,遠高於人眼。
尤其:
- 逆光
- 過曝
- 強陰影
- 夜間低照度
- 黃光混白光
- LED 閃爍
都可能造成 AI 判斷錯誤。
夜間環境是 AI 辨識最大挑戰
夜間會出現:
- Noise 增加
- 色彩消失
- IR 過曝
- 對比下降
- 紋理消失
因此很多 AI 系統:
- 白天準確率 95%
- 夜間可能降到 70%
甚至更低。
動態模糊(Motion Blur)會讓 AI 失去特徵
當目標移動太快時:
- 車輛
- 堆高機
- 奔跑中的人
- 大量移動人流
如果快門速度不足:AI 特徵會直接糊掉。
尤其:
- 車牌辨識(LPR)
- 人臉辨識
- 行為分析
最容易受到影響。
第二層核心:攝影機與光學部署
很多人以為 AI 是軟體問題。但實際上:超過一半 AI 辨識問題,出在攝影機部署。
鏡頭角度,比 AI 模型更重要
例如:人臉辨識最佳角度
最佳條件:
- 接近水平
- 正面視角
- 穩定光源
最差條件:
- 天花板俯視
- 超廣角變形
- 強逆光入口
這也是為什麼:很多大樓「人臉辨識失敗」,其實是因為:攝影機安裝在錯的位置。
安裝高度也會影響辨識率
以 People Counting 為例:
安裝狀況 | 常見問題 |
太低 | 人群互相遮擋 |
太高 | 人體像素不足 |
超廣角 | 人體邊緣變形 |
因此:People Counting 並不是:「裝一支攝影機就能準」。而是需要:
- 高度
- 角度
- FOV
- 光線
- 人流方向
共同最佳化。
第三層核心:真實世界環境條件
AI 最怕的:其實是真實世界。因為現實環境永遠比實驗室複雜。
天氣因素會直接影響 AI
包括:雨、霧、雪、水氣、沙塵、反光,都會造成:
- 對比下降
- 可視距離降低
- IR 反射異常
- 紋理消失
遮擋(Occlusion)是 AI 長期難題
AI 很怕:口罩、墨鏡、雨傘、安全帽、貨架、柱子、多人重疊,尤其是在人潮密集場景,如車站、夜市、醫院、商場,People Counting 準確率會快速下降。
第四層核心:AI 模型本身
大家最愛談 AI 模型,但它其實只是整體中的一部分。
AI 只能辨識它學過的東西
AI 的本質是統計學習,因此如果模型主要用歐美資料訓練,到了亞洲市場可能出現偏差。在台灣經常看到的可能是中國的資料,用在台灣的場景。
例如:
- 亞洲車牌
- 機車海
- 制服樣式
- 黃色安全帽
- 夜市場景
都可能影響辨識率。
標註品質會決定 AI 是否「學壞」
如果:
- 安全帽框錯
- 人物框偏移
- 車牌位置不準
AI 就可能學到錯誤特徵。因此 AI 專案後面真正昂貴的,往往不是 GPU,而是資料清洗與標註。
第五層核心:算力與系統架構
AI 不是只有模型。還包括:
- GPU
- NPU
- Edge AI
- Server 架構
- FPS
- 頻寬
- 壓縮率
以上所共同影響。不過,很多廠商不會這樣說,可能會說:你過,我們的辨識率很強,連很小的物件都可以清楚的辨認 ……
算力不足會造成 AI 漏事件
GPU 不夠時,系統通常會:
- 降 FPS
- 降解析度
- 跳 Frame
- 延遲增加
結果AI 可能直接漏掉事件。
例如:5 FPS 下,人可能已經穿越畫面。
AI 系統架構對辨識率的影響
架構 | 優點 | 缺點 |
Edge AI | 即時、低延遲 | 算力有限 |
Server AI | 可跑大型模型 | 頻寬與延遲增加 |
Hybrid AI | 平衡架構 | 系統較複雜 |
圖說:Edge AI 正在成為下一代安控核心
- AI 開始從雲端回到設備端。
- 攝影機、NVR、AI Box 本身即具備推論能力。
- 即時反應能力大幅提升。
不同場域,AI 難度完全不同
很多人問:「AI 準確率有多高?」,但真正正確的問題應該是:「在哪個場域?」
不同場域 AI 難度比較
場域 | AI 難度 |
辦公室 | 低 |
校園 | 中 |
工地 | 高 |
港口 | 很高 |
急診室 | 極高 |
原因在於場景越混亂:
- 光線變化越大
- 遮擋越多
- 移動速度越高
- 事件越難定義
AI 難度就越高。
AI 準確率,其實從來不是固定值
很多廠商會宣稱:「AI 準確率 98%」
但很少告訴你:
- 白天還夜晚?
- 多遠距離?
- 哪種鏡頭?
- 哪種 GPU?
- 哪種資料集?
- 是否多人重疊?
- 是否下雨?
- 是否逆光?
因為:AI 準確率從來不是固定數字。而是:「特定場景條件下的動態結果」。
安控產業真正正在改變的事
過去安控產業重視:
- 攝影機規格
- 錄影天數
- 夜視距離
但現在開始轉向:
- Metadata 品質
- AI 可辨識率
- 場景資料化能力
- 空間事件分析
- 行為理解能力
這代表攝影機不再只是錄影設備,而是:「AI 感測器」。
下一代智慧安控的真正核心
因此現在產業開始快速聚焦:
- Edge AI
- 高感光
- AI ISP
- WDR
- Metadata
- Multi-sensor
- AI SoC
- 空間治理
- 行為分析
- 零信任空間管理
因為未來的智慧安控,真正競爭的已經不是:「看得到什麼」而是:「系統能不能理解正在發生什麼」。
![]() |
按此 ☞ 回今日3S Market新聞首頁

0 comments:
張貼留言