Megvii Computer Vision Solution
in Smart Retail
零售領域近些年圍繞轉型升級,建設性地提出了以「人、貨、場」三核心為基礎的智慧零售藍圖之後,各方新技術蜂擁在零售的各型場景中角力。在之前的分享中,我們主要介紹了如何透過人工智慧技術,從「人」的維度,切入零售場景的。而本文將著重介紹人工智慧技術,是如何從「貨」的維度賦能零售商業的。
視覺智慧引擎作為 AI 落地的第一步,在商品數位化方面發揮著主要作用。而從視覺角度來說,「貨」的形態差異,相較於「人」來說有了顯著增加。不同的垂直行業,為順應市場需求所開發的產品,無論在產品功能,還是形態上都千差萬別,甚至同類型產品,也會產生出不同的形態,以順應差異化的細分需求。
這對視覺智慧引擎提出了新的挑戰,也激發出了 StartDT AI Lab(注,「StartDT AI Lab 」欄目致力於展現算法技術上的突破,分享算法研發成果在商業場景的應用能力,專注於「AI+ 大數據」領域。)更大的技術突破。
下面從已經商業落地的場景中,選了幾個比較有代表性的行業場景,來展示 StartDT AI Lab 已取得的技術突破。
AI 識貨賦能服飾行業
我們在 17 年率先推出服裝辨識技術,結合產品 —— 魔鏡實現落地。在這個場景中,使用者站在魔鏡前站定幾秒後,魔鏡首先將對使用者的穿著進行分割理解,從中分離出 T 恤、風衣、夾克、牛仔褲等各種類型的服飾,然後透過對單品服飾的分析,例如 T 恤,我們可以對其抽取特徵,分析出 T 恤的風格、袖長、版型等屬性,最後在我們自建的百萬級服飾商品庫中,使用推薦算法為使用者推薦相似的、配套的商品,從而達到引流客戶、智慧導購的效果。
在這個鏈路中,我們當時碰到的主要問題和解決方案:
- 1. 獲取使用者準確的衣著資訊,並獲取特徵時,像 T 恤、短褲這樣上下裝明顯的衣著較容易獲取,但像連衣裙、風衣類較長的衣著卻較難處理。我們透過收集大量數據、清洗打標、完善數據集,並使用級連方法,先對服飾一級標籤進行檢測分析,再進行二次處理,從而提高了分割效果。
- 2. 服飾屬性多樣且沒有統一的標準,如何快速同時判斷成為難題。我們將屬性的分類器各自獨立互不影響,使用特徵作為輸入,減少了重複運算,另外我們將分類器同時接在 Graph 中,使整體過程 End-to-End,快速有效。
- 3. 大規模檢索:當數據庫較大時,檢索速度慢,無法快速響應。我們將比對數據庫部署在分布式集群上,實現了特徵比對層面的 map-reduce,使我們在應對各種級別的比對時游刃有餘。
AI 識貨賦能快消飲品行業
在快消飲品行業已有近兩年的探索歷史。各式各樣的飲品——包括礦泉水、碳酸飲料、果汁、啤酒、白酒等,都可以在自動販賣機中售賣。
我們透過自研的深度學習算法、數據採樣方法,搭配客製化的硬體配置,實現了在商用場景中 99% 以上的辨識準確率。我們將貨損率控制在 1% 以內,低於快消飲品行業平均貨損水準。
此外,我們在不到 1 平米的佔地空間上,實現了極高的坪佔比,單櫃單月零售額可達千元級別,卻僅需少量的維護工作。
在正式商用的背後,StartDT AI Lab 主要的 contribution 有以下幾點:
No.1 快速有效的小物體檢測算法
和大多數場景不同,我們的檢測目標往往是最小邊接近 16 像素的小目標,且在一張圖上有相當多的目標。我們通過自適應 anchor 的方法,使先驗 anchor 更加準確;此外我們透過一種特徵增強算法,使細節特徵得以在深度網路中,盡可能減少損失,從而避免了因特徵過少,帶來的低分值檢測結果不穩定的問題。此外我們還自研了一種自蒸餾方法,在不增加參數的情況下,提升了模型準確率,從而達到了商用水準。
No.2 與度量學習結合的辨識技術
度量學習在過去的幾年中,被廣泛使用在人臉辨識模型上,並取得了非常不錯的效果。我們將其引入商品辨識,結合經典的神經網路方法,使辨識結果更加準確可靠;此外模型還可輸出可比對特徵,支持特徵比對方式出結果,支持不同類間相似比較,從而在選品層面,就避免了相似商品同時販賣無法辨識的問題。
No.3 小數據集增強
我們的數據集相對使用場景,其實是一個小數據集。如何使用小數據集,在大數據場景下獲得商用級準確度?我們自研了一種 mix 方法,使檢測模型獲得了非常高的召回率;此外我們還使用了 GAN,在訓練分類器的過程中,同時訓練生成器,再拿生成結果同時訓練分類器,使分類器訓練更充分,更平滑。
在生鮮/藥品等垂直領域,我們也敢於摸索和嘗試,發揮自有深度學習算法,和採樣方法的優勢,結合自研的硬體優點,首創能將繁複多類的生鮮,不受類別影響的智慧冷藏櫃。眾所皆知,在垂直領域中,同一 sku 的外觀變化多樣,適配成本高。我們透過特定產品設計,完美支持各類蔬菜水果等生鮮,準確率更是可以做到近乎 100%。讓顧客不受限於菜市場 / 藥房等特殊場地的限制同時,更可以發揮無人貨櫃的完美優勢——不受時間限制。
StartDT AI Lab 在黑暗中探索的收穫與創新:
No.1 新穎的深度學習式場景思考
為了擺脫生鮮場景下,各種形狀和尺寸帶來的異同和難以相容,以及客戶快速上新的切實需求,我們在場景落地的實際道路上,結合商品的特性、產品的優勢和深度學習算法的原理,給奇形怪狀的生鮮產品,進行特殊的包裝,該方案解決了生鮮產品之間的差異性,並能支持客戶快速上新。
No.2 獨具創新特色的數據增廣
光有新穎的方案設計,還不足以讓深度學習,在一個實際場景中完美落地,準確率是客戶第一要素,數據是深度學習的資本。StartDT AI Lab 在深入分析了生鮮和藥品等垂直領域的數據特性和算法性能之後,創新性地在採樣數據集上進行數據增廣,讓準確率近乎完美,詮釋了什麼是將深度學習進行落地的概念。
從以上案例中,呈現了 StartDT AI Lab 在「貨」的數位化探索,雖然還是比較初步的商品數位化階段,但也透過 AI 技術,首次實現了商品售賣週期內的全鏈路數位化跟蹤,並在此基礎上,實現了零售前端成本削減,提高了使用者調研自動化的效率。
沒有留言:
張貼留言