2017年7月21日 星期五

.盤點:中國媒體所認為「有意思」的電腦視覺公司

What is Computer Vision?






來源: 科技狂人



毫無疑問去年的風口在直播,今年轉向人工智慧,除了巨頭們不約而同的開發表會,宣佈自己 AI 方向的策略佈局,越來越多投資人和創業者,也爭先恐後的 ALL IN 入場,其中最火,也最具商業價值的非電腦視覺這一領域莫屬。知道 AI 的人多,瞭解電腦視覺的人少,這究竟是個怎樣的行業,又有哪些「有意思」的公司?

2017 已經過去一半,我們是時候對上半年做一個總結了。

我們為什麼需要人工智慧?
自深度學習概念引入以來,人工智慧的發展速度有目共睹,資訊科技的發展,按照指數規模爆炸,將導致儲存能力、計算能力、晶片規模、頻寬規模暴漲,引領第二次自動化浪潮,AI 得以逐漸成長為了遊戲高手、圍棋大師、語音轉錄專家、司機、翻譯家、圖像藝術家、鑒黃師、武器……,她正在以不可估計的力量,改變著我們的生活。

人們也開始嘗試利用人工智慧技術,幫助改善一些勞動密集型工作,以及高精度業務,因為它能持續地,像人類一樣正確描述照片上發生的事,不會感到疲倦,還能閱讀並概括出文本大意,最重要的是它還在不斷的學習進步。

就像谷歌的聯合創始人拉里·佩奇早在2002年說的,谷歌不是用人工智慧強化它的搜索能力,而是利用搜索來改善它的人工慧。

電腦視覺風口和難點
電腦視覺是一門,研究如何使機器「看」的科學,它能夠用攝影機和電腦代替人眼,對目標完成辨識、跟蹤和測量等工作。


像素級的處理讓算法得以伸展,我們可以從算法的發展,來看電腦視覺的變化。傳統算法大致可以分為以下4個步驟:圖像預處理、特徵提取、特徵篩選、推理預測與辨識,毫無疑問,這需要大量的經驗,需要你對這個領域和數據特別瞭解,然後設計出來特徵,還需要大量的調試工作。

而引入深度學習後,效果得到大幅度提升,一大批如「DeepID」人臉辨識、「Region CNN」物體檢測、DeepTrack物體跟蹤等開源算法的出現,讓技術的商用變成可能。



计算机视觉“部分价值”年中盘点

從成熟度曲線來看,語音更靠前一點,然後是電腦視覺,特別是安防領域,封閉的場景,有一些孤島化分布的大量數據,可以用於訓練,在這些領域它是有先發優勢的。

業內典型公司盤點(排名不分先後)
相比圖像,視頻擁有更多可能,而如今像素的世界已經延伸到圖像以外,人工智慧技術能夠使得從影像中,提取訊息變得跟從圖像中提取訊息一樣簡單。

這次我們在影像內容辨識技術領域,作了一個統一整理,挑選了其中做得比較好的24家公司進行比較,它們分別來自廣告行銷、遊戲、企業服務、醫療健康、金融、娛樂、電子商務等領域,均已超過A輪,並且專注於文娛類的公司數量遙遙領先,其中以服務於直播監測,和廣告行銷為主要發力方向。


计算机视觉“部分价值”年中盘点

1、商湯科技
技術實力:★★★★★ 人才優勢:★★★★★ 產品商業化:★★★★★

商湯科技是一家典型的深度學習算法公司,目前是中國在該領域,技術團隊規模最大、商業化訂單、收入及融資額最多的公司。由中國頂尖的電腦視覺專家湯曉鷗、徐立創立於2014年,其中技術團隊佔比高達90%,其中包括5位微軟研究獎獲得者(Microsoft Research Fellow),兩位A-star(阿里星人才計劃),聚集了華人世界中,一批深度學習和電腦視覺領域專家。

商湯科技早期專注於安防領域,現在擴展到互聯網+,應用最廣泛,也是受眾群體最大的一個應用,是為FaceU提供的精準的人臉檢測和跟蹤技術,能夠將Face U 的裝飾和貼紙,準確的貼在人臉五官上。

之後會將攜手 Star VC 打造命名為「未來科技研究中心」的科技產業孵化器。

计算机视觉“部分价值”年中盘点

2、曠視科技(Face++)
技術實力:★★★★★ 人才優勢:★★★★ 產品商業化:★★★★★

這個成立於2012年的公司,目前已完成C輪融資,總估值高達20億美金,是目前估值最高公司,商湯科技第一競爭對手。

Face++專注於人臉辨識技術,和相關產品應用研究,面向開發者提供服務。擁有一套非常強大的人臉檢測系統。在世界最權威的人臉檢測(FDDB評測)、人臉關鍵點定位(300-W評測),和人臉辨識(LFW評測:99.6%)獲得三個世界第一,在安防領域的成績也是有目共睹,為支付寶、Uber、中信銀行、萬科等知名企業提供 SmartID 服務。

最值得關注的是,2016年7月正式加入曠視(Face++)的首席科學家孫劍,曾經作為微軟亞洲研究院首席研究員,帶領的團隊於2015年獲得圖像識別國際。

计算机视觉“部分价值”年中盘点

3、格靈深瞳
技術實力:★★★★ 人才優勢:★★★★ 產品商業化:★★★★

格靈深瞳是第一梯隊中,唯一有在做硬體的公司,公司策略方向會重點放在兩個應用領域,第一個最大的是安全領域,第二個領域是商業數據分析。

短短3年時間,格靈深瞳逐步搭建完自己的「格靈深瞳系」——格靈深瞳繼續深耕安防,和商業數據分析領域。為了進一步擴大影響範圍,於2016年與前英特爾研究院院長吳甘沙、北京理工大學姜岩教授,三方共同成立專注無人駕駛馭勢科技;近期還會涉足智慧醫療領域。

计算机视觉“部分价值”年中盘点

4、碼隆科技
技術實力:★★★ 人才優勢:★★★ 產品商業化:★★★

碼隆科技與前三家公司不同,是與時尚業接觸最為緊密的一家公司,在面料辨識和大數據色彩研究上,優勢非常明顯,目前處於A輪狀態,發展非常迅速。
從碼隆科技核心團隊成員,經歷和A輪投資方,不難看出與微軟及英偉達的淵源頗深,今年5月剛剛發佈了國際版,加上與英偉達的合作,非常有節奏的擴大自己的海外版圖。

计算机视觉“部分价值”年中盘点

5、衣+(陌上花科技)
技術實力:★★★ 人才優勢:★★★ 產品商業化:★★★★

衣+ 主攻方向是在圖像與影像中對場景、通用物體、商品、人臉的檢測、辨識、搜索及推薦,幫助內容和平台,實現場景行銷、智慧分析和內容互動。

從2014年創立以來,發展快速,產品線拉得也比較長,除了最開始的APP保留了下來,目前主打的產品有場景化行銷、智慧搭配等,除此之外還增加了相冊分類和內容審核,幾乎涵蓋電腦視覺方方面面。

近兩年又憑借優酷,在網生內容等領域的先行優勢,快速完善了技術+電商+視訊平台+內容的生態模式,形成完整的商業循環。但這也成為他們一個羈絆,目前合作平台除了優酷土豆,幾乎沒有與其它平台的合作。

计算机视觉“部分价值”年中盘点

6、Video++
技術實力:★★★★ 人才優勢:★★★ 產品商業化:★★★★★

Video++專注於消費級視訊領域的AI科技公司,近年來也是發佈了許多成熟的點播視訊方案,以及一整套互動視訊直播方案,也和樂視、芒果、搜狐、鬥魚直播、熊貓直播等各大視頻網站進行了合作,將影像辨識技術運用到各類電視節目中,讓用戶在不反感的前提下,進行廣告植入,據官方發佈的數據,使用此類技術的月獨立UV量達到2.8億。

在技術方面,Video++在跟蹤和辨識方面,擁有自主創新算法,能夠準確的辨識出明星、物體、品牌、手機、場景等等,使機器像人類一樣理解視訊的內容,並發現其中有趣的點。用核心組件和影像應用,將這些點進行商業化的變現,將機器辨識出的結構化數據,作為投放點,應用到廣告和電商的場景中。

最值得關注的是,Video++將視訊行業與AI技術結合,打破以往的傳統商業視訊模式,透過為流量平台提供視訊AI、視訊電商、視訊互動廣告等系統應用,以視覺辨識和大數據為基礎,來實現視訊場景匹配和廣告自動投放。


计算机视觉“部分价值”年中盘点

7、云從科技
技術實力:★★★★ 人才優勢:★★★ 產品商業化:★★★★★

云從科技「國家隊」的身份,為其帶來的優勢非常明顯,據瞭解,從 2015 年 4 月成立至今,雲從的客戶已經有上百家,客戶群體主要集中在金融、公安和商業。

光是金融行業就是 50 多家銀行與非銀機構,目前人臉辨識產品,已經成為銀行業第一大供應商,並且由於在廣州省公安廳與河北省廳的出色表現,正在用人臉辨識技術,引領公安戰法變革。

2017年,云從科技會大力拓展安防領域市場,以金融行業的業務為基礎向其他行業拓展,為金融和安防領域的公司提供軟硬一體化解決方案也是雲從的兩塊核心業務。


计算机视觉“部分价值”年中盘点

8、依圖科技
技術實力:★★★★ 人才優勢:★★★ 產品商業化:★★★★

依圖科技創立於 2012 年,最開始從圖像辨識入手,與中國省市級公安系統合作,對車輛品牌、型號等進行精準辨識,隨後擴展到人像辨識,透過靜態人像比對技術,和動態人像比對技術,協助公安系統進行人員身份核查、追逃、監控、關係挖掘等。

發展 4 年以來,依圖科技的產品已經應用到他們國家二十多個省市地區的安防領域,安防領域之外,進入智慧城市領域和健康醫療領域,協助政府構建」城市大腦」,甚至未來家居、駕駛、圖片搜索、購物等都是依圖商業版圖的一部分。


计算机视觉“部分价值”年中盘点

9、小白世紀
技術實力:★ 人才優勢:★★ 產品商業化:★★

小白世紀作為一家成立於2014年的人工智慧公司,在業內可能太過低調,並沒有太多聲音。

他們目前對自己的定位,是一家致力於視訊內容搜索的CBI(基於內容的互動)科技型創新公司。從產品發展脈絡可以看出,從視訊互動技術出發,經過兩年的累積邁入人工智慧行列,著力於智慧搜索、廣告、內容審核等視訊內容辨識相關技術研究,組建團隊並擁有自己的深度學習網路模型,這些對小白世紀能夠獲得Pre-A輪融資至關重要。

不過,從目前可以查到的訊息可以看出,小白世紀在人工智慧方向的核心人才並不突出,核心成員無技術背景,沒有首席科學家坐鎮,也未成獲得高品質的技術獎項和榜單,對其技術水平存疑。

计算机视觉“部分价值”年中盘点

10、智視VCA(視連通)
技術實力:★★ 人才優勢:★★ 產品商業化:★★★

智視VCA(視連通)是一家還處在天使輪階段以電腦視覺和深度學習為基礎的科技公司,雖然目前還只有「知·視」一款產品,技術卻涉及電腦視覺的方方面面,場景辨識、生物辨識、泛物品辨識、大數據、深度學習、VR/AR等電腦視覺、智慧人機交互、人工智慧等領域。

儘管年輕,視連通有著清晰的商業模式,目標客戶是針對視訊產業的內容生產方、廣告主、各類播放平台,以及更廣泛的電商、社交和資訊類服務提供商。

對收費標準也很理性,兩種收費模式並行,一種是按照影像分析時長,或內容量級進行計費,另一種則是按照一定場景化廣告展示,或交互的比例收取分成。

不過在技術人才方面有所缺失,核心成員均非人工智慧相關領域研究人員,也未與其他院校及研究機構合作,也沒有自有數據庫,但值得注意的是,他們已經申請了兩項專利(由於時間原因尚未披露),具有一定的技術保護意識。

最後
電腦視覺技術的市場需求日益增多,投資風口也在繼續擴張,為更多初創型技術公司帶來希望。

不過現實也是很殘酷的,大量的電腦視覺技術創業公司,都集中在智慧安防、醫療等垂直領域,原因很簡單,大量有價值的數據,都掌握在BAT手中,初創公司無法僅憑一己之力,建立一整套完善的數據樣本庫,這對實現商業化非常不利。

另外電腦視覺的技術門檻高,研發週期長,容易造成資金鍊問題,這些都是創業者需要看見的,不能一味的 ALL IN 入場。

科技讓我們擁有了能夠想像未來,並掌握未來的能力。

                                                                                                                                                                                                                 

沒有留言:

張貼留言