來源:機器之心作者:Libby Kinsey
機器學習與人工智慧,在數據驅動型商業項目中發展迅速,幾乎遍布每個角落。這裡我選了幾個可能還未被大公司吞食的領域。
「鋤頭和鏟子」 戲碼
即在那次加利福尼亞州淘金熱中,鎬鍬承包商大賺了一筆(然而探礦者的貢獻被忽略了)。機器智慧的鎬與鍬就是硬體、數據輸入端及(有爭議的)算法本身。
1.很明顯,機器智慧算法的開發大多數都是開源的。當然也有例外——去年,哈佛大學申請了一項有效替代 BackProp 算法的專利,即 Feedback Alignment Algorithm ——我想知道,他們打算如何使之商業化?幫助人們方便利用學習算法的高品質 SaaS 產品,會找到有這方面需要的用戶,而且 MetaMind,正將深度學習技術帶入數據集,它們就是這樣一家公司。
另一個我喜歡的項目叫做自動統計專家(The Automatic Statistician),它利用貝葉斯推理(Bayesian
inference)找出數據擬合的最佳模型。Curious AI,是一家通用人工智慧(General AI)公司,它們的第一個商業項目就是垃圾分類(中規中矩的盈利模式範本),據報道,公司旨在以工具包的形式出售人工智慧軟體。
2.大公司可以接觸到龐大數據庫,還能獲取更多的數據。不過,到目前為止,大公司的關注點都集中在一些垂手可得的成果上,比如社交或商業數據,因此,創業公司仍有機會在某些領域大展拳腳:難以獲得數據以及(或者)難以標籤化數據的地方。
Affectiva 的臉部表情回應數據庫就是這個類型,還有 Pallas Ludens(端到端數據注釋服務),以及 opensensors.io(為傳感器數據公共資源附加價值)。基因和醫學圖像數據——受制於某些棘手的隱私問題——會讓個性化治療、護理,以及更好的診斷成為可能。這方面,看 Genomics England 公司是個好例子。
3. 先進硬體,GPUs 已經讓一些巨大進展成為可能。(一張NVIDIA GeForce GTX Titan就能讓我檢測蝙蝠的音頻信號)
蝙蝠信號的聲譜圖(下圖)及ConVnet預測(上圖)。
但是,這些只是圖像處理器。高效學習以及推理的 下一個轉折點,會來自為機器學習特別設計處理器這一領域。
Graphcore 稱之為智慧處理器單元(Intelligent Processor
Units)。同時,Nervana Systems, Teradeep(Yann LeCun 擔當顧問)以及 Thinci 正在打造他們自己的定制硬體。將一些對教育有幫助的公司(Udacity, Coursera, Kaggle 等),或管理代碼庫和項目的公司(比如 Atlassian,上市準備中)包括進來,也是很有意義的。
情感開發
眾多初創公司在這個領域的表現都差強人意。正如 MIT 的情感計算小組(Affective Computing group)所言:
情感對於人類體驗來說至關重要,它影響認知、觀念、以及學習、交流、甚至理性決策等日常活動。然而,技術人員卻大大忽略了情感的作用並為用戶創造出一種經常讓人感覺挫敗的體驗...
用來訓練一個微表情探測器的圖片
第一個任務是訓練辨識人類情感的模型。Emotient,RealEyes 及 Affectiva,都使用了臉部表情來推理情感,目前(看起來)很大程度上是一種行銷手段。Cogito Corp 及 Beyond Verbal 關注的是從語音中解讀情感線索,進而展開市場調研,提供更好的用戶體驗。
接著是模仿情感行為,比如,為了和人類自然互動。那個「友善」的機器人 Jibo,就是只用一隻「眼睛」表達情感的絕佳的例子。儘管未能找到其他例子,不過,一定會出現比較便宜的、具有自適性和回應性的機器人玩具(比如Paro,療癒系海豹機器人,不過僅供娛樂)。這些機器人的優勢在於,避免了對話性機器人玩具隱私方面的擔憂,比如像 Toy Talk 及 Mattel 的 Hello BarbieTM,至少在聲音的本地化而非雲端處理後。
另一些應用包括個性化保健與教育、衝突解決方案、協商訓練,以及自適應遊戲。這些領域看起來很適合運用機器學習,因為情感體驗是主觀和多變的。
行業滲透
機器智慧是否會讓人類勞動力顯得多餘,對此,我持觀望態度,不過我會指出,它當然會有望幫助人類完成許多專業任務(而且在這一過程中,能為消費者在金錢方面,提供更好的選擇和價值)。
這些技術能做什麼?拿法律行業為例,Ravn Systems 實現了法律工作中(重復而單調的)文件審查自動化;Bitproof’s Peter 是一個人工智慧法律助手,能請求籤名,生成合同以及證明文件;Premonition.ai 使用數據來搜索司法審判中的無意識偏見。
在招募,保險,財務管理等領域,類似工具能讓專業人士,將更多的時間花在工作上,更加讓人滿意的方面,諸如鍛鍊判斷力,進行決策以及娛樂客戶。
醫療改革
藥物發現總是昂貴而有風險的,需要相當的智慧。但是,加入你能用數據減少風險,找到更好的藥物研發目標,會怎樣?這是 Stratified Medical 的假設,運用深度學習進行藥物發現。
另外,Enlitic 和 Zebra Medical 尋求運用深度學習來開發精確的診斷/決策支持工具,而 Your.MD 已經與英國國家衛生服務組織合作,開發提供個性化健康援助的 app。
搜索優化
「什麼電影來著,有個我妹妹喜歡的德國演員...和外星人有關...很朋克的那部?」
搜索軟體需要處理不準確、主觀和個人的資訊,就像人類做的那樣。它需要幫助我們從一堆龐雜資訊中,發現與之相關的內容。這一過程包括學習文本和內容特徵。事實上,這需要一篇博文的篇幅來講清楚,不過,這裡有些例子:
Clarify 通過API使得音頻和視頻變得可檢索。它就是掃描文本,找關鍵詞來確定相關性,一個很贊的省時應用。
Lumi 根據瀏覽歷史來推測你的品味,提供相關流行內容。
Youssarian
Lives 是一個能夠進行側面連接的搜索引擎。
EyeEm 已經將機器學習用於圖片市場,這樣,無需便簽就能進行搜索特徵,比如「愉快的」和「多雨倫敦」,而 Cortexica 及 Sentient Technologies / Shoes.com 也以類似的方式重新定義產品搜索。
搜索相關性的一個必要方面,當然是「值得信任(trust worthiness)」,這樣,社交媒體及新聞網站的內容和主張的就能進行驗證或根據真實性評分。有人在做這個嗎?
網路安全
網路安全領域的機器學習已經吸引了大批風險資本(例如,Lookout 的 2.82 億注資, Vectra Networks 獲得了 7800 萬,Darktrace 的 4000 萬,以及 Cybereason 的 8900 萬),但是,一系列壞消息(比如最近 TalkTalk 用戶數據被駭)表明市場仍有相當大的缺口。
雖然就像任一片紅海一樣,但是,還是難以區分許多擁有表明相似產品的初創公司。在這方面我無疑有著更多的工作,也會密切留意網慧安全初創公司方面的加速器 Cyber London。
有太多應用領域了,很難去僅僅關注一兩個。
對新數據集的研發和應用的步伐,正使得機器智慧成為一個如此令人興奮的領域。尤其是,此刻的倫敦蘊藏著真正意義上的動力,靠近世界級學術機構的東道主(倫敦帝國學院,英國倫敦大學,哈佛和劍橋),擁有一個已經建立起來的創業生態系統(例如,Entrepreneur First加速器積極擁抱機器學習型人才),還有成為目標客戶中心——金融,法律及政治——的地理位置。
沒有留言:
張貼留言