2018年3月19日 星期一

.谷歌雲 AI、微軟 Azure、亞馬遜的機器學習服務,究竟有啥區別?

AWS, Google Cloud, and Azure Compared

 in Under 5 Minutes


八場精彩論壇發表,請用智慧手機掃描邀請函 QR Code 登錄參觀卷及報名


Nx 雲端影像平台解決方案 




leiphone 作者:雷锋字幕组


本文為雷鋒字幕組編譯的技術博客,原標題 Comparing Machine Learning as a Service: Amazon, Microsoft Azure, Google Cloud AI,作者為Altexsoft。

翻譯 | 彭珍 陳明霏    整理 |  凡江


谷歌云AI、微软Azure、亚马逊的机器学习服务,究竟有啥区别?

對於大多數的公司來說,機器學習似乎接近於火箭科學,看起來昂貴而且需要人才。而且,如果你的目標是構建另一個Netflix推薦系統,那確實是。但是,一切即服務的趨勢,也影響了這個複雜的領域。

你可以在沒有太多投資的情況下,啓動機器學習計劃,如果你是數據科學的新手,並且希望抓住成果,這會是正確的舉措。

機器學習最鼓舞人心的故事之一,是關於一個日本農民的,他決定用自動給黃瓜分類的方法,來幫助他的父母,做這項艱苦的工作。與大量關於大型企業的故事不同的是,他既沒有機器學習的專業知識,也沒有大的預算。但是他確實設法掌握了TensorFlow,並且運用深度學習,來辨識不同類別的黃瓜。

透過使用機器學習雲服務,你可以開始構建你的第一個工作模型,從相對較小的團隊預測中,來產出有價值的見解。我們已經討論了機器學習策略。現在讓我們一起看看市場上,最好的機器學習平台,並考慮一些基礎設施決策。

什麼是服務型導向的機器學習
服務型導向的機器學習(MLaaS) ,是自動化和半自動化雲平台的一個概括性定義,這個雲平台涵蓋了大多數的基礎設施,例如數據預處理、模型訓練、模型評估、以及進一步的預測。預測結果可以透過REST API,與你的內部IT基礎設施進行銜接。

亞馬遜機器學習服務、Azure機器學習和谷歌雲AI,是三個領先的雲MLaaS服務,允許在只有少量,或者沒有數據科學專業知識的情況下,進行快速模型訓練和部署。如果用可用的軟體工程師,來組建一支本土化的數據科學團隊,就應該首先考慮這些問題。來看看我們的數據科學團隊結構的故事,以便於更好地瞭解角色分配。

在本篇文章中,我們將首先概述亞馬遜、谷歌和微軟的主要服務型導向的機器學習平台,然後比較這些供應商所支持的機器學習API。請注意,本概述並非旨在提供有關何時,和如何使用這些平台的詳盡指南,而是在開始閱讀文檔之前,需要查找的內容。

用於自定義預測分析任務的機器學習服務

谷歌云AI、微软Azure、亚马逊的机器学习服务,究竟有啥区别?
Azure 機器學習工作室擁有最全面的服務;然而,如果你的任務需要用到深度神經網路,我們還推薦查看亞馬遜的SageMaker,和谷歌的機器學習引擎。

亞馬遜機器學習的預測性分析
亞馬遜機器學習服務,有兩個層面:亞馬遜機器學習的預測性分析,和數據科學家的SageMaker工具。

同於預測性分析的亞馬遜機器學習是市場上最自動化的解決方案之一,最適合於對截止時間敏感的操作。該服務可以載入多個來源的數據,包括亞馬遜RDS,亞馬遜Redshift,CSV文件等等。

所有的數據預處理操作,都是自動執行的:該服務區標識出哪些字段是分類的,哪些是數字的,並且不會要求用戶選擇,進一步數據預處理的方法(降維和白化)。

亞馬遜機器學習的預測能力,受限於三種選擇:二元分類、多類分類和回歸。也就是說,亞馬遜的機器學習服務,不支持任何無監督的學習方法,用戶必須選擇一個目標變量,並在訓練集中標注它。此外,用戶不需要瞭解任何機器學習方法,因為亞馬遜會在查看提供的數據後,會自動選擇它們。

這種高度自動化水平,既是亞馬遜機器學習使用的優勢,也是劣勢。如果你需要一個全自動但有限的解決方案,這項服務會符合你的預期。如果不是,那就選擇SageMaker。

亞馬遜SageMaker和基於框架的服務
SageMaker是一個機器學習環境,透過提供庫快速建模,和部署的工具,來簡化同行數據科學家的工作。例如,它提供Jupyter,一款創作筆記本,來簡化數據探索和分析,無需服務器管理的麻煩。亞馬遜也有內置算法,針對分布式系統中的大型數據集,和計算進行了優化。這些優化包括:

線性學習器,一種用於分類和回歸的監督方法
‧ 因子分解機,用於稀疏數據集的分類和回歸
‧ XGBoost 是一個監督提升樹算法,透過結合簡單的預測算法來提升在分類、回歸和排序中的預測準確率
‧ 基於ResNet的圖像分類,也能應用於遷移學習
‧ Seq2seq是一種預測序列的監督式算法(例如,翻譯句子,將單詞串轉化為更短的摘要等)
‧ K-means是一種用於聚類任務的無監督學習方法
‧ 主要成分分析用於降維
‧ 主題模型是一種用於在文檔中,查找分類的無監督方法
‧ 神經主題模型(NTM)是一種無監督方法,用於探索文檔、揭示排名靠前的單詞和定義主題(用戶不能預定義主題,但是他們可以設置預期主題的數量)

內置的SageMaker方法,與亞馬遜建議的機器學習API,在很大程度上相交,但它允許數據科學家參與進來,並使用他們自己的數據集。

如果你不想使用這些,你可以透過SageMaker,利用其部署功能,來添加你自己方法並運行模型。或者你可以將SageMaker與TensorFlow以及MXNeT深度學習庫進行整合。

總的來說,亞馬遜機器學習服務,能為經驗豐富的數據科學家,和那些只需要完成工作,不需要深入數據集準備和建模的人來說,提供了足夠的自由。

這對那些使用了亞馬遜環境,並且不打算轉移到另一家雲提供商的公司來說,這將會是一個不二之選。

微軟Azure機器學習工作室
Azure機器學習旨在為新手和經驗豐富的數據科學家,提供一個強大的操作環境。微軟的機器學習產品名單,與亞馬遜的類似,但是就當前而言,Azure在開箱即用的算法方面,顯得更加靈活。

Azure提供的服務,可以分為兩個主要類型:Azure機器學習工作室,和機器人服務。讓我們瞭解下Azure機器學習工作室的內幕。我們將會在講專用於特定API,和工具的部門回到機器人服務。

機器學習工作室是主要的服務型導向機器學習軟體包。在Azure機器學習工作室上的幾乎所有操作,都必須手動完成。這些操作包括數據探索、預處理、選擇方法和驗證建模結果。

使用Azure接近機器學習,需要一些學習曲線。但最終會導致對該領域主要技術的更深入理解。另一方面,Azure機器學習支持圖形化介面,以可視化工作流中的每個步驟。或許使用Azure的主要優點,在於可以使用各種算法。

工作室支持近100種方法來處理分類(二元+多類)、異常檢測、回歸、推薦和文本分析。值得一提的是這個平台擁有一種聚類算法(K-means)。

Azure機器學習的另一大部分,是Cortana Intelligence Gallery。它是由社區提供的機器學習解決方案集合,提供給數據科學家,進行探索和再利用。Azure的產品是入門機器學習,並將其能力介紹給新員工的強大工具。

谷歌預測API
谷歌在兩個層面提供AI服務:為精明的數據科學家,提供的機器學習引擎,和高度自動化的谷歌預測API。不幸的是,谷歌預測API最近已被棄用,谷歌將在2018年4月30日停止這一服務。

注定失敗的預測API與亞馬遜的機器學習很像。它的簡約方法縮小到解決兩個主要問題:分類(二元和多類)和回歸。訓練好的模型,可以透過REST API接口進行部署。

谷歌並沒有公佈會使用哪種算法來繪製預測,也不允許工程師自定義模型。另一方面,谷歌的環境最適合在緊迫的期限內,進行機器學習,並推出早期的機器學習計劃。但似乎產品並不如谷歌預期的那樣受歡迎。很遺憾的是,正如臨終常見問題解答中所建議的,使用預測性API將不得不使用其他平台,來「重建現有模型」。

那麼,接下來會是什麼呢?

谷歌雲機器學習引擎
預測API的高度自動化,是以靈活性為代價的。谷歌的機器學習引擎則截然相反。它迎合有經驗的數據科學家,它非常靈活,並建議將TensorFlow的雲端基礎架構,來作為機器學習的驅動程序。那麼,機器學習引擎原則上與SageMaker非常相似。

TensorFlow是谷歌的另一款產品,它是一個開源的機器學習庫,包括各種各樣的數據科學工具,而不是服務型導向的機器學習。它沒有可視化介面,並且TensorFlow的學習曲線,也會十分陡峭。然而,這個庫的目標人群,是那些計劃轉行到數據科學的軟體工程師。TensorFlow十分強大,但主要針對深度神經網路任務。

基本上,TensorFlow與谷歌雲服務的結合表明,基礎架構即服務,和平台即服務的解決方案,取決於三層模型的雲服務。我們在關於數位化轉型的白皮書中,討論了這個概念。如果你不瞭解,那就看一看。

為了總結服務型導向的機器學習平台,似乎Azure當前在服務型導向的機器學習的市場上,擁有功能最多的工具集。它涵蓋了大多數的機器學習相關任務,為構建自定義模型,提供了可視化介面,為那些不願徒手處理數據科學的人,提供了一組可靠的API。但是,它在亞馬遜上仍缺乏自動化的能力。

比較亞馬遜、微軟和谷歌的機器學習API
除了成熟的平台,你可以使用高級API。這些會提供底層訓練好的模型服務,你可以輸入數據然後獲取結果。API完全不需要機器學習的專業知識。目前,這三家供應商的API大致可以分為三大類:

1)文本辨識、翻譯和文本分析

2)圖像+影像辨識和相關分析

3)其他,包括特定的未分類服務

谷歌云AI、微软Azure、亚马逊的机器学习服务,究竟有啥区别?
微軟提供了最豐富的功能列表。但是,所有供應商都提供最重要的功能

語音和文本處理API:亞馬遜
亞馬遜針對文本分析中的常見任務,提供了多種API。就機器學習而言,這些是高度自動化的,僅需要適當的整合就可以工作。

亞馬遜Lex。Lex API是用來在你的應用程序中,內嵌包含自動語音辨識(ASR)和自然語言處理(NLP)能力的聊天機器人。這些都基於深度學習模型。

這個API可以辨識書面和口頭文本,Lex接口允許你將已辨識的輸入連接到各種後端解決方案。顯然,亞馬遜鼓勵使用它的Lambda雲環境。那麼,在訂閱Lex之前,也需要熟悉Lambda。除了獨立的應用程序,Lex目前支持為 Facebook Messenger、Slack和Twilio部署聊天機器人。

亞馬遜Transcribe。雖然Lex是一個以聊天機器人為導向的複雜工具,Transcribe僅僅是為了辨識口頭文本而生。該工具可以識別多個說話者,並且在低品質的電話音訊中起作用。這使得這個API成為編目音訊檔案的一種解決方案,或者為呼叫中心數據的進一步文本分析,提供良好的支持亞馬遜Polly

Polly服務與Lex相反。它將文本轉換成語音,讓你的聊天機器人用語音來回覆。它不會創作文本,只是讓文本聽起來更接近於人。如果你體驗過Alexa,那麼你就能明白。目前,它支持25種語言的女聲和男聲,大部分是英語和西歐語言。一些語言還有多個女聲和男聲,所以就有多種選擇。Polly推薦與Lambda一起使用。

亞馬遜 Comprehend。與Lex和Transcribe不同,Comprehend是另一組NLP的APL,針對不同的文本分析任務。目前,Comprehend支持:

‧實體提取(辨識名稱、日期、組織等)
‧關鍵短語檢測
‧語言辨識
‧情緒分析(正面、中立、負面的文本是怎樣的) 
‧主題模型(透過分析關鍵詞定義主要主題)

這項服務可以幫助你,分析社交媒體的反應、評論和其他不適合手動分析的大量文本數據美麗如,Comprehend和Transcribe 的組合將有助於你分析你的以電話為主的客戶服務中的情緒。

亞馬遜 Translate。正如名字所示,Translate服務翻譯文本。亞馬遜聲稱它使用的是神經網絡,相比於基於規則的翻譯方法,神經網絡方法提供更好的翻譯質量。不幸的是,當前的版本僅支持六種語言翻譯成英語,以及由英語翻譯成這六種語言。這些語言是阿拉伯語、中文、法語、德語、葡萄牙語和西班牙語。

語音、文字處理應用程序接口: 微軟 Azure 認知服務
像亞馬遜一樣, 微軟開發出的高級應用程序接口—— 認知服務,能與你的基礎開發環境兼容,非數據科學方面的專業人士也可以使用它進行工作。

語音語音設置包含了四個應用程序接口,將不同的自然語言處理方法應用於自然語言識別以及其他操作:

‧翻譯語音接口
‧將語音轉變為文字以及將文字轉變為語音的必應語音接口
‧執行聲音覈實任務的發音主體識別接口
‧基於自己的數據和模型應用Azure自然語言處理能力的定制語音服務

語言接口的語言組主要類似於Amazon Comprehend進行文本分析 
‧語言理解智能服務是一個用於分析文本中指令語句意圖的接口 (例如 「運行YouTube應用程序」或者 「打開起居室的燈」)
‧用於情感分析和主題歸納的文本分析接口
‧必應拼寫檢查
‧文本翻譯接口
‧用於估計詞語組合的概率並支持單詞自動結束的網路語言模型接口
‧用於拆分句子、詞性標注以及將文本分為標記好的詞組的語言分析接口

語音、文本處理應用程序接口:谷歌雲服務
雖然這種接口主要綜合了亞馬遜和微軟Azure開發的功能, 但是它也有一些有趣、特別的亮點值得一看Dialogflow。隨著多樣的聊天機器人越來越流行,谷歌也開發出了一些產品。Dialogflow通過自然語言處理技術來支持運行,目標功能為解析文本的意圖並說明文本主體人的意願。可以根據需要使用Java、Node.js和 Python語言對這個接口進行修改和定制。

自然語言雲處理接口。這個接口在內核特徵上幾乎與亞馬遜的Amazon Comprehend和微軟的Language相同。 

定義文本實體
情感辨識
分析句法結構
主題分類(例如食物、新聞、電子等)

雲語音接口。該服務用於自然語音辨識,可能與類似接口相比,最顯著的優勢是谷歌豐富的語言庫。當前,語音雲的詞彙,可覆蓋超過110種全球性語言,及其變體語言。它也有一些其他特徵:

‧具有客製化辨識特定可口頭表達的的文本,及單詞功能的單詞提示(例如,為了更好地理解本地土話或者行話)

‧過濾不合適的內容

‧處理噪音

雲翻譯接口。總之,你可以用這個接口,來在自己的產品上使用谷歌翻譯。它支持超過一百種語言,具有語種自動辨識功能。

除了文本和語音,亞馬遜、微軟和谷歌還開發了應用於圖像、影像分析的多功能接口。


谷歌云AI、微软Azure、亚马逊的机器学习服务,究竟有啥区别?

雖然圖像分析與影像分析接口,有許多交叉之處,但是許多視訊工具仍在發展,或處於良好的版本中。例如,谷歌對多種圖像處理任務可提供許多支持,但是明顯缺乏一些,微軟和亞馬遜已能實現的影像分析特徵功能。


谷歌云AI、微软Azure、亚马逊的机器学习服务,究竟有啥区别?

微軟看似是贏家,雖然我們仍認為亞馬遜有最高效的影像分析接口,如亞馬遜可支持流媒體處理。這個特徵功能顯然拓寬了影像分析技術的應用面。

圖像和影像處理應用程序接口:亞馬遜 Rekognition
我們絕對沒有拼錯單詞。Rekognition應用程序接口,是用於圖像辨識,以及最近的影像辨識任務。包括:

‧圖像目標檢測以及分類(發現並檢測圖像中的不同目標對象,並且進行定位)

‧在影片中,該接口能檢測一般活動(比如「跳舞」)或者複雜活動(如「撲火」)

‧臉部辨識 (用於檢測臉部並進行匹配) 以及臉部分析(這個接口有些非常有意思的功能,比如檢測笑臉、分析眼睛,甚至看可以定義影片中的情感情緒

‧檢測不合適的影片

辨識圖像和影片中的名人 (無論出於何種目的)

圖像與影像處理應用程序接口: 微軟 Azure 認知服務
微軟的圖像包結合了針對不同種類圖像、影像和文本分析的六個應用程序接口

‧可辨識目標對象、行為(如走路),以及定義圖像主顏色特徵的電腦視覺

‧可檢測圖像、文本、影片中不合適內容的內容評分機制

‧臉部應用程序接口用於檢測臉部,並集中檢測結果,進行年齡、情緒、姿勢、笑容和臉部毛髮的辨識定義

‧情緒應用程序接口,是可描繪臉部表情的另一個臉部辨識工具

‧客製化視覺服務支持用自己的數據,建構客製化圖像辨識模型

‧影像索引器是一個可在影片中尋找人物、定義語音情感,以及圈出關鍵詞的工具

圖像和影像處理應用程序接口: 谷歌雲服務
雲視覺應用程序接口。該工具被用於圖像辨識任務,並非常擅長查找特定的圖像屬性:

標記對象
檢測臉部並分析表情
發現地標並描繪場景(如度假,婚禮等)
發現圖像中的文本並辨識文本語言
主顏色特徵

雲影像智。該谷歌的影像辨識應用程序接口,處於發展的早期,因此它缺少許多亞馬遜Rekognition,和微軟認知服務的特徵功能。現在該接口提供以下工具箱:

標記對象並定義行為
精確辨識內容
轉錄語音

雖然從特徵表級別上來說,谷歌人工智慧服務,也許缺少一些功能,但是谷歌應用程序接口的優勢力量,在於谷歌握有的大數據集。

特種應用程序接口與工具
在這裡,我們將討論微軟和谷歌,開發的特種應用程序接口產品及工具。由於亞馬遜僅有上文提到的幾種,用於文本分析,和圖像/影像分析的應用程序接口產品,我們這裡的討論不包括亞馬遜。但是,這些特種應用程序接口,擁有的一些功能也被亞馬遜的某些產品擁有。

Azure 服務機器人框架。微軟做了大量努力,為其用戶提供靈活的機器人開發工具。總而言之,該服務包含一個可使用不同編程語言搭建、測試、部署機器人的全面環境

有意思的是,該機器人服務不一定需要應用機器學習的方法。比如微軟開發了五個版本的機器人(基礎版、成型版、語言理解型、主動式,以及問答機器人),只有語言理解型機器人,需要應用高級人工智慧技術。

現在,你可以使用.NET和Node.js技術,來透過Azure搭建機器人,並在以下平台和技術服務中部署它們:

必應
微軟小娜
Skype
微信
Office 365 郵箱
GroupMe
Facebook 信使
Slack
Kik
Telegram
Twilio

微軟必應搜索。微軟開發了7個,與必應搜索特徵功能,相連的應用程序接口,包括自動提示、新聞、圖像和影像搜索接口微軟Knowledge。該應用程序接口群,將文本分析,與各種各樣的特別任務相結合:

‧推薦應用程序接口,能用於搭建個性化消費推薦系統

‧知識搜索服務,讓你輸入自然問題,從而在數據庫中,檢索相應數據、可視化數據並自動補全提問

‧實體連接智慧接口,用來突出可表示正確實體的名字和短語(例如探索的時代),並且確保消除模稜兩可的情況

‧學術知識應用程序接口,可進行單詞自動補全、尋找文件單詞和概念上的相似處,並且在文件中搜索圖表部分

‧問答者接口可以被用於對應,多樣的問題與對應的答案,從而可以被用於建構客戶服務聊天機器人和應用

‧客製化決策服務,是一個強化學習工具,用於根據用戶的喜好特別客製化不同種類的內容,並將它們排序(例如鏈接、廣告等)

谷歌雲職位搜索。該應用程序接口仍處於發展階段早期,但不久就可能顛覆,如今我們擁有的職位搜索能力。不像依賴於精確關鍵字比對的傳統職位搜索引擎,谷歌應用機器學習方法,來尋找高度多樣的職位描述,與避免模糊之間的聯繫。

例如,它致力於減少不相關,或者過於寬泛的返回結果,比如對「銷售助理」的搜索詢問,返回所有關鍵字帶「助理」的職位。這個接口有哪些主要的特徵功能呢?

‧修正職位搜索詢問中的拼寫錯誤

‧比對所需的資歷水平

‧尋找可能有多樣描述方式,以及行業行話的相關職業(如對於「服務員」這一搜索詢問,而不是「網路專家」的詢問返回「咖啡館咖啡師」結果;或者對「業務開發」搜索詢問返回「營運專家」)

‧處理縮略詞(例如對「HR「搜索詢問返回「人力資源部助理」搜索結果)

‧比對多樣的地點描述

IBM 沃森以及其他
三個平台都在拿出一份非常詳盡的文件,來起動機器學習試驗,以及在公司的基礎設備上,部署訓練好的模型之前,就被提出了。也有大量來自創業的,其他服務型導向的機器學習的解決方案,為數據科學家所尊敬,比如PredicSisBigML

但是IBM沃森分析是什麼情況呢?

以商業預測為目標功能的IBM 沃森分析,現在還不是一個羽翼豐滿的機器學習平台。當前,沃森的主打是數據可視化,以及描繪不同的價值如何相互作用。

它也有與谷歌提供的相似的視覺識別服務,以及一串其他認知服務(應用程序接口)。當前沃森的問題是系統執行的是狹隘、相對簡單,並易於被非專業人士操作的任務。當涉及到客製化機器學習,或者預測的職責時,處於發展階段太早期的IBM沃森就難以駕馭了。

數據儲
透過機器學習,找到正確的儲存來收集數據,以及進一步處理數據,已經不再是個重大挑戰,數據科學家有足夠的學識,來實施流行的儲存解決方案。

在大部分情況下,機器學習要求SQL和NoSQL兩個數據庫結構支持,這兩個數據庫可被許多已建立的、值得信賴的解決方案支持,比如Hadoop Distributed File System (HDFS)、Cassandra、Amazon S3和Redshift。

對於在開始機器學習之前,使用強有力的儲存系統的組織來說,這將不會是個障礙。如果你計劃做一些服務型導向的機器學習系統,最直接的方法,就是選擇可用於儲存和機器學習兩者的供主,這將減少配置數據源的時間消耗。

然而,這些平台中有一些很容易與其他儲存相融合。比如Azure機器學習,主要與其他微軟產品相融(Azure SQL, Azure 表格 Azure Blob) ,但是也支持Hadoop ,以及大量其他數據資源的選擇。

這些包含直接從桌面上傳數據,或者部署服務器的功能。如果你的機器學習工作流程多樣化,並且數據來自多種資源,也許會面臨更大的挑戰。

建模與計算
我們討論過,主要提供計算力的服務型導向的,機器學習解決方案。但是如果機器學習工作流程,在內部進行,計算挑戰將會遲早敲響鐘聲。

在大部分情況下,機器學習需要大量的計算力。即使忽略大數據時代已經到來的事實,數據集(做一個策劃的子集) 仍是一個相關實踐。雖然模型原型可以在筆電中完成構建,但是使用一個大數據集訓練複雜模型,需要投入更多強有力的硬體。

數據處理也是如此,它可以在正規的辦公設備上,佔用幾天時間,在快到截止日期時 ——有時候模型需要每周或每天修改、重新訓練——這顯然不是一種合理選擇。有三種可行方案來保持高效表現:

1)加速硬體。如果你做的是相對簡單的任務,並且不用將模型應用到大數據中,那麼針對這些任務,使用固態硬碟作為數據準備,或者使用分析軟體。計算集中處理能被放置在一個,或幾個圖形處理單元 (GPUs)上執行。大量可獲得的庫能讓GPUs 的處理模型,能被用像Python一樣的高級語言編寫。

2)採用分布式計算。分布式計算指使用多台機器處理,分別切分之後的任務。然而,這個方法不能適用於所有的機器學習方法。

3)使用雲計算的可擴展性。如果你的模型在處理,有集中高峰時段的顧客相關的數據,雲計算服務將具有急速可擴展性。對於要求擁有其內部數據的公司,值得考慮架構私有雲設施 。

下一步計劃
我們很容易在大量可獲得的解決方案中迷失。 它們算法不同、要求的技術不同,最終他們做的任務也不同。此情況對於這個年輕的市場非常普遍,甚至我們之前談論的三大領先解決方案,並沒有產生完全的相互競爭關係。不僅如此,變化的速度是非常快的。有很大可能你堅守一個供應商,然後突然另一個供應商,意外跳出來滿足你的商業需求。

正確的做法是盡早明瞭,你打算透過機器學習獲得什麼。這並不容易。如果你缺乏數據科學或相關領域專業知識,在數據科學與商業價值中,搭一座連接橋是非常困難的。

我們在AltexSoft 與客戶討論機器學習應用時,經常遇到這樣的問題。這通常是一個一般問題,化為單一屬性的問題。無論是價格預測,還是其他數值,確定對象的類別,還是將對象分散成多個組 一旦你找到這個單一屬性,確定供應商和選擇提議內容將會簡單一些。

DCVC創立合伙人,Bradford Cross,認為服務型導向的機器學習,不是一種可行的商業模式。據他所說,服務型導向的機器學習,落入了傾向使用開源產品的數據科學家,與傾向購買能解決更高級任務工具的,高管之間的差異鴻溝中。

然而,這個行業似乎現在還在克服,它長期以來存在的問題,最終我們將看到更多的公司,透過轉向服務型導向的機器學習方向,來避免昂貴的人才收錄,並同時擁有多功能的數據處理工具。

部落格原址:
https://www.altexsoft.com/blog/datascience/comparing-machine-learning-as-a-service-amazon-microsoft-azure-google-cloud-ai/

今年的智慧城市展,有什麼看頭……
                                                                                                                                                                                                                            

沒有留言:

張貼留言