Voice Recognition As Fast As Possible
ifanr
2011 年 10 月 4 日,蘋果在 iPhone 4s 的發表會上,宣佈了一項全新的功能——智慧語音助手 Siri;通過它,使用者可以用語音來實現打電話、發簡訊、設置鬧鈴等功能。
雖然實際的體驗效果並不出色,但隨後的幾年時間裡,Google Now(後來更名為 Google Assistant)、微軟 Cortana 相繼誕生,語音助手似乎成為智慧手機的標配。
但實際的情況是,在以觸控操作,為主要交互方式的智慧手機上,語音助手的功能,和使用場景都比較有限,語音辨識率和對話能力也有待提升,由此導致 Siri 們的使用體驗並不好。許多智慧手機用戶稱之為「雞肋」。
不過,在人工智慧時代到來的大背景下,隨著亞馬遜 Alexa 和 Echo 智慧音箱的出現,智慧語音助手終於找到了一個新的應用場景——智慧家庭。
Alexa,一個內置在智慧音箱中的 Siri
與 Siri、Google now 等語音助手不同,亞馬遜從一開始就沒有把 Alexa ,與智慧手機結合在一起的意思。
2014 年 11 月,當亞馬遜默默地發佈 Echo 智慧音箱時,其內置的 Alexa 智慧語音助手,就與 Siri 們走進了一個不同的場景。
作為一款智慧音箱,亞馬遜 Echo 沒有螢幕,它唯一支持的交互方式就是語音;在設置完成之後,用戶可以說出 「Alexa」 來喚醒,並通過它完成播放音樂、查詢天氣、設置鬧鈴、Uber 打車、查詢菜譜等功能。
Alexa,一個內置在智慧音箱中的 Siri
與 Siri、Google now 等語音助手不同,亞馬遜從一開始就沒有把 Alexa ,與智慧手機結合在一起的意思。
2014 年 11 月,當亞馬遜默默地發佈 Echo 智慧音箱時,其內置的 Alexa 智慧語音助手,就與 Siri 們走進了一個不同的場景。
作為一款智慧音箱,亞馬遜 Echo 沒有螢幕,它唯一支持的交互方式就是語音;在設置完成之後,用戶可以說出 「Alexa」 來喚醒,並通過它完成播放音樂、查詢天氣、設置鬧鈴、Uber 打車、查詢菜譜等功能。
對於 iPhone 來說,Siri 只是一個可有可無的語音輔助工具,但對於 Echo 而言,Alexa 就是它全部的靈魂,而 Echo 只是 Alexa 的一個外殼。
另外,由於 Echo 沒有螢幕,使用者與它是完全基於語音交互的,這就要求 Alexa 的語音能力足夠強悍;而交互方式的限制,則意味著 Alexa 必須足夠智慧化,從一個相對簡單的智慧語音助手,變成一個能夠聽懂,並回應使用者的語音機器人。
為此,亞馬遜 Alexa(以及 Echo 智慧音箱)的功能特點,主要體現在三個方面:
- 強大的語音技術。語音是 Alexa 唯一的交互方式,因此對於語音辨識、語義分析等方面的技術,要求非常嚴格。在一次採訪中,亞馬遜 CEO 貝索斯表示,亞馬遜已經在 Echo 和 Alexa 上投入數年的時間,先是從老牌語音辨識公司 Nuance ,挖來了一大批人才,後來又收購了兩家致力於語音技術的創業公司 Yap 和 Evi。最終,Alexa 的語音能力可以與 Siri、Cortana 等相比肩。
- 人工智慧。Alexa 本來就是人工智慧的產物,它最初的研發靈感就是《星際迷航》中的機器人,後者可以像人一樣正常交流。為此,亞馬遜在 Alexa 中整合了增強機器學習等人工智慧技術,這些技術此前被用於亞馬遜商城的產品推薦和價格預測;後來隨著 Echo 用戶的不斷增加,亞馬遜也獲得大量的語音數據,對 Alexa 的人工智慧技術進行改進升級。
- 基於語音的應用。作為 Alexa 的載體,Echo 智慧音箱究竟能幹什麼,才是使用者真正關心的問題。起初 Echo 可以完成播放 Prime 音樂、設置鬧鈴、查詢天氣、回答問題等基礎任務,但後來,Echo 開始支持 Spotify 音樂、Audible 有聲電子書、NPR 新聞資訊等,來自第三方的服務,也開始增加對家中的燈、空調、攝影機等電器設備的控制。
programmableweb |
2015 年 6 月,亞馬遜將 Alexa 開放出來,第三方開發者可以透過 Alexa ,來建構自己的語音應用,也就是亞馬遜所說的技能 Skill ;一個月後,亞馬遜也放開了 Echo 智慧音箱的銷售。
截止 2016 年 12 月,Echo 的銷量已經超過 500 萬台,而 Alexa 的技能也達到了 5000 多項。
智慧家庭操作系統
今年的 CES,亞馬遜 Alexa 的存在感爆棚;其主要原因是,包括三星、聯想、LG、Dish 在內的多家廠商,都推出了不同類型的智慧家庭設備,這些設備都內置了 Alexa。
這得益於 Alexa 在另外一個維度的開放策略——針對第三方硬體廠商開放。
早在 2015 年 6 月,當亞馬遜針對第三方開發者,推出 Alexa Skills Kit(技能開發包)時,也針對第三方硬體廠商推出了 Alexa Voice Serive 開發包。
為了鼓勵開發者和廠商參與其中,亞馬遜推出了一個 1 億美元的資助基金 Alexa Fund;最終的結果是,在最初的一段時間裡,有第三方開發者為 Alexa 開發技能應用,但是願意搭載 Alexa 的第三方硬體廠商卻寥寥無幾。
獲得 Alexa Fund 資助的部分品牌
|
因此,在最初的一段時間內,Alexa 的唯一載體,就是亞馬遜自己的 Echo 智能音箱;後來在 2016 年 3 月,亞馬遜又推出 Amazon Tap 和 Echo Dot 兩款設備。
前者更像是 Echo 的行動版本,而後者則有點類似於,一個可以自定義音箱音質,但同時又能使用Alexa 的 Echo。
Amazon Tap 和 Echo Dot |
但是,隨著 Echo 設備銷量的越來越多,和 Alexa 技能數量的不斷增加,從 2015 年下半年開始,第三方硬體廠商意識到 ,Alexa 在智慧家庭領域的重大發展潛力,陸續有家電廠商開始與亞馬遜合作,試圖在自家產品中內置 Alexa。
實際上,在一年前的 CES 2016 展會上 ,Alexa 已經刷了一波存在感。
然而到了 CES 2017 年,Alexa 出現在各大廠商的產品發表會上,涵蓋的產品類型包括冰箱、吸塵器、DVR、手勢遙控器、燈泡、車載系統等,它們都內置了 Alexa 語音助手,以及可與 Alexa 賴以交互的音頻 I/O 模組。
也就是說,Alexa 不再僅僅蜷縮在一款智慧音箱的外殼之中,它開始成為多種智慧家庭產品的內置助手。
聯想 Smart Assistant 智慧音箱,內置 Alexa |
另外值得一提的是,CES 2017 期間,亞馬遜負責 Echo、Alexa 和應用商店的副總裁 Mike Geroge ,還宣佈 Alexa 的技能已經達到了 7000 項,而且未來幾個月裡,將會有多個內置 Alexa 的硬體設備種類問世。
這時候的 Alexa,距離一款基於語音交互的智慧家庭操作系統,越來越近;只不過它支持的硬體種類更加豐富了。
智慧家庭的初步形態
相對於智慧家庭這個行業的發展來說,智慧家庭這個概念本身已經存在了很久了;但是近兩年來 ,Alexa 人工智慧語音助手的出現,似乎讓智慧家庭的形態變得更加清晰了。
智慧家庭的初步形態
相對於智慧家庭這個行業的發展來說,智慧家庭這個概念本身已經存在了很久了;但是近兩年來 ,Alexa 人工智慧語音助手的出現,似乎讓智慧家庭的形態變得更加清晰了。
從交互方式來說,在家庭場景下,語音交互顯然比螢幕觸控操作更加自然,更加自由;這也是 Alexa 被用戶接受的原因。在設置完成之後,人們可以在家中的任何一個生活場景下,用語音調用它,而無需特意把目光和注意力,放在任何一個設備螢幕上;這才是符合人們家庭生活場景的交互方式。
正如語音技術公司 Nuance Communication(Siri 語音技術的支持者)副總裁 Kenn Harper 所認為的那樣:
語音才是智慧家庭的未來交互介面。
而在小編看來,智慧家庭中的「智慧」,也應該指向人工智慧,而非僅僅是連接到網路那麼簡單。
Kenn Harper |
站在這個角度來看,可以說目前亞馬遜已經憑借 Alexa ,初步確立了未來智慧家庭的初步形態,也借此佔據了人工智慧的一個重要入口。
在亞馬遜推出 Echo 一年多之後,在人工智慧領域深耕多年的 Google ,也推出了一款基於自家人工智慧語音助手 Google Assistant 的智慧音箱 Google Home,從而與亞馬遜的 Echo 形成直接競爭關係。
支持 Google Home 的應用 |
另外,在 CES 2017 上,Google 也與英偉達合作,推出了內置 Google Assistant 的 Nvidia Shield 遊戲主機;而且在 CES 2017 期間,Google 也在官網上宣佈, Google Assistant 將會登陸更多的 Android TV 設備。
除了亞馬遜和 Google,蘋果的 Homekit 也在與 Siri 深度合作,試圖走向語音交互;但是有媒體認為,與亞馬遜的 Alexa 相比,Homekit 還顯得非常基礎化。另外,有傳聞稱微軟也在試圖透過 Windows 10 上的 Cortana 語音助手,來發力智慧家庭領域,推出一款名為 Homehub 的產品。
Homekit |
未來會怎麼玩?
放眼 2017 年,Alexa 和 Google Assistant 支持的第三方應用,會越來越多,內置它們的第三方設備種類,也會繼續增加;其中,亞馬遜的 Alexa 要比 Google Assistant 領先一大步。
不過有 Alexa 作為先導,再加上 Google 在開發者領域裡的號召力,Google Assistant 的應用成長速度會比較快。
未來會怎麼玩?
放眼 2017 年,Alexa 和 Google Assistant 支持的第三方應用,會越來越多,內置它們的第三方設備種類,也會繼續增加;其中,亞馬遜的 Alexa 要比 Google Assistant 領先一大步。
不過有 Alexa 作為先導,再加上 Google 在開發者領域裡的號召力,Google Assistant 的應用成長速度會比較快。
通過 Google Assistant 來試使用 Uber 打車服務
|
而在 Alexa 和 Google Assistant 的引領下,根據語音交互的人工智慧技術,將會繼續大力發展,並且與智慧家庭行業的發展更加緊密。
蘋果憑借 Homekit 已經在智慧家庭領域有所累積,但還需要對 Siri 進行技術上的提升,同時加大 Siri 的開放力度,再將 Homekit 與 Siri 深度結合起來,使 Homekit 擺脫對 iPhone 的依賴。而微軟如果要入局的話,可能會另闢蹊徑,從內置 Cortana 的家用電腦,切入到家庭場景中去,但效果還不好說。
概念圖 |
另外,在 Alexa 和 Echo 的產品形態已經被對岸中國相關公司有所跟隨的情況下,2017 年中國的智慧家庭市場,也會即時以相似的語音交互介面,和人工智慧技術跟進,但由於語音技術的門檻和第三方開發者參與意願的限制,要想取得一定的成果,可能還需要一定的時間。(真的是大言不慚!!)
另外還有一個值得關注的問題是,Alexa 和 Echo 是否會進入中國市場?在小編看來,至少在未來幾年內,可能微乎其微。究其原因,一方面是因為中英文語言差異所導致的中文語音技術處理難度加大,另一方面則是亞馬遜在中國,還未形成像在美國那樣的服務生態;此外,Alexa 所支持的眾多第三方技能具有本地化特徵,很難移植過來。
0 comments:
張貼留言