ifanr 陳一斌
最近幾年,科幻電影不斷推陳出新,展現了未來眾多可能的情景,而它們在電影中提出如何運用科技的方式,也給硬體創業者諸多想像。從湯姆·漢克斯的《少數派報告》,到小羅伯特·唐尼的《鋼鐵人 3》,再到斯嘉麗·詹森的《Her》,你會發現語音交互的比例越來越高。
《少數派報告》的場景雖然科幻,然而需要人不斷抬起手滑動來滑動去的方式,其實很累;《鋼鐵人 3》中,鋼鐵人主要用語音來下命令,而用手勢進行細微的操作;至於《Her》,語音佔據交互的整體部分,手機則是用於展示圖片、影像,用於定位和拍照。
最近我接觸不少硬體創業者,相當有趣的是,他們對語音的興趣越來越高。經過瞭解則發現,他們的觀點是這樣的:在交互上,越不花費人精力的方式,會越好。所以比起手勢,會更加看好聲音在交互上的作用,畢竟語音交互只需要人動動嘴皮子而已。
但是,若讓創業團隊自己從頭做一個語音辨識功能,費錢費力不說,效果是不是達到預期也是未知數。MIT Technology Review 最近報導了國外一個創業項目 Wit.ai,則是希望能夠為硬體創業者提供一個語音命令的框架,讓後者的產品當中,輕易集成語音控制的功能。
公司創始人 Alex Lebrun 此前創立另外一家公司叫
VirtuOz,為 eBay 和 AT&T 開發類似 Siri 一樣的聲控軟體。因此有相關的技術背景。
Wit.ai 稱開發者只需要 3 步,即可把語音辨識功能集成到產品裡。第一步,上傳設定自己需要的語音命令,第二部,調用 Wit.ai 的 API,輸入音訊得到結果,第三步,讓 WIt.ai 進行學習,並改進辨識精度。——換言之,語音會發送到 Wit.ai 的伺服器,然後伺服器向應用返回結構化的資料。
對於 Wit.ai 來說,其實做到語音辨識不難,但難在如何讓各個平台的開發者,都能利用到 Wit.ai 的 API 介面。實際上,Wit.ai 做了不少準備,查看開發文檔可知道,它已經相容 Web、iOS、Android、Node.js、Raspberry Pi、Ruby、Python、C 和 Rust 等不同的版本。
滑鐵盧大學的學生 Nick Mostowich 上個月參加了校內駭客馬拉松,他以及團隊成員利用 Wit.ai 為他智慧微波爐產品添加語音控制功能。他說,他們很快就添加了一系列和食譜有關的指令,這樣使用者在說“給我做點培根”,然後微波爐就會啟動,然後設定好合適的火力和時間。
0 comments:
張貼留言