2017年9月20日星期三

‧ 2017\09\20\3S Market Daily 智慧產業新聞

3S Market deliver Smart and Valuable information for Business

3S Market 傳遞智慧應用與價值的商業資訊

台灣宗教與歷史

今日主題智慧建築與家居\可穿戴產品 \智慧醫護\智慧科技生活創新應用
智慧科技生活創新應用	．語音辨識的前世今生：深度學習徹底改變對話式人工智慧
	．如何打造完美產品？賈伯斯的秘訣只有一句話 \| iPhone 的進化論
	．看你打盤超級瑪利歐，人家做 AI
	．想要 iPhone 8 懸浮著充電? 看看這款磁懸浮底座
	．改姓亞馬遜之後，全食超市降價了，客流量也大漲 25%

AKD 零售櫃檯專用監視攝影機

智慧建築與智慧家庭	．一個機器人就能建一座大廈，建築業迎來了顛覆行業的時機
	．宜家要在倫敦舉辦快閃活動，關注設計創新與城市化

智慧醫護長照	．科技大廠整合人工智慧，決戰智慧醫院
	．智慧食品包裝袋:可判斷其內食品是否變質

可穿戴產品＆ AR\VR	．今年全球可穿戴設備銷量將成長 17% 至 3.1億

開始保護您家裡與您的摯愛親人

結合物聯網產業人才，共同創造全球物聯網產業合作契機。

按此回今日3S Market新聞首頁

迎接雲端超融合來臨，10G混合式交換器全面支援雲端超融合基礎架構

．語音辨識的前世今生：深度學習徹底改變對話式人工智慧

Amazon Echo Alexa's voice recognition skills tested

愛瑪麗歐是智慧攝影機器人的全球先驅

來源：科技行者

「語音辨識」的終極夢想，是真正能夠理解人類語言，甚至是方言環境的系統。但幾十年來，人們並沒有一個有效的策略，來創建這樣一個系統，直到人工智慧技術的爆發。

在過去幾年中，人們在人工智慧和深度學習領域的突破，讓語音辨識的探索跨了一大步。市面上玲琅滿目的產品，也反映了這種飛躍式發展，例如亞馬遜Echo、蘋果Siri 等等。本文將回顧語音辨識技術領域的最新進展，研究促進其迅猛發展進程的元素，並探討其未來，以及我們距離可以完全解決這個問題，還有多遠。

背景：人機交互

多年來，理解人類一直都是人工智慧的最重要任務之一。人們不僅希望機器能夠理解他們在說些什麼，還希望它們能夠理解他們所要表達的意思，並基於這些資訊採取特定的行動。而這一目標正是對話式人工智慧（AI）的精髓。

對話式AI包含有兩個主要類別：人機介面，以及人與人溝通的介面。在人機介面中，人類與機器往往透過語音或文本交互，屆時機器會理解人類（儘管這種理解方式是有限的）並採取相應的一些措施。圖1表明，這台機器可以是一個私人助理（ Siri、Alexa之類的產品）或某種聊天機器人。

圖1：人機交互AI

在人與人之間的互動中，人工智慧會在兩個或兩個以上，進行會話、互動或提出見解的人類用戶之間，構建一座橋梁（參見圖2 ）。例如，一個AI在聽取電話會議後，能夠創立出一段簡要的電話記錄摘要，並跟進相關人員。

圖2：人與人之間互動的人工智慧

對話式AI背後：機器感知與機器辨識

為了理解對話式AI背後的挑戰與技術，我們必須研究人工智慧的基本概念：機器感知與機器辨識。

機器感知是指機器能夠採用，類似於人類自己憑感覺，感知周圍世界，來分析數據的能力；換句話說，其本質上就是為機器賦予人類的感知能力。

近來很多的人工智慧算法，都需要使用電腦攝影機，如目標檢測和辨識，都歸屬於機器感知範疇——主要涉及視覺處理。語音辨識和分析，則是那些利用聽覺的機器感知技術。

機器辨識是在機器感知，所生成的元數據之上的推理運算。機器辨識包括決策制訂、專家系統、行動執行，以及用戶的意圖等方面。一般情況下，如果沒有機器辨識，對AI的感知系統不會產生任何影響，而機器感知會提供適當的元數據資訊，來令其做出決策與執行行動。

在對話式AI中，機器感知包括所有的語音分析技術，如辨識和性能分析；機器辨識則包括所有與語言理解能力相關的技術，而這也是自然語言處理（ NLP ）的一部分。

語音辨識的發展

語音辨識的研究和發展情況基本分為三個主要時期：

2011年之前

人們對語音辨識的活躍研究，已經進行了幾十年，而事實上，即使是在二十世紀50年代和60年代，人們也一直在試圖構建語音辨識系統。然而，在2011年以及深度學習、大數據和雲計算出現以前，這些解決方案還遠遠不足以被大規模採用，以及商業使用。從本質上來說，其算法還不夠好，當時也沒有足夠的數據可以用於算法的訓練，而且無法進行高性能電腦，也阻礙了研究人員運行更複雜的實驗。

2011年-2014年

深度學習產生的第一個重大影響發生在2011年，當時有一個研究小組，一同創造了第一個基於深度學習的語音辨識系統，而這個研究小組成員包括來自微軟的研究人員、李登（Li Deng）、董玉（Dong Yu）和亞歷克斯·阿賽羅（Alex Acero），以及傑弗里·希爾頓（Geoffrey Hinton）和他的學生喬治·達爾（George Dahl）。

效果很即時：其相對錯誤率降低了25%以上。而這個系統也是深度學習領域進行大規模發展和改進的切入點。

此後，在有了更多數據、雲計算可用後，蘋果（Siri）、亞馬遜（Alexa）和谷歌這類的大公司，均採用了深度學習技術，而且對其產品性能有著顯著的改善，並將其產品發佈到了市場上。

2015至今

在2014年底，遞歸神經網路獲得了更多的關注。與此同時，遞歸神經網路與注意力模型、記憶網路，以及其他技術一起，掀起了這個領域發展的第三次浪潮。

如今，幾乎每一種算法或者解決方案，都採用了某種類型的神經模型，而且實際上，幾乎所有的關於語音的研究，都已轉向深度學習。

語音辨識領域，神經模型的最新進展

過去六年中，語音辨識在此前，40多年的基礎上，創造了更多的突破。這種非凡的新進展，主要歸功於神經網路。要理解深度學習所帶來的影響，以及它所扮演的角色，我們首先需要理解語音辨識是如何工作的。

儘管近50年來語音辨識，一直屬於熱門研究領域，然而構建能夠理解人類語言的，及其仍舊是人工智慧最具挑戰性的問題之一，要實現這一目標非常困難。

語音辨識由不少明確的任務組成：給出某種制訂的人類語言，然後嘗試將其語音轉換成文字。然而，機器所辨識的語音中可能包括一部分噪音，所以就要求其能夠從噪聲中，提取出與對話相關的部分，並將其轉換成有意義的文字。

語音辨識系統的基本構造塊

語音辨識基本分為三個主要部分：

信號位準：信號位準的目的是提取語音信號，並增強信號（如果有必要的話），或是進行適當的預處理、清理和特徵提取。這非常類似於每一項機器學習任務，換句話說，如果給定一些數據，我們需要做適當的數據預處理和特徵提取。

噪音位準：噪音位準的目的在於將不同的特徵，劃分成不同的聲音。換句話說，聲音本身並不能提供出一個足夠精確的標準，而有時我們將次於原聲的聲音稱為聲學標準。

語言位準：因為我們假設這些聲音都是人類所產生，而且是有意義的，因此我們可以把這些聲音組合成詞語，然後把這些詞語組合成句子。在語言位準中，這些技術通常屬於不同類型的NLP技術。

基於深度學習的改進

深入學習對語音辨識領域產生了巨大的影響。其影響非常深遠，即使在今天，幾乎每一個語音辨識領域的解決方案，都可能包含有一個或多個，基於神經模型的嵌入算法。

通常而言，人們對語音辨識系統的評價，都基於一個名為配電盤（SWBD）的行業標準。SWBD是一個語音語料庫，整合了電話中的即興對話，包含音頻和人聲的副本。

語音辨識系統的評估標準，主要基於其誤字率（WER），誤字率是指語音辨識系統，辨別錯誤的單詞有多少。圖3展示了從2008年到2017的誤字率改進情況。

圖3：誤字率改進情況

從2008年到2011年，誤字率一直都處於一個穩定的狀態，位於23%至24%之間；而深度學習從2011年開始出現時起，誤字率從23.6%降低至5.5%。這一重大發展對語音辨識開發而言，是一種變革，其誤字率的改進相對提高了近77%。

誤字率的改善也產生了廣泛應用，例如蘋果Siri、亞馬遜 Alexa、微軟 Cortana 和 Google Now，這些應用也可以透過語音辨識啟動各種家居，如亞馬遜Echo 和 Google Home。

秘密武器

那麼，系統產生如此大幅度改善的原因是什麼呢？是不是有什麼技術可以使得誤字率從23.6%減少到了5.5%呢？遺憾的是，並沒有其他單獨的技術、方法。

然而，深入學習和語音辨識息息相關，構造出了一個，可以涉及各種不同技術和方法的先進系統。

例如，在信號位準中，有著不同的基於神經模型，從信號中提取和增強語音本身的技術（圖4）。同時，還有能夠用更加複雜高效的，基於神經模型的方法，取代經典特徵提取方法的技術。

圖4：信號位準的分析

聲音和語言位準中，也包含有各種各樣不同的深度學習技術，無論是聲音等級分類，還是語言等級分類，都採用了不同類型，基於神經模型的架構（見圖5）。

圖5：聲音和語言位準分析

總而言之，建立一個先進的系統並不是一項容易的工作，而實現將所有涉及的這些不同技術，整合為一個系統的過程也不輕鬆。

先進研究

近來在語音辨識領域有這麼多的突破，那麼我們自然要問，語音識別接下來的突破口在哪？未來聚焦的研究點，或將從以下三個主要領域展開：算法、數據和可擴展性。

算法

隨著亞馬遜Echo 與 Google Home 的成功，許多公司正在發佈能夠辨識理解語音的智慧喇八揚聲器和家庭設備。然而，這些設備的推出又帶來了一個新問題：用戶說話時往往距離麥克風不是很近，例如用戶用手機對話時的狀態。

而處理遠距離語音辨識又是一個具有挑戰性的問題，很多研究小組也正在積極研究這個問題。如今，創新的深度學習和信號處理技術，已經可以提高語音辨識的品質了。

數據

語音辨識系統的關鍵問題之一，是缺乏現實生活的數據。例如，很難獲得高品質的遠端通話數據。但是，有很多來自其他來源的數據可用。一個問題是：我們可以創建合適的合成器，來生成訓練用的數據嗎？今天，生成合成數據並訓練系統正在受到重視。

為了訓練語音辨識別系統，我們需要同時具備音頻和轉錄的數據集。人工轉錄是繁瑣的工作，有時會導致大量音頻的問題。因此，就有了對半監督培訓的積極研究，並為辨識者建立了適當程度的信心。

由於深度學習與語音辨識相結合，因此對CPU和內存的佔用量不容小覷。隨著用戶大量採用語音辨識系統，構建經濟高效的雲解決方案，是一個具有挑戰性的重要問題。

對如何降低計算成本，並開發更有效的解決方案的研究，一直在進行。今天，大多數語音辨識系統都是基於雲的，並且具有必須解決的兩個具體問題：延遲和持續連接。

延遲是需要立即響應的設備（如機器人）的關鍵問題。在長時間監聽的系統中，由於頻寬成本，持續連接是一個問題。因此，還需要對邊緣語音辨識的研究，它必須保持基於雲的系統的質量。

解決語音辨識問題

近年來，語音辨識的表現和應用，出現了巨大的飛躍。我們離完全解決這個問題還有多遠？答案也許五年、也許十年，但仍然有一些挑戰性的問題需要時間來解決。

第一個問題是對噪音的敏感性問題。一個語音辨識系統在非常接近麥克風，而且不嘈雜的環境中運行得很好——然而，如果說話的聲音比較遠，或者環境很嘈雜能迅速降低系統的效能。

第二個必須解決的問題是語言擴展：世界上大約有7000種語言，絕大多數語音辨識系統能夠支持的語言數量，大約是八十種。擴展系統帶來了巨大的挑戰。

此外，我們缺少許多語言的數據，而且匱乏數據資源，則難以創建語音辨識系統。

結論

深度學習在語音辨識和對話式AI領域，刻下了深深的印記。而鑒於該技術最近獲得的突破，我們真的正處於一場革命的邊緣。

而最大的問題在於，我們是否準備贏得語音辨識領域的技術挑戰，並像其他商品化技術一樣，開始運用它呢？或者說，是否還有另一個新的解決方案，正等待著我們去發現？畢竟，語音辨識的最新進展，只是未來科技藍圖的一小塊：語言理解本身就是一個複雜，而且或許更加強大的一個領域。

開始保護您家裡與您的摯愛親人

結合物聯網產業人才，共同創造全球物聯網產業合作契機。

按此回今日3S Market新聞首頁

迎接雲端超融合來臨，10G混合式交換器全面支援雲端超融合基礎架構

．一個機器人就能建一座大廈，建築業迎來了顛覆行業的時機

MIT Media Lab Digital Construction Platform (DCP) - architectural robotic 3D printing

單一app 讓您在行動中也享有最完整的保全、安全、影像、照護的服務。

leiphone：晞萌

按：之前，MIT媒體實驗室在《Science Robotics》上發表了一篇關於數位建築平台（DCP）的論文，文中提到的DCP是一台自動化的建築系統，能建造即時訂制的大型建築結構。本文來源於IEEE spectrum，作者Evan Ackerman，雷鋒網編譯。

「當我還生活在矽谷時，認為建築業已經迎來了顛覆行業的時機。」

MIT媒體實驗室最近發表在《Science Robotics》的論文應驗了此觀點，論文指出「依賴於傳統製造技術的建築是危險的，緩慢且高耗能。」如此來說，建築聽起來就像是機器人的工作。」

MIT媒體實驗室的這篇論文，介紹了數位建築平台（DCP），是一台自動化的建築系統，能建造即時訂製的大型建築結構。換言之，數位建築平台（DCP）使用一個機器人手臂，運用輔助性的建築技術，安全並快速地修建可重構的大型建築。

近年來出現了一些有趣的機器人，使用輔助性的建築技術來建造小型建築，甚至建造機器人本身。雖然大型機器人建設也是一個積極研究的領域，但一直沒有相關的概念或原型出現。

此前，在建築業出現了砌磚機器人，起重機架式的機器人，它們可以3D列印混凝土建築，甚至透過不停運磚來建造牆壁。

在這些建築解決方案中，最實際的可能就是起重機架式的機器人，但其最大的缺點是，此類機器人只有在人工設置機器位置，並預調出待建建築物的情況下，才能發揮最大功效。

（source： Science Robotics）

MIT的數位化建設平台（DCP）則與這些機器人有所不同，它是一台獨立的移動式設備（最高速度為0.5m/s），由太陽能電池供電（設備上有幾個太陽能電池板），所以只要有陽光，它可以永遠運行。DCP擁有3D建築列印機的功能：手臂很長，最大可列印2,786立方米。

機器人本身由兩只手臂製成：長手臂自由度為4，負責所有大型動作；另外一個小巧的手臂，自由度為6，如人手一般做精細動作。此系統成本達到了244500美元。

DCP的建造技術很直接：在小臂的末端有一個噴霧器，將兩種化學品組合成液體聚氨酯泡沫，能迅速膨脹和硬化。你可以編程命令DCP列印你喜歡的任何東西。在上面的影片演示中，它以每小時1.728立方米的速度，列印了一個14.6米寬，3.7米高的半球形開放式圓頂。

DCP用泡沫塑造一個混凝土框架：兩個泡沫牆，其中一面牆嵌在另一面的內壁，中間有一個空間，放入管件和電器設備，澆入混凝土，使其成為更永久和彈性的結構（或者用灰塵或其他任何東西填補它們）。

此後，保留泡沫外層可以增加建築物的絕緣性質。但即使此建築只有泡沫沒有混凝土，結構仍然非常穩固，足夠承受一個成年人在上面蹦跳。

（source： Science Robotics）

因為泡沫能快速乾燥，所以它能快速形成一個圓頂形狀，連續層不必直接接觸到頂部。它甚至可以旋轉90度，形成一個平屋頂，或者是無需支撐的架台和長凳。

另外，研究人員做過實驗，當此建築需要額外的支撐時，機器能夠自動焊成固定形狀的鏈條，將螺紋鋼和鏈條嵌入，概念如下圖所示：

（source： Science Robotics）

實現按需建造的功能有兩項必要條件：電力和建築材料。電力是一個難點，儘管不存在真正的技術障礙（添加太陽能電池板能保持機器人啓動和運行）。

建築材料更是一個挑戰，因為從頭開始噴塗泡沫使其定型很困難，但幸好噴霧泡沫不是唯一能用的建築材料（但它可能是最適合的材料）。研究人員還成功地應用了電燒結玻璃粉（electro-sintered powdered glass），熱沈積冰，含礫石和乾草纖維的壓縮土，所有這些材料都能成為有效的建築材料，且能批量使用。

（source： Science Robotics）

這是一個非常有趣的想法，只要能提供太陽能和原材料，這些機器就人可以快速，低成本地，自動地構建建築，通常這三個特徵很難兼得。

研究人員已經想到了幾種應用情景，包括在極地環境中製造冰結構，在沙漠中製造分形結構，將其沈入海洋，為珊瑚礁提供棲息地。

（source： Science Robotics）

這一點使得此類機器人更有價值，尤其是發生在自然災害或難民危機時，此時需要在低基礎設施領域，迅速而低成本地建造大量住房。

此類機器人能否比其他快速建造的解決方案更實用，還有待觀察，與許多機器人應用一樣，人工建造仍然是最便宜，和最有效的方式。

via spectrum.ieee

康橋科技 —— 白光攝影機專業廠商！

按此回今日3S Market新聞首頁

迎接雲端超融合來臨，10G混合式交換器全面支援雲端超融合基礎架構

．科技大廠整合人工智慧，決戰智慧醫院

Smart Hospitals Presentation

一鍵即可獲得幫助

來源：stpi.narl 作者：May

科技大廠整合AI決戰智慧醫院

隨著資通訊技術(ICT)成熟，及AI人工智慧技術的崛起，尤其看好AI在數位醫療健康領域應用中，扮演樞紐角色，應用於預防醫學、數位醫療，及精準醫療等三大領域。

AI技術會在短時間內，處理與分析大量臨床數據訊息，並進一步協助醫師進行判斷、分類與處理，以增加臨床反應時間，與協助病患照護的精確度。

亞太地區成為接受AI技術的重要早期進入者

據IDC Health Insights最近發佈了，亞太地區AI和認知計算應用報告，顯示亞太地區的醫院，將是醫療保健AI認知技術，及實踐(不包括日本)的最佳地區，包括醫院、生命科學/醫療器械/醫療保險公司在內的醫療保健市場，將成為該地區接受AI技術的重要早期進入者之一。

IDC指出：醫院不僅將自動化或準確使用AI / Cognitive認知科學技術。由於，新興解決方案已經幫助醫院利用深度學習改進醫學圖像診斷，並允許以最少的人力，投入進行大規模的診斷工作。未來十年的AI /認知解決方案，將著眼於加強決策，並為臨床醫生提供臨床驗證的決策信心，成為幫助改善疾病的工具。

預估在未來2-3年，醫院將先從簡單的自動化試驗，開始投資深度學習算法，並從個人診療和醫院蒐集的數據，呈現健康的成長，非結構化數據集中管理及分析，產生有效的洞察力資訊管理系統。

IDC也認為，基於醫院(醫師，護理人員)及病患的需求，對診病進行不同項目的AI投資，私立醫院會將資金投注於腫瘤科學、神經病學，建立臨床決策支持系統，而小型或者公立醫院則會建立病患的數據，運用手中數據開始佈局醫療自動化相關領域。

亞太地區，除了大型私人連鎖醫院之外，大多數醫院仍在評估大規模解決方案，首先很重要的是開始一系列，內部個別流程工作。對於許多醫院，這些內部工作的關鍵流程投入，是要改善醫護、醫院管理者，及病患等相關利益者，同時對未來更大規模投資的投資報酬率的重要性，都要更近一步的瞭解。

華碩投資旗下醫揚轉進智慧醫院

華碩轉投資「醫揚」進入智慧醫院。醫揚屬於華碩集團成員之一，整合母公司的工業電腦及行動裝置的優勢，攻入行動醫療設備、輔具及智慧醫院系統，具備優異軟硬體整合能力，從事研發、製造、行銷能力的醫療設備解決方案廠商，主要以自有品牌ONYX在各地行銷。

同時，「醫揚」也為國際醫療設備大廠、醫療軟體公司代工，今年營收佔比中，自有品牌與ODM/OEM比重各半。醫揚佈局歐美較早，歐洲市場約佔營收比六成、美洲市場三成，亞太市場則佔一成。

醫揚的智慧行動醫護平台，可用於遠端醫療及臨床管理應用，優化繁瑣的工作流程與減少錯誤機率，獲得海內外醫院陸續採用，成為未來重要成長動能，將帶動明年逾15%的業績成長：

先前與楊梅怡仁醫院合作智慧醫院項目，導入美國智慧醫院概念，現階段正與南部某大型醫療院所集團，洽談智慧醫院項目，並應用在長照服務，未來相關業務進展有望直線加速。

美國北肯薩斯市立醫院，成功導入醫揚自主研發的智慧行動醫護平台，該系統可即時透過院內私有雲，安全存取電子健康紀錄(EHR)來查閱病歷、記錄患者用藥情況，大幅改善護理效率。將護理推車上的電腦，可協助護理人員管控藥品，達到100%的用藥正確。

在內建的遠端照護模組，使病患與護理人員即時溝通用藥訊息，同時還能安全管理患者數據，並達到護理人員快速交班，未來可進一步地串連居家長照服務。

宏碁協助彰基導入智慧健康平台aBeing Wellness

宏碁投入資源成立AI團隊。宏碁攜手彰化基督教醫院，打造遠端雲端健康照護服務，推動智慧醫療再升級。

導入宏碁智慧健康平台aBeing Wellness，為慢性病患者提供長期追蹤管理的雲端照護服務，受照顧者可使用血壓計、血糖機與智慧穿戴等量測裝置，檢測自己的生理量測數值，持續記錄並觀察監測。

未來雙方將在智慧醫療領域上持續合作，開發更多人工智慧和大數據相關應用，讓雲端服務將醫療的範疇，擴大至智能照護、醫療產品以及個人健康管理，達到預防、診斷、治療與追蹤的全面性健康管理服務。

結語

由於，醫療照護產業具有高毛利、高附加價值及強烈需求等特性，即使目前相關監管法規尚未完全明朗，也已吸引國際通訊科技大廠投入，尤其成為PC及手機業者轉型的處女地，包含：IBM、Google、Microsoft等科技巨頭、阿里巴巴及百度等互聯網業者，更是我們PC業者轉型的新藍海，紛紛投入相當大量的應用研發，為的就是希望未來能在AI醫療應用領域中，佔有一席之地。

開始保護您家裡與您的摯愛親人

結合物聯網產業人才，共同創造全球物聯網產業合作契機。

按此回今日3S Market新聞首頁

迎接雲端超融合來臨，10G混合式交換器全面支援雲端超融合基礎架構

2017年9月20日 星期三

‧ 2017\09\20\3S Market Daily 智慧產業新聞

台灣宗教與歷史

．語音辨識的前世今生：深度學習徹底改變對話式人工智慧

Amazon Echo Alexa's voice recognition skills tested

．一個機器人就能建一座大廈，建築業迎來了顛覆行業的時機

．科技大廠整合人工智慧，決戰智慧醫院

Smart Hospitals Presentation

2017年9月20日星期三