cookieOptions = {...}; .微軟語音辨識又一里程碑,錯誤率為行業最低 - 3S Market「全球智慧科技應用」市場資訊網

3S MARKET

3S MARKET
2017年7月7日 星期五

CNTK Image Detection FastRCNN Pascal VOC 2007 Dataset

leiphone 亚峰


微软语音识别又一里程碑,错误率为行业最低

微軟首席語音科學家黃學東,在論文中表示,他們在近期產業標準Switchboard語音辨識基準測試中,實現詞錯率(WER)低至6.3%的這一技術突破,這比IBM達到的6.6%WER下降了0.3%,達到語音辨識領域錯誤率最低的水準。

黃學東在論文中提到

我們最好的單個系統,在 NIST 2000 Switchboard 集上取得了 6.9% 的詞錯率。我們相信這是目前單個系統,能取得的最好表現。在Switchboard 測試數據上,多個語音模型的組合,將進一步使詞錯率降至 6.3%。


微軟表示,人類大腦的生物運作原理,啓發微軟研發深層神經網路來實現這一突破。此外,他們還提及計算網路工具包(CNTK)的深層學習算法,對這次技術突破的影響,以及GPU集群為這個進步所做的貢獻。


微軟指出,相比於以往,現在Cortana可以在相同的時間內,吸收十倍以上的語音數據。


微軟的語音辨識技術已較為成熟,在不斷突破語音辨識基礎技術的前提下,其繼續提升以語音辨識技術為基礎的各種應用服務,包括Cortana以及Skype翻譯等,使得人與機器可以更自然地交互。

                                                                                                                                                                                                                 


0 comments: