CNTK Image Detection FastRCNN Pascal VOC 2007 Dataset
leiphone 亚峰
微軟首席語音科學家黃學東,在論文中表示,他們在近期產業標準Switchboard語音辨識基準測試中,實現詞錯率(WER)低至6.3%的這一技術突破,這比IBM達到的6.6%WER下降了0.3%,達到語音辨識領域錯誤率最低的水準。
黃學東在論文中提到
我們最好的單個系統,在 NIST 2000 Switchboard 集上取得了 6.9% 的詞錯率。我們相信這是目前單個系統,能取得的最好表現。在Switchboard 測試數據上,多個語音模型的組合,將進一步使詞錯率降至 6.3%。
微軟表示,人類大腦的生物運作原理,啓發微軟研發深層神經網路來實現這一突破。此外,他們還提及計算網路工具包(CNTK)的深層學習算法,對這次技術突破的影響,以及GPU集群為這個進步所做的貢獻。
微軟指出,相比於以往,現在Cortana可以在相同的時間內,吸收十倍以上的語音數據。
微軟的語音辨識技術已較為成熟,在不斷突破語音辨識基礎技術的前提下,其繼續提升以語音辨識技術為基礎的各種應用服務,包括Cortana以及Skype翻譯等,使得人與機器可以更自然地交互。
沒有留言:
張貼留言