HyperAIHyperAI

Command Palette

Search for a command to run...

IBM 2016 英语会话电话语音识别系统

George Saon Tom Sercu Steven Rennie Hong-Kwang J. Kuo

摘要

我们描述了一组声学建模和语言建模技术,这些技术将我们的英语会话电话连续语音识别(LVCSR)系统的单词错误率降低到了在Hub5 2000评估测试集的Switchboard子集上的创纪录的6.6%。在声学建模方面,我们采用了三种强大的模型的得分融合:具有最大输出激活函数的循环神经网络、使用3x3卷积核的非常深的卷积神经网络以及在FMLLR和i-vector特征上运行的双向长短时记忆网络。在语言建模方面,我们使用了更新后的模型“M”和分层神经网络语言模型(Hierarchical Neural Network LMs)。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供