语音处理
Speech技术是指通过计算机系统处理人类语音的能力,旨在实现语音识别、合成及理解。其目标是构建能够高效交互的智能系统,提升用户体验。广泛应用于虚拟助手、客服系统、语音翻译等领域,极大促进了人机交互的自然性和便捷性。
语音去混响
6 篇论文 | 5 个基准测试
口语语言识别
6 篇论文 | 12 个基准测试
语音分离
46 篇论文 | 19 个基准测试
语音提取
1 篇论文 | 1 个基准测试
带宽扩展
2 篇论文 | 6 个基准测试
口语理解
20 篇论文 | 5 个基准测试
视听语音识别
19 篇论文 | 4 个基准测试
声音转换
3 篇论文 | 3 个基准测试
文化声爆发强度预测
2 篇论文 | 1 个基准测试
对话生成
12 篇论文 | 13 个基准测试
语音增强
63 篇论文 | 14 个基准测试
关键词定位
53 篇论文 | 10 个基准测试
说话人识别
9 篇论文 | 4 个基准测试
语音合成
19 篇论文 | 5 个基准测试
远场语音识别
4 篇论文 | 2 个基准测试
声学单元发现
1 篇论文 | 1 个基准测试
声爆发类型预测
1 篇论文 | 1 个基准测试
语音识别
135 篇论文 | 148 个基准测试
说话人验证
12 篇论文 | 12 个基准测试
说话人识别
2 篇论文 | 1 个基准测试
带口音语音识别
2 篇论文 | 4 个基准测试
文本到语音合成
14 篇论文 | 6 个基准测试
故事生成
2 篇论文 | 5 个基准测试
视觉语音识别
2 篇论文 | 2 个基准测试
多模态情感识别
12 篇论文 | 7 个基准测试
唇语到语音合成
1 篇论文 | 1 个基准测试
噪声语音识别
4 篇论文 | 2 个基准测试
语音去噪
1 篇论文 | 2 个基准测试
阿拉伯语文本注音
7 篇论文 | 2 个基准测试
说话人分割
10 篇论文 | 15 个基准测试
自动歌词转录
2 篇论文 | 5 个基准测试
语音到语音翻译
5 篇论文 | 3 个基准测试
音频 Deepfake 检测
8 篇论文 | 1 个基准测试
语音命令识别
3 篇论文 | 1 个基准测试
音素级别发音评分
6 篇论文 | 1 个基准测试
自动音素识别
1 篇论文 | 6 个基准测试
自动语音识别 (ASR)
11 篇论文 | 8 个基准测试
语音情感识别
31 篇论文 | 15 个基准测试
单词级别发音评分
3 篇论文 | 1 个基准测试
A-VB 高
1 篇论文 | 1 个基准测试
语篇级别发音评分
3 篇论文 | 1 个基准测试
语音查询识别
1 篇论文 | 1 个基准测试
A-VB 文化
1 篇论文 | 1 个基准测试
A-VB 二
1 篇论文 | 1 个基准测试
语音合成 - 古吉拉特语
2 篇论文 | 2 个基准测试
语音合成 - 阿萨姆语
1 篇论文 | 1 个基准测试
语音合成 - 孟加拉语
1 篇论文 | 1 个基准测试
语音合成 - 博多语
1 篇论文 | 1 个基准测试
语音合成 - 印地语
1 篇论文 | 1 个基准测试
语音合成 - 卡纳达语
1 篇论文 | 1 个基准测试
语音合成 - 马拉雅拉姆语
1 篇论文 | 1 个基准测试
语音合成 - 曼尼普尔语
1 篇论文 | 1 个基准测试
语音合成 - 马拉地语
1 篇论文 | 1 个基准测试
语音合成 - 拉贾斯坦语
1 篇论文 | 1 个基准测试
语音合成 - 泰米尔语
1 篇论文 | 1 个基准测试
语音合成 - 泰卢固语
1 篇论文 | 1 个基准测试