HyperAI超神经

语音处理

Speech技术是指通过计算机系统处理人类语音的能力,旨在实现语音识别、合成及理解。其目标是构建能够高效交互的智能系统,提升用户体验。广泛应用于虚拟助手、客服系统、语音翻译等领域,极大促进了人机交互的自然性和便捷性。

语音去混响

6 篇论文 | 5 个基准测试

口语语言识别

6 篇论文 | 12 个基准测试

语音分离

46 篇论文 | 19 个基准测试

语音提取

1 篇论文 | 1 个基准测试

带宽扩展

2 篇论文 | 6 个基准测试

口语理解

20 篇论文 | 5 个基准测试

视听语音识别

19 篇论文 | 4 个基准测试

声音转换

3 篇论文 | 3 个基准测试

文化声爆发强度预测

2 篇论文 | 1 个基准测试

对话生成

12 篇论文 | 13 个基准测试

语音增强

63 篇论文 | 14 个基准测试

关键词定位

53 篇论文 | 10 个基准测试

说话人识别

9 篇论文 | 4 个基准测试

语音合成

19 篇论文 | 5 个基准测试

远场语音识别

4 篇论文 | 2 个基准测试

声学单元发现

1 篇论文 | 1 个基准测试

声爆发类型预测

1 篇论文 | 1 个基准测试

语音识别

135 篇论文 | 148 个基准测试

说话人验证

12 篇论文 | 12 个基准测试

说话人识别

2 篇论文 | 1 个基准测试

带口音语音识别

2 篇论文 | 4 个基准测试

文本到语音合成

14 篇论文 | 6 个基准测试

故事生成

2 篇论文 | 5 个基准测试

视觉语音识别

2 篇论文 | 2 个基准测试

多模态情感识别

12 篇论文 | 7 个基准测试

唇语到语音合成

1 篇论文 | 1 个基准测试

噪声语音识别

4 篇论文 | 2 个基准测试

语音去噪

1 篇论文 | 2 个基准测试

阿拉伯语文本注音

7 篇论文 | 2 个基准测试

说话人分割

10 篇论文 | 15 个基准测试

自动歌词转录

2 篇论文 | 5 个基准测试

语音到语音翻译

5 篇论文 | 3 个基准测试

音频 Deepfake 检测

8 篇论文 | 1 个基准测试

语音命令识别

3 篇论文 | 1 个基准测试

音素级别发音评分

6 篇论文 | 1 个基准测试

自动音素识别

1 篇论文 | 6 个基准测试

自动语音识别 (ASR)

11 篇论文 | 8 个基准测试

语音情感识别

31 篇论文 | 15 个基准测试

单词级别发音评分

3 篇论文 | 1 个基准测试

A-VB 高

1 篇论文 | 1 个基准测试

语篇级别发音评分

3 篇论文 | 1 个基准测试

语音查询识别

1 篇论文 | 1 个基准测试

A-VB 文化

1 篇论文 | 1 个基准测试

A-VB 二

1 篇论文 | 1 个基准测试

语音合成 - 古吉拉特语

2 篇论文 | 2 个基准测试

语音合成 - 阿萨姆语

1 篇论文 | 1 个基准测试

语音合成 - 孟加拉语

1 篇论文 | 1 个基准测试

语音合成 - 博多语

1 篇论文 | 1 个基准测试

语音合成 - 印地语

1 篇论文 | 1 个基准测试

语音合成 - 卡纳达语

1 篇论文 | 1 个基准测试

语音合成 - 马拉雅拉姆语

1 篇论文 | 1 个基准测试

语音合成 - 曼尼普尔语

1 篇论文 | 1 个基准测试

语音合成 - 马拉地语

1 篇论文 | 1 个基准测试

语音合成 - 拉贾斯坦语

1 篇论文 | 1 个基准测试

语音合成 - 泰米尔语

1 篇论文 | 1 个基准测试

语音合成 - 泰卢固语

1 篇论文 | 1 个基准测试