HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
SOTA
语音处理

语音处理

Speech技术是指通过计算机系统处理人类语音的能力，旨在实现语音识别、合成及理解。其目标是构建能够高效交互的智能系统，提升用户体验。广泛应用于虚拟助手、客服系统、语音翻译等领域，极大促进了人机交互的自然性和便捷性。

语音识别

136 篇论文 | 148 个基准测试

语音分离

47 篇论文 | 19 个基准测试

说话人分割

10 篇论文 | 15 个基准测试

语音情感识别

31 篇论文 | 15 个基准测试

语音增强

64 篇论文 | 14 个基准测试

对话生成

12 篇论文 | 13 个基准测试

说话人验证

12 篇论文 | 12 个基准测试

口语语言识别

6 篇论文 | 12 个基准测试

关键词定位

53 篇论文 | 10 个基准测试

自动语音识别 (ASR)

11 篇论文 | 8 个基准测试

多模态情感识别

12 篇论文 | 7 个基准测试

自动音素识别

1 篇论文 | 6 个基准测试

带宽扩展

2 篇论文 | 6 个基准测试

文本到语音合成

15 篇论文 | 6 个基准测试

自动歌词转录

2 篇论文 | 5 个基准测试

语音去混响

6 篇论文 | 5 个基准测试

语音合成

19 篇论文 | 5 个基准测试

口语理解

20 篇论文 | 5 个基准测试

故事生成

2 篇论文 | 5 个基准测试

带口音语音识别

2 篇论文 | 4 个基准测试

视听语音识别

19 篇论文 | 4 个基准测试

说话人识别

9 篇论文 | 4 个基准测试

语音到语音翻译

5 篇论文 | 3 个基准测试

声音转换

3 篇论文 | 3 个基准测试

阿拉伯语文本注音

7 篇论文 | 2 个基准测试

远场语音识别

5 篇论文 | 2 个基准测试

噪声语音识别

5 篇论文 | 2 个基准测试

语音去噪

1 篇论文 | 2 个基准测试

语音合成 - 古吉拉特语

2 篇论文 | 2 个基准测试

视觉语音识别

2 篇论文 | 2 个基准测试

A-VB 文化

1 篇论文 | 1 个基准测试

A-VB 高

1 篇论文 | 1 个基准测试

A-VB 二

1 篇论文 | 1 个基准测试

声学单元发现

1 篇论文 | 1 个基准测试

音频 Deepfake 检测

8 篇论文 | 1 个基准测试

文化声爆发强度预测

2 篇论文 | 1 个基准测试

唇语到语音合成

1 篇论文 | 1 个基准测试

音素级别发音评分

6 篇论文 | 1 个基准测试

说话人识别

2 篇论文 | 1 个基准测试

语音提取

1 篇论文 | 1 个基准测试

语音合成 - 阿萨姆语

1 篇论文 | 1 个基准测试

语音合成 - 孟加拉语

1 篇论文 | 1 个基准测试

语音合成 - 博多语

1 篇论文 | 1 个基准测试

语音合成 - 印地语

1 篇论文 | 1 个基准测试

语音合成 - 卡纳达语

1 篇论文 | 1 个基准测试

语音合成 - 马拉雅拉姆语

1 篇论文 | 1 个基准测试

语音合成 - 曼尼普尔语

1 篇论文 | 1 个基准测试

语音合成 - 马拉地语

1 篇论文 | 1 个基准测试

语音合成 - 拉贾斯坦语

1 篇论文 | 1 个基准测试

语音合成 - 泰米尔语

1 篇论文 | 1 个基准测试

语音合成 - 泰卢固语

1 篇论文 | 1 个基准测试

语音命令识别

3 篇论文 | 1 个基准测试

声爆发类型预测

1 篇论文 | 1 个基准测试

语篇级别发音评分

3 篇论文 | 1 个基准测试

语音查询识别

1 篇论文 | 1 个基准测试

单词级别发音评分

3 篇论文 | 1 个基准测试

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
SOTA
语音处理

语音处理

Speech技术是指通过计算机系统处理人类语音的能力，旨在实现语音识别、合成及理解。其目标是构建能够高效交互的智能系统，提升用户体验。广泛应用于虚拟助手、客服系统、语音翻译等领域，极大促进了人机交互的自然性和便捷性。

语音识别

136 篇论文 | 148 个基准测试

语音分离

47 篇论文 | 19 个基准测试

说话人分割

10 篇论文 | 15 个基准测试

语音情感识别

31 篇论文 | 15 个基准测试

语音增强

64 篇论文 | 14 个基准测试

对话生成

12 篇论文 | 13 个基准测试

说话人验证

12 篇论文 | 12 个基准测试

口语语言识别

6 篇论文 | 12 个基准测试

关键词定位

53 篇论文 | 10 个基准测试

自动语音识别 (ASR)

11 篇论文 | 8 个基准测试

多模态情感识别

12 篇论文 | 7 个基准测试

自动音素识别

1 篇论文 | 6 个基准测试

带宽扩展

2 篇论文 | 6 个基准测试

文本到语音合成

15 篇论文 | 6 个基准测试

自动歌词转录

2 篇论文 | 5 个基准测试

语音去混响

6 篇论文 | 5 个基准测试

语音合成

19 篇论文 | 5 个基准测试

口语理解

20 篇论文 | 5 个基准测试

故事生成

2 篇论文 | 5 个基准测试

带口音语音识别

2 篇论文 | 4 个基准测试

视听语音识别

19 篇论文 | 4 个基准测试

说话人识别

9 篇论文 | 4 个基准测试

语音到语音翻译

5 篇论文 | 3 个基准测试

声音转换

3 篇论文 | 3 个基准测试

阿拉伯语文本注音

7 篇论文 | 2 个基准测试

远场语音识别

5 篇论文 | 2 个基准测试

噪声语音识别

5 篇论文 | 2 个基准测试

语音去噪

1 篇论文 | 2 个基准测试

语音合成 - 古吉拉特语

2 篇论文 | 2 个基准测试

视觉语音识别

2 篇论文 | 2 个基准测试

A-VB 文化

1 篇论文 | 1 个基准测试

A-VB 高

1 篇论文 | 1 个基准测试

A-VB 二

1 篇论文 | 1 个基准测试

声学单元发现

1 篇论文 | 1 个基准测试

音频 Deepfake 检测

8 篇论文 | 1 个基准测试

文化声爆发强度预测

2 篇论文 | 1 个基准测试

唇语到语音合成

1 篇论文 | 1 个基准测试

音素级别发音评分

6 篇论文 | 1 个基准测试

说话人识别

2 篇论文 | 1 个基准测试

语音提取

1 篇论文 | 1 个基准测试

语音合成 - 阿萨姆语

1 篇论文 | 1 个基准测试

语音合成 - 孟加拉语

1 篇论文 | 1 个基准测试

语音合成 - 博多语

1 篇论文 | 1 个基准测试

语音合成 - 印地语

1 篇论文 | 1 个基准测试

语音合成 - 卡纳达语

1 篇论文 | 1 个基准测试

语音合成 - 马拉雅拉姆语

1 篇论文 | 1 个基准测试

语音合成 - 曼尼普尔语

1 篇论文 | 1 个基准测试

语音合成 - 马拉地语

1 篇论文 | 1 个基准测试

语音合成 - 拉贾斯坦语

1 篇论文 | 1 个基准测试

语音合成 - 泰米尔语

1 篇论文 | 1 个基准测试

语音合成 - 泰卢固语

1 篇论文 | 1 个基准测试

语音命令识别

3 篇论文 | 1 个基准测试

声爆发类型预测

1 篇论文 | 1 个基准测试

语篇级别发音评分

3 篇论文 | 1 个基准测试

语音查询识别

1 篇论文 | 1 个基准测试

单词级别发音评分

3 篇论文 | 1 个基准测试

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

语音处理 - SOTA | HyperAI超神经