Command Palette

Search for a command to run...

3 个月前

DABS:一种面向自监督学习的领域无关基准

Alex Tamkin Vincent Liu Rongfei Lu Daniel Fein Colin Schultz Noah Goodman

DABS:一种面向自监督学习的领域无关基准

摘要

自监督学习算法(如 BERT 和 SimCLR)在自然语言处理、计算机视觉和语音处理等领域取得了显著进展。然而,这些算法具有领域特定性,意味着针对每一个新应用场景(包括医疗健康、科学研究以及多模态等众多领域),都需要开发新的自监督学习方法。为推动面向通用领域的自监督学习方法的发展,我们提出了 DABS:一种面向自监督学习的领域无关基准测试(Domain-Agnostic Benchmark for Self-supervised learning)。在 DABS 上表现优异的算法,需在七个不同领域中接受评估:自然图像、多通道传感器数据、英文文本、语音记录、多语言文本、胸部X光片以及带有文本描述的图像。每个领域均提供一个无标签数据集用于预训练,随后根据模型在该领域一组有标签下游任务上的表现进行评分。此外,我们还提出了两个基准性的领域无关算法:e-Mix 和 ShED;其相对有限的性能表明,要使自监督学习真正成为适用于任意领域的即插即用解决方案,仍需取得重大突破。基准数据集及基线算法的代码已开源,可访问 https://github.com/alextamkin/dabs 获取。

代码仓库

alextamkin/dabs
官方
pytorch

基准测试

基准方法指标
self-supervised-learning-on-dabsPretraining: ShED
Images u0026 Text: 54.3
Med. Imaging: 74.5
Natural Images: 20.9
Sensors: 88.7
Speech: 36.5
Text: 48.4
self-supervised-learning-on-dabsPretraining: e-Mix
Images u0026 Text: 48.9
Med. Imaging: 72.4
Natural Images: 27.9
Sensors: 79.5
Speech: 41.8
Text: 44.1
self-supervised-learning-on-dabsPretraining: None
Images u0026 Text: 57.5
Med. Imaging: 68.1
Natural Images: 10.1
Sensors: 69.8
Speech: 24.9
Text: 42.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供