Command Palette

Search for a command to run...

4 个月前

扩展以自我为中心的视觉:EPIC-KITCHENS 数据集

Dima Damen; Hazel Doughty; Giovanni Maria Farinella; Sanja Fidler; Antonino Furnari; Evangelos Kazakos; Davide Moltisanti; Jonathan Munro; Toby Perrett; Will Price; Michael Wray

扩展以自我为中心的视觉:EPIC-KITCHENS 数据集

摘要

第一人称视角视觉因其能够提供人们与物体互动、注意力乃至意图的独特视角而日益受到关注。然而,由于缺乏足够大规模的数据集,这一具有挑战性的领域的进展相对缓慢。在本文中,我们介绍了EPIC-KITCHENS,这是一个由32名参与者在其家庭厨房环境中录制的大规模第一人称视频基准数据集。我们的视频描绘了非脚本化的日常活动:我们只是要求每位参与者每次进入厨房时开始录像。录像分别在北美洲和欧洲的4个城市进行,参与者来自10个不同的国家,因此烹饪风格非常多样。我们的数据集包含55小时的视频,共计1150万帧,并对其进行了密集标注,共包含39600个动作片段和454300个物体边界框。我们的标注方法独特之处在于让参与者在录制完成后对自己的视频进行叙述,从而反映了真实的意图,并基于这些叙述通过众包方式获取了真实标签。我们描述了物体识别、动作识别和预测挑战,并在两个测试集(已见和未见的厨房)上评估了几种基线模型。数据集和项目页面:http://epic-kitchens.github.io

基准测试

基准方法指标
action-anticipation-on-epic-kitchens-55-12SCNN
Top 1 Accuracy - Act.: 2.29
Top 1 Accuracy - Noun: 9.97
Top 1 Accuracy - Verb: 25.23
Top 5 Accuracy - Act.: 9.35
Top 5 Accuracy - Noun: 27.38
Top 5 Accuracy - Verb: 68.66
action-anticipation-on-epic-kitchens-55-1ATSN
Top 1 Accuracy - Act.: 2.39
Top 1 Accuracy - Noun: 10.41
Top 1 Accuracy - Verb: 25.30
Top 5 Accuracy - Act.: 6.63
Top 5 Accuracy - Noun: 29.50
Top 5 Accuracy - Verb: 68.32
action-anticipation-on-epic-kitchens-55-seen2SCNN
Top 1 Accuracy - Act.: 4.32
Top 1 Accuracy - Noun: 15.15
Top 1 Accuracy - Verb: 29.76
Top 5 Accuracy - Act.: 15.21
Top 5 Accuracy - Noun: 38.56
Top 5 Accuracy - Verb: 76.03
action-anticipation-on-epic-kitchens-55-seenATSN
Top 1 Accuracy - Act.: 6.00
Top 1 Accuracy - Noun: 16.22
Top 1 Accuracy - Verb: 31.81
Top 5 Accuracy - Act.: 28.21
Top 5 Accuracy - Noun: 42.15
Top 5 Accuracy - Verb: 76.56

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供