Command Palette
Search for a command to run...
Chen Sun; Manohar Paluri; Ronan Collobert; Ram Nevatia; Lubomir Bourdev

摘要
本文旨在准确高效地对物体进行分类和定位,而无需使用边界框注释。这一目标具有挑战性,因为自然环境中的物体可能出现在任意位置,并且以不同的尺度出现。在本文中,我们提出了一种基于卷积神经网络的新型分类架构——ProNet。该架构利用计算效率高的神经网络来提议可能包含物体的图像区域,并在这些提议的区域上应用更为强大但速度较慢的网络。其基本构建模块是一个多尺度全卷积网络,该网络为不同位置和尺度的框分配物体置信度分数。我们展示了这种网络可以使用图像级别的注释有效训练,并且可以连接成级联或树状结构以实现高效的物体分类。实验结果表明,ProNet在PASCAL VOC 2012和MS COCO数据集上的物体分类和基于点的定位任务中显著优于以往的最先进方法。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| weakly-supervised-object-detection-on-coco | ProNet | MAP: 43.5 |