Command Palette

Search for a command to run...

3 个月前

BEVDepth:多视角三维目标检测中可靠深度信息的获取

Yinhao Li Zheng Ge Guanyi Yu Jinrong Yang Zengran Wang Yukang Shi Jianjian Sun Zeming Li

BEVDepth:多视角三维目标检测中可靠深度信息的获取

摘要

在本项研究中,我们提出了一种基于摄像头的鸟瞰图(Bird's-Eye-View, BEV)3D目标检测新方法——BEVDepth,其核心特点在于具备可信的深度估计能力。我们的工作基于一个关键观察:尽管深度信息对于基于摄像头的3D目标检测至关重要,但现有方法中的深度估计性能却出人意料地不足。为此,BEVDepth通过引入显式的深度监督机制,有效解决了该问题。同时,我们设计了具有摄像头感知能力的深度估计模块,以进一步提升深度预测的准确性。此外,为缓解因特征反投影不精确所引发的副作用,我们提出了一种新颖的深度精炼模块(Depth Refinement Module)。结合定制化的高效体素池化(Efficient Voxel Pooling)机制与多帧信息融合策略,BEVDepth在具有挑战性的nuScenes测试集上取得了60.9%的NDS(NuScenes Detection Score)新纪录,同时保持了较高的运行效率。这是首次有纯摄像头模型在nuScenes测试集上达到60%的NDS分数,标志着基于视觉的3D检测性能的重要突破。

代码仓库

megvii-basedetection/bevdepth
官方
pytorch
GitHub 中提及
ZRandomize/MatrixVT
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-object-detection-on-dair-v2x-iBEVDepth
AP|R40(easy): 75.7
AP|R40(hard): 63.7
AP|R40(moderate): 63.6
3d-object-detection-on-nuscenes-camera-onlyBEVDepth-pure
Future Frame: false
NDS: 60.9
3d-object-detection-on-rope3dBEVDepth
AP@0.7: 42.56

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供