Command Palette
Search for a command to run...
Huang Siyu ; Qin Fangbo ; Xiong Pengfei ; Ding Ning ; He Yijia ; Liu Xiao

摘要
本文提出了一种新颖的深度卷积模型——基于三点的线段检测器(TP-LSD),能够在实时速度下检测图像中的线段。以往的相关方法通常采用两步策略,依赖于启发式后处理或额外的分类器。为了实现更快、更紧凑的一步检测,我们引入了三点表示法,将线段检测转化为对每个线段的根点和两个端点进行端到端预测。TP-LSD 模型包含两个分支:三点提取分支和线段分割分支。前者预测根点的热图以及两个端点的位移图;后者从背景中分割出直线上的像素。此外,线段分割图在第一个分支中被重新利用作为结构先验。我们提出了一种新的评估指标,并在 Wireframe 和 YorkUrban 数据集上评估了该方法,不仅展示了与最新方法相当的精度,还实现了高达 78 帧每秒(FPS)的实时运行速度,输入分辨率为 $320 \times 320$。
代码仓库
MegviiRobot/TP-LSD
官方
pytorch
GitHub 中提及
siyuada7/tp-lsd
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| line-segment-detection-on-wireframe-dataset | TP-LSD | sAP10: 57.2 sAP5: 57.6 |
| line-segment-detection-on-york-urban-dataset | TP-LSD | sAP10: 27.7 sAP5: 27.6 |