6 个月前

机器视觉 3D

计算机视觉

Yikang Ding Wentao Yuan Qingtian Zhu Haotian Zhang Xiangyue Liu Yuanjiang Wang Xiao Liu

摘要

在本文中，我们提出了TransMVSNet，该方法基于对多视图立体视觉（Multi-View Stereo, MVS）中特征匹配机制的深入探索。我们重新审视MVS的本质，将其视为一项特征匹配任务，并据此提出了一种强大的特征匹配Transformer（Feature Matching Transformer, FMT），通过引入内部（自）注意力与跨图像（交叉）注意力机制，有效聚合图像内部及图像之间的长程上下文信息。为更好地适应FMT的特性，我们设计了自适应感受野（Adaptive Receptive Field, ARF）模块，以确保特征感受野在不同层级间平滑过渡，并通过特征路径实现跨尺度的特征与梯度传递。此外，我们采用成对特征相关性来衡量特征间的相似性，并引入去模糊聚焦损失（ambiguity-reducing focal loss）以增强监督信号。据我们所知，TransMVSNet是首个将Transformer架构成功应用于MVS任务的尝试。实验结果表明，该方法在DTU数据集、Tanks and Temples基准以及BlendedMVS数据集上均取得了当前最优的性能表现。本方法的代码将开源，发布于 https://github.com/MegviiRobot/TransMVSNet。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

机器视觉 3D

计算机视觉

Yikang Ding Wentao Yuan Qingtian Zhu Haotian Zhang Xiangyue Liu Yuanjiang Wang Xiao Liu

摘要

在本文中，我们提出了TransMVSNet，该方法基于对多视图立体视觉（Multi-View Stereo, MVS）中特征匹配机制的深入探索。我们重新审视MVS的本质，将其视为一项特征匹配任务，并据此提出了一种强大的特征匹配Transformer（Feature Matching Transformer, FMT），通过引入内部（自）注意力与跨图像（交叉）注意力机制，有效聚合图像内部及图像之间的长程上下文信息。为更好地适应FMT的特性，我们设计了自适应感受野（Adaptive Receptive Field, ARF）模块，以确保特征感受野在不同层级间平滑过渡，并通过特征路径实现跨尺度的特征与梯度传递。此外，我们采用成对特征相关性来衡量特征间的相似性，并引入去模糊聚焦损失（ambiguity-reducing focal loss）以增强监督信号。据我们所知，TransMVSNet是首个将Transformer架构成功应用于MVS任务的尝试。实验结果表明，该方法在DTU数据集、Tanks and Temples基准以及BlendedMVS数据集上均取得了当前最优的性能表现。本方法的代码将开源，发布于 https://github.com/MegviiRobot/TransMVSNet。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供