3 days ago
基于弱监督的无人机影像未见域车辆检测器自适应方法
Xiao Fang; Minhyek Jeon; Zheyang Qin; Stanislav Panev; Celso de Melo; Shuowen Hu; Shayok Chakraborty; Fernando De la Torre

摘要
在航拍图像中检测车辆是一项关键任务,广泛应用于交通监控、城市规划和国防情报等领域。深度学习方法在该任务中已取得当前最先进的(SOTA)性能。然而,当在某一地理区域数据上训练的模型难以有效泛化至其他区域时,仍面临显著挑战。环境条件、城市布局、道路网络、车辆类型以及图像采集参数(如分辨率、光照和拍摄角度)等方面的差异,会导致域间分布偏移,从而降低模型性能。本文提出一种新颖方法,利用生成式人工智能合成高质量的航拍图像及其标注信息,通过数据增强提升检测器的训练效果。本文的核心贡献在于构建了一种多阶段、多模态的知识迁移框架,采用微调后的潜在扩散模型(Latent Diffusion Models, LDMs)有效缓解源域与目标域之间的分布差异。在多个不同航拍图像域上的大量实验表明,相较于在源域数据上进行监督学习、弱监督适应方法、无监督域适应方法以及开集目标检测器,本方法在AP50指标上分别实现了4%-23%、6%-10%、7%-40%以及超过50%的性能提升。此外,本文还发布了两个新标注的航拍图像数据集,分别来自新西兰和犹他州,以支持该领域的进一步研究。项目主页详见:https://humansensinglab.github.io/AGenDA