最新论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

CoMotion:并发多人3D运动
Alejandro Newell, Peiyun Hu, Lahav Lipson, et al.
发布日期: 4/23/2025

RF-DETR目标检测与YOLOv12的比较:在标签模糊的复杂果园环境下,针对单类和多类青果检测的Transformer架构与CNN架构的研究
Ranjan Sapkota, Rahul Harsha Cheppally, Ajay Sharda, et al.
发布日期: 4/23/2025

从反思到完美:通过反思调整对文本到图像扩散模型的推理时间优化进行扩展
Le Zhuo, Liangbing Zhao, Sayak Paul, et al.
发布日期: 4/23/2025

RainbowPlus:通过进化质量多样性搜索增强对抗性提示生成
Quy-Anh Dang, Chris Ngo, Truong-Son Hy
发布日期: 4/23/2025

MetaSynth: 由元提示驱动的代理支架用于多样化的合成数据生成
Haris Riaz, Sourav Bhabesh, Vinayak Arannil, et al.
发布日期: 4/23/2025

Vidi:用于视频理解和编辑的大型多模态模型
Vidi Team, Celong Liu, Chia-Wen Kuo, et al.
发布日期: 4/23/2025

TAPIP3D:在持久的3D几何结构中追踪任意点
Bowei Zhang, Lei Ke, Adam W. Harley, et al.
发布日期: 4/23/2025

传递成本:评估语言模型的经济框架
Mehmet Hamza Erol, Batu El, Mirac Suzgun, et al.
发布日期: 4/23/2025

具有精炼正则化偏好的大视频语言模型的自对齐
Pritam Sarkar, Ali Etemad
发布日期: 4/23/2025

学习鲁棒于遮挡的视觉变换器用于实时无人机追踪
You Wu, Xucheng Wang, Xiangyang Yang, et al.
发布日期: 4/23/2025