HyperAI超神经
3 days ago

BANG:通过生成式爆炸动力学划分3D资产

Longwen Zhang; Qixuan Zhang; Haoran Jiang; Yinuo Bai; Wei Yang; Lan Xu; Jingyi Yu
BANG:通过生成式爆炸动力学划分3D资产
摘要

三维创作始终是人类独有的能力,源于我们通过视觉、思维与双手对物体进行拆解与重构的自然过程。然而,当前的三维设计工具难以复现这一直观的创作方式,往往需要大量艺术专业技能和繁重的手动操作。本文提出了一种名为 BANG 的新型生成式方法,该方法融合了三维生成与推理能力,实现了对三维物体的直观且灵活的部件级分解。BANG 的核心是“生成式爆炸动态”(Generative Exploded Dynamics),该技术能够为输入的几何体生成一系列平滑的爆炸状态序列,在逐步分离各部件的同时,保持其几何结构与语义的一致性。BANG 采用一个预训练的大规模潜在扩散模型,并通过一个轻量级的爆炸视图适配器对其进行微调,以实现对分解过程的精确控制。同时,系统引入时间注意力模块,确保时间序列中各帧之间的过渡平滑且前后一致。通过空间提示(如边界框和表面区域),BANG 进一步增强了用户对分解过程的控制能力,使用户能够明确指定待分解的部件及其分解方式。该交互机制还可与多模态模型(如 GPT-4)结合,支持从二维到三维的智能操作,从而构建更加直观、富有创造性的设计工作流。BANG 的功能不仅限于生成精细的部件级几何结构,还可将各个部件与功能描述相关联,推动面向组件感知的三维创作与制造流程。此外,BANG 在三维打印领域具有广泛应用潜力——系统可自动生成可分离的部件,便于打印后快速组装。本质上,BANG 实现了从创意构想到详细三维资产的无缝转化,为创作提供了契合人类直觉的新范式。