Command Palette

Search for a command to run...

3 个月前

对抗性得分身份蒸馏:一步超越教师模型

对抗性得分身份蒸馏:一步超越教师模型

摘要

Score Identity Distillation(SiD)是一种无需训练数据的图像生成方法,通过仅利用预训练的扩散模型即实现了当前最优(SOTA)性能。然而,其最终生成效果受限于预训练模型在扩散过程不同阶段对真实数据梯度(score)的建模准确性。本文提出SiDA(SiD with Adversarial Loss),通过引入真实图像与对抗损失,不仅显著提升了生成质量,还增强了蒸馏效率。SiDA创新性地将生成器的得分网络中的编码器用作判别器,使其能够有效区分真实图像与SiD生成的图像。对抗损失在每个GPU批次内进行批量归一化处理,随后与原始SiD损失相结合。该设计将每批次图像的平均“伪造程度”信息融入基于像素的SiD损失中,从而实现单步生成器的高效蒸馏。相较于原始SiD方法,SiDA在从零开始蒸馏时收敛速度显著加快,并在基于预蒸馏SiD生成器进行微调时迅速超越原始模型性能。该单步对抗蒸馏方法在蒸馏EDM扩散模型方面树立了新基准,在ImageNet 64×64数据集上取得了1.110的FID分数。在蒸馏在ImageNet 512×512上训练的EDM2模型时,SiDA的表现甚至超越了最大的教师模型EDM2-XXL——后者采用分类器自由引导(CFG)与63步生成,FID为1.81。相比之下,SiDA在无需CFG且仅需单步生成的情况下,分别实现了XS、S、M、L、XL、XXL版本的FID分数:2.156、1.669、1.488、1.413、1.379和1.366,全面优于现有方法,且在所有模型规模上均展现出显著提升。上述结果充分证明了SiDA在生成质量与蒸馏效率方面的卓越性能。相关代码已开源,地址为:https://github.com/mingyuanzhou/SiD/tree/sida。

代码仓库

mingyuanzhou/sid-lsg
pytorch
GitHub 中提及
mingyuanzhou/sid
官方
pytorch

基准测试

基准方法指标
image-generation-on-afhq-v2-64x64SiDA-EDM
FID: 1.276
NFE: 1
image-generation-on-cifar-10SiDA-EDM
FID: 1.396
NFE: 1
image-generation-on-ffhq-64x64SiDA-EDM
FID: 1.040
NFE: 1
image-generation-on-imagenet-512x512SiD-EDM2-M (498M)
FID: 2.06
NFE: 1
image-generation-on-imagenet-512x512SiDA-EDM2-M (498M)
FID: 1.488
NFE: 1
image-generation-on-imagenet-512x512SiDA-EDM2-L (777M)
FID: 1.413
NFE: 1
image-generation-on-imagenet-512x512SiD-EDM2-XS (125M)
FID: 3.353
NFE: 1
image-generation-on-imagenet-512x512SiDA-EDM2-XL (1.1B)
FID: 1.379
NFE: 1
image-generation-on-imagenet-512x512SiD-EDM2-S (280M)
FID: 2.707
NFE: 1
image-generation-on-imagenet-512x512SiDA-EDM2-XS (125M)
FID: 2.156
NFE: 1
image-generation-on-imagenet-512x512SiD-EDM2-XXL (1.5B)
FID: 1.969
NFE: 1
image-generation-on-imagenet-512x512SiDA-EDM2-XXL (1.5B)
FID: 1.366
NFE: 1
image-generation-on-imagenet-512x512SiDA-EDM2-S (280M)
FID: 1.669
NFE: 1
image-generation-on-imagenet-512x512SiD-EDM2-L (777M)
FID: 1.907
NFE: 1
image-generation-on-imagenet-512x512SiD-EDM2-XL (1.1B)
FID: 1.888
NFE: 1
image-generation-on-imagenet-64x64SiDA-EDM
FID: 1.11
NFE: 1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供