Command Palette

Search for a command to run...

5 个月前

预训练是图像到图像转换所需的一切

预训练是图像到图像转换所需的一切

摘要

我们提出利用预训练来提升通用图像到图像的转换效果。以往的图像到图像转换方法通常需要专门的架构设计,并且从零开始训练单独的转换模型,这在生成复杂场景时尤为困难,尤其是在配对训练数据不足的情况下。本文中,我们将每个图像到图像转换问题视为下游任务,并引入了一个简单而通用的框架,该框架可以将预训练的扩散模型适应于各种类型的图像到图像转换。此外,我们还提出了对抗训练以增强扩散模型中的纹理合成能力,并结合归一化指导采样来提高生成质量。我们在ADE20K、COCO-Stuff和DIODE等具有挑战性的基准数据集上进行了广泛的实证比较,结果表明所提出的基于预训练的图像到图像转换(PITI)能够生成前所未有的真实且忠实的图像。

代码仓库

PITI-Synthesis/PITI
官方
pytorch
GitHub 中提及
rinnakk/japanese-stable-diffusion
pytorch
GitHub 中提及

基准测试

基准方法指标
image-to-image-translation-on-coco-stuffPITI
FID: 15.6
sketch-to-image-translation-on-coco-stuffPITI
FID: 18.5
FID-C: 7.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供