Command Palette

Search for a command to run...

5 个月前

向文本到图像扩散模型中添加条件控制

Zhang Lvmin ; Rao Anyi ; Agrawala Maneesh

向文本到图像扩散模型中添加条件控制

摘要

我们介绍了ControlNet,这是一种神经网络架构,旨在为大型预训练文本到图像扩散模型添加空间条件控制。ControlNet锁定生产就绪的大型扩散模型,并重用其通过数十亿张图像预训练得到的深度且强大的编码层作为强大骨干,以学习多种条件控制。该神经架构通过“零卷积”(zero-initialized convolution layers)与之连接,这些卷积层从零开始逐步增加参数,确保不会有任何有害噪声影响微调过程。我们使用Stable Diffusion测试了各种条件控制,例如边缘、深度、分割、人体姿态等,使用单个或多个条件,并结合或不结合提示进行实验。结果显示,ControlNet在小规模(<50k)和大规模(>1m)数据集上的训练均具有鲁棒性。大量实验结果表明,ControlNet可能有助于更广泛地应用图像扩散模型的控制功能。

代码仓库

xuanliu2000/vgcdm
pytorch
GitHub 中提及
DingDing33/BPS-v1-1
pytorch
GitHub 中提及
lllyasviel/controlnet
官方
pytorch
GitHub 中提及
fhshen2022/prunerepaint
pytorch
GitHub 中提及
google/style-aligned
pytorch
GitHub 中提及
quereste/implicit-deepfake
pytorch
GitHub 中提及
bytedance/x-dyna
pytorch
GitHub 中提及
microsoft/visual-chatgpt
GitHub 中提及
Francis-Rings/MotionEditor
pytorch
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供