人工智能给原生的 Stable Diffusion 模型按个涡轮发动机——DeepCache

3c零部件主要包括几大类人工智能 2024-04-21 10 0

AI绘图虽然模型种类繁多，但是一直存在一个缺点就是不够快。以至于Stability公司专门做了Turbo系列和Cascade版本。但是这些终究治标不治本，终于在CVPR2024收入中，我觉得DeepCache是一次不错的尝试。

论文

《DeepCache: Accelerating Diffusion Models for Free》

摘要

扩散模型因其卓越的生成能力，最近在图像合成领域获得了前所未有的关注。尽管这些模型性能出众，但通常会产生大量的计算成本，这主要归因于顺序去噪过程和繁琐的模型大小。压缩扩散模型的传统方法通常涉及大量的再训练，带来了成本和可行性方面的挑战。在本文中，我们介绍了 DeepCache，一种从模型架构角度加速扩散模型的新型免训练范式。DeepCache 利用扩散模型顺序去噪步骤中固有的时间冗余，缓存并检索相邻去噪阶段的特征，从而减少冗余计算。利用 U-Net 的特性，我们在重复使用高级特征的同时，还能以非常低廉的成本更新低级特征。这一创新策略反过来又使稳定扩散 v1.5 的速度提高了 2.3 倍，而 CLIP 分数仅下降了 0.05；使 LDM-4-G 的速度提高了 4.1 倍，而 ImageNet 上的 FID 仅略微下降了 0.22。我们的实验还证明，DeepCache 优于需要重新训练的现有剪枝和蒸馏方法，而且与当前的采样技术兼容。此外，我们还发现，在相同的吞吐量下，DeepCache 能有效地实现与 DDIM 或 DDIM 相似甚至略有改进的结果。

部署

pip install DeepCache

代码

import torch

# Loading the original pipeline

from diffusers import StableDiffusionPipeline

pipe = StableDiffusionPipeline.from_pretrained('runwayml/stable-diffusion-v1-5', torch_dtype=torch.float16).to("cuda:0")

# Import the DeepCacheSDHelper

from DeepCache import DeepCacheSDHelper

helper = DeepCacheSDHelper(pipe=pipe)

helper.set_params(

cache_interval=3,

cache_branch_id=0,

)

helper.enable()

# Generate Image

deepcache_image = pipe(

prompt,

output_type='pt'

).images[0]

helper.disable()

测试

我用sdxl base 1.0 + 4090

无cache Total runtime of the program is 7.61311936378479 有cache Total runtime of the program is 3.8023335933685303

结语

如果用在中低端显卡估计推理效果更为显著吧！

精彩内容

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

stable diffusion 人工智能

本文由用户于 2024-04-21 发布在金钥匙，如有疑问，请联系我们。
本文链接：https://www.51969.com/post/18783801.html

金钥匙

人工智能给原生的 Stable Diffusion 模型按个涡轮发动机——DeepCache

AI作画人工智能学习【实战】Stable Diffusion抠图插件爬坑经历，SD实操案例

游戏引擎 c# 从零开始创建Unity自定义包Package：一步一步实现您的功能

发表评论取消回复

金钥匙

人工智能 给原生的 Stable Diffusion 模型按个涡轮发动机——DeepCache

AI作画 人工智能 学习 ​【实战】Stable Diffusion抠图插件爬坑经历，SD实操案例

游戏引擎 c# 从零开始创建Unity自定义包Package：一步一步实现您的功能

相关文章

发表评论取消回复

人工智能给原生的 Stable Diffusion 模型按个涡轮发动机——DeepCache

AI作画人工智能学习【实战】Stable Diffusion抠图插件爬坑经历，SD实操案例