Skip to content

LEDITS++

LEDITS++ 是在 Manuel Brack、Felix Friedrich、Katharina Kornmeier、Linoy Tsaban、Patrick Schramowski、Kristian Kersting 和 Apolinário Passos 撰写的论文 LEDITS++: Limitless Image Editing using Text-to-Image Models 中提出的。

论文的摘要如下:

文本到图像扩散模型因其仅通过文本输入生成高保真图像的惊人能力而受到越来越多的关注。随后的研究努力旨在利用和应用这些能力进行真实图像编辑。然而,现有的图像到图像方法通常效率低下、不精确且缺乏多样性。它们要么需要耗时的微调,要么不必要地偏离输入图像,并且/或缺乏对多个同时编辑的支持。为了解决这些问题,我们引入了 LEDITS++,一种高效且多功能且精确的文本图像操作技术。LEDITS++ 的新颖反演方法不需要调整或优化,并且只需几次扩散步骤即可产生高保真结果。其次,我们的方法支持多个同时编辑,并且与架构无关。第三,我们使用一种新颖的隐式掩码技术,将更改限制在相关图像区域。我们提出了新的 TEdBench++ 基准作为我们全面评估的一部分。我们的结果展示了 LEDITS++ 的能力及其相对于以前方法的改进。项目页面可在 https://leditsplusplus-project.static.hf.space 获取。

我们基于不同的预训练模型提供了两个不同的管道。

LEditsPPPipelineStableDiffusion

[[autodoc]] pipelines.ledits_pp.LEditsPPPipelineStableDiffusion - all - call - invert

LEditsPPPipelineStableDiffusionXL

[[autodoc]] pipelines.ledits_pp.LEditsPPPipelineStableDiffusionXL - all - call - invert

LEditsPPDiffusionPipelineOutput

[[autodoc]] pipelines.ledits_pp.pipeline_output.LEditsPPDiffusionPipelineOutput - all

LEditsPPInversionPipelineOutput

[[autodoc]] pipelines.ledits_pp.pipeline_output.LEditsPPInversionPipelineOutput - all