Skip to content

Kandinsky 2.2

Kandinsky 2.2 由 Arseniy ShakhmatovAnton RazzhigaevAleksandr NikolichVladimir ArkhipkinIgor PavlovAndrey KuznetsovDenis Dimitrov 创建。

其 GitHub 页面上的描述如下:

Kandinsky 2.2 在其前身 Kandinsky 2.1 的基础上引入了显著的改进,通过引入一种更强大的图像编码器——CLIP-ViT-G 和支持 ControlNet。将图像编码器切换为 CLIP-ViT-G 显著提高了模型生成更具美感的图片和更好地理解文本的能力,从而增强了模型的整体性能。添加 ControlNet 机制使模型能够有效控制图像生成过程。这导致了更准确和视觉上更吸引人的输出,并为文本引导的图像操作开辟了新的可能性。

原始代码库可以在 ai-forever/Kandinsky-2 找到。

KandinskyV22PriorPipeline

[[autodoc]] KandinskyV22PriorPipeline - all - call - interpolate

KandinskyV22Pipeline

[[autodoc]] KandinskyV22Pipeline - all - call

KandinskyV22CombinedPipeline

[[autodoc]] KandinskyV22CombinedPipeline - all - call

KandinskyV22ControlnetPipeline

[[autodoc]] KandinskyV22ControlnetPipeline - all - call

KandinskyV22PriorEmb2EmbPipeline

[[autodoc]] KandinskyV22PriorEmb2EmbPipeline - all - call - interpolate

KandinskyV22Img2ImgPipeline

[[autodoc]] KandinskyV22Img2ImgPipeline - all - call

KandinskyV22Img2ImgCombinedPipeline

[[autodoc]] KandinskyV22Img2ImgCombinedPipeline - all - call

KandinskyV22ControlnetImg2ImgPipeline

[[autodoc]] KandinskyV22ControlnetImg2ImgPipeline - all - call

KandinskyV22InpaintPipeline

[[autodoc]] KandinskyV22InpaintPipeline - all - call

KandinskyV22InpaintCombinedPipeline

[[autodoc]] KandinskyV22InpaintCombinedPipeline - all - call