Kandinsky 2.2
Kandinsky 2.2 由 Arseniy Shakhmatov、Anton Razzhigaev、Aleksandr Nikolich、Vladimir Arkhipkin、Igor Pavlov、Andrey Kuznetsov 和 Denis Dimitrov 创建。
其 GitHub 页面上的描述如下:
Kandinsky 2.2 在其前身 Kandinsky 2.1 的基础上引入了显著的改进,通过引入一种更强大的图像编码器——CLIP-ViT-G 和支持 ControlNet。将图像编码器切换为 CLIP-ViT-G 显著提高了模型生成更具美感的图片和更好地理解文本的能力,从而增强了模型的整体性能。添加 ControlNet 机制使模型能够有效控制图像生成过程。这导致了更准确和视觉上更吸引人的输出,并为文本引导的图像操作开辟了新的可能性。
原始代码库可以在 ai-forever/Kandinsky-2 找到。
KandinskyV22PriorPipeline
[[autodoc]] KandinskyV22PriorPipeline - all - call - interpolate
KandinskyV22Pipeline
[[autodoc]] KandinskyV22Pipeline - all - call
KandinskyV22CombinedPipeline
[[autodoc]] KandinskyV22CombinedPipeline - all - call
KandinskyV22ControlnetPipeline
[[autodoc]] KandinskyV22ControlnetPipeline - all - call
KandinskyV22PriorEmb2EmbPipeline
[[autodoc]] KandinskyV22PriorEmb2EmbPipeline - all - call - interpolate
KandinskyV22Img2ImgPipeline
[[autodoc]] KandinskyV22Img2ImgPipeline - all - call
KandinskyV22Img2ImgCombinedPipeline
[[autodoc]] KandinskyV22Img2ImgCombinedPipeline - all - call
KandinskyV22ControlnetImg2ImgPipeline
[[autodoc]] KandinskyV22ControlnetImg2ImgPipeline - all - call
KandinskyV22InpaintPipeline
[[autodoc]] KandinskyV22InpaintPipeline - all - call
KandinskyV22InpaintCombinedPipeline
[[autodoc]] KandinskyV22InpaintCombinedPipeline - all - call