Kandinsky 2.1

Kandinsky 2.1 由 Arseniy Shakhmatov、Anton Razzhigaev、Aleksandr Nikolich、Vladimir Arkhipkin、Igor Pavlov、Andrey Kuznetsov 和 Denis Dimitrov 共同创建。

其 GitHub 页面上的描述如下：

Kandinsky 2.1 继承了 Dall-E 2 和 Latent diffusion 的最佳实践，同时引入了一些新想法。它使用 CLIP 模型作为文本和图像编码器，并在 CLIP 模态的潜在空间之间进行扩散图像先验（映射）。这种方法提高了模型的视觉性能，并在图像混合和文本引导图像操作方面开辟了新的视野。

原始代码库可以在 ai-forever/Kandinsky-2 中找到。

KandinskyPriorPipeline

[[autodoc]] KandinskyPriorPipeline - all - call - interpolate

KandinskyPipeline

[[autodoc]] KandinskyPipeline - all - call

KandinskyCombinedPipeline

[[autodoc]] KandinskyCombinedPipeline - all - call

KandinskyImg2ImgPipeline

[[autodoc]] KandinskyImg2ImgPipeline - all - call

KandinskyImg2ImgCombinedPipeline

[[autodoc]] KandinskyImg2ImgCombinedPipeline - all - call

KandinskyInpaintPipeline

[[autodoc]] KandinskyInpaintPipeline - all - call

KandinskyInpaintCombinedPipeline

[[autodoc]] KandinskyInpaintCombinedPipeline - all - call

Kandinsky 2.1 ​

KandinskyPriorPipeline ​

KandinskyPipeline ​

KandinskyCombinedPipeline ​

KandinskyImg2ImgPipeline ​

KandinskyImg2ImgCombinedPipeline ​

KandinskyInpaintPipeline ​

KandinskyInpaintCombinedPipeline ​

实用工具