Skip to content

Kandinsky 2.1

Kandinsky 2.1 由 Arseniy ShakhmatovAnton RazzhigaevAleksandr NikolichVladimir ArkhipkinIgor PavlovAndrey KuznetsovDenis Dimitrov 共同创建。

其 GitHub 页面上的描述如下:

Kandinsky 2.1 继承了 Dall-E 2 和 Latent diffusion 的最佳实践,同时引入了一些新想法。它使用 CLIP 模型作为文本和图像编码器,并在 CLIP 模态的潜在空间之间进行扩散图像先验(映射)。这种方法提高了模型的视觉性能,并在图像混合和文本引导图像操作方面开辟了新的视野。

原始代码库可以在 ai-forever/Kandinsky-2 中找到。

KandinskyPriorPipeline

[[autodoc]] KandinskyPriorPipeline - all - call - interpolate

KandinskyPipeline

[[autodoc]] KandinskyPipeline - all - call

KandinskyCombinedPipeline

[[autodoc]] KandinskyCombinedPipeline - all - call

KandinskyImg2ImgPipeline

[[autodoc]] KandinskyImg2ImgPipeline - all - call

KandinskyImg2ImgCombinedPipeline

[[autodoc]] KandinskyImg2ImgCombinedPipeline - all - call

KandinskyInpaintPipeline

[[autodoc]] KandinskyInpaintPipeline - all - call

KandinskyInpaintCombinedPipeline

[[autodoc]] KandinskyInpaintCombinedPipeline - all - call