算力平台:
Kandinsky 2.1
Kandinsky 2.1 由 Arseniy Shakhmatov、Anton Razzhigaev、Aleksandr Nikolich、Vladimir Arkhipkin、Igor Pavlov、Andrey Kuznetsov 和 Denis Dimitrov 共同创建。
其 GitHub 页面上的描述如下:
Kandinsky 2.1 继承了 Dall-E 2 和 Latent diffusion 的最佳实践,同时引入了一些新想法。它使用 CLIP 模型作为文本和图像编码器,并在 CLIP 模态的潜在空间之间进行扩散图像先验(映射)。这种方法提高了模型的视觉性能,并在图像混合和文本引导图像操作方面开辟了新的视野。
原始代码库可以在 ai-forever/Kandinsky-2 中找到。
KandinskyPriorPipeline
[[autodoc]] KandinskyPriorPipeline - all - call - interpolate
KandinskyPipeline
[[autodoc]] KandinskyPipeline - all - call
KandinskyCombinedPipeline
[[autodoc]] KandinskyCombinedPipeline - all - call
KandinskyImg2ImgPipeline
[[autodoc]] KandinskyImg2ImgPipeline - all - call
KandinskyImg2ImgCombinedPipeline
[[autodoc]] KandinskyImg2ImgCombinedPipeline - all - call
KandinskyInpaintPipeline
[[autodoc]] KandinskyInpaintPipeline - all - call
KandinskyInpaintCombinedPipeline
[[autodoc]] KandinskyInpaintCombinedPipeline - all - call