it之家 6 月 25 日消息,stability ai 近日宣布,旗下文字生成图片模型 sdxl 0.9 已经正式推出。这个版本经过了显著的图像内容和构图细节改进,还支持在消费级 gpu 上运行。
据悉,sdxl 0.9 在所有开源图像模型中参数数量位居前茅,其具备一个 35 亿参数的基础模型和一个 66 亿参数的附加模型。围绕这两个模型,sdxl 的工作原理即,使用基础模型创建粗略的细节,再使用附加模型精细化生成的图片,如果it之家的小伙伴们有使用过 stable diffusion 的话,应该可以注意到这一渐进式的工作过程。
▲ 图源 sdxl 团队
stability ai 表示,sdxl0.9 中使用了两个 clip 模型,其中包括 openclip vitg /14,这是迄今为止体积最大的 openclip 模型。使用这个模型,stable diffusion 能够生成更逼真、分辨率更高、深度更广的图像。
stability ai 同时表示,sdxl 团队将发布一篇研究博客,详细介绍 sdxl 0.9 的模规范和更多参数细节,预计该模型将在 7 月迎来 1.0 正式版本,并将在 github 开源。
以上就是stability ai 推出文生图模型 sdxl0.9,gpu要求下探至消费级水平的详细内容。