Lumina-Image_2.0

Portrait PhotographyGirl

2.0

최근 업데이트: 첫 번 게시:

Image info

Lumina-Image-2.0 是上海 AI 智能实验室推出的开源统一图像生成模型

技术架构

Transformer 架构：以 Transformer 为核心架构，能处理长距离依赖关系，采用 Gemma-2-2B 作为文本编码器，可高效地将文本提示转化为图像生成所需的特征。

扩散模型：使用基于流的扩散模型，通过逐步去除噪声来生成图像，即先给图像数据添加高斯噪声，再训练神经网络逐步去噪以恢复清晰图像。

VAE：采用 FLUX-VAE-16CH 作为变分自编码器，用于高效地编码和解码图像。

模型参数：参数量为 26 亿，相对较小的参数量使其在资源效率方面表现出色，能在保持高质量生成的同时，降低计算资源的消耗。

核心功能

高质量图像生成：可生成写真、艺术字、风格化图像、逻辑推理图像等多种高质量图像。

多语言支持：支持中英双语提示词，能根据不同语言的描述生成对应的图像。

复杂提示词理解：对动物、人物表情等复杂提示词的理解和展示能力较强，能更准确地根据文本描述生成图像。

多种推理求解器支持：支持中点求解器、欧拉求解器和 DPM 求解器等多种推理求解器，可根据不同的生成需求和资源限制进行选择，在速度和质量间取得平衡。

与 ComfyUI 集成：已实现对 ComfyUI 的原生支持，用户可通过 ComfyUI 直接使用该模型。

性能表现

提示词理解准确：在文本对齐能力上达到行业领先水平，对提示词的理解准确性较高，在艺术性以及风格表现方面也较为出色。

出图速度快：相比普通 FLUX 模型，出图速度有明显提升。

가장 인기

최신

보내기

곧 오픈

다운로드

(0.00KB)

자세히

유형

온라인 생성 횟수

다운로드

가장 인기

최신