图像生成开源程序是什么

时间:2025-01-30 00:16:16 手机游戏

OpenAI sCM

OpenAI发布的sCM是一种新的图像生成方法,虽然目前仅发布了论文且没有开源,但它实现了与扩散模型相当的质量,并且仅需2次采样步骤,在A100 GPU上生成单张图像仅需0.11秒,速度提升了约50倍。

OmniGen

OmniGen是一个开源的多模态输入图像生成模型,能够接受多模态输入,例如提示词,并自动识别输入图像中的特征。它使用特殊的XML标记提示词,可以实现文生图、风格迁移、角色一致性、图像编辑和图生图。

BlinkShot

BlinkShot是一款实时AI图像生成器,基于Flux Schnell技术,支持自定义分辨率和生成步骤,适用于多种应用场景。它是一个开源项目,易于克隆和运行,并提供详细的操作步骤。

图像魔方

图像魔方是一个基于Next.js 14开发的在线图像处理工具集,提供多种图像处理功能和AI创意工具,包括AI文生图、文字卡片生成、图片压缩、调整大小、图片格式转换等。

Stable Diffusion

Stable Diffusion由Stability AI开发,是一个强大的文本到图像生成模型,能够根据文本描述生成高质量和富有创意的图像。它拥有67k stars,是一个流行的开源项目。

DALL-E Mini (Craiyon)

DALL-E Mini是OpenAI的DALL-E的开源替代品,能够根据文本描述生成图像。它拥有14.7k stars,并且已经更名为Craiyon。

Fooocus

Fooocus是一个基于Gradio的图像生成软件,目前最流行的文生图大模型是Stable Diffusion。它提出了对图像生成器设计的重新思考,是离线、开源和免费的。

Photoshot

Photoshot是一款开源的AI头像生成器,用户可以上传个人头像并使用Stable Diffusion模型进行训练,生成不同风格的个人头像。项目遵守MIT开源协议。

Llama

Llama模型本身不是专门为图像生成而设计的,它是一个基础的语言模型,但通过与图像编码器的结合,可以用于生成图像。虽然Llama不是专门的图像生成程序,但它在图像生成方面有一定的应用。

PhotoMaker

PhotoMaker是腾讯开源的一款文本到图像生成工具,它利用多张照片作为身份ID,获取人物特征,然后创造出一个新的个性化的人物图像。其核心技术是“堆叠ID嵌入”。

ACE (All-round Creator and Editor)

阿里云通义万相团队开源的图像编辑模型ACE,旨在为用户提供便捷、智能的图片生成与编辑服务。用户可以通过输入提示词生成或修改图片。

这些开源项目涵盖了从实时图像生成到复杂的文本到图像生成模型等多种应用场景,可以根据具体需求选择合适的项目进行尝试和使用。