-
AI本地大模型 Insert-Anything 图片万物迁移工具
Insert Anything 是一个基于扩散Transformer(DiT)的图像插入模型,提供了统一的上下文编辑框架。它支持用户灵活指定插入位置、参考图像和对象区域等多种控制方式,可将参考图像中的目标对象无缝融合到目标图像场景中,实现自然、真实的插入效果。该模型在人物、物体和复杂背景下均表现出色,适用于图像合成、内容填充、AIGC创作等多个应用场景,可以用于虚拟试穿、图片幻脸、图片主体替换等场…... -
AI本地大模型 自然语言图像编辑模型 OmniGen2
OmniGen2 是一个强大且高效的统一多模态模型。其架构由两个关键组件组成:一个3B视觉语言模型(VLM)和一个4B扩散模型。在这个设计中,冻结的3B VLM (Qwen-VL-2.5) 负责解释视觉信号和用户指令,而4B扩散模型则利用这种理解来执行高质量的图像生成。 这种双组件架构在四个主要能力上表现出色: 视觉理解:从其Qwen-VL-2.5基础继承了强大的图像内容解释和分析能力。 文本到图…... -
SD绘画本地部署解决方案 Stable Diffusion 整合包
Stable Diffusion整合包是B站UP主秋葉aaaki发布的SD绘画本地部署解决方案,包含了Stable Diffusion WebUI、必要的运行环境、预装模型以及一些常用插件的集合。整合包的目的是为了让新手用户能更加方便地安装和使用Stable Diffusion进行AI绘画创作。用户无需具备深厚的技术背景,也不需要自己配置环境,只需下载整合包并按照简单的步骤操作,可快速启动和使用S…... -
官方出品 ComfyUI工作流客户端
ComfyUI客户端是什么 ComfyUI客户端是ComfyUI官方推出的桌面客户端,支持Windows和Mac系统。简洁直观的用户界面、一键安装的便利性、具有自动更新功能、轻量级的安装包、预配置的Python环境、支持用户通过连接不同的节点来构建复杂的图像生成流程,精确控制每个步骤的参数。为用户提供了一个高效、稳定且易于使用的AI生图创作环境。 ComfyUI客户端的主要功能 跨平台支持:Com…... -
AI大模型 图像编辑 Step1X-Edit 一键运行包
Step1X-Edit号称为是GPT4o平替,Step1X-Edit能通过提示词编辑图像,挺火的图像编辑AI大模型,但由于原版模型对显存要求太高,需要80G显存才能运行,而且量化模型并不能达到官方宣传的效果,所以使用人并不多。网上有人做成整合包,山羊分享一下,玩玩就可以了毕竟吃配置而且效果也没法达到官方那样。 配置要求: 操作系统:Windows 10/11 64位 内存:建议32G以上 显卡:至…... -
AI本地大模型 英文海报生成器 PosterCraft
PosterCraft 是由香港科技大学(广州)与美团等机构共同推出的创新性海报生成框架,专为生成高质量、美学化的海报而设计。 注意:目前不支持生成中文字符 开源地址:https://github.com/Ephemeral182/PosterCraft 配置要求: 操作系统:Windows 10/11 64位 内存:48G以上 显卡:至少16G及以上显存的英伟达(NVIDIA)显卡,由于用的是F…... -
潦草手绘变精美画作一键生成绘画 Doodly 离线模型
有用过Stable Diffuison的小伙伴都知道,想要生成一张高质量的图片,需要输入非常详细的提示词,并伴随多次“摇色子”才能获得满意的结果,有没有简便的方法呢? Doodly开创了一种新的方式,你只需随手画个草图,AI就会很好的理解其中的意思,并自动生成细节丰富、完全渲染的精美图像。无论是给客户设计logo、做展示需要的素材,还是各种插画,Doodle都能一键搞定,效率max! 工作原理 T…... -
中文生图AI大模型 Qwen-Image 一键运行包
我们非常激动地发布了 Qwen-Image,这是 Qwen 系列中的一个图像生成基础模型,在 复杂文本渲染 和 精确图像编辑 方面取得了显著进展。实验显示,该模型在图像生成和编辑方面具有强大的通用能力,特别是在文本渲染方面表现出色,尤其是在中文上。 Qwen-Image 是阿里通义千问团队开源的 20B 参数MMDiT模型,是通义千问系列中首个图像生成基础模型,模型在复杂文本渲染和精确图像编辑方面…... -
OpenAI生图模型 GPT-4o 多模态AI大模型
GPT-4o是什么 GPT-4o是OpenAI最新推出的一款先进的人工智能模型,具备强大的多模态推理能力,能够处理语音、文本和视觉信息。模型能实时响应用户输入,在音频交互中检测和表达情感,提供了更加自然和富有表现力的交流体验。GPT-4o的设计注重提高运算速度和降低成本,速度是之前模型的两倍,成本仅为一半。GPT-4o在多语言处理、音频和视觉理解上表现突出,同时在安全性设计上进行了强化,确保交互的…... -
自称最强一键抠图工具 BRIA-RMBG 离线AI大模型
咱们来简单介绍一下这个背景去除图片项目BRIA-RMBG,它是基于MBG v1.4模型制作的。MBG v1.4是一种先进的背景去除模型,它的目标是能够有效地将各种类别和图像类型的前景和背景分开。 这个模型经过在精心挑选的数据集上的训练,包括各种库存图像、电子商务、游戏和广告内容,所以非常适合用于支持大规模企业内容创建的用途。它的准确性、效率和多功能性可以与目前市面上领先的收费模型媲美。在涉及内容安…...










































