-
AI本地大模型 自然语言图像编辑模型 OmniGen2
OmniGen2 是一个强大且高效的统一多模态模型。其架构由两个关键组件组成:一个3B视觉语言模型(VLM)和一个4B扩散模型。在这个设计中,冻结的3B VLM (Qwen-VL-2.5) 负责解释视觉信号和用户指令,而4B扩散模型则利用这种理解来执行高质量的图像生成。 这种双组件架构在四个主要能力上表现出色: 视觉理解:从其Qwen-VL-2.5基础继承了强大的图像内容解释和分析能力。 文本到图…... -
AI本地大模型 英文海报生成器 PosterCraft
PosterCraft 是由香港科技大学(广州)与美团等机构共同推出的创新性海报生成框架,专为生成高质量、美学化的海报而设计。 注意:目前不支持生成中文字符 开源地址:https://github.com/Ephemeral182/PosterCraft 配置要求: 操作系统:Windows 10/11 64位 内存:48G以上 显卡:至少16G及以上显存的英伟达(NVIDIA)显卡,由于用的是F…... -
自称最强一键抠图工具 BRIA-RMBG 离线AI大模型
咱们来简单介绍一下这个背景去除图片项目BRIA-RMBG,它是基于MBG v1.4模型制作的。MBG v1.4是一种先进的背景去除模型,它的目标是能够有效地将各种类别和图像类型的前景和背景分开。 这个模型经过在精心挑选的数据集上的训练,包括各种库存图像、电子商务、游戏和广告内容,所以非常适合用于支持大规模企业内容创建的用途。它的准确性、效率和多功能性可以与目前市面上领先的收费模型媲美。在涉及内容安…... -
AI本地大模型 多模态图像生成工作流 Flux-Kontext-dev
FLUX.1Kontext-dev 是一款震撼发布的开源图像编辑模型,采用12亿参数的流匹配架构,专为上下文感知的图像精准编辑而设计。它在保证编辑区域风格一致性与真实感的同时,支持在消费级硬件上运行,极大降低了专业图像编辑门槛。这一模型被视为图像创作领域的“GPT-4o 级”开源工具,标志着社区级高质量图像编辑正式迈入新时代 开源地址:https://huggingface.co/black-fo…... -
AI本地大模型 DreamO 图片换装/ 幻脸/换风格
DreamO 是一个统一的图像定制编辑框架,基于 Diffusion Transformer(DiT)架构设计,旨在支持多样化、高质量、可控性强的图像编辑任务。 其核心特性包括: 换装与物体编辑(Item Prompt, IP):支持对人物服饰或物品的精准替换,自动抠除背景,突出主体内容。 换脸与面部一致性(ID):通过面部专用ID参数实现类似PuLID技术的高一致性换脸,保持人物身份连续性。 风…... -
官方出品 ComfyUI工作流客户端
ComfyUI客户端是什么 ComfyUI客户端是ComfyUI官方推出的桌面客户端,支持Windows和Mac系统。简洁直观的用户界面、一键安装的便利性、具有自动更新功能、轻量级的安装包、预配置的Python环境、支持用户通过连接不同的节点来构建复杂的图像生成流程,精确控制每个步骤的参数。为用户提供了一个高效、稳定且易于使用的AI生图创作环境。 ComfyUI客户端的主要功能 跨平台支持:Com…... -
潦草手绘变精美画作一键生成绘画 Doodly 离线模型
有用过Stable Diffuison的小伙伴都知道,想要生成一张高质量的图片,需要输入非常详细的提示词,并伴随多次“摇色子”才能获得满意的结果,有没有简便的方法呢? Doodly开创了一种新的方式,你只需随手画个草图,AI就会很好的理解其中的意思,并自动生成细节丰富、完全渲染的精美图像。无论是给客户设计logo、做展示需要的素材,还是各种插画,Doodle都能一键搞定,效率max! 工作原理 T…... -
AI本地大模型 图像融合并调整光照 LBM-Relighting
LBM(Latent Bridge Matching) 是一种创新的图像重照明算法,旨在通过潜在空间中的桥接匹配,实现快速、高质量的图像到图像翻译任务。其核心理念是:在潜在空间中构建前景与背景之间的“光照桥梁”,通过潜在桥匹配(Latent Bridge Matching)机制,将背景光照信息映射到前景主体上,从而实现自然、合理的光照迁移。 注意:文件夹路径和文件名称(包括音频、图片、视频等文件名…... -
SD绘画本地部署解决方案 Stable Diffusion 整合包
Stable Diffusion整合包是B站UP主秋葉aaaki发布的SD绘画本地部署解决方案,包含了Stable Diffusion WebUI、必要的运行环境、预装模型以及一些常用插件的集合。整合包的目的是为了让新手用户能更加方便地安装和使用Stable Diffusion进行AI绘画创作。用户无需具备深厚的技术背景,也不需要自己配置环境,只需下载整合包并按照简单的步骤操作,可快速启动和使用S…... -
专业图像和插画生成器 Midjourney
Midjourney 是由人工智能研究实验室 Midjourney, Inc. 开发的AI图像生成工具,可以根据输入的文本提示生成图像。该程序最早于2022年7月12日进入公开测试阶段,用户可以通过 Discord 的机器人指令进行操作,创作出许多不同风格的图像作品。官方国内中文版:悠船。 类似于 OpenAI 的 DALL·E 和 Stability AI 的 Stable Diffusion,…...


















































