-
AI本地大模型 DreamO 图片换装/ 幻脸/换风格
DreamO 是一个统一的图像定制编辑框架,基于 Diffusion Transformer(DiT)架构设计,旨在支持多样化、高质量、可控性强的图像编辑任务。 其核心特性包括: 换装与物体编辑(Item Prompt, IP):支持对人物服饰或物品的精准替换,自动抠除背景,突出主体内容。 换脸与面部一致性(ID):通过面部专用ID参数实现类似PuLID技术的高一致性换脸,保持人物身份连续性。 风…... -
ComfyUI神级PS插件 AI图像生成、放大和重绘
这是一款PS神级插件comfyui-photoshop,它是基于ComfyUI人工智能。它由程序员 Nami 独立开发,将 ComfyUI 做为后端接入 Ps 中,借助其强大的 AI 生成能力,实现文生图、图生图、高清放大、局部重绘、外绘拓展等多种功能。 AI 出图非常稳定,软件之间的交互也非常顺畅;因为使用了 LCM lora,所以出图速度也非常快,可以做为 Ps 原生 AI 功能的平替,而且功…... -
专业图像和插画生成器 Midjourney
Midjourney 是由人工智能研究实验室 Midjourney, Inc. 开发的AI图像生成工具,可以根据输入的文本提示生成图像。该程序最早于2022年7月12日进入公开测试阶段,用户可以通过 Discord 的机器人指令进行操作,创作出许多不同风格的图像作品。官方国内中文版:悠船。 类似于 OpenAI 的 DALL·E 和 Stability AI 的 Stable Diffusion,…... -
潦草手绘变精美画作一键生成绘画 Doodly 离线模型
有用过Stable Diffuison的小伙伴都知道,想要生成一张高质量的图片,需要输入非常详细的提示词,并伴随多次“摇色子”才能获得满意的结果,有没有简便的方法呢? Doodly开创了一种新的方式,你只需随手画个草图,AI就会很好的理解其中的意思,并自动生成细节丰富、完全渲染的精美图像。无论是给客户设计logo、做展示需要的素材,还是各种插画,Doodle都能一键搞定,效率max! 工作原理 T…... -
自称最强一键抠图工具 BRIA-RMBG 离线AI大模型
咱们来简单介绍一下这个背景去除图片项目BRIA-RMBG,它是基于MBG v1.4模型制作的。MBG v1.4是一种先进的背景去除模型,它的目标是能够有效地将各种类别和图像类型的前景和背景分开。 这个模型经过在精心挑选的数据集上的训练,包括各种库存图像、电子商务、游戏和广告内容,所以非常适合用于支持大规模企业内容创建的用途。它的准确性、效率和多功能性可以与目前市面上领先的收费模型媲美。在涉及内容安…... -
AI大模型本地智能去除物体 ObjectClear 一键运行整合包
ObjectClear 是一个创新的图像处理技术,旨在解决对象移除时产生的阴影和反射等附带效果的问题。在日常生活中,当我们试图从照片中去除某个物体时,往往会发现该物体的阴影或反射仍然留在背景上,使得移除效果不尽如人意。ObjectClear正是为了解决这一难题而诞生的。 想象一下,你有一张照片,上面有一个不想要的物体,比如一个路人或者一个垃圾筒,而且这个物体还在地面上投下了阴影或者在旁边的物体上产…... -
AI本地大模型 英文海报生成器 PosterCraft
PosterCraft 是由香港科技大学(广州)与美团等机构共同推出的创新性海报生成框架,专为生成高质量、美学化的海报而设计。 注意:目前不支持生成中文字符 开源地址:https://github.com/Ephemeral182/PosterCraft 配置要求: 操作系统:Windows 10/11 64位 内存:48G以上 显卡:至少16G及以上显存的英伟达(NVIDIA)显卡,由于用的是F…... -
AI本地大模型 图像融合并调整光照 LBM-Relighting
LBM(Latent Bridge Matching) 是一种创新的图像重照明算法,旨在通过潜在空间中的桥接匹配,实现快速、高质量的图像到图像翻译任务。其核心理念是:在潜在空间中构建前景与背景之间的“光照桥梁”,通过潜在桥匹配(Latent Bridge Matching)机制,将背景光照信息映射到前景主体上,从而实现自然、合理的光照迁移。 注意:文件夹路径和文件名称(包括音频、图片、视频等文件名…... -
抖音旗下AI绘画/视频生成工具 即梦AI
即梦AI是字节跳动推出的一站式AI创作平台,支持AI视频生成和AI图片生成。用户可通过自然语言或图片输入生成高质量的图像和视频。即梦AI提供AI绘画、智能画布、视频生成以及故事创作等多种功能,降低创作门槛,激发用户创意。用户可以用即梦AI的AI视频生成功能,输入简单的文案或图片,快速生成视频片段,且视频动效效果连贯性强、流畅自然。 即梦AI还提供中文创作支持,根据中文提示词进行创作,拥有更好的语义…... -
AI本地大模型 自然语言图像编辑模型 OmniGen2
OmniGen2 是一个强大且高效的统一多模态模型。其架构由两个关键组件组成:一个3B视觉语言模型(VLM)和一个4B扩散模型。在这个设计中,冻结的3B VLM (Qwen-VL-2.5) 负责解释视觉信号和用户指令,而4B扩散模型则利用这种理解来执行高质量的图像生成。 这种双组件架构在四个主要能力上表现出色: 视觉理解:从其Qwen-VL-2.5基础继承了强大的图像内容解释和分析能力。 文本到图…...


















































