【腾讯混元文生图大模型宣布全面开源训练代码】
腾讯混元文生图大模型今日宣布全面开源训练代码,同时对外开源混元 DiTLoRA 小规模数据集训练方案与可控制插件 ControlNet。
该模型支持中英文双语输入及理解,此前已在 HuggingFace 平台及 Github 上发布,可供企业与个人开发者免费商用。
LoRA 模型是一种用于微调大型语言模型的技术,在文生图模型中被用作插件,允许用户利用少量数据训练出具有特定画风、IP 或人物特征的模型。
混元 DiT 本次发布的专属 LoRA 插件,支持开发者最少仅需一张图即可创作出专属的模型。
ControlNet 是一种应用于文生图领域的可控化生成算法,允许用户通过添加额外条件来更好地控制图像的生成。
腾讯混元提供了能提取与应用图像的边缘、深度、人体姿势等条件的三个首发 ControlNet 模型,让开发者直接使用其进行推理。
自混元 DiT 模型开源以来,得到了众多开发者的支持和反馈,腾讯混元团队也一直在持续完善和优化基于混元 DiT 的开源组件,与行业共建下一代视觉生成开源生态。
刘畅 06-18 10:47
贺翀 06-16 12:23
刘畅 06-14 10:47
王丹 06-14 08:55
刘静 06-12 10:45
刘静 05-29 14:40
刘畅 05-29 08:05
最新评论