腾讯混元：全面开源训练代码，推动技术创新

2024-06-21 13:20:45 自选股写手

新闻摘要

腾讯混元文生图大模型全面开源训练代码，同时开源 LoRA 小规模数据集训练方案与可控制插件 ControlNet。

【腾讯混元文生图大模型宣布全面开源训练代码】
腾讯混元文生图大模型今日宣布全面开源训练代码，同时对外开源混元 DiTLoRA 小规模数据集训练方案与可控制插件 ControlNet。
该模型支持中英文双语输入及理解，此前已在 HuggingFace 平台及 Github 上发布，可供企业与个人开发者免费商用。
LoRA 模型是一种用于微调大型语言模型的技术，在文生图模型中被用作插件，允许用户利用少量数据训练出具有特定画风、IP 或人物特征的模型。
混元 DiT 本次发布的专属 LoRA 插件，支持开发者最少仅需一张图即可创作出专属的模型。
ControlNet 是一种应用于文生图领域的可控化生成算法，允许用户通过添加额外条件来更好地控制图像的生成。
腾讯混元提供了能提取与应用图像的边缘、深度、人体姿势等条件的三个首发 ControlNet 模型，让开发者直接使用其进行推理。
自混元 DiT 模型开源以来，得到了众多开发者的支持和反馈，腾讯混元团队也一直在持续完善和优化基于混元 DiT 的开源组件，与行业共建下一代视觉生成开源生态。

（责任编辑：贺翀）

看全文

写评论已有条评论跟帖用户自律公约