

站长之家(ChinaZ.com)6月21日 报道:最新的研究表明,腾讯混元团队发布了其研发的图像生成模型,该模型被命名为 DiT 模型。该模型支持使用 LoRA 和 ControlNet 技术进行扩展。
LoRA 是一种降低大型模型训练成本的技术,它允许开发者在不完全重新训练整个模型的情况下,通过少量参数调整来实现定制化的图像生成。
ControlNet 是一种神经网络结构,它通过增加额外的控制信号来引导图像生成过程,使得用户可以更精确地控制生成图像的各种属性。研究人员已经发布了三个 ControlNet 模型。
总的来说,腾讯的 DiT 模型代表着图像生成技术的一个进步,它能够产生高质量的图像,并且可以通过 LoRA 和 ControlNet 等技术进行定制和扩展,为图像生成领域带来了新的可能性。
项目地址:
https://dit.hunyuan.tencent.com/
代码:
https://github.com/Tencent/HunyuanDiT
模型:
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
报告:
https://tencent.github.io/HunyuanDiT/asset/HunyuanDiTTechReport05140553.pdf
数据准备教程:
https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md
© 版权声明:
文章版权归作者所有,未经允许请勿转载。
本文地址:https://aidh.net/kuaixun/g7f06kqj暂无评论...