个性化音乐生成

共 1 篇文章

Migician

Migician是由北京交通大学、华中科技大学和清华大学的研究团队联合开发的多模态大语言模型(MLLM),旨在应对形式的多图像定位(Multi-Image Grounding,MIG)任务。该模型基于大规模训练数据集MGrounding-630k,能够根据不同形式的查询(如文本描述、图像或两者结合)...
AI工具箱9个月前
Migician