豆包开源VideoWorld模型:突破语言模型依赖,认知世界视频生成新纪元 豆包大模型团队联合北京交通大学、中国科学技术大学,于近日宣布开源其共同研发的视频生成实验模型“VideoWorld”。该模型与Sora、DALL-E、Midjourney等主流多模态模型的主要区别在于,VideoWorld在业界率先实现了不依赖于语言模型即可认知世界的能力。 据悉,目前多数模型在学习... AI之家3个月前