Liquid Liquid是一款由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架。该框架利用VQGAN技术将图像转换为离散的视觉token,并与文本token共享同一词汇空间,从而使得大型语言模型(LLM)在视觉生成和理解任务中发挥作用,而无需对模型结构进行修改。 Liquid的主要功能包括视觉生成、视... AI工具箱8个月前