统一多模态生成框架

共 1 篇文章

华科字节提出Liquid:揭示统一多模态模型尺度规律,生成与理解相互促进!

近年来,随着大语言模型(LLM)的迅猛发展,人工智能正步入多模态整合的新纪元。然而,目前主流的多模态大模型(MLLM)通常依赖复杂的外部视觉模块(例如 CLIP 或扩散模型),这导致系统臃肿、扩展性受限,从而成为跨模态智能演进的主要障碍。 为了应对此问题,华中科技大学、字节跳动与香港大学的联合研究团...
+4
智能之星2个月前