Meta宣布原生多模态 Llama 4 开源，强劲性能吸引关注

标签：Llama4 Llama4Maverick Llama4Scout Meta

摘要：

美国科技巨头 Meta 推出了其最强大的开源人工智能模型 Llama4。此次首批发布共两款，分别是 Llama […]

美国科技巨头 Meta 推出了其最强大的开源人工智能模型 Llama4。此次首批发布共两款，分别是 Llama4Scout 和 Llama4Maverick。

Llama4Scout 共有1090亿参数，其中包含170亿活跃参数和16个专家。其最大亮点是支持1000万上下文，相当于可以处理20多小时的视频，并且仅需在单个 H100GPU（Int4量化后）上运行。在基准测试中，Llama4Scout的性能超越了 Gemma3、Gemini2.0Flash-Lite 和 Mistral3.1。

Llama4Maverick 共有4000亿参数，其中包含170亿活跃参数和128个专家，支持100万上下文。在大模型 LMSYS 排行榜上，Llama4Maverick 以 ELO 得分1417 的成绩排名第二，仅次于闭源 Gemini2.5Pro，但仅使用了一半的参数。其推理编码能力与 DeepSeek-v3-0324 不相上下。

另外，更强大的2万亿参数 Llama4Behemoth 将在未来几个月推出，拥有2880亿活跃参数和16个专家。目前在 STEM 基准测试中，Llama4Behemoth已超越了 GPT-4.5、Claude Sonnet3.7 和 Gemini2.0Pro。

Llama4 系列首次采用混合专家（MoE）架构，该架构在训练和回答用户查询时效率更高。同时，Llama4 是原生多模态模型，采用早期融合技术，能够无缝整合文本和视觉 token。Meta 还升级了视觉编码器，开发了新训练方法 MetaP 来优化超参数。现在，开发者可以在 llama.com 和 Hugging Face 下载这两款最新模型。

总结要点：