

美国科技巨头 Meta 推出了其最强大的开源人工智能模型 Llama4。此次首批发布共两款,分别是 Llama4Scout 和 Llama4Maverick。
Llama4Scout 共有1090亿参数,其中包含170亿活跃参数和16个专家。其最大亮点是支持1000万上下文,相当于可以处理20多小时的视频,并且仅需在单个 H100GPU(Int4量化后)上运行。在基准测试中,Llama4Scout的性能超越了 Gemma3、Gemini2.0Flash-Lite 和 Mistral3.1。
Llama4Maverick 共有4000亿参数,其中包含170亿活跃参数和128个专家,支持100万上下文。在大模型 LMSYS 排行榜上,Llama4Maverick 以 ELO 得分1417 的成绩排名第二,仅次于闭源 Gemini2.5Pro,但仅使用了一半的参数。其推理编码能力与 DeepSeek-v3-0324 不相上下。
另外,更强大的2万亿参数 Llama4Behemoth 将在未来几个月推出,拥有2880亿活跃参数和16个专家。目前在 STEM 基准测试中,Llama4Behemoth已超越了 GPT-4.5、Claude Sonnet3.7 和 Gemini2.0Pro。
Llama4 系列首次采用混合专家(MoE)架构,该架构在训练和回答用户查询时效率更高。同时,Llama4 是原生多模态模型,采用早期融合技术,能够无缝整合文本和视觉 token。Meta 还升级了视觉编码器,开发了新训练方法 MetaP 来优化超参数。现在,开发者可以在 llama.com 和 Hugging Face 下载这两款最新模型。
总结要点:
- Meta 推出开源多模态 Llama4,首批发布 Llama4Scout 和 Llama4Maverick,未来将推出 Llama4Behemoth。
- Llama4 性能强劲,在大模型排行榜中表现突出,推理编码能力与其他优秀模型相当甚至超越。
- 采用 MoE 架构,为原生多模态模型,有技术升级和新训练方法,开发者可下载使用。
快讯中提到的AI工具

深度求索:引领未来人工智能技术的探索与创新

由Anthropic公司开发的下一代人工智能AI助手

机器学习和人工智能技术的平台

OpenAI 发布的最新一代语言模型