Meta 推出 Llama 4 大模型：混合专家架构引领人工智能新时代

摘要：

Meta 公司推出了最新的开源人工智能模型 Llama4，这标志着该公司在人工智能领域取得了重大进展。Llam […]

Meta 公司推出了最新的开源人工智能模型 Llama4，这标志着该公司在人工智能领域取得了重大进展。Llama4被分为 Scout 和 Maverick 两个版本，旨在提升 AI 模型的功能和性能。Meta 表示，Llama4是一个多模态大模型，可以处理文本、图像、视频和音频等多种数据类型，并能够在这些格式之间自由转换。

值得注意的是，Llama4系列首次采用了“混合专家”（MoE）架构，这一创新设计显著提高了模型的训练和响应效率。通过将模型划分为多个专注于特定任务的“专家”子模型，Llama4在处理复杂查询时能够更快速和准确地展现其能力。

根据 Meta 的介绍，Scout 和 Maverick 是目前公司最先进的模型。Scout 拥有170亿个活跃参数，配备16个“专家”模型，总参数量高达1090亿；而 Maverick 同样包含170亿个活跃参数，但“专家”模型数量增至128个，总参数量达到了惊人的4000亿。此外，Meta 还在研发一款名为 Behemoth 的更强大模型，该模型被称为“新模型中的教师”，预示着更多创新的可能性。

这些模型经过大量未标注的数据训练，展现出优异的视觉理解能力。目前，Scout 和 Maverick 可以在 Llama.com 及Meta 的合作伙伴平台上公开获取，并已在 WhatsApp、Messenger 和 Instagram Direct 等社交平台上推广使用。

Meta 的首席执行官扎克伯格在发布会上表示：“我们的目标是建立世界领先的人工智能，并将其开源，让更多的人受益。” 他强调，Llama4的推出标志着开源人工智能的兴起，将改变行业格局。

Meta 计划在未来一年内投资高达650亿美元来扩展其人工智能基础设施，尽管投资者对大型科技公司的实际回报仍持保守态度。这一系列举措将使 Meta 在人工智能领域更具竞争力，并推动整个行业的技术革新。

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/hel6ng1u